TW202405792A

TW202405792A - 立體聲增強系統及立體聲增強方法

Info

Publication number: TW202405792A
Application number: TW111126730A
Authority: TW
Inventors: 陳佳蘋; 陳致生; 洪華駿; 徐建華; 李任峯; 張維安; 陳宗樑
Original assignee: 英屬開曼群島商意騰科技股份有限公司
Priority date: 2022-07-15
Filing date: 2022-07-15
Publication date: 2024-02-01
Also published as: US20240022855A1

Abstract

本發明揭露一種立體聲增強系統及立體聲增強方法。立體聲增強系統包括波束成形單元及訊號處理單元。波束成形單元用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號。訊號處理單元耦接波束成形單元，用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。

Description

立體聲增強系統及立體聲增強方法

本發明係與立體聲增強有關，特別是關於一種立體聲增強系統及立體聲增強方法。

一般而言，如圖1所示，由於傳統之錄音裝置1的麥克風10的距離及機構較不容易模擬人耳EAR，無法表現左右耳之間的距離，及頭遮蓋聲音的效應，因而導致錄音裝置1的麥克風10所錄到的聲音SOU的立體聲效果(Stereo effect)較差，聽起來較缺乏空間感(Spatial sense)，亟待改善。

因此，本發明提出一種立體聲增強系統及立體聲增強方法，藉以有效解決先前技術所遭遇到之上述問題。

根據本發明之一較佳具體實施例為一種立體聲增強系統。於此實施例中，立體聲增強系統包括波束成形單元及訊號處理單元。波束成形單元用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號。訊號處理單元耦接波束成形單元，用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。

於一實施例中，訊號處理單元包括複數個頭部相關傳輸函數(HRTF)單元、第一合成單元及第二合成單元。該複數個HRTF單元耦接波束成形單元且分別對應於該複數個方向區間，該複數個HRTF單元中之每一個HRTF單元接收該複數個波束成形聲音信號中之相對應的波束成形聲音信號並計算波束成形聲音信號以產生第一輸出聲音信號及第二輸出聲音信號。第一合成單元耦接該複數個HRTF單元，用以將該複數個HRTF單元產生的複數個第一輸出聲音信號合成為第一合成輸出聲音信號。第二合成單元耦接該複數個HRTF單元，用以將該複數個HRTF單元產生的複數個第二輸出聲音信號合成為第二合成輸出聲音信號。

於一實施例中，該複數個方向區間所分別包括的角度範圍之間有重疊。

於一實施例中，該複數個輸入聲音信號係來自錄音裝置且將錄音裝置的全部或部分的收音範圍切成該複數個方向區間，致使波束成形單元產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號。

於一實施例中，每一HRTF單元產生的第一輸出聲音信號及第二輸出聲音信號係分別對應於左耳及右耳。

於一實施例中，第一合成單元及第二合成單元分別輸出第一合成輸出聲音信號及第二合成輸出聲音信號至左耳及右耳。

於一實施例中，第一合成輸出聲音信號及第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。

於一實施例中，該複數個HRTF單元係採用真實錄音模式。

於一實施例中，該複數個HRTF單元係採用模擬模式且包括下列至少一者：濾波單元，用以模擬雙耳間的時間差及位準差；延遲單元，用以模擬雙耳間的時間差；及增益單元，用以模擬雙耳間的位準差。

於一實施例中，訊號處理單元還包括：聲音偵測單元，耦接於波束成形單元與該複數個HRTF單元之間，用以分別偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音並輸出包括有效聲音的波束成形聲音信號至該複數個HRTF單元。

於一實施例中，訊號處理單元透過修改該複數個HRTF單元的延遲及增益來調整音場寬窄。

根據本發明之另一較佳具體實施例為一種立體聲增強方法。於此實施例中，立體聲增強方法包括下列步驟：(a)根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號；(b)根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號；以及(c)將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。

於一實施例中，演算法為頭部相關傳輸函數(HRTF)或能模擬聲源至左右耳的通道響應之技術。

於一實施例中，步驟(a)還偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟(a)所產生的該複數個波束成形聲音信號包括有效聲音。

於一實施例中，立體聲增強方法還包括下列步驟：透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄。

於一實施例中，該複數個輸入聲音信號係來自錄音裝置且將錄音裝置的全部或部分的收音範圍切成該複數個方向區間，致使步驟(a)產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號。

於一實施例中，步驟(b)係採用真實錄音模式。

於一實施例中，步驟(b)係採用模擬模式且立體聲增強方法還包括下列至少一者：模擬雙耳間的時間差；以及模擬雙耳間的位準差。

相較於先前技術，本發明之立體聲增強系統及立體聲增強方法係透過波束成形方法將麥克風陣列所錄到的複數個聲音信號分離至對應於不同聲音方向區間的不同通道並分別在每個通道內應用頭部相關傳輸函數(HRTF)處理來增強聲音信號的空間感，藉以讓聲音信號呈現出較佳的立體聲效果，使得左右耳聽到的聲音變寬敞。

根據本發明之一較佳具體實施例為一種立體聲增強系統。於此實施例中，立體聲增強系統可保留錄音裝置的麥克風陣列所錄到的所有輸入聲音信號並透過波束成形方法將所有輸入聲音信號分離至對應於不同聲音方向區間的不同通道，再分別於每個通道內應用頭部相關傳輸函數(HRTF)處理來增強聲音信號的空間感，藉以有效提升聲音信號的立體聲效果，使得左右耳聽到的聲音變寬敞。

請參照圖2至圖4，圖2及圖3分別繪示將錄音裝置的收音範圍切成複數個方向區間以及分別位於不同聲音方向區間的複數個HRTF單元之不同實施例。圖4繪示圖3中之每一個HRTF單元輸出第一輸出聲音信號至左耳且輸出第二輸出聲音信號至右耳的示意圖。

如圖2所示，假設錄音裝置2的收音範圍為360度角，其全部的收音範圍(亦即360度角)被切成複數個方向區間DI1~DI7且每一個方向區間DI1~DI7分別設置有頭部相關傳輸函數(HRTF)單元HR1~HR7。當錄音裝置2錄到複數個輸入聲音信號時，立體聲增強系統會根據該複數個輸入聲音信號產生分別對應於複數個方向區間DI1~DI7的複數個波束成形聲音信號至相對應的HRTF單元HR1~HR7。

如圖3所示，假設錄音裝置3的收音範圍為360度角，其部分的收音範圍(例如210度角)被切成複數個方向區間DI1~DI4且每一個方向區間DI1~DI4分別設置有頭部相關傳輸函數(HRTF)單元HR1~HR4。當錄音裝置3錄到複數個輸入聲音信號時，立體聲增強系統會根據該複數個輸入聲音信號產生分別對應於複數個方向區間DI1~DI4的複數個波束成形聲音信號至相對應的HRTF單元HR1~HR4。

需說明的是，本發明並未透過錄音裝置(例如麥克風陣列)來偵測特定的目標方向區間。本發明將錄音裝置的全部或部分的收音範圍切成複數個方向區間的數量並不以上述實施例為限，並且每個角度範圍可以相同或不同，並無特定之限制。

此外，該複數個方向區間所分別包括的角度範圍之間會有重疊。舉例而言，假設方向區間DI1的角度範圍為0至30度且方向區間DI2的角度範圍為15至45度，則方向區間DI1與DI2分別包括的角度範圍之間重疊了15度，藉以確保當物體從方向區間DI1移動至方向區間DI2時，聲音仍能維持平順。

如圖4所示，每一個HRTF單元HR1~HR4分別接收並計算各自相對應的波束成形聲音信號後輸出第一輸出聲音信號SO11~SO14至左耳EL且輸出第二輸出聲音信號SO21~SO24至右耳ER。詳細而言，HRTF單元HR1輸出第一輸出聲音信號SO11至左耳EL且輸出第二輸出聲音信號SO21至右耳ER；HRTF單元HR2輸出第一輸出聲音信號SO12至左耳EL且輸出第二輸出聲音信號SO22至右耳ER；HRTF單元HR3輸出第一輸出聲音信號SO13至左耳EL且輸出第二輸出聲音信號SO23至右耳ER；HRTF單元HR4輸出第一輸出聲音信號SO14至左耳EL且輸出第二輸出聲音信號SO24至右耳ER。

請參照圖5，圖5繪示本發明之一較佳具體實施例中之立體聲增強系統的示意圖。如圖5所示，立體聲增強系統5包括波束成形單元50及訊號處理單元52。當波束成形單元50接收到M個輸入聲音信號SIN1~SINM時，波束成形單元50根據該M個輸入聲音信號SIN1~SINM產生分別對應於N個方向區間DI1~DIN的N個波束成形聲音信號BF1~BFN。訊號處理單元52耦接波束成形單元50，用以接收分別對應於該N個方向區間DI1~DIN的該N個波束成形聲音信號BF1~BFN並根據該N個波束成形聲音信號BF1~BFN產生第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2。其中，M及N為正整數。

需說明的是，訊號處理單元52所產生的第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2係分別傳送至左耳LE及右耳RE，並且第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2的音場會比該M個輸入聲音信號SIN1~SINM的音場來得寬，使得左耳EL及右耳RE分別聽到第一合成輸出聲音信號SY1及第二合成輸出聲音信號SY2時會有較佳的立體聲效果。

於實際應用中，波束成形單元50所接收到的該M個輸入聲音信號SIN1~SINM可來自錄音裝置(例如麥克風陣列)，並且錄音裝置的收音範圍可被切成N個方向區間DI1~DIN，致使波束成形單元50產生相對於錄音裝置所有N個方向區間DI1~DIN的N個波束成形聲音信號BF1~BFN。

此外，本發明的立體聲增強系統5與錄音裝置可視實際需求設計為彼此分離的不同設備或彼此整合於同一設備。舉例而言，麥克風陣列可設置於運動攝影機上進行收音及增強立體聲處理後儲存下來或由使用者接耳機聆聽，但不以此為限。

於此實施例中，訊號處理單元52可包括N個HRTF單元HR1~HRN、第一合成單元521及第二合成單元522。該N個HRTF單元HR1~HRN耦接波束成形單元50且分別對應於該N個方向區間DI1~DIN。該N個HRTF單元HR1~HRN中之每一個HRTF單元接收並計算該N個波束成形聲音信號BF1~BFN中之相對應的波束成形聲音信號以產生N個第一輸出聲音信號SO11~SO1N及N個第二輸出聲音信號SO21~SO2N。

第一合成單元521耦接該N個HRTF單元HR1~HRN，用以將該N個HRTF單元HR1~HRN產生的該N個第一輸出聲音信號SO11~SO1N合成為第一合成輸出聲音信號SY1後傳至左耳LE。第二合成單元522耦接該N個HRTF單元HR1~HRN，用以將該N個HRTF單元HR1~HRN產生的該N個第二輸出聲音信號SO21~SO2N合成為第二合成輸出聲音信號SY2後傳至右耳RE。

於實際應用中，第一合成輸出聲音SY1及第二合成輸出聲音SY2可分別輸出至耳機的左耳部及右耳部，但不以此為限。

於另一實施例中，如圖6所示，訊號處理單元52還可包括聲音偵測單元520。聲音偵測單元520耦接於波束成形單元50與該N個HRTF單元HR1~HRN之間，用以分別偵測對應於該N個方向區間DI1~DIN的該N個波束成形聲音信號BF1~BFN是否包括有效聲音，並且聲音偵測單元520僅會將包括有效聲音的K個波束成形聲音信號BF1~BFK分別輸出至K個HRTF單元HR1~HRK。其中，K為小於或等於N的正整數。

需說明的是，聲音偵測單元520偵測該N個波束成形聲音信號BF1~BFN是否包括有效聲音的方式可包含但不限於下列兩種：

(1)語音活動偵測(Voice Activity Detection，VAD)，可用以偵測人聲；以及

(2)聲音事件偵測(Sound Event Detection)，可用以偵測特定的聲音事件，例如狗叫、門鈴聲、飛機聲…等。

接著，該K個HRTF單元HR1~HRK中之每一個HRTF單元接收並計算該K個波束成形聲音信號BF1~BFK中之相對應的波束成形聲音信號以產生K個第一輸出聲音信號SO11~SO1K及K個第二輸出聲音信號SO21~SO2K。第一合成單元521將該K個第一輸出聲音信號SO11~SO1K合成為第一合成輸出聲音信號SY1後傳至左耳LE。第二合成單元522將該K個第二輸出聲音信號SO21~SO2K合成為第二合成輸出聲音信號SY2後傳至右耳RE。

於實際應用中，該N個HRTF單元HR1~HRN可採用真實錄音模式或模擬模式。當該N個HRTF單元HR1~HRN採用模擬模式時，每一個HRTF單元可包括用以模擬雙耳間的位準差及時間差的濾波單元、用以模擬雙耳間的時間差的延遲單元及/或用以模擬雙耳間的位準差的增益單元，但不以此為限。訊號處理單元52可透過修改該N個HRTF單元HR1~HRN的延遲及增益來調整聲音信號的音場寬窄，但不以此為限。

舉例而言，如圖7所示，第一HRTF單元HR1可包括分別對應於左耳LE及右耳RE的第一濾波單元FG1及第二濾波單元FG2。當第一濾波單元FG1接收到波束成形聲音信號BF1時，第一濾波單元FG1對波束成形聲音信號BF1進行濾波處理後產生對應於左耳LE的第一輸出聲音信號SO11。當第二濾波單元FG2接收到波束成形聲音信號BF1時，第二濾波單元FG2對波束成形聲音信號BF1進行濾波處理後產生對應於右耳RE的第二輸出聲音信號SO21。至於其他HRTF單元HR2~HRN亦可依此類推，故於此不另行贅述。

根據本發明之另一較佳具體實施例為一種立體聲增強方法。於此實施例中，立體聲增強方法可應用於前述各實施例中之立體聲增強系統，但不以此為限。

請參照圖8，圖8繪示此實施例中之立體聲增強方法的流程圖。如圖8所示，立體聲增強方法可包括但不限於下列步驟：

步驟S10：根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號；

步驟S12：根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號；以及

步驟S14：將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。其中，第一合成輸出聲音信號及第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬，藉以達到增強立體聲的效果。

於實際應用中，步驟S10中之該複數個輸入聲音信號可來自錄音裝置且錄音裝置的全部或部分的收音範圍被切成該複數個方向區間，致使步驟S10可產生相對於錄音裝置所有方向區間的該複數個波束成形聲音信號，其中該複數個方向區間所分別包括的角度範圍之間會有重疊，但不以此為限。

此外，步驟S10還可偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟S10所產生的該複數個波束成形聲音信號包括有效聲音。

於另一實施例中，立體聲增強方法還可包括下列步驟：透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄，但不以此為限。

於另一實施例中，步驟S12中之演算法可以是頭部相關傳輸函數(HRTF)或其他任何能夠模擬聲源至左右耳的通道響應之技術。此外，步驟S12可採用真實錄音模式或模擬模式。當步驟S12採用模擬模式時，立體聲增強方法還可包括下列步驟之至少一者：模擬雙耳間的時間差；以及模擬雙耳間的位準差，但不以此為限。

1:錄音裝置 10:麥克風 EAR:人耳 SOU:聲音 2:錄音裝置 3:錄音裝置 DI1~DI7:方向區間 HR1~HR7:頭部相關傳輸函數(HRTF)單元 LE:左耳 RE:右耳 5:立體聲增強系統 50:波束成形單元 52:訊號處理單元 520:聲音偵測單元 521:第一合成單元 522:第二合成單元 HR1~HRN:頭部相關傳輸函數(HRTF)單元 SIN1~SINM:輸入聲音信號 DI1~DIN:方向區間 CH1~CHN:通道 BF1~BFN:波束成形聲音信號 SO11~SO1N:第一輸出聲音信號 SO21~SO2N:第二輸出聲音信號 SY1:第一合成輸出聲音信號 SY2:第二合成輸出聲音信號 FG1:第一濾波單元 FG2:第二濾波單元 S10~S14:步驟

圖1繪示傳統之錄音裝置的麥克風的距離及機構難以模擬人耳而導致其錄到的聲音缺乏空間感的示意圖。

圖2及圖3分別繪示將錄音裝置的收音範圍切成複數個方向區間以及分別位於不同聲音方向區間的複數個頭部相關傳輸函數(HRTF)單元之不同實施例。

圖4繪示圖3中之每一個HRTF單元輸出第一輸出聲音信號至左耳且輸出第二輸出聲音信號至右耳的示意圖。

圖5繪示本發明之一較佳具體實施例中之立體聲增強系統的示意圖。

圖6繪示本發明之立體聲增強系統聲音還包括偵測單元的示意圖。

圖7繪示本發明之HRTF單元還包括分別對應於左右耳的兩個濾波單元的示意圖。

圖8繪示本發明之一較佳具體實施例中之立體聲增強方法的流程圖。

5:立體聲增強系統

50:波束成形單元

52:訊號處理單元

521:第一合成單元

522:第二合成單元

HR1~HRN:頭部相關傳輸函數(HRTF)單元

SIN1~SINM:輸入聲音信號

DI1~DIN:方向區間

CH1~CHN:通道

BF1~BFN:波束成形聲音信號

SO11~SO1N:第一輸出聲音信號

SO21~SO2N:第二輸出聲音信號

SY1:第一合成輸出聲音信號

SY2:第二合成輸出聲音信號

LE:左耳

RE:右耳

Claims

一種立體聲增強系統，包括：波束成形單元，用以接收複數個輸入聲音信號並據以產生分別對應於複數個方向區間的複數個波束成形聲音信號；以及訊號處理單元，耦接該波束成形單元，用以接收分別對應於該複數個方向區間的該複數個波束成形聲音信號並據以產生第一合成輸出聲音信號及第二合成輸出聲音信號。
如請求項1所述的立體聲增強系統，其中該訊號處理單元包括：複數個頭部相關傳輸函數(HRTF)單元，耦接該波束成形單元且分別對應於該複數個方向區間，該複數個HRTF單元中之每一個HRTF單元接收該複數個波束成形聲音信號中之相對應的波束成形聲音信號並計算該波束成形聲音信號以產生第一輸出聲音信號及第二輸出聲音信號；第一合成單元，耦接該複數個HRTF單元，用以將該複數個HRTF單元產生的複數個第一輸出聲音信號合成為該第一合成輸出聲音信號；以及第二合成單元，耦接該複數個HRTF單元，用以將該複數個HRTF單元產生的複數個第二輸出聲音信號合成為該第二合成輸出聲音信號。
如請求項2所述的立體聲增強系統，其中該複數個方向區間所分別包括的角度範圍之間有重疊。
如請求項2所述的立體聲增強系統，其中該複數個輸入聲音信號係來自錄音裝置且將該錄音裝置的全部或部分的收音範圍切成該複數個方向區間，致使該波束成形單元產生相對於該錄音裝置所有方向區間的該複數個波束成形聲音信號。
如請求項2所述的立體聲增強系統，其中每一HRTF單元產生的該第一輸出聲音信號及該第二輸出聲音信號係分別對應於左耳及右耳。
如請求項2所述的立體聲增強系統，其中該第一合成單元及該第二合成單元分別輸出該第一合成輸出聲音信號及該第二合成輸出聲音信號至左耳及右耳。
如請求項2所述的立體聲增強系統，其中該第一合成輸出聲音信號及該第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
如請求項2所述的立體聲增強系統，其中該複數個HRTF單元係採用真實錄音模式。
如請求項2所述的立體聲增強系統，其中該複數個HRTF單元係採用模擬模式且包括下列至少一者：濾波單元，用以模擬雙耳間的位準差及時間差；延遲單元，用以模擬雙耳間的時間差；以及增益單元，用以模擬雙耳間的位準差。
如請求項2所述的立體聲增強系統，其中該訊號處理單元還包括：聲音偵測單元，耦接於該波束成形單元與該複數個HRTF單元之間，用以分別偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音並輸出包括有效聲音的波束成形聲音信號至該複數個HRTF單元。
如請求項2所述的立體聲增強系統，其中該訊號處理單元透過修改該複數個HRTF單元的延遲及增益來調整音場寬窄。
一種立體聲增強方法，包括下列步驟： (a)根據複數個輸入聲音信號產生分別對應於複數個方向區間的複數個波束成形聲音信號； (b)根據演算法計算該複數個波束成形聲音信號中之每一個波束成形聲音信號以產生對應於複數個方向區間中之每一個方向區間的第一輸出聲音信號及第二輸出聲音信號；以及 (c)將複數個第一輸出聲音信號合成為第一合成輸出聲音信號且將複數個第二輸出聲音信號合成為第二合成輸出聲音信號。
如請求項12所述的立體聲增強方法，其中該演算法為頭部相關傳輸函數(HRTF)或能模擬聲源至左右耳的通道響應之技術。
如請求項13所述的立體聲增強方法，其中步驟(a)還偵測對應於該複數個方向區間的該複數個波束成形聲音信號是否包括有效聲音且步驟(a)所產生的該複數個波束成形聲音信號包括有效聲音。
如請求項13所述的立體聲增強方法，還包括下列步驟：透過修改HRTF及其它能模擬聲源至左右耳通道響應之技術的增益及延遲來調整音場寬窄。
如請求項13所述的立體聲增強方法，其中該複數個方向區間所分別包括的角度範圍之間有重疊。
如請求項13所述的立體聲增強方法，其中該複數個輸入聲音信號係來自錄音裝置且將該錄音裝置的全部或部分的收音範圍切成該複數個方向區間，致使步驟(a)產生相對於該錄音裝置所有方向區間的該複數個波束成形聲音信號。
如請求項13所述的立體聲增強方法，其中該第一合成輸出聲音信號及該第二合成輸出聲音信號的音場會比該複數個輸入聲音信號的音場來得寬。
如請求項13所述的立體聲增強方法，其中步驟(b)係採用真實錄音模式。
如請求項13所述的立體聲增強方法，其中步驟(b)係採用模擬模式且該立體聲增強方法還包括下列至少一者：模擬雙耳間的時間差；以及模擬雙耳間的位準差。