TWI816313B

TWI816313B - 虛擬揚聲器集合確定方法和裝置

Info

Publication number: TWI816313B
Application number: TW111107551A
Authority: TW
Inventors: 高原; 劉帥; 王賓; 王喆; 曲天書; 徐佳浩
Original assignee: 大陸商華為技術有限公司
Priority date: 2021-03-05
Filing date: 2022-03-02
Publication date: 2023-09-21
Also published as: EP4294056A4; AU2022230620A1; US20230412981A1; KR20230154241A; CN116980818A; CN117061983A; TW202245487A; CN115038028A; WO2022184097A1; JP2024512347A; BR112023017996A2; CN115038028B; EP4294056A1; TW202410705A

Abstract

本申請提供一種虛擬揚聲器集合確定方法和裝置。虛擬揚聲器集合確定方法，包括：根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F≤K，F×S≥K。本申請可以提升音訊信號的重播效果。

Description

虛擬揚聲器集合確定方法和裝置

本發明涉及音訊技術領域，特別涉及虛擬揚聲器集合確定方法和裝置。

三維音訊技術是通過電腦、信號處理等方式對真實世界中聲音事件和三維聲場資訊進行獲取、處理，傳輸和渲染重播的音訊技術。三維音訊技術使聲音具有強烈的空間感、包圍感及沉浸感，給人以“聲臨其境”的聽覺體驗。目前主流的三維音訊技術是高階立體混響（higher order ambisonics，HOA）技術，HOA技術因其在錄製和編碼中與重播階段的揚聲器佈局無關的性質，以及HOA格式資料的可旋轉特性，使得HOA技術在三維音訊重播時具有更高的靈活性，因而也得到了更為廣泛的關注和研究。

HOA技術可以將HOA信號轉為虛擬揚聲器信號再映射為雙耳信號進行重播。在上述過程中，虛擬揚聲器均勻分佈可以達到最好的採樣效果，例如將虛擬揚聲器分佈於正四面體的頂點上。但由於三維空間中正多面體的數量只有五種，即正四面體、正六面體、正八面體、正十二面體和正二十面體，因此可以設置的虛擬揚聲器的數量有限，不能適用於更多數量的虛擬揚聲器的分佈。

本申請提供一種虛擬揚聲器集合確定方法和裝置，以提升音訊信號的重播效果。

第一方面，本申請提供一種虛擬揚聲器集合確定方法，包括：根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F≤K，F×S≥K。

本申請通過預先設定虛擬揚聲器分佈表，使得按照該分佈表部署虛擬揚聲器可以獲得較高的HOA重建信號的信噪比（SNR）平均值，進而在基於這種分佈的情況下選取與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器，可以達到最優的採樣效果，進而提升音訊信號的重播效果。

在一種可能的實現方式中，所述根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，包括：獲取所述音訊信號的高階立體混響HOA係數；獲取所述F個虛擬揚聲器對應的F組HOA係數，所述F個虛擬揚聲器與所述F組HOA係數一一對應；將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。

對待處理的音訊信號進行編碼分析，例如分析待處理的音訊信號的聲場分佈，包括音訊信號的聲源個數、方向性、彌散度等特徵，得到該音訊信號的HOA係數，作為決定如何選擇目標虛擬揚聲器的判斷條件之一。根據待處理的音訊信號的HOA係數和候選的虛擬揚聲器（即上述F個虛擬揚聲器）的HOA係數，可以選擇出與待處理的音訊信號匹配的虛擬揚聲器，本申請中將該虛擬揚聲器稱作目標虛擬揚聲器。可以將F個虛擬揚聲器各自的HOA係數分別與音訊信號的HOA係數做內積，選取內積絕對值最大的虛擬揚聲器為目標虛擬揚聲器。需要說明的是，還可以採用其他方法確定目標虛擬揚聲器，本申請對此不做具體限定。

在一種可能的實現方式中，所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件：所述S個虛擬揚聲器包括所述目標虛擬揚聲器，以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器，所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。

在確定目標虛擬揚聲器時，該目標虛擬揚聲器是與待處理的音訊信號HOA係數相關性最高的中心虛擬揚聲器。而每個中心虛擬揚聲器對應的S個虛擬揚聲器是與該中心虛擬揚聲器HOA係數相關性最高的S個虛擬揚聲器，而因此與目標虛擬揚聲器對應的S個虛擬揚聲器也是與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器。

在一種可能的實現方式中，所述K個虛擬揚聲器滿足如下條件：所述K個虛擬揚聲器分佈於預設球面上；所述預設球面包含L個緯度區域，L＞1；其中，所述L個緯度區域中第m個緯度區域包含T _m個緯線圈，所述K個虛擬揚聲器中分佈於第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α _m，1≤m≤L，T _m為正整數，1≤mi≤T _m；其中，當T _m＞1時，所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _m。

在一種可能的實現方式中，所述L個緯度區域中第n個緯度區域包含T _n個緯線圈，所述K個虛擬揚聲器中分佈於第n _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α _n，1≤n≤L，T _n為正整數，1≤n _i≤T _n；其中，當T _n＞1時，所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _n；其中，α _n=α _m或者α _n≠α _m，n≠m。

在一種可能的實現方式中，所述L個緯度區域中第c個緯度區域包含T _c個緯線圈，所述T _c個緯線圈的其中之一為赤道緯線圈，所述K個虛擬揚聲器中分佈於第c _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α _c，1≤c≤L，T _c為正整數，1≤c _i≤T _c；其中，當T _c＞1時，所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _c；其中，α _c＜α _m，c≠m。

在一種可能的實現方式中，所述F個虛擬揚聲器滿足如下條件：所述F個虛擬揚聲器中分佈於所述第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α _mi大於α _m。

在一種可能的實現方式中，α _mi=q×α _m，其中，q為大於1的正整數。

在一種可能的實現方式中，所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R _fk滿足如下公式：

其中，表示所述目標虛擬揚聲器的水準角度，表示所述目標虛擬揚聲器的俯仰角度，表示所述目標虛擬揚聲器的HOA係數，表示所述K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。

第二方面，本申請提供一種虛擬揚聲器集合確定裝置，包括：確定模組，用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；獲取模組，用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F≤K，F×S≥K。

在一種可能的實現方式中，所述確定模組，具體用於獲取所述音訊信號的高階立體混響HOA係數；獲取所述F個虛擬揚聲器對應的F組HOA係數，所述F個虛擬揚聲器與所述F組HOA係數一一對應；將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。

在一種可能的實現方式中，所述K個虛擬揚聲器滿足如下條件：所述K個虛擬揚聲器分佈於預設球面上；所述預設球面包含L個緯度區域，L＞1；其中，所述L個緯度區域中第m個緯度區域包含T _m個緯線圈，所述K個虛擬揚聲器中分佈於第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α _m，1≤m≤L，T _m為正整數，1≤m _i≤T _m；其中，當T _m＞1時，所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _m。

在一種可能的實現方式中，所述L個緯度區域中第n個緯度區域包含T _n個緯線圈，所述K個虛擬揚聲器中分佈於第n _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α _n，1≤n≤L，T _n為正整數，1≤n _i≤T _n；其中，當Tn＞1時，所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _n；其中，α _n=α _m或者α _n≠α _m，n≠m。

第三方面，本申請提供一種音訊處理設備，包括：一個或多個處理器；記憶體，用於存儲一個或多個程式；當所述一個或多個程式被所述一個或多個處理器執行，使得所述一個或多個處理器實現如上述第一方面中任一項所述的方法。

第四方面，本申請提供一種電腦可讀存儲介質，包括電腦程式，所述電腦程式在電腦上被執行時，使得所述電腦執行上述第一方面中任一項所述的方法。

為使本申請的目的、技術方案和優點更加清楚，下面將結合本申請中的附圖，對本申請中的技術方案進行清楚、完整地描述，顯然，所描述的實施例是本申請一部分實施例，而不是全部的實施例。基於本申請中的實施例，本領域普通技術人員在沒有作出創造性勞動前提下所獲取的所有其他實施例，都屬於本申請保護的範圍。

本申請的說明書實施例和權利要求書及附圖中的術語“第一”、“第二”等僅用於區分描述的目的，而不能理解為指示或暗示相對重要性，也不能理解為指示或暗示順序。此外，術語“包括”和“具有”以及他們的任何變形，意圖在於覆蓋不排他的包含，例如，包含了一系列步驟或單元。方法、系統、產品或設備不必限於清楚地列出的那些步驟或單元，而是可包括沒有清楚地列出的或對於這些過程、方法、產品或設備固有的其它步驟或單元。

應當理解，在本申請中，“至少一個（項）”是指一個或者多個，“多個”是指兩個或兩個以上。“和/或”，用於描述關聯物件的關聯關係，表示可以存在三種關係，例如，“A和/或B”可以表示：只存在A，只存在B以及同時存在A和B三種情況，其中A，B可以是單數或者複數。字元“/”一般表示前後關聯物件是一種“或”的關係。“以下至少一項（個）”或其類似表達，是指這些項中的任意組合，包括單項（個）或複數項（個）的任意組合。例如，a，b或c中的至少一項（個），可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是單個，也可以是多個。字元“~”連接的兩個數值一般表示一個取值範圍，該取值範圍包含“~”連接的兩個數值。

本申請涉及到的相關名詞解釋：

音訊幀：音訊資料是流式的，在實際應用中，為了便於音訊處理和傳輸，通常取一時長內的音訊資料量作為一幀音訊，該時長被稱為“採樣時間”，可以根據轉碼器和具體應用的需求確定其值，例如該時長為2.5ms~60ms，ms為毫秒。

音訊信號：音訊信號是帶有語音、音樂和音效的有規律的聲波的頻率、幅度變化資訊載體。音訊是一種連續變化的類比信號，可用一條連續的曲線來表示，稱為聲波。音訊通過模數轉換或電腦生成的數位信號即為音訊信號。聲波有三個重要參數：頻率、幅度和相位，這也就決定了音訊信號的特徵。

以下是本申請所應用的系統架構。

圖1為本申請音訊播放系統的一個示例性的結構圖，如圖1所示，該音訊播放系統包括：音訊發送設備和音訊接收設備，其中，音訊發送設備包括例如手機、電腦（筆記型電腦、臺式電腦等）、平板（手持平板、車載平板等）等可以進行音訊編碼並發送音訊碼流的設備；音訊接收設備包括例如真無線身歷聲（true wireless stereo，TWS）、普通無線耳機、音響、智慧手錶、智慧眼鏡等可以接收音訊碼流、解碼音訊碼流並播放的設備。

音訊發送設備和音訊接收設備之間可以建立藍牙連接，二者之間可以支援語音和音樂的傳輸。音訊發送設備和音訊接收設備的較為廣泛的示例是手機與TWS耳機、無線頭戴式耳機或者無線頸圈式耳機之間，或者手機與其他終端設備（例如智能音箱、智能手錶、智能眼鏡和車載音箱等）之間。可選的，音訊發送設備和音訊接收設備的示例也可以是平板、筆記型電腦或者臺式電腦與TWS耳機、無線頭戴式耳機、無線頸圈式耳機或其他終端設備（例如智慧音箱、智慧手錶、智慧眼鏡和車載音箱）之間。

需要說明的是，音訊發送設備和音訊接收設備之間除藍牙連接外，還可以通過其他通信方式連接，例如WiFi連接、有線連接或其他無線連接等，本申請對此不做具體限定。

圖2為本申請音訊解碼系統10的一個示例性的結構圖，如圖2所示，音訊解碼系統10可包括源設備12和目的設備14，源設備12可以是圖1的音訊發送設備，目的設備14可以是圖1的音訊接收設備。源設備12產生經編碼的碼流資訊，因此，源設備12也可以被稱為音訊編碼設備。目的設備14可對由源設備12所產生的經編碼的碼流資訊進行解碼，因此，目的設備14也可以被稱為音訊解碼設備。本申請中，源設備12、音訊編碼設備可以被統一稱作音訊發送設備，目的設備14、音訊解碼設備可以被統一稱作音訊接收設備。

源設備12包括編碼器20，可選地，可包括音訊源16、音訊預處理器18、通信介面22。

音訊源16，可以包括或可以為任何類別的音訊擷取裝置，例如，捕獲現實世界聲音，和/或任何類別的音訊生成設備，例如，電腦音訊處理器，或用於獲取和/或提供現實世界音訊、電腦動畫音訊（例如，螢幕內容、虛擬實境（virtual reality，VR）中的音訊）的任何類別設備，和/或其任何組合（例如，增強現實（augmented reality，AR）中的音訊、混合現實（mixed Reality，MR）中的音訊和/或擴展現實（extended Reality，XR）中的音訊）。音訊源16可以為用於捕獲音訊的麥克風或者用於存儲音訊的記憶體，音訊源16還可以包括存儲先前捕獲或產生的音訊和/或獲取或接收音訊的任何類別的（內部或外部）介面。當音訊源16為麥克風時，音訊源16可例如為本地的或集成在源設備中的音訊採集裝置；當音訊源16為記憶體時，音訊源16可為本地的或例如集成在源設備中的集成記憶體。當所述音訊源16包括介面時，介面可例如為從外部音訊源接收音訊的外部介面，外部音訊源例如為外部音訊擷取裝置，比如話筒、麥克風、外部記憶體或外部音訊生成設備，外部音訊生成設備例如為外部電腦音訊處理器、電腦或伺服器。介面可以為根據任何專有或標準化介面協定的任何類別的介面，例如有線或無線介面、光介面。

本申請中，音訊源16獲取當前場景音訊信號，該當前場景音訊信號是指對空間中麥克風所在位置的聲場進行採集得到的音訊信號，當前場景音訊信號也可以稱為原始場景音訊信號。例如，當前場景音訊信號可以是通過高階立體混響（higher order ambisonics，HOA）技術得到的音訊信號。音訊源16獲取待編碼的HOA信號，例如，可以採用實際採集設備獲取HOA信號或採用人工音訊物件合成HOA信號。可選的，待編碼的HOA信號可以是時域HOA信號或者頻域HOA信號。

音訊預處理器18，用於接收原始音訊信號並對原始音訊信號執行預處理，以獲取經預處理的音訊信號。例如，音訊預處理器18執行的預處理可以包括整修或去噪。

編碼器20，用於接收經預處理的音訊信號，對經預處理的音訊信號進行處理，從而提供經編碼的碼流資訊。

源設備12中的通信介面22可用於接收碼流資訊並通過通信通道13向目的設備14發送該碼流。通信通道13例如為直接有線或無線連接，任何類別的網路例如為有線或無線網路或其任何組合，或任何類別的私網和公網，或其任何組合。

目的設備14包括解碼器30，可選地，可包括通信介面28、音訊後處理器32和播放設備34。

目的設備14中的通信介面28用於直接從源設備12接收碼流資訊，並將碼流資訊提供給解碼器30。通信介面22和通信介面28可用於通過源設備12與目的設備14之間的通信通道13發送或接收碼流資訊。

通信介面22和通信介面28均可配置為如圖2中從源設備12指向目的設備14的對應通信通道13的箭頭所指示的單向通信介面，或雙向通信介面，並且可用於發送和接收消息等，以建立連接，確認並交換與通信鏈路和/或編碼音訊資料等資料傳輸相關的任何其它資訊，等等。

解碼器30，用於接收碼流資訊，並解碼碼流資訊得到經解碼的音訊資料。

音訊後處理器32，用於對解碼的音訊資料進行後處理，得到後處理後的音訊資料。音訊後處理器32執行的後處理可以包括例如修剪或重採樣等。

播放設備34，用於接收後處理後的音訊資料，以向使用者或收聽者播放音訊。播放設備34可以為或包括任意類型的用於播放重建後音訊的播放機，例如，集成或外部揚聲器。例如，揚聲器可包括喇叭、音響等。

圖3為本申請HOA編碼裝置的一個示例性的結構圖，如圖3所示，HOA編碼裝置可以應用於上述音訊解碼系統10的編碼器20中。HOA編碼裝置包括：虛擬揚聲器配置單元、編碼分析單元、虛擬揚聲器集合生成單元、虛擬揚聲器選擇單元、虛擬揚聲器信號生成單元和核心編碼器處理單元。其中，

虛擬揚聲器配置單元，用於根據編碼器配置資訊對虛擬揚聲器進行配置，以得到虛擬揚聲器配置參數。編碼器配置資訊包括且不限於：HOA階數，編碼位元速率，使用者自訂資訊等，虛擬揚聲器配置參數包括且不限於：虛擬揚聲器的個數，虛擬揚聲器的HOA階數等。

虛擬揚聲器配置單元輸出的虛擬揚聲器配置參數作為虛擬揚聲器集合生成單元的輸入。

編碼分析單元，用於對待編碼HOA信號進行編碼分析，例如分析待編碼HOA信號的聲場分佈，包括待編碼HOA信號的聲源個數、方向性、彌散度等特徵，作為決定如何選擇目標虛擬揚聲器的判斷條件之一。

不限定的是，本申請中，HOA編碼裝置中也可以不包括編碼分析單元，即HOA編碼裝置可以不對輸入信號進行分析，則採用一種預設配置決定如何選擇目標虛擬揚聲器。

其中，HOA編碼裝置獲取待編碼HOA信號，例如可以將從實際採集設備記錄的HOA信號或採用人工音訊物件合成的HOA信號作為編碼器的輸入，同時編碼器輸入的待編碼HOA信號可以是時域HOA信號也可以是頻域HOA信號。

虛擬揚聲器集合生成單元，用於生成虛擬揚聲器集合，該虛擬揚聲器集合中可以包括：多個虛擬揚聲器，虛擬揚聲器集合中的虛擬揚聲器也可以稱為“候選虛擬揚聲器”。

虛擬揚聲器集合生成單元生成指定的候選虛擬揚聲器HOA係數。由虛擬揚聲器配置單元提供的候選虛擬揚聲器的座標（即位置資訊）和候選虛擬揚聲器的HOA階數用於生成候選虛擬揚聲器HOA係數。候選虛擬揚聲器的座標確定方法包括且不限於按等距規則產生K個虛擬揚聲器、根據聽覺感知原理生成非均勻分佈的K個候選虛擬揚聲器。根據候選虛擬揚聲器的個數生成分佈均勻的候選虛擬揚聲器的座標。

接下來生成虛擬揚聲器的HOA係數：

聲波在理想介質中傳播，其波速為k=w/c，角頻率w=2πf，f表示聲波頻率，c表示聲速。因此聲壓p滿足如下公式（1）： ▽ ²p+k ²p=0 （1）

其中，▽ ²為拉普拉斯運算元。

在球座標下求解公式（1），聲壓p可以得到如下公式（2）：（2）

其中，r表示球半徑，θ表示水準角度（azimuth）（水準角度也可以稱作方位角），φ表示俯仰角度（elevation），k表示波速，s表示理想平面波的幅度，m表示HOA階數序號，表示球貝塞爾函數，亦稱作徑向基函數，第一個j是虛數單位，不隨角度變化，是θ和φ對應的球諧函數，是聲源方向的球諧函數。

立體混響（Ambisonics）係數為：（3）

因此可以得到聲壓p的一般展開形式（4）：（4）

上述公式（3）可以表明聲場可以在球面上按球諧函數展開，其通過Ambisonics係數進行表示。

相應的，已知Ambisonics係數則可以重建聲場，將公式（3）截斷到第N項，以Ambisonics係數作為對聲場的近似描述，則稱為N階的HOA係數，該HOA係數亦稱作Ambisonics係數。N階Ambisonics係數共有(N+1) ²個通道。可選的，HOA階數可以為2階~10階，將球諧函數按照HOA信號的一個採樣點對應的係數進行疊加，就能實現該採樣點對應的時刻空間聲場的重構。根據該原理可以生成虛擬揚聲器的HOA係數。將公式（3）中的和分別設置為虛擬揚聲器的位置資訊，即水準角度和俯仰角度，根據式（3）可以獲得該虛擬揚聲器的HOA係數，也稱作Ambisonics係數。例如，針對3階HOA信號，假設s=1，其對應的16通道的HOA係數可通過球諧函數得到，3階HOA信號對應的16通道的HOA係數計算公式具體如表1所示：

表1

l	m	極座標中的運算式
0	0
1	0
+1
-1
2	0
+1
-1
+2
-2
3	0
+1
-1
+2
-2
+3
-3

表1中θ表示虛擬揚聲器在預設球面上的位置資訊的水準角度，φ表示虛擬揚聲器在預設球面上的位置資訊的俯仰角度，l表示HOA階數，l=0,1,…,N，m表示每一階中的方向參數，m=-l,…,l。按照表1中的極座標的運算式，可以根據虛擬揚聲器的位置資訊，獲得該虛擬揚聲器的3階HOA信號對應的16個通道的HOA係數。

虛擬揚聲器集合生成單元輸出的候選虛擬揚聲器的HOA係數作為虛擬揚聲器選擇單元的輸入。

虛擬揚聲器選擇單元，用於根據待編碼HOA信號從虛擬揚聲器集合中的多個候選虛擬揚聲器中選擇出目標虛擬揚聲器，該目標虛擬揚聲器可以稱為“與待編碼HOA信號匹配的虛擬揚聲器”，或者簡稱為匹配虛擬揚聲器。

虛擬揚聲器選擇單元根據待編碼HOA信號與虛擬揚聲器集合生成單元輸出的候選虛擬揚聲器HOA係數，選擇出指定的匹配虛擬揚聲器。

接下來對匹配虛擬揚聲器的選擇方法進行舉例說明：在一種可能的實現方式中，使用候選虛擬揚聲器HOA係數匹配與待編碼HOA信號做內積，選取內積絕對值最大的候選虛擬揚聲器為目標虛擬揚聲器，即匹配虛擬揚聲器，並將待編碼HOA信號在該候選虛擬揚聲器的投影疊加到該候選虛擬揚聲器HOA係數的線性組合上，然後將投影向量從待編碼HOA信號中減去得到差值，對差值重複上述過程實現反覆運算計算，每反覆運算一次產生一個匹配虛擬揚聲器，輸出匹配虛擬揚聲器座標和匹配虛擬揚聲器HOA係數。可以理解的是，匹配虛擬揚聲器會選取多個，每反覆運算一次產生一個匹配虛擬揚聲器。（除此之外，不限定其他實現方法）

虛擬揚聲器選擇單元輸出的目標虛擬揚聲器的座標和目標虛擬揚聲器的HOA係數作為虛擬揚聲器信號生成單元的輸入。

虛擬揚聲器信號生成單元，用於根據待編碼HOA信號和目標虛擬揚聲器的屬性資訊生成虛擬揚聲器信號，其中當屬性資訊為位置資訊時，根據所述目標虛擬揚聲器的位置資訊確定所述目標虛擬揚聲器的HOA係數，當屬性資訊包括HOA係數時，從所述屬性資訊中獲取所述目標虛擬揚聲器的HOA係數。

虛擬揚聲器信號生成單元通過待編碼HOA信號和目標虛擬揚聲器的HOA係數計算虛擬揚聲器信號。

虛擬揚聲器的HOA係數用矩陣A表示，用矩陣A可以線性組合出待編碼HOA信號，進一步的可以採用最小二乘方法求得理論的最優解w，即為虛擬揚聲器信號，例如可以採用如下計算公式：，

其中，代表矩陣A的逆矩陣，矩陣A的大小為(M×C)，C為目標虛擬揚聲器個數，M為階的HOA係數的通道個數，M=(N+1) ²，a表示目標虛擬揚聲器的HOA係數，例如，

X代表待編碼HOA信號，矩陣X的大小為(M×L)，M為階的HOA係數的通道個數，L為時域或頻域樣點個數，x表示待編碼HOA信號的係數，例如，

虛擬揚聲器信號生成單元輸出的虛擬揚聲器信號作為核心編碼器處理單元的輸入。

核心編碼器處理單元，用於對虛擬揚聲器信號進行核心編碼器處理，得到傳輸碼流。

核心編碼器處理包括且不限於變換、量化、心理聲學模型、碼流產生等，可以對頻域傳輸通道進行處理也可以對時域傳輸通道進行處理，此處不做限定。

基於上述實施例的描述，本申請提供了一種虛擬揚聲器集合確定方法。該虛擬揚聲器集合確定方法基於以下預先設定：

一.虛擬揚聲器分佈表

虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，該位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數。設定K個虛擬揚聲器分佈於預設球面上。該預設球面可以包括X個緯線圈，Y個經線圈，X和Y可以相同也可以不同，X和Y均為正整數，例如X為512，768或1024等等，Y為512，768或1024等等。虛擬揚聲器位於所述X個緯線圈和所述Y個經線圈的交匯點上。其中X和Y的取值越大，虛擬揚聲器的候選選擇位置越多，最終選擇的虛擬揚聲器構成的聲場的重播效果就越好。

圖4a為本申請預設球面的一個示例性的示意圖，如圖4a所示，預設球面包含L（L＞1）個緯度區域，第m個緯度區域包含T _m個緯線圈，K個虛擬揚聲器中分佈於第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm，1≤m≤L，T _m為正整數，1≤m _i≤T _m。當T _m＞1時，第m個緯度區域中的任意兩個相鄰緯線圈的俯仰角度差為α _m。圖4b為本申請俯仰角度和水準角度的一個示例性的示意圖，如圖4b所示，虛擬揚聲器的位置和球心之間的連線與預設水平面（例如赤道圈所在平面，或者南極點所在的平面，或者北極點所在的平面，其中，南極點所在的平面垂直於南極點和北極點之間的連線，北極點所在的平面垂直於南極點和北極點之間的連線）之間的夾角為虛擬揚聲器的俯仰角度；虛擬揚聲器的位置和球心之間的連線在水平面上的投影與設定初始方向的夾角為虛擬揚聲器的水準角度。

應當理解的是，K個虛擬揚聲器分佈於各個緯度區域中的一個或多個緯線圈上，位於同一個緯線圈上的相鄰虛擬揚聲器之間的距離通過水準角度差表示，且同一個緯線圈上的所有相鄰虛擬揚聲器之間的水準角度差相等。例如，上述第m _i個緯線圈上，任意兩個相鄰虛擬揚聲器之間的水準角度差均為α _m。而位於同一個緯度區域內的虛擬揚聲器，若該緯度區域包含多個緯線圈，則無論在該緯度區域中的哪一個緯線圈上，相鄰虛擬揚聲器之間的水準角度差全都相等。例如，第m個緯度區域中，第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差和第m _i+1個緯線圈上的相鄰虛擬揚聲器之間的水準角度差均為α _m。另外，若某一個緯度區域包含多個緯線圈，則該緯度區域中的緯線圈之間的距離通過俯仰角度差表示，且任意兩個相鄰緯線圈之間的俯仰角度差和該緯度區域中的相鄰虛擬揚聲器之間的水準角度差相等。

在一種可能的實現方式中，α _n=α _m或者α _n≠α _m，α _n為K個虛擬揚聲器中分佈於第n個緯度區域中的任意一個緯線圈上的相鄰虛擬揚聲器之間的水準角度差，n≠m。

即，位於不同緯度區域的虛擬揚聲器，相鄰虛擬揚聲器之間的水準角度差可以是相等的，α _n=α _m，也可以是不相等的，α _n≠α _m。應當理解的是，本申請並不限定L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差全部相等，也不限定L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差全部不相等，甚至L個緯度區域中可以有部分緯度區域內的相鄰虛擬揚聲器之間的水準角度差相等，而和另一部分緯度區域內的相鄰虛擬揚聲器之間的水準角度差不相等。

在一種可能的實現方式中，α _c＜α _m，α _c為K個虛擬揚聲器中分佈於第m _c個緯線圈上的相鄰虛擬揚聲器之間的水準角度差，第m _c個緯線圈是L個緯度區域中包含赤道緯線圈的緯度區域中的任意一個緯線圈。

即，L個緯度區域中，包含了赤道緯線圈的緯度區域內的相鄰虛擬揚聲器之間的水準角度差是最小的，亦即，L個緯度區域中，包含了赤道緯線圈的緯度區域內的虛擬揚聲器是分佈最密集的。

可選的，可以通過索引的方式表示虛擬揚聲器分佈表中的K個虛擬揚聲器的位置，索引可以包括俯仰角索引和水平角索引。例如，在任意一個緯線圈上，將分佈其上的其中一個虛擬揚聲器的水準角度設置為0，然後根據預設的水準角度與水平角索引之間的轉換公式轉換獲得對應的水平角索引；由於緯線圈上的任意相鄰虛擬揚聲器之間的水平角差值是相等的，因此可以獲得該緯線圈上的其他虛擬揚聲器的水準角度，從而根據上述轉換公式獲得所述其他虛擬揚聲器各自的水平角索引。需要說明的是，本申請對將緯線圈上的哪個虛擬揚聲器的水準角度設置為0不作具體限定。同理，由於在經線圈方向相鄰虛擬揚聲器之間的俯仰角差值滿足前述的要求，因此在設置了俯仰角度為0的虛擬揚聲器後，就可以獲得其他虛擬揚聲器的俯仰角度，基於預設的俯仰角度和俯仰角索引之間的轉換公式就可以獲得經線圈上所有虛擬揚聲器的俯仰角索引。需要說明的是，本申請對將經線圈上哪個虛擬揚聲器的俯仰角度設置為0不作具體限定，例如可以是位於所述赤道圈上的虛擬揚聲器，或者所述位於所述南極點上的虛擬揚聲器，或者位於所述北極點上的虛擬揚聲器。

可選的，上述K個虛擬揚聲器中的第k個虛擬揚聲器，其俯仰角度φ _k和俯仰角索引φ _k’滿足如下公式（即俯仰角度和俯仰角索引的轉換公式）：

其中，r _k表示第k個虛擬揚聲器所在經線圈的半徑，round()表示取整。

上述K個虛擬揚聲器中的第k個虛擬揚聲器，其水準角度θ _k和水平角索引θ _k’滿足如下公式（即水準角度和水平角索引的轉換公式）：

其中，r _k表示第k個虛擬揚聲器所在緯線圈的半徑，round()表示取整。

圖5a和圖5b為K個虛擬揚聲器的示例性的分佈圖。如圖5a所示，包含了赤道緯線圈的緯度區域內的相鄰虛擬揚聲器之間的水準角度差小於其他緯度區域內的相鄰虛擬揚聲器之間的水準角度差，α _c＜α _m。如圖5b所示，K個虛擬揚聲器在預設球面上隨機近似均勻分佈。

表1示出了圖5a和圖5b所示的分佈圖的比較，假設K=1669，可以看出圖5a的分佈方法獲得的HOA重建信號的信噪比（SNR）的平均值高於圖5b的分佈方法獲得的HOA重建信號的信噪比。

表1

檔案名	圖5b的分佈方法 SNR(dB)	圖5a的分佈方法 SNR(dB)
1	12.75	10.86
2	8.83	12.86
3	13.16	24.85
4	18.66	11.97
5	12.18	15.04
6	10.85	13.41
7	6.28	6.31
8	10.49	11.15
9	12.97	16.16
10	6.93	6.94
11	8.17	8.66
12	8.11	8.59
平均值	10.78	12.23

如表1所示，本實施例採用了12個不同類型的測試音訊，檔案名從1到12分別為單聲源語音信號、單聲源樂器信號、兩聲源語音信號、兩聲源樂器信號、三聲源語音樂器混合信號、四聲源語音樂器混合信號、兩聲源雜訊信號1、兩聲源雜訊信號2、兩聲源雜訊信號3、兩聲源雜訊信號4、兩聲源混響信號1、兩聲源混響信號2。

圖6a和圖6b為K個虛擬揚聲器的示例性的分佈圖。如圖6a所示，L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差均相等，α _n=α _m。如圖6b所示，K個虛擬揚聲器在預設球面上隨機近似均勻分佈。

表2示出了圖6a和圖6b所示的分佈圖的比較，假設K=1669，可以看出圖6a的分佈方法獲得的HOA重建信號的信噪比（SNR）的平均值高於圖6b的分佈方法獲得的HOA重建信號的信噪比。

表2

檔案名	圖6b的分佈方法 SNR(dB)	圖6a的分佈方法 SNR(dB)
1	12.75	10.45
2	8.83	9.95
3	13.16	22.67
4	18.66	15.36
5	12.18	15.00
6	10.85	12.53
7	6.28	6.33
8	10.49	11.17
9	12.97	16.10
10	6.93	6.99
11	8.17	8.67
12	8.11	8.41
平均值	10.78	11.97

如表2所示，本實施例採用了12個不同類型的測試音訊，檔案名從1到12分別為單聲源語音信號、單聲源樂器信號、兩聲源語音信號、兩聲源樂器信號、三聲源語音樂器混合信號、四聲源語音樂器混合信號、兩聲源雜訊信號1、兩聲源雜訊信號2、兩聲源雜訊信號3、兩聲源雜訊信號4、兩聲源混響信號1、兩聲源混響信號2。

示例性的，表3是虛擬揚聲器分佈表的一個示例，該示例中K為530，即表3描述了序號從0~529的530個虛擬揚聲器的具體分佈，位置表示對應序號虛擬揚聲器的水平角索引和俯仰角索引，表格中位置列中“,”前的數位是水平角索引，“,”後的數位是俯仰角索引。

表3 虛擬揚聲器分佈表

序號	位置	序號	位置	序號	位置	序號	位置	序號	位置
0	5, 768	106	444, 987	212	453, 5	318	208, 34	424	19, 68
1	5, 805	107	478, 987	213	470, 5	319	226, 34	425	37, 68
2	146, 805	108	512, 987	214	487, 5	320	243, 34	426	56, 68
3	293, 805	109	546, 987	215	504, 5	321	260, 34	427	74, 68
4	439, 805	110	580, 987	216	520, 5	322	278, 34	428	93, 68
5	585, 805	111	614, 987	217	537, 5	323	295, 34	429	112, 68
6	731, 805	112	649, 987	218	554, 5	324	312, 34	430	130, 68
7	878, 805	113	683, 987	219	571, 5	325	330, 34	431	149, 68
8	5, 841	114	717, 987	220	588, 5	326	347, 34	432	168, 68
9	73, 841	115	751, 987	221	604, 5	327	364, 34	433	186, 68
10	146, 841	116	785, 987	222	621, 5	328	382, 34	434	205, 68
11	219, 841	117	819, 987	223	638, 5	329	399, 34	435	223, 68
12	293, 841	118	853, 987	224	655, 5	330	417, 34	436	242, 68
13	366, 841	119	887, 987	225	671, 5	331	434, 34	437	261, 68
14	439, 841	120	922, 987	226	688, 5	332	451, 34	438	279, 68
15	512, 841	121	956, 987	227	705, 5	333	469, 34	439	298, 68
16	585, 841	122	990, 987	228	722, 5	334	486, 34	440	317, 68
17	658, 841	123	5, 256	229	739, 5	335	503, 34	441	335, 68
18	731, 841	124	5, 222	230	755, 5	336	521, 34	442	354, 68
19	805, 841	125	146, 222	231	772, 5	337	538, 34	443	372, 68
20	878, 841	126	293, 222	232	789, 5	338	555, 34	444	391, 68
21	951, 841	127	439, 222	233	806, 5	339	573, 34	445	410, 68
22	5, 878	128	585, 222	234	823, 5	340	590, 34	446	428, 68
23	54, 878	129	731, 222	235	839, 5	341	607, 34	447	447, 68
24	108, 878	130	878, 222	236	856, 5	342	625, 34	448	465, 68
25	162, 878	131	5, 188	237	873, 5	343	642, 34	449	484, 68
26	216, 878	132	79, 188	238	890, 5	344	660, 34	450	503, 68
27	269, 878	133	158, 188	239	906, 5	345	677, 34	451	521, 68
28	323, 878	134	236, 188	240	923, 5	346	694, 34	452	540, 68
29	377, 878	135	315, 188	241	940, 5	347	712, 34	453	559, 68
30	431, 878	136	394, 188	242	957, 5	348	729, 34	454	577, 68
31	485, 878	137	473, 188	243	974, 5	349	746, 34	455	596, 68
32	539, 878	138	551, 188	244	990, 5	350	764, 34	456	614, 68
33	593, 878	139	630, 188	245	1007, 5	351	781, 34	457	633, 68
34	647, 878	140	709, 188	246	5, 17	352	798, 34	458	652, 68
35	701, 878	141	788, 188	247	17, 17	353	816, 34	459	670, 68
36	755, 878	142	866, 188	248	34, 17	354	833, 34	460	689, 68
37	808, 878	143	945, 188	249	51, 17	355	850, 34	461	707, 68
38	862, 878	144	5, 154	250	68, 17	356	868, 34	462	726, 68
39	916, 878	145	57, 154	251	85, 17	357	885, 34	463	745, 68
40	970, 878	146	114, 154	252	102, 17	358	903, 34	464	763, 68
41	5, 914	147	171, 154	253	119, 17	359	920, 34	465	782, 68
42	43, 914	148	228, 154	254	137, 17	360	937, 34	466	801, 68
43	85, 914	149	284, 154	255	154, 17	361	955, 34	467	819, 68
44	128, 914	150	341, 154	256	171, 17	362	972, 34	468	838, 68
45	171, 914	151	398, 154	257	188, 17	363	989, 34	469	856, 68
46	213, 914	152	455, 154	258	205, 17	364	1007, 34	470	875, 68
47	256, 914	153	512, 154	259	222, 17	365	5, 51	471	894, 68
48	299, 914	154	569, 154	260	239, 17	366	18, 51	472	912, 68
49	341, 914	155	626, 154	261	256, 17	367	35, 51	473	931, 68
50	384, 914	156	683, 154	262	273, 17	368	53, 51	474	950, 68
51	427, 914	157	740, 154	263	290, 17	369	71, 51	475	968, 68
52	469, 914	158	796, 154	264	307, 17	370	88, 51	476	987, 68
53	512, 914	159	853, 154	265	324, 17	371	106, 51	477	1005, 68
54	555, 914	160	910, 154	266	341, 17	372	124, 51	478	5, 85
55	597, 914	161	967, 154	267	358, 17	373	141, 51	479	20, 85
56	640, 914	162	5, 119	268	375, 17	374	159, 51	480	39, 85
57	683, 914	163	45, 119	269	393, 17	375	177, 51	481	59, 85
58	725, 914	164	89, 119	270	410, 17	376	194, 51	482	79, 85
59	768, 914	165	134, 119	271	427, 17	377	212, 51	483	98, 85
60	811, 914	166	178, 119	272	444, 17	378	230, 51	484	118, 85
61	853, 914	167	223, 119	273	461, 17	379	247, 51	485	138, 85
62	896, 914	168	267, 119	274	478, 17	380	265, 51	486	158, 85
63	939, 914	169	312, 119	275	495, 17	381	282, 51	487	177, 85
64	981, 914	170	356, 119	276	512, 17	382	300, 51	488	197, 85
65	5, 951	171	401, 119	277	529, 17	383	318, 51	489	217, 85
66	37, 951	172	445, 119	278	546, 17	384	335, 51	490	236, 85
67	73, 951	173	490, 119	279	563, 17	385	353, 51	491	256, 85
68	110, 951	174	534, 119	280	580, 17	386	371, 51	492	276, 85
69	146, 951	175	579, 119	281	597, 17	387	388, 51	493	295, 85
70	183, 951	176	623, 119	282	614, 17	388	406, 51	494	315, 85
71	219, 951	177	668, 119	283	631, 17	389	424, 51	495	335, 85
72	256, 951	178	712, 119	284	649, 17	390	441, 51	496	354, 85
73	293, 951	179	757, 119	285	666, 17	391	459, 51	497	374, 85
74	329, 951	180	801, 119	286	683, 17	392	477, 51	498	394, 85
75	366, 951	181	846, 119	287	700, 17	393	494, 51	499	414, 85
76	402, 951	182	890, 119	288	717, 17	394	512, 51	500	433, 85
77	439, 951	183	935, 119	289	734, 17	395	530, 51	501	453, 85
78	475, 951	184	979, 119	290	751, 17	396	547, 51	502	473, 85
79	512, 951	185	5, 5	291	768, 17	397	565, 51	503	492, 85
80	549, 951	186	17, 5	292	785, 17	398	583, 51	504	512, 85
81	585, 951	187	34, 5	293	802, 17	399	600, 51	505	532, 85
82	622, 951	188	50, 5	294	819, 17	400	618, 51	506	551, 85
83	658, 951	189	67, 5	295	836, 17	401	636, 51	507	571, 85
84	695, 951	190	84, 5	296	853, 17	402	653, 51	508	591, 85
85	731, 951	191	101, 5	297	870, 17	403	671, 51	509	610, 85
86	768, 951	192	118, 5	298	887, 17	404	689, 51	510	630, 85
87	805, 951	193	134, 5	299	905, 17	405	706, 51	511	650, 85
88	841, 951	194	151, 5	300	922, 17	406	724, 51	512	670, 85
89	878, 951	195	168, 5	301	939, 17	407	742, 51	513	689, 85
90	914, 951	196	185, 5	302	956, 17	408	759, 51	514	709, 85
91	951, 951	197	201, 5	303	973, 17	409	777, 51	515	729, 85
92	987, 951	198	218, 5	304	990, 17	410	794, 51	516	748, 85
93	5, 987	199	235, 5	305	1007, 17	411	812, 51	517	768, 85
94	34, 987	200	252, 5	306	5, 34	412	830, 51	518	788, 85
95	68, 987	201	269, 5	307	17, 34	413	847, 51	519	807, 85
96	102, 987	202	285, 5	308	35, 34	414	865, 51	520	827, 85
97	137, 987	203	302, 5	309	52, 34	415	883, 51	521	847, 85
98	171, 987	204	319, 5	310	69, 34	416	900, 51	522	866, 85
99	205, 987	205	336, 5	311	87, 34	417	918, 51	523	886, 85
100	239, 987	206	353, 5	312	104, 34	418	936, 51	524	906, 85
101	273, 987	207	369, 5	313	121, 34	419	953, 51	525	926, 85
102	307, 987	208	386, 5	314	139, 34	420	971, 51	526	945, 85
103	341, 987	209	403, 5	315	156, 34	421	989, 51	527	965, 85
104	375, 987	210	420, 5	316	174, 34	422	1006, 51	528	985, 85
105	410, 987	211	436, 5	317	191, 34	423	5, 68	529	1004, 85

需要說明的是，表3中虛擬揚聲器所分佈的球面包括了1024個經線圈以及1024個緯線圈（南極點和北極點也分別對應一個緯線圈），所述1024個經線圈和1024個緯線圈對應了1024×1022+2=1046530個交匯點，所述1046530個交匯點分別有各自的俯仰角和水平角，相應地，所述1046530個交匯點分別有各自的俯仰角索引和水平角索引；表3中的530個虛擬揚聲器的位置是所述1046530個交匯點中的530個。其中，表3中俯仰角索引是基於赤道的俯仰角度為0進行計算獲得的，即除赤道外，其餘俯仰角索引所對應的俯仰角度均是相對於赤道所在平面的俯仰角度。

二、預設的F個虛擬揚聲器

F個虛擬揚聲器滿足條件：F個虛擬揚聲器中分佈於第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α _mi大於α _m，第m _i個緯線圈是第m個緯度區域內的其中一個緯線圈。

為方便描述，將K個虛擬揚聲器中的虛擬揚聲器稱作候選虛擬揚聲器，將F個虛擬揚聲器中的任意一個虛擬揚聲器稱作中心虛擬揚聲器（亦可以稱作第一輪虛擬揚聲器）。即，針對預設球面上的任意一個緯線圈，可以從分佈在該緯線圈上的多個候選虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器，加入F個虛擬揚聲器中。若是選取多個虛擬揚聲器，則相鄰中心虛擬揚聲器之間的水準角度差α _mi大於相鄰候選虛擬揚聲器之間的水準角度差α _m，可以表示為α _mi＞α _m。亦即，針對某一個緯線圈，分佈有多個候選虛擬揚聲器，中心虛擬揚聲器選自該多個候選虛擬揚聲器，且密度更小。例如，緯線圈上的相鄰候選虛擬揚聲器之間的水準角度差α _m=5°，相鄰中心虛擬揚聲器之間的水準角度差α _mi=8°。

在一種可能的實現方式中，α _mi=q×α _m，其中，q為大於1的正整數。可見，相鄰中心虛擬揚聲器之間的水準角度差和相鄰候選虛擬揚聲器之間的水準角度差成倍數關係。例如，緯線圈上的相鄰候選虛擬揚聲器之間的水準角度差α _m=5°，相鄰中心虛擬揚聲器之間的水準角度差α _mi=10°。

三、F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器

為方便描述，將S個虛擬揚聲器中的虛擬揚聲器稱作目標虛擬揚聲器。即，任意一個中心虛擬揚聲器對應的S個虛擬揚聲器滿足條件：該S個虛擬揚聲器包括前述任意一個中心虛擬揚聲器，以及位於該任意一個中心虛擬揚聲器周圍的S-1個虛擬揚聲器，該S-1個虛擬揚聲器與前述任意一個中心虛擬揚聲器的S-1個相關性中的任意一個相關性大於K個虛擬揚聲器中除S個虛擬揚聲器外的其它K-S個虛擬揚聲器與前述任意一個中心虛擬揚聲器的K-S個相關性中的所有相關性。

亦即，該S個虛擬揚聲器對應的S個R _fk是K個虛擬揚聲器對應的K個R _fk中最大的S個。最大的S個表示K個R _fk從大到小排序，排在最前面的S個R _fk即為最大的S個。

R _fk表示上述任意一個中心虛擬揚聲器和K個虛擬揚聲器中的第k個虛擬揚聲器的相關性，R _fk滿足如下公式：

其中，表示上述任意一個虛擬揚聲器的水準角度，表示上述任意一個虛擬揚聲器的俯仰角度，表示上述任意一個虛擬揚聲器的HOA係數，表示K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。

通過上述方法即可給每個中心虛擬揚聲器確定出S個目標虛擬揚聲器。應當理解的是，本申請預先設定的是，來自K個虛擬揚聲器的F個虛擬揚聲器，因此每個中心虛擬揚聲器的位置也可以用俯仰角索引和水平角索引表示；每個中心虛擬揚聲器對應S個虛擬揚聲器，該S個虛擬揚聲器也來源於K個虛擬揚聲器，因此每個目標虛擬揚聲器的位置也可以用俯仰角索引和水平角索引表示。

圖7是本申請虛擬揚聲器集合確定方法的一個示例性的流程圖。該過程700可由上述實施例中的編碼器20或解碼器30執行，即由音訊發送設備中的編碼器20實現音訊編碼，然後將碼流資訊發送給音訊接收設備，由音訊接收設備中的解碼器30對碼流資訊進行解碼以獲得目標音訊幀，進而基於該目標音訊幀渲染得到對應於一個或多個虛擬揚聲器的聲場音訊信號。過程700描述為一系列的步驟或操作，應當理解的是，過程700可以以各種循序執行和/或同時發生，不限於圖7所示的執行順序。如圖7所示，該方法包括：

步驟701、根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器。

如上所述，對待處理的音訊信號進行編碼分析，例如分析待處理的音訊信號的聲場分佈，包括音訊信號的聲源個數、方向性、彌散度等特徵，得到該音訊信號的HOA係數，作為決定如何選擇目標虛擬揚聲器的判斷條件之一。根據待處理的音訊信號的HOA係數和候選的虛擬揚聲器（即上述F個虛擬揚聲器）的HOA係數，可以選擇出與待處理的音訊信號匹配的虛擬揚聲器，本申請中將該虛擬揚聲器稱作目標虛擬揚聲器。

在一種可能的實現方式中，可以先獲取音訊信號的HOA係數，再獲取F個虛擬揚聲器對應的F組HOA係數，F個虛擬揚聲器與F組HOA係數是一一對應的，然後將F組HOA係數中與音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為目標虛擬揚聲器。

本申請可以將F個虛擬揚聲器各自的HOA係數分別與音訊信號的HOA係數做內積，選取內積絕對值最大的虛擬揚聲器為目標虛擬揚聲器。即，F組HOA係數中每一組包含(N+1) ²個係數，音訊信號的HOA係數包含(N+1) ²個係數，N表示音訊信號的階數，因此音訊信號的HOA係數與F組HOA係數中的每一組一一對應，基於此對應關係，將音訊信號的HOA係數分別與F組HOA係數中每一組做內積，得到音訊信號的HOA係數分別與F組HOA係數中每一組之間的相關性。需要說明的是，還可以採用其他方法確定目標虛擬揚聲器，本申請對此不做具體限定。

步驟702、從預設的虛擬揚聲器分佈表中獲取與目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，該位置資訊包括俯仰角索引和水平角索引。

基於上述本申請的預先設定，一旦確定了目標虛擬揚聲器（亦即中心虛擬揚聲器），該目標虛擬揚聲器對應的S個虛擬揚聲器就可以獲取到。而基於最早設定的虛擬揚聲器分佈表，就可以得到該S個虛擬揚聲器的位置資訊。與K個虛擬揚聲器採用同樣的表示方法，S個虛擬揚聲器的位置資訊用俯仰角索引和水平角索引表示。

由此可見，在確定目標虛擬揚聲器時，該目標虛擬揚聲器是與待處理的音訊信號HOA係數相關性最高的中心虛擬揚聲器。而每個中心虛擬揚聲器對應的S個虛擬揚聲器是與該中心虛擬揚聲器HOA係數相關性最高的S個虛擬揚聲器，而因此與目標虛擬揚聲器對應的S個虛擬揚聲器也是與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器。

圖8為本申請虛擬揚聲器集合確定裝置的一個示例性的結構圖，如圖8所示，該裝置可以應用於上述實施例中的編碼器20或解碼器30。本實施例的虛擬揚聲器集合確定裝置可以包括：確定模組801和獲取模組802，其中，確定模組801，用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；獲取模組802，用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F≤K，F×S≥K。

在一種可能的實現方式中，所述確定模組801，具體用於獲取所述音訊信號的高階立體混響HOA係數；獲取所述F個虛擬揚聲器對應的F組HOA係數，所述F個虛擬揚聲器與所述F組HOA係數一一對應；將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。

在一種可能的實現方式中，所述K個虛擬揚聲器滿足如下條件：所述K個虛擬揚聲器分佈於預設球面上；所述預設球面包含L個緯度區域，L＞1；其中，所述L個緯度區域中第m個緯度區域包含T _m個緯線圈，所述K個虛擬揚聲器中分佈於第m _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm，1≤m≤L，T _m為正整數，1≤m _i≤T _m；其中，當T _m＞1時，所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _m。

在一種可能的實現方式中，所述L個緯度區域中第n個緯度區域包含T _n個緯線圈，所述K個虛擬揚聲器中分佈於第n _i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αn，1≤n≤L，T _n為正整數，1≤n _i≤T _n；其中，當T _n＞1時，所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α _n；其中，v=α _m或者α _n≠α _m，n≠m。

本實施例的裝置，可以用於執行圖7所示方法實施例的技術方案，其實現原理和技術效果類似，此處不再贅述。

在實現過程中，上述方法實施例的各步驟可以通過處理器中的硬體的集成邏輯電路或者軟體形式的指令完成。處理器可以是通用處理器、數位訊號處理器（digital signal processor, DSP）、特定應用積體電路（application-specific integrated circuit，ASIC)、現場可程式設計閘陣列（field programmable gate array, FPGA）或其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。本申請公開的方法的步驟可以直接體現為硬體編碼處理器執行完成，或者用編碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機記憶體，快閃記憶體、唯讀記憶體，可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、寄存器等本領域成熟的存儲介質中。該存儲介質位於記憶體，處理器讀取記憶體中的資訊，結合其硬體完成上述方法的步驟。

上述各實施例中提及的記憶體可以是易失性記憶體或非易失性記憶體，或可包括易失性和非易失性記憶體兩者。其中，非易失性記憶體可以是唯讀記憶體（read-only memory，ROM）、可程式設計唯讀記憶體（programmable ROM，PROM）、可擦除可程式設計唯讀記憶體（erasable PROM，EPROM）、電可擦除可程式設計唯讀記憶體（electrically EPROM，EEPROM）或快閃記憶體。易失性記憶體可以是隨機存取記憶體（random access memory，RAM），其用作外部快取記憶體。通過示例性但不是限制性說明，許多形式的RAM可用，例如靜態隨機存取記憶體（static RAM，SRAM）、動態隨機存取記憶體（dynamic RAM，DRAM）、同步動態隨機存取記憶體（synchronous DRAM，SDRAM）、雙倍數據速率同步動態隨機存取記憶體（double data rate SDRAM，DDR SDRAM）、增強型同步動態隨機存取記憶體（enhanced SDRAM，ESDRAM）、同步連接動態隨機存取記憶體（synchlink DRAM，SLDRAM）和直接記憶體匯流排隨機存取記憶體（direct rambus RAM，DR RAM）。應注意，本文描述的系統和方法的記憶體旨在包括但不限於這些和任意其它適合類型的記憶體。

本領域普通技術人員可以意識到，結合本文中所公開的實施例描述的各示例的單元及演算法步驟，能夠以電子硬體、或者電腦軟體和電子硬體的結合來實現。這些功能究竟以硬體還是軟體方式來執行，取決於技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能，但是這種實現不應認為超出本申請的範圍。

所屬領域的技術人員可以清楚地瞭解到，為描述的方便和簡潔，上述描述的系統、裝置和單元的具體工作過程，可以參考前述方法實施例中的對應過程，在此不再贅述。

在本申請所提供的幾個實施例中，應該理解到，所揭露的系統、裝置和方法，可以通過其它的方式實現。例如，以上所描述的裝置實施例僅僅是示意性的，例如，所述單元的劃分，僅僅為一種邏輯功能劃分，實際實現時可以有另外的劃分方式，例如多個單元或元件可以結合或者可以集成到另一個系統，或一些特徵可以忽略，或不執行。另一點，所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些介面，裝置或單元的間接耦合或通信連接，可以是電性，機械或其它的形式。

所述作為分離部件說明的單元可以是或者也可以不是物理上分開的，作為單元顯示的部件可以是或者也可以不是物理單元，即可以位於一個地方，或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。

另外，在本申請各個實施例中的各功能單元可以集成在一個處理單元中，也可以是各個單元單獨物理存在，也可以兩個或兩個以上單元集成在一個單元中。

所述功能如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時，可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解，本申請的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的部分可以以軟體產品的形式體現出來，該電腦軟體產品存儲在一個存儲介質中，包括若干指令用以使得一台電腦設備（個人電腦，伺服器，或者網路設備等）執行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括：U盤、移動硬碟、唯讀記憶體（read-only memory，ROM）、隨機存取記憶體（random access memory，RAM）、磁碟或者光碟等各種可以存儲程式碼的介質。

以上所述，僅為本申請的具體實施方式，但本申請的保護範圍並不局限於此，任何熟悉本技術領域的技術人員在本申請揭露的技術範圍內，可輕易想到變化或替換，都應涵蓋在本申請的保護範圍之內。因此，本申請的保護範圍應以所述權利要求的保護範圍為准。

10:音訊解碼系統 12:源設備 13:通信通道 14:目的設備 16:音訊源 18:音訊預處理器 20:編碼器 22、28:通信介面 30:解碼器 32:音訊後處理器 34:播放設備 700:過程 701、702:步驟 801:確定模組 802:獲取模組

圖1為本申請音訊播放系統的一個示例性的結構圖；圖2為本申請音訊解碼系統10的一個示例性的結構圖；圖3為本申請HOA編碼裝置的一個示例性的結構圖；圖4a為本申請預設球面的一個示例性的示意圖；圖4b為本申請俯仰角度和水準角度的一個示例性的示意圖；圖5a和圖5b為K個虛擬揚聲器的示例性的分佈圖；圖6a和圖6b為K個虛擬揚聲器的示例性的分佈圖；圖7是本申請虛擬揚聲器集合確定方法的一個示例性的流程圖；圖8為本申請虛擬揚聲器集合確定裝置的一個示例性的結構圖。

701、702:步驟

Claims

一種虛擬揚聲器集合確定方法，其中，包括：根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；從預設的虛擬揚聲器分佈表中，獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F
K，F×S
K，其中，從所述K個虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器，加入所述F個虛擬揚聲器中。
如請求項1所述的方法，其中，所述根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，包括：獲取所述音訊信號的高階立體混響HOA係數；獲取所述F個虛擬揚聲器對應的F組HOA係數，所述F個虛擬揚聲器與所述F組HOA係數一一對應；將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
如請求項1所述的方法，其中，所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件：所述S個虛擬揚聲器包括所述目標虛擬揚聲器，以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器，所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
如請求項1-3中任一項所述的方法，其中，所述K個虛擬揚聲器滿足如下條件：所述K個虛擬揚聲器分佈於預設球面上；所述預設球面包含L個緯度區域，L>1；其中，所述L個緯度區域中第m個緯度區域包含T_m個緯線圈，所述K個虛擬揚聲器中分佈於第m_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α_m，1
m
L，T_m為正整數，1
m_i
T_m；其中，當T_m>1時，所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_m。
如請求項4所述的方法，其中，所述L個緯度區域中第n個緯度區域包含T_n個緯線圈，所述K個虛擬揚聲器中分佈於第n_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α_n，1
n
L，T_n為正整數，1
n_i
T_n；其中，當T_n>1時，所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_n；其中，α_n=α_m或者α_n≠α_m，n≠m。
如請求項4所述的方法，其中，所述L個緯度區域中第c個緯度區域包含T_c個緯線圈，所述T_c個緯線圈的其中之一為赤道緯線圈，所述K個虛擬揚聲器中分佈於第c_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α_c，1
c
L，T_c為正整數，1
c_i
T_c；其中，當T_c>1時，所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_c；其中，α_c<α_m，c≠m。
如請求項4所述的方法，其中，所述F個虛擬揚聲器滿足如下條件：所述F個虛擬揚聲器中分佈於所述第m_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α_mi大於α_m。
如請求項7所述的方法，其中，α_mi=q×α_m，其中，q為大於1的正整數。
如請求項3所述的方法，其中，所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R_fk滿足如下公式：R _fk=B_f(θ,φ)‧B_k(θ,φ)其中，θ表示所述目標虛擬揚聲器的水準角度，φ表示所述目標虛擬揚聲器的俯仰角度，B_f(θ,φ)表示所述目標虛擬揚聲器的HOA係數，B_k(θ,φ)表示所述第k個虛擬揚聲器的HOA係數。
一種虛擬揚聲器集合確定裝置，其中，包括：確定模組，用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器，所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器，F為正整數，S為大於1的正整數；獲取模組，用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊，所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊，所述位置資訊包括俯仰角索引和水平角索引，K為大於1的正整數，F
K，F×S
K，其中，從所述K個虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器，加入所述F個虛擬揚聲器中。
如請求項10所述的裝置，其中，所述確定模組，具體用於獲取所述音訊信號的高階立體混響HOA係數；獲取所述F個虛擬揚聲器對應的F組HOA係數，所述F個虛擬揚聲器與所述F組HOA係數一一對應；將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
如請求項10所述的裝置，其中，所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件：所述S個虛擬揚聲器包括所述目標虛擬揚聲器，以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器，所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
如請求項10-12中任一項所述的裝置，其中，所述K個虛擬揚聲器滿足如下條件：所述K個虛擬揚聲器分佈於預設球面上；所述預設球面包含L個緯度區域，L>1；其中，所述L個緯度區域中第m個緯度區域包含T_m個緯線圈，所述K個虛擬揚聲器中分佈於第m_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α_m，1
m
L，T_m為正整數，1
m_i
T_m；其中，當T_m>1時，所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_m。
如請求項13所述的裝置，其中，所述L個緯度區域中第n個緯度區域包含T_n個緯線圈，所述K個虛擬揚聲器中分佈於第n_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α_n，1
n
L，T_n為正整數，1
n_i
T_n；其中，當T_n>1時，所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_n；其中，α_n=α_m或者α_n≠α_m，n≠m。
如請求項13所述的裝置，其中，所述L個緯度區域中第c個緯度區域包含T_c個緯線圈，所述T_c個緯線圈的其中之一為赤道緯線圈，所述K個虛擬揚聲器中分佈於第c_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αc，1
c
L，T_c為正整數，1
c_i
T_c；其中，當T_c>1時，所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α_c；其中，α_c<α_m，c≠m。
如請求項13所述的裝置，其中，所述F個虛擬揚聲器滿足如下條件：所述F個虛擬揚聲器中分佈於所述第m_i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α_mi大於α_m。
如請求項16所述的裝置，其中，α_mi=q×α_m，其中，q為大於1的正整數。
如請求項12所述的裝置，其中，所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R_fk滿足如下公式：R _fk=B_f(θ,φ)．B_k(θ,φ)其中，θ表示所述目標虛擬揚聲器的水準角度，φ表示所述目標虛擬揚聲器的俯仰角度，B_f(θ,φ)表示所述目標虛擬揚聲器的HOA係數，B_k(θ,φ)表示所述第k個虛擬揚聲器的HOA係數。
一種音訊處理設備，其中，包括：一個或多個處理器；記憶體，用於存儲一個或多個程式；當所述一個或多個程式被所述一個或多個處理器執行，使得所述一個或多個處理器實現如請求項1-9中任一項所述的方法。
一種電腦可讀存儲介質，其中，包括電腦程式，所述電腦程式在電腦上被執行時，使得所述電腦執行如請求項1-9中任一項所述的方法。