TWI816313B - 虛擬揚聲器集合確定方法和裝置 - Google Patents

虛擬揚聲器集合確定方法和裝置 Download PDF

Info

Publication number
TWI816313B
TWI816313B TW111107551A TW111107551A TWI816313B TW I816313 B TWI816313 B TW I816313B TW 111107551 A TW111107551 A TW 111107551A TW 111107551 A TW111107551 A TW 111107551A TW I816313 B TWI816313 B TW I816313B
Authority
TW
Taiwan
Prior art keywords
virtual
speakers
latitude
virtual speakers
speaker
Prior art date
Application number
TW111107551A
Other languages
English (en)
Other versions
TW202245487A (zh
Inventor
高原
劉帥
王賓
王喆
曲天書
徐佳浩
Original Assignee
大陸商華為技術有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 大陸商華為技術有限公司 filed Critical 大陸商華為技術有限公司
Publication of TW202245487A publication Critical patent/TW202245487A/zh
Application granted granted Critical
Publication of TWI816313B publication Critical patent/TWI816313B/zh

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/024Positioning of loudspeaker enclosures for spatial sound reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)

Abstract

本申請提供一種虛擬揚聲器集合確定方法和裝置。虛擬揚聲器集合確定方法,包括:根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F≤K,F×S≥K。本申請可以提升音訊信號的重播效果。

Description

虛擬揚聲器集合確定方法和裝置
本發明涉及音訊技術領域,特別涉及虛擬揚聲器集合確定方法和裝置。
三維音訊技術是通過電腦、信號處理等方式對真實世界中聲音事件和三維聲場資訊進行獲取、處理,傳輸和渲染重播的音訊技術。三維音訊技術使聲音具有強烈的空間感、包圍感及沉浸感,給人以“聲臨其境”的聽覺體驗。目前主流的三維音訊技術是高階立體混響(higher order ambisonics,HOA)技術,HOA技術因其在錄製和編碼中與重播階段的揚聲器佈局無關的性質,以及HOA格式資料的可旋轉特性,使得HOA技術在三維音訊重播時具有更高的靈活性,因而也得到了更為廣泛的關注和研究。
HOA技術可以將HOA信號轉為虛擬揚聲器信號再映射為雙耳信號進行重播。在上述過程中,虛擬揚聲器均勻分佈可以達到最好的採樣效果,例如將虛擬揚聲器分佈於正四面體的頂點上。但由於三維空間中正多面體的數量只有五種,即正四面體、正六面體、正八面體、正十二面體和正二十面體,因此可以設置的虛擬揚聲器的數量有限,不能適用於更多數量的虛擬揚聲器的分佈。
本申請提供一種虛擬揚聲器集合確定方法和裝置,以提升音訊信號的重播效果。
第一方面,本申請提供一種虛擬揚聲器集合確定方法,包括:根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F≤K,F×S≥K。
本申請通過預先設定虛擬揚聲器分佈表,使得按照該分佈表部署虛擬揚聲器可以獲得較高的HOA重建信號的信噪比(SNR)平均值,進而在基於這種分佈的情況下選取與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器,可以達到最優的採樣效果,進而提升音訊信號的重播效果。
在一種可能的實現方式中,所述根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,包括:獲取所述音訊信號的高階立體混響HOA係數;獲取所述F個虛擬揚聲器對應的F組HOA係數,所述F個虛擬揚聲器與所述F組HOA係數一一對應;將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
對待處理的音訊信號進行編碼分析,例如分析待處理的音訊信號的聲場分佈,包括音訊信號的聲源個數、方向性、彌散度等特徵,得到該音訊信號的HOA係數,作為決定如何選擇目標虛擬揚聲器的判斷條件之一。根據待處理的音訊信號的HOA係數和候選的虛擬揚聲器(即上述F個虛擬揚聲器)的HOA係數,可以選擇出與待處理的音訊信號匹配的虛擬揚聲器,本申請中將該虛擬揚聲器稱作目標虛擬揚聲器。可以將F個虛擬揚聲器各自的HOA係數分別與音訊信號的HOA係數做內積,選取內積絕對值最大的虛擬揚聲器為目標虛擬揚聲器。需要說明的是,還可以採用其他方法確定目標虛擬揚聲器,本申請對此不做具體限定。
在一種可能的實現方式中,所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件:所述S個虛擬揚聲器包括所述目標虛擬揚聲器,以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器,所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
在確定目標虛擬揚聲器時,該目標虛擬揚聲器是與待處理的音訊信號HOA係數相關性最高的中心虛擬揚聲器。而每個中心虛擬揚聲器對應的S個虛擬揚聲器是與該中心虛擬揚聲器HOA係數相關性最高的S個虛擬揚聲器,而因此與目標虛擬揚聲器對應的S個虛擬揚聲器也是與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器。
在一種可能的實現方式中,所述K個虛擬揚聲器滿足如下條件:所述K個虛擬揚聲器分佈於預設球面上;所述預設球面包含L個緯度區域,L>1;其中,所述L個緯度區域中第m個緯度區域包含T m個緯線圈,所述K個虛擬揚聲器中分佈於第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α m,1≤m≤L,T m為正整數,1≤mi≤T m;其中,當T m>1時,所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α m
在一種可能的實現方式中,所述L個緯度區域中第n個緯度區域包含T n個緯線圈,所述K個虛擬揚聲器中分佈於第n i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α n,1≤n≤L,T n為正整數,1≤n i≤T n;其中,當T n>1時,所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α n;其中,α nm或者α n≠α m,n≠m。
在一種可能的實現方式中,所述L個緯度區域中第c個緯度區域包含T c個緯線圈,所述T c個緯線圈的其中之一為赤道緯線圈,所述K個虛擬揚聲器中分佈於第c i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α c,1≤c≤L,T c為正整數,1≤c i≤T c;其中,當T c>1時,所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α c;其中,α c<α m,c≠m。
在一種可能的實現方式中,所述F個虛擬揚聲器滿足如下條件:所述F個虛擬揚聲器中分佈於所述第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α mi大於α m
在一種可能的實現方式中,α mi=q×α m,其中,q為大於1的正整數。
在一種可能的實現方式中,所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R fk滿足如下公式:
其中, 表示所述目標虛擬揚聲器的水準角度, 表示所述目標虛擬揚聲器的俯仰角度, 表示所述目標虛擬揚聲器的HOA係數, 表示所述K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。
第二方面,本申請提供一種虛擬揚聲器集合確定裝置,包括:確定模組,用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;獲取模組,用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F≤K,F×S≥K。
在一種可能的實現方式中,所述確定模組,具體用於獲取所述音訊信號的高階立體混響HOA係數;獲取所述F個虛擬揚聲器對應的F組HOA係數,所述F個虛擬揚聲器與所述F組HOA係數一一對應;將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
在一種可能的實現方式中,所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件:所述S個虛擬揚聲器包括所述目標虛擬揚聲器,以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器,所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
在一種可能的實現方式中,所述K個虛擬揚聲器滿足如下條件:所述K個虛擬揚聲器分佈於預設球面上;所述預設球面包含L個緯度區域,L>1;其中,所述L個緯度區域中第m個緯度區域包含T m個緯線圈,所述K個虛擬揚聲器中分佈於第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α m,1≤m≤L,T m為正整數,1≤m i≤T m;其中,當T m>1時,所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α m
在一種可能的實現方式中,所述L個緯度區域中第n個緯度區域包含T n個緯線圈,所述K個虛擬揚聲器中分佈於第n i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α n,1≤n≤L,T n為正整數,1≤n i≤T n;其中,當Tn>1時,所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α n;其中,α nm或者α n≠α m,n≠m。
在一種可能的實現方式中,所述L個緯度區域中第c個緯度區域包含T c個緯線圈,所述T c個緯線圈的其中之一為赤道緯線圈,所述K個虛擬揚聲器中分佈於第c i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α c,1≤c≤L,T c為正整數,1≤c i≤T c;其中,當T c>1時,所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α c;其中,α c<α m,c≠m。
在一種可能的實現方式中,所述F個虛擬揚聲器滿足如下條件:所述F個虛擬揚聲器中分佈於所述第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α mi大於α m
在一種可能的實現方式中,α mi=q×α m,其中,q為大於1的正整數。
在一種可能的實現方式中,所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R fk滿足如下公式:
其中, 表示所述目標虛擬揚聲器的水準角度, 表示所述目標虛擬揚聲器的俯仰角度, 表示所述目標虛擬揚聲器的HOA係數, 表示所述K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。
第三方面,本申請提供一種音訊處理設備,包括:一個或多個處理器;記憶體,用於存儲一個或多個程式;當所述一個或多個程式被所述一個或多個處理器執行,使得所述一個或多個處理器實現如上述第一方面中任一項所述的方法。
第四方面,本申請提供一種電腦可讀存儲介質,包括電腦程式,所述電腦程式在電腦上被執行時,使得所述電腦執行上述第一方面中任一項所述的方法。
為使本申請的目的、技術方案和優點更加清楚,下面將結合本申請中的附圖,對本申請中的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本申請一部分實施例,而不是全部的實施例。基於本申請中的實施例,本領域普通技術人員在沒有作出創造性勞動前提下所獲取的所有其他實施例,都屬於本申請保護的範圍。
本申請的說明書實施例和權利要求書及附圖中的術語“第一”、“第二”等僅用於區分描述的目的,而不能理解為指示或暗示相對重要性,也不能理解為指示或暗示順序。此外,術語“包括”和“具有”以及他們的任何變形,意圖在於覆蓋不排他的包含,例如,包含了一系列步驟或單元。方法、系統、產品或設備不必限於清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或對於這些過程、方法、產品或設備固有的其它步驟或單元。
應當理解,在本申請中,“至少一個(項)”是指一個或者多個,“多個”是指兩個或兩個以上。“和/或”,用於描述關聯物件的關聯關係,表示可以存在三種關係,例如,“A和/或B”可以表示:只存在A,只存在B以及同時存在A和B三種情況,其中A,B可以是單數或者複數。字元“/”一般表示前後關聯物件是一種“或”的關係。“以下至少一項(個)”或其類似表達,是指這些項中的任意組合,包括單項(個)或複數項(個)的任意組合。例如,a,b或c中的至少一項(個),可以表示:a,b,c,“a和b”,“a和c”,“b和c”,或“a和b和c”,其中a,b,c可以是單個,也可以是多個。字元“~”連接的兩個數值一般表示一個取值範圍,該取值範圍包含“~”連接的兩個數值。
本申請涉及到的相關名詞解釋:
音訊幀:音訊資料是流式的,在實際應用中,為了便於音訊處理和傳輸,通常取一時長內的音訊資料量作為一幀音訊,該時長被稱為“採樣時間”,可以根據轉碼器和具體應用的需求確定其值,例如該時長為2.5ms~60ms,ms為毫秒。
音訊信號:音訊信號是帶有語音、音樂和音效的有規律的聲波的頻率、幅度變化資訊載體。音訊是一種連續變化的類比信號,可用一條連續的曲線來表示,稱為聲波。音訊通過模數轉換或電腦生成的數位信號即為音訊信號。聲波有三個重要參數:頻率、幅度和相位,這也就決定了音訊信號的特徵。
以下是本申請所應用的系統架構。
圖1為本申請音訊播放系統的一個示例性的結構圖,如圖1所示,該音訊播放系統包括:音訊發送設備和音訊接收設備,其中,音訊發送設備包括例如手機、電腦(筆記型電腦、臺式電腦等)、平板(手持平板、車載平板等)等可以進行音訊編碼並發送音訊碼流的設備;音訊接收設備包括例如真無線身歷聲(true wireless stereo,TWS)、普通無線耳機、音響、智慧手錶、智慧眼鏡等可以接收音訊碼流、解碼音訊碼流並播放的設備。
音訊發送設備和音訊接收設備之間可以建立藍牙連接,二者之間可以支援語音和音樂的傳輸。音訊發送設備和音訊接收設備的較為廣泛的示例是手機與TWS耳機、無線頭戴式耳機或者無線頸圈式耳機之間,或者手機與其他終端設備(例如智能音箱、智能手錶、智能眼鏡和車載音箱等)之間。可選的,音訊發送設備和音訊接收設備的示例也可以是平板、筆記型電腦或者臺式電腦與TWS耳機、無線頭戴式耳機、無線頸圈式耳機或其他終端設備(例如智慧音箱、智慧手錶、智慧眼鏡和車載音箱)之間。
需要說明的是,音訊發送設備和音訊接收設備之間除藍牙連接外,還可以通過其他通信方式連接,例如WiFi連接、有線連接或其他無線連接等,本申請對此不做具體限定。
圖2為本申請音訊解碼系統10的一個示例性的結構圖,如圖2所示,音訊解碼系統10可包括源設備12和目的設備14,源設備12可以是圖1的音訊發送設備,目的設備14可以是圖1的音訊接收設備。源設備12產生經編碼的碼流資訊,因此,源設備12也可以被稱為音訊編碼設備。目的設備14可對由源設備12所產生的經編碼的碼流資訊進行解碼,因此,目的設備14也可以被稱為音訊解碼設備。本申請中,源設備12、音訊編碼設備可以被統一稱作音訊發送設備,目的設備14、音訊解碼設備可以被統一稱作音訊接收設備。
源設備12包括編碼器20,可選地,可包括音訊源16、音訊預處理器18、通信介面22。
音訊源16,可以包括或可以為任何類別的音訊擷取裝置,例如,捕獲現實世界聲音,和/或任何類別的音訊生成設備,例如,電腦音訊處理器,或用於獲取和/或提供現實世界音訊、電腦動畫音訊(例如,螢幕內容、虛擬實境(virtual reality,VR)中的音訊)的任何類別設備,和/或其任何組合(例如,增強現實(augmented reality,AR)中的音訊、混合現實(mixed Reality,MR)中的音訊和/或擴展現實(extended Reality,XR)中的音訊)。音訊源16可以為用於捕獲音訊的麥克風或者用於存儲音訊的記憶體,音訊源16還可以包括存儲先前捕獲或產生的音訊和/或獲取或接收音訊的任何類別的(內部或外部)介面。當音訊源16為麥克風時,音訊源16可例如為本地的或集成在源設備中的音訊採集裝置;當音訊源16為記憶體時,音訊源16可為本地的或例如集成在源設備中的集成記憶體。當所述音訊源16包括介面時,介面可例如為從外部音訊源接收音訊的外部介面,外部音訊源例如為外部音訊擷取裝置,比如話筒、麥克風、外部記憶體或外部音訊生成設備,外部音訊生成設備例如為外部電腦音訊處理器、電腦或伺服器。介面可以為根據任何專有或標準化介面協定的任何類別的介面,例如有線或無線介面、光介面。
本申請中,音訊源16獲取當前場景音訊信號,該當前場景音訊信號是指對空間中麥克風所在位置的聲場進行採集得到的音訊信號,當前場景音訊信號也可以稱為原始場景音訊信號。例如,當前場景音訊信號可以是通過高階立體混響(higher order ambisonics,HOA)技術得到的音訊信號。音訊源16獲取待編碼的HOA信號,例如,可以採用實際採集設備獲取HOA信號或採用人工音訊物件合成HOA信號。可選的,待編碼的HOA信號可以是時域HOA信號或者頻域HOA信號。
音訊預處理器18,用於接收原始音訊信號並對原始音訊信號執行預處理,以獲取經預處理的音訊信號。例如,音訊預處理器18執行的預處理可以包括整修或去噪。
編碼器20,用於接收經預處理的音訊信號,對經預處理的音訊信號進行處理,從而提供經編碼的碼流資訊。
源設備12中的通信介面22可用於接收碼流資訊並通過通信通道13向目的設備14發送該碼流。通信通道13例如為直接有線或無線連接,任何類別的網路例如為有線或無線網路或其任何組合,或任何類別的私網和公網,或其任何組合。
目的設備14包括解碼器30,可選地,可包括通信介面28、音訊後處理器32和播放設備34。
目的設備14中的通信介面28用於直接從源設備12接收碼流資訊,並將碼流資訊提供給解碼器30。通信介面22和通信介面28可用於通過源設備12與目的設備14之間的通信通道13發送或接收碼流資訊。
通信介面22和通信介面28均可配置為如圖2中從源設備12指向目的設備14的對應通信通道13的箭頭所指示的單向通信介面,或雙向通信介面,並且可用於發送和接收消息等,以建立連接,確認並交換與通信鏈路和/或編碼音訊資料等資料傳輸相關的任何其它資訊,等等。
解碼器30,用於接收碼流資訊,並解碼碼流資訊得到經解碼的音訊資料。
音訊後處理器32,用於對解碼的音訊資料進行後處理,得到後處理後的音訊資料。音訊後處理器32執行的後處理可以包括例如修剪或重採樣等。
播放設備34,用於接收後處理後的音訊資料,以向使用者或收聽者播放音訊。播放設備34可以為或包括任意類型的用於播放重建後音訊的播放機,例如,集成或外部揚聲器。例如,揚聲器可包括喇叭、音響等。
圖3為本申請HOA編碼裝置的一個示例性的結構圖,如圖3所示,HOA編碼裝置可以應用於上述音訊解碼系統10的編碼器20中。HOA編碼裝置包括:虛擬揚聲器配置單元、編碼分析單元、虛擬揚聲器集合生成單元、虛擬揚聲器選擇單元、虛擬揚聲器信號生成單元和核心編碼器處理單元。其中,
虛擬揚聲器配置單元,用於根據編碼器配置資訊對虛擬揚聲器進行配置,以得到虛擬揚聲器配置參數。編碼器配置資訊包括且不限於:HOA階數,編碼位元速率,使用者自訂資訊等,虛擬揚聲器配置參數包括且不限於:虛擬揚聲器的個數,虛擬揚聲器的HOA階數等。
虛擬揚聲器配置單元輸出的虛擬揚聲器配置參數作為虛擬揚聲器集合生成單元的輸入。
編碼分析單元,用於對待編碼HOA信號進行編碼分析,例如分析待編碼HOA信號的聲場分佈,包括待編碼HOA信號的聲源個數、方向性、彌散度等特徵,作為決定如何選擇目標虛擬揚聲器的判斷條件之一。
不限定的是,本申請中,HOA編碼裝置中也可以不包括編碼分析單元,即HOA編碼裝置可以不對輸入信號進行分析,則採用一種預設配置決定如何選擇目標虛擬揚聲器。
其中,HOA編碼裝置獲取待編碼HOA信號,例如可以將從實際採集設備記錄的HOA信號或採用人工音訊物件合成的HOA信號作為編碼器的輸入,同時編碼器輸入的待編碼HOA信號可以是時域HOA信號也可以是頻域HOA信號。
虛擬揚聲器集合生成單元,用於生成虛擬揚聲器集合,該虛擬揚聲器集合中可以包括:多個虛擬揚聲器,虛擬揚聲器集合中的虛擬揚聲器也可以稱為“候選虛擬揚聲器”。
虛擬揚聲器集合生成單元生成指定的候選虛擬揚聲器HOA係數。由虛擬揚聲器配置單元提供的候選虛擬揚聲器的座標(即位置資訊)和候選虛擬揚聲器的HOA階數用於生成候選虛擬揚聲器HOA係數。候選虛擬揚聲器的座標確定方法包括且不限於按等距規則產生K個虛擬揚聲器、根據聽覺感知原理生成非均勻分佈的K個候選虛擬揚聲器。根據候選虛擬揚聲器的個數生成分佈均勻的候選虛擬揚聲器的座標。
接下來生成虛擬揚聲器的HOA係數:
聲波在理想介質中傳播,其波速為k=w/c,角頻率w=2πf,f表示聲波頻率,c表示聲速。因此聲壓p滿足如下公式(1): ▽ 2p+k 2p=0      (1)
其中,▽ 2為拉普拉斯運算元。
在球座標下求解公式(1),聲壓p可以得到如下公式(2): (2)
其中,r表示球半徑,θ表示水準角度(azimuth)(水準角度也可以稱作方位角),φ表示俯仰角度(elevation),k表示波速,s表示理想平面波的幅度,m表示HOA階數序號, 表示球貝塞爾函數,亦稱作徑向基函數,第一個j是虛數單位, 不隨角度變化, 是θ和φ對應的球諧函數, 是聲源方向的球諧函數。
立體混響(Ambisonics)係數為: (3)
因此可以得到聲壓p的一般展開形式(4): (4)
上述公式(3)可以表明聲場可以在球面上按球諧函數展開,其通過Ambisonics係數進行表示。
相應的,已知Ambisonics係數則可以重建聲場,將公式(3)截斷到第N項,以Ambisonics係數作為對聲場的近似描述,則稱為N階的HOA係數,該HOA係數亦稱作Ambisonics係數。N階Ambisonics係數共有(N+1) 2個通道。可選的,HOA階數可以為2階~10階,將球諧函數按照HOA信號的一個採樣點對應的係數進行疊加,就能實現該採樣點對應的時刻空間聲場的重構。根據該原理可以生成虛擬揚聲器的HOA係數。將公式(3)中的 分別設置為虛擬揚聲器的位置資訊,即水準角度和俯仰角度,根據式(3)可以獲得該虛擬揚聲器的HOA係數,也稱作Ambisonics係數。例如,針對3階HOA信號,假設s=1,其對應的16通道的HOA係數可通過球諧函數 得到,3階HOA信號對應的16通道的HOA係數計算公式具體如表1所示:
表1
l m 極座標中的運算式
0 0
1 0
+1
-1
2 0
+1
-1
+2
-2
3 0
+1
-1
+2
-2
+3
-3
表1中θ表示虛擬揚聲器在預設球面上的位置資訊的水準角度,φ表示虛擬揚聲器在預設球面上的位置資訊的俯仰角度,l表示HOA階數,l=0,1,…,N,m表示每一階中的方向參數,m=-l,…,l。按照表1中的極座標的運算式,可以根據虛擬揚聲器的位置資訊,獲得該虛擬揚聲器的3階HOA信號對應的16個通道的HOA係數。
虛擬揚聲器集合生成單元輸出的候選虛擬揚聲器的HOA係數作為虛擬揚聲器選擇單元的輸入。
虛擬揚聲器選擇單元,用於根據待編碼HOA信號從虛擬揚聲器集合中的多個候選虛擬揚聲器中選擇出目標虛擬揚聲器,該目標虛擬揚聲器可以稱為“與待編碼HOA信號匹配的虛擬揚聲器”,或者簡稱為匹配虛擬揚聲器。
虛擬揚聲器選擇單元根據待編碼HOA信號與虛擬揚聲器集合生成單元輸出的候選虛擬揚聲器HOA係數,選擇出指定的匹配虛擬揚聲器。
接下來對匹配虛擬揚聲器的選擇方法進行舉例說明:在一種可能的實現方式中,使用候選虛擬揚聲器HOA係數匹配與待編碼HOA信號做內積,選取內積絕對值最大的候選虛擬揚聲器為目標虛擬揚聲器,即匹配虛擬揚聲器,並將待編碼HOA信號在該候選虛擬揚聲器的投影疊加到該候選虛擬揚聲器HOA係數的線性組合上,然後將投影向量從待編碼HOA信號中減去得到差值,對差值重複上述過程實現反覆運算計算,每反覆運算一次產生一個匹配虛擬揚聲器,輸出匹配虛擬揚聲器座標和匹配虛擬揚聲器HOA係數。可以理解的是,匹配虛擬揚聲器會選取多個,每反覆運算一次產生一個匹配虛擬揚聲器。(除此之外,不限定其他實現方法)
虛擬揚聲器選擇單元輸出的目標虛擬揚聲器的座標和目標虛擬揚聲器的HOA係數作為虛擬揚聲器信號生成單元的輸入。
虛擬揚聲器信號生成單元,用於根據待編碼HOA信號和目標虛擬揚聲器的屬性資訊生成虛擬揚聲器信號,其中當屬性資訊為位置資訊時,根據所述目標虛擬揚聲器的位置資訊確定所述目標虛擬揚聲器的HOA係數,當屬性資訊包括HOA係數時,從所述屬性資訊中獲取所述目標虛擬揚聲器的HOA係數。
虛擬揚聲器信號生成單元通過待編碼HOA信號和目標虛擬揚聲器的HOA係數計算虛擬揚聲器信號。
虛擬揚聲器的HOA係數用矩陣A表示,用矩陣A可以線性組合出待編碼HOA信號,進一步的可以採用最小二乘方法求得理論的最優解w,即為虛擬揚聲器信號,例如可以採用如下計算公式:
其中, 代表矩陣A的逆矩陣,矩陣A的大小為(M×C),C為目標虛擬揚聲器個數,M為 階的HOA係數的通道個數,M=(N+1) 2,a表示目標虛擬揚聲器的HOA係數,例如,
X代表待編碼HOA信號,矩陣X的大小為(M×L),M為 階的HOA係數的通道個數,L為時域或頻域樣點個數,x表示待編碼HOA信號的係數,例如,
虛擬揚聲器信號生成單元輸出的虛擬揚聲器信號作為核心編碼器處理單元的輸入。
核心編碼器處理單元,用於對虛擬揚聲器信號進行核心編碼器處理,得到傳輸碼流。
核心編碼器處理包括且不限於變換、量化、心理聲學模型、碼流產生等,可以對頻域傳輸通道進行處理也可以對時域傳輸通道進行處理,此處不做限定。
基於上述實施例的描述,本申請提供了一種虛擬揚聲器集合確定方法。該虛擬揚聲器集合確定方法基於以下預先設定:
一.虛擬揚聲器分佈表
虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,該位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數。設定K個虛擬揚聲器分佈於預設球面上。該預設球面可以包括X個緯線圈,Y個經線圈,X和Y可以相同也可以不同,X和Y均為正整數,例如X為512,768或1024等等,Y為512,768或1024等等。虛擬揚聲器位於所述X個緯線圈和所述Y個經線圈的交匯點上。其中X和Y的取值越大,虛擬揚聲器的候選選擇位置越多,最終選擇的虛擬揚聲器構成的聲場的重播效果就越好。
圖4a為本申請預設球面的一個示例性的示意圖,如圖4a所示,預設球面包含L(L>1)個緯度區域,第m個緯度區域包含T m個緯線圈,K個虛擬揚聲器中分佈於第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm,1≤m≤L,T m為正整數,1≤m i≤T m。當T m>1時,第m個緯度區域中的任意兩個相鄰緯線圈的俯仰角度差為α m。圖4b為本申請俯仰角度和水準角度的一個示例性的示意圖,如圖4b所示,虛擬揚聲器的位置和球心之間的連線與預設水平面(例如赤道圈所在平面,或者南極點所在的平面,或者北極點所在的平面,其中,南極點所在的平面垂直於南極點和北極點之間的連線,北極點所在的平面垂直於南極點和北極點之間的連線)之間的夾角為虛擬揚聲器的俯仰角度;虛擬揚聲器的位置和球心之間的連線在水平面上的投影與設定初始方向的夾角為虛擬揚聲器的水準角度。
應當理解的是,K個虛擬揚聲器分佈於各個緯度區域中的一個或多個緯線圈上,位於同一個緯線圈上的相鄰虛擬揚聲器之間的距離通過水準角度差表示,且同一個緯線圈上的所有相鄰虛擬揚聲器之間的水準角度差相等。例如,上述第m i個緯線圈上,任意兩個相鄰虛擬揚聲器之間的水準角度差均為α m。而位於同一個緯度區域內的虛擬揚聲器,若該緯度區域包含多個緯線圈,則無論在該緯度區域中的哪一個緯線圈上,相鄰虛擬揚聲器之間的水準角度差全都相等。例如,第m個緯度區域中,第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差和第m i+1個緯線圈上的相鄰虛擬揚聲器之間的水準角度差均為α m。另外,若某一個緯度區域包含多個緯線圈,則該緯度區域中的緯線圈之間的距離通過俯仰角度差表示,且任意兩個相鄰緯線圈之間的俯仰角度差和該緯度區域中的相鄰虛擬揚聲器之間的水準角度差相等。
在一種可能的實現方式中,α nm或者α n≠α m,α n為K個虛擬揚聲器中分佈於第n個緯度區域中的任意一個緯線圈上的相鄰虛擬揚聲器之間的水準角度差,n≠m。
即,位於不同緯度區域的虛擬揚聲器,相鄰虛擬揚聲器之間的水準角度差可以是相等的,α nm,也可以是不相等的,α n≠α m。應當理解的是,本申請並不限定L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差全部相等,也不限定L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差全部不相等,甚至L個緯度區域中可以有部分緯度區域內的相鄰虛擬揚聲器之間的水準角度差相等,而和另一部分緯度區域內的相鄰虛擬揚聲器之間的水準角度差不相等。
在一種可能的實現方式中,α c<α m,α c為K個虛擬揚聲器中分佈於第m c個緯線圈上的相鄰虛擬揚聲器之間的水準角度差,第m c個緯線圈是L個緯度區域中包含赤道緯線圈的緯度區域中的任意一個緯線圈。
即,L個緯度區域中,包含了赤道緯線圈的緯度區域內的相鄰虛擬揚聲器之間的水準角度差是最小的,亦即,L個緯度區域中,包含了赤道緯線圈的緯度區域內的虛擬揚聲器是分佈最密集的。
可選的,可以通過索引的方式表示虛擬揚聲器分佈表中的K個虛擬揚聲器的位置,索引可以包括俯仰角索引和水平角索引。例如,在任意一個緯線圈上,將分佈其上的其中一個虛擬揚聲器的水準角度設置為0,然後根據預設的水準角度與水平角索引之間的轉換公式轉換獲得對應的水平角索引;由於緯線圈上的任意相鄰虛擬揚聲器之間的水平角差值是相等的,因此可以獲得該緯線圈上的其他虛擬揚聲器的水準角度,從而根據上述轉換公式獲得所述其他虛擬揚聲器各自的水平角索引。需要說明的是,本申請對將緯線圈上的哪個虛擬揚聲器的水準角度設置為0不作具體限定。同理,由於在經線圈方向相鄰虛擬揚聲器之間的俯仰角差值滿足前述的要求,因此在設置了俯仰角度為0的虛擬揚聲器後,就可以獲得其他虛擬揚聲器的俯仰角度,基於預設的俯仰角度和俯仰角索引之間的轉換公式就可以獲得經線圈上所有虛擬揚聲器的俯仰角索引。需要說明的是,本申請對將經線圈上哪個虛擬揚聲器的俯仰角度設置為0不作具體限定,例如可以是位於所述赤道圈上的虛擬揚聲器,或者所述位於所述南極點上的虛擬揚聲器,或者位於所述北極點上的虛擬揚聲器。
可選的,上述K個虛擬揚聲器中的第k個虛擬揚聲器,其俯仰角度φ k和俯仰角索引φ k’滿足如下公式(即俯仰角度和俯仰角索引的轉換公式):
其中,r k表示第k個虛擬揚聲器所在經線圈的半徑,round()表示取整。
上述K個虛擬揚聲器中的第k個虛擬揚聲器,其水準角度θ k和水平角索引θ k’滿足如下公式(即水準角度和水平角索引的轉換公式):
其中,r k表示第k個虛擬揚聲器所在緯線圈的半徑,round()表示取整。
圖5a和圖5b為K個虛擬揚聲器的示例性的分佈圖。如圖5a所示,包含了赤道緯線圈的緯度區域內的相鄰虛擬揚聲器之間的水準角度差小於其他緯度區域內的相鄰虛擬揚聲器之間的水準角度差,α c<α m。如圖5b所示,K個虛擬揚聲器在預設球面上隨機近似均勻分佈。
表1示出了圖5a和圖5b所示的分佈圖的比較,假設K=1669,可以看出圖5a的分佈方法獲得的HOA重建信號的信噪比(SNR)的平均值高於圖5b的分佈方法獲得的HOA重建信號的信噪比。
表1
檔案名 圖5b的分佈方法 SNR(dB)   圖5a的分佈方法 SNR(dB)
1 12.75   10.86
2 8.83   12.86
3 13.16   24.85
4 18.66   11.97
5 12.18   15.04
6 10.85   13.41
7 6.28   6.31
8 10.49   11.15
9 12.97   16.16
10 6.93   6.94
11 8.17   8.66
12 8.11   8.59
平均值 10.78   12.23
如表1所示,本實施例採用了12個不同類型的測試音訊,檔案名從1到12分別為單聲源語音信號、單聲源樂器信號、兩聲源語音信號、兩聲源樂器信號、三聲源語音樂器混合信號、四聲源語音樂器混合信號、兩聲源雜訊信號1、兩聲源雜訊信號2、兩聲源雜訊信號3、兩聲源雜訊信號4、兩聲源混響信號1、兩聲源混響信號2。
圖6a和圖6b為K個虛擬揚聲器的示例性的分佈圖。如圖6a所示,L個緯度區域內的相鄰虛擬揚聲器之間的水準角度差均相等,α nm。如圖6b所示,K個虛擬揚聲器在預設球面上隨機近似均勻分佈。
表2示出了圖6a和圖6b所示的分佈圖的比較,假設K=1669,可以看出圖6a的分佈方法獲得的HOA重建信號的信噪比(SNR)的平均值高於圖6b的分佈方法獲得的HOA重建信號的信噪比。
表2
檔案名 圖6b的分佈方法 SNR(dB) 圖6a的分佈方法 SNR(dB)
1 12.75 10.45
2 8.83 9.95
3 13.16 22.67
4 18.66 15.36
5 12.18 15.00
6 10.85 12.53
7 6.28 6.33
8 10.49 11.17
9 12.97 16.10
10 6.93 6.99
11 8.17 8.67
12 8.11 8.41
平均值 10.78 11.97
如表2所示,本實施例採用了12個不同類型的測試音訊,檔案名從1到12分別為單聲源語音信號、單聲源樂器信號、兩聲源語音信號、兩聲源樂器信號、三聲源語音樂器混合信號、四聲源語音樂器混合信號、兩聲源雜訊信號1、兩聲源雜訊信號2、兩聲源雜訊信號3、兩聲源雜訊信號4、兩聲源混響信號1、兩聲源混響信號2。
示例性的,表3是虛擬揚聲器分佈表的一個示例,該示例中K為530,即表3描述了序號從0~529的530個虛擬揚聲器的具體分佈,位置表示對應序號虛擬揚聲器的水平角索引和俯仰角索引,表格中位置列中“,”前的數位是水平角索引,“,”後的數位是俯仰角索引。
表3 虛擬揚聲器分佈表
序號 位置 序號 位置 序號 位置 序號 位置 序號 位置
0 5, 768 106 444, 987 212 453, 5 318 208, 34 424 19, 68
1 5, 805 107 478, 987 213 470, 5 319 226, 34 425 37, 68
2 146, 805 108 512, 987 214 487, 5 320 243, 34 426 56, 68
3 293, 805 109 546, 987 215 504, 5 321 260, 34 427 74, 68
4 439, 805 110 580, 987 216 520, 5 322 278, 34 428 93, 68
5 585, 805 111 614, 987 217 537, 5 323 295, 34 429 112, 68
6 731, 805 112 649, 987 218 554, 5 324 312, 34 430 130, 68
7 878, 805 113 683, 987 219 571, 5 325 330, 34 431 149, 68
8 5, 841 114 717, 987 220 588, 5 326 347, 34 432 168, 68
9 73, 841 115 751, 987 221 604, 5 327 364, 34 433 186, 68
10 146, 841 116 785, 987 222 621, 5 328 382, 34 434 205, 68
11 219, 841 117 819, 987 223 638, 5 329 399, 34 435 223, 68
12 293, 841 118 853, 987 224 655, 5 330 417, 34 436 242, 68
13 366, 841 119 887, 987 225 671, 5 331 434, 34 437 261, 68
14 439, 841 120 922, 987 226 688, 5 332 451, 34 438 279, 68
15 512, 841 121 956, 987 227 705, 5 333 469, 34 439 298, 68
16 585, 841 122 990, 987 228 722, 5 334 486, 34 440 317, 68
17 658, 841 123 5, 256 229 739, 5 335 503, 34 441 335, 68
18 731, 841 124 5, 222 230 755, 5 336 521, 34 442 354, 68
19 805, 841 125 146, 222 231 772, 5 337 538, 34 443 372, 68
20 878, 841 126 293, 222 232 789, 5 338 555, 34 444 391, 68
21 951, 841 127 439, 222 233 806, 5 339 573, 34 445 410, 68
22 5, 878 128 585, 222 234 823, 5 340 590, 34 446 428, 68
23 54, 878 129 731, 222 235 839, 5 341 607, 34 447 447, 68
24 108, 878 130 878, 222 236 856, 5 342 625, 34 448 465, 68
25 162, 878 131 5, 188 237 873, 5 343 642, 34 449 484, 68
26 216, 878 132 79, 188 238 890, 5 344 660, 34 450 503, 68
27 269, 878 133 158, 188 239 906, 5 345 677, 34 451 521, 68
28 323, 878 134 236, 188 240 923, 5 346 694, 34 452 540, 68
29 377, 878 135 315, 188 241 940, 5 347 712, 34 453 559, 68
30 431, 878 136 394, 188 242 957, 5 348 729, 34 454 577, 68
31 485, 878 137 473, 188 243 974, 5 349 746, 34 455 596, 68
32 539, 878 138 551, 188 244 990, 5 350 764, 34 456 614, 68
33 593, 878 139 630, 188 245 1007, 5 351 781, 34 457 633, 68
34 647, 878 140 709, 188 246 5, 17 352 798, 34 458 652, 68
35 701, 878 141 788, 188 247 17, 17 353 816, 34 459 670, 68
36 755, 878 142 866, 188 248 34, 17 354 833, 34 460 689, 68
37 808, 878 143 945, 188 249 51, 17 355 850, 34 461 707, 68
38 862, 878 144 5, 154 250 68, 17 356 868, 34 462 726, 68
39 916, 878 145 57, 154 251 85, 17 357 885, 34 463 745, 68
40 970, 878 146 114, 154 252 102, 17 358 903, 34 464 763, 68
41 5, 914 147 171, 154 253 119, 17 359 920, 34 465 782, 68
42 43, 914 148 228, 154 254 137, 17 360 937, 34 466 801, 68
43 85, 914 149 284, 154 255 154, 17 361 955, 34 467 819, 68
44 128, 914 150 341, 154 256 171, 17 362 972, 34 468 838, 68
45 171, 914 151 398, 154 257 188, 17 363 989, 34 469 856, 68
46 213, 914 152 455, 154 258 205, 17 364 1007, 34 470 875, 68
47 256, 914 153 512, 154 259 222, 17 365 5, 51 471 894, 68
48 299, 914 154 569, 154 260 239, 17 366 18, 51 472 912, 68
49 341, 914 155 626, 154 261 256, 17 367 35, 51 473 931, 68
50 384, 914 156 683, 154 262 273, 17 368 53, 51 474 950, 68
51 427, 914 157 740, 154 263 290, 17 369 71, 51 475 968, 68
52 469, 914 158 796, 154 264 307, 17 370 88, 51 476 987, 68
53 512, 914 159 853, 154 265 324, 17 371 106, 51 477 1005, 68
54 555, 914 160 910, 154 266 341, 17 372 124, 51 478 5, 85
55 597, 914 161 967, 154 267 358, 17 373 141, 51 479 20, 85
56 640, 914 162 5, 119 268 375, 17 374 159, 51 480 39, 85
57 683, 914 163 45, 119 269 393, 17 375 177, 51 481 59, 85
58 725, 914 164 89, 119 270 410, 17 376 194, 51 482 79, 85
59 768, 914 165 134, 119 271 427, 17 377 212, 51 483 98, 85
60 811, 914 166 178, 119 272 444, 17 378 230, 51 484 118, 85
61 853, 914 167 223, 119 273 461, 17 379 247, 51 485 138, 85
62 896, 914 168 267, 119 274 478, 17 380 265, 51 486 158, 85
63 939, 914 169 312, 119 275 495, 17 381 282, 51 487 177, 85
64 981, 914 170 356, 119 276 512, 17 382 300, 51 488 197, 85
65 5, 951 171 401, 119 277 529, 17 383 318, 51 489 217, 85
66 37, 951 172 445, 119 278 546, 17 384 335, 51 490 236, 85
67 73, 951 173 490, 119 279 563, 17 385 353, 51 491 256, 85
68 110, 951 174 534, 119 280 580, 17 386 371, 51 492 276, 85
69 146, 951 175 579, 119 281 597, 17 387 388, 51 493 295, 85
70 183, 951 176 623, 119 282 614, 17 388 406, 51 494 315, 85
71 219, 951 177 668, 119 283 631, 17 389 424, 51 495 335, 85
72 256, 951 178 712, 119 284 649, 17 390 441, 51 496 354, 85
73 293, 951 179 757, 119 285 666, 17 391 459, 51 497 374, 85
74 329, 951 180 801, 119 286 683, 17 392 477, 51 498 394, 85
75 366, 951 181 846, 119 287 700, 17 393 494, 51 499 414, 85
76 402, 951 182 890, 119 288 717, 17 394 512, 51 500 433, 85
77 439, 951 183 935, 119 289 734, 17 395 530, 51 501 453, 85
78 475, 951 184 979, 119 290 751, 17 396 547, 51 502 473, 85
79 512, 951 185 5, 5 291 768, 17 397 565, 51 503 492, 85
80 549, 951 186 17, 5 292 785, 17 398 583, 51 504 512, 85
81 585, 951 187 34, 5 293 802, 17 399 600, 51 505 532, 85
82 622, 951 188 50, 5 294 819, 17 400 618, 51 506 551, 85
83 658, 951 189 67, 5 295 836, 17 401 636, 51 507 571, 85
84 695, 951 190 84, 5 296 853, 17 402 653, 51 508 591, 85
85 731, 951 191 101, 5 297 870, 17 403 671, 51 509 610, 85
86 768, 951 192 118, 5 298 887, 17 404 689, 51 510 630, 85
87 805, 951 193 134, 5 299 905, 17 405 706, 51 511 650, 85
88 841, 951 194 151, 5 300 922, 17 406 724, 51 512 670, 85
89 878, 951 195 168, 5 301 939, 17 407 742, 51 513 689, 85
90 914, 951 196 185, 5 302 956, 17 408 759, 51 514 709, 85
91 951, 951 197 201, 5 303 973, 17 409 777, 51 515 729, 85
92 987, 951 198 218, 5 304 990, 17 410 794, 51 516 748, 85
93 5, 987 199 235, 5 305 1007, 17 411 812, 51 517 768, 85
94 34, 987 200 252, 5 306 5, 34 412 830, 51 518 788, 85
95 68, 987 201 269, 5 307 17, 34 413 847, 51 519 807, 85
96 102, 987 202 285, 5 308 35, 34 414 865, 51 520 827, 85
97 137, 987 203 302, 5 309 52, 34 415 883, 51 521 847, 85
98 171, 987 204 319, 5 310 69, 34 416 900, 51 522 866, 85
99 205, 987 205 336, 5 311 87, 34 417 918, 51 523 886, 85
100 239, 987 206 353, 5 312 104, 34 418 936, 51 524 906, 85
101 273, 987 207 369, 5 313 121, 34 419 953, 51 525 926, 85
102 307, 987 208 386, 5 314 139, 34 420 971, 51 526 945, 85
103 341, 987 209 403, 5 315 156, 34 421 989, 51 527 965, 85
104 375, 987 210 420, 5 316 174, 34 422 1006, 51 528 985, 85
105 410, 987 211 436, 5 317 191, 34 423 5, 68 529 1004, 85
需要說明的是,表3中虛擬揚聲器所分佈的球面包括了1024個經線圈以及1024個緯線圈(南極點和北極點也分別對應一個緯線圈),所述1024個經線圈和1024個緯線圈對應了1024×1022+2=1046530個交匯點,所述1046530個交匯點分別有各自的俯仰角和水平角,相應地,所述1046530個交匯點分別有各自的俯仰角索引和水平角索引;表3中的530個虛擬揚聲器的位置是所述1046530個交匯點中的530個。其中,表3中俯仰角索引是基於赤道的俯仰角度為0進行計算獲得的,即除赤道外,其餘俯仰角索引所對應的俯仰角度均是相對於赤道所在平面的俯仰角度。
二、預設的F個虛擬揚聲器
F個虛擬揚聲器滿足條件:F個虛擬揚聲器中分佈於第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α mi大於α m,第m i個緯線圈是第m個緯度區域內的其中一個緯線圈。
為方便描述,將K個虛擬揚聲器中的虛擬揚聲器稱作候選虛擬揚聲器,將F個虛擬揚聲器中的任意一個虛擬揚聲器稱作中心虛擬揚聲器(亦可以稱作第一輪虛擬揚聲器)。即,針對預設球面上的任意一個緯線圈,可以從分佈在該緯線圈上的多個候選虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器,加入F個虛擬揚聲器中。若是選取多個虛擬揚聲器,則相鄰中心虛擬揚聲器之間的水準角度差α mi大於相鄰候選虛擬揚聲器之間的水準角度差α m,可以表示為α mi>α m。亦即,針對某一個緯線圈,分佈有多個候選虛擬揚聲器,中心虛擬揚聲器選自該多個候選虛擬揚聲器,且密度更小。例如,緯線圈上的相鄰候選虛擬揚聲器之間的水準角度差α m=5°,相鄰中心虛擬揚聲器之間的水準角度差α mi=8°。
在一種可能的實現方式中,α mi=q×α m,其中,q為大於1的正整數。可見,相鄰中心虛擬揚聲器之間的水準角度差和相鄰候選虛擬揚聲器之間的水準角度差成倍數關係。例如,緯線圈上的相鄰候選虛擬揚聲器之間的水準角度差α m=5°,相鄰中心虛擬揚聲器之間的水準角度差α mi=10°。
三、F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器
為方便描述,將S個虛擬揚聲器中的虛擬揚聲器稱作目標虛擬揚聲器。即,任意一個中心虛擬揚聲器對應的S個虛擬揚聲器滿足條件:該S個虛擬揚聲器包括前述任意一個中心虛擬揚聲器,以及位於該任意一個中心虛擬揚聲器周圍的S-1個虛擬揚聲器,該S-1個虛擬揚聲器與前述任意一個中心虛擬揚聲器的S-1個相關性中的任意一個相關性大於K個虛擬揚聲器中除S個虛擬揚聲器外的其它K-S個虛擬揚聲器與前述任意一個中心虛擬揚聲器的K-S個相關性中的所有相關性。
亦即,該S個虛擬揚聲器對應的S個R fk是K個虛擬揚聲器對應的K個R fk中最大的S個。最大的S個表示K個R fk從大到小排序,排在最前面的S個R fk即為最大的S個。
R fk表示上述任意一個中心虛擬揚聲器和K個虛擬揚聲器中的第k個虛擬揚聲器的相關性,R fk滿足如下公式:
其中, 表示上述任意一個虛擬揚聲器的水準角度, 表示上述任意一個虛擬揚聲器的俯仰角度, 表示上述任意一個虛擬揚聲器的HOA係數, 表示K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。
通過上述方法即可給每個中心虛擬揚聲器確定出S個目標虛擬揚聲器。應當理解的是,本申請預先設定的是,來自K個虛擬揚聲器的F個虛擬揚聲器,因此每個中心虛擬揚聲器的位置也可以用俯仰角索引和水平角索引表示;每個中心虛擬揚聲器對應S個虛擬揚聲器,該S個虛擬揚聲器也來源於K個虛擬揚聲器,因此每個目標虛擬揚聲器的位置也可以用俯仰角索引和水平角索引表示。
圖7是本申請虛擬揚聲器集合確定方法的一個示例性的流程圖。該過程700可由上述實施例中的編碼器20或解碼器30執行,即由音訊發送設備中的編碼器20實現音訊編碼,然後將碼流資訊發送給音訊接收設備,由音訊接收設備中的解碼器30對碼流資訊進行解碼以獲得目標音訊幀,進而基於該目標音訊幀渲染得到對應於一個或多個虛擬揚聲器的聲場音訊信號。過程700描述為一系列的步驟或操作,應當理解的是,過程700可以以各種循序執行和/或同時發生,不限於圖7所示的執行順序。如圖7所示,該方法包括:
步驟701、根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器。
如上所述,對待處理的音訊信號進行編碼分析,例如分析待處理的音訊信號的聲場分佈,包括音訊信號的聲源個數、方向性、彌散度等特徵,得到該音訊信號的HOA係數,作為決定如何選擇目標虛擬揚聲器的判斷條件之一。根據待處理的音訊信號的HOA係數和候選的虛擬揚聲器(即上述F個虛擬揚聲器)的HOA係數,可以選擇出與待處理的音訊信號匹配的虛擬揚聲器,本申請中將該虛擬揚聲器稱作目標虛擬揚聲器。
在一種可能的實現方式中,可以先獲取音訊信號的HOA係數,再獲取F個虛擬揚聲器對應的F組HOA係數,F個虛擬揚聲器與F組HOA係數是一一對應的,然後將F組HOA係數中與音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為目標虛擬揚聲器。
本申請可以將F個虛擬揚聲器各自的HOA係數分別與音訊信號的HOA係數做內積,選取內積絕對值最大的虛擬揚聲器為目標虛擬揚聲器。即,F組HOA係數中每一組包含(N+1) 2個係數,音訊信號的HOA係數包含(N+1) 2個係數,N表示音訊信號的階數,因此音訊信號的HOA係數與F組HOA係數中的每一組一一對應,基於此對應關係,將音訊信號的HOA係數分別與F組HOA係數中每一組做內積,得到音訊信號的HOA係數分別與F組HOA係數中每一組之間的相關性。需要說明的是,還可以採用其他方法確定目標虛擬揚聲器,本申請對此不做具體限定。
步驟702、從預設的虛擬揚聲器分佈表中獲取與目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,該位置資訊包括俯仰角索引和水平角索引。
基於上述本申請的預先設定,一旦確定了目標虛擬揚聲器(亦即中心虛擬揚聲器),該目標虛擬揚聲器對應的S個虛擬揚聲器就可以獲取到。而基於最早設定的虛擬揚聲器分佈表,就可以得到該S個虛擬揚聲器的位置資訊。與K個虛擬揚聲器採用同樣的表示方法,S個虛擬揚聲器的位置資訊用俯仰角索引和水平角索引表示。
由此可見,在確定目標虛擬揚聲器時,該目標虛擬揚聲器是與待處理的音訊信號HOA係數相關性最高的中心虛擬揚聲器。而每個中心虛擬揚聲器對應的S個虛擬揚聲器是與該中心虛擬揚聲器HOA係數相關性最高的S個虛擬揚聲器,而因此與目標虛擬揚聲器對應的S個虛擬揚聲器也是與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器。
本申請通過預先設定虛擬揚聲器分佈表,使得按照該分佈表部署虛擬揚聲器可以獲得較高的HOA重建信號的信噪比(SNR)平均值,進而在基於這種分佈的情況下選取與待處理的音訊信號HOA係數相關性最高的S個虛擬揚聲器,可以達到最優的採樣效果,進而提升音訊信號的重播效果。
圖8為本申請虛擬揚聲器集合確定裝置的一個示例性的結構圖,如圖8所示,該裝置可以應用於上述實施例中的編碼器20或解碼器30。本實施例的虛擬揚聲器集合確定裝置可以包括:確定模組801和獲取模組802,其中,確定模組801,用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;獲取模組802,用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F≤K,F×S≥K。
在一種可能的實現方式中,所述確定模組801,具體用於獲取所述音訊信號的高階立體混響HOA係數;獲取所述F個虛擬揚聲器對應的F組HOA係數,所述F個虛擬揚聲器與所述F組HOA係數一一對應;將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
在一種可能的實現方式中,所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件:所述S個虛擬揚聲器包括所述目標虛擬揚聲器,以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器,所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
在一種可能的實現方式中,所述K個虛擬揚聲器滿足如下條件:所述K個虛擬揚聲器分佈於預設球面上;所述預設球面包含L個緯度區域,L>1;其中,所述L個緯度區域中第m個緯度區域包含T m個緯線圈,所述K個虛擬揚聲器中分佈於第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm,1≤m≤L,T m為正整數,1≤m i≤T m;其中,當T m>1時,所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α m
在一種可能的實現方式中,所述L個緯度區域中第n個緯度區域包含T n個緯線圈,所述K個虛擬揚聲器中分佈於第n i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αn,1≤n≤L,T n為正整數,1≤n i≤T n;其中,當T n>1時,所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α n;其中,v=α m或者α n≠α m,n≠m。
在一種可能的實現方式中,所述L個緯度區域中第c個緯度區域包含T c個緯線圈,所述T c個緯線圈的其中之一為赤道緯線圈,所述K個虛擬揚聲器中分佈於第c i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為α c,1≤c≤L,T c為正整數,1≤c i≤T c;其中,當T c>1時,所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為α c;其中,α c<α m,c≠m。
在一種可能的實現方式中,所述F個虛擬揚聲器滿足如下條件:所述F個虛擬揚聲器中分佈於所述第m i個緯線圈上的相鄰虛擬揚聲器之間的水準角度差α mi大於α m
在一種可能的實現方式中,α mi=q×α m,其中,q為大於1的正整數。
在一種可能的實現方式中,所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性R fk滿足如下公式:
其中, 表示所述目標虛擬揚聲器的水準角度, 表示所述目標虛擬揚聲器的俯仰角度, 表示所述目標虛擬揚聲器的HOA係數, 表示所述K個虛擬揚聲器中的第k個虛擬揚聲器的HOA係數。
本實施例的裝置,可以用於執行圖7所示方法實施例的技術方案,其實現原理和技術效果類似,此處不再贅述。
在實現過程中,上述方法實施例的各步驟可以通過處理器中的硬體的集成邏輯電路或者軟體形式的指令完成。處理器可以是通用處理器、數位訊號處理器(digital signal processor, DSP)、特定應用積體電路(application-specific integrated circuit,ASIC)、現場可程式設計閘陣列(field programmable gate array, FPGA)或其他可程式設計邏輯器件、分立門或者電晶體邏輯器件、分立硬體元件。通用處理器可以是微處理器或者該處理器也可以是任何常規的處理器等。本申請公開的方法的步驟可以直接體現為硬體編碼處理器執行完成,或者用編碼處理器中的硬體及軟體模組組合執行完成。軟體模組可以位於隨機記憶體,快閃記憶體、唯讀記憶體,可程式設計唯讀記憶體或者電可讀寫可程式設計記憶體、寄存器等本領域成熟的存儲介質中。該存儲介質位於記憶體,處理器讀取記憶體中的資訊,結合其硬體完成上述方法的步驟。
上述各實施例中提及的記憶體可以是易失性記憶體或非易失性記憶體,或可包括易失性和非易失性記憶體兩者。其中,非易失性記憶體可以是唯讀記憶體(read-only memory,ROM)、可程式設計唯讀記憶體(programmable ROM,PROM)、可擦除可程式設計唯讀記憶體(erasable PROM,EPROM)、電可擦除可程式設計唯讀記憶體(electrically EPROM,EEPROM)或快閃記憶體。易失性記憶體可以是隨機存取記憶體(random access memory,RAM),其用作外部快取記憶體。通過示例性但不是限制性說明,許多形式的RAM可用,例如靜態隨機存取記憶體(static RAM,SRAM)、動態隨機存取記憶體(dynamic RAM,DRAM)、同步動態隨機存取記憶體(synchronous DRAM,SDRAM)、雙倍數據速率同步動態隨機存取記憶體(double data rate SDRAM,DDR SDRAM)、增強型同步動態隨機存取記憶體(enhanced SDRAM,ESDRAM)、同步連接動態隨機存取記憶體(synchlink DRAM,SLDRAM)和直接記憶體匯流排隨機存取記憶體(direct rambus RAM,DR RAM)。應注意,本文描述的系統和方法的記憶體旨在包括但不限於這些和任意其它適合類型的記憶體。
本領域普通技術人員可以意識到,結合本文中所公開的實施例描述的各示例的單元及演算法步驟,能夠以電子硬體、或者電腦軟體和電子硬體的結合來實現。這些功能究竟以硬體還是軟體方式來執行,取決於技術方案的特定應用和設計約束條件。專業技術人員可以對每個特定的應用來使用不同方法來實現所描述的功能,但是這種實現不應認為超出本申請的範圍。
所屬領域的技術人員可以清楚地瞭解到,為描述的方便和簡潔,上述描述的系統、裝置和單元的具體工作過程,可以參考前述方法實施例中的對應過程,在此不再贅述。
在本申請所提供的幾個實施例中,應該理解到,所揭露的系統、裝置和方法,可以通過其它的方式實現。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現時可以有另外的劃分方式,例如多個單元或元件可以結合或者可以集成到另一個系統,或一些特徵可以忽略,或不執行。另一點,所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些介面,裝置或單元的間接耦合或通信連接,可以是電性,機械或其它的形式。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位於一個地方,或者也可以分佈到多個網路單元上。可以根據實際的需要選擇其中的部分或者全部單元來實現本實施例方案的目的。
另外,在本申請各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。
所述功能如果以軟體功能單元的形式實現並作為獨立的產品銷售或使用時,可以存儲在一個電腦可讀取存儲介質中。基於這樣的理解,本申請的技術方案本質上或者說對現有技術做出貢獻的部分或者該技術方案的部分可以以軟體產品的形式體現出來,該電腦軟體產品存儲在一個存儲介質中,包括若干指令用以使得一台電腦設備(個人電腦,伺服器,或者網路設備等)執行本申請各個實施例所述方法的全部或部分步驟。而前述的存儲介質包括:U盤、移動硬碟、唯讀記憶體(read-only memory,ROM)、隨機存取記憶體(random access memory,RAM)、磁碟或者光碟等各種可以存儲程式碼的介質。
以上所述,僅為本申請的具體實施方式,但本申請的保護範圍並不局限於此,任何熟悉本技術領域的技術人員在本申請揭露的技術範圍內,可輕易想到變化或替換,都應涵蓋在本申請的保護範圍之內。因此,本申請的保護範圍應以所述權利要求的保護範圍為准。
10:音訊解碼系統 12:源設備 13:通信通道 14:目的設備 16:音訊源 18:音訊預處理器 20:編碼器 22、28:通信介面 30:解碼器 32:音訊後處理器 34:播放設備 700:過程 701、702:步驟 801:確定模組 802:獲取模組
圖1為本申請音訊播放系統的一個示例性的結構圖; 圖2為本申請音訊解碼系統10的一個示例性的結構圖; 圖3為本申請HOA編碼裝置的一個示例性的結構圖; 圖4a為本申請預設球面的一個示例性的示意圖; 圖4b為本申請俯仰角度和水準角度的一個示例性的示意圖; 圖5a和圖5b為K個虛擬揚聲器的示例性的分佈圖; 圖6a和圖6b為K個虛擬揚聲器的示例性的分佈圖; 圖7是本申請虛擬揚聲器集合確定方法的一個示例性的流程圖; 圖8為本申請虛擬揚聲器集合確定裝置的一個示例性的結構圖。
701、702:步驟

Claims (20)

  1. 一種虛擬揚聲器集合確定方法,其中,包括:根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;從預設的虛擬揚聲器分佈表中,獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F
    Figure 111107551-A0305-02-0045-1
    K,F×S
    Figure 111107551-A0305-02-0045-2
    K,其中,從所述K個虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器,加入所述F個虛擬揚聲器中。
  2. 如請求項1所述的方法,其中,所述根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,包括:獲取所述音訊信號的高階立體混響HOA係數;獲取所述F個虛擬揚聲器對應的F組HOA係數,所述F個虛擬揚聲器與所述F組HOA係數一一對應;將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
  3. 如請求項1所述的方法,其中,所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件: 所述S個虛擬揚聲器包括所述目標虛擬揚聲器,以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器,所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
  4. 如請求項1-3中任一項所述的方法,其中,所述K個虛擬揚聲器滿足如下條件:所述K個虛擬揚聲器分佈於預設球面上;所述預設球面包含L個緯度區域,L>1;其中,所述L個緯度區域中第m個緯度區域包含Tm個緯線圈,所述K個虛擬揚聲器中分佈於第mi個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm,1
    Figure 111107551-A0305-02-0046-3
    m
    Figure 111107551-A0305-02-0046-4
    L,Tm為正整數,1
    Figure 111107551-A0305-02-0046-5
    mi
    Figure 111107551-A0305-02-0046-6
    Tm;其中,當Tm>1時,所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αm
  5. 如請求項4所述的方法,其中,所述L個緯度區域中第n個緯度區域包含Tn個緯線圈,所述K個虛擬揚聲器中分佈於第ni個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αn,1
    Figure 111107551-A0305-02-0046-7
    n
    Figure 111107551-A0305-02-0046-8
    L,Tn為正整數,1
    Figure 111107551-A0305-02-0046-10
    ni
    Figure 111107551-A0305-02-0046-12
    Tn;其中,當Tn>1時,所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αn;其中,αnm或者αn≠αm,n≠m。
  6. 如請求項4所述的方法,其中,所述L個緯度區域中第c個緯度區域包含Tc個緯線圈,所述Tc個緯線圈的其中之一為赤道緯線圈,所述K個虛擬揚聲器中分佈於第ci個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αc,1
    Figure 111107551-A0305-02-0047-13
    c
    Figure 111107551-A0305-02-0047-14
    L,Tc為正整數,1
    Figure 111107551-A0305-02-0047-15
    ci
    Figure 111107551-A0305-02-0047-16
    Tc;其中,當Tc>1時,所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αc;其中,αcm,c≠m。
  7. 如請求項4所述的方法,其中,所述F個虛擬揚聲器滿足如下條件:所述F個虛擬揚聲器中分佈於所述第mi個緯線圈上的相鄰虛擬揚聲器之間的水準角度差αmi大於αm
  8. 如請求項7所述的方法,其中,αmi=q×αm,其中,q為大於1的正整數。
  9. 如請求項3所述的方法,其中,所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性Rfk滿足如下公式:R fk =B f ,φ)‧B k ,φ)其中,θ表示所述目標虛擬揚聲器的水準角度,φ表示所述目標虛擬揚聲器的俯仰角度,B f ,φ)表示所述目標虛擬揚聲器的HOA係數,B k ,φ)表示所述第k個虛擬揚聲器的HOA係數。
  10. 一種虛擬揚聲器集合確定裝置,其中,包括: 確定模組,用於根據待處理的音訊信號從預設的F個虛擬揚聲器中確定目標虛擬揚聲器,所述F個虛擬揚聲器中的每個虛擬揚聲器各自對應S個虛擬揚聲器,F為正整數,S為大於1的正整數;獲取模組,用於從預設的虛擬揚聲器分佈表中獲取與所述目標虛擬揚聲器對應的S個虛擬揚聲器各自的位置資訊,所述虛擬揚聲器分佈表包括K個虛擬揚聲器的位置資訊,所述位置資訊包括俯仰角索引和水平角索引,K為大於1的正整數,F
    Figure 111107551-A0305-02-0048-17
    K,F×S
    Figure 111107551-A0305-02-0048-18
    K,其中,從所述K個虛擬揚聲器中選取一個或多個虛擬揚聲器作為中心虛擬揚聲器,加入所述F個虛擬揚聲器中。
  11. 如請求項10所述的裝置,其中,所述確定模組,具體用於獲取所述音訊信號的高階立體混響HOA係數;獲取所述F個虛擬揚聲器對應的F組HOA係數,所述F個虛擬揚聲器與所述F組HOA係數一一對應;將所述F組HOA係數中與所述音訊信號的HOA係數相關性最大的一組HOA係數對應的虛擬揚聲器確定為所述目標虛擬揚聲器。
  12. 如請求項10所述的裝置,其中,所述與所述目標虛擬揚聲器對應的S個虛擬揚聲器滿足如下條件:所述S個虛擬揚聲器包括所述目標虛擬揚聲器,以及位於所述目標虛擬揚聲器周圍的S-1個虛擬揚聲器,所述S-1個虛擬揚聲器與所述目標虛擬揚聲器的S-1個相關性中的任意一個相關性大於所述K個虛擬揚聲器中除所述S個虛擬揚聲器外的其它K-S個虛擬揚聲器與所述目標虛擬揚聲器的K-S個相關性中的所有相關性。
  13. 如請求項10-12中任一項所述的裝置,其中,所述K個虛擬揚聲器滿足如下條件:所述K個虛擬揚聲器分佈於預設球面上;所述預設球面包含L個緯度區域,L>1;其中,所述L個緯度區域中第m個緯度區域包含Tm個緯線圈,所述K個虛擬揚聲器中分佈於第mi個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αm,1
    Figure 111107551-A0305-02-0049-19
    m
    Figure 111107551-A0305-02-0049-20
    L,Tm為正整數,1
    Figure 111107551-A0305-02-0049-21
    mi
    Figure 111107551-A0305-02-0049-22
    Tm;其中,當Tm>1時,所述第m個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αm
  14. 如請求項13所述的裝置,其中,所述L個緯度區域中第n個緯度區域包含Tn個緯線圈,所述K個虛擬揚聲器中分佈於第ni個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αn,1
    Figure 111107551-A0305-02-0049-23
    n
    Figure 111107551-A0305-02-0049-24
    L,Tn為正整數,1
    Figure 111107551-A0305-02-0049-25
    ni
    Figure 111107551-A0305-02-0049-27
    Tn;其中,當Tn>1時,所述第n個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αn;其中,αnm或者αn≠αm,n≠m。
  15. 如請求項13所述的裝置,其中,所述L個緯度區域中第c個緯度區域包含Tc個緯線圈,所述Tc個緯線圈的其中之一為赤道緯線圈,所述K個虛擬揚聲器中分佈於第ci個緯線圈上的相鄰虛擬揚聲器之間的水準角度差為αc,1
    Figure 111107551-A0305-02-0049-28
    c
    Figure 111107551-A0305-02-0049-29
    L,Tc為正整數,1
    Figure 111107551-A0305-02-0049-30
    ci
    Figure 111107551-A0305-02-0049-31
    Tc; 其中,當Tc>1時,所述第c個緯度區域中的任意兩個相鄰緯線圈之間的俯仰角度差為αc;其中,αcm,c≠m。
  16. 如請求項13所述的裝置,其中,所述F個虛擬揚聲器滿足如下條件:所述F個虛擬揚聲器中分佈於所述第mi個緯線圈上的相鄰虛擬揚聲器之間的水準角度差αmi大於αm
  17. 如請求項16所述的裝置,其中,αmi=q×αm,其中,q為大於1的正整數。
  18. 如請求項12所述的裝置,其中,所述K個虛擬揚聲器中的第k個虛擬揚聲器與所述目標虛擬揚聲器的相關性Rfk滿足如下公式:R fk =B f ,φ).B k ,φ)其中,θ表示所述目標虛擬揚聲器的水準角度,φ表示所述目標虛擬揚聲器的俯仰角度,B f ,φ)表示所述目標虛擬揚聲器的HOA係數,B k ,φ)表示所述第k個虛擬揚聲器的HOA係數。
  19. 一種音訊處理設備,其中,包括:一個或多個處理器;記憶體,用於存儲一個或多個程式;當所述一個或多個程式被所述一個或多個處理器執行,使得所述一個或多個處理器實現如請求項1-9中任一項所述的方法。
  20. 一種電腦可讀存儲介質,其中,包括電腦程式,所述電腦程式在電腦上被執行時,使得所述電腦執行如請求項1-9中任一項所述的方法。
TW111107551A 2021-03-05 2022-03-02 虛擬揚聲器集合確定方法和裝置 TWI816313B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202110247466.1A CN115038028B (zh) 2021-03-05 2021-03-05 虚拟扬声器集合确定方法和装置
CN202110247466.1 2021-03-05

Publications (2)

Publication Number Publication Date
TW202245487A TW202245487A (zh) 2022-11-16
TWI816313B true TWI816313B (zh) 2023-09-21

Family

ID=83117702

Family Applications (2)

Application Number Title Priority Date Filing Date
TW111107551A TWI816313B (zh) 2021-03-05 2022-03-02 虛擬揚聲器集合確定方法和裝置
TW112131814A TW202410705A (zh) 2021-03-05 2022-03-02 虛擬揚聲器集合確定方法和裝置

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW112131814A TW202410705A (zh) 2021-03-05 2022-03-02 虛擬揚聲器集合確定方法和裝置

Country Status (9)

Country Link
US (1) US20230412981A1 (zh)
EP (1) EP4294056A4 (zh)
JP (1) JP2024512347A (zh)
KR (1) KR20230154241A (zh)
CN (3) CN115038028B (zh)
AU (1) AU2022230620A1 (zh)
BR (1) BR112023017996A2 (zh)
TW (2) TWI816313B (zh)
WO (1) WO2022184097A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118283485A (zh) * 2022-12-29 2024-07-02 华为技术有限公司 虚拟扬声器的确定方法及相关装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103618986A (zh) * 2013-11-19 2014-03-05 深圳市新一代信息技术研究院有限公司 一种3d空间中音源声像体的提取方法及装置
EP3209036A1 (en) * 2016-02-19 2017-08-23 Thomson Licensing Method, computer readable storage medium, and apparatus for determining a target sound scene at a target position from two or more source sound scenes

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0815362D0 (en) * 2008-08-22 2008-10-01 Queen Mary & Westfield College Music collection navigation
EP2645748A1 (en) * 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
CN105637901B (zh) * 2013-10-07 2018-01-23 杜比实验室特许公司 空间音频处理系统和方法
JP6724830B2 (ja) * 2017-03-16 2020-07-15 ヤマハ株式会社 マイクロフォンアレイ

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103618986A (zh) * 2013-11-19 2014-03-05 深圳市新一代信息技术研究院有限公司 一种3d空间中音源声像体的提取方法及装置
EP3209036A1 (en) * 2016-02-19 2017-08-23 Thomson Licensing Method, computer readable storage medium, and apparatus for determining a target sound scene at a target position from two or more source sound scenes

Also Published As

Publication number Publication date
EP4294056A4 (en) 2024-07-17
AU2022230620A1 (en) 2023-09-21
US20230412981A1 (en) 2023-12-21
KR20230154241A (ko) 2023-11-07
CN116980818A (zh) 2023-10-31
CN117061983A (zh) 2023-11-14
TW202245487A (zh) 2022-11-16
CN115038028A (zh) 2022-09-09
WO2022184097A1 (zh) 2022-09-09
JP2024512347A (ja) 2024-03-19
BR112023017996A2 (pt) 2023-11-14
CN115038028B (zh) 2023-07-28
EP4294056A1 (en) 2023-12-20
TW202410705A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
US10313815B2 (en) Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
WO2022110723A1 (zh) 一种音频编解码方法和装置
US10477310B2 (en) Ambisonic signal generation for microphone arrays
US20080004729A1 (en) Direct encoding into a directional audio coding format
WO2009056956A1 (en) Focusing on a portion of an audio scene for an audio signal
WO2022110722A1 (zh) 一种音频编解码方法和装置
WO2018200089A1 (en) Microphone configurations
TWI819344B (zh) 音訊訊號渲染方法、裝置、設備及電腦可讀存儲介質
WO2010125228A1 (en) Encoding of multiview audio signals
WO2022262576A1 (zh) 三维音频信号编码方法、装置、编码器和系统
TWI816313B (zh) 虛擬揚聲器集合確定方法和裝置
CN115346537A (zh) 一种音频编码、解码方法及装置
CN115038027B (zh) Hoa系数的获取方法和装置
WO2024212638A1 (zh) 场景音频解码方法及电子设备
WO2024212894A1 (zh) 场景音频信号的解码方法和装置
WO2024212898A1 (zh) 场景音频信号的编码方法和装置
TWI853232B (zh) 一種音訊編碼、解碼方法及裝置
WO2024212895A1 (zh) 场景音频信号的解码方法和装置