TWM626327U

TWM626327U - 用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之系統

Info

Publication number: TWM626327U
Application number: TW110213468U
Authority: TW
Inventors: Ｄ雨果瑪蘭
Original assignee: 美商凱利產物有限公司
Priority date: 2020-11-18
Filing date: 2021-11-15
Publication date: 2022-05-01
Also published as: CA3199374A1; US20220159125A1; US11750745B2; CA3199374C; CR20230246A; TW202234864A; TWI820515B; WO2022108802A1; EP4248647A4; MX2023005524A; EP4248647A1

Abstract

本案涉及一種用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之系統。所述系統包括：至少一處理器；以及耦接至所述至少一處理器的記憶體。所述記憶體儲存供所述至少一處理器執行的指令。所述指令包含在所述複數個使用者的第一使用者以及遠端的人之間的音訊連接期間接收第一向外的信號，其中所述第一向外的信號編碼正從對應於所述第一使用者的第一通訊裝置發送至所述遠端的人的音訊；接收第一向內的信號，其中所述第一向內的信號編碼正從所述遠端的人的遠端的通訊裝置發送至所述第一使用者的音訊；從除了所述第一通訊裝置之外的所述複數個通訊裝置中的至少一個接收一組向外的信號；藉由組合所述組的向外的信號與所述第一向內的信號來產生第一組合的信號，其中所述第一組合的信號排除被發送至除了所述第一通訊裝置之外的所述複數個通訊裝置的向內的信號；以及發送所述第一組合的信號至所述第一通訊裝置。

Description

用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之系統

本揭露內容是有關於電話會議系統，並且更特別是有關用於在分別對應於複數個使用者的複數個通訊裝置之分配音訊信號之系統。

相關申請案之交互參照

此申請案是主張2021年11月8日申請的美國專利申請案號17/453,949的益處及優先權，所述美國專利申請案主張2020年11月18日申請的美國臨時申請案號63/115,596的益處及優先權。此申請案亦主張2020年11月18日申請的美國臨時申請案號63/115,596的益處及優先權。以上申請案的整體揭露內容被納入在此作為參考。

在商業用的實體辦公室空間中(例如，客服中心......等等)，在辦公室工作的商業的員工(例如，招聘人員、銷售人員...等等)經常獲益於無意中聽到其辦公室的同事間的談話、以及其同事(例如，經由電話...等等)正與所述商業外的個人(例如，可能的新成員、可能的客戶...等等)的談話的一邊。然而，當員工以虛擬方式工作時，其會失去與其同事在辦公室中工作的這些重要元素，包含無意中聽到其同事說話。

在一分散式客服中心中，一或多個員工可以遠端地工作(例如，在家)，使得其與其他同事實際遠離的。無法聽見其同事間的談話以及在其同事與所述商業外的個人之間的談話，可能會拖慢指導、在員工間散布資訊上創造阻力、以及妨礙從無意中聽到的談話產生的有利發現。

例如，在客服中心的一銷售員可能無意中聽到配置在所述客服中心附近的一招聘人員與一候選者談到有關所述候選者的技能，並且瞭解到所述招聘人員的客戶中之一正尋求這些技能。或是，在所述客服中心的一招聘人員可能無意中聽到配置在所述客服中心附近的一銷售員與一客戶談到有關所述客戶的需求，並且根據所述銷售員對所述客戶所說的而瞭解到所述招聘人員近來曾與一對於所述客戶的需求而言為完美的候選者說過話。或是在一更間接的方式中，一資淺的招聘人員可能無意中聽到一資深的招聘人員正對可能的新成員說話，並且從所述資深的招聘人員得知有關如何管理複雜的客戶/候選者互動。或是，一經理可能無意中聽到一銷售員正對一可能的客戶所說的，並且根據所述經理聽到所述銷售員如何和所述可能的客戶互動來識別可能的指導機會給所述銷售員。

習知的電話會議系統容許一群組的同事能夠有一會議通話。然而，這些系統通常只是有用於當所述群組在本身之間討論內部事務時，因而並不適合用於當所述同事中的一或多個希望個別地與所述商業外的個人談話。甚至在一會議通話內也可能是難以分辨在所述群組中的哪一個同事正在所述會議通話上說話、或是聚焦在一特定的同事所說的，尤其是當參與所述會議通話的同事數目增加時。

在此所提供的背景說明是為了大致提供本揭露內容的背景之目的。在本先前技術段落中所描述的範圍內之目前所列名的新型人之工作成果、以及在申請時可能未以其它方式認定為先前技術的說明方面均非明示或暗示地承認為不利於本揭露內容的先前技術。

一種用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之方法，其包含在所述複數個使用者的第一使用者以及遠端的人之間的音訊連接期間，接收第一向外的信號。所述第一向外的信號編碼正從所述複數個通訊裝置的第一通訊裝置發送至所述遠端的人的遠端的通訊裝置的音訊。所述第一通訊裝置對應於所述第一使用者。所述方法包含接收第一向內的信號。所述第一向內的信號編碼正從所述遠端的通訊裝置發送至所述第一通訊裝置的音訊。所述方法包含從除了所述第一通訊裝置之外的所述複數個通訊裝置中的至少一個接收一組向外的信號、以及藉由組合所述組的向外的信號與所述第一向內的信號來產生第一組合的信號。所述第一組合的信號排除被發送至除了所述第一通訊裝置之外的所述複數個通訊裝置的向內的信號。所述方法包含發送所述第一組合的信號至所述第一通訊裝置。

在其它特點中，所述方法包含轉傳所述第一向外的信號至所述遠端的通訊裝置。在其它特點中，所述方法包含藉由組合排除第二向外的信號的所述組的向外的信號來產生第二組合的信號。所述第二向外的信號編碼來自對應於第二使用者的第二通訊裝置的音訊。所述方法包含發送所述第二組合的信號至所述第二通訊裝置。

在其它特點中，產生所述第一組合的信號包含組合所述組的向外的信號與針對於內含在所述第一組合的信號中的向外的信號的一子集合的對應的時間延遲。在其它特點中，所述對應的時間延遲是避免內含在所述第一組合的信號中的所述組的向外的信號重疊。在其它特點中，所述方法包含對於內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號，根據所述第一向內的信號來調整所述對應的向外的信號的音量。

在其它特點中，調整所述組的向外的信號的所述對應的向外的信號的音量包含實施機器學習演算法，以正規化內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號。在其它特點中，所述方法包含發送所述第一向外的信號至一組遠端的通訊裝置。

在其它特點中，所述第一通訊裝置包含用於接收所述第一組合的信號的雙耳頭戴式耳機、以及用於發送所述第一向外的信號的麥克風。在其它特點中，所述方法包含指定所述雙耳頭戴式耳機的第一側或第二側給內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號。所述對應的向外的信號是從所述被指定的第一側或第二側被投射的。

一種用於在分別對應於複數個使用者的複數個通訊裝置之間分配音訊信號之系統，其包含至少一處理器、以及耦接至所述至少一處理器的記憶體。所述記憶體儲存供所述至少一處理器執行的指令，並且所述指令包含在所述複數個使用者的第一使用者以及遠端的人之間的音訊連接期間，接收第一向外的信號。所述第一向外的信號編碼正從對應於所述第一使用者的第一通訊裝置發送至所述遠端的人的音訊。所述指令包含接收第一向內的信號。所述第一向內的信號編碼正從所述遠端的人的遠端的通訊裝置發送至所述第一使用者的音訊。所述指令包含從除了所述第一通訊裝置之外的所述複數個通訊裝置中的至少一個接收一組向外的信號、以及藉由組合所述組的向外的信號與所述第一向內的信號來產生第一組合的信號。所述第一組合的信號排除被發送至除了所述第一通訊裝置之外的所述複數個通訊裝置的向內的信號。所述指令包含發送所述第一組合的信號至所述第一通訊裝置。

在其它特點中，所述指令包含發送所述第一向外的信號至對應於所述遠端的人的所述遠端的通訊裝置。在其它特點中，所述指令包含藉由組合排除第二向外的信號的所述組的向外的信號來產生第二組合的信號。所述第二向外的信號編碼來自對應於第二使用者的第二通訊裝置的音訊，並且所述指令包含發送所述第二組合的信號至所述第二通訊裝置。

在其它特點中，產生所述第一組合的信號包含組合所述組的向外的信號與針對於內含在所述第一組合的信號中的向外的信號的一子集合的對應的時間延遲。在其它特點中，所述對應的時間延遲是避免內含在所述第一組合的信號中的所述組的向外的信號重疊。

在其它特點中，所述指令包含對於內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號，根據所述第一向內的信號來調整所述對應的向外的信號的音量。在其它特點中，調整所述組的向外的信號的所述對應的向外的信號的音量包含實施機器學習演算法，以正規化內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號。

在其它特點中，所述指令包含發送所述第一向外的信號至一組遠端的通訊裝置。在其它特點中，所述第一通訊裝置包含用於接收所述第一組合的信號的雙耳頭戴式耳機、以及用於發送所述第一向外的信號的麥克風。在其它特點中，所述指令包含指定所述雙耳頭戴式耳機的第一側或第二側給內含在所述第一組合的信號中的所述組的向外的信號的每一個向外的信號。所述對應的向外的信號是從所述被指定的第一側或第二側被投射的。

本揭露內容的可利用性的進一步的領域從詳細說明、請求項、以及圖式來看將會變為明顯的。所述詳細說明及特定的例子只欲為了說明之目的而已，因而並不欲限制本揭露內容的範疇。

10:電話控制器系統

14:內部的使用者

14a:第一使用者

14b:第二使用者

14c:第三使用者

18:外部的使用者

18a:第一遠端的人

18b:第二遠端的人

18c:第三遠端的人

101:環境

102:使用者

102a:第一使用者

102b:第二使用者

102c:第三使用者

104:通訊網路

106:遠端的人

106a:第一遠端的人

106b:第二遠端的人

106c:第三遠端的人

108:雙耳頭戴式耳機

110:麥克風

112:立體聲耳機

114:行動電話

116:揚聲器

118:麥克風

200:電話控制器

202:音訊處理模組

302:團隊組合模組

304:音量模組

306:定位模組

308:衰減模組

310:正規化模組

312:音調調整模組

400:入口模組

502-568:處理訊息

本揭露內容從詳細說明以及所附的圖式來看將會變得更加完全瞭解。

[圖1]A是其中一範例電話控制器可被實施以用於處理及分配音訊信號的範例環境的圖形描繪。

[圖1]B是其中一範例電話控制器可被實施以用於處理及分配音訊信號的範例環境的另一圖形描繪。

[圖2]是所述電話控制器的圖形說明。

[圖3]是所述電話控制器的一音訊處理模組的功能方塊圖。

[圖4]是所述電話控制器的一入口模組的功能方塊圖。

[圖5]是可以相關圖2-4的電話控制器而被實施的範例信號處理的訊息序列圖表。

在圖式中，元件符號可被再利用來識別類似及/或相同的元件。

在一分散式環境中，每一個人都可以與其某些或全部的同事分開地工作，此剝奪他們聽見其同事互動的益處。此可能會減緩指導、在同事之間擴散資訊上創造阻力、並且妨礙從無意中聽到的談話的機會發現(例如，對於有一需求的一可能的消費者而言，另一銷售員是唯一合適解決的)。

在各種的實施方式中，利用本揭露內容的系統的每一個人都有雙耳頭戴式耳機以及一麥克風(其可以是與所述頭戴式耳機整合的)，以用於和發話人以及彼此通訊。本揭露內容容許一組織來識別團隊，並且輸送所有團隊成員的麥克風饋送至所述團隊成員的每一個的耳機。在各種的實施方式中，第一人將能夠聽見他們的團隊成員側的談話，但聽不見其他團隊成員的發話人。

例如，考量在一團隊中的第一人，麥克風是從所有其他團隊成員饋送至所述第一人的頭戴式耳機。相較於正和所述第一人說話的發話人的語音，來自所述團隊成員的饋送在音量上將會被降低。

一虛擬的房間可被佈局有虛擬位置，所述虛擬位置是針對於每一個團隊成員界定的。所述音訊將被處理，以使得其被所述第一團隊成員聽起來，彷佛是另一團隊成員的麥克風饋送是來自所述團隊成員的虛擬位置。對於較大的團隊而言，所述虛擬的房間會是較大的，就像是實體房間。接著，不只是方向，衰減亦可被採用來區別團隊成員。坐在離彼此較遠的團隊成員在其個別的頭戴式耳機中將會是較輕聲的。額外或替代所述虛擬的3D空間之內的設置，團隊成員的語音可被調整，例如藉由增高或降低音調，以使得他們更輕易可與彼此分辨的。

為了考量不同的語音音量，一機器學習模型可以在每一個使用者的語音上訓練以學習正常的語音音量，並且依此正規化語音。例如，使用者可能在較有自信時大聲說話，而在其它時候較為安靜。所述經訓練的機器學習模型可以辨認這兩個狀態，並且在每一個狀態中不同地縮放所述使用者的語音，以達成更均勻的平均音量。接著，不同使用者的語音可以彼此被正規化，使得一大聲的說話者在所述混合的饋送中將不會壓過一輕聲的說話者。

每一個麥克風饋送都可被監測以判斷話音的音量的平均及標準差-此可以藉由訓練一機器學習模型來完成。接著所述人的語音可以根據其平均音量而被正規化，並且根據其音量的標準差而被壓縮。此避免大聲的說話者蓋過輕聲的說話者。

再者，每一個人的語音可以受到動態壓縮、或至少是動態箝位(限制大聲的雜訊)，以便若某人的語音升高、或是若大聲的雜訊(例如咳嗽或猛力關門)被拾音時，避免驚嚇及中斷。在各種的實施方式中，每一個人可以具有一實體或軟體的靜音功能以容許其語音不廣播到其團隊成員，以便容許私下的談話。再者，每一個人必要時可以能夠暫時靜音周圍的談話。在各種的實施方式中，一入口(例如一網路入口)可以容許每一個人訂製麥克風注入參數。例如，一個人可以選擇誰是其團隊成員，並且可以調整音量或完全靜音某些同事。所述入口可以容許所述人調整其同事在3D空間中的虛擬位置，並且施加其它濾波器，例如是音調增高或降低。

組合及供應所述麥克風饋送至所述團隊成員可以利用單一邏輯裝置(被稱為一電話控制器)來發生，其可被置放在單一位置、或是被分散在橫跨多個位置。所述位置可包含一本地主機的專用交換機(private branch exchange；PBX)、一雲端PBX、或是一雲端主機提供者，例如是亞馬遜網路服務(Amazon Web Services；AWS)。在各種的實施方式中，某些功能可以在一使用者的電話本地加以執行。例如，側音的注入(其中使用者可以透過其頭戴式耳機聽見在降低的音量下回來的其本身的語音)可以本地加以執行，以避免任何延遲或失真。再者，所述使用者的發話人的語音可以在本地與所有其他團隊成員的累積饋送組合，以最小化所述發話人的語音的延遲。同時，即使有大量的延遲，但只要所述延遲不是可變的，對於其他團隊成員的談話的接收而言都是沒問題的，因為它們只是無意中被聽到，而不是參與在其中。

圖1A是範例電話控制器系統10的高階的圖形描繪。所述電話控制器系統10展現在複數個內部的使用者14以及複數個外部的使用者18之間發生多個同時的談話。所述複數個內部的使用者14包含一第一使用者14a、一第二使用者14b、以及一第三使用者14c。所述複數個外部的使用者18包含一第一遠端的人18a、一第二遠端的人18b、以及一第三遠端的人18c。儘管三個內部及外部的使用者被展示，較少或額外的內部及外部的使用者都可以利用所述電話控制器系統10來同時通訊。

所述電話控制器系統包含一電話控制器200，該電話控制器200 包含至少一處理器，以及耦接至所述至少一處理器的記憶體。亦即所述電話控制器系統包含至少一處理器，以及耦接至所述至少一處理器的記憶體。在各種的實施方式中，所述複數個內部的使用者14可以是在單一公司的員工，並且在內部連接至彼此。所述複數個外部的使用者18可以是所述複數個內部的使用者14經由一通訊網路104(例如，利用像是網際網路語音協定(Voice over Internet Protocol；VoIP)...等等的網際網路電話)通訊的消費者或其他個人。一範例通訊網路104包含所述網際網路。在各種的實施方式中，所述通訊網路104可包含一替代類型的網路，例如是一公用交換電話網路(public switch telephone network；PSTN)...等等。

所述電話控制器系統10包含用於每一個使用者的一向外的通訊信號、以及用於每一個使用者的一向內的通訊信號。在各種的實施方式中，一使用者可以產生多個向外的通訊信號，其例如是藉由對著超過一個麥克風說話。類似地，一使用者可以經由一通訊裝置，例如是一或多個揚聲器、頭戴式耳機、或電話來聆聽多個向內的通訊信號。若所述系統包含多個麥克風以產生多個向外的通訊信號，則所述多個向外的通訊信號將會是一複合的通訊信號，其組合來自每一個麥克風的不同的信號。然而，所述組合的向外的通訊信號仍然可以接著被分開。類似地，若所述系統包含多個揚聲器以接收多個向內的通訊信號，則所述向內的通訊信號被組合成為一複合的向內的通訊信號，其可被分開並且傳遞至每一個揚聲器。

在各種的實施方式中，所述複合的向內的通訊信號、或是所述組合的向外的通訊信號，可以在所述通訊裝置中的一或多個加以組合或匯總。例如，一頭戴式耳機可以接收個別的向外的通訊信號，並且組合那些向外的通訊信號(不包括藉由所述頭戴式耳機接收到的所述向外的通訊信號)，以供對應的使用者聆聽所述組合的信號。

所述電話控制器200對於所有向外的通訊信號具有完整的接達，並且可以控制或改變所有向內的通訊信號。再者，若所述向外的通訊信號是一複合的通訊信號，則所述電話控制器200可以在所述向外的通訊信號、或是個別的成分上即時地執行各種轉換。向外的通訊信號的轉換類型包含：複製向外的通訊信號或成分；相對於其它向外的通訊信號或成分來引入時間延遲；改變向外的通訊信號或成分的音調；相對於其它頻率範圍來抑制或放大在所述向外的通訊信號或成分中的某些頻率範圍；相對於其它向外的通訊信號或成分來改變向外的通訊信號或成分的音量；等等。

若所述向內的通訊信號是一複合的通訊信號，則所述電話控制器200可進一步即時地執行各種向內的通訊信號或是個別的成分。向內的通訊信號的轉換類型包含以上向外的通訊信號轉換的表列、以及加上向外的(或是其它向內的)通訊信號或成分到一向內的通訊信號上。在各種的實施方式中，所述相加可以發生在對於所述向外的(或是其它向內的)通訊信號或成分的一或多個轉換的施加之後。

所述電話控制器200從一處理器或是一或多個模組接收指令，其指示所述轉換在所述向外的通訊信號以及所述向內的通訊信號上執行。所述電話控制器200亦可以即時地接收輸入來指示特定的轉換的執行。例如，所述電話控制器200可以接收一指令，來根據實體構件的空間定位，即時地改變在信號成分之間被引入的一時間延遲。

在各種的實施方式中，所述電話控制器系統10以及電話控制器200可以實施基本的共同聆聽。在基本的共同聆聽中，第一使用者14a可以聆聽所述複數個內部的使用者14的每一個的向外的通訊信號，並且聆聽其談話。以此種方式，所述第一使用者14a聽見所述複數個內部的使用者14的談話，彷佛他們是在相同的房間內。例如，所述電話控制器系統10以及電話控制器200可以產生一虛擬的房間，其中每一個使用者14是位在所述虛擬的房間中的一不同的位置(例如，利用一用於定位的XAudio2函式庫...等等)。一使用者介面可以容許一系統管理者來配置所述使用者14在所述虛擬的房間中的位置，例如是對應於使用者先前在一實體辦公室環境中的位置之位置。

一或多個虛擬的房間可被創造，其中任意適當數目的使用者14被指定到每一個房間。例如，所述電話控制器系統10以及電話控制器200可被設計以支援2個虛擬的房間，其中每一房間最多八個使用者。在其它實施例中，更多或較少虛擬的房間可被支援，其中每一房間有更多或較少的最大的使用者數。

為了實施基本的共同聆聽，所述電話控制器系統10包含用於每一個內部的使用者以及每一個外部的使用者的至少一麥克風以及至少一揚聲器。在實施中，所述電話控制器200是將所述複數個內部的使用者14的每一個的向外的通訊信號，加到所述第一使用者14a的第一向內的通訊信號上。被加入的向外的通訊信號可以是在比所述第一向內的通訊信號較低的音量、或是所述第一使用者14a可以經由被提供給所述第一使用者14a的第一控制器，即時地調整每一個通訊信號的音量。

一對應的控制器可被提供給每一個使用者，以調整音量、靜音...等等。在各種的實施方式中，所述電話控制器200可以實施一機器學習演算法，以根據所述第一使用者的音量歷史、或是成比例於所述第一向內的通訊信號來調整音量。在各種的實施方式中，所述電話控制器200亦可以提供所述複數個內部的使用者14的向內的通訊信號，其供應所述談話的兩邊(換言之，所述複數個外部的使用者18的向外的通訊信號)。

在各種的實施方式中，所述電話控制器系統10以及所述電話控制器200可以從一或多個應用程式捕捉音訊，以組合來自多個內部的使用者14及/或外部的使用者18的音訊。例如，所述電話控制器系統10以及所述電話控制器 200可以從一或多個第三方應用程式捕捉音訊，其中被捕捉的音訊(或是每一個第三方應用程式音源)的每一個實例是被納入，作為在所述向外及/或向內的通訊信號之間的一個別的音訊串流。

所述電話控制器系統10以及所述電話控制器200可以使用濾波或是其它適當的技術來禁止和捕捉音訊相關的回音。在各種的實施方式中，一編解碼器(例如一Opus編解碼器及管線)可被使用於針對所捕捉的音訊的資料壓縮。

所述電話控制器系統10以及所述電話控制器200亦可以實施空間上分開的共同聆聽。空間上分開的共同聆聽是類似於基本的共同聆聽，其中來自所述複數個內部的使用者14的向外的通訊信號是包含獨特的時間延遲、以及指定不同的向外的通訊信號，以交替在所述第一使用者14a的左揚聲器及右揚聲器之間。所述電話控制器200包含用於所述向外的通訊信號的時間延遲並且交替在所述左揚聲器及右揚聲器之間，以容許所述第一使用者14a能夠更佳區別其它內部的使用者的向外的通訊信號。

為了實施空間上分開的共同聆聽，所述系統包含用於所述複數個外部的使用者18的每一個的一麥克風以及一揚聲器、以及用於所述複數個內部的使用者14的每一個的一麥克風以及兩個立體聲揚聲器。所述複數個內部的使用者14分別具有左立體聲及右立體聲揚聲器，以創造(所述複數個內部的使用者14或是所述複數個外部的使用者18的)所述個別的向外的通訊信號是從不同的空間方向聽見的感知。所述多個揚聲器以及所述時間延遲是有助於所述第一使用者14a區別不同的通訊信號。

在各種的實施方式中，針對於所述複數個內部的使用者14，所述電話控制器系統10可以使用雙耳頭戴式耳機來實施空間上分開的共同聆聽。所述雙耳頭戴式耳機提供被錨定至所述內部的使用者的頭部的一平面的座標系統，其根據所述內部的使用者的頭部的方位來改變所述向外的通訊信號的主觀的聲音方向。

在各種的實施方式中，所述電話控制器系統10可以利用方位追蹤的雙耳頭戴式耳機，類似於用在虛擬實境頭戴式耳機的頭戴式耳機，來實施空間上分開的共同聆聽。所述方位追蹤的雙耳頭戴式耳機提供一平面的座標系統，同時容許所述座標系統是固定的，而與所述內部的使用者的頭部的方位無關，其是藉由改變介於所述向外的通訊信號之間的時間延遲以補償在所述頭部的方位上的改變。例如，所述主觀的聲音方向並不隨著在所述內部的使用者的頭部上的改變而移動。

在各種的實施方式中，所述電話控制器系統10可以利用多個外部的揚聲器來實施空間上分開的共同聆聽，其提供較複雜的空間定位。多個外部的揚聲器提供在所述內部的使用者之上或之下的主觀的空間方向。再者，多個外部的揚聲器創造一座標系統，其是與所述內部的使用者的頭部的方位無關的。

在各種的實施方式中，所述電話控制器系統10可以利用一方位追蹤的麥克風或是利用多個外部的麥克風來實施空間上分開的共同聆聽，此容許外部的使用者能夠藉由轉向一特定的人的「虛擬的」方向，以更直接向所述特定的人說話。

所述電話控制器系統10以及所述電話控制器200亦可以實施音色分開的共同聆聽。音色分開的共同聆聽是類似於基本的共同聆聽以及空間上分開的共同聆聽而被實施的，但是其進一步轉換所述向外的通訊信號的音調、混頻、音量...等等中的一或多個。由於在正被聽見的各種內部或外部的使用者的音調、聲音品質、音量...等等上的差異，音色分開的共同聆聽是考量音調、混頻...等等，以協助所述第一使用者14a區別所述各種的向外的通訊信號。在各種的實施方式中，音色分開的共同聆聽的聲音轉換可被選擇以匹配所述第一使用者14a的聽力(例如，以補償晚年的高頻聽覺損失)。

在各種的實施方式中，所述電話控制器系統10以及所述電話控制器200可以藉由混合來自各種的使用者，例如是所述內部的使用者14及/或所述外部的使用者18中的兩個或多個的音源來創造一空間效應。例如，數位信號處理器(digital signal processor；DSP)或是DSP應用程式可被用來混合音源，例如是安裝在膝上型或其它適當的計算裝置上的DSP應用程式。

當所述複數個內部的使用者14以及所述複數個外部的使用者18亦利用視訊螢幕及攝影機時，所述電話控制器系統10以及所述電話控制器200亦可以實施視訊同步化的共同聆聽。當實施視訊同步化的共同聆聽時，所述電話控制器系統10同步化對應於目前聽見的向外的通訊信號的視訊信號，以匹配所述向外的通訊信號的時序。視訊同步化的共同聆聽進一步協助所述第一使用者14a，因為所述第一使用者14a可以看見誰正在說話以及說話者的臉部運動是如何對應於所述第一使用者14a所聽見的聲音。在各種的實施方式中，所述額外的向外的通訊信號的即時的AI驅動的翻譯可被顯示在視訊上或是在文字視窗中，以使得個別的談話較容易跟上。

在各種的實施方式中，所述電話控制器系統10以及所述電話控制器200可包含一或多個DSP應用程式、伺服器應用程式...等等。所述電話控制器系統10及/或所述電話控制器200可以作用為一網路控制器，其提供一或多個控制通道應用程式介面(application programming interface；API)。例如，所述電話控制器系統10及/或所述電話控制器200可被用來控制針對於每一個使用者14的進入及向外的語音通道的參數、指定...等等，並且所述API可以容許一系統管理者或其它系統構件來修改藉由所述電話控制器系統10及/或所述電話控制器200實施的設定或控制。

在某些實施例中，一應用程式(例如一伺服器應用程式)可以提供一插槽傳輸實施方式。所述插槽傳輸實施方式可以提供各種的處理特點，例如是語音資料處理、控制資料處理...等等。在各種的實施方式中，一客戶應用程式可以處理進入的請求，例如是接受及斷連客戶(例如，所述內部的使用者14及/或外部的使用者18)。

一應用程式可以重新定向在客戶之間的語音流量、重新定向在客戶之間的控制流量...等等。例如，所述應用程式的一終端使用者可能是能夠創造一虛擬的房間，從一本地的計算裝置連接至所述虛擬的房間，並且配置用於每一個使用者(例如每一個內部的使用者14)的個別的位置。所述應用程式可以容許一客戶根據一指定的配置(例如，所述虛擬的房間的配置)聽見來自所有參與者的音訊串流，並且在一第三應用程式中聽見來自一參與者的通話的音訊串流。當所要或必要時，所述客戶可以離開所述虛擬的房間。

在各種的實施方式中，所述系統10及/或電話控制器200可以記錄所述內部的使用者14及/或外部的使用者18中的一或多個的音訊。例如，來自一內部的使用者14的音訊串流可被記錄及儲存，以供之後的播放。在所述記錄及播放之間的時間可以是非常短的，例如是引入一短的時間延遲、或是可以間隔開更長的時間週期(例如，若一記錄的音訊串流是在當天稍後播放、或甚至是在隔天播放，其例如是為了訓練的目的)。

若內部的使用者14工作在一天的不同時間(或是在不同天)，則在先前的時間點被記錄的來自一內部的使用者14的音訊可被播放給另一內部的使用者(例如，作為一組合的通訊信號的部分)。因為所述被記錄的音訊是發生在較早時，儘管之後的使用者14可能無法即時地在所播放的音訊上做動作，但是所播放的音訊可以警示之後的使用者14跟上先前產生所述被記錄的音訊的使用者14(例如，若之後的使用者在聆聽所播放的音訊時注意到一項重要相關的資訊的話)。

圖1B是包含一電話控制器200的一範例環境101的另一圖形描繪。所述電話控制器200的範例實施方式是在以下參考圖2-4而更加詳細地描述。

在圖1B中，所述環境101包含一團隊的第一、第二及第三使用者102a、102b及102c(全體稱為使用者102)、一通訊網路104、以及第一、第二及第三遠端的人106a、106b及106c(全體稱為遠端的人106)。所述電話控制器200是經由和所述通訊網路104的連接(或是作為其部分)而被實施在所述環境101中。

所述三個不同的使用者102可以是具有分散式客服中心的一商業的員工，其中每一個雇員實際是工作在一不同的實體位置(例如，其是從所述員工的個人住宅與所述商業的不同的可能的消費者或新成員等等的電話會議)。在各種的環境中，使用者的數目可以是大於或小於三個。再者，所述使用者並不需要是一定義的團隊的部分、任何特定的商業或實體的員工、或是工作在一分散式客服中心。在圖1B中，每一個使用者102是在一會議中的一參與者，所述會議是透過所述通訊網路104而被實行在所述使用者102以及並非所述團隊VoIP的部分的一不同的遠端的人106之間。

一實施在所述環境101中的電話控制器可被配置以使得經由所述通訊網路104，在每一個使用者102以及每一個對應的遠端的人106之間的會議變得容易。例如，所述第一使用者102a是在藉由所述電話控制器所促成在所述第一使用者102a以及所述第一遠端的人106a之間的一會議中的一參與者。所述第二使用者102b是在藉由所述電話控制器所促成在所述第二使用者102b以及所述第二遠端的人106b之間的一不同會議中的一參與者。並且，所述第三使用者102c是在藉由所述電話控制器所促成在所述第三使用者102c以及所述第三遠端的人106c之間的又一不同會議中的一參與者。

在所述使用者102以及對應的遠端的人106之間的範例會議是電話會議，並且所述電話會議是在所述使用者102以及所述對應的遠端的人106之間的一對一的電話通話，使得在每一個通話中的參與者只有所述對應的使用者102以及遠端的人106。在各種的環境中，一會議可以用一或多種其它方式來實行，例如是利用一PSTN。在各種的實施方式中，一會議是一對一、一對多、多對一、或是多對多的。再者，一會議可能牽涉到一或多個其它類型的媒體，例如是一視訊。在各種的實施方式中，所述第一使用者102a可能是在與一遠端的人的一會議中，但是所述第二及第三使用者102b及102c可能不在與任何遠端的人的任何會議中。

針對於所述團隊的每一個使用者102，除了在與所述使用者102的一對一的通話中對應的遠端的人106的語音之外，所述電話控制器200是被配置以分配所述團隊的其他使用者102的每一個的語音(向外的通訊信號)給所述使用者102，同時把所述使用者102隔離於每一個其他遠端的人106的語音。因此，所述使用者102只能夠聽見在所述使用者的團隊的其他使用者的語音。針對於每一個遠端的人106，所述電話控制器200亦被配置以僅發送對應的使用者102的語音至所述遠端的人106。

例如，當所述電話控制器200被實施在所述環境101中，除了在與所述第一使用者102a的一對一的會議中的第一遠端的人106a的語音之外，其可被配置以分配所述第二及第三使用者102b及102c的語音給所述第一使用者102a，同時把所述第一使用者102a隔離於所述第二及第三遠端的人106b及106c的語音。所述電話控制器200亦可被配置以發送所述第一使用者102a的語音至所述第一遠端的人106a(在所述第一使用者102a以及所述第一遠端的人106a之間的會議中)，同時把所述第一遠端的人106a隔離於所述第二及第三使用者102b及102c的語音(在所述第二及第三使用者102b及102c與所述第二及第三遠端的人106b及106c之間的一對一的會議中)。

作為另一例子的是，除了在與所述第二使用者102b的一對一的會議中的第二遠端的人106b的語音之外，所述電話控制器200可被配置以分配所述第一及第三使用者102a及102c的語音至所述第二使用者102b，同時把所述第二使用者102b隔離於所述第一及第三遠端的人106a及106c的語音。所述電話控制器200亦可被配置以發送所述第二使用者102b的語音至所述第二遠端的人106b(在所述第二使用者以及所述第二遠端的人之間的會議中)，同時把所述第二遠端的人隔離於所述第一及第三使用者的語音(在所述第一及第三使用者與所述第一及第三遠端的人之間的一對一的會議中)。

作為另一例子的是，除了在與所述第三使用者102c的一對一的會議中的第三遠端的人106c的語音之外，所述電話控制器200可被配置以分配所述第一及第二使用者102a及102b的語音給所述第三使用者102c，同時把所述第三使用者102c隔離於所述第一及第二遠端的人106a及106b的語音。所述電話控制器200亦可被配置以發送所述第三使用者102c的語音至所述第三遠端的人106c(在所述第三使用者102c以及所述第三遠端的人106c之間的會議中)，同時把所述第三遠端的人106c隔離於所述第一及第二使用者102a及102b的語音(在所述第一及第二使用者102a及102b與所述第一及第二遠端的人106a及106b之間的一對一的會議中)。所述電話控制器200可以針對於任何所期望的使用者數量而類似地被配置。

以此種方式，所述電話控制器200使得使用者102的團隊(可能分散在城市、州、國家、或甚至是世界)能夠根據需要來私下共同聆聽/無意中聽到及/或與彼此談話。同時，所述電話控制器200使得所述團隊的每一個使用者102能夠參與和不是所述團隊的部分的一遠端的人106的一會議，其中此種和所述遠端的人106的會議是與所述團隊的其他使用者102半隔離的(相關所述遠端的人106的語音)。

在各種的實施方式中，根據涉及音量控制、三維的(3D)語音定位、衰減、正規化、及/或音調調整以及其它方面的音訊處理，所述電話控制器200使得所述團隊的每一個使用者102能夠輕易區別所述團隊的其他使用者102的每一個的語音。再者，所述電話控制器200可以使得所述團隊的每一個使用者102能夠提供使用者輸入，以控制所述使用者102及/或所述團隊的其他使用者102的語音的處理。

圖2是一範例電話控制器200的圖形說明，其可被實施在圖1A及1B的環境中。為了簡化起見，圖2是在圖形上描繪所述電話控制器200的相關所述第一使用者102a以及所述第一遠端的人106a的一詳細的實施方式。然而，所述實施方式對於其他使用者102b及102c以及對應的遠端的人106b及106c的每一個而言是實質相同的。再者，儘管三個使用者102以及三個遠端的人106被描繪在圖2中，但所述電話控制器200可被實施在一支援任何所期望的數量的使用者或遠端的人的環境中。

在圖2中，電話控制器200是被配置以針對於所述團隊的使用者102的每一個，接收所述使用者102在所述使用者以及所述對應的遠端的人106之間的會議中的一向外的音訊信號。所述向外的音訊信號包含所述使用者102在所述使用者以及所述對應的遠端的人106之間的會議中的語音。

每一個使用者102配備有一音訊輸入/輸出(IO)裝置。為了說明，每一個使用者102的範例音訊IO裝置是一雙耳頭戴式耳機108，其具有一麥克風110以及一組立體聲耳機112，使用者102的每一個耳朵有一耳機。

所述雙耳頭戴式耳機108是被配置以從所述電話控制器200，經由所述通訊網路104來接收相關的使用者102的一向內的音訊信號，所述向內的音訊信號除了根據(或包含)所述團隊的其他使用者102的每一個(例如，所述第二及第三使用者102b及102c...等等)的語音之外，還根據(或包含)在所述使用者102以及所述遠端的人106之間的對應的會議中的遠端的人106(例如，所述遠端的人106a...等等)的語音。

在各種的實施例中，所述雙耳頭戴式耳機108可被配置以從所述電話控制器200，經由所述通訊網路104，經由一或多個中間的通訊裝置(例如，一個人電腦、一膝上型電腦、一行動電話、一電話(例如，一VoIP電話、一固網電話...等等)(未顯示)來接收相關的使用者102的向內的音訊信號。所述中間的通訊裝置可被配置以從所述電話控制器200，經由所述通訊網路104來接收相關的使用者102的向內的音訊信號，並且提供所接收到的向內的音訊信號至所述雙耳頭戴式耳機108。

在圖2中，除了所述團隊的每一個其他使用者102的語音之外，所述雙耳頭戴式耳機108是被配置，以根據相關的使用者102所接收到的向內的音訊信號，經由所述頭戴式耳機或是立體聲耳機組112來輸出在所述使用者以及所述遠端的人106之間的對應的會議中的遠端的人106的語音。

所述雙耳頭戴式耳機108亦被配置以經由所述麥克風110來收集所述相關的使用者102的語音，並且經由所述通訊網路104來提供所述使用者102的一向外的音訊信號至所述電話控制器200，所述向外的音訊信號是根據(或包含)在所述使用者102以及所述遠端的人106之間的對應的會議中的使用者102的語音。

在各種的實施例中，雙耳頭戴式耳機108可被配置以經由所述通訊網路104，經由一或多個中間的通訊裝置來提供所述相關的使用者102的向外的音訊信號至所述電話控制器200。所述中間的通訊裝置於是可被配置以接收所述使用者102的向外的音訊信號，並且經由所述通訊網路104來提供所述接收到的向外的音訊至所述電話控制器200。

再者，為了簡化起見，只有所述第一使用者102a在圖2中被描繪為配備有所述雙耳頭戴式耳機108。然而，所述其他使用者102b及102c的每一個都配備有實質類似的雙耳頭戴式耳機。再者，在各種的環境中，一或多個使用者的音訊IO裝置可以是一不同類型的裝置(例如，一或多個耳機，例如是耳塞式耳機、帶有一麥克風、一獨立的麥克風以及獨立的耳機...等等)。

在圖2中，每一個遠端的人106類似地配備有一音訊IO裝置。為了說明，每一個遠端的人106的範例音訊IO裝置是一行動電話114的部分，其包含一揚聲器116以及一麥克風118。

所述行動電話114是被配置以從所述電話控制器200，經由所述通訊網路104來接收相關的遠端的人106的一向內的音訊信號，所述向內的音訊信號根據(或包含)在所述使用者102以及所述遠端的人106之間的對應的會議中的使用者102的語音。

在各種的實施例中，所述行動電話114可被配置以從所述電話控制器200，經由所述通訊網路104，經由一或多個中間的通訊裝置來接收相關的遠端的人的向內的音訊信號。所述中間的通訊裝置可被配置以從所述電話控制器200，經由所述通訊網路104來接收所述遠端的人106的向內的音訊信號，並且提供所接收到的向內的音訊信號至所述行動電話114。

在圖2中，所述行動電話114是被配置以根據相關的遠端的人106所接收到的向內的音訊信號，經由所述揚聲器116來輸出在所述使用者102以及所述遠端的人106之間的對應的會議中的使用者102的語音。

所述行動電話114亦被配置以經由所述麥克風118來收集相關的遠端的人106的語音，並且經由所述通訊網路104來提供所述遠端的人106的一向外的音訊信號至所述電話控制器200，所述向外的音訊信號根據(或包含)在所述使用者102以及所述遠端的人之間的對應的會議中的遠端的人106的語音。

在各種的實施例中，行動電話114可被配置以經由所述通訊網路 104，經由一或多個中間的通訊裝置來提供相關的遠端的人106的向外的音訊信號至所述電話控制器200。所述中間的通訊裝置於是可被配置以接收所述遠端的人106的向外的音訊信號，並且經由所述通訊網路104來提供所接收到的向外的音訊至所述電話控制器200。

再者，為了簡化起見，只有遠端的人106a在圖2中被描繪為配備有所述行動電話114。然而，所述其他遠端的人106b及106c的每一個是類似地配備有行動電話、固網電話、或是電腦為基礎的電話。再者，在各種的環境中，一或多個遠端的人的音訊IO裝置可以是一不同類型的裝置(例如，一雙耳頭戴式耳機、一或多個耳機，例如是耳塞式耳機、帶有一麥克風、一獨立的麥克風以及獨立的耳機...等等)。

所述電話控制器200是被配置以針對於所述團隊的使用者102的每一個，接收所述使用者102的向外的音訊信號，其包含在所述會議中以及尤其在所述使用者102以及所述對應的遠端的人106之間的一對一的通話中的使用者102的語音。所述電話控制器200是被配置以針對於所述團隊的每一個使用者102，從所述使用者102的雙耳頭戴式耳機108經由所述通訊網路104來接收所述使用者102的向外的音訊信號。

所述電話控制器200亦被配置以針對於所述遠端的人106的每一個，提供所述遠端的人106的向內的音訊信號，其包含在所述對應的使用者102以及所述遠端的人106之間的會議中的對應的使用者102的語音。在各種的實施方式中，所述電話控制器200可被配置，以根據在針對於對應的使用者102所接收到的向外的音訊信號中的所述對應的使用者102的語音，來產生用於所述遠端的人106的向內的信號以作為一新的音訊信號，並且經由所述通訊網路104來提供所產生的用於所述遠端的人106的向內的音訊信號至所述遠端的人106。或是，所述電話控制器200可被配置以經由所述通訊網路104來提供針對於對應的使用者102的向外的音訊信號至所述遠端的人106的行動電話114，以作為用於所述遠端的人106的向內的音訊信號(例如，在無產生新的音訊信號之下...等等)。

所述電話控制器200亦被配置以針對於並非所述團隊的部分的遠端的人106的每一個，接收針對於所述遠端的人106的向外的音訊信號，所述向外的音訊信號包含所述遠端的人106在所述會議中以及尤其在對應的使用者102以及所述遠端的人106之間的一對一的通話中的語音。所述電話控制器200是被配置以針對於每一個遠端的人106，從所述遠端的人的行動電話114經由所述通訊網路104來接收針對於所述遠端的人106的向外的信號。

所述電話控制器200是被配置以針對於所述團隊的每一個使用者102，處理用於所述使用者102的一向內的音訊信號；處理內含在向外的音訊信號中的語音，所述向外的音訊信號中的語音是針對於每一個其他使用者102所接收到的；以及處理內含在向外的音訊信號中的語音，所述向外的音訊信號是針對於在使用者102以及所述對應的遠端的人106之間的會議中之對應的遠端的人106所接收到的。

所述電話控制器200可包含一音訊處理模組202。所述電話控制器200是被配置以對於所述團隊的每一個使用者102，提供針對於在所述使用者102以及對應的遠端的人106之間的會議中的使用者102所接收到的向外的音訊信號至所述音訊處理模組202。所述音訊處理模組是被配置以針對於所述團隊的每一個使用者102，接收針對於所述使用者102的向外的音訊信號，並且除了相關圖3更詳細敘述的其它方面，其針對於所述團隊的每一個使用者102，組合針對於所述團隊的其他使用者102的每一個所接收到的向外的音訊信號成為一團隊音訊信號(總體來說，一複合的音訊信號)。所述團隊音訊信號於是包含所述團隊的每一個其他使用者102的語音。

圖3是所述電話控制器200的一音訊處理模組202的功能方塊圖。所述範例音訊處理模組202包含模組，所述模組被配置以針對於所述團隊的每一個使用者，組合針對於所述團隊的每一個其他使用者102所接收到的音訊向外的音訊信號成為一團隊音訊信號(總體來說，一輔助的音訊信號)以用於所述使用者102，並且透過在此描述的各種處理技術，使得所述使用者102能夠例如輕易地區別所述團隊的其他使用者102的每一個的語音。

所述電話控制器200的範例模組包含一團隊組合模組302、一音量模組304、一定位模組306、一衰減模組308、一正規化模組310、以及一音調調整模組312。所述音訊處理模組202是被配置以針對於所述團隊的每一個使用者102，在針對於所述團隊的其他使用者102的每一個接收所述向外的音訊信號之後，提供針對於所述團隊的每一個其他使用者102的向外的音訊信號至所述模組，以及尤其是提供至所述團隊組合模組302。

所述團隊組合模組302是如上所述被配置以針對於所述團隊的每一個使用者，組合針對於所述團隊的每一個其他使用者102所接收到的音訊向外的音訊信號成為一團隊音訊信號，使得所述團隊音訊信號包含所述團隊的每一個其他使用者102的語音，但是不包含在其他使用者102以及對應遠端的人之間的會議中的對應的遠端的人106的語音。以此種方式，所述其他遠端的人106的語音是與針對於所述使用者102產生的團隊音訊信號隔離開。所述團隊組合模組302接著被配置以對於每一個使用者102，提供針對於所述使用者102的團隊音訊信號至所述音量模組304。

所述音量模組304是被配置以針對於所述團隊的每一個使用者102，從所述團隊組合模組302接收針對於所述使用者102的團隊音訊信號、以及尤其是所述團隊的每一個其他使用者的語音。相較於在所述使用者102以及對應的遠端的人106之間的會議中的對應的遠端的人106的語音的音量，所述音量模組304是被配置以接著降低所述團隊的每一個其他使用者的語音的音量。所述音量模組304是被配置以針對於所述團隊的每一個使用者，提供用於所述使用者102的音量經調整的團隊音訊信號至所述定位模組306。在各種的實施例中，所述電話控制器200、所述音訊處理模組202、及/或所述音量模組304可被配置，以額外或替代地增大所述對應的遠端的人106的音量，使得所述團隊的每一個其他使用者102的語音的音量低於對應的遠端的人106的音量。

在圖2中，所述定位模組306是被配置以針對於所述團隊的每一個使用者102，從所述音量模組304接收用於所述使用者102的音量經調整的團隊音訊信號，並且在一個二維(2D)或是三維(3D)虛擬空間中，在所述使用者102在所述虛擬空間中的一位置周圍，定位在所述團隊音訊信號中的每一個其他使用者102的語音。所述定位模組306是被配置以針對於所述團隊的每一個使用者102，提供用於所述使用者102的經定位的團隊音訊信號至所述衰減模組308。

所述定位模組306在各種的實施例中可被配置以轉換所述團隊音訊信號成為一立體聲音訊信號，使得所述團隊音訊信號創造多向可聽見的觀點的幻象，並且導引或關聯在所述立體聲的團隊音訊信號之內每一個其他使用者102的語音的某些聲音至所述使用者102的雙耳頭戴式耳機108的一耳機，以及導引或關聯每一個其他使用者102的語音的其它聲音至所述使用者102的雙耳頭戴式耳機108的另一耳機。在其它實施例中，從所述音量模組304接收到的團隊音訊信號可能已經是一立體聲音訊信號，所述定位模組306在此情形中可被配置以調整在所述團隊音訊信號之內的耳機關聯。

再者，藉由在被導向或關聯至所述使用者102的雙耳頭戴式耳機的一耳機之每一個其他使用者102的語音的某些聲音、以及被導向或關聯至的所述使用者102的雙耳頭戴式耳機的另一耳機之每一個其他使用者102的語音的其它聲音之間，在時間上產生一延遲，所述定位模組306在各種的實施例中可被配置以針對於每一個其他使用者102的語音(或是其之某些聲音)產生多向可聽見的觀點的幻象。

在各種的實施例中，所述虛擬空間是代表例如用於一客服中心的辦公室空間的一實體位置，其包含所述使用者102的多個辦公室、隔間、辦公桌、工作站...等等。以此種方式，所述定位模組306例如可被配置以對於所述團隊的第一使用者102a，把所述第二使用者102b在一虛擬空間(其代表用於客服中心的辦公室空間)中的語音定位至所述虛擬空間之內的一位置，其代表所述第二使用者102b的一辦公桌在用於所述客服中心的辦公室空間中的實體位置，其中在所述虛擬空間中的一不同的位置，代表所述第一使用者在用於所述客服中心的辦公室空間中的一隔間的一實體位置(例如，離所述第二使用者102a的辦公桌十呎...等等)。

在圖3中，所述衰減模組308是被配置以針對於所述團隊的每一個使用者102，從所述定位模組306接收針對於所述使用者102的經定位的團隊音訊信號，並且根據所述其他使用者102在所述虛擬空間之內的位置、以及尤其所述使用者102在所述虛擬空間中的位置以及所述其他使用者102在所述虛擬空間中的位置之間的距離，來衰減每一個其他使用者102的語音，使得被定位比另一使用者102(例如，所述第三使用者102c...等等)更遠的一其他使用者102(例如，所述第二使用者102b...等等)，對於所述使用者102而言將會聽起來更輕聲。所述衰減模組308是被配置以針對於所述團隊的每一個使用者102，提供用於所述使用者102的所述經衰減的團隊音訊信號至所述正規化模組310。

所述正規化模組310是被配置以針對於所述團隊的每一個使用者102，從所述衰減模組308接收用於所述使用者102的所述經衰減的團隊音訊信號，並且正規化在所述團隊音訊信號中的每一個其他使用者102的語音。所述正規化模組310是被配置以針對於所述團隊的每一個使用者102，提供所述正規化的團隊音訊信號至所述音調調整模組312。

在各種的實施例中，所述正規化模組310可被配置以平均在所述團隊音訊信號中的其他使用者102的語音的音量，並且根據所述平均音量來正規化每一個其他使用者102的語音的音量(例如，正規化所有其他使用者102b及102c的音量至所述平均音量...等等)，以便幫助確保「大聲的說話者」並不蓋過「輕聲的說話者」。所述正規化模組310在各種的實施例中可以替代或額外地被配置以針對於所述團隊的每一個使用者102，計算在所述團隊音訊信號中的團隊的每一個其他使用者102的語音的音量的標準差，並且根據所述平均音量及/或所述標準差來正規化在所述團隊音訊信號中的每一個其他使用者102的語音。

在各種的實施例中，所述正規化模組310可被配置，以利用在藉由電話控制器200接收到的針對於所述使用者102的向外的音訊信號中的使用者102的語音，來持續地訓練一機器學習模型，使得所述經訓練的模型指出所述使用者102的所述語音的平均音量及/或語音的標準差。所述正規化模組310接著可被配置以針對於所述團隊的每一個使用者102，根據所述經訓練的機器學習模型來正規化在所述團隊音訊信號中的其他使用者102的每一個的語音。

替代或是額外地，所述正規化模組310可被配置以針對於所述團隊的每一個使用者102，動態地箝位或壓縮在所述團隊音訊信號中的其他使用者102的語音，使得所述其他使用者102的語音的最大音量是相同或類似的，以便幫助限制大聲的雜訊(例如，以便若所述第二或第三使用者102b或102c的語音暫時升高等等的話，避免驚嚇及/或打斷所述第一使用者102a)。

所述音調調整模組312是被配置以針對於所述團隊的每一個使用者102，接收針對於所述使用者102的正規化的團隊音訊信號，並且調整一或多個其他使用者102的語音的音調。所述音調調整模組312可被配置以增高或降低每一個其他使用者102的音調，及/或改變所述其他使用者102的每一個的語音的音調，以便於使得在所述團隊音訊信號中的每一個其他使用者102的語音對於所述使用者102而言是更可分辨的。所述音調調整模組312是被配置以針對於所述團隊的每一個使用者102，提供所述音調經調整的團隊音訊信號作為一輸出，以供如同在以下敘述的音訊處理模組202使用。

在各種的實施例中，所述團隊組合模組302、所述音量模組304、所述定位模組306、所述衰減模組308、所述正規化模組310、以及所述音調調整模組312，可以大致被配置以用任意順序或甚至是同時來處理、運算等等如上所述的針對於所述團隊的每一個使用者接收到的向外的音訊信號、以及針對於所述團隊的每一個使用者的團隊音訊信號。再者，一或多個模組可以具有單一模組的形式。

再次參照圖2，所述電話控制器200是被配置以針對於所述團隊的每一個使用者102，根據用於所述使用者102的團隊音訊信號、以及在所述使用者102以及所述對應的遠端的人106之間的會議中的對應的遠端的人106的向外的音訊信號，來產生用於所述使用者102的一向內的音訊信號，使得用於所述使用者102的向內的音訊信號包含所述團隊的每一個其他使用者102的語音、以及所述對應的遠端的人106的語音。所述電話控制器200是被配置以針對於所述團隊的每一個使用者102，經由所述通訊網路104來提供用於所述使用者102的向內的音訊信號至所述使用者102的雙耳頭戴式耳機108。在各種的實施例中，所述電話控制器200是被配置以針對於所述團隊的每一個使用者102，藉由組合用於所述使用者102的團隊音訊信號與針對於對應的遠端的人106的向外的音訊信號，來產生用於所述使用者102的向內的音訊信號。

在各種的實施例中，所述電話控制器200可以進一步包含一入口模組(未顯示在圖2中)。圖4是所述電話控制器200的一範例入口模組400的功能方塊圖。然而，在各種的實施例中，所述入口模組400並不一定需要是所述電話控制器200的部分。例如，所述入口模組400可以是位在所述電話控制器200的遠端，並且經由所述通訊網路104來和所述電話控制器200通訊。再者，儘管圖4僅描繪所述第一使用者102a，但是所述入口模組400類似地被配置以用於所述第二及第三使用者102b及102c。再者，所述入口模組400在各種的實施例中可被配置以支援任意所期望的使用者數量。

在圖4中，所述範例入口模組400是一網路入口模組。所述入口模組400是被配置以對於所述團隊的每一個使用者，提供選項給所述使用者102，以控制用於所述使用者102的團隊的音訊信號及/或用於所述其他使用者102的團隊音訊信號的處理，並且因此控制用於所述使用者102的向內的音訊信號以及用於所述其他使用者102的向內的音訊信號。

在各種的實施方式中，所述入口模組400可被配置以針對於所述團隊的每一個使用者102，經由所述通訊網路104來發送具有用於所述入口模組400的一圖形使用者介面(graphical user interface；GUI)的形式的選項(總體來說，一入口GUI)至和所述使用者102相關的一電腦(例如，一PC、膝上型電腦、行動電話...等等)(例如，具有一或多個網頁的形式...等等)。所述入口GUI接著被配置以針對於所述團隊的每一個使用者102，響應於所述選項從所述使用者102來接收輸入，並且經由所述通訊網路104來發送所述使用者輸入至所述入口模組400。所述入口模組400是被配置以對於所述團隊的每一個使用者，接收使用者輸入，並且提供所述使用者輸入至所述音訊處理模組202。所述音訊處理模組202是被配置以對於所述團隊的每一個使用者，從所述入口模組400接收所述使用者輸入，並且根據所述使用者輸入來控制用於所述團隊的使用者102及/或其他使用者102的團隊音訊信號的處理。

在各種的實施例中，針對於所述團隊的每一個使用者102的處理控制選項可包含一選項給所述使用者，來在用於其他使用者102的團隊音訊信號中靜音其語音，藉此在所述使用者102以及對應的遠端的人106之間的會議中，所述會議是在所述使用者102以及對應的遠端的人之間完全私密的。

在各種的實施例中，所述處理控制選項可包含一選項給每一個使用者102，以在用於所述使用者102的團隊音訊信號中暫時靜音一或多個其他使用者102的語音。

在各種的實施例中，所述處理控制選項可包含一選項給所述使用者102，以訂製用於所述使用者102的麥克風110及/或其他使用者102的麥克風110的注入參數。例如，所述處理控制選項可包含一選項給所述團隊的每一個使用者102，以選擇、指明、定義等等所述團隊的其他使用者102、及/或調整一或多個其他使用者102的語音的音量。

用於每一個使用者102的處理控制選項可包含一選項給所述使用者102，來指明、定義、調整等等所述使用者102在所述虛擬空間之內的虛擬位置、及/或一或多個其他使用者102在所述虛擬空間之內的虛擬位置。

所述處理控制選項可包含選項給每一個使用者102，來施加各種的濾波器至用於所述使用者102及/或所述其他使用者102的團隊音訊信號。例如，這些濾波器可以增高或降低所述使用者102在用於其他使用者的團隊音訊信號中的語音的音調、或是其他使用者102在用於所述使用者102的團隊音訊信號中的語音的音調。

在各種的實施例中，每一個使用者102的雙耳頭戴式耳機108可包含一實體按鈕或開關。所述雙耳頭戴式耳機108可被配置以針對於所述團隊的每一個使用者102，響應於所述使用者102致動所述按鈕或開關，經由所述通訊網路104來發送一靜音信號至所述電話控制器200或是所述音訊處理模組202。所述電話控制器200或是所述音訊處理模組202可被配置，以針對於所述團隊的每一個使用者102接收所述靜音信號，並且響應於所述靜音信號來靜音所述使用者102在用於所述團隊的其他使用者102的團隊音訊信號中的語音。

在此所述的範例實施例可以用任何適當的實施方式來配置，例如在一計算裝置上執行的一瀏覽器客戶外掛、一獨立的應用程式、以一軟體即服務(software-as-a-service；SaaS)實施方式、以一伺服器雲端為基礎的實施方式...等等。

流程圖

圖5是一訊息序列圖表，其在視覺上展示範例信號以及在一團隊會議環境中分配音訊信號所用的處理。所述信號是相關所述使用者102、所述雙耳頭戴式耳機108、所述遠端的人106、所述行動電話114、所述音訊處理模組202、以及所述通訊網路104而被展示及敘述。然而，所述信號並不限於圖1A-4的環境101、電話控制器200、或是任何其它實體。為了說明的緣故，圖1B的範例環境是描述所述使用者102正在個別與所述遠端的人106的談話中。

所述音訊處理模組202從所述團隊成員接收向外的使用者音訊信號-明確地說，來自所述使用者102a的一向外的音訊信號是在502接收到，來自所述使用者102b的一向外的音訊信號是在504接收到，並且來自所述使用者102c的一向外的音訊信號是在506接收到。儘管所述使用者102是為了方便而被展示的，但所述音訊信號本身是藉由其電話，根據來自所述雙耳頭戴式耳機108的麥克風輸入而被產生的。

所述音訊處理模組202亦從所述團隊成員接收向外的遠端音訊信號-明確地說，來自所述遠端的人106a的一向外的音訊信號是在516接收到，來自所述遠端的人106b的一向外的音訊信號是在520接收到，並且來自所述遠端的人106c的一向外的音訊信號是在524接收到。

在528，所述音訊處理模組202指定來自所述使用者102的向外的使用者音訊信號至所述遠端的人106，並且在532、536及540輸出個別的向內的遠端音訊信號至所述遠端的人106。由於在所述使用者102以及所述遠端的人106 之間的談話是一對一的，因此每一個向外的使用者音訊信號是單純被對映至對應的向內的遠端音訊信號。

注意到的是，所述術語「向內的」以及「向外的」是相關利用所述網路的電話通訊而被使用。向內的信號因此是藉由所述電話接收到的信號，以用於透過一揚聲器(例如，透過一手機揚聲器、揚聲電話、頭戴式耳機...等等)輸出至所述使用者。相應地，向外的信號信號是藉由一電話的麥克風(例如，實體位在所述電話上的一麥克風、或是整合到一有線或無線的頭戴式耳機的一麥克風)所獲得的，其被轉移至所述網路以用於處理及/或傳送至另一電話。

在544，所述音訊處理模組202預先處理所述向外的使用者音訊信號，其可包含正規化音量、移除尖脈衝、以及施加校正。例如，所述校正可以使得語音更容易理解、或是移除分心的嘶嘶聲，其例如是利用高音調的濾波器。在各種的實施方式中，所述正規化及校正是對於所述使用者的每一個特別訂製的。例如，設定可以是手動控制的，適應性濾波可加以實施，且/或機器學習模型可加以訓練及採用。

在548，所述音訊處理模組202特別針對於所述使用者102a進一步處理所述預處理的向外的使用者音訊信號-刪除來自所述使用者102a的向外的使用者音訊信號。例如，所述音訊處理模組202可以調整所述向外的使用者音訊信號(來自所述使用者102b以及所述使用者102c)，以將他們設置在相關所述使用者102a的一虛擬的2D或3D空間中。此調整可包含根據在所述其他使用者以及所述使用者102a在所述虛擬空間中的距離來衰減。所述調整亦可以調整所述其他使用者的每一個的音色更高或更低，以協助區別語音。

所述音訊處理模組202組合所述經處理的向外的使用者音訊信號與來自所述遠端的人106a的向外的遠端音訊信號。例如，線性重疊可被用來執行所述組合。在552，此組合的信號是被發送至所述使用者102a以作為一向內的使用者音訊信號。

類似地，在556，所述音訊處理模組202特別針對於所述使用者102b進一步處理所述預處理的向外的使用者音訊信號-刪除來自所述使用者102b的向外的使用者音訊信號。所述音訊處理模組202組合所述經處理的向外的使用者音訊信號與來自所述遠端的人106b的向外的遠端的音訊信號，並且在560，發送此組合的信號至所述使用者102b以作為一向內的使用者音訊信號。

類似地，在564，所述音訊處理模組202特別針對於所述使用者102c進一步處理所述預處理的向外的使用者音訊信號-刪除來自所述使用者102c的向外的使用者音訊信號。所述音訊處理模組202組合所述經處理的向外的使用者音訊信號、與來自所述遠端的人106c的向外的遠端的音訊信號，並且在556發送此組合的信號至所述使用者102c以作為一向內的使用者音訊信號。

此信號處理是反覆地執行以提供音訊內容至所述使用者102以及所述遠端的人106，其像是連續且無縫的。在各種的實施方式中，所述音訊信號具有VoIP封包的形式。在來自所述使用者102a的一向外的封包以及至所述使用者102a的一向內的封包之間並不保證有一對一的對應性。然而，在各種的實施方式中，在504從所述使用者102a接收到的一向外的封包可以在532直接發送至所述遠端的人106a。對於544、548、556及564的預處理及處理而言，所述向外的使用者音訊信號可被重組成為時域資料，並且接著在被轉回離散的封包以用於發送之前以時間系列資料來加以處理。

結論

先前的說明本質上僅為例示性的，且決不旨在限制本揭露內容、其應用或使用。本揭露內容之廣泛教示可以用各種形式來實施。因此，儘管本揭露包含特定例子，但本揭露內容之真實範疇不應如此限制，因為在研究圖式、說明書及以下請求項時，其它修改將變得顯而易見。應理解的是，在不改變本揭露內容之原理下，一種方法中之一或多個步驟可以用不同之順序(或同時)執行。此外，儘管所述實施例的每一個在以上被描述為具有某些特點，但關於本揭露內容之任何實施例所述之那些特點中之任一者或多者可在其它實施例中之任一者之特點中實施及/或與該等特點組合實施，即使該組合沒有被明確闡述。換言之，所述實施例並非相互排斥的，且一或多個實施例彼此之置換仍保持於本揭露內容的範疇內。

在元件之間(例如，在模組之間)的空間及功能關係是利用各種的術語來描述，其包含「連接」、「嚙合」、「介接」以及「耦接」。當在第一及第二元件之間的關係被描述在以上的揭露內容中，除非明確敘述為「直接的」，否則該關係是包含一直接的關係，其中沒有其它介於中間的元件存在於所述第一及第二元件之間，並且亦包含一間接的關係，其中一或多個介於中間的元件存在(在空間或功能上)於所述第一及第二元件之間。所述措辭A、B及C中的至少一個應該被解釋為表示一邏輯(A OR B OR C)，其利用一非互斥邏輯OR，因而不應該被解釋為表示「至少一個A、至少一個B、以及至少一個C」。

在圖式中，如同由箭頭所指出的一箭矢的方向大致是展示所述圖示所關注的資訊(例如資料或指令)的流動。例如，當元件A及元件B交換各種資訊，但從元件A發送至元件B的資訊是相關於所述圖示時，箭頭可以從元件A指向元件B。此單向的箭頭並不意指沒有其它資訊從元件B被發送至元件A。再者，針對於從元件A被傳送至元件B的資訊，元件B可以傳送對於所述資訊的請求、或是所述資訊的確收至元件A。所述術語子集合並不一定需要一真子集合。換言之，一第一集合的一第一子集合可以是與所述第一集合同延的(相等的)。

在此申請案中(包含以下的定義)，所述術語「模組」或是所述術語「控制器」可被所述術語「電路」所取代。所述術語「模組」可以是指執行碼之處理器硬體(共用的、專用的、或是群組)以及儲存藉由所述處理器硬體執行的碼之記憶體硬體(共用的、專用的、或是群組)、其之部分、或是包含其。

所述模組可包含一或多個介面電路。在某些例子中，所述介面電路可以實施有線或無線的介面，其連接至一本地區域網路(local area network；LAN)或是一無線個人區域網路(wireless personal area network；WPAN)。LAN的例子是電機電子工程師學會(IEEE)標準802.11-2016(亦以WIFI無線連網標準著稱)、以及IEEE標準802.3-2015(亦以乙太網路有線的連網標準著稱)。WPAN的例子是IEEE標準802.15.4(包含來自ZigBee聯盟的ZIGBEE標準)、以及來自藍芽技術聯盟(SIG)的藍芽無線連網標準(包含來自所述藍芽SIG的核心規格版本3.0、4.0、4.1、4.2、5.0及5.1)。

所述模組可以利用所述介面電路來和其它模組通訊。儘管所述模組在本揭露內容中可能被描繪為邏輯上直接與其它模組通訊，但在各種的實施方式中，所述模組可以實際上經由一通訊系統來通訊。所述通訊系統包含實體及/或虛擬的連網設備，例如集線器、開關、路由器、以及閘道。在某些實施方式中，所述通訊系統連接至或是橫越一例如是網際網路的廣域網路(wide area network；WAN)。例如，所述通訊系統可包含透過網際網路或是點對點的租用線，利用包含多協定標籤交換(Multiprotocol Label Switch；MPLS)以及虛擬私人網路(virtual private network；VPN)的技術來連接至彼此的多個LAN。

在各種的實施方式中，所述模組的功能可被分散在經由所述通訊系統連接的多個模組之間。例如，多個模組可以實施藉由一負載均衡系統分散的相同的功能。在另一例子中，所述模組的功能可被分開在一伺服器(亦以遠端或雲端著稱)模組以及一客戶(或是使用者)模組之間。例如，所述客戶模組可包含一原生或網路應用程式，其是在一客戶裝置上執行並且和所述伺服器模組網路通訊。

如同在以上所用的，所述術語碼可包含軟體、韌體、及/或微碼，並且可以是指程式、常式、函式、類別、資料結構、及/或物件。共用的處理器硬體包含單一微處理器，其執行來自多個模組的某些或全部的碼。群組的處理器硬體是包含一微處理器，其組合額外的微處理器來執行來自一或多個模組的某些或全部的碼。對於多個微處理器的參照是涵蓋在離散的晶粒上的多個微處理器、在單一晶粒上的多個微處理器、單一微處理器的多個核心、單一微處理器的多個執行緒、或是以上的組合。

共用的記憶體硬體是包含單一記憶體裝置，其儲存來自多個模組的某些或全部的碼。群組的記憶體硬體是包含一記憶體裝置，其組合其它記憶體裝置來儲存來自一或多個模組的某些或全部的碼。

所述術語記憶體硬體是所述術語電腦可讀取的媒體的一子集合。如同在此所用的，所述術語電腦可讀取的媒體並不涵蓋透過一媒體(例如在一載體波上)傳播的暫態的電性或電磁信號；所述術語電腦可讀取的媒體因此被視為實體且非暫態的。非暫態的電腦可讀取的媒體之非限制性的例子是非揮發性記憶體裝置(例如快閃記憶體裝置、可抹除的可程式化唯讀記憶體裝置、或是遮罩唯讀記憶體裝置)、揮發性記憶體裝置(例如靜態隨機存取記憶體裝置或是動態隨機存取記憶體裝置)、磁性儲存媒體(例如類比或數位磁帶或是硬碟機)、以及光學儲存媒體(例如CD、DVD、或是藍光碟片)。

在此申請案中敘述的設備及方法可以部分或完全藉由一特殊用途的電腦來實施，所述電腦是藉由配置一般用途的電腦以執行用電腦程式體現的一或多個特定功能所創造的。上述的功能區塊及流程圖元素是作為軟體規格，其可以藉由熟練的技術員或程式設計者的日常工作而被轉換成為電腦程式。

所述電腦程式包含處理器可執行的指令，其被儲存在至少一非暫態的電腦可讀取的媒體上。所述電腦程式亦可包含或是依賴所儲存的資料。所述電腦程式可以涵蓋一基本輸入/輸出系統(BIOS)，其是和所述特殊用途的電腦的硬體互動、裝置驅動程式，其是和所述特殊用途的電腦的特定裝置互動、一或多個作業系統、使用者應用程式、背景服務、背景應用程式...等等。

所述電腦程式可包含：(i)待解析之描述性文字，例如HTML(超文字標記語言)、XML(可擴展標記語言)、或是JSON(爪哇腳本物件注釋)、(ii)組合語言碼、(iii)從原始碼藉由編譯器產生的目的碼、(iv)用於藉由解譯器執行的原始碼、(v)用於藉由即時編譯器編輯及執行的原始碼...等等。僅作為例示，原始碼可以利用來自包含以下語言之語法來撰寫：C、C++、C#、Objective-C、Swift、Haskell、Go、SQL、R、Lisp、Java®、Fortran、Perl、Pascal、Curl、OCaml、JavaScript®、HTML5(超文字標記語言第五版)、Ada、ASP(動態伺服器頁面)、PHP(PHP：超文字預處理器)、Scala、Eiffel、Smalltalk、Erlang、Ruby、Flash®、VisualBasic®、Lua、MATLAB、SIMULINK、以及Python®。