TWI753741B - 聲源追蹤系統及其方法 - Google Patents

聲源追蹤系統及其方法 Download PDF

Info

Publication number
TWI753741B
TWI753741B TW110100918A TW110100918A TWI753741B TW I753741 B TWI753741 B TW I753741B TW 110100918 A TW110100918 A TW 110100918A TW 110100918 A TW110100918 A TW 110100918A TW I753741 B TWI753741 B TW I753741B
Authority
TW
Taiwan
Prior art keywords
sound
sound source
source tracking
speaker
audio signal
Prior art date
Application number
TW110100918A
Other languages
English (en)
Other versions
TW202227855A (zh
Inventor
蔡敷恩
洪峰文
李昭逸
Original Assignee
圓展科技股份有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 圓展科技股份有限公司 filed Critical 圓展科技股份有限公司
Priority to TW110100918A priority Critical patent/TWI753741B/zh
Priority to US17/572,100 priority patent/US20220223174A1/en
Application granted granted Critical
Publication of TWI753741B publication Critical patent/TWI753741B/zh
Publication of TW202227855A publication Critical patent/TW202227855A/zh

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/93Discriminating between voiced and unvoiced parts of speech signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/141Systems for two-way working between two video terminals, e.g. videophone
    • H04N7/147Communication arrangements, e.g. identifying the communication as a video-communication, intermediate storage of the signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N23/00Cameras or camera modules comprising electronic image sensors; Control thereof
    • H04N23/60Control of cameras or camera modules
    • H04N23/695Control of camera direction for changing a field of view, e.g. pan, tilt or based on tracking of objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一種聲源追蹤方法,適用於視訊會議,包括:從網路取得視訊會議之串流訊號,執行視訊會議程序以從串流訊號中取得音頻訊號並傳送音頻訊號至揚聲器,執行音頻側錄程序以取得視訊會議程序輸出至通訊裝置之音頻訊號並傳送音頻訊號至聲源追蹤攝影機,播放音頻訊號以產生遠端聲音,收錄包含揚聲器播放之遠端聲音及本地端聲音中至少一者之現場聲音,以及依據現場聲音及音頻訊號執行比對程序以決定攝影機之拍攝方向,其中當遠端聲音與音頻訊號之相似度大於閾值時,調整拍攝方向以不拍攝揚聲器。

Description

聲源追蹤系統及其方法
本發明係關於視訊會議中的聲源追蹤,特別是一種避免追蹤揚聲器的聲源追蹤系統及其方法。
常見的聲源追蹤攝影技術係利用麥克風陣列以偵測聲源位置,並計算原本的拍攝方向和聲源位置所在方向之間的變動量(包含平移pan、傾斜tilt、縮放zoom,簡稱PTZ),藉此PTZ攝影機可追蹤發出聲音的人。但在本地端執行視訊會議時,係搭配揚聲器以播放遠端發言者的聲音,因此聲源追蹤攝影機可能誤追蹤到播放遠端聲音的揚聲器而非本地端的發言者。
現有的單體全備(all-in-one)視訊會議裝置係具有處理器、麥克風陣列、揚聲器、攝影機及聲音追蹤模組等模組。這些模組彼此需以實體線路互相連接,故內建於一單體中。All-in-one視訊會議裝置從網路接收到遠端聲音之後可透過揚聲器播放遠端聲音,麥克風陣列錄下本地端發言者的聲音及揚聲器播放的遠端聲音之後,將這些聲音送至聲音追蹤模組。聲音追蹤模組藉由聲學比對過濾掉視訊會議裝置內建的揚聲器的聲音,僅追蹤本地端發言者的聲音,並調整攝影機鏡頭以朝向發言者。
然而,上述的all-in-one視訊會議裝置中通常無法另外連接外部揚聲器。即使可以連接外部揚聲器,也無法讓攝影機避免誤追蹤到播放遠端聲音的外部揚聲器。從另一角度來說,如果揚聲器為獨立裝置,因為沒有實體線路將遠端聲音傳送到聲音追蹤模組,故無法進行回聲消除,更無法達成聲源追蹤。因此,在上述的all-in-one視訊會議裝置中,若內建的揚聲器損壞則必須將整台裝置送去維修,而無法以外接揚聲器的方式繼續使用,如此將造成實際應用上的諸多不便。
有鑑於此,本發明提出一種聲源追蹤系統及其方法,可於視訊會議中用更簡易的設備達到聲源追蹤的目的。
依據本發明一實施例敘述的一種聲源追蹤系統,適用於進行中的視訊會議,聲源追蹤系統包括:處理器、通訊裝置、揚聲器以及聲源追蹤攝影機。處理器用以執行視訊會議程序及音頻側錄程序。視訊會議程序從串流訊號中取得音頻訊號,並控制通訊裝置傳送音頻訊號至揚聲器。音頻側錄程序取得視訊會議程序輸出至通訊裝置之音頻訊號,並控制通訊裝置傳送音頻訊號至聲源追蹤攝影機。通訊裝置電性連接處理器、揚聲器及聲源追蹤攝影機。通訊裝置用以從網路取得視訊會議之串流訊號,傳送音頻訊號至揚聲器及聲源追蹤攝影機。揚聲器播放音頻訊號以產生遠端聲音。聲源追蹤攝影機用以收錄現場聲音,現場聲音包含揚聲器播放之遠端聲音及本地端聲音中至少一者。聲源追蹤攝影機依據現場聲音及音頻訊號執行比對程序以決定攝影機之拍攝方向。
依據本發明一實施例敘述的一種聲源追蹤方法,適用於進行中的一視訊會議,包括:處理器控制通訊裝置從網路取得視訊會議之串流訊號;處理器執行視訊會議程序,視訊會議程序從串流訊號中取得音頻訊號並控制通訊裝置傳送音頻訊號至揚聲器;處理器執行音頻側錄程序,音頻側錄程序取得視訊會議程序輸出至通訊裝置之音頻訊號,並控制通訊裝置傳送音頻訊號至聲源追蹤攝影機;揚聲器播放音頻訊號以產生遠端聲音;聲源追蹤攝影機收錄現場聲音,現場聲音包含揚聲器播放之遠端聲音及本地端聲音中至少一者;以及聲源追蹤攝影機依據現場聲音及音頻訊號執行比對程序以決定攝影機之拍攝方向。
本發明利用獨立的揚聲器及獨立的聲源追蹤器達成all-in-one視訊會議裝置才有的聲源追蹤功能。All-in-one視訊會議裝置由於整合多項設備,因此價格較為昂貴。採用本發明提出的聲源追蹤系統及其方法可以較低的硬體 價格達成聲源追蹤的效果,而且不限定於特定廠牌的硬體設備,在採購視訊會議所需的硬體上更為彈性。
以上之關於本揭露內容之說明及以下之實施方式之說明係用以示範與解釋本發明之精神與原理,並且提供本發明之專利申請範圍更進一步之解釋。
10:聲源追蹤系統
1:處理器
12:視訊會議程序
14:音頻側錄程序
3:通訊裝置
32:第一通訊介面
34:第二通訊介面
36:第三通訊介面
5:揚聲器
7:聲源追蹤攝影機
72:麥克風陣列
74:聲音追蹤電路
76:攝影機
S1~S9:步驟
N:網路
圖1係依據本發明一實施例的聲源追蹤系統繪示的方塊架構圖。
圖2係依據本發明一實施例的聲源追蹤方法繪示的流程圖。
以下在實施方式中詳細敘述本發明之詳細特徵以及優點,其內容足以使任何熟習相關技藝者了解本發明之技術內容並據以實施,且根據本說明書所揭露之內容、申請專利範圍及圖式,任何熟習相關技藝者可輕易地理解本發明相關之目的及優點。以下之實施例係進一步詳細說明本發明之觀點,但非以任何觀點限制本發明之範疇。
本發明提出的聲源追蹤系統及其方法適用於執行視訊會議。請參考圖1。圖1繪示依據本發明一實施例的聲源追蹤系統10。聲源追蹤系統10包括:處理器1、通訊裝置3、揚聲器5以及聲源追蹤攝影機7。以下分別敘述各項元件的構成與其特點。
在一實施例中,處理器1及通訊裝置3係設置於可運行視訊會議軟體(Conference Application)的電腦(Personal Computer)中的硬體元件。所述的電腦例如是桌上型電腦(Desktop Computer),筆記型電腦(Laptop)或平板電腦(Tablet)等。
處理器1用以執行視訊會議程序12及音頻側錄程序14。視訊會議程序12例如是前述的視訊會議軟體。視訊會議程序12從網路N取得而得的串流訊號中擷取影像訊號並取得音頻訊號。所述的影像訊號係進 行遠端會議的本地端用戶被拍攝到的影像資訊,所述的音頻訊號係進行遠端會議的遠端用戶被收錄到的聲音資訊。本發明對於視訊會議程序的發佈者,影像訊號的檔案格式以及音頻訊號的檔案格式並未特別限制。視訊會議程序12控制通訊裝置3將音頻訊號傳送至揚聲器5。
音頻側錄程序14預先偵測揚聲器5的啟用狀態。舉例來說,當通訊裝置3電性連接複數個揚聲器5時,音頻側錄程序14首先確認用於播放的揚聲器5為何者,在用於播放視訊會議聲音的揚聲器5通電啟動之後,音頻側錄程序14取得視訊會議程序12輸出至通訊裝置3之音頻訊號,並控制通訊裝置3傳送音頻訊號至聲源追蹤攝影機7。在一實施例中,音頻側錄程序14例如係自行撰寫的配送應用程式(dispatch application),當運行在作業系統底下的視訊會議程序12透過通訊裝置3傳送音頻訊號至揚聲器5時,音頻側錄程序同時取得此一音頻訊號。
通訊裝置3電性連接處理器1、揚聲器5及聲源追蹤攝影機7。在一實施例中,通訊裝置3包括第一通訊介面32、第二通訊介面34及第三通訊介面36。處理器1透過通訊裝置3的第一通訊介面32電性連接至揚聲器5。第一通訊介面32例如為通訊序列匯流排(Universal Serial Bus,USB)或音源插座(audio jack)。處理器1透過通訊裝置3的第二通訊介面34電性連接至聲源追蹤攝影機7。第二通訊介面34例如為USB。處理器1透過通訊裝置3的第三通訊介面36通訊連接到網路N,第三通訊介面36例如為網路卡、無線網路模組或行動網路模組。本發明對於第一通訊介面32、第二通訊介面34及第三通訊介面36採用的通訊標準並不特別限制。依據運行視訊會議程序12的處理器1的指令,通訊裝置3從網路N取得視訊會議之串流訊號,串流訊號經第三通訊介面36而被傳送到處理器1的視訊會議程序12,視訊會議程序12擷取串流訊號中的音頻訊號後,將此音頻訊號透過第一通訊介面32傳送至揚聲器5。依據運行音頻側錄程序14的處理器1的指令,通訊裝置3的第二通訊介面34傳送音頻訊號至聲 源追蹤攝影機7中的聲音追蹤電路74。
揚聲器5播放音頻訊號以產生遠端聲音。本發明對於揚聲器7的硬體類型或廠牌並不特別限制。
聲源追蹤攝影機7包括麥克風陣列(Microphone array)72、聲音追蹤電路74及具有PTZ功能的攝影機76。聲音追蹤電路74電性連接麥克風陣列72及攝影機76。本發明並不限制聲源追蹤攝影機7是否為單體全備(all-in-one)裝置。在其他實施例中,麥克風陣列72、聲音追蹤電路74及攝影機76亦可以透過實體線路或無線網路彼此連接而採用分離式的設置。
麥克風陣列72用以收錄現場聲音,現場聲音包含揚聲器5播放之遠端聲音及本地端用戶產生的本地端聲音中至少一者。在一實施中,多個位於本地端的用戶可能在同一時間發言,因此所述的本地端聲音中可包含多個用戶的聲音。
聲音追蹤電路74依據現場聲音及音頻訊號執行比對程序以調整攝影機7之拍攝方向。所述的比對程序關聯於回聲抑制消除技術(Acoustic Echo Suppression,AES)或回聲消除技術(Acoustic Echo Cancellation,AEC)。當遠端聲音與音頻訊號之相似度大於閾值時,聲音追蹤電路74調整拍攝方向以不拍攝揚聲器5。具體來說,被調整後的拍攝方向例如朝向一預設方向,或是不改變原本的拍攝方向,本發明對此不予限制。在另一實施例中,聲音追蹤模組74執行聲學比對程序,藉此過濾掉揚聲器5播放的遠端聲音,僅讓攝影機76追蹤本地端(例如會議室內)的發言者的聲音,並且將攝影機76的拍攝視角朝向發言者,進而實現真實人聲的聲源追蹤的功能。若有多名本地端用戶在同一時間發言使得本地端聲音中包含多個用戶的聲音,則聲音追蹤電路74控制攝影機76朝向其中一個本地端的用戶的聲音。若本地端聲音與遠端用戶產生的遠端聲音在同一時間發出,則聲音追蹤電路74控制攝影機76朝向當前本地端用戶的方向, 而不朝向播放遠端聲音的揚聲器5的方向。
請參考圖2。圖2繪示本發明一實施例敘述的聲源追蹤方法的流程圖。所述的聲源追蹤方法適用於進行中的一視訊會議。
請參考步驟S1。處理器1控制通訊裝置3透過第三通訊介面36從網路N取得視訊會議之一串流訊號。
請參考步驟S2。處理器1執行視訊會議程序12,視訊會議程序12從串流訊號中取得音頻訊號並控制通訊裝置3透過第一通訊介面32傳送音頻訊號至揚聲器5。
請參考步驟S3。處理器1執行音頻側錄程序,音頻側錄程序取得視訊會議程序12透過第一通訊介面32輸出至通訊裝置3之音頻訊號,並控制通訊裝置3透過第二通訊介面34傳送音頻訊號至聲源追蹤攝影機7。在另一實施例中,在步驟S2之前,也就是在處理器1開始執行視訊會議程序12之前,音頻側錄程序14預先偵測電性連接至通訊裝置3的揚聲器5,並確認本次視訊會議程序12要用來播放遠端聲音的揚聲器5。
請參考步驟S4。揚聲器5播放音頻訊號以產生遠端聲音。
請參考步驟S5。聲源追蹤攝影機7之麥克風陣列72收錄現場聲音。現場聲音包含揚聲器播放之遠端聲音及一本地端聲音中至少一者。請參考圖1。本地端聲音由本地端用戶產生。在實際視訊會議進行中,本地端用戶發言時,麥克風陣列72可收錄到其產生的本地端聲音。
請參考步驟S6。聲源追蹤攝影機7之聲音追蹤電路74依據現場聲音及音頻訊號執行一比對程序以調整攝影機7之拍攝方向;其中,當遠端聲音與音頻訊號之相似度大於一閾值時,聲音追蹤電路74調整拍攝方向以不拍攝揚聲器5。具體而言,所調整的拍攝方向例如朝向攝影機7啟動時的預設方向,或是維持先前的拍攝方向。
綜上所述,本發明提出的聲源追蹤系統及其方法係利用獨立的揚聲器及獨立的聲源追蹤器達成all-in-one視訊會議裝置才有的聲源追蹤功能。 All-in-one視訊會議裝置由於整合多項設備,因此價格較為昂貴。採用本發明提出的聲源追蹤系統及其方法可以較低的硬體價格達成聲源追蹤的效果,而且不限定於特定廠牌的硬體設備,在採購視訊會議所需的硬體上更為彈性。
雖然本發明以前述之實施例揭露如上,然其並非用以限定本發明。在不脫離本發明之精神和範圍內,所為之更動與潤飾,均屬本發明之專利保護範圍。關於本發明所界定之保護範圍請參考所附之申請專利範圍。
S1~S6:步驟

Claims (10)

  1. 一種聲源追蹤系統,適用於進行中的一視訊會議,該聲源追蹤系統包括:一處理器、一通訊裝置、一揚聲器及一聲源追蹤攝影機;其中,該處理器用以執行一視訊會議程序及一音頻側錄程序,其中該視訊會議程序從一串流訊號中取得一音頻訊號,並控制該通訊裝置傳送該音頻訊號至該揚聲器;該音頻側錄程序取得該視訊會議程序輸出之該音頻訊號,並控制該通訊裝置傳送該音頻訊號至該聲源追蹤攝影機;該通訊裝置電性連接該處理器、該揚聲器及該聲源追蹤攝影機,該通訊裝置用以從網路取得該視訊會議之該串流訊號,且傳送該音頻訊號至該揚聲器及該聲源追蹤攝影機;該揚聲器播放該音頻訊號以產生一遠端聲音;該聲源追蹤攝影機用以收錄一現場聲音,該現場聲音包含該揚聲器播放之該遠端聲音及一本地端聲音中至少一者;該聲源追蹤攝影機依據該現場聲音及該音頻訊號執行一比對程序以決定該攝影機之一拍攝方向。
  2. 如請求項1所述的聲源追蹤系統,其中該比對程序包括:當該現場聲音中之該遠端聲音與該音頻訊號之相似度大於一閾值時,該聲源追蹤攝影機調整該拍攝方向以不拍攝該揚聲器。
  3. 如請求項1所述的聲源追蹤系統,其中該音頻側錄程序更用以在擷取該音頻訊號之前,偵測該揚聲器之啟用狀態。
  4. 如請求項1所述的聲源追蹤系統,其中該通訊裝置透過通用序列匯流排電性連接該聲源追蹤攝影機。
  5. 如請求項1所述的聲源追蹤系統,其中該通訊裝置透過通用序列匯流排電性連接該揚聲器。
  6. 一種聲源追蹤方法,適用於進行中的一視訊會議,包括:以一處理器控制一通訊裝置從網路取得該視訊會議之一串流訊號;以該處理器執行一視訊會議程序,該視訊會議程序從該串流訊號中取得一音頻訊號,並控制該通訊裝置傳送該音頻訊號至一揚聲器;以該處理器執行一音頻側錄程序,該音頻側錄程序取得該視訊會議程序輸出至該通訊裝置之該音頻訊號,並控制該通訊裝置傳送該音頻訊號至一聲源追蹤攝影機;以該揚聲器播放該音頻訊號以產生一遠端聲音;以該聲源追蹤攝影機收錄一現場聲音,該現場聲音包含該揚聲器播放之該遠端聲音及一本地端聲音中至少一者;以及以該聲源追蹤攝影機依據該現場聲音及該音頻訊號執行一比對程序以決定該攝影機之一拍攝方向。
  7. 如請求項6所述的聲源追蹤方法,其中該比對程序包括:當該現場聲音中之該遠端聲音與該音頻訊號之相似度大於一閾值時,該聲源追蹤攝影機調整該拍攝方向以不拍攝該揚聲器。
  8. 如請求項6所述的聲源追蹤方法,其中該音頻側錄程序更用以在擷取該音頻訊號之前,偵測該揚聲器之啟用狀態。
  9. 如請求項6所述的聲源追蹤方法,其中該通訊裝置透過通用序列匯流排電性連接該聲源追蹤攝影機。
  10. 如請求項6所述的聲源追蹤方法,其中該通訊裝置透過通用序列匯流排電性連接該揚聲器。
TW110100918A 2021-01-11 2021-01-11 聲源追蹤系統及其方法 TWI753741B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
TW110100918A TWI753741B (zh) 2021-01-11 2021-01-11 聲源追蹤系統及其方法
US17/572,100 US20220223174A1 (en) 2021-01-11 2022-01-10 Sound source tracking system and method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW110100918A TWI753741B (zh) 2021-01-11 2021-01-11 聲源追蹤系統及其方法

Publications (2)

Publication Number Publication Date
TWI753741B true TWI753741B (zh) 2022-01-21
TW202227855A TW202227855A (zh) 2022-07-16

Family

ID=80809087

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110100918A TWI753741B (zh) 2021-01-11 2021-01-11 聲源追蹤系統及其方法

Country Status (2)

Country Link
US (1) US20220223174A1 (zh)
TW (1) TWI753741B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI799165B (zh) * 2022-03-04 2023-04-11 圓展科技股份有限公司 拍攝發聲目標的系統及方法

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080013786A1 (en) * 2006-07-11 2008-01-17 Compal Electronics, Inc. Method of tracking vocal target
CN101345858A (zh) * 2008-08-18 2009-01-14 天津市亚安科技电子有限公司 自动追踪声源的云台摄像机
CN100551028C (zh) * 2003-05-08 2009-10-14 坦德伯格电信公司 用于音源追踪的装置和方法
TW201001045A (en) * 2008-06-27 2010-01-01 Hon Hai Prec Ind Co Ltd Imaging device capable of auto-tracking sound source
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
TWM594202U (zh) * 2019-10-21 2020-04-21 大陸商南京深視光點科技有限公司 發言人員音訊追蹤系統

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070263848A1 (en) * 2006-04-19 2007-11-15 Tellabs Operations, Inc. Echo detection and delay estimation using a pattern recognition approach and cepstral correlation
US8219387B2 (en) * 2007-12-10 2012-07-10 Microsoft Corporation Identifying far-end sound
US9385779B2 (en) * 2013-10-21 2016-07-05 Cisco Technology, Inc. Acoustic echo control for automated speaker tracking systems
US10187579B1 (en) * 2017-06-30 2019-01-22 Polycom, Inc. People detection method for auto-framing and tracking in a video conference
US10621981B2 (en) * 2017-09-28 2020-04-14 Sonos, Inc. Tone interference cancellation
US11404073B1 (en) * 2018-12-13 2022-08-02 Amazon Technologies, Inc. Methods for detecting double-talk
CN112307848B (zh) * 2019-08-01 2024-04-30 惠普发展公司,有限责任合伙企业 检测视频会议中的欺骗说话者

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100551028C (zh) * 2003-05-08 2009-10-14 坦德伯格电信公司 用于音源追踪的装置和方法
US20080013786A1 (en) * 2006-07-11 2008-01-17 Compal Electronics, Inc. Method of tracking vocal target
TW201001045A (en) * 2008-06-27 2010-01-01 Hon Hai Prec Ind Co Ltd Imaging device capable of auto-tracking sound source
CN101345858A (zh) * 2008-08-18 2009-01-14 天津市亚安科技电子有限公司 自动追踪声源的云台摄像机
CN102256098A (zh) * 2010-05-18 2011-11-23 宝利通公司 具有多个语音跟踪摄像机的视频会议端点
TWM594202U (zh) * 2019-10-21 2020-04-21 大陸商南京深視光點科技有限公司 發言人員音訊追蹤系統

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI799165B (zh) * 2022-03-04 2023-04-11 圓展科技股份有限公司 拍攝發聲目標的系統及方法

Also Published As

Publication number Publication date
US20220223174A1 (en) 2022-07-14
TW202227855A (zh) 2022-07-16

Similar Documents

Publication Publication Date Title
JP6785908B2 (ja) カメラ撮影制御方法、装置、インテリジェント装置および記憶媒体
US11418758B2 (en) Multiple simultaneous framing alternatives using speaker tracking
US10848889B2 (en) Intelligent audio rendering for video recording
US8441515B2 (en) Method and apparatus for minimizing acoustic echo in video conferencing
KR19980072931A (ko) 화상회의 시스템의 카메라/마이크 장치
CN102998880A (zh) 带摄像功能的投影仪及拍摄方法
TWI753741B (zh) 聲源追蹤系統及其方法
WO2012034329A1 (zh) 视频通话中视频录制的方法及装置
CN107087208B (zh) 一种全景视频播放方法、系统及存储装置
JP2019176386A (ja) 通信端末及び会議システム
TWI783344B (zh) 聲源追蹤系統及其方法
US10993064B2 (en) Apparatus and associated methods for presentation of audio content
JP5340880B2 (ja) 遠隔会話システムの出力制御装置、その方法、およびコンピュータが実行可能なプログラム
TWI749391B (zh) 視訊會議系統以及視訊會議方法
JP2007251355A (ja) 対話システム用中継装置、対話システム、対話方法
JP6191333B2 (ja) 情報処理装置、通信システムおよびプログラム
CN114531425A (zh) 一种处理方法和处理装置
JP7361460B2 (ja) コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法
KR20100006029A (ko) 원격 화상회의시스템
JP2009065490A (ja) テレビ会議装置
TWI799048B (zh) 環景影像會議系統及方法
TWI709337B (zh) 攝錄系統
WO2023103671A1 (zh) 一种会议设备、数据处理方法和会议系统
JP5391175B2 (ja) 遠隔会議方法、遠隔会議システム及び遠隔会議プログラム
CN107786834A (zh) 用于视频会议系统中的摄像机底座及其方法