TW201347507A - 遠程電話會議系統及方法 - Google Patents
遠程電話會議系統及方法 Download PDFInfo
- Publication number
- TW201347507A TW201347507A TW101115724A TW101115724A TW201347507A TW 201347507 A TW201347507 A TW 201347507A TW 101115724 A TW101115724 A TW 101115724A TW 101115724 A TW101115724 A TW 101115724A TW 201347507 A TW201347507 A TW 201347507A
- Authority
- TW
- Taiwan
- Prior art keywords
- sound
- remote
- sources
- module
- far
- Prior art date
Links
Landscapes
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
Abstract
一種遠程電話會議系統,其包括:一遠端麥克風陣列,用以接收遠端聲音;一聲音辨識模組,用以從遠端聲音中辨識出複數個音源;一近端顯示介面,用以顯示該複數個音源;一聲音調整模組,用以分別針對各該音源之一聲音特徵進行調整。
Description
本發明係關於電話會議技術。
遠程電話會議系統是一種商務辨公常見的通訊手段,其能夠使雙方、三方、甚至多方人員不受地域限制的進行溝通。
在遠程電話會議中,就通話的雙方而言,遠端或近端的與會人員皆可能不只一人。某些會議系統會分別為各個與會人員配置專用的麥克風,如此雖可確保每個與會人員的發言可被確實接收,但其身份驗證程序及會議管理機制較為複雜;除此之外,當與會人員的增加時,對麥克風數量的需求即隨之增加,而相鄰麥克風間聲音干擾的情形亦會變得更加嚴重。為了方便電話會議系統之架設,多數的電話會議不會為每個與會人員配置專用的麥克風,而是讓各方所有的與會人員共用相同的麥克風。然而,受限於座位的安排,當與會人員距離麥克風的遠近有所不同時,麥克風的收音效果也會隨之有所不同,如此即減損了雙方通話的品質。
因此需要一種更方便好用的遠程電話會議系統及方法。
本發明提供一種遠程電話會議系統,其包括:一遠端麥克風陣列,設置於遠端,用以接收遠端聲音;一聲音辨識模組,耦接至該遠端麥克風陣列,用以從遠端聲音中辨識出複數個音源;一近端顯示介面,設置於近端,耦接至該聲音辨識模組,用以顯示該聲音辨識模組所辨識出的該複數個音源;一聲音調整模組,耦接至該聲音辨識模組,用以分別針對各該音源之一聲音特徵進行調整。
本發明另提供一種遠程電話會議方法,其包括:以一遠端麥克風陣列接收遠端聲音;從遠端聲音中辨識出複數個音源;以一近端顯示介面顯示所辨識出的該複數個音源;分別針對各該音源之至少一聲音特徵進行調整。
下文為介紹本發明之最佳實施例。各實施例用以說明本發明之原理,但非用以限制本發明。本發明之範圍當以後附之權利要求項為準。
為了使遠程電話會議系統更易於使用,本發明提供一種新式遠程電話會議系統。下文將配合附圖說明本發明之遠程電話會議系統的各種實施例。
遠程電話會議系統
第1圖係依據本發明一實施例之遠程電話會議系統架構示意圖。本發明之遠程電話會議系統100至少包括:一遠端麥克風陣列102、一聲音辨識模組104、一近端顯示介面106、一近端控制介面108、一聲音調整模組110以及一聲音播放模組112。為方便說明,下文的實施例皆以單向通訊為例(即遠端使用者說話、近端使用者收聽),然而,本發明當然不必以此為限,熟悉本技藝人士可輕易將本發明應用在雙向通訊上。同理,本發明不限定於雙方通話之型式,多方通話之型式也在本發明所涵蓋範圍之內。
本發明之遠端麥克風陣列102係設置於遠端,可用以接收遠端聲音。一般而言,麥克風陣列102通常包括兩個或兩個以上的麥克風。本發明的麥克風不限於動圈式、電容式或其他各種類型的麥克風。熟悉本技藝人士可依麥克風數量、各個麥克風之指向性以及會議空間將麥克風陣列102設置於適當位置。舉例而言,在圓桌會議中可採用具有全指向性聲場靈敏度的麥克風陣列,並將其設置於圓桌中心位置。
本發明之聲音辨識模組104不限定設置於遠端或近端,只要能透過有線或無線通訊方式連接至前述遠端麥克風陣列102即可。值得注意的是,本發明之重要特徵即在於本發明之聲音辨識模組104可依據各種既有的聲學演算技術,從麥克風陣列102所取得的混雜的遠端聲音中辨識及分離出複數個各自不同的音源。舉例而言,這些音源即包括各個與會人員的語音,以及各種非語音之雜音。大體來說,聲學演算技術主要可分為聲音方向辨識技術以及音質辨識技術。聲音方向辨識技術可利用麥克風陣列102中各麥克風的位置及靈敏度,計算出各個音源的方向及距離(即音源在空間中的位置);而音質辨識技術則可對各音源之音壓、頻譜及波形進行分析,藉以取得各個音源諸如音量、清晰度、音頻及音質(或稱音色)等聲音特徵,甚至從中判斷各個音源是否為語音、是否為雜音、對說話者的概略性別及年紀加以估測。更詳細地說,由於語音並非持續不斷的聲音,且其音量及音頻皆可能發生變化,因此,在更佳的實施例中,本發明之聲音辨識模組104可持續交叉比對一音源在空間中的位置以及其音質,達到追蹤鎖定該音源之目的。除此之外,在某些實施例中,聲音辨識模組104亦可進行一般性的雜訊過濾及迴聲消除之動作。然而,由於前述聲音處理技術細節非本發明欲強調之重點,且其可由各種既有技術達成,因此,本文不再加以贅述以節省篇幅。
本發明之近端顯示介面106(即螢幕)係設置於近端,其耦接至該聲音辨識模組104,可用以向近端使用者顯示該聲音辨識模組104所辨識出的各個音源,甚至,在某些實施例中,顯示該等音源的各項聲音特徵。舉例而言,在一最簡單的實施例中,近端顯示介面106僅以文字顯示聲音辨識模組104所辨識出的遠端音源,並分別賦與各個既存的音源如「與會者1」、「與會者2」等名稱。每當聲音辨識模組104偵測到遠端有新成員加入時,近端顯示介面106即可將其以醒目文字予以標註。在一較佳的實施例中,近端顯示介面106可以二維或三維畫面模擬遠端會議空間,並依照聲音辨識模組104所偵測到各個音源的所在空間位置之座標,將其標註在虛擬畫面的對應位置之上。其中,各個音源除了有「與會者1」、「與會者2」等名稱之外,尚可附註各種聲音特徵,例如:音量、清晰度、音頻、音質、是否為語音、說話者的性別年紀等相關估測資訊,熟悉本技藝人士可依據本發明之精神自行設計近端顯示介面106所顯示的資訊項目及其顯示風格。值得注意的是,本發明的電話會議技術亦可進一步應用在視訊會議中,而近端顯示介面106亦可同步顯示遠端傳來的實際畫面以代替前述虛擬畫面。透過本發明之近端顯示介面106,近端使用者可輕易掌握遠端的與會情況。
本發明之近端控制介面108係耦接至本發明之聲音調整模組110,可用以接收使用者對聲音調整模組110之控制,而本發明之聲音調整模組110可依據使用者之控制而針對聲音辨識模組104所辨識出的各個音源分別調整其聲音特徵,而聲音特徵即包括:音量、清晰度、音頻及/或音質。舉例而言,近端使用者可透過控制聲音調整模組110而增加某些遠端重要與會人員之音量,或提升其清晰度;同樣的,可降低、甚至濾除某些雜音或非與會人員所發出的語音,藉此強化會議的通話品質。在某些特殊的實施例中,聲音調整模組110甚至可對各個音源進行各種音效處理,包括改變其音頻或音質,達到隱匿說話者身份之目的。本發明之聲音調整模組110不限於設置在近端或遠端,只要能透過有線或無線方式連接至該聲音辨識模組104即可。在較佳的實施例中,聲音調整模組110與聲音辨識模組104可整合於一處理器之中,達到強化聲音處理效能的目的。
最後,本發明之聲音播放模組112係耦接至近端喇吧,可用以播放前述調整聲音特徵後的各個音源。本發明之聲音播放模組112同樣不限於設置在近端或遠端,只要能透過有線或無線方式連接至連接至該聲音調整模組110即可。在較佳的實施例中,聲音播放模組112亦可與聲音調整模組110及聲音辨識模組104整合於一處理器之中。熟悉本技藝人士可了解到,聲音辨識模組104、聲音調整模組110及聲音播放模組112之區別僅為方便說明,任何處理器具有前述模組之功能者皆屬於本發明所涵蓋之範圍之內。
遠程電話會議方法
除了前述的遠程電話會議系統之外,本發明另提供一種遠程電話會議方法。第2圖為依據本發明一實施例之遠程電話會議方法流程圖。該方法200包括:在步驟S202中,以一遠端麥克風陣列接收遠端聲音;在步驟S204中,從遠端聲音中辨識出複數個音源;在步驟S206中,以一近端顯示介面顯示所辨識出的該複數個音源及其聲音特徵;在步驟S208中,分別針對各該音源之至少一聲音特徵進行調整;以及在步驟S210中,播放調整聲音特徵後的該複數個音源。其中,步驟S204可透過聲音方向辨識技術及/或音質辨識技術而從遠端聲音中辨識出該複數個音源,而這些聲音特徵即各個音源的方向、距離、音量、清晰度、音頻及/或音質。由於熟悉本技藝人士可參照前述關於遠程電話會議系統的各個實施例中了解本發明之遠程電話會議方法,故此處將不再贅述其相關細節以節省篇幅。
本發明雖以較佳實施例揭露如上,然其並非用以限定本發明的範圍,任何熟習此項技藝者,在不脫離本發明之精神和範圍內,當可做些許的更動與潤飾,因此本發明之保護範圍當視後附之申請專利範圍所界定者為準。
100...遠程電話會議系統
102...遠端麥克風陣列
104...聲音辨識模組
106...近端顯示介面
108...近端控制介面
110...聲音調整模組
112...聲音播放模組
S202~S210...步驟
第1圖係依據本發明一實施例之遠程電話會議系統架構示意圖。
第2圖為依據本發明一實施例之遠程電話會議方法流程圖。
100...遠程電話會議系統
102...遠端麥克風陣列
104...聲音辨識模組
106...近端顯示介面
108...近端控制介面
110...聲音調整模組
112...聲音播放模組
Claims (11)
- 一種遠程電話會議系統,包括:一聲音辨識模組,用以接收來自一遠端麥克風陣列所接收的一遠端聲音,並自該遠端聲音中辨識出複數個音源;一近端顯示介面,耦接至該聲音辨識模組,用以顯示該聲音辨識模組所辨識出的該複數個音源;以及一聲音調整模組,耦接至該聲音辨識模組,用以分別針對各該音源之一聲音特徵進行調整。
- 如申請專利範圍第1項所述之遠程電話會議系統,更包括:一近端控制介面,耦接至該聲音調整模組,用以接收該使用者對該聲音調整模組之控制。
- 如申請專利範圍第1項所述之遠程電話會議系統,更包括:一聲音播放模組,耦接至該聲音調整模組,用以播放調整聲音特徵後的該複數個音源。
- 如申請專利範圍第1項所述之遠程電話會議系統,其中該聲音辨識模組係透過聲音方向辨識技術與音質辨識技術其中之一從該遠端聲音中辨識出該複數個音源。
- 如申請專利範圍第1項所述之遠程電話會議系統,其中該近端顯示介面更用以顯示該聲音辨識模組所辨識出的該複數個音源之聲音特徵。
- 如申請專利範圍第1項所述之遠程電話會議系統,其中該複數個音源之聲音特徵包括該複數個音源之方向及/或距離。
- 如申請專利範圍第1項所述之遠程電話會議系統,其中該複數個音源之聲音特徵係該複數個音源之音量。
- 如申請專利範圍第1項所述之遠程電話會議系統,其中該複數個音源之聲音特徵包括該複數個音源之清晰度、音頻及/或音質。
- 一種遠程電話會議方法,包括:接收一遠端麥克風陣列的一遠端聲音;從該遠端聲音中辨識出複數個音源;以及以一近端顯示介面顯示所辨識出的該複數個音源;分別針對各該音源之至少一聲音特徵進行調整。
- 如申請專利範圍第9項所述之遠程電話會議方法,更包括:透過聲音方向辨識技術與音質辨識技術其中之一從該遠端聲音中辨識出該複數個音源。
- 如申請專利範圍第9項所述之遠程電話會議方法,其中該複數個音源之聲音特徵包括該複數個音源之方向、距離、音量、清晰度、音頻及音質其中之一。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101115724A TW201347507A (zh) | 2012-05-03 | 2012-05-03 | 遠程電話會議系統及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
TW101115724A TW201347507A (zh) | 2012-05-03 | 2012-05-03 | 遠程電話會議系統及方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
TW201347507A true TW201347507A (zh) | 2013-11-16 |
Family
ID=49990846
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW101115724A TW201347507A (zh) | 2012-05-03 | 2012-05-03 | 遠程電話會議系統及方法 |
Country Status (1)
Country | Link |
---|---|
TW (1) | TW201347507A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109413291A (zh) * | 2018-08-28 | 2019-03-01 | 陈立新 | 分散架构进行电话会议的方法 |
TWI713511B (zh) * | 2015-04-05 | 2020-12-21 | 美商高通公司 | 會議音訊管理 |
-
2012
- 2012-05-03 TW TW101115724A patent/TW201347507A/zh unknown
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI713511B (zh) * | 2015-04-05 | 2020-12-21 | 美商高通公司 | 會議音訊管理 |
US11910344B2 (en) | 2015-04-05 | 2024-02-20 | Qualcomm Incorporated | Conference audio management |
CN109413291A (zh) * | 2018-08-28 | 2019-03-01 | 陈立新 | 分散架构进行电话会议的方法 |
CN109413291B (zh) * | 2018-08-28 | 2021-01-15 | 陈立新 | 分散架构进行电话会议的方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11539844B2 (en) | Audio conferencing using a distributed array of smartphones | |
US11531518B2 (en) | System and method for differentially locating and modifying audio sources | |
US10491809B2 (en) | Optimal view selection method in a video conference | |
US10122972B2 (en) | System and method for localizing a talker using audio and video information | |
JP5857674B2 (ja) | 画像処理装置、及び画像処理システム | |
US9894213B2 (en) | Acoustic echo cancellation for audio system with bring your own devices (BYOD) | |
US20040013252A1 (en) | Method and apparatus for improving listener differentiation of talkers during a conference call | |
CN103220491B (zh) | 用于操作会议系统的方法以及用于会议系统的装置 | |
CN109637528A (zh) | 使用多个语音命令装置的设备和方法 | |
US9973561B2 (en) | Conferencing based on portable multifunction devices | |
CN103685783B (zh) | 信息处理系统和存储介质 | |
EP3751842A1 (en) | Stereoscopic audio to visual sound stage matching in a teleconference | |
US20160006879A1 (en) | Audio Capture and Render Device Having a Visual Display and User Interface for Audio Conferencing | |
JP5526134B2 (ja) | 周辺電話技術システムにおける会話検出 | |
JP7354225B2 (ja) | オーディオ装置、オーディオ配信システム及びその動作方法 | |
US10192566B1 (en) | Noise reduction in an audio system | |
CN103390410A (zh) | 远程电话会议系统及方法 | |
WO2022253003A1 (zh) | 语音增强方法及相关设备 | |
US20100266112A1 (en) | Method and device relating to conferencing | |
TW201347507A (zh) | 遠程電話會議系統及方法 | |
JP5120020B2 (ja) | 画像付音声通信システム、画像付音声通信方法およびプログラム | |
JP2020053882A (ja) | コミュニケーション装置、コミュニケーションプログラム、及びコミュニケーション方法 | |
WO2017211447A1 (en) | Method for reproducing sound signals at a first location for a first participant within a conference with at least two further participants at at least one further location | |
CN112400158B (zh) | 音频装置、音频分配系统和操作其的方法 | |
JP2023043497A (ja) | リモート会議システム |