JPH07200424A - 音声会議システム及びその制御方法 - Google Patents
音声会議システム及びその制御方法Info
- Publication number
- JPH07200424A JPH07200424A JP6256409A JP25640994A JPH07200424A JP H07200424 A JPH07200424 A JP H07200424A JP 6256409 A JP6256409 A JP 6256409A JP 25640994 A JP25640994 A JP 25640994A JP H07200424 A JPH07200424 A JP H07200424A
- Authority
- JP
- Japan
- Prior art keywords
- audio
- audio input
- computer workstation
- samples
- digital
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 25
- 230000000007 visual effect Effects 0.000 claims description 30
- 230000004044 response Effects 0.000 claims description 12
- 230000002401 inhibitory effect Effects 0.000 claims description 2
- 230000008859 change Effects 0.000 abstract description 3
- 230000005236 sound signal Effects 0.000 description 16
- 230000005540 biological transmission Effects 0.000 description 12
- 238000004891 communication Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 8
- 230000000875 corresponding effect Effects 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 230000003139 buffering effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000005070 sampling Methods 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 238000012952 Resampling Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000002079 cooperative effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- SDJLVPMBBFRBLL-UHFFFAOYSA-N dsp-4 Chemical compound ClCCN(CC)CC1=CC=CC=C1Br SDJLVPMBBFRBLL-UHFFFAOYSA-N 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/16—Arrangements for providing special services to substations
- H04L12/18—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast
- H04L12/1813—Arrangements for providing special services to substations for broadcast or conference, e.g. multicast for computer conferences, e.g. chat rooms
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/10—Architectures or entities
- H04L65/1059—End-user terminal functionalities specially adapted for real-time communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/1066—Session management
- H04L65/1083—In-session procedures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/60—Network streaming of media packets
- H04L65/61—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio
- H04L65/613—Network streaming of media packets for supporting one-way streaming services, e.g. Internet radio for the control of the source by the destination
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/567—Multimedia conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/568—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/42136—Administration or customisation of services
- H04M3/42153—Administration or customisation of services by subscriber
- H04M3/42161—Administration or customisation of services by subscriber via computer interface
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Telephonic Communication Services (AREA)
Abstract
(57)【要約】
【目的】 ネットワークに接続されて、ネットワークか
ら各々がデジタル音声サンプルのシーケンスを含む多重
音声入力ストリームを受信するコンピュータ・ワークス
テーションを提供する。 【構成】 コンピュータ・ワークステーションが音声会
議において、ネットワークを介して多重音声入力ストリ
ームを受信する。音声入力ストリームが異なるキューに
記憶され、別々に保持される。各キューからのデジタル
・サンプルは音声アダプタ・カード28に転送されて出
力される。音声アダプタ・カード28上のデジタル信号
プロセッサ46は、各音声ストリームをその固有の重み
パラメータにより乗算し、その後音声ストリームが合計
されて出力される。ユーザは各音声入力ストリームのボ
リュームを独立に見ることができ、重みパラメータの調
整により相対ボリュームを変更することができる。
ら各々がデジタル音声サンプルのシーケンスを含む多重
音声入力ストリームを受信するコンピュータ・ワークス
テーションを提供する。 【構成】 コンピュータ・ワークステーションが音声会
議において、ネットワークを介して多重音声入力ストリ
ームを受信する。音声入力ストリームが異なるキューに
記憶され、別々に保持される。各キューからのデジタル
・サンプルは音声アダプタ・カード28に転送されて出
力される。音声アダプタ・カード28上のデジタル信号
プロセッサ46は、各音声ストリームをその固有の重み
パラメータにより乗算し、その後音声ストリームが合計
されて出力される。ユーザは各音声入力ストリームのボ
リュームを独立に見ることができ、重みパラメータの調
整により相対ボリュームを変更することができる。
Description
【0001】
【産業上の利用分野】本発明はネットワーク上で受信さ
れる音声データの多重ストリームのコンピュータ・ワー
クステーションによる処理に関する。
れる音声データの多重ストリームのコンピュータ・ワー
クステーションによる処理に関する。
【0002】
【従来の技術】従来、音声信号は標準のアナログ電話回
線を介して伝送された。しかしながら、ローカル・エリ
ア・ネットワーク(LAN)により提供されるロケーシ
ョンの増加及びマルチメディア通信の重要性の増大に伴
い、音声信号を伝送するためにLANの使用が大きく注
目されている。この作業は例えばD Cohenによる"UsingL
ocal Area Networks for Carrying Online Voice"(pag
e 13-21)及びP Ravasio、R Marcogliese及びR Novares
eによる"Voice Transmission over an EthernetBackbon
e"(page 39-65)で述べられている(両方とも"Local C
omputer Networks"(P Ravasio、G Hopkins及びN Naffa
h編集;北オランダ、1982年)に記載)。こうした
方法の基本原理は、第1の端末またはワークステーショ
ンが音声入力信号を規定レート(例えば8kHz)によ
りデジタル信号にサンプリングする。多数のサンプリン
グされたデジタル信号(以下単にサンプルという)が次
にデータ・パケットにアセンブルされ、第2の端末にネ
ットワークを介して伝送され、これが次に再度一定のレ
ートにより、サンプルをラウドスピーカその他の再生装
置に供給する。
線を介して伝送された。しかしながら、ローカル・エリ
ア・ネットワーク(LAN)により提供されるロケーシ
ョンの増加及びマルチメディア通信の重要性の増大に伴
い、音声信号を伝送するためにLANの使用が大きく注
目されている。この作業は例えばD Cohenによる"UsingL
ocal Area Networks for Carrying Online Voice"(pag
e 13-21)及びP Ravasio、R Marcogliese及びR Novares
eによる"Voice Transmission over an EthernetBackbon
e"(page 39-65)で述べられている(両方とも"Local C
omputer Networks"(P Ravasio、G Hopkins及びN Naffa
h編集;北オランダ、1982年)に記載)。こうした
方法の基本原理は、第1の端末またはワークステーショ
ンが音声入力信号を規定レート(例えば8kHz)によ
りデジタル信号にサンプリングする。多数のサンプリン
グされたデジタル信号(以下単にサンプルという)が次
にデータ・パケットにアセンブルされ、第2の端末にネ
ットワークを介して伝送され、これが次に再度一定のレ
ートにより、サンプルをラウドスピーカその他の再生装
置に供給する。
【0003】音声データを伝送するためにLANを使用
する1つの問題は、ネットワークを横断する伝送時間が
変動することである。宛先ノードにおけるパケットの到
来は遅延され不規則である。パケットが不規則に再生さ
れると、これは音声信号の理解度に著しい悪影響を及ぼ
す。従って、LANによる音声伝送方式では、受信側に
おいてある程度のバッファリングを使用し、こうした不
規則性を吸収する。オリジナル音声信号と宛先側におけ
る音声出力との間に、自然な対話式双方向通信を困難に
するような余りに大きな遅延を招かないように注意が必
要である(大西洋を横断する従来の電話呼出しの過度な
遅延が聞きずらかったように)。最大許容値よりも遅く
到来するパケットが捨てられるシステムが、B Aldred、
R Bowater及びS Woodmanによる"Adaptive Audio Playou
t Algorithm for Shared PacketNetworks"(IBM Techni
cal Disclosure Bulletine、p 255-257、Vol 36 No 4、
1993年4月)で述べられている。バッファリングの
量は捨てられるパケットの数に依存して適切に制御され
る(任意の他の適切な遅延測定が使用可能である)。捨
てられるパケットの数が大きいとバッファリングの度合
いが増加し、捨てられるパケットの数が小さいとバッフ
ァリングの度合いが減少する。バッファのサイズは、再
生レートを一時的に変更することにより変更される(こ
れはピッチに影響し、簡易な技術では無音の期間を検出
し、人為的にそれらを適度に増減する)。
する1つの問題は、ネットワークを横断する伝送時間が
変動することである。宛先ノードにおけるパケットの到
来は遅延され不規則である。パケットが不規則に再生さ
れると、これは音声信号の理解度に著しい悪影響を及ぼ
す。従って、LANによる音声伝送方式では、受信側に
おいてある程度のバッファリングを使用し、こうした不
規則性を吸収する。オリジナル音声信号と宛先側におけ
る音声出力との間に、自然な対話式双方向通信を困難に
するような余りに大きな遅延を招かないように注意が必
要である(大西洋を横断する従来の電話呼出しの過度な
遅延が聞きずらかったように)。最大許容値よりも遅く
到来するパケットが捨てられるシステムが、B Aldred、
R Bowater及びS Woodmanによる"Adaptive Audio Playou
t Algorithm for Shared PacketNetworks"(IBM Techni
cal Disclosure Bulletine、p 255-257、Vol 36 No 4、
1993年4月)で述べられている。バッファリングの
量は捨てられるパケットの数に依存して適切に制御され
る(任意の他の適切な遅延測定が使用可能である)。捨
てられるパケットの数が大きいとバッファリングの度合
いが増加し、捨てられるパケットの数が小さいとバッフ
ァリングの度合いが減少する。バッファのサイズは、再
生レートを一時的に変更することにより変更される(こ
れはピッチに影響し、簡易な技術では無音の期間を検出
し、人為的にそれらを適度に増減する)。
【0004】音声通信の別の重要な態様は、双方向また
はポイント間の通信とは対照的なマルチポイント通信を
含む会議である。従来のアナログ電話回線上で実施され
る場合、音声会議は各参加者が音声信号を中央ハブに送
信することを要求する。中央ハブは入力信号を混合し、
可能であれば異なるレベル間を調整し、各参加者に他の
全ての参加者からの信号の合計(その参加者のノードか
らの信号を除く)を送信する。米国特許第465092
9号は、個人が他の参加者の相対ボリュームを調整可能
な集中型ビデオ/音声会議システムを開示する。
はポイント間の通信とは対照的なマルチポイント通信を
含む会議である。従来のアナログ電話回線上で実施され
る場合、音声会議は各参加者が音声信号を中央ハブに送
信することを要求する。中央ハブは入力信号を混合し、
可能であれば異なるレベル間を調整し、各参加者に他の
全ての参加者からの信号の合計(その参加者のノードか
らの信号を除く)を送信する。米国特許第465092
9号は、個人が他の参加者の相対ボリュームを調整可能
な集中型ビデオ/音声会議システムを開示する。
【0005】集中型混合ノードの使用は、しばしばマル
チポイント制御ユニット(MCU)として参照され、幾
つかのマルチメディア(音声並びにビデオ)・ワークス
テーション会議システムに組込まれる。例えば、米国特
許第4710917号は、各参加者が中央混合ユニット
に音声を送信し、そこから音声を受信するマルチメディ
ア会議システムについて述べている。他のマルチメディ
ア会議システムが、KWatabe、S Sakata、K Maeno、H Fu
kuoka及びT Ohmoriによる"Distributed Multiparty Des
ktop Conferencing System:MERMAID"(CSCW '90(Proc
eeding of theconference on Computer-Supported Coop
erative Work、1990年、Los Angeles)、p27-38)
及びE Addeo、A Gelman及びA Dayaoによる"Personal Mu
ltimedia Multipoint Communications Services for Br
oadband Networks"(Vol 1、IEEE GLOBECOM、1988
年)で述べられている。
チポイント制御ユニット(MCU)として参照され、幾
つかのマルチメディア(音声並びにビデオ)・ワークス
テーション会議システムに組込まれる。例えば、米国特
許第4710917号は、各参加者が中央混合ユニット
に音声を送信し、そこから音声を受信するマルチメディ
ア会議システムについて述べている。他のマルチメディ
ア会議システムが、KWatabe、S Sakata、K Maeno、H Fu
kuoka及びT Ohmoriによる"Distributed Multiparty Des
ktop Conferencing System:MERMAID"(CSCW '90(Proc
eeding of theconference on Computer-Supported Coop
erative Work、1990年、Los Angeles)、p27-38)
及びE Addeo、A Gelman及びA Dayaoによる"Personal Mu
ltimedia Multipoint Communications Services for Br
oadband Networks"(Vol 1、IEEE GLOBECOM、1988
年)で述べられている。
【0006】しかしながら、集中型MCUまたは合計ノ
ードの使用は幾つかの欠点を有する。第1に、ほとんど
のLANのアーキテクチャはピア・ツー・ピアの構成を
基本とするので、明らかな中央ノードが存在しない。更
にシステムは、会議を動作するために指定される中央ノ
ードの継続的使用可能性に総合的に依存する。エコー抑
制の問題も存在する(中央ノードはあるノードにプレイ
バックされる合計信号内に、そのノードからの音声信号
を含まないように注意しなければならない)。
ードの使用は幾つかの欠点を有する。第1に、ほとんど
のLANのアーキテクチャはピア・ツー・ピアの構成を
基本とするので、明らかな中央ノードが存在しない。更
にシステムは、会議を動作するために指定される中央ノ
ードの継続的使用可能性に総合的に依存する。エコー抑
制の問題も存在する(中央ノードはあるノードにプレイ
バックされる合計信号内に、そのノードからの音声信号
を含まないように注意しなければならない)。
【0007】これらの問題は分散音声会議システムの使
用により回避され、そこでは各ノードは会議に参加する
あらゆる他のノードから、別々の音声信号を受信する。
米国特許第5127001号はこうした分散システムに
ついて述べており、ネットワークを横断するパケットの
変動する通過時間により生じる同期問題に触れている。
米国特許第5127001号は、各出所ノードからの入
力音声パケットの別々のキューを保持することにより、
この問題を克服する。これらはポイント間通信において
上述されたのと同様の方法により、到来時刻におけるジ
ッタ(遅れ)を効果的に吸収する。規則的な間隔におい
て、各キューから1パケットが読出されることにより音
声パケットのセットが読出され、再生のために合計され
る。
用により回避され、そこでは各ノードは会議に参加する
あらゆる他のノードから、別々の音声信号を受信する。
米国特許第5127001号はこうした分散システムに
ついて述べており、ネットワークを横断するパケットの
変動する通過時間により生じる同期問題に触れている。
米国特許第5127001号は、各出所ノードからの入
力音声パケットの別々のキューを保持することにより、
この問題を克服する。これらはポイント間通信において
上述されたのと同様の方法により、到来時刻におけるジ
ッタ(遅れ)を効果的に吸収する。規則的な間隔におい
て、各キューから1パケットが読出されることにより音
声パケットのセットが読出され、再生のために合計され
る。
【0008】音声会議システムの1つの問題は、上述の
MERMAID システムにおいて発見されるように、任意の瞬
間において誰が話しているかを決定することである。米
国特許第4893326号は、各ワークステーションが
そのユーザが話しているかどうかを自動的に検出するマ
ルチメディア会議システムについて述べている。この情
報は次に中央制御ノードに供給され、中央制御ノードは
各参加者が現話し手を彼らの画面上で見ることができる
ようにビデオを交換する。こうしたシステムはビデオ及
び音声機能の両方の動作を要求し、更に中央ビデオ交換
ノードに頼るため、完全な分散システムでは使用するこ
とができない。
MERMAID システムにおいて発見されるように、任意の瞬
間において誰が話しているかを決定することである。米
国特許第4893326号は、各ワークステーションが
そのユーザが話しているかどうかを自動的に検出するマ
ルチメディア会議システムについて述べている。この情
報は次に中央制御ノードに供給され、中央制御ノードは
各参加者が現話し手を彼らの画面上で見ることができる
ようにビデオを交換する。こうしたシステムはビデオ及
び音声機能の両方の動作を要求し、更に中央ビデオ交換
ノードに頼るため、完全な分散システムでは使用するこ
とができない。
【0009】分散マルチメディア会議システムが、H Ta
nigawa、T Arikawa、S Masaki 及びK Shimamuraによる"
Personal Multimedia-Multipoint Teleconference Syst
em"(IEEE INFOCOM 91、Proceedings Vol 3、p1127-113
4)で述べられている。このシステムは、会議参加者か
らのビデオ信号を含むウィンドウが画面を横断して右か
ら左に移動される時、対応する音声信号の見掛けの出所
が同様に移動するというステレオ・ワークステーション
のための音の局所化を実現する。このアプローチは、話
し手の識別に対する限られた支援を提供する。より包含
的な機構が特開平02−第123886号で述べられて
おり、そこでは音の出所のビデオを含む近傍のウィンド
ウに関連する出力音声レベルを示すために、棒グラフが
使用される。
nigawa、T Arikawa、S Masaki 及びK Shimamuraによる"
Personal Multimedia-Multipoint Teleconference Syst
em"(IEEE INFOCOM 91、Proceedings Vol 3、p1127-113
4)で述べられている。このシステムは、会議参加者か
らのビデオ信号を含むウィンドウが画面を横断して右か
ら左に移動される時、対応する音声信号の見掛けの出所
が同様に移動するというステレオ・ワークステーション
のための音の局所化を実現する。このアプローチは、話
し手の識別に対する限られた支援を提供する。より包含
的な機構が特開平02−第123886号で述べられて
おり、そこでは音の出所のビデオを含む近傍のウィンド
ウに関連する出力音声レベルを示すために、棒グラフが
使用される。
【0010】
【発明が解決しようとする課題】この様に、従来技術は
様々な音声会議システムについて述べている。従来の集
中型電話音声会議は普及しており、技術的観点からはよ
く理解されているが、デスク・トップ環境における音声
会議の性能を向上させるためには、実施されなければな
らない多くの課題が残っている。
様々な音声会議システムについて述べている。従来の集
中型電話音声会議は普及しており、技術的観点からはよ
く理解されているが、デスク・トップ環境における音声
会議の性能を向上させるためには、実施されなければな
らない多くの課題が残っている。
【0011】
【課題を解決するための手段】従って、本発明はネット
ワークに接続し、ネットワークから各々がデジタル音声
サンプルのシーケンスを含む多重音声入力ストリームを
受信するコンピュータ・ワークステーションを提供す
る。このワークステーションは各音声入力ストリームか
らのデジタル音声サンプルを別々のキューに記憶する手
段、各キューから1つずつのデジタル音声サンプルを含
むセットのシーケンスを形成する手段、各音声入力スト
リームが関連する重みパラメータを有し、デジタル音声
サンプルの各セットの加重合計を生成する手段、加重合
計のシーケンスから音声出力を生成する手段を含み、ユ
ーザ入力に応答して多重音声ストリームの音声出力内の
相対ボリュームを制御するために、前記重みパラメータ
を調整する手段により特徴化される。
ワークに接続し、ネットワークから各々がデジタル音声
サンプルのシーケンスを含む多重音声入力ストリームを
受信するコンピュータ・ワークステーションを提供す
る。このワークステーションは各音声入力ストリームか
らのデジタル音声サンプルを別々のキューに記憶する手
段、各キューから1つずつのデジタル音声サンプルを含
むセットのシーケンスを形成する手段、各音声入力スト
リームが関連する重みパラメータを有し、デジタル音声
サンプルの各セットの加重合計を生成する手段、加重合
計のシーケンスから音声出力を生成する手段を含み、ユ
ーザ入力に応答して多重音声ストリームの音声出力内の
相対ボリュームを制御するために、前記重みパラメータ
を調整する手段により特徴化される。
【0012】本発明は、各ノードが他の全ての参加者か
ら別々の音声ストリームを受信する分散ネットワーク上
の音声会議の提供が、従来の集中型会議システムにおい
て大きな困難とコストを費やして達成された付加的機能
を、自然に可能とすることを認識する。特に各ユーザは
自身の好みにより、他の全ての参加者の相対ボリューム
を調整可能である。これは例えば会議の特定の局面に注
目する場合、或いは言語問題などにおいて非常に有望で
ある(例えば、ある人間が他人が理解できないような強
いアクセントを有していたり、会議が同時通訳を有する
場合など)。更に会議中にも、本システムはユーザ入力
に応答して異なる参加者の相対ボリュームを変更する。
この制御を可能とするために、入力音声信号が別々に保
持され、それらの出所に従い異なるキューに配置され
(キューは物理的には隣接していたり結合されたりする
が、論理的には別々の記憶である)、その後、適切なボ
リューム制御ファクタにより重み付けされる。次にそれ
らは最終音声出力を生成するために結合される。本発明
は、分散音声会議システムが相対ボリュームの個々の制
御の提供に特に好適であることを認識する。
ら別々の音声ストリームを受信する分散ネットワーク上
の音声会議の提供が、従来の集中型会議システムにおい
て大きな困難とコストを費やして達成された付加的機能
を、自然に可能とすることを認識する。特に各ユーザは
自身の好みにより、他の全ての参加者の相対ボリューム
を調整可能である。これは例えば会議の特定の局面に注
目する場合、或いは言語問題などにおいて非常に有望で
ある(例えば、ある人間が他人が理解できないような強
いアクセントを有していたり、会議が同時通訳を有する
場合など)。更に会議中にも、本システムはユーザ入力
に応答して異なる参加者の相対ボリュームを変更する。
この制御を可能とするために、入力音声信号が別々に保
持され、それらの出所に従い異なるキューに配置され
(キューは物理的には隣接していたり結合されたりする
が、論理的には別々の記憶である)、その後、適切なボ
リューム制御ファクタにより重み付けされる。次にそれ
らは最終音声出力を生成するために結合される。本発明
は、分散音声会議システムが相対ボリュームの個々の制
御の提供に特に好適であることを認識する。
【0013】好適には、ワークステーションは更に、各
前記音声入力ストリームが現在無音かどうかを示すビジ
ュアル指示を提供する手段を含む。これは音声会議にお
いて認識される1つの問題、すなわち誰が話しているか
を特定する問題を克服する。ビジュアル指示は単に、点
灯または等価機構によるオン/オフ標識の特定の形態や
音声入力ストリームの起点のビジュアル表現(例えば参
加者の肖像)の輝度を変化させる(例えば低輝度に切換
える)ことも考えられるが、好適な実施例では、各前記
音声入力ストリームに対して、その音声ストリーム内の
瞬時音響ボリュームを示す表示により実現される。換言
すると、表示は関連する参加者のボリュームの完全な指
示を提供する。ボリューム出力はデジタル音声サンプル
のシーケンスからの2乗平均平方根値(rms:root-m
ean-square)にもとづき計算されるか、プロセッサ能力
が限られている場合には、所定サンプル数内の最大デジ
タル音声値などの単純なアルゴリズムが使用される。一
般に、入力音声データは各々が所定数のデジタル音声サ
ンプルを含むブロック単位で到来し、前記ビジュアル指
示が音声データの各新たなブロックに対応して更新され
る。ボリューム値は通常、ブロック単位で計算される。
前記音声入力ストリームが現在無音かどうかを示すビジ
ュアル指示を提供する手段を含む。これは音声会議にお
いて認識される1つの問題、すなわち誰が話しているか
を特定する問題を克服する。ビジュアル指示は単に、点
灯または等価機構によるオン/オフ標識の特定の形態や
音声入力ストリームの起点のビジュアル表現(例えば参
加者の肖像)の輝度を変化させる(例えば低輝度に切換
える)ことも考えられるが、好適な実施例では、各前記
音声入力ストリームに対して、その音声ストリーム内の
瞬時音響ボリュームを示す表示により実現される。換言
すると、表示は関連する参加者のボリュームの完全な指
示を提供する。ボリューム出力はデジタル音声サンプル
のシーケンスからの2乗平均平方根値(rms:root-m
ean-square)にもとづき計算されるか、プロセッサ能力
が限られている場合には、所定サンプル数内の最大デジ
タル音声値などの単純なアルゴリズムが使用される。一
般に、入力音声データは各々が所定数のデジタル音声サ
ンプルを含むブロック単位で到来し、前記ビジュアル指
示が音声データの各新たなブロックに対応して更新され
る。ボリューム値は通常、ブロック単位で計算される。
【0014】前記ビジュアル指示が、ビデオ画像または
静止画像などのその音声入力ストリームの起点のビジュ
アル表現の近傍に表示されることが望ましい。前者は完
全なマルチメディア会議ネットワークを要求し、後者は
ビデオ信号の伝送をサポートすることのできない低い帯
域幅ネットワーク上で提供される。こうしたビジュアル
指示は、静的或いは動的に関わらず、任意の音声の出所
の識別を容易にする。
静止画像などのその音声入力ストリームの起点のビジュ
アル表現の近傍に表示されることが望ましい。前者は完
全なマルチメディア会議ネットワークを要求し、後者は
ビデオ信号の伝送をサポートすることのできない低い帯
域幅ネットワーク上で提供される。こうしたビジュアル
指示は、静的或いは動的に関わらず、任意の音声の出所
の識別を容易にする。
【0015】好適には、ワークステーションは更に、ユ
ーザに前記重みパラメータの値のビジュアル指示を提供
する手段を含み、該手段はユーザのマウス・オペレーシ
ョンに応答して前記重みパラメータを調整する。これは
スクロール・バーなどとして実現され、各音声入力スト
リームに対して1つのスクロール・バーが対応し、その
ストリームの出力ボリュームのビジュアル指示の近傍に
配置される。更にコンピュータ・ワークステーション
が、前記多重音声入力ストリームの任意のストリームか
らの音声出力を禁止する手段を含むことが便利である。
これによりユーザは、各音声入力ストリームに対するボ
リューム制御の完全なセットを効果的に提供される。
ーザに前記重みパラメータの値のビジュアル指示を提供
する手段を含み、該手段はユーザのマウス・オペレーシ
ョンに応答して前記重みパラメータを調整する。これは
スクロール・バーなどとして実現され、各音声入力スト
リームに対して1つのスクロール・バーが対応し、その
ストリームの出力ボリュームのビジュアル指示の近傍に
配置される。更にコンピュータ・ワークステーション
が、前記多重音声入力ストリームの任意のストリームか
らの音声出力を禁止する手段を含むことが便利である。
これによりユーザは、各音声入力ストリームに対するボ
リューム制御の完全なセットを効果的に提供される。
【0016】本発明は更に、各々がデジタル音声サンプ
ルのシーケンスを含む多重音声入力ストリームを受信す
るためにネットワークに接続されるコンピュータ・ワー
クステーションを動作する方法を提供する。この方法
は、各音声入力ストリームからのデジタル音声サンプル
を別々のキューに記憶するステップ、各キューから1つ
ずつのデジタル音声サンプルを含むセットのシーケンス
を形成するステップ、各音声入力ストリームが関連する
重みパラメータを有し、そのパラメータからデジタル音
声サンプルの各セットの加重合計を生成するステップ、
加重合計のシーケンスから音声出力を生成するステップ
を含み、ユーザ入力に応答して多重音声ストリームの音
声出力における相対ボリュームを制御するために、前記
重みパラメータを調整するステップにより特徴化され
る。
ルのシーケンスを含む多重音声入力ストリームを受信す
るためにネットワークに接続されるコンピュータ・ワー
クステーションを動作する方法を提供する。この方法
は、各音声入力ストリームからのデジタル音声サンプル
を別々のキューに記憶するステップ、各キューから1つ
ずつのデジタル音声サンプルを含むセットのシーケンス
を形成するステップ、各音声入力ストリームが関連する
重みパラメータを有し、そのパラメータからデジタル音
声サンプルの各セットの加重合計を生成するステップ、
加重合計のシーケンスから音声出力を生成するステップ
を含み、ユーザ入力に応答して多重音声ストリームの音
声出力における相対ボリュームを制御するために、前記
重みパラメータを調整するステップにより特徴化され
る。
【0017】
【実施例】図1はコンピュータ・ワークステーションA
乃至Eがローカル・エリア・ネットワーク(LAN)2
内でリンクされる様子を示す。これらのワークステーシ
ョンは多方向会議に参加し、それにより各ワークステー
ションがその音声信号を、会議に参加する全ての他のワ
ークステーションに同報通信する。各ワークステーショ
ンはあらゆる他のワークステーションから別々の音声信
号を受信する。図1に示されるネットワークはトークン
・リング・アーキテクチャを有し、そこではトークンが
ワークステーションを循環する。現在トークンを所持す
るワークステーションだけが、メッセージを別のワーク
ステーションに伝送することを許可される。リングを循
環してメッセージを伝送する物理伝送時間は極めて短
い。換言すると、例えばAにより伝送されるメッセージ
は、他の全ての端末によりほぼ同時に受信される。これ
はトークン・システムが同時にメッセージを伝送しよう
とする2つのノードから生じる衝突を阻止するために使
用されるからである。
乃至Eがローカル・エリア・ネットワーク(LAN)2
内でリンクされる様子を示す。これらのワークステーシ
ョンは多方向会議に参加し、それにより各ワークステー
ションがその音声信号を、会議に参加する全ての他のワ
ークステーションに同報通信する。各ワークステーショ
ンはあらゆる他のワークステーションから別々の音声信
号を受信する。図1に示されるネットワークはトークン
・リング・アーキテクチャを有し、そこではトークンが
ワークステーションを循環する。現在トークンを所持す
るワークステーションだけが、メッセージを別のワーク
ステーションに伝送することを許可される。リングを循
環してメッセージを伝送する物理伝送時間は極めて短
い。換言すると、例えばAにより伝送されるメッセージ
は、他の全ての端末によりほぼ同時に受信される。これ
はトークン・システムが同時にメッセージを伝送しよう
とする2つのノードから生じる衝突を阻止するために使
用されるからである。
【0018】以降で詳述されるように、LAN上におけ
る単方向音声通信は、通常、64kHzの帯域幅を必要
とする。図1の会議では、各ノードはその音声信号を他
の4つのノードに同報通信し、これは全体で1.28M
Hz(5×4×64kHz)の帯域幅を要求することを
意味する。これはたまたま、4Mbit/秒または16
Mbit/秒の伝送レートをサポートする標準のトーク
ン・リングの能力内に入るが、より大きな会議では帯域
幅要求が問題となり、より高い帯域幅の提供が期待され
る将来のネットワークに対応することができない。
る単方向音声通信は、通常、64kHzの帯域幅を必要
とする。図1の会議では、各ノードはその音声信号を他
の4つのノードに同報通信し、これは全体で1.28M
Hz(5×4×64kHz)の帯域幅を要求することを
意味する。これはたまたま、4Mbit/秒または16
Mbit/秒の伝送レートをサポートする標準のトーク
ン・リングの能力内に入るが、より大きな会議では帯域
幅要求が問題となり、より高い帯域幅の提供が期待され
る将来のネットワークに対応することができない。
【0019】本発明は音声会議をサポートするために必
要な帯域幅、待ち時間などに関する技術的要求が満足さ
れれば、トークン・リング以外の多くの異なるネットワ
ーク・アーキテクチャまたは構成において実現される。
要な帯域幅、待ち時間などに関する技術的要求が満足さ
れれば、トークン・リング以外の多くの異なるネットワ
ーク・アーキテクチャまたは構成において実現される。
【0020】図2は、図1のネットワークにおいて使用
されるコンピュータ・システムを単純化して表す図であ
る。コンピュータはシステム・ユニット10、表示画面
12、キーボード14及びマウス16を有する。システ
ム・ユニット10はマイクロプロセッサ22、半導体メ
モリ(ROM/RAM)24、及びデータが転送される
バス26を含む。図2のコンピュータは、例えばIBM
PS/2コンピュータなどの任意の従来のワークステ
ーションである。
されるコンピュータ・システムを単純化して表す図であ
る。コンピュータはシステム・ユニット10、表示画面
12、キーボード14及びマウス16を有する。システ
ム・ユニット10はマイクロプロセッサ22、半導体メ
モリ(ROM/RAM)24、及びデータが転送される
バス26を含む。図2のコンピュータは、例えばIBM
PS/2コンピュータなどの任意の従来のワークステ
ーションである。
【0021】図2のコンピュータには2つのアダプタ・
カードが装備される。1つはトークン・リング・アダプ
タ・カード30である。このカードは付随のソフトウェ
アと共に、図1に示されるトークン・リング・ネットワ
ークとの間のデータの送受信を可能とする。トークン・
リング・カードのオペレーションは既知であり、ここで
は詳細に述べない。第2のカードは音声カード28であ
り、これは音声入力及び出力のために、マイクロフォン
及びラウドスピーカ(図示せず)に接続される。
カードが装備される。1つはトークン・リング・アダプ
タ・カード30である。このカードは付随のソフトウェ
アと共に、図1に示されるトークン・リング・ネットワ
ークとの間のデータの送受信を可能とする。トークン・
リング・カードのオペレーションは既知であり、ここで
は詳細に述べない。第2のカードは音声カード28であ
り、これは音声入力及び出力のために、マイクロフォン
及びラウドスピーカ(図示せず)に接続される。
【0022】音声カードが図3に詳細に示される。図示
され、この特定の実施例で使用されるカードは、IBM
から提供されるM−ウェーブ・カード(M-Wave card )
であるが、類似の機能を実行する他のカードも使用可能
である。このカードは、接続されるマイクロフォン40
からの入力音声信号をデジタル化するA/D変換器42
を含む。A/D変換器はCODEC44に接続され、こ
れは入力音声信号を44.1kHzのレートで16ビッ
ト・サンプルにサンプリングする(コンパクト・ディス
クの標準サンプリング・レート/サイズに対応)。デジ
タル化されたサンプルは次にダブル・バッファ48を介
して、カード上のデジタル信号プロセッサ(DSP)4
6にパスされる(すなわちCODECがサンプルをダブ
ル・バッファの一方にロードし、その間に他方のバッフ
ァから以前のサンプルを読出す)。DSPはカード上の
半導体メモリ52に記憶される1つ以上のプログラムに
より制御される。データはDSPにより主PCバスとの
間で転送される。
され、この特定の実施例で使用されるカードは、IBM
から提供されるM−ウェーブ・カード(M-Wave card )
であるが、類似の機能を実行する他のカードも使用可能
である。このカードは、接続されるマイクロフォン40
からの入力音声信号をデジタル化するA/D変換器42
を含む。A/D変換器はCODEC44に接続され、こ
れは入力音声信号を44.1kHzのレートで16ビッ
ト・サンプルにサンプリングする(コンパクト・ディス
クの標準サンプリング・レート/サイズに対応)。デジ
タル化されたサンプルは次にダブル・バッファ48を介
して、カード上のデジタル信号プロセッサ(DSP)4
6にパスされる(すなわちCODECがサンプルをダブ
ル・バッファの一方にロードし、その間に他方のバッフ
ァから以前のサンプルを読出す)。DSPはカード上の
半導体メモリ52に記憶される1つ以上のプログラムに
より制御される。データはDSPにより主PCバスとの
間で転送される。
【0023】プレイアウトされる音声信号は、DSP4
6によりPCバス26から受信され、マイクロフォンか
らの音声入力とは逆に処理される。すなわち、出力音声
信号がDSP46及びダブル・バッファ50を介してC
ODEC44にパスされ、そこからD/A変換器54
に、そして最後にラウドスピーカ56または他の適切な
出力装置にパスされる。
6によりPCバス26から受信され、マイクロフォンか
らの音声入力とは逆に処理される。すなわち、出力音声
信号がDSP46及びダブル・バッファ50を介してC
ODEC44にパスされ、そこからD/A変換器54
に、そして最後にラウドスピーカ56または他の適切な
出力装置にパスされる。
【0024】図示の特定の実施例では、DSPは標準の
再サンプリング技術を使用することにより、CODEC
からの16ビット、44.1kHzサンプリング・レー
トのサンプルをCCITT標準G.711に対応する8
kHzサンプリング・レート、及びμ法則スケール(μ
−law scale )(実際には対数)による8ビット・サン
プルを有する新たなデジタル信号に変換するようにプロ
グラムされる。他の端末への伝送のためにワークステー
ションにパスされる信号の総帯域幅は、従って64kH
zである。DSPはまたPCから受信される入力信号に
対して、逆の変換を実行する。すなわち再度既知の再サ
ンプリング技術により、信号を8ビット、8kHzから
16ビット、44.1kHzに変換する。2つのサンプ
リング形式間のこの変換は、ハードウェアの特定の選択
のためにのみ必要であり、本発明には直接的な関係を有
さない。例えば、多くの他の音声カードが8kHz形式
の固有のサポートを含み、それによりCODECがG.
711形式に従い8kHzで動作可能となる。(代わり
に、44.1kHzのサンプルがネットワーク上の伝送
のために保持されてもよい。しかしながら、伝送される
音声信号に対してCD品質を要求する特定のニーズが存
在しない場合、より高い帯域幅及び多大な処理スピード
の向上に対する要求が、これを非現実的なものとする。
通常の音声通信では、G.711形式の64kHzの帯
域幅信号で十分である。)
再サンプリング技術を使用することにより、CODEC
からの16ビット、44.1kHzサンプリング・レー
トのサンプルをCCITT標準G.711に対応する8
kHzサンプリング・レート、及びμ法則スケール(μ
−law scale )(実際には対数)による8ビット・サン
プルを有する新たなデジタル信号に変換するようにプロ
グラムされる。他の端末への伝送のためにワークステー
ションにパスされる信号の総帯域幅は、従って64kH
zである。DSPはまたPCから受信される入力信号に
対して、逆の変換を実行する。すなわち再度既知の再サ
ンプリング技術により、信号を8ビット、8kHzから
16ビット、44.1kHzに変換する。2つのサンプ
リング形式間のこの変換は、ハードウェアの特定の選択
のためにのみ必要であり、本発明には直接的な関係を有
さない。例えば、多くの他の音声カードが8kHz形式
の固有のサポートを含み、それによりCODECがG.
711形式に従い8kHzで動作可能となる。(代わり
に、44.1kHzのサンプルがネットワーク上の伝送
のために保持されてもよい。しかしながら、伝送される
音声信号に対してCD品質を要求する特定のニーズが存
在しない場合、より高い帯域幅及び多大な処理スピード
の向上に対する要求が、これを非現実的なものとする。
通常の音声通信では、G.711形式の64kHzの帯
域幅信号で十分である。)
【0025】データは音声アダプタ・カードとワークス
テーションとの間で、64バイトのブロックにより転送
される。すなわち、これは8kHzでサンプリングされ
る8ビット・データの8ms間の音声データに対応す
る。ワークステーションは次にデータの全体ブロックだ
けを処理し、ワークステーションにより送受信される各
データ・パケットは、通常、単一の64バイト・ブロッ
ク・データを含む。ブロック・サイズに対する64バイ
トの選択は、システムの細分性(遅延を導出する)の最
小化と、ワークステーションにおける内部処理及びネッ
トワーク上の伝送の両者における効率維持との間の妥協
点である。他のシステムでは、例えば32バイトまたは
128バイトのブロック・サイズがより好適であったり
する。
テーションとの間で、64バイトのブロックにより転送
される。すなわち、これは8kHzでサンプリングされ
る8ビット・データの8ms間の音声データに対応す
る。ワークステーションは次にデータの全体ブロックだ
けを処理し、ワークステーションにより送受信される各
データ・パケットは、通常、単一の64バイト・ブロッ
ク・データを含む。ブロック・サイズに対する64バイ
トの選択は、システムの細分性(遅延を導出する)の最
小化と、ワークステーションにおける内部処理及びネッ
トワーク上の伝送の両者における効率維持との間の妥協
点である。他のシステムでは、例えば32バイトまたは
128バイトのブロック・サイズがより好適であったり
する。
【0026】音声データの伝送に関するコンピュータ・
ワークステーションのオペレーションは、従来技術にお
いて既知であり、ここでは詳細には述べない。実質的
に、音声カードがマイクロフォンまたは、例えばコンパ
クト・ディスク・プレーヤなどの他の音声源からアナロ
グ形式で入力信号を受信し、デジタル音声データのブロ
ックを生成する。これらのブロックが次にワークステー
ションの主メモリに転送され、そこからLANアダプタ
・カードに転送される(幾つかのアーキテクチャでは、
ワークステーション・メモリを介さずにブロックを音声
アダプタ・カードから直接LANアダプタ・カードに転
送することが可能である)。LANアダプタ・カード
は、出所ノード及び宛先ノードを識別するヘッダ情報と
一緒に、デジタル音声データを含むデータ・パケットを
生成し、このパケットが次にネットワークを介して所望
の受信側に伝送される。任意の双方向通信または多方向
通信において、この伝送処理は以下で述べられる受信処
理と同時に、ワークステーションにおいて実行されるこ
とが理解されよう。
ワークステーションのオペレーションは、従来技術にお
いて既知であり、ここでは詳細には述べない。実質的
に、音声カードがマイクロフォンまたは、例えばコンパ
クト・ディスク・プレーヤなどの他の音声源からアナロ
グ形式で入力信号を受信し、デジタル音声データのブロ
ックを生成する。これらのブロックが次にワークステー
ションの主メモリに転送され、そこからLANアダプタ
・カードに転送される(幾つかのアーキテクチャでは、
ワークステーション・メモリを介さずにブロックを音声
アダプタ・カードから直接LANアダプタ・カードに転
送することが可能である)。LANアダプタ・カード
は、出所ノード及び宛先ノードを識別するヘッダ情報と
一緒に、デジタル音声データを含むデータ・パケットを
生成し、このパケットが次にネットワークを介して所望
の受信側に伝送される。任意の双方向通信または多方向
通信において、この伝送処理は以下で述べられる受信処
理と同時に、ワークステーションにおいて実行されるこ
とが理解されよう。
【0027】音声データ・パケットの受信に関するコン
ピュータ・ワークステーションによる処理が、図4に表
される。新たなパケットが到来する度に(ステップ40
2)、LANアダプタ・カードはワークステーション内
のマイクロプロセッサ上で実行されるプログラムに通知
し、データ・パケットの出所を識別するプログラムに情
報を提供する。プログラムは次に入力64バイト音声ブ
ロックを主メモリ内のキューに転送する(ステップ40
4)。図5に示されるように、主メモリ500内のキュ
ーは、実際には各異なる出所ノードからの音声ブロック
を含む別々のサブキューのセットから構成される。1つ
のキューはある出所ノードからの音声ブロックを含み、
別のキューは別の出所ノードからの音声ブロックを含
む。図5では3つのサブキュー501、502、503
が存在し、それぞれノードB、C及びDからの音声デー
タに対応する。サブキューの数は、もちろん音声会議の
参加者数に従い変化する。プログラムは各受信パケット
内の出所ノード識別情報を使用し、入力音声データのブ
ロックを正しいキューに割当てる。ポインタPB、PC及
びPD はキューの終りの位置を示し、新たなパケットが
追加される度に更新される。パケットはその後の処理の
ために、サブキューのボトム(図5では"出力"と示され
る)から取り出される。図5のサブキューは、従って実
質的には標準の先入れ先出し(FIFO)キューであ
り、従来のプログラミング技術により実現される。多重
(並列)キューのサポートを除いては、これまでに述べ
てきた入力音声ブロックの処理は以前の方法と類似であ
り、必要に応じて個々のサブキューまたは結合キュー全
体として、等価のバッファリング技術の使用を可能とす
る。
ピュータ・ワークステーションによる処理が、図4に表
される。新たなパケットが到来する度に(ステップ40
2)、LANアダプタ・カードはワークステーション内
のマイクロプロセッサ上で実行されるプログラムに通知
し、データ・パケットの出所を識別するプログラムに情
報を提供する。プログラムは次に入力64バイト音声ブ
ロックを主メモリ内のキューに転送する(ステップ40
4)。図5に示されるように、主メモリ500内のキュ
ーは、実際には各異なる出所ノードからの音声ブロック
を含む別々のサブキューのセットから構成される。1つ
のキューはある出所ノードからの音声ブロックを含み、
別のキューは別の出所ノードからの音声ブロックを含
む。図5では3つのサブキュー501、502、503
が存在し、それぞれノードB、C及びDからの音声デー
タに対応する。サブキューの数は、もちろん音声会議の
参加者数に従い変化する。プログラムは各受信パケット
内の出所ノード識別情報を使用し、入力音声データのブ
ロックを正しいキューに割当てる。ポインタPB、PC及
びPD はキューの終りの位置を示し、新たなパケットが
追加される度に更新される。パケットはその後の処理の
ために、サブキューのボトム(図5では"出力"と示され
る)から取り出される。図5のサブキューは、従って実
質的には標準の先入れ先出し(FIFO)キューであ
り、従来のプログラミング技術により実現される。多重
(並列)キューのサポートを除いては、これまでに述べ
てきた入力音声ブロックの処理は以前の方法と類似であ
り、必要に応じて個々のサブキューまたは結合キュー全
体として、等価のバッファリング技術の使用を可能とす
る。
【0028】音声アダプタ・カード上のDSPにより実
行されるオペレーションが図6に表される。DSPはサ
イクル実行され、連続音声出力信号を保証するために、
8ミリ秒(ms)毎に音声ブロックの新たなセットを処
理する。DSPは8ms毎にDMAアクセスにより、異
なるノードに対応する各サブキューから1つずつの音声
ブロックを読出す。すなわち、図5に示されるキュー
B、C及びDのボトムから1ブロックが読出される(ス
テップ602:すなわちこの場合はM=3)。これらの
ブロックは同時時間間隔を表すものとして処理され、最
終出力では、その時間間隔に対応する単一音声出力を生
成するために一緒に加算される。DSPは従って、多重
音声入力ストリームに対して、デジタル混合機能を効率
的に実行する。ルックアップ・テーブルを使用すること
により、64バイト・ブロック内の個々のサンプルが、
次にG.711形式(実質的には対数)からリニア・ス
ケールに変換される(ステップ604)。各個々のサン
プルは次に重みパラメータにより乗算される(ステップ
606)。各受信音声データ・ストリームに対して、別
々の重みパラメータが存在する。すなわち、図5の3つ
のサブキューに対して、ノードBからの音声ストリーム
に対して1個、ノードCからの音声ストリームに対して
1個、またノードDからの音声ストリームに対して1個
の重みパラメータが存在する。重みパラメータは異なる
出所からの音声信号の相対ラウドネス(音の大きさ)を
制御するために使用される。
行されるオペレーションが図6に表される。DSPはサ
イクル実行され、連続音声出力信号を保証するために、
8ミリ秒(ms)毎に音声ブロックの新たなセットを処
理する。DSPは8ms毎にDMAアクセスにより、異
なるノードに対応する各サブキューから1つずつの音声
ブロックを読出す。すなわち、図5に示されるキュー
B、C及びDのボトムから1ブロックが読出される(ス
テップ602:すなわちこの場合はM=3)。これらの
ブロックは同時時間間隔を表すものとして処理され、最
終出力では、その時間間隔に対応する単一音声出力を生
成するために一緒に加算される。DSPは従って、多重
音声入力ストリームに対して、デジタル混合機能を効率
的に実行する。ルックアップ・テーブルを使用すること
により、64バイト・ブロック内の個々のサンプルが、
次にG.711形式(実質的には対数)からリニア・ス
ケールに変換される(ステップ604)。各個々のサン
プルは次に重みパラメータにより乗算される(ステップ
606)。各受信音声データ・ストリームに対して、別
々の重みパラメータが存在する。すなわち、図5の3つ
のサブキューに対して、ノードBからの音声ストリーム
に対して1個、ノードCからの音声ストリームに対して
1個、またノードDからの音声ストリームに対して1個
の重みパラメータが存在する。重みパラメータは異なる
出所からの音声信号の相対ラウドネス(音の大きさ)を
制御するために使用される。
【0029】DSPは各音声ストリームの2乗平均平方
根値(rms)の記録を保持する(ステップ608)。
通常、こうしたrms値は、音声データの各ブロック
(すなわち8ms毎)に対して、そのブロック内の値の
2乗の合計を生成することにより求められる。rms値
は個々の音声入力ストリームのボリュームを表し、後述
のように、ユーザにボリューム情報を提供するために使
用される。
根値(rms)の記録を保持する(ステップ608)。
通常、こうしたrms値は、音声データの各ブロック
(すなわち8ms毎)に対して、そのブロック内の値の
2乗の合計を生成することにより求められる。rms値
は個々の音声入力ストリームのボリュームを表し、後述
のように、ユーザにボリューム情報を提供するために使
用される。
【0030】デジタル音声サンプルが適切な重みパラメ
ータにより乗算されると(ステップ606)、それらは
合計される(ステップ610;これはステップ606の
処理と並列に効果的に発生する)。こうして多重入力音
声ストリームの加重合計を表すデジタル音声サンプルの
単一のシーケンスが生成される。デジタル音声サンプル
のこのシーケンスは、次に最大44.1kHzで再サン
プリングされ(ステップ612;上述したように、これ
はハードウェア依存であり、本発明には直接関係しな
い)、その後、ラウドスピーカに供給するためにCOD
ECにパスされる(ステップ614)。
ータにより乗算されると(ステップ606)、それらは
合計される(ステップ610;これはステップ606の
処理と並列に効果的に発生する)。こうして多重入力音
声ストリームの加重合計を表すデジタル音声サンプルの
単一のシーケンスが生成される。デジタル音声サンプル
のこのシーケンスは、次に最大44.1kHzで再サン
プリングされ(ステップ612;上述したように、これ
はハードウェア依存であり、本発明には直接関係しな
い)、その後、ラウドスピーカに供給するためにCOD
ECにパスされる(ステップ614)。
【0031】ボリューム調整信号を生成するために使用
される実際のDSP処理は、図6に示される処理と結果
としては類似であるが、多少異なった形態を有する。こ
うした変更は通常、計算効率を最大化するために、或い
はDSPに対する要求を低減するために導入される。例
えばプロセッサ能力が限られている場合、ボリューム制
御はμ法則形式からの変換において実行される。正しい
ルックアップ値が探し出された後(ステップ604)、
信号のボリュームがその通常の値から増加または減少さ
れるかに従い、テーブルを所定箇所数、上下に移動する
ことにより、実際の読出し値が決定される。この場合、
重みパラメータは事実上、ルックアップ・テーブルを調
整するために上下に移動するステップ数に相当する(こ
れは明らかに、G.711形式がオリジナル振幅の正負
に従いそれらを分離し、ボリューム調整が逆の極性に変
換できない事実を考慮する)。前記アプローチは計算的
に単純であるが、連続的なボリューム制御ではなく、連
続的でないボリューム制御だけを提供する。代わりにμ
法則値にボリューム制御値または重みパラメータの対数
を加算することも可能である。このアプローチはステッ
プ604のスケール変換に先立ち、ステップ606の乗
算を対数加算により効果的に実行する。加算はほとんど
のプロセッサにおいて、乗算よりも計算機使用上安価で
ある。そして、この結果が次に、他の音声ストリームと
の混合のために、リニア・スケールに変換し戻される
(ステップ604)。このアプローチは、ルックアップ
・テーブルが十分に詳細に作成されれば、精密なボリュ
ーム制御を可能とする(但し、出力は16ビットに制限
される)。通常、重みパラメータの対数がルックアップ
・テーブルから獲得されるか、制御アプリケーションに
より既に対数の形式で提供される。もちろん、ボリュー
ム制御の調整時に新たな数値の計算が必要となるだけで
あり、この計算は比較的稀である。
される実際のDSP処理は、図6に示される処理と結果
としては類似であるが、多少異なった形態を有する。こ
うした変更は通常、計算効率を最大化するために、或い
はDSPに対する要求を低減するために導入される。例
えばプロセッサ能力が限られている場合、ボリューム制
御はμ法則形式からの変換において実行される。正しい
ルックアップ値が探し出された後(ステップ604)、
信号のボリュームがその通常の値から増加または減少さ
れるかに従い、テーブルを所定箇所数、上下に移動する
ことにより、実際の読出し値が決定される。この場合、
重みパラメータは事実上、ルックアップ・テーブルを調
整するために上下に移動するステップ数に相当する(こ
れは明らかに、G.711形式がオリジナル振幅の正負
に従いそれらを分離し、ボリューム調整が逆の極性に変
換できない事実を考慮する)。前記アプローチは計算的
に単純であるが、連続的なボリューム制御ではなく、連
続的でないボリューム制御だけを提供する。代わりにμ
法則値にボリューム制御値または重みパラメータの対数
を加算することも可能である。このアプローチはステッ
プ604のスケール変換に先立ち、ステップ606の乗
算を対数加算により効果的に実行する。加算はほとんど
のプロセッサにおいて、乗算よりも計算機使用上安価で
ある。そして、この結果が次に、他の音声ストリームと
の混合のために、リニア・スケールに変換し戻される
(ステップ604)。このアプローチは、ルックアップ
・テーブルが十分に詳細に作成されれば、精密なボリュ
ーム制御を可能とする(但し、出力は16ビットに制限
される)。通常、重みパラメータの対数がルックアップ
・テーブルから獲得されるか、制御アプリケーションに
より既に対数の形式で提供される。もちろん、ボリュー
ム制御の調整時に新たな数値の計算が必要となるだけで
あり、この計算は比較的稀である。
【0032】同様に、使用可能な処理能力が連続的rm
sボリューム測定を実行するのに不十分な場合には、処
理はあらゆる他のデータ・ブロックに対して実行される
か、例えば連続サンプル間の差の絶対値を合計するよう
な計算的に単純なアルゴリズムが使用される。ここで2
乗値の合計はステップ604に先立ち(すなわちスケー
ル変換以前に)、対数加算により実行される。より単純
なアプローチでは、単に任意の音声ブロック内の最大サ
ンプル値をボリューム標識として使用する。
sボリューム測定を実行するのに不十分な場合には、処
理はあらゆる他のデータ・ブロックに対して実行される
か、例えば連続サンプル間の差の絶対値を合計するよう
な計算的に単純なアルゴリズムが使用される。ここで2
乗値の合計はステップ604に先立ち(すなわちスケー
ル変換以前に)、対数加算により実行される。より単純
なアプローチでは、単に任意の音声ブロック内の最大サ
ンプル値をボリューム標識として使用する。
【0033】図7は、音声会議に参加するユーザのワー
クステーションに提供される画面700を示す。今まで
述べてきたように、これは3つの異なる音声データ・ス
トリームの受信を含む。但し、本発明が3人の参加者に
限るものではないことは明らかである。図7の画面は破
線により3つの領域701、702、703に分割さ
れ、各領域が1人の参加者を表す。しかしながら、実際
にはこれらの破線は画面上には現れない。各参加者に関
連して、参加者の名前(この例では単純にB、C、Dと
する)を含むボックス724が存在する。また音声と共
にネットワーク上を伝送される音声源のビデオ画像、或
いは静止ビット・マップ(いずれも会議の開始時に音声
源により提供されるか、既にワークステーションに局所
的に存在し、その参加者の名前に応答して表示される)
を含むためのイメージ・ウィンドウ720が存在する。
参加者Dの場合には、ビデオ画像または静止画像が有効
でなく、空白ウィンドウが示される。イメージ・ウィン
ドウ内の表示の選択(空白、静止画像またはビデオ画
像)は、ワークステーションにおいて使用可能なハード
ウェア、ネットワークの帯域幅、及び関連情報の使用可
能性に依存する。
クステーションに提供される画面700を示す。今まで
述べてきたように、これは3つの異なる音声データ・ス
トリームの受信を含む。但し、本発明が3人の参加者に
限るものではないことは明らかである。図7の画面は破
線により3つの領域701、702、703に分割さ
れ、各領域が1人の参加者を表す。しかしながら、実際
にはこれらの破線は画面上には現れない。各参加者に関
連して、参加者の名前(この例では単純にB、C、Dと
する)を含むボックス724が存在する。また音声と共
にネットワーク上を伝送される音声源のビデオ画像、或
いは静止ビット・マップ(いずれも会議の開始時に音声
源により提供されるか、既にワークステーションに局所
的に存在し、その参加者の名前に応答して表示される)
を含むためのイメージ・ウィンドウ720が存在する。
参加者Dの場合には、ビデオ画像または静止画像が有効
でなく、空白ウィンドウが示される。イメージ・ウィン
ドウ内の表示の選択(空白、静止画像またはビデオ画
像)は、ワークステーションにおいて使用可能なハード
ウェア、ネットワークの帯域幅、及び関連情報の使用可
能性に依存する。
【0034】イメージ・ウィンドウの下方にはボリュー
ム表示721(VUメータ)が存在し、その音声ストリ
ームの瞬時ボリューム(図6のブロック608で計算さ
れる)を示す。この表示内の実線の長さは、音声ストリ
ームのボリュームを示す。その参加者からの音声信号が
存在しない場合、実線は0長を有する(すなわち表示さ
れない)。ユーザは従って、誰のVUメータがアクティ
ブかを見ることにより、会議で発言している人間を判断
することができる。
ム表示721(VUメータ)が存在し、その音声ストリ
ームの瞬時ボリューム(図6のブロック608で計算さ
れる)を示す。この表示内の実線の長さは、音声ストリ
ームのボリュームを示す。その参加者からの音声信号が
存在しない場合、実線は0長を有する(すなわち表示さ
れない)。ユーザは従って、誰のVUメータがアクティ
ブかを見ることにより、会議で発言している人間を判断
することができる。
【0035】ボリューム表示の下には、ボリューム制御
バー722が存在し、ユーザはその参加者の相対ボリュ
ームを調整することができる。これはボリュームを増加
または減少するために、ユーザがバーの端に位置する"
+"または"−"ボタンをそれぞれ押すことにより達成さ
れる。これはデジタル混合において使用される重みパラ
メータを増減する効果を有する。ボリューム制御バーの
中央の標識は、現在のボリューム設定(すなわち重みパ
ラメータの現在値)を表す。
バー722が存在し、ユーザはその参加者の相対ボリュ
ームを調整することができる。これはボリュームを増加
または減少するために、ユーザがバーの端に位置する"
+"または"−"ボタンをそれぞれ押すことにより達成さ
れる。これはデジタル混合において使用される重みパラ
メータを増減する効果を有する。ボリューム制御バーの
中央の標識は、現在のボリューム設定(すなわち重みパ
ラメータの現在値)を表す。
【0036】最後に、名前ボックス724の隣にはマウ
ス・ボタン723が存在する。このボタンを押すと、そ
の参加者からの音声出力を交互に許可及び禁止する。音
声出力が禁止されると重みパラメータが0にセットさ
れ、許可されると重みパラメータがその以前の値に復元
される(すなわちボリューム制御バー上に示される)。
参加者からの音声が現在禁止状態であると、これが無音
ボタン上にスーパインポーズされる十字形により示され
る(図7では3つの全ての音声出力が現在許可されてい
る)。ここで上述のDSP処理によれば、音声出力が禁
止されて無音ボタンがオンの時、VUメータは0を示
す。必要に応じVUメータが音声出力が実際に許可され
ている時に生成される信号レベルを示すように、システ
ムを変更することが、より直接的である。
ス・ボタン723が存在する。このボタンを押すと、そ
の参加者からの音声出力を交互に許可及び禁止する。音
声出力が禁止されると重みパラメータが0にセットさ
れ、許可されると重みパラメータがその以前の値に復元
される(すなわちボリューム制御バー上に示される)。
参加者からの音声が現在禁止状態であると、これが無音
ボタン上にスーパインポーズされる十字形により示され
る(図7では3つの全ての音声出力が現在許可されてい
る)。ここで上述のDSP処理によれば、音声出力が禁
止されて無音ボタンがオンの時、VUメータは0を示
す。必要に応じVUメータが音声出力が実際に許可され
ている時に生成される信号レベルを示すように、システ
ムを変更することが、より直接的である。
【0037】図8は、図7のユーザ・インタフェースを
提供するために、図2のワークステーション上で実行さ
れる主ソフトウェア・コンポーネントを表す。ワークス
テーションは、例えばマイクロソフト社から提供される
ウィンドウズなどのオペレーティング・システム814
により制御される。ワークステーション上には更に、L
AN通信を可能とする適切な通信ソフトウェア816が
存在する(幾つかの場合では、通信ソフトウェアがオペ
レーティング・システムに効果的に含まれる)。オペレ
ーティング・システム及び通信ソフトウェアは既知のよ
うに、デバイス・ドライバ818を介して、2つのアダ
プタ・カード、すなわちトークン・リング・アダプタ・
カード及び音声アダプタ・カードと対話する。音声の全
体処理はアプリケーション810により制御される。こ
れはアプリケーション・サポート層812の機能を使用
し、こうした1例にマイクロソフト社から提供されるビ
ジュアル・ベーシック(Visual Basic)がある。アプリ
ケーション・サポート層の目的は特にユーザ・インタフ
ェースに関し、アプリケーションの開発を容易にするこ
とであるが、もちろんアプリケーションが直接オペレー
ティング・システムと共に動作することも可能である。
提供するために、図2のワークステーション上で実行さ
れる主ソフトウェア・コンポーネントを表す。ワークス
テーションは、例えばマイクロソフト社から提供される
ウィンドウズなどのオペレーティング・システム814
により制御される。ワークステーション上には更に、L
AN通信を可能とする適切な通信ソフトウェア816が
存在する(幾つかの場合では、通信ソフトウェアがオペ
レーティング・システムに効果的に含まれる)。オペレ
ーティング・システム及び通信ソフトウェアは既知のよ
うに、デバイス・ドライバ818を介して、2つのアダ
プタ・カード、すなわちトークン・リング・アダプタ・
カード及び音声アダプタ・カードと対話する。音声の全
体処理はアプリケーション810により制御される。こ
れはアプリケーション・サポート層812の機能を使用
し、こうした1例にマイクロソフト社から提供されるビ
ジュアル・ベーシック(Visual Basic)がある。アプリ
ケーション・サポート層の目的は特にユーザ・インタフ
ェースに関し、アプリケーションの開発を容易にするこ
とであるが、もちろんアプリケーションが直接オペレー
ティング・システムと共に動作することも可能である。
【0038】アプリケーションは既知のプログラミング
技術により、ウィンドウ・ボックス720内の内容を制
御する。例えば、VUメータ721はビジュアル・ベー
シックにより提供される機能を使用して提供される。ビ
ジュアル・ベーシックはメータに関連する全てのグラフ
ィックスの役割を効果的に担う。すなわち、アプリケー
ションが実行すべきことは、関連する数値を供給するこ
とだけである。ビジュアル・ベーシックは割込み駆動で
あるので、これはDSPが音声ブロックに対応する出力
ボリュームをワークステーションにコピーし、次に割込
みを呼出すことにより容易に達成される。割込みはアプ
リケーションにイベントを生成し、それに対してVUメ
ータにコピーされる新たな出力ボリュームを通知する。
実際に、割込みは音声ブロックのセットに対するボリュ
ーム読出しの完全なセット、すなわち各音声ストリーム
に対して1つのボリュームの読出しの使用可能性を伝え
るために使用される。(DSPはネットワークへの伝送
のためにそのワークステーションにおいて生成される出
力音声信号に関連して、既に1音声ブロック当たり1割
込みを実行する。)同様にボリューム制御バー722も
またビジュアル・ベーシックにおいて提供される機構で
ある("スクロール・バー"と称される)。ビジュアル・
ベーシックは制御バーに関連する全てのグラフィックス
を扱い、そうしたものの中にはセレクタの位置が含ま
れ、またボリュームがユーザにより更新される度に、ア
プリケーションに更新されたボリューム値をパスする。
アプリケーションは次にこの更新値をDSPに書込み、
それに従いボリュームが変更される。無音ボタン723
はビジュアル・ベーシックにより提供される別の表示機
構であり、各音声ストリームの単純なオン/オフ制御を
可能とする。無音ボタンが活動化される度に、アプリケ
ーションは重みパラメータの前の値を記憶する必要があ
る。それにより、無音ボタンが次に押される時にこの値
が復元される。
技術により、ウィンドウ・ボックス720内の内容を制
御する。例えば、VUメータ721はビジュアル・ベー
シックにより提供される機能を使用して提供される。ビ
ジュアル・ベーシックはメータに関連する全てのグラフ
ィックスの役割を効果的に担う。すなわち、アプリケー
ションが実行すべきことは、関連する数値を供給するこ
とだけである。ビジュアル・ベーシックは割込み駆動で
あるので、これはDSPが音声ブロックに対応する出力
ボリュームをワークステーションにコピーし、次に割込
みを呼出すことにより容易に達成される。割込みはアプ
リケーションにイベントを生成し、それに対してVUメ
ータにコピーされる新たな出力ボリュームを通知する。
実際に、割込みは音声ブロックのセットに対するボリュ
ーム読出しの完全なセット、すなわち各音声ストリーム
に対して1つのボリュームの読出しの使用可能性を伝え
るために使用される。(DSPはネットワークへの伝送
のためにそのワークステーションにおいて生成される出
力音声信号に関連して、既に1音声ブロック当たり1割
込みを実行する。)同様にボリューム制御バー722も
またビジュアル・ベーシックにおいて提供される機構で
ある("スクロール・バー"と称される)。ビジュアル・
ベーシックは制御バーに関連する全てのグラフィックス
を扱い、そうしたものの中にはセレクタの位置が含ま
れ、またボリュームがユーザにより更新される度に、ア
プリケーションに更新されたボリューム値をパスする。
アプリケーションは次にこの更新値をDSPに書込み、
それに従いボリュームが変更される。無音ボタン723
はビジュアル・ベーシックにより提供される別の表示機
構であり、各音声ストリームの単純なオン/オフ制御を
可能とする。無音ボタンが活動化される度に、アプリケ
ーションは重みパラメータの前の値を記憶する必要があ
る。それにより、無音ボタンが次に押される時にこの値
が復元される。
【0039】上述のユーザ・インタフェースに関する多
くの変更が可能であることが理解されよう。例えばVU
メータがセグメント化されたり、アナログ・レベル・メ
ータにより置換される。より単純なアプローチでは、参
加者からの音声出力の有無に応答して、色を変えるだけ
のオン/オフ標識であったりする。ボリューム制御機能
はダイアルを用いて、或いは2つのプッシュ・ボタンで
はなく、ドラッグ・アンド・ドロップ・スライダにより
実現される。無音ボタンがボリューム制御バーに組込ま
れてもよい。こうした変更は当業者のプログラミング能
力の範囲内において可能である。
くの変更が可能であることが理解されよう。例えばVU
メータがセグメント化されたり、アナログ・レベル・メ
ータにより置換される。より単純なアプローチでは、参
加者からの音声出力の有無に応答して、色を変えるだけ
のオン/オフ標識であったりする。ボリューム制御機能
はダイアルを用いて、或いは2つのプッシュ・ボタンで
はなく、ドラッグ・アンド・ドロップ・スライダにより
実現される。無音ボタンがボリューム制御バーに組込ま
れてもよい。こうした変更は当業者のプログラミング能
力の範囲内において可能である。
【0040】上述のシステムでは、ユーザは各音声入力
ストリームのボリューム制御を効果的に制限されるが、
他のシステムでは、ユーザは頻繁な周波数制御(すなわ
ち高音部及び基本調整)などのより高度な制御を提供さ
れる。これはDSPが時間領域内の音声信号をFIRま
たはIIRフィルタにより乗じることにより、比較的容
易に実現される。周波数制御は図7のボリューム制御バ
ーに類似の方法によりユーザに表現され、周波数制御の
変更はFIRまたはIIRフィルタ係数の適切な変化を
生成する。これらの高度な制御は、例えばG.711で
はなくG.721音声伝送標準を使用するシステムの場
合のように、ネットワーク上を伝送される音声信号の品
質が向上するにつれ、ますます要望される。
ストリームのボリューム制御を効果的に制限されるが、
他のシステムでは、ユーザは頻繁な周波数制御(すなわ
ち高音部及び基本調整)などのより高度な制御を提供さ
れる。これはDSPが時間領域内の音声信号をFIRま
たはIIRフィルタにより乗じることにより、比較的容
易に実現される。周波数制御は図7のボリューム制御バ
ーに類似の方法によりユーザに表現され、周波数制御の
変更はFIRまたはIIRフィルタ係数の適切な変化を
生成する。これらの高度な制御は、例えばG.711で
はなくG.721音声伝送標準を使用するシステムの場
合のように、ネットワーク上を伝送される音声信号の品
質が向上するにつれ、ますます要望される。
【0041】まとめとして、本発明の構成に関して以下
の事項を開示する。
の事項を開示する。
【0042】(1)ネットワークに接続されて、該ネッ
トワークから各々がデジタル音声サンプルのシーケンス
を含む多重音声入力ストリームを受信するコンピュータ
・ワークステーションであって、各音声入力ストリーム
からのデジタル音声サンプルを別々のキューに記憶する
手段と、各キューから1つずつのデジタル音声サンプル
を含むセットのシーケンスを形成する手段と、各音声入
力ストリームが関連する重みパラメータを有し、デジタ
ル音声サンプルの各セットの加重合計を生成する手段
と、加重合計のシーケンスから音声出力を生成する手段
とユーザ入力に応答して、多重音声ストリームの音声出
力内の相対ボリュームを制御するために、前記重みパラ
メータを調整する手段と、を含む、コンピュータ・ワー
クステーション。 (2)各前記音声入力ストリームが現在無音かどうかを
示すビジュアル指示を提供する手段を含む、前記(1)
記載のコンピュータ・ワークステーション。 (3)前記ビジュアル指示が各前記音声入力ストリーム
の瞬時音響ボリュームを示す、前記(2)記載のコンピ
ュータ・ワークステーション。 (4)前記ビジュアル指示が、各前記音声入力ストリー
ムの起点のビジュアル表現の近傍に表示される、前記
(2)または(3)記載のコンピュータ・ワークステー
ション。 (5)各前記音声入力ストリームに対して、デジタル音
声サンプルのシーケンスから走行2乗平均平方根値を生
成する手段を含む、前記(3)または(4)記載のコン
ピュータ・ワークステーション。 (6)入力音声データが各々が所定数のデジタル音声サ
ンプルを含むブロック単位で到来し、前記ビジュアル指
示が音声データの各新たなブロックに対応して更新され
る、前記(2)乃至(5)のいずれかに記載のコンピュ
ータ・ワークステーション。 (7)前記多重音声入力ストリームの任意のストリーム
からの音声出力を禁止する手段を含む、前記(1)乃至
(6)のいずれかに記載のコンピュータ・ワークステー
ション。 (8)ユーザに前記重みパラメータの値のビジュアル指
示を提供する手段を含み、該手段はユーザのマウス・オ
ペレーションに応答して、前記重みパラメータを調整す
る、前記(1)乃至(7)のいずれかに記載のコンピュ
ータ・ワークステーション。 (9)ネットワークに接続されて、各々がデジタル音声
サンプルのシーケンスを含む多重音声入力ストリームを
受信するコンピュータ・ワークステーションを動作する
方法であって、各音声入力ストリームからのデジタル音
声サンプルを別々のキューに記憶するステップと、各キ
ューから1つずつのデジタル音声サンプルを含むセット
のシーケンスを形成するステップと、各音声入力ストリ
ームが関連する重みパラメータを有し、デジタル音声サ
ンプルの各セットの加重合計を生成するステップと、加
重合計のシーケンスから音声出力を生成するステップ
と、ユーザ入力に応答して、多重音声ストリームの音声
出力における相対ボリュームを制御するために、前記重
みパラメータを調整するステップと、を含む、動作方
法。 (10)各前記音声入力ストリームに対して、該音声ス
トリームの瞬時音響ボリュームを示すビジュアル指示を
提供するステップを含む、前記(9)記載の動作方法。
トワークから各々がデジタル音声サンプルのシーケンス
を含む多重音声入力ストリームを受信するコンピュータ
・ワークステーションであって、各音声入力ストリーム
からのデジタル音声サンプルを別々のキューに記憶する
手段と、各キューから1つずつのデジタル音声サンプル
を含むセットのシーケンスを形成する手段と、各音声入
力ストリームが関連する重みパラメータを有し、デジタ
ル音声サンプルの各セットの加重合計を生成する手段
と、加重合計のシーケンスから音声出力を生成する手段
とユーザ入力に応答して、多重音声ストリームの音声出
力内の相対ボリュームを制御するために、前記重みパラ
メータを調整する手段と、を含む、コンピュータ・ワー
クステーション。 (2)各前記音声入力ストリームが現在無音かどうかを
示すビジュアル指示を提供する手段を含む、前記(1)
記載のコンピュータ・ワークステーション。 (3)前記ビジュアル指示が各前記音声入力ストリーム
の瞬時音響ボリュームを示す、前記(2)記載のコンピ
ュータ・ワークステーション。 (4)前記ビジュアル指示が、各前記音声入力ストリー
ムの起点のビジュアル表現の近傍に表示される、前記
(2)または(3)記載のコンピュータ・ワークステー
ション。 (5)各前記音声入力ストリームに対して、デジタル音
声サンプルのシーケンスから走行2乗平均平方根値を生
成する手段を含む、前記(3)または(4)記載のコン
ピュータ・ワークステーション。 (6)入力音声データが各々が所定数のデジタル音声サ
ンプルを含むブロック単位で到来し、前記ビジュアル指
示が音声データの各新たなブロックに対応して更新され
る、前記(2)乃至(5)のいずれかに記載のコンピュ
ータ・ワークステーション。 (7)前記多重音声入力ストリームの任意のストリーム
からの音声出力を禁止する手段を含む、前記(1)乃至
(6)のいずれかに記載のコンピュータ・ワークステー
ション。 (8)ユーザに前記重みパラメータの値のビジュアル指
示を提供する手段を含み、該手段はユーザのマウス・オ
ペレーションに応答して、前記重みパラメータを調整す
る、前記(1)乃至(7)のいずれかに記載のコンピュ
ータ・ワークステーション。 (9)ネットワークに接続されて、各々がデジタル音声
サンプルのシーケンスを含む多重音声入力ストリームを
受信するコンピュータ・ワークステーションを動作する
方法であって、各音声入力ストリームからのデジタル音
声サンプルを別々のキューに記憶するステップと、各キ
ューから1つずつのデジタル音声サンプルを含むセット
のシーケンスを形成するステップと、各音声入力ストリ
ームが関連する重みパラメータを有し、デジタル音声サ
ンプルの各セットの加重合計を生成するステップと、加
重合計のシーケンスから音声出力を生成するステップ
と、ユーザ入力に応答して、多重音声ストリームの音声
出力における相対ボリュームを制御するために、前記重
みパラメータを調整するステップと、を含む、動作方
法。 (10)各前記音声入力ストリームに対して、該音声ス
トリームの瞬時音響ボリュームを示すビジュアル指示を
提供するステップを含む、前記(9)記載の動作方法。
【0043】
【発明の効果】以上説明したように、本発明によれば、
ネットワークを介して行われる音声会議において各参加
者はその他の参加者の音声を特定し、コントロールする
ことが可能なコンピュータ・ワークステーションを提供
することができる。
ネットワークを介して行われる音声会議において各参加
者はその他の参加者の音声を特定し、コントロールする
ことが可能なコンピュータ・ワークステーションを提供
することができる。
【図1】コンピュータ・ネットワークを表す図である。
【図2】音声会議において使用されるコンピュータ・ワ
ークステーションの単純化したブロック図である。
ークステーションの単純化したブロック図である。
【図3】図2のコンピュータ・ワークステーション内の
音声アダプタ・カードの単純化したブロック図である。
音声アダプタ・カードの単純化したブロック図である。
【図4】入力音声パケットに対して実行される処理を表
す流れ図である。
す流れ図である。
【図5】プレイアウト待機中の入力音声パケットのキュ
ーを表す図である。
ーを表す図である。
【図6】音声アダプタ・カード上のデジタル信号プロセ
ッサにより実行される処理を表す流れ図である。
ッサにより実行される処理を表す流れ図である。
【図7】図2のワークステーションのユーザに提供され
る典型的な画面インタフェースを示す図である。
る典型的な画面インタフェースを示す図である。
【図8】図2のワークステーション上で実行される主ソ
フトウェア・コンポーネントを示す図である。
フトウェア・コンポーネントを示す図である。
2 ローカル・エリア・ネットワーク(LAN) 10 システム・ユニット 12 表示画面 14 キーボード 16 マウス 22 マイクロプロセッサ 24、52 半導体メモリ 26 PCバス 28 音声カード 30 トークン・リング・アダプタ・カード 42、54 A/D変換器 44 CODEC 46 デジタル信号プロセッサ(DSP) 48、50 ダブル・バッファ 56 ラウドスピーカ 500 主メモリ 501、502、503 サブキュー 700 画面 720 イメージ・ウィンドウ 721 ボリューム表示 VUメータ 722 ボリューム制御バー 723 マウス・ボックス 無音ボタン 724 名前ボックス 810 アプリケーション 812 アプリケーション・サポート層 814 オペレーティング・システム 816 通信ソフトウェア 818 デバイス・ドライバ
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ピーター・リチャード・クリップス イギリス、エス・オー3 6ユー・ユー、 ハンプシャー、サウスプトン、ロックス・ ヒース、メドウ・アベニュー 31 (72)発明者 エイドリアン・ガイ イギリス、ピィ・オー15 6エル・イー、 ハンプシャー、フェアハム、フェアハム・ パーク・ロード 29
Claims (10)
- 【請求項1】ネットワークに接続されて、該ネットワー
クから各々がデジタル音声サンプルのシーケンスを含む
多重音声入力ストリームを受信するコンピュータ・ワー
クステーションであって、 各音声入力ストリームからのデジタル音声サンプルを別
々のキューに記憶する手段と、 各キューから1つずつのデジタル音声サンプルを含むセ
ットのシーケンスを形成する手段と、 各音声入力ストリームが関連する重みパラメータを有
し、デジタル音声サンプルの各セットの加重合計を生成
する手段と、 加重合計のシーケンスから音声出力を生成する手段とユ
ーザ入力に応答して、多重音声ストリームの音声出力内
の相対ボリュームを制御するために、前記重みパラメー
タを調整する手段と、 を含む、コンピュータ・ワークステーション。 - 【請求項2】各前記音声入力ストリームが現在無音かど
うかを示すビジュアル指示を提供する手段を含む、請求
項1記載のコンピュータ・ワークステーション。 - 【請求項3】前記ビジュアル指示が各前記音声入力スト
リームの瞬時音響ボリュームを示す、請求項2記載のコ
ンピュータ・ワークステーション。 - 【請求項4】前記ビジュアル指示が、各前記音声入力ス
トリームの起点のビジュアル表現の近傍に表示される、
請求項2または3記載のコンピュータ・ワークステーシ
ョン。 - 【請求項5】各前記音声入力ストリームに対して、デジ
タル音声サンプルのシーケンスから2乗平均平方根値を
生成する手段を含む、請求項3または4記載のコンピュ
ータ・ワークステーション。 - 【請求項6】入力音声データが各々が所定数のデジタル
音声サンプルを含むブロック単位で到来し、前記ビジュ
アル指示が音声データの各新たなブロックに対応して更
新される、請求項2乃至5のいずれかに記載のコンピュ
ータ・ワークステーション。 - 【請求項7】前記多重音声入力ストリームの任意のスト
リームからの音声出力を禁止する手段を含む、請求項1
乃至6のいずれかに記載のコンピュータ・ワークステー
ション。 - 【請求項8】ユーザに前記重みパラメータの値のビジュ
アル指示を提供する手段を含み、該手段はユーザのマウ
ス・オペレーションに応答して、前記重みパラメータを
調整する、請求項1乃至7のいずれかに記載のコンピュ
ータ・ワークステーション。 - 【請求項9】ネットワークに接続されて、各々がデジタ
ル音声サンプルのシーケンスを含む多重音声入力ストリ
ームを受信するコンピュータ・ワークステーションを動
作する方法であって、 各音声入力ストリームからのデジタル音声サンプルを別
々のキューに記憶するステップと、 各キューから1つずつのデジタル音声サンプルを含むセ
ットのシーケンスを形成するステップと、 各音声入力ストリームが関連する重みパラメータを有
し、デジタル音声サンプルの各セットの加重合計を生成
するステップと、 加重合計のシーケンスから音声出力を生成するステップ
と、 ユーザ入力に応答して、多重音声ストリームの音声出力
における相対ボリュームを制御するために、前記重みパ
ラメータを調整するステップと、 を含む、動作方法。 - 【請求項10】各前記音声入力ストリームに対して、該
音声ストリームの瞬時音響ボリュームを示すビジュアル
指示を提供するステップを含む、請求項9記載の動作方
法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB9325924A GB2284968A (en) | 1993-12-18 | 1993-12-18 | Audio conferencing system |
GB9325924.0 | 1993-12-18 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07200424A true JPH07200424A (ja) | 1995-08-04 |
JP2537024B2 JP2537024B2 (ja) | 1996-09-25 |
Family
ID=10746850
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP6256409A Expired - Fee Related JP2537024B2 (ja) | 1993-12-18 | 1994-10-21 | 音声会議システム及びその制御方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US5539741A (ja) |
EP (1) | EP0659006A3 (ja) |
JP (1) | JP2537024B2 (ja) |
KR (1) | KR0133416B1 (ja) |
CN (1) | CN1097231C (ja) |
GB (1) | GB2284968A (ja) |
IN (1) | IN190028B (ja) |
TW (1) | TW366633B (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069136A (ja) * | 2013-09-30 | 2015-04-13 | 株式会社ナカヨ | 話者別音量調整機能を有する通信会議装置 |
Families Citing this family (154)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5736982A (en) * | 1994-08-03 | 1998-04-07 | Nippon Telegraph And Telephone Corporation | Virtual space apparatus with avatars and speech |
RU2144283C1 (ru) * | 1995-06-02 | 2000-01-10 | Интел Корпорейшн | Способ и устройство для управления вводом участников в систему конференц-связи |
US5703794A (en) * | 1995-06-20 | 1997-12-30 | Microsoft Corporation | Method and system for mixing audio streams in a computing system |
US5889764A (en) * | 1995-08-31 | 1999-03-30 | Intel Corporation | Low-latency multi-party audio chat |
US5903868A (en) * | 1995-11-22 | 1999-05-11 | Yuen; Henry C. | Audio recorder with retroactive storage |
JPH09231224A (ja) * | 1996-02-26 | 1997-09-05 | Fuji Xerox Co Ltd | 言語情報処理装置 |
JPH1075310A (ja) * | 1996-08-29 | 1998-03-17 | Nec Corp | 多地点テレビ会議システム |
US5923747A (en) * | 1996-09-27 | 1999-07-13 | Rockwell International Corp. | Communications system and interface circuit for interconnecting telephonic switch and agent computer |
US5963217A (en) * | 1996-11-18 | 1999-10-05 | 7Thstreet.Com, Inc. | Network conference system using limited bandwidth to generate locally animated displays |
US5916302A (en) * | 1996-12-06 | 1999-06-29 | International Business Machines Corporation | Multimedia conferencing using parallel networks |
DE19724719C2 (de) * | 1997-06-11 | 2000-05-11 | Siemens Ag | Audiokonferenzsystem |
CA2265965C (en) * | 1997-07-24 | 2007-01-09 | Oki Electric Industry Co., Ltd. | Concentrator for speech telephones and method of communication over lan using same |
US7561538B2 (en) * | 1997-07-24 | 2009-07-14 | Oki Electronic Industry Co. Ltd. | Concentrator for speech telephones and method of communication over LAN using same |
JPH11127188A (ja) | 1997-10-20 | 1999-05-11 | Fujitsu Ltd | 蓄積交換型電子会議システムにおける情報伝達装置及び方法並びに情報伝達プログラムを記録した媒体 |
US6125115A (en) * | 1998-02-12 | 2000-09-26 | Qsound Labs, Inc. | Teleconferencing method and apparatus with three-dimensional sound positioning |
US6230130B1 (en) * | 1998-05-18 | 2001-05-08 | U.S. Philips Corporation | Scalable mixing for speech streaming |
US6466550B1 (en) * | 1998-11-11 | 2002-10-15 | Cisco Technology, Inc. | Distributed conferencing system utilizing data networks |
US6262979B1 (en) * | 1998-12-01 | 2001-07-17 | 3Com Corporation | Telecommunication conferencing system and method |
US6522739B1 (en) | 1998-12-30 | 2003-02-18 | Samsung Thales Co., Ltd. | Apparatus and method for multi-access conference call in exchange system |
US6453022B1 (en) * | 1998-12-31 | 2002-09-17 | At&T Corporation | Multi-line telephone with input/output mixing and audio control |
US6311161B1 (en) | 1999-03-22 | 2001-10-30 | International Business Machines Corporation | System and method for merging multiple audio streams |
JP3617371B2 (ja) * | 1999-05-07 | 2005-02-02 | セイコーエプソン株式会社 | プロジェクタおよび情報記憶媒体 |
US7006616B1 (en) * | 1999-05-21 | 2006-02-28 | Terayon Communication Systems, Inc. | Teleconferencing bridge with EdgePoint mixing |
EP1094657A1 (en) * | 1999-10-18 | 2001-04-25 | BRITISH TELECOMMUNICATIONS public limited company | Mobile conferencing system and method |
AUPQ378199A0 (en) * | 1999-11-01 | 1999-11-25 | Ross, Richard | Audio queue management system |
US6714826B1 (en) | 2000-03-13 | 2004-03-30 | International Business Machines Corporation | Facility for simultaneously outputting both a mixed digital audio signal and an unmixed digital audio signal multiple concurrently received streams of digital audio data |
US6501739B1 (en) * | 2000-05-25 | 2002-12-31 | Remoteability, Inc. | Participant-controlled conference calling system |
US7313593B1 (en) | 2000-10-24 | 2007-12-25 | International Business Machines Corporation | Method and apparatus for providing full duplex and multipoint IP audio streaming |
DE10062342A1 (de) * | 2000-12-14 | 2002-07-11 | Eads Defence & Security Ntwk | Verfahren und Vorrichtung zur Realisierung von Sprachkonferenzen |
US6792092B1 (en) | 2000-12-20 | 2004-09-14 | Cisco Technology, Inc. | Method and system for independent participant control of audio during multiparty communication sessions |
GB2374241B (en) * | 2001-04-03 | 2004-07-07 | Trilogy Broadcast | Management internet protocol unicast and multicast communications |
US7535995B1 (en) * | 2002-01-29 | 2009-05-19 | Cisco Technology, Inc. | System and method for volume indication during a communication session |
EP1483661A1 (en) * | 2002-03-04 | 2004-12-08 | Telefonaktiebolaget LM Ericsson (publ) | An arrangement and a method for handling an audio signal |
US20030194072A1 (en) * | 2002-04-11 | 2003-10-16 | Macnamara John J. | Control of conference bridges |
US6741595B2 (en) * | 2002-06-11 | 2004-05-25 | Netrake Corporation | Device for enabling trap and trace of internet protocol communications |
US7280133B2 (en) | 2002-06-21 | 2007-10-09 | Koninklijke Philips Electronics, N.V. | System and method for queuing and presenting audio messages |
US7023965B2 (en) * | 2002-07-17 | 2006-04-04 | Avaya Technology Corp. | Apparatus and method for displaying a name of a speaker on a telecommunication conference call |
US6925357B2 (en) | 2002-07-25 | 2005-08-02 | Intouch Health, Inc. | Medical tele-robotic system |
US20040162637A1 (en) | 2002-07-25 | 2004-08-19 | Yulun Wang | Medical tele-robotic system with a master remote station with an arbitrator |
US7280650B2 (en) * | 2002-08-28 | 2007-10-09 | Intel Corporation | Method and apparatus to manage a conference |
US6890289B2 (en) * | 2002-10-17 | 2005-05-10 | Joseph Spinosa | Back-board |
US7065198B2 (en) | 2002-10-23 | 2006-06-20 | International Business Machines Corporation | System and method for volume control management in a personal telephony recorder |
US7142678B2 (en) * | 2002-11-26 | 2006-11-28 | Microsoft Corporation | Dynamic volume control |
US6888935B1 (en) | 2003-01-15 | 2005-05-03 | Cisco Technology, Inc. | Speak-louder signaling system for conference calls |
US7187764B2 (en) | 2003-04-23 | 2007-03-06 | Siemens Communications, Inc. | Automatic speak-up indication for conference call attendees |
TWI222054B (en) * | 2003-06-02 | 2004-10-11 | Sunplus Technology Co Ltd | Simplified audio signal synthesis device |
US7916848B2 (en) * | 2003-10-01 | 2011-03-29 | Microsoft Corporation | Methods and systems for participant sourcing indication in multi-party conferencing and for audio source discrimination |
US7813836B2 (en) | 2003-12-09 | 2010-10-12 | Intouch Technologies, Inc. | Protocol for a remotely controlled videoconferencing robot |
US7522719B2 (en) * | 2004-01-13 | 2009-04-21 | International Business Machines Corporation | System and method for server based conference call volume management |
US7985138B2 (en) * | 2004-02-17 | 2011-07-26 | International Business Machines Corporation | SIP based VoIP multiplayer network games |
US20050204438A1 (en) * | 2004-02-26 | 2005-09-15 | Yulun Wang | Graphical interface for a remote presence system |
US8600077B2 (en) * | 2004-04-08 | 2013-12-03 | Koninklijke Philips N.V. | Audio level control |
US8077963B2 (en) | 2004-07-13 | 2011-12-13 | Yulun Wang | Mobile robot with a head-based movement mapping scheme |
US20060023061A1 (en) * | 2004-07-27 | 2006-02-02 | Vaszary Mark K | Teleconference audio quality monitoring |
US7940705B2 (en) * | 2004-09-09 | 2011-05-10 | Cisco Technology, Inc. | Method and system for blocking communication within a conference service |
CN100438332C (zh) * | 2004-11-06 | 2008-11-26 | 腾讯科技(深圳)有限公司 | 一种音量限制方法和系统 |
JP4513514B2 (ja) | 2004-11-10 | 2010-07-28 | 日本電気株式会社 | 多地点通話システム、携帯端末装置及びそれらに用いる音量調整方法並びにそのプログラム |
US8045998B2 (en) | 2005-06-08 | 2011-10-25 | Cisco Technology, Inc. | Method and system for communicating using position information |
US7633914B2 (en) * | 2005-08-10 | 2009-12-15 | Cisco Technology, Inc. | Method and system for providing interoperable communications with location information |
US7636339B2 (en) * | 2005-08-10 | 2009-12-22 | Cisco Technology, Inc. | Method and system for automatic configuration of virtual talk groups based on location of media sources |
US7706339B2 (en) * | 2005-08-10 | 2010-04-27 | Cisco Technology, Inc. | Method and system for communicating media based on location of media source |
US7869386B2 (en) * | 2005-08-29 | 2011-01-11 | Cisco Technology, Inc. | Method and system for conveying media source location information |
US9198728B2 (en) | 2005-09-30 | 2015-12-01 | Intouch Technologies, Inc. | Multi-camera mobile teleconferencing platform |
KR100732115B1 (ko) | 2005-10-01 | 2007-06-27 | 엘지전자 주식회사 | 통화 상태 표시 기능을 갖는 이동 통신 단말기 및 그 방법 |
US7808521B2 (en) * | 2006-01-09 | 2010-10-05 | Apple Inc. | Multimedia conference recording and manipulation interface |
US7668304B2 (en) | 2006-01-25 | 2010-02-23 | Avaya Inc. | Display hierarchy of participants during phone call |
US8085671B2 (en) * | 2006-02-27 | 2011-12-27 | Cisco Technology, Inc. | Method and system for providing interoperable communications with congestion management |
US8260338B2 (en) * | 2006-02-28 | 2012-09-04 | Cisco Technology, Inc. | Method and system for providing interoperable communications with dynamic event area allocation |
JP4525618B2 (ja) * | 2006-03-06 | 2010-08-18 | ソニー株式会社 | 映像監視システムおよび映像監視プログラム |
US9112746B2 (en) * | 2006-04-05 | 2015-08-18 | Cisco Technology, Inc. | Method and system for managing virtual talk groups |
US7843486B1 (en) | 2006-04-10 | 2010-11-30 | Avaya Inc. | Selective muting for conference call participants |
CN1968320A (zh) * | 2006-04-27 | 2007-05-23 | 华为技术有限公司 | 实现语音播放业务的方法 |
US7860070B2 (en) * | 2006-05-10 | 2010-12-28 | Cisco Technology, Inc. | Providing multiple virtual talk group communication sessions |
US7831270B2 (en) * | 2006-05-18 | 2010-11-09 | Cisco Technology, Inc. | Providing virtual talk group communication sessions in accordance with endpoint resources |
US7639634B2 (en) * | 2006-06-02 | 2009-12-29 | Cisco Technology, Inc. | Method and System for Joining a virtual talk group |
US20070291128A1 (en) * | 2006-06-15 | 2007-12-20 | Yulun Wang | Mobile teleconferencing system that projects an image provided by a mobile robot |
US8849679B2 (en) | 2006-06-15 | 2014-09-30 | Intouch Technologies, Inc. | Remote controlled robot system that provides medical images |
US20080014865A1 (en) * | 2006-06-16 | 2008-01-17 | Pinnacle Peak Holding Corporation (Dba Setcom Corp.) | Radio and public address accessory system with wireless interface |
EP2047669B1 (de) * | 2006-07-28 | 2014-05-21 | Unify GmbH & Co. KG | Verfahren zum durchführen einer audiokonferenz, audiokonferenzeinrichtung und umschalteverfahren zwischen kodierern |
US8670537B2 (en) * | 2006-07-31 | 2014-03-11 | Cisco Technology, Inc. | Adjusting audio volume in a conference call environment |
US8037414B2 (en) | 2006-09-14 | 2011-10-11 | Avaya Inc. | Audible computer user interface method and apparatus |
US8570909B1 (en) | 2006-10-17 | 2013-10-29 | Cisco Technology, Inc. | Method and system for providing an indication of a communication |
US8189460B2 (en) * | 2006-12-28 | 2012-05-29 | Cisco Technology, Inc. | Method and system for providing congestion management within a virtual talk group |
US8265793B2 (en) | 2007-03-20 | 2012-09-11 | Irobot Corporation | Mobile robot for telecommunication |
US9160783B2 (en) | 2007-05-09 | 2015-10-13 | Intouch Technologies, Inc. | Robot system that operates through a network firewall |
US8874159B2 (en) * | 2007-05-10 | 2014-10-28 | Cisco Technology, Inc. | Method and system for handling dynamic incidents |
US7995732B2 (en) * | 2007-10-04 | 2011-08-09 | At&T Intellectual Property I, Lp | Managing audio in a multi-source audio environment |
US9602295B1 (en) | 2007-11-09 | 2017-03-21 | Avaya Inc. | Audio conferencing server for the internet |
US8972594B2 (en) * | 2008-02-11 | 2015-03-03 | Microsoft Corporation | Media mix wiring protocol for media control |
US10875182B2 (en) | 2008-03-20 | 2020-12-29 | Teladoc Health, Inc. | Remote presence system mounted to operating room hardware |
US8179418B2 (en) | 2008-04-14 | 2012-05-15 | Intouch Technologies, Inc. | Robotic based health care system |
US8170241B2 (en) | 2008-04-17 | 2012-05-01 | Intouch Technologies, Inc. | Mobile tele-presence system with a microphone system |
US9193065B2 (en) | 2008-07-10 | 2015-11-24 | Intouch Technologies, Inc. | Docking system for a tele-presence robot |
US9842192B2 (en) | 2008-07-11 | 2017-12-12 | Intouch Technologies, Inc. | Tele-presence robot system with multi-cast features |
US8315409B2 (en) * | 2008-09-16 | 2012-11-20 | International Business Machines Corporation | Modifications of audio communications in an online environment |
US8340819B2 (en) | 2008-09-18 | 2012-12-25 | Intouch Technologies, Inc. | Mobile videoconferencing robot system with network adaptive driving |
US8996165B2 (en) | 2008-10-21 | 2015-03-31 | Intouch Technologies, Inc. | Telepresence robot with a camera boom |
US9138891B2 (en) | 2008-11-25 | 2015-09-22 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US8463435B2 (en) | 2008-11-25 | 2013-06-11 | Intouch Technologies, Inc. | Server connectivity control for tele-presence robot |
US8126494B2 (en) * | 2008-12-19 | 2012-02-28 | Cisco Technology, Inc. | System and method for providing a trunked radio and gateway |
US20100161727A1 (en) * | 2008-12-19 | 2010-06-24 | Cisco Technology, Inc. | System and Method for Accelerating a Wide Area Notification |
US8041378B2 (en) | 2008-12-19 | 2011-10-18 | Cisco Technology, Inc. | System and method for providing channel configurations in a communications environment |
US8849680B2 (en) | 2009-01-29 | 2014-09-30 | Intouch Technologies, Inc. | Documentation through a remote presence robot |
US9268398B2 (en) * | 2009-03-31 | 2016-02-23 | Voispot, Llc | Virtual meeting place system and method |
US8897920B2 (en) | 2009-04-17 | 2014-11-25 | Intouch Technologies, Inc. | Tele-presence robot system with software modularity, projector and laser pointer |
US8384755B2 (en) | 2009-08-26 | 2013-02-26 | Intouch Technologies, Inc. | Portable remote presence robot |
US11399153B2 (en) | 2009-08-26 | 2022-07-26 | Teladoc Health, Inc. | Portable telepresence apparatus |
US8363810B2 (en) * | 2009-09-08 | 2013-01-29 | Avaya Inc. | Method and system for aurally positioning voice signals in a contact center environment |
US8144633B2 (en) * | 2009-09-22 | 2012-03-27 | Avaya Inc. | Method and system for controlling audio in a collaboration environment |
US8547880B2 (en) * | 2009-09-30 | 2013-10-01 | Avaya Inc. | Method and system for replaying a portion of a multi-party audio interaction |
US11154981B2 (en) | 2010-02-04 | 2021-10-26 | Teladoc Health, Inc. | Robot user interface for telepresence robot system |
US8670017B2 (en) | 2010-03-04 | 2014-03-11 | Intouch Technologies, Inc. | Remote presence system including a cart that supports a robot face and an overhead camera |
US8495142B2 (en) * | 2010-03-11 | 2013-07-23 | Cisco Technology, Inc. | System and method for providing data channel management in a network environment |
US9564148B2 (en) * | 2010-05-18 | 2017-02-07 | Sprint Communications Company L.P. | Isolation and modification of audio streams of a mixed signal in a wireless communication device |
US8918213B2 (en) | 2010-05-20 | 2014-12-23 | Irobot Corporation | Mobile human interface robot |
US8935005B2 (en) | 2010-05-20 | 2015-01-13 | Irobot Corporation | Operating a mobile robot |
US9014848B2 (en) | 2010-05-20 | 2015-04-21 | Irobot Corporation | Mobile robot system |
US10343283B2 (en) | 2010-05-24 | 2019-07-09 | Intouch Technologies, Inc. | Telepresence robot system that can be accessed by a cellular phone |
US10808882B2 (en) | 2010-05-26 | 2020-10-20 | Intouch Technologies, Inc. | Tele-robotic system with a robot face placed on a chair |
US8744065B2 (en) | 2010-09-22 | 2014-06-03 | Avaya Inc. | Method and system for monitoring contact center transactions |
US9736312B2 (en) | 2010-11-17 | 2017-08-15 | Avaya Inc. | Method and system for controlling audio signals in multiple concurrent conference calls |
TW201225689A (en) * | 2010-12-03 | 2012-06-16 | Yare Technologies Inc | Conference system capable of independently adjusting audio input |
US9264664B2 (en) | 2010-12-03 | 2016-02-16 | Intouch Technologies, Inc. | Systems and methods for dynamic bandwidth allocation |
US8930019B2 (en) | 2010-12-30 | 2015-01-06 | Irobot Corporation | Mobile human interface robot |
US9323250B2 (en) | 2011-01-28 | 2016-04-26 | Intouch Technologies, Inc. | Time-dependent navigation of telepresence robots |
CN103459099B (zh) | 2011-01-28 | 2015-08-26 | 英塔茨科技公司 | 与一个可移动的远程机器人相互交流 |
US8838722B2 (en) | 2011-02-16 | 2014-09-16 | Masque Publishing, Inc. | Communications adaptable to mobile devices |
US9270784B2 (en) * | 2011-02-16 | 2016-02-23 | Masque Publishing, Inc. | Peer-to-peer communications |
US9620131B2 (en) | 2011-04-08 | 2017-04-11 | Evertz Microsystems Ltd. | Systems and methods for adjusting audio levels in a plurality of audio signals |
CN102739851B (zh) * | 2011-04-15 | 2014-01-22 | 鸿富锦精密工业(深圳)有限公司 | 具有音量调节功能的会议电话终端及方法 |
US10769739B2 (en) | 2011-04-25 | 2020-09-08 | Intouch Technologies, Inc. | Systems and methods for management of information among medical providers and facilities |
US9098611B2 (en) | 2012-11-26 | 2015-08-04 | Intouch Technologies, Inc. | Enhanced video interaction for a user interface of a telepresence network |
US20140139616A1 (en) | 2012-01-27 | 2014-05-22 | Intouch Technologies, Inc. | Enhanced Diagnostics for a Telepresence Robot |
GB2492103B (en) * | 2011-06-21 | 2018-05-23 | Metaswitch Networks Ltd | Multi party teleconference methods and systems |
JP5817276B2 (ja) * | 2011-07-14 | 2015-11-18 | 株式会社リコー | 多地点接続装置、映像音声端末、通信システム、及び信号処理方法 |
US8836751B2 (en) | 2011-11-08 | 2014-09-16 | Intouch Technologies, Inc. | Tele-presence system with a user interface that displays different communication links |
WO2013142642A1 (en) * | 2012-03-23 | 2013-09-26 | Dolby Laboratories Licensing Corporation | Clustering of audio streams in a 2d/3d conference scene |
US8902278B2 (en) | 2012-04-11 | 2014-12-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
US9251313B2 (en) | 2012-04-11 | 2016-02-02 | Intouch Technologies, Inc. | Systems and methods for visualizing and managing telepresence devices in healthcare networks |
US9361021B2 (en) | 2012-05-22 | 2016-06-07 | Irobot Corporation | Graphical user interfaces including touchpad driving interfaces for telemedicine devices |
EP2852881A4 (en) | 2012-05-22 | 2016-03-23 | Intouch Technologies Inc | GRAPHIC USER INTERFACES CONTAINING TOUCH PAD TOUCH INTERFACES FOR TELEMEDICINE DEVICES |
CN104469255A (zh) | 2013-09-16 | 2015-03-25 | 杜比实验室特许公司 | 改进的音频或视频会议 |
US9118767B1 (en) | 2013-03-28 | 2015-08-25 | Sprint Communications Company L.P. | Communication device audio control to combine incoming audio and select outgoing audio destinations |
CN103680513B (zh) * | 2013-12-13 | 2016-11-02 | 广州华多网络科技有限公司 | 语音信号处理方法、装置及服务器 |
JP6553052B2 (ja) | 2014-01-03 | 2019-07-31 | ハーマン インターナショナル インダストリーズ インコーポレイテッド | ジェスチャ相互作用式の装着可能な空間オーディオシステム |
US10079941B2 (en) | 2014-07-07 | 2018-09-18 | Dolby Laboratories Licensing Corporation | Audio capture and render device having a visual display and user interface for use for audio conferencing |
CN106664389A (zh) * | 2014-09-26 | 2017-05-10 | 英特尔公司 | 用于在视频会议中增强用户体验的技术 |
US20170187884A1 (en) * | 2015-12-23 | 2017-06-29 | Microsoft Technology Licensing, Llc | Controlling output volume levels |
US11862302B2 (en) | 2017-04-24 | 2024-01-02 | Teladoc Health, Inc. | Automated transcription and documentation of tele-health encounters |
US10402056B2 (en) * | 2017-06-28 | 2019-09-03 | Blue Jeans Network, Inc. | Selecting and managing devices to use for video conferencing |
US10483007B2 (en) | 2017-07-25 | 2019-11-19 | Intouch Technologies, Inc. | Modular telehealth cart with thermal imaging and touch screen user interface |
US11636944B2 (en) | 2017-08-25 | 2023-04-25 | Teladoc Health, Inc. | Connectivity infrastructure for a telehealth platform |
US10617299B2 (en) | 2018-04-27 | 2020-04-14 | Intouch Technologies, Inc. | Telehealth cart that supports a removable tablet with seamless audio/video switching |
JP2021184189A (ja) * | 2020-05-22 | 2021-12-02 | i Smart Technologies株式会社 | オンライン会議システム |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4389720A (en) * | 1981-04-23 | 1983-06-21 | Bell Telephone Laboratories, Incorporated | Distributed digital conferencing system |
JPS6190565A (ja) * | 1984-10-11 | 1986-05-08 | Iwatsu Electric Co Ltd | 会議通話方式 |
GB2177874B (en) * | 1985-07-19 | 1989-01-18 | Stc Plc | Conference circuit |
GB2207581A (en) * | 1987-07-22 | 1989-02-01 | Gec Avionics | Ring-shaped local area network for digital audio |
US4953159A (en) * | 1989-01-03 | 1990-08-28 | American Telephone And Telegraph Company | Audiographics conferencing arrangement |
US5014267A (en) * | 1989-04-06 | 1991-05-07 | Datapoint Corporation | Video conferencing network |
US5127001A (en) * | 1990-06-22 | 1992-06-30 | Unisys Corporation | Conference call arrangement for distributed network |
JP3308563B2 (ja) * | 1991-07-15 | 2002-07-29 | 株式会社日立製作所 | 多地点テレビ会議システム |
US5379280A (en) * | 1991-09-26 | 1995-01-03 | Ipc Information Systems, Inc. | Conferencing system for distributed switching network |
US5375068A (en) * | 1992-06-03 | 1994-12-20 | Digital Equipment Corporation | Video teleconferencing for networked workstations |
-
1993
- 1993-12-18 GB GB9325924A patent/GB2284968A/en not_active Withdrawn
-
1994
- 1994-10-21 JP JP6256409A patent/JP2537024B2/ja not_active Expired - Fee Related
- 1994-11-09 EP EP94308254A patent/EP0659006A3/en not_active Ceased
- 1994-11-28 IN IN1534DE1994 patent/IN190028B/en unknown
- 1994-11-29 US US08/346,553 patent/US5539741A/en not_active Expired - Fee Related
- 1994-12-14 CN CN94119071A patent/CN1097231C/zh not_active Expired - Fee Related
- 1994-12-16 KR KR1019940034643A patent/KR0133416B1/ko not_active IP Right Cessation
-
1995
- 1995-03-10 TW TW084102303A patent/TW366633B/zh active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015069136A (ja) * | 2013-09-30 | 2015-04-13 | 株式会社ナカヨ | 話者別音量調整機能を有する通信会議装置 |
Also Published As
Publication number | Publication date |
---|---|
JP2537024B2 (ja) | 1996-09-25 |
KR950022401A (ko) | 1995-07-28 |
TW366633B (en) | 1999-08-11 |
KR0133416B1 (ko) | 1998-04-27 |
GB2284968A (en) | 1995-06-21 |
EP0659006A2 (en) | 1995-06-21 |
IN190028B (ja) | 2003-05-31 |
CN1097231C (zh) | 2002-12-25 |
GB9325924D0 (en) | 1994-02-23 |
EP0659006A3 (en) | 1999-03-03 |
US5539741A (en) | 1996-07-23 |
CN1111775A (zh) | 1995-11-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2537024B2 (ja) | 音声会議システム及びその制御方法 | |
US6330022B1 (en) | Digital processing apparatus and method to support video conferencing in variable contexts | |
JP3216978B2 (ja) | マルチメディア・ストリーム転送方法 | |
US6100882A (en) | Textual recording of contributions to audio conference using speech recognition | |
US7046780B2 (en) | Efficient buffer allocation for current and predicted active speakers in voice conferencing systems | |
US7612793B2 (en) | Spatially correlated audio in multipoint videoconferencing | |
US6192395B1 (en) | System and method for visually identifying speaking participants in a multi-participant networked event | |
US5930752A (en) | Audio interactive system | |
JP2003500935A (ja) | エッジポイントミキシングを有する遠隔会議ブリッジ | |
GB2349055A (en) | Virtual audio-visual conference | |
AU3106000A (en) | Telecommunication conferencing system and method | |
US20040249967A1 (en) | Primary data stream communication | |
Schmandt et al. | Mediated voice communication via mobile IP | |
Hardman et al. | Enhanced reality audio in interactive networked environments | |
Seligmann et al. | Providing assurances in a multimedia interactive environment | |
JPH08163122A (ja) | 遠隔会議の方法 | |
JP2003339034A (ja) | ネットワーク会議システム、ネットワーク会議方法およびネットワーク会議プログラム | |
KR100310283B1 (ko) | 음성의 3-d 국소화를 향상시키는 방법 | |
JP2823571B2 (ja) | 分散多地点通信会議装置 | |
GB2283153A (en) | Audio communication apparatus | |
JPS63299628A (ja) | マルチメディアメ−ルシステム同期制御方式 | |
WO2024100920A1 (ja) | 情報処理装置、情報処理方法及び情報処理用プログラム | |
JP3573850B2 (ja) | ビデオ会議システム | |
JP2793679B2 (ja) | 描画処理装置 | |
JPH10304088A (ja) | 端末装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |