JP2000092218A - 電話会議の際のオ―ディオ信号を効果的に混合するための技法 - Google Patents

電話会議の際のオ―ディオ信号を効果的に混合するための技法

Info

Publication number
JP2000092218A
JP2000092218A JP11240665A JP24066599A JP2000092218A JP 2000092218 A JP2000092218 A JP 2000092218A JP 11240665 A JP11240665 A JP 11240665A JP 24066599 A JP24066599 A JP 24066599A JP 2000092218 A JP2000092218 A JP 2000092218A
Authority
JP
Japan
Prior art keywords
audio
representation
representations
audio representation
terminals
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11240665A
Other languages
English (en)
Inventor
Murali Aravamudan
アラヴァムダン ムラリ
Prakash Iyer
アイヤー プラカシュ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2000092218A publication Critical patent/JP2000092218A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/14Systems for two-way working
    • H04N7/15Conference systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/02Arrangements for generating broadcast information; Arrangements for generating broadcast-related information with a direct linking to broadcast information or to broadcast space-time; Arrangements for simultaneous generation of broadcast information and broadcast-related information
    • H04H60/04Studio equipment; Interconnection of studios
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M7/00Arrangements for interconnection between switching centres
    • H04M7/12Arrangements for interconnection between switching centres for working between exchanges having different types of switching equipment, e.g. power-driven and step by step or decimal and non-decimal

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

(57)【要約】 【課題】 本発明は、電話会議の際のオーディオ信号を
効果的に混合するための技法に関する。 【解決手段】 電話会議の際に、本発明によるミキサに
よって、複数の異なる箇所に位置する出席者間のオーデ
ィオ通信が処理される。これら複数の出席者のおのおの
に由来する発話(アタランス)含む音響効果を表すオー
ディオ信号がミキサに送信される。ミキサは、受信され
た各信号からサンプルを生成する。各サンプル期間にお
いて、ミキサは、最も高いエネルギーを持つサンプル
を、その最も高いエネルギーのサンプルに寄与したユー
ザを除く各ユーザに出力されるべき混合サンプルとして
選択する。最も高いエネルギーのサンプルに寄与したユ
ーザに対しては、ミキサは、次に高いエネルギーを持つ
サンプルを、その特定のユーザに出力されるべき混合サ
ンプルとして選択する。次に、これら混合サンプル出力
がおのおののユーザに送信され、これによって、電話会
議の際のオーディオ通信が実現される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電気通信システム
および方法、より詳細には、オーディオ通信を伴う電話
会議の際にオーディオ信号を混合するためのシステムお
よび方法に関する。
【0002】
【従来の技術】電話会議、例えば、オーディオ会議ある
いはビデオ会議は日常のビジネス活動の重要な部分を占
めるようになっている。電話会議を用いれば、様々な異
なる位置(地域)からの出席者が電気通信設備を介して
参加する会議を容易にスケジュールおよび開くことがで
きる。このように、電話会議を用いると、大きな長所と
して、会議に出席するために必要とされる時間と費用が
削減でき、会議出席者の生産性を向上させることができ
る。
【0003】オーディオ通信は、電話会議の主要な部分
を構成する。オーディオ会議の出席者は、典型的には、
全二重方式にてオーディオ通信することができる。換言
すれば、出席者は、自由、かつ、同時に、話し、互いに
情報を交換することができる。従来の技術においては、
複数の出席者の発声(アタランス)を含む音響効果を表
すオーディオ信号が通信網を通じてミキサに送信され、
ミキサは、これらオーディオ信号のサンプルを生成およ
び処理する。各サンプル期間において、ミキサは、様々
な異なる出席者に由来する複数のオーディオ信号サンプ
ルに基づいて、各出席者に対して、平均化機能に従っ
て、他の出席者に由来する音響効果の総和結果を表す混
合サンプルを計算する。結果として得られる各出席者に
送り返される混合サンプルは、例えば、他の出席者に由
来するオーディオ信号サンプルの加重平均を表し、各オ
ーディオ信号サンプルに対する重みは、オーディオ信号
サンプルの値に合わせて増加される。一般には、平均化
機能が用いられるために、各出席者に対する混合サンプ
ルは、電話会議の際の他の出席者に由来する全ての音響
効果の表現を含む。
【0004】
【発明が解決しようとする課題】上述の平均機能を用い
た混合サンプルを計算においては、従来の技術によるミ
キサは、実際には、様々な異なる出席者に由来するオー
ディオ信号サンプルのエネルギーを混合する。ただし、
この平均化機能は、乗算動作を必要とし、この回数は出
席者の数と共に増加する。これら乗算動作のために、典
型的な電話会議の場合、ミキサに要求される計算量は非
常に大きくなる。このため、通常、このように大きな計
算量を扱うために、ミキサ内に専用のデジタル信号プロ
セッサ(DSP)が採用される。ただし、不幸なこと
に、この専用のデジタル信号プロセッサ(DSP)のた
めにミキサのコストが非常に高くなる。加えて、従来の
技術によるミキサは、DSPの処理能力の制約のため
に、極限られた数の出席者しか収容することができな
い。
【0005】
【課題を解決するための手段】我々は、典型的な人間の
聴覚能力は、従来の技術において用いられる各々が対応
するサンプル期間の際の異なる複数の話者に由来するオ
ーディオサンプルのエネルギーを混合することによって
得られる一連の混合サンプルの効果と、各々が対応する
サンプル期間の際の最も声の大きな話者に由来するオー
ディオサンプルから成る一連の混合サンプルの効果と
を、サンプル期間が十分に短な場合、区別できないこと
を発見した。
【0006】この発見に基づき、本発明によると、各サ
ンプル期間において、最も声の大きな話者に由来する最
も高いエネルギーレベルを持つ第一のオーディオサンプ
ルが識別され、この第一のオーディオサンプルを表す第
一の混合サンプル信号が、その最も声の大きな話者を除
く他の全ての出席者に送信され、これによって、最も声
の大きな話者が自身の音声効果の望ましくないエコーを
聞くことが阻止される。そのサンプル期間における最も
声の大きな話者に対しては、次に大きな声の話者に由来
する次に高いエネルギーレベルを持つ第二のオーディオ
サンプルが識別され、第二のオーディオサンプルを表す
第二の混合サンプル信号が最も声の大きな話者に送信さ
れ、これによって、電話会議の際のオーディオ通信が実
現される。
【0007】第一および第二の混合サンプル信号を提供
するためには、本発明によるミキサは、従来の技術によ
るミキサにおいて要求される計算量の大きな乗算動作の
代わりに、簡単な比較動作を遂行することのみを必要と
される。長所として、本発明によるミキサに要求される
計算量は、上述の専用のDSPより非常に安価な従来の
プロセッサによって容易に扱うことができる。加えて、
本発明によるミキサは、従来の技術によるミキサと比較
して、プロセッサに過剰な負荷を掛けることなく、電話
会議の際により多数の出席者を容易に収容することがで
きる。
【0008】
【発明の実施の形態】図1は、電話会議能力を提供する
ための本発明の原理を具現する通信構成100を示す。
通信構成100を使用することで、端末103−1〜1
03−Kの所のユーザは(ここで、Kは、1より大きな
整数を表す)、これらユーザの間で通信網107を通じ
てビデオ会議やオーディオ会議等の電話会議を行なうこ
とができる。端末103−1〜103−Kは、例えば、
異なる所に位置し、おのおの、オーディオ、ビデオおよ
び/あるいはテキスト情報を通信する能力を持つ従来の
マルチメディア端末であることも考えられる。この場合
は、通信網107は、網を通じて情報を輸送するために
インターネットと同一のTCP/IP(transmission control
protocol/Internet protocol)を採用する。
【0009】本発明は、電話会議の際のオーディオ通信
に向けられる。オーディオ通信は、オーディオ会議にお
いては中心的な位置を占め、ビデオ会議においても重要
な部分を構成する。事実、オーディオ会議は、ビデオ会
議の必須な下位部分を構成する。ここでは、単に一例と
して、端末103−1〜103−Kの所のユーザは、通
信構成100を利用してこれらユーザの間でオーディオ
会議を行うものと想定され、従って、説明の実施例にお
いては、これら端末の幾つかは、オーディオ情報のみを
通信する能力を持つ従来の電話装置であることも考えら
れる。
【0010】最初に、従来の方法にて、オーディオ会議
が確立される。つまり、各端末は、網107のシグナリ
ングチャネルを通じて呼コーディネータ121に、
(a)各端末において用いられるオーディオ情報を符号
化するための符号化スキームを含む端末構成情報、
(b)端末を識別するためのIPアドレス情報、および
(c)問題のオーディオ会議に対する所定の参照情報を
送信する。呼コーディネータ121は、各端末からこれ
ら情報を受信すると、参照されるオーディオ会議におけ
るオーディオ通信需要を扱うためのミキサ、例えば、ミ
キサ125を割り当てる。ミキサによるオーディオ通信
の処理のために、呼コーディネータ121は、ミキサ1
25にも上述の情報(a)および(b)を送信する。呼
コーディネータ121は、次に、オーディオ会議を開始
する。つまり、各参加端末に対して、オーディオ会議の
際に網107のメディアチャネルを通じてオーディオ情
報を送信することを指令する。各端末から送信されるオ
ーディオ情報は、例えば、オーディオ会議に参加してい
るユーザの発声(アタランス)を含む音響効果を表すこ
とが考えられる。いずれにしても、各端末からのオーデ
ィオ情報は、各端末によって用いられる符号化スキーム
に従ってデジタル的に符号化され、オーディオ信号にて
表現され、ミキサ125に送信される。
【0011】オーディオ会議の際は、ユーザは、各自の
端末を通じて、全二重方式にてオーディオ通信すること
ができる。換言すれば、各ユーザは、自由、かつ、同時
に、話し、互いに情報を交換することができる。従来の
技術においては、オーディオ会議を実現するためには、
ミキサは、これら端末から送信されたオーディオ信号か
らデジタルサンプルを生成し、次に、各サンプル期間に
おいて、こうして生成された様々な異なるユーザに由来
する複数のデジタルサンプルに基づいて、各ユーザに送
り返すために、平均化機能に従って、他のユーザに由来
する音響効果の総和結果を表す混合サンプルを計算す
る。例えば、各ユーザに送り返される結果としての混合
サンプルは、他のユーザに由来するデジタルサンプルの
加重平均を表し、各デジタルサンプルに対する重みはサ
ンプル値の増加に合わせて増加される。一般には、平均
化機能が用いられるために、各ユーザに対する混合サン
プルには、オーディオ会議における他の全てのユーザに
由来する全音響効果の表現が含まれる。
【0012】上述の平均機能を用いての混合サンプルの
計算においては、従来の技術によるミキサは、実際に
は、様々な異なるユーザに由来するデジタルサンプルの
エネルギーを混合する。ただし、この平均化機能は、乗
算動作を必要とし、その回数はオーディオ会議に参加す
るユーザの数と共に増加する。これら乗算動作のため
に、ミキサに要求される計算量は、典型的なオーディオ
会議の場合、非常に大きくなる。通常、ミキサに要求さ
れるこのように大きな計算量を扱うために専用のデジタ
ル信号プロセッサ(DSP)が用いられる。ただし、不
幸なことに、この専用のデジタル信号プロセッサ(DS
P)のためにミキサのコストが非常に高くなる。
【0013】我々は、典型的な人間の聴覚能力は、従来
の技術において用いられる各々が対応するサンプル期間
の際の異なる話者に由来するオーディオサンプルのエネ
ルギーを混合することによって得られる一連の混合サン
プルの効果と、各々が対応するサンプル期間の際の最も
声の大きな話者に由来するオーディオサンプルから成る
一連の混合サンプルの効果とを、サンプル期間が短い場
合、例えば、100ms以下である場合は、区別できな
いことを発見した。
【0014】この発見に基づき、本発明によると、ミキ
サ125は、100msよりかなり短い各サンプル期間
において、そのサンプル期間における最も声の大きなユ
ーザに由来する最も高いエネルギーレベルを持つオーデ
ィオサンプルから成る混合サンプルを、その最も声の大
きなユーザを除く、各ユーザに送信する。そのサンプル
期間における最も声の大きなユーザに対しては、ミキサ
125は、次に大きな声のユーザに由来する次に高いエ
ネルギーレベルを持つオーディオサンプルを表す別の混
合サンプルの信号を送信する。これによって、最も声の
大きなユーザが、自身の発声(アタランス)の望ましく
ないエコーを聴くことが阻止される。実際には、各サン
プル期間において、本発明によるミキサ125は、最も
高いエネルギーレベルを持つ入力オーディオサンプル
を、それを送信したユーザを除く各ユーザに出力される
混合サンプルとして選択するように“スイッチ”する。
最も高いエネルギーレベルのオーディオサンプルを送信
した特定のユーザに対しては、ミキサ125は、次に高
いエネルギーレベルを持つ入力オーディオサンプルを、
その特定のユーザに出力される混合サンプルとして選択
するように“スイッチ”する。
【0015】サンプルスイッチング機能の遂行におい
て、ミキサ125は、従来の技術によるミキサにおいて
要求される計算量の大きな乗算動作の代わりに、簡単な
比較動作を遂行することのみを必要とされる。長所とし
て、ミキサ125に要求される計算容量は、従来のプロ
セッサ、例えば、ミキサ125内に用いられる上述の専
用のDSPより安価なプロセッサ136によって容易に
満たすことができる。加えて、サンプルスイッチング動
作が簡単であるために、ミキサ125は、従来の技術に
よるミキサと比較して、プロセッサに過剰な負荷を掛け
ることなく、電話会議の際により多数のユーザを容易に
収容することができる。
【0016】以下では、本発明によるミキサ125の動
作を説明する。端末103−1〜103−Kからオーデ
ィオ情報を表すオーディオ信号を受信すると、ミキサ1
25内のインタフェース131は、周知のやり方で、受
信された各オーディオ信号に対応するデジタルサンプル
のK個のストリームを生成する。説明の実施例において
は、端末103−1〜103−Kによって各端末内でオ
ーディオ情報を符号化するために、少なくとも2つの異
なる符号化スキームが用いられるものと想定される。次
に、復号器134は、これらサンプルによって表される
エネルギーのレベルを有効に比較するために、これらデ
ジタルサンプルのK個のストリームを、対応する線形サ
ンプル、例えば、非圧縮パルス符号変調(PCM)サンプ
ルのK個のストリームに、呼コーディネータ121によ
ってミキサ123に通知された各端末内で用いられてい
る符号化スキームに従って復号する。
【0017】次に、各サンプル期間において、プロセッ
サ136は、各端末103−1〜103−KからのK個
の線形サンプルから、図2に示すルーチン200に従っ
て、それぞれ、最も高いエネルギーレベル、すなわち振
幅を持つ線形サンプルmax1と、次に高いエネルギー
レベル、すなわち振幅を持つ線形サンプルmax2を識
別する。より詳細には、プロセッサ136は、メモリ1
38内に格納されたルーチン200の指令下で、最初
に、ステップ203において、それぞれ、max1とm
ax2を0に初期化し、インデックスiを1に初期化す
る。プロセッサ136は、次に、ステップ205におい
て、max1の値を端末103−i(ここで、1≦i≦
K)からのi番目の線形サンプルの絶対値と比較する。
max1の値がi番目の線形サンプルの絶対値より小さ
な場合は、ルーチン200は、ステップ207に進み、
ここで、max2がmax1に等しくセットされる。次
に、ステップ209において、max1がi番目の線形
サンプルの絶対値に等しくセットされる。次に、ステッ
プ211において、インデックスiが1だけ増分され
る。
【0018】他方、プロセッサ136が、ステップ20
5において、max1の値がi番目の線形サンプルの絶
対値以上であることを決定した場合は、ルーチン200
は、ステップ213に進み、ここで、max2の値がi
番目の線形サンプルの絶対値と比較される。max2が
i番目の線形サンプルの絶対値以上である場合は、ルー
チン200は、上述のステップ211に進む。他方、m
ax2がi番目の線形サンプルの絶対値より小さな場合
は、ルーチン200はステップ215に進み、ここで、
max2がi番目の線形サンプルの絶対値に等しくセッ
トされ、次に、ステップ211に進む。
【0019】インデックスiをステップ211において
増分した後、プロセッサ136は、ステップ217にお
いて、iの値をKと比較する。iの値がK以下である場
合は、ルーチン200は上述のステップ205に戻り、
そうでない場合は、ルーチン200は終了する。
【0020】本発明によると、ミキサ125は、各サン
プル期間において、ルーチン200の結果として得られ
る振幅max1を持つ混合サンプルを、max1に寄与
しなかった各端末に送信し、ルーチン200の結果とし
て得られる振幅max2を持つもう一つの混合サンプル
を、max1に寄与した端末にのみ送信する。こうし
て、各サンプル期間においてミキサ125から端末10
3−1〜103−Kに送信される混合サンプルは、振幅
max1を持つ(K−1)個の混合サンプルと、振幅m
ax2を持つ1個の混合サンプルから成る。これら混合
サンプルは、符号器140によって、各端末によって用
いられている符号化スキームに従って符号化される。結
果として得られたデジタルサンプルは、インタフェース
131を通じて、各自のIPアドレスによって識別され
る各端末に送信される。次に、端末103−1〜103
−Kは、それぞれ、受信されたデジタルサンプルからオ
ーディオ情報を生成し、これによってオーディオ会議が
実現される。
【0021】上述の説明は、単に本発明の原理を解説す
るためのものであり、当業者においては、本発明の原理
を具現し、従って、本発明の精神および範囲に含まれる
他の様々な構成を容易に考案できるものと思われる。
【0022】例えば、上述の実施例においては、端末1
03−1〜103−Kによって少なくとも2個の異なる
オーディオ符号化スキームが用いられるものと想定さ
れ、このため、各端末から受信されるデジタルサンプル
は、それらによって表されるエネルギーのレベルを有効
に比較できるように、対応する線形サンプルに復号する
ことが必要とされた。加えて、選択された線形サンプル
から成る混合サンプルは、端末に送信する前に符号化す
ることを必要とされた。ただし、これら端末によってた
った1個の符号化スキームのみが用いられる場合は、理
解できるように、エネルギーの比較はこれらが同一の符
号化スキームを用いて符号化されているために、デジタ
ルサンプル自身の値に基づいて有効に達成することがで
きる。このため、この場合は、デジタルサンプルのコー
ド変換、つまり、デジタルサンプルの線形サンプルへの
復号とこれに続く選択された線形サンプルの符号化は省
略することができる。
【0023】さらに、説明の実施例においては、ミキサ
125は、スイッチング機能をサンプルベースにて遂行
するものと想定された。ただし、理解できるように、こ
のスイッチング機能は、各アンサンブルが同一端末から
の複数のサンプルを含むアンサンブルベースにて遂行す
ることもできる。アンサンブルスイッチングの場合は、
ミキサ125は、様々な異なる端末からのミキサ出力を
生成するために、サンプルスイッチングの場合はサンプ
ルのエネルギーが比較されるのとは対照的に、アンサン
ブルのエネルギーを比較するのみで済む。このため、ア
ンサンブルスイッチングの場合は、ミキサ125によっ
て遂行されるエネルギー比較動作の頻度は、サンプルス
イッチングの場合と比較して大幅に低減され、このた
め、ミキサ125の動作がさらに簡素化される。アンサ
ンブルスイッチングは、アンサンブルの長さが、これも
複数のサンプルから成る符号器フレーム(コーダフレー
ム)の長さと一致する場合に特に効率が良い。これは、
アンサンブルの長さが符号器フレームの長さより大きな
場合、アンサンブルの値、従って、エネルギーは、その
アンサンブルに対応する符号器フレームが復号されるま
では決定できないためである。ユーザによって知覚され
るオーディオ品質は、アンサンブルの長さが増加すると
低減する点にも注意を要する。より具体的には、アンサ
ンブルの長さがある限界を超えると、ユーザはスイッチ
ング動作に由来するチャッピー(途切れ途切れの不規則
な)オーディオ効果を知覚することとなる。
【0024】加えて、説明の実施例においては、端末1
03−1〜103−Kからのオーディオ情報は網107
内をTCP/IPプロフィルに従ってパケットの形式に
て輸送されるものと想定されたが、当業者においては理
解できるように、これらパケットのサイズは、端末によ
って異なることが考えられる。このため、上述のアンサ
ンブルスイッチングを採用する場合は、アンサンブルの
サイズとして、それらパケットのオーディオ情報部分の
各サイズの公約数の値を、最高で、その最大公約数(H
CF)の値まで、取ることが考えられる。
【0025】さらに、網107は、上述のオーディオ情
報を含むパケットを網を通じてルーティングするため
に、複数のルータを使用することもでき、これら複数の
ルータは異なる設計であっても構わない。
【0026】最後に、上で開示された通信構成100の
形態においては、様々な通信機能は、おのおの、複数の
各離散機能ブロックによって遂行されたが、ただし、別
の形態として、これら一つあるいは複数の機能ブロック
の機能、さらには、これらの全ての機能を、例えば、一
つあるいは複数の適当にプログラムされたプロセッサに
よって遂行することもできる。
【図面の簡単な説明】
【図1】本発明による電話会議のための通信構成を示す
図である。
【図2】図1の通信構成内のミキサによって混合信号サ
ンプルを生成するために用いられる本発明によるルーチ
ンを示す流れ図である。
【符号の説明】
100 通信構成 103 端末 107 通信網 121 呼コーディネータ 125 ミキサ 131 インタフェース 134 復号器 136 プロセッサ 138 メモリ 140 符号器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 プラカシュ アイヤー アメリカ合衆国 07728 ニュージャーシ ィ,フリーホールド,ハーディング ロー ド 511−4

Claims (49)

    【特許請求の範囲】
  1. 【請求項1】 複数の位置のおのおのからのオーディオ
    効果を表す複数のオーディオ表現を処理するための装置
    であって、前記複数のオーディオ表現がエネルギー内容
    を持ち、この装置が:前記複数のオーディオ表現から第
    一のオーディオ表現と第二のオーディオ表現をそれらオ
    ーディオ表現のエネルギー内容のレベルに基づいて識別
    するためのプロセッサを含み、前記第一のオーディオ表
    現が特定の位置からの音響効果を表し;この装置がさら
    に前記第一のオーディオ表現を表す信号を前記特定の位
    置を除く前記複数の位置に送信し、前記第二のオーディ
    オ表現を表す信号を前記特定の位置に送信するためのイ
    ンタフェースを含むことを特徴とする装置。
  2. 【請求項2】 前記各オーディオ表現が一つあるいは複
    数のオーディオサンプルを含むことを特徴とする請求項
    1の装置。
  3. 【請求項3】 前記第一のオーディオ表現が前記複数の
    オーディオ表現の中で最も高いレベルのエネルギー内容
    を持つことを特徴とする請求項1の装置。
  4. 【請求項4】 前記第二のオーディオ表現が次に高いレ
    ベルのエネルギー内容を持つことを特徴とする請求項3
    の装置。
  5. 【請求項5】 前記複数のオーディオ表現の少なくとも
    一つが符号化されることを特徴とする請求項1の装置。
  6. 【請求項6】 前記音響効果が発声を含むことを特徴と
    する請求項1の装置。
  7. 【請求項7】 前記プロセッサがインタフェースを含む
    ことを特徴とする請求項1の装置。
  8. 【請求項8】 複数の端末に由来するオーディオ信号を
    処理するための装置であって、この装置が:前記複数の
    端末のおのおのに由来するオーディオ信号から複数のオ
    ーディオ表現を生成するためのインタフェースを含み、
    前記複数のオーディオ表現が値を持ち;この装置がさら
    に前記複数のオーディオ表現から第一のオーディオ表現
    と第二のオーディオ表現を、それらオーディオ表現の値
    に基づいて識別するためのプロセッサを含み、前記第一
    のオーディオ表現が特定の端末に由来するオーディオ信
    号から生成され;この装置がさらに前記第一のオーディ
    オ表現を表す信号を前記特定の端末を除く前記複数の端
    末に送信し、前記第二のオーディオ表現を表す信号を前
    記特定の端末に送信するための出力を含むことを特徴と
    する装置。
  9. 【請求項9】 前記第一のオーディオ表現が前記複数の
    オーディオ表現の中で最も高い絶対値を持つことを特徴
    とする請求項8の装置。
  10. 【請求項10】 前記第二のオーディオ表現が次に高い
    絶対値を持つことを特徴とする請求項9の装置。
  11. 【請求項11】 前記オーディオ信号が前記端末が存在
    する位置からの音響効果を表すことを特徴とする請求項
    8の装置。
  12. 【請求項12】 前記音響効果が発声を含むことを特徴
    とする請求項11の装置。
  13. 【請求項13】 前記オーディオ表現の値がその中に含
    まれるエネルギー内容のレベルを示すことを特徴とする
    請求項8の装置。
  14. 【請求項14】 前記各オーディオ表現が一つあるいは
    複数のオーディオサンプルを含むことを特徴とする請求
    項8の装置。
  15. 【請求項15】 前記複数のオーディオ表現の少なくと
    も一つが符号化されることを特徴とする請求項8の装
    置。
  16. 【請求項16】 前記プロセッサが前記インタフェース
    および前記出力を含むことを特徴とする請求項8の装
    置。
  17. 【請求項17】 電話会議を行なうためのシステムであ
    って、このシステムが:前記電話会議の際に複数の端末
    のおのおのから通信網を通じて送信されるオーディオ信
    号をコーディネートするためのコントローラ;および前
    記各オーディオ信号から複数のオーディオ表現を生成す
    るためのインタフェースを含み、前記複数のオーディオ
    表現が値を持ち;このシステムがさらに前記複数のオー
    ディオ表現から第一のオーディオ表現と第二のオーディ
    オ表現をそれらオーディオ表現の値に基づいて識別する
    ためのプロセッサを含み、前記第一のオーディオ表現が
    特定の端末によって送信されたオーディオ信号から生成
    され;このシステムがさらに前記第一のオーディオ表現
    を表す信号を前記特定の端末を除く前記複数の端末に送
    信し、前記第二のオーディオ表現を表す信号を前記特定
    の端末に送信するための出力を含むことを特徴とするシ
    ステム。
  18. 【請求項18】 前記電話会議がビデオ会議を含むこと
    を特徴とする請求項17のシステム。
  19. 【請求項19】 前記電話会議がオーディオ会議を含む
    ことを特徴とする請求項17のシステム。
  20. 【請求項20】 少なくとも一つの前記端末がマルチメ
    ディア端末から成ることを特徴とする請求項17のシス
    テム。
  21. 【請求項21】 少なくとも一つの前記端末が電話装置
    であることを特徴とする請求項17のシステム。
  22. 【請求項22】 前記通信網が少なくとも一部がインタ
    ーネットから構成されることを特徴とする請求項17の
    システム。
  23. 【請求項23】 前記第一のオーディオ表現が前記複数
    のオーディオ表現の中で最も高い絶対値を持つことを特
    徴とする請求項17のシステム。
  24. 【請求項24】 前記第二のオーディオ表現が次に高い
    絶対値を持つことを特徴とする請求項23のシステム。
  25. 【請求項25】 前記オーディオ表現の値がその中に含
    まれるエネルギー内容のレベルを示すことを特徴とする
    請求項17のシステム。
  26. 【請求項26】 前記各オーディオ表現が一つあるいは
    複数のオーディオサンプルを含むことを特徴とする請求
    項17のシステム。
  27. 【請求項27】 前記複数のオーディオ表現の少なくと
    も一つが符号化されることを特徴とする請求項17のシ
    ステム。
  28. 【請求項28】 複数の位置のおのおのからのオーディ
    オ効果を表す複数のオーディオ表現を処理するための方
    法であって、前記複数のオーディオ表現がエネルギー内
    容を持ち、この方法が:前記複数のオーディオ表現から
    第一のオーディオ表現と第二のオーディオ表現をそれら
    オーディオ表現のエネルギー内容のレベルに基づいて識
    別するステップを含み、前記第一のオーディオ表現が特
    定の位置からの音響効果を表し;この方法がさらに前記
    第一のオーディオ表現を表す信号を前記特定の位置を除
    く前記複数の位置に送信するステップ;および前記第二
    のオーディオ表現を表す信号を前記特定の位置に送信す
    るステップを含むことを特徴とする方法。
  29. 【請求項29】 前記各オーディオ表現が一つあるいは
    複数のオーディオサンプルを含むことを特徴とする請求
    項28の方法。
  30. 【請求項30】 前記第一のオーディオ表現が前記複数
    のオーディオ表現の中で最も高いレベルのエネルギー内
    容を持つことを特徴とする請求項28の方法。
  31. 【請求項31】 前記第二のオーディオ表現が次に高い
    レベルのエネルギー内容を持つことを特徴とする請求項
    30の方法。
  32. 【請求項32】 前記複数のオーディオ表現の少なくと
    も一つが符号化されることを特徴とする請求項28の方
    法。
  33. 【請求項33】 前記音響効果が発声を含むことを特徴
    とする請求項28の方法。
  34. 【請求項34】 複数の端末に由来するオーディオ信号
    を処理するための方法であって、この方法が:前記複数
    の端末のおのおのに由来するオーディオ信号から複数の
    オーディオ表現を生成するステップを含み、前記複数の
    オーディオ表現が値を持ち;この方法がさらに前記複数
    のオーディオ表現から第一のオーディオ表現と第二のオ
    ーディオ表現をそれらオーディオ表現の値に基づいて識
    別するステップを含み、前記第一のオーディオ表現が特
    定の端末に由来するオーディオ信号から生成され;この
    方法がさらに前記第一のオーディオ表現を表す信号を前
    記特定の端末を除く前記複数の端末に送信するステッ
    プ;および前記第二のオーディオ表現を表す信号を前記
    特定の端末に送信するステップを含むことを特徴とする
    方法。
  35. 【請求項35】 前記第一のオーディオ表現が前記複数
    のオーディオ表現の中で最も高い絶対値を持つことを特
    徴とする請求項34の方法。
  36. 【請求項36】 前記第二のオーディオ表現が次に高い
    絶対値を持つことを特徴とする請求項35の方法。
  37. 【請求項37】 前記オーディオ信号が前記端末が存在
    する位置からの音響効果を表すことを特徴とする請求項
    34の方法。
  38. 【請求項38】 前記音響効果が発声を含むことを特徴
    とする請求項37の方法。
  39. 【請求項39】 前記オーディオ表現の値がその中に含
    まれるエネルギー内容のレベルを示すことを特徴とする
    請求項34の方法。
  40. 【請求項40】 前記各オーディオ表現が一つあるいは
    複数のオーディオサンプルを含むことを特徴とする請求
    項34の方法。
  41. 【請求項41】 前記複数のオーディオ表現の少なくと
    も一つが符号化されることを特徴とする請求項34の方
    法。
  42. 【請求項42】 電話会議を行なうシステム内で用いる
    ための方法であって、前記システムが複数の端末および
    通信網を含み、この方法が:前記電話会議の際に前記複
    数の端末のおのおのから通信網を通じて送信されるオー
    ディオ信号をコーディネートするステップ;および前記
    各オーディオ信号から複数のオーディオ表現を生成する
    ステップを含み、前記複数のオーディオ表現が値を持
    ち;この方法がさらに前記複数のオーディオ表現から第
    一のオーディオ表現と第二のオーディオ表現をそれらオ
    ーディオ表現の値に基づいて識別するステップを含み、
    前記第一のオーディオ表現が特定の端末によって送信さ
    れたオーディオ信号から生成され;この方法がさらに前
    記第一のオーディオ表現を表す信号を前記特定の端末を
    除く前記複数の端末に送信するステップ;および前記第
    二のオーディオ表現を表す信号を前記特定の端末に送信
    するステップを含むことを特徴とする方法。
  43. 【請求項43】 前記電話会議がビデオ会議を含むこと
    を特徴とする請求項42の方法。
  44. 【請求項44】 前記電話会議がオーディオ会議を含む
    ことを特徴とする請求項42の方法。
  45. 【請求項45】 前記第一のオーディオ表現が前記複数
    のオーディオ表現の中で最も高い絶対値を持つことを特
    徴とする請求項42の方法。
  46. 【請求項46】 前記第二のオーディオ表現が次に高い
    絶対値を持つことを特徴とする請求項45の方法。
  47. 【請求項47】 前記オーディオ表現の値がその中に含
    まれるエネルギー内容のレベルを示すことを特徴とする
    請求項42の方法。
  48. 【請求項48】 前記各オーディオ表現が一つあるいは
    複数のオーディオサンプルを含むことを特徴とする請求
    項42の方法。
  49. 【請求項49】 前記複数のオーディオ表現の少なくと
    も一つが符号化されることを特徴とする請求項42の方
    法。
JP11240665A 1998-08-28 1999-08-27 電話会議の際のオ―ディオ信号を効果的に混合するための技法 Pending JP2000092218A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US14195498A 1998-08-28 1998-08-28
US09/141954 1998-08-28

Publications (1)

Publication Number Publication Date
JP2000092218A true JP2000092218A (ja) 2000-03-31

Family

ID=22497957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11240665A Pending JP2000092218A (ja) 1998-08-28 1999-08-27 電話会議の際のオ―ディオ信号を効果的に混合するための技法

Country Status (5)

Country Link
EP (1) EP0982921A1 (ja)
JP (1) JP2000092218A (ja)
KR (1) KR20000017611A (ja)
CA (1) CA2276954A1 (ja)
TW (1) TW428383B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228506A (ja) * 2006-02-27 2007-09-06 Tokyo Univ Of Agriculture & Technology 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法
CN110677208A (zh) * 2019-09-11 2020-01-10 厦门亿联网络技术股份有限公司 一种用于会议系统的混音方法和系统

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4387457A (en) * 1981-06-12 1983-06-07 Northern Telecom Limited Digital conference circuit and method
DE3206914C2 (de) * 1982-02-26 1984-08-09 Standard Elektrik Lorenz Ag, 7000 Stuttgart Digitale Konferenzschaltung
CA1279393C (en) * 1987-01-23 1991-01-22 A. David Milton Digital signal processing system
US5916302A (en) * 1996-12-06 1999-06-29 International Business Machines Corporation Multimedia conferencing using parallel networks

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007228506A (ja) * 2006-02-27 2007-09-06 Tokyo Univ Of Agriculture & Technology 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法
JP4644813B2 (ja) * 2006-02-27 2011-03-09 国立大学法人東京農工大学 多者間通話システム、多者間通話システムにおける通話端末および通話サーバ、多者間通話方法
CN110677208A (zh) * 2019-09-11 2020-01-10 厦门亿联网络技术股份有限公司 一种用于会议系统的混音方法和系统

Also Published As

Publication number Publication date
TW428383B (en) 2001-04-01
EP0982921A1 (en) 2000-03-01
KR20000017611A (ko) 2000-03-25
CA2276954A1 (en) 2000-02-28

Similar Documents

Publication Publication Date Title
US6940826B1 (en) Apparatus and method for packet-based media communications
US7349352B2 (en) Method for handling larger number of people per conference in voice conferencing over packetized networks
US7054820B2 (en) Control unit for multipoint multimedia/audio conference
US6956828B2 (en) Apparatus and method for packet-based media communications
US6792092B1 (en) Method and system for independent participant control of audio during multiparty communication sessions
US8433050B1 (en) Optimizing conference quality with diverse codecs
US7133521B2 (en) Method and apparatus for DTMF detection and voice mixing in the CELP parameter domain
US6697342B1 (en) Conference circuit for encoded digital audio
CN112104836A (zh) 一种音频服务器混音方法、系统、存储介质及设备
EP2572499B1 (en) Encoder adaption in teleconferencing system
US8515039B2 (en) Method for carrying out a voice conference and voice conference system
CA2534731C (en) Managing multicast conference calls
Smith et al. Tandem-free VoIP conferencing: A bridge to next-generation networks
US7058026B1 (en) Internet teleconferencing
US20030174657A1 (en) Method, system and computer program product for voice active packet switching for IP based audio conferencing
JP2000092218A (ja) 電話会議の際のオ―ディオ信号を効果的に混合するための技法
US7606563B2 (en) Distributed telephone conference with speech coders
Ahuja et al. Packet telephony
EP1298903A2 (en) Method for handling larger number of people per conference in voice conferencing over packetized networks
US20030091162A1 (en) Telephone data switching method and system
JP2005151044A (ja) 音声ミキシング方法、音声ミキシングシステム及び音声ミキシングのためのプログラム
EP1323286A2 (en) Packet-based conferencing
JPH0239763A (ja) テレビ電話会議装置
JPH10112760A (ja) 音質劣化防止方式
JPH06216860A (ja) 音声通信装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040315