JPH1127400A

JPH1127400A - 電話会議開催機能を提供する方法

Info

Publication number: JPH1127400A
Application number: JP35467197A
Authority: JP
Inventors: Farra Dave Dal; デイブ・ダル・ファラ; Paul Smeulders; ポール・スミュルダース
Original assignee: Northern Telecom Ltd
Current assignee: Nortel Networks Ltd
Priority date: 1997-01-07
Filing date: 1997-12-24
Publication date: 1999-01-29
Also published as: DE69732475T2; EP0855827A3; CA2224541A1; EP0855827B1; CA2224541C; EP0855827A2; DE69732475D1

Abstract

(57)【要約】【課題】専用の付加的な会議用ハードウェアも外的な
ネットワーク会議ブリッジも必要としない電話会議方法
を提供する。【解決手段】ターミナルのうちの1つが会議を指定し、2
人の他の会議参加者からの信号を処理し、所与の時間に
会議参加者のアクティブな話し手のうちの2人だけを遅
延させることによって、プロセッサ制御の電話端末に付
加的または専用のハードウェアを必要とせず、外的な会
議ブリッジも必要としない会議開催方法が得られる。2
人のアクティブな会議参加者は、彼ら自身の信号を受け
取らない。アクティブな会議参加者は、その会議参加者
のアクティビティ時間に対応する最小および最大の間を
変化するダイナミック・ハングオーバ時間の間アクティ
ブであると宣言されたままである。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、一般的に電話会
議に関し、特に会議を提供する方法に関係する。より具
体的には、この発明は，専用のハードウェアなくして会
議を提供するが、加入者ターミナルの既存の構成要素を
利用および制御する方法に関係する。

【０００２】

【従来の技術】会議に対する最も単純なアプローチは、
各参加者の送られた信号に固定の利得を適用し、変倍さ
れた信号の合計を各参加者の受取り（聞いている）パス
に提供することを含む。そのようなシナリオでは、全て
の参加者の背景雑音がその受信信号の中で累積される。
多くの参加者がいるならば、雑音が過大となり不快であ
る。また、エコー信号に利得が加えられて話し手に送り
返されるという強い危険がある。適用することができる
利得の量もループ安定性基準によって深刻に制限され
る。会議における遠隔の制御オフィス（ＣＯ）パーティ
は、しばしば点対点のコールに比べて２倍の接続損失で
相互接続される。この余分な損失を与えられると、単純
なサマーを使うとき安定性基準によって許される固定利
得の量は不十分で、しばしばよい品質のスピーチのため
に必要なレベルに応じることができない。

【０００３】先行技術における会議の話し手の切り換え
決定は、アクティブなな話し手が参加する順序に基づ
き、話し手のレベルに基づくのではなく、すべての話し
手を公平に扱う。最初に来た人が最初に使用することが
できるとするオペレーションが生じ、最も最近アクティ
ブな対の伝送された信号が自動利得制御（AGC）を適用
され、再分配のために混合される。現在アクティブな対
がお互いを聞くだけであるのに対し、他の人は、両方の
アクティブな話し手の話を聞く。次の話し手は、2人の
最も最近アクティブな話し手のいずれかが活動をやめる
時に会話に割り込む。したがって、最大２つのロケーシ
ョンからの背景雑音がいつでも聞こえる。

【０００４】よりよい方法は、エコーをスピーチから区
別し、安定性を損なうことなく大きな利得を可能にする
ことである。合わなければならない唯一の安定性基準
は、現在アクティブな話し手が２人いることである。全
ての他の参加者は、必要に応じて完全な利得を受け取る
ことができる。これが、この発明において、そして、ア
メリカ合衆国特許4,648,108号において使われる方法で
ある。

【０００５】「会議回路とそれを操作する方法」という
名称のエリスほかに1987年3月3日与えられたアメリカ合
衆国特許4,648,108号は、対応する複数の会議参加者の
ための複数のポートを持つ会議回路を開示している。そ
のポートに関連するのは、会議参加者がアクティブであ
るか、すなわち話し中か、またはアクティビティ休止中
すなわち聞いているのかを判断する制御回路である。そ
の回路は、「アクティブな」信号に利得を適用し、「ア
クティビティ休止中の」信号を減衰させる。リスナーが
話し始めるとき、その回路はそのポートを「アクティブ
な」モードに切り替える。リスナーがいつアクティブに
なるか判断する際に、ノイズおよび音声信号でのエコー
のために困難が生じる。それらは、ポートからの信号を
そのポートに関連した伝送路のエコーリターン損失から
導き出されたエコー信号推定値と比較することによって
和らげられる。その方法は、異なる伝送路に対して異な
るエコー・レベルを考慮に入れる。

【０００６】アメリカ合衆国特許No.4,648,108におい
て、マイクロプロセッサが会議ブリッジにおいて使われ
るが、全ての他のハードウェアは追加的で専用である。

【０００７】アメリカ合衆国特許No.4,648,108は、ここ
でリファレンスによって取り入れられ、背景としてこの
発明にとって有用であり、この明細書で使われる多くの
用語を定義する。

【０００８】

【発明が解決しようとする課題】上に述べたように電話
会議の分野では、プロセッサ制御された電話端末装置に
付加的なまたは専用のハードウェアを必要とせず、また
外部の会議ブリッジも必要としない会議開催方法に対す
る要求がある。

【０００９】

【課題を解決するための手段】この発明は、プロセッサ
制御された電話端末装置に付加的なまたは専用のハード
ウェアを必要とせず、また外部の会議ブリッジも必要と
しない会議開催方法を提供するものである。会議参加者
の数が小さいところで、これは特に有利である。この発
明の好ましい方法によると、「ブリッジング」（または
音声進路ミキシング）機能は、会議発信者の端末装置の
中で生じる。したがって、その発信者は、その会議の
「チェア」と呼ばれる。

【００１０】好ましい方法の狭い面によると、そのチェ
アに加えて、会議参加者には、3本の利用可能な制御オ
フィス（Control Office, CO）線のうちの2本、または
１本のＣＯ線と２本の利用可能なインターコム線のうち
の１本が含まれてよい。

【００１１】この方法は、以下の特徴を含む。

【００１２】・有効な話し手のアクティビティは、各ポ
ートに対して見つけられる。信号処理技法が、有効な話
し手の声をエコーおよびノイズから区別するために使わ
れる。話し手順位に依存する手法（話し手レベルに依存
する手法に対して）が、どのアクティブな話し手が任意
の所与の時に参加するか判断するために使われる。2人
の最も最近アクティブな話し手が加わることができる。
最も最近の話し手は「優先度A」とみなされ、前の話し
手は「優先度B」とされる。優先度Aは、後にで説明され
るように優先度Bに対してある特権を持つ。

【００１３】・レベル評価が、他の会議参加者への放送
に先立ち各話し手の信号に適用される自動利得制御の量
を決めるために使われる。

【００１４】・優先度Aおよび優先度Bの信号がミックス
されて放送される。優先度Aおよび優先度Bの信号は、そ
れら自身以外の端末装置にだけ送られる。

【００１５】・それゆえに、上記電話端末装置のうちの
1つにおけるマイクロプロセッサを使う複数の電話端末
装置（会議参加者）の間の会議開催機能を提供する改善
された方法は、次のステップを含む。(a）複数の電話端
末装置の一つが2つの他の電話端末装置と電話会議を始
めるステップと、(b）上記マイクロプロセッサが上記2
つの他の電話端末装置から発せられている信号を処理
し、上記複数電話端末装置のうちの2つから2つの会議参
加者信号をアクティブな話し手信号として宣言するステ
ップと、(c）上記アクティブな話し手信号をそれら自身
以外の電話端末装置に送られるようにするステップ。上
記ステップは、上記マイクロプロセッサだけで遂行され
る。

【００１６】改善された方法のもう一つの面によると、
ステップ（b）は会議参加者信号がアクティブな信号と
宣言され続けるダイナミック・ハングオーバ時間を提供
するステップを含む。

【００１７】更なる面によると、改善された方法は、定
期的に各会議参加者についてエコーリターンロス（echo
return loss, ERL）を評価するが、最近受け取られた
最小の話し手信号レベルがあらかじめ決められた最小の
ERL閾値を上回る場合だけ、ERL推定値を更新するステッ
プを含む。

【００１８】

【発明の実施の形態】図面の詳細なフローチャートを説
明する前に、話し手のアクティビティ検出の重要な面お
よび他のテクニカルな考慮を説明する。好ましい実施例
において、次の3つの要因が満足されるならば、アクテ
ィビティが検出される。

【００１９】・スピーチ・エンベロープ・レベル（SEND
IN）が予めセットされた閾値より上にある。多数のルー
プおよびネットワーク損失/ノイズ研究の結果に基づい
て、ここではアクティビティのための最小可能な平均入
力レベルは-50dBmにセットされる。ノイズからの強力な
区別を提供しながら、これは全ての予見できる範囲のル
ープ損失および話し手レベルの組合せをカバーする。エ
ンベロープ検出は、リアルタイム処理の消耗を減少させ
るために単に4msの平均として実行される、しかし、プ
ロセッサ容量が充分であるならば、この制限は必要でな
い。

【００２０】・到来する信号（SENDIN）は、送られた信
号のエコーでない。その接続のためのエコーリターンロ
ス（ERL）のなんらかの推定値が必要であり、それは規
則正しく計算される。

【００２１】・信号のエンベロープ値（SENDIN）は、ノ
イズマージンより大きい量だけノイズの現在の推定値よ
り大きい。

【００２２】これらの条件が少くとも2つのフレーム（8
ms）について満足されるならば、その会議参加者のポー
トはアクティブとしてフラッグされる。上記のテストの
うちの1つが失敗するならば、そのポートは、アクティ
ブなスピーチを持たず、「アクティビティ」を持たない
として扱われる。連続するアクティビティの期間を通し
て増加するカウンターが維持され、アクティビティがな
くなれば、クリアされる。アクティビティが中止するな
らば、その非アクティブがハングオーバ期間を通して残
ったときだけ、ポートは非アクティブとしてフラグを立
てられる。

【００２３】フレームごとに、エコーリターンロス（ER
L）およびノイズフロア推定値が各ポートについて更新
される。強力な検出の鍵は、強力なエコー検出および強
力なノイズ検出である。

【００２４】アクティビティ検出およびエコー排除エコー推定値は、更新される最も最近の少しの（ここで
は8）RECEIVEOUTの平均（AGC利得が適用された後にアル
ゴリズムによって送り出されたレベル、少数の平均はMI
NRECEIVEOUT）の最小値がここでは-40dBm0にセットされ
た最小のERL閾値より大きくさえあれば、更新される。
さらに、エコー推定値は、受け取られたレベル（4ms SE
NDIN平均）がその入力での現ノイズ推定値より大きけれ
ば、更新される。これは、雑音が多い線および高いエコ
ー経路損失があるとき、エコー経路推定値がノイズによ
って動かされないことを確実にする。この2つのテスト
が満足され、そのポートが非アクティブであるならば、
ERL推定値は、現在のERL推定値がMINRECEIVEOUT-SENDIN
より小さいかより大きいかに従って2dB/秒で上または下
に変えられる。

【００２５】ERL初期化は、10dBにある。アクティビテ
ィが入力レベルをエコー・レベルと比較することによっ
て判断されるから、このことは、ノイズフロアが高く最
遠端のスピーチ・レベルが低い場合のこれらの条件に対
してエコー弁別を確保する。線エコーキャンセラーが使
われる場合、この推定値は高くないので、エコーが会議
のはじめでスピーチとして不正に宣言されることがあ
る。

【００２６】アクティビティ検出およびノイズ余裕度ノイズフロア推定値は、32ms平均に基づく。このノイズ
フロア推定値は、そのポートのSENDIN信号（SENDIN_32m
s）の最も最近の32ミリ秒平均に対して比較される。ノ
イズフロア推定値が大きいならば、50dB/秒で下降さ
れ、小さいならば、もっと遅い率で上昇される。実際、
アメリカ合衆国特許No.4,648,108（4ミリ秒フレームの
平均が使われているけれども）と同様に二重のレートで
の増加が使われる。初めに、上昇率は、最初の800ミリ
秒間2dB/秒である。変化がその期間を通してポジティブ
のままであるならば、その推定値を安定させるため5dB/
秒の率がその後使われる。ノイズ推定値は、4msごとに
更新される。

【００２７】ノイズ平均算出（32ms平均）という遅い率
を持つことによって、ノイズ余裕度は現実のバリエーシ
ョンをなめらかにすることによって改善される。減衰速
度がノイズ推定値のための取り組み速度より１０ないし
２０倍速いから、32ミリ秒時間フレーム内で繰り返すノ
イズ・スパイクに対して、この方法はより強力である。
このことは、パルス的な「あいまいなサウンド」ノイズ
のフィールド・レポートによって刺激され、この場合、
ロックアウトが生じることがある（有効な話し手がなん
らかの普通でない条件のために会話への割り込みを妨げ
られる状況）。ポートのアクティビティは、SENDINがノ
イズマージンより大きい量だけノイズ推定値より大きい
ことを確実にすることによってテストされる。ノイズフ
ロア推定値が増加するにつれて、ノイズマージン値は減
少する。これは、高い雑音環境に対して話し手のより簡
単な介入を可能し、大いに「ロックアウト」を減らす。
また、低レベル・ノイズ上での間違ったアクティビティ
検出に対するよりよい耐性を提供する。ノイズマージン
は、次のように決められる：ノイズマージン=max（6,-14−（ノイズ推測値/2））dBm もしノイズ推定値<=-76dBm0ならば、ノイズ推定値=-76d
Bm0

【００２８】また、ダイナミック・ハング時間を有利に
使用することができる。先行技術は、規則正しく間隔を
あけられたパルス性雑音が潜在的にその会議を「独り占
め」することができる固定されたハング時間を使った。
この独り占めは、インパルスがスピーチとして不正に検
出され、スピーチに必要とされる固定の長いハングオー
バのため、次のインパルスが生じるまで非アクティブと
して宣言されないときに、生じる。

【００２９】スピーチでは、短いハングオーバは、それ
らが単語の前端部のクリッピングに至ることがあるの
で、適当でない。ここでは、短いアクティビティ期間の
ためには短いハングオーバ時間が、長い期間のため長い
ハングオーバ時間が使われる。新しい話し手が現れない
限り、非アクティブの間、AGC利得が好ましくは一定に
保持されるから、この方法には背景雑音ポンピングを引
き起こす危険がない。ハングタイム関係は、単にアクテ
ィビティ時間に等しく、最小値12ms（12ms未満のアクテ
ィビティ時間について）、最大値100ms（100msを超える
アクティビティ時間について）である。アクティビティ
は、8msの連続したアクティビティを検出した後宣言さ
れる。これは、鉛筆を軽くたたくような非常に短いイン
パルス的な信号が間違って優先度AかBの話し手と宣言さ
れることからを防ぐ。

【００３０】ノイズ減衰速度が少くとも10倍、取り組み
速度より速いから、ノイズ推定値は好ましくは0dBmで初
期化される。これは、会議の初めですばやくノイズ推定
値に収束することを保証する。

【００３１】ダイナミック・ハングオーバ時間、8msの
アクティビティ条件、および過去32ミリ秒の入力信号レ
ベルに基づくノイズ評価が組み合わされて、表面上切り
替えられない、すなわち「継ぎ目のない」会議の運営に
対するランダムなパルス性雑音の悪影響を最小にする。

【００３２】話し手の順番付けアクティビティが正確に宣言されたならば、次の決定は
ポートが参加することができる方法にかかわる。

【００３３】この方法は、アクティビティの強度よりも
むしろそれらがアクティブである時間順に基づいてどの
アクティブな話し手が参加することができるかを決め
る。低い声をしている、あるいは長い送話ループ上にい
る参加者に不利はない。話し手順序づけ方策は、最高2
人の話し手がいつでもアクティブに参加していることを
確実にする。任意の時に2人の話し手だけを可能にする
ことによって、2つのロケーションからだけの背景雑音
が出力信号に存在するようになる。

【００３４】最も最近の話し手は、最も高い優先度、優
先度Aを割り当てられる。前の話し手は、優先度Bを割り
当てられる。残りの会議参加者（優先度C）は、優先度A
および優先度Bの信号の和を聞き、各信号は、目標信号
レベルを達成するために独立に増幅されまたは減衰され
る。優先度Aの話し手は、優先度Bの話し手だけの話を聞
き、同じように、優先度Bの話し手は、優先度Aの話し手
だけの話を聞く。

【００３５】2人の最も最近の話し手のうちの1人が非ア
クティブにならない限り、新しくアクティブになる話し
手は会話に割り込むことができない。優先度Bの話し手
が非アクティブならば、新しい話し手が優先度Bに昇格
させられ、ＢがCへ降格される。優先度Aの話し手が非ア
クティブであるならば、アクティブな優先度Bの話し手
がAに昇格され、AはBへ降格される（新しいBが非アクテ
ィブなままであるならば、先に述べたように次のフレー
ムにおいてCの話し手がBに昇格される）。優先度Aおよ
びBの話し手が非アクティブであるならば、新しい話し
手が直接優先度Aに昇格され、前のAがBに降格され、前
のBがCに降格される。

【００３６】非アクティブがポートで検出されるとき、
話し手が直ちに降格されるのではないことを強調するこ
とが重要である。直ちに降格されるのではなく、アクテ
ィビティが別のポートで検出されるまで、その話し手の
優先度ランキングは維持され、検出されるとき優先度変
化が生じる。ハングオーバ時間は、短い休止によって直
ちに他の人が介入することがないようにするために使わ
れる。そのような休止は、話された文の中の単語の間で
自然に生じるものである。

【００３７】自動利得制御および利得適用加入者端末装置におけるブリッジング機能の位置のため
に、ユーザーは二点間接続ごとに減衰された信号を受け
取る。しかし、CO線接続上の遠い会議参加者は、潜在的
にそれらの間の損失の２倍を経験する。明らかに、端末
装置でのある目標レベルに信号を正規化するために自動
利得制御（AGC）が必要とされる。自動利得制御パラメ
ータは、CPEでネットワークにおける配置を反映する大
きな多様性のネットワーク条件をカバーする。2つの余
分な加入者ループからの損失およびノイズが考慮されな
ければならない。好ましい利得/レベル・パラメータ
は、以下の通りである。最大利得=21dB AGC目標=-17dBm 最大損失=22dB

【００３８】ネットワーク・エコーキャンセラーが収束
する前に、AGC利得は安定性ガードとして0dBに初期化さ
れる。参加者アクティビティが初めてその会議に入ると
き、32msレベル平均がとられる。この平均に基づいて必
要とされるAGC利得の量が計算される。速い取り組み
が、この利得まで参加者をもたらすために使われ、した
がって、それらは直ちに普通に近いレベルで現れる。こ
の段階で適用することができる最大AGC利得は、+7dBに
限られ、最小は、2dBに限られる。そのアルゴリズム
は、より長い期間のレベル変動をスムーズに追跡するた
めに適度な取り組みおよび減衰レートを使い、利用可能
な利得のレンジが、たとえば±10dB広げられる。AGCが
たとえば+/-2dBのヒステリシス・ウィンドウを上回る量
だけ変化するならば、適用される利得は、どちらの方向
にでもAGC利得を追跡する。これは、潜在的に間違った
アクティビティを引き起こすことがあるノイズに対する
耐性を増大させる。

【００３９】図1で示される先行技術の会議開催回路を
参照すると、会議開催は、その受信信号を変倍し混合す
るために専用のハードウェアを必要とすることがわか
る。専用のハードウェアは、線形から対数関数への変換
を含み入来（SENDIN）および出発（RECEIVEOUT）信号の
フレーム指向のパワー推定値を計算する。マイクロプロ
セッサは、全面的にフレーム平均に作用し、各ポートに
適用されるべき必要な利得を計算し、音声進路接続を制
御する。

【００４０】対照的に、この好ましい方法においてホス
ト端末装置（すなわちチェアのもの）におけるモトロー
ラDSP56156プロセッサ（60MHzで動く）は、専用のハー
ドウェアによって充足される機能の全てを実行する。先
行技術のプログラムが4ミリ秒間隔で実行するのに対し
て、この方法は、サンプル指向のものとフレーム指向の
ものの2つのセクションから成っていると考えることが
できる。「フレーム」は、音声チャネルからの32の連続
的な8kHzサンプルの組を指し、したがって、長さ4msで
ある。しかし、ピークのリアルタイム使用を最小にする
ためにフレーム指向の操作は、適時にそれら自身分配さ
れる。

【００４１】モトローラDSP56156ソフトウェアのフロー
チャートの以下の説明の中で、配列変数は、特別な要素
（FORTRAN規約でのように）を示すために丸括弧を使
う。例えば、PRIORITY（2）はPRIORITY配列においてイ
ンデックス2をもつ要素を表し、メモリロケーションPRI
ORITY+2で見つけられる。配列は、最初の要素を示すた
めに0から始まるインデックスを付けられる。完全に丸
括弧内の変数名は、ブラケット内で指されたメモリロケ
ーションの内容を示す。正方形の中括弧[ ]は、その間
接指定演算子を示す。

【００４２】ポート・パラメータおよび変数は、参加し
ている各ポートに1つずつ、長さ3の配列の中に書込まれ
る。最初の配列エントリ（offset=0）は、常にチェア・
ポート・パラメータ（ポート0）に対応するが、残りの
エントリはポート1とポート2のためのパラメータにその
順序で対応する。2本の内部通話装置線が現在のコード
に修正なしで支えられることができるけれども、ポート
1および2は2本のCO線のいずれかか1本のCO線と1本のイ
ンターコム線でありえる。ポートの実ハードウェア・マ
ッピングは、ロケーションconfRXSptrs(+0,+1,+2)およ
びconfTXSptrs(+0,+1,+2）におけるOSによって提供され
るポインタにのみ依存する。その規則に対する例外は、
配列PRIORITYである。優先度Aのポートのポート・イン
デックスは、PRIORITY+0に格納され、優先度Bのポート
のポート・インデックスがPRIORITY+1に、優先度Cのポ
ートのポート・インデックスがPRIORITY+2に格納され
る。優先度変化は、この配列の要素を再配置することに
よって実行される。その配列要素は、値0、1または2だ
けをとることができる。

【００４３】図2および3を参照して、機能「mainconf」
はOSによってサンプル期間（125マイクロ秒）ごとに呼
ばれる「使命タスク」ラベルである。プログラムが、
（ポート０フレームとして参照される）フレーム内のど
のサンプルが現在処理されているかを判断し、必要であ
ればフレーム指向の処理を開始するようプログラムを変
更する。フレーム処理の目的のために、各ポートについ
て「フレーム」は、ポート1に対して-1サンプル、ポー
ト2に対して-2サンプルだけポート0からオフセットされ
ている。全てのポートに対するフレーム処理の結果に依
存するフレーム指向の処理は、ポート0のフレームの終
わりに完了される。図３におけるLOOPMAX-CONT修正ステ
ップにおいて、LOOPMAXはポートにつき2つの異なる値を
とることができる。初めに3dBをとり、十分な（4秒）LI
STENING時間後（入力非アクティブだが他のポートから
アクティビティが聞こえる）、8dBのより高いLOOPMAX値
がその後使われる。これは、エコー・キャンセラーが収
束すると仮定されるから、より高い利得がポートAおよ
びポートBの間の潜在的に不安定なループに適用される
のを許す。それらの個々の評価された「収束された」状
態に依存して、LOOPMAXはそのループに参加しているポ
ートに対して計算される。すなわち、LOOPMAXは6、11ま
たは16dBの値をとることができる。これは、かなり切替
および利得変化の感覚を低減し、主要な短所である。フ
レーム指向の処理が完了されるとき、サンプル指向の処
理が始まる。

【００４４】図4を参照して、サンプル指向操作はコー
ドセグメント「samples_process」の中で取り扱われ
る。入力サンプルは、入力データ・ストリームから読ま
れる。出力サンプルは、各ポートに対して、それらの現
在の優先度および現在の利得レベルに基づいて計算され
る。後にSENDINおよびRECEIVEOUTの平均の計算に使うた
めに各ポートについてSENDIN_sumおよびRECEIVEOUT_sum
の倍精度合計が更新される。そのサンプルは、対数スケ
ールに変換されない。

【００４５】上で言及されるように、レーム指向の処理
の多くは時間的に分配されるので、プログラムのピーク
実時間消費が引き下げられる。サンプル番号は、ポート
0フレームにリファレンスをつけられる。ポート2フレー
ムがサンプル間隔#30の間処理され、ポート1フレームが
サンプル間隔#31の間処理され、ポート0フレームがサン
プル間隔#0の間処理される。利得変化は、サンプル間隔
#15の間に実行される。

【００４６】全てのフレーム処理が、このように分配さ
れることができるというわけでない。たとえば、全ての
ポートのアクティビティ状態が調べられ優先順序の構造
を再構成するために使用される、mixconf機能は全ての
ポートが処理されたあと実行されなければならない。そ
の切替は、ポート0フレームの処理フェーズの間に起こ
る。また、機能「AGC_adapt」は、この間隔の間に実行
される。実際は、ピークの実時間消費が更なる減少を必
要とするならば、それはどんな間隔の間にでも実行する
ことができる。会議パフォーマンスに対する影響はほと
んど何も知覚されない。

【００４７】目標サンプル間隔が検出されるとき、フレ
ーム指向の処理が始まる。図5に示された「frame_proce
ss」サブルーチンを呼ぶことに先立ち、2つのパラメー
タがメモリに書き込まれ、現在のポート・インデックス
（0、1または2）が「Cur_Port_Index」に格納され、
「遅延ストライド」が現在のポート・インデックス*FRM
S_HISTORYに対応する「Delay_Stride」に格納される。
遅延ストライドが、「遅延テーブル」の二次元のマトリ
ックスへの指数づけを助けるために使われ、このテーブ
ルは、SENDINおよびRECEIVEOUT平均の最も最近のFRMS_H
ISTORY値を持つ。一つのDELAYPOINTERが、最も最近の要
素に索引をつけるために維持され全てのポートによって
使われる。RECEIVEOUT（ポート、DELAYPOINTER）に索引
をつけるために、実アドレスが次のように素早く計算さ
れる：RECEIVEOUTベースアドレス＋DELAYPOINTER＋Dela
y_Stride

【００４８】サブルーチンframe_processは、RECEIVEOU
T_sumおよびSENDIN_sumを使ってRECEIVEOUTおよびSENDI
N平均を計算する。その結果が対数スケールに変換され
コピーがそれぞれの遅延テーブルに入れられる。SENDIN
平均の最後のFRMS_HISTORYフレームの平均が計算されSE
NDIN_32msとして格納される。AGCGAINは、ポートSENDIN
-ENVで見られる受け取られた4ミリ秒平均の長期間エン
ベロープに基づいて計算される。AGCGAINの変化率およ
びエンベロープ率は、速い適合を許すがごくかすかなボ
リュームの揺れしか許さないよう適当に調整されてい
る。サブルーチン「actconf」（図6）および「nse_erl_
adapt」（図7）が次いで呼ばれる。

【００４９】サブルーチン「actconf」は、そのポート
のアクティビティ状態を判断しアクティビティ・フラッ
グおよびアクティビティ・カウンタを更新する。（アク
ティビティ検出は、ポート（SENDIN）での入力信号の4
ミリ秒平均が閾値たとえば-50dBmより大きくなければな
らない）。それは、必要なダイナミック・ハングオーバ
・カウンタ限度を計算し実際のハングオーバ・カウンタ
を維持する。

【００５０】サブルーチン「nse_erl_adapt」は、その
ノイズフロアおよびエコーリターン損失推定値の適合化
を取り扱う。ポートがNOTアクティブとしてフラグを立
てられるとき、ERLが計算される。

【００５１】ポート1およびポート2のフレーム処理の場
合、「frame_process」からの復帰に続いてサンプル処
理が始まる。ポート0フレーム処理は、「AGC_adapt」
（図8）サブルーチンを続け、アクティブな優先度Aのポ
ートのAGCGAINが調節される。共通のDELAYPOINTERはモ
ジュロ8で増やされ、「mixconf」（図9）サブルーチン
が呼ばれ、そこで優先度の変更がなされる。利得値をこ
の点で変えることができるから、優先度A/Bループが安
定性のためにチェックされることが重要である。コード
セグメント「loop_adjust」（図10）がこの目的のため
に呼ばれる。

【００５２】サンプル#15（ポート0フレームにリファレ
ンスをつけた）の間、利得PORTAGAINおよびPORTBGAIN
が、サブルーチンrampgain（図10）を使ってそれらのそ
れぞれの目標に向けて変化する。もう一度述べると、そ
の利得が変わるから、優先度A/Bループは安定性のため
にチェックされなければならず、「loop_adjust」（図1
0）が再び呼ばれる。「loop_adjust」がフレームにつき
二度呼ばれるから、4ミリ秒フレームに基づいた変化率
増加は半分にされる。

【００５３】会議初期化会議電話の具体化ごとに、会議アルゴリズム運用パラメ
ーターが初期化されなければならない。プログラムIniC
onf（ファイルconf.asmの中）がこの初期化手続きを取
り扱う。全ての会議データが定義され一緒にファイルda
tconf.asmに置かれる。

【００５４】ベンチャ・ユーザが会議電話の間、送受話
器（ハンドセット）からハンドフリー・モードに切り替
えるとき、チェア・ポートのパラメータが再び初期設定
されなければならない。Mission_flagsを監視すること
によって送受話器からハンドフリーへの移行が検出され
るときはいつでも、チェアを再び初期設定するコードが
用意されている。以下は、会議パラメータのための初期
値の概要である。ほとんどの場合、初期値の位置調整
（justification，ジャスチフィケーション）は、その
パラメータの状況から明らかである。他の場合には簡単
な説明が与えられている。全ての3つの配列エントリの
それぞれのために、以下の会議パラメータが0に初期化
される： IN_SAMP, MAXRECEIVEOUT, MINRECEIVEOUT, RECEIVEOUT,
SENDIN, DELAYPOINTER,SENDIN_sum, SENDIN_ENV, RECE
IVEOUT_sum, DELAYTABLE, SENDIN_DELAYTABLE,ACTIVE,
ACTCOUNT, ACTHANGCOUNT, NOISECOUNTER, ADAPT。

【００５５】AEC_ONフラグは、ハンドフリー機能が半二
重モードで走ることを確実にするためにクリアされる。
LOOPMAX_CONTは、3dBのそれらの下部の値に初期化され
る。収束カウンタ（CONV_ACT_CNTR）は1000フレーム（4
秒）に初期化され、収束（converge）されたフラグ（CO
NV_FLAGS）がクリアされる。

【００５６】フラグACTIVE_firstは、各ポートについて
1に初期化され、優先度Aとしての最初の32ミリ秒のポー
ト・アクティビティのあとクリアされる。

【００５７】全てのポートに対して全ての利得パラメー
タは、INITGAIN = 0dBに初期化される。それらは、AGCG
AIN, AGCPREL である。単一変数PORTAGAIN、PORTBGAI
N、PATHGAINA_to_B、PATHGAINB_to_Aは、INITGAINに初
期化される。

【００５８】全てのポートに対して、ERLCONFパラメー
タはERLINIT = 10dBに初期化され、VARNOISEMARGINは、
FIXNOISEMARGIN = 9dBに初期化される。

【００５９】最初のNOISE推定値は、INITNOISE = 0dBm0
で、高く設定される。最初のノイズフロアがあまりに低
く設定されるならば、アクティビティ検出はその会議の
初めに極端に敏感である。そのノイズに対する上昇率は
遅く、ノイズフロア推定値は安定するにはあまりに長い
（だいたい8秒）。しかし、下降率が速く、したがっ
て、高い推定値での起動は正しいノイズフロアへの急速
な収束を引き起こし、同時に早期の間違ったアクティビ
ティ検出を防ぐ。

【００６０】その会議で使われた他の定数は、次のとお
りである：パラメータVARNOISE_const =-14dB。パラメータは、次
の計算中で使われる VARNOISEMARGINVARNOISE_const−NOISE/2。

【００６１】可変的なノイズマージンは、6dBと15dB（M
INNOISEMARGIN，MAXNOISEMARGIN）の間に限られてい
る。NOISELIMCNTRは、800ミリ秒の遅延に対する集合で
ある。ノイズ下降率は、50dB/秒であり、2つの上昇率
は、2dBおよび5dB/秒（NOISEDOWNSTEP、NOISESLOWSTEP
およびNOISEFASTSTEPそれぞれ）である。

【００６２】全ての利得パラメータは、+10 dBの最大値
および-10dBの最小値に制限されている。適用される利
得（PORTAGAIN，PORTBGAIN，PATHGAINA_to_B，PATHGAIN
B_to_A）は、両方向に2.9dB/秒の実効レートで変化す
る。

【００６３】ERLFIXTHRESH（固定された閾値）パラメー
タは、-40dBm0にセットされ、ERLMARGINは3dBである。E
RLCONFは、ERLMINIMUM=0dBおよびERLMAXIMUM=25dBの間
で制限される。アクティビティ検出（MINACTIVE_SENDI
N）のための最小限の入力レベルは、-50dBm0に設定され
る。

【００６４】パラメータAGCWAITは、20のミリ秒遅延（5
フレーム）に対して設定され、AGCWAIT_firstは、32ms
（8フレーム）に設定される。AGCGAINは、AGCUPSTEP=2.
9dB/秒で上昇し、AGCDOWNSTEP=2.9dB/秒で下降する。AG
Cヒステリシス・ウィンドウは、HYSTERISIS=2dBに設定
される。AGCREFERENCE=AGCTARGET=-19dBm0であり、優先
度Aとしての最初のアクティビティに続いて最大の初期A
GCGAINは、MAXAGC_first=7dBにセットされる。これは、
最初のアクティビティが非常に静かである場合、また
は、予測できないサイト条件のためにアクティビティが
誤って検出される場合に過大な利得増大を制限するため
のものである。MINAGC_firstは、2dBにセットされる。

【００６５】図11は、多重音源局地化仮想ステレオ（Mu
ltiple-Source Localization Virtual Stereo）の拡張
を示す。この機能は、会議電話の間、最も注目に値する
パフォーマンスを実現する。ユーザーは、ステレオのヘ
ッドセットを使い、他の2人の会議参加者の話をステレ
オで聞く。このとき、2つの別々の位置に知覚される
「仮想」ロケーションはリスナーにとって外的である。
この会議開催方法は、遠く離れた参加者の信号が適当な
利得適用に続いて別々のメモリロケーションに送られる
ように実行されている。遠隔会議参加者からの信号が、
入力データとしてMSL-VSEルーチンによって使われるた
めに増幅されるが混合はされない。

【００６６】会議が関係する限り、常に、MSL-VSE機能
は動作しており、samples_processルーチンの一部とし
てMSL-VSE入力データを計算する。ロケーションconfTXS
ptrs+3およびconfTXSptrs+4は、ポインタとともに、MSL
-VSEがそのスピーカー1およびスピーカー2の入力データ
を予想するロケーションへ書き込まれなければならな
い。ポート1の信号が[ confTXSptrs+3 ]に提供され、ポ
ート2の信号が[ confTXSptrs+4 ]に提供される。基本的
な会議初期化の場合のように、ユーザーがMSL-VSE機能
を可能にするか、使用禁止にするときはいつでもポイン
タを正しく更新することはオペレーティングシステムの
責任である。MSL-VSEに対するユーザー側音の追加は、
会議コードの中で取り扱われておらず、聞いているパス
に専用の側音機能によって加えられると仮定される。

【００６７】

【発明の効果】この発明によれば、専用の付加的な会議
用ハードウェアも外的なネットワーク会議ブリッジも必
要とされない。

【図面の簡単な説明】

【図１】先行技術の会議開催回路（アメリカ合衆国特許
No.4,648,108の図1）の回路図。

【図２】この発明に従って会議開催を提供する方法を要
約している全体的フローチャート。

【図３】図2の中で示された「Process-PortΦ-Frame」
ブロックを詳述するフローチャート。

【図４】図2の「サンプル-プロセス」ブロックを詳述す
るフローチャート。

【図５】図3の「フレーム-プロセス」ブロックを詳述す
るフローチャート。

【図６】図5の「actconf」ブロックを詳述するフローチ
ャート。

【図７】そのノイズフロアおよびエコーリターンロス推
定値の適合のためのサブルーチンを示すフローチャー
ト。

【図８】図3の「AGC-adapt」ブロックを詳述するフロー
チャート。

【図９】図3の「mixconf」ブロックを詳述するフローチ
ャート。

【図１０】図2の「rampgain」ブロックを詳述するフロ
ーチャート。

【図１１】仮想ステレオが提供することがある「サンプ
ル-プロセス」（図4で示された）の拡張版のブロック
図。

【符号の説明】

１０ＰＣＭバッファ１４対数から線形への変換ＲＯＭ１８マイクロプロセッサ３０線形から対数への変換ＲＯＭ

フロントページの続き (71)出願人 390023157 ＴＨＥＷＯＲＬＤＴＲＡＤＥＣＥＮＴＲＥＯＦＭＯＮＴＲＥＡＬ，ＭＯＮＴＲＥＡＬ，ＱＵＥＢＥＣＨ２Ｙ３Ｙ４，ＣＡＮＡＤＡ (72)発明者ポール・スミュルダースカナダ、ケー１ゼット、５イー１、オンタリオ州、オタワ、チャーチル・アベニュー・ノース 443

Claims

【特許請求の範囲】

【請求項１】複数の電話端末装置のうちの1つにおけ
るマイクロプロセッサを使い複数の電話端末装置の間の
会議開催機能を提供する方法であって、(a)上記一つの
電話端末装置が他の2つの電話端末装置と電話会議を始
めるステップと、（b）前記マイクロプロセッサが前記2
つの他の電話端末装置から発せられる信号を処理し、前
記複数の電話端末装置のうちの2つからの会議参加者信
号をアクティブな話し手信号として宣言するステップ
と、(c）前記アクティブな話し手信号を自分以外の電話
端末装置に送られるようにするステップとを含み、上記
ステップは、前記マイクロプロセッサだけで実行される
ようにした会議開催機能を提供する方法。
【請求項２】上記ステップ(b)が、会議参加者信号が
アクティブな信号と宣言され続けるダイナミック・ハン
グオーバ時間を提供するステップを含む請求項1に記載
の方法。
【請求項３】前記ダイナミック・ハングオーバ時間
が、それぞれあらかじめ決められた最低限より小さい話
し手アクティビティ時間およびあらかじめ決められた最
大数より大きい話し手アクティビティ時間に対応それぞ
れ対応する下限および上限を持つ請求項２に記載の方
法。
【請求項４】上記予め決められた下限および上限がそ
れぞれ約10ミリ秒および100ミリ秒である請求項３に記
載の方法。
【請求項５】各会議参加者について定期的にエコーリ
ターンロス（ERL）評価を行い、最近受け取られた最小
の話し手信号レベルがあらかじめ決められた最小限のER
L閾値上回るときだけERL評価を更新するステップをさら
に含む請求項１に記載の方法。
【請求項６】前記最小限のERL閾値がおよそ-40dBm0で
ある請求項５に記載の方法。
【請求項７】会議参加者ポートで受け取られた平均信
号レベルが上記会議参加者ポートでの現在の雑音水準推
定値より大きさえすれば、前記ERL推定値が更新される
請求項５に記載の方法。
【請求項８】各会議参加者について定期的にエコーリ
ターンロス（ERL）評価を行い、最近受け取られた最小
の話し手信号レベルがあらかじめ決められた最小限のER
L閾値を超えさえすれば、ERL推定値を更新するステップ
をさらに含む請求項２に記載の方法。
【請求項９】各会議参加者について定期的にリターン
ロス（ERL）評価を行い、最近受け取られた最小の話し
手信号レベルがあらかじめ決められた最小限のERL閾値
を超えさえすれば、ERL推定値を更新するステップをさ
らに含む請求項３に記載の方法。
【請求項１０】最近受け取られた最小の話し手信号レ
ベルがあらかじめ決められた最小限のERL閾値を超えさ
えすれば、ERL推定値を更新するステップをさらに含む
請求項４に記載の方法。
【請求項１１】会議参加者ポートで受け取った平均信
号レベルが上記会議参加者ポートでの現在の雑音水準推
定値より大きくさえあれば、上記ERL推定値が更新され
る請求項８に記載の方法。
【請求項１２】会議参加者ポートで受け取られた平均
信号レベルが上記会議参加者ポートでの現在の雑音水準
推定値より大きくさえあれば、上記ERL推定値が更新さ
れる請求項９に記載の方法。
【請求項１３】会議参加者ポートで受け取られた平均
信号レベルが上記会議参加者ポートでの現在の雑音水準
推定値より大きくさえあれば、上記ERL推定値が更新さ
れる請求項１０に記載の方法。