JP2512418B2 - 音声コンデイシヨニング装置 - Google Patents

音声コンデイシヨニング装置

Info

Publication number
JP2512418B2
JP2512418B2 JP59122202A JP12220284A JP2512418B2 JP 2512418 B2 JP2512418 B2 JP 2512418B2 JP 59122202 A JP59122202 A JP 59122202A JP 12220284 A JP12220284 A JP 12220284A JP 2512418 B2 JP2512418 B2 JP 2512418B2
Authority
JP
Japan
Prior art keywords
signal
voice
level
conference
transmitted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59122202A
Other languages
English (en)
Other versions
JPS6012852A (ja
Inventor
マイケル・ステヘン・レ−ン
スチ−ヴン・ダグラス・シヨルブロツク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
AT&T Corp
Original Assignee
AT&T Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by AT&T Corp filed Critical AT&T Corp
Publication of JPS6012852A publication Critical patent/JPS6012852A/ja
Application granted granted Critical
Publication of JP2512418B2 publication Critical patent/JP2512418B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04QSELECTING
    • H04Q11/00Selecting arrangements for multiplex systems
    • H04Q11/04Selecting arrangements for multiplex systems for time-division multiplexing

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)

Description

【発明の詳細な説明】 技術分野 本発明は信号コンデイシヨニング(条件付け)特にレ
ベル補償、エコー信号の除去、雑音信号の除去を行なう
信号コンデイシヨニング装置に関する。
通信方式においてレベルコントラス卜とは他の話者の
通話エネルギーと比較したある話者の通話エネルギーを
特徴付ける用語である。このようなシステムにおいて
は、話者の間のレベルコントラストは伝送設備の品質に
よつて影響され、2者の会話の場合には、コントラスト
は一般に感知されない。しかし3者に関連した会議接続
の場合には、特に最も遠方の話者と近端の話者の通話エ
ネルギーのコントラストは一般に感知される。レベルコ
ントラストの問題は会議接続の規模が3者以上になつた
ときによりきびしいものになる。このような問題がある
ために、PBXのようなビズネス向けのシステムでは2つ
以上のトランクに関連した会議接続の品質は保証してい
ない。
伝統的には、これらの問題は二つのエコーサプレツサ
を背中合せに配置して構成されるエコー抑圧アンチシン
ギング(ESAS)回路によつて解決される。しかしESAS回
路はスイツチ利得技術を用いていて、これによつて二重
通話が生ずるのを防止するので、ESAS回路はデイジタル
会議システムの信号コンデイシヨナとしては使用するこ
とはできない。多数の話者からの同時発言を許す機能と
して定義される二重通話はデイジタル会議システムの本
質的な機能である。ESAS回路はまた切替のときにライン
雑音を生じ、また話頭と話尾の音節を切断してしまう傾
向がある。
会議接続の各会議者が他の会議者の音声信号の和を受
信するような音声会議システムでは、話をしていない会
議者からの空きチヤネル雑音と話をしている会議者から
のエコーが会議和に含まれてくる。会議和から雑音とエ
コー信号を除去し、レベルの補償を行なおうとする試み
はアナログ会議装置についても行なわれて来た。しか
し、デイジタル会議システムでこのような装置を用いる
にはアナログ信号取扱いシステムはD/AおよびA/D変換器
を必要とする。さらに、このようなアナログ装置は許容
できない位に高価であつて、エコーを相殺するためにベ
ルシステム140Yエコーキヤンセラのような適応デイジタ
ルエコーキヤンセラを使用することはできない。さら
に、雑音のレベルが大幅に減少されたり、除去されたり
したときには、無音期間では会議和は本質的に0とな
り、会議が動作していないように見えることになる。
雑音和を制御するために、会議装置の無音の話者から
の雑音を除去するためにあるタイプの音声制御による雑
音ガードが必要である。さらに、平均の通話レベルを判
定し、これによつて自動利得制御の機能を実現するため
に通話の検出が必要である。
従つて、レベル補償を行ない、雑音信号を減少し、エ
コー信号を除去するが、会議接続が行なわれていること
の表示として最後の話者のラインからのチヤネル雑音を
与えるような音声信号取扱い装置がこのような技術とし
て必要になる。
発明の要約 会議設備のための従来技術の信号コンデイシヨニング
装置による問題と不適切さは、入来信号が音声なのか、
雑音なのか、あるいはエコーなのかを分類する適応音声
検出装置となるよう4線式設備の中にデイジタル信号プ
ロセツサとエコーキヤンセラを設けることによつて軽減
される。レベルを調整し、会議者の間のコントラストの
バランスをとるために、信号の増幅や信号の減衰を行な
う目的で、このような信号の分類が用いられる。またシ
ステムが送信された音声を検出し、その受信路に音声が
存在しないことを検出すると、これは最終話者保持(ホ
ールドオーバ)モードを実行する。このモードては、デ
イジタル信号プロセツサ(DSP)のプログラムは雑音信
号の利得を減衰せず、会議接続が見えることの表示とし
て、最後の話者のラインからの高レベルの雑音が他の会
議者に与えられるようにする。これに対してその受信路
に音声を検出し、その送信路に音声を検出しないデイジ
タル信号プロセツサはその送信路の利得を減少し、その
線の雑音が他の会議者の音声信号に加算されることを防
止する。
デイジタル信号プロセツサはまたその会議ラインの受
信路を監視し、最小の反射損を仮定することによつてエ
コー信号を予測するように構成されている。このように
して、デイジタル信号プロセツサは反射エコーから送信
された信号を区別することができる。もしその信号が反
射エコーであると判定されれば、デイジタル信号プロセ
ツサは損失を挿入してエコー信号のレベルを下げる。
本発明の動作とその実現法は図面を参照した以下の説
明により、完全に理解されるものである。
詳細な説明 第1図は代表的デイジタル会議装置を示している。線
108を経由して接続される各々の入来ステーシヨンとト
ランク回路について、2線/4線変換ハイブリツド101と
アナログ−デイジタルコデツク102を含む適切なライン
回路が設けられている。コデツク102の出力はデイジタ
ル信号であり、これは適応信号コンデイシヨニング回路
150に直接接続されるかスイツチを通して接続されるデ
イジタル信号である。信号コンデイシヨニング回路150
はエコーキヤンセラ103とDSP104が組合わされたもので
所望の信号処理を実行する。各々の適応信号コンデイシ
ヨニング回路150の出力はマルチプレクサ160によつて多
重化され、デイジタル会議ブリツジ175に供給される。
デイジタル会議ブリツジ175は特定の会議接続のすべて
の入来話者の信号を加算し、各会議者に対して適切な会
議和を出力する。この会議和は会議者に送られるべきラ
イン回路100の適切な信号コンデイシヨニング回路に多
重分離して戻される。
第2図はDSP104で実現される適応信号コンデイシヨニ
ングアルゴリズムの流れ図である。プログラムはシステ
ム全体のリセツト信号あるいは会議呼の開始(図示せ
ず)で起動される。音声検出器のシステム変数を初期化
したあとで、プログラムはループに入り、各入来デイジ
タル音声サンプルが利用できるようになるたびに、各入
来音声サンプルを処理する。会議者からの送信された信
号はDSP104のプログラムによつて処理されて送信振幅信
号(TMAG)を発生する。この信号パラメータは低域フイ
ルタを通して送信エネルギー値(TEMP)を発生するよう
に与えられる。さらにTEMPの最小値を追尾することによ
つて最小の送信エネルギーレベル(MEMP)が保持され
る。この最小値が送信される信号におけるバツクグラウ
ンド雑音レベルを表わす。MEMPがTEMP最小値の上にゆる
やかにドリフトするのを許すことによつて雑音レベルの
変化を迫尾することができる。これによつてDSP104の音
声検出器で高い雑音レベルに適応し、しかも弱い音声信
号を検出し、スレシヨルドが固定しているときに可能に
なるのに比べて雑音と話者のレベルの範囲を有効に作用
できるようになる。
反射による受信音声と弱い送信音声の間を区別するこ
とは不可能であるから、予期されるエコーのある種の測
度が必要である。従つて、受信信号は受信振幅(RMAG)
と受信エネルギー(REMP)信号パラメータを得るために
同様に処理される。ピークストレツチヤは予期されるエ
コーエンベロープ(SRECV)を得るために使用される。
これはREMPの尖頭値を捕え、これを最長の予期されるエ
コー遅延に等しい時間だけ保持するようになつている。
送信および受信信号のパラメータが利用できるように
なつたときに、音声が存在するかどうかを判定するため
に種々の比較が行なわれる。この比較は音声信号と非音
声信号の統計的な観察にもとづく比較はTASIシステムに
おいて確立されている。
ハイブリツド101とエコーキヤンセラ103を通過した残
りの受信音声がもしあれば弱い伝送された音声として現
われるから、次を確立することがまず必要である TEMP>SRECV−最小反射損(MRL) 一度この関係が確立されると、C.J.メイの1981年7月
7日の米国特許4,277,645で示されたような以下の比較
を行なうことによつて、音声の出現が検査される TMAG>10*MEMP あるいは TEMP> 2*MEMP あるいは TEMP>最大雑音レベル(MNL) ここで*は乗算を示す。
これらの比較結果のいずれかが真であれば、信号は音
声であると分類され、近端アクテイブ(NEA)のフラグ
がセツトされる。このフラグはさらに適切なホールドオ
ーバ時間によつて修正されて、トランクサービス要求
(TNS)フラグが発生される。
話者間ギヤツプの間の背景雑音を維持するために、受
信信号に作用する粗音声検出器によつてHOLD信号が発生
され、TNS信号がセツトされており、他の参加者が通話
を開始するまで、その話者がアクテイブになつているこ
とができるようにする。
送信通話が検出されたときに、適切な利得値が選択さ
れ、音声信号に対して適用される。これはピークフオロ
ワによつてTEMPレベルを追尾し、この尖頭値送信エネル
ギー(PEMP)を使用される利得値に対応させることによ
つて実現できる。理想的にはPEMPは話者のVU(ボリユー
ムユニツト)レベルに関連した移動平均を表わす。この
話者のレベルは次に適切な利得値に写像される。この写
像はもしHOLDフラグがセツトされていなければ(他がア
クテイブ)、固定損失が使用されるようになつている。
もしHOLDフラグがセツトされていれば、所望の話者レベ
ルの圧縮を行なうために写像された利得が使用される。
受信信号の大きさ(RMAG)を受信エネルギー(REMP)
と比較することによつて広帝域エネルギー検出器が実現
される。もし平均と尖頭値の比が固定したスレシヨルド
を越えれば、エコーキヤンセラ適応信号がリード105を
通してセツトされる。適応信号には信号の起動の間の耐
雑音性を与えるための待ち時間が設けてある。
詳細な説明 第1図は本発明の詳細な実現法を示している。ライン
回路100−1のようなライン回路が線108のような電話
線、CO線あるいは他の適切なステーシヨンからの2線式
入力を取扱かう。2線−4線ハイブリツド101は2線信
号のチヤネルを別々の送信および受信路を持つ4線チヤ
ネルに変換する。これは入力音声信号をアナログ信号か
ら圧縮されたデイジタル表示して変換し、圧縮されたデ
イジタル音声信号をアナログ信号に変換して線108を通
して遠方のステーシヨンあるいはトランクに返送するた
めのコデツク102によつて次の処理を行なうために必要
である。
エコーキヤンセラ103とデイジタル信号プロセツサ(D
SP)104から成る適応信号コンデイシヨニング回路150は
ライン回路100に直接接続してもよいし、あるいはスイ
ツチ機構を通して接続してもよい。従つて、信号コンデ
イシヨニング回路は真の会議装置に関連したライン回路
についてだけライン回路100の一部として含まれてい
る。例えば、単純な2者接続の場合には信号コンデイシ
ヨニング回路150は必要ない。
エコーキヤンセラ103は、線108のような線上のエコー
を減少しDSP104のソフトウエア音声検出アルゴリズムに
望ましい既知の最小の反射損を与えるように設けられて
いる。
エコーキヤンセラ103のようなエコーキヤンセラは数
字あるいはコールプログレス音のような純音もしくはト
ーン信号の組合せに対して感度があるかもしれない。こ
のためにエコーキヤンセラ103の適応アルゴリズムを助
けるためにDSP104を動作して、リード105を経由して制
御信号を発生させることが望ましい。DSP104によつてリ
ード105を通して出力される制御信号については後述す
る。
さらに第1図を参照すれば、マルチプレクサ160はラ
イン回路100−1のような複数のライン回路からの出力
を多重化し、出力として、バス151を経由してデイジタ
ル会議ブリツジ175に供給される時分割多重信号を発生
する。同様に、マルチプレクサ160はバス107を経由して
会議回路175によつて出力されたタイムスロツト情報を
多重分離して、適切な出力ライン回路に供給する。デイ
ジタル会議ブリツジ175は1978年10月10日の“デイジタ
ル時分割多重交換方式”と題する米国特許4,119,807に
開示されたタイプのものでよい。これでは会議接続の各
会議者からのメツセージサンプルはフレーム中の第1の
タイムスロツトの間に加算され、次のフレームの間に各
会議者に割当てられたタイムスロツトで会議和は各会議
者に分配される。会議和はバス152を経由してマルチプ
レクサ160に供給され、バス152はバス107を経由してラ
イン回路100−1のような適切なライン回路にデイジタ
ル和を与える。
第2図にはデイジタル信号プロセツサ104で実現され
る信号コンデイシヨニングアルゴリズムの全体を図示し
ている。デイジタル信号プロセツサ104は1981年9月号
のベルシステムテクニカルジヤーナル誌第60巻第7号第
2部頁1449に開示されたタイプのものである。このプロ
グラムは電力のスイツチ入、あるいは外部の制御リード
(図示せず)によつて動作を開始する。呼設定あるいは
会議呼の開始時にはDSP104はリセツトされ、アルゴリズ
ムは第2図のブロツク2のような既知の状態で開始され
る。リセツトされると、プログラムはブロツク2に示す
ようにシステム変数を初期化する。ブロツク2はDSP104
の制御レジスタをクリアし、プロセツサがプログラムカ
ウンタと音声検出器のアルゴリズムの一部のパラメータ
を初期化できるようにする。詳しく述べれば、上述した
二つのパラメータ最小EMP(MEMP)と尖頭EMP(PEMP)
(第3図)はアルゴリズムの適切な始動を保障するため
に初期化される。MEMPは最大の雑音レベル(MNL)に初
期化され、従つて会議者の信号がデイジタル信号プロセ
ツサ104に与えられたときに、これが会議のための正し
い雑音レベルに適合するようにする。またバス106への
出力が初期には利得調整をしていないことを保証するた
めにPEMPは平均話者レベルに対応するように初期化され
る。この平均レベルでPEMPパラメータのマツピングは利
得の調整がない状態に対応する。従つて、デイジタル信
号プロセツサ104からバス106に出力される信号は始動時
にEC103からデイジタル信号プロセツサ104に入力される
信号に等しくなる。これらの機能とパラメータの調整が
完了すると、アルゴリズムが起動される。
アルゴリズムに入つて最初の手続きは第2図のブロツ
ク3に示される新らしい送信変数を計算することであ
る。
第3図を参照すれば、図にはMEMPのようなDSP送信変
数を計算するための第2図のブロツク3に示したインラ
インプログラムの詳細な流れ図を示している。ブロツク
301において、DSP104は送信信号サンプルがバス108を経
由してEC103から入力されるのを待つ。送信信号データ
は同期的であるから、デイジタル信号プロセツサは処理
を開始する前に送信データが利用できるようになるのを
待たなければならない。送信信号サンプルを受信する
と、プログラムはブロツク302に進んでEC103から出力さ
れたμ255符号化された値から内部処理のための直接符
号化された値に信号を変換することによつてパラメータ
TFIL(送信波信号)とTMAGを計算する。この線形表現
によつて、DSP104の実現を容易にし、アルゴリズムによ
つて実行される信号のテストと変換が可能になる。線形
化された信号サンプルが一度得られると、これはソフト
ウエアによるデイジタル高域フイルタによつて処理さ
れ、存在する可能性のある直流成分と60サイクルのハム
のような低周波交流成分が除去される。
DSP104のデイジタル高域フイルタは次の形を持つ単純
な1段の再帰的フイルタである。
TFIL=現在の入力−元の入力+(L×元のTFIL) ここで係数Lは次の関係でフイルタの遮断周波数(f3
db)を決める。
L=1−(2π×f3db/(サンプリング周波数)) コデツク102のサンプリングは125マイクロ秒ごとに行
なわれるからサンプリング周波数は8kHzである。例え
ば、200Hzの3db遮断周波数で動作するには定数Lは0.85
となる。送信波信号(TFIL)についてのこの新らしい
値が一度計算されると、これは後の比較に用いるために
DSP104中に記憶される。
送信信号の大きさ(TMAG)はTFILの絶対値に等しい。
さらに第3図を参照すれば、ブロツク303は上述した
ように新らしい送信EMP(TEMP)を計算する。TEMPはTMA
GをDSP104のソフトウエアの低域フイルタを通すことに
よつて計算される。このフイルタは次式に従つてエミユ
レートする。
TEMP=K×TMAG+(C1−K)×元のTEMP) 定数Kは低域フイルタの低域遮断周波数(f3dB)を決
定する。この解釈において、これは絶対値信号(TMAG)
を使用しており、定数Kは短期間の信号エネルギーの計
算に関連した過去の信号サンプルの数を決定する。定数
Kは1を所望の時定数にサンプリング周波数を乗じたし
た値で除したものである。本応用において、短時間エネ
ルギーとしては16ミリ秒の時定数を使用している。この
計算に16ミリ秒の時定数を与えれば、Kの値は0.007812
5に対応することになる。同様に1−Kは0.9921875に対
応する。これらの二つの定数は次に新らしいTEMP値を決
定するのに使用され、これはメモリーに記憶されて、後
の比較に使用される。
304〜309の番号を持つブロツクは最小のEMP(MEMP)
の新らしい値を決定する。MEMPは線108(第1図)に現
われる送信信号上のバツクグラウンド雑音レベルの表示
として使用される。このバツクグラウンド雑音レベルは
送信信号(入力信号)が音声であるか非音声であるかの
判定に使用される。
MEMPの実際の計算は次のようである。ブロツク304に
おいて、現在の送信EMP(TEMP)と固定した最大の雑音
レベル(MNL)の間の比較が行なわれ、線108を経由して
入力される信号が音声であるか雑音であるかの近似的表
示が与えられる。MNLは−43dbmの信号レベルと等価であ
り、これは47dBrnCoの雑音レベルに対応する。もしTEMP
がこの最大の雑音レベルよりも大であれば、入力された
送信信号はバツクグラウンド雑音ではなく有効な信号で
あるとされ、従つてブロツク304からはノーの出力路は
取られ、MEMPは更新されない。
もし送信EMP(TEMP)がこの最大の雑音レベルより小
さければ、ブロツク305からはイエスの経路がとられ、
入力信号はバツクグラウンド雑音であるらしいとされ
る。
ブロツク305において、もし計算されたTEMPが計算さ
れたMEMPより小さければ、イエスの経路が取られ、現在
のメモリー中でMEMPが更新されて、ブロツク306で現在
のMEMPに等価になる。
ブロツク308においては、最小のEMPが定数33に等しい
固定された最小値(MMEMP)より小さくならないことを
保証するテストが行なわれる。MEMPの現在の値がこの最
小スレシヨルド値(MMEMP)より小であれば、MEMPはブ
ロツク309でこの最小値に等しいとおかれる。
ブロツク305に戻つて、もしTEMPがMEMPより大であれ
ば、プログラムはMEMPを増大させるブロツク307への経
路はとらず、これは送信エネルギー(TEMP)はプログラ
ムが現在の最小のエネルギーレベル(MEMP)と考えるも
のよりも大であることを知らせる。これは外部のネツト
ワークに設けられたエコーサプレツサの切替によるもの
である。ブロツク307において、プログラムはMEMPを上
方に調整し、新らしいバツクグラウンド雑音レベルに対
応するレベルに達するようにする。この上方への調整は
ブロツク307によつて次のように行なわれる。ここで4dB
/秒の調整速度ではQ=1.00011514である。
MEMPは弱い通話信号の存在に適応するようになつてい
るから、MEMPが弱い話者を切断する点まで適応する可能
性がある。しかしこの問題を最小化するために二つの要
因が助けになる。第1に音節間のホールドオーバによつ
て弱い音節の末尾が切断されることを減少し、第2に音
節間のポーズによつてMEMPが瞬時的に低下させる。実際
に4dB/秒の現在の適応速度ではMEMPは弱い音声の間にも
あまり上に変化してゆかないことが観察されている。
第2図のブロツク4は第4図に詳細に示されており、
ここでプログラムは送信側で送信パラメータ(TFIL、TM
AGおよびTEMP)を計算するのに使用したのと同様の方法
で新らしい受信変数(RFIL、RMAGおよびREMP)を計算す
る。
ブロツク400において、プログラムはバス107(第1
図)を経由してマルチプレクサ150からの信号サンプル
の受信を待つ。ブロツク401において、受信信号サンプ
ルはμ−255エンコーデイングから線形表現に変換さ
れ、新らしい波された受信信号値(RFIL)を得るため
にf3dbが200Hzであるソフトウエアのデイジタル高域フ
イルタによつて処理される。RMAGはRFILの絶対値に等し
いように設定される。
次にブロツク402で受信信号の短時間エネルギー(REM
P)の計算が行なわれる。REMPの計算は同じ16ミリ秒の
時定数で送信側(第3図)で実行された計算に対応す
る。RFIL、RMAGおよびREMPの新らしい値が決定されたあ
とで、予期されるエコーエネルギーの値を決定する必要
がある。
ブロツク403-414は遅延された受信信号エネルギー(S
RECV)のパラメータを計算するのに使用される。EC103
は16ミリ秒までのエコー路を補償することができるか
ら、4サンプルから成るソフトウエアの遅延線が使用さ
れ、ここで各サンプルは4ミリ秒の中のウインドウの中
のREMPの最大値を表わす。
ブロツク403では現在のREMPがそのときの4ミリ秒の
ウインドウ(RO)についての先に記憶された最大のREMP
より大であるかの比較が行なわれる。もしREMPがROより
大であれば、ROはブロツク404でREMPに等しいように更
新され、さもなければブロツク404はバイパスされて、R
Oの値はこの4ミリ秒のウインドウの最大のREMPの値の
ままとなる。
ブロツク405においては、REMPと遅延線の現在の出力
(SRECV)との間の比較が行なわれる。エコーは16ミリ
秒よりかなり短いかもしれないから、もし現在のREMPが
現在のSRECVよりも大であれば、SRECVはブロツク406で
現在のREMPに等しいように更新される。このようにして
延長された受信出力(SRECV)は最大の最悪値の予期さ
れるエコーとなる。
要約すれば、第5図を参照して図には延長された受信
信号を示しており、ここで曲線(b)は初期には静かで
あり、通話があり、再び静かになるREMP信号を表わして
いる。直線(c)は予期されるエコーあるいはSRECVを
表わしている。ここでは尖頭値(a)が16ミリ秒のウイ
ンドウ、すなわち考えている最大のエコー路だけ保持さ
れていることが示されている。16ミリ秒の後で、SRECV
は(c)に向つてゆるやかにREMPの減少に従つて低下す
る。従つて、REMPにもし増加があれば、これはただちに
遅延線の出力(SRECV)に反映され、一方REMPの減少は1
6ミリ秒遅延される。
第4図に戻つて、ブロツク407-414で16ミリ秒の遅延
は次のような方法で実現されている。ブロツク407にお
いて、プログラムが4ミリ秒のウインドウにどの程度入
つているかを示す計数値が保持されている。カウンタ
(GCNT)を減分したあと、ブロツク408でカウンタが0
に達したかどうかを見るテストが行なわれる。もしカウ
ンタが0に達しなければ、プログラムはルーチンの終り
にパスされる。しかし、もしカウントが0に達すると
(現在の4ミリ秒のウインドウの終りを表わす)遅延線
内の値(R0、R1、R2、R3)はシフトされる。これはブロ
ツク409においてSRECV信号を遅延線の前の信号R3かR0で
ある遅延線の現在の入力のいずれかの大きい方に更新す
ることによつて第1に示されている。
ブロツク410では遅延線の第4の値R3は前の値R2ある
いは初期値R0の大きい方の値に等価になるように設定さ
れる。同様にブロツク411ではR2が更新される。従つ
て、もしR0が遅延線のR2、R3あるいはSRECVをこの計算
の間に越えれば、遅延線のその値がR0の値として設定さ
れる。従つてREMPの増大する値は遅延線の値が更新され
たときに遅延線を通して伝播する。
ブロツク412と413においては、R1の値はR0に等しいと
おかれ、R0は次の4ミリ秒のウインドウで最大のREMPの
初期推定値として使用される現在のREMPのレベルにセツ
トされる。最後にブロツク414でソフトウエアのカウン
タ(GCNT)は4ミリ秒のカウントに再初期化される。以
下において、第4図に示される処理工程を第5図との関
連において概説する。
GCNTはFLCNTの値(FLCNT×サンプル周期が4msに相当
する)に初期設定されサンプル周期毎に減分されるカウ
ンタを構成する。また、R0、R1、R2、R3はサンプルデー
タを順次後段に転送する一連のシフトレジスタを構成し
ソフト遅延線として働く。カウンタGCNTが4ms分カウン
トする都度、409ないし414の処理工程にはいりソフト遅
延線の処理が遂行される。そして各レジスタ内のデータ
は、4ms毎に隣接する後段のレジスタに転送される。こ
こで、R0が相対的に大きい値をもつ場合はより後段のレ
ジスタにまで優先的に転送されることに注意する。
REMPが単調に増加している時間帯では、SRECVはサン
プル周期毎に新しいREMP値で置きかえられるので(処理
ステップ405、406)SRECVは時系列的にREMPをそのまま
トレースする信号となる(第5図でSRECV波形はREMP波
形と重なっている)。REMPが極大値に達したとき、その
直後のソフト遅延線の処理ではすべてのレジスタR0、R
1、R2、R3にREMPの極大値が格納される。そのため、REM
Pが単調減少する時間帯の初期においてSRECVには4ms毎
に4回(R0、R1、R2、R3から順に転送される)REMPの極
大値が現れることとなる。つまりSRECVでは4ms×4=16
msの間REMPの極大値が保持される。16ms経過後には、4m
s毎に新しいREMPデータがレジスタR0、R1、R2、R3を介
してSRECVに現れるから、SRECV信号は、(REMPの信号に
対して)16ms遅れでかつ4ms毎に階段状に減哀していく
第5図に示される波形を形成する。第4図を脱出する
と、第2図で示したDSPプログラムが準備されて第2図
のブロツク6で開始されるように送信信号が音声である
のか非音声であるのかに関して実際の計算と判定が開始
される。
第2図のブロツク6は第6図に詳述されており、上に
計算した送信パラメータと受信パラメータを比較するこ
とによつて近端アクテイブ(NEA)フラグを計算するプ
ログラムステツプを示している。この比較(テスト)に
よつて送信信号がバス108に接続された会議者の発した
音声、雑音、エコーのいずれであるかが判定される。従
つて近端アクテイブ(NEA)が値“1"に等しければ、送
信信号が真の会議音声であることを示し、NEAの値が
“0"に等しければ、信号は雑音であるかエコーであるか
を示すことになる。
第6図を参照して、ブロツク601は送信エネルギーレ
ベル(TEMP)と推定されたエコーエネルギーレベルの間
の比較を行なう。エコーエネルギーレベルは延長受信信
号(SRECV)から最小の反射損(MRL)を引いたものであ
る。24dBの値を持つ最小の反射損(MRL)は会議者に戻
る受信路と会議者からの送信路の間で予期される最悪の
反射損のプログラムによる推定値を表わしている。エコ
ーキヤンセラ103を設けなくとも、0dBに等しい反射損と
することは可能である。従つて、NEAの計算は会議者の
音声信号とエコー信号を見分けるときにエコーキヤンセ
ラの有無に大きな影響を受ける。
もし送信エネルギー(TEMP)が予期されたエコーエネ
ルギー(SRECV-MRL)よりも大でなければ、プログラム
はブロツク605に移り、近端アクテイブを0にして、送
信信号は会議者の音声ではないことを示す。
これに対してもし送信エネルギーが予期されたエコー
エネルギーより大であれば、プログラムはブロツク602
に進み、ここでプログラムは送信パラメータを比較して
送信信号が音声の特性を持つているかどうかを判定す
る。第1の比較では送信信号の大きさ(TMAG)をとり、
これがMEMPの10倍より大であるかどうかを判定する。従
つて、もし送信信号の瞬時値がバツクグラウンド雑音レ
ベルの推定値の10倍よりも大であれば、プログラムはブ
ロツク606に進み、近端アクテイブ(NEA)を“1"にセツ
トして送信信号が真の通話を表わしていることを表示す
る。
ブロツク603においては、プログラムは送信EMP(TEM
P)と最小のEMP(MEMP)の2倍を比較する。このように
して、プログラムは送信エネルギーがバツクグラウンド
雑音レベルの2倍以上であるかを判定する。トーン信号
の瞬時の大きさは602の先の検出器をトリガするには不
充分であるかもしれないが、603の検出器をトリガする
には充分のエネルギーを持つかもしれないので、この比
較は有用である。
もし先述のように、ブロツク603の検出器によつて信
号が音声であると判定されれば、ブロツク606に行くイ
エスの経路がとられて、近端アクテイブ(NEA)は“1"
にセツトされる。もしブロツク603のテストに失敗すれ
ば、プログラムはブロツク604に進み、TEMPと最大雑音
レベル(MNL)の最終比較が行なわれる。最大の雑音レ
ベル(MNL)はどのようなサービス中のトランクやステ
ーシヨンにも生ずることがないと予期される雑音レベル
を表わしており、47dBrnCoのレベルに設定されている。
47dBrnCoのレベルを越える信号はどのようなものでも音
声であると考えられ、ブロツク605で近端アクテイブは
“1"にセツトされる。ブロツク605あるいは606のいずれ
かを脱するときに、プログラムは近端アクテイブ(NF
A)の現在の値を判定し、新らしいトランク要求サービ
ス(TNS)信号を計算するために第2図のブロツク7を
通る。
第7図はプログラムの第2図のブロツク7の動作を詳
細に説明するための状態図である。第7図はトランク要
求サービス(TNS)パラメータの値を駆動する3状態機
構を表わしている。基本的には、プログラムはプログラ
ムが現在の状態にある時間と近端アクテイブ(NEA)の
現在の値とに従つて三つの状態のひとつで動作する。TN
Sは近端アクテイブ(NEA)パラメータの遅延されたもの
であり、弱い音声信号のチヨツピング(突然の中断)を
防止するために音節間のギヤツプをつなぐものである。
TNS信号はまた特に、語の終りが無声音であるときにに
語の末尾のクリツピングを除去するために語の終り(音
声信号の終り)を保持するために使用される。
第7図の状態機構は次のように実現される。
空き状態においては、線108(第1図)を通して回路1
00−1に接続されたステーシヨンはアクテイブではな
く、送信信号は雑音あるいはエコーであると考えられ
る。近端アクテイブのパラメータが“0"である間はプロ
グラムは状態700に留まる。近端アクテイブが“1"にな
つたときに(音声検出)プログラムは保持カウンタ(HO
CNT)を“0"に初期化し、チエツク状態701に進む。状態
701において、プログラムはライン108(第1図)に接続
されたトランクにアクテイブであることを記し、それが
状態701に留る時間を測定するために保持カウントを開
始する。プログラムを繰返すたびに(送信サンプルを受
信するたびに)プログラムは保持カウントを増分する。
第7図の上の図を参照すれば、チエツク状態701で
は、プログラムはまず16ミリ秒の待ち時間の間待ち合わ
せる。待ち時間の間には近端アクテイブ信号のテストは
行なわれない。待ち時間が完了すると、プログラムは状
態701を示すチエツク期間に入る。
チエツク期間の間では、もし近端アクテイブが“1"に
等しいことがわかると、線108の活動がさらに示された
ことになり、プログラムは保持状態702に入る。NEAが
“1"に等しい間は、一番後の近端アクテイブの活動の発
生の後300ミリ秒はプログラムは状態702に留まる。もし
プログラムが2度目の近端アクテイブをチエツクするこ
となく16ミリ秒を経過すると、プログラムは短時間の間
状態701に留り状態700に戻る。この点に関して、もしラ
イン108(第1図)の雑音スパイクが近端アクテイブを
単一のサンプル期間の間“1"に等しくすると、プログラ
ムは状態700から状態701に行くが、これは最大32ミリ秒
の期間の間だけで、これは空き状態700に戻り、近端ア
クテイブが次に生ずるのを待つことになる。
TNSの判定が完了すると、第2図に示したプログラム
はブロツク8を通つて新らしい尖頭値EMP(PEMP)値を
計算する。
第8図は第2図のブロツク8の詳細な流れ図であり、
ここではDSP104のプログラムは新らしいPEMPを計算し、
これは話者レベルを推定するのに使用される。ブロツク
801において、近端アクテイブ(NEA)の値に注意するこ
とによつて、現在の送信信号が音声か非音声かの判定の
ために比較が行なわれる。もしNEAが“1"に等しくなけ
れば、現在の送信信号は音声ではなく、プログラムは第
8図から脱出する。もしNEAが“1"に等しければ、信号
は音声であり、従つてTEMPは話者のエネルギーレベルを
表わす。
プログラムはブロツク802に進み、ここでTEMPとPEMP
の比較が行なわれる。もしTEMPが現在のPEMPより大であ
れば、プログラムはブロツク804に進み、現在のPEMPを
上方に調整し、一方もしTEMPが現在のPEMPより小であれ
ば、プログラムはブロツク803に進み、現在のPEMPを下
方に調整する。
いずれの場合でも、尖頭値EMP(PEMP)の新らしい値
はPEMPの先の値を1に近い値を持つQで乗算することに
よつて計算される。MEMPの計算に関して上述したよう
に、この手続きによつて、PEMPの調整は毎秒何テシベル
と定義される。
Qの現在の値はPEMPが2dB/秒の速度で増大し、また2d
B/秒の値で減少するようになつている。後述するよう
に、PEMPの調整速度は送信音声信号に対して自動利得変
化が行なわれる速度を決定する。人間の耳は利得の変化
が2〜4dB/秒の近くであるときには不連続性を感知しな
いことが良く知られている。これはここに開示する本発
明を用いた我々の実験でも正しいことが示されている。
新らしいPEMPの値が一度設定されると、プログラムは
第2図のブロツク9に進みHOLD値を計算する。第2図の
ブロツク9は第9図に詳細に示されており、これは次の
ように進行する。
HOLDフラグは送信信号が話をすべき最後の話者からの
ものであることの判定を表わす。ブロツク901に示すよ
うに、TNSのテストが行なわれ、もしTNSが空きでなけれ
ば、HOLDは“1"にセツトされ(ブロツク703)DSP104が
音声信号を処理していることを示す。ライン108(第1
図)に接続されたトランクがアクテイブでなければ(TN
S=IDLE)、そのときにはプログラムはブロツク902に進
み第2のテストを実行する。ブロツク902において、プ
ログラムは受信信号EMP(REMP)を最小音声レベルの定
数(MSL)と比較する。従つて、REMPをある固定したレ
ベル(MSL)と比較することによつて、プログラムは会
議において第2の会議者が話をしているかどうかを判定
する粗固定スレシヨルド音声検出器を模擬する。
さらに第9図を参照すれば、REMPがMSLより大であれ
ば、プロクラムはブロツク904に進み、ここでHOLDは
“0"にセツトされて、第1図の回路100−1のようなラ
イン回路はアクテイブではなくまた最後の話者でもない
ことを示す。従つて、第9図に示したルーチンの終りで
は、もしHOLDフラグが“1"に等しければ、DSPプログラ
ムは送信音声信号が受信されていることあるいは送信音
声が受信されてしまつて他の会議者は話を開始していな
いこと(最後の話者の保持モード)のいずれかを表わし
ていることになる。もしHOLDが“0"に等しければ、送信
音声信号が受信されていないことと他の会議者が話をし
ていることを表わす。
第10図は第2図のブロツク10の詳細な流れ図であり、
ここでブロツク1001において現在のHOLDフラグについて
のテストが行なわれる。もしHOLDの値が0であれば(こ
れは回路がアクテイブでないことを示す。)プログラム
はブロツク1003に進み、ここで話者レベル(TLEV)は0
にセツトされる。もしHOLDの値が“1"てあれば(これは
DSP140が音声を処理しているか、最終話者保持モードが
設定されているかを示す)話者レベルは現在の尖頭EMP
(PEMP)に等しく設定される。また、最終話者保持モー
ドが設定されている場合(即ち、話者が話をする最後の
会議者であったとき)には、送信チャンネルにそれまで
供給されていた送信音声信号のレベルに送信背景雑音の
レベルを調整するようにする。新らしい話者レベル(TL
EV)はライン108に接続された会議者の通話レベルを示
す。通話信号レベルが0であることはライン108上に音
声信号が不在であり、会議の他のラインの活動を示すか
ら意味があることになる。
ブロツク1004においては、プログラムは線形符号化さ
れた話者レベル(TLEV)をμ255の圧縮符号に変換する
ことによつて通話レベルの推定を行なう。μ255の符号
化手法は極めて低レベルの信号に対しては線形である
が、大信号に対してはほぼ対数的である。従つて、通話
レベル(SLEV)の推定値は話者レベルのほぼ対数とな
り、話者の通話レベルはVUメータのボリユームユニツト
によつて表わされるものと似て来る。
通話レベル(SLEV)が一度決定されると、これは特別
の利得表(図示せず)を調べるインデクスとして使用さ
れ、出力利得値が求められる。通話レベル(SLEV)はμ
255の値によつて実現されているから、利得表は話者レ
ベル(TLEV)が単に線形の形式で使用された場合に比べ
てはるかに小さくなる。さらに利得表は対数的であるか
ら、ある表の内容と次に対応するものはそのラインの話
者のレベルで約0.5dBに対応することになる。従つて、
表の内容は送信信号を適切な利得で変更するように選択
される。利得表は第11図に示した入出力利得マツプのセ
グメント化された表示として実現される。例えば、もし
入力話者レベルが−15dBmの値にあれば、出力信号レベ
ルは0の利得で修正され、従つて−15dBmの信号を送出
し、一方入力信号がはるかに弱く−30dBmであれば、出
力信号は+10dBの利得によつて修正され、−20dBmで送
出される。同様に、もし入力信号が0dBmであれば出力信
号は−10dBmになる。従つて−15dBmの信号は、その信号
レベルが会議接続における平均の通話レベルを表わすの
で修正されない。−15dBm以下の通話レベルに対しては1
5dBの範囲にわたつて最大10dBの利得まで利得が迫加さ
れる。従つて通話レベルが低下するに従つて、最大10dB
までの利得が与えられる。同様に、通話レベルが増大す
ると、負の利得(実際には損失)が挿入され、大きな声
の話者を平均の話者レベルに近くする。
10dBの利得の値は会議の環境で音声取扱い回路が与え
てもなお安定性を保つことができる最大の利得であると
考えられる。
第10図に戻つて、ブロツク1005はDSP104のメモリーに
記憶された出力信号106には20dBの損失が与えられる。
第2図に戻つて、ブロツク12は新らしい適応パラメー
タを計算し、これはエコーキヤンセラ103に供給される
オンあるいはオフの信号である。適応信号によつてエコ
ーキヤンセラ103が純枠のトーン信号に適応するのが防
止される。純トーンがライン109に存在したときにそれ
に適応するためにエコーキヤンセラに不安定が生ずる可
能性があるので、これが必要になる。従つて、DSP104は
受信路を監視し、純トーンと広帯域信号を区別し、広帯
域信号が存在する間はリード105を論理“1"に設定して
これによりエコーキヤンセラ103がこれらの信号だけに
適応するようにする。第2図のブロツク12によつて表わ
される適応プロセスによつて、エコーキヤンセラに安定
な信号を与えるのに30ミリ秒の保持時間を与えることに
なる。
プログラムがブロツク12(第2図)の処理を完了した
ときに、これはブロツク3に移り、新らしい送信信号が
DSP104に入力されるのを待ち、上述した動作が繰返され
る。
結論 本発明は添付図面に示され以上の詳細な説明に述べら
れた実施例に限定されるものではなく、本発明の精神と
範囲を逸脱することなくその構成部分と機能を入替た
り、追加したり、削除したりすること利得表を使用して
出力利得値(OGAIN)を計算する。μ255の符号化は線形
のTLEVの値をとり、これを符号付きの8ビツトのSLEV量
に変換する。この8ビツトの内で、第1ビツトは符号ビ
ツトであり、残りの7ビツトが利得表の128の内容をア
ドレスするのに使用される。前述のように、利得表の各
内容は与えられた通話レベルに対応し、内容の間の差は
約0.5dBである。出力の利得が一度決定されると、これ
は送信信号を修正し、バス106上にDSP104の出力を発生
するのに使用される。
0に等しい話者レベル(TLEV)は利得表から選択され
るべき一義的な値を生ずることに注意されたい。すなわ
ち、0をμ255で符号化すれば、一義的な通話レベル(S
LEV)値を与える。この一義的な値は利得表に入り、20d
Bの損失に対応する一義的な利得値を得るのに使用され
る。従つて、話者レベル(TLEV)が使われるときにはい
つでも、送信路には20dBの損失が挿入される。20dBの損
失はライン108上に音声が検出されないときと、HOLDフ
ラグによつて判定されるようにバス107上に音声が検出
されたときに選択される。従つて、発言中の会議者ある
いは最後に発言した会議者だけがその現在の尖頭値EMP
(PEMP)を表わす話者レベル(TLEV)を持つことにな
る。話をしていない会議中の会議者はブロツク1003によ
つて0のレベルに設定され、そのそれぞれによつて、構
成を変更できることは当業者には明らかである。
例えば、エコーキヤンセラはエコー戻り路を16ミリ秒
から32ミリ秒に増大するために二つの縦続接続されたエ
コーキヤンセラで実現することができる。またここに開
示した利得表を改訂して隣接した内容の間の増分が、こ
こで開示した0.5dBの増分より大きくすることも小さく
することもできる。さらに、利得表をここで開示したμ
255のフオーマツトの代りに他の符号化フオーマツトと
互換性があるように構成することもでき、使用される特
定の利得値は異つていてもよい。さらにまたここで開示
したMNL、MMEMP、MRLあるいはMSLのような定数パラメー
タおよび時定数と調整速度は本発明の他の応用について
はそれに適合するように変更することができる。
以上、本発明の音声コンディショニング装置の動作・
機能について詳細に説明を行った。最後にあたり本発明
の動作原理の端的な理解に資することを目的として以下
において本発明の動作原理を第12図に即してまとめてお
く。
(本発明の動作原理) 第12図は、本発明の音声の音声コンディショニング装置
の信号処理アルゴリズムを示している。会議者から送信
される信号は、まず高域通過フィルター(HPF)に通さ
れ、CODECの直流オフセットおよび60Hz干渉が減少され
た信号TFILを得る。この信号は、次に全波整流されて、
送信振幅(TMAG)信号が発生される。この送信振幅信号
は、さらに低域通過フィルター(EMP)に通されて、送
信エネルギー信号(TEMP)が発生される。これに加え
て、最小送信エネルギーレベル(MEMP)がいくつかのTE
MP最小値をとらえることによって維持される。これらの
いくつかの最小値は送信された信号中の背景雑音を表わ
している。MEMPをTEMP最小値の間で上方にゆっくりとド
リフトさせることにより、雑音フロアーレベルの変化を
追跡することが可能となる。これにより、音声検出器が
高雑音レベルに適応するが依然弱い音声信号をも検出で
きるようになり、固定されたしきい値を用いた場合と比
較してより広いレンジの雑音および話者レベルにわたっ
て音声検出器を有効に機能させることができる。
エコーがかった受信音声と弱い送信音声との間を区別す
ることは不可能なので、予測されるエコーの何らかの測
定が必要となる。このようにして、受信信号は同じよう
に高域通過フィルター(HPF)および整流器に通され、
受信振幅(RMAG)信号が得られるとともに、低域通過フ
ィルターに通されて受信エネルギー(REMP)信号が得ら
れる。
次に、ピーク伸張器は、予測されるエコー包絡線(SREC
V)を得るために用いられる。これは、いちばん長い予
測されるエコー遅延(第5図参照)に等しい時間の間い
くつかのREMPピークをとらえ、かつそれらを保持する処
理を含む(第4図408ないし414参照)。
一度、送信および受信信号パラメータが利用できるよ
うになると、音声が存在するかどうかを決定するのに種
々のテストが用いられる。これらのテストは、TASIシス
テムのために設定されるような音声信号対非音声信号の
統計的な観測にもとづくものである。
ハイブリッドおよびエコーキャンセラを通過した後に
残っている任意の受信音声は弱い送信音声として現れる
から、次式を確立することがまず必要である。
▲▼=TEMP>(SRECV−最小反射損(MRL)) 即ち、TEMPが(SRECV-MRL)よりも大きい場合は“エ
コーでない”(▲▼)とされる。次に以下の比
較が行われる。
TMAG>10*MEMP, TEMP>2*MEMP,もしくは TEMP>最大雑音レベル(MNL) これらの比較結果のいずれかが真であれば、“雑音で
ない”(▲▼)とされる。そして、▲
▼と▲▼との論理積かとられ“エコーでな
くかつ雑音でない”とされた場合には、信号は音声もし
くは近端活性(NEA)として分類される。このNEA信号
は、相互音節ポーズを広げることを目的としてホールド
オーバー タイムにより修正されてトランク・ニード
・サービス(TNS)信号が発生される。近端活性(NEA)
の論理“1"が検出され、所定の待ち時間を経たチェック
期間中にNEAの“1"が再度検出されるとTNSは“1"に設定
され、チェック期間中にNEA信号の“1"が見出されない
場合には設定されない。こうして、NEA信号が瞬時的に
のみ存在する場合にはTNSが“1"に設定されないように
しインパルス性雑音の影響を受けないようにされる。ま
た、一旦TNSが“1"に設定されると近端活性(NEA)が
“0"となっても所定の時間はこれが保持される。
次に、誰も話していないときに会議者が、正常な量の
背景雑音を聞くようにするため、HOLDが用いられる。HO
LDは、TNSが“1"のとき“1"に設定されるがTNSの設定が
解除され“0"となってもHOLDはしばらく“1"に保持さ
れ、処理回路によりREMP>最小音声レベル(MSL)が検
出されるとHOLDは“0"にリセットされる。このようにし
て、一旦話した最後の話者は話を終えてもREMP>MSLの
検出により別の会議参加者が話すまで活性のまま保持さ
れ、最後の話者の背景雑音が話者ギャップ中に充満され
る。
送信信号が音声であると判定されると適正な利得値が
ピーク送信エネルギー(PEMP)にもとづいて選択され
る。PEMPは送信エネルギレベル(TEMPレベル)をピーク
キャッチャーによって追跡することによって得られる。
そして、平均レベル会話者に0dBの利得が与えられるよ
う、大声の会話者には−10dBの損失が弱い声の会話者に
は+10dBの利得が加えられる。次に利得値選択におい
て、HOLDが設定されてはいるがTNSが設定されていない
場合(最後の会話者が話を終えた後に相当)には相互間
会話者背景雑音を与えるため0dBの利得が用いられる。T
NSが設定されている場合には上述の所望のレベル圧伸に
よりマップ化された利得が用いられる。
一方、受信路を監視し、受信信号の大きさ(RMAG)と
受信エネルギー(REMP)とが比較される。これは、純ト
ーンと広帯域信号を区別し広帯域信号が存在する間はエ
コーキャンセラ適応信号(ADAPT)が論理“1"に設定さ
れリード105を介してエコーキャンセラーに伝達され、
エコーキャンセラーが広帯域信号にのみ適応するように
する。また、エコーキャンセラ適応信号(ADAPT)には
起動の間の耐雑音性を与えるための待ち時間と安定な信
号を与えるための保持時間をホールドオーバー回路によ
り与えるようにしている。
〈略記号解説〉 ADAPT(Adapt Signal) エコーキャンセラーを支援するために発生される信
号。
受信サイドが有意な時間について広帯域エネルギーを
有しているときを示す。WBE信号とともに開始し、48ミ
リ秒の待ち時間と64ミリ秒の保持時間を用いる。
ECHO(Not Echo Signal) この信号は次の比較から生じる。
TEMP>(SRECV×MRL) ここでMRLは最小反射損、即ち、回路について最悪の
ケースの予想反射損失である。
EMP(Exponentially Mapped Past Value) 次式を介して計算される最近の信号値の重みづけ平
均。
NEW EMP=K×NEW SAMPLE+(1−K)×OLD EMP この出願では、K=1/128である。これを8kHzのサン
プリング周波数下16ミリ秒の時定数をもった低域フィル
ターとみることもできる。
HOLD(Hold Over Signal) この信号は、最終話者保持計算を表示するものであ
る。TNSが真で、かつ受信側音声がない場合にはHOLD
は、この話者の背景雑音が話者がアクティブであるとき
と同じレベルで回線にとどまるよう真に留まる。
MEMP(Minimum EMP Value) 最小のTEMP値の記録。(この出願では、送信サイドに
ついて追尾されるだけである。) この値は、次式を用いて非音声の期間中ゆっくりと増
加させられる。
NEW MEMP=Q×OLD MEMP この出願では、Q=1.00011514を用いる。
これは、秒あたり4dBの調整速度に対応する。
MNL(Maximum Noise Level Value) これは、受信サイドにおける最大の予測雑音レベルを
定義する定数である。受信サイドのための単純な音声検
出器の部分として使用される。
NEA(Near End Active Signal) 近端がアクティブに話しつつあるかを示す音声検出器
の「生の」出力。
これは、Not NOISEとNOT ECHOの「and(論理積)」で
ある。即ち、送信サイドが雑音でなくかつエコーでもな
い場合には、それは音声でなくてはならない。
OGAIN(Output Gain Value) 検索表から得られた実際のゲインレベル。
これは、送信音声信号を修正するのに使用される。
(PEMPによって決定づけられるような)この話者レベル
に対して適正なレベル、又は背景雑音(例えば、−12d
B)を減少させるのに用いられる固定レベルのいずれか
である。
PEMP(Peak EMP Value) 送信サイドEMP(TEMP)のピーク値。
音声が存在する(NEAが“真”)であるときにはいつ
でもMEMPについて使用したのと同じ手法を使用して
(が、秒あたり2dBの調整速度を使用して)一定の変化
速度でTEMPの方へ移動させることによりTEMPを実際に追
尾する。
注)PEMPの変化速度は、送信信号に印加されるゲイン
値の変化速度を制御する。
RFIL(Receive Filtered Value) 次式を介しての高域通過型フィルターを通過するサン
プル。
RFIL=NEW SAMPLE-LAST SAMPLE+(L×OLD RFIL) この出願では、200Hzの3dBカットオフ周波数が使われ
L=0.85となる。
REMP(Receive EMP Value) TEMPに類似、これは最近のRMAG値の重みづけられた平
均である(EMP参照)。
RMAG(Receive Magnitude Value) 現在の受信サイドRFIL値の絶対値。
SRECV(Streched Receive Value) この値は、予測されるエコー信号の粗い近似である。
予想される最悪のケースのエコー路長にもとづいてお
り「ピーク伸長」アルゴリズムによって実行されるもの
である。これにより最大値がエコー路時間として記憶さ
れる。
TEMP(Transmit side EMP Value) 最近のTMAG値の重みづけられた平均(EMP参照)。
TFIL(Transmit Filtered Value) 次式を介しての高域通過フィルターを通過した送信サ
ンプル。
TFIL=NEW SAMPLE-LAST SAMPLE+(L×OLD TFIL) この出願では、200Hzの3dBカットオフ周波数が使われ
L=0.85となる。
TMAG(Transmit Magnitude Value) 現在の送信サイドTFIL値の絶対値。
TNS(Trunk Needs Service Signal) この信号は、ワードの終端におけるクリッピングを減
少させる何らかの保持(ホールド・オーバー)を伴った
NEA信号である。インパルス性雑音の効果を減少させる
のに役立つテスト期間も含まれている。(即ち、一旦TN
Sが設定されるとNEAが急激に消失した場合TNSは十分な
保持時間を持たない。) この出願では、テスト期間は32ミリ秒であり十分な待
ち期間は300ミリ秒である。
WBE(Wide Band Energy Signal) 受信サイドにおける有意な非トーン信号の存在を示す
ものである。(これは、エコーキャンセラーが自己調整
するのに必要とされる信号エネルギーのタイプであ
る。) WEBは次のようにして計算される。
WBE=(REMP>MNL)&((RMAG×PTAR)>REMP) ここで、PTARは、平均に対するピーク比(Poak to Av
erate Ratio)でありこの出願では−9dB=0.354813に設
定される。
【図面の簡単な説明】
第1図は本発明を利用した会議システムのブロツク図; 第2図は本発明の流れ図; 第3図は送信チヤネル変数を計算するための詳細な流れ
図; 第4図は受信チヤネル変数を計算するための詳細な流れ
図; 第5図はストレツチ受信信号の図; 第6図は近端アクテイブを判定する流れ図; 第7図はサービスを要求するトランクの状態遷移を表わ
す図; 第8図は信号の尖頭エネルギーの計算を示す詳細な流れ
図; 第9図はホールドフラグの計算を示す詳細な流れ図; 第10図は信号に与えられるべき利得の計算を示す詳細な
流れ図; 第11図は利得表を構成するために使用される自動利得マ
ップの図; 第12図は、本発明の信号処理アルゴリズムに等価なブロ
ック図である。 〔主要部分の符号の説明〕 送信チヤネル……108 受信チヤネル……109 制御手段……104 区別手段……104 エコーキヤンセラ……103
フロントページの続き (72)発明者 スチ−ヴン・ダグラス・シヨルブロツク アメリカ合衆国07728ニユ−ジヤ−シ イ・モンマウス・フリ−ホ−ルド・コ− ニグ・レ−ン26 (56)参考文献 IEEE,1982,(0536−1486/82 /0000−0164)”NETWORK SE RVICES AUDIO BRIDG E”P.4E.3.1〜4E.3.5

Claims (7)

    (57)【特許請求の範囲】
  1. 【請求項1】第1の会議者からの信号を受信するための
    送信チャンネルと少なくとも1人の他の会議者からの信
    号を受信するための受信チャンネルとを有する伝送回線
    で使用するのに適した、すべての会議者が会話を停止し
    ても会議接続が終了しない音声コンディショニング装置
    であって、 該送信チャンネル上に含まれる信号が送信音声信号又は
    送信背景雑音信号のいずれかであるかを識別するための
    手段と、 該送信音声信号及び該送信背景雑音信号のレベルを調整
    し、かつ結果として生じる信号を該送信チャンネルに供
    給するための手段であって、同時に会話をする音声信号
    が同じレベルになるように調整され、また該第1の会議
    者が話をする最後の会議者であったときに該送信チャン
    ネルにそれまで供給されていた送信音声信号のレベルに
    該送信背景雑音信号のレベルを調整するようになってい
    る手段と を含む音声コンディショニング装置。
  2. 【請求項2】特許請求の範囲第1項に記載の装置におい
    て、 該送信チャンネル上に存在するエコー信号をキャンセル
    するための手段をさらに含む音声コンディショニング装
    置。
  3. 【請求項3】特許請求の範囲第1項に記載の装置におい
    て、 該識別する手段が、送信チャンネル音声検出器を含む音
    声コンディショニング装置。
  4. 【請求項4】特許請求の範囲第3項に記載の装置におい
    て、 該送信チャンネル音声検出器が、該送信チャンネル上に
    含まれる信号の平均エネルギー値を引き出すための手段
    を含み、該送信音声信号と該送信背景雑音信号の該識別
    は該平均エネルギー値に応答してなされるものである音
    声コンディショニング装置。
  5. 【請求項5】特許請求の範囲第4項に記載の装置におい
    て、 該送信チャンネル音声検出器が、さらに該平均エネルギ
    ー値から所定の速度で該平均エネルギー値の値に適応す
    るピークエネルギー値を引き出すための手段を含み、該
    調整する手段が該送信音声信号のレベルを該ピークエネ
    ルギー値の関数として調整するものである音声コンディ
    ショニング装置。
  6. 【請求項6】特許請求の範囲第1項に記載の装置におい
    て、 該調整する手段が、該少なくとも1人の他の会議者が話
    しつつあるかもしくは話をする最後の会議者であった場
    合には該送信背景雑音信号を所定のレベルに調整する手
    段を含む音声コンディショニング装置。
  7. 【請求項7】第1の会議者からの信号を受信するための
    送信チャンネルと少なくとも1人の他の会議者からの信
    号を受信するための受信チャンネルとを有する伝送回線
    で使用するのに適した、すべての会議者が会話を停止し
    ても会議接続が終了しない音声コンディショニング装置
    を使用するために適した方法において、 該送信チャンネル上に含まれる信号が送信音声信号であ
    るか送信背景雑音信号であるかを識別するステップと、 該送信音声信号及び送信背景雑音信号のレベルを調整
    し、かつ結果として生ずる信号を該送信チャンネルに供
    給するステップとを含み、 該調整するステップは同時に会話をする音声信号を同じ
    レベルになるように調整し、また該第1の会議者が話を
    する最後の会議者であったときに該送信チャンネルにそ
    れまで供給されていた送信音声信号のレベルに該送信背
    景雑音信号のレベルを調整するステップを含むものであ
    る方法。
JP59122202A 1983-06-16 1984-06-15 音声コンデイシヨニング装置 Expired - Lifetime JP2512418B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US505106 1983-06-16
US06/505,106 US4535445A (en) 1983-06-16 1983-06-16 Conferencing system adaptive signal conditioner

Publications (2)

Publication Number Publication Date
JPS6012852A JPS6012852A (ja) 1985-01-23
JP2512418B2 true JP2512418B2 (ja) 1996-07-03

Family

ID=24009049

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59122202A Expired - Lifetime JP2512418B2 (ja) 1983-06-16 1984-06-15 音声コンデイシヨニング装置

Country Status (3)

Country Link
US (1) US4535445A (ja)
JP (1) JP2512418B2 (ja)
CA (1) CA1210541A (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3427303A1 (de) * 1984-07-20 1986-01-30 Siemens AG, 1000 Berlin und 8000 München Konferenzschaltung fuer digitale kommunikationssysteme
US4603417A (en) * 1984-10-09 1986-07-29 Hitachi, Ltd. PCM coder and decoder
JPH0638621B2 (ja) * 1985-03-01 1994-05-18 日本電気株式会社 音声加算分配装置
GB2177874B (en) * 1985-07-19 1989-01-18 Stc Plc Conference circuit
US5420860A (en) * 1990-06-18 1995-05-30 Intelect, Inc. Volume control for digital communication system
US5195132B1 (en) * 1990-12-03 1996-03-19 At & T Bell Lab Telephone network speech signal enhancement
US5471527A (en) 1993-12-02 1995-11-28 Dsc Communications Corporation Voice enhancement system and method
US5844994A (en) * 1995-08-28 1998-12-01 Intel Corporation Automatic microphone calibration for video teleconferencing
US5809463A (en) * 1995-09-15 1998-09-15 Hughes Electronics Method of detecting double talk in an echo canceller
US5802164A (en) * 1995-12-22 1998-09-01 At&T Corp Systems and methods for controlling telephone sound enhancement on a per call basis
US5848146A (en) * 1996-05-10 1998-12-08 Rane Corporation Audio system for conferencing/presentation room
US6002762A (en) * 1996-09-30 1999-12-14 At&T Corp Method and apparatus for making nonintrusive noise and speech level measurements on voice calls
US5793864A (en) * 1996-12-12 1998-08-11 At&T Corp. Nonintrusive measurement of echo power and echo path delay present on a transmission path
US6011952A (en) * 1998-01-20 2000-01-04 Viasat, Inc. Self-interference cancellation for relayed communication networks
US7263074B2 (en) * 1999-12-09 2007-08-28 Broadcom Corporation Voice activity detection based on far-end and near-end statistics
US6859641B2 (en) * 2001-06-21 2005-02-22 Applied Signal Technology, Inc. Adaptive canceller for frequency reuse systems
US6907093B2 (en) * 2001-08-08 2005-06-14 Viasat, Inc. Method and apparatus for relayed communication using band-pass signals for self-interference cancellation
US6725017B2 (en) 2001-12-05 2004-04-20 Viasat, Inc. Multi-channel self-interference cancellation method and apparatus for relayed communication
JP3984842B2 (ja) * 2002-03-12 2007-10-03 松下電器産業株式会社 ハウリング制御装置
US20060136200A1 (en) * 2004-12-22 2006-06-22 Rhemtulla Amin F Intelligent active talker level control
US9984675B2 (en) * 2013-05-24 2018-05-29 Google Technology Holdings LLC Voice controlled audio recording system with adjustable beamforming

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3649766A (en) * 1969-12-01 1972-03-14 Bell Telephone Labor Inc Digital speech detection system
FR2157143A5 (ja) * 1971-10-19 1973-06-01 Queffeulou Jean Yves
US4028496A (en) * 1976-08-17 1977-06-07 Bell Telephone Laboratories, Incorporated Digital speech detector
US4167653A (en) * 1977-04-15 1979-09-11 Nippon Electric Company, Ltd. Adaptive speech signal detector
US4197429A (en) * 1978-07-17 1980-04-08 Bell Telephone Laboratories, Incorporated Gain-adjusting conference circuit
US4351983A (en) * 1979-03-05 1982-09-28 International Business Machines Corp. Speech detector with variable threshold
US4274155A (en) * 1979-08-06 1981-06-16 Gte Automatic Electric Laboratories Inc. Multiport conference circuit with multi-frame summing and voice level coding
US4281218A (en) * 1979-10-26 1981-07-28 Bell Telephone Laboratories, Incorporated Speech-nonspeech detector-classifier
US4288871A (en) * 1979-11-05 1981-09-08 Bell Telephone Laboratories, Incorporated Digital loop conferencing signal correction arrangement
US4300231A (en) * 1979-12-31 1981-11-10 Bell Telephone Laboratories, Incorporated Digital system error correction arrangement
US4277645A (en) * 1980-01-25 1981-07-07 Bell Telephone Laboratories, Incorporated Multiple variable threshold speech detector
DE3005162A1 (de) * 1980-02-12 1981-08-20 Siemens AG, 1000 Berlin und 8000 München Verfahren zur einspeisung von hoertoenen in konferenzverbindungen
US4387457A (en) * 1981-06-12 1983-06-07 Northern Telecom Limited Digital conference circuit and method
GB2110057B (en) * 1981-10-22 1986-06-25 Bloomfield James Warman Improvements in and relating to telephone conference amplifiers, and telephone conference bridges incorporating the same

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
IEEE,1982,(0536−1486/82/0000−0164)"NETWORKSERVICESAUDIOBRIDGE"P.4E.3.1〜4E.3.5

Also Published As

Publication number Publication date
US4535445A (en) 1985-08-13
JPS6012852A (ja) 1985-01-23
CA1210541A (en) 1986-08-26

Similar Documents

Publication Publication Date Title
JP2512418B2 (ja) 音声コンデイシヨニング装置
JP3032811B2 (ja) 音声品質向上システムおよび方法
US6507653B1 (en) Desired voice detection in echo suppression
EP0615674B1 (en) Network echo canceller
EP1086453B1 (en) Noise suppression using external voice activity detection
JP4522497B2 (ja) デジタル電話システムの機能素子を制御するために状態決定を使用する方法および装置
US6622030B1 (en) Echo suppression using adaptive gain based on residual echo energy
US6889187B2 (en) Method and apparatus for improved voice activity detection in a packet voice network
US5390244A (en) Method and apparatus for periodic signal detection
US5619566A (en) Voice activity detector for an echo suppressor and an echo suppressor
US7558729B1 (en) Music detection for enhancing echo cancellation and speech coding
US8363820B1 (en) Headset with whisper mode feature
JPH11500277A (ja) 音声活性度検出
EP0648397A4 (en) FAILURE-PROOF OPERATING PROCEDURE IN A SPEAKER SYSTEM.
JPH09172396A (ja) 音響結合の影響を除去するためのシステムおよび方法
JP4204754B2 (ja) 通信システムにおける適応信号利得制御のための方法及び装置
EP0376587B1 (en) Acoustic calibration arrangement for a voice switched speakerphone
US20070269039A1 (en) Method and apparatus for active reduction of speakerphone singing
JPH0239744A (ja) 雑音整合方法及び雑音整合を行なう受信器
JPH07123266B2 (ja) 音声交換装置及び音響応答の判定方法
JPH1174822A (ja) 音響反響制御システム、音響反響制御システムの同時通話検出器及び音響反響制御システムの同時通話制御方法
JP2009094802A (ja) 通信装置
US7171004B2 (en) Room acoustics echo meter for voice terminals
US20010006511A1 (en) Process for coordinated echo- and/or noise reduction
US6178162B1 (en) Method and apparatus for inhibiting echo in a channel of a communication system