JP4875090B2 - 音声明瞭度を測定するための方法およびテスト信号 - Google Patents

音声明瞭度を測定するための方法およびテスト信号 Download PDF

Info

Publication number
JP4875090B2
JP4875090B2 JP2008531046A JP2008531046A JP4875090B2 JP 4875090 B2 JP4875090 B2 JP 4875090B2 JP 2008531046 A JP2008531046 A JP 2008531046A JP 2008531046 A JP2008531046 A JP 2008531046A JP 4875090 B2 JP4875090 B2 JP 4875090B2
Authority
JP
Japan
Prior art keywords
speech
signal
intelligibility
speech intelligibility
test signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008531046A
Other languages
English (en)
Other versions
JP2009509396A (ja
Inventor
ユン チェン,
Original Assignee
テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テレフオンアクチーボラゲット エル エム エリクソン(パブル) filed Critical テレフオンアクチーボラゲット エル エム エリクソン(パブル)
Publication of JP2009509396A publication Critical patent/JP2009509396A/ja
Application granted granted Critical
Publication of JP4875090B2 publication Critical patent/JP4875090B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/0082Monitoring; Testing using service channels; using auxiliary channels
    • H04B17/0085Monitoring; Testing using service channels; using auxiliary channels using test signal generators
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/0082Monitoring; Testing using service channels; using auxiliary channels
    • H04B17/0087Monitoring; Testing using service channels; using auxiliary channels using auxiliary channels or channel simulators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B17/00Monitoring; Testing
    • H04B17/30Monitoring; Testing of propagation channels
    • H04B17/391Modelling the propagation channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B3/00Line transmission systems
    • H04B3/02Details
    • H04B3/20Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other
    • H04B3/23Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers
    • H04B3/234Reducing echo effects or singing; Opening or closing transmitting path; Conditioning for transmission in one direction or the other using a replica of transmitted signal in the time domain, e.g. echo cancellers using double talk detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech

Description

本発明は、移動体通信ネットワークにおける音声明瞭度の客観測定に関し、詳細には、移動体通信ネットワークにおける音声明瞭度の測定および/または改善のための新規な技術に関する。
音声の明瞭度(intelligibility of speech)または音声明瞭度(speech intelligibility)は一般には、音声がどれだけよく理解されたかに関するもので、音声通信の有効性の尺度である。早口で話す人や不明瞭な話し方で話す人を理解するのが非常に困難な場合もある。しかし、聴き手の母国語で上品に話されたメッセージであったとしても、そのメッセージがよく聞こえなかったり、聴き手への途中で歪んでしまった場合には、聴き手は誤解してしまうであろう。一方、合成音声は、例えば、聴き手によく理解されるのだが、一般には耳障りで、不自然かつ低品質である。これは、メッセージの品質が劣っていても明瞭度は高い場合があることを示している。したがって、音声明瞭度は一般には音声品質によって制限されるものではなく、音声の理解に関する効率性のより一般的な尺度であると考えられている。
多人数の話し手および聴き手によって行われる聴取テストに基づいて音声明瞭度を主観的に測定するための標準化された方法がある。「伝送品質の主観的に測定する方法(Methods for subjective determination of transmission quality)」と題されたITU-T標準規格P.800(非特許文献1)は、聴取テストによって通信システムの音声品質を評価するための、0から5の範囲の平均オピニオンスコア(MOS : Mean Opinion Score)法を提案している。しかし、このタイプのテストでは大規模で入念に選択された話し手と聴き手のグループを必要とするため、測定には費用や時間がかかるものとなる。さらに、音声品質結果を考察対象システムに実時間でフィードバックすることができないことも明らかである。
そのため、時間のかかる主観的な評価法に代わる、音声明瞭度の客観的な測定方法が望まれる。
ITU-T G.168「デジタル通信ネットワークエコーキャンセラ(Digital network echo canceller)」(非特許文献2)の図I.6-15/G.168は、主観的な音声品質と客観的な測定値との関係を提示し、客観的方法によって音声品質/音声明瞭度を測定する可能性を明らかにしている。
IEC 60268-16 Sound System Equipment - Part 16 「STIによる音声明瞭度の客観評価(Object rating of speech intelligibility by speech transmission index)」(非特許文献3)は、明瞭度についての音声の伝送品質を測定する客観的手法に関する標準化である。この方法は、さまざまな場所やさまざまな条件での音声伝送品質の比較を、同じ聴取空間において行うことができる。また、音声通信チャンネルの評価や、とりわけ、エコー、残響、雑音といった音響特性の変化の影響を評価するためにも使用できる。
非特許文献3で提案された音声明瞭度測定システムの実際的な構成は、音源/スピーカおよびマイクロホンを含む。音声明瞭度指標STI(speech transmission index)は、劇場やコンサートホールのような部屋で発したテスト信号や、通信チャンネルを通ったテスト信号のセットの変調度の減少に基づいて測定される。劇場のような部屋における測定では、各テスト信号は、伝達された音を受信するマイクロホンシステムに向けて音源により発信されるのが通常である。より正確に言えば、STIは、音声周波数域内の多数の周波数オクターブ帯域の重み付け寄与に基づく客観尺度である。各周波数オクターブ帯域信号は、種々の周波数オクターブ帯域において種々の変調を受けたテスト信号の完全行列(complete matrix)を規定するために、一連の異なる変調周波数によって変調される。変調度の低減を定義する変調伝達関数(modulation transfer function)が各オクターブ帯域の各変調周波数について個々に求められ、最終的に、全ての変調周波数と全てのオクターブ帯域についての変調伝達関数値を組み合わせて、音声明瞭度の総合的な尺度が形成される。
通信システム用の音声明瞭度指標STITEL(speech transmission index for telecommunication system)はSTIの簡略版であり、単一通信チャンネルの典型的な条件の下で、STIの代わりに使用できる。
STI法の導入によって音声明瞭度の客観評価は大幅に進歩したが、これらの方法は、相当大量のテスト信号を必要とするため、やはり非常に時間がかかる。また、制約の強い聴取空間や孤立した通信チャネルなど、かなり単純な設定での測定用に特化されたものでもある。
現在の移動体通信ネットワークでは、エコー、残響、雑音が相互に影響しあう信号経路を含んだ複雑な技術的状況がしばしば存在する。例えば、公衆陸上移動体通信ネットワーク(PLMN : public land mobile network)のデジタルコアネットワークには、音声品質および音声明瞭度を改善するためのエコーキャンセラ(EC : echo canceller)、雑音低減(NR : noise reduction)、移動電話漏話制御(MCC : mobile cross-talk control)、レベル制御(LC : level control)装置などの、いわゆる音声強調装置が一般に存在する。通信ネットワーク側では、エコーキャンセラ(EC)が特に重要な音声強調装置であり、近端信号経路への擾乱エコーとして反射される遠端信号の部分の処理に関与する。そのようなより複雑な技術的状況では、音声明瞭度を客観的に測定するための効率的な方法が必要となる。その測定結果は、ひいては、デジタル移動体コアネットワークなど、通信ネットワークにおける音声強調装置の動作を最適化し調整するための基礎として役立てることができよう。
国際公開第2004/002127号(特許文献1)は、非定在エコーの除去に特化した特性のエコーキャンセラに関する。エコー推定における特に残留エコー中の定在要素によって近端音声が継続的に歪むことを防ぐために、非定在エコーキャンセラが提案されている。これは音声品質および音声明瞭度から見たエコーキャンセラの性能を改善するものであり、ダブルトークとは対照的な、シングルトークでの近端音声のケースで特に重要である。
米国特許第5,636,272号(特許文献2)は、スピーカ出力の明瞭度の増大および電話機中のエコー除去のための方法および装置に関する。電話機は、明瞭度強調信号を生成するために音声入力信号を処理する明瞭度ブースタを含む。
国際公開第2004/002127号 米国特許第5,636,272号 ITU-T P.800, "Methods for subjective determination of transmission quality" ITU-T G.168, "Digital network echo canceller" IEC 60268-16 Sound System Equipment - Part 16, "Object rating of speech intelligibility by speech transmission index"
本発明の一般的な目的は、移動体通信ネットワークにおける音声明瞭度を測定するための効率的な手法を提供することである。
具体的な本発明の目的は、近端と遠端など、2つの端末間の双方向通信を行う通信ネットワーク構成要素の音声明瞭度を測定するための方法および構成を提供することである。
特に、エコーキャンセラなど、少なくとも1つの非線形な音声強調装置を近端信号経路中に持つ通信ネットワーク構成要素の音声明瞭度を客観的に測定する、効率的な手法を提供することが望まれる。
音声明瞭度の客観的測定に要する時間を低減することが、本発明のもう1つの具体的目的である。
また、音声明瞭度の客観測定に応じて移動体通信ネットワーク中の音声強調装置の動作を最適化して、音声明瞭度を改善することも、本発明の一般的な目的である。
移動体通信ネットワークにおける音声明瞭度を改善する方法およびシステムを提供することも、本発明の目的である。
これらおよびその他の目的は、添付の特許請求の範囲から明らかなように、本発明によって達成される。
本発明は一般に、2つの端末、通常は近端と遠端との間、の双方向通信を行う移動体通信ネットワーク構成要素の音声明瞭度の測定に関する。基本的なアイデアは、音声明瞭度の測定向きに構成されたテスト信号に基づいて双方向音声通信をシミュレートし、シミュレートされた音声通信中のダブルトークを検出し、そしてダブルトークの期間中のみ音声明瞭度の測定を実行することである。このようにして、例えば、音声明瞭度測定対象信号経路に見込まれる非線形処理からの望ましくない影響を回避しつつ、音声明瞭度の測定においてエコーの影響を考慮に入れることが可能となる。
多くの利用では、普通、近端信号経路は、選択的に活動する非線形プロセッサおよびコンフォートノイズ発生器付のエコーキャンセラなど、音声活動で制御される非線形信号処理を備える1つ以上の音声強調装置を含む。非線形処理によって近端信号経路の入出力関係が変化してしまうので(見込まれるコンフォートノイズも一緒に)、音声明瞭度の客観的測定は事実上、不可能と言わないまでも非常に困難になる。音声明瞭度の測定において、ダブルトークの検出を使用しかつダブルトークの期間中のみ明瞭度を測定することにより、近端信号経路中の非線形処理からの望ましくない影響は一般に回避されよう。
発明者は、近端信号が所定のしきい値以上のときは、通常、非線形信号処理(NLP)がオフになることの知見を得た。同時に、通信ネットワークにおける通信の実際の状態を表す測定結果を得るためには、例えば、ハイブリッドエコーの源泉である遠端信号を考慮することも、通常、重要である。ダブルトークを検出することにより、望みどおりに、(NLPが入出力関係を変えないよう)NLPがオフでありかつコンフォートノイズが付加されていないときに測定が実行され、そして測定において遠端信号経路からのエコーが考慮されることが確実になる。
好ましくは、測定結果は次いで、エコーキャンセラ、雑音低減、移動電話漏話制御およびレベル制御装置など、関連する音声強調装置の動作および調整を分析および/または制御するために、フィードバックとして使用される。例えば、移動体通信ネットワーク中の音声強調装置は、新しい要求および/または標準に対応するために、時々新しい装置による更新または取替えが必要かもしれない。このプロセスでは、新しいまたは更新された音声強調装置の効果を音声明瞭度の観点からテストし、それらを通信ネットワーク中に実装する前に装置の構成を必要があれば調整するのに役に立つかもしれない。
音声明瞭度の尺度は、好ましくは、いずれかの非線形な動作を行う音声強調装置を一般に含む近端信号経路の少なくとも一部についての信号特性の変化の測定に基づいて推定される。
音声明瞭度の尺度は、好ましくは、明瞭度(STI(speech transmission index)とも呼ばれる)の観点からの音声の伝達品質を表し、コンサートホールや劇場用に使用される標準的方法と同様に、変調度の減少の測定に基づいて推定される。
本発明の別の態様は、新たな高効率なテスト信号の使用に関係する。その新たなテスト信号は好ましくは雑音搬送波を含むが、これは音声に似たスペクトルを持ちそして周波数掃引信号によって変調されている。これは、IEC 60268-16標準で提案されたように、種々の周波数オクターブ帯域における種々の変調を受けたテスト信号の完全行列を使用し、各オクターブ帯域における各変調周波数について個々に変調伝達関数を決定するのに比べて遥かに効率的である。テスト信号中の関連する周波数域全体にわたる普通の音声をエミュレートし、その音声状のテスト信号を周波数掃引により変調することにより、測定手順は遥かに効率的になる。単一のテスト信号を使用することで基本的に十分であり、これにより測定手順は、時間効率に優れ、管理の容易なものになる。本発明のこの態様は、双方向通信を処理する移動体通信ネットワーク構成要素における、音声明瞭度の任意の測定に一般的に適用可能である。
本発明は以下の利点を提供する。
・移動体通信ネットワークにおける音声明瞭度の客観測定、
・移動体通信ネットワークにおける音声強調装置の動作および調整の最適化、
・音声明瞭度の改善、
・時間効率に優れ管理の容易な音声明瞭度の測定、
・音声明瞭度の測定において遠端信号経路のエコーの影響が考慮に入れられ、一方、近端信号経路に見込まれる非線形処理からの望ましくない影響が回避される。
本発明が提供するその他の利点は、本発明の実施形態の以下の説明を読む際に理解されよう。
本発明は、以下の説明を添付の図面と合わせて参照することにより、さらなる目的および利点も含めて、最もよく理解されよう。
全図面を通して、対応するまたは類似する要素については同じ参照符号を使用するものとする。
以下、本発明について、事例的な移動体通信ネットワークの利用における事例的な実施形態を説明するが、本発明はこれらの事例に限定されるものではないことは言うまでもない。
先に述べたように、本発明は一般に2つの端末、通常、近端と遠端との間の双方向通信を処理する移動体通信ネットワーク構成要素における音声明瞭度の測定に関する。
図1のフローチャートを参照する。音声明瞭度の測定の基礎は、音声明瞭度の測定用に構成された好適なテスト信号を使用して、考察対象通信ネットワーク構成要素を介した双方向通信をシミュレートする(S1)ことである。次いで、シミュレートされた音声通信の最中にダブルトーク検出器を使用してダブルトークを検出し(S2)、ダブルトーク期間にのみ音声明瞭度の測定を実行する(S3)。音声明瞭度を測定するこの方法は、音声明瞭度の測定においてエコーの影響を考慮に入れることができ、一方、音声明瞭度の測定対象である信号経路中に見込まれる非線形処理からの望ましくない影響を回避することができる。オプションとして、測定結果は、考察対象移動体通信ネットワーク中の音声強調装置の動作および調整を分析および/または制御するためのフィードバックとして使用される(S4)。
多くの応用においては、図2の事例的な図に示されるように、通信ネットワーク側の近端信号経路は、普通、選択的に動作する非線形プロセッサ、コンフォートノイズ発生器付のエコーキャンセラなど、音声アクティビティ(speech-activity)で制御される非線形信号処理を伴う1つ以上の音声強調装置10を含む。非線形処理は一般に、近端信号経路の入出力関係を変化させてしまうので(見込まれたコンフォートノイズも一緒に)、音声明瞭度の客観測定が、事実上不可能と言わないまでも、非常に困難になる。
発明者による注意深い分析によって、近端信号が所定のしきい値以上のときに、非線形信号処理は通常オフであることが明らかになった。同時に、ハイブリッドエコーの源泉である遠端信号を考慮に入れることが重要であることも分かった。以上をまとめると、見込まれるハイブリッドエコーを明らかにし、そして非線形処理の不都合な影響を避けるためには、音声明瞭度測定は近端信号エネルギおよび遠端信号エネルギが同時に存在する時、すなわちダブルトーク状態、にのみ実行されるべきである。
したがって、本発明による着想ではダブルトーク検出器20を使用する。これにより、シミュレートされた音声通信中のダブルトークを検出する。すなわち、近端および遠端両方からのより高い信号エネルギを検出する。ダブルトーク検出器の出力は音声明瞭度推定器30へ転送され、音声明瞭度推定器30はダブルトーク中にのみ音声明瞭度の測定を実行する。
双方向音声通信をシミュレートするために、この構成においては、好適なテスト信号TEST_1、TEST_2を発生するテスト信号発生器40が含まれる。これらのテスト信号は通信ネットワーク構成要素に、好ましくは、遠端信号経路および近端信号経路それぞれに、挿入される。
次いで測定結果は、好ましくは、音声強調装置の動作を分析しおよび/または最適化するために、(明瞭度推定器から音声強調装置への破線によって示されるように)フィードバックとして使用される。例えば、通信ネットワーク中の音声強調装置は、新たな要求条件および/または標準に対応するために、時々新しい装置による更新または取替えが必要かもしれない。このプロセスでは、新しいまたは更新された音声強調装置の効果を音声明瞭度の観点からテストし、それらを通信ネットワーク中に実装する前に装置の構成を必要があれば調整するのに役に立つかもしれない。これは、例えば、通信ネットワークの通常の保守/点検/更新の一環として実行されてもよい。
音声明瞭度の尺度は、好ましくは、いずれかの非線形な動作を行う音声強調装置を一般に含む近端信号経路の少なくとも一部についての信号特性の変化の測定に基づいて推定される。
近端および遠端など、2つの端末間の双方向通信を処理する移動体通信ネットワーク構成要素では、一般に2つの入力と2つの出力が存在する。図2の事例的な図について、RINは遠端からの入力信号を示し、ROUTは近端への出力信号を示す。SINは近端からの全入力信号(遠端信号からのエコーを含み得る)を示し、SOUTは遠端への出力信号を示す。テスト信号TEST_1を遠端入力で挿入し、テスト信号TEST_2を近端入力で挿入するとよい。既に述べたように、ハイブリッドエコーでは、SIN信号は挿入されたテスト信号TEST_2および遠端信号経路からのエコー寄与分ECHOの両方を表すであろう。
音声明瞭度の尺度は、好ましくは、明瞭度(STI(speech transmission index)とも呼ばれる)の観点からの音声の伝送品質を表し、変調度の減少の測定に基づいて推定される。例えば、近端でのテスト信号TEST_2が100%の変調度であり、ハイブリッドエコーを含んだSIN信号が例えば40%の変調度であり、SOUT信号が例えば15%の変調度であるとする。そうすると、STIは、変調度の減少に基づいて計算することができ、これは上記の例では、40%-15%=25%である。STIが変調度の減少に直接に比例する場合には、STIの改善は0.25となる。実際にはその場合、STIの推定値は単純に、ダブルトーク時間でかつ信号の谷の時間(signal valley time)に測定されたSINとSOUTとのパワの差 (dB) で推定できる。
本発明のよりよい理解には、移動体コアネットワーク中の通信ゲートウェイにおける特有の適用について本発明を説明するのが役立つかもしれない。公衆陸上移動体通信ネットワーク(PLMN)を全体的に示す図3において、デジタルコアネットワーク100は、無線アクセスネットワーク200および公衆交換電話ネットワーク(PSTN)、サービス総合デジタルネットワークまたは同等の通信ネットワークなど、種々の通信ネットワークを相互接続する。移動体コアネットワークは、通常、音声およびデータの交換およびルーティングのためのノードだけでなく、制御および管理のためのノードを持っており、それらには異なる伝送方式間を繋ぎ、また端末ユーザの接続にサービスを付加する、いわゆるゲートウェイ(GW : gateway)が含まれる。
図4は、従来のデジタル移動体ネットワークの通信ネットワーク側の音声強調装置の事例的方式を示す概略図である。PSTN網へおよび/またはPSTNネットワークから繋ぐゲートウェイは一般にハイブリッド回路5を含むが、これは別々の伝達経路を持つ4線式回線を2線式の加入者線に変換する装置である。ケーブル敷設コストのため、ローカル交換局から加入者施設へ4線式回線を敷設する考えは成り立たない。この理由から、別の解決法を見つけねばならなかった。それ故に、4線から2線へのハイブリッド回路がずっと以前に導入された。残念ながら、ハイブリッド回路は本質的に漏話が大きい装置である。加入者線インピーダンスによっては、近端(PSTN)側へ向かう信号の一部が遠端側へ向かって反射され、擾乱の元となるエコー、いわゆるハイブリッドエコー、を生じる。無線通信ネットワークにおける音声信号の無線伝送によって入り込む伝達遅延のせいで、遠端の話者に擾乱を与えることを回避するようこのエコーを制御する必要がある。したがって、エコーキャンセラ(EC)10−Aがそのエコーを制御するために通信ネットワーク側で使用される。
普通のエコーキャンセラでは、エコーの線形部分を除去するために線形フィルタ12が適用され、非線形プロセッサ(NLP)14が残留エコーを除去するために使用され、またコンフォートノイズ推定・発生器16がコンフォートノイズを挿入する。普通、線形フィルタ12は、ハイブリッド回路を通過するエコー信号を適応的に評価しようと試みる適応フィルタである。そのフィルタは通常1秒以内に良好な推定値に収束する。推定値が良好な場合、線形エコーは除去されよう。しかし、両方の話者が同時に話した場合、適応フィルタは発散することが多く、推定値はエコーを表現しないであろう。この理由から、フィルタの発散を避けるべく、ダブルトーク中のフィルタの適応を停止させるための内蔵型ダブルトーク検出器をエコーキャンセラ中に設けてもよい。線形適応フィルタだけではエコーの全体は除去されず、その他のいわゆる残留エコーがなお存在し得る。残留エコーを除去するために、通常、非線形プロセッサ14がエコーキャンセラ中に配置される。非線形プロセッサ(NLP)は、普通、近端信号が所定の閾値以下の場合に残留エコーを除去する。しかし、近端音声信号が所定の閾値を超える場合、通常、非線形プロセッサ(NLP)はオフになる。NLPが残留エコーを除去するとき、それは近端信号からの背景雑音をも除去するかもしれない。背景雑音のこのオン/オフの影響は非常な擾乱をもたらし得る。したがって、NLPが活発に残留エコーを除去する時は、いわゆるコンフォートノイズが推定され、信号に追加される。コンフォートノイズは、スペクトル特性および振幅特性の両方が、できる限り元々の背景雑音に似たものであるべきである。エコーキャンセラの設計が異なると、非線形処理も異なりがちである。これは外部からはわからないであろう。
その他の考えられる音声強調装置には、移動電話漏話制御(MCC)装置、雑音低減(NR)装置10−Cおよび固定レベル制御(fixed level control、FLC)装置10−Dが含まれる。移動電話漏話制御(MCC)装置は、通常、遠端音響雑音を制御するために使用される。MCC装置はエコーキャンセラに非常に似ているかもしれないが、線形フィルタはないことが多く、非線形プロセッサのみおよび場合によっては付随するコンフォートノイズ発生器が存在する。雑音低減(NR)装置は両信号方向で使用されてもよく、一方、レベル制御(LC)装置は一般にダウンリンク経路の音声品質を改善するために適用される。
エコーキャンセラなどの音声強調装置における非線形処理によって、音声の品質および明瞭度が改善されるであろうが、これにより、考察対象信号経路の入出力関係が変化してしまうので、音声明瞭度の客観評価が困難あるいは不可能になってしまう。付随するコンフォートノイズ発生器によってコンフォートノイズが付加される場合には、客観評価はさらに困難になる。
図5は、本発明の事例的実施形態による、デジタル移動体ネットワークの通信ネットワーク側で音声明瞭度を測定する構成の概略図である。この構成はゲートウェイなど、通信ネットワーク構成要素の通信ネットワーク側に装備されるが、これは、ダブルトーク検出器20、音声明瞭度測定用のモジュール30、およびゲートウェイにおいて双方向音声通信をシミュレートするテスト信号発生器40を基本的に含む。ダブルトーク検出器(DTD)20は、シミュレートされた音声通信において近端および遠端からの高い信号エネルギを検出する。ダブルトーク検出器20の出力信号は明瞭度測定モジュール30に転送され、明瞭度測定モジュール30はダブルトークの期間中のみ音声明瞭度の測定を実行し、音声明瞭度の客観尺度を推定する。この本質は、明瞭度測定モジュール30を交互に休止または作動させるためにダブルトーク検出器を使用し、こうして音声明瞭度測定における非線形処理(および見込まれるコンフォートノイズ付加)の悪影響を回避することである。次いで、音声明瞭度の推定尺度は、好ましくは、分析されそして種々の音声強調装置の性能を最適化するための基礎として使用される。この音声強調装置の最適化は、通常、通信ネットワークの保守/更新の際に、例えば、構成/変更アルゴリズムを調整し、そしてその調整を音声明瞭度の観点から評価することにより、試行錯誤(trial-and-error)ベースで実行される。
本発明の別の態様は、特有のテスト信号の使用に関する。IEC 60268-16標準で提案されたような、種々の周波数オクターブ帯域において種々の変調を受けたテスト信号の完全行列を使用して、変調伝達関数を各オクターブ帯域の各変調周波数について個々に求める代わりに、新しいテスト信号を提案し、これにより測定手順を遥かに効率的になる。
新しいテスト信号は、好ましくは、雑音搬送波を含み、これは、音声状のスペクトルを持ち、周波数掃引信号によって変調される。テスト信号中の関連する周波数域全体にわたって普通の音声をエミュレートし、そしてその音声に似たテスト信号を周波数掃引によって変調することにより、測定手順は遥かに時間効率がよくそして管理し易いものとなる。図6(A)は周波数掃引信号の例を示し、図6(B)は音声に似たスペクトルを持つ周波数掃引変調雑音搬送波の例を示す。周波数掃引信号は、例えば、図6(A)に示されるような低周波チャープ信号であってもよい。
雑音搬送波は、男性音声、女性音声および/または子供の音声に対応する音声スペクトルを持ってもよい。例えば、雑音搬送波は、様々な年齢の多数の男性および女性の音声の平均に対応するスペクトルを持ってもよい。あるいは、雑音搬送波は、ある部分は男性音声に対応するスペクトルを持ち、別の部分は女性音声に対応するスペクトルを持ち、さらに別の部分は子供の音声に対応するスペクトルを持つ多数の様々な連結部分でできている。別のやり方として、雑音搬送波は、特定の言語または様々な言語の組み合わせに対応する音声スペクトルを持ってもよい。例えば、あるテスト信号は英語音声用に、別のものはスウェーデン語用に、さらに別のテスト信号は中国語用にというように、言語依存の様々なバージョンのテスト信号が存在してもよい。
雑音搬送波が周波数掃引によって一度変調されれば、結果のテスト信号は選択可能な回数だけ複製できよう。
特有のテスト信号は、好ましくは、音声明瞭度の尺度の推定が望まれる信号経路に挿入される。例えば、図2および図5に示される事例的な構成では、新しい周波数掃引変調テスト信号が、好ましくは、通信ネットワーク構成要素の近端信号経路に挿入される。というのは、近端信号経路について音声明瞭度を推定することが望まれるからである。遠端信号経路に挿入されるその他のテスト信号は、事実上、音声明瞭度測定用に構成された任意(従来型)のテスト信号、例えば、G.168標準によるシミュレートされた音声および非音声信号の複合音源信号(CSS : composite source signal)であってよい。
最後に、本発明を実践的に感得できるよう、事例的なシミュレーションおよび音声明瞭度測定手順からの一連の信号について、図7(A)〜(D)を参照して説明する。測定手順はここでは図5の構成に対応する動作で実行される。
図7(A)は遠端からの入力信号電力(RIN)を示している。この例では、この信号はG.168標準による音声および非音声信号を含む複合音源信号CSS(Composite Source Signal)である。
図7(B)は近端からの入力信号電力(SIN)を示している。この信号は遠端と近端のテスト信号を合わせたものからのエコー信号を含む。エコーレベルは20dB ERL(echo return loss)であり、シミュレーション中の近端では雑音が存在しないことに注意されたい。
図7(C)は遠端への出力信号電力(SOUT)示している。この例では、エコー除去は直ちに収束し、その結果、エコーは近端経路中のエコーキャンセラのNLPによって除去される。
図7(D)はいわゆるダブルトークハングオーバを表し、ここでdthangt=0はダブルトークが存在しないことを意味し、dthangt>0はダブルトークが検出されることを意味する。
STIなどの音声明瞭度の尺度は、例えば、テスト信号が谷の期間中で、かつ、ダブルトーク時間にあるときの、RIN信号とSOUT信号との間の差から抽出される。
上述の諸実施形態は事例として与えられたに過ぎず、言うまでもないことであるが、本発明はこれらに限定されるものではない。本明細書で開示および請求された基本的な基盤原理を保持するさらなる改造、変更、改良は本発明の範囲内にあるものである。
本発明の好適な事例的実施形態による、音声明瞭度を測定/改善するための方法の概略的なフローチャートである。 本発明の好適な事例的実施形態による、音声明瞭度を効率的に測定する(内蔵/外付け)構成を含む、近端と遠端との間の通信を処理する通信ネットワーク構成要素の関連部分の概略図である。 無線アクセスネットワーク、公衆交換電話ネットワークなどの種々の通信ネットワークを接続するコアネットワークを含む従来の移動体通信ネットワークの概略図である。 従来のデジタル移動体ネットワークの通信ネットワーク側の音声強調装置の事例的構成を示す概略図である。 本発明の事例的実施形態による、デジタル移動体ネットワークの通信ネットワーク側の音声明瞭度を測定するための構成の概略図である。 (A)は本発明による周波数掃引信号の例を示す図、(B)は音声に似たスペクトルを持つ周波数掃引変調雑音搬送波の例を示す図である。 事例的なシミュレーションおよび音声明瞭度測定手順からの関連する一連の信号を示す図である。

Claims (14)

  1. 2つの端末間で双方向通信を行う移動体通信ネットワーク構成要素の音声明瞭度を測定するための方法であって、
    前記ネットワーク構成要素は、入力した信号に含まれるエコー成分を抑圧するように該信号に対して非線形処理を行う非線形プロセッサと、該非線形プロセッサの出力信号に付加するコンフォートノイズを発生するコンフォートノイズ発生器とを含む音声強調装置を備え、
    前記非線形プロセッサ及び前記コンフォートノイズ発生器は、少なくともダブルトーク期間中においては動作しないように構成され、
    前記方法は、
    音声明瞭度測定用のテスト信号に基づいて双方向音声通信をシミュレートするステップと、
    前記シミュレートされた音声通信中のダブルトークを検出するステップと、
    前記検出されたダブルトークの期間中においてのみ、明瞭度に関する音声の品質の測定値を推定するために、前記テスト信号に応答して、前記ネットワーク構成要素における近端入力信号と遠端出力信号との変調度の減少の測定を行うステップと、
    を有することを特徴とする方法。
  2. 前記テスト信号は、音声に対応するスペクトルを有する、周波数掃引信号によって変調された雑音搬送波を含むテスト信号であり、該テスト信号が、前記ネットワーク構成要素の近端入力に挿入されることを特徴とする請求項1に記載の方法。
  3. 前記周波数掃引信号は低周波チャープ信号であることを特徴とする請求項2に記載の方法。
  4. 前記雑音搬送波は、音声周波数帯域にわたる音声に対応するスペクトルを有することを特徴とする請求項2に記載の方法。
  5. 前記音声明瞭度の尺度は、明瞭度に関する音声の伝送品質を表すSTI(speech transmission index)であることを特徴とする請求項1に記載の方法。
  6. 移動体通信ネットワークにおける音声明瞭度を改善するための方法であって、
    請求項1乃至5のいずれか1項に記載の方法により音声明瞭度を測定するステップと、
    前記測定した音声明瞭度に応じて前記音声強調装置の動作を調整するステップと、
    を有することを特徴とする方法。
  7. 2つの端末間で双方向通信を行う移動体通信ネットワーク構成要素の音声明瞭度を測定する装置であって、
    前記ネットワーク構成要素は、入力した信号に含まれるエコー成分を抑圧するように該信号に対して非線形処理を行う非線形プロセッサと、該非線形プロセッサの出力信号に付加するコンフォートノイズを発生するコンフォートノイズ発生器とを含む音声強調装置を備え、
    前記非線形プロセッサ及び前記コンフォートノイズ発生器は、少なくともダブルトーク期間中においては動作しないように構成され、
    前記装置は、
    音声明瞭度測定用のテスト信号に基づいて双方向音声通信をシミュレートする手段と、
    前記シミュレートされた音声通信中のダブルトークを検出する手段と、
    前記検出されたダブルトークの期間中においてのみ、明瞭度に関する音声の品質の測定値を推定するために、前記テスト信号に応答して、前記ネットワーク構成要素における近端入力信号と遠端出力信号の変調度の減少の測定を行う手段と、
    を有することを特徴とする装置。
  8. 前記テスト信号は、音声に対応するスペクトルを有する、周波数掃引信号によって変調された雑音搬送波を含むテスト信号であり、前記音声通信をシミュレートする手段は、前記ネットワーク構成要素の近端入力に前記テスト信号を挿入する手段を含むことを特徴とする請求項7に記載の装置。
  9. 前記周波数掃引信号は低周波チャープ信号であることを特徴とする請求項8に記載の装置。
  10. 前記雑音搬送波は、音声周波数帯域にわたる音声に対応するスペクトルを有することを特徴とする請求項8に記載の装置。
  11. 前記音声明瞭度の尺度は、明瞭度に関する音声の伝送品質を表すSTI(speech transmission index)であることを特徴とする請求項7に記載の装置。
  12. 前記ネットワーク構成要素は通信ゲートウェイであることを特徴とする請求項7に記載の装置。
  13. 前記装置は前記ネットワーク構成要素内に実装されることを特徴とする請求項7に記載の装置。
  14. 移動体通信ネットワークにおける音声明瞭度を改善するシステムであって、
    請求項7乃至13のいずれか1項に記載の音声明瞭度の測定のための装置と、
    前記測定した音声明瞭度に応じて前記音声強調装置の動作を調整する手段と、
    を有することを特徴とするシステム。
JP2008531046A 2005-09-20 2005-09-20 音声明瞭度を測定するための方法およびテスト信号 Expired - Fee Related JP4875090B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/SE2005/001382 WO2007035140A1 (en) 2005-09-20 2005-09-20 Method and test signal for measuring speech intelligibility

Publications (2)

Publication Number Publication Date
JP2009509396A JP2009509396A (ja) 2009-03-05
JP4875090B2 true JP4875090B2 (ja) 2012-02-15

Family

ID=37889102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008531046A Expired - Fee Related JP4875090B2 (ja) 2005-09-20 2005-09-20 音声明瞭度を測定するための方法およびテスト信号

Country Status (7)

Country Link
US (1) US8731907B2 (ja)
EP (1) EP1927192B1 (ja)
JP (1) JP4875090B2 (ja)
CN (1) CN101268624B (ja)
AT (1) ATE492979T1 (ja)
DE (1) DE602005025545D1 (ja)
WO (1) WO2007035140A1 (ja)

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070112563A1 (en) * 2005-11-17 2007-05-17 Microsoft Corporation Determination of audio device quality
US8599704B2 (en) * 2007-01-23 2013-12-03 Microsoft Corporation Assessing gateway quality using audio systems
US20080312916A1 (en) * 2007-06-15 2008-12-18 Mr. Alon Konchitsky Receiver Intelligibility Enhancement System
US8244538B2 (en) 2008-04-30 2012-08-14 Qnx Software Systems Limited Measuring double talk performance
US8331552B2 (en) * 2008-05-09 2012-12-11 Agere Systems Llc Detection of double talk in telecommunications networks
DE102008052176B4 (de) * 2008-10-17 2013-11-14 Siemens Medical Instruments Pte. Ltd. Verfahren und Hörgerät zur Parameteradaption durch Ermittlung einer Sprachverständlichkeitsschwelle
CA2701439C (en) * 2009-04-29 2013-12-24 Qnx Software Systems (Wavemakers), Inc. Measuring double talk performance
DE102009038599B4 (de) 2009-08-26 2015-02-26 Db Netz Ag Verfahren zur Messung der Sprachverständlichkeit in einem digitalen Übertragungssystem
CN101853667B (zh) * 2010-05-25 2012-08-29 无锡中星微电子有限公司 一种语音降噪装置
CN102510418B (zh) * 2011-10-28 2015-11-25 声科科技(南京)有限公司 噪声环境下的语音可懂度测量方法及装置
TWI459753B (zh) * 2012-07-31 2014-11-01 Pegatron Corp 網路音訊測試系統及其網路音訊測試之方法
EP2891150A4 (en) * 2012-09-02 2016-05-25 Qosound Inc ADAPTIVE AUDIO SIGNAL FORMULATION FOR IMPROVED PLAYBACK IN A SOUND ENVIRONMENT
CN103796135B (zh) * 2012-10-31 2018-06-19 马克西姆综合产品公司 具有回声消除的动态扬声器管理
US9697847B2 (en) * 2013-03-14 2017-07-04 Semiconductor Components Industries, Llc Acoustic signal processing system capable of detecting double-talk and method
US20150012265A1 (en) * 2013-07-02 2015-01-08 Sander Jeroen van Wijngaarden Enhanced Speech Transmission Index measurements through combination of indirect and direct MTF estimation
EP3040984B1 (en) 2015-01-02 2022-07-13 Harman Becker Automotive Systems GmbH Sound zone arrangment with zonewise speech suppresion
GB201501791D0 (en) * 2015-02-03 2015-03-18 Microsoft Technology Licensing Llc Non-linear echo path detection
CN105280195B (zh) * 2015-11-04 2018-12-28 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
US9924404B1 (en) 2016-03-17 2018-03-20 8X8, Inc. Privacy protection for evaluating call quality
CN106531183A (zh) * 2016-11-17 2017-03-22 中国传媒大学 一种基于传输系统声学参量的汉语语音清晰度评测算法
US11138989B2 (en) * 2019-03-07 2021-10-05 Adobe Inc. Sound quality prediction and interface to facilitate high-quality voice recordings
CN110264261A (zh) * 2019-06-17 2019-09-20 浙江华坤道威数据科技有限公司 一种通过语音分析确定广告需求的系统和方法
KR20210072384A (ko) * 2019-12-09 2021-06-17 삼성전자주식회사 전자 장치 및 이의 제어 방법
CN111091846B (zh) * 2019-12-26 2022-07-26 江亨湖 一种降噪方法及应用该方法的回声消除系统
CN113824843B (zh) * 2020-06-19 2023-11-21 大众问问(北京)信息科技有限公司 语音通话质量检测方法、装置、设备及存储介质
RU2748934C1 (ru) * 2020-10-16 2021-06-01 Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Московский институт электронной техники" Способ измерения разборчивости речи

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6184103A (ja) * 1984-10-01 1986-04-28 Sony Corp 周波数掃引信号発生装置
JPH0482457A (ja) * 1990-07-25 1992-03-16 Nec Corp エコーキャンセラのリモート・ループバック試験方式
JPH1188238A (ja) * 1997-06-09 1999-03-30 Fr Telecom 音響獲得の間における外乱信号の最適化された処理のための方法および装置
JP2004328345A (ja) * 2003-04-24 2004-11-18 Nec Corp メディアゲートウェイにおけるシステム運用中の音声品質監視方法および方式
JP2005176071A (ja) * 2003-12-12 2005-06-30 Fujitsu I-Network Systems Ltd 音声品質管理機能付きハイブリッド電話システムおよびそれに用いるハイブリッドpbx

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5602913A (en) * 1994-09-22 1997-02-11 Hughes Electronics Robust double-talk detection
US5636272A (en) * 1995-05-30 1997-06-03 Ericsson Inc. Apparatus amd method for increasing the intelligibility of a loudspeaker output and for echo cancellation in telephones

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6184103A (ja) * 1984-10-01 1986-04-28 Sony Corp 周波数掃引信号発生装置
JPH0482457A (ja) * 1990-07-25 1992-03-16 Nec Corp エコーキャンセラのリモート・ループバック試験方式
JPH1188238A (ja) * 1997-06-09 1999-03-30 Fr Telecom 音響獲得の間における外乱信号の最適化された処理のための方法および装置
JP2004328345A (ja) * 2003-04-24 2004-11-18 Nec Corp メディアゲートウェイにおけるシステム運用中の音声品質監視方法および方式
JP2005176071A (ja) * 2003-12-12 2005-06-30 Fujitsu I-Network Systems Ltd 音声品質管理機能付きハイブリッド電話システムおよびそれに用いるハイブリッドpbx

Also Published As

Publication number Publication date
US8731907B2 (en) 2014-05-20
US20080255829A1 (en) 2008-10-16
EP1927192A1 (en) 2008-06-04
CN101268624B (zh) 2011-07-06
JP2009509396A (ja) 2009-03-05
ATE492979T1 (de) 2011-01-15
EP1927192A4 (en) 2009-12-16
DE602005025545D1 (de) 2011-02-03
EP1927192B1 (en) 2010-12-22
CN101268624A (zh) 2008-09-17
WO2007035140A1 (en) 2007-03-29

Similar Documents

Publication Publication Date Title
JP4875090B2 (ja) 音声明瞭度を測定するための方法およびテスト信号
US7366663B2 (en) Measuring a talking quality of a telephone link in a telecommunications network
US9443528B2 (en) Method and device for eliminating echoes
CN101026392A (zh) 对滤波器的调整进行控制的方法
US8731184B2 (en) Performance testing of echo cancellers using a white noise test signal
US20010006511A1 (en) Process for coordinated echo- and/or noise reduction
US7787597B1 (en) Automated tools for testing echo cancellers using natural speech excitations
US7359489B2 (en) Method and apparatus for inclusive echo canceller testing
US7353002B2 (en) Measuring a talking quality of a communication link in a network
Surin et al. An adaptive noise decorrelation technique for stereophonic acoustic echo cancellation
US7023986B2 (en) Echo canceller in a communication system at a terminal
Gierlich et al. Advanced speech quality testing of modern telecommunication equipment: An overview
Möller et al. Extending the e-model for capturing noise reduction and echo canceller impairments
JP3970746B2 (ja) エコーキャンセラ性能評価試験装置
Kettler et al. Evaluation of aurally-adequate analyses for echo assessment
Biscainho et al. An objective method for quality assessment of ultra-wideband speech corrupted by echo
EP1216519B1 (en) Measuring the perceptual quality of speech signals including echo disturbances
JP3724726B2 (ja) 反響消去装置、反響消去方法、および反響消去プログラム
Rumsey Sound field control
Möller et al. Quality of Prediction Models

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100902

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100910

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20101208

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111031

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4875090

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees