JP4570609B2 - 音声伝送システムの音声品質予測方法及びシステム - Google Patents
音声伝送システムの音声品質予測方法及びシステム Download PDFInfo
- Publication number
- JP4570609B2 JP4570609B2 JP2006500043A JP2006500043A JP4570609B2 JP 4570609 B2 JP4570609 B2 JP 4570609B2 JP 2006500043 A JP2006500043 A JP 2006500043A JP 2006500043 A JP2006500043 A JP 2006500043A JP 4570609 B2 JP4570609 B2 JP 4570609B2
- Authority
- JP
- Japan
- Prior art keywords
- wirss
- power density
- ppx
- pitch power
- compensation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 230000005540 biological transmission Effects 0.000 title claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 45
- 230000004044 response Effects 0.000 claims abstract description 21
- 238000007781 pre-processing Methods 0.000 claims abstract description 12
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 description 17
- 230000000694 effects Effects 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 7
- 238000001303 quality assessment method Methods 0.000 description 5
- 230000001934 delay Effects 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 230000008447 perception Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000012937 correction Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000001149 cognitive effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 206010021403 Illusion Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000002776 aggregation Effects 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000000691 measurement method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephonic Communication Services (AREA)
- Transmitters (AREA)
Description
本発明は、被試験システムの伝送品質を測定する方法及びシステムであって、被試験システムに入力された入力信号と、被試験システムから生じた出力信号とを処理して、互いに比較する方法及びシステムに関する。
2001年2月に出されたITU−TのP.862勧告「電話伝送品質、電話設置、ローカル・ライン・ネットワーク−客観的及び主観的品質評価方法−音声品質の知覚的評価方法(PESQ)、ナローバンド電話網及び音声コーデックのエンド・ツー・エンドの音声品質を評価する客観的方法」は、そのような方法及びシステムを開示する[8]。
本発明は、P.862の方法及びシステムにより測定された知覚音声品質と、試験者による実際の知覚音声品質との相関を向上させることを目的とする。
ローカル・パワー・スケーリング係数の計算は、ITU−T勧告P.862に記載された通りに、又は、代わりに、出願人の未公開の欧州特許出願第02075973号[10]に記載された通りに、実行され得る。該出願は、参照により本明細書に援用される。
図1は、人間の音声知覚及び認識モデルに基づき、ITU−T勧告P.862[8]に従って音声リンク又はコーデックの知覚品質を予測するための客観的測定手法の既知の適用構成を概略的に示す。この手法又は装置に用いられる頭字語はPESQ(音声品質の知覚的評価)である。該構成は、簡潔にするために以下システム10と呼ぶ被試験システム又は電気通信ネットワーク10と、提供される音声信号の知覚的分析のための品質測定装置11とを備える。音声信号X0(t)が、一方ではシステム10の入力信号として利用され、他方では、装置11の第1の入力信号X(t)として利用される。システム10の出力信号Y(t)は、実際にシステム10の影響を受けた音声信号X0(t)であり、装置11の第2の入力信号として利用される。装置11の出力信号Qは、システム10を通過する音声リンクの知覚品質の予測を表す。音声リンクの入力端及び出力端は、特に電気通信ネットワークを通る場合には離れているため、品質測定装置11の入力信号には、たいていの場合、データベースに格納された音声信号X(t)が利用される。ここで、音声信号は、慣習的に、基本的に人間の聴覚で知覚可能な音声及び楽音のような個々の音を意味すると理解される。被試験システム10は、もちろん、電気通信ネットワークをシミュレートするシミュレーション・システムであってもよい。装置11は、前処理部11.1において前処理手段12により実行される前処理のステップと、処理部11.2において第1の処理手段13及び第2の処理手段14により実行される更なる処理ステップと、信号結合部11.3において信号差分手段15及びモデル化手段16により実行される結合信号処理ステップとを連続的に含む、主要な処理ステップを実行する。前処理ステップにおいて、信号X(t)及びY(t)は、手段13及び14における更なる処理ステップのために準備される。前処理には、パワー・レベル・スケーリング及び時間整列処理が含まれる。更なる処理ステップには、(劣化)出力信号Y(t)及び参照信号X(t)の代表信号R(Y)及びR(X)への人間の聴覚システムの精神物理学的知覚モデルに従ったマッピングが含まれる。結合信号処理ステップの期間に、前記の代表信号から差分手段15により差信号又は外乱信号Dが決定される。信号Dは、次に、被験者の特定の性質がモデル化された認識モデルに従って、モデル化手段16により処理され、品質信号Qが求められる。
図2において、上記の通り、第1の信号処理手段13、第2の信号処理手段14及び差分手段15を本質的に備える、装置11の実現形態の一部(即ち、認識モデル部)が示される。
絶対聴覚閾値P0(f)は、利用されるBark帯域の中央における値を得るために補間される。これらの値は配列に記憶され、ツビッカーのラウドネス公式において利用される。
時間−周波数分析のためのFFTに従う任意の利得定数が存在し、ラウドネス計算において、システムの校正を意味する。
聴音試験が、ハンドセットにおけるIRS(中間参照システム)受信特性又は修正IRS受信特性を用いて実行されると想定される場合、音声信号に対する必要なフィルタリングは、前処理(図1のセクション11.1)において適用され、信号XIRSS(t)及びYIRSS(t)がもたらされる。
原音声ファイル及び劣化音声ファイルが大きな無音区間で開始又は終了している場合、これは、それらのファイルにおける特定の平均ひずみ値の計算に影響し得る。そのため、これらのファイルの最初又は最後の無音部分が見積もられる。
人間の耳は、時間−周波数変換を実行する。PESQシステムにおいて、これは、連続する時間ウィンドウ(フレーム)どうしのオーバーラップを有する短期FFTにより実現される。パワー・スペクトル、即ち複素数FFT要素の実部の二乗と虚部の二乗との和は、原信号及び劣化信号について別々の実数値配列に格納される。単一のハニング窓内の位相情報はPESQシステムにおいて廃棄され、全ての計算はパワー表現PXWIRSS(f)n及びPYWIRSS(f)nのみに基づく。劣化信号におけるウィンドウの始点は、遅延のために移動される。原音声信号の時間軸は、そのままに留められる。遅延が増加すると、劣化信号の一部が処理から省略され、遅延が減少すると、一部が繰り返される、
Barkスケールは、人間の聴覚システムが低周波数において高周波数におけるよりも優れた周波数分解能を有することを反映する。これは、FFT帯域をビンニングして、FFT帯域の対応するパワーを加算し、加算された部分を正規化することにより実現される。Hertzの周波数スケールをBarkのピッチ・スケールにマッピングするワーピング関数は、与えられた通りの値に正確に従うのではない。結果としての信号は、ピッチ・パワー密度PPXWIRSS(f)n及びPPYWIRSS(f)nとして知られる。
被試験システムのフィルタリングを扱うために、原ピッチ・パワー密度及び劣化ピッチ・パワー密度のパワー・スペクトルが時間平均される。この平均は、パワーが絶対聴音閾値の数分の1である時間−周波数セルを用いて、アクティブな音声フレームについてのみ計算される。修正されたBarkビンごとに、劣化スペクトルの原スペクトルに対する比率から部分補償係数が計算される。個々のフレームnの原ピッチ・パワー密度PPXWIRSS(f)nは、原信号を劣化信号と等しくするよう、この部分補償係数を乗じられる。この結果、逆フィルター処理された原ピッチ・パワー密度PPX’WIRSS(f)nが得られる。厳格なフィルター処理は聴取者の妨げとなるため、この部分補償が利用される。ACR実験において劣化信号が被験者により判断されるため、原信号に補償が実行される。
短期利得変動は、ピッチ・パワー密度をフレームごとに処理(即ち、ローカル補償)することにより部分補償される。原ピッチ・パワー密度及び劣化ピッチ・パワー密度について、個々のフレームnにおける絶対聴覚閾値を超える全ての値の合計が計算される。原ファイルと劣化ファイルとのパワー比率が計算され、所定の範囲に結び付けられる。(時間軸に沿った)第1次のローパス・フィルターが、この比率に適用される。各フレームnにおけるひずみのあるピッチ・パワー密度は、この比率を乗じられて、部分的に利得補償されたひずみのあるピッチ・パワー密度PPY’WIRSS(f)nを生ずる。
フィルター処理と短期間利得変動とに対する補償の後で、原ピッチ・パワー密度及び劣化ピッチ・パワー密度が、ツビッカーの法則を用いてSoneラウドネス・スケールに変換される[7]。即ち、
ひずみのあるラウドネス密度と原ラウドネス密度との符号付きの差が計算される。この差が正である場合、ノイズなどの要素が追加されている。この差が負である場合、原信号から要素が欠落している。この差の配列は、未処理外乱密度と呼ばれる。
・未処理外乱密度が正でありマスク値より大きい場合、マスク値が未処理外乱から減じられる。
・未処理外乱密度がマスク値の大きさの正の値と負の値との間にある場合、外乱密度はゼロに設定される。
・未処理外乱密度がマスク値の負の値より更に小さい場合、マスク値が未処理外乱密度に加算される。
コーデックが入力信号をひずませる場合、入力信号と統合する新しい時間−周波数要素を導入することは一般に非常に難しいため、結果としての出力信号は入力信号とひずみという2つの異なる知覚対象に分解され、明らかに聞き取れるひずみをもたらすという事実により、非対称効果が引き起こされる[2]。コーデックが時間−周波数要素を無視する場合、結果としての出力信号は同様には分解され得ず、ひずみの不快さは小さくなる。この効果は、外乱密度D(f)nに非対称係数を乗じてフレームごとの非対称外乱密度DA(f)nを計算することによりモデル化される。この非対称係数は、1.2乗された、ひずみピッチ・パワー密度と原ピッチ・パワー密度との比率に等しい。非対称係数は、3より小さい場合に、ゼロに設定される。非対称係数が12を超える場合、その値でクリッピングされる。従って、劣化ピッチ・パワー密度が原ピッチ・パワー密度を超える時間周波数セルのみが非ゼロの値として留まり得る。
外乱密度D(f)nと非対称外乱密度DA(f)nとは、2つの異なるLp標準と、ソフト・フレーム上の(ラウドネスの低い)重み付けとを用いて、周波数軸に沿って統合(加算)される。即ち、
閾値を超えるフレーム外乱を有する連続したフレームは、不良区間と呼ばれる。少数のケースにおいて、客観的測定は、前処理により観察された不正確な時間遅延に起因する最小数の不良フレームにおける大きなひずみを予測する。いわゆる不良区間に対して、絶対原信号と、前処理により観察された遅延に応じて調整された絶対劣化信号との相関を最大化することにより、新しい遅延値が予測される。最大化された相関が閾値を下回る場合、該区間はノイズどうしをマッチングしており、該区間はもはや不良と呼ばれず、該区間に対する処理が中止されることが結論付けられる。そうではない場合、不良区間のフレームに対するフレーム外乱が再計算され、より小さい場合には、原フレーム外乱と置き換えられる。結果として、知覚品質を計算するために利用される最終的なフレーム外乱D’’n及びDA’’nが得られる。
次に、フレーム外乱値及び非対称フレーム外乱値が、L6標準と、音声ファイル長の集合におけるのと同様のより高いp値とを用いて、20フレームからなる瞬時区間(フレームの重なりを考慮すると約320ms)を通して集計される。これらの区間もまた、50%ずつ重なりあい、窓関数は利用されない。
瞬時外乱値及び非対称瞬時外乱値は、L2標準を用いて、音声ファイルのアクティブな区間(対応するフレーム)を通して集計される。音声ファイルの第1のセンテンスがひずんだ場合でも他のセンテンスの品質はそのままであるのに対し、瞬時区間の一部がひずむとその瞬時が意味を失うという事実のために、音声ファイルの集合における低いp値よりも瞬時区間内の集合に対するp値は高くなる。
最終的なPESQスコアは、平均外乱値と平均非対称外乱値との線形結合である。
上記の(ITU−T勧告P.862に規定された)PESQ方法は、周波数応答変動に大きな差のある音声信号を正しく扱うことができないという欠陥を有する。周波数応答変動補償及びローカル・パワー・スケーリング補償は、不正確に計算されて、システム10の音声品質の誤った計算がもたらされる。
[1] BEERENDS (J.G.)、STEMERDINK(J.A.):音響心理学的音声表現に基づく知覚音声品質測定(A Perceptual Speech-Quality Measure Based on a Psychoacoustic Sound Representation)、AESジャーナル第42巻第3号、115−123頁、1994年3月。
[2] BEERENDS(J.G.):音声品質知覚における役割を果たす認識効果のモデル化、品質評価(Modelling Cognitive Effects that Play a Role in the Perception of Speech Quality, Speech Quality Assessment)、Workshop papers、Boclmrum刊,1−9頁、1994年11月。
[3] BEERENDS(J.G.):音声及び音楽コーデックの品質測定、統合された音響心理学的アプローチ(Measuring the quality of speech and music codecs, an integrated psychoacoustic approach)、98t12 AESコンベンション、事前印刷3945号、1995年。
[4] HOLLIER (M.P.)、HAWKSFORD (M.O.)、GUARD (D.R.):知覚ドメインにおける心理音響的重要性の測定としてのエラー・アクティビティ及びエラー・エントロピー(Error activity and error entropy as a measure of psychoacoustic significance in the perceptual domain,IEEE会報版、画像と信号処理第141(3)号、203−208頁、1994年6月。
[5] RIX (A.W.)、REYNOLDS(R.)、HOLLIER (M.P.):音声及びパケット・ベースのネットワークにおけるエンド・ツー・エンドの音声品質の知覚的測定(Perceptual measurement of end-to-end speech quality over audio and packet-based networks)、第106回AESコンベンション、事前印刷第4873号、1999年5月。
[6] HOLLIER (M.P.)、HAWKSFORD (M.O.)、GUARD (D.R.):音声に類似した試験刺激を用いた通信システムの特徴決定(Characterization of communications systems using a speech-like test stimulus)、AESジャーナル第41巻第12号、1008−1021頁、1993年12月。
[7] ZWICKER (Feldtkeller):報告受信としての聴覚(Das Ohr als Nachrichtenempfanger)、S. Hirzel Verlag、シュツットガルト、1967年。
[8] ITU−T勧告P.862「音声品質の知覚的評価(PESQ) ナローバンド電話ネットワーク及び音声コーデックのエンド・ツー・エンドの音声品質の客観的評価方法」("Perceptual evaluation of speech quality (PESQ), an objective method for en-to-end speech quality assessment of narrow-band telephone networks and speech codecs")、ITU−T2001年2月。
[9] BEERENDS (J.G.)、HEKSTRA (A.P.)、RIX (A.W.)、HOLLIER (M. P.):音声品質の知覚的評価(PESQ) エンド・ツー・エンドの音声品質評価のための新しいITU標準第2部−音響心理学モデル(Perceptual Evaluation of Speech Quality (PESQ) The New ITU Standard for ENd-to-End Speech Quality Assessment Part II-Psychoacoustic Model)、AESジャーナル第50巻第10号、2002年10月。
[10]欧州特許出願第EP02075973号、出願人コニンクリジケKPN N.V.。
Claims (6)
- 音声伝送システム(10)の伝送品質を測定する方法であって、入力信号(X)が前記システム(10)に入力されて出力信号(Y)がもたらされ、前記入力信号(X)及び前記出力信号(Y)が処理される方法において、該方法が、
前記入力信号(X)及び出力信号(Y)を前処理して、各信号に対するピッチ・パワー密度(PPXWIRSS(f)n、PPYWIRSS(f)n)を取得するステップと、
線形周波数応答及び時間変動利得を補償して、補償されたピッチ・パワー密度(PPX’’WIRSS(f)n、PPY’WIRSS(f)n)を取得するステップであって、線形周波数応答及び時間変動利得の前記補償が、それぞれが線形周波数応答の補償計算、及びローカル・パワー・スケーリング係数の計算のいずれかを含む少なくとも3つの補償計算を含む反復ループを備えるステップと、
前記の補償されたピッチ・パワー密度(PPX’’WIRSS(f)n、PPY’WIRSS(f)n)から、前記システム(10)の伝送品質を示すスコア(Q)を計算するステップと、
を備え、前記反復ループが、
前記ピッチ・パワー密度(PPXWIRSS(f)n、PPYWIRSS(f)n)に基づいて第1の部分的線形周波数補償を計算し、前記入力信号のピッチ・パワー密度(PPXWIRSS(f)n)に前記第1の部分的線形周波数補償を適用し、前記入力信号を部分的に補償したピッチ・パワー密度(PPX’WIRSS(f)n)を取得するステップと、
それに続いて、前記入力信号を部分的に補償した前記ピッチ・パワー密度(PPX’WIRSS(f)n)及び前記出力信号のピッチ・パワー密度(PPYWIRSS(f)n)に基づいて前記ローカル・パワー・スケーリング係数を計算し、前記出力信号のピッチ・パワー密度(PPYWIRSS(f)n)に前記ローカル・パワー・スケーリング係数を適用し、前記出力信号を部分的に補償したピッチ・パワー密度(PPY’WIRSS(f)n)を取得するステップと、
それに続いて、前記入力信号を部分的に補償した前記ピッチ・パワー密度(PPX’WIRSS(f)n)及び前記出力信号を部分的に補償した前記ピッチ・パワー密度(PPY’WIRSS(f)n)に基づいて第2の部分的線形周波数補償を計算し、前記入力信号の部分補償された前記ピッチ・パワー密度(PPX’WIRSS(f)n)に前記線形周波数補償を適用し、前記の補償されたピッチ・パワー密度(PPX’’WIRSS(f)n)を取得するステップと、
を備える、
方法。 - 請求項1に記載の方法において、前記第1の部分的線形周波数補償が、前記線形ひずみの正確な評価に必要とされる線形周波数補償より低い第1の予測である方法。
- 請求項2記載の方法において、前記第1の部分的線形周波数補償が、周波数依存関数である方法。
- 音声伝送システム(10)の伝送品質を測定するシステムであって、前記システム(10)に入力信号(X)が入力されて出力信号(Y)がもたらされるシステムにおいて、該システムが、
各信号に対するピッチ・パワー密度(PPXWIRSS(f)n、PPYWIRSS(f)n)を取得するために、前記入力信号(X)及び前記出力信号(Y)を前処理する前処理手段(12)と、
補償されたピッチ・パワー密度(PPX’’WIRSS(f)n、PPY’WIRSS(f)n)を取得するために線形周波数応答及び時間変動利得を補償する補償手段(13、14)であって、それぞれが線形周波数応答の補償計算、及びローカル・パワー・スケーリング係数の計算のいずれかを含む少なくとも3つの補償計算を有する反復ループを含む補償手段(13、14)と、
前記補償されたピッチ・パワー密度(PPX’’WIRSS(f)n、PPY’WIRSS(f)n)から前記システム(10)の伝送品質を示すスコア(Q)を計算する計算手段(15、16)と、
を備え、前記反復ループが、
前記ピッチ・パワー密度(PPXWIRSS(f)n、PPYWIRSS(f)n)に基づいて第1の部分的線形周波数補償を計算し、前記入力信号のピッチ・パワー密度(PPXWIRSS(f)n)に前記第1の部分的線形周波数補償を適用し、前記入力信号を部分的に補償したピッチ・パワー密度(PPX’WIRSS(f)n)を取得し、
それに続いて、前記入力信号を部分的に補償した前記ピッチ・パワー密度(PPX’WIRSS(f)n)及び前記出力信号のピッチ・パワー密度(PPYWIRSS(f)n)に基づいて前記ローカル・パワー・スケーリング係数を計算し、前記出力信号のピッチ・パワー密度(PPYWIRSS(f)n)に前記ローカル・パワー・スケーリング係数を適用し、前記出力信号を部分的に補償したピッチ・パワー密度(PPY’WIRSS(f)n)を取得し、
それに続いて、前記入力信号を部分的に補償した前記ピッチ・パワー密度(PPX’WIRSS(f)n)及び前記出力信号を部分的に補償した前記ピッチ・パワー密度(PPY’WIRSS(f)n)に基づいて第2の部分的線形周波数補償を計算し、前記入力信号の部分補償された前記ピッチ・パワー密度(PPX’WIRSS(f)n)に前記線形周波数補償を適用し、前記の補償されたピッチ・パワー密度(PPX’’WIRSS(f)n)を取得する、
ことを特徴とするシステム。 - 請求項4に記載のシステムにおいて、前記第1の部分的な線形周波数補償が、前記線形ひずみの正確な評価に必要とされる線形周波数補償より低い第1の予測であるシステム。
- 請求項5記載のシステムにおいて、前記第1の部分的な線形周波数補償が周波数依存関数であるシステム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP03075949A EP1465156A1 (en) | 2003-03-31 | 2003-03-31 | Method and system for determining the quality of a speech signal |
PCT/EP2004/002026 WO2004088638A1 (en) | 2003-03-31 | 2004-02-26 | Method and system for speech quality prediction of an audio transmission system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006522349A JP2006522349A (ja) | 2006-09-28 |
JP4570609B2 true JP4570609B2 (ja) | 2010-10-27 |
Family
ID=32842795
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006500043A Expired - Fee Related JP4570609B2 (ja) | 2003-03-31 | 2004-02-26 | 音声伝送システムの音声品質予測方法及びシステム |
Country Status (8)
Country | Link |
---|---|
US (1) | US7313517B2 (ja) |
EP (2) | EP1465156A1 (ja) |
JP (1) | JP4570609B2 (ja) |
AT (1) | ATE381089T1 (ja) |
DE (1) | DE602004010634T2 (ja) |
DK (1) | DK1611571T3 (ja) |
ES (1) | ES2298725T3 (ja) |
WO (1) | WO2004088638A1 (ja) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1241663A1 (en) * | 2001-03-13 | 2002-09-18 | Koninklijke KPN N.V. | Method and device for determining the quality of speech signal |
CN101053016B (zh) * | 2004-09-20 | 2011-05-18 | 荷兰应用科学研究会(Tno) | 构建第一频率补偿输入间距功率密度函数的方法和系统 |
US20060200346A1 (en) * | 2005-03-03 | 2006-09-07 | Nortel Networks Ltd. | Speech quality measurement based on classification estimation |
US8005675B2 (en) * | 2005-03-17 | 2011-08-23 | Nice Systems, Ltd. | Apparatus and method for audio analysis |
US20070203694A1 (en) * | 2006-02-28 | 2007-08-30 | Nortel Networks Limited | Single-sided speech quality measurement |
EP1975924A1 (en) * | 2007-03-29 | 2008-10-01 | Koninklijke KPN N.V. | Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system |
EP2410517B1 (en) * | 2007-09-11 | 2017-02-22 | Deutsche Telekom AG | Method and system for the integral and diagnostic assessment of listening speech quality |
DE602007007090D1 (de) * | 2007-10-11 | 2010-07-22 | Koninkl Kpn Nv | Verfahren und System zur Messung der Sprachverständlichkeit eines Tonübertragungssystems |
US8296131B2 (en) * | 2008-12-30 | 2012-10-23 | Audiocodes Ltd. | Method and apparatus of providing a quality measure for an output voice signal generated to reproduce an input voice signal |
CN101609686B (zh) * | 2009-07-28 | 2011-09-14 | 南京大学 | 基于语音增强算法主观评估的客观评估方法 |
CN102549657B (zh) * | 2009-08-14 | 2015-05-20 | 皇家Kpn公司 | 用于确定音频系统的感知质量的方法和系统 |
US8818798B2 (en) | 2009-08-14 | 2014-08-26 | Koninklijke Kpn N.V. | Method and system for determining a perceived quality of an audio system |
US8774417B1 (en) | 2009-10-05 | 2014-07-08 | Xfrm Incorporated | Surround audio compatibility assessment |
GB2474297B (en) * | 2009-10-12 | 2017-02-01 | Bitea Ltd | Voice Quality Determination |
JP5606764B2 (ja) | 2010-03-31 | 2014-10-15 | クラリオン株式会社 | 音質評価装置およびそのためのプログラム |
EP2733700A1 (en) * | 2012-11-16 | 2014-05-21 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
DE102013005844B3 (de) * | 2013-03-28 | 2014-08-28 | Technische Universität Braunschweig | Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals |
RU2729147C1 (ru) * | 2020-04-02 | 2020-08-05 | Общество С Ограниченной Ответственностью "Центр Коррекции Слуха И Речи "Мелфон" (Ооо "Цкср "Мелфон") | Способ автоматизированной оценки качества распознавания речи пациентом |
RU2743049C1 (ru) * | 2020-09-07 | 2021-02-15 | Общество С Ограниченной Ответственностью "Центр Коррекции Слуха И Речи "Мелфон" (Ооо "Цкср "Мелфон") | Способ доврачебной оценки качества распознавания речи, скрининговой аудиометрии и программно-аппаратный комплекс, его реализующий |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB1429617A (en) * | 1974-06-03 | 1976-03-24 | Hewlett Packard Ltd | Method and apparatus for measuring the group delay character istics of a transmission path |
US4862492A (en) * | 1988-10-26 | 1989-08-29 | Dialogic Corporation | Measurement of transmission quality of a telephone channel |
JP2953238B2 (ja) * | 1993-02-09 | 1999-09-27 | 日本電気株式会社 | 音質主観評価予測方式 |
NL9500512A (nl) * | 1995-03-15 | 1996-10-01 | Nederland Ptt | Inrichting voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal, alsmede werkwijze voor het bepalen van de kwaliteit van een door een signaalbewerkingscircuit te genereren uitgangssignaal. |
JP3756686B2 (ja) * | 1999-01-19 | 2006-03-15 | 日本放送協会 | 所望信号抽出の度合いを評価する評価値を求める方法および装置、ならびに信号抽出装置のパラメータ制御方法および装置 |
-
2003
- 2003-03-31 EP EP03075949A patent/EP1465156A1/en not_active Withdrawn
-
2004
- 2004-02-26 JP JP2006500043A patent/JP4570609B2/ja not_active Expired - Fee Related
- 2004-02-26 US US10/549,003 patent/US7313517B2/en not_active Expired - Fee Related
- 2004-02-26 DK DK04714792T patent/DK1611571T3/da active
- 2004-02-26 WO PCT/EP2004/002026 patent/WO2004088638A1/en active IP Right Grant
- 2004-02-26 DE DE602004010634T patent/DE602004010634T2/de not_active Expired - Lifetime
- 2004-02-26 EP EP04714792A patent/EP1611571B1/en not_active Expired - Lifetime
- 2004-02-26 ES ES04714792T patent/ES2298725T3/es not_active Expired - Lifetime
- 2004-02-26 AT AT04714792T patent/ATE381089T1/de active
Also Published As
Publication number | Publication date |
---|---|
ES2298725T3 (es) | 2008-05-16 |
DE602004010634D1 (de) | 2008-01-24 |
WO2004088638A1 (en) | 2004-10-14 |
DK1611571T3 (da) | 2008-03-31 |
US7313517B2 (en) | 2007-12-25 |
ATE381089T1 (de) | 2007-12-15 |
DE602004010634T2 (de) | 2008-12-11 |
EP1611571B1 (en) | 2007-12-12 |
US20060171543A1 (en) | 2006-08-03 |
EP1611571A1 (en) | 2006-01-04 |
EP1465156A1 (en) | 2004-10-06 |
JP2006522349A (ja) | 2006-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4570609B2 (ja) | 音声伝送システムの音声品質予測方法及びシステム | |
US9025780B2 (en) | Method and system for determining a perceived quality of an audio system | |
JP4263620B2 (ja) | システムの伝送品質を測定する方法及びシステム | |
US8818798B2 (en) | Method and system for determining a perceived quality of an audio system | |
US9659579B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter | |
US20100211395A1 (en) | Method and System for Speech Intelligibility Measurement of an Audio Transmission System | |
US9472202B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal | |
US8566082B2 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
US9659565B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through providing a difference function representing a difference between signal frames and an output signal indicative of a derived quality parameter | |
EP1343145A1 (en) | Method and system for measuring a sytems's transmission quality | |
JP2023535694A (ja) | 信号の知覚される品質に対する残響の知覚的影響を判定する方法、及びコンピュータプログラム製品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081218 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090318 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090618 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100326 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100712 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100810 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130820 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |