JP2008513834A - 知覚音声分析のための周波数補償 - Google Patents

知覚音声分析のための周波数補償 Download PDF

Info

Publication number
JP2008513834A
JP2008513834A JP2007532270A JP2007532270A JP2008513834A JP 2008513834 A JP2008513834 A JP 2008513834A JP 2007532270 A JP2007532270 A JP 2007532270A JP 2007532270 A JP2007532270 A JP 2007532270A JP 2008513834 A JP2008513834 A JP 2008513834A
Authority
JP
Japan
Prior art keywords
density function
loudness
frequency
input
power density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007532270A
Other languages
English (en)
Other versions
JP4879180B2 (ja
Inventor
ジョン ヘラルト ベーレンツ
Original Assignee
ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー filed Critical ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー
Publication of JP2008513834A publication Critical patent/JP2008513834A/ja
Application granted granted Critical
Publication of JP4879180B2 publication Critical patent/JP4879180B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • H04M3/2236Quality of speech transmission monitoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/09Long term prediction, i.e. removing periodical redundancies, e.g. by using adaptive codebook or pitch predictor

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
  • Measuring Instrument Details And Bridges, And Automatic Balancing Devices (AREA)
  • Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
  • Machine Translation (AREA)

Abstract

本発明は、音響送信システムにおいて、線形周波数応答歪みを含む全歪みの広域的影響を示す第1の品質尺度と、線形周波数応答歪みの影響のみを考慮する第2の品質尺度とを評価することを可能にするソフトスケール周波数補償関数を提供する。ソフトスケール周波数補償関数は、時間積分された出力パワー密度関数と時間積分された入力パワー密度関数との間のソフトスケール比率から導出される。第1の品質尺度は、ITU規格P.862において実施されるのと同じ方式で時間及び周波数の関数である周波数補償済み入力ラウドネス密度関数及び利得補償済み出力ラウドネス密度関数を用いて、時間及び周波数の関数として差分ラウドネス密度関数から導出される。第2の尺度は、両方共に時間及び周波数の関数である第2の周波数補償済み入力ラウドネス密度関数及び利得補償済み出力ラウドネス密度関数の時間積分から導出される周波数のみの関数として差分ラウドネス密度関数から設定される。
【選択図】図3

Description

本発明は、入力部及び出力部を有し、該出力部が時間フレーム出力信号を生成する音響送信システムに適用するための時間フレーム入力信号の周波数補償済み(compensated)入力ピッチパワー密度関数を設定する方法に関する。本発明はまた、周波数補償済み入力ピッチパワー密度関数を設定するための処理システムに関する。本発明はまた、コンピュータ実行可能なソフトウェアコードを含むコンピュータ読み取り可能媒体に関する。
本発明が関係する方法及びシステムは、例えば音響送信システムの知覚品質を分析するための方法又はシステムの一部として用いることができる。線形周波数歪みの影響について知覚品質尺度を分析するこうした方法及びシステムは、既に公開されている欧州特許出願EP1343145により公知であり、引用文献[1]から[8]でも開示されている。本明細書で開示されるシステム及び方法、並びにその先行技術は、ITU−T勧告P.862(以下P.862と呼ぶ)の一部としての知覚音声尺度を備えており、これによって入力信号に対する劣化出力信号の知覚品質についての単一の総合評価が得られる。
開示される方法及びシステムは、音声及び音響品質測定を知覚領域で行うべきであるという知見に基づいている(図1を参照)。この目標は、テスト(1)下のシステムに適用される基準音声信号Xnをその劣化出力信号Ynと比較することによって達成される。これらの信号の内部知覚表現を設定(0.1)、(0.2)し、これらを比較(0.3)することにより、その結果を知覚品質スケールにマッピングして知覚品質尺度PESQを得ることで知覚品質に関する推定を行うことができる。平均オピニオンスケール(MOS)としても公知である知覚品質スケールは、従来技術においては経験的推定によって設定される。劣化又は歪み音声断片の品質を人間に判断するように求める。次に、スコアは、実際の歪みにマッチングされ、知覚スケールにおいて規定される。このスケールは、信号内に存在する歪みに応じて知覚スコアを予測するのに用いることができる。
P.862を含む、音響送信システムの知覚品質を求める現在利用可能な処理システムは、総合品質を表す単一の数値が出力されるという欠点がある。これにより、知覚した劣化についての根本的原因の究明が不可能になる。信号対雑音比、周波数応答歪み、全高調波歪み等の従来的な測定は、ある種の劣化を前提としているので、ある種の品質測定を実施することによってこの劣化を定量化する。この従来的手法によって、テスト下のシステムが低性能であることの1つ又はそれ以上の根本的原因は究明されるが、総合知覚品質に関する他の種の歪みに関係する線形周波数応答歪みの影響は定量化することができない。
更に、P.862を含む、音響送信システムの知覚品質を求める現在利用可能な方法及び処理システムの性能は、知覚線形周波数歪みがこれらのシステムにおいて適正に処理されないことに起因して不十分な結果を与える。
上記の方法は、非線形歪みよりも線形周波数応答歪みの方が知覚音声品質に及ぼす影響が少ない効果を定量化する目的で、入力信号から導出される入力パワー密度関数の周波数補償を利用する。
公知の周波数補償方法は、知覚的に正確な方法で知覚音声品質に対する線形周波数応答歪みの影響を定量化することができないハードクリッピング関数又は修正クリッピング関数のいずれかを用いるので有効ではない。
欧州特許出願EP1343145公報
本発明の目的は、知覚的な正確な方法で知覚音声品質に対する線形周波数応答歪みの影響を定量化することを可能にする、入力ピッチパワー密度関数の周波数補償のための方法及びシステムを提供することである。
本発明の目的は、本発明の第1の態様において、入力部及び出力部を有し、その入力部に時間フレーム入力信号が適用され、該出力部が時間フレーム出力信号を生成する音響送信システムの入力ピッチパワー密度関数を周波数補償する方法によって達成することができ、本方法は、入力信号を処理して入力ピッチパワー密度関数を得る段階と、出力信号を処理して出力ピッチパワー密度関数を得る段階と、第1の周波数補償関数を用いて入力ピッチパワー密度関数を周波数補償し、第1の周波数補償済み入力ピッチパワー密度関数を得る段階と、を含むことができ、入力ピッチパワー密度関数を周波数補償する段階は、ソフトスケーリング関数が0.5の範囲内の累乗圧縮関数及び4*105の範囲内のオフセットを用いることを特徴とする。
ピッチパワー密度関数及びソフトスケーリング自体は従来技術から公知である。この圧縮関数を用いて線形周波数応答歪みの全影響を定量化し、線形周波数応答歪みの正確な定量化を含む総合品質についての広域スコアを得ることができる。この単一の品質数値は、例えばP.862[3]において実施される同じ方式で計算することができる、すなわちラウドネス差分関数の周波数積分から各時間フレームについて2つの異なる擾乱が計算される。次いで、最終品質数値が2つの異なる時間積分から導出される。この改善は、特に線形周波数応答歪みが総合音声品質において優勢である音声送信システム(例えば帯域幅制限のみを実施するシステム)においては客観的音声品質測定と主観的音声品質査定との間の良好な相関関係を与える。
本発明によるこの改善された方法に基づいて、P.862のように線形周波数歪みに関して正確な結果を与える、音響送信システムの知覚品質を求めるための方法又はシステムの実施形態、及び線形周波数歪みを含む知覚歪みを表す単一の出力値の取得を可能にする方法又はシステムの実施形態を提供することができる。
本発明の第1の態様による別の実施形態において、短期利得変動に対して出力ピッチパワー密度関数を補償して局所基準化出力ピッチパワー密度関数を得る段階、周波数補償済み出力ピッチパワー密度関数をラウドネス知覚スケールに変換して、出力ラウドネス密度関数を得る段階、第2の周波数補償関数を用いて入力ピッチパワー密度関数を周波数補償し、0.4の範囲内の累乗及び5*106の範囲内のオフセットを有するソフトスケーリングパワー関数に基づいて第2の周波数補償済み入力ピッチパワー密度関数を得る段階、第2の周波数補償済み入力ピッチパワー密度関数をラウドネス知覚スケールに変換し、入力ラウドネス密度関数を得る段階、フレーム付き入力ラウドネス密度関数の時間フレームにわたって平均化し、平均入力ラウドネススペクトルを得る段階、フレーム付き出力ラウドネス密度関数の時間フレームにわたって平均化し、平均出力ラウドネススペクトルを得る段階、平均入力ラウドネススペクトルに対して平均出力ラウドネススペクトルを正規化し、これによって正規化平均出力ラウドネススペクトルを得る段階、正規化出力ラウドネススペクトルから入力ラウドネススペクトルを減算し、これによって差分平均ラウドネススペクトルを得る段階、及び差分平均ラウドネススペクトル関数をLubesque積分し、これによって音響送信システムについての線形スペクトル歪み尺度を設定する段階を更に含み、知覚線形周波数歪みを含む単一の測定値の確定が可能になる。
このようにして本方法は、ラウドネススペクトルにおける差分に基づいて線形周波数歪みについて単一の品質尺度を得る。しかしながら、この尺度は、更に知覚品質尺度へのマッピングを必要とし、このマッピングは、本発明の第1の態様による下記の実施形態で行われ、連続周波数ビン値の絶対差分に基づいて差分平均ラウドネススペクトルの粗度尺度を設定する段階と、粗度尺度と線形スペクトル歪み測定値とを乗算によって組み合わせ、その結果をMOSスケールにマッピングしてこれによって周波数応答影響品質尺度を得る段階を更に含む。
本発明の第1の態様による別の実施形態は、時間フレーム入力信号を処理する段階が理想スペクトルに対して入力ピッチパワー密度関数を補償する段階を更に含み、スペクトルパワー密度の不均衡、ほとんどの場合は低周波数(500Hz未満)の過度の強調を生じる録音技術における誤差がこれによって補償される利点を有する。この段階は、引用文献[1]に従って入力信号のハニング窓掛け、FFT、及び周波数ワーピングによって得られる入力ピッチパワー密度に適用される。
本発明の第1の態様による別の実施形態では、第1の周波数補償関数は、バークビン値の項で表され、入力及び出力ピッチパワー密度関数の少なくとも2つの隣接するバークビン値にわたる平均化から導出される。
本発明の第1の態様の別の実施形態では、第2の周波数補償関数もまたバークビン値の項で表され、入力及び出力ピッチパワー密度関数の少なくとも2つの隣接するバークビン値にわたる平均化から導出される。
周波数補償関数計算における平均化は、周波数補償関数内で局所ピークを平滑化し、これらのピークは平滑化を行わない直接計算から推定されたものよりも聴き取りにくい。
本発明の第1の態様による別の実施形態は、
フレーム当たりの入力及び出力ピッチパワー密度関数が同時に無音基準値よりも大きい時間フレームを検出する段階と、
時間フレームを検出する段階の制御下で入力ラウドネス密度関数フレーム及び出力ラウドネス密度関数フレームをゲーティングする段階と、
を更に含み、
この結果において特にゼロによる除算を行う可能性があるフレームにおける0の範囲内の値による不安定性を防止する。
本発明の第1の態様による更なる実施形態では、線形スペクトル歪み尺度を設定する段階が、差分平均ラウドネススペクトルを正の差分平均ラウドネススペクトルと負の差分平均ラウドネススペクトルとに分割する段階と、差分平均ラウドネススペクトルの正の値を周波数領域において積分し、これによって正の線形スペクトル歪み尺度を設定する段階と、差分平均ラウドネススペクトルの負の値を周波数領域で積分し、これによって負の線形スペクトル歪み尺度を設定する段階と、粗度尺度と正の線形スペクトル歪み測定値とを乗算し、その結果をMOS(平均オピニオンスコア)スケールにマッピングし、これによって正の周波数応答歪み品質尺度を得る段階と、乗算によって粗度尺度と負の線形スペクトル歪み尺度とを組み合わせ、その結果をMOS(平均オピニオンスコア)スケールにマッピングし、これによって負の周波数応答歪み品質尺度を得る段階と、0よりも大きい第1の重み付け要因を用いて正の周波数応答歪み品質尺度を重み付けする段階と、0よりも大きい第2の重み付け要因を用いて負の周波数応答歪み品質尺度を重み付けする段階と、重み付けされた負の周波数応答影響品質尺度と正の周波数応答影響品質尺度とを加算し、これによって単一の周波数応答影響尺度を得る段階と、を更に含み、出力信号において大きな音量で現れる周波数帯域及び出力信号において弱い音量で現れる周波数帯域に対してこの方法を微調整し最適化することが可能となる。どの周波数帯域が平均差分ラウドネススペクトルの正又は負の部分に入るかは、入力ピッチパワー密度関数を周波数補償する段階において、この段階における補償要因を調節することによって制御することができる。これらの補償要因は、周波数応答影響尺度の帰結と主観的な知覚との間の最適な相関関係について調節される。
本発明の第1の態様による別の実施形態では、短期利得変動に対して出力ピッチパワー密度関数を補償して局所基準化出力ピッチパワー密度関数を得る段階と、第1の周波数補償済み入力ピッチパワー密度関数をラウドネス知覚スケールに変換して入力ラウドネス密度関数を得る段階と、周波数補償済み入力ピッチパワー密度関数をラウドネス知覚スケールに変換して、出力ラウドネス密度関数を得る段階と、出力及び入力ラウドネス密度関数を減算し、差分ラウドネス密度関数を得る段階と、差分ラウドネス密度関数における正のビンと負のビンとの間で非対称処理を行い、これにより非対称差分ラウドネス密度関数を得る段階と、非対称差分ラウドネス密度関数を周波数積分し、無音部分を強調することによって非対称擾乱尺度を得る段階と、差分ラウドネス密度関数を周波数積分し、無音部分を強調することよって対称擾乱尺度を得る段階と、差分ラウドネス密度関数及び非対称差分ラウドネス密度関数を時間積分し、これによって対称及び非対称の擾乱尺度を得て、次いで該対称及び非対称の擾乱尺度を組み合わせることによって単一の知覚品質推定を得る段階と、を更に含み、線形周波数歪みに関して正確な結果を与える音響送信システムの知覚品質を求めることが可能となる。
本発明の目的は、プロセッサと、フレーム付き入力信号及びフレーム付き出力信号を入力するための手段とを備え、プロセッサが本発明の第1の態様による方法に属する段階を実行するように構成されている、音響送信システムの送信品質を測定するための処理システムによって本発明による第2の態様において更に達成される。
本発明の目的は、コンピュータシステム上にロードされたときにコンピュータシステムが本発明の第1の態様による方法の段階を実行することを可能にするコンピュータ実行可能なソフトウェアコードを含むソフトウェアプログラム記憶装置手段によって本発明による第3の態様において更に達成される。
図2は、引用により本明細書に組み込まれるITU−T勧告P.862、引用文献[6]による、音響送信システムの知覚品質を求めるための方法を表す図を示している。段階2.1...2.12は、本発明によるシステム及び方法においても用いられているので、この図を簡潔に説明する。
段階1は、入出力信号が離散的時間フレーム1...nで表された、テスト1下のシステム又はデバイスによる入力信号Xnから出力信号Ynへの変換を表しており、ここでXnは基準信号を表し、Ynは、Xnでのテスト1下のシステムの歪み応答を表す。現行のPESQの実施形態によればフレームの持続時間は、32msとすることができる。本発明では、フレーム持続時間は32msよりも短く又は長くすることができる。完全な音声断片をカバーする持続時間は、分のオーダーにおいても実施可能とすることができる。
テスト下のデバイス又はシステムは、通信ネットワーク、電話等の通信端末、或いは音響処理用のあらゆるデバイス又はシステムとすることができる。入力信号は、音声断片とすることができるが、本発明の実施形態の用途は、音声に限定されない。
入力信号Xnに対する出力信号Ynの知覚品質尺度を設定するためには、幾つかの事前処理が必要である。従来技術によれば、事前処理は、段階2.1...2.6によって実行される。段階2.1及び2.4はそれぞれ、ハニング窓を用いた入力信号Xnフレーム及び出力信号Ynフレームの時間窓掛けを表す。段階2.2及び2.5はそれぞれ、入力及び出力信号のフレーム単位の離散的フーリエ変換を表す。段階2.3及び2.6は、いわゆるバーク帯域内へのフーリエ変換入出力信号のワーピングを表し、このようにして入力信号及び出力信号に対する離散的周波数帯域におけるピッチパワー密度関数PPX(f)n及びPPY(f)nがそれぞれ得られる。
段階2.7は、線形周波数補償の計算を表しており、これを用いて、段階2.8において入力ピッチパワー密度関数PPX(f)nを重み付けし、周波数補償済み入力ピッチパワー密度関数PPX’(f)nを得る。入力ピッチパワー密度関数PPX(f)nは、テスト1下の音響送信システムにおいて行うフィルタリングに対して周波数補償されることになる。P862では、補償量は、最終PESQ値における線形周波数歪みの寄与を決定付ける。
従来技術すなわちP.862において開示されている周波数補償は、入力基準信号が無音基準値よりも大きい全てのフレーム(音声作動フレームであり、PPX(f)n>107、すなわち正確に設定された再生レベルで使用された場合にP.862で約70dB SPLよりも音が大きいフレーム)に基づくテスト下のシステムの線形周波数応答の推定を用いる。P.862における周波数応答補償は、フレーム当たりの入力ピッチパワー密度関数PPX(f)nに対して実施される。本明細書における全てのパワー密度関数及びオフセットは、パワー関数についてのITU P.862規格に基準化される。
2.7では、時間インデックスnにわたって2.3及び2.6それぞれの出力であるPPX(f)n及びPPY(I)nを平均化(平易なパワー平均化)することによって周波数応答補償関数H(f)が計算され、結果として平均ピッチパワー密度関数APPX及びAPPY(2.7で用いられる)が生じ、これらから2.8の出力において第1の周波数補償済み関数PPX’(f)nが乗算によって計算される。この目的は、小さな不可聴周波数応答歪みについて完全に補償し、すなわち事前設定のデシベル量よりも小さな全ての偏差が完全に補償されることである。
段階2.9は、出力ピッチパワー密度関数の短期利得変動を補償するための局所スケーリング関数の計算を示しており、これによって最後の局所スケーリング関数Sn-1が次のフレームで使用するために2.10において保管される。2.11において、局所スケーリング関数Snを出力ピッチパワー密度関数PPY(f)nと乗算することによって補償が行われ、局所基準化出力ピッチパワー密度関数PPY’(f)nが得られる。
入力及び出力ピッチパワー密度関数PPX’(f)n及びPPY’(f)nは、段階2.12及び2.13においてZwickerのアルゴリズムを用いたソーン(Sone)ラウドネススケールに従ってラウドネススケールに変換され、この結果、入力及び出力ラウドネス密度関数LX(f)n及びLY(f)nがそれぞれ得られる。従って、入力及び出力ラウドネス密度関数LX(f)n及びLY(f)nは、知覚周波数領域における入力及び出力信号のラウドネス表現である。段階2.14において、入力及び出力ラウドネス密度関数LX(f)n及びLY(f)nは減算され、この結果、差分ラウドネス密度関数D(f)nが得られ、これから知覚品質尺度を導出することができる。
差分ラウドネス関数D(f)nにおける正及び負のビン間の2.15での非対称処理、2.16での周波数積分、及び2.17での無音部分の強調後に、差分ラウドネス密度関数D(f)nは非対称擾乱尺度DAに変換され、これは知覚品質尺度として用いることができる。同じことが段階2.18及び2.19に対して適用され、非対称性を伴わずに周波数積分及び無音部分の強調をそれぞれ行ことによって差分ラウドネス密度関数D(f)nが擾乱尺度Dnに変換される。
次いで、段階2.20おける時間フレームにわたる集計後に、擾乱尺度D及び非対称擾乱尺度DAは、音響送信システム1についての知覚品質推定を意味する単一のPESQスコアに組み合わせられる。全段階2.1...2.20は、引用により本明細書に組み込まれる[6]においてより詳細に説明されている。
図3は、本発明による、音響送信システムの送信品質を測定する方法を示しており、既知の段階2.1...2.11は、周波数補償済み入力ピッチパワー密度関数PPX’(f)nを設定するのに用いられ、段階2.13は、ラウドネス密度関数LY(f)nを設定するのに用いられる。
本発明によれば、段階2.7では、新しい第1の周波数補償関数H1(f)が計算される。H1(f)は、時間内平均入力及び出力のピッチパワー密度関数APPX(f)及びAPPY(f)を用いた、オフセット[6]を伴うパワーベースのソフトスケーリング関数である。
Figure 2008513834
ここでq(f)は0.1〜1.0の範囲内にあり(周波数依存とすることができる)、OFFSETは104〜106の範囲内にある。
qが小さい程及びOFFSETが高くなる程、より小さな周波数補償量が得られる。この段階2.7におけるパラメータq及びOFFSETは、最適な結果を求めて調整されることになる。好ましくは、q(f)は0.5の範囲内にあり、OFFSETは4*105の範囲内にある。P.862と同様、第1の周波数補償済み入力ピッチパワー密度関数PPX’(f)nは、2.8において入力ピッチパワー密度関数PPX(f)nを第1の周波数補償関数H1(f)と乗算することによって計算される。
段階3.10においては、オフセットを伴うが、ここではより高いオフセットを伴うパワーベースのソフトスケーリング関数を用いて、第2の周波数補償関数H2(f)が音声作動フレームの同じ集合にわたって段階2.7と同様に計算される。
Figure 2008513834
ここでq(f)は0.0〜1.0の範囲内にあり(周波数依存とすることができる)、OFFSETLARGEは105〜108の範囲内にある。好ましくは、q(f)は0.4の範囲内にあり、OFFSETLARGEは5*106の範囲内にある。
第2の周波数補償関数H2(f)は、3.11において入力ピッチパワー密度関数PPX(f)nに乗算するのに用いられ、この結果、第2の補償済みピッチパワー密度関数PPX''(f)nが得られる。
本発明による実施形態では、1次及び2次の周波数補償関数H1(f)及びΗ2(f)は、APPX(f)及びAPPY(f)から直接計算されるのではなく、これらの関数の平滑化形態から計算される。平滑化は、P.862[3]で指定されているようにバークビン値(f)、f=0...fMAXにわたって平均化することによって行われ、ここでf=0及びfMAXは、最初と最後のビン値を表す。平均化は、ビン0、1及びfMAX、fMAX−1にわたってそれぞれ実施される。2番目及び最後から2番目(1及びfMAX−1)については、平均化は、ビン0、1、2及びfMAX、fMAX−1、fMAX−2それぞれにわたって実施される。次に、この平均化は、下位インデックスの10から高位インデックスのfMAX−4に至るまで反復される。インデックス10とfMAX−4との間では、インデックス値の左2つから右2つまで5つのビンにわたって平均化が行われる。
段階2.12と同様に段階3.14では、第2の補償済みピッチパワー密度関数PPX''(f)nは、本発明によるラウドネス計算内で用いられるものよりも小さな線形周波数応答歪み補償を含む入力ラウドネス密度関数LX’(f)nに変換される。この段階3.10、3.11におけるパラメータq(f)及びOFFSETLARGEは、線形周波数歪み品質尺度における最適な結果に調整されることになる。
次いで、新しい入力ラウドネス密度関数LX’(f)n及びP.862に類似の出力ラウドネス密度関数LY(f)nを用いて、段階3.4及び3.5においてスペクトルラウドネス密度関数LX’(f)n及びLY(f)nを平均化することによって、平均ラウドネス密度関数ALSX(f)及びALSY(f)を計算する。
時間の平均化は、Lubesqueに従う。
Figure 2008513834
及び、
Figure 2008513834
ここでp>1、好ましくはp=2.5である。
任意選択的に、この平均化は、フレーム当たりの入力及び出力パワーの両方が、無音基準値よりも大きい、好ましくはPPX(f)n及びPPY(f)n>107である時間フレームのみにわたって実行され、段階3.1で求められ、段階3.2及び3.3で有効にされる。
次に、ラウドネスを周波数の関数として表すこれらの平均入力及び出力ラウドネス密度関数は、周波数軸(Lp=1)をわたってパワー積分され、この結果、次式に従って、(理想化された)基準に対する単一のラウドネス数NX、及び調節された歪み信号に対するラウドネス数NYが得られる。
Figure 2008513834
及び、
Figure 2008513834
次いで、単一のラウドネス数NX、NYを用いて、段階3.7において、周波数領域の平均化された出力ラウドネス密度関数ALSY(f)の平均値が、(理想化された)入力信号及び調節された出力信号の両方で同じになるような方法で平均ラウドネス密度関数ALSY(f)を正規化し、結果として、正規化平均ラウドネス密度関数NALSY(f)が得られる。
段階3.8では、差分平均ラウドネス関数DALS(f)が、平均ラウドネス密度ALSX(f)とNALSY(f)との間で定義される。次いで、段階3.9では、この差分平均ラウドネス関数は、同様にLubesqueを用いて周波数軸にわたるが、ここでは各バーク周波数帯域におけるラウドネスに対してp<1.0(pは好ましくは0.2から0.4の範囲内)を用いて個々の周波数帯域差分にわたって積分される。この結果は、次式に従うラウドネス周波数応答歪み尺度LSDMとなる。
Figure 2008513834
ここで、fは差分平均ラウドネススペクトルにおける周波数帯域を意味する。
段階3.12では、ラウドネス差分関数DALS(f)の連続ラウドネスビンの絶対値を取り、全ての連続ビンについてこれらを合計することによって特定の粗度尺度RMを計算することができる。
Figure 2008513834
(fは帯域インデックス数であり、pは0.5〜2.0の範囲内にあり、好ましくはpは1.5の範囲内にある)
粗度数値RMは、段階3.13においてラウドネス周波数応答歪み測定値LSDMと乗算により組み合わせることができ、この結果は平均オピニオンスコアテーブルにマッピングされ、結果として単一の周波数応答影響品質尺度FRIQMが得られる。
図4は、本発明による実施形態を示しており、この実施形態では段階4.1において、差分関数DALS(f)が正部分(入力>出力)DALS+(f)と負部分DALS−(f)に分割される。次いで、段階4.2及び4.3では、両方の部分DALS(f)+及びDALS(f)−はそれぞれ、同様にLpノルムを用いて周波数軸にわたるが、ここでは個々の周波数帯域差分にわたってp<1.0を用いると共に各バーク周波数帯域におけるラウドネスに対しては0.1<p<0.5を用いてLubesqueに従って積分される。この結果、正及び負の周波数応答歪み数LSDM+及びLSDM−が得られる。
段階4.4及び4.5では、2つの線形周波数領域影響数FRIQM+及びFRIQM−が、正及び負の周波数応答歪み数LSDM+及びLSDM−から粗度数RMと乗算することによって計算される。次に、これらの周波数応答歪み数は、段階4.6において線形周波数応答歪みの影響を定量化するためにMOS(平均オピニオンスコア)様尺度にマッピングされ、2つの線形周波数領域影響数FRIQM+及びFRIQM−がそれぞれ得られる。FRIQM+及びFRIQM−は重み付けされ、次式の単一の周波数応答影響品質尺度FRIQMを得る。
Figure 2008513834
ここで、好ましくはα+β=1であり、αとβとの比率は好ましくは10よりも大きい。現行の実装ではβ=0であり、従ってLSDM+値のみが考慮される。
勿論、LSDM+及びLSDM−はまた、周波数応答影響品質尺度FRIQM+及びFRIQM−と同様の方式で組み合わせることができ、この後で、MOSへのマッピングを行い、単一周波数応答影響品質尺度FRIQMを得ることができる。更に、この実施形態では、粗度尺度との乗算もLSDM単独に対して実施することができる。
図4に示す本発明の好ましい実施形態によれば、入力ピッチパワー密度関数は、音声信号の理想スペクトルパワー密度Ideal(f)に向けて0.3<p<0.6のLpスケーリングを基準としてLubesqueを用いて周波数補償される。入力ピッチパワー密度関数は、歪み信号の品質が計算する必要がある完全な音声断片にわたって、各周波数バーク帯域における平均パワーを計算することによって入力基準音声信号から計算される。理想スペクトルパワー密度関数Ideal(f)は、平坦な周波数応答のマイクロフォンを用いて記録された多数の男女の声の長期平均スペクトルパワー密度の平均化を基準として定義される。PESQにおいて用いられるように各バーク帯域では、密度数は理想密度関数を基準として構成される。
理想スペクトルパワー密度関数Ideal(f)に向けたこの部分的スケーリングは、録音技術における誤差を補償する。録音技術は、スペクトルパワー密度の不均衡、ほとんどの場合低周波数(500Hz未満)の過度の強調を引起こすことが多い。
段階5.1において、理想スペクトル及び入力スペクトルから、幾つかの連続周波数帯域にわたって平均化することによって理想スペクトルパワー密度関数Ideal(f)及び入力ピッチパワー密度関数PPX(f)nの平滑化形態が計算される。これらの平滑化形態から、パワー比「理想/基準」として定義される補償要因S(f)を各バーク帯域について計算することができる。次いで、段階5.2においてこれらの要因S(f)を用いて、0.3<p<0.8であるS(f)pによって入力ピッチパワー密度関数PPX(f)nを再基準化して、(理想化された)入力ピッチパワー密度関数PPXI(f)nが得られ、これは更に、入力ピッチパワー密度関数PPX(f)nの代わりに本発明による評価用に用いることができる。
本発明は、周波数補償の反復調整を用いた局所時間スケーリングと[7]による局所時間スケーリングとを組み合わせることができる点に留意されたい。
本発明は、プロセッサ、メモリ、並びに入力部及び出力部を含むコンピュータシステムにおいて具現化することができる。入力部は、テスト下の音響送信システムから到来する基準入力信号及び劣化出力信号をサンプリングすることができるアナログ入力部のような読み取りデバイスとすることができる。サンプリング信号は固定ディスク等のメモリ内に記憶し、サンプル列を選択することによってフレーム内に入れることができる。次いで、プロセッサは、上述の段階に進み、これらを実行することができる。例えば、線形周波数影響品質尺度の結果は、ディスプレイ又は通信ポートに出力し、或いは後で参照するためにメモリ内に記憶することができる。
(参考文献)
[1]A.W.Rix、M.P.Hollier、A.P.Hekstra、及びJ.G.Beerend、「PESQ, the new ITU standard for objective measurement of perceived speech quality, Part 1 − Time alignment(PESQ、知覚音声品質の客観的評価のための新ITU規格、第1部−時間整合)」、音響工学会誌(J.Audio Eng.Soc)第50巻755〜564頁(2002年10月)
[2]J.G.Beerends、A.P.Hekstra、A.W.Rix、及びM.P.Hollier、「PESQ, the new ITU standard for objective measurement of perceived speech quality, Part II − Perceptual model(PESQ、知覚音声品質の客観的評価のための新ITU規格、第2部−知覚モデル)」、音響工学会誌(J.Audio Eng.Soc)第50巻765〜578頁(KPN Research発行文書00−32228と同等)(2002年10月)
[3]ITU−T記録 P.862、「Perceptual Evaluation Of Speech Quality (PESQ), An Objective Method for End−to−end Speech Quality Assessment of Narrowband Telephone Networks and Speech Codecs(音声品質の知覚評価(PESQ)、狭帯域電話ネットワーク及び音声コーデックの末端間音声品質査定の客観的方法)」、国際電気通信連合、スイス、ジュネーブ、(2001年2月)
[4]A.P.Hekstra、J.G.Beerends、「Output power decompensation(出力パワー補償解除)」、国際特許出願PCT EP02/02342;欧州特許出願01200945.2(2001年3月);Koninklijke PTT Nederland N.V.
[5]J.G.Beerends、「Frequency dependent frequency compensation(周波数依存の周波数補償)」、国際特許出願PCT EP02/05556;欧州特許出願01203699.2(2001年6月);Koninklijke PTT Nederland N.V.
[6]J.G.Beerends、「Method and system for measuring a system’s transmission quality(システムの送信品質を測定するための方法及びシステム)」、ソフトスケーリング、国際特許出願;PCT EP03/02058;欧州特許出願02075973.4−2218(2002年4月);Koninklijke PTT Nederland N.V.
[7]J.G.Beerends、「Method and system for measuring a system’s transmission quality(システムの送信品質を測定するための方法及びシステム)」;欧州特許出願02075973(2003年7月)、Koninklijke PTT Nederland N.V.
[8]T.Goldstein、J.G.Beerends、H.Klaus、及びC.Schmidmer、「Draft ITU−T Recommendation P.AAM, An objective method for end−to−end speech quality assessment of narrow−band telephone networks including acoustic terminal(R)(ITU−T草案勧告P.AAM、音響端末を含む狭帯域電話ネットワークの末端間音声品質査定のための客観的方法)」(2003年9月)、ITU−T研究グループ12への正式寄書COM12〜64
従来技術による音響送信システムの知覚品質を判定するための方法の全体図である。 従来技術によるITU−T勧告P.862に従って音響送信システムの知覚品質を判定するための方法を表す図である。 本発明の好ましい実施形態による音響送信システムの知覚品質を判定するための方法を表す図である。 本発明の第1の実施形態による改善を示す図である。 本発明の第2の実施形態による更なる改善を示す図である。

Claims (12)

  1. 入力部及び出力部を有し、該出力部が時間フレーム出力信号(Yn)を生成する音響送信システム(1)に適用するための時間フレーム入力信号(Xn)の第1の周波数補償済み入力ピッチパワー密度関数(PPX’(f)n)を設定するための方法であって、
    前記入力信号(Xn)を処理して入力ピッチパワー密度関数(PPX(f)n)を得る段階(2.1...2.3)と、
    前記出力信号(Yn)を処理して出力ピッチパワー密度関数(PPY(f)n)を得る段階(2.4...2.6)と、
    第1の周波数補償関数(H1(f))を用いて前記入力ピッチパワー密度関数(PPX(f)n)を周波数補償して、前記第1の周波数補償済み入力ピッチパワー密度関数(PPX’(f)n)を得る段階(2.7、2.8)と、
    を含み、
    前記入力ピッチパワー密度関数(PPX(f)n)を周波数補償する段階(2.7、2.8)は、オフセット[6]を有するパワーベースソフトスケーリング関数が0.5の範囲内の累乗と、4*105の範囲内のオフセットとを用いることを含む、
    ことを特徴とする方法。
  2. 短期利得変動に対して前記出力ピッチパワー密度関数(PPY(f)n)を補償して、局所基準化出力ピッチパワー密度関数(PPY’(f)n)を得る段階(2.9...2.11)と、
    前記周波数補償済み出力ピッチパワー密度関数(PPY’(f)n)をラウドネス知覚スケールに変換して、出力ラウドネス密度関数(LY(f)n)を得る段階(2.13)と、
    第2の周波数補償関数(H2(f))を用いて前記入力ピッチパワー密度関数(PPX(f)n)を周波数補償して、第2の周波数補償済み入力ピッチパワー密度関数(PPX''(f)n)を得る段階(3.10、3.11)と、
    前記第2の周波数補償済み入力ピッチパワー密度関数(PPX''(f)n)をラウドネス知覚スケールに変換し、入力ラウドネス密度関数(LX’(f)n)を得る段階(3.14)と、
    前記フレーム付き入力ラウドネス密度関数(LX’(f)n)の時間フレームにわたって平均化して、平均入力ラウドネススペクトル(ALSX(f))を得る段階(3.4)と、
    前記フレーム付き出力ラウドネス密度関数(LY(f)n)の時間フレームにわたって平均化し、平均出力ラウドネススペクトル(ALSY(f))を得る段階(3.5)と、
    前記平均入力ラウドネススペクトル(ALSX(f))に対して前記平均出力ラウドネススペクトル(ALSY(f))を正規化し、これによって正規化平均出力ラウドネススペクトル(NALSY(f))を得る段階(3.6、3.7)と、
    前記正規化出力ラウドネススペクトル(NALSY(f))から前記入力ラウドネススペクトル(ALSX(f))を減算し、これによって差分平均ラウドネススペクトル(DALS(f))を得る段階(3.8)と、
    前記差分平均ラウドネススペクトル関数(DALS(f))をLubesque積分し、これによって前記音響送信システム(1)についての線形スペクトル歪み尺度(LSDM)を設定する段階(3.9)と、
    を含む請求項1に記載の方法。
  3. 連続周波数ビン値の絶対差分に基づいて前記差分平均ラウドネススペクトル(DALS(f))の粗度尺度(RM)を設定する段階(3.12)と、
    前記粗度尺度(RM)と前記線形スペクトル歪み尺度(LSDM)とを乗算によって組み合わせ、その結果をMOS(平均オピニオンスコア)スケールにマッピングする(FRIQM)段階(3.13)と、
    を更に含む請求項1に記載の方法。
  4. 前記入力ピッチパワー密度関数(PPX(f)n)を周波数補償して前記第2の周波数補償済み入力ピッチパワー密度関数(PPX''(f)n)を得る段階(3.10、3.11)は、0.4の範囲内の累乗と5*106の範囲のオフセットとを用いるオフセット[6]を有するソフトスケーリング関数に基づくことを特徴とする前記請求項のいずれかに記載の方法。
  5. 前記第1の周波数補償関数(H1(f))がバークビン値の項で表され、前記入力及び出力ピッチパワー密度関数の少なくとも2つの隣接するバークビン値にわたる平均化から導出されることを特徴とする前記請求項のいずれかに記載の方法。
  6. 前記第2の周波数補償関数(H2(f))はバークビン値の項で表され、前記入力及び出力ピッチパワー密度関数の少なくとも2つの隣接するバークビン値にわたる平均化から導出されることを特徴とする前記請求項のいずれかに記載の方法。
  7. 前記時間フレーム入力信号(Xn)を処理する前記段階(2)が更に、
    理想スペクトルIdeal(f)に対して前記入力ピッチパワー密度関数(PPX(f)n)を周波数補償する段階(5.1、5.2)を含む、
    前記請求項のいずれかに記載の方法。
  8. フレーム当たりの前記入力及び出力ピッチパワー密度関数(PPX(f)n、PPY(f)n)が同時に無音基準値よりも大きい時間フレームを検出する段階(3.1)と、
    時間フレームを検出する前記段階(3.1)の制御下で、前記入力ラウドネス密度関数フレーム(LX’(f)n)及び出力ラウドネス密度関数フレーム(LY(f)n)をゲーティングする段階(3.2及び3.3)と、
    を更に含む前記請求項のいずれかに記載の方法。
  9. 線形スペクトル歪み尺度(LSDM)を設定する前記段階が更に、
    前記差分平均ラウドネススペクトル(DALS(f))を正の差分平均ラウドネススペクトル(DALS+(f))と負の差分平均ラウドネススペクトル(DALS−(f))とに分割する段階(4.1)と、
    前記差分平均ラウドネススペクトルの正の値(DALS+(f))を前記周波数領域において積分し、これによって正の線形スペクトル歪み尺度(LSDM+)を設定する段階(4.2)と、
    前記差分平均ラウドネススペクトルの負の値(DALS−(f))を前記周波数領域において積分し、これによって負の線形スペクトル歪み尺度(LSDM−)を設定する段階(4.3)と、
    前記粗度尺度(RM)と前記正の線形スペクトル歪み尺度(LSDM+)とを乗算し、その結果をMOS(平均オピニオンスコア)スケールにマッピングし、これによって正の周波数応答歪み品質尺度(FRIQM+)を得る段階(4.4)と、
    乗算によって前記粗度尺度(RM)と前記負の線形スペクトル歪み尺度(LSDM−)とを組み合わせ、その結果をMOS(平均オピニオンスコア)スケールにマッピングし、これによって負の周波数応答歪み品質尺度(FRIQM−)を得る段階(4.5)と、
    0よりも大きい第1の重み付け要因(α)を用いて前記正の周波数応答歪み品質尺度(FRIQM+)を重み付けする段階(4.6)と、
    0よりも大きい第2の重み付け要因(β)を用いて前記負の周波数応答歪み品質尺度(FRIQM−)を重み付けする段階(4.6)と、
    前記重み付けされた負の周波数応答影響品質尺度(FRIQM−)と前記正の周波数応答影響品質尺度(FRIQM+)とを加算し、これによって単一の周波数応答影響尺度(FRIQM)を得る段階(4.6)と、
    を含む前記請求項のいずれかに記載の方法。
  10. 短期利得変動に対して前記出力ピッチパワー密度関数(PPY(f)n)を補償し、局所基準化出力ピッチパワー密度関数(PPY’(f)n)を得る段階(2.9...2.11)と、
    前記第1の周波数補償済み入力ピッチパワー密度関数(PPX’(f)n)をラウドネス知覚スケールに変換し、入力ラウドネス密度関数(LX(f)n)を得る段階(2.12)と、
    前記周波数補償済み入力ピッチパワー密度関数(PPY’(f)n)をラウドネス知覚スケールに変換し、出力ラウドネス密度関数(LY(f)n)を得る段階(2.13)と、
    出力及び入力ラウドネス密度関数(LY(f)n、LX(f)n)を減算し、差分ラウドネス密度関数(D(f)n)を得る段階(3.4)と、
    前記差分ラウドネス密度関数(D(f)n)における正のビンと負のビンとの間で非対称処理を行い、これにより非対称差分ラウドネス密度関数(D(f)n)を得る段階(2.15)と、
    前記非対称差分ラウドネス密度関数(DA(f)n)を周波数積分し(2.16)、無音部分を強調することによって非対称擾乱尺度(DAn)を得る段階(2.17)と、
    前記差分ラウドネス密度関数(D(f)n)を周波数積分し(2.18)、無音部分を強調することよって対称擾乱尺度を得る段階(2.19)と、
    前記差分ラウドネス密度関数及び前記非対称差分ラウドネス密度関数(Dn、An)を時間積分し(2.20)、これによって対称及び非対称擾乱尺度(D、DA)を得て、次いで前記対称及び非対称擾乱尺度(D、DA)を組み合わせることによって単一の知覚品質推定(PESQ)を得る段階(2.20)と、
    を更に含む請求項1に記載の方法。
  11. 入力部及び出力部を有し、該出力部が時間フレーム出力信号を生成する音響送信システムに適用される時間フレーム入力信号の周波数補償済み入力ピッチパワー密度関数を設定するための処理システムであって、
    プロセッサと、
    フレーム付き入力信号(Xn)及びフレーム付き出力信号(Yn)を入力する手段と、
    周波数応答影響品質尺度(LSDM、FRIQM、PESQ)を出力する手段と、
    を備え、
    前記プロセッサは、前記請求項1〜10のうちの少なくとも1つに記載の方法の段階を実行するように構成されている、
    ことを特徴とするシステム。
  12. コンピュータシステム上で実行されたときに該コンピュータに前記請求項1〜10のうちの少なくとも1つに記載の方法の段階を実行させるコンピュータ実行可能なソフトウェアコードを含むコンピュータ読み取り可能媒体。
JP2007532270A 2004-09-20 2005-09-20 知覚音声分析のための周波数補償 Active JP4879180B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04077601.5 2004-09-20
EP04077601 2004-09-20
PCT/NL2005/000683 WO2006033570A1 (en) 2004-09-20 2005-09-20 Frequency compensation for perceptual speech analysis

Publications (2)

Publication Number Publication Date
JP2008513834A true JP2008513834A (ja) 2008-05-01
JP4879180B2 JP4879180B2 (ja) 2012-02-22

Family

ID=35355107

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007532270A Active JP4879180B2 (ja) 2004-09-20 2005-09-20 知覚音声分析のための周波数補償

Country Status (12)

Country Link
US (1) US8014999B2 (ja)
EP (1) EP1792304B1 (ja)
JP (1) JP4879180B2 (ja)
CN (1) CN101053016B (ja)
AT (1) ATE405922T1 (ja)
AU (1) AU2005285694B2 (ja)
CA (1) CA2580763C (ja)
DE (1) DE602005009221D1 (ja)
DK (1) DK1792304T3 (ja)
ES (1) ES2313413T3 (ja)
PT (1) PT1792304E (ja)
WO (1) WO2006033570A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128296A (ja) * 2008-11-28 2010-06-10 Fujitsu Ltd 音声信号処理評価プログラム、音声信号処理評価装置
JP2011215211A (ja) * 2010-03-31 2011-10-27 Clarion Co Ltd 音質評価装置およびそのためのプログラム
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1975924A1 (en) * 2007-03-29 2008-10-01 Koninklijke KPN N.V. Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system
CN101790758B (zh) * 2007-07-13 2013-01-09 杜比实验室特许公司 用于控制音频信号的信号处理的设备和方法
ES2403509T3 (es) * 2007-09-11 2013-05-20 Deutsche Telekom Ag Método y sistema para la evaluación integral y diagnóstica de la calidad de la voz de escucha
EP2048657B1 (en) * 2007-10-11 2010-06-09 Koninklijke KPN N.V. Method and system for speech intelligibility measurement of an audio transmission system
WO2011010962A1 (en) * 2009-07-24 2011-01-27 Telefonaktiebolaget L M Ericsson (Publ) Method, computer, computer program and computer program product for speech quality estimation
DK2465112T3 (en) 2009-08-14 2015-01-12 Koninkl Kpn Nv PROCEDURE, COMPUTER PROGRAM PRODUCT, AND SYSTEM FOR DETERMINING AN EVALUATED QUALITY OF AN AUDIO SYSTEM
CN102456348B (zh) * 2010-10-25 2015-07-08 松下电器产业株式会社 声音补偿参数计算方法和设备、声音补偿系统
TWI759223B (zh) * 2010-12-03 2022-03-21 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
EP2733700A1 (en) * 2012-11-16 2014-05-21 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
CN104243723B (zh) * 2014-09-28 2017-03-29 辽宁省建设科学研究院 访客对讲系统音频信号非线性失真检测方法
JP6461064B2 (ja) * 2016-09-28 2019-01-30 本田技研工業株式会社 音響特性校正方法
CN112083807B (zh) * 2020-09-20 2021-10-29 吉林大学 一种基于音触转换的足部地形触觉再现方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06236198A (ja) * 1993-02-09 1994-08-23 Nec Corp 音質主観評価予測方式
JPH11502071A (ja) * 1995-03-15 1999-02-16 コニンクリジケ ピーティーティー ネーダーランド エヌ ブィー 信号特性決定装置およびその方法
JP2000206979A (ja) * 1999-01-19 2000-07-28 Nippon Hoso Kyokai <Nhk> 所望信号抽出の度合いを評価する評価値を求める方法および装置、ならびに信号抽出装置のパラメ―タ制御方法および装置
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
WO2003076889A1 (en) * 2002-03-08 2003-09-18 Koninklijke Kpn N.V. Method and system for measuring a system's transmission quality
JP2004343687A (ja) * 2003-01-18 2004-12-02 Psytechnics Ltd 品質評価装置
JP2005531990A (ja) * 2002-07-01 2005-10-20 ルーセント テクノロジーズ インコーポレーテッド 音声品質を評価する方法

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8701365D0 (en) * 1987-01-22 1987-02-25 Thomas L D Signal level control
US5321636A (en) * 1989-03-03 1994-06-14 U.S. Philips Corporation Method and arrangement for determining signal pitch
US5687281A (en) * 1990-10-23 1997-11-11 Koninklijke Ptt Nederland N.V. Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US5588089A (en) * 1990-10-23 1996-12-24 Koninklijke Ptt Nederland N.V. Bark amplitude component coder for a sampled analog signal and decoder for the coded signal
US5765127A (en) * 1992-03-18 1998-06-09 Sony Corp High efficiency encoding method
US5632003A (en) * 1993-07-16 1997-05-20 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for coding method and apparatus
WO1997027578A1 (en) * 1996-01-26 1997-07-31 Motorola Inc. Very low bit rate time domain speech analyzer for voice messaging
ATE205009T1 (de) * 1996-05-21 2001-09-15 Koninkl Kpn Nv Vorrichtung und verfahren zur bestimmung der qualität eines ausgangssignals, das von einem signalverarbeitungsschaltkreis erzeugt werden soll
JP2000507788A (ja) * 1996-12-13 2000-06-20 コニンクリジケ ケーピーエヌ エヌブィー 信号特性決定のための装置および方法
DE19840548C2 (de) * 1998-08-27 2001-02-15 Deutsche Telekom Ag Verfahren zur instrumentellen Sprachqualitätsbestimmung
WO2001065543A1 (en) * 2000-02-29 2001-09-07 Telefonaktiebolaget Lm Ericsson (Publ) Compensation for linear filtering using frequency weighting factors
DE60029453T2 (de) * 2000-11-09 2007-04-12 Koninklijke Kpn N.V. Messen der Übertragungsqualität einer Telefonverbindung in einem Fernmeldenetz
DE10134471C2 (de) * 2001-02-28 2003-05-22 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Charakterisieren eines Signals und Verfahren und Vorrichtung zum Erzeugen eines indexierten Signals
EP1298646B1 (en) * 2001-10-01 2006-01-11 Koninklijke KPN N.V. Improved method for determining the quality of a speech signal
US7146313B2 (en) * 2001-12-14 2006-12-05 Microsoft Corporation Techniques for measurement of perceptual audio quality
US7457757B1 (en) * 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
EP1465156A1 (en) * 2003-03-31 2004-10-06 Koninklijke KPN N.V. Method and system for determining the quality of a speech signal
US7526093B2 (en) * 2003-08-04 2009-04-28 Harman International Industries, Incorporated System for configuring audio system

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06236198A (ja) * 1993-02-09 1994-08-23 Nec Corp 音質主観評価予測方式
JPH11502071A (ja) * 1995-03-15 1999-02-16 コニンクリジケ ピーティーティー ネーダーランド エヌ ブィー 信号特性決定装置およびその方法
JP2000206979A (ja) * 1999-01-19 2000-07-28 Nippon Hoso Kyokai <Nhk> 所望信号抽出の度合いを評価する評価値を求める方法および装置、ならびに信号抽出装置のパラメ―タ制御方法および装置
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
JP2004524753A (ja) * 2001-03-13 2004-08-12 コニンクリジケ ケーピーエヌ エヌブィー スピーチ信号の品質を決定するための方法及び装置
WO2003076889A1 (en) * 2002-03-08 2003-09-18 Koninklijke Kpn N.V. Method and system for measuring a system's transmission quality
JP2005519339A (ja) * 2002-03-08 2005-06-30 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ システムの伝送品質を測定する方法及びシステム
JP2005531990A (ja) * 2002-07-01 2005-10-20 ルーセント テクノロジーズ インコーポレーテッド 音声品質を評価する方法
JP2004343687A (ja) * 2003-01-18 2004-12-02 Psytechnics Ltd 品質評価装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010128296A (ja) * 2008-11-28 2010-06-10 Fujitsu Ltd 音声信号処理評価プログラム、音声信号処理評価装置
JP2013501952A (ja) * 2009-08-14 2013-01-17 コニンクリーケ・ケイピーエヌ・ナムローゼ・フェンノートシャップ オーディオ・システムの知覚品質を判定する方法およびシステム
JP2011215211A (ja) * 2010-03-31 2011-10-27 Clarion Co Ltd 音質評価装置およびそのためのプログラム
US9031837B2 (en) 2010-03-31 2015-05-12 Clarion Co., Ltd. Speech quality evaluation system and storage medium readable by computer therefor

Also Published As

Publication number Publication date
CN101053016B (zh) 2011-05-18
US8014999B2 (en) 2011-09-06
CN101053016A (zh) 2007-10-10
JP4879180B2 (ja) 2012-02-22
ATE405922T1 (de) 2008-09-15
US20080040102A1 (en) 2008-02-14
DE602005009221D1 (de) 2008-10-02
ES2313413T3 (es) 2009-03-01
AU2005285694B2 (en) 2010-09-16
PT1792304E (pt) 2008-12-04
CA2580763C (en) 2014-07-29
CA2580763A1 (en) 2006-03-30
AU2005285694A1 (en) 2006-03-30
DK1792304T3 (da) 2009-01-05
EP1792304A1 (en) 2007-06-06
EP1792304B1 (en) 2008-08-20
WO2006033570A1 (en) 2006-03-30

Similar Documents

Publication Publication Date Title
JP4879180B2 (ja) 知覚音声分析のための周波数補償
US9025780B2 (en) Method and system for determining a perceived quality of an audio system
CA2891453C (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal
KR101430321B1 (ko) 오디오 시스템의 지각 품질을 결정하기 위한 방법 및 시스템
US9953663B2 (en) Method of and apparatus for evaluating quality of a degraded speech signal
US9659579B2 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter
US9659565B2 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal, through providing a difference function representing a difference between signal frames and an output signal indicative of a derived quality parameter
US20230260528A1 (en) Method of determining a perceptual impact of reverberation on a perceived quality of a signal, as well as computer program product

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110516

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110816

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110823

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110915

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111107

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111129

R150 Certificate of patent or registration of utility model

Ref document number: 4879180

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141209

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250