JP2005531990A - 音声品質を評価する方法 - Google Patents

音声品質を評価する方法 Download PDF

Info

Publication number
JP2005531990A
JP2005531990A JP2004517987A JP2004517987A JP2005531990A JP 2005531990 A JP2005531990 A JP 2005531990A JP 2004517987 A JP2004517987 A JP 2004517987A JP 2004517987 A JP2004517987 A JP 2004517987A JP 2005531990 A JP2005531990 A JP 2005531990A
Authority
JP
Japan
Prior art keywords
power
pronunciation
voice quality
speech
quality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004517987A
Other languages
English (en)
Other versions
JP4301514B2 (ja
JP2005531990A5 (ja
Inventor
ドー−スク キム,
Original Assignee
ルーセント テクノロジーズ インコーポレーテッド
ドー−スク キム,
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ルーセント テクノロジーズ インコーポレーテッド, ドー−スク キム, filed Critical ルーセント テクノロジーズ インコーポレーテッド
Publication of JP2005531990A publication Critical patent/JP2005531990A/ja
Publication of JP2005531990A5 publication Critical patent/JP2005531990A5/ja
Application granted granted Critical
Publication of JP4301514B2 publication Critical patent/JP4301514B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

【課題】音声品質評価される音声信号をひずませることによって、表音内容、話し方、または個々の話者の相違を説明する客観的音声品質評価の方法を提供すること。
【解決手段】音声信号のひずんだバージョンを使用することによって、音声品質を評価するときに、異なる表音内容、異なる個々の話者、および異なる話し方を補償することが可能である。音声信号をひずませることによって客観的音声品質評価が低下する量は、具体的には音声信号のひずんだバージョンのひずみの量が厳密であるとき、異なる音声信号について同様に維持される。ひずんだ音声信号と当初のひずんでいない音声信号との客観的音声信号評価を比較して、発声依存明瞭度を補償する音声品質評価を得る。

Description

本発明は、一般に、通信システムに関し、具体的には、音声品質評価に関する。
無線通信システムの性能は、とりわけ、音声品質の観点から測定することができる。当技術分野では、音声品質を評価する2つの技法が存在する。第1の技法は、主観的技法である(これ以後「主観的音声品質評価」と呼ぶ)。主観的音声品質評価では、聴取者を使用して、処理された音声の音声品質を評価する。この場合、処理された音声は、受信器において処理された伝送後の音声信号である。この技法は、個人の知覚に基づくので主観的であり、人間による音声品質評価は、通常、表音内容、話し方、または個々の話者の相違を考慮に入れる。主観的音声品質評価は、コストがかかり、時間がかかることがある。
第2の技法は、客観的技法である(これ以後「客観的音声品質評価」と呼ぶ)。客観的音声品質評価は、個人の知覚に基づいていない。ほとんどの客観的音声品質評価の技法は、既知の元の音声、または処理された音声から推定された、再構築された元の音声に基づく。しかし、これらの客観的技法は、表音内容、話し方、または個々の話者の相違を考慮に入れない。
したがって、表音内容、話し方、または個々の話者の相違を考慮に入れて客観的に音声品質を評価することが求められている。
本発明は、音声品質評価される音声信号をひずませることによって、表音内容、話し方、または個々の話者の相違を明らかにする客観的音声品質評価の方法である。音声信号のひずんだバージョンを使用することによって、音声品質を評価する際に、異なる表音内容、異なる個々の話者、および異なる話し方を補償することが可能である。音声信号をひずませることによって客観的音声品質評価が低下する量は、特に音声信号のひずんだバージョンのひずみ量が厳密であるとき、異なる音声信号について同様に維持される。発声に依存する明瞭度について補償された音声品質評価を得るために、ひずんだ音声信号についての客観的音声品質評価と元のひずんでいない音声信号についての客観的音声品質評価とを比較する。一実施形態では、比較は、ひずんだ音声信号とひずんでいない音声信号との客観的音声品質評価の相違に相当する。
本発明の特徴、態様、および利点は、以下の記述、添付の請求項、および付随する図面に関してより良く理解されるであろう。
本発明は、処理された音声をひずませることによって、表音内容、話し方、または個々の話者の相違を明らかにする客観的音声品質評価方法である。客観的音声品質評価は、同じ主観的音声品質スコアを有する異なる音声信号について異なる値をもたらす傾向がある。これらの値が異なる理由は、変調スペクトル領域におけるスペクトル内容の分布が異なるためである。処理された音声信号のひずんだバージョンを使用することによって、異なる表音内容、異なる個々の話者、および異なる話し方を補償することが可能である。音声信号をひずませることによって客観的音声品質評価が低下する量は、特にひずみが厳密であるとき、異なる音声信号について同様に維持される。発声に依存明瞭度について補償された音声品質評価を得るために、ひずんだ音声信号と元のひずんでいない音声信号との客観的音声信号評価を比較する。
図1は、本発明による発声依存明瞭度を補償する客観的音声品質評価構成10を示す。客観的音声品質評価構成10は、複数の客観的音声品質評価モジュール12、14と、ひずみモジュール16と、発声固有バイアス補償モジュール18とを備える。音声信号s(t)が、入力としてひずみモジュール16および客観的音声品質評価モジュール12に提供される。ひずみモジュール16において、音声信号s(t)をひずませて、変調雑音基準単位(modulated Noise Reference Unit MNRU)音声信号s’(t)を生成する。すなわち、ひずみモジュール16は、入力信号s(t)の雑音バージョンを生成する。次いで、MNRU音声信号s’(t)は、入力として客観的音声品質評価モジュール14に提供される。
客観的音声品質評価モジュール12、14において、音声信号s(t)およびMNRU音声信号s’(t)を処理して、客観的音声品質評価SQ(s(t))およびSQ(s’(t))を得る。客観的音声品質評価モジュール12、14は、あらゆる入力音声信号に対して実施される処理のタイプについて本質的に同一である。すなわち、両方の客観的音声品質評価モジュール12、14が、同じ入力音声信号を受信する場合、両方のモジュール12、14の出力信号は、ほぼ同一である。他の実施形態では、客観的音声品質評価モジュール12、14は、互いに異なる方式で音声信号s(t)およびs’(t)を処理することが可能であることに留意されたい。客観的音声信号評価モジュールは、当技術分野では周知である。そのようなモジュールの例について、以下で記述する。
次いで、客観的音声品質評価SQ(s(t))とSQ(s’(t))とを比較して、発声依存明瞭度を補償する音声品質評価SQcompensatedを獲得する。一実施形態では、音声品質評価SQcompensatedは、客観的音声品質評価SQ(s(t))とSQ(s’(t))との相違を使用して決定される。たとえば、SQcompensatedは、SQ(s(t))からSQ(s’(t))を減算したもの、またはSQ(s’(t))からSQ(s(t))を減算したものに等しい。他の実施形態では、音声品質評価SQcompensatedは、客観的音声品質評価SQ(s(t))とSQ(s’(t))との比に基づいて決定される。たとえば、
Figure 2005531990

であり、上式で、μは、小さい一定値である。
前述したように、客観的音声品質評価モジュール12、14は、当技術分野では周知である。図2は、本発明による音声の聴覚明瞭度分析モジュールを使用する客観的音声品質評価モジュール12、14の実施形態20を示す。図2に示すように、客観的品質評価モジュール20は、蝸牛フィルタバンク22と、包絡線分析モジュール24と、明瞭度分析モジュール26とを備える。客観的品質評価モジュール20において、音声信号s(t)が、入力として蝸牛フィルタバンク22に提供される。蝸牛フィルタバンク22は、周辺聴覚システムの第1段階に従って音声信号s(t)を処理するための複数の蝸牛フィルタh(t)を備える。ここでi=1,2,・・・,Nは、特定の蝸牛フィルタ・チャネルを表し、Nは、蝸牛フィルタ・チャネルの全数を表す。具体的には、蝸牛フィルタバンク22は、複数の臨界帯域信号s(t)を生成するように音声信号s(t)をろ波する。臨界帯域信号s(t)は、s(t)とh(t)との積に等しい。
複数の臨界帯域信号s(t)は、入力として包絡線分析モジュール24に提供される。包絡線分析モジュール24において、複数の臨界帯域信号s(t)を処理して、複数の包絡線a(t)を得る。ここで、
Figure 2005531990

であり、
Figure 2005531990

は、s(t)のヒルベルト変換である。
次いで、複数の包絡線a(t)は、入力として明瞭度分析モジュール26に提供される。明瞭度分析モジュール26において、複数の包絡線a(t)を処理して、音声信号s(t)の音声品質評価を得る。具体的には、明瞭度分析モジュール26は、人間の明瞭発音システムから生成された信号に関連付けられた電力(これ以後「明瞭発音電力P(m,i)」と呼ぶ)を、人間の明瞭発音システムから生成されない信号に関連付けられた電力(これ以後「非明瞭発音電力PNA(m,i)」と呼ぶ)と比較する。次いで、そのような比較を使用して、音声品質評価を実施する。
図3は、明瞭度分析モジュール26において、本発明の一実施形態による複数の包絡線a(t)を処理するためのフローチャート300を示す。工程310において、複数の包絡線a(t)のそれぞれのフレームmに対してフーリエ変換を実施して、変調スペクトルA(m,f)を生成する。fは周波数である。
図4は、電力対周波数の観点から変調スペクトルA(m,f)を示す例40である。例40では、明瞭発音電力P(m,i)は、周波数2〜12.5Hzに関連付けられた電力であり、非明瞭発音電力PNA(m,i)は、12.5Hzより高い周波数に関連付けられた電力である。2Hz未満の周波数に関連する電力PN0(m,i)は、臨界帯域信号a(t)のフレームmのDC成分である。この例では、明瞭発音電力P(m,i)は、人間の明瞭発音速度が2〜12.5Hzであるということに基づいて、周波数2〜12.5Hzに関連付けられた電力として選択される。明瞭発音電力P(m,i)に関連付けられた周波数範囲と非明瞭発音電力PNA(m,i)に関連付けられた周波数範囲(これ以後それぞれ「明瞭発音周波数範囲」および「非明瞭発音周波数範囲」と呼ぶ)とは、隣接する重複しない周波数範囲である。本願の目的のため、「明瞭発音電力P(m,i)」という用語は、人間が明瞭な発音の周波数範囲または上述した周波数範囲2〜12.5Hzに限定すべきではないことを理解されたい。同様に、「非明瞭発音電力PNA(m,i)」という用語は、明瞭発音電力P(m,i)に関連付けられた周波数範囲より高い周波数範囲に限定すべきではない。非明瞭発音周波数範囲は、明瞭発音周波数範囲と重複するまたはしない可能性があり、もしくは明瞭発音周波数範囲と隣接するまたはしない可能性がある。非明瞭発音周波数の範囲は、臨界帯域信号a(t)のフレームmのDC成分に関連付けられた周波数など、明瞭発音周波数範囲の最低周波数より小さい周波数を含む可能性もある。
工程320において、各変調スペクトルA(m,f)について、明瞭度分析モジュール26は、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との比較を実施する。明瞭度分析モジュール26のこの実施形態では、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との比較は、明瞭発音対非明瞭発音の比ANR(m,i)である。ANRは、以下の式によって定義される。
Figure 2005531990

上式で、εは、ある程度小さい一定値である。明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との他の比較が可能である。たとえば、比較は、式(1)の逆数とすることが可能であり、または、比較は、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との差とすることが可能である。議論を簡単にするために、フローチャート300によって示した明瞭度分析モジュール26の実施形態について、式(1)のANR(m,i)を使用する比較に関して議論する。しかし、これは決して、本発明を限定すると解釈すべきではない。
工程330において、ANR(m,i)を使用して、フレームmについて局部音声品質LSQ(m)を決定する。局部音声品質LSQ(m)は、DC成分電力PN0(m,i)に基く重み付けファクタR(m、i)と、すべてのチャネルiにわたる明瞭発音対非明瞭発音の比ANR(m,i)を使用して決定される。具体的には、局部音声品質LSQ(m)は、以下の式を使用して決定される。
Figure 2005531990

上式で
Figure 2005531990

であり、kは、周波数インデックスである。
工程340において、音声信号s(t)の全音声品質SQが、フレームmについての局部音声品質LSQ(m)および対数電力P(m)を使用して決定される。具体的には、音声品質SQは、以下の式を使用して決定される。
Figure 2005531990

上式で、
Figure 2005531990
であり、LはLノルム(norm)、Tは音声信号s(t)におけるフレームの全数、λは任意の値、Pthは、可聴信号と沈黙とを識別する閾値である。一実施形態では、λは奇数値であることが好ましい。
明瞭度分析モジュール26の出力は、すべてのフレームmにわたる音声品質SQの評価である。すなわち、音声品質SQは、音声信号s(t)に対する音声品質評価である。
本発明について、ある実施形態を参照してかなり詳細に記述してきたが、他の形態も可能である。したがって、本発明の精神および範囲は、本明細書に包含される実施形態の記述に限定すべきではない。
本発明による発声依存明瞭度を補償する客観的音声品質評価構成を示す図である。 本発明による音声の聴覚明瞭度分析モジュールを使用する客観的音声品質評価の実施形態を示す図である。 明瞭度分析モジュールにおいて、本発明の一実施形態による複数の包絡線a(t)を処理するためのフローチャートである。 電力対周波数の観点から、変調スペクトルA(m,f)を例示する図である。

Claims (20)

  1. 音声品質を評価する方法であって、
    第1音声信号および第2音声信号についての第1音声品質評価および第2音声品質評価を決定する工程であって、前記第1音声信号が、前記第2音声信号のひずんだバージョンである工程と、
    前記第1音声品質と前記第2音声品質とを比較して、補償された音声品質評価を得る工程とを含む方法。
  2. 前記第1音声品質評価および前記第2音声品質評価を決定する前に、前記第2音声信号をひずませて、前記第1音声信号を生成する工程をさらに含む、請求項1に記載の方法。
  3. 前記第1音声品質および前記第2音声品質が、客観的音声品質評価のための同一技法を使用して評価される、請求項1に記載の方法。
  4. 前記補償された音声品質評価が、前記第1音声品質と前記第2音声品質との差に相当する、請求項1に記載の方法。
  5. 前記補償された音声品質評価が、前記第1音声品質と前記第2音声品質との比に相当する、請求項1に記載の方法。
  6. 前記第1音声品質および前記第2音声品質が、音声の聴覚明瞭度分析を使用して評価される、請求項1に記載の方法。
  7. 前記第2音声品質または前記第1音声品質を評価する工程が、
    前記音声信号またはひずんだ音声信号について明瞭発音電力と非明瞭発音電力とを比較する工程であって、明瞭発音電力および非明瞭発音電力が、前記音声信号または前記ひずんだ音声信号の明瞭発音周波数に関連付けられた電力および非明瞭発音周波数に関連付けられた電力である工程と、
    前記比較に基づいて、前記第2音声品質または前記第1音声品質を評価する工程とを含む、請求項1に記載の方法。
  8. 前記明瞭発音周波数が、約2〜12.5Hzである、請求項7に記載の方法。
  9. 前記明瞭発音周波数が、人間の明瞭発音速度にほぼ対応する、請求項7に記載の方法。
  10. 前記非明瞭発音周波数が、明瞭発音周波数よりおおよそ高い、請求項7に記載の方法。
  11. 前記明瞭発音電力と前記非明瞭発音電力との前記比較が、前記明瞭発音電力と前記非明瞭発音電力との比である、請求項7に記載の方法。
  12. 前記比が、前記明瞭発音電力および小さい定数を含む分母と、前記非明瞭発音電力と小さい定数との和を含む分子とを含む、請求項10に記載の方法。
  13. 前記明瞭発音電力と前記非明瞭発音電力との比較が、前記明瞭発音電力と前記非明瞭発音電力との差である、請求項7に記載の方法。
  14. 前記第1音声品質または前記第2音声品質を評価する工程が、
    前記比較を使用して局部音声品質を決定する工程を含む、請求項7に記載の方法。
  15. 前記局部音声品質が、DC成分電力に基づく重み付けファクタを使用してさらに決定される、請求項7に記載の方法。
  16. 前記第1音声品質または前記第2音声品質が、前記局部音声品質を使用して決定される、請求項9に記載の方法。
  17. 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
    複数の臨界帯域信号から得られた複数の包絡線のそれぞれに対してフーリエ変換を実施する工程を含む、請求項7に記載の方法。
  18. 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
    複数の臨界帯域信号を得るために、前記音声信号をろ波する工程を含む、請求項7に記載の方法。
  19. 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
    複数の変調スペクトルを得るために、前記複数の臨界帯域信号について包絡線分析を実施する工程を含む、請求項18に記載の方法。
  20. 明瞭発音電力と非明瞭発音電力とを比較する前記工程が、
    前記複数の変調スペクトルのそれぞれに対してフーリエ変換を実施する工程を含む、請求項18に記載の方法。
JP2004517987A 2002-07-01 2003-06-27 音声品質を評価する方法 Expired - Fee Related JP4301514B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/186,862 US7308403B2 (en) 2002-07-01 2002-07-01 Compensation for utterance dependent articulation for speech quality assessment
PCT/US2003/020354 WO2004003499A2 (en) 2002-07-01 2003-06-27 Compensation for utterance dependent articulation for speech quality assessment

Publications (3)

Publication Number Publication Date
JP2005531990A true JP2005531990A (ja) 2005-10-20
JP2005531990A5 JP2005531990A5 (ja) 2006-05-25
JP4301514B2 JP4301514B2 (ja) 2009-07-22

Family

ID=29779951

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004517987A Expired - Fee Related JP4301514B2 (ja) 2002-07-01 2003-06-27 音声品質を評価する方法

Country Status (7)

Country Link
US (1) US7308403B2 (ja)
EP (1) EP1518096B1 (ja)
JP (1) JP4301514B2 (ja)
KR (1) KR101052432B1 (ja)
CN (1) CN1307611C (ja)
AU (1) AU2003253742A1 (ja)
WO (1) WO2004003499A2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008513834A (ja) * 2004-09-20 2008-05-01 ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー 知覚音声分析のための周波数補償
JP2011172235A (ja) * 2008-04-18 2011-09-01 Dolby Lab Licensing Corp サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7165025B2 (en) * 2002-07-01 2007-01-16 Lucent Technologies Inc. Auditory-articulatory analysis for speech quality assessment
US7305341B2 (en) * 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment
CN101262885B (zh) 2005-06-10 2015-04-01 中外制药株式会社 含有sc(Fv)2的药物组合物
US7856355B2 (en) * 2005-07-05 2010-12-21 Alcatel-Lucent Usa Inc. Speech quality assessment method and system
KR100729555B1 (ko) * 2005-10-31 2007-06-19 연세대학교 산학협력단 음성 품질의 객관적인 평가방법
CN101609686B (zh) * 2009-07-28 2011-09-14 南京大学 基于语音增强算法主观评估的客观评估方法
CN101894560B (zh) * 2010-06-29 2012-08-15 上海大学 一种无参考源的mp3音频清晰度客观评价方法
CN102157147B (zh) * 2011-03-08 2012-05-30 公安部第一研究所 一种拾音系统语音质量客观评价的测试方法
DE102013005844B3 (de) * 2013-03-28 2014-08-28 Technische Universität Braunschweig Verfahren und Vorrichtung zum Messen der Qualität eines Sprachsignals
US9830905B2 (en) 2013-06-26 2017-11-28 Qualcomm Incorporated Systems and methods for feature extraction
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3971034A (en) * 1971-02-09 1976-07-20 Dektor Counterintelligence And Security, Inc. Physiological response analysis method and apparatus
IT1121496B (it) 1979-12-14 1986-04-02 Cselt Centro Studi Lab Telecom Procedimento e dispositivo per l effettuazione di misure oggettive di qualita su apparecchiature di trasmissione di segnali fonici
JP2002517175A (ja) * 1991-02-22 2002-06-11 シーウェイ テクノロジーズ インコーポレイテッド 人間の音源を識別するための手段および装置
US5454375A (en) * 1993-10-21 1995-10-03 Glottal Enterprises Pneumotachograph mask or mouthpiece coupling element for airflow measurement during speech or singing
US5794188A (en) * 1993-11-25 1998-08-11 British Telecommunications Public Limited Company Speech signal distortion measurement which varies as a function of the distribution of measured distortion over time and frequency
CA2196553C (en) * 1994-08-18 2000-04-11 Michael Peter Hollier Analysis of audio quality
GB9604315D0 (en) * 1996-02-29 1996-05-01 British Telecomm Training process
WO1997005730A1 (en) * 1995-07-27 1997-02-13 British Telecommunications Public Limited Company Assessment of signal quality
DE19647399C1 (de) * 1996-11-15 1998-07-02 Fraunhofer Ges Forschung Gehörangepaßte Qualitätsbeurteilung von Audiotestsignalen
US6052662A (en) * 1997-01-30 2000-04-18 Regents Of The University Of California Speech processing using maximum likelihood continuity mapping
US6246978B1 (en) * 1999-05-18 2001-06-12 Mci Worldcom, Inc. Method and system for measurement of speech distortion from samples of telephonic voice signals
US6609092B1 (en) * 1999-12-16 2003-08-19 Lucent Technologies Inc. Method and apparatus for estimating subjective audio signal quality from objective distortion measures
EP1187100A1 (en) * 2000-09-06 2002-03-13 Koninklijke KPN N.V. A method and a device for objective speech quality assessment without reference signal
US7165025B2 (en) * 2002-07-01 2007-01-16 Lucent Technologies Inc. Auditory-articulatory analysis for speech quality assessment
US7305341B2 (en) * 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008513834A (ja) * 2004-09-20 2008-05-01 ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー 知覚音声分析のための周波数補償
JP4879180B2 (ja) * 2004-09-20 2012-02-22 ネーデルラントセ オルハニサティー フォール トゥーヘパスト−ナトゥールウェッテンサッペリーク オンデルズック テーエヌオー 知覚音声分析のための周波数補償
JP2011172235A (ja) * 2008-04-18 2011-09-01 Dolby Lab Licensing Corp サラウンド体験に対する影響を最小限にしてマルチチャンネルオーディオにおけるスピーチの聴覚性を維持するための方法及び装置

Also Published As

Publication number Publication date
WO2004003499A3 (en) 2004-04-01
JP4301514B2 (ja) 2009-07-22
EP1518096A2 (en) 2005-03-30
CN1307611C (zh) 2007-03-28
WO2004003499A2 (en) 2004-01-08
AU2003253742A8 (en) 2004-01-19
CN1550000A (zh) 2004-11-24
US20040002857A1 (en) 2004-01-01
KR20050012712A (ko) 2005-02-02
US7308403B2 (en) 2007-12-11
AU2003253742A1 (en) 2004-01-19
KR101052432B1 (ko) 2011-07-29
EP1518096B1 (en) 2014-04-23

Similar Documents

Publication Publication Date Title
Ma et al. Objective measures for predicting speech intelligibility in noisy conditions based on new band-importance functions
US9064502B2 (en) Speech intelligibility predictor and applications thereof
US7343022B2 (en) Spectral enhancement using digital frequency warping
JP4551215B2 (ja) 音声の聴覚明瞭度分析を実施する方法
US9031837B2 (en) Speech quality evaluation system and storage medium readable by computer therefor
US20050114127A1 (en) Methods and apparatus for maximizing speech intelligibility in quiet or noisy backgrounds
JP4301514B2 (ja) 音声品質を評価する方法
US20040267523A1 (en) Method of reflecting time/language distortion in objective speech quality assessment
US9245538B1 (en) Bandwidth enhancement of speech signals assisted by noise reduction
Huber et al. Objective assessment of a speech enhancement scheme with an automatic speech recognition-based system
US20090161882A1 (en) Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence
KR20170098761A (ko) 인-이어 마이크로폰을 갖는 이어셋의 대역폭 확장 장치 및 방법
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
RU2589298C1 (ru) Способ повышения разборчивости и информативности звуковых сигналов в шумовой обстановке
Pujar et al. Wiener filter based noise reduction algorithm with perceptual post filtering for hearing aids
Pourmand et al. Computational auditory models in predicting noise reduction performance for wideband telephony applications
Pujar et al. Cascaded structure of noise reduction and multiband frequency compression of speech signal to improve speech perception for monaural hearing aids
Dimolitsas et al. Dependence of opinion scores on listening sets used in degradation category rating assessments
Shinde et al. Quality evaluation of combined temporal and spectral processing for hearing impaired
JPH0417520B2 (ja)
Zorila et al. Effectiveness of Near-End Speech Enhancement Under Equal-Loudness and Equal-Level Constraints.
Brouckxon et al. Design and evaluation of a microphone signal conditioning system
JPH09153769A (ja) 騒音抑圧装置
Ellaham Binaural speech intelligibility prediction and nonlinear hearing devices
Kressner Auditory models for evaluating algorithms

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060330

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071210

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080310

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080317

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080610

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20080806

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081204

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20090226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090323

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090417

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120501

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120501

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130501

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140501

Year of fee payment: 5

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees