JP4551215B2 - 音声の聴覚明瞭度分析を実施する方法 - Google Patents

音声の聴覚明瞭度分析を実施する方法 Download PDF

Info

Publication number
JP4551215B2
JP4551215B2 JP2004517988A JP2004517988A JP4551215B2 JP 4551215 B2 JP4551215 B2 JP 4551215B2 JP 2004517988 A JP2004517988 A JP 2004517988A JP 2004517988 A JP2004517988 A JP 2004517988A JP 4551215 B2 JP4551215 B2 JP 4551215B2
Authority
JP
Japan
Prior art keywords
power
speech
pronunciation
frequency
clear
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004517988A
Other languages
English (en)
Other versions
JP2005531811A5 (ja
JP2005531811A (ja
Inventor
ドー−スク キム,
Original Assignee
アルカテル−ルーセント ユーエスエー インコーポレーテッド
ドー−スク キム,
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント ユーエスエー インコーポレーテッド, ドー−スク キム, filed Critical アルカテル−ルーセント ユーエスエー インコーポレーテッド
Publication of JP2005531811A publication Critical patent/JP2005531811A/ja
Publication of JP2005531811A5 publication Critical patent/JP2005531811A5/ja
Application granted granted Critical
Publication of JP4551215B2 publication Critical patent/JP4551215B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/21Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being power information
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Telephone Function (AREA)
  • Electrically Operated Instructional Devices (AREA)
  • Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)

Description

本発明は、一般に、通信システムに関し、具体的には、音声品質評価に関する。
無線通信システムの性能は、とりわけ、音声品質の観点から測定することができる。当技術分野では、主観的音声品質評価が、最も信頼性がありかつ一般に許容された音声の品質を評価するための方法である。主観的音声品質評価では、聴取者を使用して、処理された音声の音声品質を評価する。この場合、処理された音声とは、受信器において復号されるなどして、処理された伝送音声信号である。この技法は、個々の人間の知覚に基づくので主観的である。しかし、主観的音声品質評価は、統計的に信頼性のある結果を得るために、十分に多数の音声サンプルおよび聴取者を必要とするので、コストがかかり、時間がかかる技法である。
客観的音声品質評価は、音声品質を評価するもう1つの技法である。主観的音声品質評価とは異なり、客観的音声品質評価は、個人の知覚に基づいていない。客観的音声品質評価は、2つのタイプの一方とすることが可能である。客観的音声品質評価の第1のタイプは、既知の元の音声に基づく。客観的音声品質評価のこの第1のタイプでは、移動局が、既知の元の音声から符号化するなどして、導出された音声信号を送信する。送信された音声信号は、受信され、処理され、その後記録される。音声品質知覚評価(PESQ)などの周知の音声評価技法を使用して、処理されて記録された音声信号を既知の元の音声と比較し、音声品質を決定する。元の音声信号が既知でない場合、または送信音声信号が既知の元の音声から導出されていない場合、客観的音声品質評価のこの第1のタイプを使用することはできない。
客観的音声品質評価の第2のタイプは、既知の元の音声に基づいていない。客観的音声品質評価のこの第2のタイプのほとんどの実施形態は、処理された音声から元の音声を推定し、次いで、周知の音声評価技法を使用して、推定された元の音声を処理された音声と比較する。しかし、処理された音声中のひずみが増大するにつれて、推定された元の音声の品質が低下し、客観的音声品質評価の第2のタイプのこれらの実施形態の信頼性は低下する。
したがって、既知の元の音声または推定された元の音声を使用しない客観的音声品質評価技法が求められている。
本発明は、音声品質評価に使用する音声の聴覚明瞭度分析技法である。本発明の明瞭度分析技法は、音声信号の明瞭発音周波数範囲に関連付けられた電力と非明瞭発音周波数範囲に関連付けられた電力との比較に基づく。元の音声も元の音声の推定も、明瞭度分析では使用されない。明瞭度分析は、音声信号の明瞭発音電力と非明瞭発音電力とを比較する工程と、比較に基づいて音声品質を評価する工程とを含み、明瞭発音電力および非明瞭発音電力は、音声信号の明瞭発音周波数範囲に関連付けられた電力および非明瞭発音周波数範囲に関連付けられた電力である。一実施形態では、明瞭発音電力と非明瞭発音電力との比較は、比であり、明瞭発音電力は、2〜12.5Hzの周波数に関連付けられた電力であり、非明瞭発音電力は、12.5Hzより高い周波数に関連付けられた電力である。
本発明の特徴、態様、および利点は、以下の記述、添付の請求項、および付随する図面に関してより良く理解されるであろう。
本発明により、既知の元の音声または推定された元の音声を使用しない客観的音声品質評価技法が提供される。
本発明は、音声品質評価に使用する音声の聴覚明瞭度分析技法である。本発明の明瞭度分析技法は、音声信号の明瞭発音周波数範囲に関連付けられた電力と非明瞭発音周波数範囲に関連付けられた電力との比較に基づく。元の音声も元の音声の推定も、明瞭度分析では使用されない。明瞭度分析は、音声信号の明瞭発音電力と非明瞭発音電力とを比較する工程と、比較に基づいて音声品質を評価する工程とを含み、明瞭発音電力および非明瞭発音電力は、音声信号の明瞭発音周波数範囲に関連付けられた電力および非明瞭発音周波数範囲に関連付けられた電力である。
図1は、本発明による明瞭度分析を使用する音声品質評価構成10を示す。音声品質評価構成10は、蝸牛フィルタバンク12と、包絡線分析モジュール14と、明瞭度分析モジュール16とを備える。音声品質評価構成10において、音声信号s(t)が、入力として蝸牛フィルタバンク12に提供される。蝸牛フィルタバンク12は、周辺聴覚システムの第1段階に従って音声信号s(t)を処理するための複数の蝸牛フィルタh(t)を備える。i=1,2,・・・,Nは、特定の蝸牛フィルタ・チャネルを表し、Nは、蝸牛フィルタ・チャネルの全数を表す。具体的には、蝸牛フィルタバンク12は、複数の臨界帯域信号s(t)を生成するために音声信号s(t)をろ波する。臨界帯域信号s(t)は、s(t)とh(t)との積に等しい。
複数の臨界帯域信号s(t)は、入力として包絡線分析モジュール14に提供される。包絡線分析モジュール14において、複数の臨界帯域信号s(t)を処理して、複数の包絡線a(t)を得る。ただし、
Figure 0004551215
であり、
Figure 0004551215
は、s(t)のヒルベルト変換である。
次いで、複数の包絡線a(t)は、入力として明瞭度分析モジュール16に提供される。明瞭度分析モジュール16において、複数の包絡線a(t)を処理して、音声信号s(t)の音声品質評価を得る。具体的には、明瞭度分析モジュール16は、人間の明瞭発音システムから生成された信号に関連付けられた電力(これ以後「明瞭発音電力P(m,i)」と呼ぶ)を、人間の明瞭発音システムから生成されない信号に関連付けられた電力(これ以後「非明瞭発音電力PNA(m,i)」と呼ぶ)と比較する。次いで、そのような比較を使用して、音声品質評価を実施する。
図2は、明瞭度分析モジュール16において、本発明の一実施形態による複数の包絡線a(t)を処理するためのフローチャート200を示す。工程210において、複数の包絡線a(t)のそれぞれについてのフレームmに対してフーリエ変換を実施して、変調スペクトルA(m,f)を生成する。fは周波数である。
図3は、電力対周波数の観点から変調スペクトルA(m,f)を示す例30である。例30では、明瞭発音電力P(m,i)は、周波数2〜12.5Hzに関連付けられた電力であり、非明瞭発音電力PNA(m,i)は、12.5Hzより高い周波数に関連付けられた電力である。2Hz未満の周波数に関連する電力PN0(m,i)は、臨界帯域幅信号a(t)のフレームmのDC成分である。この例では、明瞭発音電力P(m,i)は、人間の明瞭発音速度が2〜12.5Hzであるということに基づいて、周波数2〜12.5Hzに関連付けられた電力として選択される。明瞭発音電力P(m,i)に関連付けられた周波数範囲と非明瞭発音電力PNA(m,i)に関連付けられた周波数範囲(これ以後それぞれ「明瞭発音周波数範囲」および「非明瞭発音周波数範囲」と呼ぶ)とは隣接した、重複しない周波数範囲である。本願の目的のため、「明瞭発音電力P(m,i)」という用語は、人間の明瞭な発音の周波数範囲または上述した周波数範囲2〜12.5Hzに限定すべきではないことを理解されたい。同様に、「非明瞭発音電力PNA(m,i)」という用語は、明瞭発音電力P(m,i)に関連付けられた周波数範囲より高い周波数範囲に限定すべきではない。非明瞭発音周波数範囲は、明瞭発音周波数範囲と重複するまたはしない可能性があり、もしくは明瞭発音周波数範囲と隣接するまたはしない可能性がある。非明瞭発音周波数範囲は、臨界帯域信号a(t)のフレームmのDC成分に関連付けられた周波数など、明瞭発音周波数範囲の最低周波数より低い周波数を含む可能性もある。
工程220において、各変調スペクトルA(m,f)について、明瞭度分析モジュール16は、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との比較を実施する。明瞭度分析モジュール16のこの実施形態では、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との比較は、明瞭発音対非明瞭発音の比ANR(m,i)である。ANRは、以下の式によって定義される。
Figure 0004551215
上式で、εは、ある程度小さい一定値である。明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との他の比較が可能である。たとえば、比較は、式(1)の逆数とすることが可能であり、または、比較は、明瞭発音電力P(m,i)と非明瞭発音電力PNA(m,i)との差とすることが可能である。議論を簡単にするために、フローチャート200によって示した明瞭度分析モジュール16の実施形態について、式(1)のANR(m,i)を使用する比較に関して議論する。しかし、これは決して、本発明を限定すると解釈すべきではない。
工程230において、ANR(m,i)を使用して、フレームmについて局部音声品質LSQ(m)を決定する。局部音声品質LSQ(m)は、DC成分電力PN0(m,i)に基づく重み付けファクタR(m、i)と、すべてのチャネルiにわたる明瞭発音対非明瞭発音の比ANR(m,i)とを使用して決定される。具体的には、局部音声品質LSQ(m)は、以下の式を使用して決定される。
Figure 0004551215
上式で
Figure 0004551215
であり、kは、周波数インデックスである。
工程240において、音声信号s(t)の全音声品質SQが、フレームmについての局部音声品質LSQ(m)および対数電力P(m)を使用して決定される。具体的には、音声品質SQは、以下の式を使用して決定される。
Figure 0004551215
上式で、
Figure 0004551215
であり、LはLノルム(norm)、Tは音声信号s(t)におけるフレームの全数、λは任意の値、Pthは、可聴信号と沈黙とを識別する閾値である。一実施形態では、λは奇数値であることが好ましい。
明瞭度分析モジュール16の出力は、すべてのフレームmに対する音声品質SQの評価である。すなわち、音声品質SQは、音声信号s(t)に対する音声品質評価である。
本発明について、ある実施形態を参照してかなり詳細に記述してきたが、他の形態も可能である。したがって、本発明の精神および範囲は、本明細書に包含される実施形態の記述に限定すべきではない。
本発明による明瞭度分析を使用する音声品質評価構成を示す図である。 本発明の一実施形態による、明瞭度分析モジュールにおいて、複数の包絡線a(t)を処理するためのフローチャートの図である。 電力対周波数の観点から、変調スペクトルA(m,f)を例示する図である。

Claims (15)

  1. 音声の聴覚明瞭度分析を実施する方法であって、
    音声信号s(t)について明瞭発音電力(P)と非明瞭発音電力(PNA)とを比較する工程を含み、前記明瞭発音電力および前記非明瞭発音電力が、前記音声信号の明瞭発音周波数に関連付けられた電力および前記音声信号の非明瞭発音周波数に関連付けられた電力であり、前記明瞭発音周波数および前記非明瞭発音周波数は各々、前記音声信号(s(t))をフィルタリングし処理することで得られる複数の臨界帯域信号から得られた複数の包絡線(a (t))のそれぞれのフレーム(m)にフーリエ変換を実施して生成された変調スペクトル(A (m,f))の周波数(f)に対応し、さらに、
    前記明瞭発音電力と前記非明瞭発音電力との前記比較に基づいて、音声品質を評価する工程とを含み、
    音声品質を評価する前記工程が、
    前記明瞭発音電力と前記非明瞭発音電力との前記比較を使用して、前記音声信号における複数のフレームmの各々に対する局部音声品質(LSQ(m))を決定する工程を含み、
    Figure 0004551215
    であり、ここで、R(m,i)は、フレームm、チャネルiに対する重み付けファクタである、方法。
  2. 前記明瞭発音周波数が、約2〜12.5Hzである、請求項1に記載の方法。
  3. 前記明瞭発音周波数が、人間の明瞭発音速度に対応する、請求項1に記載の方法。
  4. 前記非明瞭発音周波数が、前記明瞭発音周波数より高い、請求項1に記載の方法。
  5. 前記明瞭発音電力と前記非明瞭発音電力との前記比較が、前記明瞭発音電力と前記非明瞭発音電力との比(ANR(m、i))である、請求項1に記載の方法。
  6. 前記比が、前記明瞭発音電力および小さい定数εを含む分子と、非明瞭発音電力と前記小さい定数εとの和を含む分母とを含み、
    Figure 0004551215
    である、請求項5に記載の方法。
  7. 前記明瞭発音電力と前記非明瞭発音電力との前記比較が、前記明瞭発音電力と前記非明瞭発音電力との差である、請求項1に記載の方法。
  8. 前記局部音声品質が、DC成分電力(PN0(m,i))に基づいて重み付けファクタ(R(m,i))を使用してさらに決定され、
    Figure 0004551215
    であり、ここでkは周波数インデックスである、請求項に記載の方法。
  9. 全体の音声品質(SQ)が、前記局部音声品質を使用して決定され、
    Figure 0004551215
    であり、ここでTは音声信号s(t)におけるフレームmの全数、λは任意の値、そして、Pthは可聴信号と沈黙とを識別する閾値である、請求項に記載の方法。
  10. 前記全体の音声品質が、対数電力Pを使用してさらに決定される、請求項に記載の方法。
  11. 全体の音声品質が、対数電力Pを使用して決定される、請求項1に記載の方法。
  12. 前記比較する工程が、
    複数の包絡線a(t)の各々のフレームm上の複数の臨界帯域信号から得られる複数の包絡線のそれぞれに対してフーリエ変換を実施して、変調スペクトル(A(m,f))(fは周波数)を生成する工程を含む、請求項1に記載の方法。
  13. 前記比較する工程が、
    それぞれのチャネルiに対する複数の臨界帯域信号(S(t))を得るために、前記音声信号(s(t))をろ波する工程を含み、前記臨界帯域信号(S(t))はs(t)×h(t)に等しく、ここでh(t)は蝸牛フィルタである、請求項1に記載の方法。
  14. 前記比較する工程が、
    複数の変調スペクトル(A(m,f))(fは周波数)を得るために、前記複数の臨界帯域信号に対して包絡線分析を実施する工程を含む、請求項13に記載の方法。
  15. 前記比較する工程が、
    前記複数の変調スペクトルのそれぞれに対してフーリエ変換を実施する工程を含む、請求項14に記載の方法。
JP2004517988A 2002-07-01 2003-06-27 音声の聴覚明瞭度分析を実施する方法 Expired - Fee Related JP4551215B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/186,840 US7165025B2 (en) 2002-07-01 2002-07-01 Auditory-articulatory analysis for speech quality assessment
PCT/US2003/020355 WO2004003889A1 (en) 2002-07-01 2003-06-27 Auditory-articulatory analysis for speech quality assessment

Publications (3)

Publication Number Publication Date
JP2005531811A JP2005531811A (ja) 2005-10-20
JP2005531811A5 JP2005531811A5 (ja) 2006-05-25
JP4551215B2 true JP4551215B2 (ja) 2010-09-22

Family

ID=29779948

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004517988A Expired - Fee Related JP4551215B2 (ja) 2002-07-01 2003-06-27 音声の聴覚明瞭度分析を実施する方法

Country Status (7)

Country Link
US (1) US7165025B2 (ja)
EP (1) EP1518223A1 (ja)
JP (1) JP4551215B2 (ja)
KR (1) KR101048278B1 (ja)
CN (1) CN1550001A (ja)
AU (1) AU2003253743A1 (ja)
WO (1) WO2004003889A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7308403B2 (en) * 2002-07-01 2007-12-11 Lucent Technologies Inc. Compensation for utterance dependent articulation for speech quality assessment
US20040167774A1 (en) * 2002-11-27 2004-08-26 University Of Florida Audio-based method, system, and apparatus for measurement of voice quality
US7327985B2 (en) * 2003-01-21 2008-02-05 Telefonaktiebolaget Lm Ericsson (Publ) Mapping objective voice quality metrics to a MOS domain for field measurements
DE60305306T2 (de) * 2003-06-25 2007-01-18 Psytechnics Ltd. Vorrichtung und Verfahren zur binauralen Qualitätsbeurteilung
US7305341B2 (en) * 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment
US20050228655A1 (en) * 2004-04-05 2005-10-13 Lucent Technologies, Inc. Real-time objective voice analyzer
US7742914B2 (en) * 2005-03-07 2010-06-22 Daniel A. Kosek Audio spectral noise reduction method and apparatus
US7515966B1 (en) 2005-03-14 2009-04-07 Advanced Bionics, Llc Sound processing and stimulation systems and methods for use with cochlear implant devices
US7426414B1 (en) * 2005-03-14 2008-09-16 Advanced Bionics, Llc Sound processing and stimulation systems and methods for use with cochlear implant devices
US7856355B2 (en) * 2005-07-05 2010-12-21 Alcatel-Lucent Usa Inc. Speech quality assessment method and system
WO2007043971A1 (en) * 2005-10-10 2007-04-19 Olympus Technologies Singapore Pte Ltd Handheld electronic processing apparatus and an energy storage accessory fixable thereto
US8296131B2 (en) * 2008-12-30 2012-10-23 Audiocodes Ltd. Method and apparatus of providing a quality measure for an output voice signal generated to reproduce an input voice signal
CN101996628A (zh) * 2009-08-21 2011-03-30 索尼株式会社 提取语音信号的韵律特征的方法和装置
CN109496334B (zh) 2016-08-09 2022-03-11 华为技术有限公司 用于评估语音质量的设备和方法
CN106782610B (zh) * 2016-11-15 2019-09-20 福建星网智慧科技股份有限公司 一种音频会议的音质测试方法
CN106653004B (zh) * 2016-12-26 2019-07-26 苏州大学 感知语谱规整耳蜗滤波系数的说话人识别特征提取方法
EP3961624A1 (de) * 2020-08-28 2022-03-02 Sivantos Pte. Ltd. Verfahren zum betrieb einer hörvorrichtung in abhängigkeit eines sprachsignals
DE102020210919A1 (de) * 2020-08-28 2022-03-03 Sivantos Pte. Ltd. Verfahren zur Bewertung der Sprachqualität eines Sprachsignals mittels einer Hörvorrichtung

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3971034A (en) * 1971-02-09 1976-07-20 Dektor Counterintelligence And Security, Inc. Physiological response analysis method and apparatus
JPH078080B2 (ja) * 1989-06-29 1995-01-30 松下電器産業株式会社 音質評価装置
WO1992015090A1 (en) * 1991-02-22 1992-09-03 Seaway Technologies, Inc. Acoustic method and apparatus for identifying human sonic sources
US5454375A (en) * 1993-10-21 1995-10-03 Glottal Enterprises Pneumotachograph mask or mouthpiece coupling element for airflow measurement during speech or singing
GB9604315D0 (en) * 1996-02-29 1996-05-01 British Telecomm Training process
MX9800434A (es) * 1995-07-27 1998-04-30 British Telecomm Evaluacion de calidad de señal.
US6052662A (en) * 1997-01-30 2000-04-18 Regents Of The University Of California Speech processing using maximum likelihood continuity mapping
US6246978B1 (en) * 1999-05-18 2001-06-12 Mci Worldcom, Inc. Method and system for measurement of speech distortion from samples of telephonic voice signals
JP4463905B2 (ja) * 1999-09-28 2010-05-19 隆行 荒井 音声処理方法、装置及び拡声システム
US7308403B2 (en) * 2002-07-01 2007-12-11 Lucent Technologies Inc. Compensation for utterance dependent articulation for speech quality assessment
US7305341B2 (en) * 2003-06-25 2007-12-04 Lucent Technologies Inc. Method of reflecting time/language distortion in objective speech quality assessment

Also Published As

Publication number Publication date
KR20050012711A (ko) 2005-02-02
AU2003253743A1 (en) 2004-01-19
KR101048278B1 (ko) 2011-07-13
EP1518223A1 (en) 2005-03-30
WO2004003889A1 (en) 2004-01-08
US7165025B2 (en) 2007-01-16
CN1550001A (zh) 2004-11-24
US20040002852A1 (en) 2004-01-01
JP2005531811A (ja) 2005-10-20

Similar Documents

Publication Publication Date Title
JP4551215B2 (ja) 音声の聴覚明瞭度分析を実施する方法
US7158933B2 (en) Multi-channel speech enhancement system and method based on psychoacoustic masking effects
EP3598441B1 (en) Systems and methods for modifying an audio signal using custom psychoacoustic models
EP3899936B1 (en) Source separation using an estimation and control of sound quality
US8744846B2 (en) Procedure for processing noisy speech signals, and apparatus and computer program therefor
Relaño-Iborra et al. A speech-based computational auditory signal processing and perception model
JP4301514B2 (ja) 音声品質を評価する方法
Crochiere et al. An interpretation of the log likelihood ratio as a measure of waveform coder performance
US10319394B2 (en) Apparatus and method for improving speech intelligibility in background noise by amplification and compression
Huber et al. Objective assessment of a speech enhancement scheme with an automatic speech recognition-based system
US20090161882A1 (en) Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence
Steeneken et al. Basics of the STI measuring method
Senoussaoui et al. SRMR variants for improved blind room acoustics characterization
Cosentino et al. Towards objective measures of speech intelligibility for cochlear implant users in reverberant environments
Chanda et al. Speech intelligibility enhancement using tunable equalization filter
US20240071411A1 (en) Determining dialog quality metrics of a mixed audio signal
Rosca et al. Multichannel voice detection in adverse environments
EP3718476B1 (en) Systems and methods for evaluating hearing health
CN116686047A (zh) 确定混合音频信号的对话质量度量
Pourmand et al. Computational auditory models in predicting noise reduction performance for wideband telephony applications
Nikhil et al. Impact of ERB and bark scales on perceptual distortion based near-end speech enhancement
Roßbach et al. Prediction of speech intelligibility based on deep machine listening: Influence of training data and simulation of hearing impairment
Chetan et al. Lower and higher critical band enhancement to attain intelligibility improvement in noisy environment
Kressner Auditory models for evaluating algorithms
Speech Transmission and Music Acoustics PREDICTED SPEECH INTELLIGIBILITY AND LOUDNESS IN MODEL-BASED PRELIMINARY HEARING-AID FITTING

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060330

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060330

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090507

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090807

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090814

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090907

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090914

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091006

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091109

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100309

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100310

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20100525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100616

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100709

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130716

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees