JP2005292841A - リアルタイムの客観的音声アナライザ - Google Patents

リアルタイムの客観的音声アナライザ Download PDF

Info

Publication number
JP2005292841A
JP2005292841A JP2005108161A JP2005108161A JP2005292841A JP 2005292841 A JP2005292841 A JP 2005292841A JP 2005108161 A JP2005108161 A JP 2005108161A JP 2005108161 A JP2005108161 A JP 2005108161A JP 2005292841 A JP2005292841 A JP 2005292841A
Authority
JP
Japan
Prior art keywords
signal
processed
voice
quality
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2005108161A
Other languages
English (en)
Inventor
Cao Binshi
カオ ビンシ
Doh-Suk Kim
キム ドー−スク
A Tarraf Ahmed
エー.タラフ アーメッド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nokia of America Corp
Original Assignee
Lucent Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lucent Technologies Inc filed Critical Lucent Technologies Inc
Publication of JP2005292841A publication Critical patent/JP2005292841A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • FMECHANICAL ENGINEERING; LIGHTING; HEATING; WEAPONS; BLASTING
    • F02COMBUSTION ENGINES; HOT-GAS OR COMBUSTION-PRODUCT ENGINE PLANTS
    • F02BINTERNAL-COMBUSTION PISTON ENGINES; COMBUSTION ENGINES IN GENERAL
    • F02B61/00Adaptations of engines for driving vehicles or for driving propellers; Combinations of engines with gearing
    • F02B61/04Adaptations of engines for driving vehicles or for driving propellers; Combinations of engines with gearing for driving propellers
    • F02B61/045Adaptations of engines for driving vehicles or for driving propellers; Combinations of engines with gearing for driving propellers for marine engines
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B63SHIPS OR OTHER WATERBORNE VESSELS; RELATED EQUIPMENT
    • B63HMARINE PROPULSION OR STEERING
    • B63H21/00Use of propulsion power plant or units on vessels
    • B63H21/12Use of propulsion power plant or units on vessels the vessels being motor-driven
    • B63H21/14Use of propulsion power plant or units on vessels the vessels being motor-driven relating to internal-combustion engines

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Ocean & Marine Engineering (AREA)
  • Chemical & Material Sciences (AREA)
  • Combustion & Propulsion (AREA)
  • Mechanical Engineering (AREA)
  • General Engineering & Computer Science (AREA)
  • Telephonic Communication Services (AREA)

Abstract

【課題】リアルタイムの客観的音声解析のための方法と装置を提供すること。
【解決手段】上記装置に、少なくとも1つの第1の信号を受信し、その少なくとも1つの第1の信号に基づき、音声品質についての少なくとも1つの非侵入型の評価を示す少なくとも1つの第2の信号を提供する音声品質アナライザを含める。
【選択図】図2

Description

本発明は一般に、ネットワーク・システムに関し、より詳細には、ネットワーク内の音声信号に関する。
音声信号は、例えばPOTS(Plain Old Telephone System、一般電話システム)、VoIP(Voice over Internet Protocol)を使用するインターネットベースのネットワーク、無線通信システムなど、様々なネットワーク・システムによって送信される。一般に、元の音声信号、例えば第1のユーザの音声によって生成された音響信号、がネットワーク・システムを介して第2のユーザの耳に伝えられるとき、その信号は多数の装置によって処理される。例えば、無線通信ネットワークでは、元の音声信号が、第1のモバイル・ユニット、第1の基地局、ネットワーク・ハブ、第2の基地局、第2のモバイル・ユニット、その他の中間装置などによって処理されてはじめて、第2のユーザはその処理された音声信号を聞くことができる。
ネットワーク内の各装置、ならびに処理された音声信号を伝送する有線および/または無線のチャネルは、処理された音声信号を修正する可能性がある。修正の中には、望ましいものがある。例えば、様々なフィルタを使用して、処理された音声信号から不要ノイズを除去すること、処理された音声信号に快適ノイズを追加して不自然な無音を除去すること、処理された音声信号を圧縮して、送信されるデータの総量を削減することなどである。処理された音声信号の修正の中には、望ましくないものもある。例えば、処理された音声信号がネットワークを通過するとき、送信エラーが発生することがある。このエラーによって、処理された音声信号中にギャップや不要ノイズなどが生じる恐れがある。
ネットワーク・システムによって元の音声信号が処理されることによって、望ましいものか望ましくないものかにかかわらず、処理された音声信号の品質が低下する恐れがある。人間の知覚に基づく主観的技術を用いて、処理された音声信号の品質を評価することができる。例えば、ネットワーク・システムで元の音声サンプルのデータベースを処理し、処理された音声信号を一組の聴取者に提供し、その聴取者が処理された音声信号を1〜5のランクに基づいて評価することができる。しかし、主観的技術は時間がかかり費用もかかる。主観的テスト方法で費用がかかり、かつ/または時間がかかる状況には、例えば、音声データベースを収集すること、大きなリスニング・チームを募り、報酬を支払って音声品質についての統計的に有意な評価を得ること、防音室その他の設備を準備することなどが含まれる。
客観的方法を用いて、処理された音声信号の品質を評価することもできる。一般に侵入型(intrusive)の方法と呼ばれている、処理された音声の品質についての代表的な客観的評価法においては、元の音声信号がネットワーク・システムによって処理され、次いで元の音声のサンプルと処理された音声のサンプルの両方がコンピュータに提供される。次に、コンピュータは、元の音声信号と処理された音声信号とを比較して、処理された音声信号の品質を評価する。しかし、元の音声信号が使用できない場合は、処理された音声信号の品質を評価するために、従来からの侵入型の客観的方法を使用することはできない。失われた元の音声信号の代わりに、推定された元の音声信号を使用することもできるが、処理された音声信号の歪みが大きくなるほど、推定された元の音声信号の品質は低下する。
米国特許出願第10/186840号
1つまたは複数の上記問題についての有効な対策を提供すること。
本発明の一実施形態では、リアルタイムの客観的音声解析のための装置が提供される。この装置は音声品質アナライザを含む。音声品質アナライザは、少なくとも1つの第1の信号を受信し、受信した第1の信号に基づいて、音声品質についての少なくとも1つの非侵入型の(non−intrusive)評価を示す少なくとも1つの第2の信号を提供する。
本発明の他の実施形態では、リアルタイムの客観的音声解析のための方法が提供される。この方法は、少なくとも1つの処理された音声信号を示す少なくとも1つの第1の信号を受信する工程と、受信した少なくとも1つの第1の信号に基づき、その少なくとも1つの処理された音声信号の音声品質を非侵入型で決定する工程と、その少なくとも1つの処理された音声信号の決定された音声品質を示す少なくとも1つの第2の信号を提供する工程とを含む。
本発明は、以下の説明を添付の図面と併せて読むことによって理解できるはずである。図面中、類似の参照番号は類似の要素を示す。
本発明に関して、様々な修正形態および代替形態が実施可能であるが、本明細書では、例示として、本発明の特定の実施形態を図示し詳細に説明する。しかし、特定の実施形態についての本明細書の説明によって、本発明が、開示した特定の形態に限定されることを意図するものではなく、逆に、本発明が、添付の特許請求の範囲によって定義された本発明の趣旨および範囲に含まれるあらゆる修正形態、均等物、および代替実施形態を包含することを意図するものであることを理解されたい。
本発明の例示的な実施形態を以下に記す。説明を分かりやすくするために、この詳細な説明では、必ずしも実際の実装に関するあらゆる機能を説明している訳ではない。当然のことながら、実際の実施形態の開発にあたっては、例えばシステムに関する制約やビジネスに関する制約への適合など、実装ごとに異なる各開発者固有の目標を達成するために、各実装固有の多くの決定が必要になることが理解されよう。さらに、このような開発作業は、たとえ複雑で時間のかかる作業であったとしても、本開示の利益を享受する当業者にとっては、定型的な業務にすぎないことが理解されよう。
図1は、無線通信ネットワーク100の例示的実施形態を示す。本発明は、無線通信ネットワーク100の例示的実施形態に関して説明しているが、当業者であれば、本発明が図1に示されるような無線通信ネットワークに限定されるものではないことを理解されたい。代替実施形態では、POTS(一般電話システム)、VoIP(Voice over Internet Protocol)などを使用するインターネットベースのネットワークなど、他のネットワークの中で本発明を実施することができる。さらに、無線通信ネットワーク100の構造や動作については、一般に当業者にはよく知られているので、説明を分かりやすくするために、本明細書では、無線通信ネットワーク100の、本発明の理解に役立つ構造および動作に関する面だけを説明する。
無線通信ネットワーク100は、無線通信チャネル115を介して基地局110に信号を送信し、そこから信号を受信できる第1のモバイル・ユニット105を含む。基地局110は、ネットワーク120に通信で結合されている。様々な代替実施形態において、基地局110は、無線通信リンク、有線通信リンクなど、任意の望ましい方法によってネットワーク120と通信で結合することができる。ネットワーク120は、任意の望ましい方法で相互接続できるルータ、スイッチ、フィルタ、シグナル・プロセッサなどの装置を含むことができる。ネットワーク120は、少なくとも1つの基地局125とも通信で結合される。この基地局は、無線通信チャネル135を介して、モバイル・ユニット130に信号を送信し、かつ/またはそこから信号を受信することができる。
動作に際して、元の音声信号140がモバイル・ユニット105に提供される。例えば、第1のユーザは、モバイル・ユニット105に内蔵されたマイクロホン(図示せず)に話しかけることができる。モバイル・ユニット105は、元の音声信号140を処理して、処理された音声信号145を形成し、その音声信号が基地局110に送信される。処理された音声信号145は、基地局110から、ネットワーク120、基地局125、無線通信チャネル135、他の中間装置および/またはチャネルなどを経由してモバイル・ユニット130に送信することができる。次いで、モバイル・ユニット130は、処理された音声信号145に基づいて、第2のユーザに音響信号を提供することができる。
処理された音声信号145は、モバイル・ユニット105、130、基地局110、125、ネットワーク120、無線通信チャネル115、135、他の中間装置および/またはチャネルなどによって修正されることがある。その結果として、処理された音声信号145は元の音声信号140と異なっている可能性がある。一般に、元の音声信号140の修正は、処理された音声信号145の音声品質を低下させる傾向がある。例えば、処理された音声信号145は、元の音声信号140には存在しないスパイク・ノイズ150を含むことがある。ただし、処理された音声信号145の音声品質の低下が比較的小さいときには、人間の耳には容易に感知できないこともあり、したがって心配する必要がないこともある。
したがって、音声品質アナライザ155を提供することによって、処理された音声信号145の音声品質を非侵入型の音声品質評価技術を使用して評価する。当技術分野における一般的な使用に従って、「非侵入型(non−intrusive)」という用語は、本明細書では元々の音声信号を使用せずに実施できる音声品質評価技術を意味するものと理解される。図1に示した実施形態では、音声品質アナライザ155は、処理された音声信号145を示す信号を基地局125から受信し、受信した信号に基づいて、処理された音声信号145の音声品質を評価することができる。しかし、少なくとも一部には、この音声品質アナライザ155が非侵入型の音声品質評価技術を使用しているので、音声品質アナライザ155は、処理された音声信号145を示す信号を無線通信ネットワーク100の任意の部分から受信することができる。例えば、一実施形態では、音声品質アナライザ155は、処理された音声信号145を示す信号をネットワーク120の一部から受信することができる。
図1に示した例示的実施形態では、音声品質アナライザ155は、処理された音声信号145の経路の外部にある。しかし、本発明は、処理された音声信号145の経路の外部にある音声品質アナライザ155に限定されるものではない。代替実施形態では、実質的に音声品質アナライザ155は、処理された音声信号145の経路内に配置することができる。例えば、音声品質アナライザ155を基地局125とモバイル・ユニット130の間に直列に設置することができる。他の代替実施形態では、音声品質アナライザ155を無線通信ネットワーク100の任意の部分に並列に配置することもできる。さらに、非侵入型の技術を使用して2台以上の音声品質アナライザ155を配置することによって、無線通信ネットワーク100内の選択された場所における、処理された音声信号145の音声品質を評価することもできる。
一実施形態では、音声品質アナライザ155は、処理された音声信号145の、非侵入型で評価された音声品質に基づいて、基地局125にフィードバックを提供することができる。例えば、音声品質アナライザ155は、処理された音声信号145の音声品質がノイズ・スパイク150の存在によって低下したと判断し、処理された音声信号145中のノイズ・スパイク150の振幅を、フィルタ処理を適用して抑えるのが望ましいことを指示する信号を基地局125に提供することができる。しかし、当業者であれば、本発明がフィルタ処理の適用に限定されるものではなく、代替実施形態では、音声品質アナライザ155によって提供されるフィードバックに応答して、任意の望ましい装置が任意の望ましい信号処理技術を使用して、処理された音声信号145の望ましくない部分の影響を低減させることができることを理解されたい。
図2は、音声品質アナライザ155の例示的な実施形態を示す。音声品質アナラザ155は、図1に示した処理された音声信号145など、1つまたは複数の処理された音声信号を、1つまたは複数の入力ライン200(1〜n)を介して受信することができる。一実施形態では、入力ライン200(1〜n)はT1ラインであり、これらの各T1ラインは、例えばシスコ・メディア・ゲートウェイ(Cisco Media Gateway)MXGに結合されたOC3−T1コンバータなど、ゲートウェイ装置(図示せず)に結合されたコンバータから得ることができる。一般に、1本のT1ラインは、約24通話回線を通す。しかし、当業者であれば、入力ライン200(1〜n)はT1ラインに限定されるものではなく、代替実施形態では、任意の望ましい数の通話チャネルを通す、任意の望ましい種類のラインであってよいことを理解されたい。
入力ライン200(1〜n)は、処理された音声信号を、例えばPCMCIAインタフェースなどのインタフェース205に提供する。インタフェース205は、処理された音声信号を示す1つまたは複数の信号を、1つまたは複数のデジタル・シグナル・プロセッサ(DSP)210(1−m)に提供することができる。例示の実施形態では、デジタル・シグナル・プロセッサ210は、基板215上に配置された個別のチップ上に形成される。しかし、本発明は、単一の基板215上に配置された1つまたは複数のデジタル・シグナル・プロセッサ210(1〜m)に限定されるものではない。代替実施形態では、基板215が提供されないこともある。他の代替実施形態では、デジタル・シグナル・プロセッサ210(1〜m)を複数の基板215上に配置することもできる。
デジタル・シグナル・プロセッサ210(1〜m)は、処理された音声信号145の音声品質を評価するための非侵入型の方法を実装する。一実施形態では、デジタル・シグナル・プロセッサ210(1〜m)は、ANIQUE(Auditory Non−Intrusive Quality Estimation、非侵入型の聴覚品質評価)アルゴリズムを実装する。この聴覚調音解析技術(auditory−articulatory analysis technique)は、調音周波数範囲のパワーと非調音周波数範囲のパワーを比較して音声信号の音声品質を評価する。例えば、ANIQUEアルゴリズムは、約2〜12.5Hzの調音周波数範囲のパワーと約12.5Hzより上の非調音周波数範囲のパワーとを比較することによって、処理された音声信号の音声品質を評価する。非侵入型ANIQUEアルゴリズムの例示的実施形態は、例えばKimによる「Auditory−Articulatory Analysis for Speech Quality Assessment」と題する、2002年7月1日出願の米国特許出願第10/186840号に記載されており、この参照によりその全体を本明細書に組み込む。
ANIQUEアルゴリズムの複雑さは、選択可能モード・ボコーダからANIQUEアルゴリズムを実装するために使用されるCソース・コードまでにWMOPS(Weighted Million Operations Per Second)計算ルーチンを採用することによって評価できる。評価結果によれば、ANIQUEアルゴリズムは約217WMOPSの複雑さを有する。しかし、当業者であれば当然理解すべきことであるが、この評価はアルゴリズムの個々の実装に依存する。例えば、ANIQUEアルゴリズムの複雑さの評価は、高速フーリエ変換点のポイント数を4096から2048に削減すること、フィルタリング処理中に4要素同時乗算および累算演算を使用すること、ソース・コードを最適化することなどによって、122WMOPS以下に低減させることができる。
一実施形態では、音声品質アナライザ155は、16個のデジタル・シグナル・プロセッサ210(1〜m)を含む。各デジタル・シグナル・プロセッサ210(1〜m)に実装された非侵入型音声品質評価技術で約80MIPS(Million Instructions per Second)の演算速度が使用された場合、この数値はANIQUEアルゴリズムに関して上で論じた122WMOPSよりいくぶん低めの値ではあるが、音声品質アナライザ155のこの実装は、ほぼ64通話チャネルを同時に処理することができる。しかし、当業者であれば、音声品質アナライザ155によって同時に処理できる通話チャネル数についてのこの評価が例示的なものであり、本発明を制限することを意図したものでないことを理解されたい。
デジタル・シグナル・プロセッサ210(1〜m)は、処理された音声信号についての評価された音声品質を示す1つまたは複数の信号を、例えばPCMCIAインタフェースなどのインタフェース217に提供する。一実施形態では、インタフェース217は、処理された音声信号についての評価された音声品質を示す1つまたは複数の信号をコンピュータ220に提供することができる。例えば、インタフェース217は、信号をラップトップ・コンピュータ220に提供することができる。次いで、コンピュータ220は、音声品質アナライザ155によって解析された、1つまたは複数の通信チャネル上の処理された音声信号についての、評価された音声品質を示す情報を表示することができる。例えば、コンピュータ220は、グラフィカル・ユーザ・インタフェース225を使用してこの情報を表示することができる。
図3Aは、グラフィカル・ユーザ・インタフェース225の例示的一実施形態である。図示の実施形態では、グラフィカル・ユーザ・インタフェース225は、列300に通信チャネルを示す情報(例えば、チャネル番号など)を、列305に評価された音声品質を示す情報(例えば、1〜5の音声品質ランクなど)を、列310に処理された音声信号の時間および/または継続時間を示す情報(例えば、タイム・スタンプなど)を、また列320にユーザ起動ボタン315を表示する。ユーザ起動ボタン315を使用すると、ユーザが、処理された音声信号の波形の一部、例えば図3Bに示された例示的波形330を見ることを可能にすることができる。しかし、当業者であれば、本発明が図3Aに示された情報に限定されるものではなく、代替実施形態では、任意の所望の情報をグラフィカル・ユーザ・インタフェース225に表示できることを理解されよう。
図2に戻って、上記のように、音声品質アナライザ155は、音声品質の非侵入型の評価に基づいてフィードバックを提供することができる。したがって、一実施形態では、コンピュータ220は無線通信ネットワーク100に通信で結ばれており、処理された音声信号に適用できる修正を示す信号を提供することができる。この信号は、無線通信ネットワーク100内の1つまたは複数の装置に提供することが可能で、その信号を使用して、各装置が、処理された音声信号を修正することができる。あるいは、コンピュータ220が、処理された音声信号を修正することもできる。例えば、コンピュータ220は、ユーザが、処理された音声信号に対する様々な音声編集ツールを選択し、かつ/または利用することを可能にすることができる。音声編集ツールは、例えば時間および/または周波数フィルタリング、圧縮、補間、フェージング、正規化、エンベローピング(enveloping)などを含むことができる。
上記の音声品質アナライザ155は、1つまたは複数の処理された音声信号の音声品質を非侵入型で、すなわち元の音声信号を使用せずに評価できるので、この音声品質アナライザ155は、稼動中のネットワークや元の音声信号を使用することができない他のシステムの音声品質を評価するために使用することができる。さらに、音声品質アナライザ155は、所定のテスト信号を用いて駆動する必要がなく、また音声品質を客観的に評価できるので、この音声品質アナライザ155は、従来の主観的方法と比べて、ネットワークの音声品質を評価するための時間とコストを削減することができる。
上で開示した特定の実施形態は、単に例示のために示したものである。したがって、本発明は、本明細書の教示の利益を有する当業者には明らかな、異なってはいても均等な方法で修正し実施することができる。さらに、本明細書に示した詳細な構造または設計は、添付の特許請求の範囲に記載した以外の制限を意図するものではない。したがって、上で開示した特定の実施形態を改変または修正できることは明らかであり、そのような変形形態はすべて本発明の範囲および趣旨に含まれるものと見なされる。したがって、本明細書が求める保護は、添付の特許請求の範囲に記載されている。
本発明の一実施形態による、音声品質アナライザを含む通信ネットワークを示す図である。 本発明の一実施形態による、音声品質アナライザ、例えば図1に示した音声品質アナライザの例示的一実施形態を示す図である。 本発明の一実施形態による、図2に示した音声品質アナライザが提供する情報を表示するために使用できるグラフィカル・ユーザ・インタフェースの例示的一実施形態を示す図である。 本発明の一実施形態による、図3Aに示したグラフィカル・ユーザ・インタフェースを使用して見ることができる、処理された音声信号の波形の例示的一部分を示す図である。

Claims (10)

  1. 少なくとも1つの第1の信号を受信し、前記少なくとも1つの第1の信号に基づき、音声品質についての少なくとも1つの非侵入型の評価を示す少なくとも1つの第2の信号を提供する音声品質アナライザを含む装置。
  2. 前記少なくとも1つの第1の信号が、少なくとも1つの処理された音声信号を含む、請求項1に記載の装置。
  3. 前記少なくとも1つの処理された音声信号を受信し、前記少なくとも1つの処理された音声信号に基づく前記少なくとも1つの第1の信号を提供する第1のインタフェースと、
    前記少なくとも1つの第2の信号を受信し、前記少なくとも1つの第2の信号に基づく少なくとも1つの第3の信号を提供する第2のインタフェースであって、前記第2のインタフェースが前記少なくとも1つの第3の信号をコンピュータに提供できるインタフェースと
    を含む、請求項2に記載の装置。
  4. 前記コンピュータが、
    前記少なくとも1つの第1の信号の前記音声品質についての前記少なくとも1つの非侵入型の評価を示す情報を表示し、かつ
    前記評価された音声品質に基づき、前記処理された音声信号に対する少なくとも1つの修正を決定する
    ように構成された、請求項3に記載の装置。
  5. 前記音声品質アナライザが少なくとも1つのデジタル信号処理回路を含み、前記デジタル信号処理回路が、少なくとも1つの第1の信号を受信すると共に、前記少なくとも1つの第1の信号に基づき、少なくとも1つの処理された音声信号の少なくとも1つの音声品質を評価するように構成された、請求項1に記載の装置。
  6. 前記音声品質アナライザが非侵入型の聴覚調音解析技術を実装する、請求項1に記載の装置。
  7. 少なくとも1つの処理された音声信号を示す少なくとも1つの第1の信号を受信する工程と、
    前記少なくとも1つの第1の信号に基づき、前記少なくとも1つの処理された音声信号の音声品質を非侵入型で決定する工程と、
    前記少なくとも1つの処理された音声信号の前記音声品質を示す少なくとも1つの第2の信号を提供する工程と
    を含む方法。
  8. 通信チャネル、前記評価された音声品質、前記処理された音声信号に関する時間、および前記処理された音声信号の継続時間のうちの少なくとも1つを示す情報を表示する工程を含む、請求項7に記載の方法。
  9. 前記決定された音声品質に基づき、前記処理された音声信号に対する少なくとも1つの修正を決定する工程を含む、請求項7に記載の方法。
  10. 前記音声品質を非侵入型で決定する工程が、前記処理された音声信号の調音周波数範囲のパワーと前記処理された音声信号の非調音周波数範囲のパワーとを比較する工程を含む非侵入型の聴覚調音解析技術を使用して前記音声品質を決定することを含む、請求項7に記載の方法。
JP2005108161A 2004-04-05 2005-04-05 リアルタイムの客観的音声アナライザ Pending JP2005292841A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US10/818,435 US20050228655A1 (en) 2004-04-05 2004-04-05 Real-time objective voice analyzer

Publications (1)

Publication Number Publication Date
JP2005292841A true JP2005292841A (ja) 2005-10-20

Family

ID=34912686

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005108161A Pending JP2005292841A (ja) 2004-04-05 2005-04-05 リアルタイムの客観的音声アナライザ

Country Status (5)

Country Link
US (1) US20050228655A1 (ja)
EP (1) EP1585111A1 (ja)
JP (1) JP2005292841A (ja)
KR (1) KR20060045423A (ja)
CN (1) CN1681004A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9729602B2 (en) 2011-01-11 2017-08-08 Inha-Industry Partnership Institute Audio signal quality measurement in mobile device

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0707343B1 (pt) * 2006-01-31 2020-09-08 Telefonaktiebolaget Lm Ericsson (Publ) Método e aparelho de avaliação de qualidade de sinal não intrusivo
JP2013153414A (ja) * 2011-12-28 2013-08-08 Ricoh Co Ltd コミュニケーション端末装置、コミュニケーションシステム、コミュニケーション通信状態表示方法及びプログラム
JP2016038513A (ja) * 2014-08-08 2016-03-22 富士通株式会社 音声切替装置、音声切替方法及び音声切替用コンピュータプログラム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5103467A (en) * 1989-10-31 1992-04-07 Motorola, Inc. Asynchronous voice reconstruction for a digital communication system
GB9213459D0 (en) * 1992-06-24 1992-08-05 British Telecomm Characterisation of communications systems using a speech-like test stimulus
US6446038B1 (en) * 1996-04-01 2002-09-03 Qwest Communications International, Inc. Method and system for objectively evaluating speech
US5809472A (en) * 1996-04-03 1998-09-15 Command Audio Corporation Digital audio data transmission system based on the information content of an audio signal
US6304865B1 (en) * 1998-10-27 2001-10-16 Dell U.S.A., L.P. Audio diagnostic system and method using frequency spectrum and neural network
EP1187100A1 (en) * 2000-09-06 2002-03-13 Koninklijke KPN N.V. A method and a device for objective speech quality assessment without reference signal
FR2817096B1 (fr) * 2000-11-23 2003-02-28 France Telecom Procede et systeme de detection non intrusive des defauts d'un signal de parole transmis en telephonie sur reseau de transmission par paquets
WO2002065456A1 (en) * 2001-02-09 2002-08-22 Genista Corporation System and method for voice quality of service measurement
EP1244094A1 (de) * 2001-03-20 2002-09-25 Swissqual AG Verfahren und Vorrichtung zur Bestimmung eines Qualitätsmasses eines Audiosignals
US6975330B1 (en) * 2001-08-08 2005-12-13 Sprint Communications Company L.P. Graphic display of network performance information
US7165025B2 (en) * 2002-07-01 2007-01-16 Lucent Technologies Inc. Auditory-articulatory analysis for speech quality assessment
US7274670B2 (en) * 2002-09-27 2007-09-25 Netiq Corporation Methods, systems and computer program products for assessing network quality
EP1661377A1 (en) * 2003-08-28 2006-05-31 Koninklijke KPN N.V. Measuring a talking quality of a communication link in a network
GB2407952B (en) * 2003-11-07 2006-11-29 Psytechnics Ltd Quality assessment tool

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9729602B2 (en) 2011-01-11 2017-08-08 Inha-Industry Partnership Institute Audio signal quality measurement in mobile device

Also Published As

Publication number Publication date
CN1681004A (zh) 2005-10-12
KR20060045423A (ko) 2006-05-17
US20050228655A1 (en) 2005-10-13
EP1585111A1 (en) 2005-10-12

Similar Documents

Publication Publication Date Title
US8305913B2 (en) Method and apparatus for non-intrusive single-ended voice quality assessment in VoIP
US7729275B2 (en) Method and apparatus for non-intrusive single-ended voice quality assessment in VoIP
Arehart et al. Effects of noise and distortion on speech quality judgments in normal-hearing and hearing-impaired listeners
Počta et al. Subjective and objective assessment of perceived audio quality of current digital audio broadcasting systems and web-casting applications
Thorpe et al. Performance of current perceptual objective speech quality measures
JP2009050013A (ja) エコー検出および監視
CN108933856B (zh) 用于声学暴露管理的动态时间加权系统和方法
US11488616B2 (en) Real-time assessment of call quality
US20060069551A1 (en) Operating method for voice activity detection/silence suppression system
US8737571B1 (en) Methods and apparatus providing call quality testing
JP4551215B2 (ja) 音声の聴覚明瞭度分析を実施する方法
CN103282960B (zh) 声音控制装置、声音控制方法以及声音控制程序
Huber et al. Predicting the perceived sound quality of frequency-compressed speech
CN101336431A (zh) 检测语音可识别度及在噪音和回响空间改善语音公告系统可识别度的系统和方法
Fuglsig et al. Minimum processing near-end listening enhancement
JP4113481B2 (ja) 音声品質客観評価装置および音声品質客観評価方法
JP2005292841A (ja) リアルタイムの客観的音声アナライザ
Moeller et al. Objective estimation of speech quality for communication systems
Shimizu et al. Study on acoustic improvements by sound-absorbing panels and acoustical quality assessment of teleconference systems
Dantas et al. Comparing network performance of mobile voip solutions
Côté et al. Speech communication
US20090161882A1 (en) Method of Measuring an Audio Signal Perceived Quality Degraded by a Noise Presence
US20100070266A1 (en) Performance metrics for telephone-intensive personnel
Gierlich et al. Advanced speech quality testing of modern telecommunication equipment: An overview
Wu et al. Using a signal cancellation technique involving impulse response to assess directivity of hearing aids