JP4500458B2 - 音声及びオーディオ信号用リアルタイム品質アナライザ - Google Patents

音声及びオーディオ信号用リアルタイム品質アナライザ Download PDF

Info

Publication number
JP4500458B2
JP4500458B2 JP2000620620A JP2000620620A JP4500458B2 JP 4500458 B2 JP4500458 B2 JP 4500458B2 JP 2000620620 A JP2000620620 A JP 2000620620A JP 2000620620 A JP2000620620 A JP 2000620620A JP 4500458 B2 JP4500458 B2 JP 4500458B2
Authority
JP
Japan
Prior art keywords
test signal
signal
audio test
received
aqa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000620620A
Other languages
English (en)
Other versions
JP2003500701A (ja
Inventor
アトキンソン・イアン・アンドルー
リー・マーティン
マー・ウェイ
ホマユンファー・カンビズ
Original Assignee
アルゴレックス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルゴレックス インコーポレイテッド filed Critical アルゴレックス インコーポレイテッド
Publication of JP2003500701A publication Critical patent/JP2003500701A/ja
Application granted granted Critical
Publication of JP4500458B2 publication Critical patent/JP4500458B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Description

【0001】
【発明の属する技術分野】
本発明は試験しようとする音声装置に対する品質測定を実現するための方法および装置に関し、詳細には音声装置により受信される音声またはオーディオ信号のリアルタイム客観知覚品質測定を実現するための方法および装置に関する。
【0002】
【従来の技術】
音声の品質評価はスピーチシステム、特に圧縮や符号化を伴うシステムにとって困難な作業であるが、それは通常の波形及びスペクトラム類似基準(similarity criterion)が、受信した音声信号の感覚品質と特にうまく相関しないためである。以前は、電気通信システムの音声品質評価は、事前に準備された音声材料を用いて、注意深く調整された環境において実行される正規な感覚試聴試験(formal perceptual listening test)によりオフラインで測定されていた。このやり方は有効ではあるが、コストがかかり、時間もかかっていた。さらにその試験から得られる結果は、個々の被験者及びその環境に依存する。その結果、その試験から得られる知見は、常に再現可能または一定しているとは限らない。
【0003】
心理音響学の分野の最近の研究により、人間が如何に音声及び音を知覚するかということに関してより理解が深まった。臨界帯域理論(critical band theory)、聴覚マスキング(auditory masking)及び知覚ラウドネス(perceptual loudness)のようなこの分野のいくつかの知見を適用することにより、現在、規定された主観試聴試験の結果と概ね一致する「客観」スピーチ測定を開発することが可能である。例えば国際電気通信連合(ITU)等の種々の機関が、コンピュータに格納されたファイルを用いてオフラインの音声品質を測定するためのアルゴリズムを開発している。現存の客観測定アルゴリズムの例としては、知覚スピーチ品質測定(Perceptual Speech Quality Measure:PSQM)、測定正規化ブロック(Measuring Normalizing Blocks:MNB)、知覚解析測定システム(Perceptual Analysis Measurement System:PAMS)、および修正バークスペクトル歪み(Modified Bark Spectral Distortion:MBSD)測定がある。後者の測定は例えば、人間聴覚受信を反射する帯域に周波数を分割する。
【0004】
既存の客観知覚品質測定システムは、音声品質の測定をオフラインで、すなわち格納された受信音声データから行う必要がある。そのような客観知覚品質測定が、評価装置においてリアルタイム、或いは概ねリアルタイムに行われることが望ましい。
【0005】
【発明が解決しようとする課題】
音声の客観品質評価をリアルタイム或いは概ねリアルタイムに実行できるオーディオ品質アナライザ及びその評価方法を提供する。
【0006】
【課題を解決するための手段】
一態様では本発明は、オーディオ信号のリアルタイム知覚品質測定を実現するための方法である。オーディオ試験信号を含む品質試験信号は、試験しようとする装置に受信される。オーディオ信号の事前記憶表現の再生信号が、例えば品質試験信号のヘッダ内の同期パルスを用いて、受信したオーディオ試験信号に概ね同期される。その後、例えば受信したオーディオ試験信号のウインドウ化部分の信号とオーディオ試験信号の事前記憶表現のウインドウ化部分の信号とを比較し、比較の結果によりオーディオ試験信号の事前記憶表現のウインドウ化部分を調整することにより、その再生信号は受信したオーディオ信号に正確に同期される。その後受信したオーディオ試験信号のウインドウが、オーディオ試験信号の事前記憶表現の正確に同期した再生信号の一部と比較され、受信したオーディオ試験信号の品質測定値を出力する。
【0007】
別の態様では、本発明は、試験しようとする装置により受信される品質試験信号の品質を評価するためのオーディオ品質アナライザ(AQA)を備えており、品質試験信号がオーディオ試験信号を含んでいる。AQAは、オーディオ試験信号の事前記憶表現の再生信号を受信したオーディオ試験信号に概ね同期し、オーディオ試験信号の事前記憶表現の再生信号を受信したオーディオ試験信号に正確に同期し、さらに受信したオーディオ試験信号のウインドウを、オーディオ試験信号の事前記憶表現の正確に同期した再生信号の一部と比較し、受信したオーディオ試験信号の品質測定値を出力するように構成される。
【0008】
従って本発明は、評価装置においてリアルタイム或いは概ねリアルタイムにオーディオ及び音声信号の客観知覚品質測定を実現することが理解されよう。
【0009】
【発明の実施の形態】
図1は、試験しようとする音声装置(VEUT)12により出力される音声信号を受信する音声品質アナライザ(VQA)10のブロック図である。VQA10は、VEUT12から受信される音声試験信号の品質測定値を生成する品質評価部14を備える。またVQA10は、DTMF(dual tone multiple frequency)信号検出部18及びシーケンサ20を順に備えるヘッダ検出部16も備える。DTMF検出部18はVEUT12から受信される信号を監視し、受信した信号のシグナリングトーンの存在を検出及びデコードする。デコードされた信号はシーケンサ20を用いて、音声文生成部22の動作を制御する。
【0010】
音声試験信号の事前記憶表現は、音声文生成部22に格納される。そのような「文」は、必ずしも任意の特定の言語の完全な文及び言葉を表わさなくてもよく、また任意の特定の人間によるスピーチを表す必要もない。むしろその表現は、品質評価部14により実行される音声品質測定を容易にするために選択される。音声試験信号に先行するヘッダ信号が受信される際に、シーケンサ20が、ヘッダにおいて識別される特定の音声試験信号により、音声文生成部22からの特定の事前記憶音声試験信号表現の再生を開始する。品質評価部14を用いて、客観知覚品質比較を実行するだけの十分な、音声試験信号の事前記憶表現と受信した音声試験信号との間の同期を達成するために、正確な同期検出部24が備えられる。音声品質測定は客観知覚品質測定アルゴリズムを適用し、正確な同期検出部24からの同期したローカルに生成した基準信号の一部を、VEUT12から受信した信号のウインドウ化部分と比較することにより実行される。一実施例では、以下のアルゴリズムの1つが用いられているが、それらは知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、知覚解析測定システム(PAMS)、および修正バーク(modified bark)スペクトル歪み(MBSD)測定である。別の実施例では、複数の異なるアルゴリズムが利用可能であり、アルゴリズム選択が手動で行われる。別の実施例(図示せず)では、複数の異なるアルゴリズムが利用可能であり、音声文生成部22のいずれの事前記憶表現がシーケンサ20により選択されたかによって、選択が行われる。
【0011】
一実施例では図2を参照すると、品質試験メッセージ30の一例が示される。品質試験メッセージ30は、4つのセクション32、34、36、38を備え、その内の32、34、36の3つがDTMFシグナリングを用いて送信されるヘッダ40を備え、第4のセクションが音声試験メッセージ38を含む。ユニークワード32を用いて、新規の品質試験メッセージ30の開始を知らせる。ユニークワード32は、あるチャネル劣化期間中、例えばセルラー網からVEUT12が雑音を含む信号を受信する間に、測定開始信号が誤るのを防ぐために含まれる。音声文ID34は音声試験メッセージ38の索引番号或いは識別子を含み、それにより異なる試験メッセージがVEUT12に送信され、VQA10により識別されるようにする。同期パルス36は、音声試験信号38の開始を知らせるために用いられる短いDTMFパルスである。同期パルス36はシーケンサ20により用いられ、VEUT12により受信される信号との比較のために、適当な事前記憶音声試験信号表現を送出する音声文生成部22の動作を開始する。他の実施例では、ヘッダ40は別の状態、例えば帯域内シグナリングの別形態、或いは帯域外シグナリングを用いて送信される。これらの他の実施例では、DTMF検出部18以外の手段を用いて、ヘッダ40を検出し、ヘッダ40に対応する。適当な帯域内シグナリングの例は、モノトーンシグナリング或いは電話データプロトコルを含む。適当な帯域外シグナリングの例は、個別ページングチャネル上でのシグナリングである。
【0012】
一実施例では図3を参照すると、シーケンサ20はユニークワード検出部42、音声文ID検出部44及び粗い同期検出部46を備え、図1のDTMF検出部18の機能を含む。それゆえ個別のDTMF検出部18は図3には示されない。ユニークワード32がユニークワード検出部42により認識されるとき、その結果受信したデータは、音声文ID検出部44に渡される。音声文ID検出部44はユニークワードに後続して受信される音声文ID34を検出する。音声文ID34が識別された場合、それは音声文生成部22に渡され、音声文ID34により識別された音声試験信号に対応する音声試験信号の適当な事前記憶表現を出力し、その結果受信したデータは粗い同期検出部46に渡される。粗い同期検出部46は、同期パルス36を検出するが、一実施例では短いDTMFパルスとして符号化される。粗い同期検出部46からの粗い同期信号が受信された場合、音声文生成部22が、判定された音声文ID34に相当する音声信号の事前記憶表現の再生を開始する。
【0013】
一実施例では、同期パルス36によりもたらされる粗い同期では十分ではなく、信号比較部14が音声試験信号38を音声信号の事前記憶表現とリアルタイムに比較できない、すなわちユーザに知覚されるような明らかな遅延がほとんど或いは全くなく、音声試験信号38の受信中に信号比較部14により品質評価が実行されない。一実施例では、粗い同期は、知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、知覚解析測定システム(PAMS)、および修正バークスペクトル歪み(MBSD)測定アルゴリズムを用いて音声試験信号38を解析するためには不十分である。それゆえ、正確な同期検出部24が、より正確に同期をとるために設けられる。正確な同期検出部24は、音声文生成部22の出力を、同期ウインドウ化モジュール52により選択される音声データのウインドウと比較する。一実施例ではこの比較は、国際電気通信連合(ITU)標準P.931「マルチメディア通信遅延、同期及びフレーム速度測定」により実行される。この比較の結果として、正確な同期検出部24の出力はスイッチ54を制御するために生成され、スイッチ54は正確な同期が達成される際に閉じる。スイッチ54により、品質評価が、正確な同期が達成される前に出力されるのを防ぐ。さらに、音声試験信号の事前記憶表現の同期した部分を表すデータウインドウは、選択ウインドウ化モジュール56への出力である。選択ウインドウ化モジュール56は、入力音声試験データ58の同期した部分を選択し、事前記憶表現60の同期した部分と比較する。比較は知覚比較部14により実行され、品質評価値が生成される。品質評価値は、上記したようにスイッチ54が閉じる際に出力される。
【0014】
図4は、本発明の一実施例における同期ウインドウモジュール52及び選択ウインドウ化モジュール56のウインドウ化動作の図である。同期ウインドウ62は、同期ウインドウモジュール52によりバッファ48から選択される。同期ウインドウ62及び選択ウインドウ化モジュール56から選択される選択ウインドウ64が位置合わせされる。バッファ48は、デジタル化された音声入力を受け取る循環バッファである。同期ウインドウ62の位置は、図3に示されるように、知覚比較部14により行われる品質測定により調整される。選択ウインドウ64と同期ウインドウ62との位置合わせは、本実施例では、音声文生成部22から出力されるウインドウ化データの選択とともに、正確同期検出部24により成し遂げられる。
【0015】
図3に示される実施例では、選択ウインドウ化モジュール52は、重み付けのために、少なくとも1つの受信した音声データ及び音声試験信号の事前記憶表現に窓関数の適用も行う。一実施例では、図5に示されるような方形重み付け、図6にその一例が示される非線形強調重み付け及び図7にその一例が示される断続方形重み付けを含む複数の重み付け関数が与えられる。重み付け関数の選択は、品質アルゴリズムの選択により予め選択される。また選択は、知覚比較部14からの品質測定により、図3に示されるように適応的に変更可能である。例えば断続方形重み付けは、セルラーシステムにおけるハンドオフのような外乱が音声信号データの受信を妨害する際に用いられる。この場合に一実施例では、知覚比較部14により用いられるアルゴリズムは、品質評価から妨害を受けた期間を除去する。一実施例では障害期間の発生及びその長さは、品質測定とは別に報告される。
【0016】
本発明による試験構成の実施例が図8に示される。VQA10における多くの或いは全ての機能構成要素は、設計上の選択としてコンピュータのソフトウエア或いはファームウエアにおいて実装される。従ってVQA10は図8ではコンピュータとして示される。VQA10はVEUT12の出力ポートに接続され、一実施例では「ハンズフリーポート」を備えるセルラー電話12である。このようにセルラー電話により受信された品質試験メッセージ30は、解析を行うためにVQA10に送信される。セルラー電話12は、例えばセルラー無線網のようなネットワーク68を介してメッセージ源66から品質試験メッセージ30を受信する。一実施例では、メッセージ源66はボイスメールボックスに格納される録音された品質試験メッセージ30を有する応答装置として構成される。ボイスメールボックス内の録音された品質試験メッセージ30は、音声文ID34と識別される。メッセージ源66に格納された音声試験信号38は、VQA10の音声文生成部22における音声試験メッセージの対応する事前記憶表現を識別する音声文ID34と識別される。
【0017】
一実施例では図9を参照すると、VEUT12は、ネットワーク68を介してメッセージ源66にダイアルし(100)、そこからのボイスメールメッセージを回収する(102)。回収されたボイスメールメッセージは品質試験メッセージ30である。そのVQA10はユニークワード32が認識されるまで(106)待機する(104)。次に音声文ID34が得られる(108)。その後VQA10は、同期パルス36が受信されるまで(112)待機する(100)。同期パルス36が受信されるとき、音声試験信号38のローカルな複製が、例えば音声文生成部22から回収される(114)。その後音声試験信号38のローカルな複製の正確な同期が行われ(116)、音声試験信号38が終了したことが判定される(120)まで音声品質測定値が計算される(118)。音声試験信号38が終了したとき、計算された品質が表示され(122)、試験が終了する(124)。他の実施例では、品質試験は手動或いは自動で繰り返されてもよい。
【0018】
ここで記載される本発明は、音声信号のリアルタイム知覚品質測定を提供することは当業者には理解されよう。本発明は特に、以前には信号のリアルタイム測定に適していることが知られていなかったアルゴリズムを用いてそのような測定を実行するのに適している。また本発明は特に、非常に圧縮された音声信号が送信される際にリアルタイム知覚品質測定を実現するのにも適している。ここで記載される実施例は音声信号の品質測定に適用することができるが、本発明は同様に非音声オーディオ試験信号の品質測定にも適していることは理解されよう。これらの実施例では、こうして音声品質アナライザ10は、より一般的にはオーディオ品質アナライザ(AQA)であり、音声試験信号38はオーディオ試験信号であり、音声文生成部22はオーディオ波形生成部(デジタル化波形生成部のような)であり、オーディオ波形生成部の音声試験信号の事前記憶表現は、オーディオ試験信号の事前記憶表現である。
【0019】
多くの他の変更例が本発明の精神の範囲内で実現可能であることは当業者には明らかであろう。それゆえ本発明の範囲は、添付の請求の範囲及びその等価内容を参照して確定されるべきである。
【0020】
【発明の効果】
上記のように本発明により、音声の客観品質評価をリアルタイム或いは概ねリアルタイムに実行できるオーディオ品質アナライザ及びその評価方法を提供することができる。
【図面の簡単な説明】
【図1】 本発明による音声品質アナライザの一実施例のブロック図である。
【図2】 品質試験メッセージフレームの図である。
【図3】 本発明による音声品質アナライザの別の実施例の図である。
【図4】 本発明による同期ウインドウ形成及び選択ウインドウ形成を行うバッファの一実施例のブロック図である。
【図5】 方形窓関数形状を表す図である。
【図6】 非線形強調窓関数形状を表す図である。
【図7】 断続方形窓関数を表す図である。
【図8】 本発明による試験構成のブロック図である。
【図9】 本発明による試験方法の一実施例の流れ図である。
【符号の説明】
10 音声品質アナライザ 12 音声装置
14 品質評価部 16 ヘッダ検出部
18 DTMF信号検出部 20 シーケンサ
22 音声文生成部 24 正確な同期部
30 品質試験メッセージ 32 ユニークワード
34 音声文ID 36 同期パルス
38 音声試験信号 40 ヘッダ
42 ユニークワード検出部 44 音声文検出部
46 粗い同期検出部 48 バッファ
50 A/D 52 同期ウインドウ化モジュール
54 スイッチ 56 選択ウインドウ化モジュール
58 入力音声試験データ 60 事前記憶表現
62 同期ウインドウ 64 選択ウインドウ
66 メッセージ源 68 ネットワーク
100 遠隔メールボックスにダイアル
102 ボイスメッセージ回収 104 ユニークワード待ち
106 ユニークワード取得? 108 音声文ID取得
110 同期パルス待ち 112 同期パルス取得?
114 文のローカルな複製回収
116 正確な同期
118 音声品質測定値計算 120 試験信号終了?
122 品質表示 124 試験終了

Claims (32)

  1. オーディオ信号のリアルタイムで知覚品質測定を実現するための方法であって、
    オーディオ試験信号を含む、品質試験信号を受信する過程と前記品質試験信号はヘッダー信号を備えており、
    予め記憶されている前記オーディオ試験信号の表現の再生信号を、前記受信したオーディオ試験信号に、そのヘッダー信号により粗く同期を取る過程と、
    予め記憶されている前記オーディオ試験信号の表現の再生信号を、前記受信したオーディオ試験信号に、正確に同期を取る過程と、
    前記受信したオーディオ試験信号のウインドウを、前記正確に同期した、予め記憶されている前記オーディオ試験信号の表現の再生信号の一部分と比較して、
    前記受信したオーディオ試験信号と品質の測定値を出力する過程とを有することを特徴とする方法。
  2. 前記品質試験信号が同期パルスを含むヘッダー信号を備え、
    前記予め記憶されている前記オーディオ試験信号の表現の再生信号を、前記受信したオーディオ試験信号に、粗く同期を取る過程は、前記同期パルスを用いて行うことを特徴とする請求項1に記載の方法
  3. 予め記憶されている前記オーディオ試験信号の表現の再生信号を、前記受信したオーディオ試験信号に、正確に同期を取る過程が、
    前記受信したオーディオ試験信号のウインドウ化部分のデータと前記予め記憶されているオーディオ試験信号の表現のウインドウ化部分のデータを比較する過程と、
    前記比較の結果により、前記受信したオーディオ試験信号の前記ウインドウ化部分と前記予め記憶されているオーディオ試験信号の表現のウインドウ化部分との位置合わせを調整する過程を有することを特徴とする請求項2に記載の方法。
  4. 前記ヘッダー信号を帯域外で受信する過程をさらに有することを特徴とする請求項3に記載の方法。
  5. 前記ヘッダー信号を帯域内で受信する過程をさらに有することを特徴とする請求項3に記載の方法。
  6. 前記ヘッダー信号を受信する前記過程が、DTMFトーンを受信する過程を有し、前記前記予め記憶されている前記オーディオ試験信号の表現の再生信号を粗く同期をとる過程が、前記オーディオ試験信号の前記予め記憶されている前記オーディオ試験信号の表現の再生信号をDTMFパルスと同期をとる過程を有することを特徴とする請求項5に記載の方法。
  7. 前記オーディオ信号が音声試験信号であり、前記オーディオ試験信号の前記予め記憶されている表現が前記音声試験信号の予め記憶されている表現であることを特徴とする請求項3に記載の方法。
  8. 前記受信した音声試験信号を識別する音声文IDを受信する過程と、
    前記受信した音声文IDにより、複数の予め記憶されている表現から前記音声試験信号の予め記憶された表現を選択する過程をさらに有することを特徴とする請求項7に記載の方法。
  9. 前記受信した音声信号を識別する音声文IDを受信する過程が、前記受信した音声信号を識別するDTMFトーンを受信する過程を有することを特徴とする請求項8に記載の方法。
  10. 前記オーディオ試験信号のウインドウを、前記予め記憶されている前記オーディオ試験信号の表現の正確に同期した再生信号の一部と比較し、前記受信したオーディオ試験信号の品質測定値を出力する過程が、ITU P.861知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、修正バークスペクトル歪み(MBSD)測定、及び知覚解析測定システム(PAMS)からなる品質測定群から選択される少なくとも1つの品質測定アルゴリズムにより品質測定値を生成する過程を有することを特徴とする請求項3に記載の方法。
  11. 前記ヘッダー信号における音声文IDを受信する過程と、前記受信した音声文IDにより前記品質測定値を生成するために品質測定アルゴリズムを選択する過程とをさらに有することを特徴とする請求項10に記載の方法。
  12. 前記ヘッダー信号において送信されたユニークワードを受信する過程と、
    前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニークワードが受信されたことを照合する過程をさらに有することを特徴とする請求項3に記載の方法。
  13. ユニークワードを受信する過程が、ユニークワードを表すDTMF信号を受信する過程を有することを特徴とする請求項12に記載の方法。
  14. 前記品質測定値を生成するために前記ウインドウ化部分を比較する過程に先行して、前記受信したオーディオ試験信号の少なくとも1つのウインドウと前記オーディオ試験信号の前記正確に同期した予め記憶されている表現のウインドウとに窓関数を適用する過程をさらに有することを特徴とする請求項1に記載の方法。
  15. 窓関数を適用する過程が、窓関数を事前に選択する過程を特徴とする請求項14に記載の方法。
  16. 窓関数を適用する過程が、窓関数を適応時に選択する過程を特徴とする請求項14に記載の方法。
  17. 試験中の装置により受信される品質試験信号の品質を評価するためのオーディオ品質アナライザー(AQA)であって、前記品質試験信号がオーディオ試験信号を有し、前記AQAが、
    前記オーディオ試験信号の予め記憶されている表現の再生信号を、受信したオーディオ試験信号に、試験信号のヘッダーに備えたヘッダー信号により粗く同期し、
    前記オーディオ試験信号の、予め記憶された表現(事前記憶表現)の再生信号を前記受信したオーディオ試験信号に正確に同期し、
    前記受信したオーディオ試験信号のウインドウを、前記オーディオ試験信号の予め記憶されている表現の、前記正確な同期した再生信号の一部と比較し、前記受信したオーディオ試験信号の品質測定値を出力されるように構成されることを特徴とするオーディオ品質アナライザー。
  18. 前記試験信号のヘッダー信号は同期パルスを備え、前記AQAが、前記同期パルスを用いて、前記オーディオ試験信号の前記予め記憶されている表現の再生信号を、前記受信したオーディオ試験信号に粗く同期するように構成されるように構成されることを特徴とする請求項17に記載のAQA。
  19. 前記AQAが、
    前記受信したオーディオ試験信号のウインドウ化部分のデータと前記オーディオ試験信号の前記予め記憶されている表現のウインドウ化部分のデータを比較し、
    前記比較の結果により、前記受信したオーディオ試験信号のウインドウ化部分と前記オーディオ試験信号の前記予め記憶されている表現のウインドウ化部分の位置合わせを調整するように構成されることを特徴とする請求項18に記載のAQA。
  20. 前記ヘッダー信号を帯域外で受信するようにさらに構成されることを特徴とする請求項19に記載のAQA。
  21. 前記ヘッダー信号を帯域内で受信するようにさらに構成されることを特徴とする請求項19に記載のAQA。
  22. 前記ヘッダー信号としてDTMF信号を受信し、かつ前記オーディオ試験信号の前記予め記憶されている表現の再生信号をDTMFパルスと粗く同期をとるようにさらに構成されていることを特徴とする請求項21に記載のAQA。
  23. 前記オーディオ試験信号が音声試験信号であり、前記オーディオ試験信号の前記予め記憶された表現が、音声試験信号の予め記憶された表現であることを特徴とする請求項19に記載のAQA。
  24. 前記受信した音声試験信号を識別する音声文IDを受信し、前記受信した音声文IDにより、複数の事前記憶表現から前記音声試験信号の前記事前記憶表現を選択するようにさらに構成されることを特徴とする請求項23に記載のAQA。
  25. 前記音声文IDとして、DTMF信号を受信するようにさらに構成されることを特徴とする請求項24に記載のAQA。
  26. ITU P.861知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、修正バークスペクトル歪み(MBSD)測定及び知覚解析測定システム(PAMS)からなる品質測定アルゴリズム群から選択される少なくとも1つの品質測定アルゴリズムにより品質測定値を生成する予に構成されることを特徴とする請求項19に記載のAQA。
  27. 前記ヘッダー信号における音声文IDを受信し、
    前記受信した音声文IDにより前記品質測定値を生成するための品質測定アルゴリズムを選択するように構成されることを特徴とする請求項26に記載のAQA。
  28. 前記ヘッダー信号において送信されるユニークワードを受信し、
    前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニークワードが受信されたことを照会するようにさらに構成されたことを特徴とする請求項19に記載のAQA。
  29. 前記ユニークワードを表すDTMF信号を受信するようにさらに構成されることを特徴とする請求項28に記載のAQA。
  30. 前記受信したオーディオ試験信号の前記品質測定値を生成するために、前記受信したオーディオ試験信号の前記ウインドウ化部分の少なくとも1つのウインドウと前記オーディオ試験信号の前記正確に同期した事前記憶表現のウインドウ化とを比較する前に、それらウインドウに窓関数を適用するように構成されることを特徴とする請求項19に記載のAQA。
  31. 事前に選択された窓関数を適用するように構成されることを特徴とする請求項19に記載のAQA。
  32. 窓関数を適用時に適用するように構成されることを特徴とする請求項19に記載のAQA。
JP2000620620A 1999-05-25 1999-05-25 音声及びオーディオ信号用リアルタイム品質アナライザ Expired - Fee Related JP4500458B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1999/011473 WO2000072306A1 (en) 1999-05-25 1999-05-25 Real-time quality analyzer for voice and audio signals

Publications (2)

Publication Number Publication Date
JP2003500701A JP2003500701A (ja) 2003-01-07
JP4500458B2 true JP4500458B2 (ja) 2010-07-14

Family

ID=22272829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000620620A Expired - Fee Related JP4500458B2 (ja) 1999-05-25 1999-05-25 音声及びオーディオ信号用リアルタイム品質アナライザ

Country Status (4)

Country Link
JP (1) JP4500458B2 (ja)
KR (1) KR100623214B1 (ja)
AU (1) AU4097099A (ja)
WO (1) WO2000072306A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004008207B4 (de) 2004-02-19 2006-01-05 Opticom Dipl.-Ing. Michael Keyhl Gmbh Verfahren und Vorrichtung zur Qualitätsbeurteilung eines Audiosignals und Vorrichtung und Verfahren zum Erhalten eines Qualitätsbeurteilungsergebnisses
US20060093094A1 (en) * 2004-10-15 2006-05-04 Zhu Xing Automatic measurement and announcement voice quality testing system
US9300694B2 (en) 2011-01-11 2016-03-29 INHA—Industry Partnership Institute Audio signal quality measurement in mobile device
JP5792994B2 (ja) * 2011-05-18 2015-10-14 日本放送協会 音声比較装置及び音声比較プログラム
US9412373B2 (en) * 2013-08-28 2016-08-09 Texas Instruments Incorporated Adaptive environmental context sample and update for comparing speech recognition
CN107785031B (zh) * 2017-10-18 2021-01-22 京信通信系统(中国)有限公司 一种测试无线通信中有线网络侧语音损伤的方法及基站
CN108877839B (zh) * 2018-08-02 2021-01-12 南京华苏科技有限公司 基于语音语义识别技术的语音质量感知评估的方法及系统
CN109979487B (zh) * 2019-03-07 2021-07-30 百度在线网络技术(北京)有限公司 语音信号检测方法和装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS622286A (ja) * 1985-06-27 1987-01-08 松下電器産業株式会社 発音練習装置
US5633909A (en) * 1994-06-17 1997-05-27 Centigram Communications Corporation Apparatus and method for generating calls and testing telephone equipment
US6035270A (en) * 1995-07-27 2000-03-07 British Telecommunications Public Limited Company Trained artificial neural networks using an imperfect vocal tract model for assessment of speech signal quality
US5809108A (en) * 1996-09-27 1998-09-15 Mci Communications Corporation Automated test call generation and execution system
US5805646A (en) * 1996-10-08 1998-09-08 Ericsson Inc. Synchronization method, and associated circuitry, for improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization
DE19730716A1 (de) * 1996-10-21 1998-04-23 Fraunhofer Ges Forschung Triggerung eines Meßverfahrens zur Qualitätsbeurteilung von Audio- und/oder Sprachsignalen

Also Published As

Publication number Publication date
WO2000072306A1 (en) 2000-11-30
KR100623214B1 (ko) 2006-09-12
JP2003500701A (ja) 2003-01-07
KR20010106412A (ko) 2001-11-29
AU4097099A (en) 2000-12-12

Similar Documents

Publication Publication Date Title
US6823302B1 (en) Real-time quality analyzer for voice and audio signals
JP4308278B2 (ja) 電気通信装置の客観的音声品質測定の方法および装置
EP0840975B1 (en) Assessment of signal quality
CA2196554C (en) Test method
US7680056B2 (en) Apparatus and method for extracting a test signal section from an audio signal
JPH10505718A (ja) オーディオ品質の解析
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
US20090319268A1 (en) Method and apparatus for measuring the intelligibility of an audio announcement device
US7050924B2 (en) Test signalling
JP4500458B2 (ja) 音声及びオーディオ信号用リアルタイム品質アナライザ
US7978613B2 (en) Test signalling
US5799133A (en) Training process
Barnwell III Objective measures for speech quality testing
KR101151746B1 (ko) 오디오 신호용 잡음제거 방법 및 장치
Côté et al. Speech Quality Measurement Methods
JPH08298698A (ja) 環境音分析装置
Holub et al. Impact of end to end encryption on GSM speech transmission quality-a case study
Szarvas et al. Qualiphone-a: a perceptual speech quality evaluation system for analog mobile networks.
Rix Perceptual techniques in audio quality assessment
KR20020044687A (ko) 이동통신 시스템의 음질평가 장치 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100419

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees