JP2003500701A - 音声及びオーディオ信号用リアルタイム品質アナライザ - Google Patents

音声及びオーディオ信号用リアルタイム品質アナライザ

Info

Publication number
JP2003500701A
JP2003500701A JP2000620620A JP2000620620A JP2003500701A JP 2003500701 A JP2003500701 A JP 2003500701A JP 2000620620 A JP2000620620 A JP 2000620620A JP 2000620620 A JP2000620620 A JP 2000620620A JP 2003500701 A JP2003500701 A JP 2003500701A
Authority
JP
Japan
Prior art keywords
test signal
signal
audio test
received
aqa
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000620620A
Other languages
English (en)
Other versions
JP4500458B2 (ja
Inventor
アトキンソン・イアン・アンドルー
リー・マーティン
マー・ウェイ
ホマユンファー・カンビズ
Original Assignee
アルゴレックス インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルゴレックス インコーポレイテッド filed Critical アルゴレックス インコーポレイテッド
Publication of JP2003500701A publication Critical patent/JP2003500701A/ja
Application granted granted Critical
Publication of JP4500458B2 publication Critical patent/JP4500458B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • G10L25/60Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Monitoring And Testing Of Transmission In General (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Abstract

(57)【要約】 【課題】音声の客観品質評価をリアルタイム或いは概ねリアルタイムに実行できるオーディオ品質アナライザ及びその評価方法を提供する。 【解決手段】オーディオ試験信号を含む品質試験信号が試験しようとする装置により受信される、オーディオ信号のリアルタイム知覚品質測定を実現するための方法である。オーディオ信号の事前記憶表現の再生信号が、例えば品質試験信号のヘッダにおける同期パルスを用いて、受信したオーディオ試験信号に粗く同期される。その後その再生信号は、例えば受信したオーディオ試験信号のウインドウ化部分のデータとオーディオ試験信号の事前記憶表現のウインドウ化部分のデータとを比較し、その比較の結果によりオーディオ試験信号の事前記憶表現のウインドウ化部分を調整することにより、受信したオーディオ信号に正確に同期される。その後受信したオーディオ試験信号のウインドウは、オーディオ試験信号の事前記憶表現の正確に同期した再生信号の一部と比較され、その受信したオーディオ試験信号の品質測定値を出力する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】
本発明は試験しようとする音声装置に対する品質測定を実現するための方法お
よび装置に関し、詳細には音声装置により受信される音声またはオーディオ信号
のリアルタイム客観知覚品質測定を実現するための方法および装置に関する。
【0002】
【従来の技術】
音声の品質評価はスピーチシステム、特に圧縮や符号化を伴うシステムにとっ
て困難な作業であるが、それは通常の波形及びスペクトラム類似基準(similari
ty criterion)が、受信した音声信号の感覚品質と特にうまく相関しないためで
ある。以前は、電気通信システムの音声品質評価は、事前に準備された音声材料
を用いて、注意深く調整された環境において実行される正規な感覚試聴試験(fo
rmal perceptual listening test)によりオフラインで測定されていた。このや
り方は有効ではあるが、コストがかかり、時間もかかっていた。さらにその試験
から得られる結果は、個々の被験者及びその環境に依存する。その結果、その試
験から得られる知見は、常に再現可能または一定しているとは限らない。
【0003】 心理音響学の分野の最近の研究により、人間が如何に音声及び音を知覚するか
ということに関してより理解が深まった。臨界帯域理論(critical band theory
)、聴覚マスキング(auditory masking)及び知覚ラウドネス(perceptual lou
dness)のようなこの分野のいくつかの知見を適用することにより、現在、規定
された主観試聴試験の結果と概ね一致する「客観」スピーチ測定を開発すること
が可能である。例えば国際電気通信連合(ITU)等の種々の機関が、コンピュ
ータに格納されたファイルを用いてオフラインの音声品質を測定するためのアル
ゴリズムを開発している。現存の客観測定アルゴリズムの例としては、知覚スピ
ーチ品質測定(Perceptual Speech Quality Measure:PSQM)、測定正規化
ブロック(Measuring Normalizing Blocks:MNB)、知覚解析測定システム(
Perceptual Analysis Measurement System:PAMS)、および修正バークスペ
クトル歪み(Modified Bark Spectral Distortion:MBSD)測定がある。後
者の測定は例えば、人間聴覚受信を反射する帯域に周波数を分割する。
【0004】 既存の客観知覚品質測定システムは、音声品質の測定をオフラインで、すなわ
ち格納された受信音声データから行う必要がある。そのような客観知覚品質測定
が、評価装置においてリアルタイム、或いは概ねリアルタイムに行われることが
望ましい。
【0005】
【発明が解決しようとする課題】
音声の客観品質評価をリアルタイム或いは概ねリアルタイムに実行できるオー
ディオ品質アナライザ及びその評価方法を提供する。
【0006】
【課題を解決するための手段】
一態様では本発明は、オーディオ信号のリアルタイム知覚品質測定を実現する
ための方法である。オーディオ試験信号を含む品質試験信号は、試験しようとす
る装置に受信される。オーディオ信号の事前記憶表現の再生信号が、例えば品質
試験信号のヘッダ内の同期パルスを用いて、受信したオーディオ試験信号に概ね
同期される。その後、例えば受信したオーディオ試験信号のウインドウ化部分の
信号とオーディオ試験信号の事前記憶表現のウインドウ化部分の信号とを比較し
、比較の結果によりオーディオ試験信号の事前記憶表現のウインドウ化部分を調
整することにより、その再生信号は受信したオーディオ信号に正確に同期される
。その後受信したオーディオ試験信号のウインドウが、オーディオ試験信号の事
前記憶表現の正確に同期した再生信号の一部と比較され、受信したオーディオ試
験信号の品質測定値を出力する。
【0007】 別の態様では、本発明は、試験しようとする装置により受信される品質試験信
号の品質を評価するためのオーディオ品質アナライザ(AQA)を備えており、
品質試験信号がオーディオ試験信号を含んでいる。AQAは、オーディオ試験信
号の事前記憶表現の再生信号を受信したオーディオ試験信号に概ね同期し、オー
ディオ試験信号の事前記憶表現の再生信号を受信したオーディオ試験信号に正確
に同期し、さらに受信したオーディオ試験信号のウインドウを、オーディオ試験
信号の事前記憶表現の正確に同期した再生信号の一部と比較し、受信したオーデ
ィオ試験信号の品質測定値を出力するように構成される。
【0008】 従って本発明は、評価装置においてリアルタイム或いは概ねリアルタイムにオ
ーディオ及び音声信号の客観知覚品質測定を実現することが理解されよう。
【0009】
【発明の実施の形態】
図1は、試験しようとする音声装置(VEUT)12により出力される音声信
号を受信する音声品質アナライザ(VQA)10のブロック図である。VQA1
0は、VEUT12から受信される音声試験信号の品質測定値を生成する品質評
価部14を備える。またVQA10は、DTMF(dual tone multiple frequen
cy)信号検出部18及びシーケンサ20を順に備えるヘッダ検出部16も備える
。DTMF検出部18はVEUT12から受信される信号を監視し、受信した信
号のシグナリングトーンの存在を検出及びデコードする。デコードされた信号は
シーケンサ20を用いて、音声文生成部22の動作を制御する。
【0010】 音声試験信号の事前記憶表現は、音声文生成部22に格納される。そのような
「文」は、必ずしも任意の特定の言語の完全な文及び言葉を表わさなくてもよく
、また任意の特定の人間によるスピーチを表す必要もない。むしろその表現は、
品質評価部14により実行される音声品質測定を容易にするために選択される。
音声試験信号に先行するヘッダ信号が受信される際に、シーケンサ20が、ヘッ
ダにおいて識別される特定の音声試験信号により、音声文生成部22からの特定
の事前記憶音声試験信号表現の再生を開始する。品質評価部14を用いて、客観
知覚品質比較を実行するだけの十分な、音声試験信号の事前記憶表現と受信した
音声試験信号との間の同期を達成するために、正確な同期検出部24が備えられ
る。音声品質測定は客観知覚品質測定アルゴリズムを適用し、正確な同期検出部
24からの同期したローカルに生成した基準信号の一部を、VEUT12から受
信した信号のウインドウ化部分と比較することにより実行される。一実施例では
、以下のアルゴリズムの1つが用いられているが、それらは知覚スピーチ品質測
定(PSQM)、測定正規化ブロック(MNB)、知覚解析測定システム(PA
MS)、および修正バーク(modified bark)スペクトル歪み(MBSD)測定
である。別の実施例では、複数の異なるアルゴリズムが利用可能であり、アルゴ
リズム選択が手動で行われる。別の実施例(図示せず)では、複数の異なるアル
ゴリズムが利用可能であり、音声文生成部22のいずれの事前記憶表現がシーケ
ンサ20により選択されたかによって、選択が行われる。
【0011】 一実施例では図2を参照すると、品質試験メッセージ30の一例が示される。
品質試験メッセージ30は、4つのセクション32、34、36、38を備え、
その内の32、34、36の3つがDTMFシグナリングを用いて送信されるヘ
ッダ40を備え、第4のセクションが音声試験メッセージ38を含む。ユニーク
ワード32を用いて、新規の品質試験メッセージ30の開始を知らせる。ユニー
クワード32は、あるチャネル劣化期間中、例えばセルラー網からVEUT12
が雑音を含む信号を受信する間に、測定開始信号が誤るのを防ぐために含まれる
。音声文ID34は音声試験メッセージ38の索引番号或いは識別子を含み、そ
れにより異なる試験メッセージがVEUT12に送信され、VQA10により識
別されるようにする。同期パルス36は、音声試験信号38の開始を知らせるた
めに用いられる短いDTMFパルスである。同期パルス36はシーケンサ20に
より用いられ、VEUT12により受信される信号との比較のために、適当な事
前記憶音声試験信号表現を送出する音声文生成部22の動作を開始する。他の実
施例では、ヘッダ40は別の状態、例えば帯域内シグナリングの別形態、或いは
帯域外シグナリングを用いて送信される。これらの他の実施例では、DTMF検
出部18以外の手段を用いて、ヘッダ40を検出し、ヘッダ40に対応する。適
当な帯域内シグナリングの例は、モノトーンシグナリング或いは電話データプロ
トコルを含む。適当な帯域外シグナリングの例は、個別ページングチャネル上で
のシグナリングである。
【0012】 一実施例では図3を参照すると、シーケンサ20はユニークワード検出部42
、音声文ID検出部44及び粗い同期検出部46を備え、図1のDTMF検出部
18の機能を含む。それゆえ個別のDTMF検出部18は図3には示されない。
ユニークワード32がユニークワード検出部42により認識されるとき、その結
果受信したデータは、音声文ID検出部44に渡される。音声文ID検出部44
はユニークワードに後続して受信される音声文ID34を検出する。音声文ID
34が識別された場合、それは音声文生成部22に渡され、音声文ID34によ
り識別された音声試験信号に対応する音声試験信号の適当な事前記憶表現を出力
し、その結果受信したデータは粗い同期検出部46に渡される。粗い同期検出部
46は、同期パルス36を検出するが、一実施例では短いDTMFパルスとして
符号化される。粗い同期検出部46からの粗い同期信号が受信された場合、音声
文生成部22が、判定された音声文ID34に相当する音声信号の事前記憶表現
の再生を開始する。
【0013】 一実施例では、同期パルス36によりもたらされる粗い同期では十分ではなく
、信号比較部14が音声試験信号38を音声信号の事前記憶表現とリアルタイム
に比較できない、すなわちユーザに知覚されるような明らかな遅延がほとんど或
いは全くなく、音声試験信号38の受信中に信号比較部14により品質評価が実
行されない。一実施例では、粗い同期は、知覚スピーチ品質測定(PSQM)、
測定正規化ブロック(MNB)、知覚解析測定システム(PAMS)、および修
正バークスペクトル歪み(MBSD)測定アルゴリズムを用いて音声試験信号3
8を解析するためには不十分である。それゆえ、正確な同期検出部24が、より
正確に同期をとるために設けられる。正確な同期検出部24は、音声文生成部2
2の出力を、同期ウインドウ化モジュール52により選択される音声データのウ
インドウと比較する。一実施例ではこの比較は、国際電気通信連合(ITU)標
準P.931「マルチメディア通信遅延、同期及びフレーム速度測定」により実
行される。この比較の結果として、正確な同期検出部24の出力はスイッチ54
を制御するために生成され、スイッチ54は正確な同期が達成される際に閉じる
。スイッチ54により、品質評価が、正確な同期が達成される前に出力されるの
を防ぐ。さらに、音声試験信号の事前記憶表現の同期した部分を表すデータウイ
ンドウは、選択ウインドウ化モジュール56への出力である。選択ウインドウ化
モジュール56は、入力音声試験データ58の同期した部分を選択し、事前記憶
表現60の同期した部分と比較する。比較は知覚比較部14により実行され、品
質評価値が生成される。品質評価値は、上記したようにスイッチ54が閉じる際
に出力される。
【0014】 図4は、本発明の一実施例における同期ウインドウモジュール52及び選択ウ
インドウ化モジュール56のウインドウ化動作の図である。同期ウインドウ62
は、同期ウインドウモジュール52によりバッファ48から選択される。同期ウ
インドウ62及び選択ウインドウ化モジュール56から選択される選択ウインド
ウ64が位置合わせされる。バッファ48は、デジタル化された音声入力を受け
取る循環バッファである。同期ウインドウ62の位置は、図3に示されるように
、知覚比較部14により行われる品質測定により調整される。選択ウインドウ6
4と同期ウインドウ62との位置合わせは、本実施例では、音声文生成部22か
ら出力されるウインドウ化データの選択とともに、正確同期検出部24により成
し遂げられる。
【0015】 図3に示される実施例では、選択ウインドウ化モジュール52は、重み付けの
ために、少なくとも1つの受信した音声データ及び音声試験信号の事前記憶表現
に窓関数の適用も行う。一実施例では、図5に示されるような方形重み付け、図
6にその一例が示される非線形強調重み付け及び図7にその一例が示される断続
方形重み付けを含む複数の重み付け関数が与えられる。重み付け関数の選択は、
品質アルゴリズムの選択により予め選択される。また選択は、知覚比較部14か
らの品質測定により、図3に示されるように適応的に変更可能である。例えば断
続方形重み付けは、セルラーシステムにおけるハンドオフのような外乱が音声信
号データの受信を妨害する際に用いられる。この場合に一実施例では、知覚比較
部14により用いられるアルゴリズムは、品質評価から妨害を受けた期間を除去
する。一実施例では障害期間の発生及びその長さは、品質測定とは別に報告され
る。
【0016】 本発明による試験構成の実施例が図8に示される。VQA10における多くの
或いは全ての機能構成要素は、設計上の選択としてコンピュータのソフトウエア
或いはファームウエアにおいて実装される。従ってVQA10は図8ではコンピ
ュータとして示される。VQA10はVEUT12の出力ポートに接続され、一
実施例では「ハンズフリーポート」を備えるセルラー電話12である。このよう
にセルラー電話により受信された品質試験メッセージ30は、解析を行うために
VQA10に送信される。セルラー電話12は、例えばセルラー無線網のような
ネットワーク68を介してメッセージ源66から品質試験メッセージ30を受信
する。一実施例では、メッセージ源66はボイスメールボックスに格納される録
音された品質試験メッセージ30を有する応答装置として構成される。ボイスメ
ールボックス内の録音された品質試験メッセージ30は、音声文ID34と識別
される。メッセージ源66に格納された音声試験信号38は、VQA10の音声
文生成部22における音声試験メッセージの対応する事前記憶表現を識別する音
声文ID34と識別される。
【0017】 一実施例では図9を参照すると、VEUT12は、ネットワーク68を介して
メッセージ源66にダイアルし(100)、そこからのボイスメールメッセージ
を回収する(102)。回収されたボイスメールメッセージは品質試験メッセー
ジ30である。そのVQA10はユニークワード32が認識されるまで(106
)待機する(104)。次に音声文ID34が得られる(108)。その後VQ
A10は、同期パルス36が受信されるまで(112)待機する(100)。同
期パルス36が受信されるとき、音声試験信号38のローカルな複製が、例えば
音声文生成部22から回収される(114)。その後音声試験信号38のローカ
ルな複製の正確な同期が行われ(116)、音声試験信号38が終了したことが
判定される(120)まで音声品質測定値が計算される(118)。音声試験信
号38が終了したとき、計算された品質が表示され(122)、試験が終了する
(124)。他の実施例では、品質試験は手動或いは自動で繰り返されてもよい
【0018】 ここで記載される本発明は、音声信号のリアルタイム知覚品質測定を提供する
ことは当業者には理解されよう。本発明は特に、以前には信号のリアルタイム測
定に適していることが知られていなかったアルゴリズムを用いてそのような測定
を実行するのに適している。また本発明は特に、非常に圧縮された音声信号が送
信される際にリアルタイム知覚品質測定を実現するのにも適している。ここで記
載される実施例は音声信号の品質測定に適用することができるが、本発明は同様
に非音声オーディオ試験信号の品質測定にも適していることは理解されよう。こ
れらの実施例では、こうして音声品質アナライザ10は、より一般的にはオーデ
ィオ品質アナライザ(AQA)であり、音声試験信号38はオーディオ試験信号
であり、音声文生成部22はオーディオ波形生成部(デジタル化波形生成部のよ
うな)であり、オーディオ波形生成部の音声試験信号の事前記憶表現は、オーデ
ィオ試験信号の事前記憶表現である。
【0019】 多くの他の変更例が本発明の精神の範囲内で実現可能であることは当業者には
明らかであろう。それゆえ本発明の範囲は、添付の請求の範囲及びその等価内容
を参照して確定されるべきである。
【0020】
【発明の効果】
上記のように本発明により、音声の客観品質評価をリアルタイム或いは概ねリ
アルタイムに実行できるオーディオ品質アナライザ及びその評価方法を提供する
ことができる。
【図面の簡単な説明】
【図1】 本発明による音声品質アナライザの一実施例のブロック図である。
【図2】 品質試験メッセージフレームの図である。
【図3】 本発明による音声品質アナライザの別の実施例の図である。
【図4】 本発明による同期ウインドウ形成及び選択ウインドウ形成を行うバッファの一
実施例のブロック図である。
【図5】 方形窓関数形状を表す図である。
【図6】 非線形強調窓関数形状を表す図である。
【図7】 断続方形窓関数を表す図である。
【図8】 本発明による試験構成のブロック図である。
【図9】 本発明による試験方法の一実施例の流れ図である。
【符号の説明】
10 音声品質アナライザ 12 音声装置 14 品質評価部 16 ヘッダ検出部 18 DTMF信号検出部 20 シーケンサ 22 音声文生成部 24 正確な同期部 30 品質試験メッセージ 32 ユニークワード 34 音声文ID 36 同期パルス 38 音声試験信号 40 ヘッダ 42 ユニークワード検出部 44 音声文検出部 46 粗い同期検出部 48 バッファ 50 A/D 52 同期ウインドウ化モジュール 54 スイッチ 56 選択ウインドウ化モジュール 58 入力音声試験データ 60 事前記憶表現 62 同期ウインドウ 64 選択ウインドウ 66 メッセージ源 68 ネットワーク 100 遠隔メールボックスにダイアル 102 ボイスメッセージ回収 104 ユニークワード待ち 106 ユニークワード取得? 108 音声文ID取得 110 同期パルス待ち 112 同期パルス取得? 114 文のローカルな複製回収 116 正確な同期 118 音声品質測定値計算 120 試験信号終了? 122 品質表示 124 試験終了
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE),OA(BF,BJ ,CF,CG,CI,CM,GA,GN,GW,ML, MR,NE,SN,TD,TG),AP(GH,GM,K E,LS,MW,SD,SL,SZ,UG,ZW),E A(AM,AZ,BY,KG,KZ,MD,RU,TJ ,TM),AL,AM,AT,AZ,BA,BB,BG ,BR,BY,CA,CH,CN,CU,CZ,DE, DK,EE,ES,FI,GB,GE,GH,GM,H U,ID,IL,IS,JP,KE,KG,KP,KR ,KZ,LC,LK,LR,LS,LT,LU,LV, MD,MG,MK,MN,MW,MX,NO,NZ,P L,PT,RO,RU,SD,SE,SG,SI,SK ,SL,TJ,TM,TR,TT,UA,UG,US, UZ,VN,YU,ZW (72)発明者 リー・マーティン アメリカ合衆国 カリフォルニア 94121 サンフランシスコ トウェンティー フ ィフス アヴェニュー 371 アパートメ ント1 (72)発明者 マー・ウェイ アメリカ合衆国 カリフォルニア 94552 カストロ ヴァリー レイクモント プ レイス 22819 (72)発明者 ホマユンファー・カンビズ 東京都渋谷区恵比寿西1−35−11 代官山 タワー303号

Claims (32)

    【特許請求の範囲】
  1. 【請求項1】 オーディオ信号のリアルタイム知覚品質測定を実現するため
    の方法であって、 品質試験信号を受信し、オーディオ試験信号を受信する過程と、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
    試験信号と粗く同期をとる過程と、 前記オーディオ試験信号の前記事前記憶表現の再生信号を前記受信したオーデ
    ィオ試験信号と正確に同期をとる過程と、 前記受信したオーディオ試験信号のウインドウを前記オーディオ試験信号の前
    記事前記憶表現の前記正確に同期した再生信号の一部と比較し、前記受信したオ
    ーディオ試験信号の品質測定値を出力する過程とを有することを特徴とする方法
  2. 【請求項2】 前記品質試験信号が、同期パルスを含むヘッダ信号を備え、
    前記オーディオ試験信号の前記事前記憶表現の再生信号を前記受信したオーディ
    オ試験信号と粗く同期をとる過程が、前記同期パルスを用いて前記オーディオ試
    験信号の前記事前記憶表現の再生信号の同期をとる過程を有することを特徴とす
    る請求項1に記載の方法。
  3. 【請求項3】 前記オーディオ試験信号の前記事前記憶表現の再生信号を前
    記受信したオーディオ試験信号と正確に同期をとる過程が、 前記受信したオーディオ試験信号のウインドウ化部分のデータと前記オーディ
    オ試験信号の前記事前記憶表現のウインドウ化部分のデータとを比較する過程と
    、 前記比較の結果により、前記受信したオーディオ試験信号の前記ウインドウ化
    部分と前記オーディオ試験信号の前記事前記憶表現のウインドウ化部分との位置
    合わせを調整する過程とを有することを特徴とする請求項2に記載の方法。
  4. 【請求項4】 前記ヘッダ信号を帯域外で受信する過程をさらに有すること
    を特徴とする請求項3に記載の方法。
  5. 【請求項5】 前記ヘッダ信号を帯域内で受信する過程をさらに有すること
    を特徴とする請求項3に記載の方法。
  6. 【請求項6】 前記ヘッダ信号を受信する前記過程が、DTMFトーンを受
    信する過程を有し、前記オーディオ試験信号の前記事前記憶表現の再生信号を粗
    く同期をとる過程が、前記オーディオ試験信号の前記事前記憶表現の再生信号を
    DTMFパルスと同期をとる過程を有することを特徴とする請求項5に記載の方
    法。
  7. 【請求項7】 前記オーディオ試験信号が音声試験信号であり、前記オーデ
    ィオ試験信号の前記事前記憶表現が前記音声試験信号の事前記憶表現であること
    を特徴とする請求項3に記載の方法。
  8. 【請求項8】 前記受信した音声試験信号を識別する音声文IDを受信する
    過程と、 前記受信した音声文IDにより、複数の事前記憶表現から前記音声試験信号の
    前記事前記憶表現を選択する過程とをさらに有することを特徴とする請求項7に
    記載の方法。
  9. 【請求項9】 前記受信した音声信号を識別する音声文IDを受信する過程
    が、前記受信した音声信号を識別するDTMFトーンを受信する過程を有するこ
    とを特徴とする請求項8に記載の方法。
  10. 【請求項10】 前記受信したオーディオ試験信号のウインドウを、前記オ
    ーディオ試験信号の前記事前記憶表現の正確に同期した再生信号の一部と比較し
    、前記受信したオーディオ試験信号の品質測定値を出力する過程が、ITU P
    .861知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、
    修正バークスペクトル歪み(MBSD)測定及び知覚解析測定システム(PAM
    S)からなる品質測定群から選択される少なくとも1つの品質測定アルゴリズム
    により品質測定値を生成する過程を有することを特徴とする請求項3に記載の方
    法。
  11. 【請求項11】 前記ヘッダ信号における音声文IDを受信する過程と、 前記受信した音声文IDにより前記品質測定値を生成するために品質測定アル
    ゴリズムを選択する過程とをさらに有することを特徴とする請求項10に記載の
    方法。
  12. 【請求項12】前記ヘッダにおいて送信されたユニークワードを受信する過
    程と、 前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニーク
    ワードが受信されたことを照合する過程とをさらに有することを特徴とする請求
    項3に記載の方法。
  13. 【請求項13】ユニークワードを受信する過程が、ユニークワードを表すD
    TMF信号を受信する過程を有することを特徴とする請求項12に記載の方法。
  14. 【請求項14】前記品質測定値を生成するために前記ウインドウ化部分を比
    較する過程に先行して、前記受信したオーディオ試験信号の少なくとも1つのウ
    インドウと前記オーディオ試験信号の前記正確に同期した事前記憶表現のウイン
    ドウとに窓関数を適用する過程をさらに有することを特徴とする請求項1に記載
    の方法。
  15. 【請求項15】窓関数を適用する過程が、窓関数を事前選択する過程を有す
    ることを特徴とする請求項14に記載の方法。
  16. 【請求項16】窓関数を適用する過程が、窓関数を適応的に選択する過程を
    有することを特徴とする請求項15に記載の方法。
  17. 【請求項17】試験下の装置により受信される品質試験信号の品質を評価す
    るためのオーディオ品質アナライザ(AQA)であって、前記品質試験信号がオ
    ーディオ試験信号を有し、前記AQAが、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
    試験信号に粗く同期し、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
    試験信号に正確に同期し、 前記受信したオーディオ試験信号のウインドウを、前記オーディオ試験信号の
    前記事前記憶表現の前記正確に同期した再生信号の一部と比較し、前記受信した
    オーディオ試験信号の品質測定値を出力するように構成されることを特徴とする
    オーディオ品質アナライザ。
  18. 【請求項18】前記品質試験信号が同期パルスを有し、前記AQAが、前記
    同期パルスを用いて、前記オーディオ試験信号の前記事前記憶表現の再生信号を
    前記受信したオーディオ試験信号に粗く同期するように構成されることを特徴と
    する請求項17に記載のAQA。
  19. 【請求項19】前記AQAが、 前記受信したオーディオ試験信号のウインドウ化部分のデータと前記オーディ
    オ試験信号の前記事前記憶表現のウインドウ化部分のデータとを比較し、 前記比較の結果により、前記受信したオーディオ試験信号のウインドウ化部分
    と前記オーディオ試験信号の前記事前記憶表現のウインドウ化部分の位置合わせ
    を調整するように構成されることを特徴とする請求項18に記載のAQA。
  20. 【請求項20】前記ヘッダ信号を帯域外で受信するようにさらに構成される
    ことを特徴とする請求項19に記載のAQA。
  21. 【請求項21】前記ヘッダ信号を帯域内で受信するようにさらに構成される
    ことを特徴とする請求項19に記載のAQA。
  22. 【請求項22】前記ヘッダ信号としてDTMF信号を受信し、かつ前記オー
    ディオ試験信号の前記事前記憶表現の再生信号をDTMFパルスと粗く同期をと
    るようにさらに構成されることを特徴とする請求項21に記載のAQA。
  23. 【請求項23】前記オーディオ試験信号が音声試験信号であり、前記オーデ
    ィオ試験信号の前記事前記憶表現が音声試験信号の事前記憶表現であることを特
    徴とする請求項19に記載のAQA。
  24. 【請求項24】前記受信した音声試験信号を識別する音声文IDを受信し、 前記受信した音声文IDにより、複数の事前記憶表現から前記音声試験信号の
    前記事前記憶表現を選択するようにさらに構成されることを特徴とする請求項2
    3に記載のAQA。
  25. 【請求項25】前記音声文IDとして、DTMF信号を受信するようにさら
    に構成されることを特徴とする請求項24に記載のAQA。
  26. 【請求項26】ITU P.861知覚スピーチ品質測定(PSQM)、測
    定正規化ブロック(MNB)、修正バークスペクトル歪み(MBSD)測定及び
    知覚解析測定システム(PAMS)からなる品質測定アルゴリズム群から選択さ
    れる少なくとも1つの品質測定アルゴリズムにより品質測定値を生成するように
    構成されることを特徴とする請求項19に記載のAQA。
  27. 【請求項27】前記ヘッダ信号における音声文IDを受信し、 前記受信した音声文IDにより前記品質測定値を生成するための品質測定アル
    ゴリズムを選択するように構成されることを特徴とする請求項26に記載のAQ
    A。
  28. 【請求項28】前記ヘッダ信号において送信されたユニークワードを受信し
    、 前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニーク
    ワードが受信されたことを照合するようにさらに構成されたことを特徴とする請
    求項19に記載のAQA。
  29. 【請求項29】前記ユニークワードを表すDTMF信号を受信するようにさ
    らに構成されることを特徴とする請求項28に記載のAQA。
  30. 【請求項30】前記受信したオーディオ試験信号の前記品質測定値を生成す
    るために、前記受信したオーディオ試験信号の前記ウインドウ化部分の少なくと
    も1つのウインドウと前記オーディオ試験信号の前記正確に同期した事前記憶表
    現のウインドウ化部分とを比較する前に、それらウインドウに窓関数を適用する
    ように構成されることを特徴とする請求項19に記載のAQA。
  31. 【請求項31】事前選択された窓関数を適用するように構成されることを特
    徴とする請求項30に記載のAQA。
  32. 【請求項32】窓関数を適応的に適用するように構成されることを特徴とす
    る請求項31に記載のAQA。
JP2000620620A 1999-05-25 1999-05-25 音声及びオーディオ信号用リアルタイム品質アナライザ Expired - Fee Related JP4500458B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/US1999/011473 WO2000072306A1 (en) 1999-05-25 1999-05-25 Real-time quality analyzer for voice and audio signals

Publications (2)

Publication Number Publication Date
JP2003500701A true JP2003500701A (ja) 2003-01-07
JP4500458B2 JP4500458B2 (ja) 2010-07-14

Family

ID=22272829

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000620620A Expired - Fee Related JP4500458B2 (ja) 1999-05-25 1999-05-25 音声及びオーディオ信号用リアルタイム品質アナライザ

Country Status (4)

Country Link
JP (1) JP4500458B2 (ja)
KR (1) KR100623214B1 (ja)
AU (1) AU4097099A (ja)
WO (1) WO2000072306A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012242542A (ja) * 2011-05-18 2012-12-10 Nippon Hoso Kyokai <Nhk> 音声比較装置及び音声比較プログラム

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004008207B4 (de) * 2004-02-19 2006-01-05 Opticom Dipl.-Ing. Michael Keyhl Gmbh Verfahren und Vorrichtung zur Qualitätsbeurteilung eines Audiosignals und Vorrichtung und Verfahren zum Erhalten eines Qualitätsbeurteilungsergebnisses
US20060093094A1 (en) * 2004-10-15 2006-05-04 Zhu Xing Automatic measurement and announcement voice quality testing system
US9300694B2 (en) 2011-01-11 2016-03-29 INHA—Industry Partnership Institute Audio signal quality measurement in mobile device
US9412373B2 (en) * 2013-08-28 2016-08-09 Texas Instruments Incorporated Adaptive environmental context sample and update for comparing speech recognition
CN107785031B (zh) * 2017-10-18 2021-01-22 京信通信系统(中国)有限公司 一种测试无线通信中有线网络侧语音损伤的方法及基站
CN108877839B (zh) * 2018-08-02 2021-01-12 南京华苏科技有限公司 基于语音语义识别技术的语音质量感知评估的方法及系统
CN109979487B (zh) * 2019-03-07 2021-07-30 百度在线网络技术(北京)有限公司 语音信号检测方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS622286A (ja) * 1985-06-27 1987-01-08 松下電器産業株式会社 発音練習装置
WO1997005730A1 (en) * 1995-07-27 1997-02-13 British Telecommunications Public Limited Company Assessment of signal quality
WO1998016031A2 (en) * 1996-10-08 1998-04-16 Ericsson Inc. Improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization
WO1998018295A1 (de) * 1996-10-21 1998-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Triggerung eines messverfahrens zur qualitätsbeurteilung von audio- und/oder sprachsignalen

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5633909A (en) * 1994-06-17 1997-05-27 Centigram Communications Corporation Apparatus and method for generating calls and testing telephone equipment
US5809108A (en) * 1996-09-27 1998-09-15 Mci Communications Corporation Automated test call generation and execution system

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS622286A (ja) * 1985-06-27 1987-01-08 松下電器産業株式会社 発音練習装置
WO1997005730A1 (en) * 1995-07-27 1997-02-13 British Telecommunications Public Limited Company Assessment of signal quality
JPH11510334A (ja) * 1995-07-27 1999-09-07 ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー 信号品質の評価
WO1998016031A2 (en) * 1996-10-08 1998-04-16 Ericsson Inc. Improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization
JP2001502134A (ja) * 1996-10-08 2001-02-13 エリクソン インコーポレイテッド 粗同期中における早晩テストを用いる受信機の送信機との改善された同期
WO1998018295A1 (de) * 1996-10-21 1998-04-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Triggerung eines messverfahrens zur qualitätsbeurteilung von audio- und/oder sprachsignalen
JP2000505269A (ja) * 1996-10-21 2000-04-25 フラウンホーファー・ゲゼルシャフト ツア フェルデルンク デル アンゲワンテン フォルシュンク アインゲトラーゲナー フェライン オーディオおよび/または音声信号を品質評価するための測定方法のトリガー方法および装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012242542A (ja) * 2011-05-18 2012-12-10 Nippon Hoso Kyokai <Nhk> 音声比較装置及び音声比較プログラム

Also Published As

Publication number Publication date
KR100623214B1 (ko) 2006-09-12
WO2000072306A1 (en) 2000-11-30
JP4500458B2 (ja) 2010-07-14
AU4097099A (en) 2000-12-12
KR20010106412A (ko) 2001-11-29

Similar Documents

Publication Publication Date Title
US6823302B1 (en) Real-time quality analyzer for voice and audio signals
EP0840975B1 (en) Assessment of signal quality
US20190231233A1 (en) Hearing test and modification of audio signals
CA2196554C (en) Test method
RU2312405C2 (ru) Способ осуществления машинной оценки качества звуковых сигналов
CN102214464B (zh) 音频信号的瞬态检测方法以及基于该方法的时长调整方法
CN112017687B (zh) 一种骨传导设备的语音处理方法、装置及介质
JP2004514327A (ja) 電気通信網における電話リンクの会話品質の測定
US6564181B2 (en) Method and system for measurement of speech distortion from samples of telephonic voice signals
JPH0654364A (ja) 移動電話システムにおける主観的な対話の質を比較するための装置
CN111640411B (zh) 音频合成方法、装置及计算机可读存储介质
US7050924B2 (en) Test signalling
CN100499694C (zh) 测试语音质量的方法及装置
US6834040B2 (en) Measurement synchronization method for voice over packet communication systems
JP2003500701A (ja) 音声及びオーディオ信号用リアルタイム品質アナライザ
Barnwell III Objective measures for speech quality testing
FR2817096A1 (fr) Procede et systeme de detection non intrusive des defauts d&#39;un signal de parole transmis en telephonie sur reseau de transmission par paquets
KR101151746B1 (ko) 오디오 신호용 잡음제거 방법 및 장치
Nakatsui et al. Subjective speech‐to‐noise ratio as a measure of speech quality for digital waveform coders
JP2905112B2 (ja) 環境音分析装置
Kitawaki et al. Objective quality assessment of wideband speech coding
JP2002300259A (ja) 音声通話装置の評価試験方法及びシステム
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863
Holub et al. Impact of end to end encryption on GSM speech transmission quality-a case study
CN116778954A (zh) 一种广播系统静音检测方法、音频输出设备及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060425

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081104

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090202

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090209

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090501

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100406

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100419

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130423

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140423

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees