JP2003500701A - 音声及びオーディオ信号用リアルタイム品質アナライザ - Google Patents
音声及びオーディオ信号用リアルタイム品質アナライザInfo
- Publication number
- JP2003500701A JP2003500701A JP2000620620A JP2000620620A JP2003500701A JP 2003500701 A JP2003500701 A JP 2003500701A JP 2000620620 A JP2000620620 A JP 2000620620A JP 2000620620 A JP2000620620 A JP 2000620620A JP 2003500701 A JP2003500701 A JP 2003500701A
- Authority
- JP
- Japan
- Prior art keywords
- test signal
- signal
- audio test
- received
- aqa
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 11
- 238000012360 testing method Methods 0.000 claims abstract description 144
- 238000005259 measurement Methods 0.000 claims abstract description 63
- 238000000034 method Methods 0.000 claims abstract description 26
- 230000001360 synchronised effect Effects 0.000 claims abstract description 18
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000013441 quality evaluation Methods 0.000 abstract description 8
- 238000001514 detection method Methods 0.000 description 11
- 230000011664 signaling Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 4
- 238000001303 quality assessment method Methods 0.000 description 2
- 230000001953 sensory effect Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
- G10L25/60—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination for measuring the quality of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Monitoring And Testing Of Transmission In General (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Abstract
Description
よび装置に関し、詳細には音声装置により受信される音声またはオーディオ信号
のリアルタイム客観知覚品質測定を実現するための方法および装置に関する。
て困難な作業であるが、それは通常の波形及びスペクトラム類似基準(similari
ty criterion)が、受信した音声信号の感覚品質と特にうまく相関しないためで
ある。以前は、電気通信システムの音声品質評価は、事前に準備された音声材料
を用いて、注意深く調整された環境において実行される正規な感覚試聴試験(fo
rmal perceptual listening test)によりオフラインで測定されていた。このや
り方は有効ではあるが、コストがかかり、時間もかかっていた。さらにその試験
から得られる結果は、個々の被験者及びその環境に依存する。その結果、その試
験から得られる知見は、常に再現可能または一定しているとは限らない。
ということに関してより理解が深まった。臨界帯域理論(critical band theory
)、聴覚マスキング(auditory masking)及び知覚ラウドネス(perceptual lou
dness)のようなこの分野のいくつかの知見を適用することにより、現在、規定
された主観試聴試験の結果と概ね一致する「客観」スピーチ測定を開発すること
が可能である。例えば国際電気通信連合(ITU)等の種々の機関が、コンピュ
ータに格納されたファイルを用いてオフラインの音声品質を測定するためのアル
ゴリズムを開発している。現存の客観測定アルゴリズムの例としては、知覚スピ
ーチ品質測定(Perceptual Speech Quality Measure:PSQM)、測定正規化
ブロック(Measuring Normalizing Blocks:MNB)、知覚解析測定システム(
Perceptual Analysis Measurement System:PAMS)、および修正バークスペ
クトル歪み(Modified Bark Spectral Distortion:MBSD)測定がある。後
者の測定は例えば、人間聴覚受信を反射する帯域に周波数を分割する。
ち格納された受信音声データから行う必要がある。そのような客観知覚品質測定
が、評価装置においてリアルタイム、或いは概ねリアルタイムに行われることが
望ましい。
ディオ品質アナライザ及びその評価方法を提供する。
ための方法である。オーディオ試験信号を含む品質試験信号は、試験しようとす
る装置に受信される。オーディオ信号の事前記憶表現の再生信号が、例えば品質
試験信号のヘッダ内の同期パルスを用いて、受信したオーディオ試験信号に概ね
同期される。その後、例えば受信したオーディオ試験信号のウインドウ化部分の
信号とオーディオ試験信号の事前記憶表現のウインドウ化部分の信号とを比較し
、比較の結果によりオーディオ試験信号の事前記憶表現のウインドウ化部分を調
整することにより、その再生信号は受信したオーディオ信号に正確に同期される
。その後受信したオーディオ試験信号のウインドウが、オーディオ試験信号の事
前記憶表現の正確に同期した再生信号の一部と比較され、受信したオーディオ試
験信号の品質測定値を出力する。
号の品質を評価するためのオーディオ品質アナライザ(AQA)を備えており、
品質試験信号がオーディオ試験信号を含んでいる。AQAは、オーディオ試験信
号の事前記憶表現の再生信号を受信したオーディオ試験信号に概ね同期し、オー
ディオ試験信号の事前記憶表現の再生信号を受信したオーディオ試験信号に正確
に同期し、さらに受信したオーディオ試験信号のウインドウを、オーディオ試験
信号の事前記憶表現の正確に同期した再生信号の一部と比較し、受信したオーデ
ィオ試験信号の品質測定値を出力するように構成される。
ーディオ及び音声信号の客観知覚品質測定を実現することが理解されよう。
号を受信する音声品質アナライザ(VQA)10のブロック図である。VQA1
0は、VEUT12から受信される音声試験信号の品質測定値を生成する品質評
価部14を備える。またVQA10は、DTMF(dual tone multiple frequen
cy)信号検出部18及びシーケンサ20を順に備えるヘッダ検出部16も備える
。DTMF検出部18はVEUT12から受信される信号を監視し、受信した信
号のシグナリングトーンの存在を検出及びデコードする。デコードされた信号は
シーケンサ20を用いて、音声文生成部22の動作を制御する。
「文」は、必ずしも任意の特定の言語の完全な文及び言葉を表わさなくてもよく
、また任意の特定の人間によるスピーチを表す必要もない。むしろその表現は、
品質評価部14により実行される音声品質測定を容易にするために選択される。
音声試験信号に先行するヘッダ信号が受信される際に、シーケンサ20が、ヘッ
ダにおいて識別される特定の音声試験信号により、音声文生成部22からの特定
の事前記憶音声試験信号表現の再生を開始する。品質評価部14を用いて、客観
知覚品質比較を実行するだけの十分な、音声試験信号の事前記憶表現と受信した
音声試験信号との間の同期を達成するために、正確な同期検出部24が備えられ
る。音声品質測定は客観知覚品質測定アルゴリズムを適用し、正確な同期検出部
24からの同期したローカルに生成した基準信号の一部を、VEUT12から受
信した信号のウインドウ化部分と比較することにより実行される。一実施例では
、以下のアルゴリズムの1つが用いられているが、それらは知覚スピーチ品質測
定(PSQM)、測定正規化ブロック(MNB)、知覚解析測定システム(PA
MS)、および修正バーク(modified bark)スペクトル歪み(MBSD)測定
である。別の実施例では、複数の異なるアルゴリズムが利用可能であり、アルゴ
リズム選択が手動で行われる。別の実施例(図示せず)では、複数の異なるアル
ゴリズムが利用可能であり、音声文生成部22のいずれの事前記憶表現がシーケ
ンサ20により選択されたかによって、選択が行われる。
品質試験メッセージ30は、4つのセクション32、34、36、38を備え、
その内の32、34、36の3つがDTMFシグナリングを用いて送信されるヘ
ッダ40を備え、第4のセクションが音声試験メッセージ38を含む。ユニーク
ワード32を用いて、新規の品質試験メッセージ30の開始を知らせる。ユニー
クワード32は、あるチャネル劣化期間中、例えばセルラー網からVEUT12
が雑音を含む信号を受信する間に、測定開始信号が誤るのを防ぐために含まれる
。音声文ID34は音声試験メッセージ38の索引番号或いは識別子を含み、そ
れにより異なる試験メッセージがVEUT12に送信され、VQA10により識
別されるようにする。同期パルス36は、音声試験信号38の開始を知らせるた
めに用いられる短いDTMFパルスである。同期パルス36はシーケンサ20に
より用いられ、VEUT12により受信される信号との比較のために、適当な事
前記憶音声試験信号表現を送出する音声文生成部22の動作を開始する。他の実
施例では、ヘッダ40は別の状態、例えば帯域内シグナリングの別形態、或いは
帯域外シグナリングを用いて送信される。これらの他の実施例では、DTMF検
出部18以外の手段を用いて、ヘッダ40を検出し、ヘッダ40に対応する。適
当な帯域内シグナリングの例は、モノトーンシグナリング或いは電話データプロ
トコルを含む。適当な帯域外シグナリングの例は、個別ページングチャネル上で
のシグナリングである。
、音声文ID検出部44及び粗い同期検出部46を備え、図1のDTMF検出部
18の機能を含む。それゆえ個別のDTMF検出部18は図3には示されない。
ユニークワード32がユニークワード検出部42により認識されるとき、その結
果受信したデータは、音声文ID検出部44に渡される。音声文ID検出部44
はユニークワードに後続して受信される音声文ID34を検出する。音声文ID
34が識別された場合、それは音声文生成部22に渡され、音声文ID34によ
り識別された音声試験信号に対応する音声試験信号の適当な事前記憶表現を出力
し、その結果受信したデータは粗い同期検出部46に渡される。粗い同期検出部
46は、同期パルス36を検出するが、一実施例では短いDTMFパルスとして
符号化される。粗い同期検出部46からの粗い同期信号が受信された場合、音声
文生成部22が、判定された音声文ID34に相当する音声信号の事前記憶表現
の再生を開始する。
、信号比較部14が音声試験信号38を音声信号の事前記憶表現とリアルタイム
に比較できない、すなわちユーザに知覚されるような明らかな遅延がほとんど或
いは全くなく、音声試験信号38の受信中に信号比較部14により品質評価が実
行されない。一実施例では、粗い同期は、知覚スピーチ品質測定(PSQM)、
測定正規化ブロック(MNB)、知覚解析測定システム(PAMS)、および修
正バークスペクトル歪み(MBSD)測定アルゴリズムを用いて音声試験信号3
8を解析するためには不十分である。それゆえ、正確な同期検出部24が、より
正確に同期をとるために設けられる。正確な同期検出部24は、音声文生成部2
2の出力を、同期ウインドウ化モジュール52により選択される音声データのウ
インドウと比較する。一実施例ではこの比較は、国際電気通信連合(ITU)標
準P.931「マルチメディア通信遅延、同期及びフレーム速度測定」により実
行される。この比較の結果として、正確な同期検出部24の出力はスイッチ54
を制御するために生成され、スイッチ54は正確な同期が達成される際に閉じる
。スイッチ54により、品質評価が、正確な同期が達成される前に出力されるの
を防ぐ。さらに、音声試験信号の事前記憶表現の同期した部分を表すデータウイ
ンドウは、選択ウインドウ化モジュール56への出力である。選択ウインドウ化
モジュール56は、入力音声試験データ58の同期した部分を選択し、事前記憶
表現60の同期した部分と比較する。比較は知覚比較部14により実行され、品
質評価値が生成される。品質評価値は、上記したようにスイッチ54が閉じる際
に出力される。
インドウ化モジュール56のウインドウ化動作の図である。同期ウインドウ62
は、同期ウインドウモジュール52によりバッファ48から選択される。同期ウ
インドウ62及び選択ウインドウ化モジュール56から選択される選択ウインド
ウ64が位置合わせされる。バッファ48は、デジタル化された音声入力を受け
取る循環バッファである。同期ウインドウ62の位置は、図3に示されるように
、知覚比較部14により行われる品質測定により調整される。選択ウインドウ6
4と同期ウインドウ62との位置合わせは、本実施例では、音声文生成部22か
ら出力されるウインドウ化データの選択とともに、正確同期検出部24により成
し遂げられる。
ために、少なくとも1つの受信した音声データ及び音声試験信号の事前記憶表現
に窓関数の適用も行う。一実施例では、図5に示されるような方形重み付け、図
6にその一例が示される非線形強調重み付け及び図7にその一例が示される断続
方形重み付けを含む複数の重み付け関数が与えられる。重み付け関数の選択は、
品質アルゴリズムの選択により予め選択される。また選択は、知覚比較部14か
らの品質測定により、図3に示されるように適応的に変更可能である。例えば断
続方形重み付けは、セルラーシステムにおけるハンドオフのような外乱が音声信
号データの受信を妨害する際に用いられる。この場合に一実施例では、知覚比較
部14により用いられるアルゴリズムは、品質評価から妨害を受けた期間を除去
する。一実施例では障害期間の発生及びその長さは、品質測定とは別に報告され
る。
或いは全ての機能構成要素は、設計上の選択としてコンピュータのソフトウエア
或いはファームウエアにおいて実装される。従ってVQA10は図8ではコンピ
ュータとして示される。VQA10はVEUT12の出力ポートに接続され、一
実施例では「ハンズフリーポート」を備えるセルラー電話12である。このよう
にセルラー電話により受信された品質試験メッセージ30は、解析を行うために
VQA10に送信される。セルラー電話12は、例えばセルラー無線網のような
ネットワーク68を介してメッセージ源66から品質試験メッセージ30を受信
する。一実施例では、メッセージ源66はボイスメールボックスに格納される録
音された品質試験メッセージ30を有する応答装置として構成される。ボイスメ
ールボックス内の録音された品質試験メッセージ30は、音声文ID34と識別
される。メッセージ源66に格納された音声試験信号38は、VQA10の音声
文生成部22における音声試験メッセージの対応する事前記憶表現を識別する音
声文ID34と識別される。
メッセージ源66にダイアルし(100)、そこからのボイスメールメッセージ
を回収する(102)。回収されたボイスメールメッセージは品質試験メッセー
ジ30である。そのVQA10はユニークワード32が認識されるまで(106
)待機する(104)。次に音声文ID34が得られる(108)。その後VQ
A10は、同期パルス36が受信されるまで(112)待機する(100)。同
期パルス36が受信されるとき、音声試験信号38のローカルな複製が、例えば
音声文生成部22から回収される(114)。その後音声試験信号38のローカ
ルな複製の正確な同期が行われ(116)、音声試験信号38が終了したことが
判定される(120)まで音声品質測定値が計算される(118)。音声試験信
号38が終了したとき、計算された品質が表示され(122)、試験が終了する
(124)。他の実施例では、品質試験は手動或いは自動で繰り返されてもよい
。
ことは当業者には理解されよう。本発明は特に、以前には信号のリアルタイム測
定に適していることが知られていなかったアルゴリズムを用いてそのような測定
を実行するのに適している。また本発明は特に、非常に圧縮された音声信号が送
信される際にリアルタイム知覚品質測定を実現するのにも適している。ここで記
載される実施例は音声信号の品質測定に適用することができるが、本発明は同様
に非音声オーディオ試験信号の品質測定にも適していることは理解されよう。こ
れらの実施例では、こうして音声品質アナライザ10は、より一般的にはオーデ
ィオ品質アナライザ(AQA)であり、音声試験信号38はオーディオ試験信号
であり、音声文生成部22はオーディオ波形生成部(デジタル化波形生成部のよ
うな)であり、オーディオ波形生成部の音声試験信号の事前記憶表現は、オーデ
ィオ試験信号の事前記憶表現である。
明らかであろう。それゆえ本発明の範囲は、添付の請求の範囲及びその等価内容
を参照して確定されるべきである。
アルタイムに実行できるオーディオ品質アナライザ及びその評価方法を提供する
ことができる。
実施例のブロック図である。
Claims (32)
- 【請求項1】 オーディオ信号のリアルタイム知覚品質測定を実現するため
の方法であって、 品質試験信号を受信し、オーディオ試験信号を受信する過程と、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
試験信号と粗く同期をとる過程と、 前記オーディオ試験信号の前記事前記憶表現の再生信号を前記受信したオーデ
ィオ試験信号と正確に同期をとる過程と、 前記受信したオーディオ試験信号のウインドウを前記オーディオ試験信号の前
記事前記憶表現の前記正確に同期した再生信号の一部と比較し、前記受信したオ
ーディオ試験信号の品質測定値を出力する過程とを有することを特徴とする方法
。 - 【請求項2】 前記品質試験信号が、同期パルスを含むヘッダ信号を備え、
前記オーディオ試験信号の前記事前記憶表現の再生信号を前記受信したオーディ
オ試験信号と粗く同期をとる過程が、前記同期パルスを用いて前記オーディオ試
験信号の前記事前記憶表現の再生信号の同期をとる過程を有することを特徴とす
る請求項1に記載の方法。 - 【請求項3】 前記オーディオ試験信号の前記事前記憶表現の再生信号を前
記受信したオーディオ試験信号と正確に同期をとる過程が、 前記受信したオーディオ試験信号のウインドウ化部分のデータと前記オーディ
オ試験信号の前記事前記憶表現のウインドウ化部分のデータとを比較する過程と
、 前記比較の結果により、前記受信したオーディオ試験信号の前記ウインドウ化
部分と前記オーディオ試験信号の前記事前記憶表現のウインドウ化部分との位置
合わせを調整する過程とを有することを特徴とする請求項2に記載の方法。 - 【請求項4】 前記ヘッダ信号を帯域外で受信する過程をさらに有すること
を特徴とする請求項3に記載の方法。 - 【請求項5】 前記ヘッダ信号を帯域内で受信する過程をさらに有すること
を特徴とする請求項3に記載の方法。 - 【請求項6】 前記ヘッダ信号を受信する前記過程が、DTMFトーンを受
信する過程を有し、前記オーディオ試験信号の前記事前記憶表現の再生信号を粗
く同期をとる過程が、前記オーディオ試験信号の前記事前記憶表現の再生信号を
DTMFパルスと同期をとる過程を有することを特徴とする請求項5に記載の方
法。 - 【請求項7】 前記オーディオ試験信号が音声試験信号であり、前記オーデ
ィオ試験信号の前記事前記憶表現が前記音声試験信号の事前記憶表現であること
を特徴とする請求項3に記載の方法。 - 【請求項8】 前記受信した音声試験信号を識別する音声文IDを受信する
過程と、 前記受信した音声文IDにより、複数の事前記憶表現から前記音声試験信号の
前記事前記憶表現を選択する過程とをさらに有することを特徴とする請求項7に
記載の方法。 - 【請求項9】 前記受信した音声信号を識別する音声文IDを受信する過程
が、前記受信した音声信号を識別するDTMFトーンを受信する過程を有するこ
とを特徴とする請求項8に記載の方法。 - 【請求項10】 前記受信したオーディオ試験信号のウインドウを、前記オ
ーディオ試験信号の前記事前記憶表現の正確に同期した再生信号の一部と比較し
、前記受信したオーディオ試験信号の品質測定値を出力する過程が、ITU P
.861知覚スピーチ品質測定(PSQM)、測定正規化ブロック(MNB)、
修正バークスペクトル歪み(MBSD)測定及び知覚解析測定システム(PAM
S)からなる品質測定群から選択される少なくとも1つの品質測定アルゴリズム
により品質測定値を生成する過程を有することを特徴とする請求項3に記載の方
法。 - 【請求項11】 前記ヘッダ信号における音声文IDを受信する過程と、 前記受信した音声文IDにより前記品質測定値を生成するために品質測定アル
ゴリズムを選択する過程とをさらに有することを特徴とする請求項10に記載の
方法。 - 【請求項12】前記ヘッダにおいて送信されたユニークワードを受信する過
程と、 前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニーク
ワードが受信されたことを照合する過程とをさらに有することを特徴とする請求
項3に記載の方法。 - 【請求項13】ユニークワードを受信する過程が、ユニークワードを表すD
TMF信号を受信する過程を有することを特徴とする請求項12に記載の方法。 - 【請求項14】前記品質測定値を生成するために前記ウインドウ化部分を比
較する過程に先行して、前記受信したオーディオ試験信号の少なくとも1つのウ
インドウと前記オーディオ試験信号の前記正確に同期した事前記憶表現のウイン
ドウとに窓関数を適用する過程をさらに有することを特徴とする請求項1に記載
の方法。 - 【請求項15】窓関数を適用する過程が、窓関数を事前選択する過程を有す
ることを特徴とする請求項14に記載の方法。 - 【請求項16】窓関数を適用する過程が、窓関数を適応的に選択する過程を
有することを特徴とする請求項15に記載の方法。 - 【請求項17】試験下の装置により受信される品質試験信号の品質を評価す
るためのオーディオ品質アナライザ(AQA)であって、前記品質試験信号がオ
ーディオ試験信号を有し、前記AQAが、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
試験信号に粗く同期し、 前記オーディオ試験信号の事前記憶表現の再生信号を前記受信したオーディオ
試験信号に正確に同期し、 前記受信したオーディオ試験信号のウインドウを、前記オーディオ試験信号の
前記事前記憶表現の前記正確に同期した再生信号の一部と比較し、前記受信した
オーディオ試験信号の品質測定値を出力するように構成されることを特徴とする
オーディオ品質アナライザ。 - 【請求項18】前記品質試験信号が同期パルスを有し、前記AQAが、前記
同期パルスを用いて、前記オーディオ試験信号の前記事前記憶表現の再生信号を
前記受信したオーディオ試験信号に粗く同期するように構成されることを特徴と
する請求項17に記載のAQA。 - 【請求項19】前記AQAが、 前記受信したオーディオ試験信号のウインドウ化部分のデータと前記オーディ
オ試験信号の前記事前記憶表現のウインドウ化部分のデータとを比較し、 前記比較の結果により、前記受信したオーディオ試験信号のウインドウ化部分
と前記オーディオ試験信号の前記事前記憶表現のウインドウ化部分の位置合わせ
を調整するように構成されることを特徴とする請求項18に記載のAQA。 - 【請求項20】前記ヘッダ信号を帯域外で受信するようにさらに構成される
ことを特徴とする請求項19に記載のAQA。 - 【請求項21】前記ヘッダ信号を帯域内で受信するようにさらに構成される
ことを特徴とする請求項19に記載のAQA。 - 【請求項22】前記ヘッダ信号としてDTMF信号を受信し、かつ前記オー
ディオ試験信号の前記事前記憶表現の再生信号をDTMFパルスと粗く同期をと
るようにさらに構成されることを特徴とする請求項21に記載のAQA。 - 【請求項23】前記オーディオ試験信号が音声試験信号であり、前記オーデ
ィオ試験信号の前記事前記憶表現が音声試験信号の事前記憶表現であることを特
徴とする請求項19に記載のAQA。 - 【請求項24】前記受信した音声試験信号を識別する音声文IDを受信し、 前記受信した音声文IDにより、複数の事前記憶表現から前記音声試験信号の
前記事前記憶表現を選択するようにさらに構成されることを特徴とする請求項2
3に記載のAQA。 - 【請求項25】前記音声文IDとして、DTMF信号を受信するようにさら
に構成されることを特徴とする請求項24に記載のAQA。 - 【請求項26】ITU P.861知覚スピーチ品質測定(PSQM)、測
定正規化ブロック(MNB)、修正バークスペクトル歪み(MBSD)測定及び
知覚解析測定システム(PAMS)からなる品質測定アルゴリズム群から選択さ
れる少なくとも1つの品質測定アルゴリズムにより品質測定値を生成するように
構成されることを特徴とする請求項19に記載のAQA。 - 【請求項27】前記ヘッダ信号における音声文IDを受信し、 前記受信した音声文IDにより前記品質測定値を生成するための品質測定アル
ゴリズムを選択するように構成されることを特徴とする請求項26に記載のAQ
A。 - 【請求項28】前記ヘッダ信号において送信されたユニークワードを受信し
、 前記受信したオーディオ試験信号の品質測定値を出力する前に、前記ユニーク
ワードが受信されたことを照合するようにさらに構成されたことを特徴とする請
求項19に記載のAQA。 - 【請求項29】前記ユニークワードを表すDTMF信号を受信するようにさ
らに構成されることを特徴とする請求項28に記載のAQA。 - 【請求項30】前記受信したオーディオ試験信号の前記品質測定値を生成す
るために、前記受信したオーディオ試験信号の前記ウインドウ化部分の少なくと
も1つのウインドウと前記オーディオ試験信号の前記正確に同期した事前記憶表
現のウインドウ化部分とを比較する前に、それらウインドウに窓関数を適用する
ように構成されることを特徴とする請求項19に記載のAQA。 - 【請求項31】事前選択された窓関数を適用するように構成されることを特
徴とする請求項30に記載のAQA。 - 【請求項32】窓関数を適応的に適用するように構成されることを特徴とす
る請求項31に記載のAQA。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US1999/011473 WO2000072306A1 (en) | 1999-05-25 | 1999-05-25 | Real-time quality analyzer for voice and audio signals |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003500701A true JP2003500701A (ja) | 2003-01-07 |
JP4500458B2 JP4500458B2 (ja) | 2010-07-14 |
Family
ID=22272829
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000620620A Expired - Fee Related JP4500458B2 (ja) | 1999-05-25 | 1999-05-25 | 音声及びオーディオ信号用リアルタイム品質アナライザ |
Country Status (4)
Country | Link |
---|---|
JP (1) | JP4500458B2 (ja) |
KR (1) | KR100623214B1 (ja) |
AU (1) | AU4097099A (ja) |
WO (1) | WO2000072306A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012242542A (ja) * | 2011-05-18 | 2012-12-10 | Nippon Hoso Kyokai <Nhk> | 音声比較装置及び音声比較プログラム |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102004008207B4 (de) * | 2004-02-19 | 2006-01-05 | Opticom Dipl.-Ing. Michael Keyhl Gmbh | Verfahren und Vorrichtung zur Qualitätsbeurteilung eines Audiosignals und Vorrichtung und Verfahren zum Erhalten eines Qualitätsbeurteilungsergebnisses |
US20060093094A1 (en) * | 2004-10-15 | 2006-05-04 | Zhu Xing | Automatic measurement and announcement voice quality testing system |
US9300694B2 (en) | 2011-01-11 | 2016-03-29 | INHA—Industry Partnership Institute | Audio signal quality measurement in mobile device |
US9412373B2 (en) * | 2013-08-28 | 2016-08-09 | Texas Instruments Incorporated | Adaptive environmental context sample and update for comparing speech recognition |
CN107785031B (zh) * | 2017-10-18 | 2021-01-22 | 京信通信系统(中国)有限公司 | 一种测试无线通信中有线网络侧语音损伤的方法及基站 |
CN108877839B (zh) * | 2018-08-02 | 2021-01-12 | 南京华苏科技有限公司 | 基于语音语义识别技术的语音质量感知评估的方法及系统 |
CN109979487B (zh) * | 2019-03-07 | 2021-07-30 | 百度在线网络技术(北京)有限公司 | 语音信号检测方法和装置 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS622286A (ja) * | 1985-06-27 | 1987-01-08 | 松下電器産業株式会社 | 発音練習装置 |
WO1997005730A1 (en) * | 1995-07-27 | 1997-02-13 | British Telecommunications Public Limited Company | Assessment of signal quality |
WO1998016031A2 (en) * | 1996-10-08 | 1998-04-16 | Ericsson Inc. | Improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization |
WO1998018295A1 (de) * | 1996-10-21 | 1998-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Triggerung eines messverfahrens zur qualitätsbeurteilung von audio- und/oder sprachsignalen |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5633909A (en) * | 1994-06-17 | 1997-05-27 | Centigram Communications Corporation | Apparatus and method for generating calls and testing telephone equipment |
US5809108A (en) * | 1996-09-27 | 1998-09-15 | Mci Communications Corporation | Automated test call generation and execution system |
-
1999
- 1999-05-25 AU AU40970/99A patent/AU4097099A/en not_active Abandoned
- 1999-05-25 KR KR1020017000881A patent/KR100623214B1/ko not_active IP Right Cessation
- 1999-05-25 JP JP2000620620A patent/JP4500458B2/ja not_active Expired - Fee Related
- 1999-05-25 WO PCT/US1999/011473 patent/WO2000072306A1/en active IP Right Grant
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS622286A (ja) * | 1985-06-27 | 1987-01-08 | 松下電器産業株式会社 | 発音練習装置 |
WO1997005730A1 (en) * | 1995-07-27 | 1997-02-13 | British Telecommunications Public Limited Company | Assessment of signal quality |
JPH11510334A (ja) * | 1995-07-27 | 1999-09-07 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | 信号品質の評価 |
WO1998016031A2 (en) * | 1996-10-08 | 1998-04-16 | Ericsson Inc. | Improved synchronization of a receiver with a transmitter using early-late testing during coarse synchronization |
JP2001502134A (ja) * | 1996-10-08 | 2001-02-13 | エリクソン インコーポレイテッド | 粗同期中における早晩テストを用いる受信機の送信機との改善された同期 |
WO1998018295A1 (de) * | 1996-10-21 | 1998-04-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Triggerung eines messverfahrens zur qualitätsbeurteilung von audio- und/oder sprachsignalen |
JP2000505269A (ja) * | 1996-10-21 | 2000-04-25 | フラウンホーファー・ゲゼルシャフト ツア フェルデルンク デル アンゲワンテン フォルシュンク アインゲトラーゲナー フェライン | オーディオおよび/または音声信号を品質評価するための測定方法のトリガー方法および装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012242542A (ja) * | 2011-05-18 | 2012-12-10 | Nippon Hoso Kyokai <Nhk> | 音声比較装置及び音声比較プログラム |
Also Published As
Publication number | Publication date |
---|---|
KR100623214B1 (ko) | 2006-09-12 |
WO2000072306A1 (en) | 2000-11-30 |
JP4500458B2 (ja) | 2010-07-14 |
AU4097099A (en) | 2000-12-12 |
KR20010106412A (ko) | 2001-11-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6823302B1 (en) | Real-time quality analyzer for voice and audio signals | |
EP0840975B1 (en) | Assessment of signal quality | |
US20190231233A1 (en) | Hearing test and modification of audio signals | |
CA2196554C (en) | Test method | |
RU2312405C2 (ru) | Способ осуществления машинной оценки качества звуковых сигналов | |
CN102214464B (zh) | 音频信号的瞬态检测方法以及基于该方法的时长调整方法 | |
CN112017687B (zh) | 一种骨传导设备的语音处理方法、装置及介质 | |
JP2004514327A (ja) | 電気通信網における電話リンクの会話品質の測定 | |
US6564181B2 (en) | Method and system for measurement of speech distortion from samples of telephonic voice signals | |
JPH0654364A (ja) | 移動電話システムにおける主観的な対話の質を比較するための装置 | |
CN111640411B (zh) | 音频合成方法、装置及计算机可读存储介质 | |
US7050924B2 (en) | Test signalling | |
CN100499694C (zh) | 测试语音质量的方法及装置 | |
US6834040B2 (en) | Measurement synchronization method for voice over packet communication systems | |
JP2003500701A (ja) | 音声及びオーディオ信号用リアルタイム品質アナライザ | |
Barnwell III | Objective measures for speech quality testing | |
FR2817096A1 (fr) | Procede et systeme de detection non intrusive des defauts d'un signal de parole transmis en telephonie sur reseau de transmission par paquets | |
KR101151746B1 (ko) | 오디오 신호용 잡음제거 방법 및 장치 | |
Nakatsui et al. | Subjective speech‐to‐noise ratio as a measure of speech quality for digital waveform coders | |
JP2905112B2 (ja) | 環境音分析装置 | |
Kitawaki et al. | Objective quality assessment of wideband speech coding | |
JP2002300259A (ja) | 音声通話装置の評価試験方法及びシステム | |
Ghimire | Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863 | |
Holub et al. | Impact of end to end encryption on GSM speech transmission quality-a case study | |
CN116778954A (zh) | 一种广播系统静音检测方法、音频输出设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060425 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081104 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090202 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090209 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090501 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100406 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100419 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130423 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140423 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |