JP5204904B2 - オーディオ信号品質予測 - Google Patents
オーディオ信号品質予測 Download PDFInfo
- Publication number
- JP5204904B2 JP5204904B2 JP2011546623A JP2011546623A JP5204904B2 JP 5204904 B2 JP5204904 B2 JP 5204904B2 JP 2011546623 A JP2011546623 A JP 2011546623A JP 2011546623 A JP2011546623 A JP 2011546623A JP 5204904 B2 JP5204904 B2 JP 5204904B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- distortion
- spectral
- quality
- parameter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000005236 sound signal Effects 0.000 title claims description 40
- 230000003595 spectral effect Effects 0.000 claims description 92
- 238000000034 method Methods 0.000 claims description 25
- 238000004891 communication Methods 0.000 claims description 24
- 238000006073 displacement reaction Methods 0.000 claims description 24
- 238000004364 calculation method Methods 0.000 claims description 18
- 238000001228 spectrum Methods 0.000 claims description 13
- 230000007704 transition Effects 0.000 claims description 7
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 12
- 230000010354 integration Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 230000005540 biological transmission Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 239000000654 additive Substances 0.000 description 3
- 230000000996 additive effect Effects 0.000 description 3
- 230000001360 synchronised effect Effects 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
Description
前記リファレンス信号及び前記処理済信号を、所定の長さを有する少なくとも2つの第1のブロックに分割するステップと、
前記第1のブロックの各々の信号のスペクトル特性を表す少なくとも2つの異なるスペクトルパラメータを計算するステップと、
前記第1のブロックの各々に対して、前記リファレンス信号の計算された各スペクトルパラメータと前記処理済信号の対応する計算されたスペクトルパラメータとの間の歪みを計算するステップと、
前記リファレンス信号と前記処理済信号との間の複数の異なる時間変位に対する前記歪みの統合値を計算するステップと、
最適な時間変位における前記歪みの最小統合値から前記オーディオ信号の第1の品質値を判定するステップと、
を有する。
前記リファレンス信号及び前記処理済信号を、各々が所定の数の前記第1のブロックを含む少なくとも1つの第2のブロックに分割するステップと、
前記第2のブロックに含まれる前記第1のブロックの各々に対して計算された前記スペクトルパラメータの各々から第2のパラメータを計算するステップと、
前記最適な時間変位における、前記リファレンス信号の前記第2のパラメータの各々と前記処理済信号の対応する前記第2のパラメータとの間の歪みを計算するステップと、
前記計算された歪みの統合値から、第2の品質値を判定するステップと、
を更に有することができる。
式(14)においてk1=k2である場合、第1の品質値及び第2の品質値は同一の重みを付与される。しかし、更なる実施形態によれば、第1の品質値及び第2の品質値は異なる重みを付与され、異なる重みは上記の(14)においてk1≠k2で示される。一部の歪みがより大きい信号区分における例えば加法性背景雑音、帯域幅制限及びエネルギ損失等のより大きいパラメータを用いて容易に記述されるため、特定の歪みが検出された場合、予測される総合品質値においては、例えばインデクスBを有するより大きいブロックから予測された第2の品質値にはより大きい重みを付与してもよい。従って、総合品質値において、第2の大スケールの品質値に、より大きい重みを付与することが有利である場合がある。この場合、上記の式(14)においてk1<k2である。
・ リファレンス信号及び処理済信号を、各々が第1のブロックより大きく且つ所定の数、すなわち2つ以上の第1のブロックを含む1つ以上の第2のブロックに分割する第2の分割手段と、
・ 第2の大ブロックに含まれる第1の小ブロックの各々に対して計算された各スペクトルパラメータから第2のパラメータを計算する第2のパラメータ計算手段と、
・ 処理済信号とリファレンス信号との間の最適な時間変位m*においてリファレンス信号の第2のパラメータの各々と処理済信号の対応する第2のパラメータとの間の歪みを計算し、第2のブロックの各々に対する局所歪みを判定する第2の歪み計算手段と、
・ 計算された局所歪みの統合値から第2の品質値を判定する第2の品質判定手段と、
を備える。
RMSE − 二乗平均誤差(Root Mean Squared Error)
VoIP − Voice Over Internet Protocol
n − 第1のブロック、すなわち20〜40ミリ秒の小ブロックに対するブロックインデクス
B − 各々が2つ以上の第1の小ブロックを含む第2の大ブロックに対するブロックインデクス
N − 信号シーケンス内のブロック数
w − 1つのブロック内の周波数ビンのインデクス
r − リファレンス信号に関連するパラメータ
p − 処理済信号に関連するパラメータ
Claims (23)
- 通信システムへの入力信号に対応するリファレンス信号と前記通信システムからの出力信号に対応する処理済信号とを用いて、前記通信システムを介して送信されたオーディオ信号の品質を予測する方法であって、
前記リファレンス信号及び前記処理済信号を、所定の長さを有する少なくとも2つの第1のブロックに分割するステップ(51)と、
前記第1のブロックの各々の信号のスペクトル特性を表す少なくとも2つの異なるスペクトルパラメータを計算するステップ(52)と、
前記第1のブロックの各々に対して、前記リファレンス信号の計算された各スペクトルパラメータと前記処理済信号の対応する計算されたスペクトルパラメータとの間の歪みを計算するステップ(53)と、
前記リファレンス信号と前記処理済信号との間の複数の異なる時間変位に対する前記歪みの統合値を計算するステップ(54)と、
最適な時間変位における前記歪みの最小統合値から前記オーディオ信号の第1の品質値を判定するステップ(55)と、
を有することを特徴とする方法。 - 前記判定された第1の品質値により示される前記品質は、前記歪みの前記最小統合値に反比例することを特徴とする請求項1に記載の方法。
- 前記スペクトルパラメータの数は3つであることを特徴とする請求項1又は2に記載の方法。
- 前記スペクトルパラメータのうちの1つは、パワースペクトルの共鳴構造を示すスペクトル平坦特性を表すことを特徴とする請求項1乃至3のいずれか1項に記載の方法。
- 前記スペクトルパラメータのうちの1つは、信号エネルギの変化率を示すRMSE正規化遷移率を表すことを特徴とする請求項1乃至4のいずれか1項に記載の方法。
- 前記スペクトルパラメータのうちの1つは、信号エネルギが集中する周波数を示すスペクトルセントロイドを表すことを特徴とする請求項1乃至5のいずれか1項に記載の方法。
- 前記リファレンス信号及び前記処理済信号を、各々が所定の数の前記第1のブロックを含む少なくとも1つの第2のブロックに分割するステップ(61)と、
前記第2のブロックに含まれる前記第1のブロックの各々に対して計算された前記スペクトルパラメータの各々から第2のパラメータを計算するステップ(62)と、
前記最適な時間変位における、前記リファレンス信号の前記第2のパラメータの各々と前記処理済信号の対応する前記第2のパラメータとの間の歪みを計算するステップ(63)と、
前記計算された歪みの統合値から、第2の品質値を判定するステップ(64)と、
を更に有することを特徴とする請求項1乃至6のいずれか1項に記載の方法。 - 前記判定された第2の品質値は、前記歪みの統合値に反比例することを特徴とする請求項7に記載の方法。
- 前記判定された第1の品質値と前記判定された第2の品質値とを組み合わせることにより前記オーディオ信号の総合品質値を判定するステップを更に有することを特徴とする請求項7又は8に記載の方法。
- 前記第1の品質値と前記第2の品質値との組み合わせは、互いに異なる重みを用いた重み付け和によって行われることを特徴とする請求項9に記載の方法。
- 前記第2のパラメータの計算は、前記第2のブロックに含まれる前記第1のブロックの各々に対して計算された前記スペクトルパラメータの平均、分散又は歪度の判定を含むことを特徴とする請求項7乃至10のいずれか1項に記載の方法。
- 通信システムへの入力信号に対応するリファレンス信号(11)と前記通信システムからの歪んだ出力信号に対応する処理済信号(12)とを用いて、前記通信システムを介して送信されたオーディオ信号の品質を予測する装置(42)であって、
前記リファレンス信号及び前記処理済信号を、所定の長さを有する少なくとも2つの第1のブロックに分割する信号分割手段(71)と、
前記第1のブロックの各々の信号のスペクトル特性を表す少なくとも2つの異なるスペクトルパラメータを計算するパラメータ計算手段(72)と、
前記第1のブロックの各々に対して、前記処理済信号の各スペクトルパラメータと前記リファレンス信号の対応するスペクトルパラメータとの間の歪みを計算する歪み計算手段(73)と、
前記リファレンス信号と前記処理済信号との間の複数の異なる時間変位における前記計算された歪みの統合値を計算する統合値計算手段(74)と、
最適な時間変位における前記歪みの最小統合値から前記オーディオ信号の第1の品質値を判定する第1の品質判定手段(75)と、
を備えることを特徴とする装置。 - 前記判定された第1の品質値により示される前記品質は、前記歪みの前記最小統合値に反比例することを特徴とする請求項12に記載の装置。
- 前記スペクトルパラメータの数は3つである請求項12又は13に記載の装置。
- 前記スペクトルパラメータのうちの1つは、パワースペクトルの共鳴構造を示すスペクトル平坦特性を表すことを特徴とする請求項12乃至14のいずれか1項に記載の装置。
- 前記スペクトルパラメータのうちの1つは、信号エネルギの変化率を示すRMSE正規化遷移率を表すことを特徴とする請求項12乃至15のいずれか1項に記載の装置。
- 前記スペクトルパラメータのうちの1つは、信号エネルギが集中する周波数を示すスペクトルセントロイドを表すことを特徴とする請求項12乃至16のいずれか1項に記載の装置。
- 第2の品質値を判定する手段を更に備え、該手段は、
前記リファレンス信号(11)及び前記処理済信号(12)を、各々が所定の数の前記第1のブロックを含む少なくとも1つの第2のブロックに分割する第2の分割手段と、
前記第2のブロックに含まれる前記第1のブロックの各々に対して計算された前記スペクトルパラメータの各々から第2のパラメータを計算する第2のパラメータ計算手段と、
前記最適な時間変位における、前記リファレンス信号の前記第2のパラメータの各々と前記処理済信号の対応する前記第2のパラメータとの間の歪みを計算する第2の歪み計算手段と、
前記計算された歪みの統合値から、第2の品質値を判定する第2の品質判定手段と、
を含むことを特徴とする請求項12乃至17のいずれか1項に記載の装置。 - 前記判定された第2の品質値は、前記歪みの統合値に反比例することを特徴とする請求項18に記載の装置。
- 前記第1の品質値と前記第2の品質値とを組み合わせることにより前記オーディオ信号の総合品質値を判定する品質判定手段を更に備えることを特徴とする請求項18又は19に記載の装置。
- 前記第1の品質値と前記第2の品質値との組み合わせは、互いに異なる重みを用いた重み付け和によって行われることを特徴とする請求項20に記載の装置。
- 前記第2のパラメータの計算は、前記第2のブロックに含まれる前記第1のブロックの各々に対して計算された前記スペクトルパラメータの平均、分散又は歪度を判定することを含むことを特徴とする請求項18乃至21のいずれか1項に記載の装置。
- 前記装置は、前記リファレンス信号の挿入点及び前記歪んだ処理済信号の受信点である、前記通信システムの2つの点に接続されることを特徴とする請求項12乃至22のいずれか1項に記載の装置。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2009/051054 WO2010086020A1 (en) | 2009-01-30 | 2009-01-30 | Audio signal quality prediction |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2012516591A JP2012516591A (ja) | 2012-07-19 |
JP5204904B2 true JP5204904B2 (ja) | 2013-06-05 |
Family
ID=41136699
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011546623A Expired - Fee Related JP5204904B2 (ja) | 2009-01-30 | 2009-01-30 | オーディオ信号品質予測 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20120020484A1 (ja) |
EP (1) | EP2392003B1 (ja) |
JP (1) | JP5204904B2 (ja) |
WO (1) | WO2010086020A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2011010962A1 (en) * | 2009-07-24 | 2011-01-27 | Telefonaktiebolaget L M Ericsson (Publ) | Method, computer, computer program and computer program product for speech quality estimation |
US8493202B1 (en) | 2010-03-22 | 2013-07-23 | Alarm.Com | Alarm signaling technology |
JP5750167B2 (ja) * | 2010-12-07 | 2015-07-15 | エンパイア テクノロジー ディベロップメント エルエルシー | 端末間の体感品質を測定するためのオーディオフィンガープリントの差分 |
BR112014007481A2 (pt) * | 2011-09-29 | 2017-04-04 | Dolby Int Ab | detecção de alta qualidade em sinais de rádio fm estéreo |
US9830905B2 (en) | 2013-06-26 | 2017-11-28 | Qualcomm Incorporated | Systems and methods for feature extraction |
US11888919B2 (en) * | 2013-11-20 | 2024-01-30 | International Business Machines Corporation | Determining quality of experience for communication sessions |
US9325838B2 (en) * | 2014-07-22 | 2016-04-26 | International Business Machines Corporation | Monitoring voice over internet protocol (VoIP) quality during an ongoing call |
US10490206B2 (en) * | 2016-01-19 | 2019-11-26 | Dolby Laboratories Licensing Corporation | Testing device capture performance for multiple speakers |
EP3483878A1 (en) * | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
JP7212925B2 (ja) * | 2018-10-30 | 2023-01-26 | 国立大学法人九州大学 | 音声伝達環境評価システム及び感覚刺激提示装置 |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09331391A (ja) * | 1996-06-12 | 1997-12-22 | Nippon Telegr & Teleph Corp <Ntt> | 通話品質客観推定装置 |
US6201176B1 (en) * | 1998-05-07 | 2001-03-13 | Canon Kabushiki Kaisha | System and method for querying a music database |
WO2000022803A1 (en) * | 1998-10-08 | 2000-04-20 | British Telecommunications Public Limited Company | Measurement of speech signal quality |
FR2835125B1 (fr) * | 2002-01-24 | 2004-06-18 | Telediffusion De France Tdf | Procede d'evaluation d'un signal audio numerique |
JP3809164B2 (ja) * | 2002-12-25 | 2006-08-16 | 日本電信電話株式会社 | 総合通話品質推定方法及び装置、その方法を実行するプログラム、及びその記録媒体 |
KR101101384B1 (ko) * | 2003-04-24 | 2012-01-02 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 파라미터화된 시간 특징 분석 |
JP4341586B2 (ja) * | 2005-06-08 | 2009-10-07 | Kddi株式会社 | 通話品質の客観評価サーバ、方法及びプログラム |
JP2007013674A (ja) * | 2005-06-30 | 2007-01-18 | Ntt Docomo Inc | 総合通話品質評価装置および総合通話品質評価方法 |
US7933427B2 (en) * | 2006-06-27 | 2011-04-26 | Motorola Solutions, Inc. | Method and system for equal acoustics porting |
JP4597919B2 (ja) * | 2006-07-03 | 2010-12-15 | 日本電信電話株式会社 | 音響信号特徴抽出方法、抽出装置、抽出プログラム、該プログラムを記録した記録媒体、および該特徴を利用した音響信号検索方法、検索装置、検索プログラム、並びに該プログラムを記録した記録媒体 |
-
2009
- 2009-01-30 US US13/146,426 patent/US20120020484A1/en not_active Abandoned
- 2009-01-30 EP EP09778994A patent/EP2392003B1/en not_active Not-in-force
- 2009-01-30 WO PCT/EP2009/051054 patent/WO2010086020A1/en active Application Filing
- 2009-01-30 JP JP2011546623A patent/JP5204904B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
WO2010086020A1 (en) | 2010-08-05 |
US20120020484A1 (en) | 2012-01-26 |
EP2392003A1 (en) | 2011-12-07 |
EP2392003B1 (en) | 2013-01-02 |
JP2012516591A (ja) | 2012-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5204904B2 (ja) | オーディオ信号品質予測 | |
KR100883712B1 (ko) | 음원 방향 추정 방법, 및 음원 방향 추정 장치 | |
EP2587842B1 (en) | Device and method for detecting tone frequency | |
CN102549657B (zh) | 用于确定音频系统的感知质量的方法和系统 | |
KR101430321B1 (ko) | 오디오 시스템의 지각 품질을 결정하기 위한 방법 및 시스템 | |
KR20180073649A (ko) | 에코 지연을 추적하는 방법 및 장치 | |
CN102598119B (zh) | 基音估计 | |
EP1432137A2 (en) | Echo detection and monitoring | |
JP2004272052A (ja) | 音声区間検出装置 | |
JP2005165021A (ja) | 雑音低減装置、および低減方法 | |
JP2013500498A (ja) | 音声品質の評価のための方法、コンピュータ、コンピュータプログラム、およびコンピュータプログラム製品 | |
JP2010112995A (ja) | 通話音声処理装置、通話音声処理方法およびプログラム | |
JP2012181429A (ja) | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム | |
WO2013170610A1 (zh) | 检测基音周期的正确性的方法和装置 | |
EP2438591B1 (en) | A method and arrangement for estimating the quality degradation of a processed signal | |
JPH0844395A (ja) | 音声ピッチ検出装置 | |
US11437054B2 (en) | Sample-accurate delay identification in a frequency domain | |
KR20130116897A (ko) | 예측 인코딩을 위한 인코더 및 방법, 디코딩을 위한 디코더 및 방법, 예측 인코딩 및 디코딩을 위한 시스템 및 방법, 및 예측 인코딩된 정보 신호 | |
JP5611393B2 (ja) | 遅延時間測定装置、遅延時間測定方法及びプログラム | |
JP5952252B2 (ja) | 通話品質推定方法、通話品質推定装置、及びプログラム | |
JP4430566B2 (ja) | 客観品質評価装置および方法 | |
Waltermann et al. | Towards a new E-model impairment factor for linear distortion of narrowband and wideband speech transmission | |
JP2004158925A (ja) | ディジタルデータ処理装置およびディジタルデータ処理方法 | |
JP4514149B2 (ja) | 音声品質推定装置および音声品質推定方法 | |
JP5792689B2 (ja) | 送話ラウドネス定格情報測定装置、及び送話ラウドネス定格情報測定方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130201 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130208 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130215 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5204904 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160222 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |