DK2465113T3 - Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem - Google Patents

Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem Download PDF

Info

Publication number
DK2465113T3
DK2465113T3 DK10751828.4T DK10751828T DK2465113T3 DK 2465113 T3 DK2465113 T3 DK 2465113T3 DK 10751828 T DK10751828 T DK 10751828T DK 2465113 T3 DK2465113 T3 DK 2465113T3
Authority
DK
Denmark
Prior art keywords
reference signal
output signal
signal
level
scaling
Prior art date
Application number
DK10751828.4T
Other languages
English (en)
Inventor
John Beerends
Vugt Jeroen Van
Original Assignee
Koninkl Kpn Nv
Tno
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninkl Kpn Nv, Tno filed Critical Koninkl Kpn Nv
Application granted granted Critical
Publication of DK2465113T3 publication Critical patent/DK2465113T3/da

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/22Arrangements for supervision, monitoring or testing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/69Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Circuit For Audible Band Transducer (AREA)

Claims (9)

1. Fremgangsmåde til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet af et udgangssignal fra et lydsystem, i forhold til et referencesignal, hvor referencesignalet og udgangssignalet behandles og sammenlignes, og hvor behandlingen indbefatter opdeling af referencesignalet og udgangssignalet i indbyrdes tilsvarende tidsrammer, hvor behandlingen endvidere omfatter: - skalering af referencesignalets intensitet i retning mod et fast intensitetsniveau; - udførelse af målinger på tidsrammer inden for det skalerede referencesignal for at bestemme karakteristika for referencesignal-tidsrammen; kendetegnet ved, at fremgangsmåden endvidere omfatter følgende trin: - skalering af referencesignalets intensitet ud fra det faste intensitetsniveau i retning mod et intensitetsniveau, der er relateret til udgangssignalet; skalering af udgangssignalets lydstyrke i retning mod et fast lydstyrkeniveau i det perceptuelle lydstyrkeområde, hvor skalering af udgangssignalets lydstyrke sker ved hjælp af karakteristikaene for referencesignal-tidsrammen; og skalering af referencesignalets lydstyrke ud fra et lydstyrkeniveau, der svarer til det udgangssignal-relaterede intensitetsniveau i retning mod et lydstyrkeniveau, der er relateret til lydstyrkeniveauet for det skalerede udgangssignal i det perceptuelle lydstyrkeområde, hvor skaleringen af referencesignalets lydstyrke sker ved hjælp af karakteristikaene for referencesignal-tidsrammen; perceptuel subtraktion af referencesignalet og udgangssignalet for at danne et differenssignal; samt udledning af kvalitetsindikatoren fra differenssignalet.
2. Fremgangsmåde ifølge krav 1, hvor skalering af referencesignalets intensitet ud fra det faste intensitetsniveau i retning mod et intensitetsniveau, der er relateret til udgangssignalet, er baseret på multiplikation af referencesignalet med en skaleringsfaktor, hvor skaleringsfaktoren er defineret ved: bestemmelse af et gennemsnitligt referencesignal-intensitetsniveau for at antal tidsrammer; bestemmelse af et gennemsnitligt udgangssignal-intensitetsniveau for et antal tidsrammer, der svarer til tidsrammerne for det referencesignal, der anvendes til at bestemme det gennemsnitlige referencesignal-intensitetsniveau; - udledning af en foreløbig skaleringsfaktor ved at bestemme en brøkdel, der er baseret på det gennemsnitlige referencesignal-intensitetsniveau og det gennemsnitlige udgangssignal-intensitetsniveau; bestemmelse af en skaleringsfaktor ved at definere, at skaleringsfaktoren skal være lig med den foreløbige skaleringsfaktor, hvis den foreløbige skaleringsfaktor er mindre end en tærskelværdi, og som ellers skal være lig med den foreløbige skaleringsfaktor, der øges med en ekstra foreløbig skaleringsfaktor-afhængig værdi.
3. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor fremgangsmåden, inden lydstyrkeskaleringen af udgangsniveauet til en fast lydstyrke, endvidere omfatter: - lokal skalering af lydstyrkeniveauet for referencesignalet i retning mod udgangssignalets lydstyrkeniveau for dele af referencesignalet med en lydstyrke, der er højere end udgangssignalets lydstyrkeniveau; og efterfølgende lokal skalering af udgangssignalets lydstyrkeniveau i retning mod referencesignalets lydstyrkeniveau for dele af udgangssignalet med en lydstyrke, der er højere end referencesignalets lydstyrkeniveau.
4. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor referencesignalet i det perceptuelle lydstyrkeområde - inden skalering i retning mod et lydstyrkeniveau, der er relateret til udgangssignalets lydstyrkeniveau i det perceptuelle lydstyrkeområde underkastes en støjdæmpningshandling for at dæmpe støj op til et forudbestemt støjniveau.
5. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor udgangssignalet i det perceptuelle lydstyrkeområde, inden skaleringen i retning mod en fast lydstyrke, underkastes en støjdæmpningsalgoritme for at dæmpe støj op til et støjniveau, som er repræsentativt for forstyrrelse.
6. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor referencesignalet og udgangssignalet i det perceptuelle lydstyrkeområde, inden sammenligning, underkastes global støjdæmpning.
7. Fremgangsmåde ifølge krav 1, hvor lydsystemet er en talebehandlingsanordning.
8. Computerprogramprodukt, der omfatter computer-eksekverbar kode, som for eksempel er lagret på et computerlæsbart medium, der er indrettet til at udføre, når udførelsen foretages af en processor, fremgangsmåden som defineret i et hvilket som helst af kravene 1 - 7.
9. System (20) til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet af et udgangssignal Y (t) fra et lydsystem (10), for eksempel en talebehandlingsanordning, i forhold til et indgangssignal X(t) i lydsystemet, der fungerer som et referencesignal, hvilket system omfatter: en forbehandlingsanordning (30) til forbehandling af referencesignalet og udgangssignalet; en første behandlingsanordning (40a) til behandling af referencesignalet, og en anden behandlingsanordning (40b) til behandling af udgangssignalet for at opnå repræsentationssignaler R(X), R(Y) for henholdsvis referencesignalet og udgangssignalet; en differentieringsanordning (50) til at kombinere repræsentationssignalerne for referencesignalet og udgangssignalet for på denne måde at opnå et differentielt signal D; og en modelleringsanordning (60) til behandling af differentialesignalet for at opnå et kvalitetssignal Q, der repræsenterer et estimat af den perceptuelle kvalitet af talebehandlingssysternet; hvor forbehandlingsanordningen, den første behandlingsanordning og den anden behandlingsanordning danner et behandlingssystem til udførelse af fremgangsmåden ifølge et hvilket som helst af kravene 1-7.
DK10751828.4T 2009-08-14 2010-08-09 Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem DK2465113T3 (da)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP09010501 2009-08-14
EP10161830 2010-05-04
PCT/EP2010/061542 WO2011018430A1 (en) 2009-08-14 2010-08-09 Method and system for determining a perceived quality of an audio system

Publications (1)

Publication Number Publication Date
DK2465113T3 true DK2465113T3 (da) 2015-04-07

Family

ID=42985662

Family Applications (1)

Application Number Title Priority Date Filing Date
DK10751828.4T DK2465113T3 (da) 2009-08-14 2010-08-09 Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem

Country Status (8)

Country Link
US (1) US8818798B2 (da)
EP (1) EP2465113B1 (da)
JP (1) JP5542206B2 (da)
KR (1) KR101430321B1 (da)
CN (1) CN102576535B (da)
DK (1) DK2465113T3 (da)
ES (1) ES2531556T3 (da)
WO (1) WO2011018430A1 (da)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8873762B2 (en) * 2011-08-15 2014-10-28 Stmicroelectronics Asia Pacific Pte Ltd System and method for efficient sound production using directional enhancement
EP2733700A1 (en) * 2012-11-16 2014-05-21 Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating intelligibility of a degraded speech signal
EP2922058A1 (en) * 2014-03-20 2015-09-23 Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO Method of and apparatus for evaluating quality of a degraded speech signal
ES2916254T3 (es) 2014-10-10 2022-06-29 Dolby Laboratories Licensing Corp Sonoridad de programa basada en la presentación, independiente de la transmisión
CN106887233B (zh) * 2015-12-15 2020-01-24 广州酷狗计算机科技有限公司 音频数据处理方法及系统
JP6461064B2 (ja) * 2016-09-28 2019-01-30 本田技研工業株式会社 音響特性校正方法
CN107452399B (zh) * 2017-09-18 2020-09-15 腾讯音乐娱乐科技(深圳)有限公司 音频特征提取方法及装置
CN109903752B (zh) * 2018-05-28 2021-04-20 华为技术有限公司 对齐语音的方法和装置
US11172293B2 (en) * 2018-07-11 2021-11-09 Ambiq Micro, Inc. Power efficient context-based audio processing
US11456007B2 (en) 2019-01-11 2022-09-27 Samsung Electronics Co., Ltd End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization
CN110517708B (zh) * 2019-09-02 2024-06-07 平安科技(深圳)有限公司 一种音频处理方法、装置及计算机存储介质

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US2005155A (en) * 1932-02-23 1935-06-18 Bolton C Moise Tube expanding mill
JPH0784596A (ja) * 1993-09-13 1995-03-31 Nippon Telegr & Teleph Corp <Ntt> 符号化音声の品質評価方法
EP1241663A1 (en) * 2001-03-13 2002-09-18 Koninklijke KPN N.V. Method and device for determining the quality of speech signal
DE60116559D1 (de) * 2001-10-01 2006-04-06 Koninkl Kpn Nv Verbessertes Verfahren zur Ermittlung der Qualität eines Sprachsignals
US7689406B2 (en) 2002-03-08 2010-03-30 Koninklijke Kpn. N.V. Method and system for measuring a system's transmission quality
DE60319666T2 (de) * 2003-01-21 2009-04-02 Psytechnics Ltd. Verfahren zur Qualitätsbestimmung eines Audiosignals
EP1465156A1 (en) 2003-03-31 2004-10-06 Koninklijke KPN N.V. Method and system for determining the quality of a speech signal
EP1492084B1 (en) * 2003-06-25 2006-05-17 Psytechnics Ltd Binaural quality assessment apparatus and method
US7240252B1 (en) * 2004-06-30 2007-07-03 Sprint Spectrum L.P. Pulse interference testing in a CDMA communication system
ATE405922T1 (de) * 2004-09-20 2008-09-15 Tno Frequenzkompensation für die wahrnehmungsbezogene sprachanalyse
CN101048935B (zh) * 2004-10-26 2011-03-23 杜比实验室特许公司 控制音频信号的单位响度或部分单位响度的方法和设备
US7590530B2 (en) * 2005-09-03 2009-09-15 Gn Resound A/S Method and apparatus for improved estimation of non-stationary noise for speech enhancement
EP1798897B1 (en) * 2005-12-14 2008-06-18 NTT DoCoMo, Inc. Apparatus and method for determining transmission policies for a plurality of applications of different types
EP1975924A1 (en) 2007-03-29 2008-10-01 Koninklijke KPN N.V. Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system
DE602007007090D1 (de) 2007-10-11 2010-07-22 Koninkl Kpn Nv Verfahren und System zur Messung der Sprachverständlichkeit eines Tonübertragungssystems

Also Published As

Publication number Publication date
US8818798B2 (en) 2014-08-26
WO2011018430A1 (en) 2011-02-17
EP2465113B1 (en) 2014-12-24
CN102576535B (zh) 2014-06-11
JP2013501952A (ja) 2013-01-17
ES2531556T3 (es) 2015-03-17
EP2465113A1 (en) 2012-06-20
US20120143601A1 (en) 2012-06-07
KR20120042989A (ko) 2012-05-03
CN102576535A (zh) 2012-07-11
KR101430321B1 (ko) 2014-08-13
JP5542206B2 (ja) 2014-07-09

Similar Documents

Publication Publication Date Title
DK2465113T3 (da) Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem
DK2465112T3 (da) Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem
Hines et al. ViSQOL: an objective speech quality model
CN104919525B (zh) 用于评估退化语音信号的可理解性的方法和装置
CN106663450B (zh) 用于评估劣化语音信号的质量的方法及装置
US9659579B2 (en) Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter
US8566082B2 (en) Method and system for the integral and diagnostic assessment of listening speech quality
EP3223279A1 (en) A speech signal processing circuit
EP2474975B1 (en) Method for estimating speech quality
Reimes et al. The relative approach algorithm and its applications in new perceptual models for noisy speech and echo performance
Egi et al. Objective quality evaluation method for noise-reduced speech
Ghimire Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863