DK2465113T3 - Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem - Google Patents
Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem Download PDFInfo
- Publication number
- DK2465113T3 DK2465113T3 DK10751828.4T DK10751828T DK2465113T3 DK 2465113 T3 DK2465113 T3 DK 2465113T3 DK 10751828 T DK10751828 T DK 10751828T DK 2465113 T3 DK2465113 T3 DK 2465113T3
- Authority
- DK
- Denmark
- Prior art keywords
- reference signal
- output signal
- signal
- level
- scaling
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 42
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims description 28
- 230000009471 action Effects 0.000 claims description 20
- 238000005259 measurement Methods 0.000 claims description 13
- 238000007781 pre-processing Methods 0.000 claims description 13
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000012360 testing method Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 15
- 230000001629 suppression Effects 0.000 description 13
- 238000004364 calculation method Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 230000000694 effects Effects 0.000 description 8
- 238000002474 experimental method Methods 0.000 description 8
- 230000015556 catabolic process Effects 0.000 description 7
- 230000008447 perception Effects 0.000 description 7
- 238000006731 degradation reaction Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 238000001514 detection method Methods 0.000 description 4
- 238000011156 evaluation Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 230000005236 sound signal Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Circuit For Audible Band Transducer (AREA)
Claims (9)
1. Fremgangsmåde til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet af et udgangssignal fra et lydsystem, i forhold til et referencesignal, hvor referencesignalet og udgangssignalet behandles og sammenlignes, og hvor behandlingen indbefatter opdeling af referencesignalet og udgangssignalet i indbyrdes tilsvarende tidsrammer, hvor behandlingen endvidere omfatter: - skalering af referencesignalets intensitet i retning mod et fast intensitetsniveau; - udførelse af målinger på tidsrammer inden for det skalerede referencesignal for at bestemme karakteristika for referencesignal-tidsrammen; kendetegnet ved, at fremgangsmåden endvidere omfatter følgende trin: - skalering af referencesignalets intensitet ud fra det faste intensitetsniveau i retning mod et intensitetsniveau, der er relateret til udgangssignalet; skalering af udgangssignalets lydstyrke i retning mod et fast lydstyrkeniveau i det perceptuelle lydstyrkeområde, hvor skalering af udgangssignalets lydstyrke sker ved hjælp af karakteristikaene for referencesignal-tidsrammen; og skalering af referencesignalets lydstyrke ud fra et lydstyrkeniveau, der svarer til det udgangssignal-relaterede intensitetsniveau i retning mod et lydstyrkeniveau, der er relateret til lydstyrkeniveauet for det skalerede udgangssignal i det perceptuelle lydstyrkeområde, hvor skaleringen af referencesignalets lydstyrke sker ved hjælp af karakteristikaene for referencesignal-tidsrammen; perceptuel subtraktion af referencesignalet og udgangssignalet for at danne et differenssignal; samt udledning af kvalitetsindikatoren fra differenssignalet.
2. Fremgangsmåde ifølge krav 1, hvor skalering af referencesignalets intensitet ud fra det faste intensitetsniveau i retning mod et intensitetsniveau, der er relateret til udgangssignalet, er baseret på multiplikation af referencesignalet med en skaleringsfaktor, hvor skaleringsfaktoren er defineret ved: bestemmelse af et gennemsnitligt referencesignal-intensitetsniveau for at antal tidsrammer; bestemmelse af et gennemsnitligt udgangssignal-intensitetsniveau for et antal tidsrammer, der svarer til tidsrammerne for det referencesignal, der anvendes til at bestemme det gennemsnitlige referencesignal-intensitetsniveau; - udledning af en foreløbig skaleringsfaktor ved at bestemme en brøkdel, der er baseret på det gennemsnitlige referencesignal-intensitetsniveau og det gennemsnitlige udgangssignal-intensitetsniveau; bestemmelse af en skaleringsfaktor ved at definere, at skaleringsfaktoren skal være lig med den foreløbige skaleringsfaktor, hvis den foreløbige skaleringsfaktor er mindre end en tærskelværdi, og som ellers skal være lig med den foreløbige skaleringsfaktor, der øges med en ekstra foreløbig skaleringsfaktor-afhængig værdi.
3. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor fremgangsmåden, inden lydstyrkeskaleringen af udgangsniveauet til en fast lydstyrke, endvidere omfatter: - lokal skalering af lydstyrkeniveauet for referencesignalet i retning mod udgangssignalets lydstyrkeniveau for dele af referencesignalet med en lydstyrke, der er højere end udgangssignalets lydstyrkeniveau; og efterfølgende lokal skalering af udgangssignalets lydstyrkeniveau i retning mod referencesignalets lydstyrkeniveau for dele af udgangssignalet med en lydstyrke, der er højere end referencesignalets lydstyrkeniveau.
4. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor referencesignalet i det perceptuelle lydstyrkeområde - inden skalering i retning mod et lydstyrkeniveau, der er relateret til udgangssignalets lydstyrkeniveau i det perceptuelle lydstyrkeområde underkastes en støjdæmpningshandling for at dæmpe støj op til et forudbestemt støjniveau.
5. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor udgangssignalet i det perceptuelle lydstyrkeområde, inden skaleringen i retning mod en fast lydstyrke, underkastes en støjdæmpningsalgoritme for at dæmpe støj op til et støjniveau, som er repræsentativt for forstyrrelse.
6. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor referencesignalet og udgangssignalet i det perceptuelle lydstyrkeområde, inden sammenligning, underkastes global støjdæmpning.
7. Fremgangsmåde ifølge krav 1, hvor lydsystemet er en talebehandlingsanordning.
8. Computerprogramprodukt, der omfatter computer-eksekverbar kode, som for eksempel er lagret på et computerlæsbart medium, der er indrettet til at udføre, når udførelsen foretages af en processor, fremgangsmåden som defineret i et hvilket som helst af kravene 1 - 7.
9. System (20) til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet af et udgangssignal Y (t) fra et lydsystem (10), for eksempel en talebehandlingsanordning, i forhold til et indgangssignal X(t) i lydsystemet, der fungerer som et referencesignal, hvilket system omfatter: en forbehandlingsanordning (30) til forbehandling af referencesignalet og udgangssignalet; en første behandlingsanordning (40a) til behandling af referencesignalet, og en anden behandlingsanordning (40b) til behandling af udgangssignalet for at opnå repræsentationssignaler R(X), R(Y) for henholdsvis referencesignalet og udgangssignalet; en differentieringsanordning (50) til at kombinere repræsentationssignalerne for referencesignalet og udgangssignalet for på denne måde at opnå et differentielt signal D; og en modelleringsanordning (60) til behandling af differentialesignalet for at opnå et kvalitetssignal Q, der repræsenterer et estimat af den perceptuelle kvalitet af talebehandlingssysternet; hvor forbehandlingsanordningen, den første behandlingsanordning og den anden behandlingsanordning danner et behandlingssystem til udførelse af fremgangsmåden ifølge et hvilket som helst af kravene 1-7.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09010501 | 2009-08-14 | ||
EP10161830 | 2010-05-04 | ||
PCT/EP2010/061542 WO2011018430A1 (en) | 2009-08-14 | 2010-08-09 | Method and system for determining a perceived quality of an audio system |
Publications (1)
Publication Number | Publication Date |
---|---|
DK2465113T3 true DK2465113T3 (da) | 2015-04-07 |
Family
ID=42985662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DK10751828.4T DK2465113T3 (da) | 2009-08-14 | 2010-08-09 | Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem |
Country Status (8)
Country | Link |
---|---|
US (1) | US8818798B2 (da) |
EP (1) | EP2465113B1 (da) |
JP (1) | JP5542206B2 (da) |
KR (1) | KR101430321B1 (da) |
CN (1) | CN102576535B (da) |
DK (1) | DK2465113T3 (da) |
ES (1) | ES2531556T3 (da) |
WO (1) | WO2011018430A1 (da) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8873762B2 (en) * | 2011-08-15 | 2014-10-28 | Stmicroelectronics Asia Pacific Pte Ltd | System and method for efficient sound production using directional enhancement |
EP2733700A1 (en) * | 2012-11-16 | 2014-05-21 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
EP2922058A1 (en) * | 2014-03-20 | 2015-09-23 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating quality of a degraded speech signal |
ES2916254T3 (es) | 2014-10-10 | 2022-06-29 | Dolby Laboratories Licensing Corp | Sonoridad de programa basada en la presentación, independiente de la transmisión |
CN106887233B (zh) * | 2015-12-15 | 2020-01-24 | 广州酷狗计算机科技有限公司 | 音频数据处理方法及系统 |
JP6461064B2 (ja) * | 2016-09-28 | 2019-01-30 | 本田技研工業株式会社 | 音響特性校正方法 |
CN107452399B (zh) * | 2017-09-18 | 2020-09-15 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频特征提取方法及装置 |
CN109903752B (zh) * | 2018-05-28 | 2021-04-20 | 华为技术有限公司 | 对齐语音的方法和装置 |
US11172293B2 (en) * | 2018-07-11 | 2021-11-09 | Ambiq Micro, Inc. | Power efficient context-based audio processing |
US11456007B2 (en) | 2019-01-11 | 2022-09-27 | Samsung Electronics Co., Ltd | End-to-end multi-task denoising for joint signal distortion ratio (SDR) and perceptual evaluation of speech quality (PESQ) optimization |
CN110517708B (zh) * | 2019-09-02 | 2024-06-07 | 平安科技(深圳)有限公司 | 一种音频处理方法、装置及计算机存储介质 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US2005155A (en) * | 1932-02-23 | 1935-06-18 | Bolton C Moise | Tube expanding mill |
JPH0784596A (ja) * | 1993-09-13 | 1995-03-31 | Nippon Telegr & Teleph Corp <Ntt> | 符号化音声の品質評価方法 |
EP1241663A1 (en) * | 2001-03-13 | 2002-09-18 | Koninklijke KPN N.V. | Method and device for determining the quality of speech signal |
DE60116559D1 (de) * | 2001-10-01 | 2006-04-06 | Koninkl Kpn Nv | Verbessertes Verfahren zur Ermittlung der Qualität eines Sprachsignals |
US7689406B2 (en) | 2002-03-08 | 2010-03-30 | Koninklijke Kpn. N.V. | Method and system for measuring a system's transmission quality |
DE60319666T2 (de) * | 2003-01-21 | 2009-04-02 | Psytechnics Ltd. | Verfahren zur Qualitätsbestimmung eines Audiosignals |
EP1465156A1 (en) | 2003-03-31 | 2004-10-06 | Koninklijke KPN N.V. | Method and system for determining the quality of a speech signal |
EP1492084B1 (en) * | 2003-06-25 | 2006-05-17 | Psytechnics Ltd | Binaural quality assessment apparatus and method |
US7240252B1 (en) * | 2004-06-30 | 2007-07-03 | Sprint Spectrum L.P. | Pulse interference testing in a CDMA communication system |
ATE405922T1 (de) * | 2004-09-20 | 2008-09-15 | Tno | Frequenzkompensation für die wahrnehmungsbezogene sprachanalyse |
CN101048935B (zh) * | 2004-10-26 | 2011-03-23 | 杜比实验室特许公司 | 控制音频信号的单位响度或部分单位响度的方法和设备 |
US7590530B2 (en) * | 2005-09-03 | 2009-09-15 | Gn Resound A/S | Method and apparatus for improved estimation of non-stationary noise for speech enhancement |
EP1798897B1 (en) * | 2005-12-14 | 2008-06-18 | NTT DoCoMo, Inc. | Apparatus and method for determining transmission policies for a plurality of applications of different types |
EP1975924A1 (en) | 2007-03-29 | 2008-10-01 | Koninklijke KPN N.V. | Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system |
DE602007007090D1 (de) | 2007-10-11 | 2010-07-22 | Koninkl Kpn Nv | Verfahren und System zur Messung der Sprachverständlichkeit eines Tonübertragungssystems |
-
2010
- 2010-08-09 US US13/390,221 patent/US8818798B2/en active Active
- 2010-08-09 JP JP2012524212A patent/JP5542206B2/ja active Active
- 2010-08-09 DK DK10751828.4T patent/DK2465113T3/da active
- 2010-08-09 WO PCT/EP2010/061542 patent/WO2011018430A1/en active Application Filing
- 2010-08-09 ES ES10751828.4T patent/ES2531556T3/es active Active
- 2010-08-09 EP EP10751828.4A patent/EP2465113B1/en active Active
- 2010-08-09 CN CN201080046406.3A patent/CN102576535B/zh active Active
- 2010-08-09 KR KR1020127003997A patent/KR101430321B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
US8818798B2 (en) | 2014-08-26 |
WO2011018430A1 (en) | 2011-02-17 |
EP2465113B1 (en) | 2014-12-24 |
CN102576535B (zh) | 2014-06-11 |
JP2013501952A (ja) | 2013-01-17 |
ES2531556T3 (es) | 2015-03-17 |
EP2465113A1 (en) | 2012-06-20 |
US20120143601A1 (en) | 2012-06-07 |
KR20120042989A (ko) | 2012-05-03 |
CN102576535A (zh) | 2012-07-11 |
KR101430321B1 (ko) | 2014-08-13 |
JP5542206B2 (ja) | 2014-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2465113T3 (da) | Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et lydsystem | |
DK2465112T3 (da) | Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem | |
Hines et al. | ViSQOL: an objective speech quality model | |
CN104919525B (zh) | 用于评估退化语音信号的可理解性的方法和装置 | |
CN106663450B (zh) | 用于评估劣化语音信号的质量的方法及装置 | |
US9659579B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter | |
US8566082B2 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
EP3223279A1 (en) | A speech signal processing circuit | |
EP2474975B1 (en) | Method for estimating speech quality | |
Reimes et al. | The relative approach algorithm and its applications in new perceptual models for noisy speech and echo performance | |
Egi et al. | Objective quality evaluation method for noise-reduced speech | |
Ghimire | Speech intelligibility measurement on the basis of ITU-T Recommendation P. 863 |