DK2465112T3 - Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem - Google Patents
Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem Download PDFInfo
- Publication number
- DK2465112T3 DK2465112T3 DK10740657.1T DK10740657T DK2465112T3 DK 2465112 T3 DK2465112 T3 DK 2465112T3 DK 10740657 T DK10740657 T DK 10740657T DK 2465112 T3 DK2465112 T3 DK 2465112T3
- Authority
- DK
- Denmark
- Prior art keywords
- noise
- signal
- output
- output signal
- level
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000012545 processing Methods 0.000 claims description 39
- 238000005259 measurement Methods 0.000 claims description 18
- 230000003595 spectral effect Effects 0.000 claims description 17
- 238000007781 pre-processing Methods 0.000 claims description 14
- 238000001303 quality assessment method Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 5
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 claims description 3
- 230000001131 transforming effect Effects 0.000 claims description 3
- 230000001629 suppression Effects 0.000 description 54
- 230000006870 function Effects 0.000 description 46
- 230000009471 action Effects 0.000 description 27
- 238000012360 testing method Methods 0.000 description 14
- 238000004364 calculation method Methods 0.000 description 12
- 230000015556 catabolic process Effects 0.000 description 12
- 238000006731 degradation reaction Methods 0.000 description 12
- 230000008447 perception Effects 0.000 description 12
- 238000001514 detection method Methods 0.000 description 10
- 238000001914 filtration Methods 0.000 description 10
- 230000005540 biological transmission Effects 0.000 description 9
- 238000002474 experimental method Methods 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 6
- 230000005284 excitation Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 230000009466 transformation Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000001228 spectrum Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000001149 cognitive effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000000873 masking effect Effects 0.000 description 2
- 238000000691 measurement method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 241000282412 Homo Species 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/69—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for evaluating synthetic or decoded voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/22—Arrangements for supervision, monitoring or testing
- H04M3/2236—Quality of speech transmission monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Telephone Function (AREA)
- Circuit For Audible Band Transducer (AREA)
Claims (12)
1. Fremgangsmåde til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet af et udgangssignal for en audioanordning, med hensyn til et referencesignal, hvor referencesignalet og udgangssignalet behandles og sammenlignes, og behandlingen indbefatter inddeling af referencesignalet og udgangssignalet til indbyrdes tilsvarende tidsrammer, hvor behandlingen yderligere omfatter: skalering af referencesignalet hen imod et fast intensitetsniveau; - udvælgelse af tidsrammer for udgangssignalet, der er baseret på målinger, som udføres på det skalerede referencesignal; - beregning af en støj kontrastparameter, der er baseret på de udvalgte tidsrammer af udgangssignalet, hvor støj kontrastparameteren er en måling af støj kontrasten inden i signalet; anvendelse af en støjdæmpning på i det mindste enten referencesignalet og/eller udgangssignalet i det opfattede lydstyrkedomæne, der er baseret på støj kontrastparameteren; perceptuel subtraktion af referencesignalet og udgangssignalet for at danne et differenssignal; - udledning af kvalitetsindikatoren fra differenssignalet; kendetegnet ved, at trinet til beregning af støj kontrastparameteren omfatter: bestemmelse af en brøkdel ved inddeling af intensitetsværdien for en første udvalgt tidsramme inden i udgangssignalet med intensitetsværdien af en anden udvalgt tidsramme inden i udgangssignalet; - komprimering af brøkdelen ved anvendelse af a potenslov med en forudbestemt kompressionskoefficient for at opnå støj kontrastparameteren.
2. Fremgangsmåde ifølge krav 1, hvor audioanordningen er et talebehandlingssystem.
3. Fremgangsmåde ifølge krav 1, hvor støj kontrastparameteren er indstillet til en forudbestemt fast værdi, hvis den komprimerede brøkdel er under den forudbestemte faste værdi.
4. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor anvendelse af støjdæmpningen på referencesignalet omfatter: - beregning af en gennemsnitlig referencestøj-spektraltæthed over et antal af tidsrammer, der har et detekteret intensitetsniveau under en tærskelværdi; bestemmelse af en referencestøjdæmpningsfaktor, der er baseret på en optimeret korrelation mellem objektiv og subjektiv kvalitetsbestemmelsesinformation; og beregning af et ønsket støjniveau, der er baseret på referencestøjdæmpningsfaktoren og den gennemsnitlige referencestøj-spektraltæthed.
5. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor anvendelse af støjdæmpningen på udgangssignalet omfatter: beregning af en gennemsnitlig udgangsstøj-spektraltæthed over et antal af tidsrammer, der svarer til tidsrammer inden i referencesignalet, der har et detekteret intensitetsniveau under en tærskelværdi; - bestemmelse af en lav støjniveaukonstant, der er baseret på en optimeret korrelation mellem objektiv og subjektiv kvalitetsbestemmelsesinformation; bestemmelse af en udgangsstøj-dæmpningsfaktor, der er baseret på en optimeret korrelation mellem objektiv og subjektiv kvalitetsbestemmelsesinformation; og beregning af et støjniveau, der er repræsentativ for forstyrrelse i udgangssignalet ved anvendelse af den lave støjniveaukonstant, udgangsstøj-dæmpningsfaktoren og den gennemsnitlige udgangsstøj-spektraltæthed.
6. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor behandlingen yderligere omfatter: - transformering af referencesignalet og udgangssignalet fra tidsdomænet hen imod tids-frekvens-domænet; - udledning af en referencetonehøjdeeffekttæthedsfunktion fra referencesignalet og udledning af en udgangstonehøjdeeffekttæthedsfunktion fra udgangssignalet; - lokal skalering af referencetonehøjdeeffekttæthedsfunktionen for at opnå en lokalt skaleret referencetonehøj deeffekttæthedsfunktion; delvis kompensering af enten udgangstonehøjdeeffekttæthedsfunktionen eller den lokalt skalerede referencetonehøjdeeffekttæthedsfunktion med hensyn til frekvens; og udledning af en referencelydstyrketæthedsfunktion og en udgangslydstyrketæthedsfunktion.
7. Fremgangsmåde ifølge krav 6, hvor behandlingen yderligere omfatter: skalering af intensiteten af referencetonehøjdeeffekttæthedsfunktionen fra det faste intensitetsniveau hen imod et intensitetsniveau, der relaterer sig til udgangstonehøjdeeffekttæthedsfunktionen for at opnå en intensitetsniveauforskel mellem tonehøjdeeffekttæthedsfunktionerne, der giver mulighed for kvantificering af virkningen af intensitetsniveauet på den opfattede kvalitet; - skalering af lydstyrken af udgangslydstyrketæthedsfunktionen hen imod et fast lydstyrkeniveau i det opfattede lydstyrkedomæne; og skalering af lydstyrken af referencelydstyrketæthedsfunktionen fra et lydstyrkeniveau, der svarer til det udgangsrelaterede intensitetsniveau hen imod et lydstyrkeniveau, der relaterer sig til lydstyrkeniveauet for udgangslydstyrketæthedsfunktionen i det opfattede lydstyrkedomæne, for at opnå en lydstyrkeniveauforskel mellem referencelydstyrketæthedsfunktionen og udgangslydstyrketæthedsfunktionen, der giver mulighed for kvantificering af virkningen af lydstyrken på den opfattede kvalitet af udgangssignalet.
8. Fremgangsmåde ifølge et hvilket som helst af de foregående krav, hvor udvælgelse af tidsrammer omfatter udvælgelse af tidsrammer af udgangssignalet, der svarer til tidsrammer af det skalerede referencesignal, der opfylder en forudbestemt betingelse.
9. Fremgangsmåde ifølge krav 8, hvor den forudbestemte betingelse indbefatter, at tidsrammen for det skalerede referencesignal, en tavs ramme, har et intensitetsniveauværdi under en tærskelværdi.
10. Fremgangsmåde ifølge krav 9, hvor den forudbestemte betingelse yderligere indbefatter, at tidsrammen for det skalerede referencesignal er en del af en række af på hinanden følgende tavse rammer, et tavst interval.
11. Computerprogramprodukt, der omfatter en computereksekverbar kode, der for eksempel er lagret på et computerlæsbart medium, der er indrettet til at udføre fremgangsmåden, når den eksekveres af en processor som defineret i et hvilket som helst af kravene 1 -10.
12. System (20) til bestemmelse af en kvalitetsindikator, der repræsenterer en opfattet kvalitet for et udgangssignal Y (t) af et audiosystem (10), for eksempel en talebehandlingsanordning, med hensyn til et indgangssignal X(t) for audiosystemet, der tjener som et referencesignal, hvor systemet omfatter: en forbehandlingsanordning (30) til at forbehandle referencesignalet og udgangssignalet; en første behandlingsanordning (40a) til at behandle referencesignalet, og en anden behandlingsanordning (40b) til at behandle udgangssignalet for at opnå repræsentationssignaler R(X), R(Y) for henholdsvis referencesignalet og udgangssignalet; en differentieringsanordning (50) til at kombinere repræsentationssignalerne af referencesignalet og udgangssignalet for at opnå et differentialsignal D; og en modelleringsanordning (60) til at behandle differentialsignalet for at opnå et kvalitetssignal Q, der repræsenterer et estimat for den opfattede kvalitet af talebehandlingssysternet; hvor forbehandlingsanordningen, den første behandlingsanordning og den anden behandlingsanordning danner et behandlingssystem til at udføre fremgangsmåden ifølge et hvilket som helst af kravene 1-10.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09010500 | 2009-08-14 | ||
EP10158410 | 2010-03-30 | ||
PCT/EP2010/061538 WO2011018428A1 (en) | 2009-08-14 | 2010-08-09 | Method and system for determining a perceived quality of an audio system |
Publications (1)
Publication Number | Publication Date |
---|---|
DK2465112T3 true DK2465112T3 (da) | 2015-01-12 |
Family
ID=42990263
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DK10740657.1T DK2465112T3 (da) | 2009-08-14 | 2010-08-09 | Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem |
Country Status (6)
Country | Link |
---|---|
US (1) | US9025780B2 (da) |
EP (1) | EP2465112B1 (da) |
CN (1) | CN102549657B (da) |
DK (1) | DK2465112T3 (da) |
ES (1) | ES2526126T3 (da) |
WO (1) | WO2011018428A1 (da) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9202456B2 (en) | 2009-04-23 | 2015-12-01 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for automatic control of active noise cancellation |
US9053697B2 (en) | 2010-06-01 | 2015-06-09 | Qualcomm Incorporated | Systems, methods, devices, apparatus, and computer program products for audio equalization |
US20120263317A1 (en) * | 2011-04-13 | 2012-10-18 | Qualcomm Incorporated | Systems, methods, apparatus, and computer readable media for equalization |
US20130033996A1 (en) * | 2011-08-05 | 2013-02-07 | Kee-Bong Song | Electronic device with antenna switching capabilities |
JP5782402B2 (ja) * | 2012-03-29 | 2015-09-24 | 日本電信電話株式会社 | 音声品質客観評価装置及び方法 |
EP2733700A1 (en) * | 2012-11-16 | 2014-05-21 | Nederlandse Organisatie voor toegepast -natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating intelligibility of a degraded speech signal |
US9679555B2 (en) * | 2013-06-26 | 2017-06-13 | Qualcomm Incorporated | Systems and methods for measuring speech signal quality |
EP2922058A1 (en) * | 2014-03-20 | 2015-09-23 | Nederlandse Organisatie voor toegepast- natuurwetenschappelijk onderzoek TNO | Method of and apparatus for evaluating quality of a degraded speech signal |
US9721580B2 (en) * | 2014-03-31 | 2017-08-01 | Google Inc. | Situation dependent transient suppression |
US10020862B2 (en) | 2014-11-03 | 2018-07-10 | Apple Inc. | Wi-Fi adaptive receiver diversity |
US9853681B2 (en) | 2014-11-03 | 2017-12-26 | Apple Inc. | Arbitrator for multi-radio antenna switching |
US9768825B2 (en) | 2014-11-03 | 2017-09-19 | Apple Inc. | Wi-Fi adaptive transmit antenna selection |
US20160379661A1 (en) * | 2015-06-26 | 2016-12-29 | Intel IP Corporation | Noise reduction for electronic devices |
CN107170465B (zh) * | 2017-06-29 | 2020-07-14 | 数据堂(北京)科技股份有限公司 | 一种音频质量检测方法及音频质量检测系统 |
EP3669780B1 (en) * | 2018-12-21 | 2023-10-04 | Audiodo AB (publ) | Methods, devices and system for a compensated hearing test |
KR20210056146A (ko) * | 2019-11-08 | 2021-05-18 | 엘지전자 주식회사 | 고장 진단을 하는 인공 지능 장치 및 그 방법 |
WO2021161440A1 (ja) * | 2020-02-13 | 2021-08-19 | 日本電信電話株式会社 | 音声品質推定装置、音声品質推定方法及びプログラム |
US20210350819A1 (en) * | 2020-05-07 | 2021-11-11 | Netflix, Inc. | Techniques for training a multitask learning model to assess perceived audio quality |
CN111800545B (zh) * | 2020-06-24 | 2022-05-24 | Oppo(重庆)智能科技有限公司 | 终端通话状态检测方法、装置、终端及存储介质 |
CN112216305A (zh) * | 2020-09-30 | 2021-01-12 | 上海幻维数码创意科技有限公司 | 一种音频相似度识别方法 |
CN114095825B (zh) * | 2021-11-23 | 2024-08-13 | 深圳市锐尔觅移动通信有限公司 | 模式切换方法、装置、音频播放设备及计算机可读介质 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3278900B2 (ja) * | 1992-05-07 | 2002-04-30 | ソニー株式会社 | データ符号化装置及び方法 |
US6473733B1 (en) * | 1999-12-01 | 2002-10-29 | Research In Motion Limited | Signal enhancement for voice coding |
EP1241663A1 (en) | 2001-03-13 | 2002-09-18 | Koninklijke KPN N.V. | Method and device for determining the quality of speech signal |
EP1298646B1 (en) | 2001-10-01 | 2006-01-11 | Koninklijke KPN N.V. | Improved method for determining the quality of a speech signal |
EP1343145A1 (en) * | 2002-03-08 | 2003-09-10 | Koninklijke KPN N.V. | Method and system for measuring a sytems's transmission quality |
EP1485691B1 (en) | 2002-03-08 | 2006-09-13 | Koninklijke KPN N.V. | Method and system for measuring a system's transmission quality |
EP1465156A1 (en) * | 2003-03-31 | 2004-10-06 | Koninklijke KPN N.V. | Method and system for determining the quality of a speech signal |
US7492889B2 (en) * | 2004-04-23 | 2009-02-17 | Acoustic Technologies, Inc. | Noise suppression based on bark band wiener filtering and modified doblinger noise estimate |
KR20050104976A (ko) * | 2004-04-30 | 2005-11-03 | 삼성전자주식회사 | 자동 음질 평가 방법 및 그 시스템 |
CA2580763C (en) * | 2004-09-20 | 2014-07-29 | John Gerard Beerends | Frequency compensation for perceptual speech analysis |
CN1321390C (zh) * | 2005-01-18 | 2007-06-13 | 中国电子科技集团公司第三十研究所 | 客观音质评价归一化主客观统计相关模型的建立方法 |
EP1975924A1 (en) * | 2007-03-29 | 2008-10-01 | Koninklijke KPN N.V. | Method and system for speech quality prediction of the impact of time localized distortions of an audio transmission system |
US9008321B2 (en) * | 2009-06-08 | 2015-04-14 | Nokia Corporation | Audio processing |
WO2011146002A1 (en) * | 2010-05-17 | 2011-11-24 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and arrangement for processing of speech quality estimate |
-
2010
- 2010-08-09 DK DK10740657.1T patent/DK2465112T3/da active
- 2010-08-09 US US13/390,259 patent/US9025780B2/en active Active
- 2010-08-09 ES ES10740657.1T patent/ES2526126T3/es active Active
- 2010-08-09 WO PCT/EP2010/061538 patent/WO2011018428A1/en active Application Filing
- 2010-08-09 CN CN201080046390.6A patent/CN102549657B/zh active Active
- 2010-08-09 EP EP10740657.1A patent/EP2465112B1/en active Active
Also Published As
Publication number | Publication date |
---|---|
ES2526126T3 (es) | 2015-01-07 |
EP2465112A1 (en) | 2012-06-20 |
US20120148057A1 (en) | 2012-06-14 |
US9025780B2 (en) | 2015-05-05 |
EP2465112B1 (en) | 2014-10-08 |
WO2011018428A1 (en) | 2011-02-17 |
CN102549657A (zh) | 2012-07-04 |
CN102549657B (zh) | 2015-05-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DK2465112T3 (da) | Fremgangsmåde, computerprogramprodukt og system til bestemmelse af en opfattet kvalitet af et audiosystem | |
US8818798B2 (en) | Method and system for determining a perceived quality of an audio system | |
JP4879180B2 (ja) | 知覚音声分析のための周波数補償 | |
CN104919525B (zh) | 用于评估退化语音信号的可理解性的方法和装置 | |
US9659579B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through selecting a difference function for compensating for a disturbance type, and providing an output signal indicative of a derived quality parameter | |
US9953663B2 (en) | Method of and apparatus for evaluating quality of a degraded speech signal | |
US20100211395A1 (en) | Method and System for Speech Intelligibility Measurement of an Audio Transmission System | |
JP4570609B2 (ja) | 音声伝送システムの音声品質予測方法及びシステム | |
US20090099843A1 (en) | Method and system for the integral and diagnostic assessment of listening speech quality | |
US9659565B2 (en) | Method of and apparatus for evaluating intelligibility of a degraded speech signal, through providing a difference function representing a difference between signal frames and an output signal indicative of a derived quality parameter | |
JP2023535694A (ja) | 信号の知覚される品質に対する残響の知覚的影響を判定する方法、及びコンピュータプログラム製品 |