RU2020100016A - Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения - Google Patents

Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения Download PDF

Info

Publication number
RU2020100016A
RU2020100016A RU2020100016A RU2020100016A RU2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A
Authority
RU
Russia
Prior art keywords
audio signal
time
frequency
gain
channels
Prior art date
Application number
RU2020100016A
Other languages
English (en)
Other versions
RU2801156C2 (ru
Inventor
Пер ХЕДЕЛИН
Ариджит БИСВАС
Михель ШУГ
Винай МЕЛКОТЕ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн, Долби Интернешнл Аб filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Publication of RU2020100016A publication Critical patent/RU2020100016A/ru
Application granted granted Critical
Publication of RU2801156C2 publication Critical patent/RU2801156C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0324Details of processing therefor
    • G10L21/034Automatic adjustment
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/45Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/66Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)
  • Liquid Crystal Substances (AREA)

Claims (18)

1. Способ обработки звукового сигнала, включающий этапы: приема звукового сигнала, содержащего ряд временных сегментов, определения соответствующего усиления для каждого временного сегмента звукового сигнала, при этом усиление находится в частотной области и основано на p-норме спектральных амплитуд каждого временного сегмента представления в частотной области звукового сигнала, при этом значение р-нормы выбирают так, чтобы выделить спектральный состав слабого сигнала звукового сигнала относительно спектрального состава сильного сигнала звукового сигнала; и применения соответствующих значений усиления к каждому временному сегменту с получением распакованного звукового сигнала, при этом применение соответствующих индивидуальных значений усиления усиливает сегменты с относительно высокой интенсивностью и ослабляет сегменты с относительно низкой интенсивностью, и при этом каждое соответствующее усиление для каждого временного сегмента вычисляют с использованием дискретных значений поддиапазона в подмножестве поддиапазонов в соответствующем временном сегменте.
2. Способ по п. 1, отличающийся тем, что значение p в p-норме меньше 2.
3. Способ по п. 1, отличающийся тем, что первый банк фильтров используют для анализа звукового сигнала с целью получения представления в частотной области, и при этом фильтр-прототип выполнен с возможностью сглаживания индивидуальных значений усиления для устранения разрывов в огибающей звукового сигнала.
4. Способ по п. 3, отличающийся тем, что первый банк фильтров представляет собой одно из банка квадратурных модулированных фильтров (QMF) или оконного преобразования Фурье.
5. Постоянный машиночитаемый носитель, содержащий команды, которые при исполнении одним или более процессорами выполняют способ по п. 1.
6. Устройство для обработки звукового сигнала, содержащее: первый интерфейс для приема упакованного звукового сигнала, который содержит ряд сегментов; и компонент распаковки, распаковывающий упакованный звуковой сигнал включительно с определением соответствующего усиления для каждого сегмента из ряда сегментов, причем усиление находится в частотной области и основано на p-норме спектральных амплитуд каждого сегмента из ряда сегментов дискретных значений частотной области начального звукового сигнала, при этом значение р-нормы выбирают так, чтобы выделить спектральный состав слабого сигнала звукового сигнала относительно спектрального состава сильного сигнала звукового сигнала, и применяют соответствующее усиление к каждому сегменту из ряда сегментов для усиления сегментов с относительно высокой интенсивностью и ослабления сегментов с относительно низкой интенсивностью, при этом каждое соответствующее усиление для каждого временного сегмента вычисляется с использованием дискретных значений поддиапазона в подмножестве поддиапазонов в каждом соответствующем временном сегменте.
7. Устройство по п. 6, отличающееся тем, что дополнительно содержит первый банк фильтров, анализирующий звуковой сигнал, для получения представления в частотной области, и при этом определенная форма окна соответствует фильтр-прототипу для первого банка фильтров, и при этом, кроме того, банк фильтров представляет собой одно из банка квадратурных модулированных фильтров (QMF) или оконного преобразования Фурье, и при этом фильтр-прототип выполнен с возможностью сглаживания индивидуальных значений усиления для устранения разрывов в огибающей звукового сигнала.
8. Устройство по п. 6, отличающееся тем, что значение p в p-норме меньше 2.
9. Способ упаковки звукового сигнала, содержащего несколько каналов, при этом способ включает: прием частотно-временного мозаичного представления звукового сигнала, при этом частотно-временное мозаичное представление звукового сигнала содержит разделение звукового сигнала на временные интервалы, при этом каждый временной интервал разделен на частотные поддиапазоны; и упаковку частотно-временного мозаичного представления звукового сигнала с целью уменьшения динамического диапазона звукового сигнала; при этом упаковка частотно-временного мозаичного представления звукового сигнала предусматривает: разделение каналов звукового сигнала на дискретные подмножества каналов на основе сгруппированной информации; и для каждого дискретного подмножества каналов: вычисление общего усиления для временного интервала частотно-временного мозаичного представления звукового сигнала, при этом вычисление общего усиления включает снижение уровня упаковки под действием управляющей информации; и применение общего усиления для временного интервала к каждому частотному поддиапазону каждого канала дискретного подмножества каналов.
10. Способ по п. 9, отличающийся тем, что частотно-временное мозаичное представление звукового сигнала является представлением в области QMF.
11. Способ по п. 10, отличающийся тем, что количество частотных поддиапазонов в каждом временном интервале представления в области QMF равно 64.
12. Способ по п. 9, отличающийся тем, что для временных интервалов с относительно низкой интенсивностью применение вычисленного усиления усиливает звуковой сигнал, а для временных интервалов с относительно высокой интенсивностью применение вычисленного усиления ослабляет звуковой сигнал.
13. Способ по п. 9, отличающийся тем, что снижение уровня упаковки предусматривает снижение величины усиления, применяемого к звуковому сигналу, или снижение величины ослабления, применяемого к звуковому сигналу.
14. Способ по п. 9, отличающийся тем, что упаковка частотно-временного мозаичного представления звукового сигнала включается или отключается под действием управляющей информации.
15. Способ по п. 9, отличающийся тем, что сгруппированная информация указывает на то, что все каналы звукового сигнала находятся в одном и том же подмножестве каналов.
16. Способ по п. 9, отличающийся тем, что сгруппированная информация указывает на то, что каждый канал звукового сигнала находится в отдельном дискретном подмножестве каналов.
17. Устройство для упаковки звукового сигнала, содержащего несколько каналов, при этом устройство содержит: первый интерфейс, осуществляющий прием частотно-временного мозаичного представления звукового сигнала, при этом частотно-временное мозаичное представление звукового сигнала содержит разделение звукового сигнала на временные интервалы, при этом каждый временной интервал разделен на частотные поддиапазоны; и компонент упаковки, осуществляющий упаковку частотно-временного мозаичного представления звукового сигнала с целью уменьшения динамического диапазона звукового сигнала; при этом упаковка частотно-временного мозаичного представления звукового сигнала предусматривает: разделение каналов звукового сигнала на дискретные подмножества каналов на основе сгруппированной информации; и для каждого дискретного подмножества каналов: вычисление общего усиления для временного интервала частотно-временного мозаичного представления звукового сигнала, при этом вычисление общего усиления включает снижение уровня упаковки под действием управляющей информации; и применение общего усиления для временного интервала к каждому частотному поддиапазону каждого канала дискретного подмножества каналов.
18. Постоянный машиночитаемый носитель, содержащий команды, которые при исполнении одним или более процессорами выполняют способ по любому из пп. 9–16.
RU2020100016A 2013-04-05 2020-01-08 Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения RU2801156C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361809028P 2013-04-05 2013-04-05
US61/809,028 2013-04-05
US201361877167P 2013-09-12 2013-09-12
US61/877,167 2013-09-12

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2016116038A Division RU2712814C2 (ru) 2013-04-05 2014-04-01 Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения

Publications (2)

Publication Number Publication Date
RU2020100016A true RU2020100016A (ru) 2021-07-08
RU2801156C2 RU2801156C2 (ru) 2023-08-02

Family

ID=

Also Published As

Publication number Publication date
JP7050976B2 (ja) 2022-04-08
US10679639B2 (en) 2020-06-09
HK1257807A1 (zh) 2019-11-01
CN108269586A (zh) 2018-07-10
IL266569A (en) 2019-07-31
KR102081043B1 (ko) 2020-02-26
EA028755B9 (ru) 2018-04-30
JP2016167081A (ja) 2016-09-15
MY197063A (en) 2023-05-23
MX342965B (es) 2016-10-19
MY173488A (en) 2020-01-28
KR102248008B1 (ko) 2021-05-07
IL274358A (en) 2020-06-30
EA201591533A1 (ru) 2015-12-30
IL240006A (en) 2016-03-31
CN106024008A (zh) 2016-10-12
US20180197561A1 (en) 2018-07-12
KR20150098688A (ko) 2015-08-28
IL292853B2 (en) 2023-07-01
IL261514B (en) 2019-05-30
EP3564953A2 (en) 2019-11-06
IL292853B1 (en) 2023-03-01
US20230049495A1 (en) 2023-02-16
KR20230039765A (ko) 2023-03-21
US10373627B2 (en) 2019-08-06
EP3176786A1 (en) 2017-06-07
CN104995680A (zh) 2015-10-21
KR102088153B1 (ko) 2020-03-12
IL240006A0 (en) 2015-09-24
JP6838105B2 (ja) 2021-03-03
WO2014165543A1 (en) 2014-10-09
HK1211379A1 (en) 2016-05-20
MX2015010478A (es) 2015-12-16
ME02623B (me) 2017-06-20
KR20160075804A (ko) 2016-06-29
IL266569B (en) 2020-06-30
RU2712814C2 (ru) 2020-01-31
CL2015002278A1 (es) 2015-12-11
HUE031966T2 (en) 2017-08-28
JP2016510439A (ja) 2016-04-07
IL274358B (en) 2021-05-31
RU2600527C1 (ru) 2016-10-20
CN106024008B (zh) 2020-01-14
CA2900724C (en) 2016-09-13
JP2024020311A (ja) 2024-02-14
IL300496A (en) 2023-04-01
US9947335B2 (en) 2018-04-17
US20180197562A1 (en) 2018-07-12
IL283098B (en) 2022-06-01
KR20160075805A (ko) 2016-06-29
US20190325890A1 (en) 2019-10-24
JP2016191934A (ja) 2016-11-10
JP6026678B2 (ja) 2016-11-16
HK1254791A1 (zh) 2019-07-26
US20160019908A1 (en) 2016-01-21
HK1254790A1 (zh) 2019-07-26
JP6542717B2 (ja) 2019-07-10
CN108269586B (zh) 2022-04-05
AU2014248232A1 (en) 2015-08-06
JP2019179254A (ja) 2019-10-17
KR102509345B1 (ko) 2023-03-14
IL283098A (en) 2021-06-30
CN105933030A (zh) 2016-09-07
BR122017006632A2 (pt) 2021-06-29
BR112015019176B1 (pt) 2021-02-09
EP3564953B1 (en) 2022-03-23
CN108269585B (zh) 2022-03-25
EP3564953A3 (en) 2020-02-26
CA2900724A1 (en) 2014-10-09
BR112015019176A2 (pt) 2017-07-18
JP7383067B2 (ja) 2023-11-17
CN108269584A (zh) 2018-07-10
EA028755B1 (ru) 2017-12-29
CN105933030B (zh) 2018-09-28
EP3176786B1 (en) 2019-05-08
US10217476B2 (en) 2019-02-26
EP2981963A1 (en) 2016-02-10
IL243689A0 (en) 2016-04-21
CN104995680B (zh) 2018-04-03
SG11201506134XA (en) 2015-09-29
JP6517723B2 (ja) 2019-05-22
IL292853A (en) 2022-07-01
CN108269585A (zh) 2018-07-10
US20200395031A1 (en) 2020-12-17
KR20220140002A (ko) 2022-10-17
IL261514A (en) 2018-10-31
CN108269584B (zh) 2022-03-25
EP2981963B1 (en) 2017-01-04
KR20200028037A (ko) 2020-03-13
RU2016116038A3 (ru) 2019-11-11
KR101632599B1 (ko) 2016-06-22
AU2014248232B2 (en) 2015-09-24
JP2021076872A (ja) 2021-05-20
RU2016116038A (ru) 2018-11-30
ZA201600393B (en) 2017-05-31
CN114566182A (zh) 2022-05-31
JP2022088519A (ja) 2022-06-14
DK2981963T3 (en) 2017-02-27
AP2015008800A0 (en) 2015-10-31
PL2981963T3 (pl) 2017-06-30
US11423923B2 (en) 2022-08-23
KR20210049963A (ko) 2021-05-06
ES2617314T3 (es) 2017-06-16
CN114566183A (zh) 2022-05-31

Similar Documents

Publication Publication Date Title
RU2016116038A (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
US10142749B2 (en) Dynamic sound adjustment
RU2014127177A (ru) Кодер и декодер звукового сигнала, способ генерирования управляющих данных из звукового сигнала и способ декодирования битового потока
RU2012113254A (ru) Способ и устройство для обработки звукового сигнала
RU2007140406A (ru) Системы, способы и устройства для подавления высокополосных всплесков
ES2540215T3 (es) Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
EP2667508A3 (en) Method and apparatus for efficient frequency-domain implementation of time-varying filters
FI20185602A1 (fi) Epäjatkuva nopeaan konvoluutioon perustuva suodatinprosessointi
RU2801156C2 (ru) Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
CA2840851C (en) Audio bandwidth dependent noise suppression
RU2021130656A (ru) Способ и устройство для применения сжатия динамического диапазона к сигналу амбиофонии высшего порядка