RU2020100016A - Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения - Google Patents
Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения Download PDFInfo
- Publication number
- RU2020100016A RU2020100016A RU2020100016A RU2020100016A RU2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A RU 2020100016 A RU2020100016 A RU 2020100016A
- Authority
- RU
- Russia
- Prior art keywords
- audio signal
- time
- frequency
- gain
- channels
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 16
- 230000003595 spectral effect Effects 0.000 title claims 7
- 238000013139 quantization Methods 0.000 title 1
- 230000005236 sound signal Effects 0.000 claims 41
- 238000012856 packing Methods 0.000 claims 6
- 238000004806 packaging method and process Methods 0.000 claims 3
- 230000003321 amplification Effects 0.000 claims 1
- 238000003199 nucleic acid amplification method Methods 0.000 claims 1
- 230000002085 persistent effect Effects 0.000 claims 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/45—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of analysis window
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Liquid Crystal Substances (AREA)
Claims (18)
1. Способ обработки звукового сигнала, включающий этапы: приема звукового сигнала, содержащего ряд временных сегментов, определения соответствующего усиления для каждого временного сегмента звукового сигнала, при этом усиление находится в частотной области и основано на p-норме спектральных амплитуд каждого временного сегмента представления в частотной области звукового сигнала, при этом значение р-нормы выбирают так, чтобы выделить спектральный состав слабого сигнала звукового сигнала относительно спектрального состава сильного сигнала звукового сигнала; и применения соответствующих значений усиления к каждому временному сегменту с получением распакованного звукового сигнала, при этом применение соответствующих индивидуальных значений усиления усиливает сегменты с относительно высокой интенсивностью и ослабляет сегменты с относительно низкой интенсивностью, и при этом каждое соответствующее усиление для каждого временного сегмента вычисляют с использованием дискретных значений поддиапазона в подмножестве поддиапазонов в соответствующем временном сегменте.
2. Способ по п. 1, отличающийся тем, что значение p в p-норме меньше 2.
3. Способ по п. 1, отличающийся тем, что первый банк фильтров используют для анализа звукового сигнала с целью получения представления в частотной области, и при этом фильтр-прототип выполнен с возможностью сглаживания индивидуальных значений усиления для устранения разрывов в огибающей звукового сигнала.
4. Способ по п. 3, отличающийся тем, что первый банк фильтров представляет собой одно из банка квадратурных модулированных фильтров (QMF) или оконного преобразования Фурье.
5. Постоянный машиночитаемый носитель, содержащий команды, которые при исполнении одним или более процессорами выполняют способ по п. 1.
6. Устройство для обработки звукового сигнала, содержащее: первый интерфейс для приема упакованного звукового сигнала, который содержит ряд сегментов; и компонент распаковки, распаковывающий упакованный звуковой сигнал включительно с определением соответствующего усиления для каждого сегмента из ряда сегментов, причем усиление находится в частотной области и основано на p-норме спектральных амплитуд каждого сегмента из ряда сегментов дискретных значений частотной области начального звукового сигнала, при этом значение р-нормы выбирают так, чтобы выделить спектральный состав слабого сигнала звукового сигнала относительно спектрального состава сильного сигнала звукового сигнала, и применяют соответствующее усиление к каждому сегменту из ряда сегментов для усиления сегментов с относительно высокой интенсивностью и ослабления сегментов с относительно низкой интенсивностью, при этом каждое соответствующее усиление для каждого временного сегмента вычисляется с использованием дискретных значений поддиапазона в подмножестве поддиапазонов в каждом соответствующем временном сегменте.
7. Устройство по п. 6, отличающееся тем, что дополнительно содержит первый банк фильтров, анализирующий звуковой сигнал, для получения представления в частотной области, и при этом определенная форма окна соответствует фильтр-прототипу для первого банка фильтров, и при этом, кроме того, банк фильтров представляет собой одно из банка квадратурных модулированных фильтров (QMF) или оконного преобразования Фурье, и при этом фильтр-прототип выполнен с возможностью сглаживания индивидуальных значений усиления для устранения разрывов в огибающей звукового сигнала.
8. Устройство по п. 6, отличающееся тем, что значение p в p-норме меньше 2.
9. Способ упаковки звукового сигнала, содержащего несколько каналов, при этом способ включает: прием частотно-временного мозаичного представления звукового сигнала, при этом частотно-временное мозаичное представление звукового сигнала содержит разделение звукового сигнала на временные интервалы, при этом каждый временной интервал разделен на частотные поддиапазоны; и упаковку частотно-временного мозаичного представления звукового сигнала с целью уменьшения динамического диапазона звукового сигнала; при этом упаковка частотно-временного мозаичного представления звукового сигнала предусматривает: разделение каналов звукового сигнала на дискретные подмножества каналов на основе сгруппированной информации; и для каждого дискретного подмножества каналов: вычисление общего усиления для временного интервала частотно-временного мозаичного представления звукового сигнала, при этом вычисление общего усиления включает снижение уровня упаковки под действием управляющей информации; и применение общего усиления для временного интервала к каждому частотному поддиапазону каждого канала дискретного подмножества каналов.
10. Способ по п. 9, отличающийся тем, что частотно-временное мозаичное представление звукового сигнала является представлением в области QMF.
11. Способ по п. 10, отличающийся тем, что количество частотных поддиапазонов в каждом временном интервале представления в области QMF равно 64.
12. Способ по п. 9, отличающийся тем, что для временных интервалов с относительно низкой интенсивностью применение вычисленного усиления усиливает звуковой сигнал, а для временных интервалов с относительно высокой интенсивностью применение вычисленного усиления ослабляет звуковой сигнал.
13. Способ по п. 9, отличающийся тем, что снижение уровня упаковки предусматривает снижение величины усиления, применяемого к звуковому сигналу, или снижение величины ослабления, применяемого к звуковому сигналу.
14. Способ по п. 9, отличающийся тем, что упаковка частотно-временного мозаичного представления звукового сигнала включается или отключается под действием управляющей информации.
15. Способ по п. 9, отличающийся тем, что сгруппированная информация указывает на то, что все каналы звукового сигнала находятся в одном и том же подмножестве каналов.
16. Способ по п. 9, отличающийся тем, что сгруппированная информация указывает на то, что каждый канал звукового сигнала находится в отдельном дискретном подмножестве каналов.
17. Устройство для упаковки звукового сигнала, содержащего несколько каналов, при этом устройство содержит: первый интерфейс, осуществляющий прием частотно-временного мозаичного представления звукового сигнала, при этом частотно-временное мозаичное представление звукового сигнала содержит разделение звукового сигнала на временные интервалы, при этом каждый временной интервал разделен на частотные поддиапазоны; и компонент упаковки, осуществляющий упаковку частотно-временного мозаичного представления звукового сигнала с целью уменьшения динамического диапазона звукового сигнала; при этом упаковка частотно-временного мозаичного представления звукового сигнала предусматривает: разделение каналов звукового сигнала на дискретные подмножества каналов на основе сгруппированной информации; и для каждого дискретного подмножества каналов: вычисление общего усиления для временного интервала частотно-временного мозаичного представления звукового сигнала, при этом вычисление общего усиления включает снижение уровня упаковки под действием управляющей информации; и применение общего усиления для временного интервала к каждому частотному поддиапазону каждого канала дискретного подмножества каналов.
18. Постоянный машиночитаемый носитель, содержащий команды, которые при исполнении одним или более процессорами выполняют способ по любому из пп. 9–16.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361809028P | 2013-04-05 | 2013-04-05 | |
US61/809,028 | 2013-04-05 | ||
US201361877167P | 2013-09-12 | 2013-09-12 | |
US61/877,167 | 2013-09-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016116038A Division RU2712814C2 (ru) | 2013-04-05 | 2014-04-01 | Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020100016A true RU2020100016A (ru) | 2021-07-08 |
RU2801156C2 RU2801156C2 (ru) | 2023-08-02 |
Family
ID=
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2016116038A (ru) | Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения | |
US10142749B2 (en) | Dynamic sound adjustment | |
RU2014127177A (ru) | Кодер и декодер звукового сигнала, способ генерирования управляющих данных из звукового сигнала и способ декодирования битового потока | |
RU2012113254A (ru) | Способ и устройство для обработки звукового сигнала | |
RU2007140406A (ru) | Системы, способы и устройства для подавления высокополосных всплесков | |
ES2540215T3 (es) | Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial | |
EP2667508A3 (en) | Method and apparatus for efficient frequency-domain implementation of time-varying filters | |
FI20185602A1 (fi) | Epäjatkuva nopeaan konvoluutioon perustuva suodatinprosessointi | |
RU2801156C2 (ru) | Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения | |
CA2840851C (en) | Audio bandwidth dependent noise suppression | |
RU2021130656A (ru) | Способ и устройство для применения сжатия динамического диапазона к сигналу амбиофонии высшего порядка |