RU2018129969A - Временное согласование данных обработки на основе квадратурного зеркального фильтра - Google Patents
Временное согласование данных обработки на основе квадратурного зеркального фильтра Download PDFInfo
- Publication number
- RU2018129969A RU2018129969A RU2018129969A RU2018129969A RU2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A
- Authority
- RU
- Russia
- Prior art keywords
- metadata
- waveform
- delay
- audio signal
- decoded
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 claims 9
- 238000000034 method Methods 0.000 claims 3
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 2
- 230000010355 oscillation Effects 0.000 claims 2
- 238000003786 synthesis reaction Methods 0.000 claims 2
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Claims (17)
1. Звуковой декодер, выполненный с возможностью определения восстановленного кадра звукового сигнала по блоку доступа принимаемого потока данных; причем блок доступа содержит данные о колебании и метаданные; причем данные о колебании и метаданные связаны с одним и тем же восстановленным кадром звукового сигнала; причем звуковой декодер содержит
- тракт обработки формы сигнала, выполненный с возможностью генерирования множества форм субполосных сигналов по данным о форме сигнала;
- тракт обработки метаданных, выполненный с возможностью генерирования декодированных метаданных по метаданным; и
- блок применения и синтеза метаданных, выполненный с возможностью генерирования восстановленного кадра звукового сигнала по множеству форм субполосных сигналов и по декодированным метаданным;
причем тракт обработки формы сигнала включает в себя, по меньшей мере, один блок задержки формы сигнала, выполненный с возможностью применения задержки формы сигнала к форме сигнала, которая представлена во временной области, и/или тракт обработки метаданных включает в себя, по меньшей мере, один блок задержки метаданных, причем блок задержки формы сигнала и/или блок задержки метаданных выполнены с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных, и причем указанный, по меньшей мере, один блок анализа выполнен с возможностью включения постоянной задержки, которая независима от длины N восстановленного кадра звукового сигнала.
2. Звуковой декодер по п. 1, в котором постоянная задержка, вносимая блоком анализа, соответствует 320 выборкам звукового сигнала.
3. Звуковой декодер по п. 1, в котором полная задержка тракта обработки метаданных зависит от одного из: кодированного битового потока или заранее задаваемого прогноза между метаданными и данными о форме сигнала.
4. Звуковой декодер по п. 1, в котором блок задержки формы сигнала и/или блок задержки метаданных сконфигурированы с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных таким образом, что полная задержка тракта обработки формы сигнала соответствует полной задержке тракта обработки метаданных.
5. Звуковой декодер по п. 1, в котором блок задержки формы сигнала и/или блок задержки метаданных сконфигурированы с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных таким образом, что множество форм субполосных сигналов и декодированных метаданных выдаются для обработки, выполняемой блоком применения и синтеза метаданных.
6. Способ определения восстановленного кадра звукового сигнала по блоку доступа принимаемого потока данных; причем блок доступа содержит данные о форме сигнала и метаданные; причем данные о форме сигнала и метаданные связаны с одним и тем же восстановленным кадром звукового сигнала; причем способ включает в себя
- генерирование множества форм субполосных сигналов по данным о форме сигнала;
- генерирование декодированных метаданных по метаданным;
- временное согласование множества форм субполосных сигналов и декодированных метаданных; и
- генерирование восстановленного кадра звукового сигнала по согласованному по времени множеству форм субполосных сигналов и декодированных метаданных;
причем генерирование множества форм субполосных сигналов по данным о форме сигнала содержит применение задержки формы сигнала к форме сигнала, который представлен во временной области и при этом включают постоянную задержку, которая независима от длины N восстановленного кадра звукового сигнала.
7. Компьютерная программа, выполненная с возможностью исполнения процессором для выполнения способа по п.6, при исполнении процессором.
8. Носитель хранения, содержащий компьютерную программу по п.7.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361877194P | 2013-09-12 | 2013-09-12 | |
US61/877,194 | 2013-09-12 | ||
US201361909593P | 2013-11-27 | 2013-11-27 | |
US61/909,593 | 2013-11-27 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016113716A Division RU2665281C2 (ru) | 2013-09-12 | 2014-09-08 | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2022112517A Division RU2022112517A (ru) | 2013-09-12 | 2022-05-11 | Временное согласование данных обработки на основе квадратурного зеркального фильтра |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2018129969A true RU2018129969A (ru) | 2019-03-15 |
RU2018129969A3 RU2018129969A3 (ru) | 2021-11-09 |
RU2772778C2 RU2772778C2 (ru) | 2022-05-25 |
Family
ID=
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2009526262A5 (ru) | ||
EP3923277A3 (en) | Delayed responses by computational assistant | |
MX2016000940A (es) | Aparato, metodo y programa de computadora para descodificar una señal de audio codificada. | |
RU2010140365A (ru) | Способ и устройство для обработки аудиосигнала | |
BR112012025570A2 (pt) | aparelho e método de processamento de sinal, meio de gravação, decodificador, codificador, métodos de decodificação e de codificação. | |
RU2010140362A (ru) | Способ и устройство для обработки аудиосигнала | |
RU2016101521A (ru) | Устройство и способ для генерации адаптивной формы спектра комфотного шума | |
IL268510A (en) | A model-based forecasting at a critically sampled filter bank | |
PH12015501575A1 (en) | Device and method for reducing quantization noise in a time-domain decoder | |
MX2016005535A (es) | Decodificador de audio y metodo para proveer una informacion de audio decodificada usando un ocultamiento de error sobre la base de una señal de excitacion de dominio de tiempo. | |
ATE455348T1 (de) | Vorrichtung und verfahren zur dekodierung eines audiosignals | |
JP2017516125A (ja) | エンコーダ、デコーダ並びに符号化及び復号方法 | |
RU2015133287A (ru) | Декорреляция сигналов в системе обработки аудиоданных | |
RU2017143404A (ru) | Устройство кодирования, способ кодирования, устройство декодирования, способ декодирования и программа | |
RU2017144520A (ru) | Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой | |
RU2017117896A (ru) | Кодирование и декодирование аудиосигналов | |
RU2016116016A (ru) | Способ и устройство предсказания сигнала возбуждения верхней полосы | |
RU2016113716A (ru) | Временное согласование данных обработки на основе квадратурного зеркального фильтра | |
Sahidullah | Enhancement of speaker recognition performance using block level, relative and temporal information of subband energies | |
RU2017106641A (ru) | Устройство и способ кодирования, устройство и способ декодирования и программа | |
RU2022112517A (ru) | Временное согласование данных обработки на основе квадратурного зеркального фильтра | |
RU2018115550A (ru) | Устройство декодирования, способ декодирования и программа | |
TH170266A (th) | การคาดคะเนที่ใช้แบบจำลองเป็นหลักในคลังตัวกรองสุ่มตัวอย่างขั้นวิกฤติ | |
Sharma | Information-rich sampling of time-varying signals | |
RU2020141850A (ru) | Предсказание на основе модели в наборе фильтров с критической дискретизацией |