RU2018129969A - Временное согласование данных обработки на основе квадратурного зеркального фильтра - Google Patents

Временное согласование данных обработки на основе квадратурного зеркального фильтра Download PDF

Info

Publication number
RU2018129969A
RU2018129969A RU2018129969A RU2018129969A RU2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A RU 2018129969 A RU2018129969 A RU 2018129969A
Authority
RU
Russia
Prior art keywords
metadata
waveform
delay
audio signal
decoded
Prior art date
Application number
RU2018129969A
Other languages
English (en)
Other versions
RU2018129969A3 (ru
RU2772778C2 (ru
Inventor
Кристофер ЧЕРЛИНГ
Хейко ПУРНХАГЕН
Йенс ПОПП
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2018129969A publication Critical patent/RU2018129969A/ru
Publication of RU2018129969A3 publication Critical patent/RU2018129969A3/ru
Application granted granted Critical
Publication of RU2772778C2 publication Critical patent/RU2772778C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Claims (17)

1. Звуковой декодер, выполненный с возможностью определения восстановленного кадра звукового сигнала по блоку доступа принимаемого потока данных; причем блок доступа содержит данные о колебании и метаданные; причем данные о колебании и метаданные связаны с одним и тем же восстановленным кадром звукового сигнала; причем звуковой декодер содержит
- тракт обработки формы сигнала, выполненный с возможностью генерирования множества форм субполосных сигналов по данным о форме сигнала;
- тракт обработки метаданных, выполненный с возможностью генерирования декодированных метаданных по метаданным; и
- блок применения и синтеза метаданных, выполненный с возможностью генерирования восстановленного кадра звукового сигнала по множеству форм субполосных сигналов и по декодированным метаданным;
причем тракт обработки формы сигнала включает в себя, по меньшей мере, один блок задержки формы сигнала, выполненный с возможностью применения задержки формы сигнала к форме сигнала, которая представлена во временной области, и/или тракт обработки метаданных включает в себя, по меньшей мере, один блок задержки метаданных, причем блок задержки формы сигнала и/или блок задержки метаданных выполнены с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных, и причем указанный, по меньшей мере, один блок анализа выполнен с возможностью включения постоянной задержки, которая независима от длины N восстановленного кадра звукового сигнала.
2. Звуковой декодер по п. 1, в котором постоянная задержка, вносимая блоком анализа, соответствует 320 выборкам звукового сигнала.
3. Звуковой декодер по п. 1, в котором полная задержка тракта обработки метаданных зависит от одного из: кодированного битового потока или заранее задаваемого прогноза между метаданными и данными о форме сигнала.
4. Звуковой декодер по п. 1, в котором блок задержки формы сигнала и/или блок задержки метаданных сконфигурированы с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных таким образом, что полная задержка тракта обработки формы сигнала соответствует полной задержке тракта обработки метаданных.
5. Звуковой декодер по п. 1, в котором блок задержки формы сигнала и/или блок задержки метаданных сконфигурированы с возможностью временного согласования множества форм субполосных сигналов и декодированных метаданных таким образом, что множество форм субполосных сигналов и декодированных метаданных выдаются для обработки, выполняемой блоком применения и синтеза метаданных.
6. Способ определения восстановленного кадра звукового сигнала по блоку доступа принимаемого потока данных; причем блок доступа содержит данные о форме сигнала и метаданные; причем данные о форме сигнала и метаданные связаны с одним и тем же восстановленным кадром звукового сигнала; причем способ включает в себя
- генерирование множества форм субполосных сигналов по данным о форме сигнала;
- генерирование декодированных метаданных по метаданным;
- временное согласование множества форм субполосных сигналов и декодированных метаданных; и
- генерирование восстановленного кадра звукового сигнала по согласованному по времени множеству форм субполосных сигналов и декодированных метаданных;
причем генерирование множества форм субполосных сигналов по данным о форме сигнала содержит применение задержки формы сигнала к форме сигнала, который представлен во временной области и при этом включают постоянную задержку, которая независима от длины N восстановленного кадра звукового сигнала.
7. Компьютерная программа, выполненная с возможностью исполнения процессором для выполнения способа по п.6, при исполнении процессором.
8. Носитель хранения, содержащий компьютерную программу по п.7.
RU2018129969A 2013-09-12 2014-09-08 Временное согласование данных обработки на основе квадратурного зеркального фильтра RU2772778C2 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US201361877194P 2013-09-12 2013-09-12
US61/877,194 2013-09-12
US201361909593P 2013-11-27 2013-11-27
US61/909,593 2013-11-27

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
RU2016113716A Division RU2665281C2 (ru) 2013-09-12 2014-09-08 Временное согласование данных обработки на основе квадратурного зеркального фильтра

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2022112517A Division RU2022112517A (ru) 2013-09-12 2022-05-11 Временное согласование данных обработки на основе квадратурного зеркального фильтра

Publications (3)

Publication Number Publication Date
RU2018129969A true RU2018129969A (ru) 2019-03-15
RU2018129969A3 RU2018129969A3 (ru) 2021-11-09
RU2772778C2 RU2772778C2 (ru) 2022-05-25

Family

ID=

Also Published As

Publication number Publication date
WO2015036348A1 (en) 2015-03-19
EP3044790A1 (en) 2016-07-20
CN105637584B (zh) 2020-03-03
EP3975179A1 (en) 2022-03-30
CN105637584A (zh) 2016-06-01
BR112016005167B1 (pt) 2021-12-28
RU2665281C2 (ru) 2018-08-28
US10811023B2 (en) 2020-10-20
EP3044790B1 (en) 2018-10-03
US20210158827A1 (en) 2021-05-27
CN118262739A (zh) 2024-06-28
RU2018129969A3 (ru) 2021-11-09
CN118248165A (zh) 2024-06-25
JP2024107012A (ja) 2024-08-08
HK1225503A1 (zh) 2017-09-08
JP2021047437A (ja) 2021-03-25
JP6531103B2 (ja) 2019-06-12
JP2016535315A (ja) 2016-11-10
KR20210143331A (ko) 2021-11-26
KR20160053999A (ko) 2016-05-13
US10510355B2 (en) 2019-12-17
EP3291233A1 (en) 2018-03-07
EP3582220B1 (en) 2021-10-20
CN111312279A (zh) 2020-06-19
CN111292757A (zh) 2020-06-16
RU2016113716A (ru) 2017-10-17
KR102329309B1 (ko) 2021-11-19
KR20220156112A (ko) 2022-11-24
KR102467707B1 (ko) 2022-11-17
JP7490722B2 (ja) 2024-05-27
US20180025739A1 (en) 2018-01-25
BR112016005167A2 (pt) 2017-08-01
JP6805293B2 (ja) 2020-12-23
EP3582220A1 (en) 2019-12-18
CN111312279B (zh) 2024-02-06
JP7139402B2 (ja) 2022-09-20
US20160225382A1 (en) 2016-08-04
EP3291233B1 (en) 2019-10-16
CN111292757B (zh) 2024-05-24
JP2019152876A (ja) 2019-09-12
JP2022173257A (ja) 2022-11-18

Similar Documents

Publication Publication Date Title
JP2009526262A5 (ru)
EP3923277A3 (en) Delayed responses by computational assistant
MX2016000940A (es) Aparato, metodo y programa de computadora para descodificar una señal de audio codificada.
RU2010140365A (ru) Способ и устройство для обработки аудиосигнала
BR112012025570A2 (pt) aparelho e método de processamento de sinal, meio de gravação, decodificador, codificador, métodos de decodificação e de codificação.
RU2010140362A (ru) Способ и устройство для обработки аудиосигнала
RU2016101521A (ru) Устройство и способ для генерации адаптивной формы спектра комфотного шума
IL268510A (en) A model-based forecasting at a critically sampled filter bank
PH12015501575A1 (en) Device and method for reducing quantization noise in a time-domain decoder
MX2016005535A (es) Decodificador de audio y metodo para proveer una informacion de audio decodificada usando un ocultamiento de error sobre la base de una señal de excitacion de dominio de tiempo.
ATE455348T1 (de) Vorrichtung und verfahren zur dekodierung eines audiosignals
JP2017516125A (ja) エンコーダ、デコーダ並びに符号化及び復号方法
RU2015133287A (ru) Декорреляция сигналов в системе обработки аудиоданных
RU2017143404A (ru) Устройство кодирования, способ кодирования, устройство декодирования, способ декодирования и программа
RU2017144520A (ru) Передискретизация звукового сигнала для кодирования/декодирования с малой задержкой
RU2017117896A (ru) Кодирование и декодирование аудиосигналов
RU2016116016A (ru) Способ и устройство предсказания сигнала возбуждения верхней полосы
RU2016113716A (ru) Временное согласование данных обработки на основе квадратурного зеркального фильтра
Sahidullah Enhancement of speaker recognition performance using block level, relative and temporal information of subband energies
RU2017106641A (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
RU2022112517A (ru) Временное согласование данных обработки на основе квадратурного зеркального фильтра
RU2018115550A (ru) Устройство декодирования, способ декодирования и программа
TH170266A (th) การคาดคะเนที่ใช้แบบจำลองเป็นหลักในคลังตัวกรองสุ่มตัวอย่างขั้นวิกฤติ
Sharma Information-rich sampling of time-varying signals
RU2020141850A (ru) Предсказание на основе модели в наборе фильтров с критической дискретизацией