RU2020138094A - Интеграция методик реконструкции высоких частот звука - Google Patents
Интеграция методик реконструкции высоких частот звука Download PDFInfo
- Publication number
- RU2020138094A RU2020138094A RU2020138094A RU2020138094A RU2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A
- Authority
- RU
- Russia
- Prior art keywords
- audio signal
- band
- value
- mode parameter
- audio
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims 3
- 230000005236 sound signal Effects 0.000 claims 23
- 230000003595 spectral Effects 0.000 claims 11
- 230000017105 transposition Effects 0.000 claims 6
- 238000001914 filtration Methods 0.000 claims 5
- 230000002194 synthesizing Effects 0.000 claims 5
- 230000015572 biosynthetic process Effects 0.000 claims 4
- 238000007781 pre-processing Methods 0.000 claims 4
- 238000003786 synthesis reaction Methods 0.000 claims 4
- 238000004458 analytical method Methods 0.000 claims 3
- 238000003780 insertion Methods 0.000 claims 2
- 238000004590 computer program Methods 0.000 claims 1
- 238000000605 extraction Methods 0.000 claims 1
- 238000001228 spectrum Methods 0.000 claims 1
- 230000001052 transient Effects 0.000 claims 1
Claims (37)
1. Способ выполнения реконструкции высоких частот звукового сигнала, включающий:
прием кодированного звукового битового потока, этот кодированный звуковой битовый поток содержит звуковые данные, представляющие относящуюся к нижнему диапазону часть звукового сигнала, и метаданные реконструкции высоких частот;
декодирование звуковых данных для генерирования декодированного звукового сигнала нижнего диапазона;
извлечение из кодированного звукового битового потока метаданных реконструкции высоких частот, эти метаданные реконструкции высоких частот содержат рабочие параметры для процесса реконструкции высоких частот, рабочие параметры включают параметр режима вставки, расположенный в обратно совместимом контейнере расширения кодированного звукового битового потока, при этом первое значение параметра режима вставки указывает на спектральный перенос, а второе значение параметра режима вставки указывает на гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером;
фильтрацию декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона;
восстановление относящейся к верхнему диапазону части звукового сигнала с использованием фильтрованного звукового сигнала нижнего диапазона и метаданных реконструкции высоких частот, при этом восстановление включает спектральный перенос, если параметр режима вставки имеет первое значение, и восстановление включает гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером, если параметр режима вставки имеет второе значение; и
объединение фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала,
при этом фильтрацию, восстановление и объединение выполняют как операцию постобработки с задержкой в 3010 дискретных значений на звуковой канал.
2. Способ по п. 1, отличающийся тем, что кодированный звуковой битовый поток дополнительно включает заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющими данными после идентификатора, где заполняющие данные содержат обратно совместимый контейнер расширения.
3. Способ по п. 2, отличающийся тем, что идентификатор представляет собой трехбитное целое число без знака, у которого сначала передают старший значащий бит, имеющее значение 0×6.
4. Способ по п. 2 или 3, отличающийся тем, что заполняющие данные содержат полезные данные расширения, при этом полезные данные расширения содержат данные расширения копирования спектральной полосы, и полезные данные расширения идентифицируют с помощью четырехбитного целого числа без знака, у которого сначала передают старший значащий бит, имеющего значение «1101» или «1110», и необязательно
при этом данные расширения копирования спектральной полосы содержат:
необязательный заголовок копирования спектральной полосы,
данные копирования спектральной полосы после заголовка и
элемент расширения копирования спектральной полосы после данных копирования спектральной полосы, и при этом в элемент расширения копирования спектральной полосы включают флаг.
5. Способ по любому из пп. 1-4, отличающийся тем, что метаданные реконструкции высоких частот содержат масштабные коэффициенты огибающей, масштабные коэффициенты шумового порога, информацию временной/частотной сетки или параметр, указывающий частоту разделения.
6. Способ по любому из пп. 1-5, отличающийся тем, что обратно совместимый контейнер расширения дополнительно содержит флаг, указывающий, используется ли дополнительная предварительная обработка для избежания нарушений непрерывности в форме огибающей спектра относящейся к верхнему диапазону части, когда параметр режима вставки равен первому значению, при этом первое значение флага включает дополнительную предварительную обработку, и второе значение флага отключает дополнительную предварительную обработку.
7. Способ по п. 6, отличающийся тем, что дополнительная предварительная обработка включает вычисление кривой предварительного усиления с использованием коэффициента фильтра линейного предсказания.
8. Способ по любому из пп. 1-5, отличающийся тем, что обратно совместимый контейнер расширения дополнительно содержит флаг, указывающий, необходимо ли применять адаптивную к сигналу передискретизацию в частотной области, когда параметр режима вставки равен второму значению, при этом первое значение флага включает адаптивную к сигналу передискретизацию в частотной области, и второе значение флага отключает адаптивную к сигналу передискретизацию в частотной области.
9. Способ по п. 8, отличающийся тем, что адаптивную к сигналу передискретизацию в частотной области применяют только для кадров, содержащих переходной сигнал.
10. Способ по любому из предыдущих пунктов, отличающийся тем, что гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером выполняют с оценочной сложностью 4,5 миллиона или менее операций в секунду и 3 или менее килослов памяти.
11. Способ по любому из предыдущих пунктов, отличающийся тем, что
фильтрация декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона включает фильтрование декодированного звукового сигнала нижнего диапазона во множество поддиапазонов с использованием блока комплексных анализирующих QMF фильтров; и
объединение фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала включает использование блока комплексных синтезирующих QMF фильтров.
12. Способ по п. 11, отличающийся тем, что анализирующие фильтры hk(n) блока комплексных анализирующих QMF фильтров и синтезирующие фильтры fk(n) блока комплексных синтезирующих QMF фильтров определяют по формуле:
где p0(n) представляет собой вещественнозначный фильтр-прототип, M обозначает количество каналов, а N представляет собой порядок фильтра-прототипа.
13. Компьютерный программный продукт, содержащий команды, которые при исполнении вычислительным устройством или системой вызывают выполнение указанным вычислительным устройством или системой способа по любому из пп. 1-12.
14. Блок обработки звука для выполнения реконструкции высоких частот звукового сигнала, содержащий:
интерфейс ввода для приема кодированного звукового битового потока, при этом кодированный звуковой битовый поток содержит звуковые данные, представляющие относящуюся к нижнему диапазону часть звукового сигнала, и метаданные реконструкции высоких частот;
основной декодер звука для декодирования звуковых данных для генерирования декодированного звукового сигнала нижнего диапазона;
устройство удаления форматирования для извлечения из кодированного звукового битового потока метаданных реконструкции высоких частот, эти метаданные реконструкции высоких частот содержат рабочие параметры для процесса реконструкции высоких частот, рабочие параметры включают параметр режима вставки, расположенный в обратно совместимом контейнере расширения кодированного звукового битового потока, при этом первое значение параметра режима вставки указывает на спектральный перенос, а второе значение параметра режима вставки указывает на гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером;
блок анализирующих фильтров для фильтрации декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона;
устройство восстановления высоких частот для реконструкции относящейся к верхнему диапазону части звукового сигнала с использованием фильтрованного звукового сигнала нижнего диапазона и метаданных реконструкции высоких частот, при этом реконструкция включает спектральный перенос, если параметр режима вставки имеет первое значение, и реконструкция включает гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером, если параметр режима вставки имеет второе значение; и
блок синтезирующих фильтров для объединения фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала,
при этом блок анализирующих фильтров, устройство восстановления высоких частот и блок синтезирующих фильтров выполняются в постпроцессоре с задержкой в 3010 дискретных значений на канал звука или менее.
15. Блок обработки звука по п. 14, отличающийся тем, что гармоническая транспозиция с использованием растяжения диапазона частот фазовым вокодером выполняется с оценочной сложностью 4,5 миллиона или менее операций в секунду и 3 или менее килослов памяти.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP18169156.9 | 2018-04-25 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2023105629A Division RU2023105629A (ru) | 2018-04-25 | 2019-04-25 | Интеграция методик реконструкции высоких частот звука |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020138094A true RU2020138094A (ru) | 2022-05-25 |
RU2792114C2 RU2792114C2 (ru) | 2023-03-16 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2021130811A (ru) | Интеграция методик реконструкции высоких частот с сокращенной задержкой постобработки | |
RU2449387C2 (ru) | Способ и устройство для обработки сигнала | |
RU2510536C2 (ru) | Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра | |
CA2853987C (en) | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding | |
US11908484B2 (en) | Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon | |
CN107527629B (zh) | 用于在音频信号解码器中进行频带扩展的优化缩放因子 | |
JP6775063B2 (ja) | オーディオ信号復号器における改善された周波数帯域拡張 | |
IL265722A (en) | Method and system for harmonic, lumpy, subchannel transposition, and enhanced by vertical rotation | |
CN101083076A (zh) | 使用带宽扩展技术对信号编码和解码的方法和设备 | |
JP2021157202A5 (ru) | ||
IL278573B2 (en) | Coordinate-inverse combination of high-frequency reconstruction techniques for audio signals | |
RU2733278C1 (ru) | Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке спектрального улучшения аудиосигнала | |
EA038268B1 (ru) | Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов | |
KR20210143331A (ko) | Qmf 기반 처리 데이터의 시간 정렬 | |
KR102469964B1 (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
RU2020138094A (ru) | Интеграция методик реконструкции высоких частот звука | |
RU2409874C2 (ru) | Сжатие звуковых сигналов | |
IL310202A (en) | Combining high-frequency audio reconstruction techniques | |
RU2023105629A (ru) | Интеграция методик реконструкции высоких частот звука | |
RU2021128983A (ru) | Обратно совместимая интеграция методов высокочастотного восстановления для аудиосигналов | |
DK2691951T3 (en) | TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency |