RU2020138094A - Интеграция методик реконструкции высоких частот звука - Google Patents

Интеграция методик реконструкции высоких частот звука Download PDF

Info

Publication number
RU2020138094A
RU2020138094A RU2020138094A RU2020138094A RU2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A RU 2020138094 A RU2020138094 A RU 2020138094A
Authority
RU
Russia
Prior art keywords
audio signal
band
value
mode parameter
audio
Prior art date
Application number
RU2020138094A
Other languages
English (en)
Other versions
RU2792114C2 (ru
Inventor
Кристофер ЧОЭРЛИНГ
Ларс ВИЛЛЕМОЕС
Хейко ПУРНХАГЕН
Пер Экстранд
Original Assignee
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернешнл Аб filed Critical Долби Интернешнл Аб
Publication of RU2020138094A publication Critical patent/RU2020138094A/ru
Application granted granted Critical
Publication of RU2792114C2 publication Critical patent/RU2792114C2/ru

Links

Claims (37)

1. Способ выполнения реконструкции высоких частот звукового сигнала, включающий:
прием кодированного звукового битового потока, этот кодированный звуковой битовый поток содержит звуковые данные, представляющие относящуюся к нижнему диапазону часть звукового сигнала, и метаданные реконструкции высоких частот;
декодирование звуковых данных для генерирования декодированного звукового сигнала нижнего диапазона;
извлечение из кодированного звукового битового потока метаданных реконструкции высоких частот, эти метаданные реконструкции высоких частот содержат рабочие параметры для процесса реконструкции высоких частот, рабочие параметры включают параметр режима вставки, расположенный в обратно совместимом контейнере расширения кодированного звукового битового потока, при этом первое значение параметра режима вставки указывает на спектральный перенос, а второе значение параметра режима вставки указывает на гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером;
фильтрацию декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона;
восстановление относящейся к верхнему диапазону части звукового сигнала с использованием фильтрованного звукового сигнала нижнего диапазона и метаданных реконструкции высоких частот, при этом восстановление включает спектральный перенос, если параметр режима вставки имеет первое значение, и восстановление включает гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером, если параметр режима вставки имеет второе значение; и
объединение фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала,
при этом фильтрацию, восстановление и объединение выполняют как операцию постобработки с задержкой в 3010 дискретных значений на звуковой канал.
2. Способ по п. 1, отличающийся тем, что кодированный звуковой битовый поток дополнительно включает заполняющий элемент с идентификатором, указывающим начало заполняющего элемента, и заполняющими данными после идентификатора, где заполняющие данные содержат обратно совместимый контейнер расширения.
3. Способ по п. 2, отличающийся тем, что идентификатор представляет собой трехбитное целое число без знака, у которого сначала передают старший значащий бит, имеющее значение 0×6.
4. Способ по п. 2 или 3, отличающийся тем, что заполняющие данные содержат полезные данные расширения, при этом полезные данные расширения содержат данные расширения копирования спектральной полосы, и полезные данные расширения идентифицируют с помощью четырехбитного целого числа без знака, у которого сначала передают старший значащий бит, имеющего значение «1101» или «1110», и необязательно
при этом данные расширения копирования спектральной полосы содержат:
необязательный заголовок копирования спектральной полосы,
данные копирования спектральной полосы после заголовка и
элемент расширения копирования спектральной полосы после данных копирования спектральной полосы, и при этом в элемент расширения копирования спектральной полосы включают флаг.
5. Способ по любому из пп. 1-4, отличающийся тем, что метаданные реконструкции высоких частот содержат масштабные коэффициенты огибающей, масштабные коэффициенты шумового порога, информацию временной/частотной сетки или параметр, указывающий частоту разделения.
6. Способ по любому из пп. 1-5, отличающийся тем, что обратно совместимый контейнер расширения дополнительно содержит флаг, указывающий, используется ли дополнительная предварительная обработка для избежания нарушений непрерывности в форме огибающей спектра относящейся к верхнему диапазону части, когда параметр режима вставки равен первому значению, при этом первое значение флага включает дополнительную предварительную обработку, и второе значение флага отключает дополнительную предварительную обработку.
7. Способ по п. 6, отличающийся тем, что дополнительная предварительная обработка включает вычисление кривой предварительного усиления с использованием коэффициента фильтра линейного предсказания.
8. Способ по любому из пп. 1-5, отличающийся тем, что обратно совместимый контейнер расширения дополнительно содержит флаг, указывающий, необходимо ли применять адаптивную к сигналу передискретизацию в частотной области, когда параметр режима вставки равен второму значению, при этом первое значение флага включает адаптивную к сигналу передискретизацию в частотной области, и второе значение флага отключает адаптивную к сигналу передискретизацию в частотной области.
9. Способ по п. 8, отличающийся тем, что адаптивную к сигналу передискретизацию в частотной области применяют только для кадров, содержащих переходной сигнал.
10. Способ по любому из предыдущих пунктов, отличающийся тем, что гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером выполняют с оценочной сложностью 4,5 миллиона или менее операций в секунду и 3 или менее килослов памяти.
11. Способ по любому из предыдущих пунктов, отличающийся тем, что
фильтрация декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона включает фильтрование декодированного звукового сигнала нижнего диапазона во множество поддиапазонов с использованием блока комплексных анализирующих QMF фильтров; и
объединение фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала включает использование блока комплексных синтезирующих QMF фильтров.
12. Способ по п. 11, отличающийся тем, что анализирующие фильтры hk(n) блока комплексных анализирующих QMF фильтров и синтезирующие фильтры fk(n) блока комплексных синтезирующих QMF фильтров определяют по формуле:
Figure 00000001
где p0(n) представляет собой вещественнозначный фильтр-прототип, M обозначает количество каналов, а N представляет собой порядок фильтра-прототипа.
13. Компьютерный программный продукт, содержащий команды, которые при исполнении вычислительным устройством или системой вызывают выполнение указанным вычислительным устройством или системой способа по любому из пп. 1-12.
14. Блок обработки звука для выполнения реконструкции высоких частот звукового сигнала, содержащий:
интерфейс ввода для приема кодированного звукового битового потока, при этом кодированный звуковой битовый поток содержит звуковые данные, представляющие относящуюся к нижнему диапазону часть звукового сигнала, и метаданные реконструкции высоких частот;
основной декодер звука для декодирования звуковых данных для генерирования декодированного звукового сигнала нижнего диапазона;
устройство удаления форматирования для извлечения из кодированного звукового битового потока метаданных реконструкции высоких частот, эти метаданные реконструкции высоких частот содержат рабочие параметры для процесса реконструкции высоких частот, рабочие параметры включают параметр режима вставки, расположенный в обратно совместимом контейнере расширения кодированного звукового битового потока, при этом первое значение параметра режима вставки указывает на спектральный перенос, а второе значение параметра режима вставки указывает на гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером;
блок анализирующих фильтров для фильтрации декодированного звукового сигнала нижнего диапазона для генерирования фильтрованного звукового сигнала нижнего диапазона;
устройство восстановления высоких частот для реконструкции относящейся к верхнему диапазону части звукового сигнала с использованием фильтрованного звукового сигнала нижнего диапазона и метаданных реконструкции высоких частот, при этом реконструкция включает спектральный перенос, если параметр режима вставки имеет первое значение, и реконструкция включает гармоническую транспозицию с использованием растяжения диапазона частот фазовым вокодером, если параметр режима вставки имеет второе значение; и
блок синтезирующих фильтров для объединения фильтрованного звукового сигнала нижнего диапазона с восстановленной относящейся к верхнему диапазону частью для формирования широкополосного звукового сигнала,
при этом блок анализирующих фильтров, устройство восстановления высоких частот и блок синтезирующих фильтров выполняются в постпроцессоре с задержкой в 3010 дискретных значений на канал звука или менее.
15. Блок обработки звука по п. 14, отличающийся тем, что гармоническая транспозиция с использованием растяжения диапазона частот фазовым вокодером выполняется с оценочной сложностью 4,5 миллиона или менее операций в секунду и 3 или менее килослов памяти.
RU2020138094A 2018-04-25 2019-04-25 Интеграция методик реконструкции высоких частот звука RU2792114C2 (ru)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP18169156.9 2018-04-25

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2023105629A Division RU2023105629A (ru) 2018-04-25 2019-04-25 Интеграция методик реконструкции высоких частот звука

Publications (2)

Publication Number Publication Date
RU2020138094A true RU2020138094A (ru) 2022-05-25
RU2792114C2 RU2792114C2 (ru) 2023-03-16

Family

ID=

Similar Documents

Publication Publication Date Title
RU2021130811A (ru) Интеграция методик реконструкции высоких частот с сокращенной задержкой постобработки
RU2449387C2 (ru) Способ и устройство для обработки сигнала
RU2510536C2 (ru) Устройство сглаживания спектра, устройство кодирования, устройство декодирования, устройство терминала связи, устройство базовой станции и способ сглаживания спектра
CA2853987C (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US11908484B2 (en) Apparatus and method for generating an enhanced signal using independent noise-filling at random values and scaling thereupon
CN107527629B (zh) 用于在音频信号解码器中进行频带扩展的优化缩放因子
JP6775063B2 (ja) オーディオ信号復号器における改善された周波数帯域拡張
IL265722A (en) Method and system for harmonic, lumpy, subchannel transposition, and enhanced by vertical rotation
CN101083076A (zh) 使用带宽扩展技术对信号编码和解码的方法和设备
JP2021157202A5 (ru)
IL278573B2 (en) Coordinate-inverse combination of high-frequency reconstruction techniques for audio signals
RU2733278C1 (ru) Устройство и способ для определения предварительно определенной характеристики, относящейся к обработке спектрального улучшения аудиосигнала
EA038268B1 (ru) Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов
KR20210143331A (ko) Qmf 기반 처리 데이터의 시간 정렬
KR102469964B1 (ko) 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치
RU2020138094A (ru) Интеграция методик реконструкции высоких частот звука
RU2409874C2 (ru) Сжатие звуковых сигналов
IL310202A (en) Combining high-frequency audio reconstruction techniques
RU2023105629A (ru) Интеграция методик реконструкции высоких частот звука
RU2021128983A (ru) Обратно совместимая интеграция методов высокочастотного восстановления для аудиосигналов
DK2691951T3 (en) TRANSFORMATION WITH REDUCED COMPLEXITY OF AN Low-Frequency