RU2407069C2

RU2407069C2 - Кодирование и декодирование аудиосигналов с использованием гребенок фильтров с комплексным значением

Info

Publication number: RU2407069C2
Application number: RU2007120591/09A
Authority: RU
Inventors: Ларс Ф. ВИЛЛЕМОЕС (SE); Ларс Ф. ВИЛЛЕМОЕС; Эрик Г.П. СХЕЙЕРС (NL); Эрик Г.П. СХЕЙЕРС
Original assignee: Конинклейке Филипс Электроникс Н.В.; Коудинг Текнолоджиз Аб
Priority date: 2004-11-02
Filing date: 2005-10-31
Publication date: 2010-12-20
Also published as: JP2008519290A; KR20070085681A; BRPI0517234B1; BRPI0517234A; ES2791001T3; KR101187597B1; US8255231B2; PL1810281T3; RU2007120591A; EP1810281B1; CN102148035A; WO2006048814A1; MX2007005103A; CN102148035B; US20090063140A1; EP1810281A1; CN101053019B; JP4939424B2; CN101053019A

Abstract

Изобретение относится к кодированию и/или декодированию аудиосигналов и, в частности, к кодированию/декодированию формы аудиосигнала. Технический результат - повышение точности кодирования аудиосигналов. Кодер содержит приемник (201), который принимает аудиосигнал временной области. Гребенка (203) фильтров генерирует первый поддиапазонный сигнал из аудиосигнала временной области, где первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области. Процессор (205) преобразования генерирует второй поддиапазонный сигнал из первого поддиапазонного сигнала путем поддиапазонной обработки. Второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области. Процессор (207) кодирования затем генерирует поток данных кодированного по форме сигнала путем кодирования значений данных второго поддиапазонного сигнала. Процессор (205) преобразования генерирует второй поддиапазонный сигнал путем непосредственного преобразования поддиапазонов, без обратного преобразования во временную область. Изобретение позволяет выполнять кодирование по форме сигнала с уменьшенной сложностью для поддиапазонного сигнала с повышенной частотой дискретизации, обычно генерируемого при параметрическом кодировании. Декодер выполняет обратную операцию. 13 н. и 15 з.п. ф-лы, 11 ил.

Description

Изобретение относится к кодированию и/или декодированию аудиосигналов и, в частности, к кодированию/декодированию формы аудиосигнала.

Цифровое кодирование сигналов различных источников за последние десятилетия приобретает все большее значение, поскольку цифровое представление сигналов и цифровая связь все в большей степени заменяют аналоговое представление и связь. Например, системы мобильных телефонов, такие как Глобальная система мобильной связи, основаны на цифровом кодировании речи. Кроме того, распространение мультимедийного содержания, такого как видео и музыка, все в большей степени основывается на цифровом кодировании содержания.

Традиционно при кодировании аудио, в основном, использовали кодирование формы сигнала, при котором соответствующую форму сигнала преобразовывали в цифровую форму и эффективно кодировали. Например, типичный кодер формы сигнала содержит гребенку фильтров, преобразующую сигнал в область частотного поддиапазона. Основываясь на психоакустической модели, применяют порог маскирования, и полученные в результате значения поддиапазонов эффективно дискретизируют и кодируют, например, используя код Хаффмана.

Примеры кодеров формы сигнала включают в себя хорошо известные схемы кодирования MPEG-1 (Экспертная группа по вопросам движущегося изображения) уровень 3 (или MP3), или AAC (УКЗ, усовершенствованное кодирование аудио).

В последние годы было предложено множество методов кодирования, которые не используют непосредственное кодирование соответствующей формы сигнала, а вместо этого используют характеристики кодируемых сигналов, используя множество параметров. Например, для кодирования речи кодер и декодер могут быть основанными на модели голосового тракта человека, и вместо кодирования формы сигнала могут кодироваться различные параметры и сигналы возбуждения для этой модели. Такие методы обычно называются методами параметрического кодирования.

Кроме того, кодирование формы сигнала и параметрическое кодирование могут комбинироваться для получения особенно эффективного и высококачественного кодирования. В таких системах параметры могут описывать часть сигнала со ссылкой на другую часть сигнала, которая кодирована по форме сигнала. Например, были предложены методы кодирования, в которых нижние частоты кодируют по форме сигнала, а высокие частоты кодируют с использованием параметрического расширения, которое описывает свойства более высоких частот относительно низких частот. В качестве другого примера было предложено многоканальное кодирование сигнала, в котором, например, монофонический сигнал кодируют с использованием формы сигнала, и параметрическое расширение включает в себя параметрические данные, указывающие, чем отдельные каналы отличаются от общего сигнала.

Примеры методов кодирования на основе параметрического расширения включают в себя методы репликации спектральной полосы (SBR, РСП), параметрического стерео (PS, ПС) кодирования и пространственного кодирования аудио (SAC, ПКА).

В настоящее время метод SAC разрабатывается для эффективного кодирования многоканальных аудиосигналов. Этот метод частично основан на методе кодирования PS. Аналогично парадигме PS, метод SAC основан на понимании того, что многоканальный сигнал, содержащий М каналов, может быть эффективно представлен сигналом, состоящим из N каналов, где N<М, и небольшим количеством параметров, представляющих пространственные ориентиры. Типичное применение состоит в кодировании обычного представления сигнала 5.1 в качестве монофонического или стереофонического сигнала, кодированного по форме или с добавлением пространственных параметров. Пространственные параметры могут быть внедрены во вспомогательную часть данных основного монофонического или стереофонического потока битов для формирования расширения, обладающего обратной совместимостью.

Так же, как и в методах SBR и PS, в методе SAC используются гребенки комплексных (псевдо) квадратурных зеркальных фильтров (QMF) для преобразования представления во временной области в представление в частотной области (и наоборот). Характеристика этих гребенок фильтров состоит в том, что сигналы в областях поддиапазонов с комплексным значением эффективно подвергают дискретизации с повышенной частотой с коэффициентом два. Это позволяет выполнять операции пост-обработки сигналов в области поддиапазона без ввода искажений, связанных с дискретизацией.

Другая общая характеристика параметрического расширения состоит в том, что в типичных условиях эти методы не позволяют достичь прозрачного уровня качества аудио, то есть вводится некоторое ухудшение качества.

Для развития параметрических расширений, таких как SBR, PS и SAC в направлении прозрачного качества аудио, было бы желательно кодировать отдельные части, например, определенное количество полос сигналов в области комплексных поддиапазонов, используя кодер формы сигнала.

Непосредственный подход состоит в том, что вначале эти части области комплексного поддиапазона преобразуют обратно во временную область. Существующий кодер формы сигнала (например, AAC) затем можно применять к полученным в результате сигналам во временной области. Однако такой подход связан с множеством недостатков.

В частности, в результате получаются кодер и декодер большой сложности с высокой вычислительной нагрузкой, связанной с повторными преобразованиями между частотной областью и временной областью, с использованием разных преобразований. Например, если в параметрическом расширении будет использоваться кодирование сигнала во временной области, полученного после синтеза QMF, соответствующий декодер будет состоять из полного декодера формы сигнала (например, декодера производного AAC) и дополнительно гребенки анализа QMF. Это решение является дорогостоящим ввиду высокой сложности вычислений.

Кроме того, было бы предпочтительно получить корреляцию между используемым параметрическим расширением и кодированием формы сигнала для элементов сигнала, кодированных с использованием параметрического расширения.

Например, система может состоять из, например, кодирования AAC и SBR (НE-AAC) или AAC и SAC. Если в системе возможно дополнить расширение SBR или SAC кодированием формы сигнала, было бы логично также использовать AAC для кодирования сигнала во временной области, полученной после синтеза QMF. Однако в другой системе, использующей те же расширения, например, в комбинации MPEG-1, уровень II и SBR предпочтительно возможно было бы использовать другую систему кодирования формы сигнала: MPEG-1, уровень II. В соответствии с этим, было бы предпочтительно объединить расширение кодирования формы сигнала с инструментом параметрического расширения, а не с основным кодером.

Следовательно, предпочтительно было бы получить улучшенную систему и, в частности, систему кодирования и/или декодирования, позволяющую повысить гибкость, снизить сложность, уменьшить вычислительную нагрузку, которая способствовала бы взаимодействию между разными элементами используемого кодирования, обеспечить улучшение (например, с возможностью масштабирования) качества аудио и/или улучшение рабочих характеристик.

В соответствии с этим, изобретение, предпочтительно, направлено на уменьшение, ослабление или устранение одного или более из указанных выше недостатков, по отдельности или в любой их комбинации.

В соответствии с аспектом изобретения предложен декодер, предназначенный для генерирования аудиосигнала во временной области путем декодирования формы сигнала, причем декодер содержит: средство приема потока кодированных данных; средство генерирования первого поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала области поддиапазонов для аудиосигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала во временной области; и гребенку фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

Изобретение позволяет получить улучшенный декодер. При этом может быть создан декодер с уменьшенной сложностью и/или могут быть снижены требования к вычислительным ресурсам. В частности, гребенка фильтров синтеза может использоваться как для декодирования параметрического расширения для аудиосигнала во временной области, так и для декодирования формы сигнала. При этом может быть достигнута общность между декодированием формы сигнала и параметрическим декодированием. В частности, гребенка фильтров синтеза может представлять собой гребенку фильтров QMF, которую обычно используют для параметрического декодирования в методах кодирования на основе параметрического расширения, таких как SBR, PS и SAC.

Процессор преобразования выполнен с возможностью генерирования второго поддиапазонного сигнала в результате поддиапазонной обработки, при этом не требуется какое-либо преобразование, например, первого поддиапазонного сигнала обратно во временную область.

Декодер может дополнительно содержать средство обработки сигналов без искажений, связанных с дискретизацией, для второго поддиапазонного сигнала перед выполнением операции синтеза в гребенке фильтров синтеза.

В качестве дополнительного признака изобретения каждый поддиапазон первого поддиапазонного сигнала содержит множество подподдиапазонов, и средство преобразования содержит вторую гребенку фильтров синтеза, предназначенную для генерирования поддиапазонов вторых поддиапазонных сигналов из подподдиапазонов первого поддиапазонного сигнала.

Это может обеспечить эффективное средство преобразования первого поддиапазонного сигнала. Может быть предусмотрено свойство для получения эффективного средства и/или средства низкой сложности для компенсации частотного отклика фильтров поддиапазонов гребенки фильтров синтеза.

В качестве дополнительного признака изобретения каждый поддиапазон второго поддиапазонного сигнала содержит поддиапазон с наложением спектров и поддиапазон без наложения спектров, при этом средство преобразования содержит средство разделения, предназначенное для разделения подподдиапазона первого поддиапазонного сигнала на подподдиапазон с наложением спектров в полосе первого поддиапазона второго поддиапазонного сигнала и поддиапазон без наложения спектров второго поддиапазона второго поддиапазонного сигнала, при этом поддиапазон с наложением спектров и поддиапазон без наложения спектров имеют соответствующие частотные интервалы в сигнале временной области.

Это может обеспечить эффективное средство преобразования первого поддиапазонного сигнала. В частности, это позволяет генерировать сигнальные компоненты в разных поддиапазонах, получаемых из одной и той же частоты аудиосигнала временной области, из одного сигнального компонента.

В качестве дополнительного признака изобретения средство разделения содержит структуру типа бабочки.

Такой подход позволяет получить особенно эффективный вариант выполнения и/или высокие рабочие характеристики. В структуре типа бабочки может использоваться одно нулевое входное значение и одно входное значение данных поддиапазона для генерирования двух выходных значений, соответствующих разным поддиапазонам второго поддиапазона.

В соответствии с другим аспектом изобретения предусмотрен кодер для кодирования аудиосигнала временной области, причем кодер содержит: средство приема аудиосигнала временной области; первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала.

Изобретение позволяет получить улучшенный кодер. При этом может быть получен кодер с уменьшенной сложностью, и/или могут быть снижены требования к вычислительным ресурсам. При этом обеспечивается общность между кодированием по форме сигнала и параметрическим кодированием. В частности, первая гребенка фильтров может представлять собой гребенку фильтров QMF, которую обычно используют для параметрического кодирования при использовании методов кодирования с параметрическим расширением, таких как SBR, PS и SAC.

Может быть улучшено качество декодированного аудио. Например, аудиосигнал временной области может представлять собой остаточный сигнал после параметрического кодирования. Сигнал, кодированный по форме сигнала, может обеспечить информацию, которая позволяет получить повышенную прозрачность.

Процессор преобразования выполнен с возможностью генерирования второго поддиапазонного сигнала в результате поддиапазонной обработки, и при этом не требуется какое-либо преобразование, например, первого поддиапазонного сигнала обратно во временную область.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство параметрического кодирования аудиосигнала временной области с использованием первого поддиапазонного сигнала.

Изобретение обеспечивает возможность эффективного и/или высококачественного кодирования основного сигнала с одновременным использованием параметрического кодирования и кодирования по форме сигнала. При этом функции могут быть разделены между параметрическим кодированием и кодированием по форме сигнала. Параметрическое кодирование может представлять собой кодирование параметрического расширения, такое как кодирование SBR, PS или SAC. Кодер может, в частности, обеспечивать кодирование формы сигнала некоторых или всех поддиапазонов кодирования параметрического расширения.

В качестве дополнительного признака изобретения средство преобразования содержит вторую гребенку фильтров для генерирования множества подподдиапазонов для каждого поддиапазона первого поддиапазонного сигнала.

Это позволяет обеспечить эффективное средство преобразования первого поддиапазонного сигнала. Этот признак может обеспечить эффективное средство и/или средство низкой сложности для компенсации частотного отклика фильтров поддиапазонов для первого поддиапазона.

В качестве дополнительного признака изобретения вторая гребенка фильтров упорядочена нечетным образом.

Это позволяет улучшить рабочие характеристики и обеспечить улучшенное разделение между положительными и отрицательными частотами в области комплексных поддиапазонов.

В качестве дополнительного признака изобретения каждый поддиапазон содержит несколько подподдиапазонов с наложением спектров, соответствующих диапазону с наложением спектров поддиапазона, и несколько подподдиапазонов без наложения спектров, соответствующих диапазону без наложения спектров поддиапазона; при этом средство преобразования содержит средство комбинирования, предназначенное для комбинирования подподдиапазонов с наложением спектров в полосе первого поддиапазона с подподдиапазонами без наложения спектров второго поддиапазона, при этом подподдиапазоны с наложением спектров и подподдиапазоны без наложения спектров имеют соответствующие частотные интервалы в сигнале временной области.

Это позволяет обеспечить эффективное средство преобразования первого поддиапазонного сигнала. В частности, это позволяет скомбинировать сигнальные компоненты разных поддиапазонов, полученных из одной и той же частоты аудиосигнала временной области, в один сигнальный компонент. Это позволяет снизить скорость передачи данных.

В качестве дополнительного признака изобретения средство комбинирования выполнено с возможностью уменьшения энергии в диапазоне с наложением спектров.

Это позволяет улучшить рабочие характеристики и/или позволяет снизить скорость передачи данных. В частности, энергия диапазона с наложением спектров может быть сведена к минимуму, и диапазоны с наложением спектров могут игнорироваться.

В частности, средство комбинирования может дополнительно содержать средство, предназначенное для компенсации поддиапазонов без наложения спектров первого поддиапазона поддиапазонами с наложением спектров второго поддиапазона. В частности, средство комбинирования может содержать средство вычитания коэффициентов поддиапазонов с наложением спектров второго поддиапазона из поддиапазонов без наложения спектров первого поддиапазона.

В качестве дополнительного признака изобретения средство комбинирования содержит средство, предназначенное для генерирования суммарного сигнала без наложения спектров для первого подподдиапазона с наложением спектров в первом поддиапазоне и первого подподдиапазона без наложения спектров во втором поддиапазоне.

Это позволяет обеспечить особенно эффективную реализацию и/или высокие рабочие характеристики.

В качестве дополнительного признака изобретения средство комбинирования содержит структуру типа бабочки, предназначенную для генерирования суммарного сигнала без наложения спектров.

Это позволяет обеспечить особенно эффективную реализацию и/или высокие рабочие характеристики. Структура типа бабочки, в частности, может представлять собой половину структуры типа бабочки, в которой генерируется только одно выходное значение.

В качестве дополнительного признака изобретения, по меньшей мере, один коэффициент структуры типа бабочки зависит от частотного отклика фильтра первой гребенки фильтров.

В качестве дополнительного признака изобретения средство преобразования выполнено с возможностью не включать значения данных для диапазона с наложением спектров в поток кодированных данных.

Это позволяет обеспечить высокое качество кодированного аудио для заданной скорости передачи данных.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство обработки сигнала без наложения спектров для первого поддиапазонного сигнала перед преобразованием во второй сигнал.

Это позволяет улучшить рабочие характеристики. Изобретение позволяет эффективно реализовать кодер по форме сигнала, имеющий критически дискретизированный выходной сигнал, что обеспечивает выполнение обработки сигналов в отдельных поддиапазонах без ввода ошибок, обусловленных наложением спектров, связанным с дискретизацией.

В качестве дополнительного признака изобретения кодер дополнительно содержит средство компенсации фазы первого поддиапазонного сигнала перед преобразованием во второй сигнал.

Это позволяет улучшить рабочие характеристики и/или обеспечить возможность эффективной реализации.

В качестве дополнительного признака изобретения первая гребенка фильтров представляет собой гребенку фильтров QMF.

Изобретение позволяет обеспечить эффективное кодирование по форме сигнала, используя фильтр QMF, который используется во многих методах параметрического кодирования, таких как SBR, PS, SAC. Таким образом могут быть достигнуты улучшенная совместимость и/или улучшенное разделение функций и/или улучшенное взаимодействие методов кодирования по форме сигнала и параметрического кодирования.

В соответствии с другим аспектом изобретения предложен способ генерирования аудиосигнала временной области путем декодирования формы сигнала, причем способ содержит: прием потока кодированных данных; генерирование первого поддиапазонного сигнала путем декодирования значений данных из потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование гребенкой фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ кодирования аудиосигнала временной области, причем способ содержит: прием аудиосигнала временной области; генерирование первой гребенкой фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и генерирование потока данных, кодированных по форме сигнала, путем кодирования значения данных второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предусмотрен приемник для приема аудиосигнала, причем приемник содержит: средство приема потока кодированных данных; средство генерирования первого поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и гребенку фильтров синтеза для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен передатчик, предназначенный для передачи кодированного аудиосигнала, причем передатчик содержит: средство приема аудиосигнала временной области; первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала; и средство передачи потока данных, кодированных по форме сигнала.

В соответствии с другим аспектом изобретения предложена система передачи, предназначенная для передачи аудиосигнала временной области, причем система передачи содержит: передатчик, содержащий: средство приема аудиосигнала временной области, первую гребенку фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области, средство преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области, средство генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и средство передачи потока данных, кодированных по форме сигнала; и приемник, содержащий: средство приема потока данных, кодированных по форме сигнала, средство генерирования третьего поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области, средство преобразования, предназначенное для генерирования четвертого поддиапазонного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и гребенку фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из четвертого поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ приема аудиосигнала, причем способ содержит: прием потока кодированных данных; генерирование первого поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование с помощью гребенки фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен способ передачи кодированного аудиосигнала, причем способ содержит: прием аудиосигнала временной области; генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области; генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и генерирование потока данных, кодированных по форме сигнала путем кодирования значения данных второго поддиапазонного сигнала; и передачу потока данных, кодированных по форме сигнала.

В соответствии с другим аспектом изобретения предложен способ передачи и приема аудиосигнала временной области, причем способ содержит: передатчик: прием аудиосигнала временной области, генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области, генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области, генерирование потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и передачу потока данных, кодированных по форме сигнала; и приемник: прием потока данных, кодированных по форме сигнала, генерирование третьего поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области, генерирование четвертого поддиапазоного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и генерирование гребенкой фильтров синтеза аудиосигнала временной области из четвертого поддиапазонного сигнала.

В соответствии с другим аспектом изобретения предложен компьютерный программный продукт, предназначенный для выполнения любого из описанных выше способов.

Эти и другие аспекты, свойства и преимущества изобретения будут очевидны из вариантов выполнения, описанных ниже.

Варианты выполнения изобретения описаны только в качестве примера со ссылкой на чертежи, на которых представлено следующее:

фиг. 1 - система 100 передачи, предназначенная для передачи аудиосигнала в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 2 - кодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 3 - пример некоторых элементов кодера в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 4 - декодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 5 - кодер в соответствии с некоторыми вариантами выполнения изобретения;

фиг. 6 - пример гребенки фильтра анализа и синтеза;

фиг. 7 - пример спектра гребенки фильтра QMF;

фиг. 8 - примеры спектров фильтра поддиапазона QMF, дискретизированных с пониженной частотой дискретизации;

фиг. 9 - примеры спектров поддиапазона QMF;

фиг. 10 - примеры спектров гребенки фильтров поддиапазонов; и

фиг. 11 - пример структуры преобразования типа бабочки.

На фиг. 1 показана система 100 передачи, предназначенная для передачи аудиосигнала в соответствии с некоторыми вариантами выполнения изобретения. Система 100 передачи содержит передатчик 101, который связан с приемником 103 через сеть 105, которая, в частности, может представлять собой сеть Интернет.

В конкретном примере передатчик 101 представляет собой устройство записи сигнала, и приемник представляет собой устройство 103 воспроизведения сигнала, но следует понимать, что в других вариантах выполнения передатчик и приемник можно использовать в других реализациях и для других целей. Например, передатчик 101 и/или приемник 103 могут представлять собой часть функциональных средств транскодирования, например, они могут обеспечивать интерфейс для других отправителей сигнала или других получателей сигнала.

В конкретном примере, когда поддерживается функция записи сигнала, передатчик 101 содержит цифровой преобразователь 107, который принимает аналоговый сигнал, который преобразуется в цифровой сигнал PCM, путем дискретизации и аналогово-цифрового преобразования.

Передатчик 101 связан с кодером 109 по фиг. 1, который кодирует сигнал PCM в соответствии с алгоритмом кодирования. Кодер 100 связан с сетевым передатчиком 111, который принимает кодированный сигнал и обеспечивает интерфейс с Интернетом 105. Сетевой передатчик может передавать кодированный сигнал в приемник 103 через Интернет 105.

Приемник 103 содержит сетевой приемник 113, который обеспечивает интерфейс с Интернетом 105 и который выполнен с возможностью приема кодированного сигнала из передатчика 101.

Сетевой приемник 111 связан с декодером 115. Декодер 115 принимает кодированный сигнал и декодирует его в соответствии с алгоритмом декодирования.

В конкретном примере, когда поддерживается функция воспроизведения сигнала, приемник 103 дополнительно содержит устройство 117 воспроизведения сигнала, которое принимает декодированный аудиосигнал из декодера 115 и представляет его пользователю. В частности, устройство 113 воспроизведения сигнала может содержать цифроаналоговый преобразователь, усилители и громкоговорители, в соответствии с требованиями вывода декодированного аудиосигнала.

На фиг. 2 более подробно представлен кодер 109 по фиг. 1. Кодер 109 содержит приемник 201, который принимает аудиосигнал временной области, предназначенный для кодирования. Аудиосигнал может поступать из любого внешнего или внутреннего источника, например из локального хранилища сигнала.

Приемник соединен с первой гребенкой 203 фильтров, которая генерирует поддиапазонный сигнал, содержащий множество разных поддиапазонов. В частности, первая гребенка 203 фильтров может представлять собой гребенку фильтров QMF, как известно из методов параметрического кодирования, таких как SBR, PS и SAC. Таким образом, первая гребенка 203 фильтров генерирует первый поддиапазонный сигнал, который соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области. В конкретном примере первый поддиапазонный сигнал имеет коэффициент дискретизации с повышенной частотой, равный двум, как хорошо известно для фильтров QMF с комплексной модуляцией.

Поскольку каждый диапазон QMF дискретизирован с повышенной частотой с коэффициентом два, возможно выполнить множество операций обработки сигнала над отдельными поддиапазонами, без ввода каких-либо искажений наложения спектров, связанных с дискретизацией. Например, каждый отдельный поддиапазон может быть масштабирован, и/или другие поддиапазоны могут быть добавлены или вычтены, и т.д. Таким образом, в некоторых вариантах выполнения кодер 109 дополнительно содержит средство выполнения операций обработки без наложения спектров сигнала для поддиапазонов QMF.

Первый поддиапазонный сигнал соответствует поддиапазонным сигналам, обычно генерируемым кодерами параметрического расширения, такими как SBR, PS и SAC. Таким образом, первый поддиапазонный сигнал можно использовать для генерирования кодирования параметрического расширения для сигнала временной области. Кроме того, этот же поддиапазонный сигнал в кодере 109 по фиг. 2 также используется для кодирования сигнала по форме для сигнала временной области. Таким образом, кодер 109 может использовать одну и ту же гребенку 203 фильтров для параметрического кодирования и кодирования сигнала по форме.

Основная трудность кодирования по форме комплексного представления в поддиапазонной области для первого поддиапазонного сигнала состоит в том, что он не формирует компактное представление, то есть он дискретизирован с повышенной частотой с коэффициентом два. Кодер 109 непосредственно преобразует комплексное представление в поддиапазонной области в представление, которое близко повторяет представление, которое было бы получено при непосредственном применении модифицированного дискретного косинусного преобразования (MDCT, МДКП) к исходному сигналу временной области (см., например, H. Malvar, "Signal Processing with Lapped Transforms", Artech House, Boston, London, 1992, где описана процедура MDCT). Такое представление типа MDCT является критически дискретизированным. Кроме того, такой сигнал можно использовать в известных перцептуальных методах кодирования аудио, которые можно применять для эффективного кодирования полученного представления, в результате чего обеспечивается эффективное кодирование сигнала по форме.

В частности, кодер 109 содержит процессор 205 преобразования, который генерирует второй поддиапазонный сигнал из первого поддиапазонного сигнала, применяя комплексное преобразование к отдельным поддиапазонам первого поддиапазонного сигнала. Второй поддиапазонный сигнал соответствует критически дискретизированному комплексному представлению в поддиапазонной области для аудиосигналов временной области.

Таким образом, в кодере 109 процессор 205 преобразования преобразует выходной сигнал гребенки фильтров QMF, который совместим с типичными современными кодерами параметрического расширения, в критически дискретизированный поддиапазон, аналогичный MDCT, который близко соответствует поддиапазонным сигналам, которые обычно генерируются в обычных кодерах формы сигнала.

Таким образом, вместо одновременного использования преобразования QMF и MDCT, первый поддиапазонный сигнал непосредственно обрабатывается в поддиапазонной области для генерирования второго поддиапазонного сигнала, который можно обрабатывать как сигнал MDCT в обычных кодерах формы сигнала. Таким образом, можно применять известные методы кодирования поддиапазонного сигнала и можно обеспечить эффективное кодирование по форме сигнала, например остаточного сигнала после кодирования параметрического расширения, и при этом не требуется преобразовывать сигнал во временную область, и, таким образом, можно устранить требование использования фильтров синтеза QMF.

В данном примере кодер 109 содержит процессор 207 кодирования, который соединен с процессором 205 преобразования. Процессор 207 кодирования принимает второй критически дискретизированный поддиапазонный сигнал, аналогичный MDCT, из процессора 205 преобразования и кодирует его, используя обычные методы кодирования по форме сигнала, включающие в себя, например, квантование, коэффициенты масштабирования, кодирование Хаффмана и т.д. Полученные в результате кодированные данные вводятся в поток кодированных данных. Поток данных может дополнительно содержать другие кодированные данные, такие как, например, данные параметрического кодирования.

Как подробно описано ниже, процессор 205 преобразования использует информацию фундаментального фильтра (фильтра основной частоты или фильтра-прототипа) первой гребенки 203 фильтров для комбинирования сигнальных компонентов из разных поддиапазонов в диапазонах (или полосах пропускания) без наложения спектров и для удаления сигнальных компонентов из диапазонов (или полос заграждения) с наложением спектров. В соответствии с этим, частотные компоненты полосы с наложением спектров для каждого поддиапазона можно игнорировать, в результате чего получают критически дискретизированный сигнал без дискретизации с повышенной частотой.

В частности, как описано ниже, процессор 205 преобразования содержит второй фильтр, который генерирует множество поддиапазонов для каждого из поддиапазонов гребенки фильтров QMF. Таким образом, поддиапазоны разделяются на дополнительные подподдиапазоны. В результате перекрытия между фильтрами QMF данный сигнальный компонент сигнала временной области (например, синусоида на определенной частоте) может сформировать сигнальный компонент в двух разных поддиапазонах QMF. Вторая гребенка фильтров дополнительно разделяет эти поддиапазоны, в результате чего сигнальный компонент будет представлен в одном поддиапазоне первого поддиапазона QMF и в одном поддиапазоне второго поддиапазона QMF. Значения данных этих двух поддиапазонных сигналов податся в блок комбинирования, который комбинирует два сигнала для генерирования одного сигнального компонента. Такой один сигнальный компонент затем кодируется с помощью процессора 207 кодирования.

На фиг. 3 представлен пример некоторых элементов процессора 205 преобразования. В частности, на фиг. 3 представлена гребенка 301 фильтров первого преобразования для первого поддиапазона QMF и гребенка 303 фильтров второго преобразования для второго поддиапазона QMF. Сигналы из поддиапазонов, которые соответствуют тем же самым частотам, затем подаются в блок 305 комбинирования, который генерирует одно значение выходных данных для поддиапазона.

Понятно, что декодер 115 может выполнять обратные операции относительно кодера 109. На фиг. 4 более подробно представлен декодер 115.

Декодер содержит приемник 401, который принимает сигнал, кодированный кодером 109 из сетевого приемника 113. Кодированный сигнал поступает в процессор 403 декодирования, который декодирует кодирование по форме сигнала, выполненное процессором 207 кодирования, восстанавливая, таким образом, критически дискретизированный поддиапазонный сигнал. Этот сигнал подается в процессор 405 преобразования декодирования, который восстанавливает некритически дискретизированный поддиапазонный сигнал, выполняя обратную операцию по сравнению с процессором 205 преобразования. Некритически дискретизированный сигнал затем подается в фильтр 407 синтеза QMF, который генерирует декодированную версию исходного аудиосигнала кодирования временной области.

В частности, процессор 405 преобразования декодирования содержит разветвитель, такой как инверсная структура типа бабочки, который восстанавливает сигнальные компоненты в поддиапазонах, включая диапазоны сигнала как с наложением спектров, так и без наложения спектров. Поддиапазонные сигналы затем поступают в гребенку фильтров синтеза, соответствующую гребенке 301, 303 фильтров преобразования кодера 109. Выходной сигнал этих гребенок фильтров соответствует некритически дискретизированному поддиапазонному сигналу.

Конкретные варианты выполнения изобретения более подробно описаны ниже. Описание вариантов выполнения приведено со ссылкой на структуру 500 кодера по фиг. 5. Структура 500 кодера, в частности, может быть выполнена в виде кодера 109 по фиг. 1.

Структура 500 кодера содержит 64-полосную гребенку фильтров 501 анализа QMF.

Поддиапазонный фильтр анализа QMF может быть описан следующим образом. Если обозначить фильтр-прототип с линейной фазой, с реальным значением p(ν), М-полосная комплексная модулированная гребенка фильтров анализа может быть определена фильтрами анализа

для индекса поддиапазона k=0,1,…, М-1. Параметр θ фазы имеет важность для следующего анализа. Обычный выбор представляет собой (N+M)/2, где N представляет собой порядок фильтра-прототипа.

При заданном дискретном временном сигнале x(ν) с реальным значением поддиапазонные сигналы ν_k(n) получают путем фильтрации (свертки) x(ν) с h_k(ν), и с последующей дискретизацией с пониженной частотой результата с коэффициентом М, как представлено левой стороной фиг. 6, на которой иллюстрируется операция гребенок фильтров анализа и синтеза QMF кодера 109 и декодера 115.

Предположим, что операция синтеза состоит вначале из дискретизации с повышенной частотой сигналов поддиапазона QMF с коэффициентом М, после чего выполняется фильтрация с использованием комплексно модулированных фильтров типа, аналогичного уравнению (1), результаты суммируются и, наконец, берется удвоенная реальная часть, как представлено с правой стороны на фиг. 6. В таком случае можно обеспечить близкую к идеальной реконструкцию реального значения входного сигнала x(ν), используя соответствующую конструкцию фильтра p(ν) прототипа с линейной фазой, с линейным значением, как представлено в публикации P. Ekstrand "Bandwidth extension of audio signals by spectral band replication", Proc. 1st IEEE Benelux Workshop on Model based Processing and Coding of Audio (MPCA-2002), pp. 53-58, Leuven, Belgium, November 15 2002.

Далее, пусть

представляет собой дискретное по времени преобразование Фурье дискретного временного сигнала z(n).

В дополнение к близкому к идеальному свойству реконструкции гребенки QMF, предполагается, что P(ω), преобразование Фурье p(ν), по существу, становится пренебрежительно малым за пределами интервала частот [-π/M, π/M].

Преобразование Фурье дискретизированных с пониженной частотой комплексных сигналов поддиапазонной области определяется следующим выражением:

где k представляет собой индекс поддиапазона, и М представляет собой количество поддиапазонов. Если предположить, что частотный отклик фильтра прототипа ограничен, сумма в уравнении (2) содержит только один член для каждого значения ω.

Соответствующие идеальные абсолютные частотные отклики представлены на фиг. 7 и фиг. 8.

В частности, на фиг. 7 представлены идеальные частотные отклики для первых нескольких частотных диапазонов комплексной гребенки 501 QMF перед дискретизацией с пониженной частотой. На фиг. 8 представлены идеальные частотные отклики комплексной гребенки QMF дискретизированного с пониженной частотой сигнала для четных (вверху) и нечетных (внизу) поддиапазонов k. Таким образом, как показано на фиг. 8, центр полосы пропускания фильтра QMF после дискретизации с пониженной частотой будет представлен с наложением спектров до π/2 для поддиапазонов с четными номерами и до -π/2 для поддиапазонов с нечетными номерами.

На фиг. 8 представлен эффект дискретизации с повышенной частотой комплексной гребенки QMF. Для полос с четным индексом k и нечетным индексом k соответственно отрицательная и положительная части частотного диапазона не требуются для реконструкции (первоначально имеющего реальное значение) сигнала. Эти части спектра частот гребенки фильтра с пониженной частотой дискретизации будут называться диапазонами с наложением спектров или полосами заграждения, в то время как другие части будут обозначены как полосы пропускания или диапазоны без наложения спектров. Следует отметить, что диапазоны с наложением спектров содержат информацию, которая также представлена в полосах пропускания спектров других поддиапазонов. Это конкретное свойство будет использоваться для получения эффективного механизма кодирования.

Следует понимать, что диапазоны с наложением спектров и без наложения спектров содержат избыточную информацию и что один может быть определен из другого. Следует понимать, что может использоваться взаимодополняющая интерпретация диапазонов с наложением спектров и без наложения спектров.

Как будет показано ниже, значения энергии, соответствующие диапазонам с наложением спектров (или полосам заграждения) гребенки фильтров анализа QMF, могут быть сведены к нулю и пренебрежимо малым значениям в результате применения определенного типа дополнительной гребенки 503 фильтров на каждом выходе гребенки 501 фильтров анализа с пониженной частотой дискретизации и путем применения определенных структур 505 типа бабочки между выходами дополнительных гребенок 501 фильтров.

Вследствие этого, половину информации, то есть половину выходов гребенки фильтров, можно отбросить. В результате получают критически дискретизированное представление. Такое представление очень похоже на представление, обеспечиваемое преобразованием MDCT исходных выборок временной области, и поэтому достаточно полно воспроизводит поддиапазонные сигналы, которые генерируются типичными кодерами на основе формы сигнала, такими как MP3 или AAC. В соответствии с этим можно непосредственно применять методы кодирования на основе формы сигнала к критически дискретизированному сигналу в процессоре 507 кодирования по форме сигнала и при этом не требуется выполнять преобразование во временную область с последующим генерированием поддиапазона MDCT. Полученные в результате кодированные данные затем включаются в поток битов с помощью процессора 509 потока битов.

На фиг. 9 представлен эффект генерирования поддиапазона QMF для сигнала, состоящего из двух синусоид.

В комплексной частотной области (такой как, например, получается при использовании FFT (БПФ, быстрое преобразование Фурье)) каждая синусоида представлена в спектре одновременно как положительная и отрицательная частота. Теперь предположим, что используется 8-полосная комплексная гребенка QMF (например, 64-полосная гребенка, представленная на фиг. 5). Перед понижением частоты дискретизации синусоиды выглядят, как представлено в спектрах А-H. Как представлено на чертеже, каждая синусоида возникает в двух поддиапазонах, например спектральная линия низкой частоты возникает как в спектре A, соответствующем первому поддиапазону QMF, так и в спектре B, соответствующем второму поддиапазону QMF.

Процесс дискретизации с пониженной частотой гребенки QMF представлен в нижней части фиг. 9, где спектр I представляет спектр перед дискретизацией с пониженной частотой. Процедура дискретизации с пониженной частотой может быть интерпретирована следующим образом. Вначале спектр разделяется на М спектров от А до H, где М представляет собой коэффициент дискретизации с пониженной частотой (M=8), как представлено для I и K для первого и второго поддиапазонов соответственно. Каждый отдельно разделенный спектр расширяется (растягивается) снова до полного диапазона частот. Затем все отдельные разделенные и расширенные спектры суммируются, в результате чего получаются спектры, представленные в спектре J и L для первого и второго поддиапазонов соответственно.

Таким образом, благодаря наличию фильтра каждого отдельного поддиапазона, имеющего ширину полосы, которая превышает частотный интервал между поддиапазонами, сигнальные компоненты для сигнала временной области будут преобразованы в сигнальные компоненты в двух разных поддиапазонах. Кроме того, один из этих сигнальных компонентов попадает в диапазон с наложением спектров одного из поддиапазонов и другой попадает в диапазон без наложения спектров другого поддиапазона.

Таким образом, как показано в спектрах J и L, в конечных выходных спектрах комплексной гребенки QMF компоненты все еще расположены в двух поддиапазонах, например спектральная линия низкой частоты возникает в полосе пропускания первого поддиапазона, а также в полосе заграждения второго поддиапазона. Амплитуда спектральной линии в обоих случаях определяется частотным откликом (сдвинутого) фильтра прототипа.

В соответствии с вариантами выполнения, представленными на фиг. 5, вводится дополнительный набор комплексного преобразования (гребенка 503 фильтра), где каждое преобразование применяется к выходному сигналу в поддиапазоне. Такой подход используется для дополнительного разделения частотного спектра этих поддиапазонов на множество поддиапазонов.

Каждый поддиапазон в полосе пропускания поддиапазона QMF затем комбинируется с соответствующим поддиапазоном полосы с наложением спектров в соседнем поддиапазоне QMF. В данном примере поддиапазон, содержащий синусоиду низкой частоты в спектре J, комбинируется с синусоидой низкой частоты в спектре L, в результате чего оба сигнальных компонента, возникающих из одной синусоиды низкой частоты сигнала временной области, комбинируются в один сигнальный компонент.

Кроме того, для компенсации частотного отклика фильтра-прототипа QMF значение из каждого из подподдиапазонов взвешивается по относительной амплитуде частотного отклика перед комбинированием (предполагается, что амплитудный отклик фильтра-прототипа QMF является постоянным в пределах каждого поддиапазона).

Сигнальные компоненты в полосах заграждения можно игнорировать, или они могут быть компенсированы значениями из полосы пропускания, в результате чего эффективно уменьшается энергия в полосе с наложением спектров. Таким образом, операцию процессора 207 преобразования можно рассматривать как соответствующую концентрации энергии двух сигнальных компонентов, возникающих для каждой частоты, в одном сигнальном компоненте в полосе пропускания одного из поддипазонов QMF. Таким образом, поскольку значения сигнала в полосах с наложением спектров и полосах заграждения можно игнорировать, можно получить эффективное понижение частоты дискретизации в два раза, в результате чего получают сигнал критической дискретизации.

Как будет показано ниже, комбинирование сигнальных компонентов (и компенсация сигнальных компонентов в полосах с наложением спектров) может быть получено с использованием структуры типа бабочки.

В принципе, при применении другого (с 50%-ным взаимным наложением) комплексного преобразования (с использованием гребенок 503 фильтров) для поддиапазонных сигналов можно получить другую дискретизацию с повышением частоты дискретизации с коэффициентом 2. Однако выбранные преобразования обладают определенным свойством симметричности, которое позволяет уменьшить количество данных на 50%. Полученное в результате преобразование можно рассматривать как эквивалентное MDCT для реальных данных и MDST для мнимых данных. Оба эти преобразования представляют собой преобразования с критической дискретизацией, и, таким образом, не возникает дискретизации с повышенной частотой.

Более подробно, гребенки 503 фильтров могут представлять собой комплексно модулированную гребенку фильтров, состоящую из R=2Q полос. В качестве примера идеальный частотный отклик гребенок 503 фильтров для каждого поддиапазона представлен на фиг. 10 для каждого поддиапазона k. Как можно видеть, гребенка фильтров упорядочена нечетным образом и не содержит поддиапазона, центрированного вокруг значения DC. Вместо этого, в этом примере центральные частоты поддиапазонов являются симметричными относительно нуля, причем центральная частота первого поддиапазона смещена на половину поддиапазона.

Коэффициент дискретизации с пониженной частотой во второй гребенке равен Q и определяется фильтрами анализа для r=-Q, -Q+1,…, Q-1,

где окно w(ν) прототипа с реальным значением выбрано таким образом, чтобы w(ν)=w(-ν-1-Q). Известно, что такое окно может быть спроектировано таким образом, чтобы обеспечивалась идеальная реконструкция из анализа в гребенке фильтров, при этом фильтры равны либо действительной части (3), или мнимой части (3). В этих случаях достаточно использовать только Q из R=2Q поддиапазонов с положительными или отрицательными частотами. Хорошим примером является модифицированное дискретное косинусное преобразование MDCT.

Однако в варианте выполнения по фиг. 5 сигнал z(n) c комплексным значением, вместо этого, анализируется с помощью фильтров 503, полученные в результате сигналы дискретизируются с понижением частоты дискретизации на коэффициент q и используется реальная часть. Соответствующие операции синтеза состоят в повышении частоты дискретизации на коэффициент Q и фильтрации синтеза с использованием комплексно модулированных фильтров,

суммировании результатов по R=2Q поддиапазонам, r=-Q, -Q+1,…, Q-1, и последующим делением результата на два.

Если окно w(ν) выбрано так, что обеспечивается идеальная реконструкция в указанных выше гребенках с реальными значениями, комбинированная операция анализа и синтеза в комплексном случае будет идеально реконструировать сигнал z(n) c комплексным значением. Чтобы показать это, допустим, что C представляет гребенку анализа, которая имеет фильтры анализа, соответствующие реальной части (3), и S представляет гребенку анализа, которая имеет фильтры анализа, соответствующие отрицательной мнимой части (3). Тогда гребенка (3) комплексного анализа может быть записана как E=С-iS. Если затем записать комплексный сигнал как z=ξ+iη, получим

Здесь (5) оценивается как для положительных частот r=0,…, Q-1, так и для отрицательных частот r=-Q,…,-1. Следует отметить, что изменение от r до -1-r в (3) приводит к комплексному сопряжению фильтров анализа, в результате чего анализ (5) обеспечивает доступ как Сξ+Sη, так и Сξ-Sη для положительных частот r=0, …, Q-1. Для синтеза эта информация может быть легко рекомбинирована в Cξ и Sη, для которых идеальная реконструкция как ξ, так и η возможна с использованием соответствующих гребенок синтеза с реальными значениями. При доказательстве исключены очевидные детали того, что такая реконструкция эквивалентна операции комплексного анализа, комплексного синтеза реальной части и деления на два.

Такая структура гребенки фильтров похожа, но не идентична, модифицированным гребенкам фильтров DFT (MDFT), описанным в публикации Karp T., Fliege N.J., "Modified DFT Filter Banks with Perfect Reconstruction", IEEE Transactions on Circuits and Systems-II: Analog and Digital Signal Processing, Vol. 46, No. 11, November 1999. Основное различие состоит в том, что настоящая гребенка фильтров упорядочена нечетным образом, что является предпочтительным для следующей предложенной гибридной структуры.

Для каждого k=0, 1,…, M-1 и r=-Q, -Q+1,…, Q-1 допустим, что ν_kr(n) представляет собой поддиапазонный сигнал, получаемый в результате анализа сигнала y_k(ν) комплексного анализа QMF с фильтром 503 анализа, дискретизации с пониженной частотой с коэффициентом Q, и взятия действительной части. В результате получается сумма 2QM сигналов с действительным значением с частотой дискретизации 1/(QM) от исходной частоты дискретизации. Следовательно, получается представление с частотой дискретизации, повышенной в два раза. Как показано на фиг. 8 и 10, удобно определять сигналы полосы пропускания с помощью уравнения

Аналогично, указанные выше сигналы полос заграждения или полос с наложением спектра определяют из уравнения

Следует отметить, что оба этих сигнала являются критически дискретизированными. Следующий этап состоит в использовании того факта, что если сигнал временной области представляет собой чистую синусоиду на частоте π/(2M)≤Ω≤π/(2M), и если θ=0 в (1), тогда

где C представляет собой комплексную константу. В результате соседние полосы QMF будут, таким образом, содержать комплексные синусоиды с той же частотой и фазой, но с разными амплитудами, из-за отклика модулированного фильтра прототипа QMF с линейной фазой. Таким образом, как указано выше, возникают два компонента сигнала - один в полосе пропускания одного поддиапазона QMF и другой в полосе с наложением спектров соседнего поддиапазона.

Поэтому при преобразовании соответствующих пар выборок поддиапазона во взвешенные суммы и разности будут получены очень малые разности. Прежде чем такое преобразование будет представлено подробно, следует указать, что, если не удовлетворяется предположение, что θ=0, выборки QMF, предпочтительно, должны быть компенсированы по фазе, в результате их предварительного умножения (предварительного поворота) в процессоре 511 предварительного поворота в соответствии с уравнением

В качестве альтернативы, вместо придания дополнительного сдвига фазы на kπ в процессоре предварительного поворота, сигнал также можно обрабатывать с помощью структуры типа бабочки, используя отбрасывание знака.

Для k=0,…, М-2 сигналы суммы и разности определяются следующими выражениями:

Для первого и последнего диапазонов QMF это определение заменяется

На фиг. 11 представлены соответствующие структуры преобразования типа бабочки. Эти структуры типа бабочки аналогичны используемым в стандарте MPEG-1 уровень III (MP3). Однако важное отличие состоит в том, что так называемые бабочки, сглаживающие искажения дискретизации, mp3 используются для уменьшения искажений, связанных с дискретизацией, в полосах пропускания гребенки фильтров с реальными значениями. В реальной модулированной гребенке фильтров невозможно различать положительные и отрицательные (сложные) частоты в поддиапазонах. На этапе синтеза из одной синусоиды в поддиапазоне поэтому обычно получают две синусоиды на выходе. Одна из них, побочная синусоида, расположена на частоте, достаточно удаленной от правильной частоты. Бабочки сглаживания искажений дискретизации в реальной гребенке предназначены для подавления побочной синусоиды путем направления синтеза второй гибридной гребенки в два соседних реальных диапазона QMF. Настоящий подход существенно отличается от этой ситуации тем, что в комплексный поддиапазон QMF подается комплексная синусоида из второй гибридной гребенки. В результате в конечном выходном сигнале получается только одна правильно расположенная синусоида, и проблема искажений, связанных с дискретизацией, присущая MP3, никогда не возникает. Структуры 505 типа бабочки направлены исключительно на коррекцию амплитудного отклика операции комбинированного анализа и синтеза, когда сигналами d разности пренебрегают.

Отметим вначале, что если коэффициенты преобразования установлены как β_k,r=1 и α_k,r=0, то пара сигнала (s, d) будет представлять собой всего лишь копию пары (b, a). Это можно выполнить избирательно, поскольку структура в соответствии с (10) и (11) такова, что расчеты могут быть выполнены на месте. Это важно для случая, когда структура гибридной гребенки фильтров используется только для поднабора полос QMF. Все операции суммирования и вычитания являются обратимыми, если только β² _k,r+α² _k,r>0, и преобразование является ортогональным, если β² _k,r+α² _k,r=1.

Соответствующие этапы синтеза очень похожи на (10) и (11) и будут понятны для специалиста в данной области техники. Это также справедливо для инверсного предварительного поворота с помощью процессора 511 предварительного поворота. Данный подход представляет, что сигналы d_kr(n) становятся очень малыми при выборе, где одновременно β_k,Q-1-r=β_k,r и α_k,Q-1-r=α_k,r, и

где K представляет собой константу нормализации.

Таким образом, если предположить, что дополнительная гребенка фильтров для каждого поддиапазона k является критически дискретизированной и идеально реконструирующейся, аппроксимация сигналов в поддиапазонной области в диапазоне с наложением спектров фактически сводится к представлению с пониженной частотой дискретизации для представления с критической дискретизацией, сильно напоминающей MDCT, исходных выборок во временной области. Это обеспечивает возможность эффективного кодирования сигналов в комплексной поддиапазонной области, аналогично известным перцептуальным кодерам по форме сигнала. Ошибка реконструкции или отбрасывание коэффициентов преобразования, соответствующих полосам заграждения или с наложением спектров, составляет порядка 34 децибел для типичной длины преобразования Q=16.

В качестве альтернативы, коэффициенты, соответствующие полосам заграждения или полосам с наложением спектров, могут быть дополнительно кодированы для получения коэффициентов, соответствующих полосам пропускания для получения лучшей реконструкции. Это может быть предпочтительным в случае, когда Q представляет собой очень малую величину (например, Q<8), или в случае плохих рабочих характеристик гребенки QMF.

В примере, показанном на фиг. 5, бабочки суммы - разности (10) и (11) 505 применяют для получения пары (s, d) сигнала, в которой, в данном случае, сохраняются только доминирующие компоненты (s). На следующем этапе применяют обычные методы кодирования по форме сигнала с использованием, например, коэффициента кодирования с коэффициентом масштабирования и квантования для полученного в результате сигнала (сигналов). Кодированные коэффициенты вводятся в поток битов.

Декодер выполняет обратный процесс. Вначале коэффициенты демультиплексируются из потока битов и декодируются. Затем применяется инверсная операция типа бабочки в кодере, после чего выполняется фильтрация синтеза и последующий поворот для получения сигналов комплексной поддиапазонной области. И эти сигналы, наконец, могут быть преобразованы во временную область с использованием гребенки синтеза QMF.

Следует понимать, что в приведенном выше описании, для ясности, были представлены варианты выполнения изобретения со ссылкой на разные функциональные модули и процессоры. Однако очевидно, что любое соответствующее распределение функций между разными функциональными блоками или процессорами можно использовать без отхода от сущности изобретения. Например, представленные функции, которые предназначены для выполнения отдельными процессорами или контроллерами, могут быть выполнены одним и тем же процессором или контроллерами. Следовательно, ссылки на конкретные функциональные блоки представлены только в качестве ссылки на соответствующие средства, обеспечивающие описываемую функцию, и не обозначают строгую логическую или физическую структуру или организацию.

Изобретение может быть выполнено в любой соответствующей форме, включая аппаратные средства, программные средства, встроенное программное обеспечение или любую их комбинацию. Изобретение, в случае необходимости, может быть выполнено, по меньшей мере, частично как компьютерное программное средство, работающее на одном или более процессорах обработки данных и/или цифровых процессорах сигналов. Элементы и компоненты варианта выполнения в соответствии с изобретением могут быть физически, функционально и логически выполнены любым соответствующим образом. Действительно, функции могут быть выполнены в одном модуле, в множестве модулей или в части других функциональных модулей. При этом изобретение может быть выполнено в одном модуле или может быть физически и функционально распределено между разными модулями и процессорами.

Хотя настоящее изобретение было описано для некоторых вариантов его выполнения, не предполагается его ограничение конкретной приведенной формой. Вместо этого, объем настоящего изобретения ограничивается только приложенной формулой изобретения. Кроме того, хотя свойство может выглядеть, как описанное для конкретного варианта выполнения, для специалистов в данной области техники будет понятно, что различные свойства описанных вариантов выполнения могут быть скомбинированы в соответствии с изобретением. В формуле изобретения термин "содержащий" не исключает наличие других элементов или этапов.

Кроме того, хотя множество средств, элементов или этапов способа представлены по отдельности, они могут быть выполнены, например, в одном модуле или процессоре. Кроме того, хотя отдельные свойства могут быть включены в разные пункты формулы изобретения, может быть предпочтительно их комбинировать, и включение в разные пункты формулы изобретения не подразумевает, что комбинация свойств невозможна и/или не является предпочтительной. Кроме того, включение свойства в одну категорию пунктов формулы изобретения не подразумевает ограничения этой категории, но скорее обозначает, что свойство в равной степени применимо к другим категориям пункта формулы изобретения, если это соответствует. Кроме того, порядок свойств в формуле изобретения не подразумевает конкретный порядок, в котором указанные признаки должны действовать, и, в частности, порядок отдельных этапов в пункте формулы изобретения, направленном на способ, не подразумевает, что эти этапы должны быть выполнены в этом порядке. Вместо этого, этапы могут быть выполнены с использованием любого соответствующего порядка. Кроме того, ссылки на единственное число не исключают множественное число. Таким образом, ссылки на единственное число на "первый", "второй" и т.д. не исключают множественность. Ссылочные позиции в формуле изобретения приведены исключительно как поясняющий пример и их не следует рассматривать как какое-либо ограничение объема формулы изобретения.

Claims

1. Декодер, предназначенный для генерирования аудиосигнала временной области путем декодирования формы сигнала, содержащий
средство (401) приема потока кодированных данных;
средство (403) генерирования первого поддиапазонного сигнала путем декодирования значения данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области;
средство (405) преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
гребенку (407) фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

2. Декодер по п.1, в котором каждый поддиапазон первого поддиапазонного сигнала содержит множество подподдиапазонов, и средство (405) преобразования содержит вторую гребенку фильтров синтеза, предназначенную для генерирования поддиапазонов вторых поддиапазонных сигналов из подподдиапазонов первого поддиапазонного сигнала.

3. Декодер по п.2, в котором каждый поддиапазон второго поддиапазонного сигнала содержит диапазон с наложением спектров и диапазон без наложения спектров, при этом средство (405) преобразования содержит средство разделения, предназначенное для разделения подподдиапазона первого поддиапазонного сигнала на подподдиапазон с наложением спектров в полосе первого поддиапазона второго поддиапазонного сигнала и поддиапазон без наложения спектров второго поддиапазона второго поддиапазонного сигнала, при этом поддиапазон с наложением спектров и поддиапазон без наложения спектров имеют соответствующие частотные интервалы в сигнале временной области.

4. Декодер по п.3, в котором средство разделения содержит структуру типа бабочки.

5. Кодер, предназначенный для кодирования аудиосигнала во временной области, причем кодер содержит
средство приема (201) аудиосигнала временной области;
первую гребенку (203) фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области;
средство (205) преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и
средство (207) генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала.

6. Кодер по п.5, дополнительно содержащий средство параметрического кодирования аудиосигнала временной области с использованием первого поддиапазонного сигнала.

7. Кодер по п.5, в котором средство преобразования содержит вторую гребенку (301, 303) фильтров, предназначенную для генерирования множества подподдипазонов для каждого поддиапазона первого поддиапазонного сигнала.

8. Кодер по п.7, в котором вторая гребенка (301, 303) фильтров упорядочена нечетным образом.

9. Кодер по п.7, в котором каждый поддиапазон содержит некоторые подподдиапазоны с наложением спектров, соответствующие диапазону с наложением спектров поддиапазона, и некоторые подподдиапазоны без наложения спектров, соответствующие диапазону без наложения спектров поддиапазона; при этом средство (205) преобразования содержит средство (305) комбинирования, предназначенное для комбинирования подподдиапазонов с наложением спектров в полосе первого поддиапазона с подподдиапазонами без наложения спектров второго поддиапазона, при этом подподдиапазоны с наложением спектров и подподдиапазоны без наложения спектров имеют соответствующие частотные интервалы сигнала временной области.

10. Кодер по п.9, в котором средство (305) комбинирования выполнено с возможностью уменьшения энергии в диапазоне с наложением спектров.

11. Кодер по п.9, в котором средство (305) комбинирования содержит средство генерирования суммарного сигнала без наложения спектров для первого подподдиапазона с наложением спектров в первом поддиапазоне и первого подподдиапазона без наложения спектров во втором поддиапазоне.

12. Кодер по п.11, в котором средство (305) комбинирования содержит структуру типа бабочки, предназначенную для генерирования суммарного сигнала без наложения спектров.

13. Кодер по п.12, в котором, по меньшей мере, один коэффициент структуры типа бабочки зависит от частотного отклика фильтра первой гребенки (203) фильтров.

14. Кодер по п.9, в котором средство (205) преобразования выполнено с возможностью не включать значения данных для диапазона с наложением спектров в поток кодированных данных.

15. Кодер по п.5, дополнительно содержащий средство обработки сигнала без наложения спектров для первого поддиапазонного сигнала перед преобразованием во второй сигнал.

16. Кодер по п.5, дополнительно содержащий средство (511) компенсации фазы первого поддиапазонного сигнала перед преобразованием во второй сигнал.

17. Кодер по п.5, в котором первая гребенка (203) фильтров представляет собой гребенку фильтров QMF.

18. Способ генерирования аудиосигнала временной области путем декодирования формы сигнала, содержащий
прием потока кодированных данных;
генерирование первого поддиапазонного сигнала путем декодирования значений данных из потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области;
генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
генерирование гребенкой фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

19. Способ кодирования аудиосигнала временной области, содержащий
прием аудиосигнала временной области;
генерирование первой гребенкой фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области;
генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и
генерирование потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала.

20. Приемник, предназначенный для приема аудиосигнала, содержащий
средство приема (401) потока кодированных данных;
средство генерирования (403) первого поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области;
средство (405) преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
гребенку (407) фильтров синтеза для генерирования аудиосигнала временной области из второго поддиапазонного сигнала.

21. Передатчик, предназначенный для передачи кодированного аудиосигнала, содержащий
средство приема (201) аудиосигнала временной области;
первую гребенку (203) фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области;
средство (205) преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и
средство генерирования (207) потока данных кодированного по форме сигнала путем кодирования значения данных второго поддиапазонного сигнала; и
средство передачи потока данных, кодированных по форме сигнала.

22. Система передачи, предназначенная для передачи аудиосигнала временной области, причем система передачи содержит
передатчик, содержащий
средство (201) приема аудиосигнала временной области,
первую гребенку (203) фильтров, предназначенную для генерирования первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области,
средство (205) преобразования, предназначенное для генерирования второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области,
средство (207) генерирования потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и
средство передачи потока данных, кодированных по форме сигнала;
и приемник содержащий:
средство приема (401) потока данных, кодированных по форме сигнала,
средство (403) генерирования третьего поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области,
средство (405) преобразования, предназначенное для генерирования четвертого поддиапазонного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
гребенку (407) фильтров синтеза, предназначенную для генерирования аудиосигнала временной области из четвертого поддиапазонного сигнала.

23. Способ приема аудиосигнала, содержащий
прием потока кодированных данных;
генерирование первого поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем первый поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области;
генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
генерирование с помощью гребенки фильтров синтеза аудиосигнала временной области из второго поддиапазонного сигнала.

24. Способ передачи кодированного аудиосигнала, содержащий
прием аудиосигнала временной области;
генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области;
генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области; и
генерирование потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала; и
передачу потока данных, кодированных по форме сигнала.

25. Способ передачи и приема аудиосигнала временной области, содержащий
передатчик:
прием аудиосигнала временной области,
генерирование с помощью первой гребенки фильтров первого поддиапазонного сигнала из аудиосигнала временной области, причем первый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области сигнала временной области,
генерирование второго поддиапазонного сигнала из первого поддиапазонного сигнала путем поддиапазонной обработки, причем второй поддиапазонный сигнал соответствует критически дискретизированному представлению в поддиапазонной области аудиосигналов временной области,
генерирование потока данных, кодированных по форме сигнала, путем кодирования значений данных второго поддиапазонного сигнала, и
передачу потока данных, кодированных по форме сигнала;
и приемник:
прием потока данных, кодированных по форме сигнала,
генерирование третьего поддиапазонного сигнала путем декодирования значений данных потока кодированных данных, причем третий поддиапазонный сигнал соответствует критически дискретизированному представлению сигнала в поддиапазонной области аудиосигнала временной области,
генерирование четвертого поддиапазонного сигнала из третьего поддиапазонного сигнала путем поддиапазонной обработки, причем четвертый поддиапазонный сигнал соответствует некритически дискретизированному комплексному представлению в поддиапазонной области аудиосигнала временной области; и
генерирование гребенкой фильтров синтеза аудиосигнала временной области из четвертого поддиапазонного сигнала.

26. Машиночитаемый носитель, на котором хранится компьютерный программный продукт, который, при исполнении процессором, предназначен для выполнения способа по любому из пп.18, 19, 23, 24 или 25.

27. Устройство воспроизведения аудио, содержащее декодер по п.1.

28. Устройство записи аудио, содержащее кодер по п.5.