RU2014134317A

RU2014134317A - Способы и системы для эффективного восстановления высокочастотного аудиоконтента

Info

Publication number: RU2014134317A
Application number: RU2014134317A
Authority: RU
Inventors: Робин Тезинг; Михаэль ШУГ
Original assignee: Долби Интернэшнл Аб
Priority date: 2012-02-23
Filing date: 2013-02-22
Publication date: 2016-04-20
Also published as: EP3288033B1; EP3288033A1; US20150003632A1; EP3029672B1; EP2817803A2; JP2016173597A; CN107993673B; JP6334602B2; JP6046169B2; BR122021018240B1; WO2013124445A2; EP2817803B1; RU2601188C2; BR112014020562A2; WO2013124445A3; CN107993673A; ES2568640T3; CN104541327B; US20170221491A1; JP2015508186A

Abstract

1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; иформируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; иопределяют фазовое ускорение на основании последовательности фаз; изначение (341) тональности бина для конкретного ч

Claims

1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:

определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;

определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и

формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;

причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;

для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;

определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:

определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; и

определяют фазовое ускорение на основании последовательности фаз; и

значение (341) тональности бина для конкретного частотного бина является функцией фазового ускорения.

2. Способ по п. 1, дополнительно содержащий этап, на котором

определяют второе значение (321, 322) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов, находящихся во второй частотной субполосе; причем первая и вторая частотные субполосы содержат по меньшей мере один общий частотный бин, и при этом первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.

3. Способ по п. 1, в котором

аппроксимация высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала содержит этап, на котором копируют один или более низкочастотных коэффициентов преобразования одного или более частотных бинов из низкочастотной полосы (101), соответствующей низкочастотной компоненте, на высокочастотную полосу (102), соответствующую высокочастотной компоненте;

первая частотная субполоса находится в низкочастотной полосе (101);

вторая частотная субполоса находится в высокочастотной полосе (102);

причем способ дополнительно содержит этап, на котором определяют второе значение (233) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих частотных бинов из числа частотных бинов, которые были скопированы на вторую частотную субполосу;

вторая частотная субполоса содержит по меньшей мере один частотный бин, который был скопирован с частотного бина, находящегося в первой частотной субполосе; и

первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.

4. Способ по любому из предшествующих пунктов, в котором формирование первого поднабора из двух или более значений из набора значений (341) тональности бина содержит этап, на котором усредняют два или более значений (341) тональности бина; или суммируют два или более значений (341) тональности бина.

5. Способ по п. 1, в котором значение (341) тональности бина для частотного бина определяют только на основании коэффициентов преобразования того же частотного бина.

6. Способ по п. 1, в котором

первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на

основании низкочастотной компоненты аудиосигнала с использованием схемы спектрального расширения, называемого SPX; и

первое значение (311, 312) полосовой тональности используют для определения стратегии повторной отправки координат SPX, коэффициента шумового смешения и/или значительного затухания дисперсии.

7. Способ определения коэффициента шумового смешения, в котором коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем высокочастотная компонента содержит один или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит этап, на котором копируют один или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем способ содержит этапы, на которых:

определяют целевое значение (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;

определяют значение (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и

определяют коэффициент шумового смешения на основании

целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.

8. Способ по п. 7, в котором способ содержит этап, на котором определяют коэффициент шумового смешения на основании дисперсии целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.

9. Способ по любому из пп. 7-8, причем способ содержит этап, на котором определяют коэффициент b шумового смешения как

где

- дисперсия значения T_copy (323) тональности источника и целевого значения T_high (322) тональности.

10. Способ по любому из пп. 7-8, в котором коэффициент шумового смешения указывает уровень шума, добавляемого к одному или более сигналам аппроксимированной высокочастотной субполосы, чтобы аппроксимировать высокочастотную компоненту аудиосигнала.

11. Способ по любому из пп. 7-8, в котором

низкочастотная полоса (101) содержит стартовую полосу (201), указывающую низкочастотную субполосу, имеющую минимальную частоту из числа низкочастотных субполос, доступных для копирования;

высокочастотная полоса (101) содержит начальную полосу (202), указывающую высокочастотную субполосу, имеющую минимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;

высокочастотная полоса (102) содержит концевую полосу (203),

указывающую высокочастотную субполосу, имеющую максимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;

способ содержит этап, на котором определяют первую ширину полосы частот между стартовой полосой (201) и начальной полосой (202); и

способ содержит этап, на котором определяют вторую ширину полосы частот между начальной полосой (202) и концевой полосой (203).

12. Способ по п. 11, дополнительно содержащий этапы, на которых

если первая ширина полосы частот меньше, чем вторая ширина полосы частот, то определяют низкочастотное значение (321) полосовой тональности на основании одного или более сигналов (205) низкочастотной полосы между стартовой полосой (201) и начальной полосой (202) и определяют коэффициент шумового смешения на основании целевого значения (322) полосовой тональности и низкочастотного значения (321) полосовой тональности источника.

13. Способ по п. 11, дополнительно содержащий этап, на котором

если первая ширина полосы частот больше или равна второй ширине полосы частот, то определяют значение (323) полосовой тональности источника на основании одного или более сигналов (205) низкочастотной субполосы, находящейся между стартовой полосой (201) и стартовой полосой плюс вторая ширина полосы частот.

14. Способ по любому из пп. 7-8, в котором определение значения полосовой тональности частотной субполосы содержит этапы, на которых:

определяют набор значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и

формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в частотной субполосе, в результате чего получают значение (311, 312) полосовой тональности частотной субполосы.

15. Способ определения первого значения тональности для первого частотного бина аудиосигнала, причем значение первого частотного бина используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:

обеспечивают последовательность коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;

определяют последовательность фаз на основании последовательности коэффициентов преобразования;

определяют фазовое ускорение на основании последовательности фаз;

определяют мощность бина на основании текущего коэффициента преобразования;

аппроксимируют весовой коэффициент, указывающий корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и

взвешивают фазовое ускорение с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.

16. Способ по п. 15, в котором

последовательность коэффициентов преобразования содержит текущий коэффициент преобразования и непосредственно предшествующий коэффициент преобразования; и

весовой коэффициент указывает корень четвертой степени из отношения мощностей текущего коэффициента преобразования и непосредственно предшествующего коэффициента преобразования.

17. Способ по любому из пп. 15-16, в котором

коэффициенты преобразования являются комплексными числами, содержащими действительную часть и мнимую часть;

мощность текущего коэффициента преобразования определяют на основании квадрата действительной части и квадрата мнимой части текущего коэффициента преобразования; и

фазу определяют на основании функции арктангенса действительной части и мнимой части текущего коэффициента преобразования.

18. Способ по любому из пп. 15-16, в котором

текущее фазовое ускорение определяют на основании фазы

текущего коэффициента преобразования и на основании фаз двух или более непосредственно предшествующих коэффициентов преобразования.

19. Способ по любому из пп. 15-16, в котором аппроксимация весового коэффициента содержит этапы, на которых

обеспечивают текущую мантиссу и текущий показатель степени, представляющие текущий коэффициент преобразования из числа последующих коэффициентов преобразования;

определяют значение индекса для заданной справочной таблицы на основании текущей мантиссы и текущего показателя степени, причем справочная таблица обеспечивает взаимосвязь между множеством значений индекса и соответствующим множеством значений показателя степени множества значений индексов; и

определяют аппроксимированный весовой коэффициент с использованием значения индекса и справочной таблицы.

20. Способ по п. 19, в котором логарифмическая аппроксимация содержит линейную аппроксимацию логарифмической функции; и/или где справочная таблица содержит 64 или менее записей.

21. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых

определяют вещественное значение индекса на основании мантиссы и показателя степени; и

определяют значение индекса путем усечения и/или округления вещественного значения индекса.

22. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых

обеспечивают предшествующую мантиссу и предшествующий

показатель степени, представляющие коэффициент преобразования, предшествующий текущему коэффициенту преобразования; и

определяют значение индекса на основании одной или более операций сложения и/или вычитания, применяемых к текущей мантиссе, предшествующей мантиссе, текущему показателю степени и предшествующему показателю степени.

23. Способ по п. 22, в котором значение индекса определяют путем выполнения операции по модулю над

(е_{y} - e_{z} + 2 \cdot m_{y} - 2 \cdot m_{z})

, где e_y - текущая мантисса, e_z - предшествующая мантисса, m_y - текущий показатель степени и m_z - предшествующий показатель степени.

24. Способ определения множества значений тональности для множества связанных каналов многоканального аудиосигнала, причем способ содержит этапы, на которых

определяют первую последовательность коэффициентов преобразования для соответствующей последовательности блоков выборок первого канала из множества связанных каналов;

определяют первую последовательность фаз на основании последовательности первых коэффициентов преобразования;

определяют первое фазовое ускорение на основании последовательности первых фаз;

определяют первое значение тональности для первого канала на основании первого фазового ускорения; и

определяют значение тональности для второго канала из множества связанных каналов на основании первого фазового ускорения.

25. Способ определения значения (321) полосовой тональности для первого канала многоканального аудиосигнала в устройстве

кодирования на основе спектрального расширения, называемого SPX, выполненном с возможностью аппроксимации высокочастотной компоненты первого канала из низкочастотной компоненты первого канала; причем первый канал связывается устройством кодирования на основе SPX с одним или более другими каналами многоканального аудиосигнала; причем значение (321) полосовой тональности используют для определения коэффициента шумового смешения; причем значение (321) полосовой тональности указывает тональность аппроксимированной высокочастотной компоненты до шумового смешения; причем способ содержит этапы, на которых:

обеспечивают множество коэффициентов преобразования на основании первого канала до связывания; и

определяют значение (321) полосовой тональности на основании множества коэффициентов преобразования.

26. Система, выполненная с возможностью определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала; при этом первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем система выполнена с возможностью:

определения набора коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;

определения набора значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и

образования первого поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;

причем

система дополнительно выполнена с возможностью определения последовательности наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;

определение значения (341) тональности бина для конкретного частотного бина содержит:

определение последовательности фаз на основании последовательности конкретных коэффициентов преобразования; и

определение фазового ускорения на основании последовательности фаз; и

27. Система, выполненная с возможностью определения коэффициента шумового смешения; при этом коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала; причем высокочастотная компонента содержит один

или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит копирование одного или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем система выполнена с возможностью

определения целевого значения (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;

определения значения (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и

определения коэффициента шумового смешения на основании целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.

28. Система, выполненная с возможностью определения первого значения тональности для первого частотного бина аудиосигнала; причем первое значение полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем система выполнена с возможностью:

обеспечения последовательности коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;

определения последовательности фаз на основании последовательности коэффициентов преобразования;

определения фазового ускорения на основании последовательности фаз;

определения мощности бина на основании текущего коэффициента преобразования;

аппроксимации весового коэффициента, указывающего корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и

взвешивания фазового ускорения с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.

29. Устройство аудиокодирования, выполненное с возможностью кодирования аудиосигнала с использованием высокочастотного восстановления, причем устройство аудиокодирования содержит любую одну или более из систем по пп. 26-28.