RU2014134317A - Способы и системы для эффективного восстановления высокочастотного аудиоконтента - Google Patents

Способы и системы для эффективного восстановления высокочастотного аудиоконтента Download PDF

Info

Publication number
RU2014134317A
RU2014134317A RU2014134317A RU2014134317A RU2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A
Authority
RU
Russia
Prior art keywords
frequency
value
band
determining
tonality
Prior art date
Application number
RU2014134317A
Other languages
English (en)
Other versions
RU2601188C2 (ru
Inventor
Робин Тезинг
Михаэль ШУГ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2014134317A publication Critical patent/RU2014134317A/ru
Application granted granted Critical
Publication of RU2601188C2 publication Critical patent/RU2601188C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; иформируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; иопределяют фазовое ускорение на основании последовательности фаз; изначение (341) тональности бина для конкретного ч

Claims (29)

1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:
определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;
причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;
для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;
определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:
определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; и
определяют фазовое ускорение на основании последовательности фаз; и
значение (341) тональности бина для конкретного частотного бина является функцией фазового ускорения.
2. Способ по п. 1, дополнительно содержащий этап, на котором
определяют второе значение (321, 322) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов, находящихся во второй частотной субполосе; причем первая и вторая частотные субполосы содержат по меньшей мере один общий частотный бин, и при этом первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.
3. Способ по п. 1, в котором
аппроксимация высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала содержит этап, на котором копируют один или более низкочастотных коэффициентов преобразования одного или более частотных бинов из низкочастотной полосы (101), соответствующей низкочастотной компоненте, на высокочастотную полосу (102), соответствующую высокочастотной компоненте;
первая частотная субполоса находится в низкочастотной полосе (101);
вторая частотная субполоса находится в высокочастотной полосе (102);
причем способ дополнительно содержит этап, на котором определяют второе значение (233) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих частотных бинов из числа частотных бинов, которые были скопированы на вторую частотную субполосу;
вторая частотная субполоса содержит по меньшей мере один частотный бин, который был скопирован с частотного бина, находящегося в первой частотной субполосе; и
первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.
4. Способ по любому из предшествующих пунктов, в котором формирование первого поднабора из двух или более значений из набора значений (341) тональности бина содержит этап, на котором усредняют два или более значений (341) тональности бина; или суммируют два или более значений (341) тональности бина.
5. Способ по п. 1, в котором значение (341) тональности бина для частотного бина определяют только на основании коэффициентов преобразования того же частотного бина.
6. Способ по п. 1, в котором
первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на
основании низкочастотной компоненты аудиосигнала с использованием схемы спектрального расширения, называемого SPX; и
первое значение (311, 312) полосовой тональности используют для определения стратегии повторной отправки координат SPX, коэффициента шумового смешения и/или значительного затухания дисперсии.
7. Способ определения коэффициента шумового смешения, в котором коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем высокочастотная компонента содержит один или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит этап, на котором копируют один или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем способ содержит этапы, на которых:
определяют целевое значение (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;
определяют значение (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и
определяют коэффициент шумового смешения на основании
целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
8. Способ по п. 7, в котором способ содержит этап, на котором определяют коэффициент шумового смешения на основании дисперсии целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
9. Способ по любому из пп. 7-8, причем способ содержит этап, на котором определяют коэффициент b шумового смешения как
Figure 00000001
где
Figure 00000002
- дисперсия значения Tcopy (323) тональности источника и целевого значения Thigh (322) тональности.
10. Способ по любому из пп. 7-8, в котором коэффициент шумового смешения указывает уровень шума, добавляемого к одному или более сигналам аппроксимированной высокочастотной субполосы, чтобы аппроксимировать высокочастотную компоненту аудиосигнала.
11. Способ по любому из пп. 7-8, в котором
низкочастотная полоса (101) содержит стартовую полосу (201), указывающую низкочастотную субполосу, имеющую минимальную частоту из числа низкочастотных субполос, доступных для копирования;
высокочастотная полоса (101) содержит начальную полосу (202), указывающую высокочастотную субполосу, имеющую минимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;
высокочастотная полоса (102) содержит концевую полосу (203),
указывающую высокочастотную субполосу, имеющую максимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;
способ содержит этап, на котором определяют первую ширину полосы частот между стартовой полосой (201) и начальной полосой (202); и
способ содержит этап, на котором определяют вторую ширину полосы частот между начальной полосой (202) и концевой полосой (203).
12. Способ по п. 11, дополнительно содержащий этапы, на которых
если первая ширина полосы частот меньше, чем вторая ширина полосы частот, то определяют низкочастотное значение (321) полосовой тональности на основании одного или более сигналов (205) низкочастотной полосы между стартовой полосой (201) и начальной полосой (202) и определяют коэффициент шумового смешения на основании целевого значения (322) полосовой тональности и низкочастотного значения (321) полосовой тональности источника.
13. Способ по п. 11, дополнительно содержащий этап, на котором
если первая ширина полосы частот больше или равна второй ширине полосы частот, то определяют значение (323) полосовой тональности источника на основании одного или более сигналов (205) низкочастотной субполосы, находящейся между стартовой полосой (201) и стартовой полосой плюс вторая ширина полосы частот.
14. Способ по любому из пп. 7-8, в котором определение значения полосовой тональности частотной субполосы содержит этапы, на которых:
определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определяют набор значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в частотной субполосе, в результате чего получают значение (311, 312) полосовой тональности частотной субполосы.
15. Способ определения первого значения тональности для первого частотного бина аудиосигнала, причем значение первого частотного бина используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:
обеспечивают последовательность коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;
определяют последовательность фаз на основании последовательности коэффициентов преобразования;
определяют фазовое ускорение на основании последовательности фаз;
определяют мощность бина на основании текущего коэффициента преобразования;
аппроксимируют весовой коэффициент, указывающий корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и
взвешивают фазовое ускорение с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.
16. Способ по п. 15, в котором
последовательность коэффициентов преобразования содержит текущий коэффициент преобразования и непосредственно предшествующий коэффициент преобразования; и
весовой коэффициент указывает корень четвертой степени из отношения мощностей текущего коэффициента преобразования и непосредственно предшествующего коэффициента преобразования.
17. Способ по любому из пп. 15-16, в котором
коэффициенты преобразования являются комплексными числами, содержащими действительную часть и мнимую часть;
мощность текущего коэффициента преобразования определяют на основании квадрата действительной части и квадрата мнимой части текущего коэффициента преобразования; и
фазу определяют на основании функции арктангенса действительной части и мнимой части текущего коэффициента преобразования.
18. Способ по любому из пп. 15-16, в котором
текущее фазовое ускорение определяют на основании фазы
текущего коэффициента преобразования и на основании фаз двух или более непосредственно предшествующих коэффициентов преобразования.
19. Способ по любому из пп. 15-16, в котором аппроксимация весового коэффициента содержит этапы, на которых
обеспечивают текущую мантиссу и текущий показатель степени, представляющие текущий коэффициент преобразования из числа последующих коэффициентов преобразования;
определяют значение индекса для заданной справочной таблицы на основании текущей мантиссы и текущего показателя степени, причем справочная таблица обеспечивает взаимосвязь между множеством значений индекса и соответствующим множеством значений показателя степени множества значений индексов; и
определяют аппроксимированный весовой коэффициент с использованием значения индекса и справочной таблицы.
20. Способ по п. 19, в котором логарифмическая аппроксимация содержит линейную аппроксимацию логарифмической функции; и/или где справочная таблица содержит 64 или менее записей.
21. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых
определяют вещественное значение индекса на основании мантиссы и показателя степени; и
определяют значение индекса путем усечения и/или округления вещественного значения индекса.
22. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых
обеспечивают предшествующую мантиссу и предшествующий
показатель степени, представляющие коэффициент преобразования, предшествующий текущему коэффициенту преобразования; и
определяют значение индекса на основании одной или более операций сложения и/или вычитания, применяемых к текущей мантиссе, предшествующей мантиссе, текущему показателю степени и предшествующему показателю степени.
23. Способ по п. 22, в котором значение индекса определяют путем выполнения операции по модулю над ( е y e z + 2 m y 2 m z )
Figure 00000003
, где ey - текущая мантисса, ez - предшествующая мантисса, my - текущий показатель степени и mz - предшествующий показатель степени.
24. Способ определения множества значений тональности для множества связанных каналов многоканального аудиосигнала, причем способ содержит этапы, на которых
определяют первую последовательность коэффициентов преобразования для соответствующей последовательности блоков выборок первого канала из множества связанных каналов;
определяют первую последовательность фаз на основании последовательности первых коэффициентов преобразования;
определяют первое фазовое ускорение на основании последовательности первых фаз;
определяют первое значение тональности для первого канала на основании первого фазового ускорения; и
определяют значение тональности для второго канала из множества связанных каналов на основании первого фазового ускорения.
25. Способ определения значения (321) полосовой тональности для первого канала многоканального аудиосигнала в устройстве
кодирования на основе спектрального расширения, называемого SPX, выполненном с возможностью аппроксимации высокочастотной компоненты первого канала из низкочастотной компоненты первого канала; причем первый канал связывается устройством кодирования на основе SPX с одним или более другими каналами многоканального аудиосигнала; причем значение (321) полосовой тональности используют для определения коэффициента шумового смешения; причем значение (321) полосовой тональности указывает тональность аппроксимированной высокочастотной компоненты до шумового смешения; причем способ содержит этапы, на которых:
обеспечивают множество коэффициентов преобразования на основании первого канала до связывания; и
определяют значение (321) полосовой тональности на основании множества коэффициентов преобразования.
26. Система, выполненная с возможностью определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала; при этом первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем система выполнена с возможностью:
определения набора коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определения набора значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
образования первого поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;
причем
система дополнительно выполнена с возможностью определения последовательности наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;
для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;
определение значения (341) тональности бина для конкретного частотного бина содержит:
определение последовательности фаз на основании последовательности конкретных коэффициентов преобразования; и
определение фазового ускорения на основании последовательности фаз; и
значение (341) тональности бина для конкретного частотного бина является функцией фазового ускорения.
27. Система, выполненная с возможностью определения коэффициента шумового смешения; при этом коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала; причем высокочастотная компонента содержит один
или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит копирование одного или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем система выполнена с возможностью
определения целевого значения (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;
определения значения (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и
определения коэффициента шумового смешения на основании целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
28. Система, выполненная с возможностью определения первого значения тональности для первого частотного бина аудиосигнала; причем первое значение полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем система выполнена с возможностью:
обеспечения последовательности коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;
определения последовательности фаз на основании последовательности коэффициентов преобразования;
определения фазового ускорения на основании последовательности фаз;
определения мощности бина на основании текущего коэффициента преобразования;
аппроксимации весового коэффициента, указывающего корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и
взвешивания фазового ускорения с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.
29. Устройство аудиокодирования, выполненное с возможностью кодирования аудиосигнала с использованием высокочастотного восстановления, причем устройство аудиокодирования содержит любую одну или более из систем по пп. 26-28.
RU2014134317/08A 2012-02-23 2013-02-22 Способы и системы для эффективного восстановления высокочастотного аудиоконтента RU2601188C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP12156631.9 2012-02-23
EP12156631 2012-02-23
US201261680805P 2012-08-08 2012-08-08
US61/680,805 2012-08-08
PCT/EP2013/053609 WO2013124445A2 (en) 2012-02-23 2013-02-22 Methods and systems for efficient recovery of high frequency audio content

Publications (2)

Publication Number Publication Date
RU2014134317A true RU2014134317A (ru) 2016-04-20
RU2601188C2 RU2601188C2 (ru) 2016-10-27

Family

ID=49006324

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014134317/08A RU2601188C2 (ru) 2012-02-23 2013-02-22 Способы и системы для эффективного восстановления высокочастотного аудиоконтента

Country Status (9)

Country Link
US (2) US9666200B2 (ru)
EP (3) EP3288033B1 (ru)
JP (2) JP6046169B2 (ru)
KR (2) KR101679209B1 (ru)
CN (2) CN107993673B (ru)
BR (2) BR122021018240B1 (ru)
ES (1) ES2568640T3 (ru)
RU (1) RU2601188C2 (ru)
WO (1) WO2013124445A2 (ru)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado
KR20150056770A (ko) * 2012-09-13 2015-05-27 엘지전자 주식회사 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치
WO2014115225A1 (ja) * 2013-01-22 2014-07-31 パナソニック株式会社 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法
EP3742440B1 (en) 2013-04-05 2024-07-31 Dolby International AB Audio decoder for interleaved waveform coding
US9542955B2 (en) * 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
EP2963646A1 (en) 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal
JP2016038435A (ja) 2014-08-06 2016-03-22 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
WO2017125559A1 (en) 2016-01-22 2017-07-27 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling
US10681679B1 (en) * 2017-06-21 2020-06-09 Nxp Usa, Inc. Resource unit detection in high-efficiency wireless system
US10187721B1 (en) * 2017-06-22 2019-01-22 Amazon Technologies, Inc. Weighing fixed and adaptive beamformers
EP3435376B1 (en) 2017-07-28 2020-01-22 Fujitsu Limited Audio encoding apparatus and audio encoding method
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置
TWI702594B (zh) 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
CN109036457B (zh) * 2018-09-10 2021-10-08 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
CN110267082B (zh) * 2019-06-03 2020-05-05 李少锋 按语言最小单元自动切换音视频的播放控制方法及系统
CN116134834A (zh) * 2020-12-31 2023-05-16 深圳市韶音科技有限公司 生成音频的方法和系统

Family Cites Families (49)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR920008063B1 (ko) * 1988-11-22 1992-09-22 마쯔시다덴기산교 가부시기가이샤 텔레비젼신호수신장치
US5699477A (en) * 1994-11-09 1997-12-16 Texas Instruments Incorporated Mixed excitation linear prediction with fractional pitch
US7012630B2 (en) 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
US5913189A (en) * 1997-02-12 1999-06-15 Hughes Electronics Corporation Voice compression system having robust in-band tone signaling and related method
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
JP3654117B2 (ja) * 2000-03-13 2005-06-02 ヤマハ株式会社 時間軸方向における楽音波形信号の伸縮方法
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
US6978001B1 (en) 2001-12-31 2005-12-20 Cisco Technology, Inc. Method and system for controlling audio content during multiparty communication sessions
DE60326782D1 (de) * 2002-04-22 2009-04-30 Koninkl Philips Electronics Nv Dekodiervorrichtung mit Dekorreliereinheit
TWI288915B (en) * 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
KR100463417B1 (ko) 2002-10-10 2004-12-23 한국전자통신연구원 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치
US20060100861A1 (en) 2002-10-14 2006-05-11 Koninkijkle Phillips Electronics N.V Signal filtering
US7318035B2 (en) * 2003-05-08 2008-01-08 Dolby Laboratories Licensing Corporation Audio coding systems and methods using spectral component coupling and spectral component regeneration
JP4252417B2 (ja) * 2003-10-02 2009-04-08 住友重機械工業株式会社 成形機の監視装置及び監視方法
CA2454296A1 (en) * 2003-12-29 2005-06-29 Nokia Corporation Method and device for speech enhancement in the presence of background noise
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7218240B2 (en) * 2004-08-10 2007-05-15 The Boeing Company Synthetically generated sound cues
US7545875B2 (en) 2004-11-03 2009-06-09 Nokia Corporation System and method for space-time-frequency coding in a multi-antenna transmission system
US7675873B2 (en) 2004-12-14 2010-03-09 Alcatel Lucent Enhanced IP-voice conferencing
US8082156B2 (en) * 2005-01-11 2011-12-20 Nec Corporation Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal
CN101180676B (zh) * 2005-04-01 2011-12-14 高通股份有限公司 用于谱包络表示的向量量化的方法和设备
US7630882B2 (en) 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
JP4736812B2 (ja) * 2006-01-13 2011-07-27 ソニー株式会社 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体
KR101240261B1 (ko) 2006-02-07 2013-03-07 엘지전자 주식회사 이동통신 단말기의 영상 통화 장치 및 방법
CN101149918B (zh) * 2006-09-22 2012-03-28 鸿富锦精密工业(深圳)有限公司 具练唱功能的声音处理装置
JP2008096567A (ja) 2006-10-10 2008-04-24 Matsushita Electric Ind Co Ltd オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム
DE602008001787D1 (de) * 2007-02-12 2010-08-26 Dolby Lab Licensing Corp Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer
JP4871894B2 (ja) 2007-03-02 2012-02-08 パナソニック株式会社 符号化装置、復号装置、符号化方法および復号方法
US8121535B2 (en) 2007-03-02 2012-02-21 Qualcomm Incorporated Configuration of a repeater
WO2009039897A1 (en) 2007-09-26 2009-04-02 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program
US8509454B2 (en) 2007-11-01 2013-08-13 Nokia Corporation Focusing on a portion of an audio scene for an audio signal
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8223851B2 (en) 2007-11-23 2012-07-17 Samsung Electronics Co., Ltd. Method and an apparatus for embedding data in a media stream
CN101471072B (zh) * 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
US8532998B2 (en) * 2008-09-06 2013-09-10 Huawei Technologies Co., Ltd. Selective bandwidth extension for encoding/decoding audio/speech signal
US20110254913A1 (en) 2008-12-24 2011-10-20 Panasonic Corporation Conferencing apparatus and communication setting method
UA99878C2 (ru) * 2009-01-16 2012-10-10 Долби Интернешнл Аб Гармоническое преобразование, усовершенствованное перекрестным произведением
CN101527141B (zh) * 2009-03-10 2011-06-22 苏州大学 基于径向基神经网络的耳语音转换为正常语音的方法
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
US8223943B2 (en) 2009-04-14 2012-07-17 Citrix Systems Inc. Systems and methods for computer and voice conference audio transmission during conference call via PSTN phone
US8351589B2 (en) 2009-06-16 2013-01-08 Microsoft Corporation Spatial audio for audio conferencing
US8427521B2 (en) 2009-10-21 2013-04-23 At&T Intellectual Property I, L.P. Method and apparatus for providing a collaborative workspace
WO2011059432A1 (en) * 2009-11-12 2011-05-19 Paul Reed Smith Guitars Limited Partnership Precision measurement of waveforms
US8774787B2 (en) 2009-12-01 2014-07-08 At&T Intellectual Property I, L.P. Methods and systems for providing location-sensitive conference calling
SI2510515T1 (sl) 2009-12-07 2014-06-30 Dolby Laboratories Licensing Corporation Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije
US20110182415A1 (en) 2010-01-28 2011-07-28 Jacobstein Mark Williams Methods and apparatus for providing call conferencing services
MX2012001696A (es) * 2010-06-09 2012-02-22 Panasonic Corp Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio.
JP6010539B2 (ja) * 2011-09-09 2016-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化装置、復号装置、符号化方法および復号方法
BR122021018240B1 (pt) * 2012-02-23 2022-08-30 Dolby International Ab Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado

Also Published As

Publication number Publication date
EP3288033B1 (en) 2019-04-10
EP3288033A1 (en) 2018-02-28
US20150003632A1 (en) 2015-01-01
EP3029672B1 (en) 2017-09-13
EP2817803A2 (en) 2014-12-31
JP2016173597A (ja) 2016-09-29
CN107993673B (zh) 2022-09-27
JP6334602B2 (ja) 2018-05-30
JP6046169B2 (ja) 2016-12-14
BR122021018240B1 (pt) 2022-08-30
WO2013124445A2 (en) 2013-08-29
EP2817803B1 (en) 2016-02-03
RU2601188C2 (ru) 2016-10-27
BR112014020562A2 (ru) 2017-06-20
WO2013124445A3 (en) 2013-11-21
CN107993673A (zh) 2018-05-04
ES2568640T3 (es) 2016-05-03
CN104541327B (zh) 2018-01-12
US20170221491A1 (en) 2017-08-03
JP2015508186A (ja) 2015-03-16
EP3029672A2 (en) 2016-06-08
EP3029672A3 (en) 2016-06-29
KR20160134871A (ko) 2016-11-23
KR101679209B1 (ko) 2016-12-06
CN104541327A (zh) 2015-04-22
KR20140116520A (ko) 2014-10-02
US9984695B2 (en) 2018-05-29
KR101816506B1 (ko) 2018-01-09
BR112014020562B1 (pt) 2022-06-14
US9666200B2 (en) 2017-05-30

Similar Documents

Publication Publication Date Title
RU2014134317A (ru) Способы и системы для эффективного восстановления высокочастотного аудиоконтента
US7929708B2 (en) Audio spatial environment engine
US8447597B2 (en) Audio encoding device, audio decoding device, audio encoding method, and audio decoding method
JP4527716B2 (ja) 複素指数変調フィルタバンクを基にした新型プロセッシングおよび適応型時間信号伝達方法
RU2595544C2 (ru) Устройство и способ кодирования, устройство и способ декодирования и программа
RU2670797C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
JP6061121B2 (ja) オーディオ符号化装置、オーディオ符号化方法、およびプログラム
EP3343560A1 (en) Audio coding device and audio coding method
MX2010008279A (es) Metodo y aparato para calcular energia de banda alta en un sistema de extension de ancho de banda.
CN102201823B (zh) 多通道音频信号处理
CN101971249A (zh) 用于计算音频信号的指纹、用于同步、以及用于表征测试音频信号的装置和方法
MY156427A (en) Device and method for postprocessing spectral values and encoder and decoder for audio signals
CN104221082A (zh) 谐波音频信号的带宽扩展
EP3179476B1 (en) Coding device and method, and program
CN103366750A (zh) 一种声音编解码装置及其方法
CN102243876B (zh) 预测残差信号的量化编码方法及装置
RU2018118576A (ru) Способ и устройство обработки сигналов
US20110116551A1 (en) Apparatus and methods for processing compression encoded signals
JP2000122676A (ja) 音楽信号の波形符号化方式
RU2777660C2 (ru) Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов
JP3725876B2 (ja) オーディオ符号化器とその符号化処理プログラム
CN103971692A (zh) 音频处理方法、装置及系统