RU2014134317A - Способы и системы для эффективного восстановления высокочастотного аудиоконтента - Google Patents
Способы и системы для эффективного восстановления высокочастотного аудиоконтента Download PDFInfo
- Publication number
- RU2014134317A RU2014134317A RU2014134317A RU2014134317A RU2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A RU 2014134317 A RU2014134317 A RU 2014134317A
- Authority
- RU
- Russia
- Prior art keywords
- frequency
- value
- band
- determining
- tonality
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract 40
- 230000005236 sound signal Effects 0.000 claims abstract 34
- 238000006243 chemical reaction Methods 0.000 claims abstract 17
- 230000001133 acceleration Effects 0.000 claims abstract 13
- 238000000819 phase cycle Methods 0.000 claims 3
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 230000003595 spectral effect Effects 0.000 claims 2
- 238000012935 Averaging Methods 0.000 claims 1
- 238000011084 recovery Methods 0.000 claims 1
- 238000005303 weighing Methods 0.000 claims 1
- 235000010627 Phaseolus vulgaris Nutrition 0.000 abstract 1
- 244000046052 Phaseolus vulgaris Species 0.000 abstract 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
- G10L21/0388—Details of processing therefor
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; иформируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; иопределяют фазовое ускорение на основании последовательности фаз; изначение (341) тональности бина для конкретного ч
Claims (29)
1. Способ определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала, в котором первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:
определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определяют набор значений (341) тональностей бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;
причем способ дополнительно содержит этап, на котором определяют последовательность наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;
для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;
определение значения (341) тональности бина для конкретного частотного бина содержит этапы, на которых:
определяют последовательность фаз на основании последовательности конкретных коэффициентов преобразования; и
определяют фазовое ускорение на основании последовательности фаз; и
значение (341) тональности бина для конкретного частотного бина является функцией фазового ускорения.
2. Способ по п. 1, дополнительно содержащий этап, на котором
определяют второе значение (321, 322) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов, находящихся во второй частотной субполосе; причем первая и вторая частотные субполосы содержат по меньшей мере один общий частотный бин, и при этом первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.
3. Способ по п. 1, в котором
аппроксимация высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала содержит этап, на котором копируют один или более низкочастотных коэффициентов преобразования одного или более частотных бинов из низкочастотной полосы (101), соответствующей низкочастотной компоненте, на высокочастотную полосу (102), соответствующую высокочастотной компоненте;
первая частотная субполоса находится в низкочастотной полосе (101);
вторая частотная субполоса находится в высокочастотной полосе (102);
причем способ дополнительно содержит этап, на котором определяют второе значение (233) полосовой тональности во второй частотной субполосе путем формирования второго поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих частотных бинов из числа частотных бинов, которые были скопированы на вторую частотную субполосу;
вторая частотная субполоса содержит по меньшей мере один частотный бин, который был скопирован с частотного бина, находящегося в первой частотной субполосе; и
первый и второй поднаборы содержат соответствующее значение (341) тональности по меньшей мере одного общего бина.
4. Способ по любому из предшествующих пунктов, в котором формирование первого поднабора из двух или более значений из набора значений (341) тональности бина содержит этап, на котором усредняют два или более значений (341) тональности бина; или суммируют два или более значений (341) тональности бина.
5. Способ по п. 1, в котором значение (341) тональности бина для частотного бина определяют только на основании коэффициентов преобразования того же частотного бина.
6. Способ по п. 1, в котором
первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на
основании низкочастотной компоненты аудиосигнала с использованием схемы спектрального расширения, называемого SPX; и
первое значение (311, 312) полосовой тональности используют для определения стратегии повторной отправки координат SPX, коэффициента шумового смешения и/или значительного затухания дисперсии.
7. Способ определения коэффициента шумового смешения, в котором коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем высокочастотная компонента содержит один или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит этап, на котором копируют один или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем способ содержит этапы, на которых:
определяют целевое значение (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;
определяют значение (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и
определяют коэффициент шумового смешения на основании
целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
8. Способ по п. 7, в котором способ содержит этап, на котором определяют коэффициент шумового смешения на основании дисперсии целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
10. Способ по любому из пп. 7-8, в котором коэффициент шумового смешения указывает уровень шума, добавляемого к одному или более сигналам аппроксимированной высокочастотной субполосы, чтобы аппроксимировать высокочастотную компоненту аудиосигнала.
11. Способ по любому из пп. 7-8, в котором
низкочастотная полоса (101) содержит стартовую полосу (201), указывающую низкочастотную субполосу, имеющую минимальную частоту из числа низкочастотных субполос, доступных для копирования;
высокочастотная полоса (101) содержит начальную полосу (202), указывающую высокочастотную субполосу, имеющую минимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;
высокочастотная полоса (102) содержит концевую полосу (203),
указывающую высокочастотную субполосу, имеющую максимальную частоту из числа высокочастотных субполос, подлежащих аппроксимации;
способ содержит этап, на котором определяют первую ширину полосы частот между стартовой полосой (201) и начальной полосой (202); и
способ содержит этап, на котором определяют вторую ширину полосы частот между начальной полосой (202) и концевой полосой (203).
12. Способ по п. 11, дополнительно содержащий этапы, на которых
если первая ширина полосы частот меньше, чем вторая ширина полосы частот, то определяют низкочастотное значение (321) полосовой тональности на основании одного или более сигналов (205) низкочастотной полосы между стартовой полосой (201) и начальной полосой (202) и определяют коэффициент шумового смешения на основании целевого значения (322) полосовой тональности и низкочастотного значения (321) полосовой тональности источника.
13. Способ по п. 11, дополнительно содержащий этап, на котором
если первая ширина полосы частот больше или равна второй ширине полосы частот, то определяют значение (323) полосовой тональности источника на основании одного или более сигналов (205) низкочастотной субполосы, находящейся между стартовой полосой (201) и стартовой полосой плюс вторая ширина полосы частот.
14. Способ по любому из пп. 7-8, в котором определение значения полосовой тональности частотной субполосы содержит этапы, на которых:
определяют набор коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определяют набор значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
формируют первый поднабор из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в частотной субполосе, в результате чего получают значение (311, 312) полосовой тональности частотной субполосы.
15. Способ определения первого значения тональности для первого частотного бина аудиосигнала, причем значение первого частотного бина используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем способ содержит этапы, на которых:
обеспечивают последовательность коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;
определяют последовательность фаз на основании последовательности коэффициентов преобразования;
определяют фазовое ускорение на основании последовательности фаз;
определяют мощность бина на основании текущего коэффициента преобразования;
аппроксимируют весовой коэффициент, указывающий корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и
взвешивают фазовое ускорение с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.
16. Способ по п. 15, в котором
последовательность коэффициентов преобразования содержит текущий коэффициент преобразования и непосредственно предшествующий коэффициент преобразования; и
весовой коэффициент указывает корень четвертой степени из отношения мощностей текущего коэффициента преобразования и непосредственно предшествующего коэффициента преобразования.
17. Способ по любому из пп. 15-16, в котором
коэффициенты преобразования являются комплексными числами, содержащими действительную часть и мнимую часть;
мощность текущего коэффициента преобразования определяют на основании квадрата действительной части и квадрата мнимой части текущего коэффициента преобразования; и
фазу определяют на основании функции арктангенса действительной части и мнимой части текущего коэффициента преобразования.
18. Способ по любому из пп. 15-16, в котором
текущее фазовое ускорение определяют на основании фазы
текущего коэффициента преобразования и на основании фаз двух или более непосредственно предшествующих коэффициентов преобразования.
19. Способ по любому из пп. 15-16, в котором аппроксимация весового коэффициента содержит этапы, на которых
обеспечивают текущую мантиссу и текущий показатель степени, представляющие текущий коэффициент преобразования из числа последующих коэффициентов преобразования;
определяют значение индекса для заданной справочной таблицы на основании текущей мантиссы и текущего показателя степени, причем справочная таблица обеспечивает взаимосвязь между множеством значений индекса и соответствующим множеством значений показателя степени множества значений индексов; и
определяют аппроксимированный весовой коэффициент с использованием значения индекса и справочной таблицы.
20. Способ по п. 19, в котором логарифмическая аппроксимация содержит линейную аппроксимацию логарифмической функции; и/или где справочная таблица содержит 64 или менее записей.
21. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых
определяют вещественное значение индекса на основании мантиссы и показателя степени; и
определяют значение индекса путем усечения и/или округления вещественного значения индекса.
22. Способ по п. 15, в котором аппроксимация весового коэффициента содержит этапы, на которых
обеспечивают предшествующую мантиссу и предшествующий
показатель степени, представляющие коэффициент преобразования, предшествующий текущему коэффициенту преобразования; и
определяют значение индекса на основании одной или более операций сложения и/или вычитания, применяемых к текущей мантиссе, предшествующей мантиссе, текущему показателю степени и предшествующему показателю степени.
24. Способ определения множества значений тональности для множества связанных каналов многоканального аудиосигнала, причем способ содержит этапы, на которых
определяют первую последовательность коэффициентов преобразования для соответствующей последовательности блоков выборок первого канала из множества связанных каналов;
определяют первую последовательность фаз на основании последовательности первых коэффициентов преобразования;
определяют первое фазовое ускорение на основании последовательности первых фаз;
определяют первое значение тональности для первого канала на основании первого фазового ускорения; и
определяют значение тональности для второго канала из множества связанных каналов на основании первого фазового ускорения.
25. Способ определения значения (321) полосовой тональности для первого канала многоканального аудиосигнала в устройстве
кодирования на основе спектрального расширения, называемого SPX, выполненном с возможностью аппроксимации высокочастотной компоненты первого канала из низкочастотной компоненты первого канала; причем первый канал связывается устройством кодирования на основе SPX с одним или более другими каналами многоканального аудиосигнала; причем значение (321) полосовой тональности используют для определения коэффициента шумового смешения; причем значение (321) полосовой тональности указывает тональность аппроксимированной высокочастотной компоненты до шумового смешения; причем способ содержит этапы, на которых:
обеспечивают множество коэффициентов преобразования на основании первого канала до связывания; и
определяют значение (321) полосовой тональности на основании множества коэффициентов преобразования.
26. Система, выполненная с возможностью определения первого значения (311, 312) полосовой тональности для первой частотной субполосы (205) аудиосигнала; при этом первое значение (311, 312) полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты этого аудиосигнала, причем система выполнена с возможностью:
определения набора коэффициентов преобразования в соответствующем наборе частотных бинов на основании блока выборок аудиосигнала;
определения набора значений (341) тональности бина для набора частотных бинов, соответственно, с использованием упомянутого набора коэффициентов преобразования; и
образования первого поднабора из двух или более значений из набора значений (341) тональности бина для двух или более соответствующих соседних частотных бинов из набора частотных бинов, находящихся в первой частотной субполосе, в результате чего получают первое значение (311, 312) полосовой тональности для первой частотной субполосы;
причем
система дополнительно выполнена с возможностью определения последовательности наборов коэффициентов преобразования на основании соответствующей последовательности блоков аудиосигнала;
для конкретного частотного бина последовательность наборов коэффициентов преобразования содержит последовательность конкретных коэффициентов преобразования;
определение значения (341) тональности бина для конкретного частотного бина содержит:
определение последовательности фаз на основании последовательности конкретных коэффициентов преобразования; и
определение фазового ускорения на основании последовательности фаз; и
значение (341) тональности бина для конкретного частотного бина является функцией фазового ускорения.
27. Система, выполненная с возможностью определения коэффициента шумового смешения; при этом коэффициент шумового смешения используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала; причем высокочастотная компонента содержит один
или более сигналов высокочастотной субполосы в высокочастотной полосе (102); причем низкочастотная компонента содержит один или более сигналов низкочастотной субполосы в низкочастотной полосе (101); причем аппроксимация высокочастотной компоненты содержит копирование одного или более сигналов низкочастотной субполосы на высокочастотную полосу (102), в результате чего получают один или более сигналов аппроксимированной высокочастотной субполосы, причем система выполнена с возможностью
определения целевого значения (322) полосовой тональности на основании одного или более сигналов высокочастотной субполосы;
определения значения (323) полосовой тональности источника на основании одного или более сигналов аппроксимированной высокочастотной субполосы; и
определения коэффициента шумового смешения на основании целевого значения (322) полосовой тональности и значения (323) полосовой тональности источника.
28. Система, выполненная с возможностью определения первого значения тональности для первого частотного бина аудиосигнала; причем первое значение полосовой тональности используют для аппроксимации высокочастотной компоненты аудиосигнала на основании низкочастотной компоненты аудиосигнала, причем система выполнена с возможностью:
обеспечения последовательности коэффициентов преобразования в первом частотном бине для соответствующей последовательности блоков выборок аудиосигнала;
определения последовательности фаз на основании последовательности коэффициентов преобразования;
определения фазового ускорения на основании последовательности фаз;
определения мощности бина на основании текущего коэффициента преобразования;
аппроксимации весового коэффициента, указывающего корень четвертой степени отношения мощностей последующих коэффициентов преобразования, с использованием логарифмической аппроксимации; и
взвешивания фазового ускорения с использованием мощности бина и аппроксимированного весового коэффициента для получения первого значения тональности бина.
29. Устройство аудиокодирования, выполненное с возможностью кодирования аудиосигнала с использованием высокочастотного восстановления, причем устройство аудиокодирования содержит любую одну или более из систем по пп. 26-28.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP12156631.9 | 2012-02-23 | ||
EP12156631 | 2012-02-23 | ||
US201261680805P | 2012-08-08 | 2012-08-08 | |
US61/680,805 | 2012-08-08 | ||
PCT/EP2013/053609 WO2013124445A2 (en) | 2012-02-23 | 2013-02-22 | Methods and systems for efficient recovery of high frequency audio content |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2014134317A true RU2014134317A (ru) | 2016-04-20 |
RU2601188C2 RU2601188C2 (ru) | 2016-10-27 |
Family
ID=49006324
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2014134317/08A RU2601188C2 (ru) | 2012-02-23 | 2013-02-22 | Способы и системы для эффективного восстановления высокочастотного аудиоконтента |
Country Status (9)
Country | Link |
---|---|
US (2) | US9666200B2 (ru) |
EP (3) | EP3288033B1 (ru) |
JP (2) | JP6046169B2 (ru) |
KR (2) | KR101679209B1 (ru) |
CN (2) | CN107993673B (ru) |
BR (2) | BR122021018240B1 (ru) |
ES (1) | ES2568640T3 (ru) |
RU (1) | RU2601188C2 (ru) |
WO (1) | WO2013124445A2 (ru) |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
KR20150056770A (ko) * | 2012-09-13 | 2015-05-27 | 엘지전자 주식회사 | 손실 프레임 복원 방법 및 오디오 복호화 방법과 이를 이용하는 장치 |
WO2014115225A1 (ja) * | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
EP3742440B1 (en) | 2013-04-05 | 2024-07-31 | Dolby International AB | Audio decoder for interleaved waveform coding |
US9542955B2 (en) * | 2014-03-31 | 2017-01-10 | Qualcomm Incorporated | High-band signal coding using multiple sub-bands |
EP2963646A1 (en) | 2014-07-01 | 2016-01-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Decoder and method for decoding an audio signal, encoder and method for encoding an audio signal |
JP2016038435A (ja) | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP6611042B2 (ja) * | 2015-12-02 | 2019-11-27 | パナソニックIpマネジメント株式会社 | 音声信号復号装置及び音声信号復号方法 |
WO2017125559A1 (en) | 2016-01-22 | 2017-07-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling |
US10681679B1 (en) * | 2017-06-21 | 2020-06-09 | Nxp Usa, Inc. | Resource unit detection in high-efficiency wireless system |
US10187721B1 (en) * | 2017-06-22 | 2019-01-22 | Amazon Technologies, Inc. | Weighing fixed and adaptive beamformers |
EP3435376B1 (en) | 2017-07-28 | 2020-01-22 | Fujitsu Limited | Audio encoding apparatus and audio encoding method |
CN107545900B (zh) * | 2017-08-16 | 2020-12-01 | 广州广晟数码技术有限公司 | 带宽扩展编码和解码中高频弦信号生成的方法和装置 |
TWI702594B (zh) | 2018-01-26 | 2020-08-21 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建技術之回溯相容整合 |
CN109036457B (zh) * | 2018-09-10 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 恢复音频信号的方法和装置 |
CN110267082B (zh) * | 2019-06-03 | 2020-05-05 | 李少锋 | 按语言最小单元自动切换音视频的播放控制方法及系统 |
CN116134834A (zh) * | 2020-12-31 | 2023-05-16 | 深圳市韶音科技有限公司 | 生成音频的方法和系统 |
Family Cites Families (49)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR920008063B1 (ko) * | 1988-11-22 | 1992-09-22 | 마쯔시다덴기산교 가부시기가이샤 | 텔레비젼신호수신장치 |
US5699477A (en) * | 1994-11-09 | 1997-12-16 | Texas Instruments Incorporated | Mixed excitation linear prediction with fractional pitch |
US7012630B2 (en) | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US5913189A (en) * | 1997-02-12 | 1999-06-15 | Hughes Electronics Corporation | Voice compression system having robust in-band tone signaling and related method |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP3654117B2 (ja) * | 2000-03-13 | 2005-06-02 | ヤマハ株式会社 | 時間軸方向における楽音波形信号の伸縮方法 |
EP1423847B1 (en) * | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6978001B1 (en) | 2001-12-31 | 2005-12-20 | Cisco Technology, Inc. | Method and system for controlling audio content during multiparty communication sessions |
DE60326782D1 (de) * | 2002-04-22 | 2009-04-30 | Koninkl Philips Electronics Nv | Dekodiervorrichtung mit Dekorreliereinheit |
TWI288915B (en) * | 2002-06-17 | 2007-10-21 | Dolby Lab Licensing Corp | Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components |
KR100463417B1 (ko) | 2002-10-10 | 2004-12-23 | 한국전자통신연구원 | 상관함수의 최대값과 그의 후보값의 비를 이용한 피치검출 방법 및 그 장치 |
US20060100861A1 (en) | 2002-10-14 | 2006-05-11 | Koninkijkle Phillips Electronics N.V | Signal filtering |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
JP4252417B2 (ja) * | 2003-10-02 | 2009-04-08 | 住友重機械工業株式会社 | 成形機の監視装置及び監視方法 |
CA2454296A1 (en) * | 2003-12-29 | 2005-06-29 | Nokia Corporation | Method and device for speech enhancement in the presence of background noise |
KR100608062B1 (ko) * | 2004-08-04 | 2006-08-02 | 삼성전자주식회사 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
US7218240B2 (en) * | 2004-08-10 | 2007-05-15 | The Boeing Company | Synthetically generated sound cues |
US7545875B2 (en) | 2004-11-03 | 2009-06-09 | Nokia Corporation | System and method for space-time-frequency coding in a multi-antenna transmission system |
US7675873B2 (en) | 2004-12-14 | 2010-03-09 | Alcatel Lucent | Enhanced IP-voice conferencing |
US8082156B2 (en) * | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
CN101180676B (zh) * | 2005-04-01 | 2011-12-14 | 高通股份有限公司 | 用于谱包络表示的向量量化的方法和设备 |
US7630882B2 (en) | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
JP4736812B2 (ja) * | 2006-01-13 | 2011-07-27 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
KR101240261B1 (ko) | 2006-02-07 | 2013-03-07 | 엘지전자 주식회사 | 이동통신 단말기의 영상 통화 장치 및 방법 |
CN101149918B (zh) * | 2006-09-22 | 2012-03-28 | 鸿富锦精密工业(深圳)有限公司 | 具练唱功能的声音处理装置 |
JP2008096567A (ja) | 2006-10-10 | 2008-04-24 | Matsushita Electric Ind Co Ltd | オーディオ符号化装置およびオーディオ符号化方法ならびにプログラム |
DE602008001787D1 (de) * | 2007-02-12 | 2010-08-26 | Dolby Lab Licensing Corp | Verbessertes verhältnis von sprachlichen zu nichtsprachlichen audio-inhalten für ältere oder hörgeschädigte zuhörer |
JP4871894B2 (ja) | 2007-03-02 | 2012-02-08 | パナソニック株式会社 | 符号化装置、復号装置、符号化方法および復号方法 |
US8121535B2 (en) | 2007-03-02 | 2012-02-21 | Qualcomm Incorporated | Configuration of a repeater |
WO2009039897A1 (en) | 2007-09-26 | 2009-04-02 | Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V. | Apparatus and method for extracting an ambient signal in an apparatus and method for obtaining weighting coefficients for extracting an ambient signal and computer program |
US8509454B2 (en) | 2007-11-01 | 2013-08-13 | Nokia Corporation | Focusing on a portion of an audio scene for an audio signal |
KR100970446B1 (ko) * | 2007-11-21 | 2010-07-16 | 한국전자통신연구원 | 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법 |
US8223851B2 (en) | 2007-11-23 | 2012-07-17 | Samsung Electronics Co., Ltd. | Method and an apparatus for embedding data in a media stream |
CN101471072B (zh) * | 2007-12-27 | 2012-01-25 | 华为技术有限公司 | 高频重建方法、编码装置和解码装置 |
US8532998B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Selective bandwidth extension for encoding/decoding audio/speech signal |
US20110254913A1 (en) | 2008-12-24 | 2011-10-20 | Panasonic Corporation | Conferencing apparatus and communication setting method |
UA99878C2 (ru) * | 2009-01-16 | 2012-10-10 | Долби Интернешнл Аб | Гармоническое преобразование, усовершенствованное перекрестным произведением |
CN101527141B (zh) * | 2009-03-10 | 2011-06-22 | 苏州大学 | 基于径向基神经网络的耳语音转换为正常语音的方法 |
EP2239732A1 (en) * | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
US8223943B2 (en) | 2009-04-14 | 2012-07-17 | Citrix Systems Inc. | Systems and methods for computer and voice conference audio transmission during conference call via PSTN phone |
US8351589B2 (en) | 2009-06-16 | 2013-01-08 | Microsoft Corporation | Spatial audio for audio conferencing |
US8427521B2 (en) | 2009-10-21 | 2013-04-23 | At&T Intellectual Property I, L.P. | Method and apparatus for providing a collaborative workspace |
WO2011059432A1 (en) * | 2009-11-12 | 2011-05-19 | Paul Reed Smith Guitars Limited Partnership | Precision measurement of waveforms |
US8774787B2 (en) | 2009-12-01 | 2014-07-08 | At&T Intellectual Property I, L.P. | Methods and systems for providing location-sensitive conference calling |
SI2510515T1 (sl) | 2009-12-07 | 2014-06-30 | Dolby Laboratories Licensing Corporation | Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije |
US20110182415A1 (en) | 2010-01-28 | 2011-07-28 | Jacobstein Mark Williams | Methods and apparatus for providing call conferencing services |
MX2012001696A (es) * | 2010-06-09 | 2012-02-22 | Panasonic Corp | Metodo de extension de ancho de banda, aparato de extension de ancho de banda, programa, circuito integrado, y aparato de descodificacion de audio. |
JP6010539B2 (ja) * | 2011-09-09 | 2016-10-19 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 符号化装置、復号装置、符号化方法および復号方法 |
BR122021018240B1 (pt) * | 2012-02-23 | 2022-08-30 | Dolby International Ab | Método para codificar um sinal de áudio multicanal, método para decodificar um fluxo de bits de áudio codificado, sistema configurado para codificar um sinal de áudio, e sistema para decodificar um fluxo de bits de áudio codificado |
-
2013
- 2013-02-22 BR BR122021018240-0A patent/BR122021018240B1/pt active IP Right Grant
- 2013-02-22 US US14/372,733 patent/US9666200B2/en active Active
- 2013-02-22 JP JP2014558129A patent/JP6046169B2/ja active Active
- 2013-02-22 EP EP17190541.7A patent/EP3288033B1/en active Active
- 2013-02-22 BR BR112014020562-0A patent/BR112014020562B1/pt active IP Right Grant
- 2013-02-22 WO PCT/EP2013/053609 patent/WO2013124445A2/en active Application Filing
- 2013-02-22 CN CN201711320050.8A patent/CN107993673B/zh active Active
- 2013-02-22 CN CN201380010593.3A patent/CN104541327B/zh active Active
- 2013-02-22 KR KR1020147023193A patent/KR101679209B1/ko active IP Right Grant
- 2013-02-22 ES ES13705503.4T patent/ES2568640T3/es active Active
- 2013-02-22 EP EP15196734.6A patent/EP3029672B1/en active Active
- 2013-02-22 RU RU2014134317/08A patent/RU2601188C2/ru active
- 2013-02-22 KR KR1020167031826A patent/KR101816506B1/ko active IP Right Grant
- 2013-02-22 EP EP13705503.4A patent/EP2817803B1/en active Active
-
2016
- 2016-05-23 JP JP2016102645A patent/JP6334602B2/ja active Active
-
2017
- 2017-04-21 US US15/494,195 patent/US9984695B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3288033B1 (en) | 2019-04-10 |
EP3288033A1 (en) | 2018-02-28 |
US20150003632A1 (en) | 2015-01-01 |
EP3029672B1 (en) | 2017-09-13 |
EP2817803A2 (en) | 2014-12-31 |
JP2016173597A (ja) | 2016-09-29 |
CN107993673B (zh) | 2022-09-27 |
JP6334602B2 (ja) | 2018-05-30 |
JP6046169B2 (ja) | 2016-12-14 |
BR122021018240B1 (pt) | 2022-08-30 |
WO2013124445A2 (en) | 2013-08-29 |
EP2817803B1 (en) | 2016-02-03 |
RU2601188C2 (ru) | 2016-10-27 |
BR112014020562A2 (ru) | 2017-06-20 |
WO2013124445A3 (en) | 2013-11-21 |
CN107993673A (zh) | 2018-05-04 |
ES2568640T3 (es) | 2016-05-03 |
CN104541327B (zh) | 2018-01-12 |
US20170221491A1 (en) | 2017-08-03 |
JP2015508186A (ja) | 2015-03-16 |
EP3029672A2 (en) | 2016-06-08 |
EP3029672A3 (en) | 2016-06-29 |
KR20160134871A (ko) | 2016-11-23 |
KR101679209B1 (ko) | 2016-12-06 |
CN104541327A (zh) | 2015-04-22 |
KR20140116520A (ko) | 2014-10-02 |
US9984695B2 (en) | 2018-05-29 |
KR101816506B1 (ko) | 2018-01-09 |
BR112014020562B1 (pt) | 2022-06-14 |
US9666200B2 (en) | 2017-05-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2014134317A (ru) | Способы и системы для эффективного восстановления высокочастотного аудиоконтента | |
US7929708B2 (en) | Audio spatial environment engine | |
US8447597B2 (en) | Audio encoding device, audio decoding device, audio encoding method, and audio decoding method | |
JP4527716B2 (ja) | 複素指数変調フィルタバンクを基にした新型プロセッシングおよび適応型時間信号伝達方法 | |
RU2595544C2 (ru) | Устройство и способ кодирования, устройство и способ декодирования и программа | |
RU2670797C2 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
JP6061121B2 (ja) | オーディオ符号化装置、オーディオ符号化方法、およびプログラム | |
EP3343560A1 (en) | Audio coding device and audio coding method | |
MX2010008279A (es) | Metodo y aparato para calcular energia de banda alta en un sistema de extension de ancho de banda. | |
CN102201823B (zh) | 多通道音频信号处理 | |
CN101971249A (zh) | 用于计算音频信号的指纹、用于同步、以及用于表征测试音频信号的装置和方法 | |
MY156427A (en) | Device and method for postprocessing spectral values and encoder and decoder for audio signals | |
CN104221082A (zh) | 谐波音频信号的带宽扩展 | |
EP3179476B1 (en) | Coding device and method, and program | |
CN103366750A (zh) | 一种声音编解码装置及其方法 | |
CN102243876B (zh) | 预测残差信号的量化编码方法及装置 | |
RU2018118576A (ru) | Способ и устройство обработки сигналов | |
US20110116551A1 (en) | Apparatus and methods for processing compression encoded signals | |
JP2000122676A (ja) | 音楽信号の波形符号化方式 | |
RU2777660C2 (ru) | Способ и устройство для формирования из представления hoa-сигналов в области коэффициентов смешанного представления упомянутых hoa-сигналов в пространственной области/области коэффициентов | |
JP3725876B2 (ja) | オーディオ符号化器とその符号化処理プログラム | |
CN103971692A (zh) | 音频处理方法、装置及系统 |