RU2020123740A - Способы, устройство и системы для улучшения модуля гармонической транспозиции на основе qmf унифицированного декодирования и кодирования речи и звука - Google Patents

Способы, устройство и системы для улучшения модуля гармонической транспозиции на основе qmf унифицированного декодирования и кодирования речи и звука Download PDF

Info

Publication number
RU2020123740A
RU2020123740A RU2020123740A RU2020123740A RU2020123740A RU 2020123740 A RU2020123740 A RU 2020123740A RU 2020123740 A RU2020123740 A RU 2020123740A RU 2020123740 A RU2020123740 A RU 2020123740A RU 2020123740 A RU2020123740 A RU 2020123740A
Authority
RU
Russia
Prior art keywords
valued
complex
real
subband
samples
Prior art date
Application number
RU2020123740A
Other languages
English (en)
Other versions
RU2777304C2 (ru
Inventor
Раджат КУМАР
Рамеш КАТУРИ
Сакет САТУВАЛЛИ
Решма РАИ
Original Assignee
Долби Интернэшнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Интернэшнл Аб filed Critical Долби Интернэшнл Аб
Publication of RU2020123740A publication Critical patent/RU2020123740A/ru
Application granted granted Critical
Publication of RU2777304C2 publication Critical patent/RU2777304C2/ru

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • G10L19/07Line spectrum pair [LSP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Claims (97)

1. Устройство для декодирования закодированного потока унифицированного кодирования речи и звука (MPEG-D USAC) содержит
базовый декодер для декодирования закодированного потока унифицированного кодирования речи и звука (MPEG-D USAC);
причем базовый декодер включает в себя блок eSBR для расширения частотной полосы входного сигнала, блок eSBR включает в себя модуль гармонической транспозиции на основе QMF;
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью обрабатывать входной сигнал в области QMF в каждом из множества поддиапазонов синтеза для расширения частотной полосы входного сигнала; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью функционировать по меньшей мере частично на основе предварительно вычисленной информации, и
причем модуль гармонической транспозиции на основе QMF выполнен с дополнительной возможностью получать соответствующее комплексное выходное значение коэффициента усиления для каждого из множества поддиапазонов синтеза и применять комплексные выходные значения коэффициента усиления к их соответствующим поддиапазонам синтеза;
причем предварительно вычисленная информация относится к комплексным выходным значениям коэффициента усиления; и
причем комплексные выходные значения коэффициента усиления включают в себя действительные и мнимые части, к которым осуществляют доступ из одной или более поисковых таблиц во время выполнения,
причем поисковая таблица phase_vocoder_cos_tab обеспечена для действительных частей комплексных выходных значений коэффициента усиления, и поисковая таблица phase_vocoder_sin_tab обеспечена для мнимых частей комплексных выходных значений коэффициента усиления,
причем во время выполнения индекс поддиапазона k используется для ссылки на поисковые таблицы и извлечения подходящих действительных и мнимых частей, и
причем умножение для применения комплексных выходных значений коэффициента усиления выполняется на основе функции ixheaacd_qmf_hbe_apply, использующей поисковую таблицу phase_vocoder_cos_tab[k] для действительных частей и поисковую таблицу phase_vocoder_sin_tab[k] для мнимых частей.
2. Устройство по п. 1, в котором блок eSBR выполнен с возможностью восстанавливать компонент частоты верхнего диапазона входного сигнала на основе репликации последовательностей гармоник, которые были усечены во время кодирования, чтобы тем самым расширить частотную полосу входного сигнала.
3. Устройство по любому из пп. 1-2, в котором блок eSBR выполнен с возможностью управлять параметрическим представлением более высоких звуковых частот во входном сигнале.
4. Устройство по любому из пп. 1-3,
в котором множество поддиапазонов синтеза включает в себя нецелочисленные поддиапазоны синтеза с дробным индексом поддиапазона, и модуль гармонической транспозиции на основе QMF выполнен с возможностью обрабатывать отсчеты, извлеченные из входного сигнала, входной сигнал находится в этих нецелочисленных поддиапазонах синтеза;
причем предварительно вычисленная информация относится к коэффициентам интерполяции для интерполяции отсчетов в нецелочисленных поддиапазонах из отсчетов в соседних целочисленных поддиапазонах с целочисленными индексами поддиапазонов;
причем коэффициенты интерполяции определены автономно и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к коэффициентам интерполяции из одной или более поисковых таблиц во время выполнения.
5. Устройство по любому из пп. 1-4,
в котором модуль гармонической транспозиции на основе QMF содержит набор действительнозначных MS-канальных синтезирующих фильтров и набор комплекснозначных 2M-канальных анализирующих фильтров;
причем предварительно вычисленная информация относится к оконным коэффициентам для оконной обработки массивов отсчетов во время синтеза в наборе действительнозначных MS-канальных синтезирующих фильтров и/или во время анализа в наборе комплекснозначных 2M-канальных анализирующих фильтров;
причем оконные коэффициенты определены автономно на основе линейной интерполяции между сведенными в таблицу значениями для всех возможных значений MS или M, соответственно, и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к оконным коэффициентам из одной или более поисковых таблиц во время выполнения.
6. Устройство по любому из пп. 1-5,
в котором модуль гармонической транспозиции на основе QMF содержит набор действительнозначных MS-канальных синтезирующих фильтров;
причем набор действительнозначных MS-канальных синтезирующих фильтров выполнен с возможностью обрабатывать массив из MS действительнозначных отсчетов поддиапазона, чтобы получить массив из 2MS действительнозначных отсчетов поддиапазона, причем каждый действительнозначный отсчет поддиапазона среди MS действительнозначных отсчетов поддиапазона ассоциирован с соответствующим поддиапазоном среди MS поддиапазонов;
причем обработка массива из MS действительнозначных отсчетов поддиапазона включает в себя выполнение матрично-векторного умножения действительнозначной матрицы N и массива из MS действительнозначных отсчетов поддиапазона, причем элементы действительнозначной матрицы N зависят от индекса поддиапазона соответствующего отсчета поддиапазона, на который они умножаются при векторно-матричном умножении;
причем предварительно вычисленная информация относится к элементам действительнозначной матрицы для матрично-векторного умножения
причем элементы действительнозначной матрицы N определены автономно и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к элементам действительнозначной матрицы N из одной или более поисковых таблиц во время выполнения.
7. Устройство по любому из пп. 1-6,
в котором модуль гармонической транспозиции на основе QMF содержит набор комплекснозначных 2MS-канальных анализирующих фильтров;
причем набор комплекснозначных 2MS-канальных анализирующих фильтров выполнен с возможностью обрабатывать массив из 4MS отсчетов поддиапазона, чтобы получить массив из 2MS комплекснозначных отсчетов поддиапазона, причем каждый комплекснозначный отсчет поддиапазона среди 2MS действительнозначных отсчетов поддиапазона ассоциирован с соответствующим поддиапазоном среди 2MS поддиапазонов;
причем обработка массива из 4MS отсчетов поддиапазона включает в себя выполнение матрично-векторного умножения комплекснозначной матрицы M и массива из 4MS отсчетов поддиапазона, причем элементы комплекснозначной матрицы M зависят от индекса поддиапазона соответствующего отсчета поддиапазона среди 2MS комплекснозначных отсчетов поддиапазона, в которые эти матричные элементы вносят вклад при векторно-матричном умножении;
причем предварительно вычисленная информация относится к элементам комплекснозначной матрицы M для матрично-векторного умножения;
причем элементы комплекснозначной матрицы M определены автономно и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к элементам комплекснозначной матрицы M из одной или более поисковых таблиц во время выполнения.
8. Устройство по любому из пп. 1-7,
в котором модуль гармонической транспозиции на основе QMF содержит набор действительнозначных MS-канальных синтезирующих фильтров, выполненный с возможностью вычислять множество из MS действительнозначных отсчетов поддиапазона из множества из MS новых комплекснозначных отсчетов поддиапазона, причем каждый действительнозначный отсчет поддиапазона и каждый новый комплекснозначный отсчет поддиапазона ассоциированы с соответствующим поддиапазоном среди MS поддиапазонов;
причем вычисление множества MS действительнозначных отсчетов поддиапазона из множества из MS новых комплекснозначных отсчетов поддиапазона включает в себя для каждого из MS новых комплекснозначных отсчетов поддиапазона применение соответствующей комплексной экспоненты к этому новому комплекснозначному отсчету поддиапазона и извлечение его действительной части, причем соответствующая комплексная экспонента зависит от индекса поддиапазона этого нового комплекснозначного отсчета поддиапазона,
причем предварительно вычисленная информация относится к комплексным экспонентам для MS поддиапазонов;
причем комплексные экспоненты определены автономно и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к комплексным экспонентам из одной или более поисковых таблиц во время выполнения.
9. Устройство по любому из пп. 1-8,
в котором модуль гармонической транспозиции на основе QMF выполнен с возможностью извлекать отсчеты из поддиапазонов входного сигнала, получать значения коэффициента усиления векторного произведения для пар извлеченных отсчетов и применять значения коэффициента усиления векторного произведения к соответствующим парам извлеченных отсчетов;
причем предварительно вычисленная информация относится к значениям коэффициента усиления векторного произведения;
причем значения коэффициента усиления векторного произведения определены автономно на основе коэффициентов формулы усиления векторного произведения и сохранены в одной или более поисковых таблицах; и
причем модуль гармонической транспозиции на основе QMF выполнен с возможностью осуществлять доступ к значениям коэффициента усиления векторного произведения из одной или более поисковых таблиц во время выполнения.
10. Способ декодирования закодированного потока унифицированного кодирования речи и звука (MPEG-D USAC) содержит этап, на котором
декодируют закодированный поток унифицированного кодирования речи и звука (MPEG-D USAC);
причем декодирование включает в себя расширение частотной полосы входного сигнала,
причем расширение частотной полосы входного сигнала включает в себя обработку входного сигнала в области QMF в каждом из множества поддиапазонов синтеза,
причем обработка входного сигнала в области QMF функционирует по меньшей мере частично на основе предварительно вычисленной информации, и
причем обработка входного сигнала в области QMF, в каждом из множества поддиапазонов синтеза включает в себя получение соответствующего комплексного выходного значения коэффициента усиления для каждого из множества поддиапазонов синтеза и применение комплексных выходных значений коэффициента усиления к их соответствующим поддиапазонам синтеза;
причем предварительно вычисленная информация относится к комплексным выходным значениям коэффициента усиления; и
причем комплексные выходные значения коэффициента усиления включают в себя действительные и мнимые части, к которым осуществляют доступ из одной или более поисковых таблиц во время выполнения,
причем поисковая таблица phase_vocoder_cos_tab обеспечена для действительных частей комплексных выходных значений коэффициента усиления, и поисковая таблица phase_vocoder_sin_tab обеспечена для мнимых частей комплексных выходных значений коэффициента усиления,
причем во время выполнения индекс поддиапазона k используется для ссылки на поисковые таблицы и извлечения подходящих действительных и мнимых частей, и
причем умножение для применения комплексных выходных значений коэффициента усиления выполняется на основе функции ixheaacd_qmf_hbe_apply, использующей поисковую таблицу phase_vocoder_cos_tab[k] для действительных частей и поисковую таблицу phase_vocoder_sin_tab[k] для мнимых частей.
11. Способ по п. 10, в чем расширение частотной полосы входного сигнала включает в себя восстановление компонента частоты верхнего диапазона входного сигнала на основе репликации последовательностей гармоник, которые были усечены во время кодирования.
12. Способ по любому из пп. 10-11, в котором расширение частотной полосы входного сигнала включает в себя управление параметрическим представлением более высоких звуковых частот во входном сигнале.
13. Способ по любому из пп. 10-12,
в котором множество поддиапазонов синтеза включает в себя нецелочисленные поддиапазоны синтеза с дробным индексом поддиапазона, и модуль гармонической транспозиции на основе QMF выполнен с возможностью обрабатывать отсчеты, извлеченные из входного сигнала, входной сигнал находится в этих нецелочисленных поддиапазонах синтеза;
причем предварительно вычисленная информация относится к коэффициентам интерполяции для интерполяции отсчетов в нецелочисленных поддиапазонах из отсчетов в соседних целочисленных поддиапазонах с целочисленными индексами поддиапазонов;
причем коэффициенты интерполяции определены автономно и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к коэффициентам интерполяции из одной или более поисковых таблиц во время выполнения.
14. Способ по любому из пп. 10-13,
в котором обработка входного сигнала в области QMF в каждом из множества поддиапазонов синтеза включает в себя применение набора действительнозначных MS-канальных синтезирующих фильтров и набора комплекснозначных 2M-канальных анализирующих фильтров;
причем предварительно вычисленная информация относится к оконным коэффициентам для оконной обработки массивов отсчетов во время синтеза в наборе действительнозначных MS-канальных синтезирующих фильтров и/или во время анализа в наборе комплекснозначных 2M-канальных анализирующих фильтров;
причем оконные коэффициенты определены автономно на основе линейной интерполяции между сведенными в таблицу значениями для всех возможных значений MS или M, соответственно, и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к оконным коэффициентам из одной или более поисковых таблиц во время выполнения.
15. Способ по любому из пп. 10-14,
причем обработка входного сигнала в области QMF в каждом из множества поддиапазонов синтеза включает в себя применение набора действительнозначных MS-канальных синтезирующих фильтров;
причем набор действительнозначных MS-канальных синтезирующих фильтров обрабатывает массив из MS действительнозначных отсчетов поддиапазона, чтобы получить массив из 2MS действительнозначных отсчетов поддиапазона, причем каждый действительнозначный отсчет поддиапазона среди MS действительнозначных отсчетов поддиапазона ассоциирован с соответствующим поддиапазоном среди MS поддиапазонов;
причем обработка массива из MS действительнозначных отсчетов поддиапазона включает в себя выполнение матрично-векторного умножения действительнозначной матрицы N и массива из MS действительнозначных отсчетов поддиапазона, причем элементы действительнозначной матрицы N зависят от индекса поддиапазона соответствующего отсчета поддиапазона, на который они умножаются при векторно-матричном умножении;
причем предварительно вычисленная информация относится к элементам действительнозначной матрицы для матрично-векторного умножения;
причем элементы действительнозначной матрицы N определены автономно и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к элементам действительнозначной матрицы N из одной или более поисковых таблиц во время выполнения.
16. Способ по любому из пп. 10-15,
в котором обработка входного сигнала в области QMF в каждом из множества поддиапазонов синтеза включает в себя применение набора комплекснозначных 2MS-канальных анализирующих фильтров;
причем набор комплекснозначных 2MS-канальных анализирующих фильтров обрабатывает массив из 4MS отсчетов поддиапазона, чтобы получить массив из 2MS комплекснозначных отсчетов поддиапазона, причем каждый комплекснозначный отсчет поддиапазона среди 2MS действительнозначных отсчетов поддиапазона ассоциирован с соответствующим поддиапазоном среди 2MS поддиапазонов;
причем обработка массива из 4MS отсчетов поддиапазона включает в себя выполнение матрично-векторного умножения комплекснозначной матрицы M и массива из 4MS отсчетов поддиапазона, причем элементы комплекснозначной матрицы M зависят от индекса поддиапазона соответствующего отсчета поддиапазона среди 2MS комплекснозначных отсчетов поддиапазона, в которые эти матричные элементы вносят вклад при векторно-матричном умножении;
причем предварительно вычисленная информация относится к элементам комплекснозначной матрицы M для матрично-векторного умножения;
причем элементы комплекснозначной матрицы M определены автономно и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к элементам комплекснозначной матрицы M из одной или более поисковых таблиц во время выполнения.
17. Способ по любому из пп. 10-16,
причем обработка входного сигнала в области QMF в каждом из множества поддиапазонов синтеза включает в себя применение набора действительнозначных MS-канальных синтезирующих фильтров, выполненных с возможностью вычислять множество из MS действительнозначных отсчетов поддиапазона из множества из MS новых комплекснозначных отсчетов поддиапазона, причем каждый действительнозначный отсчет поддиапазона и каждый новый комплекснозначный отсчет поддиапазона ассоциированы с соответствующим поддиапазоном среди MS поддиапазонов;
причем вычисление множества MS действительнозначных отсчетов поддиапазона из множества из MS новых комплекснозначных отсчетов поддиапазона включает в себя для каждого из MS новых комплекснозначных отсчетов поддиапазона применение соответствующей комплексной экспоненты к этому новому комплекснозначному отсчету поддиапазона и извлечение его действительной части, причем соответствующая комплексная экспонента зависит от индекса поддиапазона этого нового комплекснозначного отсчета поддиапазона,
причем предварительно вычисленная информация относится к комплексным экспонентам для MS поддиапазонов;
причем комплексные экспоненты определены автономно и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к комплексным экспонентам из одной или более поисковых таблиц во время выполнения.
18. Способ по любому из пп. 10-17,
в котором обработка входного сигнала в области QMF в каждом из множества поддиапазонов синтеза включает в себя извлечение отсчетов из поддиапазонов входного сигнала, получение значений коэффициента усиления векторного произведения для пар извлеченных отсчетов и применение значений коэффициента усиления векторного произведения к соответствующим парам извлеченных отсчетов;
причем предварительно вычисленная информация относится к значениям коэффициента усиления векторного произведения;
причем значения коэффициента усиления векторного произведения определены автономно на основе коэффициентов формулы усиления векторного произведения и сохранены в одной или более поисковых таблицах; и
причем способ содержит доступ к значениям коэффициента усиления векторного произведения из одной или более поисковых таблиц во время выполнения.
19. Носитель информации, содержащий программу, выполненную с возможностью исполнения на процессоре и выполнения этапов способа по любому из пп. 10-18 при ее выполнении на вычислительном устройстве.
RU2020123740A 2017-12-19 2018-12-19 Способы, устройство и системы для улучшения модуля гармонической транспозиции на основе qmf унифицированного декодирования и кодирования речи и звука RU2777304C2 (ru)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
IN201741045576 2017-12-19
IN201741045576 2017-12-19
US201862665741P 2018-05-02 2018-05-02
US62/665,741 2018-05-02
PCT/EP2018/085940 WO2019121982A1 (en) 2017-12-19 2018-12-19 Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements

Publications (2)

Publication Number Publication Date
RU2020123740A true RU2020123740A (ru) 2022-01-20
RU2777304C2 RU2777304C2 (ru) 2022-08-02

Family

ID=

Also Published As

Publication number Publication date
WO2019121982A1 (en) 2019-06-27
US20210020186A1 (en) 2021-01-21
US11315584B2 (en) 2022-04-26
CN111670473A (zh) 2020-09-15
ZA202003646B (en) 2022-12-21
JP7326285B2 (ja) 2023-08-15
KR20200099560A (ko) 2020-08-24
JP2021508076A (ja) 2021-02-25
BR112020012654A2 (pt) 2020-12-01
EP3729427A1 (en) 2020-10-28

Similar Documents

Publication Publication Date Title
JP6543640B2 (ja) エンコーダ、デコーダ並びに符号化及び復号方法
US11640827B2 (en) Concept for encoding of information
JP2007526691A (ja) 信号解析及び合成のための適応型混合変換
CN102915739A (zh) 用于对高频信号进行编码和解码的方法和设备
KR100776235B1 (ko) 변환 표시로의 변환 또는 변환 표시의 역변환을 위한 장치및 방법
CN101622663B (zh) 编码装置以及编码方法
JP2021157202A5 (ru)
Wang et al. A temporal-spectral generative adversarial network based end-to-end packet loss concealment for wideband speech transmission
RU2020123740A (ru) Способы, устройство и системы для улучшения модуля гармонической транспозиции на основе qmf унифицированного декодирования и кодирования речи и звука
EP2784776B1 (en) Orthogonal transform apparatus, orthogonal transform method, orthogonal transform computer program, and audio decoding apparatus
WO2021244409A1 (zh) 一种声波信号解码的方法及装置
CN105849802B (zh) 用于正交镜像滤波的方法和装置
Badeau et al. Probabilistic time-frequency source-filter decomposition of non-stationary signals
Chivukula Fast algorithms for MDCT and low delay filterbanks used in audio coding
CN103415883B (zh) 用于低频效果声道的减少复杂性变换
TWI470622B (zh) 用於低頻效應頻道降低複雜度之轉換
Zantalis et al. Semi-Blind Audio Source Separation of Linearly Mixed Two-Channel Recordings via Guided Matching Pursuit.
AL-ASHKAR et al. SPEECH NOISE SEPARATION USING NON-NEGATIVE MATRIX FACTORIZATION
AU2012238001A1 (en) Reduced complexity transform for a low-frequency-effects channel