RU2719285C1 - Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом - Google Patents

Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом Download PDF

Info

Publication number
RU2719285C1
RU2719285C1 RU2019105570A RU2019105570A RU2719285C1 RU 2719285 C1 RU2719285 C1 RU 2719285C1 RU 2019105570 A RU2019105570 A RU 2019105570A RU 2019105570 A RU2019105570 A RU 2019105570A RU 2719285 C1 RU2719285 C1 RU 2719285C1
Authority
RU
Russia
Prior art keywords
samples
overlapping
audio signal
subband
block
Prior art date
Application number
RU2019105570A
Other languages
English (en)
Inventor
Нильс ВЕРНЕР
Бернд ЭДЛЕР
Original Assignee
Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф.
Application granted granted Critical
Publication of RU2719285C1 publication Critical patent/RU2719285C1/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Изобретение относится к средствам для обработки аудиосигнала. Технический результат заключается в повышении эффективности обработки аудиосигнала за счет уменьшения избыточности и задержки. Выполняют каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Выполняют комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала. Выполняют перекрывающиеся критически дискретизированные преобразования для первого блока выборок и второго блока выборок по меньшей мере из двух частично перекрывающихся блоков выборок аудиосигнала. 13 н. и 8 з.п. ф-лы, 14 ил.

Description

Варианты осуществления относятся к аудиопроцессору/способу обработки аудиосигнала для получения поддиапазонное представление аудиосигнала. Дополнительные варианты осуществления относятся к аудиопроцессору/способу обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Некоторые варианты осуществления относятся к уменьшению наложения спектров во временной области в поддиапазонах частот неравномерных ортогональных гребенок фильтров на основе анализа/синтеза на основе MDCT (MDCT=модифицированное дискретное косинусное преобразование), например, в поддиапазонах частот неравномерных ортогональных гребенок MDCT-фильтров.
MDCT широко используется в вариантах применения для кодирования аудио вследствие своих свойств, таких как хорошее энергетическое уплотнение и ортогональность, при использовании перекрывающимся способом. Тем не менее, MDCT демонстрирует равномерное частотно-временное разрешение [J. Princen, A. Johnson и A. Bradley, "Subband/transform coding using filter bank designs based on time domain aliasing cancellation", in Acoustics, Speech and Signal Processing, IEEE International Conference on ICASSP '87, апрель 1987 года, издание 12, стр. 2161-2164]. Тем не менее, при выполнении перцепционно обусловленной аудиообработки, неравномерное частотно-временное разрешение может быть более желательным представлением.
Один способ проектирования неравномерного преобразования представляет собой повторное применение одного из нескольких равномерных преобразований.
Для поддиапазонного объединения, сначала применяется длинное преобразование, преобразование сигнала из временной в спектральную область. Результат представляет собой спектр с высоким спектральным, но низким временным разрешением. Впоследствии, несколько спектральных элементов разрешения преобразуются обратно во временную область. Это увеличивает временное разрешение при сокращении спектрального разрешения в этом выбранном поддиапазоне частот.
Поддиапазонное разбиение представляет собой комплементарную операцию: сначала применяется короткое преобразование. Результат представляет собой спектр с низким спектральным, но высоким временным разрешением. Впоследствии, спектральные элементы разрешения двух или более смежных кадров преобразования преобразуются снова, увеличивая свое спектральное разрешение за счет временного разрешения.
Эти этапы могут смешиваться и повторяться при необходимости. Выбор преобразования может быть произвольным; тем не менее, для каждого этапа обычно выбираются одинаковые или аналогичные преобразования.
Предусмотрено множество способов упрощения неравномерных частотно-временных преобразований:
При использовании двух последовательных быстрых преобразований Фурье, существует ERBLet-преобразование, преобразование с поддиапазонным объединением со шкалой частот ERB [T. Necciari, P. Balazs, N. Holighaus и P.L. Sondergaard, "The erblet transform: An auditory-based time-frequency representation with perfect reconstruction", in Acoustics, Speech and Signal Processing (ICASSP), 2013 IEEE International Conference on, май 2013 года, стр. 498-502]. В последнее время те же авторы распространяют свой подход на спектр дискретного косинусного преобразования типа 4 (DCT4) и MDCT-преобразование с поддиапазонным объединением [Olivier Derrien, Thibaud Necciari и Peter Balazs, "A quasi-orthogonal, invertible and perceptually relevant time-frequency transform for audio coding", in EUSIPCO, Ницца, Франция, август 2015 года].
Тем не менее, оба подхода спроектированы таким образом, что они требуют очень длинных перекрывающихся окон преобразования на основе кодирования со взвешиванием с некритической дискретизацией или даже преобразованием всего сигнала за один этап. Эти длинные окна преобразования на основе кодирования со взвешиванием и некритическая дискретизация запрещают точную временную локализацию в области преобразования и приводят к тому, что они являются неподходящими для вариантов применения кодирования вследствие большого упреждающего просмотра и высокой избыточности.
Технология поддиапазонного объединения с использованием MDCT и элементов на основе принципа «бабочки» для комбинирования выбранных коэффициентов одного MDCT-кадра, введена в [J. Mau, J. Valot и D. Minaud, "Time-varying orthogonal filter banks without transient filters", in Proceedings of the Acoustics, Speech and Signal Processing, 1995 год, On International Conference - Volume 02, Вашингтон, округ Колумбия, США, 1995 г., ICASSP '95, стр. 1328-1331, EEE Computer Society] и обобщена до матриц Адамара в [O.A. Niamut и R. Heusdens, "Flexible frequency decompositions for cosine-modulated filter banks", in Acoustics, Speech and Signal Processing, 2003 год, Proceedings (ICASSP '03), 2003 IEEE International Conference on, апрель 2003 г., издание 5, стр. V-449-52, издание 5]. Комплементарная операция поддиапазонного разбиения введена в [Jean-Marc Valin, Gregory Maxwell, Timothy B. Terriberry и Koen Vos, "High-quality, low-delay music coding in the opus codec", in Audio Engineering Society Convention 135, октябрь 2013 г.].
При обеспечении возможности прямой интеграции в общие конвейеры перекрывающегося MDCT-преобразования, эти реализации на основе принципа «бабочки» и матрицы Адамара обеспечивают только проектные решения с очень ограниченной шкалой частот, например, с размерами, ограниченными до k=2n с n∈N. Кроме того, матрица Адамара лишь очень примерно аппроксимирует DCT и в силу этого обеспечивает лишь очень ограниченное временно-спектральное разрешение, как подробнее описано ниже.
Кроме того, хотя некоторые из этих способов используют MDCT, они не пытаются уменьшать результирующее наложение спектров в поддиапазонах частот, формируя размытую временную компактность результирующего импульса гребенки фильтров.
Следовательно, задача настоящего изобретения состоит в создании принципа, обеспечивающего по меньшей мере одно из улучшенной временной компактности импульсной характеристики, обработки произвольных шкал частот и уменьшенной избыточности и задержки.
Эта задача решается посредством независимых пунктов формулы изобретения.
Варианты осуществления предусматривают аудиопроцессор для обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Аудиопроцессор содержит каскад каскадного перекрывающегося критически дискретизированного преобразования и каскад уменьшения наложения спектров во временной области. Каскад каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Каскад уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
Дополнительные варианты осуществления предусматривают аудиопроцессор для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Аудиопроцессор содержит каскад обратного уменьшения наложения спектров во временной области и каскад каскадного обратного перекрывающегося критически дискретизированного преобразования. Каскад обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок. Каскад каскадного обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.
Согласно принципу настоящего изобретения, дополнительный каскад постобработки добавляется в конвейер перекрывающегося критически дискретизированного преобразования (например, MDCT), причем дополнительный каскад постобработки содержит другое перекрывающееся критически дискретизированное преобразование (например, MDCT) вдоль частотной оси и уменьшение наложения спектров во временной области вдоль каждой поддиапазонной временной оси. Это обеспечивает возможность извлечения произвольных шкал частот из спектрограммы перекрывающегося критически дискретизированного преобразования (например, MDCT) с улучшенной временной компактностью импульсной характеристики, при отсутствии введения дополнительной избыточности и уменьшенной кадровой задержки перекрывающегося критически дискретизированного преобразования.
Дополнительные варианты осуществления предусматривают способ обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Способ содержит:
- выполнение каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и
- выполнение комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
Дополнительные варианты осуществления предусматривают способ обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Способ содержит:
- выполнение комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок; и
- выполнение каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.
Предпочтительные реализации рассмотрены в зависимых пунктах формулы изобретения.
Ниже описаны предпочтительные реализации аудиопроцессора для обработки аудиосигнала для получения поддиапазонного представления аудиосигнала.
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование), MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование).
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может содержать первый каскад перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока выборок и второго блока выборок по меньшей мере из двух частично перекрывающихся блоков выборок аудиосигнала для получения первого набора элементов разрешения для первого блока выборок и второго набора элементов разрешения (перекрывающихся критически дискретизированных коэффициентов) для второго блока выборок.
Первый каскад перекрывающегося критически дискретизированного преобразования может представлять собой первый MDCT-, MDST- или MLT-каскад.
Каскад каскадного перекрывающегося критически дискретизированного преобразования дополнительно может содержать второй каскад перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента (собственного поднабора) первого набора элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента (собственного поднабора) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения набора поддиапазонных выборок для первого набора элементов разрешения и набора поддиапазонных выборок для второго набора элементов разрешения.
Второй каскад перекрывающегося критически дискретизированного преобразования может представлять собой второй MDCT-, MDST- или MLT-каскад.
В силу этого, первый и второй каскады перекрывающегося критически дискретизированного преобразования могут иметь одинаковый тип, т.е. представлять собой один из MDCT-, MDST- или MLT-каскадов.
В вариантах осуществления, второй каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов (собственных поднаборов) первого набора элементов разрешения и выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов (собственных поднаборов) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения по меньшей мере двух наборов поддиапазонных выборок для первого набора элементов разрешения и по меньшей мере двух наборов поддиапазонных выборок для второго набора элементов разрешения.
В силу этого, первый набор поддиапазонных выборок может представлять собой результат первого перекрывающегося критически дискретизированного преобразования на основе первого сегмента первого набора элементов разрешения, при этом второй набор поддиапазонных выборок может представлять собой результат второго перекрывающегося критически дискретизированного преобразования на основе второго сегмента первого набора элементов разрешения, при этом третий набор поддиапазонных выборок может представлять собой результат третьего перекрывающегося критически дискретизированного преобразования на основе первого сегмента второго набора элементов разрешения, при этом четвертый набор поддиапазонных выборок может представлять собой результат четвертого перекрывающегося критически дискретизированного преобразования на основе второго сегмента второго набора элементов разрешения. Каскад уменьшения наложения спектров во временной области может быть выполнен с возможностью выполнения комбинирования со взвешиванием первого набора поддиапазонных выборок и третьего набора поддиапазонных выборок для получения первого поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и выполнения комбинирования со взвешиванием второго набора поддиапазонных выборок и четвертого набора поддиапазонных выборок для получения второго поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку выборок, при этом каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе второго блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку выборок, при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку выборок, при этом каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе второго блока выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку выборок, при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования выборок аудиосигнала на первый блок выборок и второй блок выборок с использованием первой функции кодирования со взвешиванием, при этом каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок, и набора элементов разрешения, полученного на основе второго блока выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок, при этом первая функция кодирования со взвешиванием и вторая функция кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
В вариантах осуществления, каскад каскадного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования выборок аудиосигнала на первый блок выборок и второй блок выборок с использованием первой функции кодирования со взвешиванием, при этом каскад перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью сегментирования набора элементов разрешения, полученного на основе первого блока выборок, и набора элементов разрешения, полученного на основе второго блока выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга на коэффициент, отличный от степени двух.
Ниже описаны предпочтительные реализации аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала.
В вариантах осуществления, каскад обратного каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад обратного каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование), MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование).
В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора элементов разрешения, ассоциированного с данной поддиапазоном частот аудиосигнала.
Первый каскад обратного перекрывающегося критически дискретизированного преобразования может представлять собой первый обратный MDCT-, MDST- или MLT-каскад.
В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад суммирования с перекрытием, выполненный с возможностью выполнения конкатенации набора элементов разрешения, ассоциированного с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора элементов разрешения, ассоциированного с данной поддиапазоном частот аудиосигнала, с набором элементов разрешения, ассоциированным с другой поддиапазоном частот аудиосигнала, для получения набора элементов разрешения, ассоциированного с блоком выборок аудиосигнала.
В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора элементов разрешения, ассоциированных с блоком выборок аудиосигнала, для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.
Второй каскад обратного перекрывающегося критически дискретизированного преобразования может представлять собой второй обратный MDCT-, MDST- или MLT-каскад.
В силу этого, первый и второй каскады обратного перекрывающегося критически дискретизированного преобразования могут иметь одинаковый тип, т.е. представлять собой один из обратных MDCT-, MDST- или MLT-каскадов.
В вариантах осуществления, каскад каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора выборок, ассоциированных с блоком выборок аудиосигнала, и другого набора выборок, ассоциированных с другим блоком выборок аудиосигнала, причем блок выборок и другой блок выборок аудиосигнала частично перекрываются, для получения аудиосигнала.
Варианты осуществления настоящего изобретения описаны в данном документе со ссылкой на прилагаемые чертежи.
Фиг. 1 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно варианту осуществления;
Фиг. 2 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления;
Фиг. 3 показывает принципиальную блок-схему аудиопроцессора, выполненного с возможностью обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления;
Фиг. 4 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно варианту осуществления;
Фиг. 5 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно дополнительному варианту осуществления;
Фиг. 6 показывает принципиальную блок-схему аудиопроцессора для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно дополнительному варианту осуществления;
Фиг. 7 показывает на схемах пример поддиапазонных выборок (верхний график) и распределение их выборок по времени и частоте (нижний график);
Фиг. 8 показывает на схеме спектральную и временную неопределенность, полученную посредством нескольких различных преобразований;
Фиг. 9 показывает на схемах сравнение двух примерных импульсных характеристик, сформированных посредством поддиапазонного объединения с и без TDAR, простых коротких MDCT-блоков и поддиапазонного объединения на основе матрицы Адамара;
Фиг. 10 показывает блок-схему способа обработки аудиосигнала для получения поддиапазонного представления аудиосигнала согласно варианту осуществления;
Фиг. 11 показывает блок-схему способа обработки поддиапазонного представления аудиосигнала для получения аудиосигнала согласно варианту осуществления;
Фиг. 12 показывает принципиальную блок-схему аудиокодера, согласно варианту осуществления;
Фиг. 13 показывает принципиальную блок-схему аудиодекодера, согласно варианту осуществления;
Фиг. 14 показывает принципиальную блок-схему аудиоанализатора, согласно варианту осуществления.
Одинаковые или эквивалентные элементы либо элементы с одинаковой или эквивалентной функциональностью обозначены в нижеприведенном описании одинаковыми или эквивалентными ссылочными позициями.
В нижеприведенном описании приведено множество подробностей для обеспечения более полного пояснения вариантов осуществления настоящего изобретения. Тем не менее, специалистам в данной области техники должно быть очевидным, что варианты осуществления настоящего изобретения могут быть использованы на практике без этих конкретных подробностей. В других случаях, известные структуры и устройства показаны в форме блок-схемы, а не подробно, чтобы не затруднять понимание вариантов осуществления настоящего изобретения. Помимо этого, признаки различных вариантов осуществления, описанных ниже, могут комбинироваться между собой, если прямо не указано иное.
Фиг. 1 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно варианту осуществления. Аудиопроцессор 100 содержит каскад 104 каскадного перекрывающегося критически дискретизированного преобразования (LCST) и каскад 106 уменьшения наложения спектров во временной области (TDAR).
Каскад 104 каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков 108_1 и 108_2 выборок аудиосигнала 102 для получения набора 110_1,1 поддиапазонных выборок на основе первого блока 108_1 выборок (по меньшей мере из двух перекрывающихся блоков 108_1 и 108_2 выборок) аудиосигнала 102 и получения соответствующего набора 110_2,1 поддиапазонных выборок на основе второго блока 108_2 выборок (по меньшей мере из двух перекрывающихся блоков 108_1 и 108_2 выборок) аудиосигнала 102.
Каскад 104 уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов 110_1,1 и 110_2,1 поддиапазонных выборок (т.е. поддиапазонных выборок, соответствующих тому же поддиапазону частот), причем один из них получен на основе первого блока 108_1 выборок аудиосигнала 102 и один из них получен на основе второго блока 108_2 выборок аудиосигнала, для получения поддиапазонного представления 112_1 с уменьшенным наложением спектров аудиосигнала 102.
В вариантах осуществления, каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать по меньшей мере два каскада каскадного перекрывающегося критически дискретизированного преобразования, или другими словами, причем два каскада перекрывающегося критически дискретизированного преобразования соединяются каскадным способом.
Каскад каскадного перекрывающегося критически дискретизированного преобразования может представлять собой каскад каскадного MDCT (MDCT=модифицированное дискретное косинусное преобразование). Каскадный MDCT-каскад может содержать по меньшей мере два MDCT-каскада.
Естественно, каскад каскадного перекрывающегося критически дискретизированного преобразования также может представлять собой каскад каскадного MDST (MDST=модифицированное дискретное синусное преобразование) или MLT (MLT=модулированное перекрывающееся преобразование), содержащий по меньшей мере два MDST- или MLT-каскада, соответственно.
Два соответствующих набора 110_1,1 и 110_2,1 поддиапазонных выборок могут представлять собой поддиапазонные выборки, соответствующие тому же поддиапазону частот (т.е. диапазону частот).
Фиг. 2 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления.
Как показано на фиг. 2, каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать первый каскад 120 перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока 108_1 (2M) выборок (xi-1(n), 0≤n≤2M-1) и второй блок 108_2 (2M) выборок (xi(n), 0≤n≤2M-1) по меньшей мере из двух частично перекрывающихся блоков 108_1 и 108_2 выборок аудиосигнала 102, для получения первого набора 124_1 (M) элементов разрешения (LCST-коэффициентов) (Xi-1(k), 0≤k≤M-1) для первого блока 108_1 выборок и второго набора 124_2 (M) элементов разрешения (LCST-коэффициентов) (Xi(k), 0≤k≤M-1) для второго блока 108_2 выборок.
Каскад 104 каскадного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 126 перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента 128_1,1 (собственного поднабора) (Xv,i-1(k)) первого набора 124_1 элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента 128_2,1 (собственного поднабора) (Xv,i(k)) второго набора 124_2 элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала 102, для получения набора 110_1,1 поддиапазонных выборок [ŷv,i-1(m)] для первого набора 124_1 элементов разрешения и набора 110_2,1 поддиапазонных выборок (ŷv,i(m)) для второго набора 124_2 элементов разрешения.
Фиг. 3 показывает принципиальную блок-схему аудиопроцессора 100, выполненного с возможностью обработки аудиосигнала 102 для получения поддиапазонного представления аудиосигнала, согласно дополнительному варианту осуществления. Другими словами, фиг. 3 показывает схему гребенки аналитических фильтров. В силу этого, предполагаются соответствующие функции кодирования со взвешиванием. Следует отметить, что для простоты, на фиг. 3 указывается (только) обработка первой половины поддиапазонного кадра (y[m], 0<=m<N/2) (т.е. только первая строка уравнения (6)).
Как показано на фиг. 3, первый каскад 120 перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения первого перекрывающегося критически дискретизированного преобразования 122_1 (например, MDCT i-1) для первого блока 108_1 (2M) выборок (xi-1(n), 0≤n≤2M-1) для получения первого набора 124_1 (M) элементов разрешения (LCST-коэффициентов) (Xi-1(k), 0≤k≤M-1) для первого блока 108_1 выборок, и выполнения второго перекрывающегося критически дискретизированного преобразования 122_2 (например, MDCT i) для второго блока 108_2 (2M) выборок (xi(n), 0≤n≤2M-1) для получения второго набора 124_2 (M) элементов разрешения (LCST-коэффициентов) (Xi(k), 0≤k≤M-1) для второго блока 108_2 выборок.
Подробно, второй каскад 126 перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов 128_1,1 и 128_1,2 (собственных поднаборов) (Xv,i-1(k)) первого набора 124_1 элементов разрешения и выполнения перекрывающихся критически дискретизированных преобразований по меньшей мере для двух частично перекрывающихся сегментов 128_2,1 и 128_2,2 (собственных поднаборов) (Xv,i(k)) второго набора элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала, для получения по меньшей мере двух наборов 110_1,1 и 110_1,2 поддиапазонных выборок (ŷv,i-1(m)) для первого набора 124_1 элементов разрешения и по меньшей мере двух наборов 110_2,1 и 110_2,2 поддиапазонных выборок (ŷv,i(m)) для второго набора 124_2 элементов разрешения.
Например, первый набор 110_1,1 поддиапазонных выборок может представлять собой результат первого перекрывающегося критически дискретизированного преобразования 132_1,1 на основе первого сегмента 132_1,1 первого набора 124_1 элементов разрешения, при этом второй набор 110_1,2 поддиапазонных выборок может представлять собой результат второго перекрывающегося критически дискретизированного преобразования 132_1,2 на основе второго сегмента 128_1,2 первого набора 124_1 элементов разрешения, при этом третий набор 110_2,1 поддиапазонных выборок может представлять собой результат третьего перекрывающегося критически дискретизированного преобразования 132_2,1 на основе первого сегмента 128_2,1 второго набора 124_2 элементов разрешения, при этом четвертый набор 110_2,2 поддиапазонных выборок может представлять собой результат четвертого перекрывающегося критически дискретизированного преобразования 132_2,2 на основе второго сегмента 128_2,2 второго набора 124_2 элементов разрешения.
В силу этого, каскад 106 уменьшения наложения спектров во временной области может быть выполнен с возможностью выполнения комбинирования со взвешиванием первого набора 110_1,1 поддиапазонных выборок и третьего набора 110_2,1 поддиапазонных выборок для получения первого поддиапазонного представления 112_1 с уменьшенным наложением спектров (y1,i[m1]) аудиосигнала, при этом каскад 106 уменьшения наложения спектров в области может быть выполнен с возможностью выполнения комбинирования со взвешиванием второго набора 110_1,2 поддиапазонных выборок и четвертого набора 110_2,2 поддиапазонных выборок для получения второго поддиапазонного представления 112_2 с уменьшенным наложением спектров (y2,i[m2]) аудиосигнала.
Фиг. 4 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно варианту осуществления. Аудиопроцессор 200 содержит каскад 202 обратного уменьшения наложения спектров во временной области (TDAR) и каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования (LCST).
Каскад 202 обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений 112_1 и 112_2 с уменьшенным наложением спектров (yv,i(m), yv,i-1(m)) аудиосигнала 102 для получения поддиапазонного представления 110_1 с наложением спектров (ŷv,i(m)), при этом поддиапазонное представление с наложением спектров представляет собой набор 110_1 поддиапазонных выборок.
Каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора 110_1 поддиапазонных выборок для получения набора выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102.
Фиг. 5 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно дополнительному варианту осуществления. Каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования (LCST) и первый каскад 210 суммирования с перекрытием.
Первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования может быть выполнен с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора 110_1,1 поддиапазонных выборок для получения набора 128_1,1 элементов разрешения, ассоциированных с данной поддиапазоном частот аудиосигнала (
Figure 00000001
v,i(k)).
Первый каскад 210 суммирования с перекрытием может быть выполнен с возможностью выполнения конкатенации наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора 128_1,1 элементов (
Figure 00000001
v,i(k)) разрешения, ассоциированных с данной поддиапазоном (v) частот аудиосигнала 102, с набором 128_1,2 элементов (
Figure 00000001
v-1,(k)) разрешения, ассоциированных с другой поддиапазоном (v-1) частот аудиосигнала 102, для получения набора 124_1 элементов разрешения, ассоциированных с блоком 108_1 выборок аудиосигнала 102.
Как показано на фиг. 5, каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования (LCST), выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора 124_1 элементов разрешения, ассоциированных с блоком 108_1 выборок аудиосигнала 102, для получения набора 206_1,1 выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102.
Кроме того, каскад 204 каскадного обратного перекрывающегося критически дискретизированного преобразования может содержать второй каскад 214 суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора 206_1,1 выборок, ассоциированных с блоком 108_1 выборок аудиосигнала 102, и другого набора 206_2,1 выборок, ассоциированных с другим блоком 108_2 выборок аудиосигнала, причем блок 108_1 выборок и другой блок 108_2 выборок аудиосигнала 102 частично перекрываются, для получения аудиосигнала 102.
Фиг. 6 показывает принципиальную блок-схему аудиопроцессора 200 для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала 102 согласно дополнительному варианту осуществления. Другими словами, фиг. 6 показывает схему гребенки синтезирующих фильтров. В силу этого, предполагаются соответствующие функции кодирования со взвешиванием. Следует отметить, что для простоты, на фиг. 6 указывается (только) обработка первой половины поддиапазонного кадра (y[m], 0<=m<N/2) (т.е. только первая строка уравнения (6)).
Как описано выше, аудиопроцессор 200 содержит каскад 202 обратного уменьшения наложения спектров во временной области и каскад 204 обратного каскадного перекрывающегося критически дискретизированного преобразования, содержащий первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования и второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования.
Каскад 104 обратного уменьшения во временной области выполнен с возможностью выполнения первого комбинирования 220_1 со взвешиванием и сдвигом первого и второго поддиапазонных представлений y1,i-1[m1] и y1,i[m1] с уменьшенным наложением спектров для получения первого поддиапазонного представления 110_1,1 ŷ1,i[m1] с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок, и выполнения второго комбинирования 220_2 со взвешиванием и сдвигом третьего и четвертого поддиапазонных представлений y2,i-1[m1] и y2,i[m1] с уменьшенным наложением спектров для получения второго поддиапазонного представления 110_2,1 ŷ2,i[m1] с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок.
Первый каскад 208 обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения первого обратного перекрывающееся критически дискретизированного преобразования 222_1 для первого набора 110_1,1 ŷ1,i[m1] поддиапазонных выборок для получения набора 128_1,1 элементов разрешения, ассоциированных с данной поддиапазоном частот аудиосигнала (
Figure 00000001
1,1(k)), и выполнения второго обратного перекрывающегося критически дискретизированного преобразования 222_2 для второго набора 110_2,1 ŷ2,i[m1] поддиапазонных выборок для получения набора 128_2,1 элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (
Figure 00000001
2,1(k)).
Второй каскад 212 обратного перекрывающегося критически дискретизированного преобразования выполнен с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для перекрывающегося и добавленного набора элементов разрешения, полученных посредством перекрытия и добавления наборов 128_1,1 и 128_2,1 элементов разрешения, обеспеченных первым каскадом 208 обратного перекрывающегося критически дискретизированного преобразования, для получения блока 108_2 выборок.
Ниже описаны варианты осуществления аудиопроцессоров, показанных на фиг. 1-6, в которых в качестве примера предполагается, что каскад 104 каскадного перекрывающегося критически дискретизированного преобразования представляет собой MDCT-каскад, т.е. первый и второй каскады 120 и 126 перекрывающегося критически дискретизированного преобразования представляют собой MDCT-каскады, и каскад 204 обратного каскадного перекрывающегося критически дискретизированного преобразования представляет собой обратный каскадный MDCT-каскад, т.е. первый и второй каскады обратного перекрывающегося критически дискретизированного преобразования 120 и 126 представляют собой обратные MDCT-каскады. Естественно, нижеприведенное описание также является применимым к другим вариантам осуществления каскада 104 каскадного перекрывающегося критически дискретизированного преобразования и каскада 204 обратного перекрывающегося критически дискретизированного преобразования, к примеру, к каскадном MDST- или MLT-каскаду или к обратному каскадному MDST- или MLT-каскаду.
В силу этого, описанные варианты осуществления могут работать для последовательности MDCT-спектров ограниченной длины и использовать MDCT и уменьшение наложения спектров во временной области (TDAR) в качестве операции поддиапазонного объединения. Результирующая неравномерная гребенка фильтров является перекрывающейся, ортогональной и обеспечивает поддиапазонные ширины k=2n с n∈N. Вследствие TDAR, может достигаться временно и спектрально более компактная поддиапазонная импульсная характеристика.
Ниже описаны варианты осуществления гребенки фильтров.
Реализация гребенки фильтров непосредственно основана на общих схемах перекрывающегося MDCT-преобразования: Исходное преобразование с перекрытием и кодированием со взвешиванием остается неизменным.
Без потери общности, следующая система обозначений допускает ортогональные MDCT-преобразования, например, в которых функции аналитического и синтезирующего кодирования со взвешиванием являются одинаковыми.
Figure 00000002
(1)
Figure 00000003
, (2)
где
Figure 00000004
является ядром MDCT-преобразования, и
Figure 00000005
является подходящей функцией аналитического кодирования со взвешиванием
Figure 00000006
. (3)
Вывод этого преобразования
Figure 00000007
после этого сегментируется на
Figure 00000008
поддиапазонов частот с отдельными ширинами
Figure 00000009
и преобразуется снова с использованием MDCT. Это приводит к гребенке фильтров с перекрытием во временном и спектральном направлении.
Для упрощения системы обозначений в данном документе, используется один общий коэффициент N объединения для всех поддиапазонов частот; тем не менее, любое допустимое переключение/упорядочение функции MDCT-кодирования со взвешиванием может использоваться для того, чтобы реализовывать требуемое частотно-временное разрешение. Ниже содержится дополнительная информация относительно проектирования разрешения.
Figure 00000010
(4)
Figure 00000011
, (5)
где
Figure 00000012
является подходящей функцией аналитического кодирования со взвешиванием и, в общем, отличается от
Figure 00000005
по размеру и может отличаться по типу функции кодирования со взвешиванием. Поскольку варианты осуществления применяют функцию кодирования со взвешиванием в частотной области, следует заметить, что временная и частотная избирательность функции кодирования со взвешиванием переставляются.
Для надлежащей обработки границ, дополнительное смещение в N/2 может вводиться в уравнении (4), комбинированном с прямоугольными половинами начального/конечного окна кодирования со взвешиванием на границах. Также для упрощения системы обозначений, это смещение не учитывается здесь.
Вывод
Figure 00000013
представляет собой список
Figure 00000014
векторов отдельных длин
Figure 00000009
коэффициентов с соответствующими полосами
Figure 00000015
пропускания и временным разрешением, пропорциональным этой полосе пропускания.
Тем не менее, эти векторы содержат наложение спектров из исходного MDCT-преобразования и в силу этого демонстрируют плохую временную компактность. Чтобы компенсировать это наложение спектров, TDAR может упрощаться.
Выборки, используемые для TDAR, извлекаются из двух смежных блоков
Figure 00000014
поддиапазонных выборок в текущем и предыдущем MDCT-кадре
Figure 00000016
и
Figure 00000017
. Результат представляет собой уменьшенное наложение спектров во второй половине предыдущего кадра и в первой половине второго кадра.
Figure 00000018
(6)
для
Figure 00000019
с:
Figure 00000020
(7)
TDAR-коэффициенты
Figure 00000021
,
Figure 00000022
,
Figure 00000023
и
Figure 00000024
могут быть спроектированы с возможностью минимизации остаточного наложения спектров. Ниже вводится простой способ оценки на основе функции
Figure 00000025
синтезирующего кодирования со взвешиванием.
Также следует отметить, что, если A является несингулярным, операции (6) и (8) соответствуют биортогональной системе. Кроме того, если
Figure 00000026
и
Figure 00000027
, например, оба MDCT являются ортогональными, и матрица A является ортогональной, полный конвейер составляет ортогональное преобразование.
Чтобы вычислять обратное преобразование, выполняется первое обратное TDAR,
Figure 00000028
(8)
после которого выполняется обратное MDCT, и должно выполняться подавление наложения спектров во временной области (TDAC, хотя подавление наложения спектров здесь осуществляется вдоль частотной оси), для подавления наложения спектров, сформированное в уравнении 5:
Figure 00000029
В завершение, начальное MDCT в уравнении 2 инвертируется, и снова выполняется TDAC:
Figure 00000030
Ниже описаны проектные ограничения частотно-временного разрешения. Хотя любое требуемое частотно-временное разрешение является возможным, некоторые ограничения для проектирования результирующих функций кодирования со взвешиванием должны соблюдаться с тем, чтобы обеспечивать обратимость. В частности, наклоны двух смежных поддиапазонов частот могут быть симметричными таким образом, что уравнение (6) удовлетворяет условию Принцена-Брэдли [J. Princen, A. Johnson и A. Bradley, "Subband/transform coding using filter bank designs based on time domain aliasing cancellation", in Acoustics, Speech and Signal Processing, IEEE International Conference on ICASSP '87, апрель 1987 г., издание 12, стр. 2161-2164]. Здесь может применяться схема переключения окон кодирования со взвешиванием, введенная в [B. Edler, "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Frequenz, издание 43, стр. 252-256, сентябрь 1989 г.], первоначально разработанная с возможностью противостояния эффектам опережающего эхо. См. [Olivier Derrien, Thibaud Necciari и Peter Balazs, "A quasi-orthogonal, invertible and perceptually relevant time-frequency transform for audio coding", in EUSIPCO, Ницца, Франция, август 2015 г.].
Во-вторых, сумма всех длин вторых MDCT-преобразований должна составлять в сумме общую длину обеспечиваемых MDCT-коэффициентов. Диапазоны частот могут выбираться с возможностью не преобразовываться с использованием единичной ступенчатой функции кодирования со взвешиванием с нулями в требуемых коэффициентах. Тем не менее, должны отслеживаться свойства симметрии соседних функций кодирования со взвешиванием [B. Edler, "Codierung von Audiosignalen mit überlappender Transformation und adaptiven Fensterfunktionen", Frequenz, издание 43, стр. 252-256, сентябрь 1989 г.]. Результирующее преобразование должно давать в результате нули в этих диапазонах частот, так что исходные коэффициенты могут непосредственно использоваться.
В качестве возможного частотно-временного разрешения, могут непосредственно использоваться диапазоны частот коэффициентов масштабирования из наиболее современных аудиокодеров.
Ниже описано вычисление коэффициентов уменьшения наложения спектров во временной области (TDAR).
Согласно вышеуказанному временному разрешению, каждая поддиапазонная выборка соответствует
Figure 00000031
исходных выборок или интервалу
Figure 00000009
, умноженному на размер, в качестве одной исходной выборки.
Кроме того, величина наложения спектров в каждой поддиапазонной выборке зависит от величины наложения спектров в интервале, который она представляет. Поскольку наложение спектров взвешивается с помощью функции
Figure 00000005
аналитического кодирования со взвешиванием, использование приближенного значения функции синтезирующего кодирования со взвешиванием в каждом интервале поддиапазонной выборки предполагается в качестве хорошей первой оценки для TDAR-коэффициента.
Эксперименты демонстрируют, что две очень простых схемы вычисления коэффициентов обеспечивают хорошие начальные значения с улучшенной временной и спектральной компактностью. Оба способа основаны на гипотетической функции
Figure 00000032
синтезирующего кодирования со взвешиванием длины
Figure 00000033
.
1) Для параметрических функций кодирования со взвешиванием, таких как синусоидальные или производные методом Кайзера-Бесселя, может задаваться простое более короткое окно кодирования со взвешиванием одинакового типа.
2) Как для параметрических, так и для табличных функций кодирования со взвешиванием без закрытого представления, окно может разделяться на
Figure 00000033
секций равного размера, обеспечивая возможность получения коэффициентов с использованием среднего значения каждой секции:
Figure 00000034
(15)
С учетом граничных MDCT-условий и зеркалирования наложения спектров, в таком случае в результате получаются TDAR-коэффициенты:
Figure 00000035
(16)
Figure 00000036
(17)
Figure 00000037
(18)
Figure 00000038
(19)
или в случае ортогонального преобразования:
Figure 00000039
(20)
Figure 00000040
. (21)
Независимо от того, какое решение по аппроксимации коэффициентов выбрано, при условии, что A является несингулярным, идеальное восстановление всей гребенки фильтров сохраняется. В других отношениях субоптимальный выбор коэффициентов должен затрагивать только величину остаточного наложения спектров в поддиапазонном сигнале
Figure 00000041
; тем не менее, не в сигнале
Figure 00000042
, синтезированном посредством гребенки обратных фильтров.
Фиг. 7 показывает на схемах пример поддиапазонных выборок (верхний график) и распределение их выборок по времени и частоте (нижний график). Снабженная примечаниями выборка имеет более широкую полосу пропускания, но меньшее распределение по времени, чем нижние выборки. Функции аналитического кодирования со взвешиванием (нижний график) имеют полное разрешение одного коэффициента в расчете на исходную временную выборку. TDAR-коэффициенты в силу этого должны быть аппроксимированы (отмечены точкой) для каждой временной области поддиапазонных выборок (m=256:::384).
Ниже описаны результаты (моделирования).
Фиг. 8 показывает спектральную и временную неопределенность, полученную посредством нескольких различных преобразований, как показано в [Frederic Bimbot, Ewen Camberlein и Pierrick Philippe, "Adaptive filter banks using fixed size mdct and subband merging for audio coding-comparison with the mpeg aac filter banks", in Audio Engineering Society Convention, октябрь 2006 года].
Можно видеть, что преобразования на основе матрицы Адамара предлагают сильно ограниченные характеристики частотно-временного компромисса. Для растущих размеров объединения, дополнительное временное разрешение приводит к непропорционально высоким затратам в спектральной неопределенности.
Другими словами, фиг. 8 показывает сравнение спектрального и временного энергетического уплотнения различных преобразований. Встроенные метки обозначают длины кадров для MDCT, коэффициенты разбиения для разбиения Гейзенберга и коэффициенты объединения для всего остального.
Тем не менее, поддиапазонное объединение с TDAR имеет линейный компромисс между временной и спектральной неопределенностью, параллельно простому равномерному MDCT. Их произведение является постоянным, хотя немного выше, чем простое равномерное MDCT. Для этого анализа, синусоидальная функция аналитического кодирования со взвешиванием и производная методом Кайзера-Бесселя функция кодирования со взвешиванием при поддиапазонном объединении демонстрируют наиболее компактные результаты и в силу этого выбираются.
Тем не менее, кажется, что использование TDAR для коэффициента
Figure 00000043
объединения снижает временную и спектральную компактность. Это обусловлено тем, что схема вычисления коэффициентов, введенная в разделе II-B, является слишком упрощенной и не аппроксимирует надлежащим образом значения для крутых наклонов функции кодирования со взвешиванием. Схема числовой оптимизации должна представляться в последующей публикации.
Эти значения компактности вычислены с использованием центра cog тяжести и эффективной длины
Figure 00000044
квадратной формы импульсной характеристики
Figure 00000045
, заданной как [Athanasios Papoulis, "Signal analysis", Electrical and electronic engineering series, McGraw-Hill, Нью-Йорк, Сан-Франциско, Париж, 1977 год]
Figure 00000046
Показаны средние значения всех импульсных характеристик каждой отдельной гребенки фильтров.
Фиг. 9 показывает сравнение двух примерных импульсных характеристик, сформированных посредством поддиапазонного объединения с и без TDAR, простых коротких MDCT-блоков и поддиапазонного объединения на основе матрицы Адамара, как предложено в [O.A. Niamut и R. Heusdens, "Flexible frequency decompositions for cosine-modulated filter banks", in Acoustics, Speech and Signal Processing, 2003. Proceedings (ICASSP '03), 2003 IEEE International Conference on, апрель 2003 года, издание 5, стр. V-449-52, издание 5].
Плохая временная компактность преобразования с объединением на основе матрицы Адамара является четко видимой. Также можно четко видеть, что большинство артефактов наложения спектров в поддиапазоне частот значительно уменьшаются посредством TDAR.
Другими словами, фиг. 9 показывает примерные импульсные характеристики объединенного поддиапазонного фильтра, содержащего 8 из 1024 исходных элементов разрешения, с использованием способа, предложенного здесь без TDAR, с TDAR, способа, предложенного в [O.A. Niamut и R. Heusdens, "Subband merging in cosine-modulated filter banks", Signal Processing Letters, IEEE, издание 10, № 4, стр. 111-114, апрель 2003 года], и с использованием меньшей длины MDCT-кадра в 256 выборок.
Фиг. 10 показывает блок-схему способа 300 обработки аудиосигнала для получения поддиапазонного представления аудиосигнала. Способ 300 содержит этап 302 выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала. Кроме того, способ 300 содержит этап 304 выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
Фиг. 11 показывает блок-схему способа 400 обработки поддиапазонного представления аудиосигнала для получения аудиосигнала. Способ 400 содержит этап 402 выполнения комбинирования со взвешиванием (и сдвигом) двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров (различных блоков частично перекрывающихся выборок) аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок. Кроме того, способ 400 содержит этап 404 выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала.
Фиг. 12 показывает принципиальную блок-схему аудиокодера 150, согласно варианту осуществления. Аудиокодер 150 содержит аудиопроцессор (100), как описано выше, кодер 152, выполненный с возможностью кодирования поддиапазонного представления с уменьшенным наложением спектров аудиосигнала для получения кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и модуль 154 формирования потоков битов, выполненный с возможностью формирования потока 156 битов из кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
Фиг. 13 показывает принципиальную блок-схему аудиодекодера 250, согласно варианту осуществления. Аудиодекодер 250 содержит синтаксический анализатор 252 потоков битов, выполненный с возможностью синтаксического анализа потока 154 битов для получения кодированного поддиапазонного представления с уменьшенным наложением спектров, декодер 254, выполненный с возможностью декодирования кодированного поддиапазонного представления с уменьшенным наложением спектров для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, и аудиопроцессор 200, как описано выше.
Фиг. 14 показывает принципиальную блок-схему аудиоанализатора 180, согласно варианту осуществления. Аудиоанализатор 180 содержит аудиопроцессор 100, как описано выше, модуль 182 извлечения информации, выполненный с возможностью анализа поддиапазонного представления с уменьшенным наложением спектров для обеспечения информации, описывающей аудиосигнал.
Варианты осуществления обеспечивают уменьшение наложения спектров во временной области (TDAR) в поддиапазонах частот гребенок фильтров неравномерного ортогонального модифицированного дискретного косинусного преобразования (MDCT).
Варианты осуществления добавляют дополнительный этап постобработки в широко используемый конвейер MDCT-преобразования, причем непосредственно этап содержит только другое перекрывающееся MDCT-преобразование вдоль частотной оси и уменьшение наложения спектров во временной области (TDAR) вдоль каждой поддиапазонной временной оси, обеспечивая возможность извлекать произвольные шкалы частот из MDCT-спектрограммы с улучшенной временной компактностью импульсной характеристики, при отсутствии введения дополнительной избыточности и только одной кадровой MDCT-задержки.
Хотя некоторые аспекты описаны в контексте устройства, очевидно, что эти аспекты также представляют описание соответствующего способа, при этом блок или устройство соответствует этапу способа либо признаку этапа способа. Аналогично, аспекты, описанные в контексте этапа способа, также представляют описание соответствующего блока или элемента, или признака соответствующего устройства. Некоторые или все этапы способа могут быть выполнены посредством (или с использованием) устройства, такого как, например, микропроцессор, программируемый компьютер либо электронная схема. В некоторых вариантах осуществления, один или более наиболее важных этапов способа могут выполняться посредством этого устройства.
В зависимости от определенных требований к реализации, варианты осуществления изобретения могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может выполняться с использованием цифрового носителя хранения данных, например, гибкого диска, DVD, Blu-Ray, CD, ROM, PROM, EPROM, EEPROM или флэш-памяти, имеющего сохраненные электронно считываемые управляющие сигналы, которые взаимодействуют (или допускают взаимодействие) с программируемой компьютерной системой, так что осуществляется соответствующий способ. Следовательно, цифровой носитель хранения данных может быть машиночитаемым.
Некоторые варианты осуществления согласно изобретению содержат носитель данных, имеющий электронночитаемые управляющие сигналы, которые допускают взаимодействие с программируемой компьютерной системой таким образом, что осуществляется один из способов, описанных в данном документе.
В общем, варианты осуществления настоящего изобретения могут быть реализованы как компьютерный программный продукт с программным кодом, при этом программный код выполнен с возможностью осуществления одного из способов, когда компьютерный программный продукт работает на компьютере. Программный код, например, может сохраняться на машиночитаемом носителе.
Другие варианты осуществления содержат компьютерную программу для осуществления одного из способов, описанных в данном документе, сохраненную на машиночитаемом носителе.
Другими словами, вариант осуществления изобретаемого способа в силу этого представляет собой компьютерную программу, имеющую программный код для осуществления одного из способов, описанных в данном документе, когда компьютерная программа работает на компьютере.
Следовательно, дополнительный вариант осуществления изобретаемых способов представляет собой носитель хранения данных (цифровой носитель хранения данных или машиночитаемый носитель), содержащий записанную компьютерную программу для осуществления одного из способов, описанных в данном документе. Носитель данных, цифровой носитель хранения данных или носитель с записанными данными типично является материальным и/или энергонезависимым.
Следовательно, дополнительный вариант осуществления изобретаемого способа представляет собой поток данных или последовательность сигналов, представляющих компьютерную программу для осуществления одного из способов, описанных в данном документе. Поток данных или последовательность сигналов, например, может быть выполнена с возможностью передачи через соединение для передачи данных, например, через Интернет.
Дополнительный вариант осуществления содержит средство обработки, например, компьютер или программируемое логическое устройство, выполненное с возможностью осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления содержит компьютер, имеющий установленную компьютерную программу для осуществления одного из способов, описанных в данном документе.
Дополнительный вариант осуществления согласно изобретению содержит устройство или систему, выполненную с возможностью передачи (например, электронным или оптическим способом) компьютерной программы для осуществления одного из способов, описанных в данном документе, в приемное устройство. Приемное устройство, например, может представлять собой компьютер, мобильное устройство, запоминающее устройство и т.п. Устройство или система, например, может содержать файловый сервер для передачи компьютерной программы в приемное устройство.
В некоторых вариантах осуществления, программируемое логическое устройство (например, программируемая пользователем вентильная матрица) может использоваться для того, чтобы выполнять часть или все из функциональностей способов, описанных в данном документе. В некоторых вариантах осуществления, программируемая пользователем вентильная матрица может взаимодействовать с микропроцессором, чтобы осуществлять один из способов, описанных в данном документе. В общем, способы предпочтительно осуществляются посредством любого аппаратного устройства.
Устройство, описанное в данном документе, может реализовываться с использованием аппаратного устройства либо с использованием компьютера, либо с использованием комбинации аппаратного устройства и компьютера.
Устройство, описанное в данном документе, или любые компоненты устройства, описанного в данном документе, могут реализовываться по меньшей мере частично в аппаратных средствах и/или в программном обеспечении.
Способы, описанные в данном документе, могут осуществляться с использованием аппаратного устройства либо с использованием компьютера, либо с использованием комбинации аппаратного устройства и компьютера.
Способы, описанные в данном документе, или любые компоненты устройства, описанного в данном документе, могут быть реализованы по меньшей мере частично посредством аппаратных средств и/или посредством программного обеспечения.
Вышеописанные варианты осуществления являются лишь иллюстративными в отношении принципов настоящего изобретения. Следует понимать, что модификации и изменения конструкций и подробностей, описанных в данном документе, должны быть очевидными для специалистов в данной области техники. Таким образом, подразумевается ограничение лишь объемом нижеприведенной формулы изобретения, а не конкретными подробностями, представленными в описании и пояснении вариантов осуществления в данном документе.

Claims (87)

1. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:
- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и
- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);
при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования содержит:
- первый каскад (120) перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающихся критически дискретизированных преобразований для первого блока (108_1) выборок и второго блока (108_2) выборок по меньшей мере из двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102), для получения первого набора (124_1) элементов разрешения для первого блока (108_1) выборок и второго набора (124_2) элементов разрешения для второго блока (108_2) выборок;
при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования дополнительно содержит:
- второй каскад (126) перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения перекрывающегося критически дискретизированного преобразования для сегмента (128_1,1) первого набора (124_1) элементов разрешения и выполнения перекрывающегося критически дискретизированного преобразования для сегмента (128_2,1) второго набора (124_2) элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала (102), для получения набора (110_1,1) поддиапазонных выборок для первого набора элементов разрешения и набора (110_2,1) поддиапазонных выборок для второго набора элементов разрешения;
при этом первый набор (110_1,1) поддиапазонных выборок представляет собой результат первого перекрывающегося критически дискретизированного преобразования (132_1,1) на основе первого сегмента (128_1,1) первого набора (124_1) элементов разрешения, при этом второй набор (110_1,2) поддиапазонных выборок представляет собой результат второго перекрывающегося критически дискретизированного преобразования (132_1,2) на основе второго сегмента (128_1,2) первого набора (124_1) элементов разрешения, при этом третий набор (110_2,1) поддиапазонных выборок представляет собой результат третьего перекрывающегося критически дискретизированного преобразования (132_2,1) на основе первого сегмента (128_2,1) второго набора (128_2,1) элементов разрешения, при этом четвертый набор (110_2,2) поддиапазонных выборок представляет собой результат четвертого перекрывающегося критически дискретизированного преобразования (132_2,2) на основе второго сегмента (128_2,2) второго набора (128_2,1) элементов разрешения; и
- при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием первого набора (110_1,1) поддиапазонных выборок и третьего набора (110_2,1) поддиапазонных выборок для получения первого поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала, при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием второго набора (110_1,2) поддиапазонных выборок и четвертого набора (110_2,2) поддиапазонных выборок для получения второго поддиапазонное представление (112_2) с уменьшенным наложением спектров аудиосигнала.
2. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
3. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.
4. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования выборок аудиосигнала на первый блок (108_1) выборок и второй блок (108_2) выборок с использованием первой функции кодирования со взвешиванием;
- при этом каскад перекрывающегося критически дискретизированного преобразования (104) выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок, и набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборки; и
- при этом первая функция кодирования со взвешиванием и вторая функция кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
5. Аудиопроцессор (100) по п. 1, в котором каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования выборок аудиосигнала на первый блок (108_1) выборок и второй блок (108_2) выборок с использованием первой функции кодирования со взвешиванием;
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок, и набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием второй функции кодирования со взвешиванием, для получения соответствующих поддиапазонных выборок; и
- при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга, при этом ширина окна кодирования со взвешиванием первой функции кодирования со взвешиванием и ширина окна кодирования со взвешиванием второй функции кодирования со взвешиванием отличаются друг от друга на коэффициент, отличный от степени двух.
6. Аудиопроцессор (100) по п. 1, в котором каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок согласно следующему уравнению:
Figure 00000047
для
Figure 00000048
с:
Figure 00000049
,
для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала, при этом yv,i(m) представляет собой первое поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, yv,i-1(N-1-m) представляет собой второе поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, ŷv,i(m) представляет собой набор поддиапазонных выборок на основе второго блока выборок аудиосигнала, ŷv,i-1(N-1-m) представляет собой набор поддиапазонных выборок на основе первого блока выборок аудиосигнала, и av(m), bv(m), cv(m) и dv(m) представляют собой коэффициенты уменьшения наложения спектров во временной области, причём N - общий коэффициент объединения, который используется для всех поддиапазонов.
7. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:
- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и
- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
8. Аудиопроцессор (100) для обработки аудиосигнала (102) для получения поддиапазонного представления аудиосигнала (102), причем аудиопроцессор (100) содержит:
- каскад (104) каскадного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного перекрывающегося критически дискретизированного преобразования по меньшей мере для двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения набора (110_1,1) поддиапазонных выборок на основе первого блока (108_1) выборок аудиосигнала (102) и получения соответствующего набора (110_2,1) поддиапазонных выборок на основе второго блока (108_2) выборок аудиосигнала (102); и
- каскад (106) уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих наборов (110_1,1; 110_1,2) поддиапазонных выборок, причем один из них получен на основе первого блока (108_1) выборок аудиосигнала (102), и один из них получен на основе второго блока (108_2) выборок аудиосигнала, для получения поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала (102);
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере двух сегментированных наборов (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом каскад (104) каскадного перекрывающегося критически дискретизированного преобразования выполнен с возможностью сегментирования набора (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получения по меньшей мере два набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.
9. Аудиопроцессор (200) для обработки поддиапазонного представления аудиосигнала для получения аудиосигнала (102), причем аудиопроцессор (200) содержит:
- каскад (202) обратного уменьшения наложения спектров во временной области, выполненный с возможностью выполнения комбинирования со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала (102) для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор (110_1,1) поддиапазонных выборок; и
- каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения каскадного обратного перекрывающегося критически дискретизированного преобразования для набора (110_1,1) поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала (102);
- при этом каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит первый каскад (208) обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора (110_1,1) поддиапазонных выборок для получения набора (128_1,1) элементов разрешения, ассоциированного с данным поддиапазоном частот аудиосигнала; и
- первый каскад (210) суммирования с перекрытием, выполненный с возможностью выполнения конкатенации наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора (128_1,1) элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (102), с набором (128_1,2) элементов разрешения, ассоциированных с другим поддиапазоном частот аудиосигнала (102), для получения набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102).
10. Аудиопроцессор (200) по п. 9, в котором каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит второй каскад (212) обратного перекрывающегося критически дискретизированного преобразования, выполненный с возможностью выполнения обратного перекрывающегося критически дискретизированного преобразования для набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102), для получения набора выборок, ассоциированных с блоком выборок аудиосигнала (102).
11. Аудиопроцессор (200) по п. 10, в котором каскад (204) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит второй каскад (214) суммирования с перекрытием, выполненный с возможностью суммирования с перекрытием набора выборок, ассоциированных с блоком выборок аудиосигнала (102), и другого набора выборок, ассоциированных с другим блоком выборок аудиосигнала (102), причем блок выборок и другой блок выборок аудиосигнала (102) частично перекрываются, для получения аудиосигнала (102).
12. Аудиопроцессор (200) по п. 9, в котором каскад (202) обратного уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала (102) на основе следующего уравнения:
Figure 00000050
для
Figure 00000048
с:
Figure 00000051
,
для получения поддиапазонного представления с наложением спектров, при этом yv,i(m) представляет собой первое поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, yv,i-1(N-1-m) представляет собой второе поддиапазонное представление с уменьшенным наложением спектров аудиосигнала, ŷv,i(m) представляет собой набор поддиапазонных выборок на основе второго блока выборок аудиосигнала, ŷv,i-1(N-1-m) представляет собой набор поддиапазонных выборок на основе первого блока выборок аудиосигнала, и av(m), bv(m), cv(m) и dv(m) представляют собой коэффициенты уменьшения наложения спектров во временной области, причём N - общий коэффициент объединения, который используется для всех поддиапазонов.
13. Аудиокодер, содержащий:
- аудиопроцессор (100) по п. 1, или 7, или 8;
- кодер, выполненный с возможностью кодирования поддиапазонного представления с уменьшенным наложением спектров аудиосигнала для получения кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала; и
- модуль формирования потоков битов, выполненный с возможностью формирования потока битов из кодированного поддиапазонного представления с уменьшенным наложением спектров аудиосигнала.
14. Аудиодекодер, содержащий:
- синтаксический анализатор потоков битов, выполненный с возможностью синтаксического анализа потока битов для получения кодированного поддиапазонного представления с уменьшенным наложением спектров;
- декодер, выполненный с возможностью декодирования кодированного поддиапазонного представления с уменьшенным наложением спектров для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала; и
- аудиопроцессор (200) по п. 9.
15. Аудиоанализатор, содержащий:
- аудиопроцессор (100) по п. 1, или 7, или 8; и
- модуль извлечения информации, выполненный с возможностью анализа поддиапазонного представления с уменьшенным наложением спектров для обеспечения информации, описывающей аудиосигнал.
16. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:
- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и
- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют перекрывающиеся критически дискретизированные преобразования для первого блока (108_1) выборок и второго блока (108_2) выборок по меньшей мере из двух частично перекрывающихся блоков (108_1; 108_2) выборок аудиосигнала (102) для получения первого набора (124_1) элементов разрешения для первого блока (108_1) выборок и второго набора (124_2) элементов разрешения для второго блока (108_2) выборок;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют перекрывающееся критически дискретизированное преобразование для сегмента (128_1,1) первого набора (124_1) элементов разрешения и выполняют перекрывающееся критически дискретизированное преобразование для сегмента (128_2,1) второго набора (124_2) элементов разрешения, причем каждый сегмент ассоциирован с поддиапазоном частот аудиосигнала (102), для получения набора (110_1,1) поддиапазонных выборок для первого набора элементов разрешения и набора (110_2,1) поддиапазонных выборок для второго набора элементов разрешения;
- при этом первый набор (110_1,1) поддиапазонных выборок представляет собой результат первого перекрывающегося критически дискретизированного преобразования (132_1,1) на основе первого сегмента (128_1,1) первого набора (124_1) элементов разрешения, при этом второй набор (110_1,2) поддиапазонных выборок представляет собой результат второго перекрывающегося критически дискретизированного преобразования (132_1,2) на основе второго сегмента (128_1,2) первого набора (124_1) элементов разрешения, при этом третий набор (110_2,1) поддиапазонных выборок представляет собой результат третьего перекрывающегося критически дискретизированного преобразования (132_2,1) на основе первого сегмента (128_2,1) второго набора (128_2,1) элементов разрешения, при этом четвертый набор (110_2,2) поддиапазонных выборок представляет собой результат четвертого перекрывающегося критически дискретизированного преобразования (132_2,2) на основе второго сегмента (128_2,2) второго набора (128_2,1) элементов разрешения; и
- при этом выполнение (304) комбинирования со взвешиванием двух соответствующих наборов поддиапазонных выборок содержит этап, на котором выполняют комбинирование со взвешиванием первого набора (110_1,1) поддиапазонных выборок и третьего набора (110_2,1) поддиапазонных выборок для получения первого поддиапазонного представления (112_1) с уменьшенным наложением спектров аудиосигнала, при этом каскад (106) уменьшения наложения спектров во временной области выполнен с возможностью выполнения комбинирования со взвешиванием второго набора (110_1,2) поддиапазонных выборок и четвертого набора (110_2,2) поддиапазонных выборок, для получения второго поддиапазонного представления (112_2) с уменьшенным наложением спектров аудиосигнала.
17. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:
- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и
- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом по меньшей мере две функции кодирования со взвешиванием содержат различную ширину окна кодирования со взвешиванием.
18. Способ (300) обработки аудиосигнала для получения поддиапазонного представления аудиосигнала, при этом способ содержит этапы, на которых:
- выполняют (302) каскадное перекрывающееся критически дискретизированное преобразование по меньшей мере для двух частично перекрывающихся блоков выборок аудиосигнала для получения набора поддиапазонных выборок на основе первого блока выборок аудиосигнала и получения соответствующего набора поддиапазонных выборок на основе второго блока выборок аудиосигнала; и
- выполняют (304) комбинирование со взвешиванием двух соответствующих наборов поддиапазонных выборок, причем один из них получен на основе первого блока выборок аудиосигнала, и один из них получен на основе второго блока выборок аудиосигнала, для получения поддиапазонного представления с уменьшенным наложением спектров аудиосигнала;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_1) элементов разрешения, полученных на основе первого блока (108_1) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два сегментированных набора (128_1,1; 128_1,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих первому блоку (108_1) выборок;
- при этом выполнение (302) каскадного перекрывающегося критически дискретизированного преобразования содержит этап, на котором сегментируют набор (124_2) элементов разрешения, полученных на основе второго блока (108_2) выборок с использованием по меньшей мере двух функций кодирования со взвешиванием, и получают по меньшей мере два набора (128_2,1; 128_2,2) поддиапазонных выборок на основе сегментированного набора элементов разрешения, соответствующих второму блоку (108_2) выборок; и
- при этом наклоны фильтра функций кодирования со взвешиванием, соответствующих смежным наборам поддиапазонных выборок, являются симметричными.
19. Способ (400) обработки поддиапазонного представления аудиосигнала для получения аудиосигнала, при этом способ содержит этапы, на которых:
- выполняют (402) комбинирование со взвешиванием двух соответствующих поддиапазонных представлений с уменьшенным наложением спектров аудиосигнала для получения поддиапазонного представления с наложением спектров, при этом поддиапазонное представление с наложением спектров представляет собой набор поддиапазонных выборок; и
- выполняют (404) каскадное обратное перекрывающееся критически дискретизированное преобразование для набора поддиапазонных выборок для получения набора выборок, ассоциированных с блоком выборок аудиосигнала;
- при этом выполнение (404) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют обратное перекрывающееся критически дискретизированное преобразование для набора (110_1,1) поддиапазонных выборок для получения набора (128_1,1) элементов разрешения, ассоциированного с данным поддиапазоном частот аудиосигнала; и
- при этом выполнение (404) каскадного обратного перекрывающегося критически дискретизированного преобразования содержит этап, на котором выполняют конкатенацию наборов элементов разрешения, ассоциированных с множеством поддиапазонов частот аудиосигнала, что содержит комбинирование со взвешиванием набора (128_1,1) элементов разрешения, ассоциированных с данным поддиапазоном частот аудиосигнала (102), с набором (128_1,2) элементов разрешения, ассоциированных с другим поддиапазоном частот аудиосигнала (102), для получения набора (124_1) элементов разрешения, ассоциированных с блоком выборок аудиосигнала (102).
20. Машиночитаемый носитель, на котором сохранена компьютерная программа для осуществления способа по п. 16, или 17, или 18.
21. Машиночитаемый носитель, на котором сохранена компьютерная программа для осуществления способа по п. 19.
RU2019105570A 2016-07-29 2017-07-26 Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом RU2719285C1 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP16181883.6 2016-07-29
EP16181883.6A EP3276620A1 (en) 2016-07-29 2016-07-29 Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
PCT/EP2017/068932 WO2018019909A1 (en) 2016-07-29 2017-07-26 Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis

Publications (1)

Publication Number Publication Date
RU2719285C1 true RU2719285C1 (ru) 2020-04-17

Family

ID=56555310

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2019105570A RU2719285C1 (ru) 2016-07-29 2017-07-26 Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом

Country Status (11)

Country Link
US (1) US10978082B2 (ru)
EP (3) EP3276620A1 (ru)
JP (1) JP6768141B2 (ru)
KR (1) KR102218371B1 (ru)
CN (1) CN109863555B (ru)
BR (1) BR112019001741A2 (ru)
CA (2) CA3139439C (ru)
ES (1) ES2807564T3 (ru)
MX (1) MX2019001023A (ru)
RU (1) RU2719285C1 (ru)
WO (1) WO2018019909A1 (ru)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3644313A1 (en) 2018-10-26 2020-04-29 Fraunhofer Gesellschaft zur Förderung der Angewand Perceptual audio coding with adaptive non-uniform time/frequency tiling using subband merging and time domain aliasing reduction
CN110535472B (zh) * 2019-07-17 2023-05-02 南开大学深圳研究院 高速逐次逼近式模数转换器及控制方法
EP3786948A1 (en) * 2019-08-28 2021-03-03 Fraunhofer Gesellschaft zur Förderung der Angewand Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar
CN112767329B (zh) * 2021-01-08 2021-09-10 北京安德医智科技有限公司 图像处理方法及装置、电子设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020176353A1 (en) * 2001-05-03 2002-11-28 University Of Washington Scalable and perceptually ranked signal coding and decoding
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
WO2005083682A1 (en) * 2004-02-19 2005-09-09 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP2144171A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7460993B2 (en) * 2001-12-14 2008-12-02 Microsoft Corporation Adaptive window-size selection in transform coding
US7536305B2 (en) 2002-09-04 2009-05-19 Microsoft Corporation Mixed lossless audio compression
CN1460992A (zh) * 2003-07-01 2003-12-10 北京阜国数字技术有限公司 用于感知音频编/解码的低延时、自适应的多分辨率滤波器组
DE10345995B4 (de) 2003-10-02 2005-07-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten
CN101053019B (zh) * 2004-11-02 2012-01-25 皇家飞利浦电子股份有限公司 使用复值滤波器组的音频信号的编码和解码的装置和方法
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
ES2947516T3 (es) 2006-10-25 2023-08-10 Fraunhofer Ges Forschung Aparato y procedimiento para la generación de valores de subbanda de audio de valor complejo
EP2015293A1 (en) * 2007-06-14 2009-01-14 Deutsche Thomson OHG Method and apparatus for encoding and decoding an audio signal using adaptively switched temporal resolution in the spectral domain
US7761290B2 (en) * 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
PT3550564T (pt) * 2007-08-27 2020-08-18 Ericsson Telefon Ab L M Análise/síntese espectral de baixa complexidade utilizando resolução temporal selecionável
WO2010003532A1 (en) 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
RU2562434C2 (ru) * 2010-08-12 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Передискретизация выходных сигналов аудиокодеков на основе квадратурных зеркальных фильтров (qmf)

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6496795B1 (en) * 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US20020176353A1 (en) * 2001-05-03 2002-11-28 University Of Washington Scalable and perceptually ranked signal coding and decoding
WO2005083682A1 (en) * 2004-02-19 2005-09-09 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
EP2479750B1 (en) * 2005-06-17 2014-03-12 DTS(BVI) Limited Method for hierarchically filtering an input audio signal and method for hierarchically reconstructing time samples of an input audio signal
WO2008071353A2 (en) * 2006-12-12 2008-06-19 Fraunhofer-Gesellschaft Zur Förderung Der Angewandten Forschung E.V: Encoder, decoder and methods for encoding and decoding data segments representing a time-domain data stream
EP2144171A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding frames of a sampled audio signal

Also Published As

Publication number Publication date
MX2019001023A (es) 2019-06-10
EP3276620A1 (en) 2018-01-31
ES2807564T3 (es) 2021-02-23
KR20190034314A (ko) 2019-04-01
BR112019001741A2 (pt) 2019-05-07
JP2019526074A (ja) 2019-09-12
CA3139439A1 (en) 2018-02-01
EP3491643A1 (en) 2019-06-05
CA3031553A1 (en) 2018-02-01
JP6768141B2 (ja) 2020-10-14
KR102218371B1 (ko) 2021-02-22
US20190172471A1 (en) 2019-06-06
CN109863555A (zh) 2019-06-07
CA3139439C (en) 2024-03-19
CN109863555B (zh) 2023-09-08
CA3031553C (en) 2022-01-04
EP3664090A1 (en) 2020-06-10
EP3491643B1 (en) 2020-06-03
WO2018019909A1 (en) 2018-02-01
US10978082B2 (en) 2021-04-13

Similar Documents

Publication Publication Date Title
RU2691231C2 (ru) Декодер для декодирования кодированного аудиосигнала и кодер для кодирования аудиосигнала
RU2719285C1 (ru) Уменьшение наложения спектров во временной области для неравномерных гребенок фильтров, которые используют спектральный анализ с последующим частичным синтезом
CA2662910C (en) Method and device for transcoding audio signals
AU2014220725A1 (en) Apparatus and method for encoding or decoding an audio signal using a transient-location dependent overlap
KR20050007312A (ko) 시간-이산 오디오 신호를 부호화하기 위한 장치 및 방법그리고 부호화 오디오 데이터를 복호화하기 위한 장치 및방법
CA2792453C (en) Signal processor and method for processing a signal
BRPI0412166B1 (pt) aparato e método para a conversão em uma representação transformada ou para a conversão inversa da representação transformada
JP2004531151A (ja) 時間離散オーディオサンプル値を処理する方法と装置
Werner et al. Nonuniform orthogonal filterbanks based on MDCT analysis/synthesis and time-domain aliasing reduction
US20220165283A1 (en) Time-varying time-frequency tilings using non-uniform orthogonal filterbanks based on mdct analysis/synthesis and tdar
RU2791664C1 (ru) Варьирующиеся во времени расположения частотно-временными плитками с использованием неравномерных ортогональных гребенок фильтров на основе mdct-анализа/синтеза и tdar
JP2022505789A (ja) サブバンド併合および時間領域エイリアシング低減を使用した適応的な非均一時間/周波数タイリングによる知覚音声符号化
KR20200099560A (ko) 통합 음성 및 오디오 디코딩 및 인코딩 qmf 기반 고조파 트랜스포저 개선을 위한 방법, 장치 및 시스템
Wang Time-varying cosine-modulated filter banks
Song et al. New aliasing cancelation algorithm for the transition between non-aliased and TDAC-based coding modes