RU2444071C2 - Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области - Google Patents

Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области Download PDF

Info

Publication number
RU2444071C2
RU2444071C2 RU2009117569/07A RU2009117569A RU2444071C2 RU 2444071 C2 RU2444071 C2 RU 2444071C2 RU 2009117569/07 A RU2009117569/07 A RU 2009117569/07A RU 2009117569 A RU2009117569 A RU 2009117569A RU 2444071 C2 RU2444071 C2 RU 2444071C2
Authority
RU
Russia
Prior art keywords
domain
data
time
frequency domain
encoded
Prior art date
Application number
RU2009117569/07A
Other languages
English (en)
Other versions
RU2009117569A (ru
Inventor
Ральф ГАЙГЕР (DE)
Ральф ГАЙГЕР
Макс НУЕНДОРФ (DE)
Макс НУЕНДОРФ
Йошиказу ЙОКОТАНИ (DE)
Йошиказу ЙОКОТАНИ
Николас РЕТТЕЛЬБАХ (DE)
Николас РЕТТЕЛЬБАХ
Юрген ХЕРРЕ (DE)
Юрген ХЕРРЕ
Стефан ГАЙЕРСБЕРГЕР (DE)
Стефан ГАЙЕРСБЕРГЕР
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен
Publication of RU2009117569A publication Critical patent/RU2009117569A/ru
Application granted granted Critical
Publication of RU2444071C2 publication Critical patent/RU2444071C2/ru

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7847Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content
    • G06F16/7864Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using low-level visual features of the video content using domain-transform features, e.g. DCT or wavelet transform coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2368Multiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4341Demultiplexing of audio and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/438Interfacing the downstream path of the transmission network originating from a server, e.g. retrieving encoded video stream packets from an IP network
    • H04N21/4382Demodulation or channel decoding, e.g. QPSK demodulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Изобретение относится к кодированию данных для случаев, когда различные характеристики данных, подлежащих кодированию, используются для кодирования скоростей, как, например, в видео- и звуковом кодировании. Техническим результатом является повышение эффективности кодирования и расшифровки сегментов данных. Указанный технический результат достигается тем, что предложено устройство для расшифровки сегментов данных, представляющих собой поток данных временного интервала, сегмент данных, закодированный во временном интервале или в частотной области, сегмент данных, закодированный в частотной области, имеющий последовательные блоки данных, представляющих собой последовательные и наложенные блоки образцов данных временного интервала, причем устройство содержит: декодер временного интервала для расшифровки сегмента данных, закодированных во временном интервале, и процессор для обработки сегмента данных, закодированных в частотной области, и выходные данные декодера временного интервала для получения наложенных блоков данных временного интервала, и налагающий/добавляющий объединитель для соединения наложенных блоков данных временного интервала для получения расшифрованного сегмента данных потока данных временного интервала. 6 н. и 34 з.п. ф-лы, 14 ил.

Description

Данное изобретение относится к сфере кодирования для случаев, когда различные характеристики данных, подлежащих кодированию, используются для кодирования скоростей, как, например, в видео- и звуковом кодировании.
Состояние стратегий кодирования позволяет использовать особенности потока данных, подлежащих кодированию. Например, в звуковом кодировании модели восприятия используются для того, чтобы сжать исходные данные таким образом, чтобы практически не ухудшить качество при воспроизведении. Современные воспринимающие аудиокодирующие схемы, такие как, MPEG-2/4 AAC (MPEG=Moving Pictures Expert Group, AAC=Advanced Audio Coding). Для сравнения, общее кодирование кинофильмов и связанная с этим звукозапись: перспективное звуковое кодирование, Международный Стандарт 13818-7, ISO/IEC JTC1/SC2 9/WG11. Экспертная группа по кинематографии, 1997, - могут использовать банки фильтров, такие как, Модифицированное дискретное косинусное преобразование (MDCT), для того чтобы представить звуковой сигнал в частотной области.
В частотной области может быть осуществлена квантизация частотных коэффициентов, согласно модели восприятия. Такие кодеры могут обеспечить превосходное качество звукового восприятия для общих типов звуковых сигналов, таких как, например, музыка. С другой стороны, современные речевые кодеры, такие как, например, ACELP (ACELP = Алгебраический код возбужденного линейного предсказания), используют опережающий подход и таким образом могут представить аудио/речевой сигнал во временной области. Такие речевые кодеры могут смоделировать особенности процесса производства речи человека, то есть речевой тракт человека, и, следовательно, достигают превосходного исполнения речевых сигналов при низких скоростях передачи битов. И наоборот, воспринимающие звуковые кодеры не достигают уровня исполнения, предлагаемого речевыми кодерами для речевых сигналов, закодированных при низких скоростях передачи битов, а использование речевых кодеров для отображения общих звуковых сигналов/музыки приводит к существенному ухудшению качества.
Традиционные концепции предусматривают слоистую комбинацию, в которой всегда все частичные кодеры являются активными, то есть кодеры временной области и частотной области, а конечный выходной сигнал вычисляется путем сложения вкладов частичных кодеров в течение данного обработанного выделенного интервала времени. Популярный пример слоистого кодирования - масштабируемое кодирование речи/звуков MPEG-4 речевым кодером в качестве базового слоя и повышающего слоя на основе блока фильтров, для сравнения, работа Бернхарда Грилла, Карлхайнца Бранденбурга «Двух- или трехэтапная скоростная биты-передающая масштабируемая кодирующая аудиосистема», сигнальный экземпляр, номер 4132, 99-ое Соглашение AES (Улучшенный стандарт шифрования) (сентябрь 1995).
Традиционные кодеры частотной области могут использовать MDCT блоки фильтров. MDCT стал основным блоком фильтров для обычных воспринимающих звуковых кодеров благодаря их благоприятным свойствам. Например, это может обеспечить гладкий монтажный переход между блоками обработки. Даже если сигнал в каждом блоке обработки изменяется по-разному, например, благодаря квантизации спектральных коэффициентов, никакие артефакты блокирования не происходят из-за резких переходов от блока к блоку ввиду процессов наложения/добавления, реализуемых посредством организации окна. MDCT использует концепцию отмены наложения временнй области (TDAC).
MDCT является родственным Фурье-преобразованию, основанным на IV типе дискретных косинусных преобразований, с дополнительным свойством наложения. Оно разработано для исполнения в последовательных блоках большего набора данных, где последующие блоки накладываются так, что задняя половина одного блока совпадает с передней половиной следующего блока. Это наложение в дополнение к свойству уплотнения энергии DCT (дискретного косинусного преобразования) делает MDCT особенно привлекательным для использования сжатия сигнала, так как это помогает избежать упомянутых артефактов, возникающих в границах блока. Будучи наложенным преобразованием, MDCT немного отличается от других родственных Фурье-преобразований тем, что у них в полтора раза больше выходов, чем входов, а не одинаковое число. В частности, 2N действительные числа преобразованы в N реальные числа, где N - положительное целое число.
Обратный MDCT также известен как IMDCT. Поскольку имеются различные количества входов и выходов, на первый взгляд может показаться, что MDCT не должен быть обратимым. Однако идеальная обратимость достигается добавлением наложения IDMCT последующих наложенных блоков, что исправляет ошибки и восстанавливает оригинальные данные, то есть достигается TDAC (отмена наложения временной области).
К тому же число спектральных значений на выходе блока фильтров равно числу входных значений временной области на его входе, который также называется критической выборкой.
MDCT блок фильтров обеспечивает высокочастотную селективность и дает возможность получить высокую эффективность кодирования. Свойства наложения блоков и критической выборки могут быть получены при использовании техники отмены наложения временной области, для сравнения, Дж.Принсен, А.Брэдли «Проект анализа/синтеза блока фильтров, основанный на отмене наложения временной области», преобразование IEEE (Институт инженеров по электротехнике и радиоэлектронике). ASSP, ASSP-34 (5):1153-1161, 1986. Фиг.4 иллюстрирует эти эффекты MDCT. На фиг.4 наверху показан входной сигнал MDCT в переводе на импульс, отложенный по оси времени 400. Затем входной сигнал 400 преобразуется двумя последовательными окнами и блоками MDCT, где окна 410 показаны под входным сигналом 400 на фиг.4. Обратные преобразованные индивидуальные реализуемые посредством организации окна сигналы показаны на фиг.4 при помощи временных шкал 420 и 425.
После обратного MDCT первый блок производит компонент наложения с положительным знаком 420, второй блок производит компонент наложения с той же самой величиной и отрицательным знаком 425. Компоненты наложения отменяют друг друга после дополнения двух выходных сигналов 420 и 425, как показано в конечном выходе 430 на фиг.4 внизу.
В технической спецификации «Расширенный адаптивный многоскоростной широкополосный (AMR-WB+) кодер-декодер», 3GPP (общий протокол пакетной передачи) TS (техническая спецификация) 26.290V6.3.0, 2005-06, AMR-WB+(AMR-WB=Адаптивный многоскоростной широкополосный) определен кодер-декодер. Согласно разделу 5.2 алгоритм кодирования в ядре AMR-WB+ кодер-декодера основывается на гибридной модели ACELP/TCX (ТСХ = Преобразование кодированного возбуждения). Для каждого блока входного сигнала кодер решает, какой режим, кодирующий модель, лучше: в открытой петле или в замкнутой петле, то есть ACELP или ТСХ. Модель ACELP является прогнозирующим кодером временной области, который лучше всего подходит для речевых и переходных сигналов. Кодер AMR-WB+ используется в режимах ACELP. В качестве альтернативы, модель ТСХ является кодером, базирующимся на преобразовании, и больше подходит для типичных образцов музыки.
В частности, AMR-WB+ использует дискретное Фурье-преобразование (DFT) для кодирующего режима преобразования ТСХ. Чтобы обеспечить плавный переход между смежными блоками, используются окна и наложение. Эти окна и наложение необходимы как для переходов между различными режимами кодирования (TCX/ACELP), так и для последовательных структур ТСХ. Таким образом, DFT вместе с окнами и наложением представляет блок фильтров, который критически не выбран. Блок фильтров генерирует больше частотных значений, чем число новых входных образцов, для сравнения фиг.4 в 3GPP TS 26.290V6.3.0 (3GPP = Проект сотрудничества третьего поколения, TS = Техническая Спецификация). Каждая структура ТСХ использует наложение 1/8 длины структуры, которая равна числу новых входных образцов. Следовательно, соответствующая длина DFT составляет 9/8 длины структуры.
Принимая во внимание некритически выбранный DFT блок фильтров в ТСХ, то есть число спектральных величин на выходе фильтра блоков больше, чем число входных величин временной области на его входе, этот кодирующий режим частотной области отличается от звуковых кодер-декодеров, таких как ААС (ААС = усовершенствованное аудиокодирование или перспективное звуковое кодирование), который использует MDCT, критически выбранным наложенным преобразованием.
Система кодер-декодера Долби Е описана в работе Фидлера, Луи Д.; Тодда, Крейга К. «Проект удобной видеокодирующей аудиосистемы для дистрибутивного применения», работа номер 17-008, 17-ая AES Международная Конференция: Высококачественное аудиокодирование (август 1999) и в работе Фидлера, Луи Д.; Дэвидсона, Гранта А., «Аудиокодирующие инструменты для цифрового телевизионного распределения», номер сигнального экземпляра 5104, 108-ое Соглашение AES (январь 2000 г.). Система кодер-декодера Долби Е использует MDCT блок фильтров. В проекте этого кодирования специальный акцент был сделан на возможности выполнить редактирование в кодирующей области. Чтобы достигнуть этого, используются специальные свободные от неоднородности окна. В границах этих окон возможен гладкий монтажный переход или соединение различных частей сигнала. В вышеупомянутых документах, например, обрисовано в общих чертах, для сравнения раздел 3 работы «Проект удобной видеокодирующей аудиосистемы для дистрибутивного применения», то, что это не было бы возможно, если просто использовать обычные окна MDCT, которые вводят наложение временной области. Однако также описано, что удаление наложения происходит за счет увеличения числа коэффициентов преобразования, и указано на то, что у результирующего блока фильтров больше нет свойства осуществления критической выборки.
Задача настоящего изобретения - создание более эффективных концепций кодирования и декодирования сегментов данных.
Задача достигается при использовании устройства декодирования согласно пункту 1 формулы, способа декодирования (расшифровки) согласно пункту формулы 22, устройства, генерирующего закодированные потоки данных согласно пункту формулы 24, и способа, генерирующего закодированные потоки данных согласно пункту формулы 35.
Данное изобретение основано на заключении о том, что более эффективная концепция кодирования и декодирования может быть применена при использовании комбинированных кодеров временной и частотной областей и соответственно декодеров. Проблема временного наложения может быть эффективно решена путем преобразования данных временной области в частотную область в декодере и путем комбинирования полученных преобразованных данных частотной области с полученными декодированными данными частотной области. Служебные сигналы могут быть уменьшены подгонкой областей наложения окон, применяемых к сегментам данных для изменения области кодирования. Использование окон с меньшими областями наложения может быть выгодным при использовании кодирования временной области, соответственно при переключении с или на кодирование временной области.
Осуществления изобретения могут создать универсальную концепцию звукового кодирования и декодирования, которая улучшает работу обоих типов входных сигналов, таких как речевые сигналы и музыкальные сигналы. Осуществления могут иметь преимущество, комбинируя многократные кодирующие подходы, например, концепции кодирования временной области и частотной области. Осуществления могут эффективно объединять концепции кодирования, основанные на блоке фильтров и временной области, в единую схему. Осуществления могут привести к созданию объединенного кодер-декодера, который может, например, переключаться со звукового кодер-декодера, используемого для музыкального звукового содержания, на речевой кодер-декодер, используемый для речевого содержания. Осуществления могут часто использовать это переключение, особенно для смешанного содержания.
Осуществления данного изобретения могут иметь то преимущество, что никакие артефакты переключения не происходят. В осуществлениях количество дополнительно передаваемых данных или дополнительно закодированных выборок для процесса переключения может быть минимизировано для того, чтобы избежать снижения эффективности во время этой фазы функционирования. К тому же концепция переключаемой комбинации частичных кодеров отличается от концепции слоистой комбинации, в которой всегда все частичные кодеры активны.
Далее будут подробно описаны осуществления данного изобретения с использованием сопровождающих иллюстраций, в которых
на фиг.1а показано осуществление устройства для декодирования;
на фиг.1b показано другое осуществление устройства для декодирования;
на фиг.1с показано другое осуществление устройства для декодирования;
на фиг.1d показано другое осуществление устройства для декодирования;
на фиг.1е показано другое осуществление устройства для декодирования;
на фиг.1f показано другое осуществление устройства для декодирования;
на фиг.2а показано осуществление устройства для кодирования;
на фиг.2b показано другое осуществление устройства для кодирования;
на фиг.2с показано другое осуществление устройства для кодирования;
фиг.3а иллюстрирует области наложения при переключении с кодирования частотной области на кодирование временной области на срок действия одного окна;
фиг.3b иллюстрирует области наложения при переключении с кодирования частотной области на кодирование временной области на срок действия двух окон;
фиг.3c иллюстрирует многократные окна с различными областями наложения;
фиг.3d иллюстрирует использование окон с различными областями наложения в осуществлении; и
фиг.4 иллюстрирует отмену наложения временной области при использовании MDCT.
На фиг.1а показано устройство 100 для декодирования сегментов данных, представляющих поток данных временной области, сегмент данных, закодированный во временной области или в частотной области, сегмент данных, закодированный в частотной области, имеющий последовательные блоки данных, представляющие последовательный и наложенные блоки выборок данных временной области. Этот поток данных может, например, соответствовать звуковому потоку, где некоторые из блоков данных закодированы во временной области, а другие закодированы в частотной области. Блоки данных или сегменты, которые были закодированы в частотной области, могут представлять выборки данных временной области наложенных блоков данных.
Устройство 100 включает декодер временной области 110 для декодирования сегмента данных, закодированных во временной области. Кроме того, устройство 100 включает процессор 120 для обработки сегмента данных, закодированных в частотной области, и выходных данных декодера временной области 110 для получения наложенных блоков данных временной области. Более того, устройство 100 включает налагающий/добавляющий объединитель 130 для комбинирования наложенных блоков данных временной области для получения декодированных (расшифрованных) сегментов данных потока данных временной области.
На фиг.1b показано другое осуществление устройства 100. В осуществлениях изобретения процессор 120 может включать декодер частотной области 122 для декодирования сегментов данных, закодированных в частотной области, для получения сегментов данных частотной области. Кроме того, в осуществлениях процессор 120 может включать преобразователь временной области в частотную область 124 для преобразования выходных данных декодера временной области 110 для получения преобразованных сегментов данных частотной области.
Кроме того, в осуществлениях процессор 120 может включать объединитель частотной области 126 для комбинирования сегментов частотной области и преобразованных сегментов данных частотной области для получения потока данных частотной области. Процессор 120 может далее включать преобразователь частотной области во временную область 128 для преобразования потока данных частотной области в наложенные блоки данных временной области, которые затем могут быть объединены налагающим/добавляющим объединителем 130.
Осуществления изобретения могут использовать MDCT блок фильтров, такой как, например, используемый в MPEG-4 ААС, без всяких модификаций, особенно не отказываясь от свойства осуществления критической выборки. Осуществления могут обеспечить оптимальную эффективность кодировки. Осуществления могут достигнуть гладкого перехода к кодер-декодеру временной области, совместимого с установленными окнами MDCT, не вводя дополнительных артефактов переключения и только минимальное количество служебных сигналов.
Осуществления могут поддерживать наложение временной области в блоке фильтров и преднамеренно вводить соответствующее наложение временной области в части сигнала, закодированного кодер-декодером временной области. Таким образом, результирующие компоненты наложения временной области могут уравновесить друг друга так же, как они делают это для двух последовательных структур спектров MDCT.
На фиг.1с показано другое осуществление устройства 100. Согласно фиг.1с декодер частотной области 122 может включать стадию переквантизации 122а. Кроме того, преобразователь временной области в частотную область 124 может включать косинусно-модулированный блок фильтров, расширенное наложенное преобразование, блок фильтров с малой задержкой или многофазный блок фильтров. Осуществление, показанное на фиг.1с, свидетельствует о том, что преобразователь временной области в частотную область 124 может включать MDCT 124а.
Кроме того, фиг.1с показывает, что объединитель частотной области 126 может включать сумматор 126а. Как показано на фиг.1с, преобразователь частотной области во временную область 128 может включать косинусно-модулированный блок фильтров, соответственно обратный MDCT 128а. Поток данных, включающий закодированную временную область и закодированный сегмент данных частотной области, может быть генерирован кодером, который будет подробно описан ниже. Переключение с кодирования частотной области на кодирование временной области может быть достигнуто кодированием некоторых частей входного сигнала кодером частотной области и некоторых частей входного сигнала кодером временной области. Осуществление устройства 100, показанное на фиг.1с, иллюстрирует принципиальную структуру соответствующего устройства 100 для декодирования. В других осуществлениях переквантизация 122а и обратное модифицированное дискретное косинусное преобразование 128а может представлять декодер частотной области.
Как показано на фиг.1с для частей сигнала в случае использования декодера временной области 110, выход временной области декодера временной области 110 может быть преобразован переадресовкой MDCT 124a. Декодер временной области может использовать фильтр с предсказанием для декодирования закодированных данных временной области. Некоторое наложение на входе MDCT 124a и, следовательно, некоторые служебные сигналы могут быть введены здесь. Далее будут описаны осуществления, которые уменьшают или минимизируют эти служебные сигналы.
В принципе, осуществление, показанное на фиг.1с, также включает рабочий режим, когда оба кодера-декодера могут работать параллельно. В осуществлениях процессор 120 может быть приспособлен для обработки сегмента данных, закодированных параллельно во временной области и в частотной области. Таким образом, сигнал может быть частично закодирован в частотной области и частично во временной области подобно слоистому кодированию. Затем результирующие сигналы добавляются в частотную область, сравните с объединителем частотной области 126а. Однако осуществления могут выполнять такой режим работы, который должен переключаться исключительно между двумя кодерами-декодерами и должны иметь только предпочтительно минимальное число выборок, где оба кодера-декодера являются активными для получения наилучшей эффективности.
На фиг.1с показан выход декодера временной области 110, преобразованный MDCT 124a, за которым следует IMDCT 128а. В другом осуществлении эти два шага могут быть преимущественно объединены в один шаг для упрощения. На фиг.1d показано осуществление устройства 100, иллюстрирующее этот подход. Устройство 100 на фиг.1d показывает, что процессор 120 может включать вычислитель 129 для подсчета наложенных блоков данных временной области, основанных на выходных данных декодера временной области 110. Процессор 120 или вычислитель 129 может быть приспособлен для воспроизведения свойства: соответственно свойства наложения преобразователя частотной области во временную область 128, основанный на выходных данных декодера временной области 110, то есть процессор 120 или вычислитель 129 может воспроизводить характеристику наложения блоков данных временной области, подобных характеристике наложения, производимой преобразователем частотной области во временную область 128. Кроме того, процессор 120 или вычислитель 129 может быть приспособлен для воспроизведения наложения временной области, подобного наложению временной области, вводимого преобразователем частотной области во временную область 128, основанного на выходных данных декодера временной области 110.
Преобразователь частотной области во временную область 128 затем может быть приспособлен для преобразования сегментов данных частотной области, создаваемых декодером частотной области 122 для наложенных блоков данных временной области. Налагающий/добавляющий объединитель 130 может быть приспособлен для объединения блоков данных, создаваемых преобразователем частотной области во временную область 128 и вычислитель 129 для получения расшифрованных сегментов данных потока данных временной области.
Вычислитель 129 может включать стадию наложения временной области 129а, как показано на осуществлении фиг.1е. Стадия 129а наложения временной области может быть приспособлена к выходным данным наложения времени декодера временной области для получения наложенных блоков данных временной области.
Для кодирования данных временной области комбинация MDCT и IMDCT может сделать процесс в осуществлениях намного более простым как в структуре, так и в вычислительной сложности, так как только процесс наложения временной области (TDA) остается в осуществлениях. Этот эффективный процесс может быть основан на числе наблюдений. Реализуемый посредством организации окна MDCT входных сегментов выборок 2N может разлагаться на три шага.
Во-первых, входной сигнал множится окном анализа.
Во-вторых, результат затем свертывается с 2N выборок до N образцов. Для MDCT этот процесс подразумевает, что первая четверть выборок объединена, то есть вычтена, в порядке обращения во времени со второй четвертью выборок, и что четвертая четверть выборок объединена, то есть прибавлена, с третьей четвертью выборок в порядке обращения во времени. В результате получаем субдискретизированный сигнал временного наложения в измененной второй и третьей четверти сигнала, включая N выборки.
В-третьих, субдискретизированный сигнал затем преобразуется при помощи ортогонального DCT-подобного преобразующего отображения N входных в N выходные выборки, чтобы получить конечный выход MDCT.
Оконная IMDCT реконструкция входной последовательности спектральных выборок N может аналогично разделяться на три шага.
Во-первых, входная последовательность спектральных выборок N преобразуется при помощи ортогонального DCT-подобного инверсивного преобразующего отображения N входных в N выходные выборки.
Во-вторых, результаты разворачиваются от N до 2N выборок путем записи обратных DCT преобразованных величин во вторую и третью четверти 2N выборок выходного буфера, заполняя первую четверть обращенной во времени и инвертированной версией второй четверти, а четвертую четверть обращенной во времени версией третьей четверти соответственно.
В-третьих, результирующие 2N выборки множатся окном синтеза, чтобы получить реализуемый посредством организации окна IMDCT выход.
Таким образом, конкатенация оконного MDCT и реализуемого посредством организации окна IMDCT может быть эффективно проведена в осуществлениях последовательным выполнением первого и второго шагов оконного MDCT и второго и третьего шагов оконного IMDCT. Третий шаг MDCT и первый шаг IMDCT могут быть полностью пропущены в осуществлениях, потому что это - обратные относительно друг друга операции, и поэтому они уравновешиваются. Оставшиеся шаги могут быть выполнены только во временной области, и, таким образом, осуществления, использующие этот подход, могут иметь существенно более низкую вычислительную сложность.
Для одного блока MDCT и последующего IMDCT второй и третий шаг MDCT и второй и третий шаг IMDCT могут быть записаны, как умножение со следующей разреженной 2N×2N матрицей.
Другими словами, вычислитель 129 может быть приспособлен к сегментации выхода декодера временной области 110 в сегментах вычислителя, включающих 2N последовательные выборки, применяя весовые коэффициенты к 2N выборкам согласно функции окна анализа, вычитая первые N/2 выборки в обратном порядке из вторых выборок N/2, и последние N/2 выборки в обратном порядке к третьим N/2 выборкам, инвертируя вторые и третьи N/2 образцы, заменяя первые N/2 образцы обращенной во времени инвертированной версией вторых N/2 выборок, заменяя четвертые N/2 выборки обращенной во времени версией третьих N/2 выборок и применяя весовые коэффициенты к 2N выборкам согласно функции окна синтеза.
В других осуществлениях налагающий/добавляющий объединитель 130 может быть приспособлен для применения весовых коэффициентов, согласно функции окна синтеза, к наложенным блокам данных временной области, произведенных преобразователем частотной области во временную область 128. Кроме того, налагающий/добавляющий объединитель 130 может быть приспособлен для применения весовых коэффициентов, согласно функции окна синтеза, будучи приспособленным к размеру области наложения последовательных наложенных блоков данных временной области.
Вычислитель 129 может быть приспособлен для применения весовых коэффициентов к 2N выборкам, согласно функции окна анализа, будучи приспособленным к размеру области наложения последовательных наложенных блоков данных временной области, а вычислитель может быть далее приспособлен для применения весовых коэффициентов к 2N выборкам, согласно функции окна синтеза, будучи приспособленным к размеру области наложения.
В осуществлениях размер области наложения двух последовательных блоков данных временной области, закодированных в частотной области, может быть большим, чем размер области наложения двух последовательных блоков данных временной области, один из которых закодирован в частотной области, а другой - во временной области.
В осуществлениях размер сегментов данных может быть приспособлен к размеру областей наложения. Осуществления могут эффективно выполнять комбинированную MDCT/IMDCT обработку, то есть блок TDA, включающий работу окон анализа, сворачивание и разворачивание и работу окон синтеза. Кроме того, в осуществлениях некоторые из этих шагов могут быть частично или полностью объединены в ходе фактического выполнения.
Другое осуществление устройства 100, показанное на фиг.1f, свидетельствует о том, что устройство 100 может далее включать обход 140 для процессора 120 и налагающего/добавляющего объединителя 130, приспособленный для обхода процессора 120 и налагающего/добавляющего объединителя 130, в случае, когда неналагающиеся последовательные блоки данных временной области появляются в сегментах данных, закодированных во временной области. Если множественные сегменты данных закодированы во временной области, то есть нет необходимости в преобразовании частотной области для декодирования последовательных сегментов данных, они могут быть переданы без какого бы то ни было наложения. В этих случаях осуществления, как показано в фиг.1f, могут обойти процессор 120 и налагающий/добавляющий объединитель 130. В осуществлениях наложение блоков может быть определено согласно ААС-спецификациям.
На фиг.2а показано осуществление устройства 200 для генерирования закодированного потока данных, основанного на потоке данных временной области, имеющем выборки сигнала. Поток данных временной области может, например, соответствовать звуковому сигналу, включая речевые секции и секции музыки или обе одновременно. Устройство 200 включает сегментный процессор 210 для производства сегментов данных из потока данных, два последовательных сегмента данных, имеющие первую или вторую область наложения, вторая область наложения меньше первой области наложения. Устройство 200 далее включает кодер временной области 220 для кодирования сегмента данных во временной области и кодер частотной области 230 для применения весовых коэффициентов к выборкам потока данных временной области согласно первой или второй функции окна для получения оконного сегмента данных, первая и вторая функции окна приспособлены к первой и второй областям наложения и для кодирования оконного сегмента данных в частотной области.
Кроме того, устройство 200 включает анализатор данных временной области 240 для определения переходного индикатора, связанного с сегментом данных, и контроллер 250 для управления устройством для сегментов данных, имеющих первый переходный индикатор, выходные данные кодера временной области 220 включены в закодированный поток данных, и для сегментов данных, имеющих второй переходный индикатор, выходные данные кодера частотной области 230 включены в закодированный поток данных.
В осуществлениях анализатор данных временной области 240 может быть приспособлен для определения переходного индикатора из потока данных временной области или из сегментов данных, произведенных сегментным процессором 210. Эти осуществления обозначены на фиг.2b. На фиг.2b показано, что анализатор данных временной области 240 может быть соединен со входом сегментного процессора 210 для того, чтобы определить переходный индикатор из потока данных временной области. В другом осуществлении анализатор данных временной области 240 может быть соединен с выходом сегментного процессора 210 для того, чтобы определить переходный индикатор из сегментов данных. В осуществлениях анализатор данных временной области 240 может быть соединен непосредственно с сегментным процессором 210 для того, чтобы определить переходный индикатор из данных, производимых непосредственно сегментным процессором. Эти осуществления обозначены пунктирами на фиг.2b.
В осуществлениях анализатор данных временной области 240 может быть приспособлен для определения переходного показателя, переходный показатель, основывается на уровне переходных процессов в потоке данных временной области или сегментов данных, где переходный индикатор может указать, превышает ли уровень переходных процессов заранее установленный порог.
На фиг.2с показано другое осуществление устройства 200. В осуществлениях, показанных на фиг.2с, сегментный процессор 210 может быть приспособлен для производства сегментов данных с первой и второй областями наложения, кодер временной области 220 может быть приспособлен для кодирования всех сегментов данных, кодер частотной области 230 может быть приспособлен для кодирования всех оконных сегментов данных, и контроллер 250 может быть приспособлен для управления кодером временной области 220, и кодер временной области 220, и кодер частотной области 230 для сегментов данных, имеющих первый переходный индикатор, выходные данные кодера временной области 220, включены в закодированный поток данных, и для сегментов данных, имеющих второй переходный индикатор, выходные данные кодера частотной области 230 включены в закодированный поток данных. В других осуществлениях и выходные данные кодера временной области 220 и кодера частотной области 230 могут быть включены в закодированный поток данных. Переходный индикатор может указывать на то, является ли сегмент данных скорее связанным или коррелированным с речевым сигналом или с музыкальным сигналом. В осуществлениях кодер частотной области 230 может использоваться для большего количества подобных музыке сегментов данных, и кодер временной области 220 может использоваться для большего количества подобных речи сегментов данных. В осуществлениях может использоваться параллельное кодирование, например, для подобных речи звуковых сигналов, имеющих музыкальный фон.
В осуществлениях, показанных на фиг.2с, множественные возможности доступны для контроллера 250, позволяющие управлять множественными компонентами устройства 200. Различные возможности обозначены пунктирами на фиг.2с. Например, контроллер 250 может быть соединен с кодером временной области 220 и кодером частотной области 230, чтобы выбрать, какой кодер должен произвести закодированный выход, основанный на переходном индикаторе. В другом осуществлении контроллер 250 может управлять выключателем на выходах кодера временной области 220 и кодера частотной области 230.
В таком осуществлении и кодер временной области 220, и кодер частотной области 230 могут закодировать все сегменты данных, и контроллер 250 может быть приспособлен для того, чтобы выбрать при помощи указанного выключателя, который соединен с выходами кодеров, какой закодированный сегмент данных должен быть включен в закодированный поток данных, основанный на эффективности кодирования, может быть приспособлен для управления сегментным процессором 210 для производства сегментов данных либо для кодера временной области 220, либо для кодера частотной области 230. Контроллер 250 может также управлять сегментным процессором 210, чтобы установить области наложения для сегмента данных. В другом осуществлении контроллер 250 может быть приспособлен для переключения выключателя между сегментным процессором 210 и кодером временной области 220, соответственно кодером частотной области 230. Контроллер 250 может затем влиять на выключатель, таким образом, направлять сегменты данных к любому из кодеров, соответственно к обоим. Контроллер 250 может быть далее приспособлен для установки функций окна для кодера частотной области 230 наряду с областями наложения и стратегиями кодирования.
Кроме того, в осуществлениях кодер частотной области 230 может быть приспособлен для применения весовых коэффициентов функций окна согласно спецификациям ААС. Кодер частотной области 230 может быть приспособлен для преобразования оконного сегмента данных в частотную область для получения сегмента данных частотной области. Более того, кодер частотной области 230 может быть приспособлен для квантования сегментов данных частотной области, и, кроме того, кодер частотной области 230 может быть приспособлен для оценки сегментов данных частотной области согласно перцепционной модели.
Кодер частотной области 230 может быть приспособлен для использования косинусно-модулированного блока фильтров, расширенного наложенного преобразования, блока фильтров с малой задержкой или многофазного блока фильтров для получения сегментов данных частотной области.
Кодер частотной области 230 может быть приспособлен для использования MDCT для получения сегментов данных частотной области. Кодер временной области 220 может быть приспособлен для использования перцепционной модели для кодирования сегментов данных.
В осуществлениях, где MDCT в кодере частотной области 230 работает в так называемом длинном блочном режиме, то есть в нормальном режиме работы, который используется для кодирования непереходных входных сигналов, для сравнения ААС-спецификации, служебный сигнал, введенный процессом переключения, может быть высоким. Это может быть верно для случаев, где только одна структура, то есть показатель длины/структуры выборок N, должна быть закодирована с использованием кодера временной области 220 вместо кодера частотной области 230.
Тогда все входные величины для MDCT, вероятно, должны быть закодированы кодером временной области 220, то есть 2N выборки доступны на выходе декодера временной области 110. Таким образом, может быть введен служебный сигнал N дополнительных выборок. Фиг.3а-3d иллюстрируют некоторые вероятные области наложения сегментов, соответственно применимых, реализуемых посредством организации окна функций. 2N выборки, вероятно, должны быть закодированы кодером временной области 220, чтобы заменить один блок закодированных данных частотной области. Фиг.3а иллюстрирует пример, где закодированные блоки данных частотной области изображены сплошной линией, а закодированные данные временной области изображены пунктиром. Под реализуемыми посредством организации окна функциями изображены сегменты данных, которые могут быть закодированы в частотной области (сплошные квадратики) или во временной области (пунктирные квадратики). Это также относится к фиг.3b-3d.
Фиг.3а иллюстрирует случай, где данные закодированы в частотной области, прерванной одним сегментом данных, который закодирован во временной области, и сегмент данных после этого снова закодирован в частотной области. Чтобы получить данные временной области, которые необходимы для отмены наложения временной области, вызванного кодером частотной области 230, при переключении с частотной области на временную область, требуется половина величины сегмента наложения, то же самое требуется при обратном переключении с временной области на частотную область. При условии, что сегмент данных, закодированный во временной области, на фиг.3а имеет размер 2N, тогда в его начале и в конце он перекрывается закодированными данными частотной области на N/2 выборок.
В случае если больше чем одна последующая структура может быть закодирована с использованием кодера временной области 220, служебный сигнал для закодированной секции временной области остается в N выборках. Как показано на фиг.3b, где две последующие структуры закодированы во временной области, и области наложения в начале и конце закодированных секций временной области имеют то же самое наложение, как это было объяснено в отношении фиг.3а. На Фиг.3b показана структура наложения в случае двух структур (фреймов), закодированных кодером временной области 220. 3N выборки должны быть закодированы кодером временной области 220 в этом случае.
Этот служебный сигнал может быть уменьшен в осуществлениях при использовании переключения окна, например, согласно структуре, которая используется в ААС. Фиг.3c иллюстрирует типичную последовательность Длинное, Начальное, 8 Коротких и окно Остановки, как они используются в ААС. На фиг.3с видно, что размеры окна, размеры сегментов данных и, следовательно, размеры областей наложения изменяются различными окнами. Последовательность, изображенная на фиг.3с, является примером для упомянутой выше последовательности.
Осуществления не должны быть ограничены окнами размером с окна ААС, однако осуществления используют окна с различными областями наложения и также окна различной длительности. В осуществлениях переходы к и от коротких окон могут использовать уменьшенное наложение, как, например, описано в работе Бернда Эдлера «Кодирование аудиосигналов с наложенным преобразованием и адаптивными функциями окна», Frequenz, том 43, номер 9, стр.252-256, сентябрь 1989, и "Общее кодирование кинофильмов и связанная с ним звукозапись: Перспективное звуковое кодирование", Международный Стандарт 13818-7, ISO/IEC JTC1/SC29/WG11 Экспертная группа по кинематографии, 1997, может быть использована в осуществлениях, чтобы уменьшить служебный сигнал для перехода к и от закодированных областей временной области, как показано на фиг.3d. Фиг.3d иллюстрирует четыре сегмента данных, из которых первые два и последний закодированы в частотной области, и третий закодирован во временной области. При переключении с частотной области на временную область используются различные окна с уменьшенным размером наложения, тем самым уменьшается служебный сигнал.
В осуществлениях переход может основываться на окнах Start (старт) и Stop (стоп), идентичных тем, которые используются в ААС. Соответствующие окна для переходов к и от закодированных областей временной области являются окнами только с маленькими областями наложения. В результате, служебный сигнал, то есть число дополнительных величин, которые будут переданы благодаря процессу переключения, существенно уменьшается. Обычно, служебный сигнал может быть Nov1/2 для каждого перехода с наложением окна Novl выборки. Таким образом, переход с обычным полностью наложенным окном, таким как ААС с Novl=1024, несет служебный сигнал 1024/2=512 выборок для левой стороны, то есть окно постепенного появления изображения, и 1024/2=512 выборок для правой стороны, то есть окно постепенного затемнения изображения, переход, заканчивающийся общим служебным сигналом 1024 (=N) выборок. Выбор уменьшенного окна наложения, такого как ААС Короткие блочные окна с Novl=128 только, приводит к полному служебному сигналу 128 выборок.
Осуществления могут использовать блок фильтров в кодере частотной области 230, как, например, широко используемый MDCT блок фильтров, однако другие осуществления могут также использоваться с кодерами-декодерами частотной области, основанными на другом косинусно-модулированном блоке фильтров. Он может включать производные MDCT, такие как расширенное наложенное преобразование или блоки или блоки фильтров с малой задержкой, так же как многофазные блоки фильтров, такие как, например, используемый в MPEG-1-Layer-1/2/3 звуковых кодерах-декодерах. В осуществлениях эффективное выполнение работы передних/задних блоков фильтров может учитывать определенный тип окна и сворачивание/разворачивание, используемое в блоке фильтров. Для каждого типа блока фильтров стадия анализа может быть эффективно осуществлена при помощи предварительной обработки и преобразования блоков, то есть DCT-подобный или DFT, для модуляции. В осуществлениях может быть выполнена соответствующая стадия синтеза при использовании соответствующего инверсионного преобразования и постобработки. Осуществления могут использовать только пред- и постобработку для закодированных частей сигнала временной области.
Осуществления данного изобретения позволяют обеспечить лучшую эффективность кодирования, поскольку переключения между кодером временной области 220 и кодером частотной области 230 могут производиться с введением очень низкого служебного сигнала. Только в секциях сигнала кодирования следующей временной области наложение может быть полностью опущено в осуществлениях. Осуществления устройства 100 позволяют согласованное декодирование закодированного потока данных.
Осуществления к тому же позволяют обеспечить то же самое качество, например, звукового сигнала при более низких скоростях кодирования, соответственно более высокое качество может быть достигнуто при той же самой скорости кодирования, поскольку соответствующие кодеры могут быть приспособлены к быстротечности звукового сигнала.
В зависимости от определенных требований методы изобретения могут реализовываться в аппаратных средствах или в программном обеспечении. Реализация может быть осуществлена с использованием цифрового носителя данных, в частности диска DVD или компакт-диска, имеющих электронно запоминающиеся сигналы управления, сохраняющиеся там, которые объединяются с программируемой компьютерной системой таким образом, чтобы реализовывались методы изобретения. В целом, данное изобретение, таким образом, является компьютерным программным продуктом, имеющим программный код, хранящийся в машиночитаемом носителе, программный код является действующим для реализации методов изобретения, когда компьютерный программный продукт запускается на компьютере. Другими словами, методы изобретения - это компьютерная программа, имеющая программный код для реализации, по крайней мере, одного метода изобретения, когда компьютерная программа запущена на компьютере.

Claims (40)

1. Устройство для декодирования сегментов данных, представляющих собой поток данных временной области, сегмент данных, закодированный во временной области или в частотной области, сегмент данных, закодированный в частотной области, имеющий последовательные блоки данных, представляющие собой последовательные и наложенные блоки выборок данных временной области, где два последовательных блока данных временной области, один из которых закодирован в частотной области, а другой закодирован во временной области, имеющем налагающуюся область временной области, характеризующееся тем, что включает декодер временной области для декодирования сегмента данных, закодированных во временной области, обеспечивающий получение выходных данных декодера временной области; процессор для обработки сегментов данных, закодированных в частотной области, и выходных данных декодера временной области для получения наложенных блоков данных временной области для налагающейся области временной области; и налагающий/добавляющий объединитель для соединения наложенных блоков данных временной области в налагающейся области временной области для получения декодированных сегментов данных потока данных временной области для налагающейся области временной области.
2. Устройство по п.1, характеризующееся тем, что процессор включает декодер частотной области для декодирования сегментов данных, закодированных в частотной области, для получения сегментов данных частотной области.
3. Устройство по п.1, характеризующееся тем, что процессор приспособлен для обработки сегмента данных, закодированных параллельно во временной области и в частотной области.
4. Устройство по п.2, характеризующееся тем, что процессор включает преобразователь временной области в частотную область для преобразования выходных данных декодера временной области для получения преобразованных сегментов данных частотной области.
5. Устройство по п.4, характеризующееся тем, что процессор включает объединитель частотной области для объединения сегментов данных частотной области и преобразованных сегментов данных частотной области для получения потока данных частотной области.
6. Устройство по п.5, характеризующееся тем, что процессор включает преобразователь частотной области во временную область для преобразования потока данных частотной области в наложенные блоки данных временной области.
7. Устройство по п.2, характеризующееся тем, что декодер частотной области далее включает стадию переквантизации сегментов данных частотной области.
8. Устройство по п.4, характеризующееся тем, что преобразователь временной области в частотную область включает косинусно-модулированный блок фильтров, расширенное наложенное преобразование, блок фильтров с малой задержкой, многофазный блок фильтров или модифицированное дискретное косинусное преобразование.
9. Устройство по п.5, характеризующееся тем, что объединитель частотной области включает сумматор.
10. Устройство по п.6, характеризующееся тем, что преобразователь частотной области во временную область включает косинусно-модулированный блок фильтров или измененное дискретное косинусное инверсионное преобразование.
11. Устройство по п.1, характеризующееся тем, что декодер временной области приспособлен для использования фильтра с предсказанием для декодирования сегмента данных, закодированных во временной области.
12. Устройство по п.1, характеризующееся тем, что процессор включает вычислитель для вычисления наложения блоков данных временной области, основанных на выходных данных декодера временной области.
13. Устройство по п.12, характеризующееся тем, что вычислитель приспособлен для воспроизведения свойства наложения преобразователя частотной области во временную область, основанного на выходных данных декодера временной области.
14. Устройство по п.13, характеризующееся тем, что вычислитель приспособлен для воспроизведения свойства наложения временной области преобразователя частотной области во временную область, основанного на выходных данных декодера временной области.
15. Устройство по п.6, характеризующееся тем, что преобразователь частотной области во временную область приспособлен для преобразования сегментов данных частотной области, произведенных декодером частотной области, в наложенные блоки данных временной области.
16. Устройство по п.15, характеризующееся тем, что налагающий/добавляющий объединитель приспособлен для соединения наложенных блоков данных временной области, произведенных преобразователем частотной области во временную область, и вычислителя для получения декодирования сегментов данных потока данных временной области.
17. Устройство по п.12, характеризующееся тем, что вычислитель включает стадию наложения временной области для наложения времени выходных данных декодера временной области для получения наложенных блоков данных временной области.
18. Устройство по п.12, характеризующееся тем, что вычислитель приспособлен для сегментации выхода декодера временной области в сегментах вычислителя, включающих 2N последовательные выборки, для применения весовых коэффициентов к 2N выборкам согласно функции окна анализа, для вычитания первых выборок N/2 в обратном порядке из вторых выборок N/2, для добавления последних выборок N/2 в обратном порядке к третьим выборкам N/2, для инвертирования вторых и третьих выборок N/2, для замены первых выборок N/2 на обращенную во времени и инвертированную версию вторых выборок N/2, для замены четвертых выборок N/2 на обращенную во времени версию третьих выборок N/2 и для применения весовых коэффициентов к 2/N выборкам согласно функции синтеза, реализуемой посредством организации окна.
19. Устройство по п.6, характеризующееся тем, что налагающий/добавляющий объединитель приспособлен для применения весовых коэффициентов согласно функции синтеза, реализуемой посредством организации окна, к наложенным блокам данных временной области, произведенным преобразователем частотной области во временную область.
20. Устройство по п.19, характеризующееся тем, что налагающий/добавляющий объединитель приспособлен для применения весовых коэффициентов согласно функции синтеза, реализуемой посредством организации окна, приспособленной к размеру наложенной области последовательных наложенных блоков данных временной области.
21. Устройство по п.20, характеризующееся тем, что вычислитель приспособлен для применения весовых коэффициентов к 2N выборкам согласно функции анализа, реализуемой посредством организации окна, приспособленной к размеру наложенной области последовательных наложенных блоков данных временной области, и в котором вычислитель приспособлен для применения весовых коэффициентов к 2N выборкам согласно функции синтеза, реализуемой посредством организации окна, приспособленной к размеру наложенной области.
22. Устройство по п.1, характеризующееся тем, что размер наложенной области двух последовательных блоков данных временной области, закодированных в частотной области, больше чем размер наложенной области двух последовательных блоков данных временной области, одна из которых закодирована в частотной области, а другая закодирована во временной области.
23. Устройство по п.1, характеризующееся тем, что наложение блоков данных определяется согласно спецификациям усовершенствованного аудиокодирования (спецификациям ААС).
24. Устройство по п.1, характеризующееся тем, что далее включающий обход для процессора и налагающего/добавляющего объединителя, обход приспособлен для обхода процессора и налагающего/добавляющего объединителя, когда не наложенные последовательные блоки данных временной области появляются в сегментах данных, закодированных во временной области.
25. Способ декодирования сегментов данных, представляющих собой поток данных временной области, сегмент данных, закодированных во временной области или в частотной области, сегмент данных, закодированных в частотной области, имеющий последовательные блоки данных, представляющих собой последовательные и наложенные блоки выборок данных временной области, где два последовательных блока данных временной области, один из которых закодирован в частотной области, а другой закодирован во временной области, имеющей налагающуюся область временной области, характеризующийся тем, что включает стадии декодирования сегмента данных, закодированных во временной области, чтобы получить выходные данные декодера временной области; обработки сегмента данных, закодированных в частотной области, и выходных данных декодера временной области для получения наложенных блоков данных временной области для налагающейся области временной области; и объединения наложенных блоков данных временной области в налагающейся области временной области для получения декодированных сегментов данных потока данных временной области для налагающейся области временной области.
26. Машиночитаемый носитель, содержащий сохраненную на нем компьютерную программу с программным кодом, для реализации способа по п.25, когда программный код запущен на компьютере.
27. Устройство для генерирования закодированного потока данных, основанного на потоке данных временной области, поток данных временной области, имеющий выборки сигнала, характеризующееся тем, что включает сегментный процессор для производства сегментов данных из потока данных, два последовательных сегмента данных, имеющих первую или вторую область наложения, вторая область наложения меньше, чем первая область наложения; кодер временной области для кодирования оконных сегментов данных во временной области; кодер частотной области для применения весовых коэффициентов к выборкам потока данных временной области согласно первой или второй функции, реализуемой посредством организации окна, для получения оконных сегментов данных, первая и вторая функции, реализуемые посредством организации окна, приспособлены для первой и второй области наложения, кодер частотной области приспособлен для кодирования оконных сегментов данных в частотной области; анализатор данных временной области для определения переходного индикатора, связанного с сегментом данных; и контроллер для управления устройством генерирования закодированного потока данных, имеющих первый переходный индикатор, связанный с сегментом данных для указания уровня переходных процессов потока данных, выходные данные кодера временной области включены в закодированный поток данных и для сегментов данных, имеющих второй переходный индикатор, связанный с сегментом данных для указания уровня переходных процессов потока данных, выходные данные кодера частотной области включены в закодированный поток данных.
28. Устройство по п.27, характеризующееся тем, что анализатор данных временной области приспособлен для определения переходного индикатора из потока данных временной области, сегментов данных или из данных, непосредственно производимых сегментным процессором.
29. Устройство по п.27, характеризующееся тем, что анализатор данных временной области приспособлен для определения переходного показателя, переходный показатель основывается на уровне переходных процессов в потоке данных временной области или сегменте данных, и в котором переходный индикатор указывает, превышает ли уровень переходных процессов заранее установленный порог.
30. Устройство по п.27, характеризующееся тем, что сегментный процессор приспособлен для производства сегментов данных с первой и второй областями наложения, кодер временной области приспособлен для кодирования сегментов данных, кодер частотной области приспособлен для кодирования оконных сегментов данных, и контроллер приспособлен для управления кодером временной области и кодером частотной области, таким, какой используется для сегментов данных, имеющих первый переходный индикатор, выходные данные кодера временной области включены в закодированный поток данных и для оконных сегментов данных, имеющих второй переходный индикатор, выходные данные кодера частотной области включены в закодированный поток данных.
31. Устройство по п.27, характеризующееся тем, что контроллер приспособлен для управления сегментным процессором для производства сегментных данных либо для кодера временной области, либо для кодера частотной области.
32. Устройство по п.27, характеризующееся тем, что кодер частотной области приспособлен для применения весовых коэффициентов функций, реализуемых посредством организации окна, согласно спецификации ААС.
33. Устройство по п.27, характеризующееся тем, что кодер частотной области приспособлен для преобразования оконных сегментов данных в частотную область для получения сегмента данных частотной области.
34. Устройство по п.33, характеризующееся тем, что кодер частотной области приспособлен для квантования сегмента данных частотной области.
35. Устройство по п.34, характеризующееся тем, что кодер частотной области приспособлен для оценки сегмента данных частотной области согласно перцепционной модели.
36. Устройство по п.35, характеризующееся тем, что кодер частотной области приспособлен для использования косинусно-модулированного блока фильтров, расширенного наложенного преобразования, блока фильтров с малой задержкой или многофазного блока фильтров для получения сегментов данных частотной области.
37. Устройство по п.33, характеризующееся тем, что кодер частотной области приспособлен для использования модифицированного дискретного косинусного преобразования для получения сегментов данных частотной области.
38. Устройство по п.27, характеризующееся тем, что кодер временной области приспособлен для использования фильтра с предсказанием для кодирования сегментов данных.
39. Способ генерирования закодированного потока данных, основанного на потоке данных временной области, поток данных временной области, имеющий выборки сигнала, характеризующийся тем, что включает производство сегментов данных из потока данных, двух последовательных сегментов данных, имеющих первую или вторую область наложения, вторая область наложения меньше, чем первая область наложения; определение переходного индикатора, связанного с сегментами данных; кодирование сегмента данных во временной области и/или применение весовых коэффициентов к выборке потока данных временной области согласно первой или второй функции, реализуемой посредством организации окна, для получения оконного сегмента данных, первая и вторая функции, реализуемые посредством организации окна, приспособлены к первой и второй области наложения и кодирования оконного сегмента данных в частотной области; и управление, такое, какое используется для сегментов данных, имеющих первый переходный индикатор, выходные данные, закодированные во временной области, включены в закодированный поток данных, и для сегментов данных, имеющих второй переходный индикатор, выходные данные, закодированные в частотной области, включены в закодированный поток данных.
40. Машиночитаемый носитель, содержащий сохраненную на нем компьютерную программу с программным кодом, для реализации способа по п.39, когда программный код запущен на компьютере.
RU2009117569/07A 2006-12-12 2007-12-07 Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области RU2444071C2 (ru)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US86967006P 2006-12-12 2006-12-12
US60/869,670 2006-12-12

Publications (2)

Publication Number Publication Date
RU2009117569A RU2009117569A (ru) 2011-01-20
RU2444071C2 true RU2444071C2 (ru) 2012-02-27

Family

ID=39410130

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009117569/07A RU2444071C2 (ru) 2006-12-12 2007-12-07 Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области

Country Status (20)

Country Link
US (8) US8818796B2 (ru)
EP (1) EP2052548B1 (ru)
JP (1) JP5171842B2 (ru)
KR (1) KR101016224B1 (ru)
CN (2) CN102395033B (ru)
AT (1) ATE547898T1 (ru)
AU (1) AU2007331763B2 (ru)
BR (2) BR122019024992B1 (ru)
CA (1) CA2672165C (ru)
ES (1) ES2383217T3 (ru)
HK (2) HK1126602A1 (ru)
IL (1) IL198725A (ru)
MX (1) MX2009006201A (ru)
MY (1) MY148913A (ru)
NO (1) NO342080B1 (ru)
PL (1) PL2052548T3 (ru)
RU (1) RU2444071C2 (ru)
TW (1) TWI363563B (ru)
WO (1) WO2008071353A2 (ru)
ZA (1) ZA200903159B (ru)

Families Citing this family (73)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8630863B2 (en) * 2007-04-24 2014-01-14 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding audio/speech signal
WO2008151137A2 (en) * 2007-06-01 2008-12-11 The Trustees Of Columbia University In The City Of New York Real-time time encoding and decoding machines
WO2009006405A1 (en) 2007-06-28 2009-01-08 The Trustees Of Columbia University In The City Of New York Multi-input multi-output time encoding and decoding machines
ATE518224T1 (de) 2008-01-04 2011-08-15 Dolby Int Ab Audiokodierer und -dekodierer
WO2010003521A1 (en) * 2008-07-11 2010-01-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method and discriminator for classifying different segments of a signal
ES2558229T3 (es) * 2008-07-11 2016-02-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar tramas de señales de audio muestreadas
EP3002751A1 (en) 2008-07-11 2016-04-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder for encoding and decoding audio samples
EP2144230A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
AU2009267518B2 (en) * 2008-07-11 2012-08-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme
ES2683077T3 (es) * 2008-07-11 2018-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada
PL3002750T3 (pl) * 2008-07-11 2018-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koder i dekoder audio do kodowania i dekodowania próbek audio
MX2011000375A (es) 2008-07-11 2011-05-19 Fraunhofer Ges Forschung Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada.
PT2146344T (pt) * 2008-07-17 2016-10-13 Fraunhofer Ges Forschung Esquema de codificação/descodificação de áudio com uma derivação comutável
CN102216982A (zh) * 2008-09-18 2011-10-12 韩国电子通信研究院 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备
EP3640941A1 (en) * 2008-10-08 2020-04-22 Fraunhofer Gesellschaft zur Förderung der Angewand Multi-resolution switched audio encoding/decoding scheme
FR2936898A1 (fr) * 2008-10-08 2010-04-09 France Telecom Codage a echantillonnage critique avec codeur predictif
KR101649376B1 (ko) 2008-10-13 2016-08-31 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
WO2010044593A2 (ko) 2008-10-13 2010-04-22 한국전자통신연구원 Mdct 기반 음성/오디오 통합 부호화기의 lpc 잔차신호 부호화/복호화 장치
KR101315617B1 (ko) * 2008-11-26 2013-10-08 광운대학교 산학협력단 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기
US9384748B2 (en) 2008-11-26 2016-07-05 Electronics And Telecommunications Research Institute Unified Speech/Audio Codec (USAC) processing windows sequence based mode switching
US8457975B2 (en) * 2009-01-28 2013-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program
WO2011013983A2 (en) 2009-07-27 2011-02-03 Lg Electronics Inc. A method and an apparatus for processing an audio signal
WO2011034375A2 (en) * 2009-09-17 2011-03-24 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US20110087494A1 (en) * 2009-10-09 2011-04-14 Samsung Electronics Co., Ltd. Apparatus and method of encoding audio signal by switching frequency domain transformation scheme and time domain transformation scheme
KR101137652B1 (ko) * 2009-10-14 2012-04-23 광운대학교 산학협력단 천이 구간에 기초하여 윈도우의 오버랩 영역을 조절하는 통합 음성/오디오 부호화/복호화 장치 및 방법
BR122020024243B1 (pt) * 2009-10-20 2022-02-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Codificador de sinal de áudio, decodificador de sinal de áudio, método para prover uma representação codificada de um conteúdo de áudio e método para prover uma representação decodificada de um conteúdo de áudio.
AU2010309838B2 (en) * 2009-10-20 2014-05-08 Dolby International Ab Audio signal encoder, audio signal decoder, method for encoding or decoding an audio signal using an aliasing-cancellation
CA3025108C (en) 2010-07-02 2020-10-27 Dolby International Ab Audio decoding with selective post filtering
PL4120248T3 (pl) 2010-07-08 2024-05-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder wykorzystujący kasowanie aliasingu w przód
KR101826331B1 (ko) * 2010-09-15 2018-03-22 삼성전자주식회사 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법
JP6148983B2 (ja) 2010-12-29 2017-06-14 サムスン エレクトロニクス カンパニー リミテッド 高周波数帯域幅拡張のための符号化/復号化装置及びその方法
US9807424B2 (en) 2011-01-10 2017-10-31 Qualcomm Incorporated Adaptive selection of region size for identification of samples in a transition zone for overlapped block motion compensation
WO2012109407A1 (en) 2011-02-09 2012-08-16 The Trustees Of Columbia University In The City Of New York Encoding and decoding machine with recurrent neural networks
EP4243017A3 (en) 2011-02-14 2023-11-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method decoding an audio signal using an aligned look-ahead portion
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
MX2013009345A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Codificacion y decodificacion de posiciones de los pulsos de las pistas de una señal de audio.
MY159444A (en) * 2011-02-14 2017-01-13 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E V Encoding and decoding of pulse positions of tracks of an audio signal
CA2827266C (en) * 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
MX2013009305A (es) 2011-02-14 2013-10-03 Fraunhofer Ges Forschung Generacion de ruido en codecs de audio.
MX2013009346A (es) 2011-02-14 2013-10-01 Fraunhofer Ges Forschung Prediccion lineal basada en esquema de codificacion utilizando conformacion de ruido de dominio espectral.
PL2661745T3 (pl) 2011-02-14 2015-09-30 Fraunhofer Ges Forschung Urządzenie i sposób do ukrywania błędów w zunifikowanym kodowaniu mowy i audio
ES2529025T3 (es) 2011-02-14 2015-02-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y método para procesar una señal de audio decodificada en un dominio espectral
JP5712288B2 (ja) * 2011-02-14 2015-05-07 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 重複変換を使用した情報信号表記
FR2977439A1 (fr) * 2011-06-28 2013-01-04 France Telecom Fenetres de ponderation en codage/decodage par transformee avec recouvrement, optimisees en retard.
US10084818B1 (en) 2012-06-07 2018-09-25 Amazon Technologies, Inc. Flexibly configurable data modification services
US9590959B2 (en) 2013-02-12 2017-03-07 Amazon Technologies, Inc. Data security service
US9286491B2 (en) 2012-06-07 2016-03-15 Amazon Technologies, Inc. Virtual service provider zones
US10075471B2 (en) 2012-06-07 2018-09-11 Amazon Technologies, Inc. Data loss prevention techniques
US10467422B1 (en) 2013-02-12 2019-11-05 Amazon Technologies, Inc. Automatic key rotation
US10210341B2 (en) * 2013-02-12 2019-02-19 Amazon Technologies, Inc. Delayed data access
US9547771B2 (en) 2013-02-12 2017-01-17 Amazon Technologies, Inc. Policy enforcement with associated data
US9705674B2 (en) 2013-02-12 2017-07-11 Amazon Technologies, Inc. Federated key management
US10211977B1 (en) 2013-02-12 2019-02-19 Amazon Technologies, Inc. Secure management of information using a security module
US9367697B1 (en) 2013-02-12 2016-06-14 Amazon Technologies, Inc. Data security with a security module
US9300464B1 (en) 2013-02-12 2016-03-29 Amazon Technologies, Inc. Probabilistic key rotation
US9608813B1 (en) 2013-06-13 2017-03-28 Amazon Technologies, Inc. Key rotation techniques
CN110232929B (zh) 2013-02-20 2023-06-13 弗劳恩霍夫应用研究促进协会 用于对音频信号进行译码的译码器和方法
RU2643662C2 (ru) * 2013-08-23 2018-02-02 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Устройство и способ для обработки звукового сигнала с использованием комбинирования в диапазоне перекрытия
CN104681034A (zh) 2013-11-27 2015-06-03 杜比实验室特许公司 音频信号处理
US9397835B1 (en) 2014-05-21 2016-07-19 Amazon Technologies, Inc. Web of trust management in a distributed system
US9438421B1 (en) 2014-06-27 2016-09-06 Amazon Technologies, Inc. Supporting a fixed transaction rate with a variably-backed logical cryptographic key
WO2016022982A1 (en) 2014-08-08 2016-02-11 University Of Florida Research Foundation, Inc. Joint fountain coding and network coding for loss-tolerant information spreading
US9866392B1 (en) 2014-09-15 2018-01-09 Amazon Technologies, Inc. Distributed system web of trust provisioning
KR101626280B1 (ko) * 2014-11-05 2016-06-01 주식회사 디오텍 합성음의 고조파 성분 제거 방법 및 장치
US10469477B2 (en) 2015-03-31 2019-11-05 Amazon Technologies, Inc. Key export techniques
WO2017050398A1 (en) * 2015-09-25 2017-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder and methods for signal-adaptive switching of the overlap ratio in audio transform coding
US10014906B2 (en) * 2015-09-25 2018-07-03 Microsemi Semiconductor (U.S.) Inc. Acoustic echo path change detection apparatus and method
US10230388B2 (en) * 2015-12-30 2019-03-12 Northwestern University System and method for energy efficient time domain signal processing
WO2017161122A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for live video streaming using delay-aware fountain codes
WO2017161124A1 (en) * 2016-03-16 2017-09-21 University Of Florida Research Foundation, Incorporated System for video streaming using delay-aware fountain codes
EP3276620A1 (en) 2016-07-29 2018-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain aliasing reduction for non-uniform filterbanks which use spectral analysis followed by partial synthesis
JPWO2018198454A1 (ja) * 2017-04-28 2019-06-27 ソニー株式会社 情報処理装置、および情報処理方法
US11467831B2 (en) * 2018-12-18 2022-10-11 Northwestern University System and method for pipelined time-domain computing using time-domain flip-flops and its application in time-series analysis

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990009022A1 (en) * 1989-01-27 1990-08-09 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder and encoder/decoder for high-quality audio
EP0575675A1 (en) * 1992-06-26 1993-12-29 Discovision Associates Method and arrangement for transformation of signals from a frequency to a time domaine
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
EP1396844A1 (en) * 2002-09-04 2004-03-10 Microsoft Corporation Unified lossy and lossless audio compression
US6807526B2 (en) * 1999-12-08 2004-10-19 France Telecom S.A. Method of and apparatus for processing at least one coded binary audio flux organized into frames
WO2005043511A1 (en) * 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding
RU2005135650A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Синтез аудиосигнала

Family Cites Families (85)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5230038A (en) * 1989-01-27 1993-07-20 Fielder Louis D Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
DE3902948A1 (de) 1989-02-01 1990-08-09 Telefunken Fernseh & Rundfunk Verfahren zur uebertragung eines signals
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5327518A (en) * 1991-08-22 1994-07-05 Georgia Tech Research Corporation Audio analysis/synthesis system
US5570455A (en) * 1993-01-19 1996-10-29 Philosophers' Stone Llc Method and apparatus for encoding sequences of data
DE69428119T2 (de) * 1993-07-07 2002-03-21 Picturetel Corp., Peabody Verringerung des hintergrundrauschens zur sprachverbesserung
US5651090A (en) * 1994-05-06 1997-07-22 Nippon Telegraph And Telephone Corporation Coding method and coder for coding input signals of plural channels using vector quantization, and decoding method and decoder therefor
US5615299A (en) * 1994-06-20 1997-03-25 International Business Machines Corporation Speech recognition using dynamic features
TW271524B (ru) * 1994-08-05 1996-03-01 Qualcomm Inc
WO1996019876A1 (en) * 1994-12-20 1996-06-27 Dolby Laboratories Licensing Corporation Method and apparatus for applying waveform prediction to subbands of a perceptual coding system
JP3158932B2 (ja) 1995-01-27 2001-04-23 日本ビクター株式会社 信号符号化装置及び信号復号化装置
US5669484A (en) * 1996-01-24 1997-09-23 Paulson; Tom J. Protective cover for the mini-slide knob of dimmers with mini-slide knobs
US5809459A (en) 1996-05-21 1998-09-15 Motorola, Inc. Method and apparatus for speech excitation waveform coding using multiple error waveforms
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
KR100261253B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6064954A (en) * 1997-04-03 2000-05-16 International Business Machines Corp. Digital audio signal coding
US6233550B1 (en) * 1997-08-29 2001-05-15 The Regents Of The University Of California Method and apparatus for hybrid coding of speech at 4kbps
US6006179A (en) * 1997-10-28 1999-12-21 America Online, Inc. Audio codec using adaptive sparse vector quantization with subband vector classification
US6249766B1 (en) * 1998-03-10 2001-06-19 Siemens Corporate Research, Inc. Real-time down-sampling system for digital audio waveform data
US6085163A (en) * 1998-03-13 2000-07-04 Todd; Craig Campbell Using time-aligned blocks of encoded audio in video/audio applications to facilitate audio switching
US6119080A (en) * 1998-06-17 2000-09-12 Formosoft International Inc. Unified recursive decomposition architecture for cosine modulated filter banks
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6188987B1 (en) * 1998-11-17 2001-02-13 Dolby Laboratories Licensing Corporation Providing auxiliary information with frame-based encoded audio information
US6311154B1 (en) * 1998-12-30 2001-10-30 Nokia Mobile Phones Limited Adaptive windows for analysis-by-synthesis CELP-type speech coding
US6226608B1 (en) * 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US6640209B1 (en) * 1999-02-26 2003-10-28 Qualcomm Incorporated Closed-loop multimode mixed-domain linear prediction (MDLP) speech coder
US6449592B1 (en) * 1999-02-26 2002-09-10 Qualcomm Incorporated Method and apparatus for tracking the phase of a quasi-periodic signal
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US6604070B1 (en) * 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
CA2809775C (en) * 1999-10-27 2017-03-21 The Nielsen Company (Us), Llc Audio signature extraction and correlation
US6868377B1 (en) * 1999-11-23 2005-03-15 Creative Technology Ltd. Multiband phase-vocoder for the modification of audio or speech signals
JP3630609B2 (ja) * 2000-03-29 2005-03-16 パイオニア株式会社 音声情報再生方法ならびに装置
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US7020605B2 (en) * 2000-09-15 2006-03-28 Mindspeed Technologies, Inc. Speech coding system with time-domain noise attenuation
US7010480B2 (en) * 2000-09-15 2006-03-07 Mindspeed Technologies, Inc. Controlling a weighting filter based on the spectral content of a speech signal
US7472059B2 (en) * 2000-12-08 2008-12-30 Qualcomm Incorporated Method and apparatus for robust speech classification
US6738739B2 (en) * 2001-02-15 2004-05-18 Mindspeed Technologies, Inc. Voiced speech preprocessing employing waveform interpolation or a harmonic model
US7283954B2 (en) 2001-04-13 2007-10-16 Dolby Laboratories Licensing Corporation Comparing audio using characterizations based on auditory events
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
US7333929B1 (en) * 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
JP3750583B2 (ja) * 2001-10-22 2006-03-01 ソニー株式会社 信号処理方法及び装置、並びに信号処理プログラム
EP1484841B1 (en) * 2002-03-08 2018-12-26 Nippon Telegraph And Telephone Corporation DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM
US7366659B2 (en) * 2002-06-07 2008-04-29 Lucent Technologies Inc. Methods and devices for selectively generating time-scaled sound signals
JP4022111B2 (ja) * 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7295970B1 (en) * 2002-08-29 2007-11-13 At&T Corp Unsupervised speaker segmentation of multi-speaker speech data
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
JP3870880B2 (ja) * 2002-09-04 2007-01-24 住友電装株式会社 導線と圧接端子との接続構造
CN1689070A (zh) * 2002-10-14 2005-10-26 皇家飞利浦电子股份有限公司 信号滤波
KR101008529B1 (ko) * 2002-12-19 2011-01-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 인코딩에서의 정현파 선택
AU2003208517A1 (en) * 2003-03-11 2004-09-30 Nokia Corporation Switching between coding schemes
JP2004302259A (ja) 2003-03-31 2004-10-28 Matsushita Electric Ind Co Ltd 音響信号の階層符号化方法および階層復号化方法
US7325023B2 (en) 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
AU2003291862A1 (en) * 2003-12-01 2005-06-24 Aic A highly optimized method for modelling a windowed signal
FR2865310A1 (fr) 2004-01-20 2005-07-22 France Telecom Procede de restauration de partiels d'un signal sonore
US7516064B2 (en) * 2004-02-19 2009-04-07 Dolby Laboratories Licensing Corporation Adaptive hybrid transform for signal analysis and synthesis
US7596486B2 (en) * 2004-05-19 2009-09-29 Nokia Corporation Encoding an audio signal using different audio coder modes
US7649988B2 (en) * 2004-06-15 2010-01-19 Acoustic Technologies, Inc. Comfort noise generator using modified Doblinger noise estimate
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US8326606B2 (en) * 2004-10-26 2012-12-04 Panasonic Corporation Sound encoding device and sound encoding method
GB2420846B (en) * 2004-12-04 2009-07-08 Ford Global Technologies Llc A cooling system for a motor vehicle engine
US20070147518A1 (en) * 2005-02-18 2007-06-28 Bruno Bessette Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
BRPI0608756B1 (pt) * 2005-03-30 2019-06-04 Koninklijke Philips N. V. Codificador e decodificador de áudio de multicanais, método para codificar e decodificar um sinal de áudio de n canais, sinal de áudio de multicanais codificado para um sinal de áudio de n canais e sistema de transmissão
US7418394B2 (en) 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US7571104B2 (en) * 2005-05-26 2009-08-04 Qnx Software Systems (Wavemakers), Inc. Dynamic real-time cross-fading of voice prompts
US7546240B2 (en) * 2005-07-15 2009-06-09 Microsoft Corporation Coding with improved time resolution for selected segments via adaptive block transformation of a group of samples from a subband decomposition
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
KR100643310B1 (ko) * 2005-08-24 2006-11-10 삼성전자주식회사 음성 데이터의 포먼트와 유사한 교란 신호를 출력하여송화자 음성을 차폐하는 방법 및 장치
US7953605B2 (en) 2005-10-07 2011-05-31 Deepen Sinha Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension
KR100647336B1 (ko) * 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
CN1963917A (zh) * 2005-11-11 2007-05-16 株式会社东芝 评价语音的分辨力、说话人认证的注册和验证方法及装置
US7805297B2 (en) * 2005-11-23 2010-09-28 Broadcom Corporation Classification-based frame loss concealment for audio signals
EP1855436A1 (en) 2006-05-12 2007-11-14 Deutsche Thomson-Brandt Gmbh Method and apparatus for encrypting encoded audio signal
WO2007148925A1 (en) * 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
US8036903B2 (en) * 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
DE102006051673A1 (de) * 2006-11-02 2008-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
KR100964402B1 (ko) * 2006-12-14 2010-06-17 삼성전자주식회사 오디오 신호의 부호화 모드 결정 방법 및 장치와 이를 이용한 오디오 신호의 부호화/복호화 방법 및 장치
KR101334366B1 (ko) * 2006-12-28 2013-11-29 삼성전자주식회사 오디오 배속 재생 방법 및 장치
KR100883656B1 (ko) * 2006-12-28 2009-02-18 삼성전자주식회사 오디오 신호의 분류 방법 및 장치와 이를 이용한 오디오신호의 부호화/복호화 방법 및 장치
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8050934B2 (en) * 2007-11-29 2011-11-01 Texas Instruments Incorporated Local pitch control based on seamless time scale modification and synchronized sampling rate conversion
KR101441896B1 (ko) * 2008-01-29 2014-09-23 삼성전자주식회사 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치
US8364481B2 (en) * 2008-07-02 2013-01-29 Google Inc. Speech recognition with parallel recognition tasks
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990009022A1 (en) * 1989-01-27 1990-08-09 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder and encoder/decoder for high-quality audio
EP0575675A1 (en) * 1992-06-26 1993-12-29 Discovision Associates Method and arrangement for transformation of signals from a frequency to a time domaine
RU2214047C2 (ru) * 1997-11-19 2003-10-10 Самсунг Электроникс Ко., Лтд. Способ и устройство для масштабируемого кодирования/декодирования аудиосигналов
US6807526B2 (en) * 1999-12-08 2004-10-19 France Telecom S.A. Method of and apparatus for processing at least one coded binary audio flux organized into frames
EP1396844A1 (en) * 2002-09-04 2004-03-10 Microsoft Corporation Unified lossy and lossless audio compression
RU2005135650A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Синтез аудиосигнала
WO2005043511A1 (en) * 2003-10-30 2005-05-12 Koninklijke Philips Electronics N.V. Audio signal encoding or decoding

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HEUSDENS R. et al, Optimal Time Segmentation for Overlap-Add Systems With Variable Amount of Window Overlap, IEEE SIGNAL PROCESSING LETTERS, IEEE SERVICE CENTER, PISCATAWAY, vol.12, no.10, 1 October 2005, abstract. *

Also Published As

Publication number Publication date
ATE547898T1 (de) 2012-03-15
NO20092506L (no) 2009-09-10
US9653089B2 (en) 2017-05-16
KR101016224B1 (ko) 2011-02-25
WO2008071353A2 (en) 2008-06-19
HK1126602A1 (en) 2009-09-04
US9355647B2 (en) 2016-05-31
US10714110B2 (en) 2020-07-14
US20130282389A1 (en) 2013-10-24
WO2008071353A3 (en) 2008-08-21
HK1168706A1 (en) 2013-01-04
US9043202B2 (en) 2015-05-26
ES2383217T3 (es) 2012-06-19
BRPI0718738B1 (pt) 2023-05-16
IL198725A0 (en) 2010-02-17
CN101589623A (zh) 2009-11-25
BRPI0718738A8 (pt) 2018-10-16
JP5171842B2 (ja) 2013-03-27
US11581001B2 (en) 2023-02-14
MY148913A (en) 2013-06-14
IL198725A (en) 2016-03-31
US20200335117A1 (en) 2020-10-22
CA2672165C (en) 2014-07-29
US20230154475A1 (en) 2023-05-18
US8812305B2 (en) 2014-08-19
EP2052548B1 (en) 2012-02-29
CN101589623B (zh) 2013-03-13
CN102395033B (zh) 2014-08-27
ZA200903159B (en) 2010-07-28
JP2010512550A (ja) 2010-04-22
KR20090085655A (ko) 2009-08-07
BR122019024992B1 (pt) 2021-04-06
AU2007331763B2 (en) 2011-06-30
US20140222442A1 (en) 2014-08-07
TW200841743A (en) 2008-10-16
US8818796B2 (en) 2014-08-26
CN102395033A (zh) 2012-03-28
US20170249952A1 (en) 2017-08-31
RU2009117569A (ru) 2011-01-20
CA2672165A1 (en) 2008-06-19
MX2009006201A (es) 2009-06-22
PL2052548T3 (pl) 2012-08-31
NO342080B1 (no) 2018-03-19
TWI363563B (en) 2012-05-01
US20160225383A1 (en) 2016-08-04
US20150179183A1 (en) 2015-06-25
US11961530B2 (en) 2024-04-16
AU2007331763A1 (en) 2008-06-19
US20100138218A1 (en) 2010-06-03
BRPI0718738A2 (pt) 2015-03-24
EP2052548A2 (en) 2009-04-29

Similar Documents

Publication Publication Date Title
RU2444071C2 (ru) Кодер, декодер и методы кодирования и декодирования сегментов данных, представляющих собой поток данных временной области
EP2405425B1 (en) Apparatus, method and computer program for upmixing a downmix audio signal using a phase value smoothing
RU2625444C2 (ru) Система обработки аудио
US8639519B2 (en) Method and apparatus for selective signal coding based on core encoder performance
Britanak et al. Cosine-/Sine-Modulated Filter Banks
CN113196386A (zh) 用于控制多声道音频帧丢失隐藏的方法和装置
KR102654181B1 (ko) 예측 코딩에서 저비용 에러 복구를 위한 방법 및 장치