RU2563164C2 - Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер - Google Patents
Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер Download PDFInfo
- Publication number
- RU2563164C2 RU2563164C2 RU2012102411/08A RU2012102411A RU2563164C2 RU 2563164 C2 RU2563164 C2 RU 2563164C2 RU 2012102411/08 A RU2012102411/08 A RU 2012102411/08A RU 2012102411 A RU2012102411 A RU 2012102411A RU 2563164 C2 RU2563164 C2 RU 2563164C2
- Authority
- RU
- Russia
- Prior art keywords
- window
- signal
- frequency
- analysis
- audio signal
- Prior art date
Links
- 238000004458 analytical method Methods 0.000 claims abstract description 169
- 230000005236 sound signal Effects 0.000 claims abstract description 154
- 230000006870 function Effects 0.000 claims description 192
- 230000015572 biosynthetic process Effects 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 57
- 238000003786 synthesis reaction Methods 0.000 claims description 48
- 230000000052 comparative effect Effects 0.000 claims description 45
- 238000001228 spectrum Methods 0.000 claims description 33
- 230000003595 spectral effect Effects 0.000 claims description 27
- 230000000875 corresponding effect Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 16
- 238000012546 transfer Methods 0.000 claims description 15
- 230000008569 process Effects 0.000 claims description 14
- 238000006243 chemical reaction Methods 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 6
- 238000002156 mixing Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 230000001131 transforming effect Effects 0.000 claims description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 4
- 239000000126 substance Substances 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 29
- 238000004422 calculation algorithm Methods 0.000 description 18
- 230000008901 benefit Effects 0.000 description 10
- 238000013461 design Methods 0.000 description 10
- 230000010076 replication Effects 0.000 description 9
- 238000013459 approach Methods 0.000 description 8
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 241001270131 Agaricus moelleri Species 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- OFHCOWSQAMBJIW-AVJTYSNKSA-N alfacalcidol Chemical compound C1(/[C@@H]2CC[C@@H]([C@]2(CCC1)C)[C@H](C)CCCC(C)C)=C\C=C1\C[C@@H](O)C[C@H](O)C1=C OFHCOWSQAMBJIW-AVJTYSNKSA-N 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008447 perception Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/04—Time compression or expansion
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Изобретение относится к средствам расширения полосы пропускания. Технический результат заключается в улучшении акустических качеств выходного аудиосигнала. Кодер для кодирования аудиосигнала включает в себя анализатора сигнала, корневой кодер и вычислитель параметров. Аудиосигнал содержит низкочастотный сигнал, включающий в себя полосу центральной частоты, и высокочастотный сигнал, включающий в себя полосу верхних частот. Анализатор сигналов предназначен для анализа аудиосигнала, содержащего блок аудиоотсчетов, который имеет некоторую протяженность во времени. Анализатор сигналов также предназначен для выбора из множества окон анализа окна анализа для использования при расширении полосы пропускания на стороне декодера расширения полосы пропускания. Корневой кодер для кодирования низкочастотного сигнала с получением кодированного сигнала или сигнала с частотным кодированием. Вычислитель параметров предназначен для расчета параметров расширения полосы пропускания на основе высокочастотного сигнала. 16 н. и 7 з.п. ф-лы, 15 ил.
Description
Заявляемое изобретение относится к цифровой обработке аудиосигнала, в частности, к кодеру расширения полосы пропускания, способу кодирования звукового сигнала, декодеру расширения полосы пропускания, способу декодирования кодированного аудиосигнала, фазовому вокодеру и аудиосигналу.
Вместе с тем, конструктивные решения по настоящему изобретению имеют целью применение фазового вокодера для автономного растягивания временной шкалы независимо от расширения полосы пропускания.
Процесс накопления или передачи звуковых сигналов часто строго ограничен скоростью передачи данных. Причиной таких ограничений чаще всего служит применение кодеров/декодеров („кодеков"), которые эффективно сжимают аудиосигнал для обеспечения скорости обмена информацией при хранении или передаче сигнала. Раньше, когда была доступна только низкая скорость передачи данных (низкий битрейт), кодеры вынужденно резко сужали ширину полосы пропускания звуковых частот. Современные аудиокодеки могут кодировать широкополосные сигналы, используя методы расширения полосы пропускания (BWE), что описано в литературе: М. Dietz, L. Liljeryd, К. Kjörling and О. Kunz, "Spectral Band Replication, a novel approach in audio coding," [„Репликация спектральных полос (SBR), новый подход в кодировании звука"], in 112th AES Convention, Munich, May 2002; S. Meltzer, R. Böhm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," [„ Усовершенствованные аудиокодеки с репликацией спектральных полос (SBR) для цифрового радиовещания, такого как „Всемирное цифровое радио (DRM)"] in 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3PRO Algorithm," [„Расширение mp3 с SBR: особенности и возможности нового алгоритма mpSPRO "] in 112th AES Convention, Munich, May 2002; Международный стандарт ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," [„Расширение полосы пропускания"] ISO/IEC, 2002; "Speech bandwidth extension method and apparatus" [„Способ и устройство расширения полосы пропускания речи"], Vasu Iyengar et al. US Patent 5,455,888; E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech [Эффективное расширение высокочастотного диапазона в музыке и речи]. In AES 112th Convention, Munich, Germany, May 2002; R. M. Aarts, E. Larsen, and O. Ouweltjes. A unified approach to low- and high-frequency bandwidth extension [Унифицированный подход к расширению низко- и высокочастотной полосы пропускания]. In AES 115th Convention, New York, USA, October 2003; K. Käyhkö. A Robust Wideband Enhancement for Narrowband Speech Signal [Мощное широкополосное расширение узкополосного голосового сигнала.]. Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio Signal Processing, 2001; E. Larsen and R. M. Aarts. Audio Bandwidth Extension - Application to psychoacoustics, Signal Processing and Loudspeaker Design [Расширение полосы пропускания звуковых частот - применение в психоакустике, обработке сигналов и конструировании громкоговорителей]. John Wiley & Sons, Ltd, 2004; E. Larsen, R. M. Aarts, and M. Danessis. Efficient high-frequency bandwidth extension of music and speech [Эффективное расширение высокочастотного диапазона в музыке и речи]. In AES 112th Convention, Munich, Germany, May 2002; J. Makhoul. Spectral Analysis of Speech by Linear Prediction [Спектральный анализ речи с помощью линейного предсказания]. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973; United States Patent Application 08/951,029, Ohmori, et al. Audio band width extending system and method [Система и способ расширения диапазона звуковых частот]; United States Patent 6895375, Malah, D & Cox, R. V.: System for bandwidth extension of Narrow-band speech [Система для расширения диапазона частот узкополосной речи]; и Frederik Nagel, Sascha Disch, "A harmonic bandwidth extension method for audio codecs," [„Метод расширения гармонического диапазона частот для аудиокодеков"], ICASSP International Conference on Acoustics, Speech and Signal Processing, IEEE CNF, Taipei, Taiwan, April 2009.
Такие алгоритмы основаны на параметрическом представлении высокочастотного контента (ВЧ). Это представление генерируется из низкочастотной составляющей (НЧ) декодированного сигнала посредством транспонирования в ВЧ спектральную область („патчированием") и применением полученного параметра для последующей обработки сигнала.
На существующем уровне техники известны такие методы расширения полосы пропускания, как репликация спектральных полос (SBR) или гармоническое расширение полосы пропускания (НВЕ). Далее будут кратко рассмотрены эти два метода BWE.
С одной стороны, репликация спектральных полос (SBR), как описано в М. Dietz, L. Liljeryd, К. Kjörling and О. Kunz, "Spectral Band Replication, a novel approach in audio coding," [„Репликация спектральных полос (SBR), новый подход в кодировании звука"], in 112th AES Convention, Munich, May 2002, для генерации ВЧ характеристик использован банк квадратурных зеркальных фильтров (КЗФ). С помощью алгоритма так называемого „патчирования" („заполнения пробела") сигналы нижней полосы КЗФ копируют в верхние полосы КЗФ, дублируя информацию НЧ части в ВЧ часть. Позже выверяют согласование сгенерированной ВЧ составляющей с оригинальной ВЧ составляющей, используя параметры корректировки огибающей спектра и тона.
С другой стороны, альтернативной является схема гармонического расширения полосы пропускания (НВЕ), базирующаяся на фазовых вокодерах. По схеме НВЕ задействовано гармоническое продление спектра в противоположность SBR, которое основано на негармоническом спектральном сдвиге. Такая схема может заменить или усовершенствовать алгоритм SBR.
Предварительная заявка на патент США за номером US 61/079,841 раскрывает способ BWE, который дает выбор между альтернативными алгоритмами патчирования, которые работают или в частотной области, или во временной области. При время-частотном преобразовании с помощью банка фильтров задают определенное окно анализа. Кроме того, классические версии исполнения фазового вокодера по современному состоянию используют одну предварительно заданную форму окна, такую, как окно в виде приподнятого косинуса или окно Бартлетта.
Однако, выбирая одно заранее заданное окно анализа для приложений вокодера, разработчик всегда вынужден идти на компромисс в отношении общего воспринимаемого качества звучания, получаемого для различных классов аудиосигналов. В силу этого, несмотря на то, что усредненное качество звука может быть оптимизировано предварительным выбором определенной оконной функции, качество звучания каждого конкретного класса сигналов остается неоптимальным.
Вместе с тем, было установлено, что некоторые сигналы выигрывают от применения специализированных анализирующих окон для фазового вокодера, который может быть направленно использован для временного распространения аудиосигнала без модификации его основного тона.
Отсюда вытекает необходимость в концепции выбора оптимальных окон анализа, таких как существуют в рамках схемы BWE. В то же время, меры, принимаемые в отношении упомянутой выше деградации качества воспринимаемого звука, предпочтительно, не должны вести к значительному возрастанию вычислительной сложности используемых кодеков.
Целью данного изобретения является выработка концепции кодирования и/или декодирования или концепции фазового вокодера, обеспечивающих улучшенное акустическое качество.
Поставленная цель достигается за счет кодера расширения полосы пропускания по пункту 1 формулы изобретения, декодера расширения полосы пропускания по п.2, фазового вокодера по п.12, способа кодирования по п.13, способа декодирования по п.14, кодированного аудиосигнала по п.15 или компьютерной программы по п.16.
Идея, лежащая в основе настоящего изобретения, состоит в том, что улучшение перцептуальных свойств может быть достигнуто, если аудиосигнал, содержащий блок аудиоотсчетов заданной длины во времени, анализируют, чтобы определить из множества окон анализа анализирующее окно, которое будет использовано для расширения полосы пропускания в декодере расширения полосы пропускания. Благодаря применению такого подхода можно предотвратить ухудшение качества звука, происходящего вследствие применения предварительно заданного окна анализа, и, следовательно, повысить перцепционное качество звучания при относительно малой трудоемкости по сравнению с методиками В WE известного уровня техники.
Один из вариантов реализации настоящего изобретения включает в себя кодер расширения полосы пропускания для кодирования аудиосигнала, состоящий из анализатора сигналов, корневого кодера и вычислителя параметров. Аудиосигнал содержит низкочастотный сигнал, включающий в себя полосу центральной частоты, и высокочастотный сигнал, включающий в себя полосу верхних частот. Анализатор сигналов предназначен для анализа аудиосигнала, содержащего блок аудиоотсчетов, который имеет некоторую длительность во времени. Анализатор сигналов, кроме того, предназначен для выбора из множества окон анализа окна анализа, которое будет применено для расширения полосы пропускания в декодере расширения полосы пропускания. Корневой кодер предназначен для кодирования низкочастотного сигнала с образованием кодированного низкочастотного сигнала. Вычислитель параметров предназначен для расчета параметров расширения полосы пропускания на основе высокочастотного сигнала.
Другой вариант реализации изобретения включает в себя декодер расширения полосы пропускания для декодирования закодированного аудиосигнала, состоящий из корневого декодера, модуля патчирования и комбинатора (блока сведения). Кодированный аудиосигнал содержит закодированный низкочастотный сигнал и параметры верхней полосы частот. Корневой декодер предназначен для декодирования закодированного низкочастотного сигнала, при этом декодированный низкочастотный сигнал содержит полосу центральной частоты. Модуль патчирования предназначен для генерирования патчированного сигнала на основе декодированного низкочастотного сигнала и параметров верхней полосы частот, при этом патчированный сигнал содержит полосу верхних частот, сгенерированную на базе полосы центральной частоты. Комбинатор предназначен для сведения патчированного сигнала и декодированного низкочастотного сигнала для формирования общего выходного сигнал.
Еще один вариант реализации представленного изобретения включает в себя процессор фазового вокодера для обработки аудиосигнала, состоящий из оконного анализатора, время-спектрального преобразователя, процессора частотной области, частотно-временного преобразователя, синтезирующего оконного преобразователя, компаратора и сумматора с наложением. Оконный анализатор (анализирующий оконный преобразователь) предназначен для приложения множества оконных (весовых) функций анализа к аудиосигналу или сигналу, образованному из аудиосигнала, при этом аудиосигнал содержит блок аудиоотсчетов, имеющий определенную длительность во времени, с формированием множества взвешенных аудиосигналов. Время-спектральный преобразователь предназначен для преобразования взвешенных аудиосигналов в спектры. Процессор частотной области предназначен для преобразования спектров в частотную область с формированием модифицированных спектров. Частотно-временной преобразователь предназначен для преобразования модифицированных спектров в модифицированные сигналы временной области. Оконный синтезатор (синтезирующий оконный преобразователь) предназначен для приложения множества оконных (весовых) функций синтеза к модифицированным сигналам временной области, причем оконные функции синтеза соотнесены с оконными функциями анализа, с формированием взвешенных модифицированных сигналов временной области. Компаратор предназначен для расчета множества сравнительных параметров на основании сопоставления множества взвешенных модифицированных сигналов во временной области и аудиосигнала или сигнала, образованного из аудиосигнала, при этом множество сравнительных параметров соответствует множеству оконных функций анализа. Кроме того, компаратор выполнен с возможностью выбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет предварительно заданному условию. Сумматор с наложением предназначен для сложения наложением блоков взвешенного модифицированного сигнала во временной области с образованием развернутого во времени сигнала. Кроме того, сумматор с наложением предназначен для обработки блоков взвешенного модифицированного сигнала во временной области, модифицированного с использованием весовой функции анализа и весовой функции синтеза, подобранной компаратором.
Конструктивные решения по заявляемому изобретению основаны на концепции, согласно которой множество патчированных сигналов может быть генерировано с использованием множества оконных функций анализа, приложенных к аудиосигналу, содержащему полосу центральной частоты. Множество патчированных сигналов может быть сопоставлено с опорным сигналом, которым может служить оригинальный аудиосигнал или дериват аудиосигнала. В результате получают множество сравнительных параметров, которые могут быть интерпретированы как мера оценки качества звука. В дополнение к этому, из множества оконных функций анализа может быть выбрана оконная функция анализа, для которой сравнительный параметр удовлетворяет предварительно заданному условию. Таким образом, использование выбранной оконной функции анализа позволяет добиваться минимального снижения качества звучания, обеспечивая оптимальное перцептуальное акустическое качество в контексте сценария BWE.
Ряд технических решений по предлагаемому изобретению относится к анализатору сигналов, который включает в свой состав классификатор сигнала, предназначенный для выполнения анализа/классификации аудиосигнала или деривата аудиосигнала. В этом случае оконную функцию анализа, которая будет использована для расширения полосы пропускания на стороне декодера расширения полосы пропускания, выбирают на основе характеристики сигнала, прошедшего анализ/классификацию.
В силу этого, в вариантах компоновки реализован способ выбора оптимального окна анализа для расширения полосы пропускания в декодере. Для подбора наиболее подходящего окна анализа могут быть вычислены параметры управления. Это делается с использованием процедуры анализа через синтез; то есть - путем приложения ряда окон и выбора из них наиболее соответствующего поставленной задаче. В предпочтительной форме реализации изобретения такой задачей является обеспечение оптимального качества акустического восприятия восстановленного сигнала. В альтернативных реализациях может быть оптимизирована целевая функция. Например, цель может состоять в максимально точном сохранении равномерности исходных спектральных характеристик ВЧ.
С одной стороны, подбор оконной функции может выполняться только на стороне кодера, исходя из первоначального сигнала, синтезированного сигнала или обоих. Принятое решение (указание на окно) затем пересылается на декодер. С другой стороны, выбор может выполняться синхронно на стороне кодера и на стороне декодера, исходя только из полосы пропускания центральной частоты декодированного сигнала. При использовании последнего метода нет необходимости в формировании сопутствующей служебной информации, что дает преимущество в эффективности битрейта кодека.
Преимущество изобретения заключается в оптимизации перцептуальных свойств выходного сигнала вокодера. Конструктивные решения обеспечивают выбор адаптивных к сигналу окон анализа и синтеза в процессе преобразования речевых сигналов, при котором возможно варьирование временных или частотных характеристик окон анализа и/или синтеза.
Другим преимуществом изобретения является возможность достижения лучшего баланса между снижением вышеназванной деградации и вычислительной трудоемкостью, как, например, в рамках схемы BWE.
Далее будут представлены пояснения к вариантам технических решений по заявляемому изобретению со ссылкой на сопроводительные фигуры, где:
на фиг.1 показана принципиальная модульная схема варианта компоновки кодера расширения полосы пропускания;
на фиг.2 показана принципиальная модульная схема варианта компоновки декодера расширения полосы пропускания;
на фиг.3 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;
на фиг.4 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;
на фиг.5 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;
на фиг.6 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;
на фиг.7 показана принципиальная модульная схема конструктивного решения компаратора;
на фиг.8 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;
на фиг.9 показана принципиальная модульная схема конструктивного решения классификатора сигналов;
на фиг.10 показана принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания;
на фиг.11 показана принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания;
на фиг.12 показана принципиальная модульная схема конструктивного решения процессора фазового вокодера;
на фиг.13 показана принципиальная модульная схема коммутатора вариантов окон анализа и синтеза в зависимости от управляющих параметров; и
на фиг.14 дана блок-схема реализации декодера расширения полосы пропускания на базе фазового вокодера.
На фиг.1 отображена принципиальная модульная схема реализации кодера расширения полосы пропускания 100, предназначенного для кодирования аудиосигнала 101-1 в соответствии с заявляемым изобретением. Аудиосигнал 101-1 включает в себя низкочастотный сигнал 101-2, содержащий полосу центральной частоты 101-3, и высокочастотный сигнал 101-4, содержащий полосу верхних частот 101-5. Кодер расширения полосы пропускания 100 имеет в своем составе анализатор сигналов 110, корневой кодер 120 и вычислитель параметров 130. Анализатор сигналов ПО выполняет функцию анализа аудиосигнала 101-1, который содержит блок 101-6 аудиоотсчетов, имеющий заданную продолжительность во времени. Анализатор сигналов ПО, кроме того, выполнен с возможностью подбора из множества 111-1 окон анализа окна анализа 111-2 для дальнейшего использования при расширении полосы пропускания в декодере расширения полосы пропускания 200. Корневой кодер 120 выполняет функцию кодирования низкочастотного сигнала 101-2 с получением кодированного низкочастотного сигнала 121. Наконец, вычислитель параметров 130 выполняет функцию расчета параметров расширения полосы пропускания 131 на базе высокочастотного сигнала 101-4. Параметры расширения полосы пропускания 131, окно анализа 111-2, которое будет использовано в декодере расширения полосы пропускания 200, и закодированный низкочастотный сигнал 121 составляют кодированный аудиосигнал 103-1 на выходе кодера расширения полосы пропускания 100.
На фиг.2 отображена принципиальная модульная схема декодера расширения полосы пропускания 200, предназначенного для декодирования закодированного аудиосигнала 201-1, в соответствии с другим техническим решением данного изобретения. Кодированный аудиосигнал 201-1 состоит из закодированного низкочастотного сигнала 201-2 и параметров верхней полосы частот 201-3. Здесь кодированный аудиосигнал 201-1 может соответствовать кодированному аудиосигналу 103-1, сгенерированному кодером расширения полосы пропускания 100 на фиг.1. Декодер расширения полосы пропускания 200 имеет в своем составе корневой декодер 210, модуль патчирования 220 и комбинатор 230. Корневой декодер 210 выполняет функцию декодирования закодированного низкочастотного сигнала 201-2 в образованием декодированного низкочастотного сигнала 211-1. Декодированный низкочастотный сигнал 211-1 содержит полосу центральной частоты 211-2. Модуль патчирования 220 генерирует патчированный сигнал 221-1 на базе декодированного низкочастотного сигнала 211-1 и параметров полосы верхних частот 201-3, при этом патчированный сигнал 221-1 включает в себя полосу верхних частот 221-2, генерированную из полосы центральной частоты 211-2. Наконец, комбинатор (блок сведения) 230 выполняет функцию сведения патчированного сигнала 221-1 и декодированного низкочастотного сигнала 211-1 с получением совокупного выходного сигнала. В частности, патчированный сигнал 221-1 может быть сигналом в пределах целевой полосы частот алгоритма расширения полосы пропускания, в то время как сведенный выходной сигнал на выходе декодера расширения полосы пропускания 200 может быть преобразованным сигналом с расширенным диапазоном рабочих частот (231-2).
На фиг.3 отображена принципиальная модульная схема реализации развернутого варианта компоновки кодера расширения полосы пропускания 300. Кодер расширения полосы пропускания 300 может включать в себя фильтр нижних частот (ФНЧ) и фильтр верхних частот (ФВЧ). Фильтры могут генерировать отфильтрованную по нижним частотам версию аудиосигнала 101-1, представляющую собой низкочастотный сигнал 101-2, и отфильтрованную по верхним частотам версию аудиосигнала 101-1, являющуюся высокочастотным сигналом 101-4. Как показано на фиг.3, кодер расширения полосы пропускания 300 может также включать в свой состав оконный контроллер 310 для формирования информации по управлению окнами 311, которая используется вычислителем параметров 320 и модулем патчирования 330. Информация по управлению окнами 311 на выходе оконного контроллера 310 может отображать множество 111-1 оконных функций анализа, которые будут применены к блоку 101-6 аудиоотсчетов, полученных из аудиосигнала 101-1. Вычислитель параметров 320, в частности, может включать в свою компоновку оконный преобразователь, управляемый оконным контроллером 310, причем оконный преобразователь вычислителя параметров 320 применяет множество 111-1 оконных функций анализа и оконную функцию анализа 111 - 2, выбранную компаратором 340, к высокочастотному сигналу 101-4. При этом получают соответственно параметры расширения полосы пропускания 321-1, 321-2, соответствующие множеству 111-1 оконных функций анализа, на что указывает информация по управлению окнами 311, и соответствующие выбранной оконной функции анализа 111-2 согласно индикации окна 341-1 на выходе компаратора 340.
В аппаратной версии на фиг.3 анализатор сигнала 110 имеет в своем составе модуль патчирования 330, генерирующий множество 331-1 патчированных сигналов на базе низкочастотного сигнала 101-2, информации по управлению окнами 311 и параметров расширения полосы пропускания 321-1. При этом патчированные сигналы 331-1 содержат полосы верхних частот 331-2, сгенерированные на основе полосы центральной частоты 101-3. Модуль патчирования 330, в частности, включает в себя оконный преобразователь, управляемый оконным контроллером 310, причем оконный преобразователь модуля патчирования 330 предназначен для приложения множества 111-1 оконных функций анализа к низкочастотному сигналу 101-2.
Далее, анализатор сигнала 110 в составе кодера расширения полосы пропускания 300 включает в себя компаратор 340, предназначенный для определения множества 341-2 сравнительных параметров на основе сопоставления патчированных сигналов 331-1 с опорным сигналом, представляющим собой аудиосигнал 101-1 или сигнал, производный от этого аудиосигнала, такой, как высокочастотный сигнал 101-4, обозначенный пунктирной линией, при этом множество 341-2 сравнительных параметров соответствует множеству 111-1 оконных функций анализа. Компаратор 340, кроме того, генерирует указатель окна 341-1, соответствующий оконной функции анализа 111-2, для которого сравнительный параметр удовлетворяет предварительно заданному условию. И, наконец, кодер расширения полосы пропускания 300 оснащен выходным интерфейсом 350 для вывода кодированного аудиосигнала 351, содержащего указатель окна 341-1.
Упомянув выше процедуру сопоставления, обратимся к фиг.7, отображающей принципиальную блочную схему варианта компоновки компаратора 700, куда может быть включен вычислитель 710 показателя степени спектральной (неравномерности (параметра SFM), компаратор параметра SFM 720 и экстрактор указателя окна 730. Вычислитель параметров SFM 710 реализован с возможностью расчета, например, множества 703-1 параметров SFM на основе множества 701-1 входных сигналов и опорного параметра SFM 703-2 на основе опорного входного сигнала 701-2. Так, каждый показатель SFM может быть рассчитан путем деления среднего геометрического спектральной плотности мощности на среднее арифметическое спектральной плотности мощности, выведенной из соответствующего входного сигнала, при этом относительно высокое значение параметра SFM указывает на однородность распределения плотности мощности по всем полосам спектра, в то время как относительно низкий показатель SFM свидетельствует о том, что спектральная мощность сконцентрирована в относительно небольшом числе полос. Вместе с тем, параметр SFM может быть измерен в пределах какой-либо части полосы (подполосы), а не по всему диапазону входного сигнала. Компаратор параметров SFM 720 реализован с возможностью сравнения параметров SFM 703-1 с опорным параметром SFM 703-2 с получением множества 705 сравнительных параметров, которые могут базироваться, допустим, на отклонениях в сравненных параметрах SFM. Экстрактор указателя окна 730 реализован с возможностью выбора из множества сравнительных параметров 705 сравнительного параметра, которому будет удовлетворять предварительно заданное условие. Предварительно задаваемое условие может быть выбрано так, например, что взятый сравнительный параметр будет минимальным из множества сравнительных параметров 705. В этом случае выбранный сравнительный параметр будет соответствовать одному входному сигналу из множества входных сигналов 701-1, который характеризуется минимальным отклонением от опорного входного сигнала 701-2 по спектральной неравномерности.
На практике входные сигналы 701-1 могут соответствовать патчированным сигналам 331-1, патчированным сигналам 331-1, полученным взвешиванием аудиосигнала 101-1 с помощью множества 111-1 оконных функций анализа, или деривату аудиосигнала 101-1, такому, как низкочастотный сигнал 101-2, в то время как опорный входной сигнал 701-2 может соответствовать оригинальному аудиосигналу 101-1. Кроме того, множество 705 сравнительных параметров компаратора 700 может соответствовать множеству 341-2 сравнительных параметров кодера расширения полосы пропускания 300. Таким образом, оконная функция анализа 111-2 может быть выбрана в соответствии с выделенным сравнительным параметром, в котором девиация параметра SFM патчированных сигналов 331-1 относительно оригинального аудиосигнала 101-1, например, будет минимальной. С выбранной оконной функцией анализа 111-2 также может быть соотнесен указатель окна 707, который может соответствовать указателю окна 341-1 на выходе компаратора 700 или компаратора 340 соответственно. Следовательно, перцептуальное акустическое качество, оцениваемое, например, через спектральную неравномерность, будет изменено или возможно минимально снижено при задействовании отобранной оконной функции анализа 111-2 для выполнения расширения полосы пропускания, например, на стороне декодера расширения полосы пропускания.
Более того, множество 111-1 оконных функций анализа, указанных в информации по управлению окнами 311 на выходе оконного контроллера 310, может включать в себя разные оконные функции анализа, содержащие отличающиеся друг от друга характеристики окон при длине окна, по времени совпадающей с блоком 101-6. В частности, разные оконные функции анализа могут характеризоваться различными амплитудно-частотными характеристиками („передаточными функциями"), полученными в результате спектрального анализа. Передаточные функции, в свою очередь, могут различаться характерными особенностями, такими как ширина основного лепестка, уровень боковых лепестков или спад боковых лепестков. Разные оконные функции анализа также могут быть разделены на несколько групп, исходя из таких их характеристик, как спектральное разрешение или динамический диапазон. Так, окна с высокой и средней разрешающей способностью могут быть представлены оконными функциями - прямоугольными, треугольными, косинусными, приподнято-косинусными, Хемминга, Ханна, Бартлетта, Блэкмана (Блекмена), Гауссовыми, Кайзера или Бартлетта-Ханна, в то время как окна с низким разрешением или с широким динамическим диапазоном могут быть представлены оконными функциями с плоской вершиной, Блэкмана-Харриса или Тукея (Tukey). В альтернативных конструктивных решениях могут быть использованы оконные функции, содержащие иное количество отсчетов (т.е. окна другой длины).
В частности, применяя различные оконные функции анализа 111-1, которые могут принадлежать к разным группам оконных функций анализа, к блоку 101-6 отсчетов аудиосигнала, с использованием модуля патчирования 330, например, даст в результате патчированные сигналы 331-1 с различными отличительными характеристиками, такими как разные показатели степени неравномерности спектра SFM.
На фиг.4 отображена принципиальная блочная схема развернутого конструктивного решения декодера расширения полосы пропускания 400, который однозначно может использовать указатель окна 341-1, принятый, например, от кодера расширения полосы пропускания 300 на фиг.3. Декодер расширения полосы пропускания 400 выполнен, в частности, с возможностью обрабатывать кодированный аудиосигнал 401-1, содержащий, кроме кодированного низкочастотного сигнала 401-2 и параметров полосы верхних частот 401-3, указатель окна 401-4. Здесь закодированный сигнал низких частот 401-2, параметры полосы верхних частот 401-3 и указатель окна 401-4 могут соответствовать кодированному низкочастотному сигналу 121, параметрам расширения полосы пропускания 321-2 и указателю окна 341-1 на выходе выходного интерфейса 350 кодера расширения полосы пропускания 300 соответственно. В аппаратной версии на фиг.4 декодер расширения полосы пропускания 400 имеет в своем составе корневой декодер 410 как возможный аналог корневого декодера 210 в составе декодера расширения полосы пропускания 200, при этом корневой декодер 410 предназначен для декодирования кодированного сигнала нижних частот 401-2, а декодированный низкочастотный сигнал 411-1 содержит полосу центральной частоты 411-2. Кроме того, декодер расширения полосы пропускания 400 включает в свой состав модуль патчирования 420 как возможный аналог модуля патчирования 220 декодера расширения полосы пропускания 200, при этом модуль патчирования 420 содержит в себе управляемый оконный преобразователь, предназначенный для подбора оконной функции анализа из множества оконных функций анализа, исходя из указателя окна 401-4, и для приложения выбранной оконной функции анализа к декодированному низкочастотному сигналу 411-1. В результате этого на выходе модуля патчирования 420 формируется патчированный сигнал 421. Патчированный сигнал 421 далее может быть совмещен комбинатором 430 с сигналом низких частот 411-1 с получением на выходе декодера расширения полосы пропускания 400 совокупного выходного сигнала 431. В данном случае патчированный сигнал 421, декодированный сигнал низких частот 411-1, комбинатор 430 и сведенный выходной сигнал 431 могут быть эквивалентны патчированному сигналу 221-1, декодированному сигналу низких частот 211-1, комбинатору 230 и сведенному выходному сигналу 231-1 соответственно. Как и в предыдущем случае, сведенный выходной сигнал 431 может быть прошедшим обработку сигналом с расширенной полосой пропускания.
Фиг.3 и 4 демонстрируют то преимущество, что указатель окна 341-1; 401-4, соответствующий оптимальной оконной функции анализа, полученной путем анализа сигнала на стороне кодера (фиг.3), может быть передан в составе кодированного аудиосигнала 351; 401-1 и затем использован модулем патчирования 420 в процессе расширения полосы пропускания без необходимости дополнительного анализа сигнала на стороне декодера (фиг.4).
На фиг.5 представлена принципиальная блочная схема развернутого варианта компоновки кодера расширения полосы пропускания 500. Кодер расширения полосы пропускания 500 в основном состоит из блоков, аналогичных кодеру расширения полосы пропускания 300 на фиг.3. Поэтому идентичные компоненты схемы, имеющие сходное конструктивное исполнение и/или функциональное назначение, имеют одинаковое цифровое обозначение. Тем не менее в отличие от аппаратной версии на фиг.3 в кодер расширения полосы пропускания 500 введен компаратор 510, выполняющий функцию сравнения множества патчированных сигналов 333-1 с опорным низкочастотным сигналом, производным от аудиосигнала 101-1. Кодер расширения полосы пропускания 500 может в качестве опции включать в свой состав корневой декодер 520, генерирующий декодированный низкочастотный сигнал 521, декодируя кодированный низкочастотный сигнал 121, принятый с выхода корневого кодера 120. В качестве опорного сигнала нижних частот может служить, например, низкочастотный сигнал 101-2, представляющий собой прошедшую НЧ фильтрацию версию аудиосигнала 101-1 или декодированный низкочастотный сигнал 521, принимаемый с выхода корневого декодера 520. Кроме того, компаратор 510 выводит указатель окна 511, соответствующий выбранной (оптимальной) оконной функции анализа, при этом в таком случае подбор окна основывается на сравнении патчированных сигналов 331-1 с опорным низкочастотным сигналом 101-2 или 521. Как и в случае указателя окна 341-1 на фиг.3 указатель окна 511 может быть передан на вычислитель параметров 320, причем, таким образом, что будет выполняться расчет только параметров В WE 321-2, соответствующих указателю окна 511. Параметры BWE 321-2 вместе с кодированным низкочастотным сигналом 121 могут быть выведены на выходной интерфейс 530. Однако при этом указатель окна 511 может не выводиться на выходной интерфейс 530. В итоге выходной интерфейс 530 предназначен для вывода кодированного аудиосигнала 531, который не содержит указатель окна 511.
На фиг.6 изображена принципиальная блочная схема развернутого варианта компоновки декодера расширения полосы пропускания 600. Декодер расширения полосы пропускания 600, в частности выполнен с возможностью обработки кодированного аудиосигнала 601-1, содержащего закодированный низкочастотный сигнал 601-2 и параметры верхней полосы частот 601-3. Здесь кодированный аудиосигнал 601-1, кодированный низкочастотный сигнал 601-2 и параметры верхней полосы частот 601-3 могут быть аналогами кодированному аудиосигналу 201-1, кодированному сигналу низких частот 201-2 и параметрам полосы верхних частот 201-3 соответственно. Следует обратить внимание на то, что в аппаратной версии на фиг.6 кодированный аудиосигнал 601-1, вводимый в декодер расширения полосы пропускания 600, не содержит указатель окна. Поэтому в данном случае на стороне декодера необходим анализ сигнала для подбора подходящей оконной функции, которая будет применена в рамках схемы расширения полосы пропускания (фиг.6).
Как показано на фиг.6, модуль патчирования 220 декодера расширения полосы пропускания 600 включает в себя оконный анализатор 610, время-спектральный преобразователь 620, процессор частотной области 630, частотно-временной преобразователь 640, оконный синтезатор 650, компаратор 660 и модуль расширения полосы пропускания 670. В дополнение к этому декодер расширения полосы пропускания 600 имеет в своем составе корневой декодер 680 для декодирования кодированного сигнала низких частот 601-2, при этом декодированный низкочастотный сигнал 681-1 содержит полосу центральной частоты 681-2. Здесь корневой декодер 680 и декодированный низкочастотный сигнал 681-1 могут быть идентичными корневому декодеру 210 и декодированному низкочастотному сигналу 211-1 соответственно.
Оконный анализатор 610 предназначен для приложения множества оконных функций анализа, таких как весовые функция анализа 111-1 в вариантах компоновки кодера расширения полосы пропускания 300; 500, к декодированному сигналу низких частот 681-1 с формированием множества 611 оконных (взвешенных) низкочастотных сигналов. Время-спектральный преобразователь 620 предназначен для трансформации взвешенных сигналов низких частот 611 в спектры 621. Процессор частотной области 630 предназначен для обработки спектров 621 в частотной области с получением модифицированных спектров 631. Частотно-временной преобразователь 640 предназначен для преобразования модифицированных спектров 631 в модифицированные сигналы временной области 641. Оконный синтезатор 650 предназначен для взвешивания модифицированных сигналов временной области 641 с помощью множества оконных функций синтеза, где оконные функции синтеза соотнесены с оконными функциями анализа, с получением модифицированных сигналов временной области 651. В частности, оконные функции синтеза могут быть так соотнесены с оконными функциями анализа, что приложенные оконные функции синтеза будут компенсировать эффект применения соответствующих оконных функций анализа. Компаратор 660 предназначен для расчета множества сравнительных параметров на основе сопоставления множества 651 взвешенных модифицированных сигналов во временной области с декодированным низкочастотным сигналом 681-1, причем множество сравнительных параметров соответствует множеству 111-1 оконных (весовых) функций анализа, примененных к декодированному низкочастотному сигналу 681-1 оконным анализатором 610. Компаратор 660, кроме того, выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет расчетному условию. В подобном случае компаратор 660 может быть специально сконфигурирован по аналогии с вариантом, рассмотренным в контексте фиг.7. Подобранные оконная функция анализа и оконная функция синтеза могут составлять указатель окна 661, сгенерированный на выходе компаратора 660. Тем не менее в противоположность конструктивному решению декодера расширения полосы пропускания 400 на фиг.4, где указатель окна 401-4, используемый в схеме расширения полосы пропускания на стороне декодера, содержится в кодированном аудиосигнале 401 -1, указатель окна 661 в декодере расширения полосы пропускания 600 на фиг.6 не входит в состав кодированного аудиосигнала 601-1, в силу чего указатель окна 661 сначала должен быть выведен путем анализа декодированного низкочастотного сигнала 681-1, выработанного из кодированного аудиосигнала 601-1. В дополнение к этому модуль патчирования 220 в составе декодера расширения полосы пропускания 600 может включать в себя модуль расширения полосы пропускания 670, выполненный с возможностью реализации алгоритма расширения полосы пропускания, в котором модуль патчирования 220 генерирует патчированный сигнал 671 на баже декодированного низкочастотного сигнала 681-1, оконной функции анализа и оконной функция синтеза, выбранных компаратором 660, и параметра 601-3 верхней полосы частот. В завершение, патчированные сигналы 671 и декодированный сигнал низких частот 681-1 могут быть сведены комбинатором 690 с формированием совокупного выходного сигнала 691 с расширенной частотной полосой. В подобном случае патчированный сигнал 671, декодированный низкочастотный сигнал 681-1, комбинатор 690 и сведенный выходной сигнал 691 могут соответствовать в той же последовательности патчированному сигналу 221-1, декодированному низкочастотному сигналу 211-1, комбинатору 230 и сведенному выходному сигналу 231-1 на стороне декодера расширения полосы пропускания 200, представленного на фиг.2.
Ранее рассмотренные технические решения кодеров/декодеров расширения полосы пропускания включают в свой состав компараторы, которые могут соответствовать компаратору 700, описанному в контексте фиг.7. А именно, компаратор 700 может быть реализован с возможностью приема в качестве множества входных сигналов 701-1 множества 331-1 патчированных сигналов от кодеров расширения полосы пропускания 300 и 500 на Фиг.3 и 5 или множества 651 взвешенных модифицированных сигналов временной области от декодера расширения полосы пропускания 600 на фиг.6 и в качестве опорного входного сигнала 701-2 аудиосигнала 101-1, обозначенного на фиг.3 как „опорный сигнал", или высокочастотного сигнала 101-4, обозначенного на фиг.3 пунктирной линией, низкочастотного сигнала 101-2, обозначенного на фиг.5 как „опорный низкочастотный сигнал", или декодированного низкочастотного сигнала 521, обозначенного на фиг.5 пунктирной линией, или декодированного низкочастотного сигнала 681-1 от декодера расширения полосы пропускания 600 на фиг.6. Кроме того, компаратор 700 выполнен с возможностью вычисления указателя окна 707, который может соответствовать указателю окна 341-1 кодера расширения полосы пропускания 300 на фиг.3, указателю окна 511 кодера расширения полосы пропускания 500 на фиг.5 или указателю окна 661 декодера расширения полосы пропускания 600 на фиг.6. Как пояснялось раньше, сравнение может базироваться, в частности, на вычислении параметров SFM входных сигналов. В ином случае входные сигналы 701-1 могут быть сопоставлены также с опорными входными сигналами 701-2 на основе вычисления разницы значений аудиосигнала по каждому отсчету.
В предыдущих реализациях выбор окон выполнялся посредством анализа сигнала, при котором множество разных оконных функций анализа применялось к аудиосигналу или сигналу, производному от аудиосигнала, с генерацией множества различных патчированных (синтезированных) сигналов. Из этого множества синтезированных сигналов выбирают оптимальную оконную функцию, исходя из критерия, предварительно заданного на основе сопоставления синтезированных сигналов с исходным аудиосигналом или сигналом, производным от этого аудиосигнала. Выбранную оконную функция затем применяют к аудиосигналу или к деривату такого аудиосигнала, скажем, в рамках схемы расширения полосы пропускания с формированием желаемого патчированного (синтезированного) сигнала. Описанная выше процедура в особенности соответствует замкнутому контуру и может быть названа схемой „анализа через синтез". И наоборот, окно может быть подобрано путем прямого анализа входного аудиосигнала или сигнала, производного от него, когда оригинальный входной сигнал разлагают/классифицируют, исходя из определенной характеристики сигнала, например тональной. Такой альтернативный подход к анализу, соответствующий открытому контуру, будет представлен в последующих конструктивных решениях.
На фиг.8 изображена принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания 800. Здесь базовая компоновка кодера расширения полосы пропускания 800 соответствует компоновке кодера расширения полосы пропускания 300 на фиг.3. В силу этого идентичные блоки на фигурах 3 и 8 имеют одинаковое цифровое обозначение.
Анализатор сигнала 110 в составе кодера расширения полосы пропускания 800 включает в себя классификатор сигналов 810, предназначенный для сортировки аудиосигнала 101-1 или его деривата, например, сигнала высоких частот 101-4 (показанного пунктиром), с целью определения указателя окна 811, соответствующего оконной функции анализа, исходя из характеристики отсортированного сигнала. Так, классификатор сигналов 810 может предусматривать вычисление указателя окна 811 из тональных характеристик звукового сигнала 101-1 или высокочастотного сигнала 101-4, при этом тональные характеристики могут отражать распределение спектральной энергии в их полосах. В случае если спектральная энергия распределена по полосе относительно равномерно, то в этом диапазоне присутствует, скорее, нетональный сигнал („зашумленный сигнал"), и указатель окна 811 относится к первой оконной функции, имеющей первую характеристику, предназначенную для применения к нетональному сигналу, в то время как в случае, если спектральная энергия относительно сильно сконцентрирована на определенном участке данной полосы, то в этой полосе присутствует, скорее, тональный сигнал, и указатель окна 811 относится ко второй оконной функции, имеющей вторую характеристику, предназначенную для применения к тональному сигналу. Далее, кодер 800 имеет в своем составе оконный контроллер 820, предназначенный для формирования информации по управлению окнами 821 на основании указателя окна 811, определенного классификатором сигналов 810. Вычислитель параметров 830 в составе кодера 800 включает в себя управляемый оконным контроллером 820 оконный преобразователь, который применяет оконную функцию анализа, исходя из информации по управлению окнами 821, к высокочастотному сигналу 101-4 с извлечением параметров В WE 831. Оконный контроллер 820 может, допустим, предусматривать выработку информации по управлению окнами 821 для передачи на вычислитель параметров 830 таким образом, что первое окно, характеризуемое передаточной функцией с первой шириной основного лепестка, будет задействовано оконным преобразователем вычислителя параметров 830, когда значение рассчитанной тональной характеристики будет ниже расчетной пороговой величины, или второе окно, характеризуемое передаточной функцией со второй шириной основного лепестка, будет задействовано оконным преобразователем вычислителя параметров 830, когда значение рассчитанной тональной характеристики будет равно или выше расчетной пороговой величины, при этом первая ширина основного лепестка передаточной функции превышает вторую ширину основного лепестка передаточной функции. Особенно предпочтительным в контексте алгоритма расширения полосы пропускания, может быть использование оконной функции с большим основным лепестком передаточной функции в случае нетонального сигнала и использование оконной функции с меньшим основным лепестком передаточной функции в случае тонального сигнала.
Корневой кодер 120 в составе кодера расширения полосы пропускания 800 выполняет функцию кодирования низкочастотного сигнала 101-2 с формированием кодированного низкочастотного сигнала 121. Как и в версии исполнения на фиг.3, кодированный низкочастотный сигнал 121, указатель окна 811 и параметры В WE 831 могут быть переданы на устройство выходного интерфейса 840 с формированием на его выходе кодированного аудиосигнала 841, содержащего указатель окна 811.
На фиг.9 изображена принципиальная блочная схема классификатора сигналов 900, который может быть использован для прямого анализа аудиосигнала 101-1 в аппаратных реализациях на фиг.8, 10 и 11. Классификатор сигналов 900 может включать в свою схему измеритель тонального уровня 910, определитель типа сигнала 920 и оконный селектор (блок выбора окна) 930. Измеритель тонального уровня 910 может выполнять функцию анализа аудиосигнала 101-1 для определения тональной характеристики 911 аудиосигнала 101-1. Определитель типа сигнала 920 может выполнять функцию определения акустических свойств 921 аудиосигнала 101-1, исходя из тональной характеристики 911 полученной от измерителя тонального уровня 910. В частности, определитель типа сигнала 920 устанавливает принадлежность аудиосигнала 101-1 больше к зашумленному или к тональному сигналу. И, наконец, оконный селектор 930 выполнен с возможностью выработки указателя окна 811 в зависимости от свойств сигнала 921.
На фиг.10 изображена принципиальная модульная схема развернутого варианта компоновки кодера расширения полосы пропускания 1000, который может соответствовать кодеру расширения полосы пропускания 500 на фиг.5. Соответственно, идентичные блоки в версиях исполнения на фигурах 5 и 10 имеют одинаковые цифровые обозначения. Анализатор сигнала ПО в составе кодера расширения полосы пропускания 1000 включает в свой состав классификатор сигналов 1010, предназначенный для классификации низкочастотного сигнала 101-2, выработанного из аудиосигнала 101-1, для определения указателя окна 1011, соответствующего оконной функции анализа, на основании характеристики классифицированного сигнала, полученного от классификатора сигналов 1010. Кроме того, кодер 1000 включает в свой состав оконный контроллер 1020, предназначенный для выработки информации по управлению окнами 1021 на основании указателя окна 1011, определенного классификатором сигналов 1010. Вычислитель параметров 1030 в составе кодера расширения полосы пропускания 1000 включают в себя управляемый оконным контроллером 1020 оконный преобразователь, который выполняет функцию приложения на основании информации по управлению окнами 1021 оконной функции анализа к высокочастотному сигналу 101-4 с получением параметров расширения полосы пропускания В WE 1031. Кодер расширения полосы пропускания 1000 может включать в свою конфигурацию корневой кодер 120 для формирования из низкочастотного сигнала 101-2 кодированного низкочастотного сигнала 121. В дополнение к этому в кодер расширения полосы пропускания 1000 в качестве опции может быть введен корневой декодер 1050, обозначенный пунктирной рамкой, выполняющий декодирование закодированного сигнала низких частот 121 с извлечением декодированного низкочастотного сигнала 1051 (обозначенного пунктирной стрелкой). Соответственно, классификатор сигналов 1010 может факультативно выполнять анализ/классификацию декодированного сигнала нижних частот 1051 с целью определения указателя окна 1011. Закодированный низкочастотный сигнал 121 и параметры В WE 1031 далее могут быть переданы на устройство выходного интерфейса 1040, предназначенное для формирования кодированного аудиосигнала 1041, не содержащего указатель окна 1011. В данной ситуации кодированный аудиосигнал 1041 может соответствовать кодированному аудиосигналу 531 на фиг.5.
В подобном случае указатель окна не содержится в закодированном аудиосигнал на стороне кодера (фиг.10), что означает, что указатель окна должен быть задан на стороне декодера (фиг.11), что будет проиллюстрировано дальше.
На фиг.11 представлена принципиальная модульная схема развернутого варианта компоновки декодера расширения полосы пропускания 1100, который может соответствовать декодеру расширения полосы пропускания 600 на фиг.6. Соответственно, идентичные блоки в реализациях на фиг.6 и 11 имеют одинаковое цифровое обозначение. А именно, декодер расширения полосы пропускания 1100 имеет в своем составе корневой декодер 680 для извлечения из закодированного сигнала нижних частот 601-2 декодированного низкочастотного сигнала 681-1. Модуль патчирования 220 в составе декодера расширения полосы пропускания 1100 включает в себя классификатор сигналов 1110, который анализирует/классифицирует декодированный низкочастотный сигнал 681-1 для определения указателя окна 1111, соответствующего оконной функции анализа, исходя из характеристики проанализированного сигнала. Кроме того, в схему декодера 1100 входит оконный контроллер 1120, формирующий информацию по управлению окнами 1121 с опорой на указатель окна 1111, выведенный классификатором сигналов 1110. Дополнительно декодер 1100 может включать в себя модуль расширения полосы пропускания В WE ИЗО, в составе которого модуль патчирования 220 генерирует патчированный сигнал 671 на основе декодированного сигнала низких частот 681-1, оконную функцию анализа на основании информации по управлению окнами 1121 и параметры 601-3 полосы верхних частот. Патчированный сигнал 671 и декодированный низкочастотный сигнал 681-1 в последующем могут быть сведены с помощью комбинатора 690 с формированием совокупного выходного сигнала 691.
Схема анализа через синтез, задействованная в предыдущих реализациях, также может быть приложена в отношении технического исполнения фазового вокодера. В этой связи фиг.12 отображает принципиальную блочную схему аппаратной версии процессора фазового вокодера 1200. Процессор фазового вокодера 1200, предназначенный для обработки аудиосигнала 1201, может иметь в своем составе оконный анализатор 1210, время-спектральный преобразователь 1220, процессор частотной области 1230, частотно-временной преобразователь 1240, оконный синтезатор 1250, компаратор 1260 и сумматор с наложением 1270. В частности, оконный анализатор 1210 выполнен с возможностью приложения множества 111-1 оконных (весовых) функций анализа к аудиосигналу 1201 или к сигналу, производному от аудиосигнала, например декодированному сигналу нижних частот 1202, обозначенному пунктирной стрелкой, при этом аудиосигнал 1201 содержит блок аудиоотсчетов, имеющий определенную длину во времени, с целью формирования множества 1211 взвешенных аудиосигналов. Время-спектральный преобразователь 1220 выполнен с возможностью трансформации взвешенных аудиосигналов 1211 в спектры 1221. Процессор частотной области 1230 выполнен с возможностью обработки спектров 1221 трансформанты с получением модифицированных спектров 1231. Частотно-временной преобразователь 1240 выполнен с возможностью преобразования модифицированных спектров 1231 в модифицированные сигналы временной области 1241. Оконный синтезатор 1250 выполнен с возможностью приложения множества оконных (весовых) функций синтеза к модифицированным сигналам временной области 1241, причем оконные функции синтеза соотнесены с оконными функциями анализа, с формированием взвешенных модифицированных сигналов во временной области 1251. Компаратор 1260 выполнен с возможностью расчета множества сравнительных параметров на основе сопоставления множества взвешенных
модифицированных сигналов временной области 1251 с аудиосигналом 1201 или его дериватом, таким как декодированный низкочастотный сигнал 1202 (показанный пунктиром), причем множество сравнительных параметров соответствует множеству оконных функций анализа, и, кроме того, компаратор 1260 выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет предварительно заданному условию. Здесь следует заметить, что оконная функция анализа и оконная функция синтеза подбираются компаратором 1260 аналогично процедуре, рассмотренной ранее в контексте предшествующих конструктивных решений. Допустим, компаратор 1260 может быть осуществлен по аналогии с техническим исполнением, показанным на фиг.7. В последующем выбранные оконные функции анализа и синтеза могут быть задействованы по всей технологической цепочке на пути прохождения сигнала, начиная от оконного анализатора 1210 и заканчивая оконным синтезатором 1250 перед введением в компаратор 1260, как показано на фиг.12, в результате чего на выходе оконного синтезатора 1250 будет сгенерирован желаемый (оптимизированный) взвешенный модифицированный сигнал во временной области 1255. Наконец, устройство суммирования с наложением 1270 выполнено с возможностью сложения наложением последовательных блоков взвешенного модифицированного сигнала временной области 1255, преобразованного с помощью весовой функции анализа и весовой функции синтеза, отобранных компаратором 1260 с формированием развернутого во времени сигнала.
В частности, развернутый во времени сигнал 1271 может быть сформирован путем разнесения перекрывающихся последовательных блоков взвешенного модифицированного сигнала во временной области 1255 на большее расстояние относительно друг друга, чем расположены соответствующие блоки оригинального аудиосигнала 1201 или декодированного низкочастотного сигнала 1202. В дополнение к этому сумматор с наложением 1270' реализуют с возможностью временной развертки аудиосигнала 1201 или декодированного низкочастотного сигнала 1202, основной тон которого не меняется, с целью осуществления сценария „автономного растягивания временной шкалы".
В другой компоновке компаратор 1260 может быть помещен в тракте обработки сигнала после сумматора с наложением 1270 таким образом, что он тоже будет включен в схему анализа через синтез, что может обеспечить преимущество за счет того, что в этом случае эффекты от различных взвешенных модифицированных сигналов временной области 1251, обработанных блоком суммирования с наложением 1270, также могут быть приняты в расчет при последующем сопоставлении/выборе окна.
В других альтернативных реализациях процессор фазового вокодера 1200 может включать в себя также дециматор, выполненный, например, в форме простого преобразователя частоты дискретизации с возможностью децимации (сжатия) развернутого сигнала с получением децимированного сигнала в целевом частотном диапазоне алгоритма расширения полосы.
Дальнейшие конструктивные решения процессора фазового вокодера предусматривают выполнение прямого анализа входного аудиосигнала с целью выбора оптимальной оконной функции анализа, адаптированной к характеристикам проанализированного аудиосигнала. В частности, установлено, что определенные сигналы выигрывают от использования специфицированных окон анализа для фазового вокодера. Например, зашумленные сигналы лучше поддаются анализу с применением, например, окна Tukey, в то время как преимущественно тональные сигналы выигрывают от небольшого основного лепестка передаточной функции, который обеспечивает, например, окно Бартлетта.
Суммируя сказанное, можно отметить, что процедура подбора оптимальной оконной функции может быть осуществлена или только на стороне кодера, например кодеров расширения полосы пропускания 300 и 800 на фиг.3 и 8, где в последующем выведенный указатель окна передается на сторону декодера, например декодера расширения полосы пропускания 400 на фиг.4, или на обеих сторонах - кодера и декодера, как в случае кодеров/декодеров расширения полосы 500 и 600 на фиг.5 и 6 или кодеров/декодеров расширения полосы 1000 и 1100 на фиг.10 и 11.
В данном контексте преимуществом является то, что в последнем случае указатель окна не вводится как дополнительная служебная информация в состав кодированного аудиосигнала, благодаря чему битрейт для его хранения или передачи снижается.
На фиг.13 отображен вариант компоновки устройства 1300, выполненного с возможностью переключения между различными окнами анализа и синтеза в зависимости от управляющей информации в ходе время-частотных преобразований в рамках реализации фазового вокодера. Входящий битстрим 1301-1 обрабатывается интерпретатором потока данных, выполняющим функцию разделения управляющей информации 1301-2 и аудиоданных 1301-3. Кроме того, на основании управляющей информации 1301-2 к аудиоданным 1301-3 может быть применена оконная функция анализа 1311-1 из множества 1311-2 окон анализа. Здесь для наглядности показано множество 1311-2 из четырех разных окон анализа, отображенных рамками от „окно анализа 1" до „окно анализа 4", где блок „окно анализа 1" является активированным окном анализа 1311-1. Управляющая информация 1301-2 может являться результатом прямого расчета характеристик сигнала или следствием задействования схемы анализа через синтез, как описано ранее. В случае зашумленного сигнала может быть выбрано, допустим, окно Tukey, а в случае тонального сигнала может быть выбрано, скажем, окно Бартлетта. Окно Tukey, которое также можно назвать косинусоидально-клиновидным (серповидным), может быть отображено как косинусоидальный выступ шириной (α·2) N, свернутый совместно с прямоугольным окном шириной (1.0-α·2) N. Окно Tukey может быть построено с использованием
где указанное окно превращается из прямоугольного окна в окно Ханнинга, так как параметр а изменяется от 0 до единицы. Окно Бартлетта, имеющее треугольную форму, может быть построено с помощью
В уравнениях (1) и (2) n - целочисленное значение, а N - ширина (в отсчетах) дискретизированных по времени оконных функций w(n).
После взвешивания окном анализа 1311-1 аудиосигнал может быть введен в блок „время-частотное преобразование" 1320 для дальнейшей трансформации из временной в частотную область. Сформированный спектр затем может быть передан для обработки в блок „преобразование в частотной области" 1330. В частности, блок 1330 может включать в себя фазокомпенсатор для фазовой корректировки спектральных характеристик. После этого модифицированный спектр может быть передан в блок „частотно-временное преобразование" 1340 для обратного преобразования во временную область с получением модифицированного сигнала временной области. В завершение, исходя из управляющей информации 1301-2, модифицированный сигнал временной области может быть взвешен с использованием окна синтеза 1351-1 из множества окон синтеза 1351-2, обозначенных от „окно синтеза 1" до „окно синтеза 4", из которых окно синтеза 1351-1 компенсирует эффекты от окна анализа 1311-1, с формированием на выходе устройства 1300 взвешенного модифицированного сигнала во временной области 1361 после сложения в блоке 1360, обозначенном знаком „+", всех возможных составляющих из всех каналов прохождения сигнала.
На фиг.14 представлена общая схема реализации декодера расширения полосы пропускания на базе фазового вокодера 1400. Практически, поток аудиоданных 1411-1 может быть разделен на кодированный сигнал нижних частот 1411-2 и данные гармонического расширения полосы пропускания/репликации спектральных полос HBE/SBR 1411-3. Закодированный сигнал низких частот 1411-2 декодируют с помощью корневого декодера 1420 с извлечением декодированного низкочастотного сигнала 1421, несущего в себе полосу центральной частоты 1425. Декодированный низкочастотный сигнал 1421 может содержать, предположим, данные ИКМ (импульсно-кодовой модуляции) с форматом фрейма 1024. Далее, декодированный низкочастотный сигнал 1421 проходит стадию задержки 1430 с образованием на выходе задержанного сигнала 1431. На следующем шаге сигнал с задержкой 1431 вводят в 32-полосный анализирующий банк КЗФ (квадратурно-зеркальных фильтров) 1440, генерирующий на основе задержанного сигнала 1431, например, 32 частотные подполосы 1441. Данные HBE/SBR 1411-3 могут включать в себя служебную информацию, управляющую коммутатором патчирования 1450, предназначенным для переключения между алгоритмом патчирования SBR и алгоритмом патчирования НВЕ. При задействовании алгоритма патчирования SBR частотные поддиапазоны 1441 поступают в устройство патчирования SBR 1460-1, формирующее патчированные данные КЗФ 1461. Патчированные данные КЗФ 1461 с выхода устройства патчирования SBR 1460-1 вводят в блок инструментальных средств HBE/SBR 1470-1, в схему которого могут быть включены, например, контур заполнения шумом 1470-2, контур восстановления недостающих гармоник 1470-3 или контур обратного фильтрования 1470-4. Так, с помощью блока инструментальных средств HBE/SBR 1470-1 к патчированным данным КЗФ 1461 могут быть применены известные механизмы репликации спектральных полос. В алгоритме патчирования, используемом устройством патчирования SBR 1460-1, может быть применено, например, зеркалирование или копирование спектральных данных в частотной области. Кроме того, управление блоком инструментальных средств HBE/SBR 1470-1 осуществляется с использованием данных HBE/SBR 1411-3. Патчированные данные КЗФ 1461 и выходные данные 1471 блока инструментальных средств HBE/SBR 1470-1 поступают в форматер огибающей 1470. Форматер огибающей 1470 введен с целью приведения огибающей в соответствие с генерируемым патчем таким образом, что на выходе формируется патчированный сигнал 1471 со скорректированной огибающей, включающий в себя полосу верхних частот. Сигнал со скорректированной огибающей 1471 вводят в синтезирующий банк КЗФ 1480, выполняющий функцию объединения компонент полосы верхних частот с аудиосигналом в частотной области 1441. В итоге на выходе синтезирован аудиосигнал 1481, обозначенный рамкой „форма волны".
В случае перехода к НВЕ-алгоритму патчирования (блок 1460-2) декодированный низкочастотный сигнал 1421 разбивают на отсчеты с пониженной частотой с помощью дискретизатора с увеличенным шагом 1490, скажем, на коэффициент 2, с получением версии декодированного низкочастотного сигнала 1491 с пониженной частотой дискретизации. Сигнал, дискретизированный с пониженной частотой 1491, далее может быть передан для обработки по усовершенствованной технологии с применением алгоритма гармонического расширения полосы пропускания на базе фазового вокодера.
С одной стороны, в случае необнаружения декодером нестационарности 1485 нестационарного события в блоке декодированного низкочастотного сигнала 1421 может быть использован адаптивный к сигналу метод обработки, где выполняется переключение между стандартным алгоритмом, показанным на схеме как путь прохождения сигнала 1500 с обозначением ,,no(/нет)", и усовершенствованным алгоритмом, показанным как путь сигнала 1510 с обозначением „yes(/da)", начиная с операции дополнения нулями (рамка 1515), в случае обнаружения события нестационарности в блоке.
С другой стороны, главным образом, выполняется адаптивная к сигналу коммутация характеристик окон анализа с помощью время-частотного преобразователя в структуре фазового вокодера, как подробно рассмотрено выше. Так, на фиг.14 рамки с пунктирным контуром 1520; 1530 обозначают окна, изменяемые через сигнал. В целом, фиг.14 демонстрирует приложение конструктивного решения фиг.13 к реализации процесса расширения полосы пропускания на базе фазового вокодера.
Здесь, рамки, обозначенные „FFT(/БПФ)" (быстрое преобразование Фурье), „фазовая адаптация" и „iFFT(/ОБПФ)" (обратное быстрое преобразование Фурье) могут соответствовать элементам 1320, 1330 и 1340 схемы на фиг.13 в порядке перечисления. В частности, преобразователи БПФ и ОБПФ могут быть реализованы с возможностью выполнения в отношении блока декодированного низкочастотного сигнала 1421 оконного преобразования Фурье (ОПФ) или дискретного преобразования Фурье (ДПФ) и обратного оконного преобразования (ООПФ) или обратного дискретного преобразования Фурье (ОДПФ) соответственно. В дополнение к этому декодер расширения полосы пропускания 1400 на фиг.14 может также включать в свой рабочий цикл этап повышения частоты дискретизации 1540, этап сложения наложением (OLA) 1550 и этап децимации 1560.
Обратим внимание на то, что представленный выше подход обеспечивает возможность коммутации разновидностей окон в любой позиции внутри аудиосигнала.
Несмотря на то, что данное изобретение представлено в контексте принципиальных блочных схем, где в виде блоков отображены реальные или логические инструментальные средства, изобретение также может быть реализовано как способ, осуществляемый в компьютерной среде. В этом случае блоки (рамки) схемы отображают соответствующие шаги осуществления способа, заменяющие аппаратные функции, выполняемые соответствующими логическими или физическими элементами технических средств.
Описанные выше примеры реализации приведены исключительно для наглядного представления основных принципов, лежащих в основе настоящего изобретения. Подразумевается, что для специалистов в данной области возможность внесения изменений и усовершенствований в компоновку и элементы описанной конструкции очевидна. В силу этого, представленные здесь описания и пояснения вариантов реализации изобретения ограничиваются только рамками патентных требований, а не конкретными деталями.
В зависимости от конкретных требований к практическому осуществления способов, относящихся к изобретению, эти способы могут быть реализованы в виде аппаратного или программного обеспечения. Для реализации может быть использована цифровая среда хранения информации, как, например, диск, DVD или CD, несущая электронно считываемые управляющие сигналы, совместимые с программируемыми вычислительными системами и обеспечивающие осуществление заявленных в изобретении способов. В целом, данное изобретение может быть реализовано как компьютерный программный продукт с хранящемся на машинно-считываемом накопителе кодом программы, обеспечивающим осуществление являющихся частью изобретения способов при условии, что компьютерный программный продукт выполняется на компьютерной техники. Иначе говоря, методы, относящиеся к изобретению, представляют собой, таким образом, компьютерную программу с присвоенным ей кодом программы, предназначенную для реализации, по меньшей мере, одного из относящихся к изобретению методов при выполнении компьютерной программы на компьютере. Относящийся к изобретению кодированный аудиосигнал может храниться на любом машиночитаемом носителе данных, относящемся к цифровой среде хранения информации.
Преимущества нового процесса обработки состоят в том, что представленные выше конструктивные решения, то есть - заявленные устройство, способы или компьютерные программы, направленные на расширение полосы пропускания частот, позволяют улучшить качество акустического восприятия. В частности, в этом процессе использована адаптивная к сигналу коммутация характеристик окон анализа, скажем, в рамках расширения полосы пропускания на базе фазового вокодера.
Новелла заявленного процесса применима в других приложениях фазового вокодера, таких как автономное растягивание временной шкалы в каждом случае, когда необходимо принимать в расчет характеристики сигнала для выбора оптимального окна анализа или синтеза.
Представленная концепция дает возможность расширению полосы пропускания с учетом характеристик сигнала при выполнении процедуры патчирования (заполнения пропуска). Решение о наиболее подходящем окне анализа может быть принято в пределах открытого или замкнутого контура. Благодаря этому через оптимизацию процесса восстановления достигается лучшее качество.
Наилучшее приложение предусматривается в аудиодекодерах, построенных на принципах расширения полосы пропускания. Тем не менее процесс, относящийся к изобретению, может также расширить сферу применения фазового вокодера, включая в нее музыкальную звукозапись или постпроцессинг фонограмм.
Claims (23)
1. Кодер расширения полосы пропускания (100; 300; 500; 800; 1000), предназначенный для кодирования аудиосигнала (101-1), содержащего низкочастотный сигнал (101-2), включающий полосу центральных частот (101-3), и содержащего высокочастотный сигнал (101-4), включающий полосу верхних частот (101-5), при этом в состав кодера (100; 300; 500; 800; 1000) входят:
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) окон анализа окна анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121); и
вычислитель параметров (130; 320; 830; 1030), предназначенный для расчета на основе высокочастотного сигнала (101-4) параметров расширения полосы пропускания (131; 321-2; 831; 1031);
кодер расширения полосы пропускания (300; 500), далее включающий оконный контроллер (310), предназначенный для вывода информации по управлению окнами (311), содержащей указания на множество (111-1) оконных функций анализа;
вычислитель параметров (320), включающий оконный преобразователь, управляемый оконным контроллером (310), где оконный преобразователь выполняет приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4),
анализатор сигнала (110) с модулем патчирования (330), генерирующий множество (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (расширения полосы пропускания) (321-1), где патчированные сигналы (331-1) содержат полосы верхних частот (331-2), генерируемые из полосы центральных частот (101-3);
компаратор (340; 510), предназначенный для определения множества (341-2) сравнительных параметров путем сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2) производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, при этом компаратор (340; 510) предназначен также для указания окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
выходной интерфейс (350; 530), предназначенный для вывода кодированного аудиосигнала (351; 531).
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) окон анализа окна анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121); и
вычислитель параметров (130; 320; 830; 1030), предназначенный для расчета на основе высокочастотного сигнала (101-4) параметров расширения полосы пропускания (131; 321-2; 831; 1031);
кодер расширения полосы пропускания (300; 500), далее включающий оконный контроллер (310), предназначенный для вывода информации по управлению окнами (311), содержащей указания на множество (111-1) оконных функций анализа;
вычислитель параметров (320), включающий оконный преобразователь, управляемый оконным контроллером (310), где оконный преобразователь выполняет приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4),
анализатор сигнала (110) с модулем патчирования (330), генерирующий множество (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (расширения полосы пропускания) (321-1), где патчированные сигналы (331-1) содержат полосы верхних частот (331-2), генерируемые из полосы центральных частот (101-3);
компаратор (340; 510), предназначенный для определения множества (341-2) сравнительных параметров путем сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2) производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, при этом компаратор (340; 510) предназначен также для указания окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
выходной интерфейс (350; 530), предназначенный для вывода кодированного аудиосигнала (351; 531).
2. Декодер расширения полосы пропускания (200; 400; 600; 1100; 1400), выполняющий декодирование закодированного аудиосигнала (201-1; 401-1; 601-1; 1411-1), содержащего в себе кодированный низкочастотный сигнал (201-2; 401-2; 601-2; 1411-2) и параметры верхней полосы частот (201-3; 401-3; 601-3; 1411-3), при этом в состав декодера (200; 400; 600; 1100; 1400) включены:
корневой декодер (210; 410; 680; 1420), предназначенный для декодирования закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
модуль патчирования (220; 420; 1460-2), генерирующий патчированный сигнал (221-1; 421; 671; 1461) на основе декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров верхней полосы частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461) содержит полосу верхних частот (221-2), генерированную на основе полосы центральных частот (211-2; 411-2; 681-2; 1425); и
комбинатор (230; 430; 690; 1480), предназначенный для сведения патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с выводом совокупного выходного сигнала (231-1; 431; 691; 1481),
где модуль патчирования (220) включает:
оконный анализатор (610), предназначенный для приложения множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) взвешенных сигналов низких частот;
время-спектральный преобразователь (620), трансформирующий взвешенные низкочастотные сигналы (611) в спектры (621);
процессор частотной области (630), обрабатывающий спектры (621) в частотной области с получением модифицированных спектров (631);
частотно-временной преобразователь (640), преобразующий модифицированные спектры (631) в модифицированные сигналы временной области (641);
оконный синтезатор (650), применяющий множество оконных функций синтеза к модифицированным сигналам временной области (641), при этом оконные функции синтеза соотнесены с оконными функциями анализа, что обеспечивает формирование взвешенных модифицированных сигналов во временной области (651); и
компаратор (660), предназначенный для нахождения множества сравнительных параметров на основе сопоставления множества (651) взвешенных модифицированных сигналов временной области с низкочастотным сигналом (681-1), при этом множество сравнительных параметров соответствует множеству (111-1) оконных функций анализа, кроме того, компаратор (660) выполнен с возможностью подбора оконной функции анализа и оконной функция синтеза, для которых сравнительный параметр удовлетворяет требуемому условию;
с учетом сказанного модуль патчирования (220) предназначен для генерации патчированного сигнала (671) на основании декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных компаратором (660), и параметров полосы верхних частот (601-3).
корневой декодер (210; 410; 680; 1420), предназначенный для декодирования закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
модуль патчирования (220; 420; 1460-2), генерирующий патчированный сигнал (221-1; 421; 671; 1461) на основе декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров верхней полосы частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461) содержит полосу верхних частот (221-2), генерированную на основе полосы центральных частот (211-2; 411-2; 681-2; 1425); и
комбинатор (230; 430; 690; 1480), предназначенный для сведения патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с выводом совокупного выходного сигнала (231-1; 431; 691; 1481),
где модуль патчирования (220) включает:
оконный анализатор (610), предназначенный для приложения множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) взвешенных сигналов низких частот;
время-спектральный преобразователь (620), трансформирующий взвешенные низкочастотные сигналы (611) в спектры (621);
процессор частотной области (630), обрабатывающий спектры (621) в частотной области с получением модифицированных спектров (631);
частотно-временной преобразователь (640), преобразующий модифицированные спектры (631) в модифицированные сигналы временной области (641);
оконный синтезатор (650), применяющий множество оконных функций синтеза к модифицированным сигналам временной области (641), при этом оконные функции синтеза соотнесены с оконными функциями анализа, что обеспечивает формирование взвешенных модифицированных сигналов во временной области (651); и
компаратор (660), предназначенный для нахождения множества сравнительных параметров на основе сопоставления множества (651) взвешенных модифицированных сигналов временной области с низкочастотным сигналом (681-1), при этом множество сравнительных параметров соответствует множеству (111-1) оконных функций анализа, кроме того, компаратор (660) выполнен с возможностью подбора оконной функции анализа и оконной функция синтеза, для которых сравнительный параметр удовлетворяет требуемому условию;
с учетом сказанного модуль патчирования (220) предназначен для генерации патчированного сигнала (671) на основании декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных компаратором (660), и параметров полосы верхних частот (601-3).
3. Кодер расширения полосы пропускания (500) по п.1, в котором модуль патчирования (330) включает оконный преобразователь, управляемый оконным контроллером (310), предназначенный для применения множества (111-1) оконных функций анализа к низкочастотному сигналу (101-2);
где компаратор (510) выполнен с возможностью нахождения множества сравнительных параметров на основании сравнения патчированных сигналов (331-1) с опорным низкочастотным сигналом (101-2), производным от аудиосигнала; и
в котором устройство выходного интерфейса (530) выводит кодированный аудиосигнал (531), не содержащий указатель окна (511).
где компаратор (510) выполнен с возможностью нахождения множества сравнительных параметров на основании сравнения патчированных сигналов (331-1) с опорным низкочастотным сигналом (101-2), производным от аудиосигнала; и
в котором устройство выходного интерфейса (530) выводит кодированный аудиосигнал (531), не содержащий указатель окна (511).
4. Кодер (300; 500) расширения полосы пропускания по п.1 или 3, в котором компаратор (340; 510; 660; 700) предназначен для расчета множества (703-1) параметров спектральной неравномерности SFM для патчированных сигналов (331-1) или взвешенных модифицированных сигналов временной области (651) и опорного параметра SFM (703-2), выведенного из аудиосигнала (101-1) или декодированного низкочастотного сигнала (681-1), и для нахождения множества (705) сравнительных параметров путем сопоставления параметров SFM (703-1) и опорного параметра SFM (703-2).
5. Декодер (600) расширения полосы пропускания по п.2, в котором компаратор (340; 510; 660; 700) предназначен для расчета множества (703-1) параметров спектральной неравномерности SFM для патчированных сигналов (331-1) или взвешенных модифицированных сигналов временной области (651) и опорного параметра SFM (703-2), выведенного из аудиосигнала (101-1) или декодированного низкочастотного сигнала (681-1), и для нахождения множества (705) сравнительных параметров путем сопоставления параметров SFM (703-1) и опорного параметра SFM (703-2).
6. Кодер расширения полосы пропускания (800) по п.1, в составе которого анализатор сигнала (110) включает в себя классификатор сигналов (810; 900), предназначенный для классификации аудиосигнала (101-1) или его деривата (101-4) с целью определения указателя окна (811), соответствующего оконной функции анализа, исходя из характеристики классифицированного сигнала; кодер (800), в составе которого оконный контроллер (820) формирует информацию по управлению окнами (821) на основании указателя окна (811), определенного классификатором сигналов (810); вычислитель параметров (830) включает в себя оконный преобразователь, управляемый оконным контроллером (820), выполненный с возможностью применения оконной функции анализа к высокочастотному сигналу (101-4) на основании информации по управлению окнами (821); и устройство выходного интерфейса (840) обеспечивает вывод кодированного аудиосигнала (841).
7. Кодер расширения полосы пропускания (1000) по п.1, в составе которого анализатор сигнала (110) включает в себя классификатор сигналов (900; 1010), классифицирующий низкочастотный сигнал (101-2), производный от аудиосигнала (101-1), с целью определения указателя окна (1011), соответствующего оконной функции анализа, исходя из характеристики классифицированного сигнала; оконный контроллер (1020) выводит информацию по управлению окнами (1021) на основании указателя окна (1011), определенного классификатором сигналов (900; 1010); вычислитель параметров (1030) включает в себя оконный преобразователь, управляемый оконным контроллером (1020), применяющий оконную функцию анализа к высокочастотному сигналу (101-4) на основании информации по управлению окнами (1021); и устройство выходного интерфейса (1040), обеспечивающее вывод кодированного аудиосигнала (1041), не содержащего указатель окна (1011).
8. Кодер расширения полосы пропускания (500; 1000) в соответствии с пп. 3 или 7, в который также входит корневой декодер (520; 1050), выполняющий декодирование закодированного низкочастотного сигнала (121) с выводом декодированного низкочастотного сигнала (521; 1051).
9. Процессор фазового вокодера (1200), выполняющий обработку аудиосигнала (1201), включающий:
оконный анализатор (1210), предназначенный для применения множества (111-1) оконных (весовых) функций анализа к аудиосигналу (1201) или сигналу (1202), производному от аудиосигнала, причем аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную длину во времени, с целью получения множества (1211) взвешенных аудиосигналов;
время-спектральный преобразователь (1220), предназначенный для трансформирования взвешенных аудиосигналов (1211) в спектры (1221);
процессор частотной области (1230), предназначенный для обработки спектров (1221) в области трансформанты с формированием модифицированных спектров (1231);
частотно-временной преобразователь (1240), предназначенный для преобразования модифицированных спектров (1231) в модифицированные сигналы временной области (1241);
оконный синтезатор (1250), предназначенный для применения множества весовых функций синтеза к модифицированным сигналам во временной области (1241), при этом оконные весовые функции синтеза соотнесены с весовыми функциями анализа, с образованием взвешенных модифицированных сигналов временной области (1251);
компаратор (1260), предназначенный для определения множества сравнительных параметров на основе сопоставления множества (1251) взвешенных модифицированных сигналов во временной области с аудиосигналом (1201) или деривата (1202) аудиосигнала, при этом множество сравнительных параметров соответствует множеству оконных функций анализа, и при этом компаратор (1260), кроме того, выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию; и
устройство суммирования с наложением (1270), выполняющее сложение наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием сигнала с растянутой временной шкалой, предназначенное для обработки блоков взвешенного сигнала временной области (1255), модифицированного посредством весовой функции анализа и весовой функции синтеза, отобранных компаратором (1260).
оконный анализатор (1210), предназначенный для применения множества (111-1) оконных (весовых) функций анализа к аудиосигналу (1201) или сигналу (1202), производному от аудиосигнала, причем аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную длину во времени, с целью получения множества (1211) взвешенных аудиосигналов;
время-спектральный преобразователь (1220), предназначенный для трансформирования взвешенных аудиосигналов (1211) в спектры (1221);
процессор частотной области (1230), предназначенный для обработки спектров (1221) в области трансформанты с формированием модифицированных спектров (1231);
частотно-временной преобразователь (1240), предназначенный для преобразования модифицированных спектров (1231) в модифицированные сигналы временной области (1241);
оконный синтезатор (1250), предназначенный для применения множества весовых функций синтеза к модифицированным сигналам во временной области (1241), при этом оконные весовые функции синтеза соотнесены с весовыми функциями анализа, с образованием взвешенных модифицированных сигналов временной области (1251);
компаратор (1260), предназначенный для определения множества сравнительных параметров на основе сопоставления множества (1251) взвешенных модифицированных сигналов во временной области с аудиосигналом (1201) или деривата (1202) аудиосигнала, при этом множество сравнительных параметров соответствует множеству оконных функций анализа, и при этом компаратор (1260), кроме того, выполнен с возможностью подбора оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию; и
устройство суммирования с наложением (1270), выполняющее сложение наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием сигнала с растянутой временной шкалой, предназначенное для обработки блоков взвешенного сигнала временной области (1255), модифицированного посредством весовой функции анализа и весовой функции синтеза, отобранных компаратором (1260).
10. Способ (100; 300; 500; 1000) кодирования аудиосигнала (101-1), состоящего из низкочастотного сигнала (101-2), содержащего полосу центральных частот (101-3), и высокочастотного сигнала (101-4), содержащего полосу верхних частот (101-5), включающий:
анализ (110) аудиосигнала (101-1), содержащего блок (101-6) аудиоотсчетов, имеющий определенную протяженность во времени, с целью определения из множества (111-1) окон анализа окна анализа (111-2) для использования в процедуре расширения полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121); и
вычисление (130; 320; 830; 1030) параметров расширения полосы пропускания на основе высокочастотного сигнала (101-4);
способ дополнительно включает:
обеспечение информации по управлению окнами (311) с указанием множества (111-1) оконных функций анализа, приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4), генерация множества (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (321-1), где патчированные сигналы (331-1) включают полосы верхних частот (331-2) генерируемые из полосы центральных частот (101-3);
определение множества (341-2) сравнительных параметров на основе сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2), производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, и указание окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
обеспечение кодированного аудиосигнала (351; 531).
анализ (110) аудиосигнала (101-1), содержащего блок (101-6) аудиоотсчетов, имеющий определенную протяженность во времени, с целью определения из множества (111-1) окон анализа окна анализа (111-2) для использования в процедуре расширения полосы пропускания на стороне декодера расширения полосы пропускания (200; 400; 1400);
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121); и
вычисление (130; 320; 830; 1030) параметров расширения полосы пропускания на основе высокочастотного сигнала (101-4);
способ дополнительно включает:
обеспечение информации по управлению окнами (311) с указанием множества (111-1) оконных функций анализа, приложение множества (111-1) оконных функций анализа и оконной функции анализа (111-2), выбранной компаратором (340; 510), к высокочастотному сигналу (101-4), генерация множества (331-1) патчированных сигналов на основе низкочастотного сигнала (101-2), информации по управлению окнами (311) и параметров BWE (321-1), где патчированные сигналы (331-1) включают полосы верхних частот (331-2) генерируемые из полосы центральных частот (101-3);
определение множества (341-2) сравнительных параметров на основе сравнения патчированных сигналов (331-1) и контрольного сигнала, являющегося аудиосигналом (101-1) или сигналом (101-4; 101-2), производным от аудиосигнала, где множество (341-2) сравнительных параметров соответствует множеству (111-1) оконных функций анализа, и указание окна (341-1; 511), соответствующего оконной функции анализа (111-2), для которой сравнительный параметр удовлетворяет заданному условию; и
обеспечение кодированного аудиосигнала (351; 531).
11. Способ (200; 400; 600; 1100; 1400) декодирования закодированного аудиосигнала (201-1; 401-1; 601-1; 1411-1), содержащего кодированный низкочастотный сигнал (201-2; 401-2; 601-2; 1411-2) и параметры верхней полосы частот (201-3; 401-3; 601-3; 1411-3), включающий:
декодирование (210; 410; 680; 1420) закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
генерирование (220; 420; 1460-2) патчированного сигнала (221-1; 421; 671; 1461), исходя из декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров полосы верхних частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461), содержит полосу верхних частот (221-2), генерированную из полосы центральных частот (211-2; 411-2; 681-2; 1425); и
сведение (230; 430; 690; 1480) патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с получением сведенного выходного сигнала (231-1; 431; 691; 1481), при этом генерация (220) патчированного сигнала включает:
приложение множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) оконно-взвешенных низкочастотных сигналов;
преобразование оконно-взвешенных низкочастотных сигналов (611) в спектры (621);
обработка спектров (621) в частотной области с получением модифицированных спектров (631);
преобразование модифицированных спектров (631) в модифицированные сигналы временной области (641);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (641), при выполнении которого оконные функции синтеза согласуются с оконными функциями анализа с формированием оконно-взвешенных модифицированных сигналов временной области (651); и
определение множества сравнительных параметров на основе сравнения множества (651) взвешенных модифицированных сигналов временной области и декодированного низкочастотного сигнала (681-1), где множество сравнительных параметров соответствует множеству (111-1) весовых (оконных) функций анализа, и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, и генерирование патчированного сигнала (671) на основе декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных путем определения множества сравнительных параметров и параметров верхней полосы частот (601-3).
декодирование (210; 410; 680; 1420) закодированного низкочастотного сигнала (201-2; 401-2; 601-2; 1411-2), содержащего полосу центральных частот (211-2; 411-2; 681-2; 1425);
генерирование (220; 420; 1460-2) патчированного сигнала (221-1; 421; 671; 1461), исходя из декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) и параметров полосы верхних частот (201-3; 401-3; 601-3; 1411-3), при этом патчированный сигнал (221-1; 421; 671; 1461), содержит полосу верхних частот (221-2), генерированную из полосы центральных частот (211-2; 411-2; 681-2; 1425); и
сведение (230; 430; 690; 1480) патчированного сигнала (221-1; 421; 671; 1461) и декодированного низкочастотного сигнала (211-1; 411-1; 681-1; 1421) с получением сведенного выходного сигнала (231-1; 431; 691; 1481), при этом генерация (220) патчированного сигнала включает:
приложение множества (111-1) оконных функций анализа к декодированному низкочастотному сигналу (681-1) с получением множества (611) оконно-взвешенных низкочастотных сигналов;
преобразование оконно-взвешенных низкочастотных сигналов (611) в спектры (621);
обработка спектров (621) в частотной области с получением модифицированных спектров (631);
преобразование модифицированных спектров (631) в модифицированные сигналы временной области (641);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (641), при выполнении которого оконные функции синтеза согласуются с оконными функциями анализа с формированием оконно-взвешенных модифицированных сигналов временной области (651); и
определение множества сравнительных параметров на основе сравнения множества (651) взвешенных модифицированных сигналов временной области и декодированного низкочастотного сигнала (681-1), где множество сравнительных параметров соответствует множеству (111-1) весовых (оконных) функций анализа, и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, и генерирование патчированного сигнала (671) на основе декодированного низкочастотного сигнала (681-1), оконной функции анализа и оконной функции синтеза, подобранных путем определения множества сравнительных параметров и параметров верхней полосы частот (601-3).
12. Способ обработки аудиосигнала (1201) с помощью процессора фазового вокодера (1200), включающий:
приложение множества (111-1) оконных функций анализа к аудиосигналу (1201) или к производному от него сигналу (1202), когда аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную продолжительность во времени, с формированием множества (1211) взвешенных аудиосигналов с помощью оконного анализатора (1210);
преобразование взвешенных аудиосигналов (1211) в спектры (1221) с помощью время-спектрального преобразователя (1220);
обработка спектров (1221) в частотной области с формированием модифицированных спектров (1231) с помощью процессора частотной области (1230);
преобразование модифицированных спектров (1231) в модифицированные сигналы временной области (1241) с помощью частотно-временного преобразователя (1240);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (1241), при котором оконные функции синтеза согласуются с оконными функциями анализа с формированием взвешенных модифицированных сигналов временной области (1251) с помощью оконного синтезатора (1250);
определение множества сравнительных параметров на основе сравнения множества (1251) взвешенных модифицированных сигналов временной области и аудиосигнала (1201) или производного от аудиосигнала сигнала (1202), где множество сравнительных параметров соответствует множеству оконных функций анализа, с помощью компаратора (1260) и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, с помощью компаратора (1260); и
сложение с наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием развернутого во времени сигнала (1271) с помощью сумматора с наложением (1270) и обработка блоков взвешенного модифицированного сигнала временной области (1255), модифицированных посредством оконной функции анализа и оконной функции синтеза, подобранных на шаге отбора компаратором (1260), с помощью сумматора с наложением (1270).
приложение множества (111-1) оконных функций анализа к аудиосигналу (1201) или к производному от него сигналу (1202), когда аудиосигнал (1201) содержит блок (101-6) аудиоотсчетов, имеющий определенную продолжительность во времени, с формированием множества (1211) взвешенных аудиосигналов с помощью оконного анализатора (1210);
преобразование взвешенных аудиосигналов (1211) в спектры (1221) с помощью время-спектрального преобразователя (1220);
обработка спектров (1221) в частотной области с формированием модифицированных спектров (1231) с помощью процессора частотной области (1230);
преобразование модифицированных спектров (1231) в модифицированные сигналы временной области (1241) с помощью частотно-временного преобразователя (1240);
приложение множества оконных функций синтеза к модифицированным сигналам временной области (1241), при котором оконные функции синтеза согласуются с оконными функциями анализа с формированием взвешенных модифицированных сигналов временной области (1251) с помощью оконного синтезатора (1250);
определение множества сравнительных параметров на основе сравнения множества (1251) взвешенных модифицированных сигналов временной области и аудиосигнала (1201) или производного от аудиосигнала сигнала (1202), где множество сравнительных параметров соответствует множеству оконных функций анализа, с помощью компаратора (1260) и подбор оконной функции анализа и оконной функции синтеза, для которых сравнительный параметр удовлетворяет заданному условию, с помощью компаратора (1260); и
сложение с наложением блоков взвешенного модифицированного сигнала временной области (1255) с формированием развернутого во времени сигнала (1271) с помощью сумматора с наложением (1270) и обработка блоков взвешенного модифицированного сигнала временной области (1255), модифицированных посредством оконной функции анализа и оконной функции синтеза, подобранных на шаге отбора компаратором (1260), с помощью сумматора с наложением (1270).
13. Машиночитаемая запоминающая среда, хранящая компьютерную программу, имеющую код программы, для осуществления способа по п.10 при условии выполнения компьютерной программы на компьютере.
14. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, для осуществления способа по п.11 при условии выполнения компьютерной программы на компьютере.
15. Машиночитаемый носитель информации с сохраненной на нем компьютерной программой, имеющей код программы, для осуществления способа по п.12 при условии выполнения компьютерной программы на компьютере.
16. Кодер расширения полосы пропускания (800), кодирующий аудиосигнал (101-1) с формированием кодированного аудиосигнала (103-1), причем аудиосигнал (101-1) содержит низкочастотный сигнал (101-2), включающий полосу центральных частот (101-3), и высокочастотный сигнал (101-4), включающий полосу верхних частот (101-5), при этом в состав кодера (800) входят:
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) оконных функций анализа оконную функцию анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификатор сигналов (810), который классифицирует аудиосигнал (101-1) или сигнал, производный от аудиосигнала (101-4), определяя указатель окна (811), соответствующий оконной функции анализа, исходя из характеристики аудиосигнала;
оконный контроллер (820), обеспечивающий на выходе информацию по управлению окнами (821) на основе указателя окна (811), определяемого классификатором сигналов (810), содержащую множество (111-1) оконных функций анализа с различными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121);
вычислитель параметров (830), рассчитывающий параметры расширения полосы пропускания (831) на основе высокочастотного сигнала (101-4), включающий оконный преобразователь, управляемый оконным контроллером (820), где оконный преобразователь отвечает за приложение оконной функции анализа, исходя из информации по управлению окнами (821), к высокочастотному сигналу (101-4); и
выходной интерфейс (840) для вывода кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатели окон (811).
анализатор сигнала (110), предназначенный для анализа аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, выполненный с возможностью определения из множества (111-1) оконных функций анализа оконную функцию анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификатор сигналов (810), который классифицирует аудиосигнал (101-1) или сигнал, производный от аудиосигнала (101-4), определяя указатель окна (811), соответствующий оконной функции анализа, исходя из характеристики аудиосигнала;
оконный контроллер (820), обеспечивающий на выходе информацию по управлению окнами (821) на основе указателя окна (811), определяемого классификатором сигналов (810), содержащую множество (111-1) оконных функций анализа с различными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
корневой кодер (120), предназначенный для кодирования низкочастотного сигнала (101-2) с получением кодированного низкочастотного сигнала (121);
вычислитель параметров (830), рассчитывающий параметры расширения полосы пропускания (831) на основе высокочастотного сигнала (101-4), включающий оконный преобразователь, управляемый оконным контроллером (820), где оконный преобразователь отвечает за приложение оконной функции анализа, исходя из информации по управлению окнами (821), к высокочастотному сигналу (101-4); и
выходной интерфейс (840) для вывода кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатели окон (811).
17. Кодер расширения полосы пропускания (800) по п.16, в составе которого классификатор сигналов (810) включает:
измеритель тонального уровня (910), анализирующий аудиосигнал на меру тональности;
определитель типа сигнала (920), распознающий характеристики аудиосигнала на основе меры тональности; и
оконный селектор (930), обеспечивающий указатель окна (811) исходя из характеристики сигнала.
измеритель тонального уровня (910), анализирующий аудиосигнал на меру тональности;
определитель типа сигнала (920), распознающий характеристики аудиосигнала на основе меры тональности; и
оконный селектор (930), обеспечивающий указатель окна (811) исходя из характеристики сигнала.
18. Кодер расширения полосы пропускания (800) по п.16, схема которого предусматривает подачу информации по управлению окнами (821) на драйвер параметров таким образом, что первая оконная функция, характеризующаяся передаточной функцией, имеющей первую ширину главного лепестка, применяется оконным преобразователем вычислителя параметров (830), когда вычисленная мера тональности аудиосигнала ниже заданного порогового значения, и таким образом, что вторая оконная функция, характеризующаяся передаточной функцией, имеющей вторую ширину главного лепестка, применяется оконным преобразователем вычислителя параметров (830), когда вычисленная мера тональности аудиосигнала равна или выше предварительно заданного порогового значения, при этом первая ширина главного лепестка превосходит вторую ширину главного лепестка.
19. Декодер расширения полосы пропускания (400), предназначенный для декодирования кодированного аудиосигнала (401-1), содержащего закодированный низкочастотный сигнал (401-2), параметры верхней полосы частот (401-3) и указатель окна (401-4), при этом в состав декодера (400) входят:
корневой декодер (410), декодирующий кодированный низкочастотный сигнал (401-2), где декодированный низкочастотный сигнал (411-1) включает полосу центральных частот (411-2);
модуль патчирования (420), генерирующий патчированный сигнал (421) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3), где патчированный сигнал (421) содержит полосу верхних частот (221-2), генерируемых из полосы центральных частот (211-2; 411-2), при этом модуль патчирования (420) включает управляемый оконный преобразователь, селектирующий оконную функцию анализа из множества оконных функций анализа на основе указателя окна (401-4) и применяющий селектированную оконную функцию анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
комбинатор (430), представляющий собой блок сведения патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).
корневой декодер (410), декодирующий кодированный низкочастотный сигнал (401-2), где декодированный низкочастотный сигнал (411-1) включает полосу центральных частот (411-2);
модуль патчирования (420), генерирующий патчированный сигнал (421) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3), где патчированный сигнал (421) содержит полосу верхних частот (221-2), генерируемых из полосы центральных частот (211-2; 411-2), при этом модуль патчирования (420) включает управляемый оконный преобразователь, селектирующий оконную функцию анализа из множества оконных функций анализа на основе указателя окна (401-4) и применяющий селектированную оконную функцию анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
комбинатор (430), представляющий собой блок сведения патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).
20. Способ (100; 300; 500; 1000) кодирования аудиосигнала (101-1), содержащего низкочастотный сигнал (101-2) с полосой центральных частот (101-3) и высокочастотный сигнал (101-4) с полосой верхних частот (101-5), включающий:
анализ (110) аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, для определения из множества (111-1) оконных функций анализа оконной функции анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификацию аудиосигнала (101-1) или сигнала (101-4), производного от аудиосигнала, с использованием классификатора сигналов (810) для определения указателя окна (811), соответствующего оконной функции анализа, исходя из характеристики аудиосигнала;
обеспечение с помощью оконного контроллера (820) информации по управлению окнами (821) на основе указателя окна (811), определенного классификатором сигналов (810), где множество (111-1) оконных функций анализа, указанных в информации по управлению окнами на выходе оконного контроллера, включает различные оконные функции анализа с разнообразными оконными характеристиками, с передаточными функциями, различающимися шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121);
расчет (130) параметров расширения полосы пропускания из высокочастотного сигнала с приложением оконной функции анализа на основе информации по управлению окнами (821) к высокочастотному сигналу (101-4) посредством оконного преобразователя, управляемого оконным контроллером (820);
вывод посредством выходного интерфейса (840) кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатель окна (811).
анализ (110) аудиосигнала (101-1), содержащего блок аудиоотсчетов (101-6) определенной длительности во времени, для определения из множества (111-1) оконных функций анализа оконной функции анализа (111-2) для приложения при расширении полосы пропускания на стороне декодера расширения полосы пропускания (400), включающий классификацию аудиосигнала (101-1) или сигнала (101-4), производного от аудиосигнала, с использованием классификатора сигналов (810) для определения указателя окна (811), соответствующего оконной функции анализа, исходя из характеристики аудиосигнала;
обеспечение с помощью оконного контроллера (820) информации по управлению окнами (821) на основе указателя окна (811), определенного классификатором сигналов (810), где множество (111-1) оконных функций анализа, указанных в информации по управлению окнами на выходе оконного контроллера, включает различные оконные функции анализа с разнообразными оконными характеристиками, с передаточными функциями, различающимися шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков;
кодирование (120) низкочастотного сигнала (102-2) с формированием кодированного низкочастотного сигнала (121);
расчет (130) параметров расширения полосы пропускания из высокочастотного сигнала с приложением оконной функции анализа на основе информации по управлению окнами (821) к высокочастотному сигналу (101-4) посредством оконного преобразователя, управляемого оконным контроллером (820);
вывод посредством выходного интерфейса (840) кодированного аудиосигнала (841), содержащего кодированный низкочастотный сигнал (121), параметры расширения полосы пропускания и указатель окна (811).
21. Способ декодирования кодированного аудиосигнала (401-1), содержащего кодированный низкочастотный сигнал (401-2), параметры верхней полосы частот (401-3) и указатель окна (401-4), включающий:
декодирование (410) кодированного низкочастотного сигнала (401-2), где декодированный низкочастотный сигнал (411-1) содержит полосу центральных частот (411-2);
генерирование (420) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3) патчированного сигнала (421), содержащего полосу верхних частот (221-2), формируемую из полосы центральных частот (411-2), включающее подбор управляемым оконным преобразователем оконной функции анализа из множества оконных функций анализа на основе указателя окна (401-4) и приложение выбранной оконной функции анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
сведение (430) патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).
декодирование (410) кодированного низкочастотного сигнала (401-2), где декодированный низкочастотный сигнал (411-1) содержит полосу центральных частот (411-2);
генерирование (420) на основе декодированного низкочастотного сигнала (411-1) и параметров верхней полосы частот (401-3) патчированного сигнала (421), содержащего полосу верхних частот (221-2), формируемую из полосы центральных частот (411-2), включающее подбор управляемым оконным преобразователем оконной функции анализа из множества оконных функций анализа на основе указателя окна (401-4) и приложение выбранной оконной функции анализа к декодированному низкочастотному сигналу (411-1) с формированием патчированного сигнала (421), где множество (111-1) оконных функций анализа, обозначенных указателем окна, включает различные оконные функции анализа с разнообразными оконными характеристиками, где оконные функции анализа имеют разнообразные передаточные функции, отличающиеся шириной главного лепестка, уровнями боковых лепестков или спадами боковых лепестков; и
сведение (430) патчированного сигнала (421) и декодированного низкочастотного сигнала (411-1) с формированием сведенного выходного сигнала (431).
22. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, предназначенной для осуществления способа по п.20 при условии выполнения компьютерной программы на компьютере.
23. Машиночитаемый носитель информации, с сохраненной на нем компьютерной программой, имеющей код программы, предназначенной для осуществления способа по п.21 при условии выполнения компьютерной программы на компьютере.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US22144209P | 2009-06-29 | 2009-06-29 | |
US61/221,442 | 2009-06-29 | ||
EP10153530.0 | 2010-02-12 | ||
EP10153530A EP2273493B1 (en) | 2009-06-29 | 2010-02-12 | Bandwidth extension encoding and decoding |
PCT/EP2010/059025 WO2011000780A1 (en) | 2009-06-29 | 2010-06-24 | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2012102411A RU2012102411A (ru) | 2013-08-20 |
RU2563164C2 true RU2563164C2 (ru) | 2015-09-20 |
Family
ID=42537947
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2012102411/08A RU2563164C2 (ru) | 2009-06-29 | 2010-06-24 | Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер |
Country Status (14)
Country | Link |
---|---|
US (1) | US8606586B2 (ru) |
EP (2) | EP2273493B1 (ru) |
JP (1) | JP5329714B2 (ru) |
KR (1) | KR101425157B1 (ru) |
CN (1) | CN102473414B (ru) |
AU (1) | AU2010268160B2 (ru) |
BR (1) | BRPI1010165B1 (ru) |
CA (2) | CA2766573C (ru) |
ES (2) | ES2400661T3 (ru) |
HK (2) | HK1153035A1 (ru) |
MX (1) | MX2011013610A (ru) |
PL (2) | PL2273493T3 (ru) |
RU (1) | RU2563164C2 (ru) |
WO (1) | WO2011000780A1 (ru) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
Families Citing this family (38)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102473417B (zh) | 2010-06-09 | 2015-04-08 | 松下电器(美国)知识产权公司 | 频带扩展方法、频带扩展装置、集成电路及音频解码装置 |
KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
US9177570B2 (en) * | 2011-04-15 | 2015-11-03 | St-Ericsson Sa | Time scaling of audio frames to adapt audio processing to communications network timing |
US9697840B2 (en) * | 2011-11-30 | 2017-07-04 | Dolby International Ab | Enhanced chroma extraction from an audio codec |
CN108831501B (zh) | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
RU2725416C1 (ru) | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
CN106409299B (zh) * | 2012-03-29 | 2019-11-05 | 华为技术有限公司 | 信号编码和解码的方法和设备 |
EP2709106A1 (en) | 2012-09-17 | 2014-03-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
ES2768179T3 (es) * | 2013-01-29 | 2020-06-22 | Fraunhofer Ges Forschung | Codificador de audio, decodificador de audio, método para proporcionar una información de audio codificada, método para proporcionar una información de audio decodificada, programa informático y representación codificada utilizando una ampliación de ancho de banda adaptada a la señal |
RU2676242C1 (ru) * | 2013-01-29 | 2018-12-26 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Декодер для формирования аудиосигнала с улучшенной частотной характеристикой, способ декодирования, кодер для формирования кодированного сигнала и способ кодирования с использованием компактной дополнительной информации для выбора |
RU2625945C2 (ru) | 2013-01-29 | 2017-07-19 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство и способ для генерирования сигнала с улучшенным спектром, используя операцию ограничения энергии |
US9319510B2 (en) * | 2013-02-15 | 2016-04-19 | Qualcomm Incorporated | Personalized bandwidth extension |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
CA2927990C (en) | 2013-10-31 | 2018-08-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain |
EP2881943A1 (en) | 2013-12-09 | 2015-06-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding an encoded audio signal with low computational resources |
CN103714822B (zh) * | 2013-12-27 | 2017-01-11 | 广州华多网络科技有限公司 | 基于silk编解码器的子带编解码方法及装置 |
WO2015133795A1 (ko) * | 2014-03-03 | 2015-09-11 | 삼성전자 주식회사 | 대역폭 확장을 위한 고주파 복호화 방법 및 장치 |
CN106463143B (zh) | 2014-03-03 | 2020-03-13 | 三星电子株式会社 | 用于带宽扩展的高频解码的方法及设备 |
SG11201609834TA (en) | 2014-03-24 | 2016-12-29 | Samsung Electronics Co Ltd | High-band encoding method and device, and high-band decoding method and device |
CN111710342B (zh) * | 2014-03-31 | 2024-04-16 | 弗朗霍弗应用研究促进协会 | 编码装置、解码装置、编码方法、解码方法及程序 |
KR102191506B1 (ko) * | 2014-05-14 | 2020-12-16 | 삼성전자주식회사 | 통신 시스템에서 송신 신호 처리 장치 및 방법 |
CN104007977A (zh) * | 2014-06-09 | 2014-08-27 | 威盛电子股份有限公司 | 电子装置及音频播放方法 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
JP2016038435A (ja) * | 2014-08-06 | 2016-03-22 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
US10117247B2 (en) * | 2015-03-13 | 2018-10-30 | Futurewei Technologies, Inc. | Windowing methods for efficient channel aggregation and deaggregation |
KR101642112B1 (ko) | 2015-10-29 | 2016-07-22 | 주식회사 님버스 | 이동통신망에서 실시간 멀티미디어를 송수신하기 위한 모뎀 본딩 시스템 및 방법 |
US10504530B2 (en) | 2015-11-03 | 2019-12-10 | Dolby Laboratories Licensing Corporation | Switching between transforms |
KR101688647B1 (ko) | 2016-04-04 | 2016-12-22 | 주식회사 님버스 | 이동통신망에서 실시간 저지연 전송을 위한 모뎀 본딩 시스템 및 방법 |
CN110062945B (zh) * | 2016-12-02 | 2023-05-23 | 迪拉克研究公司 | 音频输入信号的处理 |
US11527256B2 (en) * | 2018-04-25 | 2022-12-13 | Dolby International Ab | Integration of high frequency audio reconstruction techniques |
CA3152262A1 (en) * | 2018-04-25 | 2019-10-31 | Dolby International Ab | Integration of high frequency reconstruction techniques with reduced post-processing delay |
WO2020094263A1 (en) | 2018-11-05 | 2020-05-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and audio signal processor, for providing a processed audio signal representation, audio decoder, audio encoder, methods and computer programs |
CN113593586A (zh) * | 2020-04-15 | 2021-11-02 | 华为技术有限公司 | 音频信号编码方法、解码方法、编码设备以及解码设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
WO1998002971A1 (en) * | 1996-07-11 | 1998-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A method of coding and decoding audio signals |
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
EP1672618A1 (en) * | 2003-10-07 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
RU2006134641A (ru) * | 2004-03-01 | 2008-04-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) | Устройство и способ обработки многоканального сигнала |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6921740B1 (en) * | 1999-08-31 | 2005-07-26 | Mitsubishi Paper Miils Ltd. | Electron-receiving compound and thermal recording material |
US6704711B2 (en) * | 2000-01-28 | 2004-03-09 | Telefonaktiebolaget Lm Ericsson (Publ) | System and method for modifying speech signals |
US6636830B1 (en) * | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
US20020128839A1 (en) * | 2001-01-12 | 2002-09-12 | Ulf Lindgren | Speech bandwidth extension |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
US7389226B2 (en) * | 2002-10-29 | 2008-06-17 | Ntt Docomo, Inc. | Optimized windows and methods therefore for gradient-descent based window optimization for linear prediction analysis in the ITU-T G.723.1 speech coding standard |
EP1595247B1 (en) * | 2003-02-11 | 2006-09-13 | Koninklijke Philips Electronics N.V. | Audio coding |
JP2007508623A (ja) | 2003-10-08 | 2007-04-05 | ユニシス コーポレーション | 複数のノードにわたってシステムリソースを割り当てて管理する仮想データセンタ |
US7953605B2 (en) * | 2005-10-07 | 2011-05-31 | Deepen Sinha | Method and apparatus for audio encoding and decoding using wideband psychoacoustic modeling and bandwidth extension |
JP2007304258A (ja) * | 2006-05-10 | 2007-11-22 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化およびその復号化装置、方法ならびにプログラム |
US8463412B2 (en) * | 2008-08-21 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus to facilitate determining signal bounding frequencies |
-
2010
- 2010-02-12 ES ES10153530T patent/ES2400661T3/es active Active
- 2010-02-12 EP EP10153530A patent/EP2273493B1/en active Active
- 2010-02-12 PL PL10153530T patent/PL2273493T3/pl unknown
- 2010-06-24 RU RU2012102411/08A patent/RU2563164C2/ru active
- 2010-06-24 EP EP10725483.1A patent/EP2449554B1/en active Active
- 2010-06-24 WO PCT/EP2010/059025 patent/WO2011000780A1/en active Application Filing
- 2010-06-24 CA CA2766573A patent/CA2766573C/en active Active
- 2010-06-24 JP JP2012518070A patent/JP5329714B2/ja active Active
- 2010-06-24 KR KR1020117031327A patent/KR101425157B1/ko active IP Right Grant
- 2010-06-24 AU AU2010268160A patent/AU2010268160B2/en active Active
- 2010-06-24 PL PL10725483T patent/PL2449554T3/pl unknown
- 2010-06-24 CA CA2856587A patent/CA2856587C/en active Active
- 2010-06-24 BR BRPI1010165-9A patent/BRPI1010165B1/pt active IP Right Grant
- 2010-06-24 ES ES10725483.1T patent/ES2534944T3/es active Active
- 2010-06-24 MX MX2011013610A patent/MX2011013610A/es active IP Right Grant
- 2010-06-24 CN CN2010800291647A patent/CN102473414B/zh active Active
-
2011
- 2011-07-08 HK HK11107088.5A patent/HK1153035A1/xx unknown
- 2011-12-22 US US13/335,096 patent/US8606586B2/en active Active
-
2012
- 2012-11-01 HK HK12111016.3A patent/HK1170331A1/xx unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5455888A (en) * | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
WO1998002971A1 (en) * | 1996-07-11 | 1998-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | A method of coding and decoding audio signals |
WO1998057436A2 (en) * | 1997-06-10 | 1998-12-17 | Lars Gustaf Liljeryd | Source coding enhancement using spectral-band replication |
WO2001026095A1 (en) * | 1999-10-01 | 2001-04-12 | Coding Technologies Sweden Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
EP1672618A1 (en) * | 2003-10-07 | 2006-06-21 | Matsushita Electric Industrial Co., Ltd. | Method for deciding time boundary for encoding spectrum envelope and frequency resolution |
RU2006134641A (ru) * | 2004-03-01 | 2008-04-10 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. (De) | Устройство и способ обработки многоканального сигнала |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU169931U1 (ru) * | 2016-11-02 | 2017-04-06 | Акционерное Общество "Объединенные Цифровые Сети" | Устройство сжатия аудиосигнала для передачи по каналам распространения данных |
Also Published As
Publication number | Publication date |
---|---|
EP2273493B1 (en) | 2012-12-19 |
KR101425157B1 (ko) | 2014-08-01 |
RU2012102411A (ru) | 2013-08-20 |
CA2856587C (en) | 2016-09-13 |
CA2766573C (en) | 2015-06-23 |
CN102473414B (zh) | 2013-11-06 |
US20120158409A1 (en) | 2012-06-21 |
KR20120031957A (ko) | 2012-04-04 |
MX2011013610A (es) | 2012-03-26 |
WO2011000780A1 (en) | 2011-01-06 |
US8606586B2 (en) | 2013-12-10 |
CA2766573A1 (en) | 2011-01-06 |
EP2449554B1 (en) | 2015-03-25 |
BRPI1010165B1 (pt) | 2021-01-05 |
CN102473414A (zh) | 2012-05-23 |
JP2012531632A (ja) | 2012-12-10 |
PL2273493T3 (pl) | 2013-07-31 |
HK1153035A1 (en) | 2012-03-16 |
ES2534944T3 (es) | 2015-04-30 |
AU2010268160A1 (en) | 2012-02-02 |
BRPI1010165A2 (pt) | 2016-03-29 |
ES2400661T3 (es) | 2013-04-11 |
PL2449554T3 (pl) | 2015-08-31 |
JP5329714B2 (ja) | 2013-10-30 |
AU2010268160B2 (en) | 2014-03-06 |
HK1170331A1 (en) | 2013-02-22 |
CA2856587A1 (en) | 2011-01-06 |
EP2449554A1 (en) | 2012-05-09 |
EP2273493A1 (en) | 2011-01-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2563164C2 (ru) | Кодер расширения полосы пропускания, декодер расширения полосы пропускания и фазовый вокодер | |
RU2667629C1 (ru) | Гармоническое преобразование, усовершенствованное перекрестным произведением | |
US10373623B2 (en) | Apparatus and method for processing an audio signal to obtain a processed audio signal using a target time-domain envelope | |
JP5722437B2 (ja) | 広帯域音声コーディングのための方法、装置、およびコンピュータ可読記憶媒体 | |
US8793123B2 (en) | Apparatus and method for converting an audio signal into a parameterized representation using band pass filters, apparatus and method for modifying a parameterized representation using band pass filter, apparatus and method for synthesizing a parameterized of an audio signal using band pass filters | |
CN104575517B (zh) | 高频重建期间的音频信号处理 | |
JP6229957B2 (ja) | 音声信号を再生するための装置および方法、符号化音声信号を生成するための装置および方法、コンピュータプログラム、および符号化音声信号 | |
JP5688852B2 (ja) | オーディオコーデックポストフィルタ | |
TWI492222B (zh) | 用以產生合成音訊信號及將音訊信號編碼之裝置與方法 | |
US9805731B2 (en) | Audio bandwidth extension by insertion of temporal pre-shaped noise in frequency domain | |
RU2452044C1 (ru) | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот | |
KR20150051301A (ko) | 광대역 신호 생성방법 및 장치와 이를 채용하는 기기 | |
AU2014201331B2 (en) | Bandwidth extension encoder, bandwidth extension decoder and phase vocoder |