UA126393C2 - Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів - Google Patents

Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів Download PDF

Info

Publication number
UA126393C2
UA126393C2 UAA201907982A UAA201907982A UA126393C2 UA 126393 C2 UA126393 C2 UA 126393C2 UA A201907982 A UAA201907982 A UA A201907982A UA A201907982 A UAA201907982 A UA A201907982A UA 126393 C2 UA126393 C2 UA 126393C2
Authority
UA
Ukraine
Prior art keywords
data
audio
metadata
signal
decoder
Prior art date
Application number
UAA201907982A
Other languages
English (en)
Inventor
Ларс Віллемоєс
Ларс ВИЛЛЕМОЕС
Хейко ПУРНХАГЕН
Пер Екстранд
Пер ЭКСТРАНД
Original Assignee
Долбі Інтернешнл Аб
Долби Интернешнл Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долбі Інтернешнл Аб, Долби Интернешнл Аб filed Critical Долбі Інтернешнл Аб
Publication of UA126393C2 publication Critical patent/UA126393C2/uk

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques

Abstract

Розкрито спосіб декодування кодованого звукового бітового потоку. Спосіб включає у себе прийом кодованого звукового бітового потоку і декодування звукових даних для формування декодованого звукового сигналу в смузі низьких частот. Спосіб додатково включає у себе витягання метаданих реконструкції високих частот і фільтрацію декодованого звукового сигналу в смузі низьких частот гребінкою фільтрів розкладання сигналу для формування фільтрованого звукового сигналу в смузі низьких частот. Спосіб також включає у себе витягання прапорцевої ознаки, що вказує, чи повинні виконуватися над звуковими даними спектральне перетворення або гармонічна транспозиція, і відновлення частини високих частот звукового сигналу з використанням фільтрованого звукового сигналу в смузі низьких частот і метаданих реконструкції високих частот відповідно до прапорцевої ознаки.

Description

ГАЛУЗЬ ТЕХНІКИ, ДО ЯКОЇ НАЛЕЖИТЬ ВИНАХІД
Варіанти здійснення мають відношення до обробки звукових сигналів, а точніше, до кодування, декодування або перекодування звукових бітових потоків з керуючими даними, що задають те, чи повинна виконуватися над звуковими даними базова форма реконструкції високих частот ("НЕВ") або вдосконалена форма НЕК.
РІВЕНЬ ТЕХНІКИ ВИНАХОДУ
Типовий звуковий бітовий потік включає у себе як звукові дані (наприклад, кодовані звукові дані), що вказують один або більше каналів звукового контента, так і метадані, що вказують щонайменше одну характеристику звукових даних або звукового контента. Одним із широко відомих форматів для формування кодованого звукового бітового потоку є формат
Перспективного звукового кодування (ААС) МРЕС-4, описаний у стандарті ІЗОЛЕС 14496- 3:2009 МРЕбБ. У стандарті МРЕС-4, ААС позначає "перспективне звукове кодування", а НЕ-ААС позначає "високоефективне перспективне звукове кодування".
Стандарт ААС МРЕС-4 визначає декілька звукових профілів, які визначають, які об'єкти і засоби кодування присутні в сумісному кодувальнику або декодері. Трьома із цих звукових профілів є (1) профіль ААС, (2) профіль НЕ-ААС і (3) профіль НЕ-ААС м2. Профіль ААС включає у себе тип об'єкта малої складності ААС (або "ААС-І С"). Об'єкт ААС-Ї С є аналогом для профілю малої складності ААС МРЕОС-2 з деякими коректуваннями і не включає у себе ні тип об'єкта реплікації смуг спектра ("ЗВК"), ні тип об'єкта параметричної стереофонії ("Р5").
Профіль НЕ-ААС є надмножиною профілю ААС і додатково включає у себе тип об'єкта ЗВЕ.
Профіль НЕ-ААС м2 є надмножиною профілю НЕ-ААС і додатково включає у себе тип об'єкта
РБ.
Тип об'єкта ЗВК включає у себе засіб реплікації смуг спектра, що є важливим засобом кодування реконструкції високих частот ("НЕК"), що значно поліпшує ефективність стиску перцепційних звукових кодеків. «ВК реконструює високочастотні складові звукового сигналу на стороні приймача (наприклад, у декодері). Таким чином, кодувальнику потрібно кодувати і передавати тільки низькочастотні складові, надаючи можливість для набагато більш високої якості звуку на низьких швидкостях передачі даних. ВК основана на реплікації послідовностей гармонік, раніше усічених, для того щоб зменшити швидкість передачі даних, з наявного в
Зо розпорядженні сигналу з обмеженою шириною смуги частот і керуючих даних, отриманих з кодувальника. Співвідношення між тональними і шумоподібними складовими підтримується за допомогою адаптивної зворотної фільтрації, а також необов'язковим додаванням шуму і синусоїдальних сигналів. У стандарті ААС МРЕС-4, засіб 5ВК виконує спектральну вклейку (також називане лінійним перетворенням або спектральним перетворенням), у якому деяка кількість піддіапазонів, що йдуть один за одним, квадратурних дзеркальних фільтрів (КДФ, ОМЕ) копіюються (або "вклеюються") з переданої частини смуги низьких частот звукового сигналу в частину смуги високих частот звукового сигналу, яка формується в декодері.
Спектральна вклейка або лінійне перетворення можуть не бути ідеальними для деяких типів звукового сигналу, таких як музичний контент із відносно низькими частотами поділу. Тому, необхідні технології для поліпшення реплікації смуг спектра.
Короткий опис варіантів здійснення винаходу
Розкрито першу групу варіантів здійснення, що належить до способу для декодування кодованого звукового бітового потоку. Спосіб включає у себе прийом кодованого звукового бітового потоку і декодування звукових даних для формування декодованого звукового сигналу в смузі низьких частот. Спосіб додатково включає у себе витягання метаданих реконструкції високих частот і фільтрацію декодованого звукового сигналу в смузі низьких частот гребінкою фільтрів розкладання сигналу для формування фільтрованого звукового сигналу в смузі низьких частот. Спосіб додатково включає у себе витягання прапорцевої ознаки, що вказує, чи повинні виконуватися над звуковими даними спектральне перетворення або гармонічна транспозиція, і відновлення частини високих частот звукового сигналу з використанням фільтрованого звукового сигналу в смузі низьких частот і метаданих реконструкції високих частот відповідно до прапорцевої ознаки. На закінчення, спосіб включає у себе комбінування фільтрованого звукового сигналу у смузі низьких частот і відновленої частини смуги високих частот для формування широкосмугового звукового сигналу.
Друга група варіантів здійснення належить до звукового декодера для декодування кодованого звукового бітового потоку. Декодер включає у себе вхідний інтерфейс для прийому кодованого звукового бітового потоку, де кодований звуковий бітовий потік включає у себе звукові дані, що яляють собою частину низьких частот звукового сигналу, і основний декодер для декодування звукових даних, щоб формувати декодований звуковий сигнал у смузі низьких 60 частот. Декодер також включає у себе демультиплексор для витягання з кодованого звукового бітового потоку метаданих реконструкції високих частот, де метадані реконструкції високих частот включають у себе робочі параметри для процесу реконструкції високих частот, що лінійно перетворюють деяку кількість піддіапазонів, що йдуть один за одним, із частини смуги низьких частот звукового сигналу в частину смуги високих частот звукового сигналу, і гребінку фільтрів розкладання сигналу для фільтрації декодованого звукового сигналу в смузі низьких частот, щоб формувати фільтрований звуковий сигнал в смузі низьких частот. Декодер додатково включає у себе демультиплексор для витягання з кодованого звукового бітового потоку прапорцевої ознаки, що вказує, чи повинні виконуватися над звуковими даними лінійне перетворення або гармонічна транспозиція, і відновлювач високих частот для відновлення частини високих частот звукового сигналу з використанням фільтрованого звукового сигналу в смузі низьких частот і метаданих реконструкції високих частот відповідно до прапорцевої ознаки. На закінчення, декодер включає у себе гребінку фільтрів синтезу сигналу для комбінування фільтрованого звукового сигналу в смузі низьких частот і відновленої частини смуги високих частот, щоб формувати широкосмуговий звуковий сигнал.
Інші групи варіантів здійснення належать до кодування і перекодування звукових бітових потоків, що включають у себе метадані, які ідентифікують, чи повинна виконуватися обробка вдосконаленої реплікації смуг спектра (езвВК).
Короткий опис креслень
Фіг. 1 - структурна схема варіанта здійснення системи, що може бути виконана з можливістю виконувати варіант здійснення способу, що володіє ознаками винаходу.
Фіг. 2 - структурна схема кодувальника, що є варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу.
Фіг. З - структурна схема системи, що включає в себе декодер, що є варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу, і, на вибір, також постпроцесор, приєднаний до нього.
Фіг. 4 - структурна схема декодера, що є варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу.
Фіг. 5 - структурна схема декодера, що є ще одним варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу.
Зо Фіг. 6 - структурна схема ще одного варіанта здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу.
Фіг. 7 - схема блоку бітового потоку ААС МРЕС-4, що включає в себе сегменти, на які він розділений.
Система позначень і термінологія
Протягом всього даного опису винаходу, у тому числі у формулі винаходу, вираз виконання операції "над" сигналом або даними (наприклад, фільтрацією, масштабуванням, перетворенням або застосуванням коефіцієнта передачі до сигналу або даних) використовується в широкому змісті для позначення виконання операції безпосередньо над сигналом або даними, або над обробленим варіантом сигналу або даних (наприклад, над варіантом сигналу, що піддався попередній фільтрації або попередній обробці перед виконанням операції над ним).
Протягом всього цього опису винаходу, у тому числі у формулі винаходу, вираз "блок обробки звукового сигналу" або "звуковий процесор" використовується в широкому змісті для позначення системи, пристрою або установки, виконаних з можливістю обробляти звукові дані.
Приклади блоків обробки звукового сигналу включають у себе, але не як обмеження, кодувальники, перекодувальники, декодери, кодеки, системи попередньої обробки, системи постобробки і системи обробки бітового потоку (іноді згадувані як засіб обробки бітового потоку). Практично вся побутова електроніка, така як мобільні телефони, телевізори, дорожні комп'ютери, планшетні комп'ютери, включає у себе блок обробки звукового сигналу або звуковий процесор.
Протягом всього цього опису винаходу, у тому числі, у формулі винаходу, термін "приєднується" або "приєднаний" використовується в широкому змісті, щоб означати пряме або опосередковане з'єднання. Таким чином, якщо перший пристрій приєднується до другого пристрою, з'єднання може відбуватися через пряме з'єднання або через опосередковане з'єднання за допомогою інших пристроїв і з'єднань. Більше того, компоненти, які об'єднані в або з іншими компонентами, також з'єднані один з одним.
Докладний опис варіантів здійснення винаходу
Стандарт ААС МРЕС-4 припускає, що кодований бітовий потік ААС МРЕС-4 включає у себе метадані, що вказують кожен тип обробки реконструкції високих частот ("НЕК"), що повинна виконуватися (якщо яка-небудь повинна виконуватися) декодером для декодування звукового 60 контента бітового потоку, і/або які керують такою обробкою НЕК і/або вказують щонайменше одну характеристику або параметр щонайменше одного засобу НЕК, що підлягає застосуванню для декодування звукового контента бітового потоку. У матеріалах даної заявки, ми використаємо вираз "метадані ЗВК" для позначення метаданих цього типу, що описаний або згадується в стандарті ААС МРЕС-4 для використання з реплікацією смуг спектра (ЗВЕ"). Як береться до уваги фахівцем у даній галузі техніки, ЗВЕ є різновидом НЕК.
ЗВК переважно використовується як система з подвійною частотою дискретизації, причому кодек, що лежить в основі, працює на половині вихідної частоти дискретизації, у той час як ЗВК функціонує на вихідній частоті дискретизації. Кодувальник ЗВК працює паралельно з основним кодеком, що лежить в основі, хоча і на більш високій частоті дискретизації. Хоча 5ВЕ головним чином є постобробкою в декодері, важливі параметри витягаються в кодувальнику, для того щоб забезпечувати найбільш точну реконструкцію високих частот у декодері. Кодувальник оцінює обвідну спектра діапазону З5ВК, що стосується частотно-часового діапазону/дозволу за часом і частотою, що підходять для характеристик поточних сегментів вхідного сигналу.
Обвідна спектра оцінюється за допомогою розкладання сигналу за допомогою комплексних КДФ і наступного розрахунку енергії. Дозволи за часом і частотою обвідних спектра можуть вибиратися з високим ступенем вільності, для того щоб забезпечувати найкращий дозвіл за часом і частотою для даного сегмента вхідного сигналу. Оцінка обвідної повинна враховувати, що перехідний процес в оригіналі, головним чином розташований в ділянці високих частот (наприклад, високий викид), буде присутній у незначному ступені в сформованій! 5ВК смузі високих частот перед корекцією обвідної, оскільки смуга високих частот у декодері основана на смузі низьких частот, де перехідний процес виражений у набагато меншому ступені в порівнянні зі смугою високих частот. Цей аспект накладає інші вимоги на дозвіл за часом і частотою даних обвідної спектра в порівнянні із традиційною оцінкою обвідної спектра, як використовувана в інших алгоритмах звукового кодування.
Крім обвідної спектра, витягаються декілька додаткових параметрів, що являють собою спектральні характеристики вхідного сигналу для різних частотно-часових ділянок. Оскільки кодувальник природно має доступ до вихідного сигналу, а також до інформації про те, яким чином блок ЗВК у декодері буде створювати смугу високих частот, за умови визначеного набору параметрів керування, можна, щоб система справлялася із ситуаціями, де смуга низьких
Зо частот становить потужний гармонічний ряд, а смуга високих частот, яка повинна бути відтворена, головним чином становить випадкові складові сигналу, а також ситуації, де потужні тональні складові присутні у вихідній смузі високих частот без аналогів у смузі низьких частот, на якій основана ділянка смуги високих частот. Більше того, кодувальник ЗВК працює в тісній залежності від основного кодека, що лежить в основі, щоб оцінювати, який частотний діапазон повинен бути охоплений ЗВК у цей момент часу. Дані 5ВК раціонально кодуються перед передачею за допомогою використання ентропійного кодування, а також залежностей каналів керуючих даних, у випадку стереофонічних сигналів.
Алгоритми витягання параметрів керування типово необхідно ретельно набудовувати під кодек, що лежить в основі, на заданій швидкості передачі бітів і заданій частоті дискретизації.
Це відбувається внаслідок тієї обставини, що більш низька швидкість передачі бітів звичайно покладається на більший діапазон 5ВЕК у порівнянні з високою швидкістю передачі бітів, і різні частоти дискретизації відповідають різним дозволам за часом кадрів ЗВЕ.
Декодер З5ВЕ типово включає у себе декілька різних частин. Він містить модуль декодування бітового потоку, модуль відновлення високих частот (НЕК), модуль додаткових високочастотних складових і модуль коректора обвідної Система основана на гребінці фільтрів з комплекснозначних КДФ. У модулі витягання бітового потоку, керуючі дані зчитуються з бітового потоку і декодуються. Час/частотна сітка одержується для поточного кадру перед зчитуванням даних обвідної з бітового потоку. Основний декодер, що лежить в основі, декодує звуковий сигнал поточного кадру (хоча і з більш низькою частотою дискретизації), для створення відліків звукового сигналу в часовій ділянці. Результуючий кадр звукових даних використовується для реконструкції високих частот модулем НЕК. Декодований сигнал у смузі низьких частот потім піддається розкладанню сигналу з використанням гребінки фільтрів із КДФ. Реконструкція високих частот і корекція обвідної згодом виконуються над відліками піддіапазонів гребінки фільтрів із КДФ. Високі частоти реконструюються зі смуги низьких частот гнучким чином на основі заданих параметрів керування. Більше того, реконструйована смуга високих частот адаптивно фільтрується на основі каналів піддіапазону згідно з керуючими даними, щоб забезпечити належні спектральні характеристики даної частотно/часової ділянки.
Верхнім рівнем бітового потоку ААС МРЕС-4 є послідовність блоків даних (елементів "ам даїа ріоскК"), кожний з яких є сегментом даних (що згадуються у матеріалах даної заявки як бо "ріоск"), що включає у себе звукові дані (типово для періоду часу в 1024 або 960 відліків) і зв'язану інформацію і/або інші дані. У матеріалах даної заявки, ми використовуємо термін "блок" для позначення сегмента бітового потоку ААС МРЕС-4, що містить звукові дані (і відповідних метаданих і, на вибір, також інших зв'язаних даних), які визначають або вказують один (але не більше ніж один) елемент "гам/ даїа бБіоск".
Кожен блок бітового потоку ААС МРЕС-4 може включати в себе деяку кількість синтаксичних елементів (кожний з яких також матеріалізований у бітовому потоці у вигляді сегмента даних). Сім типів таких синтаксичних елементів визначено в стандарті ААС МРЕО-4.
Кожен синтаксичний елемент ідентифікується різним значенням елемента "ід 5уп еїе" даних.
Приклади синтаксичних елементів включають у себе "5іпдіє спаппе! еіетепі/", "спаппе! раїг еіетепі)" і "Я еіетепі)". Елемент одиночного каналу є контейнером, що включає в себе звукові дані одиночного звукового каналу (монофонічного звукового сигналу).
Елемент пари каналів включає у себе звукові дані двох звукових каналів (тобто, стереофонічний звуковий сигнал).
Елемент заповнення є контейнером інформації, що включає в себе ідентифікатор (наприклад, значення відзначеного вище елемента "їй зуп еїе"), супроводжуваний даними, які згадуються як "дані заповнення". Елементи заповнення історично використовувалися для корекції миттєвої швидкості передачі бітів бітових потоків, які повинні передаватися по каналу з постійною швидкістю передачі. Додаванням належної кількості даних заповнення в кожен блок, може досягатися постійна швидкість передачі даних.
Відповідно до варіантів здійснення у винаходу, дані заповнення можуть включати в себе одне або більше корисних навантажень розширення, які розширюють тип даних (наприклад, метадані), що допускають передачу в бітовому потоці. Декодер, що приймає бітові потоки із даними заповнення, що включають у себе новий тип даних, на вибір може використатися пристроєм, що приймає бітовий потік (наприклад, декодером) для розширення функціональних можливостей пристрою. Таким чином, як може бути прийняте до уваги фахівцем у даній галузі техніки, елементи заповнення є спеціальним типом структури даних і відрізняються від структур даних, типово використовуваних для передачі звукових даних (наприклад, корисних навантажень звукового сигналу, що включають у себе канальні дані).
У деяких варіантах здійснення винаходу, ідентифікатор, використовуваний для ідентифікації елемента заповнення, може складатися із трибітного беззнакового цілого числа, переданого старшим бітом уперед ("ціт5рі"), що має значення Охб. В одному блоці можуть з'являтися декілька екземплярів того самого типу синтаксичного елемента (наприклад, декілька елементів заповнення).
Ще одним стандартом для кодування звукових бітових потоків є стандарт уніфікованого кодування мови і звукових сигналів (Ш5БАС) МРЕС (ІЗОЛЕС 23003-3:2012). Стандарт ОБАС
МРЕС описує кодування і декодування звукового контента з використанням обробки реплікації смуг спектра (у тому числі, обробки 5ВЕ, як описано в стандарті ААС МРЕО-4, і, до того ж, що включає в себе інші вдосконалені форми обробки реплікації смуг спектра). Ця обробка застосовує засоби реплікації смуг спектра (іноді в матеріалах даної заявки згадувані як "засоби вдосконаленої 5ВЕ" або "засоби езВвЕ") розширеного і удосконаленого варіанта набору засобів
ЗВЕ, описаних у стандарті ААС МРЕОС-4. Таким чином, еЗзВК (як визначена в стандарті ОБАС) є вдосконаленням у відношенні ЗВК (як визначена в стандарті ААС МРЕС-4).
У матеріалах даної заявки, ми використовуємо вираз "обробка вдосконаленої ЗВК" (або "обробка е5ВкК") для позначення обробки реплікації смуг спектра з використанням щонайменше одного засобу езВЕ (наприклад, щонайменше одного засобу е5ВК, що описаний або згаданий в стандарті ОБАС МРЕбС), що не описаний і не згаданий в стандарті ААС МРЕС-4. Прикладами таких засобів еЗзВК є гармонічна транспозиція і додаткова попередня обробка вклейки за допомогою КДФ або "попереднє вирівнювання".
Гармонічний транспозер цілочисленого порядку Т відображає синусоїду із частотою о у синусоїду із частотою То, тим часом зберігаючи тривалість сигналу. Три порядки, Т-2, 3, 4, типово використовуються послідовно для створення кожної частини бажаного вихідного частотного діапазону з використанням найменшого можливого порядку транспозиції. Якщо потрібен вихідний сигнал вище діапазону транспозиції четвертого порядку, він може формуватися за допомогою зсувів по частоті. Коли можливо, майже критично дискретизовані часові ділянки основної смуги створюються для обробки, щоб мінімізувати обчислювальну складність.
Бітовий потік, сформований відповідно до стандарту ОБАС МРЕС (у матеріалах даної заявки іноді згадуваний як "бітовий потік ОБАС"), включає у себе кодований звуковий контент і типово включає у себе метадані, що вказують кожен тип обробки реплікації смуг спектра, яка 60 повинна застосовуватися декодером для декодування звукового контента бітового потоку
БАС, і/або метадані, які керують такою обробкою реплікації смуг спектра або вказують щонайменше одну характеристику або параметр щонайменше одного засобу ЗВЕ і/або засобу еб5ВК, що повинний застосовуватися для декодування звукового контента бітового потоку
БАС.
У матеріалах даної заявки використовуємо вираз "метадані вдосконаленої 5ВЕК" (або "метадані е5ВЕ") для позначення метаданих, що вказують кожен тип обробки реплікації смуг спектра, яка повинна застосовуватися декодером для декодування звукового контента кодованого звукового бітового потоку (наприклад, бітового потоку О5АС), і/або які керують такою обробкою реплікації смуг спектра і/або вказує щонайменше одну характеристику або параметр щонайменше одного засобу ЗВК і/або засобу езВК, що підлягає застосуванню для декодування такого звукового контента, але які не описані і не згадані в стандарті ААС МРЕС-4.
Прикладом метаданих е5ЗВК є метадані (що вказують або призначені для керування обробкою реплікації смуг спектра), які описані або згадані в стандарті ОБАС МРЕЄС, але не в стандарті
ААС МРЕС-4. Таким чином, метадані еЗзВК у матеріалах даної заявки позначають метадані, які не є метаданими ВК, а метадані ЗВЕК у матеріалах даної заявки позначають метадані, які не є метаданими е5ВЕ.
Бітовий потік ОБАС може включати в себе як метадані ЗВЕ, так і метадані езВЕ. Точніше, бітовий потік ШБАС може включати в себе метадані еЗзВК, які керують виконанням обробки еЗВК декодером, і метадані ЗВЕ, які керують виконанням обробки ЗВК декодером. Відповідно до типових варіантів здійснення даними винаходу, метадані езВК (наприклад, специфічні ез вк конфігураційні дані) (відповідно до даних винаходу) включені в бітовий потік ААС МРЕС-4 (наприклад, у контейнері 5бг ехіепзіоп() наприкінці корисного навантаження 5ВК).
Виконання обробки еЗВЕ під час декодування кодованого бітового потоку з використанням засобу езВК (що містить щонайменше один засіб е5ВЕ), установленого декодером, відновлює смугу високих частот звукового сигналу на основі реплікації послідовностей гармонік, які були усічені під час кодування. Така обробка езвЕ типово коректує обвідну спектра сформованої смуги високих частот і застосовує зворотну фільтрацію, і додає шумові і синусоїдальні складові, для того щоб відтворити спектральні характеристики вихідного звукового сигналу.
Відповідно до типових варіантів здійснення винаходу, метадані езВвкК включені (наприклад, невелика кількість керуючих бітів, які є метаданими еЗзВК, включена) в один або більше сегментів метаданих кодованого звукового бітового потоку (наприклад, бітового потоку ААС
МРЕС-4), що також включає у себе кодовані звукові дані в інших сегментах (сегментах звукових даних). Типово, щонайменше один такий сегмент метаданих кожного блоку бітового потоку являє собою (або включає у себе) елемент заповнення (що включає в себе ідентифікатор, що вказує початок елемента заповнення), і метадані езвк включені в елемент заповнення після ідентифікатора. Фіг. 1 - структурна схема зразкового ланцюга обробки звукового сигналу (системи обробки звукових даних), у якій один або більше з елементів системи може бути виконаний відповідно до варіанта здійснення даного винаходу. Система включає у себе наступні елементи, з'єднані один з одним, як показано: кодувальник 1, підсистему 2 доставки, декодер З і блок 4 постобробки. У різновидах показаної системи, не включені до складу один або більше елементів, або включені до складу додаткові блоки обробки звукових даних.
У деяких реалізаціях, кодувальник 1 (який на вибір включає у себе блок попередньої обробки) виконаний з можливістю приймати відліки РОМ (часової ділянки), що містять звуковий контент, як вхідний сигнал і видавати кодований звуковий бітовий потік (що має формат, який сумісний зі стандартом ААС МРЕС-4), що є таким, що вказує звуковий контент. Дані бітового потоку, які вказують звуковий контент, у матеріалах даної заявки іноді згадуються як "звукові дані" або "кодовані звукові дані". Якщо кодувальник виконаний відповідно до типового варіанта здійснення даними винаходу, звуковий бітовий потік, видаваний з кодувальника, включає у себе метадані еЗВК (і, до того ж, типово інші метадані), а також звукові дані.
Один або більше кодованих звукових потоків, видаваних з кодувальника 1, можуть пред'являтися в підсистему 2 доставки кодованого звукового сигналу. Підсистема 2 виконана з можливістю зберігати і/або доставляти кожен кодований бітовий потік, видаваний з кодувальника 1. Кодований звуковий бітовий потік виведений з кодувальника 1, може зберігатися підсистемою 2 (наприклад, у вигляді ОМО або диска Віпгау) або передаватися підсистемою 2 (яка може реалізовувати канал або мережу передачі), або може як зберігатися, так і передаватися підсистемою 2.
Декодер 3 виконаний з можливістю декодувати кодований звуковий бітовий потік ААС
МРЕС-4 (сформований кодувальником 1), який він приймає через підсистему 2. У деяких варіантах здійснення, декодер З виконаний з можливістю витягати метадані езВкК з кожного 60 блоку бітового потоку і декодувати бітовий потік (у тому числі, за допомогою виконання обробки еЗзВК з використанням витягнутих метаданих езВК) для формування декодованих звукових даних (наприклад, потоків декодованих звукових відліків РОМ). У деяких варіантах здійснення, декодер З виконаний з можливістю витягати метадані 5ВЕ з бітового потоку (але ігнорувати метадані еЗзВК, включені в бітовий потік) і декодувати бітовий потік (у тому числі, за допомогою виконання обробки 5ВК з використанням витягнутих метаданих 5ВК) для формування декодованих звукових даних (наприклад, потоків декодованих відліків звукового сигналу РСМ.
Типово, декодер З включає у себе буфер, що зберігає (наприклад, неефемерним чином) сегменти кодованого звукового бітового потоку, прийнятого з підсистеми 2.
Блок 4 постобробки за фіг. 1 виконаний з можливістю приймати потік декодованих звукових даних з декодера З (наприклад, відліки звукового сигналу РСМ) і виконувати постобробку над ним. Блок постобробки також може бути виконаний з можливістю відтворювати підданий постобробці звуковий контент (або декодований звуковий сигнал, прийнятий з декодера 3) для програвання одним або більше гучномовців.
Фіг. 2 - структурна схема кодувальника (100), що є варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу. Будь-які з компонентів або елементів кодувальника 100 можуть бути реалізовані у вигляді одного або більше процесів і/або однієї або більше схем (наприклад, А5БІ (спеціалізованих інтегральних схем), ЕРОА (програмованих користувачем вентильних матриць) або інших інтегральних схем) в апаратних засобах, програмному забезпеченні або комбінації апаратних засобів і програмного забезпечення.
Кодувальник 100 включає у себе кодувальник 105, каскад 107 заповнювача/форматера, каскад 106 формування метаданих і буферну пам'ять 109, з'єднані як показано. До того ж, типово, кодувальник 100 включає у себе інші елементи обробки (не показані). Кодувальник 100 виконаний з можливістю перетворювати вхідний звуковий бітовий потік у кодований вихідний бітовий потік ААС МРЕО-4.
Генератор 106 метаданих приєднаний і виконаний з можливістю формувати (і/або пропускати наскрізь у каскад 107) метадані (у тому числі, метадані езВК і метадані ЗВК), які повинні бути включені каскадом 107 у кодований бітовий потік, що підлягає виводу з кодувальника 100.
Кодувальник 105 приєднаний і виконаний з можливістю кодувати (наприклад, виконуючи
Зо стиск над ними) вхідні звукові дані і пред'являти результуючий кодований звуковий сигнал у каскад 107 для включення в кодований бітовий потік, що повинен видаватися з каскаду 107.
Каскад 107 виконаний з можливістю мультиплексувати кодований звуковий сигнал з кодувальника 105 і метадані (у тому числі, метадані еЗВК і метадані 5ВК) з генератора 106 для формування кодованого бітового потоку, що повинен видаватися з каскаду 107, переважно так, щоб кодований бітовий потік мав формат, як заданий одним з варіантів здійснення даними винаходу.
Буферна пам'ять 109 виконана з можливістю зберігати (наприклад, неефемерним чином) щонайменше один блок кодованого звукового бітового потоку, виведеного з каскаду 107, і послідовність блоків кодованого звукового бітового потоку потім пред'являється з буферної пам'яті 109 як вихідний сигнал з кодувальника 100 у систему доставки.
Фіг. З - структурна схема системи, що включає в себе декодер (200), що є варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу, і, на вибір, також постпроцесор (300), приєднаний до нього. Будь-які з компонентів або елементів декодера 200 і постпроцесора 300 можуть бути реалізовані у вигляді одного або більше процесів і/або однієї або більше схем (наприклад, АбБІ (спеціалізованих інтегральних схем), ЕРОСА (програмованих користувачем вентильних матриць) або інших інтегральних схем) в апаратних засобах, програмному забезпеченні або комбінації апаратних засобів і програмного забезпечення.
Декодер 200 містить буферну пам'ять 201, деформатер 205 (синтаксичний аналізатор) корисного навантаження бітового потоку, підсистему 202 декодування звукового сигналу (іноді згадувану як каскад "основного" декодування або підсистема "основного" декодування), каскад 203 обробки еЗзВК і каскад 204 формування керуючих бітів, з'єднані як показано. До того ж, типово, декодер 200 включає у себе інші елементи обробки (не показані).
Буферна пам'ять 201 (буфер) зберігає (наприклад, неефемерним чином) щонайменше один блок кодованого звукового бітового потоку ААС МРЕС-4, прийнятого декодером 200. При експлуатації декодера 200, послідовність блоків бітового потоку пред'являється з буфера 201 у деформатер 205.
У різновиді варіанта здійснення на фіг. 3, АРО, що не є декодером (наприклад, АРИ 500 по фіг. 6), включає у себе буферну пам'ять (наприклад, буферну пам'ять, ідентичну буферу 201), що зберігає (наприклад, неефемерним чином) щонайменше один блок кодованого звукового бо бітового потоку (наприклад, звукового бітового потоку ААС МРЕС-4) того ж самого типу,
прийнятого буфером 201 за фіг. З або фіг. 4 (тобто, кодованого звукового бітового потоку, що включає у себе метадані еЗзВК).
Знову з посиланням на фіг. З, деформатер 205 приєднаний і виконаний з можливістю демультиплексувати кожен блок бітового потоку для витягання метаданих ЗВК (у тому числі, дані квантованої обвідної) і метаданих е5ВЕ (і типово також інших метаданих) з нього, пред'являти щонайменше метадані еЗВК і метадані ЗВК у каскад 203 обробки еЗВК і типово також пред'являти інші витягнуті метадані в підсистему 202 декодування (і, на вибір, також у генератор 204 керуючих бітів). Деформатер 205 також приєднаний і виконаний з можливістю витягати звукові дані з кожного блоку бітового потоку, і пред'являти витягнуті звукові дані в підсистему 202 декодування (каскад декодування).
Система за фіг. З на вибір також включає у себе постпроцесор 300. Постпроцесор 300 включає у себе буферну пам'ять 301 (буфер) і інші елементи обробки (не показані), у тому числі, щонайменше один елемент обробки, приєднаний до буфера 301. Буфер 301 зберігає (наприклад, неефемерним чином) щонайменше один блок (або кадр) декодованих звукових даних, прийнятих постпроцесором 300 з декодера 200. Елементи обробки постпроцесора 300 приєднані і виконані з можливістю приймати і адаптивно обробляти послідовність блоків (або кадрів) декодованого звукового сигналу, виведеного з буфера 301, з використанням метаданих, виведених з підсистеми 202 декодування (і/або деформатера 205), і/або керуючих бітів, виведених з каскаду 204 декодера 200.
Підсистема 202 декодування звукового сигналу декодера 200 виконана з можливістю декодувати звукові дані, витягнуті синтаксичним аналізатором 205 (таке декодування може згадуватися як операція "основного" декодування), для формування декодованих звукових даних і пред'являти декодовані звукові дані в каскад 203 обробки еЗзВК. Декодування виконується в частотній ділянці і типово включає у себе обернене квантування, супроводжуване спектральною обробкою. Типово, завершальний каскад обробки в підсистемі 202 застосовує перетворення із частотної ділянки в часову ділянку до декодованих звукових даних частотної ділянки, так щоб вихідними даними підсистеми були декодовані звукові дані часової ділянки.
Каскад 203 виконаний з можливістю застосовувати засоби 5ВК і засоби езВК, зазначені метаданими 5ВК і метаданими еЗзВК (витягнутими синтаксичним аналізатором 205), до декодованих звукових даних (тобто, виконувати обробку ЗВЕ і езВК над вихідними даними підсистеми 202 декодування з використанням метаданих ЗВК і езЗВК) для формування повністю декодованих звукових даних, які виводяться (наприклад, у постпроцесор 300) з декодера 200. Типово, декодер 200 включає у себе пам'ять (доступну з підсистеми 202 і каскаду 203), що зберігає деформатовані звукові дані і метадані, видані з деформатера 205, а каскад 203 виконаний з можливістю здійснювати доступ до звукових даних і метаданних (у тому числі, метаданних 5ВК і метаданних еЗВК) у міру потреби під час обробки 5ВЕ і е5ВЕ. Обробка ЗВ і обробка езВК у каскаді 203 може вважатися постобробкою на виході з підсистеми 202 основного декодування. На вибір, декодер 200 також включає у себе підсистему завершального підвищувального мікшування (яка може застосовувати засоби параметричної стереофонії
СРБ"), визначені в стандарті ААС МРЕС-4, з використанням метаданих РБ5, витягнутих деформатером 205, і/або керуючих бітів, сформованих у підсистемі 204), що приєднана і виконана з можливістю виконувати підвищувальне мікшування над вихідним сигналом каскаду 203, щоб формувати повністю декодований підданий підвищувальному мікшуванню звуковий сигнал, що виводиться з декодера 200. Як альтернатива, постпроцесор 300 виконаний з можливістю виконувати підвищувальне мікшування над вихідним сигналом декодера 200 (наприклад, з використанням метаданих Р5, витягнутих деформатером 205, і/або керуючих бітів, сформованих у підсистемі 204).
У відповідь на метадані, витягнуті деформатером 205, генератор 204 керуючих бітів може формувати керуючі дані, і керуючі дані можуть використатися в межах декодера 200 (наприклад, у підсистемі завершального підвищувального мікшування) і/або пред'являтися як вихідний сигнал декодера 200 (наприклад, у постпроцесор 300 для використання при постобробці). У відповідь на метадані, витягнуті із вхідного бітового потоку (і, на вибір, також у відповідь на керуючі дані), каскад 204 може формувати (і пред'являти в постпроцесор 300) керуючі біти, що вказують, що декодовані звукові дані, видавані з каскаду 203 обробки еЗзВЕ, повинні піддаватися конкретному типу постобробки. У деяких варіантах здійснення, декодер 200 виконаний з можливістю пред'являти метадані, витягнуті деформатером 205 із вхідного бітового потоку, у постпроцесор 300, а постпроцесор 300 виконаний з можливістю виконувати постобробку над декодованими звуковими даними, виведеними з декодера 200, з використанням метаданих. 60 Фіг. 4 - структурна схема блоку (210) обробки звукового сигналу (АРИ"), що є ще одним варіантом здійснення блоку обробки звукового сигналу, що володіє ознаками винаходу. АРО 210 є успадкованим декодером, що не виконаний з можливістю виконувати обробку езВЕ.
Будь-які з компонентів або елементів АР 210 можуть бути реалізовані у вигляді одного або більше процесів і/або однієї або більше схем (наприклад, А5БІ (спеціалізованих інтегральних схем), ЕРОА (програмованих користувачем вентильних матриць) або інших інтегральних схем) в апаратних засобах, програмному забезпеченні або комбінації апаратних засобів і програмного забезпечення. АРИО 210 містить буферну пам'ять 201, деформатер 215 (синтаксичний аналізатор) корисного навантаження бітового потоку, підсистему 202 декодування звукового сигналу (іноді згадувану як каскад "основного" декодування або підсистема "основного" декодування), і каскад 213 обробки ЗВК, з'єднані, як показано. До того ж, типово, АРИО 210 включає у себе інші елементи обробки (не показані). АРО 210, наприклад, може являти собою кодувальник, декодер або перекодувальник звукового сигналу.
Елементи 201 і 202 АРИШ 210 ідентичні однаково пронумерованим елементам декодера 200 (за фіг. 3), і вищенаведений їх опис повторюватися не буде. При експлуатації АРО 210, послідовність блоків кодованого звукового бітового потоку (бітового потоку ААС МРЕС-4), прийнятого АРИ 210, пред'являється з буфера 201 у деформатер 215.
Деформатер 215 приєднаний і виконаний з можливістю демультиплексувати кожен блок бітового потоку, щоб витягати метадані ЗВК (у тому числі, дані квантованої обвідної) і також типово інші метадані з нього, але ігнорувати метадані езВК, які можуть бути включені в бітовий потік, відповідно до будь-якого варіанта здійснення даного винаходу. Деформатер 215 виконаний з можливістю додавати щонайменше метадані 5ВК у каскад 213 обробки 5ВЕ.
Деформатер 215 також приєднаний і виконаний з можливістю витягати звукові дані з кожного блоку бітового потоку, і пред'являти витягнуті звукові дані в підсистему 202 декодування (каскад декодування).
Підсистема 202 декодування звуку декодера 200 виконана з можливістю декодувати звукові дані, витягнуті деформатером 215 (таке декодування може згадуватися як операція "основного" декодування), для формування декодованих звукових даних і пред'являти декодовані звукові дані в каскад 213 обробки ЗВК. Декодування виконується в частотній ділянці. Типово, завершувальний каскад обробки в підсистемі 202 застосовує перетворення із частотної ділянки
Зо в часову ділянку до декодованих звукових даних частотної ділянки, так щоб вихідними даними підсистеми були декодовані звукові дані часової ділянки. Каскад 213 виконаний з можливістю застосовувати засоби 5ВК (але не засоби е5ВЕ), зазначені метаданими ЗВК (витягнутими деформатером 215), до декодованих звукових даних (тобто, виконувати обробку 5ВК над вихідними даними підсистеми 202 декодування з використанням метаданих 5ВК) для формування повністю декодованих звукових даних, які виводяться (наприклад, у постпроцесор 300) з АРИ 210. Типово, АР 210 включає у себе пам'ять (доступну з підсистеми 202 і каскаду 213), що зберігає деформатовані звукові дані і метадані, видані з деформатера 215, а каскад 213 виконаний з можливістю здійснювати доступ до звукових даних і метаданних (у тому числі, метаданних 5ВК) у міру потреби під час обробки 5ВК. Обробка 5ВК у каскаді 213 може вважатися наступною обробкою на виході з підсистеми 202 основного декодування. На вибір,
АРИи 210 також включає у себе підсистему завершального підвищувального мікшування (яка може застосовувати засоби параметричної стереофонії ("Р5З"), визначені в стандарті ААС
МРЕС-4, з використанням метаданих Р5, витягнутих деформатером 215), що приєднана і виконана з можливістю виконувати підвищувальне мікшування над вихідним сигналом каскаду 213, щоб формувати повністю декодований підданий підвищувальному мікшуванню звуковий сигнал, що виводиться з АР 210. Як альтернатива, постпроцесор виконаний з можливістю виконувати підвищувальне мікшування над вихідним сигналом АРИО 210 (наприклад, з використанням метаданих РБб, витягнутих деформатером 215, і/або керуючих (бітів, сформованих в АРИи 210).
Різні реалізації кодувальника 100, декодера 200 і АРИО 210 виконані з можливістю виконувати різні варіанти здійснення способу, що володіє ознаками винаходу.
Відповідно до деяких варіантів здійснення, метадані езВК включені (наприклад, невелика кількість керуючих бітів, які Є метаданими езВК, включені) у кодований звуковий бітовий потік (наприклад, бітовий потік ААС МРЕС-4), так щоб успадковані декодери (які не виконані з можливістю синтаксично аналізувати метадані езВК і використати який би то не був засіб еЗВК, до якого належать метадані езВкК), можуть ігнорувати метадані езВК, але, проте, декодувати бітовий потік, наскільки можливо без використання метаданих езВЕ або якого би то не було засобу е5ВК, до якого належать метадані е5ВК, типово без якого би то не було значного погіршення якості декодованого звукового сигналу. Однак, декодери езвВК, виконані з 60 можливістю синтаксично аналізувати бітовий потік для ідентифікації метаданих еЗзВК і для використання щонайменше одного засобу езВК у відповідь на метадані езВК, будуть мати вигоди використання щонайменше одного такого засобу е5ВЕ. Тому, варіанти здійснення винаходу передбачають засіб для раціональної передачі керуючих даних удосконаленої реплікації смуг спектра (еЗзВЕ) або метаданих зворотно сумісним чином.
Типово, метадані езВЕ у бітовому потоці є такими, що вказують (наприклад служать ознакою щонайменше однієї характеристики або параметра) одного або більше з наступних засобів езВЕ (які описані в стандарті МРЕС ИОБАС, і які могли бути або могли не бути застосованими кодувальником під час формування бітового потоку): " Гармонічна транспозиція; і " Додаткова попередня обробка вклейкою за допомогою КДФ (попереднє вирівнювання).
Наприклад, метадані езВЕ, включені в бітовий потік, можуть бути вказуючими значення параметрів (описаних у стандарті ОБАС МРЕС і у даному винаході): 5бгРаїспіпамМоае|снп|, 5ргОмегзатріїпоніад(сп)у, 5бгРСПІпВіпв|(|сСпІ, 5бгРЇСПІпВіпо5(спу і 65 5бг ргергосезвзіпад.
У матеріалах даної заявки, позначення Х|ІСП)|, де Х - деякий параметр, позначає, що параметр належить до каналу ("сп") звукового контента кодованого бітового потоку, що підлягає декодуванню. Для спрощення, ми іноді опускаємо вираз |Сп| і допускаємо, що відповідний параметр належить до каналу звукового контента.
У матеріалах даної заявки, позначення ХіІспЦІ(епм|, де Х - деякий параметр, позначає, що параметр належить до обвідної (епм") 5ВЕ каналу ("сп") звукового контента кодованого бітового потоку, що підлягає декодуванню. Для спрощення, ми іноді опускаємо вираз (епмі і (СМ, і допускаємо, що відповідний параметр належить до обвідної 5ВЕ каналу звукового контента.
Під час декодування кодованого бітового потоку, виконання гармонічної транспозиції під час стадії обробки е5ВЕ декодування (для кожного каналу, "сп", звукового контента, зазначеного бітовим потоком), керується наступними параметрами метаданих езВК: 5БбгРаїспіпаМоае|сп|: зргОмегзатріїпо РІад(|сп); збгРИСпІпВіпз РІадісп|І; ії 5бгРИСПІпВіп5|сСп|.
Значення "зБбгРаїспіпаМоде|сп|" указує тип транспозера, використовуваний в езвЕе: 5ргРаїспіпоМоде(|сНп|І-1 указує негармонічну вклейку, як описано в розділі 4.6.18.6.3 стандарту
ААС МРЕС-4; 5БгРаїспіпоаМоае(снп|-О указує гармонічну вклейку ЗВЕ, як зазначено в розділі 7.5.3 або 7.5.4 стандарту ОБАС МРЕС БАС.
Зо Значення "5БгОмегзатріїпунРіад(|сп|" указує використання адаптивної стосовно сигналу передискретизації частотної ділянки в езВК у комбінації основаної на ДПФ гармонічної вклейки
ЗВЕ, як описано в розділі 7.5.3 стандарту ОБАС МРЕС. Ця прапорцева ознака керує розміром
ДПФ, які використовуються в транспозері: 1 указує активовану адаптивну стосовно сигналу передискретизацію частотної ділянки, як описано в розділі 7.5.3.1 стандарту ОБАС МРЕС; 0 указує деактивовану адаптивну стосовно сигналу передискретизацію частотної ділянки, як описано в розділі 7.5.3.1 стандарту ОБАС МРЕО.
Значення "зБбгРІЇСпіпВіп5РіІад|сп!" керує інтерпретацією параметра 5бгРіїспіпВіп5|сСп): 1 указує, що значення в 5бргРіїспіпВіпо|сСР| дійсне і більше нуля; 0 указує, що значення 5ВгРЇСпіпВіп5|СВ)| установлене в нуль.
Значення "збБгРіїспіпВіп5ІсСп|" керує додаванням членів векторного добутку в гармонічний транспозер ЗВК. Значення 5бгРіїспіпВіп5(сСп| є цілочисельним значенням у діапазоні І0,127| і являє собою відстань, вимірювану в елементах дозволу по частоті для 1536-точкове ДПФ, що діє на частоті дискретизації основного кодера.
У випадку, якщо бітовий потік ААС МРЕС-4 указує пару каналів ЗВЕ, чиї канали не з'єднані (замість одиночного каналу 5ВК), бітовий потік є вказуючим два екземпляри вищенаведеного синтаксису (для гармонічної або негармонічної транспозиції), один для кожного каналу 5рг спаппеї! раїг еіетепю).
Гармонічна транспозиція засобу езВК типово поліпшує якість декодованих музичних сигналів з відносно низькими частотами поділу. Негармонічна транспозиція (тобто, успадкована спектральна вклейка) типово поліпшує мовні сигнали. Звідси, відправна точка при ухваленні рішення у відношенні того, який тип транспозиції переважний для кодування конкретного звукового контента, полягає в тому, щоб вибирати спосіб транспозиції залежно від виявлення мови/музики, причому, гармонічна транспозиція виконується над музичним контентом, і спектральна вклейка над мовним контентом.
Виконання попереднього вирівнювання під час обробки езвЕК керується значенням однобітного параметра метаданих еЗзВК, відомого як "б5 5бг ргергосев5іпд", у тому розумінні, що попереднє вирівнювання виконується або не виконується залежно від значення цього одиночного біта. Коли використовується алгоритм вклейки за допомогою КДФ ЗВЕ, як описаний у розділі 4.6.18.6.3 стандарту ААС МРЕС-4, етап попереднього вирівнювання може бо виконуватися (коли зазначений параметром "Б5 5рг ргергосез5іпд") у спробі уникнути відсутності безперервності профілю обвідної спектра високочастотного сигналу, що подається в наступний коректор обвідної (коректор обвідної відіграє роль ще однієї стадії обробки е5ВК).
Попереднє вирівнювання типово поліпшує дію наступного каскаду корекції обвідної, даючи в результаті сигнал у смузі високих частот, що сприймається більш стійким.
Очікується, що загальна вимога до швидкості передачі в бітах для включення в метадані е5ВК бітового потоку ААС МРЕС-4, що вказують згадані вище засоби еЗзВК (гармонічну транспозицію і попереднє вирівнювання) буде порядку декількох сотень біт у секунду, тому що тільки відмітні керуючі дані, необхідні для виконання обробки езВК, передаються відповідно до деяких варіантів здійснення винаходу. Успадковані декодери можуть ігнорувати цю інформацію, тому що вона включена назад сумісним чином (як буде пояснено пізніше). Тому, пагубний вплив на швидкості передачі бітів, пов'язану із включенням до складу метаданих езВК, незначний з ряду причин, у тому числі, наступних: " Погіршення швидкості передачі бітів (обумовлене включенням до складу метаданих езВкК) є досить невеликою часткою повної швидкості передачі бітів, тому що передаються тільки відмітні керуючі дані, необхідні для виконання обробки е5ВЕК (а не одночасна передача керуючих даних ЗВК); і " Настроювання пов'язаної з 5ВК керуючої інформації типово не залежить від подробиць транспозиції.
Таким чином, варіанти здійснення винаходу передбачають засіб для раціональної передачі керуючих даних удосконаленої реплікації смуг спектра (езВК) або метаданих назад сумісним чином. Раціональна передача керуючих даних езВвВкК зменшує вимоги до пам'яті в декодерах, кодувальниках і перекодувальниках, що застосовує аспекти винаходу, тим часом не піддаючись відчутному несприятливому впливу на швидкість передачі бітів. Більше того, складність і вимоги до обробки, пов'язані з виконанням еЗзВЕ. відповідно до варіантів здійснення винаходу, також зменшуються, тому що дані 5ВК необхідно обробляти тільки один раз, і немає одночасної передачі, що мала б місце, якби езВвкК оброблявся у вигляді повністю окремого типу об'єкта в
ААС МРЕС-4 замість вбудовування в кодек ААС МРЕС-4 назад сумісним чином.
Потім, з посиланням на фіг. 7, опишемо елементи блоку ("там даїа БіосК") бітового потоку
ААС МРЕС-4, у якому метадані е5ВвВЕЕ включені до складу відповідно до деяких варіантів
Зо здійснення даними винаходу. Фіг. 7 - схема блоку ("гаму даїа Біоск") бітового потоку ААС МРЕО- 4, що показує деякі його сегменти.
Блок бітового потоку ААС МРЕС-4 може включати в себе щонайменше один "віпдіє спаппе! еіетепі)" (наприклад, елемент одиночного каналу, показаний на фіг. 7), і/або щонайменше один "спаппеї! раїг еїетепі)" (особливо не показаний на фіг. 7, хоча він може бути присутнім), у тому числі, звукові дані для звукової програми. Блок також може включати в себе деяку кількість "ЛІ еІетепіє" (наприклад, елемент 1 заповнення і/або елемент 2 заповнення за фіг. 7), що включають у себе дані (наприклад, метадані), що мають відношення до програми. Кожен "зіпдіє спаппе! еіетепі)" включає у себе ідентифікатор (наприклад, "ІС1" за фіг. 7), що вказує початок елемента одиночного каналу, і може включати в себе звукові дані, що вказують інший канал багатоканальної звукової програми. Кожен "спаппеї! раїг еІетепі" включає у себе ідентифікатор (не показаний на фіг. 7), що вказує початок елемента пари каналів, і може включати в себе звукові дані, що вказують два канали програми.
ТІЇ еіетепі (у матеріалах даної заявки згадуваний як елемент заповнення) бітового потоку
ААС МРЕС-4 включає у себе ідентифікатор (102" по фіг. 7), що вказує початок елемента заповнення, і даного заповнення після ідентифікатора. Ідентифікатор І02 може складатися із трибітного беззнакового цілого числа, переданого старшим бітом уперед ("ціт5бі"), що має значення 0хб. Дані заповнення можуть включати в себе елемент ехіепзіоп рауїсаді) (іноді в матеріалах даної заявки згадуваний як корисне навантаження розширення), чий синтаксис показаний у Таблиці 4.57 стандарту ААС МРЕС-4. Декілька типів корисного навантаження розширення існують і ідентифікуються за допомогою параметра "ехіепзіоп їуре", що є чотирибітним беззнаковим цілим числом, переданим старшим бітом уперед ("ціт5р).
Дані заповнення (наприклад, їх корисне навантаження розширення) можуть включати в себе заголовок або ідентифікатор (наприклад, "заголовок 1" за фіг. 7), що вказує сегмент даних заповнення, які є вказуючими об'єкт ЗВК (тобто, заголовок ініціалізує тип "об'єкта 5ВЕ", що вказується посиланням як 5рбг ехіепзіоп даїа() у стандарті ААС МРЕС-4). Наприклад, корисне навантаження розширення реплікації смуг спектра (ВЕ) ідентифікується значенням 1101" или "11107, що стосується поля ехієепзіоп їуре у заголовку, причому, "1101" ідентифікує корисне навантаження розширення з даними ВК, а "1110 ідентифікує і корисне навантаження розширення з даними ЗВЕК із циклічним надлишковим кодом (СКС) для перевірки правильності 60 даних ЗВЕ.
Коли заголовок (наприклад, поле ехіепвзіоп їуре) ініціалізує тип об'єкта ВЕК, метадані ЗВК (іноді згадувані як "дані реплікації смуг спектра" і вказувані посиланням як 5бг даїад() у стандарті
ААС МРЕ-4) йдуть за заголовком, і щонайменше один елемент розширення реплікації смуг спектра (наприклад, "елемент розширення ЗВЕК" елемента 1 заповнення за фіг. 7) може йти за метаданими 5ВК. Такий елемент розширення реплікації смуг спектра (сегмент бітового потоку) указується посиланням як контейнер "5бг ехіепзіоп)" у стандарті ААС МРЕС-4. Елемент розширення реплікації смуг спектра на вибір включає у себе заголовок (наприклад, "заголовок розширення 5ВЕ" елемента 1 заповнення за фіг. 7).
Стандарт ААС МРЕС-4 припускає, що елемент розширення реплікації смуг спектра може включати в себе дані Р5 (параметричної стереофонії) для звукових даних програми. Стандарт
ААС МРЕ-4 припускає, що, коли заголовок елемента заповнення (наприклад, його корисного навантаження розширення) ініціалізує тип об'єкта ЗВК (як це робить "пПеадегі" за фіг. 7), і елемент розширення реплікації смуг спектра елемента заповнення включає у себе дані РБ, елемент заповнення (наприклад, його корисне навантаження розширення) включає у себе дані реплікації смуг спектра, і параметр "р5 ехіепвіоп іа", чиє значення (тобто, 55 ехіепвіоп іа-2) указує, що дані РЗ5 включені в елемент розширення реплікації смуг спектра елемента заповнення.
Відповідно до деяких варіантів здійснення даного винаходу, метадані езВвкК (наприклад, прапорцева ознака, що вказує, чи повинна обробка вдосконаленої реплікації смуг спектра (езВК) виконуватися над звуковим контентом блоку). Наприклад, така прапорцева ознака вказується в елементі 1 заповнення за фіг. 7, де прапорцева ознака зустрічається після заголовка ("заголовка розширення ЗВЕ" елемента 1 заповнення) "елемента розширення ЗВЕ" елемента 1 заповнення. На вибір, така прапорцева ознака і додаткові дані е2ВК включені в елемент розширення реплікації смуг спектра після заголовка елемента розширення реплікації смуг спектра (наприклад, в елемент розширення З5ВК елемента 1 заповнення на фіг. 7, після заголовка розширення 5ВК). Відповідно до деяких варіантів здійснення даними винаходу, елемент заповнення, що включає у себе метадані езВК, також включає у себе параметр "ро ехіепзіоп ій", чиє значення (наприклад, р5 ехіепзіоп їй-3) указує, що метадані езВК включено в елемент заповнення, і що обробка е5ВвіК повинна бути виконана над звуковим
Зо контентом доречного блоку.
Відповідно до деяких варіантів здійснення винаходу, метадані, езвк включені в елемент заповнення (наприклад, елемент 2 заповнення за фіг. 7) бітового потоку ААС МРЕС-4, інші ніж в елементі розширення реплікації смуг спектра (елементі розширення 5ЗВК) елемента заповнення. Причина в тім, що елементи заповнення, що включають у себе ехіепзіоп рауїсайдо з даними 5ВЕ або дані ЗВЕ з СЕКС, не включають у себе ніякого іншого корисного навантаження розширення будь-якого іншого типу розширення. Тому, у варіантах здійснення, де метадані е5ВК зберігаються своїм власним корисним навантаженням розширення, окремий елемент заповнення, використовується для зберігання метаданих езВК. Такий елемент заповнення включає у себе ідентифікатор (наприклад, "2" за фіг. 7), що вказує початок елемента заповнення, і даного заповнення після ідентифікатора. Дані заповнення можуть включати в себе елемент ехіепзіоп рауїсайО (іноді в матеріалах даної заявки згадуваний як корисне навантаження розширення), чий синтаксис показаний у Таблиці 4.57 стандарту ААС МРЕС-4.
Дані заповнення (наприклад, їх корисне навантаження розширення) включають у себе заголовок (наприклад, "пеадег2" елемента 2 заповнення за фіг. 7), який є вказуючим об'єкт езЗВЕ (тобто, заголовок ініціалізує тип об'єкта вдосконаленої реплікації смуг спектра (еЗзВК)), і дані заповнення (наприклад, його корисне навантаження розширення) включають у себе метадані е5ВЕ після заголовка. Наприклад, елемент 2 заповнення за фіг. 7 включає у себе такий заголовок ("Пеадег2") і також включає у себе, після заголовка, метадані езВкК. (тобто, "прапорцева ознака" в елементі 2 заповнення, що вказує, чи повинна обробка вдосконаленої реплікації смуг спектра (езЗВК) виконуватися над звуковим контентом блоку). На вибір, додаткові метадані езВкК також включені в дані заповнення елемента 2 заповнення за фіг. 7 після заголовка 2. У варіантах здійснення, описуваних у даному параграфі, заголовок (наприклад, заголовок 2 за фіг. 7) має ідентифікаційне значення, що не є одним із традиційних значень, заданих у Таблиці 4.57 стандарту ААС МРЕОС-4, і, навзамін, є вказуючим корисне навантаження розширення езВК (так що поле ехіепзіоп їуре вказує, що дані заповнення включають у себе метадані езВК).
У першій групі варіантів здійснення, винахід є блоком обробки звукового сигналу (наприклад, декодером), що містить: пам'ять (наприклад, буфер 201 за фіг. З або 4), виконану з можливістю зберігати бо щонайменше один блок кодованого звукового бітового потоку (наприклад, щонайменше один блок бітового потоку ААС МРЕО-4); деформатер корисного навантаження бітового потоку (наприклад, елемент 205 за фіг. З або елемент 215 за фіг. 4), приєднаний до пам'яті і виконаний з можливістю демультиплексувати щонайменше одну частину згаданого блоку бітового потоку; і підсистему декодування (наприклад, елементи 202 і 203 за фіг. З або елементи 202 і 213 за фіг. 4), приєднану і виконану з можливістю декодувати щонайменше одну частину звукового контента згаданого блоку бітового потоку, при цьому, блок включає у себе: елемент заповнення, що включає в себе ідентифікатор, що вказує початок елемента заповнення (наприклад, ідентифікатор "ід буп ее", що має значення 0хб, за Таблицею 4.85 стандарту ААС МРЕФ-4), і дані заповнення після ідентифікатора, при цьому, дані заповнення включають у себе: щонайменше одну прапорцеву ознака, що ідентифікує, чи повинна обробка вдосконаленої реплікації смуг спектра (е5ВК) виконуватися над звуковим контентом блоку (наприклад, з використанням даних реплікації смуг спектра і метаданих еЗВЕ, включених у блок).
Прапорцевою ознакою є метадані еЗзВК, і прикладом прапорцевої ознаки є прапорцева ознака 5ргРаїспіпоМоде. Ще одним прикладом прапорцевої ознаки є прапорцева ознака гармонічної 5ВК. Обидві ці прапорцеві ознаки вказують, базова форма реплікації смуг спектра або вдосконалена форма реплікації спектра повинна виконуватися над звуковими даними блоку. Базовою формою реплікації спектра є спектральна вклейка, а вдосконаленою формою реплікації смуг спектра є гармонічна транспозиція.
У деяких варіантах здійснення, дані заповнення також включають у себе додаткові метадані еЗВК (тобто, метадані еЗзВЕ, інші ніж прапорцева ознака).
Пам'ять може бути буферною пам'яттю (наприклад, реалізацією буфера 201 за фіг. 4), що зберігає (наприклад, неефемерним чином) щонайменше один блок кодованого звукового бітового потоку.
Оцінюється, що складність виконання обробки езвВК (з використанням гармонічної транспозиції і попереднього вирівнювання езвкК) за допомогою декодера езВК під час декодування бітового потоку ААС МРЕО-4, що включає у себе метадані еЗзВК (що вказують ці засоби еЗВК), була б наступною (для типового декодування із зазначеними параметрами):
Зо " Гармонічна транспозиція (16 кбіт/с, 14400/28800 Гц) о на основі ДПФ: 3,68 М/УМОРЗ (зважених мільйонів операцій на секунду); о на основі КДФ: 0,98 МУМОР5; " попередня обробка вклейки за допомогою КДФ (попереднє вирівнювання): 0,1 УММОР5.
Відомо, що основана на ДПФ транспозиція типово працює краще, ніж основана на КДФ транспозиція, стосовно до перехідних процесів.
Відповідно до деяких варіантів здійснення даного винаходу, елемент заповнення (кодованого звукового бітового потоку), що включає у себе метадані езВК, також включає у себе параметр (наприклад, параметр "р5 ехіепвіоп їй"), чиє значення (наприклад, ро ехіепвіоп іа-3) сигналізує, що метадані е5ВК включено в елемент заповнення, і що обробка еЗзВЕК повинна бути виконана над звуковим контентом доречного блоку, і/або параметр (наприклад, той же самий параметр "р5 ехіепзіоп ій", чиє означення (наприклад, р5 ехіепзіоп іїй4-2) сигналізує, що контейнер 5Ббг ехіепзіоп() елемента заповнення включає у себе дані Р5. Наприклад, як зазначено в Таблиці 1, наведеній нижче, такий параметр, що має значення 05 ехіепзіоп іїй-2, може сигналізувати, що контейнер 50рг ехіепзіоп0) елемента заповнення включає у себе дані Р5, і такий параметр, що має значення Бб5 ехіепвтіоп їд-3, може сигналізувати, що контейнер 5бг ехіепзіоп() елемента заповнення включає у себе метадані еЗзВЕ:
Таблиця 1 11000111 |Зарезервовано./7/7/:«/:/:/:/УУ4/С:К://ССССГОИ
Відповідно до деяких варіантів здійснення винаходу, синтаксис кожного елемента розширення реплікації смуг спектра, що включає у себе метадані еЗВК і/або дані РБ5 є таким, як зазначено в Таблиці 2, наведеній вище (у якій "хбг ехіепзіоп()" позначає контейнер, що є елементом розширення реплікації смуг спектра, "5 ехіепвіоп ід" є таким, як описано в Таблиці
1, наведеній вище, "р5 ааїа" позначає дані Р5, а "езбг аага" позначає метадані езВК):
Таблиця 2 вот ехіепвіоп(р5 ехіепвіоп ій, пит Бйв ей) 77777711 її вмйсп(рв ехівпвіоп Є 11111111 савеєХТЕМБІОМОІЮ Р: 77777711 ак 111 савеЕХТЕМБІОМОЮ ЕБВА://777777771111111111111111111111111Ї111111111 иЙакє 111 дей 1
ПЕК ННЯ КО пит вйв ей; 111 ивакрї 111 нюІ"н"'нкІТОВИіВВІОВОМШ6СТЬТЬНТЬЬЬНВШИХИХОИИХЙНШИЙИОСЬСТИНТЬННЯШИШИ ннІ"":ниІИЩХЬЬХЬЙЦЙНІІПІЛЛОЛЛТТВОООИТЬТЬТТЬЬСЬЬОЬИЬЬТЬИТИТИОТОВВОВТВВОТВОООНЯ
Примітка ї:ре даїаОповертає кількістьліченихбіт.д ЇЇ (Примітка2:езрг дайаОповертає кількістьліченихбі.д ЇЇ. ..777777777111111171сСс
У зразковому варіанті здійснення, езбг аага(0, згаданий у Таблиці 2, наведеній вище, є вказуючим значення наступних параметрів метаданих: 1. однобітний параметр метаданих, "б5 5бг ргергосевв5іпод"; і 2. для кожного каналу ("сп") звукового контента кодованого бітового потоку, що підлягає декодуванню, кожний З описаних вище параметрів: "5ргРаїспіпамМоде|спІу"; "зБгОмегзатріїпоРІад(|сп)"; "5бгРСпіпВіп5 РІад(сп)"; ії "«огРІСВІіпВіпв|спу".
Наприклад, у деяких варіантах здійснення, езбг дага() може мати синтаксис, зазначений у
Таблиці 3, для вказівки цих параметрів метаданих:
Таблиця З еврг давай аас,рв соиріпо)ї 77777111 нннннюнІ""ннИШИХМВЖКОВООТДВВОВТОТВООВОВОВЛВВОИВВВВВВВВВВВВВВВВВВА ВВ ба аас- Ю ЗСЕЇЛССССССССС111111111111111Г вів овбгРИСЛВіИвІЮВО; 71 зфеве( С овбгОмегватріпонаяцорвої 77777771 овбгРИСЛВівІЮВО: 771 нннюнн""?н6ьаияшнинниииининининниннниннннншшш зевей(й аас- І СРЕДДГС////СССССС1111111111111111Г1 (в соцріпої 71111111 вів вбгРИСЛВіИвІІО; 11 зфеве( (зргОмегватріпонаєойІ; 77777711
Таблиця З вбгРИСЛВіИвІІО; 11 нннююнІн""ншииинииниинининининнишининнншшшш зеіве(/рв соцріпа 01 вів овбгРИСЛВівІЮВО: 771 зфеве( С овбгОмегватріпонаяцорвої 77777771 овбгРИСЛВівІЮВО: 771 нннннн"":"в6шИТШИфкШитннинишинннншшшш вів вбгРИСЛВИїИІО; 1 зфеве( овбгОмегватріпонаятвої 77777771 вбгРИСЛВИїИІО; 1 ннююІ""нкіІнІЗВТТЛТЛТЛДЛДТЛДЛДЛДЛДЛДЛДЛДЛДЛДЛДЛООЛІЛТИВІОШВОИЦОВОЛЛЛОТЛОТЛОТВОТИТНИМИ ОЛЯ ннююІ""'нкьфирФиЕиииииииининининннишинннншшш ннююІ""'нкьфирФиЕиииииииининининннишинннншшш нннннн"""?шБиинжяжяияяІІйїнжиИ н шини
Примітка: б5 5рг ргергосеззіпд визначено, як описано в розділі 6.2.12 ІБОЛЕС 23003-3:2012. 5ргРаїспіпамоде|спІ, збгОмегзатріїпонРіад(снІ, 5бгРИСПІпВіп5РіІадсп|І і 5бгРИСпіпВіп5 (сп визначені, як описано в розділі 7.5 ІЗОЛЕС 23003-3:2012.
Наведений вище синтаксис дає можливість раціональної реалізації вдосконаленої форми реплікації смуг спектра, такий як гармонічна транспозиція, як розширення успадкованого декодера. Більш точно, дані езВкК з Таблиці З включають у себе тільки ті параметри, необхідні для виконання вдосконаленої форми реплікації смуг спектра, які ще не підтримуються в бітовому потоці і не є виведеними безпосередньо з параметрів, уже підтримуваних у бітовому потоці. Всі інші параметри і дані обробки, необхідні для виконання вдосконаленої форми реплікації смуг спектра витягаються з існуючих раніше параметрів у вже визначених розташуваннях у бітовому потоці.
Наприклад, сумісний з НЕ-ААС МРЕ-4 або з НЕ-ААС м2 декодер може бути розширений, щоб включати в себе вдосконалену форму реплікації смуг спектра, таку як гармонічна транспозиція. Ця вдосконалена форма реплікації смуг спектра є доповненням до базової форми реплікації смуг спектра, уже підтримуваної декодером. У контексті сумісного з НЕ-ААС або НЕ-
ААС ом2 МРЕС-4 декодера, ця базова форма реплікації смуг спектра є засобом 5ВК спектральної вклейки за допомогою КДФ, як визначено в розділі 4.6.18 стандарту ААС МРЕО-4.
При виконанні вдосконаленої форми реплікації смуг спектра, декодер розширеного НЕ-ААС може повторно використати багато параметрів бітового потоку, уже включені в корисне навантаження розширення 5ВЕ бітового потоку. Конкретні параметри, які можуть повторно використатися, наприклад, включають у себе різні параметри, які визначають зведену таблицю смуг частот. Ці параметри включають у себе Б5 «аг їед (параметр, що визначає початок параметра зведеної таблиці частот), р5 5іор їїтед (параметр, що визначає закінчення зведеної таблиці частот), б5 їед 5саі6є (параметр, що визначає кількість смуг частот на октаву) і р5 апкег 5саіє (параметр, що змінює шкалу смуг частот). Параметри, які можуть повторно використовуватися, також включають у себе параметри, які визначають таблицю шумових смуг (55 поїхе рапаз) і параметри таблиці обмежувальних смуг (р5 Ітпйег рапа5). Відповідно, у різних варіантах здійснення, щонайменше деякі з еквівалентних параметрів, заданих у стандарті ОБАС, не включені в бітовий потік, тим самим, скорочуючи службові сигнали і дані керування в бітовому потоці. Типово, у тих випадках, коли параметр, заданий у стандарті ААС, має еквівалентний параметр, заданий в ЗАС, еквівалентний параметр, заданий в О5АС, має таке ж найменування, як параметр, заданий у стандарті ААС, наприклад, масштабний коефіцієнт обвідної, Еогпомарреа. Однак, еквівалентний параметр, заданий у стандарті О5АС, типово має інше значення, що "пристосоване" скоріше для обробки вдосконаленої 5ВЕ, визначеної в стандарті ОБАС, ніж для обробки ЗВЕ, визначеної в стандарті ААС.
На додаток до численних параметрів, інші елементи даних також можуть повторно використовуватися декодером розширеного НЕ-ААС при виконанні вдосконаленої форми реплікації смуг спектра відповідно до варіантів здійснення винаходу. Наприклад, дані обвідної і дані рівня власних шумів також можуть витягатися з даних р5 дайа епм (масштабних коефіцієнтів обвідної) і Бб5 поїхе епм (масштабних коефіцієнтів рівня власних шумів) і використовуватися під час удосконаленої форми реплікації смуг спектра.
По суті, ці варіанти здійснення використовують конфігураційні параметри і дані обвідної, уже підтримувані успадкованим декодером НЕ-ААС або НЕ-ААС м2 у корисному навантаженні розширення 5ВЕ, щоб уможливити вдосконалену форму реплікації смуг спектра, вимагаючи як можна меншої кількості додаткових переданих даних. Метадані початково були пристосовані для базової форми НЕК (наприклад, спектральної вклейки 5ВЕ), але, відповідно до варіантів здійснення, використовується для вдосконаленої форми НЕК (наприклад, гармонічної транспозиції еВ). Як обговорено раніше, метадані як правило являють собою робочі параметри (наприклад масштабні коефіцієнти обвідної, масштабні коефіцієнти рівня власних шумів, параметри час/частотної сітки, інформацію про синусоїдальне доповнення, змінну частоту/смугу поділу, режим зворотної фільтрації, розрізнення обвідної, режим згладжування, режим частотної інтерполяції), пристосовані і призначені для використання з базовою формою
НЕК (наприклад, лінійним перетворенням). Однак, ці метадані, комбіновані з додатковими параметрами метаданих, специфічними для вдосконаленої форми НЕК (наприклад, гармонічної транспозиції), можуть використовуватися для раціональної і ефективної обробки звукових даних з використанням удосконаленої форми НЕК.
Зо Відповідно, розширені декодери, які підтримують удосконалену форму реплікації смуг спектра, можуть бути створені дуже ефективним чином, покладаючись на вже визначені елементи бітового потоку (наприклад, такі в корисному навантаженні розширення ЗВЕ) і додаючи тільки ті параметри, які необхідні для підтримки вдосконаленої форми реплікації смуг спектра (у корисному навантаженні розширення елемента заповнення). Ця ознака скорочення даних у комбінації з розміщенням знову доданих параметрів у зарезервованих полях даних, таких як контейнер розширення, істотно зменшує бар'єри до створення декодера, що підтримує вдосконалену реплікацію смуг спектра, гарантуючи, що бітовий потік зворотно сумісний з успадкованим декодером, що не підтримує вдосконалену форму реплікації смуг спектра.
У таблиці 3, номер у правому стовпці вказує кількість бітів відповідного параметра в лівому стовпці.
У деяких варіантах здійснення, тип об'єкта ВК, визначений в ААС МРЕС-4, оновлений, щоб включати в себе засіб 5ВЕ. або аспекти засобу вдосконаленої 5ВК (езВЕ), що сигналізується в елементі розширення 5ВЕК (05 ехіепзіоп ій-- ЕХТЕМ5БІОМ ІО ЕЗВК).
У деяких варіантах здійснення, винахід є способом, що включає в себе етап кодування звукових даних для формування кодованого бітового потоку (наприклад, бітового потоку ААС
МРЕС-4), у тому числі, за допомогою включення метаданих езвкК у щонайменше один сегмент щонайменше одного блоку кодованого бітового потоку і звукових даних у щонайменше один інший сегмент блоку. У типових варіантах здійснення, спосіб включає у себе етап мультиплексування звукових даних з метаданими езВЕ у кожному блоці кодованого бітового потоку. При типовому декодуванні кодованого бітового потоку в декодері езВЕ, декодер витягає метадані езВК з бітового потоку (у тому числі, за допомогою синтаксичного розбору і демультиплексування метаданих езВК і звукових даних) і використовує метадані езВвВкК для обробки звукових даних, щоб формувати потік декодованих звукових даних.
Ще одним аспектом винаходу є декодер еЗВК, виконаний з можливістю виконувати обробку еЗВК (наприклад, з використанням щонайменше одного із засобів езВЕ, відомих як гармонічна транспозиція або попереднє вирівнювання) під час декодування кодованого звукового потоку (наприклад, бітового потоку ААС МРЕС-4), що не включає у себе метадані езВК. Приклад такого декодера буде описаний з посиланням на фіг. 5.
Декодер (400) е5ВЕК за фіг. 5 включає у себе буферну пам'ять 201 (яка ідентична пам'яті 201 бо за фіг. З ії 4), деформатер 215 корисного навантаження бітового потоку (який ідентичний деформатеру 215 за фіг. 4), підсистему 202 декодування звукового сигналу (іноді згадувану як каскад "основного" декодування або підсистема "основного" декодування, і яка ідентична підсистемі 202 основного декодування за фіг. 3), підсистему 401 формування керуючих даних еЗВК і каскад 203 обробки еЗВЕ (який ідентичний каскаду 203 за фіг. 3, з'єднані як показано. До
Б того ж, типово, декодер 400 включає у себе інші елементи обробки (не показані).
При експлуатації декодера 400, послідовність блоків кодованого звукового бітового потоку (бітового потоку ААС МРЕС-4), прийнятого декодером 400, пред'являється з буфера 201 у деформатер 215.
Деформатер 215 приєднаний і виконаний з можливістю демультиплексувати кожен блок бітового потоку для витягання метаданих ЗВЕ (у тому числі квантованих даних обвідної) і також типово інших метаданих з нього. Деформатер 215 виконаний з можливістю додавати щонайменше метадані ЗВЕ у каскад 203 обробки е5ВЕ. Деформатер 215 також приєднаний і виконаний з можливістю витягати звукові дані з кожного блоку бітового потоку, і пред'являти витягнуті звукові дані в підсистему 202 декодування (каскад декодування).
Підсистема 202 декодування звуку декодера 400 виконана з можливістю декодувати звукові дані, витягнуті деформатером 215 (таке декодування може згадуватися як операція "основного" декодування), для формування декодованих звукових даних і пред'являти декодовані звукові дані в каскад 203 обробки езВК. Декодування виконується в частотній ділянці. Типово, завершувальний каскад обробки в підсистемі 202 застосовує перетворення із частотної ділянки в часову ділянку до декодованих звукових даних частотної ділянки, так щоб вихідними даними підсистеми були декодовані звукові дані часової ділянки. Каскад 203 виконаний з можливістю застосовувати засоби 5ВК (і засоби ебВК), зазначені метаданими 5ВЕ (витягнутими деформатером 215) і метаданими езВК, сформованими в підсистемі 401, до декодованих звукових даних (тобто, виконувати обробку ЗВК і еЗВЕ над вихідними даними підсистеми 202 декодування з використанням метаданих З5ВЕК і езвк) для формування повністю декодованих звукових даних, які виводяться з декодера 400. Типово, декодер 400 включає у себе пам'ять (доступну з підсистеми 202 і каскаду 203), що зберігає деформатовані звукові дані і метадані, видані з деформатера 215 (і, на вибір, також підсистеми 401), а каскад 203 виконаний з можливістю здійснювати доступ до звукових даних і метаданих у міру необхідності під час
Зо обробки ЗВК і еЗзВЕ. Обробка ЗВК у каскаді 203 може вважатися наступною обробкою на виході з підсистеми 202 основного декодування. На вибір, декодер 400 також включає у себе підсистему завершального підвищувального мікшування (яка може застосовувати засоби параметричної стереофонії ("Р5"), визначені в стандарті ААС МРЕС-4, з використанням метаданих Р5, витягнутих деформатером 215), що приєднана і виконана з можливістю виконувати підвищувальне мікшування над вихідним сигналом каскаду 203, щоб формувати повністю декодований підданий підвищувальному мікшуванню звуковий сигнал, що виводиться з АРИ 210.
Підсистема 401 формування керуючих даних за фіг. 5 приєднана і виконана з можливістю виявляти щонайменше одну властивість кодованого звукового бітового потоку, що підлягає декодуванню, і формувати керуючі дані езВЕ. (які можуть бути або включати в себе метадані езвВК кожного з типів, включених у кодовані звукові бітові потоки, відповідно до інших варіантів здійснення винаходу) у відповідь на щонайменше один результат етапу виявлення. Керуючі дані еЗзВК додаються в каскад 203, щоб пускати в хід застосування окремих засобів езВЕ. або комбінації засобів е5ВК при виявленні конкретної властивості (або комбінації властивостей) бітового потоку і/або керувати застосуванням таких засобів езВК. Наприклад, для того щоб контролювати виконання обробки еВ з використанням гармонічної транспозиції, деякі варіанти здійснення підсистеми 401 формування керуючих даних включали б у себе: детектор музики (наприклад, спрощений варіант традиційного детектора музики) для установки параметра 5бгРаїспіпоМоде|сп| (і пред'явлення встановленого параметра в каскад 203) у відповідь на виявлення, що бітовий потік є або не є таким, що вказує музику; детектор перехідних процесів для установки параметра 5БбгОмегзатріїпоРіадІснп| (і пред'явлення встановленого параметра в каскад 203) у відповідь на виявлення наявності або відсутності перехідних процесів у звуковому контенті, що вказується бітовим потоком; і/або детектор основного тону для установки параметрів 5ргРіїспіпВіп5Ріаз(|сн! і 5бгРіїспіпВіп5(|сСН) (їі пред'явлення встановлених параметрів у каскад 203) у відповідь на виявлення основного тону звукового контента, що вказується бітовим потоком. Іншими аспектами винаходу є виконувані будь-яким варіантом здійснення способи декодування звукового бітового потоку декодером, що володіє ознаками винаходу, описаним у цьому параграфі і попередньому параграфі.
Аспекти винаходу включають у себе спосіб кодування або декодування типу, який будь-який 60 варіант здійснення АРИ, системи або пристрою, що володіють ознаками винаходу, виконаний з можливістю (або запрограмований) виконувати. Інші аспекти винаходу включають у себе систему або пристрій, виконані з можливістю (наприклад, запрограмовані) виконувати будь-який варіант здійснення способу, що володіє ознаками винаходу, і машинно-читаний носій (наприклад, диск), який зберігає машинну програму (наприклад, неефемерним чином) для реалізації будь-якого варіанта здійснення винаходу способу, що володіє ознаками, або його етапів. Наприклад, система, що володіє ознаками винаходу, може бути або включати в себе програмований процесор загального застосування, цифровий сигнальний процесор або мікропроцесор, запрограмований програмним забезпеченням або мікропрограмним забезпеченням і/або іншим способом виконаний з можливістю виконувати будь-які з різноманіття операцій над даними, у тому числі, варіант здійснення способу, що володіє ознаками винаходу, або його етапів. Такий процесор загального застосування може бути або включати в себе комп'ютерну систему, що включає в себе пристрій вводу, пам'ять, схему обробки, запрограмовану (і/або іншим способом виконану з можливістю) виконувати варіант здійснення способу, що володіє ознаками винаходу, (або його етапів) у відповідь на дані, пред'явлені йому.
Варіанти здійснення даного винаходу можуть бути реалізовані в апаратних засобах, мікропрограмному забезпеченні або програмному забезпеченні, або комбінацією того і іншого (наприклад, у вигляді програмованої логічної матриці). Якщо не зазначений інший спосіб дій, алгоритми і процеси, включені до складу як частина винаходу, за своєю природою, не мають відношення до якого б то не було конкретного комп'ютеру або іншого пристрою. Зокрема, різні машини загального застосування можуть використовуватися із програмами, написаними відповідно до доктрин, наведених в матеріалах даної заявки, або може бути більш зручним сконструювати більш спеціалізований пристрій (наприклад, інтегральні схеми) для виконання необхідних етапів способу. Таким чином, винахід може бути реалізований в одній або більше комп'ютерних програм, що виконуються в одній або більше програмованих комп'ютерних систем (наприклад, реалізації будь-якого з елементів за фіг. 1 або кодувальника 100 за фіг. 2 (або його елемента), або декодера 200 за фіг. З (або його елемента), або декодера 210 за фіг. 4 (або його елементи) або декодера 400 за фіг. 5 (або його елемента)), кожна з яких містить щонайменше один процесор, щонайменше одну систему зберігання даних (у тому числі, енергозалежні або
Зо енергонезалежні елементи пам'яті або запам'ятовувальні елементи), щонайменше один пристрій або порт вводу і щонайменше один пристрій або порт виводу. Керуюча програма застосовується до вхідних даних для виконання функцій, описаних у матеріалах даної заявки, і формує вихідну інформацію. Вихідна інформація спрямовується в один або більше пристроїв виводу відомим чином.
Кожна така програма може бути реалізована на будь-якій бажаній комп'ютерній мові (включаючи машинні, компонувальні або високорівневі процедурні, логічні або об'єктно- орієнтовані мови програмування) для обміну інформацією з комп'ютерною системою. У кожному разі, мова може бути компільованою або інтерпретованою мовою.
Наприклад, коли реалізуються послідовностями команд комп'ютерного програмного забезпечення, різні функції і етапи варіантів здійснення винаходу можуть реалізовуватися послідовностями команд багатопотокового програмного забезпечення, що працюють на придатних апаратних засобах цифрової обробки сигналів, у якому випадку, різні пристрої, етапи і функції варіантів здійснення можуть відповідати порціям команд програмного забезпечення.
Кожна така комп'ютерна програма переважно зберігається на або завантажується на запам'ятовувальні носії або в пристрій (наприклад, твердотільну пам'ять або носії, або магнітні або оптичні носії), що читаються програмованим комп'ютером загального застосування або спеціального призначення, для конфігурування і керування комп'ютером, коли запам'ятовувальні носії або пристрій зчитуються комп'ютерною системою, щоб виконувати процедури, описані в матеріалах даної заявки. Система, що володіє ознаками винаходу також може бути реалізована у вигляді машинно-читаного запам'ятовувального носія, сконфігурованого комп'ютерною програмою (тобто, що зберігає комп'ютерну програму), де запам'ятовувальний носій, сконфігурований таким чином, спонукує комп'ютерну систему діяти конкретним і визначеним чином для виконання функцій, описаних у матеріалах даної заявки.
Була описана деяка кількість варіантів здійснення винаходу. Проте, буде зрозуміло, що різні модифікації можуть бути зроблені, не виходячи із суті і обсягу винаходу. Багато модифікацій і різновидів даного винаходу можливі у світлі вищенаведених доктрин. Наприклад, для того щоб сприяти ефективним реалізаціям, фазові зсуви можуть використатися в комбінації із гребінками фільтрів розкладання сигналу і синтезу сигналу комплексним КДФ. Гребінка фільтрів розкладання сигналу відповідальна за фільтрацію сигналу в смузі низьких частот часової 60 ділянки, сформованого основним декодером, у множину піддіапазонів (наприклад, піддіапазонів
КДФ). Гребінка фільтрів розкладання сигналу відповідальна за комбінування відновленої смуги високих частот, створеного за допомогою вибраної технології НЕК (яка зазначена прийнятим параметром 5БбгРаїспіпоМоде), з декодованою смугою низьких частот, щоб синтезувати широкосмуговий вихідний звуковий сигнал. Дана реалізація гребінки фільтрів, що працює в визначеному режимі частоти вибірки, наприклад, режимі нормальної роботи на подвоєній частоті або ВК з понижувальною дискретизацією, однак, не повинна мати фазових зсувів, які залежать від бітового потоку. Гребінки КДФ, використовувані в 5ВК є розширенням складної експонентної функції з теорії гребінок фільтрів з косинусоїдальною модуляцією. Може бути показано, що обмеження заглушення паразитних сигналів стають застарілими при розширенні гребінки фільтрів з косиносуїдальною модуляцією комплексною експонентною модуляцією.
Таким чином, що стосується гребінок із КДФ ЗВК, як фільтри розкладання сигналу, Пк(п), так і фільтри синтезм сигналу. їк(п). можуть бути визначені за допомогою: и й ; ву(п) хе Гуп) ех роп) окрім ня 5, с - з)
ОепЕМОвКа М (1) де ро(п) - дійснозначний симетричний або несиметричний прототипний фільтр (типово, прототипний фільтр нижніх частот), М позначає кількість каналів, а М - порядок прототипного фільтра. Кількість каналів, використовуваних у гребінці фільтрів розкладання сигналу, може бути іншою, ніж кількість каналів, використовуваних у гребінці фільтрів синтезу сигналу.
Наприклад, гребінка фільтрів розкладання сигналу може мати 32 канали, а гребінка фільтрів синтезу сигналу може мати 64 канали. При експлуатації гребінки фільтрів синтезу сигналів у режимі з понижувальною дискретизацією, гребінка фільтрів синтезу сигналу може мати тільки 32 канали. Оскільки відліки піддіапазонів із гребінки фільтрів є комплекснозначними, ступінь адитивного можливо каналозалежного фазового зсуву може бути додана до гребінки фільтрів розкладання сигналу. Ці додаткові фазові зсуви необхідно компенсувати до гребінки фільтрів синтезу сигналу. Незважаючи на те, що елементи фазового зсуву в принципі можуть бути довільними значеннями, що не порушують роботу ланцюжка розкладання/синтезу сигналу за допомогою КДФ, вони також можуть бути обмежені визначеними значеннями для контролю відповідності. Сигнал ЗВК буде перебувати під впливом вибору фазових множників, у той час як сигнал нижніх частот, що приходить із основного декодера, не буде. Якість звуку вихідного сигналу не порушується.
Коефіцієнти прототипного фільтра, ро(п), можуть бути обмежені довжиною, І в 640, як показано в Таблиці 4, наведеної нижче.
Таблиця 4 0 | Ффорооооо0оо | 214 | 0,0019765601 | 428 | 0,0117623832 « 6 | -0.0005040714 | 220 | -0,0319531274 | 434 | 0,0366418116 8 | -0.0005466565 | 222 | -0,0447806821 | 436 | 0,0434768782 « 9 | -0.0005677802 | 223 | -0,0514804176 | 437 | 0,0466303305
Таблиця 4 60 | Ффоотов41140 | 274 | 0,5630789140 | 488 | 0,0466843027 66 | 0,0029469447 | 280 | 0,62б1242695 | 494 | 0,0374812850 68 | 0бооз2739613 | 282 | 0,6461269695 | 496 | 0,0344620948 ( 69 | 0о0034418874 | 283 | 0,6559016302 | 497 | 0,0329754081
Таблиця 4 80 | фо0воз93022 | 294 | 0,7513137456 | 508 | 0,0179433381 86 | 00055475714 | 300 | 0,7919735841 | 514 | -0,0111315548 89 | 0боробаБот96 | 303 | 0,8087695004 | 517 | -0,0081798233 890 | Ффоооб389199 | 304 | 0,8138191270 | 518 | -0,0072615816 96 | 0борб2715758 | 310 | 0,8379717337 | 524 | -0,0024826723 ( 98 | 0,0049839687 | 312 | 0,8436238281 | 526 | -0,0011568135 « 89 | 00048109469 | 313 | 0,8459818469 | 527 | -0,0005464280
Таблиця 4 172 | 0,0725682583 | 386 | -0,3388722693 | 600 | -0,0002896981 178 | 0,0761992479 | 392 | -0,2736634040 | 606 | -0,0005946118 ( 181 | 0,0768173975 | 395 | -0б,2423016884 | 609 | -0,0006917937
Таблиця 4 212 | 0бої117623832 | 426 | 000197656601.Й. (213 | 0бо0069636862 | 427 | 00069636862.
Прототипний фільтр, ро(п), також може бути виведений з таблиці 4 за допомогою однієї або більше математичних операцій, таких як округлення, знижувальна дискретизація, інтерполяція або проріджування.
Зрозуміло, що, у межах обсягу прикладеної формули винаходу, винахід може бути здійснений на практиці іншим способом, ніж конкретно описаний у матеріалах даної заявки.
Будь-які номери посилань, що містяться в нижченаведеній формулі винаходу, призначені тільки для ілюстративних цілей і ніяким чином не повинні використовуватися для тлумачення або обмеження формули винаходу.

Claims (15)

ФОРМУЛА ВИНАХОДУ
1. Спосіб декодування кодованого звукового бітового потоку, що включає етапи, на яких: приймають кодований звуковий бітовий потік, при цьому кодований звуковий бітовий потік включає звукові дані, що представляють собою частину смуги низьких частот звукового сигналу; декодують звукові дані для формування декодованого звукового сигналу в смузі низьких частот; витягають із кодованого звукового бітового потоку метадані реконструкції високих частот, при цьому метадані реконструкції високих частот включають робочі параметри лінійного перетворення, налаштовані для процесу реконструкції високих частот, який лінійно перетворює послідовну кількість піддіапазонів, із частини смуги низьких частот звукового сигналу в частину смуги високих частот звукового сигналу, при цьому робочі параметри лінійного перетворення включають масштабні коефіцієнти обвідної, масштабні коефіцієнти рівня власних шумів, інформацію про синусоїдальне доповнення, інформацію про час/частотну сітку, частоту поділу і режим зворотної фільтрації; фільтрують декодований звуковий сигнал у смузі низьких частот гребінкою фільтрів розкладання сигналу для формування фільтрованого звукового сигналу в смузі низьких частот;
витягають із кодованого звукового бітового потоку прапорцеву ознаку, що вказує, чи повинні виконуватися над звуковими даними лінійне перетворення або гармонічна транспозиція; якщо прапорцева ознака вказує, що над звуковими даними повинна виконуватися гармонічна транспозиція: відновлюють частину смуги високих частот звукового сигналу шляхом виконання гармонійної транспозиції з використанням фільтрованого звукового сигналу у смузі низьких частот і метаданих реконструкції високих частот, що включають робочі параметри лінійного перетворення; і комбінують фільтрований звуковий сигнал у смузі низьких частот і відновлену частину смуги високих частот для формування широкосмугового звукового сигналу, при цьому гребінка фільтрів розкладання сигналу включає фільтри розкладання сигналу, пк(п), які є модульованими варіантами прототипного фільтра, ро(п), згідно 3: Нк(п) - ро(п) ехо вій |; ни |" - з). МО 2А 2/) ОєпеМм Оккам. де ро(п) - дійснозначний симетричний або несиметричний прототипний фільтр, М - кількість каналів у гребінці фільтрів розкладання сигналу, а М - порядок прототипного фільтра.
2. Спосіб за п. 1, у якому кодований звуковий бітовий потік додатково включає елемент заповнення з ідентифікатором, що вказує початок елемента заповнення, і даними заповнення після ідентифікатора, при цьому дані заповнення включають прапорцеву ознаку.
З. Спосіб за п. 2, у якому ідентифікатор є трибітовим беззнаковим цілим числом, що передається старшим бітом вперед і має значення Ох6.
4. Спосіб за п. 2, у якому дані заповнення включають корисне навантаження розширення, корисне навантаження розширення включає дані розширення реплікації смуг спектра, і корисне навантаження розширення ідентифікується чотирибітним беззнаковим цілим числом, що передається старшим бітом вперед і має значення "1101" або 1110".
5. Спосіб за п. 4, у якому дані розширення реплікації смуг спектра включають: необов'язковий заголовок реплікації смуг спектра, дані реплікації смуг спектра після заголовка, елемент розширення реплікації смуг спектра після даних реплікації смуг спектра, і при цьому Зо прапорцева ознака включена в елемент розширення реплікації смуг спектра.
б. Спосіб за будь-яким одним із пп. 1-4, у якому прототипний фільтр, ро(п), визначається коефіцієнтами за Таблицею 4.
7. Спосіб за будь-яким одним із пп. 1-4, у якому прототипний фільтр, ро(п), виводиться з коефіцієнтів за Таблицею 4 за допомогою однієї або більше математичних операцій, вибраних із групи, що складається з округлення, знижувальної дискретизації, інтерполяції або проріджування.
8. Довгостроковий машиночитаний носій, що включає команди, які при виконанні процесором спонукають цей процесор виконувати спосіб за будь-яким з пп. 1-6.
9. Декодер для декодування кодованого звукового бітового потоку, при цьому декодер містить: вхідний інтерфейс для прийому кодованого звукового бітового потоку, кодований звуковий бітовий потік включає звукові дані, що являють собою частину смуги низьких частот звукового сигналу; основний декодер для декодування звукових даних для формування декодованого звукового сигналу в смузі низьких частот; деформатер для витягання з кодованого звукового бітового потоку метаданих реконструкції високих частот і робочі параметри лінійного перетворення, налаштовані для процесу реконструкції високих частот, який лінійно перетворює послідовну кількість піддіапазонів з частини смуги низьких частот звукового сигналу в частину смуги високих частот звукового сигналу, при цьому робочі параметри лінійного перетворення включають масштабні коефіцієнти обвідної, масштабні коефіцієнти рівня шумів, інформацію про синусоїдальне доповнення, інформацію про час/частотну сітку, частоту поділу та режим зворотної фільтрації; гребінку фільтрів розкладання сигналу для фільтрації декодованого звукового сигналу в смузі низьких частот, щоб формувати фільтрований звуковий сигнал у смузі низьких частот; деформатер для витягання з кодованого звукового бітового потоку прапорцевої ознаки, що вказує, чи повинні виконуватися над звуковими даними лінійне перетворення або гармонічна транспозиція; відновлювач високих частот для відновлення, якщо прапорцева ознака вказує, що над звуковими даними повинна виконуватися гармонійна транспозиція, частини смуги високих частот звукового сигналу, шляхом виконання гармонійної транспозиції з використанням фільтрованого звукового сигналу в смузі низьких частот і метаданих реконструкції високих частот, що включають параметри лінійного перетворення; і гребінку фільтрів синтезу сигналу для комбінування фільтрованого звукового сигналу в смузі низьких частот і відновленої частини смуги високих частот для формування широкосмугового звукового сигналу, при цьому гребінка фільтрів розкладання сигналу включає фільтри розкладання сигналу, пк(п), які Є модульованими варіантами прототипного фільтра, ро(п), згідно : х 1 М К(п) - ро(п) ехо - |; ни |" - 5). Мо аг 2/) ОспеМ О«каМ де ро(п) - дійснозначний симетричний або несиметричний прототипний фільтр, М - кількість каналів у гребінці фільтрів розкладання сигналу, а М - порядок прототипного фільтра.
10. Декодер за п. 9, у якому кодований звуковий бітовий потік додатково включає елемент заповнення з ідентифікатором, що вказує початок елемента заповнення, і даними заповнення після ідентифікатора, при цьому дані заповнення включають прапорцеву ознаку.
11. Декодер за п. 10, у якому ідентифікатор є трибітним беззнаковим цілим числом, що передається старшим бітом вперед і має значення Ох6б.
12. Декодер за п. 10, у якому дані заповнення включають корисне навантаження розширення, при цьому корисне навантаження розширення включає дані розширення реплікації смуг спектра, і корисне навантаження розширення ідентифікується чотирибітним беззнаковим цілим числом, що передається старшим бітом вперед і має значення "1101" або "1110.
13. Декодер за п. 12, у якому дані розширення реплікації смуг спектра включають: необов'язковий заголовок реплікації смуг спектра, дані реплікації смуг спектра після заголовка, елемент розширення реплікації смуг спектра після даних реплікації смуг спектра, і при цьому прапорцева ознака включена в елемент розширення реплікації смуг спектра.
14. Декодер за будь-яким одним із пп. 9-13, у якому прототипний фільтр, ро(п), визначаєтся коефіцієнтами за Таблицею 4.
15. Декодер за будь-яким одним із пп. 9-13, у якому прототипний фільтр, ро(п), виводиться з коефіцієнтів за Таблицею 4 за допомогою однієї або більше математичних операцій, вибраних із групи, що складається з округлення, знижувальної дискретизації, інтерполяції або Зо проріджування. К БТОВИЙ ПОТІК АС МРЕС:-З ки ах Ї Дитя Коша ж і ни акне п я о ма лин ж вХхІдниИЙ й с сечу АТ І пронни ї о дижирвко СИГНАЛ т |юдвальникр ДОСТАВКА щ ДЕМОДЕРВ щ ПОСТОБРОБКА |- «КН А 3 і
Фіг. і вати ки оду ту ня др их Й ще ТО ил? БО ЗВУКОВИЙ рення пунк ую риб . шт х . Еге ; і ЮВАЧ/ о. й В ВИЙ п і ВХІДНИЙ КОДУВАЛЬНИКІч /ЛОВНЮВІ сооБУФЕР о ф-ее БТОВИЙ ПОТІК СИГНАЛ КЕ. ФОРМАТЕР | АСЕМРЕВ-Я ГЕНЕРАТОР ! » МЕТАДАНИХ і тот ЖОДУВАЛЬНИКІ
ФІГ. я
ГаШ я ЗО ДАК МАМА ЛАНА УКАА ЗАЙМАЄ КАК РТ ЗЛАК МКМ ЗААМІ МАМКО ТАТА ВАЛКОВККА ЗАМКА ЗАМАЛО СМАК САРА МАРК ЗАММЄО СУКА МІФИ течі А ВАНА УКААО ЗАКМЕ Я х, с рн я ' з от пет ; ГОЕКОДЕВІ го? ро) ЛосСтТОРОЦЕСОР З Ї вудвея пече ; ! щу щ пе , БУФЕР » ДЕ- зе ПЕКОДЕР НЯ ОБРОБКА Бен БУФЕР ДЕ! і і пе Ї ; Ше ФОРМАТЕР ях М вод І шу і ої «ккд повна юр Є і за ж т 3 і о МЕТАДАНІ ВОВК! о : : ! зо оре" Її затії Е шк ЗШ | ТЕМНЕРАТОВ ' ! і » нео КЕРУЮЧИХ БЕПД Кия Р | ; Е ! ї . У нор ЩО КК еІг. З ев р ж я в я же я Ж я Ж ве ях жи в я ж ня вк нн ат реч р АРІ | и 2оз ї і | й Кі те БУФЕР реч де ев ДЕКОДЕР фени ОБРОБКА рф 3 1 й я ЕЕ І ФОВМАТЕ ШИ | св ! 28 - - СВО і з 7 й о МЕТАЛАНІ Зб ноеннвновннноннріннвннньнй і «ак пралутт : -ї5 2 І
ФІГ. 4 З се ви по з ідЕкОдеР) ВЕ як! Й ; ке ВХІДНИЙ дерев БУФЕВ з ДеФіюМАТЕ? їі ДЕКОДЕВ СИГНАЛ. Н І НІ : Н і зр па і Н зе 2 й Ко Й ше : Н ! вин НВ й о, і ТО ТЕНЕВАНВОР Пк ОБРОБКА у ; і КЕРУЮЧИХ БИТВ « зе З і св і ВИХІДНІ ДАНІ
ФІ. 5 ще БЮ ІАРЦ і
ТІК. б
ЕВЕМЕНТ ца уж оюєюх і ж шин одиночного ЕЛЕМЕНТ і ЗАПОВНЕННЯ ЕЛЕМЕНТ З ЗАПОВНЕННЯ КАНАЛУ х. однх, р нн р и ше ше: Е
Шк. ; і ЩЕ ; де КО ; С се з З Х Не цен Й бен НЗ0еИ 5-0 ПРАПОВЦЕВА ОЗНАКА к НВ "пили в. ЗАГОЛОВОК Я С Я СЛЕМЕНІ -- ЗАГОЛОВОК І зі вОовшиРЕННЯ ВИ ЗАГОЛОВОК РОЗШМВЕВНЯ ЯН Я що шо ПРАПСРЦЕВА ОЗНАНА я. т
UAA201907982A 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів UA126393C2 (uk)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762475619P 2017-03-23 2017-03-23
PCT/US2018/023183 WO2018175347A1 (en) 2017-03-23 2018-03-19 Backward-compatible integration of harmonic transposer for high frequency reconstruction of audio signals

Publications (1)

Publication Number Publication Date
UA126393C2 true UA126393C2 (uk) 2022-09-28

Family

ID=63585721

Family Applications (3)

Application Number Title Priority Date Filing Date
UAA201907982A UA126393C2 (uk) 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
UAA201912129A UA126401C2 (uk) 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
UAA202100914A UA126719C2 (uk) 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів

Family Applications After (2)

Application Number Title Priority Date Filing Date
UAA201912129A UA126401C2 (uk) 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
UAA202100914A UA126719C2 (uk) 2017-03-23 2018-03-19 Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів

Country Status (26)

Country Link
US (7) US10818306B2 (uk)
EP (1) EP3559821A4 (uk)
JP (4) JP6665354B2 (uk)
KR (6) KR102275129B1 (uk)
CN (3) CN110178180B (uk)
AR (6) AR111047A1 (uk)
AU (5) AU2018237070B2 (uk)
BR (2) BR122019027754B1 (uk)
CA (5) CA3171727A1 (uk)
CL (1) CL2019001981A1 (uk)
CO (1) CO2019008431A2 (uk)
EA (3) EA036090B1 (uk)
EC (1) ECSP19054232A (uk)
GE (1) GEP20217226B (uk)
IL (5) IL310208A (uk)
MA (1) MA47232A (uk)
MX (7) MX2019008349A (uk)
NZ (4) NZ759800A (uk)
PE (1) PE20191288A1 (uk)
PH (1) PH12019501658A1 (uk)
SA (1) SA519402434B1 (uk)
SG (1) SG11201906370TA (uk)
TW (3) TWI807562B (uk)
UA (3) UA126393C2 (uk)
WO (1) WO2018175347A1 (uk)
ZA (6) ZA201904559B (uk)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI693594B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
TWI809289B (zh) 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN113113032A (zh) * 2020-01-10 2021-07-13 华为技术有限公司 一种音频编解码方法和音频编解码设备

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5527024A (en) 1978-08-15 1980-02-26 Mitsui Toatsu Chem Inc Molded tableted catalysts showing high selectivity
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0101175D0 (sv) 2001-04-02 2001-04-02 Coding Technologies Sweden Ab Aliasing reduction using complex-exponential-modulated filterbanks
JP3870193B2 (ja) * 2001-11-29 2007-01-17 コーディング テクノロジーズ アクチボラゲット 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム
BR122018007834B1 (pt) * 2003-10-30 2019-03-19 Koninklijke Philips Electronics N.V. Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador
KR100571824B1 (ko) 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
DE602004020765D1 (de) * 2004-09-17 2009-06-04 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten Tonsignalen
RU2376657C2 (ru) * 2005-04-01 2009-12-20 Квэлкомм Инкорпорейтед Системы, способы и устройства для высокополосного предыскажения шкалы времени
KR100818268B1 (ko) 2005-04-14 2008-04-02 삼성전자주식회사 오디오 데이터 부호화 및 복호화 장치와 방법
WO2007055464A1 (en) 2005-08-30 2007-05-18 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR101565919B1 (ko) 2006-11-17 2015-11-05 삼성전자주식회사 고주파수 신호 부호화 및 복호화 방법 및 장치
CN101471072B (zh) 2007-12-27 2012-01-25 华为技术有限公司 高频重建方法、编码装置和解码装置
KR101413968B1 (ko) * 2008-01-29 2014-07-01 삼성전자주식회사 오디오 신호의 부호화, 복호화 방법 및 장치
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
CA2729474C (en) 2008-07-11 2015-09-01 Frederik Nagel Apparatus and method for generating a bandwidth extended signal
PL4053838T3 (pl) * 2008-12-15 2023-11-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy
PL3598447T3 (pl) * 2009-01-16 2022-02-14 Dolby International Ab Transpozycja harmonicznych rozszerzona o iloczyn wektorowy
TWI597938B (zh) * 2009-02-18 2017-09-01 杜比國際公司 低延遲調變濾波器組
TWI591625B (zh) * 2009-05-27 2017-07-11 杜比國際公司 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體
US8515768B2 (en) * 2009-08-31 2013-08-20 Apple Inc. Enhanced audio decoder
EP4250290A1 (en) * 2010-01-19 2023-09-27 Dolby International AB Improved subband block based harmonic transposition
JP5854520B2 (ja) * 2010-03-09 2016-02-09 フラウンホーファーゲゼルシャフトツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. オーディオ信号用の位相ボコーダに基づく帯域幅拡張方法における改善された振幅応答及び時間的整列のための装置及び方法
US8886523B2 (en) * 2010-04-14 2014-11-11 Huawei Technologies Co., Ltd. Audio decoding based on audio class with control code for post-processing modes
IL311020A (en) 2010-07-02 2024-04-01 Dolby Int Ab After–selective bass filter
PL2596497T3 (pl) * 2010-07-19 2014-10-31 Dolby Int Ab Przetwarzanie sygnałów audio podczas rekonstrukcji wysokiej częstotliwości
TWI476761B (zh) 2011-04-08 2015-03-11 Dolby Lab Licensing Corp 用以產生可由實施不同解碼協定之解碼器所解碼的統一位元流之音頻編碼方法及系統
EP3054446B1 (en) * 2013-01-29 2023-08-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for providing an encoded audio information, method for providing a decoded audio information, computer program and encoded representation using a signal-adaptive bandwidth extension
BR112015017748B1 (pt) * 2013-01-29 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Preenchimento de ruído na codificação de áudio de transformada perceptual
KR102329309B1 (ko) 2013-09-12 2021-11-19 돌비 인터네셔널 에이비 Qmf 기반 처리 데이터의 시간 정렬
EP2881943A1 (en) * 2013-12-09 2015-06-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal with low computational resources
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
TWI693594B (zh) 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI807562B (zh) * 2017-03-23 2023-07-01 瑞典商都比國際公司 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合
TWI809289B (zh) * 2018-01-26 2023-07-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
CN114242089A (zh) * 2018-04-25 2022-03-25 杜比国际公司 具有减少后处理延迟的高频重建技术的集成

Also Published As

Publication number Publication date
KR20220054712A (ko) 2022-05-03
EA202191156A1 (ru) 2021-08-31
PE20191288A1 (es) 2019-09-20
ZA202007510B (en) 2022-04-28
CA3171733A1 (en) 2018-09-27
MX2022009313A (es) 2023-01-19
MX2022015198A (es) 2023-01-04
KR20200022547A (ko) 2020-03-03
US11763830B2 (en) 2023-09-19
CO2019008431A2 (es) 2019-08-20
NZ787839A (en) 2023-12-22
EA038268B1 (ru) 2021-08-02
JP6665354B2 (ja) 2020-03-13
SG11201906370TA (en) 2019-08-27
CA3171727A1 (en) 2018-09-27
KR20240008408A (ko) 2024-01-18
BR122019027754B1 (pt) 2020-08-18
TW201835897A (zh) 2018-10-01
JP2023181209A (ja) 2023-12-21
IL267666B (en) 2020-04-30
MX2020005844A (es) 2020-09-07
AU2018237070B2 (en) 2019-09-12
EA036090B1 (ru) 2020-09-25
JP2022003420A (ja) 2022-01-11
KR102275129B1 (ko) 2021-07-09
KR102390360B1 (ko) 2022-04-26
IL272690A (en) 2020-04-30
AR115947A2 (es) 2021-03-17
CN110178180A (zh) 2019-08-27
KR102083768B1 (ko) 2020-03-02
US11605391B2 (en) 2023-03-14
US20230051379A1 (en) 2023-02-16
ZA202109047B (en) 2023-06-28
TWI807562B (zh) 2023-07-01
US20230042393A1 (en) 2023-02-09
TW202341126A (zh) 2023-10-16
UA126401C2 (uk) 2022-09-28
CA3049600C (en) 2021-12-07
CN110178180B (zh) 2020-12-29
EA201991453A1 (ru) 2019-11-29
IL296961B1 (en) 2023-12-01
CA3133921A1 (en) 2018-09-27
WO2018175347A1 (en) 2018-09-27
KR20230160960A (ko) 2023-11-24
CL2019001981A1 (es) 2019-10-18
JP2020503566A (ja) 2020-01-30
IL272690B2 (en) 2023-03-01
US20230036258A1 (en) 2023-02-02
US20230377589A1 (en) 2023-11-23
IL296961B2 (en) 2024-04-01
ZA201904559B (en) 2022-05-25
KR20210088012A (ko) 2021-07-13
MA47232A (fr) 2019-10-30
IL272690B (en) 2022-11-01
AU2021215249B2 (en) 2023-02-02
NZ759800A (en) 2021-07-30
US20230041798A1 (en) 2023-02-09
GEP20217226B (en) 2021-02-25
JP7413334B2 (ja) 2024-01-15
ZA202211731B (en) 2024-02-28
US11626123B2 (en) 2023-04-11
US11676616B2 (en) 2023-06-13
KR102622804B1 (ko) 2024-01-10
KR20190085144A (ko) 2019-07-17
CA3133923A1 (en) 2018-09-27
AU2023200619B2 (en) 2023-08-17
CN112863528A (zh) 2021-05-28
MX2019008349A (es) 2019-09-16
AU2018237070A1 (en) 2019-08-01
AU2023200619A1 (en) 2023-03-09
MX2022015200A (es) 2023-01-05
TW202215418A (zh) 2022-04-16
ECSP19054232A (es) 2019-08-30
BR112019014125B1 (pt) 2021-11-16
IL305626B1 (en) 2024-02-01
US11621013B2 (en) 2023-04-04
US20200027471A1 (en) 2020-01-23
AU2021215249A1 (en) 2021-09-02
US20210104252A1 (en) 2021-04-08
AR120464A2 (es) 2022-02-16
IL267666A (en) 2019-08-29
EP3559821A4 (en) 2020-10-28
NZ755366A (en) 2019-12-20
EA202091313A1 (ru) 2020-09-30
ZA202109045B (en) 2023-04-26
UA126719C2 (uk) 2023-01-11
IL305626A (en) 2023-11-01
MX2022009312A (es) 2022-08-18
NZ777923A (en) 2023-12-22
AR111047A1 (es) 2019-05-29
PH12019501658A1 (en) 2020-03-02
IL310208A (en) 2024-03-01
AU2023266360A1 (en) 2023-12-07
AR120465A2 (es) 2022-02-16
US10818306B2 (en) 2020-10-27
TWI752166B (zh) 2022-01-11
MX2022015199A (es) 2023-01-05
IL296961A (en) 2022-12-01
AR120467A2 (es) 2022-02-16
AU2019222906B2 (en) 2021-05-20
SA519402434B1 (ar) 2023-02-01
EP3559821A1 (en) 2019-10-30
AR120466A2 (es) 2022-02-16
JP2020074052A (ja) 2020-05-14
AU2019222906A1 (en) 2019-09-19
CN112863527A (zh) 2021-05-28
BR112019014125A2 (pt) 2019-12-17
CA3049600A1 (en) 2018-09-27
ZA202109046B (en) 2023-04-26

Similar Documents

Publication Publication Date Title
US9478224B2 (en) Audio processing system
CN111656444B (zh) 用于音频信号的高频重建技术的回溯兼容集成
UA126393C2 (uk) Зворотно сумісне компонування гармонічного транспозера для реконструкції високих частот звукових сигналів
EA044947B1 (ru) Обратно совместимая компоновка гармонического транспозера для реконструкции высоких частот звуковых сигналов