RU2407070C2 - Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала - Google Patents

Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала Download PDF

Info

Publication number
RU2407070C2
RU2407070C2 RU2008136185/09A RU2008136185A RU2407070C2 RU 2407070 C2 RU2407070 C2 RU 2407070C2 RU 2008136185/09 A RU2008136185/09 A RU 2008136185/09A RU 2008136185 A RU2008136185 A RU 2008136185A RU 2407070 C2 RU2407070 C2 RU 2407070C2
Authority
RU
Russia
Prior art keywords
information
audio signal
channel
signal
objects
Prior art date
Application number
RU2008136185/09A
Other languages
English (en)
Other versions
RU2008136185A (ru
Inventor
Сунг Йонг ЙООН (KR)
Сунг Йонг ЙООН
Хее Сук ПАНГ (KR)
Хее Сук ПАНГ
Хиун Коок ЛИ (KR)
Хиун Коок ЛИ
Донг Соо КИМ (KR)
Донг Соо КИМ
Дзае Хиун ЛИМ (KR)
Дзае Хиун ЛИМ
Original Assignee
ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭлДжи ЭЛЕКТРОНИКС ИНК. filed Critical ЭлДжи ЭЛЕКТРОНИКС ИНК.
Publication of RU2008136185A publication Critical patent/RU2008136185A/ru
Application granted granted Critical
Publication of RU2407070C2 publication Critical patent/RU2407070C2/ru

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

Изобретение относится к способам и устройства, предназначенным для кодирования и декодирования звукового сигнала, и более конкретно, к способам и устройствам для кодирования и декодирования объектно-ориентированного звукового сигнала. Способ декодирования объектно-ориентированного звукового сигнала включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование звукового сигнала объектов с использованием сигнала понижающего микширования и информации о параметрах объектов и генерирование звукового сигнала объектов с трехмерными (3D) эффектами посредством применения 3D информации к звуковому сигналу объектов. Соответственно, можно локализировать звуковой образ для каждого звукового сигнала объектов. Технический результат - возможность обеспечивать отчетливый эффект присутствия во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из объектно-ориентированных звуковых сигналов. 7 н. и 19 з.п. ф-лы, 9 ил.

Description

Область техники, к которой относится изобретение
Настоящее изобретение относится к способам и устройствам, предназначенным для кодирования и декодирования звукового сигнала, и более конкретно, к способам и устройствам для кодирования и декодирования звукового сигнала, которые могут локализовать звуковой образ в требуемом положении в пространстве для каждого звукового сигнала объекта.
Уровень техники
В общем, согласно обычному способу кодирования объектно-ориентированного звукового сигнала устройство кодирования объектов генерирует сигнал сведения фонограммы посредством сведения фонограммы из множества звуковых сигналов объектов и генерирует информацию о параметрах, включающую в себя множество порций информации, выделяемой из звуковых сигналов объектов. Согласно обычному способу декодирования объектно-ориентированного звукового сигнала устройство декодирования объектов восстанавливает множество звуковых сигналов объектов посредством декодирования принимаемого сигнала сведения фонограммы с использованием информации о параметрах объектов, а устройство рендеринга (в контексте настоящей заявки под рендерингом подразумевается создание эффекта «трехмерности» звукового сигнала) синтезирует звуковые сигналы объектов в 2-канальный сигнал или многоканальный сигнал, используя управляющие данные, которые необходимы для обозначения положений восстанавливаемых звуковых сигналов объектов.
Однако управляющие данные представляют собой всего лишь межуровневую информацию, и существует четкое ограничение в создании 3D эффектов путем локализации звукового образа посредством простого использования информации об уровнях громкости.
Раскрытие изобретения
Настоящее изобретение обеспечивает способы и устройства, предназначенные для кодирования и декодирования звукового сигнала, которые могут локализировать звуковой образ в требуемом положении в пространстве для каждого звукового сигнала объекта.
В соответствии с аспектом настоящего изобретения, предусмотрен способ декодирования звукового сигнала. Способ включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование звукового сигнала объектов с использованием сигнала сведения фонограммы и информации о параметрах объектов и генерирование звукового сигнала объектов с трехмерными (3D) эффектами посредством применения 3D информации к звуковому сигналу объектов.
В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство декодирования объектов, которое генерирует звуковой сигнал объектов с использованием сигнала сведения фонограммы и информации о параметрах объектов, и устройство рендеринга, которое генерирует трехмерный звуковой сигнал объектов с 3D эффектами посредством применения 3D информации к звуковому сигналу объектов.
В соответствии с другим аспектом настоящего изобретения, предусмотрен способ декодирования звукового сигнала. Способ включает в себя выделение сигнала сведения фонограммы и информации о параметрах объектов из входного звукового сигнала, генерирование информации о параметрах каналов посредством преобразования информации о параметрах объектов, генерирование звукового сигнала с использованием сигнала сведения фонограммы и информации о параметрах объектов и генерирование звукового сигнала с 3D эффектами посредством применения 3D информации к звуковому сигналу.
В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство рендеринга, которое извлекает 3D информацию с использованием индексных данных и выводит 3D информацию, транскодер, который генерирует информацию о параметрах каналов с использованием информации о параметрах объектов и 3D информации, и многоканальное устройство декодирования, которое генерирует звуковой сигнал с использованием сигнала сведения фонограммы и информации о параметрах каналов и генерирует звуковой сигнал с 3D эффектами посредством применения 3D информации к звуковому сигналу.
В соответствии с другим аспектом настоящего изобретения, предусмотрено устройство для декодирования звукового сигнала. Устройство включает в себя демультиплексор, который выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного звукового сигнала, устройство рендеринга, которое извлекает 3D информацию с использованием входных индексных данных и выводит 3D информацию, транскодер, который преобразовывает информацию о параметрах объектов в информацию о параметрах каналов, преобразовывает 3D информацию в 3D информацию о каналах и выводит информацию о параметрах каналов и 3D информацию о каналах, и многоканальное устройство декодирования, которое генерирует звуковой сигнал с использованием сигнала сведения фонограммы и информации о параметрах каналов и генерирует звуковой сигнал с 3D эффектами посредством применения к звуковому сигналу 3D информации о каналах.
В соответствии с другим аспектом настоящего изобретения, предусмотрен способ кодирования звукового сигнала. Способ включает в себя генерирование сигнала сведения фонограммы посредством сведения фонограммы звукового сигнала объектов, выделение информации относительно звукового сигнала объектов и генерирование информации о параметрах объектов, основанной на выделяемой информации, и введение индексных данных в информацию о параметрах объектов, причем индексные данные являются необходимыми для поиска 3D информации, которая используется для создания 3D эффектов для звукового сигнала объектов.
В соответствии с другим аспектом настоящего изобретения, предусмотрен машиночитаемый носитель, на котором записана программа для выполнения одного из вышеупомянутых способов.
Как описано выше, в соответствии с настоящим изобретением, можно обеспечить более отчетливый эффект присутствия, чем при обычных способах кодирования и декодирования объектно-ориентированного звукового сигнала во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из звуковых сигналов объектов, в то же время максимально используя обычные способы кодирования и декодирования объектно-ориентированного звукового сигнала. Кроме того, можно создавать высококачественную виртуальную реальность путем применения настоящего изобретения в интерактивных играх, в которых часто изменяется информация о расположении игровых персонажей, управляемых игроками через сеть.
Краткое описание чертежей
Фиг. 1 представляет собой блок-схему обычного устройства кодирования объектно-ориентированного звукового сигнала;
фиг. 2 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с вариантом выполнения настоящего изобретения;
фиг. 3 представляет собой блок-схему процесса, иллюстрирующую функционирование устройства, показанного на фиг. 2;
фиг. 4 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения;
фиг. 5 представляет собой блок-схему процесса, иллюстрирующую функционирование устройства, показанного на фиг. 4;
фиг. 6 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения;
фиг. 7 иллюстрирует применение трехмерной (3D) информации к кадрам с помощью устройства, иллюстрируемого на фиг. 6;
фиг. 8 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения; и
фиг. 9 представляет собой блок-схему устройства для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения.
Осуществление изобретения
Настоящее изобретение в дальнейшем будет описано более подробно со ссылкой на сопровождающие чертежи, на которых показаны примерные варианты выполнения изобретения.
Способы и устройства, предназначенные для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением, можно применять к процессам кодирования и декодирования объектно-ориентированного звукового сигнала, но не ограничиваясь этим. Другими словами, способы и устройства, предназначенные для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением, также можно применять к различным операциям обработки сигналов, отличающимся от тех, что были сформулированы в данном описании, до тех пор, пока операции обработки сигналов удовлетворяют нескольким условиям. Способы и устройства для кодирования и декодирования звукового сигнала в соответствии с настоящим изобретением могут локализировать звуковые образы звуковых сигналов объектов в требуемых положениях в пространстве посредством применения трехмерной (3D) информации, такой как функция моделирования восприятия звука (HRTF), к звуковым сигналам объектов.
Фиг. 1 иллюстрирует обычное устройство кодирования объектно-ориентированного звукового сигнала. Что касается фиг. 1, то на ней устройство кодирования объектно-ориентированного звукового сигнала включает в себя устройство 110 кодирования объектов и генератор 120 битового потока.
Устройство 110 кодирования объектов принимает N звуковых сигналов объектов и генерирует объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов, включающую в себя множество порций информации, выделяемых из N звуковых сигналов объектов. Множество порций информации могут быть значениями разности и корреляции энергии.
Генератор 120 битового потока генерирует битовый поток, объединяя объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов, генерируемую устройством 110 кодирования объектов. Битовый поток, генерируемый генератором 120 битового потока, может включать в себя стандартные значения параметров смешивания, необходимые для стандартной настройки для декодирующего устройства. Стандартные значения параметров смешивания могут включать в себя индексные данные, необходимые для поиска 3D информации, такой как HRTF, которая может использоваться для создания 3D эффектов.
Фиг. 2 иллюстрирует устройство, предназначенное для декодирования звукового сигнала в соответствии с вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 2, может быть разработано посредством объединения концепции, основанной на HRTF стереофонической 3D локализации с обычным способом объектно-ориентированного кодирования. HRTF представляет собой функцию преобразования, которая описывает передачу звуковых волн между источником звука в произвольном положении и барабанной перепонкой, и возвращает значение, которое изменяется в соответствии с направлением и выстой источника звука. Если сигнал без направленности фильтруется с использованием HRTF, сигнал можно слышать, как будто он воспроизводится с некоторого направления.
Рассмотрим фиг. 2, на которой устройство включает в себя демультиплексор 130, устройство 140 декодирования объектов, устройство 150 визуализации и базу 160 данных 3D информации.
Демультиплексор 130 выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного битового потока. Устройство 140 декодирования объектов генерирует звуковой сигнал объектов на основании сигнала сведения фонограммы и информации о параметрах объектов. База 160 данных 3D информации представляет собой базу данных, которая хранит 3D информацию, такую как HRTF, и ищет и выводит 3D информацию, соответствующую входным индексным данным. Устройство 150 рендеринга генерирует 3D сигнал с использованием звукового сигнала объектов, генерируемого устройством 140 декодирования объектов, и 3D информации, выводимой базой 160 данных 3D информации.
Фиг. 3 иллюстрирует функционирование устройства, иллюстрируемого на фиг. 2. Рассмотрим фиг. 2 и 3, на которых, когда принимается (S170) битовый поток, передаваемый устройством для кодирования звукового сигнала, из этого битового потока демультиплексор 130 выделяет (S172) сигнал сведения фонограммы и информацию о параметрах объектов. Устройство 140 декодирования объектов генерирует (S174) звуковой сигнал объектов, используя сигнал сведения фонограммы и информацию о параметрах объектов.
Устройство 150 рендеринга извлекает (S176) 3D информацию из базы 160 данных 3D информации, используя индексные данные, включенные в управляющие данные, которые необходимы для обозначения расположений звуковых сигналов объектов. Устройство 150 рендеринга генерирует 3D сигнал с 3D эффектами, выполняя (S178) операцию 3D рендеринга с использованием звукового сигнала объектов, обеспечиваемого устройством 140 декодирования объектов, и 3D информации, обеспечиваемой базой 160 данных 3D информации.
3D сигнал, генерируемый устройством 150 рендеринга, может быть 2-канальным сигналом с тремя или более направленностями, и таким образом может быть воспроизведен как 3D стереофонический звук с помощью 2-канальных динамиков, таких как наушники. Другими словами, 3D сигнал, генерируемый устройством 150 рендеринга, может быть воспроизведен 2-канальными динамиками так, что пользователь может ощущать, что 3D сигнал сведения фонограммы будто бы воспроизводится из источника звука с тремя или более каналами. Направление источника звука может быть определено на основании по меньшей мере одного из: различия между интенсивностями двух звуковых сигналов, соответственно вводимых в оба уха, интервала времени между двумя звуковыми сигналами и различия между фазами двух звуковых сигналов. Поэтому 3D устройство 150 рендеринга может генерировать 3D сигнал на основании того, как люди могут определять положение источника звука в трехмерном пространстве с помощью слуха.
Устройство для кодирования звукового сигнала может включать в себя индексные данные, необходимые для извлечения 3D информации в информации о стандартных значениях параметров смешивания для стандартной настройки. В этом случае, устройство 150 рендеринга может извлекать 3D информацию из базы 160 данных 3D информации, используя индексные данные, включенные в информацию о стандартных значениях параметров смешивания.
Устройство для кодирования звукового сигнала может включать в управляющие данные индексные данные, которые необходимы для поиска 3D информации, такой как HRTF, которая может использоваться для создания 3D эффектов для сигнала объекта. Другими словами, информация о параметрах смешивания, включенная в управляющие данные, используемые устройством для кодирования звукового сигнала, может включать в себя не только информацию об уровнях громкости, но также и индексные данные, необходимые для поиска 3D информации. Информация о параметрах смешивания может быть информацией о времени, такой как информация о временной разнице между каналами, информацией о расположении, или сочетанием информации об уровнях громкости и информации о синхронизации.
Если имеется множество звуковых сигналов объектов, и 3D эффекты должны быть добавлены к одному или более из множества звуковых сигналов объектов, 3D информация, соответствующая заданным индексным данным, разыскивается и извлекается из базы 160 данных 3D информации, которая хранит 3D информацию, определяющую заданные положения звуковых сигналов объектов, к которым должны быть добавлены 3D эффекты. Затем 3D устройство 150 рендеринга выполняет операцию 3D рендеринга с использованием извлеченной 3D информации так, чтобы можно было создавать 3D эффекты. 3D информация относительно всех сигналов объектов может использоваться как информация о параметрах смешивания. Если 3D информация применяется только к нескольким сигналам объектов, информация об уровнях громкости и информация о времени относительно сигналов объектов, отличающихся от этих нескольких сигналов объектов, также может использоваться в качестве информации о параметрах смешивания.
Фиг. 4 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Что касается фиг. 4, то на ней устройство включает в себя вместо устройства декодирования объектов многоканальное устройство 270 декодирования.
Более конкретно, устройство включает в себя демультиплексор 230, транскодер 240, устройство 250 рендеринга, базу 260 данных 3D информации и многоканальное устройство 270 декодирования.
Демультиплексор 230 выделяет сигнал сведения фонограммы и информацию о параметрах объектов из входного битового потока. Устройство 250 рендеринга определяет положение каждого сигнала объектов в трехмерном пространстве с использованием 3D информации, соответствующей индексным данным, включенным в управляющие данные. Транскодер 230 генерирует информацию о параметрах каналов посредством синтезирования информации о параметрах объектов и 3D информации о положении каждого звукового сигнала объектов, обеспечиваемых устройством 250 рендеринга. Многоканальное устройство 270 декодирования генерирует 3D сигнал с использованием сигнала сведения фонограммы, обеспечиваемого демультиплексором 230, и информации о параметрах каналов, обеспечиваемой транскодером 230.
Фиг. 5 иллюстрирует функционирование устройства, иллюстрируемого на фиг. 4. Что касается фиг. 4 и 5, то на них устройство принимает (S280) битовый поток. Демультиплексор 230 выделяет (S282) объектно-ориентированный сигнал сведения фонограммы и информацию о параметрах объектов из принимаемого битового потока. Устройство 250 рендеринга выделяет индексные данные, включенные в управляющие данные, которые используются для определения положений звуковых сигналов объектов, и извлекает (S284) 3D информацию, соответствующую индексным данным, из базы 260 данных 3D информации. Положения звуковых сигналов объектов, исходно определенные информацией о стандартных параметрах смешивания, могут быть изменены посредством определения 3D информации, соответствующей требуемым положениям звуковых сигналов объектов, используя управляющие данные смешивания.
Транскодер 230 генерирует (S286) информацию о параметрах каналов относительно М каналов, синтезируя информацию о параметрах объектов относительно сигналов N объектов, которые передаются устройством для кодирования звукового сигнала, и 3D информацию о расположении каждого из сигналов объектов, который получен с использованием 3D информации, такой как HRTF, с помощью устройства 250 рендеринга.
Многоканальное устройство 270 декодирования генерирует звуковой сигнал с использованием объектно-ориентированного сигнала сведения фонограммы, обеспечиваемого демультиплексором 230, и информации о параметрах каналов, обеспечиваемой транскодером 230, и генерирует многоканальный сигнал посредством выполнения (S290) операции 3D рендеринга на звуковом сигнале с использованием 3D информации, включенной в информацию о параметрах каналов.
Фиг. 6 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 6, отличается от устройства, иллюстрируемого на фиг. 4, тем, что транскодер 440 каналов отдельно передает в многоканальный декодер 470 информацию о параметрах каналов и 3D информацию. Другими словами, транскодер 440, в отличие от транскодера 240, иллюстрируемого на фиг. 4, передает информацию о параметрах каналов относительно М каналов, которая получена с использованием информации о параметрах объектов относительно сигналов N объектов, и 3D информацию, которая применяется к каждому из сигналов N объектов, в многоканальный декодер 470, вместо передачи информации о параметрах каналов, включающей в себя 3D информацию.
Рассмотрим фиг. 7, на которой информация о параметрах каналов и 3D информация имеют свои собственные данные индексов кадров. Таким образом, многоканальное устройство 470 декодирования может применять 3D информацию к заданному кадру битового потока посредством синхронизирования информации о параметрах каналов и 3D информации с использованием индексов кадров информации о параметрах каналов и 3D информации. Например, что касается фиг. 7, то на ней 3D информация, соответствующая индексу 2, может применяться к началу кадра 2, имеющего индекс 2.
Даже если 3D информация обновляется с течением времени, возможно определить, где в информации о параметрах каналов следует применять 3D информацию, ссылаясь на индекс кадра 3D информации. Другими словами, транскодер 440 может вводить информацию об индексе кадра в информацию о параметрах каналов и 3D информацию, соответственно, для того, чтобы многоканальное устройство 470 декодирования синхронизировало во времени информацию о параметрах каналов и 3D информацию.
Фиг. 8 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 8, отличается от устройства, иллюстрируемого на фиг. 6, тем, что иллюстрируемое на фиг. 8 устройство дополнительно включает в себя устройство 543 предварительной обработки и устройство 580 обработки эффектов в дополнение к демультиплексору 530, транскодеру 547, устройству 550 рендеринга и базе 560 данных 3D информации, и тем, что база 560 данных 3D информации включена в устройство 550 рендеринга.
Более конкретно, структура и функции демультиплексора 530, транскодера 547, устройства 550 рендеринга, базы 560 данных 3D информации и многоканального устройства 570 декодирования являются такими же, как структура и функции их соответствующих аналогов, иллюстрируемых на фиг. 6. Что касается фиг. 8, то на ней устройство 580 обработки эффектов может добавлять заданный эффект к сигналу сведения фонограммы. Устройство 543 предварительной обработки может выполнять действие предварительной обработки, например, на стереофоническом сигнале сведения фонограммы, таким образом, чтобы положение стереофонического сигнала сведения фонограммы можно было регулировать. База 560 данных 3D информации может быть включена в устройство 550 рендеринга.
Фиг. 9 иллюстрирует устройство для декодирования звукового сигнала в соответствии с другим вариантом выполнения настоящего изобретения. Устройство, иллюстрируемое на фиг. 9, отличается от устройства, иллюстрируемого на фиг. 8, тем, что модуль 680 генерирования 3D сигнала разделен на многоканальное устройство 670 декодирования и запоминающее устройство 675. Что касается фиг. 9, то на ней многоканальное устройство 670 декодирования копирует 3D информацию, которая хранится в пассивном запоминающем устройстве многоканального декодера 670, в запоминающее устройство 675, и запоминающее устройство 675 осуществляет операцию 3D рендеринга с использованием этой 3D информации. 3D информация, скопированная в запоминающее устройство 675, может обновляться с помощью 3D информации, выводимой транскодером 647. Поэтому можно генерировать 3D сигнал с использованием требуемой 3D информации без каких-либо модификаций в структуре многоканального устройства 670 декодирования.
Настоящее изобретение может быть осуществлено в виде машиночитаемого кода, записанного на машиночитаемом носителе. Машиночитаемым носителем может быть запоминающее устройство любого типа, в котором данные хранятся в машиночитаемой форме. Примеры машиночитаемого носителя включают в себя ПЗУ (постоянное запоминающее устройство), ОЗУ (оперативное запоминающее устройство), CD-ROM (неперезаписываемый компакт-диск), магнитную ленту, гибкий диск, оптическое запоминающее устройство для данных и несущую волну (например, передачу данных через Интернет). Машиночитаемый носитель можно распределять через множество связанных с сетью компьютерных систем так, чтобы записывать в них машиночитаемый код и выполнять его на них в децентрализованном виде. Функциональные программы, код и сегменты кода, необходимые для осуществления настоящего изобретения, могут быть легко истолкованы специалистами в данной области техники.
Другие варианты осуществления находятся в пределах объема последующей формулы изобретения.
Промышленная применимость
Настоящее изобретение можно применять к различным процессам декодирования объектно-ориентированных звуковых сигналов, и оно может обеспечивать отчетливый эффект присутствия во время воспроизведения звуковых сигналов объектов посредством локализирования звукового образа для каждого из объектно-ориентированных звуковых сигналов.

Claims (26)

1. Способ декодирования аудиосигнала, содержащий этапы, на которых:
выделяют сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
генерируют аудиосигнал объектов с использованием сигнала понижающего микширования и информации об объектно-ориентированных параметрах;
извлекают 3D-информацию, используя индексные данные, из базы данных 3D; и
генерируют аудиосигнал объектов с трехмерными (3D) эффектами посредством применения 3D-инфopмaции к аудиосигналу объектов.
2. Способ по п.1, в котором 3D-инфopмaция представляет собой информацию функции моделирования восприятия звука (HRTF).
3. Способ по п.1, в котором индексные данные включены в данные управления, используемые для воспроизведения аудиосигнала объектов.
4. Способ по п.3, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.
5. Способ по п.3, дополнительно содержащий этап, на котором воспроизводят аудиосигнал объектов с использованием данных управления.
6. Способ по п.1, в котором индексные данные включены в информацию о заданных по умолчанию параметрах микширования, которая включена в информацию об объектно-ориентированных параметрах.
7. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, который выделяет сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
декодер объектов, который генерирует аудиосигнал объектов с использованием сигнала понижающего микширования и информации об объектно-ориентированных параметрах;
базу данных 3D, которая хранит 3D-информацию; и
устройство воспроизведения, которое извлекает 3D-информацию, используя индексные данные, из базы данных 3D и генерирует трехмерный аудиосигнал объектов с 3D-эффектами посредством применения 3D-информации к аудиосигналу объектов.
8. Устройство по п.7, в котором 3D-информация представляет собой информацию функции моделирования восприятия звука (HRTF).
9. Устройство по п.7, в котором индексные данные включены в данные управления, используемые для воспроизведения аудиосигнала объектов.
10. Устройство по п.9, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.
11. Способ декодирования аудиосигнала, содержащий этапы, на которых:
выделяют сигнал понижающего микширования, сгенерированный посредством понижающего микширования, по меньшей мере, одного сигнала объектов, и информацию об объектно-ориентированных параметрах, определенную при генерации сигнала понижающего микширования, из входного аудиосигнала;
принимают данные управления для управления, по меньшей мере, одним сигналом объектов;
извлекают 3D-информацию, используя индексные данные, из базы данных 3D;
генерируют информацию об основанных на каналах параметрах с использованием информации об объектно-ориентированных параметрах и данных управления; и
генерируют аудиосигнал с 3D-эффектами с использованием сигнала понижающего микширования, информации об основанных на каналах параметрах и 3D-информации.
12. Способ по п.11, в котором 3D-информация представляет собой информацию HRTF.
13. Способ по п.11, в котором индексные данные включены в данные управления.
14. Способ по п.11, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.
15. Способ по п.11, дополнительно содержащий этап, на котором добавляют предопределенный эффект к сигналу понижающего микширования.
16. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, выделяющий из входного аудиосигнала сигнал понижающего микширования, сгенерированный посредством понижающего микширования, по меньшей мере, одного сигнала объектов, и информацию об объектно-ориентированных параметрах, определенную при генерации сигнала понижающего микширования;
устройство воспроизведения, конфигурированное для
приема данных управления для управления уровнем или расположением,
по меньшей мере, одного сигнала объектов;
выделения индексных данных, включенных в данные управления;
извлечения 3D-информации, используя индексные данные, из базы данных 3D; и
вывода 3D-информации;
транскодер, генерирующий информацию об основанных на каналах параметрах посредством синтезирования информации об объектно-ориентированных параметрах и 3D-информации; и
многоканальный декодер, генерирующий аудиосигнал с 3D-эффектами посредством выполнения операции 3D-воспроизведения над сигналом понижающего микширования с использованием информации об основанных на каналах параметрах.
17. Устройство по п.16, в котором 3D-информация представляет собой информацию HRTF.
18. Устройство по п.16, дополнительно содержащее процессор эффектов, который добавляет предопределенный эффект к сигналу понижающего микширования.
19. Устройство по п.16, в котором данные управления содержат, по меньшей мере, одно из информации о межканальных уровнях, информации о межканальной синхронизации, информации о расположении и комбинации информации о межканальных уровнях и информации о синхронизации.
20. Устройство для декодирования аудиосигнала, содержащее:
демультиплексор, который выделяет сигнал понижающего микширования и информацию об объектно-ориентированных параметрах из входного аудиосигнала;
базу данных 3D, которая хранит 3D-информацию;
устройство воспроизведения, которое принимает данные управления для управления, по меньшей мере, одним сигналом объектов, извлекает 3D-информацию, используя входные индексные данные, из базы данных 3D и выводит 3D-информацию;
транскодер, который преобразует информацию об объектно-ориентированных параметрах в информацию об основанных на каналах параметрах, преобразует 3D-информацию в основанную на каналах 3D-информацию и выводит информацию об основанных на каналах параметрах и основанную на каналах 3D-информацию; и
многоканальный декодер, который генерирует аудиосигнал с 3D-эффектами посредством выполнения операции 3D-воспроизведения над сигналом понижающего микширования с использованием информации об основанных на каналах параметрах и основанной на каналах 3D-информации.
21. Устройство по п.20, в котором многоканальный декодер содержит запоминающее устройство, которое хранит 3D-информацию, обычно используемую для генерирования аудиосигнала с 3D-эффектами.
22. Устройство по п.21, в котором 3D-информация, хранящаяся в запоминающем устройстве, обновляется с помощью основанной на каналах 3D-информации.
23. Устройство по п.20, в котором индексные данные включены в данные управления микшированием, используемые для воспроизведения аудиосигнала объектов.
24. Устройство по п.20, в котором информация об основанных на каналах параметрах и основанная на каналах 3D-информация содержат индексную информацию для синхронизации информации об основанных на каналах параметрах с основанной на каналах 3D-информацией.
25. Машиночитаемый носитель, на котором сохранена программа для осуществления способа по п.1.
26. Машиночитаемый носитель, на котором сохранена программа для осуществления способа по п.11.
RU2008136185/09A 2006-02-09 2007-02-09 Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала RU2407070C2 (ru)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US77147106P 2006-02-09 2006-02-09
US60/771,471 2006-02-09
US77333706P 2006-02-15 2006-02-15
US60/773,337 2006-02-15
US60/880,714 2007-01-17
US88094207P 2007-01-18 2007-01-18
US60/880,942 2007-01-18

Publications (2)

Publication Number Publication Date
RU2008136185A RU2008136185A (ru) 2010-03-20
RU2407070C2 true RU2407070C2 (ru) 2010-12-20

Family

ID=42136822

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008136185/09A RU2407070C2 (ru) 2006-02-09 2007-02-09 Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала

Country Status (1)

Country Link
RU (1) RU2407070C2 (ru)

Also Published As

Publication number Publication date
RU2008136185A (ru) 2010-03-20

Similar Documents

Publication Publication Date Title
AU2007212873B2 (en) Method for encoding and decoding object-based audio signal and apparatus thereof
US20090177479A1 (en) Method for Encoding and Decoding Object-Based Audio Signal and Apparatus Thereof
EP1416769B1 (en) Object-based three-dimensional audio system and method of controlling the same
JP5688030B2 (ja) 三次元音場の符号化および最適な再現の方法および装置
JP7014176B2 (ja) 再生装置、再生方法、およびプログラム
US7912566B2 (en) System and method for transmitting/receiving object-based audio
CN106104680B (zh) 将音频信道插入到声场的描述中
TW201810249A (zh) 使用近場/遠場渲染之距離聲相偏移
BR112020000759A2 (pt) aparelho para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, método para gerar uma descrição aprimorada de campo sonoro, método para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, programa de computador, descrição aprimorada de campo sonoro
KR20090104674A (ko) 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
US11570569B2 (en) Associated spatial audio playback
JP2007158527A (ja) 信号処理装置、信号処理方法、再生装置、記録装置
WO2022014326A1 (ja) 信号処理装置および方法、並びにプログラム
JP2009071406A (ja) 波面合成信号変換装置および波面合成信号変換方法
CN114915874A (zh) 音频处理方法、装置、设备、介质及程序产品
WO2020153027A1 (ja) オーディオシステム、オーディオ再生装置、サーバー装置、オーディオ再生方法及びオーディオ再生プログラム
RU2407070C2 (ru) Способ и устройство кодирования и декодирования объектно-ориентированного звукового сигнала
WO2018150774A1 (ja) 音声信号処理装置及び音声信号処理システム
WO2021124903A1 (ja) 信号処理装置および方法、並びにプログラム
KR102058228B1 (ko) 입체 음향 컨텐츠 저작 방법 및 이를 위한 어플리케이션
CN113632496A (zh) 相关联的空间音频回放
KR20190081163A (ko) 입체 음향 컨텐츠 저작 툴을 이용한 선택적 광고 제공 방법 및 이를 위한 어플리케이션
KR101534295B1 (ko) 멀티 뷰어 영상 및 3d 입체음향 제공방법 및 장치
WO2023085186A1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
US11967329B2 (en) Signaling for rendering tools

Legal Events

Date Code Title Description
MM4A The patent is invalid due to non-payment of fees

Effective date: 20190210