RU2554523C1 - Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных - Google Patents
Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных Download PDFInfo
- Publication number
- RU2554523C1 RU2554523C1 RU2013158064/08A RU2013158064A RU2554523C1 RU 2554523 C1 RU2554523 C1 RU 2554523C1 RU 2013158064/08 A RU2013158064/08 A RU 2013158064/08A RU 2013158064 A RU2013158064 A RU 2013158064A RU 2554523 C1 RU2554523 C1 RU 2554523C1
- Authority
- RU
- Russia
- Prior art keywords
- data
- sound
- speakers
- sound object
- reproducing
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/307—Frequency adjustment, e.g. tone control
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/02—Spatial or constructional arrangements of loudspeakers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/40—Visual indication of stereophonic sound image
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Circuit For Audible Band Transducer (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Input Circuits Of Receivers And Coupling Of Receivers And Audio Equipment (AREA)
Abstract
Изобретение относится к средствам для усовершенствованной авторской разработки и представления трехмерных аудиоданных. Технический результат заключается в уменьшении вычислительной сложности обработки трехмерного звука. Представлены усовершенствованные инструментальные средства для авторской разработки и представления данных звуковоспроизведения. Некоторые указанные инструментальные средства авторской разработки позволяют обобщать данные звуковоспроизведения на широкий выбор воспроизводящих сред. Данные звуковоспроизведения могут авторски разрабатываться путем создания метаданных для звуковых объектов. Метаданные могут создаваться со ссылкой на зоны громкоговорителей. В ходе процесса представления данных данные звуковоспроизведения могут воспроизводиться в соответствии со схемой расположения воспроизводящих громкоговорителей конкретной воспроизводящей среды. 6 н. и 36 з.п. ф-лы, 47 ил.
Description
ПЕРЕКРЕСТНАЯ ССЫЛКА НА РОДСТВЕННЫЕ ЗАЯВКИ
[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №61/504005, поданной 1 июля 2011 г., и предварительной заявки на патент США №61/636102, поданной 20 апреля 2012 г., обе заявки с сылкой включаются в данное раскрытие полностью во всех отношениях.
ОБЛАСТЬ ТЕХНИЧЕСКОГО ПРИМЕНЕНИЯ
[0002] Данное раскрытие относится к авторской разработке и представлению данных звуковоспроизведения. В частности, данное раскрытие относится к авторской разработке и представлению данных звуковоспроизведения для таких воспроизводящих сред, как системы звуковоспроизведения для кинематографии.
ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯ
[0003] С момента представления в 1927 г. звука на пленке происходило устойчивое развитие технологии, используемой для захвата авторского замысла звуковой дорожки кинокартины и для ее проигрывания в среде кинематографии. В 1930-е гг. синхронизированный звук на диске уступил место переменной области звука на пленке, которая в дальнейшем развивалась в 1940-е гг. вместе с соображениями акустики для театров и совершенствования конструкции громкоговорителей наряду с первыми представлениями многодорожечной записи и управляемого проигрывания (с использованием управляющих тонов для перемещения звуков). В 1950-е и 1960-е гг. нанесение магнитной дорожки на пленку сделало возможным многоканальное воспроизведение в театре, введение окружающих каналов и до пяти экранных каналов в театрах высокого класса.
[0004] В 1970-е гг. Dolby представила шумоподавление как при компоновке кинопродукции, так и на пленке наряду с экономичными средствами кодирования и распространения микшированных звуковых дорожек с тремя экранными каналами и монофоническим окружающим каналом. Качество кинематографического звука было дополнительно улучшено в 1980-е гг. шумоподавлением Dolby Spectral Recording (SR) и такими программами аттестации, как THX. В ходе 1990-х гг. Dolby привнесла в кинематографию цифровой звук с форматом каналов 5.1, который предусматривает отдельные левый, центральный и правый экранные каналы, левый и правый окружающие массивы и сверхнизкочастотный канал для низкочастотных эффектов. Dolby Surround 7.1, представленный в 2010 г., увеличил количество окружающих каналов путем разложения существующих левого и правого окружающих каналов на четыре «зоны».
[0005] По мере того, как увеличивается количество каналов, и схема расположения громкоговорителей переходит от плоского двумерного (2D) массива к трехмерному (3D) массиву, включая возвышение, задача определения местоположения и представления данных для звуков становится все более и более сложной. Были бы желательны усовершенствованные способы авторской разработки и представления аудиоданных.
КРАТКОЕ ОПИСАНИЕ ИЗОБРЕТЕНИЯ
[0006] Некоторые особенности предмета изобретения, описываемые в данном раскрытии, могут быть реализованы в инструментальных средствах для авторской разработки и представления данных звуковоспроизведения. Некоторые из указанных инструментальных средств авторской разработки позволяют обобщать данные звуковоспроизведения на широкий выбор воспроизводящих сред. Согласно некоторым из указанных реализаций, данные звуковоспроизведения могут авторски разрабатываться путем создания метаданных для звуковых объектов. Эти метаданные могут создаваться со ссылкой на зоны громкоговорителей. В ходе процесса представления данных, данные звуковоспроизведения могут воспроизводиться в соответствии со схемой расположения воспроизводящих громкоговорителей для конкретной воспроизводящей среды.
[0007] Некоторые реализации, описываемые в данном раскрытии, предусматривают устройство, которое включает систему интерфейсов и логическую систему. Логическая система может конфигурироваться для приема посредством системы интерфейсов данных звуковоспроизведения, которые содержат один или несколько звуковых объектов и связанные метаданные, и данные воспроизводящей среды. Данные воспроизводящей среды могут содержать указатель количества воспроизводящих громкоговорителей в воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя в пределах воспроизводящей среды. Логическая система может конфигурироваться для представления данных звуковых объектов в одном или нескольких сигналах, подаваемых на громкоговорители, по меньшей мере, частично на основе связанных метаданных и данных воспроизводящей среды, где каждый сигнал, подаваемый на громкоговоритель, соответствует, по меньшей мере, одному воспроизводящему громкоговорителю в пределах воспроизводящей среды. Логическая система может конфигурироваться для вычисления коэффициентов усиления для громкоговорителей, соответствующих местоположениям виртуальных громкоговорителей.
[0008] Воспроизводящая среда может, например, представлять собой среду звуковой системы для кинематографии. Воспроизводящая среда может иметь конфигурацию Dolby Surround 5.1, конфигурацию Dolby Surround 7.1 или конфигурацию окружающего звука Hamasaki 22.2. Данные воспроизводящей среды могут содержать данные схемы расположения воспроизводящих громкоговорителей, указывающие местоположения воспроизводящих громкоговорителей. Данные воспроизводящей среды могут содержать данные зон воспроизводящих громкоговорителей, указывающие области воспроизводящих громкоговорителей и местоположения воспроизводящих громкоговорителей, которые соответствуют областям воспроизводящих громкоговорителей.
[0009] Метаданные могут содержать информацию для присвоения местоположения звукового объекта местоположению единичного воспроизводящего громкоговорителя. Представление данных может включать создание совокупного коэффициента усиления на основе одного или нескольких следующих параметров: требуемого положения звукового объекта, расстояния от требуемого положения звукового объекта до исходного положения, скорости звукового объекта или типа содержимого звукового объекта. Метаданные могут содержать данные для ограничения положения звукового объекта одномерной кривой или двумерной поверхностью. Метаданные могут содержать данные траектории для звукового объекта.
[0010] Представление данных может включать наложение ограничений на зоны громкоговорителей. Например, устройство может содержать систему пользовательского ввода. Согласно некоторым реализациям, представление данных может включать применение управления балансом между экраном и помещением в соответствии с данными управления балансом между экраном и помещением, получаемыми из системы пользовательского ввода.
[0011] Устройство может содержать дисплейную систему. Логическая система может конфигурироваться для управления дисплейной системой с целью демонстрации динамического трехмерного вида воспроизводящей среды.
[0012] Представление данных может включать управление распространением звукового объекта в одном или нескольких из трех измерений. Представление данных может включать динамическое перераспределение объекта в ответ на перегрузку громкоговорителей. Представление данных может включать присвоения местоположений звуковых объектов плоскостям массивов громкоговорителей воспроизводящей среды.
[0013] Устройство может содержать один или несколько постоянных носителей данных, таких как запоминающие устройства системы памяти. Запоминающие устройства могут, например, включать память с произвольным доступом (RAM), постоянное запоминающее устройство (ROM), флеш-память, один или несколько накопителей на жестких магнитных дисках. Система интерфейсов может содержать интерфейс между логической системой и одним или несколькими указанными запоминающими устройствами. Система интерфейсов также может содержать сетевой интерфейс.
[0014] Метаданные могут содержать метаданные ограничения зон громкоговорителей. Логическая система может конфигурироваться для ослабления выбранных сигналов, подаваемых на выбранный громкоговоритель, путем выполнения следующих операций: вычисления первых коэффициентов усиления, которые содержат вклады от выбранных громкоговорителей; вычисление вторых коэффициентов усиления, которые не включают вклады от выбранных громкоговорителей; и смешивания первых коэффициентов усиления со вторыми коэффициентами усиления. Логическая система может конфигурироваться для определения того, применять правила панорамирования для положения звукового объекта или присваивать положение звукового объекта местоположению единичного громкоговорителя. Логическая система может конфигурироваться для плавных переходов между коэффициентами усиления громкоговорителей при переходе от присвоения положения звукового объекта от местоположения первого единичного громкоговорителя в местоположение второго единичного громкоговорителя. Логическая система может конфигурироваться для плавных переходов между коэффициентами усиления громкоговорителей при переходе между присвоением положения звукового объекта местоположению единичного громкоговорителя и применением правил панорамирования к положению звукового объекта. Логическая система может конфигурироваться для вычисления коэффициентов усиления громкоговорителей для положений звукового объекта на одномерной кривой между положениями виртуальных громкоговорителей.
[0015] Некоторые способы, описываемые в данном раскрытии, включают прием данных звуковоспроизведения, которые содержат один или несколько звуковых объектов и связанные метаданные, и прием данных воспроизводящей среды, которые включают указатель количества воспроизводящих громкоговорителей в воспроизводящей среде. Данные воспроизводящей среды могут содержать указатель местоположения каждого воспроизводящего громкоговорителя в пределах воспроизводящей среды. Указанные способы могут включать представление данных звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители, по меньшей мере, частично на основе связанных метаданных. Каждый сигнал, подаваемый на громкоговоритель, может соответствовать, по меньшей мере, одному из воспроизводящих громкоговорителей в пределах воспроизводящей среды. Воспроизводящая среда может представлять собой среду звуковой системы для кинематографии.
[0016] Представление данных может включать создание совокупного коэффициента усиления на основе одного или нескольких параметров: требуемого местоположения звукового объекта, расстояния от требуемого местоположения звукового объекта до исходного положения, скорости звукового объекта или типа содержимого звукового объекта. Метаданные могут включать данные для ограничения местоположения звукового объекта одномерной кривой или двумерной поверхностью. Представление данных может включать наложение ограничений на зоны громкоговорителей.
[0017] Некоторые реализации могут обнаруживаться на одном или нескольких постоянных носителях данных, содержащих хранящееся в их памяти программное обеспечение. Программное обеспечение может содержать команды для управления одним или несколькими устройствами с целью выполнения следующих операций: приема данных звуковоспроизведения, содержащих один или несколько звуковых объектов и связанные метаданные; приема данных воспроизводящей среды, содержащих указатель количества воспроизводящих громкоговорителей в воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя в пределах воспроизводящей среды; и представления данных звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители, по меньшей мере, частично на основе связанных метаданных. Каждый сигнал, подаваемый на громкоговоритель, может соответствовать, по меньшей мере, одному из воспроизводящих громкоговорителей в пределах воспроизводящей среды. Воспроизводящая среда может, например, представлять собой среду звуковой системы для кинематографии.
[0018] Представление данных может включать создание совокупного коэффициента усиления на основе одного или нескольких параметров: требуемого положения звукового объекта, расстояния от требуемого местоположения звукового объекта до исходного положения, скорости звукового объекта или типа содержимого звукового объекта. Метаданные могут содержать данные для ограничения положения звукового объекта одномерной кривой или двумерной поверхностью. Представление данных может включать наложение ограничений на зоны громкоговорителей. Представление данных может включать динамическое перераспределение объекта в ответ на перегрузку громкоговорителей.
[0019] В данном раскрытии описываются и альтернативные устройства. Некоторые такие устройства могут содержать систему интерфейсов, систему пользовательского ввода и логическую систему. Логическая система может конфигурироваться для приема аудиоданных через систему интерфейсов, приема положения звукового объекта через систему пользовательского ввода или систему интерфейсов и определения положения звукового объекта в трехмерном пространстве. Указанное определение может включать ограничение положения одномерной кривой или двумерной поверхностью в пределах трехмерного пространства. Логическая система может конфигурироваться для создания метаданных, связанных со звуковым объектом, по меньшей мере, частично на основе пользовательского ввода, принимаемого через систему пользовательского ввода, при этом метаданные содержат данные, указывающие положение звукового объекта в трехмерном пространстве.
[0020] Метаданные могут содержать данные траектории, указывающие переменное во времени положение звукового объекта в пределах трехмерного пространства. Логическая система может конфигурироваться для вычисления данных траектории в соответствии с пользовательским вводом, принимаемым через систему пользовательского ввода. Данные траектории могут содержать набор положений в пределах трехмерного пространства для нескольких моментов времени. Данные траектории могут содержать исходное положение, данные скорости и данные ускорения. Данные траектории могут содержать исходное положение и уравнение, которое определяет положения в трехмерном пространстве и соответствующие времена.
[0021] Устройство может содержать дисплейную систему. Логическая система может конфигурироваться для управления дисплейной системой с целью демонстрации траектории звукового объекта в соответствии с данными траектории.
[0022] Логическая система может конфигурироваться для создания метаданных ограничения зон громкоговорителей в соответствии с пользовательским вводом, принимаемым через систему пользовательского ввода. Метаданные ограничения зон громкоговорителей могут содержать данные для блокирования выбранных громкоговорителей. Логическая система может конфигурироваться для создания метаданных ограничения зон громкоговорителей путем присвоения положения звукового объекта единичному громкоговорителю.
[0023] Устройство может содержать систему звуковоспроизведения. Логическая система может конфигурироваться для управления системой звуковоспроизведения, по меньшей мере, частично в соответствии с метаданными.
[0024] Положение звукового объекта может ограничиваться одномерной кривой. Логическая система может дополнительно конфигурироваться для создания положений виртуальных громкоговорителей на одномерной кривой.
[0025] В данном раскрытии описываются и альтернативные способы. Некоторые такие способы включают прием аудиоданных, прием положения звукового объекта и определение положения звукового объекта в трехмерном пространстве. Указанное определение может включать ограничение положения одномерной кривой или двумерной поверхностью в пределах трехмерного пространства. Указанные способы могут включать создание метаданных, связанных со звуковым объектом, по меньшей мере, частично на основе пользовательского ввода.
[0026] Метаданные могут содержать данные, указывающие положение звукового объекта в трехмерном пространстве. Метаданные могут содержать данные траектории, указывающие переменное во времени положение звукового объекта в пределах трехмерного пространства. Создание метаданных может включать создание метаданных ограничения зон громкоговорителей, например, в соответствии с пользовательским вводом. Метаданные ограничения зон громкоговорителей могут содержать данные для блокирования выбранных громкоговорителей.
[0027] Положение звукового объекта может ограничиваться одномерной кривой. Указанные способы могут включать создание положений виртуальных громкоговорителей на указанной одномерной кривой.
[0028] Другие особенности данного раскрытия могут реализовываться на одном или нескольких постоянных носителях данных, в памяти которых содержится программное обеспечение. Указанное программное обеспечение может содержать команды для управления одним или несколькими устройствами с целью выполнения следующих операций: приема аудиоданных; приема положения звукового объекта; и определения положения звукового объекта в трехмерном пространстве. Указанное определение может включать ограничение указанного положения одномерной кривой или двумерной поверхностью в пределах трехмерного пространства. Указанное программное обеспечение может содержать команды для управления одним или несколькими устройствами с целью создания метаданных, связанных с указанным звуковым объектом. Метаданные, по меньшей мере, частично основываются на пользовательском вводе.
[0029] Метаданные могут содержать данные, указывающие положение звукового объекта в трехмерном пространстве. Указанные метаданные могут содержать данные траектории, указывающие переменное во времени положение звукового объекта в пределах указанного трехмерного пространства. Создание метаданных может включать создание метаданных ограничения зон громкоговорителей, например, в соответствии с пользовательским вводом. Метаданные ограничения зон громкоговорителей могут содержать данные для блокирования выбранных громкоговорителей.
[0030] Указанное положение звукового объекта может быть ограничено одномерной кривой. Программное обеспечение может содержать команды для управления одним или несколькими устройствами с целью создания положений виртуальных громкоговорителей на указанной одномерной кривой.
[0031] Подробности одной или нескольких реализаций предмета изобретения, описываемые в данном описании, изложены ниже в сопроводительных графических материалах и описании. Другие характерные признаки, особенности и преимущества будут очевидны из описания, графических материалов и формулы изобретения. Следует отметить, что относительные размеры на нижеследующих фигурах могут не являться вычерченными в масштабе.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВ
[0032] На фиг. 1 показан пример воспроизводящей среды, имеющей конфигурацию Dolby Surround 5.1.
[0033] На фиг. 2 показан пример воспроизводящей среды, имеющей конфигурацию Dolby Surround 7.1.
[0034] На фиг. 3 показан пример воспроизводящей среды, имеющей конфигурацию окружающего звука Hamasaki 22.2.
[0035] На фиг. 4A показан пример графического пользовательского интерфейса (GUI), который графически представляет зоны громкоговорителей при переменных возвышениях в виртуальной воспроизводящей среде.
[0036] На фиг. 4В показан пример другой воспроизводящей среды.
[0037] На фиг. 5А-5С показаны примеры характеристик громкоговорителей, соответствующих звуковому объекту, имеющему положение, которое ограничено двумерной поверхностью в трехмерном пространстве.
[0038] На фиг. 5D и 5Е показаны примеры двумерных поверхностей, которыми может ограничиваться звуковой объект.
[0039] Фиг. 6А представляет собой схему последовательности операций, которая описывает один из примеров процесса ограничения положений звукового объекта двумерной поверхностью.
[0040] Фиг. 6В представляет собой схему последовательности операций, которая описывает один из примеров процесса присвоения положения звукового объекта местоположению единичного громкоговорителя или зоне единичного громкоговорителя.
[0041] Фиг. 7 представляет собой схему последовательности операций, которая описывает процесс создания и использования виртуальных громкоговорителей.
[0042] На фиг. 8А-8С показаны примеры виртуальных громкоговорителей, присвоенных конечным точкам линии, и соответствующие характеристики громкоговорителей.
[0043] На фиг. 9А-9С показаны примеры использования виртуальной привязки для перемещения звукового объекта.
[0044] Фиг. 10А представляет собой схему последовательности операций, которая описывает процесс использования виртуальной привязки для перемещения звукового объекта.
[0045] Фиг. 10В представляет собой схему последовательности операций, которая описывает альтернативный процесс использования виртуальной привязки для перемещения звукового объекта.
[0046] На фиг. 10С-10Е показаны примеры процесса, описанного на фиг. 10В.
[0047] На фиг. 11 показан пример применения ограничения зон громкоговорителей в виртуальной воспроизводящей среде.
[0048] Фиг. 12 представляет собой схему последовательности операций, которая описывает некоторые примеры применения правил ограничения зон громкоговорителей.
[0049] На фиг. 13А и 13В показан один из примеров GUI, который может переключаться между двумерным изображением и трехмерным изображением виртуальной воспроизводящей среды.
[0050] На фиг. 13С-13Е показаны сочетания двумерных и трехмерных иллюстраций воспроизводящих сред.
[0051] Фиг. 14А представляет собой схему последовательности операций, которая описывает процесс управления устройством, предназначенным для представления таких интерфейсов GUI, как интерфейсы, показанные на фиг. 13С-13Е.
[0052] Фиг. 14В представляет собой схему последовательности операций, которая описывает процесс представления данных звуковых объектов для воспроизводящей среды.
[0053] На фиг. 15А показан один из примеров звукового объекта и связанной ширины звукового объекта в виртуальной воспроизводящей среде.
[0054] На фиг. 15В показан один из примеров профиля распространения, соответствующего ширине звукового объекта, показанной на фиг. 15А.
[0055] Фиг. 16 представляет собой схему последовательности операций, которая описывает процесс перераспределения звуковых объектов.
[0056] На фиг. 17А и 17В показаны примеры звукового объекта, расположенного в трехмерной виртуальной воспроизводящей среде.
[0057] На фиг. 18 показаны примеры зон, которые соответствуют режимам панорамирования.
[0058] На фиг. 19A-19D показаны примеры применения методик панорамирования в ближней зоне и дальней зоне к звуковым объектам в различных местоположениях.
[0059] На фиг. 20 указаны зоны громкоговорителей воспроизводящей среды, которая могут использоваться в процессе управления смещением между экраном и помещением.
[0060] Фиг. 21 представляет собой блок-схему, которая представляет примеры компонентов устройства для авторской разработки и/или представления данных.
[0061] Фиг. 22А представляет собой блок-схему, которая представляет некоторые компоненты, которые могут использоваться для создания звукового содержимого.
[0062] Фиг. 22В представляет собой блок-схему, которая представляет некоторые компоненты, которые могут использоваться для проигрывания звука в воспроизводящей среде.
[0063] Сходные ссылочные позиции и обозначения в различных графических материалах указывают сходные элементы.
ОПИСАНИЕ ПРИМЕРНЫХ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯ ИЗОБРЕТЕНИЯ
[0064] Нижеследующее описание направлено на некоторые реализации с целью описания некоторых изобретательских особенностей данного раскрытия, а также примеров контекстов, в которых эти изобретательские особенности могут реализовываться. Однако описанные идеи данного раскрытия могут применяться и другими различными способами. Например, несмотря на то, что различные реализации описаны в отношении конкретных воспроизводящих сред, идеи данного раскрытия широко применимы к другим известным воспроизводящим средам, а также к воспроизводящим средам, которые могут быть представлены в будущем. Аналогично, несмотря на то, что в данном раскрытии представлены примеры графических пользовательских интерфейсов (GUI), некоторые из которых предусматривают примеры местоположений громкоговорителей, зон громкоговорителей и т.д., предполагаются и другие реализации. Кроме того, описанные реализации могут реализовываться в различных инструментальных средствах авторской разработки и/или представления данных, которые могут разнообразно реализовываться в аппаратном обеспечении, программном обеспечении, аппаратно-программном обеспечении и т.д. Соответственно идеи данного раскрытия не подразумеваются как ограниченные реализациями, показанными на фигурах и/или описанными в данном раскрытии, но вместо этого имеют широкую применимость.
[0065] На фиг. 1 показан пример воспроизводящей среды, имеющей конфигурацию Dolby Surround 5.1. Dolby Surround 5.1 разрабатывалась в 1990-е гг., однако эта конфигурация по-прежнему широко распространена в средах звуковых систем для кинематографии. Проектор 105 может конфигурироваться для проецирования видеоизображений, например, кинокартины, на экран 150. Данные звуковоспроизведения могут синхронизироваться с видеоизображениями и обрабатываться устройством 110 обработки звука. Усилители 115 мощности могут снабжать громкоговорители воспроизводящей среды 100 сигналами, подаваемыми на громкоговорители.
[0066] Конфигурация Dolby Surround 5.1 содержит левый окружающий массив 120 и правый окружающий массив 125, каждый из которых комплексно управляется единственным каналом. Конфигурация Dolby Surround 5.1 также содержит отдельные каналы для левого экранного канала 130, центрального экранного канала 135 и правого экранного канала 140. Для низкочастотных эффектов (LFE) предусматривается отдельный канал для сверхнизкочастотного громкоговорителя 145.
[0067] В 2010 г. Dolby представила усовершенствования цифрового звука для кинематографии, представив Dolby Surround 7.1. На фиг. 2 показан пример воспроизводящей среды, имеющей конфигурацию Dolby Surround 7.1. Цифровой проектор 205 может конфигурироваться для приема цифровых видеоданных и для проецирования видеоизображений на экран 150. Данные звуковоспроизведения могут обрабатываться устройством 210 обработки звука. Усилители 215 мощности могут снабжать громкоговорители воспроизводящей среды 200 сигналами, подаваемыми на громкоговорители.
[0068] Конфигурация Dolby Surround 7.1 включает левый боковой окружающий массив 220 и правый боковой окружающий массив 225, каждый из которых может управляться единственным каналом. Как и Dolby Surround 5.1, конфигурация Dolby Surround 7.1 содержит отдельные каналы для левого экранного канала 230, центрального экранного канала 235, правого экранного канала 240 и сверхнизкочастотного громкоговорителя 245. Однако Dolby Surround 7.1 увеличивает количество окружающих каналов путем разделения левого и правого окружающих каналов Dolby Surround 5.1 на четыре зоны: в дополнение к левому боковому окружающему массиву 220 и правому боковому окружающему массиву 225, для левых задних окружающих громкоговорителей 224 и правых задних окружающих громкоговорителей 226 включены отдельные каналы. Увеличение количества окружающих зон в пределах воспроизводящей среды 200 может значительно улучшать локализацию звука.
[0069] В попытке создать более многонаправленную среду, некоторые воспроизводящие среды могут конфигурироваться с повышенными количествами громкоговорителей, управляемых повышенными количествами каналов. Более того, некоторые воспроизводящие среды могут содержать громкоговорители, развернутые на разных возвышениях, некоторые из которых могут находиться над опорной поверхностью воспроизводящей среды.
[0070] На фиг. 3 показан пример воспроизводящей среды, имеющей конфигурацию окружающего звука Hamasaki 22.2. Hamasaki 22.2 разрабатывалась в NHK Science & Technology Research Laboratories в Японии как компонент окружающего звука для телевидения сверхвысокой четкости. Hamasaki 22.2 предусматривает 24 канала громкоговорителей, которые могут использоваться для управления громкоговорителями, расположенными в трех слоях. Верхний слой 310 громкоговорителей воспроизводящей среды 300 может управляться 9 каналами. Средний слой 320 громкоговорителей может управляться 10 каналами. Нижний слой 330 громкоговорителей может управляться 5 каналами, два из которых предназначены для сверхнизкочастотных громкоговорителей 345a и 345b.
[0071] Соответственно современным направлением является включение не только большего количества громкоговорителей и большего количества каналов, но также включение громкоговорителей на разных высотах. По мере того, как увеличивается количество каналов, и слой громкоговорителей переходит от двумерного массива к трехмерному массиву, становятся все более и более сложными задачи определения положения и представления данных для звуков.
[0072] Данное раскрытие предусматривает различные инструментальные средства, а также относящиеся к ним пользовательские интерфейсы, что увеличивает функциональные возможности и/или снижает сложность авторской разработки для системы трехмерного звука.
[0073] На фиг. 4А показан один из примеров графического пользовательского интерфейса (GUI), который графически представляет зоны громкоговорителей на различных возвышениях в виртуальной воспроизводящей среде. GUI 400 графически представляет зоны на различных возвышениях в виртуальной среде. GUI 400 может, например, отображаться на дисплейном устройстве в соответствии с командами из логической системы, в соответствии с сигналами, принимаемыми от устройств пользовательского ввода данных и т.д. Некоторые такие устройства описаны ниже со ссылкой на фиг. 21.
[0074] В контексте данного раскрытия, со ссылкой на такие виртуальные воспроизводящие среды, как виртуальная воспроизводящая среда 404, термин «зона громкоговорителей» обычно относится к логической структуре, которая может обладать, но может и не обладать, взаимнооднозначным соответствием с воспроизводящим громкоговорителем фактической воспроизводящей среды. Например, «местоположение зоны громкоговорителей» может соответствовать, но может и не соответствовать, местоположению конкретного воспроизводящего громкоговорителя воспроизводящей среды для кинематографии. Вместо этого, термин «местоположение зоны громкоговорителей» обычно может относиться к зоне виртуальной воспроизводящей среды. В некоторых реализациях, зона громкоговорителя виртуальной воспроизводящей среды может соответствовать виртуальному громкоговорителю, например, посредством использования такой технологии виртуализации, как Dolby Headphone,™ (иногда именуемой Mobile Surround™), которая создает виртуальную среду окружающего звука в реальном времени с использованием комплекта двухканальных стереофонических наушников. В GUI 400 имеется семь зон 402а громкоговорителей на первом возвышении и две зоны 402b громкоговорителей на втором возвышении, что в сумме составляет девять зон громкоговорителей в виртуальной воспроизводящей среде 404. В данном примере, зоны 1-3 громкоговорителей находятся в передней области 405 виртуальной воспроизводящей среды 404. Передняя область 405 может соответствовать, например, области воспроизводящей среды для кинематографии, в которой расположен экран 150, к области дома, в которой расположен телевизионный экран и т.д.
[0075] Здесь, зона 4 громкоговорителей обычно соответствует громкоговорителям в левой области 410, а зона 5 громкоговорителей соответствует громкоговорителям в правой области 415 виртуальной воспроизводящей среды 404. Зона 6 громкоговорителей соответствует левой задней области 412, и зона 7 громкоговорителей соответствует правой задней области 414 виртуальной воспроизводящей среды 404. Зона 8 громкоговорителей соответствует громкоговорителям в верхней области 420а, и зона 9 громкоговорителей соответствует громкоговорителям в верхней области 420b, которая может представлять собой область виртуального потолка, такую как область виртуального потолка 520, показанная на фиг. 5D и 5Е. Соответственно, и как более подробно будет описано ниже, местоположения зон 1-9 громкоговорителей, которые показаны на фиг. 4А, может соответствовать или может не соответствовать, местоположениям воспроизводящих громкоговорителей фактической воспроизводящей среды. Кроме того, другие реализации могут содержать больше или меньше зон громкоговорителей и/или возвышений.
[0076] В различных реализациях, описываемых в данном раскрытии, пользовательский интерфейс, такой как GUI 400, может использоваться как часть инструментального средства авторской разработки и/или инструментального средства представления данных. В некоторых реализациях, инструментальное средство авторской разработки и/или инструментальное средство представления данных может реализовываться посредством программного обеспечения, хранящегося в памяти одного или нескольких постоянных носителей данных. Инструментальное средство авторской разработки и/или инструментальное средство представления данных могут реализовываться (по меньшей мере, частично) аппаратным обеспечением, программно-аппаратным обеспечением и т.д., таким как логическая система и другие устройства, описываемые ниже со ссылкой на фиг. 21. В некоторых реализациях авторской разработки связанное инструментальное средство авторской разработки может использоваться с целью создания метаданных для связанных аудиоданных. Метаданные могут, например, содержать данные, указывающие положение и/или траекторию звукового объекта в трехмерном пространстве, данные ограничения зон громкоговорителей и т.д. Метаданные могут создаваться в отношении зон 402 громкоговорителей виртуальной воспроизводящей среды 404, а не в отношении конкретной схемы расположения громкоговорителей фактической воспроизводящей среды. Инструментальное средство представления данных может принимать аудиоданные и связанные метаданные и вычислять коэффициенты усиления звука и сигналы, подаваемые на громкоговорители, для воспроизводящей среды. Указанные коэффициенты усиления звука и сигналы, подаваемые на громкоговорители, могут вычисляться согласно процессу амплитудного панорамирования, который может создавать ощущение того, что звук приходит из положения Р в воспроизводящей среде. Например, сигналы, подаваемые на громкоговорители, могут доставляться воспроизводящим громкоговорителям 1-N воспроизводящей среды в соответствии со следующим уравнением:
[0078] В уравнении 1
представляет сигнал, подаваемый на громкоговоритель, который подлежит применению к громкоговорителю i, gi представляет коэффициент усиления соответствующего канала,
представляет звуковой сигнал, и t представляет время. Коэффициенты усиления могут определяться, например, в соответствии со способами амплитудного панорамирования, описанными в разделе 2 на страницах 3-4 публикации V. Pulkki, Compensating Displacement of Amplitude-Panned Virtual Sources (Audio Engineering Society (AES) International Conference on Virtual, Synthetic and Entertainment Audio), которая ссылкой включается в данное раскрытие. В некоторых реализациях, коэффициенты усиления могут быть частотнозависимыми. В некоторых реализациях, путем замены
на
может вводиться временная задержка.
[0079] В некоторых реализациях представления данных, данные звуковоспроизведения, созданные со ссылкой на зоны 402 громкоговорителей, могут присваиваться местоположениям громкоговорителей для широкого выбора воспроизводящих сред, которые могут иметь конфигурацию Dolby Surround 5.1, конфигурацию Dolby Surround 7.1, конфигурацию Hamasaki 22.2 или другую конфигурацию. Например, со ссылкой на фиг. 2, инструментальное средство представления данных может присваивать данные звуковоспроизведения для зон 4 и 5 громкоговорителей левому боковому окружающему массиву 220 и правому боковому окружающему массиву 225 воспроизводящей среды, имеющей конфигурацию Dolby Surround 7.1. Данные звуковоспроизведения для зон 1, 2 и 3 громкоговорителей могут соответственно присваиваться левому экранному каналу 230, правому экранному каналу 240 и центральному экранному каналу 235. Данные звуковоспроизведения для зон 6 и 7 громкоговорителей могут присваиваться левым задним окружающим громкоговорителям 224 и правым задним окружающим громкоговорителям 226.
[0080] На фиг. 4 В показан один из примеров другой воспроизводящей среды. В некоторых реализациях, инструментальное средство представления данных может присваивать данные звуковоспроизведения для зон 1, 2 и 3 громкоговорителей соответствующим экранным громкоговорителям 455 воспроизводящей среды 450. Инструментальное средство представления данных может присваивать данные звуковоспроизведения для зон 4 и 5 громкоговорителей левому боковому окружающему массиву 460 и правому боковому окружающему массиву 465 и может присваивать данные звуковоспроизведения для зон 8 и 9 громкоговорителей левым верхним громкоговорителям 470а и правым верхним громкоговорителям 470b. Данные звуковоспроизведения для зон 6 и 7 громкоговорителей могут присваиваться левым задним окружающим громкоговорителям 480а и правым задним окружающим громкоговорителям 480b.
[0081] В некоторых реализациях авторской разработки, инструментальное средство авторской разработки может использоваться с целью создания метаданных для звуковых объектов. В контексте данного раскрытия, термин «звуковой объект» может относиться к потоку аудиоданных и связанным метаданным. Эти метаданные обычно указывают трехмерное местоположение объекта, ограничения представления данных, а также тип содержимого (например, диалог, эффекты и т.д.). В зависимости от реализации, метаданные могут содержать другие типы данных, такие как данные ширины, данные коэффициента усиления, данные траектории и т.д. Некоторые звуковые объекты могут быть неподвижными, в то время как другие объекты могут перемещаться. Детали звукового объекта могут авторски разрабатываться или представляться в соответствии со связанными метаданными, которые, среди прочего, могут указывать положение звукового объекта в трехмерном пространстве в заданный момент времени. Когда звуковой объект наблюдается или проигрывается в воспроизводящей среде, данные звуковых объектов могут представляться в соответствии с метаданными положения с использованием воспроизводящих громкоговорителей, которые присутствуют в воспроизводящей среде, а не являться выводом в предварительно определенный физический канал, как это происходит в случае таких традиционных систем на канальной основе, как Dolby 5.1 и Dolby 7.1.
[0082] Различные инструментальные средства авторской разработки и представления данных описываются в данном раскрытии со ссылкой на GUI, который, по существу, аналогичен GUI 400. Однако в сочетании с указанными инструментальными средствами авторской разработки и представления данных могут использоваться и другие разнообразные пользовательские интерфейсы, включающие интерфейсы GUI в качестве неограничивающих примеров. Некоторые такие инструментальные средства могут упрощать процесс авторской разработки путем применения различного рода ограничений. Некоторые реализации будут описаны ниже со ссылкой на фиг. 5А и след.
[0083] На фиг. 5А-5С показаны примеры характеристик громкоговорителей, соответствующих звуковому объекту, имеющему положение, которое ограничено в трехмерном пространстве двумерной поверхностью, которая в данном примере представляет собой полусферу. В этих примерах, характеристики громкоговорителей были вычислены устройством представления данных в предположении конфигурации с девятью громкоговорителями, где каждый громкоговоритель соответствует одной из зон 1-9 громкоговорителей. Однако, как указывается в другом месте данного раскрытия, существование взаимнооднозначного присваивания между зонами громкоговорителей виртуальной воспроизводящей среды и воспроизводящими громкоговорителями в воспроизводящей среде может являться необязательным. Со ссылкой, в первую очередь, на фиг. 5А, звуковой объект 505 показан в местоположении в левой передней части виртуальной воспроизводящей среды 404. Соответственно громкоговоритель, соответствующий зоне 1 громкоговорителей, указывает значительный коэффициент усиления, а громкоговорители, соответствующие зонам 3 и 4 громкоговорителей, указывают умеренные коэффициенты усиления.
[0084] В этом примере, местоположение звукового объекта 505 может изменяться путем помещения курсора 510 на звуковой объект 505 и «перетаскивания» звукового объекта 505 в требуемое местоположение в плоскости х,у виртуальной воспроизводящей среды 404. По мере того, как объект перетаскивается в направлении центра воспроизводящей среды, он также присваивается поверхности полусферы, и его возвышение увеличивается. Здесь увеличения в возвышении звукового объекта 505 указываются путем увеличения диаметра окружности, которая представляет звуковой объект 505: как показано на фиг. 5В и 5С, по мере того, как звуковой объект 505 перетаскивается в верхнюю центральную часть виртуальной воспроизводящей среды 404, звуковой объект 505 становится все более и более крупным. В альтернативном варианте, или в дополнение, возвышение звукового объекта 505 может указываться изменениями в цвете, яркости, численном указателе возвышения и т.д. Когда звуковой объект 505 располагается в верхней центральной части виртуальной воспроизводящей среды 404, как показано на фиг. 5С, громкоговорители, соответствующие зонам 8 и 9 громкоговорителей, указывают значительные коэффициенты усиления, а остальные громкоговорители указывают небольшой коэффициент усиления или отсутствие его.
[0085] В данной реализации, положение звукового объекта 505 ограничено такой двумерной поверхностью, как сферическая поверхность, эллиптическая поверхность, коническая поверхность, цилиндрическая поверхность, клин и т.д. На фиг. 5D и 5E показаны примеры двумерных поверхностей, которыми может ограничиваться звуковой объект. Фиг. 5D и 5Е представляют собой изображения в поперечном разрезе через виртуальную воспроизводящую среду 404 с передней областью 405, показанной слева. На фиг. 5D и 5Е значения y на оси y-z увеличиваются в направлении передней области 405 виртуальной воспроизводящей среды 404 для сохранения соответствия ориентациям осей x-y, показанных на фиг. 5А-5С.
[0086] В примере, показанном на фиг. 5D, двумерная поверхность 515а представляет собой сечение эллипсоида. В примере, показанном на фиг. 5Е, двумерная поверхность 515b представляет собой сечение клина. Однако формы, ориентации и положения двумерных поверхностей 515, показанных на фиг. 5D и 5Е, являются только примерами. В альтернативных реализациях, по меньшей мере, часть двумерной поверхности 515 может выходить за пределы виртуальной воспроизводящей среды 404. В некоторых таких реализациях, двумерная поверхность 515 может проходить над виртуальным потолком 520. Соответственно трехмерное пространство, в пределах которого проходит двумерная поверхность 515, необязательно имеет одинаковую протяженность в пространстве с объемом виртуальной воспроизводящей среды 404. В других реализациях, звуковой объект может ограничиваться такими одномерными элементами, как кривые, прямые линии и т.д.
[0087] На фиг. 6А показана схема последовательности операций, которая описывает один из примеров процесса ограничения положений звукового объекта двумерной поверхностью. Как для остальных схем последовательностей операций, представленных в данном раскрытии, операции процесса 600 необязательно выполняются в показанном порядке. Более того, процесс 600 (и другие процессы, представленные в данном раскрытии) может содержать количество операций больше или меньше того, которое указывается в графических материалах и/или описывается. В данном примере блоки 605-622 выполняются инструментальным средством авторской разработки, а блоки 624-630 выполняются инструментальным средством представления данных. Инструментальное средство авторской разработки и инструментальное средство представления данных могут реализовываться в едином устройстве или более чем в одном устройстве. Несмотря на то, что фиг. 6А (и другие схемы последовательностей операций, представленные в данном раскрытии) могут производить впечатление того, что процессы авторской разработки и представления данных выполняются последовательно, во многих реализациях процессы авторской разработки и представления данных выполняются, по существу, одновременно. Процессы авторской разработки и процессы представления данных могут быть диалоговыми. Например, результаты операции авторской разработки могут направляться инструментальному средству представления данных, соответствующие результаты инструментального средства представления данных могут оцениваться пользователем, который может выполнять дальнейшую авторскую разработку на основе этих результатов и т.д.
[0088] В блоке 605 принимается указатель того, что положение звукового объекта нужно ограничить двумерной поверхностью. Указатель может приниматься, например, логической системой устройства, которое сконфигурировано для обеспечения инструментальных средств авторской разработки и/или представления данных. Как и для других реализаций, описываемых в настоящем раскрытии, логическая система может действовать в соответствии с командами программного обеспечения, хранящегося в памяти постоянного носителя данных, в соответствии с аппаратно-программным обеспечением и т.д. Указатель может представлять собой сигнал из устройства пользовательского ввода (такого, как сенсорный экран, мышь, шаровой манипулятор, устройство распознавания жестов и т.д.) в ответ на ввод данных пользователем.
[0089] Аудиоданные принимаются в необязательном блоке 607. В данном примере, блок 607 является необязательным, поскольку аудиоданные также могут приходить напрямую в инструментальные средства представления данных из другого источника (например, от микшерного пульта), который синхронизирован по времени с инструментальным средством авторской разработки метаданных. В некоторых таких реализациях, может существовать неявный механизм, предназначенный для связывания каждого аудиопотока с соответствующим входящим потоком метаданных с целью формирования звукового объекта. Если устройство представления данных сконфигурировано входными звуковыми сигналами, которые также нумеруются от 1 до N, инструментальное средство представления данных может автоматически предполагать, что звуковой объект формируется потоком метаданных, который идентифицируется численным значением (например, 1), и аудиоданными, принимаемыми на первом вводе аудиоданных. Аналогично, какой-либо поток метаданных, идентифицируемый как число 2, может формировать объект с аудиоданными, принимаемыми на втором входном звуковом канале. В некоторых реализациях, аудиоданные и метаданные могут предварительно упаковываться инструментальными средствами авторской разработки, образуя звуковые объекты, а звуковые объекты могут доставляться в инструментальное средство представления данных, например, передаваться по сети как пакеты TCP/IP.
[0090] В альтернативных реализациях, инструментальное средство авторской разработки может передавать по сети только метаданные, а инструментальное средство представления данных может принимать аудиоданные из другого источника (например, посредством потока с импульсно-кодовой модуляцией (РСМ), посредством аналогового звукового сигнала и т.д.). В таких реализациях, инструментальное средство представления данных может конфигурироваться для группировки аудиоданных и метаданных, формируя звуковые объекты. Аудиоданные могут, например, приниматься логической системой через интерфейс. Интерфейс может, например, представлять собой сетевой интерфейс, звуковой интерфейс (например, интерфейс, сконфигурированный для осуществления связи посредством стандарта AES3, разработанного обществом инженеров-акустиков и Европейским радиовещательным союзом, также известного как AES/EBU, посредством протокола многоканального звукового цифрового интерфейса (MADI), посредством аналоговых сигналов и т.д.) или интерфейса между логической системой и запоминающим устройством. В этом примере, данные, принимаемые устройством представления данных, содержат, по меньшей мере, один звуковой объект.
[0091] В блоке 610 принимаются координаты (x,y) или (x,y,z) положения звукового объекта. Блок 610 может, например, включать прием исходного положения звукового объекта. Блок 610 также может содержать прием указателя того, что пользователь расположил звуковой объект, или изменил его положение, так, как, например, описано выше со ссылкой на фиг. 5А-5С. Координаты звукового объекта присваиваются двумерной поверхности в блоке 615. Двумерная поверхность может быть аналогична тем, которые описаны выше со ссылкой на фиг. 5D-5E, или она может представлять собой другую двумерную поверхность. В данном примере, каждая точка плоскости x-y будет присваиваться единственному значению z, поэтому блок 615 включает присваивание координат x и y, полученных в блоке 610, значению z. В других реализациях могут использоваться другие процессы присваивания и/или системы координат. Звуковой объект может демонстрироваться (блок 620) в местоположении (x,y,z), которое определяется в блоке 615. Аудиоданные и метаданные, содержащие присвоенное местоположение (x,y,z), которое определяется в блоке 615, могут сохраняться в блоке 621. Аудиоданные и метаданные могут отравляться инструментальному средству представления данных (блок 622). В некоторых реализациях, метаданные могут отправляться непрерывно по мере того, как выполняются некоторые операции авторской разработки, например, по мере того, как определяется положение звукового объекта, ограничение, демонстрация через GUI 400 и т.д.
[0092] В блоке 623 определяется, будет ли продолжен процесс авторской разработки. Например, процесс авторской разработки может завершаться (блок 625) при получении ввода из пользовательского интерфейса, указывающего, что пользователь больше не желает ограничивать положения звукового объекта двумерной плоскостью. Иначе, процесс авторской разработки может продолжаться, например, возвращаясь в блок 607 или блок 610. В некоторых реализациях, операции представления данных могут продолжаться независимо от того, продолжается ли процесс авторской разработки. В некоторых реализациях, звуковые объекты могут записываться на диск на авторской платформе, а затем с целью показа проигрываться специализированным устройством обработки звука или сервером кинотеатра, связанным с устройством обработки звука, например, с устройством обработки звука, аналогичным устройству 210 обработки звука по фиг. 2.
[0093] В некоторых реализациях, инструментальное средство представления данных может представлять собой программное обеспечение, которое запускается на устройстве, которое сконфигурировано для обеспечения функциональной возможности авторской разработки. В других реализациях, инструментальное средство представления данных может предусматриваться на другом устройстве. Тип протокола связи, используемого для установления связи между инструментальным средством авторской разработки и инструментальным средством представления данных, может изменяться в зависимости от того, запускаются оба инструментальных средства на одном и том же устройстве, или они связываются по сети.
[0094] В блоке 626 аудиоданные и метаданные (включающие положение (положения) (x,y,z), определяемые в блоке 615) принимаются инструментальным средством представления данных. В альтернативных реализациях, аудиоданные и метаданные могут приниматься по отдельности и интерпретироваться инструментальным средством представления данных в качестве звукового объекта посредством неявного механизма. Как отмечалось выше, например, поток метаданных может содержать идентификационный код звукового объекта (например, 1, 2, 3 и т.д.) и может прикрепляться соответственно к первому, второму, третьему и т.д. звуковым вводам (т.е. к цифровой или аналоговой аудиосвязи) в системе представления данных, образуя звуковой объект, данные которого могут представляться громкоговорителям.
[0095] В ходе операций представления данных в процессе 600 (и других операциях представления данных, описываемых в данном раскрытии), в соответствии со схемой расположения воспроизводящих громкоговорителей конкретной воспроизводящей среды, могут применяться уравнения коэффициентов усиления при панорамировании. Соответственно логическая система инструментального средства представления данных может принимать данные воспроизводящей среды, содержащие указатель количества воспроизводящих громкоговорителей в воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя в пределах воспроизводящей среды. Эти данные могут приниматься, например, путем получения доступа к структуре данных, которая хранится в памяти, доступной для логической системы, или приниматься через систему интерфейсов.
[0096] В данном примере, уравнения коэффициентов усиления при панорамировании применяются к положению (положениям) (x,y,z) для определения значений коэффициентов усиления (блок 628) с целью их применения к аудиоданным (блок 630). В некоторых реализациях, аудиоданные, которые были скорректированы по уровню в ответ на значения коэффициентов усиления, могут воспроизводиться воспроизводящими громкоговорителями, например, динамиками наушников (или другими громкоговорителями), которые сконфигурированы для связи с логической системой инструментального средства представления данных. В некоторых реализациях, местоположения воспроизводящих громкоговорителей могут соответствовать местоположениям зон громкоговорителей такой виртуальной воспроизводящей среды, как вышеописанная виртуальная воспроизводящая среда 404. Соответствующие характеристики громкоговорителей могут демонстрироваться на дисплейном устройстве, как, например, показано на фиг. 5А-5С.
[0097] В блоке 635 определяется, будет ли процесс продолжен. Например, процесс может завершиться (блок 640) при получении ввода из пользовательского интерфейса, указывающего, что пользователь больше не желает продолжать процесс представления данных. Иначе, процесс может продолжаться, например, возвращаясь в блок 626. Если логическая система принимает указатель того, что пользователь желает вернуться к соответствующему процессу авторской разработки, процесс 600 может вернуться в блок 607 или блок 610.
[0098] Другие реализации могут содержать наложение разного рода ограничений и создание других типов метаданных ограничения для звуковых объектов. Фиг. 6В представляет собой схему последовательности операций, которая описывает один из примеров процесса присвоение положения звукового объекта местоположению единичного громкоговорителя. В данном раскрытии, этот процесс также может именоваться «привязкой». В блоке 655 принимается указатель того, что положение звукового объекта может привязываться к местоположению единичного громкоговорителя или единичной зоне громкоговорителей. В данном примере, указатель таков, что положение звукового объекта будет при необходимости привязано к местоположению единичного громкоговорителя. Данный указатель может, например, приниматься логической системой устройства, которое сконфигурировано для предоставления инструментальных средств авторской разработки. Указатель может соответствовать вводу, принимаемому из устройства пользовательского ввода. Однако этот указатель также может соответствовать категории звукового объекта (например, звуку пули, произнесению звуков и т.д.) и/или ширине звукового объекта. Информация, относящаяся к категории и/или ширине, может, например, приниматься в качестве метаданных для звукового объекта. В таких реализациях блок 657 может находиться перед блоком 655.
[0099] В блоке 656 принимаются аудиоданные. Координаты положения звукового объекта принимаются в блоке 657. В данном примере, положение звукового объекта демонстрируется (блок 658) в соответствии с координатами, принимаемыми в блоке 657. Метаданные, содержащие координаты звукового объекта и флаг привязки, указывающий функциональную возможность привязки, сохраняются в блоке 659. Аудиоданные и метаданные направляются инструментальным средством авторской разработки инструментальному средству представления данных (блок 660).
[0100] В блоке 662 определяется, будет ли продолжен процесс авторской разработки. Например, процесс авторской разработки может завершаться (блок 663) при получении от пользовательского интерфейса ввода, указывающего, что пользователь больше не желает привязывать положения звукового объекта к местоположению одного из громкоговорителей. Иначе, процесс авторской разработки может продолжаться, например, возвращаясь в блок 665. В некоторых реализациях, операции представления данных могут продолжаться независимо от того, продолжается ли процесс авторской разработки.
[0101] Аудиоданные и метаданные, направляемые инструментальным средством авторской разработки инструментальному средству представления данных, принимаются инструментальным средством представления данных в блоке 664. В блоке 665 определяется (например, логической системой), следует ли привязать положение звукового объекта к местоположению одного из громкоговорителей. Данное определение может основываться, например, по меньшей мере, частично на расстоянии между положением звукового объекта и местоположением ближайшего воспроизводящего громкоговорителя воспроизводящей среды.
[0102] В этом примере, если в блоке 665 определяется привязка местоположения звукового объекта к местоположению одного из громкоговорителей, положение этого звукового объекта будет присвоено в блоке 670 местоположению одного из громкоговорителей, обычно громкоговорителя, ближайшего к намеченному положению (x,y,z), принятому для данного звукового объекта. В этом случае, коэффициент усиления для аудиоданных, воспроизводимых этим местоположением громкоговорителя, будет равен 1,0, в то время как коэффициент усиления для аудиоданных, воспроизводимых другими громкоговорителями, будет нулевым. В альтернативных реализациях, положение звукового объекта может присваиваться в блоке 670 группе местоположений громкоговорителей.
[0103] Например, снова обращаясь к фиг. 4В, блок 670 может включать привязку положения звукового объекта к одному из верхних левых громкоговорителей 470а. В альтернативном варианте, блок 670 может включать привязку положения звукового объекта к единичному громкоговорителю и соседним громкоговорителям, например, к одному или двум соседним громкоговорителям. Таким образом, соответствующие метаданные могут применяться к небольшой группе воспроизводящих громкоговорителей и/или к отдельному воспроизводящему громкоговорителю.
[0104] Однако, если в блоке 665 определяется, что положение звукового объекта не будет привязываться к местоположению громкоговорителя, например, в случае, когда это может привести к большому отклонению в положении относительно оригинального намеченного положения, полученного для этого объекта, будут применяться правила панорамирования (блок 675). Правила панорамирования могут применяться в соответствии с положением звукового объекта, а также с другими свойствами звукового объекта (такими как ширина, громкость и т.д.).
[0105] Данные коэффициентов усиления, определяемые в блоке 675, могут применяться к аудиоданным в блоке 681, а результат может сохраняться. В некоторых реализациях, результирующие аудиоданные могут воспроизводиться громкоговорителями, которые сконфигурированы для связи с логической системой. Если в блоке 685 определяется, что процесс 650 будет продолжен, процесс 650 может возвращаться в блок 664 для продолжения операций представления данных. В альтернативном варианте, процесс 650 может возвращаться в блок 655 для продолжения операций авторской разработки.
[0106] Процесс 650 может содержать различного рода операции сглаживания. Например, логическая система может конфигурироваться для сглаживания переходов в коэффициентах усиления, применяемых к аудиоданным при переходе от присвоения положения звукового объекта от местоположения первого единичного громкоговорителя местоположению второго единичного громкоговорителя. Снова обращаясь к фиг. 4В, если положение звукового объекта вначале присваивалось одному из верхних левых громкоговорителей 470а, а позднее присваивалось одному из верхних правых окружающих громкоговорителей 480b, логическая система может конфигурироваться для сглаживания перехода между громкоговорителями так, чтобы не казалось, что звуковой объект внезапно «перепрыгивает» от одного громкоговорителя (или зоны громкоговорителей) к другому. В некоторых реализациях, сглаживание может реализовываться в соответствии с параметром скорости плавного перехода.
[0107] В некоторых реализациях, логическая система может конфигурироваться для сглаживания переходов между коэффициентами усиления, применяемыми к аудиоданным при переходе между присвоением положения звукового объекта местоположению единичного громкоговорителя и применением для положения звукового объекта правил панорамирования. Например, если в блоке 665 последовательно определяется, что положение звукового объекта было перемещено в положение, которое определяется, как слишком удаленное от ближайшего громкоговорителя, в блоке 675 могут применяться правила панорамирования для положения звукового объекта. Однако при переходе от привязки к панорамированию (и наоборот), логическая система может конфигурироваться для сглаживания переходов в коэффициентах усиления, применяемых к аудиоданным. Процесс может завершаться в блоке 690, например, при получении соответствующего ввода из пользовательского интерфейса.
[0108] Некоторые альтернативные реализации могут включать создание логических ограничений. В некоторых случаях, например, для звукового микшера может возникнуть необходимость более явно управлять набором громкоговорителей, которые используются в ходе конкретной операции панорамирования. Некоторые реализации позволяют пользователю генерировать одно- или двумерные «логические присвоения» между наборами громкоговорителей и интерфейсом панорамирования.
[0109] Фиг. 7 представляет собой схему последовательности операций, которая описывает процесс создания и использования виртуальных громкоговорителей. На фиг. 8А-8С показаны примеры виртуальных громкоговорителей, присвоенных конечным точкам линии, и соответствующие характеристики зон громкоговорителей. Обращаясь, в первую очередь, к процессу 700 по фиг. 7, в блоке 705 принимается указатель для создания виртуальных громкоговорителей. Указатель может приниматься, например, логической системой устройства авторской разработки и соответствовать вводу, полученному из устройства пользовательского ввода.
[0110] В блоке 710 принимается указатель местоположения виртуальных громкоговорителей. Например, со ссылкой на фиг. 8А, пользователь может использовать устройство пользовательского ввода для расположения курсора 510 в положении виртуального громкоговорителя 805а и для выбора этого местоположения, например, щелчком мыши. В блоке 715 определяется (например, в соответствии с пользовательским вводом), что в данном примере будут выбраны дополнительные виртуальные громкоговорители. Процесс возвращается в блок 710, и, в данном примере, пользователь выбирает положение виртуального громкоговорителя 805а, показанное на фиг. 8А.
[0111] В этом случае, пользователь хочет создать только два местоположения виртуальных громкоговорителей. Поэтому в блоке 715 определяется (например, в соответствии с пользовательским вводом), что дополнительные виртуальные громкоговорители выбираться не будут. Как показано на фиг. 8А, может демонстрироваться ломаная линия 810, соединяющая положения виртуальных громкоговорителей 805а и 805b. В некоторых реализациях, положение звукового объекта 505 будет ограничиваться ломаной линией 810. В некоторых реализациях, положение звукового объекта 505 может ограничиваться параметрической кривой. Например, для определения параметрической кривой в соответствии с пользовательским вводом, может предусматриваться набор контрольных точек и алгоритм подбора такой аппроксимирующей кривой, как сплайновая кривая. В блоке 725 принимается указатель положения звукового объекта на ломаной линии 810. В некоторых таких реализациях, положение будет указываться как скалярная величина со значениями в интервале от нуля до единицы. В блоке 725 могут демонстрироваться координаты (x,y,z) звукового объекта и ломаная линия, определяемая виртуальными громкоговорителями. Могут демонстрироваться аудиоданные и связанные метаданные, содержащие полученное скалярное положение и координаты (x,y,z) виртуальных громкоговорителей. (Блок 727). Здесь, аудиоданные и метаданные могут направляться инструментальному средству представления данных посредством соответствующего протокола связи в блоке 728.
[0112] В блоке 729 определяется, будет ли продолжен процесс авторской разработки. Если нет, то процесс 700 может завершаться (блок 730) или может продолжаться операциями представления данных в соответствии с пользовательским вводом. Однако, как отмечено выше, во многих реализациях, по меньшей мере, некоторые операции представления данных могут выполняться параллельно операциям авторской разработки.
[0113] В блоке 732 аудиоданные и метаданные принимаются инструментальным средством представления данных. В блоке 735 для положения каждого виртуального громкоговорителя вычисляются коэффициенты усиления, подлежащие применению к аудиоданным. На фиг. 8В показаны характеристики громкоговорителей для положения виртуального громкоговорителя 805а. На фиг. 8С показаны характеристики громкоговорителей для положения виртуального громкоговорителя 805b. В этом примере, как и во многих других примерах, описываемых в данном раскрытии, указанные характеристики громкоговорителей представлены для воспроизводящих громкоговорителей, которые имеют местоположения, соответствующие местоположениям, показанным GUI 400 для зон громкоговорителей. Здесь, виртуальные громкоговорители 805а, 805b и линия 810 были расположены в плоскости, которая не находится рядом с воспроизводящими громкоговорителями, которые имеют местоположения, соответствующие зонам 8 и 9 громкоговорителей. Поэтому на фиг. 8В и 8С коэффициент усиления для этих громкоговорителей не указывается.
[0114] Когда пользователь переместит звуковой объект 505 в другие положения на линии 810, логическая система будет вычислять плавный переход, который соответствует этим положениям (блок 740), например, в соответствии со скалярным параметром положения звукового объекта. В некоторых реализациях, для смешения между коэффициентами усиления, подлежащими применению к аудиоданным для положения виртуального громкоговорителя 805а, и коэффициентами усиления, подлежащими применению к аудиоданным для положения виртуального громкоговорителя 805b, может применяться закон попарного панорамирования (например, синусный или степенной закон сохранения энергии).
[0115] Затем в блоке 742 может определяться (например, в соответствии с пользовательским вводом), будет ли продолжен процесс 700. Например, пользователю может предоставляться (например, через GUI) возможность продолжения операций представления данных или возврата к операциям авторской разработки. Если определяется, что процесс 700 продолжаться не будет, процесс завершается (блок 745).
[0116] При панорамировании быстро движущихся звуковых объектов (например, звуковых объектов, которые соответствуют автомобилям, реактивным самолетам и т.д.), авторская разработка плавной траектории может оказаться затруднительной, если положения звуковых объектов единовременно выбираются пользователем по одной точке. Недостаточная плавность в траектории звукового объекта может оказывать влияние на восприятие звукового образа. Соответственно некоторые реализации авторской разработки, представленные в данном раскрытии, применяют фильтр пропускания нижних частот к положению звукового объекта с целью сглаживания результирующих коэффициентов панорамирования. Альтернативные реализации авторской разработки применяют фильтр пропускания нижних частот к коэффициенту усиления, применяемому к аудиоданным.
[0117] Другие реализации авторской разработки могут позволять пользователю моделировать захват, выталкивание, отбрасывание или аналогичные взаимодействия со звуковыми объектами. Некоторые такие реализации могут включать применение таких модельных физических законов, как наборы правил, используемые для описания скорости, ускорения, импульса, кинетической энергии, приложения сил и т.д.
[0118] На фиг. 9А-9С показаны примеры использования виртуальной привязки для перетаскивания звукового объекта. На фиг. 9А виртуальная привязка 905 была сформирована между звуковым объектом 505 и курсором 510. В данном примере, виртуальная привязка 905 имеет виртуальную пружинную постоянную. В некоторых таких реализациях, виртуальная пружинная постоянная может выбираться в соответствии с пользовательским вводом.
[0119] На фиг. 9В показан звуковой объект 505 и курсор 510 в последующий момент времени, после которого пользователь переместил курсор 510 в направлении зоны 3 громкоговорителей. Пользователь мог переместить курсор 510 с использованием мыши, джойстика, шарового манипулятора, устройства распознавания жестов или устройства пользовательского ввода другого типа. Виртуальная привязка 905 была натянута, и звуковой объект 505 был перемещен близко к зоне 8 громкоговорителей. Звуковой объект на фиг. 9А и 9В имеет приблизительно одинаковый размер, что указывает (в данном примере), что возвышение звукового объекта 505 существенно не изменилось.
[0120] На фиг. 9С показан звуковой объект 505 и курсор 510 в более поздний момент времени, после которого пользователь переместил курсор к зоне 9 громкоговорителей. Виртуальная привязка 905 натянулась еще сильнее. Звуковой объект 505 переместился вниз, что указывается уменьшением размера звукового объекта 505. Звуковой объект 505 был перемещен по гладкой дуге. Данный пример иллюстрирует одну из потенциальных выгод данных реализаций, которая заключается в том, что звуковой объект 505 может перемещаться по более плавной траектории, чем если бы пользователь выбирал положения звукового объекта 505 только по точкам.
[0121] Фиг. 10А представляет собой схему последовательности операций, которая описывает процесс использования виртуальной привязки для перемещения звукового объекта. Процесс 1000 начинается в блоке 1005, где принимаются аудиоданные. В блоке 1007 принимается указатель для прикрепления виртуальной привязки между звуковым объектом и курсором. Указатель может приниматься логической системой устройства авторской разработки и может соответствовать вводу, полученному из устройства пользовательского ввода. Со ссылкой на фиг. 9А, например, пользователь может поместить курсор 510 над звуковым объектом 505, а затем указать через устройство пользовательского ввода или GUI, что виртуальная привязка 905 должна формироваться между курсором 510 и звуковым объектом 505. Могут приниматься данные положения курсора и объекта. (Блок 1010).
[0122] В данном примере, данные скорости и/или ускорения курсора могут вычисляться логической системой в соответствии с данными положения курсора по мере перемещения курсора 510. (Блок 1015). Данные положения и/или данные траектории звукового объекта 505 могут вычисляться в соответствии с виртуальной пружинной постоянной виртуальной привязки 905 и положением курсора, данными скорости и ускорения. Некоторые такие реализации могут включать приписывание звуковому объекту 505 виртуальной массы. (Блок 1020). Например, если курсор 510 перемещается с относительно постоянной скоростью, виртуальная привязка 905 может не натягиваться, и звуковой объект 505 может протаскиваться с относительной постоянной скоростью. Если курсор 510 ускоряется, виртуальная привязка 905 может натягиваться, и виртуальной привязкой 905 может прилагаться к звуковому объекту соответствующая сила. Между ускорением курсора 510 и приложением силы виртуальной привязкой 905 может происходить запаздывание по времени. В альтернативных реализациях, положение и/или траектория звукового объекта 505 может определяться иначе, например, без приписывания виртуальной привязке 905 виртуальной пружинной постоянной, путем применения к звуковому объекту 505 законов трения и/или инерции и т.д.
[0123] Дискретные положения и/или траектория звукового объекта 505 и курсора 510 могут демонстрироваться (блок 1025). В данном примере, логическая система дискретизирует положения звукового объекта в промежутке времени (блок 1030). В некоторых таких реализациях пользователь может определять временной интервал для дискретизации. Метаданные местоположения звукового объекта и/или траектории и т.д. могут сохраняться (Блок 1034).
[0124] В блоке 1036 определяется, будет ли продолжен этот режим авторской разработки. Если пользователь изъявляет такое желание, процесс может продолжаться, например, возвращаясь в блок 1005 или блок 1010. Иначе, процесс 1000 может завершаться (блок 1040).
[0125] Фиг. 10В представляет схему последовательности операций, которая описывает альтернативный процесс использования виртуальной привязки для перемещения звукового объекта. На фиг. 10С-10Е показаны примеры процесса, описываемого на фиг. 10В. Обращаясь, в первую очередь, к фиг. 10В, процесс 1050 начинается в блоке 1055, где принимаются аудиоданные. В блоке 1057 принимается указатель для прикрепления виртуальной привязки между звуковым объектом и курсором. Указатель может приниматься логической системой устройства авторской разработки и может соответствовать вводу, принимаемому из устройства пользовательского ввода. Со ссылкой на фиг. 10C, например, пользователь может помещать курсор 510 над звуковым объектом 505, а затем указывать посредством устройства пользовательского ввода или GUI, что между курсором 510 и звуковым объектом 505 должна формироваться виртуальная привязка 905.
[0126] Данные положения курсора и звукового объекта могут приниматься в блоке 1060. В блоке 1062 логическая система может принимать (например, посредством устройства пользовательского ввода или GUI) указатель того, что звуковой объект 505 должен удерживаться в указанном положении, например, в положении, указанном курсором 510. В блоке 1065 логическое устройство принимает указатель того, что курсор 510 был перемещен в новое положение, которое может демонстрироваться наряду с положением звукового объекта 505 (блок 1067). Например, со ссылкой на фиг. 10D, курсор 510 был перемещен с левой стороны виртуальной воспроизводящей среды 404 на правую сторону. Однако звуковой объект 510 по-прежнему удерживается в том же положении, что и указанное на фиг. 10С. Как результат, виртуальная привязка 905 была сильно натянута.
[0127] В блоке 1069 логическая система принимает (например, посредством устройства пользовательского ввода или GUI) указатель того, что звуковой объект 505 подлежит высвобождению. Логическая система может вычислять данные результирующего положения звукового объекта и/или траектории, которые могут демонстрироваться (блок 1075). Демонстрация результатов может быть аналогична демонстрации, показанной на фиг. 10Е, которая показывает звуковой объект 505, плавно и быстро движущийся через виртуальную воспроизводящую среду 404. Логическая система может сохранять метаданные местоположения и/или траектории в системе памяти (блок 1080).
[0128] В блоке 1085 определяется, будет ли продолжен процесс 1050 авторской разработки. Процесс может продолжаться, если логическая система принимает указатель того, что пользователь желает так поступить. Например, процесс 1050 может продолжаться, возвращаясь в блок 1055 или блок 1060. Иначе, инструментальное средство авторской разработки может направлять аудиоданные и метаданные инструментальному средству представления данных (блок 1090), после чего процесс 1050 может завершаться (блок 1095).
[0129] С целью оптимизации правдоподобия при восприятии движения звукового объекта, может потребоваться предоставление пользователю инструментального средства авторской разработки (или инструментального средства представления данных) возможности выбирать в воспроизводящей среде подмножество громкоговорителей и, таким образом, ограничивать набор активных громкоговорителей выбранным подмножеством. В некоторых реализациях, зоны громкоговорителей и/или группы зон громкоговорителей в ходе операции авторской разработки или представления данных могут обозначаться как активные или неактивные. Например, со ссылкой на фиг. 4А, зоны громкоговорителей в передней области 405, левой области 410, правой области 415 и/или верхней области 420 могут управляться как группа. Зоны громкоговорителей в задней области, которая содержит зоны 6 и 7 громкоговорителей (и, в других реализациях, одну или несколько других зон громкоговорителей, расположенных между зонами 6 и 7 громкоговорителей) также могут управляться как группа. Может предусматриваться, чтобы пользовательский интерфейс динамически разблокировал или блокировал все громкоговорители, которые соответствуют данной конкретной зоне громкоговорителей или области, которая содержит несколько зон громкоговорителей.
[0130] В некоторых реализациях, логическая система устройства авторской разработки (или устройства представления данных) может конфигурироваться для создания метаданных ограничения зон громкоговорителей в соответствии с пользовательским вводом, полученным через систему пользовательского ввода. Метаданные ограничения зон громкоговорителей могут содержать данные для блокирования выбранных зон громкоговорителей. Некоторые такие реализации будут описаны ниже со ссылкой на фиг. 11 и 12.
[0131] На фиг. 11 показан пример применения ограничения зон громкоговорителей в виртуальной воспроизводящей среде. В некоторых таких реализациях, пользователь может иметь возможность выбирать зоны громкоговорителей путем щелчка на их представлениях в таком GUI, как GUI 400, используя такое устройство пользовательского ввода, как мышь. В данном случае, пользователь заблокировал зоны 4 и 5 громкоговорителей на боковых сторонах виртуальной воспроизводящей среды 404. Зоны 4 и 5 громкоговорителей могут соответствовать большинству (или всем) громкоговорителям в такой физической воспроизводящей среде, как среда звуковой системы для кинематографии. В данном примере, пользователь также ограничил положения звукового объекта 505 положениями на линии 1105. Если большинство громкоговорителей, или все громкоговорители, на боковых стенах заблокированы, панорамирование от экрана 150 к задней части виртуальной воспроизводящей среды 404 могло бы ограничиваться неиспользованием боковых громкоговорителей. Это может создавать для широкой зрительской области, в особенности для зрителей, которые рассажены возле воспроизводящих громкоговорителей, соответствующих зонам 4 и 5 громкоговорителей, улучшенное восприятие движения от передней к задней части.
[0132] В некоторых реализациях, ограничения зон громкоговорителей могут осуществляться посредством всех режимов представления данных. Например, ограничения зон громкоговорителей могут осуществляться посредством ситуаций, в которых для представления данных доступно меньшее количество зон, например, при представлении данных для конфигурации Dolby Surround 7.1 или 5.1 экспонируются только 5 или 7 зон. Ограничения зон громкоговорителей также могут осуществляться посредством ситуации, в которой для представления данных доступно больше зон. По существу, ограничения зон громкоговорителей также можно рассматривать как способ управления изменением представления данных, предоставляющим не являющееся слепым решение для традиционного процесса «повышающего/понижающего микширования».
[0133] Фиг. 12 представляет собой схему последовательности операций, которая описывает некоторые примеры применения правил ограничения зон громкоговорителей. Процесс 1200 начинается в блоке 1205, где принимается один или несколько указателей для применения правил ограничения зон громкоговорителей. Указатель (указатели) может приниматься логической системой устройства авторской разработки или представления данных, и может соответствовать вводу, принимаемому из устройства пользовательского ввода. Например, указатели могут соответствовать выбору пользователем для деактивации одной или нескольких зон громкоговорителей. В некоторых реализациях, блок 1205 может содержать прием указателя того, какой тип правил ограничения зон громкоговорителей следует применить, как, например, описывается ниже.
[0134] В блоке 1207 инструментальным средством авторской разработки принимаются аудиоданные. Например, в соответствии с вводом пользователя инструментального средства авторской разработки, могут приниматься (блок 1210) и демонстрироваться (блок 1215) данные положения звукового объекта. В этом примере, данные положения представляют собой координаты (x,y,z). Здесь, активные и неактивные зоны громкоговорителей для выбранных правил ограничения зон громкоговорителей также демонстрируются в блоке 1215. В блоке 1220 аудиоданные и связанные метаданные сохраняются. В этом примере, метаданные содержат метаданные положения звукового объекта и метаданные ограничения зон громкоговорителей, которые могут включать флаг идентификатора зон громкоговорителей.
[0135] В некоторых реализациях, метаданные ограничения зон громкоговорителей могут указывать, что инструментальное средство представления данных должно применять уравнения панорамирования для вычисления коэффициентов усиления бинарным образом, например, рассматривая все громкоговорители в выбранных (заблокированных) зонах громкоговорителей как являющиеся «отключенными», а все остальные зоны громкоговорителей - как являющиеся «включенными». Логическая система может конфигурироваться для создания метаданных ограничения зон громкоговорителей, которые содержат данные для блокирования выбранных зон громкоговорителей.
[0136] В альтернативных реализациях, метаданные ограничения зон громкоговорителей могут указывать, что инструментальное средство представления данных будет применять уравнения панорамирования для вычисления коэффициентов усиления смешанным способом, который в некоторой степени включает вклад от громкоговорителей из заблокированных зон громкоговорителей. Например, логическая система может конфигурироваться для создания метаданных ограничения зон громкоговорителей, указывающих, что инструментальное средство представления данных должно ослаблять выбранные зоны громкоговорителей, выполняя следующие операции: вычисление первых коэффициентов усиления, которые содержат вклады от выбранных (заблокированных) зон громкоговорителей; вычисление вторых коэффициентов усиления, которые не содержат вклады от выбранных зон громкоговорителей; и смешивание первых коэффициентов усиления со вторыми коэффициентами усиления. В некоторых реализациях, к первым коэффициентам усиления и/или ко вторым коэффициентам усиления может применяться смещение (например, от выбранного минимального значения до выбранного максимального значения) с целью допущения некоторого интервала потенциальных вкладов от выбранных зон громкоговорителей.
[0137] В данном примере, инструментальное средство авторской разработки отправляет аудиоданные и метаданные инструментальному средству представления данных в блоке 1225. Логическая система может затем определять, будет ли продолжен процесс авторской разработки (блок 1227). Процесс авторской разработки может продолжаться, если логическая система принимает указатель того, что пользователь изъявляет желание так поступить. Иначе, процесс авторской разработки может завершаться (блок 1229). В некоторых реализациях, операции представления данных могут продолжаться в соответствии с пользовательским вводом.
[0138] Звуковые объекты, содержащие аудиоданные и метаданные, созданные инструментальным средством авторской разработки, принимаются инструментальным средством представления данных в блоке 1230. Данные положения для конкретного звукового объекта в этом примере принимаются в блоке 1235. Логическая система инструментального средства представления данных может применять к данным положения звукового объекта уравнения панорамирования для вычисления коэффициентов усиления в соответствии с правилами ограничения зон громкоговорителей.
[0139] В блоке 1245 вычисленные коэффициенты усиления применяются к аудиоданным. Логическая система может сохранять в системе памяти коэффициент усиления, метаданные местоположения звукового объекта и ограничения зон громкоговорителей. В некоторых реализациях, аудиоданные могут воспроизводиться системой громкоговорителей. Соответствующие характеристики громкоговорителей в некоторых реализациях могут демонстрироваться на дисплее.
[0140] В блоке 1248 определяется, будет ли продолжен процесс 1200. Процесс может продолжаться, если логическая система получает указатель того, что пользователь изъявляет желание так поступить. Например, процесс представления данных может продолжаться, возвращаясь в блок 1230 или блок 1235. Если принимается указатель того, что пользователь изъявляет желание вернуться к соответствующему процессу авторской разработки, процесс может возвращаться в блок 1207 или блок 1210. Иначе, процесс 1200 может завершаться (блок 1250).
[0141] Задачи определения положения и представления данных звуковых объектов в трехмерной виртуальной воспроизводящей среде становятся все более и более сложными. Часть сложностей относится к проблемам представления виртуальной воспроизводящей среды в GUI. Некоторые реализации авторской разработки и представления данных, представленные в данном раскрытии, позволяют пользователю переключаться между панорамированием в двумерном экранном пространстве и панорамированием в трехмерном пространстве помещения. Данная функциональная возможность может помочь сохранить точность определения положения звукового объекта и, в то же время, обеспечить удобство GUI для пользователя.
[0142] На фиг. 13А и 13В показан пример GUI, который может переключаться между двумерным видом и трехмерным видом виртуальной воспроизводящей среды. Со ссылкой на фиг. 13А, GUI 400 отображает изображение 1305 на экране. В этом примере, изображение 1305 представляет собой изображение саблезубого тигра. В данном виде сверху на виртуальную воспроизводящую среду 404 пользователь может легко наблюдать, что звуковой объект 505 находится вблизи зоны 1 громкоговорителей. Вывод о возвышении можно сделать, например, по размеру, цвету или другим признакам звукового объекта 505. Однако в таком виде трудно определить взаимоотношение положения с таковым для изображения 1305.
[0143] В данном примере, GUI 400 может оказываться динамически поворачивающимся вокруг такой оси, как ось 1310. На фиг. 13В показан GUI 1300 после процесса вращения. В данном виде, пользователь может более отчетливо видеть изображение 1305 и может использовать информацию из изображения 1305 для более точного определения положения звукового объекта 505. В данном примере звуковой объект соответствует звуку в том направлении, куда смотрит саблезубый тигр. Имея возможность переключаться между видом сверху и экранным видом виртуальной воспроизводящей среды 404, пользователь имеет возможность быстро и точно выбирать надлежащее возвышение для звукового объекта 505, используя информацию из материала, находящегося на экране.
[0144] В данном раскрытии предусматриваются и другие удобные интерфейсы GUI для авторской разработки и/или представления данных. На фиг. 13С-13Е показаны сочетания двумерных и трехмерных изображений воспроизводящих сред. Со ссылкой на фиг. 13С, в левой области GUI 1310 изображен вид сверху на виртуальную воспроизводящую среду 404. GUI 1310 также содержит трехмерное изображение 1345 виртуальной (или фактической) воспроизводящей среды. Область 1350 трехмерного изображения 1345 соответствует экрану 150 GUI 400. Положение звукового объекта 505, в частности его возвышение, отчетливо видно на трехмерном изображении 1345. В данном примере, на трехмерном изображении 1345 также показана ширина звукового объекта 505.
[0145] Схема 1320 расположения громкоговорителей изображает местоположения 1324-1340 громкоговорителей, каждое из которых может указывать коэффициент усиления, соответствующий положению звукового объекта 505 в виртуальной воспроизводящей среде 404. В некоторых реализациях, схема 1320 расположения громкоговорителей может, например, отображать местоположения воспроизводящих громкоговорителей в такой фактической воспроизводящей среде, как конфигурация Dolby Surround 5.1, конфигурация Dolby Surround 7.1, конфигурация Dolby 7.1, дополненная верхними громкоговорителями и т.д. Когда логическая система принимает указатель положения звукового объекта 505 в виртуальной воспроизводящей среде 404, логическая система может конфигурироваться для присвоения этого положения коэффициентам усиления для местоположений 1324-1340 громкоговорителей схемы 1320 расположения громкоговорителей, например, при помощи вышеописанного процесса амплитудного панорамирования. Например, на фиг. 13С каждое из местоположений 1325, 1335 и 1337 громкоговорителей имеет изменение цвета, указывающее коэффициенты усиления, соответствующие положению звукового объекта 505.
[0146] Со ссылкой на фиг. 13D, звуковой объект был перемещен в положение за экраном 150. Например, пользователь мог переместить звуковой объект 505, помещая курсор на звуковой объект в GUI 400 и перетаскивая его в новое положение. Новое положение также показано в трехмерном изображении 1345, которое было повернуто в новую ориентацию. Характеристики схемы 1320 расположения громкоговорителей могут оказаться такими же, как на фиг. 13С и 13D. Однако в фактическом GUI, местоположения 1325, 1335 и 1337 громкоговорителей могут иметь другой внешний вид (как, например, другую яркость или цвет) для указания соответствующих разностей коэффициентов усиления, вызываемых новым положением звукового объекта 505.
[0147] Со ссылкой на фиг. 13Е, звуковой объект 505 был быстро перемещен в положение в правой задней части виртуальной воспроизводящей среды 404. В момент, изображенный на фиг. 13Е, местоположение 1326 громкоговорителя является отвечающим текущему положению звукового объекта 505, а местоположения 1325 и 1337 громкоговорителей по-прежнему отвечают предыдущему положению звукового объекта 505.
[0148] Фиг. 14А представляет собой схему последовательности операций, которая описывает процесс управления устройством для представления таких интерфейсов GUI, как интерфейсы, показанные на фиг. 13С-13Е. Процесс 1400 начинается в блоке 1405, в котором принимается один или несколько указателей для демонстрации местоположений звукового объекта, местоположений зон громкоговорителей, и местоположений воспроизводящих громкоговорителей для воспроизводящей среды. Местоположения зон громкоговорителей могут соответствовать виртуальной воспроизводящей среде и/или фактической воспроизводящей среде, например, как показано на фиг. 13С-13Е. Указатель (указатели) может приниматься логической системой устройства представления данных и/или авторской разработки и может соответствовать вводу, принимаемому из устройства пользовательского ввода. Например, указатели могут соответствовать пользовательскому выбору конфигурации воспроизводящей среды.
[0149] В блоке 1407 принимаются аудиоданные. Данные положения и ширины звукового объекта принимаются в блоке 1410, например, в соответствии с пользовательским вводом. В блоке 1415 демонстрируется звуковой объект, местоположения зон громкоговорителей и местоположения воспроизводящих громкоговорителей. Положение звукового объекта может демонстрироваться в двумерном и/или трехмерном виде, например, как показано на фиг. 13С-13Е. Данные ширины могут использоваться не только для представления данных звукового объекта, но также могут оказывать влияние на то, каким образом демонстрируется звуковой объект (см. изображение звукового объекта 505 в трехмерном изображении 1345 по фиг. 13С-13Е).
[0150] Аудиоданные и связанные метаданные могут записываться. (Блок 1420). В блоке 1425 инструментальное средство авторской разработки направляет аудиоданные и метаданные инструментальному средству представления данных. Затем логическая система может определять (в блоке 1427), будет ли продолжен процесс авторской разработки. Процесс авторской разработки может продолжаться (например, возвращаясь в блок 1405), если логическая система принимает указатель того, что пользователь изъявляет желание так поступить. Иначе, процесс авторской разработки может завершаться. (Блок 1429).
[0151] Звуковые объекты, включающие аудиоданные и метаданные, созданные инструментальным средством авторской разработки, принимаются инструментальным средством представления данных в блоке 1430. Данные положения для конкретного звукового объекта в данном примере принимаются в блоке 1435. Логическая система инструментального средства авторской разработки может применять уравнения панорамирования с целью вычисления коэффициентов усиления для данных положения звукового объекта в соответствии с метаданными ширины.
[0152] В некоторых реализациях представления данных, логическая система может присваивать зоны громкоговорителей воспроизводящим громкоговорителям воспроизводящей среды. Например, логическая система может получать доступ к структуре данных, которая содержит зоны громкоговорителей и соответствующие местоположения воспроизводящих громкоговорителей. Больше подробностей и примеров описывается ниже со ссылкой на фиг. 14В.
[0153] В некоторых реализациях, уравнения панорамирования могут применяться, например, логической системой в соответствии с положением, шириной звукового объекта и/или другой информацией, такой как местоположения громкоговорителей воспроизводящей среды (блок 1440). В блоке 1445 аудиоданные обрабатываются в соответствии с коэффициентами усиления, которые получаются в блоке 1440. Если изъявляется такое желание, по меньшей мере, некоторые результирующие аудиоданные могут сохраняться наряду с соответствующими данными положения звукового объекта и другими метаданными, принимаемыми из инструментального средства авторской разработки. Аудиоданные могут воспроизводиться громкоговорителями.
[0154] Затем логическая система может определять (блок 1448), будет ли продолжен процесс 1400. Процесс 1400 может продолжаться, если, например, логическая система принимает указатель того, что пользователь изъявляет желание так поступить. Иначе, процесс 1400 может завершаться (блок 1449).
[0155] Фиг. 14В представляет собой схему последовательности операций, которая описывает процесс представления данных звуковых объектов для воспроизводящей среды. Процесс 1450 начинается в блоке 1455, в котором принимается один или несколько указателей для представления данных звуковых объектов для воспроизводящей среды. Указатель (указатели) могут приниматься логической системой устройства представления данных и могут соответствовать вводу, получаемому из устройства пользовательского ввода. Например, указатели могут соответствовать пользовательскому выбору конфигурации воспроизводящей среды.
[0156] В блоке 1457 принимаются данные звуковоспроизведения (в том числе, один или несколько звуковых объектов и связанные метаданные). Данные воспроизводящей среды могут приниматься в блоке 1460. Данные воспроизводящей среды могут содержать указатель количества воспроизводящих громкоговорителей в воспроизводящей среде и указатель местоположения каждого из воспроизводящих громкоговорителей в пределах воспроизводящей среды. Воспроизводящая среда может представлять собой среду звуковой системы для кинематографии, среду домашнего кинотеатра и т.д. В некоторых реализациях, данные воспроизводящей среды могут содержать данные схемы расположения зон воспроизводящих громкоговорителей, указывающие зоны воспроизводящих громкоговорителей, и местоположения воспроизводящих громкоговорителей, которые соответствуют указанным зонам громкоговорителей.
[0157] Воспроизводящая среда может демонстрироваться в блоке 1465. В некоторых реализациях, воспроизводящая среда может демонстрироваться аналогично схеме 1320 расположения громкоговорителей, показанной на фиг. 13С-13Е.
[0158] В блоке 1470 звуковые объекты могут представляться в один или несколько сигналов, подаваемых на громкоговорители, для воспроизводящей среды. В некоторых реализациях, метаданные, связанные со звуковыми объектами могут авторски разрабатываться таким же способом, как способ, описанный выше, и, таким образом, метаданные могут содержать данные коэффициентов усиления, соответствующие зонам громкоговорителей (например, соответствующие зонам 1-9 громкоговорителей в GUI 400). Логическая система может присваивать зоны громкоговорителей воспроизводящим громкоговорителям воспроизводящей среды. Например, логическая система может получать доступ к хранящейся в памяти структуре данных, которая содержит зоны громкоговорителей и соответствующие местоположения громкоговорителей. Устройство представления данных может содержать множество таких структур данных, каждая из которых соответствует отличающейся конфигурации громкоговорителей. В некоторых реализациях, устройство представления данных может содержать такие структуры данных для множества стандартных конфигураций воспроизводящих сред, таких как конфигурация Dolby Surround 5.1, конфигурация Dolby Surround 7.1 и/или конфигурация окружающего звука Hamasaki 22.2.
[0159] В некоторых реализациях, метаданные для звуковых объектов могут содержать другую информацию из процесса авторской разработки. Например, метаданные могут содержать данные ограничения громкоговорителей. Метаданные могут содержать информацию для присвоения положения звукового объекта местоположению единичного воспроизводящего громкоговорителя или местоположению единичной зоны громкоговорителей. Метаданные могут содержать данные, ограничивающие положение звукового объекта одномерной кривой или двумерной поверхностью. Метаданные могут содержать данные траектории звукового объекта. Метаданные могут содержать идентификатор для типа содержимого (например, диалога, музыки или эффектов).
[0160] Соответственно процесс представления данных может включать использование метаданных, например, для наложения ограничений на зоны громкоговорителей. В некоторых таких реализациях, устройство представления данных может предоставлять пользователю возможность модифицировать ограничения, указанные в метаданных, например, путем соответствующей модификации ограничений громкоговорителей и изменения представления данных. Представление данных может включать создание совокупного коэффициента усиления на основе одного или нескольких из следующих параметров: требуемое положение звукового объекта, расстояние от требуемого положения звукового объекта до исходного положения, скорость звукового объекта или тип содержимого звукового объекта. Могут демонстрироваться соответствующие характеристики воспроизводящих громкоговорителей. (Блок 1475). В некоторых реализациях, логическая система может управлять громкоговорителями для воспроизведения звука, соответствующего результатам процесса представления данных.
[0161] В блоке 1480 логическая система может определять, будет ли продолжен процесс 1450. Процесс 1450 может продолжаться, если, например, логическая система принимает указатель того, что пользователь изъявляет желание так поступить. Например, процесс 1450 может продолжаться, возвращаясь в блок 1457 или блок 1460. Иначе, процесс 1450 может завершаться (блок 1485).
[0162] Характерными признаками некоторых существующих систем авторской разработки/представления данных окружающего звука являются распространение и управление кажущейся шириной источника. В данном раскрытии термин «распространение» относится к распределению одного и того же сигнала по нескольким громкоговорителям с целью размытия звукового образа. Термин «ширина» относится к декорреляции выходных сигналов для каждого канала с целью регулирования кажущейся ширины. Ширина может представлять собой дополнительную скалярную величину, которая регулирует величину декорреляции, применяемой к каждому сигналу, подаваемому на громкоговорители.
[0163] Некоторые реализации, описываемые в данном раскрытии, предусматривают регулировку распространения, ориентированную по трехмерной оси. Одна из таких реализаций будет описана ниже со ссылкой на фиг. 15А и 15В. Фиг. 15А показывает один из примеров звукового объекта и связанной ширины звукового объекта в виртуальной воспроизводящей среде. Здесь, GUI 400 указывает эллипсоид 1505, проходящий вокруг звукового объекта 505 и указывающий ширину звукового объекта. Ширина звукового объекта может указываться метаданными звукового объекта и/или приниматься в соответствии с пользовательским вводом. В данном примере, размеры х и y эллипсоида 1505 отличаются, но в других реализациях эти размеры могут быть одинаковыми. Размеры z эллипсоида 1505 на фиг. 15А не показаны.
[0164] На фиг. 15В показан один из примеров профиля распространения, который соответствует ширине звукового объекта, показанной на фиг. 15А. Распространение может быть представлено трехмерным векторным параметром. В данном примере, профиль 1507 распространения может независимо регулироваться по трем направлениям, например, в соответствии с пользовательским вводом. Коэффициенты усиления по осям х и y представлены на фиг. 15В соответствующей высотой кривых 1510 и 1520. Коэффициент усиления для каждого дискретного значения 1512 также указывается размером соответствующих окружностей 1515 в пределах профиля 1507 распространения. Характеристики громкоговорителей 1510 указываются на фиг. 15В серым затенением.
[0165] В некоторых реализациях, профиль 1507 распространения для каждой оси может реализовываться посредством отдельного интеграла. Согласно некоторым реализациям, минимальное значение распространения может выбираться автоматически в зависимости от размещения громкоговорителей во избежание тембральных рассогласований при панорамировании. В альтернативном варианте или в дополнение минимальное значение распространения может устанавливаться автоматически в зависимости от скорости панорамированного звукового объекта так, чтобы по мере возрастания скорости звукового объекта объект становился более уширенным в пространстве аналогично тому, как выглядят размытыми быстро движущиеся изображения в кинокартине.
[0166] При использовании таких реализаций звукового представления данных на основе звукового объекта, как реализации, описываемые в данном раскрытии, потенциально большое количество звуковых дорожек и сопроводительных метаданных (включающих в качестве неограничивающих примеров метаданные, указывающие положения звукового объекта в трехмерном пространстве) может доставляться в воспроизводящую среду в немикшированном виде. Инструментальное средство представления данных в реальном времени может использовать указанные метаданные и информацию в отношении воспроизводящей среды для вычисления сигналов, подаваемых на громкоговорители, с целью оптимизации воспроизведения каждого звукового объекта.
[0167] Когда большое количество звуковых объектов совместно микшируется в выходные сигналы громкоговорителей, может возникать перегрузка или в цифровой области (например, пик цифрового сигнала может срезаться перед аналоговым преобразованием), или в аналоговой области, когда усиленный аналоговый сигнал проигрывается воспроизводящими громкоговорителями. Оба случая могут приводить к слышимому искажению, которое является нежелательным. Перегрузка в аналоговой области также может повреждать воспроизводящие громкоговорители.
[0168] Соответственно некоторые реализации, описываемые в данном раскрытии, включают динамическое «перераспределение» объектов в ответ на перегрузку воспроизводящих громкоговорителей. Если звуковые объекты представляются с заданным профилем распространения, в некоторых реализациях энергия может направляться в увеличенное количество соседних воспроизводящих громкоговорителей с сохранением общей постоянной энергии. Например, если энергия для звукового объекта однородно распределялась по N воспроизводящих громкоговорителей, она может вносить вклад в выходной сигнал каждого воспроизводящего громкоговорителя с коэффициентом усиления 1/sqrt(N). Данный подход обеспечивает при микшировании дополнительный «запас по уровню» и может ослаблять или предотвращать такое искажение воспроизводящих громкоговорителей, как срезание пика.
[0169] Для использования численного примера, предположим, что громкоговоритель будет срезать пик, если он принимает ввод больше 1,0. Положим, что два объекта, как указывается, должны микшироваться в громкоговоритель А, один - на уровне 1,0, и второй - на уровне 0,25. Если перераспределение не использовалось, микшированный уровень в громкоговорителе А составлял бы в сумме 1,25, и возникало бы срезание пика. Однако если первый объект перераспределяется на другой громкоговоритель В, то (согласно некоторым реализациям) каждый громкоговоритель будет принимать указанный объект при 0,707, что в результате приводит к дополнительному «запасу по уровню» в громкоговорителе А для микширования других объектов. Тогда второй объект может безопасно микшироваться в громкоговоритель А без срезания пика, так как микшированный уровень для громкоговорителя А будет составлять 0,707+0,25=0,957.
[0170] В некоторых реализациях, в ходе фазы авторской разработки каждый звуковой объект может микшироваться в одно из подмножеств зон громкоговорителей (или во все зоны громкоговорителей) с заданным коэффициентом усиления при микшировании. Таким образом, можно построить динамический список всех объектов, вносящих вклад в каждый громкоговоритель. В некоторых реализациях, этот список может сортироваться по убыванию уровней энергии, например, с использованием результата умножения начального среднеквадратического (RMS) уровня сигнала на коэффициент усиления при микшировании. В других реализациях, список может сортироваться по другим критериям, таким как приписанная объекту относительная важность.
[0171] В ходе процесса представления данных, если для данного выходного сигнала воспроизводящего громкоговорителя обнаружена перегрузка, энергия звуковых объектов может распространяться по нескольким воспроизводящим громкоговорителям. Например, энергия звуковых объектов может распространяться с использованием коэффициента ширины, или распространения, который пропорционален величине перегрузки и относительному вкладу каждого звукового объекта в данный воспроизводящий громкоговоритель. Если один и тот же звуковой объект вносит вклад в несколько перегруженных воспроизводящих громкоговорителей, его коэффициент ширины или распространения, может, в некоторых реализациях, аддитивно увеличиваться и применяться к следующему представляемому кадру аудиоданных.
[0172] Обычно ограничитель с жестким порогом будет срезать любое значение, которое превышает пороговое значение до значения пороговой величины. Как и в приведенном выше примере, если громкоговоритель принимает микшированный объект на уровне 1,25 и способен допускать максимальный уровень только 1,0, объект будет «жестко ограничен» до 1,0. Ограничитель с плавным порогом будет начинать ограничение перед достижением абсолютного порогового значения для того, чтобы обеспечить более плавный, приятный на слух результат. Ограничители с плавным порогом также могут использовать функциональную возможность «предвидения» для предсказания того, когда в будущем может возникнуть срезание пика, с целью плавного снижения коэффициента усиления перед тем, как срезание пика должно возникнуть, чтобы, таким образом, избежать срезания пика.
[0173] Различные реализации «перераспределения», представленные в данном раскрытии, могут использоваться в сочетании с ограничителем с жестким или плавным порогом для ограничения слышимого искажения, в то же время, избегая ухудшения пространственной точности/резкости. В противоположность глобальному распространению или использованию ограничителей самих по себе, реализации перераспределения могут селективно нацеливаться на громкие объекты или объекты с заданным типом содержимого. Такие реализации могут управляться микшером. Например, если метаданные ограничения зон громкоговорителей для звукового объекта указывают, что некоторое подмножество воспроизводящих громкоговорителей использоваться не должно, устройство представления данных может в дополнение к реализации способа перераспределения применять соответствующие правила ограничения зон громкоговорителей.
[0174] Фиг. 16 представляет собой схему последовательности операций, которая описывает процесс перераспределения звуковых объектов. Процесс 1600 начинается с блока 1605, где принимается один или несколько указателей для активации функциональной возможности перераспределения звуковых объектов. Указатель (указатели) может приниматься логической системой устройства представления данных и может соответствовать вводу, принимаемому из устройства пользовательского ввода. В некоторых реализациях указатели могут включать пользовательский выбор конфигурации воспроизводящей среды. В альтернативных реализациях, пользователь мог предварительно выбрать конфигурацию воспроизводящей среды.
[0175] В блоке 1607 принимаются данные звуковоспроизведения (содержащие один или несколько звуковых объектов и связанные метаданные). В некоторых реализациях, метаданные могут содержать метаданные ограничения зон громкоговорителей, как, например, описано выше. В этом примере, в блоке 1610 в данных звуковоспроизведения отыскиваются (или, иначе, принимаются, например, посредством ввода через пользовательский интерфейс) данные положения, времени и распространения звукового объекта.
[0176] Характеристики воспроизводящих громкоговорителей определяются для определенной конфигурации воспроизводящей среды путем применения уравнений панорамирования к данным звукового объекта, например, как описано выше (блок 1612). В блоке 1615 демонстрируются положение звукового объекта и характеристики воспроизводящих громкоговорителей. Характеристики воспроизводящих громкоговорителей также могут воспроизводиться посредством громкоговорителей, которые сконфигурированы для связи с логической системой.
[0177] В блоке 1620 логическая система определяет, обнаруживается ли перегрузка для какого-либо воспроизводящего громкоговорителя воспроизводящей среды. Если обнаруживается, то до тех пор, пока не перестанет обнаруживаться перегрузка, могут применяться вышеописанные правила перераспределения объектов (блок 1625). Вывод аудиоданных в блоке 1630 может по желанию сохраняться и выводиться на воспроизводящие громкоговорители.
[0178] В блоке 1635 логическая система может определять, будет ли продолжен процесс 1600. Процесс 1600 может продолжаться, если, например, логическая система принимает указатель того, что пользователь изъявляет желание так поступить. Например, процесс 1600 может продолжаться, возвращаясь в блок 1607 или блок 1610. Иначе, процесс 1600 может завершаться (блок 1640).
[0179] Некоторые реализации предусматривают доопределенные уравнения коэффициентов усиления при панорамировании, которые могут использоваться для изображения положения звукового объекта в трехмерном пространстве. Некоторые примеры будут описаны ниже со ссылкой на фиг. 17А и 17В. На фиг. 17А и 17В показаны примеры звукового объекта, помещенного в трехмерную виртуальную воспроизводящую среду. Вначале, со ссылкой на фиг. 17А, можно видеть положение звукового объекта 505 в виртуальной воспроизводящей среде 404. В данном примере, зоны 1-7 громкоговорителей расположены в одной плоскости, а зоны 8 и 9 громкоговорителей расположены в другой плоскости, как показано на фиг. 17В. Однако номера зон громкоговорителей, плоскостей и т.д. даны только для примера; концепции, описываемые в данном раскрытии, могут распространяться на другие номера зон громкоговорителей (или отдельные громкоговорители) и более чем на две плоскости возвышения.
[0180] В данном примере, параметр возвышения «z», который может находиться в интервале от нуля до 1, присваивает положение звукового объекта плоскостям возвышения. В данном примере, значение z=0 соответствует базисной плоскости, которая содержит зоны 1-7 громкоговорителей, в то время как значение z=1 соответствует верхней плоскости, которая содержит зоны 8 и 9 громкоговорителей. Значения z между нулем и 1 соответствуют смешиванию между звуковым образом, генерируемым с использованием только громкоговорителей в базисной плоскости, и звуковым образом, генерируемым с использованием только громкоговорителей в верхней плоскости.
[0181] В примере, показанном на фиг. 17В, параметр возвышения для звукового объекта 505 имеет значение 0,6. Соответственно, в одной из реализаций, первый звуковой образ может генерироваться с использованием уравнений панорамирования для базисной плоскости в соответствии с координатами (х,y) звукового объекта 505 в базисной плоскости. Второй звуковой образ может генерироваться с использованием уравнений панорамирования для верхней плоскости в соответствии с координатами (х,y) звукового объекта 505 в верхней плоскости. Результирующий звуковой образ может генерироваться путем объединения первого звукового образа со вторым звуковым образом в соответствии с близостью звукового объекта 505 к каждой из плоскостей. Может применяться функция возвышения z, сохраняющая энергию или амплитуду. Например, полагая, что z может находиться в интервале от нуля до единицы, значения коэффициентов усиления первого звукового образа могут умножаться на
, а значения коэффициентов усиления второго звукового образа могут умножаться на
так, чтобы сумма их квадратов была равна 1 (сохранение энергии).
[0182] Другие реализации, описываемые в данном раскрытии, могут включать вычисление коэффициентов усиления на основе двух или большего количества методик панорамирования и создание совокупного коэффициента усиления на основе одного или нескольких параметров. Указанные параметры могут содержать один или несколько из следующих параметров: требуемое положение звукового объекта; расстояние от требуемого положения звукового объекта до исходного положения; скорость звукового объекта; или тип содержимого звукового объекта.
[0183] Некоторые указанные реализации будет описаны ниже со ссылкой на фиг. 18 и след. На фиг. 18 показаны примеры зон, которые соответствуют различным режимам панорамирования. Размеры, формы и величина этих зон приводятся только в качестве примера. В данном примере, к звуковым объектам, расположенным в пределах зоны 1805 применяются способы панорамирования в ближней зоне, а к звуковым объектам, расположенным в зоне 1815 за пределами зоны 1810, применяются способы панорамирования в дальней зоне.
[0184] На фиг. 19А-19D показаны примеры применения методик панорамирования в ближней зоне и дальней зоне к звуковым объектам в различных местоположениях. Вначале, со ссылкой на фиг. 19А, звуковой объект по существу находится за пределами виртуальной воспроизводящей среды 1900. Это местоположение соответствует зоне 1815 по фиг. 18. Поэтому в данном случае будет применяться один или несколько способов панорамирования в дальней зоне. В некоторых реализациях, способы панорамирования в дальней зоне могут основываться на уравнениях амплитудного панорамирования на векторной основе (VBAP), которые известны средним специалистам в данной области. Например, способы панорамирования в дальней зоне могут основываться на уравнениях VBAP, описываемых в разделе 2.3, стр.4 публикации V. Pulkki, Compensating Displacement of Amplitude-Panned Virtual Sources (AES International Conference on Virtual, Synthetic and Entertainment Audio), которая ссылкой включается в данное раскрытие. В альтернативных реализациях, для панорамирования звуковых объектов в ближней зоне и дальней зоне могут использоваться другие способы, например, способы, которые включают использование синтеза соответствующих акустических плоскостей или сферической волны. Значимые способы описаны в монографии D. de Vries, Wave Field Synthesis (AES Monograph 1999), которая ссылкой включается в данное раскрытие.
[0185] Со ссылкой на фиг. 19В, звуковой объект находится внутри виртуальной воспроизводящей среды 1900. Его местоположение соответствует зоне 1805 по фиг. 18. Поэтому в данном случае будет применяться один или несколько способов панорамирования в ближней зоне. Некоторые из указанных способов панорамирования в ближней зоне будут использовать несколько зон громкоговорителей, заключающих в себе звуковой объект 505 в виртуальной воспроизводящей среде 1900.
[0186] В некоторых реализациях, способ панорамирования в ближней зоне может включать панорамирование «с двойным балансом» и объединение двух наборов коэффициентов усиления. В примере, изображенном на фиг. 19В, первый набор коэффициентов усиления соответствует переднему/заднему балансу между двумя наборами зон громкоговорителей, заключающих в себе положения звукового объекта 505 по оси y. Соответствующие характеристики включают все зоны громкоговорителей виртуальной воспроизводящей среды 1900 за исключением зон 1915 и 1960 громкоговорителей.
[0187] В примере, изображенном на фиг. 19С, второй набор коэффициентов усиления соответствует левому/правому балансу между двумя наборами зон громкоговорителей, заключающих в себе положения звукового объекта 505 по оси х. Соответствующие характеристики включают зоны 1905-1925 громкоговорителей. На фиг. 19D указан результат объединения характеристик, указанных на фиг. 19 В и 19С.
[0188] По мере того, как звуковой объект входит в виртуальную воспроизводящую среду 1900 или покидает ее, может потребоваться смешивание различных режимов панорамирования. Соответственно, для звуковых объектов, расположенных в зоне 1810 (см. фиг. 18), может применяться смесь коэффициентов усиления, вычисленных согласно способам панорамирования в ближней зоне и способам панорамирования в дальней зоне. В некоторых реализациях, для смешивания коэффициентов усиления, вычисленных согласно способам панорамирования в ближней зоне и способам панорамирования в дальней зоне, может использоваться парный закон панорамирования (например, синусный или степенной закон сохранения энергии). В альтернативных реализациях, парный закон панорамирования может быть сохраняющим амплитуду, а не сохраняющим энергию, так, чтобы вместо суммы квадратов единице была равна сумма. Также можно смешивать результирующие обработанные сигналы, например, для обработки звукового сигнала с независимым использованием обоих способов панорамирования и плавным переходом между двумя результирующими звуковыми сигналами.
[0189] Может потребоваться предусмотреть механизм, позволяющий создателю содержимого и/или воспроизводителю содержимого легко подвергать тонкой регулировке различные измененные представления данных для заданной авторской траектории. В контексте микширования кинокартин, считается важной концепция баланса энергии между экраном и помещением. В некоторых случаях автоматическое изменение представления данных для заданной траектории звука (или «панорамирования») будет приводить к другому балансу между экраном и помещением, зависящему от количества воспроизводящих громкоговорителей в воспроизводящей среде. Согласно некоторым реализациям, смещение между экраном и помещением может регулироваться в соответствии с метаданными, созданными в ходе процесса авторской разработки. Согласно альтернативным реализациям, смещение между экраном и помещением может регулироваться исключительно на стороне представления данных (т.е. под управлением воспроизводителя содержимого), а не в ответ на метаданные.
[0190] Соответственно, некоторые реализации, описываемые в данном раскрытии, предусматривают одну или несколько форм управления смещением между экраном и помещением. В некоторых таких реализациях, смещение между экраном и помещением может реализовываться как операция масштабирования. Например, операция масштабирования может включать оригинальную намеченную траекторию звукового объекта в направлении спереди назад и/или масштабирование положений громкоговорителей, используемых в устройстве представления данных для определения коэффициентов усиления при панорамировании. В некоторых таких реализациях, управление смещением между экраном и помещением может представлять собой переменную величину в интервале от нуля до максимального значения (например, единицы). Изменение может управляться, например, GUI, виртуальным или физическим ползунком, кнопкой и т.д.
[0191] В альтернативном варианте, или в дополнение, управление смещением между экраном и помещением может реализовываться с использованием какой-либо формы ограничения областей громкоговорителей. На фиг. 20 указаны зоны громкоговорителей воспроизводящей среды, которая может использоваться в процессе управления смещением между экраном и помещением. В данном примере, может устанавливаться область 2005 передних громкоговорителей и область 2010 (или 2015) задних громкоговорителей. Смещение между экраном и помещением может регулироваться в зависимости от выбранных областей громкоговорителей. В некоторых таких реализациях, смещение между экраном и помещением может реализовываться как операция масштабирования между областью 2005 передних громкоговорителей и областью 2010 (или 2015) задних громкоговорителей. В альтернативных реализациях, смещение между экраном и помещением может реализовываться бинарным образом, допуская выбор пользователем смещения на передней стороне, смещения на задней стороне или отсутствие смещения. Настройки смещения для каждого случая могут соответствовать предварительно определенным (и, обычно, ненулевым) уровням смещения для области 2005 передних громкоговорителей и области 2010 (или 2015) задних громкоговорителей. По существу, такие реализации могут предусматривать три предварительных набора для управления смещением между экраном и помещением вместо (или в дополнение к) операции масштабирования с непрерывными значениями.
[0192] Согласно некоторым таким реализациям, в GUI (например, 400) для авторской разработки могут создаваться две дополнительные логические зоны громкоговорителей путем разбиения боковых стен на переднюю боковую стену и заднюю боковую стену. В некоторых реализациях, две дополнительные логические зоны громкоговорителей соответствуют областям левой стены/левого окружающего звука и правой стены/правого окружающего звука устройства представления данных. В зависимости от пользовательского выбора того, какие из этих двух логических зон громкоговорителей являются активными, инструментальное средство представления данных может применять предварительно установленные коэффициенты масштабирования (например, описанные выше) при представлении данных в конфигурации Dolby 5.1 или Dolby 7.1. Инструментальное средство представления данных также может применять указанные предварительно определенные коэффициенты масштабирования при представлении данных для воспроизводящих сред, которые поддерживают определение этих двух дополнительных логических зон, например, по причине того, что конфигурации их физических громкоговорителей не содержат более одного физического громкоговорителя на боковой стене.
[0193] Фиг. 21 представляет собой блок-схему, которая приводит примеры компонентов устройства авторской разработки и/или представления данных. В данном примере устройство 2100 содержит систему 2105 интерфейсов. Система 2105 интерфейсов может содержать такой сетевой интерфейс, как беспроводной сетевой интерфейс. В альтернативном варианте, или в дополнение, система 2105 интерфейсов может содержать интерфейс универсальной последовательной шины (USB) или другой подобный интерфейс.
[0194] Устройство 2100 содержит логическую систему 2110. Логическая система 2110 может содержать процессор, такой как одно- или многокристальный процессор общего назначения. Логическая система 2110 может содержать процессор цифровой обработки сигналов (DSP), проблемно-ориентированную интегральную микросхему (ASIC), программируемую вентильную матрицу (FPGA) или другое программируемое логическое устройство, схему на дискретных компонентах или транзисторную логическую схему, или компоненты дискретного аппаратного обеспечения, или их комбинации. Логическая система 2110 может конфигурироваться для управления другими компонентами устройства 2100. И хотя на фиг. 21 не показаны интерфейсы между компонентами устройства 2100, логическая система 2110 может конфигурироваться с интерфейсами для связи с другими компонентами. При необходимости, другие компоненты могут конфигурироваться, или могут не конфигурироваться, для связи друг с другом.
[0195] Логическая система 2110 может конфигурироваться для выполнения функциональной возможности авторской разработки звука и/или представления данных, включающего в качестве неограничивающих примеров те типы функциональных возможностей авторской разработки звука и/или представления данных, которые описаны в данном раскрытии. В некоторых таких реализациях, логическая система 2110 может конфигурироваться для действия (по меньшей мере, частично) в соответствии с программным обеспечением, хранящимся в памяти одного или нескольких постоянных носителей данных. Постоянные носители данных могут включать такую связанную с логической системой 2110 память, как память с произвольным доступом (RAM) и/или постоянное запоминающее устройство (ROM). Постоянные носители данных могут содержать память системы 2115 памяти. Система 2115 памяти может содержать один или несколько постоянных носителей данных подходящих типов, такие как флеш-память, накопитель на жестком магнитном диске и т.д.
[0196] Дисплейная система 2130 может содержать дисплей одного или нескольких подходящих типов в зависимости от проявления устройства 2100. Например, дисплейная система 2130 может содержать жидкокристаллический дисплей, плазменный дисплей, бистабильный дисплей и т.д.
[0197] Система 2135 пользовательского ввода может включать одно или несколько устройств, сконфигурированных для приема ввода от пользователя. В некоторых реализациях, система 2135 пользовательского ввода может содержать сенсорный экран, который накладывается на дисплей дисплейной системы 2130. Система 2135 пользовательского ввода может содержать мышь, шаровой манипулятор, систему обнаружения жестов, джойстик, один или несколько интерфейсов GUI и/или меню, представленные на дисплейной системе 2130, кнопки, клавиатуру, переключатели и т.д. В некоторых реализациях, система 2135 пользовательского ввода может содержать микрофон 2125: пользователь может отдавать устройству 2100 голосовые команды через микрофон 2125. Логическая система может конфигурироваться для распознавания речи и для управления, по меньшей мере, некоторыми операциями устройства 2100 в соответствии с этими голосовыми командами.
[0198] Система 2140 питания может содержать один или несколько подходящих аккумуляторов, таких как никель-кадмиевая батарея или литий-ионная батарея. Система 2140 питания может конфигурироваться для получения энергии от электрической розетки.
[0199] Фиг. 22А представляет собой блок-схему, которая представляет некоторые компоненты, которые могут использоваться для создания звукового содержимого. Например, система 2200 может использоваться для создания звукового содержимого в микшерных студиях и/или монтажных павильонах. В данном примере, система 2200 содержит инструментальное средство 2205 авторской разработки звука и метаданных и инструментальное средство 2210 представления данных. В данной реализации, инструментальное средство 2205 авторской разработки звука и метаданных и инструментальное средство 2210 представления данных содержат, соответственно, интерфейсы 2207 и 2212 подключения звука, которые могут конфигурироваться для связи посредством AES/EBU, MADI, аналоговой связи и т.д. Инструментальное средство 2205 авторской разработки звука и метаданных и инструментальное средство 2210 представления данных содержат, соответственно, сетевые интерфейсы 2209 и 2217, которые могут конфигурироваться для отправки и приема метаданных посредством протокола TCP/IP или любого другого подходящего протокола. Интерфейс 2220 сконфигурирован для вывода аудиоданных на громкоговорители.
[0200] Система 2200 может, например, содержать такую уже существующую систему авторской разработки, как система Pro Tools™, которая запускает инструментальное средство создания метаданных (т.е. описываемое в данном раскрытии инструментальное средство панорамирования) в качестве программного расширения. Инструментальное средство панорамирования также может запускаться в автономной системе (например, на ПК или микшерном пульте), подключенном к инструментальному средству 2210 представления данных, или может запускаться на том же физическом устройстве, что и инструментальное средство 2210 представления данных. В последнем случае, инструментальные средства панорамирования и представления данных могут использовать локальное соединение, например, через совместно используемую память. GUI инструментального средства панорамирования также может являться удаленным на планшетном устройстве, ноутбуке и т.д. Инструментальное средство 2210 представления данных может содержать систему представления данных, которая содержит устройство обработки звука, которое сконфигурировано для исполнения программного обеспечения представления данных. Система представления данных может содержать, например, персональный компьютер, ноутбук и т.д., который содержит интерфейсы для ввода/вывода звука и соответствующую логическую систему.
[0201] Фиг. 22В представляет собой блок-схему, которая отображает некоторые компоненты, которые могут использоваться для проигрывания звука в воспроизводящей среде (например, в кинотеатре). В данном примере, система 2250 содержит сервер 2255 для кинотеатра и систему 2260 представления данных. Сервер 2255 для кинотеатра и система 2260 представления данных содержат сетевые интерфейсы 2257 и 2262, соответственно, которые могут конфигурироваться для отправки и приема звуковых объектов посредством TCP/IP или любого другого подходящего протокола. Интерфейс 2264 сконфигурирован для вывода аудиоданных на громкоговорители.
[0202] Средним специалистам в данной области могут быть легко понятны различные модификации реализаций, описанных в данном раскрытии. Общие принципы, определенные в данном раскрытии, могут применяться к другим реализациям без отступления от духа и объема данного раскрытия. Таким образом, формула изобретения не предполагается как ограниченная реализациями, показанными в данном раскрытии, но подлежит согласованию с наиболее широким объемом, соответствующим данному раскрытию, принципам и новаторским характерным признакам, раскрытым в данном раскрытии.
Claims (42)
1. Устройство, содержащее:
систему интерфейсов; и
логическую систему, сконфигурированную для:
приема через систему интерфейсов данных звуковоспроизведения, содержащих один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
приема через систему интерфейсов данных воспроизводящей среды, содержащих указатель количества воспроизводящих громкоговорителей фактической трехмерной воспроизводящей среды и указатель местоположения каждого воспроизводящего громкоговорителя в пределах фактической воспроизводящей среды;
присвоения данных звуковоспроизведения, созданных в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представления одного или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
систему интерфейсов; и
логическую систему, сконфигурированную для:
приема через систему интерфейсов данных звуковоспроизведения, содержащих один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
приема через систему интерфейсов данных воспроизводящей среды, содержащих указатель количества воспроизводящих громкоговорителей фактической трехмерной воспроизводящей среды и указатель местоположения каждого воспроизводящего громкоговорителя в пределах фактической воспроизводящей среды;
присвоения данных звуковоспроизведения, созданных в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представления одного или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
2. Устройство по п. 1, отличающееся тем, что воспроизводящая среда содержит среду звуковой системы для кинематографии.
3. Устройство по п. 1, отличающееся тем, что фактическая воспроизводящая среда содержит конфигурацию 7.1.
4. Устройство по п. 1, отличающееся тем, что данные фактической воспроизводящей среды содержат данные схемы расположения воспроизводящих громкоговорителей, указывающие местоположения воспроизводящих громкоговорителей.
5. Устройство по п. 1, отличающееся тем, что данные фактической воспроизводящей среды содержат данные схемы расположения зон воспроизводящих громкоговорителей, указывающие местоположения воспроизводящих громкоговорителей.
6. Устройство по п. 5, отличающееся тем, что метаданные содержат информацию для присвоения положения звукового объекта местоположению единичного воспроизводящего громкоговорителя.
7. Устройство по п. 1, отличающееся тем, что представление данных включает создание коэффициента усиления на основе одного или нескольких из следующих параметров: требуемое положение звукового объекта, расстояние от требуемого положения звукового объекта до исходного положения, скорость звукового объекта или тип содержимого звукового объекта.
8. Устройство по п. 1, отличающееся тем, что двумерная поверхность содержит одно из следующего: сферическую поверхность, эллиптическую поверхность, коническую поверхность, цилиндрическую поверхность или клин.
9. Устройство по п. 1, отличающееся тем, что представление данных включает наложение ограничений на зоны громкоговорителей, содержащие данные для блокирования выбранных воспроизводящих громкоговорителей.
10. Устройство по п. 1, отличающееся тем, что фактическая воспроизводящая среда содержит экран для проецирования видеоизображений; при этом данные звуковоспроизведения синхронизированы с видеоизображениями; и при этом представление данных включает применение управления балансом между экраном и помещением в соответствии с данными управления балансом между экраном и помещением, принимаемым из системы пользовательского ввода.
11. Устройство по п. 1, отличающееся тем, что дополнительно содержит дисплейную систему, где логическая система сконфигурирована для управления дисплейной системой с целью демонстрации динамического трехмерного вида фактической воспроизводящей среды.
12. Устройство по п. 1, отличающееся тем, что представление данных включает управление распространением звукового объекта в одном или нескольких из трех измерений по нескольким воспроизводящим громкоговорителям.
13. Устройство по п. 1, отличающееся тем, что представление данных включает динамическое перераспределение объекта в ответ на перегрузку громкоговорителей путем направления энергии звука в увеличенное количество соседних воспроизводящих громкоговорителей с сохранением общей постоянной энергии.
14. Устройство по п. 1, отличающееся тем, что представление данных включает присвоение положений звуковых объектов плоскостям массивов громкоговорителей фактической воспроизводящей среды.
15. Устройство по п. 1, отличающееся тем, что дополнительно содержит запоминающее устройство, при этом система интерфейсов содержит интерфейс между логической системой и запоминающим устройством.
16. Устройство по п. 1, отличающееся тем, что система интерфейсов содержит сетевой интерфейс.
17. Устройство по п. 1, отличающееся тем, что логическая система сконфигурирована для определения того, применять правила панорамирования для положения звукового объекта к нескольким местоположениям громкоговорителей или присвоить положение звукового объекта местоположению единичного громкоговорителя.
18. Устройство по п. 17, отличающееся тем, что логическая система сконфигурирована для сглаживания переходов между коэффициентами усиления громкоговорителей при переходе от присвоения положения звукового объекта от местоположения первого единичного громкоговорителя в местоположение второго единичного громкоговорителя.
19. Устройство по п. 17, отличающееся тем, что логическая система сконфигурирована для сглаживания переходов между коэффициентами усиления громкоговорителей при переходе от присвоения положения звукового объекта местоположению единичного громкоговорителя и к применению правил панорамирования для положения звукового объекта к местоположениям громкоговорителей.
20. Устройство по любому из пп. 1-19, отличающееся тем, что логическая система дополнительно сконфигурирована для вычисления коэффициентов усиления громкоговорителей, соответствующих нескольким зонам громкоговорителей.
21. Устройство по п. 20, отличающееся тем, что логическая система дополнительно сконфигурирована для вычисления коэффициентов громкоговорителей для положений звукового объекта на одномерной кривой между положениями виртуальных громкоговорителей.
22. Способ, включающий этапы, на которых:
принимают данные звуковоспроизведения, содержащие один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
принимают данные воспроизводящей среды, содержащие указатель количества воспроизводящих громкоговорителей в фактической воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя трехмерной фактической воспроизводящей среды;
присваивают данные звуковоспроизведения, созданные в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представляют один или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
принимают данные звуковоспроизведения, содержащие один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
принимают данные воспроизводящей среды, содержащие указатель количества воспроизводящих громкоговорителей в фактической воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя трехмерной фактической воспроизводящей среды;
присваивают данные звуковоспроизведения, созданные в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представляют один или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
23. Способ по п. 22, отличающийся тем, что фактическая воспроизводящая среда содержит среду звуковой системы для кинематографии.
24. Способ по п. 22, отличающийся тем, что представление данных включает создание коэффициента усиления на основе одного или нескольких из следующих параметров: требуемое положение звукового объекта, расстояние от требуемого положения звукового объекта до исходного положения, скорость звукового объекта или тип содержимого звукового объекта.
25. Способ по п. 22, отличающийся тем, что представление данных включает наложение ограничений на зоны громкоговорителей, которые содержат данные для блокирования выбранных воспроизводящих громкоговорителей.
26. Постоянный носитель данных, содержащий хранящееся в его памяти программное обеспечение, при этом программное обеспечение содержит команды для выполнения следующих операций:
приема данных звуковоспроизведения, содержащих один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
приема данных воспроизводящей среды, содержащих указатель количества воспроизводящих громкоговорителей в фактической воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя трехмерной фактической воспроизводящей среды;
присвоения данных звуковоспроизведения, созданных в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представления одного или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
приема данных звуковоспроизведения, содержащих один или несколько звуковых объектов и связанные метаданные; при этом связанные метаданные содержат данные траектории для по меньшей мере одного из одного или нескольких звуковых объектов, указывающие переменное во времени положение звукового объекта по меньшей мере одного звукового объекта в пределах трехмерного пространства; при этом положение звукового объекта ограничено двумерной поверхностью; при этом данные звуковоспроизведения созданы в отношении виртуальной воспроизводящей среды, содержащей множество зон громкоговорителей при различных возвышениях;
приема данных воспроизводящей среды, содержащих указатель количества воспроизводящих громкоговорителей в фактической воспроизводящей среде и указатель местоположения каждого воспроизводящего громкоговорителя трехмерной фактической воспроизводящей среды;
присвоения данных звуковоспроизведения, созданных в отношении нескольких зон громкоговорителей виртуальной воспроизводящей среды воспроизводящим громкоговорителям фактической воспроизводящей среды; и
представления одного или нескольких звуковых объектов в один или несколько сигналов, подаваемых на громкоговорители по меньшей мере частично на основе связанных метаданных, где каждый сигнал, подаваемый на громкоговоритель, соответствует по меньшей мере одному из воспроизводящих громкоговорителей в пределах фактической воспроизводящей среды.
27. Постоянный носитель данных по п. 26, отличающийся тем, что фактическая воспроизводящая среда содержит среду звуковой системы для кинематографии.
28. Постоянный носитель данных по п. 26, отличающийся тем, что представление данных включает создание коэффициента усиления на основе одного или нескольких из следующих параметров: требуемое положение звукового объекта, расстояние от требуемого положения звукового объекта до исходного положения, скорость звукового объекта или тип содержимого звукового объекта.
29. Постоянный носитель данных по п. 26, отличающийся тем, что представление данных включает наложение ограничений на зоны громкоговорителей, которые содержат данные для блокирования выбранных воспроизводящих громкоговорителей.
30. Постоянный носитель данных по п. 26, отличающийся тем, что представление данных включает динамическое перераспределение объекта в ответ на перегрузку громкоговорителей путем направления энергии звука в увеличенное количество соседних воспроизводящих громкоговорителей с сохранением общей постоянной энергии.
31. Устройство (2100) для авторской разработки звукового объекта, при этом устройство (2100) содержит:
систему (2105) интерфейсов;
систему (2135) пользовательского ввода;
дисплейную систему (2130); и
логическую систему (2110), сконфигурированную для:
приема аудиоданных через систему интерфейсов;
демонстрирования виртуальной воспроизводящей среды в графическом пользовательском интерфейсе на дисплейной системе (2130); при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
приема пользовательского ввода в отношении положения звукового объекта посредством системы пользовательского ввода;
определения данных траектории, указывающих переменное во времени положение звукового объекта в трехмерном пространстве в соответствии с пользовательским вводом, полученным посредством системы пользовательского ввода, при этом определение включает ограничение переменного во времени положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрирования траектории звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе;
создания метаданных, связанных со звуковым объектом, при этом метаданные содержат данные траектории.
систему (2105) интерфейсов;
систему (2135) пользовательского ввода;
дисплейную систему (2130); и
логическую систему (2110), сконфигурированную для:
приема аудиоданных через систему интерфейсов;
демонстрирования виртуальной воспроизводящей среды в графическом пользовательском интерфейсе на дисплейной системе (2130); при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
приема пользовательского ввода в отношении положения звукового объекта посредством системы пользовательского ввода;
определения данных траектории, указывающих переменное во времени положение звукового объекта в трехмерном пространстве в соответствии с пользовательским вводом, полученным посредством системы пользовательского ввода, при этом определение включает ограничение переменного во времени положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрирования траектории звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе;
создания метаданных, связанных со звуковым объектом, при этом метаданные содержат данные траектории.
32. Устройство по п. 31, отличающееся тем, что двумерная поверхность содержит одно из следующего: сферическую поверхность, эллиптическую поверхность, коническую поверхность, цилиндрическую поверхность или клин.
33. Устройство по п. 31, отличающееся тем, что данные траектории содержат набор положений в пределах трехмерного пространства для нескольких моментов времени.
34. Устройство по п. 31, отличающееся тем, что данные траектории содержат исходное положение, данные скорости и данные ускорения.
35. Устройство по п. 31, отличающееся тем, что данные траектории содержат исходное положение и уравнение, которое определяет положения в трехмерном пространстве и соответствующие показатели времени.
36. Устройство по п. 31, отличающееся тем, что дополнительно содержит систему звуковоспроизведения, где логическая система сконфигурирована для управления системой звуковоспроизведения, по меньшей мере частично, в соответствии с метаданными.
37. Устройство по п. 31, отличающееся тем, что несколько зон громкоговорителей соответствуют воспроизводящим громкоговорителям фактической трехмерной воспроизводящей среды, содержащей воспроизводящие громкоговорители, или где несколько зон громкоговорителей соответствуют виртуальным громкоговорителям виртуальной среды окружающего звука.
38. Устройство по п. 31, отличающееся тем, что увеличенное возвышение звукового объекта указывают в графическом пользовательском интерфейсе путем увеличения диаметра окружности, которая представляет звуковой объект в графическом пользовательском интерфейсе.
39. Способ, включающий этапы, на которых:
принимают аудиоданные;
демонстрируют виртуальную воспроизводящую среду в графическом пользовательском интерфейсе на дисплейной системе; при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
принимают пользовательский ввод, касающийся положения звукового объекта;
определяют данные траектории, указывающие переменное во времени положение звукового объекта в трехмерном пространстве, где указанное определение включает ограничение положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрируют траекторию звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе; и
создают метаданные, связанные со звуковым объектом; при этом метаданные содержат данные траектории.
принимают аудиоданные;
демонстрируют виртуальную воспроизводящую среду в графическом пользовательском интерфейсе на дисплейной системе; при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
принимают пользовательский ввод, касающийся положения звукового объекта;
определяют данные траектории, указывающие переменное во времени положение звукового объекта в трехмерном пространстве, где указанное определение включает ограничение положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрируют траекторию звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе; и
создают метаданные, связанные со звуковым объектом; при этом метаданные содержат данные траектории.
40. Способ по п. 39, отличающийся тем, что двумерная поверхность содержит одно из следующего: сферическую поверхность, эллиптическую поверхность, коническую поверхность, цилиндрическую поверхность или клин.
41. Постоянный носитель данных, содержащий хранящееся в его памяти программное обеспечение, при этом программное обеспечение содержит команды для выполнения следующих операций:
приема аудиоданных;
демонстрирования виртуальной воспроизводящей среды в графическом пользовательском интерфейсе на дисплейной системе; при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
приема пользовательского ввода, касающегося положения звукового объекта;
определения данных траектории, указывающих переменное во времени положение звукового объекта в трехмерном пространстве, где указанное определение включает ограничение положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрации траектории звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе; и
создания метаданных, связанных со звуковым объектом; при этом метаданные содержат данные траектории.
приема аудиоданных;
демонстрирования виртуальной воспроизводящей среды в графическом пользовательском интерфейсе на дисплейной системе; при этом виртуальная воспроизводящая среда содержит несколько зон громкоговорителей на различных возвышениях;
приема пользовательского ввода, касающегося положения звукового объекта;
определения данных траектории, указывающих переменное во времени положение звукового объекта в трехмерном пространстве, где указанное определение включает ограничение положения двумерной поверхностью в пределах трехмерного пространства; при этом звуковой объект содержит аудиоданные;
демонстрации траектории звукового объекта в соответствии с данными траектории в графическом пользовательском интерфейсе; и
создания метаданных, связанных со звуковым объектом; при этом метаданные содержат данные траектории.
42. Постоянный носитель данных по п. 41, отличающийся тем, что двумерная поверхность содержит одно из следующего: сферическую поверхность, эллиптическую поверхность, коническую поверхность, цилиндрическую поверхность или клин.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201161504005P | 2011-07-01 | 2011-07-01 | |
US61/504,005 | 2011-07-01 | ||
US201261636102P | 2012-04-20 | 2012-04-20 | |
US61/636,102 | 2012-04-20 | ||
PCT/US2012/044363 WO2013006330A2 (en) | 2011-07-01 | 2012-06-27 | System and tools for enhanced 3d audio authoring and rendering |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015109613A Division RU2672130C2 (ru) | 2011-07-01 | 2012-06-27 | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |
Publications (1)
Publication Number | Publication Date |
---|---|
RU2554523C1 true RU2554523C1 (ru) | 2015-06-27 |
Family
ID=46551864
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2013158064/08A RU2554523C1 (ru) | 2011-07-01 | 2012-06-27 | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |
RU2015109613A RU2672130C2 (ru) | 2011-07-01 | 2012-06-27 | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2015109613A RU2672130C2 (ru) | 2011-07-01 | 2012-06-27 | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |
Country Status (21)
Country | Link |
---|---|
US (8) | US9204236B2 (ru) |
EP (4) | EP4132011A3 (ru) |
JP (8) | JP5798247B2 (ru) |
KR (8) | KR102052539B1 (ru) |
CN (2) | CN106060757B (ru) |
AR (1) | AR086774A1 (ru) |
AU (7) | AU2012279349B2 (ru) |
BR (1) | BR112013033835B1 (ru) |
CA (7) | CA3238161A1 (ru) |
CL (1) | CL2013003745A1 (ru) |
DK (1) | DK2727381T3 (ru) |
ES (2) | ES2909532T3 (ru) |
HK (1) | HK1225550A1 (ru) |
HU (1) | HUE058229T2 (ru) |
IL (8) | IL307218A (ru) |
MX (5) | MX2013014273A (ru) |
MY (1) | MY181629A (ru) |
PL (1) | PL2727381T3 (ru) |
RU (2) | RU2554523C1 (ru) |
TW (7) | TWI548290B (ru) |
WO (1) | WO2013006330A2 (ru) |
Families Citing this family (143)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5798247B2 (ja) | 2011-07-01 | 2015-10-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 向上した3dオーディオ作成および表現のためのシステムおよびツール |
KR101901908B1 (ko) * | 2011-07-29 | 2018-11-05 | 삼성전자주식회사 | 오디오 신호 처리 방법 및 그에 따른 오디오 신호 처리 장치 |
KR101744361B1 (ko) * | 2012-01-04 | 2017-06-09 | 한국전자통신연구원 | 다채널 오디오 신호 편집 장치 및 방법 |
US9264840B2 (en) * | 2012-05-24 | 2016-02-16 | International Business Machines Corporation | Multi-dimensional audio transformations and crossfading |
EP2862370B1 (en) * | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
WO2014044332A1 (en) * | 2012-09-24 | 2014-03-27 | Iosono Gmbh | Method for controlling a three-dimensional multi-layer speaker arrangement and apparatus for playing back three-dimensional sound in an audience area |
US10158962B2 (en) | 2012-09-24 | 2018-12-18 | Barco Nv | Method for controlling a three-dimensional multi-layer speaker arrangement and apparatus for playing back three-dimensional sound in an audience area |
RU2612997C2 (ru) * | 2012-12-27 | 2017-03-14 | Николай Лазаревич Быченко | Способ управления звуком для зрительного зала |
JP6174326B2 (ja) * | 2013-01-23 | 2017-08-02 | 日本放送協会 | 音響信号作成装置及び音響信号再生装置 |
US9648439B2 (en) | 2013-03-12 | 2017-05-09 | Dolby Laboratories Licensing Corporation | Method of rendering one or more captured audio soundfields to a listener |
KR102332632B1 (ko) * | 2013-03-28 | 2021-12-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 임의적 라우드스피커 배치들로의 겉보기 크기를 갖는 오디오 오브젝트들의 렌더링 |
EP2979467B1 (en) | 2013-03-28 | 2019-12-18 | Dolby Laboratories Licensing Corporation | Rendering audio using speakers organized as a mesh of arbitrary n-gons |
US9786286B2 (en) | 2013-03-29 | 2017-10-10 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
TWI530941B (zh) | 2013-04-03 | 2016-04-21 | 杜比實驗室特許公司 | 用於基於物件音頻之互動成像的方法與系統 |
MX2015014065A (es) | 2013-04-05 | 2016-11-25 | Thomson Licensing | Metodo para manejar campo reverberante para audio inmersivo. |
US9767819B2 (en) * | 2013-04-11 | 2017-09-19 | Nuance Communications, Inc. | System for automatic speech recognition and audio entertainment |
CN105144751A (zh) * | 2013-04-15 | 2015-12-09 | 英迪股份有限公司 | 用于产生虚拟对象的音频信号处理方法 |
RU2667377C2 (ru) | 2013-04-26 | 2018-09-19 | Сони Корпорейшн | Способ и устройство обработки звука и программа |
EP2991383B1 (en) * | 2013-04-26 | 2021-01-27 | Sony Corporation | Audio processing device and audio processing system |
KR20140128564A (ko) * | 2013-04-27 | 2014-11-06 | 인텔렉추얼디스커버리 주식회사 | 음상 정위를 위한 오디오 시스템 및 방법 |
RU2667630C2 (ru) | 2013-05-16 | 2018-09-21 | Конинклейке Филипс Н.В. | Устройство аудиообработки и способ для этого |
US9491306B2 (en) * | 2013-05-24 | 2016-11-08 | Broadcom Corporation | Signal processing control in an audio device |
KR101458943B1 (ko) * | 2013-05-31 | 2014-11-07 | 한국산업은행 | 가상 스크린 내 오브젝트 위치를 이용한 스피커 제어 장치 및 방법 |
TWI615834B (zh) * | 2013-05-31 | 2018-02-21 | Sony Corp | 編碼裝置及方法、解碼裝置及方法、以及程式 |
EP3011764B1 (en) | 2013-06-18 | 2018-11-21 | Dolby Laboratories Licensing Corporation | Bass management for audio rendering |
EP2818985B1 (en) * | 2013-06-28 | 2021-05-12 | Nokia Technologies Oy | A hovering input field |
EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
EP2830049A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
KR102327504B1 (ko) * | 2013-07-31 | 2021-11-17 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 공간적으로 분산된 또는 큰 오디오 오브젝트들의 프로세싱 |
US9483228B2 (en) | 2013-08-26 | 2016-11-01 | Dolby Laboratories Licensing Corporation | Live engine |
US8751832B2 (en) * | 2013-09-27 | 2014-06-10 | James A Cashin | Secure system and method for audio processing |
US9807538B2 (en) | 2013-10-07 | 2017-10-31 | Dolby Laboratories Licensing Corporation | Spatial audio processing system and method |
KR102226420B1 (ko) * | 2013-10-24 | 2021-03-11 | 삼성전자주식회사 | 다채널 오디오 신호 생성 방법 및 이를 수행하기 위한 장치 |
EP3075173B1 (en) | 2013-11-28 | 2019-12-11 | Dolby Laboratories Licensing Corporation | Position-based gain adjustment of object-based audio and ring-based channel audio |
EP2892250A1 (en) | 2014-01-07 | 2015-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating a plurality of audio channels |
US9578436B2 (en) | 2014-02-20 | 2017-02-21 | Bose Corporation | Content-aware audio modes |
CN103885596B (zh) * | 2014-03-24 | 2017-05-24 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
WO2015147533A2 (ko) | 2014-03-24 | 2015-10-01 | 삼성전자 주식회사 | 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
KR101534295B1 (ko) * | 2014-03-26 | 2015-07-06 | 하수호 | 멀티 뷰어 영상 및 3d 입체음향 제공방법 및 장치 |
EP2925024A1 (en) * | 2014-03-26 | 2015-09-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for audio rendering employing a geometric distance definition |
EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
WO2015152661A1 (ko) * | 2014-04-02 | 2015-10-08 | 삼성전자 주식회사 | 오디오 오브젝트를 렌더링하는 방법 및 장치 |
KR102302672B1 (ko) | 2014-04-11 | 2021-09-15 | 삼성전자주식회사 | 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체 |
WO2015177224A1 (en) * | 2014-05-21 | 2015-11-26 | Dolby International Ab | Configuring playback of audio via a home audio playback system |
USD784360S1 (en) | 2014-05-21 | 2017-04-18 | Dolby International Ab | Display screen or portion thereof with a graphical user interface |
WO2015180866A1 (en) * | 2014-05-28 | 2015-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Data processor and transport of user control data to audio decoders and renderers |
DE102014217626A1 (de) * | 2014-09-03 | 2016-03-03 | Jörg Knieschewski | Lautsprechereinheit |
RU2698779C2 (ru) | 2014-09-04 | 2019-08-29 | Сони Корпорейшн | Устройство передачи, способ передачи, устройство приема и способ приема |
US9706330B2 (en) * | 2014-09-11 | 2017-07-11 | Genelec Oy | Loudspeaker control |
WO2016039287A1 (ja) | 2014-09-12 | 2016-03-17 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
EP3192282A1 (en) * | 2014-09-12 | 2017-07-19 | Dolby Laboratories Licensing Corp. | Rendering audio objects in a reproduction environment that includes surround and/or height speakers |
WO2016052191A1 (ja) | 2014-09-30 | 2016-04-07 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
EP3208801A4 (en) | 2014-10-16 | 2018-03-28 | Sony Corporation | Transmitting device, transmission method, receiving device, and receiving method |
GB2532034A (en) * | 2014-11-05 | 2016-05-11 | Lee Smiles Aaron | A 3D visual-audio data comprehension method |
CN106537942A (zh) * | 2014-11-11 | 2017-03-22 | 谷歌公司 | 3d沉浸式空间音频系统和方法 |
KR102605480B1 (ko) | 2014-11-28 | 2023-11-24 | 소니그룹주식회사 | 송신 장치, 송신 방법, 수신 장치 및 수신 방법 |
USD828845S1 (en) | 2015-01-05 | 2018-09-18 | Dolby International Ab | Display screen or portion thereof with transitional graphical user interface |
JP6732764B2 (ja) | 2015-02-06 | 2020-07-29 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 適応オーディオ・コンテンツのためのハイブリッドの優先度に基づくレンダリング・システムおよび方法 |
CN105992120B (zh) | 2015-02-09 | 2019-12-31 | 杜比实验室特许公司 | 音频信号的上混音 |
EP3258467B1 (en) | 2015-02-10 | 2019-09-18 | Sony Corporation | Transmission and reception of audio streams |
CN105989845B (zh) * | 2015-02-25 | 2020-12-08 | 杜比实验室特许公司 | 视频内容协助的音频对象提取 |
WO2016148553A2 (ko) * | 2015-03-19 | 2016-09-22 | (주)소닉티어랩 | 3차원 사운드를 편집 및 제공하는 방법 및 장치 |
US9609383B1 (en) * | 2015-03-23 | 2017-03-28 | Amazon Technologies, Inc. | Directional audio for virtual environments |
CN111586533B (zh) * | 2015-04-08 | 2023-01-03 | 杜比实验室特许公司 | 音频内容的呈现 |
US10136240B2 (en) * | 2015-04-20 | 2018-11-20 | Dolby Laboratories Licensing Corporation | Processing audio data to compensate for partial hearing loss or an adverse hearing environment |
WO2016171002A1 (ja) | 2015-04-24 | 2016-10-27 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
US10187738B2 (en) * | 2015-04-29 | 2019-01-22 | International Business Machines Corporation | System and method for cognitive filtering of audio in noisy environments |
US9681088B1 (en) * | 2015-05-05 | 2017-06-13 | Sprint Communications Company L.P. | System and methods for movie digital container augmented with post-processing metadata |
US10628439B1 (en) | 2015-05-05 | 2020-04-21 | Sprint Communications Company L.P. | System and method for movie digital content version control access during file delivery and playback |
WO2016183379A2 (en) | 2015-05-14 | 2016-11-17 | Dolby Laboratories Licensing Corporation | Generation and playback of near-field audio content |
KR101682105B1 (ko) * | 2015-05-28 | 2016-12-02 | 조애란 | 입체음향 조절 방법 및 장치 |
CN106303897A (zh) | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
CA3149389A1 (en) | 2015-06-17 | 2016-12-22 | Sony Corporation | Transmitting device, transmitting method, receiving device, and receiving method |
KR102633077B1 (ko) * | 2015-06-24 | 2024-02-05 | 소니그룹주식회사 | 음성 처리 장치 및 방법, 그리고 기록 매체 |
WO2016210174A1 (en) * | 2015-06-25 | 2016-12-29 | Dolby Laboratories Licensing Corporation | Audio panning transformation system and method |
US9854376B2 (en) * | 2015-07-06 | 2017-12-26 | Bose Corporation | Simulating acoustic output at a location corresponding to source position data |
US9847081B2 (en) | 2015-08-18 | 2017-12-19 | Bose Corporation | Audio systems for providing isolated listening zones |
US9913065B2 (en) | 2015-07-06 | 2018-03-06 | Bose Corporation | Simulating acoustic output at a location corresponding to source position data |
JP6729585B2 (ja) | 2015-07-16 | 2020-07-22 | ソニー株式会社 | 情報処理装置および方法、並びにプログラム |
TWI736542B (zh) * | 2015-08-06 | 2021-08-21 | 日商新力股份有限公司 | 資訊處理裝置、資料配訊伺服器及資訊處理方法、以及非暫時性電腦可讀取之記錄媒體 |
US20170086008A1 (en) * | 2015-09-21 | 2017-03-23 | Dolby Laboratories Licensing Corporation | Rendering Virtual Audio Sources Using Loudspeaker Map Deformation |
US20170098452A1 (en) * | 2015-10-02 | 2017-04-06 | Dts, Inc. | Method and system for audio processing of dialog, music, effect and height objects |
EP3706444B1 (en) * | 2015-11-20 | 2023-12-27 | Dolby Laboratories Licensing Corporation | Improved rendering of immersive audio content |
WO2017087564A1 (en) * | 2015-11-20 | 2017-05-26 | Dolby Laboratories Licensing Corporation | System and method for rendering an audio program |
EP3389046B1 (en) | 2015-12-08 | 2021-06-16 | Sony Corporation | Transmission device, transmission method, reception device, and reception method |
WO2017098772A1 (ja) * | 2015-12-11 | 2017-06-15 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
WO2017104519A1 (ja) | 2015-12-18 | 2017-06-22 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
CN106937205B (zh) * | 2015-12-31 | 2019-07-02 | 上海励丰创意展示有限公司 | 面向影视、舞台的复杂声效轨迹控制方法 |
CN106937204B (zh) * | 2015-12-31 | 2019-07-02 | 上海励丰创意展示有限公司 | 全景多声道声效轨迹控制方法 |
WO2017126895A1 (ko) * | 2016-01-19 | 2017-07-27 | 지오디오랩 인코포레이티드 | 오디오 신호 처리 장치 및 처리 방법 |
EP3203363A1 (en) * | 2016-02-04 | 2017-08-09 | Thomson Licensing | Method for controlling a position of an object in 3d space, computer readable storage medium and apparatus configured to control a position of an object in 3d space |
CN105898668A (zh) * | 2016-03-18 | 2016-08-24 | 南京青衿信息科技有限公司 | 一种声场空间的坐标定义方法 |
WO2017173776A1 (zh) * | 2016-04-05 | 2017-10-12 | 向裴 | 三维环境中的音频编辑方法与系统 |
US10863297B2 (en) | 2016-06-01 | 2020-12-08 | Dolby International Ab | Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position |
HK1219390A2 (zh) * | 2016-07-28 | 2017-03-31 | Siremix Gmbh | 終端混音設備 |
US10419866B2 (en) | 2016-10-07 | 2019-09-17 | Microsoft Technology Licensing, Llc | Shared three-dimensional audio bed |
JP7014176B2 (ja) | 2016-11-25 | 2022-02-01 | ソニーグループ株式会社 | 再生装置、再生方法、およびプログラム |
WO2018147143A1 (ja) | 2017-02-09 | 2018-08-16 | ソニー株式会社 | 情報処理装置および情報処理方法 |
EP3373604B1 (en) * | 2017-03-08 | 2021-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for providing a measure of spatiality associated with an audio stream |
WO2018167948A1 (ja) * | 2017-03-17 | 2018-09-20 | ヤマハ株式会社 | コンテンツ再生機器、方法、及びコンテンツ再生システム |
JP6926640B2 (ja) * | 2017-04-27 | 2021-08-25 | ティアック株式会社 | 目標位置設定装置及び音像定位装置 |
EP3410747B1 (en) * | 2017-06-02 | 2023-12-27 | Nokia Technologies Oy | Switching rendering mode based on location data |
US20180357038A1 (en) * | 2017-06-09 | 2018-12-13 | Qualcomm Incorporated | Audio metadata modification at rendering device |
WO2019067469A1 (en) * | 2017-09-29 | 2019-04-04 | Zermatt Technologies Llc | FILE FORMAT FOR SPACE |
EP3474576B1 (en) * | 2017-10-18 | 2022-06-15 | Dolby Laboratories Licensing Corporation | Active acoustics control for near- and far-field audio objects |
US10531222B2 (en) * | 2017-10-18 | 2020-01-07 | Dolby Laboratories Licensing Corporation | Active acoustics control for near- and far-field sounds |
FR3072840B1 (fr) * | 2017-10-23 | 2021-06-04 | L Acoustics | Arrangement spatial de dispositifs de diffusion sonore |
EP3499917A1 (en) * | 2017-12-18 | 2019-06-19 | Nokia Technologies Oy | Enabling rendering, for consumption by a user, of spatial audio content |
WO2019132516A1 (ko) * | 2017-12-28 | 2019-07-04 | 박승민 | 입체 음향 컨텐츠 저작 방법 및 이를 위한 장치 |
WO2019149337A1 (en) | 2018-01-30 | 2019-08-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs |
JP7146404B2 (ja) * | 2018-01-31 | 2022-10-04 | キヤノン株式会社 | 信号処理装置、信号処理方法、及びプログラム |
GB2571949A (en) * | 2018-03-13 | 2019-09-18 | Nokia Technologies Oy | Temporal spatial audio parameter smoothing |
US10848894B2 (en) * | 2018-04-09 | 2020-11-24 | Nokia Technologies Oy | Controlling audio in multi-viewpoint omnidirectional content |
WO2020071728A1 (ko) * | 2018-10-02 | 2020-04-09 | 한국전자통신연구원 | 가상 현실에서 음향 확대 효과 적용을 위한 음향 신호 제어 방법 및 장치 |
KR102458962B1 (ko) * | 2018-10-02 | 2022-10-26 | 한국전자통신연구원 | 가상 현실에서 음향 확대 효과 적용을 위한 음향 신호 제어 방법 및 장치 |
WO2020081674A1 (en) | 2018-10-16 | 2020-04-23 | Dolby Laboratories Licensing Corporation | Methods and devices for bass management |
US11503422B2 (en) * | 2019-01-22 | 2022-11-15 | Harman International Industries, Incorporated | Mapping virtual sound sources to physical speakers in extended reality applications |
US11206504B2 (en) * | 2019-04-02 | 2021-12-21 | Syng, Inc. | Systems and methods for spatial audio rendering |
JPWO2020213375A1 (ru) * | 2019-04-16 | 2020-10-22 | ||
EP3726858A1 (en) * | 2019-04-16 | 2020-10-21 | Fraunhofer Gesellschaft zur Förderung der Angewand | Lower layer reproduction |
KR102285472B1 (ko) * | 2019-06-14 | 2021-08-03 | 엘지전자 주식회사 | 음향의 이퀄라이징 방법과, 이를 구현하는 로봇 및 ai 서버 |
EP3997700A1 (en) | 2019-07-09 | 2022-05-18 | Dolby Laboratories Licensing Corporation | Presentation independent mastering of audio content |
JP7533461B2 (ja) | 2019-07-19 | 2024-08-14 | ソニーグループ株式会社 | 信号処理装置および方法、並びにプログラム |
US11659332B2 (en) | 2019-07-30 | 2023-05-23 | Dolby Laboratories Licensing Corporation | Estimating user location in a system including smart audio devices |
EP4005234A1 (en) | 2019-07-30 | 2022-06-01 | Dolby Laboratories Licensing Corporation | Rendering audio over multiple speakers with multiple activation criteria |
WO2021021460A1 (en) * | 2019-07-30 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Adaptable spatial audio playback |
WO2021021857A1 (en) | 2019-07-30 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Acoustic echo cancellation control for distributed audio devices |
WO2021021750A1 (en) | 2019-07-30 | 2021-02-04 | Dolby Laboratories Licensing Corporation | Dynamics processing across devices with differing playback capabilities |
US11968268B2 (en) | 2019-07-30 | 2024-04-23 | Dolby Laboratories Licensing Corporation | Coordination of audio devices |
US11533560B2 (en) * | 2019-11-15 | 2022-12-20 | Boomcloud 360 Inc. | Dynamic rendering device metadata-informed audio enhancement system |
US12094476B2 (en) | 2019-12-02 | 2024-09-17 | Dolby Laboratories Licensing Corporation | Systems, methods and apparatus for conversion from channel-based audio to object-based audio |
JP7443870B2 (ja) | 2020-03-24 | 2024-03-06 | ヤマハ株式会社 | 音信号出力方法および音信号出力装置 |
US11102606B1 (en) | 2020-04-16 | 2021-08-24 | Sony Corporation | Video component in 3D audio |
US20220012007A1 (en) * | 2020-07-09 | 2022-01-13 | Sony Interactive Entertainment LLC | Multitrack container for sound effect rendering |
WO2022059858A1 (en) * | 2020-09-16 | 2022-03-24 | Samsung Electronics Co., Ltd. | Method and system to generate 3d audio from audio-visual multimedia content |
JP7536735B2 (ja) * | 2020-11-24 | 2024-08-20 | ネイバー コーポレーション | ユーザカスタム型臨場感を実現するためのオーディオコンテンツを製作するコンピュータシステムおよびその方法 |
KR102500694B1 (ko) * | 2020-11-24 | 2023-02-16 | 네이버 주식회사 | 사용자 맞춤형 현장감 실현을 위한 오디오 콘텐츠를 제작하는 컴퓨터 시스템 및 그의 방법 |
JP7536733B2 (ja) * | 2020-11-24 | 2024-08-20 | ネイバー コーポレーション | オーディオと関連してユーザカスタム型臨場感を実現するためのコンピュータシステムおよびその方法 |
WO2022179701A1 (en) * | 2021-02-26 | 2022-09-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for rendering audio objects |
EP4324224A1 (en) * | 2021-04-14 | 2024-02-21 | Telefonaktiebolaget LM Ericsson (publ) | Spatially-bounded audio elements with derived interior representation |
US20220400352A1 (en) * | 2021-06-11 | 2022-12-15 | Sound Particles S.A. | System and method for 3d sound placement |
US20240196158A1 (en) * | 2022-12-08 | 2024-06-13 | Samsung Electronics Co., Ltd. | Surround sound to immersive audio upmixing based on video scene analysis |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10321980A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen eines diskreten Werts einer Komponente in einem Lautsprechersignal |
EP2309781A2 (en) * | 2009-09-23 | 2011-04-13 | Iosono GmbH | Apparatus and method for calculating filter coefficients for a predefined loudspeaker arrangement |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9307934D0 (en) * | 1993-04-16 | 1993-06-02 | Solid State Logic Ltd | Mixing audio signals |
GB2294854B (en) | 1994-11-03 | 1999-06-30 | Solid State Logic Ltd | Audio signal processing |
US6072878A (en) | 1997-09-24 | 2000-06-06 | Sonic Solutions | Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics |
GB2337676B (en) | 1998-05-22 | 2003-02-26 | Central Research Lab Ltd | Method of modifying a filter for implementing a head-related transfer function |
GB2342830B (en) | 1998-10-15 | 2002-10-30 | Central Research Lab Ltd | A method of synthesising a three dimensional sound-field |
US6442277B1 (en) | 1998-12-22 | 2002-08-27 | Texas Instruments Incorporated | Method and apparatus for loudspeaker presentation for positional 3D sound |
US6507658B1 (en) * | 1999-01-27 | 2003-01-14 | Kind Of Loud Technologies, Llc | Surround sound panner |
US7660424B2 (en) | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
KR100922910B1 (ko) | 2001-03-27 | 2009-10-22 | 캠브리지 메카트로닉스 리미티드 | 사운드 필드를 생성하는 방법 및 장치 |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7558393B2 (en) * | 2003-03-18 | 2009-07-07 | Miller Iii Robert E | System and method for compatible 2D/3D (full sphere with height) surround sound reproduction |
JP3785154B2 (ja) * | 2003-04-17 | 2006-06-14 | パイオニア株式会社 | 情報記録装置、情報再生装置及び情報記録媒体 |
DE10344638A1 (de) * | 2003-08-04 | 2005-03-10 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Erzeugen, Speichern oder Bearbeiten einer Audiodarstellung einer Audioszene |
JP2005094271A (ja) * | 2003-09-16 | 2005-04-07 | Nippon Hoso Kyokai <Nhk> | 仮想空間音響再生プログラムおよび仮想空間音響再生装置 |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US8363865B1 (en) | 2004-05-24 | 2013-01-29 | Heather Bottum | Multiple channel sound system using multi-speaker arrays |
JP2006005024A (ja) | 2004-06-15 | 2006-01-05 | Sony Corp | 基板処理装置および基板移動装置 |
JP2006050241A (ja) * | 2004-08-04 | 2006-02-16 | Matsushita Electric Ind Co Ltd | 復号化装置 |
KR100608002B1 (ko) | 2004-08-26 | 2006-08-02 | 삼성전자주식회사 | 가상 음향 재생 방법 및 그 장치 |
AU2005282680A1 (en) | 2004-09-03 | 2006-03-16 | Parker Tsuhako | Method and apparatus for producing a phantom three-dimensional sound space with recorded sound |
WO2006050353A2 (en) * | 2004-10-28 | 2006-05-11 | Verax Technologies Inc. | A system and method for generating sound events |
US20070291035A1 (en) | 2004-11-30 | 2007-12-20 | Vesely Michael A | Horizontal Perspective Representation |
US7928311B2 (en) | 2004-12-01 | 2011-04-19 | Creative Technology Ltd | System and method for forming and rendering 3D MIDI messages |
US7774707B2 (en) * | 2004-12-01 | 2010-08-10 | Creative Technology Ltd | Method and apparatus for enabling a user to amend an audio file |
JP3734823B1 (ja) * | 2005-01-26 | 2006-01-11 | 任天堂株式会社 | ゲームプログラムおよびゲーム装置 |
DE102005008343A1 (de) * | 2005-02-23 | 2006-09-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Liefern von Daten in einem Multi-Renderer-System |
DE102005008366A1 (de) * | 2005-02-23 | 2006-08-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ansteuern einer Wellenfeldsynthese-Renderer-Einrichtung mit Audioobjekten |
US8577483B2 (en) * | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
EP1853092B1 (en) * | 2006-05-04 | 2011-10-05 | LG Electronics, Inc. | Enhancing stereo audio with remix capability |
EP2022263B1 (en) * | 2006-05-19 | 2012-08-01 | Electronics and Telecommunications Research Institute | Object-based 3-dimensional audio service system using preset audio scenes |
US20090192638A1 (en) * | 2006-06-09 | 2009-07-30 | Koninklijke Philips Electronics N.V. | device for and method of generating audio data for transmission to a plurality of audio reproduction units |
JP4345784B2 (ja) * | 2006-08-21 | 2009-10-14 | ソニー株式会社 | 音響収音装置及び音響収音方法 |
WO2008039041A1 (en) * | 2006-09-29 | 2008-04-03 | Lg Electronics Inc. | Methods and apparatuses for encoding and decoding object-based audio signals |
JP4257862B2 (ja) * | 2006-10-06 | 2009-04-22 | パナソニック株式会社 | 音声復号化装置 |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
US20080253577A1 (en) | 2007-04-13 | 2008-10-16 | Apple Inc. | Multi-channel sound panner |
US20080253592A1 (en) | 2007-04-13 | 2008-10-16 | Christopher Sanders | User interface for multi-channel sound panner |
WO2008135049A1 (en) | 2007-05-07 | 2008-11-13 | Aalborg Universitet | Spatial sound reproduction system with loudspeakers |
JP2008301200A (ja) | 2007-05-31 | 2008-12-11 | Nec Electronics Corp | 音声処理装置 |
WO2009001292A1 (en) * | 2007-06-27 | 2008-12-31 | Koninklijke Philips Electronics N.V. | A method of merging at least two input object-oriented audio parameter streams into an output object-oriented audio parameter stream |
JP4530007B2 (ja) * | 2007-08-02 | 2010-08-25 | ヤマハ株式会社 | 音場制御装置 |
EP2094032A1 (en) | 2008-02-19 | 2009-08-26 | Deutsche Thomson OHG | Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same |
JP2009207780A (ja) * | 2008-03-06 | 2009-09-17 | Konami Digital Entertainment Co Ltd | ゲームプログラム、ゲーム装置、およびゲーム制御方法 |
EP2154911A1 (en) * | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus for determining a spatial output multi-channel audio signal |
US8705749B2 (en) * | 2008-08-14 | 2014-04-22 | Dolby Laboratories Licensing Corporation | Audio signal transformatting |
US20100098258A1 (en) * | 2008-10-22 | 2010-04-22 | Karl Ola Thorn | System and method for generating multichannel audio with a portable electronic device |
KR101542233B1 (ko) * | 2008-11-04 | 2015-08-05 | 삼성전자 주식회사 | 화면음원 정위장치, 화면음원 정위를 위한 스피커 셋 정보 생성방법 및 정위된 화면음원 재생방법 |
BRPI0922046A2 (pt) * | 2008-11-18 | 2019-09-24 | Panasonic Corp | dispositivo de reprodução, método de reprodução e programa para reprodução estereoscópica |
JP2010252220A (ja) | 2009-04-20 | 2010-11-04 | Nippon Hoso Kyokai <Nhk> | 3次元音響パンニング装置およびそのプログラム |
EP2249334A1 (en) | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
WO2011002006A1 (ja) | 2009-06-30 | 2011-01-06 | 新東ホールディングス株式会社 | イオン発生装置及びイオン発生素子 |
ES2793958T3 (es) * | 2009-08-14 | 2020-11-17 | Dts Llc | Sistema para trasmitir adaptativamente objetos de audio |
JP2011066868A (ja) * | 2009-08-18 | 2011-03-31 | Victor Co Of Japan Ltd | オーディオ信号符号化方法、符号化装置、復号化方法及び復号化装置 |
JP5439602B2 (ja) * | 2009-11-04 | 2014-03-12 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 仮想音源に関連するオーディオ信号についてスピーカ設備のスピーカの駆動係数を計算する装置および方法 |
CN108989721B (zh) * | 2010-03-23 | 2021-04-16 | 杜比实验室特许公司 | 用于局域化感知音频的技术 |
WO2011117399A1 (en) | 2010-03-26 | 2011-09-29 | Thomson Licensing | Method and device for decoding an audio soundfield representation for audio playback |
KR20130122516A (ko) | 2010-04-26 | 2013-11-07 | 캠브리지 메카트로닉스 리미티드 | 청취자의 위치를 추적하는 확성기 |
WO2011152044A1 (ja) | 2010-05-31 | 2011-12-08 | パナソニック株式会社 | 音響再生装置 |
JP5826996B2 (ja) * | 2010-08-30 | 2015-12-02 | 日本放送協会 | 音響信号変換装置およびそのプログラム、ならびに、3次元音響パンニング装置およびそのプログラム |
WO2012122397A1 (en) * | 2011-03-09 | 2012-09-13 | Srs Labs, Inc. | System for dynamically creating and rendering audio objects |
JP5798247B2 (ja) * | 2011-07-01 | 2015-10-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 向上した3dオーディオ作成および表現のためのシステムおよびツール |
RS1332U (en) | 2013-04-24 | 2013-08-30 | Tomislav Stanojević | FULL SOUND ENVIRONMENT SYSTEM WITH FLOOR SPEAKERS |
-
2012
- 2012-06-27 JP JP2014517258A patent/JP5798247B2/ja active Active
- 2012-06-27 EP EP22196385.3A patent/EP4132011A3/en active Pending
- 2012-06-27 AR ARP120102307A patent/AR086774A1/es active IP Right Grant
- 2012-06-27 AU AU2012279349A patent/AU2012279349B2/en active Active
- 2012-06-27 KR KR1020197006780A patent/KR102052539B1/ko active Application Filing
- 2012-06-27 EP EP12738278.6A patent/EP2727381B1/en active Active
- 2012-06-27 TW TW101123002A patent/TWI548290B/zh active
- 2012-06-27 KR KR1020157001762A patent/KR101843834B1/ko active IP Right Grant
- 2012-06-27 KR KR1020207025906A patent/KR102394141B1/ko active IP Right Grant
- 2012-06-27 CA CA3238161A patent/CA3238161A1/en active Pending
- 2012-06-27 EP EP21179211.4A patent/EP3913931B1/en active Active
- 2012-06-27 WO PCT/US2012/044363 patent/WO2013006330A2/en active Application Filing
- 2012-06-27 KR KR1020237021095A patent/KR20230096147A/ko not_active Application Discontinuation
- 2012-06-27 MX MX2013014273A patent/MX2013014273A/es active IP Right Grant
- 2012-06-27 RU RU2013158064/08A patent/RU2554523C1/ru active
- 2012-06-27 KR KR1020197035259A patent/KR102156311B1/ko active IP Right Grant
- 2012-06-27 ES ES12738278T patent/ES2909532T3/es active Active
- 2012-06-27 HU HUE12738278A patent/HUE058229T2/hu unknown
- 2012-06-27 KR KR1020187008173A patent/KR101958227B1/ko active Application Filing
- 2012-06-27 CA CA3151342A patent/CA3151342A1/en active Pending
- 2012-06-27 TW TW109134260A patent/TWI785394B/zh active
- 2012-06-27 TW TW105115773A patent/TWI607654B/zh active
- 2012-06-27 TW TW108114549A patent/TWI701952B/zh active
- 2012-06-27 KR KR1020137035119A patent/KR101547467B1/ko active IP Right Grant
- 2012-06-27 CA CA3025104A patent/CA3025104C/en active Active
- 2012-06-27 CN CN201610496700.3A patent/CN106060757B/zh active Active
- 2012-06-27 PL PL12738278T patent/PL2727381T3/pl unknown
- 2012-06-27 EP EP22196393.7A patent/EP4135348A3/en active Pending
- 2012-06-27 MX MX2015004472A patent/MX337790B/es unknown
- 2012-06-27 CA CA2837894A patent/CA2837894C/en active Active
- 2012-06-27 TW TW106131441A patent/TWI666944B/zh active
- 2012-06-27 MX MX2020001488A patent/MX2020001488A/es unknown
- 2012-06-27 RU RU2015109613A patent/RU2672130C2/ru active
- 2012-06-27 ES ES21179211T patent/ES2932665T3/es active Active
- 2012-06-27 IL IL307218A patent/IL307218A/en unknown
- 2012-06-27 US US14/126,901 patent/US9204236B2/en active Active
- 2012-06-27 KR KR1020227014397A patent/KR102548756B1/ko active Application Filing
- 2012-06-27 CA CA3104225A patent/CA3104225C/en active Active
- 2012-06-27 DK DK12738278.6T patent/DK2727381T3/da active
- 2012-06-27 MY MYPI2013004180A patent/MY181629A/en unknown
- 2012-06-27 MX MX2016003459A patent/MX349029B/es unknown
- 2012-06-27 TW TW111142058A patent/TWI816597B/zh active
- 2012-06-27 CN CN201280032165.6A patent/CN103650535B/zh active Active
- 2012-06-27 BR BR112013033835-0A patent/BR112013033835B1/pt active IP Right Grant
- 2012-06-27 TW TW112132111A patent/TW202416732A/zh unknown
- 2012-06-27 CA CA3134353A patent/CA3134353C/en active Active
- 2012-06-27 CA CA3083753A patent/CA3083753C/en active Active
- 2012-06-27 IL IL298624A patent/IL298624B2/en unknown
-
2013
- 2013-12-05 MX MX2022005239A patent/MX2022005239A/es unknown
- 2013-12-19 IL IL230047A patent/IL230047A/en active IP Right Grant
- 2013-12-27 CL CL2013003745A patent/CL2013003745A1/es unknown
-
2015
- 2015-08-20 JP JP2015162655A patent/JP6023860B2/ja active Active
- 2015-10-09 US US14/879,621 patent/US9549275B2/en active Active
-
2016
- 2016-05-13 AU AU2016203136A patent/AU2016203136B2/en active Active
- 2016-10-07 JP JP2016198812A patent/JP6297656B2/ja active Active
- 2016-12-01 HK HK16113736A patent/HK1225550A1/zh unknown
- 2016-12-02 US US15/367,937 patent/US9838826B2/en active Active
-
2017
- 2017-03-16 IL IL251224A patent/IL251224A/en active IP Right Grant
- 2017-09-27 IL IL254726A patent/IL254726B/en active IP Right Grant
- 2017-11-03 US US15/803,209 patent/US10244343B2/en active Active
-
2018
- 2018-02-20 JP JP2018027639A patent/JP6556278B2/ja active Active
- 2018-04-26 IL IL258969A patent/IL258969A/en active IP Right Grant
- 2018-06-12 AU AU2018204167A patent/AU2018204167B2/en active Active
-
2019
- 2019-01-23 US US16/254,778 patent/US10609506B2/en active Active
- 2019-03-31 IL IL265721A patent/IL265721B/en unknown
- 2019-07-09 JP JP2019127462A patent/JP6655748B2/ja active Active
- 2019-10-30 AU AU2019257459A patent/AU2019257459B2/en active Active
-
2020
- 2020-02-03 JP JP2020016101A patent/JP6952813B2/ja active Active
- 2020-03-30 US US16/833,874 patent/US11057731B2/en active Active
-
2021
- 2021-01-22 AU AU2021200437A patent/AU2021200437B2/en active Active
- 2021-07-01 US US17/364,912 patent/US11641562B2/en active Active
- 2021-09-28 JP JP2021157435A patent/JP7224411B2/ja active Active
-
2022
- 2022-02-03 IL IL290320A patent/IL290320B2/en unknown
- 2022-06-08 AU AU2022203984A patent/AU2022203984B2/en active Active
-
2023
- 2023-02-07 JP JP2023016507A patent/JP7536917B2/ja active Active
- 2023-05-01 US US18/141,538 patent/US12047768B2/en active Active
- 2023-08-10 AU AU2023214301A patent/AU2023214301B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10321980A1 (de) * | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Berechnen eines diskreten Werts einer Komponente in einem Lautsprechersignal |
EP2309781A2 (en) * | 2009-09-23 | 2011-04-13 | Iosono GmbH | Apparatus and method for calculating filter coefficients for a predefined loudspeaker arrangement |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2554523C1 (ru) | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных | |
AU2012279349A1 (en) | System and tools for enhanced 3D audio authoring and rendering | |
EP3378240B1 (en) | System and method for rendering an audio program | |
RU2795520C1 (ru) | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных | |
RU2771935C2 (ru) | Система и инструментальные средства для усовершенствованной авторской разработки и представления трехмерных аудиоданных |