RU2766560C2 - Method and device for decoding ambiophonic audio presentation of sound field for audio playback using 2d-arrangements - Google Patents
Method and device for decoding ambiophonic audio presentation of sound field for audio playback using 2d-arrangements Download PDFInfo
- Publication number
- RU2766560C2 RU2766560C2 RU2019100542A RU2019100542A RU2766560C2 RU 2766560 C2 RU2766560 C2 RU 2766560C2 RU 2019100542 A RU2019100542 A RU 2019100542A RU 2019100542 A RU2019100542 A RU 2019100542A RU 2766560 C2 RU2766560 C2 RU 2766560C2
- Authority
- RU
- Russia
- Prior art keywords
- speaker
- matrix
- decoding
- positions
- processing
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
- H04S7/308—Electronic adaptation dependent on speaker or headphone connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/11—Positioning of individual sound objects, e.g. moving airplane, within a sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/07—Synergistic effects of band splitting and sub-band processing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/11—Application of ambisonics in stereophonic audio systems
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Algebra (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Stereophonic System (AREA)
Abstract
Description
ОБЛАСТЬ ТЕХНИКИ, К КОТОРОЙ ОТНОСИТСЯ ИЗОБРЕТЕНИЕFIELD OF TECHNOLOGY TO WHICH THE INVENTION RELATES
Настоящее изобретение относится к способу и устройству для декодирования аудиопредставления звукового поля, и, в частности, амбиофонически форматируемого аудиопредставления, для проигрывания аудио с использованием двухмерной или близкой к двухмерной компоновки.The present invention relates to a method and apparatus for decoding an audio sound field representation, and in particular an ambiophonically formatted audio representation, for audio playback using a two-dimensional or near two-dimensional layout.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE INVENTION
Точная локализация является ключевой целью для любой системы воспроизведения пространственного аудио. Такие системы воспроизведения успешно применимы для систем конференций, игр или других виртуальных сред, которые получают преимущества от 3D-звука. Звуковые сцены в 3D могут быть синтезированы или захвачены как естественное звуковое поле. Сигналы звукового поля, такие как, например, амбиофония, переносят представление желаемого звукового поля. Процесс декодирования требуется для получения отдельных сигналов громкоговорителей из представления звукового поля. Декодирование амбиофонически форматируемого сигнала также называется "обработкой". Для того чтобы синтезировать аудиосцены, функции панорамирования, которые обращаются к пространственной компоновке громкоговорителей, требуются для получения пространственной локализации заданного источника звука. Для записи естественного звукового поля, матрицы микрофонов требуются для захвата пространственной информации. Амбиофонический подход является очень подходящим инструментом для выполнения этого. Амбиофонически форматируемые сигналы переносят представление желаемого звукового поля на основе сферического гармонического разложения звукового поля. В то время как базовый амбиофонический формат или B-формат использует сферические гармонические функции нулевого и первого порядка, так называемая амбиофония высокого порядка (HOA) также дополнительно использует сферические гармонические функции по меньшей мере 2-го порядка. Пространственное расположение громкоговорителей называется компоновкой громкоговорителей. Для процесса декодирования требуется матрица декодирования (также называемая матрицей обработки), которая является конкретной для некоторой заданной компоновки громкоговорителей и которая генерируется с использованием известных позиций громкоговорителей.Accurate localization is a key goal for any spatial audio playback system. Such playback systems are useful for conferencing, gaming, or other virtual environments that benefit from 3D audio. Soundstages in 3D can be synthesized or captured as a natural sound field. Sound field signals, such as, for example, ambiphony, carry the representation of the desired sound field. The decoding process is required to obtain individual speaker signals from the sound field representation. Decoding an ambiophonically formatted signal is also referred to as "processing". In order to synthesize audio scenes, panning functions that refer to the spatial layout of the speakers are required to obtain the spatial localization of a given sound source. To record a natural sound field, microphone arrays are required to capture spatial information. The ambiophonic approach is a very suitable tool for doing this. Ambiophonically formatted signals transfer the representation of the desired sound field based on the spherical harmonic decomposition of the sound field. While the basic ambiophonic format or B-format uses zeroth and first order spherical harmonics, the so-called high order ambiphony (HOA) also additionally uses at least 2nd order spherical harmonics. The spatial arrangement of the speakers is called the speaker layout. The decoding process requires a decoding matrix (also called a processing matrix) that is specific to some given speaker layout and that is generated using known speaker positions.
Обычно используемыми компоновками громкоговорителей являются стереокомпоновка, которая задействует два громкоговорителя, стандартная компоновка объемного звучания, которая использует пять громкоговорителей, и расширения компоновки объемного звучания, которые используют более пяти громкоговорителей. Однако эти широко известные компоновки ограничены двумя измерениями (2D), например никакая информация высоты не воспроизводится. Обработка для известных компоновок громкоговорителей, которая может воспроизводить информацию высоты, имеет недостатки в локализации и окраске звука: либо пространственные вертикальные панорамы воспринимаются с очень неравномерной громкостью, либо сигналы громкоговорителей имеют сильные боковые лепестки, что дает недостатки в особенности для смещенных от центра позиций слушания. Таким образом, так называемое сберегающее энергию построение обработки предпочтительно при обработке описания звукового поля HOA для громкоговорителей. Это означает, что обработка одного источника звука дает в результате сигналы громкоговорителей с постоянной энергией независимо от направления источника. Иными словами, входная энергия, переносимая амбиофоническим представлением, сохраняется средством обработки громкоговорителя. Международная патентная публикация WO2014/012945A1 [1] настоящих изобретателей описывает построение средства обработки HOA с хорошими свойствами сбережения энергии и локализации для 3D-компоновок громкоговорителей. Однако в то время как этот подход хорошо работает для 3D-компоновок громкоговорителей, которые покрывают все направления, некоторые направления источников ослабляются для 2D-компоновок громкоговорителей (как, например объемный звук 5.1). Это происходит в особенности для направлений, где никакие громкоговорители не размещаются, например, сверху.Commonly used speaker layouts are the stereo layout that uses two speakers, the standard surround layout that uses five speakers, and the surround extensions that use more than five speakers. However, these well-known arrangements are limited to two dimensions (2D), for example, no height information is reproduced. Processing for known speaker layouts that can reproduce height information has disadvantages in sound localization and coloration: either spatial vertical panoramas are perceived with very uneven loudness, or loudspeaker signals have strong sidelobes, which are disadvantageous especially for off-center listening positions. Thus, the so-called power-saving processing construction is preferable when processing the HOA sound field description for loudspeakers. This means that the processing of one sound source results in loudspeaker signals with constant energy regardless of the direction of the source. In other words, the input energy carried by the ambiophonic representation is stored by the loudspeaker processing means. International Patent Publication WO2014/012945A1 [1] of the present inventors describes the construction of a HOA processing tool with good power saving and localization properties for 3D speaker layouts. However, while this approach works well for 3D speaker layouts that cover all directions, some source directions are attenuated for 2D speaker layouts (such as 5.1 surround sound). This is especially true for directions where no loudspeakers are placed, such as from above.
В работе Ф. Зоттера и М. Франка "Круговое амбиофоническое панорамирование и декодирование" ("All-Round Ambisonic Panning and Decoding") [2] "мнимый" громкоговоритель добавляется, если присутствует пустота в выпуклой оболочке, образуемой громкоговорителями. Однако получающийся в результате сигнал для этого мнимого громкоговорителя пропускается в проигрывании через действительный громкоговоритель. Таким образом, источник сигнала с этого направления (т.е. направления, где никакой действительный громкоговоритель не располагается), будет все равно ослаблен. Кроме того, эта работа показывает использование мнимого громкоговорителя только для использования с VBAP (панорамированием амплитуды на векторной основе).In the work of F. Zotter and M. Frank "All-Round Ambisonic Panning and Decoding" [2], an "imaginary" loudspeaker is added if there is a void in the convex hull formed by the loudspeakers. However, the resulting signal for this imaginary loudspeaker is passed through the actual loudspeaker in playback. Thus, a signal source from that direction (ie the direction where no actual loudspeaker is located) will still be attenuated. In addition, this work shows the use of an imaginary loudspeaker only for use with VBAP (vector-based amplitude panning).
СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION
Таким образом, остается проблемой проектирование сберегающих энергию амбиофонических средств обработки для 2D (двухмерных) компоновок громкоговорителей, в которых источники звука с направлений, где никаких громкоговорителей не размещается, менее ослаблены или вообще не ослаблены. 2D- компоновки громкоговорителей могут быть классифицированы как те, в которых углы возвышения громкоговорителей находятся внутри определенного малого диапазона (например, <10°) так, что они близки к горизонтальной плоскости.Thus, it remains a challenge to design energy-saving ambiophonic processing for 2D (two-dimensional) speaker layouts in which sound sources from directions where no speakers are placed are less attenuated or not attenuated at all. 2D speaker layouts can be classified as those in which the speaker elevation angles are within a certain small range (eg <10°) such that they are close to the horizontal plane.
Настоящее техническое описание описывает решение для обработки/декодирования амбиофонически форматируемого аудиопредставления звукового поля для равномерных или неравномерных распределений пространственных громкоговорителей, причем обработка/декодирование обеспечивает сильно улучшенные свойства локализации и окраски и является сберегающим энергию, и причем даже звук с направлений, в которых никакой громкоговоритель не доступен, обрабатывается. Обеспечивает преимущества то, что звук с направлений, в которых никакой громкоговоритель не доступен, обрабатывается с по существу той же самой энергией и воспринимаемой громкостью, какую он имел бы, если бы громкоговоритель был доступен в соответственном направлении. Разумеется, точная локализация этих источников звука невозможна, поскольку никакой громкоговоритель не доступен в этом направлении.This technical specification describes a solution for processing/decoding an ambiophonically formatted sound field audio representation for uniform or non-uniform spatial speaker distributions, the processing/decoding providing greatly improved localization and coloration properties and being energy saving, and even sound from directions in which no loudspeaker is available, being processed. Advantageously, sound from directions in which no speaker is available is processed with substantially the same energy and perceived loudness as it would have if the speaker were available in that direction. Of course, exact localization of these sound sources is not possible, since no loudspeaker is available in this direction.
В частности, по меньшей мере некоторые описанные варианты осуществления обеспечивают новый способ для получения матрицы декодирования для декодирования данных звукового поля в формате HOA. Поскольку по меньшей мере формат HOA описывает звуковое поле, которое не относится непосредственно к позициям громкоговорителей, и поскольку сигналы громкоговорителей, которые должны быть получены, обязательно имеют формат аудио на основе каналов, декодирование сигналов HOA всегда непосредственно относится к обработке аудиосигнала. По существу, то же самое также применимо и к другим аудиоформатам звукового поля. Таким образом, настоящее раскрытие относится и к декодированию, и к обработке относящихся к звуковому полю аудиоформатов. Термины "матрица декодирования" и "матрица обработки" используются как синонимы.In particular, at least some of the described embodiments provide a novel method for obtaining a decoding matrix for decoding sound field data in HOA format. Since at least the HOA format describes a sound field that is not directly related to speaker positions, and since the speaker signals to be received are necessarily in channel-based audio format, the decoding of HOA signals is always directly related to audio signal processing. As such, the same also applies to other sound field audio formats. Thus, the present disclosure relates to both decoding and processing of sound field-related audio formats. The terms "decoding matrix" and "processing matrix" are used interchangeably.
Для получения матрицы декодирования для некоторой заданной компоновки с хорошими свойствами сбережения энергии один или несколько виртуальных громкоговорителей добавляется в позициях, где никакой громкоговоритель не доступен. Например, для получения улучшенной матрицы декодирования для 2D-компоновки два виртуальных громкоговорителя добавляется сверху и снизу (в соответствии с углами возвышения +90° и -90°, причем 2D-громкоговорители размещаются приблизительно на возвышении 0°). Для этой виртуальной 3D-компоновки громкоговорителей строится матрица декодирования, которая удовлетворяет свойству сбережения энергии. Наконец, весовые коэффициенты из матрицы декодирования для виртуальных громкоговорителей микшируются с постоянными усилениями для действительных громкоговорителей 2D-компоновки.To obtain a decoding matrix for some given arrangement with good power saving properties, one or more virtual speakers are added at positions where no speaker is available. For example, to obtain an improved decoding matrix for a 2D layout, two virtual speakers are added at the top and bottom (corresponding to elevation angles of +90° and -90°, with 2D speakers placed at approximately 0° elevation). For this virtual 3D speaker layout, a decoding matrix is constructed that satisfies the energy saving property. Finally, the weights from the decoding matrix for the virtual speakers are mixed with constant gains for the actual speakers in the 2D layout.
Согласно одному варианту осуществления матрица декодирования (или матрица обработки) для обработки или декодирования аудиосигнала в амбиофоническом формате для некоторого заданного набора громкоговорителей генерируется путем генерирования первой предварительной матрицы декодирования с использованием стандартного способа и с использованием модифицированных позиций громкоговорителей, причем модифицированные позиции громкоговорителей включают в себя позиции громкоговорителей заданного набора громкоговорителей и по меньшей мере одну дополнительную виртуальную позицию громкоговорителя, и понижающего микширования первой предварительной матрицы декодирования, причем коэффициенты, относящиеся к по меньшей мере одному дополнительному виртуальному громкоговорителю, удаляются и распределяются по коэффициентам, относящимся к громкоговорителям заданного набора громкоговорителей. В одном варианте осуществления последующий этап нормализации матрицы декодирования следует за этим. Получающаяся в результате матрица декодирования является подходящей для обработки или декодирования амбиофонического сигнала для заданного набора громкоговорителей, причем даже звук от позиций, где никакой громкоговоритель не присутствует, воспроизводится с верной энергией сигнала. Это происходит ввиду строения улучшенной матрицы декодирования. Предпочтительно, первая предварительная матрица декодирования является сберегающей энергию.According to one embodiment, a decoding matrix (or processing matrix) for processing or decoding an audio signal in ambiophonic format for some given set of speakers is generated by generating a first preliminary decoding matrix using a standard method and using modified speaker positions, where the modified speaker positions include the positions speakers of a given set of speakers and at least one additional virtual speaker position, and downmixing the first pre-decoding matrix, wherein the coefficients related to at least one additional virtual speaker are removed and distributed among the coefficients related to the speakers of a given set of speakers. In one embodiment, a subsequent decoding matrix normalization step follows this. The resulting decoding matrix is suitable for processing or decoding an ambiophonic signal for a given set of speakers, even sound from positions where no speaker is present is reproduced with the correct signal energy. This is due to the structure of the improved decoding matrix. Preferably, the first decoding pre-matrix is energy saving.
В одном варианте осуществления матрица декодирования имеет L строк и O3D столбцов. Количество строк соответствует количеству громкоговорителей в 2D-компоновке громкоговорителей, и количество столбцов соответствует количеству амбиофонических коэффициентов O3D, которое зависит от порядка N HOA согласно O3D=(N+1)2. Каждый из коэффициентов матрицы декодирования для 2D-компоновки громкоговорителей является суммой по меньшей мере первого промежуточного коэффициента и второго промежуточного коэффициента. Первый промежуточный коэффициент получается способом построения 3D-матрицы со сбережением энергии для текущей позиции громкоговорителя 2D-компоновки громкоговорителей, причем способ построения 3D-матрицы со сбережением энергии использует по меньшей мере одну позицию виртуального громкоговорителя. Второй промежуточный коэффициент получается посредством коэффициента, который получается из упомянутого способа построения 3D-матрицы со сбережением энергии для по меньшей мере одной позиции виртуального громкоговорителя, умноженного на весовой коэффициент g. В одном варианте осуществления весовой коэффициент g вычисляется согласно , где L является количеством громкоговорителей в 2D-компоновке громкоговорителей.In one embodiment, the decoding matrix has L rows and O3D columns. The number of rows corresponds to the number of speakers in the 2D speaker layout, and the number of columns corresponds to the number of ambiophonic coefficients O3D, which depends on the order N HOA according to O3D=(N+1)2. Each of the coefficients of the decoding matrix for the 2D speaker layout is the sum of at least the first intermediate coefficient and the second intermediate coefficient. The first intermediate coefficient is obtained by a power-saving 3D matrix construction method for the current speaker position of a 2D speaker layout, wherein the energy-saving 3D matrix construction method uses at least one virtual speaker position. The second intermediate coefficient is obtained by a coefficient which is obtained from said energy-saving 3D matrix construction method for at least one virtual speaker position multiplied by the weighting coefficient g. In one embodiment, the weighting factor g is calculated according to where L is the number of speakers in the 2D speaker layout.
В одном варианте осуществления изобретение относится к машиночитаемому носителю данных, имеющему сохраненные на нем исполняемые инструкции, для побуждения компьютера выполнять способ, содержащий этапы способа, раскрываемого выше или в формуле изобретения.In one embodiment, the invention relates to a computer-readable storage medium having executable instructions stored thereon for causing a computer to execute a method comprising the steps of the method disclosed above or in the claims.
Устройство, которое задействует способ, раскрывается в пункте 9.The device that operates the method is disclosed in clause 9.
Имеющие преимущества варианты осуществления раскрываются в зависимых пунктах формулы изобретения, в последующем описании и на чертежах.Advantageous embodiments are disclosed in the dependent claims, in the following description and in the drawings.
КРАТКОЕ ОПИСАНИЕ ЧЕРТЕЖЕЙBRIEF DESCRIPTION OF THE DRAWINGS
Примерные варианты осуществления изобретения описаны со ссылками на сопроводительные чертежи, которые изображают наExemplary embodiments of the invention are described with reference to the accompanying drawings, which are shown in
фиг.1 блок-схему способа согласно одному варианту осуществления;1 is a flowchart of a method according to one embodiment;
фиг.2 примерное строение микшированной с понижением матрицы декодирования HOA;2 exemplary structure of a downmixed HOA decoding matrix;
фиг.3 блок-схему для получения и модификации позиций громкоговорителей;3 is a block diagram for obtaining and modifying speaker positions;
фиг.4 структурную схему устройства согласно одному варианту осуществления;4 is a block diagram of a device according to one embodiment;
фиг.5 распределение энергии, возникающее в результате стандартной матрицы декодирования;5 the energy distribution resulting from the standard decoding matrix;
фиг.6 распределение энергии, возникающее в результате матрицы декодирования согласно вариантам осуществления; иFig. 6 energy distribution resulting from the decoding matrix according to the embodiments; And
фиг.7 использование раздельно оптимизированных матриц декодирования для различных полос частот.7 using separately optimized decoding matrices for different frequency bands.
ОПИСАНИЕ ВАРИАНТОВ ОСУЩЕСТВЛЕНИЯDESCRIPTION OF EMBODIMENTS
Фиг.1 изображает блок-схему способа для декодирования аудиосигнала, в частности, сигнала звукового поля, согласно одному варианту осуществления. Декодирование сигналов звукового поля в общем случае требует позиций громкоговорителей, для которых аудиосигнал должен быть обработан. Такие позиции громкоговорителей 1 ... L для L громкоговорителей вводятся i10 в процесс. Следует заметить, что, когда упоминаются позиции, фактически здесь подразумеваются пространственные направления, т.е. позиции громкоговорителей определяются их углами наклона и углами азимута , которые комбинируются в вектор . Затем по меньшей мере одна позиция виртуального громкоговорителя добавляется 10. В одном варианте осуществления все позиции громкоговорителей, которые вводятся в процесс i10, находятся по существу в одной и той же плоскости так, что они составляют 2D-компоновку, и по меньшей мере один виртуальный громкоговоритель, который добавляется, находится вне этой плоскости. В одном особенно выгодном варианте осуществления все позиции громкоговорителей, которые вводятся в процесс i10, находятся по существу в одной и той же плоскости, и позиции двух виртуальных громкоговорителей добавляются на этапе 10. Имеющие преимущества позиции двух виртуальных громкоговорителей описаны ниже. В одном варианте осуществления добавление выполняется согласно ур.(6) ниже. Этап 10 добавления дает в результате модифицированный набор углов громкоговорителей '1 ... 'L+Lвирт на q10. Lвирт является количеством виртуальных громкоговорителей. Модифицированный набор углов громкоговорителей используется на этапе 11 построения 3D-матрицы декодирования. Также порядок N HOA (в общем случае порядок коэффициентов сигнала звукового поля) должен быть обеспечен i11 для этапа 11.1 shows a flowchart of a method for decoding an audio signal, in particular a sound field signal, according to one embodiment. Decoding sound field signals generally requires speaker positions for which the audio signal must be processed. These speaker positions one ... L for L speakers are introduced i10 into the process. It should be noted that when positions are mentioned, in fact, spatial directions are meant here, i.e. speaker positions are determined by their tilt angles and azimuth angles , which are combined into a vector . Then, at least one virtual speaker position is added 10. In one embodiment, all speaker positions that are entered into the i10 process are substantially in the same plane so that they constitute a 2D layout, and at least one virtual speaker The , which is being added, is outside this plane. In one particularly advantageous embodiment, all speaker positions that are entered into process i10 are essentially in the same plane, and two virtual speaker positions are added in
Этап 11 построения 3D-матрицы декодирования выполняет любой известный способ для генерирования 3D-матрицы декодирования. Предпочтительно, 3D-матрица декодирования является подходящей для сберегающего энергию типа декодирования/обработки. Например, способ, описанный в работе PCT/EP2013/065034, может быть использован. Этап 11 построения 3D-матрицы декодирования дает в результате матрицу декодирования или матрицу обработки D', которая подходит для обработки L'=L+Lвирт сигналов громкоговорителей, где Lвирт является количеством виртуальных позиций громкоговорителей, которые были добавлены на этапе 10 "добавления виртуальных позиций громкоговорителей".The 3D decoding
Поскольку только L громкоговорителей физически доступно, матрица декодирования D', которая получается в результате этапа 11 построения 3D-матрицы декодирования, должна быть приспособлена под L громкоговорителей на этапе 12 понижающего микширования. Этот этап выполняет понижающее микширование матрицы декодирования D', причем коэффициенты, относящиеся к виртуальным громкоговорителям, взвешиваются и распределяются по коэффициентам, относящимся к существующим громкоговорителям. Предпочтительно, коэффициенты любого конкретного порядка HOA (т.е. столбец матрицы декодирования D') взвешиваются и добавляются к коэффициентам того же самого порядка HOA (т.е. к тому же самому столбцу матрицы декодирования D'). Одним примером является понижающее микширование согласно ур.(8) ниже. Этап 12 понижающего микширования дает в результате микшированную с понижением 3D-матрицу декодирования , которая имеет L строк, т.е. меньше строк, чем матрица декодирования D', но имеет то же самое количество столбцов, что и матрица декодирования D'. Иными словами, размерность матрицы декодирования D' равна (L+Lвирт)×O3D и размерность микшированной с понижением 3D-матрицы декодирования равна L×O3D.Since only L speakers are physically available, the decoding matrix D' that results from the 3D decoding
Фиг.2 изображает примерное строение микшированной с понижением HOA-матрицы декодирования из HOA-матрицы декодирования D'. HOA-матрица декодирования D' имеет L+2 строк, что означает, что две виртуальные позиции громкоговорителей были добавлены к L доступным позициям громкоговорителей, и O3D столбцов, где O3D=(N+1)2 и N является порядком HOA. На этапе 12 понижающего микширования коэффициенты строк L+1 и L+2 HOA-матрицы декодирования D' взвешиваются и распределяются по коэффициентам их соответственного столбца, и строки L+1 и L+2 удаляются. Например, первые коэффициенты d'L+1,1 и d'L+2,1 каждой из строк L+1 и L+2 взвешиваются и добавляются к первым коэффициентам всех остальных строк, таким как d'1,1. Получающийся в результате коэффициент 1,1 микшированной с понижением HOA-матрицы декодирования является функцией от d'1,1, d'L+1,1, d'L+2,1 и весового коэффициента g. Тем же самым образом, например, получающийся в результате коэффициент 2,1 микшированной с понижением HOA-матрицы декодирования является функцией от d'2,1, d'L+1,1, d'L+2,1 и весового коэффициента g, и получающийся в результате коэффициент 1,2 микшированной с понижением HOA-матрицы декодирования является функцией от d'1,2, d'L+1,2, d'L+2,2 и весового коэффициента g.2 shows an exemplary structure of a downmixed HOA decoding matrix from the HOA decoding matrix D'. The HOA decoding matrix D' has L+2 rows, meaning that two virtual speaker positions have been added to the L available speaker positions, and O3D columns, where O3D=(N+1)2 and N is the HOA order. In the
Обычно микшированная с понижением HOA-матрица декодирования будет нормализована на этапе 13 нормализации. Однако этот этап 13 является опциональным, поскольку не нормализованная матрица декодирования также может быть использована для декодирования сигнала звукового поля. В одном варианте осуществления микшированная с понижением HOA-матрица декодирования нормализуется согласно ур.(9) ниже. Этап 13 нормализации дает в результате нормализованную микшированную с понижением HOA-матрицу декодирования D, которая имеет ту же самую размерность L×O3D, что и микшированная с понижением HOA-матрица декодирования .Typically downmixed HOA decoding matrix will be normalized in step 13 normalization. However, this step 13 is optional since a non-normalized decoding matrix can also be used to decode the sound field signal. In one embodiment, the downmixed HOA decoding matrix is normalized according to eq.(9) below. The normalization step 13 results in a normalized downmix HOA decoding matrix D which has the same dimension L×O3D as the downmixed HOA decoding matrix .
Нормализованная микшированная с понижением HOA-матрица декодирования D может затем быть использована на этапе 14 декодирования звукового поля, где входной сигнал звукового поля i14 декодируется для L сигналов q14 громкоговорителей. Обычно нормализованная микшированная с понижением HOA-матрица декодирования D не нуждается в модификации, пока компоновка громкоговорителей не модифицируется. Таким образом, в одном варианте осуществления нормализованная микшированная с понижением HOA-матрица декодирования D сохраняется в хранилище матрицы декодирования.The normalized downmix HOA decoding matrix D can then be used in the sound field decoding step 14 where the sound field input signal i14 is decoded for L speaker signals q14. Typically, the normalized downmix HOA decoding matrix D does not need to be modified as long as the speaker layout is not modified. Thus, in one embodiment, the normalized downmix HOA decoding matrix D is stored in a decoding matrix store.
Фиг.3 изображает подробности того, как в одном варианте осуществления позиции громкоговорителей получаются и модифицируются. Этот вариант осуществления содержит этапы определения 101 позиций 1 ... L L громкоговорителей и порядка N коэффициентов сигнала звукового поля, определения 102 из позиций, что L громкоговорителей находятся по существу в 2D-плоскости, и генерирования 103 по меньшей мере одной виртуальной позиции виртуального громкоговорителя.3 depicts details of how, in one embodiment, speaker positions are obtained and modified. This embodiment contains the steps of determining 101 positions one ... LL speakers and order N sound field signal coefficients, determining 102 from positions that the L speakers are substantially in a 2D plane, and generating 103 at least one virtual position virtual speaker.
В одном варианте осуществления по меньшей мере одна виртуальная позиция является одной из и .In one embodiment, at least one virtual position is one of And .
В одном варианте осуществления две виртуальных позиции и , соответствующие двум виртуальным громкоговорителям, генерируются 103, где и .In one embodiment, two virtual positions And , corresponding to two virtual speakers, are generated 103, where And .
Согласно одному варианту осуществления способ для декодирования закодированного аудиосигнала для L громкоговорителей в известных позициях содержит этапы, на которых определяют 101 позиции 1 ... L L громкоговорителей и порядок N коэффициентов сигнала звукового поля, определяют 102 из позиций, что L громкоговорителей находятся по существу в 2D-плоскости, генерируют 103 по меньшей мере одну виртуальную позицию виртуального громкоговорителя, генерируют 11 3D-матрицу декодирования D', причем определенные позиции 1 ... L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, микшируют с понижением 12 3D-матрицу декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и декодируют 14 закодированный аудиосигнал i14 с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов q14 громкоговорителей.According to one embodiment, a method for decoding an encoded audio signal for L speakers at known positions comprises the steps of determining 101 positions one ... Loudspeaker LL and order N of sound field signal coefficients, determine 102 from positions that L loudspeakers are substantially in a 2D plane, generate 103 at least one virtual position virtual loudspeaker generate 11 3D decoding matrix D', with certain positions one ... Loudspeaker LL and at least one virtual position are used and the 3D decoding matrix D' has coefficients for said defined and virtual speaker positions, the 3D decoding matrix D' is downmixed 12, wherein the coefficients for the virtual speaker positions are weighted and distributed over coefficients related to the defined speaker positions, and where a reduced 3D decoding matrix is obtained having coefficients for certain speaker positions, and decode the 14 i14 encoded audio signal using the reduced 3D decoding matrix , and a plurality of decoded speaker signals q14 are obtained.
В одном варианте осуществления закодированный аудиосигнал является сигналом звукового поля, например в формате HOA.In one embodiment, the encoded audio signal is a sound field signal, such as in HOA format.
В одном варианте осуществления по меньшей мере одна виртуальная позиция виртуального громкоговорителя является одной из и .In one embodiment, at least one virtual position virtual speaker is one of the And .
В одном варианте осуществления коэффициенты для виртуальных позиций громкоговорителей взвешиваются посредством весового коэффициента .In one embodiment, the coefficients for virtual speaker positions are weighted by a weighting factor .
В одном варианте осуществления способ имеет дополнительный этап нормализации уменьшенной 3D-матрицы декодирования , причем получается нормализованная уменьшенная 3D-матрица декодирования D, и этап 14 декодирования закодированного аудиосигнала i14 использует нормализованную уменьшенную 3D-матрицу декодирования D. В одном варианте осуществления способ имеет дополнительный этап сохранения уменьшенной 3D-матрицы декодирования или нормализованной микшированной с понижением HOA-матрицы декодирования D в хранилище матрицы декодирования.In one embodiment, the method has the additional step of normalizing the reduced 3D decoding matrix , wherein a normalized reduced 3D decoding matrix D is obtained, and the encoded audio decoding step 14 i14 uses the normalized reduced 3D decoding matrix D. In one embodiment, the method has an additional step of storing the reduced 3D decoding matrix or a normalized downmix HOA decoding matrix D in the decoding matrix store.
Согласно одному варианту осуществления, матрица декодирования для обработки или декодирования сигнала звукового поля для некоторого заданного набора громкоговорителей генерируется путем генерирования первой предварительной матрицы декодирования с использованием стандартного способа и с использованием модифицированных позиций громкоговорителей, причем модифицированные позиции громкоговорителей включают в себя позиции громкоговорителей заданного набора громкоговорителей и по меньшей мере одну дополнительную виртуальную позицию громкоговорителя, и понижающего микширования первой предварительной матрицы декодирования, причем коэффициенты, относящиеся к по меньшей мере одному дополнительному виртуальному громкоговорителю, удаляются и распределяются по коэффициентам, относящимся к громкоговорителям из заданного набора громкоговорителей. В одном варианте осуществления последующий этап нормализации матрицы декодирования следует за этим. Получающаяся в результате матрица декодирования подходит для обработки или декодирования сигнала звукового поля для заданного набора громкоговорителей, причем даже звук от позиций, где никакой громкоговоритель не присутствует, воспроизводится с верной энергией сигнала. Это происходит ввиду строения улучшенной матрицы декодирования. Предпочтительно, первая предварительная матрица декодирования является сберегающей энергию.According to one embodiment, a decoding matrix for processing or decoding a sound field signal for a given set of speakers is generated by generating a first preliminary decoding matrix using a standard method and using modified speaker positions, where the modified speaker positions include the speaker positions of the given speaker set and at least one additional virtual speaker position, and downmixing the first pre-decoding matrix, wherein the coefficients associated with at least one additional virtual speaker are removed and distributed among the coefficients associated with speakers from a given set of speakers. In one embodiment, a subsequent decoding matrix normalization step follows this. The resulting decoding matrix is suitable for processing or decoding the sound field signal for a given set of speakers, even sound from positions where no speaker is present is reproduced with the correct signal energy. This is due to the structure of the improved decoding matrix. Preferably, the first decoding pre-matrix is energy saving.
Фиг.4a) изображает структурную схему устройства согласно одному варианту осуществления. Устройство 400 для декодирования закодированного аудиосигнала в формате звукового поля для L громкоговорителей в известных позициях содержит блок 410 суммирования для добавления по меньшей мере одной позиции по меньшей мере одного виртуального громкоговорителя к позициям L громкоговорителей, блок 411 генератора матрицы декодирования для генерирования 3D-матрицы декодирования D', причем позиции 1 ... L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, блок 412 понижающего микширования матрицы для понижающего микширования 3D-матрицы декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и блок 414 декодирования для декодирования закодированного аудиосигнала с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов громкоговорителей.4a) depicts a block diagram of a device according to one embodiment. A
В одном варианте осуществления устройство дополнительно содержит блок 413 нормализации для нормализации уменьшенной 3D-матрицы декодирования , причем получается нормализованная уменьшенная 3D-матрица декодирования D, и блок 414 декодирования использует нормализованную уменьшенную 3D-матрицу декодирования D.In one embodiment, the apparatus further comprises a
В одном варианте осуществления, изображенном на фиг.4b), устройство дополнительно содержит первый блок 4101 определения для определения позиций (L) L громкоговорителей и порядка N коэффициентов сигнала звукового поля, второй блок 4102 определения для определения из позиций, что L громкоговорителей находятся по существу в 2D-плоскости, и блок 4103 генерирования позиции виртуального громкоговорителя для генерирования по меньшей мере одной виртуальной позиции () виртуального громкоговорителя.In one embodiment depicted in FIG. 4b), the device further comprises a
В одном варианте осуществления устройство дополнительно содержит множество полосовых фильтров 715b для разделения закодированного аудиосигнала на множество полос частот, причем множество раздельных 3D-матриц декодирования Db' генерируется 711b, по одной для каждой полосы частот, и каждая 3D-матрица декодирования Db' микшируется с понижением 712b и опционально нормализуется раздельно, и причем блок 714b декодирования декодирует каждую полосу частот раздельно. В этом варианте осуществления устройство дополнительно содержит множество блоков 716b суммирования, по одному для каждого громкоговорителя. Каждый блок суммирования суммирует полосы частот, которые относятся к соответственному громкоговорителю.In one embodiment, the apparatus further comprises a plurality of band pass filters 715b for separating the encoded audio signal into a plurality of frequency bands, wherein a plurality of separate 3D decoding matrices Db' are generated 711b, one for each frequency band, and each 3D decoding matrix Db' is downmixed 712b and optionally normalized separately, and wherein the decoder 714b decodes each frequency band separately. In this embodiment, the device further comprises a plurality of summing
Каждый из блока 410 суммирования, блока 411 генератора матрицы декодирования, блока 412 понижающего микширования матрицы, блока 413 нормализации, блока 414 декодирования, первого блока 4101 определения, второго блока 4102 определения и блока 4103 генерирования позиции виртуального громкоговорителя может осуществляться одним или несколькими процессорами, и каждый из этих блоков может совместно использовать один и тот же процессор с любым другим из этих или других блоков.Each of summing
Фиг.7 изображает вариант осуществления, который использует раздельно оптимизированные матрицы декодирования для различных полос частот входного сигнала. В этом варианте осуществления способ декодирования содержит этап разделения закодированного аудиосигнала на множество полос частот с использованием полосовых фильтров. Множество раздельных 3D-матриц декодирования Db' генерируется 711b, по одной для каждой полосы частот, и каждая 3D-матрица декодирования Db' микшируется с понижением 712b и опционально нормализуется раздельно. Декодирование 714b закодированного аудиосигнала выполняется для каждой полосы частот раздельно. Это имеет преимущество в том, что зависимые от частоты различия в человеческом восприятии могут быть приняты в расчет и могут приводить к различным матрицам декодирования для различных полос частот. В одном варианте осуществления только одна или несколько (но не все) матриц декодирования генерируется путем добавления виртуальных позиций громкоговорителей и затем взвешивания и распределения их коэффициентов по коэффициентам для существующих позиций громкоговорителей, как описано выше. В другом варианте осуществления каждая из матриц декодирования генерируется путем добавления виртуальных позиций громкоговорителей и затем взвешивания и распределения их коэффициентов по коэффициентам для существующих позиций громкоговорителей, как описано выше. Наконец, все полосы частот, которые относятся к одному и тому же громкоговорителю, суммируются в одном блоке 716b суммирования полос частот для каждого громкоговорителя в операции, обратной к разбиению полос частот.7 depicts an embodiment that uses separately optimized decoding matrices for different input signal bandwidths. In this embodiment, the decoding method comprises the step of dividing the encoded audio signal into a plurality of frequency bands using band pass filters. A plurality of separate 3D decoding matrices Db' are generated 711b, one for each frequency band, and each 3D decoding matrix Db' is downmixed 712b and optionally normalized separately. Decoding 714b of the encoded audio signal is performed for each frequency band separately. This has the advantage that frequency dependent differences in human perception can be taken into account and can result in different decoding matrices for different frequency bands. In one embodiment, only one or more (but not all) decoding matrices are generated by adding virtual speaker positions and then weighting and distributing their coefficients to the coefficients for the existing speaker positions, as described above. In another embodiment, each of the decoding matrices is generated by adding virtual speaker positions and then weighting and distributing their coefficients to the coefficients for the existing speaker positions, as described above. Finally, all frequency bands that belong to the same speaker are summed in one frequency
Каждый из блока 410 суммирования, блока 711b генератора матрицы декодирования, блока 712b понижающего микширования матрицы, блока 713b нормализации, блока 714b декодирования, блока 716b суммирования полос частот и блока 715b полосовых фильтров может осуществляться одним или несколькими процессорами, и каждый из этих блоков может совместно использовать один и тот же процессор с любым другим из этих или других блоков.Each of summing
Один аспект настоящего раскрытия предназначен для получения матрицы обработки для 2D-компоновки с хорошими свойствами сбережения энергии. В одном варианте осуществления два виртуальных громкоговорителя добавляется сверху и снизу (углы возвышения +90° и -90°, причем 2D-громкоговорители размещены приблизительно на возвышении 0°). Для этой виртуальной 3D-компоновки громкоговорителей строится матрица обработки, которая удовлетворяет свойству сбережения энергии. Наконец, весовые коэффициенты из матрицы обработки для виртуальных громкоговорителей микшируются с постоянными усилениями для действительных громкоговорителей 2D-компоновки.One aspect of the present disclosure is to provide a 2D layout processing matrix with good power saving properties. In one embodiment, two virtual speakers are added at the top and bottom (elevation angles of +90° and -90°, with the 2D speakers placed at approximately 0° elevation). For this virtual 3D speaker layout, a processing matrix is built that satisfies the power saving property. Finally, the weights from the processing matrix for the virtual speakers are mixed with constant gains for the actual speakers in the 2D layout.
Далее описывается амбиофоническая (а именно HOA) обработка.The following describes ambiophonic (namely HOA) processing.
Амбиофоническая обработка является процессом вычисления сигналов громкоговорителей из амбиофонического описания звукового поля. Иногда она также называется амбиофоническим декодированием. Амбиофоническое 3D-представление звукового поля порядка N рассматривается, где количество коэффициентов равноAmbiophonic processing is the process of computing loudspeaker signals from an ambiophonic description of the sound field. It is sometimes also called ambiophonic decoding. An ambiophonic 3D sound field representation of order N is considered, where the number of coefficients is
Коэффициенты для временной выборки t представляются вектором b(t) c O3D элементами. Посредством матрицы обработки D сигналы громкоговорителей для временной выборки t вычисляются следующим образомThe coefficients for time sample t are represented by the vector b(t) with O3D elements. By processing matrix D speaker signals for time sample t are calculated as follows
где D , и w , и L является количеством громкоговорителей.where D , and w , and L is the number of speakers.
Позиции громкоговорителей определяются через их углы наклона и углы азимута , которые комбинируются в вектор для . Различные расстояния громкоговорителей от позиций прослушивания компенсируются посредством отдельных задержек для каналов громкоговорителей.Loudspeaker positions are determined in terms of their tilt angles and azimuth angles , which are combined into a vector for . Different speaker distances from listening positions are compensated for by separate delays for the speaker channels.
Энергия сигнала в области HOA дается следующим образомThe signal energy in the HOA region is given as follows
где H обозначает (комплексно-сопряженное) транспонирование. Соответствующая энергия сигналов громкоговорителей вычисляется следующим образомwhere H denotes the (complex conjugate) transposition. The corresponding energy of the loudspeaker signals is calculated as follows
Соотношение для сберегающей энергию матрицы декодирования/обработки должно быть постоянным для того, чтобы достигать сберегающего энергию декодирования/обработки.Ratio for the energy-saving decoding/processing matrix must be constant in order to achieve energy-saving decoding/processing.
По существу следующее расширение для улучшенной 2D-обработки предлагается: Для построения матриц обработки для 2D-компоновок громкоговорителей один или несколько виртуальных громкоговорителей добавляется. 2D-компоновки понимаются как те, в которых углы возвышения громкоговорителей находятся внутри определенного малого диапазона так, что они близки к горизонтальной плоскости. Это может быть выражено следующим образомAs such, the following extension for enhanced 2D processing is proposed: To build processing matrices for 2D speaker layouts, one or more virtual speakers are added. 2D arrangements are understood to be those in which the elevation angles of the loudspeakers are within a certain small range so that they are close to the horizontal plane. This can be expressed as follows
Пороговое значение обычно выбирается для соответствия значению в диапазоне 5°-10° в одном варианте осуществления.Threshold typically selected to match a value in the range of 5°-10° in one embodiment.
Для построения обработки определяется модифицированный набор углов громкоговорителей . Последние (в этом примере две) позиции громкоговорителей являются позициями двух виртуальных громкоговорителей на северном и южном полюсах (в вертикальном направлении, т.е. сверху и снизу) полярной системы координат:To construct the processing, a modified set of speaker angles is determined . The last (two in this example) speaker positions are the positions of the two virtual speakers at the north and south poles (in the vertical direction, i.e. top and bottom) of the polar coordinate system:
ZEqn1_virtualLS
ZEqn1_virtualLS
Таким образом, новое количество громкоговорителей, используемое для построения обработки, равно . Из этих модифицированных позиций громкоговорителей матрица обработки строится с подходом сбережения энергии. Например, способ построения, описанный в [1], может быть использован. Теперь окончательная матрица обработки для исходной компоновки громкоговорителей находится из D'. Одной идеей является микшировать весовые коэффициенты для виртуального громкоговорителя, определенные в матрице D', для действительных громкоговорителей. Фиксированный коэффициент усиления используется, который выбирается равнымSo the new number of speakers used to build the processing is . From these modified speaker positions, the processing matrix built with an energy conservation approach. For example, the construction method described in [1] can be used. Now the final processing matrix for the original speaker layout is from D'. One idea is to mix the virtual speaker weights defined in the matrix D' to the actual speakers. A fixed gain is used, which is chosen to be
Коэффициенты промежуточной матрицы (также называемой здесь уменьшенной 3D-матрицей декодирования) определяются следующим образомIntermediate matrix coefficients (also referred to here as the reduced 3D decoding matrix) are defined as follows
где является элементом матрицы в l-й строке и q-м столбце. На опциональном последнем этапе промежуточная матрица (уменьшенная 3D-матрица декодирования) нормализуется с использованием нормы Фробениуса:where is an element of the matrix in l-th row and q-th column. In an optional last step, the intermediate matrix (reduced 3D decoding matrix) is normalized using the Frobenius norm:
Фиг.5 и 6 изображают распределения энергии для компоновки громкоговорителей объемного звучания 5.0. На обоих чертежах значения энергии показаны как градации серого, и окружности указывают позиции громкоговорителей. Посредством раскрываемого способа в особенности ослабление сверху (а также снизу, не показано здесь) явным образом уменьшается.5 and 6 show the energy distributions for a 5.0 surround speaker layout. In both drawings, the energy values are shown as grayscale and the circles indicate the positions of the loudspeakers. By means of the disclosed method in particular, attenuation from above (and also from below, not shown here) is clearly reduced.
Фиг.5 изображает распределение энергии, возникающее в результате стандартной матрицы декодирования. Малые окружности вокруг плоскости z=0 представляют позиции громкоговорителей. Как можно увидеть, покрывается диапазон энергии [-3,9, ..., 2,1] дБ, что дает в результате различия в энергии, равные 6 дБ. Кроме того, сигналы сверху (и снизу, не показано) единичной сферы воспроизводятся с очень низкой энергией, т.е. не слышны, поскольку никакие громкоговорители здесь не доступны.5 shows the energy distribution resulting from the standard decoding matrix. The small circles around the z=0 plane represent the positions of the loudspeakers. As can be seen, the energy range of [-3.9, ..., 2.1] dB is covered, resulting in an energy difference of 6 dB. In addition, signals from above (and below, not shown) the unit sphere are reproduced at very low energy, i.e. are inaudible as no loudspeakers are available here.
Фиг.6 изображает распределение энергии, возникающее в результате матрицы декодирования согласно одному или нескольким вариантам осуществления, причем то же самое количество громкоговорителей находится в тех же самых позициях, что и на фиг.5. По меньшей мере следующие преимущества обеспечены: во-первых, покрывается меньший диапазон энергии [-1,6, ..., 0,8] дБ, что дает в результате меньшие различия в энергии, равные только 2,4 дБ. Во-вторых, сигналы из всех направлений единичной сферы воспроизводятся с их верной энергией, даже если никакие громкоговорители здесь не доступны. Поскольку эти сигналы воспроизводятся через доступные громкоговорители, их локализация не верна, но сигналы слышны с верной громкостью. В этом примере сигналы сверху и снизу (не показано) становятся слышимыми ввиду декодирования посредством улучшенной матрицы декодирования.FIG. 6 depicts the energy distribution resulting from a decoding matrix according to one or more embodiments, with the same number of speakers in the same positions as in FIG. At least the following advantages are provided: firstly, a smaller energy range [-1.6, ..., 0.8] dB is covered, resulting in smaller energy differences of only 2.4 dB. Secondly, signals from all directions of the unit sphere are reproduced with their correct energy, even if no loudspeakers are available here. Since these signals are played through the available speakers, their localization is not correct, but the signals are heard at the correct volume. In this example, top and bottom signals (not shown) are made audible due to decoding by the enhanced decoding matrix.
В одном варианте осуществления способ для декодирования закодированного аудиосигнала в амбиофоническом формате для L громкоговорителей в известных позициях содержит этапы, на которых добавляют по меньшей мере одну позицию по меньшей мере одного виртуального громкоговорителя к позициям L громкоговорителей, генерируют 3D-матрицу декодирования D', причем позиции 1, ..., L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, микшируют с понижением 3D-матрицу декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и декодируют закодированный аудиосигнал с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов громкоговорителей.In one embodiment, a method for decoding an encoded audio signal in ambiophonic format for L speakers at known positions comprises adding at least one position of at least one virtual speaker to the L speaker positions, generating a 3D decoding matrix D', wherein the positions one, ..., Loudspeaker LL and at least one virtual position are used and the 3D decoding matrix D' has the coefficients for said specific and virtual speaker positions, the 3D decoding matrix D' is downmixed, the coefficients for the virtual speaker positions are weighted and distributed over the coefficients related to the determined speaker positions, and the result is reduced 3D decoding matrix having coefficients for certain speaker positions, and decode the encoded audio signal using the reduced 3D decoding matrix , and a plurality of decoded speaker signals are obtained.
В другом варианте осуществления устройство для декодирования закодированного аудиосигнала в амбиофоническом формате для L громкоговорителей в известных позициях содержит блок 410 суммирования для добавления по меньшей мере одной позиции по меньшей мере одного виртуального громкоговорителя к позициям L громкоговорителей, блок 411 генератора матрицы декодирования для генерирования 3D-матрицы декодирования D', причем позиции 1 ... L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, блок 412 понижающего микширования матрицы для понижающего микширования 3D-матрицы декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и блок 414 декодирования для декодирования закодированного аудиосигнала с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов громкоговорителей.In another embodiment, a device for decoding an encoded audio signal in an ambiophonic format for L speakers at known positions comprises a
В еще одном варианте осуществления устройство для декодирования закодированного аудиосигнала в амбиофоническом формате для L громкоговорителей в известных позициях содержит по меньшей мере один процессор и по меньшей мере одну память, причем память имеет сохраненные инструкции, которые при исполнении в процессоре осуществляют блок 410 суммирования для добавления по меньшей мере одной позиции по меньшей мере одного виртуального громкоговорителя к позициям L громкоговорителей, блок 411 генератора матрицы декодирования для генерирования 3D-матрицы декодирования D', причем позиции 1 ... L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, блок 412 понижающего микширования матрицы для понижающего микширования 3D-матрицы декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и блок 414 декодирования для декодирования закодированного аудиосигнала с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов громкоговорителей.In yet another embodiment, a device for decoding an encoded audio signal in ambiophonic format for L loudspeakers at known positions comprises at least one processor and at least one memory, the memory having stored instructions that, when executed in the processor, perform a
В еще одном варианте осуществления машиночитаемый носитель данных имеет сохраненные на нем исполняемые инструкции для побуждения компьютера выполнять способ для декодирования закодированного аудиосигнала в амбиофоническом формате для L громкоговорителей в известных позициях, причем способ содержит этапы, на которых добавляют по меньшей мере одну позицию по меньшей мере одного виртуального громкоговорителя к позициям L громкоговорителей, генерируют 3D-матрицу декодирования D', причем позиции 1, ..., L L громкоговорителей и по меньшей мере одна виртуальная позиция используются, и 3D-матрица декодирования D' имеет коэффициенты для упомянутых определенных и виртуальных позиций громкоговорителей, микшируют с понижением 3D-матрицу декодирования D', причем коэффициенты для виртуальных позиций громкоговорителей взвешиваются и распределяются по коэффициентам, относящимся к определенным позициям громкоговорителей, и причем получается уменьшенная 3D-матрица декодирования , имеющая коэффициенты для определенных позиций громкоговорителей, и декодируют закодированный аудиосигнал с использованием уменьшенной 3D-матрицы декодирования , причем получается множество декодированных сигналов громкоговорителей. Дополнительные варианты осуществления машиночитаемых носителей информации могут включать в себя любые признаки, описанные выше, в частности признаки, раскрываемые в зависимых пунктах формулы изобретения, ссылающиеся на пункт 1.In yet another embodiment, a computer-readable storage medium has executable instructions stored thereon for causing a computer to perform a method for decoding an encoded audio signal in ambiophonic format for L speakers at known positions, the method comprising adding at least one position of at least one virtual speaker to L speaker positions generate a 3D decoding matrix D', with the positions one, ..., Loudspeaker LL and at least one virtual position are used and the 3D decoding matrix D' has the coefficients for said specific and virtual speaker positions, the 3D decoding matrix D' is downmixed, the coefficients for the virtual speaker positions are weighted and distributed over the coefficients related to the determined speaker positions, and the result is reduced 3D decoding matrix having coefficients for certain speaker positions, and decode the encoded audio signal using the reduced 3D decoding matrix , and a plurality of decoded speaker signals are obtained. Additional embodiments of computer-readable storage media may include any of the features described above, in particular the features disclosed in dependent claims referring to
Следует понимать, что настоящее изобретение было описано исключительно в качестве примера, и модификации подробностей могут быть осуществлены без выхода за пределы объема изобретения. Например, хотя это описано только в отношении HOA, изобретение может также применяться для других аудиоформатов звукового поля.It should be understood that the present invention has been described by way of example only, and modifications of the details may be made without departing from the scope of the invention. For example, although only described in relation to HOA, the invention can also be applied to other sound field audio formats.
Каждый признак, раскрываемый в описании, (где уместно) в формуле изобретения и на чертежах может быть обеспечен независимо или в любой надлежащей комбинации. Признаки могут, где уместно, осуществляться в аппаратных средствах, в программных средствах или в их комбинации. Ссылочные позиции, фигурирующие в формуле изобретения, приведены только в качестве иллюстрации и не должны оказывать ограничивающего эффекта на объем формулы изобретения.Each feature disclosed in the description, (where appropriate) in the claims and drawings may be provided independently or in any appropriate combination. The features may, where appropriate, be implemented in hardware, software, or a combination of both. Reference numerals appearing in the claims are for illustrative purposes only and are not intended to limit the scope of the claims.
На следующие материалы были сделаны ссылки выше.The following materials have been referenced above.
[1] Интернациональная патентная публикация № WO2014/012945A1 (PD120032).[1] International Patent Publication No. WO2014/012945A1 (PD120032).
[2] Ф. Зоттер и М. Франк, "Круговое амбиофоническое панорамирование и декодирование" ("All-Round Ambisonic Panning and Decoding"), Журнал Общества инженеров по звуковой технике, 2012 г., том 60, стр.807-820.[2] F. Zotter and M. Frank, "All-Round Ambisonic Panning and Decoding", Journal of the Society of Audio Engineers, 2012, Volume 60, pp. 807-820.
Claims (9)
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP20130290255 EP2866475A1 (en) | 2013-10-23 | 2013-10-23 | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
EP13290255.2 | 2013-10-23 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016119533A Division RU2679230C2 (en) | 2013-10-23 | 2014-10-20 | Method and apparatus for decoding ambisonics audio sound field representation for audio playback using 2d setups |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2022101794A Division RU2022101794A (en) | 2013-10-23 | 2022-01-27 | METHOD AND DEVICE FOR DECODING AMBIOPHONY AUDIO REPRESENTATION OF SOUND FIELD FOR AUDIO PLAYBACK USING 2D LAYOUTS |
Publications (3)
Publication Number | Publication Date |
---|---|
RU2019100542A RU2019100542A (en) | 2019-02-28 |
RU2019100542A3 RU2019100542A3 (en) | 2021-12-08 |
RU2766560C2 true RU2766560C2 (en) | 2022-03-15 |
Family
ID=49626882
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016119533A RU2679230C2 (en) | 2013-10-23 | 2014-10-20 | Method and apparatus for decoding ambisonics audio sound field representation for audio playback using 2d setups |
RU2019100542A RU2766560C2 (en) | 2013-10-23 | 2014-10-20 | Method and device for decoding ambiophonic audio presentation of sound field for audio playback using 2d-arrangements |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2016119533A RU2679230C2 (en) | 2013-10-23 | 2014-10-20 | Method and apparatus for decoding ambisonics audio sound field representation for audio playback using 2d setups |
Country Status (16)
Country | Link |
---|---|
US (8) | US9813834B2 (en) |
EP (5) | EP2866475A1 (en) |
JP (5) | JP6463749B2 (en) |
KR (4) | KR102491042B1 (en) |
CN (6) | CN108632736B (en) |
AU (6) | AU2014339080B2 (en) |
BR (2) | BR112016009209B1 (en) |
CA (5) | CA3168427A1 (en) |
ES (1) | ES2637922T3 (en) |
HK (4) | HK1257203A1 (en) |
MX (5) | MX359846B (en) |
MY (2) | MY179460A (en) |
RU (2) | RU2679230C2 (en) |
TW (4) | TWI817909B (en) |
WO (1) | WO2015059081A1 (en) |
ZA (5) | ZA201801738B (en) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9288603B2 (en) | 2012-07-15 | 2016-03-15 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding |
US9473870B2 (en) | 2012-07-16 | 2016-10-18 | Qualcomm Incorporated | Loudspeaker position compensation with 3D-audio hierarchical coding |
US9516446B2 (en) | 2012-07-20 | 2016-12-06 | Qualcomm Incorporated | Scalable downmix design for object-based surround codec with cluster analysis by synthesis |
US9761229B2 (en) | 2012-07-20 | 2017-09-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for audio object clustering |
US9913064B2 (en) | 2013-02-07 | 2018-03-06 | Qualcomm Incorporated | Mapping virtual speakers to physical speakers |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
US9838819B2 (en) * | 2014-07-02 | 2017-12-05 | Qualcomm Incorporated | Reducing correlation between higher order ambisonic (HOA) background channels |
WO2017081222A1 (en) * | 2015-11-13 | 2017-05-18 | Dolby International Ab | Method and apparatus for generating from a multi-channel 2d audio input signal a 3d sound representation signal |
US20170372697A1 (en) * | 2016-06-22 | 2017-12-28 | Elwha Llc | Systems and methods for rule-based user control of audio rendering |
FR3060830A1 (en) * | 2016-12-21 | 2018-06-22 | Orange | SUB-BAND PROCESSING OF REAL AMBASSIC CONTENT FOR PERFECTIONAL DECODING |
US10405126B2 (en) | 2017-06-30 | 2019-09-03 | Qualcomm Incorporated | Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems |
CA3069241C (en) | 2017-07-14 | 2023-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description |
RU2740703C1 (en) * | 2017-07-14 | 2021-01-20 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Principle of generating improved sound field description or modified description of sound field using multilayer description |
US10015618B1 (en) * | 2017-08-01 | 2018-07-03 | Google Llc | Incoherent idempotent ambisonics rendering |
CN114582357A (en) * | 2020-11-30 | 2022-06-03 | 华为技术有限公司 | Audio coding and decoding method and device |
US11743670B2 (en) | 2020-12-18 | 2023-08-29 | Qualcomm Incorporated | Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP2124351B1 (en) * | 2008-05-20 | 2010-12-15 | NTT DoCoMo, Inc. | A spatial sub-channel selection and pre-coding apparatus |
WO2011129304A1 (en) * | 2010-04-13 | 2011-10-20 | ソニー株式会社 | Signal processing device and method, encoding device and method, decoding device and method, and program |
US8111830B2 (en) * | 2005-12-19 | 2012-02-07 | Samsung Electronics Co., Ltd. | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener |
RU2011117698A (en) * | 2008-10-07 | 2012-11-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., (DE) | BINAURAL VISUALIZATION OF MULTICANAL AUDIO SIGNAL |
US20130010971A1 (en) * | 2010-03-26 | 2013-01-10 | Johann-Markus Batke | Method and device for decoding an audio soundfield representation for audio playback |
WO2013149867A1 (en) * | 2012-04-02 | 2013-10-10 | Sonicemotion Ag | Method for high quality efficient 3d sound reproduction |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5594800A (en) * | 1991-02-15 | 1997-01-14 | Trifield Productions Limited | Sound reproduction system having a matrix converter |
GB9204485D0 (en) * | 1992-03-02 | 1992-04-15 | Trifield Productions Ltd | Surround sound apparatus |
US6798889B1 (en) * | 1999-11-12 | 2004-09-28 | Creative Technology Ltd. | Method and apparatus for multi-channel sound system calibration |
FR2847376B1 (en) * | 2002-11-19 | 2005-02-04 | France Telecom | METHOD FOR PROCESSING SOUND DATA AND SOUND ACQUISITION DEVICE USING THE SAME |
EP2088580B1 (en) * | 2005-07-14 | 2011-09-07 | Koninklijke Philips Electronics N.V. | Audio decoding |
KR100619082B1 (en) * | 2005-07-20 | 2006-09-05 | 삼성전자주식회사 | Method and apparatus for reproducing wide mono sound |
KR20080086549A (en) * | 2006-04-03 | 2008-09-25 | 엘지전자 주식회사 | Apparatus for processing media signal and method thereof |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
EP2372701B1 (en) | 2006-10-16 | 2013-12-11 | Dolby International AB | Enhanced coding and parameter representation of multichannel downmixed object coding |
FR2916078A1 (en) * | 2007-05-10 | 2008-11-14 | France Telecom | AUDIO ENCODING AND DECODING METHOD, AUDIO ENCODER, AUDIO DECODER AND ASSOCIATED COMPUTER PROGRAMS |
GB2467668B (en) * | 2007-10-03 | 2011-12-07 | Creative Tech Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US8605914B2 (en) * | 2008-04-17 | 2013-12-10 | Waves Audio Ltd. | Nonlinear filter for separation of center sounds in stereophonic audio |
DK2211563T3 (en) * | 2009-01-21 | 2011-12-19 | Siemens Medical Instr Pte Ltd | Blind source separation method and apparatus for improving interference estimation by binaural Weiner filtration |
KR20110041062A (en) * | 2009-10-15 | 2011-04-21 | 삼성전자주식회사 | Virtual speaker apparatus and method for porocessing virtual speaker |
JP2011211312A (en) * | 2010-03-29 | 2011-10-20 | Panasonic Corp | Sound image localization processing apparatus and sound image localization processing method |
WO2012025580A1 (en) * | 2010-08-27 | 2012-03-01 | Sonicemotion Ag | Method and device for enhanced sound field reproduction of spatially encoded audio input signals |
EP2450880A1 (en) * | 2010-11-05 | 2012-05-09 | Thomson Licensing | Data structure for Higher Order Ambisonics audio data |
EP2469741A1 (en) * | 2010-12-21 | 2012-06-27 | Thomson Licensing | Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field |
EP2541547A1 (en) * | 2011-06-30 | 2013-01-02 | Thomson Licensing | Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation |
EP2592845A1 (en) * | 2011-11-11 | 2013-05-15 | Thomson Licensing | Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field |
EP2645748A1 (en) * | 2012-03-28 | 2013-10-02 | Thomson Licensing | Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal |
EP4284026A3 (en) | 2012-07-16 | 2024-02-21 | Dolby International AB | Method and device for rendering an audio soundfield representation |
CN102932730B (en) * | 2012-11-08 | 2014-09-17 | 武汉大学 | Method and system for enhancing sound field effect of loudspeaker group in regular tetrahedron structure |
EP2866475A1 (en) * | 2013-10-23 | 2015-04-29 | Thomson Licensing | Method for and apparatus for decoding an audio soundfield representation for audio playback using 2D setups |
-
2013
- 2013-10-23 EP EP20130290255 patent/EP2866475A1/en not_active Withdrawn
-
2014
- 2014-10-17 TW TW112107889A patent/TWI817909B/en active
- 2014-10-17 TW TW107141933A patent/TWI686794B/en active
- 2014-10-17 TW TW103135906A patent/TWI651973B/en active
- 2014-10-17 TW TW109102609A patent/TWI797417B/en active
- 2014-10-20 CN CN201810453098.4A patent/CN108632736B/en active Active
- 2014-10-20 KR KR1020217009256A patent/KR102491042B1/en active IP Right Grant
- 2014-10-20 CA CA3168427A patent/CA3168427A1/en active Pending
- 2014-10-20 US US15/030,066 patent/US9813834B2/en active Active
- 2014-10-20 CA CA2924700A patent/CA2924700C/en active Active
- 2014-10-20 WO PCT/EP2014/072411 patent/WO2015059081A1/en active Application Filing
- 2014-10-20 EP EP23160070.1A patent/EP4213508A1/en active Pending
- 2014-10-20 CN CN201810453100.8A patent/CN108632737B/en active Active
- 2014-10-20 KR KR1020237001978A patent/KR102629324B1/en active IP Right Grant
- 2014-10-20 RU RU2016119533A patent/RU2679230C2/en active
- 2014-10-20 MY MYPI2016700638A patent/MY179460A/en unknown
- 2014-10-20 EP EP20186663.9A patent/EP3742763B1/en active Active
- 2014-10-20 EP EP17180213.5A patent/EP3300391B1/en active Active
- 2014-10-20 JP JP2016525578A patent/JP6463749B2/en active Active
- 2014-10-20 CN CN201810453094.6A patent/CN108777836B/en active Active
- 2014-10-20 CA CA3221605A patent/CA3221605A1/en active Pending
- 2014-10-20 KR KR1020247002360A patent/KR20240017091A/en active Application Filing
- 2014-10-20 CN CN201810453121.XA patent/CN108337624B/en active Active
- 2014-10-20 AU AU2014339080A patent/AU2014339080B2/en active Active
- 2014-10-20 CN CN201810453106.5A patent/CN108777837B/en active Active
- 2014-10-20 MX MX2016005191A patent/MX359846B/en active IP Right Grant
- 2014-10-20 RU RU2019100542A patent/RU2766560C2/en active
- 2014-10-20 EP EP14786876.4A patent/EP3061270B1/en active Active
- 2014-10-20 BR BR112016009209-0A patent/BR112016009209B1/en active IP Right Grant
- 2014-10-20 KR KR1020167010383A patent/KR102235398B1/en active IP Right Grant
- 2014-10-20 BR BR122017020302-9A patent/BR122017020302B1/en active IP Right Grant
- 2014-10-20 ES ES14786876.4T patent/ES2637922T3/en active Active
- 2014-10-20 MY MYPI2019006201A patent/MY191340A/en unknown
- 2014-10-20 CA CA3147189A patent/CA3147189C/en active Active
- 2014-10-20 CA CA3147196A patent/CA3147196C/en active Active
- 2014-10-20 CN CN201480056122.0A patent/CN105637902B/en active Active
-
2016
- 2016-04-21 MX MX2022011448A patent/MX2022011448A/en unknown
- 2016-04-21 MX MX2018012489A patent/MX2018012489A/en unknown
- 2016-04-21 MX MX2022011447A patent/MX2022011447A/en unknown
- 2016-04-21 MX MX2022011449A patent/MX2022011449A/en unknown
- 2016-07-29 HK HK18116206.6A patent/HK1257203A1/en unknown
- 2016-07-29 HK HK16109099.3A patent/HK1221105A1/en unknown
- 2016-07-29 HK HK18114756.5A patent/HK1255621A1/en unknown
-
2017
- 2017-09-28 US US15/718,471 patent/US10158959B2/en active Active
-
2018
- 2018-03-14 ZA ZA2018/01738A patent/ZA201801738B/en unknown
- 2018-09-26 HK HK18112339.5A patent/HK1252979A1/en unknown
- 2018-11-13 US US16/189,732 patent/US10694308B2/en active Active
- 2018-11-23 AU AU2018267665A patent/AU2018267665B2/en active Active
-
2019
- 2019-01-04 JP JP2019000177A patent/JP6660493B2/en active Active
- 2019-02-27 ZA ZA2019/01243A patent/ZA201901243B/en unknown
-
2020
- 2020-02-07 JP JP2020019638A patent/JP6950014B2/en active Active
- 2020-06-16 US US16/903,238 patent/US10986455B2/en active Active
- 2020-08-14 ZA ZA2020/05036A patent/ZA202005036B/en unknown
-
2021
- 2021-02-12 AU AU2021200911A patent/AU2021200911B2/en active Active
- 2021-04-15 US US17/231,291 patent/US11451918B2/en active Active
- 2021-09-22 JP JP2021153984A patent/JP7254137B2/en active Active
- 2021-09-28 ZA ZA2021/07269A patent/ZA202107269B/en unknown
-
2022
- 2022-08-23 US US17/893,729 patent/US11770667B2/en active Active
- 2022-08-23 US US17/893,753 patent/US11750996B2/en active Active
- 2022-09-27 ZA ZA2022/10670A patent/ZA202210670B/en unknown
- 2022-12-20 AU AU2022291445A patent/AU2022291445A1/en active Pending
- 2022-12-20 AU AU2022291443A patent/AU2022291443A1/en active Pending
- 2022-12-20 AU AU2022291444A patent/AU2022291444B2/en active Active
-
2023
- 2023-03-28 JP JP2023051470A patent/JP2023078432A/en active Pending
- 2023-08-28 US US18/457,030 patent/US20240056755A1/en active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8111830B2 (en) * | 2005-12-19 | 2012-02-07 | Samsung Electronics Co., Ltd. | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener |
EP2124351B1 (en) * | 2008-05-20 | 2010-12-15 | NTT DoCoMo, Inc. | A spatial sub-channel selection and pre-coding apparatus |
RU2011117698A (en) * | 2008-10-07 | 2012-11-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., (DE) | BINAURAL VISUALIZATION OF MULTICANAL AUDIO SIGNAL |
US20130010971A1 (en) * | 2010-03-26 | 2013-01-10 | Johann-Markus Batke | Method and device for decoding an audio soundfield representation for audio playback |
WO2011129304A1 (en) * | 2010-04-13 | 2011-10-20 | ソニー株式会社 | Signal processing device and method, encoding device and method, decoding device and method, and program |
WO2013149867A1 (en) * | 2012-04-02 | 2013-10-10 | Sonicemotion Ag | Method for high quality efficient 3d sound reproduction |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2766560C2 (en) | Method and device for decoding ambiophonic audio presentation of sound field for audio playback using 2d-arrangements | |
TWI841483B (en) | Method and apparatus for rendering ambisonics format audio signal to 2d loudspeaker setup and computer readable storage medium |