RU2416172C1 - Способ и устройство для улучшения воспроизведения звука - Google Patents

Способ и устройство для улучшения воспроизведения звука Download PDF

Info

Publication number
RU2416172C1
RU2416172C1 RU2009134471/09A RU2009134471A RU2416172C1 RU 2416172 C1 RU2416172 C1 RU 2416172C1 RU 2009134471/09 A RU2009134471/09 A RU 2009134471/09A RU 2009134471 A RU2009134471 A RU 2009134471A RU 2416172 C1 RU2416172 C1 RU 2416172C1
Authority
RU
Russia
Prior art keywords
origin
channel
audio
sound
signal
Prior art date
Application number
RU2009134471/09A
Other languages
English (en)
Inventor
Вилле ПУЛККИ (FI)
Вилле ПУЛККИ
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Application granted granted Critical
Publication of RU2416172C1 publication Critical patent/RU2416172C1/ru

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Abstract

Изобретение относится к способам и устройствам воспроизведения многоканальных звуковых сигналов. Техническим результатом является улучшение восприятия направления источника восстановленного звукового сигнала. Указанный технический результат достигается тем, что звуковой сигнал, имеющий, по крайней мере, один звуковой канал и связанные параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи, восстанавливается для получения восстановленного звукового сигнала. Выбирается желаемое направление происхождения относительно позиции звукозаписи. Часть звукового канала изменяется для получения восстановленной части восстановленного звукового сигнала, где изменение включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от желаемого направления происхождения. 6 н. и 13 з.п. ф-лы, 8 ил.

Description

Данное изобретение имеет отношение к методам, дающим возможность улучшить восприятие направления источника восстановленного звукового сигнала. В частности, данное изобретение предлагает устройство и способ для воспроизведения записанных звуковых сигналов таким образом, что выбираемое направление источников звука может быть акцентировано или перегружено относительно звуковых сигналов, поступающих с других направлений.
Обычно при многоканальном воспроизводстве и прослушивании слушатель окружен многочисленными громкоговорителями. Существуют различные методы захвата звуковых сигналов для определенных установок. Общая цель при воспроизведении состоит в том, чтобы воспроизвести пространственный состав первоначально записанного звука, то есть происхождение индивидуального звукового источника, такого как местоположение трубы в оркестре. Использование нескольких акустических установок достаточно распространено и может создать различные пространственные впечатления. Не используя специальные методы компоновки, общеизвестные двухканальные стереоустановки могут только воссоздать слуховые события на линии между этими двумя громкоговорителями. Это, главным образом, достигается так называемым «амплитудным панорамированием», где амплитуда сигнала, связанного с одним звуковым источником, распределяется между этими двумя громкоговорителями, в зависимости от положения источника звука относительно громкоговорителей. Это обычно делается во время звукозаписи или последующего микширования. То есть источник звука, поступающий с крайне-левой позиции относительно слушателя, будет, главным образом, воспроизведен левым громкоговорителем, а источник звука с позиции перед слушателем будет воспроизведен с идентичной амплитудой (уровнем) обоими громкоговорителями. Однако звук, исходящий с других направлений, не может быть воспроизведен.
Следовательно, при использовании большего количества громкоговорителей, которые распределены вокруг слушателя, большее количество направлений может быть покрыто, и может быть создано более естественное пространственное впечатление. Вероятно, самая известная схема расположения многоканальных громкоговорителей - это стандарт 5.1 (ITU-R775-1), который состоит из 5 громкоговорителей, азимутальные углы которых определены равными 0°, ±30° и ±110° относительно положения слушателя. Это означает, что во время звукозаписи или микширования сигнал приспосабливается к этой определенной конфигурации громкоговорителей, и отклонения установки воспроизведения от стандарта приведут к снижению качества воспроизведения.
Также были предложены многочисленные другие системы с различным числом громкоговорителей, расположенных в различных направлениях. Профессиональные и специальные системы, особенно в театрах и звуковых установках, также включают громкоговорители, расположенные на различных высотах.
Согласно различным установкам воспроизведения несколько различных методов записи были разработаны и предложены для вышеупомянутых систем громкоговорителя, чтобы записывать и воспроизводить пространственное впечатление в ситуации прослушивания, как если бы оно было воспринято при звукозаписи в окружающей среде. Теоретически идеальный способ записи пространственного звука для выбранной многоканальной системы громкоговорителя состоял бы в том, чтобы использовать столько же микрофонов, сколько имеется громкоговорителей. В таком случае диаграммы направления микрофонов должны также соответствовать схеме расположения громкоговорителей так, чтобы звук от любого единичного направления был бы записан только небольшим количеством микрофонов (1, 2 или больше). Каждый микрофон связан с определенным громкоговорителем. Чем больше громкоговорителей используется при воспроизведении, тем более узкими должны быть диаграммы направления микрофонов. Однако узко-направленные микрофоны довольно дороги и обычно имеют неплоскую частотную характеристику, значительно ухудшающую качество записанного звука. Кроме того, использование нескольких микрофонов со слишком широкими диаграммами направления в качестве ввода к многоканальному воспроизведению приводит к окрашенному и расплывчатому слуховому восприятию, вследствие того, что звук, исходящий из единичного направления, будет всегда воспроизводиться большим количеством громкоговорителей, чем необходимо, как если бы запись производилась микрофонами, связанными с различными громкоговорителями. В целом, имеющиеся в настоящее время микрофоны лучше всего подходят для двухканальной записи и воспроизведения, то есть они разработаны без цели воспроизведения окружающего пространственного впечатления.
Относительно конструкции микрофона обсуждалось несколько способов приспособления диаграмм направления микрофонов к требованиям пространственного воспроизведения звука. Вообще, все микрофоны захватывают звук по-разному в зависимости от направления поступления звука в микрофон. Таким образом, микрофоны имеют различную чувствительность в зависимости от направления поступления записанного звука. В некоторых микрофонах этот эффект незначителен, поскольку они захватывают звук почти независимо от направления. Эти микрофоны обычно называют ненаправленными микрофонами. В типичной конструкции микрофона круглая диафрагма прикреплена к маленькому воздухонепроницаемому корпусу. Если диафрагма не прикреплена к корпусу, и звук достигает ее одинаково с каждой стороны, то ее диаграмма направления имеет два лепестка. Таким образом, такой микрофон захватывает звук с равной чувствительностью и спереди, и сзади диафрагмы, однако, с обратными полярностями. Такой микрофон не захватывает звук, поступающий с направления, совпадающего с плоскостью диафрагмы, то есть перпендикулярного направлению максимальной чувствительности. Такая диаграмма направления называется диполем, или «восьмеркой».
Ненаправленные микрофоны могут также быть модифицированы в направленные микрофоны при помощи использования воздухопроницаемого корпуса для микрофона. Корпус специально сконструирован таким образом, что звуковые волны могут проходить по корпусу и достигать диафрагмы, в которой некоторые направления распространения являются предпочтительными, так что диаграмма направления такого микрофона становится конфигурацией между ненаправленным микрофоном и диполем. Эти конфигурации могут, например, иметь два лепестка. Однако лепестки могут иметь различную интенсивность. Некоторые наиболее известные микрофоны имеют конфигурации только с одним единственным лепестком. Самый важный пример - кардиоидная конфигурация, где направленная функция D может быть выражена как D=1+cos (θ), θ - направление поступления звука. Направленная функция, таким образом, определяет, какая фракция поступающей звуковой амплитуды захватывается в зависимости от направления.
Ранее обсужденные ненаправленные конфигурации также называют конфигурациями нулевого порядка, а другие ранее упомянутые конфигурации (диполь и кардиоид) называют конфигурациями первого порядка. Все ранее обсужденные конструкции микрофона не допускают произвольное формирование диаграммы направления, так как их диаграмма направления полностью определяется их механической конструкцией.
Чтобы частично преодолеть эту проблему, были разработаны некоторые специализированные акустические конструкции, которые могут использоваться для создания более узких диаграмм направления, чем таковые у микрофонов первого порядка. Например, если прикрепить трубку с отверстиями в ней к ненаправленному микрофону, можно создать микрофон с узкой диаграммой направления. Эти микрофоны называются остронаправленными микрофонами. Однако обычно они не имеют плоской частотной характеристики, то есть диаграмма направления сужена за счет качества записанного звука. Кроме того, диаграмма направления предопределена геометрической конструкцией и, таким образом, диаграмму направления записи, выполненной с таким микрофоном, нельзя контролировать после записи.
Поэтому были предложены другие методы, позволяющие частично изменять диаграмму направления после фактической записи. В целом, это рассчитано на основную идею записи звука при помощи множества ненаправленных или направленных микрофонов с последующей обработкой сигнала. Недавно был предложен целый ряд таких различных методов. Довольно простой пример - запись звука с двумя ненаправленными микрофонами, размещенными близко друг к другу, и вычитание обоих сигналов друг из друга. Это создает виртуальный сигнал микрофона, имеющий диаграмму направления, эквивалентную диполю.
В других более сложных схемах сигналы микрофона могут также быть отсрочены или отфильтрованы до их суммирования. В технике, использующей формирование луча, также известной в связи с беспроводной ЛВС (локальная вычислительная сеть), сигнал, соответствующий узкому лучу, формируется путем фильтрации каждого сигнала микрофона при помощи специально разработанного фильтра и суммирования сигналов после фильтрации (формирование фильтрованно-суммированного луча). Однако эти методы «слепые» в отношении самого сигнала, то есть они не дают информации о направлении поступления звука. Таким образом, должна быть задана предопределенная диаграмма направления, которая независима от фактического присутствия источника звука в предопределенном направлении. В целом, определение «направления поступления» звука является задачей само по себе.
В целом, многочисленные различные пространственные характеристики направления могут быть сформированы при помощи вышеупомянутых методов. Однако формирование произвольных пространственно отобранных конфигураций чувствительности (то есть формирование узких диаграмм направления) требует большого количества микрофонов.
Альтернативный способ создания многоканальной записи состоит в том, чтобы разместить микрофон близко к каждому источнику звука (например, инструмент), чтобы записывать и восстанавливать пространственное впечатление, контролируя уровни крупноплановых сигналов микрофона в окончательной смеси. Однако такая система требует большого количества микрофонов и большого пользовательского взаимодействия при осуществлении окончательного понижающего микширования.
Недавно был предложен метод преодоления вышеупомянутой проблемы, названный направленным кодированием звука (DirAC), который может использоваться с различными системами микрофона и который позволяет записывать звук для воспроизведения с произвольными установками громкоговорителя. Цель DirAC состоит в воспроизведении пространственного впечатления существующей акустической окружающей среды настолько возможно точно, используя многоканальную систему громкоговорителя, имеющую произвольную геометрическую конфигурацию. В пределах окружающей среды звукозаписи отклики окружающей среды (которые могут быть непрерывным записанным звуком или импульсными характеристиками) измеряются при помощи ненаправленного микрофона (W) и набора микрофонов, позволяющих измерить направление поступления звука и диффузность звука. В следующих параграфах и в рамках заявки, термин «диффузность» должен пониматься как мера ненаправленности звука. Таким образом, звук, поступающий на позицию прослушивания или записи с равной интенсивностью со всех направлений, максимально рассеян. Обычный способ определения диффузности состоит в использовании величин диффузности из интервала [0, …, 1], где величина 1 описывает максимально рассеянный звук, а величина 0 описывает идеально направленный звук, то есть звук, поступающий только из одного ясно различимого направления. Один общеизвестный метод измерения направления поступления звука использует 3 микрофона «восьмерки» (XYZ), ориентированные по осям декартовой системы координат. Разработаны специальные микрофоны, так называемые «микрофоны звукового поля», которые прямо приводят ко всем желаемым откликам. Однако, как было сказано выше, W, X, Y и Z сигналы могут также быть вычислены из набора дискретных ненаправленных микрофонов.
При анализе DirAC записанный звуковой сигнал разделяется на частотные каналы, которые соответствуют частотной селективности слухового восприятия человека. Таким образом, сигнал, например, обработанный блоком фильтров или преобразованием Фурье для разделения сигнала на многочисленные частотные каналы, имеющие полосу пропускания, приспособленную к частотной селективности слуха человека. Затем сигналы диапазона частот анализируются, чтобы определить направление происхождения звука и величину диффузности для каждого частотного канала с предопределенным временным разрешением. Это временное разрешение не должно быть зафиксировано и может, конечно, быть приспособлено к окружающей среде звукозаписи. В DirAC один или более звуковых каналов записываются или передаются вместе с проанализированным направлением и данными диффузности.
При синтезировании или расшифровке звуковые каналы, в конечном итоге поступающие в громкоговорители, могут основываться на ненаправленном канале W (записанном с высоким качеством благодаря ненаправленной диаграмме направления используемого микрофона), или звук для каждого громкоговорителя может быть вычислен как взвешенная сумма W, X, Y и Z, то есть путем формирования сигнала, имеющего определенную характеристику направления для каждого громкоговорителя. Соответственно кодированию каждый звуковой канал разделяется на частотные каналы, которые далее произвольно разделяются на рассеянные и нерассеянные потоки, в зависимости от проанализированной диффузности. Если диффузность оказалась высокой, рассеянный поток может быть воспроизведен, используя метод, обеспечивающий рассеянное восприятие звука, такой как методы декорреляции, также используемые в стереофоническом кодировании вызова. Нерассеянный звук воспроизводится с использованием метода, направленного на получение точечного виртуального источника звука, расположенного в направлении, обозначенном данными направления, определенными при анализе, то есть генерацией сигнала DirAC. Таким образом, пространственное воспроизведение не привязано к одной определенной «идеальной» установке громкоговорителя, как в предшествующих прототипных методах (например, 5.1). Это особо касается случая, когда происхождение звука определено как параметры направления (то есть описано вектором) с использованием сведений о диаграмме направления на микрофонах, используемых при звукозаписи. Как уже упоминалось, происхождение звука в 3-мерном пространстве параметризуется в частотно-селективной манере. По существу, направленное впечатление может быть воспроизведено с высоким качеством на произвольных установках громкоговорителя, если известна конфигурация установки громкоговорителя. Поэтому DirAC не ограничен специальными конфигурациями громкоговорителя и обычно обеспечивает более гибкое пространственное воспроизведение звука.
Хотя было разработано большое количество методов для воспроизведения многоканальной звукозаписи и для записи соответствующих сигналов для последующего многоканального воспроизведения, ни один из предшествующих прототипных методов не позволяет влиять на уже записанный сигнал, таким образом, чтобы направление происхождения звуковых сигналов могло быть акцентировано во время воспроизведения, таким образом, чтобы, например, повысить внятность сигнала от одного индивидуального желаемого направления.
Согласно одному осуществлению данного изобретения, звуковой сигнал, имеющий, по крайней мере, один звуковой канал и связанные с ним параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи, может быть восстановлен, обеспечивая повышение восприимчивости сигнала, поступающего от определенного направления или от многочисленных определенных направлений.
Таким образом, при воспроизведении может быть выбрано желаемое направление происхождения звука относительно позиции звукозаписи. При дифференцировании восстановленной части восстановленного звукового сигнала, часть звукового канала изменяется таким образом, что интенсивность частей звукового канала, имеющего параметры направления, указывающие направление происхождения звука, расположенного близко к желаемому направлению происхождения, увеличивается относительно других частей звукового канала, имеющего параметры направления, указывающие направление происхождения, находящееся дальше от желаемого направления происхождения. Направления происхождения частей звукового канала или многоканального сигнала могут быть акцентированы, таким образом, чтобы обеспечить лучшее восприятие звуковых объектов, которые были расположены на выбранном направлении во время звукозаписи.
Согласно дальнейшему осуществлению данного изобретения, пользователь может выбрать во время восстановления, какое направление или какие направления должны быть акцентированы так, чтобы части звукового канала или части многократных звуковых каналов, связанные с выбранным направлением, были акцентированы, то есть их интенсивность или амплитуда увеличивались относительно остальных частей. Согласно осуществлению, акцент или ослабление звука, поступающего из определенного направления, могут быть сделаны с намного более отчетливым пространственным разрешением, чем в системах, не использующих параметры направления. Согласно дальнейшему осуществлению данного изобретения могут быть определены произвольные пространственные весовые функции, которые не могут быть получены при использовании обычных микрофонов. Кроме того, весовые функции могут быть временными или частотными, так что дальнейшие осуществления данного изобретения могут использоваться с высокой гибкостью. Кроме того, весовые функции очень легки для применения и модернизации, поскольку они должны только быть помещены в систему вместо заменяемых аппаратных средств (например, микрофоны).
Согласно дальнейшему осуществлению данного изобретения, звуковые сигналы, связанные с параметром диффузности (параметр диффузности, указывающий диффузность части звукового канала), восстанавливаются так, что интенсивность части звукового канала с высокой диффузностью уменьшается относительно другой части звукового канала, связанного с более низкой диффузностью.
Таким образом, при восстановлении звукового сигнала диффузность отдельных частей звукового сигнала может приниматься во внимание для дальнейшего усиления направленного восприятия восстановленного сигнала. Это может дополнительно усилить перераспределение источников звука относительно методов, использующих только части рассеянного звука для увеличения полной диффузности сигнала, вместо того, чтобы использовать информацию диффузности для лучшего перераспределения источников звука. Обратите внимание на то, что данное изобретение также позволяет обратно акцентировать части записанного звука рассеянного происхождения, например, сопровождающие сигналы.
Согласно дальнейшему осуществлению, по крайней мере, один звуковой канал микширован с повышением на множественные звуковые каналы. Множественные звуковые каналы могут соответствовать числу громкоговорителей, доступных для воспроизведения. Могут использоваться произвольные установки громкоговорителей для усиления перераспределения источников звука с гарантией того, что направление источника звука всегда воспроизводится насколько возможно хорошо на имеющемся оборудовании, независимо от числа доступных громкоговорителей.
Согласно другому осуществлению данного изобретения, воспроизведение может даже быть выполнено через монофонический громкоговоритель. Конечно, направление происхождения сигнала, в этом случае, будет физическим местоположением громкоговорителя. Однако, выбирая желаемое направление происхождения сигнала относительно позиции звукозаписи, слышимость сигнала, исходящего из выбранного направления, может быть значительно усилена, по сравнению с воспроизведением простого понижающего микширования.
Согласно дальнейшему осуществлению данного изобретения, может быть точно воспроизведено направление происхождения сигнала, когда один или более звуковых каналов смикшированы с повышением на число каналов, соответствующее громкоговорителям. Направление происхождения может быть восстановлено насколько возможно хорошо при использовании, например, метода амплитудного панорамирования. Для дальнейшего улучшения перцепционного качества могут быть введены дополнительные фазовые сдвиги, которые также зависят от выбранного направления.
Определенные осуществления данного изобретения могут дополнительно уменьшать стоимость капсул микрофона для записи звукового сигнала, серьезно не затрагивая качество звука, так как, по крайней мере, микрофон, используемый для определения оценки направления/рассеянности не обязательно должен иметь плоскую частотную характеристику.
Несколько осуществлений данного изобретения будут в дальнейшем описаны со ссылками на приложенные чертежи.
Фиг.1 показывает осуществление метода для восстановления звукового сигнала;
Фиг.2 показывает блок-схему устройства для восстановления звукового сигнала; и
Фиг.3 показывает блок-схему дальнейшего осуществления;
Фиг.4 показывает пример использования изобретенного метода или изобретенного устройства в сценарии организации телеконференций;
Фиг.5 показывает осуществление метода для усиления направленного восприятия звукового сигнала;
Фиг.6 показывает осуществление декодера для восстановления звукового сигнала; и
Фиг.7 показывает осуществление системы для усиления направленного восприятия звукового сигнала.
Фиг.1 показывает осуществление способа для восстановления звукового сигнала, имеющего, по крайней мере, один звуковой канал и связанные с ним параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи. На стадии выбора 10 желаемое направление происхождения относительно позиции звукозаписи выбирается для восстановленной части восстановленного звукового сигнала, где восстановленная часть соответствует части звукового канала. Таким образом, для части сигнала, подлежащей обработке, выбирается желаемое направление происхождения, из которого части сигнала будут ясно слышимы после восстановления. Выбор может быть сделан непосредственно вводом пользователя или автоматически, как детализировано ниже.
Часть может быть временной областью, частотной областью, или временной областью определенного частотного интервала звукового канала. На стадии модификации 12 часть звукового канала изменяется для получения восстановленной части восстановленного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, близкого к желаемому направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенного дальше от желаемого направления происхождения. Таким образом, такие части звукового канала акцентируются путем усиления их интенсивность или уровня, который может, например, быть осуществлен при умножении масштабного коэффициента на часть звукового канала. Согласно осуществлению части, происходящие из направления, расположенного близко к выбранному (желаемому) направлению, умножаются на крупномасштабные факторы, чтобы акцентировать эти части сигнала при восстановлении и, чтобы улучшить слышимость тех записанных звуковых объектов, которые интересуют слушателя. В целом, в контексте этой заявки, увеличение интенсивности сигнала или канала должно пониматься как любая мера, которая формирует лучше слышимый сигнал. Это может, например, быть увеличение амплитуды сигнала энергии, которую несет сигнал, или умножение сигнала на масштабный коэффициент, больше единицы. В качестве альтернативы, чтобы достигнуть эффекта, громкость конкурирующих сигналов может быть уменьшена.
Выбор желаемого направления может быть непосредственно осуществлен пользователем через пользовательский интерфейс на позиции прослушивания. Однако, согласно альтернативным осуществлениям, выбор может выполняться автоматически, например, при помощи анализа параметров направления, так чтобы частотные области, имеющие примерно то же самое происхождение, акцентировались, тогда как остальные части звукового канала заглушены. Таким образом, сигнал может быть автоматически сфокусирован на преобладающих источниках звука, не требуя дополнительного пользовательского ввода на конце прослушивания.
Согласно дальнейшим осуществлениям стадия выбора опущена, так как направление происхождения было установлено. Таким образом, увеличивается интенсивность части звукового канала, имеющего параметры направления, указывающие направление происхождения, находящееся близко к установленному направлению. Установленное направление может, например, быть аппаратным обеспечением, то есть направление может быть предопределено. Если, например, в сценарии организации телеконференций интерес представляет только центральный источник сообщений, это может быть осуществлено при использовании предопределенного установленного направления. Альтернативные осуществления могут считывать установленное направление с памяти, которая может также хранить многие альтернативные направления, которые будут использоваться как установленные направления. Одно из них может, например, быть считано при включении изобретенного устройства.
Согласно альтернативному осуществлению выбор желаемого направления может также быть выполнен на стороне кодирующего устройства, то есть при записи сигнала, так что дополнительные параметры передаются со звуковым сигналом, указывая желаемое направление для воспроизведения. Таким образом, пространственное восприятие восстановленного сигнала может уже быть выбрано в кодирующем устройстве без сведений о конкретной установке громкоговорителя, используемой для воспроизведения.
Так как метод восстановления звукового сигнала не зависит от конкретной установки громкоговорителя, предназначенной для воспроизведения восстановленного звукового сигнала, то его можно применять как к монофонической, так и к стерео и многоканальной конфигурации громкоговорителя. Таким образом, согласно дальнейшему осуществлению пространственное впечатление от воспроизведенного окружения в дальнейшем обрабатывается для усиления воспринимаемости сигнала.
При использовании для монофонического воспроизведения, эффект может интерпретироваться как запись сигнала с новым типом микрофона, способного формировать произвольные диаграммы направления. Однако этот эффект может быть полностью достигнут на приемном конце, то есть во время воспроизведения сигнала без каких-либо изменений в установке звукозаписи.
Фиг.2 показывает осуществление устройства (декодер) для восстановления звукового сигнала, то есть осуществление декодера 20 для восстановления звукового сигнала. Декодер 20 включает селектор направления 22 и модификатор звуковой части 24. Согласно осуществлению Фиг.2 многоканальный звуковой ввод 26, записанный несколькими микрофонами, анализируется анализатором направления 28, который получает параметры направления, указывающие направление происхождения части звуковых каналов, то есть направление происхождения проанализированной части сигнала. Согласно одному осуществлению данного изобретения выбирается направление, с которого большая часть энергии подается на микрофон. Позиция звукозаписи определяется для каждой конкретной части сигнала. Это может, например, быть также сделано при применении ранее описанных методов, использующих DirAC-микрофоны. Конечно, другой метод направленного анализа, основанный на записи звуковой информации, может использоваться для выполнения анализа. В результате анализатор направления 28 получает параметры направления 30, указывающие направление происхождения части звукового канала или многоканального сигнала 26. Кроме того, анализатор направления 28 может служить для получения параметра диффузности 32 для каждой части сигнала (например, для каждого частотного интервала или для каждого срока сигнала).
Параметр направления 30 и, по выбору, параметр диффузности 32 передается селектору направления 22, который осуществляет выбор желаемого направления происхождения относительно позиции звукозаписи для восстановленной части восстановленного звукового сигнала. Информация относительно желаемого направления передается к модификатору звуковой части 24. Модификатор звуковой части 24 получает, по крайней мере, один звуковой канал 34, имеющий часть, для которой были получены параметры направления. По крайней мере, один канал, измененный модификатором звуковой части, может, например, быть многоканальным сигналом понижающего микширования 26, генерированным при помощи обычных многоканальных алгоритмов понижающего микширования. Один чрезвычайно простой случай - прямая сумма сигналов многоканального звукового ввода 26. Однако, поскольку изобретенные осуществления не ограничены числом входных каналов, в альтернативном осуществлении, все каналы звукового ввода 26 могут быть одновременно обработаны звуковым декодером 20.
Модификатор звуковой части 24 изменяет звуковую часть для получения восстановленной части восстановленного звукового сигнала, где изменение включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, находящееся дальше от желаемого направления происхождения. В примере фиг.2 модификация выполнена путем умножения масштабного коэффициента 36 (q) на часть звукового канала, которая будет изменена. Таким образом, если анализируется часть звукового канала, происходящая из направления, расположенного близко к выбранному желаемому направлению, крупномасштабный фактор 36 умножается на звуковую часть. Таким образом, на выходе 38 модификатор звуковой части выводит восстановленную часть восстановленного звукового сигнала, соответствующую части звукового канала, существующей на входе. Как, кроме того, обозначено пунктирными линиями на выходе 38 модификатора звуковой части 24, это может быть выполнено не только для выходного моносигнала, но также и для многоканальных выходных сигналов, для которых число выходных каналов не установлено или не предопределено.
Другими словами, осуществление звукового декодера 20 вводится из такого направленного анализа как, например, используемый в DirAC. Звуковые сигналы 26 от массива микрофонов могут быть разделены на диапазоны частот согласно частотному разрешению слуховой системы человека. Направление звука и, по выбору, диффузность звука анализируются в зависимости от времени в каждом частотном канале. Эти признаки получаются далее как, например, угловой азимут направления (azi) и повышение (ele), и как коэффициент диффузности Psi, который изменяется от ноля до единицы.
Затем намеченные или выбранные характеристики направления накладываются на полученные сигналы, используя процедуру взвешивания, которая зависит от углов направления (azi и/или ele) и, по выбору, от диффузности (Psi). Очевидно, что это взвешивание может быть определено по-разному для различных частотных диапазонов, и, в целом, меняется в течение долгого времени.
Фиг.3 показывает дальнейшее осуществление данного изобретения, основанного на синтезировании DirAC. В том смысле осуществление Фиг.3 может быть интерпретировано как улучшение воспроизведения DirAC, которое позволяет контролировать уровень звука в зависимости от анализируемого направления. Это позволяет акцентировать звук, поступающий из одного или многочисленных направлений, или подавить звук от одного или множественных направлений. При использовании для многоканального воспроизведения достигается постобработка воспроизведенного звукового образа. Если только один канал используется в качестве выхода, эффект эквивалентен использованию направленного микрофона с произвольной диаграммой направления во время записи сигнала. В осуществлении на фиг.3 показано дифференцирование параметров направления, а так же дифференцирование одного переданного звукового канала. Анализ выполнен на основе В-форматных каналов микрофона W, X, Y и Z, как, например, записанных при помощи микрофонов звукового поля.
Обработка выполняется по циклам. Поэтому непрерывные звуковые сигналы разделяются на циклы, которые масштабируются функцией окна, чтобы избежать неоднородности на границах цикла. Циклы сигнала, обработанного методом окна, подвергаются преобразованию Фурье в блоке преобразования Фурье 40, деля сигналы микрофона на N частотных диапазонов. Для простоты обработка одного произвольного частотного диапазона будет описана в следующих параграфах, поскольку остальные частотные диапазоны обрабатываются аналогично. Блок преобразования Фурье 40 получает коэффициенты, описывающие силу имеющейся частотной составляющей в каждом из В-форматных каналов микрофона W, X, Y, и Z в пределах анализируемого оконного цикла. Эти параметры частоты 42 вводятся в звуковое кодирующее устройство 44 для получения звукового канала и связанных параметров направления. В осуществлении, показанном на фиг.3, переданный звуковой канал выбран в качестве ненаправленного канала 46, имеющего информацию о сигнале со всех направлений. Основанный на коэффициентах 42 для ненаправленных и направленных частей В-форматных каналов микрофона, анализ направления и диффузности выполняется блоком направленного анализа 48.
Направление происхождения звука для анализируемой части звукового канала 46 передается на звуковой декодер 50 для восстановления звукового сигнала вместе с ненаправленным каналом 46. Когда присутствуют параметры диффузности 52, тракт сигнала расщепляется на нерассеянный тракт 54a и рассеянный тракт 54b. Нерассеянный тракт 54a масштабируется согласно параметру диффузности, таким образом, что, когда диффузность Ψ высока, большая часть энергии или амплитуды останется в нерассеянном тракте. И наоборот, когда разбросанность высока, большая часть энергии будет перемещена к рассеянному тракту 54b. В рассеянном тракте 54b сигнал декоррелируется или рассеивается при помощи декорреляторов 56a или 56b. Декорреляция может быть выполнена при использовании известных традиционных методов, таких как свертывание с сигналом белого шума, где сигнал белого шума может отличаться от одного частотного канала к другому частотному каналу. Пока декорреляция является энергосохраняющей, окончательный результат может быть регенерирован путем простого добавления сигналов нерассеянного тракта сигнала 54a и рассеянного тракта сигнала 54b на выходе, так как сигналы в трактах сигнала были уже масштабированы, что обозначено параметром диффузности Ψ. Рассеянный тракт сигнала 54b может быть масштабирован в зависимости от числа громкоговорителей с использованием соответствующего правила масштабирования. Например, сигналы в рассеянном тракте могут быть масштабированы при помощи
Figure 00000001
, где N - число громкоговорителей.
Когда выполняется восстановление для многоканальной установки, прямой тракт сигнала 54a, а так же и рассеянный тракт сигнала 54b расщепляются на несколько подтрактов, соответствующих индивидуальным сигналам громкоговорителя (на позициях расщепления 58a и 58b). К этому концу расщепление на позициях расщепления 58a и 58b может интерпретироваться как эквивалентное повышающему микшированию, по крайней мере, одного звукового канала на множественные каналы для воспроизведения через систему громкоговорителей, имеющую множественные громкоговорители. Поэтому каждый из множественных каналов имеет канальную часть звукового канала 46. Направление происхождения индивидуальных звуковых частей восстанавливается блоком перенаправления 60, который дополнительно увеличивает или уменьшает интенсивность или амплитуду канальных частей, соответствующих громкоговорителям, используемым для воспроизведения. К этому концу блок перенаправления 60 обычно требует сведений об установке громкоговорителя, используемой для воспроизведения. Фактическое перераспределение (перенаправление) и дифференцирование связанных весовых коэффициентов может, например, быть осуществлено при помощи таких методов, как основанное на векторе амплитудное панорамирование. При приложении различных геометрических установок громкоговорителей к блоку перераспределения 60 могут использоваться произвольные конфигурации громкоговорителей воспроизведения для реализации изобретенной концепции без потери качества воспроизведения. После обработки выполняются множественные обратные преобразования Фурье на сигналах частотной области при помощи блоков обратных преобразований Фурье 62, чтобы получить сигнал временного интервала, который может быть воспроизведен индивидуальными громкоговорителями. До воспроизведения должны выполняться методики наложения и добавления при помощи сумматора 64, чтобы связать индивидуальные звуковые циклы для получения непрерывных сигналов временного интервала, готовых к воспроизведению громкоговорителями.
Согласно осуществлению изобретения, показанному на фиг.3, совершенствуется обработка сигнала DirAC, при этом вводится модификатор звуковой части 66, чтобы изменить часть фактически обработанного звукового канала, который позволяет увеличивать интенсивность части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению. Это достигается применением дополнительного весового коэффициента к прямому тракту сигнала. Таким образом, если обработанная частотная часть исходит из желаемого направления, сигнал акцентируется путем приложения дополнительного коэффициента усиления к той конкретной части сигнала. Приложение коэффициента усиления может быть выполнено до точки расщепления 58a, поскольку эффект одинаково обогатит все части канала.
Приложение дополнительного весового коэффициента может, в альтернативном осуществлении, также быть выполнено в блоке перераспределения 60, который, в этом случае, применяет коэффициенты усиления перераспределения, увеличенные или уменьшенные при помощи дополнительного весового коэффициента.
Используя направленное повышение при восстановлении многоканального сигнала, воспроизведение может, например, быть выполнено в стиле визуализации DirAC, как показано на фиг.3. Звуковой канал, который будет воспроизведен, разделяется на частотные диапазоны, равные тем, которые используются для направленного анализа. Эти частотные диапазоны затем разделяются на потоки: рассеянный и нерассеянный поток. Рассеянный поток воспроизводится, например, путем приложения звука к каждому громкоговорителю после свертывания с шумовыми выбросами шириной в 30 миллисекунд. Шумовые выбросы различны для каждого громкоговорителя. Нерассеянный поток прилагается к направлению, полученному от направленного анализа, который является, конечно, зависимым от времени. Чтобы получить направленное восприятие в многоканальных системах громкоговорителя, используется простое попарное или тройное амплитудное панорамирование. Кроме того, каждый частотный канал умножается на коэффициент усиления или коэффициент масштабирования, который зависит от анализируемого направления. В общих чертах, функция может быть задана так, чтобы определять желаемую диаграмму направления для воспроизведения. Это может, например, быть только одно единственное направление, которое должно быть акцентировано. Однако произвольные диаграммы направления могут легко применяться с осуществлением фиг.3.
В следующем подходе дальнейшее осуществление данного изобретения описано как перечень стадий обработки. Перечень базируется на допущении, что звук записан с В-форматным микрофоном, а затем обработан для прослушивания при помощи многоканальных или монофонических установок громкоговорителей, использующих стиль визуализации DirAC или визуализацию подаваемых параметров направления, указывающих направление происхождения частей звукового канала. Обработка включает следующие стадии:
1. Разделение сигналов микрофона на частотные диапазоны и анализ направления и, по выбору, диффузности в каждом диапазоне в зависимости от частоты. В качестве примера, направление может быть параметризировано азимутным углом и углом повышения (azi, ele).
2. Определение функции F, которая описывает желаемую диаграмму направления. Функция может иметь произвольную форму. Это обычно зависит от направления. Это может, кроме того, также зависеть от диффузности, если доступна информация о диффузности. Функция может быть различной для различных частот, и она может также изменяться в зависимости от времени. В каждом частотном диапазоне получение направленного фактора q из функции F для каждого временного элемента, который используется для последующего взвешивания (масштабирования) звукового сигнала.
3. Умножение опорных звуковых величин на величины q факторов направления, соответствующих каждой части времени и частоты для формирования выходного сигнала. Это может быть сделано в представлении временной и/или частотной области. Кроме того, эта обработка может, например, быть осуществлена как часть DirAC визуализации для любого числа желаемых выходных каналов.
Как ранее описано, результат можно прослушать, используя многоканальные или монофонические системы громкоговорителей.
Фиг.4 показывает иллюстрацию того, как изобретенные методы и устройства могут быть использованы для значительного усиления восприимчивости участника в рамках сценария организации телеконференций. На стороне звукозаписи 100 показаны четыре источника сообщений 102a-102d, которые имеют четкую ориентацию относительно позиции звукозаписи 104. Таким образом, звуковой сигнал, исходящий от источника сообщений 102c, имеет фиксированное направление происхождения относительно позиции звукозаписи 104. При условии, что звуковой сигнал, записанный на позиции звукозаписи 104, имеет ответное сообщение от источника сообщений 102c, и возникают некоторые «фоновые» шумы, например, от дискуссии источников сообщений 102a и 102b, широкополосный сигнал, записываемый и передаваемый на позицию прослушивания 110, будет включать оба компонента сигнала.
В качестве примера сделан набросок установки для прослушивания, имеющей шесть громкоговорителей 112a-112f, которые окружают слушателя, находящегося на позиции прослушивания 114. Поэтому, в принципе, звук, происходящий из почти произвольных позиций вокруг слушателя 114, может быть воспроизведен установкой, изображенной на фиг.4. Традиционные многоканальные системы воспроизвели бы звук, используя эти шесть динамиков 112a-112f, чтобы восстановить насколько возможно точно пространственное восприятие, имевшее место на позиции звукозаписи 104 во время записи. Поэтому, когда звук воспроизводится с использованием традиционных методов, ответное сообщение абонента 102c в качестве «фона» переговоров абонентов 102a и 102b будет так же ясно слышимо, уменьшая ясность сигнала абонента 102c.
Согласно осуществлению данного изобретения, селектор направления может использоваться для выбора желаемого направления происхождения относительно позиции звукозаписи, которое используется для восстановленной версии восстановленного звукового сигнала, который должен быть воспроизведен громкоговорителями 112a-112f. Поэтому слушатель 114 может выбрать желаемое направление 116, соответствующее положению абонента 102c. Таким образом, модификатор звуковой части может изменить часть звукового канала для получения восстановленной части восстановленного звукового сигнала таким образом, чтобы акцентировать интенсивность частей звукового канала, исходящего из направления, расположенного близко к выбранному направлению 116. На приемном конце слушатель может решать, какое направление происхождения будет воспроизведено. После осуществления этого выбора акцентируются только те части сигнала, которые исходят из направления абонента 102c и, таким образом, переговаривающиеся абоненты 102a и 102b будут испытывать меньше помех. Кроме акцентирования сигнала из отобранного направления, направление может быть воспроизведено амплитудным панорамированием, как условно обозначено формами волн 120a и 120b. Поскольку абоненты 102c будут расположены ближе к громкоговорителю 112d, чем к громкоговорителю 112c, амплитудное панорамирование приведет к воспроизведению акцентированного сигнала через громкоговорители 112c и 112d, тогда как остальные громкоговорители будут почти бесшумными (в конечном счете, воспроизводя рассеянные части сигнала). Амплитудное панорамирование повысит уровень громкоговорителя 112d относительно громкоговорителя 112c, поскольку абонент 102c расположен ближе к громкоговорителю 112d.
Фиг.5 иллюстрирует блок-схему осуществления метода для улучшения направленного восприятия звукового сигнала. На первой стадии анализа 150, получается, по крайней мере, один звуковой канал и связанные параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи.
На стадии выбора 152 желаемое направление происхождения относительно позиции звукозаписи выбирается для восстановленной части восстановленного звукового сигнала; восстановленная часть соответствует части звукового канала.
На стадии модификации 154 часть звукового канала изменяется для получения восстановленной части восстановленного звукового сигнала, где изменение включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, находящееся дальше от желаемого направления происхождения.
Фиг.6 иллюстрирует осуществление звукового декодера для восстановления звукового сигнала, имеющего, по крайней мере, один звуковой канал 160 и связанные параметры направления 162, указывающие направление происхождения части звукового канала относительно позиции звукозаписи.
Звуковой декодер 158 включает селектор направления 164 для выбора желаемого направления происхождения относительно позиции звукозаписи для восстановленной части восстановленного звукового сигнала: восстановленная часть соответствует части звукового канала. Декодер 158 далее включает модификатор звуковой части 166 для изменения части звукового канала для получения восстановленной части восстановленного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенного близко к желаемому направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенного дальше от желаемого направления происхождения.
Как обозначено на фиг.6, может быть получена единственная восстановленная часть 168, или могут быть одновременно получены многочисленные восстановленные части 170, когда используется декодер в многоканальной воспроизводящей установке. Осуществление системы для улучшения направленного восприятия звукового сигнала 180, как показано на фиг.7, основано на декодере 158 фиг.6. Поэтому, в дальнейшем, будут описаны только дополнительно введенные элементы. Система для улучшения направленного восприятия звукового сигнала 180 получает звуковой сигнал 182 в качестве ввода, который может быть как монофоническим сигналом, так и многоканальным сигналом, записанным множественными микрофонами. Звуковое кодирующее устройство 184 получает звуковой сигнал, имеющий, по крайней мере, один звуковой канал 160 и связанные параметры направления 162, указывающие направление происхождения части звукового канала относительно позиции звукозаписи. По крайней мере, один звуковой канал и связанные параметры направления, кроме того, обрабатываются, как уже было описано, для звукового декодера фиг.6 для получения перцепционно усиленного выходного сигнала 170.
Хотя изобретение было описано, главным образом, для многоканального звукового воспроизведения, различные сферы применения могут выиграть от использования изобретенных методов и устройств. В качестве примера, изобретенная концепция может использоваться, чтобы сфокусироваться (повышая напряжение или ослабляя) на конкретных абонентах, переговаривающихся в сценарии организации телеконференций. Это может, кроме того, использоваться, чтобы отклонить (или усилить) окружающие компоненты, а так же для усиления реверберации или дереверберации. Дальнейшие возможные сценарии применения включают подавление помех окружающих шумовых сигналов. Дальнейшим возможным использованием могло бы быть направленное улучшение сигналов слуховых аппаратов.
В зависимости от определенных требований к применению изобретенных методов, они могут быть реализованы в аппаратных средствах или в программном обеспечении. Реализация может быть выполнена с использованием цифровых носителей данных, в частности дисков, DVD или компакт-дисков, хранящих электронно-считываемые управляющие сигналы, которые взаимодействуют с программируемой компьютерной системой таким образом, что реализуются изобретенные методы. В целом, данное изобретение - это компьютерный программный продукт с управляющей программой, хранящейся на машиночитаемом носителе: управляющая программа используется для реализации изобретенных методов, когда компьютерный программный продукт запущен на компьютере. Другими словами, изобретенные методы - это компьютерная программа, имеющая управляющую программу для реализации, по крайней мере, одного из изобретенных методов, когда компьютерная программа запущена на компьютере.
В то время как все вышеупомянутое было показано и описано со ссылкой на конкретные осуществления, квалифицированные специалисты, сведущие в этой области, должны понимать - что различные другие изменения формы и деталей могут быть произведены без изменения духа и сферы действия. Следует понимать, что различные изменения могут быть произведены для приспосабливания к различным осуществлениям, не отступая от более широких представлений, раскрытых здесь и содержащихся в требованиях, которые приведены ниже.

Claims (19)

1. Способ восстановления звукового сигнала, имеющего, по крайней мере, один звуковой канал и связанные параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи, характеризующийся тем, что включает
выбор установленного направления происхождения относительно позиции звукозаписи;
и изменение части звукового канала для получения восстановленной части восстановленного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к установленному направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от установленного направления происхождения.
2. Способ по п.1, характеризующийся тем, что выбор включает считывание установленного направления с памяти.
3. Способ по п.1, характеризующийся тем, что модификация включает изменение представления частотной области части звукового канала.
4. Способ по п.1, характеризующийся тем, что модификация включает изменение представления временного интервала части звукового канала.
5. Способ по п.1, характеризующийся тем, что модификация включает получение коэффициента масштабирования для каждой части звукового канала таким образом, что масштабируемая часть звукового канала, полученная путем умножения части звукового канала на коэффициент масштабирования, имеющего связанные параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению происхождения, имеют усиленную интенсивность относительно другой масштабируемой части звукового канала, имеющего связанные параметры направления, указывающие направление происхождения, расположенное дальше от желаемого направления происхождения.
6. Способ по п.1, характеризующийся тем, что включает получение частотного представления, по крайней мере, одного звукового канала.
7. Способ по п.1, характеризующийся тем, что дифференцирование включает получение представления конечной ширины первого и второго частотных интервалов, по крайней мере, одного звукового канала, где ширина первого частотного интервала отличается от ширины второго частотного интервала.
8. Способ по п.1, характеризующийся тем, что выбор желаемого направления происхождения включает приемные входные параметры, указывающие желаемое направление в качестве пользовательского ввода.
9. Способ по п.1, характеризующийся тем, что выбор желаемого направления включает приемные параметры направления, связанные со звуковым сигналом, параметры направления указывают желаемое направление.
10. Способ по п.1, характеризующийся тем, что выбор желаемого направления включает определение направления происхождения конечной ширины частотного интервала, по крайней мере, одного звукового канала.
11. Способ по п.1, характеризующийся тем, что включает
получение параметра диффузности, связанного со звуковым каналом,
параметр диффузности указывает диффузность части звукового канала, и
где изменение части звукового канала включает уменьшение интенсивности части звукового канала, имеющего параметр диффузности, указывающий на высокую диффузность относительно другой части звукового канала, имеющего параметр диффузности, указывающий на более низкую диффузность.
12. Способ по п.1, характеризующийся тем, что включает повышающее микширование, по крайней мере, одного звукового канала на множественные каналы для воспроизведения через систему громкоговорителей, имеющую множественные громкоговорители, где каждый из многочисленных каналов имеет часть канала, соответствующую части, по крайней мере, одного звукового канала.
13. Способ по п.12, характеризующийся тем, что модификация включает усиление интенсивности каждой из частей канала повышающего микширования от части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к желаемому направлению происхождения относительно других частей канала множественных каналов повышающего микшировання от другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от желаемого направления происхождения.
14. Способ по п.13, характеризующийся тем, что включает панорамирование амплитуды частей канала таким образом, что воспринятое направление происхождения восстановленных частей канала соответствует направлению происхождения при воспроизведении с использованием заданной установки громкоговорителей.
15. Способ улучшения направленного восприятия звукового сигнала, характеризующийся тем, что включает
получение, по крайней мере, одного звукового канала и связанных параметров направления, указывающих направление происхождения части звукового канала относительно позиции звукозаписи;
выбор установленного направления происхождения относительно позиции звукозаписи; и
изменение части звукового канала для получения части улучшенного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к установленному направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от установленного направления происхождения.
16. Звуковой декодер для восстановления звукового сигнала, имеющего, по крайней мере, один звуковой канал и связанные параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи, характеризующийся тем, что включает
селектор направления, адаптированный для выбора установленного направления происхождения относительно позиции звукозаписи; и
модификатор звуковой части для изменения части звукового канала для получения восстановленной части восстановленного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к установленному направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от установленного направления происхождения.
17. Звуковое кодирующее устройство для улучшения направленного восприятия звукового сигнала, характеризующееся тем, что включает
генератор сигнала для получения, по крайней мере, одного звукового канала и связанных параметров направления, указывающих направление происхождения части звукового канала относительно позиции звукозаписи;
селектор направления, адаптированный для выбора установленного направления происхождения относительно позиции звукозаписи; и
модификатор сигнала для изменения части звукового канала для получения части улучшенного звукового сигнала, где модификация включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к установленному направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от установленного направления происхождения.
18. Система улучшения восстановленного звукового сигнала, характеризующаяся тем, что включает
звуковое кодирующее устройство для получения звукового сигнала, имеющее, по крайней мере, один звуковой канал и связанные параметры направления, указывающие направление происхождения части звукового канала относительно позиции звукозаписи;
селектор направления, адаптированный для выбора установленного направления происхождения относительно позиции звукозаписи; и
звуковой декодер, имеющий модификатор звуковой части для изменения части звукового канала для получения восстановленной части восстановленного звукового сигнала, где изменение включает усиление интенсивности части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное близко к установленному направлению происхождения относительно другой части звукового канала, имеющего параметры направления, указывающие направление происхождения, расположенное дальше от установленного направления происхождения.
19. Машиночитаемый носитель записи, содержащий сохраненный на нем программный код для выполнения способа по п.1 при запуске на компьютере.
RU2009134471/09A 2007-03-21 2008-02-01 Способ и устройство для улучшения воспроизведения звука RU2416172C1 (ru)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US89618407P 2007-03-21 2007-03-21
US60/896,184 2007-03-21
US11/742,488 2007-04-30
US11/742,488 US20080232601A1 (en) 2007-03-21 2007-04-30 Method and apparatus for enhancement of audio reconstruction

Publications (1)

Publication Number Publication Date
RU2416172C1 true RU2416172C1 (ru) 2011-04-10

Family

ID=39322757

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2009134471/09A RU2416172C1 (ru) 2007-03-21 2008-02-01 Способ и устройство для улучшения воспроизведения звука

Country Status (12)

Country Link
US (1) US20080232601A1 (ru)
EP (1) EP2130403B1 (ru)
JP (1) JP5455657B2 (ru)
KR (1) KR101096072B1 (ru)
CN (1) CN101658052B (ru)
AT (1) ATE476835T1 (ru)
BR (1) BRPI0808225B1 (ru)
DE (1) DE602008002066D1 (ru)
HK (1) HK1138977A1 (ru)
RU (1) RU2416172C1 (ru)
TW (1) TWI456569B (ru)
WO (1) WO2008113427A1 (ru)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2558642C2 (ru) * 2013-12-18 2015-08-10 Владимир Георгиевич Потёмкин Способ формирования сигнала для управления электроакустическим излучателем
RU2635286C2 (ru) * 2013-03-19 2017-11-09 Конинклейке Филипс Н.В. Способ и устройство для определения позиции микрофона
US9936323B2 (en) 2014-05-05 2018-04-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
RU2655994C2 (ru) * 2013-04-26 2018-05-30 Сони Корпорейшн Устройство обработки звука и система обработки звука
RU2668113C2 (ru) * 2013-05-31 2018-09-26 Сони Корпорейшн Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8908873B2 (en) * 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) * 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
EP2154677B1 (en) * 2008-08-13 2013-07-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. An apparatus for determining a converted spatial audio signal
EP2446642B1 (en) * 2009-06-23 2017-04-12 Nokia Technologies Oy Method and apparatus for processing audio signals
EP2537350A4 (en) 2010-02-17 2016-07-13 Nokia Technologies Oy PROCESSING AN AUDIO RECORDING OF MULTIPLE DEVICES
KR102622947B1 (ko) 2010-03-26 2024-01-10 돌비 인터네셔널 에이비 오디오 재생을 위한 오디오 사운드필드 표현을 디코딩하는 방법 및 장치
EP2375410B1 (en) * 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
CN101867853B (zh) * 2010-06-08 2014-11-05 中兴通讯股份有限公司 基于传声器阵列的语音信号处理方法及装置
EP2591614B1 (en) * 2010-07-06 2014-05-14 Bang & Olufsen A/S A method and an apparatus for a user to select one of a multiple of audio tracks
US9271081B2 (en) * 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
US9055371B2 (en) 2010-11-19 2015-06-09 Nokia Technologies Oy Controllable playback system offering hierarchical playback options
US9313599B2 (en) 2010-11-19 2016-04-12 Nokia Technologies Oy Apparatus and method for multi-channel signal playback
US9456289B2 (en) 2010-11-19 2016-09-27 Nokia Technologies Oy Converting multi-microphone captured signals to shifted signals useful for binaural signal processing and use thereof
EP2600343A1 (en) * 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
CN104054126B (zh) * 2012-01-19 2017-03-29 皇家飞利浦有限公司 空间音频渲染和编码
EP2645749B1 (en) * 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
US9578438B2 (en) * 2012-03-30 2017-02-21 Barco Nv Apparatus and method for driving loudspeakers of a sound system in a vehicle
WO2013150341A1 (en) 2012-04-05 2013-10-10 Nokia Corporation Flexible spatial audio capture apparatus
US9161149B2 (en) 2012-05-24 2015-10-13 Qualcomm Incorporated Three-dimensional sound compression and over-the-air transmission during a call
US9445174B2 (en) 2012-06-14 2016-09-13 Nokia Technologies Oy Audio capture apparatus
US9268522B2 (en) 2012-06-27 2016-02-23 Volkswagen Ag Devices and methods for conveying audio information in vehicles
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
BR122021021506B1 (pt) 2012-09-12 2023-01-31 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d
WO2014053875A1 (en) 2012-10-01 2014-04-10 Nokia Corporation An apparatus and method for reproducing recorded audio with correct spatial directionality
US9396732B2 (en) * 2012-10-18 2016-07-19 Google Inc. Hierarchical deccorelation of multichannel audio
EP2733965A1 (en) * 2012-11-15 2014-05-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a plurality of parametric audio streams and apparatus and method for generating a plurality of loudspeaker signals
CN103124386A (zh) * 2012-12-26 2013-05-29 山东共达电声股份有限公司 一种远讲用降噪、消回波、锐指向传声器
US9357306B2 (en) 2013-03-12 2016-05-31 Nokia Technologies Oy Multichannel audio calibration method and apparatus
EP2982139A4 (en) 2013-04-04 2016-11-23 Nokia Technologies Oy AUDIOVISUAL PROCESSING APPARATUS
CN116741186A (zh) 2013-04-05 2023-09-12 杜比国际公司 立体声音频编码器和解码器
WO2014184618A1 (en) 2013-05-17 2014-11-20 Nokia Corporation Spatial object oriented audio apparatus
CN104575515A (zh) * 2013-10-23 2015-04-29 中兴通讯股份有限公司 一种提高语音质量的方法及装置
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
CN106471822B (zh) * 2014-06-27 2019-10-25 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的设备
CN105992120B (zh) * 2015-02-09 2019-12-31 杜比实验室特许公司 音频信号的上混音
US10176813B2 (en) 2015-04-17 2019-01-08 Dolby Laboratories Licensing Corporation Audio encoding and rendering with discontinuity compensation
EP3378241B1 (en) * 2015-11-20 2020-05-13 Dolby International AB Improved rendering of immersive audio content
US20170264942A1 (en) * 2016-03-11 2017-09-14 Mediatek Inc. Method and Apparatus for Aligning Multiple Audio and Video Tracks for 360-Degree Reconstruction
JP6634976B2 (ja) * 2016-06-30 2020-01-22 株式会社リコー 情報処理装置、及びプログラム
EP3520437A1 (en) 2016-09-29 2019-08-07 Dolby Laboratories Licensing Corporation Method, systems and apparatus for determining audio representation(s) of one or more audio sources
US10257633B1 (en) 2017-09-15 2019-04-09 Htc Corporation Sound-reproducing method and sound-reproducing apparatus
US10382878B2 (en) * 2017-10-18 2019-08-13 Htc Corporation Sound reproducing method, apparatus and non-transitory computer readable storage medium thereof
TWI703557B (zh) * 2017-10-18 2020-09-01 宏達國際電子股份有限公司 聲音播放裝置、方法及非暫態儲存媒體
ES2930374T3 (es) 2017-11-17 2022-12-09 Fraunhofer Ges Forschung Aparato y método para codificar o decodificar parámetros de codificación de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia
GB2572420A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2572419A (en) * 2018-03-29 2019-10-02 Nokia Technologies Oy Spatial sound rendering
GB2573537A (en) * 2018-05-09 2019-11-13 Nokia Technologies Oy An apparatus, method and computer program for audio signal processing
US11032644B2 (en) 2019-10-10 2021-06-08 Boomcloud 360, Inc. Subband spatial and crosstalk processing using spectrally orthogonal audio components
WO2022020365A1 (en) * 2020-07-20 2022-01-27 Orbital Audio Laboratories, Inc. Multi-stage processing of audio signals to facilitate rendering of 3d audio via a plurality of playback devices

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5208860A (en) * 1988-09-02 1993-05-04 Qsound Ltd. Sound imaging method and apparatus
ATE138238T1 (de) * 1991-01-08 1996-06-15 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
JPH07222299A (ja) * 1994-01-31 1995-08-18 Matsushita Electric Ind Co Ltd 音像移動処理編集装置
US5850453A (en) * 1995-07-28 1998-12-15 Srs Labs, Inc. Acoustic correction apparatus
FR2738099B1 (fr) * 1995-08-25 1997-10-24 France Telecom Procede de simulation de la qualite acoustique d'une salle et processeur audio-numerique associe
US5870484A (en) * 1995-09-05 1999-02-09 Greenberger; Hal Loudspeaker array with signal dependent radiation pattern
US6697491B1 (en) * 1996-07-19 2004-02-24 Harman International Industries, Incorporated 5-2-5 matrix encoder and decoder system
JP3594281B2 (ja) * 1997-04-30 2004-11-24 株式会社河合楽器製作所 ステレオ拡大装置及び音場拡大装置
WO1998058523A1 (en) * 1997-06-17 1998-12-23 British Telecommunications Public Limited Company Reproduction of spatialised audio
FI116990B (fi) * 1997-10-20 2006-04-28 Nokia Oyj Menetelmä ja järjestelmä akustisen virtuaaliympäristön käsittelemiseksi
DE60010457T2 (de) * 2000-09-02 2006-03-02 Nokia Corp. Vorrichtung und Verfahren zur Verarbeitung eines Signales emittiert von einer Zielsignalquelle in einer geräuschvollen Umgebung
CN100539737C (zh) * 2001-03-27 2009-09-09 1...有限公司 产生声场的方法和装置
SE0202159D0 (sv) * 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3810004B2 (ja) * 2002-03-15 2006-08-16 日本電信電話株式会社 ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
SE0400997D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Efficient coding of multi-channel audio
WO2006003813A1 (ja) * 2004-07-02 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ符号化及び復号化装置
US7720232B2 (en) * 2004-10-15 2010-05-18 Lifesize Communications, Inc. Speakerphone
US8873768B2 (en) * 2004-12-23 2014-10-28 Motorola Mobility Llc Method and apparatus for audio signal enhancement
JP4804014B2 (ja) * 2005-02-23 2011-10-26 沖電気工業株式会社 音声会議装置
US8023659B2 (en) * 2005-06-21 2011-09-20 Japan Science And Technology Agency Mixing system, method and program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2635286C2 (ru) * 2013-03-19 2017-11-09 Конинклейке Филипс Н.В. Способ и устройство для определения позиции микрофона
RU2655994C2 (ru) * 2013-04-26 2018-05-30 Сони Корпорейшн Устройство обработки звука и система обработки звука
RU2668113C2 (ru) * 2013-05-31 2018-09-26 Сони Корпорейшн Способ и устройство вывода аудиосигнала, способ и устройство кодирования, способ и устройство декодирования и программа
RU2558642C2 (ru) * 2013-12-18 2015-08-10 Владимир Георгиевич Потёмкин Способ формирования сигнала для управления электроакустическим излучателем
US9936323B2 (en) 2014-05-05 2018-04-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, apparatus and method for consistent acoustic scene reproduction based on informed spatial filtering
US10015613B2 (en) 2014-05-05 2018-07-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. System, apparatus and method for consistent acoustic scene reproduction based on adaptive functions
RU2663343C2 (ru) * 2014-05-05 2018-08-03 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Система, устройство и способ для совместимого воспроизведения акустической сцены на основе адаптивных функций
RU2665280C2 (ru) * 2014-05-05 2018-08-28 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Система, устройство и способ для согласованного воспроизведения акустической сцены на основании информированной пространственной фильтрации

Also Published As

Publication number Publication date
HK1138977A1 (en) 2010-09-03
BRPI0808225A2 (pt) 2014-07-08
JP2010521909A (ja) 2010-06-24
KR20090121348A (ko) 2009-11-25
CN101658052B (zh) 2013-01-30
KR101096072B1 (ko) 2011-12-20
JP5455657B2 (ja) 2014-03-26
ATE476835T1 (de) 2010-08-15
EP2130403B1 (en) 2010-08-04
TWI456569B (zh) 2014-10-11
WO2008113427A1 (en) 2008-09-25
DE602008002066D1 (de) 2010-09-16
CN101658052A (zh) 2010-02-24
BRPI0808225B1 (pt) 2019-12-24
US20080232601A1 (en) 2008-09-25
EP2130403A1 (en) 2009-12-09
TW200841326A (en) 2008-10-16

Similar Documents

Publication Publication Date Title
RU2416172C1 (ru) Способ и устройство для улучшения воспроизведения звука
US9015051B2 (en) Reconstruction of audio channels with direction parameters indicating direction of origin
US9361898B2 (en) Three-dimensional sound compression and over-the-air-transmission during a call
KR101341523B1 (ko) 스테레오 신호들로부터 멀티 채널 오디오 신호들을생성하는 방법
RU2449385C2 (ru) Способ и устройство для осуществления преобразования между многоканальными звуковыми форматами
US8509454B2 (en) Focusing on a portion of an audio scene for an audio signal
AU2011340891B2 (en) Apparatus and method for decomposing an input signal using a downmixer
US20120128160A1 (en) Three-dimensional sound capturing and reproducing with multi-microphones
Pulkki et al. First‐Order Directional Audio Coding (DirAC)
Alexandridis et al. Capturing and reproducing spatial audio based on a circular microphone array
ES2755675T3 (es) Aparato y método para escalado de señales centrales y mejora estereofónica basada en una relación señal a mezcla a dos canales
Wiggins An investigation into the real-time manipulation and control of three-dimensional sound fields
Ziemer Source width in music production. methods in stereo, ambisonics, and wave field synthesis
Ahrens Auralization of omnidirectional room impulse responses based on the spatial decomposition method and synthetic spatial data
Weller et al. Application of a circular 2D hard-sphere microphone array for higher-order Ambisonics auralization
Deppisch et al. Browser Application for Virtual Audio Walkthrough.
Rosen et al. Automatic speaker directivity control for soundfield reconstruction
Fernandez et al. Investigating sound-field reproduction methods as perceived by bilateral hearing aid users and normal-hearing listeners
Pulkki et al. Spatial impulse response rendering: A tool for reproducing room acoustics for multi-channel listening
Alexandridis et al. Research Article Capturing and Reproducing Spatial Audio Based on a Circular Microphone Array