RU2822170C1 - Bank of audiofilters with decorrelation components - Google Patents

Bank of audiofilters with decorrelation components Download PDF

Info

Publication number
RU2822170C1
RU2822170C1 RU2022108800A RU2022108800A RU2822170C1 RU 2822170 C1 RU2822170 C1 RU 2822170C1 RU 2022108800 A RU2022108800 A RU 2022108800A RU 2022108800 A RU2022108800 A RU 2022108800A RU 2822170 C1 RU2822170 C1 RU 2822170C1
Authority
RU
Russia
Prior art keywords
frequency domain
gain vector
group
frequency
decorrelation
Prior art date
Application number
RU2022108800A
Other languages
Russian (ru)
Inventor
Дэвид С. МАКГРАТ
Original Assignee
Долби Лабораторис Лайсэнзин Корпорейшн
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Долби Лабораторис Лайсэнзин Корпорейшн filed Critical Долби Лабораторис Лайсэнзин Корпорейшн
Application granted granted Critical
Publication of RU2822170C1 publication Critical patent/RU2822170C1/en

Links

Abstract

FIELD: physics.
SUBSTANCE: present invention relates generally to audio signal processing. Method for multiple input and multiple output of audio signals is realized as a linear system for use in an audio filter bank for converting a group of input audio signals in the frequency domain into a group of output audio signals in the frequency domain. Transfer function from one input signal to one output signal is defined as frequency-dependent amplification function. In some embodiments, the transfer function comprises a forward component, which is substantially defined as a frequency-dependent gain, and one or more decorrelation components, which have a frequency-varying group phase characteristic. Transfer function is formed from a set of subband functions, wherein each subband function is formed from a set of transfer functions of corresponding components, which include a direct component and one or more decorrelation components.
EFFECT: disclosed embodiments embed decorrelation processing into the audio filter bank, thereby providing a mapping of input audio signals to output audio signals using one linear mixer, as a result of which less delay is provided than in conventional banks of audiofilters, which perform decorrelation processing using several linear mixers.
14 cl, 8 dwg

Description

Перекрестная ссылка на родственные заявкиCross reference to related applications

[0001] Данная заявка заявляет приоритет предварительной заявки на патент США №62/895096, поданной 3 сентября 2019 г., которая включена в настоящий документ посредством ссылки.[0001] This application claims priority to U.S. Provisional Patent Application No. 62/895,096, filed September 3, 2019, which is incorporated herein by reference.

Область техникиTechnical field

[0002] Настоящее изобретение относится в общем к обработке звуковых сигналов, и, в частности, к обработке звуковых сигналов, при которой группа из одного или более входных звуковых сигналов в частотной области обрабатывается для создания новой группы из одного или более выходных звуковых сигналов в частотной области.[0002] The present invention relates generally to audio signal processing, and in particular to audio signal processing in which a group of one or more input frequency domain audio signals is processed to create a new group of one or more output frequency domain audio signals. areas.

Предпосылки изобретенияBACKGROUND OF THE INVENTION

[0003] В обработке звуковых сигналов общепринятой практикой является преобразование группы входных звуковых сигналов в новую группу выходных звуковых сигналов, при этом количество выходных звуковых сигналов может быть таким же, что и количество входных звуковых сигналов или может превышать его. Например, система объемного звучания может преобразовывать два входных звуковых сигнала (например стереофонические звуковые сигналы) в пять выходных звуковых сигналов посредством использования линейной матричной операции. В линейной матричной операции к входным звуковым сигналам применяется матрица, содержащая коэффициенты, которые могут варьировать в зависимости от времени или частоты. Посредством линейной матричной операции также можно определять ковариацию выходных звуковых сигналов, когда входные звуковые сигналы подвергаются декорреляционной обработке.[0003] In audio signal processing, it is common practice to convert a group of input audio signals into a new group of output audio signals, where the number of output audio signals may be the same as or greater than the number of input audio signals. For example, a surround sound system may convert two input audio signals (eg, stereo audio signals) into five output audio signals using linear matrix operation. Linear matrix operation applies a matrix containing coefficients that can vary with time or frequency to the input audio signals. Through linear matrix operation, it is also possible to determine the covariance of output audio signals when the input audio signals are subjected to decorrelation processing.

Сущность изобретенияThe essence of the invention

[0004] Способ множественного ввода и множественного вывода звуковых сигналов реализуется в качестве линейной системы для использования в банке аудиофильтров для преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области. Передаточная функция от одного входного сигнала к одному выходному сигналу определяется как частотно-зависимая функция усиления. В некоторых вариантах реализации передаточная функция содержит прямой компонент, который по существу определен как частотно-зависимое усиление, и один или более компонентов декорреляции, которые имеют групповую фазовую характеристику, варьирующую в зависимости от частоты. Передаточная функция образуется из набора функций поддиапазона, при этом каждая функция поддиапазона образована из набора передаточных функций соответствующих компонентов, включающих прямой компонент и один или более компонентов декорреляции.[0004] The multiple input/multiple output audio signal method is implemented as a linear system for use in an audio filter bank for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals. The transfer function from one input signal to one output signal is defined as a frequency-dependent gain function. In some embodiments, the transfer function includes a direct component, which is essentially defined as a frequency-dependent gain, and one or more decorrelation components, which have a group phase response that varies with frequency. The transfer function is formed from a set of subband functions, wherein each subband function is formed from a set of transfer functions of corresponding components including a direct component and one or more decorrelation components.

[0005] В некоторых вариантах реализации способ преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области включает: вычисление с использованием одного или более процессоров каждого выходного звукового сигнала в частотной области как суммы отфильтрованных входных звуковых сигналов в частотной области, при этом каждый фильтр, используемый для фильтрации входных звуковых сигналов в частотной области, характеризуется комплексной функцией усиления в диапазоне соответствующей частоты поддиапазона входного звукового сигнала в частотной области, при этом вклады входных звуковых сигналов в частотной области в выходные звуковые сигналы в частотной области определяют посредством составного вектора усиления частотной области, и при этом составной вектор усиления частотной области получают посредством: вычисления с использованием одного или более процессоров группы компонентов вектора усиления частотной области, при этом по меньшей мере один из компонентов вектора усиления частотной области представляет собой компонент декорреляции вектора усиления частотной области, образованный посредством дополнения компонента вектора усиления частотной области дополнительными компонентами вектора усиления частотной области с модифицированными частотными характеристиками, для создания эффекта декорреляции; и суммирование с использованием одного или более процессоров компонентов вектора усиления частотной области для получения составного вектора усиления частотной области.[0005] In some embodiments, a method for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals includes: calculating, using one or more processors, each output frequency domain audio signal as a sum of the filtered input frequency domain audio signals, wherein each filter used to filter input frequency domain audio signals is characterized by a complex gain function over a corresponding frequency range of a subband of the input frequency domain audio signal, wherein the contributions of the input frequency domain audio signals to the output frequency domain audio signals are determined by a composite a frequency domain gain vector, wherein the composite frequency domain gain vector is obtained by: calculating, using one or more processors, a group of frequency domain gain vector components, wherein at least one of the frequency domain gain vector components is a decorrelation component of the frequency domain gain vector , formed by augmenting a frequency domain gain vector component with additional frequency domain gain vector components with modified frequency characteristics to create a decorrelation effect; and summing, using one or more processors, the frequency domain gain vector components to obtain a composite frequency domain gain vector.

[0006] В некоторых вариантах реализации компонент декорреляции вектора усиления частотной области получают посредством масштабирования по меньшей мере одного из компонентов вектора частотной области посредством значения коэффициента усиления компонента.[0006] In some embodiments, the decorrelation components of the frequency domain gain vector are obtained by scaling at least one of the components of the frequency domain vector by the component gain value.

[0007] В некоторых вариантах реализации один или более компонентов вектора усиления частотной области содержат фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая является по существу постоянной в частоте поддиапазона, и при этом групповая задержка является по существу постоянной, если колебание в групповой задержке является достаточно небольшим, чтобы быть незначительными с точки зрения чувственного восприятия слушателя.[0007] In some embodiments, one or more frequency domain gain vector components comprise a phase response that varies across a subband frequency range, thereby providing a group delay that is substantially constant across the subband frequency, and wherein the group delay is substantially constant , if the variation in group delay is small enough to be negligible from the listener's sensory point of view.

[0008] В некоторых вариантах реализации один или более компонентов вектора усиления частотной области содержат фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая варьирует в диапазоне частоты поддиапазона для обеспечения эффекта декорреляции.[0008] In some embodiments, one or more frequency domain gain vector components comprise a phase response that varies across a subband frequency range, thereby providing a group delay that varies across a subband frequency range to provide a decorrelation effect.

[0009] В некоторых вариантах реализации компонент декорреляции вектора усиления частотной области получен посредством умножения компонента вектора усиления частотной области на функцию декорреляции.[0009] In some embodiments, the decorrelation component of the frequency domain gain vector is obtained by multiplying the frequency domain gain vector component by the decorrelation function.

[0010] В некоторых вариантах реализации банк аудиофильтров с компонентами декорреляции содержит: преобразователь, выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области; и линейный микшер, выполненный с возможностью преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области, при этом каждый выходной звуковой сигнал в частотной области представляет собой сумму отфильтрованных входных звуковых сигналов в частотной области, причем каждый фильтр, используемый для фильтрации входных звуковых сигналов в частотной области, характеризуется комплексной функцией усиления в диапазоне соответствующей частоты поддиапазона входного звукового сигнала в частотной области, и при этом вклады входных звуковых сигналов в частотной области в выходные звуковые сигналы в частотной области определяют посредством составного вектора усиления частотной области.[0010] In some embodiments, an audio filter bank with decorrelation components comprises: a converter configured to convert a group of time domain audio input signals to a group of frequency domain audio input signals; and a linear mixer configured to convert a group of input frequency domain audio signals into a group of output frequency domain audio signals, wherein each output frequency domain audio signal is a sum of the filtered input frequency domain audio signals, each filter used to filtering input frequency domain audio signals is characterized by a complex gain function in the range of a corresponding frequency of a subband of the input frequency domain audio signal, and wherein contributions of the input frequency domain audio signals to the output frequency domain audio signals are determined by a composite frequency domain gain vector.

[0011] В некоторых вариантах реализации составной вектор усиления частотной области получают посредством: вычисления группы компонентов вектора усиления частотной области, причем по меньшей мере один из компонентов вектора усиления частотной области представляет собой компонент декорреляции вектора усиления частотной области, полученный посредством дополнения компонента вектора усиления частотной области дополнительными компонентами вектора усиления частотной области с модифицированными частотными характеристиками для создания эффекта корреляции для выходного звукового сигнала частотной области; и суммирование компонентов вектора усиления частотной области для получения составного вектора усиления частотной области.[0011] In some embodiments, a composite frequency domain gain vector is obtained by: calculating a group of frequency domain gain vector components, wherein at least one of the frequency domain gain vector components is a decorrelation component of the frequency domain gain vector obtained by complementing the frequency domain gain vector component domain with additional frequency domain gain vector components with modified frequency characteristics to create a correlation effect for the output frequency domain audio signal; and summing the components of the frequency domain gain vector to obtain a composite frequency domain gain vector.

[0012] В некоторых вариантах реализации компонент декорреляции вектора усиления частотной области получен посредством масштабирования по меньшей мере одного из компонентов вектора частотной области посредством значения коэффициента усиления компонента.[0012] In some embodiments, the decorrelation component of the frequency domain gain vector is obtained by scaling at least one of the components of the frequency domain vector by the component gain value.

[0013] В некоторых вариантах реализации один или более компонентов вектора усиления частотной области содержат фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая является приблизительно постоянной в частоте поддиапазона, и при этом групповая задержка является приблизительно постоянной, если колебание в групповой задержке является достаточно небольшим, чтобы быть незначительными с точки зрения чувственного восприятия слушателя.[0013] In some embodiments, one or more frequency domain gain vector components comprise a phase response that varies across a subband frequency range, thereby providing a group delay that is approximately constant across the subband frequency, and wherein the group delay is approximately constant if the variation in group delay is small enough to be negligible from the listener's sensory perspective.

[0014] В некоторых вариантах реализации один или более компонентов вектора усиления частотной области содержат фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая варьирует в диапазоне частоты поддиапазона для обеспечения эффекта декорреляции для выходного звукового сигнала в частотной области.[0014] In some embodiments, one or more frequency domain gain vector components comprise a phase response that varies across a subband frequency range, thereby providing a group delay that varies across a subband frequency range to provide a decorrelation effect for the output audio signal in the frequency domain.

[0015] В некоторых вариантах реализации компонент декорреляции вектора усиления частотной области получен посредством умножения компонента вектора усиления частотной области на функцию декорреляции.[0015] In some embodiments, the decorrelation component of the frequency domain gain vector is obtained by multiplying the frequency domain gain vector component by the decorrelation function.

[0016] В некоторых вариантах реализации звуковая система на основании банка фильтров содержит: преобразователь, выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области; и линейный микшер, выполненный с возможностью преобразования группы входных сигналов в частотной области в группу выходных сигналов в частотной области, причем линейный микшер включает весовые коэффициенты, которые обеспечивают частотно-зависимую функцию усиления, которая содержит прямой компонент, который определен как частотно-зависимое усиление, и один или более компонентов декорреляции, которые имеют групповую фазовую характеристику, варьирующую в зависимости от частоты, при этом частотно-зависимое усиление образуется из набора функций поддиапазона, причем каждая функция поддиапазона образована из набора передаточных функций соответствующих компонентов, включающих прямой компонент и один или более компонентов декорреляции.[0016] In some embodiments, a filter bank-based audio system comprises: a converter configured to convert a group of time domain audio input signals to a group of frequency domain audio input signals; and a linear mixer configured to convert a group of frequency domain input signals into a group of frequency domain output signals, the linear mixer including weighting coefficients that provide a frequency dependent gain function that includes a forward component that is defined as a frequency dependent gain, and one or more decorrelation components that have a group phase response varying with frequency, wherein the frequency-dependent gain is formed from a set of subband functions, wherein each subband function is formed from a set of transfer functions of corresponding components including a direct component and one or more decorrelation components.

[0017] Другие варианты реализации, раскрытые в данном документе, направлены на систему, устройство и машиночитаемый носитель. Подробности раскрытых вариантов реализаций изложены в сопроводительных графических материалах и приведенном ниже описании. Другие признаки, цели и преимущества очевидны из описания, графических материалов и формулы изобретения.[0017] Other embodiments disclosed herein are directed to a system, device, and computer-readable medium. Details of the disclosed embodiments are set forth in the accompanying drawings and description below. Other features, objects and advantages are apparent from the description, drawings and claims.

[0018] Раскрытые в данном документе конкретные варианты осуществления обеспечивают одно или более из следующих преимуществ. Раскрытые варианты реализации внедряют декорреляционную обработку в банк аудиофильтров, тем самым обеспечивая отображение входных звуковых сигналов в выходные звуковые сигналы с использованием одного линейного микшера, в результате чего обеспечивают меньшую задержку, чем в обычных банках аудиофильтров, которые выполняют декорреляционную обработку с использованием нескольких линейных микшеров.[0018] Specific embodiments disclosed herein provide one or more of the following advantages. Disclosed embodiments implement decorrelation processing into an audio filter bank, thereby allowing input audio signals to be mapped to output audio signals using a single line mixer, resulting in lower latency than conventional audio filter banks that perform decorrelation processing using multiple line mixers.

Описание графических материаловDescription of graphic materials

[0019] На графических материалах конкретные расположения или порядки схематических элементов, например тех, что представляют устройства, блоки, блоки команд и элементы данных, показаны для облегчения описания. Однако специалистам в данной области техники следует понимать, что конкретный порядок или расположение схематических элементов в графических материалах не предполагает, что требуется конкретный порядок или последовательность обработки или разделение процессов. Кроме того, включение схематического элемента в графический материал не предполагает, что такой элемент необходим во всех вариантах осуществления или что признаки, представленные таким элементом, нельзя включать в другие элементы или сочетать с ними в некоторых вариантах реализации.[0019] In the drawings, specific arrangements or orders of schematic elements, such as those representing devices, blocks, instruction blocks, and data elements, are shown to facilitate description. However, those skilled in the art will understand that a particular order or arrangement of schematic elements in the graphical materials does not imply that a particular order or sequence of processing or division of processes is required. In addition, the inclusion of a schematic element in the graphic material does not imply that such element is necessary in all embodiments or that the features represented by such element cannot be included in or combined with other elements in some embodiments.

[0020] Кроме того, в графических материалах, где соединительные элементы, такие как сплошные или пунктирные линии или стрелки, используют для иллюстрации соединения, отношения или связи между двумя или более другими схематическими элементами или среди них, отсутствие любого из таких соединяющих элементов не предполагает, что соединения, отношения или связи не могут существовать. Другими словами, некоторые соединения, отношения или связи между элементами не показаны на графических материалах, чтобы не затруднять понимание настоящего изобретения. Дополнительно для упрощения иллюстрации один соединительный элемент используют для представления множества соединений, отношений или связей между элементами. Например, если соединительный элемент представляет передачу сигналов, данных или команд, специалистам в данной области техники следует понимать, что такой элемент представляет один или множество путей сигнала, по необходимости, для воздействия на передачу.[0020] Additionally, in graphical materials where connecting elements, such as solid or dotted lines or arrows, are used to illustrate a connection, relationship, or connection between or among two or more other schematic elements, the absence of any such connecting elements does not imply that connections, relationships or connections cannot exist. In other words, some connections, relationships or connections between elements are not shown in the drawings so as not to obscure the understanding of the present invention. Additionally, for ease of illustration, a single connection element is used to represent a plurality of connections, relationships, or connections between elements. For example, if a connecting element represents the transmission of signals, data, or commands, those skilled in the art will understand that such element represents one or multiple signal paths, as necessary, to affect the transmission.

[0021] На фиг. 1 показана группа отфильтрованных входных звуковых сигналов для получения группы выходных звуковых сигналов с использованием массива фильтров согласно одному или более вариантам осуществления.[0021] In FIG. 1 illustrates a group of input audio signals filtered to produce a group of output audio signals using a filter array in accordance with one or more embodiments.

[0022] На фиг. 2 показана желаемая кривая частотной характеристики согласно одному или более вариантам осуществления.[0022] In FIG. 2 illustrates a desired frequency response curve according to one or more embodiments.

[0023] На фиг. 3 показан набор частотных характеристик банка фильтров согласно одному или более вариантам осуществления.[0023] In FIG. 3 illustrates a set of frequency responses of a filter bank in accordance with one or more embodiments.

[0024] На фиг. 4 показана полосовая амплитудно-частотная характеристика типичного компонента вектора усиления частотной области согласно одному или более вариантам осуществления.[0024] In FIG. 4 shows the bandpass response of a typical frequency domain gain vector component according to one or more embodiments.

[0025] На фиг. 5 показана частотная характеристика фильтра поддиапазона с групповой задержкой, которая значительно варьирует по частоте, согласно одному или более вариантам осуществления.[0025] In FIG. 5 shows the frequency response of a subband filter with a group delay that varies significantly in frequency, according to one or more embodiments.

[0026] На фиг. 6 показан известный способ микширования входного сигнала для создания выходного сигнала с использованием прямой матрицы микширования и одной или более декоррелирующих матриц микширования согласно одному или более вариантам осуществления.[0026] In FIG. 6 illustrates a known method of mixing an input signal to create an output signal using a direct mixing matrix and one or more decorrelated mixing matrices, according to one or more embodiments.

[0027] На фиг. 7 представлена блок-схема примерного способа преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области согласно одному или более вариантам осуществления.[0027] In FIG. 7 is a flow diagram of an exemplary method for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals, according to one or more embodiments.

[0028] На фиг. 8 представлена блок-схема системы, подходящей для реализации признаков и процессов, описанных со ссылкой на фиг. 1–7, согласно одному или более вариантам осуществления.[0028] In FIG. 8 is a block diagram of a system suitable for implementing the features and processes described with reference to FIG. 1-7, according to one or more embodiments.

[0029] Одинаковые ссылочные позиции, используемые в разных графических материалах, указывают подобные элементы.[0029] The same reference numerals used in different graphics indicate similar elements.

Подробное описаниеDetailed description

[0030] В следующем подробном описании многочисленные конкретные подробности изложены для обеспечения полного понимания различных описанных вариантов осуществления. Для специалиста в данной области техники будет очевидно, что различные описанные варианты реализации могут быть реализованы на практике без этих конкретных подробностей. В других примерах хорошо известные способы, процедуры, компоненты и схемы не были описаны подробно, чтобы не создавать ненужного затруднения понимания аспектов вариантов осуществления. Ниже описаны некоторые признаки, каждый из которых может быть использован независимо друг от друга или с любым сочетанием других признаков.[0030] In the following detailed description, numerous specific details are set forth in order to provide a thorough understanding of the various embodiments described. It will be apparent to one skilled in the art that the various embodiments described may be practiced without these specific details. In other examples, well-known methods, procedures, components and circuits have not been described in detail so as not to unduly obscure aspects of the embodiments. Several features are described below, each of which can be used independently of each other or with any combination of other features.

ТерминологияTerminology

[0031] В контексте настоящего документа слово «включает» и его варианты следует понимать как неограничивающие термины, которые означают «включает, но без ограничения». Слово «или» следует понимать как «и/или», если контекст явно не указывает иное. Выражение «на основе» следует понимать как «на основе по меньшей мере частично». Выражения «одни примерный вариант реализации» и «примерный вариант реализации» следует понимать как «по меньшей мере один примерный вариант реализации». Выражение «другой вариант реализации» следует понимать как «по меньшей мере один другой вариант реализации». Слова «определенный», «определяет» или «определяющий» следует понимать как «получающий», «принимающий», «вычисляющий», «рассчитывающий», «оценивающий», «предсказывающий» или «выводящий». Дополнительно в следующем описании и формуле изобретения, если не задано иное, все технические и научные термины, используемые в данном документе, имеют тот же смысл, что и обычно понимаемый специалистами в области, к которой принадлежит настоящее изобретение.[0031] As used herein, the word “includes” and its variations are to be understood as non-limiting terms that mean “includes but is not limited to.” The word “or” should be understood as “and/or” unless the context clearly indicates otherwise. The expression “based on” should be understood as “based on at least in part.” The expressions “one exemplary embodiment” and “exemplary implementation” should be understood to mean “at least one exemplary implementation.” The expression “other embodiment” should be understood as “at least one other embodiment.” The words “determined”, “determines” or “determining” should be understood as “receiving”, “receiving”, “calculating”, “calculating”, “estimating”, “predicting” or “inferring”. Additionally, in the following description and claims, unless otherwise defined, all technical and scientific terms used herein have the same meaning as commonly understood by those skilled in the art to which the present invention belongs.

Обзор системыSystem overview

[0032] На фиг. 1 показана система 100 линейного микширования, в которой группа входных звуковых сигналов фильтруется для получения группы выходных звуковых сигналов согласно одному или более вариантам осуществления. Система 100 может быть реализована, например, в виде банка аудиофильтров. Банк аудиофильтров содержит массив полосовых фильтров, которые разделяют входной звуковой сигнал на несколько частотных поддиапазонов входного звукового сигнала. В показанном примере система 100 линейного микширования содержит банк фильтров 101 и сумматоры 102. N входных сигналов (X1…XN) обрабатывают посредством банка фильтров 101 и суммируют друг с другом посредством сумматора 102 для получения M выходных сигналов (Y1…YM). Система 100 линейного микширования может быть образована в рамках входных сигналов в частотной области и выходных сигналов в частотной области следующим образом:[0032] In FIG. 1 illustrates a linear mixing system 100 in which a group of input audio signals is filtered to produce a group of output audio signals, according to one or more embodiments. System 100 may be implemented, for example, as an audio filter bank. An audio filter bank contains an array of bandpass filters that divide the input audio signal into several frequency subbands of the input audio signal. In the example shown, the linear mixing system 100 includes a filter bank 101 and adders 102. N input signals (X 1 ...X N ) are processed through the filter bank 101 and summed together through an adder 102 to produce M output signals (Y 1 ...Y M ) . The linear mixing system 100 may be configured within frequency domain input signals and frequency domain output signals as follows:

, [1] , [1]

[2] [2]

. [3] . [3]

[0033] Согласно уравнению [3] выходные звуковые сигналы в частотной области образуются в виде суммы отфильтрованных входных звуковых сигналов в частотной области , причем вклады входных звуковых сигналов в частотной области в определяют посредством составного вектора частотной области, , согласно:[0033] According to equation [3], the output audio signals in the frequency domain are formed as the sum of filtered input audio signals in the frequency domain , and the contributions of input audio signals in the frequency domain V determined by a composite frequency domain vector, , according to:

. [4] . [4]

[0034] Для целей настоящего обсуждения G(f) будет называться примерным составным вектором усиления частотной области, и этот термин должен пониматься как относящийся к любому из составных векторов усиления частотной области , как использовано в уравнениях [3] и [4].[0034] For purposes of this discussion, G(f) will be referred to as an example composite frequency domain gain vector, and this term should be understood to refer to any of the composite frequency domain gain vectors , as used in equations [3] and [4].

[0035] На фиг. 2 показана желаемая кривая частотной характеристики для фильтра согласно одному или более вариантам осуществления. Желаемая частотная характеристика примерного составного вектора усиления частотной области может быть сгенерирована посредством процесса, который создает сглаженные функции, как показано на фиг. 2, при этом коэффициент 20 усиления фильтра в зависимости от частоты определяют согласно предварительно определенной группе управляющих частот fc1, fc2… и соответствующих значений w1, w2... коэффициента усиления компонента. Например, коэффициент 21 усиления фильтра с частотой fc2 устанавливают посредством значения w2 коэффициента усиления компонента, как показано на фиг. 2. Частотная характеристика, показанная на фиг. 2, достигается путем взвешенного суммирования некоторого количества предварительно определенных компонентов вектора усиления частотной области.[0035] In FIG. 2 illustrates a desired frequency response curve for a filter according to one or more embodiments. The desired frequency response of an exemplary composite frequency domain gain vector can be generated through a process that creates smooth functions, as shown in FIG. 2, wherein the filter gain 20 as a function of frequency is determined according to a predetermined group of control frequencies fc 1 , fc 2 ... and the corresponding values w 1 , w 2 ... of the component gain. For example, the gain 21 of the frequency fc 2 filter is set by the component gain value w 2 as shown in FIG. 2. Frequency response shown in FIG. 2 is achieved by weighted summation of a number of predetermined frequency domain gain vector components.

[0036] На фиг. 3 показан набор частотных характеристик банка фильтров согласно одному или более вариантам осуществления со ссылкой на характеристику 300 полосы 2 частот H0,2 (f). Частотные характеристики этих предварительно определенных компонентов вектора усиления частотной области далее в данном документе называются компонентами вектора усиления частотной области H0,b (f), для b [1…B], где B представляет собой количество полос (например, B=5 в примере по фиг. 3), и каждый из компонентов вектора усиления частотной области имеет альтернативное представление в форме импульсной характеристики во временной области h0,b (n).[0036] In FIG. 3 shows a set of frequency responses of a filter bank according to one or more embodiments with reference to frequency band 2 response H 0.2 (f) 300 . The frequency characteristics of these predefined frequency domain gain vector components are hereinafter referred to as frequency domain gain vector components H 0,b (f), for b [1...B], where B represents the number of bands (for example, B=5 in the example of Fig. 3), and each of the frequency domain gain vector components has an alternative representation in the form of a time domain impulse response h 0,b (n ).

[0037] В варианте осуществления желаемую характеристику фильтра (см. фиг. 2) можно образовать из взвешенной суммы предварительно определенных характеристик банка фильтров. Это можно выразить как суммирование во временной или частотной области:[0037] In an embodiment, the desired filter characteristic (see FIG. 2) can be formed from a weighted sum of the predetermined characteristics of the filter bank. This can be expressed as summation in the time or frequency domain:

. [5] . [5]

[0038] В некоторых вариантах реализации группу компонентов вектора усиления частотной области дополняют дополнительными компонентами вектора усиления частотной области H0,b (f), которые имеют свою частотную характеристику, которая модифицирована для создания эффекта декорреляции. Расширенную группу компонентов вектора усиления частотной области называют в данном документе компонентами декорреляции вектора усиления частотной области, которые представлены следующей номенклатурой:[0038] In some embodiments, a group of frequency domain gain vector components is supplemented with additional frequency domain gain vector components H 0,b (f) that have their own frequency response that is modified to create a decorrelation effect. An extended group of frequency domain gain vector components are referred to herein as frequency domain gain vector decorrelation components, which are represented by the following nomenclature:

. [6] . [6]

где B представляет собой количество поддиапазонов и L представляет собой количество функций декорреляции.where B represents the number of subbands and L represents the number of decorrelation functions.

[0039] Эта дополненная группа компонентов вектора усиления частотной области может быть использована в системе обработки звука на основании банка фильтров для генерирования составного вектора усиления частотной области посредством применения модифицированной формы уравнения [5], как показано в уравнении [7]:[0039] This augmented group of frequency domain gain vector components can be used in an audio processing system based on a filter bank to generate a composite frequency domain gain vector by applying a modified form of equation [5], as shown in equation [7]:

. [7] . [7]

[0040] На фиг. 4 показана полосовая амплитудно-частотная характеристика типичного компонента вектора усиления частотной области согласно одному или более вариантам осуществления. В показанном примере компонент вектора усиления частотной области H0,b (f) имеет амплитудную характеристику 401, которая обычно является доминантной над конкретным диапазоном поддиапазона всего диапазона частоты, и групповая задержка 402 является по существу постоянной по диапазону поддиапазона. Групповая задержка считается по существу постоянной, если колебание в групповой задержке является достаточно небольшим, чтобы быть незначительными с точки зрения чувственного восприятия слушателя, когда фильтр используют для обработки звукового сигнала.[0040] In FIG. 4 shows the bandpass response of a typical frequency domain gain vector component according to one or more embodiments. In the example shown, the frequency domain gain vector component H 0,b (f) has an amplitude response 401 that is typically dominant over a particular subband range of the entire frequency range, and a group delay 402 is substantially constant across the subband range. A group delay is considered to be substantially constant if the variation in the group delay is small enough to be negligible from the point of view of the listener's sensory perception when the filter is used to process the audio signal.

[0041] На фиг. 5 показана частотная характеристика фильтра поддиапазона с групповой задержкой, которая значительно варьирует по частоте, согласно одному или более вариантам осуществления. Частотная характеристика компонента декорреляции вектора усиления частотной области, такого как Hl,b (f) (l , демонстрирует групповую задержку 502, которая варьирует по диапазону частоты поддиапазона, и при этом варьирование в групповой задержке является таким, что входные звуковые сигналы, которые фильтруются компонентом декорреляции вектора усиления частотной области Hl,b (f) (l , воспринимаются как декоррелируемые из входных звуковых сигналов, которые отфильтрованы компонентом вектора усиления частотной области H0,b (f).[0041] In FIG. 5 shows the frequency response of a subband filter with a group delay that varies significantly in frequency, according to one or more embodiments. Frequency response of the decorrelation component of a frequency domain gain vector such as H l,b (f) (l , exhibits a group delay 502 that varies across the subband frequency range, and wherein the variation in the group delay is such that the input audio signals that are filtered by the frequency domain gain vector decorrelation component H l,b (f) (l , are perceived as decorrelated from the input audio signals, which are filtered by the frequency domain gain vector component H 0,b (f).

[0042] Из уровня техники известно как создать частотные характеристики с варьирующей групповой задержкой, которая варьирует по широкому диапазону частоты для целей создания воспринимаемого эффекта декорреляции. В варианте осуществления известная частотная характеристика декорреляции может быть приспособлена для применения амплитудной характеристики 501 для образования компонента декорреляции вектора усиления частотной области. В варианте осуществления известная функция Dl(f) (l [1…L]) декорреляции используется для вычисления группы B компонентов декорреляции вектора усиления частотной области:[0042] It is known in the art to create variable group delay frequency responses that vary over a wide frequency range for the purpose of creating a perceived decorrelation effect. In an embodiment, a known decorrelation frequency response may be adapted to apply an amplitude response 501 to form a decorrelation component of the frequency domain gain vector. In an embodiment, the known function D l (f) (l [1...L]) decorrelation is used to calculate group B of decorrelation components of the frequency domain gain vector:

. [8] . [8]

[0043] На фиг. 6 показана система 600 для микширования входного сигнала для создания выходного сигнала с использованием прямой матрицы микширования и одной или более декоррелирующих матриц микширования согласно одному или более вариантам осуществления. Принимая во внимание группу из L известных функций декорреляции Dl (f) (l [1…L]), N-канальный входной сигнал (X) обрабатывают посредством системы 600 для получения M-канального выходного сигнала (Y). В этом примере проиллюстрирована обработка для одного поддиапазона (например полосы b), при этом к N-канальным входным данным 601 (X) применяют прямую матрицу 602 (C) линейного микширования (например матрицу M × N) для получения M-канального прямого сигнала 603. N-канальные входные данные 601 также обрабатывают посредством линейного микшера 610 (Ql) (например матрицы KL × N) для получения группы из KL каналов 611, которые проходят через банк из KL фильтров 612 (Dl) декорреляции, каждый из которых применяет частотную характеристику DL (f) для получения KL-канального сигнала 613, который затем повторно микшируют посредством линейного микшера 614 (Pl) (например матрицы M × KL) для получения M-канального сигнала 615 компонента декорреляции. M-канальный прямой сигнал 603 затем суммируют с M-канальным сигналами компонента декорреляции (например сигналом (615) компонента декорреляции) для получения M-канальных выходных данных 602 (Y).[0043] In FIG. 6 illustrates a system 600 for mixing an input signal to create an output signal using a direct mixing matrix and one or more decorrelating mixing matrices, according to one or more embodiments. Given a group of L known decorrelation functions D l (f) (l [1...L]), the N-channel input signal (X) is processed by system 600 to produce an M-channel output signal (Y). This example illustrates processing for one subband (eg, b band) whereby a forward linear mixing matrix 602 (C) (eg, an M×N matrix) is applied to the N-channel input data 601 (X) to produce an M-channel forward signal 603 The N-channel input data 601 is also processed by a linear mixer 610 (Q l ) (eg, a K L × N matrix) to produce a group of K L channels 611 that pass through a bank of K L decorrelation filters 612 (D l ) each. of which applies the frequency response D L (f) to obtain a K L channel signal 613, which is then remixed by a linear mixer 614 (P l ) (eg, an M × K L matrix) to obtain an M channel decorrelation component signal 615. The M-channel forward signal 603 is then added to the M-channel decorrelation component signals (eg, the decorrelation component signal (615)) to produce the M-channel output data 602 (Y).

[0044] В этом варианте осуществления альтернатива обработке, показанной на фиг. 6, реализована посредством замены функций матриц C, Q1…QL и P1…PL линейного микширования на одну группу весовых коэффициентов, . Согласно варианту осуществления и снова со ссылкой на уравнение [4], выходной канал Ym (f) может быть сгенерирован в соответствии со следующим:[0044] In this embodiment, an alternative to the processing shown in FIG. 6, is implemented by replacing the linear mixing matrix functions C, Q 1 ...Q L and P 1 ...P L with one group of weighting coefficients, . According to an embodiment and again with reference to equation [4], the output channel Y m (f) can be generated in accordance with the following:

, ,

. [9] . [9]

[0045] Уравнение [9] может быть реализовано в системе обработки звука на основе банка фильтров, где количество фильтров составляет (L+1) x B вместо B фильтров, которые, как известно, используют в уровне техники. Этот увеличенный набор фильтров может дополнительно считаться B фильтрами, как было известно ранее, с добавлением L x B фильтров, которые соответствуют L разных функций декорреляции.[0045] Equation [9] can be implemented in an audio processing system based on a filter bank, where the number of filters is (L+1) x B instead of the B filters that are known to be used in the prior art. This enlarged set of filters can further be considered B filters as previously known, with the addition of L x B filters that correspond to L different decorrelation functions.

[0046] В некоторых вариантах реализации уравнение [9] реализуют как банк аудиофильтров, который содержит преобразователь (например для быстрого преобразования Фурье), выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области (f), и линейный микшер (реализует операции матричного умножения), выполненный с возможностью реализации для преобразования группы входных звуковых сигналов в частотной области (f) в группу выходных звуковых сигналов в частотной области . Каждый выходной звуковой сигнал в частотной области представляет собой сумму отфильтрованных входных звуковых сигналов в частотной области, и каждый фильтр, используемый для фильтрации входных звуковых сигналов в частотной области, характеризуется комплексной функцией усиления в диапазоне соответствующей частоты поддиапазона входного звукового сигнала частотной области. Вклады входных звуковых сигналов в частотной области в выходной звуковой сигнал в частотной области определяют посредством составного вектора усиления частотной области.[0046] In some embodiments, Equation [9] is implemented as an audio filter bank that includes a converter (eg, a fast Fourier transform) configured to convert a group of time domain audio input signals to a group of frequency domain audio input signals (f), and a linear mixer (implements matrix multiplication operations), configured to implement to convert a group of input audio signals in the frequency domain (f) to a group of output audio signals in the frequency domain . Each output frequency domain audio signal is the sum of the filtered input frequency domain audio signals, and each filter used to filter the input frequency domain audio signals is characterized by a complex gain function in the range of the corresponding frequency subband of the input frequency domain audio signal. The contributions of the input frequency domain audio signals to the output frequency domain audio signal are determined by a composite frequency domain gain vector.

[0047] В некоторых вариантах реализации уравнение [9] реализуют как систему банка аудиофильтров, которая содержит преобразователь (например для быстрого преобразования Фурье), выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области (f), и линейный микшер (программное обеспечение или аппаратное обеспечение для реализации суммы операций произведения), выполненный с возможностью реализации для преобразования группы входных звуковых сигналов в частотной области (f) в группу выходных звуковых сигналов в частотной области . Линейный микшер содержит весовые коэффициенты (элементы ), которые обеспечивают частотно-зависимую функцию усиления, которая содержит прямой компонент, который определяется как частотно-зависимое усиление, и один или более компонентов декорреляции, который имеет групповую фазовую характеристику, варьирующую в зависимости от частоты. Частотно-зависимое усиление образуется из набора функций поддиапазона, при этом каждая функция поддиапазона образована из набора передаточных функций соответствующих компонентов, включающих прямой компонент и один или более компонентов декорреляции.[0047] In some embodiments, Equation [9] is implemented as an audio filter bank system that includes a converter (for example, a fast Fourier transform) configured to convert a group of time domain audio input signals to a group of frequency domain audio input signals (f), and a line mixer (software or hardware for realizing the sum of operations of a work) configured to implement to convert a group of input audio signals in the frequency domain (f) to a group of output audio signals in the frequency domain . The linear mixer contains weighting coefficients (elements ) that provide a frequency-dependent gain function that contains a direct component, which is defined as frequency-dependent gain, and one or more decorrelation components, which has a group phase response that varies with frequency. The frequency-dependent gain is formed from a set of subband functions, wherein each subband function is formed from a set of transfer functions of corresponding components, including a direct component and one or more decorrelation components.

Примерный способApproximate method

[0048] На фиг. 7 представлена блок-схема примерного способа 700 преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области согласно одному или более вариантам осуществления. Способ 700 может быть реализован, например, посредством системы 800, описанной со ссылкой на фиг. 8.[0048] In FIG. 7 is a flow diagram of an exemplary method 700 for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals according to one or more embodiments. The method 700 may be implemented, for example, by the system 800 described with reference to FIG. 8.

[0049] Посредством способа 700 вычисляют (701) каждый выходной звуковой сигнал в частотной области как сумму отфильтрованных входных звуковых сигналов в частотной области, каждый из которых образует комплексную функцию усиления в диапазоне соответствующей частоты поддиапазона, при этом вклады входных звуковых сигналов в частотной области в выходной звуковой сигнал в частотной области определяют посредством составного вектора усиления частотной области.[0049] Method 700 calculates (701) each output frequency domain audio signal as the sum of the filtered input frequency domain audio signals, each of which forms a complex gain function over the range of the corresponding subband frequency, wherein the input frequency domain audio signals contribute to the frequency domain audio output signal is determined by a composite frequency domain gain vector.

[0050] Способ 700 продолжают получением (702) составного вектора усиления частотной области посредством вычисления группы компонентов вектора усиления частотной области. По меньшей мере один из компонентов вектора усиления частотной области представляет собой компонент декорреляции вектора усиления частотной области, образованный посредством дополнения компонента вектора усиления частотной области дополнительными компонентами вектора усиления частотной области, имеющими модифицированные частотные характеристики для создания эффекта декорреляции.[0050] Method 700 continues by obtaining (702) a composite frequency domain gain vector by calculating a group of frequency domain gain vector components. At least one of the frequency domain gain vector components is a frequency domain gain vector decorrelation component formed by augmenting the frequency domain gain vector component with additional frequency domain gain vector components having modified frequency characteristics to create a decorrelation effect.

[0051] Способ 700 продолжают суммированием (703) компонентов вектора усиления частотной области с образованием составного вектора усиления частотной области.[0051] Method 700 continues by summing (703) the components of the frequency domain gain vector to form a composite frequency domain gain vector.

Примерная архитектура системыApproximate system architecture

[0052] На фиг. 8 показана блок-схема примерной системы 800, подходящей для реализации примерных вариантов осуществления настоящего изобретения. Система 800 содержит один или более серверных компьютеров или любое клиентское устройство, включая, но без ограничения: серверы обработки вызовов, пользовательское оборудование, системы помещений для переговоров, системы домашних кинотеатров, приспособления виртуальной реальности (VR) и устройства, работающие с содержимым с эффектом присутствия. Система 800 включает любые потребительские устройства, включая, но без ограничения: смартфоны, планшетные компьютеры, носимые компьютеры, компьютеры транспортных средств, игровые приставки, системы объемного звука, компьютеры общественного пользования и т. п.[0052] In FIG. 8 shows a block diagram of an example system 800 suitable for implementing example embodiments of the present invention. System 800 includes one or more server computers or any client device, including, but not limited to: call servers, user equipment, meeting room systems, home theater systems, virtual reality (VR) devices, and immersive content devices. . System 800 includes any consumer devices, including, but not limited to: smartphones, tablet computers, wearable computers, vehicle computers, game consoles, surround sound systems, public use computers, and the like.

[0053] Как показано, система 800 содержит центральное процессорное устройство (ЦПУ) 801, которое может осуществлять различные способы в соответствии с программой, сохраненной, например, в постоянном запоминающем устройстве (ПЗУ) 802, или программой, загруженной из, например, блока 808 памяти в оперативное запоминающее устройство (ОЗУ) 803. Если требуется, в ОЗУ 803 также хранятся данные, необходимые при выполнении ЦПУ 801 различных способов. ЦПУ 801, ПЗУ 802 и ОЗУ 803 соединены друг с другом посредством шины 804. Интерфейс 805 ввода/вывода (I/O) также соединен с шиной 804.[0053] As shown, the system 800 includes a central processing unit (CPU) 801 that can implement various methods in accordance with a program stored, for example, in a read-only memory (ROM) 802, or a program loaded from, for example, a block 808 memory into a random access memory (RAM) 803. If required, the RAM 803 also stores data needed when the CPU 801 executes various methods. The CPU 801, ROM 802, and RAM 803 are connected to each other via bus 804. An input/output (I/O) interface 805 is also connected to bus 804.

[0054] Следующие компоненты соединены с интерфейсом 805 I/O: блок 806 ввода, который может содержать клавиатуру, мышь или т.п.; блок 807 вывода, который может содержать дисплей, такой как жидкокристаллический дисплей (LCD), и один или более динамиков; блок 808 памяти, содержащий жесткий диск или другое подходящее устройство хранения; и блок 809 связи, содержащий сетевую интерфейсную карту, такую как сетевая карта (например проводная или беспроводная).[0054] The following components are connected to the I/O interface 805: an input unit 806, which may include a keyboard, mouse, or the like; an output unit 807, which may include a display such as a liquid crystal display (LCD) and one or more speakers; a memory unit 808 comprising a hard disk or other suitable storage device; and a communication unit 809 including a network interface card, such as a network card (eg, wired or wireless).

[0055] В некоторых вариантах реализации блок 806 ввода содержит один или более микрофонов в разных положениях (в зависимости от хост-устройства), обеспечивающих запись звуковых сигналов в различных форматах (например монофоническом, стереофоническом, пространственном, с эффектом присутствия и других подходящих форматах).[0055] In some embodiments, the input unit 806 includes one or more microphones at different positions (depending on the host device) to record audio signals in various formats (e.g., mono, stereo, surround, immersive, and other suitable formats) .

[0056] В некоторых вариантах реализации блок 807 вывода содержит системы с различным количеством динамиков. Блок 807 вывода (в зависимости от функциональных возможностей хост-устройства) может осуществлять рендеринг звуковых сигналов в различных форматах (например монофоническом, стереофоническом, с эффектом присутствия, бинауральном и других подходящих форматах).[0056] In some embodiments, output block 807 includes systems with varying numbers of speakers. The output block 807 (depending on the functionality of the host device) can render audio signals in various formats (eg, monophonic, stereophonic, immersive, binaural, and other suitable formats).

[0057] Блок 809 связи выполнен с возможностью осуществления связи с другими устройствами (например посредством сети). Накопитель 810 также соединен с интерфейсом 805 I/O, если это необходимо. Сменный носитель 811, такой как магнитный диск, оптический диск, магнитооптический диск, флеш-накопитель или другой подходящий сменный носитель, установлен в накопителе 810 так, что компьютерную программу, считанную с него, устанавливают в блок 808 памяти, если это необходимо. Для специалиста в данной области техники будет понятно, что хотя система 800 описана как содержащая вышеописанные компоненты, в реальных применениях возможно добавить, удалить и/или заменить некоторые из этих компонентов, и все эти модификации или изменения попадают в объем настоящего изобретения.[0057] The communication unit 809 is configured to communicate with other devices (eg, via a network). The drive 810 is also connected to the I/O interface 805 if necessary. Removable media 811, such as a magnetic disk, optical disk, magneto-optical disk, flash drive, or other suitable removable media, is installed in the drive 810 such that a computer program read from it is installed in the memory unit 808, if desired. It will be appreciated by one skilled in the art that although the system 800 is described as comprising the components described above, in actual applications it is possible to add, remove and/or replace some of these components, and all such modifications or changes fall within the scope of the present invention.

[0058] В соответствии с примерными вариантами осуществления настоящего изобретения процессы, описанные выше, могут быть реализованы как программы компьютерного программного обеспечения или на машиночитаемом носителе. Например, варианты осуществления настоящего изобретения содержат компьютерный программный продукт, содержащий компьютерную программу, материально воплощенную на машиночитаемом носителе, при этом компьютерная программа содержит программный код для выполнения способов. В таких вариантах осуществления компьютерная программа может быть загружена и установлена из сети посредством блока 809 связи и/или инсталлирована со сменного носителя 811, которые показаны на фиг. 8.[0058] In accordance with exemplary embodiments of the present invention, the processes described above may be implemented as computer software programs or on a computer-readable medium. For example, embodiments of the present invention comprise a computer program product comprising a computer program tangibly embodied on a computer readable medium, the computer program comprising program code for executing the methods. In such embodiments, a computer program may be downloaded and installed from a network via communications unit 809 and/or installed from removable media 811, which are shown in FIG. 8.

[0059] В целом различные примерные варианты осуществления настоящего изобретения могут быть реализованы в аппаратном обеспечении или схемах специального назначения (например, наборе схем управления), программном обеспечении, логической схеме или любом их сочетании. Например, вышеописанные блоки могут быть исполнены схемой управления (например ЦПУ в сочетании с другими компонентами, показанными на фиг. 8), таким образом, схема управления может осуществлять действия, описанные в этом раскрытии. Некоторые аспекты могут быть реализованы в аппаратном обеспечении, тогда как другие аспекты могут быть реализованы в аппаратно-программном обеспечении или программном обеспечении, которые могут быть исполнены контроллером, микропроцессором или другим вычислительным устройством (например схемой управления). Хотя различные аспекты примерных вариантов осуществления настоящего изобретения проиллюстрированы и описаны как структурные схемы, блок-схемы или с использованием некоторого другого графического представления, будет понятно, что блоки, аппараты, системы, методы или способы, описанные в настоящем документе, могут быть реализованы, в качестве неограничительных примеров, в аппаратном обеспечении, программном обеспечении, аппаратно-программном обеспечении, схемах специального назначения или логических схемах, в аппаратном обеспечении или контроллере, или других вычислительных устройствах общего назначения, или в некотором их сочетании.[0059] In general, various exemplary embodiments of the present invention may be implemented in hardware or special purpose circuitry (eg, a set of control circuits), software, logic circuitry, or any combination thereof. For example, the above-described blocks may be implemented by a control circuit (eg, a CPU in combination with other components shown in FIG. 8), such that the control circuit may perform the actions described in this disclosure. Some aspects may be implemented in hardware, while other aspects may be implemented in firmware or software that may be executed by a controller, microprocessor, or other computing device (eg, control circuitry). While various aspects of exemplary embodiments of the present invention have been illustrated and described as block diagrams, block diagrams, or some other graphical representation, it will be understood that the blocks, apparatus, systems, methods, or methods described herein may be implemented, in as non-limiting examples, in hardware, software, firmware, special purpose circuits or logic circuits, hardware or controller, or other general purpose computing devices, or some combination thereof.

[0061] Дополнительно различные блоки, показанные на блок-схемах, можно рассматривать как этапы способа и/или как операции, которые являются результатом работы компьютерного программного кода, и/или как множество элементов связанной логической схемы, созданных для осуществления связанной функции (связанных функций). Например, варианты осуществления настоящего изобретения предусматривают компьютерный программный продукт, содержащий компьютерную программу, материально воплощенную на машиночитаемом носителе, при этом компьютерная программа содержит программные коды, сконфигурированные для осуществления способов, которые описаны выше.[0061] Additionally, the various blocks shown in the block diagrams can be viewed as method steps and/or as operations that result from the operation of computer program code, and/or as a plurality of associated logic circuit elements designed to implement associated function(s). ). For example, embodiments of the present invention provide a computer program product comprising a computer program tangibly embodied on a computer readable medium, the computer program comprising program codes configured to implement the methods as described above.

[0061] В контексте настоящего изобретения машиночитаемый носитель может быть любым материальным носителем, который может содержать или хранить программу для использования системой, аппаратом или устройством для исполнения команд или в сочетании с ними. Машиночитаемый носитель может представлять собой машиночитаемый носитель сигналов или машиночитаемый носитель данных. Машиночитаемый носитель может быть постоянным и может содержать, но без ограничения, электронную, магнитную, оптическую, электромагнитную, инфракрасную или полупроводниковую систему, аппарат или устройство или любое подходящее сочетание указанного выше. Более конкретные примеры машиночитаемого носителя данных будут включать электрическое соединение посредством одного или более проводов, портативный компьютерный гибкий диск, жесткий диск, ОЗУ, ПЗУ, стираемое программируемое постоянное запоминающее устройство (СППЗУ, или флеш-память), оптическое волокно, постоянное запоминающее устройством на портативном компактном диске (CD-ROM), оптическое запоминающее устройство, магнитное запоминающее устройство или любое подходящее сочетание указанного выше.[0061] In the context of the present invention, a computer-readable medium can be any tangible medium that can contain or store a program for use by or in combination with a system, apparatus, or device for executing instructions. The computer-readable medium may be a computer-readable signal medium or a computer-readable storage medium. A computer-readable medium may be non-transitory and may contain, but is not limited to, an electronic, magnetic, optical, electromagnetic, infrared or semiconductor system, apparatus or device, or any suitable combination of the foregoing. More specific examples of computer readable storage media will include an electrical connection through one or more wires, a portable computer floppy disk, a hard disk, RAM, ROM, erasable programmable read only memory (EPROM, or flash memory), optical fiber, portable read only memory. compact disk drive (CD-ROM), optical storage device, magnetic storage device, or any suitable combination of the above.

[0062] Компьютерный программный код для осуществления способов настоящего изобретения может быть написан на одном или более языках программирования в любом их сочетании. Эти компьютерные программные коды могут быть предоставлены на процессор компьютера общего назначения, компьютера специального назначения или другого программируемого аппарата обработки данных, который имеет схему управления, так, что программные коды при исполнении процессором компьютера или другого программируемого аппарата обработки данных обеспечивают реализацию функций/операций, заданных в блок-схемах и/или структурных схемах. Программный код может быть исполнен полностью на компьютере, частично на компьютере в качестве автономного пакета программного обеспечения, частично на компьютере и частично на удаленном компьютере, или полностью на удаленном компьютере или сервере, или распределен между одним или более удаленными компьютерами и/или серверами.[0062] The computer program code for implementing the methods of the present invention may be written in one or more programming languages, in any combination thereof. These computer program codes may be provided to a processor of a general purpose computer, special purpose computer, or other programmable data processing apparatus that has control circuitry such that the program codes, when executed by the processor of the computer or other programmable data processing apparatus, implement functions/operations specified by in block diagrams and/or block diagrams. The program code may be executed entirely on a computer, partially on a computer as a stand-alone software package, partially on a computer and partially on a remote computer, or entirely on a remote computer or server, or distributed among one or more remote computers and/or servers.

[0063] Хотя этот документ содержит множество специфических подробностей реализации, их не следует истолковывать как ограничения в отношении объема того, что может быть заявлено, но скорее как описания признаков, которые могут являться специфическими для конкретных вариантов осуществления. Определенные признаки, описанные в данном описании в контексте отдельных вариантов осуществления изобретения, также могут быть реализованы в комбинации в одном варианте осуществления. И наоборот, различные признаки, которые описаны в контексте одного варианта осуществления, также могут быть реализованы в нескольких вариантах осуществления по отдельности или в любой подходящей подкомбинации. Кроме того, хотя признаки могут быть описаны выше как действующие в определенных комбинациях и даже изначально заявлены как таковые, один или более признаков из заявленной комбинации в некоторых случаях могут быть исключены из комбинации, а заявленная комбинация может быть направлена на подкомбинацию или изменение подкомбинации. Логические последовательности, изображенные на фигурах, не требуют конкретного показанного порядка, или последовательного порядка, для достижения требуемых результатов. Дополнительно могут быть предусмотрены другие этапы, или этапы могут быть исключены из описанных последовательностей, а другие компоненты могут быть добавлены в описанные системы или исключены из них. Соответственно, другие варианты реализации находятся в пределах объема следующей формулы изобретения.[0063] Although this document contains many specific implementation details, these should not be construed as limitations on the scope of what may be claimed, but rather as descriptions of features that may be specific to particular embodiments. Certain features described herein in the context of individual embodiments of the invention may also be implemented in combination in a single embodiment. Conversely, various features that are described in the context of one embodiment may also be implemented in multiple embodiments individually or in any suitable subcombination. In addition, although features may be described above as operating in certain combinations and even initially stated as such, one or more features from a claimed combination may in some cases be excluded from the combination, and the claimed combination may be directed to a subcombination or a modification of a subcombination. The logical sequences depicted in the figures do not require the specific order shown, or sequential order, to achieve the required results. Additionally, other steps may be provided or steps may be omitted from the described sequences, and other components may be added to or omitted from the described systems. Accordingly, other embodiments are within the scope of the following claims.

Claims (24)

1. Способ преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области, причем способ включает:1. A method for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals, the method comprising: вычисление с использованием одного или более процессоров каждого выходного звукового сигнала в частотной области как суммы отфильтрованных входных звуковых сигналов в частотной области, причем каждый фильтр, используемый для фильтрации входных звуковых сигналов в частотной области, характеризуют посредством комплексной функции усиления в диапазоне соответствующей частоты поддиапазона входного звукового сигнала частотной области, при этом вклады входных звуковых сигналов в частотной области в выходной звуковой сигнал в частотной области определяют посредством составного вектора усиления частотной области, и составной вектор усиления частотной области получают посредством:calculating, using one or more processors, each output frequency domain audio signal as the sum of the filtered input frequency domain audio signals, wherein each filter used to filter the input frequency domain audio signals is characterized by a complex gain function over a range of a corresponding frequency subband of the input audio signal frequency domain signal, wherein contributions of the input frequency domain audio signals to the output frequency domain audio signal are determined by a composite frequency domain gain vector, and the composite frequency domain gain vector is obtained by: вычисления с использованием одного или более процессоров группы компонентов вектора усиления частотной области, при этом по меньшей мере один из компонентов вектора усиления частотной области представляет собой компонент декорреляции вектора усиления частотной области, образованный посредством дополнения компонента вектора усиления частотной области дополнительными компонентами вектора усиления частотной области, имеющими модифицированные частотные характеристики для создания эффекта декорреляции; иcalculating, using one or more processors, a group of frequency domain gain vector components, wherein at least one of the frequency domain gain vector components is a frequency domain gain vector decorrelation component formed by augmenting the frequency domain gain vector component with additional frequency domain gain vector components, having modified frequency characteristics to create a decorrelation effect; And суммирования с использованием одного или более процессоров компонентов вектора усиления частотной области с образованием составного вектора усиления частотной области.summing using one or more frequency domain gain vector component processors to form a composite frequency domain gain vector. 2. Способ по п. 1, отличающийся тем, что компонент декорреляции вектора усиления частотной области получен посредством масштабирования по меньшей мере одного из компонентов вектора частотной области посредством значения коэффициента усиления компонента.2. The method of claim 1, wherein the decorrelation component of the frequency domain gain vector is obtained by scaling at least one of the components of the frequency domain vector by a gain value of the component. 3. Способ по любому из пп. 1 или 2, отличающийся тем, что один или более компонентов вектора усиления частотной области содержит фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая является по существу постоянной в частоте поддиапазона, и при этом групповая задержка является по существу постоянной, если колебание в групповой задержке является достаточно небольшим, чтобы быть незначительными с точки зрения чувственного восприятия слушателя.3. Method according to any one of paragraphs. 1 or 2, wherein one or more frequency domain gain vector components comprise a phase response that varies over a subband frequency range, thereby providing a group delay that is substantially constant across the subband frequency, and wherein the group delay is substantially constant if the variation in group delay is small enough to be insignificant from the point of view of the listener's sensory perception. 4. Способ по любому из пп. 1–3, отличающийся тем, что один или более компонентов вектора усиления частотной области содержит фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая варьирует в диапазоне частоты поддиапазона для обеспечения эффекта декорреляции.4. Method according to any one of paragraphs. 1-3, wherein one or more frequency domain gain vector components comprise a phase response that varies over a subband frequency range, thereby providing a group delay that varies over a subband frequency range to provide a decorrelation effect. 5. Способ по любому из пп. 1–4, отличающийся тем, что компонент декорреляции вектора усиления частотной области получают посредством умножения компонента вектора усиления частотной области на функцию декорреляции.5. Method according to any one of paragraphs. 1-4, characterized in that the decorrelation component of the frequency domain gain vector is obtained by multiplying the frequency domain gain vector component by the decorrelation function. 6. Система для преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области, содержащая: один или более процессоров; и6. A system for converting a group of input frequency domain audio signals into a group of output frequency domain audio signals, comprising: one or more processors; And постоянный машиночитаемый носитель, на котором сохранены команды, которые при исполнении одним или более процессорами вызывают выполнение одним или более процессорами операций способа по любому из пп. 1–5.a non-transitory computer-readable medium on which instructions are stored that, when executed by one or more processors, cause one or more processors to perform the operations of the method according to any one of claims. 1–5. 7. Постоянный машиночитаемый носитель, на котором сохранены команды, которые при исполнении одним или более процессорами вызывают выполнение одним или более процессорами операций способа по любому из пп. 1–5.7. A non-transitory computer-readable medium on which are stored instructions that, when executed by one or more processors, cause one or more processors to perform the operations of the method according to any one of claims. 1–5. 8. Банк аудиофильтров с компонентами декорреляции, содержащий:8. Bank of audio filters with decorrelation components, containing: преобразователь, выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области; иa converter configured to convert a group of input audio signals in the time domain into a group of input audio signals in the frequency domain; And линейный микшер, выполненный с возможностью преобразования группы входных звуковых сигналов в частотной области в группу выходных звуковых сигналов в частотной области, при этом каждый выходной звуковой сигнал в частотной области представляет собой сумму отфильтрованных входных звуковых сигналов в частотной области, причем каждый фильтр, используемый для фильтрации входных звуковых сигналов в частотной области, характеризуется комплексной функцией усиления в диапазоне соответствующей частоты поддиапазона входного звукового сигнала в частотной области, и при этом вклады входных звуковых сигналов в частотной области в выходной звуковой сигнал в частотной области определяют посредством составного вектора усиления частотной области.a linear mixer configured to convert a group of input frequency domain audio signals into a group of output frequency domain audio signals, wherein each output frequency domain audio signal is the sum of the filtered input frequency domain audio signals, each filter used for filtering input frequency domain audio signals is characterized by a complex gain function over a corresponding frequency range of a subband of the input frequency domain audio signal, and wherein the contributions of the input frequency domain audio signals to the output frequency domain audio signal are determined by a composite frequency domain gain vector. 9. Банк аудиофильтров по п. 8, отличающийся тем, что составной вектор усиления частотной области получают посредством:9. Bank of audio filters according to claim 8, characterized in that the composite frequency domain gain vector is obtained by: вычисления группы компонентов вектора усиления частотной области, при этом по меньшей мере один из компонентов вектора усиления частотной области представляет собой компонент декорреляции вектора усиления частотной области, образованный посредством дополнения компонента вектора усиления частотной области дополнительными компонентами вектора усиления частотной области, имеющими модифицированные частотные характеристики для создания эффекта декорреляции для выходного звукового сигнала в частотной области; иcalculating a group of frequency domain gain vector components, wherein at least one of the frequency domain gain vector components is a frequency domain gain vector decorrelation component formed by augmenting the frequency domain gain vector component with additional frequency domain gain vector components having modified frequency characteristics to create a decorrelation effect for the output audio signal in the frequency domain; And суммирования компонентов вектора усиления частотной области с образованием составного вектора усиления частотной области.summing the components of the frequency domain gain vector to form a composite frequency domain gain vector. 10. Банк аудиофильтров по любому из пп. 8 или 9, отличающийся тем, что компонент декорреляции вектора усиления частотной области получают посредством масштабирования по меньшей мере одного из компонентов вектора частотной области посредством значения коэффициента усиления компонента.10. Bank of audio filters according to any one of paragraphs. 8 or 9, wherein the decorrelation component of the frequency domain gain vector is obtained by scaling at least one of the components of the frequency domain vector by a gain value of the component. 11. Банк аудиофильтров по любому из пп. 8–10, отличающийся тем, что один или более компонентов вектора усиления частотной области содержит фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая является приблизительно постоянной в частоте поддиапазона, и при этом групповая задержка является приблизительно постоянной, если колебание в групповой задержке является достаточно небольшим, чтобы быть незначительными с точки зрения чувственного восприятия слушателя.11. Bank of audio filters according to any one of paragraphs. 8-10, wherein one or more frequency domain gain vector components comprise a phase response that varies across a subband frequency range, thereby providing a group delay that is approximately constant across the subband frequency, and wherein the group delay is approximately constant, if the variation in group delay is small enough to be insignificant from the point of view of the listener's sensory perception. 12. Банк аудиофильтров по любому из пп. 8–11, отличающийся тем, что один или более компонентов вектора усиления частотной области содержит фазовую характеристику, которая варьирует в диапазоне частоты поддиапазона, тем самым обеспечивая групповую задержку, которая варьирует в диапазоне частоты поддиапазона для обеспечения эффекта декорреляции для выходного звукового сигнала в частотной области.12. Bank of audio filters according to any one of paragraphs. 8-11, wherein one or more frequency domain gain vector components comprise a phase response that varies over a subband frequency range, thereby providing a group delay that varies over a subband frequency range to provide a decorrelation effect for the output audio signal in the frequency domain . 13. Банк аудиофильтров по любому из пп. 8–12, отличающийся тем, что компонент декорреляции вектора усиления частотной области получают посредством умножения компонента вектора усиления частотной области на функцию декорреляции.13. Bank of audio filters according to any one of paragraphs. 8-12, characterized in that the decorrelation component of the frequency domain gain vector is obtained by multiplying the frequency domain gain vector component by the decorrelation function. 14. Звуковая система на основании банка фильтров, содержащая:14. Sound system based on a filter bank, containing: преобразователь, выполненный с возможностью преобразования группы входных звуковых сигналов во временной области в группу входных звуковых сигналов в частотной области; иa converter configured to convert a group of input audio signals in the time domain into a group of input audio signals in the frequency domain; And линейный микшер, выполненный с возможностью преобразования группы входных сигналов в частотной области в группу выходных сигналов в частотной области, причем линейный микшер включает весовые коэффициенты, которые обеспечивают частотно-зависимую функцию усиления, которая содержит прямой компонент, который определен как частотно-зависимое усиление, и один или более компонентов декорреляции, которые имеют групповую фазовую характеристику, варьирующую в зависимости от частоты, и при этом частотно-зависимое усиление образуется из набора функций поддиапазона, причем каждая функция поддиапазона образована из набора передаточных функций соответствующих компонентов, включающих прямой компонент и один или более компонентов декорреляции.a linear mixer configured to convert a group of input frequency domain signals into a group of output frequency domain signals, the linear mixer including weighting coefficients that provide a frequency dependent gain function that includes a direct component that is defined as a frequency dependent gain, and one or more decorrelation components that have a group phase response varying with frequency, wherein the frequency-dependent gain is formed from a set of subband functions, wherein each subband function is formed from a set of transfer functions of corresponding components including a direct component and one or more decorrelation components.
RU2022108800A 2019-09-03 2020-09-02 Bank of audiofilters with decorrelation components RU2822170C1 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/895,096 2019-09-03

Related Child Applications (1)

Application Number Title Priority Date Filing Date
RU2024115788A Division RU2024115788A (en) 2019-09-03 2020-09-02 AUDIO FILTER BANK WITH DECORRELATION COMPONENTS

Publications (1)

Publication Number Publication Date
RU2822170C1 true RU2822170C1 (en) 2024-07-02

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003046891A1 (en) * 2001-11-29 2003-06-05 Coding Technologies Ab Methods for improving high frequency reconstruction

Similar Documents

Publication Publication Date Title
US12089033B2 (en) Generating binaural audio in response to multi-channel audio using at least one feedback delay network
US10555109B2 (en) Generating binaural audio in response to multi-channel audio using at least one feedback delay network
RU2676879C2 (en) Audio device and method of providing audio using audio device
KR101346490B1 (en) Method and apparatus for audio signal processing
RU2361185C2 (en) Device for generating multi-channel output signal
CN103329571A (en) Immersive audio rendering system
CN108293165A (en) Enhance the device and method of sound field
CN114467313B (en) Non-linear adaptive filter bank for psychoacoustic frequency range extension
KR101779731B1 (en) Adaptive diffuse signal generation in an upmixer
EP3329485A1 (en) System and method for spatial processing of soundfield signals
RU2822170C1 (en) Bank of audiofilters with decorrelation components
US10341802B2 (en) Method and apparatus for generating from a multi-channel 2D audio input signal a 3D sound representation signal
US12069467B2 (en) All-pass network system for colorless decorrelation with constraints
EP3488623B1 (en) Audio object clustering based on renderer-aware perceptual difference
TWI776222B (en) Audio filterbank with decorrelating components
Franck et al. Optimization-based reproduction of diffuse audio objects
Brunnström et al. Sound zone control for arbitrary sound field reproduction methods
Mckenzie Towards a perceptually optimal bias factor for directional bias equalisation of binaural ambisonic rendering
CN116076090A (en) Matrix encoded stereo signal with omni-directional acoustic elements
WO2022047078A1 (en) Matrix coded stereo signal with periphonic elements