RU2777511C1

RU2777511C1 - Method and device for rendering acoustic signal and machine readable recording media

Info

Publication number: RU2777511C1
Application number: RU2021131706A
Authority: RU
Inventors: Санг-бае ЧОН; Сун-мин КИМ
Original assignee: Самсунг Электроникс Ко., Лтд.
Priority date: 2014-06-26
Filing date: 2021-10-29
Publication date: 2022-08-05

Abstract

FIELD: audio signal rendering.

SUBSTANCE: invention relates to an audio signal rendering method, and more specifically, to a rendering method for even more accurately representing the position of an audio image and timbre by modifying the lift pan gain or lift filter gain when an input channel rises above or below the rise according to a standard layout. The claimed method for rendering the rise of an audio signal includes: receiving a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; adding a preset delay to the front height input channel so as to allow each of the plurality of output channels to provide an audio image having a lift with a reference pitch angle; changing, based on the added delay, a lift rendering parameter relative to the front height input channel; and preventing front/rear channel confusion by generating, based on the changed lift rendering parameter, a surround output channel after the lift rendering delayed with respect to the front height input channel.

EFFECT: preventing distortion from occurring in the audio image when a channel signal such as a 22.2-channel signal is rendered into a 5.1-channel signal, 3D audio can be reproduced by using a 2D output channel, and when the input channel elevation angle is different from the standard elevation angle.

3 cl, 18 dwg

Description

Область техники, к которой относится изобретениеThe field of technology to which the invention belongs

[0001] Настоящее изобретение относится к способу и устройству для рендеринга аудиосигнала, а более конкретно, к способу рендеринга и устройству для еще более точного представления позиции звукового изображения и тембра посредством модификации коэффициента панорамирования подъема или коэффициента фильтрации подъема, когда подъем входного канала выше или ниже подъема согласно стандартной схеме размещения.[0001] The present invention relates to a method and apparatus for rendering an audio signal, and more specifically, to a rendering method and apparatus for still more accurately representing the position of an audio image and timbre by modifying the lift pan gain or lift filter gain when the lift of an input channel is higher or lower. lifting according to the standard layout.

Уровень техникиState of the art

[0002] Трехмерное аудио означает аудио, которое обеспечивает возможность слушателю иметь ощущение погружения посредством воспроизведения не только подъема аудио и оттенка, но также и воспроизведения направления или расстояния, и в которое добавляется пространственная информация, при этом пространственная информация заставляет слушателя, который не находится в пространстве, в котором возникает аудиоисточник, иметь направленное восприятие, восприятие расстояния и пространственное восприятие.[0002] Three-dimensional audio means audio that enables the listener to have an immersive experience by reproducing not only audio elevation and hue, but also reproducing direction or distance, and to which spatial information is added, the spatial information causing the listener who is not in the space in which the audio source originates, have directional perception, distance perception, and spatial perception.

[0003] Когда канальный сигнал, к примеру, 22.2-канальный сигнал, преобразуется посредством рендеринга в 5.1-канальный сигнал, трехмерное аудио может воспроизводиться посредством использования двумерного выходного канала; тем не менее, когда угол подъема входного канала отличается от стандартного угла подъема, если входной сигнал преобразуется посредством рендеринга посредством использования параметров рендеринга, определенных согласно стандартному углу подъема, искажение может возникать в звуковом изображении.[0003] When a channel signal such as a 22.2 channel signal is rendered into a 5.1 channel signal, 3D audio can be reproduced by using the 2D output channel; however, when the input channel elevation angle differs from the standard elevation angle, if the input signal is converted by rendering by using the rendering parameters determined according to the standard elevation angle, distortion may occur in the audio image.

Раскрытие изобретенияDisclosure of invention

Техническая задачаTechnical task

[0004] Как описано выше, когда многоканальный сигнал, к примеру, 22.2-канальный сигнал, преобразуется посредством рендеринга в 5.1-канальный сигнал, трехмерный объемный звук может воспроизводиться посредством использования двумерного выходного канала; тем не менее, когда угол подъема входного канала отличается от стандартного угла подъема, если входной сигнал преобразуется посредством рендеринга посредством использования параметров рендеринга, определенных согласно стандартному углу подъема, искажение может возникать в звуковом изображении.[0004] As described above, when a multi-channel signal such as a 22.2-channel signal is rendered into a 5.1-channel signal, 3D surround sound can be reproduced by using the 2D output channel; however, when the input channel elevation angle differs from the standard elevation angle, if the input signal is converted by rendering by using the rendering parameters determined according to the standard elevation angle, distortion may occur in the audio image.

[0005] Чтобы разрешать вышеуказанную проблему согласно предшествующему уровню техники, настоящее изобретение предоставляется для того, чтобы снижать искажение звукового изображения, даже если подъем входного канала выше или ниже стандартного подъема.[0005] In order to solve the above problem according to the prior art, the present invention is provided in order to reduce audio image distortion even if the input channel rise is higher or lower than the standard rise.

Техническое решениеTechnical solution

[0006] Чтобы достигать цели, настоящее изобретение включает в себя нижеприведенные варианты осуществления.[0006] To achieve the object, the present invention includes the following embodiments.

[0007] Согласно варианту осуществления настоящего изобретения, предусмотрен способ рендеринга аудиосигнала, причем способ включает в себя прием многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; добавление предварительно определенной задержки во фронтальный входной высотный канал, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема; модификацию, на основе добавленной задержки, параметров рендеринга подъема относительно фронтального входного высотного канала; и предотвращение путаницы передних/задних каналов посредством формирования, на основе модифицированных параметров рендеринга подъема, выходного канала объемного звучания после рендеринга подъема, задержанного относительно фронтального входного высотного канала.[0007] According to an embodiment of the present invention, an audio signal rendering method is provided, the method including: receiving a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; adding a predetermined delay to the front height input channel so as to allow the plurality of output channels to provide a raised audio image with a reference elevation angle; modifying, based on the added delay, the lift rendering parameters relative to the front height input channel; and preventing front/rear channel confusion by generating, based on the modified lift rendering parameters, a surround output channel after the lift rendering delayed with respect to the front height input channel.

[0008] Множество выходных каналов могут представлять собой горизонтальные каналы.[0008] The plurality of output channels may be horizontal channels.

[0009] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений и коэффициентов фильтрации подъема.[0009] The lifting rendering parameters may include at least one of panning gains and lifting filter coefficients.

[0010] Фронтальный входной высотный канал может включать в себя, по меньшей мере, один из CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045- и CH_U_000-каналов.[0010] The front height input channel may include at least one of CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045-, and CH_U_000 channels.

[0011] Выходной канал объемного звучания может включать в себя, по меньшей мере, один из CH_M_L110- и CH_M_R110-каналов.[0011] The surround output channel may include at least one of CH_M_L110 and CH_M_R110 channels.

[0012] Предварительно определенная задержка может определяться на основе частоты дискретизации.[0012] The predetermined delay may be determined based on the sampling rate.

[0013] Согласно другому варианту осуществления настоящего изобретения, предусмотрено устройство для рендеринга аудиосигнала, причем устройство включает в себя приемный модуль, выполненный с возможностью принимать многоканальный сигнал, включающий в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; модуль рендеринга, выполненный с возможностью добавлять предварительно определенную задержку во фронтальный входной высотный канал, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема, и модифицировать, на основе добавленной задержки, параметры рендеринга подъема относительно фронтального входного высотного канала; и модуль вывода, выполненный с возможностью предотвращать путаницу передних/задних каналов посредством формирования, на основе модифицированных параметров рендеринга подъема, выходного канала объемного звучания после рендеринга подъема, задержанного относительно фронтального входного высотного канала.[0013] According to another embodiment of the present invention, an apparatus for rendering an audio signal is provided, the apparatus including: a receiving module configured to receive a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; a rendering module configured to add a predetermined delay to the front height input channel so as to enable the plurality of output channels to provide a lifted sound image with a reference elevation angle, and modify, based on the added delay, the rise rendering parameters with respect to the front height input channel; and an output module configured to prevent front/rear channel confusion by generating, based on the modified lift rendering parameters, a surround output channel after the lift rendering delayed with respect to the front height input channel.

[0014] Множество выходных каналов могут представлять собой горизонтальные каналы.[0014] The plurality of output channels may be horizontal channels.

[0015] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений и коэффициентов фильтрации подъема.[0015] The lifting rendering parameters may include at least one of panning gains and lifting filter coefficients.

[0016] Фронтальный входной высотный канал может включать в себя, по меньшей мере, один из CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045- и CH_U_000-каналов.[0016] The front height input channel may include at least one of CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045-, and CH_U_000 channels.

[0017] Фронтальный высотный канал может включать в себя, по меньшей мере, один из CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045- и CH_U_000-каналов.[0017] The front height channel may include at least one of CH_U_L030-, CH_U_R030-, CH_U_L045-, CH_U_R045-, and CH_U_000 channels.

[0018] Предварительно определенная задержка может определяться на основе частоты дискретизации.[0018] The predetermined delay may be determined based on the sampling rate.

[0019] Согласно другому варианту осуществления настоящего изобретения, предусмотрен способ рендеринга аудиосигнала, причем способ включает в себя прием многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; получение параметров рендеринга подъема относительно входного высотного канала, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема; и обновление параметров рендеринга подъема относительно входного высотного канала, имеющего предварительно определенный угол подъема, а не опорный угол подъема, при этом обновление параметров рендеринга подъема включает в себя обновление панорамирующих усилений подъема для панорамирования входного высотного канала вверху спереди и по центру в выходной канал объемного звучания.[0019] According to another embodiment of the present invention, an audio signal rendering method is provided, the method including: receiving a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; obtaining elevation rendering parameters relative to the height input channel so as to allow the plurality of output channels to provide a lifted audio image with a reference elevation angle; and updating the lift rendering parameters relative to an input height channel having a predetermined elevation angle rather than a reference elevation angle, wherein updating the lift rendering parameters includes updating the panning lift gains to pan the height input channel top front and center into the surround output channel .

[0020] Множество выходных каналов могут представлять собой горизонтальные каналы.[0020] The plurality of output channels may be horizontal channels.

[0021] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений подъема и коэффициентов фильтрации подъема.[0021] The lifting rendering parameters may include at least one of lifting panning gains and lifting filter coefficients.

[0022] Обновление параметров рендеринга подъема может включать в себя обновление панорамирующих усилений подъема на основе опорного угла подъема и предварительно определенного угла подъема.[0022] Updating the lift rendering parameters may include updating the lift pan gains based on a reference lift angle and a predetermined lift angle.

[0023] Когда предварительно определенный угол подъема меньше опорного угла подъема, обновленные панорамирующие усиления подъема из числа обновленных панорамирующих усилений подъема, которые должны применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, могут превышать панорамирующие усиления подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0023] When the predetermined elevation angle is smaller than the reference elevation angle, the updated pan lift gains among the updated pan lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may exceed the pan lift gains before the update, and the total the sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0024] Когда предварительно определенный угол подъема превышает опорный угол подъема, обновленное панорамирующее усиление подъема из числа обновленных панорамирующих усилений подъема, которое должно применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, может быть меньше панорамирующих усилений подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0024] When the predetermined lift angle exceeds the reference lift angle, the updated pan lift gain of the updated pan lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined lift angle may be less than the pan lift gains before the update, and the total sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0025] Согласно другому варианту осуществления настоящего изобретения, предусмотрено устройство для рендеринга аудиосигнала, причем устройство включает в себя приемный модуль, выполненный с возможностью принимать многоканальный сигнал, включающий в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; и модуль рендеринга, выполненный с возможностью получать параметры рендеринга подъема относительно входного высотного канала, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема, и обновлять параметры рендеринга подъема относительно входного высотного канала, имеющего предварительно определенный угол подъема, а не опорный угол подъема, при этом обновленные параметры рендеринга подъема включают в себя панорамирующие усиления подъема для панорамирования входного высотного канала вверху спереди и по центру в выходной канал объемного звучания.[0025] According to another embodiment of the present invention, an apparatus for rendering an audio signal is provided, the apparatus including: a receiving module configured to receive a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; and a renderer configured to obtain lift rendering parameters with respect to an input height channel so as to enable the plurality of output channels to provide a lifted audio image with a reference pitch angle, and update the lift rendering parameters with respect to an input height channel having a predetermined pitch angle, and not a reference elevation angle, while the upgraded elevation rendering options include panning elevation gains to pan the height input channel top front and center into the surround output channel.

[0026] Множество выходных каналов могут представлять собой горизонтальные каналы.[0026] The plurality of output channels may be horizontal channels.

[0027] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений подъема и коэффициента фильтрации подъема.[0027] The lifting rendering parameters may include at least one of the lifting panning gain and the lifting filtering factor.

[0028] Обновленные параметры рендеринга подъема могут включать в себя панорамирующие усиления подъема, обновленные на основе опорного угла подъема и предварительно определенного угла подъема.[0028] The updated lift rendering parameters may include panning lift gains updated based on a reference lift angle and a predetermined lift angle.

[0029] Когда предварительно определенный угол подъема меньше опорного угла подъема, обновленные панорамирующие усиления подъема из числа обновленных панорамирующих усилений подъема, которые должны применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, могут превышать панорамирующие усиления подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0029] When the predetermined elevation angle is smaller than the reference elevation angle, the updated pan-lift gains among the updated pan-lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may exceed the pan-lift gains before the update, and the total the sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0030] Когда предварительно определенный угол подъема превышает опорный угол подъема, обновленные панорамирующие усиления подъема из числа обновленных панорамирующих усилений подъема, которые должны применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, могут быть меньше панорамирующих усилений подъема, которые не обновляются, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0030] When the predetermined elevation angle exceeds the reference elevation angle, the updated pan elevation gains among the updated pan elevation gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may be smaller than the pan elevation gains that are not updated , and the total sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0031] Согласно другому варианту осуществления настоящего изобретения, предусмотрен способ рендеринга аудиосигнала, причем способ включает в себя прием многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; получение параметров рендеринга подъема относительно входного высотного канала, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема; и обновление параметров рендеринга подъема относительно входного высотного канала, имеющего предварительно определенный угол подъема, а не опорный угол подъема, при этом обновление параметров рендеринга подъема включает в себя получение панорамирующих усилений подъема, обновленных относительно частотного диапазона, включающего в себя полосу низких частот, на основе местоположения входного высотного канала.[0031] According to another embodiment of the present invention, an audio signal rendering method is provided, the method including: receiving a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; obtaining elevation rendering parameters relative to the height input channel so as to allow the plurality of output channels to provide a lifted audio image with a reference elevation angle; and updating lift rendering parameters with respect to an input height channel having a predetermined elevation angle rather than a reference elevation angle, wherein updating the lift rendering parameters includes obtaining pan lift gains updated with respect to a frequency band including a low band based on location of the input height channel.

[0032] Обновленные панорамирующие усиления подъема могут представлять собой панорамирующие усиления относительно заднего входного высотного канала.[0032] The updated lift pan gains may be pan gains relative to the rear height input channel.

[0033] Множество выходных каналов могут представлять собой горизонтальные каналы.[0033] The plurality of output channels may be horizontal channels.

[0034] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений подъема и коэффициентов фильтрации подъема.[0034] The lifting rendering parameters may include at least one of lifting panning gains and lifting filter coefficients.

[0035] Обновление параметров рендеринга подъема может включать в себя применение весового коэффициента к коэффициентам фильтрации подъема на основе опорного угла подъема и предварительно определенного угла подъема.[0035] Updating the lift rendering parameters may include applying a weight to the lift filter coefficients based on a reference lift angle and a predetermined lift angle.

[0036] Когда предварительно определенный угол подъема меньше опорного угла подъема, весовой коэффициент может определяться таким образом, что характеристика фильтрации подъема может демонстрироваться плавно, а когда предварительно определенный угол подъема превышает опорный угол подъема, весовой коэффициент может определяться таким образом, что характеристика фильтрации подъема может демонстрироваться резко.[0036] When the predetermined elevation angle is smaller than the reference elevation angle, the weighting factor may be determined such that the elevation filtering performance can be smoothly exhibited, and when the predetermined elevation angle exceeds the reference elevation angle, the weighting factor may be determined such that the elevation filtering performance may appear abruptly.

[0037] Обновление параметров рендеринга подъема может включать в себя обновление панорамирующих усилений подъема на основе опорного угла подъема и предварительно определенного угла подъема.[0037] Updating the lift rendering parameters may include updating the lift pan gains based on a reference lift angle and a predetermined lift angle.

[0038] Когда предварительно определенный угол подъема меньше опорного угла подъема, обновленное панорамирующее усиление подъема из числа обновленных панорамирующих усилений подъема, которое должно применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, может превышать панорамирующие усиления подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0038] When the predetermined elevation angle is smaller than the reference elevation angle, the updated pan lift gain among the updated pan lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may exceed the pan lift gains before the update, and the total the sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0039] Когда предварительно определенный угол подъема превышает опорный угол подъема, обновленное панорамирующее усиление подъема из числа обновленных панорамирующих усилений подъема, которое должно применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, может быть меньше панорамирующих усилений подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0039] When the predetermined lift angle exceeds the reference lift angle, the updated pan lift gain of the updated pan lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined lift angle may be less than the pan lift gains before the update, and the total sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0040] Согласно другому варианту осуществления настоящего изобретения, предусмотрено устройство для рендеринга аудиосигнала, причем устройство включает в себя приемный модуль, выполненный с возможностью принимать многоканальный сигнал, включающий в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; и модуль рендеринга, выполненный с возможностью получать параметры рендеринга подъема относительно входного высотного канала, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема, и обновлять параметры рендеринга подъема относительно входного высотного канала, имеющего предварительно определенный угол подъема, а не опорный угол подъема, при этом обновленные параметры рендеринга подъема включают в себя панорамирующие усиления подъема, обновленные относительно частотного диапазона, включающего в себя полосу низких частот, на основе местоположения входного высотного канала.[0040] According to another embodiment of the present invention, an apparatus for rendering an audio signal is provided, the apparatus including: a receiving module configured to receive a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; and a renderer configured to obtain lift rendering parameters with respect to an input height channel so as to enable the plurality of output channels to provide a lifted audio image with a reference pitch angle, and update the lift rendering parameters with respect to an input height channel having a predetermined pitch angle, and not a reference elevation angle, wherein the updated elevation rendering parameters include panning elevation gains updated with respect to the frequency range including the low band based on the height input channel location.

[0041] Обновленные панорамирующие усиления подъема могут представлять собой панорамирующие усиления относительно заднего входного высотного канала.[0041] The updated lift pan gains may be pan gains relative to the rear height input channel.

[0042] Множество выходных каналов могут представлять собой горизонтальные каналы.[0042] The plurality of output channels may be horizontal channels.

[0043] Параметры рендеринга подъема могут включать в себя, по меньшей мере, одно из панорамирующих усилений подъема и коэффициентов фильтрации подъема.[0043] The lifting rendering parameters may include at least one of lifting panning gains and lifting filter coefficients.

[0044] Обновленные параметры рендеринга подъема могут включать в себя коэффициенты фильтрации подъема, к которым применяется весовой коэффициент, на основе опорного угла подъема и предварительно определенного угла подъема.[0044] The updated lift rendering parameters may include lift filter coefficients to which a weighting factor is applied based on a reference lift angle and a predetermined lift angle.

[0045] Когда предварительно определенный угол подъема меньше опорного угла подъема, весовой коэффициент может определяться таким образом, что характеристика фильтрации подъема может демонстрироваться плавно, а когда предварительно определенный угол подъема превышает опорный угол подъема, весовой коэффициент может определяться таким образом, что характеристика фильтрации подъема может демонстрироваться резко.[0045] When the predetermined elevation angle is smaller than the reference elevation angle, the weighting factor may be determined such that the elevation filtering performance can be smoothly exhibited, and when the predetermined elevation angle exceeds the reference elevation angle, the weighting factor may be determined such that the elevation filtering performance may appear abruptly.

[0046] Обновленные параметры рендеринга подъема могут включать в себя панорамирующие усиления подъема, обновленные на основе опорного угла подъема и предварительно определенного угла подъема.[0046] The updated lift rendering parameters may include panning lift gains updated based on a reference lift angle and a predetermined lift angle.

[0047] Когда предварительно определенный угол подъема меньше опорного угла подъема, обновленные панорамирующие усиления подъема из числа обновленных панорамирующих усилений подъема, которые должны применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, могут превышать панорамирующие усиления подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0047] When the predetermined elevation angle is smaller than the reference elevation angle, the updated pan lift gains among the updated pan lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may exceed the pan lift gains before the update, and the total the sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0048] Когда предварительно определенный угол подъема превышает опорный угол подъема, обновленные панорамирующие усиления подъема из множества обновленных панорамирующих усилений подъема, которые должны применяться к ипсилатеральному выходному каналу выходного канала, имеющего предварительно определенный угол подъема, могут быть меньше панорамирующих усилений подъема до обновления, и общая сумма квадратов обновленных панорамирующих усилений подъема, которые должны, соответственно, применяться ко множеству входных каналов, может составлять 1.[0048] When the predetermined elevation angle exceeds the reference elevation angle, the updated pan-lift gains of the plurality of updated pan-lift gains to be applied to the ipsilateral output channel of the output channel having the predetermined elevation angle may be less than the pan-lift gains before the update, and the total sum of the squares of the updated pan lift gains to be applied to multiple input channels, respectively, may be 1.

[0049] Согласно другому варианту осуществления настоящего изобретения, предусмотрена программа для осуществления вышеуказанных способов и машиночитаемый носитель записи, на котором записана компьютерная программа.[0049] According to another embodiment of the present invention, there is provided a program for carrying out the above methods, and a computer-readable recording medium on which the computer program is recorded.

[0050] Помимо этого, предусмотрены другой способ, другая система и машиночитаемый носитель записи, на котором записана компьютерная программа для осуществления способа.[0050] In addition, another method, another system, and a computer-readable recording medium on which a computer program for carrying out the method is recorded are provided.

Преимущества изобретенияBenefits of the Invention

[0051] Согласно настоящему изобретению, трехмерный аудиосигнал может преобразовываться посредством рендеринга таким образом, что искажение звукового изображения снижается, даже если подъем входного канала выше или ниже стандартного подъема. Помимо этого, согласно настоящему изобретению, может предотвращаться явление путаницы передних/задних каналов вследствие выходных каналов объемного звучания.[0051] According to the present invention, a 3D audio signal can be converted by rendering such that audio image distortion is reduced even if the input channel boost is higher or lower than the standard boost. In addition, according to the present invention, the phenomenon of front/rear channel confusion due to surround output channels can be prevented.

Краткое описание чертежейBrief description of the drawings

[0052] Фиг. 1 является блок-схемой, иллюстрирующей внутреннюю структуру устройства воспроизведения трехмерного аудио согласно варианту осуществления.[0052] FIG. 1 is a block diagram illustrating the internal structure of a 3D audio playback device according to the embodiment.

[0053] Фиг. 2 является блок-схемой, иллюстрирующей конфигурацию модуля рендеринга в устройстве воспроизведения трехмерного аудио, согласно варианту осуществления.[0053] FIG. 2 is a block diagram illustrating the configuration of a rendering unit in a 3D audio playback device according to an embodiment.

[0054] Фиг. 3 иллюстрирует схему размещения каналов, когда множество входных каналов низводится во множество выходных каналов, согласно варианту осуществления.[0054] FIG. 3 illustrates a channel layout when a plurality of input channels is downmixed into a plurality of output channels, according to an embodiment.

[0055] Фиг. 4 иллюстрирует модуль панорамирования в примере, в котором возникает позиционное отклонение между стандартной схемой размещения и компоновочной схемой размещения выходных каналов, согласно варианту осуществления.[0055] FIG. 4 illustrates a panning module in an example in which a positional deviation occurs between a standard layout and an output channel layout according to an embodiment.

[0056] Фиг. 5 является блок-схемой, иллюстрирующей конфигурации декодера и модуля рендеринга трехмерного аудио в устройстве воспроизведения трехмерного аудио, согласно варианту осуществления.[0056] FIG. 5 is a block diagram illustrating the configurations of a decoder and a 3D audio rendering unit in a 3D audio playback apparatus according to an embodiment.

[0057] Фиг. 6-8 иллюстрируют схемы размещения каналов верхнего уровня согласно подъемам верхних уровней в схеме размещения каналов, согласно варианту осуществления.[0057] FIG. 6-8 illustrate upper layer channel layouts according to upper layer lifts in a channel layout according to an embodiment.

[0058] Фиг. 9-11 иллюстрируют варьирование звукового изображения и варьирование фильтра подъема, согласно подъемам канала, согласно варианту осуществления.[0058] FIG. 9-11 illustrate audio image variation and lift filter variation according to channel lifts, according to an embodiment.

[0059] Фиг. 12 является блок-схемой последовательности операций, иллюстрирующей способ рендеринга трехмерного аудиосигнала, согласно варианту осуществления.[0059] FIG. 12 is a flowchart illustrating a 3D audio signal rendering method according to an embodiment.

[0060] Фиг. 13 иллюстрирует явление, при котором левое и правое звуковые изображения переставляются, когда угол подъема входного канала равен или выше порогового значения, согласно варианту осуществления.[0060] FIG. 13 illustrates a phenomenon in which the left and right sound images are swapped when the elevation angle of an input channel is equal to or higher than a threshold value, according to an embodiment.

[0061] Фиг. 14 иллюстрирует горизонтальные каналы и фронтальные высотные каналы, согласно варианту осуществления.[0061] FIG. 14 illustrates horizontal channels and front height channels, according to an embodiment.

[0062] Фиг. 15 иллюстрирует процентную долю восприятия фронтальных высотных каналов, согласно варианту осуществления.[0062] FIG. 15 illustrates the perception percentage of the front height channels, according to an embodiment.

[0063] Фиг. 16 является блок-схемой последовательности операций способа предотвращения путаницы передних/задних каналов, согласно варианту осуществления.[0063] FIG. 16 is a flowchart of a method for preventing front/rear channel confusion, according to an embodiment.

[0064] Фиг. 17 иллюстрирует горизонтальные каналы и фронтальные высотные каналы, когда задержка добавляется в выходные каналы объемного звучания, согласно варианту осуществления.[0064] FIG. 17 illustrates the horizontal channels and front height channels when a delay is added to the surround output channels, according to an embodiment.

[0065] Фиг. 18 иллюстрирует горизонтальный канал и верхний передний центральный (TFC) канал, согласно варианту осуществления.[0065] FIG. 18 illustrates a horizontal channel and a top front center (TFC) channel, according to an embodiment.

Осуществление изобретенияImplementation of the invention

[0066] Чтобы достигать цели, настоящее изобретение включает в себя нижеприведенные варианты осуществления.[0066] To achieve the object, the present invention includes the following embodiments.

[0067] Согласно варианту осуществления, предусмотрен способ рендеринга аудиосигнала, причем способ включает в себя прием многоканального сигнала, включающего в себя множество входных каналов, которые должны преобразовываться во множество выходных каналов; добавление предварительно определенной задержки во фронтальный входной высотный канал, с тем чтобы обеспечивать возможность множеству выходных каналов предоставлять приподнятое звуковое изображение с опорным углом подъема; модификацию, на основе добавленной задержки, параметров рендеринга подъема относительно фронтального входного высотного канала; и предотвращение путаницы передних/задних каналов посредством формирования, на основе модифицированных параметров рендеринга подъема, выходного канала объемного звучания после рендеринга подъема, задержанного относительно фронтального входного высотного канала.[0067] According to an embodiment, an audio signal rendering method is provided, the method including: receiving a multi-channel signal including a plurality of input channels to be converted to a plurality of output channels; adding a predetermined delay to the front height input channel so as to allow the plurality of output channels to provide a raised audio image with a reference elevation angle; modifying, based on the added delay, the lift rendering parameters relative to the front height input channel; and preventing front/rear channel confusion by generating, based on the modified lift rendering parameters, a surround output channel after the lift rendering delayed with respect to the front height input channel.

Оптимальный режим осуществления изобретенияOptimal Mode for Carrying Out the Invention

[0068] Подробное описание изобретения связано с прилагаемыми чертежами, иллюстрирующими конкретные варианты осуществления изобретения. Эти варианты осуществления предоставляются таким образом, что данное раскрытие сущности являются исчерпывающим и всеобъемлющим и полностью передает принцип изобретения для специалистов в данной области техники. Следует понимать, что различные варианты осуществления изобретения отличаются друг от друга и не являются исключительными относительно друг друга.[0068] A detailed description of the invention is associated with the accompanying drawings illustrating specific embodiments of the invention. These embodiments are provided such that this disclosure is exhaustive and comprehensive and fully conveys the principle of the invention to those skilled in the art. It should be understood that the various embodiments of the invention differ from each other and are not exclusive to each other.

[0069] Например, конкретная форма, конкретная структура и конкретный признак, приведенные в описании изобретения, могут изменяться в зависимости от варианта осуществления без отступления от сущности и объема изобретения. Кроме того, следует понимать, что позиция или схема размещения каждого элемента в каждом варианте осуществления может изменяться без отступления от сущности и объема изобретения. Следовательно, подробное описание должно рассматриваться только в описательном смысле, а не в целях ограничения, и объем изобретения задается не посредством подробного описания изобретения, а посредством прилагаемой формулы изобретения, и все различия в пределах объема должны истолковываться как включенные в настоящее изобретение.[0069] For example, the specific shape, specific structure, and specific feature described in the specification may vary depending on the embodiment without departing from the spirit and scope of the invention. In addition, it should be understood that the position or layout of each element in each embodiment may be changed without departing from the essence and scope of the invention. Therefore, the detailed description is to be considered in a descriptive sense only and not for purposes of limitation, and the scope of the invention is not defined by the detailed description of the invention, but by the appended claims, and all differences within the scope are to be construed as being included in the present invention.

[0070] Аналогичные ссылки с номерами на чертежах обозначают аналогичные или похожие элементы во всем подробном описании. В нижеприведенном описании и на прилагаемых чертежах, известные функции или конструкции не описываются подробно, поскольку они затрудняют понимание настоящего изобретения в силу необязательных подробностей. Кроме того, аналогичные ссылки с номерами на чертежах обозначают аналогичные или похожие элементы во всем подробном описании.[0070] Like reference numerals throughout the drawings refer to like or like elements throughout the detailed description. In the description below and in the accompanying drawings, known functions or constructions are not described in detail because they make it difficult to understand the present invention due to unnecessary details. In addition, like reference numerals throughout the drawings refer to like or like elements throughout the detailed description.

[0071] В дальнейшем в этом документе, настоящее изобретение подробно описывается посредством пояснения примерных вариантов осуществления изобретения со ссылкой на прилагаемые чертежи. Тем не менее, изобретение может быть реализовано во многих различных формах и не должно истолковываться как ограниченное вариантами осуществления, изложенными в данном документе; наоборот, эти варианты осуществления предоставлены таким образом, что это изобретение является исчерпывающим и всеобъемлющим и полностью передает идею изобретения специалистам в данной области техники.[0071] Hereinafter in this document, the present invention is described in detail by explaining exemplary embodiments of the invention with reference to the accompanying drawings. However, the invention may be embodied in many different forms and should not be construed as being limited to the embodiments set forth herein; rather, these embodiments are provided in such a way that this invention is exhaustive and comprehensive and fully conveys the idea of the invention to those skilled in the art.

[0072] Во всем подробном описании, когда элемент упоминается как "соединенный (connected)" или "спаренный (coupled)" с другим элементом, он может быть "непосредственно соединен (connected) или спарен (coupled)" с другим элементом, либо он может быть "электрически соединен (connected) или спарен (coupled)" с другим элементом в силу наличия промежуточного элемента, размещенного между ними. Кроме того, когда часть "включает в себя" или "содержит" элемент, если отсутствует конкретное описание, отличное от означенного, часть дополнительно может включать в себя другие элементы, без исключения других элементов.[0072] Throughout the detailed description, when an element is referred to as "connected" or "coupled" with another element, it may be "directly connected (connected) or coupled (coupled)" with another element, or it may be "electrically connected (connected) or paired (coupled)" with another element due to the presence of an intermediate element placed between them. In addition, when a part "includes" or "comprises" an element, if there is no specific description other than that indicated, the part may further include other elements without excluding other elements.

[0073] Далее описываются примерные варианты осуществления настоящего изобретения со ссылками на прилагаемые чертежи.[0073] The following describes exemplary embodiments of the present invention with reference to the accompanying drawings.

[0074] Фиг. 1 является блок-схемой, иллюстрирующей внутреннюю структуру устройства воспроизведения трехмерного аудио согласно варианту осуществления.[0074] FIG. 1 is a block diagram illustrating the internal structure of a 3D audio playback device according to the embodiment.

[0075] Устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления может выводить многоканальный аудиосигнал, в котором множество входных каналов сводятся во множество выходных каналов для воспроизведения. Здесь, если число выходных каналов меньше числа входных каналов, входные каналы низводятся, чтобы соответствовать числу выходных каналов.[0075] The 3D audio playback apparatus 100 according to the embodiment can output a multi-channel audio signal in which a plurality of input channels are downmixed to a plurality of output channels for playback. Here, if the number of output channels is less than the number of input channels, the input channels are downmixed to match the number of output channels.

[0076] Трехмерное аудио означает аудио, которое обеспечивает возможность слушателю иметь ощущение погружения посредством воспроизведения не только подъема аудио и оттенка, но также и воспроизведения направления или расстояния, и в которое добавляется пространственная информация, при этом пространственная информация заставляет слушателя, который не находится в пространстве, в котором возникает аудиоисточник, иметь направленное восприятие, восприятие расстояния и пространственное восприятие.[0076] Three-dimensional audio means audio that allows the listener to have an immersive feeling by reproducing not only audio elevation and hue, but also reproducing direction or distance, and to which spatial information is added, the spatial information causing the listener who is not in the space in which the audio source originates, have directional perception, distance perception, and spatial perception.

[0077] В нижеприведенном описании, выходные каналы аудиосигнала могут означать число динамиков, через которые выводится аудио. Чем выше число выходных каналов, тем выше число динамиков, через которые выводится аудио. Устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления может преобразовывать посредством рендеринга и сводить многоканальный аудиосигнал в выходной канал для воспроизведения, так что многоканальный аудиосигнал, имеющий большое число входных каналов, может выводиться и воспроизводиться в окружении, в котором число выходных каналов является небольшим. В этом отношении, многоканальный аудиосигнал может включать в себя канал, допускающий вывод приподнятого звука.[0077] In the description below, audio output channels may refer to the number of speakers through which audio is output. The higher the number of output channels, the higher the number of speakers through which audio is output. The 3D audio playback apparatus 100 according to the embodiment can render and downmix a multi-channel audio signal into an output channel for playback, so that a multi-channel audio signal having a large number of input channels can be output and reproduced in an environment in which the number of output channels is small. In this regard, the multi-channel audio signal may include a channel capable of outputting a raised sound.

[0078] Канал, допускающий вывод приподнятого звука, может указывать канал, допускающий вывод аудиосигнала через динамик, позиционированный над головой слушателя, с тем чтобы заставлять слушателя ощущать себя приподнятым. Горизонтальный канал может указывать канал, допускающий вывод аудиосигнала через динамик, позиционированный на горизонтальной плоскости относительно слушателя.[0078] A channel capable of outputting elevated sound may indicate a channel capable of outputting an audio signal from a speaker positioned above a listener's head so as to make the listener feel elevated. The horizontal channel may indicate a channel capable of outputting an audio signal from a speaker positioned on a horizontal plane relative to the listener.

[0079] Вышеуказанное окружение, в котором число выходных каналов является небольшим, может указывать окружение, которое не включает в себя выходной канал, допускающий вывод приподнятого звука, и в котором аудио может выводиться через динамик, размещаемый на горизонтальной плоскости.[0079] The above environment in which the number of output channels is small may indicate an environment that does not include an output channel capable of outputting elevated sound, and in which audio can be output from a speaker placed on a horizontal plane.

[0080] Кроме того, в нижеприведенном описании, горизонтальный канал может указывать канал, включающий в себя аудиосигнал, который должен выводиться через динамик, позиционированный на горизонтальной плоскости. Надголовный канал может указывать канал, включающий в себя аудиосигнал, который должен выводиться через динамик, который не позиционируется на горизонтальной плоскости, а позиционируется на приподнятой плоскости, с тем чтобы выводить приподнятый звук.[0080] In addition, in the description below, a horizontal channel may indicate a channel including an audio signal to be output from a speaker positioned on a horizontal plane. The overhead channel may indicate a channel including an audio signal to be output from a speaker that is not positioned on a horizontal plane but is positioned on a raised plane so as to output a raised sound.

[0081] Ссылаясь на фиг. 1, устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления может включать в себя аудиоядро 110, модуль 120 рендеринга, микшер 130 и модуль 140 постобработки.[0081] Referring to FIG. 1, the 3D audio playback device 100 according to the embodiment may include an audio core 110, a renderer 120, a mixer 130, and a post-processing module 140.

[0082] Согласно варианту осуществления, устройство 100 воспроизведения трехмерного аудио может выводить, может преобразовывать посредством рендеринга, сводить и выводить многоканальный входной аудиосигнал в выходной канал для воспроизведения. Например, многоканальный входной аудиосигнал может представлять собой 22.2-канальный сигнал, и выходной канал для воспроизведения может представлять собой 5.1 или 7.1 каналов. Устройство 100 воспроизведения трехмерного аудио может выполнять рендеринг посредством задания выходных каналов, которые, соответственно, должны преобразовываться в каналы многоканального входного аудиосигнала, и может сводить преобразованные посредством рендеринга аудиосигналы посредством сведения сигналов каналов, соответственно, преобразованных в каналы для воспроизведения, и вывода конечного сигнала.[0082] According to an embodiment, the 3D audio playback apparatus 100 can output, can convert by rendering, downmix and output the multi-channel input audio signal to an output channel for playback. For example, a multi-channel input audio signal may be 22.2 channels, and an output channel for playback may be 5.1 or 7.1 channels. The 3D audio playback apparatus 100 can perform rendering by specifying output channels to be respectively converted to channels of the multi-channel input audio signal, and can downmix the rendered audio signals by downmixing the signals of the channels respectively converted to channels for playback and outputting the final signal.

[0083] Кодированный аудиосигнал вводится в форме потока битов в аудиоядро 110, и аудиоядро 110 выбирает декодер, подходящий для формата кодированного аудиосигнала, и декодирует входной аудиосигнал.[0083] The encoded audio signal is input in the form of a bit stream to the audio core 110, and the audio core 110 selects a decoder suitable for the format of the encoded audio signal and decodes the input audio signal.

[0084] Модуль 120 рендеринга может преобразовывать посредством рендеринга многоканальный входной аудиосигнал в многоканальные выходные каналы согласно каналам и частотам. Модуль 120 рендеринга может выполнять трехмерный рендеринг и двумерный рендеринг для каждого из сигналов согласно надголовным каналам и горизонтальным каналам. Ниже подробно описывается конфигурация модуля рендеринга и способа рендеринга со ссылкой на фиг. 2.[0084] The rendering module 120 may convert, by rendering, a multi-channel input audio signal into multi-channel output channels according to channels and frequencies. The rendering module 120 may perform 3D rendering and 2D rendering for each of the signals according to the overhead channels and the horizontal channels. The configuration of the rendering unit and the rendering method will be described in detail below with reference to FIG. 2.

[0085] Микшер 130 может сводить сигналы каналов, соответственно, преобразованных в горизонтальные каналы, посредством модуля 120 рендеринга, и может выводить конечный сигнал. Микшер 130 может сводить сигналы каналов согласно каждому из предварительно определенных периодов. Например, микшер 130 может сводить сигналы каждого из каналов согласно одному кадру.[0085] The mixer 130 may downmix the signals of the channels respectively converted to horizontal channels by the rendering unit 120 and may output the final signal. The mixer 130 may downmix the channel signals according to each of the predetermined periods. For example, mixer 130 may downmix each of the channels according to one frame.

[0086] Микшер 130 согласно варианту осуществления может выполнять сведение на основе значения мощности сигналов, соответственно, преобразованных посредством рендеринга в каналы для воспроизведения. Другими словами, микшер 130 может определять амплитуду конечного сигнала или усиления, которое должно применяться к конечному сигналу, на основе значения мощности сигналов, соответственно, преобразованных посредством рендеринга в каналы для воспроизведения.[0086] The mixer 130 according to the embodiment can perform downmix based on the power value of the signals respectively rendered into channels for playback. In other words, the mixer 130 may determine the amplitude of the final signal or gain to be applied to the final signal based on the power value of the signals, respectively, rendered into channels for playback.

[0087] Модуль 140 постобработки выполняет управление динамическим диапазоном относительно многополосного сигнала и бинаурализацию для выходного сигнала из микшера 130, согласно каждому устройству воспроизведения (динамику, наушнику и т.д.). Выходной аудиосигнал, выводимый из модуля 140 постобработки, может выводиться через такое устройство, как динамик, и может воспроизводиться двумерным или трехмерным способом после обработки каждого конфигурационного элемента.[0087] The post-processing module 140 performs dynamic range control on the multiband signal and binauralization for the output signal from the mixer 130 according to each playback device (speaker, headphone, etc.). The output audio signal output from the post-processing unit 140 may be output through a device such as a speaker, and may be reproduced in a two-dimensional or three-dimensional manner after processing each configuration item.

[0088] Устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления, показанному на фиг. 1, показано относительно конфигурации его аудиодекодера, и дополнительная конфигурация пропускается.[0088] The 3D audio playback device 100 according to the embodiment shown in FIG. 1 is shown with respect to the configuration of its audio decoder, and the additional configuration is omitted.

[0089] Фиг. 2 является блок-схемой, иллюстрирующей конфигурацию модуля рендеринга в устройстве воспроизведения трехмерного аудио, согласно варианту осуществления.[0089] FIG. 2 is a block diagram illustrating the configuration of a rendering unit in a 3D audio playback device according to an embodiment.

[0090] Модуль 120 рендеринга включает в себя модуль 121 фильтрации и модуль 123 панорамирования.[0090] The rendering module 120 includes a filtering module 121 and a panning module 123.

[0091] Модуль 121 фильтрации может компенсировать оттенок и т.п. декодированного аудиосигнала согласно местоположению и может фильтровать входной аудиосигнал посредством использования фильтра на основе передаточной функции восприятия звука человеком (HRTF).[0091] The filter unit 121 can compensate for tint and the like. of the decoded audio signal according to the location, and can filter the input audio signal by using a filter based on the human audio perception transfer function (HRTF).

[0092] Чтобы выполнять трехмерный рендеринг для надголовного канала, модуль 121 фильтрации может преобразовывать посредством рендеринга надголовный канал, который проходит через HRTF-фильтр, посредством использования различных способов согласно частотам.[0092] In order to perform 3D rendering for the overhead channel, the filter module 121 may render transform the overhead channel that passes through the HRTF filter by using different methods according to frequencies.

[0093] HRTF-фильтр обеспечивает распознаваемость трехмерного аудио согласно явлению, в котором не только простая разность в тракте, к примеру, интерауральные разности уровней (ILD) между обоими ушами, интерауральные разности времен (ITD) между обоими ушами относительно времени поступления аудио и т.п., но также и усложненные свойства тракта, к примеру, дифракция на поверхности головы, отражение вследствие ушной раковины и т.п., изменяются согласно направлению, в которое поступает аудио. HRTF-фильтр может обрабатывать аудиосигналы, включенные в надголовный канал, посредством изменения качества звука аудиосигнала, с тем чтобы обеспечивать распознаваемость трехмерного аудио.[0093] The HRTF filter provides 3D audio recognition according to a phenomenon in which not only a simple path difference, such as interaural level differences (ILD) between both ears, interaural time differences (ITD) between both ears with respect to audio arrival time, etc. .etc., but also the complicated properties of the path, such as diffraction at the surface of the head, reflection due to the auricle, etc., change according to the direction in which the audio arrives. The HRTF filter can process the audio signals included in the overhead channel by changing the sound quality of the audio signal so as to provide 3D audio recognizability.

[0094] Модуль 123 панорамирования получает коэффициент панорамирования, который должен применяться к каждой из полос частот и каждому из каналов, и применяет коэффициент панорамирования, с тем чтобы панорамировать входной аудиосигнал относительно каждого из выходных каналов. Выполнение панорамирования для аудиосигнала означает управление абсолютной величиной сигнала, применяемого к каждому выходному каналу, с тем чтобы преобразовывать посредством рендеринга аудиоисточник в конкретном местоположении между двумя выходными каналами. Коэффициент панорамирования может упоминаться в качестве панорамирующего усиления.[0094] The panning unit 123 obtains a panning factor to be applied to each of the frequency bands and each of the channels, and applies the panning factor so as to pan the input audio signal with respect to each of the output channels. Performing panning for an audio signal means controlling the absolute amount of the signal applied to each output channel so as to render the audio source at a particular location between two output channels. The pan factor may be referred to as pan gain.

[0095] Модуль 123 панорамирования может выполнять рендеринг для низкочастотного сигнала из числа сигналов надголовного канала посредством использования способа добавления в ближайший канал и может выполнять рендеринг для высокочастотного сигнала посредством использования способа многоканального панорамирования. Согласно способу многоканального панорамирования, значение усиления, которое задается таким образом, что оно отличается в каналах, которые должны преобразовываться посредством рендеринга в каждый из канальных сигналов, применяется к сигналам каждого из каналов многоканального аудиосигнала, так что каждый из сигналов может преобразовываться посредством рендеринга, по меньшей мере, в один горизонтальный канал. Сигналы каждого канала, к которому применяется значение усиления, могут быть синтезированы через сведение и могут выводиться в качестве конечного сигнала.[0095] The panning unit 123 may render for a low frequency signal among the overhead channel signals by using the nearest channel addition method, and may perform rendering for a high frequency signal by using the multi-channel panning method. According to the multi-channel panning method, a gain value that is set such that it is different in the channels to be rendered converted to each of the channel signals is applied to the signals of each of the channels of the multi-channel audio signal, so that each of the signals can be rendered converted by at least one horizontal channel. The signals of each channel to which the gain value is applied can be synthesized through the downmix and can be output as the final signal.

[0096] Низкочастотные сигналы являются высокодифракционными, даже если каналы многоканального аудиосигнала не разделяются и преобразуются посредством рендеринга в несколько каналов согласно способу многоканального панорамирования, но преобразуются посредством рендеринга только в один канал, низкочастотные сигналы могут иметь качество звука, которое аналогично распознается слушателем. Следовательно, устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления может преобразовывать посредством рендеринга низкочастотные сигналы посредством использования способа добавления в ближайший канал и за счет этого может предотвращать ухудшение качества звука, которое может возникать, когда несколько каналов сводятся в один выходной канал. Иными словами, когда несколько каналов сводятся в один выходной канал, качество звука может усиливаться или снижаться вследствие помех между канальными сигналами и в силу этого может ухудшаться, и в этом отношении, ухудшение качества звука может предотвращаться посредством сведения одного канала в один выходной канал.[0096] The low frequency signals are highly diffractive, even if the channels of the multi-channel audio signal are not separated and rendered into multiple channels according to the multi-channel panning method, but rendered into only one channel, the low frequency signals can have a sound quality that is similarly recognized by the listener. Therefore, the 3D audio playback apparatus 100 according to the embodiment can render low frequency signals by using the nearest channel addition method, and thereby can prevent deterioration in audio quality that may occur when multiple channels are downmixed to one output channel. In other words, when multiple channels are downmixed into one output channel, audio quality may be enhanced or decreased due to interference between channel signals, and therefore may be degraded, and in this regard, deterioration in audio quality can be prevented by downmixing one channel into one output channel.

[0097] Согласно способу добавления в ближайший канал, каналы многоканального аудиосигнала могут не преобразовываться посредством рендеринга в несколько каналов, а могут преобразовываться посредством рендеринга в ближайший канал из числа каналов для воспроизведения.[0097] According to the method of adding to the nearest channel, the channels of the multi-channel audio signal may not be rendered to multiple channels, but may be rendered to the closest channel among the playback channels.

[0098] Помимо этого, устройство 100 воспроизведения трехмерного аудио может расширять зону наилучшего восприятия без ухудшения качества звука посредством выполнения рендеринга посредством использования различных способов согласно частотам. Иными словами, низкочастотные сигналы, которые являются высокодифракционными, преобразуются посредством рендеринга согласно способу добавления в ближайший канал, так что может предотвращаться ухудшение качества звука, возникающее, когда несколько каналов сводятся в один выходной канал. Зона наилучшего восприятия означает предварительно определенный диапазон, в котором слушатель может оптимально прослушивать трехмерное аудио без искажения.[0098] In addition, the 3D audio playback device 100 can expand the sweet spot without degrading sound quality by performing rendering by using different methods according to frequencies. In other words, low frequency signals that are highly diffractive are converted by rendering according to the nearest channel addition method, so that audio quality deterioration occurring when multiple channels are downmixed into one output channel can be prevented. The sweet spot means a predetermined range in which the listener can optimally enjoy 3D audio without distortion.

[0099] Когда зона наилучшего восприятия является большой, слушатель может оптимально прослушивать трехмерное аудио без искажения в большом диапазоне, а когда слушатель не находится в зоне наилучшего восприятия, слушатель может прослушивать аудио, в котором искажается качество звука или звуковое изображение.[0099] When the sweet spot is large, the listener can optimally listen to 3D audio without distortion over a wide range, and when the listener is not in the sweet spot, the listener can listen to audio in which the sound quality or sound image is distorted.

[00100] Фиг. 3 иллюстрирует схему размещения каналов, когда множество входных каналов низводится во множество выходных каналов, согласно варианту осуществления.[00100] FIG. 3 illustrates a channel layout when a plurality of input channels is downmixed into a plurality of output channels, according to an embodiment.

[00101] Разрабатывается технология для того, чтобы предоставлять трехмерное аудио с трехмерным изображением с объемным звучанием, с тем чтобы предоставлять ощущения живого звучания и погружения, к примеру, с трехмерным изображением, которое является идентичным реальности или дополнительно чрезмерно увеличивается. Трехмерное аудио означает аудиосигнал, имеющий подъем и пространственное восприятие относительно звука, и требуются, по меньшей мере, два громкоговорителя, т.е. выходных канала, с тем чтобы воспроизводить трехмерное аудио. Помимо этого, за исключением бинаурального трехмерного аудио с использованием HRTF, большое число выходных каналов требуется, с тем чтобы еще более точно реализовывать подъем, направленное восприятие и пространственное восприятие относительно звука.[00101] A technology is being developed to provide 3D surround sound 3D audio so as to provide a live and immersive experience, for example, with a 3D image that is identical to reality or further over-enlarged. 3D audio means an audio signal having elevation and spatial perception relative to the sound, and at least two speakers are required, i. e. output channels in order to play 3D audio. In addition, except for binaural 3D audio using HRTF, a large number of output channels are required in order to realize lift, directional perception, and spatial perception relative to sound even more accurately.

[00102] Следовательно, после стереосистемы, имеющей 2-канальный выход, предоставляются и разрабатываются различные многоканальные системы, к примеру, 5.1-канальная система, трехмерная система Auro, 10.2-канальная система Holman, 10.2-канальная система ETRI/Samsung, 22.2-канальная система NHK и т.п.[00102] Therefore, after the stereo system having 2-channel output, various multi-channel systems are provided and developed, for example, 5.1-channel system, Auro 3D system, 10.2-channel Holman system, 10.2-channel ETRI/Samsung system, 22.2-channel NHK system etc.

[00103] Фиг. 3 иллюстрирует пример, в котором 22.2-канальный трехмерный аудиосигнал воспроизводится через 5.1-канальную систему вывода.[00103] FIG. 3 illustrates an example in which a 22.2-channel 3D audio signal is reproduced through a 5.1-channel output system.

[00104] 5.1-канальная система является общим названием 5-канальной системы многоканального объемного звучания и обычно распространяется и используется в качестве бытового домашнего кинотеатра и аудиосистемы для кинотеатров. Все 5.1 каналов включают в себя передний левый (FL) канал, центральный (C) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR). Как показано на фиг. 3, поскольку выводы из 5.1 каналов присутствуют на идентичной плоскости, 5.1-канальная система соответствует двумерной системе физическим способом, и для воспроизведения трехмерного аудиосигнала посредством 5.1-канальной системы, процесс рендеринга должен выполняться для того, чтобы применять трехмерный эффект к сигналу, который должен воспроизводиться.[00104] A 5.1 channel system is a generic term for a 5 channel multi-channel surround sound system and is commonly distributed and used as a consumer home theater and cinema audio system. All 5.1 channels include Front Left (FL) channel, Center (C) channel, Front Right (FR) channel, Surround Left (SL) and Surround Right (SR). As shown in FIG. 3, since the outputs from the 5.1 channels are present on the identical plane, the 5.1 channel system corresponds to the 2D system in a physical way, and in order to reproduce the 3D audio signal by the 5.1 channel system, a rendering process must be performed in order to apply the 3D effect to the signal to be reproduced. .

[00105] 5.1-канальная система широко используется в различных областях техники, включающих в себя фильмы, DVD-видео, DVD-аудио, супераудиокомпакт-диски (SACD), цифровую широковещательную передачу и т.п. Тем не менее, даже если 5.1-канальная система предоставляет улучшенное пространственное восприятие по сравнению со стереосистемой, 5.1-канальная система имеет множество ограничений при формировании большего пространства прослушивания. В частности, зона наилучшего восприятия формируется узко, и вертикальное звуковое изображение, имеющее угол подъема, не может предоставляться, так что 5.1-канальная система может не быть подходящей для крупного пространства прослушивания, такого как кинотеатр.[00105] The 5.1 channel system is widely used in various fields including movies, DVD video, DVD audio, Super Audio Compact Disc (SACD), digital broadcast, and the like. However, even though a 5.1-channel system provides an improved spatial experience compared to a stereo system, a 5.1-channel system has many limitations in providing a larger listening space. In particular, the sweet spot is formed narrowly, and a vertical sound image having a pitch angle cannot be provided, so a 5.1-channel system may not be suitable for a large listening space such as a movie theater.

[00106] 22.2-канальная система, представленная посредством NHK, состоит из трех уровней выходных каналов, как показано на фиг. 3. Верхний уровень 310 включает в себя канал гласа Божьего (VoG), T0-, T180-, TL45-, TL90-, TL135-, TR45-, TR90- и TR45-каналы. Здесь, индекс T в начале названия каждого канала означает верхний уровень, индекс L или R означает левую сторону или правую сторону, и число в конце означает азимутальный угол от центрального канала. Верхний уровень обычно называется верхним уровнем.[00106] The 22.2-channel system represented by NHK consists of three levels of output channels as shown in FIG. 3. Upper level 310 includes the Voice of God (VoG) channel, T0-, T180-, TL45-, TL90-, TL135-, TR45-, TR90- and TR45 channels. Here, the index T at the beginning of the name of each channel means the upper level, the index L or R means the left side or the right side, and the number at the end means the azimuth angle from the center channel. The top level is usually called the top level.

[00107] VoG-канал представляет собой канал, который находится над головой слушателя, имеет угол подъема в 90 градусов и не имеет азимутального угла. Когда местоположение VoG-канала немного изменяется, VoG-канал имеет азимутальный угол и имеет угол подъема, который не составляет 90 градусов, и в этом случае, VoG-канал более может не представлять собой VoG-канал.[00107] A VoG channel is a channel that is above the listener's head, has a 90 degree elevation angle, and has no azimuth angle. When the location of the VoG channel changes slightly, the VoG channel has an azimuth angle and has an elevation angle that is not 90 degrees, in which case the VoG channel may no longer be a VoG channel.

[00108] Средний уровень 320 находится на плоскости, идентичной плоскости 5.1 каналов, и включает в себя ML60-, ML90-, ML135-, MR60-, MR90- и MR135-каналы, в дополнение к выходным каналам для 5.1 каналов. Здесь, индекс M в начале названия каждого канала означает средний уровень, и число в конце означает азимутальный угол от центрального канала.[00108] The middle layer 320 is on an identical plane to the 5.1 channel plane and includes ML60-, ML90-, ML135-, MR60-, MR90- and MR135-channels, in addition to the output channels for 5.1 channels. Here, the index M at the beginning of the name of each channel means the average level, and the number at the end means the azimuth angle from the center channel.

[00109] Нижний уровень 330 включает в себя L0-, LL45- и LR45-каналы. Здесь, индекс L в начале названия каждого канала означает нижний уровень, и число в конце означает азимутальный угол от центрального канала.[00109] The lower layer 330 includes L0, LL45, and LR45 channels. Here, the index L at the beginning of the name of each channel means the lower level, and the number at the end means the azimuth angle from the center channel.

[00110] В 22.2 каналах, средний уровень называется горизонтальным каналом, а VOG-, T0-, T180-, T180-, M180-, L- и C-каналы, азимутальный угол которых составляет 0 градусов или 180 градусов, называются вертикальными каналами.[00110] In 22.2 channels, the middle level is called a horizontal channel, and VOG-, T0-, T180-, T180-, M180-, L-, and C-channels whose azimuth angle is 0 degrees or 180 degrees are called vertical channels.

[00111] Когда 22.2-канальный входной сигнал воспроизводится через 5.1-канальную систему, наиболее общая схема заключается в том, чтобы распределять сигналы в каналы посредством использования формулы низведения. Альтернативно, посредством выполнения рендеринга для того, чтобы предоставлять виртуальный подъем, 5.1-канальная система может воспроизводить аудиосигнал, имеющий подъем.[00111] When a 22.2-channel input signal is reproduced through a 5.1-channel system, the most common scheme is to distribute the signals to the channels by using a downmix formula. Alternatively, by performing rendering to provide virtual lift, a 5.1-channel system can reproduce an audio signal having lift.

[00112] Фиг. 4 иллюстрирует модуль панорамирования в примере, в котором возникает позиционное отклонение между стандартной схемой размещения и компоновочной схемой размещения выходных каналов, согласно варианту осуществления.[00112] FIG. 4 illustrates a panning module in an example in which a positional deviation occurs between a standard layout and an output channel layout according to an embodiment.

[00113] Когда многоканальный входной аудиосигнал воспроизводится посредством использования числа выходных каналов, меньшего числа каналов входного сигнала, исходное звуковое изображение может искажаться, и чтобы компенсировать искажение, изучаются различные технологии.[00113] When a multi-channel input audio signal is reproduced by using the number of output channels less than the number of channels of the input signal, the original audio image may be distorted, and various technologies are being studied to compensate for the distortion.

[00114] Общие технологии рендеринга спроектированы с возможностью осуществлять рендеринг при условии, что динамики, т.е. выходные каналы, размещаются согласно стандартной схеме размещения. Тем не менее, когда выходные каналы не размещаются таким образом, что они точно совпадают со стандартной схемой размещения, возникает искажение местоположения звукового изображения и искажение качества звука.[00114] The general rendering technologies are designed to render as long as the dynamics, i.e. output channels are placed according to the standard layout. However, when the output channels are not placed in such a way that they exactly match the standard layout, sound image location distortion and sound quality distortion occur.

[00115] Искажение звукового изображения широко включает в себя искажение подъема, искажение фазового угла и т.п., которые не являются чувствительными на относительно низком уровне. Тем не менее, вследствие такой физической характеристики человеческого тела, что оба уха расположены с левой и правой стороны, если звуковые изображения левой-центральной-правой сторон изменяются, искажение звукового изображения может восприниматься чувствительно. В частности, звуковое изображение передней стороны может восприниматься еще более чувствительно.[00115] Audio image distortion broadly includes lift distortion, phase angle distortion, and the like, which are not sensitive at a relatively low level. However, due to such a physical characteristic of the human body that both ears are located on the left and right side, if the sound images of the left-center-right sides change, distortion of the sound image can be perceived sensitively. In particular, the sound image of the front side can be perceived even more sensitively.

[00116] Следовательно, как показано на фиг. 3, когда 22.2 каналов реализованы через 5.1 каналов, в частности, требуется не изменять звуковые изображения VOG-, T0-, T180-, T180-, M180-, L- и C-каналов, расположенных на уровне в 0 градусов или 180 градусов, а не левых и правых каналов.[00116] Therefore, as shown in FIG. 3, when 22.2 channels are implemented through 5.1 channels, in particular, it is required not to change the sound images of VOG-, T0-, T180-, T180-, M180-, L- and C-channels located at the level of 0 degrees or 180 degrees, not left and right channels.

[00117] Когда входной аудиосигнал панорамируется, по существу, выполняются два процесса. Первый процесс соответствует процессу инициализации, в котором коэффициент панорамирования относительно входного многоканального сигнала вычисляется согласно стандартной схеме размещения выходных каналов. Во втором процессе, вычисленный коэффициент модифицируется на основе схемы размещения, в которой фактически размещаются выходные каналы. После того, как процесс модификации коэффициента панорамирования выполняется, звуковое изображение выходного сигнала может присутствовать в более точном местоположении.[00117] When the input audio signal is panned, essentially two processes are performed. The first process corresponds to the initialization process in which the panning factor relative to the input multi-channel signal is calculated according to the standard output channel layout. In the second process, the calculated coefficient is modified based on the layout in which the output channels are actually placed. After the panning coefficient modification process is performed, the audio image of the output signal may be present at a more precise location.

[00118] Следовательно, для выполнения обработки посредством модуля 123 панорамирования, требуется информация относительно стандартной схемы размещения выходных каналов и информация относительно компоновочной схемы размещения выходных каналов, в дополнение к входному аудиосигналу. В случае если C-канал формируется посредством рендеринга из L-канала и R-канала, входной аудиосигнал указывает входной сигнал, который должен воспроизводиться через C-канал, и выходной аудиосигнал указывает модифицированные сигналы панорамирования, выводимые из L-канала и R-канала согласно компоновочной схеме размещения.[00118] Therefore, in order to perform processing by the panning unit 123, information on the standard output channel layout and information on the layout layout of the output channels is required, in addition to the input audio signal. In the case where the C-channel is generated by rendering from the L-channel and the R-channel, the input audio signal indicates the input signal to be reproduced through the C-channel, and the output audio signal indicates the modified pan signals output from the L-channel and the R-channel according to layout layout.

[00119] Когда отклонение подъема присутствует между стандартной схемой размещения и компоновочной схемой размещения выходных каналов, способ двумерного панорамирования с учетом только азимутального отклонения не компенсирует эффект вследствие отклонения подъема. Следовательно, если отклонение подъема присутствует между стандартной схемой размещения и компоновочной схемой размещения выходных каналов, эффект увеличения подъема вследствие отклонения подъема должен компенсироваться посредством использования модуля 124 компенсации эффекта подъема по фиг. 4.[00119] When elevation deviation is present between the standard layout and the output channel layout, the azimuthal deviation-only 2D panning method does not compensate for the effect due to elevation deviation. Therefore, if a lift deviation is present between the standard layout and the output channel layout, the lift increase effect due to the lift deviation must be compensated by using the lift effect compensation module 124 of FIG. four.

[00120] Фиг. 5 является блок-схемой, иллюстрирующей конфигурации декодера и модуля рендеринга трехмерного аудио в устройстве воспроизведения трехмерного аудио, согласно варианту осуществления.[00120] FIG. 5 is a block diagram illustrating the configurations of a decoder and a 3D audio rendering unit in a 3D audio playback apparatus according to an embodiment.

[00121] Ссылаясь на фиг. 5, устройство 100 воспроизведения трехмерного аудио согласно варианту осуществления показано относительно конфигураций декодера 110 и модуля 120 рендеринга трехмерного аудио, и другие конфигурации опускаются.[00121] Referring to FIG. 5, the 3D audio playback apparatus 100 according to the embodiment is shown with respect to the configurations of the decoder 110 and the 3D audio rendering unit 120, and other configurations are omitted.

[00122] Аудиосигнал, вводимый в устройство 100 воспроизведения трехмерного аудио, представляет собой кодированный сигнал, который вводится в форме потока битов. Декодер 110 выбирает декодер, подходящий для формата кодированного аудиосигнала, декодирует входной аудиосигнал и передает декодированный аудиосигнал в модуль 120 рендеринга трехмерного аудио.[00122] The audio signal input to the 3D audio playback device 100 is an encoded signal that is input in the form of a bitstream. The decoder 110 selects a decoder suitable for the format of the encoded audio signal, decodes the input audio signal, and transmits the decoded audio signal to the 3D audio rendering unit 120 .

[00123] Модуль 120 рендеринга трехмерного аудио состоит из модуля 125 инициализации, выполненного с возможностью получать и обновлять коэффициент фильтрации и коэффициент панорамирования, и модуля 127 рендеринга, выполненного с возможностью осуществлять фильтрацию и панорамирование.[00123] The 3D audio rendering module 120 is composed of an initialization module 125 configured to obtain and update a filter coefficient and a panning coefficient, and a renderer 127 configured to perform filtering and panning.

[00124] Модуль 127 рендеринга выполняет фильтрацию и панорамирование для аудиосигнала, передаваемого из декодера 110. Модуль 1271 фильтрации обрабатывает информацию относительно местоположения аудио и в силу этого обеспечивает воспроизведение преобразованного посредством рендеринга аудиосигнала в требуемом местоположении, и модуль 1272 панорамирования обрабатывает информацию относительно качества звука аудио и в силу этого обеспечивает то, что преобразованный посредством рендеринга аудиосигнал имеет качество звука, преобразованное в требуемое местоположение.[00124] The rendering module 127 performs filtering and panning on the audio signal transmitted from the decoder 110. The filter module 1271 processes information regarding the location of the audio and thereby causes the rendered audio signal to be reproduced at the desired location, and the panning module 1272 processes information regarding the sound quality of the audio and thereby ensures that the rendered audio signal has the audio quality converted to the desired location.

[00125] Модуль 1271 фильтрации и модуль 1272 панорамирования выполняют функции, аналогичные функциям модуля 121 фильтрации и модуля 123 панорамирования, описанных со ссылкой на фиг. 2. Тем не менее, модуль 121 фильтрации и модуль 123 панорамирования по фиг. 2 отображаются в простых формах, в которых могут опускаться модуль инициализации и т.п., с тем чтобы получать коэффициент фильтрации и коэффициент панорамирования.[00125] The filtering module 1271 and panning module 1272 perform functions similar to those of the filtering module 121 and panning module 123 described with reference to FIG. 2. However, the filtering unit 121 and the panning unit 123 of FIG. 2 are displayed in simple forms in which an initialization unit and the like can be omitted so as to obtain a filter factor and a pan factor.

[00126] Здесь, коэффициент фильтрации для выполнения фильтрации и коэффициент панорамирования для выполнения панорамирования предоставляются из модуля 125 инициализации. Модуль 125 инициализации состоит из модуля 1251 получения параметров рендеринга подъема и модуля 1252 обновления параметров рендеринга подъема.[00126] Here, a filter coefficient for performing filtering and a panning coefficient for performing panning are provided from the initialization unit 125 . The initialization module 125 consists of a module 1251 for obtaining lifting rendering parameters and a module 1252 for updating rendering parameters for lifting.

[00127] Модуль 1251 получения параметров рендеринга подъема получает начальное значение параметра рендеринга подъема посредством использования конфигурации и компоновки выходного канала, т.е. громкоговорителя. Здесь, начальное значение параметра рендеринга подъема может вычисляться на основе конфигурации выходного канала согласно стандартной схеме размещения и конфигурации входного канала согласно заданию рендеринга подъема, либо считывается начальное значение, ранее сохраненное согласно взаимосвязи преобразования между входными/выходными каналами. Параметр рендеринга подъема может включать в себя коэффициент фильтрации, который должен использоваться посредством модуля 1251 получения параметров рендеринга подъема, или коэффициент панорамирования, который должен использоваться посредством модуля 1252 обновления параметров рендеринга подъема.[00127] The lifting rendering parameter obtaining module 1251 obtains the initial value of the lifting rendering parameter by using the output channel configuration and arrangement, i.e. loudspeaker. Here, the initial value of the lifting rendering parameter may be calculated based on the output channel configuration according to the standard layout and the input channel configuration according to the lifting rendering job, or the initial value previously stored according to the conversion relationship between input/output channels is read. The lifting rendering parameter may include a filter coefficient to be used by the lifting rendering parameters obtaining module 1251 or a panning coefficient to be used by the lifting rendering parameters updating module 1252.

[00128] Тем не менее, как описано выше, заданное значение подъема для рендеринга подъема может иметь отклонение относительно задания входного канала. В том случае, если используется фиксированное заданное значение подъема, затруднительно достигать цели виртуального рендеринга для аналогичного трехмерного воспроизведения исходного трехмерного аудиосигнала посредством использования выходного канала, отличающегося от входного канала.[00128] However, as described above, the lift setpoint for rendering the lift may have a deviation from the input channel setpoint. In the case where a fixed boost setpoint is used, it is difficult to achieve the goal of virtual rendering for similar 3D reproduction of the original 3D audio signal by using an output channel different from the input channel.

[00129] Например, когда подъем является слишком высоким, звуковое изображение является небольшим, и качество звука ухудшается, а когда подъем должен слишком низко, затруднительно ощущать эффект виртуального рендеринга. Соответственно, требуется регулировать подъем согласно настройке пользователя или уровню виртуального рендеринга, подходящему для входного канала.[00129] For example, when the lift is too high, the sound image is small and the sound quality deteriorates, and when the lift is too low, it is difficult to feel the virtual rendering effect. Accordingly, it is required to adjust the lift according to the user setting or the virtual rendering level suitable for the input channel.

[00130] Модуль 1252 обновления параметров рендеринга подъема обновляет начальные значения параметра рендеринга подъема, которые получены посредством модуля 1251 получения параметров рендеринга подъема, на основе информации подъема входного канала или заданного пользователем подъема. Здесь, если схема размещения динамиков выходного канала имеет отклонение относительно стандартной схемы размещения, может добавляться процесс для компенсации эффекта вследствие разности. Отклонение выходного канала может включать в себя информацию отклонения согласно разности между углами подъема или азимутальными углами.[00130] The lift render parameter update module 1252 updates the initial lift render parameter values that are obtained by the lift render parameter acquisition unit 1251 based on input channel lift information or a user-specified lift. Here, if the speaker layout of the output channel has a deviation from the standard layout, a process may be added to compensate for the effect due to the difference. The output channel deviation may include deviation information according to a difference between elevation angles or azimuth angles.

[00131] Выходной аудиосигнал, который фильтруется и панорамируется посредством модуля 127 рендеринга с использованием параметра рендеринга подъема, полученного и обновленного посредством модуля 125 инициализации, воспроизводится через динамики, соответствующие выходным каналам, соответственно.[00131] The output audio signal, which is filtered and panned by the rendering module 127 using the lift rendering parameter obtained and updated by the initialization module 125, is reproduced through the speakers corresponding to the output channels, respectively.

[00132] Фиг. 6-8 иллюстрируют схемы размещения каналов верхнего уровня согласно подъемам верхних уровней в схеме размещения каналов, согласно варианту осуществления.[00132] FIG. 6-8 illustrate upper layer channel layouts according to upper layer lifts in a channel layout according to an embodiment.

[00133] Когда предполагается, что сигнал входного канала представляет собой 22.2-канальный трехмерный аудиосигнал и размещается согласно схеме размещения, показанной на фиг. 3, верхний уровень входного канала имеет схему размещения, показанную на фиг. 4, согласно углам подъема. Здесь, предполагается, что углы подъема составляют 0 градусов, 25 градусов, 35 градусов и 45 градусов, и VoG-канал, соответствующий 90 градусов угла подъема, опускается. Каналы верхнего уровня, имеющие угол подъема 0 градусов, присутствуют на горизонтальной плоскости (средний уровень 320).[00133] When it is assumed that the input channel signal is a 22.2-channel 3D audio signal and is arranged according to the layout shown in FIG. 3, the upper level of the input channel has the layout shown in FIG. 4, according to the angles of elevation. Here, it is assumed that the elevation angles are 0 degrees, 25 degrees, 35 degrees, and 45 degrees, and the VoG channel corresponding to 90 degrees of elevation angle is lowered. Upper level channels having an elevation angle of 0 degrees are present on the horizontal plane (average level 320).

[00134] Фиг. 6 иллюстрирует схему размещения при виде спереди каналов верхнего уровня.[00134] FIG. 6 illustrates the front view layout of the upper layer channels.

[00135] Ссылаясь на фиг. 6, каждый из восьми каналов верхнего уровня имеет разность азимутальных углов в 45 градусов, так что когда каналы верхнего уровня просматриваются спереди относительно оси вертикальных каналов, в шести каналах, за исключением TL90-канала и TR90-канала, каждые два канала, т.е. TL45-канал и TL135-канал, T0-канал и T180-канал и TR45-канал и TR135-канал, перекрываются. Это более очевидно по сравнению с фиг. 8.[00135] Referring to FIG. 6, each of the eight upper-level channels has an azimuth angle difference of 45 degrees, so that when the upper-level channels are viewed from the front of the vertical channel axis, in six channels, except for the TL90 channel and the TR90 channel, every two channels, i.e. . TL45-channel and TL135-channel, T0-channel and T180-channel and TR45-channel and TR135-channel overlap. This is more obvious compared to FIG. eight.

[00136] Фиг. 7 иллюстрирует схему размещения при виде сверху каналов верхнего уровня. Фиг. 8 иллюстрирует схему размещения при трехмерном виде каналов верхнего уровня. Можно видеть, что восемь каналов верхнего уровня размещаются с регулярными интервалами при том, что каждый из них имеет разность азимутальных углов в 45 градусов.[00136] FIG. 7 illustrates the top-level layout of the top-level channels. Fig. 8 illustrates the layout in 3D of the upper layer channels. It can be seen that the eight upper-level channels are placed at regular intervals, with each having an azimuth angle difference of 45 degrees.

[00137] Когда контент, который должен воспроизводиться с трехмерным аудио через рендеринг подъема, является фиксированным таким образом, что он имеет угол подъема в 35 градусов, рендеринг подъема с углом подъема в 35 градусов может выполняться для всех входных аудиосигналов, так что должен достигаться оптимальный результат.[00137] When the content to be played back in 3D audio via lift rendering is fixed such that it has a lift angle of 35 degrees, lift rendering with a lift angle of 35 degrees can be performed for all input audio signals, so that an optimal result.

[00138] Тем не менее, угол подъема может по-разному применяться к трехмерному аудио контента, в зависимости от множества фрагментов контента, и как показано на фиг. 6-8, согласно подъему каждого из каналов, местоположения и расстояния каналов варьируются, и характеристики сигналов вследствие дисперсии также варьируются.[00138] However, the elevation angle may be applied differently to 3D audio content depending on the plurality of pieces of content, and as shown in FIG. 6-8, according to the rise of each of the channels, the locations and distances of the channels vary, and signal characteristics due to dispersion also vary.

[00139] Следовательно, когда виртуальный рендеринг выполняется с фиксированным углом подъема, возникает искажение звукового изображения, и для того, чтобы достигать оптимальной производительности рендеринга, необходимо выполнять рендеринг с учетом угла подъема входного трехмерного аудиосигнала, т.е. угла подъема входного канала.[00139] Therefore, when virtual rendering is performed at a fixed pitch angle, sound image distortion occurs, and in order to achieve optimal rendering performance, it is necessary to perform rendering taking into account the pitch angle of the input 3D audio signal, i.e. inlet angle.

[00140] Фиг. 9-11 иллюстрируют варьирование звукового изображения и варьирование фильтра подъема, согласно подъемам канала, согласно варианту осуществления.[00140] FIG. 9-11 illustrate audio image variation and lift filter variation according to channel lifts, according to an embodiment.

[00141] Фиг. 9 иллюстрирует местоположения каналов, когда подъемы высотных каналов составляют 0 градусов, 35 градусов и 45 градусов, соответственно. Фиг. 9 рассматривается сзади слушателя, и каждый из проиллюстрированных каналов представляет собой ML90-канал или TL90-канал. Когда угол подъема составляет 0 градусов, канал присутствует на горизонтальной плоскости и соответствует ML90-каналу, а когда угол подъема составляет 35 градусов и 45 градусов, каналы представляют собой каналы верхнего уровня и соответствуют TL90-каналу.[00141] FIG. 9 illustrates channel locations when elevation channels are 0 degrees, 35 degrees, and 45 degrees, respectively. Fig. 9 is viewed from behind the listener and each of the illustrated channels is an ML90 channel or a TL90 channel. When the elevation angle is 0 degrees, the channel is present on the horizontal plane and corresponds to the ML90 channel, and when the elevation angle is 35 degrees and 45 degrees, the channels are upper level channels and correspond to the TL90 channel.

[00142] Фиг. 10 иллюстрирует разность сигналов между левым и правым ухом слушателя, когда аудиосигналы выводятся из соответствующих каналов, расположенных так, как показано на фиг. 9.[00142] FIG. 10 illustrates the signal difference between the listener's left and right ears when audio signals are output from the respective channels arranged as shown in FIG. 9.

[00143] Когда аудиосигнал выводится из ML90, не имеющего угла подъема, теоретически, аудиосигнал воспринимается только через левое ухо и не воспринимается через правое ухо.[00143] When an audio signal is output from the ML90 having no elevation angle, theoretically, the audio signal is only perceived through the left ear and not perceived through the right ear.

[00144] Тем не менее, по мере того, как увеличивается подъем, разность между аудиосигналами, воспринимаемыми через левое ухо и правое ухо, снижается, и когда угол подъема канала увеличивается и в силу этого становится 90 градусов, канал становится VoG-каналом над головой слушателя, так что оба уха воспринимают идентичный аудиосигнал.[00144] However, as the elevation increases, the difference between the audio signals perceived through the left ear and the right ear decreases, and when the channel elevation angle increases and thereby becomes 90 degrees, the channel becomes an overhead VoG channel listener so that both ears receive an identical audio signal.

[00145] Следовательно, варьирование относительно аудиосигнала, воспринимаемого посредством обоих ушей согласно углам подъема, является таким, как показано фиг. 7B.[00145] Therefore, the variation with respect to the audio signal perceived by both ears according to the elevation angles is as shown in FIG. 7B.

[00146] Относительно аудиосигнала, воспринимаемого через левое ухо, когда угол подъема составляет 0 градусов, только левое ухо воспринимает аудиосигнал, тогда как правое ухо не воспринимает аудиосигнал. В этом случае, интерауральные разности уровней (ILD) и интерауральные разности времен (ITD) являются максимальными, и слушатель воспринимает аудиосигнал в качестве звукового изображения ML90-канала, существующего на левом канале горизонтальной плоскости.[00146] Regarding the audio signal perceived through the left ear, when the elevation angle is 0 degrees, only the left ear perceives the audio signal, while the right ear does not perceive the audio signal. In this case, interaural level differences (ILD) and interaural time differences (ITD) are maximum, and the listener perceives the audio signal as an ML90 sound image existing on the left channel of the horizontal plane.

[00147] Относительно разности между аудиосигналами, воспринимаемыми через левое и правое ухо, когда угол подъема составляет 35 градусов, и аудиосигналами, воспринимаемыми через левое и правое ухо, когда угол подъема составляет 45 градусов, поскольку угол подъема увеличивается, разность между аудиосигналами, воспринимаемыми через левое и правое ухо, снижается, и вследствие разности слушатель может ощущать разность подъемов в выходном аудиосигнале.[00147] Regarding the difference between the audio signals perceived through the left and right ear when the elevation angle is 35 degrees, and the audio signals perceived through the left and right ear when the elevation angle is 45 degrees, as the elevation angle increases, the difference between the audio signals perceived through left and right ear is reduced, and due to the difference, the listener may experience a difference in the rises in the audio output.

[00148] Выходной сигнал из канала с углом подъема в 35 градусов характеризуется большим звуковым изображением, большой зоной наилучшего восприятия и естественным качеством звука, по сравнению с выходным сигналом из канала с углом подъема 45 градусов, и выходной сигнал из канала с углом подъема 45 градусов характеризуется небольшим звуковым изображением, небольшой зоной наилучшего восприятия и ощущением звукового поля, предоставляющим интенсивное ощущение погружения, по сравнению с выходным сигналом из канала с углом подъема в 35 градусов.[00148] The 35-degree channel output has a larger sound image, large sweet spot, and natural sound quality compared to the 45-degree channel output and the 45-degree channel output characterized by a small sound image, a small sweet spot, and a sound field feel that provides an intense sense of immersion compared to output from a 35-degree elevation channel.

[00149] Как описано выше, по мере того, как увеличивается угол подъема, подъем также увеличивается, так что ощущение погружения становится интенсивным, но снижается ширина аудиосигнала. Это обусловлено тем, что, по мере того, как увеличивается угол подъема, физическое местоположение канала становится ближе и в силу этого находится близко к слушателю.[00149] As described above, as the elevation angle increases, the elevation also increases, so that the immersive feeling becomes intense, but the width of the audio signal decreases. This is because as the angle of elevation increases, the physical location of the channel gets closer and therefore closer to the listener.

[00150] Следовательно, обновление коэффициента панорамирования согласно дисперсии угла подъема определяется ниже. По мере того, как увеличивается угол подъема, коэффициент панорамирования обновляется, с тем чтобы обеспечивать увеличение звукового изображения, а по мере того, как снижается угол подъема, коэффициент панорамирования обновляется, с тем чтобы обеспечивать уменьшение звукового изображения.[00150] Therefore, updating the panning coefficient according to the elevation angle dispersion is defined below. As the elevation angle increases, the pan factor is updated to increase the sound image, and as the elevation angle decreases, the pan factor is updated to reduce the sound image.

[00151] Например, предполагается, что базовый заданный угол подъема составляет 45 градусов для виртуального рендеринга, и виртуальный рендеринг должен выполняться посредством снижения угла подъема до 35 градусов. В этом случае, коэффициент панорамирования при рендеринге, который должен применяться к виртуальному каналу, который должен формироваться посредством рендеринга, и к ипсилатеральному выходному каналу, увеличивается, и коэффициент панорамирования, который должен применяться к остаточным каналам, определяется через нормализацию мощности.[00151] For example, the base predetermined elevation angle is assumed to be 45 degrees for virtual rendering, and virtual rendering is to be performed by lowering the elevation angle to 35 degrees. In this case, the rendering pan factor to be applied to the virtual channel to be generated by rendering and the ipsilateral output channel is increased, and the pan factor to be applied to the residual channels is determined through power normalization.

[00152] В более конкретном описании, предполагается, что 22.2 входной многоканальный сигнал должен воспроизводиться через выходные 5.1-каналы (динамики). В этом случае, из числа входных 22.2-каналов, входные каналы, к которым применяется виртуальный рендеринг и которые имеют углы подъема, составляют девять каналов, которые представляют собой CH_U_000 (T0), CH_U_L45 (TL45), CH_U_R45 (TR45), CH_U_L90 (TL90), CH_U_R90 (TR90), CH_U_L135 (TL135), CH_U_R135 (TR135), CH_U_180 (T180) и CH_T_000 (VOG), и выходные 5.1-каналы составляют пять каналов (за исключением канала низкочастотного динамика), которые представляют собой CH_M_000, CH_M_L030, CH_M_R030, CH_M_L110 и CH_R_110, существующие на горизонтальной плоскости.[00152] In a more specific description, it is assumed that the 22.2 input multi-channel signal should be played through the output 5.1 channels (speakers). In this case, among the 22.2 input channels, the input channels to which virtual rendering is applied and which have elevation angles are nine channels, which are CH_U_000 (T0), CH_U_L45 (TL45), CH_U_R45 (TR45), CH_U_L90 (TL90 ), CH_U_R90 (TR90), CH_U_L135 (TL135), CH_U_R135 (TR135), CH_U_180 (T180), and CH_T_000 (VOG), and the 5.1-channel output is five channels (excluding the woofer channel), which are CH_M_000, CH_M_L030, CH_M_R030, CH_M_L110 and CH_R_110 existing on the horizontal plane.

[00153] Таким образом, в случае если CH_U_L45-канал формируется посредством рендеринга посредством использования выходных 5.1-каналов, когда базовый заданный угол подъема составляет 45 градусов, и предпринимается попытка снижать угол подъема до 35 градусов, коэффициент панорамирования, который должен применяться к CH_M_L030 и CH_M_L110, которые представляют собой ипсилатеральные выходные каналы CH_U_L45-канала, обновляется таким образом, что он увеличивается на 3 дБ, и коэффициент панорамирования остаточных трех каналов обновляется таким образом, что он снижается, так что удовлетворяется

. Здесь, N указывает число выходных каналов для рендеринга случайного виртуального канала, и

указывает коэффициент панорамирования, который должен применяться каждому выходному каналу.[00153] Thus, in the case that the CH_U_L45 channel is generated by rendering by using the output 5.1 channels when the base predetermined elevation angle is 45 degrees, and an attempt is made to lower the elevation angle to 35 degrees, the pan factor to be applied to CH_M_L030 and CH_M_L110, which are the ipsilateral output channels of the CH_U_L45 channel, is updated such that it increases by 3 dB, and the pan gain of the remaining three channels is updated such that it decreases so that it is satisfied

. Here, N indicates the number of output channels to render the random virtual channel, and

specifies the pan factor to be applied to each output channel.

[00154] Этот процесс должен выполняться для каждого входного высотного канала.[00154] This process must be performed for each height input channel.

[00155] С другой стороны, предполагается, что базовый заданный угол подъема составляет 45 градусов для виртуального рендеринга, и виртуальный рендеринг должен выполняться посредством увеличения угла подъема до 55 градусов. В этом случае, коэффициент панорамирования при рендеринге, который должен применяться к виртуальному каналу, который должен формироваться посредством рендеринга, и к ипсилатеральному выходному каналу, снижается, и коэффициент панорамирования, который должен применяться к остаточным каналам, определяется через нормализацию мощности.[00155] On the other hand, it is assumed that the base predetermined elevation angle is 45 degrees for virtual rendering, and virtual rendering should be performed by increasing the elevation angle to 55 degrees. In this case, the rendering pan factor to be applied to the virtual channel to be generated by rendering and the ipsilateral output channel is reduced, and the pan factor to be applied to the residual channels is determined through power normalization.

[00156] Когда CH_U_L45-канал формируется посредством рендеринга посредством использования выходных 5.1-каналов, если базовый заданный угол подъема увеличивается с 45 градусов до 55 градусов, коэффициент панорамирования, который должен применяться к CH_M_L030 и CH_M_L110, которые представляют собой ипсилатеральные выходные каналы CH_U_L45-канала, обновляется таким образом, что он снижается на 3 дБ, и коэффициент панорамирования остаточных трех каналов обновляется таким образом, что он увеличивается, так что удовлетворяется

указывает коэффициент панорамирования, который должен применяться каждому выходному каналу.[00156] When the CH_U_L45 channel is generated by rendering by using the 5.1 output channels, if the base predetermined elevation angle is increased from 45 degrees to 55 degrees, the pan factor to be applied to CH_M_L030 and CH_M_L110, which are the ipsilateral output channels of the CH_U_L45 channel , is updated such that it is reduced by 3 dB, and the pan ratio of the remaining three channels is updated such that it is increased such that

specifies the pan factor to be applied to each output channel.

[00157] Тем не менее, когда подъем увеличивается вышеуказанным способом, необходимо не переставлять и правое звуковые изображения вследствие обновления коэффициента панорамирования, и это описывается со ссылкой на фиг. 8.[00157] However, when the elevation is increased in the above manner, it is also necessary not to rearrange the right sound images due to updating the pan coefficient, and this will be described with reference to FIG. eight.

[00158] В дальнейшем в этом документе описывается способ обновления коэффициента фильтрации оттенков со ссылкой на фиг. 11.[00158] Hereinafter, a method for updating the hue filter coefficient will be described with reference to FIG. eleven.

[00159] Фиг. 11 иллюстрирует характеристики оттеночного фильтра согласно частотам, когда угол подъема канала составляет 35 градусов, и угол подъема составляет 45 градусов.[00159] FIG. 11 illustrates the characteristics of the tint filter according to frequencies when the channel lift angle is 35 degrees and the lift angle is 45 degrees.

[00160] Как проиллюстрировано на фиг. 11, очевидно, что характеристика вследствие угла подъема является очень заметной в оттеночном фильтре канала с углом подъема 45 градусов, по сравнению с оттеночным фильтром канала с углом подъема в 35 градусов.[00160] As illustrated in FIG. 11, it is clear that the characteristic due to the elevation angle is very prominent in the 45 degree elevation channel tint filter, compared to the 35 degree elevation channel tint filter.

[00161] В случае если виртуальный рендеринг выполняется для того, чтобы иметь угол подъема, превышающий опорный угол подъема, когда рендеринг выполняется для опорного угла подъема, большее увеличение (обновленный коэффициент фильтрации увеличивается таким образом, что он больше 1) возникает в полосе частот (в которой исходный коэффициент фильтрации больше 1), абсолютная величина которой должна увеличиваться, и большее снижение (обновленный коэффициент фильтрации снижается таким образом, что он меньше 1) возникает в полосе частот (в которой исходный коэффициент фильтрации меньше 1), абсолютная величина которой должна снижаться.[00161] In the case where virtual rendering is performed to have an elevation angle greater than the reference elevation angle, when rendering is performed for the reference elevation angle, a larger increase (updated filter factor increases such that it is greater than 1) occurs in the frequency band ( in which the original filter factor is greater than 1), the absolute value of which should increase, and a larger reduction (the updated filter factor decreases so that it is less than 1) occurs in the frequency band (in which the original filter factor is less than 1), the absolute value of which should be reduced .

[00162] Когда характеристики абсолютной величины фильтра выражаются в шкале в децибелах, как показано на фиг. 11, оттеночный фильтр имеет положительное значение, показанное в полосе частот, в которой абсолютная величина выходного сигнала должна увеличиваться, и имеет отрицательное значение в полосе частот, в которой абсолютная величина выходного сигнала должна снижаться. Помимо этого, как очевидно на фиг. 11, по мере того, как снижается угол подъема, форма абсолютной величины фильтра становится плоской.[00162] When the absolute magnitude characteristics of a filter are expressed on a decibel scale, as shown in FIG. 11, the tint filter has a positive value shown in the frequency band in which the absolute value of the output signal should increase, and has a negative value in the frequency band in which the absolute value of the output signal should decrease. In addition, as is evident in FIG. 11, as the elevation angle decreases, the shape of the absolute value of the filter becomes flat.

[00163] Когда высотный канал виртуально формируется посредством рендеринга посредством использования канала горизонтальной плоскости, по мере того, как снижается угол подъема, высотный канал имеет оттенок, аналогичный сигналу горизонтальной плоскости, и по мере того, как увеличивается угол подъема, изменение подъема является значительным, так что по мере того, как увеличивается угол подъема, эффект согласно оттеночному фильтру увеличивается, так что эффект подъема вследствие увеличения угла подъема подчеркивается. С другой стороны, по мере того, как увеличивается угол подъема, эффект согласно оттеночному фильтру снижается, так что эффект подъема может снижаться.[00163] When the height channel is virtually generated by rendering by using the horizontal plane channel, as the elevation angle decreases, the height channel has a similar hue to the horizontal plane signal, and as the elevation angle increases, the change in elevation is significant, so that as the lift angle increases, the effect according to the tint filter increases, so that the lift effect due to the increase in the lift angle is emphasized. On the other hand, as the lift angle increases, the effect according to the tint filter decreases, so that the lift effect may decrease.

[00164] Следовательно, обновление коэффициента фильтрации согласно изменению угла подъема выполняется посредством обновления исходного коэффициента фильтрации посредством использования базового заданного угла подъема и весового коэффициента на основе угла подъема, который должен фактически преобразовываться посредством рендеринга.[00164] Therefore, updating the filter factor according to the change in elevation angle is performed by updating the original filter factor by using the base predetermined elevation angle and the weighting factor based on the elevation angle to be actually transformed by rendering.

[00165] В случае если базовый заданный угол подъема для виртуального рендеринга составляет 45 градусов, и подъем снижается посредством выполнения рендеринга на 35 градусов, ниже базового угла подъема, коэффициенты, соответствующие фильтру в 45 градусов по фиг. 11, определяются в качестве начальных значений и должны обновляться на коэффициенты, соответствующие фильтру в 35 градусов.[00165] In the case where the base predetermined elevation angle for virtual rendering is 45 degrees and the elevation is reduced by rendering 35 degrees below the base elevation angle, the coefficients corresponding to the 45 degree filter of FIG. 11 are defined as initial values and must be updated by coefficients corresponding to a 35 degree filter.

[00166] Следовательно, в случае если предпринимается попытка снижать подъем посредством выполнения рендеринга до 35 градусов, т.е. до угла подъема ниже 45 градусов, т.е. базового угла подъема, коэффициент фильтрации должен обновляться таким образом, что впадина и минимальный уровень для фильтра согласно полосе частот модифицируются таким образом, что они являются более плавными, чем впадина и минимальный уровень для фильтра в 45 градусов.[00166] Therefore, in the event that an attempt is made to reduce lift by rendering up to 35 degrees, i. e. up to an elevation angle below 45 degrees, i.е. base elevation angle, the filter coefficient must be updated such that the trough and minimum level for the filter according to the bandwidth are modified so that they are smoother than the trough and minimum level for the 45-degree filter.

[00167] С другой стороны, в случае если базовый заданный угол подъема составляет 45 градусов, и подъем увеличивается посредством выполнения рендеринга на 55 градусов, выше базового угла подъема, коэффициент фильтрации должен обновляться таким образом, что впадина и минимальный уровень для фильтра согласно полосе частот модифицируются таким образом, что они являются резкими, чем впадина и минимальный уровень для фильтра в 45 градусов.[00167] On the other hand, in the case where the base predetermined elevation angle is 45 degrees, and the elevation is increased by rendering 55 degrees above the base elevation angle, the filter coefficient should be updated such that the trough and the minimum level for the filter according to the frequency band are modified in such a way that they are sharper than the trough and the minimum filter level of 45 degrees.

[00168] Фиг. 12 является блок-схемой последовательности операций, иллюстрирующей способ рендеринга трехмерного аудиосигнала, согласно варианту осуществления.[00168] FIG. 12 is a flowchart illustrating a 3D audio signal rendering method according to an embodiment.

[00169] Модуль рендеринга принимает многоканальный аудиосигнал, включающий в себя множество входных каналов (1210). Входной многоканальный аудиосигнал преобразуется во множество сигналов выходных каналов через рендеринг, и в примере низведения, в котором число выходных каналов меньше числа входных каналов, входной сигнал, имеющий 22.2 каналов, преобразуется в выходной канал, имеющий 5.1 каналов.[00169] The rendering module receives a multi-channel audio signal including a plurality of input channels (1210). The input multi-channel audio signal is converted to a plurality of output channel signals through rendering, and in a downmix example in which the number of output channels is less than the number of input channels, an input signal having 22.2 channels is converted to an output channel having 5.1 channels.

[00170] Таким образом, когда трехмерный входной аудиосигнал формируется посредством рендеринга посредством использования двумерных выходных каналов, общий рендеринг применяется к входным каналам на горизонтальной плоскости, и виртуальный рендеринг применяется к высотным каналам, имеющим угол подъема, с тем чтобы применять подъем к ним.[00170] Thus, when a 3D audio input signal is rendered by using 2D output channels, general rendering is applied to input channels on a horizontal plane, and virtual rendering is applied to height channels having a lift angle so as to apply lift to them.

[00171] Чтобы выполнять рендеринг, требуется коэффициент фильтрации, который должен использоваться в фильтрации, и коэффициент панорамирования, который должен использоваться в панорамировании. Здесь, в процессе инициализации, параметр рендеринга получается согласно стандартной схеме размещения выходного канала и базовому заданному углу подъема для виртуального рендеринга (1220). Базовый заданный угол подъема может определяться различными способами согласно модулю рендеринга, но когда виртуальный рендеринг выполняется с фиксированным углом подъема, удовлетворенность и эффект виртуального рендеринга могут снижаться согласно предпочтениям пользователя или характеристике входного сигнала.[00171] In order to render, a filter factor to be used in filtering and a pan factor to be used in panning are required. Here, during the initialization process, the rendering parameter is obtained according to the standard output channel layout and the base predetermined elevation angle for virtual rendering (1220). The base predetermined elevation angle may be determined in various ways according to the renderer, but when virtual rendering is performed at a fixed elevation angle, the satisfaction and effect of the virtual rendering may be reduced according to the user's preferences or input signal characteristics.

[00172] Следовательно, когда конфигурация выходного канала имеет отклонение относительно стандартной схемы размещения выходного канала, либо когда подъем, при котором должен выполняться виртуальный рендеринг, отличается от базового заданного угла подъема модуля рендеринга, параметр рендеринга обновляется (1230).[00172] Therefore, when the output channel configuration deviates from the standard output channel layout, or when the elevation at which the virtual rendering is to be performed differs from the base preset elevation angle of the renderer, the render parameter is updated (1230).

[00173] Здесь, обновленный параметр рендеринга может включать в себя коэффициент фильтрации, обновленный посредством суммирования, с начальным значением коэффициента фильтрации, весового коэффициента, определенного на основе отклонения углов подъема, или может включать в себя коэффициент панорамирования, обновленный посредством увеличения или уменьшения начального значения коэффициента панорамирования согласно результату сравнения угла подъема входного канала с базовым заданным углом подъема.[00173] Here, the updated render parameter may include a filter coefficient updated by summation with an initial value of the filter coefficient, a weighting coefficient determined based on elevation deviation, or may include a pan coefficient updated by increasing or decreasing the initial value pan ratio according to the result of comparing the elevation angle of the input channel with the base preset elevation angle.

[00174] Подробный способ обновления коэффициента фильтрации и коэффициента панорамирования уже описан со ссылкой на фиг. 9-11, и в силу этого описание опускается. В этом отношении, обновленный коэффициент фильтрации и обновленный коэффициент панорамирования могут быть дополнительно модифицированы или расширены, и его подробное описание предоставлено ниже.[00174] A detailed method for updating the filter factor and the pan factor has already been described with reference to FIG. 9-11, and therefore the description is omitted. In this regard, the updated filter factor and the updated pan factor can be further modified or extended, and a detailed description thereof is provided below.

[00175] Если схема размещения динамиков выходного канала имеет отклонение относительно стандартной схемы размещения, может добавляться процесс для компенсации эффекта вследствие отклонения, но описание его подробного способа опускается здесь. Отклонение выходного канала может включать в себя информацию отклонения согласно разности между углами подъема или азимутальными углами.[00175] If the speaker layout of the output channel has a deviation from the standard layout, a process may be added to compensate for the effect due to the deviation, but a description of its detailed method is omitted here. The output channel deviation may include deviation information according to a difference between elevation angles or azimuth angles.

[00176] Фиг. 13 иллюстрирует явление, при котором левое и правое звуковые изображения переставляются, когда угол подъема входного канала равен или выше порогового значения, согласно варианту осуществления.[00176] FIG. 13 illustrates a phenomenon in which the left and right sound images are swapped when the elevation angle of an input channel is equal to or higher than a threshold value, according to an embodiment.

[00177] Пользователь различает между местоположениями звуковых изображений согласно разностям времен, разностям уровней и разностям частот звуков, которые поступают в оба уха пользователя. Когда разности между характеристиками сигналов, которые поступают в оба уха, являются большими, пользователь может легко локализовать местоположения, и даже если возникает небольшая ошибка, не возникает путаница передних/задних каналов или путаница левых/правых каналов относительно звуковых изображений. Тем не менее, виртуальный аудиоисточник, расположенный в правой задней боковой или правой передней стороне головы, имеет очень небольшую разность времен и очень небольшую разность уровней, так что пользователь должен локализовать местоположение посредством использования только разности между частотами.[00177] The user discriminates between the locations of sound images according to time differences, level differences, and frequency differences of sounds that enter both ears of the user. When the differences between the characteristics of the signals that enter both ears are large, the user can easily locate the locations, and even if a small error occurs, there is no front/back channel confusion or left/right channel confusion with respect to sound images. However, the virtual audio source located in the right rear side or right front side of the head has a very small time difference and a very small level difference, so that the user has to localize the location by using only the difference between frequencies.

[00178] Аналогично на фиг. 10, на фиг. 13, канал квадратной формы представляет собой CH_U_L90-канал сзади относительно слушателя. Здесь, когда угол подъема CH_U_L90 составляет

, по мере того, как

увеличивается, ILD и ITD аудиосигналов, которые поступают в левое ухо и правое ухо слушателя, снижаются, и аудиосигналы, воспринимаемые посредством обоих ушей, имеют аналогичные звуковые изображения. Максимальное значение угла

подъема составляет 90 градусов, и когда

составляет 90 градусов, CH_U_L90 становится VoG-каналом, существующим над головой слушателя, в силу чего идентичные аудиосигналы принимаются через оба уха.[00178] Similarly, in FIG. 10 in FIG. 13, the square channel is the CH_U_L90 channel behind the listener. Here, when the elevation angle CH_U_L90 is

, as

increases, the ILD and ITD of the audio signals that enter the left ear and the right ear of the listener decrease, and the audio signals perceived by both ears have similar sound images. Max Angle

lift is 90 degrees, and when

is 90 degrees, CH_U_L90 becomes a VoG channel that exists above the listener's head, whereby identical audio signals are received through both ears.

[00179] Как показано в левой схеме по фиг. 13, если

имеет очень большое значение, подъем увеличивается, так что слушатель может испытывать ощущение звукового поля, предоставляющее интенсивное ощущение погружения. Тем не менее, когда подъем увеличивается, звуковое изображение становится небольшим, и зона наилучшего восприятия становится небольшой, так что даже если местоположение слушателя немного изменяется, или канал немного перемещается, явление перестановки левых/правых каналов может возникать относительно звукового изображения.[00179] As shown in the left diagram of FIG. 13 if

is very important, the lift is increased so that the listener can experience a sound field sensation that provides an intense sense of immersion. However, as the lift increases, the sound image becomes small and the sweet spot becomes small, so that even if the listener's position changes slightly or the channel moves slightly, a left/right channel swapping phenomenon may occur relative to the sound image.

[00180] Правая схема по фиг. 13 иллюстрирует местоположения слушателя и канала, когда слушатель немного перемещается влево. Это представляет собой случай, когда подъем формируется высоко, поскольку угол

подъема канала имеет большое значение, так что даже если слушатель немного перемещается, относительные местоположения левых и правых каналов значительно изменяются, и в наихудшем случае, хотя он представляет собой левосторонний канал, сигнал, который поступает в правое ухо, воспринимается еще более существенно, так что может возникать перестановка левых/правых каналов звукового изображения, как показано на фиг. 13.[00180] The right diagram of FIG. 13 illustrates the listener and channel locations when the listener moves slightly to the left. This is a case where the lift is formed high because the angle

channel lift is important, so that even if the listener moves slightly, the relative locations of the left and right channels change significantly, and in the worst case, although it is a left-sided channel, the signal that enters the right ear is perceived even more significantly, so that left/right channel swapping of the audio image may occur, as shown in FIG. 13.

[00181] В процессе рендеринга, более важно поддерживать баланс левых и правых каналов звукового изображения и локализовать левые и правые местоположения звукового изображения, чем применять подъем, в силу чего, для того чтобы предотвращать вышеуказанное явление, может быть необходимым ограничивать угол подъема для виртуального рендеринга пределами предварительно определенного диапазона.[00181] In the rendering process, it is more important to maintain the balance of the left and right channels of the audio image and localize the left and right locations of the audio image than to apply lift, whereby, in order to prevent the above phenomenon, it may be necessary to limit the lift angle for virtual rendering outside a predefined range.

[00182] Следовательно, в случае если коэффициент панорамирования снижается, когда угол подъема увеличивается для того, чтобы достигать более высокого подъема, чем базовый заданный угол подъема для рендеринга, необходимо задавать минимальное пороговое значение коэффициента панорамирования таким образом, что оно не равно или меньше предварительно определенного значения.[00182] Therefore, in the case that the panning ratio is lowered when the elevation angle is increased in order to achieve a higher elevation than the base preset elevation angle for rendering, it is necessary to set the minimum threshold value of the panning ratio such that it is not equal to or less than previously a certain value.

[00183] Например, даже если подъем при рендеринге в 60 градусов увеличивается таким образом, что он равен или выше 60 градусов, когда панорамирование выполняется посредством обязательного применения коэффициента панорамирования, который обновляется относительно порогового угла подъема в 60 градусов, может предотвращаться явление перестановки левых/правых каналов звукового изображения.[00183] For example, even if the 60-degree rendering elevation is increased such that it is equal to or higher than 60 degrees, when panning is performed by necessarily applying a pan factor that is updated with respect to the 60-degree elevation threshold angle, the phenomenon of left/right shifting can be prevented. right channels of the sound image.

[00184] Когда трехмерное аудио формируется посредством использования виртуального рендеринга, явление путаницы передних/задних каналов аудиосигнала может возникать вследствие компонента воспроизведения канала объемного звучания. Явление путаницы передних/задних каналов означает явление, посредством которого затруднительно определять то, присутствует виртуальный аудиоисточник в трехмерном аудио спереди или сзади.[00184] When 3D audio is generated by using virtual rendering, a front/rear channel confusion phenomenon of the audio signal may occur due to the surround channel playback component. The front/rear confusion phenomenon means a phenomenon by which it is difficult to determine whether a virtual audio source is present in 3D audio from the front or the back.

[00185] Со ссылкой на фиг. 13, предполагается, что слушатель перемещается; тем не менее, специалистам в данной области техники должно быть очевидным, что по мере того, как увеличивается звуковое изображение, даже если слушатель не перемещается, имеется высокая вероятность того, что возникает путаница левых/правых каналов или путаница передних/задних каналов вследствие характеристики органа слуха каждого пользователя.[00185] With reference to FIG. 13, the listener is assumed to be moving; however, it should be apparent to those skilled in the art that as the sound image increases, even if the listener does not move, there is a high probability that left/right channel confusion or front/rear channel confusion occurs due to organ characteristics. hearing of each user.

[00186] В дальнейшем в этом документе подробно описывается способ инициализации и обновления параметра рендеринга подъема, т.е. коэффициента панорамирования подъема и коэффициента фильтрации подъема.[00186] Hereinafter, this document describes in detail the method of initializing and updating the lifting rendering parameter, i.e. lift pan factor and lift filter factor.

[00187] Когда угол elv подъема входного высотного канала

превышает 35 градусов, если

представляет собой фронтальный канал (азимутальный угол составляет от -90 градусов до +90 градусов), обновленный коэффициент

фильтрации подъема определяется согласно уравнениям 1-3.[00187] When the elevation angle elv of the height input channel

exceeds 35 degrees if

represents the frontal channel (azimuth angle is from -90 degrees to +90 degrees), the updated coefficient

lift filtering is determined according to Equations 1-3.

[00188] уравнение 1[00188] Equation 1

[00189]

[00190] уравнение 2[00190] Equation 2

[00191]

[00192] уравнение 3[00192] Equation 3

[00193]

[00194] С другой стороны, когда угол elv подъема входного высотного канала

превышает 35 градусов, если

представляет собой задний канал (азимутальный угол составляет от -180 градусов до -90 градусов или от 90 градусов до 180 градусов), обновленный коэффициент

фильтрации подъема определяется согласно уравнениям 4-6.[00194] On the other hand, when the elevation angle elv of the input height channel

exceeds 35 degrees if

represents the rear channel (azimuth angle is -180 degrees to -90 degrees or 90 degrees to 180 degrees), updated coefficient

lift filtering is determined according to Equations 4-6.

[00195] уравнение 4[00195] Equation 4

[00196]

[00197] уравнение 5[00197] Equation 5

[00198]

[00199] уравнение 6[00199] Equation 6

[00200]

,[00200]

,

где

является нормализованной центральной частотой k-ой полосы частот, f_s является частотой дискретизации, и

является начальным значением коэффициента фильтрации подъема с опорным углом подъема.where

is the normalized center frequency of the k-th band, f _s is the sample rate, and

is the initial value of the lift filter coefficient with the reference lift angle.

[00201] Когда угол подъема для рендеринга подъема не является опорным углом подъема, коэффициент панорамирования подъема относительно входных высотных каналов за исключением TBC-канала (CH_U_180) и VoG-канала (CH_T_000) должен обновляться.[00201] When the elevation angle for elevation rendering is not the elevation reference angle, the elevation pan factor relative to the height input channels except for the TBC channel (CH_U_180) and the VoG channel (CH_T_000) needs to be updated.

[00202] Когда опорный угол подъема составляет 35 градусов, и

представляет собой TFC-канал (CH_U_000), обновленные коэффициенты

и

панорамирования подъема определяются согласно уравнениям 7 и 8, соответственно.[00202] When the lift reference angle is 35 degrees, and

is a TFC channel (CH_U_000), updated coefficients

and

lift pans are determined according to Equations 7 and 8, respectively.

[00203] уравнение 7[00203] Equation 7

[00204]

[00205] уравнение 8[00205] Equation 8

[00206]

,[00206]

,

где

является коэффициентом панорамирования выходного SL-канала для виртуального рендеринга TFC-канала посредством использования опорного угла подъема в 35 градусов, и

является коэффициентом панорамирования выходного SR-канала для виртуального рендеринга TFC-канала посредством использования опорного угла подъема в 35 градусов.where

is the pan factor of the SL output channel for virtual rendering of the TFC channel by using a reference elevation angle of 35 degrees, and

is the panning ratio of the SR output channel for virtual rendering of the TFC channel by using a reference elevation angle of 35 degrees.

[00207] Относительно TFC-канала, невозможно регулировать усиления левых и правых каналов, с тем чтобы управлять подъемом, так что регулируется отношение усиления относительно SL-канала и SR-канала, которые представляют собой задние каналы фронтального канала, с тем чтобы управлять подъемом. Ниже предоставляется подробное описание.[00207] Regarding the TFC channel, it is not possible to adjust the gains of the left and right channels so as to control the lift, so the gain ratio is adjusted with respect to the SL channel and the SR channel, which are the rear channels of the front channel, so as to control the lift. A detailed description is provided below.

[00208] Относительно других каналов за исключением TFC-канала, когда угол подъема входного высотного канала превышает опорный угол подъема в 35 градусов, усиление ипсилатерального канала входного канала снижается, а усиление контралатерального канала входного канала увеличивается вследствие разности усилений между

и

.[00208] With respect to other channels except for the TFC channel, when the elevation angle of the input height channel exceeds the reference elevation angle of 35 degrees, the gain of the ipsilateral channel of the input channel is reduced, and the gain of the contralateral channel of the input channel is increased due to the gain difference between

and

.

[00209] Например, когда входной канал представляет собой CH_U_L045-канал, ипсилатеральный выходной канал входного канала представляет собой CH_M_L030 и CH_M_L110, и контралатеральный выходной канал входного канала представляет собой CH_M_R030 и CH_M_R110.[00209] For example, when the input channel is CH_U_L045 channel, the ipsilateral output channel of the input channel is CH_M_L030 and CH_M_L110, and the contralateral output channel of the input channel is CH_M_R030 and CH_M_R110.

[00210] В дальнейшем в этом документе подробно описывается способ получения

и

и обновления панорамирующего усиления подъема из них, когда входной канал представляет собой боковой канал, фронтальный канал или задний канал.[00210] Hereinafter, this document describes in detail a method for obtaining

and

and updating the panning gain of them when the input channel is a side channel, a front channel, or a rear channel.

[00211] Когда входной канал, имеющий угол elv подъема, представляет собой боковой канал (азимутальный угол составляет от -110 градусов до -70 градусов или от 70 градусов до 110 градусов),

и

определяются согласно уравнениям 9 и 10, соответственно.[00211] When the inlet channel having the elevation angle elv is a side channel (the azimuth angle is -110 degrees to -70 degrees or 70 degrees to 110 degrees),

and

are determined according to Equations 9 and 10, respectively.

[00212] уравнение 9[00212] Equation 9

[00213]

[00214] уравнение 10[00214] Equation 10

[00215]

[00216] Когда входной канал, имеющий угол elv подъема, представляет собой фронтальный канал (азимутальный угол составляет от -70 градусов до +70 градусов) или задний канал (азимутальный угол составляет от -180 градусов до -110 градусов или от 110 градусов до 180 градусов),

и

определяются согласно уравнениям 11 и 12, соответственно.[00216] When the input channel having the elevation angle elv is the front channel (azimuth angle is -70 degrees to +70 degrees) or the rear channel (azimuth angle is -180 degrees to -110 degrees or 110 degrees to 180 degrees),

and

are determined according to Equations 11 and 12, respectively.

[00217] уравнение 11[00217] Equation 11

[00218]

[00219] уравнение 12[00219] Equation 12

[00220]

[00221] На основе

и

, вычисленных посредством использования уравнений 9 через и 12, могут обновляться коэффициенты панорамирования подъема.[00221] Based on

and

calculated by using Equations 9 through and 12, the lift pan coefficients can be updated.

[00222] Обновленный коэффициент

панорамирования подъема относительно ипсилатерального выходного канала входного канала и обновленный коэффициент

панорамирования подъема относительно контралатерального выходного канала входного канала определяются согласно уравнениям 13 и 14, соответственно.[00222] Updated coefficient

elevation panning relative to the ipsilateral output channel of the input channel and the updated coefficient

elevation pans relative to the contralateral exit channel of the inlet channel are determined according to Equations 13 and 14, respectively.

[00223] уравнение 13[00223] Equation 13

[00224]

[00225] уравнение 14[00225] Equation 14

[00226]

[00227] Чтобы постоянно поддерживать энергетический уровень выходного сигнала, коэффициенты панорамирования, полученные посредством использования уравнений 13 и 14, нормализуются согласно уравнениям 15 и 16.[00227] In order to constantly maintain the energy level of the output signal, the pan coefficients obtained by using Equations 13 and 14 are normalized according to Equations 15 and 16.

[00228] уравнение 15[00228] Equation 15

[00229]

[00230] уравнение 16[00230] Equation 16

[00231]

[00232] Таким образом, процесс нормализации мощности выполняется таким образом, что общая сумма квадрата коэффициентов панорамирования входного канала становится 1, и за счет этого может в равной степени поддерживаться энергетический уровень выходного сигнала до того, как обновляются коэффициенты панорамирования, и энергетический уровень выходного сигнала после того, как обновляются коэффициенты панорамирования.[00232] Thus, the power normalization process is performed such that the total sum of the squared pan coefficients of the input channel becomes 1, and thereby the energy level of the output signal before the pan coefficients are updated and the energy level of the output signal can be equally maintained. after the pan coefficients are updated.

[00233] В

и

, индексный H указывает то, что коэффициент панорамирования подъема обновляется только в высокочастотной области. Обновленные коэффициенты панорамирования подъема уравнений 13 и 14 применяются только к полосе высоких частот, для полос частот от 2,8 кГц до 10. Тем не менее, когда коэффициент панорамирования подъема обновляется относительно канала объемного звучания, коэффициент панорамирования подъема обновляется не только относительно полосы высоких частот, но также и относительно полосы низких частот.[00233] B

and

, index H indicates that the lift pan factor is updated only in the high frequency region. The updated lift pan gains of Equations 13 and 14 only apply to the high band, for frequency bands from 2.8 kHz to 10. However, when the lift pan gain is updated relative to the surround channel, the lift pan gain is not only updated relative to the high band. , but also relative to the low frequency band.

[00234] Когда входной канал, имеющий угол elv подъема, представляет собой канал объемного звучания (азимутальный угол составляет от -160 градусов до -110 градусов или от 110 градусов до 160 градусов), обновленный коэффициент

панорамирования подъема относительно ипсилатерального выходного канала входного канала в полосе низких частот 2,8 кГц или ниже и обновленный коэффициент

панорамирования подъема относительно контралатерального выходного канала входного канала определяются согласно уравнениям 17 и 18, соответственно.[00234] When the input channel having the elevation angle elv is a surround channel (azimuth angle is -160 degrees to -110 degrees or 110 degrees to 160 degrees), the updated coefficient

lift panning relative to the ipsilateral output channel of the input channel in the low frequency band of 2.8 kHz or below and the updated coefficient

elevation pans relative to the contralateral exit channel of the inlet channel are determined according to Equations 17 and 18, respectively.

[00235] уравнение 17[00235] Equation 17

[00236]

[00237] уравнение 18[00237] Equation 18

[00238]

[00239] Аналогично полосе высоких частот, чтобы постоянно поддерживать энергетический уровень выходного сигнала посредством обновленного панорамирующего усиления подъема полосы низких частот, коэффициенты панорамирования, полученные посредством использования уравнений 15 и 16, нормализуются по мощности согласно уравнениям 19 и 20.[00239] Similar to the high band, in order to constantly maintain the energy level of the output signal through the updated low band boost panning gain, the pan gains obtained by using Equations 15 and 16 are power normalized according to Equations 19 and 20.

[00240] уравнение 19[00240] Equation 19

[00241]

[00242] уравнение 20[00242] Equation 20

[00243]

[00244] Таким образом, процесс нормализации мощности выполняется таким образом, что общая сумма квадрата коэффициентов панорамирования входного канала становится 1, и за счет этого может в равной степени поддерживаться энергетический уровень выходного сигнала до того, как обновляются коэффициенты панорамирования, и энергетический уровень выходного сигнала после того, как обновляются коэффициенты панорамирования.[00244] Thus, the power normalization process is performed such that the total sum of the squared pan coefficients of the input channel becomes 1, and thereby the energy level of the output signal before the pan coefficients are updated and the energy level of the output signal can be equally maintained. after the pan coefficients are updated.

[00245] Фиг. 14-17 являются схемами для описания способа предотвращения путаницы передних/задних каналов звукового изображения, согласно варианту осуществления.[00245] FIG. 14-17 are diagrams for describing a method for preventing front/rear channel confusion in an audio image according to an embodiment.

[00246] Фиг. 14 иллюстрирует горизонтальные каналы и фронтальные высотные каналы, согласно варианту осуществления.[00246] FIG. 14 illustrates horizontal channels and front height channels, according to an embodiment.

[00247] Что касается варианта осуществления, показанного на фиг. 14, предполагается, что выходной канал представляет собой 5.0 каналов (теперь показан канал низкочастотного динамика), и фронтальные входные высотные каналы преобразуются посредством рендеринга в горизонтальные выходные каналы. 5.0 каналов присутствуют на горизонтальной плоскости 1410 и включают в себя передний центральный (FC) канал, передний левый (FL) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR).[00247] With regard to the embodiment shown in FIG. 14, the output channel is assumed to be 5.0 channels (the woofer channel is now shown), and the front height input channels are rendered converted to horizontal output channels. 5.0 channels are present on the horizontal plane 1410 and include a front center (FC) channel, a front left (FL) channel, a front right (FR) channel, a surround left (SL) channel, and a surround right (SR) channel.

[00248] Фронтальные высотные каналы представляют собой каналы, соответствующие верхнему уровню 1420 по фиг. 14, и в варианте осуществления, показанном на фиг. 14, фронтальные высотные каналы включают в себя верхний передний центральный (TFC) канал, верхний передний левый (TFL) канал и верхний передний правый (TFR) канал.[00248] Frontal height channels are channels corresponding to the upper layer 1420 of FIG. 14 and in the embodiment shown in FIG. 14, the front height channels include a top front center (TFC) channel, a top front left (TFL) channel, and a top front right (TFR) channel.

[00249] Когда предполагается, что в варианте осуществления, показанном на фиг. 14, входной канал представляет собой 22.2 каналов, входные сигналы 24 каналов преобразуются посредством рендеринга (низводятся), чтобы формировать выходные сигналы 5 каналов. Здесь, компоненты, которые надлежащим образом соответствуют входным сигналам 24 каналов, распределены в 5-канальном выходном сигнале согласно правилу рендеринга. Следовательно, выходные каналы, т.е. передний центральный (FC) канал, передний левый (FL) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR), соответственно, включают в себя компоненты, соответствующие входным сигналам.[00249] When it is assumed that in the embodiment shown in FIG. 14, the input channel is 22.2 channels, the input signals of 24 channels are rendered converted (downmixed) to generate output signals of 5 channels. Here, the components that properly match the 24-channel input signals are distributed in the 5-channel output signal according to the rendering rule. Therefore, the output channels, i.e. front center (FC) channel, front left (FL) channel, front right (FR) channel, surround left (SL) channel and surround right (SR) channel, respectively, include components corresponding to the input signals.

[00250] В этом отношении, число фронтальных высотных каналов, число горизонтальных каналов, азимутальные углы и углы подъема высотных каналов могут определяться различными способами согласно схеме размещения каналов. Когда входной канал представляет собой 22.2 каналов или 22.0 каналов, фронтальный высотный канал может включать в себя, по меньшей мере, один из CH_U_L030, CH_U_R030, CH_U_L045, CH_U_R045 и CH_U_000. Когда выходной канал представляет собой 5.0 каналов или 5.1 каналов, канал объемного звучания может включать в себя, по меньшей мере, один из CH_M_L110 и CH_M_R110.[00250] In this regard, the number of frontal height channels, the number of horizontal channels, the azimuth angles and elevation angles of the height channels may be determined in various ways according to the channel layout. When the input channel is 22.2 channels or 22.0 channels, the front height channel may include at least one of CH_U_L030, CH_U_R030, CH_U_L045, CH_U_R045, and CH_U_000. When the output channel is 5.0 channels or 5.1 channels, the surround channel may include at least one of CH_M_L110 and CH_M_R110.

[00251] Тем не менее, специалистам в данной области техники должно быть очевидным, что даже если несколько входных и выходных каналов не совпадают со стандартной схемой размещения, многоканальная схема размещения может конфигурироваться различными способами согласно углу подъема и азимутальному углу каждого канала.[00251] However, those skilled in the art will appreciate that even if the multiple input and output channels do not match the standard layout, the multi-channel layout can be configured in various ways according to the elevation angle and azimuth angle of each channel.

[00252] Когда сигнал входного высотного канала виртуально преобразуется посредством рендеринга посредством использования горизонтальных выходных каналов, выходной канал объемного звучания действует с возможностью увеличивать подъем звукового изображения посредством применения подъема к звуку. Следовательно, когда сигналы из горизонтальных входных высотных каналов виртуально преобразуются посредством рендеринга в выходные 5.0-каналы, которые представляют собой горизонтальные каналы, подъем может применяться и регулироваться посредством выходных сигналов из SL-канала и SR-каналов, которые представляют собой выходные каналы объемного звучания.[00252] When the height input channel signal is virtually rendered by using the horizontal output channels, the surround output channel operates to increase the lift of the audio image by applying the lift to the sound. Therefore, when the signals from the horizontal height input channels are virtually rendered into the 5.0 output channels, which are the horizontal channels, boost can be applied and adjusted by the output signals from the SL channel and the SR channels, which are the surround output channels.

[00253] Тем не менее, поскольку HRTF является уникальной для каждого пользователя, может возникать явление путаницы передних/задних каналов, в котором сигнал, который виртуально преобразуется посредством рендеринга во фронтальный высотный канал, воспринимается, как если он звучит сзади согласно HRTF-характеристике слушателя.[00253] However, since the HRTF is unique to each user, a front/rear channel confusion phenomenon can occur in which a signal that is virtually rendered into a front height channel is perceived as if it is coming from behind according to the listener's HRTF response .

[00254] Фиг. 15 иллюстрирует процентную долю восприятия фронтальных высотных каналов, согласно варианту осуществления.[00254] FIG. 15 illustrates the perception percentage of the front height channels, according to an embodiment.

[00255] Фиг. 15 иллюстрирует процентную долю того, что когда фронтальный высотный канал, т.е. TFR-канал, виртуально формируется посредством рендеринга посредством использования горизонтального выходного канала, пользователь локализует местоположение (переднее и заднее) звукового изображения. Со ссылкой на фиг. 15, высота, распознанная пользователем, соответствует высотному каналу 1420, и размер окружности является пропорциональным значению вероятности.[00255] FIG. 15 illustrates the percentage that when the front height channel, ie. The TFR channel is virtually rendered by using the horizontal output channel, the user localizes the location (front and back) of the audio image. With reference to FIG. 15, the height recognized by the user corresponds to the height channel 1420, and the size of the circle is proportional to the probability value.

[00256] Ссылаясь на фиг. 15, хотя большинство пользователей локализует звуковое изображение при 45 градусов справа, которое является местоположением виртуально преобразованного посредством рендеринга канала, многие пользователи локализуют звуковое изображение в другом местоположении, а не при 45 градусов. Как описано выше, это явление возникает, поскольку HRTF-характеристика отличается для людей, можно видеть, что определенный пользователь локализует звуковое изображение даже сзади, дополнительно идущее на 90 градусов справа.[00256] Referring to FIG. 15, although most users locate the audio image at 45 degrees to the right, which is the location of the virtually rendered channel, many users locate the audio image at a location other than 45 degrees. As described above, this phenomenon occurs because the HRTF characteristic is different for people, it can be seen that a certain user localizes the sound image even from behind, further going 90 degrees to the right.

[00257] HRTF указывает тракт передачи аудио из аудиоисточника в точке в пространстве, смежной с головой, в барабанную перепонку, что математически выражается как передаточная функция. HRTF значительно варьируется согласно местоположению аудиоисточника относительно центра головы и размеру либо форме головы или ушной раковины. Чтобы точно изобразить виртуальный аудиоисточник, HRTF целевых людей должны отдельно измеряться и использоваться, что фактически является невозможным. Таким образом, в общем, используется неиндивидуализированная HRTF, измеренная посредством размещения микрофона в позиции барабанной перепонки манекена, аналогичного человеческому телу.[00257] HRTF indicates the audio transmission path from an audio source at a point in space adjacent to the head to the eardrum, which is expressed mathematically as a transfer function. The HRTF varies considerably according to the location of the audio source relative to the center of the head and the size or shape of the head or pinna. To accurately represent a virtual audio source, the target people's HRTFs must be separately measured and used, which is virtually impossible. Thus, in general, a non-individualized HRTF is used, measured by placing a microphone in the eardrum position of a manikin similar to the human body.

[00258] Когда виртуальный аудиоисточник воспроизводится посредством использования неиндивидуализированной HRTF, если голова или ушная раковина пользователя не совпадает с микрофонной системой муляжа или манекена, возникают различные проблемы, связанные с локализацией звуковых изображений. Отклонение локализованных градусов на горизонтальной плоскости может компенсироваться с учетом размера головы пользователя, но поскольку размер или формы ушной раковины отличается у людей, затруднительно компенсировать отклонение подъема или явление путаницы передних/задних каналов.[00258] When a virtual audio source is played back using a non-personalized HRTF, if the user's head or pinna does not match the microphone system of the dummy or dummy, various audio image localization problems arise. Deviation of localized degrees on the horizontal plane can be compensated for according to the size of the user's head, but since the size or shape of the auricle differs between people, it is difficult to compensate for the elevation deviation or the phenomenon of anterior/posterior channel confusion.

[00259] Как описано выше, каждый пользователь имеет собственную HRTF согласно размеру или форме головы; тем не менее, фактически затруднительно применять различные HRTF к людям, соответственно. Следовательно, используется неиндивидуализированная HRTF, т.е. общая HRTF, и в этом случае может возникать явление путаницы передних/задних каналов.[00259] As described above, each user has their own HRTF according to the size or shape of the head; however, it is actually difficult to apply different HRTFs to people, respectively. Therefore, a non-individualized HRTF is used, i. e. common HRTF, in which case the phenomenon of anterior/rear channel confusion may occur.

[00260] Здесь, когда предварительно определенная временная задержка добавляется в сигнал выходного канала объемного звучания, может предотвращаться явление путаницы передних/задних каналов.[00260] Here, when a predetermined time delay is added to the surround output channel signal, the phenomenon of front/rear confusion can be prevented.

[00261] Звук не воспринимается одинаково всеми, а воспринимается по-разному согласно окружению или психологическому состоянию слушателя. Это обусловлено тем, что физическое событие в пространстве, в котором доставляется звук, воспринимается слушателем субъективным и сенсорным способом. Аудиосигнал, который воспринимается слушателем согласно субъективному или психологическому фактору, упоминается в качестве психоакустики. Психоакустика не только находится под влиянием физических переменных, включающих в себя акустическое давление, частоту, время и т.д., но также она затрагивается посредством субъективных переменных, включающих в себя громкость, основной тон, оттенок, восприятие относительно звука и т.д.[00261] The sound is not perceived equally by everyone, but is perceived differently according to the environment or the psychological state of the listener. This is because the physical event in the space in which the sound is delivered is perceived by the listener in a subjective and sensory way. An audio signal that is perceived by the listener according to a subjective or psychological factor is referred to as psychoacoustics. Psychoacoustics is not only influenced by physical variables, including acoustic pressure, frequency, time, etc., but it is also affected by subjective variables, including loudness, pitch, hue, perception relative to sound, etc.

[00262] Психоакустика может иметь множество эффектов согласно ситуациям и, например, может включать в себя эффект маскирования, коктейльный эффект, эффект восприятия направления, эффект восприятия расстояния и эффект предшествования. Технология на основе психоакустики используется в различных областях техники, с тем чтобы предоставлять более надлежащий аудиосигнал слушателю.[00262] Psychoacoustics can have a variety of effects according to situations and, for example, can include a masking effect, a cocktail effect, a direction perception effect, a distance perception effect, and a precedence effect. Psychoacoustic-based technology is used in various fields of technology in order to provide a more appropriate audio signal to the listener.

[00263] Эффект предшествования также упоминается как эффект Хааза, в котором когда различные звуки последовательно формируются посредством временной задержки в 1-30 мс, слушатель может воспринимать то, что звуки формируются в местоположении, в котором формируется первый поступающий звук. Тем не менее, если временная задержка между временами формирования двух звуков равна или выше 50 мс, два звука воспринимаются в различных направлениях.[00263] The precedence effect is also referred to as the Haas effect, in which when different sounds are sequentially generated by a time delay of 1-30 ms, the listener may perceive that the sounds are generated at the location where the first incoming sound is generated. However, if the time delay between the generation times of two sounds is equal to or greater than 50 ms, the two sounds are perceived in different directions.

[00264] Например, когда звуковое изображение локализуется, если выходной сигнал правого канала задерживается, звуковое изображение перемещается влево и в силу этого воспринимается как сигнал, воспроизведенный справа, и это явление называется эффектом предшествования или эффектом Хааза.[00264] For example, when an audio image is localized, if the right channel output signal is delayed, the audio image moves to the left and is therefore perceived as the signal reproduced from the right, and this phenomenon is called the precedence effect or the Haas effect.

[00265] Выходной канал объемного звучания используется для того, чтобы добавлять подъем в звуковое изображение, и как проиллюстрировано на фиг. 15, вследствие сигнала выходного канала объемного звучания, возникает явление путаницы передних/задних каналов, так что некоторые слушатели могут воспринимать то, что сигнал фронтального канала исходит с задней стороны.[00265] The surround output channel is used to add lift to the sound image, and as illustrated in FIG. 15, due to the surround output channel signal, a front/rear confusion phenomenon occurs, so that some listeners may perceive that the front channel signal is coming from the rear side.

[00266] Посредством использования вышеуказанного эффекта предшествования, может разрешаться вышеуказанная проблема. Когда предварительно определенная временная задержка добавляется в сигнал выходного канала объемного звучания, чтобы воспроизводить фронтальный входной высотный канал, по сравнению с сигналами из фронтальных выходных каналов, которые присутствуют на уровне от -90 градусов до +90 градусов относительно передней стороны и происходят из числа выходных сигналов для воспроизведения сигнала фронтального входного высотного канала, сигналы из выходных каналов объемного звучания, которые присутствуют на уровне от -180 градусов до -90 градусов или от +90 градусов до +180 градусов относительно передней стороны, воспроизводятся с задержкой.[00266] By using the above precedence effect, the above problem can be resolved. When a predetermined time delay is added to the surround output channel signal to reproduce the front height input channel, compared to signals from the front output channels that are present at -90 degrees to +90 degrees from the front and originate from the number of output signals To reproduce the front height input channel signal, signals from the surround output channels that are present at -180 degrees to -90 degrees or +90 degrees to +180 degrees from the front are delayed.

[00267] Соответственно, даже если аудиосигнал из фронтального входного канала может восприниматься, как если он воспроизводится сзади вследствие уникальной HRTF слушателя, аудиосигнал воспринимается, как если он воспроизводится спереди, где аудиосигнал воспроизводится сначала, согласно эффекту предшествования.[00267] Accordingly, even if the audio signal from the front input channel may be perceived as if it is played back due to the listener's unique HRTF, the audio signal is perceived as if it is played from the front, where the audio signal is played first, according to the precedence effect.

[00268] Фиг. 16 является блок-схемой последовательности операций способа предотвращения путаницы передних/задних каналов, согласно варианту осуществления.[00268] FIG. 16 is a flowchart of a method for preventing front/rear channel confusion, according to an embodiment.

[00269] Модуль рендеринга принимает многоканальный аудиосигнал, включающий в себя множество входных каналов (1610). Входной многоканальный аудиосигнал преобразуется во множество сигналов выходных каналов через рендеринг, и в примере низведения, в котором число выходных каналов меньше числа входных каналов, входной сигнал, имеющий 22.2 каналов, преобразуется в выходной сигнал, имеющий 5.1 каналов или 5.0 каналов.[00269] The rendering module receives a multi-channel audio signal including a plurality of input channels (1610). The input multi-channel audio signal is converted to a plurality of output channel signals through rendering, and in a downmix example in which the number of output channels is less than the number of input channels, an input signal having 22.2 channels is converted to an output signal having 5.1 channels or 5.0 channels.

[00270] Таким образом, когда трехмерный входной аудиосигнал преобразуется посредством рендеринга посредством использования двумерного выходного канала, общий рендеринг применяется к входным каналам на горизонтальной плоскости, и виртуальный рендеринг применяется к высотным каналам, имеющим угол подъема, с тем чтобы применять подъем к ним.[00270] Thus, when a 3D input audio signal is rendered rendered by using a 2D output channel, general rendering is applied to input channels on a horizontal plane, and virtual rendering is applied to height channels having a lift angle so as to apply lift to them.

[00271] Чтобы выполнять рендеринг, требуется коэффициент фильтрации, который должен использоваться в фильтрации, и коэффициент панорамирования, который должен использоваться в панорамировании. Здесь, в процессе инициализации, параметр рендеринга получается согласно стандартной схеме размещения выходного канала и базовому заданному углу подъема для виртуального рендеринга. Базовый заданный угол подъема может определяться различными способами согласно модулю рендеринга, и когда предварительно определенный угол подъема, а не базовый заданный угол подъема, задается согласно предпочтениям пользователя или характеристике входного сигнала, может улучшаться удовлетворенность и эффект виртуального рендеринга.[00271] In order to render, a filter factor to be used in filtering and a pan factor to be used in panning are required. Here, during the initialization process, the rendering parameter is obtained according to the standard output channel layout and the base preset elevation angle for virtual rendering. The base predetermined elevation angle may be determined in various ways according to the renderer, and when the predetermined elevation angle rather than the base predetermined elevation angle is set according to the user's preference or input signal characteristic, satisfaction and virtual rendering effect can be improved.

[00272] Чтобы предотвращать путаницу передних/задних каналов вследствие канала объемного звучания, временная задержка добавляется в выходной канал объемного звучания относительно фронтального высотного канала (1620).[00272] To prevent front/rear channel confusion due to the surround channel, a time delay is added to the surround output channel relative to the front height channel (1620).

[00273] Когда предварительно определенная временная задержка добавляется в сигнал выходного канала объемного звучания, чтобы воспроизводить фронтальный входной высотный канал, по сравнению с сигналами из фронтальных выходных каналов, которые присутствуют на уровне от -90 градусов до +90 градусов относительно передней стороны и происходят из числа выходных сигналов для воспроизведения сигнала фронтального входного высотного канала, сигналы из выходных каналов объемного звучания, которые присутствуют на уровне от -180 градусов до -90 градусов или от +90 градусов до +180 градусов относительно передней стороны, воспроизводятся с задержкой.[00273] When a predetermined time delay is added to the surround output channel signal to reproduce the front height input channel, compared to signals from the front output channels that are present at -90 degrees to +90 degrees from the front and originate from number of output signals to reproduce the front height input channel signal, signals from the surround output channels that are present at -180 degrees to -90 degrees or +90 degrees to +180 degrees from the front are delayed.

[00274] Соответственно, даже если аудиосигнал из фронтального входного канала может восприниматься, как если он воспроизводится сзади вследствие уникальной HRTF слушателя, аудиосигнал воспринимается, как если он воспроизводится спереди, где аудиосигнал воспроизводится сначала, согласно эффекту предшествования.[00274] Accordingly, even if the audio signal from the front input channel may be perceived as if it is played back due to the listener's unique HRTF, the audio signal is perceived as if it is played from the front, where the audio signal is played first, according to the precedence effect.

[00275] Как описано выше, чтобы воспроизводить фронтальный высотный канал посредством задержки выходного канала объемного звучания относительно фронтального высотного канала, модуль рендеринга изменяет параметр рендеринга подъема на основе задержки, добавляемой в выходной канал объемного звучания (1630).[00275] As described above, in order to reproduce the front height channel by delaying the surround output channel relative to the front height channel, the renderer changes the lift rendering parameter based on the delay added to the surround output channel (1630).

[00276] Когда параметр рендеринга подъема изменяется, модуль рендеринга формирует выходной канал объемного звучания после рендеринга подъема на основе измененного параметра рендеринга подъема (1640). Подробнее, рендеринг выполняется посредством применения измененного параметра рендеринга подъема к сигналу входного высотного канала, так что формируется сигнал выходного канала объемного звучания. Таким образом, выходной канал объемного звучания после рендеринга подъема, который задерживается относительно фронтального входного высотного канала на основе измененного параметра рендеринга подъема, может предотвращать путаницу передних/задних каналов вследствие выходного канала объемного звучания.[00276] When the lift rendering parameter is changed, the renderer generates a surround output channel after the lift rendering based on the changed lift rendering parameter (1640). More specifically, rendering is performed by applying a modified lift rendering parameter to a height input channel signal so that a surround output channel signal is generated. Thus, the surround output channel after lift rendering, which is delayed relative to the front height input channel based on the changed lift rendering parameter, can prevent front/rear channel confusion due to the surround output channel.

[00277] Временная задержка, применяемая к выходному каналу объемного звучания, предпочтительно составляет приблизительно 2,7 мс и приблизительно 91,5 см по расстоянию, что соответствует 128 выборкам, т.е. двум выборкам из квадратурного зеркального фильтра (QMF) при 48 кГц. Тем не менее, чтобы предотвращать путаницу передних/задних каналов, задержка, добавляемая в выходной канал объемного звучания, может варьироваться согласно частоте дискретизации и окружению воспроизведения.[00277] The time delay applied to the surround output channel is preferably about 2.7 ms and about 91.5 cm in distance, corresponding to 128 samples, i.e. two samples from a quadrature mirror filter (QMF) at 48 kHz. However, to prevent front/rear channel confusion, the delay added to the surround output channel may vary according to the sample rate and playback environment.

[00278] Здесь, когда конфигурация выходного канала имеет отклонение относительно стандартной схемы размещения выходного канала, либо когда подъем, при котором должен выполняться виртуальный рендеринг, отличается от базового заданного угла подъема модуля рендеринга, параметр рендеринга обновляется. Обновленный параметр рендеринга может включать в себя коэффициент фильтрации, обновленный посредством суммирования, с начальным значением коэффициента фильтрации, весового коэффициента, определенного на основе отклонения углов подъема, или может включать в себя коэффициент панорамирования, обновленный посредством увеличения или уменьшения начального значения коэффициента панорамирования согласно результату сравнения угла подъема входного канала с базовым заданным углом подъема.[00278] Here, when the output channel configuration has a deviation from the standard output channel layout, or when the elevation at which virtual rendering is to be performed differs from the base preset elevation angle of the renderer, the rendering parameter is updated. The updated render parameter may include a filter coefficient updated by summing with an initial value of the filter coefficient, a weighting coefficient determined based on elevation deviation, or may include a pan coefficient updated by increasing or decreasing the initial value of the pan coefficient according to the comparison result. the angle of inlet channel elevation with the base predetermined angle of elevation.

[00279] Если присутствует фронтальный входной высотный канал, который должен подвергаться пространственному рендерингу подъема, задержанные QMF-выборки фронтального входного канала суммируются со входной QMF-выборкой, и матрица низведения расширяется на измененный коэффициент.[00279] If there is a front input height channel to be subjected to spatial lifting rendering, the delayed QMF samples of the front input channel are added to the input QMF sample and the downmix matrix is expanded by the modified factor.

[00280] Ниже подробно описывается способ добавления временной задержки во фронтальный входной высотный канал и изменения матрицы рендеринга (низведения).[00280] The method for adding a time delay to the front height input channel and changing the rendering matrix (downmix) is described in detail below.

[00281] Когда число входных каналов составляет Nin, относительно i-ого входного канала из числа [1 Nin] каналов, если i-ый входной канал представляет собой один из входных высотных каналов CH_U_L030, CH_U_L045, CH_U_R030, CH_U_R045 и CH_U_000, задержка QMF-выборки входного канала и задержанная QMF-выборка определяются согласно уравнению 21 и уравнению 22.[00281] When the number of input channels is Nin, with respect to the i-th input channel of [1 Nin] channels, if the i-th input channel is one of the input height channels CH_U_L030, CH_U_L045, CH_U_R030, CH_U_R045, and CH_U_000, the delay QMF is the input channel samples and the delayed QMF sample are determined according to Equation 21 and Equation 22.

[00282] уравнение 21[00282] Equation 21

[00283] delay=round(f_s*0,003/64)[00283] delay=round( _fs *0.003/64)

[00284] уравнение 22[00284] Equation 22

[00285]

,[00285]

,

[00286] где f_s указывает частоту дискретизации, и

указывает n-ую подполосную QMF-выборку k-ой полосы частот. Временная задержка, применяемая к выходному каналу объемного звучания, предпочтительно составляет приблизительно 2,7 мс и приблизительно 91,5 см по расстоянию, что соответствует 128 выборкам, т.е. двум QMF-выборкам при 48 кГц. Тем не менее, чтобы предотвращать путаницу передних/задних каналов, задержка, добавляемая в выходной канал объемного звучания, может варьироваться согласно частоте дискретизации и окружению воспроизведения.[00286] where f _s indicates the sampling rate, and

indicates the n-th subband QMF sample of the k-th band. The time delay applied to the surround output channel is preferably about 2.7 ms and about 91.5 cm in distance, corresponding to 128 samples, i.e. two QMF samples at 48 kHz. However, to prevent front/rear channel confusion, the delay added to the surround output channel may vary according to the sample rate and playback environment.

[00287] Измененная матрица рендеринга (низведения) определяется согласно уравнениям 23-25.[00287] The modified rendering matrix (reduced) is determined according to Equations 23-25.

[00288] уравнение 23[00288] Equation 23

[00289]

[00290] уравнение 24[00290] Equation 24

[00291]

[00292] уравнение 25[00292] Equation 25

[00293] Nin=Nin +1,[00293] Nin=Nin+1,

где

указывает матрицу низведения для рендеринга подъема,

указывает матрицу низведения для общего рендеринга, и Nout указывает число выходных каналов.where

specifies the reduction matrix to render the rise,

specifies the reduction matrix for general rendering, and Nout specifies the number of output channels.

[00294] Чтобы завершать матрицу низведения для каждого из входных каналов, Nin увеличивается на 1, и процедура из уравнения 3 и уравнения 4 повторяется. Чтобы получать матрицу низведения относительно одного входного канала, требуется получать параметры низведения для выходных каналов.[00294] To complete the downmix matrix for each of the input channels, Nin is incremented by 1 and the procedure from Equation 3 and Equation 4 is repeated. To get the downmix matrix with respect to one input channel, you need to get the downmix parameters for the output channels.

[00295] Параметр низведения j-ого выходного канала относительно i-ого входного канала определяется так, как пояснено ниже.[00295] The downmix parameter of the j-th output channel relative to the i-th input channel is determined as explained below.

[00296] Когда число выходных каналов составляет Nout, относительно j-ого выходного канала из числа [1 Nout] каналов, если j-ый выходной канал представляет собой один из каналов CH_M_L110 и CH_M_R110 объемного звучания, параметр низведения, который должен применяться к выходному каналу, определяется согласно уравнению 26.[00296] When the number of output channels is Nout, with respect to the j-th output channel of [1 Nout] channels, if the j-th output channel is one of the surround channels CH_M_L110 and CH_M_R110, the downmix parameter to be applied to the output channel , is determined according to Equation 26.

[00297] уравнение 26[00297] Equation 26

[00298]

[00299] Когда число выходных каналов составляет Nout, относительно j-ого выходного канала из числа [1 Nout], если j-ый выходной канал не представляет собой канал CH_M_L110 или CH_M_R110 объемного звучания, параметр низведения, который должен применяться к выходному каналу, определяется согласно уравнению 27.[00299] When the number of output channels is Nout, with respect to the j-th output channel of [1 Nout], if the j-th output channel is not the surround channel CH_M_L110 or CH_M_R110, the downmix parameter to be applied to the output channel is determined according to equation 27.

[00300] уравнение 27[00300] Equation 27

[00301]

[00302] Здесь, если схема размещения динамиков выходного канала имеет отклонение относительно стандартной схемы размещения, может добавляться процесс для компенсации эффекта вследствие разности, но его подробное описание опускается. Отклонение выходного канала может включать в себя информацию отклонения согласно разности между углами подъема или азимутальными углами.[00302] Here, if the speaker layout of the output channel has a deviation from the standard layout, a process may be added to compensate for the effect due to the difference, but its detailed description will be omitted. The output channel deviation may include deviation information according to a difference between elevation angles or azimuth angles.

[00303] Фиг. 17 иллюстрирует горизонтальные каналы и фронтальные высотные каналы, когда задержка добавляется в выходные каналы объемного звучания, согласно варианту осуществления.[00303] FIG. 17 illustrates the horizontal channels and front height channels when a delay is added to the surround output channels, according to an embodiment.

[00304] В варианте осуществления по фиг. 17, аналогично варианту осуществления по фиг. 14, предполагается, что выходной канал представляет собой 5.0 каналов (теперь показан канал низкочастотного динамика), и фронтальные входные высотные каналы преобразуются посредством рендеринга в горизонтальные выходные каналы. 5.0 каналов присутствуют на горизонтальной плоскости 1410 и включают в себя передний центральный (FC) канал, передний левый (FL) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR).[00304] In the embodiment of FIG. 17, similar to the embodiment of FIG. 14, the output channel is assumed to be 5.0 channels (the woofer channel is now shown), and the front height input channels are rendered converted to horizontal output channels. 5.0 channels are present on the horizontal plane 1410 and include a front center (FC) channel, a front left (FL) channel, a front right (FR) channel, a surround left (SL) channel, and a surround right (SR) channel.

[00305] Фронтальные высотные каналы представляют собой каналы, соответствующие верхнему уровню 1420 по фиг. 14, и в варианте осуществления, показанном на фиг. 14, фронтальные высотные каналы включают в себя верхний передний центральный (TFC) канал, верхний передний левый (TFL) канал и верхний передний правый (TFR) канал.[00305] Frontal height channels are channels corresponding to the upper layer 1420 of FIG. 14 and in the embodiment shown in FIG. 14, the front height channels include a top front center (TFC) channel, a top front left (TFL) channel, and a top front right (TFR) channel.

[00306] В варианте осуществления по фиг. 17, аналогично варианту осуществления по фиг. 14, когда предполагается, что входной канал представляет собой 22.2 каналов, входные сигналы 24 каналов преобразуются посредством рендеринга (низводятся), чтобы формировать выходные сигналы 5 каналов. Здесь, компоненты, которые надлежащим образом соответствуют входным сигналам 24 каналов, распределены в 5-канальном выходном сигнале согласно правилу рендеринга. Следовательно, выходные каналы, т.е. FC-канал, FL-канал, FR-канал, SL-канал и SR-канал, соответственно, включают в себя компоненты, соответствующие входным сигналам.[00306] In the embodiment of FIG. 17, similar to the embodiment of FIG. 14, when it is assumed that the input channel is 22.2 channels, the input signals of 24 channels are rendered converted (downmixed) to generate output signals of 5 channels. Here, the components that properly match the 24-channel input signals are distributed in the 5-channel output signal according to the rendering rule. Therefore, the output channels, i.e. The FC channel, FL channel, FR channel, SL channel, and SR channel, respectively, include components corresponding to input signals.

[00307] В этом отношении, число фронтальных высотных каналов, число горизонтальных каналов, азимутальные углы и углы подъема высотных каналов могут определяться различными способами согласно схеме размещения каналов. Когда входной канал представляет собой 22.2 каналов или 22.0 каналов, фронтальный высотный канал может включать в себя, по меньшей мере, один из CH_U_L030, CH_U_R030, CH_U_L045, CH_U_R045 и CH_U_000. Когда выходной канал представляет собой 5.0 каналов или 5.1 каналов, канал объемного звучания может включать в себя, по меньшей мере, один из CH_M_L110 и CH_M_R110.[00307] In this regard, the number of frontal height channels, the number of horizontal channels, the azimuth angles and elevation angles of the height channels may be determined in various ways according to the channel layout. When the input channel is 22.2 channels or 22.0 channels, the front height channel may include at least one of CH_U_L030, CH_U_R030, CH_U_L045, CH_U_R045, and CH_U_000. When the output channel is 5.0 channels or 5.1 channels, the surround channel may include at least one of CH_M_L110 and CH_M_R110.

[00308] Тем не менее, специалистам в данной области техники должно быть очевидным, что даже если несколько входных и выходных каналов не совпадают со стандартной схемой размещения, многоканальная схема размещения может конфигурироваться различными способами согласно углу подъема и азимутальному углу каждого канала.[00308] However, those skilled in the art will appreciate that even if the multiple input and output channels do not match the standard layout, the multi-channel layout can be configured in various ways according to the elevation angle and azimuth angle of each channel.

[00309] Здесь, чтобы предотвращать явление путаницы передних/задних каналов, возникающее вследствие SL-канала и SR-канала, предварительно определенная задержка добавляется во фронтальный входной высотный канал, который преобразуется посредством рендеринга через выходной канал объемного звучания. Выходной канал объемного звучания после рендеринга подъема, который задерживается относительно фронтального входного высотного канала на основе измененного параметра рендеринга подъема, может предотвращать путаницу передних/задних каналов вследствие выходного канала объемного звучания.[00309] Here, in order to prevent the phenomenon of front/rear channel confusion due to the SL channel and the SR channel, a predetermined delay is added to the front height input channel, which is converted by rendering through the surround output channel. The surround output channel after lift rendering, which is delayed relative to the front height input channel based on the changed lift rendering parameter, can prevent front/rear channel confusion due to the surround output channel.

[00310] Способы получения параметра рендеринга подъема, измененного на основе аудиосигнала с добавленной задержкой и добавленной задержки, показаны в уравнениях 1-7. Как подробно описано в варианте осуществления по фиг. 16, их подробное описание опускается в варианте осуществления по фиг. 17.[00310] Methods for obtaining a rise rendering parameter modified based on an added delay and added delay audio signal are shown in Equations 1-7. As detailed in the embodiment of FIG. 16, their detailed description is omitted in the embodiment of FIG. 17.

[00311] Временная задержка, применяемая к выходному каналу объемного звучания, предпочтительно составляет приблизительно 2,7 мс и приблизительно 91,5 см по расстоянию, что соответствует 128 выборкам, т.е. двум QMF-выборкам при 48 кГц. Тем не менее, чтобы предотвращать путаницу передних/задних каналов, задержка, добавляемая в выходной канал объемного звучания, может варьироваться согласно частоте дискретизации и окружению воспроизведения.[00311] The time delay applied to the surround output channel is preferably about 2.7 ms and about 91.5 cm in distance, corresponding to 128 samples, i.e. two QMF samples at 48 kHz. However, to prevent front/rear channel confusion, the delay added to the surround output channel may vary according to the sample rate and playback environment.

[00312] Фиг. 18 иллюстрирует горизонтальный канал и верхний передний центральный (TFC) канал, согласно варианту осуществления.[00312] FIG. 18 illustrates a horizontal channel and a top front center (TFC) channel, according to an embodiment.

[00313] Согласно варианту осуществления, показанному на фиг. 18, предполагается, что выходной канал представляет собой 5.0 каналов (теперь показан канал низкочастотного динамика), и верхний передний центральный (TFC) канал преобразуется посредством рендеринга в горизонтальный выходной канал. 5.0 каналов присутствуют на горизонтальной плоскости 1810 и включают в себя передний центральный (FC) канал, передний левый (FL) канал, передний правый (FR) канал, левый канал объемного звучания (SL) и правый канал объемного звучания (SR). TFC-канал соответствует верхнему уровню 1820 по фиг. 18, и предполагается, что TFC-канал имеет 0-ой азимутальный угол и расположен с предварительно определенным углом подъема.[00313] According to the embodiment shown in FIG. 18, it is assumed that the output channel is 5.0 channels (the woofer channel is now shown), and the top front center (TFC) channel is converted by rendering to a horizontal output channel. 5.0 channels are present on the horizontal plane 1810 and include a front center (FC) channel, a front left (FL) channel, a front right (FR) channel, a surround left (SL) channel, and a surround right (SR) channel. The TFC channel corresponds to upper layer 1820 of FIG. 18, and it is assumed that the TFC channel has a 0-th azimuth angle and is located at a predetermined elevation angle.

[00314] Как описано выше, очень важно предотвращать перестановку левых/правых каналов звукового изображения, когда аудиосигнал преобразуется посредством рендеринга. Чтобы преобразовать посредством рендеринга входной высотный канал, имеющий угол подъема, в горизонтальный выходной канал, требуется выполнять виртуальный рендеринг, и сигналы многоканальных входных каналов панорамируются в многоканальные выходные сигналы через рендеринг.[00314] As described above, it is very important to prevent the left/right channels of the audio image from being interchanged when the audio signal is converted by rendering. In order to render an input height channel having a pitch angle into a horizontal output channel, virtual rendering is required, and multi-channel input channel signals are panned to multi-channel output signals via rendering.

[00315] Для виртуального рендеринга, который предоставляет ощущение приподнятости при конкретном подъеме, определяются коэффициент панорамирования и коэффициент фильтрации, и в этом отношении, для входного сигнала TFT-канала, звуковое изображение должно быть расположено перед слушателем, т.е. в станде, так что коэффициенты панорамирования FL-канала и FR-канала определяются с тем, чтобы обеспечивать расположение звукового изображения TFC-канала в центре.[00315] For a virtual rendering that provides a sense of elevation at a particular lift, a panning factor and a filtering factor are determined, and in this regard, for a TFT channel input signal, the audio image must be located in front of the listener, i.e. in a stand so that the pan ratios of the FL channel and the FR channel are determined so as to ensure that the TFC channel sound image is centered.

[00316] В случае если схема размещения выходных каналов совпадает со стандартной схемой размещения, коэффициенты панорамирования FL-канала и FR-канала должны быть идентичными, и коэффициенты панорамирования SL-канала и SR-канала также должны быть идентичными.[00316] In case the output channel layout is the same as the standard layout, the pan gains of the FL channel and the FR channel should be identical, and the pan gains of the SL channel and the SR channel should also be identical.

[00317] Как описано выше, поскольку коэффициенты панорамирования левых и правых каналов для рендеринга входного TFC-канала должны быть идентичными, невозможно регулировать коэффициенты панорамирования левых и правых каналов, с тем чтобы регулировать подъем входного TFC-канала. Следовательно, коэффициенты панорамирования для передних и задних каналов регулируются, с тем чтобы применять ощущение приподнятости посредством рендеринга входного TFC-канала.[00317] As described above, since the pan coefficients of the left and right channels for rendering the TFC input channel must be identical, it is not possible to adjust the pan coefficients of the left and right channels so as to adjust the elevation of the TFC input channel. Therefore, the panning ratios for the front and rear channels are adjusted so as to apply a sense of elevation through the rendering of the TFC input channel.

[00318] Когда опорный угол подъема составляет 35 градусов, и угол подъема входного TFC-канала, который должен преобразовываться посредством рендеринга, составляет elv, коэффициенты панорамирования SL-канала и SR-канала для виртуального рендеринга TFC-канала в угол elv подъема, соответственно, определяются согласно уравнению 28 и уравнению 29.[00318] When the reference elevation angle is 35 degrees, and the elevation angle of the input TFC channel to be transformed by rendering is elv, the pan coefficients of the SL channel and the SR channel for virtual rendering of the TFC channel to the elevation angle elv, respectively, determined according to Equation 28 and Equation 29.

[00319] уравнение 28[00319] Equation 28

[00320]

[00321] уравнение 29[00321] Equation 29

[00322]

,[00322]

,

где

является коэффициентом панорамирования SL-канала для выполнения виртуального рендеринга с опорным углом подъема, который составляет 35 градусов, и

является коэффициентом панорамирования SR-канала для выполнения виртуального рендеринга с опорным углом подъема, который составляет 35 градусов;

является индексом относительно входного высотного канала, и уравнение 28 и уравнение 29 указывают взаимосвязь между начальным значением коэффициента панорамирования и обновленным коэффициентом панорамирования, когда входной высотный канал представляет собой TFC-канал.where

is the pan factor of the SL channel to perform virtual rendering with a reference elevation angle of 35 degrees, and

is the SR channel pan factor for performing virtual rendering with a reference elevation angle that is 35 degrees;

is an index relative to the input height channel, and Equation 28 and Equation 29 indicate the relationship between the initial value of the pan gain and the updated pan gain when the input height channel is a TFC channel.

[00323] Здесь, чтобы постоянно поддерживать энергетический уровень выходного сигнала, коэффициенты панорамирования, полученные посредством использования уравнения 28 и уравнения 29, не используются неизменно, а нормализуются по мощности посредством использования уравнения 30 и уравнения 31, и затем используются.[00323] Here, in order to constantly maintain the energy level of the output signal, the pan coefficients obtained by using Equation 28 and Equation 29 are not used unchanged, but are normalized in power by using Equation 30 and Equation 31, and then used.

[00324] уравнение 30[00324] Equation 30

[00325]

[00326] уравнение 31[00326] Equation 31

[00327]

[00328] Таким образом, процесс нормализации мощности выполняется таким образом, что общая сумма квадрата коэффициентов панорамирования входного канала становится 1, и за счет этого может в равной степени поддерживаться энергетический уровень выходного сигнала до того, как обновляются коэффициенты панорамирования, и энергетический уровень выходного сигнала после того, как обновляются коэффициенты панорамирования.[00328] Thus, the power normalization process is performed such that the total sum of the squared pan coefficients of the input channel becomes 1, and thereby the energy level of the output signal before the pan coefficients are updated and the energy level of the output signal can be equally maintained. after the pan coefficients are updated.

[00329] Варианты осуществления согласно настоящему изобретению также могут быть осуществлены в качестве программируемых команд, которые должны выполняться в различных компьютерных конфигурационных элементах, и затем могут записываться на машиночитаемый носитель записи. Машиночитаемый носитель записи может включать в себя одно или более из программируемых команд, файлов данных, структур данных и т.п. Программируемые команды, записанные на машиночитаемый носитель записи, могут быть специально разработаны или сконфигурированы для изобретения либо могут быть известны специалистам в области техники компьютерного программного обеспечения. Примеры машиночитаемого носителя записи включают в себя магнитные носители, включающие в себя жесткие диски, магнитные ленты и гибкие диски, оптические носители, включающие в себя CD-ROM и DVD, магнитооптические носители, включающие в себя флоптические диски, и аппаратное устройство, сконструированное с возможностью сохранять и выполнять программируемые команды в постоянном запоминающем устройстве (ROM), оперативном запоминающем устройстве (RAM), флэш-памяти и т.п. Примеры программируемых команд включают в себя не только машинные коды, сформированные посредством компилятора, но также и включают в себя объемные коды, которые должны выполняться в компьютере посредством использования интерпретатора. Аппаратное устройство может быть выполнено с возможностью выступать в качестве одного или более программных модулей, с тем чтобы выполнять этапы для изобретения, либо наоборот.[00329] Embodiments of the present invention may also be implemented as programmable instructions to be executed on various computer configuration items and then recorded on a computer-readable recording medium. The computer-readable recording medium may include one or more of programmable instructions, data files, data structures, and the like. Programmable instructions recorded on a computer-readable recording medium may be specially designed or configured for the invention, or may be known to those skilled in the art of computer software. Examples of the computer-readable recording medium include magnetic media including hard disks, magnetic tapes, and floppy disks, optical media including CD-ROMs and DVDs, magneto-optical media including floppy disks, and a hardware device designed to store and execute programmable instructions in read-only memory (ROM), random access memory (RAM), flash memory, and the like. Examples of programmable instructions include not only machine codes generated by a compiler, but also include large codes to be executed in a computer by using an interpreter. The hardware device may be configured to act as one or more software modules in order to perform the steps for the invention, or vice versa.

[00330] Хотя подробное описание конкретно описано со ссылкой на неочевидные признаки настоящего изобретения, специалисты в данной области техники должны понимать, что различные исключения, замены и изменения в форме и деталях вышеуказанного устройства и способа могут вноситься без отступления от сущности и объема прилагаемой формулы изобретения.[00330] While the detailed description is specifically described with reference to non-obvious features of the present invention, those skilled in the art will appreciate that various exceptions, substitutions, and changes in the form and details of the above apparatus and method may be made without departing from the spirit and scope of the appended claims. .

[00331] Следовательно, объем настоящего изобретения задается не посредством подробного описания изобретения, а посредством прилагаемой формулы изобретения, и любые отличия в пределах объема должны истолковываться как включенные в настоящее изобретение.[00331] Therefore, the scope of the present invention is not defined by the detailed description of the invention, but by the appended claims, and any differences within the scope are to be construed as being included in the present invention.

Claims

1. A method for rendering an audio signal rise, the method comprising the steps of:

- receive multi-channel signals, including the signal of the input altitude channel of a predetermined elevation angle;

- get the first rendering parameters of the rise for the input height channel signal of the standard angle of rise;

receiving a delayed height input channel signal by applying a predetermined delay to the height input channel signal, wherein the label of said height input channel signal is one of the front height channel labels;

- updating the first elevation rendering parameters based on the specified predefined elevation angle in the case when the predetermined elevation angle is higher than the specified standard elevation angle;

receiving second lift rendering parameters based on a height input channel signal label and two output channel signal labels, said two output channel signal labels being surround channel labels; and

converting by lifting rendering the multi-channel signals and said delayed input height channel signal to output a plurality of output channel signals of the elevated sound image based on the updated first lifting rendering parameters and the second lifting rendering parameters.

2. The method of claim 1, wherein updating said first lifting rendering parameters comprises updating at least one of the panning gains or lifting filter coefficients.

3. The method of claim 2, wherein the panning gain update is determined based on the equation:

or

,

where G _vHO,5~6 (i _in ) are the first elevation rendering parameters and G _vH,5~6 (i _in ) are the updated elevation rendering parameters, in the case where the standard elevation angle is 35 degrees and the height input signal label i _in represents the top front center.