JP2022092184A - Voice signal processing device and voice signal processing program - Google Patents

Voice signal processing device and voice signal processing program Download PDF

Info

Publication number
JP2022092184A
JP2022092184A JP2020204835A JP2020204835A JP2022092184A JP 2022092184 A JP2022092184 A JP 2022092184A JP 2020204835 A JP2020204835 A JP 2020204835A JP 2020204835 A JP2020204835 A JP 2020204835A JP 2022092184 A JP2022092184 A JP 2022092184A
Authority
JP
Japan
Prior art keywords
sound
sound source
indirect
direct
signal processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2020204835A
Other languages
Japanese (ja)
Inventor
渉 波多野
Wataru Hatano
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tamura Corp
Original Assignee
Tamura Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tamura Corp filed Critical Tamura Corp
Priority to JP2020204835A priority Critical patent/JP2022092184A/en
Publication of JP2022092184A publication Critical patent/JP2022092184A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

To provide a voice signal processing device capable of up-mixing without distorting a stereo sound source.SOLUTION: A voice signal processing device 100 is used to up-mix a stereo sound source to a surrounding sound source. The voice signal processing device 100 includes a separation unit 10, for separating the stereo sound source into a direct sound and an indirect sound, a setting unit 20, for generating parameters for adjusting at least one of the direct sound and the indirect sound, a coefficient generating unit 30, for generating coefficients to be multiplied on the direct sound and the indirect sound for each channel of the surrounding sound source on the basis of the parameters, and a calculation unit 40, for multiplying the coefficients on the direct sound and indirect sound to up-mix a stereo sound source to the surrounding sound source.SELECTED DRAWING: Figure 2

Description

本発明は、音質の低下を抑制しつつ音声信号をアップミックスする音声信号処理装置、音声信号処理プログラムに関する。 The present invention relates to an audio signal processing device and an audio signal processing program that upmix an audio signal while suppressing deterioration of sound quality.

近年、4K放送や8K放送の実現に伴い、ステレオ(2ch)の音声フォーマットをアップミックスして5.1chサラウンドや3Dオーディオに対応する22.2chサラウンドの音声フォーマットを生成する需要が高まっている。生放送では、ステレオの音声フォーマットから5.1chサラウンドや22.2chサラウンドの音声フォーマットをリアルタイムで生成することにより、2K放送と同時に4K放送や8K放送を行うこともある。 In recent years, with the realization of 4K broadcasting and 8K broadcasting, there is an increasing demand for upmixing stereo (2ch) audio formats to generate 22.2ch surround audio formats corresponding to 5.1ch surround and 3D audio. In live broadcasting, 4K broadcasting or 8K broadcasting may be performed at the same time as 2K broadcasting by generating 5.1ch surround or 22.2ch surround audio formats in real time from stereo audio formats.

アップミックスの具体的な手法としては、特許文献1に記載されているように、ステレオの音源を左右それぞれで直接音と間接音とに分離し、これら4つの音源に対して遅延処理などの各種処理を行うことにより、サラウンドにおける各チャンネルの出力とする。また、特許文献2に記載されている技術では、ステレオの音源を左右それぞれで直接音と間接音とに分離した後に、HRIRを用いてアップミックスする手法も知られている。なお、ステレオの音源を直接音と間接音とに分離する手法としては、特許文献3に記載されているように、ステレオの音源からコヒーレント成分を抽出する方法が優れている。 As a specific method of upmixing, as described in Patent Document 1, stereo sound sources are separated into direct sound and indirect sound on the left and right sides, and various types such as delay processing are performed on these four sound sources. By performing the processing, the output of each channel in surround is obtained. Further, in the technique described in Patent Document 2, there is also known a method of separating a stereo sound source into a direct sound and an indirect sound on each of the left and right sides, and then upmixing them using an HRIR. As a method for separating a stereo sound source into a direct sound and an indirect sound, a method of extracting a coherent component from the stereo sound source is excellent as described in Patent Document 3.

特開2015-076857号公報Japanese Unexamined Patent Publication No. 2015-06857 特開2017-163458号公報JP-A-2017-163458 国際公開第2017/188141号International Publication No. 2017/188141

しかしながら、特許文献1及び2においては、ステレオの音源を分離した後、遅延処理やHRIRに伴うフィルタ処理を行うため、元の音源に歪みが生じるという問題があった。特に、近年ではステレオの音源からアップミックスして生成したサラウンドの音源を、再びステレオの音源にダウンミックスするという需要もあるが、アップミックスの際に元の音源に歪みが生じていると、ステレオの音源にダウンミックスした際にもこのような歪みが残るという問題もあった。また、特許文献2においては、リファレンスのHRIRを必要としているが、入手が困難という問題もあった。 However, in Patent Documents 1 and 2, since the stereo sound source is separated and then the delay processing and the filter processing associated with the HRIR are performed, there is a problem that the original sound source is distorted. In particular, in recent years, there has been a demand to downmix a surround sound source generated by upmixing from a stereo sound source to a stereo sound source again, but if the original sound source is distorted during upmixing, it is stereo. There was also the problem that such distortion remained even when downmixing to the sound source of. Further, in Patent Document 2, although a reference HRIR is required, there is also a problem that it is difficult to obtain it.

本発明は、上記課題を解決すべく、ステレオの音源に歪みを生じさせないようにアップミックスすることの出来る音声信号処理装置を提供することを目的とする。 An object of the present invention is to provide an audio signal processing device capable of upmixing a stereo sound source so as not to cause distortion in order to solve the above problems.

本発明の音声信号処理装置は、次のような構成を備える。
(1)ステレオの音源をサラウンドの音源にアップミックスする音声信号処理装置である。
(2)前記ステレオの音源を直接音と間接音とに分離する分離部。
(3)前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部。
(4)前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部。
(5)前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算部。
The audio signal processing device of the present invention has the following configuration.
(1) An audio signal processing device that upmixes a stereo sound source to a surround sound source.
(2) A separation unit that separates the stereo sound source into direct sound and indirect sound.
(3) A setting unit that generates parameters for adjusting at least one of the direct sound and the indirect sound.
(4) A coefficient generation unit that generates a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameter.
(5) A calculation unit that upmixes the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.

また、本発明の音声信号処理装置は、次のような構成を更に備えてもよい。
(1)前記パラメータは、前記サラウンドの音源のフロント側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む。
(2)前記パラメータは、前記サラウンドの音源のリア側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む。
(3)前記パラメータは、前記サラウンドの音源のフロント側チャンネルから出力される前記直接音に対して、前記間接音のミキシング量を調整するためのものを含む。
(4)前記サラウンドの音源は、3Dオーディオに対応し、前記パラメータは、前記サラウンドの音源における中層のチャンネルから出力される前記直接音及び前記間接音と、上下層のチャンネルから出力される前記直接音及び前記間接音とのバランスを調整するものを含む。
(5)前記パラメータは、前記直接音と前記間接音とのバランスを調整するためのものを含む。
(6)前記設定部は、直接音/間接音バランス調整部を備え、前記直接音/間接音バランス調整部は、前記直接音と前記間接音とのバランスを調整する。
Further, the audio signal processing device of the present invention may further include the following configurations.
(1) The parameter includes a parameter for adjusting the balance between a center sound source and a sound source other than the center sound source in the front channel of the surround sound source.
(2) The parameter includes a parameter for adjusting the balance between the center sound source and a sound source other than the center sound source in the rear channel of the surround sound source.
(3) The parameter includes a parameter for adjusting the mixing amount of the indirect sound with respect to the direct sound output from the front side channel of the surround sound source.
(4) The surround sound source corresponds to 3D audio, and the parameters are the direct sound and the indirect sound output from the middle layer channel in the surround sound source, and the direct sound output from the upper and lower layer channels. Includes those that adjust the balance between sound and the indirect sound.
(5) The parameter includes a parameter for adjusting the balance between the direct sound and the indirect sound.
(6) The setting unit includes a direct sound / indirect sound balance adjusting unit, and the direct sound / indirect sound balance adjusting unit adjusts the balance between the direct sound and the indirect sound.

本発明の音声信号処理プログラムは、次のような構成を備える。
(1)コンピュータにステレオの音源をサラウンドの音源にアップミックスする処理を実行させる音声信号処理プログラムである。
(2)前記ステレオの音源を直接音と間接音とに分離する分離手順。
(3)前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定手順。
(4)前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成手順。
(5)前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算手順。
The audio signal processing program of the present invention has the following configuration.
(1) An audio signal processing program that causes a computer to execute a process of upmixing a stereo sound source to a surround sound source.
(2) Separation procedure for separating the stereo sound source into direct sound and indirect sound.
(3) A setting procedure for generating a parameter for adjusting at least one of the direct sound or the indirect sound.
(4) A coefficient generation procedure for generating a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameter.
(5) A calculation procedure for upmixing the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.

本発明によれば、ステレオの音源に歪みを生じさせないようにアップミックスすることが出来る。 According to the present invention, it is possible to upmix a stereo sound source so as not to cause distortion.

実施形態の音声信号処理装置の構成を示すブロック図。The block diagram which shows the structure of the audio signal processing apparatus of embodiment. 実施形態の音声信号処理装置の構成の一部を詳細に示すブロック図。The block diagram which shows a part of the structure of the audio signal processing apparatus of embodiment in detail. 実施形態の直接音/間接音バランス調整部における作用を示す図。The figure which shows the operation in the direct sound / indirect sound balance adjustment part of embodiment. 実施形態のフロントバランス調整部における作用を示す図。The figure which shows the operation in the front balance adjustment part of an embodiment. 実施形態のリアバランス調整部における作用を示す図。The figure which shows the operation in the rear balance adjustment part of an embodiment. 実施形態のミキシング量調整部における作用を示す図。The figure which shows the operation in the mixing amount adjustment part of an embodiment. 実施形態の層間バランス調整部における作用を示す図。The figure which shows the operation in the interlayer balance adjustment part of an embodiment. 実施形態の演算部における作用を示す図。The figure which shows the operation in the arithmetic part of embodiment. 実施形態の音声信号処理装置の作用を示すフローチャート。The flowchart which shows the operation of the audio signal processing apparatus of embodiment. 他の実施形態の音声信号処理装置の構成の一部を詳細に示すブロック図。The block diagram which shows a part of the structure of the audio signal processing apparatus of another embodiment in detail.

[第1の実施形態]
[構成]
図1に示す本実施形態の音声信号処理装置100は、例えば、音声調整卓あるいはミキサーとして知られているものである。以下の説明においては、ステレオから22.2chサラウンドへのアップミックスを例に挙げ、音声信号処理装置100に入力される音声信号は、ステレオの音源のものとする。22.2chサラウンドは、チャンネル1~24の24のチャンネルにより構成される。具体的には、上層の9チャンネルと、中層の10チャンネルと、下層の3.2チャンネルとにより構成される。なお、下層の3.2チャンネルには、2つのLFEが含まれる。また、22.2chサラウンドは、フロント側の11.2チャンネルとサイド側及びリア側の11チャンネルに分けて考えることも出来る。説明を容易にするため、フロント側チャンネルからは主に直接音が、サイド側チャンネル及びリア側チャンネルからは主に間接音が、それぞれ出力されるものとして考えるが、間接音は、フロント側チャンネルから出力されても良い。
[First Embodiment]
[Constitution]
The audio signal processing device 100 of the present embodiment shown in FIG. 1 is known as, for example, an audio adjusting console or a mixer. In the following description, an upmix from stereo to 22.2ch surround will be taken as an example, and the audio signal input to the audio signal processing device 100 will be that of a stereo sound source. 22.2ch surround is composed of 24 channels of channels 1 to 24. Specifically, it is composed of 9 channels in the upper layer, 10 channels in the middle layer, and 3.2 channels in the lower layer. The lower 3.2 channel contains two LFEs. Further, 22.2ch surround can be considered by dividing it into 11.2 channels on the front side and 11 channels on the side and rear sides. For the sake of simplicity, it is assumed that the direct sound is mainly output from the front side channel and the indirect sound is mainly output from the side side channel and the rear side channel, but the indirect sound is mainly output from the front side channel. It may be output.

音声信号処理装置100は、ステレオの音源を左右それぞれで直接音と間接音とに分離する分離部10と、分離した音源を調整するための各種パラメータを生成する設定部20と、生成したパラメータに基づいて係数を生成する係数生成部30と、この係数と分離した音源とからアップミックスされたサラウンドの音源を生成する演算部40と、を備える。 The audio signal processing device 100 has a separation unit 10 that separates a stereo sound source into direct sound and an indirect sound on each of the left and right sides, a setting unit 20 that generates various parameters for adjusting the separated sound sources, and generated parameters. It includes a coefficient generation unit 30 that generates a coefficient based on the coefficient, and a calculation unit 40 that generates a surround sound source that is upmixed from the coefficient and a sound source separated from the coefficient.

分離部10は、ステレオの音源を左右それぞれで直接音と間接音とに分離する。すなわち、左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に分離する。ステレオの音源を直接音と間接音とに分離する手法としては、背景技術で説明した特許文献3の技術など、周知技術を用いることが出来る。分離部10は、後段に設けられた演算部40に、これら4つの音源を出力する。なお、直接音とは、直接耳に届く音であり、間接音とは、壁などに反射して耳に届く音である。 The separation unit 10 separates the stereo sound source into direct sound and indirect sound on the left and right sides, respectively. That is, it is separated into four sound sources: left direct sound DL, right direct sound DR, left indirect sound RL, and right indirect sound RR. As a method for separating a stereo sound source into a direct sound and an indirect sound, a well-known technique such as the technique of Patent Document 3 described in the background technique can be used. The separation unit 10 outputs these four sound sources to the calculation unit 40 provided in the subsequent stage. The direct sound is a sound that reaches the ear directly, and the indirect sound is a sound that is reflected by a wall or the like and reaches the ear.

設定部20は、分離部10が分離した4つの音源を調整するためのパラメータを生成する。図2に示すように、設定部20は、直接音と間接音とのバランスを調整する直接音/間接音バランス調整部21と、直接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するフロントバランス調整部22と、間接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するリアバランス調整部23と、直接音と間接音とのミキシング量を調整するミキシング量調整部24と、直接音及び間接音における中層チャンネルからの出力と上下層チャンネルからの出力とのバランスを調整する層間バランス調整部25と、を備える。 The setting unit 20 generates parameters for adjusting the four sound sources separated by the separation unit 10. As shown in FIG. 2, the setting unit 20 adjusts the balance between the direct sound / indirect sound balance adjusting unit 21 that adjusts the balance between the direct sound and the indirect sound, and the center sound source and the sound source other than the center sound source in the direct sound. The front balance adjusting unit 22 for adjusting the balance between the center sound source and the sound source other than the center sound source in the indirect sound, and the mixing amount adjusting unit 24 for adjusting the mixing amount between the direct sound and the indirect sound. The layer balance adjusting unit 25 for adjusting the balance between the output from the middle layer channel and the output from the upper and lower layer channels in the direct sound and the indirect sound is provided.

図3に示すように、直接音/間接音バランス調整部21は、例えば1つの操作子を備え、この操作子を左に回転させると直接音のミキシング量が増加し、右に回転させると間接音のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における直接音と間接音とのバランスを調整する。この調整の度合いは、ROOM値として後段に設けられた演算部40に出力される。 As shown in FIG. 3, the direct sound / indirect sound balance adjusting unit 21 includes, for example, one operator, and when the operator is rotated to the left, the mixing amount of the direct sound increases, and when the operator is rotated to the right, the mixing amount is indirect. The amount of sound mixing increases. The mixing engineer adjusts the balance between the direct sound and the indirect sound in the surround sound source after the upmix by rotating this controller left and right. The degree of this adjustment is output as a ROOM value to the calculation unit 40 provided in the subsequent stage.

図4に示すように、フロントバランス調整部22は、直接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、直接音のうちセンターに定位する成分である。また、このセンター音源以外の音源とは、直接音のうちセンター音源以外の成分である。フロントバランス調整部22は、例えば1つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における、フロント側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Fdiv値として後段に設けられた係数生成部30に出力される。 As shown in FIG. 4, the front balance adjusting unit 22 adjusts the balance between the center sound source and the sound source other than the center sound source among the direct sounds. This center sound source is a component of the direct sound that is localized in the center. Further, the sound source other than the center sound source is a component of the direct sound other than the center sound source. The front balance adjusting unit 22 includes, for example, one operator, and when the operator is rotated to the left, the mixing amount of the center sound source increases, and when the operator is rotated to the right, the mixing amount of the sound sources other than the center sound source increases. By rotating this controller left and right, the mixing engineer adjusts the balance between the center sound source output from the front channel and the sound sources other than the center sound source in the surround sound source after upmixing. The degree of this adjustment is output as an Fdiv value to the coefficient generation unit 30 provided in the subsequent stage.

図5に示すように、リアバランス調整部23は、間接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、間接音のうちセンターに定位する成分である。また、このセンター音源以外の音源とは、間接音のうちセンター音源以外の成分である。リアバランス調整部23は、例えば1つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における、リア側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Rdiv値として後段に設けられた係数生成部30に出力される。 As shown in FIG. 5, the rear balance adjusting unit 23 adjusts the balance between the center sound source and the sound source other than the center sound source among the indirect sounds. This center sound source is a component of the indirect sound that is localized in the center. Further, the sound source other than the center sound source is a component of the indirect sound other than the center sound source. The rear balance adjusting unit 23 includes, for example, one operator, and when the operator is rotated to the left, the mixing amount of the center sound source increases, and when the operator is rotated to the right, the mixing amount of the sound sources other than the center sound source increases. By rotating this controller left and right, the mixing engineer adjusts the balance between the center sound source output from the rear channel and the sound sources other than the center sound source in the surround sound source after upmixing. The degree of this adjustment is output as an Rdiv value to the coefficient generation unit 30 provided in the subsequent stage.

図6に示すように、ミキシング量調整部24は、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及びリア側チャンネルから出力される間接音に対する直接音のミキシング比率を調整する。このために、ミキシング量調整部24は、例えば主操作子Xと副操作子Yとを備える。 As shown in FIG. 6, the mixing amount adjusting unit 24 adjusts the mixing ratio of the indirect sound to the direct sound output from the front side channel and the mixing ratio of the direct sound to the indirect sound output from the rear side channel. For this purpose, the mixing amount adjusting unit 24 includes, for example, a main operator X and a sub-operator Y.

主操作子Xは、フロント側チャンネルから出力される直接音と、間接音とのバランスを調整する。例えば、主操作子Xを左に回転させると直接音及び間接音のミキシング量が減少し、右に回転させると直接音及び間接音のミキシング量が増加する。一方で、副操作子Yは、間接音に対して直接音をミキシングする量、及びフロント側チャンネルから出力される直接音に対して間接音をミキシングする量を調整する。例えば、副操作子Yを左に回転させると間接音に対してミキシングする直接音の量及び直接音に対してミキシングする間接音の量が減少し、右に回転させると間接音に対してミキシングする直接音の量及び直接音に対してミキシングする間接音の量が増加する。ミキシングエンジニアは、主操作子Xと副操作子Yとを回転させることにより、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及び間接音に対する直接音のミキシング比率を調整する。なお、主操作子Xと副操作子Yは連動するようにしても良いし、主操作子Xは固定して副操作子Yだけが回転するようにしても良い。連動させる場合は、主操作子Xの回転方向と反対方向に副操作子Yが回転するようにすると良い。この調整の度合いは、FRdiv値として後段に設けられた係数生成部30に出力される。 The main operator X adjusts the balance between the direct sound output from the front channel and the indirect sound. For example, rotating the main controller X to the left reduces the mixing amount of direct and indirect sounds, and rotating it to the right increases the mixing amount of direct and indirect sounds. On the other hand, the sub-operator Y adjusts the amount of mixing the direct sound with respect to the indirect sound and the amount of mixing the indirect sound with respect to the direct sound output from the front side channel. For example, rotating the sub-operator Y to the left reduces the amount of direct sound that mixes with the indirect sound and the amount of indirect sound that mixes with the direct sound, and rotating it to the right reduces the amount of indirect sound that mixes with the indirect sound. The amount of direct sound to be made and the amount of indirect sound to be mixed with the direct sound are increased. The mixing engineer adjusts the mixing ratio of the indirect sound to the direct sound output from the front channel and the mixing ratio of the direct sound to the indirect sound by rotating the main operator X and the sub-operator Y. The main operator X and the sub-operator Y may be interlocked with each other, or the main operator X may be fixed and only the sub-operator Y may rotate. In the case of interlocking, it is preferable to rotate the sub-operator Y in the direction opposite to the rotation direction of the main operator X. The degree of this adjustment is output as a FRdiv value to the coefficient generation unit 30 provided in the subsequent stage.

図7に示すように、アップミックス後のサラウンドの音源が3Dオーディオに対応している場合、層間バランス調整部25は、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。すなわち、層間バランス調整部25は、例えば1つの操作子を備え、この操作子を左に回転させると中層チャンネルから出力される直接音及び間接音が強調され、右に回転させると上下層チャンネルから出力される直接音及び間接音が強調される。ミキシングエンジニアは、この操作子を左右に回転させることにより、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。この調整の度合いは、ELdiv値として後段に設けられた係数生成部30に出力される。 As shown in FIG. 7, when the surround sound source after upmix corresponds to 3D audio, the interlayer balance adjusting unit 25 outputs the direct sound and the indirect sound output from the middle layer channel and the upper and lower layer channels. Adjust the balance between the direct sound and the indirect sound. That is, the interlayer balance adjusting unit 25 includes, for example, one operator, and when this operator is rotated to the left, the direct sound and the indirect sound output from the middle layer channel are emphasized, and when the operator is rotated to the right, the upper and lower layer channels are emphasized. The output direct and indirect sounds are emphasized. The mixing engineer adjusts the balance between the direct sound and the indirect sound output from the middle layer channel and the direct sound and the indirect sound output from the upper and lower layer channels by rotating this operator left and right. The degree of this adjustment is output as an ELdiv value to the coefficient generation unit 30 provided in the subsequent stage.

図2に戻り、係数生成部30は、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivを任意に組み合わせて四則演算することにより、係数A、B、C、Dを生成する。また、この組み合わせ及び四則演算は、サラウンドにおける各チャンネルにより異なっている。すなわち、22.2chのそれぞれに対してFdiv、Rdiv、FRdiv、ELdivの各値が組み合わせられることにより、24組の係数A1~D1、・・・、A24~D24が生成される。 Returning to FIG. 2, the coefficient generation unit 30 generates the coefficients A, B, C, and D by performing four arithmetic operations by arbitrarily combining the four parameters Fdiv, Rdiv, FRdiv, and ELdiv generated by the setting unit 20. In addition, this combination and four arithmetic operations are different for each channel in surround. That is, by combining the values of Fdiv, Rdiv, FRdiv, and ELdiv for each of 22.2 channels, 24 sets of coefficients A1 to D1, ..., A24 to D24 are generated.

各係数An~Dnの生成について、より詳細に説明する。Fdivは、AnFdiv、BnFdiv、CnFdiv、DnFdivからなる。同様に、Rdivは、AnRdiv、BnRdiv、CnRdiv、DnRdivからなり、FRdivは、AnFRdiv、BnFRdiv、CnFRdiv、DnFRdivからなり、ELdivは、AnELdiv、BnELdiv、CnELdiv、DnELdivからなる。 The generation of each coefficient An to Dn will be described in more detail. Fdiv consists of AnFdiv, BnFdiv, CnFdiv, and DnFdiv. Similarly, Rdiv consists of AnRdiv, BnRdiv, CnRdiv, DnRdiv, FRdiv consists of AnFRdiv, BnFRdiv, CnFRdiv, DnFRdiv, and ELdiv consists of AnELdiv, BnELdiv, CnELdiv.

例えば、フロントバランス調整部22の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnFdiv、BnFdivが生成される。同様に、リアバランス調整部23の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにCnRdiv、DnRdivが生成され、ミキシング量調整部24の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnFRdiv、BnFRdiv、CnFRdiv、DnFRdivが生成され、層間バランス調整部25の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnELdiv、BnELdiv、CnELdiv、DnELdivが生成される。 For example, by rotating the operator of the front balance adjusting unit 22, AnFdiv and BnFdiv are generated for each channel in the surround sound source. Similarly, by rotating the operator of the rear balance adjusting unit 23, CnRdiv and DnRdiv are generated for each channel in the surround sound source, and by rotating the operator of the mixing amount adjusting unit 24, the channel in the surround sound source is generated. AnFRdiv, BnFRdiv, CnFRdiv, and DnFRdiv are generated for each, and by rotating the operator of the interlayer balance adjusting unit 25, AnELdiv, BnELdiv, CnELdiv, and DnELdiv are generated for each channel in the surround sound source.

そして、An~Dnは、次の各式により生成される。
An=AnFdiv×AnRdiv×AnFRdiv×AnELdiv
Bn=BnFdiv×BnRdiv×BnFRdiv×BnELdiv
Cn=CnFdiv×CnRdiv×CnFRdiv×CnELdiv
Dn=DnFdiv×DnRdiv×DnFRdiv×DnELdiv
And An to Dn are generated by each of the following equations.
An = AnFdiv x AnRdiv x AnFRdiv x AnELdiv
Bn = BnFdiv × BnRdiv × BnFRdiv × BnELdiv
Cn = CnFdiv × CnRdiv × CnFRdiv × CnELdiv
Dn = DnFdiv × DnRdiv × DnFRdiv × DnELdiv

以上のようにして生成された係数A1~D1、・・・、A24~D24は、後段に設けられた演算部40に出力される。 The coefficients A1 to D1, ..., A24 to D24 generated as described above are output to the calculation unit 40 provided in the subsequent stage.

図8に示すように、演算部40は、分離部10が分離した4つの音源DL、DR、RL、RRと、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した係数A1~D1、・・・、A24~D24に基づいて、アップミックス後のサラウンドにおいて各チャンネルから出力する音声信号を演算する。演算部40は、各チャンネルからの出力Tを、以下の(式1)により演算する。なお、(式1)において出力T及び各係数A、B、C、Dに付されるnは、サラウンドにおけるチャンネル番号であり、例えばT1はチャンネル1の出力Tである。また、DL’、DR’、RL’、RR’は、それぞれDL、DR、RL、RRをROOM値で調整したものである。これにより、演算部40は、チャンネル1~24からの出力T1~T24をそれぞれ生成し、サラウンドの音源を生成する。なお、アップミックスされたサラウンドの音源は、各チャンネルに設けられた図示しないスピーカなどの出力装置から外部に出力される。
(数1)
Tn=An×DL’+Bn×DR’+Cn×RL’+Dn×RR’・・・(式1)
As shown in FIG. 8, the calculation unit 40 includes four sound source DLs, DRs, RLs, and RRs separated by the separation unit 10, a parameter ROOM generated by the direct sound / indirect sound balance adjustment unit 21, and a coefficient generation unit 30. The audio signals output from each channel in the surround after upmix are calculated based on the coefficients A1 to D1, ..., A24 to D24 generated by. The calculation unit 40 calculates the output T from each channel by the following (Equation 1). In (Equation 1), the output T and n attached to each of the coefficients A, B, C, and D are the channel numbers in surround, and for example, T1 is the output T of the channel 1. Further, DL', DR', RL', and RR'are DL, DR, RL, and RR adjusted by ROOM values, respectively. As a result, the arithmetic unit 40 generates outputs T1 to T24 from channels 1 to 24, respectively, and generates a surround sound source. The upmixed surround sound source is output to the outside from an output device such as a speaker (not shown) provided for each channel.
(Number 1)
Tn = An x DL'+ Bn x DR'+ Cn x RL'+ Dn x RR'... (Equation 1)

[作用]
図9を参照しつつ、本実施形態における音声信号処理装置100の作用について説明する。まず、元の音声信号であるステレオの音源が、分離部10に入力される。分離部10は、ステレオの音源を、左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に分離する(ステップS01)。分離された4つの音源は、演算部40に入力される。
[Action]
The operation of the audio signal processing device 100 in the present embodiment will be described with reference to FIG. 9. First, a stereo sound source, which is the original audio signal, is input to the separation unit 10. The separation unit 10 separates the stereo sound source into four sound sources: a left direct sound DL, a right direct sound DR, a left indirect sound RL, and a right indirect sound RR (step S01). The four separated sound sources are input to the calculation unit 40.

設定部20において、直接音/間接音バランス調整部21がROOM値を、フロントバランス調整部22がFdiv値を、リアバランス調整部23がRdiv値を、ミキシング量調整部24がFRdiv値を、層間バランス調整部25がELdiv値を、それぞれ生成し、後段に設けられた係数生成部30または演算部40に出力する(ステップS02)。より詳細には、これらの各構成において、ミキシングエンジニアが1つまたは2つの操作子を回転させ、直接音または間接音の少なくとも一方を調整するためにミキシング量の調整を行う。この調整の結果として、上述の各パラメータが生成される。ROOM値と4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて生成された係数とが演算部40に入力され、アップミックス後のサラウンドの音源に反映される。すなわち、設定部20におけるミキシング量の調整は、アップミックス後のサラウンドの音源を調整するものであるとも言える。 In the setting unit 20, the direct sound / indirect sound balance adjusting unit 21 sets the ROOM value, the front balance adjusting unit 22 sets the Fdiv value, the rear balance adjusting section 23 sets the Rdiv value, and the mixing amount adjusting section 24 sets the FRdiv value between layers. The balance adjustment unit 25 generates ELdiv values, respectively, and outputs them to the coefficient generation unit 30 or the calculation unit 40 provided in the subsequent stage (step S02). More specifically, in each of these configurations, the mixing engineer rotates one or two controls to adjust the mixing amount to adjust at least one of the direct and indirect sounds. As a result of this adjustment, each of the above parameters is generated. The ROOM value and the coefficients generated based on the four parameters Fdiv, Rdiv, FRdiv, and ELdiv are input to the calculation unit 40 and reflected in the surround sound source after the upmix. That is, it can be said that the adjustment of the mixing amount in the setting unit 20 adjusts the surround sound source after the upmix.

係数生成部30は、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivを任意に組み合わせて四則演算することにより、サラウンドの出力におけるチャンネルごとに係数A、B、C、Dを生成する。すなわち、22.2chのそれぞれに対してFdiv、Rdiv、FRdiv、ELdivの各値が組み合わせられることにより、24組の係数A1~D1、・・・、A24~D24が生成される(ステップS03)。係数A1~D1、・・・、A24~D24は、後段に設けられた演算部40に出力される。なお、間接音RL、RRの係数Cn、Dnの生成においては、直接音のミキシング量に関係するFdiv値を用いなくてもよい。同様に、直接音DL、DRの係数An、Bnの生成においては、間接音のミキシング量に関係するRdiv値を用いなくてもよい。このように、各係数の生成において、必ずしも全てのパラメータを用いる必要はない。また、チャンネルによっては、全ての係数を四則演算により生成する必要もない。例えば、中層のフロント側における左チャンネル出力の係数は、Bn=Dn=1とすることが出来る。 The coefficient generation unit 30 generates coefficients A, B, C, and D for each channel in the surround output by performing four arithmetic operations by arbitrarily combining the four parameters Fdiv, Rdiv, FRdiv, and ELdiv generated by the setting unit 20. do. That is, by combining the values of Fdiv, Rdiv, FRdiv, and ELdiv for each of 22.2 channels, 24 sets of coefficients A1 to D1, ..., A24 to D24 are generated (step S03). The coefficients A1 to D1, ..., A24 to D24 are output to the calculation unit 40 provided in the subsequent stage. In the generation of the coefficients Cn and Dn of the indirect sounds RL and RR, it is not necessary to use the Fdiv value related to the mixing amount of the direct sound. Similarly, in the generation of the coefficients An and Bn of the direct sound DL and DR, it is not necessary to use the Rdiv value related to the mixing amount of the indirect sound. As described above, it is not always necessary to use all the parameters in the generation of each coefficient. Further, depending on the channel, it is not necessary to generate all the coefficients by four arithmetic operations. For example, the coefficient of the left channel output on the front side of the middle layer can be Bn = Dn = 1.

演算部40は、分離部10が生成した4つの音源DL、DR、RL、RRと、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した24組の係数A1~D1、・・・、A24~D24とに基づいて、上記(式1)から、22.2chサラウンドにおける各チャンネルの出力T1~T24を演算する(ステップS04)。演算された出力T1~T24は、サラウンドにおける各チャンネルに設けられた図示しないスピーカから出力される。 The calculation unit 40 includes four sound source DLs, DRs, RLs, and RRs generated by the separation unit 10, a parameter ROOM generated by the direct sound / indirect sound balance adjustment unit 21, and 24 sets of coefficients generated by the coefficient generation unit 30. Based on A1 to D1, ..., A24 to D24, the outputs T1 to T24 of each channel in 22.2ch surround are calculated from the above (Equation 1) (step S04). The calculated outputs T1 to T24 are output from speakers (not shown) provided for each channel in surround.

[効果]
(1)本実施形態の音声信号処理装置100は、ステレオの音源を分離部10が分離して生成した左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に対して、直接音/間接音バランス調整部21が生成したROOM値により調整した上で、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて係数生成部30が生成した係数を、演算部40が乗算することにより、ステレオの音源からサラウンドの音源を生成する。このように、遅延処理やフィルタ処理を行うことなくステレオの音源をアップミックスするので、アップミックスに伴う音源の歪みを抑制することが出来る。そのため、アップミックスしたサラウンドの音源をステレオの音源に再度ダウンミックスしても、ステレオの音源に生じる歪みが少ない。
[effect]
(1) In the audio signal processing device 100 of the present embodiment, the left direct sound DL, the right direct sound DR, the left indirect sound RL, and the right indirect sound RR generated by separating the stereo sound source by the separation unit 10 After adjusting the four sound sources of the above by the ROOM value generated by the direct sound / indirect sound balance adjusting unit 21, the coefficient generation unit is based on the four parameters Fdiv, Rdiv, FRdiv, and ELdiv generated by the setting unit 20. The calculation unit 40 multiplies the coefficient generated by 30 to generate a surround sound source from the stereo sound source. In this way, since the stereo sound source is upmixed without performing delay processing or filter processing, distortion of the sound source due to the upmix can be suppressed. Therefore, even if the upmixed surround sound source is downmixed to the stereo sound source again, the distortion that occurs in the stereo sound source is small.

(2)本実施形態の音声信号処理装置100の設定部20は、フロントバランス調整部22を備える。これにより、フロント側チャンネル出力においてセンター音源だけを他の音源に比較して強調することが出来るので、センター音源が他の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。特に、センター音源にコメントなどの重要な情報が含まれている場合に、コメントが聞こえないという事態を回避することが出来る。 (2) The setting unit 20 of the audio signal processing device 100 of the present embodiment includes a front balance adjusting unit 22. As a result, only the center sound source can be emphasized in the front channel output as compared with other sound sources, so that it is possible to avoid a situation in which the center sound source is buried in other sound sources and becomes difficult to hear. In particular, when the center sound source contains important information such as comments, it is possible to avoid the situation where the comments cannot be heard.

(3)本実施形態の音声信号処理装置100の設定部20は、リアバランス調整部23を備える。これにより、リア側チャンネル出力においてセンター音源と他の音源とのバランスを調整することが出来るので、リア側チャンネルから出力される音の拡がり方を調整することが出来る。 (3) The setting unit 20 of the audio signal processing device 100 of the present embodiment includes a rear balance adjusting unit 23. As a result, the balance between the center sound source and other sound sources can be adjusted in the rear side channel output, so that it is possible to adjust how the sound output from the rear side channel spreads.

(4)本実施形態の音声信号処理装置100の設定部20は、ミキシング量調整部24を備える。これにより、センター音源が他の音源に比較して弱々しい場合であっても、フロント側チャンネルから出力される直接音に間接音をミックスすることにより、フロント側チャンネルから出力されるセンター音源を補強し、センターに定位する音を聴き易くすることが出来る。同様にして、間接音に直接音をミックスすることにより、センター音源を補強することが出来る。 (4) The setting unit 20 of the audio signal processing device 100 of the present embodiment includes a mixing amount adjusting unit 24. As a result, even if the center sound source is weaker than other sound sources, the center sound source output from the front side channel can be obtained by mixing the indirect sound with the direct sound output from the front side channel. It can be reinforced to make it easier to hear the sound localized in the center. Similarly, the center sound source can be reinforced by mixing the direct sound with the indirect sound.

(5)本実施形態の音声信号処理装置100の設定部20は、層間バランス調整部25を備える。これにより、サラウンドにおける中層の直接音及び間接音を上層及び下層にも拡げることが出来る。 (5) The setting unit 20 of the audio signal processing device 100 of the present embodiment includes an interlayer balance adjusting unit 25. As a result, the direct sound and the indirect sound in the middle layer in surround can be extended to the upper layer and the lower layer.

(6)本実施形態の音声信号処理装置100の設定部20は、直接音/間接音バランス調整部21を備える。これにより、アップミックス後のサラウンドの音源において間接音を強調することが出来る。 (6) The setting unit 20 of the audio signal processing device 100 of the present embodiment includes a direct sound / indirect sound balance adjusting unit 21. This makes it possible to emphasize the indirect sound in the surround sound source after the upmix.

[他の実施形態]
本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。具体的には、次のような他の実施形態も包含する。
[Other embodiments]
The present invention is not limited to the above embodiment, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof. In addition, various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. Specifically, it also includes other embodiments such as the following.

(1)上記の実施形態においては、ステレオから22.2chサラウンドへのアップミックスについて説明したが、例えばステレオから5.1chサラウンドへのアップミックスや、ステレオから3Dオーディオに対応する5.1.2chサラウンドへのアップミックスについても本発明を適用することが出来る。 (1) In the above embodiment, the upmix from stereo to 22.2ch surround has been described, but for example, the upmix from stereo to 5.1ch surround and 5.12ch corresponding to stereo to 3D audio are supported. The present invention can also be applied to upmix to surround.

(2)上記の実施形態においては、各チャンネルの出力Tnをそれぞれ演算するものとしたが、これに限られない。例えば、フロント側の左右チャンネルやサイド側及びリア側の左右チャンネルの出力については、同じにしてもよい。これにより、係数生成部30や演算部40の演算量を削減することが出来る。 (2) In the above embodiment, the output Tn of each channel is calculated, but the present invention is not limited to this. For example, the outputs of the left and right channels on the front side and the left and right channels on the side and rear sides may be the same. As a result, the amount of calculation of the coefficient generation unit 30 and the calculation unit 40 can be reduced.

(3)上記の実施形態の設定部20は、4つのパラメータFdiv、Rdiv、FRdiv、ELdivを生成するようにしたが、これに限られない。設定部20が1つでもパラメータを生成できるのであれば、係数An~Dnを生成するための四則演算を多様にすることで、各チャンネルnの出力Tnを細やかに調整することも可能である。また、図10に示すように、Room値も含めた5つのパラメータで係数An~Dnを生成するようにしても良い。この場合、例えば以下の各式により、係数を生成することが出来る。ただし、AnRoom=BnRoom、CnRoom=DnRoom=1-AnRoomとする。
An=AnRoom×AnFdiv×AnRdiv×AnFRdiv×AnELdiv
Bn=BnRoom×BnFdiv×BnRdiv×BnFRdiv×BnELdiv
Cn=CnRoom×CnFdiv×CnRdiv×CnFRdiv×CnELdiv
Dn=DnRoom×DnFdiv×DnRdiv×DnFRdiv×DnELdiv
(3) The setting unit 20 of the above embodiment is designed to generate four parameters Fdiv, Rdiv, FRdiv, and ELdiv, but the present invention is not limited to this. If even one setting unit 20 can generate a parameter, it is possible to finely adjust the output Tn of each channel n by diversifying the four arithmetic operations for generating the coefficients An to Dn. Further, as shown in FIG. 10, the coefficients An to Dn may be generated with five parameters including the Room value. In this case, for example, the coefficient can be generated by the following equations. However, it is assumed that AnRoom = BnRoom and CnRoom = DnRoom = 1-AnRoom.
An = AnRoom × AnFdiv × AnRdiv × AnFRdiv × AnELdiv
Bn = BnRoom × BnFdiv × BnRdiv × BnFRdiv × BnELdiv
Cn = CnRoom × CnFdiv × CnRdiv × CnFRdiv × CnELdiv
Dn = DnRoom × DnFdiv × DnRdiv × DnFRdiv × DnELdiv

(4)上記の実施形態の設定部20においては、ミキシングエンジニアが各構成に設けられた操作子を操作することによってパラメータを生成したが、音声信号処理装置100に設けられたGUIを操作することによってパラメータを生成してもよい。 (4) In the setting unit 20 of the above embodiment, the mixing engineer generates the parameters by operating the controls provided in each configuration, but operates the GUI provided in the audio signal processing device 100. May generate parameters by.

(5)上記の実施形態の設定部20は、直接音/間接音バランス調整部21、フロントバランス調整部22、リアバランス調整部23、ミキシング量調整部24、層間バランス調整部25を備えるものとしたが、これらの構成に加えて、イコライザを備えてもよい。この場合、イコライザは、ステレオの音源を歪め過ぎない程度に利用される。 (5) The setting unit 20 of the above embodiment includes a direct sound / indirect sound balance adjusting unit 21, a front balance adjusting unit 22, a rear balance adjusting unit 23, a mixing amount adjusting unit 24, and an interlayer balance adjusting unit 25. However, in addition to these configurations, an equalizer may be provided. In this case, the equalizer is used to the extent that the stereo sound source is not distorted too much.

(6)上記の実施形態のミキシング量調整部24は、直接音に対してミキシングする間接音の量と、間接音に対してミキシングする直接音の量を調整するようにしたが、前者だけであってもよい。すなわち、間接音に対して直接音をミキシングしなくてもよい。 (6) The mixing amount adjusting unit 24 of the above embodiment adjusts the amount of indirect sound mixed with respect to the direct sound and the amount of direct sound mixed with respect to the indirect sound, but only in the former case. There may be. That is, it is not necessary to mix the direct sound with the indirect sound.

(7)上記の実施形態の層間バランス調整部25は、1つの操作子でサラウンドの音源における中層の直接音及び間接音を上下層に拡げることとしたが、2つの操作子を備えることにより、直接音と間接音とを個別に調整することも出来る。なお、2つの操作子は連動するようにしても良いし、一方は固定して他方だけが回転するようにしても良い。連動させる場合は、一方の回転方向と反対方向に他方が回転するようにすると良い。 (7) The interlayer balance adjusting unit 25 of the above embodiment is to expand the direct sound and the indirect sound of the middle layer in the surround sound source to the upper and lower layers with one operator, but by providing two controls, the layer balance adjusting unit 25 is provided. It is also possible to adjust the direct sound and the indirect sound individually. The two controls may be interlocked with each other, or one may be fixed and only the other may rotate. In the case of interlocking, it is preferable to rotate the other in the direction opposite to the rotation direction of one.

(8)上記の実施形態においては、音声信号処理装置100というハードウェアについて説明したが、コンピュータに音声信号処理装置100の各構成の作用を手順として実行させるプログラムなどのソフトウェアによっても同様の効果を奏することが出来る。例えば、分離部10と、設定部20と、係数生成部30と、演算部40を構成として備える音声信号処理装置100の代わりに、ステレオの音源を直接音と間接音とに分離する分離手順と、直接音または間接音の少なくとも一方を調整するためのパラメータを生成する設定手順と、パラメータに基づき、サラウンドの音源におけるチャンネルごとに直接音及び間接音に乗算する係数を生成する係数生成手順と、直接音及び間接音に係数を乗算することにより、ステレオの音源をサラウンドの音源にアップミックスする演算手順をコンピュータに実行させる音声信号処理プログラムによっても、同様の効果を奏することが出来る。この手順は、例えば図9の説明と同様に行われる。 (8) In the above embodiment, the hardware of the audio signal processing device 100 has been described, but the same effect can be obtained by software such as a program that causes a computer to execute the operation of each configuration of the audio signal processing device 100 as a procedure. I can play it. For example, a separation procedure for separating a stereo sound source into direct sound and indirect sound instead of the voice signal processing device 100 including a separation unit 10, a setting unit 20, a coefficient generation unit 30, and a calculation unit 40 as a configuration. , A setting procedure that generates a parameter for adjusting at least one of the direct sound or the indirect sound, and a coefficient generation procedure that generates a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameter. A similar effect can be achieved by a voice signal processing program that causes a computer to perform an arithmetic procedure for upmixing a stereo sound source to a surround sound source by multiplying the direct sound and the indirect sound by a coefficient. This procedure is performed, for example, in the same manner as described in FIG.

100…音声信号処理装置
10…分離部
20…設定部
21…直接音/間接音バランス調整部
22…フロントバランス調整部
23…リアバランス調整部
24…ミキシング量調整部
25…層間バランス調整部
30…係数生成部
40…演算部
X…主操作子
Y…副操作子
DL…左の直接音
DR…右の直接音
RL…左の間接音
RR…右の間接音
A~D…係数
T…出力
100 ... Audio signal processing device 10 ... Separation unit 20 ... Setting unit 21 ... Direct sound / indirect sound balance adjustment unit 22 ... Front balance adjustment unit 23 ... Rear balance adjustment unit 24 ... Mixing amount adjustment unit 25 ... Interlayer balance adjustment unit 30 ... Coefficient generation unit 40 ... Calculation unit X ... Main operator Y ... Sub-operator DL ... Left direct sound DR ... Right direct sound RL ... Left indirect sound RR ... Right indirect sound A to D ... Coefficient T ... Output

Claims (8)

ステレオの音源をサラウンドの音源にアップミックスする音声信号処理装置であって、
前記ステレオの音源を直接音と間接音とに分離する分離部と、
前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部と、
前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算部を備える音声信号処理装置。
An audio signal processing device that upmixes a stereo sound source to a surround sound source.
A separation unit that separates the stereo sound source into direct sound and indirect sound,
A setting unit that generates parameters for adjusting at least one of the direct sound and the indirect sound, and
A coefficient generator that generates a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameters.
An audio signal processing device including a calculation unit that upmixes the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
前記パラメータは、前記サラウンドの音源のフロント側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む、
請求項1に記載の音声信号処理装置。
The parameters include those for adjusting the balance between the center sound source and the sound sources other than the center sound source in the front channel of the surround sound source.
The audio signal processing device according to claim 1.
前記パラメータは、前記サラウンドの音源のリア側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む、
請求項1または2に記載の音声信号処理装置。
The parameters include those for adjusting the balance between the center sound source and the sound sources other than the center sound source in the rear channel of the surround sound source.
The audio signal processing device according to claim 1 or 2.
前記パラメータは、前記サラウンドの音源のフロント側チャンネルから出力される前記直接音に対して、前記間接音のミキシング量を調整するためのものを含む、
請求項1乃至3のいずれかに記載の音声信号処理装置。
The parameters include those for adjusting the mixing amount of the indirect sound with respect to the direct sound output from the front side channel of the surround sound source.
The audio signal processing device according to any one of claims 1 to 3.
前記サラウンドの音源は、3Dオーディオに対応し、
前記パラメータは、前記サラウンドの音源における中層のチャンネルから出力される前記直接音及び前記間接音と、上下層のチャンネルから出力される前記直接音及び前記間接音とのバランスを調整するものを含む、
請求項1乃至4のいずれかに記載の音声信号処理装置。
The surround sound source supports 3D audio and is compatible with 3D audio.
The parameters include adjusting the balance between the direct sound and the indirect sound output from the middle layer channel in the surround sound source and the direct sound and the indirect sound output from the upper and lower layer channels.
The audio signal processing device according to any one of claims 1 to 4.
前記パラメータは、前記直接音と前記間接音とのバランスを調整するためのものを含む、
請求項1乃至5のいずれかに記載の音声信号処理装置。
The parameters include those for adjusting the balance between the direct sound and the indirect sound.
The audio signal processing device according to any one of claims 1 to 5.
前記設定部は、直接音/間接音バランス調整部を備え、
前記直接音/間接音バランス調整部は、前記直接音と前記間接音とのバランスを調整する、
請求項1乃至5のいずれかに記載の音声信号処理装置。
The setting unit includes a direct sound / indirect sound balance adjustment unit.
The direct sound / indirect sound balance adjusting unit adjusts the balance between the direct sound and the indirect sound.
The audio signal processing device according to any one of claims 1 to 5.
コンピュータにステレオの音源をサラウンドの音源にアップミックスする処理を実行させる音声信号処理プログラムであって、
前記ステレオの音源を直接音と間接音とに分離する分離手順と、
前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定手順と、
前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成手順と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算手順をコンピュータに実行させる音声信号処理プログラム。
An audio signal processing program that causes a computer to perform a process of upmixing a stereo sound source to a surround sound source.
The separation procedure for separating the stereo sound source into direct sound and indirect sound,
A setting procedure for generating parameters for adjusting at least one of the direct sound or the indirect sound, and
Based on the parameters, a coefficient generation procedure for generating a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source, and a coefficient generation procedure.
A voice signal processing program that causes a computer to perform an arithmetic procedure for upmixing a stereo sound source to a surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
JP2020204835A 2020-12-10 2020-12-10 Voice signal processing device and voice signal processing program Pending JP2022092184A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2020204835A JP2022092184A (en) 2020-12-10 2020-12-10 Voice signal processing device and voice signal processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2020204835A JP2022092184A (en) 2020-12-10 2020-12-10 Voice signal processing device and voice signal processing program

Publications (1)

Publication Number Publication Date
JP2022092184A true JP2022092184A (en) 2022-06-22

Family

ID=82067986

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020204835A Pending JP2022092184A (en) 2020-12-10 2020-12-10 Voice signal processing device and voice signal processing program

Country Status (1)

Country Link
JP (1) JP2022092184A (en)

Similar Documents

Publication Publication Date Title
AU2008278072B2 (en) Method and apparatus for generating a stereo signal with enhanced perceptual quality
US8605914B2 (en) Nonlinear filter for separation of center sounds in stereophonic audio
US7076071B2 (en) Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings
EP2326108A1 (en) Audio system phase equalizion
EP3613219A1 (en) Stereo virtual bass enhancement
US8971542B2 (en) Systems and methods for speaker bar sound enhancement
JP2006025439A (en) Apparatus and method for creating 3d sound
US11388539B2 (en) Method and device for audio signal processing for binaural virtualization
KR20190091825A (en) Method for up-mixing stereo audio to binaural audio and apparatus using the same
EP3963906B1 (en) Rendering audio objects with multiple types of renderers
JP2006033847A (en) Sound-reproducing apparatus for providing optimum virtual sound source, and sound reproducing method
US10013970B2 (en) Sound effect producing apparatus, method of producing sound effect and program therefor
JP2022092184A (en) Voice signal processing device and voice signal processing program
JP2009134128A (en) Acoustic processing device and acoustic processing method
JP6512767B2 (en) Sound processing apparatus and method, and program
EP4264963A1 (en) Binaural signal post-processing
JP2000228800A (en) Method and device for reproducing multi-channel audio signal
JP2004343590A (en) Stereophonic signal processing method, device, program, and storage medium
CN113645531A (en) Earphone virtual space sound playback method and device, storage medium and earphone
JPWO2016039168A1 (en) Audio processing apparatus and method
CN113632501A (en) Information processing apparatus and method, reproduction apparatus and method, and program
JP7292650B2 (en) MIXING APPARATUS, MIXING METHOD, AND MIXING PROGRAM
JP2022090727A (en) Voice signal processing device and voice signal processing program
US11924628B1 (en) Virtual surround sound process for loudspeaker systems
JPH0834653B2 (en) Sound field expansion controller

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20231128