JP2022092184A - Voice signal processing device and voice signal processing program - Google Patents
Voice signal processing device and voice signal processing program Download PDFInfo
- Publication number
- JP2022092184A JP2022092184A JP2020204835A JP2020204835A JP2022092184A JP 2022092184 A JP2022092184 A JP 2022092184A JP 2020204835 A JP2020204835 A JP 2020204835A JP 2020204835 A JP2020204835 A JP 2020204835A JP 2022092184 A JP2022092184 A JP 2022092184A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- sound source
- indirect
- direct
- signal processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000926 separation method Methods 0.000 claims abstract description 17
- 230000005236 sound signal Effects 0.000 claims description 39
- 238000000034 method Methods 0.000 claims description 26
- 239000010410 layer Substances 0.000 description 22
- 239000011229 interlayer Substances 0.000 description 8
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Abstract
Description
本発明は、音質の低下を抑制しつつ音声信号をアップミックスする音声信号処理装置、音声信号処理プログラムに関する。 The present invention relates to an audio signal processing device and an audio signal processing program that upmix an audio signal while suppressing deterioration of sound quality.
近年、4K放送や8K放送の実現に伴い、ステレオ(2ch)の音声フォーマットをアップミックスして5.1chサラウンドや3Dオーディオに対応する22.2chサラウンドの音声フォーマットを生成する需要が高まっている。生放送では、ステレオの音声フォーマットから5.1chサラウンドや22.2chサラウンドの音声フォーマットをリアルタイムで生成することにより、2K放送と同時に4K放送や8K放送を行うこともある。 In recent years, with the realization of 4K broadcasting and 8K broadcasting, there is an increasing demand for upmixing stereo (2ch) audio formats to generate 22.2ch surround audio formats corresponding to 5.1ch surround and 3D audio. In live broadcasting, 4K broadcasting or 8K broadcasting may be performed at the same time as 2K broadcasting by generating 5.1ch surround or 22.2ch surround audio formats in real time from stereo audio formats.
アップミックスの具体的な手法としては、特許文献1に記載されているように、ステレオの音源を左右それぞれで直接音と間接音とに分離し、これら4つの音源に対して遅延処理などの各種処理を行うことにより、サラウンドにおける各チャンネルの出力とする。また、特許文献2に記載されている技術では、ステレオの音源を左右それぞれで直接音と間接音とに分離した後に、HRIRを用いてアップミックスする手法も知られている。なお、ステレオの音源を直接音と間接音とに分離する手法としては、特許文献3に記載されているように、ステレオの音源からコヒーレント成分を抽出する方法が優れている。 As a specific method of upmixing, as described in Patent Document 1, stereo sound sources are separated into direct sound and indirect sound on the left and right sides, and various types such as delay processing are performed on these four sound sources. By performing the processing, the output of each channel in surround is obtained. Further, in the technique described in Patent Document 2, there is also known a method of separating a stereo sound source into a direct sound and an indirect sound on each of the left and right sides, and then upmixing them using an HRIR. As a method for separating a stereo sound source into a direct sound and an indirect sound, a method of extracting a coherent component from the stereo sound source is excellent as described in Patent Document 3.
しかしながら、特許文献1及び2においては、ステレオの音源を分離した後、遅延処理やHRIRに伴うフィルタ処理を行うため、元の音源に歪みが生じるという問題があった。特に、近年ではステレオの音源からアップミックスして生成したサラウンドの音源を、再びステレオの音源にダウンミックスするという需要もあるが、アップミックスの際に元の音源に歪みが生じていると、ステレオの音源にダウンミックスした際にもこのような歪みが残るという問題もあった。また、特許文献2においては、リファレンスのHRIRを必要としているが、入手が困難という問題もあった。 However, in Patent Documents 1 and 2, since the stereo sound source is separated and then the delay processing and the filter processing associated with the HRIR are performed, there is a problem that the original sound source is distorted. In particular, in recent years, there has been a demand to downmix a surround sound source generated by upmixing from a stereo sound source to a stereo sound source again, but if the original sound source is distorted during upmixing, it is stereo. There was also the problem that such distortion remained even when downmixing to the sound source of. Further, in Patent Document 2, although a reference HRIR is required, there is also a problem that it is difficult to obtain it.
本発明は、上記課題を解決すべく、ステレオの音源に歪みを生じさせないようにアップミックスすることの出来る音声信号処理装置を提供することを目的とする。 An object of the present invention is to provide an audio signal processing device capable of upmixing a stereo sound source so as not to cause distortion in order to solve the above problems.
本発明の音声信号処理装置は、次のような構成を備える。
(1)ステレオの音源をサラウンドの音源にアップミックスする音声信号処理装置である。
(2)前記ステレオの音源を直接音と間接音とに分離する分離部。
(3)前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部。
(4)前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部。
(5)前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算部。
The audio signal processing device of the present invention has the following configuration.
(1) An audio signal processing device that upmixes a stereo sound source to a surround sound source.
(2) A separation unit that separates the stereo sound source into direct sound and indirect sound.
(3) A setting unit that generates parameters for adjusting at least one of the direct sound and the indirect sound.
(4) A coefficient generation unit that generates a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameter.
(5) A calculation unit that upmixes the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
また、本発明の音声信号処理装置は、次のような構成を更に備えてもよい。
(1)前記パラメータは、前記サラウンドの音源のフロント側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む。
(2)前記パラメータは、前記サラウンドの音源のリア側チャンネルにおいて、センター音源と当該センター音源以外の音源とのバランスを調整するためのものを含む。
(3)前記パラメータは、前記サラウンドの音源のフロント側チャンネルから出力される前記直接音に対して、前記間接音のミキシング量を調整するためのものを含む。
(4)前記サラウンドの音源は、3Dオーディオに対応し、前記パラメータは、前記サラウンドの音源における中層のチャンネルから出力される前記直接音及び前記間接音と、上下層のチャンネルから出力される前記直接音及び前記間接音とのバランスを調整するものを含む。
(5)前記パラメータは、前記直接音と前記間接音とのバランスを調整するためのものを含む。
(6)前記設定部は、直接音/間接音バランス調整部を備え、前記直接音/間接音バランス調整部は、前記直接音と前記間接音とのバランスを調整する。
Further, the audio signal processing device of the present invention may further include the following configurations.
(1) The parameter includes a parameter for adjusting the balance between a center sound source and a sound source other than the center sound source in the front channel of the surround sound source.
(2) The parameter includes a parameter for adjusting the balance between the center sound source and a sound source other than the center sound source in the rear channel of the surround sound source.
(3) The parameter includes a parameter for adjusting the mixing amount of the indirect sound with respect to the direct sound output from the front side channel of the surround sound source.
(4) The surround sound source corresponds to 3D audio, and the parameters are the direct sound and the indirect sound output from the middle layer channel in the surround sound source, and the direct sound output from the upper and lower layer channels. Includes those that adjust the balance between sound and the indirect sound.
(5) The parameter includes a parameter for adjusting the balance between the direct sound and the indirect sound.
(6) The setting unit includes a direct sound / indirect sound balance adjusting unit, and the direct sound / indirect sound balance adjusting unit adjusts the balance between the direct sound and the indirect sound.
本発明の音声信号処理プログラムは、次のような構成を備える。
(1)コンピュータにステレオの音源をサラウンドの音源にアップミックスする処理を実行させる音声信号処理プログラムである。
(2)前記ステレオの音源を直接音と間接音とに分離する分離手順。
(3)前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定手順。
(4)前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成手順。
(5)前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算手順。
The audio signal processing program of the present invention has the following configuration.
(1) An audio signal processing program that causes a computer to execute a process of upmixing a stereo sound source to a surround sound source.
(2) Separation procedure for separating the stereo sound source into direct sound and indirect sound.
(3) A setting procedure for generating a parameter for adjusting at least one of the direct sound or the indirect sound.
(4) A coefficient generation procedure for generating a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameter.
(5) A calculation procedure for upmixing the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
本発明によれば、ステレオの音源に歪みを生じさせないようにアップミックスすることが出来る。 According to the present invention, it is possible to upmix a stereo sound source so as not to cause distortion.
[第1の実施形態]
[構成]
図1に示す本実施形態の音声信号処理装置100は、例えば、音声調整卓あるいはミキサーとして知られているものである。以下の説明においては、ステレオから22.2chサラウンドへのアップミックスを例に挙げ、音声信号処理装置100に入力される音声信号は、ステレオの音源のものとする。22.2chサラウンドは、チャンネル1~24の24のチャンネルにより構成される。具体的には、上層の9チャンネルと、中層の10チャンネルと、下層の3.2チャンネルとにより構成される。なお、下層の3.2チャンネルには、2つのLFEが含まれる。また、22.2chサラウンドは、フロント側の11.2チャンネルとサイド側及びリア側の11チャンネルに分けて考えることも出来る。説明を容易にするため、フロント側チャンネルからは主に直接音が、サイド側チャンネル及びリア側チャンネルからは主に間接音が、それぞれ出力されるものとして考えるが、間接音は、フロント側チャンネルから出力されても良い。
[First Embodiment]
[Constitution]
The audio
音声信号処理装置100は、ステレオの音源を左右それぞれで直接音と間接音とに分離する分離部10と、分離した音源を調整するための各種パラメータを生成する設定部20と、生成したパラメータに基づいて係数を生成する係数生成部30と、この係数と分離した音源とからアップミックスされたサラウンドの音源を生成する演算部40と、を備える。
The audio
分離部10は、ステレオの音源を左右それぞれで直接音と間接音とに分離する。すなわち、左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に分離する。ステレオの音源を直接音と間接音とに分離する手法としては、背景技術で説明した特許文献3の技術など、周知技術を用いることが出来る。分離部10は、後段に設けられた演算部40に、これら4つの音源を出力する。なお、直接音とは、直接耳に届く音であり、間接音とは、壁などに反射して耳に届く音である。
The
設定部20は、分離部10が分離した4つの音源を調整するためのパラメータを生成する。図2に示すように、設定部20は、直接音と間接音とのバランスを調整する直接音/間接音バランス調整部21と、直接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するフロントバランス調整部22と、間接音におけるセンター音源とセンター音源以外の音源とのバランスを調整するリアバランス調整部23と、直接音と間接音とのミキシング量を調整するミキシング量調整部24と、直接音及び間接音における中層チャンネルからの出力と上下層チャンネルからの出力とのバランスを調整する層間バランス調整部25と、を備える。
The
図3に示すように、直接音/間接音バランス調整部21は、例えば1つの操作子を備え、この操作子を左に回転させると直接音のミキシング量が増加し、右に回転させると間接音のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における直接音と間接音とのバランスを調整する。この調整の度合いは、ROOM値として後段に設けられた演算部40に出力される。
As shown in FIG. 3, the direct sound / indirect sound
図4に示すように、フロントバランス調整部22は、直接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、直接音のうちセンターに定位する成分である。また、このセンター音源以外の音源とは、直接音のうちセンター音源以外の成分である。フロントバランス調整部22は、例えば1つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における、フロント側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Fdiv値として後段に設けられた係数生成部30に出力される。
As shown in FIG. 4, the front
図5に示すように、リアバランス調整部23は、間接音のうち、センター音源とセンター音源以外の音源とのバランスを調整する。このセンター音源は、間接音のうちセンターに定位する成分である。また、このセンター音源以外の音源とは、間接音のうちセンター音源以外の成分である。リアバランス調整部23は、例えば1つの操作子を備え、この操作子を左に回転させるとセンター音源のミキシング量が増加し、右に回転させるとセンター音源以外の音源のミキシング量が増加する。ミキシングエンジニアは、この操作子を左右に回転させることにより、アップミックス後のサラウンドの音源における、リア側チャンネルから出力されるセンター音源とセンター音源以外の音源とのバランスを調整する。この調整の度合いは、Rdiv値として後段に設けられた係数生成部30に出力される。
As shown in FIG. 5, the rear
図6に示すように、ミキシング量調整部24は、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及びリア側チャンネルから出力される間接音に対する直接音のミキシング比率を調整する。このために、ミキシング量調整部24は、例えば主操作子Xと副操作子Yとを備える。
As shown in FIG. 6, the mixing
主操作子Xは、フロント側チャンネルから出力される直接音と、間接音とのバランスを調整する。例えば、主操作子Xを左に回転させると直接音及び間接音のミキシング量が減少し、右に回転させると直接音及び間接音のミキシング量が増加する。一方で、副操作子Yは、間接音に対して直接音をミキシングする量、及びフロント側チャンネルから出力される直接音に対して間接音をミキシングする量を調整する。例えば、副操作子Yを左に回転させると間接音に対してミキシングする直接音の量及び直接音に対してミキシングする間接音の量が減少し、右に回転させると間接音に対してミキシングする直接音の量及び直接音に対してミキシングする間接音の量が増加する。ミキシングエンジニアは、主操作子Xと副操作子Yとを回転させることにより、フロント側チャンネルから出力される直接音に対する間接音のミキシング比率、及び間接音に対する直接音のミキシング比率を調整する。なお、主操作子Xと副操作子Yは連動するようにしても良いし、主操作子Xは固定して副操作子Yだけが回転するようにしても良い。連動させる場合は、主操作子Xの回転方向と反対方向に副操作子Yが回転するようにすると良い。この調整の度合いは、FRdiv値として後段に設けられた係数生成部30に出力される。
The main operator X adjusts the balance between the direct sound output from the front channel and the indirect sound. For example, rotating the main controller X to the left reduces the mixing amount of direct and indirect sounds, and rotating it to the right increases the mixing amount of direct and indirect sounds. On the other hand, the sub-operator Y adjusts the amount of mixing the direct sound with respect to the indirect sound and the amount of mixing the indirect sound with respect to the direct sound output from the front side channel. For example, rotating the sub-operator Y to the left reduces the amount of direct sound that mixes with the indirect sound and the amount of indirect sound that mixes with the direct sound, and rotating it to the right reduces the amount of indirect sound that mixes with the indirect sound. The amount of direct sound to be made and the amount of indirect sound to be mixed with the direct sound are increased. The mixing engineer adjusts the mixing ratio of the indirect sound to the direct sound output from the front channel and the mixing ratio of the direct sound to the indirect sound by rotating the main operator X and the sub-operator Y. The main operator X and the sub-operator Y may be interlocked with each other, or the main operator X may be fixed and only the sub-operator Y may rotate. In the case of interlocking, it is preferable to rotate the sub-operator Y in the direction opposite to the rotation direction of the main operator X. The degree of this adjustment is output as a FRdiv value to the
図7に示すように、アップミックス後のサラウンドの音源が3Dオーディオに対応している場合、層間バランス調整部25は、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。すなわち、層間バランス調整部25は、例えば1つの操作子を備え、この操作子を左に回転させると中層チャンネルから出力される直接音及び間接音が強調され、右に回転させると上下層チャンネルから出力される直接音及び間接音が強調される。ミキシングエンジニアは、この操作子を左右に回転させることにより、中層チャンネルから出力される直接音及び間接音と、上下層チャンネルから出力される直接音及び間接音とのバランスを調整する。この調整の度合いは、ELdiv値として後段に設けられた係数生成部30に出力される。
As shown in FIG. 7, when the surround sound source after upmix corresponds to 3D audio, the interlayer
図2に戻り、係数生成部30は、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivを任意に組み合わせて四則演算することにより、係数A、B、C、Dを生成する。また、この組み合わせ及び四則演算は、サラウンドにおける各チャンネルにより異なっている。すなわち、22.2chのそれぞれに対してFdiv、Rdiv、FRdiv、ELdivの各値が組み合わせられることにより、24組の係数A1~D1、・・・、A24~D24が生成される。
Returning to FIG. 2, the
各係数An~Dnの生成について、より詳細に説明する。Fdivは、AnFdiv、BnFdiv、CnFdiv、DnFdivからなる。同様に、Rdivは、AnRdiv、BnRdiv、CnRdiv、DnRdivからなり、FRdivは、AnFRdiv、BnFRdiv、CnFRdiv、DnFRdivからなり、ELdivは、AnELdiv、BnELdiv、CnELdiv、DnELdivからなる。 The generation of each coefficient An to Dn will be described in more detail. Fdiv consists of AnFdiv, BnFdiv, CnFdiv, and DnFdiv. Similarly, Rdiv consists of AnRdiv, BnRdiv, CnRdiv, DnRdiv, FRdiv consists of AnFRdiv, BnFRdiv, CnFRdiv, DnFRdiv, and ELdiv consists of AnELdiv, BnELdiv, CnELdiv.
例えば、フロントバランス調整部22の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnFdiv、BnFdivが生成される。同様に、リアバランス調整部23の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにCnRdiv、DnRdivが生成され、ミキシング量調整部24の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnFRdiv、BnFRdiv、CnFRdiv、DnFRdivが生成され、層間バランス調整部25の操作子を回転させることにより、サラウンドの音源におけるチャンネルごとにAnELdiv、BnELdiv、CnELdiv、DnELdivが生成される。
For example, by rotating the operator of the front
そして、An~Dnは、次の各式により生成される。
An=AnFdiv×AnRdiv×AnFRdiv×AnELdiv
Bn=BnFdiv×BnRdiv×BnFRdiv×BnELdiv
Cn=CnFdiv×CnRdiv×CnFRdiv×CnELdiv
Dn=DnFdiv×DnRdiv×DnFRdiv×DnELdiv
And An to Dn are generated by each of the following equations.
An = AnFdiv x AnRdiv x AnFRdiv x AnELdiv
Bn = BnFdiv × BnRdiv × BnFRdiv × BnELdiv
Cn = CnFdiv × CnRdiv × CnFRdiv × CnELdiv
Dn = DnFdiv × DnRdiv × DnFRdiv × DnELdiv
以上のようにして生成された係数A1~D1、・・・、A24~D24は、後段に設けられた演算部40に出力される。
The coefficients A1 to D1, ..., A24 to D24 generated as described above are output to the
図8に示すように、演算部40は、分離部10が分離した4つの音源DL、DR、RL、RRと、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した係数A1~D1、・・・、A24~D24に基づいて、アップミックス後のサラウンドにおいて各チャンネルから出力する音声信号を演算する。演算部40は、各チャンネルからの出力Tを、以下の(式1)により演算する。なお、(式1)において出力T及び各係数A、B、C、Dに付されるnは、サラウンドにおけるチャンネル番号であり、例えばT1はチャンネル1の出力Tである。また、DL’、DR’、RL’、RR’は、それぞれDL、DR、RL、RRをROOM値で調整したものである。これにより、演算部40は、チャンネル1~24からの出力T1~T24をそれぞれ生成し、サラウンドの音源を生成する。なお、アップミックスされたサラウンドの音源は、各チャンネルに設けられた図示しないスピーカなどの出力装置から外部に出力される。
(数1)
Tn=An×DL’+Bn×DR’+Cn×RL’+Dn×RR’・・・(式1)
As shown in FIG. 8, the
(Number 1)
Tn = An x DL'+ Bn x DR'+ Cn x RL'+ Dn x RR'... (Equation 1)
[作用]
図9を参照しつつ、本実施形態における音声信号処理装置100の作用について説明する。まず、元の音声信号であるステレオの音源が、分離部10に入力される。分離部10は、ステレオの音源を、左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に分離する(ステップS01)。分離された4つの音源は、演算部40に入力される。
[Action]
The operation of the audio
設定部20において、直接音/間接音バランス調整部21がROOM値を、フロントバランス調整部22がFdiv値を、リアバランス調整部23がRdiv値を、ミキシング量調整部24がFRdiv値を、層間バランス調整部25がELdiv値を、それぞれ生成し、後段に設けられた係数生成部30または演算部40に出力する(ステップS02)。より詳細には、これらの各構成において、ミキシングエンジニアが1つまたは2つの操作子を回転させ、直接音または間接音の少なくとも一方を調整するためにミキシング量の調整を行う。この調整の結果として、上述の各パラメータが生成される。ROOM値と4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて生成された係数とが演算部40に入力され、アップミックス後のサラウンドの音源に反映される。すなわち、設定部20におけるミキシング量の調整は、アップミックス後のサラウンドの音源を調整するものであるとも言える。
In the
係数生成部30は、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivを任意に組み合わせて四則演算することにより、サラウンドの出力におけるチャンネルごとに係数A、B、C、Dを生成する。すなわち、22.2chのそれぞれに対してFdiv、Rdiv、FRdiv、ELdivの各値が組み合わせられることにより、24組の係数A1~D1、・・・、A24~D24が生成される(ステップS03)。係数A1~D1、・・・、A24~D24は、後段に設けられた演算部40に出力される。なお、間接音RL、RRの係数Cn、Dnの生成においては、直接音のミキシング量に関係するFdiv値を用いなくてもよい。同様に、直接音DL、DRの係数An、Bnの生成においては、間接音のミキシング量に関係するRdiv値を用いなくてもよい。このように、各係数の生成において、必ずしも全てのパラメータを用いる必要はない。また、チャンネルによっては、全ての係数を四則演算により生成する必要もない。例えば、中層のフロント側における左チャンネル出力の係数は、Bn=Dn=1とすることが出来る。
The
演算部40は、分離部10が生成した4つの音源DL、DR、RL、RRと、直接音/間接音バランス調整部21が生成したパラメータROOMと、係数生成部30が生成した24組の係数A1~D1、・・・、A24~D24とに基づいて、上記(式1)から、22.2chサラウンドにおける各チャンネルの出力T1~T24を演算する(ステップS04)。演算された出力T1~T24は、サラウンドにおける各チャンネルに設けられた図示しないスピーカから出力される。
The
[効果]
(1)本実施形態の音声信号処理装置100は、ステレオの音源を分離部10が分離して生成した左の直接音DL、右の直接音DR、左の間接音RL、右の間接音RRの4つの音源に対して、直接音/間接音バランス調整部21が生成したROOM値により調整した上で、設定部20が生成した4つのパラメータFdiv、Rdiv、FRdiv、ELdivに基づいて係数生成部30が生成した係数を、演算部40が乗算することにより、ステレオの音源からサラウンドの音源を生成する。このように、遅延処理やフィルタ処理を行うことなくステレオの音源をアップミックスするので、アップミックスに伴う音源の歪みを抑制することが出来る。そのため、アップミックスしたサラウンドの音源をステレオの音源に再度ダウンミックスしても、ステレオの音源に生じる歪みが少ない。
[effect]
(1) In the audio
(2)本実施形態の音声信号処理装置100の設定部20は、フロントバランス調整部22を備える。これにより、フロント側チャンネル出力においてセンター音源だけを他の音源に比較して強調することが出来るので、センター音源が他の音源に埋もれて聞こえづらくなるという事態を回避することが出来る。特に、センター音源にコメントなどの重要な情報が含まれている場合に、コメントが聞こえないという事態を回避することが出来る。
(2) The
(3)本実施形態の音声信号処理装置100の設定部20は、リアバランス調整部23を備える。これにより、リア側チャンネル出力においてセンター音源と他の音源とのバランスを調整することが出来るので、リア側チャンネルから出力される音の拡がり方を調整することが出来る。
(3) The
(4)本実施形態の音声信号処理装置100の設定部20は、ミキシング量調整部24を備える。これにより、センター音源が他の音源に比較して弱々しい場合であっても、フロント側チャンネルから出力される直接音に間接音をミックスすることにより、フロント側チャンネルから出力されるセンター音源を補強し、センターに定位する音を聴き易くすることが出来る。同様にして、間接音に直接音をミックスすることにより、センター音源を補強することが出来る。
(4) The
(5)本実施形態の音声信号処理装置100の設定部20は、層間バランス調整部25を備える。これにより、サラウンドにおける中層の直接音及び間接音を上層及び下層にも拡げることが出来る。
(5) The
(6)本実施形態の音声信号処理装置100の設定部20は、直接音/間接音バランス調整部21を備える。これにより、アップミックス後のサラウンドの音源において間接音を強調することが出来る。
(6) The
[他の実施形態]
本発明は、上記実施形態に限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。具体的には、次のような他の実施形態も包含する。
[Other embodiments]
The present invention is not limited to the above embodiment, and at the implementation stage, the components can be modified and embodied within a range that does not deviate from the gist thereof. In addition, various inventions can be formed by an appropriate combination of the plurality of components disclosed in the above-described embodiment. For example, some components may be removed from all the components shown in the embodiments. Specifically, it also includes other embodiments such as the following.
(1)上記の実施形態においては、ステレオから22.2chサラウンドへのアップミックスについて説明したが、例えばステレオから5.1chサラウンドへのアップミックスや、ステレオから3Dオーディオに対応する5.1.2chサラウンドへのアップミックスについても本発明を適用することが出来る。 (1) In the above embodiment, the upmix from stereo to 22.2ch surround has been described, but for example, the upmix from stereo to 5.1ch surround and 5.12ch corresponding to stereo to 3D audio are supported. The present invention can also be applied to upmix to surround.
(2)上記の実施形態においては、各チャンネルの出力Tnをそれぞれ演算するものとしたが、これに限られない。例えば、フロント側の左右チャンネルやサイド側及びリア側の左右チャンネルの出力については、同じにしてもよい。これにより、係数生成部30や演算部40の演算量を削減することが出来る。
(2) In the above embodiment, the output Tn of each channel is calculated, but the present invention is not limited to this. For example, the outputs of the left and right channels on the front side and the left and right channels on the side and rear sides may be the same. As a result, the amount of calculation of the
(3)上記の実施形態の設定部20は、4つのパラメータFdiv、Rdiv、FRdiv、ELdivを生成するようにしたが、これに限られない。設定部20が1つでもパラメータを生成できるのであれば、係数An~Dnを生成するための四則演算を多様にすることで、各チャンネルnの出力Tnを細やかに調整することも可能である。また、図10に示すように、Room値も含めた5つのパラメータで係数An~Dnを生成するようにしても良い。この場合、例えば以下の各式により、係数を生成することが出来る。ただし、AnRoom=BnRoom、CnRoom=DnRoom=1-AnRoomとする。
An=AnRoom×AnFdiv×AnRdiv×AnFRdiv×AnELdiv
Bn=BnRoom×BnFdiv×BnRdiv×BnFRdiv×BnELdiv
Cn=CnRoom×CnFdiv×CnRdiv×CnFRdiv×CnELdiv
Dn=DnRoom×DnFdiv×DnRdiv×DnFRdiv×DnELdiv
(3) The
An = AnRoom × AnFdiv × AnRdiv × AnFRdiv × AnELdiv
Bn = BnRoom × BnFdiv × BnRdiv × BnFRdiv × BnELdiv
Cn = CnRoom × CnFdiv × CnRdiv × CnFRdiv × CnELdiv
Dn = DnRoom × DnFdiv × DnRdiv × DnFRdiv × DnELdiv
(4)上記の実施形態の設定部20においては、ミキシングエンジニアが各構成に設けられた操作子を操作することによってパラメータを生成したが、音声信号処理装置100に設けられたGUIを操作することによってパラメータを生成してもよい。
(4) In the
(5)上記の実施形態の設定部20は、直接音/間接音バランス調整部21、フロントバランス調整部22、リアバランス調整部23、ミキシング量調整部24、層間バランス調整部25を備えるものとしたが、これらの構成に加えて、イコライザを備えてもよい。この場合、イコライザは、ステレオの音源を歪め過ぎない程度に利用される。
(5) The
(6)上記の実施形態のミキシング量調整部24は、直接音に対してミキシングする間接音の量と、間接音に対してミキシングする直接音の量を調整するようにしたが、前者だけであってもよい。すなわち、間接音に対して直接音をミキシングしなくてもよい。
(6) The mixing
(7)上記の実施形態の層間バランス調整部25は、1つの操作子でサラウンドの音源における中層の直接音及び間接音を上下層に拡げることとしたが、2つの操作子を備えることにより、直接音と間接音とを個別に調整することも出来る。なお、2つの操作子は連動するようにしても良いし、一方は固定して他方だけが回転するようにしても良い。連動させる場合は、一方の回転方向と反対方向に他方が回転するようにすると良い。
(7) The interlayer
(8)上記の実施形態においては、音声信号処理装置100というハードウェアについて説明したが、コンピュータに音声信号処理装置100の各構成の作用を手順として実行させるプログラムなどのソフトウェアによっても同様の効果を奏することが出来る。例えば、分離部10と、設定部20と、係数生成部30と、演算部40を構成として備える音声信号処理装置100の代わりに、ステレオの音源を直接音と間接音とに分離する分離手順と、直接音または間接音の少なくとも一方を調整するためのパラメータを生成する設定手順と、パラメータに基づき、サラウンドの音源におけるチャンネルごとに直接音及び間接音に乗算する係数を生成する係数生成手順と、直接音及び間接音に係数を乗算することにより、ステレオの音源をサラウンドの音源にアップミックスする演算手順をコンピュータに実行させる音声信号処理プログラムによっても、同様の効果を奏することが出来る。この手順は、例えば図9の説明と同様に行われる。
(8) In the above embodiment, the hardware of the audio
100…音声信号処理装置
10…分離部
20…設定部
21…直接音/間接音バランス調整部
22…フロントバランス調整部
23…リアバランス調整部
24…ミキシング量調整部
25…層間バランス調整部
30…係数生成部
40…演算部
X…主操作子
Y…副操作子
DL…左の直接音
DR…右の直接音
RL…左の間接音
RR…右の間接音
A~D…係数
T…出力
100 ... Audio
Claims (8)
前記ステレオの音源を直接音と間接音とに分離する分離部と、
前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定部と、
前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成部と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算部を備える音声信号処理装置。 An audio signal processing device that upmixes a stereo sound source to a surround sound source.
A separation unit that separates the stereo sound source into direct sound and indirect sound,
A setting unit that generates parameters for adjusting at least one of the direct sound and the indirect sound, and
A coefficient generator that generates a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source based on the parameters.
An audio signal processing device including a calculation unit that upmixes the stereo sound source to the surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
請求項1に記載の音声信号処理装置。 The parameters include those for adjusting the balance between the center sound source and the sound sources other than the center sound source in the front channel of the surround sound source.
The audio signal processing device according to claim 1.
請求項1または2に記載の音声信号処理装置。 The parameters include those for adjusting the balance between the center sound source and the sound sources other than the center sound source in the rear channel of the surround sound source.
The audio signal processing device according to claim 1 or 2.
請求項1乃至3のいずれかに記載の音声信号処理装置。 The parameters include those for adjusting the mixing amount of the indirect sound with respect to the direct sound output from the front side channel of the surround sound source.
The audio signal processing device according to any one of claims 1 to 3.
前記パラメータは、前記サラウンドの音源における中層のチャンネルから出力される前記直接音及び前記間接音と、上下層のチャンネルから出力される前記直接音及び前記間接音とのバランスを調整するものを含む、
請求項1乃至4のいずれかに記載の音声信号処理装置。 The surround sound source supports 3D audio and is compatible with 3D audio.
The parameters include adjusting the balance between the direct sound and the indirect sound output from the middle layer channel in the surround sound source and the direct sound and the indirect sound output from the upper and lower layer channels.
The audio signal processing device according to any one of claims 1 to 4.
請求項1乃至5のいずれかに記載の音声信号処理装置。 The parameters include those for adjusting the balance between the direct sound and the indirect sound.
The audio signal processing device according to any one of claims 1 to 5.
前記直接音/間接音バランス調整部は、前記直接音と前記間接音とのバランスを調整する、
請求項1乃至5のいずれかに記載の音声信号処理装置。 The setting unit includes a direct sound / indirect sound balance adjustment unit.
The direct sound / indirect sound balance adjusting unit adjusts the balance between the direct sound and the indirect sound.
The audio signal processing device according to any one of claims 1 to 5.
前記ステレオの音源を直接音と間接音とに分離する分離手順と、
前記直接音または前記間接音の少なくとも一方を調整するためのパラメータを生成する設定手順と、
前記パラメータに基づき、前記サラウンドの音源におけるチャンネルごとに前記直接音及び前記間接音に乗算する係数を生成する係数生成手順と、
前記直接音及び前記間接音に前記係数を乗算することにより、前記ステレオの音源を前記サラウンドの音源にアップミックスする演算手順をコンピュータに実行させる音声信号処理プログラム。 An audio signal processing program that causes a computer to perform a process of upmixing a stereo sound source to a surround sound source.
The separation procedure for separating the stereo sound source into direct sound and indirect sound,
A setting procedure for generating parameters for adjusting at least one of the direct sound or the indirect sound, and
Based on the parameters, a coefficient generation procedure for generating a coefficient for multiplying the direct sound and the indirect sound for each channel in the surround sound source, and a coefficient generation procedure.
A voice signal processing program that causes a computer to perform an arithmetic procedure for upmixing a stereo sound source to a surround sound source by multiplying the direct sound and the indirect sound by the coefficient.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020204835A JP2022092184A (en) | 2020-12-10 | 2020-12-10 | Voice signal processing device and voice signal processing program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020204835A JP2022092184A (en) | 2020-12-10 | 2020-12-10 | Voice signal processing device and voice signal processing program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2022092184A true JP2022092184A (en) | 2022-06-22 |
Family
ID=82067986
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020204835A Pending JP2022092184A (en) | 2020-12-10 | 2020-12-10 | Voice signal processing device and voice signal processing program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2022092184A (en) |
-
2020
- 2020-12-10 JP JP2020204835A patent/JP2022092184A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2008278072B2 (en) | Method and apparatus for generating a stereo signal with enhanced perceptual quality | |
US8605914B2 (en) | Nonlinear filter for separation of center sounds in stereophonic audio | |
US7076071B2 (en) | Process for enhancing the existing ambience, imaging, depth, clarity and spaciousness of sound recordings | |
EP2326108A1 (en) | Audio system phase equalizion | |
EP3613219A1 (en) | Stereo virtual bass enhancement | |
US8971542B2 (en) | Systems and methods for speaker bar sound enhancement | |
JP2006025439A (en) | Apparatus and method for creating 3d sound | |
US11388539B2 (en) | Method and device for audio signal processing for binaural virtualization | |
KR20190091825A (en) | Method for up-mixing stereo audio to binaural audio and apparatus using the same | |
EP3963906B1 (en) | Rendering audio objects with multiple types of renderers | |
JP2006033847A (en) | Sound-reproducing apparatus for providing optimum virtual sound source, and sound reproducing method | |
US10013970B2 (en) | Sound effect producing apparatus, method of producing sound effect and program therefor | |
JP2022092184A (en) | Voice signal processing device and voice signal processing program | |
JP2009134128A (en) | Acoustic processing device and acoustic processing method | |
JP6512767B2 (en) | Sound processing apparatus and method, and program | |
EP4264963A1 (en) | Binaural signal post-processing | |
JP2000228800A (en) | Method and device for reproducing multi-channel audio signal | |
JP2004343590A (en) | Stereophonic signal processing method, device, program, and storage medium | |
CN113645531A (en) | Earphone virtual space sound playback method and device, storage medium and earphone | |
JPWO2016039168A1 (en) | Audio processing apparatus and method | |
CN113632501A (en) | Information processing apparatus and method, reproduction apparatus and method, and program | |
JP7292650B2 (en) | MIXING APPARATUS, MIXING METHOD, AND MIXING PROGRAM | |
JP2022090727A (en) | Voice signal processing device and voice signal processing program | |
US11924628B1 (en) | Virtual surround sound process for loudspeaker systems | |
JPH0834653B2 (en) | Sound field expansion controller |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20231128 |