JP2017163458A - Up-mix device and program - Google Patents
Up-mix device and program Download PDFInfo
- Publication number
- JP2017163458A JP2017163458A JP2016048051A JP2016048051A JP2017163458A JP 2017163458 A JP2017163458 A JP 2017163458A JP 2016048051 A JP2016048051 A JP 2016048051A JP 2016048051 A JP2016048051 A JP 2016048051A JP 2017163458 A JP2017163458 A JP 2017163458A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- impulse response
- indirect
- similar
- acoustic signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005314 correlation function Methods 0.000 claims abstract description 5
- 230000005236 sound signal Effects 0.000 claims description 23
- 230000006866 deterioration Effects 0.000 abstract description 5
- 238000000034 method Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 238000000926 separation method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000004807 localization Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001172 regenerating effect Effects 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Stereophonic System (AREA)
Abstract
Description
本発明は、入力音響信号よりもチャンネル数の多い出力音響信号を生成するアップミックス装置及びプログラムに関する。 The present invention relates to an upmix device and a program for generating an output sound signal having a larger number of channels than an input sound signal.
従来、2chステレオから5.1chサラウンドに変換するといった、少ないチャンネル数のオーディオ信号からより多いチャンネル数のオーディオ信号を作り出す、アップミックスと呼ばれる技術が知られている(例えば、特許文献1及び2参照)。
2. Description of the Related Art Conventionally, a technique called upmix that creates an audio signal with a larger number of channels from an audio signal with a smaller number of channels, such as conversion from 2ch stereo to 5.1ch surround, is known (see, for example,
2chステレオの信号から5.1chサラウンドの信号を作り出すアルゴリズムはいろいろと提案されており、すでに製品化もされている。これらの機器は、例えば、ポストプロダクションなどで既存の2チャンネルオーディオ素材を5.1chサラウンド制作に応用したり、あるいは、5.1chサラウンドの音楽番組で2チャンネル制作のカラオケを5.1chに変換して使用したりするといった用途に使われている。また、素材レベルでのアップミックスの利用だけではなく、2チャンネルステレオで制作されたプログラムを丸ごとアップミックスして5.1chサラウンドのプログラムにするといった例もある。 Various algorithms for creating 5.1ch surround signals from 2ch stereo signals have been proposed and have already been commercialized. These devices, for example, apply existing 2-channel audio material to 5.1ch surround production in post-production, etc., or convert 2-channel production karaoke to 5.1ch in 5.1ch surround music programs. It is used for purposes such as In addition to the use of upmix at the material level, there is an example in which a program produced in 2-channel stereo is upmixed into a 5.1ch surround program.
さらに近年、8Kスーパーハイビジョン用の22.2ch音響を始め、5.1chを上回る多数のチャンネルを有する音響システムの開発が進められている。しかし、現在市販されているアップミックス装置の中に22.2ch音響に対応したものはない。また、Nチャンネルのオーディオ信号からMチャンネルのオーディオ信号を生成する技術(N≦M)も提案されているが(例えば、特許文献3及び4参照)、その多くは5.1chサラウンドなどの二次元平面上にスピーカを配置したシステムを想定したものであり、高さ方向にもスピーカが存在する三次元音響システムに適用した場合に、自然な三次元空間印象が得られるかどうかは検証されていない。
Furthermore, in recent years, development of an acoustic system having many channels exceeding 5.1 ch, including 22.2 ch sound for 8K Super Hi-Vision, has been underway. However, none of the upmix devices currently on the market are compatible with 22.2 ch sound. Further, a technique (N ≦ M) for generating an M-channel audio signal from an N-channel audio signal has also been proposed (see, for example,
このように、音響制作において、異なるチャンネル方式で制作された素材を融合したり、互換したりする上で、アップミックス技術は重要である。特に、音響制作の効率的化には、アップミックス用の付帯情報(サイド情報)を持たない従来の2chステレオ、5.1chの音声信号(音声データ)から、音響エンジニアがミキシング作業を行うことなく22.2chの音声信号(音声データ)を得ることができる、自動アップミックス技術が不可欠である。 In this way, in sound production, upmix technology is important in order to fuse and interchange materials produced by different channel methods. In particular, for efficient sound production, acoustic engineers do not perform mixing work from conventional 2ch stereo and 5.1ch audio signals (audio data) that do not have additional information (side information) for upmixing. Automatic upmix technology that can obtain 22.2 ch audio signals (audio data) is essential.
そこで、特許文献5では、アップミックス用の付帯情報を持たない従来の2chステレオ、5.1chサラウンドの音声信号から、ミキシング作業を行うことなく22.2chの音声信号を得る技術が開示されている。 Therefore, Patent Document 5 discloses a technique for obtaining a 22.2 ch audio signal without performing a mixing operation from a conventional 2 ch stereo and 5.1 ch surround audio signal having no additional information for upmixing. .
また、22.2chを5.1chや2chステレオに変換するといった、より少ないチャンネル数のオーディオ信号を作り出すことをダウンミックスと呼ぶ。22.2chの再生に対応しない機器(受信機、オーディオアンプ等)では、予め定められた配分(ダウンミックス係数)で複数チャンネルの信号を混合し、再生可能なより少ないチャンネル数に再構成するダウンミックス処理が行われる(例えば、非特許文献1参照)。 Creating an audio signal with a smaller number of channels, such as converting 22.2 ch into 5.1 ch or 2 ch stereo, is called downmix. For devices that do not support 22.2ch playback (receivers, audio amplifiers, etc.), a multi-channel signal is mixed with a predetermined distribution (downmix coefficient) and reconfigured to a smaller number of channels that can be played back. Mix processing is performed (for example, refer nonpatent literature 1).
特許文献5に記載のアップミックス装置によれば、アップミックス用の付帯情報を持たない従来の2chステレオ、5.1chサラウンドの音声信号から、ミキシング作業を行うことなく22.2chの音声信号を生成することができる。しかし、得られた22.2ch信号から、上述のダウンミックス係数を使った自動ダウンミックスを行った場合、以下の理由により音質が劣化するという課題があった。 According to the upmix device described in Patent Document 5, a 22.2 ch audio signal is generated from a conventional 2 ch stereo and 5.1 ch surround audio signal having no additional information for upmix without performing a mixing operation. can do. However, when automatic downmix using the above-described downmix coefficient is performed from the obtained 22.2ch signal, there is a problem that sound quality deteriorates for the following reason.
特許文献5に記載のアップミックス装置は、アップミックス前の原信号から分離した間接音に遅延処理を施し、この遅延時間を変えることで、複数の間接音を新たに生成してアップミックスを行う。このアップミックス後の信号に、ダウンミックス係数によるダウンミックス処理が施された場合、遅延時間だけが異なる同一の信号が加算される。そのため、櫛形フィルタが形成され、周波数特性に遅延時間の逆数の周波数間隔でピーク又はディップが生じ、音質が劣化してしまう。 The upmix device described in Patent Document 5 performs a delay process on the indirect sound separated from the original signal before the upmix, and changes the delay time to newly generate a plurality of indirect sounds and perform the upmix. . When a downmix process using a downmix coefficient is performed on the signal after the upmixing, the same signal that is different only in delay time is added. Therefore, a comb filter is formed, and a peak or dip occurs in the frequency characteristic at a frequency interval that is the reciprocal of the delay time, and the sound quality is degraded.
かかる事情に鑑みてなされた本発明の目的は、アップミックス用の付帯情報を持たない従来の2chステレオ、5.1chサラウンドなどの入力音響信号から、ミキシング作業を行うことなく、かつダウンミックスしても音質劣化の少ない、アップミックスされた出力音響信号を得ることが可能なアップミックス装置及びプログラムを提供することにある。 An object of the present invention made in view of such circumstances is to perform downmixing without performing mixing work from an input acoustic signal such as a conventional 2ch stereo or 5.1ch surround which does not have additional information for upmixing. Another object of the present invention is to provide an upmix device and a program capable of obtaining an upmixed output acoustic signal with little deterioration in sound quality.
上記課題を解決するため、本発明に係るアップミックス装置は、入力音響信号よりもチャンネル数の多い出力音響信号を生成するアップミックス装置であって、入力音響信号を直接音及び間接音に分離する残響分離器と、入力音響信号を収録した原音場のインパルス応答を推定するインパルス応答推定部と、前記インパルス応答との相関関数の絶対値の最大値が1よりも小さい複数の類似インパルス応答を生成するインパルス応答生成部と、前記直接音及び前記複数の類似インパルス応答の畳み込み演算により複数の類似間接音を生成する間接音生成部と、前記直接音、前記間接音、及び前記類似間接音を用いた線形演算を行い、前記出力音響信号を生成する混合器と、を備えることを特徴とする。 In order to solve the above problems, an upmix device according to the present invention is an upmix device that generates an output acoustic signal having a larger number of channels than an input acoustic signal, and separates the input acoustic signal into a direct sound and an indirect sound. A reverberation separator, an impulse response estimator for estimating an impulse response of an original sound field recorded with an input acoustic signal, and a plurality of similar impulse responses having a maximum absolute value of a correlation function with the impulse response smaller than 1. Using the direct sound, the indirect sound, and the similar indirect sound, and the indirect sound generating unit that generates a plurality of similar indirect sounds by convolution of the direct sound and the plurality of similar impulse responses. And a mixer for performing the linear operation and generating the output acoustic signal.
さらに、本発明に係るアップミックス装置において、前記インパルス応答生成部は、前記インパルス応答を所定の時間で分割し、乱数を用いて並べ直して前記類似インパルス応答を生成することを特徴とする。 Furthermore, in the upmix device according to the present invention, the impulse response generation unit divides the impulse response by a predetermined time, rearranges the impulse response using a random number, and generates the similar impulse response.
さらに、本発明に係るアップミックス装置において、前記混合器により生成された出力音響信号について、チャンネル毎に音量レベルを調節する乗算器をさらに備えることを特徴とする。 The upmix device according to the present invention further includes a multiplier that adjusts a volume level for each channel of the output acoustic signal generated by the mixer.
また、上記課題を解決するため、本発明に係るプログラムは、コンピュータを、上記アップミックス装置として機能させることを特徴とする。 In order to solve the above problem, a program according to the present invention causes a computer to function as the upmix device.
本発明によれば、アップミックス用の付帯情報を持たない従来の2chステレオ、5.1chサラウンドなどの入力音響信号から、ミキシング作業を行うことなく、入力音響信号よりもチャンネル数の多いアップミックスされた出力音響信号を得ることができる。また、得られた出力音響信号をダウンミックスしても、音質劣化の少ないブラインドアップミックスを実現することができる。 According to the present invention, a conventional 2ch stereo having no additional information for upmixing and 5.1ch surround input audio signals are mixed without any mixing work and having a larger number of channels than the input audio signals. Output acoustic signals can be obtained. Moreover, even if the obtained output sound signal is downmixed, a blind upmix with little deterioration in sound quality can be realized.
本発明のアップミックス装置は、入力音響信号よりもチャンネル数の多い出力音響信号を生成する装置である。以下、本発明の実施形態について、図面を参照して詳細に説明する。 The upmix apparatus of the present invention is an apparatus that generates an output acoustic signal having a larger number of channels than the input acoustic signal. Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
(第1の実施形態)
第1の実施形態では、入力音響信号(原信号)を、前方左右の音を収録した2chステレオ信号とし、出力音響信号を、22.2ch信号とする。図1に、本発明の第1の実施形態に係るアップミックス装置の構成例を示す。図1に示す例では、アップミックス装置1は、残響分離器11と、インパルス応答推定部12と、インパルス応答生成部13と、間接音生成部14と、混合器15と、乗算器16と、ローパスフィルタ17とを備える。ただし、乗算器16は必須の構成ではない。
(First embodiment)
In the first embodiment, the input sound signal (original signal) is a 2ch stereo signal that includes sounds on the left and right in front, and the output sound signal is a 22.2ch signal. FIG. 1 shows a configuration example of an upmix device according to the first embodiment of the present invention. In the example illustrated in FIG. 1, the
図2に、22.2ch信号を再生する場合のスピーカ配置とチャンネル番号・ラベルを示す。 FIG. 2 shows the speaker arrangement and channel number / label when reproducing 22.2ch signals.
アップミックスによって得られる図2の1〜24ch用の信号をy1(t),y2(t),・・・,y24(t)とする。原信号である2chステレオ信号の左右の信号をそれぞれxL(t),xR(t)とする。原信号xL(t),xR(t)は、それぞれの直接音dL(t),dR(t)と間接音(残響音)rL(t),rR(t)とを用いて次のように表される。 Signals for channels 1 to 24 in FIG. 2 obtained by upmixing are assumed to be y 1 (t), y 2 (t),..., Y 24 (t). The left and right signals of the 2ch stereo signal that is the original signal are assumed to be x L (t) and x R (t), respectively. The original signals x L (t) and x R (t) are obtained from the respective direct sounds d L (t) and d R (t) and indirect sounds (reverberation sounds) r L (t) and r R (t). It is expressed as follows.
残響分離器11は、入力された原信号xL(t),xR(t)を、それぞれ直接音dL(t),dR(t)、及び間接音rL(t),rR(t)に分離して、インパルス応答推定部12、混合器15、及びローパスフィルタ17に出力する。残響分離処理は、公知の処理を用いることができる。例えば、K. Kinoshita et al, "Blind Upmix Of Stereo Music Signals Using Multi-Step Linear Prediction Based Reverberation Extraction", ICASSP, pp.49-52, 2010.に開示された手法により、残響分離処理を行う。
The
インパルス応答推定部12は、残響分離器11により分離された直接音dL(t),dR(t)と間接音rL(t),rR(t)とから、あるいは原信号xL(t),xR(t)と直接音dL(t),dR(t)とから、原音場(入力音響信号を収録した、直接音を含まない原音場)のインパルス応答hL(t),hR(t)を推定し、インパルス応答生成部13に出力する。
The impulse response estimation unit 12 uses the direct sounds d L (t) and d R (t) separated by the
間接音rL(t),rR(t)は、原音場のインパルス応答hL(t),hR(t)を用いて、式(2)で表される。 The indirect sounds r L (t) and r R (t) are expressed by Equation (2) using the impulse responses h L (t) and h R (t) of the original sound field.
ここで、*は畳み込み演算を示す。式(2)の周波数領域表現は、式(3)のように表せる。 Here, * indicates a convolution operation. The frequency domain representation of Equation (2) can be expressed as Equation (3).
式(3)より、原音場の伝達関数HL(ω),HR(ω)は、式(4)で表される。 From Expression (3), the transfer functions H L (ω) and H R (ω) of the original sound field are expressed by Expression (4).
インパルス応答推定部12は、式(4)に基づき伝達関数HL(ω),HR(ω)を求め、時間領域に戻したインパルス応答hL(t),hR(t)を算出する。直接音の周波数成分DL(ω),DR(ω)に零点がある場合、式(4)の値を算出できないが、原信号の間接音rL(t),rR(t)、及び直接音dL(t),dR(t)から、例えばクロススペクトル法や適応フィルタ法など既知の手法を適用することにより、インパルス応答hL(t),hR(t)を推定することができる。 The impulse response estimation unit 12 obtains the transfer functions H L (ω) and H R (ω) based on the equation (4), and calculates the impulse responses h L (t) and h R (t) returned to the time domain. . If the frequency components D L (ω) and D R (ω) of the direct sound have zeros, the value of Equation (4) cannot be calculated, but the indirect sounds r L (t), r R (t), And impulse responses h L (t) and h R (t) are estimated from the direct sounds d L (t) and d R (t) by applying a known method such as a cross spectrum method or an adaptive filter method. be able to.
インパルス応答生成部13は、インパルス応答推定部12により推定されたインパルス応答との相関係数の絶対値の最大値が1よりも小さいインパルス応答である類似インパルス応答hLm(t),hRn(t)を複数生成し、間接音生成部14に出力する。なお、特許文献5に記載の手法では、遅延時間を変えることで複数の間接音を生成しているが、この方法だと遅延前のインパルス応答と遅延後のインパルス応答の相関関数の絶対値の最大値が1となる。すなわち、インパルス応答生成部13の処理には、特許文献5に記載の手法が含まれない。
The impulse
インパルス応答生成部13は、例えば、元になるインパルス応答hL(t),hR(t)を所定の時間で分割し、乱数を用いて並べ直すことにより、類似インパルス応答hLm(t),hRn(t)を生成する。
For example, the impulse
図3に、インパルス応答生成部13の一例として、特許第3657340号公報に開示された構成例を示す。インパルス応答生成部13にはインパルス応答hL(t)及びhR(t)が与えられるが、説明の便宜上、ここではインパルス応答h(t)が与えられるものとし、1つのインパルス応答h(t)からm個の類似インパルス応答h1(t),h2(t),・・・,hm(t)を生成する処理について説明する。
FIG. 3 shows a configuration example disclosed in Japanese Patent No. 3657340 as an example of the impulse
図3に示す例では、インパルス応答生成部13は、信号分離部131と、n個の乗算部132(132−1〜132−n)と、m個の乱数発生部133(133−1〜133−m)と、n個の時間シフト部134(134−1〜134−n)と、信号加算部135と、スイッチ136と、スイッチ137とを備える。
In the example illustrated in FIG. 3, the impulse
信号分離部131は、与えられたインパルス応答を初期反射音部e(t)と残響音部r(t)とに分離する。
The
乗算部132は、信号分離部131により分離された残響音部r(t)に対して、所定の有限長の時間窓をそれぞれ所定時間だけシフトして得られた時間窓を乗じ、信号r1(t),r2(t),・・・,rn(t)を生成する。
The
乱数発生部133は、時間シフト量をランダム時間系列で与える。
The random
時間シフト部134は、乱数発生部133のランダムな時間シフト量で、乗算部132の出力の時間軸をシフトし、信号r1 (k)(t),r2 (k)(t),・・・,rn (k)(t)を生成する。
The
信号加算部135は、信号分離部131により分離された初期反射音部e(t)と、時間シフト部134の出力とを全て加算する。
The
スイッチ136は、乱数発生部133の異なる出力を選択するものである。スイッチ137は、スイッチ136と連動しており、信号加算部135からの信号を振り分ける。
The
間接音生成部14は、式(5)に示すように、直接音dL(t),dR(t)、及び類似インパルス応答hLm(t),hRn(t)の畳み込み演算により、間接音と類似した音色を持つ間接音である類似間接音rLm(t),rRn(t)を複数生成し、混合器15に出力する。
As shown in Expression (5), the indirect
間接音と類似した類似間接音を用いることにより、聴感上3次元的な広がり感を得ることができる。また、インパルス応答hLm(t),hRn(t)から生成した類似間接音rLm(t),rRn(t)は、単純な時間遅延と異なり、混合しても櫛形フィルタが形成されず、ダウンミックスした際の音質劣化を避けることができる。 By using a similar indirect sound similar to the indirect sound, a three-dimensional sense of spread can be obtained in terms of hearing. Also, the similar indirect sounds r Lm (t) and r Rn (t) generated from the impulse responses h Lm (t) and h Rn (t) are different from simple time delays, and even if mixed, a comb filter is formed. Therefore, it is possible to avoid deterioration in sound quality when downmixing.
ローパスフィルタ17は、残響分離器11から入力された直接音dL(t),dR(t)の低域成分ldL(t),ldR(t)、及び間接音rL(t),rR(t)の低域成分lrL(t),lrR(t)をそれぞれ抽出して、混合器15に出力する。ここで、ローパスフィルタ17のカットオフ周波数は、例えば、80〜120Hzとする。またこの例では、ローパスフィルタ17からの出力信号はLFE(Low Frequency Effects)チャンネルである、図2のLFE1(4ch)及びLFE2(10ch)に出力される信号に適用される。
The low-
混合器15は、直接音dL(t),dR(t)、間接音rL(t),rR(t)、及び類似間接音rLm(t),rRn(t)を混合し(すなわち、直接音、間接音、及び類似間接音を用いた線形演算を行い)、各チャンネルへの信号を生成する。ここで、線形演算は直接音、間接音、類似間接音のうち、少なくとも一つを用いていればよい。また、混合器15は、各チャンネルへの信号に含まれる間接音に係数ar1,ar2,…,ar24を乗算することにより、各チャンネルに間接音を付加する度合いを調節する。例えば、直接音と間接音を混合するチャンネル(本実施形態では1ch、2ch、3ch、4ch、10ch)については、直接音と間接音の比を調節することができる。アップミックス装置1が乗算器16を備えない場合には、混合器15の出力する信号が出力音響信号となる。
The
乗算器16は、混合器15から出力される信号に係数a1,a2,…,a24を乗算することにより、チャンネル毎に音量レベルを調節して、22.2chのスピーカにそれぞれ出力音響信号を出力する。22.2chのスピーカが図2に示す位置に配置される場合、乗算器16が出力する出力信号y1(t),y2(t),…,y24(t)は、例えば式(6)のように表される。
The
式(6)の例では、混合器15は、図2に示すFL(1ch)への信号を生成するため、直接音dL(t)に、係数ar1を乗算した間接音rL(t)を付加する。同様に、混合器15は、FR(2ch)への信号を生成するため、直接音dR(t)に、係数ar2を乗算した間接音rR(t)を付加する。
In the example of Expression (6), the
混合器15は、FC(3ch)については、原信号の間接音のもつ方向特性の再現性と22.2ch音響のチャンネル配置に鑑み左右中央に位置する信号であるため、原信号の左右の直接音を混合したdL(t)+dR(t)に、原信号の左右の間接音を混合した{rL(t)+rR(t)}を、係数ar3を乗算して付加する。
The
同様に、混合器15は、左右中央に位置するBC(9ch),TpFC(15ch),TpC(16ch),TpBC(21ch),BtFC(22ch)についても、原信号から得た左右のインパルス応答hL(t),hR(t)それぞれから生成したhLm(t),hRn(t)に基づく類似間接音rLm(t),rRn(t)(m=n=9,15,16,21,22)を混合した間接音を付加する。また、混合器15は、中央より左側に位置するチャンネルには、原信号の左側インパルス応答hL(t)から生成したhLm(t)に基づく類似間接音rLm(t)(m=5,7,11,13,17,19,23)を付加する。中央より右側に位置するチャンネルには、原信号の右側インパルス応答hR(t)から生成したhRn(t)に基づく類似間接音rRm(t)(n=6,8,12,14,18,20,24)を付加する。なお、類似間接音それぞれの相関は低く、音の定位にも大きく影響しないため、左右どちらか一方の類似間接音を付加するようにしてもよい。
Similarly, the
(第2の実施形態)
つぎに、本発明の第2の実施形態について説明する。第2の実施形態では、入力音響信号(原信号)を、L,R,C,SL,SR,LFEチャンネルからなる5.1chサラウンド信号とし、出力音響信号を、22.2ch信号とする。図4に、本発明の第2の実施形態に係るアップミックス装置の構成例を示す。図4に示す例では、アップミックス装置2は、残響分離器21と、インパルス応答推定部22と、インパルス応答生成部23と、間接音生成部24と、混合器25と、乗算器26とを備える。ただし、乗算器26は必須の構成ではない。
(Second Embodiment)
Next, a second embodiment of the present invention will be described. In the second embodiment, an input acoustic signal (original signal) is a 5.1 channel surround signal including L, R, C, SL, SR, and LFE channels, and an output acoustic signal is a 22.2 channel signal. FIG. 4 shows a configuration example of an upmix device according to the second embodiment of the present invention. In the example illustrated in FIG. 4, the
原信号である5.1chサラウンド信号xL(t),xR(t),xC(t),xSL(t),xSR(t),xLFE(t)は、それぞれの直接音dL(t),dR(t),dC(t),dSL(t),dSR(t),dLFE(t)と、間接音rL(t),rR(t),rC(t),rSL(t),rSR(t),rLFE(t)を用いて、式(7)のように表される。 The original 5.1-channel surround signals x L (t), x R (t), x C (t), x SL (t), x SR (t), and x LFE (t) d L (t), d R (t), d C (t), d SL (t), d SR (t), d LFE (t) and indirect sounds r L (t), r R (t) , R C (t), r SL (t), r SR (t), r LFE (t) are expressed as in Expression (7).
残響分離器21は、原信号をそれぞれ直接音dL(t),dR(t),dC(t),dSL(t),dSR(t),dLFE(t)、及び間接音rL(t),rR(t),rC(t),rSL(t),rSR(t),rLFE(t)に分離して、インパルス応答推定部22、及び混合器25に出力する。
The
インパルス応答推定部22は、残響分離器21により分離された直接音と間接音とから、あるいは原信号と直接音とから、原音場のインパルス応答hL(t),hR(t),hC(t),hSL(t),hSR(t),hLFE(t)を推定し、インパルス応答生成部23に出力する。
The impulse
原信号の間接音rL(t),rR(t),rC(t),rSL(t),rSR(t),rLFE(t)は、原音場のインパルス応答hL(t),hR(t),hC(t),hSL(t),hSR(t),hLFE(t)を用いて、式(8)で表される。 The indirect sound r L (t), r R (t), r C (t), r SL (t), r SR (t), r LFE (t) of the original signal is the impulse response h L ( t), h R (t), h C (t), h SL (t), h SR (t), and h LFE (t) are expressed by Expression (8).
ここで、*は畳み込み演算を示す。式(8)の周波数領域表現を用いて、原音場の伝達関数HL(ω),HR(ω),HC(ω),HSL(ω),HSR(ω),HLFE(ω)は、式(9)で表される。 Here, * indicates a convolution operation. Using the frequency domain representation of Equation (8), the transfer function H L (ω), H R (ω), H C (ω), H SL (ω), H SR (ω), H LFE ( ω) is expressed by equation (9).
第1の実施形態と同様、インパルス応答推定部22は、式(9)の伝達関数に基づき、クロススペクトル法や適応フィルタ法など既知の手法を適用することにより、インパルス応答hL(t),hR(t),hC(t),hSL(t),hSR(t),hLFE(t)を推定する。
Similar to the first embodiment, the impulse
インパルス応答生成部23は、インパルス応答推定部22により推定されたインパルス応答との相関係数の絶対値の最大値が1よりも小さいインパルス応答である類似インパルス応答hLk(t),hRl(t),hCm(t),hSLn(t),hSRp(t),hLFEq(t)を複数生成し、間接音生成部24に出力する。例えば、元になるインパルス応答hL(t),hR(t),hC(t),hSL(t),hSR(t),hLFE(t)を所定の時間で分割し、乱数を用いて並べ直すことにより、類似インパルス応答hLk(t),hRl(t),hCm(t),hSLn(t),hSRp(t),hLFEq(t)を生成する。
The impulse
間接音生成部24は、式(10)に示すように、直接音dL(t),dR(t),dC(t),dSL(t),dSR(t),dLFE(t)、及び類似インパルス応答hLk(t),hRl(t),hCm(t),hSLn(t),hSRp(t),hLFEq(t)の畳み込み演算により、間接音と類似した音色を持つ間接音である類似間接音rLk(t),rRl(t),rCm(t),rSLn(t),rSRp(t),rLFEq(t)を複数生成し、混合器25に出力する。間接音と類似した類似間接音を用いることにより、聴感上3次元的な広がり感を得ることができる。
As shown in Expression (10), the indirect
混合器25は、直接音dL(t),dR(t),dC(t),dSL(t),dSR(t),dLFE(t)、間接音rL(t),rR(t),rC(t),rSL(t),rSR(t),rLFE(t)、及び類似間接音rLk(t),rRl(t),rCm(t),rSLn(t),rSRp(t),rLFEq(t)を混合し(すなわち、直接音、間接音、及び類似間接音を用いた線形演算を行い)、各チャンネルへの信号を生成する。ここで、線形演算は直接音、間接音、類似間接音のうち、少なくとも一つを用いていればよい。また、混合器25は、各チャンネルへの信号に含まれる間接音に係数ar1,ar2,…,ar24を乗算することにより、各チャンネルに間接音を付加する度合いを調節する。アップミックス装置2が乗算器26を備えない場合には、混合器25の出力する信号が出力音響信号となる。
The
乗算器26は、混合器25から出力される信号に係数a1,a2,…,a24を乗算することにより、チャンネル毎に音量レベルを調節して、22.2chのスピーカにそれぞれ出力音響信号を出力する。22.2chのスピーカが図2に示す位置に配置される場合、乗算器26が出力する出力信号y1(t),y2(t),…,y24(t)は、例えば式(11)のように表される。
The
式(10)の例では、原信号の間接音のもつ方向特性の再現性と22.2ch音響のチャンネル配置に鑑み、原音場の左側のインパルス応答hL(t)から生成した間接音及び類似間接音は、アップミックスで生成される22.2ch信号の左側チャンネルに利用し、原音場の右側のインパルス応答hR(t)から生成した間接音及び類似間接音は22.2ch信号の右側チャンネルに利用している。同様に、hC(t)から生成した間接音及び類似間接音は左右中央のチャンネルに割り当て、hSL(t),hSR(t)から生成した間接音及び類似間接音はそれぞれ後方の左右に割り当て、hLFE(t)から生成した間接音及び類似間接音はLFEチャンネルに割り当てている。なお、間接音及び類似間接音それぞれの相関は低く、音の定位にも大きく影響しないため、他の割り当て方法も考えられる。 In the example of Expression (10), in consideration of the reproducibility of the directional characteristics of the indirect sound of the original signal and the channel arrangement of the 22.2 ch sound, the indirect sound generated from the impulse response h L (t) on the left side of the original sound field and similar The indirect sound is used for the left channel of the 22.2 ch signal generated by the upmix, and the indirect sound and the similar indirect sound generated from the impulse response h R (t) on the right side of the original sound field are the right channel of the 22.2 ch signal. It is used for. Similarly, the indirect sound and similar indirect sound generated from h C (t) are assigned to the left and right center channels, and the indirect sound and similar indirect sound generated from h SL (t) and h SR (t) are respectively rear left and right. And the indirect sound and similar indirect sound generated from h LFE (t) are assigned to the LFE channel. Since the correlation between the indirect sound and the similar indirect sound is low and does not greatly affect the localization of the sound, other allocation methods can be considered.
以上、アップミックス装置1,2について説明したが、このアップミックス装置1,2として機能させるためにコンピュータを好適に用いることができ、そのようなコンピュータは、アップミックス装置1,2の各機能を実現する処理内容を記述したプログラムを該コンピュータの記憶部に格納しておき、該コンピュータのCPUによってこのプログラムを読み出して実行させることで実現することができる。なお、このプログラムは、コンピュータ読取り可能な記録媒体に記録可能である。
In the above, the
上述したアップミックス装置1,2、又はアップミックス装置1,2として機能させるコンピュータによれば、原音場のインパルス応答に類似する類似インパルス応答から複数の類似間接音を生成するため、アップミックス用の付帯情報を持たない入力音響信号から、ミキシング作業を行うことなく、入力音響信号よりもチャンネル数の多いアップミックスされた出力音響信号を得ることができる。
また、類似インパルス応答はインパルス応答との相関関数の絶対値の最大値が1よりも小さいため、得られた出力音響信号をダウンミックスしても、音質劣化の少ないブラインドアップミックスを実現することができる。
According to the above-described
Further, since the maximum value of the absolute value of the correlation function with the impulse response of the similar impulse response is smaller than 1, it is possible to realize a blind upmix with little deterioration in sound quality even if the obtained output acoustic signal is downmixed. it can.
上述の実施形態は代表的な例として説明したが、本発明の趣旨及び範囲内で、多くの変更及び置換ができることは当業者に明らかである。したがって、本発明は、上述の実施形態によって制限するものと解するべきではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。例えば、実施形態の構成図に記載の複数の構成ブロックを1つに組み合わせたり、あるいは1つの構成ブロックを分割したりすることが可能である。 Although the above embodiment has been described as a representative example, it will be apparent to those skilled in the art that many changes and substitutions can be made within the spirit and scope of the invention. Therefore, the present invention should not be construed as being limited by the above-described embodiments, and various modifications and changes can be made without departing from the scope of the claims. For example, it is possible to combine a plurality of constituent blocks described in the configuration diagram of the embodiment into one, or to divide one constituent block.
また、上述の実施形態では、22.2chへアップミックミックスする例を示したが、本発明によれば、同様な方法で7.1chなど、入力音響信号よりもチャンネル数の多い他のマルチチャンネルフォーマットへアップミックスすることができる。 Further, in the above-described embodiment, an example in which upmix mixing is performed to 22.2 ch has been described. However, according to the present invention, other multi-channels having a larger number of channels than the input acoustic signal, such as 7.1 ch, by the same method. Can be upmixed to format.
1,2 アップミックス装置
11,21 残響分離器
12,22 インパルス応答推定部
13,23 インパルス応答生成部
14,24 間接音生成部
15,25 混合器
16,26 乗算器
17 ローパスフィルタ
131 信号分離部
132 乗算部
133 乱数発生部
134 時間シフト部
135 信号加算部
136 スイッチ
137 スイッチ
1, 2
Claims (4)
入力音響信号を直接音及び間接音に分離する残響分離器と、
入力音響信号を収録した原音場のインパルス応答を推定するインパルス応答推定部と、
前記インパルス応答との相関関数の絶対値の最大値が1よりも小さい複数の類似インパルス応答を生成するインパルス応答生成部と、
前記直接音及び前記複数の類似インパルス応答の畳み込み演算により複数の類似間接音を生成する間接音生成部と、
前記直接音、前記間接音、及び前記類似間接音を用いた線形演算を行い、前記出力音響信号を生成する混合器と、
を備えることを特徴とするアップミックス装置。 An upmix device that generates an output acoustic signal having a larger number of channels than an input acoustic signal,
A reverberation separator that separates input sound signals into direct and indirect sounds;
An impulse response estimator for estimating the impulse response of the original sound field containing the input acoustic signal;
An impulse response generator that generates a plurality of similar impulse responses having a maximum absolute value of a correlation function with the impulse response smaller than 1.
An indirect sound generation unit that generates a plurality of similar indirect sounds by convolution of the direct sound and the plurality of similar impulse responses;
A mixer that performs a linear operation using the direct sound, the indirect sound, and the similar indirect sound, and generates the output acoustic signal;
An upmix device comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048051A JP6630599B2 (en) | 2016-03-11 | 2016-03-11 | Upmix device and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016048051A JP6630599B2 (en) | 2016-03-11 | 2016-03-11 | Upmix device and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017163458A true JP2017163458A (en) | 2017-09-14 |
JP6630599B2 JP6630599B2 (en) | 2020-01-15 |
Family
ID=59858173
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016048051A Active JP6630599B2 (en) | 2016-03-11 | 2016-03-11 | Upmix device and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6630599B2 (en) |
-
2016
- 2016-03-11 JP JP2016048051A patent/JP6630599B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP6630599B2 (en) | 2020-01-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101341523B1 (en) | Method to generate multi-channel audio signals from stereo signals | |
CN108307272B (en) | Audio signal processing method and apparatus | |
JP5379838B2 (en) | Apparatus for determining spatial output multi-channel audio signals | |
RU2376654C2 (en) | Parametric composite coding audio sources | |
EP1774515B1 (en) | Apparatus and method for generating a multi-channel output signal | |
JP5284638B2 (en) | Method, device, encoder device, decoder device, and audio system | |
JP6377249B2 (en) | Apparatus and method for enhancing an audio signal and sound enhancement system | |
JP5417227B2 (en) | Multi-channel acoustic signal downmix device and program | |
JP6284480B2 (en) | Audio signal reproducing apparatus, method, program, and recording medium | |
US9913036B2 (en) | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels | |
JP2018201224A (en) | Audio signal rendering method and apparatus | |
KR20100084319A (en) | Method and apparatus for adaptive remastering of rear audio channel | |
JP5372142B2 (en) | Surround signal generating apparatus, surround signal generating method, and surround signal generating program | |
JP6212348B2 (en) | Upmix device, sound reproduction device, sound amplification device, and program | |
JP6630599B2 (en) | Upmix device and program | |
US11470438B2 (en) | Audio signal processor, system and methods distributing an ambient signal to a plurality of ambient signal channels | |
WO2013176073A1 (en) | Audio signal conversion device, method, program, and recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190128 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191025 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20191112 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20191209 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6630599 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |