JP2017212552A - Channel number converter and program thereof - Google Patents
Channel number converter and program thereof Download PDFInfo
- Publication number
- JP2017212552A JP2017212552A JP2016103664A JP2016103664A JP2017212552A JP 2017212552 A JP2017212552 A JP 2017212552A JP 2016103664 A JP2016103664 A JP 2016103664A JP 2016103664 A JP2016103664 A JP 2016103664A JP 2017212552 A JP2017212552 A JP 2017212552A
- Authority
- JP
- Japan
- Prior art keywords
- channel
- signal
- unit
- weighting
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012937 correction Methods 0.000 claims abstract description 207
- 230000005236 sound signal Effects 0.000 claims abstract description 198
- 238000006243 chemical reaction Methods 0.000 claims abstract description 89
- 238000004364 calculation method Methods 0.000 claims abstract description 77
- 238000000034 method Methods 0.000 claims abstract description 46
- 230000005484 gravity Effects 0.000 claims description 2
- 238000004458 analytical method Methods 0.000 description 29
- 238000010586 diagram Methods 0.000 description 14
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 238000000611 regression analysis Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000005314 correlation function Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000000491 multivariate analysis Methods 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 1
- 101100018996 Caenorhabditis elegans lfe-2 gene Proteins 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000010219 correlation analysis Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Abstract
Description
本発明は、マルチチャンネル音声信号のチャンネル数を変換するチャンネル数変換装置およびそのプログラムに関する。 The present invention relates to a channel number conversion device that converts the number of channels of a multi-channel audio signal and a program thereof.
現在、22.2chなどのマルチチャンネル音声放送(非特許文献1)の実用化が進められている。マルチチャンネル音声放送により、高い臨場感を持った音声の再生を実現することができる。しかし、一般的な家庭の場合、例えば、2chステレオ等、22.2chより少ないチャンネル数のみを再生可能な環境である場合が多いと想定される。このため、マルチチャンネル音声放送を家庭で再生するには、家庭で再生できるチャンネル数に合わせて、音声信号のチャンネル数を変換する必要がある。このような場合、一般的にダウンミックスやレンダリング等を行って再生環境に応じたチャンネル数に変換する技術が知られている(非特許文献1、2)。 Currently, the practical use of multi-channel audio broadcasting (Non-Patent Document 1) such as 22.2ch is being promoted. With multi-channel audio broadcasting, it is possible to realize audio reproduction with high presence. However, in the case of a general home, for example, it is assumed that there are many cases where it is possible to reproduce only the number of channels smaller than 22.2 ch, such as 2 ch stereo. For this reason, in order to reproduce multi-channel audio broadcasting at home, it is necessary to convert the number of channels of audio signals in accordance with the number of channels that can be reproduced at home. In such a case, a technique is generally known in which downmixing or rendering is performed to convert the number of channels according to the reproduction environment (Non-Patent Documents 1 and 2).
しかし、番組の内容に関わらず一意にチャンネル数を変換する一般的なチャンネル数変換方法では、チャンネル数変換後の音声信号が番組制作者の意図に沿ったものとならない可能性がある。これに対し、マルチチャンネル音声放送を実施する場合には、番組制作者が2chステレオ用の番組を別に制作して、マルチチャンネルと2chステレオを同時に放送するいわゆるサイマル放送の実施が検討されている。 However, in a general channel number conversion method in which the number of channels is uniquely converted regardless of the contents of the program, there is a possibility that the audio signal after the channel number conversion does not conform to the intention of the program producer. On the other hand, when multi-channel audio broadcasting is performed, implementation of so-called simulcast where a program producer separately produces a program for 2ch stereo and simultaneously broadcasts multi-channel and 2ch stereo is being studied.
ところで、家庭環境によってスピーカ数やその配置は様々であり、各家庭での再生環境に応じたチャンネル数での放送を聴取したいというニーズがある。しかし、あらゆるチャンネル数、スピーカ配置に対応するサイマル放送を実施することは不可能である。また、各家庭での再生環境(スピーカ数、スピーカ配置)に応じた一律なチャンネル数変換方法によってチャンネル数を変換した場合、番組ごとに、番組制作者の意図通りに変換を行うことは難しい。その為、サイマル放送が実施されたとしても、各家庭では、番組ごとに適切にチャンネル数変換された音声再生ができない可能性が高い。 By the way, the number of speakers and their arrangement vary depending on the home environment, and there is a need to listen to broadcasting on the number of channels corresponding to the playback environment in each home. However, it is impossible to carry out simultaneous broadcasting corresponding to any number of channels and speaker arrangements. Further, when the number of channels is converted by a uniform channel number conversion method corresponding to the reproduction environment (number of speakers, speaker arrangement) in each home, it is difficult to convert for each program as intended by the program producer. For this reason, even if simulcasting is carried out, there is a high possibility that each home will not be able to reproduce the sound with the appropriate number of channels converted for each program.
そこでこの発明は、上述の課題を解決することのできるチャンネル数変換装置およびそのプログラムを提供することを目的としている。 SUMMARY OF THE INVENTION Accordingly, an object of the present invention is to provide a channel number conversion device and a program thereof that can solve the above-described problems.
本発明の一態様によれば、チャンネル数変換装置は、マルチチャンネル音声信号と前記マルチチャンネル音声信号に対応する参照信号とを入力し、前記参照信号の各チャンネルに含まれる前記マルチチャンネル音声信号の各チャンネル信号に対応する重み付け係数をそれぞれ計算する重み付け係数計算部と、前記重み付け係数に基づいて前記マルチチャンネル音声信号の各チャンネル信号に乗じる補正係数を計算する補正係数計算部と、前記補正係数を前記マルチチャンネル音声信号に適用する補正係数適用部と、前記補正係数を適用したマルチチャンネル音声信号を、所定のチャンネル数変換方法によって、所望のチャンネル数の再生チャンネル信号に変換するチャンネル数変換部と、を備える。 According to an aspect of the present invention, the channel number conversion device receives a multi-channel audio signal and a reference signal corresponding to the multi-channel audio signal, and the multi-channel audio signal included in each channel of the reference signal. A weighting coefficient calculator for calculating a weighting coefficient corresponding to each channel signal, a correction coefficient calculator for calculating a correction coefficient to be multiplied to each channel signal of the multi-channel audio signal based on the weighting coefficient, and the correction coefficient A correction coefficient applying unit to be applied to the multi-channel audio signal; a channel number converting unit for converting the multi-channel audio signal to which the correction coefficient is applied into a reproduction channel signal having a desired number of channels by a predetermined channel number conversion method; .
本発明の一態様によれば、前記重み付け係数計算部は、前記参照信号と前記マルチチャンネル音声信号の各チャンネル信号との間の遅延を補正する遅延補正部、を備えてもよい。 According to an aspect of the present invention, the weighting coefficient calculation unit may include a delay correction unit that corrects a delay between the reference signal and each channel signal of the multi-channel audio signal.
本発明の一態様によれば、前記重み付け係数計算部は、前記マルチチャンネル音声信号と前記参照信号とを入力し、前記マルチチャンネル音声信号の各チャンネル信号に対する重み付け比を分析する重み付け比分析部、を備えてもよい。 According to an aspect of the present invention, the weighting coefficient calculator receives the multichannel audio signal and the reference signal, and analyzes a weighting ratio for each channel signal of the multichannel audio signal; May be provided.
本発明の一態様によれば、前記重み付け係数計算部は、前記参照信号の各チャンネル信号のエネルギーと、前記参照信号の各チャンネルに対応した前記マルチチャンネル音声信号の各チャンネル信号に前記重み付け比を乗じた信号のエネルギーの和とが等しくなるように前記重み付け比を補正する重み付け比補正部、を備えてもよい。 According to an aspect of the present invention, the weighting coefficient calculator calculates the weighting ratio for the energy of each channel signal of the reference signal and each channel signal of the multichannel audio signal corresponding to each channel of the reference signal. You may provide the weighting ratio correction | amendment part which correct | amends the said weighting ratio so that the sum of the energy of the multiplied signal may become equal.
本発明の一態様によれば、前記重み付け係数計算部は、マルチチャンネル音声信号の各チャンネル信号を、各チャンネル信号の類似度に基づいてグルーピングし、そのグループに所属する前記チャンネル信号に基づいて当該グループを代表するグループ信号を生成するグルーピング部、をさらに備え、前記重み付け係数計算部は、前記グループ信号についての重み付け係数を計算してもよい。 According to an aspect of the present invention, the weighting coefficient calculation unit groups each channel signal of the multi-channel audio signal based on the similarity of each channel signal, and based on the channel signal belonging to the group A grouping unit that generates a group signal representing a group may be further included, and the weighting coefficient calculation unit may calculate a weighting coefficient for the group signal.
本発明の一態様によれば、前記グルーピング部は、前記グループに所属する前記チャンネル信号に基づいて、前記チャンネル信号の平均、前記チャンネル信号の類似度の重心にあるチャンネル信号、前記チャンネル信号のうち最大のエネルギーを有するチャンネル信号の何れかを、前記グループ信号として生成してもよい。 According to an aspect of the present invention, the grouping unit includes, based on the channel signals belonging to the group, an average of the channel signals, a channel signal at the centroid of the similarity of the channel signals, and the channel signals Any one of the channel signals having the maximum energy may be generated as the group signal.
本発明の一態様によれば、前記重み付け係数計算部は、前記マルチチャンネル音声信号の各チャンネル信号の中から、前記参照信号との間の相互相関係数に基づいて1つまたは複数のチャンネル信号を選択する基準チャンネル信号選択部、をさらに備え、前記重み付け係数計算部は、前記選択されたチャンネル信号の重み付け係数が、それ以外のチャンネル信号の重み付け係数よりも大きくなることを拘束条件として、重み付け係数を計算してもよい。 According to an aspect of the present invention, the weighting coefficient calculation unit includes one or more channel signals based on a cross-correlation coefficient between the channel signals of the multi-channel audio signal and the reference signal. A reference channel signal selection unit that selects the weighting factor, and the weighting factor calculation unit performs weighting with a constraint that the weighting factor of the selected channel signal is larger than the weighting factors of the other channel signals. A coefficient may be calculated.
本発明の一態様によれば、前記重み付け係数計算部は、前記マルチチャンネル音声信号の各チャンネル信号の中から、前記参照信号との間の相互相関係数に基づいて1つまたは複数のチャンネル信号を選択する基準チャンネル信号選択部、をさらに備え、前記重み付け係数計算部は、前記基準チャンネル信号選択部が選択したチャンネル信号についてのみ重み付け係数を計算してもよい。 According to an aspect of the present invention, the weighting coefficient calculation unit includes one or more channel signals based on a cross-correlation coefficient between the channel signals of the multi-channel audio signal and the reference signal. A reference channel signal selection unit that selects the reference channel signal, and the weighting coefficient calculation unit may calculate the weighting coefficient only for the channel signal selected by the reference channel signal selection unit.
本発明の一態様によれば、前記補正係数計算部は、前記参照信号の全エネルギーまたは前記参照信号の各チャンネルに対応する前記マルチチャンネル音声信号の各チャンネル信号に前記重み付け係数を適用した信号のエネルギーの和と、前記マルチチャンネル音声信号の各チャンネル信号に前記補正係数を適用した信号のエネルギーの和とが等しくなるように前記補正係数を計算してもよい。 According to an aspect of the present invention, the correction coefficient calculation unit is configured to calculate a signal obtained by applying the weighting coefficient to each channel signal of the multi-channel audio signal corresponding to the total energy of the reference signal or each channel of the reference signal. The correction coefficient may be calculated so that the sum of energy is equal to the sum of energy of signals obtained by applying the correction coefficient to each channel signal of the multi-channel audio signal.
本発明の一態様によれば、前記補正係数適用部は、前記マルチチャンネル音声信号のチャンネル数に対応する補正係数の所定の初期値と、前記補正係数計算部が計算した補正係数であって前記参照信号のチャンネル数に対応する補正係数と、に基づいて、補間法により、前記再生チャンネル信号のチャンネル数に応じて前記補正係数計算部が計算した補正係数を修正してもよい。 According to an aspect of the present invention, the correction coefficient application unit includes a predetermined initial value of a correction coefficient corresponding to the number of channels of the multi-channel audio signal, and a correction coefficient calculated by the correction coefficient calculation unit, Based on the correction coefficient corresponding to the number of channels of the reference signal, the correction coefficient calculated by the correction coefficient calculation unit according to the number of channels of the reproduction channel signal may be corrected by an interpolation method.
本発明の一態様によれば、前記チャンネル数変換装置は、前記参照信号を、所定のチャンネル数変換方法によってモノ信号に変換するモノ信号変換部、をさらに備えてもよい。 According to an aspect of the present invention, the channel number conversion device may further include a mono signal conversion unit that converts the reference signal into a mono signal by a predetermined channel number conversion method.
本発明の一態様によれば、コンピュータを、上記の何れか1つに記載のチャンネル数変換装置、として機能させるためのプログラムである。 According to one aspect of the present invention, there is provided a program for causing a computer to function as the channel number conversion device described in any one of the above.
本発明のチャンネル数変換装置によれば、マルチチャンネル音声信号とそれより少ないチャンネル数の音声信号が同時に提供された場合に、任意のチャンネル数に制作意図に沿ったチャンネル数の変換を実現することができる。 According to the channel number conversion apparatus of the present invention, when a multi-channel audio signal and an audio signal having a smaller number of channels are simultaneously provided, conversion of the number of channels according to the production intention can be realized for an arbitrary number of channels. Can do.
<第一実施形態>
以下、本発明の第一実施形態によるチャンネル数変換装置を図1〜図3を参照して説明する。
図1は、本発明に係る第一実施形態におけるチャンネル数変換装置の一例を示すブロック図である。図1に示すようにチャンネル数変換装置10は、参照信号入力部11、マルチチャンネル音声信号入力部12、重み付け係数計算部13、補正係数計算部14、補正係数適用部15、再生チャンネル情報取得部16、チャンネル数変換部17、記憶部18と、を含む。
図1は、チャンネル数変換装置10に22.2chのマルチチャンネル音声信号と2chの参照信号を入力し、チャンネル数変換後の5.1chの再生チャンネル音声信号を出力する様子を示している。
チャンネル数変換装置10は、所定のマルチチャンネル音声信号(nチャンネル)を、そのマルチチャンネル音声信号のチャンネル数よりも少ないチャンネル数の音声信号(lチャンネル)(以下、参照信号と呼ぶ)を参照して、所望のチャンネル数の再生音声信号(mチャンネル)に変換する装置である。以下、所定のマルチチャンネル音声信号として8K SHV用の22.2ch音響システム、参照信号として2chステレオ、再生音声信号を5.1chの場合を例に説明を行う。しかし、マルチチャンネル音声信号、参照信号、再生音声信号の各チャンネル数は、この例のチャンネル数に限らない。また、チャンネル数変換装置10は、コンピュータによって構成されており、例えば、テレビなどの放送受信機やホームシアターなどのメディアの再生装置に組み込まれていてもよい。
<First embodiment>
Hereinafter, a channel number conversion apparatus according to a first embodiment of the present invention will be described with reference to FIGS.
FIG. 1 is a block diagram showing an example of a channel number conversion apparatus according to the first embodiment of the present invention. As shown in FIG. 1, the channel
FIG. 1 shows a state where a 22.2 ch multi-channel audio signal and a 2 ch reference signal are input to the
The
以下に、チャンネル数変換装置10について、詳細に説明する。
参照信号入力部11は、参照信号を入力する。例えば、参照信号入力部11は、サイマル放送で放送された22.2chのマルチチャンネル音声信号と2chステレオの音声信号のうち2chステレオの音声信号を入力する。
マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を入力する。例えば、サイマル放送で放送された22.2chの音声信号を入力する。
サイマル放送で放送される各チャンネル数に対応する音声信号は、それぞれ専用の技術者が作成してもよい。例えば、22.2chの音声信号については、22.2chの専用の技術者が、22.2chに対応するスピーカ配置等の再生環境によって、放送内容に適した(番組作成者の意図が反映された)3次元の音が再現されるように各チャンネルの音声信号を作成する。一方、2chの音声信号については、2chの専用の技術者が、2chの再生環境によって放送内容に適した音声が再現されるように2つのチャンネルそれぞれの音声信号を作成する。このとき作成される22.2chと2chの各音声信号は、番組によって表現したい内容に適するように作成される。例えばナレーションが支配的なドキュメンタリー番組と音楽番組とでは、同じ2chであっても、各チャンネルに対して作成される音声信号の性質が異なる。従って、22.2chの音声信号と2chの音声信号との関係は、22.2chの音声信号から2chの音声信号へ、所定の(一種類の)ダウンミックス係数によって変換できる関係であるとは限らない。
Hereinafter, the channel
The reference
The multichannel audio
A dedicated engineer may create audio signals corresponding to the number of channels broadcast by simulcast. For example, for 22.2ch audio signals, a 22.2ch dedicated engineer is suitable for the broadcast content depending on the playback environment such as the speaker layout corresponding to 22.2ch (the intention of the program creator was reflected). ) Create an audio signal for each channel so that a three-dimensional sound is reproduced. On the other hand, for 2ch audio signals, a 2ch dedicated engineer creates audio signals for each of the two channels so that audio suitable for the broadcast content is reproduced in a 2ch playback environment. Each of the 22.2ch and 2ch audio signals created at this time is created so as to suit the contents to be expressed by the program. For example, a documentary program in which narration is dominant and a music program have different characteristics of an audio signal created for each channel even if they are the same 2ch. Therefore, the relationship between the 22.2ch audio signal and the 2ch audio signal is not always a relationship that can be converted from the 22.2ch audio signal to the 2ch audio signal by a predetermined (one type) downmix coefficient. Absent.
重み付け係数計算部13は、参照信号の個々のチャンネルの信号に含まれるマルチチャンネル音声信号の各チャンネル信号の重み付け係数を計算する。例えば、参照信号を(L、R)、マルチチャンネル音声信号を(FC、FLc、FRc、FL、FR、SiL、SiR、BL、BR、BC、LFE1、LFE2、TpFC、TpFL、TpFR、TpSiL、TpSiR、TpC、TpBL、TpBR、TpBC、BtFC、BtFL、BtFR)とすると、重み付け係数計算部13は、Lを(a1,1×FC、a2,1×FLc、・・・・、a24,1×BtFR)、Rを(a1,2×FC、a2,2×FLc、・・・・、a24,2×BtFR)と表した場合、各係数(a1,1〜a1,24、a2,1〜a2,24)の値を計算する。後述する重み付け係数計算部13a、13bに示す構成についても同様である。
The
補正係数計算部14は、重み付け係数計算部13が計算した重み付け係数を用いて、マルチチャンネル音声信号の各チャンネル信号に乗じる補正係数を計算する。より具体的には、補正係数計算部14は、参照信号とマルチチャンネル音声信号の各チャンネル信号に重み付け係数を適用して生成した信号のエネルギーまたはラウドネスを指標として、マルチチャンネル音声信号の各チャンネル信号に適用する補正係数を計算する。
または、補正係数計算部14は、参照信号の各チャンネル信号に対するマルチチャンネル音声信号の各チャンネル信号の重み付け係数の二乗和に基づいて、マルチチャンネル音声信号の各チャンネル信号に適用する補正係数を計算する。
The correction
Alternatively, the correction
補正係数適用部15は、補正係数計算部14が上記したいずれかの方法で計算した補正係数をマルチチャンネル音声信号に適用する。このとき、補正係数適用部15は、再生する音声信号のチャンネル数に応じて補正係数を修正し、修正後の補正係数をマルチチャンネル音声信号に適用する。
再生チャンネル情報取得部16は、再生チャンネル音声信号の情報として、例えば、再生チャンネル音声信号のチャンネル数(再生チャンネル数)の情報を取得する。
The correction
The playback channel
チャンネル数変換部17は、補正係数適用部15が補正係数を適用した後のマルチチャンネル音声信号を入力し、例えば、後述するチャンネル数変換処理により、再生チャンネル数に合わせて、マルチチャンネル音声信号をチャンネル数変換する。
記憶部18は、チャンネル数変換処理に必要な種々のデータを記憶する。
The channel
The
次に図2を用いて重み付け係数計算部13について詳しく説明する。
図2は、本発明に係る第一実施形態における重み付け係数計算部の一例を示すブロック図である。
図2に示すように重み付け係数計算部13は、遅延補正部131と、重み付け比分析部132と、重み付け比補正部133と、を含む。
遅延補正部131は、参照信号の各チャンネル信号に対する、マルチチャンネル音声信号の各チャンネル信号の遅延を補正する。2つの信号の時間的なずれは、進んだり遅れたり様々な場合が考えられるが、これらをまとめて遅延と記載する。遅延補正部131は、参照信号の各チャンネルに含まれているマルチチャンネル音声信号の各チャンネル信号に対応する信号の、マルチチャンネル音声信号を構成する当該チャンネル信号に対する遅延を、例えば、相互相関関数によって計算する。この理由は、参照信号においては、例えば、マルチチャンネル音声信号で表現される3次元的な音を表現するために、マルチチャンネル音声信号に含まれるあるチャンネル信号に係る音について時間軸方向にずらして構成する場合(例えば、マルチチャンネル音声信号において後方から出力される音と前方から出力される音とが重ならないように、参照信号においては後方からの音を少し遅延させるなど)があるためである。遅延補正部131は、マルチチャンネル音声信号の各チャンネル信号の遅延を計算した遅延量分だけ補正し、参照信号の各チャンネル信号に含まれるマルチチャンネル音声信号に対応する信号の位相と、マルチチャンネル音声信号の当該チャンネル信号の位相とを揃える。
Next, the
FIG. 2 is a block diagram showing an example of the weighting coefficient calculator in the first embodiment according to the present invention.
As shown in FIG. 2, the weighting
The
重み付け比分析部132は、マルチチャンネル音声信号の各チャンネル信号に対する重み付け比を、重回帰分析、正準相関分析などのいずれかの多変量解析の方法を用いて分析する。または、重み付け比分析部132は、遺伝的アルゴリズム、深層学習等の機械学習によって重み付け比を分析してもよい。
重み付け比補正部133は、重み付け比分析部132が分析した重み付け比を、参照信号を構成する各チャンネル信号のエネルギーに基づいて補正し、補正後の値を重み付け係数として出力する。具体的には、重み付け比補正部133は、参照信号の各チャンネル信号のエネルギーと、重み付け比分析部132が分析した重み付け比をマルチチャンネル音声信号の各チャンネルに乗じ、乗じて得た擬似参照信号の各チャンネル信号のエネルギーとが等しくなるように前記重み付け比を補正する。
The weighting
The weighting
次に図3を用いて、チャンネル数変換処理の詳細について説明を行う。
図3は、本発明に係る第一実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
前提として、ある番組について、チャンネル数に応じて作成されたマルチチャンネル音声信号および参照信号が同時に放送されており、チャンネル数変換装置10は両方の信号を入力する。
まず、ステップS11で、マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を入力する。マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を重み付け係数計算部13に出力する。また、ステップS11と並行して、ステップS12で、参照信号入力部11は、参照信号を入力する。参照信号入力部11は、入力したされた2chステレオの参照信号を、LRそれぞれのチャンネル信号に分離する(pj、1≦j≦2、l=2)。ここで、pjは分離後の参照信号の各チャンネル信号である。参照信号入力部11は、参照信号の各チャンネル信号を重み付け係数計算部13に出力する。
Next, details of the channel number conversion process will be described with reference to FIG.
FIG. 3 is a flowchart showing an example of the channel number conversion process in the first embodiment according to the present invention.
As a premise, for a certain program, a multi-channel audio signal and a reference signal created according to the number of channels are broadcast simultaneously, and the channel
First, in step S11, the multichannel audio
次に、ステップS13で、重み付け係数計算部13では、遅延補正部131が、参照信号とマルチチャンネル音声信号とを入力して、マルチチャンネル音声信号の遅延を補正する。例えば、遅延補正部131は、例えば、相互相関関数を計算することにより参照信号のチャンネル信号ごとにマルチチャンネル音声信号の各チャンネル信号に対応する遅延を計算し、マルチチャンネル音声信号の各チャンネルを補正する。遅延補正部131は、遅延補正後のマルチチャンネル音声信号を重み付け比分析部132に出力する。遅延の補正を行うのは、重み付け比をより正確に計算するためである。
Next, in step S13, in the weighting
次に、ステップS14で、重み付け比分析部132は、遅延補正後のマルチチャンネル音声信号と参照信号とを入力し、参照信号の各チャンネル信号に対するマルチチャンネル音声信号の各チャンネル信号の重み付け比を、重回帰分析等を用いて計算する。具体的には、重み付け比分析部132は、2ch(参照信号)の各チャンネル信号を適切に構成するための、22.2ch(マルチチャンネル音声信号)の音声信号(qi、1≦i≦24、n=24)のチャンネル間の重み付け比(aij、1≦i≦24、1≦j≦2)を計算する。ここで、擬似参照信号のチャンネル信号p^jは、以下の式(1)で表すことができる。
Next, in step S14, the weighting
式(1)より、重み付け比「aij」は、2chの各チャンネル信号に含まれる22.2ch音声信号の各チャンネルのレベル比に対応する。重み付け比分析部132は、計算した重み付け比を重み付け比補正部133に出力する。
From equation (1), the weighting ratio “a ij ” corresponds to the level ratio of each channel of the 22.2 ch audio signal included in each channel signal of 2 ch. The weighting
次に、ステップS15で、重み付け比補正部133は、重み付け比分析部132が分析した重み付け比と参照信号とを入力し、重み付け比を、エネルギーに基づいて補正する。例えば、2chの参照信号のLchのエネルギー(ELch)は、以下の式(2)で表すことができる。
Next, in step S15, the weighting
また、重み付け比を用いて表した擬似参照信号のLchエネルギーは、以下の式(3)で表すことができる。 Further, the Lch energy of the pseudo reference signal expressed using the weighting ratio can be expressed by the following equation (3).
重み付け比補正部133は、式(4)によって、参照信号のLchのエネルギーと擬似参照信号のLchのエネルギーが等しくなるような定数c1を計算する。
The weighting
次に、重み付け比補正部133は、重み付け比aij(1≦i≦24、1≦j≦2)のそれぞれに定数cjの平方根を乗じて重み付け比を補正する。補正後の重み付け比が重み付け係数である。ステップS16で、重み付け係数計算部13は、重み付け比補正部133が補正して得られた重み付け係数を補正係数計算部14へ出力する。
Next, the weighting
なお、重み付け比補正部133は、補正の基準となる指標としてエネルギー以外にもラウドネスや振幅などを用いてもよい。例えば、重み付け比補正部133は、参照信号の各チャンネル信号のラウドネスの和と擬似参照信号の各チャンネル信号のラウドネスの和が等しくなるような定数cjを算出してもよい。
Note that the weighting
次に、ステップS17で、補正係数計算部14は、補正係数を計算する。具体的には、補正係数計算部14は、2chステレオ信号全体のエネルギーと、補正係数を適用した22.2ch音声信号の全エネルギーの和を等しくするための補正係数bi(1≦i≦24)を、以下の式(5)によって計算する。
Next, in step S17, the
例えば、式5より、以下の式(6)を導出することができる。
(b1)2=c1×(a11)2+c2×(a21)2・・・(6)
他のb2〜b24の値についても同様に式(5)から導出することができる。
For example, the following formula (6) can be derived from the formula 5.
(B 1 ) 2 = c 1 × (a 11 ) 2 + c 2 × (a 21 ) 2 (6)
Other values of b 2 to b 24 can be similarly derived from the equation (5).
なお、補正係数計算部14は、補正係数算出の基準となる指標としてエネルギー以外にもラウドネスや振幅などを用いてもよい。例えば、補正係数計算部14は、参照信号の全ラウドネスと補正係数を適用したマルチチャンネル音声信号の全ラウドネスが等しくなるような補正係数biを算出してもよい。あるいは、補正係数計算部14は、参照信号の全チャンネル信号の振幅の2乗和と補正係数を適用したマルチチャンネル音声信号の全チャンネル信号の振幅の2乗和が等しくなるような補正係数biを算出してもよい。補正係数計算部14は、計算した補正係数b1〜b24を補正係数適用部15に出力する。
Note that the correction
次に、ステップS18で、補正係数適用部15は、再生チャンネル数に応じて、例えば線形補間を利用して補正係数を修正する。ステップS13〜S17の過程を経て計算した補正係数biは、22.2chのマルチチャンネル音声信号と2chの参照信号とから得られた、いわば、22.2chを2chに変換するのに適した補正係数(参照信号のチャンネル数に対応する補正係数)である。22.2chのマルチチャンネル音声信号を、所定のチャンネル数変換方法を用いて再生チャンネル音声信号(5.1ch)にダウンミックスすると、例えば、規格等で定められたダウンミックス係数によって機械的に変換されることになる。このため、変換後の5.1chの再生チャンネル音声信号は、番組製作者が5.1chを用いて表現する音声として意図する音声信号とは乖離する可能性がある。本実施形態では、5.1chより少ないチャンネル数の番組製作者の意図が反映された参照信号を教師データとして、22.2chのマルチチャンネル音声信号を参照信号に近づけるための補正係数biを計算する。しかし、上記のステップで得られたこの補正係数をそのまま適用22.2chに適用すると、適用後のマルチチャンネル音声信号には、2chへの変換が想定された片寄りが生じるため、補正係数適用部15は、2chへの片寄りを緩和する修正を行う。そして、補正係数適用部15は、補正係数biを、より5.1chに適した補正係数(再生チャンネル信号のチャンネル数に対応する補正係数)となるよう修正する。
Next, in step S18, the correction
例えば、22.2ch(nチャンネル)を22.2ch(nチャンネル)へ変換するときの補正係数を「1.0」、22.2ch(nチャンネル)を2ch(lチャンネル)へ変換するときの補正係数を「bi」とした場合、5.1ch(mチャンネル)のチャンネル数が両者の間であることに基づき、22.2ch(nチャンネル)を5.1ch(mチャンネル)へ変換するときの補正係数b^iがそれら両方の補正係数の中間の値(例えば、b^i=(bi+1)÷2)と考える。ここで、bi≦b^i≦1.0である。すると、線形補間の関係から、以下の式(6)が導出できる。
(b^i−bi)÷(1.0−bi) = (m−l)÷(n−l)
・・・(6)
これを変形すると、以下の式(7)が導出できる。
b^i = bi + (1−bi)×(m−l)÷(n−l)・・・(7)
なお、上記の線形補間の説明でl<m<nであることを前提に説明を行ったが、式(7)は、m>lでもm<lでも適用可能であり、mとlの大小関係には制約がない。また、ここでは、線形補間を用いて5.1ch用に補正係数を修正する場合を例に説明を行ったが、他の補間法(多項式補間など)を用いて補正係数を修正してもよい。
次に、ステップS19で、補正係数適用部15は、5.1chに適した補正係数b^iを22.2chのマルチチャンネル音声信号に適用する。具体的には、補正係数適用部15は、b^iをqiに乗じる。そして、補正係数適用部15は、適用後のb^i×qi(1≦i≦24)をチャンネル数変換部17に出力する。
For example, the correction coefficient when converting 22.2 ch (n channel) to 22.2 ch (n channel) is “1.0”, and the correction coefficient when converting 22.2 ch (n channel) to 2 ch (l channel) When the coefficient is “b i ”, when converting the number of channels of 5.1 ch (m channel) between the two, 22.2 ch (n channel) is converted to 5.1 ch (m channel). It is assumed that the correction coefficient b i is an intermediate value between the two correction coefficients (for example, b i = (b i +1) / 2). Here, b i ≦ b i ≦ 1.0. Then, the following equation (6) can be derived from the relationship of linear interpolation.
(B ^ i −b i ) ÷ (1.0−b i ) = (m−l) ÷ (n−l)
... (6)
By transforming this, the following equation (7) can be derived.
b i = b i + (1−b i ) × (m−l) ÷ (n−l) (7)
In the above description of linear interpolation, it was assumed that l <m <n. However, Equation (7) can be applied to both m> l and m <l. There are no restrictions on the relationship. In addition, here, the case where the correction coefficient is corrected for 5.1ch using linear interpolation has been described as an example, but the correction coefficient may be corrected using another interpolation method (polynomial interpolation or the like). .
Next, in step S19, the correction
なお、上記の例では、22.2chを22.2chへ変換するときの補正係数を「1.0」と仮定したが、これに限定されない。例えば、マルチチャンネル音声信号の各チャンネル信号qiの重要度などに応じて初期値(マルチチャンネル音声信号のチャンネル数に対応する補正係数の初期値)を設定することが可能である。例えば、記憶部18にマルチチャンネル音声信号のチャンネル信号qi(1≦i≦24)ごとに補正係数の初期値が記録されていて、補正係数適用部15は、記憶部18からチャンネル信号qi(1≦i≦24)ごとの補正係数の初期値を読み出すことで、b^iを計算してもよい。例えば、記憶部18には、q1の補正係数の初期値が「1.0」、q2の補正係数の初期値が「0.9」、・・・、q24の補正係数の初期値が「0.8」などと記録されていてもよい。
In the above example, the correction coefficient when converting 22.2 ch to 22.2 ch is assumed to be “1.0”, but the present invention is not limited to this. For example, an initial value (an initial value of a correction coefficient corresponding to the number of channels of the multichannel audio signal) can be set according to the importance of each channel signal q i of the multichannel audio signal. For example, the initial value of the correction coefficient is recorded for each channel signal q i (1 ≦ i ≦ 24) of the multi-channel audio signal in the
次に、ステップS20で、チャンネル数変換部17は、入力した補正係数適用後のマルチチャンネル音声信号を、後述する所定のチャンネル数変換方法(一般的なチャンネル数変換方法)でチャンネル数変換し、再生チャンネル音声信号を出力する。
Next, in step S20, the channel
本実施形態によれば、マルチチャンネル音声信号とそれより少ないチャンネル数の音声信号(参照信号)が同時に提供された場合に、少ないチャンネル数の参照信号を基準にして、より制作意図に沿ったチャンネル数変換を実現することができる。 According to the present embodiment, when a multi-channel audio signal and an audio signal (reference signal) having a smaller number of channels are simultaneously provided, a channel that is more in line with the production intention with reference to the reference signal having a smaller number of channels. Number conversion can be realized.
<第二実施形態>
以下、本発明の第二実施形態による重み付け係数計算部を、図4〜6を参照して説明する。
図4は、本発明に係る第二実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図4に示すようにチャンネル数変換装置10aは、参照信号入力部11、マルチチャンネル音声信号入力部12、重み付け係数計算部13a、補正係数計算部14、補正係数適用部15、再生チャンネル情報取得部16、チャンネル数変換部17、記憶部18と、を含む。このように、第二実施形態によるチャンネル数変換装置10aは、第一実施形態の重み付け係数計算部13に代えて重み付け係数計算部13aを備えている。なお、第二実施形態によるチャンネル数変換装置10aの他の構成は、第一実施形態のチャンネル数変換装置10と同様である。
<Second embodiment>
Hereinafter, the weighting coefficient calculator according to the second embodiment of the present invention will be described with reference to FIGS.
FIG. 4 is a block diagram showing an example of the channel number conversion apparatus according to the second embodiment of the present invention.
As shown in FIG. 4, the channel
図5は、本発明に係る第二実施形態における重み付け係数計算部の一例を示すブロック図である。
図5に示すように、本実施形態による重み付け係数計算部13aは、遅延補正部131と、重み付け比分析部132と、重み付け比補正部133と、グルーピング部134と、を含む。
グルーピング部134は、マルチチャンネル音声信号の各チャンネル信号を、各チャンネル信号の類似度に基づいてグルーピングする。例えば、グルーピング部134は、各チャンネル音声信号間の相互相関係数を計算し、相互相関係数の大きいチャンネル同士をグルーピングする。また、グルーピング部134は、主成分分析、クラスタ分析等の方法、あるいはそれら両方の方法を用いて音声信号の性質が似たチャンネル同士をグルーピングしてもよい。さらに、グルーピング部134は、同じグループに所属するチャンネル音声信号を代表するグループ信号を生成する。なお、本実施形態では、重み付け係数計算部13aは、このグループ信号について重み付け係数を計算する。グループ信号の生成方法には以下のような方法がある。例えば、グルーピング部134は、同じグループに所属するチャンネル信号の平均を生成し、生成した信号をグループ信号として扱ってもよい。また、例えば、グルーピング部134は、同じグループに所属するチャンネル信号の類似度の重心にある信号を選択し、選択した信号をグループ信号として扱ってもよい。さらに、例えば、グルーピング部134は、同じグループに所属するチャンネル音声信号のうち、最大エネルギーを有するチャンネル音声信号を選択し、選択した信号をグループ信号として扱ってもよい。
FIG. 5 is a block diagram showing an example of a weighting coefficient calculator in the second embodiment according to the present invention.
As shown in FIG. 5, the weighting
The
遅延補正部131、重み付け比分析部132、重み付け比補正部133の機能は、第一実施形態と同様であり、参照信号の各チャンネル信号に対する、マルチチャンネル音声信号の各グループ信号の遅延を補正する。重み付け比分析部132は、参照信号の各チャンネル信号におけるマルチチャンネル音声信号の各グループ信号の重み付け比を多変量解析で分析する。重み付け比補正部133は、参照信号の各チャンネル信号のエネルギーと、重み付け比分析部132が分析した重み付け比をマルチチャンネル音声信号の各グループ信号に乗じて得た擬似参照信号の各チャンネルのエネルギー(参照信号のチャンネルに対応する擬似参照信号のチャンネルのエネルギー)とが等しくなるような定数cjを計算する。グループに所属する各チャンネル音声信号には、グループ信号に与えられた重み付け比を、グループに所属するチャンネル数に応じて等分した値を付与する。
The functions of the
次に、図6を用いて、第二実施形態におけるチャンネル数変換処理について説明を行う。図6は、本発明に係る第二実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
なお、図3で説明した処理と同様の処理については簡単に説明を行う。まず、ステップS11で、マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を入力する。マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を重み付け係数計算部13aに出力する。また、ステップS12で、参照信号入力部11は、参照信号を入力する。参照信号入力部11は、参照信号の各チャンネル信号を重み付け係数計算部13aに出力する。次に、ステップS121で、重み付け係数計算部13aでは、グルーピング部134がマルチチャンネル音声信号の各チャンネル信号を、例えば、主成分分析等の方法を用いてグルーピングする。グルーピング部134は、グルーピング後のグループ信号を遅延補正部131に出力する。次に、ステップS13で、遅延補正部131が、参照信号とマルチチャンネル音声信号とを入力して、マルチチャンネル音声信号の遅延を補正する。遅延補正部131は、遅延補正後のマルチチャンネル音声信号(各グループ信号)を重み付け比分析部132に出力する。
Next, the channel number conversion process in the second embodiment will be described with reference to FIG. FIG. 6 is a flowchart showing an example of channel number conversion processing in the second embodiment according to the present invention.
A process similar to the process described with reference to FIG. 3 will be briefly described. First, in step S11, the multichannel audio
次に、ステップS14で、重み付け比分析部132は、遅延補正後のマルチチャンネル音声信号と参照信号とを入力し、参照信号の各チャンネル信号に対するマルチチャンネル音声信号の各グループ信号の重み付け比を、重回帰分析等を用いて計算する。重み付け比分析部132は、分析した重み付け比を重み付け比補正部133に出力する。次に、ステップS15で、重み付け比補正部133は、重み付け比分析部132が分析した重み付け比と参照信号とを入力し、重み付け比をエネルギーに基づいて補正する。第二実施形態では、重み付け比補正部133は、参照信号の各チャンネル信号のエネルギーと、重み付け比をマルチチャンネル音声信号の各グループ信号に乗じて得た擬似参照信号の各チャンネルのエネルギーとが等しくなるような定数cjを計算し、各重み付け比aijにcjの平方根を乗じた重み付け係数を計算する。このとき、重み付け比補正部133は、同じグループ信号に所属するチャンネル信号のそれぞれに同じ重み付け係数を付与する。そして、ステップS16で、重み付け係数計算部13は、重み付け比補正部133が計算した重み付け係数を補正係数計算部14へ出力する。
Next, in step S14, the weighting
次に、ステップS17で、補正係数計算部14は、第一実施形態と同様に補正係数を計算する。次に、ステップS18で、補正係数適用部15は、線形補間等により、再生チャンネル数に応じて補正係数を修正する。ステップS19で、補正係数適用部15は、修正後の補正係数をマルチチャンネル音声信号に適用する。補正係数適用部15は、補正係数適用後のマルチチャンネル音声信号をチャンネル数変換部17に出力する。次に、ステップS20で、チャンネル数変換部17は、所定の方法で補正係数適用後のマルチチャンネル音声信号をチャンネル数変換する。チャンネル数変換装置10aは、チャンネル数変換後の再生チャンネル音声信号を再生機器等に出力する。
Next, in step S17, the correction
第二実施形態によれば、第一実施形態と同様の効果を得ることができる。また、第二実施形態によれば、マルチチャンネル音声信号に含まれるチャンネル音声信号のうち、音声信号の特性が似ているチャンネル音声信号をグルーピングして、遅延補正処理や重み付け係数の算出処理を行うので、第一実施形態に比べ、計算量を抑えることができる。 According to the second embodiment, the same effect as the first embodiment can be obtained. In addition, according to the second embodiment, among channel audio signals included in a multi-channel audio signal, channel audio signals having similar audio signal characteristics are grouped to perform delay correction processing and weighting coefficient calculation processing. Therefore, the amount of calculation can be suppressed as compared with the first embodiment.
<第三実施形態>
以下、本発明の第三実施形態による重み付け係数計算部を、図7〜9を参照して説明する。
図7は、本発明に係る第三実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図7に示すようにチャンネル数変換装置10bは、参照信号入力部11、マルチチャンネル音声信号入力部12、重み付け係数計算部13b、補正係数計算部14、補正係数適用部15、再生チャンネル情報取得部16、チャンネル数変換部17、記憶部18と、を含む。このように、第二実施形態によるチャンネル数変換装置10aは、第一実施形態の重み付け係数計算部13に代えて重み付け係数計算部13bを備えている。なお、第二実施形態によるチャンネル数変換装置10bの他の構成は、第一実施形態のチャンネル数変換装置10と同様である。
<Third embodiment>
Hereinafter, the weighting coefficient calculator according to the third embodiment of the present invention will be described with reference to FIGS.
FIG. 7 is a block diagram showing an example of the channel number conversion apparatus according to the third embodiment of the present invention.
As shown in FIG. 7, the channel
図8は、本発明に係る第三実施形態における重み付け係数計算部の一例を示すブロック図である。
図8に示すように、本実施形態による重み付け係数計算部13bは、遅延補正部131bと、重み付け比分析部132bと、重み付け比補正部133と、基準チャンネル信号選択部135と、チャンネル分類部136と、を含む。
基準チャンネル信号選択部135は、マルチチャンネル音声信号に含まれるチャンネル信号のうち、参照信号のチャンネル信号との間の相互相関係数が最も大きいチャンネル信号(基準チャンネル信号)を選択する。基準チャンネル信号選択部135は、選択した基準チャンネルの情報を出力する。
チャンネル分類部136は、マルチチャンネル音声信号に含まれるチャンネル信号を、基準チャンネル音声信号とそれ以外(非基準チャンネル信号)に分類する。
FIG. 8 is a block diagram showing an example of the weighting coefficient calculator in the third embodiment according to the present invention.
As shown in FIG. 8, the weighting
The reference channel
The
遅延補正部131bは、参照信号のチャンネル信号に対する、基準チャンネル信号および非基準チャンネル信号郡のうち少なくとも一方の遅延を補正する。なお、非基準チャンネル信号郡に含まれる各チャンネル音声信号の遅延は、個別に補正してもよい。
重み付け比分析部132bは、基準チャンネル信号の重み付け比が、非基準チャンネル信号群のどの重み付け係数よりも大きいという拘束条件を課したうえで、重み付け比を計算する。
The
The weighting
重み付け比補正部133の機能は、第一実施形態と同様であり、参照信号の各チャンネル信号のエネルギーと、重み付け比分析部132bが分析した重み付け比をマルチチャンネル音声信号の各チャンネル信号に乗じて得た擬似参照信号の各チャンネルのエネルギー(参照信号のチャンネルに対応する擬似参照信号のチャンネルのエネルギー)とが等しくなるような定数cjを計算する。
The function of the weighting
次に図9を用いて、第三実施形態におけるチャンネル数変換処理について説明を行う。図9は、本発明に係る第三実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
なお、図3、6で説明した処理と同様の処理については簡単に説明を行う。まず、ステップS11で、マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を入力する。マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を重み付け係数計算部13bに出力する。また、ステップS12で、参照信号入力部11は、参照信号を入力する。参照信号入力部11は、参照信号の各チャンネル信号を重み付け係数計算部13bに出力する。次に、ステップS122で、重み付け係数計算部13bでは、基準チャンネル信号選択部135が基準チャンネル信号を選択する。例えば、番組が報道番組の場合、2chの参照信号において支配的なのはダイアログ音声信号だと考えられる。基準チャンネル信号選択部135は、22.2chの各チャンネル信号のうち、ダイアログ音声信号を多く含むチャンネル(相互相関係数が最も大きいチャンネル信号)を基準チャンネル信号として選択する。基準チャンネル信号選択部135は、選択した基準チャンネル信号の情報(どのチャンネルを選択したか)をチャンネル分類部136に出力する。ステップS123で、チャンネル分類部136は、基準チャンネル信号の情報とマルチチャンネル音声信号とを入力し、マルチチャンネル音声信号に含まれるチャンネル信号を、基準チャンネル信号と非基準チャンネル信号とに分類する。チャンネル分類部136は、分類した基準チャンネル信号と非基準チャンネル信号とを遅延補正部131bへ出力する。次に、ステップS124で、遅延補正部131bは、参照信号の各チャンネル信号に対する基準チャンネル信号の遅延を補正する。次に、ステップS125で、遅延補正部131bは、参照信号の各チャンネル信号に対する非基準チャンネル信号の遅延を補正する。このとき、遅延補正部131bは、非基準チャンネル信号のそれぞれについて遅延の補正を行ってもよい。なお、ステップS124〜S125の処理は両方行うことが好ましいが、どちらか一方、例えば、基準チャンネル信号の遅延の補正処理(ステップS124)だけを行ってもよい。遅延補正部131bは、基準チャンネル信号と非基準チャンネル信号とを重み付け比分析部132bへ出力する。次に、ステップS141で、重み付け比分析部132bは、基準チャンネル信号の重み付け比が非基準チャンネル信号に含まれるチャンネル信号のどの重み付け比よりも大きいという拘束条件下で、重み付け比を重回帰分析等により計算する。重み付け比分析部132bは、分析した重み付け比を重み付け比補正部133に出力する。次に、ステップS15で、重み付け比補正部133は、重み付け比分析部132が分析した重み付け比と参照信号とを入力し、重み付け比をエネルギーに基づいて補正する。ステップS16で、重み付け係数計算部13は、重み付け比補正部133による補正後の重み付け係数を補正係数計算部14へ出力する。
Next, the channel number conversion process in the third embodiment will be described with reference to FIG. FIG. 9 is a flowchart showing an example of channel number conversion processing in the third embodiment according to the present invention.
A process similar to the process described with reference to FIGS. 3 and 6 will be briefly described. First, in step S11, the multichannel audio
次に、ステップS17で、補正係数計算部14は、補正係数(bi)を計算する。次に、ステップS18で、補正係数適用部15は、再生チャンネル数に応じて補正係数を修正する。ステップS19で、補正係数適用部15は、修正後の補正係数(b^i)をマルチチャンネル音声信号に適用し、補正係数適用後のマルチチャンネル音声信号をチャンネル数変換部17に出力する。次に、ステップS20で、チャンネル数変換部17は、所定の方法でマルチチャンネル音声信号をチャンネル数変換する。チャンネル数変換装置10bは、チャンネル数変換後の再生チャンネル音声信号を再生機器等に出力する。
Next, in step S17, the correction
第三実施形態によれば、第一実施形態と同様の効果を得ることができる。また、第三実施形態によれば、マルチチャンネル音声信号に含まれるチャンネル信号のうち、音声信号の特性が似ているチャンネル信号(基準チャンネル信号)だけを選択して、遅延補正処理や重み付け係数の算出処理を行うので、第一実施形態に比べ、計算量を抑えることができる。第三実施形態は、例えば、テレビの対談番組などのダイアログ音声信号が支配的な番組のマルチチャンネル音声信号を再生チャンネル音声信号に変換するような場面で用いることができる。 According to the third embodiment, the same effect as that of the first embodiment can be obtained. Further, according to the third embodiment, only the channel signal (reference channel signal) having similar audio signal characteristics is selected from the channel signals included in the multi-channel audio signal, and the delay correction process and the weighting coefficient are selected. Since the calculation process is performed, the amount of calculation can be reduced compared to the first embodiment. The third embodiment can be used in a situation where, for example, a multi-channel audio signal of a program in which a dialog audio signal is dominant, such as a TV talk program, is converted into a reproduction channel audio signal.
また、基準チャンネル信号だけに限定して以降の処理(重み付け係数の計算など)を行い、非基準チャンネル信号については処理を行わない(非基準チャンネル信号群のそれぞれの信号の強さを「0」として扱う)といった実施形態でもよい。また、基準チャンネル信号選択部135は、参照信号のチャンネル信号との間の相互相関係数が最も大きい(一つの)チャンネル信号を選択するだけではなく、相互相関係数が大きいチャンネル信号を、相互相関係数が大きい順に複数選択して、あるいは、相互相関係数が所定の閾値以上のチャンネル信号を選択して、選択した複数のチャンネル信号を基準チャンネル信号としてもよい。
なお、ダイアログ音声信号に含まれる音声は必ずしもダイアログ(対話)の音声に限られない。主に人の声で構成される音声信号をダイアログ音声信号としてよい。
Further, the following processing (weighting coefficient calculation, etc.) is performed only for the reference channel signal, and processing is not performed for the non-reference channel signal (the intensity of each signal of the non-reference channel signal group is “0”). May be used as an embodiment). The reference channel
Note that the sound included in the dialog sound signal is not necessarily limited to the sound of the dialog (dialog). An audio signal mainly composed of a human voice may be used as the dialog audio signal.
<第四実施形態>
以下、本発明の第四実施形態による重み付け係数計算部を、図10〜11を参照して説明する。
図10は、本発明に係る第四実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図10に示すようにチャンネル数変換装置10cは、参照信号入力部11、マルチチャンネル音声信号入力部12、重み付け係数計算部13、補正係数計算部14、補正係数適用部15、再生チャンネル情報取得部16、チャンネル数変換部17、記憶部18と、モノ信号変換部19と、を含む。このように、第四実施形態によるチャンネル数変換装置10cは、第一実施形態の構成に加え、モノ信号変換部19を備えている。なお、第四実施形態によるチャンネル数変換装置10cの他の構成は、第一実施形態のチャンネル数変換装置10と同様である。また、重み付け係数計算部13の構成については、図2を用いて説明したものと同様である。
<Fourth embodiment>
Hereinafter, the weighting coefficient calculation unit according to the fourth embodiment of the present invention will be described with reference to FIGS.
FIG. 10 is a block diagram showing an example of the channel number conversion apparatus in the fourth embodiment according to the present invention.
As shown in FIG. 10, the channel
モノ信号変換部19は、参照信号を所定の方法によって、参照信号をモノ信号にダウンミックスする。例えば、モノ信号変換部19は、参照信号入力部11が入力した2chの音声信号を1chの音声信号に変換する。2chの音声信号から1chの音声信号への変換には、公知のダウンミックス法を用いてもよい。
The
第四実施形態では、モノ信号に対して重み付け比を計算したり、補正係数を計算したりするため、第一実施形態で説明したそれらの値の計算式と異なる部分がある。例えば、重み付け比補正部133は、以下の式(8)から定数cを計算する。
In the fourth embodiment, since a weighting ratio is calculated for a mono signal or a correction coefficient is calculated, there are portions different from the calculation formulas of those values described in the first embodiment. For example, the weighting
また、補正係数計算部14は、第一実施形態と同様、重み付け係数計算部13が計算した重み付け係数を用いて補正係数を計算するが、第四実施形態の場合、補正係数計算部14cは、参照信号を変換したモノ信号に対する重み付け係数のみを入力する。従って、第一実施形態と異なり、2ch分の重み付け係数を統合する必要が無い。具体的には、補正係数計算部14は、上記の式(8)から算出される以下の関係式(9)によって、補正係数b1を導出する。
(b1)2=c×(a1)2 ・・・(9)
補正係数計算部14は、他の補正係数b2〜b24の値についても同様に計算する。
The
(B 1 ) 2 = c × (a 1 ) 2 (9)
The correction
次に図11を用いて、第四実施形態におけるチャンネル数変換処理について説明を行う。図11は、本発明に係る第四実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
なお、図3で説明した処理と同様の処理については簡単に説明を行う。まず、ステップS11で、マルチチャンネル音声信号入力部12は、マルチチャンネル音声信号を入力する。また、ステップS12で、参照信号入力部11は、参照信号を入力する。参照信号入力部11は、参照信号をモノ信号変換部19へ出力する。次に、ステップS126で、モノ信号変換部19は、参照信号を1chのモノ信号に変換し、モノ信号を重み付け係数計算部13へ出力する。次に重み付け係数計算部13では、遅延補正部131が、モノ信号とマルチチャンネル音声信号とを入力する。ステップS13で、遅延補正部131は、モノ信号に対するマルチチャンネル音声信号の遅延を補正する。次に、ステップS14で、重み付け比分析部132は、遅延補正後のマルチチャンネル音声信号とモノ信号とを入力し、モノ信号に対するマルチチャンネル音声信号の各チャンネル信号の重み付け比を、重回帰分析等を用いて計算する。重み付け比分析部132は、分析した重み付け比を重み付け比補正部133に出力する。次に、ステップS15で、重み付け比補正部133は、重み付け比分析部132が分析した重み付け比とモノ信号とを入力し、重み付け比をエネルギーに基づいて補正する。第四実施形態では、重み付け比補正部133は、モノ信号のエネルギーと、重み付け比をマルチチャンネル音声信号の各チャンネル信号に乗じて得た擬似モノ信号のエネルギーとが等しくなるような定数cを計算し、各重み付け比aiにcの平方根を乗じた重み付け係数を計算する。ステップS16で、重み付け係数計算部13は、重み付け係数(補正係数と同じ値)を補正係数計算部14へ出力する。補正係数計算部14は、補正係数を補正係数適用部15へ出力する。
Next, the channel number conversion process in the fourth embodiment will be described with reference to FIG. FIG. 11 is a flowchart showing an example of channel number conversion processing in the fourth embodiment according to the present invention.
A process similar to the process described with reference to FIG. 3 will be briefly described. First, in step S11, the multichannel audio
次に、ステップS18で、補正係数適用部15は、再生チャンネル数に応じて補正係数を修正する。ステップS19で、補正係数適用部15は、修正後の補正係数をマルチチャンネル音声信号に適用する。次に、ステップS20で、チャンネル数変換部17は、所定のレンダリング方法で補正係数適用後のマルチチャンネル音声信号を補正係数適用部15から入力し、チャンネル数変換する。チャンネル数変換装置10cは、チャンネル数変換後の再生チャンネル音声信号を再生機器等に出力する。
Next, in step S18, the correction
第四実施形態によれば、第一実施形態と同様の効果を得ることができる。また、補正係数を計算等の処理を、モノ信号を参照して行うので、第一実施形態に比べ加え、計算量を抑えることができる。なお、第四実施形態は、第二実施形態、または、第三実施形態に適用してもよい。 According to the fourth embodiment, the same effect as that of the first embodiment can be obtained. Further, since the processing such as calculation of the correction coefficient is performed with reference to the mono signal, the amount of calculation can be reduced as compared with the first embodiment. Note that the fourth embodiment may be applied to the second embodiment or the third embodiment.
なお、上述のチャンネル数変換装置10、10a、10b、10cは、内部にコンピュータシステムを有している。そして、チャンネル数変換装置10等の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
Note that the above-described channel
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
Further, the “computer system” includes a homepage providing environment (or display environment) if a WWW system is used.
The “computer-readable recording medium” refers to a storage device such as a flexible medium, a magneto-optical disk, a portable medium such as a ROM and a CD-ROM, and a hard disk incorporated in a computer system. Furthermore, the “computer-readable recording medium” dynamically holds a program for a short time like a communication line when transmitting a program via a network such as the Internet or a communication line such as a telephone line. In this case, a volatile memory in a computer system serving as a server or a client in that case, and a program that holds a program for a certain period of time are also included. The program may be a program for realizing a part of the functions described above, and may be a program capable of realizing the functions described above in combination with a program already recorded in a computer system.
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。 In addition, it is possible to appropriately replace the components in the above-described embodiments with known components without departing from the spirit of the present invention. The technical scope of the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.
10、10a、10b、10c・・・チャンネル数変換装置
11・・・参照信号入力部
12・・・マルチチャンネル音声信号入力部
13、13a、13b・・・重み付け係数計算部
131、131b・・・遅延補正部
132、132b・・・重み付け比分析部
133・・・重み付け比補正部
134・・・グルーピング部
135・・・基準チャンネル信号選択部
136・・・チャンネル分類部
14・・・補正係数計算部
15・・・補正係数適用部
16・・・再生チャンネル情報取得部
17・・・チャンネル数変換部
18・・・記憶部
19・・・モノ信号変換部
10, 10a, 10b, 10c ... Channel
Claims (12)
前記重み付け係数に基づいて前記マルチチャンネル音声信号の各チャンネル信号に乗じる補正係数を計算する補正係数計算部と、
前記補正係数を前記マルチチャンネル音声信号に適用する補正係数適用部と、
前記補正係数を適用したマルチチャンネル音声信号を、所定のチャンネル数変換方法によって、所望のチャンネル数の再生チャンネル信号に変換するチャンネル数変換部と、
を備えることを特徴とするチャンネル数変換装置。 Weighting coefficient calculation for inputting a multichannel audio signal and a reference signal corresponding to the multichannel audio signal, and calculating a weighting coefficient corresponding to each channel signal of the multichannel audio signal included in each channel of the reference signal And
A correction coefficient calculator that calculates a correction coefficient to be multiplied to each channel signal of the multi-channel audio signal based on the weighting coefficient;
A correction coefficient applying unit that applies the correction coefficient to the multi-channel audio signal;
A channel number conversion unit that converts the multichannel audio signal to which the correction coefficient is applied into a reproduction channel signal having a desired number of channels by a predetermined channel number conversion method;
A channel number conversion device comprising:
を備えることを特徴とする請求項1に記載のチャンネル数変換装置。 A delay correction unit that corrects a delay between the reference signal and each channel signal of the multi-channel audio signal;
The channel number conversion apparatus according to claim 1, further comprising:
を備えることを特徴とする請求項1または請求項2に記載のチャンネル数変換装置。 The weighting coefficient calculation unit inputs the multichannel audio signal and the reference signal, and analyzes a weighting ratio for each channel signal of the multichannel audio signal;
The channel number conversion apparatus according to claim 1 or 2, further comprising:
をさらに備えることを特徴とする請求項3に記載のチャンネル数変換装置。 The weighting coefficient calculation unit includes a sum of energy of each channel signal of the reference signal and a signal energy obtained by multiplying each channel signal of the multichannel audio signal corresponding to each channel of the reference signal by the weighting ratio. A weighting ratio correction unit for correcting the weighting ratio to be equal;
The channel number conversion device according to claim 3, further comprising:
マルチチャンネル音声信号の各チャンネル信号を、各チャンネル信号の類似度に基づいてグルーピングし、そのグループに所属する前記チャンネル信号に基づいて当該グループを代表するグループ信号を生成するグルーピング部、をさらに備え、
前記重み付け係数計算部は、前記グループ信号についての重み付け係数を計算する、
ことを特徴とする請求項2から請求項4の何れか1項に記載のチャンネル数変換装置。 The weighting factor calculator is
A grouping unit for grouping each channel signal of the multi-channel audio signal based on the similarity of each channel signal, and generating a group signal representing the group based on the channel signal belonging to the group;
The weighting coefficient calculator calculates a weighting coefficient for the group signal;
5. The channel number conversion device according to claim 2, wherein the number of channels is converted.
ことを特徴とする請求項5に記載のチャンネル数変換装置。 The grouping unit may be any one of an average of the channel signals, a channel signal at the center of gravity of the similarity of the channel signals, and a channel signal having the maximum energy among the channel signals based on the channel signals belonging to the group. Or as the group signal,
The number-of-channels conversion device according to claim 5.
前記マルチチャンネル音声信号の各チャンネル信号の中から、前記参照信号との間の相互相関係数に基づいて1つまたは複数のチャンネル信号を選択する基準チャンネル信号選択部、をさらに備え、
前記重み付け係数計算部は、前記選択されたチャンネル信号の重み付け係数が、それ以外のチャンネル信号の重み付け係数よりも大きくなることを拘束条件として、重み付け係数を計算する、
ことを特徴とする請求項2から請求項4の何れか1項に記載のチャンネル数変換装置。 The weighting factor calculator is
A reference channel signal selection unit that selects one or a plurality of channel signals based on a cross-correlation coefficient with the reference signal from each channel signal of the multi-channel audio signal;
The weighting coefficient calculation unit calculates a weighting coefficient on the condition that the weighting coefficient of the selected channel signal is larger than the weighting coefficients of other channel signals.
5. The channel number conversion device according to claim 2, wherein the number of channels is converted.
前記マルチチャンネル音声信号の各チャンネル信号の中から、前記参照信号との間の相互相関係数に基づいて1つまたは複数のチャンネル信号を選択する基準チャンネル信号選択部、をさらに備え、
前記重み付け係数計算部は、前記基準チャンネル信号選択部が選択したチャンネル信号についてのみ重み付け係数を計算する、
ことを特徴とする請求項2から請求項4の何れか1項に記載のチャンネル数変換装置。 The weighting factor calculator is
A reference channel signal selection unit that selects one or a plurality of channel signals based on a cross-correlation coefficient with the reference signal from each channel signal of the multi-channel audio signal;
The weighting coefficient calculator calculates a weighting coefficient only for the channel signal selected by the reference channel signal selector.
5. The channel number conversion device according to claim 2, wherein the number of channels is converted.
ことを特徴とする請求項1から請求項8の何れか1項に記載のチャンネル数変換装置。 The correction coefficient calculation unit includes the sum of the energy of the signal obtained by applying the weighting coefficient to each channel signal of the multichannel audio signal corresponding to the total energy of the reference signal or each channel of the reference signal, and the multichannel audio Calculating the correction coefficient so that the sum of energy of signals obtained by applying the correction coefficient to each channel signal of the signal is equal;
9. The channel number converter according to claim 1, wherein the number of channels is converted.
ことを特徴とする請求項1から請求項9の何れか1項に記載のチャンネル数変換装置。 The correction coefficient application unit corrects the predetermined initial value of the correction coefficient corresponding to the number of channels of the multi-channel audio signal and the correction coefficient calculated by the correction coefficient calculation unit and corresponding to the number of channels of the reference signal. And correcting the correction coefficient calculated by the correction coefficient calculation unit according to the number of channels of the reproduction channel signal by interpolation based on the coefficient,
10. The channel number conversion apparatus according to claim 1, wherein
請求項1から請求項10の何れか1項に記載のチャンネル数変換装置。 11. The channel number conversion apparatus according to claim 1, further comprising: a mono signal conversion unit that converts the reference signal into a mono signal by a predetermined channel number conversion method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103664A JP6684651B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016103664A JP6684651B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2017212552A true JP2017212552A (en) | 2017-11-30 |
JP6684651B2 JP6684651B2 (en) | 2020-04-22 |
Family
ID=60475698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016103664A Expired - Fee Related JP6684651B2 (en) | 2016-05-24 | 2016-05-24 | Channel number converter and its program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6684651B2 (en) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011193164A (en) * | 2010-03-12 | 2011-09-29 | Nippon Hoso Kyokai <Nhk> | Down-mix device of multi-channel acoustic signal and program |
WO2014192603A1 (en) * | 2013-05-31 | 2014-12-04 | ソニー株式会社 | Audio signal output device and method, encoding device and method, decoding device and method, and program |
JP2015195545A (en) * | 2014-03-25 | 2015-11-05 | 日本放送協会 | Channel number converter |
-
2016
- 2016-05-24 JP JP2016103664A patent/JP6684651B2/en not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2011193164A (en) * | 2010-03-12 | 2011-09-29 | Nippon Hoso Kyokai <Nhk> | Down-mix device of multi-channel acoustic signal and program |
WO2014192603A1 (en) * | 2013-05-31 | 2014-12-04 | ソニー株式会社 | Audio signal output device and method, encoding device and method, decoding device and method, and program |
JP2015195545A (en) * | 2014-03-25 | 2015-11-05 | 日本放送協会 | Channel number converter |
Also Published As
Publication number | Publication date |
---|---|
JP6684651B2 (en) | 2020-04-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6778781B2 (en) | Dynamic range control of encoded audio extended metadatabase | |
CN101484935B (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
CN101009952B (en) | Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener | |
CN110832881B (en) | Stereo virtual bass enhancement | |
CN101542597B (en) | Methods and apparatuses for encoding and decoding object-based audio signals | |
EP4340397A2 (en) | Audio processing device and method, and program therefor | |
US10595144B2 (en) | Method and apparatus for generating audio content | |
JP5417227B2 (en) | Multi-channel acoustic signal downmix device and program | |
JP5720897B2 (en) | Method and apparatus for generating lower audio format | |
US11871196B2 (en) | Audio enhancements based on video detection | |
US20230254655A1 (en) | Signal processing apparatus and method, and program | |
EP2708041A1 (en) | Apparatus and method and computer program for generating a stereo output signal for providing additional output channels | |
JP6684651B2 (en) | Channel number converter and its program | |
JP6694755B2 (en) | Channel number converter and its program | |
JP5680391B2 (en) | Acoustic encoding apparatus and program | |
JP6905411B2 (en) | Channel number converter and program | |
JP2017211649A (en) | Audio signal correction device and program | |
JP6832095B2 (en) | Channel number converter and its program | |
Uhle et al. | Subband center signal scaling using power ratios | |
JP6630599B2 (en) | Upmix device and program | |
JP2014161111A (en) | Wavefront synthesis signal conversion apparatus and wavefront synthesis signal conversion method | |
JPWO2017188141A1 (en) | Audio signal processing apparatus, audio signal processing method, and audio signal processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20181026 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190402 |
|
TRDD | Decision of grant or rejection written | ||
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200212 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200303 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200330 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6684651 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |