JP2017212547A - チャンネル数変換装置およびそのプログラム - Google Patents

チャンネル数変換装置およびそのプログラム Download PDF

Info

Publication number
JP2017212547A
JP2017212547A JP2016103594A JP2016103594A JP2017212547A JP 2017212547 A JP2017212547 A JP 2017212547A JP 2016103594 A JP2016103594 A JP 2016103594A JP 2016103594 A JP2016103594 A JP 2016103594A JP 2017212547 A JP2017212547 A JP 2017212547A
Authority
JP
Japan
Prior art keywords
downmix
signal
channel
downmix coefficient
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016103594A
Other languages
English (en)
Other versions
JP6694755B2 (ja
Inventor
大出 訓史
Norifumi Oide
訓史 大出
岳大 杉本
Takehiro Sugimoto
岳大 杉本
一穂 小野
Kazuo Ono
一穂 小野
北島 周
Shu Kitajima
周 北島
陽 佐々木
Akira Sasaki
陽 佐々木
小森 智康
Tomoyasu Komori
智康 小森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Priority to JP2016103594A priority Critical patent/JP6694755B2/ja
Publication of JP2017212547A publication Critical patent/JP2017212547A/ja
Application granted granted Critical
Publication of JP6694755B2 publication Critical patent/JP6694755B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】再生環境のスピーカ配置に応じたダウンミックス係数を算出するチャンネル数変換装置を提供する。【解決手段】チャンネル数変換装置は、第一ダウンミックス係数を用いてマルチチャネル音響信号から所望の第一ダウンミックス信号を算出し、第二ダウンミックス係数を用いて第一ダウンミックス信号から参照信号と同じチャンネル数の第二ダウンミックス信号を算出するダウンミックス信号算出部と、第二ダウンミックス信号と参照信号との差分を算出する差分信号算出部と、差分信号算出部が算出した差分が、最小または所定の閾値以下となるように、第一ダウンミックス係数および第二ダウンミックス係数を更新するダウンミックス係数更新部と、を備える。【選択図】図1

Description

本発明は、マルチチャンネルの音響信号から再生環境に応じた再生用音響信号を生成するチャンネル数変換装置およびプログラムに関する。
現在、22.2chなどのマルチチャンネル音響放送(非特許文献1)の実用化が進められている。また、近年、5.1chなどのマルチチャンネル音響システムが家庭等でも広がりつつある。しかし、家庭等の音響システムは、22.2chより少ないチャンネル数でのみ再生可能なシステムである場合が多いと想定される。一般に所定の数のチャンネル数で制作された番組の音響信号を、制作時よりも少ないチャンネル数で再生する場合、ダウンミックスと呼ばれるチャンネル数変換処理が行われる。ダウンミックスとは、制作時の音響信号の各チャンネルの信号にダウンミックス係数を乗じて加算することで、再生時のチャンネル数に応じた音響信号を算出する処理である。ダウンミックス係数は、規格において予め定められている場合がある(例えば、非特許文献2)。例えば、5.1chサラウンド(L,R,C,LFE,Ls,Rsの6チャンネル)からステレオ2ch(Lt, Rtの2チャンネル)へのダウンミックス係数は、ARIB STD−B32に以下のように規定されている。
Figure 2017212547
ここで、サラウンドチャンネル(Ls,Rs)のレベルを規定する係数kには以下の値が用いられる。
Figure 2017212547
また、メタデータが伝送されない場合、デジタルテレビ受信機では、係数kに以下の値が用いられる。
Figure 2017212547
また、放送では、番組ごとにメタデータを添付することで、番組内容に合わせて異なるダウンミックス係数を指定することが可能である。
なお、近年、家庭やシアター等で利用される音響システムには、オブジェクトベース音響方式が採用されることも多い。オブジェクトベース音響方式では、様々なスピーカ配置が採用されており、再生環境は多様化している。
「デジタル放送における映像符号化、音声符号化及び多重化方式 標準規格 VIDEO CODING, AUDIO CODING AND MULTIPLEXING SPECIFICATIONS FOR DIGITAL BROADCASTING ARIB STANDARD ARIB STD-B32 3.6版」,平成28年(2016年)3月25日,一般社団法人電波産業会 勧告 ITU-R BS.775-3、「Multichannel stereophonic sound system with and without accompanying picture」、インターネット<URL:https://www.itu.int/rec/R-REC-BS.775-3-201208-I/en>
上記のとおり、4K/8K放送の22.2chなど、5.1chを上回るチャンネル数のマルチチャンネル音響放送が提案されている。しかし、家庭では、22.2chに対応するスピーカ数を所定のスピーカ位置に設置することができず、番組制作時に想定した数よりも少ないスピーカ数で再生される場合も多い。その場合、ダウンミックスが必要となるが、スピーカ数とその配置は、メーカーの製品の仕様に依存しており、全てのスピーカ配置に対するダウンミックス係数を規定するのは現実的ではない。また、ドキュメンタリーや音楽番組など番組によって最適なダウンミックス係数が異なる可能性があり、同じスピーカ配置であっても、番組ごとにスピーカ数、スピーカ配置に応じた適切なダウンミックス係数を規定することが望ましい。このような中、マルチチャンネル音響信号を、再生環境(スピーカ数、配置)や番組内容に応じて、最適にダウンミックスする技術に対するニーズが存在する。
そこでこの発明は、上述の課題を解決することのできるチャンネル数変換装置およびそのプログラムを提供することを目的としている。
本発明の一態様によれば、チャンネル数変換装置は、第一ダウンミックス係数を用いてマルチチャネル音響信号から所望の第一ダウンミックス信号を算出し、第二ダウンミックス係数を用いて前記第一ダウンミックス信号から参照信号と同じチャンネル数の第二ダウンミックス信号を算出するダウンミックス信号算出部と、前記第二ダウンミックス信号と参照信号との差分を算出する差分信号算出部と、前記差分信号算出部が算出した差分が、最小または所定の閾値以下となるように、前記第一ダウンミックス係数および前記第二ダウンミックス係数を更新するダウンミックス係数更新部と、を備える。
本発明の一態様によれば、前記チャンネル数変換装置は、前記マルチチャネル音響信号を所定のダウンミックス係数を用いてダウンミックスし、前記参照信号を算出する参照信号算出部、をさらに備えてもよい。
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記第二ダウンミックス係数を固定して、前記第一ダウンミックス係数のみを更新してもよい。
本発明の一態様によれば、前記チャンネル数変換装置は、前記第一ダウンミックス係数の初期値と前記第二ダウンミックス係数の初期値とのうち少なくとも一方を記憶するダウンミックス係数記憶部、をさらに備えてもよい。
本発明の一態様によれば、前記ダウンミックス係数記憶部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第一ダウンミックス係数を記憶してもよい。
本発明の一態様によれば、前記ダウンミックス係数記憶部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第二ダウンミックス係数を記憶してもよい。
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第一ダウンミックス係数を更新してもよい。
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第二ダウンミックス係数を更新してもよい。
本発明の一態様によれば、前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第一ダウンミックス係数および第二ダウンミックス係数を更新してもよい。
本発明の一態様によれば、コンピュータを、上記の何れか1つに記載のチャンネル数変換装置、として機能させるためのプログラムである。
本発明のチャンネル数変換装置によれば、再生環境(スピーカ数、スピーカ配置)に応じたダウンミックス係数を番組ごとに算出することができる。
本発明に係る第一実施形態におけるチャンネル数変換装置の一例を示すブロック図である。 本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第一の図である。 本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第一の図である 本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第二の図である。 本発明に係る第一実施形態における上層があるチャンネル配置の一例を示す図である。 本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第二の図である。 本発明に係る第一実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。 本発明に係る第二実施形態におけるチャンネル数変換装置の一例を示すブロック図である。 本発明に係る第二実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
<第一実施形態>
以下、本発明の第一実施形態によるチャンネル数変換装置を図1〜図7を参照して説明する。
図1は、本発明に係る第一実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図1に示すようにチャンネル数変換装置10は、マルチチャンネル音響信号入力部11と、参照信号入力部12と、スピーカ位置情報入力部13と、ダウンミックス信号算出部14と、差分信号算出部15と、ダウンミックス係数更新部16と、ダウンミックス係数記憶部17と、を備えている。
チャンネル数変換装置10は、所定のマルチチャンネル音響信号(Nチャンネル)を、そのマルチチャンネル音響信号のチャンネル数よりも少ないチャンネル数の音響信号(以下、参照信号と呼ぶ)(Sチャンネル)と、マルチチャンネル音響信号のスピーカ位置の情報と、ダウンミックス先のスピーカ位置の情報とに基づいて、所望のチャンネル数の再生用ダウンミックス音響信号(Mチャンネル)に変換する装置である。
以下、所定のマルチチャンネル音響信号として4k/8Kの22.2ch音響システム、参照信号としてステレオ2ch、再生音響信号を7.1chの場合を例に説明を行う。しかし、マルチチャンネル音響信号、参照信号、ダウンミックス信号の各チャンネル数は、この例の数に限らない。また、チャンネル数変換装置10は、コンピュータによって構成されており、例えば、テレビなどの放送受信機やホームシアターなどのメディアの再生装置に組み込まれていてもよい。
図1は、チャンネル数変換装置10にマルチチャンネル音響信号と参照信号を入力し、ダウンミックス信号を出力する構成を示す。チャンネル数変換装置10が出力するダウンミックス信号は、例えば、再生装置に接続したスピーカ等から出力される。このとき、チャンネル数変換装置10は、入力したマルチチャンネル音響信号が作成されたときのスピーカ数およびスピーカ配置によって出力されたときに聴取者が感じる音の印象を、なるべく再現できるようなダウンミックス信号を生成する。チャンネル数変換装置10は、そのようなダウンミックス信号を生成するために、再生環境におけるスピーカの数およびスピーカ配置に応じた適切なダウンミックス係数を算出する。
マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。ここで、マルチチャンネル音響信号は、例えば、放送局から送出された22.2chのマルチチャンネル音響信号とする。
参照信号入力部12は、参照信号を入力する。参照信号は、所望のダウンミックス信号のチャンネル数よりも少ないチャンネル数で制作されたマルチチャンネル音響信号と同一内容の音響信号であり、元のマルチチャンネル音響信号と別途入力される音響信号である。ここで、参照信号は、例えば、マルチチャンネル音響信号と同時に放送されたステレオ2chの音声信号である。また、参照信号は、所定のダウンミックス係数に基づいてマルチチャンネル音響信号からダウンミックスして生成された参照信号であってもよい。
スピーカ位置情報入力部13は、マルチチャンネル音響信号の作成時において、そのマルチチャンネル音響信号に対して定められた複数のスピーカそれぞれの位置情報を取得する。また、スピーカ位置情報入力部13は、ダウンミックス信号の再生環境における一つまたは複数のスピーカそれぞれの位置情報を取得する。ここで、スピーカ位置情報は、例えば、座標情報、極座標情報として与えられる。
ダウンミックス信号算出部14は、第一ダウンミックス信号算出部141と、第二ダウンミックス信号算出部142と、を含む。第一ダウンミックス信号算出部141は、後述するダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)を用いて、チャンネル数Nのマルチチャネル音響信号(N)から所望のチャンネル数Mの第一ダウンミックス信号(M)を算出する。
第二ダウンミックス信号算出部142は、ダウンミックス係数記憶部17が記憶する第二ダウンミックス係数(S×M)を用いて、算出したチャンネル数Mの第一ダウンミックス信号(M)から参照信号と同じチャンネル数Sの第二ダウンミックス信号(S)とを算出する。
差分信号算出部15は、参照信号と第二ダウンミックス信号(S)との差分を算出する。また、差分信号算出部15は、算出した差分が最小かどうか、または、算出した差分が所定の閾値以下かどうかを判定する。差分信号算出部15は、完全に最小値となるまで計算を繰り返さなくても、第一ダウンミックス係数(M×N)と第二ダウンミックス係数(S×M)を更新しても差分の変化が閾値以下となることに基づいて差分が最小となったと判定してもよい。
ダウンミックス係数更新部16は、差分信号算出部15が算出する差分が最小もしくは閾値以下になるように第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)、または、第一ダウンミックス係数(M×N)のみを補正する。ダウンミックス係数更新部16は、補正した第一ダウンミックス係数(M×N)等でダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)等を更新する。なお、後述するように、ダウンミックス係数更新部16は、例えば、マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と、第一ダウンミックス信号(M)に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて第一ダウンミックス係数(M×N)を更新する。
ダウンミックス係数記憶部17は、チャンネル数変換処理に必要な種々のデータを記憶する。まず、ダウンミックス係数記憶部17は、第一ダウンミックス係数(M×N)の初期値、および、第二ダウンミックス係数(S×M)の初期値を記憶する。そして、ダウンミックス信号算出部14は、これらの初期値を用いて第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)の算出を開始する。なお、第一ダウンミックス係数(M×N)初期値、および、第二ダウンミックス係数(S×M)初期値については、例えば乱数を発生させて設定してもよい。または、ダウンミックス前後の各チャンネル位置の角度差や距離差に応じた数値を設定してもよい。また、ダウンミックス係数が規格などで決まっており、チャンネル数変換装置10によって、番組ごとの補正を行う場合は、規格で定められたダウンミックス係数を初期値に用いてもよい。
図2は、本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第一の図である。図2を用いて本実施形態のチャンネル数変換処理の概要を説明する。
図2に示す(M−Ch、・・・、M−Ch)は、Nチャンネルのマルチチャンネル音響信号である。
また、図2に示す行列の第2項目
Figure 2017212547
は、M行N列の第一ダウンミックス係数(M×N)である。第一ダウンミックス信号算出部141は、この第一ダウンミックス係数(M×N)を用いて、マルチチャネル音響信号から所望のチャンネル数Mの第一ダウンミックス信号(M)を算出する。
また、図2に示す行列の第1項目
Figure 2017212547
は、S行M列の第二ダウンミックス係数(S×M)である。第二ダウンミックス信号算出部142は、この第二ダウンミックス係数(S×M)を用いて、第一ダウンミックス信号(M)から参照信号と同じチャンネル数Sの第二ダウンミックス信号(S)を算出する。図2において、(Lt、Rt)は第二ダウンミックス信号(S)である。差分信号算出部15は、第二ダウンミックス信号(S)「(Lt、Rt)」と参照信号「(L、R)」との差分を、それぞれの信号のエネルギー差、二乗平均誤差、1−正規化相互相関係数(1から2つの信号の正規化相互相関係数を減算する)などの方法で算出する。なお、差分の算出方法は、これらの方法に限定されない。
ダウンミックス係数更新部16は、差分信号算出部15が算出する第二ダウンミックス信号(S)と参照信号の差分に基づいて、第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を更新する。ダウンミックス係数更新部16が、差分が小さくなるようにダウンミックス係数を更新するアルゴリズムには、遺伝的アルゴリズム、最急降下法、確率的勾配降下法などを用いることができるが、差分を小さくする方法であれば、他の方法を用いてもよい。
また、ダウンミックス係数更新部16が、ダウンミックス係数を更新する場合、第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)を同時に変化させてもよい。あるいは、ダウンミックス係数更新部16は、第二ダウンミックス係数(S×M)を所定の値に固定した状態で、第一ダウンミックス係数(M×N)だけを変化させてもよい。また、ダウンミックス係数更新部16は、チャンネルの重要度に応じて、重要度の高いチャンネルの音響信号から順にダウンミックス係数を変化させてもよい。チャンネルの重要度は、例えば、前方に位置するスピーカに対応するチャンネルを重要度が高いと設定するなど再生位置によって規定されるほか、ダイアログ音声信号が含まれるチャンネルを重要度が高いと設定するなど音響信号の内容に応じて設定されてもよい。重要度は、メタデータとしてマルチチャンネル音響信号に付加されるほか、別途入力されるか、予め記憶されるか、ユーザによって指定されてもよい。なお、ダイアログ音声信号に含まれる音声は必ずしもダイアログ(対話)の音声に限られない。ナレーションなどの主に人の声で構成される音声信号をダイアログ音声信号としてよい。
ダウンミックス係数更新部16は、第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を用いて再度第二ダウンミックス信号(S)を出力する。ダウンミックス係数更新部16は、差分が最小となるか、差分が予め定められた閾値以下になるまでダウンミックス係数を更新する処理を繰り返す。差分信号算出部15で差分が閾値以下または最小と判定されると、ダウンミックス信号算出部14(第二ダウンミックス信号算出部142)は、最終的に更新された第一ダウンミックス係数(M×N)を用いて元のマルチチャンネル音響信号から所望の第一ダウンミックス信号(M)を算出し、再生装置に出力する。
図3は、本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第一の図である。
図3(a)は、変換前のマルチチャンネル音響信号に含まれる各チャンネルの配置の一例を示している。図3(a)は、22.2chの中層のチャンネル配置の一例を示している。図3(a)において、例えば、チャンネル「FC」はユーザの正面、チャンネル「FL」「FLc」、「FC」、「FRc」、「FR」はユーザの前面に位置している。また、例えば、チャンネル「SiL」はユーザの左側、チャンネル「SiR」はユーザの右側、チャンネル「BC」はユーザの後側に位置するチャンネルである。
図3(b)は、変換後の所望の第一ダウンミックス信号(M)に含まれる各チャンネルの配置の一例を示している。図3(b)は、一例として、7.1chのチャンネル配置の一例を示している。例えば、チャンネル「Cm」はユーザの正面、チャンネル「Lm」、「Cm」、「Rm」はユーザの前面に位置している。これら、正面または前面のチャンネルには高い重要度が設定される場合がある。
図3(c)は、参照信号に含まれる各チャンネルの配置の一例を示している。図3(c)は、一例として、2chのチャンネル配置の一例を示している。
なお、図3(b)、図3(c)に例示するチャンネルは、22.2chの中層の高さに対応するチャンネルである。
本実施形態のチャンネル数変換装置10は、元のマルチチャンネル音響信号が持つ音響の印象をなるべく保持したまま第一ダウンミックス信号(M)を算出する。具体的には、ダウンミックス係数更新部16が、上記の第一ダウンミックス係数(M×N)等の更新処理を繰り返す中で、マルチチャンネル音響信号が持つ音響の印象をできるだけ保持できるような第一ダウンミックス係数(M×N)を算出し、第二ダウンミックス信号(S)と参照信号の差分が収束するように第一ダウンミックス係数(M×N)等を更新する。そのため、チャンネル数変換装置10では、第一ダウンミックス係数(M×N)の算出において、マルチチャンネル音響信号の特徴を保持するための拘束条件が必要となる。例えば、参照信号がモノ信号(1ch)やステレオ信号(2ch)であり、所望のチャンネル数が5.1chや7.1chであった場合、参照信号のチャンネル位置は、所望のチャンネル数のチャンネル配置に完全に包含される。この場合、拘束条件を設定しないと、元のマルチチャンネル音響から所望のチャンネル数に変換するための第一ダウンミックス係数(M×N)は、元のマルチチャンネル音響信号から参照信号と同じチャンネル数のダウンミックス係数と同じになる可能性がある。なぜなら、このような第一ダウンミックス係数(M×N)によって変換した第一ダウンミックス信号(M)を、図3(b)で例示したチャンネルの配置どおりに設置されたスピーカ群を有する再生装置が出力しても、そのとき再生される音は、図3(c)の「Lt」、「Rt」と同じ位置に配置されたチャンネル「Lm」、「Rm」に対応するスピーカだけから出力され、目的とする「マルチチャンネル音響信号が持つ音響の印象を保持した」音とはならないためである。このことからも、元のマルチチャネル音響の特徴をなるべく保持するためには、第一ダウンミックス係数(M×N)の算出に拘束条件が必要である。
次に、図3で例示したチャンネル配置を用いて、拘束条件の一部について説明を行う。図3に例示した各チャンネル数におけるチャンネル配置は、変換前後の各チャンネル数において、略同一の平面上に配置されるチャンネル群を対象としている。例えば、22.2chのマルチチャンネル音響信号では、図3(a)に例示する中層の他、上層、下層が存在し、これらを含めた場合、異なる高さである上層、下層からの変換を考慮しなければならない。図3では、これらの変換については考慮せず、略同一の平面内に配置されるチャンネル間での変換における拘束条件について説明する。
(位置の類似性による拘束条件)
拘束条件は、例えば、元のマルチチャンネル音響のチャンネル位置と所望のダウンミックス先のチャンネル位置の類似度によって規定してもよい。位置の類似度は、例えば、ユーザの聴取位置(図3の場合、円の中心)に対する変換前後のそれぞれのチャンネル位置の間の距離、角度の変化によって定義してもよい。例えば、図3(a)の「FC」と、変換後の図3(b)の「Cm」との位置の類似度は高い(どちらもユーザの正面であって、変換前後で距離、角度が同じ)。このような場合、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Cm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0」と設定することを拘束条件として定めてもよい。
あるいは、この場合のダウンミックス係数が最大となるように拘束条件として定めてもよい。拘束条件で「1.0」と定めた場合には、ダウンミックス係数算出の計算量を減らすことができる。
(ダウンミックスの前後でユーザからの距離が変わらない場合)
また、この例の場合、まず、マルチチャネル音響信号に含まれるチャンネルの音響信号の再生位置の一つである「FC」と、ダウンミックス信号に含まれるチャンネルの音響信号の再生位置の一つである「Cm」とを予め対応付けておく。そして、「FC」から「Cm」へのダウンミックス係数の値を例えば「1.0」と定め、「FC」から他のチャンネルへのダウンミックス係数の値は「0」とすることを拘束条件としてもよい。
また、例えば、図3(a)の「FC」と、変換後の図3(b)の「Lm」、「Rm」との位置の類似度はやや高い(どちらもユーザの前面であって、変換前後でユーザからの距離は変化せず、角度は例えば20度強変化する)。このような場合、位置の類似度に応じて、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Lm」、「Rm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0以下の同じ値」を設定することを拘束条件として定めてもよい。
同様に、例えば、図3(a)の「FC」と、変換後の図3(b)の「Lssm」、「Rssm」との位置の類似度は低い(変換前後でユーザからの距離は変化しないが、角度は110度以上異なる)。このような場合、位置の類似度は低いことに基づいて、チャンネル「FC」に割り当てられた音声信号から、チャンネル「Lssm」、「Rssm」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「0」を設定することを拘束条件として定めてもよい。
また、例えば、図3(a)の「BL」と変換後の図3(b)の「Lrsm」との位置の類似度と、図3(a)の「BR」と変換後の図3(b)の「Rrsm」との位置の類似度とは同程度(どちらもユーザからみて左側または右側の斜め後方から、同じ側の斜め後方に位置するチャンネルへの変換)である。このような場合、位置の類似度が同程度であるため、チャンネル「BL」に割り当てられた音声信号から、チャンネル「Lrsm」に割り当てられる音声信号との変換を行うダウンミックス係数と、チャンネル「BR」に割り当てられた音声信号からチャンネル「Rrsm」に割り当てられる音声信号との変換を行うダウンミックス係数とに、同じ値を設定することを拘束条件として定めてもよい。
また、例えば、図3(a)の「BL」に割り当てられた音声信号から、変換後の図3(b)の「Lssm」、「Lrsm」に割り当てられる音声信号との変換を行うダウンミックス係数については、何れのチャンネルもユーザからの距離は同じとなる。しかしながら、変換前の「BL」の位置(ユーザからの角度)は、「Lrsm」により近く、「Lrsm」に比べれば「Lssm」がより遠いことに基づいて、「Lrsm」へのダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。あるいは、さらに「Lssm」へのダウンミックス係数の値は2番目に大きくなるように拘束条件を定めてもよい。また、円の中心と「BL」の位置を結ぶ線を基準とした、円の中心と「Lssm」および「Lssm」それぞれを結ぶ線がなす開き角度に基づいて、それぞれのダウンミックス係数の値の比が、開き角度の比の逆数となるようにダウンミックス係数を設定することを拘束条件として定めてもよい。
(スピーカを理想的な位置に置けないような場合)
図3は、ダウンミックスの前後でユーザからの距離が変わらない場合を例示している。次に、図4を用いて、ユーザがスピーカなどを設置する部屋のレイアウト等の都合で、あるチャンネルに対応するスピーカを理想的な位置に置けないような場合の例を挙げて拘束条件の説明を行う。
図4は、本発明に係る第一実施形態における同一平面のチャンネル配置の一例を示す第二の図である。
図4(a)は、変換前のマルチチャンネル音響信号におけるチャンネル配置の一例を示している。図4(b)は、変換後の所望の第一ダウンミックス信号(M)におけるチャンネル配置の一例を示している。図4(b)において、チャンネル「Lssm」と「Lrsm」に対応するスピーカの位置は、所定の「Lssm」と「Lrsm」の位置からずれている。この例の場合、「Lssm」のスピーカが、変換前のマルチチャンネル音響信号におけるチャンネル「BL」の位置から距離vの位置に設置され、「Lrsm」のスピーカが、変換前のマルチチャンネル音響信号におけるチャンネル「BL」の位置から距離uの位置に設置されているものとする(v>u)。また、図示するように他のチャンネルから「Lssm」のスピーカ位置は、チャンネル「SiL」から「Lssm」までの距離yよりも離れているものとする。この場合、「SiL」から「Lssm」へのダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。さらに「BL」から「Lrsm」へのダウンミックス係数の値を1番目に大きく、「Lssm」へのダウンミックス係数の値が2番目に大きくなるように拘束条件を定めてもよい。また、距離u、vに基づいて、「BL」から「Lssm」へのダウンミックス係数の値と「BL」から「Lrsm」へのダウンミックス係数の値の比が、v:uとなるようにダウンミックス係数を設定することを拘束条件として定めてもよい。
また、図4(b)において、チャンネル「Cm」に対応するスピーカの位置は、所定の「Cm」の位置から側方に距離wだけずれている。「FC」と「Cm」とを予め対応付け、「FC」から「Cm」へのダウンミックス係数の値を「1.0」、それ以外の他のチャンネルへのダウンミックス係数の値を「0」とする拘束条件の例を上記で説明した。この場合、変換前の「FC」の位置と変換後のwのずれを含む「Cm」の位置との位置の類似度(この場合は距離の差)が所定の範囲内であるときのみ、当該拘束条件を適用してもよい。
なお、家庭でのスピーカ位置の座標情報は、ユーザが、チャンネル数変換装置10に入力してもよい。あるいは、音響再生装置が備える各スピーカ位置を検出する機能を利用して得た座標情報を、音響再生装置がチャンネル数変換装置10に入力してもよい。
(変換前のマルチチャンネル音響信号におけるチャンネル配置の一例)
次に図5を用いて上層から中層への変換におけるダウンミックス係数の拘束条件について説明を行う。
図5は、本発明に係る第一実施形態における上層があるチャンネル配置の一例を示す図である。
図5(a)は、変換前のマルチチャンネル音響信号におけるチャンネル配置の一例を示している。図5(a)に、上層、中層の二層からなるチャンネル配置の一例を示す。図5(a)において、チャンネル「TpFL」は上層のユーザの左斜め前、チャンネル「TpFR」は上層のユーザの右斜め前、チャンネル「TpBL」は上層のユーザの左斜め後、チャンネル「TpBR」は上層のユーザの右斜め後に位置している。図5(b)は、変換後の所望の第一ダウンミックス信号(M)におけるチャンネル配置の一例を示している。図5(c)は、参照信号におけるチャンネル配置の一例を示している。
例えば、図5(a)の「TpFL」と、変換後の図5(b)の「L」との位置の類似度は、どちらもユーザの斜め左前であるが、ユーザからの開き角度が若干変化する。また、「TpFL」は上層にあり「L」は中層に位置するという違いが存在する。従って、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「1.0」または「1.0以下」の値を設定することを拘束条件として定めてもよい。拘束条件で「1.0」と定めた場合には、ダウンミックス係数算出の計算量を減らすことができる。
また、この例の場合、上層の「TpFL」と中層の「TpFL」に対応する位置の近傍に存在する「L」とを予め対応付けておき、「TpFL」から「L」へのダウンミックス係数の値を例えば「1.0」、「TpFL」から他のチャンネルへのダウンミックス係数の値を「0」とすることを拘束条件としてもよい。
また、例えば、図5(a)の「TpFL」と、変換後の図5(b)の「Ls」、「Rs」との位置の類似度は低い(変換前後でユーザからの距離が遠ざかる関係にあり、角度も大きく異なり、さらに上層と中層の違いがある)。このような場合、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「Ls」、「Rs」に割り当てられる音声信号との変換を行うダウンミックス係数には、例えば、「0」を設定することを拘束条件として定めてもよい。
また、例えば、図5(a)の「TpFL」と変換後の図5(b)の「L」との位置の類似度と、図5(a)の「TpFR」と変換後の図5(b)の「R」との位置の類似度とは同程度である。このような場合、同一平面上でのダウンミックス係数と同様、チャンネル「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数と、チャンネル「TpFR」に割り当てられた音声信号から、チャンネル「R」に割り当てられる音声信号との変換を行うダウンミックス係数とに、同じ値を設定することを拘束条件として定めてもよい。
また、例えば、図5(a)の「TpFL」と図5(b)の「L」の距離、図5(a)の「TpFL」と図5(b)の「C」の距離に基づいて、「TpFL」は「L」により近いことから、「TpFL」に割り当てられた音声信号から「L」に割り当てられる音声信号への変換を行うダウンミックス係数の値が最大となるように設定することを拘束条件として定めてもよい。
このように、変換元のマルチチャンネル音響信号のチャンネル位置とダウンミックス先のチャンネル位置との距離または開き角を算出し、最も近傍のチャンネル位置へのダウンミックス係数を最大となることを拘束条件とすることで、元のマルチチャンネル音響信号の特徴を保持できるダウンミックス係数を算出することが可能となる。
(聞きやすさによる拘束条件)
図3、図5に戻り、他の拘束条件の他の例について説明する。拘束条件は、音の聞きやすさの観点によって規定されてもよい。例えば、後方、側方にあるチャンネルが前方にあるチャンネルにダウンミックスされるとき、前方のチャンネルに割り当てられたダイアログ音声信号などの音声が聞きにくくなる可能性がある。そのような場合に聞きやすさを担保するために、後方、側方のうち少なくとも一方に位置するチャンネルに割り当てられた音声信号から前方のチャンネルに割り当てられる音声信号へのダウンミックス係数に「1.0」よりも小さい補正値を乗じることを拘束条件として定めてもよい。
同様に、上層か下層、もしくはその両方のチャンネルから中層のチャンネルへダウンミックスする場合に、上層、下層の音によって中層の音が聞き取りにくくなる可能性がある。従って、上層か下層、もしくはその両方のチャンネルから中層のチャンネルへのダウンミックス係数に1.0よりも小さい補正値を用いることを拘束条件として加えてもよい。
また、チャンネル配置は通常左右対称であるが、左右から聞こえてくる音の大きさのバランスが変化すると、マルチチャンネル音響信号を再生した場合の印象から大きく変わってしまう可能性がある。従って、左右対称な位置に配置されたチャンネルから対応する左右対称な位置に配置されたチャンネルへのダウンミックス係数を算出するにあたり、元のマルチチャネル音響信号に含まれる左右対称な位置に配置されたチャンネルから対応する左右対称な位置に配置されたチャンネルへのダウンミックス係数に同じ数値を用いることを拘束条件として加えてもよい。
前方からのダイアログ音声信号を強調した方が聞き取りやすい場合の例のように、ダウンミックス信号の特徴が、元のマルチチャンネル音響の特徴とは完全に一致しないことが望ましい場合がある。聞きやすさによる拘束条件を適用することで、ユーザの聞きやすさを確保することができる。
(重要度による拘束条件)
次に、重要度による拘束条件について説明する。拘束条件は、重要度の観点によって規定されてもよい。例えば、報道番組の場合、アナウンサー等によるダイアログ音声信号が最も重要となる。このような場合、例えば前面に位置するチャンネル(例えば、図5の「L」、「C」、「R」)に対して、これらはダイアログ音声信号に対応するチャンネルであるとして、高い重要度が設定されてもよい。重要度は、例えばマルチチャンネル音響信号のメタデータとして入力される。あるいは、ユーザが入力することでダウンミックス係数更新部16に設定されてもよい。
この場合、例えば、「FL」から「L」、「FC」から「C」、「FR」から「R」へのダウンミックス係数に最大の値を設定することを拘束条件として加えてもよい。
重要度による拘束条件を適用することによって、特定の音響信号の印象を強調するようにダウンミックスすることができる。
なお、上記した拘束条件は、第一ダウンミックス係数(M×N)の算出時だけでなく、第二ダウンミックス係数(S×M)の算出時にも適用してよい。また、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値の各要素の値について、拘束条件によってダウンミックス係数の値を「1.0」とすると予め定められているような場合、そのチャンネル間のダウンミックス係数に対応する要素には、初期値の段階で「1.0」が設定されていてもよい。また、拘束条件によって値が「1.0」等と定められていない場合でも、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値の各要素の値には、上記した位置の類似性等に基づく拘束条件が考慮されて予め定められた値が設定されていてもよい。
次に図6を用いて、これらの拘束条件を課したうえで算出された第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)の一例を説明する。
図6は、本発明に係る第一実施形態におけるダウンミックス係数の一例を示す第二の図である。
図6に例示する第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)は、ダウンミックス係数更新部16が、拘束条件を満たすようにして算出したものである。
図6の上図は、図5(a)で例示したマルチチャンネル音響信号に含まれる各チャンネル信号から、図5(b)で例示した所望の第一ダウンミックス信号(M)に含まれる各チャンネル信号への第一ダウンミックス係数(M×N)の一例を示している。例えば、「L」と「R」、「FL」と「FR」は左右対称の位置に配置されている。従って、「FL」に割り当てられた音声信号からチャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数と、「FR」に割り当てられた音声信号からチャンネル「R」に割り当てられる音声信号との変換を行うダウンミックス係数には同じ値「C1」が設定されている。また、また、「FL」と「L」はほぼ同じ位置に配置されている。同様に「FR」と「R」はほぼ同じ位置に配置されている。従って、「C1」の大きさは例えば「1.0」であってもよい。また、例えば、「TpFL」に割り当てられた音声信号から、チャンネル「L」に割り当てられる音声信号との変換を行うダウンミックス係数「k1C1」の「k1」は、上層から中層のチャンネルへのダウンミックス係数に乗じる補正値の例である。ここで、k1は1よりも小さい値である。また、「SiL」と「L」の距離、「SiL」と「Ls」の距離を比べると、「SiL」と「Ls」の距離の方が短い。従って、「SiL」から「Ls」へのダウンミックス係数により大きな値が設定される(C4≧C3)。同様に、「BL」と「Ls」の距離、「BR」と「Ls」の距離を比べると、「BL」と「Ls」の距離の方が短い。従って、「BL」と「BR」とでは、「BL」から「Ls」へのダウンミックス係数により大きな値が設定される(C5≧C6)。また、上層の「TpBL」、「TpBR」に割り当てられた音声信号から、チャンネル「Ls」に割り当てられる音声信号との変換を行うダウンミックス係数には、上層から中層のチャンネルへのダウンミックス係数に用いる補正値「k1」が含まれている。
図6の下図は、図5(b)で例示した所望の第一ダウンミックス信号(M)における各チャンネル信号から図5(c)で例示した参照信号への第二ダウンミックス係数(S×M)の一例を示している。上記の拘束条件は、第二ダウンミックス係数(S×M)に適用することも可能である。例えば、k2は、後方のチャンネルから前方のチャンネルへのダウンミックス係数に用いる補正値である。また、「Lt」は「C」よりも「L」により近い為、「L」から「Lt」へのダウンミックス係数により大きな値が設定される(Ct1>Ct2)。
図7は、本発明に係る第一実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
図7を用いて本実施形態のチャンネル数変換処理の流れを説明する。
前提として、マルチミックス音響信号の各チャンネルの位置情報(座標情報)、所望のダウンミックス信号の再生環境におけるスピーカの数および各スピーカの位置情報は、予めチャンネル数変換装置10に入力され、スピーカ位置情報入力部13がこれらの情報の入力を受け付けている。また、スピーカ位置情報入力部13は、マルチミックス音響信号の各チャンネルの位置情報と再生環境における各スピーカの位置情報とをダウンミックス係数更新部16に出力している。また、ダウンミックス係数更新部16には、ダウンミックス係数算出における種々の拘束条件が設定されている。また、ダウンミックス係数記憶部17は、第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値を記憶している。
まず、ステップS11で、参照信号入力部12は、参照信号を入力する。参照信号入力部12は、入力した参照信号を差分信号算出部15に出力する。また、ステップS11と並行して、ステップS12で、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。続いて、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号をダウンミックス信号算出部14に出力する。
次に、ステップS13で、ダウンミックス信号算出部14では、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を算出する。具体的には、第一ダウンミックス信号算出部141は、ダウンミックス係数記憶部17から第一ダウンミックス係数(M×N)の初期値を読み出して取得し、この初期値でマルチチャンネル音響信号をダウンミックスして第一ダウンミックス信号(M)を算出する。続いて、第一ダウンミックス信号算出部141は、第一ダウンミックス信号(M)を第二ダウンミックス信号算出部142に出力する。
次に、ステップS14で、第二ダウンミックス信号算出部142が第二ダウンミックス信号(S)を算出する。具体的には、第二ダウンミックス信号算出部142は、ダウンミックス係数記憶部17から第二ダウンミックス係数(S×M)の初期値を読み出して取得し、この初期値で第一ダウンミックス信号(M)をダウンミックスして第二ダウンミックス信号(S)を算出する。第二ダウンミックス信号算出部142は、ダウンミックス信号(S)を差分信号算出部15へ出力する。
次に、ステップS15で、差分信号算出部15は、第二ダウンミックス信号(S)と参照信号の差分を算出する。差分の算出には、2つの信号のエネルギー差、二乗平均誤差、1−正規化相互相関係数などの方法を用いてもよい。
次に、ステップS16で、差分信号算出部15は、差分が所定の閾値以下かどうかを判定する。あるいは、差分信号算出部15は、差分が最小となったかどうかを判定してもよい。差分が閾値以下の場合(差分が最小となった場合)、第一ダウンミックス信号算出部141は、ステップS13で第一ダウンミックス係数(M×N)によって、マルチチャンネル音響信号をダウンミックスして生成した第一ダウンミックス信号(M)を再生装置へ出力する。
差分が閾値より大きい場合(差分が最小ではない場合)、差分信号算出部15は、算出した差分をダウンミックス係数更新部16に出力する。
次に、ステップS17で、ダウンミックス係数更新部16は、ダウンミックス係数を更新する。ダウンミックス係数更新部16は、図3〜図6を用いて説明した拘束条件を満たしつつ、差分を小さくする第一ダウンミックス係数(M×N)および第二ダウンミックス係数(S×M)を算出する。
または、ダウンミックス係数更新部16は、第二ダウンミックス係数(S×M)が固定されている場合、第一ダウンミックス係数(M×N)のみを算出する。なお、第一ダウンミックス係数(M×N)等の算出には、遺伝的アルゴリズム、最急降下法、確率的勾配降下法などを用いてもよい。ダウンミックス係数更新部16は、第一ダウンミックス係数(M×N)等を算出すると、算出した新たな第一ダウンミックス係数(M×N)等をダウンミックス係数記憶部17に記録する。そして、差分が閾値以下となるまで、ステップS13からの処理を繰り返す。
なお、2回目以降のステップS13、及びステップS14の処理では、ダウンミックス係数記憶部17が記憶する第一ダウンミックス係数(M×N)の初期値、第二ダウンミックス係数(S×M)の初期値を用いるのではなく、ステップS17でダウンミックス係数更新部16が算出し、ダウンミックス係数記憶部17に記録した第一ダウンミックス係数(M×N)、第二ダウンミックス係数(S×M)を用いる。
地上デジタル放送において基本の音声フォーマットはステレオ2chであり、一方、BSデジタル放送については、ステレオ2chまたは5.1chサラウンド放送である。4K/8K放送では、22.2chマルチチャンネル音響と同時にステレオ2ch用の音声信号(参照信号)のいわゆるサイマル放送が検討されている。
そこで、本実施形態では、マルチチャンネル音響信号から再生環境のスピーカ配置に対応する第一ダウンミックス信号(M)と、再生環境のスピーカ配置に対応する参照信号と同じチャンネル数の第二ダウンミックス信号(S)とをダウンミックス係数の初期値を用いて作成する。そして、ステレオ2ch用の音声信号とダウンミックス信号(S)との差が最小となるようにダウンミックス係数を最適化する。
このとき、元のマルチチャンネル音響信号と所望の第一ダウンミックス信号(M)との変換について、スピーカ位置に応じた拘束条件を加えることで、元のマルチチャンネル音響の印象をなるべく保持した第一ダウンミックス信号(M)を実現する第一ダウンミックス係数(M×N)が算出できる。また、放送された番組製作者の意図が反映されたステレオ2chによる音声信号を参照することで、より番組製作者の意図に沿った第一ダウンミックス信号(M)を実現する第一ダウンミックス係数(M×N)が算出できる。
<第二実施形態>
以下、本発明の第二実施形態によるチャンネル数変換装置を、図8〜図9を参照して説明する。
図8は、本発明に係る第二実施形態におけるチャンネル数変換装置の一例を示すブロック図である。
図8に示すようにチャンネル数変換装置10aは、マルチチャンネル音響信号入力部11と、スピーカ位置情報入力部13と、ダウンミックス信号算出部14と、差分信号算出部15と、ダウンミックス係数更新部16と、ダウンミックス係数記憶部17と、参照信号算出部18と、を備えている。つまり、第二実施形態によるチャンネル数変換装置10aは、第一実施形態の参照信号入力部12に代えて参照信号算出部18を備えている。他の構成は、第一実施形態と同様である。
参照信号算出部18は、所定のダウンミックス係数を用いて、マルチチャンネル音響信号をダウンミックスして例えば2chステレオの参照信号を算出する。
第一実施形態では、マルチチャンネル音響信号と同時にステレオ2chの音声信号(参照信号)が放送される場合を前提とした。しかし、マルチチャンネル音響信号に対応する参照信号が常に得られるとは限らない。例えば、マルチチャンネル音響信号に付加されるメタデータとして参照信号へのダウンミックス係数が送出される場合がある。そこで、第二実施形態では、参照信号算出部18が、入力したマルチチャンネル音響信号から参照信号を算出する。
次に図9を用いて本実施形態のチャンネル数変換処理の流れを説明する。
図9は、本発明に係る第二実施形態におけるチャンネル数変換処理の一例を示すフローチャートである。
前提として、参照信号算出部18には、予めマルチチャンネル音響信号をステレオ2ch音声信号(参照信号)にダウンミックスするダウンミックス係数(参照ダウンミックス係数と呼ぶ)が設定されているとする。他の前提条件は第一実施形態と同様である。また、図7と同様の処理については簡単に説明する。
まず、ステップS12で、マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を入力する。マルチチャンネル音響信号入力部11は、マルチチャンネル音響信号を、参照信号算出部18、ダウンミックス信号算出部14に出力する。
ステップS121で、参照信号算出部18は、参照ダウンミックス係数によってマルチチャンネル音響信号をダウンミックスして参照信号を算出する。参照信号算出部18は、算出した参照信号を差分信号算出部15に出力する。以下の処理については第一実施形態と同様である。
つまり、次に、ステップS13で、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を算出し、ステップS14で、第二ダウンミックス信号算出部142が第二ダウンミックス信号(S)を算出する。
次に、ステップS15で、差分信号算出部15は、第二ダウンミックス信号算出部142が算出した第二ダウンミックス信号(S)と参照信号算出部18が算出した参照信号の差分を算出する。次に、ステップS16で、差分信号算出部15は、差分が所定の閾値以下かどうかを判定し、差分が閾値以下の場合、第一ダウンミックス信号算出部141が第一ダウンミックス信号(M)を再生装置へ出力する。
また、差分が閾値より大きい場合、ステップS17で、ダウンミックス係数更新部16は、ダウンミックス係数を更新し、差分が閾値より小さくなるまで、ステップS13からの処理を繰り返す。
本実施形態によれば、ステレオ2chが同時に放送されない場合でも、マルチチャンネル音響方式からステレオ2chなどの既存のチャンネル数への最適化されたダウンミックス係数(例えば、最適化されたダウンミックス係数がマルチチャンネル音響信号にメタデータとして付加されてもよい)によってダウンミックスされた信号を参照信号の代わりに用いる。これにより、第一実施形態と同様の手順で、マルチチャンネル音響信号の制作時のスピーカ数、スピーカ配置で再生されたときの音の印象をなるべく保持しつつ、再生装置のスピーカ数およびスピーカ配置に応じた第一ダウンミックス係数(M×N)を、番組ごとに算出することができる。
なお、上述のチャンネル数変換装置10、10aは、内部にコンピュータシステムを有している。そして、チャンネル数変換装置10等の動作の過程は、プログラムの形式でコンピュータ読み取り可能な記録媒体に記憶されており、このプログラムをコンピュータシステムが読み出して実行することによって、上記処理が行われる。ここでいうコンピュータシステムとは、CPU及び各種メモリやOS、周辺機器等のハードウェアを含むものである。
また、「コンピュータシステム」は、WWWシステムを利用している場合であれば、ホームページ提供環境(あるいは表示環境)も含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
その他、本発明の趣旨を逸脱しない範囲で、上記した実施の形態における構成要素を周知の構成要素に置き換えることは適宜可能である。また、この発明の技術範囲は上記の実施形態に限られるものではなく、本発明の趣旨を逸脱しない範囲において種々の変更を加えることが可能である。
なお、第一ダウンミックス係数(M×N)、第一ダウンミックス係数(M×N)の初期値は、第一ダウンミックス係数の一例である。第二ダウンミックス係数(S×M)、第二ダウンミックス係数(S×M)の初期値は、第二ダウンミックス係数の一例である。また、第一ダウンミックス信号(M)は第一ダウンミックス信号の一例、第二ダウンミックス信号(S)は第二ダウンミックス信号の一例である。
10、10a・・・チャンネル数変換装置
11・・・マルチチャンネル音響信号入力部
12・・・参照信号入力部
13・・・スピーカ位置情報入力部
14・・・ダウンミックス信号算出部
141・・・第一ダウンミックス信号算出部
142・・・第二ダウンミックス信号算出部
15・・・差分信号算出部
16・・・ダウンミックス係数更新部
17・・・ダウンミックス係数記憶部
18・・・参照信号算出部

Claims (11)

  1. 第一ダウンミックス係数を用いてマルチチャネル音響信号から所望の第一ダウンミックス信号を算出し、第二ダウンミックス係数を用いて前記第一ダウンミックス信号から参照信号と同じチャンネル数の第二ダウンミックス信号を算出するダウンミックス信号算出部と、
    前記第二ダウンミックス信号と参照信号との差分を算出する差分信号算出部と、
    前記差分信号算出部が算出した差分が、最小または所定の閾値以下となるように、前記第一ダウンミックス係数および第二ダウンミックス係数を更新するダウンミックス係数更新部と、
    を備えることを特徴とするチャンネル数変換装置。
  2. 前記マルチチャネル音響信号を所定のダウンミックス係数を用いてダウンミックスし、前記参照信号を算出する参照信号算出部、
    をさらに備えることを特徴とする請求項1に記載のチャンネル数変換装置。
  3. 請求項1または請求項2に記載のチャンネル数変換装置において、
    前記ダウンミックス係数更新部は、前記第二ダウンミックス係数を固定して、前記第一ダウンミックス係数のみを更新する、
    ことを特徴とするチャンネル数変換装置。
  4. 請求項1から請求項3の何れか1項に記載のチャンネル数変換装置において、
    前記第一ダウンミックス係数の初期値と前記第二ダウンミックス係数の初期値とのうち少なくとも一方を記憶するダウンミックス係数記憶部、
    をさらに備えることを特徴とするチャンネル数変換装置。
  5. 請求項4に記載のチャンネル数変換装置において、
    前記ダウンミックス係数記憶部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第一ダウンミックス係数を記憶する、
    ことを特徴とするチャンネル数変換装置。
  6. 請求項4または請求項5に記載のチャンネル数変換装置において、
    前記ダウンミックス係数記憶部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置関係に基づいて定められた初期値を有する前記第二ダウンミックス係数を記憶する、
    ことを特徴とするチャンネル数変換装置。
  7. 請求項1から請求項6の何れか1項に記載のチャンネル数変換装置において、
    前記ダウンミックス係数更新部は、前記マルチチャネル音響信号に含まれる各チャンネルの音響信号の再生位置と前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第一ダウンミックス係数を更新する、
    ことを特徴とするチャンネル数変換装置。
  8. 請求項7に記載のチャンネル数変換装置において、
    前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第一ダウンミックス係数を更新する、
    ことを特徴とするチャンネル数変換装置。
  9. 請求項1から請求項8の何れか1項に記載のチャンネル数変換装置において、
    前記ダウンミックス係数更新部は、前記第一ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置と前記第二ダウンミックス信号に含まれる各チャンネルの音響信号の再生位置との位置の類似度によって定められた拘束条件に基づいて、前記第二ダウンミックス係数を更新する、
    ことを特徴とするチャンネル数変換装置。
  10. 請求項9に記載のチャンネル数変換装置において、
    前記ダウンミックス係数更新部は、前記位置の類似度が最も高いチャンネル間のダウンミックス係数の値が最大となることを拘束条件として、前記第二ダウンミックス係数を更新する、
    ことを特徴とするチャンネル数変換装置。
  11. コンピュータを、請求項1から請求項10の何れか1項に記載のチャンネル数変換装置、として機能させるためのプログラム。
JP2016103594A 2016-05-24 2016-05-24 チャンネル数変換装置およびそのプログラム Expired - Fee Related JP6694755B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016103594A JP6694755B2 (ja) 2016-05-24 2016-05-24 チャンネル数変換装置およびそのプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016103594A JP6694755B2 (ja) 2016-05-24 2016-05-24 チャンネル数変換装置およびそのプログラム

Publications (2)

Publication Number Publication Date
JP2017212547A true JP2017212547A (ja) 2017-11-30
JP6694755B2 JP6694755B2 (ja) 2020-05-20

Family

ID=60476911

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016103594A Expired - Fee Related JP6694755B2 (ja) 2016-05-24 2016-05-24 チャンネル数変換装置およびそのプログラム

Country Status (1)

Country Link
JP (1) JP6694755B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019186888A (ja) * 2018-04-17 2019-10-24 シャープ株式会社 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019186888A (ja) * 2018-04-17 2019-10-24 シャープ株式会社 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体
JP7107727B2 (ja) 2018-04-17 2022-07-27 シャープ株式会社 音声処理装置、音声処理方法、プログラム、及び、プログラムの記録媒体

Also Published As

Publication number Publication date
JP6694755B2 (ja) 2020-05-20

Similar Documents

Publication Publication Date Title
JP6676801B2 (ja) マルチチャンネル音声コンテンツを表すビットストリームを生成する方法、およびデバイス
KR101673834B1 (ko) 협업 사운드 시스템
CN101009952B (zh) 基于扬声器和听者的位置的有源音频矩阵解码方法和装置
RU2682864C1 (ru) Устройство и способ обработки аудиоданных, и его программа
CN104429102B (zh) 使用3d音频分层译码的扩音器位置补偿
TWI489887B (zh) 用於喇叭或耳機播放之虛擬音訊處理技術
US8422688B2 (en) Method and an apparatus of decoding an audio signal
JP6968376B2 (ja) ステレオ仮想バス拡張
JP5496235B2 (ja) 多重オーディオチャンネル群の再現の向上
WO2018096954A1 (ja) 再生装置、再生方法、情報処理装置、情報処理方法、およびプログラム
JP5417227B2 (ja) マルチチャンネル音響信号のダウンミックス装置及びプログラム
KR102527336B1 (ko) 가상 공간에서 사용자의 이동에 따른 오디오 신호 재생 방법 및 장치
JP6694755B2 (ja) チャンネル数変換装置およびそのプログラム
WO2021140959A1 (ja) 符号化装置および方法、復号装置および方法、並びにプログラム
JP7517500B2 (ja) 再生装置、再生方法、およびプログラム
JP6684651B2 (ja) チャンネル数変換装置およびそのプログラム
JP6832095B2 (ja) チャンネル数変換装置およびそのプログラム
WO2017188141A1 (ja) オーディオ信号処理装置、オーディオ信号処理方法、およびオーディオ信号処理プログラム
RU2384973C1 (ru) Устройство и способ синтезирования трех выходных каналов, используя два входных канала
KR20110102719A (ko) 오디오 업믹싱 장치 및 방법

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20200129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200312

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200324

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200420

R150 Certificate of patent or registration of utility model

Ref document number: 6694755

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees