JP2017212732A - チャンネル数変換装置およびプログラム - Google Patents

チャンネル数変換装置およびプログラム Download PDF

Info

Publication number
JP2017212732A
JP2017212732A JP2017097434A JP2017097434A JP2017212732A JP 2017212732 A JP2017212732 A JP 2017212732A JP 2017097434 A JP2017097434 A JP 2017097434A JP 2017097434 A JP2017097434 A JP 2017097434A JP 2017212732 A JP2017212732 A JP 2017212732A
Authority
JP
Japan
Prior art keywords
audio signal
dialog
channel audio
conversion
channel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017097434A
Other languages
English (en)
Inventor
一穂 小野
Kazuo Ono
一穂 小野
小森 智康
Tomoyasu Komori
智康 小森
陽 佐々木
Akira Sasaki
陽 佐々木
大出 訓史
Norifumi Oide
訓史 大出
岳大 杉本
Takehiro Sugimoto
岳大 杉本
北島 周
Shu Kitajima
周 北島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK, Japan Broadcasting Corp filed Critical Nippon Hoso Kyokai NHK
Publication of JP2017212732A publication Critical patent/JP2017212732A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

【課題】チャンネル数の変換後にも聴き取りやすい音声信号を出力するチャンネル数変換装置およびプログラムを提供する。
【解決手段】フォーマット変換部が、変換前マルチチャンネルオーディオ信号のフォーマットを変換し、変換前マルチチャンネルオーディオ信号とは異なるフォーマットを有する変換後マルチチャンネルオーディオ信号を出力する。第1分析部および第2分析部は、それぞれ、変換前後のマルチチャンネルオーディオ信号に基づいて、信号に含まれるダイアログの聴き取りやすさの指標を求める。改善部は、第1分析部および第2分析部によって求められた指標に基づいて、変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比、またはチャンネル割当を変更する。
【選択図】図1

Description

本発明は、チャンネル数変換装置およびプログラムに関する。
近年、マルチチャンネルオーディオが隆興している。マルチチャンネルオーディオには、8Kスーパーハイビジョン22.2マルチチャンネル音響をはじめとして、13.1や11.1など様々なフォーマットが存在している。マルチチャンネルオーディオのさらなる普及のためには、これらのフォーマット間での互換性の確保や、相互変換技術の確立が求められている。
これらのフォーマット間での相互変換は、一般にレンダリング技術に属し、これまで様々な方式が検討されてきた。
その代表例は、固定のダウンミックス係数によるもので、チャンネル間の信号が無相関であることを仮定し、各チャンネルの再生音圧が変換前後で変化しないようにする方式である。非特許文献1には、固定のダウンミックス係数を用いたフォーマット変換について記載されている。
また、信号の相互相関を分析しチャンネル数変換の際に相関に応じて振幅を調整したり、信号の位相関係を分析してチャンネル数変換の際に各チャンネルの位相関係をそろえてからミックスして振幅調整したりする方法も提案されている。非特許文献2には、そのようなダウンミックスの方法が記載されている。
「デジタル放送における映像符号化、音声符号化及び多重化方式 標準規格 ARIB STD−B32 3.5版」,一般社団法人電波産業会,2015年(平成27年)12月3日 J. Vilkamo et al., "Reduction of Spectral Artifacts in Multichannel Downmixing with Adaptive Phase Alignment", Journal of the Audio Engineering Society, Vol. 62, No. 7/8, pp. 516-526 (2014).
非特許文献1などに記載された、固定のダウンミックス係数を用いる方法は、シンプルでわかりやすい。しかしながら、マルチチャンネルオーディオでは、チャンネル間の信号に相関を持つ場合が少なくなく、この場合、変換で生じるチャンネル間信号の加算時に、相関を持つ成分のみ、信号のレベルが上昇して、音のバランスを崩すことが問題となり得る。
また、従来技術によるダウンミックス方法で、信号の相関を解析しない方法は、信号の種類により周波数特性やレベルの変化が顕著であることが問題となり得る。
また、従来技術によるダウンミックス方法で、非特許文献2などに記載された方法のように信号の相関を見る手法では、周波数特性やレベル変化の補償が可能である。しかしながら、マスキングなどの聴覚特性が反映されないことなどが問題となり得る。
特に、チャンネル数の変換の結果として、ダイアログが聴き取りにくくなることが問題視されている。
本発明は、上記の課題認識に基づいて行なわれたものであり、チャンネル数の変換後にも聴き取りやすい音声信号を出力するチャンネル数変換装置およびプログラムを提供することを目的とする。
[1]上記の課題を解決するため、本発明の一態様によるチャンネル数変換装置は、入力される変換前マルチチャンネルオーディオ信号のフォーマットを変換し、前記変換前マルチチャンネルオーディオ信号とは異なるフォーマットを有する変換後マルチチャンネルオーディオ信号を出力するフォーマット変換部と、前記変換前マルチチャンネルオーディオ信号に基づいて、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第1分析部と、前記変換後マルチチャンネルオーディオ信号に基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第2分析部と、前記第1分析部によって求められた前記変換前マルチチャンネルオーディオ信号の聴き取りやすさの指標と、前記第2分析部によって求められた前記変換後マルチチャンネルオーディオ信号の聴き取りやすさの指標とに基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比を補正する改善部と、を具備することを特徴とする。
[2]また、本発明の一態様によるチャンネル数変換装置は、入力される変換前マルチチャンネルオーディオ信号のフォーマットを変換し、前記変換前マルチチャンネルオーディオ信号とは異なるフォーマットを有する変換後マルチチャンネルオーディオ信号を出力するフォーマット変換部と、前記変換前マルチチャンネルオーディオ信号に基づいて、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第1分析部と、前記変換後マルチチャンネルオーディオ信号に基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第2分析部と、前記第1分析部によって求められた前記変換前マルチチャンネルオーディオ信号の聴き取りやすさの指標と、前記第2分析部によって求められた前記変換後マルチチャンネルオーディオ信号の聴き取りやすさの指標とに基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログおよび背景音のチャンネル割当を変更する改善部と、を具備することを特徴とする。
[3]また、本発明の一態様は、上記のチャンネル数変換装置において、前記改善部は、さらに、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比を補正する、ことを特徴とする。
[4]また、本発明の一態様は、上記のチャンネル数変換装置において、前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差とを求め、前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差とを求める、ことを特徴とする。
[5]また、本発明の一態様は、上記のチャンネル数変換装置において、前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差との、それぞれに所定の重み付けをした線形和を求め、前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差との、それぞれに所定の重み付けをした線形和を求める、ことを特徴とする。
[6]また、本発明の一態様は、上記のチャンネル数変換装置において、前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音のエネルギー重心の上下方向の空間的な重なり度合いを求め、前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音のエネルギー重心の上下方向の空間的な重なり度合いを求める、ことを特徴とする。
[7]また、本発明の一態様は、上記のチャンネル数変換装置において、前記第1分析部は、周波数成分ごとに、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求め、前記第2分析部は、周波数成分ごとに、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求め、前記改善部は、当該周波数成分ごとに前記変換後マルチチャンネルオーディオ信号を改善する、ことを特徴とする。
[8]また、本発明の一態様は、コンピューターを、上記の[1]から[7]までのいずれかに記載のチャンネル数変換装置、として機能させるためのプログラムである。
本発明によれば、マルチチャンネルオーディオの異なるフォーマット間の変換を、ダイアログと背景音のレベルバランスや両耳のマスキング効果を考慮しながら、高品質に行うこと可能となる。
本発明の実施形態によるチャンネル数変換装置の概略機能構成を示すブロック図である。 同実施形態においてオーディビリティを分析するための分析部の概略機能構成を示すブロック図である。 同実施形態において使用される両耳マスキングレベル差関数の例を示すグラフである。 同実施形態による分析部が算出する、SN比と両耳マスキングレベル差とオーディビリティ係数との関係を表したグラフである。 同実施形態による分析部によって、SN比および両耳マスキングレベル差の線形和として算出されるオーディビリティ係数のグラフである。 同実施形態によるチャンネル数変換処理の手順を示すフローチャートである。 同実施形態の変形例おける、オーディビリティを分析するための分析部の概略機能構成を示すブロック図である。
次に、本発明の一実施形態について、図面を参照しながら説明する。
チャンネル数変換装置1は、マルチチャンネルオーディオ信号を入力する。マルチチャンネルオーディオ信号を、以下では、「MCA信号」と略称する場合がある。なお、MCA信号のフォーマットに特に限定はなく、任意である。
図1は、本実施形態によるチャンネル数変換装置の概略機能構成を示すブロック図である。図示するように、チャンネル数変換装置1は、変換前MCA信号取得部11と、信号分離部12と、分析部13(第1分析部)と、フォーマット変換部20と、変換後MCA信号取得部21と、信号分離部22と、分析部23(第2分析部)と、改善部31とを含んで構成される。
チャンネル数変換装置1は、変換前MCA信号取得部11が、入力されるMCA信号(フォーマット変換前)を取得し、フォーマット変換部20が、変換前MCA信号のフォーマットを変換し、変換前MCA信号とは異なるフォーマットを有する変換後MCA信号を出力する。第1分析部13および第2分析部23が、それぞれ、変換前後のMCA信号に基づいて、信号に含まれるダイアログの聴き取りやすさの指標を求め、第1分析部13および第2分析部23によって求められた指標に基づいて、改善部が、変換後MCA信号に含まれるダイアログと背景音とのレベル比、またはチャンネル割当を変更(補正)する。
変換前MCA信号取得部11は、チャンネル数変換のために入力されるMCA信号(フォーマット変換前)を取得する。
信号分離部12は、変換前MCA信号取得部11が取得した、フォーマット変換前のMCA信号をダイアログ信号と背景音信号とに分離する。信号分離部12は、分離して得られるダイアログ信号と背景音信号とを出力し、分析部13に出力する。ここで、ダイアログと背景音との分離に用いるアルゴリズムは、例えば、既存技術による任意の手法を用いて、MCA信号から背景音信号のみ抽出することが可能である。なお、オブジェクト音響システムの場合や、もしくはチャンネルごとにダイアログと背景音がチャンネル別に録音されている場合などでは、信号分離部12を通さずにダイアログと背景音とを分離してもよい。
分析部13は、信号分離部12から渡される、フォーマット変換前のダイアログ信号および背景音信号を分析し、そのオーディビリティの情報を出力する。言い換えれば、分析部13は、変換前MCA信号に基づいて、変換前MCA信号に含まれるダイアログの聴き取りやすさの指標を求める。ここで、聴き取りやすさの指標とは、ダイアログを信号として背景音を雑音としたときのSN比(両信号のレベル比)や、両耳マスキングレベル差(両耳マスキングレベル比)や、ダイアログ信号と背景音信号の各重心の上下方向の差(重なり具合)である。また、これらの指標に基づいて定義されるオーディビリティ係数を指標としてもよい。オーディビリティ係数の一例としては、上記のSN比や、両耳マスキングレベル差や、ダイアログ信号と背景音信号の各重心の上下方向の差(重なり具合)に関して、所定の重み付けにより線形和を取ったものを用いることができる。
これらの指標の詳細については、後で説明する。
なお、上の説明において、両耳マスキングレベル比の対数を取ったものが、両耳マスキングレベル差である。
フォーマット変換部20は、変換前MCA信号取得部11から渡されるMCA信号のフォーマットを変換し、変換後のMCA信号を変換後MCA信号取得部21に渡す。
すなわち、入力される変換前MCA信号のフォーマットを変換し、変換前MCA信号とは異なるフォーマットを有する変換後MCA信号を出力する。ここで「フォーマット」とは、MCA信号のチャンネル数や、各チャンネルの方向の配置等を意味する。各チャンネルの方向は、例えば、聴取位置を基準として、例えば、水平角および仰角・俯角の極座標で表される。なお、ここで、フォーマット変換の手法自体は、様々な既存技術の中から任意のものを適用可能である。
変換後MCA信号取得部21は、フォーマット変換部20からMCA信号(フォーマット変換後)を取得する。
信号分離部22は、変換後MCA信号取得部21が取得した、フォーマット変換後のMCA信号を再度ダイアログ信号と背景音信号とに分離する。信号分離部22は、分離して得られるダイアログ信号と背景音信号とを出力し、分析部23に供給する。ダイアログと背景音との分離に用いるアルゴリズムについては、信号分離部12の説明において記載した通り既存技術による任意の手法を用いることができる。
分析部23は、信号分離部22から渡される、フォーマット変換後のダイアログ信号および背景音信号を分析し、そのオーディビリティの情報を出力する。言い換えれば、分析部23は、変換後MCA信号に基づいて、変換後MCA信号に含まれるダイアログの聴き取りやすさの指標を求める。ここでの指標も、分析部13において説明した指標と同様である。
改善部31は、分析部13および23から、オーディビリティの情報を入力し、フォーマット変換部20における変換パラメーターを変更するよう指示することにより、変換後MCA信号のオーディビリティである聴き取りやすさを改善する。
つまり、改善部31は、分析部13および分析部23によりそれぞれ求められた聴き取りやすさの指標に基づいて、変換後MCA信号に含まれるダイアログと背景音とのレベル比を補正する。また、改善部31が、上記レベル比を補正する代わりに、変換後MCA信号に含まれるダイアログおよび背景音のチャンネル割当を変更(補正)するようにしてもよい。また、改善部31が、上記のダイアログと背景音とのレベル比と、上記のダイアログおよび背景音のチャンネル割当との両方を補正するようにしてもよい。
なお、改善部31による改善処理の詳細については、後述する。
次に、オーディビリティを分析する方法の詳細について説明する。分析部13および分析部23は、ダイアログ信号と背景音信号の2系統の信号を入力し、オーディビリティの情報を出力する。
図2は、オーディビリティを分析するための分析部13の概略機能構成を示すブロック図である。なお、分析部13と分析部23との処理は、入力される信号がフォーマット変換前の信号であるか変換後信号であるかが異なる。なお図2では、分析部13について説明するが、分析部23も、チャンネル数は異なるものの分析部13と同様の機能構成を有する。
図示するように、分析部13は、ダイアログ信号取得部51と、HRTF重畳部52と、加算部53Lおよび53Rと、相互相関係数計算部54と、上下方向重心解析部55と、背景音信号取得部61と、HRTF重畳部62と、加算部63Lおよび63Rと、相互相関係数計算部64と、上下方向重心解析部65と、ダイアログ/背景音レベル差演算部71と、両耳マスキングレベル差演算部72と、重心差演算部73と、オーディビリティ演算部77とを含んで構成される。
ダイアログ信号取得部51は、入力されるダイアログ信号を取得する。
背景音信号取得部61は、入力される背景音信号を取得する。
これらの信号を基に、分析部13は、ダイアログ/背景音のSN比の分析と、ダイアログと背景音の両耳マスキング効果の分析と、エネルギー重心の上下方向差の分析とを行い、最終的にオーディビリティを演算する。
以下で、各分析について順に説明する。
(1)ダイアログ/背景音のSN比の分析
ダイアログ/背景音レベル差演算部71は、ダイアログ信号と背景音信号のレベル比であるSN比(信号対雑音比,signal-to-noise ratio)を求める。なお、ダイアログ/背景音レベル差演算部71は、ダイアログ信号を信号(S)とし、背景音信号を雑音(N)としたときのSN比を求める。具体的には、図示する通り、ダイアログ/背景音レベル差演算部71は、ダイアログ信号取得部51から得られるダイアログ信号と、背景音信号取得部61から得られる背景音信号とから、上記のSN比を求める。なお、ダイアログ/背景音レベル差演算部71による処理の変形例については、後述する。ダイアログ/背景音のSN比は、ダイアログの聴き取りやすさを示す指標となる。ダイアログ/背景音のSN比が大きいほど、よりダイアログが聴き取りやすく、つまりオーディビリティが高い。そして、ダイアログ/背景音のSN比が小さいほど、よりダイアログが聴き取りにくく、つまりオーディビリティが低い。
(2)ダイアログと背景音の両耳マスキング効果の分析
HRTF重畳部52は、ダイアログ成分の各チャンネルの信号に対し、各チャンネルの再生方向に対応した頭部伝達関数(Head-Related Transfer Function)の畳み込み(重畳)を行う。図中のHRTF重畳部52において、FL(フロントレフト)、FR(フロントライト)、FC(フロントセンター)、BtFR(ボトムフロントライト)等は、チャンネルの再生方向を表す略号である。例えば、22.2チャンネルのフォーマットの場合、上層のチャンネルは、TpFL,TpFR,TpFC,TpC,TpBL,TpBR,TpSiL,TpSiR,TpBCの9チャンネルである。また、中層のチャンネルは、FL,FR,FC,BL,BR,FLc,FRc,BC,SiL,SiRの10チャンネルである。また、下層のチャンネルは、BtFC,BtFL,BtFRの3チャンネルである。低域効果チャンネルは,LFE1,LFE2の2チャンネルである。
加算部53Lおよび53Rは、HRTF重畳部52においてHRTFを重畳した信号の、それぞれ、左チャンネルおよび右チャンネルの和を取る。つまり、加算部53Lおよび53Rは、受聴位置におけるバイノーラル信号を生成し、出力する。
相互相関係数計算部54は、加算部53Lおよび53Rから出力されるバイノーラル信号に基づき、左および右の両耳間の相互相関係数を計算する。
HRTF重畳部62と、加算部63Lおよび63Rと、相互相関係数計算部64は、それぞれ、上述したHRTF重畳部52と、加算部53Lおよび53Rと、相互相関係数計算部54と同様の処理を、背景音信号を基に行う。
つまり、HRTF重畳部62は、背景音成分の各チャンネルの信号に対し、各チャンネルの再生方向に対応した頭部伝達関数の畳み込みを行う。
また、加算部63Lおよび63Rは、HRTF重畳部62においてHRTFを重畳した信号の、それぞれ、左チャンネルおよび右チャンネルの和を取る。つまり、加算部63Lおよび63Rは、背景音に関して、受聴位置におけるバイノーラル信号を生成する。
相互相関係数計算部64は、加算部53Lおよび53Rから出力されるバイノーラル信号に基づき、背景音に関して、左および右の両耳間の相互相関係数を計算する。
相互相関係数計算部54および64がそれぞれ計算した相互相関係数は、両耳マスキングレベル差演算部72に入力される。
両耳マスキングレベル差演算部72は、相互相関係数計算部54および64から渡されるそれぞれの相互相関係数に基づいて、両耳マスキングレベル差を計算する。
両耳マスキングレベル差とは、マスクする音とマスクされる音の両耳における相関係数(以下、両耳相互相関係数もしくは両耳相関)がともに1、つまり同相である場合のマスキングレベルを基準として、マスクする音やされる音が両耳間で異なる場合にマスキングが起きにくくなる度合いをレベルで示したものである。なお、マスクする音とマスクされる音の両耳相関がともに1である状態を、Nという。
両耳マスキングレベル差に関しては、代表値が知られている。例えば、雑音である背景音が無相関になった場合(この状態をNという)や、雑音である背景音が逆相になった場合(この状態をNπという)など、両耳相関が0や−1などの典型的なケースについては代表値が知られている。しかしながら、両耳相関が連続的に変化する場合の具体的な値は知られていない。
ここでは、ダイアログ信号の両耳相関が1である場合を考える。
図3は、ダイアログ信号の両耳相関が1である場合の、両耳マスキングレベル差関数f(r)と、その一例である関数l(r)を示すグラフである。なお、ここで、rは、背景音信号の両耳相互相関係数である。同図において、横軸は両耳相互相関係数rであり、縦軸は両耳マスキングレベル差である。
同図では、f(r)を破線で示している。関数f(r)が満たすべき条件は、次の通りである。即ち、上記の背景音信号の相関係数が−1および0である場合の、両耳マスキングレベル差を、それぞれ、A(dB,デシベル)およびB(dB)とするとき、下の式(1)で表される。
Figure 2017212732
なお、r=−1でf(r)=A(dB)のときは、状態Nπに相当する。また、r=0でf(r)=B(dB)のときは、状態Nに相当する。
式(1)を満たす関数f(r)として、様々な関数を考え得るが、例えば式(1)に現れる3点の間を線形近似した関数l(r)を用いることができる。関数l(r)は、次の式(2)で表される。
Figure 2017212732
以上によりダイアログと背景音の両耳マスキングレベル差を求めることができる。
ここで、両耳マスキングレベル差は、ダイアログと背景音の空間的な広がりの違いが聴き取りやすさに及ぼす影響を示す指標となる。両耳マスキングレベル差が大きいほど、よりダイアログが聴き取りやすく、つまりオーディビリティが高い。また、両耳マスキングレベル差が小さいほど、ダイアログは聴き取りにくく、つまりオーディビリティが低い。なお、上記のAおよびBの値の具体例としては、例えば、A=16(dB),B=4(dB)などといった値を用いる。下記の参考文献に、この値の具体例が記載されている。
[参考文献:B. C. Moore, An introduction to the psychology of hearing, Forth edition, Academic press, pp. 235-239(1997).]
(3)エネルギー重心の上下方向差の分析
上下方向重心解析部55は、ダイアログ信号取得部51から取得したダイアログ信号に基づき、ダイアログ信号の上下方向の重心を求める。具体的には、上下方向重心解析部55は、まず、ダイアログ信号の各チャンネルのエネルギーを計算する。そして、上下方向重心解析部55は、それらの各チャンネルの方向の情報を予め記憶しておいた記憶部(不図示)から読み出し、その仰角または俯角を取得する。そして、上下方向重心解析部55は、上で計算した各チャンネルのエネルギーで重み付けをして、仰角または俯角の和を取ることにより、ダイアログ信号の重心を求める。上下方向重心解析部55が求めた重心は、仰角または俯角の数値で表される。
上下方向重心解析部65は、背景音信号取得部61から取得した背景音信号に基づき、上記の上下方向重心解析部55と同様の処理手順により、背景音信号の上下方向の重心を求める。つまり、上下方向重心解析部65は、まず、背景音信号の各チャンネルのエネルギーを計算する。そして、上下方向重心解析部65は、それらの各チャンネルの方向の情報を記憶部(不図示)から読み出し、その仰角または俯角を取得する。そして、上下方向重心解析部65は、上で計算した各チャンネルのエネルギーで重み付けをして、仰角または俯角の和を取ることにより、背景音信号の重心を求める。上下方向重心解析部65が求めた重心は、仰角または俯角の数値で表される。
重心差演算部73は、上下方向重心解析部55および65がそれぞれ求めたエネルギー重心に基づいて、これら二者の上下方向の重心差を求める。重心差は、ダイアログ信号の重心の方向(仰角または俯角)と背景音信号の重心の方向(仰角または俯角)との差の絶対値として算出される。この上下方向の重心差は、ダイアログと背景音との上下方向の空間的な重なり度合いを表すものである。
ダイアログ信号の重心と背景音信号の重心との差は、ダイアログ信号と背景音信号の上下方向への空間的な広がりを表すものであり、聴き取りやすさに影響する重心差が大きいほど、よりダイアログが聴き取りやすく、つまりオーディビリティが高い。また、重心差が小さいほど、ダイアログは聴き取りにくく、つまりオーディビリティが低い。
オーディビリティ演算部77は、ダイアログ/背景音レベル差演算部71が算出したSN比を取得する。また、オーディビリティ演算部77は、両耳マスキングレベル差演算部72が算出した両耳マスキングレベル比を取得する。また、オーディビリティ演算部77は、重心差演算部73が算出した上下方向の重心差を取得する。そして、オーディビリティ演算部77は、これらの、SN比と、両耳マスキングレベル比と、重心差とに基づいて、オーディビリティを算出する。なお、SN比が増加することによりオーディビリティが増加し、両耳マスキングレベル比が増加することによりオーティビリティが増加し、また、重心差が増加することによりオーディビリティが増加する。これにより、オーディビリティ係数を、SN比と、両耳マスキングレベル比と、重心差との、それぞれの増加関数として定義すればよい。あるいは、重心差を用いず、オーディビリティ係数を、SN比と、両耳マスキングレベル比との、それぞれの増加関数として定義すればよい。
図4は、重心差を一定としたときの、SN比と両耳マスキングレベル差とオーディビリティ係数との関係を表したグラフである。同図において、横軸が両耳マスキングレベル差であり、縦軸がSN比である。そして、これら両軸が成す平面に描かれているのが、オーディビリティ係数の値が同一である点の軌跡(等高線)である。同図では、オーディビリティ係数が2dB、4dB、6dB、8dB、10dBの各線が描かれている。
なお、重心差を用いずにオーディビリティ係数を定義することも可能である。この場合にも、SN比と両耳マスキングレベル差とオーディビリティ係数との関係を表したグラフとして、図4と同様のグラフが得られる。
図4に示したグラフは、両耳マスキングレベル差とSN比とに対して、オーディビリティ係数が非線形な要素を有していたが、SN比と、両耳マスキングレベル比と、重心差との線形比としてオーディビリティ係数を定義しても良い。例えば、オーディビリティ演算部77が算出するオーディビリティ係数を、下の式(3)のように定義することができる。
Figure 2017212732
式(3)において、aはオーディビリティ係数である。また、SNRは、SN比である。また、MLRは、両耳マスキングレベル比である。また、VDDは、上下方向の重心差である。そして、α、β、γのそれぞれは、予め定められた正定数である。ただし、γを0としてもよい。なお、γを0とするとき、オーディビリティ係数aはVDDの値に依存せず、αとSNRとβとMLRの各値のみによって定まる。
図5は、重心差を一定としたときの、SN比および両耳マスキングレベル比と、オーディビリティ係数との関係を示すグラフである。同図において、横軸は両耳マスキングレベル差であり、縦軸はSN比である。そして、図4と同様に、これら両軸が成す平面上に、オーディビリティ係数の値が同一である点の軌跡(等高線)が描かれている。なお、同図では、オーディビリティ係数は、重心差を一定としたときには、SN比と両耳マスキングレベル比との線形和として定義されている。なお、図5の中の点A,A,A,A,Bについては、後述する。
オーディビリティ演算部77は、上に記したいずれかの方法でオーディビリティ係数を計算し、その結果を出力する。
つまり、分析部13および23内のオーディビリティ演算部77が、それぞれ、変換前の信号のオーディビリティ係数および変換後の信号のオーディビリティ係数を、出力し、改善部31に渡す。
ここで、改善部31による処理について、さらに詳細に説明する。フォーマット変換(チャンネル数の変換)では、一般に、ダイアログ信号と背景音のバランスが崩れることが多い。改善部31は、このバランスの崩れを補償し、聴き取りやすさを改善する。
図5における点Bは、一例として、変換前MCA信号によるSN比と両耳マスキングレベル差とによって定まる点である。そして、この点Bに関して算出されたオーディビリティ係数は8dBである。また、点Aは、変換後MCA信号によるSN比と両耳マスキングレベル差とによって定まる点である。そして、この点Aに関して算出されたオーディビリティ係数は6dBである。つまり、フォーマット変換部20によるチャンネル数の変換によって、オーディビリティ係数が2dB低くなっている。つまり、チャンネル数の変換によって、音声が聴き取りにくくなっている。オーディビリティ係数を基準とすると、点Aにある状態から、聴き取りやすさを変換前の状態に戻すためには、8dBの線上(等高線上)のどこかの位置に、両耳マスキングレベル差とSN比とを変えればよい。
図5において、点Aの位置から、両耳マスキングレベル差とSN比とを移動させることを考える。例えば、オーディビリティ係数が8dBである線上の、点A,A,A等に移動させることを考える。例えば、SN比の変更のみによってオーディビリティ係数を8dBにするためには、点Aの位置から、真上の点Aの位置に移動させる。SN比のみを向上させるためには、例えば、フォーマット変換部20における変換で、ダイアログのエネルギーのみを上げればよい。両耳マスキングレベル差の変更のみによってオーディビリティ係数を8dBにするためには、点Aの位置から、右方の点Aの位置に移動させる。両耳マスキングレベル差のみを向上させるためには、背景音のフォーマット変換後のチャンネル割り当てを変化させればよい。また、上記のように背景音のチャンネル割り当てを変化させることによってSN比が同時に変化する場合もある。このような場合には、点Aの位置から、斜め右上の点Aの位置に移動するように調整すればよい。
なお、上では、上下方向の重心差を固定させた状態でオーディビリティ係数の改善を図った。図5に示した両耳マスキングレベル差とSN比の2軸に加えて、上下方向の重心差を変更するような改善も行う様にしてもよい。具体的には、上下方向の重心差がより遠くなるようにダイアログ信号のチャンネル配置と背景音信号のチャンネル配置とを変えると、オーディビリティ係数が上がる。また、上下方向の重心差がより近くなるようにダイアログ信号のチャンネル配置と背景音信号のチャンネル配置とを変えると、オーディビリティ係数が下がる。この場合、両耳マスキングレベル差とSN比と上下方向の重心差との3軸が成す3次元空間内で、点を動かすような操作を、改善部31は行う。
改善部31は、フォーマット変換部20における変換のパラメーターをどのように変えれば、SN比、両耳マスキングレベル比、上下方向の重心差がどのように(どちらの方向に)変化するかを、知識情報として予め保持しておく。改善部31は、必要に応じてその知識情報を利用して、変換後MCA信号のオーディビリティを改善する。
なお、改善部31は、改善の結果について再度オーディビリティ係数の情報を取得するようにしてもよい。これにより、繰り返し、改善を行うことができる。また、オーディビリティ係数を評価値として用いて、所望のオーディビリティ係数が得られるまで繰り返し改善を行う様にしてもよい。
次に、チャンネル数変換装置1の全体的な処理の手順について説明する。
図6は、チャンネル数変換装置1の全体的な処理手順を示すフローチャートである。以下、このフローチャートに沿って説明する。
まずステップS1において、分析部13は、変換前MCA信号の、所定の時間区間について分析を行う。分析の具体的な内容は、既に説明した通りである。このステップの処理の結果として、分析部13は、変換前MCA信号のオーディビリティ係数を出力し、改善部31に渡す。
次にステップS2において、フォーマット変換部20は、変換前MCA信号のフォーマットを変換し、変換後MCA信号を出力する。つまり、フォーマット変換部20は、マルチチャンネル音声信号のチャンネル数を変換する。
次にステップS3において、分析部23は、変換後MCA信号の、所定の時間区間について分析を行う。ステップS1において分析対象とした時間区間と、本ステップにおいて分析対象とする時間区間とは、対応するものである。分析の具体的な内容は、既に説明した通りである。このステップの処理の結果として、分析部23は、変換後MCA信号のオーディビリティ係数を出力し、改善部31に渡す。
次にステップS4において、改善部31は、当該時間区間についての改善処理の終了条件が満たされているか否かを判定する。終了条件が満たされていれば(ステップS4:YES)、ステップS6に進む。終了条件が満たされていなければ(ステップS4:NO)、ステップS5に進む。
ここで、終了条件は、例えば、(条件1)変換後MCA信号のオーディビリティ係数が目標値を上回っている、というものである。なお、目標値は、例えば、当該時間区間における変換前MCA信号のオーディビリティ係数である。あるいは、変換前MCA信号のオーディビリティ係数から所定の値を加減した数値を目標値としてもよい。
あるいは、条件1の代わりに、(条件2)変換後MCA信号のオーディビリティ係数と目標値との差の絶対値が、所定の定数δ以下である(δ>0)、という終了条件を用いてもよい。
あるいは、上記の(条件1)または(条件2)を用いながら、(条件3)当該時間区間に関して行った改善処理の回数がN回(Nは正整数)に到達したときに、強制的に終了条件を「真」としてもよい。この条件3は、当該時間区間に関して、ステップS2〜S3〜S4〜S5のループを繰り返す回数に上限を設ける作用を有する。
なお、ここで挙げた終了条件以外の終了条件を用いるようにしてもよい。
次にステップS5に進んだ場合には、同ステップにおいて、改善部31は、改善処理を行う。具体的には、改善部31は、変換前MCA信号と変換後MCA信号との間でSN比や両耳マスキングレベル比を比較して、変換後MCA信号のオーディビリティを改善する方向に、フォーマット変換部20のパラメーター設定を変更するよう指示する。ここでの「パラメーター設定」とは、変換前MCA信号を変換後MCA信号に変換する際の、チャンネルごとの重み付け値の設定のことである。
本ステップの処理の終了後、ステップS2に戻り、改善処理後の設定で、当該時間区間の信号のフォーマット変換を行う。
ステップS4からステップS6に進んだ場合、ステップS6において、変換後MCA信号取得部21は、現在の時間区間の変換後MCA信号を外部に出力する。ここで出力される変換後MCA信号は、終了条件を満たすまで改善処理が行われた信号である。
次にステップS7において、入力されている変換前MCA信号に、次の時間区間が存在するか否かを判定する。次の時間区間の信号が存在する場合(ステップS7:YES)、次の時間区間の処理をするためにステップS1に戻って、処理を継続する。次の時間区間の信号が存在しない場合(ステップS7:NO)、つまり、入力される変換前MCA信号が終了した場合には、チャンネル数変換装置1は、本フローチャート全体の処理を終了する。
以上、本実施形態によれば、チャンネル数変換前と変換後におけるダイアログと背景音のレベル差を揃えるとともに、聴取位置での両耳相関係数を推定し、両耳マスキング効果の違いによるマスキング効果の差を補償する。これにより、チャンネル数変換後においても、聴きとりやすい音声を実現することが可能となる。
なお、上述した実施形態におけるチャンネル数変換装置の機能の少なくとも一部をコンピューターで実現するようにしても良い。その場合、機能を実現するためのプログラムをコンピューター読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピューターシステムに読み込ませ、実行することによって実現しても良い。なお、ここでいう「コンピューターシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピューター読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピューターシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピューター読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバーやクライアントとなるコンピューターシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでも良い。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに前述した機能をコンピューターシステムにすでに記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、実施形態を説明したが、本発明はさらに次のような変形例でも実施することが可能である。なお、両立する場合には、複数の変形例を組み合わせて実施してもよい。
[変形例1]
上記実施形態では、ダイアログと背景音との比を表すSN比と、両耳マスキングレベル比と、ダイアログと背景音の間での上下方向の重心差とを用いて、オーディビリティ係数を算出した。変形例では、上下方向の重心差を用いない。この場合、図2に示した構成のうち、上下方向重心解析部55および65と、重心差演算部73とは、不要である。なお、上下方向の重心差を用いずにオーディビリティ係数を計算した場合、実施形態内にも記載した、式(3)におけるγを0とする場合と同様の結果が得られる。
[変形例2]
本変形例では、分析部は、ダイアログと背景音との比を表すSN比と、両耳マスキングレベル比と、ダイアログと背景音の間での上下方向の重心差との、いずれか1つまたは複数のみを求め、それらの複数の線形和の値であるオーディビリティ係数を求めない。そして、本変形例では、改善部は、オーディビリティ係数を用いない。改善部は、分析部によって求められた、ダイアログと背景音との比を表すSN比と、両耳マスキングレベル比と、ダイアログと背景音の間での上下方向の重心差との、いずれか1つまたは複数のみにより改善処理を行う。この変形例は、分析部13にも分析部23にも適用可能である。
[変形例3]
本変形例では、分析部は、周波数成分ごとに、ダイアログと背景音との比を表すSN比や、両耳マスキングレベル比や、ダイアログと背景音の間での上下方向の重心差を、求める。また、それらの線形和の値であるオーディビリティ係数を求める場合にも、周波数成分ごとにオーディビリティ係数を求める。そして、改善部は、分析部によって求められた周波数成分ごとの値に基づいて、当該周波数成分ごとの改善処理を行う。つまり、改善部は、周波数成分ごとに、ダイアログと背景音との比を表すSN比や、両耳マスキングレベル比や、ダイアログと背景音の間での上下方向の重心差の、いずれか1つまたは複数による改善処理を行う。この変形例は、分析部13にも分析部23にも適用可能である。
[変形例4]
上記実施形態では、ダイアログの両耳相互相関係数(両耳相関)が1である場合について説明した。変形例として、ダイアログの両耳相互相関係数が1でない場合にも、ダイアログと背景音との両耳相互相関係数の両方を引数とするマスキングレベル差の関数を適宜定めることにより、上記実施形態と同様の処理が可能である。
[変形例5]
上記実施例では、図2にも示したように、ダイアログ/背景音レベル差演算部71は、ダイアログ信号取得部51から得られるダイアログ信号と、背景音信号取得部61から得られる背景音信号とから、SN比を求めるようにした。代わりに、変形例5の構成としてもよい。
図7は、変形例5による分析部13の概略機能構成を示すブロック図である。
この変形例5として、ダイアログ/背景音レベル差演算部71は、ダイアログ信号のレベル値を得るために、ダイアログ信号取得部51の出力を用いる代わりに、加算部53Lおよび加算部53Rの出力の和の値を用いるようにしてもよい。あるいは、ダイアログ/背景音レベル差演算部71は、ダイアログ信号のレベル値を得るために、加算部53Lおよび加算部53Rの出力の平均値を用いるようにしてもよい。また、同時に、ダイアログ/背景音レベル差演算部71は、背景音信号のレベル値を得るために、背景音信号取得部61の出力を用いる代わりに、加算部63Lおよび加算部63Rの出力の和の値を用いるようにしてもよい。あるいは、ダイアログ/背景音レベル差演算部71は、背景音信号のレベル値を得るために、加算部63Lおよび加算部63Rの出力の平均値を用いるようにしてもよい。つまり、本変形例の構成では、ダイアログ/背景音レベル差演算部71は、ダイアログ信号として、HRTF重畳部52の出力を用いることができる。また、ダイアログ/背景音レベル差演算部71は、背景信号として、HRTF重畳部62の出力を用いることができる。
以上の構成により、ダイアログ/背景音のレベル差算出において、マルチチャンネルオーディオの聴取時に生じうる、複数チャンネルの信号間の相関や位相差によるレベルの変化の影響を、より忠実に反映することが可能となる。
以上、この発明の実施形態および変形例について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も含まれる。
本発明は、音声処理の分野で利用できる。特に、マルチチャンネルオーディオの再生技術に幅広く利用できる。とりわけ、放送やパッケージメディアなどとして供給されるマルチチャンネルオーディオを、任意のオーディオシステムやホームシアターシステムで再生する際に利用価値が高い。
1 チャンネル数変換装置
11 変換前MCA信号取得部
12 信号分離部
13 分析部(第1分析部)
20 フォーマット変換部
21 変換後MCA信号取得部
22 信号分離部
23 分析部(第2分析部)
31 改善部
51 ダイアログ信号取得部
52,62 HRTF重畳部
53L,53R,63L,63R 加算部
54,64 相互相関係数計算部
55,65 上下方向重心解析部
61 背景音信号取得部
71 ダイアログ/背景音レベル差演算部
72 両耳マスキングレベル差演算部
73 重心差演算部
77 オーディビリティ演算部

Claims (8)

  1. 入力される変換前マルチチャンネルオーディオ信号のフォーマットを変換し、前記変換前マルチチャンネルオーディオ信号とは異なるフォーマットを有する変換後マルチチャンネルオーディオ信号を出力するフォーマット変換部と、
    前記変換前マルチチャンネルオーディオ信号に基づいて、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第1分析部と、
    前記変換後マルチチャンネルオーディオ信号に基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第2分析部と、
    前記第1分析部によって求められた前記変換前マルチチャンネルオーディオ信号の聴き取りやすさの指標と、前記第2分析部によって求められた前記変換後マルチチャンネルオーディオ信号の聴き取りやすさの指標とに基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比を補正する改善部と、
    を具備することを特徴とするチャンネル数変換装置。
  2. 入力される変換前マルチチャンネルオーディオ信号のフォーマットを変換し、前記変換前マルチチャンネルオーディオ信号とは異なるフォーマットを有する変換後マルチチャンネルオーディオ信号を出力するフォーマット変換部と、
    前記変換前マルチチャンネルオーディオ信号に基づいて、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第1分析部と、
    前記変換後マルチチャンネルオーディオ信号に基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求める第2分析部と、
    前記第1分析部によって求められた前記変換前マルチチャンネルオーディオ信号の聴き取りやすさの指標と、前記第2分析部によって求められた前記変換後マルチチャンネルオーディオ信号の聴き取りやすさの指標とに基づいて、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログおよび背景音のチャンネル割当を変更する改善部と、
    を具備することを特徴とするチャンネル数変換装置。
  3. 請求項2に記載のチャンネル数変換装置において、
    前記改善部は、さらに、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比を補正する、
    ことを特徴とするチャンネル数変換装置。
  4. 請求項1から3までのいずれか一項に記載のチャンネル数変換装置において、
    前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差とを求め、
    前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差とを求める、
    ことを特徴とするチャンネル数変換装置。
  5. 請求項1から4までのいずれか一項に記載のチャンネル数変換装置において、
    前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差との、それぞれに所定の重み付けをした線形和を求め、
    前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音とのレベル比と、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音の両耳マスキングレベル差との、それぞれに所定の重み付けをした線形和を求める、
    ことを特徴とするチャンネル数変換装置。
  6. 請求項1から5までのいずれか一項に記載のチャンネル数変換装置において、
    前記第1分析部は、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログと背景音のエネルギー重心の上下方向の空間的な重なり度合いを求め、
    前記第2分析部は、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標として、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログと背景音のエネルギー重心の上下方向の空間的な重なり度合いを求める、
    ことを特徴とするチャンネル数変換装置。
  7. 請求項1から6までのいずれか一項に記載のチャンネル数変換装置において、
    前記第1分析部は、周波数成分ごとに、前記変換前マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求め、
    前記第2分析部は、周波数成分ごとに、前記変換後マルチチャンネルオーディオ信号に含まれるダイアログの聴き取りやすさの指標を求め、
    前記改善部は、当該周波数成分ごとに前記変換後マルチチャンネルオーディオ信号を改善する、
    ことを特徴とするチャンネル数変換装置。
  8. コンピューターを、請求項1から7までのいずれか一項に記載のチャンネル数変換装置、として機能させるためのプログラム。
JP2017097434A 2016-05-24 2017-05-16 チャンネル数変換装置およびプログラム Pending JP2017212732A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016103748 2016-05-24
JP2016103748 2016-05-24

Publications (1)

Publication Number Publication Date
JP2017212732A true JP2017212732A (ja) 2017-11-30

Family

ID=60474928

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017097434A Pending JP2017212732A (ja) 2016-05-24 2017-05-16 チャンネル数変換装置およびプログラム

Country Status (1)

Country Link
JP (1) JP2017212732A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023518119A (ja) * 2020-05-15 2023-04-27 ドルビー・インターナショナル・アーベー オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023518119A (ja) * 2020-05-15 2023-04-27 ドルビー・インターナショナル・アーベー オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置
JP7314427B2 (ja) 2020-05-15 2023-07-25 ドルビー・インターナショナル・アーベー オーディオ・データの再生中のダイアログ了解性を改善するための方法および装置

Similar Documents

Publication Publication Date Title
US9949053B2 (en) Method and mobile device for processing an audio signal
KR100626233B1 (ko) 스테레오 확장 네트워크에서의 출력의 등화
RU2643630C1 (ru) Способ и устройство для рендеринга акустического сигнала и машиночитаемый носитель записи
KR102217085B1 (ko) 매칭되지 않은 트랜스오럴 라우드스피커 시스템용 강화된 가상 스테레오 재생
US11102577B2 (en) Stereo virtual bass enhancement
US8111830B2 (en) Method and apparatus to provide active audio matrix decoding based on the positions of speakers and a listener
US9743215B2 (en) Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio
KR20160001712A (ko) 음향 신호의 렌더링 방법, 장치 및 컴퓨터 판독 가능한 기록 매체
TW201927010A (zh) 串音處理b鏈
US20210250717A1 (en) Spatial audio Capture, Transmission and Reproduction
US10057702B2 (en) Audio signal processing apparatus and method for modifying a stereo image of a stereo signal
KR20120132342A (ko) 보컬 신호 제거 장치 및 방법
JP2008301427A (ja) マルチチャンネル音声再生装置
TW202030721A (zh) 用於對相聽覺傳輸技術之揚聲器系統之串音消除
US20220328056A1 (en) Sound Field Related Rendering
JP2017212732A (ja) チャンネル数変換装置およびプログラム
US8340322B2 (en) Acoustic processing device
US20230040821A1 (en) Processing device and processing method
JP2002236500A (ja) 多チャネル雑音抑圧装置、その方法、そのプログラム及びその記録媒体
JP2018029306A (ja) チャンネル数変換装置およびそのプログラム
JP2022042806A (ja) 音声処理装置およびプログラム
WO2023156274A1 (en) Apparatus and method for reducing spectral distortion in a system for reproducing virtual acoustics via loudspeakers
KR100601729B1 (ko) 인간의 인지적 측면을 고려한 공간 역 필터링 장치 및방법과 이 장치를 제어하는 컴퓨터 프로그램을 저장하는컴퓨터로 읽을 수 있는 기록 매체
JP2006042316A (ja) 音像上方拡大回路
JP2019186592A (ja) 信号処理装置、放送受信装置及び信号処理方法

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20181026