JP2016208189A - 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム - Google Patents

番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム Download PDF

Info

Publication number
JP2016208189A
JP2016208189A JP2015086160A JP2015086160A JP2016208189A JP 2016208189 A JP2016208189 A JP 2016208189A JP 2015086160 A JP2015086160 A JP 2015086160A JP 2015086160 A JP2015086160 A JP 2015086160A JP 2016208189 A JP2016208189 A JP 2016208189A
Authority
JP
Japan
Prior art keywords
conversion
channels
channel
audio signal
dialog
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2015086160A
Other languages
English (en)
Other versions
JP6510870B2 (ja
Inventor
大出 訓史
Norifumi Oide
訓史 大出
小森 智康
Tomoyasu Komori
智康 小森
一穂 小野
Kazuo Ono
一穂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Nippon Hoso Kyokai NHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Hoso Kyokai NHK filed Critical Nippon Hoso Kyokai NHK
Priority to JP2015086160A priority Critical patent/JP6510870B2/ja
Publication of JP2016208189A publication Critical patent/JP2016208189A/ja
Application granted granted Critical
Publication of JP6510870B2 publication Critical patent/JP6510870B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】番組音声のチャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つ。【解決手段】番組音声チャンネル数変換装置1の変換前ラウドネス値算出手段11は、入力音声信号に対し、番組の全区間について全チャンネル、ダイアログ及び背景音の平均ラウドネス値を算出する。チャンネル数変換手段12は、入力音声信号のチャンネル数を変換する。変換後ラウドネス値算出手段13は、チャンネル数変換後の音声信号に対し、番組の全区間について全チャンネル、ダイアログ及び背景音の平均ラウドネス値を算出する。ラウドネス調整手段14は、全チャンネルの平均ラウドネス値がチャンネル数変換前後で一致し、かつ、ダイアログの平均ラウドネス値がチャンネル数変換前におけるダイアログの平均ラウドネス値以上の所定値に一致するように、チャンネル数変換後の音声信号のレベルを調整する。【選択図】図1

Description

本発明は、番組音声の送出時または受信時に、番組音声の制作時とは異なるチャンネル数の音響方式で再生するために、番組音声のチャンネル数を変換する番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラムに関する。
従来、番組音声のチャンネル数を変換する際に、予め設定された変換係数(非特許文献1,2を参照)、または各チャンネルの音声信号の再生時に想定される位置(想定されるスピーカの位置)及び角度から算出された変換係数(非特許文献3を参照)が用いられる。具体的には、チャンネル数変換前の各チャンネルの音声信号に変換係数が乗算され、乗算結果が加算されることにより、チャンネル数変換後の音声信号が生成される。
例えば、22.2chの音響方式から5.1chの音響方式へチャンネル数を変換する技術、及び5.1chの音響方式から2chの音響方式へチャンネル数を変換する技術は、前記非特許文献1の標準規格ARIB STD−B32、及び前記非特許文献2の勧告ITU−R BS.775−3等に記載されている。
このようなチャンネル数変換手法は、各チャンネルの音声信号の再生位置に基づいており、音声信号がダイアログであるか、楽器音または背景音であるかに関わることなく、一定の変換係数が用いられる。
しかしながら、例えば番組の視聴者が高齢者の場合には、背景音の影響でダイアログが聞き取り難いという傾向がある。この場合、ダイアログ及び背景音の音圧レベルは、高齢者に適するように調整されることが望ましい(非特許文献4を参照)。
一方で、番組音声の大きさを評価するラウドネス値の測定法が知られており、このラウドネス測定法にて測定される平均ラウドネス値により、番組音声レベルの管理が行われている(非特許文献5を参照)。このラウドネス測定法に従い、番組の全区間(番組の開始時点から終了時点までの間の全時間区間)の平均ラウドネス値が目標ラウドネス値(−24LKFS)の許容範囲内(±1dB)に収まるように、番組制作の運用が定められている(非特許文献6を参照)。これにより、番組間及び放送局間の番組音声の音量感を統一することができる。
ARIB標準規格、ARIB STD−B32 3.0版、"デジタル放送における映像符号化、音声符号化及び多重化方式" ITU勧告、Recommendation ITU−R BS.775−3、"Multichannel stereophonic sound system with and without accompanying picture" Ville Pulkki、"Localization of amplitude-panned virtual sources II:two- and three-dimensional panning"、J.AudioEng. Soc.、Vol.49、No.9、pp.753-767、2001 小森、都木、黒住、庄田、村川、"高齢者にも聞きやすい放送番組の音量バランス客観評価技術"、電子情報通信学会技術研究報告WIT、vol.110、no.164、pp.35-40、2010 ITU勧告、Recommendation ITU−R BS.1770−3、"Algorithms to measure audio programme loudness and true-peak audio level" ARIB技術資料、ARIB TR−B32、"デジタルテレビ放送番組におけるラウドネス運用規定"
前述のとおり、従来のチャンネル数変換手法では、チャンネル数を変換するための変換係数として、音声信号の種類に関わらず、各チャンネルの音声信号の再生位置に基づいた一定値を用いていた。このため、特に番組の視聴者が高齢者の場合には、番組によって、チャンネル数変換後の音声信号では、背景音の影響でダイアログが聞き難くなることがあった。
また、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法では、各チャンネルの音声信号に対し、その再生位置に応じて異なる重み係数が乗算される。再生位置による重み係数とチャンネル数変換に用いられる係数が異なるため、チャンネル数が変換される前後で平均ラウドネス値が変わってしまい、番組の全区間の平均ラウドネス値が、目標ラウドネス値の許容範囲内に収まらないことがあった。
そこで、本発明は前記課題を解決するためになされたものであり、その目的は、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能な番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラムを提供することにある。
前記目的を達成するために、本発明による番組音声チャンネル数変換装置は、番組の入力音声信号のチャンネル数を変換し、出力音声信号を生成する番組音声チャンネル数変換装置において、前記入力音声信号における全チャンネルの音の大きさ、前記入力音声信号に含まれるダイアログの大きさ、及び前記入力音声信号に含まれる背景音の大きさをそれぞれ算出する変換前算出手段と、前記入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成するチャンネル数変換手段と、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号における全チャンネルの音の大きさ、前記チャンネル数変換後の音声信号に含まれるダイアログの大きさ、及び前記チャンネル数変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する変換後算出手段と、全チャンネルの音の大きさが前記変換前算出手段により算出された全チャンネルの音の大きさに一致し、かつ、ダイアログの大きさが前記変換前算出手段により算出されたダイアログの大きさ以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する調整手段と、を備えたことを特徴とする。
また、本発明による番組音声チャンネル数変換装置は、前記変換前算出手段の代わりに変換前ラウドネス値算出手段を、前記変換後算出手段の代わりに変換後ラウドネス値算出手段を、前記調整手段の代わりにラウドネス調整手段をそれぞれ備え、前記変換前ラウドネス値算出手段が、前記入力音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記入力音声信号に含まれるダイアログの平均ラウドネス値、及び前記入力音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、前記変換後ラウドネス値算出手段が、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記チャンネル数変換後の音声信号に含まれるダイアログの平均ラウドネス値、及び前記チャンネル数変換後の音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、前記ラウドネス調整手段が、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致し、かつ、ダイアログの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出されたダイアログの平均ラウドネス値以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする。
また、本発明による番組音声チャンネル数変換装置は、さらに、メタデータ抽出手段を備え、前記メタデータ抽出手段が、前記入力音声信号からメタデータを抽出し、前記メタデータから、前記平均ラウドネス値を算出する際に用いるデータであって、チャンネル数変換前後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、及び各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値を抽出する、ことを特徴とする。
また、本発明による番組音声チャンネル数変換装置は、さらに、チャンネル分離手段を備え、前記チャンネル分離手段が、前記入力音声信号を構成する各チャンネルの音声信号のうち、ダイアログ成分及び背景音成分を含むチャンネルの音声信号から、前記ダイアログ成分の音声信号であるダイアログと前記背景音成分の音声信号である背景音とを分離する、ことを特徴とする。
また、本発明による番組音声チャンネル数変換装置は、前記入力音声信号の各チャンネルのうち、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つをダイアログチャンネルとして扱うみなし処理を行い、前記ダイアログチャンネルの音声信号を、前記入力音声信号に含まれるダイアログとする、ことを特徴とする。
また、本発明による番組音声チャンネル数変換装置は、予め設定された指定に基づいて、前記みなし処理を行い、前記指定がみなし処理を行わないことを示している場合、前記みなし処理を行うことなく、前記変換前ラウドネス値算出手段が、前記入力音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記変換後ラウドネス値算出手段が、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記ラウドネス調整手段が、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする。
さらに、本発明による番組音声チャンネル数変換プログラムは、コンピュータを、前記番組音声チャンネル数変換装置として機能させることを特徴とする。
また、本発明による放送番組受信装置は、放送番組の映像信号及び音声信号を受信し、前記映像信号及び前記音声信号を再生する放送番組受信装置において、前記番組音声チャンネル数変換装置を備えたことを特徴とする。
以上のように、本発明によれば、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能となる。
本発明の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。 番組音声チャンネル数変換装置の処理を示すフローチャートである。 変換前ラウドネス値算出手段の構成例を示すブロック図である。 ラウドネス調整手段により調整されるラウドネス値を説明する図である。 ラウドネス調整手段の構成例を示すブロック図である。 ラウドネス調整手段の処理を示すフローチャートである。 ラウドネス調整手段により調整されるラウドネス値及び出力音声信号を説明する図である 本発明の他の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。
以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、音声信号のチャンネル数を変換する際に、チャンネル数変換前後における全チャンネルの音の大きさが一致し、かつ、チャンネル数変換前後のダイアログの大きさが同じになり、またはチャンネル数変換後のダイアログの大きさがチャンネル数変換前よりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整することを特徴とする。
〔番組音声チャンネル数変換装置〕
まず、本発明の実施形態による番組音声チャンネル数変換装置について説明する。図1は、本発明の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図であり、図2は、番組音声チャンネル数変換装置の処理を示すフローチャートである。この番組音声チャンネル数変換装置1は、変換前ラウドネス値算出手段(変換前算出手段)11、チャンネル数変換手段12、変換後ラウドネス値算出手段(変換後算出手段)13及びラウドネス調整手段(調整手段)14を備えている。
番組音声チャンネル数変換装置1には、N個のチャンネルにて制作された番組音声である入力音声信号、チャンネル数変換前における各チャンネルの音声信号の再生位置及びチャンネル数変換後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値、並びに、番組の全区間における平均ラウドネス値の目標値である目標ラウドネス値がそれぞれ入力される。そして、番組音声チャンネル数変換装置1により、チャンネル数Nの音声信号がチャンネル数Mの音声信号に変換され、M個のチャンネルに変換された番組音声が出力音声信号として出力される。ここで、M,Nは、一般に異なる正の整数であるが、再生位置が異なる場合は、M,Nが同数であってもよい。
チャンネル配置情報は、予め設定された情報として番組音声チャンネル数変換装置1に入力され、ダイアログ判定値及び目標ラウドネス値は、予め設定された値として番組音声チャンネル数変換装置1に入力される。
(変換前ラウドネス値算出手段11)
変換前ラウドネス値算出手段11は、チャンネル数Nの入力音声信号、チャンネル配置情報及びダイアログ判定値を入力し、入力音声信号を構成する各チャンネルの音声信号について、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号(ダイアログ)と背景音チャンネルの音声信号(背景音)とに振り分けることで、各チャンネルの音声信号を分類する(ステップS201)。
変換前ラウドネス値算出手段11は、全チャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて全チャンネルの平均ラウドネス値を算出する(ステップS202)と共に、ステップS201にて分類したダイアログチャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いてダイアログの平均ラウドネス値を算出する(ステップS203)。また、変換前ラウドネス値算出手段11は、ステップS201にて分類した背景音チャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて背景音の平均ラウドネス値を算出する(ステップS204)。
これにより、変換前ラウドネス値算出手段11において、チャンネル数変換前の全チャンネルの平均ラウドネス値、チャンネル数変換前のダイアログの平均ラウドネス値、及び、チャンネル数変換前の背景音の平均ラウドネス値が算出され、変換前のラウドネス値としてラウドネス調整手段14へ出力される。
図3は、変換前ラウドネス値算出手段11の構成例を示すブロック図であり、入力音声信号のチャンネル数が5(N=5)の場合を示している。この変換前ラウドネス値算出手段11は、フィルタ処理段21、二乗平均段22、重み処理段23、分類段24、加算段25、及び、絶対及び相対ゲーティング段26を備えている。
フィルタ処理段21は、各チャンネルの音声信号を入力し、チャンネル毎に、音声信号に対してK特性フィルタ処理を施す。二乗平均段22は、チャンネル毎に、フィルタ処理段21によりK特性フィルタ処理が施された音声信号の二乗平均値を算出する。
重み処理段23は、チャンネル配置情報に含まれるチャンネル数変換前における各チャンネルの音声信号の再生位置に基づいて、各チャンネルの重み係数を決定し、チャンネル毎に、二乗平均段22により算出された二乗平均値に、対応するチャンネルの重み係数を乗算する。ここで、重み処理段23には、チャンネル毎の再生位置に対応する重み係数が予め保持されており、各チャンネルの音声信号の再生位置及び予め保持された重み係数に従って、各チャンネルの重み係数が決定される。これにより、チャンネル毎に、重み係数が乗算された二乗平均値が得られる。
分類段24は、重み処理段23からチャンネル毎の重み係数が乗算された二乗平均値をそれぞれ入力し、ダイアログ判定値に基づいて、各チャンネルの音声信号をダイアログまたは背景音に分類する。そして、分類段24は、全チャンネルの二乗平均値、ダイアログの二乗平均値及び背景音の二乗平均値を加算段25に出力する。
加算段25は、分類段24から全チャンネルの二乗平均値、ダイアログの二乗平均値及び背景音の二乗平均値を入力する。そして、加算段25は、全チャンネルの二乗平均値を加算し、全チャンネルの二乗平均の瞬時値を求める。加算段25は、同様に、ダイアログの二乗平均値を加算し、ダイアログのみの二乗平均の瞬時値を求めると共に、背景音の二乗平均値を加算し、背景音のみの二乗平均の瞬時値を求める。
絶対及び相対ゲーティング段26は、加算段25により求めた全チャンネルの二乗平均の瞬時値に対し、絶対ゲーティング処理及び相対ゲーティング処理を施し、番組の全区間について、全チャンネルの二乗平均値Ztを求める。また、絶対及び相対ゲーティング段26は、以下の式により、全チャンネルの二乗平均値Ztを全チャンネルの平均ラウドネス値Lt(LKFS)に変換する。
[数1]
t=−0.691+10log10t ・・・(1)
絶対及び相対ゲーティング段26は、加算段25により求めたダイアログの二乗平均の瞬時値に対し、絶対ゲーティング処理及び相対ゲーティング処理を施し、番組の全区間について、ダイアログの二乗平均値Zdを求める。また、絶対及び相対ゲーティング段26は、以下の式により、ダイアログの二乗平均値Zdをダイアログの平均ラウドネス値Ldに変換する。
[数2]
d=−0.691+10log10d ・・・(2)
絶対及び相対ゲーティング段26は、ダイアログの二乗平均値Zd及びラウドネス値Ldを求める処理と同様に、番組の全区間について、背景音の二乗平均値Zbを求め、以下の式により、背景音の二乗平均値Zbを背景音の平均ラウドネス値Lbに変換する。
[数3]
b=−0.691+10log10b ・・・(3)
図3の例は、チャンネル番号3の音声信号がダイアログであり、チャンネル番号1,2,4,5の音声信号が背景音である場合を示している。加算段25により、チャンネル番号1〜5の二乗平均値が加算されて全チャンネルの二乗平均の瞬時値が求められ、チャンネル番号3の二乗平均値がダイアログのみの二乗平均の瞬時値として求められ、チャンネル番号1,2,4,5の二乗平均値が加算されて背景音のみの二乗平均の瞬時値が求められる。そして、絶対及び相対ゲーティング段26により、チャンネル番号1〜5の音声信号について全チャンネルの二乗平均値Zt及び平均ラウドネス値Ltが求められ、チャンネル番号3の音声信号についてダイアログの二乗平均値Zd及び平均ラウドネス値Ldが求められ、チャンネル番号1,2,4,5の音声信号について背景音の二乗平均値Zb及び平均ラウドネス値Lbが求められる。
これにより、チャンネル数変換前のダイアログの音声信号と背景音の音声信号との間のミキシングバランスを知ることができる。変換前ラウドネス値算出手段11により算出されたチャンネル数変換前の全チャンネルの平均ラウドネス値(二乗平均値Zt及び平均ラウドネス値Lt)、チャンネル数変換前のダイアログの平均ラウドネス値(二乗平均値Zd及び平均ラウドネス値Ld)、及び、チャンネル数変換前の背景音の平均ラウドネス値(二乗平均値Zb及び平均ラウドネス値Lb)は、変換前のラウドネス値としてラウドネス調整手段14へ出力される。
尚、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法によれば、平均ラウドネス値は、各チャンネルの音声信号にフィルタ処理を施し、二乗平均値を求め、重み係数を乗算し、全チャンネルを加算し、そして、絶対ゲーティング処理及び相対ゲーティング処理を行うことにより求められる。変換前ラウドネス値算出手段11のフィルタ処理段21、二乗平均段22、重み処理段23、加算段25及び絶対及び相対ゲーティング段26は、このラウドネス測定法に従った処理を行う。これらの処理の詳細については、前記非特許文献5の勧告ITU−R BS.1770−3及び前記非特許文献6の技術資料ARIB TR−B32を参照されたい。
(チャンネル数変換手段12)
図1及び図2に戻って、チャンネル数変換手段12は、チャンネル数Nの入力音声信号、チャンネル配置情報及びダイアログ判定値を入力し、チャンネル配置情報及びダイアログ判定値に基づいて、チャンネル数変換前のチャンネル配置(入力音声信号を構成する各チャンネルの音声信号の配置)及びチャンネル数変換後のチャンネル配置(チャンネル数変換後の音声信号を構成する各チャンネルの音声信号の配置)を特定する。そして、チャンネル数変換手段12は、特定したチャンネル数変換前後のチャンネル配置に従い、予め設定された変換係数を用いて、入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成する。つまり、チャンネル数変換手段12は、予め設定された変換係数を用いて、番組全体のチャンネル数を変換すると共に、ダイアログ判定値に従って、予め設定された変換係数を用いて、ダイアログチャンネルの音声信号のみについてチャンネル数を変換し、また、背景音チャンネルの音声信号のみについてチャンネル数を変換する。
具体的には、チャンネル数変換手段12は、ステップS201の処理と同様に、入力した各チャンネルの音声信号について、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号と背景音チャンネルの音声信号とに振り分けることで、各チャンネルの音声信号を分類する。そして、チャンネル数変換手段12は、各チャンネルにおける音声信号の分類及びチャンネル配置情報に基づいて、チャンネル数変換前後のダイアログチャンネルの音声信号についてのチャンネル配置、及びチャンネル数変換前後の背景音チャンネルの音声信号についてのチャンネル配置を特定する。
チャンネル数変換手段12は、例えばチャンネル数5をチャンネル数2に変換する場合、特定したチャンネル数変換前後のチャンネル配置に従って、以下の式により、予め設定された変換係数GC,GL,GR,GLS,GRSを用いて、入力した全チャンネルの音声信号C5,L5,R5,Ls5,Rs5のチャンネル数5をチャンネル数2に変換し、チャンネル数変換後の全チャンネルの音声信号L2,R2を生成する(ステップS205)。
[数4]
2=GC5+GL5+GLSLs5
2=GC5+GR5+GRSRs5 ・・・(4)
ここで、音声信号C5は、ダイアログチャンネルの音声信号であり、音声信号L5,R5,Ls5,Rs5は、背景音チャンネルの音声信号である。この場合の変換係数は、GC,GLS,GRS=0.7071、GL,GR=1.000が用いられる。
チャンネル数変換手段12は、特定したチャンネル数変換前後のダイアログチャンネルの音声信号についてのチャンネル配置に従って、以下の式により、予め設定された変換係数GCを用いて、入力したダイアログチャンネルの音声信号C5のチャンネル数1をチャンネル数2に変換し、チャンネル数変換後のダイアログチャンネルの音声信号(ダイアログの音声信号)Ld2,Rd2を生成する(ステップS206)。
[数5]
d2=GC5
d2=GC5 ・・・(5)
ここで、番組全体のチャンネル数は5から2に変換されるが、チャンネル数変換後の番組全体のチャンネル数2の音声信号のそれぞれには、ダイアログが含まれる。このため、ダイアログのみに着目すると、チャンネル数変換前のダイアログチャンネルのチャンネル数は1であり、チャンネル数変換後のダイアログチャンネルのチャンネル数は2となる。
チャンネル数変換手段12は、特定したチャンネル数変換前後の背景音チャンネルの音声信号についてのチャンネル配置に従って、以下の式により、予め設定された変換係数GLS,GRS,GL,GRを用いて、入力した背景音チャンネルの音声信号L5,R5,Ls5,Rs5のチャンネル数4をチャンネル数2に変換し、チャンネル数変換後の背景音チャンネルの音声信号(背景音の音声信号)Lb2,Rb2を生成する(ステップS207)。
[数6]
b2=GL5+GLSLs5
b2=GR5+GRSRs5 ・・・(6)
ここで、番組全体のチャンネル数は5から2に変換されるが、チャンネル数変換後の番組全体のチャンネル数2の音声信号のそれぞれには、背景音が含まれる。このため、背景音のみに着目すると、チャンネル数変換前の背景音チャンネルのチャンネル数は4であり、チャンネル数変換後の背景音チャンネルのチャンネル数は2となる。
これにより、チャンネル数変換手段12において、チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及びチャンネル数変換後の背景音チャンネルの音声信号が生成され、変換後の音声信号としてラウドネス調整手段14へ出力される。
尚、本発明は、チャンネル数変換手段12によるチャンネル数変換処理を前述の処理に限定するものではない。例えば、チャンネル数変換手段12は、変換係数として、前記非特許文献2の勧告ITU-R BS.775−3または前記非特許文献1の標準規格ARIB STD−B32等に規定されたダウンミックス係数を用いるようにしてもよい。また、チャンネル数変換手段12は、チャンネル位置に依存した角度に応じて変換係数を求め、この変換係数を用いてチャンネル数を変換するようにしてもよい。
(変換後ラウドネス値算出手段13)
変換後ラウドネス値算出手段13は、チャンネル配置情報を入力すると共に、チャンネル数変換手段12から変換後の音声信号(チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及びチャンネル数変換後の背景音チャンネルの音声信号)を入力する。
変換後ラウドネス値算出手段13は、チャンネル配置情報に対応したチャンネル数変換後の全チャンネルの音声信号に対し、番組の全区間について、全チャンネルの平均ラウドネス値を算出すると共に(ステップS208)、チャンネル数変換後のダイアログチャンネルの音声信号に対し、番組の全区間について、ダイアログの平均ラウドネス値を算出する(ステップS209)。また、変換後ラウドネス値算出手段13は、チャンネル数変換後の背景音チャンネルの音声信号に対し、番組の全区間について、背景音の平均ラウドネス値を算出する(ステップS210)。
これらのステップS208〜ステップS210の処理は、ステップS202〜ステップS204の処理及び図3に示した処理と同様であり、チャンネル数変換後における番組の全区間について、全チャンネルの二乗平均値Zt2及び平均ラウドネス値Lt2、ダイアログの二乗平均値Zd2及び平均ラウドネス値Ld2、並びに背景音の二乗平均値Zb2及び平均ラウドネス値Lb2が算出される。
これにより、変換後ラウドネス値算出手段13において、チャンネル数変換後の全チャンネルの平均ラウドネス値(二乗平均値Zt2及び平均ラウドネス値Lt2)、チャンネル数変換後のダイアログの平均ラウドネス値(二乗平均値Zd2及び平均ラウドネス値Ld2)、及び、チャンネル数変換後の背景音の平均ラウドネス値(二乗平均値Zb2及び平均ラウドネス値Lb2)が算出され、変換後のラウドネス値としてラウドネス調整手段14へ出力される。
(ラウドネス調整手段14)
ラウドネス調整手段14は、目標ラウドネス値を入力すると共に、チャンネル数変換手段12から変換後の音声信号(チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及び、チャンネル数変換後の背景音チャンネルの音声信号)を入力する。また、ラウドネス調整手段14は、変換前ラウドネス値算出手段11から変換前のラウドネス値(チャンネル数変換前の全チャンネルの平均ラウドネス値(二乗平均値Zt及び平均ラウドネス値Lt)、チャンネル数変換前のダイアログの平均ラウドネス値(二乗平均値Zd及び平均ラウドネス値Ld)、及び、チャンネル数変換前の背景音の平均ラウドネス値(二乗平均値Zb及び平均ラウドネス値Lb))を入力すると共に、変換後ラウドネス値算出手段13から変換後のラウドネス値(チャンネル数変換後の全チャンネルの平均ラウドネス値(二乗平均値Zt2及び平均ラウドネス値Lt2)、チャンネル数変換後のダイアログの平均ラウドネス値(二乗平均値Zd2及び平均ラウドネス値Ld2)、及び、チャンネル数変換後の背景音の平均ラウドネス値(二乗平均値Zb2及び平均ラウドネス値Lb2))を入力する。
ここで、ラウドネス調整手段14は、目標ラウドネス値及び変換後の音声信号を入力してラウドネス調整を行うにあたり、変換前ラウドネス値算出手段11から、番組の全区間について事前に算出された変換前のラウドネス値を入力しておき、また、変換後ラウドネス値算出手段13から、番組の全区間について事前に算出された変換後のラウドネス値を入力しておく。
ラウドネス調整手段14は、変換前のラウドネス値及び変換後のラウドネス値に基づいて、ダイアログ及び背景音の目標ラウドネス値を算出し(ステップS211)、変換後の音声信号を調整し(ステップS212)、出力音声信号を生成する。具体的には、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルの音声信号について、平均ラウドネス値が目標ラウドネス値(チャンネル数変換前の全チャンネルの平均ラウドネス値)と一致し、かつ、チャンネル数変換後のダイアログチャンネルの音声信号について、平均ラウドネス値がチャンネル数変換前と一致するように、またはチャンネル数変換前よりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整し、ラウドネス調整後のチャンネル数Mの音声信号を出力音声信号として生成する。
図4は、ラウドネス調整手段14により調整されるラウドネス値を説明する図であり、チャンネル数を5から2に変換する場合の例を示している。以下、説明の便宜上、二乗平均値Zをラウドネス値として説明する。図4(1)は、チャンネル数変換前における全チャンネルの音声信号における加算値を表すラウドネス値Zt、ダイアログチャンネルの音声信号における加算値を表すダイアログCのラウドネス値Zd、及び、背景音チャンネルの音声信号における加算値を表す背景音L,R,Ls,Rsのラウドネス値Zbを示している。
図4(2)は、図4(1)に示したチャンネル数5の音声信号をチャンネル数2の音声信号に変換した後のラウドネス値を示しており、チャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すダイアログLd2,Rd2のラウドネス値Zd2、及び、背景音チャンネルの音声信号における加算値を表す背景音Lb2,Rb2のラウドネス値Zb2を示している。
図4(1)(2)に示すように、チャンネル数を変換することにより、ダイアログのラウドネス値Zd,Zd2が変化せず、背景音のラウドネス値Zb2が変換前のラウドネス値Zbよりも大きくなった場合を想定する。この場合、図4(3)に示すように、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致するように、チャンネル数変換後の音声信号を構成比率を保ったまま単純に調整すると、チャンネル数変換後のダイアログのラウドネス値Zd2は、チャンネル数変換前のダイアログのラウドネス値Zdよりも小さくなってしまう。
そこで、本発明の実施形態では、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、図4(4)に示すように、チャンネル数変換後のダイアログのラウドネス値Zd2とチャンネル数変換前のラウドネス値Zdとが一致するように、チャンネル数変換後の音声信号のレベルを調整する。これにより、ダイアログと背景音との間のミキシングバランスが崩れることなく、チャンネル数を変換することが可能となる。
図4(4)は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、チャンネル数変換後のダイアログのラウドネス値Zd2とチャンネル数変換前のダイアログのラウドネス値Zdとが一致するように調整したチャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すZd2、及び、ダイアログチャンネルの音声信号における加算値を表すZb2を示している。
また、本発明の実施形態では、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、図4(5)に示すように、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のラウドネス値Zよりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整する。
図4(5)は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のダイアログの平均ラウドネス値Zdよりも大きくなるように調整したチャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すラウドネス値Zd2、及び、背景音チャンネルの音声信号における加算値表すラウドネス値Zb2を示している。
本例のように、チャンネル数が5から2に少なくなることにより、ダイアログと背景音とが同じチャンネルに変換され、同じスピーカから再生される。この場合、ダイアログと背景音との音源位置が空間的に重なり、空間マスキングが生じてしまうことから、ダイアログが聞き取り難くなることがあり得る。そこで、チャンネル数変換後のダイアログのラウドネス値Zd2を大きくし、チャンネル数変換後の背景音のラウドネス値Zb2を小さくすることにより、このような不具合を解消することができる。
図5は、ラウドネス調整手段14の構成例を示すブロック図であり、図6は、ラウドネス調整手段14の処理を示すフローチャートである。図6は、図4と同様に、チャンネル数を5から2に変換する場合の例を示している。
このラウドネス調整手段14は、目標ラウドネス値算出段31及びレベル調整段32を備えている。ラウドネス調整手段14は、チャンネル数変換手段12から変換後の音声信号、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13から変換前後のラウドネス値、及び目標ラウドネス値を入力する(ステップS601)。
具体的には、目標ラウドネス値算出段31は、変換前ラウドネス値算出手段11から、チャンネル数変換前の全チャンネルのラウドネス値Zt、ダイアログのラウドネス値Zd及び背景音のラウドネス値Zbを入力すると共に、変換後ラウドネス値算出手段13から、チャンネル数変換後の全チャンネルのラウドネス値Zt2、ダイアログのラウドネス値Zd2及び背景音のラウドネス値Zb2を入力し、目標ラウドネス値Zttを入力する。また、レベル調整段32は、チャンネル数変換手段12からチャンネル数変換後の音声信号L2,R2,Ld2,Rd2,Lb2,Rb2(L2=Ld2+Lb2,R2=Rd2+Rb2)を入力する。
ここで、チャンネル数変換前の全チャンネルのラウドネス値Ztは、目標ラウドネス値Zttと同じである。また、音声信号L2,R2は、前記式(4)のとおり、チャンネル数変換後の全チャンネルの音声信号であり、音声信号Ld2,Rd2は、前記式(5)のとおり、チャンネル数変換後のダイアログチャンネルの音声信号であり、音声信号Lb2,Rb2は、前記式(6)のとおり、チャンネル数変換後の背景音チャンネルの音声信号である。
目標ラウドネス値算出段31は、ラウドネス調整後の全チャンネルの目標ラウドネス値Zt2Aとして目標ラウドネス値Zttを設定する(ステップS602:Zt2A=Ztt(=Zt))。そして、目標ラウドネス値算出段31は、ラウドネス調整後のダイアログの目標ラウドネス値Zd2Aとして、チャンネル数変換前のダイアログの二乗平均値Zdと同じ値、または二乗平均値Zdよりも大きい所定値を設定する(ステップS603:Zd2A≧Zd)。この所定値は、チャンネル数変換前のダイアログの二乗平均値Zdよりも大きく、かつ、目標ラウドネス値Ztt(=Zt)よりも小さい値である。
目標ラウドネス値算出段31は、ステップS602にて設定した全チャンネルの目標ラウドネス値Zt2AからステップS603にて設定したダイアログの目標ラウドネス値Zd2Aを減算し、減算結果を、ラウドネス調整後の背景音の目標ラウドネス値Zb2Aに設定する(ステップS604:Zb2A=Zt2A−Zd2A)。
目標ラウドネス値算出段31は、ステップS602にて設定した全チャンネルの目標ラウドネス値Zt2A、ステップS603にて設定したダイアログの目標ラウドネス値Zd2A、及びステップS604にて設定した背景音の目標ラウドネス値Zb2Aをレベル調整段32に出力する。
レベル調整段32は、目標ラウドネス値算出段31から全チャンネルの目標ラウドネス値Zt2A、ダイアログの目標ラウドネス値Zd2A及び背景音の目標ラウドネス値Zb2Aを入力する。そして、レベル調整段32は、チャンネル数変換手段12から入力した変換後の音声信号に対し、当該音声信号の全チャンネルのラウドネス値Zt2が全チャンネルの目標ラウドネス値Zt2Aと一致し、かつ、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致するように、当該音声信号のレベルを調整する(ステップS605)。
図7は、ラウドネス調整手段14により調整されるラウドネス値及び出力音声信号を説明する図である。図7の左側に示すように、図6に示したステップS605の処理により、ラウドネス調整後のラウドネス値に対応する音声信号、すなわち、全チャンネルのラウドネス値Zt2A(図4(4)(5)ではZt2)、ダイアログのラウドネス値Zd2A(図4(4)(5)ではZd2)及び背景音のラウドネス値Zb2A(図4(4)(5)ではZb2)の音声信号が得られる。この音声信号は、ダイアログのラウドネス値Zd2Aに対応するダイアログLd2A,Rd2A、及び背景音のラウドネス値Zb2Aに対応する背景音Lb2A,Rb2Aにより構成される。
図6に戻って、レベル調整段32は、図7の右側に示すように、ステップS605にて調整されたダイアログLd2A及び背景音Lb2Aにより構成される音声信号L2Aを生成すると共に、ステップS605にて調整されたダイアログRd2A及び背景音Rb2Aにより構成される音声信号R2Aを生成する。そして、レベル調整段32は、チャンネル数2の音声信号L2A,R2Aをラウドネス調整後の音声信号である出力音声信号として出力する(ステップS606)。音声信号L2A,R2Aを生成するための加算処理は、前記式(4)に対応する。
このように、ラウドネス調整手段14は、全チャンネルのラウドネス値が全チャンネルの目標ラウドネス値Zt2A(チャンネル数変換前の全チャンネルのラウドネス値Zt)と一致し、かつ、ダイアログのラウドネス値がダイアログの目標ラウドネス値Zd2A(チャンネル数変換前のダイアログのラウドネス値Zd以上の所定値)に一致するように、変換後の音声信号を構成するダイアログLd2A,Rd2A及び背景音Lb2A,Rb2Aのレベルを調整し、チャンネル数2の音声信号L2A(=Ld2A+Lb2A),R2A(=Rd2A+Rb2A)をラウドネス調整後の音声信号である出力音声信号として出力する。
尚、ラウドネス調整手段14のレベル調整段32は、図6のステップS605において、変換後の音声信号に対し、当該音声信号の全チャンネルのラウドネス値Zt2が全チャンネルの目標ラウドネス値Zt2Aと一致し、かつ、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致するように、当該音声信号のレベルを調整するようにした。これに対し、レベル調整段32は、変換後の音声信号に対し、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致し(図4の例では、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のダイアログのラウドネス値Zd、またはラウドネス値Zdよりも大きい値に一致し)、当該音声信号の背景音のラウドネス値Zb2が背景音の目標ラウドネス値Zb2Aに一致するように(図4の例では、チャンネル数変換後の背景音のラウドネス値Zb2がチャンネル数変換前の背景音のラウドネス値Zb、またはラウドネス値Zbよりも小さい値に一致するように)、当該音声信号のレベルを調整するようにしてもよい。
要するに、ラウドネス調整手段14のレベル調整段32は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値Ztと一致し、かつ、ダイアログのラウドネス値がチャンネル数変換前のダイアログのラウドネス値Zdよりも小さくならないように、変換後の音声信号のレベルを調整すればよい。
以上のように、本発明の実施形態の番組音声チャンネル数変換装置1によれば、変換前ラウドネス値算出手段11は、チャンネル数Nの入力音声信号について、ダイアログ判定値に基づいて、ダイアログと背景音とに分類し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて、全チャンネルの平均ラウドネス値、ダイアログの平均ラウドネス値及び背景音の平均ラウドネス値を算出するようにした。
チャンネル数変換手段12は、チャンネル配置情報に基づいて、チャンネル数変換前のチャンネル配置及びチャンネル数変換後のチャンネル配置を特定し、特定したチャンネル数変換前後のチャンネル配置に従い、予め設定された変換係数を用いて、入力音声信号のチャンネル数Nを出力音声信号のチャンネル数Mに変換し、チャンネル数変換後の全チャンネルの音声信号、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号を生成するようにした。また、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルの音声信号、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号に対し、番組の全区間について、全チャンネルの平均ラウドネス値、ダイアログの平均ラウドネス値及び背景音の平均ラウドネス値を算出するようにした。
ラウドネス調整手段14は、全チャンネルの平均ラウドネス値がチャンネル数変換前の全チャンネルの平均ラウドネス値と一致し、かつ、ダイアログの平均ラウドネス値がチャンネル数変換前のダイアログの平均ラウドネス値以上の所定値に一致するように、チャンネル数変換後の音声信号を構成するダイアログ及び背景音のレベルを調整し、チャンネル数Mの音声信号をラウドネス調整後の音声信号である出力音声信号として出力するようにした。
これにより、チャンネル数変換前後の音声信号の平均ラウドネス値を一定とすることができるから、チャンネル数変換前の音声信号について、番組の全区間の平均ラウドネス値が目標ラウドネス値の許容範囲内に収まっていれば、チャンネル数変換後の音声信号についても、番組の全区間の平均ラウドネス値を目標ラウドネス値の許容範囲内に収めることができる。また、ダイアログの平均ラウドネス値がチャンネル数変換前のダイアログの平均ラウドネス値よりも小さくなることがないから、チャンネル数変換前後の音声信号について、ダイアログの聞き易さを保つことが可能となる。
〔番組音声チャンネル数変換装置/他の実施形態〕
次に、本発明の他の実施形態による番組音声チャンネル数変換装置について説明する。図8は、本発明の他の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。この番組音声チャンネル数変換装置2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16を備えている。番組音声チャンネル数変換装置2は、チャンネル数Nの入力音声信号のうちダイアログ成分及び背景音成分を含むチャンネルの音声信号から、ダイアログ及び背景音を分離し、入力音声信号に含まれるメタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出するものである。
図1に示した本発明の実施形態による番組音声チャンネル数変換装置1と図8に示す本発明の他の実施形態による番組音声チャンネル数変換装置2とを比較すると、番組音声チャンネル数変換装置1,2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14を備えている点で同一であるが、番組音声チャンネル数変換装置2は、番組音声チャンネル数変換装置1の構成に加え、さらに、メタデータ抽出手段15及びチャンネル分離手段16を備えている点で相違する。また、図1に示した番組音声チャンネル数変換装置1におけるチャンネル数Nの入力音声信号は、ダイアログ専用チャンネルの音声信号及び背景音専用チャンネルの音声信号により構成されているが、図8に示す番組音声チャンネル数変換装置2におけるチャンネル数Nの入力音声信号には、ダイアログ成分と背景音成分とを含むチャンネルの音声信号が含まれる点で相違する。図8に示す番組音声チャンネル数変換装置2において、図1に示した番組音声チャンネル数変換装置1の構成と共通する部分には図1と同一の符号を付し、その詳しい説明は省略する。
メタデータ抽出手段15は、チャンネル数Nの入力音声信号を入力し、入力音声信号からメタデータを抽出し、メタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出する。そして、メタデータ抽出手段15は、抽出したチャンネル配置情報を変換前ラウドネス値算出手段11、チャンネル数変換手段12及び変換後ラウドネス値算出手段13に出力し、抽出したダイアログ判定値を変換前ラウドネス値算出手段11、チャンネル数変換手段12及びチャンネル分離手段16に出力し、抽出した目標ラウドネス値をラウドネス調整手段14に出力する。チャンネル配置情報及びダイアログ判定値は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13において平均ラウドネス値を算出する際に用いられる。また、ダイアログ判定値は、後述するチャンネル分離手段16においてチャンネルを分離する際に用いられる。さらに、目標ラウドネス値は、ラウドネス調整手段14においてラウドネス調整する際に用いられる。
ここで、ダイアログ判定値には、各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示す値に加え、ダイアログ成分及び背景音成分を含む音声信号であることを示す値が含まれるものとする。
チャンネル分離手段16は、チャンネル数Nの入力音声信号を入力すると共に、メタデータ抽出手段15からダイアログ判定値を入力し、ダイアログ判定値に基づいて、ダイアログ成分及び背景音成分を含むチャンネルの音声信号を特定する。そして、チャンネル分離手段16は、当該音声信号から、ダイアログ成分の音声信号と背景音成分の音声信号とを分離し、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号として変換前ラウドネス値算出手段11に出力する。この分離手法(ダイアログ成分と背景音成分とを含むチャンネルの音声信号から、ダイアログ成分の音声信号と背景音成分の音声信号とを分離する手法)は既知であり、様々な手法がある。チャンネル分離手段16は、どのよな分離手法を用いてもよく、その手法は問わない。
また、チャンネル分離手段16は、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号を特定し、特定したチャンネルの音声信号をそのまま変換前ラウドネス値算出手段11に出力する。
以上のように、本発明の他の実施形態の番組音声チャンネル数変換装置2によれば、番組音声チャンネル数変換装置1の構成に加え、メタデータ抽出手段15は、入力音声信号に含まれるメタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出し、チャンネル分離手段16は、ダイアログ成分と背景音成分とを含むチャンネルの音声信号からダイアログ及び背景音を分離するようにした。
これにより、入力音声信号に、ダイアログ成分と背景音成分とを含むチャンネルの音声信号が存在する場合であっても、また、チャンネル配置情報、ダイアログ判定値及び目標ラウドネス値が予め設定されない場合であっても、変換前ラウドネス値算出手段11は、変換前のラウドネス値を算出することができ、チャンネル数変換手段12は、入力音声信号のチャンネル数を変換することができ、変換後ラウドネス値算出手段13は、変換後のラウドネス値を算出することができる。したがって、本発明の実施形態の番組音声チャンネル数変換装置1と同様に、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能となる。
尚、本発明の実施形態による番組音声チャンネル数変換装置1のハードウェア構成及び本発明の他の実施形態による番組音声チャンネル数変換装置2のハードウェア構成としては、通常のコンピュータを使用することができる。番組音声チャンネル数変換装置1,2は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。番組音声チャンネル数変換装置1に備えた変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13及びラウドネス調整手段14の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、番組音声チャンネル数変換装置2に備えた変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。
以上、実施形態及び他の実施形態を挙げて本発明を説明したが、本発明は前記実施形態及び前記他の実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、前記実施形態及び前記他の実施形態では、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13は、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法により平均ラウドネス値を算出するようにしたが、平均ラウドネス値の代わりに、平均音圧レベル、5%時間率平均音圧レベル等のような音の大きさを表す指標を算出するようにしてもよい。平均ラウドネス値は音の大きさの主観量に対応する数値であるのに対し、平均音圧レベルは音の大きさの客観量に対応する数値である。
この場合、変換前ラウドネス値算出手段11は、入力音声信号における全チャンネルの音の大きさ、入力音声信号に含まれるダイアログの大きさ、及び入力音声信号に含まれる背景音の大きさをそれぞれ算出し、変換後ラウドネス値算出手段13は、チャンネル数変換手段12によりチャンネル数が変換された変換後の音声信号における全チャンネルの音の大きさ、変換後の音声信号に含まれるダイアログの大きさ、及び変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する。そして、ラウドネス調整手段14は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13により算出されたチャンネル数変換前後の音の大きさに基づいて、チャンネル数変換後の音声信号のレベルを調整する。
また、前記実施形態及び前記他の実施形態では、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13は、番組の全区間についての平均ラウドネス値を算出するようにしたが、一定時間毎の短時間ラウドネス値を算出するようにしてもよい。ラウドネス調整手段14は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13により算出された一定時間毎の短時間ラウドネス値に基づいて、前記一定時間毎に、チャンネル数変換後の音声信号のレベルを調整する。これにより、生放送番組等に対応した逐次処理を行うことが可能となる。
また、前記他の実施形態では、番組音声チャンネル数変換装置2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16を備えて構成するようにしたが、これらの構成部からメタデータ抽出手段15を除いて構成するようにしてもよい。チャンネル配置情報、ダイアログ判定値及び目標ラウドネス値は、図1に示した番組音声チャンネル数変換装置1と同様に、予め設定される。これにより、番組音声チャンネル数変換装置2は、入力音声信号からメタデータを抽出する必要がなく、メタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出する必要がないから、処理負荷を低減することができる。
さらに、番組音声チャンネル数変換装置2は、図8に示した構成部からチャンネル分離手段16を除いて構成するようにしてもよい。入力音声信号における各チャンネルの音声信号は、ダイアログ及び背景音のうちのいずれかである。
また、前記実施形態では、入力音声信号にダイアログのチャンネルが含まれる場合について説明し、前記他の実施形態では、入力音声信号を構成する少なくとも1つのチャンネルの音声信号にダイアログ成分及び背景音成分が含まれる場合について説明した。これらは、入力音声信号からダイアログを区別することができる場合を想定している。しかし、前記実施形態において、ユーザがチャンネル配置情報等を予め入手することができない場合、または、前記他の実施形態において、入力音声信号にメタデータが付与されていない場合があり得る。また、前記他の実施形態において、番組音声チャンネル数変換装置2のチャンネル分離手段16による音源分離技術を用いたとしても、入力音声信号からダイアログを分離することができない場合もあり得る。この場合、入力音声信号からダイアログを区別することができない。
そこで、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、入力音声信号のセンターチャンネル(C−ch:Centre channel)、センターチャンネル及び両サイドのチャンネル(L−ch(レフトチャンネル):Left channel,R−ch(ライトチャンネル):Right channel)、または、センターチャンネル及び上層・下層のセンターチャンネル(TpFC:Top front centre channel/Cv:centre front vertical height,BtFC:Bottom front centre channel/Cb:centre front vertical bottom)を、ダイアログチャンネルとして扱うみなし処理を行うようにしてもよい。また、変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つのチャンネルを、ダイアログチャンネルとして扱うみなし処理を行うようにしてもよい。一般に、これらのチャンネルの音声信号には、多くのダイアログ成分が含まれるからである。
この場合、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、それぞれ切り替え段を備えるようにしてもよい。切り替え段は、入力音声信号を入力し、予め設定された切り替え指定がダイアログチャンネルを設定する指定である場合、前述のダイアログチャンネルのみなし処理を行う。一方、切り替え段は、予め設定された切り替え指定がダイアログチャンネルを設定しない指定である場合、前述のダイアログチャンネルのみなし処理を行わない。変換前ラウドネス値算出手段11は、チャンネル数変換前の全チャンネルのラウドネス値のみを算出し、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルのラウドネス値のみを算出する。また、ラウドネス調整手段14は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値と一致するように、チャンネル数変換後の音声信号のレベルを調整する。
また、入力音声信号における全チャンネルの音声信号がダイアログ成分を含まない場合も同様に、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11は、チャンネル数変換前の全チャンネルのラウドネス値のみを算出し、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルのラウドネス値のみを算出し、ラウドネス調整手段14は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値と一致するように、チャンネル数変換後の音声信号のレベルを調整する。変換前ラウドネス値算出手段11、変換後ラウドネス値算出手段13及びラウドネス調整手段14は、ダイアログ判定値に基づいて、入力音声信号における全チャンネルの音声信号がダイアログ成分を含まないことを判定する。
また、番組音声チャンネル数変換装置1,2は、放送番組の映像信号及び音声信号を受信してこれらを再生する放送番組受信装置に適用することができる。放送番組受信装置は、図1に示した番組音声チャンネル数変換装置1、または図8に示した番組音声チャンネル数変換装置2を備えて構成される。
本発明による番組音声チャンネル数変換装置は、番組制作時若しくは番組交換時における音声フォーマット変換、または放送番組受信装置での再生システムへの適応変換において有用である。
1,2 番組音声チャンネル数変換装置
11 変換前ラウドネス値算出手段(変換前算出手段)
12 チャンネル数変換手段
13 変換後ラウドネス値算出手段(変換後算出手段)
14 ラウドネス調整手段(調整手段)
15 メタデータ抽出手段
16 チャンネル分離手段
21 フィルタ処理段
22 二乗平均段
23 重み処理段
24 分類段
25 加算段
26 絶対及び相対ゲーティング段
31 目標ラウドネス値算出段
32 レベル調整段

Claims (8)

  1. 番組の入力音声信号のチャンネル数を変換し、出力音声信号を生成する番組音声チャンネル数変換装置において、
    前記入力音声信号における全チャンネルの音の大きさ、前記入力音声信号に含まれるダイアログの大きさ、及び前記入力音声信号に含まれる背景音の大きさをそれぞれ算出する変換前算出手段と、
    前記入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成するチャンネル数変換手段と、
    前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号における全チャンネルの音の大きさ、前記チャンネル数変換後の音声信号に含まれるダイアログの大きさ、及び前記チャンネル数変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する変換後算出手段と、
    全チャンネルの音の大きさが前記変換前算出手段により算出された全チャンネルの音の大きさに一致し、かつ、ダイアログの大きさが前記変換前算出手段により算出されたダイアログの大きさ以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する調整手段と、
    を備えたことを特徴とする番組音声チャンネル数変換装置。
  2. 請求項1に記載の番組音声チャンネル数変換装置において、
    前記変換前算出手段の代わりに変換前ラウドネス値算出手段を、前記変換後算出手段の代わりに変換後ラウドネス値算出手段を、前記調整手段の代わりにラウドネス調整手段をそれぞれ備え、
    前記変換前ラウドネス値算出手段は、
    前記入力音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記入力音声信号に含まれるダイアログの平均ラウドネス値、及び前記入力音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、
    前記変換後ラウドネス値算出手段は、
    前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記チャンネル数変換後の音声信号に含まれるダイアログの平均ラウドネス値、及び前記チャンネル数変換後の音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、
    前記ラウドネス調整手段は、
    全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致し、かつ、ダイアログの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出されたダイアログの平均ラウドネス値以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする番組音声チャンネル数変換装置。
  3. 請求項2に記載の番組音声チャンネル数変換装置において、
    さらに、メタデータ抽出手段を備え、
    前記メタデータ抽出手段は、
    前記入力音声信号からメタデータを抽出し、前記メタデータから、前記平均ラウドネス値を算出する際に用いるデータであって、チャンネル数変換前後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、及び各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値を抽出する、ことを特徴とする番組音声チャンネル数変換装置。
  4. 請求項2または3に記載の番組音声チャンネル数変換装置において、
    さらに、チャンネル分離手段を備え、
    前記チャンネル分離手段は、
    前記入力音声信号を構成する各チャンネルの音声信号のうち、ダイアログ成分及び背景音成分を含むチャンネルの音声信号から、前記ダイアログ成分の音声信号であるダイアログと前記背景音成分の音声信号である背景音とを分離する、ことを特徴とする番組音声チャンネル数変換装置。
  5. 請求項2から4までのいずれか一項に記載の番組音声チャンネル数変換装置において、
    前記入力音声信号の各チャンネルのうち、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つをダイアログチャンネルとして扱うみなし処理を行い、前記ダイアログチャンネルの音声信号を、前記入力音声信号に含まれるダイアログとする、ことを特徴とする番組音声チャンネル数変換装置。
  6. 請求項5に記載の番組音声チャンネル数変換装置において、
    予め設定された指定に基づいて、前記みなし処理を行い、
    前記指定がみなし処理を行わないことを示している場合、前記みなし処理を行うことなく、前記変換前ラウドネス値算出手段は、前記入力音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記変換後ラウドネス値算出手段は、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記ラウドネス調整手段は、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする番組音声チャンネル数変換装置。
  7. コンピュータを、請求項1から6までのいずれか一項に記載の番組音声チャンネル数変換装置として機能させるための番組音声チャンネル数変換プログラム。
  8. 放送番組の映像信号及び音声信号を受信し、前記映像信号及び前記音声信号を再生する放送番組受信装置において、
    請求項1から6までのいずれか一項に記載の番組音声チャンネル数変換装置を備えたことを特徴とする放送番組受信装置。
JP2015086160A 2015-04-20 2015-04-20 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム Active JP6510870B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015086160A JP6510870B2 (ja) 2015-04-20 2015-04-20 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015086160A JP6510870B2 (ja) 2015-04-20 2015-04-20 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム

Publications (2)

Publication Number Publication Date
JP2016208189A true JP2016208189A (ja) 2016-12-08
JP6510870B2 JP6510870B2 (ja) 2019-05-08

Family

ID=57487298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015086160A Active JP6510870B2 (ja) 2015-04-20 2015-04-20 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム

Country Status (1)

Country Link
JP (1) JP6510870B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513212A (zh) * 2018-02-12 2018-09-07 深圳市易科声光科技有限公司 一种运行过程中切换音频通道的方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308200A (ja) * 1999-04-20 2000-11-02 Nippon Columbia Co Ltd 音響信号処理回路及び増幅装置
JP2001245237A (ja) * 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
JP2004048741A (ja) * 2002-06-24 2004-02-12 Agere Systems Inc オーディオミキシングのための等化技術
JP2007142862A (ja) * 2005-11-18 2007-06-07 Sharp Corp テレビジョン受信装置
WO2010076850A1 (ja) * 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2012034295A (ja) * 2010-08-02 2012-02-16 Nippon Hoso Kyokai <Nhk> 音響信号変換装置及び音響信号変換プログラム
JP2013157659A (ja) * 2012-01-26 2013-08-15 Nippon Hoso Kyokai <Nhk> ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
JP2014204320A (ja) * 2013-04-05 2014-10-27 日本放送協会 音響信号再生装置、音響信号作成装置
WO2015038522A1 (en) * 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308200A (ja) * 1999-04-20 2000-11-02 Nippon Columbia Co Ltd 音響信号処理回路及び増幅装置
JP2001245237A (ja) * 2000-02-28 2001-09-07 Victor Co Of Japan Ltd 放送受信装置
JP2004048741A (ja) * 2002-06-24 2004-02-12 Agere Systems Inc オーディオミキシングのための等化技術
JP2007142862A (ja) * 2005-11-18 2007-06-07 Sharp Corp テレビジョン受信装置
WO2010076850A1 (ja) * 2009-01-05 2010-07-08 パナソニック株式会社 音場制御装置及び音場制御方法
JP2012034295A (ja) * 2010-08-02 2012-02-16 Nippon Hoso Kyokai <Nhk> 音響信号変換装置及び音響信号変換プログラム
JP2013157659A (ja) * 2012-01-26 2013-08-15 Nippon Hoso Kyokai <Nhk> ラウドネスレンジ制御システム、伝送装置、受信装置、伝送用プログラム、および受信用プログラム
JP2014204320A (ja) * 2013-04-05 2014-10-27 日本放送協会 音響信号再生装置、音響信号作成装置
WO2015038522A1 (en) * 2013-09-12 2015-03-19 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513212A (zh) * 2018-02-12 2018-09-07 深圳市易科声光科技有限公司 一种运行过程中切换音频通道的方法及装置

Also Published As

Publication number Publication date
JP6510870B2 (ja) 2019-05-08

Similar Documents

Publication Publication Date Title
JP5149968B2 (ja) スピーチ信号処理を含むマルチチャンネル信号を生成するための装置および方法
JP5658506B2 (ja) 音響信号変換装置及び音響信号変換プログラム
KR101803293B1 (ko) 입체 음향 효과를 제공하는 신호 처리 장치 및 신호 처리 방법
TW201514455A (zh) 產生多重頻道聲音訊號之方法,該訊號用於揚聲器頻道的l1頻道至不同的l2頻道,及產生多重頻道聲音訊號之裝置,該訊號用於揚聲器頻道的l1頻道至不同的l2頻道
JP2015528925A (ja) オーディオ信号処理装置および方法
KR20190085988A (ko) 상관해제 필터들의 적응적 제어를 위한 방법 및 장치
US10524081B2 (en) Sound processing device, sound processing method, and sound processing program
KR101485462B1 (ko) 후방향 오디오 채널의 적응적 리마스터링 장치 및 방법
EP3808106A1 (en) Spatial audio capture, transmission and reproduction
GB2605970A (en) Content based spatial remixing
KR101637407B1 (ko) 부가적인 출력 채널들을 제공하기 위하여 스테레오 출력 신호를 발생시키기 위한 장치와 방법 및 컴퓨터 프로그램
US20230254655A1 (en) Signal processing apparatus and method, and program
KR20120132342A (ko) 보컬 신호 제거 장치 및 방법
JP4810621B1 (ja) 音声信号変換装置、方法、プログラム、及び記録媒体
JP2022502872A (ja) 低音マネジメントのための方法及び装置
KR102231755B1 (ko) 입체 음향 재생 방법 및 장치
JP6510870B2 (ja) 番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラム
WO2018155164A1 (ja) フィルタ生成装置、フィルタ生成方法、及びプログラム
JP6832095B2 (ja) チャンネル数変換装置およびそのプログラム
Hirvonen et al. Top-down strategies in parameter selection of sinusoidal modeling of audio
JP6231762B2 (ja) 受信装置及びプログラム
KR102380232B1 (ko) 입체 음향 재생 방법 및 장치
EP3855765B1 (en) Processing device, processing method, reproduction method, and program
JP2017212732A (ja) チャンネル数変換装置およびプログラム
KR20230119192A (ko) 스테레오 헤드폰 심리음향 음 위치측정 시스템 및 이를사용한 스테레오 심리음향 음 신호를 재구성하기 위한 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190405

R150 Certificate of patent or registration of utility model

Ref document number: 6510870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250