JP6510870B2 - Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program - Google Patents

Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program Download PDF

Info

Publication number
JP6510870B2
JP6510870B2 JP2015086160A JP2015086160A JP6510870B2 JP 6510870 B2 JP6510870 B2 JP 6510870B2 JP 2015086160 A JP2015086160 A JP 2015086160A JP 2015086160 A JP2015086160 A JP 2015086160A JP 6510870 B2 JP6510870 B2 JP 6510870B2
Authority
JP
Japan
Prior art keywords
conversion
channel
audio signal
channels
program
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015086160A
Other languages
Japanese (ja)
Other versions
JP2016208189A (en
Inventor
大出 訓史
訓史 大出
小森 智康
智康 小森
一穂 小野
一穂 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2015086160A priority Critical patent/JP6510870B2/en
Publication of JP2016208189A publication Critical patent/JP2016208189A/en
Application granted granted Critical
Publication of JP6510870B2 publication Critical patent/JP6510870B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、番組音声の送出時または受信時に、番組音声の制作時とは異なるチャンネル数の音響方式で再生するために、番組音声のチャンネル数を変換する番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラムに関する。   The present invention relates to a program audio channel number converter for converting the number of channels of program audio in order to reproduce the sound of a different number of channels from that of the production of program audio at the time of transmission or reception of program audio. Apparatus and program audio channel number conversion program

従来、番組音声のチャンネル数を変換する際に、予め設定された変換係数(非特許文献1,2を参照)、または各チャンネルの音声信号の再生時に想定される位置(想定されるスピーカの位置)及び角度から算出された変換係数(非特許文献3を参照)が用いられる。具体的には、チャンネル数変換前の各チャンネルの音声信号に変換係数が乗算され、乗算結果が加算されることにより、チャンネル数変換後の音声信号が生成される。   Conventionally, when converting the number of channels of program audio, conversion coefficients set in advance (see non-patent documents 1 and 2) or positions assumed when reproducing audio signals of respective channels (positions of assumed speakers And transform coefficients (see Non-Patent Document 3) calculated from angles. Specifically, the audio signal of each channel before channel number conversion is multiplied by the conversion coefficient, and the multiplication result is added to generate an audio signal after channel number conversion.

例えば、22.2chの音響方式から5.1chの音響方式へチャンネル数を変換する技術、及び5.1chの音響方式から2chの音響方式へチャンネル数を変換する技術は、前記非特許文献1の標準規格ARIB STD−B32、及び前記非特許文献2の勧告ITU−R BS.775−3等に記載されている。   For example, the technology for converting the number of channels from 22.2 channel acoustic system to 5.1 channel audio system and the technology for converting the number of channels from 5.1 channel audio system to 2 channels acoustic system are described in Non-Patent Document 1 Recommendation ITU-R BS.2 of the standard ARIB STD-B 32 and the aforementioned Non-Patent Document 2. 775-3 and the like.

このようなチャンネル数変換手法は、各チャンネルの音声信号の再生位置に基づいており、音声信号がダイアログであるか、楽器音または背景音であるかに関わることなく、一定の変換係数が用いられる。   Such a channel number conversion method is based on the reproduction position of the audio signal of each channel, and a constant conversion coefficient is used regardless of whether the audio signal is a dialog, an instrumental sound or a background sound. .

しかしながら、例えば番組の視聴者が高齢者の場合には、背景音の影響でダイアログが聞き取り難いという傾向がある。この場合、ダイアログ及び背景音の音圧レベルは、高齢者に適するように調整されることが望ましい(非特許文献4を参照)。   However, for example, when the viewer of the program is an elderly person, there is a tendency that the dialog is difficult to hear due to the influence of the background sound. In this case, it is desirable that the sound pressure levels of the dialog and the background sound be adjusted to be suitable for elderly people (see Non-Patent Document 4).

一方で、番組音声の大きさを評価するラウドネス値の測定法が知られており、このラウドネス測定法にて測定される平均ラウドネス値により、番組音声レベルの管理が行われている(非特許文献5を参照)。このラウドネス測定法に従い、番組の全区間(番組の開始時点から終了時点までの間の全時間区間)の平均ラウドネス値が目標ラウドネス値(−24LKFS)の許容範囲内(±1dB)に収まるように、番組制作の運用が定められている(非特許文献6を参照)。これにより、番組間及び放送局間の番組音声の音量感を統一することができる。   On the other hand, there is known a measurement method of loudness value for evaluating the size of program sound, and management of program sound level is performed by the average loudness value measured by this loudness measurement method (non-patent document) 5). According to this loudness measurement method, the average loudness value of all sections of the program (all time sections from the start time point to the end time point of the program) falls within the tolerance (± 1 dB) of the target loudness value (-24 LKFS) The operation of program production is defined (see Non-Patent Document 6). This makes it possible to unify the volume feeling of program sound between programs and between broadcast stations.

ARIB標準規格、ARIB STD−B32 3.0版、“デジタル放送における映像符号化、音声符号化及び多重化方式”ARIB Standard, ARIB STD-B32 Version 3.0, "Video Coding, Audio Coding and Multiplexing in Digital Broadcasting" ITU勧告、Recommendation ITU−R BS.775−3、“Multichannel stereophonic sound system with and without accompanying picture”Recommendation ITU Recommendation ITU-R BS. 775-3, "Multichannel stereophonic sound system with and without accompanied picture" Ville Pulkki、“Localization of amplitude-panned virtual sources II:two- and three-dimensional panning”、J.AudioEng. Soc.、Vol.49、No.9、pp.753-767、2001Ville Pulkki, “Localization of amplitude-panned virtual sources II: two- and three-dimensional panning”, J. Audio Eng. Soc., Vol. 49, No. 9, pp. 753-767, 2001 小森、都木、黒住、庄田、村川、“高齢者にも聞きやすい放送番組の音量バランス客観評価技術”、電子情報通信学会技術研究報告WIT、vol.110、no.164、pp.35-40、2010Komori, Miyako, Kurozumi, Shibata, Murakawa, "Technology volume objective evaluation technology for broadcast programs easy to hear even by the elderly," IEICE technical research report W.I.T., no.164, pp.35-40 , 2010 ITU勧告、Recommendation ITU−R BS.1770−3、“Algorithms to measure audio programme loudness and true-peak audio level”Recommendation ITU Recommendation ITU-R BS. 1770-3, "Algorithms to measure audio program loudness and true-peak audio level" ARIB技術資料、ARIB TR−B32、“デジタルテレビ放送番組におけるラウドネス運用規定”ARIB technical data, ARIB TR-B32, "Loudness operation rules for digital television broadcast programs"

前述のとおり、従来のチャンネル数変換手法では、チャンネル数を変換するための変換係数として、音声信号の種類に関わらず、各チャンネルの音声信号の再生位置に基づいた一定値を用いていた。このため、特に番組の視聴者が高齢者の場合には、番組によって、チャンネル数変換後の音声信号では、背景音の影響でダイアログが聞き難くなることがあった。   As described above, in the conventional channel number conversion method, a constant value based on the reproduction position of the audio signal of each channel is used as a conversion coefficient for converting the number of channels regardless of the type of audio signal. For this reason, particularly when the viewer of the program is an elderly person, it may be difficult to hear the dialog due to the influence of the background sound in the audio signal after channel number conversion depending on the program.

また、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法では、各チャンネルの音声信号に対し、その再生位置に応じて異なる重み係数が乗算される。再生位置による重み係数とチャンネル数変換に用いられる係数が異なるため、チャンネル数が変換される前後で平均ラウドネス値が変わってしまい、番組の全区間の平均ラウドネス値が、目標ラウドネス値の許容範囲内に収まらないことがあった。   In addition, Recommendation ITU-R BS. In the loudness measurement method defined in 1770-3, the audio signal of each channel is multiplied by different weighting factors according to the reproduction position. Because the weighting coefficient according to the playback position and the coefficient used for channel number conversion are different, the average loudness value changes before and after the channel number is converted, and the average loudness value of all sections of the program is within the tolerance of the target loudness value. There were times when it did not fit.

そこで、本発明は前記課題を解決するためになされたものであり、その目的は、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能な番組音声チャンネル数変換装置、放送番組受信装置及び番組音声チャンネル数変換プログラムを提供することにある。   Therefore, the present invention has been made to solve the above-mentioned problem, and its object is to make the average loudness value constant before and after converting the number of channels, and to keep the ease of listening to the dialog. A channel number conversion device, a broadcast program reception device, and a program sound channel number conversion program.

前記目的を達成するために、本発明による番組音声チャンネル数変換装置は、番組の入力音声信号のチャンネル数を変換し、出力音声信号を生成する番組音声チャンネル数変換装置において、前記入力音声信号における全チャンネルの音の大きさ、前記入力音声信号に含まれるダイアログの大きさ、及び前記入力音声信号に含まれる背景音の大きさをそれぞれ算出する変換前算出手段と、前記入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成するチャンネル数変換手段と、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号における全チャンネルの音の大きさ、前記チャンネル数変換後の音声信号に含まれるダイアログの大きさ、及び前記チャンネル数変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する変換後算出手段と、全チャンネルの音の大きさが前記変換前算出手段により算出された全チャンネルの音の大きさに一致し、かつ、ダイアログの大きさが前記変換前算出手段により算出されたダイアログの大きさ以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する調整手段と、を備えたことを特徴とする。   In order to achieve the above object, a program audio channel number converter according to the present invention converts the number of channels of an input audio signal of a program and generates an output audio signal. Pre-conversion calculation means for calculating the size of the sound of all channels, the size of the dialog contained in the input audio signal, and the size of the background sound contained in the input audio signal, and the number of channels of the input audio signal Means for converting the number of channels and generating an audio signal after conversion of the number of channels, and the size of sound of all channels in the audio signal after conversion of the number of channels generated by the number of channels conversion means; Size of the dialog included in the audio signal of the background sound, and the background sound included in the audio signal after the channel number conversion The post-conversion calculation means for calculating the magnitudes respectively, and the sizes of the sounds of all the channels match the sizes of the sounds of all the channels calculated by the pre-conversion calculation means, and the size of the dialog is the pre-conversion Adjusting means for adjusting the level of the audio signal after channel number conversion generated by the channel number conversion means so as to coincide with a predetermined value equal to or larger than the size of the dialog calculated by the calculation means It features.

また、本発明による番組音声チャンネル数変換装置は、前記変換前算出手段の代わりに変換前ラウドネス値算出手段を、前記変換後算出手段の代わりに変換後ラウドネス値算出手段を、前記調整手段の代わりにラウドネス調整手段をそれぞれ備え、前記変換前ラウドネス値算出手段が、前記入力音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記入力音声信号に含まれるダイアログの平均ラウドネス値、及び前記入力音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、前記変換後ラウドネス値算出手段が、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記チャンネル数変換後の音声信号に含まれるダイアログの平均ラウドネス値、及び前記チャンネル数変換後の音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、前記ラウドネス調整手段が、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致し、かつ、ダイアログの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出されたダイアログの平均ラウドネス値以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする。   In the program audio channel number conversion device according to the present invention, the pre-conversion loudness value calculation means instead of the pre-conversion calculation means, the post-conversion loudness value calculation means instead of the post-conversion calculation means, and the adjustment means And the pre-conversion loudness value calculating means, for the input audio signal, the average loudness values of all channels and the average loudness of the dialog contained in the input audio signal for all time intervals of the program. Value and the average loudness value of the background sound included in the input audio signal are calculated respectively, and the converted loudness value calculating means calculates the number of channels after conversion of the audio signal after conversion by the channel number converting means. Average loudness value of all channels for all time segments of the program, after conversion of the number of channels The average loudness value of the dialog contained in the voice signal and the average loudness value of the background sound contained in the audio signal after the channel number conversion are respectively calculated, and the loudness adjustment means calculates the average loudness values of all the channels before the conversion. The average loudness value of the dialog matches the average loudness value of all the channels calculated by the loudness value calculation means, and the average loudness value of the dialog matches the predetermined loudness value of the dialog calculated by the pre-conversion loudness value calculation means And adjusting the level of the audio signal after channel number conversion generated by the channel number conversion means.

また、本発明による番組音声チャンネル数変換装置は、さらに、メタデータ抽出手段を備え、前記メタデータ抽出手段が、前記入力音声信号からメタデータを抽出し、前記メタデータから、前記平均ラウドネス値を算出する際に用いるデータであって、チャンネル数変換前後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、及び各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値を抽出する、ことを特徴とする。   The apparatus for converting the number of program audio channels according to the present invention further includes metadata extraction means, wherein the metadata extraction means extracts metadata from the input audio signal, and the average loudness value is extracted from the metadata. It is data used when calculating, and the channel determination information on the reproduction position of the audio signal of each channel before and after the channel number conversion, and the dialog determination value indicating whether the audio signal of each channel is the dialog or the background sound. It is characterized by extracting.

また、本発明による番組音声チャンネル数変換装置は、さらに、チャンネル分離手段を備え、前記チャンネル分離手段が、前記入力音声信号を構成する各チャンネルの音声信号のうち、ダイアログ成分及び背景音成分を含むチャンネルの音声信号から、前記ダイアログ成分の音声信号であるダイアログと前記背景音成分の音声信号である背景音とを分離する、ことを特徴とする。   The apparatus for converting number of program audio channels according to the present invention further includes channel separating means, and the channel separating means includes a dialog component and a background sound component among audio signals of each channel constituting the input audio signal. It is characterized in that the dialog which is the audio signal of the dialog component and the background sound which is the audio signal of the background sound component are separated from the audio signal of the channel.

また、本発明による番組音声チャンネル数変換装置は、前記入力音声信号の各チャンネルのうち、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つをダイアログチャンネルとして扱うみなし処理を行い、前記ダイアログチャンネルの音声信号を、前記入力音声信号に含まれるダイアログとする、ことを特徴とする。   In the program audio channel number converter according to the present invention, at least one of the center channel, left channel, light channel, upper layer center channel and lower layer center channel among the channels of the input audio signal is a dialog channel And treating the audio signal of the dialog channel as the dialog included in the input audio signal.

また、本発明による番組音声チャンネル数変換装置は、予め設定された指定に基づいて、前記みなし処理を行い、前記指定がみなし処理を行わないことを示している場合、前記みなし処理を行うことなく、前記変換前ラウドネス値算出手段が、前記入力音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記変換後ラウドネス値算出手段が、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記ラウドネス調整手段が、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする。   Further, the program audio channel number conversion device according to the present invention performs the above-mentioned assumption processing based on a preset designation, and when the designation indicates that the designation processing is not performed, the above-mentioned assumption processing is not performed. The pre-conversion loudness value calculating means calculates, for the input audio signal, only the loudness values of all channels for the entire time interval of the program, and the post-conversion loudness value calculating means generates the channel number converting means. Only the loudness value of all channels is calculated for the entire time interval of the program for the audio signal after the channel number conversion, and the loudness adjustment means calculates the average loudness value of all channels by the pre-conversion loudness value calculation means In the channel number conversion means to match the calculated average loudness value of all the channels Adjusting the level of the audio signal after the number of channels converted generated Ri, characterized in that.

さらに、本発明による番組音声チャンネル数変換プログラムは、コンピュータを、前記番組音声チャンネル数変換装置として機能させることを特徴とする。   Furthermore, the program sound channel number conversion program according to the present invention causes a computer to function as the program sound channel number conversion device.

また、本発明による放送番組受信装置は、放送番組の映像信号及び音声信号を受信し、前記映像信号及び前記音声信号を再生する放送番組受信装置において、前記番組音声チャンネル数変換装置を備えたことを特徴とする。   A broadcast program receiving apparatus according to the present invention is a broadcast program receiving apparatus that receives a video signal and an audio signal of a broadcast program and reproduces the video signal and the audio signal, and includes the program audio channel number conversion apparatus. It is characterized by

以上のように、本発明によれば、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能となる。   As described above, according to the present invention, it is possible to keep the average loudness value constant and to keep the dialog easy to hear before and after converting the number of channels.

本発明の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。It is a block diagram showing composition of a program sound channel number conversion device by an embodiment of the present invention. 番組音声チャンネル数変換装置の処理を示すフローチャートである。It is a flow chart which shows processing of a program sound channel number conversion device. 変換前ラウドネス値算出手段の構成例を示すブロック図である。It is a block diagram which shows the structural example of a pre-conversion loudness value calculation means. ラウドネス調整手段により調整されるラウドネス値を説明する図である。It is a figure explaining the loudness value adjusted by the loudness adjustment means. ラウドネス調整手段の構成例を示すブロック図である。It is a block diagram showing an example of composition of loudness adjustment means. ラウドネス調整手段の処理を示すフローチャートである。It is a flow chart which shows processing of loudness adjustment means. ラウドネス調整手段により調整されるラウドネス値及び出力音声信号を説明する図であるIt is a figure explaining the loudness value and output sound signal adjusted by the loudness adjustment means. 本発明の他の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。It is a block diagram which shows the structure of the program sound channel number conversion apparatus by other embodiment of this invention.

以下、本発明を実施するための形態について図面を用いて詳細に説明する。本発明は、音声信号のチャンネル数を変換する際に、チャンネル数変換前後における全チャンネルの音の大きさが一致し、かつ、チャンネル数変換前後のダイアログの大きさが同じになり、またはチャンネル数変換後のダイアログの大きさがチャンネル数変換前よりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整することを特徴とする。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. According to the present invention, when converting the number of channels of the audio signal, the loudness of all the channels before and after the conversion of the number of channels match, and the size of the dialog before and after the conversion of the number of channels becomes the same, or It is characterized in that the level of the audio signal after channel number conversion is adjusted so that the size of the dialog after conversion is larger than that before channel number conversion.

〔番組音声チャンネル数変換装置〕
まず、本発明の実施形態による番組音声チャンネル数変換装置について説明する。図1は、本発明の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図であり、図2は、番組音声チャンネル数変換装置の処理を示すフローチャートである。この番組音声チャンネル数変換装置1は、変換前ラウドネス値算出手段(変換前算出手段)11、チャンネル数変換手段12、変換後ラウドネス値算出手段(変換後算出手段)13及びラウドネス調整手段(調整手段)14を備えている。
[Program audio channel number converter]
First, a program sound channel number conversion apparatus according to an embodiment of the present invention will be described. FIG. 1 is a block diagram showing a configuration of a program sound channel number conversion device according to an embodiment of the present invention, and FIG. 2 is a flowchart showing processing of the program sound channel number conversion device. This program sound channel number conversion device 1 comprises: pre-conversion loudness value calculation means (pre-conversion calculation means) 11, channel number conversion means 12, post-conversion loudness value calculation means (post-conversion calculation means) 13 and loudness adjustment means (adjustment means) ) Has 14).

番組音声チャンネル数変換装置1には、N個のチャンネルにて制作された番組音声である入力音声信号、チャンネル数変換前における各チャンネルの音声信号の再生位置及びチャンネル数変換後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値、並びに、番組の全区間における平均ラウドネス値の目標値である目標ラウドネス値がそれぞれ入力される。そして、番組音声チャンネル数変換装置1により、チャンネル数Nの音声信号がチャンネル数Mの音声信号に変換され、M個のチャンネルに変換された番組音声が出力音声信号として出力される。ここで、M,Nは、一般に異なる正の整数であるが、再生位置が異なる場合は、M,Nが同数であってもよい。   In the program sound channel number conversion device 1, an input sound signal which is a program sound produced by N channels, a reproduction position of the sound signal of each channel before the channel number conversion, and a sound of each channel after the channel number conversion Channel arrangement information on the reproduction position of the signal, a dialog determination value indicating whether the audio signal of each channel is a dialog or background sound, and a target loudness value which is a target value of the average loudness value in all sections of the program It is input. Then, the program sound channel number conversion device 1 converts an audio signal of N channels into an audio signal of M channels, and outputs the program audio converted into M channels as an output audio signal. Here, M and N are generally different positive integers, but when the reproduction position is different, M and N may be the same.

チャンネル配置情報は、予め設定された情報として番組音声チャンネル数変換装置1に入力され、ダイアログ判定値及び目標ラウドネス値は、予め設定された値として番組音声チャンネル数変換装置1に入力される。   The channel allocation information is input to the program sound channel number conversion device 1 as preset information, and the dialog determination value and the target loudness value are input to the program sound channel number conversion device 1 as preset values.

(変換前ラウドネス値算出手段11)
変換前ラウドネス値算出手段11は、チャンネル数Nの入力音声信号、チャンネル配置情報及びダイアログ判定値を入力し、入力音声信号を構成する各チャンネルの音声信号について、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号(ダイアログ)と背景音チャンネルの音声信号(背景音)とに振り分けることで、各チャンネルの音声信号を分類する(ステップS201)。
(Pre-conversion loudness value calculation means 11)
The pre-conversion loudness value calculation means 11 inputs the input sound signal of the number N of channels, the channel arrangement information and the dialog determination value, and the audio channel of each channel constituting the input audio signal is a dialog channel based on the dialog determination value. The audio signal of each channel is classified by distributing it into the audio signal (dialog) of (1) and the audio signal (background sound) of the background sound channel (step S201).

変換前ラウドネス値算出手段11は、全チャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて全チャンネルの平均ラウドネス値を算出する(ステップS202)と共に、ステップS201にて分類したダイアログチャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いてダイアログの平均ラウドネス値を算出する(ステップS203)。また、変換前ラウドネス値算出手段11は、ステップS201にて分類した背景音チャンネルの音声信号に対し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて背景音の平均ラウドネス値を算出する(ステップS204)。   The pre-conversion loudness value calculating means 11 calculates the average loudness values of all channels for the entire channel of the audio signal of all channels using weighting factors based on channel allocation information (step S202). For the speech signal of the dialog channel classified in step S201, the average loudness value of the dialog is calculated for all sections of the program using a weighting factor or the like based on the channel arrangement information (step S203). Further, the pre-conversion loudness value calculating means 11 calculates the average loudness value of the background sound with respect to the sound signal of the background sound channel classified in step S201 using weighting factors based on the channel arrangement information for all sections of the program. Is calculated (step S204).

これにより、変換前ラウドネス値算出手段11において、チャンネル数変換前の全チャンネルの平均ラウドネス値、チャンネル数変換前のダイアログの平均ラウドネス値、及び、チャンネル数変換前の背景音の平均ラウドネス値が算出され、変換前のラウドネス値としてラウドネス調整手段14へ出力される。   By this, the average loudness value of all channels before channel number conversion, the average loudness value of dialog before channel number conversion, and the average loudness value of background sound before channel number conversion are calculated in the pre-conversion loudness value calculation means 11 And is output to the loudness adjustment means 14 as the loudness value before conversion.

図3は、変換前ラウドネス値算出手段11の構成例を示すブロック図であり、入力音声信号のチャンネル数が5(N=5)の場合を示している。この変換前ラウドネス値算出手段11は、フィルタ処理段21、二乗平均段22、重み処理段23、分類段24、加算段25、及び、絶対及び相対ゲーティング段26を備えている。   FIG. 3 is a block diagram showing a configuration example of the pre-conversion loudness value calculation means 11, and shows the case where the number of channels of the input sound signal is 5 (N = 5). The pre-conversion loudness value calculating means 11 comprises a filtering stage 21, a mean square stage 22, a weighting stage 23, a classification stage 24, an adding stage 25 and an absolute and relative gating stage 26.

フィルタ処理段21は、各チャンネルの音声信号を入力し、チャンネル毎に、音声信号に対してK特性フィルタ処理を施す。二乗平均段22は、チャンネル毎に、フィルタ処理段21によりK特性フィルタ処理が施された音声信号の二乗平均値を算出する。   The filter processing stage 21 inputs the audio signal of each channel, and performs K characteristic filter processing on the audio signal for each channel. The root mean square stage 22 calculates the root mean square value of the audio signal subjected to the K characteristic filtering process by the filtering stage 21 for each channel.

重み処理段23は、チャンネル配置情報に含まれるチャンネル数変換前における各チャンネルの音声信号の再生位置に基づいて、各チャンネルの重み係数を決定し、チャンネル毎に、二乗平均段22により算出された二乗平均値に、対応するチャンネルの重み係数を乗算する。ここで、重み処理段23には、チャンネル毎の再生位置に対応する重み係数が予め保持されており、各チャンネルの音声信号の再生位置及び予め保持された重み係数に従って、各チャンネルの重み係数が決定される。これにより、チャンネル毎に、重み係数が乗算された二乗平均値が得られる。   The weight processing stage 23 determines the weighting factor of each channel based on the reproduction position of the audio signal of each channel before the channel number conversion included in the channel layout information, and is calculated by the mean square stage 22 for each channel. The mean square value is multiplied by the weighting factor of the corresponding channel. Here, the weighting factor corresponding to the reproduction position for each channel is held in advance in the weight processing stage 23, and the weighting factor for each channel is determined according to the reproduction position of the audio signal of each channel and the weighting factor held in advance. It is determined. Thereby, the root mean square value multiplied by the weighting factor is obtained for each channel.

分類段24は、重み処理段23からチャンネル毎の重み係数が乗算された二乗平均値をそれぞれ入力し、ダイアログ判定値に基づいて、各チャンネルの音声信号をダイアログまたは背景音に分類する。そして、分類段24は、全チャンネルの二乗平均値、ダイアログの二乗平均値及び背景音の二乗平均値を加算段25に出力する。   The classification stage 24 receives the square average value multiplied by the weighting factor for each channel from the weight processing stage 23, and classifies the audio signal of each channel into a dialog or background sound based on the dialog determination value. Then, the classification stage 24 outputs the root mean square value of all channels, the root mean square value of the dialog and the root mean square value of the background sound to the adding stage 25.

加算段25は、分類段24から全チャンネルの二乗平均値、ダイアログの二乗平均値及び背景音の二乗平均値を入力する。そして、加算段25は、全チャンネルの二乗平均値を加算し、全チャンネルの二乗平均の瞬時値を求める。加算段25は、同様に、ダイアログの二乗平均値を加算し、ダイアログのみの二乗平均の瞬時値を求めると共に、背景音の二乗平均値を加算し、背景音のみの二乗平均の瞬時値を求める。   The addition stage 25 inputs from the classification stage 24 the root mean square value of all channels, the root mean square value of the dialog, and the root mean square value of the background sound. Then, the adding stage 25 adds the root mean square values of all channels to obtain an instantaneous root mean square value of all channels. Similarly, the addition stage 25 adds the root mean square value of the dialog to obtain an instantaneous root mean square value of the dialog alone, and adds the root mean square value of the background sound to find an instantaneous root mean square value of the background sound only .

絶対及び相対ゲーティング段26は、加算段25により求めた全チャンネルの二乗平均の瞬時値に対し、絶対ゲーティング処理及び相対ゲーティング処理を施し、番組の全区間について、全チャンネルの二乗平均値Ztを求める。また、絶対及び相対ゲーティング段26は、以下の式により、全チャンネルの二乗平均値Ztを全チャンネルの平均ラウドネス値Lt(LKFS)に変換する。
[数1]
t=−0.691+10log10t ・・・(1)
The absolute and relative gating stage 26 applies absolute gating processing and relative gating processing to the instantaneous value of the root mean square of all channels obtained by the adding stage 25, and the root mean value of all channels for all sections of the program. Calculate Z t . The absolute and relative gating stage 26, according to the following equation to convert the mean square value Z t of all channels in average loudness value L t of all channels (LKFS).
[Equation 1]
L t = −0.691 + 10 log 10 Z t (1)

絶対及び相対ゲーティング段26は、加算段25により求めたダイアログの二乗平均の瞬時値に対し、絶対ゲーティング処理及び相対ゲーティング処理を施し、番組の全区間について、ダイアログの二乗平均値Zdを求める。また、絶対及び相対ゲーティング段26は、以下の式により、ダイアログの二乗平均値Zdをダイアログの平均ラウドネス値Ldに変換する。
[数2]
d=−0.691+10log10d ・・・(2)
The absolute and relative gating stage 26 performs absolute gating processing and relative gating processing on the instantaneous value of the root mean square of the dialog determined by the adding stage 25 and calculates the root mean square value Z d of the dialog for all sections of the program. Ask for Also, the absolute and relative gating stage 26 transforms the dialog's root mean square value Z d into the dialog's average loudness value L d according to the following equation:
[Equation 2]
L d = −0.691 + 10 log 10 Z d (2)

絶対及び相対ゲーティング段26は、ダイアログの二乗平均値Zd及びラウドネス値Ldを求める処理と同様に、番組の全区間について、背景音の二乗平均値Zbを求め、以下の式により、背景音の二乗平均値Zbを背景音の平均ラウドネス値Lbに変換する。
[数3]
b=−0.691+10log10b ・・・(3)
The absolute and relative gating stage 26 obtains the root mean square value Z b of the background sound for the entire section of the program, similarly to the processing for obtaining the root mean square value Z d and the loudness value L d of the dialog, and The root mean square value Z b of the background sound is converted to the average loudness value L b of the background sound.
[Equation 3]
L b = −0.691 + 10 log 10 Z b (3)

図3の例は、チャンネル番号3の音声信号がダイアログであり、チャンネル番号1,2,4,5の音声信号が背景音である場合を示している。加算段25により、チャンネル番号1〜5の二乗平均値が加算されて全チャンネルの二乗平均の瞬時値が求められ、チャンネル番号3の二乗平均値がダイアログのみの二乗平均の瞬時値として求められ、チャンネル番号1,2,4,5の二乗平均値が加算されて背景音のみの二乗平均の瞬時値が求められる。そして、絶対及び相対ゲーティング段26により、チャンネル番号1〜5の音声信号について全チャンネルの二乗平均値Zt及び平均ラウドネス値Ltが求められ、チャンネル番号3の音声信号についてダイアログの二乗平均値Zd及び平均ラウドネス値Ldが求められ、チャンネル番号1,2,4,5の音声信号について背景音の二乗平均値Zb及び平均ラウドネス値Lbが求められる。 The example of FIG. 3 shows the case where the audio signal of channel number 3 is a dialog, and the audio signals of channel numbers 1, 2, 4, and 5 are background sounds. An adding stage 25 adds the root mean square values of channel numbers 1 to 5 to obtain an instantaneous root mean square value of all channels, and a root mean square value of channel number 3 is an instantaneous root mean square value of only dialog The root mean square values of channel numbers 1, 2, 4, and 5 are added to obtain an instantaneous root mean square value of only the background sound. The absolute and the relative gating stage 26, the audio signal of the channel numbers 1 to 5 mean square value Z t and the average loudness value L t of all channels are obtained, mean square value of the dialog for the audio signal of the channel number 3 Z d and average loudness value L d is determined, the audio signal of the channel numbers 1, 2, 4 mean square value Z b and average loudness value L b of the background noise is determined.

これにより、チャンネル数変換前のダイアログの音声信号と背景音の音声信号との間のミキシングバランスを知ることができる。変換前ラウドネス値算出手段11により算出されたチャンネル数変換前の全チャンネルの平均ラウドネス値(二乗平均値Zt及び平均ラウドネス値Lt)、チャンネル数変換前のダイアログの平均ラウドネス値(二乗平均値Zd及び平均ラウドネス値Ld)、及び、チャンネル数変換前の背景音の平均ラウドネス値(二乗平均値Zb及び平均ラウドネス値Lb)は、変換前のラウドネス値としてラウドネス調整手段14へ出力される。 This makes it possible to know the mixing balance between the speech signal of the dialog before the channel number conversion and the speech signal of the background sound. Average loudness value (square mean value Z t and average loudness value L t ) of all channels before channel number conversion calculated by the pre-conversion loudness value calculation means 11, average loudness value (square average value) of dialog before channel number conversion Z d and the average loudness value L d ), and the average loudness value of the background sound before conversion of the channel number (root mean value Z b and average loudness value L b ) are output to the loudness adjustment means 14 as the loudness values before conversion. Be done.

尚、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法によれば、平均ラウドネス値は、各チャンネルの音声信号にフィルタ処理を施し、二乗平均値を求め、重み係数を乗算し、全チャンネルを加算し、そして、絶対ゲーティング処理及び相対ゲーティング処理を行うことにより求められる。変換前ラウドネス値算出手段11のフィルタ処理段21、二乗平均段22、重み処理段23、加算段25及び絶対及び相対ゲーティング段26は、このラウドネス測定法に従った処理を行う。これらの処理の詳細については、前記非特許文献5の勧告ITU−R BS.1770−3及び前記非特許文献6の技術資料ARIB TR−B32を参照されたい。   In addition, Recommendation ITU-R BS. According to the loudness measurement method specified in 1770-3, the average loudness value filters the audio signal of each channel, obtains a root mean square value, multiplies weighting factors, adds all channels, and It is determined by performing absolute gating processing and relative gating processing. The filtering stage 21, the mean square stage 22, the weighting stage 23, the adding stage 25 and the absolute and relative gating stage 26 of the pre-conversion loudness value calculating means 11 perform processing according to this loudness measurement method. For details of these processes, refer to Recommendation ITU-R BS. 1770-3 and the technical data ARIB TR-B32 of the above-mentioned Non-Patent Document 6.

(チャンネル数変換手段12)
図1及び図2に戻って、チャンネル数変換手段12は、チャンネル数Nの入力音声信号、チャンネル配置情報及びダイアログ判定値を入力し、チャンネル配置情報及びダイアログ判定値に基づいて、チャンネル数変換前のチャンネル配置(入力音声信号を構成する各チャンネルの音声信号の配置)及びチャンネル数変換後のチャンネル配置(チャンネル数変換後の音声信号を構成する各チャンネルの音声信号の配置)を特定する。そして、チャンネル数変換手段12は、特定したチャンネル数変換前後のチャンネル配置に従い、予め設定された変換係数を用いて、入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成する。つまり、チャンネル数変換手段12は、予め設定された変換係数を用いて、番組全体のチャンネル数を変換すると共に、ダイアログ判定値に従って、予め設定された変換係数を用いて、ダイアログチャンネルの音声信号のみについてチャンネル数を変換し、また、背景音チャンネルの音声信号のみについてチャンネル数を変換する。
(Channel number conversion means 12)
Referring back to FIG. 1 and FIG. 2, the channel number conversion means 12 receives the input sound signal of channel number N, channel arrangement information and dialog determination value, and converts the channel number before conversion based on the channel arrangement information and dialog determination value. The channel arrangement (arrangement of the audio signal of each channel constituting the input audio signal) and the channel arrangement after the channel number conversion (arrangement of the audio signal of each channel constituting the audio signal after channel number conversion) are specified. Then, the number-of-channels conversion means 12 converts the number of channels of the input audio signal according to the channel arrangement before and after the specified number-of-channels conversion, and generates the audio signal after the number of channels conversion. . That is, the channel number conversion means 12 converts the number of channels of the whole program using the conversion coefficient set in advance, and also uses only the audio signal of the dialog channel using the conversion coefficient set in advance according to the dialog determination value. Convert the number of channels, and also convert the number of channels only for the audio signal of the background sound channel.

具体的には、チャンネル数変換手段12は、ステップS201の処理と同様に、入力した各チャンネルの音声信号について、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号と背景音チャンネルの音声信号とに振り分けることで、各チャンネルの音声信号を分類する。そして、チャンネル数変換手段12は、各チャンネルにおける音声信号の分類及びチャンネル配置情報に基づいて、チャンネル数変換前後のダイアログチャンネルの音声信号についてのチャンネル配置、及びチャンネル数変換前後の背景音チャンネルの音声信号についてのチャンネル配置を特定する。   Specifically, the number-of-channels conversion unit 12 converts the input audio signal of each channel into an audio signal of the dialog channel and an audio signal of the background sound channel based on the dialog determination value, as in the process of step S201. By distributing, the audio signal of each channel is classified. The number-of-channels conversion unit 12 arranges the channels for the audio signal of the dialog channel before and after the channel number conversion based on the classification of the audio signal in each channel and the channel arrangement information, and the sound of the background sound channel before and after the channel number conversion. Identify the channel arrangement for the signal.

チャンネル数変換手段12は、例えばチャンネル数5をチャンネル数2に変換する場合、特定したチャンネル数変換前後のチャンネル配置に従って、以下の式により、予め設定された変換係数GC,GL,GR,GLS,GRSを用いて、入力した全チャンネルの音声信号C5,L5,R5,Ls5,Rs5のチャンネル数5をチャンネル数2に変換し、チャンネル数変換後の全チャンネルの音声信号L2,R2を生成する(ステップS205)。
[数4]
2=GC5+GL5+GLSLs5
2=GC5+GR5+GRSRs5 ・・・(4)
ここで、音声信号C5は、ダイアログチャンネルの音声信号であり、音声信号L5,R5,Ls5,Rs5は、背景音チャンネルの音声信号である。この場合の変換係数は、GC,GLS,GRS=0.7071、GL,GR=1.000が用いられる。
For example, when converting the number of channels 5 into the number of channels 2, the channel number conversion means 12 converts conversion coefficients G C , G L , G R preset according to the following equation according to the channel arrangement before and after the specified channel number conversion. The number of channels 5 of the input audio signals C 5 , L 5 , R 5 , Ls 5 and Rs 5 of all the input channels is converted into the number of channels 2 using G, G LS and G RS, and all the channels after channel number conversion The voice signals L 2 and R 2 of the above are generated (step S205).
[Equation 4]
L 2 = G C C 5 + G L L 5 + G LS Ls 5
R 2 = G C C 5 + G R R 5 + G RS Rs 5 (4)
Here, the audio signal C 5 is a voice signal of a dialog channel audio signals L 5, R 5, Ls 5 , Rs 5 is an audio signal of the channel background sound. As conversion coefficients in this case, G C , G LS , and G RS = 0.7071, and G L and G R = 1.000 are used.

チャンネル数変換手段12は、特定したチャンネル数変換前後のダイアログチャンネルの音声信号についてのチャンネル配置に従って、以下の式により、予め設定された変換係数GCを用いて、入力したダイアログチャンネルの音声信号C5のチャンネル数1をチャンネル数2に変換し、チャンネル数変換後のダイアログチャンネルの音声信号(ダイアログの音声信号)Ld2,Rd2を生成する(ステップS206)。
[数5]
d2=GC5
d2=GC5 ・・・(5)
Number of channel conversion means 12, according to the channel arrangement of the audio signal of the dialog channels before and after the number of channel conversion identified by the following equation, using the conversion factor G C set in advance, the voice signal of a dialog channel input C The channel number 1 of 5 is converted to the channel number 2, and audio signals (audio signals of dialog) L d2 and R d2 of the dialog channel after conversion of the channel number are generated (step S206).
[Equation 5]
L d2 = G C C 5
R d2 = G C C 5 (5)

ここで、番組全体のチャンネル数は5から2に変換されるが、チャンネル数変換後の番組全体のチャンネル数2の音声信号のそれぞれには、ダイアログが含まれる。このため、ダイアログのみに着目すると、チャンネル数変換前のダイアログチャンネルのチャンネル数は1であり、チャンネル数変換後のダイアログチャンネルのチャンネル数は2となる。   Here, although the number of channels of the entire program is converted from 5 to 2, each audio signal of the number of channels 2 of the entire program after the number of channels conversion includes a dialog. Therefore, focusing on the dialog alone, the number of channels of the dialog channel before the channel number conversion is one, and the number of dialog channels after the channel number conversion is two.

チャンネル数変換手段12は、特定したチャンネル数変換前後の背景音チャンネルの音声信号についてのチャンネル配置に従って、以下の式により、予め設定された変換係数GLS,GRS,GL,GRを用いて、入力した背景音チャンネルの音声信号L5,R5,Ls5,Rs5のチャンネル数4をチャンネル数2に変換し、チャンネル数変換後の背景音チャンネルの音声信号(背景音の音声信号)Lb2,Rb2を生成する(ステップS207)。
[数6]
b2=GL5+GLSLs5
b2=GR5+GRSRs5 ・・・(6)
The channel number conversion means 12 uses conversion coefficients G LS , G RS , G L and G R set in advance according to the following equation according to the channel arrangement for the background sound channel before and after the specified channel number conversion. The audio signal of the background sound channel L 5 , R 5 , Ls 5 , Rs 5 is converted to the channel number 2 and the audio signal of the background sound channel after the channel number conversion (audio signal of the background sound) ) L b2 and R b2 are generated (step S207).
[Equation 6]
L b2 = G L L 5 + G LS Ls 5
R b2 = G R R 5 + G RS Rs 5 (6)

ここで、番組全体のチャンネル数は5から2に変換されるが、チャンネル数変換後の番組全体のチャンネル数2の音声信号のそれぞれには、背景音が含まれる。このため、背景音のみに着目すると、チャンネル数変換前の背景音チャンネルのチャンネル数は4であり、チャンネル数変換後の背景音チャンネルのチャンネル数は2となる。   Here, the number of channels of the entire program is converted from 5 to 2, but background sound is included in each of the audio signals of the number 2 of channels of the whole program after the conversion of the number of channels. Therefore, focusing only on the background sound, the number of background sound channels before the channel number conversion is four, and the number of background sound channels after the number channel conversion is two.

これにより、チャンネル数変換手段12において、チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及びチャンネル数変換後の背景音チャンネルの音声信号が生成され、変換後の音声信号としてラウドネス調整手段14へ出力される。   As a result, the channel number conversion means 12 generates audio signals of all channels after channel number conversion, audio signals of dialog channel after channel number conversion, and audio signals of background sound channel after channel number conversion. Is output to the loudness adjustment means 14 as an audio signal of

尚、本発明は、チャンネル数変換手段12によるチャンネル数変換処理を前述の処理に限定するものではない。例えば、チャンネル数変換手段12は、変換係数として、前記非特許文献2の勧告ITU-R BS.775−3または前記非特許文献1の標準規格ARIB STD−B32等に規定されたダウンミックス係数を用いるようにしてもよい。また、チャンネル数変換手段12は、チャンネル位置に依存した角度に応じて変換係数を求め、この変換係数を用いてチャンネル数を変換するようにしてもよい。   The present invention does not limit the channel number conversion processing by the channel number conversion means 12 to the above-described processing. For example, as the conversion factor, the channel number conversion means 12 uses the recommendation ITU-R BS. A downmix coefficient defined in 775-3 or ARIB STD-B32 standard of Non-Patent Document 1 may be used. Also, the channel number conversion means 12 may obtain conversion coefficients in accordance with the angle depending on the channel position, and may convert the number of channels using this conversion coefficient.

(変換後ラウドネス値算出手段13)
変換後ラウドネス値算出手段13は、チャンネル配置情報を入力すると共に、チャンネル数変換手段12から変換後の音声信号(チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及びチャンネル数変換後の背景音チャンネルの音声信号)を入力する。
(Converted loudness value calculation means 13)
The post-conversion loudness value calculation means 13 receives the channel arrangement information and also converts the audio signals after conversion from the channel number conversion means 12 (audio signals of all channels after channel number conversion, audio signals of dialog channel after channel number conversion And the audio signal of the background sound channel after channel number conversion).

変換後ラウドネス値算出手段13は、チャンネル配置情報に対応したチャンネル数変換後の全チャンネルの音声信号に対し、番組の全区間について、全チャンネルの平均ラウドネス値を算出すると共に(ステップS208)、チャンネル数変換後のダイアログチャンネルの音声信号に対し、番組の全区間について、ダイアログの平均ラウドネス値を算出する(ステップS209)。また、変換後ラウドネス値算出手段13は、チャンネル数変換後の背景音チャンネルの音声信号に対し、番組の全区間について、背景音の平均ラウドネス値を算出する(ステップS210)。   The post-conversion loudness value calculation means 13 calculates the average loudness values of all channels for all sections of the program for the audio signals of all channels after the channel number conversion corresponding to the channel arrangement information (step S208). For the speech signal of the dialog channel after number conversion, the average loudness value of the dialog is calculated for all sections of the program (step S209). Further, the converted loudness value calculating means 13 calculates the average loudness value of the background sound for the entire section of the program for the sound signal of the background sound channel after the channel number conversion (step S210).

これらのステップS208〜ステップS210の処理は、ステップS202〜ステップS204の処理及び図3に示した処理と同様であり、チャンネル数変換後における番組の全区間について、全チャンネルの二乗平均値Zt2及び平均ラウドネス値Lt2、ダイアログの二乗平均値Zd2及び平均ラウドネス値Ld2、並びに背景音の二乗平均値Zb2及び平均ラウドネス値Lb2が算出される。 The processes of steps S208 to S210 are the same as the processes of steps S202 to S204 and the process shown in FIG. 3, and for all sections of the program after channel number conversion, the root mean square value Z t2 of all channels and An average loudness value L t2 , a root mean square value Z d2 and an average loudness value L d2 of the dialog, and a root mean square value Z b2 and an average loudness value L b2 of the background sound are calculated.

これにより、変換後ラウドネス値算出手段13において、チャンネル数変換後の全チャンネルの平均ラウドネス値(二乗平均値Zt2及び平均ラウドネス値Lt2)、チャンネル数変換後のダイアログの平均ラウドネス値(二乗平均値Zd2及び平均ラウドネス値Ld2)、及び、チャンネル数変換後の背景音の平均ラウドネス値(二乗平均値Zb2及び平均ラウドネス値Lb2)が算出され、変換後のラウドネス値としてラウドネス調整手段14へ出力される。 Thereby, in the converted loudness value calculating means 13, the average loudness value (square mean value Zt2 and average loudness value Lt2 ) of all channels after channel number conversion, average loudness value of dialog after channel number conversion (square average) The value Z d2 and the average loudness value L d2 ), and the average loudness value of the background sound after conversion of the number of channels (the root mean square value Z b2 and the average loudness value L b2 ) are calculated, and the loudness adjustment means It is output to 14.

(ラウドネス調整手段14)
ラウドネス調整手段14は、目標ラウドネス値を入力すると共に、チャンネル数変換手段12から変換後の音声信号(チャンネル数変換後の全チャンネルの音声信号、チャンネル数変換後のダイアログチャンネルの音声信号、及び、チャンネル数変換後の背景音チャンネルの音声信号)を入力する。また、ラウドネス調整手段14は、変換前ラウドネス値算出手段11から変換前のラウドネス値(チャンネル数変換前の全チャンネルの平均ラウドネス値(二乗平均値Zt及び平均ラウドネス値Lt)、チャンネル数変換前のダイアログの平均ラウドネス値(二乗平均値Zd及び平均ラウドネス値Ld)、及び、チャンネル数変換前の背景音の平均ラウドネス値(二乗平均値Zb及び平均ラウドネス値Lb))を入力すると共に、変換後ラウドネス値算出手段13から変換後のラウドネス値(チャンネル数変換後の全チャンネルの平均ラウドネス値(二乗平均値Zt2及び平均ラウドネス値Lt2)、チャンネル数変換後のダイアログの平均ラウドネス値(二乗平均値Zd2及び平均ラウドネス値Ld2)、及び、チャンネル数変換後の背景音の平均ラウドネス値(二乗平均値Zb2及び平均ラウドネス値Lb2))を入力する。
(Loudness adjustment means 14)
The loudness adjustment means 14 receives the target loudness value and converts the audio signal after conversion from the channel number conversion means 12 (audio signal of all channels after channel number conversion, audio signal of dialog channel after channel number conversion, and Input the audio signal of the background sound channel after channel number conversion. Further, the loudness adjustment means 14 receives the pre-conversion loudness value (average loudness value of all channels before conversion of channel number (square mean value Z t and average loudness value L t ) before conversion) from the pre-conversion loudness value calculation means 11, channel number conversion Input the average loudness value (root mean value Z d and average loudness value L d ) of the previous dialog, and the average loudness value (root mean value Z b and average loudness value L b ) of the background sound before channel number conversion And the converted loudness value from the converted loudness value calculating means 13 (average loudness value of all channels after conversion of the number of channels (square mean value Zt2 and average loudness value Lt2 ), average of the dialog after the number of channels conversion loudness value (root mean square value Z d2 and average loudness value L d2), and the average of the background noise after the number of channels converted Entering loudness value (root mean square value Z b2 and average loudness value L b2)).

ここで、ラウドネス調整手段14は、目標ラウドネス値及び変換後の音声信号を入力してラウドネス調整を行うにあたり、変換前ラウドネス値算出手段11から、番組の全区間について事前に算出された変換前のラウドネス値を入力しておき、また、変換後ラウドネス値算出手段13から、番組の全区間について事前に算出された変換後のラウドネス値を入力しておく。   Here, when the loudness adjustment means 14 inputs the target loudness value and the converted audio signal and performs loudness adjustment, the pre-conversion loudness value calculation means 11 calculates the pre-conversion pre-calculated for all sections of the program. The loudness value is input, and the converted loudness value calculated in advance for all sections of the program is input from the converted loudness value calculating means 13 in advance.

ラウドネス調整手段14は、変換前のラウドネス値及び変換後のラウドネス値に基づいて、ダイアログ及び背景音の目標ラウドネス値を算出し(ステップS211)、変換後の音声信号を調整し(ステップS212)、出力音声信号を生成する。具体的には、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルの音声信号について、平均ラウドネス値が目標ラウドネス値(チャンネル数変換前の全チャンネルの平均ラウドネス値)と一致し、かつ、チャンネル数変換後のダイアログチャンネルの音声信号について、平均ラウドネス値がチャンネル数変換前と一致するように、またはチャンネル数変換前よりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整し、ラウドネス調整後のチャンネル数Mの音声信号を出力音声信号として生成する。   The loudness adjustment means 14 calculates target loudness values of the dialog and background sound based on the pre-conversion loudness value and the post-conversion loudness value (step S211), and adjusts the post-conversion audio signal (step S212). Generate an output audio signal. Specifically, the loudness adjustment means 14 matches the average loudness value with the target loudness value (average loudness value of all channels before channel number conversion) for the audio signals of all channels after channel number conversion, and the channels Adjust the level of the audio signal after channel number conversion so that the average loudness value of the dialog channel audio signal after number conversion matches the number before channel number conversion or is larger than that before channel number conversion, An audio signal with M channels after loudness adjustment is generated as an output audio signal.

図4は、ラウドネス調整手段14により調整されるラウドネス値を説明する図であり、チャンネル数を5から2に変換する場合の例を示している。以下、説明の便宜上、二乗平均値Zをラウドネス値として説明する。図4(1)は、チャンネル数変換前における全チャンネルの音声信号における加算値を表すラウドネス値Zt、ダイアログチャンネルの音声信号における加算値を表すダイアログCのラウドネス値Zd、及び、背景音チャンネルの音声信号における加算値を表す背景音L,R,Ls,Rsのラウドネス値Zbを示している。 FIG. 4 is a diagram for explaining the loudness value adjusted by the loudness adjusting means 14, and shows an example of converting the number of channels from 5 to 2. In FIG. Hereinafter, for convenience of explanation, the mean square value Z will be described as the loudness value. FIG. 4 (1) shows the loudness value Z t representing the added value in the audio signal of all channels before the channel number conversion, the loudness value Z d of dialog C representing the added value in the audio signal of the dialog channel, and the background sound channel background sound representative of the added value in the audio signal of the L, R, Ls, shows a loudness value Z b of Rs.

図4(2)は、図4(1)に示したチャンネル数5の音声信号をチャンネル数2の音声信号に変換した後のラウドネス値を示しており、チャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すダイアログLd2,Rd2のラウドネス値Zd2、及び、背景音チャンネルの音声信号における加算値を表す背景音Lb2,Rb2のラウドネス値Zb2を示している。 FIG. 4 (2) shows the loudness value after converting the audio signal of channel 5 shown in FIG. 4 (1) into an audio signal of channel 2, and the audio signals of all channels after channel number conversion loudness value represents the sum value of Z t2, loudness value Z d2 dialog L d2, R d2 representing the sum value of the audio signal of the dialog channels, and background sound L b2 representing the sum value of the audio signal of the background sound channel, It shows a loudness value Z b2 of R b2.

図4(1)(2)に示すように、チャンネル数を変換することにより、ダイアログのラウドネス値Zd,Zd2が変化せず、背景音のラウドネス値Zb2が変換前のラウドネス値Zbよりも大きくなった場合を想定する。この場合、図4(3)に示すように、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致するように、チャンネル数変換後の音声信号を構成比率を保ったまま単純に調整すると、チャンネル数変換後のダイアログのラウドネス値Zd2は、チャンネル数変換前のダイアログのラウドネス値Zdよりも小さくなってしまう。 4 (1) as shown in (2), by converting the number of channels, loudness value Z d of the dialog, Z d2 does not change, loudness value Z b2 background sound before conversion loudness value Z b Assume that it becomes larger than In this case, as shown in FIG. 4 (3), so that the loudness value Z t of all channels before loudness value Z t2 and the number of channel conversion of all the channels after the number of channels converted match, after the number of channel conversion When simply adjusted while maintaining the component ratio of the audio signal, a loudness value Z d2 dialog after the number of channels conversion becomes smaller than the loudness value Z d of the previous number of channels conversion dialog.

そこで、本発明の実施形態では、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、図4(4)に示すように、チャンネル数変換後のダイアログのラウドネス値Zd2とチャンネル数変換前のラウドネス値Zdとが一致するように、チャンネル数変換後の音声信号のレベルを調整する。これにより、ダイアログと背景音との間のミキシングバランスが崩れることなく、チャンネル数を変換することが可能となる。 Therefore, in the embodiment of the present invention, loudness adjustment means 14, a loudness value Z t of all channels before loudness values for all channels after the number of channels converted Z t2 and the number of channel conversion match and, FIG. 4 ( as shown in 4), so that the loudness value before loudness values dialog after the number of channels converted Z d2 and the number of channel conversion Z d are matched, to adjust the level of the audio signal after the number of channel conversion. This makes it possible to convert the number of channels without breaking the mixing balance between the dialog and the background sound.

図4(4)は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、チャンネル数変換後のダイアログのラウドネス値Zd2とチャンネル数変換前のダイアログのラウドネス値Zdとが一致するように調整したチャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すZd2、及び、ダイアログチャンネルの音声信号における加算値を表すZb2を示している。 4 (4) coincides with loudness value Z t of all channels before loudness value Z t2 and the number of channel conversion of all channels after channel number conversion and loudness value dialog after the number of channels converted Z d2 And the loudness value Z t2 representing the added value in the audio signals of all channels after the channel number conversion adjusted to match the loudness value Z d of the dialog before the channel number conversion, and the added value in the audio signal of the dialog channel It shows Z d2 and Z b2 representing an addition value in the audio signal of the dialog channel.

また、本発明の実施形態では、ラウドネス調整手段14は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、図4(5)に示すように、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のラウドネス値Zよりも大きくなるように、チャンネル数変換後の音声信号のレベルを調整する。 In the embodiments of the present invention, loudness adjustment means 14, a loudness value Z t of all channels before loudness values for all channels after the number of channels converted Z t2 and the number of channel conversion match and, FIG. 4 ( as shown in 5), loudness value Z d2 dialog after the number of channels conversion so that greater than loudness value Z d before the number of channels conversion to adjust the level of the audio signal after the number of channel conversion.

図4(5)は、チャンネル数変換後の全チャンネルのラウドネス値Zt2とチャンネル数変換前の全チャンネルのラウドネス値Ztとが一致し、かつ、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のダイアログの平均ラウドネス値Zdよりも大きくなるように調整したチャンネル数変換後の全チャンネルの音声信号における加算値を表すラウドネス値Zt2、ダイアログチャンネルの音声信号における加算値を表すラウドネス値Zd2、及び、背景音チャンネルの音声信号における加算値表すラウドネス値Zb2を示している。 4 (5) coincides with loudness value Z t of all channels before loudness value Z t2 and the number of channel conversion of all channels after channel number conversion and loudness value dialog after the number of channels converted Z d2 The loudness value Z t2 representing the addition value in the audio signals of all channels after adjustment of the number of channels after adjustment so as to be larger than the average loudness value Z d of the dialog before the channel number conversion The loudness value Z d2 is shown , and the loudness value Z b2 is shown, which represents the addition value in the audio signal of the background sound channel.

本例のように、チャンネル数が5から2に少なくなることにより、ダイアログと背景音とが同じチャンネルに変換され、同じスピーカから再生される。この場合、ダイアログと背景音との音源位置が空間的に重なり、空間マスキングが生じてしまうことから、ダイアログが聞き取り難くなることがあり得る。そこで、チャンネル数変換後のダイアログのラウドネス値Zd2を大きくし、チャンネル数変換後の背景音のラウドネス値Zb2を小さくすることにより、このような不具合を解消することができる。 As in this example, by reducing the number of channels from 5 to 2, the dialog and the background sound are converted to the same channel and reproduced from the same speaker. In this case, since the sound source positions of the dialog and the background sound overlap spatially and space masking occurs, the dialog may be difficult to hear. Therefore, to increase the loudness value Z d2 dialog after the number of channels converted, by decreasing the loudness value Z b2 background sound after the number of channels conversion, it is possible to solve such problems.

図5は、ラウドネス調整手段14の構成例を示すブロック図であり、図6は、ラウドネス調整手段14の処理を示すフローチャートである。図6は、図4と同様に、チャンネル数を5から2に変換する場合の例を示している。   FIG. 5 is a block diagram showing a configuration example of the loudness adjustment means 14, and FIG. 6 is a flowchart showing processing of the loudness adjustment means 14. As shown in FIG. FIG. 6 shows an example of converting the number of channels from 5 to 2 as in FIG.

このラウドネス調整手段14は、目標ラウドネス値算出段31及びレベル調整段32を備えている。ラウドネス調整手段14は、チャンネル数変換手段12から変換後の音声信号、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13から変換前後のラウドネス値、及び目標ラウドネス値を入力する(ステップS601)。   The loudness adjusting means 14 includes a target loudness value calculating stage 31 and a level adjusting stage 32. The loudness adjustment means 14 receives the converted audio signal from the channel number conversion means 12, the loudness value before and after conversion, and the target loudness value from the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13 (step S601). ).

具体的には、目標ラウドネス値算出段31は、変換前ラウドネス値算出手段11から、チャンネル数変換前の全チャンネルのラウドネス値Zt、ダイアログのラウドネス値Zd及び背景音のラウドネス値Zbを入力すると共に、変換後ラウドネス値算出手段13から、チャンネル数変換後の全チャンネルのラウドネス値Zt2、ダイアログのラウドネス値Zd2及び背景音のラウドネス値Zb2を入力し、目標ラウドネス値Zttを入力する。また、レベル調整段32は、チャンネル数変換手段12からチャンネル数変換後の音声信号L2,R2,Ld2,Rd2,Lb2,Rb2(L2=Ld2+Lb2,R2=Rd2+Rb2)を入力する。 Specifically, the target loudness value calculation stage 31, a pre-conversion loudness value calculating means 11, the loudness value of all channels before the channel number converting Z t, a loudness value Z b loudness value Z d and background sound dialog and inputs, from the converted loudness value calculating means 13, a loudness value Z t2 of all channels after channel number conversion, enter the loudness value Z b2 loudness value Z d2 and background sound of the dialog, the target loudness value Z tt input. Further, the level adjustment stage 32 receives the audio signals L 2 , R 2 , L d2 , R d2 , L b2 , R b2 (L 2 = L d2 + L b2 , R 2 =) after the channel number conversion means 12 converts the channel number. Enter R d2 + R b2 ).

ここで、チャンネル数変換前の全チャンネルのラウドネス値Ztは、目標ラウドネス値Zttと同じである。また、音声信号L2,R2は、前記式(4)のとおり、チャンネル数変換後の全チャンネルの音声信号であり、音声信号Ld2,Rd2は、前記式(5)のとおり、チャンネル数変換後のダイアログチャンネルの音声信号であり、音声信号Lb2,Rb2は、前記式(6)のとおり、チャンネル数変換後の背景音チャンネルの音声信号である。 Here, loudness value Z t of all channels before the channel number conversion is the same as the target loudness value Z tt. Further, the audio signals L 2 and R 2 are audio signals of all channels after the channel number conversion as in the equation (4), and the audio signals L d2 and R d2 are channels as in the equation (5) The voice signal of the dialog channel after number conversion is obtained, and the voice signals L b2 and R b2 are voice signals of the background sound channel after channel number conversion, as described in the equation (6).

目標ラウドネス値算出段31は、ラウドネス調整後の全チャンネルの目標ラウドネス値Zt2Aとして目標ラウドネス値Zttを設定する(ステップS602:Zt2A=Ztt(=Zt))。そして、目標ラウドネス値算出段31は、ラウドネス調整後のダイアログの目標ラウドネス値Zd2Aとして、チャンネル数変換前のダイアログの二乗平均値Zdと同じ値、または二乗平均値Zdよりも大きい所定値を設定する(ステップS603:Zd2A≧Zd)。この所定値は、チャンネル数変換前のダイアログの二乗平均値Zdよりも大きく、かつ、目標ラウドネス値Ztt(=Zt)よりも小さい値である。 Target loudness value calculation stage 31 sets the target loudness value Z tt as the target loudness value Z t2A of all channels after loudness adjustment (step S602: Z t2A = Z tt ( = Z t)). Then, the target loudness value calculation stage 31, as the target loudness value Z d2A dialog after loudness adjustment, equal to the mean square value Z d of the previous number of channels converted dialog or mean square value greater predetermined value than Z d, Are set (step S603: Z d2A ZZ d ). This predetermined value is larger than the root mean square value Z d of the dialog before the channel number conversion and smaller than the target loudness value Z tt (= Z t ).

目標ラウドネス値算出段31は、ステップS602にて設定した全チャンネルの目標ラウドネス値Zt2AからステップS603にて設定したダイアログの目標ラウドネス値Zd2Aを減算し、減算結果を、ラウドネス調整後の背景音の目標ラウドネス値Zb2Aに設定する(ステップS604:Zb2A=Zt2A−Zd2A)。 The target loudness value calculation stage 31 subtracts the target loudness value Zd2A of the dialog set in step S603 from the target loudness values Zt2A of all channels set in step S602, and the subtraction result is the background sound after the loudness adjustment. set of the target loudness value Z B2a (step S604: Z b2A = Z t2A -Z d2A).

目標ラウドネス値算出段31は、ステップS602にて設定した全チャンネルの目標ラウドネス値Zt2A、ステップS603にて設定したダイアログの目標ラウドネス値Zd2A、及びステップS604にて設定した背景音の目標ラウドネス値Zb2Aをレベル調整段32に出力する。 Target loudness value calculation stage 31, the target loudness value Z t2A of all channels set in step S602, the dialog of the target loudness value Z d2A set in step S603, and the target loudness value of the background sound set in step S604 Output Z b2A to the level adjustment stage 32.

レベル調整段32は、目標ラウドネス値算出段31から全チャンネルの目標ラウドネス値Zt2A、ダイアログの目標ラウドネス値Zd2A及び背景音の目標ラウドネス値Zb2Aを入力する。そして、レベル調整段32は、チャンネル数変換手段12から入力した変換後の音声信号に対し、当該音声信号の全チャンネルのラウドネス値Zt2が全チャンネルの目標ラウドネス値Zt2Aと一致し、かつ、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致するように、当該音声信号のレベルを調整する(ステップS605)。 The level adjustment stage 32 receives the target loudness values Zt2A of all channels, the dialog target loudness value Zd2A and the background sound target loudness value Zb2A from the target loudness value calculation stage 31. The level adjustment stage 32, to the audio signal after the conversion input from the channel number converting unit 12, a loudness value Z t2 of all channels of the audio signal is equal to the target loudness value Z t2A of all channels, and, as loudness value Z d2 dialog of the audio signal coincides with the target loudness value Z d2A dialog, it adjusts the level of the audio signal (step S605).

図7は、ラウドネス調整手段14により調整されるラウドネス値及び出力音声信号を説明する図である。図7の左側に示すように、図6に示したステップS605の処理により、ラウドネス調整後のラウドネス値に対応する音声信号、すなわち、全チャンネルのラウドネス値Zt2A(図4(4)(5)ではZt2)、ダイアログのラウドネス値Zd2A(図4(4)(5)ではZd2)及び背景音のラウドネス値Zb2A(図4(4)(5)ではZb2)の音声信号が得られる。この音声信号は、ダイアログのラウドネス値Zd2Aに対応するダイアログLd2A,Rd2A、及び背景音のラウドネス値Zb2Aに対応する背景音Lb2A,Rb2Aにより構成される。 FIG. 7 is a diagram for explaining the loudness value and the output sound signal adjusted by the loudness adjustment means 14. As shown on the left side of FIG. 7, according to the process of step S605 shown in FIG. 6, an audio signal corresponding to the loudness value after the loudness adjustment, that is, the loudness value Zt2A of all channels (FIG. 4 (4) (5) resulting in Z t2), the dialog loudness value Z d2A (FIG. 4 (4) audio signal (5) in Z d2) and the background sound loudness value Z B2a (FIG. 4 (4) (5) in the Z b2) is Be This audio signal is composed of dialogs L d2A and R d2A corresponding to the loudness value Z d2A of the dialog and background sounds L b2A and R b2A corresponding to the loudness value Z b2A of the background sound.

図6に戻って、レベル調整段32は、図7の右側に示すように、ステップS605にて調整されたダイアログLd2A及び背景音Lb2Aにより構成される音声信号L2Aを生成すると共に、ステップS605にて調整されたダイアログRd2A及び背景音Rb2Aにより構成される音声信号R2Aを生成する。そして、レベル調整段32は、チャンネル数2の音声信号L2A,R2Aをラウドネス調整後の音声信号である出力音声信号として出力する(ステップS606)。音声信号L2A,R2Aを生成するための加算処理は、前記式(4)に対応する。 Returning to FIG. 6, as shown on the right side of FIG. 7, the level adjustment stage 32 generates an audio signal L 2 A composed of the dialog L d 2 A and the background sound L b 2 A adjusted in step S 605. by adjusting the dialog R d2A and background sound R B2a at S605 to generate a composed audio signal R 2A. The level adjustment stage 32 outputs the audio signals L 2A of the channel number 2, the R 2A as the output audio signal is an audio signal after loudness adjustment (step S606). The addition process for generating the audio signals L 2A and R 2A corresponds to the equation (4).

このように、ラウドネス調整手段14は、全チャンネルのラウドネス値が全チャンネルの目標ラウドネス値Zt2A(チャンネル数変換前の全チャンネルのラウドネス値Zt)と一致し、かつ、ダイアログのラウドネス値がダイアログの目標ラウドネス値Zd2A(チャンネル数変換前のダイアログのラウドネス値Zd以上の所定値)に一致するように、変換後の音声信号を構成するダイアログLd2A,Rd2A及び背景音Lb2A,Rb2Aのレベルを調整し、チャンネル数2の音声信号L2A(=Ld2A+Lb2A),R2A(=Rd2A+Rb2A)をラウドネス調整後の音声信号である出力音声信号として出力する。 Thus, the loudness adjustment means 14, loudness value of all channels equal to the target loudness value Z t2A of all channels (loudness value of all channels before the channel number converting Z t), and, loudness value dialog dialog Dialog L d2A , R d2 A and background sound L b2 A , R that constitute the audio signal after conversion so as to match the target loudness value Z d2A (a predetermined value of the loudness value Z d of the dialog before channel number conversion) to adjust the level of B2a, audio signal of the channel number 2 L 2A (= L d2A + L b2A), and outputs the R 2A (= R d2A + R b2A) as an output audio signal is an audio signal after loudness adjustment.

尚、ラウドネス調整手段14のレベル調整段32は、図6のステップS605において、変換後の音声信号に対し、当該音声信号の全チャンネルのラウドネス値Zt2が全チャンネルの目標ラウドネス値Zt2Aと一致し、かつ、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致するように、当該音声信号のレベルを調整するようにした。これに対し、レベル調整段32は、変換後の音声信号に対し、当該音声信号のダイアログのラウドネス値Zd2がダイアログの目標ラウドネス値Zd2Aに一致し(図4の例では、チャンネル数変換後のダイアログのラウドネス値Zd2がチャンネル数変換前のダイアログのラウドネス値Zd、またはラウドネス値Zdよりも大きい値に一致し)、当該音声信号の背景音のラウドネス値Zb2が背景音の目標ラウドネス値Zb2Aに一致するように(図4の例では、チャンネル数変換後の背景音のラウドネス値Zb2がチャンネル数変換前の背景音のラウドネス値Zb、またはラウドネス値Zbよりも小さい値に一致するように)、当該音声信号のレベルを調整するようにしてもよい。 The level adjustment stage 32 of the loudness adjustment means 14, in step S605 of FIG. 6, with respect to the audio signal after the conversion, loudness value Z t2 of all channels of the audio signal and the target loudness value Z t2A of all channels one We, and as loudness value Z d2 dialog of the audio signal coincides with the target loudness value Z d2A dialog, and to adjust the level of the audio signal. In contrast, the level adjustment stage 32, to the audio signal after the conversion, loudness value Z d2 dialog of the audio signal coincides with the target loudness value Z d2A dialog (in the example of FIG. 4, after the number of channel conversion Dialog loudness value Z d2 matches the loudness value Z d of the dialog before channel number conversion, or a value greater than the loudness value Z d ), and the loudness value Z b2 of the background sound of the audio signal is the target of the background sound in the example shown in (Fig. 4 to match the loudness value Z B2a, loudness value Z b2 background sound after the number of channels converted is smaller than the loudness value Z b or loudness value Z b, the background sound of the front channel number conversion The level of the audio signal may be adjusted to match the value).

要するに、ラウドネス調整手段14のレベル調整段32は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値Ztと一致し、かつ、ダイアログのラウドネス値がチャンネル数変換前のダイアログのラウドネス値Zdよりも小さくならないように、変換後の音声信号のレベルを調整すればよい。 In short, the loudness level adjustment stage 32 of the adjusting means 14, loudness value of all channels to match the loudness value Z t of all channels before the channel number conversion, and loudness loudness value before the number of channels converted Dialog Dialog so as not to be smaller than the value Z d, may be adjusted level of the audio signal after the conversion.

以上のように、本発明の実施形態の番組音声チャンネル数変換装置1によれば、変換前ラウドネス値算出手段11は、チャンネル数Nの入力音声信号について、ダイアログ判定値に基づいて、ダイアログと背景音とに分類し、番組の全区間について、チャンネル配置情報に基づいた重み係数等を用いて、全チャンネルの平均ラウドネス値、ダイアログの平均ラウドネス値及び背景音の平均ラウドネス値を算出するようにした。   As described above, according to the program sound channel number conversion device 1 of the embodiment of the present invention, the pre-conversion loudness value calculation means 11 generates dialog and background for the input sound signal with N channels based on the dialog determination value. The average loudness value of all channels, the average loudness value of the dialog, and the average loudness value of the background sound are calculated using the weighting factors based on the channel arrangement information, etc., classified into the sound and for all sections of the program. .

チャンネル数変換手段12は、チャンネル配置情報に基づいて、チャンネル数変換前のチャンネル配置及びチャンネル数変換後のチャンネル配置を特定し、特定したチャンネル数変換前後のチャンネル配置に従い、予め設定された変換係数を用いて、入力音声信号のチャンネル数Nを出力音声信号のチャンネル数Mに変換し、チャンネル数変換後の全チャンネルの音声信号、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号を生成するようにした。また、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルの音声信号、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号に対し、番組の全区間について、全チャンネルの平均ラウドネス値、ダイアログの平均ラウドネス値及び背景音の平均ラウドネス値を算出するようにした。   The channel number conversion means 12 specifies the channel arrangement before the channel number conversion and the channel arrangement after the channel number conversion based on the channel arrangement information, and conversion coefficients set in advance according to the specified channel arrangement before and after the channel number conversion. To convert the number N of channels of the input audio signal into the number M of channels of the output audio signal, and generate the audio signals of all channels after conversion of the number of channels, the audio signal of the dialog channel and the audio signal of the background sound channel I made it. The post-conversion loudness value calculation means 13 calculates the average loudness values of all channels for all sections of the program with respect to the audio signals of all channels after conversion of the number of channels, the audio signals of the dialog channel and the audio signals of the background sound channel. The average loudness value of the dialog and the average loudness value of the background sound are calculated.

ラウドネス調整手段14は、全チャンネルの平均ラウドネス値がチャンネル数変換前の全チャンネルの平均ラウドネス値と一致し、かつ、ダイアログの平均ラウドネス値がチャンネル数変換前のダイアログの平均ラウドネス値以上の所定値に一致するように、チャンネル数変換後の音声信号を構成するダイアログ及び背景音のレベルを調整し、チャンネル数Mの音声信号をラウドネス調整後の音声信号である出力音声信号として出力するようにした。   The loudness adjustment means 14 determines that the average loudness value of all channels matches the average loudness value of all channels before the channel number conversion, and the average loudness value of the dialog is a predetermined value greater than the average loudness value of the dialog before channel number conversion. To adjust the levels of the dialog and background sound that make up the audio signal after channel number conversion, and output the audio signal with M channels as the output audio signal that is the audio signal after loudness adjustment .

これにより、チャンネル数変換前後の音声信号の平均ラウドネス値を一定とすることができるから、チャンネル数変換前の音声信号について、番組の全区間の平均ラウドネス値が目標ラウドネス値の許容範囲内に収まっていれば、チャンネル数変換後の音声信号についても、番組の全区間の平均ラウドネス値を目標ラウドネス値の許容範囲内に収めることができる。また、ダイアログの平均ラウドネス値がチャンネル数変換前のダイアログの平均ラウドネス値よりも小さくなることがないから、チャンネル数変換前後の音声信号について、ダイアログの聞き易さを保つことが可能となる。   As a result, since the average loudness value of the audio signal before and after channel number conversion can be made constant, the average loudness value of all sections of the program is within the allowable range of the target loudness value for the audio signal before channel number conversion. If so, the average loudness value of the entire section of the program can be within the tolerance of the target loudness value even for the audio signal after channel number conversion. Further, since the average loudness value of the dialog does not become smaller than the average loudness value of the dialog before the channel number conversion, it becomes possible to maintain the ease of hearing the dialog about the audio signal before and after the channel number conversion.

〔番組音声チャンネル数変換装置/他の実施形態〕
次に、本発明の他の実施形態による番組音声チャンネル数変換装置について説明する。図8は、本発明の他の実施形態による番組音声チャンネル数変換装置の構成を示すブロック図である。この番組音声チャンネル数変換装置2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16を備えている。番組音声チャンネル数変換装置2は、チャンネル数Nの入力音声信号のうちダイアログ成分及び背景音成分を含むチャンネルの音声信号から、ダイアログ及び背景音を分離し、入力音声信号に含まれるメタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出するものである。
[Program audio channel number converter / other embodiment]
Next, a program sound channel number conversion apparatus according to another embodiment of the present invention will be described. FIG. 8 is a block diagram showing the configuration of a program sound channel number conversion apparatus according to another embodiment of the present invention. The program sound channel number conversion device 2 includes pre-conversion loudness value calculation means 11, channel number conversion means 12, post-conversion loudness value calculation means 13, loudness adjustment means 14, metadata extraction means 15, and channel separation means 16. There is. The program audio channel number conversion device 2 separates the dialog and the background sound from the audio signal of the channel including the dialog component and the background sound component among the input audio signal of the channel number N, and the channel from the metadata included in the input audio signal The arrangement information, the dialog determination value and the target loudness value are extracted.

図1に示した本発明の実施形態による番組音声チャンネル数変換装置1と図8に示す本発明の他の実施形態による番組音声チャンネル数変換装置2とを比較すると、番組音声チャンネル数変換装置1,2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14を備えている点で同一であるが、番組音声チャンネル数変換装置2は、番組音声チャンネル数変換装置1の構成に加え、さらに、メタデータ抽出手段15及びチャンネル分離手段16を備えている点で相違する。また、図1に示した番組音声チャンネル数変換装置1におけるチャンネル数Nの入力音声信号は、ダイアログ専用チャンネルの音声信号及び背景音専用チャンネルの音声信号により構成されているが、図8に示す番組音声チャンネル数変換装置2におけるチャンネル数Nの入力音声信号には、ダイアログ成分と背景音成分とを含むチャンネルの音声信号が含まれる点で相違する。図8に示す番組音声チャンネル数変換装置2において、図1に示した番組音声チャンネル数変換装置1の構成と共通する部分には図1と同一の符号を付し、その詳しい説明は省略する。   Comparing the program audio channel number converter 1 according to the embodiment of the present invention shown in FIG. 1 with the program audio channel number converter 2 according to the other embodiment of the present invention shown in FIG. , 2 are identical in that the pre-conversion loudness value calculating means 11, the channel number converting means 12, the post-conversion loudness value calculating means 13 and the loudness adjusting means 14 are provided. In addition to the configuration of the program sound channel number conversion device 1, a metadata extraction unit 15 and a channel separation unit 16 are further included. Also, the input audio signal of the number N of channels in the program audio channel number conversion device 1 shown in FIG. 1 is constituted by the audio signal of the dialog dedicated channel and the audio signal of the background sound dedicated channel. The difference is that the input audio signal of the channel number N in the audio channel number conversion device 2 includes an audio signal of a channel including the dialog component and the background sound component. In the program audio channel number converter 2 shown in FIG. 8, the parts common to the configuration of the program audio channel number converter 1 shown in FIG.

メタデータ抽出手段15は、チャンネル数Nの入力音声信号を入力し、入力音声信号からメタデータを抽出し、メタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出する。そして、メタデータ抽出手段15は、抽出したチャンネル配置情報を変換前ラウドネス値算出手段11、チャンネル数変換手段12及び変換後ラウドネス値算出手段13に出力し、抽出したダイアログ判定値を変換前ラウドネス値算出手段11、チャンネル数変換手段12及びチャンネル分離手段16に出力し、抽出した目標ラウドネス値をラウドネス調整手段14に出力する。チャンネル配置情報及びダイアログ判定値は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13において平均ラウドネス値を算出する際に用いられる。また、ダイアログ判定値は、後述するチャンネル分離手段16においてチャンネルを分離する際に用いられる。さらに、目標ラウドネス値は、ラウドネス調整手段14においてラウドネス調整する際に用いられる。   The metadata extraction unit 15 receives an input audio signal of the number N of channels, extracts metadata from the input audio signal, and extracts channel arrangement information, a dialog determination value, and a target loudness value from the metadata. Then, the metadata extraction unit 15 outputs the extracted channel arrangement information to the pre-conversion loudness value calculation unit 11, the channel number conversion unit 12, and the post-conversion loudness value calculation unit 13, and the extracted dialog determination value is the pre-conversion loudness value. The target loudness value extracted is output to the loudness adjustment unit 14, and output to the calculation unit 11, the channel number conversion unit 12, and the channel separation unit 16. The channel arrangement information and the dialog determination value are used when the average loudness value is calculated in the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13. Also, the dialog determination value is used when separating channels in the channel separating means 16 described later. Furthermore, the target loudness value is used in the loudness adjustment in the loudness adjustment means 14.

ここで、ダイアログ判定値には、各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示す値に加え、ダイアログ成分及び背景音成分を含む音声信号であることを示す値が含まれるものとする。   Here, the dialog determination value includes, in addition to the value indicating whether the audio signal of each channel is the dialog or the background sound, a value indicating that the audio signal includes the dialog component and the background sound component. I assume.

チャンネル分離手段16は、チャンネル数Nの入力音声信号を入力すると共に、メタデータ抽出手段15からダイアログ判定値を入力し、ダイアログ判定値に基づいて、ダイアログ成分及び背景音成分を含むチャンネルの音声信号を特定する。そして、チャンネル分離手段16は、当該音声信号から、ダイアログ成分の音声信号と背景音成分の音声信号とを分離し、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号として変換前ラウドネス値算出手段11に出力する。この分離手法(ダイアログ成分と背景音成分とを含むチャンネルの音声信号から、ダイアログ成分の音声信号と背景音成分の音声信号とを分離する手法)は既知であり、様々な手法がある。チャンネル分離手段16は、どのよな分離手法を用いてもよく、その手法は問わない。   The channel separation means 16 receives an input audio signal of the number N of channels and also receives a dialog determination value from the metadata extraction means 15, and based on the dialog determination value, an audio signal of a channel including a dialog component and a background sound component. Identify Then, the channel separating means 16 separates the audio signal of the dialog component and the audio signal of the background sound component from the audio signal, and the pre-conversion loudness value calculating means 11 as an audio signal of the dialog channel and an audio signal of the background sound channel. Output to This separation method (a method of separating an audio signal of a dialog component and an audio signal of a background sound component from an audio signal of a channel including a dialog component and a background sound component) is known, and there are various methods. The channel separation means 16 may use any separation method, regardless of the method.

また、チャンネル分離手段16は、ダイアログ判定値に基づいて、ダイアログチャンネルの音声信号及び背景音チャンネルの音声信号を特定し、特定したチャンネルの音声信号をそのまま変換前ラウドネス値算出手段11に出力する。   Further, the channel separation unit 16 specifies the audio signal of the dialog channel and the audio signal of the background sound channel based on the dialog determination value, and outputs the audio signal of the specified channel to the pre-conversion loudness value calculation unit 11 as it is.

以上のように、本発明の他の実施形態の番組音声チャンネル数変換装置2によれば、番組音声チャンネル数変換装置1の構成に加え、メタデータ抽出手段15は、入力音声信号に含まれるメタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出し、チャンネル分離手段16は、ダイアログ成分と背景音成分とを含むチャンネルの音声信号からダイアログ及び背景音を分離するようにした。   As described above, according to the program sound channel number conversion device 2 of the other embodiment of the present invention, in addition to the configuration of the program sound channel number conversion device 1, the metadata extraction unit 15 The channel arrangement information, the dialog determination value and the target loudness value are extracted from the data, and the channel separating means 16 separates the dialog and the background sound from the audio signal of the channel including the dialog component and the background sound component.

これにより、入力音声信号に、ダイアログ成分と背景音成分とを含むチャンネルの音声信号が存在する場合であっても、また、チャンネル配置情報、ダイアログ判定値及び目標ラウドネス値が予め設定されない場合であっても、変換前ラウドネス値算出手段11は、変換前のラウドネス値を算出することができ、チャンネル数変換手段12は、入力音声信号のチャンネル数を変換することができ、変換後ラウドネス値算出手段13は、変換後のラウドネス値を算出することができる。したがって、本発明の実施形態の番組音声チャンネル数変換装置1と同様に、チャンネル数を変換する前後において、平均ラウドネス値を一定とし、ダイアログの聞き易さを保つことが可能となる。   As a result, even if an audio signal of a channel including a dialog component and a background sound component is present in the input audio signal, the channel arrangement information, the dialog determination value and the target loudness value are not set in advance. However, the pre-conversion loudness value calculation means 11 can calculate the pre-conversion loudness value, and the channel number conversion means 12 can convert the number of channels of the input audio signal, and the post-conversion loudness value calculation means 13 can calculate the converted loudness value. Therefore, as in the program sound channel number conversion device 1 according to the embodiment of the present invention, the average loudness value can be made constant before and after the conversion of the channel number, and the easiness of hearing the dialog can be maintained.

尚、本発明の実施形態による番組音声チャンネル数変換装置1のハードウェア構成及び本発明の他の実施形態による番組音声チャンネル数変換装置2のハードウェア構成としては、通常のコンピュータを使用することができる。番組音声チャンネル数変換装置1,2は、CPU、RAM等の揮発性の記憶媒体、ROM等の不揮発性の記憶媒体、及びインターフェース等を備えたコンピュータによって構成される。番組音声チャンネル数変換装置1に備えた変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13及びラウドネス調整手段14の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。また、番組音声チャンネル数変換装置2に備えた変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16の各機能は、これらの機能を記述したプログラムをCPUに実行させることによりそれぞれ実現される。これらのプログラムは、前記記憶媒体に格納されており、CPUに読み出されて実行される。また、これらのプログラムは、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスク等)、光ディスク(CD−ROM、DVD等)、半導体メモリ等の記憶媒体に格納して頒布することもでき、ネットワークを介して送受信することもできる。   The hardware configuration of the program sound channel number conversion device 1 according to the embodiment of the present invention and the hardware configuration of the program sound channel number conversion device 2 according to another embodiment of the present invention may use a normal computer. it can. The program sound channel number conversion devices 1 and 2 are configured by a computer including a CPU, a volatile storage medium such as a RAM, a non-volatile storage medium such as a ROM, and an interface. Each function of the pre-conversion loudness value calculation means 11, the channel number conversion means 12, the post-conversion loudness value calculation means 13 and the loudness adjustment means 14 provided in the program sound channel number conversion device 1 Each is realized by executing. The pre-conversion loudness value calculation means 11, the channel number conversion means 12, the post-conversion loudness value calculation means 13, the loudness adjustment means 14, the metadata extraction means 15 and the channel separation means 16 included in the program sound channel number conversion device 2. Each function is realized by causing a CPU to execute a program in which these functions are described. These programs are stored in the storage medium and read out and executed by the CPU. These programs can also be stored and distributed in storage media such as magnetic disks (floppy (registered trademark) disks, hard disks, etc.), optical disks (CD-ROM, DVD, etc.), semiconductor memories, etc. Can also be sent and received.

以上、実施形態及び他の実施形態を挙げて本発明を説明したが、本発明は前記実施形態及び前記他の実施形態に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、前記実施形態及び前記他の実施形態では、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13は、前記非特許文献5の勧告ITU−R BS.1770−3に規定されたラウドネス測定法により平均ラウドネス値を算出するようにしたが、平均ラウドネス値の代わりに、平均音圧レベル、5%時間率平均音圧レベル等のような音の大きさを表す指標を算出するようにしてもよい。平均ラウドネス値は音の大きさの主観量に対応する数値であるのに対し、平均音圧レベルは音の大きさの客観量に対応する数値である。   Although the present invention has been described above by the embodiment and the other embodiments, the present invention is not limited to the embodiments and the other embodiments, and various modifications can be made without departing from the technical concept thereof. It is. For example, in the embodiment and the other embodiments, the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13 of the program sound channel number conversion devices 1 and 2 are the same as those described in Recommendation ITU-R of Non-Patent Document 5. BS. The average loudness value is calculated by the loudness measurement method specified in 1770-3, but instead of the average loudness value, the loudness such as the average sound pressure level, 5% time rate average sound pressure level, etc. An index representing 算出 may be calculated. The average loudness value is a numerical value corresponding to the subjective quantity of the loudness, whereas the average sound pressure level is a numerical value corresponding to the objective quantity of the loudness.

この場合、変換前ラウドネス値算出手段11は、入力音声信号における全チャンネルの音の大きさ、入力音声信号に含まれるダイアログの大きさ、及び入力音声信号に含まれる背景音の大きさをそれぞれ算出し、変換後ラウドネス値算出手段13は、チャンネル数変換手段12によりチャンネル数が変換された変換後の音声信号における全チャンネルの音の大きさ、変換後の音声信号に含まれるダイアログの大きさ、及び変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する。そして、ラウドネス調整手段14は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13により算出されたチャンネル数変換前後の音の大きさに基づいて、チャンネル数変換後の音声信号のレベルを調整する。   In this case, the pre-conversion loudness value calculating unit 11 calculates the sizes of the sounds of all channels in the input audio signal, the size of the dialog included in the input audio signal, and the size of the background sound included in the input audio signal. The post-conversion loudness value calculating means 13 calculates the sizes of the sounds of all channels in the converted audio signal whose number of channels has been converted by the number-of-channels converting means 12, the size of the dialog included in the converted audio signal, And the size of the background sound included in the converted audio signal. Then, the loudness adjustment means 14 calculates the level of the audio signal after the channel number conversion based on the loudness before and after the channel number conversion calculated by the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13. adjust.

また、前記実施形態及び前記他の実施形態では、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13は、番組の全区間についての平均ラウドネス値を算出するようにしたが、一定時間毎の短時間ラウドネス値を算出するようにしてもよい。ラウドネス調整手段14は、変換前ラウドネス値算出手段11及び変換後ラウドネス値算出手段13により算出された一定時間毎の短時間ラウドネス値に基づいて、前記一定時間毎に、チャンネル数変換後の音声信号のレベルを調整する。これにより、生放送番組等に対応した逐次処理を行うことが可能となる。   Further, in the above-described embodiment and the other embodiments, the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13 of the program sound channel number conversion devices 1 and 2 calculate average loudness values for all sections of the program. Although the calculation is made, the short time loudness value for each constant time may be calculated. The loudness adjustment means 14 is an audio signal after conversion of the number of channels at each constant time based on the short time loudness value for each constant time calculated by the pre-conversion loudness value calculation means 11 and the post-conversion loudness value calculation means 13 Adjust the level of This makes it possible to perform sequential processing corresponding to live broadcast programs and the like.

また、前記他の実施形態では、番組音声チャンネル数変換装置2は、変換前ラウドネス値算出手段11、チャンネル数変換手段12、変換後ラウドネス値算出手段13、ラウドネス調整手段14、メタデータ抽出手段15及びチャンネル分離手段16を備えて構成するようにしたが、これらの構成部からメタデータ抽出手段15を除いて構成するようにしてもよい。チャンネル配置情報、ダイアログ判定値及び目標ラウドネス値は、図1に示した番組音声チャンネル数変換装置1と同様に、予め設定される。これにより、番組音声チャンネル数変換装置2は、入力音声信号からメタデータを抽出する必要がなく、メタデータからチャンネル配置情報、ダイアログ判定値及び目標ラウドネス値を抽出する必要がないから、処理負荷を低減することができる。   Further, in the other embodiment, the program sound channel number conversion device 2 includes the pre-conversion loudness value calculation unit 11, the channel number conversion unit 12, the post-conversion loudness value calculation unit 13, the loudness adjustment unit 14, and the metadata extraction unit 15 And although the channel separating means 16 is provided and configured, the metadata extracting means 15 may be removed from these components. The channel arrangement information, the dialog determination value, and the target loudness value are preset, as in the program sound channel number conversion device 1 shown in FIG. As a result, the program audio channel number conversion device 2 does not need to extract metadata from the input audio signal, and does not need to extract channel arrangement information, dialog determination value and target loudness value from metadata, so processing load It can be reduced.

さらに、番組音声チャンネル数変換装置2は、図8に示した構成部からチャンネル分離手段16を除いて構成するようにしてもよい。入力音声信号における各チャンネルの音声信号は、ダイアログ及び背景音のうちのいずれかである。   Furthermore, the program audio channel number conversion device 2 may be configured by removing the channel separation means 16 from the components shown in FIG. The audio signal of each channel in the input audio signal is either a dialog or a background sound.

また、前記実施形態では、入力音声信号にダイアログのチャンネルが含まれる場合について説明し、前記他の実施形態では、入力音声信号を構成する少なくとも1つのチャンネルの音声信号にダイアログ成分及び背景音成分が含まれる場合について説明した。これらは、入力音声信号からダイアログを区別することができる場合を想定している。しかし、前記実施形態において、ユーザがチャンネル配置情報等を予め入手することができない場合、または、前記他の実施形態において、入力音声信号にメタデータが付与されていない場合があり得る。また、前記他の実施形態において、番組音声チャンネル数変換装置2のチャンネル分離手段16による音源分離技術を用いたとしても、入力音声信号からダイアログを分離することができない場合もあり得る。この場合、入力音声信号からダイアログを区別することができない。   In the above embodiment, the case where the input audio signal includes the channel of the dialog is described, and in the other embodiment, the dialog component and the background sound component are included in the audio signal of at least one channel constituting the input audio signal. The case of inclusion is described. These assume that the dialog can be distinguished from the input speech signal. However, in the above embodiment, when the user can not obtain channel arrangement information etc. in advance, or in the other embodiment, there may be a case where metadata is not added to the input voice signal. Moreover, even if the sound source separation technique by the channel separation means 16 of the program sound channel number conversion device 2 is used in the other embodiment, the dialog may not be separated from the input sound signal. In this case, the dialog can not be distinguished from the input speech signal.

そこで、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、入力音声信号のセンターチャンネル(C−ch:Centre channel)、センターチャンネル及び両サイドのチャンネル(L−ch(レフトチャンネル):Left channel,R−ch(ライトチャンネル):Right channel)、または、センターチャンネル及び上層・下層のセンターチャンネル(TpFC:Top front centre channel/Cv:centre front vertical height,BtFC:Bottom front centre channel/Cb:centre front vertical bottom)を、ダイアログチャンネルとして扱うみなし処理を行うようにしてもよい。また、変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つのチャンネルを、ダイアログチャンネルとして扱うみなし処理を行うようにしてもよい。一般に、これらのチャンネルの音声信号には、多くのダイアログ成分が含まれるからである。   Therefore, the pre-conversion loudness value calculation means 11 and the number-of-channels conversion means 12 of the program sound channel number conversion devices 1 and 2 include the center channel (C-ch: Centre channel), center channel and channels on both sides of the input sound signal. L-ch (left channel): Left channel, R-ch (right channel): Right channel, or center channel and upper / lower center channel (TpFC: Top front center channel / Cv: center front vertical height, BtFC : Bottom front center channel / Cb: Center front vertical bottom) It may be performed regarded processing treated as a channel. Also, the pre-conversion loudness value calculation means 11 and the channel number conversion means 12 treat as a dialogue channel at least one of the center channel, left channel, light channel, upper layer center channel and lower layer center channel May be performed. Generally, the audio signals of these channels contain many dialog components.

この場合、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11及びチャンネル数変換手段12は、それぞれ切り替え段を備えるようにしてもよい。切り替え段は、入力音声信号を入力し、予め設定された切り替え指定がダイアログチャンネルを設定する指定である場合、前述のダイアログチャンネルのみなし処理を行う。一方、切り替え段は、予め設定された切り替え指定がダイアログチャンネルを設定しない指定である場合、前述のダイアログチャンネルのみなし処理を行わない。変換前ラウドネス値算出手段11は、チャンネル数変換前の全チャンネルのラウドネス値のみを算出し、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルのラウドネス値のみを算出する。また、ラウドネス調整手段14は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値と一致するように、チャンネル数変換後の音声信号のレベルを調整する。   In this case, the pre-conversion loudness value calculation means 11 and the number-of-channels conversion means 12 of the program sound channel number conversion devices 1 and 2 may each be provided with a switching stage. The switching stage receives the input audio signal, and when the switching specification set in advance is the setting for setting the dialog channel, the above-mentioned processing for only the dialog channel is performed. On the other hand, when the switching specification set in advance is the specification of not setting the dialog channel, the switching stage does not perform the above-mentioned processing only for the dialog channel. The pre-conversion loudness value calculation means 11 calculates only the loudness values of all the channels before the channel number conversion, and the post-conversion loudness value calculation means 13 calculates only the loudness values of all the channels after the channel number conversion. Also, the loudness adjustment means 14 adjusts the level of the audio signal after the channel number conversion so that the loudness values of all the channels match the loudness values of all the channels before the channel number conversion.

また、入力音声信号における全チャンネルの音声信号がダイアログ成分を含まない場合も同様に、番組音声チャンネル数変換装置1,2の変換前ラウドネス値算出手段11は、チャンネル数変換前の全チャンネルのラウドネス値のみを算出し、変換後ラウドネス値算出手段13は、チャンネル数変換後の全チャンネルのラウドネス値のみを算出し、ラウドネス調整手段14は、全チャンネルのラウドネス値がチャンネル数変換前の全チャンネルのラウドネス値と一致するように、チャンネル数変換後の音声信号のレベルを調整する。変換前ラウドネス値算出手段11、変換後ラウドネス値算出手段13及びラウドネス調整手段14は、ダイアログ判定値に基づいて、入力音声信号における全チャンネルの音声信号がダイアログ成分を含まないことを判定する。   Also, even when audio signals of all channels in the input audio signal do not contain dialog components, the pre-conversion loudness value calculation means 11 of the program audio channel number conversion devices 1 and 2 calculates the loudness of all channels before channel number conversion. Only the values are calculated, and the converted loudness value calculating means 13 calculates only the loudness values of all the channels after the channel number conversion, and the loudness adjusting means 14 calculates the loudness values of all the channels of all the channels before the channel number conversion. Adjust the level of the audio signal after channel number conversion to match the loudness value. The pre-conversion loudness value calculation means 11, the post-conversion loudness value calculation means 13 and the loudness adjustment means 14 determine that the audio signals of all channels in the input audio signal do not include a dialog component based on the dialog determination value.

また、番組音声チャンネル数変換装置1,2は、放送番組の映像信号及び音声信号を受信してこれらを再生する放送番組受信装置に適用することができる。放送番組受信装置は、図1に示した番組音声チャンネル数変換装置1、または図8に示した番組音声チャンネル数変換装置2を備えて構成される。   Furthermore, the program audio channel number conversion devices 1 and 2 can be applied to a broadcast program reception device that receives video signals and audio signals of broadcast programs and reproduces them. The broadcast program receiving apparatus is configured to include the program audio channel number converter 1 shown in FIG. 1 or the program audio channel number converter 2 shown in FIG.

本発明による番組音声チャンネル数変換装置は、番組制作時若しくは番組交換時における音声フォーマット変換、または放送番組受信装置での再生システムへの適応変換において有用である。   The program audio channel number converter according to the present invention is useful in audio format conversion at the time of program production or program exchange, or adaptive conversion to a reproduction system in a broadcast program receiver.

1,2 番組音声チャンネル数変換装置
11 変換前ラウドネス値算出手段(変換前算出手段)
12 チャンネル数変換手段
13 変換後ラウドネス値算出手段(変換後算出手段)
14 ラウドネス調整手段(調整手段)
15 メタデータ抽出手段
16 チャンネル分離手段
21 フィルタ処理段
22 二乗平均段
23 重み処理段
24 分類段
25 加算段
26 絶対及び相対ゲーティング段
31 目標ラウドネス値算出段
32 レベル調整段
1, 2 Program audio channel number converter 11 Pre-conversion loudness value calculation means (pre-conversion calculation means)
12 channel number conversion means 13 post-conversion loudness value calculation means (post-conversion calculation means)
14 loudness adjustment means (adjustment means)
15 metadata extraction means 16 channel separation means 21 filter stage 22 square average stage 23 weight process stage 24 classification stage 25 addition stage 26 absolute and relative gating stage 31 target loudness value calculation stage 32 level adjustment stage

Claims (8)

番組の入力音声信号のチャンネル数を変換し、出力音声信号を生成する番組音声チャンネル数変換装置において、
前記入力音声信号における全チャンネルの音の大きさ、前記入力音声信号に含まれるダイアログの大きさ、及び前記入力音声信号に含まれる背景音の大きさをそれぞれ算出する変換前算出手段と、
前記入力音声信号のチャンネル数を変換し、チャンネル数変換後の音声信号を生成するチャンネル数変換手段と、
前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号における全チャンネルの音の大きさ、前記チャンネル数変換後の音声信号に含まれるダイアログの大きさ、及び前記チャンネル数変換後の音声信号に含まれる背景音の大きさをそれぞれ算出する変換後算出手段と、
全チャンネルの音の大きさが前記変換前算出手段により算出された全チャンネルの音の大きさに一致し、かつ、ダイアログの大きさが前記変換前算出手段により算出されたダイアログの大きさ以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する調整手段と、
を備えたことを特徴とする番組音声チャンネル数変換装置。
In a program audio channel number conversion device for converting the number of channels of an input audio signal of a program and generating an output audio signal,
Pre-conversion calculation means for calculating the sizes of the sound of all channels in the input audio signal, the size of the dialog included in the input audio signal, and the size of the background sound included in the input audio signal;
Number-of-channels conversion means for converting the number of channels of the input audio signal and generating the audio signal after the number of channels conversion;
The size of the sound of all channels in the audio signal after channel number conversion generated by the channel number conversion means, the size of the dialog included in the audio signal after the channel number conversion, and the audio signal after the channel number conversion After-conversion calculation means for calculating the size of the background sound included in
The loudness of all channels matches the loudness of all channels calculated by the pre-conversion calculation means, and the dialog size is greater than the dialog size calculated by the pre-conversion calculation means An adjusting means for adjusting the level of the audio signal after channel number conversion generated by the channel number converting means so as to match a predetermined value;
A program audio channel number conversion device characterized by comprising.
請求項1に記載の番組音声チャンネル数変換装置において、
前記変換前算出手段の代わりに変換前ラウドネス値算出手段を、前記変換後算出手段の代わりに変換後ラウドネス値算出手段を、前記調整手段の代わりにラウドネス調整手段をそれぞれ備え、
前記変換前ラウドネス値算出手段は、
前記入力音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記入力音声信号に含まれるダイアログの平均ラウドネス値、及び前記入力音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、
前記変換後ラウドネス値算出手段は、
前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について、全チャンネルの平均ラウドネス値、前記チャンネル数変換後の音声信号に含まれるダイアログの平均ラウドネス値、及び前記チャンネル数変換後の音声信号に含まれる背景音の平均ラウドネス値をそれぞれ算出し、
前記ラウドネス調整手段は、
全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致し、かつ、ダイアログの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出されたダイアログの平均ラウドネス値以上の所定値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする番組音声チャンネル数変換装置。
In the program audio channel number conversion device according to claim 1,
A pre-conversion loudness value calculation means is provided instead of the pre-conversion calculation means, a post-conversion loudness value calculation means is provided instead of the post-conversion calculation means, and a loudness adjustment means is provided instead of the adjustment means.
The pre-conversion loudness value calculation means
The average loudness value of all channels, the average loudness value of the dialog included in the input audio signal, and the average loudness value of the background sound included in the input audio signal for the input audio signal over the entire time interval of the program Calculate each,
The post-conversion loudness value calculation means
With respect to the audio signal after channel number conversion generated by the channel number conversion means, average loudness value of all channels and average loudness value of dialog contained in the audio signal after channel number conversion over the entire time interval of the program And calculating the average loudness value of the background sound included in the audio signal after the channel number conversion,
The loudness adjustment means
The average loudness values of all the channels correspond to the average loudness values of all the channels calculated by the pre-conversion loudness value calculation means, and the average loudness values of the dialog are the averages of the dialogs calculated by the pre-conversion loudness value calculation means And converting the level of the audio signal after channel number conversion generated by the channel number conversion means so as to coincide with a predetermined value equal to or greater than a loudness value.
請求項2に記載の番組音声チャンネル数変換装置において、
さらに、メタデータ抽出手段を備え、
前記メタデータ抽出手段は、
前記入力音声信号からメタデータを抽出し、前記メタデータから、前記平均ラウドネス値を算出する際に用いるデータであって、チャンネル数変換前後における各チャンネルの音声信号の再生位置に関するチャンネル配置情報、及び各チャンネルの音声信号がダイアログ及び背景音のいずれであるかを示すダイアログ判定値を抽出する、ことを特徴とする番組音声チャンネル数変換装置。
In the program audio channel number conversion device according to claim 2,
Furthermore, metadata extraction means are provided,
The metadata extraction unit
Data used for extracting metadata from the input audio signal and calculating the average loudness value from the metadata, the channel arrangement information on the reproduction position of the audio signal of each channel before and after the conversion of the number of channels, An apparatus for converting the number of program audio channels, which extracts a dialog determination value indicating whether the audio signal of each channel is a dialog or a background sound.
請求項2または3に記載の番組音声チャンネル数変換装置において、
さらに、チャンネル分離手段を備え、
前記チャンネル分離手段は、
前記入力音声信号を構成する各チャンネルの音声信号のうち、ダイアログ成分及び背景音成分を含むチャンネルの音声信号から、前記ダイアログ成分の音声信号であるダイアログと前記背景音成分の音声信号である背景音とを分離する、ことを特徴とする番組音声チャンネル数変換装置。
In the program audio channel number conversion device according to claim 2 or 3,
Furthermore, a channel separating means is provided,
The channel separation means is
From the audio signal of the channel including the dialog component and the background sound component among the audio signals of each channel constituting the input audio signal, the dialog which is the audio signal of the dialog component and the background sound which is the audio signal of the background sound component And an apparatus for converting the number of program audio channels.
請求項2から4までのいずれか一項に記載の番組音声チャンネル数変換装置において、
前記入力音声信号の各チャンネルのうち、センターチャンネル、レフトチャンネル、ライトチャンネル、上層のセンターチャンネル及び下層のセンターチャンネルのうちの少なくとも1つをダイアログチャンネルとして扱うみなし処理を行い、前記ダイアログチャンネルの音声信号を、前記入力音声信号に含まれるダイアログとする、ことを特徴とする番組音声チャンネル数変換装置。
In the program sound channel number conversion device according to any one of claims 2 to 4,
An audio signal of the dialog channel is processed by treating at least one of the center channel, left channel, right channel, upper center channel and lower center channel among the channels of the input audio signal as the dialog channel. The program audio channel number converter, wherein the dialog is included in the input audio signal.
請求項5に記載の番組音声チャンネル数変換装置において、
予め設定された指定に基づいて、前記みなし処理を行い、
前記指定がみなし処理を行わないことを示している場合、前記みなし処理を行うことなく、前記変換前ラウドネス値算出手段は、前記入力音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記変換後ラウドネス値算出手段は、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号に対し、前記番組の全時間区間について全チャンネルのラウドネス値のみを算出し、前記ラウドネス調整手段は、全チャンネルの平均ラウドネス値が前記変換前ラウドネス値算出手段により算出された全チャンネルの平均ラウドネス値に一致するように、前記チャンネル数変換手段により生成されたチャンネル数変換後の音声信号のレベルを調整する、ことを特徴とする番組音声チャンネル数変換装置。
In the program audio channel number conversion device according to claim 5,
Perform the above-mentioned ignoring process based on a preset designation,
If the designation indicates that no categorization processing is performed, the pre-conversion loudness value calculating means may calculate the loudness of all channels for all the time sections of the program with respect to the input audio signal without performing the categorization processing. Only the value is calculated, and the converted loudness value calculating means calculates only the loudness values of all the channels for the entire time interval of the program with respect to the audio signal after the channel number conversion generated by the channel number converting means. The loudness adjustment means converts the number of channels converted by the channel number conversion means so that the average loudness values of all channels coincide with the average loudness values of all channels calculated by the pre-conversion loudness value calculation means. Adjust the audio signal level of the program, and convert the program audio channel number Location.
コンピュータを、請求項1から6までのいずれか一項に記載の番組音声チャンネル数変換装置として機能させるための番組音声チャンネル数変換プログラム。   A program audio channel number conversion program for causing a computer to function as the program audio channel number conversion device according to any one of claims 1 to 6. 放送番組の映像信号及び音声信号を受信し、前記映像信号及び前記音声信号を再生する放送番組受信装置において、
請求項1から6までのいずれか一項に記載の番組音声チャンネル数変換装置を備えたことを特徴とする放送番組受信装置。
In a broadcast program receiving apparatus for receiving a video signal and an audio signal of a broadcast program and reproducing the video signal and the audio signal,
A broadcast program receiver comprising the program audio channel number converter according to any one of claims 1 to 6.
JP2015086160A 2015-04-20 2015-04-20 Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program Active JP6510870B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015086160A JP6510870B2 (en) 2015-04-20 2015-04-20 Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015086160A JP6510870B2 (en) 2015-04-20 2015-04-20 Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program

Publications (2)

Publication Number Publication Date
JP2016208189A JP2016208189A (en) 2016-12-08
JP6510870B2 true JP6510870B2 (en) 2019-05-08

Family

ID=57487298

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015086160A Active JP6510870B2 (en) 2015-04-20 2015-04-20 Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program

Country Status (1)

Country Link
JP (1) JP6510870B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108513212B (en) * 2018-02-12 2020-12-04 深圳易科声光科技股份有限公司 Method and device for switching audio channels in operation process

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000308200A (en) * 1999-04-20 2000-11-02 Nippon Columbia Co Ltd Processing circuit for acoustic signal and amplifying device
JP2001245237A (en) * 2000-02-28 2001-09-07 Victor Co Of Japan Ltd Broadcast receiving device
US7039204B2 (en) * 2002-06-24 2006-05-02 Agere Systems Inc. Equalization for audio mixing
JP4616155B2 (en) * 2005-11-18 2011-01-19 シャープ株式会社 Television receiver
US20110268299A1 (en) * 2009-01-05 2011-11-03 Panasonic Corporation Sound field control apparatus and sound field control method
JP5658506B2 (en) * 2010-08-02 2015-01-28 日本放送協会 Acoustic signal conversion apparatus and acoustic signal conversion program
JP5909100B2 (en) * 2012-01-26 2016-04-26 日本放送協会 Loudness range control system, transmission device, reception device, transmission program, and reception program
JP6204681B2 (en) * 2013-04-05 2017-09-27 日本放送協会 Acoustic signal reproduction device
US9521501B2 (en) * 2013-09-12 2016-12-13 Dolby Laboratories Licensing Corporation Loudness adjustment for downmixed audio content

Also Published As

Publication number Publication date
JP2016208189A (en) 2016-12-08

Similar Documents

Publication Publication Date Title
JP5149968B2 (en) Apparatus and method for generating a multi-channel signal including speech signal processing
JP5635669B2 (en) System for extracting and modifying the echo content of an audio input signal
KR101935183B1 (en) A signal processing apparatus for enhancing a voice component within a multi-channal audio signal
JP5048777B2 (en) Apparatus and method for generating ambient signal from audio signal, apparatus and method for deriving multi-channel audio signal from audio signal, and computer program
KR101803293B1 (en) Signal processing apparatus and method for providing 3d sound effect
AU2005339439B2 (en) Apparatus and method for synthesizing three output channels using two input channels
KR101871234B1 (en) Apparatus and method for generating sound panorama
US11979723B2 (en) Content based spatial remixing
KR101637407B1 (en) Apparatus and method and computer program for generating a stereo output signal for providing additional output channels
KR20220076518A (en) Spectral orthogonal audio component processing
KR20100084319A (en) Method and apparatus for adaptive remastering of rear audio channel
US20230254655A1 (en) Signal processing apparatus and method, and program
JP4810621B1 (en) Audio signal conversion apparatus, method, program, and recording medium
KR102231755B1 (en) Method and apparatus for 3D sound reproducing
JP6510870B2 (en) Program sound channel number conversion device, broadcast program reception device, and program sound channel number conversion program
KR100802339B1 (en) 3D sound Reproduction Apparatus and Method using Virtual Speaker Technique under Stereo Speaker Environments
JP6694755B2 (en) Channel number converter and its program
JP6832095B2 (en) Channel number converter and its program
KR102380232B1 (en) Method and apparatus for 3D sound reproducing
JP2017212732A (en) Channel number converter and program
US11228837B2 (en) Processing device, processing method, reproduction method, and program
JP2011239036A (en) Audio signal converter, method, program, and recording medium
JP2019033352A (en) Channel number converter and program
JPWO2019203126A1 (en) Mixing equipment, mixing method, and mixing program
KR20110102719A (en) Audio up-mixing apparatus and method

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180226

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190312

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190405

R150 Certificate of patent or registration of utility model

Ref document number: 6510870

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250