JP5843705B2 - Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium - Google Patents

Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium Download PDF

Info

Publication number
JP5843705B2
JP5843705B2 JP2012138097A JP2012138097A JP5843705B2 JP 5843705 B2 JP5843705 B2 JP 5843705B2 JP 2012138097 A JP2012138097 A JP 2012138097A JP 2012138097 A JP2012138097 A JP 2012138097A JP 5843705 B2 JP5843705 B2 JP 5843705B2
Authority
JP
Japan
Prior art keywords
channel
output
audio signal
audio
assigned
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012138097A
Other languages
Japanese (ja)
Other versions
JP2014003493A (en
Inventor
藤井 修
修 藤井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2012138097A priority Critical patent/JP5843705B2/en
Publication of JP2014003493A publication Critical patent/JP2014003493A/en
Application granted granted Critical
Publication of JP5843705B2 publication Critical patent/JP5843705B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、複数のスピーカから出力される音声を制御することが可能な音声制御装置、音声再生装置、テレビジョン受像機、音声制御方法、プログラム、および記録媒体に関する。   The present invention relates to an audio control device, an audio reproduction device, a television receiver, an audio control method, a program, and a recording medium that can control audio output from a plurality of speakers.

従来、映像コンテンツを視聴する際、臨場感あるサラウンド効果を得るため、5.1チャンネルなどのマルチチャンネル音響方式が採用された音響システム(以下、「マルチチャンネル音響システム」と称する)が利用されている。マルチチャンネル音響システムにおいては、複数のチャンネルを含み、各チャンネルに対応する理想的な音声出力位置が予め定められたマルチチャンネル音声信号が利用される。マルチチャンネル音声信号を構成する各チャンネルの音声信号が表す音声を、そのチャンネルに対応する音声出力位置に配置されたスピーカから出力することによって、あたかも音場の中に居るような感覚をユーザに与えることができる。   Conventionally, in order to obtain a realistic surround effect when viewing video content, an acoustic system (hereinafter referred to as “multi-channel acoustic system”) employing a 5.1 channel multi-channel acoustic system has been used. Yes. In a multi-channel sound system, a multi-channel audio signal including a plurality of channels and having an ideal audio output position corresponding to each channel is used in advance. By outputting the sound represented by the sound signal of each channel constituting the multi-channel sound signal from the speaker arranged at the sound output position corresponding to the channel, the user feels as if they are in the sound field. be able to.

特に、近年では、スーパーハイビジョンへの利用が予定されているマルチチャンネル音響方式として、22.2チャンネルのマルチチャンネル音響方式が策定されている。この22.2チャンネルのマルチチャンネル音響方式は、3次元空間における3つのチャンネル層(上層9チャンネル、中層10チャンネル、下層3チャンネル)を含んでおり、さらに、LFE(Low Frequency Effects:低域効果)用の2つのチャンネルを含んで構成されている。これにより、22.2チャンネルの音響方式を採用したマルチチャンネル音響システムは、自然かつ高品質な3次元音響効果が得られるとされている。   In particular, in recent years, a 22.2 channel multi-channel sound system has been formulated as a multi-channel sound system scheduled to be used for Super Hi-Vision. This 22.2 channel multi-channel sound system includes three channel layers (upper layer 9 channels, middle layer 10 channels, lower layer 3 channels) in a three-dimensional space, and LFE (Low Frequency Effects). It is configured to include two channels. As a result, a multi-channel sound system employing a 22.2 channel sound system is said to provide a natural and high-quality three-dimensional sound effect.

このようなマルチチャンネル音響システムにおいて、良好なサラウンド効果を得るためには、そのチャンネル数に応じた数のスピーカを、予め定められた適切な位置に配置する必要がある。   In such a multi-channel sound system, in order to obtain a favorable surround effect, it is necessary to arrange a number of speakers corresponding to the number of channels at appropriate positions determined in advance.

しかしながら、実際には、設置スペース、設置コスト等の制約により、音響方式のチャンネル数よりも少ない数のスピーカしか設置できない場合や、スピーカを予め定められた位置に設置できない場合が多い。   However, in reality, there are many cases where only a smaller number of speakers than the number of channels of the acoustic system can be installed due to restrictions such as installation space and installation cost, or speakers cannot be installed at predetermined positions.

そこで、従来、マルチチャンネル音響システムに関し、予め定められた数のスピーカを予め定められた適切な位置に配置できない場合であっても、出来る限り良好なサラウンド効果を得ることを可能とするための、様々な技術が考案されている。   Therefore, conventionally, with respect to a multi-channel sound system, even when a predetermined number of speakers cannot be arranged at a predetermined appropriate position, it is possible to obtain the best possible surround effect. Various techniques have been devised.

例えば、下記特許文献1には、音響再生装置において、スピーカの位置が通常モードかNFL(ニアフィールドリスニング)モードかを検出し、NFLモードの場合は、上記音響信号のチャンネル数に応じた各方向の仮想音源がその方向から聞こえるように、上記音響信号を空間音場処理することが記載されている。この技術によると、スピーカを聴取者の近くに置いても本来の音質および音場感を表現することができるとされている。   For example, in Patent Document 1 below, in a sound reproduction device, it is detected whether the position of a speaker is a normal mode or an NFL (near field listening) mode, and in the NFL mode, each direction according to the number of channels of the acoustic signal It is described that the acoustic signal is subjected to spatial sound field processing so that the virtual sound source can be heard from that direction. According to this technology, it is said that the original sound quality and sound field feeling can be expressed even if a speaker is placed near the listener.

また、下記特許文献2には、複数のスピーカの各々の位置を判定し、各スピーカの位置に応じて、ステレオ信号の出力先を切り替えることが記載されている。この技術によると、複数のスピーカがどのチャンネルのスピーカであるかを考慮しなくても、確実にサラウンド効果を得ることができるとされている。   Japanese Patent Application Laid-Open No. 2004-228561 describes that the position of each of a plurality of speakers is determined and the output destination of a stereo signal is switched according to the position of each speaker. According to this technology, the surround effect can be surely obtained without considering which channel the plurality of speakers are.

特開2008−312096号公報(2008年12月25日公開)JP 2008-312096 A (released on December 25, 2008) 特開2007−60253号公報(2007年3月8日公開)JP 2007-60253 A (published March 8, 2007)

しかしながら、従来技術では、上記した22.2チャンネルの音響方式のような、3次元空間に複数のチャンネルが配置されたマルチチャンネル音響方式には対応していない。すなわち、従来技術では、スピーカの水平方向の位置に応じて、音響効果を制御することができたとしても、スピーカの垂直(上下)方向の位置に応じて音響効果を制御することはできない。このため、従来技術では、3次元空間における適切な位置(すなわち、水平方向および垂直方向の双方とも適切な位置)にスピーカが配置されていない場合において、上記マルチチャンネル音響方式用の音声信号を再生する場合、コンテンツに本来含まれる垂直方向と水平方向の立体的なサラウンド効果を良好に得ることができない。   However, the conventional technology does not support a multi-channel sound method in which a plurality of channels are arranged in a three-dimensional space, such as the 22.2 channel sound method described above. That is, in the related art, even if the acoustic effect can be controlled according to the horizontal position of the speaker, the acoustic effect cannot be controlled according to the vertical (vertical) direction position of the speaker. For this reason, in the prior art, when the speaker is not arranged at an appropriate position in the three-dimensional space (that is, an appropriate position in both the horizontal direction and the vertical direction), the audio signal for the multi-channel acoustic system is reproduced. In this case, the three-dimensional surround effect in the vertical and horizontal directions originally included in the content cannot be obtained satisfactorily.

本発明は、上記の問題に鑑みてなされたものであり、その目的は、3次元空間において適切な位置にスピーカが配置されていない場合であっても、良好なサラウンド効果を得ることにある。   The present invention has been made in view of the above problems, and an object thereof is to obtain a good surround effect even when a speaker is not disposed at an appropriate position in a three-dimensional space.

複数のチャンネルを含むマルチチャンネル音声信号であって、各チャンネルに対応する音声出力位置が予め定められたマルチチャンネル音声信号を、複数の出力チャンネルを介して出力する音声制御装置において、
前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの3次元空間における位置と、前記複数のチャンネルの各々に対応する音声出力位置とに基づいて、前記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する主チャンネル決定手段と、
前記出力チャンネル毎に、前記複数のチャンネルの中から、当該出力チャンネルに割り当てる副チャンネルを決定する副チャンネル決定手段と、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルの音声信号と、当該出力チャンネルに割り当てた前記副チャンネルの音声信号とを用いて、当該出力チャンネルを介して出力する出力音声信号を生成する出力音声信号生成手段とを備えることを特徴とする。
In a multi-channel audio signal including a plurality of channels, wherein a multi-channel audio signal having a predetermined audio output position corresponding to each channel is output via a plurality of output channels,
For each of the output channels, the output channel is selected from the plurality of channels based on the position of the speaker connected to the output channel in the three-dimensional space and the audio output position corresponding to each of the plurality of channels. A main channel determining means for determining a main channel to be assigned to
Sub-channel determining means for determining a sub-channel assigned to the output channel from the plurality of channels for each of the output channels;
For each output channel, an output audio signal to be output via the output channel is generated using the audio signal of the main channel assigned to the output channel and the audio signal of the sub-channel assigned to the output channel. And an output audio signal generating means.

本音声制御装置によれば、出力チャンネル毎に、スピーカの位置に応じた適切なチャンネルを主チャンネルとして決定することができる。このため、各スピーカから、そのスピーカの位置に応じた適切なチャンネルの音声を、主音声として出力することができる。特に、本音声制御装置によれば、3次元空間における垂直方向の位置を考慮して、主チャンネルを決定しているため、3次元空間において立体的に配置された複数のチャンネルの中から、スピーカの位置に応じた適切なチャンネルを主チャンネルとして決定することができる。   According to this audio control apparatus, an appropriate channel corresponding to the position of the speaker can be determined as the main channel for each output channel. For this reason, the sound of the appropriate channel according to the position of the speaker can be output from each speaker as the main sound. In particular, according to the audio control apparatus, the main channel is determined in consideration of the position in the vertical direction in the three-dimensional space, and therefore the speaker is selected from a plurality of channels arranged three-dimensionally in the three-dimensional space. It is possible to determine an appropriate channel according to the position as the main channel.

すなわち、本音声制御装置によれば、スピーカの水平方向および垂直方向の位置に応じて、音響効果を制御することができるため、3次元空間において適切な位置(水平方向および垂直方向の双方の適切な位置)にスピーカが配置されていない場合であっても、良好なサラウンド効果を得ることができる。   That is, according to the sound control device, the acoustic effect can be controlled according to the position of the speaker in the horizontal direction and the vertical direction, so that the appropriate position in the three-dimensional space (appropriate in both the horizontal direction and the vertical direction). Even if a speaker is not disposed at a desired position, a good surround effect can be obtained.

また、本音声制御装置によれば、出力チャンネル毎に、対応する主チャンネルをスピーカの位置に応じて決定しているため、例えばユーザがスピーカの接続端子や設置位置を間違えたとしても、そのスピーカの位置に応じた適切なチャンネルを、主チャンネルとして決定することができる。すなわち、各スピーカがどのように接続されたとしても、各スピーカからその位置に応じた適切なチャンネルの音声を出力することができる。   In addition, according to the audio control device, for each output channel, the corresponding main channel is determined according to the position of the speaker. For example, even if the user mistakes the connection terminal or installation position of the speaker, the speaker An appropriate channel in accordance with the position of can be determined as the main channel. That is, no matter how the speakers are connected, the sound of an appropriate channel corresponding to the position can be output from each speaker.

また、本音声制御装置によれば、複数のチャンネルの各々について音声出力位置が予め定められており、殆どの処理を、この音声出力位置に基づいて行っているため、処理をパターン化することが可能であり、複雑な演算処理等を行う必要なく、より高速な処理を実現することができる。   Further, according to the audio control apparatus, since the audio output position is predetermined for each of the plurality of channels, and most of the processing is performed based on the audio output position, the processing can be patterned. It is possible, and higher-speed processing can be realized without having to perform complicated arithmetic processing.

上記音声制御装置において、前記出力音声信号生成手段は、前記出力チャンネル毎に、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの音声信号とをダウンミックスすることにより、当該出力チャンネルを介して出力する出力音声信号を生成することが好ましい。   In the audio control device, the output audio signal generation means downmixes, for each output channel, the audio signal of the main channel assigned to the output channel and the audio signal of the subchannel assigned to the output channel. Thus, it is preferable to generate an output audio signal to be output via the output channel.

この構成によれば、各スピーカから、そのスピーカの位置に応じた適切な主チャンネルの音声が主音声としてダウンミックスされた出力音声信号を出力することができるため、良好なサラウンド効果を得ることができる。
・ 上記音声制御装置において、前記出力音声信号生成手段は、前記出力チャンネル毎に、当該出力チャンネルに割り当てた副チャンネルの音声信号が表す音声が、該副チャンネルに対応する音声出力位置に定位するように、当該出力チャンネルに割り当てた副チャンネルの音声信号の周波数特性を、頭部伝達関数を用いて補正した後、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの信号とをダウンミックスすることにより、当該出力チャンネルを介して出力する出力音声信号を生成することが好ましい。
According to this configuration, it is possible to output an output audio signal in which the sound of the appropriate main channel corresponding to the position of the speaker is downmixed as the main audio from each speaker, so that a favorable surround effect can be obtained. it can.
In the audio control device, the output audio signal generation unit is configured to localize the audio represented by the audio signal of the subchannel assigned to the output channel at the audio output position corresponding to the subchannel for each output channel. After correcting the frequency characteristics of the audio signal of the sub-channel assigned to the output channel using the head related transfer function, the audio signal of the main channel assigned to the output channel and the sub-channel assigned to the output channel It is preferable to generate an output audio signal to be output via the output channel by down-mixing the above signal.

特に、上記音声制御装置において、前記出力音声信号生成手段は、前記出力チャンネル毎に、当該出力チャンネルに割り当てた副チャンネルの音声信号を、前記3次元空間における水平方向の頭部伝達関数と、前記3次元空間における垂直方向の頭部伝達関数とを用いて補正することが好ましい。   In particular, in the audio control device, the output audio signal generating means, for each output channel, the audio signal of the subchannel assigned to the output channel, the head related transfer function in the horizontal direction in the three-dimensional space, and the It is preferable to perform correction using a vertical head related transfer function in a three-dimensional space.

この構成によれば、各チャンネルの音声を、3次元空間における所定の音声出力位置に定位させることができる。すなわち、各チャンネルの音声を、3次元空間における水平方向のみならず垂直方向についても、所定の音声出力位置に定位させることができる。これにより、視聴者に対し、各チャンネルの音声を、上記所定の音声出力位置から聞こえてくるように感じさせることができる。このため、3次元空間において適切な位置にスピーカが配置されていない場合であっても、より良好かつ立体的なサラウンド効果を得ることができる。   According to this configuration, the sound of each channel can be localized at a predetermined sound output position in the three-dimensional space. That is, the sound of each channel can be localized at a predetermined sound output position not only in the horizontal direction but also in the vertical direction in the three-dimensional space. This makes it possible for the viewer to feel that the sound of each channel is heard from the predetermined sound output position. For this reason, even if the speaker is not disposed at an appropriate position in the three-dimensional space, a better and three-dimensional surround effect can be obtained.

上記音声制御装置において、前記主チャンネル決定手段は、前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの位置の、基準位置からの方向である第1の方向と、前記複数のチャンネルの各々の前記音声出力位置の、前記基準位置からの方向である第2の方向とに基づいて、前記第2の方向が前記第1の方向に最も近似するチャンネルを、当該出力チャンネルに割り当てる主チャンネルとして決定することが好ましい。   In the audio control device, the main channel determination means includes, for each output channel, a first direction that is a direction from a reference position of a speaker connected to the output channel, and each of the plurality of channels. Based on the second direction, which is the direction from the reference position, of the audio output position, the channel whose second direction is the closest to the first direction is the main channel assigned to the output channel. It is preferable to determine.

この構成によれば、より効率的かつ適切に、各出力チャンネルに割り当てる主チャンネルを決定することができる。   According to this configuration, the main channel to be assigned to each output channel can be determined more efficiently and appropriately.

上記音声制御装置において、前記複数のチャンネルは、予め領域毎にグループ化されており、前記副チャンネル決定手段は、前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルに対応する前記グループに含まれているチャンネルを、当該出力チャンネルに割り当てる副チャンネルとして決定することが好ましい。   In the audio control apparatus, the plurality of channels are grouped in advance for each region, and the sub-channel determination unit assigns, for each output channel, the group corresponding to the main channel assigned to the output channel. Preferably, the included channel is determined as a sub-channel assigned to the output channel.

この構成によれば、より効率的かつ適切に、各出力チャンネルに割り当てる副チャンネルを決定することができる。   According to this configuration, it is possible to determine the sub-channel assigned to each output channel more efficiently and appropriately.

上記音声制御装置において、前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの位置を検出する検出手段をさらに備えることが好ましい。   The voice control device preferably further includes detection means for detecting a position of a speaker connected to the output channel for each output channel.

この構成によれば、より効率的かつ確実に、スピーカの位置を特定することができる。   According to this configuration, the position of the speaker can be specified more efficiently and reliably.

また、本発明に係る音声再生装置は、上記音声制御装置を備えたことを特徴とする。   In addition, a sound reproducing device according to the present invention includes the above sound control device.

本音声再生装置によれば、上記音声制御装置と同様の効果を奏する音声再生装置を提供することができる。   According to this audio reproduction device, it is possible to provide an audio reproduction device that has the same effect as the audio control device.

また、本発明に係るテレビジョン受像機は、上記音声制御装置を備えたことを特徴とする。   In addition, a television receiver according to the present invention includes the above-described audio control device.

本テレビジョン受像機によれば、上記音声制御装置と同様の効果を奏するテレビジョン受像機を提供することができる。   According to the present television receiver, it is possible to provide a television receiver that has the same effect as the sound control device.

また、本発明に係る音声制御方法は、複数のチャンネルを含むマルチチャンネル音声信号であって、各チャンネルに対応する音声出力位置が予め定められたマルチチャンネル音声信号を、複数の出力チャンネルを介して出力する音声制御方法において、前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの3次元空間における位置と、前記複数のチャンネルの各々に対応する音声出力位置とに基づいて、前記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する主チャンネル決定工程と、前記出力チャンネル毎に、前記複数のチャンネルの中から、当該出力チャンネルに割り当てる副チャンネルを決定する副チャンネル決定工程と、前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルの音声信号と、当該出力チャンネルに割り当てた前記副チャンネルの音声信号とを用いて、当該出力チャンネルを介して出力する出力音声信号を生成する出力音声信号生成工程とを含むことを特徴とする。   The audio control method according to the present invention is a multi-channel audio signal including a plurality of channels, and a multi-channel audio signal having a predetermined audio output position corresponding to each channel is transmitted via the plurality of output channels. In the audio control method for outputting, for each of the output channels, the plurality of channels based on a position in a three-dimensional space of a speaker connected to the output channel and an audio output position corresponding to each of the plurality of channels. A main channel determining step for determining a main channel to be assigned to the output channel, a sub channel determining step for determining a sub channel to be assigned to the output channel from the plurality of channels for each output channel, Assigned to the output channel for each output channel An output audio signal generating step of generating an output audio signal to be output through the output channel using the audio signal of the main channel and the audio signal of the sub-channel assigned to the output channel. And

本音声制御方法によれば、当該音声制御方法を実行することにより、上記音声制御装置と同様の効果を奏することができる。   According to this voice control method, the same effect as the voice control apparatus can be obtained by executing the voice control method.

また、本発明に係るプログラムは、コンピュータを上記音声制御装置として機能させるためのプログラムであって、前記コンピュータを前記音声制御装置が備える前記各手段として機能させる。   The program according to the present invention is a program for causing a computer to function as the voice control device, and causes the computer to function as each unit included in the voice control device.

本プログラムによれば、コンピュータが当該プログラムを実行することにより、このコンピュータは、上記音声制御装置と同様の効果を奏することができる。   According to this program, when the computer executes the program, the computer can achieve the same effects as the voice control device.

また、本発明に係る記録媒体は、上記プログラムを記録しているコンピュータ読み取り可能な記録媒体である。   A recording medium according to the present invention is a computer-readable recording medium in which the program is recorded.

本記録媒体によれば、上記音声制御装置と同様の効果を奏することを実現可能とする上記プログラムを当該記録媒体により提供することができる。   According to this recording medium, it is possible to provide the program that makes it possible to realize the same effects as the sound control apparatus.

本発明に係る音声制御装置、テレビジョン受像機、音声制御方法、プログラム、および記録媒体によれば、3次元空間において適切な位置にスピーカが配置されていない場合であっても、良好なサラウンド効果を得ることができる。   According to the sound control device, the television receiver, the sound control method, the program, and the recording medium according to the present invention, even when the speaker is not disposed at an appropriate position in the three-dimensional space, a good surround effect is obtained. Can be obtained.

実施形態に係るテレビジョン受像機の構成を示すブロック図である。It is a block diagram which shows the structure of the television receiver which concerns on embodiment. 本実施形態のテレビジョン受像機が備える音声制御回路の構成を示すブロック図である。It is a block diagram which shows the structure of the audio | voice control circuit with which the television receiver of this embodiment is provided. 実施形態に係る音声制御回路による音声制御処理の手順を示すフローチャートである。It is a flowchart which shows the procedure of the audio | voice control process by the audio | voice control circuit which concerns on embodiment. 記憶部に記憶されているベクトルデータベースの一例を示す。An example of the vector database memorize | stored in the memory | storage part is shown. 図4に示すベクトルデータベースに定義されている各音声出力位置を示す模式図である。It is a schematic diagram which shows each audio | voice output position defined in the vector database shown in FIG. 記憶部に記憶されている3次元空間における水平方向(前後方向および左右方向)の頭部伝達関数の一例を示す。An example of the head-related transfer function in the horizontal direction (front-rear direction and left-right direction) in the three-dimensional space stored in the storage unit is shown. 図4に示すベクトルデータベースに定義されている各音声出力位置の方向を示す。The direction of each voice output position defined in the vector database shown in FIG. 4 is shown.

以下、本発明の実施形態について、図面を用いて説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

(テレビジョン受像機100の概要)
はじめに、図1を参照して、実施形態に係るテレビジョン受像機100の概要および構成について説明する。図1は、実施形態に係るテレビジョン受像機100の構成を示すブロック図である。
(Outline of the television receiver 100)
First, with reference to FIG. 1, the outline | summary and structure of the television receiver 100 which concern on embodiment are demonstrated. FIG. 1 is a block diagram illustrating a configuration of a television receiver 100 according to the embodiment.

図1に示すテレビジョン受像機100は、地上デジタル放送やBS/CSデジタル放送等の各種映像コンテンツを、対応するアンテナおよびチューナによって受信し、受信した映像コンテンツを再生することによって、これら各種映像コンテンツを視聴者に視聴させることができる。   The television receiver 100 shown in FIG. 1 receives various video contents such as terrestrial digital broadcasts and BS / CS digital broadcasts by a corresponding antenna and tuner, and reproduces the received video contents. Can be viewed by the viewer.

特に、テレビジョン受像機100は、複数の外部スピーカ150を接続することで、マルチチャンネル音響システムを構築して、複数の外部スピーカ150から、映像コンテンツの音声をマルチチャンネル出力することが可能となっている。   In particular, the television receiver 100 can connect a plurality of external speakers 150 to construct a multi-channel sound system and output the audio of the video content from the plurality of external speakers 150 in a multi-channel manner. ing.

(テレビジョン受像機100の構成)
図1に示すように、テレビジョン受像機100は、チューナユニット102、ディスプレイ駆動回路104、ディスプレイ106、音声出力回路108、外部機器インタフェース110、通信インタフェース112、音声制御回路120、およびマイク122を備えている。
(Configuration of television receiver 100)
As shown in FIG. 1, the television receiver 100 includes a tuner unit 102, a display driving circuit 104, a display 106, an audio output circuit 108, an external device interface 110, a communication interface 112, an audio control circuit 120, and a microphone 122. ing.

(チューナユニット)
チューナユニット102は、チューナ、デモジュレータ、デマルチプレクサ、ビデオデコーダ、オーディオデコーダ等を有して構成されている。チューナは、地上デジタル放送やBS/CSデジタル放送等の各種映像コンテンツの放送波を、外部アンテナを介して受信する。デモジュレータは、チューナによって受信された放送波を復調することによって映像コンテンツのTS(Transport Stream)を得る。デマルチプレクサは、デモジュレータによって得られたTSから映像コンテンツの映像信号および音声信号を分離する。
(Tuner unit)
The tuner unit 102 includes a tuner, a demodulator, a demultiplexer, a video decoder, an audio decoder, and the like. The tuner receives broadcast waves of various video contents such as terrestrial digital broadcast and BS / CS digital broadcast via an external antenna. The demodulator obtains a TS (Transport Stream) of the video content by demodulating the broadcast wave received by the tuner. The demultiplexer separates the video signal and the audio signal of the video content from the TS obtained by the demodulator.

そして、デマルチプレクサによってTSから分離された映像信号(圧縮ビデオデータ)は、ビデオデコーダによってデコードされ、デジタルビデオデータとなって、ディスプレイ駆動回路104へ供給される。一方、デマルチプレクサによってTSから分離された音声信号(圧縮音声データ)は、オーディオデコーダによってデコードされ、デジタルオーディオデータとなって、音声出力回路108へ供給される。   Then, the video signal (compressed video data) separated from the TS by the demultiplexer is decoded by the video decoder, converted into digital video data, and supplied to the display driving circuit 104. On the other hand, the audio signal (compressed audio data) separated from the TS by the demultiplexer is decoded by the audio decoder and is supplied to the audio output circuit 108 as digital audio data.

(外部機器インタフェース)
外部機器インタフェース110は、外部機器へのアクセスを制御する。例えば、テレビジョン受像機100は、BDレコーダやHDDレコーダ等の外部機器を接続することにより、これらの外部機器によって再生された映像コンテンツの映像をディスプレイ106に表示したり、その音声を外部スピーカ150から出力したりすることができる。その際、レコーダへのアクセスは、この外部機器インタフェース110によって制御されることとなる。
(External device interface)
The external device interface 110 controls access to the external device. For example, the television receiver 100 is connected to an external device such as a BD recorder or an HDD recorder, so that the video of the video content reproduced by the external device is displayed on the display 106, or the sound is displayed on the external speaker 150. Can be output. At that time, access to the recorder is controlled by the external device interface 110.

(通信インタフェース)
通信インタフェース112は、LANやインターネット等の通信ネットワークへのアクセスを制御する。例えば、テレビジョン受像機100は、インターネットに接続することにより、インターネットからダウンロードした映像コンテンツの映像をディスプレイ106に表示したり、その音声を外部スピーカ150から出力したりすることができる。その際、インターネットへのアクセスは、この通信インタフェース112によって制御されることとなる。
(Communication interface)
The communication interface 112 controls access to a communication network such as a LAN or the Internet. For example, the television receiver 100 can display a video of video content downloaded from the Internet on the display 106 or output the sound from the external speaker 150 by connecting to the Internet. At that time, access to the Internet is controlled by the communication interface 112.

(ディスプレイ駆動回路、ディスプレイ)
ディスプレイ駆動回路104は、供給された映像信号に応じてディスプレイ106を駆動することにより、映像コンテンツを構成する映像を、ディスプレイ106に表示させる。本実施形態のテレビジョン受像機100は、ディスプレイ106として、液晶ディスプレイを採用しているが、これ以外にも、有機ELディスプレイ、プラズマディスプレイ、ブラウン管ディスプレイ等が採用され得る。
(Display drive circuit, display)
The display drive circuit 104 drives the display 106 in accordance with the supplied video signal, thereby causing the display 106 to display the video constituting the video content. The television receiver 100 of the present embodiment employs a liquid crystal display as the display 106, but other than this, an organic EL display, a plasma display, a cathode ray tube display, or the like may be employed.

(音声出力回路、スピーカ)
音声出力回路108は、供給された音声信号に応じて外部スピーカ150を駆動することにより、映像コンテンツを構成する音声を外部スピーカ150から出力させる。テレビジョン受像機100には、いくつかのスピーカが内蔵されているだけでなく、複数の外部スピーカ150を接続することが可能となっている。テレビジョン受像機100に接続する外部スピーカ150の数は、ユーザによって任意に変更され得る。
(Audio output circuit, speaker)
The audio output circuit 108 drives the external speaker 150 in accordance with the supplied audio signal, thereby outputting the audio constituting the video content from the external speaker 150. The television receiver 100 has not only a few built-in speakers but also a plurality of external speakers 150 that can be connected. The number of external speakers 150 connected to the television receiver 100 can be arbitrarily changed by the user.

例えば、テレビジョン受像機100は、22.2チャンネルのマルチチャンネル音響システムを構築することができるように、24個の出力チャンネルを備えており、各出力チャンネルに対して、外部スピーカ150を接続することが可能となっている。すなわち、テレビジョン受像機100は、24個の外部スピーカ150を接続することが可能となっている。   For example, the television receiver 100 includes 24 output channels so that a 22.2 channel multi-channel sound system can be constructed, and an external speaker 150 is connected to each output channel. It is possible. That is, the television receiver 100 can connect 24 external speakers 150.

例えば、当該テレビジョン受像機100に24個の外部スピーカ150が接続された場合、これに応じて、音声出力回路108は、映像コンテンツを構成する音声を、当該24個の外部スピーカ150から出力させることが可能となっている。また、外部スピーカ150は、テレビに内蔵されているスピーカであっても良い。   For example, when 24 external speakers 150 are connected to the television receiver 100, in response to this, the audio output circuit 108 causes the audio constituting the video content to be output from the 24 external speakers 150. It is possible. The external speaker 150 may be a speaker built in the television.

しかしながら、設置スペースや設置コスト等の制約により、テレビジョン受像機100に対して、24個の外部スピーカ150を接続することができず、より少ない数の外部スピーカ150が接続される場合がある。例えば、テレビジョン受像機100に内蔵の2チャンネルのスピーカのみの場合や、5.1チャンネルのシアターシステムを外部に接続する場合などもある。   However, due to restrictions such as installation space and installation cost, 24 external speakers 150 cannot be connected to the television receiver 100, and a smaller number of external speakers 150 may be connected. For example, there may be a case where only a two-channel speaker built in the television receiver 100 is connected, or a case where a 5.1-channel theater system is connected to the outside.

(音声制御回路)
音声制御回路120は、テレビジョン受像機100に接続された外部スピーカ150の数および位置に応じて、各外部スピーカ150に供給される音声信号を制御する。
(Voice control circuit)
The audio control circuit 120 controls the audio signal supplied to each external speaker 150 according to the number and position of the external speakers 150 connected to the television receiver 100.

例えば、音声制御回路120は、当該音声制御回路120に入力された音声信号(以下、「入力音声信号」と示す)のチャンネル数(mとする)が、上記外部スピーカ150の数(nとする)よりも多い場合、上記mチャンネルの入力音声信号をダウンミックスすることにより、nチャンネルの音声信号(以下、「出力音声信号」と示す)を生成する。   For example, in the audio control circuit 120, the number of channels (m) of the audio signal (hereinafter referred to as “input audio signal”) input to the audio control circuit 120 is the number (n) of the external speakers 150. ), The n-channel audio signal (hereinafter referred to as “output audio signal”) is generated by downmixing the m-channel input audio signal.

そして、音声制御回路120は、生成されたnチャンネルの出力音声信号を、音声出力回路108へ供給する。これにより、n個の外部スピーカ150の各々に対して、対応するチャンネルの音声信号が供給され、各外部スピーカ150から、対応するチャンネルの音声が出力されることとなる。   Then, the audio control circuit 120 supplies the generated n-channel output audio signal to the audio output circuit 108. As a result, the audio signal of the corresponding channel is supplied to each of the n external speakers 150, and the audio of the corresponding channel is output from each external speaker 150.

例えば、音声制御回路120は、当該音声制御回路120に22.2チャンネルの入力音声信号が入力されたにも関わらず、テレビジョン受像機100に対して外部スピーカ150が2つしか接続されていない場合、22.2チャンネルの入力音声信号をダウンミックスすることにより、2チャンネルの出力音声信号を生成する。これにより、2つの外部スピーカ150各々からは、当該外部スピーカ150に対応する複数のチャンネルの音声が出力されることとなる。   For example, the audio control circuit 120 has only two external speakers 150 connected to the television receiver 100 even though 22.2 channel input audio signals have been input to the audio control circuit 120. In this case, the output audio signal of 2 channels is generated by downmixing the input audio signal of 22.2 channels. As a result, audio from a plurality of channels corresponding to the external speaker 150 is output from each of the two external speakers 150.

このように、本実施形態のテレビジョン受像機100は、入力音声信号のチャンネル数に対する外部スピーカ150の数が少ない場合であっても、これら複数の外部スピーカ150から複数のチャンネルの音声を出力することによって、良好な音響効果を得ることができる。   As described above, the television receiver 100 according to the present embodiment outputs audio of a plurality of channels from the plurality of external speakers 150 even when the number of external speakers 150 is small with respect to the number of channels of the input audio signal. Thus, a good acoustic effect can be obtained.

(マイク122)
マイク122には、テレビジョン受像機100周辺の音声が入力される。後述するように、テレビジョン受像機100は、各外部スピーカ150から出力され、且つこのマイク122から入力された音声に基づいて、各外部スピーカ150の位置を検出することが可能となっている。なお、マイク122は、テレビジョン受像機100に内蔵されたものであってもよく、テレビジョン受像機100に外部接続されたものであってもよい。
(Microphone 122)
Sound around the television receiver 100 is input to the microphone 122. As will be described later, the television receiver 100 can detect the position of each external speaker 150 based on the sound output from each external speaker 150 and input from the microphone 122. The microphone 122 may be built in the television receiver 100 or may be externally connected to the television receiver 100.

(音声制御回路の構成)
次に、図2を参照して、本実施形態のテレビジョン受像機100が備える音声制御回路120の構成について具体的に説明する。図2は、本実施形態のテレビジョン受像機100が備える音声制御回路120の構成を示すブロック図である。
(Configuration of voice control circuit)
Next, with reference to FIG. 2, the structure of the audio | voice control circuit 120 with which the television receiver 100 of this embodiment is provided is demonstrated concretely. FIG. 2 is a block diagram illustrating a configuration of the audio control circuit 120 included in the television receiver 100 of the present embodiment.

図2に示すように、音声制御回路120は、記憶部200、検出部202、主チャンネル決定部204、副チャンネル決定部208、出力音声信号生成部210、および音声信号出力部212を備える。   As shown in FIG. 2, the audio control circuit 120 includes a storage unit 200, a detection unit 202, a main channel determination unit 204, a sub channel determination unit 208, an output audio signal generation unit 210, and an audio signal output unit 212.

(記憶部200)
記憶部200は、ベクトルデータベースおよび頭部伝達関数(HRTF: Head Related Transfer Function)を記憶する。ベクトルデータベースには、マルチチャンネル音響システムのチャンネル毎に、3次元空間における音声出力位置が定義されている。各音声出力位置は、良好な音響効果(サラウンド効果)を得るために、その位置での音声出力が推奨されている位置である。
(Storage unit 200)
The storage unit 200 stores a vector database and a head related transfer function (HRTF). In the vector database, an audio output position in a three-dimensional space is defined for each channel of the multi-channel acoustic system. Each sound output position is a position where sound output at that position is recommended in order to obtain a good acoustic effect (surround effect).

例えば、本実施形態のテレビジョン受像機100は、24個の外部スピーカ150を接続することにより、22.2チャンネルの音響システムを構築することが可能となっている。これに応じて、ベクトルデータベースには、22.2チャンネルを構成する各チャンネルの音声出力位置(すなわち、24箇所の音声出力位置)が定義されている。   For example, the television receiver 100 according to the present embodiment can construct a 22.2 channel sound system by connecting 24 external speakers 150. Correspondingly, the vector database defines the audio output positions (that is, 24 audio output positions) of each channel constituting 22.2 channels.

頭部伝達関数は、音声が出力されてから、当該音声が視聴者の頭部を経由して視聴者の鼓膜に至るまでの音声の伝達特性を示すものであり、音声の周波数特性を相対音圧レベルで示したものである。人間の頭部の構造は、方向毎に異なるため、音声が出力された位置の方向によって、その音声が鼓膜に到達した時の周波数特性が異なる。この周波数特性の違いにより、人間は、音声が出力された位置の方向を特定することができるようになっている。この原理を利用して、頭部伝達関数においては、視聴者を基準とする音声の出力位置がある方向毎に、異なる周波数特性が定義されている。したがって、この頭部伝達関数に基づいて、音声の周波数特性を制御することにより、その音声の仮想的な出力位置がある方向を自在に調整することが可能となる。   The head-related transfer function indicates the transfer characteristic of the sound from when the sound is output until the sound passes through the viewer's head and reaches the viewer's eardrum. This is indicated by the pressure level. Since the structure of the human head differs depending on the direction, the frequency characteristics when the sound reaches the eardrum differ depending on the direction of the position where the sound is output. Due to the difference in frequency characteristics, a human can specify the direction of the position where the sound is output. Using this principle, in the head-related transfer function, different frequency characteristics are defined for each direction in which the audio output position is based on the viewer. Therefore, by controlling the frequency characteristics of the sound based on this head-related transfer function, the direction in which the virtual output position of the sound is located can be freely adjusted.

特に、本実施形態のテレビジョン受像機100においては、記憶部200には、3次元空間における水平方向(前後方向および左右方向)の頭部伝達関数と、3次元空間における垂直方向(上下方向)の頭部伝達関数とが、記憶されている。テレビジョン受像機100は、この2つの頭部伝達関数を用いることにより、3次元空間におけるいずれの方向にも、音声の仮想的な出力位置がある方向を自在に調整することが可能となっている。   In particular, in the television receiver 100 of the present embodiment, the storage unit 200 includes a head-related transfer function in the horizontal direction (front-rear direction and left-right direction) in a three-dimensional space and a vertical direction (up-down direction) in a three-dimensional space. Are stored. By using these two head-related transfer functions, the television receiver 100 can freely adjust the direction in which the virtual output position of the sound is in any direction in the three-dimensional space. Yes.

(検出部202)
検出部202は、利用可能な出力チャンネル毎に、外部スピーカ150の位置を検出する。ここで、「利用可能な出力チャンネル」とは、外部スピーカ150が接続されている出力チャンネルのことを意味するが、これに限らず、ユーザによって利用することが選択された出力チャンネル等であってもよい。
(Detector 202)
The detection unit 202 detects the position of the external speaker 150 for each available output channel. Here, “available output channel” means an output channel to which the external speaker 150 is connected, but is not limited to this, and is an output channel or the like selected by the user. Also good.

例えば、検出部202は、上記出力チャンネル毎に、以下の検出処理(1−1)〜(1−5)を行うことにより、当該出力チャンネルに接続されている外部スピーカ150の位置を検出する。例えば、テレビジョン受像機100には、24個の外部スピーカ150を接続することが可能となっているが、2個の外部スピーカ150しか接続されていない場合には、検出部202は、この2個のスピーカ150の各位置を検出することになる。   For example, the detection unit 202 detects the position of the external speaker 150 connected to the output channel by performing the following detection processes (1-1) to (1-5) for each output channel. For example, it is possible to connect 24 external speakers 150 to the television receiver 100, but when only two external speakers 150 are connected, the detection unit 202 detects the two external speakers 150. Each position of the single speaker 150 is detected.

(1−1)検出部202は、位置検出用の音声信号をメモリ等の記録媒体から読み出し、当該音声信号を、出力チャンネルを指定して、音声信号出力部212へ供給する。この音声信号は、インパルスまたは正弦波等であることが好ましい。   (1-1) The detection unit 202 reads an audio signal for position detection from a recording medium such as a memory, and supplies the audio signal to the audio signal output unit 212 by designating an output channel. The audio signal is preferably an impulse or a sine wave.

(1−2)これにより、当該音声信号は、音声出力回路108へ供給され、当該音声信号が、指定された出力チャンネルから出力される。これにより、当該音声信号に基づく音声が、指定された出力チャンネルに接続されている外部スピーカ150から出力される。   (1-2) Thereby, the audio signal is supplied to the audio output circuit 108, and the audio signal is output from the designated output channel. Thereby, the sound based on the sound signal is output from the external speaker 150 connected to the designated output channel.

(1−3)検出部202は、外部スピーカ150から出力された音声を、マイク122によって集音する。このとき、検出部202は、スピーカの空間位置情報を得るために少なくとも3つ以上のマイク122を用いることがより好ましい。   (1-3) The detection unit 202 collects sound output from the external speaker 150 by the microphone 122. At this time, it is more preferable that the detection unit 202 uses at least three or more microphones 122 in order to obtain speaker spatial position information.

(1−4)検出部202は、マイク122毎に、上記音声についての、外部スピーカ150からの出力時刻とマイク122からの入力時刻との差、または、外部スピーカ150からの出力レベルとマイク122からの入力レベルとの差、の少なくともいずれか一方に基づいて、外部スピーカ150から当該マイク122までの距離を検出する。   (1-4) For each microphone 122, the detection unit 202, for each microphone 122, the difference between the output time from the external speaker 150 and the input time from the microphone 122, or the output level from the external speaker 150 and the microphone 122. The distance from the external speaker 150 to the microphone 122 is detected on the basis of at least one of the difference from the input level from.

(1−5)検出部202は、予め定められた基準位置(例えば、ディスプレイ106の中央位置)に対する各マイク122の位置と、外部スピーカ150から各マイク122までの距離とに基づいて、上記基準位置に対する外部スピーカ150の空間座標位置を特定する。   (1-5) The detection unit 202 determines the reference based on the position of each microphone 122 with respect to a predetermined reference position (for example, the center position of the display 106) and the distance from the external speaker 150 to each microphone 122. The spatial coordinate position of the external speaker 150 with respect to the position is specified.

(主チャンネル決定部204)
主チャンネル決定部204は、利用可能な出力チャンネル毎に、当該出力チャンネルに接続されている外部スピーカ150の空間座標位置(すなわち、検出部202によって検出された位置)に応じて、当該出力チャンネルに割り当てる主チャンネルを決定する。
(Main channel determination unit 204)
For each available output channel, the main channel determination unit 204 sets the output channel according to the spatial coordinate position of the external speaker 150 connected to the output channel (that is, the position detected by the detection unit 202). Determine the main channel to assign.

テレビジョン受像機100においては、記憶部200に記憶されているベクトルデータベースにおいて、複数のチャンネルの各々に対し、3次元空間における複数の音声出力位置が予め定められている。そこで、主チャンネル決定部204は、出力チャンネル毎に、当該出力チャンネルに接続されている外部スピーカ150の位置と、ベクトルデータベースにおいて定められている複数のチャンネルの各々の音声出力位置とに基づいて、上記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する。   In the television receiver 100, in the vector database stored in the storage unit 200, a plurality of audio output positions in a three-dimensional space are predetermined for each of a plurality of channels. Therefore, the main channel determination unit 204, for each output channel, based on the position of the external speaker 150 connected to the output channel and the audio output position of each of the plurality of channels defined in the vector database, A main channel to be assigned to the output channel is determined from the plurality of channels.

例えば、主チャンネル決定部204は、その音声出力位置の基準位置(視聴者の位置)からの方向(第2の方向)が、基準位置(視聴者の位置)からの外部スピーカ150の位置の方向(第1の方向)に最も近似するチャンネルを、当該出力チャンネルに割り当てるる主チャンネルとして決定する。   For example, the main channel determination unit 204 determines that the direction (second direction) of the audio output position from the reference position (viewer position) is the position of the external speaker 150 from the reference position (viewer position). The channel closest to (first direction) is determined as the main channel to be assigned to the output channel.

例えば、テレビジョン受像機100に内蔵するスピーカを利用する場合、チャンネルFLc,チャンネルFRc(図5参照)が、主チャンネルとして割り当てられ得る。   For example, when a speaker built in the television receiver 100 is used, the channel FLc and the channel FRc (see FIG. 5) can be assigned as main channels.

また、5チャンネルのマルチチャンネル音響方式に準拠して、5つの外部スピーカを床面に配置して利用する場合、チャンネルFL,FR,FC,BL,BR(図5参照)が、主チャンネルとして割り当てられ得る。   Also, in accordance with the 5-channel multi-channel sound system, when five external speakers are arranged on the floor and used, channels FL, FR, FC, BL, BR (see FIG. 5) are assigned as main channels. Can be.

また、5チャンネルのマルチチャンネル音響方式に準拠して、5つの外部スピーカを天井から吊り下げて利用する場合、チャンネルTpFL,TpFR,TpFC,TpBL,TpBR(図5参照)が、主チャンネルとして割り当てられ得る。   Further, in accordance with the 5-channel multi-channel sound system, when five external speakers are suspended from the ceiling, channels TpFL, TpFR, TpFC, TpBL, and TpBR (see FIG. 5) are assigned as main channels. obtain.

(副チャンネル決定部208)
副チャンネル決定部208は、出力チャンネル毎に、上記複数のチャンネル(すなわち、ベクトルデータベースに定義されている複数のチャンネル)の中から、当該出力チャンネルに割り当てる副チャンネルを決定する。
(Sub-channel determination unit 208)
The subchannel determination unit 208 determines, for each output channel, a subchannel to be assigned to the output channel from among the plurality of channels (that is, a plurality of channels defined in the vector database).

本実施形態のテレビジョン受像機100においては、上記複数のチャンネルは、予め領域毎にグループ化されている。特に、本実施形態のテレビジョン受像機100においては、上記グループ化は、主チャンネルの組み合わせ毎に定義されている。この定義付けは、例えば、テレビジョン受像機100が備えるメモリ等(例えば、記憶部200)に記憶されている。そして、副チャンネル決定部208は、出力チャンネル毎に、当該出力チャンネルに割り当てる主チャンネルが決定されたことに応じて、当該主チャンネルに対応する上記グループに含まれているチャンネルを、当該出力チャンネルに割り当てる副チャンネルとして決定する。   In the television receiver 100 of the present embodiment, the plurality of channels are grouped in advance for each area. In particular, in the television receiver 100 of the present embodiment, the grouping is defined for each combination of main channels. This definition is stored in, for example, a memory (for example, the storage unit 200) included in the television receiver 100. Then, in response to the determination of the main channel to be assigned to the output channel for each output channel, the sub-channel determination unit 208 sets the channel included in the group corresponding to the main channel as the output channel. Decide as subchannel to assign.

例えば、図5に示すチャンネルFL(フロント左側)とチャンネルFR(フロント右側)とが主チャンネルとして決定された場合には、副チャンネル決定部208は、FLを主チャンネルとする出力チャンネルには、3次元空間における左側(図5に示すx軸負方向側)の領域のチャンネル群と、3次元空間における中央部(すなわち、x座標が0)の領域のチャンネル群とを、当該出力チャンネルに割り当てる副チャンネルとして決定し、FRを主チャンネルとする出力チャンネルには、3次元空間における右側(図5に示すx軸正方向側)の領域のチャンネル群と、3次元空間における中央部(すなわち、x座標が0)の領域のチャンネル群とを、当該出力チャンネルに割り当てる副チャンネルとして決定する、といった具合である。   For example, when the channel FL (front left side) and the channel FR (front right side) shown in FIG. 5 are determined as main channels, the sub-channel determination unit 208 sets 3 as the output channel having FL as the main channel. A channel group in the region on the left side (in the negative x-axis direction shown in FIG. 5) in the three-dimensional space and a channel group in the central region (that is, the x coordinate is 0) in the three-dimensional space are assigned to the output channel. The output channel determined as a channel and having FR as the main channel includes a group of channels on the right side in the three-dimensional space (the x-axis positive direction side in FIG. 5) and the central portion in the three-dimensional space (ie, the x coordinate) Is determined as a sub-channel to be assigned to the output channel.

なお、上記例における、上記中央部の領域のチャンネル群のように、その音声出力位置が、複数のスピーカの位置の中間位置となり得るチャンネルは、複数のグループに属し得る。このようなチャンネルの音声は、双方スピーカから出力することが好ましい場合があるからである。   Note that, like the channel group in the central area in the above example, channels whose audio output positions can be intermediate positions of the positions of a plurality of speakers can belong to a plurality of groups. This is because it may be preferable to output the sound of such a channel from both speakers.

また、上記定義付けにおいて、全てのチャンネルが必ずしもいずれかのグループに属している必要はなく、いずれのグループにも属さないチャンネル(すなわち、いずれのスピーカからもその音声が出力されないチャンネル)が存在してもよい。スピーカの配置によっては、そのチャンネルの音声を出力しないほうが、自然なサラウンド効果を得られる場合があるからである。   Also, in the above definition, not all channels need to belong to any group, and there are channels that do not belong to any group (that is, channels whose sound is not output from any speaker). May be. This is because, depending on the arrangement of the speakers, it may be possible to obtain a natural surround effect without outputting the sound of that channel.

(出力音声信号生成部210)
出力音声信号生成部210は、出力チャンネル毎に、当該出力チャンネルに割り当てた主チャンネル(すなわち、主チャンネル決定部204によって決定された主チャンネル)の音声信号と、当該出力チャンネルに割り当てた副チャンネル(すなわち、副チャンネル決定部208によって決定された副チャンネル)の音声信号とを用いて、当該出力チャンネルを介して出力する出力音声信号を生成する。
(Output audio signal generator 210)
For each output channel, the output audio signal generation unit 210 outputs the audio signal of the main channel assigned to the output channel (that is, the main channel determined by the main channel determination unit 204) and the sub-channel assigned to the output channel ( That is, an output audio signal to be output through the output channel is generated using the audio signal of the subchannel determined by the subchannel determination unit 208.

例えば、出力音声信号生成部210は、出力チャンネル毎に、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの信号とをダウンミックスすることにより、出力音声信号を生成する。   For example, for each output channel, the output audio signal generation unit 210 down-mixes the audio signal of the main channel assigned to the output channel and the signal of the sub channel assigned to the output channel, thereby converting the output audio signal. Generate.

特に、出力音声信号生成部210は、出力チャンネル毎に、当該出力チャンネルに割り当てた副チャンネルの音声信号が表す音声が、該副チャンネルに対応する音声出力位置に定位するように、当該出力チャンネルに割り当てた副チャンネルの音声信号の周波数特性を、頭部伝達関数を用いて補正した後、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの信号とをダウンミックスすることにより、出力音声信号を生成することも可能である。   In particular, for each output channel, the output audio signal generation unit 210 sets the output channel so that the audio represented by the audio signal of the sub channel assigned to the output channel is localized at the audio output position corresponding to the sub channel. After correcting the frequency characteristics of the assigned sub-channel audio signal using the head-related transfer function, the main channel audio signal assigned to the output channel and the sub-channel signal assigned to the output channel are downmixed. By doing so, it is also possible to generate an output audio signal.

(音声信号出力部212)
音声信号出力部212は、出力音声信号生成部210によって生成された、各チャンネルの出力音声信号を、音声出力回路108へ出力する。
(Audio signal output unit 212)
The audio signal output unit 212 outputs the output audio signal of each channel generated by the output audio signal generation unit 210 to the audio output circuit 108.

(音声制御処理の手順)
次に、図3を参照して、音声制御回路120による音声制御処理の手順について説明する。図3は、実施形態に係る音声制御回路120による音声制御処理の手順を示すフローチャートである。
(Voice control processing procedure)
Next, with reference to FIG. 3, the procedure of the voice control process by the voice control circuit 120 will be described. FIG. 3 is a flowchart illustrating the procedure of the voice control process by the voice control circuit 120 according to the embodiment.

以下では、テレビジョン受像機100において、すでに複数の外部スピーカ150が接続されている出力チャンネルが、音声制御回路120によって認識されているものとして、当該音声制御回路120による音声制御処理を説明する。   Hereinafter, in the television receiver 100, the audio control process by the audio control circuit 120 will be described on the assumption that the output channel to which the plurality of external speakers 150 are already connected is recognized by the audio control circuit 120.

まず、検出部202が、利用可能な出力チャンネル毎に、当該出力チャンネルに接続されている外部スピーカ150の位置を検出する(ステップS302)。   First, the detection unit 202 detects the position of the external speaker 150 connected to the output channel for each available output channel (step S302).

次に、主チャンネル決定部204が、上記出力チャンネル毎に、ステップS302で検出された外部スピーカ150の位置と、ベクトルデータベースにおいて定義されている、複数のチャンネルの各々の音声出力位置とに基づいて、上記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する(ステップS304)。   Next, the main channel determination unit 204 determines, for each output channel, the position of the external speaker 150 detected in step S302 and the audio output positions of each of the plurality of channels defined in the vector database. The main channel to be assigned to the output channel is determined from the plurality of channels (step S304).

次に、副チャンネル決定部208が、上記出力チャンネル毎に、ステップS304で主チャンネルが決定されたことに応じて、当該出力チャンネルに割り当てる副チャンネルを決定する(ステップS306)。   Next, in response to the determination of the main channel in step S304 for each output channel, the subchannel determination unit 208 determines a subchannel to be assigned to the output channel (step S306).

その後、入力音声信号が音声制御回路120に入力されると(ステップS308)、出力音声信号生成部210は、出力チャンネル毎に、ステップS304で割り当てた主チャンネルの音声信号と、ステップS306で割り当てた副チャンネルの音声信号とを用いて、出力音声信号を生成する(ステップS310)。   Thereafter, when the input sound signal is input to the sound control circuit 120 (step S308), the output sound signal generation unit 210 assigns the sound signal of the main channel assigned in step S304 and the sound signal assigned in step S306 for each output channel. An output audio signal is generated using the sub-channel audio signal (step S310).

そして、音声信号出力部212が、ステップS310で生成された各出力音声信号を、音声出力回路108へ出力して(ステップS312)、音声制御回路120は、音声制御処理を終了する。   Then, the audio signal output unit 212 outputs each output audio signal generated in step S310 to the audio output circuit 108 (step S312), and the audio control circuit 120 ends the audio control process.

なお、テレビジョン受像機100は、ステップS304で割り当てた主チャンネルを特定するための情報、およびステップS306で割り当てた副チャンネルを特定するための情報を、当該テレビジョン受像機100が備えるメモリ等に記憶させておいてもよい。これにより、次回以降の音声制御処理において、ステップS302〜S306の処理を省略することができる。そして、テレビジョン受像機100は、スピーカの構成が変更された場合、ステップS302〜S306の処理を行うことで、主チャンネルおよび副チャンネルを改めて決定するとよい。   The television receiver 100 stores the information for specifying the main channel assigned in step S304 and the information for specifying the subchannel assigned in step S306 in a memory or the like included in the television receiver 100. It may be memorized. Thereby, the process of step S302-S306 can be abbreviate | omitted in the audio | voice control process after the next time. Then, when the configuration of the speaker is changed, the television receiver 100 may determine the main channel and the sub channel anew by performing the processes of steps S302 to S306.

(ベクトルデータベースおよび頭部伝達関数の一例)
ここで、図4および図5を参照してベクトルデータベースの一例について説明する。図4は、記憶部200に記憶されているベクトルデータベースの一例を示す。図5は、図4に示すベクトルデータベースに定義されている各音声出力位置を示す模式図である。
(Example of vector database and head-related transfer function)
Here, an example of the vector database will be described with reference to FIG. 4 and FIG. FIG. 4 shows an example of a vector database stored in the storage unit 200. FIG. 5 is a schematic diagram showing each audio output position defined in the vector database shown in FIG.

図4に示す例では、ベクトルデータベースには、22.2チャンネルの各々の音声出力位置が定義されている。この22.2チャンネルの音響システムは、3次元空間における3つのチャンネル層(上層9チャンネル、中層10チャンネル、下層3チャンネル)を含んでおり、さらに、LFE(Low Frequency Effects:低域効果)用の2つのチャンネルを含んで構成されている。これに応じて、ベクトルデータベースには、24個の音声出力位置が定義されている。   In the example shown in FIG. 4, the audio output positions of 22.2 channels are defined in the vector database. This 22.2 channel acoustic system includes three channel layers (upper layer 9 channels, middle layer 10 channels, lower layer 3 channels) in a three-dimensional space, and for LFE (Low Frequency Effects). It is configured to include two channels. Accordingly, 24 voice output positions are defined in the vector database.

ベクトルデータベースにおいて、各音声出力位置に対しては、その位置に応じた識別子の組み合わせからなる名称が付与されている。具体的には、上記識別子として、「L」,「R」,「Tp」,「Bt」,「Si」,「B」,「F」,「C」が用いられており、順に、左側,右側,上側,下側,側部,後側,前側,中央を意味する。本実施形態では、チャンネルの名称とその音声出力位置の名称とを同名としている。例えば、フロント右上部のチャンネルおよびその音声出力位置には、「TpFR」という名称が付与されている。   In the vector database, each voice output position is given a name composed of a combination of identifiers corresponding to the position. Specifically, “L”, “R”, “Tp”, “Bt”, “Si”, “B”, “F”, “C” are used as the identifiers, It means right side, upper side, lower side, side, rear side, front side, and center. In this embodiment, the name of the channel and the name of the audio output position are the same. For example, the name “TpFR” is assigned to the channel in the upper right part of the front and its audio output position.

また、ベクトルデータベースにおいて、各音声出力位置は、空間座標によって定義されている。また、各音声出力位置は、原点(0,0,0)からのベクトルで表すこともできる。この例では、ディスプレイ106における表示面の中心位置(音声出力位置FC)が、原点に設定されている。例えば、音声出力位置BLは、ベクトルVFC−BLと表すことができる。また、音声出力位置BRは、ベクトルVFC−BRと表すことができる。 In the vector database, each audio output position is defined by spatial coordinates. Each audio output position can also be represented by a vector from the origin (0, 0, 0). In this example, the center position (audio output position FC) of the display surface of the display 106 is set as the origin. For example, the audio output position BL can be expressed as a vector V FC-BL . The audio output position BR can be expressed as a vector V FC-BR .

(主チャンネルおよび副チャンネルの決定方法の一例)
主チャンネル決定部204は、このベクトルデータベースに基づいて、出力チャンネル毎に、主チャンネルを決定する。例えば、テレビジョン受像機100が備える出力チャンネルAにスピーカAが接続され、出力チャンネルBにスピーカBが接続されているとする。ここで、スピーカAは、音声出力位置FLの近傍にある位置spAに配置され、スピーカBは、音声出力位置FRの近傍にある位置spBに配置されているとする。
(Example of main channel and sub-channel determination method)
The main channel determination unit 204 determines a main channel for each output channel based on this vector database. For example, it is assumed that the speaker A is connected to the output channel A included in the television receiver 100 and the speaker B is connected to the output channel B. Here, it is assumed that the speaker A is disposed at a position spA near the sound output position FL, and the speaker B is disposed at a position spB near the sound output position FR.

この場合、主チャンネル決定部204は、スピーカAの位置spAに対応するベクトルVSPAの方向と、音声出力位置FLに対応するベクトルVFLの方向とが、互いに近似することから、音声出力位置FL(フロント左側)が設定されているチャンネルFLを、出力チャンネルAに割り当てる主チャンネルとして決定する。 In this case, the main channel determination unit 204 approximates the direction of the vector V SPA corresponding to the position spA of the speaker A and the direction of the vector V FL corresponding to the audio output position FL, so that the audio output position FL The channel FL in which (front left side) is set is determined as the main channel assigned to the output channel A.

また、主チャンネル決定部204は、スピーカBの位置spBに対応するベクトルVSPBの方向と、音声出力位置FRに対応するベクトルVFRの方向とが、互いに類似することから、音声出力位置FR(フロント右側)が設定されているチャンネルFRを、出力チャンネルBに割り当てる主チャンネルとして決定する。 In addition, the main channel determination unit 204 is similar to the direction of the vector V SPB corresponding to the position spB of the speaker B and the direction of the vector V FR corresponding to the audio output position FR, so that the audio output position FR ( The channel FR in which the front right side) is set is determined as the main channel assigned to the output channel B.

そして、副チャンネル決定部204は、チャンネルFLに予め対応付けられているチャンネル(例えば、3次元空間における左側(x軸負方向側)の領域のチャンネル、および、3次元空間における中央部の領域のチャンネル)を、出力チャンネルAに割り当てる副チャンネルとして決定する。   Then, the sub-channel determination unit 204 preliminarily associates the channel with the channel FL (for example, the channel in the left side (x-axis negative direction side) in the three-dimensional space and the central region in the three-dimensional space. Channel) is determined as a sub-channel to be assigned to output channel A.

また、副チャンネル決定部204は、チャンネルFRに予め対応付けられているチャンネル(例えば、3次元空間における右側(x軸正方向側)の領域のチャンネル、および、3次元空間における中央部の領域のチャンネル)を、出力チャンネルBに割り当てる副チャンネルとして決定する。   Further, the sub-channel determination unit 204 preliminarily associates the channel FR with the channel (for example, the channel in the right side (x-axis positive direction side) in the three-dimensional space and the central region in the three-dimensional space. Channel) is determined as a sub-channel to be assigned to the output channel B.

そして、出力音声信号生成部210は、出力チャンネルAに割り当てた主チャンネル(チャンネルFL)の音声信号と、出力チャンネルAに割り当てた副チャンネルの音声信号とをダウンミックスすることにより、出力チャンネルAの出力音声信号を生成する。   Then, the output audio signal generation unit 210 downmixes the audio signal of the main channel (channel FL) assigned to the output channel A and the audio signal of the subchannel assigned to the output channel A, so that the output channel A An output audio signal is generated.

同様に、出力音声信号生成部210は、出力チャンネルBに割り当てた主チャンネル(チャンネルFR)の音声信号と、出力チャンネルBに割り当てた副チャンネルの音声信号とをダウンミックスすることにより、出力チャンネルBの出力音声信号を生成する。   Similarly, the output audio signal generation unit 210 downmixes the audio signal of the main channel (channel FR) assigned to the output channel B and the audio signal of the sub-channel assigned to the output channel B, so that the output channel B The output audio signal is generated.

(出力音声信号の生成方法の一例)
上記のように、複数のチャンネルの各々について主チャンネルおよび副チャンネルが決定されると、音声信号生成部210は、出力チャンネル毎に、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの音声信号とをダウンミックスすることにより、当該出力チャンネルを介して出力する出力音声信号を生成することが可能となる。
(Example of output audio signal generation method)
As described above, when the main channel and the sub channel are determined for each of the plurality of channels, the audio signal generation unit 210, for each output channel, the audio signal of the main channel assigned to the output channel, and the output channel By downmixing the audio signal of the sub-channel assigned to the output channel, it is possible to generate an output audio signal that is output via the output channel.

例えば、上記出力チャンネルAについて、主チャンネルであるチャンネルFLの音声信号をSFLとし、3次元空間の左側の領域に音声出力位置が配置されている副チャンネルであるチャンネルTpFL,TpBL,・・・の音声信号をSTpFL,STpBL,・・・とし、3次元空間の中央部の領域に音声出力位置が配置されている副チャンネルであるチャンネルFC,BC,・・・の音声信号をSFC,SBC,・・・とした場合、出力音声信号生成部210は、以下の数式(数1)を用いて、これらの音声信号をダウンミックスすることにより、当該出力チャンネルAの出力音声信号SFL’’を生成することができる。 For example, for the output channels A, the audio signal of the channel FL is the main channel and S FL, 3-dimensional channel audio output position on the left side of the region is sub-channels that are arranged in space TpFL, TpBL, ··· the audio signal S TpFL, S TpBL, and ..., channel FC audio output position is subchannels is arranged in the region of the central portion of the three-dimensional space, BC, an audio signal ... S FC , S BC ,..., The output audio signal generation unit 210 downmixes these audio signals using the following formula (Equation 1), thereby outputting the output audio signal S of the output channel A. FL '' can be generated.

FL’’=a×(SFL+1/√2STpFL+1/√2STpBL+・・・+1/√2SFC+1/√2SBC+・・・) ・・・(数1)
同様に、上記出力チャンネルBについて、主チャンネルであるチャンネルFRの音声信号をSFRとし、3次元空間の右側の領域に音声出力位置が配置されている副チャンネルであるチャンネルTpFR,TpBR,・・・の音声信号をSTpFR,STpBR,・・・とし、3次元空間の中央部の領域に音声出力位置が配置されている副チャンネルであるチャンネルFC,BC,・・・の音声信号をSFC,SBC,・・・とした場合、出力音声信号生成部210は、以下の数式(数2)を用いて、これらの音声信号をダウンミックスすることにより、当該出力チャンネルBの出力音声信号SFR’’を生成することができる。
S FL ″ = a × (S FL + 1 / √2S TpFL + 1 / √2S TpBL +... + 1 / √2S FC + 1 / √2S BC +...) (Equation 1)
Similarly, for the output channel B, and audio signals of the channels FR is the main channel and S FR, channel TpFR by-channel audio output located on the right side of the region of the three-dimensional space is arranged, TPBR, · · .. , S TpFR , S TpBR ,..., And the audio signals of channels FC, BC,..., Which are sub-channels whose audio output positions are arranged in the central region of the three-dimensional space. In the case of FC , S BC ,..., The output audio signal generation unit 210 downmixes these audio signals using the following formula (Equation 2), thereby outputting the output audio signal of the output channel B. S FR ″ can be generated.

FR’’=a×(SFR+1/√2STpFR+1/√2STpBR+・・・+1/√2SFC+1/√2SBC+・・・) ・・・(数2)
但し、上記数式(数1)および(数2)において、aは、オーバーフロー(SFL’’およびSFR’’が1以上となること)を低減するための係数であり、例えば、0〜1の範囲内の値が用いられる。なお、オーバーフローの低減は、各ダウンミックス係数を調整することによって実現されてもよい。
S FR ″ = a × (S FR + 1 / √2S TpFR + 1 / √2S TpBR +... + 1 / √2S FC + 1 / √2S BC +...) (Equation 2)
However, in the above formulas (Equation 1) and (Equation 2), a is a coefficient for reducing overflow (S FL ″ and S FR ″ become 1 or more), for example, 0 to 1 A value within the range is used. The overflow reduction may be realized by adjusting each downmix coefficient.

音声信号生成部210によって生成された、出力チャンネルAの出力音声信号SFL’’および出力チャンネルBの出力音声信号SFR’’は、音声信号出力部212によって、音声出力回路108へ出力される。これにより、出力チャンネルAに接続されたスピーカAから、出力音声信号SFL’’に応じた音声(すなわち、出力チャンネルAに割り当てた各チャンネルの音声)が出力されるとともに、出力チャンネルBに接続されたスピーカBから、出力音声信号SFR’’に応じた音声(すなわち、出力チャンネルBに割り当てた各チャンネルの音声)が出力される。 The output audio signal S FL ″ of the output channel A and the output audio signal S FR ″ of the output channel B generated by the audio signal generation unit 210 are output to the audio output circuit 108 by the audio signal output unit 212. . As a result, audio corresponding to the output audio signal S FL ″ (that is, audio of each channel assigned to the output channel A) is output from the speaker A connected to the output channel A and connected to the output channel B. The sound corresponding to the output sound signal S FR ″ (that is, the sound of each channel assigned to the output channel B) is output from the speaker B.

なお、上記例では、副チャンネルに適用するダウンミックス係数として1/√2を用いているが、これに限らない。例えば、上記ダウンミックス係数として、従来のマルチチャンネル音響システムにおいてよく利用されているダウンミックス係数(1/2、1/2√2等)を用いてもよい。また、副チャンネルの音声出力位置が、主チャンネルの音声出力位置から離れているほど(ベクトル方向の角度差が大きいほど)、その副チャンネルの音声信号の出力が弱まるように、その副チャンネルに適用するダウンミックス係数を低めてもよい。また、上記例では、主チャンネルの音声信号にはダウンミックス係数を乗じていないが、主チャンネルの音声信号にダウンミックス係数を乗じてもよい。また、各副チャンネルの音声信号に対し、主チャンネルとの水平方向の位置関係に応じたダウンミックス係数と、主チャンネルとの垂直方向の位置関係に応じたダウンミックス係数とを、それぞれ乗じるようにしてもよい。   In the above example, 1 / √2 is used as the downmix coefficient applied to the sub-channel, but the present invention is not limited to this. For example, as the downmix coefficient, a downmix coefficient (1/2, 1 / 2√2, etc.) often used in a conventional multi-channel sound system may be used. Also, it is applied to the sub channel so that the audio output position of the sub channel becomes weaker as the audio output position of the sub channel is farther from the audio output position of the main channel (the greater the angle difference in the vector direction). The downmix coefficient to be performed may be lowered. In the above example, the audio signal of the main channel is not multiplied by the downmix coefficient, but the audio signal of the main channel may be multiplied by the downmix coefficient. In addition, the audio signal of each sub-channel is multiplied by a downmix coefficient corresponding to the horizontal positional relationship with the main channel and a downmix coefficient corresponding to the vertical positional relationship with the main channel. May be.

(効果)
このように、本実施形態のテレビジョン受像機100は、利用可能な出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの3次元空間における垂直方向の位置を考慮し、当該出力チャンネルに割り当てる主チャンネルを決定し、当該主チャンネルの音声を主音声としてダウンミックスすることにより、出力音声信号を生成する。
(effect)
As described above, the television receiver 100 according to the present embodiment considers the position of the speaker connected to the output channel in the three-dimensional space in the three-dimensional space for each available output channel, and assigns the main channel to the output channel. An output audio signal is generated by determining a channel and downmixing the audio of the main channel as the main audio.

これにより、本実施形態のテレビジョン受像機100によれば、スピーカの水平方向および垂直方向の双方の位置に応じて音響効果を制御することができるため、3次元空間において適切な位置(水平方向および垂直方向の双方の適切な位置)にスピーカが配置されていない場合であっても、良好なサラウンド効果を得ることができる。   As a result, according to the television receiver 100 of the present embodiment, the acoustic effect can be controlled according to the position of both the horizontal direction and the vertical direction of the speaker. Even if the speaker is not disposed at an appropriate position in both the vertical direction and the vertical direction, a good surround effect can be obtained.

(頭部伝達関数を用いた処理の一例)
上記例では、頭部伝達関数を用いた処理(音像定位処理)を行わずに、出力音声信号を生成する例を説明したが、出力音声信号生成部210は、頭部伝達関数を用いた処理(音像定位処理)を行い、出力音声信号を生成することもできる。以下、図6および図7を参照して、出力音声信号生成部210による頭部伝達関数を用いた処理の一例について説明する。
(Example of processing using head-related transfer functions)
In the above example, the example in which the output sound signal is generated without performing the process using the head-related transfer function (sound image localization process) has been described. However, the output sound signal generation unit 210 performs the process using the head-related transfer function. (Sound image localization processing) can be performed to generate an output audio signal. Hereinafter, an example of processing using the head-related transfer function by the output audio signal generation unit 210 will be described with reference to FIGS. 6 and 7.

図6は、記憶部200に記憶されている頭部伝達関数の一例を示す。図6では、一例として、記憶部200に記憶されている頭部伝達関数のうち、3次元空間における水平方向(前後方向および左右方向)の頭部伝達関数を示す。実際には、記憶部200には、3次元空間における垂直方向(上下方向)の頭部伝達関数も記憶されている。   FIG. 6 shows an example of the head-related transfer function stored in the storage unit 200. FIG. 6 shows, as an example, a head-related transfer function in the horizontal direction (front-rear direction and left-right direction) in the three-dimensional space among the head-related transfer functions stored in the storage unit 200. Actually, the storage unit 200 also stores a head-related transfer function in the vertical direction (vertical direction) in the three-dimensional space.

図7は、図4に示すベクトルデータベースに定義されている各音声出力位置の基準位置からの方向を示す。図7では、視聴者の位置(図5に示す立方体形状の3次元空間の中心C)を基準位置(原点(0,0,0))とする、各音声出力位置および各音声出力位置の基準位置からの方向が示されている。各音声出力位置は空間座標で表されており、各音声出力位置の基準位置からの方向は、基準位置からの方位角と仰角とによって表されている。ここで、上記原点から見て、z軸負方向(前方向)の仰角θelを0°、y軸正方向(上方向)の仰角θelを90°とする。また、上記原点から見て、z軸負方向(前方向)の方位角θazを0°、x軸正方向(右方向)の方位角θazを90°、z軸正方向(後方向)の方位角θazを180°、x軸負方向(左方向)の方位角θazを270°とする。 FIG. 7 shows the direction from the reference position of each audio output position defined in the vector database shown in FIG. In FIG. 7, each audio output position and the reference of each audio output position with the viewer position (center C of the cubic three-dimensional space shown in FIG. 5) as the reference position (origin (0, 0, 0)). The direction from the position is shown. Each audio output position is represented by spatial coordinates, and the direction of each audio output position from the reference position is represented by an azimuth angle and an elevation angle from the reference position. Here, as viewed from the origin, 0 ° elevation theta el of z-axis negative direction (forward direction), the elevation angle theta el of y-axis positive direction (upward direction) to 90 °. Further, when viewed from the origin, 0 ° azimuth angle theta az in the z-axis negative direction (front direction), 90 ° azimuth angle theta az of x-axis positive direction (the right direction), the z-axis positive direction (rear direction) 180 ° azimuth angle theta az of the azimuth angle theta az of x-axis negative direction (leftward) and 270 °.

出力音声信号生成部210は、各副チャンネルの音声を予め定められた音声出力位置から聞こえるようにするために、頭部伝達関数を用いて各副チャンネルの音声信号の周波数特性を補正することにより、各副チャンネルの音声を、当該副チャンネルに音声出力位置に定位させることができる。   The output audio signal generation unit 210 corrects the frequency characteristics of the audio signal of each subchannel using the head-related transfer function so that the audio of each subchannel can be heard from a predetermined audio output position. The sound of each subchannel can be localized at the sound output position of the subchannel.

特に、出力音声信号生成部210は、各副チャンネルの音声を、3次元空間における音声出力位置から聞こえるようにするために、水平方向の頭部伝達関数と垂直方向の頭部伝達関数とを用いて、各副チャンネルの音声信号の周波数特性を補正することにより、各副チャンネルの音声を、当該副チャンネルに対応する音声出力位置に定位させることができる。   In particular, the output audio signal generation unit 210 uses a horizontal head-related transfer function and a vertical head-related transfer function so that the audio of each subchannel can be heard from the audio output position in the three-dimensional space. Thus, by correcting the frequency characteristics of the audio signal of each sub-channel, the audio of each sub-channel can be localized at the audio output position corresponding to the sub-channel.

例えば、音声信号生成部210は、ある出力チャンネルの出力音声信号を生成する際、当該出力チャンネルに対応する副チャンネル毎に、以下の処理(2−1)〜(2−7)を行うことにより、当該副チャンネルの音声信号の周波数特性を補正する。そして、音声信号生成部210は、当該副チャンネルの補正後の音声信号を用いて、当該出力チャンネルの出力音声信号を生成する。   For example, when the audio signal generation unit 210 generates an output audio signal of a certain output channel, the audio signal generation unit 210 performs the following processes (2-1) to (2-7) for each sub-channel corresponding to the output channel. The frequency characteristic of the audio signal of the subchannel is corrected. Then, the audio signal generation unit 210 generates an output audio signal of the output channel using the corrected audio signal of the subchannel.

(2−1)基準位置(視聴者の位置)からの、当該副チャンネルの仮想的な音源(音声出力位置)の水平方向(方位角)に対応付けられている周波数特性を、記憶部200に記憶されている水平方向の頭部伝達関数から得る。   (2-1) The frequency characteristic associated with the horizontal direction (azimuth angle) of the virtual sound source (audio output position) of the subchannel from the reference position (viewer position) is stored in the storage unit 200. Obtained from the stored horizontal head-related transfer function.

(2−2)基準位置(視聴者の位置)からの、当該副チャンネルの仮想的な音源(音声出力位置)の垂直方向(仰角)に対応付けられている周波数特性を、記憶部200に記憶されている垂直方向の頭部伝達関数から得る。   (2-2) The frequency characteristic associated with the vertical direction (elevation angle) of the virtual sound source (audio output position) of the sub-channel from the reference position (viewer position) is stored in the storage unit 200. Obtained from the vertical head-related transfer function.

(2−3)基準位置(視聴者の位置)からの、実際に音声が出力される位置(主チャンネルの音声出力位置)の水平方向(方位角)に対応付けられている周波数特性を、記憶部200に記憶されている水平方向の頭部伝達関数から得る。   (2-3) Stores frequency characteristics associated with the horizontal direction (azimuth angle) of the position (audio output position of the main channel) where audio is actually output from the reference position (viewer position). Obtained from the horizontal head-related transfer function stored in unit 200.

(2−4)基準位置(視聴者の位置)からの、実際に音声が出力される位置(主チャンネルの音声出力位置)の垂直方向(仰角)に対応付けられている周波数特性を、記憶部200に記憶されている垂直方向の頭部伝達関数から得る。   (2-4) The frequency characteristics associated with the vertical direction (elevation angle) of the position (audio output position of the main channel) where the sound is actually output from the reference position (viewer position) It is obtained from the vertical head related transfer function stored in 200.

(2−5)上記(2−1)で得られた周波数特性と上記(2−2)で得られた周波数特性との差分(水平方向についての周波数特性の差分)を求める。   (2-5) The difference (frequency characteristic difference in the horizontal direction) between the frequency characteristic obtained in (2-1) and the frequency characteristic obtained in (2-2) is obtained.

(2−6)上記(2−3)で得られた周波数特性と上記(2−4)で得られた周波数特性との差分(垂直方向についての周波数特性の差分)を求める。   (2-6) A difference (frequency characteristic difference in the vertical direction) between the frequency characteristic obtained in the above (2-3) and the frequency characteristic obtained in the above (2-4) is obtained.

(2−7)上記(2−5)で得られた差分、および、上記(2−6)で得られた差分を用いて当該副チャンネルの音声信号の周波数特性を補正する。   (2-7) The frequency characteristic of the audio signal of the subchannel is corrected using the difference obtained in (2-5) above and the difference obtained in (2-6) above.

例えば、主チャンネルがFLであり、副チャンネルがTpFLの場合、音声信号生成部210は、方位角θazについての、周波数特性faz(315°)と、faz(315°)との差分(このような同値の差分は1とする。)を求め、仰角θelについての、周波数特性fel(0°)とfel(45°)との差分を求める。そして、音声信号生成部210は、求められた差分{faz(315°)−faz(315°)}および{fel(0°)−fel(45°)}を、副チャンネルTpFLの音声信号に乗じる。これにより、副チャンネルTpFLの音声は、音声出力位置TpFLに定位される。すなわち、副チャンネルTpFLの音声は、あたかも音声出力位置TpFLから聞こえてくるかの如く、音声出力位置FLから出力される。 For example, when the main channel is FL and the sub-channel is TpFL, the audio signal generation unit 210 determines the difference between the frequency characteristics f az (315 °) and f az (315 °) for the azimuth angle θ az ( Such a difference of the same value is set to 1.) and the difference between the frequency characteristics f el (0 °) and f el (45 °) with respect to the elevation angle θ el is obtained. Then, the audio signal generation unit 210 uses the obtained differences {f az (315 °) −f az (315 °)} and {f el (0 °) −f el (45 °)} for the subchannel TpFL. Multiply the audio signal. Thereby, the sound of the subchannel TpFL is localized at the sound output position TpFL. That is, the sound of the subchannel TpFL is output from the sound output position FL as if it is heard from the sound output position TpFL.

以下、副チャンネルの音声信号の補正処理を含んだ、出力音声信号の生成処理に用いる、数式の一例を説明する。   Hereinafter, an example of a mathematical expression used for output audio signal generation processing including subchannel audio signal correction processing will be described.

例えば、上記出力チャンネルBについて、主チャンネルであるチャンネルFRの音声信号をSFRとし、3次元空間の右側の領域に音声出力位置が配置されている副チャンネルであるチャンネルTpFR,TpBR,・・・の音声信号をSTpFR,STpBR,・・・とした場合、出力音声信号生成部210は、以下の数式(数3)を用いて、上記各副チャンネルの音声信号の補正処理を行うとともに、上記各音声信号をダウンミックスすることにより、当該出力チャンネルBの出力音声信号SFR’を生成することができる。 For example, for the output channel B, and audio signals of the channels FR is the main channel and S FR, 3-dimensional channel audio output located on the right side of the region is sub-channels that are arranged in space TpFR, TpBR, ··· the audio signal S TpFR, S TpBR, when a., the output audio signal generation unit 210, using the following equation (equation 3), performs correction processing of the audio signals of the respective sub-channel, By downmixing each of the audio signals, an output audio signal S FR ′ of the output channel B can be generated.

FR’=a×{SFR+1/√2{faz(45°)−faz(0°)}{fel(45°)−fel(45°)}STpFR+1/√2{faz(135°)−faz(0°)}{fel(45°)−fel(45°)}STpBR+・・・} ・・・(数3)
但し、上記数式(数3)において、aは、オーバーフロー(SFR’が1以上となること)を防止するための係数であり、例えば、0〜1の範囲内の値が用いられる。なお、オーバーフローの防止は、各ダウンミックス係数を調整することによって実現されてもよい。
S FR '= a × {S FR + 1 / √2 {f az (45 °) −f az (0 °)} {f el (45 °) −f el (45 °)} S TpFR + 1 / √2 { f az (135 °) −f az (0 °)} {f el (45 °) −f el (45 °)} S TpBR +...} ( Equation 3)
However, in the above mathematical formula (Equation 3), a is a coefficient for preventing overflow (S FR 'becomes 1 or more), and for example, a value in the range of 0 to 1 is used. In addition, prevention of overflow may be realized by adjusting each downmix coefficient.

(効果)
このように、本実施形態のテレビジョン受像機100は、利用可能な出力チャンネル毎に、当該出力チャンネルに対応する各副チャンネルの音声が予め定められた音声出力位置に定位するように、当該出力チャンネルに対応する各副チャンネルの音声信号の周波数特性を、頭部伝達関数を用いて補正する。
(effect)
As described above, the television receiver 100 according to the present embodiment outputs the output so that the sound of each sub-channel corresponding to the output channel is localized at a predetermined sound output position for each available output channel. The frequency characteristic of the audio signal of each subchannel corresponding to the channel is corrected using the head-related transfer function.

これにより、本実施形態のテレビジョン受像機100によれば、各副チャンネルの音声を、3次元空間における所定の音声出力位置に定位させることができる。すなわち、各副チャンネルの音声を、3次元空間における水平方向のみならず垂直方向についても、所定の音声出力位置に定位させることができる。これにより、視聴者に対し、各副チャンネルの音声を、上記所定の音声出力位置から聞こえてくるように感じさせることができる。このため、3次元空間において適切な位置にスピーカが配置されていない場合であっても、より良好かつ立体的なサラウンド効果を得ることができる。   Thereby, according to the television receiver 100 of this embodiment, the sound of each subchannel can be localized at a predetermined sound output position in the three-dimensional space. That is, the sound of each subchannel can be localized at a predetermined sound output position not only in the horizontal direction but also in the vertical direction in the three-dimensional space. Thereby, it is possible to make the viewer feel that the audio of each sub-channel is heard from the predetermined audio output position. For this reason, even if the speaker is not disposed at an appropriate position in the three-dimensional space, a better and three-dimensional surround effect can be obtained.

(プログラム、記憶媒体)
実施形態で説明したテレビジョン受像機100の各機能は、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
(Program, storage medium)
Each function of the television receiver 100 described in the embodiment may be realized in hardware by a logic circuit formed on an integrated circuit (IC chip), or software using a CPU (Central Processing Unit). May be realized.

例えば、テレビジョン受像機100は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラム及び各種データを格納するメモリ等の各種記憶装置(記録媒体)を備えている。そして、上記CPUが、上記各種記憶装置に格納されているプログラムを読み出し、このプログラムを実行することによって、音声制御回路120の各機能を実現することができる。   For example, the television receiver 100 includes a CPU that executes instructions of a program that realizes each function, a ROM (Read Only Memory) that stores the program, a RAM (Random Access Memory) that develops the program, the program, and various programs. Various storage devices (recording media) such as a memory for storing data are provided. Then, the CPU reads out the programs stored in the various storage devices and executes the programs, whereby each function of the voice control circuit 120 can be realized.

上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類等を用いることができる。   Examples of the recording medium include tapes such as magnetic tapes and cassette tapes, magnetic disks such as floppy (registered trademark) disks / hard disks, and disks including optical disks such as CD-ROM / MO / MD / DVD / CD-R. IC cards (including memory cards) / optical cards, semiconductor memories such as mask ROM / EPROM / EEPROM (registered trademark) / flash ROM, PLD (Programmable logic device) and FPGA (Field Programmable Gate) Logic circuits such as (Array) can be used.

なお、上記プログラムは、通信ネットワークを介してテレビジョン受像機100に供給されてもよい。この通信ネットワークは、少なくとも上記プログラムをテレビジョン受像機100に伝送可能であればよく、その種類はどのようなものであっても良い。例えば、通信ネットワークとしては、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。   The program may be supplied to the television receiver 100 via a communication network. The communication network only needs to be able to transmit at least the program to the television receiver 100, and may be of any type. For example, the Internet, intranet, extranet, LAN, ISDN, VAN, CATV communication network, virtual private network, telephone line network, mobile communication network, satellite communication network, etc. can be used as the communication network. is there.

また、上記プログラムをテレビジョン受像機100に供給するための伝送媒体としても、どのような種類のものを利用しても良い。例えば、伝送媒体として、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線によるものを利用しても良い。また、伝送媒体として、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、IEEE80211無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA、携帯電話網、衛星回線、地上波デジタル網等の無線によるものを利用しても良い。   Also, any kind of transmission medium for supplying the program to the television receiver 100 may be used. For example, a wired medium such as IEEE1394, USB, power line carrier, cable TV line, telephone line, ADSL (Asymmetric Digital Subscriber Line) line may be used as the transmission medium. As transmission media, infrared rays such as IrDA and remote control, Bluetooth (registered trademark), IEEE80211 wireless, HDR (High Data Rate), NFC (Near Field Communication), DLNA, cellular phone network, satellite line, terrestrial digital network You may use the thing by radio | wireless.

(補足事項)
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、また、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
(Supplementary information)
The present invention is not limited to the above-described embodiments, and various modifications can be made within the scope of the claims, and the technical means disclosed in different embodiments can be appropriately combined. Embodiments are also included in the technical scope of the present invention.

(本発明の適用対象)
例えば、実施形態では、本発明をテレビジョン受像機に適用した例を説明したが、少なくとも実施形態で説明したような音声制御処理を行うことが可能なものであれば、これ以外の装置(例えば、チューナ装置、オーディオレコーダ/プレーヤ(音声再生装置)、オーディオアンプ、HDDレコーダ/プレーヤ、BDレコーダ/プレーヤ等)にも、本発明を適用することができる。
(Application object of the present invention)
For example, in the embodiment, the example in which the present invention is applied to a television receiver has been described. However, any device (for example, any device) can be used as long as the sound control process described in the embodiment can be performed. The present invention can also be applied to tuner devices, audio recorders / players (sound reproduction devices), audio amplifiers, HDD recorders / players, BD recorders / players, and the like.

また、実施形態では、本発明を22.2チャンネルの音響システムに適用した例を説明したが、これ以外のマルチチャンネル音響システム(5.1チャンネルの音響システム等)にも、本発明を適用することができる。   In the embodiment, the example in which the present invention is applied to a 22.2 channel sound system has been described. However, the present invention is also applied to other multi-channel sound systems (such as a 5.1 channel sound system). be able to.

(スピーカの位置の検出方法)
また、実施形態では、スピーカの位置を検出する方法として、位置検出用の音声による方法を採用しているが、これに限らない。例えば、スピーカの位置を検出する方法として、カメラから得られた画像、赤外線センサ、超音波センサ、レーザセンサ等による方法を採用してもよい。また、スピーカの位置を、ユーザに設定させる構成を採用してもよい。例えば、3次元空間のイメージ画像(例えば、図5に示す立法体のようなもの)をグラフィカルに表示し、このイメージ画像に対し、スピーカの位置をユーザに設定させるようにしてもよい。
(Speaker position detection method)
In the embodiment, as a method for detecting the position of the speaker, a method using sound for position detection is employed, but the method is not limited thereto. For example, as a method of detecting the position of the speaker, a method using an image obtained from a camera, an infrared sensor, an ultrasonic sensor, a laser sensor, or the like may be employed. Moreover, you may employ | adopt the structure which makes a user set the position of a speaker. For example, an image image in a three-dimensional space (for example, the legitimate body shown in FIG. 5) may be displayed graphically, and the position of the speaker may be set for the image image by the user.

(スピーカ)
実施形態では、外部スピーカ120を対象のスピーカとしたが、テレビジョン受像機100は、内蔵スピーカを備えていてもよく、この場合、内蔵スピーカを、実施形態で説明した外部スピーカ120と同様に扱ってもよい。すなわち、内蔵スピーカを含めて、マルチチャンネル音響システムを構築してもよい。
(Speaker)
In the embodiment, the external speaker 120 is the target speaker. However, the television receiver 100 may include a built-in speaker. In this case, the built-in speaker is handled in the same manner as the external speaker 120 described in the embodiment. May be. That is, a multi-channel sound system may be constructed including a built-in speaker.

(基準位置)
図5に示す立方体形状の3次元空間の中心C(図5参照)を基準位置(視聴者の位置)として、各音声出力位置を規定したが、これに限らず、例えば、実際の視聴者の位置を検出して、検出された位置を基準位置をとして、各音声出力位置を規定してもよい。
(Reference position)
Each voice output position is defined with the center C (see FIG. 5) of the cubic three-dimensional space shown in FIG. 5 as a reference position (viewer position). A position may be detected, and each sound output position may be defined using the detected position as a reference position.

本発明は、マルチチャンネル音響システムに組み込むことが可能な、テレビジョン受像機、チューナ装置、オーディオプレーヤー、オーディオアンプ、HDDレコーダ/プレーヤ、BDレコーダ/プレーヤ、パーソナルコンピュータ等の各種機器に適用することができる。   The present invention can be applied to various devices such as a television receiver, a tuner device, an audio player, an audio amplifier, an HDD recorder / player, a BD recorder / player, and a personal computer that can be incorporated into a multi-channel sound system. it can.

100 テレビジョン受像機
102 チューナユニット
104 ディスプレイ駆動回路
106 ディスプレイ
108 音声出力回路
110 外部機器インタフェース
112 通信インタフェース
120 音声制御回路(音声制御装置)
122 マイク
150 外部スピーカ
200 記憶部
202 検出部(検出手段)
204 主チャンネル決定部(主チャンネル決定手段)
208 副チャンネル決定部(副チャンネル決定手段)
210 出力音声信号生成部(出力音声信号生成手段)
212 音声信号出力部
DESCRIPTION OF SYMBOLS 100 Television receiver 102 Tuner unit 104 Display drive circuit 106 Display 108 Audio | voice output circuit 110 External apparatus interface 112 Communication interface 120 Audio | voice control circuit (audio | voice control apparatus)
122 Microphone 150 External speaker 200 Storage unit 202 Detection unit (detection means)
204 Main channel determination unit (main channel determination means)
208 Sub-channel determination unit (sub-channel determination means)
210 Output audio signal generator (output audio signal generator)
212 Audio signal output unit

Claims (12)

複数のチャンネルを含むマルチチャンネル音声信号であって、各チャンネルに対応する音声出力位置が予め定められたマルチチャンネル音声信号を、複数の出力チャンネルを介して出力する音声制御装置において、
前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの3次元空間における位置と、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの各々に対応する音声出力位置とに基づいて、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する主チャンネル決定手段と、
前記出力チャンネル毎に、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの中から、当該出力チャンネルに割り当てる副チャンネルを決定する副チャンネル決定手段と、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルの音声信号と、当該出力チャンネルに割り当てた前記副チャンネルの音声信号とを用いて、当該出力チャンネルを介して出力する出力音声信号を生成する出力音声信号生成手段と
を備え
前記マルチチャンネル音声信号に含まれている前記複数のチャンネルは、
予め領域毎にグループ化されており、
前記副チャンネル決定手段は、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルに対応する前記グループに含まれているチャンネルを、当該出力チャンネルに割り当てる副チャン
ネルとして決定する
ことを特徴とする音声制御装置。
In a multi-channel audio signal including a plurality of channels, wherein a multi-channel audio signal having a predetermined audio output position corresponding to each channel is output via a plurality of output channels,
For each of the output channels, and the position in the three-dimensional space of the speaker connected to the output channel, based on a sound output position corresponding to each of the plurality of channels contained in the multi-channel audio signal, the Main channel determining means for determining a main channel to be assigned to the output channel from the plurality of channels included in the multi-channel audio signal ;
Sub-channel determining means for determining, for each output channel, a sub-channel assigned to the output channel from among the plurality of channels included in the multi-channel audio signal ;
For each output channel, an output audio signal to be output via the output channel is generated using the audio signal of the main channel assigned to the output channel and the audio signal of the sub-channel assigned to the output channel. and an output audio signal generation means for,
The plurality of channels included in the multi-channel audio signal are:
It is grouped in advance by area,
The sub-channel determining means includes
For each output channel, a channel included in the group corresponding to the main channel assigned to the output channel is assigned to a sub-channel assigned to the output channel.
A voice control device characterized by being determined as a channel .
前記出力音声信号生成手段は、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの音声信号とをダウンミックスすることにより、当該出力チャンネルを介して出力する出力音声信号を生成する
ことを特徴とする請求項1に記載の音声制御装置。
The output audio signal generating means is
For each output channel, by downmixing the audio signal of the main channel assigned to the output channel and the audio signal of the subchannel assigned to the output channel, an output audio signal output via the output channel is obtained. The voice control device according to claim 1, wherein the voice control device is generated.
前記出力音声信号生成手段は、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた副チャンネルの音声信号が表す音声が、該副チャンネルに対応する音声出力位置に定位するように、当該出力チャンネルに割り当てた副チャンネルの音声信号の周波数特性を、頭部伝達関数を用いて補正した後、当該出力チャンネルに割り当てた主チャンネルの音声信号と、当該出力チャンネルに割り当てた副チャンネルの信号とをダウンミックスすることにより、当該出力チャンネルを介して出力する出力音声信号を生成する
ことを特徴とする請求項2に記載の音声制御装置。
The output audio signal generating means is
For each output channel, the frequency of the audio signal of the subchannel assigned to the output channel so that the sound represented by the audio signal of the subchannel assigned to the output channel is localized at the audio output position corresponding to the subchannel. After correcting the characteristics using the head-related transfer function, the audio signal of the main channel assigned to the output channel and the signal of the sub-channel assigned to the output channel are downmixed, so that The voice control apparatus according to claim 2, wherein an output voice signal to be output is generated.
前記出力音声信号生成手段は、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた副チャンネルの音声信号を、前記3次元空間における水平方向の頭部伝達関数と、前記3次元空間における垂直方向の頭部伝達関数とを用いて補正する
ことを特徴とする請求項3に記載の音声制御装置。
The output audio signal generating means is
For each output channel, the audio signal of the subchannel assigned to the output channel is corrected using the horizontal head related transfer function in the three-dimensional space and the vertical head related transfer function in the three-dimensional space. The voice control device according to claim 3.
前記主チャンネル決定手段は、
前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの位置の、基準位置からの方向である第1の方向と、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの各々の前記音声出力位置の、前記基準位置からの方向である第2の方向とに基づいて、前記第2の方向が前記第1の方向に最も近似する前記マルチチャンネル音声信号に含まれているチャンネルを、当該出力チャンネルに割り当てる主チャンネルとして決定する
ことを特徴とする請求項1から4のいずれか一項に記載の音声制御装置。
The main channel determining means includes
For each of the output channels, a first direction which is a direction from a reference position of a speaker connected to the output channel, and the audio of each of the plurality of channels included in the multi-channel audio signal Based on an output position and a second direction that is a direction from the reference position, a channel included in the multi-channel audio signal in which the second direction is closest to the first direction is The voice control device according to any one of claims 1 to 4, wherein the voice control device is determined as a main channel to be assigned to an output channel.
前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの位置を検出する検出手段をさらに備える
ことを特徴とする請求項1からのいずれか一項に記載の音声制御装置。
Wherein for each output channel, the sound control apparatus according to any one of claims 1 to 5, further comprising a detection means for detecting the position of the speaker connected to the output channel.
前記グループは、前記マルチチャンネル音声信号に含まれている前記各チャンネルに対応する音声出力位置情報に応じて、主チャンネルの組合せ毎に設定されているThe group is set for each combination of main channels according to audio output position information corresponding to each channel included in the multi-channel audio signal.
ことを特徴とする請求項1から6のいずれか一項に記載の音声制御装置。The voice control apparatus according to any one of claims 1 to 6, wherein
請求項1から7のいずれか一項に記載の音声制御装置
を備えたことを特徴とする音声再生装置。
An audio reproduction device comprising the audio control device according to claim 1.
請求項1から7のいずれか一項に記載の音声制御装置
を備えたことを特徴とするテレビジョン受像機。
A television receiver comprising the voice control device according to any one of claims 1 to 7.
複数のチャンネルを含むマルチチャンネル音声信号であって、各チャンネルに対応する音声出力位置が予め定められたマルチチャンネル音声信号を、複数の出力チャンネルを介して出力する音声制御方法において、
前記出力チャンネル毎に、当該出力チャンネルに接続されたスピーカの3次元空間における位置と、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの各々に対応する音声出力位置とに基づいて、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの中から、当該出力チャンネルに割り当てる主チャンネルを決定する主チャンネル決定工程と、
前記出力チャンネル毎に、前記マルチチャンネル音声信号に含まれている前記複数のチャンネルの中から、当該出力チャンネルに割り当てる副チャンネルを決定する副チャンネル決定工程と、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルの音声信号と、当該出力チャンネルに割り当てた前記副チャンネルの音声信号とを用いて、当該出力チャンネルを介して出力する出力音声信号を生成する出力音声信号生成工程と
を含み、
前記マルチチャンネル音声信号に含まれている前記複数のチャンネルは、
予め領域毎にグループ化されており、
前記副チャンネル決定工程では、
前記出力チャンネル毎に、当該出力チャンネルに割り当てた前記主チャンネルに対応する前記グループに含まれているチャンネルを、当該出力チャンネルに割り当てる副チャン
ネルとして決定する
ことを特徴とする音声制御方法。
In a multichannel audio signal including a plurality of channels, a multichannel audio signal having a predetermined audio output position corresponding to each channel is output via the plurality of output channels.
For each of the output channels, and the position in the three-dimensional space of the speaker connected to the output channel, based on a sound output position corresponding to each of the plurality of channels contained in the multi-channel audio signal, the A main channel determining step for determining a main channel to be assigned to the output channel from the plurality of channels included in the multi-channel audio signal ;
A sub-channel determination step for determining, for each output channel, a sub-channel to be allocated to the output channel from among the plurality of channels included in the multi-channel audio signal ;
For each output channel, an output audio signal to be output via the output channel is generated using the audio signal of the main channel assigned to the output channel and the audio signal of the sub-channel assigned to the output channel. and an output audio signal generation step of viewing including,
The plurality of channels included in the multi-channel audio signal are:
It is grouped in advance by area,
In the sub-channel determination step,
For each output channel, a channel included in the group corresponding to the main channel assigned to the output channel is assigned to a sub-channel assigned to the output channel.
A voice control method characterized by determining as a channel .
コンピュータを請求項1から7のいずれか一項に記載の音声制御装置として機能させるためのプログラムであって、前記コンピュータを前記音声制御装置が備える前記各手段として機能させるプログラム。   A program for causing a computer to function as the voice control device according to any one of claims 1 to 7, wherein the program causes the computer to function as each unit included in the voice control device. 請求項11に記載のプログラムを記録しているコンピュータ読み取り可能な記録媒体。   The computer-readable recording medium which has recorded the program of Claim 11.
JP2012138097A 2012-06-19 2012-06-19 Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium Expired - Fee Related JP5843705B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012138097A JP5843705B2 (en) 2012-06-19 2012-06-19 Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012138097A JP5843705B2 (en) 2012-06-19 2012-06-19 Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium

Publications (2)

Publication Number Publication Date
JP2014003493A JP2014003493A (en) 2014-01-09
JP5843705B2 true JP5843705B2 (en) 2016-01-13

Family

ID=50036272

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012138097A Expired - Fee Related JP5843705B2 (en) 2012-06-19 2012-06-19 Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP5843705B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112016022042B1 (en) * 2014-03-24 2022-09-27 Samsung Electronics Co., Ltd METHOD FOR RENDERING AN AUDIO SIGNAL, APPARATUS FOR RENDERING AN AUDIO SIGNAL, AND COMPUTER READABLE RECORDING MEDIUM
EP2925024A1 (en) 2014-03-26 2015-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio rendering employing a geometric distance definition
CA3121989C (en) * 2014-03-28 2023-10-31 Samsung Electronics Co., Ltd. Method and apparatus for rendering acoustic signal, and computer-readable recording medium
KR102310240B1 (en) * 2014-05-09 2021-10-08 한국전자통신연구원 Apparatus and method for transforming audio signal using location of the user and the speaker
JP6306958B2 (en) * 2014-07-04 2018-04-04 日本放送協会 Acoustic signal conversion device, acoustic signal conversion method, and acoustic signal conversion program

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07162782A (en) * 1993-12-09 1995-06-23 Matsushita Electric Ind Co Ltd Audio signal processor
JP2000354300A (en) * 1999-06-11 2000-12-19 Accuphase Laboratory Inc Multi-channel audio reproducing device
JP4450764B2 (en) * 2005-04-12 2010-04-14 日本放送協会 Speaker device
JP2009077379A (en) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd Stereoscopic sound reproduction equipment, stereophonic sound reproduction method, and computer program
JP5826996B2 (en) * 2010-08-30 2015-12-02 日本放送協会 Acoustic signal conversion device and program thereof, and three-dimensional acoustic panning device and program thereof

Also Published As

Publication number Publication date
JP2014003493A (en) 2014-01-09

Similar Documents

Publication Publication Date Title
US11064310B2 (en) Method, apparatus or systems for processing audio objects
US11330372B2 (en) Orientation-aware surround sound playback
EP3095254B1 (en) Enhanced spatial impression for home audio
US10375503B2 (en) Apparatus and method for driving an array of loudspeakers with drive signals
JP6022685B2 (en) Audio playback apparatus and method
JP5843705B2 (en) Audio control device, audio reproduction device, television receiver, audio control method, program, and recording medium
US11445317B2 (en) Method and apparatus for localizing multichannel sound signal
JP2006303658A (en) Reproducing device and reproducing method
WO2017208821A1 (en) Sound processing device, sound processing method, and program
US11221821B2 (en) Audio scene processing
JP2010034755A (en) Acoustic processing apparatus and acoustic processing method
JP2006033847A (en) Sound-reproducing apparatus for providing optimum virtual sound source, and sound reproducing method
US9226091B2 (en) Acoustic surround immersion control system and method
JP2003032776A (en) Reproduction system
JPWO2017209196A1 (en) Speaker system, audio signal rendering device and program
CN115777203A (en) Information processing apparatus, output control method, and program
JP4289175B2 (en) Portable equipment
JP6463955B2 (en) Three-dimensional sound reproduction apparatus and program
JP2011193195A (en) Sound-field control device
CN116193196A (en) Virtual surround sound rendering method, device, equipment and storage medium
JP2012156598A (en) Video/audio output device
JP2010157954A (en) Audio playback apparatus

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150401

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150723

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150804

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20151110

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20151117

R150 Certificate of patent or registration of utility model

Ref document number: 5843705

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees