JPWO2019064719A1

JPWO2019064719A1 - 音響信号処理装置および音響信号処理方法

Info

Publication number: JPWO2019064719A1
Application number: JP2019544249A
Authority: JP
Inventors: 宮阪　修二; 修二宮阪; 一任阿部
Original assignee: Socionext Inc
Current assignee: Socionext Inc
Priority date: 2017-09-28
Filing date: 2018-06-12
Publication date: 2020-09-10
Anticipated expiration: 2038-06-12
Also published as: US20200228909A1; CN111133775B; CN111133775A; US10993060B2; WO2019064719A1; JP6988904B2

Abstract

本開示の音響信号処理装置は、正面チャンネル信号である第１信号を信号処理することで第１Ｌ信号と第１Ｒ信号とを生成する正面信号処理部（１０１Ａ）と、左側チャンネル信号である第２信号と、第１Ｌ信号とを加算した信号を、左側チャンネル信号である第４信号とする第１加算部（１０２）と、右側チャンネル信号である第３信号と、第１Ｒ信号とを加算した信号を、側チャンネル信号である第５信号とする第２加算部（１０３）とを備える。正面信号処理部（１０１Ａ）は、第１信号がダイアログ信号である場合、第１信号を分配し、所定の位置に定位させるように信号処理し、第１信号がダイアログ信号でない場合、第１信号を分配して所定の位置と異なる位置に定位させるように信号処理することで第１Ｌ信号および第１Ｒ信号を生成する。

Description

本開示は、音響信号処理装置および音響信号処理方法に関し、特にマルチチャンネルの音響信号の信号処理を行う音響信号処理装置および音響信号処理方法に関する。

ドラマ、映画等の映像および音響コンテンツを家庭用のテレビ受信機などで視聴する際に、会話およびセリフ等のダイアログが背景音に埋もれてしまい聞き取りにくいという問題があり、ダイアログの聴こえ方の改善が求められている。

それに対して、２２．２ｃｈのマルチチャンネル放送において、所定のチャンネルをダイアログ専用に設定し、再生側で、当該チャンネルの音響信号を選択的に増減できる技術がある（例えば非特許文献１参照）。非特許文献１に記載の技術によれば、ダイアログのみの音量を大きくすることでダイアログの聞き取り易さを向上できる。

杉本岳大、外２名、「ＭＰＥＧ−４ＡＡＣを用いた２２．２ｃｈ音声符号化・復号装置の開発」、ＮＨＫ技研Ｒ＆Ｄ／Ｎｏ．１５５／２０１６．１、ｐ．４０―４６

しかしながら、非特許文献１に提案される技術によりダイアログの音量を大きくしたとしてもダイアログが背景音の中に埋もれていることには変わりがない。そのため、ダイアログの音量を大きくすることが必ずしもダイアログの聴こえ方の改善につながらない場合もある。特に高齢者に多くみられるオーバーリクルートメントの症状を持つリスナーに対しては、音量が大きくなることで音声が過剰に煩わしく感じられると言われている。

また、２２．２ｃｈの音響システムは、２４個のスピーカを前提とした音響システムであるが、現実の視聴者の居住環境を鑑みれば、２２．２ｃｈより少ない、例えば２個のスピーカでダイアログの聴こえ方の改善を行う必要がある。

本開示は、上述の事情を鑑みてなされたもので、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる音響信号処理装置および音響信号処理方法を提供することを目的とする。

本開示の一形態に係る音響信号処理装置は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、前記入力信号群を構成する正面チャンネル信号である第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグが格納されているフラグ格納部と、前記第１信号を信号処理して第１Ｌ信号および第１Ｒ信号を生成する正面信号処理部と、前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算部と、前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算部とを備え、前記正面信号処理部は、前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記第１信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第１音像定位部と、前記第１信号がダイアログ信号でないことを前記第１ダイアログフラグが示す場合、前記第１信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第２音像定位部とを有する。

これにより、ダイアログ信号である第１信号の音像は、入力信号のチャンネル数より少ないスピーカ数でダイアログ信号でない第２信号および第３信号の音像と異なるところに定位されるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、例えば、前記第１音像定位部は、前記第１信号を分配し、位相差が９０度から２７０度の範囲となるように位相を回転させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成し、前記第２音像定位部は、前記第１信号を分配し、位相差が‐９０度から９０度の範囲となるように位相を回転させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成するとしてもよい。

これにより、ダイアログ信号である第１信号の音像は、入力信号のチャンネル数より少ないスピーカ数でリスナーの頭内に（リスナーの近くに）定位したかのように聞こえるので、リスナーはダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、例えば、前記正面信号処理部は、さらに、ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、前記正面信号処理部は、前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部に前記第１信号のダイナミックレンジを圧縮させて前記第１音像定位部に出力させ、前記第１音像定位部に、ダイナミックレンジが圧縮された前記第１信号を分配し、所定の位置に定位させるように信号処理することにより、前記第１Ｌ信号および前記第１Ｒ信号を生成するとしてもよい。

これにより、ダイアログの聴こえ方を音像定位の面および音量面で改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、例えば、前記フラグ格納部は、さらに、前記第２信号がダイアログ信号であるか否かを示す第２ダイアログフラグと、前記第３信号がダイアログ信号であるか否かを示す第３ダイアログフラグとが格納されており、前記音響信号処理装置は、さらに、前記第２信号を信号処理して第２Ｌ信号および第２Ｒ信号を生成する左側信号処理部と、前記第３信号を信号処理して第３Ｌ信号および第３Ｒ信号を生成する右側信号処理部とを備え、前記左側信号処理部は、前記第２信号がダイアログ信号であることを前記第２ダイアログフラグが示す場合、前記第２信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成する第１左定位部と、前記第２信号がダイアログ信号でないことを前記第２ダイアログフラグが示す場合、前記第２信号を前記第１左定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成する第２左定位部とを有し、前記右側信号処理部は、前記第３信号がダイアログ信号であることを前記第３ダイアログフラグが示す場合、前記第３信号を分配し、前記リスナーの右側に定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成する第１右定位部と、前記第３信号がダイアログ信号でないことを前記第３ダイアログフラグが示す場合、前記第３信号を前記第１右定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成する第２右定位部と、を有し、前記第１加算部は、前記第１Ｌ信号、前記第２Ｌ信号および前記第３Ｌ信号を加算した信号を前記第４信号とし、前記第２加算部は、前記第１Ｒ信号、前記第２Ｒ信号および前記第３Ｒ信号を加算した信号を前記第５信号とするとしてもよい。

これにより、ダイアログ信号である第２信号の音像は、ダイアログ信号でない第２信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。同様に、ダイアログ信号である第３信号の音像は、ダイアログ信号でない第３信号の音像と比較して、リスナーの近いところに定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、例えば、前記第１左定位部は、分配した前記第２信号にクロストークキャンセル処理を施して、前記リスナーの左側に第２信号の音像を定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成し、前記第２左定位部は、前記第２信号にクロストークキャンセル処理を施さずに、前記リスナーの左側に前記第２信号の音像を定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成し、前記第１右定位部は、前記第３信号にクロストークキャンセル処理を施して、前記リスナーの右側に前記第３信号の音像を定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成し、前記第２右定位部は、前記第３信号にクロストークキャンセル処理を施さずに、前記リスナーの右側に前記第３信号の音像を定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成するとしてもよい。

これにより、ダイアログ信号である第２信号の音像は、リスナーの左耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。同様に、ダイアログ信号である第３信号の音像は、リスナーの右耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、例えば、前記音響信号処理装置は、さらに、複数のスピーカ位置それぞれから前記リスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている伝達関数群格納テーブルと、前記第２信号および前記第３信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部と、を備え、前記第１左定位部は、前記位置情報格納部から前記第２信号に割り当てられている第１スピーカ位置を特定し、特定した第１スピーカ位置と前記伝達関数群格納テーブルとから前記第１スピーカ位置と前記リスナーの両耳の間の第１伝達関数を取得し、前記第２信号に前記第１伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの左側に音像を定位させる信号処理を行い、前記第１右定位部は、前記位置情報格納部から前記第３信号に割り当てられている第２スピーカ位置を特定し、特定した第２スピーカ位置と前記伝達関数群格納テーブルとから前記第２スピーカ位置と前記リスナーの両耳の間の第２伝達関数を取得し、前記第３信号に前記第２伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの右側に音像を定位させる信号処理を行うとしてもよい。

これにより、例えば２チャンネルスピーカしかない再生環境であっても、第２信号および／または第３信号がダイアログである場合、これらの信号に対してもともと意図されたスピーカ位置から当該信号が聴こえるようにできるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、本開示の一態様に係る音響信号処理装置は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、前記入力信号群を構成する正面チャンネル信号である第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグが格納されている第１フラグ格納部と、前記第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する正面信号処理部と、前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算部と、前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算部と、を備え、前記正面信号処理部は、ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、前記正面信号処理部は、前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部により前記第１信号のダイナミックレンジが圧縮された信号を分配することで前記第１Ｌ信号および前記第１Ｒ信号を生成し、前記正面信号処理部は、前記第１信号がダイアログ信号でないことを前記第１ダイアログフラグが示す場合、前記第１信号を分配することで前記第１Ｌ信号および前記第１Ｒ信号を生成する。

これにより、ダイアログ信号である第１信号に対して補聴器の処理と同様のダイナミックレンジ圧縮処理が行われるので、リスナーはセリフ等のダイアログを聞き取りやすくなる。このようにして、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

また、本開示の一態様に係る音響信号処理方法は、マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理方法であって、前記入力信号群を構成する正面チャンネル信号である第１信号を信号処理して第１Ｌ信号および第１Ｒ信号を生成する正面信号処理ステップと、前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算ステップと、前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算ステップとを含み、前記正面信号処理ステップでは、前記第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグにより前記第１信号がダイアログ信号であると示される場合、前記第１信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第１音像定位ステップと、前記第１ダイアログフラグにより前記第１信号がダイアログ信号でないと示される場合、前記第１信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第２音像定位ステップとを含む。

これにより、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

なお、これらの包括的又は具体的な態様は、システム、方法、集積回路、コンピュータプログラム又はコンピュータで読み取り可能なＣＤ−ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラム及び記録媒体の任意な組み合わせで実現されてもよい。

本開示の音響信号処理装置等によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

図１は、実施の形態１に係るシステムの構成の一例を示すブロック図である。図２は、実施の形態１に係る入力処理部の構成の一例を示すブロック図である。図３は、放送番組のストリームの構造の一例を示す図である。図４は、実施の形態１に係る音響信号処理装置の機能をソフトウェアにより実現するコンピュータのハードウェア構成の一例を示す図である。図５は、実施の形態１に係る音響信号処理装置の構成の一例を示す図である。図６は、実施の形態１に係る正面信号処理部の詳細構成の一例を示す図である。図７は、実施の形態１に係る音響信号処理装置の動作を示すフローチャートである。図８は、実施の形態２に係る正面信号処理部の詳細構成の一例を示す図である。図９は、実施の形態２に係る音響信号処理装置の動作を示すフローチャートである。図１０Ａは、実施の形態２に係る効果を説明するための図である。図１０Ｂは、実施の形態２に係る効果を説明するための図である。図１１は、実施の形態２の変形例に係る正面信号処理部の詳細構成の一例を示す図である。図１２は、クロストークキャンセル処理を説明するための図である。図１３は、実施の形態３に係る音響信号処理装置の構成の一例を示す図である。図１４は、実施の形態３に係る左側信号処理部の詳細構成の一例を示す図である。図１５は、実施の形態３に係る右側信号処理部の詳細構成の一例を示す図である。図１６Ａは、実施の形態３に係る効果を説明するための図である。図１６Ｂは、実施の形態３に係る効果を説明するための図である。図１７は、仮想音像定位の処理を説明するための図である。図１８は、２２．２ｃｈ規格における伝達関数群格納テーブルの一例を示す図である。図１９は、実施の形態４に係る音響信号処理装置の構成の一例を示す図である。図２０は、実施の形態４に係る左側信号処理部の詳細構成の一例を示す図である。図２１は、実施の形態４に係る右側信号処理部の詳細構成の一例を示す図である。図２２Ａは、実施の形態４に係る効果を説明するための図である。図２２Ｂは、実施の形態４に係る効果を説明するための図である。図２３Ａは、２２．２ｃｈ規格におけるスピーカ位置を示す図である。図２３Ｂは、２２．２ｃｈ規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。図２３Ｃは、２２．２ｃｈ規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。図２３Ｄは、２２．２ｃｈ規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。図２４は、非特許文献１におけるダイアログチャンネルの一例を示す図である。図２５は、非特許文献１におけるダイアログ音量用のユーザーインターフェースの一例を示す図である。

（本開示の基礎となった知見）
ＡＲＩＢ標準規格ＳＴＤ−Ｂ３２において２２．２ｃｈ（２２．２チャンネルｃｈ）の音声圧縮方式が規格化されている。この２２．２ｃｈの音声圧縮方式は、８Ｋスーパーハイビジョン放送における音声方式として実用化されることになっている。

２２．２ｃｈ規格では、スピーカの配置（スピーカ位置）と各スピーカの位置の名称（チャンネルラベル）とが規定されている。図２３Ａは、２２．２ｃｈ規格におけるスピーカ位置を示す図である。図２３Ｂ〜図２３Ｄは、２２．２ｃｈ規格におけるスピーカ位置と各スピーカ位置のチャンネルラベルを示す図である。図２３Ｂには天井レベルである上層の、図２３Ｃには視聴者の視点のレベルである中層の、図２３Ｄには床レベルである下層のスピーカの配置とチャンネルラベルがそれぞれ示されている。つまり、２２．２ｃｈ規格では、上層に９個、中層に１０個、下層に３個で構成される計２２個の通常スピーカと、下層に２個で構成されるサブウーファー（低音用スピーカ）とが配置されることになる。

また、２２．２ｃｈ規格では、放送事業者は、放送番組ごとに２２．２ｃｈのチャンネル構成の中で「ダイアログチャンネル」を指定することができる。つまり、放送事業者は、ダイアログチャンネルの個数および位置を、放送番組ごとに設定できる。

図２４は、非特許文献１におけるダイアログチャンネルの一例を示す図である。図２４には、非特許文献１においてダイアログ専用に設定されたチャンネルであるダイアログチャンネルの一例が示されており、中層の正面チャンネル（ＦＣ）と下層の正面チャンネル（ＢｔＦＣ）とが、ダイアログチャンネルとして設定された例が示されている。

また、ダイアログチャンネルではダイアログ成分だけが伝送される。２２．２ｃｈのチャンネル構成の中でどのチャンネルがダイアログチャンネルとして指定されているかは、放送番組ごとにそれを示すフラグが伝送されるので、受信端末側でダイアログチャンネルを特定できる。

受信端末側では、伝送されたフラグによって指定されたダイアログチャンネルの音量を、他のチャンネルから独立に制御できる。

図２５は、非特許文献１におけるダイアログ音量用のユーザーインターフェースの一例を示す図である。図２５に示すユーザーインターフェースにより、伝送されたフラグによって指定されたダイアログチャンネルのダイアログのみの音量を増減することができる。

これにより、ダイアログの音量を背景音と独立に増減できるので、視聴者は自身の好みまたは聴力に応じて快適なダイアログの音量を設定できる。さらに、視聴者は、例えばダイアログが聞き取りにくい場合、全体のボリュームを下げた上で、ダイアログのボリュームを上げることで、ダイアログを聞き取り易くすることができる。

このように、非特許文献１に提案される技術によれば、ダイアログのみの音量を大きくすることでダイアログの聞き取り易さを向上できる。

しかしながら、非特許文献１に提案される技術によりダイアログの音量を大きくした場合でもダイアログが背景音の中に埋もれていることには変わりがない。そのため、ダイアログの音量を大きくすることが必ずしもダイアログの聴こえ方の改善につながらない場合もある。特に、リクルートメント現象の症状をもつ視聴者にとっては、ボリュームを上げることが必ずしもダイアログの聴こえ方の改善につながらない。ここで、リクルートメント現象の症状とは、小さい音が聞き取りにくい反面、大きな音は過剰に聴覚を刺激して不快なほど煩く聞こえる、という症状である。

また、２２．２ｃｈの音響システムは、２４個のスピーカを前提とした音響システムである。一方、現実の視聴者の居住環境は、２個のスピーカの音響システムなどである。これらを鑑みると、２２．２ｃｈとして入力される信号のチャンネル数より少ないチャンネルのスピーカでダイアログの聴こえ方の改善を行うのがよい。

以下、本開示の実施の形態について、図面を用いて詳細に説明する。なお、以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置位置及び接続形態、使用手順、通信手順等は、一例であり、本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の最上位概念を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。また、各図は、必ずしも厳密に図示したものではない。各図において、実質的に同一の構成については同一の符号を付し、重複する説明は省略又は簡略化する。

（実施の形態１）
以下では、図面を参照しながら、実施の形態１に係る音響信号処理装置等の説明を行う。

［システムの構成］
図１は、実施の形態１に係るシステムの構成の一例を示すブロック図である。

図１に示すシステムは、音響信号処理装置１０と、入力処理部１１と、左側スピーカ１２と、右側スピーカ１３とを備える。図１に示すシステムは、例えば、ＴＶ装置などに搭載される。

音響信号処理装置１０は、入力されたマルチチャンネルの音響信号を信号処理して、出力する。マルチチャンネルは、例えば２２．２ｃｈであるが、５．１ｃｈでもよく、３ｃｈ以上であればよい。

入力処理部１１は、例えばマルチチャンネルの放送番組のストリームが入力され、マルチチャンネルの音響信号である入力信号群とダイアログフラグ情報とを取得して、音響信号処理装置１０に伝達する。

左側スピーカ１２は、２つのスピーカのうち視聴者またはリスナーからみて左側に位置するスピーカである。図１に示すシステムがＴＶ装置に搭載された場合には、ＴＶ装置からリスナーをみてＴＶ装置の右側に配置されることになる。

右側スピーカ１３は、２つのスピーカのうち視聴者またはリスナーからみて右側に位置するスピーカである。図１に示すシステムがＴＶ装置に搭載された場合には、ＴＶ装置からリスナーをみてＴＶ装置の左側に配置されることになる。

［入力処理部１１の構成］
図２は、実施の形態１に係る入力処理部１１の構成の一例を示すブロック図である。

図２に示す入力処理部１１は、ストリーム解析部１１１と、音響デコーダ１１２と、コントローラ１１３とを備える。

＜ストリーム解析部１１１＞
ストリーム解析部１１１は、入力処理部１１に入力されたマルチチャンネルの放送番組のストリームを解析して、ストリームに含まれる音響データを音響デコーダ１１２に伝達し、ストリームに含まれるダイアログｃｈ情報をコントローラ１１３に伝達する。

図３は、放送番組のストリームの構造の一例を示す図である。

例えば図３に示されるように、マルチチャンネルの放送番組のストリーム５０は、ヘッダ５１と、映像データが含まれるＶｉｄｅｏ５２と、音響データが含まれるＡｕｄｉｏ５３とで少なくとも構成されている。例えば、Ａｕｄｉｏ５３には、マルチチャンネルそれぞれの音響データが含まれている。例えばマルチチャンネルが２２．２ｃｈであれば、Ａｕｄｉｏ５３には、２４個のスピーカそれぞれの音響データが含まれる。また、ヘッダ５１には、マルチチャンネルのチャンネル数およびマルチチャンネルのどのチャンネルがダイアログであるかを示すダイアログｃｈ情報が含まれる。

ストリーム解析部１１１は、図３に示されるようなマルチチャンネルの放送番組のストリーム５０を解析して、Ａｕｄｉｏ５３などの音響データを音響デコーダ１１２に伝達し、ダイアログｃｈ情報をコントローラ１１３に伝達する。

＜音響デコーダ１１２＞
音響デコーダ１１２は、ストリーム解析部１１１から伝達された音響データを復号したマルチチャンネルの音響信号を音響信号処理装置１０に伝達する。図３に示す例では、音響デコーダ１１２は、ストリーム解析部１１１から伝達されたＡｕｄｉｏ５３を復号したマルチチャンネルの音響信号を音響信号処理装置１０に伝達する。

＜コントローラ１１３＞
コントローラ１１３は、ストリーム解析部１１１から伝達されたダイアログｃｈ情報からダイアログフラグを生成するし音響信号処理装置１０に伝達する。例えば、第１のチャネルの信号がダイアログである場合、第１のダイアログフラグを１にし、そうでない場合は、第１のダイアログフラグを０にする、ということである。この処理をそれぞれのチャネルについて行う。

［音響信号処理装置１０の構成］
以下、音響信号処理装置１０について詳細に説明する。

［コンピュータ１０００］
まず、図４を用いて音響信号処理装置１０のハードウェア構成について説明する。

図４は、実施の形態１に係る音響信号処理装置１０の機能をソフトウェアにより実現するコンピュータ１０００のハードウェア構成の一例を示す図である。

コンピュータ１０００は、図４に示すように、入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７、送受信装置１００８およびバス１００９を備えるコンピュータである。入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７および送受信装置１００８は、バス１００９により接続される。

入力装置１００１は入力ボタン、タッチパッド、タッチパネルディスプレイなどといったユーザインタフェースとなる装置であり、ユーザの操作を受け付ける。なお、入力装置１００１は、ユーザの接触操作を受け付ける他、音声での操作、リモコン等での遠隔操作を受け付ける構成であってもよい。

内蔵ストレージ１００４は、フラッシュメモリなどである。また、内蔵ストレージ１００４は、音響信号処理装置１０の機能を実現するためのプログラムおよび／または音響信号処理装置１０の機能構成を利用したアプリケーションが、予め記憶されているとしてもよい。

ＲＡＭ１００５は、ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙであり、プログラムやアプリケーションの実行に際してデータ等の記憶に利用される。

読取装置１００７は、ＵＳＢ（ＵｎｉｖｅｒｓａｌＳｅｒｉａｌＢｕｓ）メモリなどの記録媒体から情報を読み取る。読取装置１００７は、上記のようなプログラムやアプリケーションが記録された記録媒体からそのプログラムやアプリケーションを読み取り、内蔵ストレージ１００４に記憶させる。

送受信装置１００８は、無線又は有線で通信を行うための通信回路である。送受信装置１００８は、例えばネットワークに接続されたサーバ装置と通信を行い、サーバ装置から上記のようなプログラムやアプリケーションをダウンロードして内蔵ストレージ１００４に記憶させる。

ＣＰＵ１００３は、ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔであり、内蔵ストレージ１００４に記憶されたプログラムやアプリケーションをＲＡＭ１００５にコピーし、そのプログラムやアプリケーションに含まれる命令をＲＡＭ１００５から順次読み出して実行する。

［音響信号処理装置１０］
次に、図５および図６を用いて音響信号処理装置１０の各機能構成要素について説明する。

図５は、実施の形態１に係る音響信号処理装置１０の構成の一例を示す図である。

音響信号処理装置１０は、マルチチャンネルの音響信号である入力信号群を信号処理することで、入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する。本実施の形態では、音響信号処理装置１０は、図５に示すように、第１フラグ格納部１００と、正面信号処理部１０１と、第１加算部１０２と、第２加算部１０３とを備える。

以下では、説明を簡便にするために、入力信号群は、第１信号、第２信号および第３信号で構成され、出力信号群は、第４信号および第５信号で構成されるとして説明する。

＜入力信号群＞
第１信号は、入力信号群を構成する信号であって正面チャンネルに割り当てられている信号（正面チャンネル信号）であるとする。第１信号は、例えば２２．２ｃｈ規格におけるＦＣに割り当てられる信号であるが、これに限らない。第１信号は、左右どちらにも偏っていないスピーカ位置に割り当てられる信号であればよく、２２．２ｃｈ規格におけるＢｔＦＣ、ＴｃＦＣ、ＢＣ、ＴｐＣまたはＴｐＢＣに割り当てられる信号であってもよい。

第２信号は、入力信号群を構成する信号であって左側チャンネルに割り当てられている信号（左側チャンネル信号）であるとする。第２信号は、例えば２２．２ｃｈ規格におけるＦＬｃに割り当てられる信号であるが、これに限らない。第２信号は、左側に偏っているスピーカ位置に割り当てられる信号であればよく、２２．２ｃｈ規格におけるＢｔＦＬ、ＦＬ、ＳｉＬ、ＢＬ、ＴｐＦＬ、ＴｐＳｉＬまたはＴｐＢＬに割り当てられる信号であってもよい。

第３信号は、入力信号群を構成する信号であって右側チャンネルに割り当てられている信号（右側チャンネル信号）であるとする。第３信号は、例えば、２２．２ｃｈ規格におけるＦＲｃに割り当てられる信号であるが、これに限らない。第３信号は、右側に偏っているスピーカ位置に割り当てられる信号であればよく、２２．２ｃｈ規格におけるＢｔＦＲ、ＦＲ、ＳｉＲ、ＢＲ、ＴｐＦＲ、ＴｐＳｉＲまたはＴｐＢＲに割り当てられる信号であってもよい。

＜出力信号群＞
第４信号は、出力信号群を構成する左側チャンネル信号であって左側に配置されたスピーカから出音される信号である。第５信号は、出力信号群を構成する右側チャンネル信号であって右側に配置されたスピーカから出音される信号である。

＜第１フラグ格納部１００＞
第１フラグ格納部１００は、入力信号群を構成する正面チャンネル信号である第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグが格納されている。第１フラグ格納部１００は、例えばフラッシュメモリまたはＨＤＤ等のメモリである。第１フラグ格納部１００は、例えば入力処理部１１から伝達されたダイアログフラグ情報が格納されることで、第１ダイアログフラグが格納される。

＜正面信号処理部１０１＞
図６は、実施の形態１に係る正面信号処理部１０１の詳細構成の一例を示す図である。

正面信号処理部１０１は、第１フラグ格納部１００から、第１ダイアログフラグを取得するとともに、第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する。正面信号処理部１０１は、生成した第１Ｌ信号を第１加算部１０２に伝達し、生成した第１Ｒ信号を第２加算部１０３に出力する。

本実施の形態では、正面信号処理部１０１は、図６に示すように、ダイナミックレンジ圧縮部１０１１と、セレクタ１０１２と、セレクタ１０１３とを備える。

≪ダイナミックレンジ圧縮部１０１１≫
ダイナミックレンジ圧縮部１０１１は、ダイナミックレンジを圧縮する信号処理を行う。より具体的には、ダイナミックレンジ圧縮部１０１１は、第１信号の振幅が小さい場合に第１信号を増幅し、第１信号の振幅が大きい場合に第１信号を減衰する信号処理を行うことで、第１信号のダイナミックレンジを圧縮する。

≪セレクタ１０１２≫
セレクタ１０１２は、第１ダイアログフラグが示す第１信号がダイアログ信号であるか否かに応じて信号を切り替え、第１Ｌ信号として第１加算部１０２に出力する。

例えば、セレクタ１０１２は、第１信号がダイアログ信号であることを第１ダイアログフラグが示す場合、ダイナミックレンジが圧縮され、かつ、分配された第１信号の一方を、第１Ｌ信号として第１加算部１０２に出力する。一方、セレクタ１０１２は、第１信号がダイアログ信号でないことを第１ダイアログフラグが示す場合、分配された第１信号の一方を第１Ｌ信号として、第１加算部１０２に出力する。

≪セレクタ１０１３≫
セレクタ１０１３は、第１ダイアログフラグが示す第１信号がダイアログ信号であるか否かに応じて信号を切り替え、第１Ｒ信号として第２加算部１０３に出力する。

例えば、セレクタ１０１３は、第１信号がダイアログ信号であることを第１ダイアログフラグが示す場合、ダイナミックレンジが圧縮され、かつ、分配された第１信号の他方を、第１Ｒ信号として第２加算部１０３に出力する。一方、セレクタ１０１３は、第１信号がダイアログ信号でないことを第１ダイアログフラグが示す場合、分配された第１信号の他方を第１Ｒ信号として、第２加算部１０３に出力する。

このようにして、正面信号処理部１０１は、第１信号がダイアログ信号であることを第１ダイアログフラグが示す場合、ダイナミックレンジ圧縮部１０１１により第１信号のダイナミックレンジが圧縮された信号を分配することで第１Ｌ信号および第１Ｒ信号を生成する。また、正面信号処理部１０１は、第１信号がダイアログ信号でないことを第１ダイアログフラグが示す場合、第１信号を分配することで第１Ｌ信号および第１Ｒ信号を生成する。

＜第１加算部１０２＞
第１加算部１０２は、第２信号と、第１Ｌ信号とを加算した信号を、出力信号群を構成する左側チャンネル信号である第４信号とする。より具体的には、第１加算部１０２は、入力処理部１１により入力された第２信号と、正面信号処理部１０１により入力された第１Ｌ信号とを加算し、第４信号として、左側スピーカ１２に出力する。

＜第２加算部１０３＞
第２加算部１０３は、第３信号と、第１Ｒ信号とを加算した信号を、出力信号群を構成する右側チャンネル信号である第５信号とする。より具体的には、第２加算部１０３は、入力処理部１１により入力された第３信号と、正面信号処理部１０１により入力された第１Ｒ信号とを加算し、第５信号として、右側スピーカ１３に出力する。

［音響信号処理装置１０の動作］
以上のように構成された音響信号処理装置１０の動作について説明する。

図７は、実施の形態１に係る音響信号処理装置１０の動作を示すフローチャートである。

まず、音響信号処理装置１０は、第１ダイアログフラグを取得するとともに、入力処理部１１により入力された第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する正面信号処理を行う（Ｓ１０）。

より具体的には、音響信号処理装置１０は、第１ダイアログフラグを確認し、第１信号がダイアログ信号であるか否かを判定する（Ｓ１０１）。Ｓ１０１において、第１信号がダイアログ信号である場合（Ｓ１０１でＹｅｓ）、音響信号処理装置１０は、第１信号のダイナミックレンジを圧縮して２つの信号に分配する（Ｓ１０２）。そして、分配した２つの信号を第１Ｌ信号および第１Ｒ信号として出力する（Ｓ１０３）。一方、Ｓ１０１において、第１信号がダイアログ信号でない場合（Ｓ１０１でＮｏ）、音響信号処理装置１０は、第１信号を２つの信号に分配する（Ｓ１０４）。そして、分配した２つの信号を第１Ｌ信号および第１Ｒ信号として出力する（Ｓ１０５）。

次に、音響信号処理装置１０は、第２信号と、Ｓ１０において出力された第１Ｌ信号とを加算して、第４信号として、左側スピーカ１２に出力する第１加算処理を行う（Ｓ１１）。

次に、音響信号処理装置１０は、第３信号と、Ｓ１０において出力された第１Ｒ信号とを加算して、第５信号として、右側スピーカ１３に出力する第２加算処理を行う（Ｓ１１）。

［効果等］
本実施の形態の音響信号処理装置１０によれば、第１信号がダイアログ信号である場合に、ダイナミックレンジが圧縮処理された第１信号が左側スピーカ１２および右側スピーカ１３で出音される。つまり、第１信号がダイアログ信号である場合、当該第１信号により左側スピーカ１２および右側スピーカ１３で出音されるのは、意味の理解が必要なダイアログであるので、第１信号のダイナミックレンジを圧縮して出音される。ところで、ダイナミックレンジ圧縮により、小音量でもセリフ等のダイアログを聞き取りやすくことが知られている。特にリクルートメント現象の症状をもつリスナーは、聴こえ方が大きく改善することが知られている。小さな音は聞えない反面、大きな音が過剰に煩く感じるといったリクルートメント現象の症状の改善に、ダイナミックレンジ圧縮の処理がマッチするからである。これにより、ダイナミックレンジを圧縮して出音されたダイアログの聴こえ方を向上できる。

一方、本実施の形態の音響信号処理装置１０によれば、第１信号がダイアログ信号でない場合に、ダイナミックレンジが圧縮処理されない第１信号が左側スピーカ１２および右側スピーカ１３で出音される。第１信号がダイアログ信号でない場合は、当該第１信号により左側スピーカ１２および右側スピーカ１３で出音されるのは、背景音または音楽等である。そのため、ダイナミックレンジを圧縮して出音する必要がないからである。

このようにして、ダイアログの聴こえ方を音量面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。

以上のように本実施の形態の音響信号処理装置１０によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

（実施の形態２）
実施の形態１では、ダイアログの聴こえ方を音量面で改善することについて説明したが、これに限らない。実施の形態２では、ダイアログの聴こえ方を音像定位の面で改善することについて説明する。

実施の形態２に係るシステムおよび入力処理部１１の構成は、実施の形態１で説明したのと同様である。また、実施の形態２に係る音響信号処理装置１０の構成も、図５に示す音響信号処理装置１０と同様であるが、正面信号処理部１０１Ａの詳細構成が異なる。以下、実施の形態１と異なるところを中心に説明する。

［正面信号処理部１０１Ａの構成］
図８は、実施の形態２に係る正面信号処理部１０１Ａの詳細構成の一例を示す図である。なお、図５と同様の要素には同一の符号を付しており、詳細な説明は省略する。

正面信号処理部１０１Ａは、実施の形態１と同様に、第１フラグ格納部１００から、第１ダイアログフラグを取得するとともに、第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する。正面信号処理部１０１は、生成した第１Ｌ信号を第１加算部１０２に伝達し、生成した第１Ｒ信号を第２加算部に出力する。

本実施の形態では、正面信号処理部１０１Ａは、図８に示すように、第１音像定位部１０１４と、第２音像定位部１０１５と、セレクタ１０１２と、セレクタ１０１３とを備える。

＜第１音像定位部１０１４＞
第１音像定位部１０１４は、第１信号を分配し、所定の位置に定位させるように信号処理することにより、第１Ｌ信号および第１Ｒ信号を生成する。より具体的には、第１音像定位部１０１４は、第１信号を分配し、位相差が９０度から２７０度の範囲となるように位相を回転させる信号処理を行うことにより、第１Ｌ信号および第１Ｒ信号を生成する。

第１音像定位部１０１４は、図８に示すように、第１位相回転部１０１６と第２位相回転部１０１７とを備え、第１信号を２つに分配し、２つに分配した第１信号の位相を回転させ相互の位相差が１８０度となる２つの信号であるＸ信号およびＹ信号を生成する。例えば、第１位相回転部１０１６は、２つに分配された第１信号の一方を＋９０度回転させる信号処理を行うことで、Ｘ信号を生成する。第２位相回転部１０１７は、２つに分配された第１信号の他方を‐９０度回転させる信号処理を行うことで、Ｙ信号を生成する。これにより、Ｘ信号とＹ信号との位相差は１８０度となる。

第１位相回転部１０１６が生成するＸ信号は、第１信号がダイアログ信号である場合、セレクタ１０１２により第１Ｌ信号として第１加算部１０２に出力される。第２位相回転部１０１７が生成するＹ信号は、第１信号がダイアログ信号である場合、セレクタ１０１３により第１Ｒ信号として第２加算部１０３に出力される。

ここで、相互の位相差が１８０度となる２つの信号であるＸ信号およびＹ信号を生成する理由は、次の通りである。すなわち、位相差が１８０度の２つの信号をリスナーからみて左右に位置するスピーカから出音すると、その２つの信号の音像はリスナーの頭内に定位（リスナーの近くに定位）したかのように聞こえることが古くから知られており、その現象を利用するためである。

なお、第１位相回転部１０１６は、２つに分配された第１信号の一方が位相反転（１８０度回転）させる信号処理を行うことでＸ信号を生成し、第２位相回転部１０１７は、２つに分配された第１信号の他方そのもの（０度回転）をＹ信号として生成してもよい。もちろん、Ｘ信号とＹ信号とは逆の位相回転の関係であってもよい。

また、Ｘ信号とＹ信号との位相差は１８０度でなくてもよい。本開示の発明者らの実験によれば、Ｘ信号とＹ信号との位相差が概ね９０度以上２７０度以下であれば、その音像がリスナーの方に近づいて聴こえることになる。したがって、第１音像定位部１０１４は、第１信号を分配し、位相差が９０度から２７０度の範囲となるように位相を回転させる信号処理を行うことにより、第１Ｌ信号および第１Ｒ信号を生成すればよい。

＜第２音像定位部１０１５＞
第２音像定位部１０１５は、第１信号を分配し、当該所定の位置と異なる位置に定位させるように信号処理することにより、第１Ｌ信号および第１Ｒ信号を生成する。より具体的には、第２音像定位部１０１５は、第１信号を分配し、位相差が‐９０度から９０度の範囲となるように位相を回転させる信号処理を行うことにより、第１Ｌ信号および第１Ｒ信号を生成する。

第２音像定位部１０１５は、図８に示すように、第１信号を２つに分配することで、２つに分配した第１信号の一方をＶ信号、他方をＷ信号として生成する。このように、第２音像定位部１０１５は、図８に示すように、第１信号を位相差０度の２つの信号に分配して、Ｖ信号およびＷ信号としている。

第２音像定位部１０１５が生成するＶ信号は、第１信号がダイアログ信号でない場合、セレクタ１０１２により第１Ｌ信号として第１加算部１０２に出力される。第２音像定位部１０１５が生成するＷ信号は、第１信号がダイアログ信号でない場合、セレクタ１０１３により第Ｒ信号として第２加算部１０３に出力される。

ここで、位相差が０度となる２つの信号であるＶ信号およびＷ信号を生成する理由は次のとおりである。すなわち、相互の位相差が０度の２つの信号をリスナーからみて左右に位置するスピーカから出音すると、その２つの信号の音像は当該スピーカの真中に定位したかのように聞こえることが古くから知られており、その現象を利用するためである。

なお、第２音像定位部１０１５は、第１信号から位相差０度の２つの信号を生成するとしたが、必ずしも０度に限定されるものではなく、０度近傍（−９０度より大きく、＋９０度より小さい値）であればよい。

［音響信号処理装置１０の動作］
以上のように構成された実施の形態２に係る音響信号処理装置１０の動作について説明する。

図９は、実施の形態２に係る音響信号処理装置１０の動作を示すフローチャートである。なお、図７と同様の要素には同一の符号を付しており、詳細な説明は省略する。

まず、実施の形態２に係る音響信号処理装置１０は、第１ダイアログフラグを取得するとともに、入力処理部１１により入力された第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する正面信号処理を行う（Ｓ１０Ａ）。

より具体的には、実施の形態２に係る音響信号処理装置１０は、第１ダイアログフラグを確認し、第１信号がダイアログ信号であるか否かを判定する（Ｓ１０１）。Ｓ１０１において、第１信号がダイアログ信号である場合（Ｓ１０１でＹｅｓ）、実施の形態２に係る音響信号処理装置１０は、第１信号を２つの信号に分配して、所定の位置に定位させる信号処理を行う（Ｓ１０２Ａ）。そして、Ｓ１０２Ａにおいて信号処理を行った２つの信号であるＸ信号およびＹ信号を第１Ｌ信号および第１Ｒ信号として出力する（Ｓ１０３Ａ）。一方、Ｓ１０１において、第１信号がダイアログ信号でない場合（Ｓ１０１でＮｏ）、実施の形態２に係る音響信号処理装置１０は、第１信号を２つの信号に分配して、当該所定の位置と異なる位置に定位させる信号処理を行う（Ｓ１０４Ａ）。そして、Ｓ１０４Ａにおいて信号処理を行った２つの信号であるＶ信号およびＷ信号を第１Ｌ信号および第１Ｒ信号として出力する（Ｓ１０５Ａ）。

以降のＳ１１およびＳ１２は、実施の形態１で説明した通りであるので説明を省略する。

［効果等］
本実施の形態の音響信号処理装置１０によれば、第１信号がダイアログ信号である場合に、第１信号は２つの信号に分配され、所定の位置に定位させる信号処理が行われ、第１Ｌ信号および第１Ｒ信号として出力される。第１Ｌ信号は第２信号に加算され左側スピーカ１２から、第１Ｒ信号は第３信号に加算されて右側スピーカ１３から出音される。これにより、ダイアログ信号である第１信号の音像は、ダイアログ信号でない第２信号および第３信号の音像と異なることろに定位されるので、リスナーにとってセリフ等のダイアログを聞き取りやすくすることができる。ここで、第１信号がダイアログ信号である場合に、第１信号を分配し、位相差が１８０度となるように位相を回転させる信号処理を行うときには、第１信号の音像は、リスナーの頭内に定位（リスナーの近くに定位）したかのように聞こえるので、リスナーにとってよりダイアログを聞き取りやすくすることができる。

一方、本実施の形態の音響信号処理装置１０によれば、第１信号がダイアログ信号でない場合に、第１信号は２つの信号に分配され、当該所定の位置と異なる位置に定位させる信号処理が行われ、第１Ｌ信号および第１Ｒ信号として出力される。当該所定の位置と異なる位置に定位させる信号処理は、２つの信号に分配された第１信号の位相差が−９０度より大きく、＋９０度より小さい値といった０度近傍となるように位相を回転させることに該当する。ダイアログ信号でない第１信号の音像は、ダイアログ信号でない第２信号および第３信号の音像と異なる位置に定位させる必要がないので、第２信号および第３信号の音像の近傍に定位され、スピーカの真中に定位したかのように聞こえることになる。

図１０Ａおよび図１０Ｂは、実施の形態２に係る効果を説明するための図である。図１０Ａは、第１信号がダイアログ信号でない場合の第１信号の音像定位を概念的に示す図である。図１０Ｂは、第１信号がダイアログ信号である場合の第１信号の音像定位を概念的に示す図である。図１０Ａおよび図１０Ｂにおいて、実施の形態２に係る音響信号処理装置１０等は、家庭用のテレビ受信機６０に搭載されおり、テレビ受信機６０のリスナー７０からみた左端部には左側スピーカ１２が設置され、右端部には右側スピーカ１３が設置されているとする。図１０Ａおよび図１０Ｂでは、リスナー７０がタブレット８０を見ながらテレビを視聴している様子が示されている。

図１０Ａに示すように、第１信号がダイアログ信号でない場合には、第１信号の音像９０は、左側スピーカ１２および右側スピーカ１３の真中に定位するようにリスナー７０に感じられる。これは、テレビ視聴で従来から体験している音像定位に該当する。一方、図１０Ｂに示すように、第１信号がダイアログ信号である場合には、第１信号の音像９２は、リスナー７０の頭内に定位（リスナー７０の近くに定位）するように感じられる。これにより、第１信号の音像９２は、リスナー７０の方に迫ったように感じられ、ダイアログが強調されて聴こえる。

このようにして、ダイアログの聴こえ方を音像定位の面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。

（変形例）
上述した実施の形態２では、ダイアログの聴こえ方を音像定位の面で改善するとして説明したが、これに限らない。ダイアログの聴こえ方を音量面および音像定位の面により改善するとしてもよい。以下、変形例として説明する。なお、以下では実施の形態１および実施の形態２と異なるところを中心に説明する。

［正面信号処理部１０１Ｂの構成］
図１１は、実施の形態２の変形例に係る正面信号処理部１０１Ｂの詳細構成の一例を示す図である。なお、図５および図８と同様の要素には同一の符号を付しており、詳細な説明は省略する。

正面信号処理部１０１Ｂは、実施の形態１および２と同様に、第１フラグ格納部１００から、第１ダイアログフラグを取得するとともに、第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する。正面信号処理部１０１Ｂは、生成した第１Ｌ信号を第１加算部１０２に伝達し、生成した第１Ｒ信号を第２加算部に出力する。

本実施の形態では、正面信号処理部１０１Ｂは、図１１に示すように、ダイナミックレンジ圧縮部１０１１Ｂと、第１音像定位部１０１４Ｂと、第２音像定位部１０１５と、セレクタ１０１２と、セレクタ１０１３とを備える。

ダイナミックレンジ圧縮部１０１１Ｂは、ダイナミックレンジを圧縮する信号処理を行い、第１音像定位部１０１４Ｂに出力する。より具体的には、ダイナミックレンジ圧縮部１０１１Ｂは、第１信号の振幅が小さい場合に第１信号を増幅し、第１信号の振幅が大きい場合に第１信号を減衰する信号処理を行うことで、第１信号のダイナミックレンジを圧縮し、第１音像定位部１０１４Ｂに出力する。

第１音像定位部１０１４Ｂは、ダイナミックレンジが圧縮された第１信号を分配し、所定の位置に定位させるように信号処理することにより、第１Ｌ信号および第１Ｒ信号を生成する。本変形例では、第１音像定位部１０１４Ｂは、図１１に示すように、第１位相回転部１０１６と第２位相回転部１０１７とを備え、ダイナミックレンジが圧縮された第１信号を２つに分配し、２つに分配した当該第１信号の位相を回転させ相互の位相差が１８０度となる２つの信号であるＸ_Ｂ信号およびＹ_Ｂ信号を生成する。

その他の構成等については実施の形態１および２で説明した通りであるので説明を省略する。

この構成により、ダイアログの聴こえ方を音像定位の面および音量面で良好に改善でき、ダイアログ以外の背景音を原音のまま維持できる。さらに、正面チャンネル信号を削減できるので、正面用のスピーカが不要となる。

以上のように本変形例の音響信号処理装置によれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

（実施の形態３）
実施の形態２では、ダイアログ専用に設定される所定チャンネルが第１信号である場合について説明したが、これに限らない。第２信号および第３信号がダイアログ専用に設定されてもよい。実施の形態３では、第１信号〜第３信号がダイアログ信号に設定される場合について説明する。以下、実施の形態２と異なるところを中心に説明する。

上述したように、第２信号は左側チャンネル信号であり、第３信号は右側チャンネル信号であることから、本実施の形態では、クロストークキャンセル処理を用いる。クロストークキャンセル処理は、従来から知られているどのような方法で行ってもよいが、簡単な方法を一例として以下説明する。

［クロストークキャンセル処理］
図１２は、クロストークキャンセル処理を説明するための図である。図１２に示すように、左側スピーカ１２からリスナー７０の左耳元ＺＬまでの音の伝達関数をｈＦＬ、左側スピーカ１２からリスナー７０の右耳元ＺＲまでの音の伝達関数をｈＣＬする。同様に、右側スピーカ１３からリスナー７０の左耳元ＺＬまでの音の伝達関数をｈＣＲ、右側スピーカ１３からリスナーの右耳元ＺＲまでの音の伝達関数をｈＦＲとする。

この場合、伝達関数行列Ｍは、下記の（式１）ように定義できる。

ここで、Ｍの逆行列Ｍ^−１を、（式２）のように示す場合、クロストークキャンセル処理は、入力信号ＸＬ、ＸＲに対し、（式３）で示される行列演算を行うことに該当する。

そして、（式３）に示される行列演算で得られる信号を、左側スピーカ１２および右側スピーカ１３から出音する。これにより、左側スピーカ１２および右側スピーカ１３それぞれから出音された信号のクロストークの成分（左側スピーカ１２からＺＲ、右側スピーカ１３からＺＬの成分）が空間の伝達関数行列でキャンセルされ、信号ＸＬが左耳元ＺＬに到達し、信号ＸＲが右耳元ＺＲに到達する。

［音響信号処理装置１０Ｃ］
次に、図１３〜図１５を用いて音響信号処理装置１０Ｃの各機能構成要素について説明する。音響信号処理装置１０Ｃのハードウェア構成は、図４で説明した通りである。

図１３は、実施の形態３に係る音響信号処理装置１０Ｃの構成の一例を示す図である。なお、図５、図８等と同様の要素には同一の符号を付しており、詳細な説明は省略する。

音響信号処理装置１０Ｃも、マルチチャンネルの音響信号である入力信号群を信号処理することで、入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する。本実施の形態では、音響信号処理装置１０Ｃは、図１３に示すように、第１フラグ格納部１００と、正面信号処理部１０１Ａと、第１加算部１０２Ｃと、第２加算部１０３Ｃと、第２フラグ格納部１０４と、左側信号処理部１０５と、第３フラグ格納部１０６と、右側信号処理部１０７とを備える。なお、第１フラグ格納部１００、第２フラグ格納部１０４および第３フラグ格納部１０６は、別個の構成でなく、一つのフラグ格納部であるとしてもよい。

また、以下でも、説明を簡便にするために実施の形態１および２と同様に、入力信号群は、第１信号、第２信号および第３信号で構成され、出力信号群は、第４信号および第５信号で構成されるとして説明する。

＜第２フラグ格納部１０４＞
第２フラグ格納部１０４は、第２信号がダイアログ信号であるか否かを示す第２ダイアログフラグが格納されている。第２フラグ格納部１０４は、例えばフラッシュメモリまたはＨＤＤ等のメモリである。第２フラグ格納部１０４は、例えば入力処理部１１から伝達されたダイアログフラグ情報が格納されることで、第２ダイアログフラグが格納される。

＜左側信号処理部１０５＞
図１４は、実施の形態３に係る左側信号処理部１０５の詳細構成の一例を示す図である。

左側信号処理部１０５は、第２フラグ格納部１０４から、第２ダイアログフラグを取得するとともに、第２信号を信号処理して第２Ｌ信号および第２Ｒ信号を生成する。左側信号処理部１０５は、生成した第２Ｌ信号を第１加算部１０２Ｃに伝達し、生成した第２Ｒ信号を第２加算部１０３Ｃに出力する。

本実施の形態では、左側信号処理部１０５は、図１４に示すように、第１左定位部１０５１と、第２左定位部１０５２と、セレクタ１０５３と、セレクタ１０５４とを備える。

≪第１左定位部１０５１≫
第１左定位部１０５１は、第２信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、第２Ｌ信号および第２Ｒ信号を生成する。より具体的には、第１左定位部１０５１は、図１４に示すように、第１クロストークキャンセルフィルタ１０５５と第２クロストークキャンセルフィルタ１０５６とを備える。第１左定位部１０５１は、分配した第２信号にクロストークキャンセル処理を施して、リスナーの左側に第２信号の音像を定位させる信号処理を行うことで、第２Ｌ信号および第２Ｒ信号を生成する。図１４に示す例では、第１左定位部１０５１は、第１クロストークキャンセルフィルタ１０５５および第２クロストークキャンセルフィルタ１０５６を用いて、分配した第２信号それぞれにクロストークキャンセル処理を施し、リスナーの左側に音像を定位させる信号処理を行うことで２つの信号であるＸ_１信号およびＹ_１信号を生成する。

第１クロストークキャンセルフィルタ１０５５は、クロストークキャンセル処理が施される、左側スピーカ１２から出音する信号を生成するためのフィルタであり、例えば、上記の（式２）で示される空間の伝達関数行列における伝達関数Ａを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第２の信号を左側スピーカ１２および右側スピーカ１３から出音した際に、リスナーの右側の耳元に音が到達しないように制御する信号処理である。第１クロストークキャンセルフィルタ１０５５は、出力信号としてＸ_１信号を生成して出力する。第２クロストークキャンセルフィルタ１０５６は、クロストークキャンセル処理が施される、右側スピーカ１３から出音する信号を生成するためのフィルタであり、例えば、上記の（式２）で示される空間の伝達関数行列における伝達関数Ｂを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第２信号を左側スピーカ１２および右側スピーカ１３から出音した際に、リスナーの右側の耳元に音が到達しないように制御する信号処理である。第２クロストークキャンセルフィルタ１０５６は、出力信号として、Ｙ_１信号を生成して出力する。

第１クロストークキャンセルフィルタ１０５５が生成するＸ_１信号は、第２信号がダイアログ信号である場合、セレクタ１０５３により第２Ｌ信号として第１加算部１０２Ｃに出力される。第２クロストークキャンセルフィルタ１０５６が生成するＹ_１信号は、第２信号がダイアログ信号である場合、セレクタ１０５４により第２Ｒ信号として第２加算部１０３Ｃに出力される。

このようにして、第１左定位部１０５１は、第１クロストークキャンセルフィルタ１０５５および第２クロストークキャンセルフィルタ１０５６を用いることにより、第２信号が左側スピーカ１２および右側スピーカ１３から出音されたときに、第２信号がリスナーの左耳元に定位したかのような信号を生成することができる。なぜなら、リスナーの右耳に音が到達せず左耳にのみ音が到達するので、あたかも音像がリスナーの左耳元に定位したかのように聞こえるからである。

≪第２左定位部１０５２≫
第２左定位部１０５２は、第２信号がダイアログ信号でないことを第２ダイアログフラグが示す場合、第２信号を第１左定位部１０５１が定位させる位置と異なる位置に定位させる信号処理を行うことにより、第２Ｌ信号および第２Ｒ信号を生成する。より具体的には、第２左定位部１０５２は、第２信号にクロストークキャンセル処理を施さずに、リスナーの左側に第２信号の音像を定位させる信号処理を行うことにより、第２Ｌ信号および第２Ｒ信号を生成する。図１４に示す例では、第２左定位部１０５２は、信号処理を施さずにそのまま通過させる第２信号をＶ_１信号として生成し、別途無音信号をＷ_１信号として生成する。

第２左定位部１０５２が生成するＶ_１信号は、第２信号がダイアログ信号でない場合、セレクタ１０５３により第２Ｌ信号として第１加算部１０２Ｃに出力される。第２左定位部１０５２が生成するＷ_１信号は、第２信号がダイアログ信号でない場合、セレクタ１０５４により第２Ｒ信号として第２加算部１０３Ｃに出力される。

このようにして、第２左定位部１０５２は、第２信号が左側スピーカ１２および右側スピーカ１３から出音されたときに、第２信号が左側スピーカ１２の位置に定位するような信号を生成することができる。なぜなら、第２信号が左側スピーカ１２からのみ出音され、右側スピーカは無音となるからである。

≪セレクタ１０５３≫
セレクタ１０５３は、第２ダイアログフラグが示す第２信号がダイアログ信号であるか否かに応じて信号を切り替え、第２Ｌ信号として第１加算部１０２Ｃに出力する。

例えば、セレクタ１０５３は、第２信号がダイアログ信号であることを第２ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの左側に音像を定位させる信号処理が行われ、かつ、分配された第２信号の一方であるＸ_１信号を、第２Ｌ信号として第１加算部１０２Ｃに出力する。一方、セレクタ１０５３は、第２信号がダイアログ信号でないことを第２ダイアログフラグが示す場合、第２信号であるＶ_１信号を第２Ｌ信号として、第１加算部１０２Ｃに出力する。

≪セレクタ１０５４≫
セレクタ１０５４は、第２ダイアログフラグが示す第２信号がダイアログ信号であるか否かに応じて信号を切り替え、第２Ｒ信号として第２加算部１０３Ｃに出力する。

例えば、セレクタ１０５４は、第２信号がダイアログ信号であることを第２ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの左側に音像を定位させる信号処理が行われ、かつ、分配された第２信号の他方であるＹ_１信号を、第２Ｒ信号として第２加算部１０３Ｃに出力する。一方、セレクタ１０５３は、第２信号がダイアログ信号でないことを第２ダイアログフラグが示す場合、無音信号であるＷ_１信号を第２Ｒ信号として、第２加算部１０３Ｃに出力する。

＜第３フラグ格納部１０６＞
第３フラグ格納部１０６は、第３信号がダイアログ信号であるか否かを示す第３ダイアログフラグとが格納されている。第３フラグ格納部１０６は、例えばフラッシュメモリまたはＨＤＤ等のメモリである。第３フラグ格納部１０６は、例えば入力処理部１１から伝達されたダイアログフラグ情報が格納されることで、第３ダイアログフラグが格納される。

＜右側信号処理部１０７＞
図１５は、実施の形態３に係る右側信号処理部１０７の詳細構成の一例を示す図である。

右側信号処理部１０７は、第３フラグ格納部１０６から、第３ダイアログフラグを取得するとともに、第３信号を信号処理して第３Ｌ信号および第３Ｒ信号を生成する。右側信号処理部１０７は、生成した第３Ｌ信号を第１加算部１０２Ｃに伝達し、生成した第３Ｒ信号を第２加算部１０３Ｃに出力する。

本実施の形態では、右側信号処理部１０７は、図１５に示すように、第１右定位部１０７１と、第２右定位部１０７２と、セレクタ１０７３と、セレクタ１０７４とを備える。

≪第１右定位部１０７１≫
第１右定位部１０７１は、第３信号を分配し、リスナーの右側に定位させる信号処理を行うことにより、第３Ｌ信号および第３Ｒ信号を生成する。より具体的には、第１右定位部１０７１は、図１５に示すように、第３クロストークキャンセルフィルタ１０７５と第４クロストークキャンセルフィルタ１０７６とを備える。第１右定位部１０７１は、分配した第３信号にクロストークキャンセル処理を施して、リスナーの右側に第３信号の音像を定位させる信号処理を行うことにより、第３Ｌ信号および第３Ｒ信号を生成する。図１５に示す例では、第１右定位部１０７１は、第３クロストークキャンセルフィルタ１０７５および第４クロストークキャンセルフィルタ１０７６を用いて、分配した第３信号それぞれにクロストークキャンセル処理を施して、リスナーの右側に音像を定位させる信号処理を行うことで２つの信号であるＸ_２信号およびＹ_２信号を生成する。

第３クロストークキャンセルフィルタ１０７５は、クロストークキャンセル処理が施される、左側スピーカ１２から出音する信号を生成するためのフィルタであり、例えば、上記の（式２）で示される空間の伝達関数行列における伝達関数Ｃを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第３の信号を左側スピーカ１２および右側スピーカ１３から出音した際に、リスナーの左側の耳元に音が到達しないように制御する信号処理である。第３クロストークキャンセルフィルタ１０７５は、出力信号としてＸ_２信号を生成して出力する。第４クロストークキャンセルフィルタ１０７６は、クロストークキャンセル処理が施される、右側スピーカ１３から出音する信号を生成するためのフィルタであり、例えば、上記の（式２）で示される空間の伝達関数行列における伝達関数Ｄを処理するフィルタである。なお、ここでのクロストークキャンセル処理は、第３信号を左側スピーカ１２および右側スピーカ１３から出音した際に、リスナーの左側の耳元に音が到達しないように制御する信号処理である。第４クロストークキャンセルフィルタ１０７６は、出力信号として、Ｙ_２信号を生成して出力する。

第３クロストークキャンセルフィルタ１０７５が生成するＸ_２信号は、第３信号がダイアログ信号である場合、セレクタ１０７３により第３Ｌ信号として第１加算部１０２Ｃに出力される。第４クロストークキャンセルフィルタ１０７６が生成するＹ_２信号は、第３信号がダイアログ信号である場合、セレクタ１０７４により第３Ｒ信号として第２加算部１０３Ｃに出力される。

このようにして、第１右定位部１０７１は、第３クロストークキャンセルフィルタ１０７５および第４クロストークキャンセルフィルタ１０７６を用いることにより、第３信号が左側スピーカ１２および右側スピーカ１３から出音されたときに、第３信号がリスナーの右耳元に定位したかのような信号を生成することができる。なぜなら、リスナーの左耳に音が到達せず右耳にのみ音が到達するので、あたかも音像がリスナーの右耳元に定位したかのように聞こえるからである。

≪第２右定位部１０７２≫
第２右定位部１０７２は、第３信号がダイアログ信号でないことを第３ダイアログフラグが示す場合、第３信号を第１右定位部１０７１が定位させる位置と異なる位置に定位させる信号処理を行うことにより、第３Ｌ信号および第３Ｒ信号を生成する。より具体的には、第２右定位部１０７２は、第３信号にクロストークキャンセル処理を施さずに、リスナーの右側に第３信号の音像を定位させる信号処理を行うことにより、第３Ｌ信号および第３Ｒ信号を生成する。図１５に示す例では、第２右定位部１０７２は、別途無音信号をＶ_２信号として生成し、信号処理を施さずにそのまま通過させる第３信号をＷ_２信号として生成する。

第２右定位部１０７２が生成するＶ_２信号は、第３信号がダイアログ信号でない場合、セレクタ１０７３により第３Ｌ信号として第１加算部１０２Ｃに出力される。第２右定位部１０７２が生成するＷ_２信号は、第３信号がダイアログ信号でない場合、セレクタ１０７４により第３Ｒ信号として第２加算部１０３Ｃに出力される。

このようにして、第２右定位部１０７２は、第３信号が左側スピーカ１２および右側スピーカ１３から出音されたときに、第３信号が右側スピーカ１３の位置に定位するような信号を生成することができる。なぜなら、第３信号が右側スピーカ１３からのみ出音され、左側スピーカは無音となるからである。

≪セレクタ１０７３≫
セレクタ１０７３は、第３ダイアログフラグが示す第３信号がダイアログ信号であるか否かに応じて信号を切り替え、第３Ｌ信号として第１加算部１０２Ｃに出力する。

例えば、セレクタ１０７３は、第３信号がダイアログ信号であることを第３ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの右側に音像を定位させる信号処理が行われ、かつ、分配された第３信号の一方であるＸ_２信号を、第３Ｌ信号として第１加算部１０２Ｃに出力する。一方、セレクタ１０７３は、第３信号がダイアログ信号でないことを第３ダイアログフラグが示す場合、無音信号であるＶ_２信号を第２Ｌ信号として、第１加算部１０２Ｃに出力する。

≪セレクタ１０７４≫
セレクタ１０７４は、第３ダイアログフラグが示す第３信号がダイアログ信号であるか否かに応じて信号を切り替え、第３Ｒ信号として第２加算部１０３Ｃに出力する。

例えば、セレクタ１０７４は、第３信号がダイアログ信号であることを第３ダイアログフラグが示す場合、クロストークキャンセル処理を用いてリスナーの右側に音像を定位させる信号処理が行われ、かつ、分配された第３信号の他方であるＹ_２信号を、第３Ｒ信号として第２加算部１０３Ｃに出力する。一方、セレクタ１０７３は、第３信号がダイアログ信号でないことを第３ダイアログフラグが示す場合、第３信号であるＷ_２信号を第２Ｒ信号として、第２加算部１０３Ｃに出力する。

＜第１加算部１０２Ｃ＞
第１加算部１０２Ｃは、第１Ｌ信号、第２Ｌ信号および第３Ｌ信号を加算した信号を、出力信号群を構成する左側チャンネル信号である第４信号とする。より具体的には、第１加算部１０２Ｃは、正面信号処理部１０１Ａにより入力された第１Ｌ信号と、左側信号処理部１０５により入力された第２Ｌ信号と、右側信号処理部１０７により入力された第３Ｌ信号とを加算して、第４信号として、左側スピーカ１２に出力する。

＜第２加算部１０３Ｃ＞
第２加算部１０３Ｃは、第１Ｒ信号、第２Ｒ信号および第３Ｒ信号を加算した信号を、出力信号群を構成する右側チャンネル信号である第５信号とする。より具体的には、第２加算部１０３Ｃは、正面信号処理部１０１Ａにより入力された第１Ｒ信号と、左側信号処理部１０５により入力された第２Ｒ信号と、右側信号処理部１０７により入力された第３Ｒ信号とを加算して、第５信号として、右側スピーカ１３に出力する。

［効果等］
本実施の形態の音響信号処理装置１０Ｃによれば、第１信号がダイアログ信号である場合に、第１信号は２つの信号に分配され、リスナーの頭内に定位（リスナーの近くに定位）したかのような所定位置に定位させる信号処理が行われ、第１Ｌ信号および第１Ｒ信号として出力される。また、第２信号がダイアログ信号である場合に、第２信号は２つの信号に分配され、リスナーの左耳元に定位させる信号処理が行われ、第２Ｌ信号および第２Ｒ信号として出力される。また、第３信号がダイアログ信号である場合に、第３信号は２つの信号に分配され、リスナーの右耳元に定位させる信号処理が行われ、第３Ｌ信号および第３Ｒ信号として出力される。

さらに、ダイアログ信号である第２信号の音像は、クロストークキャンセル処理が施されることにより、リスナーの左耳元に定位したかのように聞こえるので、リスナーにとってセリフ等のダイアログを聞き取りやすくすることができる。同様に、ダイアログ信号である第３信号の音像は、クロストークキャンセル処理が施されることにより、リスナーの右耳元に定位したかのように聞こえるので、リスナーはセリフ等のダイアログをより聞き取りやすくなる。

図１６Ａおよび図１６Ｂは、実施の形態３に係る効果を説明するための図である。なお、図１０Ａおよび図１０Ｂと同様の要素には同一の符号を付しており、詳細な説明は省略する。図１６Ａは、第２信号および第３信号がダイアログ信号でない場合の第２信号および第３信号の音像定位を概念的に示す図である。図１６Ｂは、第２信号および第３信号がダイアログ信号である場合の第２信号および第３信号の音像定位を概念的に示す図である。

図１６Ａに示すように、第２信号および第３信号がダイアログ信号でない場合には、第２信号の音像９３は左側スピーカ１２の位置に、第３信号の音像９４は右側スピーカ１３の位置に定位するように、リスナー７０に感じられる。これは、テレビ視聴で従来から体験している音像定位に該当する。一方、図１６Ｂに示すように、第２信号および第３信号がダイアログ信号である場合には、第２信号の音像９５はリスナーの左耳元に、第３信号の音像９６はリスナー７０の右耳元に定位するように感じられる。これにより、第２信号の音像９５および第３信号の音像９６は、リスナー７０のダイアログの聞き取り易さを向上させることができるだけでなく、臨場感を向上させることができる。

このようにして、ダイアログの聴こえ方を音像定位の面で良好に改善でき、ダイアログ以外の背景音は原音のまま維持できる。さらに、正面チャンネルの信号を削減できるので、正面用のスピーカが不要となる。

以上のように本実施の形態の音響信号処理装置１０Ｃによれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

なお、実施の形態３では、第２信号は、例えば２２．２ｃｈ規格におけるＦＬｃに割り当てられる信号であるが、上述したように、リスナーの左側のチャンネルに割り当てられている信号であれば例えばＦＬまたはＢｔＦＬなどであってもよい。そして、実施の形態３の音響信号処理装置１０Ｃによれば、２ｃｈスピーカしかない視聴環境において、リスナーの左側のチャンネルに割り当てられている信号がダイアログである場合、当該信号がリスナーの耳元に定位することとなる。２２．２ｃｈの中のダイアログでない信号については、通常のダウンミックス処理によって、２ｃｈ信号にダウンミックスすればよい。ダウンミックス処理はどのようなものであってもよいが、例えば、非特許文献１で挙げられているダウンミックス式によって求めてもよい。ここで、非特許文献１で挙げられている（１）〜（８）のダウンミックス式は各チャンネルの信号がダイアログかどうかに関係なく処理される式である。これらのダウンミックス式を本実施の形態に適用する場合はダイアログであるチャンネルを除外してダウンミックス処理すればよい。

（実施の形態４）
実施の形態３では、第２信号および第３信号がダイアログ信号である場合に、これらの音像をリスナーの左耳元および右耳元に定位させることにより、ダイアログの聴こえ方を向上することについて説明したが、これに限らない。第２信号および第３信号に割り当てられる信号が予め予定されていたスピーカ位置に音像を定位させてもよい。なお、実施の形態４に係るシステムおよび入力処理部１１の構成は、実施の形態１等で説明したのと同様であるので、実施の形態４に係る音響信号処理装置１０Ｄの構成について、実施の形態３と異なるところを中心に説明する。

本実施の形態では、クロストークキャンセル処理を用いて、第２信号および第３信号の音像を、意図されていたスピーカ位置に仮想的に定位（仮想音像定位）させる。以下、仮想音像定位の処理の簡単な方法を一例として説明する。

［仮想音像定位の処理］
図１７は、仮想音像定位の処理を説明するための図である。図１７には、入力信号Ｓを出音した音像の位置（仮想音像位置）がスピーカ位置Ｘであるとする場合の例が示されている。ここで、図１７に示す伝達関数ＨＸは、スピーカ位置Ｘからリスナーの両耳に至る音の伝達関数であり、伝達関数ＨＸは、スピーカ位置Ｘからリスナーの左耳に至る伝達関数ＬＶｘと、スピーカ位置Ｘからリスナーの右耳に至る伝達関数ＲＶｘとの組によって構成される。

入力信号Ｓを出音した音像の位置（仮想音像位置）がスピーカ位置Ｘの位置になるためには、伝達関数ＴＬ、ＴＲと、伝達関数ＨＸと、左右の実スピーカからリスナー７０までの空間の伝達関数行列との関係が、下記の（式４）に示すような関係であればよい。伝達関数ＨＸと、左右の実スピーカからリスナー７０までの空間の伝達関数行列は、予め計測、あるいは計算できるものであるので、入力信号Ｓに伝達関数ＴＬ、ＴＲを適用して左右の実スピーカから出音した信号が、あたかもスピーカ位置Ｘに置かれたスピーカから出音されたかのように聞こえるようになる。

ここで、（式４）は、入力信号Ｓに伝達関数ＨＸを掛けた上で、クロストークキャンセル処理する（空間の伝達関数行列の逆行列を掛ける）ことで、スピーカ位置Ｘから音が聞こえてくるかのような現象を実現できることを示している。

図１８は、２２．２ｃｈ規格における伝達関数群格納テーブルの一例を示す図である。図１８に示す伝達関数群格納テーブルには、仮想音像位置としての種々のスピーカ位置Ｘからリスナー７０の左右に耳に至る伝達関数が、スピーカ位置Ｘをインデックスとして格納されている。図１８に示した伝達関数群格納テーブルの右の列は２つの要素からなっている。その左側の要素は、スピーカ位置Ｘからリスナー７０の左耳に至る伝達関数、右側の要素は、スピーカ位置Ｘからリスナー７０の右に耳に至る伝達関数である。ここで、インデックスは、一例としてＡＲＩＢ規格の２２．２ｃｈのチャンネルラベルを用いている。

チャンネルラベルに対応したそれぞれのスピーカ位置は、ＡＲＩＢ規格によって定められている。そのため、当該伝達関数群格納テーブルには、ＡＲＩＢ規格によって定められているスピーカ位置からリスナーの左右に耳に至る伝達関数（ＬＶｘ、ＲＶｘ）を予め計測して格納することができる。なお、当該伝達関数群格納テーブルには、伝達関数（ＬＶｘ、ＲＶｘ）に代えて、伝達関数（ＬＶｘ、ＲＶｘ）に予めクロストークキャンセル処理の逆行列演算を施したあとの伝達関数を格納しておいてもよい。

［音響信号処理装置１０Ｄ］
次に、図１９〜図２１を用いて音響信号処理装置１０Ｄの各機能構成要素について説明する。音響信号処理装置１０Ｄのハードウェア構成は、図４で説明した通りである。

図１９は、実施の形態４に係る音響信号処理装置１０Ｄの構成の一例を示す図である。なお、図１３と同様の要素には同一の符号を付しており、詳細な説明は省略する。

図１９に示す音響信号処理装置１０Ｄは、実施の形態３に係る図１３に示す音響信号処理装置１０Ｃに対して、第１位置情報格納部１０８、第２位置情報格納部１０９および伝達関数群格納テーブル１１０が追加され、左側信号処理部１０５Ｄおよび右側信号処理部１０７Ｄの構成が異なる。その他については実施の形態３で説明した通りであるので、説明を省略する。なお、第１位置情報格納部１０８および第２位置情報格納部１０９は、別個の構成でなく、一つの位置情報格納部であるとしてもよい。

＜伝達関数群格納テーブル１１０＞
伝達関数群格納テーブル１１０は、複数のスピーカ位置それぞれからリスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている。伝達関数群格納テーブル１１０は、マルチチャンネルが２２．２ｃｈであれば、図１８に示すものであってもよい。本実施の形態では、マルチチャンネルが２２．２ｃｈであるとして説明する。

＜第１位置情報格納部１０８＞
第１位置情報格納部１０８は、第２信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている。本実施の形態では、第１位置情報格納部１０８は、第２信号に対応するチャンネルラベルを格納する。

＜第２位置情報格納部１０９＞
第２位置情報格納部１０９は、第３信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている。本実施の形態では、第２位置情報格納部１０９は、第３信号に対応するチャンネルラベルを格納する。

＜左側信号処理部１０５Ｄ＞
図２０は、実施の形態４に係る左側信号処理部１０５Ｄの詳細構成の一例を示す図である。なお、図１４と同様の要素には同一の符号を付しており、詳細な説明は省略する。

左側信号処理部１０５Ｄは、第２フラグ格納部１０４から、第２ダイアログフラグを取得するとともに、第１位置情報格納部１０８および伝達関数群格納テーブル１１０を参照し、第２信号を信号処理して第２Ｌ信号および第２Ｒ信号を生成する。左側信号処理部１０５Ｄは、生成した第２Ｌ信号を第１加算部１０２Ｃに伝達し、生成した第２Ｒ信号を第２加算部１０３Ｃに出力する。

本実施の形態では、左側信号処理部１０５Ｄは、図２０に示すように、第１左定位部１０５１Ｄと、第２左定位部１０５２と、セレクタ１０５３と、セレクタ１０５４とを備える。

≪第１左定位部１０５１Ｄ≫
第１左定位部１０５１Ｄは、第１位置情報格納部１０８から第２信号に割り当てられている第１スピーカ位置を特定し、特定した第１スピーカ位置と伝達関数群格納テーブル１１０とから第１スピーカ位置とリスナーの両耳の間の第１伝達関数を取得する。そして、第１左定位部１０５１Ｄは、第２信号に第１伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、第１スピーカ位置に音像を定位させる信号処理を行う。

本実施の形態では、第１左定位部１０５１Ｄは、図２０に示すように、左側仮想位置フィルタ１０５７と右側仮想位置フィルタ１０５８とを備える。第１左定位部１０５１Ｄは、第１位置情報格納部１０８からチャンネルラベルを取り出し、取り出したチャンネルラベルをインデックスとして伝達関数群格納テーブル１１０を参照する。そして、第１左定位部１０５１Ｄは、当該インデックスから特定された伝達関数を第２信号に掛けた上でクロストークキャンセル処理を行う。

図２０に示す例では、第１左定位部１０５１Ｄは、左側仮想位置フィルタ１０５７および右側仮想位置フィルタ１０５８を用いて、分配した第２信号それぞれに仮想音像定位の処理を施す。さらに、第１左定位部１０５１Ｄは、第１クロストークキャンセルフィルタ１０５５および第２クロストークキャンセルフィルタ１０５６を用いて、２つの信号であるＸ_３信号およびＹ_３信号を生成する。ここでの仮想音像定位の処理は、第２信号を左側スピーカ１２および右側スピーカ１３から出音した際に、第２信号の音像が第２信号に割り当てられているスピーカ位置に定位したように感じられるように制御する信号処理である。

左側仮想位置フィルタ１０５７は、仮想音像定位の処理が施される信号であって左側スピーカ１２から出音する信号を生成するためのフィルタである。より具体的には、左側仮想位置フィルタ１０５７は、第１位置情報格納部１０８から第２信号に割り当てられているスピーカ位置を特定する。左側仮想位置フィルタ１０５７は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル１１０から、特定したスピーカ位置とリスナーの左耳の間の第１Ｌ伝達関数を取得（または算出）する。ここでは第１Ｌ伝達関数は伝達関数群格納テーブル１１０から取り出されたＨＸの左側の要素である。左側仮想位置フィルタ１０５７は、取得した第１Ｌ伝達関数を、分配された第２信号の一方に掛けて、第１クロストークキャンセルフィルタ１０５５に出力する。そして第１クロストークキャンセルフィルタ１０５５によりＸ_３信号が生成され、生成されたＸ_３信号は、第２信号がダイアログ信号である場合、セレクタ１０５３により第２Ｌ信号として第１加算部１０２Ｃに出力される。

右側仮想位置フィルタ１０５８は、仮想音像定位の処理が施される信号であって右側スピーカ１３から出音する信号を生成するためのフィルタである。より具体的には、右側仮想位置フィルタ１０５８は、第１位置情報格納部１０８から第２信号に割り当てられているスピーカ位置を特定する。右側仮想位置フィルタ１０５８は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル１１０から、特定したスピーカ位置とリスナーの右耳の間の第１Ｒ伝達関数を取得（または算出）する。ここでは第１Ｒ伝達関数は伝達関数群格納テーブル１１０から取り出されたＨＸの右側の要素である。右側仮想位置フィルタ１０５８は、取得した第１Ｒ伝達関数を、分配された第２信号の他方に掛けて、第２クロストークキャンセルフィルタ１０５６に出力する。そして第２クロストークキャンセルフィルタ１０５６によりＹ_３信号が生成され、生成されたＹ_３信号は、第２信号がダイアログ信号である場合、セレクタ１０５４により第２Ｒ信号として第２加算部１０３Ｃに出力される。

＜右側信号処理部１０７Ｄ＞
図２１は、実施の形態４に係る右側信号処理部１０７Ｄの詳細構成の一例を示す図である。なお、図１５と同様の要素には同一の符号を付しており、詳細な説明は省略する。

右側信号処理部１０７Ｄは、第３フラグ格納部１０６から、第３ダイアログフラグを取得するとともに、第２位置情報格納部１０９および伝達関数群格納テーブル１１０を参照し、第３信号を信号処理して第３Ｌ信号および第３Ｒ信号を生成する。右側信号処理部１０７Ｄは、生成した第３Ｌ信号を第１加算部１０２Ｃに伝達し、生成した第３Ｒ信号を第２加算部１０３Ｃに出力する。

本実施の形態では、右側信号処理部１０７Ｄは、図２１に示すように、第１右定位部１０７１Ｄと、第２右定位部１０７２と、セレクタ１０７３と、セレクタ１０７４とを備える。

≪第１右定位部１０７１Ｄ≫
第１右定位部１０７１Ｄは、第２位置情報格納部１０９から第３信号に割り当てられている第２スピーカ位置を特定し、特定した第２スピーカ位置と伝達関数群格納テーブル１１０とから第２スピーカ位置とリスナーの両耳の間の第２伝達関数を取得する。そして、第１右定位部１０７１Ｄは、第３信号に第２伝達関数の処理施した上でクロストークキャンセル処理を施すことにより、第２スピーカ位置に音像を定位させる信号処理を行う。

本実施の形態では、第１右定位部１０７１Ｄは、図２１に示すように、左側仮想位置フィルタ１０７７と右側仮想位置フィルタ１０７８とを備える。第１右定位部１０７１Ｄは、第２位置情報格納部１０９からチャンネルラベルを取り出し、取り出したチャンネルラベルをインデックスとして伝達関数群格納テーブル１１０を参照する。そして、第１右定位部１０７１Ｄは、当該インデックスから特定された伝達関数を第３信号に掛けた上でクロストークキャンセル処理を行う。

図２１に示す例では、第１右定位部１０７１Ｄは、左側仮想位置フィルタ１０７７および右側仮想位置フィルタ１０７８を用いて、分配した第３信号それぞれに仮想音像定位の処理を施す。さらに、第１右定位部１０７１Ｄは、第３クロストークキャンセルフィルタ１０７５および第４クロストークキャンセルフィルタ１０７６を用いて、２つの信号であるＸ_４信号およびＹ_４信号を生成する。ここでの仮想音像定位の処理は、第３信号を左側スピーカ１２および右側スピーカ１３から出音した際に、第３信号の音像が第３信号に割り当てられているスピーカ位置に定位したように感じられるように制御する信号処理である。

左側仮想位置フィルタ１０７７は、仮想音像定位の処理が施される信号であって左側スピーカ１２から出音する信号を生成するためのフィルタである。より具体的には、左側仮想位置フィルタ１０７７は、第２位置情報格納部１０９から第３信号に割り当てられているスピーカ位置を特定する。左側仮想位置フィルタ１０７７は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル１１０から、特定したスピーカ位置とリスナーの左耳の間の第２Ｌ伝達関数を取得（または算出）する。ここでは第２Ｌ伝達関数は伝達関数群格納テーブル１１０から取り出されたＨＸの左側の要素である。左側仮想位置フィルタ１０７７は、取得した第２Ｌ伝達関数を、分配された第３信号の一方に掛けて、第３クロストークキャンセルフィルタ１０７５に出力する。そして第３クロストークキャンセルフィルタ１０７５によりＸ_４信号が生成され、生成されたＸ_４信号は、第３信号がダイアログ信号である場合、セレクタ１０７３により第３Ｌ信号として第１加算部１０２Ｃに出力される。

右側仮想位置フィルタ１０７８は、仮想音像定位の処理が施される信号であって右側スピーカ１３から出音する信号を生成するためのフィルタである。右側仮想位置フィルタ１０７８は、出力信号としてＹ_４信号を生成して出力する。より具体的には、右側仮想位置フィルタ１０７８は、第２位置情報格納部１０９から第３信号に割り当てられているスピーカ位置を特定する。右側仮想位置フィルタ１０７８は、特定したスピーカ位置に基づいて、伝達関数群格納テーブル１１０から、特定したスピーカ位置とリスナーの右耳の間の第２Ｒ伝達関数を取得（または算出）する。ここでは第２Ｒ伝達関数は伝達関数群格納テーブル１１０から取り出されたＨＸの右側の要素である。右側仮想位置フィルタ１０７８は、取得した第２Ｒ伝達関数を、分配された第３信号の他方に掛けて、第４クロストークキャンセルフィルタ１０７６に出力する。そして第４クロストークキャンセルフィルタ１０７６によりＹ_４信号が生成され、生成されたＹ_４信号は、第３信号がダイアログ信号である場合、セレクタ１０７４により第３Ｒ信号として第２加算部１０３Ｃに出力される。

［効果等］
本実施の形態の音響信号処理装置１０Ｄは、実施の形態３の音響信号処理装置１０Ｃと比較して、スピーカ位置Ｘからリスナーの両耳に至る音の伝達関数ＨＸがスピーカ位置ごとに格納されている伝達関数群格納テーブルと、第２信号および／または第３信号が割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部とを更に備え、それらをクロストークキャンセル処理に加味する。

このようにすることによって、２チャンネルスピーカしかない再生環境であっても、当該信号がダイアログである場合、当該信号に対してもともと意図されたスピーカ位置から当該信号が聴こえるようにできる。

図２２Ａおよび図２２Ｂは、実施の形態４に係る効果を説明するための図である。なお、図１６Ａおよび図１６Ｂと同様の要素には同一の符号を付しており、詳細な説明は省略する。図２２Ａは図１６Ａと同じ図である。図２２Ｂは、第２信号および第３信号がダイアログ信号である場合の第２信号および第３信号の定位を概念的に示す図である。

図２２Ｂに示すように、第２信号および第３信号がダイアログ信号である場合には、第２信号および第３信号の音像９７および音像９８は、第２信号および第３信号に割り当てられる信号の予め予定していたスピーカ位置に定位するように、リスナー７０は感じられる。これにより、第２信号の音像９７および第３信号の音像９８は、リスナー７０のダイアログの聞き取り易さのみならず臨場感も向上させることができる。

以上のように本実施の形態の音響信号処理装置１０Ｄによれば、入力信号のチャンネル数より少ないスピーカ数でダイアログの聴こえ方を向上できる。

［その他の実施の形態等］
以上、本開示の態様に係る音響信号処理装置および音響信号処理方法について、実施の形態に基づいて説明したが、本開示は、この実施の形態に限定されるものではない。例えば、本明細書において記載した構成要素を任意に組み合わせて、また、構成要素のいくつかを除外して実現される別の実施の形態を本開示の実施の形態としてもよい。また、上記実施の形態に対して本開示の主旨、すなわち、請求の範囲に記載される文言が示す意味を逸脱しない範囲で当業者が思いつく各種変形を施して得られる変形例も本開示に含まれる。

また、以下に示す形態も、本開示の一つまたは複数の態様の範囲内に含まれてもよい。

（１）上記の音響信号処理装置を構成する構成要素の一部は、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムであってもよい。前記ＲＡＭまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

（２）上記の音響信号処理装置および音響信号処理方法を構成する構成要素の一部は、１個のシステムＬＳＩ（ＬａｒｇｅＳｃａｌｅＩｎｔｅｇｒａｔｉｏｎ：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。前記ＲＡＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

（３）上記の音響信号処理装置を構成する構成要素の一部は、各装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしてもよい。前記ＩＣカードまたは前記モジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。前記ＩＣカードまたは前記モジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ＩＣカードまたは前記モジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。

（４）また、上記の音響信号処理装置を構成する構成要素の一部は、前記コンピュータプログラムまたは前記デジタル信号をコンピュータで読み取り可能な記録媒体、例えば、フレキシブルディスク、ハードディスク、ＣＤ−ＲＯＭ、ＭＯ、ＤＶＤ、ＤＶＤ−ＲＯＭ、ＤＶＤ−ＲＡＭ、ＢＤ（Ｂｌｕ−ｒａｙ（登録商標）Ｄｉｓｃ）、半導体メモリなどに記録したものとしてもよい。また、これらの記録媒体に記録されている前記デジタル信号であるとしてもよい。

また、上記の音響信号処理装置を構成する構成要素の一部は、前記コンピュータプログラムまたは前記デジタル信号を、電気通信回線、無線または有線通信回線、インターネットを代表とするネットワーク、データ放送等を経由して伝送するものとしてもよい。

（５）本開示は、上記に示す方法であるとしてもよい。また、これらの方法をコンピュータにより実現するコンピュータプログラムであるとしてもよいし、前記コンピュータプログラムからなるデジタル信号であるとしてもよい。

（６）また、本開示は、マイクロプロセッサとメモリを備えたコンピュータシステムであって、前記メモリは、上記コンピュータプログラムを記憶しており、前記マイクロプロセッサは、前記コンピュータプログラムにしたがって動作するとしてもよい。

（７）また、前記プログラムまたは前記デジタル信号を前記記録媒体に記録して移送することにより、または前記プログラムまたは前記デジタル信号を、前記ネットワーク等を経由して移送することにより、独立した他のコンピュータシステムにより実施するとしてもよい。

（８）上記実施の形態及び上記変形例をそれぞれ組み合わせるとしてもよい。

本開示は、音響信号処理装置および音響信号処理方法に利用でき、特に、ドラマ、映画等の映像・音響コンテンツを家庭用のテレビ受信機などで視聴する際のダイアログ（会話、セリフ等）の聴こえ方を改善することができるテレビ受信機またはＤＶＤ／ＢＤＲなどの再生機器などに搭載される音響信号処理装置および音響信号処理方法に利用できる。

１０、１０Ｃ、１０Ｄ音響信号処理装置
１１入力処理部
１２左側スピーカ
１３右側スピーカ
５０ストリーム
５１ヘッダ
５２Ｖｉｄｅｏ
５３Ａｕｄｉｏ
６０テレビ受信機
７０リスナー
８０タブレット
９０、９２、９３、９４、９５、９６、９７、９８音像
１００第１フラグ格納部
１０１、１０１Ａ、１０１Ｂ正面信号処理部
１０２、１０２Ｃ第１加算部
１０３、１０３Ｃ第２加算部
１０４第２フラグ格納部
１０５、１０５Ｄ左側信号処理部
１０６第３フラグ格納部
１０７、１０７Ｄ右側信号処理部
１０８第１位置情報格納部
１０９第２位置情報格納部
１１０伝達関数群格納テーブル
１１１ストリーム解析部
１１２音響デコーダ
１１３コントローラ
１０００コンピュータ
１００１入力装置
１００２出力装置
１００４内蔵ストレージ
１００７読取装置
１００８送受信装置
１００９バス
１０１１、１０１１Ｂダイナミックレンジ圧縮部
１０１２、１０１３、１０５３、１０５４、１０７３、１０７４セレクタ
１０１４、１０１４Ｂ第１音像定位部
１０１５第２音像定位部
１０１６第１位相回転部
１０１７第２位相回転部
１０５１、１０５１Ｄ第１左定位部
１０５２第２左定位部
１０５５第１クロストークキャンセルフィルタ
１０５６第２クロストークキャンセルフィルタ
１０５７、１０７７左側仮想位置フィルタ
１０５８、１０７８右側仮想位置フィルタ
１０７１、１０７１Ｄ第１右定位部
１０７２第２右定位部
１０７５第３クロストークキャンセルフィルタ
１０７６第４クロストークキャンセルフィルタ

Claims

マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、
前記入力信号群を構成する正面チャンネル信号である第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグが格納されているフラグ格納部と、
前記第１信号を信号処理して第１Ｌ信号および第１Ｒ信号を生成する正面信号処理部と、
前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算部と、
前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算部とを備え、
前記正面信号処理部は、
前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記第１信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第１音像定位部と、
前記第１信号がダイアログ信号でないことを前記第１ダイアログフラグが示す場合、前記第１信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第２音像定位部とを有する、
音響信号処理装置。
前記第１音像定位部は、
前記第１信号を分配し、位相差が９０度から２７０度の範囲となるように位相を回転させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成し、
前記第２音像定位部は、
前記第１信号を分配し、位相差が‐９０度から９０度の範囲となるように位相を回転させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する、
請求項１に記載の音響信号処理装置。
前記正面信号処理部は、さらに、
ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、
前記正面信号処理部は、
前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部に前記第１信号のダイナミックレンジを圧縮させて前記第１音像定位部に出力させ、
前記第１音像定位部に、ダイナミックレンジが圧縮された前記第１信号を分配し、所定の位置に定位させるように信号処理することにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する、
請求項１または２に記載の音響信号処理装置。
前記フラグ格納部は、さらに、前記第２信号がダイアログ信号であるか否かを示す第２ダイアログフラグと、前記第３信号がダイアログ信号であるか否かを示す第３ダイアログフラグとが格納されており、
前記音響信号処理装置は、さらに、
前記第２信号を信号処理して第２Ｌ信号および第２Ｒ信号を生成する左側信号処理部と、
前記第３信号を信号処理して第３Ｌ信号および第３Ｒ信号を生成する右側信号処理部とを備え、
前記左側信号処理部は、
前記第２信号がダイアログ信号であることを前記第２ダイアログフラグが示す場合、前記第２信号を分配し、リスナーの左側に定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成する第１左定位部と、
前記第２信号がダイアログ信号でないことを前記第２ダイアログフラグが示す場合、前記第２信号を前記第１左定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成する第２左定位部とを有し、
前記右側信号処理部は、
前記第３信号がダイアログ信号であることを前記第３ダイアログフラグが示す場合、前記第３信号を分配し、前記リスナーの右側に定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成する第１右定位部と、
前記第３信号がダイアログ信号でないことを前記第３ダイアログフラグが示す場合、前記第３信号を前記第１右定位部が定位させる位置と異なる位置に定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成する第２右定位部と、を有し、
前記第１加算部は、前記第１Ｌ信号、前記第２Ｌ信号および前記第３Ｌ信号を加算した信号を前記第４信号とし、
前記第２加算部は、前記第１Ｒ信号、前記第２Ｒ信号および前記第３Ｒ信号を加算した信号を前記第５信号とする、
請求項１から３のいずれか１項に記載の音響信号処理装置。
前記第１左定位部は、分配した前記第２信号にクロストークキャンセル処理を施して、前記リスナーの左側に第２信号の音像を定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成し、
前記第２左定位部は、前記第２信号にクロストークキャンセル処理を施さずに、前記リスナーの左側に前記第２信号の音像を定位させる信号処理を行うことにより、前記第２Ｌ信号および前記第２Ｒ信号を生成し、
前記第１右定位部は、前記第３信号にクロストークキャンセル処理を施して、前記リスナーの右側に前記第３信号の音像を定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成し、
前記第２右定位部は、前記第３信号にクロストークキャンセル処理を施さずに、前記リスナーの右側に前記第３信号の音像を定位させる信号処理を行うことにより、前記第３Ｌ信号および前記第３Ｒ信号を生成する、
請求項４に記載の音響信号処理装置。
前記音響信号処理装置は、さらに、
複数のスピーカ位置それぞれから前記リスナーの両耳に至る音の伝達関数が、スピーカ位置ごとに格納されている伝達関数群格納テーブルと、
前記第２信号および前記第３信号に割り当てられているスピーカ位置を特定するスピーカ位置情報が格納されている位置情報格納部と、を備え、
前記第１左定位部は、
前記位置情報格納部から前記第２信号に割り当てられている第１スピーカ位置を特定し、特定した第１スピーカ位置と前記伝達関数群格納テーブルとから前記第１スピーカ位置と前記リスナーの両耳の間の第１伝達関数を取得し、前記第２信号に前記第１伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの左側に音像を定位させる信号処理を行い、
前記第１右定位部は、
前記位置情報格納部から前記第３信号に割り当てられている第２スピーカ位置を特定し、特定した第２スピーカ位置と前記伝達関数群格納テーブルとから前記第２スピーカ位置と前記リスナーの両耳の間の第２伝達関数を取得し、前記第３信号に前記第２伝達関数の処理を施した上でクロストークキャンセル処理を施すことにより、前記リスナーの右側に音像を定位させる信号処理を行う、
請求項５に記載の音響信号処理装置。
マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理装置であって、
前記入力信号群を構成する正面チャンネル信号である第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグが格納されている第１フラグ格納部と、
前記第１信号を信号処理して第１Ｌ信号と第１Ｒ信号とを生成する正面信号処理部と、
前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算部と、
前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算部と、を備え、
前記正面信号処理部は、
ダイナミックレンジを圧縮する信号処理を行うダイナミックレンジ圧縮部を有し、
前記正面信号処理部は、
前記第１信号がダイアログ信号であることを前記第１ダイアログフラグが示す場合、前記ダイナミックレンジ圧縮部により前記第１信号のダイナミックレンジが圧縮された信号を分配することで前記第１Ｌ信号および前記第１Ｒ信号を生成し、
前記正面信号処理部は、前記第１信号がダイアログ信号でないことを前記第１ダイアログフラグが示す場合、前記第１信号を分配することで前記第１Ｌ信号および前記第１Ｒ信号を生成する、
音響信号処理装置。
マルチチャンネルの音響信号である入力信号群を信号処理することで、前記入力信号群を構成するチャンネル信号の数より少ないチャンネル信号の数で構成される出力信号群を出力する音響信号処理方法であって、
前記入力信号群を構成する正面チャンネル信号である第１信号を信号処理して第１Ｌ信号および第１Ｒ信号を生成する正面信号処理ステップと、
前記入力信号群を構成する左側チャンネル信号である第２信号と、前記第１Ｌ信号とを加算した信号を、前記出力信号群を構成する左側チャンネル信号である第４信号とする第１加算ステップと、
前記入力信号群を構成する右側チャンネル信号である第３信号と、前記第１Ｒ信号とを加算した信号を、前記出力信号群を構成する右側チャンネル信号である第５信号とする第２加算ステップとを含み、
前記正面信号処理ステップでは、
前記第１信号がダイアログ信号であるか否かを示す第１ダイアログフラグにより前記第１信号がダイアログ信号であると示される場合、前記第１信号を分配し、所定の位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第１音像定位ステップと、
前記第１ダイアログフラグにより前記第１信号がダイアログ信号でないと示される場合、前記第１信号を分配し、前記所定の位置と異なる位置に定位させる信号処理を行うことにより、前記第１Ｌ信号および前記第１Ｒ信号を生成する第２音像定位ステップとを含む、
音響信号処理方法。