JP2016149767A

JP2016149767A - 音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法

Info

Publication number: JP2016149767A
Application number: JP2016021330A
Authority: JP
Inventors: 佳之飯村; Yoshiyuki Iimura
Original assignee: Nippon Hoso Kyokai NHK
Current assignee: Japan Broadcasting Corp
Priority date: 2015-02-05
Filing date: 2016-02-05
Publication date: 2016-08-18
Anticipated expiration: 2036-02-05
Also published as: JP6647063B2; JP6647064B2; JP2016149766A

Abstract

【課題】音声信号のアップコンバートを容易に行えるようにする、音声信号の特性調整装置を提供する。【解決手段】音声信号の特性調整装置は、スピーカから出力する第１の複数のチャンネルの音声信号を、第１の複数のチャンネルよりも多い第２の複数のチャンネルの入力音声信号をアップコンバートして生成する際に音声信号の特性を調整する音声信号の特性調整装置であって、奥行き方向における手前側でディスプレイ等の脇に位置するスピーカから出力する第１音声信号以外の第２音声信号に遅延時間を与える第１調整部と、ゲイン及び周波数を調整する第２調整部とを含み、遅延時間は、第１音声信号の模擬一次反射波を生成するための第１遅延時間と、後側に配置されるスピーカの第２音声信号ほど長く設定される第２遅延時間との和に基づいて設定され、ゲイン及び周波数は、後側のスピーカの第２音声信号ほど低く設定される。【選択図】図９

Description

本発明は、音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法に関する。

従来より、ディスプレイの周囲に配置した複数のスピーカユニットによりマルチチャンネル音響方式の音再生を行うスピーカアレイ装置であって、視聴者の前方に配置されたチャンネルの音響信号を再生する原信号用スピーカユニットと、前記視聴者の前方に配置されたチャンネルの音響信号を波面合成法の駆動信号に変換する波面合成処理部と、前記駆動信号の周波数成分の高域を除去する低域通過フィルタと、前記高域を除去した駆動信号を再生する波面合成用スピーカユニットと、を備えるスピーカアレイ装置がある（例えば、特許文献１参照）。

特開２０１４−２０４３６２号公報

例えば、特許文献１のように、スピーカアレイ装置があり、マルチチャンネルの音響信号（マルチチャンネルの音声信号）の再生が行われている。

ところで、例えば、２チャンネルの音声信号をアップコンバートしてマルチチャンネルの音声信号を作成する場合には、映像や音響信号の内容や種類に合わせて、ゲインや周波数等の音響信号の特性を手作業で設定していた。

このような音響信号の特性は、例えば、ドラマのシーンや、番組の内容によって設定を変えることが望ましい。

このため、例えば、ドラマのシーン毎に音響信号の特性を手作業で設定すると膨大な作業量が必要になり、音声信号のアップコンバートを容易に行うことができなかった。また、このように手間がかかるため、生放送には対応することが困難であった。

そこで、音声信号のアップコンバートを容易に行えるようにする、音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法を提供することを目的とする。

本発明の実施の形態の音声信号の特性調整装置は、ディスプレイ、スクリーン、又はステージに対する奥行き方向に沿って配置される複数のスピーカから出力する複数のチャンネルの音声信号を、２チャンネルの入力音声信号をアップコンバートして生成する際に、前記複数のチャンネルの音声信号の特性を調整する、音声信号の特性調整装置であって、前記複数のチャンネルの音声信号のうち、前記奥行き方向における手前側で、前記ディスプレイ、前記スクリーン、又は前記ステージの脇に位置するスピーカから出力する第１音声信号以外の第２音声信号に、遅延時間を与える第１調整部と、前記複数のチャンネルの音声信号のゲイン及び周波数を調整する第２調整部とを含み、前記遅延時間は、前記第１音声信号の模擬一次反射波を生成するための第１遅延時間と、前記奥行き方向における手前側よりも後側に配置されるスピーカから出力される前記第２音声信号ほど長く設定される第２遅延時間との和に基づいて設定され、前記ゲイン及び周波数は、前記奥行き方向における後側に配置されるスピーカから出力される前記第２音声信号ほど低く設定される。

音声信号のアップコンバートを容易に行えるようにする、音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法を提供することができる。

実施の形態の音声信号の特性調整装置が適用されるコンピュータシステムの斜視図である。コンピュータシステム５１０の本体部５１１内の要部の構成を説明するブロック図である。実施の形態の音声信号の特性調整装置１００Ａを示す外観図である。実施の形態の音声信号の特性調整装置１００Ａを示す外観図である。実施の形態の音声信号の特性調整装置１００Ａを示す外観図である。実施の形態の音声信号の特性調整装置１００Ａを示す外観図である。２２．２チャンネルの音響システムを示す図である。他の形態の２２．２チャンネルの音響システムを示す図である。実施の形態の音声信号の特性調整装置１００を接続するアップコンバータ１の回路構成を示す図である。音声信号の特性調整装置１００及び１００Ａに含まれる機能ブロックを表す図である。パラメータデータのデータ構造を示す図である。５．１チャンネル及び７．１チャンネルのスピーカの配置を示す図である。５．１チャンネル及び７．１チャンネルのスピーカの配置を示す図である。実施の形態の第１変形例のアップコンバータ１Ａの回路構成を示す図である。実施の形態の第１変形例におけるパラメータデータを選択するＧＵＩ画面を示す図である。実施の形態の第２変形例による音声信号の特性調整装置１００Ｃの構成を示すブロック図である。

以下、本発明の音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法を適用した実施の形態について説明する。

＜実施の形態＞
図１は、実施の形態の音声信号の特性調整装置１００を示す斜視図である。音声信号の特性調整装置１００は、コンピュータシステム５１０とアップコンバータ１を含む。図１に示すコンピュータシステム５１０は、本体部５１１、ディスプレイ５１２、キーボード５１３、マウス５１４、及びモデム５１５を含む。アップコンバータ１は、ケーブル１Ｃによってコンピュータシステム５１０に接続されている。コンピュータシステム５１０は、例えば、ＰＣ（Personal Computer）である。

音声信号の特性調整装置１００のアップコンバータ１は、音声信号に遅延時間を与える遅延処理、及び、音声信号のゲインや周波数を調整する調整処理を行う装置である。コンピュータシステム５１０は、アップコンバータ１における遅延時間、ゲイン、及び周波数を設定する設定装置（アップコンバータ１の設定装置）として機能する。

本体部５１１は、ＣＰＵ（Central Processing Unit：中央演算装置）、ＨＤＤ（Hard Disk Drive：ハードディスクドライブ）、及びディスクドライブ等を内蔵する。ディスプレイ５１２は、本体部５１１からの指示により表示画面５１２Ａ上に解析結果等を表示する表示部であり、例えば、液晶モニタであればよい。キーボード５１３は、コンピュータシステム５１０に種々の情報を入力するための入力部である。マウス５１４は、ディスプレイ５１２の表示画面５１２Ａ上の任意の位置を指定する入力部である。モデム５１５は、外部のデータベース等にアクセスして他のコンピュータシステムに記憶されているプログラム等をダウンロードする。

コンピュータシステム５１０にアップコンバータ１の設定装置としての機能を持たせるプログラムは、ディスク５１７等の可搬型記録媒体に格納されるか、モデム５１５等の通信装置を使って他のコンピュータシステムの記録媒体５１６からダウンロードされ、コンピュータシステム５１０に入力されてコンパイルされる。

コンピュータシステム５１０にアップコンバータ１の設定装置としての機能を持たせるプログラムは、コンピュータシステム５１０をアップコンバータ１の設定装置として動作させる。このプログラムは、例えばディスク５１７等のコンピュータ読み取り可能な記録媒体に格納されていてもよい。コンピュータ読み取り可能な記録媒体は、ディスク５１７、ＩＣカードメモリ、フロッピー（登録商標）ディスク等の磁気ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＵＳＢ(Universal Serial Bus)メモリ等の可搬型記録媒体に限定されるものではない。コンピュータ読み取り可能な記録媒体は、モデム５１５又はＬＡＮ等の通信装置を介して接続されるコンピュータシステムでアクセス可能な各種記録媒体を含む。

図２は、コンピュータシステム５１０の本体部５１１内の要部の構成を説明するブロック図である。本体部５１１は、バス５２０によって接続されたＣＰＵ５２１、ＲＡＭ又はＲＯＭ等を含むメモリ部５２２、ディスク５１７用のディスクドライブ５２３、及びハードディスクドライブ（ＨＤＤ）５２４を含む。実施の形態では、ディスプレイ５１２、キーボード５１３、及びマウス５１４は、バス５２０を介してＣＰＵ５２１に接続されているが、これらはＣＰＵ５２１に直接的に接続されていてもよい。また、ディスプレイ５１２は、入出力画像データの処理を行う周知のグラフィックインタフェース（図示せず）を介してＣＰＵ５２１に接続されていてもよい。

コンピュータシステム５１０において、キーボード５１３及びマウス５１４は、アップコンバータ１の設定装置の入力部である。ディスプレイ５１２は、アップコンバータ１の設定装置による設定結果等を表示画面５１２Ａ上に表示する表示部である。

なお、コンピュータシステム５１０は、図１及び図２に示す構成のものに限定されず、各種周知の要素を付加してもよく、又は代替的に用いてもよい。

また、図２では、アップコンバータ１の設定装置としての機能を持たせたコンピュータシステム５１０で、アップコンバータ１における遅延時間、ゲイン、及び周波数等を設定する形態について説明したが、コンピュータシステム５１０で設定した遅延時間、ゲイン、及び周波数等を表すデータをアップコンバータ１が保持するようにしてもよい。

この場合は、遅延時間、ゲイン、及び周波数等を表すデータを格納するメモリと、遅延時間、ゲイン、及び周波数等を表すデータをメモリから読み出して設定する処理部とをアップコンバータ１が含んでいればよい。

遅延時間、ゲイン、及び周波数等をアップコンバータ１に設定した後は、アップコンバータ１からコンピュータシステム５１０を切り離してよい。また、コンピュータシステム５１０をアップコンバータ１に接続することなく、遅延時間、ゲイン、及び周波数等を表すデータが予め格納されたメモリをアップコンバータ１に実装してもよい。

次に、図３乃至図６を用いて、上述のようなメモリを含む、実施の形態の音声信号の特性調整装置１００Ａについて説明する。

図３乃至図６は、実施の形態の音声信号の特性調整装置１００Ａを示す外観図である。図３乃至図６には、それぞれ、音声信号の特性調整装置１００Ａの四面（平面、正面、背面、右側面）を示す。

音声信号の特性調整装置１００Ａは、筐体１０１を有し、内部にアップコンバータ１を含む。筐体１０１は、一例として、所謂１Ｕ（ワンユー）サイズの金属製又は樹脂製の筐体である。筐体１０１の正面には、表示部１０２と、操作部１０３及び１０４が設けられている。表示部１０２は、液晶パネル等であり、音量や各チャンネルのレベル等を表示する。操作部１０３には、マスターレベル(MASTER LEVEL)調整、入力(INPUT)・出力(OUTPUT)の選択等を行うスイッチ等が配置されている。操作部１０４には、エントリーキー(ENTRY)や、機能(FUNCTION)、モニタ(MONITOR)、チャンネル(CH SELECT)の選択等を行うスイッチ等が配置されている。

筐体１０１の背面には、電源用のコネクタや、各種信号の入出力用のコネクタ等が配置されている。筐体１０１の平面（上面）は封止されており、右側面には冷却用の孔部１０５が設けられている。なお、筐体１０１の底面は平面（上面）と同様に封止されており、左側面には、右側面と同様に冷却用の孔部が設けられている。

図７は、２２．２チャンネルの音響システムを示す図である。２２．２チャンネルの音響システムは、８Ｋスーパーハイビジョンによる映像に合わせることを念頭に開発されてきたものである。図７に示す２２．２チャンネルの音響システムは、一例として、立方体の頂点や辺又は面上の点にスピーカを配置したような構成を有する。

図７では、ＸＹＺ座標を用いて説明する。ＸＹＺ座標の原点は、スピーカＢｔＦＬの位置であり、図示するようにＸ軸、Ｙ軸、Ｚ軸を定義する。ＸＹ平面は水平面と平行であり、Ｚ軸は、鉛直軸と平行である。

ディスプレイ５０は、ＹＺ平面に設置される。

２２．２チャンネルの音響システムは、２４個のスピーカＬＦＥ１、ＬＦＥ２、ＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲ、ＦＬ、ＦＬｃ、ＦＣ、ＦＲｃ、ＦＲ、ＳｉＬ、ＳｉＲ、ＢＬ、ＢＣ、ＢＲ、ＴｐＦＬ、ＴｐＦＣ、ＴｐＦＲ、ＴｐＳｉＬ、ＴｐＣ、ＴｐＳｉＲ、ＴｐＢＬ、ＴｐＢＣ、ＴｐＢＲを含む。

ＬＦＥ１、ＬＦＥ２は、２２．２チャンネルの「．２」チャンネルに対応し、サブウーハーである。

スピーカＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲ、ＦＬ、ＦＬｃ、ＦＣ、ＦＲｃ、ＦＲ、ＳｉＬ、ＳｉＲ、ＢＬ、ＢＣ、ＢＲ、ＴｐＦＬ、ＴｐＦＣ、ＴｐＦＲ、ＴｐＳｉＬ、ＴｐＣ、ＴｐＳｉＲ、ＴｐＢＬ、ＴｐＢＣ、ＴｐＢＲは、２２．２チャンネルの「２２」チャンネルに対応する。

これら２４個のスピーカは、音響システムが設置されるホール、又は、部屋等の空間又はパブリックビューイングを行う空間に合わせて設置されている。ここでは、Ｘ軸方向をホール又は部屋等の奥行き方向と称し、ディスプレイ５０に近い側をフロント（Ｆ）、ディスプレイ５０から遠い側をバック（Ｂ）と称す。これは、２４個のスピーカの中心の理想的な位置に視聴者がいてディスプレイ５０を観る場合に、視聴者にとって前（フロント）か後（バック）であるかを基準に、奥行き方向における前後方向を設定しているからである。

スピーカＬＦＥ１及びＬＦＥ２は、フロントエンド（ＦＥ:Front End）の低い（Ｌ:Low）場所において、ディスプレイ５０の左右の脇に設定されるスピーカである。

スピーカＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲは、それぞれ、フロント側の最も低いボトム（Ｂｔ:Bottom）の左（Ｌ），センター（Ｃ）、右（Ｒ）に位置する。スピーカＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲのＺ軸方向における位置は、ＸＹＺ座標系の原点と同じ高さである。

スピーカＦＬ、ＦＬｃ、ＦＣ、ＦＲｃ、ＦＲは、Ｚ軸方向における中央の高さにおいて、フロント（Ｆ）側で、それぞれ、左（Ｌ）、センター寄りの左（Ｌｃ）、センター（Ｃ）、センター寄りの右（Ｒｃ）、右（Ｒ）に位置する。

スピーカＳｉＬ、ＳｉＲは、Ｚ軸方向における中央の高さにおいて、Ｘ軸方向における奥行きの中央の位置において、それぞれ、左（Ｌ）と右（Ｒ）に位置する。Ｓｉはサイド(Side)を表し、理想的な位置にいる視聴者の横側に位置することを意味する。

スピーカＢＬ、ＢＣ、ＢＲは、Ｚ軸方向における中央の高さにおいて、Ｘ軸方向における奥行きのバック（Ｂ）側において、それぞれ、左（Ｌ）、センター（Ｃ）、右（Ｒ）に位置する。

スピーカＴｐＦＬ、ＴｐＦＣ、ＴｐＦＲは、Ｚ軸方向における最も高い位置（トップ：Ｔｐ(Top)）において、フロント（Ｆ）側で、それぞれ、左（Ｌ）、センター（Ｃ）、右（Ｒ）に位置する。

スピーカＴｐＳｉＬ、ＴｐＣ、ＴｐＳｉＲは、Ｚ軸方向における最も高い位置（トップ：Ｔｐ(Top)）において、Ｘ軸方向における奥行きの中央の位置（サイド：Ｓｉ）において、それぞれ、左（Ｌ）、センター（Ｃ）、右（Ｒ）に位置する。スピーカＴｐＣは、理想的な位置にいる視聴者の真上に位置する。

スピーカＴｐＢＬ、ＴｐＢＣ、ＴｐＢＲは、Ｚ軸方向における最も高い位置（トップ：Ｔｐ(Top)）において、Ｘ軸方向における奥行きのバック（Ｂ）側において、それぞれ、左（Ｌ）、センター（Ｃ）、右（Ｒ）に位置する。

以下では、スピーカＦＬ、ＦＲをそれぞれチャンネル１、２として取り扱う。また、スピーカＦＣ、ＬＦＥ１、ＢＬ、ＢＲ、ＦＬｃ、ＦＲｃ、ＢＣ、ＬＦＥ２、ＳｉＬ、ＳｉＲ、ＴｐＦＬ、ＴｐＦＲ、ＴｐＦＣ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ、ＢｔＦＬ、ＢｔＦＲを、それぞれ、チャンネル３〜２４として取り扱う。

図８は、他の形態の２２．２チャンネルの音響システムを示す図である。図８には、２４個のスピーカＬＦＥ１、ＬＦＥ２、ＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲ、ＦＬ、ＦＬｃ、ＦＣ、ＦＲｃ、ＦＲ、ＳｉＬ、ＳｉＲ、ＢＬ、ＢＣ、ＢＲ、ＴｐＦＬ、ＴｐＦＣ、ＴｐＦＲ、ＴｐＳｉＬ、ＴｐＣ、ＴｐＳｉＲ、ＴｐＢＬ、ＴｐＢＣ、ＴｐＢＲの配置を示す。

図８に示す２２．２チャンネルの音響システムでは、２４個のスピーカは、仮想の視聴者の頭部を中心とする球面上に配置されている。これは、２４個のスピーカのすべてが仮想の視聴者の頭部から等距離の位置に配置されるようにするためである。

ここでは、２４個のスピーカの高さ（図７におけるＺ方向における高さ）を３段階に分けて説明する。

図８（Ａ）には、ミドル層のスピーカＦＬ、ＦＬｃ、ＦＣ、ＦＲｃ、ＦＲ、ＳｉＬ、ＳｉＲ、ＢＬ、ＢＣ、ＢＲを示す。これらは、すべて１つの円周上に配置されている。

図８（Ｂ）には、トップ層のスピーカＴｐＦＬ、ＴｐＦＣ、ＴｐＦＲ、ＴｐＢＬ、ＴｐＢＣ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＣ、ＴｐＳｉＲを示す。トップ層の９個のスピーカのうち、スピーカＴｐＣ以外は、すべて１つの円周上に配置されている。スピーカＴｐＣは、球面の頂上に配置されている。なお、図８（Ｂ）では、説明の便宜上、図８（Ａ）と略同じ直径の円周上に、スピーカＴｐＣ以外のトップ層の８つのスピーカを示すが、ミドル層とトップ層ではスピーカが配置される円周の直径は異なりうる。

図８（Ｃ）には、ボトム層のスピーカＬＦＥ１、ＬＦＥ２、ＢｔＦＬ、ＢｔＦＣ、ＢｔＦＲを示す。これらは、すべて１つの円周上に配置されている。なお、ボトム層の５つのスピーカが配置される円周の直径は、ミドル層及びトップ層のスピーカが配置される円周の直径よりも小さい。

図８（Ｄ）は、トップ層、ミドル層、ボトム層の位置関係を断面で示す。なお、２４個のスピーカの配置については、ある程度の許容範囲が定められている。詳しい配置は、例えば、ＮＨＫ技研Ｒ＆Ｄ／No.148/2014.11のＰ．１２〜Ｐ．２１「８Ｋスーパーハイビジョン音響制作システムの開発と標準化動向」に記載されている。

図９は、実施の形態のアップコンバータ１の回路構成を示す図である。ここでは、図１に示すコンピュータシステム５１０に接続されるアップコンバータ１について説明する。

アップコンバータ１は、入力端子２、アンプ３、分離器４、同期調整部５、ＳＲＣ(Sample Rate Converter)６、分離器７、バス８、入力端子９、ＤＳＰ(Digital Signal Processor)１０、エンコーダ２０、出力端子２１、マトリクス出力部２２、及びモニタ出力回路２３を含む。

入力端子２は、２チャンネルの音声信号が入力される端子であり、例えば、ＢＮＣプラグコネクタを用いればよい。入力端子２には、音源からステレオの音声信号が入力される。ステレオの音声信号は、AES-EBU規格のデジタル信号として、１つの入力端子２に入力される。なお、音声信号がモノラルの場合は、Ｌ（左）及びＲ（右）用に同一の音声信号を用いることにより、２チャンネルの音声信号にすればよい。

アンプ３は、入力端子２に入力される２チャンネルの音声信号を増幅して出力する。

分離器４は、アンプ３で増幅された音声信号を同期調整部５とＳＲＣ６とに分離して出力する。

同期調整部５は、映像信号と音声信号の同期を取るための調整部である。

ＳＲＣ６は、サンプリングレートを変換するコンバータであり、ここでは、２チャンネルの音声信号を２２．２チャンネルの音声信号に変換するためにサンプリングレートを変換している。

分離器７は、ＳＲＣ６から出力される音声信号をＬ（左）及びＲ（右）用の２つの音声信号に分離してバス８に出力する。

バス８は、ＤＳＰ１０とマトリクス出力部２２との間に設けられている。

入力端子９は、コンピュータシステム５１０（図１参照）を接続する端子である。なお、アップコンバータ１が図３乃至図６に示す音声信号の特性調整装置１００Ａに含まれる場合は、特性調整装置１００Ａに含まれ、メモリを有する内蔵コンピュータを入力端子９に接続すればよい。

ＤＳＰ１０は、２４個のＤＳＰ部１０Ａを含む。ＤＳＰ部１０Ａは、２２．２チャンネルに対応して２４個設けられている。２４個のＤＳＰ部１０Ａは、すべて同一の回路構成を有する。

実際には、図９における上側から下側に向けて順番に１チャンネル用から２４チャンネル用の２４個のＤＳＰ部１０Ａが配列されるが、図９では、１チャンネルと２チャンネル用の２つのＤＳＰ部１０Ａを示し、３チャンネル用から２４チャンネル用のＤＳＰ部１０Ａの図示を省略する。

ここでは、１チャンネル用のＤＳＰ部１０Ａの内部構成について説明する。ＤＳＰ部１０Ａは、混合機(MIX)１１Ｌ、１１Ｒ、合成器１２、レベル調整部(LEVEL)１３、イコライザ(4band PEQ)１４、遅延部(DELAY)１５、スイッチ１６、マスターレベル調整部(MASTER LEVEL)１７、及びミュートスイッチ(MUTE)１８を含む。

混合比設定部１１Ｌ及び１１Ｒは、それぞれ、Ｌ（左）及びＲ（右）用の２つの音声信号を混合する割合（比率）を調整する。調整する割合は、入力端子９に接続されるコンピュータシステム５１０又は内蔵コンピュータから入力される制御信号ＭＩＸによって設定される。

合成器１２は、混合比設定部１１Ｌ及び１１Ｒから出力されるＬ（左）及びＲ（右）用の２つの音声信号を混合する。

レベル調整部１３は、そのチャンネルの音声信号の信号レベル（音量）を他のチャンネルの音声信号の信号レベルとは独立して調整する部分である。信号レベルは、入力端子９に接続されるコンピュータシステム５１０又は内蔵コンピュータから入力される制御信号ＬＥＶＥＬによって設定される。

イコライザ１４は、全帯域を４つの帯域に分けて、帯域毎にゲイン（ＧＡＩＮ）、周波数（ＦＲＥＱ）、ゲインのタイプ（ＴＹＰＥ）、又はＱを設定する。これらの値は、実験によって求めた値を蓄積したデータベースから、映像や音響信号の内容や種類に合わせて最適な値に設定される。ゲイン（ＧＡＩＮ）、周波数（ＦＲＥＱ）、ゲインのタイプ（ＴＹＰＥ）、及びＱは、入力端子９に接続されるコンピュータシステム５１０又は内蔵コンピュータから入力される制御信号ＰＥＱによって設定される。

遅延部１５は、第１遅延時間と第２遅延時間との和に応じた遅延時間をスピーカＦＬ、ＦＲ以外のスピーカから出力する音声信号に与える。このため、スピーカＦＬ、ＦＲに対応するチャンネル１、２のＤＳＰ部１０Ａの遅延部１５で音声信号に与える遅延時間は、０秒である。

チャンネル１、２のスピーカＦＬ、ＦＲは、以下で説明する第１遅延時間と第２遅延時間の基準になるスピーカである。

第１遅延時間は、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）から出力する音声信号（第１音声信号）の模擬的な一次反射波（模擬一次反射波）を生成するために、チャンネル３〜２４のスピーカから出力される音声信号（第２音声信号）に与えるように設定される時間である。

なお、奥行き方向のフロントに位置する、チャンネル３、４、７、８、１０、１３〜１５のスピーカから出力される音声信号（第２音声信号）については、第１遅延時間を与えずに、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）から出力する音声信号（第１音声信号）と同一の音声信号を出力するように設定してもよい。

一次反射波は、二次反射波以上の高次反射波に比べると、信号レベルが高く、最も早く到来するので、反射せずに直接視聴者に届く直接音を除いた反射波の中では支配的である。このため、音声信号の特性調整装置１００及び１００Ａでは、一次反射波のみを用いて近似を行い、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）から出力する音声信号（第１音声信号）の模擬的な一次反射波（模擬一次反射波）をチャンネル３〜２４用に生成することにしている。

人間が音の到来方向を認知するとき、左右の耳へ音が到達する時間差と音量の差を照らし合わせてまず判断する。其の次に人は、身の回りの物から反射してくる一次反射音を聞くことにより、身の回りの環境を認知することが出来る。直接到来した音との時間差だったり、音の成分が吸収されることで起る音質の差であったり、反射物が共鳴して付加された音などを認知することで、それまでの経験値と照らし合わせて身の回りの環境を特定していく。其の音がどのような環境で発せられたのか、また自分がどのような場所でこの音を聞いているのか、はたまた、伝搬してくる途中の環境がどのような環境なのかを、認知出来るのである。その後空間に残る残響（高次反射）の情報が加わり、人はさらに回りの環境の詳細を理解することが出来るのである。

ここで行う信号処理では、高次反射の処理は多くの条件が複雑に影響し合うことと、一次反射音の影響力が、高次反射の影響を付加する前に大きいので、其処に注目している。

また、音楽のアップコンバートを考えるとき、既にステレオで完結されている音楽をマルチサラウンド空間に広げる場合、アップコンバートすることでもとの音楽の世界観を大きく変えてしまうことにもなりかねない。そのため、細心の注意を払う必要がある。今まで作られてきているアップコンバータで、処理後の音が残響感の強いものになってしまっているのが、例としてあげることが出来る。高次反射を必要以上に加えないことが、其の残響感を減らすことに役に立っている。

実施の形態の音声信号の特性調整装置１００及び１００Ａは、ホールのステージに置かれた２つの対のスピーカーから再生されるステレオ音響を、ホールの客席で聞くことをシミュレートしようとしているものではなく、ステレオで完結されている音場を、其の世界観を変えないことを最大限に重視して、マルチチャンネル音響システムで再生することを目的としている。

人間の音源・音場環境認知の特性を利用して、反響・残響感を必要以上に増やすこと無く、ステレオ音源（モノラル音源も含む）を、マルチチャンネル空間音響システムで再生出来るようにすることを目的として作られている。

このため、音声信号の特性調整装置１００及び１００Ａでは、一次反射波のみを用いて近似を行い、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）から出力する音声信号（第１音声信号）の模擬的な一次反射波（模擬一次反射波）をチャンネル２〜２４用に生成することにしている。

第２遅延時間は、奥行き方向の中央の位置（サイド）とバックに位置する、チャンネル５、６、９、１１、１２、１６〜２２のスピーカ（ＢＬ、ＢＲ、ＢＣ、ＳｉＬ、ＳｉＲ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ）から出力される音声信号（第２音声信号）に与えられる遅延時間である。

第２遅延時間は、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）の位置に対する、チャンネル５、６、９、１１、１２、１６〜２２のスピーカ（ＢＬ、ＢＲ、ＢＣ、ＳｉＬ、ＳｉＲ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ）の位置の違いを考慮して、視聴者がディスプレイ５０があるフロント側に音源があると感じるようにするために、チャンネル５、６、９、１１、１２、１６〜２２のスピーカ（ＢＬ、ＢＲ、ＢＣ、ＳｉＬ、ＳｉＲ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ）から出力される音声信号（第２音声信号）に与えるように設定される時間である。このため、第２遅延時間は、フロント側よりもバック側に行くほど長く設定される。

第２遅延時間は、ホールの奥行き方向における最も前（最もフロント）に位置するスピーカＦＬ、ＦＲが出力する音声信号に対して、スピーカＦＬ、ＦＲよりも後（バック）側にあるスピーカが出力する音声信号を遅延させる時間である。

視聴者の前方にあるディスプレイ５０に表示される画像の物体又は生物等が発する音声信号を前（フロント）側よりも後（バック）側で遅延させることによって、前（フロント）側から音声信号が聞こえていることを視聴者に聴覚的に認識させるためである。

なお、奥行き方向のフロントに位置する、チャンネル３、４、７、８、１０、１３〜１５のスピーカ（ＦＣ、ＬＦＥ１、ＦＬｃ、ＦＲｃ、ＬＦＥ２、ＴｐＦＬ、ＴｐＦＲ、ＴｐＦＣ、ＢｔＦＬ、ＢｔＦＲ）から出力される音声信号について、チャンネル１、２のスピーカ（ＦＬ、ＦＲ）の位置との違いに基づく遅延時間を与えてもよい。

遅延部１５は、第１遅延時間と第２遅延時間との和に基づいて設定される遅延時間を音声信号に与える。これは、第１遅延時間と第２遅延時間との和を遅延時間として設定する場合の他に、例えば、第１遅延時間及び/又は第２遅延時間に係数を掛けてから求めた和を遅延時間として設定する場合や、第１遅延時間と第２遅延時間との和に係数を掛けてから求めた和を遅延時間として設定する場合があることを意味する。

係数は、例えば、前（フロント）側のスピーカと、前（フロント）側のスピーカよりも後（バック）側のスピーカとの間の距離、又は、前（フロント）側のスピーカと、前（フロント）側のスピーカよりも後（バック）側のスピーカとの間におけるホールの音響特性等に応じて設定すればよい。

係数は、正の値であり、係数をどのような値に設定しても、前（フロント）に位置するスピーカＦＬ、ＦＲが出力する音声信号に対して、スピーカＦＬ、ＦＲよりも後（バック）側にあるスピーカが出力する音声信号は遅延されることになる。

遅延時間は、入力端子９に接続されるコンピュータシステム５１０又は内蔵コンピュータから入力される制御信号ＤＥＬＡＹによって設定される。

スイッチ１６は、各チャンネルのオン／オフを切り替えるためのスイッチである。なお、スイッチ１６は、コンピュータシステム５１０又は内蔵コンピュータによってオン／オフの切り替えが行われるように構成されていてもよい。

マスターレベル調整部１７は、音響システム全体での音量を調整するための調整部であり、すべてのチャンネルにおいて、同一のレベルに設定される。なお、マスターレベル調整部１７は、コンピュータシステム５１０又は内蔵コンピュータによってオン／オフの切り替えが行われるように構成されていてもよい。

ミュートスイッチ(MUTE)１８は、音響システム全体での音量をミュートするためのスイッチである。なお、ミュートスイッチ(MUTE)１８は、コンピュータシステム５１０又は内蔵コンピュータによってオン／オフの切り替えが行われるように構成されていてもよい。

エンコーダ２０は、ＭＡＤＩＥＮＣＯＤＥ形式のエンコーダであり、２４チャンネルのＤＳＰ部１０Ａから出力される音声信号が入力され、出力端子ＯＵＴから出力端子２１に１つの音声信号として出力する。

出力端子２１は、図９に示す音響システムが最終的に出力する音声信号を出力する端子であり、例えば、ＢＮＣプラグコネクタを用いればよい。

マトリクス出力部２２は、例えば、２４チャンネルから６チャンネルを選択して、５．１チャンネル用の音声信号を出力する際に用いる出力部である。

モニタ出力回路２３は、各チャンネルのノイズチェックを行う際に用いる回路である。

図１０は、音声信号の特性調整装置１００及び１００Ａに含まれる機能ブロックを表す図である。

図１０（Ａ）には、音声信号の特性調整装置１００に含まれる、コンピュータシステム５１０によって実現される、アップコンバータ１の設定装置５５０が実現する機能ブロックを示す。

設定装置５５０は、主制御部１１０、混合比制御部１２０、レベル制御部１３０、イコライザ制御部１４０、遅延制御部１５０、及びデータベース１６０を含む。

主制御部１１０は、設定装置５５０の処理を統括する。また、主制御部１１０は、各チャンネルのスイッチ１６のオン／オフの切り替え制御、各チャンネルのマスターレベル調整部１７による音量制御、及び、各チャンネルのミュートスイッチ(MUTE)１８によるミュートの制御を行う。

混合比制御部１２０は、データベース１６０に格納されるパラメータデータを用いて、Ｌ（左）及びＲ（右）用の２つの音声信号を混合する割合（比率）を設定するために、混合比設定部１１Ｌ及び１１Ｒに制御信号ＭＩＸを出力する。

レベル制御部１３０は、データベース１６０に格納されるパラメータデータを用いて、レベル調整部１３による音声信号の信号レベル（音量）を制御するために、制御信号ＬＥＶＥＬを出力する。

イコライザ制御部１４０は、データベース１６０に格納されるパラメータデータを用いて、各チャンネルについて、ゲイン（ＧＡＩＮ）、周波数（ＦＲＥＱ）、ゲインのタイプ（ＴＹＰＥ）、又はＱを設定するための制御信号ＰＥＱを出力する。イコライザ制御部１４０は、第２調整部の一例である。

遅延制御部１５０は、データベース１６０に格納されるパラメータデータを用いて、遅延部１５における遅延時間を設定するための制御信号ＤＥＬＡＹを出力する。遅延制御部１５０は、第１調整部の一例である。

データベース１６０は、パラメータデータを格納する。パラメータデータは、各チャンネルについて、Ｌ（左）及びＲ（右）用の２つの音声信号を混合する割合（比率）を設定するための制御信号ＭＩＸ、音声信号の信号レベル（音量）制御するための制御信号ＬＥＶＥＬ、ゲイン（ＧＡＩＮ）、周波数（ＦＲＥＱ）、ゲインのタイプ（ＴＹＰＥ）、又はＱを設定するための制御信号ＰＥＱ、遅延時間を設定するための制御信号ＤＥＬＡＹの値を含むテーブル形式のデータである。なお、パラメータデータについては図１１を用いて説明する。

図１０（Ｂ）は、音声信号の特性調整装置１００Ａの内蔵コンピュータ１００Ｂによって実現される機能ブロックを示す。音声信号の特性調整装置１００Ａは、内蔵コンピュータ１００Ｂとアップコンバータ１とを含む。

内蔵コンピュータ１００Ｂは、主制御部１１０、混合比制御部１２０、レベル制御部１３０、イコライザ制御部１４０、遅延制御部１５０、及びデータベース１６０を含む。内蔵コンピュータ１００Ｂの構成は、図１０（Ａ）に示す設定装置５５０と同様である。内蔵コンピュータ１００Ｂには、アップコンバータ１が接続される。また、内蔵コンピュータ１００Ｂのデータベース１６０には、予め遅延時間、ゲイン、及び周波数等を表すデータが格納されている。

図１１は、パラメータデータを選択するＧＵＩ画面を示す図である。このようなＧＵＩ画面は、音声信号の特性調整装置１００として機能するコンピュータシステム５１０（図１参照）のディスプレイ５１２に表示される。

パラメータデータは、映像や音響信号の内容や種類に合わせて複数あり、音声信号の特性調整装置１００の利用者が選択できるようになっている。図１１には、複数あるパラメータデータのうちの１つを示す。

また、図１１は、チャンネル１〜２４の各々についてのパラメータデータを示すため、パラメータデータのデータ構造を示している。

パラメータデータは、１チャンネルから２４チャンネルまでの各チャンネルの、制御信号ＭＩＸ、ＬＥＶＥＬ、ＧＡＩＮ、ＦＲＥＱ、ＴＹＰＥ、Ｑ、ＤＥＬＡＹの値を関連付けたテーブル形式のデータである。

これらのうち、ＧＡＩＮ、ＦＲＥＱ、ＴＹＰＥ、Ｑの４つの値は、全帯域を４つの帯域に分けて、帯域毎に設定される。また、図１１には、周波数の高い帯域から低い方の帯域にかけて、４つの帯域を上の行から下方の行にかけて示す。なお、ここでは、具体的な数値は示さないため、数値の代わりに・・・を記す。

ＴＹＰＥについては、最も高い帯域と最も低い帯域とに設定され、Ｑについては、真ん中の２つの帯域に設定される。このため、最も高い帯域と最も低い帯域とには、ＧＡＩＮ、ＦＲＥＱ、ＴＹＰＥの３つの値が設定され、真ん中の２つの帯域には、ＧＡＩＮ、ＦＲＥＱ、Ｑの３つの値が設定される。

ＧＡＩＮ、ＦＲＥＱ、ＴＹＰＥ、Ｑは、制御信号ＰＥＱとしてアップコンバータ１（図９参照）に入力される。

ＭＩＸは、混合比設定部１１Ｌ及び１１ＲがＬ（左）及びＲ（右）用の２つの音声信号を出力する割合（比率）を表す。混合比設定部１１Ｌ及び１１Ｒから出力されるＬ（左）及びＲ（右）用の２つの音声信号は、合成器１２で合成（混合）される。

ＬＥＶＥＬは、レベル調整部１３が制御する音声信号の信号レベル（音量）を表す。

ＧＡＩＮとＦＲＥＱは、それぞれ、イコライザ制御部１４０が制御する音声信号のゲインと周波数を表す。

ゲインのタイプ（ＴＹＰＥ）は、周波数の増大に対して、イコライザ制御部１４０が制御するＧＡＩＮを増大させる特性にするか、又は、周波数の増大に対してＧＡＩＮを低下させる特性にするかを表す。

また、Ｑは、（共振回路の共振のピークの鋭さを表すものとして、Quality Factorと呼ばれるものである。一般的に、Q＝ω0/ω２?ω１として表され、ω２?ω１を半値幅と呼び、振幅がピークとなる共振周波数ω0の両側に其の振幅値の半分になるところの周波数で、周波数の大きい方をω２、ω0を挟んで等量（ω２-ω0）小さい周波数をω１としている。

ＤＥＬＡＹは、遅延部１５が音声信号に与える遅延時間を表す。ＤＥＬＡＹが表す遅延時間は、上述した第１遅延時間と第２遅延時間との和に基づいて設定される。

以上のようなパラメータデータは、映像や音響信号の内容や種類に合わせて複数あるため、音声信号の特性調整装置１００の利用者がいずれか１つを選択することにより、ディスプレイ５１２（図１参照）に図１１に示すように表示される。

パラメータデータに含まれる１チャンネルから２４チャンネルまでの各チャンネルの、制御信号ＭＩＸ、ＬＥＶＥＬ、ＧＡＩＮ、ＦＲＥＱ、ＴＹＰＥ、Ｑ、ＤＥＬＡＹの値は、実験によって求めた最適値であるため、そのまま用いればよいが、ＧＵＩ画面における各数値の右側にある上向きの三角形と下向きの三角形のボタンで、値を増減させてもよい。

図１１に示すように、パラメータデータは、スピーカの位置が後側に行くほど、遅延時間が長く、かつ、高域が低くなるように、ＦＲＥＱとＧＡＩＮとＱが調整されている。このような設定にすることにより、２４個のスピーカの再生音響環境の中にいる視聴者に対して、音が前方から聞こえるようにすることができる。

視聴者の前方には、ディスプレイ５０があるので、視聴者には、前方のディスプレイ５０に映し出される映像から音が出ているように聞こえるようになる。このようなパラメータデータを用いることにより、音と映像による臨場感を最大限に発揮させることができる。

なお、図３乃至図６に示す音声信号の特性調整装置１００Ａでは、内蔵コンピュータ１００Ｂのデータベース１６０に予め格納されている遅延時間、ゲイン、及び周波数等を表すデータを用いて、遅延時間、ゲイン、及び周波数等が設定される。

以上、実施の形態の実施の形態の音声信号の特性調整装置１００及び１００Ａによれば、２チャンネル用の音声信号を２２．２チャンネル用にアップコンバートする際に、チャンネル１、２の音声信号の模擬的な一次反射波に相当する遅延時間を有する音声信号をチャンネル３〜２４用に生成することにより、二次反射波以上の高次反射波を用いなくても、２２．２チャンネルの音響システムに十分に対応できる音声信号を得ることができる。

また、アップコンバートに際しては、上述の遅延時間に加えて、後側に位置するスピーカのチャンネルほどゲインや周波数の高域の信号レベルが低くなるように設定するので、音と映像による臨場感を最大限に発揮させることができる。

また、上方に設置されたスピーカーほど低域成分を落とし制限する。前方の下方に置かれたスピーカーほど高域を制限する。これらのことは、実験結果から実証されている。なお、上方とは、高さ方向に複数配置されるスピーカのうち、高さ方向の中央よりも上側をいう。この場合に、高さ方向の中央に位置するスピーカを上方のスピーカに含めてもよい。また、下方とは、高さ方向に複数配置されるスピーカのうち、高さ方向の中央よりも下側をいう。この場合に、高さ方向の中央に位置するスピーカを下方のスピーカに含めてもよい。また、前方とは、奥行き方向における前後方向に複数配置されるスピーカのうち、前後方向の中央よりも前側をいう。この場合に、前後方向の中央に位置するスピーカを前方のスピーカに含めてもよい。

また、二次反射波以上の高次反射波を用いなくても、２２．２チャンネルの音響システムに十分に対応できる音声信号を得ることができるため、装置構成が非常に簡便であり、低コストで音声信号の特性調整装置１００及び１００Ａを提供することができる。

特に、実施の形態の音声信号の特性調整装置１００及び１００Ａで得られた結果に、サンプリングリバーブや既存のリバーブを加えることで、様々な音響表現が簡便に詳細に出来るようになる。

また、従来は、映像や音響信号の内容や種類に合わせて、ゲインや周波数等の音響信号の特性を手作業で設定していたため、音声信号のアップコンバートを容易に行うことができず、手間がかかるため、生放送には対応することが困難であった。

これに対して、実施の形態の音声信号の特性調整装置１００及び１００Ａは、映像や音響信号の内容や種類に応じてパラメータデータを選択すれば、選択したパラメータデータを用いて、瞬時かつ容易に音声信号をアップコンバートすることができる。このため、手間がかからず、生放送にも対応可能である。

また、上述したように音声信号の特性調整装置１００及び１００Ａは装置構成が非常に簡便である。また、アップコンバータ１も小型化が可能であり、音声信号の特性調整装置１００Ａは、所謂１Ｕのサイズに収まるように小型化されている。このため、例えば、中継車に搭載して、駅伝等の生放送の番組で、走者の音声を、８Ｋスーパーハイビジョンによる映像に合わせて、２２．２チャンネルで音声を提供することが可能である。また、音声信号の特性調整装置１００Ａは、内蔵コンピュータ１００Ｂのデータベース１６０に遅延時間、ゲイン、及び周波数等を表すデータが予め格納されているため、設定装置５５０で設定しなくても、簡単に音声信号をアップコンバートすることができる。

なお、以上では、２チャンネルの音声信号を２２．２チャンネルにアップコンバートする形態について説明したが、アップコンバートするチャンネルは、２２．２チャンネルに限られるものではなく、例えば、５．１チャンネル、７．１チャンネル、９．１チャンネル、１０．２チャンネル、１９．１チャンネル等であってもよく、さらに多くのチャンネルであってもよい。

図１２及び図１３は、５．１チャンネル及び７．１チャンネルのスピーカの配置を示す図である。なお、図１２及び図１３では、サブウーハーを省略する。サブウーハーは、センタースピーカＣの近くに配置すればよい。

図１２に示す５．１チャンネルでは、視聴者の前方（フロント）の正面にスピーカＣが配置され、その左右にスピーカＬ，Ｒが配置される。また、視聴者の少し後方の左右には、スピーカＬｓ，Ｒｓが配置される。

図１３に示す７．１チャンネルでは、５．１チャンネルに対して、後方（バック）のスピーカＬｂ，Ｒｂを追加した構成を有する。

５．１チャンネルの配置については、例えば、ITU勧告ITU-R BS.775-1という規格があり、７．１チャンネルの配置については、例えば、ドルビー社によって推奨されている配置がある。

音声信号の特性調整装置１００又は１００Ａで５．１チャンネルの音声信号を２２．２チャンネルにアップコンバートする際には、基本的には、２チャンネルの音声信号を２２．２チャンネルにアップコンバートする場合と同様に、フロントの左右のスピーカＬ，Ｒが出力する音声信号を第１音声信号として取り扱う。

そして、５．１チャンネルの場合の第１遅延時間は、２チャンネルの場合と同様に、チャンネル３〜２４のスピーカから出力される音声信号に与えるように設定し、チャンネル３〜２４のスピーカから出力される音声信号に与えればよい。

また、５．１チャンネルの場合の第２遅延時間は、２チャンネルの場合と同様に、チャンネル５、６、９、１１、１２、１６〜２２のスピーカ（ＢＬ、ＢＲ、ＢＣ、ＳｉＬ、ＳｉＲ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ）から出力される音声信号に与えればよい。

また、このときに、５．１チャンネルのスピーカＬｓ、Ｒｓと２２．２チャンネルのスピーカＳｉＬ、ＳｉＲ、ＢＬ、ＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＬ、ＴｐＢＲとのように、ホールにおける位置が５．１チャンネルのスピーカＬｓ、Ｒｓに比較的近いスピーカから出力する音声信号については、５．１チャンネルのスピーカＬｓ、Ｒｓから出力される音声信号の特性を加味してもよい。

例えば、２２．２チャンネルのスピーカＢＬから出力される音声信号については、スピーカＦＬ、ＦＲが出力する音声信号に第１遅延時間を与える。また、第１遅延時間が与えられた音声信号に、さらに、５．１チャンネルのスピーカＬｓの音声信号の５．１チャンネルのスピーカＬ、Ｒに対する遅延時間と、第２遅延時間とを所定の割合で合成した遅延時間を与えてもよい。

また、２２．２チャンネルのスピーカＢＬから出力される音声信号のゲインや周波数をイコライザ１４で設定する際に、５．１チャンネルのスピーカＬｓの音声信号のゲインや周波数を参考にして、ゲインや周波数を設定してもよい。

また、音声信号の特性調整装置１００又は１００Ａで７．１チャンネルの音声信号を２２．２チャンネルにアップコンバートする際には、基本的には、２チャンネルの音声信号を２２．２チャンネルにアップコンバートする場合と同様に、フロントの左右のスピーカＬ，Ｒが出力する音声信号を第１音声信号として取り扱う。

そして、７．１チャンネルの場合の第１遅延時間は、２チャンネルの場合と同様に、チャンネル３〜２４のスピーカから出力される音声信号に与えるように設定し、チャンネル３〜２４のスピーカから出力される音声信号に与えればよい。

また、７．１チャンネルの場合の第２遅延時間は、２チャンネルの場合と同様に、チャンネル５、６、９、１１、１２、１６〜２２のスピーカ（ＢＬ、ＢＲ、ＢＣ、ＳｉＬ、ＳｉＲ、ＴｐＣ、ＴｐＢＬ、ＴｐＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＣ、ＢｔＦＣ）から出力される音声信号に与えればよい。

また、このときに、７．１チャンネルのスピーカＬｓ、Ｒｓ、Ｌｂ、Ｒｂと２２．２チャンネルのスピーカＳｉＬ、ＳｉＲ、ＢＬ、ＢＲ、ＴｐＳｉＬ、ＴｐＳｉＲ、ＴｐＢＬ、ＴｐＢＲとのように、ホールにおける位置が７．１チャンネルのスピーカＬｓ、Ｒｓ、Ｌｂ、Ｒｂに比較的近いスピーカから出力する音声信号については、７．１チャンネルのスピーカＬｓ、Ｒｓ、Ｌｂ、Ｒｂから出力される音声信号の特性を加味してもよい。

例えば、２２．２チャンネルのスピーカＢＬから出力される音声信号については、スピーカＦＬ、ＦＲが出力する音声信号に第１遅延時間を与える。また、第１遅延時間が与えられた音声信号に、さらに、７．１チャンネルのスピーカＬｓとＬｂの音声信号の平均を取った音声信号の７．１チャンネルのスピーカＬ、Ｒに対する遅延時間と、第２遅延時間とを所定の割合で合成した遅延時間を与えてもよい。

また、２２．２チャンネルのスピーカＢＬから出力される音声信号のゲインや周波数をイコライザ１４で設定する際に、７．１チャンネルのスピーカＬｓ、Ｌｂの音声信号のゲインや周波数を参考にして、ゲインや周波数を設定してもよい。

以上のようにすることにより、５．１チャンネルや７．１チャンネルの音声信号を２２．２チャンネルに容易かつ簡単にアップコンバートすることができる。

図１４は、実施の形態の第１変形例のアップコンバータ１Ａの回路構成を示す図である。アップコンバータ１Ａは、２チャンネルのスピーカＬ，Ｒの音声信号と、５．１チャンネルのスピーカＬｓ、Ｌ、Ｃ、Ｒ、Ｒｓ、ＬＦＥの音声信号とのいずれかをアップコンバートできる構成を有する。

ここでは、５．１チャンネルのスピーカＬ，Ｒから出力される信号をチャンネル１、２として取り扱う。また、一例として、スピーカＣから出力される信号をチャンネル３として取り扱い、サブウーハーＬＦＥから出力される信号をチャンネル４、スピーカＬｓ、Ｒｓから出力される信号をチャンネル５、６として取り扱い、として取り扱う。

また、１チャンネル用から２４チャンネル用の２４個のＤＳＰ部１０Ａについては、１チャンネルのＤＳＰ部１０Ａについて、内部を詳細に示し、２チャンネル用から２４チャンネル用のＤＳＰ部１０Ａの図示を省略する。

アップコンバータ１は、入力端子２Ａ、２Ｂ、２Ｃ、アンプ３Ａ、３Ｂ、３Ｃ、分離器４Ａ、４Ｂ、４Ｃ、同期調整部５Ａ、５Ｂ、５Ｃ、ＳＲＣ(Sample Rate Converter)６Ａ、６Ｂ、６Ｃ、分離器７Ａ、７Ｂ、７Ｃ、バス８、入力端子９、ＤＳＰ(Digital Signal Processor)１０、エンコーダ２０、出力端子２１、マトリクス出力部２２Ａ、２２Ｂ、２２Ｃ、及びモニタ出力回路２３を含む。

アップコンバータ１Ａは、図９に示す２チャンネルの音声信号用のアップコンバータ１の入力端子２、アンプ３、分離器４、同期調整部５、ＳＲＣ６、分離器７、マトリクス出力部２２を、入力端子２Ａ、アンプ３Ａ、分離器４Ａ、同期調整部５Ａ、ＳＲＣ６Ａ、分離器７Ａ、マトリクス出力部２２Ａに置き換えるとともに、図９に示す２チャンネルの音声信号用のアップコンバータ１に対して、入力端子２Ｂ、２Ｃ、アンプ３Ｂ、３Ｃ、分離器４Ｂ、４Ｃ、同期調整部５Ｂ、５Ｃ、ＳＲＣ６Ｂ、６Ｃ、分離器７Ｂ、７Ｃ、マトリクス出力部２２Ｂ、２２Ｃを追加した構成を有する。

入力端子２Ａ、アンプ３Ａ、分離器４Ａ、同期調整部５Ａ、ＳＲＣ６Ａ、分離器７Ａ、マトリクス出力部２２Ａは、１、２チャンネルの音声信号用であり、入力端子２Ｂ、アンプ３Ｂ、分離器４Ｂ、同期調整部５Ｂ、ＳＲＣ６Ｂ、分離器７Ｂ、マトリクス出力部２２Ｂは、３、４チャンネルの音声信号用であり、入力端子２Ｃ、アンプ３Ｃ、分離器４Ｃ、同期調整部５Ｃ、ＳＲＣ６Ｃ、分離器７Ｃ、マトリクス出力部２２Ｃは、３、４チャンネルの音声信号用である。

入力端子２Ｂ、２Ｃ、アンプ３Ｂ、３Ｃ、分離器４Ｂ、４Ｃ、同期調整部５Ｂ、５Ｃ、ＳＲＣ６Ｂ、６Ｃ、分離器７Ｂ、７Ｃ、マトリクス出力部２２Ｂ、２２Ｃは、入力端子２Ａ、アンプ３Ａ、分離器４Ａ、同期調整部５Ａ、ＳＲＣ６Ａ、分離器７Ａ、マトリクス出力部２２Ａに対して並列に設けられている。

入力端子２Ａ、アンプ３Ａ、分離器４Ａ、同期調整部５Ａ、ＳＲＣ６Ａ、分離器７Ａ、マトリクス出力部２２Ａは、１、２チャンネルの音声信号用であるため、それぞれ、図９に示す入力端子２、アンプ３、分離器４、同期調整部５、ＳＲＣ６、分離器７、マトリクス出力部２２と同様である。

入力端子２Ｂ、２Ｃ、アンプ３Ｂ、３Ｃ、分離器４Ｂ、４Ｃ、同期調整部５Ｂ、５Ｃ、ＳＲＣ６Ｂ、６Ｃ、分離器７Ｂ、７Ｃで処理される３、４、５、６チャンネルの音声信号は、チャンネル３〜２４のスピーカから出力される音声信号の調整用に用いればよい。

また、２４個のＤＳＰ部１０Ａの各々は、５．１チャンネルに合わせて、２チャンネル用のＤＳＰ部１０Ａ（図９参照）とは構成が異なる。以下、相違点について説明する。

ＤＳＰ部１０Ａには、２チャンネルのスピーカＬ，Ｒの音声信号に加えて、５．１チャンネルのスピーカＬｓ、Ｌ、Ｃ、Ｒ、Ｒｓ、ＬＦＥが入力されるように配線されている。なお、ＬＦＥは、５．１チャンネルのサブウーハーである。

ＤＳＰ部１０Ａは、スイッチ１１Ａ、１１Ｂ、混合機(MIX)１１Ｃ、１１Ｄ、合成器１２、スイッチ１２Ａ、レベル調整部(LEVEL)１３、イコライザ(4band PEQ)１４、遅延部(DELAY)１５、スイッチ１６、マスターレベル調整部(MASTER LEVEL)１７、及びミュートスイッチ(MUTE)１８を含む。

スイッチ１１Ａ、１１Ｂは、スイッチ11Aと11Bは、入力信号がAESデジタル信号端子のものか、MADI信号端子から入力されたものか、いずれか一方を選択する。

スイッチ１１Ａ、１１Ｂは、２チャンネルのスピーカＬ，Ｒの音声信号と、５．１チャンネルのスピーカＬｓ、Ｌ、Ｃ、Ｒ、Ｒｓとのいずれか一方を選択することができ、２チャンネルを選択した場合は、図９に示すＤＳＰ部１０Ａと同様である。スイッチ１１Ａと１１Ｂで、ＭＡＤＩ入力を選択できるようにしているのは、５．１ｃｈ以上のチャンネル数を有するサラウンド信号を処理できるようにするためである。２チャンネルを選択した場合は、図９に示すＤＳＰ部１０Ａと同様である。

スイッチ１１Ａ、１１Ｂで５．１チャンネルのスピーカＬｓ、Ｌ、Ｃ、Ｒ、Ｒｓを選択する場合には、５．１チャンネルに含まれるＬＦＥ以外の５つの音声信号のうちのいずれか２つを選択することができる。

混合比設定部１１Ｃ及び１１Ｄは、それぞれ、スイッチ１１Ａ、１１Ｂで選択する２つの音声信号を混合する割合（比率）を調整する。調整する割合は、入力端子９に接続されるコンピュータシステム５１０又は内蔵コンピュータ１００Ｃから入力される制御信号ＭＩＸによって設定される。

合成器１２は、混合比設定部１１Ｃ及び１１Ｄから出力される２つの音声信号を混合する。

スイッチ１２Ａは、５．１チャンネルのスピーカＬＦＥ（サブウーハー）の音を選択するスイッチである。ＬＦＥｃｈに送る場合、ＬＦＥ−ＬとＬＦＥ−Ｒにはパラにして、同等の信号を送ることになる。

レベル調整部１３、イコライザ１４、遅延部１５、スイッチ１６、マスターレベル調整部１７、ミュートスイッチ１８、エンコーダ２０、出力端子２１は、図９に示すＤＳＰ部１０Ａと同様である。

図１５は、実施の形態の第１変形例におけるパラメータデータを選択するＧＵＩ画面を示す図である。このようなＧＵＩ画面は、コンピュータシステム５１０（図１参照）のディスプレイ５１２に表示される。

パラメータデータは、映像や音響信号の内容や種類に合わせて複数あり、音声信号の特性調整装置１００の利用者が選択できるようになっている。図１５には、複数あるパラメータデータのうちの１つ（Ｌ２００）を示す。

図１５には、１チャンネルから２４チャンネルまでの各チャンネルの、制御信号ＬＥＶＥＬ、ＭＩＸ、Ｃ０を示す。

ＭＩＸは、混合比設定部１１Ｃ及び１１Ｄが２つの音声信号を出力する割合（比率）を表す。混合比設定部１１Ｃ及び１１Ｄから出力される２つの音声信号は、合成器１２で合成（混合）される。

Ｃ０は、５．１チャンネルのスピーカＣの音声信号を合成（混合）する量を表しており、Ｃ０は、合成（混合）がゼロ（０）であることを示す。合成（混合）が増えると、Ｃの右の数値が増大する。Ｃ０は、５．１ｃｈのフロントＬｃｈとＲｃｈの音声信号を混合する制御項目であり、Ｃ＝０の表示の時は、Ｌ＋ＲつまりＬｃｈとＲｃｈの信号を等分に混ぜた状況を示す。また、表示例は、Ｃ０の他に、Ｌ−Ｍａｘ（Ｌｃｈを最大値に設定）、Ｌ５５（Ｌｃｈを５５％）、Ｌ１２（Ｌｃｈを１２％）、Ｒ１２（Ｒｃｈを１２％）、Ｒ５５（Ｒｃｈを５５％）、Ｒ−Ｍａｘ（Ｒｃｈを最大値に設定）がある。

このような実施の形態の第１変形例におけるパラメータデータを選択するＧＵＩ画面を用いて、２チャンネルのスピーカＬ，Ｒの音声信号と、５．１チャンネルのスピーカＬｓ、Ｌ、Ｃ、Ｒ、Ｒｓ、ＬＦＥの音声信号とのいずれかをアップコンバートすることができる。

実施の形態の変形例によれば、５．１チャンネル用の音声信号を２２．２チャンネル用にアップコンバートする際に、チャンネル１、２の音声信号の模擬的な一次反射波に相当する遅延時間を有する音声信号をチャンネル３〜２４用に生成することにより、二次反射波以上の高次反射波を用いなくても、２２．２チャンネルの音響システムに十分に対応できる音声信号を得ることができる。

なお、実施の形態の第１変形例では、５．１チャンネルの音声信号を２２．２チャンネルにアップコンバートする形態について説明したが、アップコンバートの元になる音声信号は、５．１チャンネルに限られず、例えば、７．１チャンネルであってもよい。

また、５．１チャンネルや５．１チャンネルに限らず、さらにサブフーハーの数が多い、５．２チャンネルや７．２チャンネル、７．４チャンネル等であってもよい。

また、実施の形態の第２変形例では、図１６を用いて、アップコンバータとダウンコンバータとを１つの装置にした構成について説明する。

図１６は、実施の形態の第２変形例による音声信号の特性調整装置１００Ｃの構成を示すブロック図である。

音声信号の特性調整装置１００Ｃは、音声信号の特性調整装置１００Ａにダウンコンバータを追加した構成を有する。より具体的には、音声信号の特性調整装置１００Ｃは、アップコンバータ１と、ダウンコンバータ２００とを含む。

アップコンバータ１には、２チャンネルの音声信号（ＳＴＥＲＥＯ）又は５．１チャンネルあるいは７．０チャンネル等（５．１ｃｈ〜）の音声信号が入力され、２２．２チャンネルにアップコンバートして出力する。

また、アップコンバータ１には、２２．２チャンネルの音声信号が入力され、２２．２チャンネルの音声信号をそのまま２２．２チャンネルの音声信号として出力し、ダウンコンバータ２００に入力する。ダウンコンバータ２００は、２２．２チャンネルの音声信号を２チャンネルの音声信号、又は、５．１チャンネルあるいは７．０チャンネル等（５．１ｃｈ〜）の音声信号にダウンコンバータして出力する。このようなダウンコンバータ２００としては、周知のものを用いればよい。

音声信号の特性調整装置１００Ｃは、音声信号の特性調整装置１００Ａと同様に、音声信号を２２．２チャンネルにアップコンバートできるとともに、２２．２チャンネルの音声信号をダウンコンバータ２００でダウンコンバートすることができる。このような音声信号の特性調整装置１００Ｃは、例えば、図３乃至図６に示す音声信号の特性調整装置１００Ａと同様に、１Ｕ（ワンユー）型の装置として実現することができる。

以上、本発明の例示的な実施の形態の音声信号の特性調整装置、音声信号の特性調整プログラム、及び、音声信号の特性調整方法について説明したが、本発明は、具体的に開示された実施の形態に限定されるものではなく、特許請求の範囲から逸脱することなく、種々の変形や変更が可能である。

１アップコンバータ
２入力端子
３アンプ
４分離器
５同期調整部
６ＳＲＣ
７分離器
８バス
９入力端子
１０ＤＳＰ
１０ＡＤＳＰ部
１１Ｌ、１１Ｒ混合比設定部
１２合成器
１３レベル調整部
１４イコライザ
１５遅延部
１６スイッチ
１７マスターレベル調整部
１８ミュートスイッチ
２０エンコーダ
２１出力端子
２２マトリクス出力部
２３モニタ出力回路
１００、１００Ａ音声信号の特性調整装置
１１０主制御部
１２０混合比制御部
１３０レベル制御部
１４０イコライザ制御部
１５０遅延制御部
１６０データベース

Claims

ディスプレイ、スクリーン、又はステージに対する奥行き方向及び幅方向に沿って配置される複数のスピーカから出力する第１の複数のチャンネルの音声信号を、前記第１の複数のチャンネルよりもチャンネル数の多い第２の複数のチャンネルの入力音声信号をアップコンバートして生成する際に、前記第２の複数のチャンネルの音声信号の特性を調整する、音声信号の特性調整装置であって、
前記第２の複数のチャンネルの音声信号のうち、前記奥行き方向における手前側で、前記ディスプレイ、前記スクリーン、又は前記ステージの脇に位置するスピーカから出力する第１音声信号以外の第２音声信号に、遅延時間を与える第１調整部と、
前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整する第２調整部と
を含み、
前記遅延時間は、前記第１音声信号の模擬一次反射波を生成するための第１遅延時間と、前記奥行き方向における手前側よりも後側に配置されるスピーカから出力される前記第２音声信号ほど長く設定される第２遅延時間との和に基づいて設定され、
前記ゲイン及び周波数は、前記奥行き方向における後側に配置されるスピーカから出力される前記第２音声信号ほど低く設定される、音声信号の特性調整装置。
前記第２調整部は、全帯域を複数に分けた各帯域について、前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整する、請求項１記載の音声信号の特性調整装置。
前記第２調整部は、周波数の増大に応じて、前記ゲインが増大又は減少するように、前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整する、請求項１又は２記載の音声信号の特性調整装置。
前記第２調整部は、上方に設置されたスピーカーに対応するチャンネルの音声信号ほど低域成分を低減し、前方の下方に設置かれたスピーカーに対応するチャンネルの音声信号ほど高域を低減するように、前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整する、請求項１乃至３のいずれか一項記載の音声信号の特性調整装置。
ディスプレイ、スクリーン、又はステージに対する奥行き方向及び幅方向に沿って配置される複数のスピーカから出力する第１の複数のチャンネルの音声信号を、前記第１の複数のチャンネルよりもチャンネル数の多い第２の複数のチャンネルの入力音声信号をアップコンバートして生成する際に、前記第２の複数のチャンネルの音声信号の特性を調整する、音声信号の特性調整プログラムであって、
コンピュータが、
前記第２の複数のチャンネルの音声信号のうち、前記奥行き方向における手前側で、前記ディスプレイ、前記スクリーン、又は前記ステージの脇に位置するスピーカから出力する第１音声信号以外の第２音声信号に、遅延時間を与えることと、
前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整することと
を実行し、
前記遅延時間は、前記第１音声信号の模擬一次反射波を生成するための第１遅延時間と、前記奥行き方向における手前側よりも後側に配置されるスピーカから出力される前記第２音声信号ほど長く設定される第２遅延時間との和に基づいて設定され、
前記ゲイン及び周波数は、前記奥行き方向における後側に配置されるスピーカから出力される前記第２音声信号ほど低く設定される、音声信号の特性調整プログラム。
ディスプレイ、スクリーン、又はステージに対する奥行き方向及び幅方向に沿って配置される複数のスピーカから出力する第１の複数のチャンネルの音声信号を、前記第１の複数のチャンネルよりもチャンネル数の多い第２の複数のチャンネルの入力音声信号をアップコンバートして生成する際に、前記第２の複数のチャンネルの音声信号の特性を調整する、音声信号の特性調整方法であって、
コンピュータが、前記第２の複数のチャンネルの音声信号のうち、前記奥行き方向における手前側で、前記ディスプレイ、前記スクリーン、又は前記ステージの脇に位置するスピーカから出力する第１音声信号以外の第２音声信号に、遅延時間を与えることと、
前記第２の複数のチャンネルの音声信号のゲイン及び周波数を調整することと
を実行し、前記遅延時間は、前記第１音声信号の模擬一次反射波を生成するための第１遅延時間と、前記奥行き方向における手前側よりも後側に配置されるスピーカから出力される前記第２音声信号ほど長く設定される第２遅延時間との和に基づいて設定され、
前記ゲイン及び周波数は、前記奥行き方向における後側に配置されるスピーカから出力される前記第２音声信号ほど低く設定される、音声信号の特性調整方法。