WO2003079724A1

WO2003079724A1 - Appareil de traitement d'un signal de localisation d'image sonore et procede de traitement dudit signal

Info

Publication number: WO2003079724A1
Application number: PCT/JP2003/003339
Authority: WO
Inventors: Takashi Matsushige
Original assignee: Sony Corporation
Priority date: 2002-03-20
Filing date: 2003-03-19
Publication date: 2003-09-25
Also published as: JP2003284196A

Description

明細書

音像定位信号処理装置および音像定位信号処理方法技術分野

本発明は、例えば、角度情報を有する映像信号に対応するォーディォ信号に仮想音源定位処理を行う音像定位信号処理装置およぴ音像定位信号処理方法に関するものである。背景技術

従来、全方位カメラと呼ばれる 3 6 0度の周囲の被写体を例えば 8画角に分割して連続処理して撮像するものがあった。この全方位カメラで撮像された 3 6 0度撮像映像は、特に視点を注視することなく 3 6 0度の周囲を撮像するため自由視点映像と呼ばれていた。この自由視点映像に対応する音は 3 6 0度の周囲の被写体の例えば 8画角に分割した映像に対して固定してステレオ音場を再現できるようにマイク口ホンを介して収音されていた。発明の開示

このように、上述した従来の自由視点映像に対するオーディオ信号の再生において、たとえ出力がステレオ音声出力信号であつたとしても、このようなステレオ音声出力信号を再生した場合に、通常音像は再生手段として用いる 2個のスピーカの間にのみ定位し、それ以外の方向には定位しない。

従って、再生時にテレビジョン受像機等のモニタ上に再生される映像を 3 6 0度撮像映像のうち角度を変化させて移動させて再生した場合には、音像が 3 6 0度の周囲の被写体の例えば 8画角に分割した映像に対して固定してしまい、音像がモニタに表示された移動している画像とは一致せずに、通常音像は再生する 2個のスピーカの間にのみ定位し、それ以外の方向には定位しないという不都合があった。なお、ゲーム機器において、音源および画像をデータとしてメモリに記憶して、メモリから読み出した画像に対する音源の位置を変化させるものがあるが、映像信号ゃォーディォ信号などのように、リアルタイムでストリームで読み出した画像に対してリアルタイムで音源の位置を変化させる技術が要求されていた。

そこで、本発明は、かかる点に鑑みてなされたものであり、自由視点映像に対するオーディオ信号の再生において、角度を変化させて映像を移動させて再生した場合にも移動する映像の方向に音像を定位させることができる音像定位信号処理装置および音像定位信号処理方法を提供することを課題とする。

本発明の音像定位信号処理装置は、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生時における再生音像を任意の位置に定位させるように制作時において複数の音源から入力される各音源データを合成手段により合成したォーディォ信号に信号処理を施す音像定位信号処理装置において、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択手段と、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理手段と、上記音像定位制御処理手段により信号処理を施すための制御情報を生成する制御情報生成手段と、上記映像信号に上記オーディォ信号および上記制御情報を重畳して送出用情報を生成する送出用情報生成手段とを備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたものである。また、本発明の音像定位信号処理装置は、複数の音源から入力される各音源データを合成手段により合成して制作時における制御情報により信号処理を施したオーディオ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生時において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理装置において、上記再生用情報における映像信号に重畳された上記オーディオ信号および上記制御情報から、上記映像信号、上記オーディオ信号および上記制御情報を読み出す再生用情報読み出し手段と、上記映像信号を再生する映像信号再生手段と、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択手段と、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理手段とを備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたものである。

また、本発明の音像定位信号処理方法は、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生時における再生音像を任意の位置に定位させるように制作時において複数の音源から入力される各音源データを合成手段により合成したオーディオ信号に信号処理を施す音像定位信号処理方法において、上記映像信号に基づく映像の再生音像の角度情報となるユーザ一の視点選択情報を選択する選択ステップと、上記選択ステツプにより選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディォ信号のチヤンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理ステップと、上記音像定位制御処理ステップにより信号処理を施すための制御情報を生成する制御情報生成ステップと、上記映像信号に上記オーディオ信号および上記制御情報を重畳して送出用情報を生成する送出用情報生成ステップとを備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたものである。

また、本発明の音像定位信号処理方法は、複数の音源から入力される各音源データを合成手段により合成して制作時における制御情報により信号処理を施したオーディオ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生時において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理方法において、上記再生用情報における映像信号に重畳された上記オーディオ信号および上記制御情報から、上記映像信号、上記オーディオ信号およぴ上記制御情報を読み出す再生用情報読み出しステップと、上記映像信号を再生する映像信号再生ステップと、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択ステップと、上記選択ステップにより選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理ステップとを備え、上記オーディォ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたものである, 従って本発明によれば、以下の作用をする。

制作系において、音像定位制御処理手段は、選択手段から映像の角度情報に対応した制御情報に基づいてオーディオ信号のチヤンネルに音像定位のための信号処理をリアルタイムで施す。

また、制御情報生成手段は、音像定位制御処理手段で映像の角度情報に対応してオーディオ信号のチャンネルに音像定位のための信号処理を施すための音像定位処理に用いた制御情報を格納する。

送出用情報生成手段は、映像信号にオーディオ信号および制御信号を用いて送出用のフォーマツトに基づいた送出用データを生成する。この送出用データは、再生系に転送される。

これにより、制作系において、オーディオ信号の任意のチャンネルに音像定位のための信号処理を施すためのリアルタイムの音像定位処理に用いた制御情報を生成して、自由視点映像の映像信号およぴォ一ディォ信号と共に再生系に転送することにより、自由視点映像の角度を変化させて映像を移動させて再生した場合に移動する映像の方向にオーディオ信号の再生音像を定位させることができる。

また、再生系において、音像定位制御処理手段は、選択手段から映像の角度情報に対応した制御情報に基づいて制作系から転送されたオーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す。

音像定位制御処理手段で映像の角度情報に対応した制御情報に基づいてオーディオ信号のチャンネルに音像定位のための信号処理を施された補正オーディオ信号は再生手段に出力される。再生手段は補正オーディオ信号を再生して映像の角度情報に対応した再生音像を出力する。

これにより、再生系において、オーディオ信号の任意のチャンネルに音像定位のための信号処理を施して捕正オーディオ信号を出力するための音像定位処理に用いた制御情報を用いて、自由視点映像の映像信号に対するオーディォ信号をリアルタイムで音像定位処理することにより、自由視点映像の角度を変化させて映像を移動させて再生した場合に移動する映像の方向にオーディオ信号の再生音像を定位させることができる。図面の簡単な説明

図 1 は、本実施の形態に適用される自由視点映像 · 音声制作再生システムの制作系の音像定位信号処理装置の構成を示すプロック図である。

図 2は、本実施の形態に適用される自由視点映像 · 音声制作再生システムの再生系の音像定位信号処理装置の構成を示すブロック図である。

図 3は、チャンネルマッピング部の構成を示すブロック図である。図 4は、 G U I アプリケーション画面を示す図である。

図 5は、操作メタデータの生成を示す図である。

図 6 は、時間メタデータの生成を示す図である。

図 7は、メタデータの記録フォーマットを示す図であり、図 7 A は 1 フレームの先頭、図 7 Bは 1 フレームの末尾、図 7 Cは各ァルバムの先頭に記録するものである。

図 8 は、 3 6 0度カメラ撮像映像を示す図である。

図 9 は、円周状カメラによる撮像を示す図である。

図 1 0は、時間軸上での動作モードの切り換えを示す図である。図 1 1 は、 H R T Fによる補正音像を示す図である。

図 1 2は、 H R T Fによる補正処理の構成図である。

図 1 3は、制作系のフローチャートである。

図 1 4は、再生系のフローチャートである。

図 1 5は、制作系のチャンネルマツビングの働きを示す図であり、図 1 5 Aはリアルサウンドの場合、図 1 5 Bはバーチャルサゥンドの場合、図 1 5 Cはリアルサウンドとパーチャルサウンドの組み合わせの場合である。

図 1 6 は、制作系と再生系のチャンネルマッピングのパリエーションを示す図であり、図 1 6 Aはィンパルス応答畳み込み型の場合、図 1 6 Bは 5 c h出力対応のリパーブ処理の場合である。発明を実施するための最良の形態

本実施の形態に適用される音像定位信号処理装置は、いわゆる自由視点映像におけるオーディオ信号の音場の再生においてユーザ一が視点を変更するに従って音像定位位置が変化するようにするために、映像コンテンツを制作するときにサウンドクリエータが映像に合わせてオーディオ信号の再生音像を定位させるための制御情報をォーサリング情報のメタデータとして再生側に伝送するようにしたものである。

本実施の形態に適用される音像定位信号処理装置について説明する。

図 1 は、自由視点映像 · 音声制作再生システムの制作系の音像定位信号処理装置の構成を示すプロック図である。

図 1 に示す音像定位信号処理装置は、自由視点映像の角度を変化させて映像を移動させて再生した場合に移動する映像の方向にオーディオ信号の再生音像を定位させるようにオーディオ信号を制御するメタデータを再生側に伝送する点が従来と大きく異なる点である。

図 1 において、制作系では、自由視点カメラのマイク素材 1やその他の素材 2が複数チャンネルのオーディオ入力としてミキサ 3 に入力される。自由視点カメラのマイク素材 1 は、自由視点映像に対応する音であり 3 6 0度の周囲の被写体の例えば 8画角に分割した映像に対して固定してステレオ音場を再現できるようにマイクロホンを介して収音される。その他の素材 2は、ドライ素材と呼ばれるものであり、スポットマイク素材、アフレコマイク素材またはサウンドエフェクト素材などである。

ミキサ 3は、サウンドクリエータが、自由視点カメラのマイク素材 1やその他の素材 2などの複数チャンネルの音源からのォーディォ入力を、自由視点ビューァ 4で映像データ 1 0の自由視点映像を 3 6 0度にわたって見ることにより映像の素材を見ながら各チャンネルに合成処理するように調整することができる音調整卓である。例えば Nチャンネル（例えば 2 4チャンネル）のォーディォ入力データを M (ぐ N ) チャンネル (例えば 4 〜 1 0チヤンネル）のオーディオ出力データに合成して調整する。

自由視点ビューァ 4では、視点選択部 5における視点を選ぶ操作キーの操作により自由視点映像の角度情報が選択される。視点選択部 5 における視点を選ぶ操作キーは、例えば操作キーの回転により角度情報の選択の動作をして操作キーの押圧により決定の動作をすることができるものである。

ミキサ 3 には機能プロックとしてチャンネルマツビング部 6 が設けられている。ミキサ 3からのオーディオ出力データはチャンネルマッピング部 6 に供給される。チャンネルマツビング部 6 には視点選択部 5から自由視点映像の角度情報が供給されている。そこで、チャンネルマッピング部 6 は、視点選択部 5から自由視点映像の角度情報に対応した制御情報に基づいてミキサ 3からのオーディオ出力データのチャンネルに音像定位のための信号処理をリアルタイムで施す。チャンネルマッピング部 6 は、例えば 4 〜 1 0チャンネルの合成された音源のオーディオデータを入力して、 2チャンネ /レ乃至 5 . 1 チャンネノレ、 6 チャンネル、 7チヤンネルなどのマルチオーディオデータを出力する。なお、チャンネルマツビング部 6 の詳細については後述する。

チャンネルマッピング部 6で自由視点映像の角度情報に対応した制御情報に基づいてオーディオデータのチャンネルに音像定位のための信号処理を施された捕正オーディオデータはオーディオモニタ 7に出力される。オーディオモニタ 7は補正オーディオデータを再生して自由視点映像の角度情報に対応した再生音像を出力する。なお、オーディオモニタ 7 は、左（ L )、右（R ) のステレオ音響を再生するスピーカ.、左（ L)、右（R) のステレオ音響を再生するへッドホン、左（ L)、右（R)、サラウンド左（ S L )、サラウンド右（ S R) の 4チャンネルのステレオ音響を再生するスピーカまたは左（ L )、右（R)、中央（ C )、サラウンド左（ S L)、サラウンド右（ S R)、サブウーハ（ S W) の 5. 1チャンネルのステレオ音響を再生するス.ピー力を用いてもよい。

また、チャンネルマッピング部 6 で自由視点映像の角度情報に対応してオーディオデータのチヤンネルに音像定位のための信号処理を施された捕正オーディオデータの音像定位処理に用いた制御情報は、ォーサリング情報のメタデータとしてメタデータ部 9 に供給される。

ミキサ 3からのオーディオ出力データは、オーディオレコーダ 8に供給され、オーディオレコーダ 8は、チャンネルマッピング部 6 からの例えば同期信号に同期してオーディオデータを送出用のフォーマツトにストリーム化する。

オーディオインターリーブ部 1 1 は、映像データ 1 0にストリーム化されたオーディオデータおよびメタデータ部 9からのメタデータをィンターリーブ処理して送出用のフォーマツトに基づいた送出用データ 1 2を生成する。この送出用データ 1 2は、例えば、インターネット 1 3または記録媒体 1 4 を介して後述する再生系に転送される。

これにより、制作系において、オーディオデータの任意のチヤンネルに音像定位のための信号処理を施して補正オーディオデータを出力するためのリアルタイムの音像定位処理に用いた制御情報を生成して、自由視点映像の映像データおょぴオーディオデータと共に再生系に転送することにより、自由視点映像の角度を変化させて映像を移動させて再生した場合に移動する映像の方向にオーディオ信号の再生音像を定位させることができる。図 2は、自由視点映像 · 音声制作再生システムの再生系の音像定位信号処理装置の構成を示すプロック図である。

図 2 において、再生系では、上述した図 1 に示した制作系から、例えば、インターネット 1 3または記録媒体 1 4を介して転送された送出用データ 1 2が再生用データ 2 1 として入力される。送出用のフォーマツトに基づいた再生用データ 2 1 の中から映像データ、オーディオデータおよびメタデータが読み出されて、映像データはビデオプレーヤ 2 2に供給され、オーディオデータは図示しないオーディオプレーヤに設けられたチャンネルマッピング部 2 4に供給され、図示しないオーディオプレーヤに設けられたメタデータはメタデータ部 2 5に供給される。

ビデオプレーヤ 2 2では、視点選択部 2 3 における視点を選ぶ操作キーの操作により自由視点映像の角度情報が選択される。ビデォプレーヤ 2 2で再生された自由視点映像は視点選択部 2 3 により選択された角度情報に基づいた映像が再生される。視点選択部 2 3 における視点を選ぶ操作キーは、例えば操作キーの回転により角度情報の選択の動作をして操作キーの押圧により決定の動作をすることができるものである。

チャンネルマッピング部 2 4には視点選択部 2 3から自由視点映像の角度情報およびメタデータ部 2 5から制御情報としてのメタデータが供給されている。そこで、チャンネルマッピング部 2 4 は、視点選択部 2 3から自由視点映像の角度情報に対応した制御情報としてのメタデータに基づいて制作系から転送されたォーディォデータのチャンネルに音像定位のための信号処理をリアルタイムで施す。チャンネルマッピング部 2 4は、例えば 4〜 1 0 チャンネルの合成された音源のオーディオデータを入力して、 2 チャンネノレ乃至 5 . 1 チャンネル、 6 チャンネノレ、 7チャンネノレなどのマルチオーディオデータを出力する。なお、チャンネルマッビング部 2 4の詳細については後述する。

チャンネルマッピング部 2 4で自由視点映像の角度情報に対応した制御情報としてのメタデータに基づいてオーディオデータのチャンネルに音像定位のための信号処理を施された補正オーディォデータはオーディオモニタ 2 7に出力される。オーディオモニタ 2 7は補正オーディオデータを再生して自由視点映像の角度情報に対応した再生音像を出力する。なお、オーディオモニタ 2 7 は、左（ L )、右（R)のステレオ音響を再生するスピーカ、左（ L)、右（R) のステレオ音響を再生するへッドホン、左（ L )、右（R)、サラウンド左（ S L)、サラウンド右（ S R) の 4チャンネルのステレオ音響を再生するスピーカまたは左（ L )、右（R)、中央（C )、サラウンド左（ S L )、サラウンド右（ S R)、サブウーハ（ S W) の 5. 1チャンネルのステレオ音響を再生するスピーカを用いてもよい。

これにより、再生系において、オーディオデータの任意のチヤンネルに音像定位のための信号処理を施して補正オーディオデータを出力するための音像定位処理に用いた制御情報を用いて、自由視点映像の映像データに対するオーディオデータをリアルタイムで音像定位処理することにより、自由視点映像の角度を変化させて映像を移動させて再生した場合に移動する映像の方向にォーディォ信号の再生音像を定位させることができる。

以下に、チャンネルマッピング部の詳細について説明する。図 3は、チャンネルマッピング部の構成を示すブロック図である。

図 3 において、チャンネルマッピング部は、音像定位信号処理を施すオーディオ信号のチャンネルの指定に応じた動作モードを設定する動作モード設定部 3 1 と、視点選択部 5 により選択されたユーザーの視点選択情報に対応するフレーム画像を設定するトラック設定部 3 2 と、選択されたフレーム画像に対応するオーディォ信号に信号処理を施すパラメータを設定するパラメータ設定部 3 3 とを有して構成される。

動作モード設定部 3 1 は、複数のチャンネルのオーディオ信号のうちすベてのチャンネルに音像定位信号処理を施す第 1 の動作モードの固定チャンネルモード 3 1 — 1 と、複数のチャンネルのオーディオ信号のうち特定のチャンネルのみを指定して音像定位信号処理を施して他のチャンネルは信号処理を施さない第 2 の動作モードの非固定チャンネルモード 3 1 一 2 とを有して構成される。

トラック設定部 3 2 は、視点選択部 5 により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように、映像信号のフレーム処理を行うフレーム処理部 3 2 - 1 と、水平角度処理を行う水平角度処理部 3 2 - 2 と、ズーム処理を行うズーム処理部 3 2 — 3 と、垂直角度処理を行う垂直角度処理部 3 2 一 3 とを有して構成される。トラック設定部 3 2は、上述した構成により動作モード設定部 3 1 からの動作モード A Mおよび視点選択部 5からの視点選択情報 Vに応じてオーディオ信号に信号処理を施すための操作信号 Cを生成する。なお、これらの構成は、すべて用いてもよいし、これに限らず、処理に応じて何れかを選択して用いてもよい。

パラメータ設定部 3 3は、トラック設定部 3 2からの操作信号 Cに基づいて、オーディオ信号に所定のパラメータにより位相等化のィコライジング処理を行うィコライジング処理部 3 3 — 1 と残響のリバーブ処理を行うリバーブ処理部 3 3 - 2 と、音量処理を行う音量処理部 3 3 - 3 と、音像の移動のパン処理を行うパン処理部 3 3 — 4 と、 H R T F (頭部伝達関数： H e a d R e 1 a t e d T r a n s f o r m F u n c t i o n ) によりユーザ一の耳に到達する伝達関数を変更することにより音響特性処理を施す H R T F処理部 3 3 - 5 とを有して構成される。

なお、これらの構成は、すべて用いてもよいし、これに限らず、処理に応じて何れかを選択して用いてもよい。ここで、パラメ一タ設定部 3 3 に供給される操作信号。に応じて、パラメータ設定部 3 3の各処理部に対する制御情報となるメタデータ M Dが生成される。メタデータ M D の生成については後述する。

ここで、 H R T F処理部について説明する。

例えば、リスナの周囲に置かれた 5個の音源からリスナの両耳に至る 5系統のステレオインパルス応答を使用して、 5組のステレオ音源データを得ることができる。例えば、リスナの左前方の音源からリスナの両耳までのインパルス応答による伝達関数を入力信号に対して畳み込む第 1 の音源と、リスナの左後方の音源からリスナの両耳までのインパルス応答による伝達関数を入力信号に対して畳み込む第 2 の音源に対して信号処理を施す場合を説明する。

クリエィターが視点選択部 5 により、音像位置を第 1 の音源から第 2の音源に移動する移動情報を入力したとき、チャンネルマッビング部 6 のトラック設定部 3 2 はこの移動情報を角度パラメ —タあるいは位置パラメータに変換し、変換されたパラメータに応じた操作信号 Cをパラメータ設定部 3 3に供給する。

この操作信号 Cにより、パラメータ設定部 3 3 は、第 1 の音源と第 2の音源から距離または角度の比で各処理部のレベル値をク口スフヱ一ドするように処理する。

次に、 H R T F処理部の詳細な構成および動作について説明する。

ミキサ 3から出力されるオーディオ信号のディジタル信号列のうち左のディジタル信号 Lは、一対の左用畳み込み積分器おょぴメモリのうちの畳み込み積分器に供給される。ここでは、畳み込み積分器に付属するメモリには、リスナの現在頭部が向いている方向の、頭部の規準方向に対する、仮想音源位置から両耳に至る一定のサンプリング周波数および量子化ビット数で表されるデジタル記録された一組のィンパルスレスポンスが呼び出されているディジタル信号列は、畳み込み積分器において、このメモリより読み出されたィンパルスレスポンスとリアルタイムで畳み込み積分される。また、一対の右クロストーク用畳み込み積分器およびメモリは右のデイジタル信号 Rのクロストーク成分を供給する。上記と同様に右のディジタル信号 Rは、一対の右用畳み込み積分器およびメモリのうちの畳み込み積分器に供給される。ここでは、畳み込み積分器に付属するメモリには、リスナの現在頭部が向いている方向の、頭部の規準方向に対する、仮想音源位置から両耳に至る一定のサンプリング周波数および量子化ビット数で表されるデジタル記録された一組のィンパルスレスポンスが記憶されている。ディジタル信号列は、畳み込み積分器において、このメモリより読み出されたインパルスレスポンスとリアルタイムで畳み込み積分される。また、一対の左クロストーク用畳み込み積分器おょぴメモリは左のディジタル信号 Lのクロストーク成分を供給する。

また、一対の右クロストーク用畳み込み積分器およびメモリ、一対の左クロストーク用畳み込み積分器およびメモリにおいても上述と同様にインパルスレスポンスと畳み込み積分が行なわれるこのように、一対の左用、一対の右クロストーク用、一対の右用、一対の左ク口ストーク用畳み込み積分器およびメモリにおいてィンパルスレスポンスと畳み込み積分が行なわれたディジタル信号列は、加算器にそれぞれ供給される。加算器で加算された 2チヤンネルのディジタル信号は適応処理フィルタによりリスナの個人差による耳の形状の相違、ノイズ、用いる音源固有の特性等を除くように補正される。

上例では、メモリに H R T F としてのインパルスレスポンスが記憶されている例を示したが、畳み込み積分器に付属するメモリに、規準方向に対して固定された頭部の、仮想音源位置から両耳に至る一対のディジタル記憶されたィンパルスレスポンスを記憶させてもよい。この場合、ディジタル信号列はこのインパルスレスポンスとリアルタイムで畳み込み積分される。他のメモリには、頭部の規準方向に対する仮想音源位置から両耳に至る両耳間の時間差、レベル差を表す制御信号を記憶させる。

そして、この畳み込み積分された各チャンネルのディジタル信号の各々に対して、更に検出された規準方向に対する頭部運動を、一定単位角度毎あるいは予め定められた角度毎に、方向を含む大きさを表すディジタルァドレス信号に変換し、このァドレス信号により予め他のメモリに記憶された制御信号を読みだし、制御装置において、リアルタイムで補正し、変更するようにして、その結果を加算器に供給するようにしても良い。

また、このインパルスレスポンスとリアルタイムで畳み込み積分されたディジタル信号列を加算器に供給し、加算器からの 2チヤンネルのディジタル信号に対して、更に検出された規準方向に対する頭部運動を、一定単位角度毎あるいは予め定められた角度毎に、方向を含む大きさを表すディジタルァドレス信号に変換し、このァドレス信号により予め他のメモリに記憶された制御信号を読みだし、制御装置において、リアルタイムで補正し、変更するようにしても良い。

ここで、制御装置としては、可変遅延装置と可変レベル制御器、あるいは多バンドに分割されたグラフィックイコライザ等の周波数帯域毎のレベル制御器との組み合わせで構成することができる, また、他のメモリに記憶されている情報は、リスナの頭部が向いている方向の、頭部の規準方向に対する、仮想音源位置から両耳に至る両耳間の時間差及ぴレベル差等を表すインパルスレスボンスでも良い。この場合には、上述の制御装置は、 I I R、あるいは F I Rの可変ディジタルフィルターで構成すれば良い。従って、制御装置を用いて H R T F としてのインパルスレスポンスの値を変化させるようにすればよい。

このようにして制御装置により、空間情報が与えられ、適応処理フィルタによりリスナの個人差による耳の形状の相違、ノイズ、用いる音源及ぴヘッドホンの固有の特性を補正され、かつ頭部の動きに対して変化の与えられる。

このようにして視点選択部 5 においてリスナの規準方向に対する頭部運動を一定角度あるいは予め定められた角度毎に検出し、アドレス制御回路において方向を含む大きさを表すディジタルァドレス信号に変換する。

このァドレス信号により予めメモリに記録されている頭部の基準方向に対する仮想音源位置から両耳に至るディジタル記録されたインパルスレスポンスが、また他のメモリからは両耳間の時間差および両耳間のレベル差を表す制御信号あるいはインパルスレスポンスを読み出す。畳み込み積分器または制御装置において、このインパルスレスポンスまたは制御信号と音響信号とをリアルタイムで補正し変更する。

この畳み込み積分器おょぴメモリまたは制御装置および加算器により、音場としての空間情報を持った両耳への 2 チャンネルのディジタル信号に変換され、適応処理フィルタによりリスナの個人差による耳の形状の相違、ノイズ、用いる音源の特性等が補正され、電力増幅器で電力増幅された後、スピーカに供給される。これにより、あたかもその仮想音源位置に置かれたスピーカから再生音が聞こえるような再生効果を実現することができるものである。

そして、この場合、リスナが自由視点ビューァ 4を用いて自由視点映像を動かすと、視点選択部 5 により、その向きに従ったデイジタル信号、またはアナログ信号が得られ、これによりその信号は自由視点映像に対するリスナの視点の向きに従った値となる, この値がァドレス制御回路を通じてメモリにァドレス信号として供給される。

メモリ力らは、テーブルに対応したデータのうち、自由視点映像に対するリスナの視点の向きに対応した規準方向に対する仮想音源位置から両耳に至るディジタル記録されたィンパルスレスポンスまたは両耳間の時間差及び両耳間のレベル差を表す制御信号が取りだされ、このデータが畳み込み積分器または制御装置に供給される。

視点選択部 5からの角度情報に基づいてメモリから自由視点映像に対するリスナの視点の向きに対応した頭部の規準方向に対する仮想音源位置から両耳に至るディジタル記録されたィンパルスレスポンスまたは両耳間の時間差及び両耳間のレベル差を表す制御信号が取りだされ、このデータが畳み込み積分器または制御装置に供給される。

このようにして、スピーカに供給されるオーディオ信号 L， R は、自由視点映像に対するリスナの視点の向きに対応した規準方向に対する仮想音源位置から两耳に至るディジタル記録されたィンパルスレスポンスまたは両耳間の時間差及ぴ両耳間のレベル差を表す制御信号との補正が行なわれるので、自由視点映像に対するリスナの視点の移動に対しても、移動した方向に複数個のスピ一力が仮想音源位置に置かれてこのスピーカで再生しているような音場感を得ることが出来る。更にメモリのテーブルにディジタル記録された両耳間の時間差及ぴ両耳間のレベル差を表す制御信号が取りだされ、このデータが畳み込み積分器おょぴメモリにより予め畳み込まれたディジタル信号に対して、制御装置で補正するように、純電子的に供給されるので、リスナの頭の向きに対するオーディオ信号の特性の変化に遅れを生じることがなく、不自然さを生じることはない。

さらに、 H R T Fのデータは、次にようにして得ることができる。すなわち自由視点映像に対してスピーカでオーディオ信号を再生したときに好ましい再生音場となるよう、適当な室内に、必要なチャンネル数のインパルス音源とダミーへッドマイクロホンを定められた位置に配置する。この場合のィンパルスを測定する音源としてはスピーカを用いてもよい。

またダミーへッドの各耳の収音位置に関しては、外耳道入り口から鼓膜位置までの間の何れの位置でもよいが、用いる音源の固有の特性を打ち消すための捕正特性を求める位置と等しいことが要求される。

また制御信号の測定は、各チャンネルのスピーカ位置よりインパルス音を放射し、一定角度毎にダミーへッドの各耳に設けられたマイクロホンで収音することにより得られる。従ってある角度においては、 1 つのチャンネノレ毎に 1 糸且のインノノレスレスポンスが得られることになるから、仮に 5 チャンネルの信号源の場合は、 1つの角度毎に 5組、すなわち 1 0種の制御信号が得られることになる。従って、これらのレスポンスにより、左右両耳間の時間差及ぴレベル差を表す制御信号が得られる。

更に、上述においては、リスナの頭の水平面内における向きについてのみ考慮したが垂直面内および、これらと直交する面内における向きについても同様に処理することも出来る。

またメモリにおけるテーブルは 1組とし、ァドレス制御回路においてそのテーブルに対するアドレスの指定を変更して複数組のテーブルがある場合と同様に制御データを得ることも出来る。

更に、テーブルのデータは、一般的な自由視点映像に対するリスナの視点の向きの範囲に限ってもよく、また、角度，，は、例えば、，， = 0 °付近では 0 . 5 °おきに設定しておき、 i，， " 4 5 ° Iでは 3 °おきに設定するというように、向きによって角度，，の間隔を異ならせてもよい。上述したように、リスナが自由視点映像に対するリスナの視点の回転の角度を識別できる角度毎でょレ、。更に、へッドホンの代わりに、リスナ両耳の近くに配置したスピーカでもよい。

図 4は、 G U I (G r a h i c a l U s e r I n t e r f a c e ) アプリケーション画面を示す図である。図 4は、図 1 に示した視点選択部 5 による自由視点ビューァ 4の表示状態およぴ図 3に示したチャンネルマッピング部の設定の状態を示すものである。

図 4において、 GU I アプリケーション画面 4 1上では、動作モード設定部 4 2が設けられていて、サウンドクリエータが動作モード設定部 4 2 のアイコンをクリックすることにより、図 3 に示したように、複数のチャンネルのオーディオ信号のうちすベてのチャンネルに音像定位信号処理を施す第 1 の動作モードの固定チャンネルモード 3 1 - 1 と、複数のチャンネノレのオーディオ信号のうち特定のチャンネルのみを指定して音像定位信号処理を施して他のチャンネルは信号処理を施さない第 2の動作モードの非固定チャンネルモード 3 1 一 2 とを選択して設定することができる。

また、 G U I アプリケーション画面 4 1上では、トラック設定部 4 3が設けられていて、サウンドクリエータがトラック設定部 4 3のアイコンをタリックすることにより、視点選択部 5 により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように、映像信号の時間情報に応じたフレームを移動してフレーム処理を行うフレーム処理部 4 3 - 1 と、水平角度処理を行う水平角度処理部 4 3 - 2 と、ズーム処理を行うズーム処理部 4 3 - 3 と、垂直角度処理を行う垂直角度処理部 4 3 - 3 とを所定のフレーム画像の設定状態に設定することができる。なお、ここでは、トラック設定部 4 3が図ュに示した視点選択部 5 に対応し、この設定に応じてこの G U I アプリケーション画面 4 1 の下層または上層にウィンドウ表示される自由視点ビューァ 4の表示状態が自由視点映像の 3 6 0度にわたって変化する。

また、 G U I アプリケーション画面 4 1上では、パラメータ設定部 4 4が設けられていて、サウンドクリエータがパラメータ設定部 4 4のアイコンをクリックすることにより、図 3 に示したトラック設定部 3 2からの操作信号 Cに基づいて、オーディオ信号に所定のパラメータによりィコライジング処理を行うィコライジング処理部 4 4 - 1 と、リパーブ処理を行うリバーブ処理部 4 4 一 2 と、音量処理を行う音量処理部 4 4— 3 と、パン処理を行うパン処理部 4 4 - 4 と、 H R T Fによりユーザーの耳に到達する伝達関数を変更することにより音響特性処理を施す H R T F処理部 4 4 - 5 とをトラック設定部 4 3 で設定されたフレーム画像に対するオーディオ信号に対して信号処理状態に設定することができる。このパラメータ設定部 4 4による設定に応じて捕正オーディォデータを得ることができる。

以下に、メタデータの生成について詳細に説明する。

図 5は、操作メタデータの生成を示す図である。図 5 の構成は信号処理を施すオーディオ信号の各チャンネル毎に設けられる。

図 5 において、図 3 に示したトラック設定部 3 2からの操作情報 Cがパラメータ設定部 3 3のイコライザ処理部 3 3 — 1、リバープ処理部 3 3 — 2、音量処理部 3 3 — 3 、パン処理部 3 3 — 4、 H R T F処理部 3 3 — 5に供給される。各処理部にはオーディオデータ A I が連続して入力される。各処理部で操作信号 Cに基づいて信号処理を施されて捕正オーディオデータ A Oが出力される, この際のイコライザ処理部 3 3 — 1 に対する例えば操作情報 C の角度情報に応じた高周波数帯域または低周波数帯域におけるィコライザ処理の低下のための操作メタデータ、リパーブ処理部 3 3 — 2 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、音量処理部 3 3 — 3に対する例えば操作情報 Cの角度情報に応じた音量の高低の操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3 - 5 に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータを各々取り出して、各角度情報に対応させて操作メタデータ部 M Cに格納する。

これにより、ユーザーの視野の角度情報に応じたチャンネルマッビング部におけるオーディオ信号に対する信号処理機能を変化させることができる操作メタデータを生成することができる。

なお、これらの各処理部の構成は、すべて用いてもよいし、これに限らず、処理に応じて何れかを選択して用いてもよいが、この場合には、選択された処理部の操作メタデータを各角度情報に対応させて操作メタデータ部 M Cに格納する。

図 6 は、時間メタデータの生成を示す図である。図 6 の構成は信号処理を施すオーディオ信号の各チャンネル毎に設けられる。

図 6 において、図 3 に示したトラック設定部 3 2からの操作情報 Cがパラメータ設定部 3 3 のここでは図示しないイコライザ処理部 3 3 — 1、リバーブ処理部 3 3 — 2、音量処理部 3 3 — 3 を経た後に、図 6 においてパン処理部 3 3— 4、 H R T F処理部 3 3— 5に供給される。各処理部にはオーディオデータ A I が連続して入力される。各処理部で操作信号 Cに基づいて信号処理を施されて捕正オーディオデータ A Oが出力される。

この際のここでは図示しないイコライザ処理部 3 3 - 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるィコライザ処理の低下のための時間メタデータリパーブ処理部 3 3 _ 2に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための時間メタデータ、音量処理部 3 3 — 3に対する例えば操作情報 Cの角度情報に応じた音量の高低の操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、 H R T F処理部 3 3 一 5 に対する例えば操作情報 Cの時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータを各々取り出して、各時間情報に対応させて時間メタデータ部 M Tに格納する。

これにより、時間軸の変化による時間情報に応じたチャンネルマッピング部におけるオーディオ信号に対する信号処理機能を変化させることができる時間メタデータを生成することができる。

なお、これらの各処理部の構成は、すべて用いてもよいし、これに限らず、処理に応じて何れかを選択して用いてもよいが、この場合には、選択された処理部の時間メタデータを各時間情報に対応させて時間メタデータ部 M Tに格納する。

図 7は、メタデータの記録フォーマットを示す図であり、図 7 Aは 1 フレームの先頭、図 7 Bは 1 フレームの末尾、図 7 Cは各アルバムの先頭に記録するものである。

まず、第 1 のメタデータの記録フォーマットでは、図 7 Aにおいて、映像データ V I 、 V 2、 V 3、 V 4、 V 5 にオーディオデータがインターリーブされた 1 フレームの先頭にメタデータ M l を記録する。従って、再生系では、 1 フレームのデータを検出してバッファに保持し、その先頭部分を読み出せば、メタデータ M 1 を読み出すことができる。

次に、第 2のメタデータの記録フォーマットでは、図 7 Bにおいて、映像データ V I、 V 2、 V 3、 V 4、 V 5 にオーディオデータがインターリーブされた 1 フレームの末尾にメタデータ M 2 を記録する。従って、再生系では、 1 フレームのデータを検出してバッファに保持し、その末尾部分を読み出せば、メタデータ M 2を読み出すことができる。

さらに、第 3のメタデータの記録フォーマットでは、図 7 Cにおいて、曲を示すアルバムの先頭にメタデータ M l 1、 M l 2、 M l 3 を記録する。従って、再生系では、各アルバムのデータを検出してバッファに保持し、その先頭部分を読み出せば、メタデータ M l 1 、 M l 2、 M l 3 を読み出すことができる。

なお、メタデータの記録フォーマットは、これに限らず、ディスク状記録媒体の管理情報を記憶する T O C ( T a b 1 e O f C o n t e n t s ) 部分に記録してもよい。

図 8は、 3 6 0度カメラ撮像映像を示す図である。

図 8 において、全方位力メラ 8 1 は 3 6 0度の周囲の被写体を例えば 8画角に分割して連続処理して撮像する。全方位カメラ 8 1 により撮像された 3 6 0度カメラ撮像映像 8 2は、基準位置◦ に対して前方中央方向の角度情報，，を有するステージ 8 3上の歌手 8 4および演奏者 8 5 の映像を示すエリア E 1 と、基準位置 O に対して前方左方向の角度情報，，を有する観客 8 6 の映像を示すエリア E 2 と、基準位置 Oに対して左横方向の角度情報，，を有する観客 8 6 の映像を示すエリァ E 3 と、基準位置 Oに対して後方左方向の角度情報，，を有する観客 8 6 の映像を示すエリア E 4 と基準位置 Oに対して後方中央方向の角度情報，，を有する観客 8 6 の映像を示すエリア E 5 と、基準位置 Oに対して後方右方向の角度情報，，を有する観客 8 6の映像を示すエリア E 6 と、基準位置 Oに対して右横方向の角度情報，，を有する観客 8 6 の映像を示すエリア E 7 と、基準位置 Oに対して前方右方向の角度情報，，を有する観客 8 6の映像を示すエリァ E 8 とを有して構成される。

図 1 に示した制作系のチャンネルマッピング部 6 により視点選択部 5 による角度情報，，に応じてオーディオ信号に映像の移動と同期した音像定位の信号処理を施すことにより、 3 6 0度カメラ撮像映像 8 2 のエリア E 1 〜エリア E 8 までの角度情報，，による反時計方向の映像の移動に対応して滑らかに音像を反時計方向に移動させることができる。

これにより、ェリァ E 1 における基準位置 Oに対する前方中央方向の角度情報，，を有するステージ 8 3上の歌手 8 4および演奏者 8 5の映像に対して前方中央方向のステージ 8 3上の歌手 8 4 およぴ演奏者 8 5の音像が定位し、エリア E 2における基準位置 Oに対する前方左方向の角度情報，，を有する観客 8 6 の映像に対して前方左方向の観客 8 6の音像が定位し、エリア E 3における基準位置 Oに対する左横方向の観客 8 6の映像に対して左横方向の観客 8 6 の音像が定位し、エリア E 4における基準位置 Oに対する後方左方向の角度情報，，を有する観客 8 6 の映像に対して後方左方向の観客 8 6 の音像が定位し、エリア E 5 における基準位置 Oに対する後方中央方向の角度情報，，を有する観客 8 6 の映像に対して後方中央方向の観客 8 6の音像が定位し、エリア E 6における基準位置 Oに対する後方右方向の角度情報，，を有する観客 8 6 の映像に対して後方右方向の観客 8 6 の音像が定位し、エリァ E 7における基準位置 Oに対する右横方向の角度情報，，を有する観客 8 6 の映像に対して右横方向の観客 8 6 の音像が定位し、エリア E 8における基準位置 Oに対する前方右方向の角度情報，，を有する観客 8 6 の映像に対して前方右方向の観客 8 6の音像が連続して定位する。

逆に、 3 6 0度カメラ撮像映像 8 2のエリア E 1 〜エリア E 2 までの角度情報，，による時計方向の映像の移動に対応して滑らかに音像を時計方向に移動させることができる。

これにより、エリア E 1 における'基準位置 Oに対する前方中央方向の角度情報，，を有するステージ 8 3上の歌手 8 4および演奏者 8 5の映像に対して前方中央方向のステージ 8 3上の歌手 8 4 および演奏者 8 5 の音像が定位し、エリア E 8 における基準位置 Oに対する前方右方向の角度情報，，を有する観客 8 6 の映像に対して前方右方向の観客 8 6の音像が定位し、エリア E 7における基準位置 Oに対する右横方向の角度情報，，を有する観客 8 6の映像に対して右横方向の観客 8 6 の音像が定位し、エリア E 6 における基準位置 Oに対する後方右方向の角度情報，，を有する観客 8 6 の映像に対して後方右方向の観客 8 6 の音像が定位し、エリア E 5 における基準位置 Oに対する後方中央方向の角度情報，，を有する観客 8 6 の映像に対して後方中央方向の観客 8 6 の音像が定位し、エリア E 4における基準位置 Oに対する後方左方向の角度情報，，を有する観客 8 6 の映像に対して後方左方向の観客 8 6 の音像が定位し、エリア E 3 における基準位置 Oに対する左横方向の観客 8 6の映像に対して左横方向の観客 8 6の音像が定位し、エリア E 2における基準位置 Oに対する前方左方向の角度情報，, を有する観客 8 6 の映像に対して前方左方向の観客 8 6の音像が連続して定位する。

また、このときの角度情報は、水平方向の角度情報，，に限らず、垂直方向の角度情報，，を指定することができる。これにより、 3 6 0度カメラ撮像映像 8 2のエリア E 1 〜エリア E 8の映像に対してチヤンネルマツビング部で音像の定位を 3次元空間で処理することができる。

各信号処理の制御量は、 3 6 0度カメラ撮像映像 8 2を撮像するコンテンツでは、全方位カメラ 8 1 の基準位置 Oに対して移動する角度情報，，に応じて、図 3 に示したパン処理部 3 3 — 4により音像の定位角度が比例して動くように処理される。

また、全方位カメラ 8 1 の基準位置 Oに対して前方から後方または後方から前方に移動すると移動距離に応じて、図 3に示す音量処理部 3 3 — 3 により音像の音量が小さくまたは大きくなるように処理される。

また、全方位力メラ 8 1 の基準位置 Oに対して前方から後方または後方から前方に移動すると移動距離に応じて、図 3に示すィコライザ処理部 3 3 — 1 により高周波数帯域のイコライザ処理を低下させて高周波数帯域の音を下げるようにしまたは高周波数帯域のイコライザ処理を向上させて高周波数帯域の音を上げるように処理される。

また、全方位カメラ 8 1 の基準位置 Oに対して前方から後方または後方から前方に移動すると移動距離に応じて、図 3に示すリパーブ処理部 3 3 — 2によりリバーブ処理が深くかかるようにしまたはリバープ処理が浅くかかるように処理される。

また、全方位カメラ 8 1 の基準位置 Oに対して前方から後方または後方から前方にズーム処理により移動すると移動距離に応じて、図 3 に示す H R T F処理部 3 3 — 5 により音像が遠くなるように値が変更されてまたは音像が近くなるように値が変更されるように処理される。

なお、全方位カメラに限らず、後述する円周状カメラを用いてもよい。

図 9は、円周状カメラによる撮像を示す図である。図 9 において、被写体である歌手 9 2に対して、基準位置 Oに対して角度情報，，に応じて、円周状カメラ 9 1 — 1 、 9 1 一 2、 9 1 — 3、 9 1 一 4、 9 1 - 5 , 9 1 一 6、 9 1 — 7、 9 1 一 8 を設けて、角度情報，，を有する円周状映像データを撮像する。なお、円周状カメラに限らず、一部分の円弧状カメラを用いてもよい。なお、これら場合にも、このときの角度情報は、水平方向の角度情報，，に限らず、垂直方向の角度情報，，を指定することができる。これにより、円周状または円弧状撮像映像の各エリアの映像に対してチャンネルマッピング部で音像の定位を 3次元空間で処理することができる。

図 1 0は、時間軸上での動作モードの切り換えを示す図である。図 1 0 において、時間軸 t に沿って、モード 1 ( 1 0 1 )、モード 2 ( 1 0 2 )、モード 1 ( 1 0 3 )、 · · · の切り換えを行う。ここで、モード 1 ( 1 0 1 )、モード 1 ( 1 0 3 ) は、図 3 に示したチャンネルマッピング部の動作モード設定部 3 1 により設定される、複数のチャンネルのオーディオ信号のうちすベてのチャンネルに音像定位信号処理を施す第 1 の動作モードの固定チャンネルモード 3 1 — 1 であり、モード 2 ( 1 0 2 ) は、複数のチャンネルのオーディオ信号のうち特定のチャンネルのみを指定して音像定位信号処理を施して他のチャンネルは信号処理を施さない第 2 の動作モードの非固定チャンネルモード 3 1 - 2である。

これにより、時間軸上で第 1 の動作モードの固定チャンネルモード 3 1 - 1 と第 2の動作モードの非固定チャンネルモード 3 1 — 2 とを切り換えることができ、自由視点映像のシーンの切り換え時などにおけるオーディオ信号に対する音像定位処理の態様を多様にすることができる。例えば、第 1 の動作モードの固定チヤンネルモード 3 1 - 1 としては、図 8 に示した 3 6 0度カメラ撮像映像 8 2において、歌手 8 4および演奏者 8 5のオーディオ信号のうちすベてのチャンネルに音像定位信号処理を施し、第 2 の動作モードの非固定チャンネノレモード 3 1 _ 2 としては、図 8 に示した 3 6 0度カメラ撮像映像 8 2 において、歌手 8 4のオーディォ信号のチャンネルにのみ音像定位信号処理を施し、演奏者 8 5のオーディオ信号のチャンネルには音像定位信号処理を施さずに固定とするようにする。

図 1 1 は、 H R T Fによる捕正音像を示す図である。

図 1 1 において、再生時にリスナ 1 1 1 は、ビデオモニタ 1 1 2に再生される自由視点映像の角度情報に対応して、スピーカ L、 R、 S L、 S Rにより再生される再生音像 1 1 3 を聴取する。ここで、ビデオモニタ 1 1 2 に再生される自由視点映像がズーム映像となって例えばステージ上の歌手がリスナ 1 1 1 の右耳元に近づいてささやくと、図 3に示す H R T F処理部 3 3 — 5により音像がリスナ 1 1 1 の右耳に近くなるように値が変更されるように処理されることにより、リスナ 1 1 1 の右耳元に補正音像 1 1 4 が定位するように処理される。

図 1 2は、 H R T Fによる捕正処理の構成図である。

図 1 2において、オーディオデータ A I がパン処理部 1 2 1 に供給され、パン処理部 1 2 1 によりパン処理が施されて左右ステレオオーディオデータ R、 Lおよびサラウンドオーディオデータ S L、 S Rが出力される。この状態では、スィッチ S W 1 2 3、 S W 1 2 4の出力側はパン処理部 1 2 1側に接続されている。ここで、ビデオモニタ 1 1 2 に再生される自由視点映像がズーム映像となって例えばステージ上の歌手がリスナ 1 1 1 の右耳元に近づいてささやくと、オーディオデータ A I がオンとなったスイッチ S W 1 1 を介して H R T F処理部 1 2 2に供給され、 H R T F処理部 1 2 2 により周波数伝達特性の処理が施されてスイツチ S W 1 2 3、 1 2 4に供給されて捕正オーディオデータ AOとして左右ステレオオーディオデータ R、 Lが出力される。この状態では、スィッチ S W 1 2 3、 S W 1 2 4の出力側は H R T F処理部側に接続されている。

このように構成された自由視点映像 · 音声制作再生システムの制作系および再生系の動作を説明する。

図 1 3は、制作系の動作を.示すフローチヤ一トである。

図 1 3において、ステップ S 1 で、入出力装置（ I Oデバイス）の初期化を行う。具体的には、初期値の代入やオペレーティングシステム（ O S ) 上の例えば G U I アプリケーションの起動を行つて制御プログラムの読み込みなどを行う。

ステップ S 2で、映像ファイルの指定を行う。具体的には、図 1 に示す自由視点映像の映像データ 1 0の中からコンテンツの制作を行う映像ファイルを指定する。

ステップ S 3で、動作モードの指定を行う。具体的には、図 4 に示す G U I アプリケーション画面 4 1 においてサウンドクリエータが動作モード設定部 4 2のアイコンをクリックすることにより、図 3 に示したように、複数のチャンネルのオーディオ信号のうちすベてのチャンネルに音像定位信号処理を施す第 1 の動作モ一ドの固定チャンネルモード 3 1 一 1 または複数のチャンネノレのオーディオ信号のうち特定のチャンネルのみを指定して音像定位信号処理を施して他のチャンネルは信号処理を施さない第 2の動作モードの非固定チャンネルモード 3 1 - 2を選択して設定する, ステップ S 4で、固定チャンネルまたは移動チャンネルの割り当てを行う。具体的には、まず、 G U I アプリケーション画面 4 1 においてサウンドクリエータがトラック設定部 4 3のアイコンをクリックすることにより、視点選択部 5 により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように映像信号の時間情報に応じたフレームを移動してフレーム処理を行うフレーム処理部 4 3— 1 と、水平角度処理を行う水平角度処理部 4 3— 2 と、ズーム処理を行うズーム処理部 4 3 — 3 と、垂直角度処理を行う垂直角度処理部 4 3 - 3 とを選択されたフレーム画像の設定状態に設定する。なお、ここでは、トラック設定部 4 3が図 1 に示した視点選択部 5 に対応し、この設定に応じてこの GU I アプリケーション画面 4 1 の下層または上層にウインドゥ表示される自由視点ビューァ 4の自由視点映像の 3 6 0度にわたって変化する表示状態により、選択されたフレーム画像の設定状態に設定する。

次に、 GU I アプリケーション画面 4 1 でサウンドクリエータがパラメータ設定部 4 4のアイコンをクリックすることにより、図 3 に示したトラック設定部 3 2からの操作信号 Cに基づいて、オーディオ信号に所定のパラメータによりィコライジング処理を行うィコライジング処理部 4 4 - 1 と、リバーブ処理を行うリバーブ処理部 4 4一 2 と、音量処理を行う音量処理部 4 4 _ 3 と、ノン処理を行うノン処理部 4 4 - 4 と、 H R T Fによりユーザーの耳に到達する伝達関数を変更することにより音響特性処理を施す H R T F処理部 4 4 - 5 とをトラック設定部 4 3で設定されたフレーム画像に対する各チャンネルのオーディオ信号に対した信号処理状態に設定することができる。このパラメータ設定部 4 4 による設定に応じて移動チャンネルまたは固定チャンネルとを設定する。

ステップ S 5で、映像の再生をスタートする。具体的には、 G U I アプリケーション画面 4 1 の下層または上層にウィンドウ表示される自由視点ビューァ 4の自由視点映像の 3 6 0度にわたつて変化して表示状態にする映像信号による映像の再生をスタートする。これと同時にオーディォ信号による音響の再生もスタートする。ステップ S 6で、時間メタデータの記録モードキーであるタイムキー 4 5が押された時の時間メタデータの記録モードであるか否かを判断する。具体的には、パラメータ設定部が、図 5で示したイコライザ処理部 3 3 _ 1 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための操作メタデータ、リパーブ処理部 3 3 一 2に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、音量処理部 3 3 — 3 に対する例えば操作情報 Cの角度情報に応じた音量の高低の操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3 — 5 に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータによる信号処理があるか、または、パラメータ設定部が、図 6で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるィコライザ処理の低下のための時間メタデータ、リバーブ処理部 3 3 — 2に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるリバーブ処理の低下のための時間メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、または H R T F処理部 3 3 — 5 に対する例えば操作情報 C の時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータによるものであるか否かを判断する。

ステップ S 6で時間メタデータの記録モードでないときは、ステツプ S 7へ進み、ステップ S 7で、操作メタデータによるチヤンネルマッビング信号処理部の操作があるか否かを判断する。具体的には、図 5で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 cの角度情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための操作メタデータ、リバーブ処理部 3 3 — 2 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、パン処理部 3 3 一 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3 _ 5に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータによる信号処理があるか否かを判断する。

ステップ S 7で、操作メタデータによるチャンネルマッピング信号処理部の操作があるときは、ステップ S 8へ進み、ステップ S 8で、視点情報と操作情報をメタデータとして記録する。具体的には、図 5で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための操作メタデータ、リパーブ処理部 3 3 — 2に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3 — 5に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータを各々取り出して、各角度情報に対応させて操作メタデータ部 M Cに格納する。

ステップ S 6で時間メタデータの記録モードであるときは、ステツプ S 1 0へ進み、ステップ S 1 0で、時間メタデータによるチャンネルマッピング信号処理部の操作があるか否かを判断する具体的には、図 6で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるィコライザ処理の低下のための時間メタデータ、リパーブ処理部 3 3 — 2に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための時間メタデータ、パン処理部 3 3 一 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、 H R T F処理部 3 3 — 5に対する例えば操作情報 Cの時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータを各々取り出して、各時間情報に対応させて時間メタデータ部 M Tに格納するものであるか否かを判断する。

ステップ S 1 0で、時間メタデータによるチャンネルマツピング信号処理部の操作があるときは、ステップ S 1 1へ進み、時間情報と操作情報をメタデータとして記録する。具体的には、図 6 で示したイコライザ処理部 3 3 - 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるィコライザ処理の低下のための時間メタデータ、リバーブ処理部 3 3 _ 2に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるリバーブ処理の低下のための時間メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、 H R T F 処理部 3 3 — 5 に対する例えば操作情報 Cの時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータを各々取り出して、各時間情報に対応させて時間メタデータ部 M Tに格納する。

ステップ S 9で、映像の再生をストップするか否かを判断する。ステップ S 9で、映像の再生をストップしないときは、ステップ S 6へ戻ってステップ S 6 の判断を繰り返す。ステップ S 9で、映像の再生をストップするときは、ステップ S 1 2へ進んで、ステツプ S 1 2で、映像および音響の再生を止める。図 1 4は、再生系の動作を示すフローチャートである。

図 1 4 において、ステップ S 2 1 で、入出力装置（ I Oデパイス）の初期化を行う。具体的には、初期値の代入やオペレーティングシステム（ O S ) 上の例えば G U I アプリケーションの起動を行って制御プログラムの読み込みなどを行う。

ステップ S 2 2で、映像ファイルの指定を行う。具体的には、図 2 に示すビデオプレーヤ 2 2 の映像データの中からコンテンツの再生を行う映像ファイルを指定する。

ステップ S 2 3で、映像の再生をスタートする。具体的には、ビデオプレーヤ 2 2の再生動作によりビデオモニタ 2 6に表示される自由視点映像のうちの視点選択部 2 3の選択による角度情報に対応する映像信号による映像の再生をスタートする。これと同時にオーディオ信号による音響の再生もスタートする。

ステップ S 2 4で、時間メタデータの再生モードであるか否かを判断する。具体的には、パラメータ設定部が、図 5で示したィコライザ処理部 3 3 - 1 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための操作メタデータ、リパーブ処理部 3 3 - 2 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3 一 5 に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータによる信号処理があるか、または、パラメータ設定部が、図 6で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための時間メタデータ、リバーブ処理部 3 3 一 2に対する例えば操作情報 cの時間情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための時間メタデータ、パン処理部

3 3 — 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、または H R T F処理部 3 3 - 5 に対する例えば操作情報 Cの時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータによるものであるか否かを判断する。

ステップ S 2 4で、時間メタデータによる再生モードでないときは、 .ステップ S 2 5へ進み、ステップ S 2 5で、視点情報と一致したら操作情報を信号処理部に送って変更する。具体的には、操作メタデータによる再生モードのとき、視点選択部 2 3 の選択による角度情報と対応するように、図 5で示したイコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための操作メタデータ、リパーブ処理部 3 3 _ 2に対する例えば操作情報 Cの角度情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための操作メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの角度情報に応じた音の位置の移動のための操作メタデータ、 H R T F処理部 3 3₍— 5に対する例えば操作情報 Cの角度情報に応じた周波数伝達特性の向上または低下のための操作メタデータによる信号処理を施す。

ステップ S 2 4で、時間メタデータによる再生モードであるときは、ステップ S 2 7へ進み、ステップ S 2 7で、時間になったら操作情報を信号処理部に送って変更する。具体的には、時間メタデータによる再生モードのとき、時間情報と対応するように、図 6 で示したィコライザ処理部 3 3 — 1 に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるイコライザ処理の低下のための時間メタデータ、リバーブ処理部 3 3 — 2に対する例えば操作情報 Cの時間情報に応じた高周波数帯域または低周波数帯域におけるリパーブ処理の低下のための時間メタデータ、パン処理部 3 3 — 4に対する例えば操作情報 Cの時間情報に応じた音の位置の移動のための時間メタデータ、 H R T F処理部 3 3 — 5 に対する例えば操作情報 Cの時間情報に応じた周波数伝達特性の向上または低下のための時間メタデータにより信号処理を施す。

ステップ S 2 6で、映像の再生をストップするか否かを判断する。ステップ S 2 6で、映像の再生をストップしないときは、ステツプ S 2 4へ戻ってステップ S 2 4の判断を繰り返す。ステツプ S 2 6で、映像の再生をストップするときは、ステップ S 2 8 へ進んで、ステップ S 2 8 2で、映像および音響の再生を止める。

図 1 5は、制作系のチャンネルマッピングの働きを示す図であり、図 1 5 Aはリアルサウンドの場合、図 1 5 Bはバーチャルサゥンドの場合、図 1 5 Cはリアルサウンドとノーチャルサウンドの組み合わせの場合である。

図 1 5 Aにおいて、リアルサウンドの場合には、操作情報 Cにより、イコライザ処理部 3 3 _ 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、リバーブ処理部 3 3 — 2に対する高周波数帯域または低周波数帯域におけるリパーブ処理の低下、音量処理部 3 3 — 3 に対する音量の低下、サラウンドパン処理部 1 5 1 に対するサラウンド音響の位置の移動により信号処理を施す。これにより、例えば、 4チャンネルまたは 5チヤンネルなどのリアルサラウンドマルチ出力を得ることができる, 図 1 5 Bにおいて、パーチャルサウンドの場合には、操作情報 Cにより、イコライザ処理部 3 3 — 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、リバーブ処理部 3 3 — 2に対する高周波数帯域または低周波数帯域におけるリバーブ処理の低下、音量処理部 3 3 — 3 に対する音量の低下、 H R T F処理部 3 3 一 5 に対する周波数伝達特性の向上または低下により信号処理を施す。これにより、例えば、選択設定されたォーディォ信号のチャンネルに対して任意の位置に再生音像を定位させることができる。

図 1 5 Cにおいて、リアルサゥンドとバーチャルサゥンドの糸且み合わせの場合には、スィッチ S W 2 1、 SW 2 2、 S W 2 3 SW 2 4の切り替えに応じて、操作情報 Cにより、イコライザ処理部 3 3— 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、リパーブ処理部 3 3— 2 に対する高周波数帯域または低周波数帯域におけるリパーブ処理の低下、音量処理部 3 3— 3 に対する音量の低下、サラウンドパン処理部 1 5 1 に対するサラウンド音響の位置の移動により信号処理を施すことにより、リアルサラウンドの出力を得る場合と、操作情報 Cにより、イコライザ処理部 3 3 — 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、リバーブ処理部 3 3— 2に対する高周波数帯域または低周波数帯域におけるリバーブ処理の低下、音量処理部 3 3 — 3 に対する音量の低下、 HR T F処理部 3 3— 5 に対する周波数伝達特性の向上または低下により信号処理を施す。

これにより、バーチャルサラウンドの出力を得る場合とを選択的に切り換えることができるので、リアルサラウンドの再生をしているときに、 S W 2 1 、 S W 2 2、 SW 2 3、 S W 2 4の切り換えを行うことにより、選択設定されたオーディオ信号のチャンネルに対してのみ任意の位置に再生音像を定位させることができる。

このときにも、例えば、操作情報 Cに基づいて、角度情報が 4 5度で音響を 3 d B下げる視点操作メタデータ 1 5 5 を記録するようにし、また、操作情報 Cおよび時間情報 1 5 4に基づいて、 1分 3 0秒 1 5 フレームでモード 1 からモード 2に切り換える時間メタデータを記録するようにしてもよい。

なお、図 1 5 Aおよび図 1 5 Bの場合にも同様に、操作メタデータまたは時間メタデータを記録するようにしてもよい。

図 1 6は、制作系と再生系のチャンネルマッピングのバリエ一シヨンを示す図であり、図 1 6 Aはインパルス応答畳み込み型の場合、図 1 6 Bは 5 c h出力対応のリバーブ処理の場合である。

図 1 6 Aにおいて、インパルス応答畳み込み型の場合には、ィコライザ処理部 3 3 — 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、音量処理部 3 3 — 3に対する音量の低下、インパルス応答畳み込み型のサラウンドパン処理部 1 6 1 に対するインパルス応答が畳み込まれたサラウンド音響の位置の移動により信号処理を施すことにより、インパルス応答畳み込み型のサラウンドパン処理部 1 6 1 の中にリパーブ処理部が含まれるため、リバーブ処理部を設ける必要が無くなる。これにより、補正されたサラゥンドチャンネルを有する 5 チャンネル出力を得ることができる。

図 1 6 Bにおいて、 5 c h出力対応のリパーブ処理の場合には、イコライザ処理部 3 3 — 1 に対する高周波数帯域または低周波数帯域におけるイコライザ処理の低下、音量処理部 3 3 — 3 に対する音量の低下、サラウンドパン処理部 1 6 1 に対するィンパルス応答が畳み込まれたサラウンド音響の位置の移動に対して加算器 1 6 3〜 1 6 7 を用いて並列的にリパーブ処理部 3 3— 2に対する高周波数帯域または低周波数帯域におけるリバープ処理の低下により信号処理を施して加算することにより、各チャンネルについてリバーブ処理を行って捕正されたサラゥンドチャンネルを有する 5 チャンネル出力を得ることができる。なお、上述した実施の形態に示した例に限らず、本発明の特許請求の範囲であれば、適宜他の例を用いることができることはいうまでもない。

この発明の音像定位信号処理装置は、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系における再生音像を任意の位置に定位させるように制作系において複数の音源から入力される各音源データを合成手段により合成したォ一ディォ信号に信号処理を施す音像定位信号処理装置において、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択手段と、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理手段と、上記音像定位制御処理手段により信号処理を施すための制御情報を生成する制御情報生成手段と、上記映像信号に上記オーディオ信号おょぴ上記制御情報を重畳して送出用情報を生成する送出用情報生成手段とを備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたので、自由視点映像に対するオーディオ信号の再生において、角度を変化させて映像を移動させて再生した場合にも移動する映像の方向に音像を定位させるようにするための制御を制作時に行うことができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、複数のチャンネルの上記オーディオ信号のうちすベてのチャンネルに上記音像定位制御処理手段により信号処理を施す第 1 の動作モードと、複数のチャンネルの上記オーディオ信号のうち特定のチャンネルのみを指定して上記音像定位制御処理手段により信号処理を施して他のチャンネルは上記信号処理を施さない第 2 の動作モードとを設定する動作モード設定手段を有するので、動作モードに応じてチャンネル毎に音像定位を可能とすることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように上記映像信号のフレーム処理、水平角度処理、ズーム処理おょぴ /または垂直角度処理により上記オーディオ信号に上記信号処理を施すための操作信号を生成するトラック設定手段を有するので. 選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように、映像信号の画像の処理をして生成された操作信号によりオーディオ信号に信号処理を施すようにすることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、上記トラック設定手段からの上記操作信号に基づいて、上記オーディオ信号に所定のパラメータによりィコライジング処理、リパーブ処理、音量処理、パン処理および Zまたは伝達特性処理を施すパラメータ設定手段を有するのでパラメータに応じてオーディオ信号に信号処理を施すようにして音像定位を変化させることができるという効果を奏する。

'また、この発明の音像定位信号処理装置は、上述において、上記制御情報生成手段は、上記視点選択情報に対応するパラメータにより上記制御情報を生成するので、視点選択情報に対応する制御情報により音像定位を変化させることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記制御情報生成手段は、時間軸情報に対応するパラメータにより上記制御情報を生成するので、時間情報に対応する制御情報により音像定位を変化させることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、上記動作モード設定手段により上記第 1 の動作モードと上記第 2 の動作モードとを時間軸上で切り換えるので、時間軸上で第 1 の動作モードの固定チャンネルモードと第 2の動作モードの非固定チャンネルモードとを切り換えることができ、自由視点映像のシーンの切り換え時などにおけるォーディォ信号に対する音像定位処理の態様を多様にすることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、複数のチャンネルの上記オーディオ信号のうちバーチャルサラウンドのチャンネルのみを指定して上記信号処理を施して他のリアルサラウンドのチャンネルは上記信号処理を施さないので、バーチャルサラウンドの出力を得る場合とを選択的に切り換えることができるので、リアルサラウンドの再生をしているときに、切り換えを行うことにより、選択設定されたオーディオ信号のチャンネルに対してのみ任意の位置に再生音像を定位させることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、複数の音源から入力される各音源データを合成手段により合成して制作系における制御情報により信号処理を施したオーディオ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理装置において、上記再生用情報における映像信号に重畳された上記オーディォ信号および上記制御情報から、上記映像信号、上記オーディオ信号および上記制御情報を読み出す再生用情報読み出し手段と、上記映像信号を再生する映像信号再生手段と、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択手段と、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理手段とを備え、上記オーディオ信号にリアルタィムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたので、自由視点映像に対するォ一ディォ信号の再生において、角度を変化させて映像を移動させて再生した場合にも移動する映像の方向に音像を定位させることができるという効果を奏する。

また、この発明の音像定位信号処理装置は、上述において、上記音像定位制御処理手段は、上記視点選択情報に対応して、上記オーディオ信号に所定のパラメータにより少なくともサラウンドパン処理を施すパラメータ設定手段を有するので、補正されたサラゥンドチャンネルを有する出力を得ることができるとレ、う効果を奏する。

また、この発明の音像定位信号処理方法は、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系における再生音像を任意の位置に定位させるように制作系において複数の音源から入力される各音源データを合成手段により合成したオーディォ信号に信号処理を施す音像定位信号処理方法において、上記映像信号に基づく映像の再生音像の角度情報となるュ一ザ一の視点選択情報を選択する選択ステップと、上記選択ステップにより選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理ステツプと、上記音像定位制御処理ステップにより信号処理を施すための制御情報を生成する制御情報生成ステップと、上記映像信号に上記オーディオ信号および上記制御情報を重畳して送出用情報を生成する送出用情報生成ステップとを備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたので、自由視点映像に対するオーディオ信号の再生において、角度を変化させて映像を移動させて再生した場合にも移動する映像の方向に音像を定位させるようにするための制御を制作時に行うことができるという効果を奏する。

また、この発明の音像定位信号処理方法は、複数の音源から入力される各音源データを合成手段により合成して制作系における制御情報により信号処理を施したオーディオ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理方法において、上記再生用情報における映像信号に重畳された上記オーディオ信号および上記制御情報から、上記映像信号、上記オーディオ信号おょぴ上記制御情報を読み出す再生用情報読み出しステップと、上記映像信号を再生する映像信号再生ステップと、上記映像信号に基づく映像の再生音像の角度情報となるユーザーの視点選択情報を選択する選択ステップと、上記選択ステップにより選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理ステップとを備え、上記ォーディォ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたので、自由視点映像に対するオーディオ信号の再生において、角度を変化させて映像を移動させて再生した場合にも移動する映像の方向に音像を定位させることができるという効果を奏する。産業上の利用の可能性

全方位カメラと呼ばれる 3 6 0度の周囲の被写体を例えば 8画角に分割して連続処理して撮像するもので撮像された 3 6 0度撮像映像は、特に視点を注視することなく 3 6 0度の周囲を撮像するため自由視点映像と呼ばれ、この自由視点映像に対するオーディォ信号の再生において、本発明は利用される。

Claims

請求の範囲

1 . 基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系における再生音像を任意の位置に定位させるように制作系において複数の音源から入力される各音源データを合成手段により合成したオーディオ信号に信号処理を施す音像定位信号処理装置において、

上記映像信号に基づく映像の再生音像の角度情報となるユーザ一の視点選択情報を選択する選択手段と、

上記選択手段により選択された再生音像の角度情報となるユーザ一の視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理手段と、

上記音像定位制御処理手段により信号処理を施すための制御情報を生成する制御情報生成手段と、

上記映像信号に上記オーディォ信号および上記制御情報を重畳して送出用情報を生成する送出用情報生成手段と、

を備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたことを特徴とする音像定位信号処理装置。

2 . 請求の範囲 1記載の音像定位信号処理装置において、上記音像定位制御処理手段は、複数のチャンネルの上記オーディォ信号のうちすベてのチャンネルに上記音像定位制御処理手段により信号処理を施す第 1 の動作モードと、複数のチャンネルの上記オーディオ信号のうち特定のチャンネルのみを指定して上記音像定位制御処理手段により信号処理を施して他のチヤンネルは上記信号処理を施さない第 2 の動作モードとを設定する動作モード設定手段を有することを特徴とする音像定位信号処理装置。

3 . 請求の範囲 1記載の音像定位信号処理装置において、上記音像定位制御処理手段は、上記選択手段により選択された再生音像の角度情報となるユーザーの視点選択情報に対応するように、上記映像信号のフレーム処理、水平角度処理、ズーム処理およぴノまたは垂直角度処理により上記オーディオ信号に上記信号処理を施すための操作信号を生成するトラック設定手段を有することを特徴とする音像定位信号処理装置。

4 . 請求の範囲 3記載の音像定位信号処理装置において、上記音像定位制御処理手段は、上記トラック設定手段からの上記操作信号に基づいて、上記オーディオ信号に所定のパラメータによりィコライジング処理、リパーブ処理、音量処理、パン処理および Zまたは伝達特性処理を施すパラメータ設定手段を有することを特徴とする音像定位信号処理装置。

5 . 請求の範囲 1記載の音像定位信号処理装置において、上記制御情報生成手段は、上記視点選択情報に対応するパラメータにより上記制御情報を生成することを特徴とする音像定位信号処理装置。

6 . 請求の範囲 1記載の音像定位信号処理装置において、上記制御情報生成手段は、時間軸情報に対応するパラメータにより上記制御情報を生成することを特徴とする音像定位信号処理装置。

7 . 請求の範囲 2記載の音像定位信号処理装置において、上記音像定位制御処理手段は、上記動作モード設定手段により上記第 1 の動作モードと上記第 2 の動作モードとを時間軸上で切り換えるようにすることを特徴とする音像定位信号処理装置。

8 . 請求の範囲 4記載の音像定位信号処理装置において、上記音像定位制御処理手段は、複数のチャンネルの上記オーディォ信号のうちバーチャルサラゥンドのチャンネルのみを指定して上記信号処理を施して他のリアルサラゥンドのチャンネルは上記信号処理を施さないことを特徴とする音像定位信号処理装置。

9 . 請求の範囲 1記載の音像定位信号処理装置において、上記音像定位制御処理手段は、上記視点選択情報に対応して、上記オーディオ信号に所定のパラメータにより少なくともサラウンドパン処理を施すパラメータ設定手段を有することを特徴とする音像定位信号処理装置。

1 0 . 複数の音源から入力される各音源データを合成手段により合成して制作系における制御情報により信号処理を施したォーディォ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理装置において、

上記再生用情報における映像信号に重畳された上記オーディオ信号および上記制御情報から、上記映像信号、上記オーディオ信号および上記制御情報を読み出す再生用情報読み出し手段と、上記映像信号を再生する映像信号再生手段と、

1 1 . 請求の範囲 1 0記載の音像定位信号処理装置において、上記音像定位制御処理手段は、上記視点選択情報に対応して、上記オーディオ信号に所定のパラメータにより少なくともサラウンドパン処理を施すパラメータ設定手段を有することを特徴とする音像定位信号処理装置。

1 2 . 基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系における再生音像を任意の位置に定位させるように制作系において複数の音源から入力される各音源データを合成手段により合成したオーディオ信号に信号処理を施す音像定位信号処理方法において、

上記映像信号に基づく映像の再生音像の角度情報となるユーザ一の視点選択情報を選択する選択ステップと、

上記選択ステップにより選択された再生音像の角度情報となるユーザーの視点選択情報に対応する上記オーディオ信号のチャンネルに音像定位のための信号処理をリアルタイムで施す音像定位制御処理ステップと、

上記音像定位制御処理ステップにより信号処理を施すための制御情報を生成する制御情報生成ステップと、

上記映像信号に上記オーディオ信号およぴ上記制御情報を重畳して送出用情報を生成する送出用情報生成ステップと、

を備え、上記オーディオ信号にリアルタイムで信号処理を施して上記映像信号に基づく映像に対応して音像定位位置を制御するようにしたことを特徴とする音像定位信号処理方法。

1 3 . 複数の音源から入力される各音源データを合成手段により合成して制作系における制御情報により信号処理を施したォーディォ信号について、基準位置に対して角度情報を有する映像信号に基づく映像に対応するように再生系において再生音像を任意の位置に定位させるように再生用情報に信号処理を施す音像定位信号処理方法において、

上記再生用情報における映像信号に重畳された上記オーディオ信号および上記制御情報から、上記映像信号、上記オーディオ信号および上記制御情報を読み出す再生用情報読み出しステップと上記映像信号を再生する映像信号再生ステップと、