JP6274244B2 - 収音再生装置、収音再生プログラム、収音装置及び再生装置 - Google Patents

収音再生装置、収音再生プログラム、収音装置及び再生装置 Download PDF

Info

Publication number
JP6274244B2
JP6274244B2 JP2016072376A JP2016072376A JP6274244B2 JP 6274244 B2 JP6274244 B2 JP 6274244B2 JP 2016072376 A JP2016072376 A JP 2016072376A JP 2016072376 A JP2016072376 A JP 2016072376A JP 6274244 B2 JP6274244 B2 JP 6274244B2
Authority
JP
Japan
Prior art keywords
area
sound
integrated
imaging
sound collection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2016072376A
Other languages
English (en)
Other versions
JP2017184154A (ja
Inventor
一浩 片桐
一浩 片桐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2016072376A priority Critical patent/JP6274244B2/ja
Publication of JP2017184154A publication Critical patent/JP2017184154A/ja
Application granted granted Critical
Publication of JP6274244B2 publication Critical patent/JP6274244B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、収音再生装置、収音再生プログラム、収音装置及び再生装置に関し、例えば複数のエリア内の音をそれぞれ収音し、収音した音響信号を再生するシステムに適用し得るものである。
現在、ICTの発達に伴い、遠隔地の映像や音情報を用い、あたかも遠隔地にいるかのように体感させる技術への需要が高まっている。
非特許文献1では、離れた場所に存在する複数のオフィス間を映像や音、各種センサ情報などで相互に接続し、遠隔地と円滑にコミュニケーションを取ることができるテレワークシステムを提案している。非特許文献1に記載されたシステムでは、オフィス内のいたるところに複数のカメラとマイクロホンを配置し、それらから得られる映像・音情報を別の離れたオフィスへ伝送する。非特許文献1に記載されたシステムにおいて、ユーザは、遠隔地のカメラを自由に切替えることができ、カメラを切替える度にカメラの近くに配置してあるマイクロホンにより収音された音が再生され、リアルタイムに遠隔地の状況を知ることができる。
さらにテレワークの臨場感を高めるために特許文献1では、特許文献2に記載のエリアの音のみ収音する手法(エリア収音)を利用し、遠隔地の空間をいくつかのエリアに分割して収音し、ユーザの視聴位置に応じて各エリア音に立体音響処理を行った後再生し、更にこれらの処理を実時間動作させる手法(収音再生装置)を提案している。
例えば、図10(a)のように、遠隔地の空間を3×3の9つのエリアに分割している環境において、特許文献1に記載された収音再生装置を用いて各エリアの収音を行い、図10(b)のように収音した音源の音を立体音響処理して遠隔地のユーザに出力する場合について説明する。また、ここでは、図10(a)に示すように9個のエリアのうちエリアA2内を映すようにカメラCが配置されているものとする。
この場合、特許文献1に記載された収音再生装置では、エリアA2を音源とする音を中央(中心)の音源、エリアA5の音を前方の音源、エリアA1を右方向の音源、エリアA3を左方向の音源としてそれぞれ収音する。その後、特許文献1に記載された収音再生装置では、ユーザUの音響再生環境に合わせて、再生に使用する音源を選択する。
そして、図10(b)に示すように、特許文献1に記載された収音再生装置では、ユーザUから見て、中央の音源としてエリアA2の音、右方向の音源としてエリアA1の音、左方向の音源としてエリアA3の音、前方向の音源としてエリアA5の音をそれぞれ選択して定位させ、中央のエリアA2からの距離に応じてエリア音が徐々に小さくなるように調節した音響信号(立体音響処理した音響信号)を出力する。また、特許文献1に記載された収音再生装置では、ユーザへの再生環境が2チャネル(音響信号を再生出力するスピーカが2つ)の場合、選択した音源に、それぞれの方向に対応する頭部伝達関数(HRTF:Head−Related Transfer Function)を畳み込みバイノーラル音源を作成する。そして、ユーザへの再生環境がヘッドホンやイヤホンの場合、特許文献1に記載された収音再生装置は、作成したバイノーラル音源の音響信号をそのまま再生出力する。また、図10(b)のように、ユーザへの再生環境が2つのステレオスピーカS−1、S−2の場合、特許文献1に記載された収音再生装置は、バイノーラル音源をスピーカ用のトランスオーラル音源に変換して再生出力する。さらに、ユーザの再生環境が3チャネル以上のスピーカの場合、特許文献1に記載された収音再生装置は、出力先のスピーカの配置に合わせてそれぞれエリア音を処理する。例えばユーザの前後左右に1台ずつ計4個のスビーカが配置されている場合、特許文献1に記載された収音再生装置は、エリアA2の音は全てのスピーカから同時に再生し、エリアA5、A3、A1の音源の音(前、左、及び右の音源の音)は各方向に対応したスピーカから再生する。
以上のように、特許文献1に記載された収音再生装置を用いれば、ユーザに遠隔地の様々な場所の現在の状況を臨場感豊かに体感させることができる。
特開2016−25469号公報 特開2015−50558号公報
野中 他,"複数の映像・音・センサ情報を利用するオフィスコミュニケーションシステム",ヒューマンインタフェース学会研究報告集 Vol.13 No.10,2011.
しかしながら、特許文献1に記載された従来の収音再生装置では、カメラが撮像した映像に映っている場所と収音エリアが一致していることを前提としているため、映像のズーム率を変えたとき等、映像と収音エリアがずれてしまうと、臨場感が弱まってしまう可能性がある。例えば、図11(a)のように、カメラの撮像する映像に2つ以上のエリアが映っている場合は、ユーザ側の画面に映っているエリアA1とエリアA3の音が画面の外から聞こえることになる。また図11(b)のように正面がエリアの中心からずれている場合では、エリアA1またはエリアA2の音が正面から聞こえてしまう。さらに立体音響処理を行わずに、収音したエリアの音を単独で再生する場合においても、画面に映っている場所の一部の音が聞こえない状態となり、用途によっては違和感を生じさせる恐れがある。
以上のような問題に鑑みて、空間内を撮像するカメラの周辺の音を収音し、カメラにより撮像された映像と同期して再生する際に、より高い臨場感を体感させることができる収音再生装置、収音再生プログラム、収音装置及び再生装置が望まれている。
第1の本発明の収音再生装置は、(1)空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、(2)前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、(3)前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、(4)前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、(5)前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段とを有し、(6)前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、(7)前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給することを特徴とする。
第2の本発明の収音装置は、(1)空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、(2)前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、(3)前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、(4)前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段とを有し、(5)前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成することを特徴とする。
第3の本発明の再生装置は、(1)所定の空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、(2)前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、(3)前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、(4)前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段とを有し、(5)前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、(6)前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給することを特徴とする。
第4の本発明の収音再生プログラムは、コンピュータを、(1)空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、(2)前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、(3)前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、(4)前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、(5)前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段として機能させ、(6)前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、(7)前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給することを特徴とする。
本発明によれば、空間内を撮像するカメラの周辺の音を収音し、カメラにより撮像された映像と同期して再生する際に、より高い臨場感を体感させることができる。
第1の実施形態に係る各装置の接続構成及び収音再生装置の機能的構成について示したブロック図である。 第1の実施形態に係る収音再生装置を構成するエリア収音部の内部構成について示したブロック図である。 第1の実施形態に係る収音再生装置が収音する空間の構成例について示した説明図である。 第1の実施形態に係るカメラの撮像領域及び収音対象エリアの例について示した説明図である。 第2の実施形態に係る各装置の接続構成及び収音再生装置の機能的構成について示したブロック図である。 第2の実施形態に係るカメラの撮像領域及び収音対象エリアの例について示した説明図(その1)である。 第2の実施形態に係る立体音響処理部が行う立体音響処理の例について示した説明図(その1)である。 第2の実施形態に係るカメラの撮像領域及び収音対象エリアの例について示した説明図(その2)である。 第2の実施形態に係る立体音響処理部が行う立体音響処理の例について示した説明図(その2)である。 従来の収音再生装置が収音及び再生する処理の例について示した説明図である。 従来の収音再生装置が収音する空間におけるカメラの撮像範囲の例について示した説明図である。
(a)第1の実施形態
以下、本発明による収音再生装置、及び収音再生プログラムの第1の実施形態を、図面を参照しながら詳述する。
(A−1)第1の実施形態の構成
図1は、本発明の第1の実施形態に係る収音再生装置100の構成を示すブロック図である。
収音再生装置100は、m個のマイクロホンアレイMA(MA1〜MAm)(mは2以上の整数)から入力される入力信号に基づいて、所定の空間A(マイクロホンアレイMA1〜MAmにより収音可能な空間)における全てのエリアの音(以下、「エリア音」と呼ぶ)を同時に収音することが可能であり、上記所定の空間内の一部のエリアのエリア音を選択し、選択したエリアのエリア音に基づいて、ユーザUの再生環境に応じた音響信号を生成して出力するものである。ここでは、図1に示すようにユーザUへの再生環境は1つのスピーカSであるものとする。したがって、この実施形態の収音再生装置100は、選択したエリアのエリア音を処理して、スピーカSに出力する音響信号(1チャネルの音響信号)を生成する。
各マイクロホンアレイMAは、2つ以上の図示しないマイクロホンを用いて構成されており、各マイクロホンにより収音する。
収音再生装置100において、所定の空間A内を複数のエリアに分割し、分割したエリアごとのエリア音を収音する方式については限定されないものであり、種々の方式を適用することができる。この実施形態の収音再生装置100では、例として、特許文献1に記載された方式を用いて空間A内の各エリアのエリア音を収音するものとして説明する。
また、第1の実施形態では、マイクロホンアレイMAにより収音可能な空間A内を撮像するカメラCと、カメラCで撮像した映像を表示出力するディスプレイDが配置されている。ディスプレイDから表示される映像はユーザUにより目視される。収音再生装置100は、ディスプレイDから表示される映像(カメラCで撮像される映像)に応じて、選択するエリア(収音する対象となるエリア)を切替える。
第1の実施形態では、空間A内以外の場所(例えば、遠隔地)にいるユーザUに対して、収音再生装置100が出力する音響信号に基づく音をスピーカSから出力し、カメラCで撮像した映像をディスプレイDを表示出力することで、ユーザUに対して映像及び音によりカメラCの位置にいるかのような臨場感を与えることができる。
カメラC及びディスプレイDの構成は限定されないものであり種々の装置を適用することができる。また、カメラCで撮像した映像をディスプレイDまで伝送する方式や映像信号の形式(映像の符号化方式)等は限定されないものであり種々の構成を適用することができる。
また、この実施形態では、収音再生装置100がマイクロホンアレイMA1〜MAmを用いて収音する空間Aは図3に示すような正方形(二次元)で表される空間であるものとする。そして、この実施形態では、空間Aを6×6の正方形のエリアに分割し、収音再生装置100は、マイクロホンアレイMA1〜MAmからの入力信号に基づいて、図3に示す各エリアごとにエリア音を収音することが可能となっているものとする。なお、この実施形態では説明を簡易とするため空間Aの形状を正方形としたが、空間Aの形状や大きさは限定されないものである。また、この実施形態では、説明を簡易とするために空間Aを6×6の正方形のエリア(ブロック)に分割しているが、各エリアの形状や大きさは限定されない(例えば、各エリアの形状や大きさが異なるようにしてもよい)。
図3では、空間Aの周囲に12個のマイクロホンアレイMA1〜MA12が配置された構成となっている。図3において、各マイクロホンアレイMAに付された矢印は、各マイクロホンアレイMAが収音する際の指向性の方向(収エリアの方向)を示している。空間Aの周囲では図3の方向から見て横方向にマイクロホンアレイMA1〜MA6が並べて配置されている。また、空間Aの周囲では、図3の方向から見て縦方向に6個のマイクロホンアレイMA7〜MA12が並べて配置されている。この実施形態では、例として、収音再生装置100は、マイクロホンアレイMA1〜MA12から入力される信号に基づいて、空間A内の各エリアのエリア音を収音するものとする。
図3では、上から3段目のエリアについて左から順にA1〜A6、上から4段目のエリアについて左から順にA7〜A12、上から5段目のエリアについて左から順にA13〜A18、上から6段目のエリアについて左から順にA19〜A24の符号をそれぞれ付している。また、図3では、カメラCの位置と、カメラCが撮像する方向Z(撮像する範囲の中心の方向)を図示している。
以上のように第1の実施形態では、図3に示すような環境で、収音再生装置100は、空間A内の収音再生の処理を行うものとする。
次に、収音再生装置100の内部構成について、図1、図2を用いて説明する。
収音再生装置100は、データ入力部1、空間座標データ保持部2、エリア収音部3、画角情報算出部4、エリア範囲判定部5、エリア音統合部6、スピーカ出力部7を有している。
収音再生装置100は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態に係る収音再生プログラムを含む)をインストールすることによりソフトウェア的に実現するようにしてもよい。
データ入力部1は、各マイクロホンアレイで収音した音響信号をアナログ信号からデジタル信号に変換する。
空間座標データ保持部2は、収音再生装置100において、収音再生処理に関係する各構成要素に係る位置情報を保持する機能を担っている。空間座標データ保持部2は、例えば、収音対象となる空間全体の情報(例えば、空間Aの外形(輪郭)を示す各座標等の情報)、カメラC(ユーザUの仮想的な視点となるカメラC)の位置や撮像方向Z等に関する情報、収音対象となる各エリアの位置情報(例えば、空間Aを構成する各エリアの位置情報)、各マイクロホンアレイMAの位置情報、各マイクロホンアレイMAを構成するマイクロホンの位置情報等を保持している。
エリア収音部3は、各マイクロホンアレイMAからの入力信号に基づいて、空間Aを構成する各エリアのエリア音を収音する。エリア収音部3は、指向性形成部31、遅延補正部32、エリア音パワー補正係数算出部33、及びエリア音抽出部34を有している。
指向性形成部31は、各マイクロホンアレイMAでビームフォーマ(以下、「BF」とも呼ぶ)により収音エリア方向(例えば、図3に示す各マイクロホンアレイMAに付された矢印の方向)に向けて指向性ビームを形成する。指向性形成部31において、BFとしては、加算型の遅延和法や、減算型のスペクトラル減算法(以下、「SS」と呼ぶ)など各種手法を適用することができる。また、指向性形成部31は、収音する対象の各エリアの範囲に応じて、各マイクロホンアレイMAに係る指向性の強度を変更する。以下では、指向性形成部31がBFにより形成した各信号を「BF出力」とも呼ぶものとする。
遅延補正部32は、収音する対象の各エリアと、各マイクロホンアレイMAの距離の違いにより発生する遅延を算出し、補正する。遅延補正部32は、全てのエリアのそれぞれと、各エリアの収音に使用される全マイクロホンアレイとの距離の違いにより発生する伝搬遅延時間を算出し、前記全マイクロホンアレイの伝搬遅延時間を補正する。具体的には、遅延補正部32は、空間座標データ保持部2からエリアの位置情報と、当該エリアの収音に使用される全マイクロホンアレイMA1〜MAmの位置情報を取得し、当該エリアから、当該エリアの収音に使用される全マイクロホンアレイMAへのエリア音の到達時間の差(伝搬遅延時間)を算出する。そして、遅延補正部32は、当該エリアから最も遠い位置に配置されたマイクロホンアレイMAを基準として、全てのマイクロホンアレイMAにエリア音が同時に到達するように、全てのマイクロホンアレイMAからのBF出力に伝搬遅延時間を加えて遅延を補正する。また、遅延補正部32は、全てのエリアについて、それぞれのエリアの収音に使用される全マイクロホンアレイMAからのBF出力に対して遅延補正を行う。
エリア音パワー補正係数算出部33は、全てのエリアのそれぞれの収音に使用される各マイクロホンアレイからの各BF出力に含まれるエリア音のパワーをそれぞれ同じにするためのパワー補正係数を算出するものである。エリア音パワー補正係数算出部33は、補正係数を求めるために、まず各BF出力問で周波数毎に振幅スペクトルの比率を求める。この際、指向性形成部31でBFを時間領域で行っている場合は、周波数領域に変換する。そして、エリア音パワー補正係数算出部33は、パワー補正係数を求めるために、例えば、各BF出力の間で周波数毎の振幅スペクトルの比率を算出する。次に、エリア音パワー補正係数算出部33は、求めた各周波数の振幅スペクトルの比率から最頻値若しくは中央値を算出し、その値をパワー補正係数とする。具体的には、エリア音パワー補正係数算出部33は、例えば、以下の(1)式による最頻値、又は、以下の(2)式による中央値に基づいて、パワー補正係数を算出することができる。(1)式、(2)式において、Xik(n),Xjk(n)は、それぞれマイクロホンアレイi,jのBFの出力である。また、(1)式、(2)式において、Nは周波数ビンの総数、kは周波数、αij(n)はBF出力に対するパワー補正係数である。
Figure 0006274244
エリア音抽出部34は、エリア音パワー補正係数算出部33で算出した補正係数により補正した各BF出力データをSSし、収音エリア方向に存在する雑音を抽出する。さらに、エリア音抽出部34は、抽出した雑音を各BF出力からSSすることにより各エリアのエリア音を抽出する。マイクロホンアレイiからみた収音エリア方向に存在する雑音Nij(n)を抽出するには、(3)式に示すように、マイクロホンアレイiのBF出力X(n)からマイクロホンアレイjのBF出力X(n)にパワー補正係数αijを掛けたものをSSする。その後、エリア音抽出部34は、(4)式に従い、各BF出力から雑音をSSすることにより各エリアのエリア音を抽出する。γij(n)はSS時の強度を変更するための係数である。
ij(n)=X(n)−αij(n)X(n) …(3)
ij(n)=X(n)−γij(n)Nij(n) …(4)
以上のように、エリア収音部3は、マイクロホンアレイMA1〜MAmからの入力信号に基づき各エリアのエリア音を収音する処理を行う。この実施形態では、図3に示す空間Aにおいて、マイクロホンアレイMA1〜MA12を用いて各エリアのエリア音を収音する場合について説明する。エリア収音部3は、例えば、エリアA1のエリア音を収音する場合、BFの指向性がエリアA1の方に向けられているマイクロホンアレイMA1とマイクロホンアレイMA9のBF出力を用いた抽出処理を行う。
画角情報算出部4は、カメラC(例えば、ユーザUの仮想的な視点となるカメラC)の撮像に係るパラメータ(例えば、位置、撮像方向Z、及びズーム率等)に基づいて、空間A内でカメラCが撮像している領域を判定するものである。画角情報算出部4は、例えば、カメラCの位置、撮像方向Z、画角(視野角)、及びズーム率を撮像に係るパラメータ(以下、「撮像パラメータ」と呼ぶ)として取得し、取得したパラメータに応じて、現在カメラCが撮像している空間A内の領域(以下、「撮像領域」と呼ぶ)を判定(例えば、撮像領域の位置、形状等を判定)する。画角情報算出部4では、例えば、予め撮像パラメータの組み合わせに応じた撮像領域の情報を保持しておき、入力された撮像パラメータに応じた撮像領域を選択するようにしてもよい。具体的には、例えば、カメラCのズーム率のみが変動するとした場合、画角情報算出部4は、予めカメラCの位置、撮像方向Z、及び画角に基づいて予めズーム率ごとの撮像領域を算出し、算出した撮像領域の情報を保持しておいて、カメラCのズーム率に応じて対応する撮像領域の情報を出力するようにしてもよい。画角情報算出部4がカメラCの切替(ユーザUの仮想的な視点となるカメラCの切替)や、カメラCの撮像パラメータを取得する方式については限定されないものであり種々の方式を適用することができる。例えば、空間座標データ保持部2が撮像パラメータを保持して画角情報算出部4に供給するようにしてもよい。
また、画角情報算出部4において、撮像パラメータの内容(データ構成)や、撮像パラメータに基づく撮像領域の判定方法については限定されないものであり、種々の方式を適用することができる。以上のように、画角情報算出部4は、撮像領域AFを保持する撮像領域保持手段として機能する。
エリア範囲判定部5は、画角情報算出部4から供給された撮像領域の情報に基づき空間A上のどのエリアが撮像領域に対応するエリアであるかを判定する。エリア範囲判定部5は、例えば、空間Aの各エリアについて撮像領域と重なる部分(面積)を判定し、所定以上(例えば、全体面積の半分以上)撮像領域が含まれているエリアについて、撮像領域に対応するエリアとして判断するものとする。なお、この実施形態では、エリア範囲判定部5は、撮像領域の情報に基づいて中央エリアを判定しているが、撮像パラメータの情報に基づいて直接撮像領域に対応するエリアを判定するようにしてもよい。
エリア音統合部6は、エリア範囲判定部5から供給された撮像領域に対応するエリアの情報に基づいて、収音対象となる領域(以下、「収音対象エリア」と呼ぶ)を判定する。この実施形態では、エリア音統合部6は、エリア範囲判定部5から供給された撮像領域に対応するエリアを、収音対象エリアとして判定するものとする。そして、エリア音統合部6は、収音対象エリアを構成する各エリアのエリア音を混合(統合)した音響信号(以下、「収音対象エリア音」と呼ぶ)を生成する。この実施形態では、ユーザUの再生環境は、1チャネルのスピーカSであるため、エリア音統合部6は、収音対象エリアの各エリア音を混合した1つの音響信号(1チャネルの音響信号)を収音対象エリア音として生成する。以上のように、エリア音統合部6は、収音対象エリアを設定する収音対象エリア設定手段として機能する。また、第1の実施形態では、エリア音統合部6が、収音対象エリア内の音を統合(混合)する統合手段として機能する。
スピーカ出力部7は、エリア音統合部6から供給された収音対象エリア音の音響信号を、スピーカSに出力する。
(A−2)第1の実施形態の動作
次に、以上のような構成を有する第1の実施形態の収音再生装置100の動作を説明する。
以下では、エリア収音部3により、空間Aを構成する各エリアのエリア音が収音されていることを前提とし、画角情報算出部4、エリア範囲判定部5、及びエリア音統合部6の動作を中心とした説明を行う。
図4は、第1の実施形態においてカメラCの撮像領域及び収音対象エリアの例について示した説明図である。
図4では、カメラCによる撮像領域をAF、撮像領域に基づく収音対象エリアをAPと図示している。
画角情報算出部4では、供給された撮像パラメータ(例えば、カメラCの位置、撮像方向Z、画角(視野角)、及びズーム率)に基づいて撮像領域AFが判定される。例えば、画角情報算出部4は、カメラCの位置、撮像方向Z、及び画角(視野角)に基づいて、図4に示すような扇形の領域(カメラCの位置を中心位置とした扇形)を撮像領域AFとして判定するようにしてもよい。画角情報算出部4は、例えば、カメラCの位置、撮像方向Zに応じて撮像領域AFを構成する扇形の中心位置及び向きを調整するようにしてもよい。また、画角情報算出部4は、例えば、カメラCのズーム率に応じて、撮像領域AFを構成する扇形の半径を調整するようにしてもよい。さらにまた、画角情報算出部4は、カメラCの画角に応じて、撮像領域AFを構成する扇形の中心角の角度を調整するようにしてもよい。
そして、エリア範囲判定部5は、画角情報算出部4により判定された撮像領域AFに基づいて、撮像領域AFに対応するエリアを判定する。この実施形態の例では、エリア範囲判定部5は、撮像領域AFと重なる領域が半分以上となるエリアを、撮像領域AFに対応するエリアとして判定する。図4の例では、撮像領域AFと重なる領域が半分以上のエリアは、エリアA3、A4、A9、A10となるため、エリア範囲判定部5は、エリアA3、A4、A9、A10を、撮像領域AFに対応するエリアとして判定する。
エリア音統合部6は、エリア範囲判定部5で判定された撮像領域AFに対応するエリアを、収音対象エリアAPとして決定する。そして、エリア音統合部6は、決定した収音対象エリアAPの各エリア音(エリアA3、A4、A9、A10の各エリア音)を混合(統合)して収音対象エリア音を生成し、スピーカ出力部7に供給することになる。
これにより、ユーザUには、撮像領域AF内を撮像した映像(画像)がディスプレイDから表示出力されたときに、撮像領域AFに基づく収音対象エリアAP内の各エリア音(エリアA3、A4、A9、A10の各エリア音)を統合(混合)した音が出力(表音出力)されることになる。
(A−3)第1の実施形態の効果
第1の実施形態によれば、以下のような効果を奏することができる。
収音再生装置100では、カメラCの撮像領域AFに対応するエリアを統合して収音対象エリアAPとして決定し、収音対象エリアAP内のエリア音を混合した音音響信号を出力する。すなわち、収音再生装置100は、ディスプレイDに映っている映像の範囲(カメラCが撮像した映像の範囲)に応じて、エリア音を統合(混合)するエリアの範囲を切替える。したがって、第1の実施形態では、ユーザUは、ディスプレイDに映る映像の動作(例えば、ズーム等の動作)と連動して、エリア音を統合(混合)するエリアの範囲が切替えられた音を聴取することができる。すなわち、第1の実施形態では、ユーザUは、常にディスプレイDに映っている範囲のエリア音を統合(混合)した音を聞くことができるようになるため、ユーザUに遠隔地の状況を臨場感豊かに体感させることが可能となる。
(B)第2の実施形態
以下、本発明による収音再生装置、及び収音再生プログラムの第2の実施形態を、図面を参照しながら詳述する。
(B−1)第2の実施形態の構成
図5は、本発明の第2の実施形態に係る収音再生装置100Aの構成を示すブロック図である。図5では、上述の図1と同一部分又は対応部分には、同一符号又は対応符号を付している。
以下では、第2の実施形態について、第1の実施形態との差異を説明する。
第2の実施形態の収音再生装置100Aでは、統合エリア音選択部8、統合エリア音量調節部9、立体音響処理部10、及び伝達関数データ保持部11が追加されている点で第1の実施形態と異なっている。
また、第2の実施形態では、ユーザUの再生環境がモノラルのスピーカSではなく、n個(nは2以上の整数)のスピーカS(S−1〜S−n)により構成されたスピーカアレイSAとなっている。したがって、この実施形態では、収音再生装置100Aは、nチャネルの音響信号(n個のスピーカS−1〜S−nのそれぞれに対応するラインの音響信号)を出力することになる。
第2の実施形態のエリア音統合部6は、収音対象エリア音として、撮像領域AFに対応するエリアだけでなく、撮像領域AFに対応するエリアの更に周辺のエリアについても収音対象エリアAPに含める点で第1の実施形態と異なっている。以下では、撮像領域AFに対応するエリアを統合したエリアを「中央エリア」と呼ぶものとする)。
第2の実施形態において、エリア音統合部6は、例えば、中央エリア(例えば、2×2のエリアにより構成されるエリア)と、中央エリアのエリア周囲のエリア(中央エリアと同様の面積のエリア)とを含むエリアを収音対象エリアAPとして設定する。なお、中央エリアの周囲で、中央エリアと同じ面積のエリアを設定できない場合(面積が足りない場合)、設定可能なエリアのみを収音対象エリアAPとする。
統合エリア音選択部8は、エリア音統合部6で決定された収音対象エリアAPに含まれる各エリア(エリア音)を、複数(ユーザUに定位する音源の数分)の領域(以下、「統合エリア」又は「サブエリア」と呼ぶ)に分割する。そして、統合エリア音選択部8は、統合エリアごとに、当該統合エリアに含まれるエリア音を混合(統合)して「統合エリア音」を生成する。統合エリア音選択部8が決定する統合エリア(音源)の数は、後述する立体音響処理部10で立体音響処理する際に定位する各方向(位置)の数(定位する音源の数)と同じとなる。言い換えると、統合エリア音選択部8は、立体音響処理部10で立体音響処理する際に定位する各方向(位置)に対応する統合エリアを決定する。
統合エリア音量調節部9は、統合エリア音選択部8が生成した各統合エリア音の音量(パワー)を統合エリアの位置に応じて調節する。例えば、統合エリア音量調節部9は、カメラCの位置(ユーザの仮想的な視聴位置)からの距離に応じて、各統合エリア音の音量(パワー)を調節するようにしてもよい。具体的には、例えば、統合エリア音量調節部9は、カメラCの位置(ユーザの仮想的な視聴位置)から遠い統合エリアほど音量を小さくする処理(近い統合エリアほど音量を大きくする処理)を行うようにしてもよい。また、統合エリア音量調節部9は、例えば、中央の統合エリア(例えば、中央エリアを含む統合エリア)の音量を一番大きくし、中央の統合エリアの周囲の統合エリアの音量を小さく設定するようにしてもよい。
立体音響処理部10は、遠隔地のユーザUの再生環境に応じて各統合エリア音(統合エリア音量調節部9により調整された統合エリア音)を音源とする立体音響処理を行う。例えば、立体音響処理部10は、各統合エリア音について、当該統合エリア音に対応する統合エリアの方向に定位するように立体音響処理を行う。立体音響処理部10は、例えば、カメラCの位置をユーザUの仮想的な視聴位置(ユーザUの頭部の位置)、カメラCの撮像方向ZをユーザUの仮想的な視線の方向とし、各統合エリア音を、ユーザの仮想的な視点から各統合エリアへの方向(位置)に定位(音像定位)するように立体音響処理を行い、ユーザの再生環境に応じた音響信号として出力する。すなわち、立体音響処理部10は、統合エリア音を立体音響処理し、スピーカアレイSAを構成するスピーカSの数n分の音響信号(nチャネルの音響信号)として出力する。また、立体音響処理部10は、ユーザの再生環境に応じて、立体音響処理の方式を切り替え可能とするようにしてもよい。
例えば、ユーザUの再生環境がヘッドホン又はイヤホンである場合、立体音響処理部10は、伝達関数データ保持部11から、各統合エリア音(音源)に対応する方向のHRTFを取得して、各統合エリア音に対応する方向のHRTFを畳み込み、バイノーラル音源となる音響信号(ヘッドホン又はイヤホンに出力する2チャネルの音響信号)を生成するようにしてもよい。また、ユーザUの再生環境が複数のスピーカにより構成されたスピーカアレイ(ステレオスピーカ)である場合、立体音響処理部10は、統合エリア音に基づくバイノーラル音源の音響信号を、さらにトランスオーラル音源の音響信号に変換するようにしてもよい。立体音響処理部10は、例えば、伝達関数データ保持部11からユーザUと各スピーカS間の室内伝達関数を取得し、室内伝達関数を用いて設計したクロストークキャンセラを用いて、バイノーラル音源の音響信号をトランスオーラル音源の音響信号に変換するようにしてもよい。さらに、ユーザUの再生環境が3つ以上のスピーカSを使用する環境の場合(すなわち、スピーカアレイSAを構成するスピーカSの数nが3以上の場合)、立体音響処理部10は、スピーカSの位置を含む統合エリアの統合エリア音については、立体音響処理を行わずにそのまま出力するようにしてもよいし、立体音響処理(例えば、トランスオーラル音源に変換する処理)を行うようにしてもよい。
以上のように、立体音響処理部10では、バイノーラル方式やトランスオーラル方式等の種々の立体音響処理の方式を適用することができる。
伝達関数データ保持部11は、立体音響処理部10で必要となる種々のデータを保持する。例えば、立体音響処理部10がバイノーラル方式により立体音響処理を行う場合、伝達関数データ保持部11は、少なくともユーザUから各方向へ音源(統合エリア音)を定位させるためのHRTFを保持する。また、立体音響処理部10がトランスオーラル方式により立体音響処理を行う場合、伝達関数データ保持部11は、上述のHRTFに加えて、ユーザUと各スピーカSとの間の室内伝達関数を保持する。
スピーカ出力部7は、立体音響処理部10から出力されたそれぞれのチャネルの音響信号を対応するスピーカSに出力する。
(B−2)第2の実施形態の動作
次に、以上のような構成を有する第2の実施形態の収音再生装置100Aの動作を説明する。
ここでは、エリア収音部3により、空間Aを構成する各エリアのエリア音が収音されていることを前提とする。また、ここでは、第1の実施形態と同様に、画角情報算出部4により撮像領域AFが判定され、エリア範囲判定部5により撮像領域AFに対応する中央エリアが判定されているものとする。したがって、以下では、エリア音統合部6、統合エリア音選択部8、統合エリア音量調節部9、及び立体音響処理部10の動作を中心とした説明を行う。さらに、ここでは、スピーカアレイSAは、2個のスピーカS−1、S−2(ステレオスピーカ)により構成されているものとする。
図6は、第2の実施形態におけるカメラCの撮像領域及び収音対象エリアの例について示した説明図である。図6では、撮像領域AFに対応する中央エリアをAX、収音対象エリア全体をAPと図示している。
まず、図6を用いて、エリア音統合部6が収音対象エリアAPを決定する処理について説明する。
図6では、撮像領域AFに対応する中央エリアAXは、エリアA3、A4、A9、A10(2×2のブロック)により構成されている。したがって、図6の例では、収音対象エリアAPは、収音対象エリアAPとして、中央エリアAXと、中央エリアAXの周囲のエリア(中央エリアAXと同じ2×2のブロック)とにより構成されるエリアを決定する。
この実施形態では、エリア音統合部6は、収音対象エリアAPに、中央エリアAXと、中央エリアAXの周囲のブロックのうち、立体音響処理部10が音源を定位する方向に応じたブロックを収音対象エリアAPに含めるものとする。この実施形態では、立体音響処理部10は、ユーザUから見て、中央(ユーザUの位置又はユーザUに極近い位置)、左方向、右方向、前方の計4つの音源に分けて立体音響処理を行うものとする。したがって、図6の例では、収音対象エリアAPは、中央エリアAXと、カメラCから見て中央エリアAXの前方方向の2×2のブロック(エリアA15、A16、A21、A22のブロック)と、中央エリアAXの右側のブロック(エリアA1、A2、A7、A8のブロック)と、中央エリアAXの左側の2×2のブロック(エリアA5、A6、A11、A12のブロック)とで構成されている。なお、エリア音統合部6は、立体音響処理部10が立体音響処理に適用する音源の方向に応じて、収音対象エリアAPに、中央エリアAXの後方のブロックや、右斜め前のブロックや、左斜め前のブロックを追加するようにしてもよい。
次に、図6を用いて、統合エリア音選択部8が収音対象エリアAPを複数の統合エリアに分割(立体音響処理部10が音源を定位する方向の数に分割)する処理について説明する。
この実施形態では、立体音響処理部10は、ユーザUから見て、中央(中心)の位置(ユーザUの位置又はユーザUに極近い位置)、左方向、右方向、前方の計4つの音源に分けて立体音響処理を行う。したがって、統合エリア音選択部8は、図6に示すように、撮像領域AFに対応する中央エリアAXを中央に対応する中央統合エリアAC−Cとして分割する。また、統合エリア音選択部8は、中央統合エリアAC−C(中央エリアAX)の右側の2×2のブロック(中央エリアAXと同じ面積のブロック)を、右方向に対応する右方統合エリアAC−Rとして分割する。さらに、統合エリア音選択部8は、中央統合エリアAC−C(中央エリアAX)の左側の2×2のブロックを、左方向に対応する左方統合エリアAC−Lとして分割する。さらにまた、統合エリア音選択部8は、中央統合エリアAC−C(中央エリアAX)の前側の2×2のブロックを、前方向に対応する前方統合エリアAC−Fとして分割する。
したがって、図6の例では、統合エリア音選択部8は、中央統合エリアAC−Cの各エリア音を混合した音を中央の統合エリア音(音源)として生成し、右方統合エリアAC−Rの各エリア音を混合した音を右方向の統合エリア音(音源)として生成し、左方統合エリアAC−Lの各エリア音を混合した音を左方向の統合エリア音(音源)として生成し、前方統合エリアAC−Fの各エリア音を混合した音を前方向の統合エリア音(音源)として生成する。そして、統合エリア音選択部8は、生成した各統合エリアの統合エリア音を統合エリア音量調節部9に供給する。以上のように、第2の実施形態では、統合エリア音選択部8が、統合エリアごとにエリア音を統合(混合)する統合手段として機能する。
次に、統合エリア音量調節部9は、各統合エリアの位置やカメラCからの方向に応じて各統合エリア音の音量(パワー)を調整する。
例えば、また、統合エリア音量調節部9は、中央統合エリアAC−Cの統合エリア音の音量を最も大きく設定し、それ以外の各方向の統合エリア音の音量を、それぞれ中央統合エリアAC−Cよりも低い音量に設定するようにしてもよい。
次に、立体音響処理部10は、ユーザの再生環境に応じて、各統合エリア音を対応する方向に定位させる立体音響処理を行う。
図7は、立体音響処理部10が行う立体音響処理の例について示した説明図である。
図7では、ユーザUの前方にスピーカS−1、S−2が配置されている。また、図7では、ユーザUの前方にディスプレイDが配置されている。
図7の例では、ユーザUから見て中央の位置(ユーザUの位置)をP−C、右方向の位置(ディスプレイDの右側の位置)をP−R、左方向の位置をP−L(ディスプレイDの左方向の位置)、前方の位置(ディスプレイDと同じ方向の位置)をP−Fと図示している。
そして、図7の例では、立体音響処理部10は、中央統合エリアAC−Cの統合エリア音を中央の位置P−Cに対応する方向(例えば、前方)に定位し、右方統合エリアAC−Rの統合エリア音を右方向に定位し、左方統合エリアAC−Lの統合エリア音を左方向に定位し、前方統合エリアAC−Fの統合エリア音を前方向に定位するように立体音響処理(ユーザUに対する立体音響処理)を行う。そして、立体音響処理部10は、上述の4つの音源を対応する方向(位置)に定位した2チャネルの音響信号(2つのスピーカS−1、S−2のそれぞれに出力するための音響信号)を生成して、スピーカ出力部7に供給する。そして、スピーカ出力部7は、立体音響処理された音響信号(2チャネルの音響信号)を、それぞれスピーカS−1、S−2に出力する。
なお、図6、図7の例では、各統合エリアを中央エリアAXと同じ面積のブロックに設定する例について説明したが、統合エリア音選択部8は、立体音響処理部10が対応する場合、一部の統合エリアをさらに複数のサブエリアに分割するようにしてもよい。
例えば、統合エリア音選択部8は、図8に示すように中央統合エリアAC−Cをさらに左右に分割し、2つのサブエリアAC−CR(エリアA3、A9)、AC−CL(エリアA4、A10)を設定するようにしてもよい。
この場合、立体音響処理部10は、中央統合エリアAC−Cの統合エリア音ではなく、図8に示すように、右側のサブエリアAC−CRの統合エリア音と、左側のサブエリアAC−CLの統合エリア音を生成することになる。そして、この場合、立体音響処理部10は、図9に示すように、右側のサブエリアAC−CRの統合エリア音を、中央右側の位置P−CRに対応する方向(例えば、ユーザUから見て右斜め前方向)に定位する。また、立体音響処理部10は、図9に示すように、左側のサブエリアAC−CLの統合エリア音を、中央左側の位置P−CLに対応する方向(例えば、ユーザUから見て左斜め前方向の方向)に定位する。
(B−3)第2の実施形態の効果
第2の実施形態によれば、第1の実施形態の効果に加えて、以下のような効果を奏することができる。
第2の実施形態の収音再生装置100Aでは、撮像領域AFに対応する中央エリアと、その周囲のエリアを収音対象エリアAPとし、収音対象エリアAPを分割した統合エリアの統合エリア音を音源として立体音響処理を行っている。これにより、第2の実施形態では、ユーザUに、ディスプレイDに映るエリアの範囲外のエリア音について、それぞれ対応する方向から聞こえることになるため、ユーザUに遠隔地の状況を臨場感豊かに体感させることが可能となる。
また、第2の実施形態の収音再生装置100Aでは、統合エリア音を一つの音源として立体音響処理を行うため、各エリアのエリア音をそれぞれ一つの音源とした立体音響処理を行うより、少ない処理量で効率良く立体音響処理を行うことができる。
(C)他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。
(C−1)上記の各実施形態では、空間Aのエリア音を収音する収音再生装置について説明したが、収音再生装置から再生機能を省略した収音装置として構成するようにしてもよい。例えば、第1及び第2の実施形態の収音再生装置100、100Aから、スピーカ出力部7を省略した装置を収音装置として構成するようにしてもよい。
本発明の収音装置は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態に係る収音プログラムを含む)をインストールすることによりソフトウェア的に実現するようにしてもよい。
(C−2)上記の各実施形態では、空間Aのエリア音を収音する収音再生装置について説明したが、収音再生装置から収音機能を省略した再生装置として構成するようにしてもよい。例えば、第1及び第2の実施形態の収音再生装置100、100Aから、データ入力部1及びエリア収音部3を省略した装置を再生装置として構成するようにしてもよい。例えば、本発明の再生装置では、予め各エリアのエリア音の音響信号を保持(例えば、オフラインでデータ記録媒体により保持)して再生処理(エリア収音部3より後段の音響信号処理)を行う装置として構成するようにしてもよい。
本発明の再生装置は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム(実施形態に係る再生プログラムを含む)をインストールすることによりソフトウェア的に実現するようにしてもよい。
(C−3)上記の各実施形態では、空間Aは図3に示すように2次元で表すことが可能な空間であるため、撮像領域も図3に示す空間A上で2次元的に表されるものとして説明したが、空間Aが三次元的に表される空間としてもよい。この場合、空間Aを構成する各エリア(空間)は、三次元的な形状(例えば、立方体)となる。そして、この場合、収音再生装置は、カメラCによる撮像領域を3次元的な空間として認識し、各エリアについて、含まれる撮像領域の体積に応じて、撮像領域に対応するエリア(中央エリア)であるか否かを判定するようにしてもよい。そして、この場合、収音再生装置は、撮像領域に対応するエリア(中央エリア)の周囲を三次元的に認識して収音対象エリアを認識(例えば、前後左右だけでなく上下方向についても収音対象エリアと認識)する必要がある。
100…収音再生装置、1…データ入力部、2…空間座標データ保持部、3…エリア収音部、31…指向性形成部、32…遅延補正部、33…エリア音パワー補正係数算出部、34…エリア音抽出部、4…画角情報算出部、5…エリア範囲判定部、6…エリア音統合部、7…スピーカ出力部、MA、MA1〜MAm…マイクロホンアレイ、S…スピーカ、D…ディスプレイ、U…ユーザ。

Claims (9)

  1. 空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、
    前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、
    前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、
    前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、
    前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段とを有し、
    前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、
    前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給する
    ことを特徴とする収音再生装置。
  2. 前記撮像領域保持手段は、前記カメラの撮像条件を示す撮像パラメータに基づいて、前記カメラによる前記撮像領域を算出し、算出した撮像領域の情報を保持することを特徴とする請求項1に記載の収音再生装置。
  3. 前記撮像パラメータには、前記カメラの位置、撮像方向、画角、及びズーム率が含まれることを特徴とする請求項2に記載の収音再生装置。
  4. 前記収音対象エリア設定手段は、前記中央エリアと、前記中央エリアの周囲のエリアとを含むエリアを前収音対象エリアと設定することを特徴とする請求項1〜3のいずれかに記載の収音再生装置。
  5. 前記統合手段は、前記収音対象エリアを、立体音響処理で定位する音源ごとに対応する統合エリアに分割し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、
    前記統合手段が生成した各統合エリア音の音源を、それぞれ対応する方向に定位させる立体音響処理手段をさらに備え、
    前記出力手段は、前記立体音響処理手段が立体音響処理した結果生成された音響信号を出力する
    ことを特徴とする請求項1〜4のいずれかに記載の収音再生装置。
  6. 前記統合手段により生成された各統合エリア音について、前記カメラと当該統合エリア音の統合エリアとの位置関係に応じた音量に調整する統合エリア音調整手段をさらに有することを特徴とする請求項5に記載の収音再生装置。
  7. 空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、
    前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、
    前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、
    前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段とを有し、
    前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成する
    ことを特徴とする収音装置。
  8. 所定の空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、
    前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、
    前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、
    前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段とを有し、
    前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、
    前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給する
    を有することを特徴とする再生装置。
  9. コンピュータを、
    空間に配置された複数のマイクロホンアレイから入力される入力信号に基づいて、前記空間内の分割された各エリアのエリア音を収音可能な収音手段と、
    前記空間内を撮像するカメラにより撮像される撮像領域の情報を保持する撮像領域保持手段と、
    前記空間内で、前記撮像領域に対応する中央エリアを含む領域を、収音対象エリアとして設定する収音対象エリア設定手段と、
    前記収音対象エリア内のエリア音を混合した音響信号を生成する統合手段と、
    前記統合手段が生成した音響信号に基づく音響信号を、音を出力する出力部に供給する出力手段として機能させ、
    前記統合手段は、前記収音対象エリアから、1又は複数の統合エリアを抽出し、各統合エリアについて、当該統合エリアに含まれるエリアのエリア音を混合した統合エリア音を生成し、
    前記出力手段は、前記統合手段が生成した統合エリア音に基づく音響信号を前記出力部に供給する
    ことを特徴とする収音再生プログラム。
JP2016072376A 2016-03-31 2016-03-31 収音再生装置、収音再生プログラム、収音装置及び再生装置 Active JP6274244B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2016072376A JP6274244B2 (ja) 2016-03-31 2016-03-31 収音再生装置、収音再生プログラム、収音装置及び再生装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016072376A JP6274244B2 (ja) 2016-03-31 2016-03-31 収音再生装置、収音再生プログラム、収音装置及び再生装置

Publications (2)

Publication Number Publication Date
JP2017184154A JP2017184154A (ja) 2017-10-05
JP6274244B2 true JP6274244B2 (ja) 2018-02-07

Family

ID=60008655

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016072376A Active JP6274244B2 (ja) 2016-03-31 2016-03-31 収音再生装置、収音再生プログラム、収音装置及び再生装置

Country Status (1)

Country Link
JP (1) JP6274244B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021095536A1 (ja) * 2019-11-12 2021-05-20 ソニーグループ株式会社 情報処理装置、情報処理方法、並びにプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5455584B2 (ja) * 2009-11-30 2014-03-26 キヤノン株式会社 撮像装置及びその制御方法
JP6206003B2 (ja) * 2013-08-30 2017-10-04 沖電気工業株式会社 音源分離装置、音源分離プログラム、収音装置及び収音プログラム
JP5648760B1 (ja) * 2014-03-07 2015-01-07 沖電気工業株式会社 収音装置及びプログラム
JP6149818B2 (ja) * 2014-07-18 2017-06-21 沖電気工業株式会社 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム

Also Published As

Publication number Publication date
JP2017184154A (ja) 2017-10-05

Similar Documents

Publication Publication Date Title
JP6149818B2 (ja) 収音再生システム、収音再生装置、収音再生方法、収音再生プログラム、収音システム及び再生システム
US10021507B2 (en) Arrangement and method for reproducing audio data of an acoustic scene
CN113490134B (zh) 音频再现方法和声音再现系统
EP2323425B1 (en) Method and device for generating audio signals
US20150189457A1 (en) Interactive positioning of perceived audio sources in a transformed reproduced sound field including modified reproductions of multiple sound fields
US20080219485A1 (en) Apparatus, System and Method for Acoustic Signals
CN106664485A (zh) 基于自适应函数的一致声学场景再现的系统、装置和方法
CN101185368A (zh) 用于声换能器的组件、系统以及方法
US20180249276A1 (en) System and method for reproducing three-dimensional audio with a selectable perspective
US20170251324A1 (en) Reproducing audio signals in a motor vehicle
US10848890B2 (en) Binaural audio signal processing method and apparatus for determining rendering method according to position of listener and object
JP2018110366A (ja) 3dサウンド映像音響機器
JP5754595B2 (ja) トランスオーラルシステム
US20130243201A1 (en) Efficient control of sound field rotation in binaural spatial sound
JP7070910B2 (ja) テレビ会議システム
JP2018019294A (ja) 情報処理システム及びその制御方法、コンピュータプログラム
CN115777203A (zh) 信息处理装置、输出控制方法和程序
JP6274244B2 (ja) 収音再生装置、収音再生プログラム、収音装置及び再生装置
JP2018191127A (ja) 信号生成装置、信号生成方法およびプログラム
Malham Toward reality equivalence in spatial sound diffusion
JP2018019295A (ja) 情報処理システム及びその制御方法、コンピュータプログラム
KR101747800B1 (ko) 입체음향 생성 장치 및 이를 이용한 입체 컨텐츠 생성 시스템
JP6664456B2 (ja) 情報処理システム及びその制御方法、コンピュータプログラム
JP6431225B1 (ja) 音響処理装置、映像音響処理装置、映像音響配信サーバおよびそれらのプログラム
JP2011234139A (ja) 3次元音声信号生成装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170630

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20171212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20171225

R150 Certificate of patent or registration of utility model

Ref document number: 6274244

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150