JP2019169762A - 情報処理装置 - Google Patents

情報処理装置 Download PDF

Info

Publication number
JP2019169762A
JP2019169762A JP2018053898A JP2018053898A JP2019169762A JP 2019169762 A JP2019169762 A JP 2019169762A JP 2018053898 A JP2018053898 A JP 2018053898A JP 2018053898 A JP2018053898 A JP 2018053898A JP 2019169762 A JP2019169762 A JP 2019169762A
Authority
JP
Japan
Prior art keywords
sound
unit
units
camera
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018053898A
Other languages
English (en)
Inventor
康志 白石
Koji Shiraishi
康志 白石
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2018053898A priority Critical patent/JP2019169762A/ja
Publication of JP2019169762A publication Critical patent/JP2019169762A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Stereophonic Arrangements (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】臨場感のある音像を再生することを可能にした情報処理装置を提供する。【解決手段】マルチ接続カメラ100は、音を収音する少なくとも3つ以上の複数のマイクロフォンM1〜M4を有し、複数のマイクロフォン(例えば、マイクロフォンM1〜M3)の位置関係を相対的に変更可能に構成し、位置関係が変更された複数のマイクロフォンM1〜M4で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成する。【選択図】図7

Description

本発明は、情報処理装置に関する。
従来、音声を収音する機器として、例えば、音源に対して最適な収音範囲となるように、一対のマイクロフォンユニットの指向軸をそれぞれ変更可能にした音声レコーダが開示されている(例えば、特許文献1参照)。
特開2008−311802号公報
しかしながら、上記特許文献1に開示されている音声レコーダでは、収音された音声の伝わる方向を特定することができないため、当該音声を再生した際に、臨場感のある音像を再生することができない。
本発明は、このような問題に鑑みてなされたものであり、臨場感のある音像の再生を可能にした情報処理装置を提供することを目的とする。
上記課題を解決するため、本発明に係る情報処理装置は、
音を収音する少なくとも3つ以上の複数の収音部を有し、前記複数の収音部の位置関係を相対的に変更可能に構成された収音部群と、
前記位置関係が変更された前記複数の収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成する音データ生成手段と、
を備えることを特徴とする。
本発明によれば、臨場感のある音像を再生することが可能となる。
マルチ接続カメラの概略構成を示すブロック図である。 コントローラ部の機能構成を示すブロック図である。 カメラ部の機能構成を示すブロック図である。 (a)はカメラ部の正面図であり、(b)はカメラ部の上面図である。 (a)はカメラマウンタに配設された2つのカメラ部を一方のカメラ部の左斜め前方から見た状態を示す斜視図であり、(b)はカメラマウンタに配設された2つのカメラ部を他方のカメラ部の右斜め前方から見た状態を示す斜視図である。 (a)は図5(a)及び(b)に示すカメラ部のマイクロフォンの配置を模式的に示す図であり、(b)は各カメラ部の可動部を常態の位置に配置したときのマイクロフォンの配置を模式的に示す図である。 全天球映像生成処理を示すフローチャートである。
以下、添付図面を参照して、本発明に係る実施の形態を詳細に説明する。なお、本発明は、図示例に限定されるものではない。
<マルチ接続カメラ100の構成>
図1は、本実施形態のマルチ接続カメラ(情報処理装置)100の概略構成を示すブロック図である。
図1に示すように、本実施形態のマルチ接続カメラ100は、同期通信方式の無線通信(例えば、Bluetooth(登録商標)等)を行うコントローラ部1と、2つのカメラ部2A,2Bとを備えている。
カメラ部2A,2Bの各々は、図4(a)及び(b)に示すように、独立した筐体21を備えており、分離させている状態で独立した撮影が可能となっている。一方、図5(a)及び(b)に示すように、カメラ部2A,2Bは、所定のカメラマウンタCMを用いることによって、それぞれの光軸が共通となるように配設されるとともに互いのレンズ面が逆方向を向くように配設された状態、すなわち背中合わせで配設された状態で一体化させることが可能となっている。ここで、カメラ部2A,2Bの各々は、いわゆる円周魚眼レンズを搭載しており、それぞれ画角180度での撮影を行うことができるため、一体化させた際に、水平方向及び垂直方向を含む360度すべてを見渡せるパノラマ撮影(いわゆる全天球撮影)を行うことができるようになっている。なお、全天球撮影は、コントローラ部1に備えられた所定のボタンを操作することにより、撮影モードの設定画面(図示省略)において「全天球撮影」モードを設定したうえで行うことができるようになっている。
なお、各カメラ部2A,2Bが一体化しているか否かを判別可能な電気的、機構的な判別手段を備え、当該判別手段により一体化していると判別された場合、「全天球撮影」モードが自動的に設定され、各カメラ部2A,2Bから同じ時間的部分の画像が取得される一方で、当該判別手段により一体化していると判別されない場合、各カメラ部2A,2Bで異なる時間的部分の画像が取得されるようにしても良い。
<コントローラ部1の機能構成>
次に、コントローラ部1について、図2を参照して説明する。
図2は、コントローラ部1の機能構成を示すブロック図である。
コントローラ部1は、カメラ部2A,2Bとの同期通信方式の無線通信におけるマスタとなるものである。具体的には、図2に示すように、コントローラ部1は、中央制御部101と、メモリ102と、表示部103と、表示制御部104と、記録媒体制御部105と、操作入力部106と、通信部107と、計時部108とを備えている。また、中央制御部101、メモリ102、表示制御部104、記録媒体制御部105、通信部107及び計時部108は、バスライン109を介して接続されている。
なお、コントローラ部1は、例えば、カメラ部2A,2Bに対応する専用の装置であっても良いし、PC、携帯電話、スマートフォン、PDA(Personal Data Assistants)等の汎用の装置から構成されていても良い。
中央制御部(音データ生成手段、動画像データ生成手段)101は、コントローラ部1の各部を制御するものである。具体的には、中央制御部101は、図示は省略するが、CPU(Central Processing Unit)等を備え、コントローラ部1用の各種処理プログラム(図示省略)に従って各種の制御動作を行う。本実施形態では、中央制御部101は、例えば、各カメラ部2A,2Bにおいて「全天球撮影」モードで撮影された画像データを合成(マージ)して全天球画像データを生成する。
メモリ102は、例えば、DRAM(Dynamic Random Access Memory)等により構成され、中央制御部101等によって処理されるデータ等を一時的に格納する。
表示部103は、例えば、LCD等を具備し、中央制御部101の制御下にて各種情報を表示領域内に表示する。具体的には、表示部103は、例えば、表示制御部104から出力された画像信号に応じてアプリケーション画面(例えば、ライブビュー画像表示画面や遠隔操作画面等)を表示領域内に表示する。
表示制御部104は、中央制御部101による各種のアプリケーションプログラムの実行に基づいて、アプリケーション画面を生成し、生成されたアプリケーション画面に従った画像信号を表示部103に出力する。
記録媒体制御部105は、記録媒体105aが着脱自在に構成され、装着された記録媒体105aからのデータの読み出しや記録媒体105aに対するデータの書き込みを制御する。
すなわち、記録媒体制御部105は、例えば、カメラ部2A,2Bにより撮像され、このカメラ部2A,2Bから無線通信により送信されて取得された静止画像や動画像の画像データを記録媒体105aの所定の記録領域に記録させる。
なお、記録媒体105aは、例えば、不揮発性メモリ(フラッシュメモリ)等により構成されている。
操作入力部106は、コントローラ部1本体に対して各種指示を入力するためのものである。
具体的には、操作入力部106は、例えば、コントローラ部1本体の電源のON/OFFに係る電源ボタン、モードや機能等の選択指示に係る上下左右のカーソルボタンや決定ボタン(何れも図示省略)を備えている。
そして、ユーザにより各種ボタンが操作されると、操作入力部106は、操作されたボタンに応じた操作指示を中央制御部101に出力する。中央制御部101は、操作入力部106から入力された操作指示に従って所定の動作を各部に実行させる。
なお、操作入力部106は、表示部103と一体となって設けられたタッチパネルを有していても良く、ユーザによるタッチパネルの所定操作に基づいて、当該所定操作に応じた操作指示を中央制御部101に出力しても良い。
通信部107は、各カメラ部2A,2Bとの間でパーソナルな無線通信を行う。
具体的には、通信部107は、コントローラ部1と各カメラ部2A,2Bとの両方が、電源オンの状態であり、かつ、所定速度での画像送受信が可能な状態にあることを条件として通信を行う第1通信部107aと、所定速度での画像送受信はできないが、コントローラ部1と各カメラ部2A,2Bとのうちのいずれか一方がスリープ状態においても通信を行うことが可能な第2通信部107bとを具備している。
第1通信部107aは、Wi−Fi(Wireless Fidelity)(登録商標)の規格により通信を行う。
第2通信部107bは、Bluetooth(登録商標)の規格により通信を行う。
なお、第1通信部107a、第2通信部107bは、アンテナ、復調回路、信号処理回路等により構成されている。
計時部108は、例えば、タイマーや計時回路等を備えて構成され、現在の時刻を計時し時刻情報を取得する。
<カメラ部2の機能構成>
次に、カメラ部2について、図3を参照して説明する。
図3は、カメラ部2の機能構成を示すブロック図である。
ここで、各カメラ部2A,2Bは、コントローラ部1との同期通信方式の無線通信におけるスレーブとなるものであるが、構成及び動作は略同様であるため、代表してカメラ部2Aを例示して説明する。
図3に示すように、カメラ部2Aは、中央制御部201と、メモリ202と、撮像部203と、撮像制御部204と、画像処理部205と、記録媒体制御部206と、操作入力部207と、通信部208と、計時部209と、音入出力部210とを備えている。
また、中央制御部201、メモリ202、撮像部203、撮像制御部204、画像処理部205、記録媒体制御部206、通信部208、計時部209及び音入出力部210は、バスライン211を介して接続されている。
中央制御部201は、カメラ部2Aの各部を制御するものである。具体的には、中央制御部201は、図示は省略するが、CPU(Central Processing Unit)等を備え、カメラ部2A用の各種処理プログラム(図示省略)に従って各種の制御動作を行う。
メモリ202は、例えば、DRAM(Dynamic Random Access Memory)等により構成され、中央制御部201等によって処理されるデータ等を一時的に格納する。
撮像部203は、被写体を撮像する撮像手段を構成している。具体的には、撮像部203は、レンズ部203aと、電子撮像部203bとを具備している。
レンズ部203aは、例えば、いわゆる円周魚眼レンズ等から構成されている。
電子撮像部203bは、例えば、CCD(Charge Coupled Device)やCMOS(Complementary Metal-Oxide Semiconductor)等のイメージセンサから構成され、レンズ部203aのレンズを通過した光学像を二次元の画像信号に変換する。
なお、図示は省略するが、撮像部203は、レンズ部203aを通過する光の量を調整する絞りを備えていても良い。
撮像制御部204は、撮像部203による被写体の撮像を制御する。すなわち、撮像制御部204は、図示は省略するが、タイミング発生器、ドライバなどを備えている。そして、撮像制御部204は、タイミング発生器、ドライバにより電子撮像部203bを走査駆動して、所定周期毎にレンズ部203aにより結像された光学像を電子撮像部203bにより二次元の画像信号に変換させ、当該電子撮像部203bの撮像領域から1画面分ずつフレーム画像を読み出して画像処理部205に出力させる。
画像処理部205は、被写体を撮像した画像の画像データを生成する。
具体的には、画像処理部205は、電子撮像部203bから転送されたフレーム画像のアナログ値の信号に対してRGBの色成分毎に適宜ゲイン調整した後に、サンプルホールド回路(図示略)でサンプルホールドしてA/D変換器(図示略)でデジタルデータに変換し、カラープロセス回路(図示略)で画素補間処理及びγ補正処理を含むカラープロセス処理を行った後、デジタル値の輝度信号Y及び色差信号Cb,Cr(YUVデータ)を生成する。
記録媒体制御部206は、記録媒体206aが着脱自在に構成され、装着された記録媒体206aからのデータの読み出しや記録媒体206aに対するデータの書き込みを制御する。
すなわち、記録媒体制御部206は、画像処理部205により所定の圧縮形式(例えば、JPEG形式、モーションJPEG形式、MPEG形式等)で符号化された記録用の画像データを記録媒体206aの所定の記録領域に記録させる。
なお、記録媒体206aは、例えば、不揮発性メモリ(フラッシュメモリ)等により構成されている。
操作入力部207は、当該カメラ部2Aの所定操作を行うためのものである。
具体的には、操作入力部207は、例えば、装置本体の電源のON/OFFに係る電源ボタンB1、被写体の撮像指示に係るシャッターボタンB2やムービーボタンB3等(図4(b)参照)を備えている。
そして、ユーザにより各種ボタンが操作されると、操作入力部207は、操作されたボタンに応じた操作指示を中央制御部201に出力する。中央制御部201は、操作入力部207から出力され入力された操作指示に従って所定の動作を各部に実行させる。
通信部208は、コントローラ部1との間でパーソナルな無線通信を行う。
具体的には、通信部208は、コントローラ部1の通信部107と略同様の構成をなし、カメラ部2Aとコントローラ部1との両方が、電源オンの状態であり、かつ、所定速度での画像送信が可能な状態にあることを条件として通信を行う第1通信部208aと、所定速度での画像送信はできないが、カメラ部2Aとコントローラ部1とのうちのいずれか一方がスリープ状態においても通信を行うことが可能な第2通信部208bと、を具備している。
第1通信部208aは、Wi−Fi(Wireless Fidelity)(登録商標)の規格により通信を行う。
第2通信部208bは、Bluetooth(登録商標)の規格により通信を行う。
なお、第1通信部208a、第2通信部208bは、アンテナ、復調回路、信号処理回路等により構成されている。
計時部209は、例えば、タイマーや計時回路等を備えて構成され、現在の時刻を計時して時刻情報を取得する。
音入出力部210は、無指向性のマイクロフォン(収音部群;マイクロフォンM1〜M4)、ADコンバーター等の音入力部と、DAコンバーター、アンプ、スピーカー等の音出力部と、で構成される。音入出力部6は、音入力時に、マイクロフォンから音の入力を受け付け、音入力信号をデジタルの音入力情報に変換して中央制御部201に出力し、音出力時に、音出力信号をアナログの音出力信号に変換してスピーカーから音出力する。
<通信接続>
次に、コントローラ部1と各カメラ部2A,2Bとの通信接続について説明する。
本実施形態のマルチ接続カメラ100では、コントローラ部1と各カメラ部2A,2Bとの間で、例えば、予めペアリングと呼ばれる通信設定処理を行うことで、互いのデバイス情報や認証鍵のデータを無線信号により交換する。これにより、その後、通信設定処理を毎回行わなくとも、例えば、コントローラ部1とカメラ部2Aとが電波が届かない範囲に離れればBluetooth規格による通信接続が解除される一方で、電波が届く範囲に近づけば自動的にBluetooth規格による通信接続がなされる。また、このペアリングが行われることにより、Wi−Fi規格による通信設定も自動で行われるようになっている。
本実施形態のマルチ接続カメラ100では、例えば、カメラ部2Aから画像データを取得する場合には、コントローラ部1とカメラ部2Aとの間でBluetooth規格による通信接続を確立させた後、Wi−Fi接続を確立させる。そして、コントローラ部1は、第1通信部107aを介して、カメラ部2Aから画像データを取得する。また、コントローラ部1は、カメラ部2Aからの画像データの取得が終了すると、Bluetooth規格による通信により、Wi−Fi接続を切断する。
<カメラ部2の外観構成>
次に、カメラ部2の外観構成について、図4を参照して説明する。なお、カメラ部2の機能構成での説明と同様に、代表してカメラ部2Aを例示して説明する。
図4(a)は、カメラ部2Aの正面図であり、同図(b)は、カメラ部2Aの上面図である。
図4(a)及び(b)に示すように、カメラ部2Aは、筐体21と、レンズカバー22とを備えている。
筐体21は、上述の中央制御部201、メモリ202、撮像部203、撮像制御部204、画像処理部205、記録媒体制御部206、操作入力部207、通信部208、計時部209、音入出力部210のそれぞれを構成する各電子部品等を収容するものである。
また、筐体21は、図4(a)及び(b)に示すように、ベース部21aと、可動部21bとで構成されている。
ベース部21aは、可動部21bを時計回りに90度回動可能に支持する部材であり、その平面上に、可動部21bが配設されるとともに、側部上面に、操作入力部207を構成する電源ボタンB1、シャッターボタンB2及びムービーボタンB3や、フリーレバーFLが配設される。
可動部21bは、円環状をなしており、その円環内側にレンズ部203aが配設される。また、可動部21bは、レンズ部203aを保護するための半球形状の透明なレンズカバー22を支持する。また、可動部21bの側面には、レンズ部203aの光軸(可動部21bの回動軸)が対称中心となるように、音入出力部210を構成する2つのマイクロフォンM1,M2が配設される。ここで、カメラ部2Aの可動部21bが、第1撮像ユニットとしてのレンズ部203aと一体化された第1収音ユニットをなし、カメラ部2Bの可動部21bが、第2撮像ユニットとしてのレンズ部203aと一体化された第2収音ユニットをなす。
可動部21bは、図4(a)に示すように、常態のときは、2つのマイクロフォンM1,M2が図中の左右方向に位置しベース部21aと係合した状態にある。そして、可動部21bは、上述のフリーレバーFLの押下操作によって、ベース部21aとの係合が解除された状態となり、時計回りに90度回動させることが可能となる。可動部21bを時計回りに90度回動させたとき、可動部21bは、2つのマイクロフォンM1,M2が図中の上下方向に位置しベース部21aと係合した状態となる。
なお、本実施形態のカメラ部2Aでは、可動部21bが常態の位置(以下、「横撮り状態」と称することもある)にあるか、時計回りに90度回動した位置(以下、「縦撮り状態」と称することもある)にあるかを判別可能な電気的、機構的な判別手段(図示省略)を備え、撮影が行われた際の可動部21bの位置を示す情報が当該撮影により生成された画像データに付されるようになっている。
次に、カメラマウンタCMを用いることにより、背中合わせで配設された状態で一体化されたカメラ部2A,2Bの外観について、図5を参照して説明する。
図5(a)は、カメラマウンタCMに配設された2つのカメラ部2A,2Bを一方のカメラ部2Aの左斜め前方から見た状態を示す斜視図であり、同図(b)は、カメラマウンタCMに配設された2つのカメラ部2A,2Bを他方のカメラ部2Bの右斜め前方から見た状態を示す斜視図である。
図5(a)及び(b)に示すように、カメラ部2A,2Bは、カメラマウンタCMを用いることによって、それぞれの光軸が共通となるように配設されるとともに互いのレンズ面が逆方向を向くように配設された状態となり、いわゆる全天球撮影を行うことができるようになっている。
また、全天球撮影を行う場合、一方のカメラ部2Aは、図5(a)に示すように、可動部21bを常態の位置、すなわち、2つのマイクロフォンM1,M2を図中の左右方向に位置した状態(横撮り状態)にする一方で、他方のカメラ部2Bは、図5(b)に示すように、可動部21bを時計回りに90度回動させた位置、すなわち、2つのマイクロフォンM3,M4を図中の上下方向に位置した状態(縦撮り状態)にする。なお、カメラ部2Bの2つのマイクロフォンM3,M4は、カメラ部2Aの2つのマイクロフォンM1,M2に相当するものである。
図6(a)は、図5(a)及び(b)に示すカメラ部2Aの2つのマイクロフォンM1,M2、並びに、カメラ2Bの2つのマイクロフォンM3,M4の配置を模式的に示す図である。
図6(a)に示すように、カメラ2Aの2つのマイクロフォンM1,M2を図中の左右方向に配置するとともに、カメラ2Bの2つのマイクロフォンM3,M4を図中の上下方向に配置すること(第1の状態)によって、一の平面上に3つのマイクロフォン(例えば、マイクロフォンM1,M2,M3)を配置するとともに、その平面から垂直方向に離れた位置に1つのマイクロフォン(例えば、マイクロフォンM4)を配置、すなわちマイクロフォンM1〜M4がそれぞれ配置される位置を頂点として四面体を形成したこととなる。
これにより、一の平面上に配置される3つのマイクロフォンのそれぞれで収音される音の時間差によって、この音が平面上のどの位置から来たのかを特定、すなわち3つのマイクロフォンが配置された平面上での音源位置を同定することができる。具体的には、一の平面上に配置される3つのマイクロフォンM1,M2,M3のそれぞれの位置をP1,P2,P3とし、P1とP2とを焦点とする双曲線1−2と、P1とP3を焦点とする双曲線1−3とによる最大8つの交点を音源位置の候補として推定する。そして、各マイクロフォンM1,M2,M3に音が到達する時刻の大小関係を考慮することで、これらの交点から音源位置を同定する。
さらに、一の平面上から垂直方向に離れた位置に配置される1つのマイクロフォンで収音される音の時間差を加味することによって、音源の高さ位置も同定することができる。つまり、図6(a)に示すようなマイクロフォンの配置とすることによって、音源の3次元位置を同定することができる。なお、音源位置の同定方法は、上記の方法に限定されるものではない。
図6(b)は、カメラ部2A,2Bのいずれの可動部21bも常態の位置に配置したときのカメラ部2Aの2つのマイクロフォンM1,M2、並びに、カメラ2Bの2つのマイクロフォンM3,M4の配置を模式的に示す図である。
図6(b)に示すように、カメラ2Aの2つのマイクロフォンM1,M2を図中の左右方向に配置するとともに、カメラ2Bの2つのマイクロフォンM3,M4も図中の左右方向に配置すること(第2の状態)によって、一の平面上に4つのマイクロフォンM1,M2,M3,M4を配置、すなわちマイクロフォンM1〜M4がそれぞれ配置される位置を頂点として四角形を形成したこととなる。
これにより、上述した音源位置の同定方法に基づき、一の平面上に配置される4つのマイクロフォンのそれぞれで収音される音の時間差によって、この音が平面上のどの位置から来たのかを特定、すなわち4つのマイクロフォンが配置された平面上での音源位置を同定することができる。また、3つのマイクロフォンによって音源位置の同定を行う場合に比べて、同定の精度を高めることができる。したがって、例えば、「全天球撮影」モードでの撮影を屋内で行うような場合は、音源の高さ位置は予め限定され当該音源の高さ位置を同定する必要性が低いため、図6(b)に示すように、カメラ2Aの2つのマイクロフォンM1,M2を図中の左右方向に配置するとともに、カメラ2Bの2つのマイクロフォンM3,M4も図中の左右方向に配置、すなわち各カメラ部2A,2Bを横撮り状態にしても良い。
<全天球画像データ生成処理>
次に、コントローラ部1で実行される全天球画像データ生成処理について、図7を参照して説明する。
図7に示すように、コントローラ部1の中央制御部101は、先ず、「全天球撮影」モードにてカメラ部2A,2Bで同時撮影された各動画像の画像データを、第1通信部108aを介して取得する(ステップS1)。
次いで、中央制御部101は、カメラ部2A,2Bから取得された各動画像の画像データを映像データと音データとに分離する(ステップS2)。具体的には、中央制御部101は、カメラ部2Aから取得された動画像の画像データを、映像データと、マイクロフォンM1により収音された音データと、マイクロフォンM2により収音された音データとに分離する。また、中央制御部101は、カメラ部2Bから取得された動画像の画像データを、映像データと、マイクロフォンM3により収音された音データと、マイクロフォンM4により収音された音データとに分離する。
次いで、中央制御部101は、ステップS1で取得された画像データに付された可動部21bの位置を示す情報に基づき、カメラ部2A,2Bで全天球撮影が行われた際、カメラ部2A,2Bのうちの一方のカメラ部2が縦撮り状態であったか否かを判定する(ステップS3)。
ステップS3において、一方のカメラ部2が縦撮り状態であったと判定された場合(ステップS3;YES)、中央制御部101は、縦撮り状態のカメラ部2(例えば、カメラ部2B)により撮影された映像(半球状の映像)を反時計回りに90度回動、すなわち横撮り状態の映像に変換して、他方のカメラ部2、すなわち横撮り状態のカメラ部2(例えば、カメラ部2A)により撮影された映像(半球状の映像)と合成(マージ)して全天球映像を生成し、生成された全天球映像の画像データと、カメラマウンタCMを基準としたxyz座標系における位置を示す位置データと、を対応付けてメモリ102に一時記憶する(ステップS4)。なお、全天球映像の画像データと対応付けられる位置データは、後述のステップS5で同定される音源位置を示す位置データと座標系が同一であるものとする。
次いで、中央制御部101は、段落0051で説明した音源位置の同定方法に基づき、所定の単位時間ごとに、4つのマイクロフォンM1〜M4のそれぞれで収音された音データから音源位置を同定し、同定された音源位置を示す位置データと、当該音データとを対応付けてメモリ102に一時記憶する(ステップS5)。ここで、位置データは、カメラマウンタCMを基準としたxyz座標系における位置を示すデータである。なお、上述のように、所定の単位時間ごとに音源位置を同定しているのは、ステップS4で生成された全天球映像のフレーム画像に対応させるためである。
次いで、中央制御部101は、ステップS5で記憶された所定の単位時間ごとの音データに対応する位置データに応じて、所定のテーブルを検索することによって、当該音データの方向データ(前後、左右、上下を示すデータ)を取得し、取得した方向データを音データと対応付け、更に全天球映像の画像データと対応付けられている位置データに基づいて当該全天球映像の画像データも対応付けて記録媒体105aに記憶し(ステップS6)、全天球画像データ生成処理を終了する。これにより、例えば、頭部に装着し眼前前面に映像が表示されるヘッドマウントディスプレイを用いて全天球映像を再生した場合、ヘッドマウントディスプレイに搭載されているジャイロセンサによってユーザの視線方向を検出することができるため、検出されたユーザの視線方向に応じた全天球画像データ及び音データを再生することが可能となる。
また、ステップS3において、一方のカメラ部2が縦撮り状態でない、すなわち両方のカメラ部2が横撮り状態(又は縦撮り状態)であったと判定された場合(ステップS3;NO)、中央制御部101は、各カメラ部2A,2Bにより撮影された映像(半球状の映像)を合成(マージ)して全天球映像を生成し、生成された全天球映像の画像データと、カメラマウンタCMを基準としたxyz座標系における位置を示す位置データと、を対応付けてメモリ102に一時記憶する(ステップS7)。なお、全天球映像の画像データと対応付けられる位置データは、後述のステップS8で同定される音源位置を示す位置データと座標系が同一であるものとする。
次いで、中央制御部101は、段落0052で説明した音源位置の同定方法に基づき、所定の単位時間ごとに、4つのマイクロフォンM1〜M4のそれぞれで収音された音データから音源位置を同定し、同定された音源位置を示す位置データと、当該音データとを対応付けてメモリ102に一時記憶する(ステップS8)。
次いで、中央制御部101は、ステップS8で記憶された所定の単位時間ごとの音データに対応する位置データに応じて、所定のテーブルを検索することによって、当該音データの方向データ(前後、左右を示すデータ)を取得し、取得した方向データを音データと対応付け、更に全天球映像の画像データと対応付けられている位置データに基づいて当該全天球映像の画像データも対応付けて記録媒体105aに記憶し(ステップS9)、全天球画像データ生成処理を終了する。これにより、ステップS1〜S6の処理の流れで全天球画像データを生成した場合と同様に、ヘッドマウントディスプレイを用いて全天球映像を再生した場合、ヘッドマウントディスプレイに搭載されているジャイロセンサによってユーザの視線方向を検出することができるため、検出されたユーザの視線方向に応じた全天球画像データ及び音データを再生することが可能となる。
以上のように、本実施形態のマルチ接続カメラ100は、音を収音する少なくとも3つ以上の複数のマイクロフォンM1〜M4を有し、複数のマイクロフォン(例えば、マイクロフォンM1〜M3)の位置関係を相対的に変更可能に構成し、位置関係が変更された複数のマイクロフォンM1〜M4で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成するので、臨場感のある音像を再生することが可能となる。
また、本実施形態のマルチ接続カメラ100は、4つのマイクロフォンM1〜M4の各々の位置を頂点として四面体を形成する第1の状態(例えば、カメラ部2Aを横撮り状態、カメラ部2Bを縦撮り状態)に、4つのマイクロフォンM1〜M4の位置関係を相対的に変換可能であり、第1の状態にあるときのマイクロフォンM1〜M4で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成するので、当該再生用音データによって、音の伝わる方向を3次元的に知覚することができ、より臨場感のある音像を再生することが可能となる。
また、本実施形態のマルチ接続カメラ100は、4つのマイクロフォンM1〜M4の各々の位置を頂点として四角形を形成する第2の状態(例えば、カメラ部2Aを横撮り状態、カメラ部2Bを横撮り状態)に、4つのマイクロフォンM1〜M4の位置関係を相対的に変更可能であり、第2の状態にあるときのマイクロフォンM1〜M4で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成するので、当該再生用音データでは、音の伝わる方向を精度よく再現することができ、より臨場感のある音像を再生することが可能となる。
また、本実施形態のマルチ接続カメラ100は、カメラ部2Aの可動部21bを平行な2平面のうちの一方の平面上に配置するとともに、カメラ部2Bの可動部21bを他方の平面上に配置し、カメラ部2Aの可動部21bとカメラ部2Bの可動部21bとのうちの少なくともいずれか一方を、配置された平面上を移動させることによって、第1の状態と第2の状態とに4つのマイクロフォンM1〜M4の位置関係を変更可能であるので、4つのマイクロフォンM1〜M4を一つずつ移動させる必要がなく、第1の状態又は第2の状態への変更操作を容易に行うことができる。
また、本実施形態のマルチ接続カメラ100は、カメラ部2Aの可動部21b(第1収音ユニット)とカメラ部2Bの可動部21b(第2収音ユニット)とのうちの少なくともいずれか一方を、配置された平面上を2つのマイクロフォンM1〜M2(M3〜M4)の中間点を中心に回転移動させることによって、第1の状態と第2の状態とに4つのマイクロフォンM1〜M4の位置関係を変更可能であるので、4つのマイクロフォンM1〜M4を一つずつ移動させる必要がなく、第1の状態又は第2の状態への変更操作を容易に行うことができる。
また、本実施形態のマルチ接続カメラ100は、一方の平面上に配置され動画像を撮像可能なカメラ部2Aの撮像部203(第1撮像ユニット)と、他方の平面上に配置され動画像を撮像可能なカメラ部2Bの撮像部203(第2撮像ユニット)と、を備え、カメラ部2Aの撮像部203及びカメラ部2Bの撮像部203により撮像された動画像に基づき、各撮像部203の撮像範囲を網羅した全天球映像を再生するための全天球画像データ(再生用動画像データ)を生成し、当該全天球画像データを生成する際に、音の伝わる方向を知覚可能な音像を再生するための再生用音データと対応付けて全天球画像データを生成したこととなる。
このため、ユーザが見る方向の全天球映像に対応した音を当該音の音源が感じられるように出力することができる全天球画像データを生成可能となるので、臨場感のあるバーチャルリアリティな空間を再生することが可能となる。
また、本実施形態のマルチ接続カメラ100は、カメラ部2Aのレンズ部203a(第1撮像ユニット)の光軸が、一方の平面に対して垂直をなし、且つ、カメラ部2Aの可動部21b(第1収音ユニット)の2つのマイクロフォンM1〜M2の中間点を通過するように、カメラ部2Aのレンズ部203aと可動部21bとが一体として設けられるとともに、カメラ部2Bのレンズ部203a(第2撮像ユニット)の光軸が、他方の平面に対して垂直をなし、且つ、カメラ部2Bの可動部21b(第2収音ユニット)の2つのマイクロフォンM3〜M4の中間点を通過するように、カメラ部2Bのレンズ部203aと可動部21bとが一体として設けられているので、マルチ接続カメラ100のコンパクト化を図ることができる。
以上、本発明の実施形態について説明したが、本発明は、かかる実施形態に限定されず、その要旨を逸脱しない範囲で、種々変形が可能であることは言うまでもない。
例えば、上記実施形態では、4つのマイクロフォンM1〜M4を配設したが、複数のマイクロフォンがそれらの位置関係を相対的に変更可能に配設されているという条件を満たすのであれば、マイクロフォンの数はこれに限らず、5つ以上のマイクロフォンを配設するようにしても良い。
また、上記実施形態では、各マイクロフォンM1〜M4は、いずれも無指向性のマイクロフォンとしたが、これに限定されるものではなく、指向性を有するマイクロフォンとしても良い。かかる場合、指向性を有するマイクロフォンM1〜M4で収音された各音の音データと、各マイクロフォンが対応する方向を表す方向データと、全天球映像データとを、全天球映像上の座標で対応付けることにより、全天球画像データを生成するようにしても良い。この場合、各マイクロフォンが対応する上記の方向データを用いて、収音された音の方向を特定することができる。
また、上記実施形態では、音源の位置と当該音源の高さを同定する場合、図5(b)に示すように、カメラ部2Bの可動部21bを時計回りに90度回動させることによって、マイクロフォンM1〜M4がそれぞれ配置される位置を頂点として四面体を形成するようにしたが(図6(a)参照)、音源の位置と当該音源の高さを同定するためには、マイクロフォンM1〜M4がそれぞれ配置される位置を頂点として四面体を形成することができれば良く、カメラ部2Bの可動部21bの回動角度は時計回り90度に限定されない。ただし、かかる場合には、各カメラ部2は、可動部21bが常態の位置にあるか、時計回りに90度回動した位置にあるかだけでなく、可動部21bの常態の位置を基準とした回動角度を判別可能な電気的、機構的な判別手段(図示省略)を備え、撮影が行われた際の可動部21bの位置を示す情報が当該撮影により生成された画像データに付されるようにする。
また、上記実施形態では、全天球画像データ生成処理(図7参照)のステップS6,S9において、同定された位置データに基づいて、音データの方向データを取得するようにしたが、これに限定されるものではない。例えば、音データの方向データを取得せずに、水平方向及び垂直方向を含む全方向に視野を有する全天球映像上の座標位置に対応付けたテーブルを作成し、作成されたテーブルを音データ及び位置データとともに記憶するようにしても良い。
また、上記実施形態では、全天球画像データ生成処理において、全天球映像の画像データと音データとを対応付けるようにしたが、当該音データと対応付ける画像データは、全天球映像の他に、例えば、水平方向に360度の視野を有する全周囲映像や垂直方向に360度の視野を有する半天球映像の画像データであっても良い。
また、上記実施形態では、全天球画像データ生成処理をコントローラ部1の中央制御部101で行うようにしたが、これに限定されるものではない。例えば、カメラ部2A及び2Bを、それらの中央制御部201、201の間でデータを相互に通信可能に構成し、当該中央制御部201、201の一方で全天球画像データ生成処理を行っても良い。
以上、本発明の実施形態を説明したが、本発明の範囲は、上述の実施の形態に限定するものではなく、特許請求の範囲に記載された発明の範囲をその均等の範囲を含む。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
〔付記〕
<請求項1>
音を収音する少なくとも3つ以上の複数の収音部を有し、前記複数の収音部の位置関係を相対的に変更可能に構成された収音部群と、
前記位置関係が変更された前記複数の収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成する音データ生成手段と、
を備えることを特徴とする情報処理装置。
<請求項2>
前記収音部群は、
前記複数の収音部として、4つの収音部を有し、
前記4つの収音部の各々の位置を頂点として四面体を形成する第1の状態に、前記4つの収音部の位置関係を相対的に変更可能であり、
前記音データ生成手段は、前記収音部群が前記第1の状態にあるときの前記4つの収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項1に記載の情報処理装置。
<請求項3>
前記収音部群は、更に、前記4つの収音部の各々の位置を頂点として四角形を形成する第2の状態に、前記4つの収音部の位置関係を相対的に変更可能であり、
前記音データ生成手段は、前記収音部群が前記第2の状態にあるときの前記4つの収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項2に記載の情報処理装置。
<請求項4>
前記収音部群は、
前記4つの収音部のうちの2つの収音部を備える第1収音ユニットと、残りの2つの収音部を備える第2収音ユニットとで構成され、
前記第1収音ユニットを平行な2平面のうちの一方の平面上に配置するとともに、前記第2収音ユニットを他方の平面上に配置し、
前記第1収音ユニットと前記第2収音ユニットとのうちの少なくともいずれか一方を、配置された平面上を移動させることによって、前記第1の状態と前記第2の状態とに前記4つの収音部の位置関係を変更可能であることを特徴とする請求項3に記載の情報処理装置。
<請求項5>
前記収音部群は、前記第1収音ユニットと前記第2収音ユニットとのうちの少なくともいずれか一方を、配置された平面上を前記2つの収音部の中間点を中心に回転移動させることによって、前記第1の状態と前記第2の状態とに前記4つの収音部の位置関係を変更可能であることを特徴とする請求項4に記載の情報処理装置。
<請求項6>
前記一方の平面上に配置され動画像を撮像可能な第1撮像ユニットと、
前記他方の平面上に配置され動画像を撮像可能な第2撮像ユニットと、
前記第1撮像ユニット及び前記第2撮像ユニットにより撮像された動画像に基づき、各撮像ユニットの撮像範囲を網羅した動画像を再生するための再生用動画像データを生成する動画像データ生成手段と、
を備え、
前記動画像データ生成手段は、前記再生用音データと対応付けて前記再生用動画像データを生成することを特徴とする請求項5に記載の情報処理装置。
<請求項7>
前記第1撮像ユニットの光軸が、前記一方の平面に対して垂直をなし、且つ、前記第1収音ユニットの2つの収音部の中間点を通過するように、前記第1撮像ユニットと前記第1収音ユニットとが一体として設けられるとともに、
前記第2撮像ユニットの光軸が、前記他方の平面に対して垂直をなし、且つ、前記第2収音ユニットの2つの収音部の中間点を通過するように、前記第2撮像ユニットと前記第2収音ユニットとが一体として設けられることを特徴とする請求項6に記載の情報処理装置。
<請求項8>
前記複数の収音部で収音された音の発生位置又は方向を特定する特定手段をさらに備え、
前記音データ生成手段は、前記特定手段により特定された音の発生位置又は方向にさらに基づいて、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
100 マルチ接続カメラ
1 コントローラ部
101 中央制御部
102 メモリ
103 表示部
104 表示制御部
105 記録媒体制御部
105a 記録媒体
106 操作入力部
107 通信部
108 計時部
2,2A,2B カメラ部
21 筐体
21a ベース部
21b 可動部
22 レンズカバー
201 中央制御部
202 メモリ
203 撮像部
203a レンズ部
203b 電子撮像部
204 撮像制御部
205 画像処理部
206 記録媒体制御部
206a 記録媒体
207 操作入力部
208 通信部
209 計時部
210 音入出力部
CM カメラマウンタ
M1,M2,M3,M4 マイクロフォン

Claims (8)

  1. 音を収音する少なくとも3つ以上の複数の収音部を有し、前記複数の収音部の位置関係を相対的に変更可能に構成された収音部群と、
    前記位置関係が変更された前記複数の収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための再生用音データを生成する音データ生成手段と、
    を備えることを特徴とする情報処理装置。
  2. 前記収音部群は、
    前記複数の収音部として、4つの収音部を有し、
    前記4つの収音部の各々の位置を頂点として四面体を形成する第1の状態に、前記4つの収音部の位置関係を相対的に変更可能であり、
    前記音データ生成手段は、前記収音部群が前記第1の状態にあるときの前記4つの収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項1に記載の情報処理装置。
  3. 前記収音部群は、更に、前記4つの収音部の各々の位置を頂点として四角形を形成する第2の状態に、前記4つの収音部の位置関係を相対的に変更可能であり、
    前記音データ生成手段は、前記収音部群が前記第2の状態にあるときの前記4つの収音部で収音された音に基づき、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項2に記載の情報処理装置。
  4. 前記収音部群は、
    前記4つの収音部のうちの2つの収音部を備える第1収音ユニットと、残りの2つの収音部を備える第2収音ユニットとで構成され、
    前記第1収音ユニットを平行な2平面のうちの一方の平面上に配置するとともに、前記第2収音ユニットを他方の平面上に配置し、
    前記第1収音ユニットと前記第2収音ユニットとのうちの少なくともいずれか一方を、配置された平面上を移動させることによって、前記第1の状態と前記第2の状態とに前記4つの収音部の位置関係を変更可能であることを特徴とする請求項3に記載の情報処理装置。
  5. 前記収音部群は、前記第1収音ユニットと前記第2収音ユニットとのうちの少なくともいずれか一方を、配置された平面上を前記2つの収音部の中間点を中心に回転移動させることによって、前記第1の状態と前記第2の状態とに前記4つの収音部の位置関係を変更可能であることを特徴とする請求項4に記載の情報処理装置。
  6. 前記一方の平面上に配置され動画像を撮像可能な第1撮像ユニットと、
    前記他方の平面上に配置され動画像を撮像可能な第2撮像ユニットと、
    前記第1撮像ユニット及び前記第2撮像ユニットにより撮像された動画像に基づき、各撮像ユニットの撮像範囲を網羅した動画像を再生するための再生用動画像データを生成する動画像データ生成手段と、
    を備え、
    前記動画像データ生成手段は、前記再生用音データと対応付けて前記再生用動画像データを生成することを特徴とする請求項5に記載の情報処理装置。
  7. 前記第1撮像ユニットの光軸が、前記一方の平面に対して垂直をなし、且つ、前記第1収音ユニットの2つの収音部の中間点を通過するように、前記第1撮像ユニットと前記第1収音ユニットとが一体として設けられるとともに、
    前記第2撮像ユニットの光軸が、前記他方の平面に対して垂直をなし、且つ、前記第2収音ユニットの2つの収音部の中間点を通過するように、前記第2撮像ユニットと前記第2収音ユニットとが一体として設けられることを特徴とする請求項6に記載の情報処理装置。
  8. 前記複数の収音部で収音された音の発生位置又は方向を特定する特定手段をさらに備え、
    前記音データ生成手段は、前記特定手段により特定された音の発生位置又は方向にさらに基づいて、当該音の伝わる方向を知覚可能な音像を再生するための前記再生用音データを生成することを特徴とする請求項1から7のいずれか1項に記載の情報処理装置。
JP2018053898A 2018-03-22 2018-03-22 情報処理装置 Pending JP2019169762A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018053898A JP2019169762A (ja) 2018-03-22 2018-03-22 情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018053898A JP2019169762A (ja) 2018-03-22 2018-03-22 情報処理装置

Publications (1)

Publication Number Publication Date
JP2019169762A true JP2019169762A (ja) 2019-10-03

Family

ID=68108551

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018053898A Pending JP2019169762A (ja) 2018-03-22 2018-03-22 情報処理装置

Country Status (1)

Country Link
JP (1) JP2019169762A (ja)

Similar Documents

Publication Publication Date Title
JP7268369B2 (ja) 撮像システム、現像システム、撮像方法、及びプログラム
JP7322940B2 (ja) 画像通信システム、画像通信端末、画像通信方法、プログラム、及び記録媒体
JP6805861B2 (ja) 画像処理装置、画像処理システム、画像処理方法及びプログラム
US9374529B1 (en) Enabling multiple field of view image capture within a surround image mode for multi-LENS mobile devices
US20210219049A1 (en) Microphone pattern based on selected image of dual lens image capture device
KR102324702B1 (ko) 복수의 카메라를 통해 수신되는 이미지를 처리하기 위한 장치 및 방법
US20140204234A1 (en) Photographing unit, cooperative photographing method, and recording medium having recorded program
JP6455474B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP7196399B2 (ja) 音響装置、音響システム、方法およびプログラム
US20220070412A1 (en) Communication terminal, image communication system, method of displaying image, and recording medium
TW201734948A (zh) 用於在廣角圖像系統中生成相關的音頻和視覺信號的方法、系統及設備
CN103795937A (zh) 信息处理设备、显示设备、信息处理设备控制方法及程序
JP2023027280A (ja) 音響装置、撮像装置、音響システム、方法およびプログラム
CN114073069A (zh) 成像系统、图像处理设备、成像装置和记录介质
JP2020204874A (ja) 画像処理システム、撮像システム、画像処理装置、撮像装置およびプログラム
JP7017045B2 (ja) 通信端末、表示方法、及びプログラム
JP6878974B2 (ja) 撮像装置、撮像システム
JP2019169762A (ja) 情報処理装置
JP2019140667A (ja) 情報処理装置、情報処理システム、データ生成方法およびプログラム
JP7205323B2 (ja) 通信端末、画像通信システム、表示方法、及びプログラム
KR101729073B1 (ko) 디스플레이 장치에 표시되는 영상의 방향 변화에 따라 소리의 위상을 전환시키는 방법 및 시스템
JP2019062534A (ja) 通信端末、画像通信システム、表示方法、及びプログラム
US11356786B2 (en) Method and apparatus for wind noise detection and beam pattern processing
JP6218615B2 (ja) 表示機器、表示方法、撮影装置及び撮影システム
US11863871B2 (en) Communication terminal, image communication system, and method of displaying image