JP2018152846A - 音響記録装置、音響システム、音響記録方法、プログラムおよびデータ構造 - Google Patents

音響記録装置、音響システム、音響記録方法、プログラムおよびデータ構造 Download PDF

Info

Publication number
JP2018152846A
JP2018152846A JP2018030769A JP2018030769A JP2018152846A JP 2018152846 A JP2018152846 A JP 2018152846A JP 2018030769 A JP2018030769 A JP 2018030769A JP 2018030769 A JP2018030769 A JP 2018030769A JP 2018152846 A JP2018152846 A JP 2018152846A
Authority
JP
Japan
Prior art keywords
acoustic
sound
data
image
recording
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018030769A
Other languages
English (en)
Other versions
JP7196399B2 (ja
Inventor
篤 松浦
Atsushi Matsuura
篤 松浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to CA3054890A priority Critical patent/CA3054890A1/en
Priority to CN201880017543.0A priority patent/CN110463226B/zh
Priority to PCT/JP2018/009889 priority patent/WO2018168902A1/en
Priority to US16/490,825 priority patent/US11490199B2/en
Priority to EP18715142.8A priority patent/EP3596940A1/en
Publication of JP2018152846A publication Critical patent/JP2018152846A/ja
Priority to JP2022199878A priority patent/JP2023027280A/ja
Application granted granted Critical
Publication of JP7196399B2 publication Critical patent/JP7196399B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/20Arrangements for obtaining desired frequency or directional characteristics
    • H04R1/32Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
    • H04R1/40Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers
    • H04R1/406Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only by combining a number of identical transducers microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Health & Medical Sciences (AREA)
  • Studio Devices (AREA)
  • Stereophonic System (AREA)
  • Television Signal Processing For Recording (AREA)

Abstract

【課題】 音響記録装置を提供すること。【解決手段】音響記録装置110は、音を収音する複数の収音手段144A〜144Dと、音響記録装置110の姿勢を計測する計測手段136と、該姿勢が計測された時点に対応する、複数の収音手段144A〜114D各々で収音された音に基づく音響情報とを関連付けて記録する記録手段224とを含む。また、音響記録装置110を含む音響システムは、音を収音する複数の収音手段144A〜144Dと、音響記録装置110の姿勢を計測する計測手段136と、姿勢が計測された所定時点に対応する、複数の収音手段144各々で収音された音に基づく音響情報とを関連付けて記録する記録手段224を含む。【選択図】 図2

Description

本開示は、音響記録装置、音響システム、音響記録方法、プログラムおよびデータ構造に関する。
従来、全方位の音場を再現する立体音響技術として、アンビソニックス(Ambisonics)や波面合成法(WFS:Wave Field Synthesis)等が知られている。アンビソニックスおよび波面合成法は、音響理論に基づいて音場の高精度な再現を目指す技術である。例えば、アンビソニックスでは、複数のマイクロホンから記録した音に所定の信号処理を施すことにより、試聴位置における音の方向性を再現する。
これら音場再現方法では、通常、マイクロホンの配置など収音条件を高精度に整える必要がある。例えば、アンビソニックスでは、アンビソニックス・マイクロホンと呼ばれるマイクロホンを配置や向きを高精度に合わせて設置する必要がある。
音響技術に関連して、特許第5777185号(特許文献1)が知られている。特許文献1には、全方位動画をライブ配信する目的で、カメラの撮影時に同期して立体音声を取得し、配信サーバを使用して全方位動画と立体音声を配信し、ユーザが試聴する表示範囲にあわせて音声データを再生する動画配信システムが開示されている。しかしながら、特許文献1でも、違和感のない音を再生する課題を解消できるものではなかった。
本開示は、従来技術の上記点に鑑みてなされたものであり、違和感のない音を再生するための音響記録装置を提供することを目的とする。
本発明の実施形態によれば、下記特徴を有する、音響記録装置が提供される。音響記録装置は、音を収音する複数の収音手段と、前記音響記録装置の姿勢を計測する計測手段と、姿勢が計測された所定時点に対応する、複数の収音手段各々で収音された音に基づく音響情報とを関連付けて記録する記録手段とを含む。
上記構成により、違和感のない音を再生することができる。
本実施形態による全天球撮像装置のハードウェア構成図。 本実施形態による全天球撮像装置上で実現される画像および音響の記録機能に関連する機能ブロック図。 本実施形態による全天球撮像装置において記録されるファイルのデータ構造を例示する図。 本実施形態による全天球撮像装置が実行する、画像音響記録方法を示すフローチャート。 本実施形態による全天球撮像装置が実行する、画像音響再生方法を示すフローチャート。 立体音響としてアンビソニックを採用する特定の実施形態における音響データの収音から再生までの流れを説明する図。 特定の実施形態において立体音響における座標軸を説明する図。 他の実施形態による全天球撮像装置上で実現される画像音響記録機能に関連する機能ブロック図。
以下、本実施形態をもって説明するが、実施形態は、後述する実施形態に限定されるものではない。なお、以下に説明する実施形態では、音響記録装置および音響システムとして、音響記録機能を備えた全天球撮像装置110を一例に説明する。しかしながら、音響記録装置および音響システムは、以下に説明する特定の実施形態に限定されるものではない。
以下に説明する実施形態において、全天球撮像装置110は、それぞれ結像光学系および撮像素子から構成される複数の撮像光学系を備え、撮像光学系毎に各方向から撮影して撮像画像を生成する。撮像光学系は、180度(=360度/n;n=2)より大きい全画角を有し、好ましくは、185度以上の全画角を有し、より好ましくは、190度以上の全画角を有する。全天球撮像装置110は、複数の撮像光学系を通してそれぞれ撮像された撮像画像をつなぎ合わせて合成し、立体角4πステラジアンの画像(以下「全天球画像」と参照する。)を生成する。全天球画像は、撮影地点から見渡すことのできる全ての方向を撮影したものとなる。なお、単一の光学系で半球画像を撮影してもよい。
本実施形態における全天球撮像装置110は、さらに、複数のマイクロホンなどの収音手段を備えている。複数のマイクロホンからの各音響信号に基づいて、音響データを記録する。記録される音響データは、立体音響を構成可能なので、所定の構成のスピーカセットやヘッドホンを用いて、音の方向性を含む音場が再現される。
以下、図1を参照しながら、まず、全天球撮像装置110のハードウェア構成について説明する。図1は、本実施形態による全天球撮像装置110のハードウェア構成図である。なお、図1に示す全天球撮像装置110は、180度より大きい全画角を有する2つの光学系を組み合わせた2眼の全天球撮像装置として構成されている。
全天球撮像装置110は、CPU(Central Processing Unit)112と、ROM(Read Only Memory)114と、画像処理ブロック116と、動画ブロック118と、DRAM(Dynamic Random Access Memory)インタフェース120を介して接続されるDRAM132と、外部センサインタフェース124を介して接続される加速度センサ/ジャイロセンサ/地磁気センサ(加速度センサ、ジャイロセンサおよび地磁気センサの少なくとも1つを含む。)136とを含み構成される。
CPU112は、全天球撮像装置110の各部の動作および全体動作を制御する。ROM114は、CPU112が解読可能なコードで記述された制御プログラムや各種パラメータを格納する。
全天球撮像装置110は、CCD(Charge Coupled Device)センサやCMOS(Complementary Metal Oxide Semiconductor)センサなどの2つの撮像素子130A,130Bと2つの光学系131A,131Bとを有する。なお、説明する実施形態では、光学系131は、魚眼レンズを含み、ここで、魚眼レンズは、広角レンズや、超広角レンズと呼ばれるものを含むものとする。画像処理ブロック116は、2つの撮像素子130A,130Bと接続され、それぞれで撮像された画像の画像信号が入力される。画像処理ブロック116は、ISP(Image Signal Processor)などを含み構成され、撮像素子130から入力された画像信号に対し、シェーディング補正、ベイヤー補間、ホワイト・バランス補正、ガンマ補正などを行う。
本実施形態において、2つの撮像素子130A,130Bでそれぞれ撮像された画像は、例えば画像処理ブロック116で、重複部分を基準として合成処理されて、これにより、立体角4πステラジアンの全天球画像が生成される。光学系が180度を超える全画角を有するため、撮像した各撮像画像の180度を超えた部分の撮影範囲が重複する。合成処理の際には、この重複領域が同一像を表す基準として参照されて、全天球画像が生成される。そして、全天球画像の連続するフレームにより、全天球動画が構成される。複数の撮像素子130A,130Bおよび複数の光学系131A,131Bを含む撮像体は、本実施形態における撮像手段を構成する。
ここで、説明する実施形態では、撮影地点から見渡すことのできる全ての方向を撮影した全天球映像を生成するものとして説明するが、これに限定されるものではない。他の実施形態では、水平面のみ360度を撮影した、いわゆるパノラマ映像であってもよい。また、説明する実施形態では、2つの撮像光学系を含み構成されるものとして説明するが、撮像光学系の数は、特に限定されるものではない。他の実施形態では、全天球撮像装置110は、3つ以上の光学系に含む撮像体を備えるとともに、3つ以上の光学系で撮像された複数の撮像画像に基づいて全天球画像を生成する機能を備えていてもよい。他の実施形態では、全天球撮像装置110は、単一の魚眼レンズを光学系に含む撮像体を備え、単一の魚眼レンズで異なる方位で撮像された複数の撮像画像に基づいて全天球画像を生成する機能を備えていてもよい。
動画ブロック118は、H.264(MPEG(Moving Picture Experts Group)−4 AVC(Advanced Video Coding))/H.265(ISO/IEC 23008-2 HEVC(High Efficiency Video Coding))などの動画圧縮および伸張を行うコーデック・ブロックである。DRAM132は、各種信号処理および画像処理を施す際にデータを一時的に保存する記憶領域を提供する。
加速度センサ/ジャイロセンサ/地磁気センサ136は、速度、加速度、角速度、角加速度、磁気方位などの全天球撮像装置110の動きに起因した物理量を計測するものである。計測された物理量は、全天球画像および音響の天頂補正および水平面での回転補正のいずれか一方または両方を施す際に用いられる。計測された物理量は、全天球撮像装置110の姿勢を示すものであり、加速度センサ/ジャイロセンサ/地磁気センサ136は、本実施形態における、全天球撮像装置110の姿勢を計測する計測手段を構成する。
加速度センサは、例えば、公知の3軸加速度センサなどを用いることができ、各軸の加速度を検出する。加速度センサとしては、例えば、ピエゾ抵抗型加速度センサ、静電容量型加速度センサ、熱検知型加速度センサなどを挙げることができる。ジャイロセンサは、例えば、3軸方向の角速度を検出可能な、公知の角速度センサを用いることができる。地磁気センサは、地球の3軸方向の地磁気を検出することで、全天球撮像装置110を原点とした各方位(方位角、磁北)の方向を導出する。地磁気センサとしては、公知の3軸電子コンパスなどを挙げることができる。
全天球撮像装置110は、外部ストレージインタフェース122を含み構成される。外部ストレージインタフェース122には、外部ストレージ134が接続される。外部ストレージインタフェース122は、メモリカードスロットに挿入されたメモリカードなどの外部ストレージ134に対する読み書きを制御する。外部ストレージ134は、全天球動画データやその音響データを記録する記録媒体として用いることができる。なお、DRAM132等に全天球動画データやその音響データを一時的に保存しておいて、外部装置で各種処理を実行させてもよい。
全天球撮像装置110は、USB(Universal Serial Bus)インタフェース126を含み構成される。USBインタフェース126には、USBコネクタ138が接続される。USBインタフェース126は、USBコネクタ138を介して接続されるパーソナル・コンピュータやスマートフォンやタブレット・コンピュータなどの外部装置とのUSB通信を制御する。全天球撮像装置110は、シリアルブロック128を含み構成される。シリアルブロック128は、外部装置とのシリアル通信を制御し、無線通信インタフェース140が接続される。
USBコネクタ138や無線通信インタフェース140を介して外部のパーソナル・コンピュータやスマートフォンやタブレット・コンピュータ等の外部装置と接続することができる。そして、外部装置が備えるディスプレイ、または、接続されるディスプレイ上に、全天球撮像装置110で撮影された映像を表示することができる。全天球撮像装置110は、図1に示すもののほか、HDMI(商標または登録商標)などの映像出力インタフェースを有していてもよい。その場合に、全天球撮像装置110は、映像出力インタフェースを介してディスプレイなどの外部の表示装置に直接接続され、表示装置上で映像を表示することができる。
本実施形態における全天球撮像装置110は、ADC(Analog to Digital Converter)142と、ADC142に接続される複数のマイクロホン144とを含み構成される。マイクロホン144は、それぞれ、全天球撮像装置110の周辺環境から収音し、収音した音響信号をADC142に入力する。ADC142は、マイクロホン144から入力される音響信号をサンプリングし、デジタル形式の音響データに変換する。なお、説明する実施形態では、マイクロホン144は、所定の配置構成を有する4つのマイクロホン144A〜144Dを含み構成されており、好ましくは、アンビソニックス・マイクロホンである。マイクロホン144は、本実施形態において、それぞれ周辺環境から収音する収音手段を構成する。説明する実施形態では、全天球撮像装置110に内蔵されるマイクロホン144のみを示すが、全天球撮像装置110に外付けされたマイクロホンが備えられてもよい。
全天球撮像装置110は、ユーザによる各種操作指示を受け付ける操作部146を含み構成される。操作部146は、特に限定されるものではないが、切替スイッチ148と、レリーズスイッチ150とを含む。操作部146は、切替スイッチ148およびレリーズスイッチ150のほか、他の操作指示を行うためのスイッチを含んでいてもよい。切替スイッチ148は、ユーザからの動画像撮影および静止画像撮影の切替指示を受け付ける。レリーズスイッチ150は、ユーザからの撮影指示を受け付ける。
レリーズスイッチ150の長押し操作など電源投入操作によって電源がオン状態になると、ROM114などから制御プログラムが読みだされて、DRAM132などのメインメモリにロードされる。CPU112は、DRAM132などのメインメモリに読み込まれたプログラムに従って、装置各部の動作を制御するとともに、制御に必要なデータをメモリ上に一時的に保存する。これにより、画像および音響の記録に関する全天球撮像装置110の各機能部および処理が実現される。
全天球撮像装置110により撮像された動画は、一例として専用の画像ビューア・アプリケーションなどを備えた外部装置を用いて閲覧および視聴することができる。外部装置とは、例えばパーソナル・コンピュータ、スマートフォン、タブレット・コンピュータなどである。あるいは、全天球撮像装置110に、HDMI(High-Definition Multimedia Interface,HDMIは商標または登録商標)などの映像出力インタフェースまたはMiracast(商標または登録商標)やAirPlay(商標または登録商標)などの無線通信インタフェース140を介して表示装置と接続して動画を閲覧および視聴することができる。
全天球撮像装置110を三脚で固定した状態だけでなく、全天球撮像装置110を手持ちした状態でも記録される。つまり、全天球撮像装置110は、常に全天球撮像装置110の姿勢および位置が固定されているとは限らない。そのため、撮影時や記録時の全天球撮像装置110の姿勢の変動に起因して、マイクロホンで記録した音が視聴者の意図した方向とずれたように感じさせてしまう可能性がある。全天球画像に対して天頂補正を行っている場合、天頂補正に伴ってマイクロホンで記録した音も天頂方向を補正していない場合は、視聴者がよりずれを感じさせてしまう可能性がある。
以下、全天球撮像装置110の姿勢の変動に起因した視聴時の不自然さを軽減することができる、本実施形態による全天球撮像装置110が備える画像音響記録機能について、図2〜図7を参照しながら説明する。
図2は、本実施形態による全天球撮像装置110上で実現される画像音響記録機能に関連する制御部の機能ブロックを示す。なお、図2には、全天球撮像装置110の外部構成として、表示部250および音響再生部260が併せて示されている点に留意されたい。
図2に示すように、全天球撮像装置110の機能ブロック210としては、画像取得部212と、画像信号処理部214と、音響取得部216と、音響信号処理部218と、センサ情報取得部220と、傾斜角計算部222と、記録部224とが含まれる。なお、図2に示した制御部の一部または全部は、例えば、CPU112にプログラムを実行させることにより構成してもよいし、画像処理ブロック116を用いて構成してもよい。
画像取得部212は、それぞれ光学系131A,131Bを通して撮像素子130A,130Bにより撮像された画像を取得する。画像信号処理部214は、画像取得部212により取得される全天球画像に関連した各種画像信号処理を行う。具体的には、画像信号処理部214は、撮像された画像に、オプティカル・ブラック(OB)補正処理、欠陥画素補正処理、リニア補正処理、シェーディング補正処理、領域分割平均処理、ホワイト・バランス(WB)処理、ガンマ補正処理、ベイヤー補間処理、YUV変換処理、YCFLT処理および色補正処理などの信号処理を行う。説明する実施形態では、第1撮像素子130Aから取得された半球画像と、第2撮像素子130Bから取得された半球画像とに画像信号処理が施されると共に、両者がつなぎ合成されて、全天球画像が生成される。
音響取得部216は、ADC142を介して、図1に示した複数のマイクロホン144A〜144Dにより周辺環境から収音された複数の音響信号に基づき、デジタル形式の音響データを取得する。音響取得部216は、音響情報を取得する音響取得手段を構成する。音響信号処理部218は、取得された音響データに対し、公知のノイズ除去などを行う。
センサ情報取得部220は、加速度センサ/ジャイロセンサ/地磁気センサ136のセンサ各々から、所定時点の3軸方向の加速度、3軸方向の角速度および各方位(方位角、磁北)の方向などのセンサ検出結果情報を取得する。なお、各方位の方向は、必須ではなく、地磁気センサを有さない場合など、各方位の方向は取得されない場合もある。計測される各軸の加速度や角速度や各方位の方向などのセンサ検出結果情報は、全天球撮像装置110の所定時点の姿勢を示すものであり、センサ情報取得部220は、本実施形態において、計測された全天球撮像装置110の姿勢を取得する姿勢取得手段を構成する。
傾斜角計算部222は、所定時点のセンサ情報に基づいて、基準方向としての天頂方向に対する全天球撮像装置110の傾斜角を算出する。ここで、天頂方向とは、天球上においてユーザの真上方向を意味しており、反鉛直方向と一致する方向をいう。天頂方向に対する全天球撮像装置110の傾斜角は、天頂方向に対する全天球撮像装置110の光学系131Aと光学系131Bとに対向する対向面に沿った方向の傾きを示す。
傾斜角計算部222は、所定時点のセンサ情報に基づいて、基準方向として所定の正面方向に対する水平面の回転角度を算出することもできる。ここで、正面方向とは、全天球撮像装置110の向いている方向を意味しており、例えば撮影開始時に全天球撮像装置110の光学系131Aが向いている方向を所定の正面方向とすることができる。ただし、全天球撮像装置110の傾斜角に関わらず、鉛直方向と垂直に交差する水平面上の方向を指す。ジャイロセンサが用いられる場合、撮像開始時から角速度を積分することによって、撮像開始時の正面方向に対する水平面の回転角度を算出することができる。地磁気センサが用いられる場合、地磁気センサの情報を含むセンサ検出結果情報に基づいて、全天球撮像装置110の特定の方位(特定の方位角(例えば南)または磁北)の方向を正面方向とし、その特定の方位に対する角度として、水平面の回転角度を算出することができる。
記録部224は、計測された全天球撮像装置110の所定時点の姿勢と、姿勢が計測された時点に対応する複数のマイクロホン144各々で収音された音響信号に基づく音響情報と、複数の撮像素子130により撮像された複数の画像信号に基づく画像情報とを関連付けて記録する。記録部224は、本実施形態における記録手段を構成する。
ここで、説明する実施形態において、記録される画像情報は、複数の撮像素子130A,130Bにより撮像された半球画像を合成して構成される全天球画像データ242である。説明する実施形態では、全天球画像データ242としては、再生時に天頂補正および水平面での回転補正のいずれか一方または両方を行うものとして、撮像された半球画像をそのままつなぎ合成した全天球画像を記録するものとするが、全天球画像に対し天頂補正および水平面での回転補正のいずれか一方または両方を施した補正済みの全天球画像を記録することとしてもよい。また、画像情報は、全天球画像データに限定されるものではなく、他の実施形態では、再生時につなぎ合成が行われることを前提として、複数の撮像素子130A,130Bにより撮像された複数の半球画像を含む画像データを記録することとしてもよい。
また、説明する実施形態において、記録される音響情報は、複数のマイクロホン144各々で収音されたマイクロホン144毎の音響データ244である。立体音響として1次のアンビソニックスを採用し、音響データ244は、いわゆるA−フォーマット(LF,RF,LB,RB)と呼ばれるものとすることができる。マイクロホン144毎の音響データ244を記録することにより、B−フォーマットなどの立体音響データに変換した後に保存する場合に比較して、できる限り原音に近い状態で音響データを記録しておくことができる。また、説明する実施形態では、立体音響として1次のアンビソニックスを一例として説明するが、これに限定されるものではなく、他の実施形態では、立体音響としては、高次のアンビソニックス(HOA:Higher Order Ambisonics)や波面合成法を採用することを妨げるものではない。
説明する実施形態においては、記録される姿勢は、センサ情報取得部220によりセンサ136から取得したセンサ検出結果情報に基づき傾斜角計算部222で算出された、天頂方向に対する傾斜角の形で、傾斜角データ246として記録される。さらに、傾斜角データ246は、所定の正面方向に対する水平面の回転角度を含んでいてもよい。
全天球画像データ242、音響データ244および傾斜角データ246を含むファイル240は、例えば外部ストレージ134に一旦格納される。図3は、本実施形態による全天球撮像装置110において記録されるファイルのデータ構造を例示する。図3に示すように、ファイル240は、全天球画像データ242のチャンネルと、傾斜角データ246のチャンネルと、音響データ244のチャンネルとを含み構成される。図3に示す実施形態では、全天球画像データ242は、MPEG方式で記録されており、GOP(Group Of Picture)と呼ばされる単位で符号化されている。ここで、GOPとは、少なくとも1つの基準フレーム(MPEGでは、Iピクチャ)を含み構成される一群のフレーム集合の単位をいう。
図3を参照すると、音響データ244および傾斜角データ246も、GOPに対応する時間区間で区切られて記録されており、記録開始を基準に、傾斜角データ246および音響データ244の記録された時間が一致するように関連付けがなされる。したがって、記録開始からの経過時間で傾斜角データと音響データを一致させることが可能となる。音響データ244は、例えばPCM(Pulse Code Modulation)方式などの非圧縮音声フォーマット、あるいは、MP3(MPEG Layer 3)などの圧縮音声フォーマットとすることができる。説明する実施形態では、図3に例示するように、複数のマイクロホン144A〜144Dの各チャンネル毎に記録される。
なお、全天球画像データ242、音響データ244および傾斜角データ246は、説明する実施形態では、便宜上、単一のファイル240として保存されるものとするが、特に限定されるものではない。他の実施形態では、別々のファイルとして保存されてもよい。また、説明する実施形態では、フレーム集合の単位で、姿勢、画像情報および音響情報が関連付けられるものとして説明する。しかしながら、これに限定されるものではなく、フレームの単位で、姿勢、画像情報および音響情報が関連付けられることを妨げるものではない。
再び図2を参照すると、全天球撮像装置110の機能ブロック210としては、読出部226と、パラメータ生成部228と、画像変換部230と、音響変換部232と、出力部234とが含まれる。
読出部226は、ファイル240を読み出し、記録された全天球撮像装置110の所定時点の姿勢と、姿勢が計測された所定時点に対応する音響情報と、対応する画像情報とを順次読み出す。
パラメータ生成部228は、読みだした傾斜角データ246に含まれる所定時点毎の傾斜角から、それぞれ全天球画像および音響に対する所定時点毎の射影変換パラメータを生成する。傾斜角データ246に所定の正面方向に対する水平面の回転角度が含まれる場合には、パラメータ生成部228は、所定時点毎の傾斜角および水平面の回転角度から、所定時点毎の射影変換パラメータを生成することができる。なお、全天球画像に対する射影変換パラメータと、音響に対する射影変換パラメータとは、異なる可能性がある。
画像変換部230は、天頂補正および水平面での回転補正のいずれか一方または両方が求められる場合に、パラメータ生成部228により生成された射影変換パラメータを用いて、全天球画像データ242の各フレームの画像に射影変換を施す。なお、図3に示すデータ構造では、GOP単位に傾斜角の情報が関連付けられているので、GOPに対応するフレーム集合に対し、同一の傾斜角に基づき生成された射影変換パラメータが適用されてもよい。あるいは、隣接するGOPのものを用いて平滑化された傾斜角に基づく射影変換パラメータがフレーム集合内の各フレームに適用されてもよい。また、ファイル240内に、全天球画像データではなく、複数の半球画像を含む画像データが含まれる場合には、画像変換部230は、射影変換前につなぎ合成を行うことができる。また、全天球画像データに天頂補正および水平面での回転補正のいずれか一方または両方が適用済みであれば、射影変換を省略することもできる。全天球画像に対する射影変換は、公知の技術を用いて行うことができるので詳細な説明は割愛する。
音響変換部232は、音響データ244の各時間区間の音響データに対し、パラメータ生成部228により時間区間について生成された射影変換パラメータを用いて、射影変換を施す。説明する実施形態では、音響データ244は、マイクロホン144毎の音響データであるので、全天球撮像装置110の姿勢が該当する範囲に応じて、チャンネルの交換を行うことにより、大まかな天頂補正または水平面での回転補正を施すことができる。例えば、全天球撮像装置110が、水平に寝かされた場合は、垂直に持った場合を基準として、チャンネルの位置関係を90度回転させるというような方法で、天頂補正を施すことができる。
なお、全天球撮像装置110は、例えば操作部146に、再生時に天頂補正を実施するか否かの選択を受け付ける選択手段を備える。画像変換部230による射影変換および音響変換部232による射影変換は、天頂補正を実施する旨の選択が受け付けられた場合に同時に有効化される。さらに、全天球撮像装置110は、例えば操作部146に、再生時に水平面での回転補正を実施するか否かの選択を受け付ける選択手段を備えてもよい。画像変換部230による射影変換および音響変換部232による射影変換は、水平面での回転補正を実施する旨の選択が受け付けられた場合にも同時に有効化され得る。なお、水平面での回転補正を実施するか否かの選択は、天頂補正を実施するか否かの選択と独立して行われてもよいし、再生時に天頂補正を実施する旨の選択を受けた場合に、これに連動して水平面での回転補正を実施するものとしてもよい。
出力部234は、画像変換部230により射影変換された全天球画像のフレームに基づき映像信号を生成し、表示部250へ出力する。全天球画像の表示方法は、特に限定されるものではなく、全天球画像をそのまま映像信号として出力してもよいし、全天球画像の所定画角に対応する画像範囲を切り出して映像信号として出力してもよい。
出力部234は、映像信号の出力と同時に、音響変換部232により射影変換された音響データに基づき、スピーカ駆動信号を生成し、音響再生部260へ出力する。ここで、音響再生部260は、所定の構成で配置された複数のラウドスピーカを含み構成される。音響再生部260は、独自の配置構成を有するものであってもよいし、5.1ch,7.1ch、22.2chサラウンドなどの所定の規格に従ったものであってもよい。出力部234は、音響再生部260の構成に応じたスピーカ駆動信号を生成して、出力する。
以下、図4および図5を参照しながら、本実施形態による全天球撮像装置110が実行する画像および音響の記録および再生方法について、より詳細に説明する。
図4は、本実施形態による全天球撮像装置110が実行する、画像音響記録方法を示すフローチャートである。図4に示す処理は、例えば、全天球撮像装置110の筐体に設けられるレリーズスイッチ150の押下といった、記録開始の指示を行うための特定の動作に応答して、ステップS100から開始される。
ステップS101では、全天球撮像装置110は、画像取得部212により、撮像素子130A,130Bを用いて撮像された画像を取得する。ステップS102では、全天球撮像装置110は、画像信号処理部214により、ステップS101で取得した画像に画像信号処理を施し、ステップS105へ処理を進める。なお、ここでは、フレーム集合の単位で画像取得および画像信号処理が行われるものとする。
図4に示す処理が開始されると、ステップS101およびステップS102の処理と並行して、ステップS103およびステップS104の処理が実行される。ステップS103では、全天球撮像装置110は、音響取得部216により、マイクロホン144A〜144DからADC142を介してマイクロホン144毎の音響データを取得する。ステップS104では、全天球撮像装置110は、音響信号処理部218により、ステップS103で取得した音響データに信号処理を施し、ステップS105へ処理を進める。ここでは、フレーム集合の単位に対応する時間区間の音響取得および音響信号処理が行われるものとする。
ステップS105では、全天球撮像装置110は、センサ情報取得部220により、加速度センサ/ジャイロセンサ/地磁気センサ136から、ステップS101およびステップS103での画像および音響の記録時のセンサ検出結果情報を取得する。ステップS106では、全天球撮像装置110は、傾斜角計算部222により、ステップS105で取得したセンサ検出結果情報に基づいて、記録時の全天球撮像装置110の傾斜角および所定の正面方向に対する水平面の回転角度を算出する。ジャイロセンサや地磁気センサを有さない場合など、所定の正面方向に対する水平面の回転角度が取得されない場合もある。
ステップS107では、全天球撮像装置110は、記録部224により、全天球画像データ242、音響データ244および傾斜角データ246として、フレーム集合分の画像情報、音響情報および姿勢情報をそれぞれ関連付けて記録する。
ステップS108では、全天球撮像装置110は、記録終了の指示を受け付けたか否かを判定する。ステップS108で、記録終了の指示をまだ受け付けていないと判定された場合(NO)は、ステップS101およびステップS103へ処理をループさせて、次のフレーム集合に対する処理へ進める。一方、ステップS108で、記録終了の指示を受け付けたと判定された場合(YES)は、ステップS109へ処理を分岐させて、全天球撮像装置110は、ファイルを閉じて、本処理を終了させる。
図5は、本実施形態による全天球撮像装置110が実行する、画像音響再生方法を示すフローチャートである。図5に示す処理は、例えば、全天球撮像装置110の筐体に設けられる再生ボタンの押下といった特定の動作に応答して、ステップS200から開始される。図5に示す処理が開始されると、ステップS201、ステップS202およびステップS203の処理が並列に実行される。
ステップS201では、全天球撮像装置110は、読出部226により、ファイル240の全天球画像データ242からフレーム集合分の画像を読み出す。ステップS202では、全天球撮像装置110は、読出部226により、ファイル240の音響データ244からフレーム集合に対応する音響データを読み出す。ステップS203では、全天球撮像装置110は、読出部226により、ファイル240の傾斜角データ246からフレーム集合に対応する傾斜角を読み出す。
ステップS204では、全天球撮像装置110は、パラメータ生成部228により、傾斜角および所定の正面方向に対する水平面の回転角度から、フレーム集合に適用する画像および音響に対する各射影変換パラメータを生成する。ステップS205では、全天球撮像装置110は、設定情報を参照して天頂補正および水平面での回転補正を行うか否かの判定を行う。なお、説明する実施形態では、一例として、天頂補正および水平面での回転補正の両方を行うか、または両方を行わないか、が指定されているものとする。しかしながら、これに限定されるものではなく、他の実施形態では、天頂補正および水平面での回転補正を行うか否かをそれぞれ独立して指定することとしてもよい。つまり、天頂補正のみ行うこと、水平面での回転補正のみ行うこと、天頂補正および水平面での回転補正の両方を行うこと、天頂補正および水平面での回転補正のいずれも行わないことが指定されてもよい。ステップS205で、天頂補正および水平面での回転補正を行うと判定された場合(YES)は、ステップS206およびステップS207へ処理が進められる。
ステップS206では、全天球撮像装置110は、画像変換部230により、読み出されたフレーム集合分の全天球画像に対し、生成された画像用の射影変換パラメータに基づいて射影変換を施す。同時に、ステップS207では、全天球撮像装置110は、読み出された音響データに対し、天頂補正および水平面での回転補正を施す立体音響信号処理を行う。この天頂補正および水平面での回転補正を施す立体音響信号処理では、音響変換部232により、音響用の射影変換パラメータに応じて、マイクロホン144毎の音響データのチャンネル交換などにより天頂補正および水平面での回転補正が行われる。天頂補正および水平面での回転補正を施す立体音響信号処理では、出力部234により、天頂補正および水平面での回転補正後の音響データがエンコードされて、エンコードされた立体音響データが、音響再生部260の構成に応じてデコードされて、スピーカ駆動信号が生成され、音響再生部260に出力される。
一方、ステップS205で、天頂補正および水平面での回転補正を行わないと判定された場合(NO)は、ステップS208へ処理が分岐される。ステップS208では、全天球撮像装置110は、全天球画像はそのままで、読み出された音響データに対し、立体音響信号処理を行う。この立体音響信号処理では、出力部234により、マイクロホン144毎の音響データがエンコードされて、エンコードされた立体音響データが、音響再生部260の構成に応じてデコードされて、スピーカ駆動信号が生成され、音響再生部260に出力される。
ステップS209では、全天球撮像装置110は、ファイルの終端に達したか否かを判定する。ステップS209で、ファイルの終端に達していないと判定された場合(NO)は、ステップS201、ステップS202およびステップS203へ処理をループさせて、次のフレーム集合に対する処理へ進める。一方、ステップS209で、ファイルの終端に達したと判定された場合(YES)は、ステップS210へ処理を分岐させて、ファイルを閉じて、本処理を終了させる。
なお、図4および図5を参照して、画像および音響の記録および再生方法について分けて説明したが、図5の再生において実行される天頂補正および水平面での回転補正を、撮影時に記録と同時に行うことを妨げるものではない。
以下、図6および図7を参照しながら、立体音響としてアンビソニックを採用する特定の実施形態における、音響データの収音から再生までの流れを説明する。図6(A)は、実施形態における音響データの収音から再生までの流れを示す。
図6(A)に示すように、実施形態では、収音されたマイクロホン144毎の音響データ(アンビソニックのA−フォーマットのLF,LB,RF、RB)が音響データ244として傾斜角データ246に関連付けられてファイル240Aに記録される。音響データ244は、再生時に、ファイル240Aから読みだされて天頂補正および水平面での回転補正のいずれか一方または両方が施される。そして、天頂補正および水平面での回転補正のいずれか一方または両方が施された音響データ(A−フォーマットのLF’,LB’,RF’、RB’)がアンビソニックエンコーダーによりエンコードされ、立体音響データ(B−フォーマットのW,X,Y,Z)が生成される。なお、エンコードは、典型的には、下記式で表すことができる。アンビソニックにおけるマイクロホン144は正四面体の頂点に配置させた指向性マイク4つを使用して収音し、収音した4つの音声信号から無指向性信号Wおよび双指向性信号XYZを生成する。
Bフォーマットへの信号処理の結果、無指向性信号W及び双指向性信号XYZが、仮想的な無指向性マイクと双指向性マイクで収録したものとして取り扱われる。
図7(A)は、全天球撮像装置110における軸の定義を説明する図である。図7(A)に示すように、上下方向がZ軸に対応付けられており、左右方向がX軸に対応付けられており、前後方向が、Y軸に対応付けられている。そのほか、一例として、図7(B)〜図7(E)は、立体音響における収音指向特性を説明する図である。B−フォーマットのWチャンネルは、図7(B)に示すような無指向なマイクロホンでの収音信号に対応する。B−フォーマットのX,Y,Zの各チャンネルは、図7(C)〜図7(E)に示すような双指向性のマイクロホンでの収音信号に対応する。式(1)で表されるように、信号間の簡便な演算により、マイクロホン毎の音響データから立体音響データが構成される。
そして、一旦、立体音響データが生成された後は、アンビソニックデコーダにより、スピーカ構成に応じてスピーカ駆動信号が生成されて、音響再生部260に入力されて、音響再生部260の各ラウドスピーカから放音される。これにより、方向性を含めた音場が再現される。
なお、上述の説明では、音響再生部260は、複数のラウドスピーカを含むものとして説明した。しかしながら、音響再生部260は、ヘッドホンであってもよく、その場合は、出力部234は、一旦、所定の構成を有するラウドスピーカ用の信号にデコードした後、所定の頭部伝達関数(Head-Related Transfer Function:HRTF)を畳み込んで足し合わせることにより、バイノーラル信号として、ヘッドホンである音響再生部260に出力することもできる。
また、上述した実施形態では、記録される音響情報として、マイクロホン144で収音された音響データ(A−フォーマットのLF,LB,RF、RB)が、傾斜角データに関連付けて記録されるものとして説明した。そして、図6(A)に示すように、マイクロホン144毎の音響データ(A−フォーマットのLF,LB,RF、RB)に対し、チャンネル交換により射影変換を施すものとして説明した。しかしながら記録される音響情報や射影変換の態様は、上述した実施形態に限定されるものではない。
図6(B)は、他の実施形態における音響データの収音から再生までの流れを示す。図6(B)に示す他の実施形態においては、音響信号処理部218で複数のマイクロホン144各々で収音された複数の音響信号をエンコードすることとし、記録部224は、エンコードされた立体音響データをファイル240Bに記録する。立体音響としてアンビソニックスを採用する特定の実施形態では、この立体音響データは、いわゆるB−フォーマット(W,X,Y,Z)と呼ばれるものであり、図6(B)に示すように、この立体音響データ(W,X,Y,Z)が傾斜角データに関連付けてファイル240Bに記録される。
その場合、図6(B)に示すように、上述した実施形態では、エンコード後の立体音響データ(B−フォーマットのW,X,Y,Z)に対し、天頂補正および水平面の回転補正のいずれか一方または両方が施される。例えば、図7(A)に示すように、水平面上でθだけ回転することに相当する回転補正は、典型的には、下記式で表される射影変換により実現することができる。
このように、他の実施形態では、複数のマイクロホン144各々で収音された複数の音響信号をエンコードして、立体音響データ244が一旦生成される。そして、天頂補正は、この立体音響データ上で適用される。出力部234は、天頂補正および水平面の回転補正のいずれか一方まらは両方が施された立体音響データ(W’,X’、Y’、Z’)をデコードし、音響再生部260の構成に従ったスピーカ駆動信号を出力する。天頂補正の場合は同様にXまたはY軸にそった回転を行い補正する。
以上説明した実施形態によれば、所定時点の音響データに関連付けて対応する時点の傾斜角データが記録される。そのため、音響データに対し鉛直方向に対する傾斜角に応じた天頂補正および所定の正面方向に対する水平面の回転角度に応じた水平面での回転補正のいずれか一方または両方を施すことが可能となる。さらに、利用者は立体音声を記録するマイクロホン144の状態を気にすることなく、全天球撮像装置110を動かしながら、全天球動画を撮影および録音することができる。そして、視聴時は、音響データに対し傾斜角に応じた天頂補正および回転角度に応じた水平面での回転補正に一方または両方を施されているので、全天球撮像装置110の姿勢の変動に起因して、再生時の音場の方向性の不自然さを軽減することができる。
なお、上述した実施形態では、読出部226、パラメータ生成部228、画像変換部230および音響変換部232といった再生側の構成も、全天球撮像装置110上のコンポーネントとして説明した。しかしながら、他の実施形態では、再生側のコンポーネントを別の外部装置上で実装することもできる。
図8は、他の実施形態による全天球撮像装置上で実現される画像音響記録機能に関連する機能ブロック図である。図8に示す実施形態では、全天球撮像装置110の機能ブロック310としては、画像取得部312と、画像信号処理部314と、音響取得部316と、音響信号処理部318と、センサ情報取得部320と、傾斜角計算部322と、記録部324とが含まれる。そして、再生側の外部装置の機能ブロック280としては、読出部372と、パラメータ生成部374と、画像変換部376と、音響変換部378と、出力部380とが含まれる。この場合、全天球撮像装置110側の記録部324により保存されたファイル340は、USBやネットワークなどを介して外部装置側へと伝送されることになる。なお、外部装置は、パーソナル・コンピュータ、タブレット・コンピュータ、ワークステーション、サーバなどの汎用コンピュータとすることができる。
図8に示すように、再生側を外部装置上で構成することによって、立体音響データをスピーカ駆動信号へ変換する際の計算負荷を、外部装置にオフロードすることができる。
以上説明した実施形態によれば、撮影や記録時の装置の姿勢の変動に起因した、再生時の音場の方向性の不自然さを補正可能とすることができる、音響記録装置、音響システム、音響記録方法、プログラムおよびデータ構造を提供することができる。
なお、上記機能部は、アセンブラ、C、C++、C#、Java(登録商標)などのレガシープログラミング言語やオブジェクト指向プログラミング言語などで記述されたコンピュータ実行可能なプログラムにより実現でき、ROM、EEPROM、EPROM、フラッシュメモリ、フレキシブルディスク、CD−ROM、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、ブルーレイディスク、SDカード、MOなど装置可読な記録媒体に格納して、あるいは電気通信回線を通じて頒布することができる。また、上記機能部の一部または全部は、例えばフィールド・プログラマブル・ゲート・アレイ(FPGA)などのプログラマブル・デバイス(PD)上に実装することができ、あるいはASIC(特定用途向集積)として実装することができ、上記機能部をPD上に実現するためにPDにダウンロードする回路構成データ(ビットストリームデータ)、回路構成データを生成するためのHDL(Hardware Description Language)、VHDL(VHSIC(Very High Speed Integrated Circuits)Hardware Description Language))、Verilog−HDLなどにより記述されたデータとして記録媒体により配布することができる。
これまで本発明の実施形態について説明してきたが、本発明の実施形態は上述した実施形態に限定されるものではなく、他の実施形態、追加、変更、削除など、当業者が想到することができる範囲内で変更することができ、いずれの態様においても本発明の作用・効果を奏する限り、本発明の範囲に含まれるものである。
110…全天球撮像装置、112…CPU、114…ROM、116…画像処理ブロック、118…動画ブロック、120…DRAMインタフェース、122…外部ストレージインタフェース、124…外部センサインタフェース、126…USBインタフェース、128…シリアルブロック、130…撮像素子、131…光学系、132…DRAM、134…外部ストレージ、136…加速度センサ/ジャイロセンサ/地磁気センサ、138…USBコネクタ、140…無線通信インタフェース、142…ADC、144…マイクロホン、146…操作部、148…切替スイッチ、150…レリーズスイッチ、210,310…機能ブロック、212,312…画像取得部、214,314…画像信号処理部、216,316…音響取得部、218,318…音響信号処理部、220,320…センサ情報取得部、222,322…傾斜角計算部、224,324…記録部、226,372…読出部、228,374…パラメータ生成部、230,376…画像変換部、232,378…音響変換部、234,380…出力部、240,340…ファイル、242,342…全天球画像データ、244,344…立体音響データ、246,346…傾斜角データ、250,350…表示部、260,350…音響再生部
特許第5777185号明細書

Claims (16)

  1. 音響記録装置であって、
    音を収音する複数の収音手段と、
    前記音響記録装置の姿勢を計測する計測手段と、
    該姿勢が計測された時点に対応する、前記複数の収音手段各々で収音された音に基づく音響情報とを関連付けて記録する記録手段と
    を含む、音響記録装置。
  2. 前記音響情報は、前記複数の収音手段各々で収音された複数の音響信号から得られる収音手段毎の音響データ、または、前記複数の収音手段各々で収音された複数の音響信号からエンコードされた立体音響データである、請求項1に記載の音響記録装置。
  3. 前記音響記録装置は、
    当該音響記録装置の所定時点の姿勢に基づいて、該所定時点に対応する音響情報に対し射影変換を施す音響変換手段
    をさらに含む、請求項1または2に記載の音響記録装置。
  4. 前記音響記録装置は、
    光学系を有する撮像手段
    をさらに含み、前記撮像手段により前記光学系を通して撮像された画像信号に基づく画像情報をさらに前記姿勢に関連付けて記録する、請求項3に記載の音響記録装置。
  5. 前記姿勢に基づいて、所定時点に対応する画像情報に対し射影変換を施す画像変換手段と、
    天頂補正および水平面の回転補正のいずれか一方または両方を実施するか否かの選択を受け付ける選択手段と
    をさらに含み、前記音響変換手段による射影変換および前記画像変換手段による射影変換は、前記選択手段により天頂補正および水平面の回転補正のいずれか一方または両方を実施する旨の選択が受け付けられた場合に有効化される、請求項4に記載の音響記録装置。
  6. 前記記録手段により所定時点に関連付けて記録される画像情報は、1以上のフレームを含むフレーム集合の単位の画像情報であり、前記姿勢は、前記フレーム集合に対応する時間区間に計測された姿勢であり、前記姿勢に関連付けて記録される音響情報は、前記フレーム集合に対応する時間区間に収音された音に基づく音響情報であり、前記姿勢は、基準方向に対する傾斜角、または基準方向に対する傾斜角および所定の正面方向に対する水平面での回転角度の形で記録される、請求項4または5に記載の音響記録装置。
  7. 前記光学系は、広角光学系である請求項4〜6のいずれか1項に記載の音響記録装置。
  8. 音響記録装置を含む音響システムであって、
    音を収音する複数の収音手段と、
    前記音響記録装置の姿勢を計測する計測手段と、
    前記姿勢が計測された所定時点に対応する、前記複数の収音手段各々で収音された音に基づく音響情報とを関連付けて記録する記録手段と
    を含む、音響システム。
  9. 前記音響記録装置の所定時点の姿勢に基づいて、該所定時点に対応する音響情報に対し射影変換を施す音響変換手段
    をさらに含む、請求項8に記載の音響システム。
  10. 前記複数の収音手段各々で収音された収音手段毎の音響信号から得られる収音手段毎の音響データに基づいてエンコードを行い、立体音響データを生成するエンコード手段と、
    前記立体音響データに基づいてデコードを行い、スピーカ駆動信号を生成するデコード手段と
    をさらに含む、請求項8または9に記載の音響システム。
  11. 前記記録手段により記録される音響情報は、前記複数の収音手段各々で収音された複数の音響信号から得られる収音手段毎の音響データ、または、前記複数の収音手段各々で収音された複数の音響信号からエンコードされた立体音響データである、請求項10に記載の音響システム。
  12. 前記音響記録装置が備える光学系を通して撮像する撮像手段をさらに含み、前記記録手段は、前記撮像手段により前記光学系を通して撮像された画像信号に基づく画像情報をさらに、前記姿勢に関連付けて記録し、前記音響システムは、
    当該音響記録装置の所定時点の姿勢に基づいて、該所定時点に対応する画像情報に対し射影変換を施す画像変換手段と
    天頂補正および水平面の回転補正のいずれか一方または両方を実施するか否かの選択を受け付ける選択手段と
    をさらに含み、音響変換手段による射影変換および前記画像変換手段による射影変換は、前記選択手段により天頂補正および水平面の回転補正のいずれか一方または両方を実施する旨の選択が受け付けられた場合に同時に有効化される、請求項11に記載の音響システム。
  13. 音響記録装置が実行する音響記録方法であって、前記音響記録装置が、
    複数の収音手段により音を収音するステップと、
    前記音響記録装置の姿勢を計測手段により計測するステップと、
    該姿勢が計測された時点に対応する、前記複数の収音手段各々で収音された音に基づく音響情報とを関連付けて記録するステップと
    を実行する、音響記録方法。
  14. 前記記録するステップは、
    前記複数の収音手段各々で収音された複数の音響信号から得られる収音手段毎の音響データを前記音響情報として記録するステップを含むか、または、
    前記複数の収音手段各々で収音された複数の音響信号に基づいてエンコードを行い、立体音響データを生成するステップと、前記立体音響データを前記音響情報として記録するステップとを含む、請求項13に記載の音響記録方法。
  15. 音響記録装置を実現するためのプログラムであって、コンピュータまたはプログラマブルデバイスを、
    複数の収音手段により音が収音された音響信号に基づく音響情報を取得する音響取得手段、
    計測手段により計測された前記音響記録装置の姿勢を取得する姿勢取得手段、および
    該姿勢が計測された時点に対応する、前記複数の収音手段各々で収音された音に基づく音響情報とを関連付けて記録する記録手段
    として機能させるためのプログラム。
  16. コンピュータにより座標系が変換される音声付き動画データを生成するためのデータを格納するデータ構造であって、
    撮像手段により撮像された動画形式の画像のデータである画像データと、収音手段により収音された音響のデータである音響データと、前記音響が収音された際の前記収音手段の基準方向に対する姿勢のデータである姿勢データと、を有し、前記画像データのフレームと、前記音響データの前記フレームに対応する音響情報と、前記姿勢データの前記フレームに対応する姿勢とが関連付けられる、データ構造。
JP2018030769A 2017-03-14 2018-02-23 音響装置、音響システム、方法およびプログラム Active JP7196399B2 (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
CA3054890A CA3054890A1 (en) 2017-03-14 2018-03-14 Sound recording apparatus, sound system, sound recording method, and carrier means
CN201880017543.0A CN110463226B (zh) 2017-03-14 2018-03-14 声音记录设备,声音系统,声音记录方法和载体装置
PCT/JP2018/009889 WO2018168902A1 (en) 2017-03-14 2018-03-14 Sound recording apparatus, sound system, sound recording method, and carrier means
US16/490,825 US11490199B2 (en) 2017-03-14 2018-03-14 Sound recording apparatus, sound system, sound recording method, and carrier means
EP18715142.8A EP3596940A1 (en) 2017-03-14 2018-03-14 Sound recording apparatus, sound system, sound recording method, and carrier means
JP2022199878A JP2023027280A (ja) 2017-03-14 2022-12-15 音響装置、撮像装置、音響システム、方法およびプログラム

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2017048769 2017-03-14
JP2017048769 2017-03-14

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2022199878A Division JP2023027280A (ja) 2017-03-14 2022-12-15 音響装置、撮像装置、音響システム、方法およびプログラム

Publications (2)

Publication Number Publication Date
JP2018152846A true JP2018152846A (ja) 2018-09-27
JP7196399B2 JP7196399B2 (ja) 2022-12-27

Family

ID=63681930

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018030769A Active JP7196399B2 (ja) 2017-03-14 2018-02-23 音響装置、音響システム、方法およびプログラム

Country Status (4)

Country Link
US (1) US11490199B2 (ja)
EP (1) EP3596940A1 (ja)
JP (1) JP7196399B2 (ja)
CA (1) CA3054890A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018182528A (ja) * 2017-04-13 2018-11-15 株式会社ザクティ 全天球カメラ及び音声処理方法
JP2020057987A (ja) * 2018-10-04 2020-04-09 株式会社ズーム アンビソニックスのためのマイクロホン、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア
JP2020061691A (ja) * 2018-10-11 2020-04-16 楽天株式会社 カメラアッセンブリ

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020053774A (ja) * 2018-09-25 2020-04-02 株式会社リコー 撮像装置および画像記録方法
US10966017B2 (en) 2019-01-04 2021-03-30 Gopro, Inc. Microphone pattern based on selected image of dual lens image capture device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120162362A1 (en) * 2010-12-22 2012-06-28 Microsoft Corporation Mapping sound spatialization fields to panoramic video
JP5843033B1 (ja) * 2014-05-15 2016-01-13 株式会社リコー 撮像システム、撮像装置、プログラムおよびシステム
WO2016093063A1 (ja) * 2014-12-08 2016-06-16 株式会社リコー 画像管理システム、画像管理方法、及びプログラム
JP2016163181A (ja) * 2015-03-02 2016-09-05 キヤノン株式会社 信号処理装置及び信号処理方法

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5843033B2 (ja) 1978-11-17 1983-09-24 株式会社リコー インク粒子の偏向制御装置
JPS5846549B2 (ja) 1981-12-09 1983-10-17 株式会社 武蔵野化学研究所 電解法
RU2420027C2 (ru) * 2006-09-25 2011-05-27 Долби Лэборетериз Лайсенсинг Корпорейшн Улучшенное пространственное разрешение звукового поля для систем многоканального воспроизведения аудио посредством получения сигналов с угловыми членами высокого порядка
US20100223552A1 (en) * 2009-03-02 2010-09-02 Metcalf Randall B Playback Device For Generating Sound Events
US8525868B2 (en) 2011-01-13 2013-09-03 Qualcomm Incorporated Variable beamforming with a mobile platform
JP2013171089A (ja) 2012-02-17 2013-09-02 Toshiba Corp 音声補正装置、方法、及びプログラム
US20140006471A1 (en) 2012-06-27 2014-01-02 Horia Margarit Dynamic asynchronous modular feed-forward architecture, system, and method
US9179232B2 (en) * 2012-09-17 2015-11-03 Nokia Technologies Oy Method and apparatus for associating audio objects with content and geo-location
JP5777185B1 (ja) 2014-05-16 2015-09-09 株式会社ユニモト 全周動画配信システム、全周動画配信方法、通信端末装置およびそれらの制御方法と制御プログラム
JP6398457B2 (ja) 2014-08-14 2018-10-03 株式会社リコー 撮影装置、撮影方法、およびプログラム
CN105898185A (zh) 2014-11-19 2016-08-24 杜比实验室特许公司 调节视频会议系统中的空间一致性
US9712936B2 (en) 2015-02-03 2017-07-18 Qualcomm Incorporated Coding higher-order ambisonic audio data with motion stabilization
JP5846549B1 (ja) 2015-02-06 2016-01-20 株式会社リコー 画像処理システム、画像処理方法、プログラム、撮像システム、画像生成装置、画像生成方法およびプログラム
US9621795B1 (en) * 2016-01-08 2017-04-11 Microsoft Technology Licensing, Llc Active speaker location detection

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120162362A1 (en) * 2010-12-22 2012-06-28 Microsoft Corporation Mapping sound spatialization fields to panoramic video
JP5843033B1 (ja) * 2014-05-15 2016-01-13 株式会社リコー 撮像システム、撮像装置、プログラムおよびシステム
WO2016093063A1 (ja) * 2014-12-08 2016-06-16 株式会社リコー 画像管理システム、画像管理方法、及びプログラム
JP2016163181A (ja) * 2015-03-02 2016-09-05 キヤノン株式会社 信号処理装置及び信号処理方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018182528A (ja) * 2017-04-13 2018-11-15 株式会社ザクティ 全天球カメラ及び音声処理方法
JP2020057987A (ja) * 2018-10-04 2020-04-09 株式会社ズーム アンビソニックスのためのマイクロホン、a/bフォーマット変換ソフトウェア、レコーダー、再生ソフトウェア
JP2020061691A (ja) * 2018-10-11 2020-04-16 楽天株式会社 カメラアッセンブリ
US10951794B2 (en) 2018-10-11 2021-03-16 Rakuten, Inc. Camera assembly

Also Published As

Publication number Publication date
EP3596940A1 (en) 2020-01-22
CA3054890A1 (en) 2018-09-20
US20200015007A1 (en) 2020-01-09
JP7196399B2 (ja) 2022-12-27
US11490199B2 (en) 2022-11-01

Similar Documents

Publication Publication Date Title
JP7196399B2 (ja) 音響装置、音響システム、方法およびプログラム
JP5920507B1 (ja) 画像処理システム、画像処理方法およびプログラム
JP7226484B2 (ja) 撮像システム、撮像装置、動画表示装置、画像処理装置、方法およびプログラム。
KR101888470B1 (ko) 촬상 시스템, 촬상 장치, 컴퓨터 프로그램 및 시스템
JP2023027280A (ja) 音響装置、撮像装置、音響システム、方法およびプログラム
EP3952276A1 (en) Image processing device, image processing method, and program
KR20120053006A (ko) 개선된 오디오/비디오 방법들 및 시스템들
KR20200087816A (ko) 화상 처리 장치, 화상 처리 시스템, 화상 처리 방법 및 기록 매체
JP6256513B2 (ja) 撮像システム、撮像装置、方法およびプログラム
JP7306089B2 (ja) 画像処理システム、撮像システム、画像処理装置、撮像装置およびプログラム
US11228708B2 (en) Image pickup apparatus and image pickup system
JP2012151708A (ja) 撮像装置
JP2019140667A (ja) 情報処理装置、情報処理システム、データ生成方法およびプログラム
JP2019169762A (ja) 情報処理装置
JP2020078065A (ja) 撮像装置、情報処理装置、補正量設定方法およびプログラム
US20210289137A1 (en) Image pickup control device, image pickup device, and image pickup control method
JP2020123934A (ja) データ編集処理装置、アプリケーション、及び撮影装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201118

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220412

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20220531

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220830

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221028

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221128

R151 Written notification of patent or utility model registration

Ref document number: 7196399

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151