JP7247616B2 - データ編集処理装置、アプリケーション、及び撮影装置 - Google Patents

データ編集処理装置、アプリケーション、及び撮影装置 Download PDF

Info

Publication number
JP7247616B2
JP7247616B2 JP2019016354A JP2019016354A JP7247616B2 JP 7247616 B2 JP7247616 B2 JP 7247616B2 JP 2019016354 A JP2019016354 A JP 2019016354A JP 2019016354 A JP2019016354 A JP 2019016354A JP 7247616 B2 JP7247616 B2 JP 7247616B2
Authority
JP
Japan
Prior art keywords
audio data
editing
area
data
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2019016354A
Other languages
English (en)
Other versions
JP2020123934A (ja
Inventor
崇文 大熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2019016354A priority Critical patent/JP7247616B2/ja
Publication of JP2020123934A publication Critical patent/JP2020123934A/ja
Application granted granted Critical
Publication of JP7247616B2 publication Critical patent/JP7247616B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Television Signal Processing For Recording (AREA)
  • Studio Devices (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)

Description

本発明は、データ編集処理装置、アプリケーション、及び撮影装置に関する。
全天球カメラの普及に伴い、全天球動画を撮影する技術が開発されている。このような全天球動画を視聴する場合において、視線の方向に合わせて立体的な音声を再生する立体音響技術が知られている。
例えば、複数のマイクで録音することで、立体的な音声を再生する技術が知られている(例えば、特許文献1)。すなわち、特許文献1では、再生する画像と立体音声を同期させることで、ユーザの視点位置と視線方向に応じた立体音声データを出力することができ、ユーザは仮想的な臨場感を味わうことができる。
このような立体音声は、画像ファイルとともにMP4等の動画コンテナ形式で記録される。動画ファイルは、メタデータとともにコンテナ構造を有するファイル形式であり、画像ファイルと音声ファイルとがコンテナ形式で格納される(例えば、特許文献2参照)。
例えば、MP4形式の動画ファイルの場合には、音声ファイルは、AAC(Advanced Audio Codec)などの非可逆圧縮音声コーデックでエンコード(符号化処理)されたものである場合が多い。このように音声ファイルを非可逆圧縮形式とすることにより、動画ファイルのデータ容量を削減することができる。
しかしながら、動画ファイルを編集用アプリケーション等により編集する場合において、非可逆圧縮形式の音声ファイルが編集される際には、音声データはデコード(復号処理)されたうえで編集が行われ、編集後にエンコードが行われる。
このように非可逆圧縮形式の音声ファイルは、編集が行われるたびにデコード及びエンコードが行われるので音質が劣化する。特に、音声ファイルが立体音声データである場合には、音質の劣化とともに、空間音声の指向性の劣化が生じるので、空間音声による臨場感が低下するという問題がある。
開示の技術は、上記事情に鑑みてこれを解決すべくなされたものであり、非可逆圧縮形式の音声ファイルを含む動画ファイルの編集による劣化を防止することを目的としている。
開示の技術は、画像データと非可逆圧縮形式の第1音声データとが格納された第1領域と、可逆圧縮形式又は非圧縮形式の第2音声データが格納された第2領域とを有するコンテナ構造の動画ファイルを編集可能とするデータ編集処理装置であって、前記動画ファイルが編集される場合に、前記第2領域から前記第2音声データを読み込んで編集する編集処理部と、前記第2領域に格納された前記第2音声データを、前記編集処理部により編集された前記第2音声データで置換する第1置換処理部と、前記編集処理部により編集された前記第2音声データを符号化する符号化処理部と、前記第1領域に格納された前記第1音声データを、前記符号化処理部により符号化された前記第2音声データで置換する第2置換処理部と、を有するデータ編集処理装置。
本発明によれば、非可逆圧縮形式の音声ファイルを含む動画ファイルの編集による劣化を防止することができる。
本実施形態に係る撮影装置の正面図(A)、及び背面図(B)である。 本実施形態に係る撮影装置の右側面図(A)、及び左側面図(B)である。 本実施形態に係る撮影装置の平面図(A)、及び底面図(B)である。 外部マイクロフォンユニットの外観を示す斜視図である。 撮影装置及びユーザ端末に含まれるハードウェア構成を示す図である。 立体音声データを生成する処理のブロックを示す図である。 撮影装置のCPUに構成される機能ブロックを例示する図である。 編集用アプリケーションの機能ブロックを例示する図である。 編集用アプリケーションの処理を説明するフローチャートである。 第2編集処理部による編集処理を概念的に説明する図である。 ファイル共有処理部による処理を説明するフローチャートである。
以下、図面を参照して発明を実施するための形態について説明する。各図面において、同一構成部分には同一符号を付し、重複した説明を省略する場合がある。
以下の図1~図3における説明中の前、後、上、下、左、右の各方向は、各図に記載した矢線方向を基準とする。また、左右方向が幅方向に一致しており、前後方向が厚さ方向に一致している。
図1~図3は、本実施形態に係る撮影装置1の外観を示す図である。図1(A),(B)、図2(A),(B)、図3(A),(B)に示すように、全天球カメラとしての撮影装置1は、撮影装置1の各構成要素が組み付けられてこれを保持する筐体10を有している。
筐体10は、左右方向に短く、上下方向に長く、前後方向に所定の厚みを持ち、上面が丸みを帯びた輪郭を有している。筐体10は、後側金属筐体20と前側金属筐体30を有している。後側金属筐体20と前側金属筐体30は、後述する後側樹脂筐体70と前側樹脂筐体80と接続樹脂筐体90と比較して相対的に高剛性の金属材料(例えばマグネシウム合金)から構成された一体成形品とすることができる。
後側金属筐体20と前側金属筐体30は、左側面接続筐体40と右側面接続筐体50と下面接続筐体60によって接続されている。左側面接続筐体40と右側面接続筐体50と下面接続筐体60は、例えば、後側金属筐体20と前側金属筐体30と同一の金属材料から構成することができるが、その材料には自由度があり、種々の設計変更が可能である。
後側金属筐体20と前側金属筐体30の一方には、位置決めボス(図示せず)が形成されており、後側金属筐体20と前側金属筐体30の他方には、ボス挿入孔(図示せず)が形成されており、位置決めボスをボス挿入孔に挿入することにより、後側金属筐体20と前側金属筐体30が接近した状態で位置決めされる。後側金属筐体20と前側金属筐体30は、左側面と右側面と下面に、上記位置決め状態で重なって共締め可能なネジ孔(図示せず)を有している。
後側金属筐体20と前側金属筐体30の間の左側面と右側面と下面の隙間に、左側面接続筐体40と右側面接続筐体50と下面接続筐体60を嵌め込んで、これらに挿通した共締めネジ(図示せず)を上記ネジ孔に螺合することにより、後側金属筐体20と前側金属筐体30と左側面接続筐体40と右側面接続筐体50と下面接続筐体60が一体化される。なお、後側金属筐体20と前側金属筐体30と左側面接続筐体40と右側面接続筐体50と下面接続筐体60を一体化するための構成には自由度があり、種々の設計変更が可能である。
後側金属筐体20の上方には、略円形のレンズ露出孔21が形成されており、前側金属筐体30の上方には、略円形のレンズ露出孔31が形成されている。後側金属筐体20の上下方向の中間部よりやや下方には、撮影(静止画撮影、動画撮影)のトリガとなるシャッターボタン22が設けられている。シャッターボタン22の下方には、撮影装置1の操作画面や設定画面等の各種情報を表示する表示装置23が設けられている。表示装置23は、例えば、有機ELディスプレイから構成することができる。
左側面接続筐体40の上下方向の中間部には、例えば、音声案内メッセージ等を発するスピーカ41が設けられている。右側面接続筐体50の上下方向の中間部には、撮影装置1の電源のオンオフを切り替えるための電源ボタン51が設けられており、電源ボタン51の下方には、撮影モードや無線接続モードの設定操作を行うための操作ボタン52、53、54が設けられている。
後側金属筐体20のシャッターボタン22のやや上方の右側には、上下方向に離間する2つのマイクロフォン24が設けられている。前側金属筐体30の上下方向の中間部よりやや上方には、左右方向に離間する2つのマイクロフォン32が設けられている。表裏に位置する後側金属筐体20の2つのマイクロフォン24と前側金属筐体30の2つのマイクロフォン32の計4つのマイクロフォンによって3D音声が取得可能となっている。
後側金属筐体20と前側金属筐体30と左側面接続筐体40と右側面接続筐体50と下面接続筐体60の結合体は、上下方向の中間部より下方がグリップ部GPを構成している。撮影者は、グリップ部GPを把持した状態で、シャッターボタン22、電源ボタン51、操作ボタン52~54を押圧操作することができる。
後側金属筐体20と前側金属筐体30と左側面接続筐体40と右側面接続筐体50と下面接続筐体60の結合体は、上方が開放された開口部OSを有している。開口部OSは、後側樹脂筐体70と前側樹脂筐体80と接続樹脂筐体90によって埋められている。後側樹脂筐体70と前側樹脂筐体80と接続樹脂筐体90は、後側金属筐体20と前側金属筐体30と比較して相対的に低剛性の樹脂材料(例えばPC(ポリカーボネート)若しくはABS樹脂又はこれらの混合材)から構成された一体成形品とすることができる。
後側樹脂筐体70は、後側金属筐体20の上方に形成された開口部OSの湾曲切欠部に嵌め込まれる湾曲形状を有している。前側樹脂筐体80は、前側金属筐体30の上方に形成された開口部OSの湾曲切欠部に嵌め込まれる湾曲形状を有している。後側樹脂筐体70と前側樹脂筐体80は、前後方向に逆方向を向いた対称形状を有している。接続樹脂筐体90は、後側金属筐体20と前側金属筐体30の上方に形成された開口部OSのうち、後側樹脂筐体70と前側樹脂筐体80の間に嵌め込まれる湾曲形状を有している。
また、下面接続筐体60には、外部マイクロフォンユニット100を接続するためのネジ孔及びコネクタ(図示せず)が設けられている。
図4は、撮影装置1に取り付け可能な外部マイクロフォンユニット100の外観を示す斜視図である。外部マイクロフォンユニット100の上面には、ネジやコネクタ(図示せず)が設けられている。コネクタは、撮影装置1との間でデータ転送を可能とするアナログピンやUSB端子である。外部マイクロフォンユニット100は、特定の方向の対する感度特性の指向性を有する4つの単一指向性マイクロフォン(図示せず)を有する。
外部マイクロフォンユニット100のネジ及びコネクタを、撮影装置1の下面接続筐体60に設けられたネジ孔及びコネクタにそれぞれ接続することにより、外部マイクロフォンユニット100を、撮影装置1に電気的及び物理的に接続することができる。
外部マイクロフォンユニット100を用いることにより、撮影装置1による撮影環境の周囲の音声を、高品質に取得することができるが、外部マイクロフォンユニット100は必須ではない。
全天球カメラとしての撮影装置1は、例えば、ユーザ端末(図示せず)とヘッドマウントディスプレイ(図示せず)とを含んで構成されるシステム環境で使用される。なお、各ハードウェアは、無線通信または有線通信によって相互に接続することができ、設定データや、動画ファイルなどの各種データを送受信することが可能である。
本実施形態の撮影装置1は、複数の結像光学系を含んで構成され、各結像光学系で撮影された画像を合わせることで、立体角4πステラジアンの全天球画像として撮影することができる。また、撮影装置1は全天球画像を時間的に連続して撮影することも可能であり、これによって全天球動画を撮影することができる。全天球動画を撮影する場合には、撮影装置1が備えるマイクロフォン、又は撮影装置1及び外部マイクロフォンユニット100が備えるマイクロフォンによって、撮影環境の周囲の音声を取得することができる。なお、撮影装置1が取得する音声は、立体音声として、ユーザに臨場感のある映像を提供することができる。
ユーザ端末として、例えば、スマートフォン端末、タブレット端末、パーソナルコンピュータなどが挙げられる。ユーザ端末は、撮影装置1と有線または無線によって通信することができ、撮影の設定や、撮影した画像の表示や編集を行う装置である。撮影装置1の設定や、撮影装置1で撮影した画像の表示や編集には、事前にユーザ端末にアプリケーションをインストールすることで操作できる。
ユーザ端末にインストールされるアプリケーション(ソフトウェア)には、撮影装置1により撮影された全天球イメージを編集可能とする編集用アプリケーションが含まれる。編集用アプリケーションは、編集した画像(静止画や動画)をWEBやSNS(Social Networking Service)にアップロード(ファイル共有)する機能が含まれる。
なお、以下における本実施形態の説明において、撮影装置1の設定を行う機能はユーザ端末が保持するものとして説明するが、実施形態を限定するものではない。例えば、撮影装置1が画面を含み、各種操作を行ってもよい。
ヘッドマウントディスプレイは、全天球画像や全天球動画を視聴するための装置である。ヘッドマウントディスプレイは、モニタとスピーカとを含んで構成され、ユーザの頭部に装着する装置である。
ヘッドマウントディスプレイは、モーションセンサなどのような、姿勢を検出するセンサを備えることにより、ユーザの頭部の動きに追従させて、表示する画像を変更できる。これにより、ユーザ、は実際に画像を撮影した場所にいるような臨場感を得ることができる。また、ヘッドマウントディスプレイのスピーカから出力される立体音声も、ユーザの視野と同期させて再生することができる。例えば、ユーザが頭部を動かすことで視線の方向を変更した場合、当該視線の方向にある音源からの音声を強調して出力できる。これにより、ユーザは、視線の方向の変更に合わせた画像と音声を視聴することができるので、臨場感のある動画を視聴することができる。
次に、各装置の詳細なハードウェア構成について説明する。図5は、撮影装置1及びユーザ端末300に含まれるハードウェア構成を示す図である。
撮影装置1は、CPU201と、RAM202と、ROM203と、記憶装置204と、通信I/F205と、音声入力I/F206と、撮影部207と、姿勢センサ208と、操作部209とを含んで構成されている。各ハードウェアはバスを介して接続されている。また、撮影装置1は、ハードウェアとして、上述の表示装置23やスピーカ41を含む。
CPU201は、撮影装置1の動作を制御するプログラムを実行する装置である。RAM202は、CPU201が実行するプログラムの実行空間を提供するための揮発性の記憶装置であり、プログラムやデータの格納用、展開用として使用される。ROM203は、プログラムやデータ等を記憶するための不揮発性の記憶装置である。
記憶装置204は、撮影装置1を機能させるOS(Operating System)やアプリケーション、各種設定情報、撮影した画像データや音声データなどを記憶する、読み書き可能な不揮発性の記憶装置である。通信I/F205は、所定の通信プロトコルにより、ユーザ端末300やヘッドマウントディスプレイなどの他の装置と通信し、各種データの送受信を行うインターフェースである。
音声入力I/F206は、動画を撮影する際に音声を取得し、録音するためのマイクロフォン24,32と接続するインターフェースである。また、撮影装置1に外部マイクロフォンユニット100が接続されている場合には、音声入力I/F206には、マイクロフォン24,32に加えて外部マイクロフォンユニット100が接続される。
撮影部207は、2つの広角レンズ系210a,210bと、2つの撮像センサ211a,211bと、画像処理部212とを含んで構成されている。広角レンズ系210a,210bは、それぞれ魚眼レンズ系及び撮像光学系を含む。
広角レンズ系210aはレンズ露出孔21に配置されており、広角レンズ系210bはレンズ露出孔31に配置されている。2つの広角レンズ系210a,210bによる像は、それぞれ2つの撮像センサ211a,211bの撮像面に結像される。画像処理部212は、撮像センサ211a,211bにより撮像された2つの画像を合成することにより4πステラジアンの立体角内の像(全天球画像)を生成する。
姿勢センサ208は、ジャイロセンサ等の角速度センサであって、撮影装置1の傾きを検出して、姿勢データとして出力する。また、姿勢センサ208は、検出された傾き情報に基づいて、鉛直方向を算出する。この鉛直方向は、全天球画像の天頂補正に用いられる。
撮影装置1は、画像データと、音声データと、姿勢データ(方向性データ)とを対応付けて動画ファイルとして保存することができる。これらの各種データによって、ヘッドマウントディスプレイで全天球動画を視聴する場合に、ユーザの動作に合わせた映像を再生することができる。
なお、操作部209には、上述のシャッターボタン22、電源ボタン51、操作ボタン52~54が含まれる。
また、ユーザ端末300は、CPU301と、RAM302と、ROM303と、記憶装置304と、通信I/F305と、表示装置306と、入力装置307とを含んで構成され、各ハードウェアはバスを介して接続されている。
ユーザ端末300に含まれるCPU301、RAM302、ROM303、記憶装置304、及び通信I/F305は、上述した撮影装置1のCPU201、RAM202、ROM203、記憶装置204、及び通信I/F205にそれぞれ対応し、同様の機能であることから、説明を省略する。
表示装置306は、ユーザに対してユーザ端末300状態や操作画面などを表示する装置であり、例として、LCD(Liquid Crystal Display)や有機ELディスプレイなどが挙げられる。入力装置307は、ユーザがユーザ端末300を操作するための装置であり、例として、キーボード、マウス、スタイラスペンなどが挙げられる。また、入力装置307は、表示装置306の機能を有するタッチパネルディスプレイであってもよい。
図6は、立体音声データを生成する処理のブロックを示す図である。図6中の破線で囲った部分は、CPU201等により実現される信号処理ブロックである。この信号処理ブロックは、全部がソフトウェア的に実現されても良いし、その一部または全部を同等の機能を提供するハードウェアとして実装することもできる。
図6では、一例として、撮影装置1が備えるマイクロフォンを無指向性とし、外部マイクロフォンユニット100が備えるマイクロフォンを指向性とした場合を例示している。撮影装置1はCH1~4のマイクロフォン(MIC)を含み、外部マイクロフォンユニット100はCH5~8のマイクロフォン(MIC)を含む。
まず、撮影装置1が備えるマイクロフォンから出力される音声信号の処理を説明する。CH1~4の各マイクロフォンから出力された音声信号は、プリアンプ(Pre AMP)によって、信号のレベルが増幅される。なお、プリアンプでは、インピーダンスの変換を行ってもよい。
プリアンプによって増幅された音声信号は、ADC(Analog to Digital Converter)によりデジタル化される。デジタル化された音声信号は、HPF(High Pass Filter)、LPF(Low Pass Filter)、IIR(Infinite Impulse Response)、FIR(Finite Impulse Response)などの各種フィルタによって、周波数分離などが行われる。
次に、感度補正ブロックでは、音声信号の感度が補正される。コンプレッサでは、信号レベルが補正される。感度補正ブロックとコンプレッサとの補正処理によって、チャンネル間の信号のギャップを低減することができる。
その後、指向性合成ブロックでは、CH5~8のマイクロフォンから出力された音声データが合成される。すなわち、指向性合成ブロックは、マイクロフォンが無指向性である場合に、指向性を持った音声データを合成する。
指向性合成ブロックで合成された音声データは、補正ブロックで各種補正処理が行われる。補正処理の例としては、前段フィルタにおける周波数分離に起因するタイミングずれや、周波数の補正である。補正ブロックで補正された音声データは、後述する音声ファイルとして出力され、音声ファイル保存部としての記憶装置204に記憶される。
立体音声データは、一例としてambisonics形式で保存することができる。ambisonics形式の立体音声データには、無指向性のW成分、X軸方向に指向性を有するX成分、Y軸方向に指向性を有するY成分、Z軸方向に指向性を有するZ成分の各指向性成分を持つ音声データが含まれる。なお、上述した立体音声データの形式は、ambisonics形式に限定するものではなく、他の形式であってもよい。
次に、外部マイクロフォンユニット100から出力される音声信号の処理を説明する。CH5~8の各マイクロフォンから入力された音声信号は、プリアンプ、ADC、HPF/LPF、IIR/FIR、感度補正ブロック、コンプレッサによって、種々の信号処理が施される。これらの各種信号処理は、CH1~4の場合と同様であることから、詳細な説明は省略する。
音声データは、上述の信号処理が行われた後、指向性変換ブロックに入力される。指向性変換ブロックでは、ユーザが設定した指向性の感度特性で以て、音声データを変換する。すなわち、指向性変換ブロックは、指向性選択情報に基づいて、4つのマイクロフォンが出力する音声データのパラメータを調整することで、ユーザが所望する方向に指向性を持った音声データに変換する。指向性変換ブロックで変換された音声データは、上述の指向性合成ブロックに入力される。
図7は、撮影装置1のCPU201に構成される機能ブロックを例示する図である。CPU201には、立体音声データ生成部220と、動画ファイル生成部221とが構成される。立体音声データ生成部220は、図6に示した機能ブロックであり、立体音声データを生成する。
動画ファイル生成部221は、上述の撮影部207により生成される全天球画像の画像データと、立体音声データ生成部220により生成れる立体音声の音声データとに基づき、動画ファイルを生成して記憶装置204に保存する。動画ファイル生成部221により生成される動画ファイルは、例えば、MP4のコンテナ構造を有するデータファイルである。動画ファイル生成部221により生成される動画ファイルは、MOV,MPEGH等のコンテナ構造を有するものであってもよい。
図7に示すように、動画ファイルには、第1領域としての汎用領域の他に、第2領域としてのベンダ固有領域が設けられている。汎用領域は、通常ユーザがアクセス可能な領域である。ベンダ固有領域は、コンテナ構造を把握しているベンダ等の特定のユーザのみがアクセス可能な領域である。
汎用領域には、例えば、H.264の圧縮形式で符号化された画像データと、AACの圧縮形式で符号化されたマルチチャンネル(4ch)の音声データが、メタデータ(管理情報)とともに格納される。汎用領域に格納される音声データは、非可逆圧縮形式である。以下、非可逆圧縮形式の音声データを、第1音声データともいう。
非可逆圧縮とは、圧縮(符号化)前のデータと、圧縮・展開(符号化・復号)を経たデータとが完全には一致しないデータ圧縮方式である。第1音声データの圧縮形式として、AAC以外に、MP3等を用いることが可能である。
なお、汎用領域には、上述の姿勢センサ208により立体音声データとともに取得された姿勢データ(方向性データ)が格納される。
ベンダ固有領域には、例えば、FLAC等の可逆圧縮形式で符号化されたマルチチャンネル(4ch)の音声データが、メタデータとともに格納される。ベンダ固有領域に格納される音声データは、非可逆圧縮形式である。以下、可逆圧縮形式の音声データを、第2音声データともいう。
ベンダ固有領域に格納される第2音声データは、圧縮形式(符号化形式)以外については、汎用領域に格納される第1音声データと同一の音声情報を有する。
非可逆圧縮とは、圧縮(符号化)前のデータと、圧縮・展開(符号化・復号)を経たデータとが完全に一致するデータ圧縮方式である。なお、第2音声データは、可逆圧縮形式に限られず、WAV等の非圧縮形式の音声データであってもよい。
図8は、ユーザ端末300にインストールされる編集用アプリケーション400の機能ブロックを例示する図である。CPU301が編集用アプリケーション400に基づき、コンピュータを作動させることにより各部の機能が実現される。
編集用アプリケーション400には、ファイル読み込み部410と、コンテナ構造解析部420と、第1編集処理部430と、第2編集処理部440と、ファイル共有処理部450とを含む。
第1編集処理部430は、復号処理部431と、編集処理部432と、符号化処理部433と、置換処理部434とを含む。第2編集処理部440は、編集処理部441と、第1置換処理部442と、符号化処理部443と、第2置換処理部444とを含む。ファイル共有処理部450は、第2領域削除処理部としてのベンダ固有領域削除処理部451を含む。
ファイル読み込み部410は、撮影装置1により生成された動画ファイル等を、RAM302に読み込む。コンテナ構造解析部420は、読み込まれた動画ファイルのコンテナ構造を解析することにより、特定のメタデータによる固有コンテナ構造(ベンダ固有領域)が存在するか否かを判定する判定部である。すなわち、コンテナ構造解析部420は、動画ファイル読み込み部410により読み込まれた動画ファイルが、撮影装置1により生成されたベンダ固有領域を有する動画ファイルであるか否かを判定する。
第1編集処理部430は、動画ファイルがベンダ固有領域を有していない従来の動画ファイルである場合に動作する。ユーザの操作指示により音声データの編集が行われる場合に、復号処理部431は、汎用領域に格納されている第1音声データに対して復号処理を行い、非圧縮形式とする。
編集処理部432は、第1音声データに対して復号処理がなされた非圧縮形式の音声データに対して編集処理を行う。符号化処理部433は、編集処理部432による編集後の音声データに対して符号化処理を行う。置換処理部434は、汎用領域に格納されている第1音声データを、符号化処理部433により符号化された第1音声データで置換する。
第2編集処理部440は、動画ファイルがベンダ固有領域を有している場合に動作する。ユーザの操作指示により音声データの編集が行われる場合に、編集処理部441は、ベンダ固有領域に格納された第2音声データを読み込みんで、第2音声データに対して編集処理を行う。第1置換処理部442は、ベンダ固有領域に格納されている第2音声データを、編集後の第2音声データで置換する。
符号化処理部443は、編集処理部441による編集後の第2音声データに対して符号化処理を行う。第2置換処理部444は、汎用領域に格納されている第1音声データを、符号化処理部443により符号化された第1音声データで置換する。
ファイル共有処理部450は、ユーザの操作指示に応じて、動画ファイル等をWEBやSNSにアップロードする処理を行う。ベンダ固有領域削除処理部451は、ファイル共有処理部450が動画ファイルをアップロードする際、当該動画ファイルがベンダ固有領域を有する場合には、当該ベンダ固有領域のデータを削除する。これにより、アップロードする動画ファイルの容量が削減される。
次に、編集用アプリケーション400の処理を、フローチャートを参照しながら説明する。図9は、編集用アプリケーション400の処理を説明するフローチャートである。
編集用アプリケーション400により動画ファイルの編集を行う場合には、ファイル読み込み部410により動画ファイルが読み込まれる(ステップS100)。動画ファイルが読み込まれると、コンテナ構造解析部420により当該動画ファイルのコンテナ構造が解析され(ステップS101)、ベンダ固有領域が存在するか否かを判定される(ステップS102)。
当該動画ファイルにベンダ固有領域が存在しない場合には(ステップS102:NO)、編集用アプリケーション400により編集処理が開始されたか否かが判定される(ステップS103)。編集処理が開始された場合には(ステップS103:YES)、第1編集処理部430の復号処理部431により汎用領域に格納されている第1音声データが読み込まれ(ステップS104)、第1音声データに対して復号処理が行われる(ステップS105)。
次に、編集処理部432により復号された非圧縮形式の音声データに対して編集処理が行われ(ステップS106)、編集用アプリケーション400により編集処理が終了されたか否かが判定される(ステップS107)。編集処理が終了された場合には(ステップS107:YES)、符号化処理部433により編集後の音声データに対して符号化処理が行われる(ステップS108)。そして、置換処理部434により、汎用領域に格納されている第1音声データが、符号化された第1音声データで置換される。
このように、動画ファイルにベンダ固有領域が存在しない場合には、第1音声データに対する復号処理及び符号化処理によって、データが損失することにより、音質や空間音声の指向性に劣化が生じてしまう。
次に、ステップS102において、動画ファイルにベンダ固有領域が存在すると判定された場合には(ステップS102:YES)、編集用アプリケーション400により編集処理が開始されたか否かが判定される(ステップS110)。編集処理が開始された場合には(ステップS110:YES)、第2編集処理部440の編集処理部441によりベンダ固有領域に格納された第2音声データが読み込まれ(ステップS111)、第2音声データに対して編集処理が行われる(ステップS112)。
次に、編集用アプリケーション400により編集処理が終了されたか否かが判定される(ステップS113)。編集処理が終了された場合には(ステップS113:YES)、第1置換処理部442により、ベンダ固有領域に格納されている第2音声データが、編集後の第2音声データで置換される(ステップS114)。次に、符号化処理部443により、編集処理部441による編集後の第2音声データに対して符号化処理が行われる(ステップS115)。そして、第2置換処理部444により、汎用領域に格納されている第1音声データが、符号化された第1音声データで置換される(ステップS116)。
図10は、第2編集処理部440によるステップS111~S116の編集処理を概念的に説明する図である。
このように、第2編集処理部440は、第2音声データに対して編集を行った後、編集後の第2音声データを符号化して汎用領域の第1音声データを置換する。第2音声データに対する編集では、復号・符号化によるデータの劣化が生じないため、音質や空間音声の指向性に劣化が防止される。
図11は、ファイル共有処理部450による処理を説明するフローチャートである。ファイル共有処理部450は、動画ファイルがWEBやSNSにアップロードするファイル共有指示の有無を判定し(ステップS200)、ファイル共有指示があった場合には(ステップS200:YES)、コンテナ構造解析部420により当該動画ファイルのコンテナ構造が解析され(ステップS201)、ベンダ固有領域が存在するか否かを判定される(ステップS202)。
動画ファイルにベンダ固有領域が存在する場合には(ステップS202:YES)、ベンダ固有領域削除処理部451により、当該ベンダ固有領域のデータが削除される(ステップS203)。そして、ファイル共有処理部450により、ベンダ固有領域が削除された画像ファイルがアップロードされる(ステップS204)。
なお、ステップS202において動画ファイルにベンダ固有領域が存在しないと判定された場合には(ステップS202:NO)、ベンダ固有領域削除処理部451による削除処理は行われず、処理がステップS204に移行する。このように、ベンダ固有領域を有する動画ファイルをアップロードする際に、動画ファイルの容量を削減することができる。
なお、編集用アプリケーション400の機能は、ユーザ端末300のCPU301に限られず、撮影装置1のCPU201に構成されてもよい。編集用アプリケーション400がインストールされた装置は、動画ファイルの復号・符号化による劣化を防止することが可能なデータ編集処理装置を構成する。
また、上記各実施形態に示した要件に本発明が限定されるものではない。これらの点に関しては、本発明の主旨をそこなわない範囲で変更することができ、その応用形態に応じて適切に定めることができる。
1 撮影装置
100 外部マイクロフォンユニット
120 ユーザ端末
204 記憶装置
207 撮影部
208 姿勢センサ
212 画像処理部
220 立体音声データ生成部
221 動画ファイル生成部
300 ユーザ端末
400 編集用アプリケーション
420 コンテナ構造解析部
430 第1編集処理部
431 復号処理部
432 編集処理部
433 符号化処理部
434 置換処理部
440 第2編集処理部
441 編集処理部
442 第1置換処理部
443 符号化処理部
444 第2置換処理部
450 ファイル共有処理部
451 ベンダ固有領域削除処理部
特許第5777185号 特開2017-17447号公報

Claims (10)

  1. 画像データと非可逆圧縮形式の第1音声データとが格納された第1領域と、可逆圧縮形式又は非圧縮形式の第2音声データが格納された第2領域とを有するコンテナ構造の動画ファイルを編集可能とするデータ編集処理装置であって、
    前記動画ファイルが編集される場合に、前記第2領域から前記第2音声データを読み込んで編集する編集処理部と、
    前記第2領域に格納された前記第2音声データを、前記編集処理部により編集された前記第2音声データで置換する第1置換処理部と、
    前記編集処理部により編集された前記第2音声データを符号化する符号化処理部と、
    前記第1領域に格納された前記第1音声データを、前記符号化処理部により符号化された前記第2音声データで置換する第2置換処理部と、
    を有するデータ編集処理装置。
  2. 前記第2領域は、特定のユーザのみがアクセス可能なベンダ固有領域である請求項1に記載のデータ編集処理装置。
  3. 前記動画ファイルに前記第2領域が存在するか否かを判定する判定部を有し、
    前記編集処理部、前記第1置換処理部、前記符号化処理部、及び前記第2置換処理部は、前記判定部により前記第2領域が存在すると判定された場合に動作する請求項1又は2に記載のデータ編集処理装置。
  4. 前記第1音声データ及び前記第2音声データは、マルチチャンネルの立体音声データである請求項1ないし3いずれか1項に記載のデータ編集処理装置。
  5. 前記第1領域は、MP4、MOV、又はMPEGHのうちいずれか1つのコンテナ構造を有する請求項1ないし4いずれか1項に記載のデータ編集処理装置。
  6. 前記第2領域は、FLAC又はWAVのコンテナ構造を有する請求項5に記載のデータ編集処理装置。
  7. 前記動画ファイルは、全天球画像を含む請求項1ないし6いずれか1項に記載のデータ編集処理装置。
  8. 前記動画ファイルをファイル共有する際に、前記第2領域を削除する第2領域削除処理部を有する請求項1ないし7いずれか1項に記載のデータ編集処理装置。
  9. 画像データと非可逆圧縮形式の第1音声データとが格納された第1領域と、可逆圧縮形式又は非圧縮形式の第2音声データが格納された第2領域とを有するコンテナ構造の動画ファイルを編集可能とする処理をコンピュータに実行させるアプリケーションであって、
    前記動画ファイルが編集される場合に、前記第2領域から前記第2音声データを読み込んで編集する編集処理と、
    前記第2領域に格納された前記第2音声データを、前記編集処理により編集された前記第2音声データで置換する第1置換処理と、
    前記編集処理により編集された前記第2音声データを符号化する符号化処理と、
    前記第1領域に格納された前記第1音声データを、前記符号化処理により符号化された前記第2音声データで置換する第2置換処理と、
    をコンピュータに実行させるアプリケーション。
  10. 前記データ編集処理装置はさらに、
    前記画像データを生成する撮影部と、
    音声を入力する音声入力部と、
    を有する請求項1ないし8いずれか1項に記載のデータ編集処理装置
JP2019016354A 2019-01-31 2019-01-31 データ編集処理装置、アプリケーション、及び撮影装置 Active JP7247616B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019016354A JP7247616B2 (ja) 2019-01-31 2019-01-31 データ編集処理装置、アプリケーション、及び撮影装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019016354A JP7247616B2 (ja) 2019-01-31 2019-01-31 データ編集処理装置、アプリケーション、及び撮影装置

Publications (2)

Publication Number Publication Date
JP2020123934A JP2020123934A (ja) 2020-08-13
JP7247616B2 true JP7247616B2 (ja) 2023-03-29

Family

ID=71993127

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019016354A Active JP7247616B2 (ja) 2019-01-31 2019-01-31 データ編集処理装置、アプリケーション、及び撮影装置

Country Status (1)

Country Link
JP (1) JP7247616B2 (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005020321A (ja) 2003-06-26 2005-01-20 Sony Corp 記録装置および方法、並びにプログラム
JP2006528472A (ja) 2004-10-14 2006-12-14 松下電器産業株式会社 記録装置、編集装置、デジタルビデオ記録システムおよびファイルフォーマット
JP2006352556A (ja) 2005-06-16 2006-12-28 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2011223220A (ja) 2010-04-08 2011-11-04 Sanyo Electric Co Ltd ファイル編集装置
JP2017188735A (ja) 2016-04-01 2017-10-12 キヤノン株式会社 データ構造、情報処理装置およびその制御方法
JP2017195507A (ja) 2016-04-20 2017-10-26 オリンパス株式会社 情報端末装置、撮像装置及び情報処理方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005020321A (ja) 2003-06-26 2005-01-20 Sony Corp 記録装置および方法、並びにプログラム
JP2006528472A (ja) 2004-10-14 2006-12-14 松下電器産業株式会社 記録装置、編集装置、デジタルビデオ記録システムおよびファイルフォーマット
JP2006352556A (ja) 2005-06-16 2006-12-28 Sony Corp 情報処理装置および方法、記録媒体、並びにプログラム
JP2011223220A (ja) 2010-04-08 2011-11-04 Sanyo Electric Co Ltd ファイル編集装置
JP2017188735A (ja) 2016-04-01 2017-10-12 キヤノン株式会社 データ構造、情報処理装置およびその制御方法
JP2017195507A (ja) 2016-04-20 2017-10-26 オリンパス株式会社 情報端末装置、撮像装置及び情報処理方法

Also Published As

Publication number Publication date
JP2020123934A (ja) 2020-08-13

Similar Documents

Publication Publication Date Title
TWI496480B (zh) 偕同一可攜式電子裝置用於產生多頻道音訊之系統和方法
JPWO2017208820A1 (ja) 映像音響処理装置および方法、並びにプログラム
JP7196399B2 (ja) 音響装置、音響システム、方法およびプログラム
JPWO2011099299A1 (ja) 映像抽出装置、撮影装置、プログラム及び記録媒体
US10397723B2 (en) Apparatus, system, and method of processing data, and recording medium
JP7533563B2 (ja) 音響装置、撮像装置、音響システム、方法およびプログラム
JP7247616B2 (ja) データ編集処理装置、アプリケーション、及び撮影装置
US10200616B2 (en) Image processing device that performs image rotation processing, method of controlling the same, and storage medium
KR101121030B1 (ko) 촬상장치
JP2013187841A (ja) 電子機器及び出力制御方法並びにプログラム
KR101464532B1 (ko) 디지털 영상 처리 장치 및 이의 제어 방법
JP2019140667A (ja) 情報処理装置、情報処理システム、データ生成方法およびプログラム
JP6643081B2 (ja) アルバム動画生成装置、アルバム動画生成方法及びプログラム
KR20230117877A (ko) 오디오와 비디오의 동기화가 이루어진 합성 AV(audio video) 파일을 생성하기 위한 전자 장치
JP5014101B2 (ja) 撮像装置
JP2021040217A (ja) 撮像装置及びその制御方法並びにプログラム
JP5014100B2 (ja) 撮像装置
JP4934062B2 (ja) テレビカメラ
JP5349850B2 (ja) 信号処理装置、撮像装置
JP6566826B2 (ja) 画像処理装置、およびその制御方法、および制御プログラム
JP6598670B2 (ja) 画像処理装置、その制御方法及びプログラム
JP5072730B2 (ja) 信号処理装置、撮像装置
JP5530192B2 (ja) 画像音声記録システム
JP5704945B2 (ja) 撮像装置およびその制御方法、プログラム
JP2015036748A (ja) 撮像装置、撮像装置の制御方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211021

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220914

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221004

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221129

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230227

R151 Written notification of patent or utility model registration

Ref document number: 7247616

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151