JP2010262703A - リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 - Google Patents
リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 Download PDFInfo
- Publication number
- JP2010262703A JP2010262703A JP2009113258A JP2009113258A JP2010262703A JP 2010262703 A JP2010262703 A JP 2010262703A JP 2009113258 A JP2009113258 A JP 2009113258A JP 2009113258 A JP2009113258 A JP 2009113258A JP 2010262703 A JP2010262703 A JP 2010262703A
- Authority
- JP
- Japan
- Prior art keywords
- data
- file
- average value
- predetermined
- linear pcm
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
【課題】リニアPCMオーディオデータと圧縮符号化データをクラスタ単位で判別可能な判別装置を提供する。
【解決手段】リニアPCMオーディオデータと圧縮符号化データとが混在するデータに対し、所定単位でリニアPCMオーディオデータを判別する方法であって、入力されたデータ列に対し、所定の量子化ビットで量子化レベルを算出するステップと、所定単位で隣接するデータ間の量子化レベル差分絶対値の平均値を求めるステップと、平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別を判別する判別ステップとを備え、判別ステップは、平均値が閾値より大きいときはデータ列を圧縮符号化データと判別し、平均値が閾値より小さいときはデータ列を非圧縮の音声データと判別する。
【選択図】図10
【解決手段】リニアPCMオーディオデータと圧縮符号化データとが混在するデータに対し、所定単位でリニアPCMオーディオデータを判別する方法であって、入力されたデータ列に対し、所定の量子化ビットで量子化レベルを算出するステップと、所定単位で隣接するデータ間の量子化レベル差分絶対値の平均値を求めるステップと、平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別を判別する判別ステップとを備え、判別ステップは、平均値が閾値より大きいときはデータ列を圧縮符号化データと判別し、平均値が閾値より小さいときはデータ列を非圧縮の音声データと判別する。
【選択図】図10
Description
本発明は、リニアPCMオーディオデータと圧縮符号化データとが混在するデータに対し、所定単位でリニアPCMオーディオデータを判別するデータ判別方法及びデータ判別装置に関する
近年、動画や音声等のデータをファイルとしてデータ記録メディアに記録する装置が一般的になっている。また、動画データはサイズが大きいことから、各種規格化された圧縮方式によりデータサイズを大幅に圧縮し、ファイルとして記録される一方、音声データは、動画データに比べてデータサイズが小さいことから、PCM(Pulse Code Modulation)と呼ばれる符号化方式により、非圧縮データファイルとして記録されることが知られている。このようにデータ記録メディアに記録されたファイルデータは、ファイルシステムによってファイルとして管理され、個々のファイルサイズや記録日時情報、クラスタのユーザ領域の使用状況等のファイル管理情報が、ファイルデータと共にデータ記録メディアに記録される。ここで、クラスタとはファイルシステムがファイルデータを管理する記録単位のことであり、一般的に一つのクラスタ内に複数のファイルデータが混在して記録されることはない。また、ユーザ領域とは一般に動画や音声等のファイルデータを記録する領域であり、これに対しシステム領域とは、一般にユーザ領域に記録されたファイルデータをファイルとして扱うためのファイル管理情報を記録する領域である。つまり、ユーザ領域に記録されたファイルデータがファイルとして正しく認識され、正常に展開されるためには、ファイルデータだけでなく、ファイル管理情報も正しくシステム領域に記録されている必要がある。そのため、このファイル管理情報が破損、または消失する事態に対して、ユーザ領域に記録されたファイルデータのみからファイルを復旧させる方法が各種提案されている。一例として、ファイルデータを複数のユニットに分割し、各ユニットにシーケンス情報を付与することにより、シーケンス情報を元に連続するユニットを特定し、ファイルデータ復旧を可能とする方法が知られている(例えば、特許文献1参照)。
しかしながら、ファイル化されたリニアPCMオーディオデータと動画圧縮符号化データが記録されたデータ記録メディアにおいて、シーケンス情報を元にファイルデータを復旧する方法は、動画圧縮符号化データがシーケンス情報を保持していない場合や、シーケンス情報を保持していても位置情報が不明な場合、リニアPCMオーディオデータと動画圧縮符号化データの判別が不可能であった。
本発明はこのような課題に鑑みてなされたもので、容易にリニアPCMオーディオデータと圧縮符号化データの復旧を可能とするため、シーケンス情報に関係なくリニアPCMオーディオデータと圧縮符号化データのデータ判別を可能とする方法を提供することを目的とする。
本発明のデータ判別装置は上記課題を解決するため、入力されたデータ列に対し、所定の量子化ビットで量子化レベルを算出するステップと、所定単位で隣接する量子化レベル間の差分絶対値の平均値を求めるステップと、平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別を判別する判別ステップと、を備える。
リニアPCMオーディオデータと圧縮符号化データとが混在するデータから、容易な演算のみでクラスタ単位でのデータ判別を可能とする。記録メディアにおいて管理情報が消去されたデータを、メディアのユーザ領域から復旧する装置において、リニアPCMオーディオデータと圧縮符号化データの判別を可能とする。
以下、図面を参照しながら本発明を実施するための最良の形態について説明する。
図1は、本実施の形態のデータ判別装置の構成を示すブロック図である。本実施の形態では、本発明のデータ判別装置を実現するためのプログラムを実行することにより、コンピュータをデータ判別装置として機能させる構成について説明する。図1において、データ記録メディア101は、データ判別の対象となる記録媒体であり、映像信号等のデータがファイル化して記録される。データ記録メディア101としては、ハードディスク、光ディスクおよび半導体メモリ等が一般的である。データ記録メディア101は、データ判別装置に対して着脱可能に構成されていてもよい。インターフェース102は、データ記録メディア101とI/Oバス103との間の信号伝達を実現している。CPU104は、データ判別装置における演算および制御処理を行う。メモリ105は、データ記録メディア101が保持しているデータの判別処理等において、一時的なデータ記憶および判別処理により抽出したファイルデータを記憶するために使用する。CPU104は、プログラムをハードディスク等の不揮発性記録メディア106からメモリ105に読み込んで実行するが、メモリ105のうち不揮発性メモリで構成された領域にプログラムを記憶しておいてもよい。ユーザは、入力部107を使用して判別処理の開始および中止命令をデータ判別装置に指示し、または判別に用いる設定値を入力する。表示部108は、CPU104が行う判別処理の進捗状況、判別ファイルの処理結果等を表示する。以上の構成は一般的なコンピュータの主要構成である。
図2は、データ記録メディアにおけるデータ記録領域の状態の一例を示す図である。図2においてデータ記録メディア101のデータ記録領域は、一般的にファイル管理情報を保持するシステム領域201と、データが記録されるユーザ領域202とを備える。図2におけるデータ記録メディア101には、ファイル203、ファイル204およびファイル205が記録されている。すなわち、ユーザ領域202にはファイル203、ファイル204およびファイル205のデータが記録され、システム領域201にはこれらのファイルに対するファイル管理情報が記録されている。
図3は、音声データと動画データを異なるファイルとして記録するカムコーダ等において、2つのファイルを断続的に混在して記録したデータ記録メディアのユーザ領域の状態の一例を示した図である。ファイル203とファイル204は、断続的にユーザ領域に記録されるが、データ記録メディア101のシステム領域201にファイル管理情報として各ファイルのデータ記録領域が記録されているため、ファイル読み込み時にはシステム領域に記録されたデータ記録領域を順次参照してデータを読み込み、分断されたデータを一つのファイルとして操作することが可能となる。
図4は、データ消去処理後のデータ記録メディア101におけるデータ記録領域の状態を示す図である。図4におけるデータ記録メディア101は、図3に示した状態からデータ消去処理を行い、ファイル管理情報のみを削除した状態となっている。一般的なファイルシステムにおいて、データ記録メディア101に対するフォーマット等のデータ消去処理は、データ自体をユーザ領域202に保持したまま、システム領域201上のファイル管理情報だけを消去する処理である。本実施の形態のデータ判別装置は、データ記録メディア101のファイル管理情報が破損または消失しているかどうかに関わらず、ユーザ領域202からデータを取得し、データ判別を実現する。
以後、本実施の形態として、ファイルの記録単位であるクラスタサイズを32KB、ファイルシステムをFAT32とし、判別対象データを、デジタルビデオデータの半導体記録メディアに記録する方式の実施例として規格化されているSMPTE RECOMMENDED PRACTICE Content Specification on Solid State Media Card for DV/DV−Based Essenceに基づき、記録素材用音声データ、動画データをMXF(Material eXchange Format:SMPTE 377M参照)ファイルとし、プロキシAVデータをMP4(ISO/IEC 14496−12参照)ファイルとする。ここで、プロキシAVデータとは、記録素材用音声、動画データとは別に低ビットレートで圧縮記録された音声データ、動画データのことである。カムコーダ等で記録したコンテンツを編集する際、記録素材用音声、動画データを直接操作するのに比べ、低ビットレートのプロキシAVデータを用いる方がコンピュータの演算負荷が少なく、操作性が向上することから用いられる。なお、プロキシAVデータを用いた編集結果は、編集完了後に記録素材用音声、動画データに反映して用いられることが一般的である。
図5は、MXFオーディオファイルの本実施の形態におけるファイルフォーマットの構成を図示したものである。Sound Essence Element valuesにリニアPCMオーディオデータが記録されているものとする。ここで、リニアPCMオーディオデータは、連続性を有するアナログ音声波形信号を所定のサンプリング周波数でサンプリングし、所定の量子化ビットで量子化して得られた信号の大きさをデジタルデータで表現したものであるため(図6)、サンプリング毎の量子化レベルも近似的な連続性を有する。ここでリニアPCMオーディオデータのサンプリング周波数を48kHz、量子化ビットを16bitとする。
図7は、MXFビデオファイルの本実施の形態におけるファイルフォーマット構成を図示したものである。MXFファイルに記録される動画データのエッセンスはDIF(SMPTE 370M参照)とする。ここで、DIFデータとリニアPCMオーディオデータとのデータ判別方法に関して、DIFデータは80バイト毎に3バイトのシーケンスIDが付与されていることから、読み込んだクラスタデータに連続したシーケンスIDが80バイト毎に検出されるか判別することにより、データ判別が可能となる。一方、圧縮符号化データがDIFのように等間隔でシーケンスIDを保持しない場合、上記方法によるリニアPCMオーディオデータと圧縮符号化データの判別は不可能となる。
本実施の形態においては、プロキシAVデータとして記録されるMP4ファイルがDIFのように等間隔でシーケンス情報を保持しないことから、MP4ファイルデータがリニアPCMオーディオデータと混在して記録されると、シーケンス情報によるデータ判別が不可能となる。
図8に、MP4ファイルフォーマット構成の実施例を示す。本実施の形態において、mdatにISO/IEC14496−2で規格化されているMPEG−4visualと、ISO/IEC14496−3で規格化されているMPEG−4audioが記録されるものとする。以後、圧縮符号化データをMP4ファイルデータとして、リニアPCMオーディオデータとの判別方法について説明する。
一般的なカムコーダ等において、被写体に自然風景や人が選ばれる可能性が考えられるが、自然風景を被写体とする場合、収録される音声レベルは比較的小さい傾向にあるため、リニアPCMオーディオデータの量子化レベルは全体的に低く、隣り合う量子化レベルの差分も小さい傾向にある。また、人を被写体とした場合、音声データとして人の声が記録されるが、人の声は数kHzまでの周波数を中心とした音声データとなることから、リニアPCMオーディオデータとして記録される音声の周波数は、サンプリング周波数48KHzに比べ低く、隣り合う量子化レベルの差分も小さい傾向にある。
一方、動画圧縮符号化データは、リニアPCMオーディオデータのようにアナログ波形をサンプリング毎に16bitで量子化したデータではないうえ、圧縮によりデータの冗長性が大きく低減されている。このため動画圧縮符号化データをリニアPCMオーディオデータと同様に、16bit単位でデータを量子化レベルとして算出した場合、隣り合う量子化レベルに相互関係がなく、近似的な連続性も低いものとなる(図9)。よって、リニアPCMオーディオデータの差分絶対値のクラスタ単位における平均値と、動画圧縮符号化データの差分絶対値のクラスタ単位における平均値には大きな隔たりが存在し、この隔たりの間にデータ判別用の閾値を設定し、算出した差分絶対値の平均値とデータ判別用閾値との大小関係を判別することでリニアPCMオーディオデータと動画圧縮符号化データの判別が可能となる。
このように本実施の形態のデータ判別装置は、リニアPCMオーディオデータのサンプリング周波数毎の量子化レベルの近似的な連続性の高さに対し、動画圧縮符号化データを判別対象であるリニアPCMオーディオデータと同じ量子化ビット数で量子化レベルを算出すると、不規則な量子化レベルが得られ、近似的な連続性が低くなることを利用する。図10に本実施の形態のリニアPCMオーディオデータと圧縮符号化データ判別フローチャートの一例を示す。データ判別処理開始直後、ステップS1001において、判別対象となるリニアPCMオーディオデータの量子化ビット数を設定する。本実施の形態では上記の通り16bitとする。続いてステップS1002において、リニアPCMオーディオデータと圧縮符号化データを判別する量子化レベルの閾値を設定する。次にステップS1003において、データ記録メディアのユーザ領域からクラスタ単位でデータを読み込む。もしデータの読み込みに失敗した場合は判別処理を終了する(S1004)。データの読み込みに成功した場合は、読み込んだクラスタがMXFファイルヘッダか判別を行う(S1005)。MXFファイルヘッダの判別は読み込んだ32KBデータの先頭がMXFファイルヘッダに含まれるHeader Partition Pack Key Valueと一致するかどうかで判定可能である。ここで、MXFファイルの基本構造について説明する。MXFオーディオファイルの基本構造を示した図5において、MXFファイルは、ファイルヘッダ501、ファイルボディ502およびファイルフッタ503から構成される。ファイルヘッダ501はHeader Partition Pack504を含み、Header Partition Pack Key Value505がHeader Partition Pack504に含まれる。一般的にファイル先頭にはファイルヘッダが存在し、ファイルの種類に応じた固有データパターンを保有しているため、MXFファイルに限らず、読み込んだデータの中に特定の固有データパターンが存在するか検索することで、ファイルの先頭を特定可能となる。もしステップS1005でMXFファイルヘッダと判別された場合、読み込んだクラスタデータをリニアPCMオーディオデータとして出力する(S1006)。本実施の形態では、判別対象となるデータの一方をリニアPCMオーディオデータ、もう一方をMP4動画圧縮符号化データとしてそれぞれファイル形式で出力するものとする。ステップS1005でMXFファイルヘッダと判別されなかった場合、読み込んだクラスタデータがMXFファイルフッタか判別を行う(S1007)。MXFファイルフッタを判別する方法として、読み込んだクラスタデータの中にMXFファイルフッタに含まれるFooter Partition Pack Key Valueが検出されるかどうかでファイルの終端の判定を行う。もしFooter Partition Pack Key Value506が検出されれば、そのクラスタが、ファイルの終端に記録されたファイルフッタ503と特定できる。一般的なファイルの構造として、ファイル始端にはファイルヘッダが、ファイル終端にはファイルフッタが付与されるため、ファイル固有のフッタデータパターンを検出することにより、MXFファイル以外のファイル終端も検出することが可能となる。もしステップS1007でMXFファイルフッタと判別された場合、MXFファイルヘッダ同様、読み込んだクラスタデータをリニアPCMオーディオデータとして出力する(S1006)。ステップS1007でMXFファイルフッタと判別されなかった場合、読み込んだクラスタデータがMP4ファイルヘッダか判別を行う(S1008)。MP4ファイルヘッダを判別する方法として、読み込んだクラスタデータの先頭が、File Type Boxであるかどうか判別する。MP4ファイルフォーマットはボックスと呼ばれるオブジェクトで構成されており、ファイルの先頭にはファイルタイプを記述するFile Type Boxが“ftyp”という文字列を含んで記録されている。そのため読み込んだクラスタデータの先頭から“ftyp”が検出されるかどうかでMP4ファイルヘッダの判別が可能となる。もしステップS1008でMP4ファイルヘッダと判別された場合、読み込んだクラスタデータを動画圧縮符号化データとして出力する(S1009)。ステップS1008でMP4ファイルヘッダと判別されなかった場合、読み込んだクラスタデータがMP4ファイル終端か判別を行う(S1010)。MP4ファイル終端を判別する方法として、読み込んだクラスタに図7に記されるSkip Boxがあるかどうかで判別する。ここで、本実施の形態におけるSkip Boxには、クリップ名やUMID(Unique Material Identifier)、カードシリアル番号が固定サイズで記録されているため、これらの情報が既知の場合、読み込んだクラスタデータの中にこれらのデータが規定サイズで検出されるかどうかでMP4終端の判別が可能になる。しかし、MP4ファイルフォーマットのボックスと呼ばれるオブジェクトの順序は、ISO/IEC 14496−12で規定されておらず、実施例によりファイル終端に記録されるボックスが異なるうえ、Skip Boxに記録されている情報が既知でない可能性もあるため、MP4ファイル終端の判別は必ずしも実施しなくても良い。その場合、MP4ファイル終端はステップS1011以降の特定の量子化ビットによる量子化レベルの近似的な連続性を元にデータ判別を行う。次に、近似的な連続性によるデータ判別を実施するため、読み込んだクラスタデータを、ステップS1001で設定した量子化ビット数に合わせて量子化レベルを算出する(S1011)。本実施の形態では、量子化ビットが16bitのため、読み込んだ32KBのクラスタデータの先頭から16bit単位でCPUのエンディアンに合わせて量子化レベルの算出処理を繰り返し、2048個の量子化レベルを算出する続くステップS1012において、まず、算出した量子化レベルから、隣接する量子化レベル同士の差分と、その絶対値を算出する。その後、読み込んだクラスタにおける絶対値の平均値を算出する。この平均値を、読み込んだクラスタデータの量子化ビット単位の近似的な連続性の高さを判別する基準として用いる。16bit単位でアナログ波形を量子化したデータ以外は、平均値が高くなり、この値を特定の閾値と比較し(S1013)、より小さな場合は近似的な連続性が高いと判断しリニアPCMオーディオデータとして出力し(S1014)、より大きな場合は近似的な連続性が低いと判断し動画圧縮符号化データとして出力する。その後、ステップS1003に戻り、判別処理を終えた次のクラスタデータを読み込み同様の処理を繰り返す。ステップS1004において、判別対象データを全て読み終えたとき、判別処理が終了となる。なお、データ判別対象のリニアPCMオーディオデータの記録音声内容が、音楽等の音声レベルが連続して高い素材を収録したデータと、自然風景など静かな音声が収録されたデータの場合、クラスタ単位の差分平均値に隔たりが生じるため、互いにリニアPCMオーディオデータであっても、閾値を設けて判別が可能である。
図11に、リニアPCMオーディオデータまたは、圧縮符号化データどちらか一方、または両方のデータサイズが既知の場合に、閾値が変動するデータ判別フローチャートの一例を示す。まずステップS1001で判別対象となるリニアPCMオーディオデータの量子化ビットを設定する。次にステップS1101において判別対象となるデータのデータサイズを入力する。ステップS1003以降、データ記録メディアからクラスタ単位でデータを読み込み、MXFヘッダ、MXFフッタ、MP4ヘッダ、MP4フッタかどうか判別するステップは図10と同じである。読み込んだクラスタデータがMXFファイルデータと判別された場合は、ステップS1102においてリニアPCMオーディオデータを意味する記号が判別テーブルに記録され、読み込んだクラスタデータがMP4ファイルデータと判別された場合は、ステップ1103において圧縮符号化データを意味する記号が判別テーブルに記録される。ここで、判別テーブルとは、データ記録メディアから読み込んだクラスタデータの種類、または隣り合う量子化レベルの差分絶対値のクラスタ単位における平均値を記録したファイルのことである。一度、データ判別対象の差分絶対値のクラスタ単位における平均値を記録すると(S1104)、その後何度も閾値と比較する必要がある場合に、その都度平均値を算出する必要がないことから、効率的な処理が可能となる。本実施の形態においては、閾値を変化させながら算出した平均値と繰り返し比較する必要があることから、判別テーブルを用いる。判別テーブル完成後、ステップS1105において任意に閾値を設定する。この設定した閾値と、判別テーブルに記録された差分絶対値の全クラスタ単位の平均値を比較し、リニアPCMオーディオデータと圧縮符号化データの判別を行い、判別結果からリニアPCMオーディオデータのデータサイズ、または圧縮符号化データのデータサイズを算出する(S1106)。その後、ステップS1101で入力した値とそれぞれ一致するか判別すし(S1107)、一致しないようであればステップS1108において閾値を変更後、再度データ判別処理を行う。ステップS1107においてデータサイズが一致した場合、その時点の閾値によるデータ判別を元にデータを出力する(S1108)。これにより、適切な閾値が不明な場合においてもデータ判別が可能となる。
図12に、本実施の形態のデータ判別装置を用いたファイル復旧処理の概要を示す。音声データとしてリニアPCMオーディオデータが、圧縮符号化データとしてMXFビデオファイル、プロキシAVデータとしてMP4ファイルがデータ記録メディア101のユーザ領域202に先頭から順に記録されているものとする。まず、ユーザ領域202の先頭からクラスタ単位で、DIFのシーケンスIDが検出されるか判別し、検出されたクラスタデータはMXFビデオファイルとして出力する。次に、MXFビデオファイルデータでないと判別されたデータから、本実施の形態のデータ判別処理を用いてリニアPCMオーディオデータと圧縮符号化データを判別し、近似的な連続性の高いものはリニアPCMオーディオデータとして出力し、そうでないものはMP4ファイルデータとして出力する。これにより、元のリニアPCMオーディオデータ、MXFビデオファイルデータ、プロキシAVファイルデータが消去前と同様にファイルシステムにファイルとして管理されることで操作可能となり、復旧が完了する。
本実施の形態は、このようなデータ記録領域に先頭からデータ記録される記録メディアにおいて、リニアPCMオーディオデータと圧縮符号化データがクラスタ単位で混在する中、ファイル復旧を可能とするデータ判別手段を提供する。
図2は、データ記録メディアにおけるデータ記録領域の状態の一例を示す図である。図2においてデータ記録メディア101のデータ記録領域は、一般的にファイル管理情報を保持するシステム領域201と、データが記録されるユーザ領域202とを備える。図2におけるデータ記録メディア101には、ファイル203、ファイル204およびファイル205が記録されている。すなわち、ユーザ領域202にはファイル203、ファイル204およびファイル205のデータが記録され、システム領域201にはこれらのファイルに対するファイル管理情報が記録されている。
図3は、音声データと動画データを異なるファイルとして記録するカムコーダ等において、2つのファイルを断続的に混在して記録したデータ記録メディアのユーザ領域の状態の一例を示した図である。ファイル203とファイル204は、断続的にユーザ領域に記録されるが、データ記録メディア101のシステム領域201にファイル管理情報として各ファイルのデータ記録領域が記録されているため、ファイル読み込み時にはシステム領域に記録されたデータ記録領域を順次参照してデータを読み込み、分断されたデータを一つのファイルとして操作することが可能となる。
図4は、データ消去処理後のデータ記録メディア101におけるデータ記録領域の状態を示す図である。図4におけるデータ記録メディア101は、図3に示した状態からデータ消去処理を行い、ファイル管理情報のみを削除した状態となっている。一般的なファイルシステムにおいて、データ記録メディア101に対するフォーマット等のデータ消去処理は、データ自体をユーザ領域202に保持したまま、システム領域201上のファイル管理情報だけを消去する処理である。本実施の形態のデータ判別装置は、データ記録メディア101のファイル管理情報が破損または消失しているかどうかに関わらず、ユーザ領域202からデータを取得し、データ判別を実現する。
以後、本実施の形態として、ファイルの記録単位であるクラスタサイズを32KB、ファイルシステムをFAT32とし、判別対象データを、デジタルビデオデータの半導体記録メディアに記録する方式の実施例として規格化されているSMPTE RECOMMENDED PRACTICE Content Specification on Solid State Media Card for DV/DV−Based Essenceに基づき、記録素材用音声データ、動画データをMXF(Material eXchange Format:SMPTE 377M参照)ファイルとし、プロキシAVデータをMP4(ISO/IEC 14496−12参照)ファイルとする。ここで、プロキシAVデータとは、記録素材用音声、動画データとは別に低ビットレートで圧縮記録された音声データ、動画データのことである。カムコーダ等で記録したコンテンツを編集する際、記録素材用音声、動画データを直接操作するのに比べ、低ビットレートのプロキシAVデータを用いる方がコンピュータの演算負荷が少なく、操作性が向上することから用いられる。なお、プロキシAVデータを用いた編集結果は、編集完了後に記録素材用音声、動画データに反映して用いられることが一般的である。
図5は、MXFオーディオファイルの本実施の形態におけるファイルフォーマットの構成を図示したものである。Sound Essence Element valuesにリニアPCMオーディオデータが記録されているものとする。ここで、リニアPCMオーディオデータは、連続性を有するアナログ音声波形信号を所定のサンプリング周波数でサンプリングし、所定の量子化ビットで量子化して得られた信号の大きさをデジタルデータで表現したものであるため(図6)、サンプリング毎の量子化レベルも近似的な連続性を有する。ここでリニアPCMオーディオデータのサンプリング周波数を48kHz、量子化ビットを16bitとする。
図7は、MXFビデオファイルの本実施の形態におけるファイルフォーマット構成を図示したものである。MXFファイルに記録される動画データのエッセンスはDIF(SMPTE 370M参照)とする。ここで、DIFデータとリニアPCMオーディオデータとのデータ判別方法に関して、DIFデータは80バイト毎に3バイトのシーケンスIDが付与されていることから、読み込んだクラスタデータに連続したシーケンスIDが80バイト毎に検出されるか判別することにより、データ判別が可能となる。一方、圧縮符号化データがDIFのように等間隔でシーケンスIDを保持しない場合、上記方法によるリニアPCMオーディオデータと圧縮符号化データの判別は不可能となる。
本実施の形態においては、プロキシAVデータとして記録されるMP4ファイルがDIFのように等間隔でシーケンス情報を保持しないことから、MP4ファイルデータがリニアPCMオーディオデータと混在して記録されると、シーケンス情報によるデータ判別が不可能となる。
図8に、MP4ファイルフォーマット構成の実施例を示す。本実施の形態において、mdatにISO/IEC14496−2で規格化されているMPEG−4visualと、ISO/IEC14496−3で規格化されているMPEG−4audioが記録されるものとする。以後、圧縮符号化データをMP4ファイルデータとして、リニアPCMオーディオデータとの判別方法について説明する。
一般的なカムコーダ等において、被写体に自然風景や人が選ばれる可能性が考えられるが、自然風景を被写体とする場合、収録される音声レベルは比較的小さい傾向にあるため、リニアPCMオーディオデータの量子化レベルは全体的に低く、隣り合う量子化レベルの差分も小さい傾向にある。また、人を被写体とした場合、音声データとして人の声が記録されるが、人の声は数kHzまでの周波数を中心とした音声データとなることから、リニアPCMオーディオデータとして記録される音声の周波数は、サンプリング周波数48KHzに比べ低く、隣り合う量子化レベルの差分も小さい傾向にある。
一方、動画圧縮符号化データは、リニアPCMオーディオデータのようにアナログ波形をサンプリング毎に16bitで量子化したデータではないうえ、圧縮によりデータの冗長性が大きく低減されている。このため動画圧縮符号化データをリニアPCMオーディオデータと同様に、16bit単位でデータを量子化レベルとして算出した場合、隣り合う量子化レベルに相互関係がなく、近似的な連続性も低いものとなる(図9)。よって、リニアPCMオーディオデータの差分絶対値のクラスタ単位における平均値と、動画圧縮符号化データの差分絶対値のクラスタ単位における平均値には大きな隔たりが存在し、この隔たりの間にデータ判別用の閾値を設定し、算出した差分絶対値の平均値とデータ判別用閾値との大小関係を判別することでリニアPCMオーディオデータと動画圧縮符号化データの判別が可能となる。
このように本実施の形態のデータ判別装置は、リニアPCMオーディオデータのサンプリング周波数毎の量子化レベルの近似的な連続性の高さに対し、動画圧縮符号化データを判別対象であるリニアPCMオーディオデータと同じ量子化ビット数で量子化レベルを算出すると、不規則な量子化レベルが得られ、近似的な連続性が低くなることを利用する。図10に本実施の形態のリニアPCMオーディオデータと圧縮符号化データ判別フローチャートの一例を示す。データ判別処理開始直後、ステップS1001において、判別対象となるリニアPCMオーディオデータの量子化ビット数を設定する。本実施の形態では上記の通り16bitとする。続いてステップS1002において、リニアPCMオーディオデータと圧縮符号化データを判別する量子化レベルの閾値を設定する。次にステップS1003において、データ記録メディアのユーザ領域からクラスタ単位でデータを読み込む。もしデータの読み込みに失敗した場合は判別処理を終了する(S1004)。データの読み込みに成功した場合は、読み込んだクラスタがMXFファイルヘッダか判別を行う(S1005)。MXFファイルヘッダの判別は読み込んだ32KBデータの先頭がMXFファイルヘッダに含まれるHeader Partition Pack Key Valueと一致するかどうかで判定可能である。ここで、MXFファイルの基本構造について説明する。MXFオーディオファイルの基本構造を示した図5において、MXFファイルは、ファイルヘッダ501、ファイルボディ502およびファイルフッタ503から構成される。ファイルヘッダ501はHeader Partition Pack504を含み、Header Partition Pack Key Value505がHeader Partition Pack504に含まれる。一般的にファイル先頭にはファイルヘッダが存在し、ファイルの種類に応じた固有データパターンを保有しているため、MXFファイルに限らず、読み込んだデータの中に特定の固有データパターンが存在するか検索することで、ファイルの先頭を特定可能となる。もしステップS1005でMXFファイルヘッダと判別された場合、読み込んだクラスタデータをリニアPCMオーディオデータとして出力する(S1006)。本実施の形態では、判別対象となるデータの一方をリニアPCMオーディオデータ、もう一方をMP4動画圧縮符号化データとしてそれぞれファイル形式で出力するものとする。ステップS1005でMXFファイルヘッダと判別されなかった場合、読み込んだクラスタデータがMXFファイルフッタか判別を行う(S1007)。MXFファイルフッタを判別する方法として、読み込んだクラスタデータの中にMXFファイルフッタに含まれるFooter Partition Pack Key Valueが検出されるかどうかでファイルの終端の判定を行う。もしFooter Partition Pack Key Value506が検出されれば、そのクラスタが、ファイルの終端に記録されたファイルフッタ503と特定できる。一般的なファイルの構造として、ファイル始端にはファイルヘッダが、ファイル終端にはファイルフッタが付与されるため、ファイル固有のフッタデータパターンを検出することにより、MXFファイル以外のファイル終端も検出することが可能となる。もしステップS1007でMXFファイルフッタと判別された場合、MXFファイルヘッダ同様、読み込んだクラスタデータをリニアPCMオーディオデータとして出力する(S1006)。ステップS1007でMXFファイルフッタと判別されなかった場合、読み込んだクラスタデータがMP4ファイルヘッダか判別を行う(S1008)。MP4ファイルヘッダを判別する方法として、読み込んだクラスタデータの先頭が、File Type Boxであるかどうか判別する。MP4ファイルフォーマットはボックスと呼ばれるオブジェクトで構成されており、ファイルの先頭にはファイルタイプを記述するFile Type Boxが“ftyp”という文字列を含んで記録されている。そのため読み込んだクラスタデータの先頭から“ftyp”が検出されるかどうかでMP4ファイルヘッダの判別が可能となる。もしステップS1008でMP4ファイルヘッダと判別された場合、読み込んだクラスタデータを動画圧縮符号化データとして出力する(S1009)。ステップS1008でMP4ファイルヘッダと判別されなかった場合、読み込んだクラスタデータがMP4ファイル終端か判別を行う(S1010)。MP4ファイル終端を判別する方法として、読み込んだクラスタに図7に記されるSkip Boxがあるかどうかで判別する。ここで、本実施の形態におけるSkip Boxには、クリップ名やUMID(Unique Material Identifier)、カードシリアル番号が固定サイズで記録されているため、これらの情報が既知の場合、読み込んだクラスタデータの中にこれらのデータが規定サイズで検出されるかどうかでMP4終端の判別が可能になる。しかし、MP4ファイルフォーマットのボックスと呼ばれるオブジェクトの順序は、ISO/IEC 14496−12で規定されておらず、実施例によりファイル終端に記録されるボックスが異なるうえ、Skip Boxに記録されている情報が既知でない可能性もあるため、MP4ファイル終端の判別は必ずしも実施しなくても良い。その場合、MP4ファイル終端はステップS1011以降の特定の量子化ビットによる量子化レベルの近似的な連続性を元にデータ判別を行う。次に、近似的な連続性によるデータ判別を実施するため、読み込んだクラスタデータを、ステップS1001で設定した量子化ビット数に合わせて量子化レベルを算出する(S1011)。本実施の形態では、量子化ビットが16bitのため、読み込んだ32KBのクラスタデータの先頭から16bit単位でCPUのエンディアンに合わせて量子化レベルの算出処理を繰り返し、2048個の量子化レベルを算出する続くステップS1012において、まず、算出した量子化レベルから、隣接する量子化レベル同士の差分と、その絶対値を算出する。その後、読み込んだクラスタにおける絶対値の平均値を算出する。この平均値を、読み込んだクラスタデータの量子化ビット単位の近似的な連続性の高さを判別する基準として用いる。16bit単位でアナログ波形を量子化したデータ以外は、平均値が高くなり、この値を特定の閾値と比較し(S1013)、より小さな場合は近似的な連続性が高いと判断しリニアPCMオーディオデータとして出力し(S1014)、より大きな場合は近似的な連続性が低いと判断し動画圧縮符号化データとして出力する。その後、ステップS1003に戻り、判別処理を終えた次のクラスタデータを読み込み同様の処理を繰り返す。ステップS1004において、判別対象データを全て読み終えたとき、判別処理が終了となる。なお、データ判別対象のリニアPCMオーディオデータの記録音声内容が、音楽等の音声レベルが連続して高い素材を収録したデータと、自然風景など静かな音声が収録されたデータの場合、クラスタ単位の差分平均値に隔たりが生じるため、互いにリニアPCMオーディオデータであっても、閾値を設けて判別が可能である。
図11に、リニアPCMオーディオデータまたは、圧縮符号化データどちらか一方、または両方のデータサイズが既知の場合に、閾値が変動するデータ判別フローチャートの一例を示す。まずステップS1001で判別対象となるリニアPCMオーディオデータの量子化ビットを設定する。次にステップS1101において判別対象となるデータのデータサイズを入力する。ステップS1003以降、データ記録メディアからクラスタ単位でデータを読み込み、MXFヘッダ、MXFフッタ、MP4ヘッダ、MP4フッタかどうか判別するステップは図10と同じである。読み込んだクラスタデータがMXFファイルデータと判別された場合は、ステップS1102においてリニアPCMオーディオデータを意味する記号が判別テーブルに記録され、読み込んだクラスタデータがMP4ファイルデータと判別された場合は、ステップ1103において圧縮符号化データを意味する記号が判別テーブルに記録される。ここで、判別テーブルとは、データ記録メディアから読み込んだクラスタデータの種類、または隣り合う量子化レベルの差分絶対値のクラスタ単位における平均値を記録したファイルのことである。一度、データ判別対象の差分絶対値のクラスタ単位における平均値を記録すると(S1104)、その後何度も閾値と比較する必要がある場合に、その都度平均値を算出する必要がないことから、効率的な処理が可能となる。本実施の形態においては、閾値を変化させながら算出した平均値と繰り返し比較する必要があることから、判別テーブルを用いる。判別テーブル完成後、ステップS1105において任意に閾値を設定する。この設定した閾値と、判別テーブルに記録された差分絶対値の全クラスタ単位の平均値を比較し、リニアPCMオーディオデータと圧縮符号化データの判別を行い、判別結果からリニアPCMオーディオデータのデータサイズ、または圧縮符号化データのデータサイズを算出する(S1106)。その後、ステップS1101で入力した値とそれぞれ一致するか判別すし(S1107)、一致しないようであればステップS1108において閾値を変更後、再度データ判別処理を行う。ステップS1107においてデータサイズが一致した場合、その時点の閾値によるデータ判別を元にデータを出力する(S1108)。これにより、適切な閾値が不明な場合においてもデータ判別が可能となる。
図12に、本実施の形態のデータ判別装置を用いたファイル復旧処理の概要を示す。音声データとしてリニアPCMオーディオデータが、圧縮符号化データとしてMXFビデオファイル、プロキシAVデータとしてMP4ファイルがデータ記録メディア101のユーザ領域202に先頭から順に記録されているものとする。まず、ユーザ領域202の先頭からクラスタ単位で、DIFのシーケンスIDが検出されるか判別し、検出されたクラスタデータはMXFビデオファイルとして出力する。次に、MXFビデオファイルデータでないと判別されたデータから、本実施の形態のデータ判別処理を用いてリニアPCMオーディオデータと圧縮符号化データを判別し、近似的な連続性の高いものはリニアPCMオーディオデータとして出力し、そうでないものはMP4ファイルデータとして出力する。これにより、元のリニアPCMオーディオデータ、MXFビデオファイルデータ、プロキシAVファイルデータが消去前と同様にファイルシステムにファイルとして管理されることで操作可能となり、復旧が完了する。
本実施の形態は、このようなデータ記録領域に先頭からデータ記録される記録メディアにおいて、リニアPCMオーディオデータと圧縮符号化データがクラスタ単位で混在する中、ファイル復旧を可能とするデータ判別手段を提供する。
本発明にかかるデータ判別方法及びデータ判別装置は、混在するリニアPCMオーディオデータと圧縮符号化データの判別が可能なため、リニアPCMオーディオデータと動画圧縮符号化データを異なるファイルとして記録するカムコーダ等のデータ記録メディアにおける、ファイル管理情報を消失したデータからクラスタ単位で動画データと音声データを識別してファイルを復旧する際に有用である。
101 データ記録メディア
102 インターフェース
103 I/Oバス
104 CPU
105 不揮発性記録メディア
106 メモリ
107 入力部
108 表示部
102 インターフェース
103 I/Oバス
104 CPU
105 不揮発性記録メディア
106 メモリ
107 入力部
108 表示部
Claims (11)
- 入力されたデータ列に対し、所定の量子化ビットで量子化レベルを算出するステップと、所定単位で隣接する量子化レベル間の差分絶対値の平均値を求めるステップと、前記平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別を判別する判別ステップとを備え、前記判別ステップは、前記平均値が前記閾値より大きいときはデータ列を圧縮符号化データと判別し、前記平均値が前記閾値より小さいときはデータ列を非圧縮の音声データと判別する、データ判別装置。
- 前記データ列とは、記録メディアのユーザ領域から読み込んだデータである、請求項1記載のデータ判別装置。
- 前記所定単位とは、ファイルシステムにおけるクラスタ単位である、請求項1記載のデータ判別装置。
- 前記所定の量子化ビットとは、前記音声データの量子化ビットと同値である、請求項1記載のデータ判別装置。
- 入力されたデータ列に対し、所定の量子化ビットで量子化レベルを算出するステップと、所定単位で隣接する量子化レベル間の差分絶対値の平均値を求めるステップと、前記所定単位の前記平均値を記録用ファイルに記録するステップと、前記記録用ファイルに記録された前記平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別を判別する判別ステップと、判別された各種別のデータサイズを所定の値と比較し、等価関係に基づいて前記閾値を変更するステップとを備え、前記判別ステップは、前記平均値が前記閾値より大きいときはデータ列を圧縮符号化データと判別し、前記平均値が前記閾値より小さいときはデータ列を非圧縮の音声データと判別する、データ判別装置。
- 前記データ列とは、記録メディアのユーザ領域から読み込んだデータである、請求項1記載のデータ判別装置。
- 前記所定単位とは、ファイルシステムにおけるクラスタ単位である、請求項1記載のデータ半月装置。
- 前記所定の量子化ビットとは、前記音声データの量子化ビットと同値である、請求項1記載のデータ判別装置。
- ファイル化されたデータが時系列順にユーザ領域の先頭から記録された記録メディアに対して前記データを復旧するデータ復旧方法であって、
前記ユーザ領域の先頭から順にデータを読み出し、所定の量子化ビットで前記データの量子化レベルを算出するステップと、
所定単位で隣接する量子化レベル間の差分絶対値の平均値を求めるステップと、
前記平均値を所定の閾値と比較し、大小関係に基づいてデータ列の種別ごとにデータ出力する判別ステップとを備え、前記判別ステップは、前記平均値が前記閾値より大きいときはデータ列を圧縮符号化データとして出力し、前記平均値が前記閾値より小さいときはデータ列を非圧縮の音声データとして出力する、データ復旧方法。 - 請求項1乃8のいずれかに記載のデータ判別方法における各ステップをコンピュータに実行さえるためのプログラム
- 請求項10記載のプログラムを記憶するメモリと、
前記プログラムを実行するCPUと、
前記記録メディアを接続するためのインターフェースと、
を備えたデータ判別装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009113258A JP2010262703A (ja) | 2009-05-08 | 2009-05-08 | リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009113258A JP2010262703A (ja) | 2009-05-08 | 2009-05-08 | リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010262703A true JP2010262703A (ja) | 2010-11-18 |
Family
ID=43360643
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009113258A Pending JP2010262703A (ja) | 2009-05-08 | 2009-05-08 | リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010262703A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012177962A (ja) * | 2011-02-25 | 2012-09-13 | Hitachi Consumer Electronics Co Ltd | 光ディスク装置 |
WO2015050001A1 (ja) * | 2013-10-04 | 2015-04-09 | ソニー株式会社 | ファイル生成装置および方法、並びにファイル再生装置および方法 |
CN107680607A (zh) * | 2017-09-29 | 2018-02-09 | 联想(北京)有限公司 | 一种信号压缩方法、信号解压方法及其装置 |
-
2009
- 2009-05-08 JP JP2009113258A patent/JP2010262703A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2012177962A (ja) * | 2011-02-25 | 2012-09-13 | Hitachi Consumer Electronics Co Ltd | 光ディスク装置 |
WO2015050001A1 (ja) * | 2013-10-04 | 2015-04-09 | ソニー株式会社 | ファイル生成装置および方法、並びにファイル再生装置および方法 |
US10075796B2 (en) | 2013-10-04 | 2018-09-11 | Sony Corporation | File generation device, file generation method, file reproduction device, and file reproduction method |
CN107680607A (zh) * | 2017-09-29 | 2018-02-09 | 联想(北京)有限公司 | 一种信号压缩方法、信号解压方法及其装置 |
CN107680607B (zh) * | 2017-09-29 | 2021-05-18 | 联想(北京)有限公司 | 一种信号压缩方法、信号解压方法及其装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100725236B1 (ko) | 데이터 기록재생장치 및 그 방법 | |
TW423261B (en) | Recording and reproducing apparatus and terminal apparatus | |
CN101661786A (zh) | 数据记录装置以及数据再生装置 | |
US8731375B2 (en) | Recording apparatus | |
CN100422920C (zh) | 信息处理设备、信息处理方法 | |
TW200635371A (en) | Recording device and method, reproducing device and method, recording/reproducing device and method and program | |
JP2010020641A (ja) | 記録装置、方法及びプログラム | |
CN1954602A (zh) | 录像再生编辑装置 | |
JP2010262703A (ja) | リニアpcmオーディオデータと圧縮符号化データのデータ判別装置 | |
EP1437737A3 (en) | Information recording medium, information reproducing apparatus and method, and computer program | |
CN1574055B (zh) | 记录介质中的数据的管理方法及装置 | |
CN101206894A (zh) | 记录再现装置 | |
JP5063534B2 (ja) | 画像記録装置及び画像記録方法 | |
KR20000062967A (ko) | 디지털 데이터 기록 장치 | |
CN103165154A (zh) | 记录装置 | |
CN103165155B (zh) | 记录装置及其控制方法 | |
US7124086B2 (en) | Data reproducing apparatus and data reproducing system for reproducing contents stored on a removable recording medium | |
JPH1145518A (ja) | 映像記録装置及びコンピュータ読み取り可能な記録媒体 | |
JP2003228523A (ja) | 記録媒体及び複製装置 | |
PL368806A1 (en) | Method and apparatus for recording video data, and information storage medium thereby | |
JPH09102922A (ja) | 記録再生装置 | |
JP2009186797A (ja) | 復号装置および半導体装置 | |
KR101351795B1 (ko) | 클러스터 검색을 통한 동영상 복구 방법 및 그 기록매체 | |
US20060245307A1 (en) | Recording medium, data reproducing device, data recording device, and data reproducing method | |
KR100606516B1 (ko) | 디지털 녹화기에서의 오디오 및 비디오 분리 녹화 및재생장치 및 방법 |