JP4109367B2 - Non-linear video editing apparatus and method - Google Patents

Non-linear video editing apparatus and method Download PDF

Info

Publication number
JP4109367B2
JP4109367B2 JP00783699A JP783699A JP4109367B2 JP 4109367 B2 JP4109367 B2 JP 4109367B2 JP 00783699 A JP00783699 A JP 00783699A JP 783699 A JP783699 A JP 783699A JP 4109367 B2 JP4109367 B2 JP 4109367B2
Authority
JP
Japan
Prior art keywords
data
sampling rate
audio stream
stream data
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00783699A
Other languages
Japanese (ja)
Other versions
JP2000209543A (en
Inventor
良英 藤岡
智晃 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Priority to JP00783699A priority Critical patent/JP4109367B2/en
Publication of JP2000209543A publication Critical patent/JP2000209543A/en
Application granted granted Critical
Publication of JP4109367B2 publication Critical patent/JP4109367B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、ノンリニアビデオ編集装置に関し、特に、オーディオデータのサンプリングレートの変動に関する。
【0002】
【関連技術】
今日、DV(ディジタルビデオ)ノンリニアビデオ編集が注目されている。これは、ビデオキャプチャーボードを介して、DVビデオ信号をパソコンのHDD(ハードディスク)に記憶させ、任意のフレームを取り出して画像を編集する方法である。
【0003】
かかる編集処理について簡単に説明する。IEEE1394インターフェイス(図示せず)により接続されたデジタルビデオ(DV)カメラDV機器から、図6Aに示すようなDVデータを取り込む。このデジタルデータは、複数のフレームから構成されたストリームデータである。各フレームは、DV圧縮されたビデオデータと、所定のサンプリングレートでデジタル化されたオーディオデータで構成されている。
【0004】
DVビデオキャプチャボードは図6Bに示すように、各フレーム毎にビデオデータとオーディオデータに分離する。分離されたビデオデータとオーディオデータは、各フレームを連続させたストリームデータとしてハードディスクに記憶される。
【0005】
操作者から表示命令が与えられると、ハードディスクに記憶されたビデオデータが解凍され、所定のフレームの画像がモニタに表示される。操作者は、表示された画像を見て、所望の編集、例えば、第7フレームの画像を削除する等の作業を行う。これにより、第7フレームに対応するオーディオデータも同じく削除される。かかるオーディオデータの削除は次のようにして実行される。オーディオデータのサンプリングレートはあらかじめ定められているので、1フレームに該当する平均サンプル数を求めることができる。この平均サンプル数*6で第7フレームの画像に該当するオーディオデータの先頭位置が判明するので、その位置から1フレーム分に該当するオーディオデータを削除すればよい。
【0006】
【発明が解決しようとする課題】
しかしながら、上記ノンリニアビデオ編集装置においては、以下の様な問題があった。DVビデオカメラによっては、オーディオデータのサンプリングレートが所定のサンプリングレートと少しずれている場合がある。例えば、サンプリングレートが所定のレートよりも高い場合、図6Cに示すように、1フレーム当たりのデータ量が大きくなる。しかし、前記編集作業において、編集対象のビデオフレームに該当するオーディオデータの位置特定は、前記所定のレート、具体的には、ビデオ1フレーム当たりのオーディオデータ数、に基づいて決定される。したがって、編集対象のオーディオデータがずれてしまう。逆に、サンプリングレートが所定のレートよりも低い場合、図6Dに示すように、1フレーム当たりのデータ量が小さくなる。したがって、この場合も、ズレの問題が生ずる。このような映像と音声のズレは、ビデオ編集において問題となる。
【0007】
また、前記ノンリニアビデオ編集においては、次のような問題もあった。DVビデオカメラによっては、オーディオデータのサンプリングレートを1つのテープ中にて切り換えることができる。この場合には、途中からオーディオデータについてサンプリングレートが異なることになり、ハードディスクにオーディオデータを取り込むことができず停止したり、データが取り込めても無音で記憶されてしまう。
【0008】
本発明は上記問題を解決し、ビデオデータとオーディオデータがインタリーブされたデジタルストリームデータについて、オーディオデータのサンプリングレートの変動にかかわらず、ビデオデータとオーディオデータとを正確に対応づけして記憶媒体に記憶することができるデジタルデータ記憶装置またはその方法を提供することを目的とする。
【0009】
また、ビデオデータとオーディオデータがインタリーブされたデジタルストリームデータについて、オーディオデータのサンプリングレートの変動にかかわらず、ビデオデータとオーディオデータとを正確に対応付けしてノンリニアビデオ編集が可能なノンリニアビデオ編集装置またはその方法を提供することを目的とする。
【0010】
【課題を解決するための手段および発明の効果】
本発明にかかるノンリニアビデオ編集装置においては、1)前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する分離記憶手段、2)前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、3)前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段、4)オーディオストリームデータの編集命令が与えられると、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象データを特定して、前記オーディオストリームデータを編集する編集手段を備えている。したがって、前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換される。これにより、与えられる混在ストリームデジタルデータのオーディオデータのサンプリングレートが変動する場合でも、編集手段にて正確に対応するオーディオデータを特定して編集することができる。よって、音ずれのないノンリニアビデオ編集が可能となる。
【0011】
本発明にかかる混在ストリームデジタルデータ分離記憶装置においては、1)前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する分離記憶手段、2)前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、3)前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段を備えている。したがって、前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換される。これにより、与えられる混在ストリームデジタルデータのオーディオデータのサンプリングレートが変動する場合でも、ノンリニアビデオ編集装置は、正確に対応するオーディオデータを特定して編集することができる。
【0012】
本発明にかかる混在ストリームデジタルデータ分離装置においては、ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離する混在ストリームデジタルデータ分離装置であって、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離する分離手段、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、
前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段、
を備えている。
【0013】
したがって、与えられる混在ストリームデジタルデータのオーディオデータのサンプリングレートが変動する場合でも、ノンリニアビデオ編集装置に前記ビデオストリームデータとオーディオストリームデータを記憶することにより、正確に対応するオーディオデータを特定して編集することができる。
【0014】
本発明にかかるノンリニアビデオ編集方法においては、前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断し、前記オーディオストリームデータが前記目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換し、オーディオストリームデータの編集命令が与えられると、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象データを特定して、前記オーディオストリームデータを編集する。したがって、前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換される。これにより、与えられる混在ストリームデジタルデータのオーディオデータのサンプリングレートが変動する場合でも、正確に対応するオーディオデータを特定して編集することができる。
【0015】
本発明にかかる混在ストリームデジタルデータのデータ変換方法においては、ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離し、前記オーディオストリームデータのサンプリングレートを計測し、前記計測したサンプリングレートに基づいて、前記オーディオストリームデータが、ビデオストリームデータを構成する各フレームデータとの対応づけ許容度を越えるサンプリングレートで生成されている場合には、前記オーディオデータのサンプリングレートを前記対応付け許容度の範囲内となるようデータ変換する。したがって、前記対応付け許容度の範囲外である場合には、前記オーディオストリームデータのサンプリングレートがデータ変換される。これにより、与えられる混在ストリームデジタルデータのオーディオデータのサンプリングレートが変動する場合でも、正確に対応するオーディオデータを特定して編集することができる。
【0016】
本発明にかかるプログラムを記憶した記憶媒体においては、前記プログラムは、前記オーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されているか否かの判断は、先頭から所定量のデータに基づいて判断し、前記先頭から所定量のオーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されていないと判断した場合には、残りのオーディオストリームデータについては、この判断をすることなく前記データ変換する。したがって、先頭から所定量のオーディオストリームデータのサンプリングレートだけを求めるだけで、前記調整をすべきか否か判断できる。これにより、全体としての処理時間をより短くすることができる。
【0017】
本発明にかかるプログラムを記憶した記憶媒体においては、与えられたオーディオストリームデータを構成する個別データの値を時系列で並べて、直線補完して仮想直線を求め、この仮想直線について前記目標サンプリングレートで再度サンプリングして、前記サンプリングレートの変換をする。したがって、簡易、高速さらに高精度の変換が可能となる。
【0018】
本発明にかかるプログラムを記憶した記憶媒体においては、前記プログラムは、与えられたオーディオストリームデータの制御データに記憶されたサンプリングレートを検出して目標サンプリングレートとする。したがって、制御データで特定されたサンプリングレートに変換することができる。
【0019】
本発明にかかるプログラムを記憶した記憶媒体においては、前記混在ストリームデジタルデータから最初に抽出したサンプリングレートを前記目標サンプリングレートとし、与えられる混在ストリームデジタルデータの制御データ領域に記憶されたサンプリングレートが異なる場合でも、前記目標サンプリングレートにてサンプリングレート変換する。したがって、異なるサンプリングレートでデジタル化されている場合でも、1の目標サンプリングレートのオーディオデータに変換することができる。
【0020】
【発明の実施の形態】
1.機能ブロック図の説明
本発明の一実施形態を図面に基づいて説明する。図1に示すノンリニアビデオ編集装置1は、ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、前記混在ストリームデジタルデータのノンリニアビデオ編集を行うノンリニアビデオ編集装置であって、分離記憶手段3、判断手段5、サンプリングレート変換手段7、および編集手段9を備えている。
【0021】
分離記憶手段3は、前記混在ストリームデジタルデータが与えられると、与えられたデータを取り込み、取り込んだデータをビデオストリームデータとオーディオストリームデータに分離して記憶する。判断手段5は、前記オーディオストリームデータのサンプリングレートを検出して、オーディオストリームデータが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する。
【0022】
判断手段5が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、調整手段7は、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換する。編集手段9は、オーディオストリームデータの編集命令が与えられると、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象データを特定して、前記オーディオストリームデータを編集する。
【0023】
このように、前記オーディオストリームデータのサンプリングレートを計測し、前記計測したサンプリングレートに基づいて、前記オーディオストリームデータが、ビデオストリームデータを構成する各フレームデータとの対応づけ許容度を越えるサンプリングレートで生成されている場合には、前記オーディオデータのサンプリングレートを前記対応付け許容度の範囲内となるよう調整することにより、音ずれのないノンリニアビデオ編集ができる。
【0024】
2.ハードウェア構成
図2に、図1に示すノンリニアビデオ編集装置1を、CPUを用いて実現したハードウェア構成の一例を示す。
【0025】
本発明の一実施形態を図面に基づいて説明する。図1に本発明にかかるノンリニアビデオ編集システム1のハードウェア構成を示す。ノンリニアビデオ編集システム1は、CPU23、メモリ27、ハードディスク26、表示部30、FDD25、キーボード28、マウス31、DVビデオキャプチャボード41およびバスライン29を備えている。
【0026】
CPU23は、ハードディスク26に記憶されたプログラムにしたがいバスライン29を介して、各部を制御する。このプログラムは、FDD25を介して、プログラムが記憶されたフレキシブルディスク25aから読み出されてハードディスク26にインストールされたものである。なお、フレキシブルディスク以外に、CD−ROM、ICカード等のプログラムを実体的に一体化したコンピュータ可読の記憶媒体から、ハードディスクにインストールさせるようにしてもよい。さらに、通信回線を用いてダウンロードするようにしてもよい。
【0027】
本実施形態においては、プログラムをフレキシブルディスクからハードディスク26にインストールさせることにより、フレキシブルディスクに記憶させたプログラムを間接的にコンピュータに実行させるようにしている。しかし、これに限定されることなく、フレキシブルディスクに記憶させたプログラムをFDD25から直接的に実行するようにしてもよい。なお、コンピュータによって、実行可能なプログラムとしては、そのままのインストールするだけで直接実行可能なものはもちろん、一旦他の形態等に変換が必要なもの(例えば、データ圧縮されているものを、解凍する等)、さらには、他のモジュール部分と組合して実行可能なものも含む。
【0028】
ハードディスク26には、ビデオ編集プログラム26e、データ取り込みプログラム26s、ビデオデータ26v、オーディオデータ26a、オペレーティングシステム(OS)26wを記憶する。本実施形態においては、オペレーティングシステムとして、マイクロソフト社のWindows98を採用した。
【0029】
ビデオデータ26v、オーディオデータ26aは、ビデオカメラ43からのDVデータが、DVビデオキャプチャボード41で取り込まれ、一旦メモリ27に記憶される。その後、CPU23によってビデオデータとオーディオデータとに分離され、記憶されたものである。詳細は後述する。
【0030】
ビデオ編集プログラム26eについては従来と同様である。簡単に説明すると、操作者が読み出し命令を与えると、ビデオデータ26vのうち特定されたフレームの画像データを解凍して、表示部30に与える。これにより、表示部30に編集対象の画像が1フレームづつ表示される。操作者は表示された各フレームの画像をカットアンドペーストしたり、合成したりする。この際、オーディオデータもビデオデータにあわせて、1フレーム単位で同時に加工される。操作者は、所望の編集作業が終了すると、書き込み命令を与える。各フレームのビデオデータが所定の形式で圧縮され、ハードディスクにビデオデータとして記憶する。ビデオ編集プログラム26eは、オペレーティングシステム26wの上で動作するアプリケーションプログラムである。
【0031】
メモリ27にはその他、各種の演算結果等が記憶される。表示部30は、グラフィックカード30aとモニタ30bを備えており、ビデオ編集プログラム26eの実行により、編集対象の各フレームの画像がビデオ編集プログラム26eのビデオ編集画面中に表示される。キーボード28およびマウス31は各種の命令(編集開始命令、編集終了命令等)を入力する入力手段である。
【0032】
3.データ取り込みプログラム26sのフローチャート
つぎに、ハードディスク26に記憶されているデータ取り込みプログラム26sについて図3,図4を用いて説明する。
【0033】
データ取り込みプログラム26sは、図3、図4のメインプログラムと別に、割り込みプログラムを有する。この割り込みプログラムは、操作者が取り込み開始命令を与えると、DVビデオキャプチャーボード41から、ビデオデータとオーディオデータがインタリーブされたDVストリームデータが与えられるか否かを判断し、DVビデオキャプチャーボード41から、DVストリームデータが与えられると、ハードディスク26に一時記憶する。一方、DVストリームデータが与えられなければ、かかる記憶処理は行わない。かかる割り込み処理は、ビデオ1フレーム周期ごとに、繰り返される。
【0034】
メインプログラムについて図3,図4を用いて説明する。以下では、図6Cに示すようにオーディオデータのサンプリングレートが標準よりも大きく、かつ、読み出したサンプリングレートが途中で変更されない場合のデータ取り込み処理について説明する。
【0035】
CPU23は、サンプリングレートフラグ=0とし(図3ステップST1)、変換フラグfをf=0とする(ステップST11)。CPU23は、新しいDVストリームデータがハードディスク26に記憶されているか否か判断する(ステップST13)。新しいDVストリームデータがハードディスク26に記憶されている場合には、ビデオデータとオーディオデータに分離して、ハードディスクに記憶する(ステップST15)。DVストリームデータがハードディスク26に記憶されていなければ、ステップST13の処理を繰り返す。
【0036】
CPU23は、DVストリームデータの制御データからサンプリングレートを取得する(ステップST17)。具体的には、ビデオカメラ43がオーディオデータをデジタル化した場合に、そのサンプリングレートを制御データ中に埋め込んでいるので、この制御データから読み出せばよい。
【0037】
CPU23は、サンプリングレートフラグ=0か否か判断する(ステップST18)。この場合、ステップST10にてサンプリングレートフラグ=0に設定されているので、ステップST17にて読みだしたサンプリングレートを標準値として記憶する(ステップST41)。CPU23は、サンプリングレートフラグ=1とする(ステップST43)。
【0038】
CPU23は、標準値として記憶したサンプリングレートと読みだしたサンプリングレートが一致するか否か判断する(ステップST19)。この場合、読み出したサンプリングレートは途中で変更されないので、CPU23は、変換フラグがf=0であるか否か判断する(ステップST21)。この場合、ステップST11にてf=0であるので、CPU23は、分離したオーディオデータの個別データをカウントして、加算する(図4ステップST23)。DVストリームデータはビデオ1フレーム単位でブロック化されているので(図6A参照)、各ブロック中のサンプル数をカウントするようにすればよい。なお、DV規格では、NTSCモードにおける一秒の動画は29.97フレームで構成されている。したがって、ビデオ1フレームに該当する時間、1/29.97秒のサンプル数が加算されることとなる。
【0039】
CPU23は、所定数のフレーム分のカウントが終了したか否か判断する(ステップST25)。所定数のフレーム分のカウントが終了していなければ、図3ステップST13以下の処理を繰り返す。
【0040】
図4ステップST25にて、所定数のフレーム分のカウントが終了していれば、CPU23は、誤差が許容範囲内か否か判断する(図4ステップST27)。例えば、図3ステップST17にて取得したサンプリングレートが48kHzである場合、ビデオ1フレームの時間あたり、平均のサンプル数は、48kHz/29.97= 1601.60であるはずである。本実施形態においては、所定数のフレーム分のサンプリングデータ数の平均を求めて、この平均値と前記平均サンプル値との誤差がプライマイナス0.5%以下に収まっているかを否かを判断するようにした。なお、平均を求めるのは、前記1ブロック当たりの記憶されるサンプル数が若干変動するからである。
【0041】
なお、かかる誤差の許容範囲はこの値に限定されるわけでなく、編集対象のデータにおいて許容できる範囲、例えばプラスマイナス0.3%以下や、プラスマイナス1%以下というように、任意に設定するようにすればよい。さらに、操作者にかかる許容範囲を入力させてもよい。
【0042】
許容範囲内である場合には、CPU23は、変換フラグfをf=2として、ステップST13以下の処理を繰り返す。許容範囲を超えている場合には、変換フラグfをf=1とし(図4ステップST28)、サンプリングレート変換処理を行う(ステップST29)。サンプリングレート変換処理について、図5を用いて説明する。図5Aに示すように、サンプリングレート変換処理が必要なオーディオデータを時系列に並べる。この場合、図6Cに示すように、サンプリングレートが高い場合であるので、所定時間あたり(例えば1フレーム分)のサンプリング数が多い。したがって、各サンプル間の時間Δtxが標準値よりも小さい。CPU23は、各サンプルの値をつなぐ仮想直線L1を演算する。この仮想直線L1を図5Bに示すように、標準値である場合の各サンプル間の時間Δtsで再度サンプリングする。この処理により、オーディオデータの周波数と強度をほとんど代えることなく、サンプリングレートを変換することができる。
【0043】
CPU23は分離したオーディオデータのサンプリングレート変換が終了すると、変換前のオーディオーディオに代えて変換後のオーディオデータを記憶し、図3ステップST13以下の処理を繰り返す。
【0044】
なお、本実施形態においては、図4ステップST27において先頭から所定数のフレームについてサンプリングレートが許容範囲か否かを判断し、残りのフレームについてはかかる判断に基づいて、同じ処理を行うようにした。すなわち、図3ステップST13から図4ステップST27の処理によって、一度許容範囲か否かの判断を行うと、変換フラグfは、f=1またはf=2となる。したがって、図3ステップST21からステップST22に進み、変換フラグfがf=1である場合には、ステップST23〜ステップST27の許容範囲か否かの判断処理を行わず、ステップST29のサンプリングレート変換処理を行う。一方、変換フラグfがf=2であれば、ステップST29のサンプリングレート変換処理を行うことなく、ステップST13以下の処理を繰り返す。これは、多くのビデオカメラは、オーディオデータのサンプリングレートがふらつくのではなく、標準値と比べて上下いずれかにずれた値で安定している場合が多いからである。もちろん、全フレームについて、前記許容範囲か否かの判断を行うようにしてもよい。
【0045】
すなわち、本実施形態において、変換フラグfは、f=0:サンプリングレート判断要、f=1:サンプリングレート変換要、f=3:サンプリングレート変換不要を示すこととなる。
【0046】
このようにして、与えられたオーディオデータのサンプリングレートがずれている場合でも、ノンリニアビデオ編集ソフトが、対応オーディオデータを特定するのに用いる基準サンプリングレートに変換しておくことにより、オーディオストリームデータの編集命令が与えられた場合に、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象位置が特定できる。これにより、編集時における音ずれの問題を回避することができる。
【0047】
このように、オーディオデータの取り込み時にサンプリングレートの誤差を調整することにより、音ずれのないビデオ編集が可能となる。
【0048】
つぎに、読み出したサンプリングレートが途中で変更される場合について説明する。DVデータのオーディオデータには、以下の4種類が採用されている。
【0049】
1)サンプリングレート48kHz,データ長16ビット
2)サンプリングレート44.1kHz,データ長16ビット
3)サンプリングレート32kHz,データ長16ビット
4)サンプリングレート32kHz,データ長12ビット
ビデオカメラは、録音途中にて前記オーディオデータのサンプリングレートを切り換えることができる。しかし、途中でサンプリングレートが切り換わった場合、ノンリニアビデオ編集ソフトは、かかる切り替えに対応できず、データ取り込みができず停止したり、データが取り込めても無音で記憶されてしまい、結局、オーディオデータを正確に取り込むことができなかった。
【0050】
そこで、本実施形態においては、途中でサンプリングレートが切り替わった場合でも、最初に抽出したサンプリングレートにて自動的にサンプリングレート変換処理を行うことにより、ノンリニアビデオ編集ソフトにおける編集作業を可能とした。以下では、サンプリングレート48kHzから、サンプリングレート44.1kHzに切り換えられた場合を例として説明する。
【0051】
CPU23は、ビデオデータとオーディオデータを分離後、制御データからサンプリングレートを取得している(ステップST17)。そして、ステップST18にてサンプリングレートフラグを参照して、標準値として記憶ずみでない場合だけ、標準値として記憶し(ステップST41)、サンプリングレートフラグ=1とする(ステップST43)。
【0052】
一方、一旦記憶後は、標準値として記憶したサンプリングレートと読みだしたサンプリングレートが一致するか否か判断する(ステップST19)。かかる判断は、標準値として記憶されているサンプリングレート48kHzが、サンプリングレート44.1kHzとなるか否かで判断できる。
【0053】
サンプリングレートが途中で切り替わった場合には、CPU23は、オーディオデータの変換フラグfをf=0とし(ステップST31)、カウンタをクリアする(ステップST33)。そして、ステップST29以下の処理を行う。
【0054】
このようにして、サンプリングレートが途中で切り替わった場合に、その後の制御データで指定されたサンプリングレートに変換するのではなく、最初に検出したサンプリングレートでサンプリングすることができる。
【0055】
3.他の実施形態
なお、DVビデオキャプチャーボード41から与えられるDVデータは、ストリームデータであれば、記憶媒体の種類は問わず、テープだけでなく、DVDディスクでも同様である。
【0056】
なお、前記オーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されているか否かの判断は、先頭から所定量のデータに基づいて判断し、前記先頭から所定量のオーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されていないと判断した場合には、残りのオーディオストリームデータについては、この判断をすることなく前記データ変換をするようにしてもよい。
【0057】
また、本実施形態においては、与えられたオーディオストリームデータを構成する個別データの値を時系列で並べて、直線補完して仮想直線を求め、この仮想直線について前記目標サンプリングレートで再度サンプリングして、前記サンプリングレート変換をした。これにより、周波数が高ければ誤差も少なく、かつ計算も容易となる。しかし、これ以外の手法で補完処理を行ってもよく、例えば、仮想スプライン曲線を求めて、この曲線に基づいて、前記データ変換を行ってもよい。
【0058】
本実施形態においては、与えられたDVデータ中のサブコード記憶領域に記憶されたサンプリングレートを検出して目標サンプリングレートとしたが、固定値としてもよい。さらに、DVデータ以外の混在ストリームデジタルデータ、例えば、MPEGデータ等、の制御データ領域に記憶されたサンプリングレートを検出して目標サンプリングレートとしてもよい。
【0059】
また、前記目標サンプリングレートとして、前記DVストリームデータから最初に検出したサンプリングレートを用いてもよい。
【0060】
前記コンバータを汎用コンピュータに内蔵する場合に、オペレーティングシステム(OS)プログラムが上記プログラムを実行するようにしてもよい。すなわち、プログラム単独で行っても、オペレーティングシステム(OS)と分担して、実現するようにしてもよい。
【0061】
なお、本実施形態においては、図1に示す機能を実現する為に、CPU23を用い、ソフトウェアによってこれを実現している。しかし、その一部もしくは全てを、ロジック回路等のハードウェアによって実現してもよい。例えば、サンプリングレート変換はロジック回路で、サンプリングレートの許容判断はソフトウェアでやってもよい。また、一部のハードウェアで行っている処理をCPUで実行するようにしてもよい。
【0062】
また、本実施形態においては、図3、4に示すプログラムをハードディスクにインストールし、一旦DVキャプチャーボード41から与えられたDVストリームデータをハードディスク26に記憶して、データ変換するか否か判断するようにしたが、DVキャプチャーボード41に別途CPUおよびROMを搭載し、このROMに前記プログラムを記憶させて、DVキャプチャーボード41から、サンプリングレートを一致させたDVストリームデータを出力できるようにしてもよい。この場合、ステップST27の判断を行うための最初から所定フレーム分のオーディオデータを記憶するためのメモリを用意すればよい。この場合、ビデオデータについては、データ変換作業が不要なので、順次、ハードディスク26に転送するようにしてもよい。これにより、DVキャプチャーボード41に用意するメモリは、比較的データ量の少ないオーディオデータを記憶するメモリでよくなる。もちろん、判断が終了するまで、全ストリームデータを記憶するメモリを搭載してもよい。
【図面の簡単な説明】
【図1】本発明にかかるノンリニアビデオ編集システム1の機能ブロック図である。
【図2】ノンリニアビデオ編集システム1をCPUを用いて構成したハードウエア構成の一例を示す図である。
【図3】データ取り込みプログラムのメインフローチャートである。
【図4】データ取り込みプログラムのメインフローチャートである。
【図5】サンプリングレート変換を説明するための図である。
【図6】ビデオデータとオーディオーディオの対応を示す図である。
【符号の説明】
1・・・・・ノンリニアビデオ編集装置
23・・・・CPU
26s・・・データ取り込みプログラム
26e・・・ビデオ編集プログラム
41・・・・DVビデオキャプチャーボード
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a non-linear video editing apparatus, and more particularly, to a change in sampling rate of audio data.
[0002]
[Related technologies]
Today, DV (digital video) nonlinear video editing is attracting attention. In this method, a DV video signal is stored in an HDD (hard disk) of a personal computer via a video capture board, an arbitrary frame is taken out, and an image is edited.
[0003]
Such editing processing will be briefly described. DV data as shown in FIG. 6A is captured from a digital video (DV) camera DV device connected via an IEEE 1394 interface (not shown). This digital data is stream data composed of a plurality of frames. Each frame is composed of DV-compressed video data and audio data digitized at a predetermined sampling rate.
[0004]
As shown in FIG. 6B, the DV video capture board separates video data and audio data for each frame. The separated video data and audio data are stored in the hard disk as stream data in which each frame is continued.
[0005]
When a display command is given from the operator, the video data stored in the hard disk is decompressed and an image of a predetermined frame is displayed on the monitor. The operator looks at the displayed image and performs desired editing, for example, deleting the seventh frame image. As a result, the audio data corresponding to the seventh frame is also deleted. Such audio data deletion is executed as follows. Since the sampling rate of the audio data is determined in advance, the average number of samples corresponding to one frame can be obtained. Since the average position of the audio data corresponding to the image of the seventh frame is determined by this average number of samples * 6, the audio data corresponding to one frame may be deleted from that position.
[0006]
[Problems to be solved by the invention]
However, the nonlinear video editing apparatus has the following problems. Depending on the DV video camera, the sampling rate of the audio data may be slightly different from a predetermined sampling rate. For example, when the sampling rate is higher than a predetermined rate, the data amount per frame becomes large as shown in FIG. 6C. However, in the editing operation, the position of the audio data corresponding to the video frame to be edited is determined based on the predetermined rate, specifically, the number of audio data per video frame. Therefore, the audio data to be edited is shifted. On the other hand, when the sampling rate is lower than the predetermined rate, the data amount per frame becomes small as shown in FIG. 6D. Therefore, also in this case, a problem of deviation occurs. Such a shift between video and audio is a problem in video editing.
[0007]
The nonlinear video editing also has the following problems. Depending on the DV video camera, the sampling rate of the audio data can be switched in one tape. In this case, the sampling rate differs for audio data from the middle, and the audio data cannot be taken into the hard disk and stopped, or even if the data is taken in, it is stored silently.
[0008]
The present invention solves the above-described problem, and in digital stream data in which video data and audio data are interleaved, video data and audio data are accurately associated with each other in a storage medium regardless of fluctuations in the sampling rate of the audio data. It is an object of the present invention to provide a digital data storage device or method thereof that can be stored.
[0009]
In addition, non-linear video editing apparatus capable of non-linear video editing by accurately associating video data and audio data with respect to digital stream data in which video data and audio data are interleaved regardless of fluctuations in the sampling rate of the audio data. Another object is to provide a method thereof.
[0010]
[Means for Solving the Problems and Effects of the Invention]
In the nonlinear video editing apparatus according to the present invention, when 1) the mixed stream digital data is given, separate storage means for separating and storing the video stream data and the audio stream data, and 2) the sampling rate of the audio stream data is Determining means for determining whether or not the target sampling rate used for data specification at the time of editing is generated, and 3) if the determining means determines that the audio stream data is not generated at the target sampling rate, Sampling rate conversion means for converting data so that the sampling rate of the audio stream data becomes the target sampling rate, and 4) when an audio stream data editing command is given, the audio stream data is converted based on the target sampling rate. To identify the edit data of audio stream data, and includes an editing means for editing the audio stream data. Therefore, when the sampling rate of the audio stream data is not generated at the target sampling rate used for data specification at the time of editing, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate. As a result, even when the sampling rate of the audio data of the given mixed stream digital data varies, the corresponding audio data can be accurately identified and edited by the editing means. Therefore, non-linear video editing without sound deviation becomes possible.
[0011]
In the mixed stream digital data separation storage device according to the present invention, when 1) the mixed stream digital data is given, separate storage means for storing the video stream data and the audio stream data separately; 2) the audio stream data; Judgment means for judging whether or not the sampling rate is generated at a target sampling rate used for data specification at the time of editing, 3) When the judgment means judges that the audio stream data is not generated at the target sampling rate Includes sampling rate conversion means for converting the data so that the sampling rate of the audio stream data becomes the target sampling rate. Therefore, when the sampling rate of the audio stream data is not generated at the target sampling rate used for data specification at the time of editing, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate. Thereby, even when the sampling rate of the audio data of the given mixed stream digital data varies, the nonlinear video editing apparatus can accurately identify and edit the corresponding audio data.
[0012]
The mixed stream digital data separator according to the present invention is a mixed stream digital data separator that separates video stream data and audio stream data when mixed stream digital data in which video data and audio data are interleaved is provided. ,
Separation means for separating video stream data and audio stream data when the mixed stream digital data is given,
Judgment means for judging whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
Sampling rate conversion means for performing data conversion so that the sampling rate of the audio stream data becomes the target sampling rate when the determining means determines that the audio stream data is not generated at the target sampling rate;
It has.
[0013]
Therefore, even when the sampling rate of the audio data of the given mixed stream digital data fluctuates, the corresponding audio data can be accurately identified and edited by storing the video stream data and the audio stream data in the nonlinear video editing device. can do.
[0014]
In the nonlinear video editing method according to the present invention, when the mixed stream digital data is given, the video stream data and the audio stream data are separated and stored, and the sampling rate of the audio stream data is used for data specification at the time of editing. It is determined whether or not the audio stream data is generated at the target sampling rate. If the audio stream data is not generated at the target sampling rate, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate. When an audio stream data editing command is given, the audio stream data is identified based on the target sampling rate, and the audio stream data is specified. Edit. Therefore, when the sampling rate of the audio stream data is not generated at the target sampling rate used for data specification at the time of editing, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate. Thereby, even when the sampling rate of the audio data of the given mixed stream digital data varies, the corresponding audio data can be accurately identified and edited.
[0015]
In the mixed stream digital data conversion method according to the present invention, when mixed stream digital data in which video data and audio data are interleaved is given, the stream data is separated into video stream data and audio stream data, and sampling of the audio stream data is performed. If the audio stream data is generated at a sampling rate that exceeds the permissible correspondence with each frame data constituting the video stream data based on the measured sampling rate, the audio stream data is generated. Data conversion is performed so that the data sampling rate falls within the range of the association tolerance. Therefore, if the association tolerance is out of the range, the sampling rate of the audio stream data is converted. Thereby, even when the sampling rate of the audio data of the given mixed stream digital data varies, the corresponding audio data can be accurately identified and edited.
[0016]
In the storage medium storing the program according to the present invention, the program determines whether the sampling rate of the audio stream data is generated at the target sampling rate based on a predetermined amount of data from the beginning. If it is determined that the sampling rate of the predetermined amount of audio stream data from the head is not generated at the target sampling rate, the remaining audio stream data is converted without performing this determination. To do. Therefore, it is possible to determine whether or not the adjustment should be made by only obtaining the sampling rate of a predetermined amount of audio stream data from the beginning. Thereby, the processing time as a whole can be further shortened.
[0017]
In the storage medium storing the program according to the present invention, the values of the individual data constituting the given audio stream data are arranged in time series, and a straight line is obtained by linear interpolation, and the virtual straight line is obtained at the target sampling rate. Sampling is performed again to convert the sampling rate. Therefore, simple, high-speed and high-accuracy conversion is possible.
[0018]
In the storage medium storing the program according to the present invention, the program detects the sampling rate stored in the control data of the given audio stream data and sets it as the target sampling rate. Therefore, it is possible to convert to the sampling rate specified by the control data.
[0019]
In the storage medium storing the program according to the present invention, the sampling rate first extracted from the mixed stream digital data is set as the target sampling rate, and the sampling rate stored in the control data area of the given mixed stream digital data is different. Even in this case, the sampling rate is converted at the target sampling rate. Therefore, even when digitized at different sampling rates, it can be converted into audio data of one target sampling rate.
[0020]
DETAILED DESCRIPTION OF THE INVENTION
1. Functional block diagram description
An embodiment of the present invention will be described with reference to the drawings. 1 is provided with mixed stream digital data in which video data and audio data are interleaved, the video stream data and the audio stream data are separated and stored, and the non-linearity of the mixed stream digital data is stored. A non-linear video editing apparatus that performs video editing, and includes a separation storage unit 3, a determination unit 5, a sampling rate conversion unit 7, and an editing unit 9.
[0021]
When the mixed stream digital data is given, the separation storage means 3 takes in the given data, and stores the fetched data into video stream data and audio stream data. The determination means 5 detects the sampling rate of the audio stream data, and determines whether the audio stream data is generated at a target sampling rate used for data specification at the time of editing.
[0022]
When the determination unit 5 determines that the audio stream data is not generated at the target sampling rate, the adjustment unit 7 performs data conversion so that the sampling rate of the audio stream data becomes the target sampling rate. When an editing instruction for audio stream data is given, the editing unit 9 specifies data to be edited for the audio stream data based on the target sampling rate, and edits the audio stream data.
[0023]
In this way, the sampling rate of the audio stream data is measured, and based on the measured sampling rate, the audio stream data has a sampling rate that exceeds the permissible association with each frame data constituting the video stream data. If it is generated, non-linear video editing without sound deviation can be performed by adjusting the sampling rate of the audio data to be within the range of the association tolerance.
[0024]
2. Hardware configuration
FIG. 2 shows an example of a hardware configuration in which the nonlinear video editing apparatus 1 shown in FIG. 1 is realized using a CPU.
[0025]
An embodiment of the present invention will be described with reference to the drawings. FIG. 1 shows a hardware configuration of a nonlinear video editing system 1 according to the present invention. The non-linear video editing system 1 includes a CPU 23, a memory 27, a hard disk 26, a display unit 30, an FDD 25, a keyboard 28, a mouse 31, a DV video capture board 41, and a bus line 29.
[0026]
The CPU 23 controls each unit via the bus line 29 according to a program stored in the hard disk 26. This program is read from the flexible disk 25a storing the program via the FDD 25 and installed in the hard disk 26. In addition to the flexible disk, it may be installed on a hard disk from a computer-readable storage medium in which a program such as a CD-ROM or an IC card is substantially integrated. Furthermore, it may be downloaded using a communication line.
[0027]
In the present embodiment, the program stored in the flexible disk is indirectly executed by the computer by installing the program from the flexible disk to the hard disk 26. However, the present invention is not limited to this, and the program stored in the flexible disk may be directly executed from the FDD 25. Note that programs that can be executed by a computer are not only those that can be directly executed by simply installing them, but also those that need to be converted to other forms once (for example, those that have been compressed) are decompressed. Etc.), and further executable in combination with other module parts.
[0028]
The hard disk 26 stores a video editing program 26e, a data capturing program 26s, video data 26v, audio data 26a, and an operating system (OS) 26w. In this embodiment, Windows 98 of Microsoft Corporation is adopted as the operating system.
[0029]
As the video data 26v and the audio data 26a, DV data from the video camera 43 is captured by the DV video capture board 41 and temporarily stored in the memory 27. Thereafter, the CPU 23 separates and stores the video data and the audio data. Details will be described later.
[0030]
The video editing program 26e is the same as the conventional one. Briefly, when the operator gives a read command, the image data of the specified frame in the video data 26v is decompressed and given to the display unit 30. As a result, the image to be edited is displayed on the display unit 30 frame by frame. The operator cuts and pastes the images of the displayed frames and combines them. At this time, the audio data is simultaneously processed in units of one frame in accordance with the video data. When the desired editing operation is completed, the operator gives a write command. The video data of each frame is compressed in a predetermined format and stored as video data on the hard disk. The video editing program 26e is an application program that runs on the operating system 26w.
[0031]
In addition, the memory 27 stores various calculation results and the like. The display unit 30 includes a graphic card 30a and a monitor 30b, and an image of each frame to be edited is displayed on the video editing screen of the video editing program 26e by executing the video editing program 26e. The keyboard 28 and mouse 31 are input means for inputting various commands (edit start command, edit end command, etc.).
[0032]
3. Flow chart of data import program 26s
Next, the data capturing program 26s stored in the hard disk 26 will be described with reference to FIGS.
[0033]
The data capture program 26s has an interrupt program in addition to the main program shown in FIGS. When the operator gives a capture start command, the interrupt program determines whether or not DV stream data in which video data and audio data are interleaved is provided from the DV video capture board 41, and from the DV video capture board 41. When the DV stream data is given, it is temporarily stored in the hard disk 26. On the other hand, if DV stream data is not given, such storage processing is not performed. Such interruption processing is repeated for each frame period of video.
[0034]
The main program will be described with reference to FIGS. In the following, as shown in FIG. 6C, a data capturing process when the sampling rate of audio data is larger than the standard and the read sampling rate is not changed in the middle will be described.
[0035]
The CPU 23 sets the sampling rate flag = 0 (step ST1 in FIG. 3), and sets the conversion flag f = 0 (step ST11). The CPU 23 determines whether or not new DV stream data is stored in the hard disk 26 (step ST13). If new DV stream data is stored in the hard disk 26, it is separated into video data and audio data and stored in the hard disk (step ST15). If the DV stream data is not stored in the hard disk 26, the process of step ST13 is repeated.
[0036]
CPU23 acquires a sampling rate from the control data of DV stream data (step ST17). Specifically, when the audio data is digitized by the video camera 43, the sampling rate is embedded in the control data, so that the control data may be read out.
[0037]
The CPU 23 determines whether or not the sampling rate flag = 0 (step ST18). In this case, since the sampling rate flag = 0 is set in step ST10, the sampling rate read in step ST17 is stored as a standard value (step ST41). The CPU 23 sets the sampling rate flag = 1 (step ST43).
[0038]
The CPU 23 determines whether or not the sampling rate stored as the standard value matches the read sampling rate (step ST19). In this case, since the read sampling rate is not changed midway, the CPU 23 determines whether or not the conversion flag is f = 0 (step ST21). In this case, since f = 0 in step ST11, the CPU 23 counts and adds the individual data of the separated audio data (step ST23 in FIG. 4). Since the DV stream data is blocked in units of one video frame (see FIG. 6A), the number of samples in each block may be counted. In the DV standard, a one-second moving image in the NTSC mode is composed of 29.97 frames. Accordingly, the time corresponding to one frame of video, the number of samples of 1 / 29.97 seconds, is added.
[0039]
The CPU 23 determines whether or not the counting for a predetermined number of frames has been completed (step ST25). If the counting for the predetermined number of frames has not been completed, the processes in and after step ST13 in FIG. 3 are repeated.
[0040]
If the count for the predetermined number of frames has been completed in step ST25 in FIG. 4, CPU 23 determines whether or not the error is within an allowable range (step ST27 in FIG. 4). For example, when the sampling rate acquired in step ST17 in FIG. 3 is 48 kHz, the average number of samples per video one frame time should be 48 kHz / 29.97 = 1601.60. In the present embodiment, an average of the number of sampling data for a predetermined number of frames is obtained, and it is determined whether or not an error between the average value and the average sample value is within 0.5% or less. I did it. The average is obtained because the number of samples stored per block varies slightly.
[0041]
Note that the allowable range of such errors is not limited to this value, and is set arbitrarily such as a range allowable in the data to be edited, for example, plus or minus 0.3% or less, plus or minus 1% or less. What should I do? Further, an allowable range for the operator may be input.
[0042]
If it is within the allowable range, the CPU 23 sets the conversion flag f to f = 2 and repeats the processing from step ST13 onward. If the allowable range is exceeded, the conversion flag f is set to f = 1 (step ST28 in FIG. 4), and sampling rate conversion processing is performed (step ST29). The sampling rate conversion process will be described with reference to FIG. As shown in FIG. 5A, audio data that requires sampling rate conversion processing is arranged in time series. In this case, as shown in FIG. 6C, since the sampling rate is high, the number of samplings per predetermined time (for example, for one frame) is large. Therefore, the time Δtx between each sample is smaller than the standard value. The CPU 23 calculates a virtual straight line L1 that connects the values of the samples. As shown in FIG. 5B, the virtual straight line L1 is sampled again at a time Δts between samples in the case of a standard value. By this processing, the sampling rate can be converted with almost no change in the frequency and intensity of the audio data.
[0043]
When the sampling rate conversion of the separated audio data is completed, the CPU 23 stores the converted audio data in place of the audio audio before the conversion, and repeats the processes after step ST13 in FIG.
[0044]
In this embodiment, in step ST27 in FIG. 4, it is determined whether the sampling rate is within an allowable range for a predetermined number of frames from the beginning, and the same processing is performed for the remaining frames based on such determination. . That is, once it is determined whether or not it is within the allowable range by the processing from step ST13 to step ST27 in FIG. 3, the conversion flag f becomes f = 1 or f = 2. Accordingly, the process proceeds from step ST21 to step ST22 in FIG. 3, and if the conversion flag f is f = 1, the sampling rate conversion process in step ST29 is not performed without determining whether the allowable range is in step ST23 to step ST27. I do. On the other hand, if the conversion flag f is f = 2, the processing after step ST13 is repeated without performing the sampling rate conversion processing at step ST29. This is because in many video cameras, the sampling rate of audio data does not fluctuate, but is often stable at a value that is shifted up or down compared to the standard value. Of course, it may be determined whether all frames are within the allowable range.
[0045]
That is, in the present embodiment, the conversion flag f indicates that f = 0: sampling rate determination is required, f = 1: sampling rate conversion is required, and f = 3: sampling rate conversion is not required.
[0046]
In this way, even when the sampling rate of the given audio data is deviated, the non-linear video editing software converts the audio stream data into a reference sampling rate used to identify the corresponding audio data. When an editing command is given, an editing target position of the audio stream data can be specified based on the target sampling rate. Thereby, it is possible to avoid the problem of sound deviation during editing.
[0047]
In this way, by adjusting the sampling rate error at the time of capturing audio data, video editing can be performed without any sound shift.
[0048]
Next, a case where the read sampling rate is changed halfway will be described. The following four types of audio data of DV data are employed.
[0049]
1) Sampling rate 48kHz, data length 16 bits
2) Sampling rate 44.1kHz, data length 16 bits
3) Sampling rate 32kHz, data length 16 bits
4) Sampling rate 32kHz, data length 12 bits
The video camera can switch the sampling rate of the audio data during recording. However, if the sampling rate is switched in the middle, the non-linear video editing software will not be able to cope with such switching, and will not be able to capture data and will stop, or even if the data is captured, it will be stored silently, eventually resulting in audio data Could not be imported correctly.
[0050]
Therefore, in the present embodiment, even when the sampling rate is switched halfway, the editing operation in the non-linear video editing software is enabled by automatically performing the sampling rate conversion process at the sampling rate extracted first. Hereinafter, a case where the sampling rate is switched from 48 kHz to the sampling rate 44.1 kHz will be described as an example.
[0051]
The CPU 23 obtains the sampling rate from the control data after separating the video data and the audio data (step ST17). Then, referring to the sampling rate flag in step ST18, only when it is not stored as a standard value, it is stored as a standard value (step ST41), and the sampling rate flag = 1 is set (step ST43).
[0052]
On the other hand, once stored, it is determined whether or not the sampling rate stored as the standard value matches the read sampling rate (step ST19). Such a determination can be made based on whether or not the sampling rate 48 kHz stored as the standard value becomes the sampling rate 44.1 kHz.
[0053]
When the sampling rate is switched halfway, the CPU 23 sets the audio data conversion flag f to f = 0 (step ST31) and clears the counter (step ST33). And the process after step ST29 is performed.
[0054]
In this way, when the sampling rate is changed in the middle, it is possible to sample at the sampling rate detected first instead of converting to the sampling rate designated by the subsequent control data.
[0055]
3. Other embodiments
Note that the DV data provided from the DV video capture board 41 is stream data, and the same applies to not only a tape but also a DVD disk, regardless of the type of storage medium.
[0056]
Whether or not the sampling rate of the audio stream data is generated at the target sampling rate is determined based on a predetermined amount of data from the beginning, and the sampling rate of the predetermined amount of audio stream data from the beginning. However, if it is determined that the data has not been generated at the target sampling rate, the data conversion may be performed on the remaining audio stream data without making this determination.
[0057]
Further, in this embodiment, the values of the individual data constituting the given audio stream data are arranged in time series, a straight line is obtained by obtaining a virtual straight line, and the virtual straight line is sampled again at the target sampling rate, The sampling rate was converted. Thereby, if the frequency is high, the error is small and the calculation is easy. However, supplementary processing may be performed by a method other than this, for example, a virtual spline curve may be obtained, and the data conversion may be performed based on this curve.
[0058]
In this embodiment, the sampling rate stored in the subcode storage area in the given DV data is detected and set as the target sampling rate, but it may be a fixed value. Furthermore, a sampling rate stored in a control data area of mixed stream digital data other than DV data, for example, MPEG data may be detected and set as a target sampling rate.
[0059]
Further, as the target sampling rate, a sampling rate first detected from the DV stream data may be used.
[0060]
When the converter is built in a general-purpose computer, an operating system (OS) program may execute the program. In other words, the program may be executed alone or shared with the operating system (OS).
[0061]
In the present embodiment, the CPU 23 is used to realize the function shown in FIG. 1, and this is realized by software. However, some or all of them may be realized by hardware such as a logic circuit. For example, sampling rate conversion may be performed by a logic circuit, and sampling rate tolerance determination may be performed by software. Further, processing performed by some hardware may be executed by the CPU.
[0062]
In the present embodiment, the program shown in FIGS. 3 and 4 is installed in the hard disk, and the DV stream data given from the DV capture board 41 is temporarily stored in the hard disk 26 to determine whether or not to convert the data. However, a separate CPU and ROM may be mounted on the DV capture board 41, and the program may be stored in the ROM so that the DV capture board 41 can output DV stream data having the same sampling rate. . In this case, a memory for storing audio data for a predetermined frame from the beginning for performing the determination in step ST27 may be prepared. In this case, since the video data need not be converted, the video data may be sequentially transferred to the hard disk 26. As a result, the memory prepared in the DV capture board 41 may be a memory that stores audio data with a relatively small amount of data. Of course, a memory for storing all stream data may be mounted until the determination is completed.
[Brief description of the drawings]
FIG. 1 is a functional block diagram of a non-linear video editing system 1 according to the present invention.
FIG. 2 is a diagram illustrating an example of a hardware configuration in which the nonlinear video editing system 1 is configured using a CPU.
FIG. 3 is a main flowchart of a data capturing program.
FIG. 4 is a main flowchart of a data capturing program.
FIG. 5 is a diagram for explaining sampling rate conversion;
FIG. 6 is a diagram illustrating a correspondence between video data and audio audio.
[Explanation of symbols]
1 ... Nonlinear video editing device
23 ... CPU
26s ... Data acquisition program
26e ... Video editing program
41 ... DV video capture board

Claims (10)

ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、前記混在ストリームデジタルデータのノンリニアビデオ編集を行うノンリニアビデオ編集装置であって、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する分離記憶手段、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、
前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段、
オーディオストリームデータの編集命令が与えられると、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象データを特定して、前記オーディオストリームデータを編集する編集手段、
を備えたことを特徴とするノンリニアビデオ編集装置。
A non-linear video editing apparatus that, when given mixed stream digital data in which video data and audio data are interleaved, separates and stores video stream data and audio stream data, and performs non-linear video editing of the mixed stream digital data. ,
When the mixed stream digital data is given, separate storage means for separating and storing video stream data and audio stream data;
Judgment means for judging whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
Sampling rate conversion means for performing data conversion so that the sampling rate of the audio stream data becomes the target sampling rate when the determining means determines that the audio stream data is not generated at the target sampling rate;
An editing means for editing the audio stream data by specifying editing target data of the audio stream data based on the target sampling rate when an audio stream data editing command is given;
A non-linear video editing apparatus characterized by comprising:
ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する混在ストリームデジタルデータ分離記憶装置であって、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する分離記憶手段、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、
前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段、
を備えたことを特徴とする混在ストリームデジタルデータ分離記憶装置。
A mixed stream digital data separation and storage device that separates and stores video stream data and audio stream data when mixed stream digital data in which video data and audio data are interleaved is provided,
When the mixed stream digital data is given, separate storage means for separating and storing video stream data and audio stream data;
Judgment means for judging whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
Sampling rate conversion means for performing data conversion so that the sampling rate of the audio stream data becomes the target sampling rate when the determining means determines that the audio stream data is not generated at the target sampling rate;
A mixed stream digital data separation and storage device comprising:
ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離する混在ストリームデジタルデータ分離装置であって、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離する分離手段、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断する判断手段、
前記判断手段が前記オーディオストリームデータが前記目標サンプリングレートで生成されていないと判断した場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換するサンプリングレート変換手段、
を備えたことを特徴とする混在ストリームデジタルデータ分離装置。
A mixed stream digital data separation device that separates video stream data and audio stream data when mixed stream digital data in which video data and audio data are interleaved is provided,
Separation means for separating video stream data and audio stream data when the mixed stream digital data is given,
Judgment means for judging whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
Sampling rate conversion means for performing data conversion so that the sampling rate of the audio stream data becomes the target sampling rate when the determining means determines that the audio stream data is not generated at the target sampling rate;
A mixed stream digital data separation device comprising:
ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、前記混在ストリームデジタルデータのノンリニアビデオ編集を行うノンリニアビデオ編集方法であって、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断し、
前記オーディオストリームデータが前記目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換し、
オーディオストリームデータの編集命令が与えられると、前記目標サンプリングレートに基づいて、前記オーディオストリームデータの編集対象データを特定して、前記オーディオストリームデータを編集すること、
を特徴とするノンリニアビデオ編集方法。
A non-linear video editing method in which video stream data and audio data are interleaved, and when the mixed stream digital data is given, the video stream data and the audio stream data are stored separately, and non-linear video editing of the mixed stream digital data is performed. ,
Given the mixed stream digital data, separate and store video stream data and audio stream data,
It is determined whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
If the audio stream data is not generated at the target sampling rate, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate,
When an audio stream data editing command is given, based on the target sampling rate, the editing target data of the audio stream data is specified, and the audio stream data is edited.
A non-linear video editing method.
ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離し、
前記オーディオストリームデータのサンプリングレートを計測し、
前記計測したサンプリングレートに基づいて、前記オーディオストリームデータが、ビデオストリームデータを構成する各フレームデータとの対応づけ許容度を越えるサンプリングレートで生成されている場合には、前記オーディオデータのサンプリングレートを前記対応付け許容度の範囲内となるようデータ変換すること、
を特徴とする混在ストリームデジタルデータのデータ変換方法。
When mixed stream digital data in which video data and audio data are interleaved is given, it is separated into video stream data and audio stream data,
Measuring the sampling rate of the audio stream data;
Based on the measured sampling rate, if the audio stream data is generated at a sampling rate that exceeds the association tolerance with each frame data constituting the video stream data, the sampling rate of the audio data is set. Data conversion to be within the range of the association tolerance;
A mixed stream digital data conversion method characterized by the above.
コンピュータを、ビデオデータとオーディオデータがインタリーブされた混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶する混在ストリームデジタルデータ分離記憶装置として機能させるプログラムを記憶させた記憶媒体であって、以下の処理を実行すること、
前記混在ストリームデジタルデータが与えられると、ビデオストリームデータとオーディオストリームデータに分離して記憶し、
前記オーディオストリームデータのサンプリングレートが、編集時にデータ特定に用いる目標サンプリングレートで生成されているか否かを判断し、
前記オーディオストリームデータが前記目標サンプリングレートで生成されていない場合には、前記オーディオストリームデータのサンプリングレートが前記目標サンプリングレートになるようデータ変換する、
を特徴とするプログラムを記憶した記憶媒体。
A storage storing a program that causes a computer to function as a mixed stream digital data separation storage device that, when given mixed stream digital data in which video data and audio data are interleaved, is separated and stored into video stream data and audio stream data Performing the following processing on the medium:
Given the mixed stream digital data, separate and store video stream data and audio stream data,
It is determined whether the sampling rate of the audio stream data is generated at a target sampling rate used for data specification at the time of editing,
When the audio stream data is not generated at the target sampling rate, data conversion is performed so that the sampling rate of the audio stream data becomes the target sampling rate.
A storage medium storing a program characterized by the above.
請求項6のプログラムを記憶した記憶媒体において、
前記オーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されているか否かの判断は、先頭から所定量のデータに基づいて判断し、
前記先頭から所定量のオーディオストリームデータのサンプリングレートが、前記目標サンプリングレートで生成されていないと判断した場合には、残りのオーディオストリームデータについては、この判断をすることなく前記データ変換をすること、
を特徴とするもの。
In the storage medium which memorize | stored the program of Claim 6,
Whether the sampling rate of the audio stream data is generated at the target sampling rate is determined based on a predetermined amount of data from the beginning,
If it is determined that the sampling rate of the predetermined amount of audio stream data from the head is not generated at the target sampling rate, the remaining audio stream data is converted without performing this determination. ,
It is characterized by.
請求項6のプログラムを記憶した記憶媒体において、
与えられたオーディオストリームデータを構成する個別データの値を時系列で並べて、直線補完して仮想直線を求め、この仮想直線について前記目標サンプリングレートで再度サンプリングして、前記サンプリングレートの変換をすること、
を特徴とするもの。
In the storage medium which memorize | stored the program of Claim 6,
Arranging values of individual data constituting the given audio stream data in time series, obtaining a virtual straight line by complementing the line, sampling the virtual straight line again at the target sampling rate, and converting the sampling rate ,
It is characterized by.
請求項8のプログラムを記憶した記憶媒体において、
前記プログラムは、与えられたオーディオストリームデータの制御データに記憶されたサンプリングレートを検出して目標サンプリングレートとすること、
を特徴とするもの。
In the storage medium which memorize | stored the program of Claim 8,
The program detects the sampling rate stored in the control data of the given audio stream data and sets it as a target sampling rate,
It is characterized by.
請求項9のプログラムを記憶した記憶媒体において、
前記プログラムは、前記混在ストリームデジタルデータから最初に抽出したサンプリングレートを前記目標サンプリングレートとし、与えられる混在ストリームデジタルデータの制御データ領域に記憶されたサンプリングレートが異なる場合でも、前記目標サンプリングレートにてサンプリングレート変換すること、
を特徴とするもの。
In the storage medium which memorize | stored the program of Claim 9,
The program uses the sampling rate first extracted from the mixed stream digital data as the target sampling rate, and even if the sampling rate stored in the control data area of the given mixed stream digital data is different, the target sampling rate is used. Sampling rate conversion,
It is characterized by.
JP00783699A 1999-01-14 1999-01-14 Non-linear video editing apparatus and method Expired - Fee Related JP4109367B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00783699A JP4109367B2 (en) 1999-01-14 1999-01-14 Non-linear video editing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00783699A JP4109367B2 (en) 1999-01-14 1999-01-14 Non-linear video editing apparatus and method

Publications (2)

Publication Number Publication Date
JP2000209543A JP2000209543A (en) 2000-07-28
JP4109367B2 true JP4109367B2 (en) 2008-07-02

Family

ID=11676702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00783699A Expired - Fee Related JP4109367B2 (en) 1999-01-14 1999-01-14 Non-linear video editing apparatus and method

Country Status (1)

Country Link
JP (1) JP4109367B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101448095B (en) * 2007-11-28 2011-12-28 新奥特(北京)视频技术有限公司 Method and system for reviewing film based on multi-stream

Also Published As

Publication number Publication date
JP2000209543A (en) 2000-07-28

Similar Documents

Publication Publication Date Title
JP3629181B2 (en) Program development support device
US5959684A (en) Method and apparatus for audio-video synchronizing
EP0907177B1 (en) Audio-video synchronous playback apparatus
US7054540B2 (en) Information processing apparatus and method, and program storage medium
CA2219154C (en) An apparatus for a synchronized playback of audio-video signals
JPH10200862A (en) Audio and video synchronous reproducing device
WO2007105652A1 (en) Image extraction analyzer, image extraction analyzing system, and image extraction analyzing method
JP4109367B2 (en) Non-linear video editing apparatus and method
US7289963B2 (en) Sound-reproducing apparatus and high frequency interpolation-processing method
KR100581323B1 (en) Data processing device
JP2910575B2 (en) Audio signal processing circuit and image / audio decoder
JP2000278136A (en) Decoder
JP5460239B2 (en) Screen recording device
US20080130941A1 (en) Watermark detection device
WO2024093512A1 (en) Object processing method and apparatus, electronic device and readable storage medium
US6731862B1 (en) Video image edit device
JP2003125307A (en) Television receiver and osd system
JP2006041794A (en) Image processing apparatus and image processing program
JP2002077797A (en) Picture edit apparatus
JP3778812B2 (en) Video stream data converter and program for functioning the same
KR100289351B1 (en) Magnetic recording / playback apparatus and method equipped with image editing function
JP2677062B2 (en) Time series data editing device
JP2012138818A (en) Image signal data capturing device
JP2000004423A (en) Information reproduction device and method therefor
JP2002111506A (en) Waveform-recording device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060110

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20071130

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20071130

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20071213

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20080128

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20080128

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080401

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080404

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120411

Year of fee payment: 4

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140411

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees