JP3706721B2 - オーディオビジュアル・ファイル内部での検索方法および検索装置 - Google Patents

オーディオビジュアル・ファイル内部での検索方法および検索装置 Download PDF

Info

Publication number
JP3706721B2
JP3706721B2 JP31328697A JP31328697A JP3706721B2 JP 3706721 B2 JP3706721 B2 JP 3706721B2 JP 31328697 A JP31328697 A JP 31328697A JP 31328697 A JP31328697 A JP 31328697A JP 3706721 B2 JP3706721 B2 JP 3706721B2
Authority
JP
Japan
Prior art keywords
frame
file
frames
video
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31328697A
Other languages
English (en)
Other versions
JPH10262210A (ja
Inventor
エリック・ティー・ブリューワー
アンドリュー・ポールフリーマン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPH10262210A publication Critical patent/JPH10262210A/ja
Application granted granted Critical
Publication of JP3706721B2 publication Critical patent/JP3706721B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/036Insert-editing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2512Floppy disks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/781Television signal recording using magnetic recording on disks or drums
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape
    • H04N5/783Adaptations for reproducing at a rate different from the recording rate
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/804Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components
    • H04N9/8042Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback involving pulse code modulation of the colour picture signal components involving data reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Television Signal Processing For Recording (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、広くは、ビデオ・ファイルの編集の方法に関する。より詳しくは、本発明は、多重オーディオビジュアル・ファイル内部でのあらかじめ定められたビデオ・フレームの検索の各種方法および装置に関する。一側面にあっては、ファイル・バイト・オフセットを基準にして、ターゲット・フレームのデータを検索してアクセスする方法および装置が開示される。
【0002】
【従来の技術】
MPEG(動画エキスパート・グループ)は、国際規格機構(ISO)が定めたデジタル・ビデオおよびオーディオ信号を簡潔にあらわすための構文法に関する規格である。この構文法では、一般に、ビット・ストリームを符号化するときにしたがうべき規則の数を最小限にしてしかも受信したビット・ストリームを明確に復号できることが求められる。当業者には周知のように、ビット・ストリームは、ビデオおよびオーディオ構成要素に加えて「システム」構成要素を含むものである。一般に、システム構成要素は、各ビデオおよびオーディオ構成要素を組み合わせ同期させて単一のビット・ストリームにするために必要な情報を含んでいる。具体的には、システム構成要素によって復号器でのオーディオ/ビデオの同期が可能となる。
【0003】
MPEG−1と呼ばれる最初のMPEGが公表された後、MPEG−2で知られる次のMPEGが導入された。一般的にいって、MPEG−2は、放送されるビデオをより効率的にあらわすことができる改良された構文法を規定したものである。成立の経緯から、MPEG−1では、1.5Mビット/秒の速度でデータを取り扱い、各フレームが352画素×240ラインの解像度のものを毎秒約30ビデオ・フレーム(NTSC)または各フレームが352画素×288ラインの解像度のものを毎秒約25ビデオ・フレーム(PAL)再構成する場合に最適の結果が得られるものとなっている。したがって、復号されたMPEG−1ビデオは、消費者のビデオテープ(VHS)の知覚される品質にほぼ近似している。それに対して、MPEG−2は、4.0から8.0Mビット/秒のデータ速度でのCCIR601の解像度をあらわしまた720画素×480ライン(NTSC)または720画素×576ラインのフレーム解像度をあたえるように設定されている。以下、簡単のために、これら二つのMPEG規格の間の相違が問題となる場合をのぞいて、「MPEG」という用語は、現在規定されているおよび将来規定されるであろうビデオおよびオーディオ符号化および復号アルゴリズムをさすものとする。
【0004】
通常、復号の過程は、ビデオ、オーディオ、およびシステム情報を含むMPEGビット・ストリームが符号化された個別のビデオおよびオーディオ・ビット・ストリームを生成する役割りを果たすシステム復号器によってデマルチプレクスされるときに始まる。なお、これらの符号化されたビデオおよびオーディオ・ビット・ストリームは、その後、ビデオ復号器およびオーディオ復号器で復号することができる。現在は、符号化されたビデオ・ビット・ストリームの構造に関心が向けられている。一般に、符号化されたMPEGビデオ・ビット・ストリームは、明確なデータ構造階層に組織される。この階層の最も高いレベルには「ビデオ・シーケンス」がある。これは、シーケンスヘッダ、1以上の画像グループ(GOP)、およびシーケンスの終わりコードを含むものとすることができる。GOPは、ビデオ・シーケンスのサブセットであり、各GOPは、1以上の画像を含むことができる。以下に説明するように、GOPは、それによってビデオ・シーケンスのある画定されたセグメントにアクセスできるためきわめて重要である。ただし、GOPは、きわめて大きくなる場合がある。
【0005】
1つのGOP内部の各画像は、左から右へまた上から下へ向けて画定されるいくつかの「スライス」に仕切られる。個々のスライスは、16×16画素の正方形の面積を占める1以上のマクロブロックで構成される。MPEG規格に記されているように、1つのマクロブロックは、四つの8×8画素「ルミナンス(輝度)」構成要素と二つの8×8「クロミナンス(色差)」構成要素(すなわち、クロマ赤およびクロマ青)を含む。
【0006】
1つのGOP内部の画像の間では、画素情報の多くが類似しているかまたは同一であるため、MPEG規格は、この時間的冗長性を利用し、特定の基準画像から互いに異なる選ばれた画像をあらわすようにしている。MPEG規格は、大きく、三種類の符号化された画像フレームを定義している。第1の種類のフレームは、イントラ・フレーム(I−フレーム)である。I−フレームは、フレーム自身に含まれる情報を用いて符号化され、以前のまたは将来のフレームに含まれる情報には依存しない。その結果、I−フレームは、一般に、フレームのシーケンスの中の特定のGOPの起点を定義する。
【0007】
第二の種類のフレームは、予測フレーム(P−フレーム)である。P−フレームは、一般に、前のIまたはP−フレームに含まれる情報を用いて符号化される。当業者には周知のように、P−フレームは、前方予測フレームと呼ばれる。第三の種類のフレームは、双方向フレーム(B−フレーム)である。B−フレームは、過去および未来のフレームの両方に含まれる情報にもとづいて符号化され、したがって双方向予測フレームと呼ばれる。したがって、B−フレームは、I−フレームおよびP−フレームより圧縮されたものとなる。MPEG規格は、IまたはP−フレームの間に特定の数のB−フレームを配置することを求めてはいないが、大部分の符号器は、IおよびP−フレームの間に二つのB−フレームを選択する。このような選択の設定は、符号器の中のメモリの量および符号化される材料に必要な特性および定義などの各種要因にもとづいて行なわれている。
【0008】
【発明が解決しようとする課題】
MPEG規格は、ビデオおよびオーディオ・ビット・ストリームを簡潔に符号化するための便利な構文法を定めているが、符号化されたビット・ストリームのセグメントを切り取って新しいビット・ストリームで使用する場合にはかなりの困難が生じる。とくに、P−フレームは、ビット・ストリーム内の以前のフレームからの情報を使用し、またB−フレームは、以前と将来のフレームの両方からの情報を使用するため、切り取りは、I−フレームで行なわなければならない。すなわち、切り取られたセグメントは、その切り取られたセグメントの中に、I−フレームを開始フレームとしてまたPまたはI−フレームを最終フレームとしてもっていなければならない。したがって、I−フレームで切り取りを行なうと、最初のビット・ストリームに含まれる基準フレームなしには復号することができない開始および終了フレームを有するビデオ・クリップが排除されることになる。
【0009】
残念ながら、通常の符号化されたビデオ・ビット・ストリームは、I−フレームの間に多数のPおよびB−フレームをもっている。その結果、切り取りが行なわれる場所が限定される不具合が生じ、符号化されたMPEGビット・ストリームは、フレームの精密さが求められるビデオ編集業に適さないものとなってしまう。
【0010】
従来の編集エンジンに関連する他の不具合は、ターゲット・ビデオ・フレームの検索を行なうためには、ファイル内の各フレームを時間をかけて読み取って復号する必要があることである。すなわち、特定のビデオ・フレームの検索を行なう前に、編集プログラムがファイル内の各ビデオ・フレームを読み取って復号し、各フレームの時間的基準を判別する必要がある。各フレームが読み取られて復号されれば、ターゲット・フレームの検索を行なうことができる。残念ながら、大多数のビデオ・ファイルは、きわめて大きいものである。例えば、3時間のビデオ・ファイルは、フレーム・レートが毎秒30フレームとすれば、約324000ものビデオ・フレームを含むものとなる。ターゲット・フレームの検索を行なう前に324000ものビデオ・フレームを各々読み取って復号するとすれば、それは、きわめて手間のかかる今日のビデオ編集作業には不適なものとなることは理解されよう。さらに、従来の検索アルゴリズムは、ビデオ・ファイル内のフレームの正確な数を確認する前にビデオ・ファイルを読み取って復号する必要がある。
【0011】
以上の説明から、手間をかけて予めビデオ・ファイルの各フレームを読み取って復号することを必要とせずに、1つのビデオ・ファイル内部のターゲット・ビデオ・フレームの検索を効率的に行なうための方法および装置が求められている。
【0012】
【課題を解決するための手段】
本発明の目的にもとづいて上の課題を解決するために、1つのオーディオビジュアル・ファイル内部のターゲット・ビデオ・フレームの検索を高速かつ効率的に行なうための方法および装置が開示される。1つの実施の形態にあっては、本発明の検索装置は、まず、オーディオビジュアル・ファイル内部のターゲット・フレームのバイトであらわした推定位置を判別する。バイトであらわした推定位置が判別されると、該推定位置からバイトであらわしたあらかじめ定められた秒数が差し引かれ、推定時間位置が示される。次に、検索装置は、ターゲット・ビデオ・フレームの少なくとも1つの画像グループ(GOP)ヘッダだけ前にある推定時間位置まで飛び越しを行なう。
【0013】
ここで、検索エンジンは、推定時間位置の前にある任意のGOPヘッダへ進む。各GOPヘッダで、検索エンジンは、そのGOPヘッダの時間コードから得られるフレーム番号がターゲット・フレームの番号より大きいか否かを判別する。GOPヘッダの時間コードから得られるフレーム番号がターゲット・フレームの番号より大きい場合には、検索エンジンは、前に読み取られて保管されたGOPヘッダへ逆戻りする。この時点で、前のGOPヘッダは、ターゲット・フレームを含んでいることが好ましい。ターゲット・フレームを識別するために、検索エンジンは、前のGOPヘッダの時間コードから得られたフレーム番号をターゲット・フレーム番号から差し引いて、GOPヘッダ内部にターゲットの時間基準フレーム番号を生成する。これで検索エンジンは、ターゲット時間基準フレーム番号まで移動してターゲット・フレームの特定を行なうことになる。
【0014】
検索エンジンがターゲット・フレームを識別したら、そのターゲット・フレームに関するファイル・バイト・オフセットがわかって記憶される。この記憶されたバイト・ファイル・オフセットを用いれば、任意のときにターゲット・フレームの検索を行ない、ターゲット・ビデオ・フレームに含まれるデータにアクセスすることができる。
【0015】
他の一実施の形態にあっては、オーディオビジュアル・ファイルの中のビデオ・フレームの数を正確に判別することのできる検索エンジンが開示される。最初、検索エンジンは、オーディオビジュアル・ファイルの終わりを識別してそこへ移動する。終わりに達したら、検索エンジンは、あらかじめ定められた時間だけビデオ・ファイルの中のある位置まで逆戻りする。次に、検索エンジンは、時間的にファイルの前方へ移動して任意のGOPヘッダを識別し、任意の識別されたGOPヘッダが保管される。検索エンジンは、ファイルの終わりに達するまで時間的に前方へ移動しながらGOPヘッダの識別と保管を続ける。終わりに達したら、検索エンジンは、前に保管したGOPヘッダへ逆戻りする。前に保管したヘッダに達したら、検索エンジンは、該前に保管したGOPヘッダに関連するあらかじめ定められた数のビデオ・フレーム画像ヘッダの各々を読み取って各ビデオ・フレームごとの時間基準フレーム番号を判別する。あらかじめ定められた数のビデオ・フレーム画像ヘッダの各々が読み取られるのに応じて、前の時間基準フレーム番号が現在の時間基準フレーム番号より大きいか否かが判別される。
【0016】
検索エンジンは、この判別にもとづいて、前の時間基準フレーム番号より小さい時間基準フレーム番号を有するすべてのビデオ・フレームを無視する。ファイルの終わりに達した時点で、ビデオ・ファイルの中の(確認可能なフレーム番号をもつ)最後のフレームが、前に保管されたGOPヘッダの中の最も大きい時間基準フレーム番号をもつフレームとして識別される。検索エンジンは、ファイルの中の各フレームを手間をかけて読み取りまた復号する必要なしに、ビデオ・ファイルの中のビデオ・フレームの数を正確に判別することができる。
【0017】
本発明は、数多くの効果をもたらすが、とくに大きな効果は、ターゲット・ビデオ・フレームを検索する前あるいはオーディオビジュアル・ファイルのビデオ・フレームの数を判別する前に、手間をかけてオーディオビジュアル・ファイルの中の各ビデオ・フレームを読み取り、復号し、指標付けを行なう必要がないことである。
【0018】
【発明の実施の形態】
本発明ならびにその効果は、添付の図面を参照して行なう以下の説明から最もよく理解されよう。
【0019】
本発明は、広くは、オーディオビジュアル・ファイル内部での検索の方法および装置を開示するものである。検索エンジンは、手間をかけてオーディオビジュアル・ファイルの中の各ビデオ・フレームを読み取り、復号し、指標付けを行なう必要なしにターゲット・ビデオ・フレームを効率的に検索するように実装される。さらに、検索エンジンは、1つのビデオ・ファイルの中の最後のGOPヘッダを識別し、さらに該ファイルの中の最後のビデオ・フレームを識別することによって、該ビデオ・ファイルの中のフレーム数を正確に判別することができる。ファイルの中の最後のビデオ・フレームは、各ビデオ・フレームの(すなわち、最後のGOP内部の)画像ヘッダを読み取り、どの画像ヘッダがより大きい時間基準フレーム番号を示すかを判別することによって識別される。すなわち、最大の時間番号をもつビデオ・フレームは、該ビデオ・ファイルの中の最後のビデオ・フレームである。さらに、検索エンジンは、識別されたビデオ・フレームを最も近いオーディオ・フレームと関係づけてオーディオ−ビデオ検索を完了することができる。
【0020】
説明をわかりやすくするために、本発明の検索エンジンを、ビデオ・ファイルの編集との関連で説明する。ビデオの編集では、一般的に、オーディオビジュアル・ファイル内部の編集されたビデオ・セグメントの境界を画定するためにターゲット・ビデオ・フレームの検索を行なう必要がある。したがって、フレームに関して正確かつ効率的に検索を行なう方法および装置の必要性を理解するために、ビデオ・ファイルの編集の各種の方法を概観しておくことが有用であろう。「切り取り、コピー、マークイン、マークアウト」などの用語は、すべて、特定のビデオ・フレームを識別するための検索エンジンの実施の形態に関して用いられることを理解されたい。ターゲット・フレームが識別されたら、該ターゲット・フレームのデータの内容に高速でアクセスすることができる。
【0021】
本発明の一実施の形態にあっては、MPEGビット・ストリーム・ファイルからビデオのセグメントを切り取り、切り取られたセグメントの部分を処理して元のビット・ストリーム・ファイルに含まれる情報から独立した1つのビット・ストリーム・セグメントを生成するための方法が開示される。一般に、編集エンジンは、特定の編集作業を要求するアプリケーションに応じて提供されるオペレータ(演算子)の編集リストを使って二つの処理パスで独立のセグメントを生成するために編集対象セグメントを処理する。最初の処理パスでは、編集エンジンは、好ましくは切り取られたセグメントの始めと終わりにあるフレームの種類にもとづいて、該編集対象セグメント用のグル(のり付け)セグメントを生成する。第二の処理パスでは、最初のパスで生成されたすべてのグル・セグメントが編集対象セグメントの未処理部分に貼り付けられる。すべてのグル・セグメントと未処理部分が正しい時間順序で互いに貼り付けられると、貼り付けられたセグメントがアプリケーションへ送られる。貼り付けられたセグメントは、ビデオ・フレームを正確に復号するための最初のビット・ストリーム・ファイルの中に含まれている情報を必要としない。
【0022】
図1は、ソース・ファイルに含まれるフレーム情報から独立したビデオ・フレーム・セグメントを生成することに関係する処理ステップを説明するために用いる多くのビデオ・フレームのシーケンスを示す図である。例として、フレームがMPEG規格のフォーマットにもとづいて処理された後で符号化される順序を示すビデオ・フレームの符号化の順序のストリーム50が示されている。例として示したこの符号化の順序のストリーム50では、最初のフレームは、I−フレームであり、その後にP−フレーム、B−フレーム、B−フレーム、P−フレーム、B−フレーム、B−フレーム等々が続く。本発明の編集アルゴリズムは、任意の適当に配列されたフレームのシーケンスを処理することができるが、表示の順序でフレームのシーケンスを処理することが好ましい。
【0023】
すなわち、フレーム0からフレーム36まで時間順序で配列されたフレーム・ストリームは、表示順序ストリーム52の中で処理されるフレームの順序を識別する。比較のために、符号化順序ストリーム50の中のフレームの対応する時間順序を対応するフレームの下に示してある。もちろん、表示順序ストリーム52は、単に例であり、本発明にもとづいて他の適当な表示順序ストリームを適当に処理できることは理解されよう。
【0024】
ビデオ・フレームのセグメントが表示順序ストリーム52から切り取られると、マークインの位置およびマークアウトの位置が設定されて、切り取られるフレームの番号がマークされる。例として、マークインの位置がP−フレームであるフレーム9に設定され、マークアウトの位置がB−フレームであるフレーム28に設定されるとする。したがって、表示順序ストリーム52から切り取られるフレームのセグメントは、フレーム9から28までとなる。切り取りの大きさがきまると、フレーム9がI−フレームでなくフレーム28がI−フレームまたはP−フレームでない場合には、切り取りの始めに、フレームは、P−フレーム9では過去のフレームからの情報を、またB−フレーム28では過去および未来のフレームからの情報を必要とする。その結果、フレーム9から14およびフレーム25から28は、予測型のフレームであり、表示順序ストリーム52に残っているフレームから十分な情報(コンテキスト)を把握しないと復号することができないことになる。
【0025】
ビデオ・フレームの切り取られた全セグメントを復号可能にするために、ビデオ・フレーム9から14および25から28は、該切り取られた全セグメントを復号可能でかつ最初の表示順序ストリーム52に含まれる情報から独立したものとする処理を受ける。例として、フレーム9から14および25から28が復号されてI−フレームに再符号化された後に「ドラフト・モード」で処理されたセグメント54を示す。便宜上、処理されたフレーム9から14を「イン・グルセグメント」と呼び、フレーム24から28を「アウト・グルセグメント」と呼ぶ。さらに、未処理のフレーム15から23を「ミドル・グルセグメント」と呼ぶ。
【0026】
本実施の形態にあっては、イン・グルおよびアウト・グルセグメントは、フレーム9より前のリファレンスフレームを編集対象セグメント内から削除したI−フレームに符号化されており、またB−フレーム25、26、27、および28も、フレーム28より後のフレームに含まれる情報を必要としない。再符号化されたイン・グルおよびアウト・グルセグメントも、IおよびPの組み合わせに符号化することができ、I−フレームは、切り取らとられた「I−Pモード」セグメント56に示すイン・グルセグメントおよびアウト・グルセグメントの両方の始まりとなることができることは理解されよう。さらの他の一実施の形態にあっては、再符号化されたイン・グルおよびアウト・グルセグメントは、I−P−Bフレームに符号化して、I−フレームが、切り取られた「I−P−Bモード」セグメント58に示すイン・グルセグメントおよびアウト・グルセグメントの両方の始まりとなることができる。セグメント58が実施される場合には、P−フレーム間の距離(すなわち、フレームの数)を判別することが好ましい。さらに、上に述べた各モードのGOPの大きさも判別することが好ましい。
【0027】
以下に詳細に説明するように、マークインとマークアウトの位置の間の切り取るセグメントが選定されたら、マークインの位置がすでにI−フレームでなければ、マークインの位置から最も前のI−フレームが識別される。この例では、フレーム6が、表示順序ストリーム52の最も前のI−フレームである。このようにして、MPEG復号器は、I−フレーム6を復号して、マークイン・フレーム−9を含みまたミドル・インフレーム15の前の1フレームまで伸びるイン・グルセグメントの中でフレームを復号し再符号化するのに十分な情報を獲得することができる。例として、復号器が、I−フレーム6を画素ビットマップに復号して情報を獲得すると、処理が進行してフレーム9、10、11、12、13、および14を復号し再符号化するように構成することができる。同様に、復号器はI−フレーム24から十分な情報を獲得しているため、フレーム25から28も、個々に復号されまた再符号化される。したがって、フレーム25、26、27、および28も、再符号化されて、I−フレーム24で始まる適当なアウト・グルセグメントを生成する。
【0028】
図2は、本発明の一実施の形態にもとづくビデオ・ファイルの編集に用いられるデータ・フロー・アーキテクチャー100を示す。図示のように、ファイルのオーディオ構成要素の編集にも同様なアーキテクチャー(例、かげになって隠されている部分)が用いられる。
【0029】
図示の実施の形態にあっては、データ・フロー・アーキテクチャー100は、多くの編集作業を行なうことのできる編集エンジン102(例、MEDIT編集エンジン)によって駆動されることが好ましい。例として、この種の作業として、ソースまたは入力ストリームからのセグメントが他のファイルで使用するためにコピーされる必要があることを要求するコピー操作を挙げることができる。他の適当な編集作業としては、フェード操作、ブレンド操作、モーフィング(形付け)操作、ティルティング(傾け)操作、テキスト・アノテーション(注釈付け)操作などを挙げることができる。一般に、MEDITエンジン102は、編集作業を要求するアプリケーションが提供するオペレータの種類に応じて異なる多くの編集作業を管理することのできるダイナミックなエンジンである。したがって、MEDITエンジン102は、複雑高度な編集作業を必要とする将来のアプリケーションが提供するオペレータを含む多数のオペレータの種類をすべて管理することができることが理解されよう。
【0030】
以下では、ソース・ファイルからビデオのセグメントをコピーするなどの編集作業を行なう場合にMEDITエンジン102がたどる処理ステップの概要を説明する。一般に、コピー操作は、アプリケーション106がコピー操作を行なうことを要求したときに開始される。
【0031】
最初、アプリケーション106は、MEDITエンジン102に、編集する型を要求するためのチャンネル番号を識別する複数の「チャンネル・オペレータ」110、アプリケーション106が要求する編集機能の種類を識別する「機能オペレータ」112、および編集要求の終わりを識別する「終端オペレータ」114を含む適当な編集リスト108を提供する。図示の実施の形態では、機能オペレータ112は、「コピー」要求を識別する。例として、機能オペレータ112で識別された最初のコピー要求は、チャンネル1であるA.MPEGと呼ばれるファイルの中のフレーム9から28をコピーする要求であるとする。図示のように、チャンネルNであるB.MPEGと呼ばれるファイルの中のフレーム10から50をコピーする要求に至るまで、他にも多くのコピーの要求があり得る。
【0032】
MEDITエンジン102が編集リスト108を受け取ると、コピーの要求が編集リスト108を通る二つの識別可能なパスで処理される。最初のパスでは、MEDITエンジン102は、編集リスト108全体を通読してコピーされた各セグメントのためにイン・グルまたはアウト・グルセグメントが必要か否かを識別する。もちろん、マークインおよびマークアウト・フレームがともにI−フレームであれば、イン・グルまたはアウト・グルセグメントは必要ではない。しかし、マークイン・フレームがI−フレームでないか、あるいはマークアウト・フレームがPまたはI−フレームでない場合には、そのコピーされたセグメントのためにグル・セグメントが生成されることになる。コピーされたセグメントのためにグル・セグメントが生成される場合には、該グル・セグメントは、適当な記憶媒体140に記憶される。記憶媒体140は、キャッシュ・メモリ、コンピューター・ハード・ドライブ、フロッピー・ディスク、あるいは適当なネットワークによって接続されて遠隔に配置された記憶媒体など任意の適当な記憶媒体とすることができる。
【0033】
第二のパスでは、MEDITエンジン102は、MEDITエンジン102によって生成される複数のスティッチャ・オブジェクト147、148を用いてグル(のり)部分を未処理のコピーされたセグメント(すなわち、ミドル・グル)と接合することで前に生成したグル・セグメントを利用する。以下により詳細に説明するように、スティッチャ・オブジェクトは、編集リスト108の各チャンネルのために生成され、特定のチャンネルに関連して生成された各スティッチャ・オブジェクトは、編集リスト108全体をみてそれ自身のチャンネルのためにグル・セグメントを接合する(例、他のチャンネルに関連する情報は無視する)能力をもつ。
【0034】
このようにして、編集リスト108の中で識別された各チャンネルのために多数のスティッチャ・オブジェクトを生成することができる。特定の一実施の形態にあっては、各スティッチャ・オブジェクトは、正しい時系列で該特定のグル・セグメントを接合し、生成された各セグメントが適当な表示順序ストリームを生成するようにタイムスタンプを押す能力をもつ。さらに、生成された各スティッチャ・オブジェクトは、グル・オブジェクト130および131などのグル・オブジェクトを用いて、前に生成されたイン・グルまたはアウト・グルファイルからグル・セグメントを引き出すか、あるいはミドル・グルセグメントの位置を識別するポインタを用いて元のファイルからミドル・グルを引き出す。図1は、好ましくはフレーム15から23を含むミドル・グルセグメントの例を示している。貼り付けられたフレーム・データがプログラム要素ストリーム(PES)としてマルチプレクサ150に出力されると、マルチプレクサ150は、生成されたすべてのスティッチャ・オブジェクトからPESデータを引き出し、コピーされたセグメントをMEDIT102を介してアプリケーション106へ出力する。
【0035】
図2の全体のデータの流れを説明するために、アプリケーション106が、チャンネル1からA.MPEGファイル124(すなわち、図1の表示順序ストリーム52)からフレーム9から28をコピーする操作を要求する場合を仮定する。MEDITエンジン102は、最初のパスの間に全編集リスト108を通読して、前の編集要求の間にグル・セグメントがすでに生成されてグル・ファイルの中に記憶されているか否かを判別する。A.MPEGファイル124からのフレーム9から28のコピー操作のためにすでに存在するグル・セグメントはないと仮定すると、MEDITエンジン102は、制御オブジェクト111(例、ダイレクト−イン オブジェクト)を生成するコピー・オペレータ104を生成する。
【0036】
この実施の形態にあっては、制御オブジェクト111は、検索エンジン118を使用して、A.MPEGファイル124の中でコピーするために識別された適当なビデオ・フレームを検索する。特定のターゲット・ビデオ・フレームを検索することに関係するアルゴリズムは、図3から図8を参照して以下にさらに詳細に説明する。適当なフレームが検索されると、復号器は、最も前のI−フレーム6を復号して、復号器120にイン・グルセグメント内部のフレームを処理するための適当な情報(コンテキスト)を提供する。復号器120が適当な情報を獲得すると、フレーム9は、復号器120によって復号され、画素ビットマップに変換され、これがコピー・オペレータ104へ送られる。
【0037】
コピー・オペレータ104は、ビットマップ情報を、コピー・オペレータ104によって生成し符号器115を有する制御オブジェクト113(例、ダイレクト−アウト オブジェクト)へ送る。符号器115は、再符号化されたフレームをA.MPEGグル・ファイル126の中に記憶しているグル・オブジェクト116を呼び出す。図示のように、A.MPEGグル・ファイル126は、キャッシュ・メモリなどの記憶媒体140の中に記憶されている。フレーム9がI−フレームに再符号化されると、フレーム10から14も同様にして再符号化され、A.MPEGグル・ファイル126などの「イン・グル」ファイルを生成する。
【0038】
MEDITエンジン102は、通常、編集リスト108の中の各コピー要求のために個別のコピー・オペレータを生成することは理解されよう。したがって、編集リストの中の第二のコピー操作要求(すなわち、B.MPEGファイル、チャンネルNからのフレーム10から50)は、個別のコピー・オペレータ104によって処理され、これらのコピー・オペレータが、それ自身の検索および復号機能のために新しい制御オブジェクト111を生成し、また生成されたグル・フレームを符号化しておそらくは記憶媒体140に記憶されている他のグル・ファイルへ転送するための新しい制御オブジェクト113を生成する。
【0039】
一実施の形態にあっては、各コピー・オペレータの実行は、編集リスト108の中で識別されたすべての編集要求を迅速に処理する並行フォーマットの多重処理ユニットによって処理することができる。さらに、編集リストの中にはきまった評価順序は存在せず、また各編集操作は独立に行なうことができるので、並行処理は容易である。他の一実施の形態にあっては、インターネット・ビデオ・サーバーを用いて多重処理を行なうことができる。当業者には周知のように、インターネット・ビデオ・サーバーは、編集リスト108の中の編集要求を同時に処理するために用いることができる。
【0040】
やはり図2を参照して、編集リスト108の中の各コピー要求のために適当なグル・ファイルが生成されたら、MEDITエンジン102は、第二のパスで編集リスト108を通読し、編集リスト108の中で識別された各チャンネルのためにスティッチャ・オブジェクト147および148を生成する。図示の例では、チャンネル1およびチャンネルNのために生成された二つのスティッチャ・オブジェクトのみが示されているが、編集リスト108の中で識別されたチャンネルの数に応じて任意の数のスティッチャ・オブジェクトを生成できることは理解されよう。例として、実施の形態によっては、MPEG−2プラットホームの下の約4000のビデオ・チャンネルおよび約8000のオーディオ・チャンネルの多重チャンネルのためのスティッチャ・オブジェクトを含むようにすることができるものもある。
【0041】
各チャンネルのためにスティッチャ・オブジェクトが生成されると、各スティッチャ・オブジェクト147および148は、グル・オブジェクト130および131を生成することが好ましい。この実施の形態にあっては、各スティッチャ・オブジェクトは、編集リストを通読して関連するチャンネルのための編集要求をさがす。例として、スティッチャ・オブジェクト147は、編集リスト108を通読してチャンネル1のための編集要求を識別し、同様に、スティッチャ・オブジェクト148は、編集リスト108を通読してチャンネルNのための編集オペレータを識別する等々の構成とされる。グル・オブジェクト130および131が生成されると、グル・オブジェクト130は、各スティッチャ・オブジェクト147および148に、最初のパスの間に生成されたグル・データを提供する。
【0042】
この例では、グル・オブジェクト130は、コピーされたセグメントのために各種のグル・セグメントを引き出す任務をもつ。例として、グル・オブジェクト130は、A.MPEGグル・ファイル126の中に記憶されたグル・データを引き出してそれをスティッチャ・オブジェクト147に提供するものとすることもできる。さらに、なんらかのミドル・グルデータ(すなわち、切り取られたセグメントの未処理部分)が要求された場合、グル・オブジェクト130は、制御オブジェクト111によって制御されるストリーマ122へのポインタ134を用いる。このようにして、グル・オブジェクト130は、A.MPEGファイル124から正しいフレームを引き出すことができる。この実施の形態にあっては、ミドル・グルは、図1の表示順序ストリーム52内のフレーム15から23に関連させることができる。したがって、各スティッチャ・オブジェクト147および148は、グル・データを要求し、グル・オブジェクト130および131は、適当な位置からデータを引き出す。各スティッチャ・オブジェクトが、時系列的に要求されたデータを引き出すと、各スティッチャ・オブジェクトは、PESデータ・ストリームをMUXユニット150へ転送し、該ユニットは、引き出されたPESデータ・ストリームを多重化して、単一のストリームをMEDIT102を介してアプリケーション106へ送る。
【0043】
図3は、本発明の一実施の形態にもとづいてビデオ・ファイル内部でターゲット・フレームを検索することに関係するステップを示すフローチャートである。この方法では、ステップ600でビデオ・ファイルのフレーム・レートを求める。一般に、ビデオ・ファイルのフレーム・レートは、多重ファイルのビデオ部分のシーケンスヘッダ、とくに最初のビデオ・パケットのヘッダから求められる。上に述べたように、ビデオ・ファイルのフレーム・レートは、NTSCでは毎秒約30ビデオ・フレームであり、PALでは毎秒約25ビデオ・フレームである。
【0044】
ステップ600でビデオ・ファイルのフレーム・レートを求めたら、ステップ602へ進み、ビデオおよびオーディオをともに含むファイルのビット・レートを求める。当業者には周知のように、ビット・レートは、多重ストリームの中の最初のパックのパックヘッダ(例、MUXビット・レート)から求められる。ステップ602で1秒あたりのビット数としてのビット・レートが求められたら、ステップ604へ進み、ビデオ・ファイルの終わりから「バイト」であらわしたビデオ・ファイルの大きさが判別される。例として、適当な操作システムを用いれば、通常は、バイトであらわした読み取りファイルの大きさを確認することができる。したがって、ステップ604では、好ましくは、オペレーティング・システムによって多重ビデオ/オーディオ・ファイルの大きさがあたえられる。
【0045】
ステップ604でビデオ/オーディオ・ファイルの大きさが判別されたら、ステップ606へ進み、ビデオ・ファイルの全フレーム数の推定が行なわれる。例として、フレーム数は、ファイルの大きさにフレーム・レートを「掛け」、その積をビット・レートで割ることによって推定することができる。
【0046】
表1
フレーム数の推定値
S=ファイルの大きさ(バイト数)
B=ビット・レート(バイト数/秒)
R=フレーム・レート(フレーム数/秒)
T=全フレーム数の推定値(フレーム)
T=S×R/B
ステップ606で上に示した式にもとづいて全フレーム数の推定値を求めたら、ステップ608へ進み、ビデオ/オーディオ・ファイル内部のターゲット・ビデオ・フレームのバイト数であらわした時間位置を推定する。ビデオ・ファイル内部のターゲット・ビデオ・フレームの時間位置を推定するためには、ターゲット・ビデオ・フレーム番号にビット・レートを掛けて、フレーム・レートで割る。次に、求めた時間位置から1秒のバイト数を引いて、ターゲット・フレームの実際の位置の前にある位置に到達するようにする。
【0047】
Figure 0003706721
ビデオ・ターゲット・フレームの推定時間位置(ETP)は、ステップ608で上に示した式を用いて求められることは理解されよう。処理は、次にステップ610へ進み、次のGOPヘッダを読み取って、一時メモリ、例えばキャッシュ・メモリあるいは他の適当な記憶媒体に保管する。例として、次のGOPヘッダは、推定時間位置のすぐ後のGOPヘッダであることが好ましい。ステップ610で次のGOPヘッダが保管されたら、処理は、決定ステップ612へ進み、次のGOPヘッダ時間コードが、ターゲット・フレーム番号より大きいフレーム番号を示すか否かが判別される。
【0048】
例として、ターゲット・フレーム番号が、フレーム番号5525であり、GOPヘッダ時間コードが、フレーム番号5450を示したとすると、示されたフレーム番号は、ターゲット・フレーム番号より小さいことになる。当業者には周知のように、GOPヘッダが読み取られると、該GOPヘッダの中のSMPTE時間コードを読み取ることでフレーム番号が示される場合がある。MPEGの資料に示されているように、GOPヘッダに含まれるSMPTE時間コードを読み取って復号するために、任意の適当な周知のアルゴリズムを用いることができる。より詳しくは、MPEG資料「動画および関連オーディオの符号化」−−約1.5Mビット/秒までのデジタル記憶媒体用(第2部)、2−付録E、IEC規格、刊行物461、第二版、「ビデオ・テープ・レコーダー用時間および制御コード」(1986)(MPEG document "Coding of Moving Pictures and Associated Audio"--For digital storage media at up to about 1.5 Mbots/s (Part 2), 2-annex E, IEC Standard, Publication 461, second edition, entitled "Time and Control Code For Video Tape Recorders" )を参照されたい。MPEG資料は、すべて、参考資料として本出願に添付されている。
【0049】
したがって、次のGOPヘッダ時間コードがターゲット・フレーム番号より大きくないフレーム番号を示すと判別された場合には、処理は、ステップ610へ戻って、上に述べたように次のGOPヘッダが読み取られて保管される。次に、処理は、再びステップ612へ進んで、次のGOPヘッダ番号がターゲット・フレーム番号より大きいフレーム番号を示すか否かが再び判別される。他方、GOPヘッダ時間コードが、ターゲット・フレーム番号より大きいフレーム番号を示すと判別された場合には、処理は、ステップ614へ進む。
【0050】
ステップ614では、処理が1GOPヘッダだけ逆戻りし、GOPヘッダを「ターゲットGOPヘッダ」として識別する。すなわち、ターゲットGOPヘッダは、ターゲット・フレーム番号を含むGOPを画定するものである。さらに、前に読み取られた各GOPヘッダは保管されているので、1フレームの逆戻りは、単に処理を逆転させて保管されているGOPへ戻ることにしか過ぎない。このようにして、GOPヘッダ時間コードは、ターゲット・フレーム自身のフレーム番号かまたは少なくともターゲット・フレーム番号より大きくないフレーム番号を示すことになる。
【0051】
ステップ614で処理が1GOPヘッダだけ逆戻りしてGOPヘッダをターゲットGOPヘッダとした後、処理は、ステップ616へ進み、ターゲット・フレーム番号を検索するためにターゲットGOP内部のあらかじめ定められた数のフレームを読み取る。あらかじめ定められたターゲット・フレームの数が読み取られると、ターゲット・フレームが識別され、処理が完了する。
【0052】
図4は、ターゲットGOP内部であらかじめ定められた数のフレームを読み取ってターゲット・フレーム番号の検索を実行することに関係する処理ステップをより詳細に示した図である。処理は、ステップ618から始まり、このステップでは、ターゲット画像グループ(GOP)内部の次のフレームの画像ヘッダが読み取られる。上に述べたように、GOPヘッダは、一般に、I−フレームで始まるある数のビデオ・フレームの始まりを画定する。ターゲットGOP内部の最初のフレームのための画像ヘッダが読み取られたら、処理は、決定ステップ620へ進み、現在のフレームの時間表示番号にターゲットGOPヘッダ(例、SMPTE時間コード)から得られるフレーム番号を加えたものがターゲット・フレーム番号に等しいか否かが判別される。
【0053】
現在の時間基準フレーム番号にターゲットGOPヘッダから得られるフレーム番号を加算したものがターゲット・フレーム番号に等しくないと判別された場合には、処理は、再びステップ618へ進み、次のフレームの画像ヘッダが読み取られて復号される。ステップ618で次のフレームの画像ヘッダが読み取られて復号されると、処理は、再び決定ステップ620へ進む。決定ステップ620では、もう一度、現在の時間基準フレーム番号にターゲットGOPヘッダから得られるフレーム番号を加えたものがターゲット・フレーム番号に等しいか否かが判別される。この条件が満たされる場合には、処理は、ステップ622へ進んでターゲット・フレームが識別され、ターゲット・フレームの検索を実行する処理が完了する。
【0054】
ターゲット・フレームが識別されると、当該ターゲット・フレームのファイル・バイト・オフセットがわかり、記憶される。本明細書で使用する限りにおいて、ファイル・バイト・オフセットという用語は、ビデオ・ファイルの中でのファイルの始めに対するターゲット・フレームの位置として定義される。すなわち、ターゲット・フレームは、「0」バイト(すなわち、オフセットなし)に設定されるファイルの始めから判別されたバイト数である「ファイル・バイト・オフセット」だけファイル内に入り込んだ位置に位置ぎめすることができる。ターゲット・フレームに関するファイル・オフセットが知られているため、必要な場合には、単にターゲット・フレームの記憶されているファイル・バイト・オフセットを求めるだけで、ターゲット・フレームの内容に迅速にアクセスしてその内容を読み取ることができる。
【0055】
図5は、例として、本発明の一実施の形態の始点と終点をもつビデオ・ファイル702を示す線図である。図3のステップ608で説明したように、検索エンジンは、最初、飛び越しによってビデオ/オーディオ・ファイルの中の推定時間位置まで進む。図5に示すように、ビデオ・ファイルの中の推定位置への飛び越しが完了すると、GOPヘッダ710から得られるフレーム番号がターゲット・フレーム(例、ターゲット・フレーム5525)より大きいか否かが判別される。この例では、GOPヘッダ710は、ターゲット・フレーム5525より大きいビデオ・フレーム番号を示さない。
【0056】
したがって、処理は、次のGOPヘッダ712へ進み、再び、GOPヘッダ時間コードが例として挙げたターゲット・フレーム5525より大きいフレーム番号を示すか否かが判別される。説明のために、GOPヘッダ712から得られるフレーム番号が、再び、ビデオ・ターゲット・フレーム番号5525より大きくないと判別されたとする。処理は、もう一度次のGOPヘッダ714へ進むが、このGOPヘッダも、ターゲット・フレームより大きいフレーム番号を示さない。処理は、さらに次のGOPヘッダ716へ進む。この時点で、ついに、GOPヘッダ時間コードが、ターゲット・ビデオ・フレーム5525より大きいフレーム番号を示すと判別される。本発明の一実施の形態にあっては、図3のステップ614で説明したように、処理は、前の保管GOPヘッダ714へ逆戻りする。
【0057】
図5の拡大した704に示すように、GOPヘッダ714の後には多数のビデオ・フレームが続いている。すなわち、これら複数のビデオ・フレームが、画像グループを画定し、この画像グループは、I−フレーム5523(時間基準フレーム番号2)、B−フレーム5521(時間基準フレーム番号0)、B−フレーム5522(時間基準フレーム番号1)、P−フレーム5526(時間基準フレーム番号5)、B−フレーム5524(時間基準フレーム番号3)、およびB−フレーム5525(時間基準フレーム番号4)を有する。MPEG規格に記されているように、GOPヘッダ714のSMPTE時間コードから得られるフレーム番号は、矢印で示すB−フレーム5521である。これらさまざまな検索操作が行なわれている間、ビデオ・ファイルは、「符号化順序」にしたがっていることが理解されよう。しかし、各種の時間基準フレーム番号によって、適当な「表示順序」のどれかが識別されることになる。
【0058】
GOPヘッダ714から得られるフレーム番号は、フレーム番号5521であるため、検索エンジンは、ターゲット・フレーム5525から4フレームだけ離れていることになる。したがって、検索エンジンは、4番目の時間基準フレーム番号を識別する処理へ進む。この例では、4番目の時間基準フレーム番号は、「ターゲット・フレーム5525」である。図5の拡大した704に示すように、ターゲット・フレーム5525は、B−フレームである。
【0059】
図6Aは、本発明の一実施の形態における多重ビデオ/オーディオ・ファイル内のビデオ・フレーム数を効率的に判別するための処理ステップを示すフローチャートである。処理は、ステップ800で始まり、このステップでは、ビデオおよびオーディオ・ファイルの終わりがバイト数で識別される。上に述べたように、一般的に、任意の適当なオペレーティング・システムにおいては、通常のファイルを読み取り、その終わりを長さとして判別することができる。ステップ800でビデオ・ファイルの終わりが判別されると、処理は、ステップ802へ進み、検索エンジンは、バイト数で1秒だけ逆戻りする。説明をわかり易くするために、図6Bには、図6Aのフローチャートを用いて説明する開始時間と終了時間をもつファイル850の例を示してある。
【0060】
上に述べたように、検索エンジンは、好ましくは、例として示したファイル850の終わりからバイト数で1秒逆戻りして、点851に達する。検索エンジンがバイト数で1秒逆戻りすると、処理は、ステップ804へ進み、次のGOPヘッダが読み取られて保管される。例として、ファイル850では、次のGOPヘッダは、GOPヘッダ854として示されている。
【0061】
次に、処理は、決定ステップ806へ進み、検索エンジンが前方へ移動して、ビデオ・ファイルの中に次のGOPヘッダがあるか否かを判別する。例として示したファイル850は次のGOPヘッダ856を含んでいるため、検索エンジンは、次のGOPヘッダ856へ進み、このGOPヘッダが、図6Bに示すように適当に読み取られて保管される。次に、処理は、再び決定ステップ806へ進み、検索エンジンが前方へ移動して、ビデオ・ファイルの中に次のGOPヘッダがあるか否かを判別する。
【0062】
ビデオ・ファイルの中にはもうGOPヘッダはないので、処理は、ステップ808へ進み、検索エンジンは、前に保管したGOPヘッダ856へ逆戻りする。この時点で、検索エンジンは、ファイルの中の最後のGOPヘッダを識別している。したがって、ファイルの中の最後のビデオ・フレームはGOP856内部に置かれている。図6Bに示すように、検索エンジンが前に保管したGOPヘッダ856へくると、処理は、ステップ810へ進み、GOPヘッダ856に続く各フレームの画像ヘッダが読み取られる。このようにして、読み取られた各画像ヘッダの時間基準フレーム番号が判別されて保管される。
【0063】
図6Bの例として示したファイル850では、次のフレームは、時間基準フレーム番号「2」をもつ「I」フレーム15,523である。この番号は、一時的にメモリに保管される。処理は、ステップ812へ進み、次のフレームの画像ヘッダが読み取られ、時間基準フレーム番号が判別される。図6Bに示すように、次のフレームは、時間基準フレーム番号「0」をもつ「B」フレーム15,521であり、この番号は、保管される。この時点で、「前の」時間基準フレーム番号「2」と「現在の」時間基準フレーム番号「0」が保管されたことになる。
【0064】
次に、処理は、決定ステップ814へ進み、「現在」の時間基準フレーム番号「0」が「前の」時間基準フレーム番号「2」より大きいか否かが判別される。現在の時間基準フレーム番号「0」は前の時間基準フレーム番号「2」より大きくないので、処理は、ステップ815へ進み、他の画像ヘッダがあるか否かが判別される。他の画像ヘッダは存在しないので、処理は、ステップ816へ進み、現在の時間基準フレーム番号「0」をもつフレームは、無視される。
【0065】
処理は、再びステップ812へ進み、次の画像ヘッダが読み取られ、その時間基準フレーム番号が判別される。次のフレームは、時間基準フレーム番号「1」をもつ「B」フレームである。この時点で、「現在の」時間基準フレーム番号は「1」であり、「前の」時間基準フレーム番号は「2」である。ここで、処理は、決定ステップ814へ進み、「現在の」時間基準フレーム番号「1」が前の時間基準フレーム番号「2」より大きいか否かが判別される。現在の時間基準フレーム番号は前の時間基準フレーム番号より大きくないので、処理は、ステップ815へ進み、他の画像ヘッダがあるか否かが判別される。
【0066】
他の画像ヘッダは存在しないので、処理は、ステップ816へ進む。上に述べたように、現在の時間基準フレーム番号は無視されれ、処理は、再びステップ812へ進む。ステップ812では、時間基準フレーム番号「5」をもつ「P」フレーム15,526の画像ヘッダが読み取られる。この時点で、「現在の」時間基準フレーム番号は「5」であり、「前の」時間基準フレーム番号は「2」である。
【0067】
ここで再び、処理は、決定ステップ814へ進み、「現在の」時間基準フレーム番号「5」が前の時間基準フレーム番号「2」より大きいか否かが判別される。現在の時間基準フレーム番号は前の時間基準フレーム番号より大きいので、処理は、ステップ817へ進み、前の時間基準フレーム番号「2」をもつフレームは無視される。即ち、現在の時間基準フレーム番号「5」が前の時間基準フレーム番号「2」より大きいため、検索エンジンは、ファイルの中の最後に表示されるフレームの識別により近づくことになる。ファイルの中の最後に表示されるフレームが、ファイル内部に含まれるビデオ・フレームの正確な合計数を示すものであることはいうまでもない。ファイルの中の最後に表示可能なフレームは、「P」フレーム15,526であるが、検索エンジンは、上に述べたように、残るフレームを読み取ってこのことを確認しなければならない。
【0068】
したがって、処理は、決定ステップ818へ進み、他にも画像ヘッダが存在するか否かが判別される。他にも存在するため、処理は、ステップ812へ進み、次の画像ヘッダが読み取られ、時間基準フレーム番号が判別される。図6Bに示すように、次のフレームは、時間基準フレーム番号「3」をもつ「B」フレーム15,524である。したがって、「現在の」時間基準フレーム番号は「3」であり、「前の」時間基準フレーム番号は「5」である。
【0069】
ここで、処理は、決定ステップ814へ進み、「現在の」時間基準フレーム番号「3」が前の時間基準フレーム番号「5」より大きいか否かが判別される。この場合、現在の時間基準フレーム番号「3」は前の時間基準フレーム番号「5」より大きくないので、処理は、ステップ815へ進み、他の画像ヘッダがあるか否かが判別される。他の画像ヘッダは存在するので、処理は、ステップ816へ進み、現在の時間基準フレーム番号「3」をもつフレームは、無視される。処理は、次にステップ812へ進み、次の画像ヘッダが読み取られ、その時間基準フレーム番号が判別される。
【0070】
図6Bに示すように、次のフレームは、時間基準フレーム番号「4」をもつ「B」フレームである。したがって、「現在の」時間基準フレーム番号は「4」であり、「前の」時間基準フレーム番号は「5」である。ここで、処理は、決定ステップ814へ進み、現在の時間基準フレーム番号が前の時間基準フレーム番号より大きいか否かが判別される。この場合、現在の時間基準フレーム番号「4」は前の時間基準フレーム番号「5」より大きくない。次に、処理は、ステップ815へ進み、他の画像ヘッダがあるか否かが判別される。
【0071】
図6Bの例では、「B」フレーム15,525の後には画像ヘッダは存在しないので、処理は、ステップ819へ進み、現在の時間基準フレーム番号「4」をもつフレームは、無視される。この時点で、残る唯一のフレームは、時間基準フレーム番号「5」をもつ「P」フレーム15,526である。これで、検索エンジンは、時間基準フレーム番号が最も大きい画像ヘッダをもつフレームを確認し、それより小さい時間基準フレーム番号をもつフレームはすべて無視したことになる。
【0072】
処理は、次に、ステップ820へ進み、識別された時間基準フレーム番号が、GOPヘッダSMPTE時間コードから判別されたフレーム番号に加えられる。上に述べたように、MPEG資料に示されておりまた参考資料として本出願に添付した周知のアルゴリズムを用いて、GOPヘッダSMPTEから絶対フレーム番号を判別することができる。MPEG資料に示されているように、得られる絶対フレーム番号は、「B」フレーム15,521である。
【0073】
フレームが識別されたら、それが、上に識別した時間基準フレーム番号「5」に加えられる。即ち、最後のフレーム番号は、(15,521+5=15,526)である。この時点で、検索エンジンは、「P」フレームをフレーム番号「15,526」をもつ最後のフレームとして正しく識別したことになる。検索エンジンは、ファイルの中の各フレームを手間をかけて読み取って復号する必要なしに、図6Bに例として示したファイル850の中のビデオ・フレームの数を正確に判別したことになる。
【0074】
図7は、本発明の一実施の形態における、複数のオーディオおよびビデオ・パケットをもつシステム・ストリーム900を示す線図である。図7は、「システム・クロック」のシステム・ストリーム900内部でターゲット・ビデオ・フレーム918の位置を判別するための図8に記した処理ステップを視覚的に示す図である。ターゲット・ビデオ・フレーム918の位置が判別されれば、最も近いオーディオ・フレームを識別することができ、それによって「オーディオ−ビデオ」検索が完了する。
【0075】
MPEG資料に記載されているように、ビデオおよびオーディオ構成要素がともに確実に同期化されるようにするためのタイミング機構が配設される。一般的に、MPEG規格は、システム・クロック基準(SCR)および同期を維持しまた適当な再生を確保するために33ビットを用いて符号化された再生タイムスタンプ(PTS)をともに識別する。さらに、システム・クロックは、一般に、約90kHzで作動する。
【0076】
完全さのために、図7は、システム・ストリームの左端に位置するオーディオ・パケット902、および、それに続くビデオ・パケット904、その後のビデオ・パケット906、その後の他のビデオ・パケット908、およびその後のオーディオ・パケット910を示す。また、ビデオ・パケット904を拡大して、パケット・ヘッダ911、複数の画像ヘッダ912、914、および916を識別したものも示されている。この例では、画像ヘッダ916が、ターゲット・ビデオ・フレーム918の画像ヘッダである。
【0077】
図8のフローチャートに示すオーディオ−ビデオ検索を行なうための処理は、ステップ950で始まり、このステップで、ターゲット・ビデオ・フレーム918の画像ヘッダ916とビデオ・パケット・ヘッダ911の間に配置されている画像ヘッダの数が判別される。この例では、画像ヘッダの数は、「2」であると判別される。すなわち、画像ヘッダ912および914である。もちろん、ターゲット・ビデオ・フレーム画像ヘッダ916とビデオ・パケット・ヘッダ911の間に配置されている画像ヘッダがない場合には、画像ヘッダの数は、「0」である。
【0078】
次に、処理は、ステップ952へ進み、図7のパケット・ヘッダ911から「フレームあたりのシステム・クロック」であらわしたビデオ・パケットタイムスタンプが読み取られる。「フレームあたりのシステム・クロック」としてのビデオ・パケットタイムスタンプは、任意のビデオ・フレーム周波数を用いて判別することができる。例として、30フレームのフレーム周波数を用いた場合には、フレームあたりのシステム・クロックは、下の表から判別することができる。
【0079】
Figure 0003706721
次に、処理は、ステップ954へ進み、「ビデオ・フレームあたりのシステム・クロック」(すなわち、3,000)にターゲット・ビデオ・フレーム画像ヘッダ916とビデオ・パケット・ヘッダ911の間に配置されている画像ヘッダの数が乗算される。ステップ950で判別されたように、この例では、「2」つの画像ヘッダが配置されている。したがって、フレームあたりの3,000システムクロックに2フレームが乗算され、6,000システム・クロックの値が得られる。次に、パケットタイムスタンプに関するクロック数が6,000システム・クロックに加算され、システム・クロックであらわしたターゲット・ビデオ・フレーム画像ヘッダ916の位置が示される。この時点で、検索エンジンは、例として示した図7のファイル900内部のどこに、システム・クロックであらわしたターゲット・ビデオ・フレーム918が存在するかをすでに判別している。
【0080】
他方、ステップ950で、ターゲット・ビデオ・フレーム画像ヘッダ916とビデオ・パケット・ヘッダ911の間に配置されている画像ヘッダが存在しないと判別されると、フレームあたり3,000のシステム・クロックに「0」が乗算され、システム・クロックの数は0となる。したがって、ターゲット・ビデオ・フレーム画像ヘッダ916のためのシステム・クロックは、「パケットタイムスタンプ」自身に関するシステム・クロックのみとなる。この時点で、検索エンジンは、パケット・ヘッダ911とターゲット・ビデオ・フレーム画像ヘッダ916の間に存在する画像ヘッダのない特殊な場合においても、例とし示した図7のファイル900内部のどこに、システム・クロックであらわしたターゲット・ビデオ・フレーム918が存在するかをすでに判別している。
【0081】
ターゲット・ビデオ・フレーム918のシステム・クロックであらわした位置が判別されると、処理は、ステップ956へ進み、判別されたシステム・クロックの合計が一時メモリに保管される。あるいは、適当なポインタを用いて、システム・クロックであらわしたターゲット・フレームの位置を示すこともできる。次に、処理は、ステップ958へ進み、システム・クロックであらわしてターゲット・ビデオ・フレーム918に最も近いオーディオ・フレームを含むオーディオ・パケットが識別される。例として、最も近いオーディオ・パケットは、最も先行するオーディオ・パケットであることが好ましい。図7の例では、これは、オーディオ・パケット902である。ただし、他の実施の形態にあっては、最も近いオーディオ・フレームは、例えばオーディオ・パケット910のような、その後に続くオーディオ・パケットにあるとすることもできる。
【0082】
ステップ958で適当なオーディオ・パケットが識別されると、処理は、ステップ960へ進み、ビデオ・パケットについて上に説明したとほぼ同様にして適当なオーディオ・パケット内での検索が行なわれる。もちろん、選ばれたオーディオ・パケット内部でのオーディオ・フレームの適当な位置を求めるためには、特定のMPEGオーディオ規格、オーディオ・フレーム・レートおよびオーディオ・ビット・レートが用いられる。この時点で、「オーディオ−ビデオ」検索を行なう処理は完了する。
【0083】
本発明では、コンピュータ・システムに記憶されたデータを用いるさまざまなコンピュータが実行する操作が用いられる。これらの操作は、物理量の物理的処理を必要とする操作である。通常、これらの量は、記憶、転送、組み合わせ、比較、その他の処理が可能な電気信号または磁気信号の形をとるが、必ずしもそれに限定されるものではない。さらに、行なわれる処理は、生成、識別、判別、または比較などと呼ばれる場合が多い。
【0084】
本明細書に記載されまた本発明の一部をなす操作は、すべて、有用なマシン・オペレーションである。本発明は、また、これらの操作を行なうための装置に関するものである。装置は、必要な目的の達成のために特別につくることもできるし、あるいは、コンピュータに記憶されているコンピュータ・プログラムによって選択的に活性化されあるいは構成される汎用コンピュータとすることもできる。とくに、本発明の開示内容にもとづいて書かれたコンピュータ・プログラムには、さまざまな汎用マシンを用いることもできるし、あるいは、必要な操作を行なうためのより専門的な装置をつくるのが好便な場合もある。本発明の構成例を以下に示す。
【0085】
図9は、本発明にもとづく処理を行なうためのコンピュータ・システム1300の例を示すブロック線図である。コンピュータ・システム1300は、デジタル・コンピュータ1302、表示画面(モニター)1304、プリンタ1306、フロッピー・ディスク・ドライブ1308、ハード・ディスク・ドライブ1310、ネットワーク・インターフェース1312、およびキーボード1314を含む。デジタル・コンピュータ1302は、マイクロプロセッサ1316、メモリ・バス1318、ランダム・アクセス・メモリ(RAM)1320、読み取り専用メモリ(ROM)1322、周辺バス1324、キーボード・コントローラ1326を含む。デジタル・コンピュータ1302は、パーソナル・コンピュータ(例えば、IBMコンパティブルなパーソナル・コンピュータ、マッキントッシュ・コンピュータ、またはマッキントッシュ・コンピュータとコンパティブルなコンピュータ)、ワークステーション・コンピュータ(例えば、サン・マイクロシステムズまたはヒューレット・パッカードのワークステーション)、あるいは他の種類のコンピュータとすることができる。
【0086】
マイクロプロセッサ1316は、汎用デジタル・プロセッサで、コンピュータ・システム1300の操作を制御する。マイクロプロセッサ1316は、1−チップのプロセッサとすることもできるし、あるいは多数の構成要素で実装することもできる。マイクロプロセッサ1316は、メモリから検索された命令を用いて、入力データの受信と処理、および出力装置へのデータの出力と表示を制御する。本発明に関しては、マイクロプロセッサ1316の特定の機能として、MPEGビデオおよびオーディオ・ストリーム内部での検索に関係する処理を補助する機能を挙げることができる。
【0087】
メモリ・バス1318は、マイクロプロセッサ1316がRAM1320およびROM1322にアクセスするために使用する。RAM1320は、マイクロプロセッサ1316が一般記憶域としてまたスクラッチ・パッド・メモリとして使用し、また、入力データおよび処理ずみデータを記憶するために使用することもできる。ROM1322は、マイクロプロセッサ1316が実行する命令およびプログラム・コードならびに他のデータを記憶するために用いることができる。
【0088】
周辺バス1324は、デジタル・コンピュータ1302が入力、出力、および記憶装置にアクセスするために用いられる。記載の実施の形態にあっては、これらの装置は、表示画面1304、プリンタ装置1306、フロッピー・ディスク・ドライブ1308、ハード・ディスク・ドライブ1310、およびネットワーク・インターフェース1312を含む。キーボード・コントローラ1326は、キーボード1314から入力を受け取り、押された各キーの復号されたシンボルをバス1328を介してマイクロプロセッサ1316へ送るために用いられる。
【0089】
表示画面1304は、マイクロプロセッサ1316によって周辺バス1324を介して供給されるか、またはコンピュータ・システム1300の他の構成要素によって供給されるデータの映像を表示する出力装置である。プリンタ装置1306は、プリンタとして作動する場合には、紙などの上に映像を出力する。プリンタ装置1306の代わりにあるいはそれに加えて、プロッター、タイプセッター等々の他の出力装置も使用することができる。
【0090】
フロッピー・ディスク・ドライブ1308およびハード・ディスク・ドライブ1310は、各種のデータを記憶するために用いることができる。フロッピー・ディスク・ドライブ1308は、各種データの他のコンピュータ・システムへの移送を容易にし、ハード・ディスク・ドライブ1310は、記憶されている大量のデータへの高速アクセスを可能にする。
【0091】
マイクロプロセッサ1316は、オペレーティング・システムと組み合わされて、コンピュータ・コードを実行し、データを生成しまた使用する。これらのコンピュータ・コードおよびデータは、RAM1320、ROM1322、またはハード・ディスク・ドライブ1310に常駐することができる。コンピュータ・コードおよびデータは、また、取りはずし自在のプログラム媒体に常駐し、また、必要なときにはコンピュータ・システム1300にロードまたはインストールすることができる。取りはずし自在のプログラム媒体は、例えば、CD−ROM、PC−CARD、フロッピー・ディスク、および磁気テープを含む。
【0092】
ネットワーク・インターフェース1312は、他のコンピュータ・システムに接続されたネットワークを介してデータを送受信するために用いられる。インターフェース・カードまたは類似の装置およびマイクロプロセッサ1316によって実装された適当なソフトウエアを用いれば、コンピュータ・システム1300を現存のネットワークへ接続し、標準プロトコルにしたがってデータを転送することができる。
【0093】
キーボード1314は、ユーザーがこれを用いてコマンドおよび他の命令をコンピュータ・システムへ入力するものである。本発明に関連して他の種類の入力装置を使用することもできる。例えば、コンピュータ・マウス、トラック・ボール、スタイラス(尖筆)、またはタブレットなどの指示具を用いて、汎用コンピュータの画面上のポインタを操作することもできる。
【0094】
本発明は、コンピュータが読み取り可能な媒体上のコンピュータが読み取り可能なコードとして実施することもできる。コンピュータが読み取り可能な媒体とは、データを記憶することができ、そのデータを後にコンピュータ・システムで読み取ることのできる任意のデータ記憶装置を意味する。コンピュータが読み取り可能な媒体としては、例として、読み取り専用メモリ、ランダム・アクセス・メモリ、CD−ROM、磁気テープ、光学データ記憶装置を含む。コンピュータが読み取り可能な媒体は、また、ネットワークで連結された複数のコンピュータ・システムに分散させて、コンピュータが読み取り可能なコードが分散式に記憶され実行されるようにすることもできる。
【0095】
上に説明したMPEGオーディオおよびビデオ規格で、参考資料として本出願に添付するものは以下の通りである。すなわち、(1)「動画および関連するオーディオ情報の総称的符号化:ビデオ」、ISO/IEC13818−2("Generic Coding of Moving Pictures and Associated Audio Information: Video," ISO/IEC 13818-2)と題する文書、(2)「デジタル記憶媒体のための、約1.5Mビット/秒までの動画および関連するオーディオの符号化」(第1部システム、第2部ビデオ、第3部オーディオ)11171/11172(1995/1996)("Coding of Moving Picutres and Associated Audio for Digital Storage Media at up to about 1.5 MBit/s" (Part 1 System, Part 2 Video, Part 3 Audio) 11171/11172 (1995/1996))、と題する文書、および(3)「動画および関連するオーディオ情報の総称的符号化」、13818−3("Generic Coding of Moving Pictures and Associated Audio Information" ISO/IEC 13818-3)と題する文書である。上に挙げたMPEG規格文書および将来のMPEG規格文書は、すべて、スイス国ジュネーブ20、CH−1211、ISO/IEC私書箱56( ISO/IEC Case Postale 56, CH-1211, Geneva 20, Switzerland )に依頼すれば、入手可能である。
【0096】
以上、本発明の好ましい実施の形態を詳細に説明したが、本発明は、その意図および範囲を逸脱することなく他の形態で実施できるも理解されよう。説明した実施の形態では分散型アーキテクチャーが記載されている。この種のアーキテクチャーは、とくにモジュール構成の面からまた新しい機能の導入の面から多くの効果をもつ。例えば、単に検索エンジン、復号器等々多くの同じ構成要素を利用することのできる追加の「プラグ・イン」オペレータオブジェクトを配設することによって、新しい機能を生成することができる。さらに、上に述べた検索機能は、MPEG以外の規格によって定義されたオーディオビジュアル・ファイル内部でターゲット・フレームを検索し識別するためにも用いることができる。
【0097】
上に述べたようなアーキテクチャーは、とくによく機能すると考えられるが、他のアーキテクチャーを用いても同様な機能を得られることは、理解されよう。したがって、上に述べた例および実施の形態は、単に例示であって本発明を制限するものではなく、本発明は、本明細書に記されている詳細に限定されず、添付の特許請求の範囲内で修正が可能であると思料すべきでものある。
【0098】
【発明の効果】
本発明は、数多くの効果をもたらすが、とくに大きな効果は、ターゲット・ビデオ・フレームを検索する前あるいはオーディオビジュアル・ファイルのビデオ・フレームの数を判別する前に、手間をかけてオーディオビジュアル・ファイルの中の各ビデオ・フレームを読み取り、指標付けを行なう必要がないことである。
【図面の簡単な説明】
【図1】本発明の一実施の形態にもとづいたビデオ・ファイルの編集に関係する処理ステップを説明するために示した多数のビデオ・フレーム・シーケンスの例である。
【図2】本発明の一実施の形態にもとづいたビデオ・ファイルの編集を示すデータ・フロー・アーキテクチャーの図である。
【図3】本発明の一実施の形態にもとづいたビデオ・ファイル内部でのターゲット・フレームの検索に関係するステップを示すフローチャートである。
【図4】本発明の一実施の形態にもとづいたあらかじめ定められた数のフレームの読み取りに関係する方法のステップを説明する図である。
【図5】本発明の一実施の形態にもとづいたビデオ・ファイルを示す線図である。
【図6A】本発明の一実施の形態にもとづいた多重オーディオビジュアル・ファイルの中のビデオ・フレームの数を効率的に判別するための方法のステップを示すフローチャートである。
【図6B】本発明の一実施の形態にもとづいたビデオ・ファイルの例を示す図である。
【図7】本発明の一実施の形態にもとづいた多数のオーディオおよびビデオ・パケットを有するシステム・ストリームを示す線図である。
【図8】本発明の一実施の形態にもとづいたオーディオ−ビデオ検索を行なうことに関係する方法のステップを示すフローチャートである。
【図9】本発明の一実施の形態にもとづいたオーディオビジュアル編集および検索ステップを行なうためのコンピューター・システムの例を示すブロック線図である。
【符号の説明】
100…データ・フロー・アーキテクチャー、102…編集エンジン、104…コピー・オペレータ、106…アプリケーション、108…編集リスト、110…チャンネル・オペレータ、111…制御オブジェクト、112…機能オペレータ、113…制御オブジェクト、114…終端オペレータ、115…符号器、116…グル・オブジェクト、118…検索エンジン、120…復号器、122…ストリーマ、124…MPEGファイル、126…MPEGグル・ファイル、130,131…グル・オブジェクト、134…ポインタ、140…記憶媒体、147,148…スティッチャ・オブジェクト、150…マルチプレクサ、702…ビデオ・ファイル、710,712,714,716…GOPヘッダ、850…ファイル、854,856…GOPヘッダ、900…システム・ストリーム、902…オーディオ・パケット、904,906,908…ビデオ・パケット、910…オーディオ・パケット、911…パケット・ヘッダ、912,916…画像ヘッダ、918…ターゲット・ビデオ・フレーム、1300…コンピュータ・システム、1302…デジタル・コンピュータ、1304…表示画面、1306…プリンタ、1308…フロッピー・ディスク・ドライブ、1310…ハード・ディスク・ドライブ、1312…ネットワーク・インターフェース、1314…キーボード、1316…マイクロプロセッサ、1318…メモリ・バス、1320…ランダム・アクセス・メモリ、1322…読み取り専用メモリ、1324…周辺バス、1326…キーボード・コントローラ、1328…バス。

Claims (6)

  1. 複数の画像グループを有するオーディオビジュアル・ファイルのバイトサイズと、前記オーディオビジュアル・ファイルのビット・レートおよびフレーム・レートを用いて、次式(1)により、前記オーディオビジュアル・ファイルに含まれる全フレーム数を推定する第1のステップと、
    T=S×R/B・・・・・・・・・・・・(1)
    式中、T=全フレーム数の推定値(フレーム)
    S=ファイルの大きさ(バイト数)
    B=ビット・レート(バイト数/秒)
    R=フレーム・レート(フレーム数/秒)
    前記全フレーム数と、前記オーディオビジュアル・ファイルのバイトサイズと、検索対象の目的のフレーム番号とを用いて、次式(2)により、検索対象の目的のフレームの推定時間位置をバイト数で求める第2のステップと、
    ETP=F×S/T ・・・・・・・・・(2)
    式中、ETP=ターゲット・ビデオ・フレームの推定時間位置
    F=ターゲット・フレーム番号
    S=ファイルの大きさ(バイト数)
    T=全フレーム数の推定値(フレーム)
    前記バイト数に基づいて、前記オーディオビジュアル・ファイル内の検索対象の目的の前記推定時間位置を含む画像グループの先頭にアクセス開始位置を位置付ける第3のステップと、
    を含むことを特徴とするオーディオビジュアル・ファイル内部での検索方法。
  2. 請求項1記載のオーディオビジュアル・ファイル内部での検索方法において、
    前記オーディオビジュアル・ファイルの前記ビット・レートおよび前記フレーム・レートは、前記オーディオビジュアル・ファイルの再生時のビット・レート、およびフレーム・レートからなることを特徴とするオーディオビジュアル・ファイル内部での検索方法。
  3. 請求項1記載のオーディオビジュアル・ファイル内部での検索方法において、
    前記第3のステップでは、前記第2のステップで得られた前記バイト数の位置から、所定の時間分のバイト数だけ前記オーディオビジュアル・ファイルの先頭側に逆上った位置に前記アクセス位置を位置付け、当該アクセス開始位置以降に存在する各フレームのフレーム番号と、前記検索対象の目的の前記フレーム番号の大小関係を判定する操作を各フレーム毎に反復して、目的の前記フレーム番号の前記フレームの先頭部分にアクセス開始位置を位置付けることを特徴とするオーディオビジュアル・ファイル内部での検索方法。
  4. 複数の画像グループを有する編集対象のオーディオビジュアル・ファイルが格納される第1の記憶媒体と、
    オーディオビジュアル・ファイルのバイトサイズと、前記オーディオビジュアル・ファイルのビット・レートおよびフレーム・レートを用いて、次式(1)により、前記オーディオビジュアル・ファイルに含まれる全フレーム数を推定する第1のステップと、
    T=S×R/B・・・・・・・・・・・・(1)
    式中、T=全フレーム数の推定値(フレーム)
    S=ファイルの大きさ(バイト数)
    B=ビット・レート(バイト数/秒)
    R=フレーム・レート(フレーム数/秒)
    前記全フレーム数と、前記オーディオビジュアル・ファイルのバイトサイズと、検索対象の目的のフレーム番号とを用いて、次式(2)により、検索対象の目的のフレームの推定時間位置をバイト数で求める第2のステップと、
    ETP=F×S/T ・・・・・・・・・(2)
    式中、ETP=ターゲット・ビデオ・フレームの推定時間位置
    F=ターゲット・フレーム番号
    S=ファイルの大きさ(バイト数)
    T=全フレーム数の推定値(フレーム)
    前記バイト数に基づいて、前記オーディオビジュアル・ファイル内の検索対象の目的の前記推定時間位置を含む画像グループの先頭にアクセス開始位置を位置付ける第3のステップと、によって、前記記憶媒体の前記オーディオビジュアル・ファイル内部の任意の編集対象データを選択的に切り出して任意の第2の記憶媒体に保管する操作を行う検索制御部と、
    前記第2の記憶媒体に保管された前記編集対象データを読出して、任意のオーディオビジュアル・ファイルの一部に組み込んで出力する操作を行う編集制御部と、
    を含むことを特徴とするオーディオビジュアル・ファイル内部での検索装置。
  5. 請求項4記載のオーディオビジュアル・ファイル内部での検索装置において、
    前記検索制御部は、
    前記オーディオビジュアル・ファイルが、それ自体で独立して復号可能な第1のフレームと、過去のフレームのデータに依存する第2のフレームと、過去および未来のフレームの双方のデータに依存する第3のフレームとを含む場合、
    前記編集対象データの先頭部分の前記フレームが過去または過去および未来のフレームのデータに依存する前記第2または第3のフレームである時、より過去のフレームのデータを含めた復号化および前記第1のフレームへの再符号化を行う第1の操作、
    前記編集対象データの後端部分が、前記フレームが未来のフレームのデータに依存する第3のフレームである時、より未来の前記フレームのデータを含めた復号化および前記第1または第2のフレームへの再符号化を行う第2の操作、
    の少なくとも一方の操作を実行することを特徴とするオーディオビジュアル・ファイル内部での検索装置。
  6. 請求項4または5記載のオーディオビジュアル・ファイル内部での検索装置において、
    前記検索制御部および前記編集制御部は、外部から与えられる編集制御情報が格納された編集リストに基づいて、任意のオーディオビジュアル・ファイルからの前記編集対象データの切り出し操作および組み込み操作を自動的に実行する機能を備えたことを特徴とするオーディオビジュアル・ファイル内部での検索装置。
JP31328697A 1996-11-15 1997-11-14 オーディオビジュアル・ファイル内部での検索方法および検索装置 Expired - Fee Related JP3706721B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US3095596P 1996-11-15 1996-11-15
US60/030955 1996-11-15

Publications (2)

Publication Number Publication Date
JPH10262210A JPH10262210A (ja) 1998-09-29
JP3706721B2 true JP3706721B2 (ja) 2005-10-19

Family

ID=21856891

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31328697A Expired - Fee Related JP3706721B2 (ja) 1996-11-15 1997-11-14 オーディオビジュアル・ファイル内部での検索方法および検索装置

Country Status (2)

Country Link
US (1) US6157771A (ja)
JP (1) JP3706721B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210409473A1 (en) * 2017-07-20 2021-12-30 Disney Enterprises, Inc. Frame-accurate video seeking via web browsers

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6661430B1 (en) * 1996-11-15 2003-12-09 Picostar Llc Method and apparatus for copying an audiovisual segment
US6208655B1 (en) * 1996-11-27 2001-03-27 Sony Europa, B.V., Method and apparatus for serving data
WO1998041016A1 (fr) * 1997-03-13 1998-09-17 Sony Corporation Equipement et procede pour enregistrer et reproduire de l'image et le son
JP4303798B2 (ja) * 1997-09-11 2009-07-29 ソニー株式会社 撮像装置、編集装置及び編集システム
JP3786151B2 (ja) * 1997-11-05 2006-06-14 ソニー株式会社 編集装置及び編集方法
JP3665456B2 (ja) * 1997-11-19 2005-06-29 株式会社東芝 映像情報の記録再生システム及び同システムに適用する映像編集方法
JP4045651B2 (ja) * 1997-11-19 2008-02-13 ソニー株式会社 情報処理装置、情報処理方法及びプログラム記録媒体
KR100252108B1 (ko) * 1997-12-20 2000-04-15 윤종용 Mpeg 압축부호화 및 복호화기를 채용한 디지털 기록 재생장치 및 그 방법
JP4412749B2 (ja) * 1997-12-26 2010-02-10 富士フイルム株式会社 デジタルカメラ及びデジタルカメラにおける画像処理方法
JP3349964B2 (ja) * 1998-11-02 2002-11-25 沖電気工業株式会社 画像復号化装置
WO2000064156A1 (fr) * 1999-04-16 2000-10-26 Sony Corporation Procede de transmission de donnees et emetteur de donnees
JP2000350156A (ja) * 1999-06-09 2000-12-15 Hitachi Ltd 動画像情報の記憶方法及びこれを記録した記録媒体
US6850692B1 (en) * 1999-12-23 2005-02-01 Ati International Srl Method and apparatus for retrieving digital video using successive linear approximation
US6693959B1 (en) * 2000-03-03 2004-02-17 Ati International Srl Method and apparatus for indexing and locating key frames in streaming and variable-frame-length data
JP2001358980A (ja) * 2000-06-14 2001-12-26 Ricoh Co Ltd デジタルカメラ
JP4593645B2 (ja) * 2000-12-08 2010-12-08 シャープ株式会社 データ記録装置およびデータ再生装置
US7106944B2 (en) * 2001-05-30 2006-09-12 Nokia Corporation System and method for jumping to a timepoint in a MPEG file
KR100405975B1 (ko) * 2001-09-26 2003-11-14 엘지전자 주식회사 Pvr에서의 스트림 점프 방법
JP2006509389A (ja) 2002-12-05 2006-03-16 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ データフレームの編集
US20050008240A1 (en) * 2003-05-02 2005-01-13 Ashish Banerji Stitching of video for continuous presence multipoint video conferencing
US9648281B2 (en) 2005-05-23 2017-05-09 Open Text Sa Ulc System and method for movie segment bookmarking and sharing
EP2309738A1 (en) * 2005-05-23 2011-04-13 Thomas S. Gilley Distributed scalable media environment
US8141111B2 (en) 2005-05-23 2012-03-20 Open Text S.A. Movie advertising playback techniques
US8145528B2 (en) 2005-05-23 2012-03-27 Open Text S.A. Movie advertising placement optimization based on behavior and content analysis
US20070220118A1 (en) * 2006-03-15 2007-09-20 Loyer Douglas E Systems, Methods, and Apparatus for Delivering Randomly Accessible Audio and Video Media
US7975225B2 (en) * 2007-05-02 2011-07-05 Microsoft Corporation Iteratively locating a position corresponding to a desired seek time
AU2009202041A1 (en) * 2008-05-26 2009-12-10 Aristocrat Technologies Australia Pty Limited A gaming system and a method of gaming
KR101003922B1 (ko) * 2008-08-04 2010-12-30 인하대학교 산학협력단 멀티미디어 서비스를 제공하기 위한 스케쥴링 방법
JP2011253589A (ja) * 2010-06-02 2011-12-15 Funai Electric Co Ltd 画像音声再生装置
KR101727316B1 (ko) * 2010-10-08 2017-04-17 삼성전자 주식회사 비디오 재생장치 및 그 위치탐색방법
EP2978225B1 (en) * 2014-07-23 2017-11-08 Wildmoka Method for obtaining in real time a user selected multimedia content part
CN115171241B (zh) * 2022-06-30 2024-02-06 南京领行科技股份有限公司 一种视频帧定位方法、装置、电子设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60102769U (ja) * 1983-12-14 1985-07-13 パイオニア株式会社 記録情報再生装置
JP3509080B2 (ja) * 1993-10-15 2004-03-22 ソニー株式会社 データ再生装置
US5809201A (en) * 1994-06-24 1998-09-15 Mitsubishi Denki Kabushiki Kaisha Specially formatted optical disk and method of playback
JP3491366B2 (ja) * 1995-01-31 2004-01-26 ソニー株式会社 符号化データの特殊再生方法および特殊再生装置
MX9707116A (es) * 1995-03-20 1998-02-28 Closures & Packaging Serv Ltd Aparato para grabacion de informacion de imagen y metodo para grabacion de informacion de imagen.
JP3484834B2 (ja) * 1995-07-28 2004-01-06 ソニー株式会社 データ符号化/復号化方法および装置
JP3532332B2 (ja) * 1995-11-10 2004-05-31 パイオニア株式会社 画像情報再生装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20210409473A1 (en) * 2017-07-20 2021-12-30 Disney Enterprises, Inc. Frame-accurate video seeking via web browsers
US11722542B2 (en) * 2017-07-20 2023-08-08 Disney Enterprises, Inc. Frame-accurate video seeking via web browsers

Also Published As

Publication number Publication date
JPH10262210A (ja) 1998-09-29
US6157771A (en) 2000-12-05

Similar Documents

Publication Publication Date Title
JP3706721B2 (ja) オーディオビジュアル・ファイル内部での検索方法および検索装置
US6285361B1 (en) Method and apparatus for clipping video segments from an audiovisual file
US6262777B1 (en) Method and apparatus for synchronizing edited audiovisual files
US6546189B1 (en) Method and apparatus for editing compressed moving pictures and storage medium
US8942539B2 (en) Method of setting a system time clock at the start of an MPEG sequence
US6337880B1 (en) Indexing for motion video that is compressed using interframe and intraframe techniques
US9390754B2 (en) Video trick mode system
JP3768662B2 (ja) オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体
KR100725631B1 (ko) 전이 스트림 발생 및 처리를 위한 방법
JP4503858B2 (ja) 遷移ストリームの生成/処理方法
JP4270379B2 (ja) デジタル情報の効率的な伝送および再生
US6400886B1 (en) Method and apparatus for stitching edited video segments
US20060251289A1 (en) Data processing apparatus and method
WO2000014741A1 (fr) Procede et dispositif de gestion de fichier multimedia
US8126312B2 (en) Use of multiple related timelines
US6201925B1 (en) Method and apparatus for editing video files
US6314139B1 (en) Method of inserting editable point and encoder apparatus applying the same
JP2007048378A (ja) 記録装置、記録方法、記録方法のプログラム及び記録方法のプログラムを記録した記録媒体
EP0685967B1 (en) Compressed television signal recording and reproducing apparatus
US20070154185A1 (en) Method and system for transcoding video information to enable digital video recording (DVR) trick modes
US20070201828A1 (en) Method and device for generating a menu
US20130287361A1 (en) Methods for storage and access of video data while recording
JP3325464B2 (ja) 動画像処理装置
US8514949B1 (en) Synchronous, multi-stream decoder
JP2000023090A (ja) 圧縮動画像編集装置および記憶媒体

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040921

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050421

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050712

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050801

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080805

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090805

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100805

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110805

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120805

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130805

Year of fee payment: 8

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees