JP3768662B2 - オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体 - Google Patents

オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体 Download PDF

Info

Publication number
JP3768662B2
JP3768662B2 JP31566797A JP31566797A JP3768662B2 JP 3768662 B2 JP3768662 B2 JP 3768662B2 JP 31566797 A JP31566797 A JP 31566797A JP 31566797 A JP31566797 A JP 31566797A JP 3768662 B2 JP3768662 B2 JP 3768662B2
Authority
JP
Japan
Prior art keywords
frame
audio frame
audio
audiovisual
segment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP31566797A
Other languages
English (en)
Other versions
JPH10271446A (ja
Inventor
エリック・ティー・ブリューワー
アンドリュー・ポールフリーマン
グレッグ・シー・アミーズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of JPH10271446A publication Critical patent/JPH10271446A/ja
Application granted granted Critical
Publication of JP3768662B2 publication Critical patent/JP3768662B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals
    • G11B27/034Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Management Or Editing Of Information On Record Carriers (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、一般的には、オーディオビジュアル・ファイルを編集することに関する。より詳しくは、本発明は、編集操作を行なった後に、ビット・ストリームのオーディオ構成要素とビデオ構成要素との実質的な同期を維持させるための各種の方法および装置に関する。
【0002】
【従来の技術】
MPEG(動画エキスパート・グループ)は、国際規格機構(ISO)が定めたデジタル・ビデオおよびオーディオ信号を簡潔にあらわすための構文法に関する規格である。この構文法では、一般に、ビット・ストリームを符号化するときにしたがうべき規則の数を最小限にして、受信者が受信したビット・ストリームを明確に復号できることが求められる。当業者には公知のように、ビット・ストリームは、ビデオおよびオーディオ構成要素に加えて「システム」構成要素を含むものである。一般に、システム構成要素は、各ビデオおよびオーディオ構成要素を組み合わせ同期させて単一のビット・ストリームにするために必要な情報を含んでいる。
【0003】
MPEG−1と呼ばれる最初のMPEGが公表された後、MPEG−2で知られる次のMPEGが導入された。一般的にいって、MPEG−2は、放送されるビデオをより効率的にあらわすことができる改良された構文法を規定したものである。成立の経緯から、MPEG−1では、1.5Mビット/秒の速度でデータを取り扱い、各フレームが352画素×240ラインの解像度のものを毎秒約30ビデオ・フレーム(NTSC)または各フレームが352画素×288ラインの解像度のものを毎秒約25ビデオ・フレーム(PAL)を再構成する場合に最適の結果が得られるものとなっている。したがって、復号されたMPEG−1ビデオは、消費者のビデオテープ(VHS)の知覚される品質にほぼ近似している。それに対して、MPEG−2は、4.0から8.0Mビット/秒のデータ速度でのCCIR601の解像度をあらわし、また720画素×480ライン(NTSC)または720画素×576ライン(PAL)のフレーム解像度を与えるように選定されている。以下、簡単のために、これら二つのMPEG規格の間の相違が問題となる場合をのぞいて、「MPEG」という用語は、現在規定されているあるいは将来規定されるであろうビデオおよびオーディオ符号化および復号アルゴリズムを指すものとする。
【0004】
通常、復号の過程は、ビデオ、オーディオ、およびシステム情報を含むMPEGビット・ストリームが符号化された個別のビデオおよびオーディオ・ビット・ストリームを生成する役割りを果たすシステム復号器によってデマルチプレクスされるときに始まる。なお、これらの符号化されたビデオおよびオーディオ・ビット・ストリームは、その後、ビデオ復号器およびオーディオ復号器で復号することができる。現在は、符号化されたビデオ・ビット・ストリームの構造に関心が向けられている。一般に、符号化されたMPEGビデオ・ビット・ストリームは、明確なデータ構造階層に組織される。この階層の最も高いレベルには「ビデオ・シーケンス」がある。これは、シーケンス見出し、一以上の画像グループ(GOP)、およびシーケンスの終わりコードを含むものとすることができる。GOPは、ビデオ・シーケンスのサブセットであり、各GOPは、一以上の画像を含むことができる。以下に説明するように、GOPは、それによってビデオ・シーケンスのある画定されたセグメントにアクセスできるためきわめて重要である。ただし、GOPは、きわめて大きくなる場合がある。
【0005】
一つのGOP内部の各画像は、左から右へまた上から下へ向けて画定されるいくつかの「スライス」に仕切られる。個々のスライスは、16×16画素の正方形の面積を占める一以上のマクロブロックで構成される。MPEG規格に記されているように、一つのマクロブロックは、四つの8×8画素「ルミナンス(輝度)」構成要素と二つの8×8「クロミナンス(色差)」構成要素(すなわち、クロマ赤およびクロマ青)を含む。
【0006】
一つのGOP内部の画像の間では、画素情報の多くが類似しているかまたは同一であるため、MPEG規格は、この時間的冗長性を利用し、特定の基準画像から互いに異なる選ばれた画像をあらわすようにしている。MPEG規格は、大きく、三種類の符号化された画像フレームを定義している。第一の種類のフレームは、イントラ・フレーム(I−フレーム)である。I−フレームは、フレーム自身に含まれる情報を用いて符号化され、以前のまたは将来のフレームに含まれる情報には依存しない。その結果、I−フレームは、一般に、フレームのシーケンスの中の特定のGOPの起点を定義する。
【0007】
第二の種類のフレームは、予測フレーム(P−フレーム)である。P−フレームは、一般に、前のIまたはP−フレームに含まれる情報を用いて符号化される。当業者には公知のように、P−フレームは、前方予測フレームと呼ばれる。第三の種類のフレームは、双方向フレーム(B−フレーム)である。B−フレームは、過去および未来のフレームの両方に含まれる情報にもとづいて符号化され、したがって双方向予測フレームと呼ばれる。したがって、B−フレームは、I−フレームおよびP−フレームより圧縮されたものとなり、P−フレームはI−フレームより圧縮されたものとなる。MPEG規格は、IまたはP−フレームの間に特定の数のB−フレームを配置することを求めてはいないが、大部分の符号器は、IおよびP−フレームの間に二つのB−フレームを選択する。このような選択の選定は、符号器の中のメモリの量および符号化される材料に必要な特性および定義などの各種要因にもとづいて行なわれている。
【0008】
【発明が解決しようとする課題】
MPEG規格は、ビデオおよびオーディオ・ビット・ストリームを簡潔に符号化するための便利な構文法を定めている。コピーされたオーディオビジュアル・ビット・ストリームのセグメントを他のコピーされたオーディオビジュアル・ビット・ストリームのセグメントに接合する場合、オーディオの同期に困難が生じる。この同期問題は、一部に、オーディオ・フレームとビデオ・フレームとがほとんど1対1に対応しないことに起因する。したがって、ビデオ・フレームのセグメントがファイルからコピーされるため認識される場合には、認識されたビデオ・フレームはそのフレームに対応する所定の数のオーディオ・フレームを持たないことになる。
【0009】
その結果、ビデオのセグメントがファイルからコピーされ、その後で他のコピーされたセグメントに接合される場合には、コピーされたセグメントのオーディオ構成要素が正規のビデオ・フレームと同期しないおそれがある。ビデオとオーディオ・フレームが同期しなくなると、ビデオとオーディオ・フレームが同期できなかったオーディオ・フレームの数またはそのパーセントをあらわす「エラー」が得られるビット・ストリームの中に入り込むことになる。例えば、接合される二つのビット・ストリーム・セグメントから入り込む同期エラーは、オーディオ・フレームのわずか数分の一からオーディオ・フレームの数フレーム分までさまざまである。
【0010】
二つのビット・ストリーム・セグメントのみを接合することに関係するエラーは、場合によってはオーディオ・フレームのわずか数フレーム分に過ぎないかもしれないが、より複雑高度な編集作業で多数のビット・ストリーム・セグメントが接合される場合には、接合される各セグメントに関するエラーが加え合わされることになる。その結果生じるエラーがきわめて大きくなり、したがって得られるオーディオ・フレームの同期が大きくずれて、再生してもわけが分からなくなるおそれがある。さらに、同期がずれたオーディオおよびビデオ・ビット・ストリームでは、通常、セグメントが接合された位置で、ビット・ストリームにオーディオの不連続が生じる。この問題は、一般に音の「ポッピング」と呼ばれる。すなわち、接合されたビット・ストリーム・セグメントに不連続が入り込むと、不快なポッピング音が生じて、得られるオーディオ・ストリームは、同期がずれているばかりでなく、耐えられないものとなる。
【0011】
以上の説明から判るように、オーディオ構成要素がビデオ構成要素とほぼ同期した状態を確保しながら、オーディオおよびビデオ・ビット・ストリームを編集する方法および装置が求められている。
【0012】
【課題を解決するための手段】
上に述べた課題を解決するため、本発明にもとづけば、編集エンジンを用いて編集操作が行なわれる間、編集されたオーディオビジュアル・ファイルの同期をほぼ維持する方法および装置が提供される。好ましくは、編集エンジンは、編集リストを通読する二つのパスで編集操作を行なう。一つの実施の形態にあっては、編集リストは、あるファイルからオーディオおよびビデオのセグメントをコピーするコピー・オペレータの生成を編集エンジンに命令する多数のコピー要求を含むものとすることができる。好ましくは、コピー操作を始めるために、編集エンジンは、オーディオおよびビデオのコピーされたセグメントは、好ましくはビデオ構成要素より時間的に長いオーディオ構成要素をもつ第一のパスを通る。
【0013】
一つの実施の形態にあっては、第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法が開示される。この実施の形態にあっては、各オーディオビジュアル・セグメントは、第一のオーディオ・フレーム、順序として第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む多数のオーディオ・フレームを有する。オーディオビジュアル・セグメントは、さらに、最初のビデオ・フレームおよび最後のビデオ・フレームを含む多数のビデオ・フレームを有する。前記方法は、第一のオーディオビジュアル・セグメントの中の始めのオーディオ・フレームを第一のオーディオビジュアル・セグメントの中の最初のビデオ・フレームと位置合わせするステップを含む。第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、最初のオーディオ・フレームが第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定される。他方、第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、第二のオーディオ・フレームが第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定される。さらに、第一および第二のオーディオビジュアル・セグメントが貼り合わされる。
【0014】
他の一実施の形態にあっては、コピーされたオーディオ・セグメントの各端部で所定の数のオーディオ・フレームが復号されさらに再符号化されてグル・フレームを生成し、それが例えば音のフェージングおよびブレンディング効果を与える構成とすることができる。オーディオのコピーされたセグメントが第一のパスで処理されると、編集エンジンが編集リストを通読する第二のパスを開始して処理されたオーディオおよびビデオ・セグメントを貼り合わせて(すなわち、接合して)一つのファイルにする。この貼り合わせの操作の間に、各コピーされたオーディオ・セグメントの端部にあるフレーム(すなわち、タブ−インおよびタブ−アウト・オーディオ・フレーム)を落とすかあるいは保持することによって、新しく生成されたオーディオビジュアル・ファイルの中のオーディオ構成要素とビデオ構成要素の同期をほぼ維持することができる。したがって、新しく生成されたファイルは、好ましくは一オーディオ・フレームの約半分以上のエラーのないオーディオ構成要素をもつ一以上のオーディオビジュアル・セグメントからなるものとすることができる。
【0015】
さらに他の一実施の形態にあっては、多数のオーディオ・フレームおよび多数のビデオ・フレームを有する一つのオーディオビジュアル・ファイルから一つのセグメントをコピーする方法が開示される。最初のステップでは、ビデオ・ファイルの中のマーク−インの位置が選ばれて前記セグメントの中の最初のビデオ・フレームに対応し、前記最初のビデオ・フレームが関係する開始時間をもつようにされる。次に、ビデオ・ファイルの中のマーク−アウトの位置が選ばれて前記セグメントの中の最後のビデオ・フレームに対応し、前記最後のビデオ・フレームが関係する終了時間をもつようにされる。マーク−イン・ビデオ・フレームが選定されると、少なくとも最初のビデオ・フレームの開始時間と同じ程度に早い最初のオーディオ・フレームの開始時間をもつ最初のオーディオ・フレームが始めのオーディオ・フレームに指定される。少なくとも最後のビデオ・フレームと同じ程度に遅い第二のオーディオ・フレームの開始時間をもつ第二のオーディオ・フレームが最後のオーディオ・フレームに指定される。最初のビデオ・フレームから最後のビデオ・フレームまで伸びるビデオ部分と始めのオーディオ・フレームから最後のオーディオ・フレームまで伸びるオーディオ部分を含むようにオーディオビジュアル・ファイルがコピーされる。このようにして、好ましくは、セグメントのオーディオ部分は、コピーされたセグメントのビデオ部分より長くすることができる。
【0016】
さらに他の一実施の形態にあっては、実質的にオーディオとビデオの同期を維持しながら第一および第二のオーディオビジュアル・セグメントを接合する方法が開示される。各オーディオビジュアル・セグメントは、最初のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む多数のオーディオ・フレームを有し、また最初のビデオ・フレームおよび最後のビデオ・フレームを含む多数のビデオ・フレームを有する。この実施の形態にあっては、前記方法は、第一のオーディオビジュアル・セグメントの中のタブ−イン・オーディオ・フレームを第一のオーディオビジュアル・セグメントの中の最初のビデオ・フレームと位置合わせするステップを含む。好ましくは、第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームが最初のオーディオ・フレームに指定される。さらに、第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、第一のオーディオビジュアル・セグメントからの第二のオーディオ・フレームが始めのオーディオ・フレームに指定される。他方、第一のオーディオビジュアル・セグメントからの第二のオーディオ・フレームが始めのオーディオ・フレームに指定される場合には、第一のオーディオビジュアル・セグメントからの最初のオーディオ・フレームが落とされる。
【0017】
前記方法は、さらに、第一のセグメントの中の最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えると判別された場合には、第一のセグメントの中の最後のオーディオ・フレームを落とすことを含む。前記方法は、最後に、第二のセグメントの中の最初のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、最初のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えると判別された場合には、第二のセグメントの中の最初のオーディオ・フレームを落とす。
【0018】
本発明の効果は数多いが、本発明の特に顕著な効果は、ストリーム・エラーが一オーディオ・フレームの約半分を超えることが防がれ、また、連続コピー操作の後に貼り合わされるセグメントの数にかかわらず、ビデオ・フレームとオーディオ・フレームの間でほぼ同期がとられることである。上に述べたようにして第二のパスでオーディオ・フレームを落としたりあるいは保持することによって補正が行なわれなければ、さらにオーディオビジュアル・セグメントが貼り合わされる度に累積ストリーム・エラーが増大して拡散することは理解されよう。
【0019】
【発明の実施の形態】
本発明ならびにその効果は、添付の図面を参照して行なう以下の説明から最もよく理解されよう。
【0020】
広くは、本発明は、独創的な編集エンジンを用いることによって編集操作が行なわれる間、編集されたオーディオビジュアル・ファイルの同期を維持する方法および装置を開示するものである。好ましくは、編集エンジンは、編集リストを通読する二つのパスで編集操作を行なう。一般に、編集リストは、アプリケーションによって与えられ、MPEGオーディオおよびビデオ・データを含むある数のファイルで一定の操作を行なうことが要求される。一つの実施の形態にあっては、編集リストは、あるファイルからオーディオおよびビデオのセグメントをコピーするコピー・オペレータの生成を編集エンジンに命令する多数のコピー要求を含むものとすることができる。
【0021】
好ましくは、コピー操作を始めるために、編集エンジンは、オーディオおよびビデオのコピーされたセグメントは、好ましくはビデオ構成要素より時間的に長いオーディオ構成要素をもつ第一のパスを通る。他の一実施の形態にあっては、コピーされたオーディオ・セグメントの各端部で所定の数のオーディオ・フレームが復号されさらに再符号化されてグル・フレームを生成し、それが例えば音のフェージングおよびブレンディング効果を与える構成とすることができる。オーディオのコピーされたセグメントが第一のパスで処理されると、編集エンジンが編集リストを通読する第二のパスを開始して処理されたオーディオおよびビデオ・セグメントを貼り合わせて(すなわち、接合して)一つのファイルにする。この貼り合わせの操作の間に、各コピーされたオーディオ・セグメントの端部にあるフレーム(すなわち、タブ−インおよびタブ−アウト・オーディオ・フレーム)を落とすかあるいは保持することによって、新しく生成されたオーディオビジュアル・ファイルの中のオーディオ構成要素とビデオ構成要素の同期をほぼ維持することができる。したがって、新しく生成されたファイルは、一以上のコピーされたオーディオビジュアル・セグメントからなるものとすることができる。一つの実施の形態にあっては、新しいファイルは、好ましくは、ビデオ構成要素と正確に同期して一オーディオ・フレームの約半分以上はずれることのないオーディオ構成要素を有する。
【0022】
図1Aは、ビデオ構成要素とほぼ同期したオーディオ構成要素を生成することに関係する処理ステップを説明するために用いる多くのオーディオおよびビデオ・フレームのシーケンスを示す図である。例として、ビデオ・フレームがMPEG規格のフォーマットにもとづいて処理された後で符号化される順序を示すビデオ・フレームの符号化の順序のストリーム50が示されている。例として示したこの符号化の順序のストリーム50では、最初のフレームは、I−フレームであり、その後にP−フレーム、B−フレーム、B−フレーム、P−フレーム、B−フレーム、B−フレーム、B−フレーム等々が続く。本発明の編集アルゴリズムは、任意の適当に配列されたフレームのシーケンスを処理することができるが、表示の順序でフレームのシーケンスを処理することが好ましい。したがって、処理操作が行なわれる前に、符号化の順序のストリーム50は、表示の順序のストリームに変換される。
【0023】
すなわち、フレーム0からフレーム36まで時間順序で配列されたフレーム・ストリームは、表示順序ストリーム52の中で処理されるフレームの順序を識別する。比較のために、符号化順序ストリーム50の中のフレームの対応する時間順序を対応するフレームの下に示してある。もちろん、表示順序ストリーム52は、単に例であり、本発明にもとづいて他の適当な表示順序ストリームを適当に処理できることは理解されよう。
【0024】
ビデオ・フレームのセグメントが表示順序ストリーム52からコピーされると、マーク−インの位置およびマーク−アウトの位置が選定されて、コピーされるフレームの数が識別される。例として、マーク−インの位置がP−フレームであるフレーム9に選定され、マーク−アウトの位置がB−フレームであるフレーム28に選定されるとする。したがって、表示順序ストリーム52からコピーされるフレームのセグメントは、フレーム9から28までとなる。図示のように、識別されたセグメントは、関係するオーディオ・フレームも含むものとなる。
【0025】
当業者には公知のように、各オーディオ・フレームは、コピーされているMPEGオーディオレイヤの種類によって大きさが異なる場合がある。MPEGオーディオ規格は、具体的に三つのレイヤがあり、各レイヤは、関係するフレーム速度とさまざまな識別特性をもっている。例として、MPEGレイヤ2オーディオは、毎秒約28から38フレーム間での間のフレーム速度をもつことができる。特性の例としては、オーディオ・モード(例、ステレオ、モノ、サラウンド等々)、およびサンプリング周波数(例、32kHz、44.1kHz、および48kHz)を挙げることができる。MPEGオーディオ文書の中に記載されているように、各オーディオ・フレームは、好ましくは関係するヘッダを含み、このヘッダが、各ヘッダの後に続くオーディオ・サンプルの個々の特性を識別する。ただし、わかりやすくするために、以下では、オーディオ・フレームは、純粋なパルス・コード変調(PCM)オーディオ・サンプルとして説明する。
【0026】
表示順序ストリーム52に示すように、オーディオ・フレームの例がそれぞれの関係するビデオ・フレームの下に示されている。この代表的なビット・ストリームの中で互いに関係するビデオ・フレームに対するオーディオ・フレームの「時間」位置を識別するために、図では、オーディオ・フレームとビデオ・フレームは、やや絵画的に描かれている。
【0027】
図1Bは、本発明の一実施の形態にもとづいて図1Aの表示順序ストリーム52からコピーされた後のオーディオビジュアル・セグメント60を示す。図示のように、ビデオ・フレーム9から28および始めのオーディオ・フレーム56と終わりのオーディオ・フレーム62が、表示順序ストリーム52からコピーされている。始めのコピー・ステップの間、コピーされたオーディオ・セグメントは、コピーされたビデオ・セグメントより長い時間を占めることが好ましい。
【0028】
以下でより詳細に説明するように、フレーム9がマーク−イン・ビデオ・フレームであると識別されると、オーディオ・フレームをコピーするために、始めのオーディオ・フレーム56の始まりの時間がマーク−イン・フレーム9の開始時間54と同じかまたはそれより早いかの判別が行なわれる。同様に、フレーム28がマーク−アウト・ビデオ・フレームであると識別されると、オーディオ・フレームをコピーするために、終わりのオーディオ・フレーム62の始まりの時間がマーク−アウト・フレーム28の終了時間53と同じかまたはそれより早いかの判別が行なわれる。
【0029】
簡単に述べれば、オーディオ・フレームがマーク−イン・ビデオ・フレーム9の開始時間54またはマーク−アウト・ビデオ・フレーム28の終了時間53と完全に位置合わせされない場合には、始めのオーディオ・フレーム56は、マーク−イン・ビデオ・フレームの開始時間54より早い開始時間を示し、終わりのオーディオ・フレーム62は、マーク−アウト・ビデオ・フレーム28の終了時間53より早い開始時間を示す。この例では、オーディオ・フレーム56が始めのオーディオ・フレームとして選定され、オーディオ・フレーム62が終わりのオーディオ・フレームとして選定される。オーディオ・フレーム64が、マーク−アウト・ビデオ・フレーム28の終了時間53より遅い開始時間を有し、したがってコピーされないことが理解されよう、したがって、最初のパスでは、オーディオ・フレーム62間でのオーディオ・フレームのみがコピーされることになる。
【0030】
図2は、本発明の一実施の形態にもとづくビデオ・ファイルの編集に用いられるデータ・フロー・アーキテクチャー100を示す。図示のように、ファイルのオーディオ構成要素の編集にも同様なアーキテクチャー(例、かげになって隠されている部分)が用いられる。係属関連出願に記載されているように、ビデオ・ファイルは、ここにはかげで示したアーキテクチャーを用いて並行的に編集することができる。
【0031】
データ・フロー・アーキテクチャー100は、多くの編集作業を行なうことのできるMEDITエンジン102と呼ばれる編集エンジン102によって駆動されることが好ましい。例として、この種の作業として、ソースまたは入力ストリーム・ファイルからのセグメントが他のファイルで使用するためにコピーされる必要があることを要求するコピー操作を挙げることができる。他の適当な編集作業としては、フェード操作、ブレンド操作、モーフィング(形付け)操作、ティルティング(傾け)操作、テキスト・アノテーション(注釈付け)操作などを挙げることができる。一般に、MEDITエンジン102は、編集作業を要求するアプリケーションが提供するオペレータの種類に応じて異なる多くの編集作業を管理することのできるダイナミックな装置である。したがって、MEDITエンジン102は、複雑高度な編集作業を必要とする将来のアプリケーションが提供するオペレータ「プラグ−イン」を含む多数のオペレータの種類をすべて管理することができることが理解されよう。
【0032】
以下では、ソース・ファイルからビデオのセグメントをコピーするなどの編集作業を行なう場合にMEDITエンジン102がたどる処理ステップの概要を説明する。一般に、コピー操作は、アプリケーション106がコピー操作を行なうことを要求したときに開始される。
【0033】
最初、アプリケーション106は、MEDITエンジン102に、編集する型を要求するためのチャンネルを識別する数である「チャンネル・オペレータ」110、アプリケーション106が要求する編集機能の種類を識別する「機能オペレータ」112、および編集要求の終わりを識別する「終わりオペレータ」114を含む適当な編集リスト108を提供する。図示の実施の形態では、機能オペレータ112は、「コピー」要求を識別する。例として、機能オペレータ112で識別された最初のコピー要求は、チャンネル1のためにA.MPEGと呼ばれるファイルの中のフレーム9から28をコピーする要求であるとする。図示のように、チャンネルNであるB.MPEGと呼ばれるファイルの中のフレーム10から25をコピーする要求に至るまで、他にも多くのコピーの要求があり得る。もちろん、コピーするためにビデオ・フレームが識別されると、上に述べたように関係するオーディオ・フレームもコピーのために選定されることが好ましい。
【0034】
MEDITエンジン102が編集リスト108を受け取ると、コピーの要求が編集リスト108を通読する二つの識別可能なパスで処理される。第一のパスでは、MEDITエンジン102は、編集リスト108全体を通読して正しい数のオーディオ・フレームを選び出し、オーディオ構成要素が時間的にビデオ構成要素より長くなるようにする。好ましくは、始めのオーディオ・フレームは、マーク−イン・ビデオ・フレームの開始時間またはその前に始まるように選定され、終わりのオーディオ・フレームは、マーク−アウト・ビデオ・フレームの終了時間またはその前に始まるように選定される。説明をわかりやすくするために、始めのオーディオ・フレームを「タブ−イン」オーディオ・フレームと呼び、終わりのオーディオ・フレームを「タブ−アウト」オーディオ・フレームと呼ぶ。
【0035】
適当なタブ−インおよびタブ−アウト・フレームが選定されると、コピーされたセグメントの中のオーディオ・フレームの数を確認し、コピー・オペレータがタブ−イン・フレームで始まる所定の数のオーディオ・フレームを処理(すなわち、復号および再符号化)してイン・グル・セグメントを生成し、またタブ−アウト・フレームまでの所定の数のオーディオ・フレームを処理してアウト・グル・セグメントを生成することができるようになる。コピーされたオーディオ・セグメントのためにグル・セグメントが生成されると、そのグル・セグメントが適当な記憶媒体140に記憶される。記憶媒体140は、キャッシュ・メモリ、コンピューター・ハード・ドライブ、フロッピー・ディスク、あるいは適当なネットワークによって接続されて遠隔に配置された記憶媒体など任意の適当な記憶媒体とすることができる。
【0036】
第二のパスでは、MEDITエンジン102は、MEDITエンジン102によって生成される複数のスティッチャ・オブジェクト147、148を用いてグル部分を未処理のコピーされたセグメント(すなわち、ミドル・グル)と接合することで前に生成したグル・セグメントを利用する。以下により詳細に説明するように、スティッチャ・オブジェクトは、編集リスト108の各チャンネルのために生成され、特定のチャンネルに関連して生成された各スティッチャ・オブジェクトは、編集リスト108全体を通読してそれ自身のチャンネルのためにグル・セグメントを接合する(例、他のチャンネルに関連する情報は無視する)責任をもつ。
【0037】
このようにして、編集リスト108の中で識別された各チャンネルがそれ自身のスティッチャ・オブジェクトをもつように多数のスティッチャ・オブジェクトを生成することができる。特定の一実施の形態にあっては、各スティッチャ・オブジェクトは、正しい時系列で前記特定のグル・セグメントを接合し、生成された各セグメントがタイム・スタンピングされて適当な表示順序ストリームを生成するようにする責任をもつ。さらに、生成された各スティッチャ・オブジェクトは、グル・オブジェクト130および131などのグル・オブジェクトを用いて、前に生成されたイン・グルまたはアウト・グル・ファイルからグル・セグメントを引き出すか、あるいはミドル・グル・セグメントの位置を識別するポインタを用いて元のファイルからミドル・グルを引き出す。図1Bのオーディオビジュアル・セグメント60を参照して、オーディオ・フレーム56、58、59、および61が復号され再符号化されてイン・グル・セグメントを生成し、オーディオ・フレーム66、65、63、および62が復号再符号化されてアウト・グル・セグメントを生成すると、オーディオ・フレーム61と66の間にある残りのフレームは、例としてミドル・グル・セグメントをあらわすことになる。貼り合わされたフレーム・データがプログラム要素ストリーム(PES)としてマルチプレクサ150に出力されると、マルチプレクサ150は、生成されたすべてのスティッチャ・オブジェクトからPESデータを引き出し、コピーされたセグメントをMEDITエンジン102を介してアプリケーション106へ出力する。
【0038】
図2の全体のデータの流れを説明するために、アプリケーション106が、チャンネル1からA.MPEGファイル124(すなわち、図1Aの表示順序ストリーム52)からフレーム9から28をコピーする操作を要求する場合を仮定する。MEDITエンジン102は、最初のパスの間に全編集リスト108を通読して、前の編集要求の間にグル・セグメントがすでに生成されてグル・ファイルの中に記憶されているか否かを判別する。A.MPEGファイル124からのフレーム9から28のコピー操作のためにすでに存在するグル・セグメントはないと仮定すると、MEDITエンジン102は、制御オブジェクト111(例、制御オブジェクト)を生成するコピー・オペレータ104を生成する。
【0039】
この実施の形態にあっては、制御オブジェクト111は、検索エンジン装置118を使用して、A.MPEGファイル124の中でコピーするために識別された適当なビデオ・フレームを検索する。
【0040】
適当なフレームが位置付けされ、タブ−インおよびタブ−アウト・フレームを含む適当な数のオーディオ・フレームが選定されると、復号器120は、タブ−イン・オーディオ・フレームで始まるまたはタブ−アウト・オーディオ・フレームでオーディオ・フレームで終わる所定の数のオーディオ・フレームを復号することができる。一般に、オーディオ・グル・フレームは、例えば「ゼロへまたはゼロから」のフェードのようなオーディオ効果を導入するために処理されるオーディオ・フレームをあらわす。さらに、「インおよびアウト」グル・セグメントの生成は、オプションの処理ステップで、コピー・オペレータ102の中のパラメーターによって暗示的に選定されるかあるいはアプリケーション106によって送られるパラメーターによって明示的に要求される場合があることは理解されよう。したがって、グルの生成が要求される場合には、復号器120によって所定の数のオーディオ・フレームが一度に一フレームづつ復号される。MPEG規格の中で定義されている復号の要件を満たすためには、使用される復号器バッファを管理する必要があることは理解されよう。
【0041】
一つのオーディオ・フレームが復号されると、復号されたデータがコピー・オペレータ104へ送られる。コピー・オペレータ104は、復号されたデータを、コピー・オペレータ104によって生成されて符号器115を有する制御オブジェクト113(例、制御オブジェクト)へ送る。この時点で、符号器115は、オーディオ・フレーム・データを適当なフォーマットに再符号化し、再符号化されたオーディオ・フレームをグル・ファイルの中に記憶するグル・オブジェクト116を呼び出す。図示のように、グル・ファイルは、好ましくは、キャッシュ・メモリなどの記憶媒体140の中に記憶される。オプションで、各イン・グルおよびアウト・グル・セグメントのために所定の数のオーディオ・グル・フレームがすべて復号されて再符号化されると、前記セグメントは、A.MPEGグル・ファイル126などの適当なグル・ファイルの中に記憶される。
【0042】
MEDITエンジン102は、通常、編集リスト108の中の各コピー要求のために個別のコピー・オペレータを生成することは理解されよう。したがって、編集リストの中の第二のコピー操作要求(すなわち、B.MPEGファイル、チャンネルNからのフレーム10から50)は、個別のコピー・オペレータ104によって処理され、これらのコピー・オペレータが、それ自身の検索および復号機能のために新しい制御オブジェクト111を生成し、また生成されたグル・フレームを復号しておそらくは記憶媒体140に記憶されている対応するグル・ファイルへ転送するための新しい制御オブジェクト113を生成する。
【0043】
一実施の形態にあっては、各コピー・オペレータの実行は、編集リスト108の中で識別されたすべての編集要求を迅速に処理する並行フォーマットの多数の処理ユニットによって処理することができる。さらに、編集リストの中にはきまった評価順序は存在せず、また各編集操作は独立の行なうことができるので、並行処理は容易である。他の一実施の形態にあっては、インターネット・ビデオ・サーバーを用いて多重処理を行なうことができる。当業者には公知のように、インターネット・ビデオ・サーバーは、編集リスト108の中の編集要求を同時に処理するために用いることができる。
【0044】
やはり図2を参照して、編集リスト108の中の各コピー要求のために適当なグル・ファイルが生成されたら、MEDITエンジン102は、第二のパスで編集リスト108を通読し、編集リスト108の中で識別された各チャンネルのためにスティッチャ・オブジェクト147および148などのスティッチャ・オブジェクトを生成する。図示の例では、チャンネル1およびチャンネルNのために生成された二つのスティッチャ・オブジェクトのみが示されているが、編集リスト108の中で識別されたチャンネルの数に応じて任意の数のスティッチャ・オブジェクトを生成できることは理解されよう。例として、実施の形態によっては、編集リスト108はMPEG−2プラットホームの下の約8000のオーディオ・チャンネルおよび約4000のビデオ・チャンネルの多重チャンネルのためのスティッチャ・オブジェクトを含むようにすることができるものもある。
【0045】
各チャンネルのためにスティッチャ・オブジェクトが生成されると、各スティッチャ・オブジェクト147および148は、グル・オブジェクト130および131を生成することが好ましい。この実施の形態にあっては、各スティッチャ・オブジェクトは、編集リストを通読して関連するチャンネルのための編集要求を探す。例として、スティッチャ・オブジェクト147は、編集リスト108を通読してチャンネル1のための編集要求を識別し、同様に、スティッチャ・オブジェクト148は、編集リスト108を通読してチャンネルNのための編集オペレータを識別する等々の構成とされる。グル・オブジェクト130および131が生成されると、グル・オブジェクト130は、各スティッチャ・オブジェクト147および148に、グル・データを提供するが、これらのデータは、最初のパスの間に生成されたものとすることもできる。
【0046】
この例では、グル・オブジェクト130は、コピーされたセグメントのために各種のグル・セグメントを引き出す任務をもつ。例として、グル・オブジェクト130は、A.MPEGグル・ファイル126の中に記憶されたグル・データを引き出してそれをスティッチャ・オブジェクト147に提供するものとすることもできる。さらに、なんらかのミドル・グル・データ(すなわち、切り取られたセグメントの未処理部分)が要求された場合、グル・オブジェクト130は、制御オブジェクト111によって制御されるストリーマ122へポインタ134を用いる。このようにして、グル・オブジェクト130は、A.MPEGファイル124から正しいフレームを引き出すことができる。この実施の形態にあっては、ミドル・グルは、図1Bのコピーされたセグメント60の中のオーディオ・フレーム61とオーディオ・フレーム66の間にあるオーディオ・フレームに関連させることができる。もちろん、オーディオ・フレームのためにグル・セグメントが生成されない場合には、タブ−イン・オーディオ・フレームで始まりタブ−アウト・オーディオ・フレームで終わるすべてのオーディオ・フレームは、ミドル・グルとして識別される。
【0047】
したがって、各スティッチャ・オブジェクト147および148は、グル・データを要求し、グル・オブジェクト130および131は、適当な位置からデータを引き出す。各スティッチャ・オブジェクトが、時系列的に要求されたデータを引き出すと、各スティッチャ・オブジェクトは、PESデータ・ストリームをMUXユニット150へ転送し、前記ユニットは、引き出されたPESデータ・ストリームを多重化して、単一のストリームをMEDITエンジン102を介してアプリケーション106へ送る。
【0048】
図3は、本発明の一実施の形態にもとづいてビデオ・ファイルを編集するための好ましい方法のステップを示すフローチャートである。この処理は、ステップ300から始まり、このステップでは、MEDITエンジンが編集リストを受け取る。上に述べたように、編集リストは、通常、特定の編集要求に関係して必要とされるチャンネルの数および種類を識別する多数のチャンネル・オペレータを含んでいる。例えば、通常は、ビデオおよびオーディオのための個別のチャンネルが存在する。また、多数の個別のビデオ・チャンネルと多数の個別のオーディオ・チャンネルが存在する場合もある。
【0049】
図2を参照して、アプリケーション106がMEDITエンジン102へ編集リスト108を送ると、処理は、ステップ302へ進み、タブ−インおよびタブ−アウト・フレームを含むオーディオ・フレームが識別され、編集リスト108の中の各コピー要求のためにグル・セグメントが生成される。グル・セグメントが要求された場合には、編集リスト108の中の特定のコピー操作のために任意の数のグル・セグメントが存在する。すなわち、グル・セグメントは、イン・グル、ミドル・グル(すなわち、「未処理フレーム」)、およびアウト・グル・セグメントを含む。所定の数のオーディオ・フレームのためにグル・セグメントが生成された場合には、前記生成されたグル・セグメントは、第二のパスで使用しまた将来の編集操作で使用するために「インまたはアウト」グル・ファイルとして記憶されることが好ましい。
【0050】
したがって、もし将来、編集操作の中で同じフレーム域のコピーが行なわれることがある場合には、前に生成されたグル・セグメントを再使用することができる。これによって、同じグル・ファイルをまったく最初から非効率に再生成する必要をなくすことができる。実際、グル・セグメント・ファイルは、ネットワークに分散させ、編集操作の要求があれば引き出すようにすることもできる。
【0051】
適当なグル・セグメントが生成されて適当なメモリ位置(例、キャッシュ・メモリ)に記憶されると、処理は、ステップ304へ進み、第二のパスの間に図2に示すMEDITエンジン102によって要求された出力ストリームが生成される。図示のように、各チャンネル・オペレータのために多数のスティッチャが生成され、編集リストの中で識別された各チャンネルは、それ自身のスティッチャ・オブジェクトをもつことになり、また、各スティッチャ・オブジェクトは、編集リストを通読して、前記編集リストの中の各機能オペレータのためのデータを要求する。すなわち、各スティッチャ・オブジェクトは、グル・マネージャー(すなわち、グル・オブジェクト130および131)の補助のもとで、さまざまなグル・ファイルからデータを引き出す。このようにして、各スティッチャ・オブジェクトは、グル・オブジェクトからデータを受け取り、多重化ユニット150は、各スティッチャ・オブジェクトからPESストリーム・データを要求する。
【0052】
マルチプレクサが関係するスティッチャ・オブジェクトからデータを引き出すと、前記マルチプレクサは、多重化されたデータをMEDITエンジン102を介してアプリケーションへ送る。マルチプレクサによるストリームの出力は、オーディオ、ビデオ、あるいはビデオとオーディオ・データの多重化された組み合わせのいずれとしてもよいことは理解されよう。ステップ304で、要求された出力ストリームがアプリケーションへ送られると、処理は、完了する。以下では、図4から17を参照して、オーディオ構成要素をビデオ構成要素とほぼ同期した状態に維持する編集された出力ストリームの生成に関係する処理ステップをより詳細に説明する。
【0053】
図4は、本発明の一実施の形態にもとづいて任意の適当なオペレータのためにグルを生成することに関係する処理ステップを詳細に示したフローチャートである。まず、MEDITエンジンは、アプリケーションによって与えられる編集リストを通読する。一般に、処理は、ステップ310で始まり、このステップでは、MEDITエンジンが編集リストの次の入力項目を確保する。MEDITエンジンが編集リストの中の現在の入力項目を確保したら、処理は、決定ステップ312へ進む。決定ステップ312では、編集リストの中の現在の入力項目が「END(終了)」オペレータか否かが判別される。現在の入力項目がENDオペレータである場合には、図4の処理は完了する。
【0054】
現在の入力項目がENDオペレータでない場合には、処理は、第二の決定ステップ314へ進み、このステップでは、編集リストの中の現在の入力項目のためのグルが存在するか否かまた編集リストの中の現在の入力項目のためにグルが必要か否かが判別される。編集リストの中の現在の入力項目のためのグルがすでに存在する場合には、処理は、ステップ310へ戻り、上に述べたようにして編集リストの中の次の入力が処理される。他方、ステップ314で上に述べたようにグルが存在しないかあるいは現在の入力項目のために必要でないと判別された場合には、処理は、ステップ316へ進み、MEDITによって現在の入力項目のためのオペレータが生成される。もちろん、生成されるオペレータの種類は、編集リストの中の入力項目の種類に依存する。例として、入力項目がコピーの要求である場合には、図2に示すように「コピー・オペレータ」が生成される。
【0055】
したがって、MEDITによって、編集リストの中で提供される編集要求の種類に応じて任意の適当なオペレータが生成されることが理解されよう。例として、適当な編集オペレータは、ブレンド・オペレータ、フェード・オペレータ、モーフィング(形付け)オペレータ、ティルティング(傾け)オペレータ、テキスト・アノテーション(注釈付け)オペレータを含む場合が考えられる。さらに、本発明のMEDIT編集エンジンを利用するアプリケーションによって導入される「プラグ−イン」オペレータの種類によっては、将来、MEDITによって新しいオペレータを生成することもできる。
【0056】
ステップ316で適当なオペレータが生成されると、処理は、ステップ318へ進み、オペレータが実行されて、適当なオーディオ・セグメントが生成され、また編集リストの中で要求された特定の種類の操作のために必要なグル・セグメントが生成される。オペレータの実行に関係するこの処理のステップは、図5を参照して以下でより詳細に説明する。ステップ318で特定の編集オペレータのための適当なオーディオ・セグメントと任意のグル・セグメントが生成されると、処理は、ステップ320へ進み、オペレータが消滅する。現在のオペレータが消滅すると、処理は、ステップ310へ戻り、編集リストの中の次の入力項目を受け取って、上に述べたステップ320までの処理が繰り返される。
【0057】
図5は、本発明の一実施の形態にもとづいてコピー・オペレータを実行することに関係する処理ステップをより詳細に示した図である。処理は、ステップ402から始まり、このステップでは、マーク−イン・フレームが判別される。説明をわかりやすくするために、ここでは図1Aに示した表示順序ストリーム52の例を参照する。この例では、「マーク−イン」フレームは、フレーム9である。マーク−イン・フレームの種類が判別されると、処理は、ステップ404へ進み、マーク・アウト・フレームが識別される。この例では、図1Aに示すように、マーク−アウト・フレームは、フレーム28である。
【0058】
次に、処理は、ステップ406へ進み、マーク−イン・フレーム9と関係づけられるオーディオ・フレームが選定される。図示の例では、選定されたオーディオ・フレームは、好ましくはタブ−イン・オーディオ・フレームである。上に述べたように、タブ−イン・オーディオ・フレームは、マーク−イン・ビデオ・フレーム9の開始時間より前かまたは同じ開始時間を有することが好ましい。したがって、タブ−イン・オーディオ・フレームは、既知のビデオ開始時間(すなわち、マーク−イン・フレーム9の開始時間)を用いて「オーディオ−ビデオ」位置づけ操作を行ない、オーディオ構成要素の検索を行なうことによって選定される。したがって、オーディオ・シーカーは、提示タイム・スタンプおよびマーク−イン・フレーム9に最も近いオーディオ・フレームの復号タイム・スタンプを識別することができる。シーカーは、この情報を用いて、マーク−イン・ビデオ・フレーム9の開始時間54に最も近い開始時間をもつオーディオ・フレームはどれかを判別する。
【0059】
図1Bに示すように、開始時間54に近い開始時間を持つのはオーディオ・フレーム58である。この場合には、オーディオ・フレーム58が、それ自身の関係する開始時間を持つ「マーク−イン・オーディオ・フレーム」として識別される。この時点で、シーカーは、マーク−イン・オーディオ・フレーム58の開始時間が少なくともマーク−イン・ビデオ・フレーム9の開始時間54と同じ程度に早い(すなわち、間に合う)か否かを判別する。この例では、マーク−イン・オーディオ・フレーム58の開始時間は、少なくとも開始時間54ほど早くはない。したがって、シーカーは、オーディオ・フレーム56まで一オーディオ・フレーム分逆戻りし、このオーディオ・フレームがタブ−イン・オーディオ・フレームとして識別される。
【0060】
マーク−イン・ビデオ・フレームに関係するオーディオ・フレームが選定されると、処理は、ステップ408へ進み、マーク−アウト・ビデオ・フレーム28に関係づけられるオーディオ・フレームが選定される。上に述べたように、再び、オーディオ−ビデオ位置づけ操作が行なわれて「マーク−アウト・オーディオ・フレーム」が識別される。好ましくは、マーク−アウト・オーディオ・フレームは、マーク−アウト・ビデオ・フレーム28の終了時間53に時間的に最も近い開始時間を持つオーディオ・フレームである。この例では、マーク−アウト・ビデオ・フレーム28の終了時間53に最も近い開始時間を持つのはオーディオ・フレーム64である。マーク−アウト・オーディオ・フレーム64が識別されると、シーカーは、マーク−アウト・オーディオ・フレーム64の開始時間がマーク−アウト・ビデオ・フレーム28の終了時間53より遅くないか否かを判別する。例に示したマーク−アウト・オーディオ・フレーム64の開始時間は、マーク−アウト・ビデオ・フレーム28の終了時間53より遅いので、シーカーは、オーディオ・フレーム62まで一フレーム分逆戻りし、このオーディオ・フレームが「タブ−アウト」オーディオ・フレームとして識別される。ステップ406および408でタブ−インおよびタブ−アウト・オーディオ・フレームが識別されると、処理は、決定ステップ410へ進む。
【0061】
ステップ410では、コピーされたセグメントのために「イン・グル」が必要か否かが判別される。上に述べたように、グル・セグメントは、通常、復号されて再符号化されたオーディオ・フレームとして識別される。この実施の形態にあっては、コピーされたセグメントの始めで所定の数のオーディオ・フレームが復号され再符号化される。サウンド・ブレンド効果、フェード効果等々を導入するために任意の数のオーディオ・フレームを復号して再符号化することができるが、例として、図2のコピー・オペレータ104の暗示的要求にもとづいてオーディオ・フレーム56、58、59、および61が復号され再符号化されるものとする。他方、図2のアプリケーション106によってグル・オーディオ・フレームの数およびサウンド・エフェクト
(効果)の種類が明示的に要求されたものとする。
【0062】
ステップ410でイン・グルが必要と判別された場合には、処理は、ステップ412へ進み、タブ−イン・オーディオ・フレームで始まる所定の数のオーディオ・フレームのためにイン・グルが出力される。他方、イン・グルが必要でない場合には、処理は、ステップ414へ進み、「アウト・グル」が必要か否かが判別される。アウト・グルが必要な場合には、処理は、ステップ416へ進み、所定の数のフレームのためにアウト・グル(すなわち、復号され再符号化されたオーディオ・フレーム)が出力される。イン・グルの場合と同様に、例として、所定の数のフレームは、図1Bのオーディオ・フレーム66、65、63、および62であるとする。他方、ステップ414でアウト・グルが必要でないと判別された場合には、処理は、ステップ418へ進み、コピー操作のためにミドル・グルが必要か否かが判別される。ステップ418でコピー操作のためにミドル・グルが必要と判別された場合には、処理は、ステップ420へ進み、オーディオ・フレームのミドル・グル・セグメントが出力される。
【0063】
一実施の形態にあっては、ミドル・グル・オーディオ・セグメントは、(a)タブ−イン・フレームで始まりタブ−アウト・フレームで終わるオーディオ・フレーム、(b)タブ−インフレームと最初のアウト・グル・オーディオ・フレームの一フレーム前の間のオーディオ・フレーム、(c)最後のイン・グル・フレームの後のオーディオ・フレームで始まりタブ−アウト・フレームまで達するオーディオ・フレーム、または(d)最後のイン・グル・フレームの後のオーディオ・フレームで始まり最初のアウト・グル・オーディオ・フレームの一フレーム前まで達するオーディオ・フレームを含むものとすることができる。オプションとして適当なグル・セグメントが出力されると、コピー・オペレータを実行する処理が完了する。
【0064】
図6は、図5を参照して説明したミドル・グルの出力に関係する処理ステップを示すフローチャートである。処理は、ステップ451で始まり、グル域が識別される。上に述べたように、ミドル・グル域は、イン・グルおよびアウト・グルが必要か否かによって異なる。例として、オーディオ・フレーム56、58、59、および61のためにイン・グルが必要であり、オーディオ・フレーム66、65、63、および62のためにアウト・グルが必要であると仮定すると、ミドル・グル・セグメントは、オーディオ・フレーム69からオーディオ・フレーム68まで伸びているものとして識別されるであろう。もちろん、「インあるいはアウト」グルが必要でない場合には、ミドル・グル・セグメントは、タブ−イン・フレーム56からタブ−アウト・フレーム62まで伸びるものとなる。
【0065】
ステップ451でミドル・グル域が識別されると、処理は、ステップ452へ進み、多くの識別子を含むミドル・グル・ファイルが出力される。例として、この出力ファイルは、ファイル名、ミドル・グル・セグメントに関係するフレームの数、最初のフレーム番号(ミドル・グル・イン)、最後のフレーム番号(ミドル・グル・アウト)、ミドル・グルのフレーム速度、「ミドル・グル・イン」フレームを識別する入力ストリームを指すポインタ、および「ミドル・グル・アウト」フレームを識別する入力ストリームを指すポインタを有することが好ましい。一つの実施の形態にあっては、ミドル・グル・オーディオ・フレームは、第二のパスでスティッチャがミドル・グル・セグメントを要求したときに入力ファイルから「コピーされる」未処理オーディオ・フレーム69から68(例、復号されず再符号化されない)であることが好ましい。ステップ452でミドル・グル出力ファイルが生成されると、ミドル・グルを生成する処理が完了する。
【0066】
図7は、図5を参照して説明したイン・グルの出力に関係する処理ステップを示すフローチャートである。処理は、ステップ461で始まり、このステップでは、「イン・グル・イン」フレームを含みまた「イン・グル・アウト」フレームまで伸びるイン・グルのセグメントに関してグル域が識別される。例として、図1Bのオーディオビジュアル・セグメント60を参照すれば、イン・グル・セグメントは、オーディオ・フレーム56から61を含むことが好ましい。
【0067】
ステップ461でイン・グルに関するグル域が識別されると、処理は、ステップ462へ進み、最初のイン・グル・フレームが復号される。例として、復号される最初のフレームは、タブ−イン・オーディオ・フレーム56であることが好ましい。図2のデータ・フロー・アーキテクチャーを参照して、フレーム56が、制御オブジェクト111の検索エンジン118によってA.MPEGファイル124から選ばれると、識別されたデータ(すなわち、タブ−イン・オーディオ・フレーム56)が引き出され、オーディオ・ビット・ストリームからビデオ・ビット・ストリームを分離するDEMUXユニット121によってデマルチプレクスされる。その後、タブ−イン・オーディオ・フレーム56は、復号器120へ送られ、そこでオーディオ・サンプル・データが復号される。次に、この復号されたサンプル・データは、コピー・オペレータ104へ送られ、コピー・オペレータ104は、このデータを符号器115へ送る。この時点で、処理は、ステップ464へ進み、タブ−イン・オーディオ・フレーム56が制御オブジェクト113内にある符号器115によって符号化される。
【0068】
この実施の形態にあっては、フレーム56は、貼り合わされているオーディオ・セグメントの間に滑らかに移行させるように(例、ポッピング効果をほぼ除去するように)再符号化することができる。上に述べたように、再符号化されたオーディオ・フレームは、例えば、一秒の半分でゼロへフェードするまたはゼロからフェードする、あるいは60Hzの「ハミング」を加える等々の効果を含めるように符号化することもできる。フレーム56が符号化されると、処理は、ステップ466へ進み、グル・オブジェクト116によって、符号化されたフレームが出力イン・グル・ファイル(すなわち、A.MPEG グル126)に付加される。
【0069】
次に、処理は、決定ステップ468へ進み、ステップ461で識別されたフレームのイン・グル域の中にさらに他のオーディオ・フレームが存在するか否かが判別される。さらに他のオーディオ・フレームが存在する場合には、処理は、再びステップ462へ進み、上に述べたようにしてイン・グル・セグメントの中の次のフレームが復号される。ステップ462で次のフレームが復号されたら、処理は、再びステップ464へすすみ、サウンド・エフェクトを生成する任意の数の連続として符号化される。そのフレームが符号化されたら、処理は、ステップ466へ進み、再びそれが出力グル・ファイルに付加される。次に、処理は、ステップ468へ進み、ステップ461で識別されたフレームのイン・グル域の中にさらに他のオーディオ・フレームが存在するか否かが判別される。
【0070】
ステップ461で識別されたフレームのイン・グル域の中には他にフレームが存在しない場合には、処理は、ステップ469へ進み、付加されたフレームを含むイン・グル・ファイルが出力される(例、A.MPEGグル・ファイル126)。例として、このグル・ファイルは、ファイル名、イン・グル・セグメントの中のフレームの数、(「イン・グル・イン」)フレームのための最初のフレーム番号、(「イン・グル・アウト」)フレームのための最後のフレーム番号、およびイン・グル・セグメントのフレーム速度を含むものとすることができる。出力グル・ファイルが完成すると、図5を参照して説明したイン・グルを出力することに関係する処理ステップが完了する。
【0071】
図8は、図5を参照して説明したアウト・グルの出力に関係する処理ステップを示すフローチャートである。処理は、ステップ471で始まり、このステップでは、アウト・グル・セグメントのためにグル域が計算される。例として、図1Bのオーディオビジュアル・ストリーム60では、アウト・グル・セグメントは、オーディオ・フレーム66で始まりタブ−アウト・オーディオ・フレーム62まで伸びるものとすることができる。ステップ471でアウト・グル域が計算されたら、処理は、ステップ742へ進み、アウト・グル・セグメントの中のオーディオ・フレーム66が復号される。
【0072】
図2のデータ・フロー・アーキテクチャーを参照して、検索エンジン118がファイル、例えばA.MPEGファイル124の中のオーディオ・フレーム66を位置づけして引き出すと、DEMUX121の中でオーディオ・フレーム・データがデマルチプレクスされてオーディオ構成要素が分離される。次に、DEC120の中でフレーム66が復号され、DEC120は、制御オブジェクト111内部から復号されたオーディオ・サンプル・データを生成する。次に、復号されたサンプルデータは、コピー・オペレータ104へ送られ、このデータは、さらに制御オブジェクト113の符号器115へ送られる。ステップ474でデータが符号器115によって再符号化されると、グル・オブジェクト116は、ステップ476で、この再符号化されたオーディオ・フレームをグル・ファイル(例、AMPEGグル・ファイル126)へ付加する。
【0073】
次に、処理は、ステップ478へ進み、グル・アウト域の中にさらに他のフレームが存在するか否かが判別される。グル・アウト域の中にはさらに他のフレームが存在するので、処理は、ステップ472へ戻り、次のフレームが処理される。例として、次のフレームがオーディオ・フレーム65とすると、このフレームがステップ474で復号され再符号化される。上に述べたように、次に、フレーム66が適当な符号化フォーマットに符号化され、所望のサウンド・エフェクトが生成される。ステップ474でフレームが符号化されると、処理は、ステップ476へ進み、上に述べたように符号化されたフレームがアウト・グル・ファイルに付加される。
【0074】
本発明の一実施の形態にあっては、次に、処理は、所定のアウト・グル・セグメントの中のすべてのオーディオ・フレームが処理されるまでループしてステップ472へ戻る。ステップ478で処理すべき他のフレームはないと判別されると、処理は、ステップ479へ進み、出力グル・ファイルが生成される。例として、このグル・ファイルは、ファイル名、アウト・グル・セグメントの中のフレームの数、(「アウト・グル・イン」)フレームのための最初のフレーム番号、(「アウト・グル・アウト」)フレームのための最後のフレーム番号、およびアウト・グル・セグメントのフレーム速度を含むものとすることができる。出力グル・ファイルが完成すると、図5を参照して説明したアウト・グルを出力することに関係する処理ステップが完了する。
【0075】
図9は、図3のステップ304を参照して説明したMEDITエンジン102によって第二のパスの間に要求された出力ストリームを生成することに関係する処理ステップの概要を示すフローチャートである。処理は、ステップ502で始まり、このステップでは、MEDITが編集リストを通読し、前記編集リストの中の各チャンネルのためにスティッチャ・オブジェクトを生成する。例として、編集リストは、異なるビデオ・ファイルを表示するために多数のチャンネルをもつものとすることができる。図2に例として示すように、チャンネル1からチャンネルNまでのためのチャンネル・オペレータ110が識別される。したがって、チャンネル1およびチャンネルNのために関係するスティッチャが生成される。これらは、それぞれ、スティッチャ・オブジェクト147およびスティッチャ・オブジェクト148として示されている。
【0076】
ステップ502で編集リストの中で識別された各チャンネルのためにスティッチャ・オブジェクトが生成されると、処理は、ステップ504へ進み、MEDITがマルチプレクサ150を呼び出して前記マルチプレクサに入力ソースのリストを与える。この実施の形態にあっては、マルチプレクサ150は、スティッチャ・オブジェクト147およびスティッチャ・オブジェクト148などの入力ソースからデータを引き出すように構成される。ただし、マルチプレクサ150は、スティッチャ・オブジェクト147および148以外の任意の数の適当な入力ソースからデータを引き出せることは理解されよう。例として、入力ソースは、適当なMPEGデータを含むファイルなど任意の形で実施することができる。
【0077】
次に、処理は、ステップ506へ進み、各チャンネルのために生成されたスティッチャ・オブジェクトは、未処理入力ストリームおよび上に述べたように第一のパスの間に生成される各種のグル・ファイルから適当な入力データをマルチプレクサ150に供給した後、消去される。マルチプレクサ150が要求に応じてコピーされたセグメントを生成した後、コピーされたセグメントは、MEDITエンジン102を介してアプリケーションへ送られる。コピーされたセグメントが出力されると、ステップ506でスティッチャ・オブジェクトが消去され、第二のパスが完了する。
【0078】
図10は、図9のステップ504で示した入力ソースから引き出されたデータの多重化に関係する処理ステップをより詳細に示した図である。最初のステップ530では、処理は、マルチプレクサに提供された任意の入力ソースでデータが利用可能であるか否かを判別する。マルチプレクサに入力ソースが提供されない場合には、マルチプレクサの操作が完了する。他方、マルチプレクサに提供される入力ソースが存在する場合には、処理は、ステップ532へ進み、入力ソースによって提供されるデータがマルチプレクサによって読み取られる。
【0079】
ステップ532で入力ソースから利用可能なデータが読み取られたら、処理は、ステップ534へ進み、読み取られたデータが適用な多重化エンジンによって多重化される。例として、適当な公知の多重化エンジンとしては、Z・ヤール、J・バウチャー、J・パーマー、およびE・ルビンによって開発された1または2パスMPEG多重化エンジン、ファイル名MPEG−1、マルチ−ストリーム・システム・レーヤー・エンコーダ(マルチプレクサ)(公共部門、1994)を挙げることができる。この多重化エンジンは、マサチューセッツ州ボストンのボストン大学から入手することができる。
【0080】
ステップ534でデータが多重化されると、処理は、ステップ536へ進み、多重化されたデータがMEDITエンジン102へ読み取られ、次に図2を参照して説明した編集操作を要求するアプリケーションへ送られる。多重化されたデータがMEDITに書き込まれると、処理は、再び決定ステップ530へ進み、他にも利用可能な入力ソースが存在するか否かが判別される。利用可能なソースが存在する場合には、処理は、入力ソースが存在しなくなるまで再びステップ532、534、および536をループして通る。他に入力ソースが存在しない場合には、処理が完了する。
【0081】
図11は、ステップ532で説明したように入力ソースからデータを読み取るときに、スティッチャ・オブジェクトによって行なわれる処理ステップを詳細に示す図である。始めに、処理は、ステップ540で始まり、このステップでは、MEDITエンジン102によってスティッチャ・オブジェクトが呼び出される。上に述べたように、スティッチャ・オブジェクトは、編集リストの中で提供される各チャンネルごとに(すなわち、すべてのオーディオおよびビデオ・チャンネルに関して)生成されることが好ましい。適当な数のスティッチャ・オブジェクトが生成されると、処理は、ステップ542へ進み、マルチプレクサのための適当なビデオ・プログラム要素ストリーム(PES)を生成するために有限状態機械が導入される。
【0082】
一般に、有限状態機械には、時系列的に入力ソースを開き、入力ソースを読み取り、入力ソースを閉じる任務が課される。すなわち、各スティッチャは、状態機械を通り抜けて、各種の入力ソースを開き、ビデオ・データを読み取ることが好ましい。データが読み取られたら、ファイルが閉じられる。入力ソースの中にデータが見つからない(すなわち、「イン・グル、ミドル・グル、またはアウト・グル」が生成されないまたは必要とされない)場合には、状態機械は、次のファイルへ進み、開き、読み取り、閉じる操作を行なう。
【0083】
上に述べたように、スティッチャは、要求された場合には、各々が、グル・オブジェクト130および131のようなグル・オブジェクトを用いてグル・ファイルを引き出す。したがって、各グル・オブジェクトには、図3のステップ302で説明したように第一のパスの間に生成されるグル・ファイルの各種部分を引き出す任務が課される。各グル・ファイルが実行されるとき、グル・オブジェクトが各スティッチャが要求した適当な位置からグル・ファイルを引き出してからは、グル・ファイルは実際にはスティッチャに関係なく格納される。このようにして、各スティッチャはループして、特定のコピー操作に利用可能なグル・ファイルがなくなるまで、関係するグル・オブジェクトにグル・ファイルを要求する。
【0084】
図12は、図11のステップ542で説明した有限状態機械を導入する場合に各スティッチャが行なう処理ステップを詳細に示した図である。処理は、ステップ550で始まり、このステップでは、まずイン・グルまたはアウト・グルのために「開くこと」が要求されているか否かが判別される。イン・グルまたはアウト・グルのために「開くこと」が要求されている場合には、処理は、ステップ552へ進み、適当なグル・ファイルが開かれ、当業者には公知のようにしてファイル見出しが処理される。
【0085】
ファイル・ヘッダが処理されると、処理は、ステップ558へ進み、読み取り操作の全期間中、開かれたグル・ファイルのためにタイム・リスタンピングが行なわれる。また、ステップ558では、オプションで、B−フレームの取り外しが行なわれる。一般に、読み取り操作の間に、データは、それが一次的に保持されるバッファに読み込まれる。バッファに読み込まれると、読み取られた内容が始めから終わりまで処理され、適当なタイム・リスタンピングが判別され、コピーされたオーディオ・フレーム・セグメントのためにタブ−インおよびタブ−アウト・オーディオ・フレームを落とすべきかまたは保持すべきかが判別される。処理されると、バッファの全内容がマルチプレクサへ出力される(例、図2のMUX150)。
【0086】
図13を参照して以下に詳細に説明するように、タブ処理は、通常、二以上のオーディオおよびビデオ・セグメントが接合されたら、一オーディオ・フレームの半分以上のエラーが生じていないことを確認するために行なわれる。広くは、タブ処理は、タブ−インおよびタブ−アウト・オーディオ・フレームの各々に関して行なわれ、一定の条件が満たされれば、タブ−インおよびタブ−アウト・オーディオ・フレームが落とされるかあるいは保持されることになる。
【0087】
ステップ558でリスタンピングおよびタブ処理が行なわれたら、処理は、ステップ560へ進み、状態機械が開いたファイルを閉じる。他方、イン・グルおよびアウト・グルのために開くことが必要でない場合には、処理は、ステップ554へ進み、ミドル・グル・ファイルを開いてファイル・ヘッダを処理するステップが行なわれる。このステップでは、MPEGストリーム規格が満たされていることを確認するためにミドル・グル・ファイルのヘッダが処理される。次に、処理は、ステップ556へ進み、ミドル・グルの位置を示すポインタを参照してミドル・グル・ファイルが開かれる。例として、図2に示すように、ポインタ134および136は、読み取りが行なわれる入力ストリームの中の始めと終わりのフレームの位置を識別する。ステップ556で入力ストリームが開かれると、処理は、再びステップ558へ進み、上に述べたようにタイム・レスタンピングとB−フレームの除去が行なわれる。タイム・リスタンピングとB−フレームの除去が行なわれると、処理は、ステップ560へ進み、開いたファイルが閉じられる。
【0088】
図13は、本発明の一実施の形態にもとづいてタブ処理を行なうことに関係する処理ステップを示すフローチャートである。わかりやすくするために、貼り合わされる複数のオーディオビジュアル・セグメントを示す図14とタブ処理操作の一例のタブレーションの表を示す図15を同時に参照しながら説明する。
【0089】
図13の処理は、ステップ602で始まり、このステップでは、現在のタブ706が処理されて現存するストリーム・エラーが判別される。図14に示すように、最初のセグメントはSEGMENT Aであり、現存するストリーム・エラーはゼロである。この例では、現存するストリーム・エラーを持ち越す先行のタブは存在しないので、SEGMENT Aが最初のセグメントであり、現存ストリームストリーム・エラーはゼロである。ステップ602で現存するストリーム・エラーがゼロであると判別されると、処理は、ステップ604へ進み、タブ706に関してタブ・エラーが判別される。この例では、図15の表に示すように、タブ・エラーは0.2である。ここで使用する限りにおいて、「エラー」とは、一つのオーディオ・フレームが関係するビデオ・フレームと同期していないパーセントを意味する。例えば、0.2のエラーとは、オーディオ・フレームの20%を意味する。さらに、説明を容易にするために丸めた数字を用いるが、関係するエラーは、任意の適当な厳密さであらわすことができる。
【0090】
ステップ604でタブ706に関するエラーが判別されると、処理は、ステップ606へ進み、現存するストリーム・エラーとタブ・エラーの和(すなわち、累積エラー)が、一フレームの半分より大きいか否か(すなわち、>0.5エラー)か否かが判別される。この例では、現存するエラー(0.0エラー)とタブ706のエラー(0.2)の和が一フレームの半分より大きくない。エラーが一フレームの半分より大きくない場合には、処理は、ステップ608へ進み、図15の表に示すようにタブ706が保持される。次に、処理は、決定ステップ612へ進み、図14に示す貼り合わせ操作にさらに他のタブが存在するか否かが判別される。他のタブが存在するので、処理は、ステップ602へ戻り、現在のタブに関して現存するストリーム・エラーが判別される。図14に示すように、現在のタブは、今度はタブ708である。この段階では、現存するストリーム・エラーは、前のタブ処理操作から持ち越される。
【0091】
図15の表に示すように、現存するストリーム・エラーは、今度は0.2となる。ステップ602で現在のストリーム・エラーが判別されると、処理は、ステップ604へ進み、タブ708に関するタブ・エラーが判別される。図15の表に示すように、タブ708に関するタブ・エラーは、0.5である。次に、処理は、決定ステップ606へ進み、現存するストリーム・エラー(0.2)とタブ708に関するタブ・エラー(0.5)の和が一フレームの半分より大きいか否かが判別される。エラーの和は、0.7(すなわち、>0.5)であるから、処理は、ステップ610へ進み、タブ708が落とされる。タブ708が落とされた後、新しいストリーム・エラーは、図15に示すように−0.3となる。
【0092】
SEGMENT Aに関するタブ−アウトをあらわすタブ708が処理されると、処理は、再びステップ612へ進み、さらに他の処理すべきタブが存在するか否かが判別される。他の処理すべきタブが存在するので、処理は、ステップ602へ戻り、現在のタブは、SEGMENT Bのタブ−イン710となる。最後のタブが処理された後の新しいストリーム・エラーは−0.3であるため、タブ710が処理されるときの現存するストリーム・エラーは、−0.3となる。次に、処理は、ステップ604へ進み、図15の表に示すように、タブ−イン710に関するタブ・エラーは0.4であると判別される。
【0093】
次に、処理は、決定ステップ606へ進み、現存するストリーム・エラーとタブ710に関するタブ・エラーの和が一オーディオ・フレームの半分より大きいか否かが判別される。この例では、和は(−0.3+0.4)0.1であり、一オーディオ・フレームの半分より小さい(すなわち、<0.5)。したがって、図15に示すように、タブ710は保持される。処理は、再び決定ステップ612を続け、再びさらに他の処理すべきタブが存在するか否かが判別される。図14に示すように、タブ712、714、716、および720が上に述べた図13の処理ステップを通って処理される。各タブが処理されるたびに、各タブを落とすべきかあるいは保持すべきかの判別が行なわれる。上の説明を補うために、図14に示すSEGMENT AからSEGMENT Dに関係する各タブについての計算例を示す図15を参照されたい。
【0094】
図16は、図13の処理ステップを通って処理された各タブに関して現存するフレーム・エラーを示す線図である。図示のように、タブ・エラーは0.2であったが、最初のタブ706が処理された後の現存するストリーム・エラーはゼロである。このようなことが可能となるのは、最初のオーディオ・フレームの開始時間を最初のビデオ・フレームの開始時間に合わせるために全オーディオ構成要素が時間的に前にシフトされるからである。ただし、第二のタブ708が処理されると、全オーディオ構成要素の「オーディオ・フレームの20%」が時間的に前にシフトされる(すなわち、オーディオは、ビデオ構成要素の前のオーディオ・フレームの20%である)結果、現存するストリーム・エラーは、0.2となる。第三のタブ710が処理された後、現存するエラーは−0.3となるが、これは、オーディオ構成要素が、全体として「オーディオ・フレームの30%」時間的に後にシフトされることを意味する。
【0095】
補完のために、以下では、特定のタブが処理された後、どのようにしてエラーが「一フレームの半分のエラー」以下に維持されるかを説明する。例を挙げれば、第四のタブ712が処理された後、オーディオ構成要素は、オーディオ・フレームの10%分だけビデオ構成要素より時間的に先に進んでおり、第五のタブ714が処理された後、オーディオ構成要素は、オーディオ・フレームの50%分だけビデオ構成要素より時間的に遅れており、第六のタブ716が処理された後、オーディオ構成要素は、オーディオ・フレームの40%分だけビデオ構成要素より時間的に先に進んでおり、第七のタブ718が処理された後、オーディオ構成要素は、オーディオ・フレームの50%分だけビデオ構成要素より時間的に進んでおり、さらに第八のタブが処理された後、オーディオ構成要素は、オーディオ・フレームの40%分だけビデオ構成要素より時間的に先に進んでいるような場合が考えられる。
【0096】
このように、現存するストリーム・エラーが、一オーディオ・フレームの半分を超えることが防がれるため、連続するコピー操作の後、貼り合わされたセグメントの数がいくつであるかにかかわりなく、ビデオ・フレームは、オーディオ・フレームとほぼ同期することになる。上に述べたようにしてオーディオ・フレームを落としたり保持したりして補正を行なわない場合には、オーディオおよびビデオ・セグメントが貼り合わされる度ごとに、累積ストリーム・エラーが大きくなりかつ広がることは理解されよう。その結果、エラーが多数のオーディオ・フレームに相当するまで大きくなると、オーディオ構成要素は、ビデオ・構成要素と同期しなくなり、したがってわけがわからないことになる。すなわち、コピーされたオーディオの内容が、関係するビデオ・フレームの内容とマッチしないことになる。
【0097】
本発明では、コンピュータ・システムに記憶されたデータを用いてコンピュータが実行するさまざまな操作が用いられる。これらの操作は、物理量の物理的処理を必要とする操作である。通常、これらの量は、記憶、転送、組み合わせ、比較、その他の処理が可能な電気信号または磁気信号の形をとるが、必ずしもそれに限定されるものではない。さらに、行なわれる処理は、生成、識別、判別、または比較などと呼ばれる場合が多い。
【0098】
本明細書に記載されまた本発明の一部をなす操作は、すべて、有用な機械操作である。本発明は、また、これらの操作を行なうための装置に関するものである。装置は、必要な目的の達成のために特別につくることもできるし、あるいは、コンピュータに記憶されているコンピュータ・プログラムによって選択的に活性化されあるいは構成される汎用コンピュータとすることもできる。特に、本発明の開示内容にもとづいて書かれたコンピュータ・プログラムには、さまざまな汎用機械を用いることもできるし、あるいは、必要な操作を行なうためのより専門的な装置をつくるのが好便な場合もある。本発明の構成例を以下に示す。
【0099】
図17は、本発明にもとづく処理を行なうためのコンピュータ・システム800の例を示すブロック線図である。コンピュータ・システム800は、デジタル・コンピュータ802、表示画面(モニター)804、プリンタ806、フロッピー・ディスク・ドライブ808、ハード・ディスク・ドライブ810、ネットワーク・インターフェース812、およびキーボード814を含む。デジタル・コンピュータ802は、マイクロプロセッサ816、メモリ・バス818、ランダム・アクセス・メモリ(RAM)820、読み取り専用メモリ(ROM)822、周辺バス824、キーボード・コントローラ826を含む。デジタル・コンピュータ800は、パーソナル・コンピュータ(例えば、IBMコンパティブルなパーソナル・コンピュータ)、ワークステーション・コンピュータ(例えば、サン・マイクロシステムズまたはヒューレット・パッカードのワークステーション)、あるいは他の種類のコンピュータとすることができる。
【0100】
マイクロプロセッサ816は、汎用デジタル・プロセッサで、コンピュータ・システム800の操作を制御する。マイクロプロセッサ816は、1−チップのプロセッサとすることもできるし、あるいは多数の構成要素で実装することもできる。マイクロプロセッサ816は、メモリから検索された命令を用いて、入力データの受信と処理、および出力装置へのデータの出力と表示を制御する。本発明にもとづけば、マイクロプロセッサ816の特定の機能として、MPEGビデオおよびオーディオ・ストリーム内部での位置付けに関係する処理を補助する機能を挙げることができる。
【0101】
メモリ・バス818は、マイクロプロセッサ816がRAM820およびROM822にアクセスするために使用する。RAM820は、マイクロプロセッサ816が一般記憶域としてまたスクラッチ・パッド・メモリとして使用し、また、入力データおよび処理ずみデータを記憶するために使用することもできる。ROM822は、マイクロプロセッサ816が実行する命令およびプログラム・コードならびに他のデータを記憶するために用いることができる。
【0102】
周辺バス824は、デジタル・コンピュータ802が入力、出力、および記憶装置にアクセスするために用いられる。記載の実施の形態にあっては、これらの装置は、表示画面804、プリンタ装置806、フロッピー・ディスク・ドライブ808、ハード・ディスク・ドライブ810、およびネットワーク・インターフェース812を含む。キーボード・コントローラ826は、キーボード814から入力を受け取り、押された各キーの復号されたシンボルをバス828を介してマイクロプロセッサ816へ送るために用いられる。
【0103】
表示画面804は、マイクロプロセッサ816によって周辺バス824を介して供給されるまたはコンピュータ・システム800の他の構成要素によって供給されるデータの映像を表示する出力装置である。プリンタ装置806は、プリンタとして作動する場合には、紙などの上に映像を供給する。プリンタ装置806の代わりにあるいはそれに加えて、プロッター、タイプセッター等々の他の出力装置も使用することができる。
【0104】
フロッピー・ディスク・ドライブ808およびハード・ディスク・ドライブ810は、各種のデータを記憶するために用いることができる。フロッピー・ディスク・ドライブ808は、各種データの他のコンピュータ・システムへの移送を容易にし、ハード、ディスク・ドライブ810は、記憶されている大量のデータへの高速アクセスを可能にする。
【0105】
マイクロプロセッサ816は、オペレーティング・システムと組み合わされて、コンピュータ・コードを実行し、データを生成しまた使用する。これらのコンピュータ・コードおよびデータは、RAM820、ROM822、またはハード・ディスク・ドライブ810に常駐することができる。コンピュータ・コードおよびデータは、また、取りはずし自在のプログラム媒体に常駐し、また、必要なときにはコンピュータ・システム800にロードまたはインストールすることができる。取りはずし自在のプログラム媒体は、例えば、CD−ROM、PC−CARD、フロッピー・ディスク、および磁気テープを含む。
【0106】
ネットワーク・インターフェース812は、他のコンピュータ・システムに接続されたネットワークを介してデータを送受信するために用いられる。インターフェース・カードまたは類所の装置およびマイクロプロセッサ816によって実装された適当なソフトウエアを用いれば、コンピュータ・システム800を現存のネットワークへ接続し、標準プロトコルにしたがってデータを転送することができる。
【0107】
キーボード814は、ユーザーがこれを用いてコマンドおよび他の命令をコンピュータ・システムへ入力するものである。本発明に関連して他の種類の入力装置を使用することもできる。例えば、コンピュータ・マウス、トラック・ボール、スタイラス(尖筆)、またはタブレットなどの指示具を用いて、汎用コンピュータの画面上のポインタを操作することもできる。
【0108】
本発明は、コンピュータが読み取り可能な媒体上のコンピュータが読み取り可能なコードとして実施することもできる。コンピュータが読み取り可能な媒体とは、データを記憶することができ、そのデータを後にコンピュータ・システムで読み取ることのできる任意のデータ記憶装置を意味する。コンピュータが読み取り可能な媒体としては、例として、読み取り専用メモリ、ランダム・アクセス・メモリ、CD−ROM、磁気テープ、光学データ記憶装置を含む。コンピュータが読み取り可能な媒体は、また、ネットワークで連結された複数のコンピュータ・システムに分散させて、コンピュータが読み取り可能なコードが分散式に記憶され実行されるようにすることもできる。
【0109】
上に説明したMPEGオーディオおよびビデオ規格で、参考資料として本出願に組み込まれるものは以下の通りである。すなわち、(1)「動画および関連するオーディオ情報の総称的符号化:ビデオ」、ISO/IEC13818−2("Generic Coding of Moving Pictures and Associated Audio Information: Video," ISO/IEC 13818-2)と題する文書、(2)「デジタル記憶媒体のための、約1.5Mビット/秒までの動画および関連するオーディオの符号化」(第1部システム、第2部ビデオ、第3部オーディオ)11171/11172(1995/1996)("Coding of Moving Picutres and Associated Audio for Digital Storage Media at up to about 1.5 MBit/s" (Part 1 System, Part 2 Video, Part 3 Audio) 11171/11172 (1995/1996))、と題する文書、および(3)「動画および関連するオーディオ情報の総称的符号化」、13818−3("Generic Coding of Moving Pictures and Associated Audio Information" ISO/IEC 13818-3)と題する文書である。上に挙げたMPEG規格文書および将来のMPEG規格文書は、すべて、スイス国ジュネーブ20、CH−1211、ISO/IEC私書箱56(ISO/IEC Case Postale 56, CH-1211, Geneva 20, Switzerland)に依頼すれば、入手可能である。
【0110】
以上、本発明の好ましい実施の形態を詳細に説明したが、本発明は、その精神および範囲を逸脱することなく他の形態で実施できることも理解されよう。説明した実施の形態では分散型アーキテクチャーが記載されている。この種のアーキテクチャーは、特にモジュール構成の面からまた新しい機能の導入の面から多くの効果をもつ。
【0111】
例えば、単に、シーカー、復号器、符号器等々多くの同じ構成要素を利用することのできる追加の「差し込み式」オペレータ用具を配設することによって、新しい機能を生成することができる。上に述べたようなアーキテクチャーは、特によく機能すると考えられるが、他のアーキテクチャーを用いても同様な機能を得られることは、理解されよう。したがって、上に述べた例および実施の形態は、単に例示であって本発明を制限するものではなく、本発明は、本明細書に記されている詳細に限定されず、添付の特許請求の範囲内で変換が可能なものである。
【0112】
本発明の実施の形態は以下の通りである。
【0113】
(1) 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、
前記第一のオーディオビジュアル・セグメントの中の最初のオーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするステップで、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、前記第一のオーディオ・フレームが前記第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定され、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、前記第二のオーディオ・フレームが前記第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定される前記ステップと、
前記第一および第二のオーディオビジュアル・セグメントを貼り合わせるステップと、を有することを特徴とする方法。
【0114】
(2) (1)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、さらに、
前記第一のオーディオビジュアル・セグメントからの前記最後のオーディオ・フレームに関係するタブ・エラーが一フレームより小さい場合には、前記最後のオーディオ・フレームが前記第一のオーディオビジュアル・セグメントからのタブ−アウト・オーディオ・フレームに指定されるステップと、
累積ストリーム・エラーが約半フレームより大きい場合には、前記タブ−アウト・オーディオ・フレームを落とすステップと、を有することを特徴とする方法。
【0115】
(3) (2)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、前記累積ストリーム・エラーは、現存のストリーム・エラーおよび前記タブ・エラーを含むことを特徴とする方法。
【0116】
(4) (3)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、前記タブ−インおよびタブ−アウト・オーディオ・フレームの各々が落とされて保持された後に前記現存のストリーム・エラーが再計算されることを特徴とする方法。
【0117】
(5) (4)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、前記最初のオーディオ・フレームの位置合わせに関して前記現存のストリーム・エラーがゼロであることを特徴とする方法。
【0118】
(6) (5)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、さらに、
前記第一のオーディオビジュアル・セグメントの中の前記最初のオーディオ・フレームを位置合わせするステップの後に、前記第一のオーディオビジュアル・セグメントの中の前記複数のオーディオ・フレームを時間的に前へシフトするステップと、
前記最初のオーディオ・フレームを位置合わせした後に、前記現存のストリーム・エラーを再計算するステップと、を有することを特徴とする方法。
【0119】
(7) (3)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、さらに、
前記第二のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが一フレームより小さい場合には、第一のオーディオ・フレームが前記第二のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定されるステップと、
前記累積ストリーム・エラーが約半フレームより大きい場合には、前記タブ−イン・オーディオ・フレームを落とすステップと、を有することを特徴とする方法。
【0120】
(8) 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、
前記第一のオーディオビジュアル・セグメントの中のタブ−イン・オーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするステップで、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半フレームより小さい場合には、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームが、前記タブ−イン・オーディオ・フレームに指定され、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームは、前記タブ−イン・オーディオ・フレームに指定され、
前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームが前記タブ−イン・オーディオ・フレームに指定される場合には、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームが落とされる前記ステップと、
前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記最後のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームを落とすステップと、
前記第二のオーディオビジュアル・セグメントの中の第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記第一のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームを落とすステップとを有し、
それによって、前記第一および第二のオーディオビジュアル・セグメントの複数のオーディオ・フレームが前記第一および第二のオーディオビジュアル・セグメントの複数のビデオ・フレームとほぼ同期することを特徴とする方法。
【0121】
(9) (8)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、前記累積エラーは、現存のストリーム・エラーおよび現在のタブ・エラーを含むことを特徴とする方法。
【0122】
(10) (9)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、さらに、
前の各タブが落とされたかあるいは保持された後に前記現存のストリーム・エラーを計算するステップとを有することを特徴とする方法。
【0123】
(11) (9)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、前記第一のオーディオビジュアル・セグメントの前記タブ−イン・オーディオ・フレームに関して前記現存のストリーム・エラーがゼロであり、前記最後のオーディオ・フレームに関係する前記累積エラーを計算するときに、前記タブ−イン・オーディオ・フレームの前記タブ・エラーが前に持ち越されることを特徴とする方法。
【0124】
(12) (11)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、さらに、
前記第一のオーディオビジュアル・セグメントの前記第一のオーディオ・フレームが前記タブ−イン・オーディオ・フレームに指定された場合には、前記第一のオーディオビジュアル・セグメントの前記複数のオーディオ・フレームを時間的に前へシフトするステップとを有することを特徴とする方法。
【0125】
(13) (11)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、さらに、
前記第一のオーディオビジュアル・セグメントの前記第二のオーディオ・フレームが前記タブ−イン・オーディオ・フレームに指定された場合には、前記第一のオーディオビジュアル・セグメントの前記複数のオーディオ・フレームを時間的に後へシフトするステップとを有することを特徴とする方法。
【0126】
(14) (11)に記載の編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、前記第一および第二のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームは、タブ−アウト・オーディオ・フレームに指定されることを特徴とする方法。
【0127】
(15) 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、
前記第一のオーディオビジュアル・セグメントの中の最初のオーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするよう構成されたアライナーを有し、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半オーディオ・フレームより小さい場合には、前記最初のオーディオ・フレームは、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームであることを特徴とする装置。
【0128】
(16) (15)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半オーディオ・フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームは、前記最初のオーディオ・フレームであることを特徴とする装置。
【0129】
(17) (16)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームが前記最初のオーディオ・フレームである場合には、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームが落とされることを特徴とする装置。
【0130】
(18) (17)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、さらに、
現存のストリーム・エラーと現在のタブに関係するタブ・エラーとを加え合わせるよう構成された累積エラー計算器を有することを特徴とする装置。
【0131】
(19) (18)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記累積エラー計算器が、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えると判別した場合には、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームが落とされることを特徴とする装置。
【0132】
(20) (19)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記累積エラー計算器が、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームより小さいと判別した場合には、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームが保持されることを特徴とする装置。
【0133】
(21) (18)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記累積エラー計算器が、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えると判別した場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームが落とされることを特徴とする装置。
【0134】
(22) (21)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記累積エラー計算器が、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームより小さいと判別した場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームが保持されることを特徴とする装置。
【0135】
(23) (17)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記アライナーが前記第一のオーディオビジュアル・セグメントの前記最初のオーディオ・フレームを位置合わせすると、前記複数のオーディオ・フレームが時間的にシフトされることを特徴とする装置。
【0136】
(24) (23)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第一のオーディオ・フレームが前記最初のオーディオ・フレームである場合には、前記複数のオーディオ・フレームが時間的に前へシフトされることを特徴とする装置。
【0137】
(25) (23)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第二のオーディオ・フレームが前記最初のオーディオ・フレームである場合には、前記複数のオーディオ・フレームが時間的に後へシフトされることを特徴とする装置。
【0138】
(26) (18)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第一のオーディオビジュアル・セグメントの中の前記最初のオーディオ・フレームに関して前記現存のストリーム・エラーがゼロであることを特徴とする装置。
【0139】
(27) (20)に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームに関して前記現存のストリーム・エラーは、前記第一のオーディオビジュアル・セグメントの中の前記最初のオーディオ・フレームの前記タブ・エラーであることを特徴とする装置。
【0140】
(28) 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせるプログラム命令を含むコンピュータが読み取り可能な媒体であって、
前記第一のオーディオビジュアル・セグメントの中の最初のオーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするプログラム命令で、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、前記第一のオーディオ・フレームが前記第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定され、
前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、前記第二のオーディオ・フレームは前記第一のオーディオビジュアル・セグメントからのタブ−イン・オーディオ・フレームに指定される前記プログラム命令と、
前記第一および第二のオーディオビジュアル・セグメントを貼り合わせるプログラム命令とを有することを特徴とする媒体。
【0141】
(29) 複数のオーディオ・フレームと複数のビデオ・フレームとを有するオーディオビジュアル・ファイルからセグメントをコピーする方法であって、
前記セグメントの中の第一のビデオ・フレームに対応するビデオ・ファイルの中でマーク−インの位置を選定するステップで、前記第一のビデオ・フレームは、関係する開始時間を有する前記ステップと、
前記セグメントの中の最後のビデオ・フレームに対応する前記ビデオ・ファイルの中でマーク−アウトの位置を選定するステップで、前記最後のビデオ・フレームは、関係する終了時間を有する前記ステップと、
少なくとも前記第一のビデオ・フレームの開始時間と同程度に早い第一のオーディオ・フレーム開始時間を有する第一のオーディオ・フレームを最初のオーディオ・フレームに指定するステップと、
少なくとも前記最後のビデオ・フレームの終了時間と同程度に遅い第二のオーディオ・フレーム開始時間を有する第二のオーディオ・フレームを最後のオーディオ・フレームに指定するステップと、
前記第一のビデオ・フレームから前記最後のビデオ・フレームまで伸びるビデオ部分および前記最初のオーディオ・フレームから前記最後のオーディオ・フレームまで伸びるオーディオ部分を含む前記オーディオビジュアル・ファイルからセグメントをコピーするステップで、前記セグメントの前記オーディオ部分は、前記セグメントの前記ビデオ部分より長い前記ステップとを有することを特徴とする方法。
【0142】
(30) (29)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記最初のオーディオ・フレームは、時間的に前記第一のビデオ・フレームに重なり、前記最後のオーディオ・フレームは、時間的に前記最後のビデオ・フレームに重なることを特徴とする方法。
【0143】
(31) (30)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記指定された最初のオーディオ・フレームは、
前記第一のビデオ・フレームの開始時間に最も近く関係する開始時間を有するマーク−イン・オーディオ・フレームを識別するステップと、
前記マーク−イン・オーディオ・フレームの開始時間が少なくとも前記第一のビデオ・フレームの開始時間と同程度に早い場合には前記マーク−イン・オーディオ・フレームを前記最初のオーディオ・フレームに指定し、前記マーク−イン・オーディオ・フレームの開始時間が前記第一のビデオ・フレームの開始時間より遅い場合には前記マーク−イン・オーディオ・フレームの直前のオーディオ・フレームを前記最初のオーディオ・フレームに指定するステップとによって判別されることを特徴とする方法。
【0144】
(32) (30)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記指定された最後のオーディオ・フレームは、
前記最後のビデオ・フレームの終了時間に最も近く関係する開始時間を有するマーク−アウト・オーディオ・フレームを識別するステップと、
前記マーク−アウト・オーディオ・フレームの開始時間が少なくとも前記最後のビデオ・フレームの終了時間と同程度に早い場合には前記マーク−アウト・オーディオ・フレームを前記最後のオーディオ・フレームに指定し、前記マーク−アウト・オーディオ・フレームの開始時間が前記最後のビデオ・フレームの終了時間より遅い場合には前記マーク−アウト・オーディオ・フレームの直前のオーディオ・フレームを前記最後のオーディオ・フレームに指定するステップとによって判別されることを特徴とする方法。
【0145】
(33) (29)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、さらに、
前記最初のオーディオ・フレームで始まり第一の所定のオーディオ・フレームまで伸び、第二の所定のオーディオ・フレームで始まり前記最後のオーディオ・フレームまで伸びる所定の数のオーディオ・フレームを処理するステップを有することを特徴とする方法。
【0146】
(34) (33)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記処理ステップは、
前記最初のオーディオ・フレームで始まり前記第一の所定のオーディオ・フレームまで伸びる所定の数のオーディオ・フレームを復号するサブステップと、
前記復号された所定の数のフレームを再符号化するサブステップとを有することを特徴とする方法。
【0147】
(35) (33)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記処理ステップは、
前記第二の所定のオーディオ・フレームで始まり前記最後のオーディオ・フレームまで伸びる所定の数のオーディオ・フレームを復号するサブステップと、
前記復号された所定の数のフレームを再符号化するサブステップとを有することを特徴とする方法。
【0148】
(36) (34)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記再符号化された所定の数のフレームは、イン・グル・ファイルとして記憶されることを特徴とする方法。
【0149】
(37) (35)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記再符号化された所定の数のフレームは、アウト・グル・ファイルとして記憶されることを特徴とする方法。
【0150】
(38) (33)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、さらに、
前記処理されたオーディオの間にある所定の数のオーディオ・フレームをミドル・グル・オーディオ・フレームとして識別するステップを有することを特徴とする方法。
【0151】
(39) (38)に記載のオーディオビジュアル・ファイルからセグメントをコピーする方法であって、前記ミドル・グル・オーディオ・フレームは、入力オーディオビジュアル・ストリームを指すポインタで識別されることを特徴とする方法。
【0152】
(40) 複数のオーディオ・フレームと複数のビデオ・フレームとを有するオーディオビジュアル・ファイルからセグメントを切り取るための装置であって、
前記セグメントの中の第一のビデオ・フレームに対応するビデオ・ファイルの中でマーク−インの位置を識別するセレクタで、前記第一のビデオ・フレームは、関係する開始時間を有する前記セレクタと、
前記セグメントの中の最後のビデオ・フレームに対応する前記ビデオ・ファイルの中でマーク−アウトの位置を識別するセレクタで、前記最後のビデオ・フレームは、関係する終了時間を有する前記セレクタと、
第一のオーディオ・フレームが少なくとも前記第一のビデオ・フレームの開始時間と同程度に早い開始時間を有する場合には、前記第一のオーディオ・フレームを最初のオーディオ・フレームに選定するよう構成された最初のオーディオ・フレーム・指示器(デジグネータ)と、
第二のオーディオ・フレームが少なくとも前記最後のビデオ・フレームの終了時間と同程度に遅い開始時間を有する場合には、前記第二のオーディオ・フレームを最後のオーディオ・フレームに選定するよう構成された最後のオーディオ・フレーム・指示器と、
前記第一のビデオ・フレームから前記最後のビデオ・フレームまで伸びるビデオ部分および前記最初のオーディオ・フレームから前記最後のオーディオ・フレームまで伸びるオーディオ部分を含む前記オーディオビジュアル・ファイルからセグメントをコピーするよう構成されたクリッパで、前記セグメントの前記オーディオ部分は、前記セグメントの前記ビデオ部分より時間的に短くない前記クリッパとを有することを特徴とする装置。
【0153】
(41) 複数のオーディオ・フレームと複数のビデオ・フレームとを有するオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、
前記セグメントの中の第一のビデオ・フレームに対応するビデオ・ファイルの中でマーク−インの位置を選定するプログラム命令で、前記第一のビデオ・フレームは、関係する開始時間を有する前記プログラム命令と、
前記セグメントの中の最後のビデオ・フレームに対応する前記ビデオ・ファイルの中でマーク−アウトの位置を選定するプログラム命令で、前記最後のビデオ・フレームは、関係する終了時間を有する前記プログラム命令と、
少なくとも前記第一のビデオ・フレームの開始時間と同程度に早い第一のオーディオ・フレーム開始時間を有する第一のオーディオ・フレームを最初のオーディオ・フレームに指定するプログラム命令と、
少なくとも前記最後のビデオ・フレームの終了時間と同程度に遅い第二のオーディオ・フレーム開始時間を有する第二のオーディオ・フレームを最後のオーディオ・フレームに指定するプログラム命令と、
前記第一のビデオ・フレームから前記最後のビデオ・フレームまで伸びるビデオ部分および前記最初のオーディオ・フレームから前記最後のオーディオ・フレームまで伸びるオーディオ部分を含む前記オーディオビジュアル・ファイルからセグメントをコピーするプログラム命令で、前記セグメントの前記オーディオ部分は、前記セグメントの前記ビデオ部分より長い前記プログラム命令とを有することを特徴とする媒体。
【0154】
(42) (41)に記載のオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、前記最初のオーディオ・フレームは、時間的に前記第一のビデオ・フレームに重なり、前記最後のオーディオ・フレームは、時間的に前記最後のビデオ・フレームに重なることを特徴とする媒体。
【0155】
(43) (42)に記載のオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、前記指定された最初のオーディオ・フレームは、
前記第一のビデオ・フレームの開始時間に最も近く関係する開始時間を有するマーク−イン・オーディオ・フレームを識別するプログラム命令と、
前記マーク−イン・オーディオ・フレームの開始時間が少なくとも前記第一のビデオ・フレームの開始時間と同程度に早い場合には前記マーク−イン・オーディオ・フレームを前記最初のオーディオ・フレームに指定し、前記マーク−イン・オーディオ・フレームの開始時間が前記第一のビデオ・フレームの開始時間より遅い場合には前記マーク−イン・オーディオ・フレームの直前のオーディオ・フレームを前記最初のオーディオ・フレームに指定するプログラム命令とを与えることによって判別されることを特徴とする媒体。
【0156】
(44) (42)に記載のオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、前記指定された最後のオーディオ・フレームは、
前記最後のビデオ・フレームの終了時間に最も近く関係する開始時間を有するマーク−アウト・オーディオ・フレームを識別するプログラム指令と、
前記マーク−アウト・オーディオ・フレームの開始時間が少なくとも前記最後のビデオ・フレームの終了時間と同程度に早い場合には前記マーク−アウト・オーディオ・フレームを前記最後のオーディオ・フレームに指定し、前記マーク−アウト・オーディオ・フレームの開始時間が前記最後のビデオ・フレームの終了時間より遅い場合には前記マーク−アウト・オーディオ・フレームの直前のオーディオ・フレームを前記最後のオーディオ・フレームに指定するプログラム指令とを与えることによって判別されることを特徴とする媒体。
【0157】
(45) (41)に記載のオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、さらに、
前記最初のオーディオ・フレームで始まり第一の所定のオーディオ・フレームまで伸び、第二の所定のオーディオ・フレームで始まり前記最後のオーディオ・フレームまで伸びる所定の数のオーディオ・フレームを処理するプログラム命令を含むことを特徴とする媒体。
【0158】
(46) (45)に記載のオーディオビジュアル・ファイルからセグメントをコピーするためのプログラム命令を含むコンピュータが読み取り可能な媒体であって、前記処理は、さらに、
前記最初のオーディオ・フレームで始まり前記第一の所定のオーディオ・フレームまで伸びる所定の数のオーディオ・フレームを復号するプログラム命令と、
前記復号された所定の数のフレームを再符号化するプログラム命令とを含むことを特徴とする媒体。
【0159】
【発明の効果】
本発明の効果は数多いが、本発明の特に顕著な効果は、ストリーム・エラーが一オーディオ・フレームの約半分を超えることが防がれ、また、連続コピー操作の後に貼り合わされるセグメントの数にかかわらず、ビデオ・フレームとオーディオ・フレームの間でほぼ同期がとられることである。この結果、オーディオ構成要素がビデオ構成要素とほぼ同期した状態を確保しながら、オーディオおよびビデオ・ビット・ストリームを編集する方法および装置を実現することができる。
【図面の簡単な説明】
【図1A】本発明の一実施の形態にもとづいてほぼ同期したオーディオ・構成要素を生成することに関係する処理ステップを説明するために示した多数のオーディオビジュアル・フレーム・シーケンスの例を示す図である。
【図1B】本発明の一実施の形態にもとづいて図1Aの表示順序ストリームからコピーされたオーディオビジュアル・セグメントの例を示す図である。
【図2】本発明の一実施の形態にもとづいたオーディオビジュアル・ファイルの編集を示すデータ・フロー・アーキテクチャーの図である。
【図3】本発明の一実施の形態にもとづいたオーディオビジュアル・ファイルの編集の好ましいステップを示すフローチャートである。
【図4】本発明の一実施の形態にもとづいた任意の適当なオペレータのためにオプションでグル・セグメントを生成する方法を示すフローチャートである。
【図5】本発明の一実施の形態にもとづいたコピー・オペレータの実行に関係する処理ステップを示すフローチャートである。
【図6】本発明の一実施の形態にもとづいた図5のミドル・グルの出力に関係する処理ステップを示すフローチャートである。
【図7】本発明の一実施の形態にもとづいた図5のイン・グルの出力に関係する処理ステップを示すフローチャートである。
【図8】本発明の一実施の形態にもとづいた図5のアウト・グルの出力に関係する処理ステップを示すフローチャートである。
【図9】本発明の編集装置によって行なわれる第二のパスの間に要求された出力ストリームを生成することに関係する処理ステップの概要を示すフローチャートである。
【図10】本発明の一実施の形態にもとづいて入力ソースから引き出されるデータを多重化することに関係する処理ステップの詳細を示す図である。
【図11】本発明の一実施の形態にもとづいてスティッチャ・オブジェクトによって行なわれる処理ステップの概要を示す図である。
【図12】本発明の一実施の形態にもとづいてステップ・オブジェクトによって行なわれる処理ステップの詳細を示す図である。
【図13】本発明の一実施の形態にもとづいてタブを処理することに関係する処理ステップを示すフローチャートである。
【図14】本発明の一実施の形態にもとづいて貼り合わされる複数のオーディオビジュアル・セグメントを示す線図である。
【図15】本発明の一実施の形態にもとづく複数のタブ処理計算を示す表である。
【図16】本発明の一実施の形態にもとづいて処理されるタブの後のオーディオ・フレーム・エラーを示す線図である。
【図17】本発明の一実施の形態にもとづいてオーディオビジュアル編集ステップを行なうためのコンピューター・システムの例を示すブロック線図である。
【符号の説明】
50…符号化順序ストリーム、52…表示順序ストリーム、60…オーディオビジュアル・セグメント、9−28…ビデオ・フレーム、56,58−62,64…オーディオ・フレーム、100…データ・フロー・アーキテクチャ、102…MEDITエンジン、104…コピー・オペレータ、106…アプリケーション、108…編集リスト、140…記憶媒体。

Claims (7)

  1. 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、
    前記第一のオーディオビジュアル・セグメントの中のタブ−イン・オーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするステップであって
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、前記第一のオーディオ・フレームを用いて位置合わせを行い
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、前記第二のオーディオ・フレームを用いて位置合わせするステップと、
    前記第一および第二のオーディオビジュアル・セグメントを貼り合わせるステップと、
    前記第二のオーディオビジュアル・セグメントの中の第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記第一のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームを落とすステップと、を有し、
    前記累積エラーは、前記第一のオーディオビジュアル・セグメントのストリーム・エラーおよび前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームのタブ・エラーを含むことを特徴とするオーディオビジュアル・セグメントを貼り合わせる方法。
  2. 請求項1に記載の第一および第二のオーディオビジュアル・セグメントを貼り合わせる方法であって、さらに、
    記最後のオーディオ・フレームに関係する累積エラーが約半フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントの中のタブ−アウト・オーディオ・フレームを落とすステップ、を有することを特徴とするオーディオビジュアル・セグメントを貼り合わせる方法。
  3. 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する編集された第一および第二のオーディオビジュアル・セグメントを接合する方法であって、
    前記第一のオーディオビジュアル・セグメントの中のタブ−イン・オーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするステップであって
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半フレームより小さい場合には、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームを用いて位置合わせを行い
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームを用いて位置合わせするステップと
    前記第一のオーディオビジュアル・セグメントからの前記第二のオーディオ・フレームが前記タブ−イン・オーディオ・フレームとして位置合わせされる場合には、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームを落とすステップと、
    前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記最後のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第一のオーディオビジュアル・セグメントの中の前記最後のオーディオ・フレームを落とすステップと、
    前記第二のオーディオビジュアル・セグメントの中の第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記第一のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームを落とすステップとを有し、
    前記累積エラーは、前記最後のオーディオ・フレームを落とすステップの後に存在するストリーム・エラーおよび前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームのタブ・エラーを含むことを特徴とするオーディオビジュアル・セグメントを接合する方法。
  4. 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせる装置であって、
    前記第一のオーディオビジュアル・セグメントの中の最初のオーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするよう構成されたアライナーを有し、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが約半オーディオ・フレームより小さい場合には、前記最初のオーディオ・フレームは、前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームであり、
    前記第二のオーディオビジュアル・セグメントの中の第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記第一のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームを落とし、
    前記累積エラーは、前記第一のオーディオビジュアル・セグメントのストリーム・エラーおよび前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームのタブ・エラーを含むことを特徴とするオーディオビジュアル・セグメントを貼り合わせる装置。
  5. 請求項4に記載のオーディオビジュアル・セグメントを貼り合わせる装置であって、さらに、
    記最後のオーディオ・フレームに関係する累積エラーが約半フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントの中のタブ−アウト・オーディオ・フレームを落とすことを特徴とするオーディオビジュアル・セグメントを貼り合わせる装置。
  6. 各オーディオビジュアル・セグメントが、第一のオーディオ・フレーム、順序として前記第一のオーディオ・フレームに続く第二のオーディオ・フレーム、および最後のオーディオ・フレームを含む複数のオーディオ・フレームと、第一のビデオ・フレームおよび最後のビデオ・フレームを含む複数のビデオ・フレームとを有する第一および第二のオーディオビジュアル・セグメントを貼り合わせるプログラム命令を含むコンピュータが読み取り可能な媒体であって、
    前記第一のオーディオビジュアル・セグメントの中のタブ−イン・オーディオ・フレームを前記第一のオーディオビジュアル・セグメントの中の前記第一のビデオ・フレームと位置合わせするプログラム命令であって
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより小さい場合には、前記第一のオーディオ・フレームを用いて位置合わせを行い
    前記第一のオーディオビジュアル・セグメントからの前記第一のオーディオ・フレームに関係するタブ・エラーが半フレームより大きい場合には、前記第二のオーディオ・フレームを用いて位置合わせするプログラム命令と、
    前記第一および第二のオーディオビジュアル・セグメントを貼り合わせるプログラム命令と、
    前記第二のオーディオビジュアル・セグメントの中の第一のオーディオ・フレームに関係する累積エラーが約半オーディオ・フレームを超えるか否かを判別し、前記第一のオーディオ・フレームに関係する前記累積エラーが約半オーディオ・フレームを超えると判別された場合には、前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームを落とすプログラム命令と、を有し、
    前記累積エラーは、前記第一のオーディオビジュアル・セグメントのストリーム・エラーおよび前記第二のオーディオビジュアル・セグメントの中の前記第一のオーディオ・フレームのタブ・エラーを含むことを特徴とするコンピュータが読み取り可能な媒体。
  7. 請求項6に記載のコンピュータが読み取り可能な媒体であって、さらに、
    記最後のオーディオ・フレームに関係する累積エラーが約半フレームより大きい場合には、前記第一のオーディオビジュアル・セグメントの中のタブ−アウト・オーディオ・フレームを落とすプログラム命令、を有することを特徴とするコンピュータが読み取り可能な媒体。
JP31566797A 1996-11-15 1997-11-17 オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体 Expired - Fee Related JP3768662B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US4682296P 1996-11-15 1996-11-15
US60/046822 1996-11-15

Publications (2)

Publication Number Publication Date
JPH10271446A JPH10271446A (ja) 1998-10-09
JP3768662B2 true JP3768662B2 (ja) 2006-04-19

Family

ID=21945583

Family Applications (1)

Application Number Title Priority Date Filing Date
JP31566797A Expired - Fee Related JP3768662B2 (ja) 1996-11-15 1997-11-17 オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体

Country Status (2)

Country Link
US (1) US6661430B1 (ja)
JP (1) JP3768662B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6654933B1 (en) * 1999-09-21 2003-11-25 Kasenna, Inc. System and method for media stream indexing
JP4269122B2 (ja) * 1999-10-20 2009-05-27 ソニー株式会社 記録装置および記録方法
US7277956B2 (en) 2000-07-28 2007-10-02 Kasenna, Inc. System and method for improved utilization of bandwidth in a computer system serving multiple users
US8458754B2 (en) 2001-01-22 2013-06-04 Sony Computer Entertainment Inc. Method and system for providing instant start multimedia content
AU2002247257A1 (en) 2001-03-02 2002-09-19 Kasenna, Inc. Metadata enabled push-pull model for efficient low-latency video-content distribution over a network
US7143353B2 (en) * 2001-03-30 2006-11-28 Koninklijke Philips Electronics, N.V. Streaming video bookmarks
JP4534168B2 (ja) * 2001-09-27 2010-09-01 ソニー株式会社 情報処理装置および方法、記録媒体、並びにプログラム
US7199805B1 (en) * 2002-05-28 2007-04-03 Apple Computer, Inc. Method and apparatus for titling
US7400653B2 (en) * 2004-06-18 2008-07-15 Dolby Laboratories Licensing Corporation Maintaining synchronization of streaming audio and video using internet protocol
US7418394B2 (en) * 2005-04-28 2008-08-26 Dolby Laboratories Licensing Corporation Method and system for operating audio encoders utilizing data from overlapping audio segments
US8141111B2 (en) * 2005-05-23 2012-03-20 Open Text S.A. Movie advertising playback techniques
US8145528B2 (en) 2005-05-23 2012-03-27 Open Text S.A. Movie advertising placement optimization based on behavior and content analysis
US8724969B2 (en) 2005-05-23 2014-05-13 Open Text S.A. Method, system and computer program product for editing movies in distributed scalable media environment
US9648281B2 (en) 2005-05-23 2017-05-09 Open Text Sa Ulc System and method for movie segment bookmarking and sharing
US7793329B2 (en) 2006-02-06 2010-09-07 Kasenna, Inc. Method and system for reducing switching delays between digital video feeds using multicast slotted transmission technique
US9483405B2 (en) 2007-09-20 2016-11-01 Sony Interactive Entertainment Inc. Simplified run-time program translation for emulating complex processor pipelines
US8189492B2 (en) * 2009-03-18 2012-05-29 Microsoft Corporation Error recovery in an audio-video multipoint control component
US8433759B2 (en) 2010-05-24 2013-04-30 Sony Computer Entertainment America Llc Direction-conscious information sharing
US8994777B2 (en) * 2012-03-26 2015-03-31 Salesforce.Com, Inc. Method and system for web conference recording
KR101328199B1 (ko) * 2012-11-05 2013-11-13 넥스트리밍(주) 동영상 편집 방법 및 그 단말기 그리고 기록매체
US20150113408A1 (en) * 2013-10-18 2015-04-23 Apple Inc. Automatic custom sound effects for graphical elements
JP6258168B2 (ja) * 2014-09-12 2018-01-10 株式会社東芝 配信装置、再生装置および配信システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5634020A (en) * 1992-12-31 1997-05-27 Avid Technology, Inc. Apparatus and method for displaying audio data as a discrete waveform
WO1996032722A1 (fr) * 1995-04-08 1996-10-17 Sony Corporation Systeme de mise en forme
US6122668A (en) * 1995-11-02 2000-09-19 Starlight Networks Synchronization of audio and video signals in a live multicast in a LAN
US5886692A (en) * 1996-11-15 1999-03-23 Futuretel, Inc. Attracting and repelling edit blocks in a user interface of a video editor
US6285361B1 (en) * 1996-11-15 2001-09-04 Futuretel, Inc. Method and apparatus for clipping video segments from an audiovisual file
US6201925B1 (en) * 1996-11-15 2001-03-13 Futuretel, Inc. Method and apparatus for editing video files
US6400886B1 (en) * 1996-11-15 2002-06-04 Futuretel, Inc. Method and apparatus for stitching edited video segments
US6262777B1 (en) * 1996-11-15 2001-07-17 Futuretel, Inc. Method and apparatus for synchronizing edited audiovisual files
US6157771A (en) * 1996-11-15 2000-12-05 Futuretel, Inc. Method and apparatus for seeking within audiovisual files

Also Published As

Publication number Publication date
JPH10271446A (ja) 1998-10-09
US6661430B1 (en) 2003-12-09

Similar Documents

Publication Publication Date Title
US6262777B1 (en) Method and apparatus for synchronizing edited audiovisual files
JP3768662B2 (ja) オーディオビジュアル・セグメントを貼り合わせる方法および装置、オーディオビジュアル・セグメントを接合する方法、ならびにコンピュータが読み取り可能な媒体
US6285361B1 (en) Method and apparatus for clipping video segments from an audiovisual file
JP3706721B2 (ja) オーディオビジュアル・ファイル内部での検索方法および検索装置
US6400886B1 (en) Method and apparatus for stitching edited video segments
US6546189B1 (en) Method and apparatus for editing compressed moving pictures and storage medium
JP4270379B2 (ja) デジタル情報の効率的な伝送および再生
KR100725631B1 (ko) 전이 스트림 발생 및 처리를 위한 방법
JP4503858B2 (ja) 遷移ストリームの生成/処理方法
JP3361009B2 (ja) ビデオ符号化方法および速度量子化モデルを利用して符号化を行うシステム
KR101218951B1 (ko) 대체 디지털 오디오와 비디오 콘텐츠를 제공하는 방법, 비디오 편집기 및 컴퓨터 판독 가능한 저장 매체
US6201925B1 (en) Method and apparatus for editing video files
US20080002776A1 (en) Media Content and Enhancement Data Delivery
JP2001520814A (ja) エンコードされているビデオシーケンスの品質を手動によりユーザが変更できるようにした方法及びシステム
JP2003534684A (ja) 圧縮ビデオを下流で編集する方法
CN103125123A (zh) 再现装置、再现方法、集成电路、广播系统及广播方法
JP5175375B2 (ja) ストリーミング制約の変更に基づく動的品質調整
JP2001128126A (ja) エンコードされたビデオビットストリームのセクションを交換するための方法及びシステム
JP2001520813A (ja) オーディオエンコーダの数が低減されるオーディオ映像エンコードシステム
WO2005088964A1 (ja) 録画再生編集装置
EP1654874B1 (en) Frame-accurate editing methods and systems
EP0882358A2 (en) Method and apparatus for transitions, reverse play and other special effects in digital motion video
US8514949B1 (en) Synchronous, multi-stream decoder
TW571588B (en) Modifying video signals by converting non-intra pictures
US20130287361A1 (en) Methods for storage and access of video data while recording

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041012

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050111

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050301

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050407

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050621

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050831

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090210

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100210

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110210

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120210

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130210

Year of fee payment: 7

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313115

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees