JP4310195B2 - エンコードされたオーディオ/ビデオシーケンスの編集 - Google Patents

エンコードされたオーディオ/ビデオシーケンスの編集 Download PDF

Info

Publication number
JP4310195B2
JP4310195B2 JP2003579224A JP2003579224A JP4310195B2 JP 4310195 B2 JP4310195 B2 JP 4310195B2 JP 2003579224 A JP2003579224 A JP 2003579224A JP 2003579224 A JP2003579224 A JP 2003579224A JP 4310195 B2 JP4310195 B2 JP 4310195B2
Authority
JP
Japan
Prior art keywords
frame
sequence
frames
encoded
identified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003579224A
Other languages
English (en)
Other versions
JP2005521311A5 (ja
JP2005521311A (ja
Inventor
ピー ケリー,デクラン
ハッセル,ヨーゼフ ペー ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2005521311A publication Critical patent/JP2005521311A/ja
Publication of JP2005521311A5 publication Critical patent/JP2005521311A5/ja
Application granted granted Critical
Publication of JP4310195B2 publication Critical patent/JP4310195B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/02Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
    • G11B27/031Electronic editing of digitised analogue information signals, e.g. audio or video signals

Description

本発明は、フレームに基づいてコードされたオーディオ/ビデオ(A/V)データの編集をするための方法及び装置に関し、より詳細には、下記に限定しないが、MPEG2標準によりエンコードされたオーディオ/ビデオデータに関する。フレームに基づくA/Vデータの少なくとも2つのシーケンスは、第一シーケンスの第一編集ポイントまで含んだ第一フレームシーケンスのフレーム及び第二シーケンスの第二編集ポイントから含んだ第二シーケンスのフレームに基づいて第三の組合せシーケンスを形成するために組み合される。第一及び第二シーケンスの各々は、多数のフレーム(これより以後、“Iフレーム”)がシーケンスの如何なる他のフレームと関係なくイントラコードされ(intra-coded)、多数のフレーム(これより以後、“Pフレーム”)はシーケンスの一つ先の参照フレームに関係してそれぞれコードされ、残り(これより以後、“Bフレーム”)はシーケンスの一つ先及び一つ後の参照フレームに関係してそれぞれコードされるようにコードされ、参照フレームはIフレーム又はPフレームであり、フレームの参照のコード化は、関連したレームでの同様のマクロブロックを示すフレームでの移動ベクトルに基づいている。
MPEGは、国際標準組織(ISO)のムービングピクチャーエキスパートグループ(Moving Picture Experts Group)(“MPEG”)によって確立された、ビデオ信号の圧縮規格である。MPEGは、多数の周知のデータ圧縮技術を単一システムに統合する、マルチステージのアルゴリズムである。それらは、移動補償型の予期的なコード化、離散コサイン変換(“DCT”)、適応性のある量子化、及び可変長のコード化(“VLC”)を含む。MPEGの主要な目的は、フレーム間圧縮及びインターリーブされたオーディオを許可している一方、一時的なドメイン(フレームからフレーム)と同様に空間的なドメイン(ビデオフレーム内)にも通常存在する余剰を削除することである。MPEG1はISO/IEC11172で定義され、MPEG2はISO/IEC13818で定義される。
飛び越し走査信号と非飛び越し走査信号のビデオ信号の2つの基本形態がある。飛び越し走査信号は、テレビシステムで採用される技術であり、そのテレビシステムは、各テレビフレームが奇数フィールド(odd-field)と偶数フィールド(even-field)と呼ばれる2フィールドから構成される。各フィールドは、側面から側面へ且つ上部から底部へ全体のピクチャーを走査する。
しかしながら、一つの(例えば、奇数)フィールドの水平の走査ラインは、別の(例えば、偶数)フィールドの水平の走査ライン間の半分に位置する。飛び越し走査信号は、放送テレビ(“TV”)及びハイビジョンテレビ(“HDTV”)において、典型的に使用される。非飛び越し走査信号は、典型的には、コンピュータで使用される。MPEG1プロトコルは、非飛び越しビデオ信号を圧縮/非圧縮での使用において目的とされ、MPEG2プロトコルは、DVDムービーなどの非飛び越し信号と同様に、飛び越しTV及びHDTV信号を圧縮/非圧縮での使用において目的とされる。
従来のビデオ信号がいずれかのMPEGプロトコルと一致して圧縮される前に、まずデジタル化されなければならない。デジタル処理は、ペル(pels)(ピクセル素子)として呼ばれるビデオ画像の特定位置でビデオ画像の強度及び色を特定するデジタルビデオデータを生成する。各ペルは、垂直のカラムと水平の列に配置された座標のアレイに位置した座標に関係している。各ペルの座標は、水平の列と垂直のカラムとの交点によって定義される。ビデオの各フレームをデジタルビデオデータのフレームへの変換において、非デジタル化ビデオのフレームを作り上げる2つの飛び越しフィールドの走査ラインは、デジタルデータの単一マトリックスで相互デジタル化される。デジタルビデオデータの相互デジタル化は、奇数フィールドからの走査ラインのペルをデジタルビデオデータのフレームでの奇数列の座標を有するようにさせる。同様に、デジタルビデオデータの相互デジタル化は、偶数フィールドからの走査ラインのペルをデジタルビデオデータのフレームでの偶数列の座標を有するようにさせる。
図1を参照するに、各MPEG1及びMPEG−2は、一般的にフレームの連続する発生である、ビデオ入力信号をシーケンス又はフレームのグループ(“GOF”)10に分割し、ピクチャーのグループ(“GOP”)とも呼ばれる。それぞれのGOF10のフレームは、特定のフォーマットにエンコードされる。エンコードされたデータのそれぞれのフレームは、例えば、16の画像ライン14を表わすスライス12に分割される。各スライス12は、例えば、各々が16x16のペルを表わすマクロブロックに分割される。各マクロブロック16は、輝度データに関する幾つかのブロック18及びクロミナンスデータに関する幾つかのブロック20を含む多数のブロック(例えば、6ブロック)に分割される。MPEG2プロトコルは、輝度及びクロミナンスデータを個別にエンコードし、次いで、エンコードされたビデオデータを圧縮されたビデオストリームに組み合わす。輝度ブロックは、それぞれの8x8マトリックスのペル21に関する。各クロミナンスブロックは、マクロブロック16によって表わされる、全体の16x16マトリックスのペルに関する8x8マトリックスのデータを含む。ビデオデータがエンコードされた後、MPEGプロトコルと一致して、圧縮され、緩衝され、修正され、最終的にデコーダに送信される。MPEGプロトコルは、典型的には、各々がそれぞれのヘッダー情報を備える複数の層を含む。名目上、各ヘッダーは開始コード、それぞれの層に関するデータ、ヘッダー情報を追加するための条件を含む。各マクロブロックからの6ブロックの例は、一つの可能性である(4:2:0フォーマットと呼ばれる。)。MPEG−2はまた、マクロブロック当たり12ブロックを有するような他の可能性を与える。
一般的に、ビデオデータに適用される3つの異なるエンコードフォーマットがある。イントラコード化(Intra-coding)は、エンコードは専らデータのマクロブロック16が位置するビデオフレーム内の情報に依存する、“I”ブロックを生成する。インターコード化(Inter-coding)は、“P”ブロック又は“B”ブロックのいずれかを生成してよい。“P”ブロックは、エンコードがビデオフレーム(Iフレーム又はPフレームのいずれかで、これ以後は共に“参照フレーム”と呼ぶ)以前に見られた情報のブロックに基づく予測に依存するデータのブロックを設計する。“B”ブロックは、エンコードが多くて2つの取り囲むビデオフレーム、つまり、ビデオデータの先の参照フレーム及び/又は後の参照フレームからのデータのブロックに基づく予測に依存する、データブロックである。原理において、2つの参照フレーム(Iフレーム又はPフレーム)間で、幾つかのフレームはBフレームとしてコードできる。しかしながら、中間の多くのフレームがある(さらに、結果としてBフレームのコードサイズが増大する)場合、参照フレームでの一時的な差異が増大する傾向があるので、実際のMPEGコードは、参照フレーム間で、2つだけのBフレームが使用され、各々は参照番号10で図1に示されるように同一の2つの取り囲む参照フレームに依存するように使用される。フレームからフレームの余剰を削除するために、ビデオ画像での移動対象の移動は、Pフレーム及びBフレームにおいて評価され、フレームからフレームまでの前述のような動きを表わす移動ベクトル内にエンコードされる。Iフレームは、すべてのブロックがインターコードされたフレームである。Pフレームは、ブロックがPブロックとしてインターコードされるフレームである。Bフレームは、ブロックがBブロックとしてインターコードされるフレームである。効果的にコードするインターコードがフレームのすべてのブロックにおいて可能でない場合、幾つかのブロックはPブロックとして又はIブロックとしてさえもインターコードされてよい。同様に、Pフレームの幾つかのブロックは、Iブロックとしてコードされてよい。異なるフレームタイプ間の依存性は、図2に例示される。図2Aは、Pフレーム220が一つの前の参照フレーム210(Pフレーム又はIフレームのいずれか)に依存することを示す。図2Bは、Bフレーム250が一つの前の参照フレーム230及び一つの後の参照フレーム240に依存することを示す。
デジタル式にエンコードされたA/V及びそのようなデータ上で操作することができるデータ処理機器の高まった利用性で、必要は、フレームの1つのシーケンスの終了と、フレームの次のシーケンスの開始との間の変化が、デコーダによって、スムースに処理されるA/Vセグメントのシームレスの接合点のために生じた。特定の過程の使用が、ホームムービーの編集と、コマーシャルブレークの除去と、記録された放送材料の不連続性を含んで、A/Vシーケンスのシームレスの接合点における適用は多数である。さらなる例は、スプライト(sprites)(コンピュータで生じる画像)におけるビデオシーケンス背景を含み、この技術の使用例は、MPEGにコードされたビデオシーケンスの前に動く動画文字になるであろう。
例えば、MPEGにおいて記載されるように、フレーム間コードは、効果的なコードを達成するが、2つ以上のA/Vセグメントが組み合わせたセグメントを形成するシームレス方法で結合されることを必要とする場合に問題を引き起こす。P又はBフレームが組み合わされたシーケンスにもたらされる際にこの問題は特異的に生じるが、依存する一つのフレームは、組み合わされたシーケンスにもたらされない。エンコードされたA/Vシーケンスのフレームの正確な編集のためのデータ処理機器及び方法があり、フレームの第一及び代にシーケンスをブリッジするセグメントのフレームは、元来のフレームを完全に記録することによって生成される(例えば、特許文献1参照)。ブリッジセグメントは、参照フレームを失ったすべてのフレームを含む。記載された方法及び装置は、光学式に保存されたビデオシーケンスで特異的に適応され、専用ハードウェアのエンコーダの使用に依存する。PCなどの従来のデータ処理装置の技術を使用して、主にソフトウェアベースのエンコーダを使用することは、相当の時間を取り、例えば、ホームビデオなどの編集をユーザはしない。
WO00/00981
本発明の目的は、エンコードされたA/Vシーケンスを編集するための改善されたデータ処理装置及びエンコードされたA/Vシーケンスを編集する改善された方法を提供することである。特に、ソフトウェアベースのビデオ編集を可能にすることが目的である。
本発明の目的を達成するために、編集するためのデータ処理装置は、第一及び第二フレームシーケンスを受けるための入力を含み、第一の編集ポイント後の参照フレームに関してコードされる第一編集ポイントを含む第一シーケンスでフレームを識別するため、且つ第二の編集ポイント前の参照フレームに関してコードされる第二編集ポイントで開始する第二シーケンスでフレームを識別するための手段を含み、さらに、Bタイプの識別されたフレーム(元来のBフレーム)を、識別されたBフレームの各々において、元来のBフレームの移動ベクトルから単独でリエンコード(re-encoded)されたフレームの関連する移動ベクトルを派生することによって、リエンコードするためのリエンコーダを含む。
本発明者は、A/Vデータの従来のコード化と違って、ビデオ編集において、元来のエンコードされたフレームは利用可能であり、そこでエンコードされたデータは、ある範囲まで再利用できることを認識した。特に、移動ベクトルは、計算上の資源に関して高コストとなる、移動予測を含む移動ベクトルの完全な再計算を回避して、再利用できる。
従属項2に記載されるように、第一シーケンスの2つ(以上)のBフレームが後の参照フレームを失う場合、最後のBフレーム以外が、いまだに存在する先の参照フレームにだけ依存する単一側のBフレームとして、リエンコードされる。先の参照フレームに関するBフレームの移動ベクトルは、まだ使用できる。後の参照フレームに関する移動ベクトルはもはや使用できない。これは、平均してフレームのサイズの増大を導くであろう。マクロブロックの合理的な数のために、移動ベクトルが先の参照フレームに関して存在した場合(合理的な合致を示す)、サイズはただ一つの先のフレームに関してさらにコードされたPフレームのサイズと同様であるだろう。多数の移動ベクトルが先の参照ベクトルのために存在しない場合、多数のマクロブロックはイントラコードされる。結果となるサイズは、Iフレームのサイズと同様になるであろう。平均して、サイズの増大は適度になる。リエンコードが必要とされるわずかなフレームをエンコードする従来のMPEGにおいて、結果となるサイズ(及びビットレート)の増大が通常は許容範囲内におさまり、MPEG2の可変のビットレートのエンコードによるために、通常は、ビットレートの一時的な増大における十分な余裕がある。
従属項3に記載されるように、第一シーケンスの最後の識別されたBフレームは、先の参照フレームに依存するPフレームに対してリエンコードされる。先のIフレーム又はPフレームに関して存在する移動ベクトルは再利用される。
従属項4に記載されるように、あるいは従属項8に記載されるように、好ましくは、先の参照フレームに依存するだけの単一側のBフレームとしてリエンコードされたBフレームに追加して、新規に作成されたPフレームは参照フレームとして(さらに)使用される。Pフレームに関する移動ベクトルは、後の参照フレームに関して使用された移動ベクトルに基づくことができる。それらの移動ベクトルは、Bフレームの効果的なコード化を可能にする。特に、先に参照ベクトルに関して移動ベクトルの高い比率が使用できる場合、Bフレームのコードサイズは、完全なリエンコードによって達成できるサイズに非常に近接する。
従属項5に記載されるように、移動ベクトルの方向は同一性を維持するが、長さは、一時的に(そのうちに)近接する新規の参照フレームにおいて補償するために減少される。
従属項6に記載されるように、長さは、新規の参照フレームが一時的に近接する比率にしたがって適応される。これは、対象物が、フレームシーケンスの持続にわたる一定の速度及び方向で実質的に移動する際に、画像にとって良好な近似である。
従属項7に記載されるように、探求が元来の移動ベクトルの長さに沿って実行される。これは、対象物の速度が変化する良好な合致の発見を可能にするが、含まれたフレームシーケンスの持続において、方向は実質的に同一性を維持する。
従属項9に記載されるように、引き継がれた第2シーケンスのフレーム中に、新規の参照フレームは、Pフレーム又はIフレームのいずれかに位置する。第一参照フレームがPフレームに位置する場合、このフレームはIフレームまでリエンコードされる。これは、組み合わされたシーケンスの第二部分において、適切な参照フレームが元来のIフレーム又は新規に生成されたIフレームのいずれかに存在することを保証する。
従属項9に記載されるように、第二シーケンスの他の識別されたBフレームは、常に状況が発生する、新規に作成したIフレーム又は元来のIフレームに関して単一側のBフレームとして、ここでリエンコードされる。存在する移動ベクトルは、修正されない形態において再利用できる。
本発明の前述及び他の態様は、下記に記載の実施態様に関して詳細に説明され、明確となる。
図3Aは、MPEG2コード化によるフレームの典型的なシーケンスを示す。下記の記載はこのコード化に集中するが、当業者は他のA/Vコード化標準に対する本発明の適用可能性を認識するであろう。図3Aはまた、フレーム間の依存性を示す。Bフレームの前方の依存性によって引き起こされ、図3Aに示されるようなシーケンスのフレームの送信は、受信したBフレームが、後の参照フレームが受信した(さらにデコードした)後にデコードできるだけである効果を有する。デコード段階でシーケンスによる“ジャンプ”を有することを回避するために、フレームは図3Aのディスプレイシーケンスに通常は保存も送信もされないが、図3Bに示すような対応する送信シーケンスには保存又は送信される。送信シーケンスにおいて、参照フレームは、参照フレームに依存するBフレーム以前に送信される。これは、受信されるフレームがシーケンスでデコードできることを意味する。デコードされた前方の参照フレームのディスプレイが、依存するBフレームが表示されるまで遅れることを認識するであろう。
本発明によるデータ処理装置は、第二編集ポイント(インポイント)で開始する第二シーケンスのフレームと第一編集ポイント(アウトポイント)まで含む第一シーケンスのフレームとを組み合わせる。認識されるように、第二シーケンス(インシーケンス(in-sequence))のフレームは、第一シーケンスのフレームと同一のシーケンスから実際に得られてよい。例えば、編集は、ホームビデオからの一つ以上のフレームを除去して実際に含んでよい。編集ポイントにわたるフレームの依存性により、幾つかのフレームのリエンコードが必要とされる。本発明によると、リエンコードは、存在する移動ベクトルを再利用する。最後のリエンコードを生じる、リエンコード段階において、新規の移動評価は生じない。結果として、第一シーケンスから引き継がれたフレームは、リエンコード段階において、第二シーケンスのフレームに関して予測されず、逆もまた同様である。したがって、2つのセグメント間のコード化の依存性は確立されないであろう。このようにして、リエンコードはセグメントジタイに制限される。図4及び5は、第一シーケンスにおけるリエンコードの例を示す。図6及び7は、第二シーケンスにおけるリエンコードの例を示す。組み合わされたシーケンスは、第二シーケンスのリエンコードされたセグメントを備える第一シーケンスのリエンコードされたセグメントの単なる連続である。
図4は、アウトポイントがフレームBである際の第一シーケンスのリエンコードを例示する。これは、Bまで含むすべてのフレームが編集(組み合わせ)されたシーケンスに表わされるが、連続的にB(ディスプレイの順番で)続くすべてのフレームが組み合わされたシーケンスで表わされないことを意味する。実施例において、BはP及びPに依存する。本発明によると、Bは、P として示されるPフレームとしてリエンコードされる。示されるように、P はPだけに関してコードされる。Pから予期してコードされる元来のBフレームの移動ベクトルは、P フレームで完全に再利用できる。追加的な移動ベクトルは、計算される必要はない。特に、移動評価は要求されない。Pは組み合わされたシーケンスで表わされないので、PにおけるBの移動ベクトルはもはや使用できない。結果として、平均におけるP でのさらなるマクロブロックは、イントラマクロブロックとしてコードされる必要があり、Bおける場合であった。これはBのサイズを増大する(コード化効率を減少する)が、移動評価を消耗する時間で完全なリエンコードを使用しない。図4Cは図4Bのシーケンスを示すが、ここでは送信シーケンスを示さない。
図5は、アウトポイントがフレームBである第一シーケンスのリエンコードを例示する。この実施例において、両フレームB及びBは、Pと同様にP関して予期される。Pは引き継がれない。本発明によると、参照フレームが失われたBフレームの最後の一つは、Pフレームまでリエンコードされる。この場合、Bは、Pに単独で依存するフレームP にリエンコードされる。リエンコードは、図4のBにおける記載と同様である。参照フレーム(この場合、Bだけ)を失ったすべてのすべての他のBフレームは、残存する参照フレーム(つまり、先の参照フレーム)に関してコードされる単一側のBフレームとしてリエンコードされる。図5Bで示されるように、Bは、Pから予期された単一側のB フレームにリエンコードされる。Bの移動ベクトルは再利用される。PにおけるBの移動ベクトルはもはや使用できない。結果として、B でのさらなるマクロブロックは、イントラマクロブロック(intra macroblocks)としてコードされる必要があり、Bにおける場合であった。
図5Dは、移動ベクトルがリエンコードされたP からのリエンコードされたフレームB を予期するために生成される、好ましい実施態様を例示する。それ自体において、移動ベクトルはBから予期する元来のフレームBに存在しない。しかしながら、Pから予期するBの移動ベクトルは、この目的において再利用できる。図5Aの実施例及び従来のA/Vエンコードを考慮し、フレームが固定された時間間隔でのシーケンスに位置する際に、フレームBとPとの間の時間は、フレームBとBとの間の時間の2倍である。時間間隔B乃至Pの段階において、対象物の移動が実質的に一定であると仮定すると、移動ベクトルの長さを半分にすることは、P からのB を予期するための移動ベクトルの合理的な評価を与える。好ましくは、それら移動ベクトルは、PからのB を予期する移動ベクトルに追加して使用される。この後者の場合、これはB を規則的な二重側のBフレームにさせる。図5の実施例は、2つのBフレームが参照フレーム間に位置するMPEG2の通常の状態を記載する。当業者は、参照フレーム間の2つ以上のBフレームが存在する状況において前述を用意に適応できる。そのような、より一般的な場合において、移動ベクトルの長さは修正されるように必要とされる要素は、(BフレームとPフレームとの間のフレーム数+1)/(元来のBフレームとそれに続く参照フレームとの間のフレーム数+1)によって与えられる。
さらなる好ましい実施態様において、P からのB を予期するための移動ベクトルの合致の正確性は、0と1との間の因子でPからのBを予期するための元来の移動ベクトルの長さを変化することによって増大される。好ましくは、2倍の探求は、0.5(一定の移動にとにかく良好な一致)で開始するこの間隔において実行される。探求技術を使用して、良好な合致は、移動の方向が含まれた時間間隔において実質的に一定を維持する際に対象物において見られることができる。
図6は、インポイントがフレームpである際の第二シーケンスのリエンコードを例示する。これは、pで開始するすべてのフレームが編集された(組み合わされた)シーケンスで表わされるが、連続的にpに先立つ(ディスプレイの順番で)すべてのフレームは、組み合わされたシーケンスで表わされない。本発明によると、インポイントで開始する、第一参照フレームは、Iフレーム又はPフレームのいずれかで位置する。このフレームがIフレームである場合、組み合わされたシーケンスで未変更に引き継がれる。フレームがPフレームである場合、Iフレームまでリエンコードされる、つまり、すべてのマクロブロックはイントラブロックとしてリエンコードされる。図6の実施例において、第一参照フレームはpである。したがって、pはi までリエンコードされる。フレームb及びb10は、参照フレームpにすでに依存するBフレームである。移動ベクトルは引き継がれることができる。結果として、b及びb10は、リエンコードされる必要はない。図6Bは、ディスプレイシーケンスにおいて生じるリエンコードされたフレームを示す。図6Cは、送信シーケンスでの同一シーケンスを示す。
図7は、インポイントがフレームbである第二シーケンスをリエンコードする第二実施例を与える。インポイントで開始して、第一参照フレームはフレームpである。さらに図6において記載されるように、pはi までリエンコードされる。次に、第二シーケンスのすべてのBフレームは、Iフレーム又はインポイントbに先行するPフレームのいずれかである、参照フレームを失い識別される。実施例において、b及びbは、前述のBフレームである。識別されたBフレームは、単一側のBフレームとしてリエンコードされる。先行する参照フレームに対する参照は除去される。残存する後の参照フレームの依存性は維持される。実施例において、残存する後のフレームpはi までリエンコードされる。したがって、b及びbは、i に依存してフレームb 及びb として、それぞれリエンコードされる。
図8は、本発明によるデータ処理システムのブロック図を示す。データ処理システム800は、PCで実行されてよい。システム800は、A/Vフレームの第一及び第二シーケンスを受けるための入力810を有する。プロセッサ830は、A/Vフレームを処理する。特に、フレームがアナログフォーマットに供給される場合、追加的なA/Vハードウェア860は、例えば、アナログビデオサンプラーの形態で使用されてよい。A/Vハードウェア860は、PCビデオカードの形態であってよい。フレームがMPEG2のような適切なデジタルフォーマットでコードされない場合、プロセッサは所望のフォーマットでフレームを最初にリエンコードしてよい。所望のフォーマットに対する初期のコード化又はリエンコードは、通常は全体のシーケンスに適用され、ユーザの相互作用を要求しない。そういうものとして、操作は、正確にイン及びアウトポイントを決定することを通常極度のユーザ相互作用に要求するビデオ編集とは異なり、バックグラウンドで又は放置されて発生することができる。これは、より重要な編集段階において、リアルタイムに実行させる。シーケンスは、ハードディスク又は迅速な光学記憶のサブシステムなどのバックグラウンドメモリ840に記憶される。図8がプロセッサ830によるA/Vストリームの流れを示しているが、PCI及びIDE/SCSIなどの実際に適切な通信システムは、入力810から保存840まで直接的にストリームを導くように使用されてよい。編集のために、プロセッサは、編集するシーケンス並びにイン及びアウトポイントで情報を必要とする。好ましくは、ディスプレイが利用可能なストリームでユーザ情報を提供する際に、ユーザは、対話型方法でマウス及びキーボードなどのユーザインターフェースを介して前述のような情報を供給し、所望であれば、フレームはストリームで正確に位置する。前述したように、ユーザは、選択した場面を除去又はコピーすることによって、ホームビデオなどの唯一のストリームを実際に編集してよい。この記載の目的において、これは同一のA/Vシーケンスを2倍処理すると考慮され、一度はストリーム内(第二シーケンス)として処理し、一度はストリーム外(第一シーケンス)として処理する。本発明によるシステムにおいて、両シーケンスは独立して処理でき、組み合わされた(編集された)シーケンスは両セグメントの連結から形成される。通常は、組み合わされたシーケンスはまたバックグラウンド記憶840に記憶される。組み合わされたシーケンスは、出力820を介して外部的に供給できる。所望の際、フォーマットの変換は、A/V I/Oハードウェア860を用いてなされてよく、例えば、適切なアナログフォーマットに変換されてよい。
前述したように、編集において、プロセッサ830は、組み合わされたシーケンス(アウトポイントまで含む第一シーケンスでのすべてのフレームインポイントで開始する第二シーケンスでのすべてのフレーム)において引き継がれることを必要とする第一及び第二シーケンスのセグメントを決定する。次に、Bフレームは参照フレームの一つを失って識別される。それらのフレームは、存在する移動ベクトルを再利用することによってリエンコードされる。前述のように、移動評価は本発明により要求されない。示されるように、あるマクロブロックはイントラマクロブロックとしてリエンコードされる必要があってよい。イントラコード化(インターコード化と同様に)は周知であり、当業者は前述の操作を実行することができる。リエンコードは、特別のハードウェアを用いてなされてよい。しかしながら、適切なプログラムの制御下において前述の目的のためにプロセッサ830を使用することが好ましい。プログラムはまた、バックグラウンド記憶840に記憶されてよく、操作段階において、RAMメモリなどのフォアグラウンドメモリ850にロードされてよい。同一のメインメモリ850は、リエンコードされているシーケンスの一時的な記憶(部分)のために使用されてよい。好ましい実施態様において前述されるように、システムはまた移動ベクトルの長さを評価するように作用される。それは、マクロブロックの適切な一致において確認する、好ましい2倍の探求を実行するために当業者の知識内である。移動ベクトルの最適な長さの含まれた評価は、適切なプログラムの制御下でプロセッサ830によって好ましく実行される。所望であれば、さらに追加的なハードウェアが使用されてよい。
前述の実施態様は本発明を限定のではなく、むしろ本発明を例示しており、当業者が請求項の範囲を逸脱しない限り代替となる実施態様を設計できることを注意するべきである。請求項において、括弧内の参照番号は、請求項を制限するようには構成されない。単語“有する”及び“含む”は、請求項に列記された以外の他の要素又は段階の存在を除外しない。本発明は、幾つかの別個の要素を有するハードウェアの手段によって、適切にプログラムされたコンピュータの手段によって実行できる。幾つかの手段を列挙して請求するシステムにおいて、幾つかのそれら手段は、ハードウェアの一つ及び同一のアイテムによって具体化できる。コンピュータプログラム製品は、光学記憶などの適切な媒体に記憶/分配されてよいが、インターネット又は無線テレコミュニケーションシステムを介して分配されるように他の形態で分配されてもよい。
従来のMPEG2エンコードを示す図である。 MPEG2のフレーム間のコード化を例示する図である。 ディスプレイとフレームの対応する送信シーケンスを示す図である。 アウトポイント(第一編集ポイント)を含んで第一シーケンスのリエンコードを示す図である。 異なるアウトポイントにおける第一シーケンスのリエンコードを示す図である。 インポイント(第二編集ポイント)を含んで第二シーケンスのリエンコードを示す図である。 異なるインポイントにおける第二シーケンスのリエンコードを示す図である。 本発明によるデータ処理装置のブロック図である。

Claims (8)

  1. 第一シーケンスでの第一編集ポイントまで含む第一フレームシーケンスのフレーム及び第二シーケンスでの第二編集ポイントから含む第二シーケンスのフレームに基づく第三の組み合わされたシーケンスを形成するフレームに基づくA/Vデータの少なくとも2つのシーケンスを編集するためのデータ処理装置であって、前記第一及び第二シーケンスの各々は、複数のフレーム(これより以後、“Iフレーム”)が前記シーケンスの他のフレームを参照せずにイントラコードされ、複数のフレーム(これより以後、“Pフレーム”)は前記シーケンスの一つ先の参照フレームを参照してそれぞれコードされ、残り(これより以後、“Bフレーム”)は前記シーケンスの一つ先及び一つ後の参照フレームを参照してそれぞれコードされるようにコードされ、前記参照フレームはIフレーム又はPフレームであり、前記フレームの参照のコード化は、参照されたフレームでの同様のマクロブロックを示す前記フレームでの移動ベクトルに基づいており、
    前記装置は、
    前記第一及び第二フレームシーケンスを受けるための入力と、
    前記第一の編集ポイント後の参照フレームに関してコードされる前記第一編集ポイントまで含む前記第一シーケンスのフレームを識別するため、且つ前記第二の編集ポイント前の参照フレームに関してコードされる前記第二編集ポイントで開始する前記第二シーケンスフレームを識別するための手段と、
    Bタイプの識別されたフレームの各々(元来のBフレーム)を、識別されたBフレームの各々において、単に前記元来のBフレームの移動ベクトルから対応するリエンコードされたフレームの移動ベクトルを導くことによって、前記対応するリエンコードされたフレームにリエンコードするためのリエンコーダと、
    を含み、
    前記リエンコーダは、連続して近接するIフレーム又はPフレームのいずれかである先行するフレームを参照して、Pフレーム(これより以後、“P*フレーム”)として前記第一シーケンスの前記識別されたBフレームの連続する最後の一つをリエンコードするように配置され、
    前記リエンコーダは、前記P*フレームを参照してBフレーム(これより以後、“B*フレーム”)として前記識別されたBフレームの連続する最後の一つ以外の前記第一シーケンスの識別されたBフレームをリエンコードするように配置され、前記P*フレームに関する前記B*フレームの移動ベクトルが、リエンコードされたシーケンスの部分でない前記参照フレームに関するリエンコード前の前記対応する元来のBフレームの移動ベクトルから導かれることを特徴とする装置。
  2. 前記B*フレームの移動ベクトルの方向は、前記対応する元来のBフレームのそれぞれの対応する移動ベクトルと同一であり、前記B*フレームの前記移動ベクトルの長さは前記対応する元来のBフレームのそれぞれの対応する移動ベクトルの長さに比例することを特徴とする請求項に記載のデータ処理装置。
  3. 前記比例の割合は、(前記B*フレームと前記P*フレームとの間のフレーム数+1)/(前記元来のBフレームと該元来のBフレームに続く参照フレームとの間のフレーム数+1)によって与えられることを特徴とする請求項に記載のデータ処理装置。
  4. 前記リエンコーダは、前記先の参照フレームも参照して前記識別されたBフレームの連続する最後の一つ以外の前記第一シーケンスの前記識別されたBフレームをリエンコードするように配置されることを特徴とする請求項に記載のデータ処理装置。
  5. 前記リエンコーダは、前記第二編集ポイントで開始するIフレーム又はPフレームを求めて前記第二シーケンスを連続して走査するように配置され、Pフレームが最初に検出された場合、該検出されたPフレームをIフレーム(これより以後、I*フレーム)にリエンコードすることを特徴とする請求項1に記載のデータ処理装置。
  6. 前記リエンコーダは、単一側のBフレームとして前記第二シーケンスでの識別されたBフレームの各々をリエンコードするように配置され、前記Pフレームが最初に検出された場合、前記単一側のBフレームが前記I*フレームに依存し、又は前記Iフレームが最初に検出された場合は前記Iフレームに依存することを特徴とする請求項に記載のデータ処理装置。
  7. 第一シーケンスでの第一編集ポイントまで含む第一フレームシーケンスのフレーム及び第二シーケンスでの第二編集ポイントから含む第二シーケンスのフレームに基づく第三の組み合わされたシーケンスを形成するフレームに基づくA/Vデータの少なくとも2つのシーケンスを編集するための方法であって、前記第一及び第二シーケンスの各々は、複数のフレーム(これより以後、“Iフレーム”)が前記シーケンスの他のフレームを参照せずにイントラコードされ、複数のフレーム(これより以後、“Pフレーム”)は前記シーケンスの一つ先の参照フレームを参照してそれぞれコードされ、残り(これより以後、“Bフレーム”)は前記シーケンスの一つ先及び一つ後の参照フレームを参照してそれぞれコードされるようにコードされ、前記参照フレームはIフレーム又はPフレームであり、前記フレームの参照のコード化は、参照されたフレームでの同様のマクロブロックを示す前記フレームでの移動ベクトルに基づいており、
    前記方法は、
    前記第一及び第二フレームシーケンスを受けることと、
    前記第一の編集ポイント後の参照フレームに関してコードされる前記第一編集ポイントまで含む前記第一シーケンスのフレームを識別、且つ前記第二の編集ポイント前の参照フレームに関してコードされる前記第二編集ポイントで開始する前記第二シーケンスフレームを識別することと、
    Bタイプの識別されたフレームの各々(元来のBフレーム)を、識別されたBフレームの各々において、単に前記元来のBフレームの移動ベクトルから対応するリエンコードされたフレームの移動ベクトルを導くことによって、前記対応するリエンコードされたフレームにリエンコードすることと、
    を含み、
    連続して近接するIフレーム又はPフレームのいずれかである先行するフレームを参照して、Pフレーム(これより以後、“P*フレーム”)として前記第一シーケンスの前記識別されたBフレームの連続する最後の一つをリエンコードし、
    Bフレーム(これより以後、“B*フレーム”)として前記識別されたBフレームの連続する最後の一つ以外の前記第一シーケンスの識別されたBフレームをリエンコードすることは、前記P*フレームを参照して行われ、前記P*フレームに関する前記B*フレームの移動ベクトルが、リエンコードされたシーケンスの部分でない前記参照フレームに関するリエンコード前の前記対応する元来のBフレームの移動ベクトルから導かれることを特徴とする方法。
  8. プロセッサに請求項に記載の段階を実行させるコンピュータプログラムを格納したコンピュータ可読媒体
JP2003579224A 2002-03-21 2003-02-17 エンコードされたオーディオ/ビデオシーケンスの編集 Expired - Fee Related JP4310195B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02076108 2002-03-21
PCT/IB2003/000659 WO2003081594A1 (en) 2002-03-21 2003-02-17 Editing of encoded a/v sequences

Publications (3)

Publication Number Publication Date
JP2005521311A JP2005521311A (ja) 2005-07-14
JP2005521311A5 JP2005521311A5 (ja) 2006-04-06
JP4310195B2 true JP4310195B2 (ja) 2009-08-05

Family

ID=28051800

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003579224A Expired - Fee Related JP4310195B2 (ja) 2002-03-21 2003-02-17 エンコードされたオーディオ/ビデオシーケンスの編集

Country Status (8)

Country Link
US (1) US20050141613A1 (ja)
EP (1) EP1490874A1 (ja)
JP (1) JP4310195B2 (ja)
KR (1) KR20040094441A (ja)
CN (1) CN100539670C (ja)
AU (1) AU2003206043A1 (ja)
TW (1) TW200305146A (ja)
WO (1) WO2003081594A1 (ja)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100852803B1 (ko) * 2004-03-15 2008-08-18 샤프 가부시키가이샤 녹화 재생 편집 장치
US8074248B2 (en) 2005-07-26 2011-12-06 Activevideo Networks, Inc. System and method for providing video content associated with a source image to a television in a communication network
US9826197B2 (en) * 2007-01-12 2017-11-21 Activevideo Networks, Inc. Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device
US9042454B2 (en) * 2007-01-12 2015-05-26 Activevideo Networks, Inc. Interactive encoded content system including object models for viewing on a remote device
JP5257319B2 (ja) * 2009-10-09 2013-08-07 株式会社Jvcケンウッド 画像符号化装置及び画像符号化方法
AU2011315950B2 (en) 2010-10-14 2015-09-03 Activevideo Networks, Inc. Streaming digital video between video devices using a cable television system
WO2012138660A2 (en) 2011-04-07 2012-10-11 Activevideo Networks, Inc. Reduction of latency in video distribution networks using adaptive bit rates
WO2012175783A1 (en) 2011-06-21 2012-12-27 Nokia Corporation Video remixing system
US10409445B2 (en) 2012-01-09 2019-09-10 Activevideo Networks, Inc. Rendering of an interactive lean-backward user interface on a television
US9800945B2 (en) 2012-04-03 2017-10-24 Activevideo Networks, Inc. Class-based intelligent multiplexing over unmanaged networks
US9123084B2 (en) 2012-04-12 2015-09-01 Activevideo Networks, Inc. Graphical application integration with MPEG objects
WO2014145921A1 (en) 2013-03-15 2014-09-18 Activevideo Networks, Inc. A multiple-mode system and method for providing user selectable video content
US9219922B2 (en) 2013-06-06 2015-12-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
EP3005712A1 (en) 2013-06-06 2016-04-13 ActiveVideo Networks, Inc. Overlay rendering of user interface onto source video
US9294785B2 (en) 2013-06-06 2016-03-22 Activevideo Networks, Inc. System and method for exploiting scene graph information in construction of an encoded video sequence
US20150085915A1 (en) * 2013-09-25 2015-03-26 Jay C.-C. Kuo Method and system for automatically encoding video with uniform throughput
US9788029B2 (en) 2014-04-25 2017-10-10 Activevideo Networks, Inc. Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2353653B (en) * 1999-08-26 2003-12-31 Sony Uk Ltd Signal processor

Also Published As

Publication number Publication date
TW200305146A (en) 2003-10-16
KR20040094441A (ko) 2004-11-09
EP1490874A1 (en) 2004-12-29
CN1643608A (zh) 2005-07-20
AU2003206043A1 (en) 2003-10-08
US20050141613A1 (en) 2005-06-30
CN100539670C (zh) 2009-09-09
WO2003081594A1 (en) 2003-10-02
JP2005521311A (ja) 2005-07-14

Similar Documents

Publication Publication Date Title
JP4310195B2 (ja) エンコードされたオーディオ/ビデオシーケンスの編集
JP4014263B2 (ja) 映像信号変換装置及び映像信号変換方法
JP4261630B2 (ja) 画像符号化装置及び方法、画像符号化プログラムが記録されたコンピュータ可読記録媒体
JP2000278692A (ja) 圧縮データ処理方法及び処理装置並びに記録再生システム
JPH10145798A (ja) デジタル符号化信号処理方式
JP2002158969A (ja) 動画像符号化データ変換装置及びその方法
JP3331351B2 (ja) 画像データ符号化方法及び装置
WO1993003578A1 (en) Apparatus for coding and decoding picture signal with high efficiency
US8165217B2 (en) Image decoding apparatus and method for decoding prediction encoded image data
JP2011512767A (ja) ビデオ・ストリーミング
JP3240024B2 (ja) 画像処理方法
JP2008252874A (ja) 動画像符号化方法、動画像復号化方法、動画像符号化装置及び動画像復号化装置
JPH06350995A (ja) 動画像処理方法
JP2002300528A (ja) ビデオストリーム編集方法及び装置
US8306110B2 (en) Moving image coding apparatus and method using copy pictures depending on virtual buffer verifier occupancy
JPH1084545A (ja) ディジタルビデオ信号の符号化方法及び装置
JP4594163B2 (ja) 画像符号化方法、及び画像符号化装置
JP2005518728A (ja) 画像処理方法及び装置
JP2007158778A (ja) トリック再生用コンテンツ作成方法および装置、トリック再生用圧縮動画データ送出方法および装置、およびトリック再生用コンテンツ作成用プログラム
JP2883592B2 (ja) 動画像復号化装置及び動画像復号化方法
JP2011023772A (ja) 符号化データ編集方法、装置、プログラム、および媒体
JP3449370B2 (ja) 画像データ復号化方法及び装置
JP2937180B2 (ja) 映像符号化方法およびこの映像符号化方法による符号データが格納された記録媒体
JP2003169296A (ja) 動画像の再生方法
JP4651344B2 (ja) Mpeg−2ストリームのワイプ切換方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20090107

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20090115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090319

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090414

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090511

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120515

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees