JP2007533260A - 自動逆テレシネプロセス - Google Patents

自動逆テレシネプロセス Download PDF

Info

Publication number
JP2007533260A
JP2007533260A JP2007508343A JP2007508343A JP2007533260A JP 2007533260 A JP2007533260 A JP 2007533260A JP 2007508343 A JP2007508343 A JP 2007508343A JP 2007508343 A JP2007508343 A JP 2007508343A JP 2007533260 A JP2007533260 A JP 2007533260A
Authority
JP
Japan
Prior art keywords
field
pattern
frame
video
frame correlation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007508343A
Other languages
English (en)
Inventor
リン,ケン・ケイ
Original Assignee
アプル・コンピュータ・インコーポレーテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アプル・コンピュータ・インコーポレーテッド filed Critical アプル・コンピュータ・インコーポレーテッド
Publication of JP2007533260A publication Critical patent/JP2007533260A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0112Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard
    • H04N7/0115Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level one of the standards corresponding to a cinematograph film standard with details on the detection of a particular field or frame pattern in the incoming video signal, e.g. 3:2 pull-down pattern
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ビデオシーケンスにおける3−2プルダウンパターンを検出し識別する方法が本明細書で開示される。3−2プルダウンパターンが検出されない場合、ビデオは修正されないままである。3−2プルダウンパターンが見つかった場合、反復フィールドが取り除かれ、オリジナルフレームが再構成される。任意選択的に、ビデオエンコーダのための付加的な命令を作成することができる。更に本発明によれば、反復フィールドは、どのような情報も無駄にしない方法で取り除かれる。本明細書で説明される方法は、反復フィールドを識別するのに使用するビデオデータの1つ又はそれ以上のメトリクス又はパラメータを定義する複数のオペレーションを説明する。

Description

本発明は、ビデオ処理の分野におけるものである。より具体的には、本発明は、映画(フィルム)からNTSCへの変換において生じるビデオシーケンスの3−2プルダウンパターンを検出し識別する方法を提供する。これは、オリジナルフレームを自動的に再構成し、MPEGエンコーディングの目的でフラグを設定する。
映画撮影は、毎秒24フレームレートを有する。各フレーム自体は、「プログレッシブフレーム」としても知られる完全画像である。これは、トップとボトムの全てのフィールドが時間の同じ瞬間に一致することを意味する。
他方、ビデオ信号はインターレース構造を有する。ビデオフレームは、トップフィールドとボトムフィールドに分割され、一方のフィールドの走査は、他方が終了するまでは開始されない。更にビデオ信号は、様々なフレームレートを有する。NTSC規格(主に北米で使用)は、毎秒約30フレームのフレームレートを使用する。PAL規格(世界の他のほとんどで使用)は、毎秒25フレームのフレームレートを使用する。
映画とビデオとによって使用されるフレームレートが異なることにより、2つのフォーマット間での変換が複雑になる。映画からNTSCビデオへの変換では、4フィルムフレーム毎に10ビデオフィールドを作成する必要がある。このテレシネプロセスは多くの場合、1つのプログレッシブフレームから2つのフィールドを作成し、次のフィルムフレームからは3つのフィールドを作成して、シーケンスの残りについてこの3−2パターンを繰り返すことによって達成される。3−2パターンから、このプロセスは3−2プルダウンと呼ばれることが多い。このパターンは図1に一般的に示されている。
テレシネプロセスにおいて追加された(重複)フィールドにより、映画材料をビデオフォーマットで視聴することが可能になる。しかしながら幾つかのアプリケーションでは、重複フィールドを取り除くことが望ましい。例えば、繰り返されるフィールドは新しい情報を含まず、エンコーディング(圧縮)の前に取り除く必要がある。また、テレシネプロセスは、ぎざぎざの垂直方向のエッジを有するビデオフレームを生成し、これはプログレッシブディスプレイで視聴する場合に見た目に美しくない。
逆テレシネプロセスは、ビデオ信号(インターレース)を元のフィルム(プログレッシブ)フォーマットに変換する。これは、フィルムソース材料から作成されたと推定される入力フィールド画像データを取り込み、元のフレーム画像を出力する。問題は簡単なように見えるが、実際には幾つかの理由により極めて複雑である。第一に、ビデオデータにはノイズが存在する可能性がある。ビデオのノイズは、ランダムノイズを生じることになるビデオドメインでの処理の結果とすることができ、或いは材料に加えられる圧縮ノイズを生じることになる圧縮の結果とすることができる。いずれの場合においても、繰り返しのフィールドは同一でない可能性があり、3−2プルダウンパターンを求めるために2つのフィールド間の類似性にのみ依存することはできない。
編集がビデオドメインで行われている場合には、第2の複雑な問題が生じる。例えば、ビデオドメインでのカットは、3−2プルダウンパターンを中断させる可能性があり、或いはオリジナルの映画に対応する反対のフィールドを持たない幾つかのフィールドを残すことさえある。フェージング、テキスト追加、又はピクチャーインピクチャーのような操作はまた、3−2プルダウンパターンの検出と認識を複雑にする可能性がある。更に、幾つかのビデオプログラムは、3−2プルダウンパターンが存在しない一般的なビデオカメラ(例えば、NTSCビデオカメラ)を用いて材料ショットが散りばめられているフィルムのセクションを有する可能性がある。これらの全ては、逆テレシネを順方向3−2プルダウンよりも更に困難な問題にする。
従って、重複フィールドを確実に識別できる自動逆テレシネプロセスを提供することが有利である。
本発明は、ビデオシーケンスにおける3−2プルダウンパターンを検出し識別する方法に関する。3−2プルダウンパターンが検出されない場合、ビデオは修正されないままである。3−2プルダウンパターンが見つかった場合、反復フィールドが取り除かれ、オリジナルフレームが再構成される。任意選択的に、ビデオエンコーダのための付加的な命令を作成することができる。更に本発明によれば、反復フィールドは、どのような情報も無駄にしない方法で取り除かれる。本明細書で説明される方法は、反復フィールドを識別するのに使用するビデオデータの1つ又はそれ以上のメトリクス又はパラメータを定義する複数のオペレーションを説明する。
本明細書では自動逆テレシネプロセスを説明する。本発明の以下の実施形態は、カリフォルニア州キューパーティノのApple Computer,Inc.製のコンピュータシステムと互換性のあるアプリケーションの観点から説明されており、これは例示に過ぎず、いかなる点でも限定とみなすべきではない。本明細書で使用される用語「フレーム」、「映像」、「画像」は、一般的に同義語であり、文脈上他の意味に指示されていない限りこのように解釈しなければならない。同様に、文脈上他に示されていない限り、フィルムフォーマットは一般的にいずれかのプログレッシブフォーマットを意味し、ビデオはインターレースフォーマットを意味する。
本発明は、ビデオシーケンスにおいて3−2プルダウンパターンを検出し識別する方法を提供する。3−2プルダウンパターンが検出されない場合、ビデオは変更されないままである。3−2プルダウンパターンが見つかった場合、反復フィールドが取り除かれ、オリジナルフレームが再構成される。更に、3つのフラグ、すなわちpicture_structure、progressive_frame、repeat_first_fieldが正確に設定されるように、MPEG−2エンコーダに対する命令が作成される。他のビデオコーデックも、適切なフラグを設定する場合に使用できる。更に本発明によると、反復フィールドはどのような情報も無駄にしない方法で取り除かれる。
図1においてフレームB、C、Dによって作成された4つの映像112、113、114、115を考える。これらの4つの映像は、フレームBからの3つのフィールド、フレームCからの2つ、フレームDからの3つを有するので3−2−3パターンを構成する。不完全な3−2−3パターンがセグメントの始まり又は終わりに存在する場合(例えば、編集操作のせいで)、反復フィールドは取り除かれず、異なるオリジナルフィルムフレームからのトップフィールドとボトムフィールドを有する映像はノンプログレッシブとマークされる。
図2は、逆テレシネアルゴリズムのブロック図を示す。各反復の始まりでは、ステップ204でフレームバッファが満たされる。ステップ206で、バッファ内の映像が分析され、最初の8映像の中に3−2−3パターンがあるかどうかが判定される。3−2−3パターンが識別された場合、3−2−3パターンまでのものと、3−2−3パターンに関連するものを含む全映像が出力フレームを作成するよう処理される(ステップ212)。3−2−3パターンに関連する4つの映像は、プログレッシブフレームを再構成するように処理される。
3−2−3パターンの一部ではないバッファの始まりの映像は、未修正の出力で再生され、これらを別のビデオセグメントの一部とすることができるようにノンプログレッシブとして分類する。3−2−3パターンが識別されない場合、3つまでの映像が前回の反復の結果に応じて処理される(ステップ210)。この場合、全ての処理された映像は未修正出力で再生される。これらには、そのコンテンツの分析から決定されるプログレッシブ又はノンプログレッシブのいずれかをマークする。
最後に、有限状態機械が、現在の反復の結果に従ってステップ214で更新される。ステップ216で、フレームバッファがチェックされる。バッファに残っている映像がある場合、プロセスは次の反復のためにステップ204に戻り、それ以外は、ステップ218に進みプロセスが終了する。
有限状態機械は、以下のように定義される入力ビデオの長時間にわたる傾向を追跡するために4つの状態を使用する。
状態0:初期化
機械の状態は初期化中は0に設定される。
状態1:3−2−3パターンが見つからない
現在の反復中にバッファにある最初の8つの映像の中に3−2−3パターンが識別されず、状態2を入力するための条件が真でない場合、有限状態機械は反復の最後で状態1に入る。
状態2:3−2プルダウンパターンの最後
(a)フレームバッファにある最初の8つの映像の中で3−2−3パターンが識別されない場合、(b)現在の状態(前回の反復の最後で設定された)が3である場合、(c)フレームバッファの最初の2つの映像がプログレッシブとして分類された場合、(d)これらの2つの映像が前回の反復で処理された最後の映像に関連するものと判定された場合、有限状態機械は反復の最後で状態2に入る。
状態3:パターン発見
3−2−3パターンがフレームバッファの最初の8つの映像の中で識別された場合、有限状態機械は、反復の最後で状態3に入る。
以下は、図2に示されたプロセスを更に詳細に説明したものである。ステップ204で、映像は、ビデオソースからフレームバッファに読み取られる。バッファサイズは、少なくとも12フレーム分でなくてはならない。映像がステップ210、212で処理された後、フレームバッファから取り除かれ、バッファ内の残りの映像が前部に移動される。1つの反復で最大で8つの映像を処理することができ、その結果、入力ビデオが終わる前にステップ216でバッファ内に常に映像が存在する。
ステップ206で、3−2−3パターンが、フレームバッファにおいて最初の8つの映像の中で識別される。前の編集がないと仮定すると、3−2プルダウンパターンのための5つの可能な開始ポジションが存在する。これらの5つのポジションは、トップフィールド第1シーケンスにおいて図3に示されている。
2つの異なるフレームにおける同じパリティの2つのフィールドをつなぐ線は、重複フィールドを示す。トップフィールドとボトムフィールドをつなぐ線は、2つのフィールドがオリジナルフィルムの同じフレームから生じたことを示している。フィールドが繰り返された場合、パターンダイアグラムに三角形が形成される。反復フィールドがビデオの第1フィールドである場合、三角形は垂直な左端部を有し、「レフトトライアングル」と呼ばれる。図3でトップフィールドは第1フィールドであり、その結果、ケース0におけるT0、T1、B0によって形成される三角形はレフトトライアングルである。同様に、反復フィールドが第1フィールドでない場合、三角形は、垂直な右端部を有し「ライトトライアングル」と呼ばれ、例えばケース0においてB2、B3、T3によって形成された三角形である。
ダブルトライアングル構造は、レフトトライアングルと、それに続く同じフィルムフレームからしかし異なるビデオ映像(3−2プルダウン後)からの2つのフィールドと、その後のライトトライアングルである。これは図4に示されている。ダブルトライアングル構造は、1つのフィルムフレームから3つのフィールド、次のフィルムフレームから2つのフィールド、第3のフィルムフレームから3つのフィールドを含むので、3−2−3パターンとも呼ばれる。
シングルトライアングルにおける(ダブルトライアングル構造ではない)反復フィールドは適切に取り除くことができないので、シングルトライアングルの反復フィールドを識別する必要はない。従って、ステップ206の目的(図2)は、フレームバッファでの最初の8つの映像でダブルトライアングル構造又は3−2−3パターンを識別することである。ダブルトライアングル構造を識別するアルゴリズムは、シングルトライアングルの場合と比べてノイズに対してより堅牢に作ることができる。
ステップ206(図2)で3−2−3パターンを識別する段階は、2ステッププロセスである。第1のステップは、3−2−3パターンが最も見つかる可能性の高いポジションを識別することである。3−2−3パターンは、そのレフトトライアングルの左端部が映像iに対応する場合のポジションiであると言われる。第2ステップは、3−2−3パターンが適正か又は誤った警報であるかどうかを判定することである。
本プロセスは、2つの測定、すなわち「フィールド・アイデンティティ」と「フレーム相関」を必要とする。フィールド・アイデンティティは、同じパリティの2つのフィールド(すなわち、2つのトップフィールド又は2つのボトムフィールド)間の類似性を測定し、反復フィールドの識別を助ける。フィールド・アイデンティティは、2つのフィールドが同一である場合は0であり、同一でない場合は正のはずである。フィールド・アイデンティティは、絶対差の和又は平均二乗誤差のような様々な歪み尺度から決定することができる。しかしながら、2つのフィールドが類似する場合は小さく、2つのフィールドが類似しない場合は大きいどのような尺度もフィールド・アイデンティティとして使用することができる。フレーム相関は、2つの反対のフィールドが互いにどのくらい密接に関係しているかを測定する。2つのフィールドが1つのプログレッシブフレームから生じる場合、そのフレームの相関性は低いはずである。このような尺度の1つの実施例は、1つの入力フィールドと異なるパリティの他の入力フィールドの補間フィールドと間の絶対差の和とすることができる。
3−2−3パターンを位置付けるために、6つのパラメータがフレームバッファの各ポジションについて計算される。6つのパラメータは、上記で定義された2つの尺度を使用して計算される。最初の2つのパラメータは、フィールド・アイデンティティ尺度に関係する。「第1フィールド・アイデンティティ」は、映像の第1フィールドと次の映像の第1フィールド、すなわち映像i及び映像i+1の第1フィールド間のフィールド・アイデンティティを測定する。同様に、「第2フィールド・アイデンティティ」は、映像iと映像i+1の第2フィールド間のフィールド・アイデンティティを測定する。
次の3つのパラメータはフレーム相関尺度に関係する。第3パラメータは、同じ映像のトップフィールドとボトムフィールドとの間のフレーム相関尺度である「セルフフレーム相関」である。「クロスフレーム相関」も計算され、これは、フレームの第2フィールドと次のフレームの第1フィールドとの間のフレーム相関、すなわち映像iの第2フィールドと映像i+1の第1フィールドとの間のフレーム相関である。第5パラメータは、「逆クロスフレーム相関」であり、これは、対応するフレームの第1フィールドとこれに続くフレームの第2フィールドとの間のフレーム相関尺度である。
最後に、これらのパラメータから「新しいシーンスコア」が計算される。新しいシーンスコアは、前のフレームのクロスフレーム相関と、第2の前のフレームのクロスフレーム相関又は現在のフレームのクロスフレーム相関のうちの大きい方との比である。新しいシーンスコアの大きな値は、対応する映像が新しいシーンの最初の映像である可能性が高いことを示している。
これらの6つのパラメータ、すなわち「第1フィールド・アイデンティティ」、「第2フィールド・アイデンティティ」、「セルフフレーム相関」、「クロスフレーム相関」、「逆クロスフレーム相関」、「新しいシーンスコア」から、6つの付加メトリクスが計算される。付加メトリクスは、「第1フィールド・アイデンティティ比」、「第2フィールド・アイデンティティ比」、「レフトトライアングルスコア」、「ライトトライアングルスコア」、「クロスフレーム相関スコア」、「ダブルトライアングルスコア」である。これらの6つのメトリクスは、3−2−3パターンを位置付けるために使用される。
フレームの「第1フィールド・アイデンティティ比」メトリックは、現在のフレームの第1フィールド・アイデンティティとその前又は後のフレームの第1フィールド・アイデンティティの小さい方との比として定義される。同様に、「第2フィールド・アイデンティティ比」は、現在のフレームの第2フィールド・アイデンティティとその前又は後のフレームの第2フィールド・アイデンティティの小さい方との比である。フレームの「レフトトライアングルスコア」は、フレームの第1フィールド・アイデンティティ比に、フレームのセルフフレーム相関と次のフレームのセルフフレーム相関との比を加えたものの2倍である。レフトトライアングルスコアの小さな値は、レフトトライアングルが現在の映像と次の映像との間に存在している可能性が高いことを示している。同様に、ライトトライアングルスコアは、フレームの第2フィールド・アイデンティティ比に次のフレームのセルフフレーム相関と現在のフレームのセルフフレーム相関との比を加えたものの2倍である。ライトトライアングルスコアの小さな値は、ライトトライアングルが現在の映像と次の映像との間に存在している可能性が高いことを示している。
第5メトリックは、「クロスフレーム相関スコア」であり、これは、どんなに小さくても、現在の映像のクロスフレーム相関と次の又は前のフレームのクロスフレーム相関との比として定義される。クロスフレーム相関スコアの大きな値は、現在の映像と次の映像との間にカットがあることを示す。
第6メトリックは、「ダブルトライアングルスコア」であり、これは、現在のフレームのレフトトライアングルスコア、次のフレームのクロスフレーム相関スコア、第2の次のフレームのライトトライアングルスコアの総和である。ダブルトライアングルスコアの小さな値は、3−2−3パターンが映像iと映像i+3との間に存在していることを示す。ダブルトライアングルスコアは、バッファの最初の5つのフレームの各々について計算される。ダブルトライアングルスコアの最も小さな値をもたらすフレームは、適正な3−2−3パターンである可能性が高い。
この3−2−3シーケンスの妥当性を検証するために、6つの付加メトリクス、すなわち「フレーム相関変化」、「フレーム相関比」、「クロスフレーム相関比」、「逆クロスフレーム相関比」、「第1フィールド・アイデンティティ比2」、「第2フィールド・アイデンティティ比2」が計算される。
「フレーム相関変化」は、反復フィールドを取り除くことによってビデオドメインの4つの映像をフィルムドメインの3つのフレームに再配置することによって求められる。一方、フィルムドメインでの平均セルフフレーム相関とビデオドメインでの平均セルフフレーム相関の比が、フレーム相関変化である。4つの映像が実際に3−2プルダウンによって生成された場合、フレーム相関変化は1より小さくなるはずである。
「フレーム相関比」を求めるために、3−2−3パターンがフレームバッファ内のポジションiにあると仮定する。この3−2−3パターンのためのフレーム相関比は、(1)現在のフレームのセルフフレーム相関(self_frame_correlation[i])と次のフレームのセルフフレーム相関(self_frame_correlation[i+1])との比と、(2)第3の次のフレームのセルフフレーム相関(self_frame_correlation[i+3])と第2の次のフレームのセルフフレーム相関(self_frame_correlation[i+2])との比の平均値である。4つの映像が実際に3−2プルダウンを介してフィルムソースから生成されている場合、フレーム相関比は1より小さくなるはずである。
同様に、フレームバッファ内のポジションiでの3−2−3パターンの「クロスフレーム相関比」は、(1)i番目のフレームのクロスフレーム相関(cross_frame_correlation[i])と(2)第2の次のフレームのクロスフレーム相関(cross_frame_correlation[i+2])の平均値であり、次のフレームのクロスフレーム相関(cross_frame_correlation[i+1])で割った平均値である。4つの映像が実際に3−2プルダウンを介してフィルムソースから生成されてビデオドメインで圧縮された場合、クロスフレーム相関比は1より小さくなるはずである。
第4メトリックは「逆クロスフレーム相関比」である。フレームバッファのポジションiでの3−2−3パターンでは、逆クロスフレーム相関比は、現在のフレーム、次のフレーム、第2の次のフレームのクロスフレーム相関の総和と、現在のフレーム、次のフレーム、第2の次のフレームの逆クロスフレーム相関の総和との比である。4つの映像が実際に3−2プルダウンを介してフィルムソースから生成された場合、逆クロスフレーム相関比は1より小さくなるはずである。
第5メトリックは「第1フィールド・アイデンティティ比2」である。3−2−3パターンがフレームバッファのポジションiにあると仮定する。この3−2−3パターンの「第1フィールド・アイデンティティ比2」は、どんなに小さくても現在の映像の第1フィールド・アイデンティティと次の映像又は第2の次の映像の第1フィールド・アイデンティティとの比に等しい。
同様に、第6メトリックのフレームバッファのポジションiに位置付けられた3−2−3パターンの「第2フィールド・アイデンティティ比2」は、どんなに小さくても第2の次のフレームの第2フィールド・アイデンティティと次のフレーム又は現在のフレームの第2フィールド・アイデンティティとの比に等しい。
全ての6つのメトリクスは非負である。同一の映像のシーケンスでは、最初の4つのパラメータは全て1.000に等しく、最後の2つは定義されない。これらの6つのメトリクスは、3−2−3パターンに関連する4つの映像が実際にフィルムソースからのものであるかどうかを判定するのに使用される。全ての6つのメトリクスでは、小さな値は、3−2−3パターンが適正である可能性が高いことを示している。6つのメトリクスは、6−Dスペースを定義し、妥当性の領域は、3−2−3パターンが206の第2ステップでフィルムソースからのものであると分類されるこの6−Dスペース内の領域である。
領域は、既知の3−2−3パターンを有するシーケンスを使用するトレーニングによって見つけることができる。例えば、6つのメトリクスの各々に対してスレショルドを定義し、全ての6つのメトリクスがそのそれぞれのスレショルドより小さい6次元「キューブ」のような妥当性領域を定義することができる。スレショルドは、トレーニングによって求めることができる。或いは、より一般的な方法は、その各々が6つのメトリクスのサブセットの関数である少数の関数を定義することである。その結果、妥当性の領域は、評価された関数値が幾つかの事前に決定された要件を満たす領域である。
ノイズに対するアルゴリズムの堅牢性を強化するために少数の付加的なステップを加えることができる。最初に、3−2−3パターンがポジションiであることが分かった場合、パターンでの最後の3つの映像−すなわち、i+1、i+2、i+3は、新しいシーンの始めではない可能性がある。これは、その新しいシーンスコアを事前に決定されたスレショルド、例えばトレーニングから得られたカットオフと比較することによってチェックすることができる。次に、3−2−3パターンがポジション4であることが分かり、且つ第2の最も低いスコアがポジション0で発生した場合、この両方は適正である可能性が高い。このケースは図5に示されている。この場合、ポジション0は、最初にチェックしなければならない。これが適正である場合、このシーケンスを処理し、ポジション4の3−2−3パターンを次の反復に残し、適正でない場合にはポジション4をチェックする。
適正な3−2−3パターンが見つからなかった場合、3つまでの映像がその映像と現在の状態のコンテンツに応じて処理される。これはステップ210で終了する。適正な3−2−3パターンが見つかった場合、3−2−3パターンに関連するものを含むものまでのバッファの最初の全映像が処理される。これはステップ212で終了する。
ステップ210で、現在の状態が0、1、又は2である場合、3つの映像が処理される。これらはノンプログレッシブとして分類され、未修正出力に渡される。状態は、この場合はステップ214で1に変更される。現在の状態が3である場合、これは、3−2−3パターンが前回の反復で処理されており、2つまでの映像が処理されることを意味する。最初に、映像0と1の新しいシーンスコアがチェックされ、そのセルフフレーム相関値をこれまでに識別された全ての3−2−3パターンの映像から得られる移動平均と比較することによってこれらがプログレッシブかどうかを調べる。セルフフレーム相関値が移動平均よりも小さい場合、映像はプログレッシブとして分類され、そうでなければ、ノンプログレッシブとして分類される。2つの映像が処理されこれらが両方ともプログレッシブとして分類される場合、状態はステップ214で2に変更されることになり、そうでなければ、状態は1に変更されることになる。
ステップ212で、映像は、現在の状態と識別された3−2−3パターンのポジションに応じて処理される。3つの可能なケースがある。全ての3つのケースでは、状態はステップ214で3に変更される。
ケース1:状態機械の現在の状態は、0、1、又は2である。現在の状態が0である場合、映像0は、新しいシーンの始めでなくてはならない。現在の状態が1である場合、新しいシーンは前の反復で既に処理されているので、バッファ内には新しいシーンがある場合もあれば、ない場合もある。現在の状態が2である場合、3−2−3パターンの第1の映像を含むまでのポジション0で始まるバッファの始めにある映像の1つは、新しいシーンの始めでなくてはならない。新しいシーンは、最も大きな新しいシーンスコアを有する映像を見つけ、状態1のケースでこれを事前に決定されたスレショルドと比較することによって識別することができる。新しいシーンのポジションが識別されると、そのポジションの前の映像は前の反復で処理された映像と関連付けられ、そのポジションの後の映像は、3−2−3パターンと同じシーンにあるものと仮定される。3−2−3パターンにあるものを含まないこれらの映像は、未修正出力で再生される。これらは、新しいシーンのポジションと3−2−3パターンとに一致する方法でそのセルフフレーム相関尺度によって決定されるプログレッシブ又はノンプログレッシブのいずれかとして分類される。3−2−3パターンでの4つの映像は、ケース3と同じように処理される。
ケース2:現在の状態は3であるが、3−2−3パターンのポジションは1ではない。編集ポイントは、3−2−3パターンでの第1映像を含む3−2−3パターンの前の映像の中に存在していなくてはならない。3−2−3パターンではない全ての映像は、未修正出力に渡される。これらは、新しいシーンのポジションと3−2−3パターンとに一致する方法でそのセルフフレーム相関尺度によって決定されるプログレッシブ又はノンプログレッシブのいずれかとして分類される。3−2−3パターンでの4つの映像は、ケース3と同じように処理される。
ケース3:現在の状態は3であり、3−2−3パターンのポジションは1である。これは、長い3−2プルダウンセグメントの間である可能性が高い。5つの映像が処理され4つのフレームを作成する。フレーム0は映像0のコピーである。フレーム1は映像1のコピーである。映像2の第1フィールドと映像3の第2フィールドは取り除かれる。映像2の第2フィールドと映像3の第1フィールドが組み合わされ、フレーム2を形成する。最後に、フレーム3は映像3のコピーである。4つの出力フレームのMPEGフラグが図6にリストされている。
ステップ210、212の終わりで、全ての処理された映像はフレームバッファから取り除かれる。この反復で処理されなかった映像は、前部に移動される。ステップ214で、有限状態機械は、上述のようにステップ210、212の結果に従って更新される。ステップ216で、バッファに映像がある場合、次の反復のためのステップ204に戻る。バッファに映像がない場合、218に進み終了する。
本発明は、限られた数の実施形態に関して開示されているが、多くの修正や変形形態が当業者には理解されるであろう。全てのこのような変形及び修正形態は添付の請求項の範囲内にあるものとする。
フレームのシーケンスにおける順方向テレシネ、又は3−2プルダウンプロセスを示す図である。 本発明による逆テレシネプロセスのフローチャートを全体的に示す図である。 フレームのシーケンス内の3−2−3プルダウンパターンの構成の5つの可能なケースを示す図である。 反復する3−2−3プルダウンパターンと3−2−3プルダウンパターンを識別するのに使用されるダブルトライアングル構造の構成を示す図である。 フレームバッファにおけるポジション0で始まるものとポジション4で始まる2つの3−2−3プルダウンパターンを示す図である。 MPEG−2エンコーダの使用に従って逆テレシネプロセスによって設定される特定のフレームに対するフラグ値の表を示す図である。

Claims (21)

  1. ビデオデータを処理する方法であって、
    インターレースフォーマットでビデオフレームのシーケンスを受け取るステップと、
    3−2プルダウンパターンを検出するステップと、
    前記ビデオフレームのシーケンスから重複フィールドを取り除くステップと、
    を含む方法。
  2. 前記取り除かれるフィールドに関するビデオエンコーダに命令を渡すステップを更に含む請求項1に記載の方法。
  3. 前記命令は、MPEG−2エンコーダにおける1つ又はそれ以上のフラグに関係することを特徴とする請求項2に記載の方法。
  4. 前記1つ又はそれ以上のフラグは、picture_structure、progressive_frame、とrepeat_first_fieldから成るグループから選択される請求項3に記載の方法。
  5. 前記ビデオフレームのシーケンスの最後に中断された3−2プルダウンパターンを検出するステップと、
    前記中断された3−2プルダウンパターンの一部である重複フィールドを残すステップと、
    を更に含む請求項1に記載の方法。
  6. ノンプログレッシブとして重複フィールドと共に残されたフレームにマーキングするステップを更に含む請求項5に記載の方法。
  7. 3−2プルダウンパターンを検出する前記ステップは、
    前記3−2プルダウンパターンが見つかる可能性の高いバッファ内のポジションを識別するステップと、
    前記識別されたポジションに位置付けられたパターンが適正な3−2プルダウンパターンであるかどうかを判定するステップと、
    を含む請求項1に記載の方法。
  8. バッファ内でポジションを識別する前記ステップは、少なくとも1つのフィールド・アイデンティティと少なくとも1つのフレーム相関の計算を含む請求項7に記載の方法。
  9. 前記少なくとも1つのフィールド・アイデンティティは、共通パリティを有する異なるフレームからの2つのフィールド間の絶対差の総和として計算される請求項8に記載の方法。
  10. 前記少なくとも1つのフィールド・アイデンティティは、共通パリティを有する異なるフレームからの2つのフィールド間の平均二乗誤差として計算される請求項8に記載の方法。
  11. 前記少なくとも1つのフレーム相関は、異なるパリティを有する入力フィールドと別の入力フィールドの補間フィールドとの間の絶対差の総和として計算される請求項8に記載の方法。
  12. 前記少なくとも1つのフレーム相関は、異なるパリティを有する入力フィールドと別の入力フィールドの補間フィールドとの間の二乗誤差の総和として計算される請求項8に記載の方法。
  13. バッファ内でポジションを識別する前記ステップは、第1フィールド・アイデンティティ、第2フィールド・アイデンティティ、セルフフレーム相関、クロスフレーム相関、逆クロスフレーム相関、と新しいシーンスコアから成るグループから選択される1つ又はそれ以上のパラメータの計算を含む請求項7に記載の方法。
  14. バッファ内でポジションを識別する前記ステップは、前記少なくとも1つのフィールド・アイデンティティと少なくとも1つのフレーム相関から複数のメトリクスを計算するステップを更に含む請求項8に記載の方法。
  15. 前記複数のメトリクスの少なくとも1つは、第1フィールド・アイデンティティ比、第2フィールド・アイデンティティ比、レフトトライアングルスコア、ライトトライアングルスコア、クロスフレーム相関スコア、ダブルトライアングルスコアから成るグループから選択されることを特徴とする請求項14に記載の方法。
  16. 前記識別されたポジションに位置付けられたパターンが適正な3−2プルダウンパターンかどうかを判定する前記ステップは、フレーム相関変化、フレーム相関比、クロスフレーム相関比、逆クロスフレーム相関比、第1フィールド・アイデンティティ比2、第2フィールド・アイデンティティ比2から成るグループから選択された少なくとも1つのメトリックを計算するステップを更に含む請求項7に記載の方法。
  17. 前記識別されたポジションに位置付けられたパターンが適正な3−2プルダウンパターンかどうかを判定する前記ステップは、第2の次のフレームの第1フィールド・アイデンティティ比と第2フィールド・アイデンティティ比とから成るグループから選択された少なくとも1つのメトリックと少なくとも1つの付加的なパラメータを分析するステップを含む請求項16に記載の方法。
  18. 機械によって実行可能なプログラムを具現化するコンピュータ可読媒体であって、前記プログラムは、ビデオデータ上で一連のオペレーションを実行するよう動作可能であり、前記一連のオペレーションが、
    インターレースフォーマットでビデオフレームのシーケンスを受け取るステップと、
    3−2プルダウンパターンを検出するステップと、
    前記ビデオフレームのシーケンスから重複フィールドを取り除くステップと、
    を含むことを特徴とするコンピュータ可読媒体。
  19. 前記一連のオペレーションは、
    前記取り除かれたフィールドに関するビデオエンコーダに命令を渡すステップを更に含むことを特徴とする請求項18に記載のコンピュータ可読媒体。
  20. 前記一連のオペレーションは、
    前記ビデオフレームのシーケンスの最後で中断された3−2プルダウンパターンを検出するステップと、
    前記中断された3−2プルダウンパターンの部分である重複フィールドを残すステップと、
    を更に含むことを特徴とする請求項18に記載のコンピュータ可読媒体。
  21. 3−2プルダウンパターンを検出する前記オペレーションは、
    前記3−2プルダウンパターンが見つかる可能性の高いバッファ内のポジションを識別するステップと、
    前記識別されたポジションに位置付けられたパターンが適正な3−2プルダウンパターンかどうかを判定するステップと、
    を含むことを特徴とする請求項18に記載のコンピュータ可読媒体。
JP2007508343A 2004-04-16 2005-03-08 自動逆テレシネプロセス Withdrawn JP2007533260A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/826,784 US20050231635A1 (en) 2004-04-16 2004-04-16 Automated inverse telecine process
PCT/US2005/007496 WO2005107266A1 (en) 2004-04-16 2005-03-08 Automated reverse telecine process

Publications (1)

Publication Number Publication Date
JP2007533260A true JP2007533260A (ja) 2007-11-15

Family

ID=34961960

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007508343A Withdrawn JP2007533260A (ja) 2004-04-16 2005-03-08 自動逆テレシネプロセス

Country Status (4)

Country Link
US (1) US20050231635A1 (ja)
EP (1) EP1736005A1 (ja)
JP (1) JP2007533260A (ja)
WO (1) WO2005107266A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009513090A (ja) * 2005-10-24 2009-03-26 クゥアルコム・インコーポレイテッド 状態機械に基づく逆テレシネアルゴリズム

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100630923B1 (ko) * 2004-10-13 2006-10-02 삼성전자주식회사 영상신호변환장치 및 영상신호변환방법
US8780957B2 (en) 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
AR052601A1 (es) 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
US8957961B2 (en) 2006-12-27 2015-02-17 Intel Corporation Method and sytem for telecine detection and restoration
US8126262B2 (en) * 2007-06-18 2012-02-28 International Business Machines Corporation Annotating video segments using feature rhythm models
US8891011B2 (en) * 2007-08-23 2014-11-18 Qualcomm Incorporated Systems and methods for combining deinterlacing and frame rate decimation for video format conversion
JP4892450B2 (ja) * 2007-10-17 2012-03-07 パナソニック株式会社 画像符号化装置および画像符号化方法
US20100329340A1 (en) * 2009-06-25 2010-12-30 General Instrument Corporation Method and apparatus for eliminating encoding delay when a telecine source material is detected
US8718448B2 (en) 2011-05-04 2014-05-06 Apple Inc. Video pictures pattern detection
KR101858212B1 (ko) * 2014-02-10 2018-05-16 인터디지탈 패튼 홀딩스, 인크 역 텔레시네 필터

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5134480A (en) * 1990-08-31 1992-07-28 The Trustees Of Columbia University In The City Of New York Time-recursive deinterlace processing for television-type signals
US5828786A (en) * 1993-12-02 1998-10-27 General Instrument Corporation Analyzer and methods for detecting and processing video data types in a video data stream
MY113223A (en) * 1994-12-29 2001-12-31 Sony Corp Processing of redundant fields in a moving picture to achive synchronized system operation
US5929902A (en) * 1996-02-28 1999-07-27 C-Cube Microsystems Method and apparatus for inverse telecine processing by fitting 3:2 pull-down patterns
US5821991A (en) * 1996-02-28 1998-10-13 C-Cube Microsystems, Inc. Method and apparatus for inverse telecine process by correlating vectors of pixel differences
GB9607645D0 (en) * 1996-04-12 1996-06-12 Snell & Wilcox Ltd Processing of video signals prior to compression
US5847772A (en) * 1996-09-11 1998-12-08 Wells; Aaron Adaptive filter for video processing applications
US6115499A (en) * 1998-01-14 2000-09-05 C-Cube Semiconductor Ii, Inc. Repeat field detection using checkerboard pattern
JP3686249B2 (ja) * 1998-03-20 2005-08-24 パイオニア株式会社 重複画像検出装置、画像変換装置、重複画像検出方法及び画像変換方法並びに画像記録媒体
JP3846613B2 (ja) * 1999-01-27 2006-11-15 パイオニア株式会社 インバース・テレシネ変換装置、及びインバース・テレシネ変換方法
US6724433B1 (en) * 2000-12-06 2004-04-20 Realnetworks, Inc. Automated inverse telecine conversion
US7050088B2 (en) * 2003-01-06 2006-05-23 Silicon Integrated Systems Corp. Method for 3:2 pull-down film source detection
US7154555B2 (en) * 2003-01-10 2006-12-26 Realnetworks, Inc. Automatic deinterlacing and inverse telecine

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009513090A (ja) * 2005-10-24 2009-03-26 クゥアルコム・インコーポレイテッド 状態機械に基づく逆テレシネアルゴリズム

Also Published As

Publication number Publication date
WO2005107266A1 (en) 2005-11-10
US20050231635A1 (en) 2005-10-20
EP1736005A1 (en) 2006-12-27

Similar Documents

Publication Publication Date Title
JP2007533260A (ja) 自動逆テレシネプロセス
US11605403B2 (en) Time compressing video content
JP5709319B2 (ja) プログレッシブビデオにおけるケイデンス検出
KR20110042089A (ko) 이미지 정정을 위한 복원 기술들의 이용
JP4655218B2 (ja) 信号処理装置および方法、プログラム、並びに記録媒体
EP1941723A1 (en) Inverse telecine algorithm based on state machine
JP2004529585A (ja) 誤り隠蔽方法及び装置
US8401070B2 (en) Method for robust inverse telecine
JP2007335984A (ja) イベント終了点抽出装置、イベント終了点抽出方法および抽出プログラム
JP4182747B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
JP5061877B2 (ja) 動画像同定装置
JP5273670B2 (ja) 不一致フィールド順序フラグの識別方法
US11399052B2 (en) Timestamp processing methods for streaming media
US7277581B1 (en) Method for video format detection
US9055176B1 (en) Method and apparatus for performing multi-cadence detection in a motion adaptive video deinterlacer
CN115720252A (zh) 用于在事件保留的情况下缩短视频的设备和方法
US20060158513A1 (en) Recognizing film and video occurring in parallel in television fields
JP2006303910A (ja) フィルムモード検出装置
JP2005237002A (ja) 動画像のカット点検出方法
TWI448159B (zh) 可動視訊態樣偵測裝置與方法
JP2007519335A (ja) ビデオ圧縮エンコーダのための3:2プルダウンスイッチオフ信号の生成装置
JPH06303597A (ja) 画像信号再生装置
JP2003179885A (ja) 画像処理装置および方法、記録媒体、並びにプログラム

Legal Events

Date Code Title Description
A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20080303