JP4766567B2 - 第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置 - Google Patents

第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置 Download PDF

Info

Publication number
JP4766567B2
JP4766567B2 JP2006549890A JP2006549890A JP4766567B2 JP 4766567 B2 JP4766567 B2 JP 4766567B2 JP 2006549890 A JP2006549890 A JP 2006549890A JP 2006549890 A JP2006549890 A JP 2006549890A JP 4766567 B2 JP4766567 B2 JP 4766567B2
Authority
JP
Japan
Prior art keywords
format
picture sequence
frame
field
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006549890A
Other languages
English (en)
Other versions
JP2007519348A5 (ja
JP2007519348A (ja
Inventor
ヘルペル,カルステン
ベルナー ケーゼン,ハインツ
シエブゾウ,アンドリユー
ビンター,マルコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2007519348A publication Critical patent/JP2007519348A/ja
Publication of JP2007519348A5 publication Critical patent/JP2007519348A5/ja
Application granted granted Critical
Publication of JP4766567B2 publication Critical patent/JP4766567B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2537Optical discs
    • G11B2220/2562DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Television Systems (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、例えば毎秒24プログレッシブ・フレームなどの第1のフォーマットのピクチャ・シーケンスから例えば毎秒25フレームなどの第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置に関する。
世界の大半のテレビジョン(TV)システムは、インタレース走査方式を利用しており、そのフィールド周波数は50Hz(例えば欧州や中国のPALおよびSECAM)、または60Hzもしくはほぼ60Hz(例えば米国や日本のNTSC)である。これらはそれぞれ、50iおよび60iと呼ばれる。しかし、映画は、24pと呼ばれる24Hzのフレーム周波数の順次走査で製作される。この値は、インタレース方式で表すと48iに相当する。
現在、24pの映画から60Hzのインタレース表示への変換は、図2に示すように「3:2プル・ダウン(pull−down)」で行われる。3:2プル・ダウンでは、フィールド繰返しによって、5フィールドごとに1つのフィールドを挿入する。オリジナル・フィルム・フレームORGFFから複数のインタレース・フィールドILFを得る。第1のオリジナル・フィルム・フレームOFR1から、3つの出力フィールドOF1〜OF3が生成され、第3のオリジナル・フィルム・フレームOFR3から、3つの出力フィールドOF6〜OF8が生成される。第2のオリジナル・フィルム・フレームOFR2から、2つの出力フィールドOF4およびOF5が生成され、第4のオリジナル・フィルム・フレームOFR4から、2つの出力フィールドOF9およびOF10が生成される。以下、同様の動作が行われる。
例えばDVDなどのパッケージ・メディア・タイトルのそれぞれについて少なくとも50Hzバージョンと60Hzバージョンが存在する現在の状況よりは、世界中で再生可能な単一フォーマットのビデオおよびオーディオ・トラックを配布メディアが有することが望ましい。多くのソースは24fps(フレーム毎秒)フィルムからなるので、この24pフォーマットが、このような単一フォーマットのビデオ・トラックの望ましいフォーマットであることが好ましい。従って、このフォーマットは、50Hzを採用している国々および60Hzを採用している国々の両方で、ディスプレイ装置で適切な表示が行われるように再生時に適応させる必要がある。
以下は、24pから25pまたは50iへの変換、より一般的には、25fps変換のための既知の解決策である。
− 4.2%速く再生する。これは、コンテンツ長を変化させ、高コストの実時間オーディオ・ピッチ変換を必要とするので、消費者製品に適用することはできない。実際に、現在の映画放送およびDVDでは、この解決策をビデオに適用しているが、消費者側でオーディオ・ピッチの変換を行う必要がないように、必要なオーディオ速度またはピッチの変換はコンテンツ・プロバイダ側で既に行われている。50Hzの国々で販売されるDVDビデオ・ディスクは、DVDプレーヤのデコーダが正しい速度またはピッチのオーディオ信号を自動的に出力するように既に符号化されたオーディオ・データ・ストリームを収容している。
− 規則的なフィールド/フレーム複製方式を適用する。この解決策では、許容できない規則的なモーション・ジャダ(motion judder)が生じるので、実際には適用されない。
− 動き補償フレーム・レート変換を適用する。これは、このような変換問題に関する一般的な解決策である。非常にコストがかかるので、消費者製品に適用することはできない。
現在では、オリジナルの24pフォーマットの映画のビデオ・データ・ストリームおよびオーディオ・データ・ストリームから50Hzインタレース表示への変換は、映画を約4%速く再生することによって行っている。しかし、これは、50Hzの国々においては、その映画の芸術的内容(時間、声のピッチ)が変更されることを意味する。3:2プル・ダウンに類似したフィールド/フレーム繰返し方式は、1つの追加フィールドを12フレームごとに挿入するなど定期的に適用すると許容できないモーション・ジャダ・アーチファクトを示すので、使用されない。
本発明が解決しようとする課題は、改善された方法で24pフォーマットから25fpsフォーマットへの変換を行うためのフィールドまたはフレーム挿入方式を提供し、モーション・ジャダ・アーチファクトを最小限に抑えることである。この課題は、請求項1に開示の方法によって解決される。この方法を利用した装置を、請求項2に開示する。
複製または繰返しフレーム/フィールドを主観的に不快でない位置に適用するために、グローバル・モーション(global motion)や輝度/強度レベル、シーン変更位置など、現在の映画のシーンの特徴を評価する。換言すれば、本発明では、24pから25fpsに変換する素材に関する比較的容易に入手できる情報を使用して、その結果得られる挿入アーチファクトが最小限になる等間隔でない位置に、繰返しフィールド/フレームを適応的に挿入する。
本発明は、元のフレーム・レートと目標フレーム・レートの間の差が小さいすべてのフレーム・レート変換問題に対して使用することができるので有利である。24fpsから30fpsへの変換など、これらのフレーム・レートの差が大きい場合には、繰り返すフィールドまたはフレームを時間的にシフトさせる自由度はほとんどない。
本発明は、モーション・ジャダを最小限に抑えて、24fpsフォーマット・ピクチャ・シーケンスから25fpsフォーマット・ピクチャ・シーケンス(例示的な値)への計算コストの低い変換を容易にする。
基本的に、本発明の方法は、第1のフォーマットのピクチャ・シーケンスから、第1のフォーマットのピクチャ・シーケンスより高い一定のフレーム周波数を有する第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加のフィールドまたはフレームの挿入を制御するのに適しており、この方法は、
− 対応する追加のフィールドまたはフレームの挿入によって第2のフォーマットのピクチャ・シーケンス中に生じる可視モーション・ジャダが最小である、第1のフォーマットのピクチャ・シーケンス内のフィールドまたはフレームの位置を決定するステップと、
− 全体として任意の隣接するフレーム間の平均距離が前記第2のフォーマットのピクチャ・シーケンスの平均距離に相当するように、上記の位置のいくつかにおいて不規則なフィールドまたはフレーム挿入距離で、前記第1のフォーマットのピクチャ・シーケンスにフィールドまたはフレームを挿入するステップと、
− 前記第1のフォーマットのピクチャ・シーケンスを、前記不規則に挿入されたフィールドおよび/またはフレームと共に、前記第2のフォーマットのピクチャ・シーケンスのフォーマットで提示するステップとを含む。
基本的に、本発明の装置は、第1のフォーマットのピクチャ・シーケンスから、第1のフォーマットのピクチャ・シーケンスより高い一定のフレーム周波数を有する第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加のフィールドまたはフレームの挿入を制御するのに適しており、この装置は、
対応する追加のフィールドまたはフレームの挿入によって前記第2のフォーマットのピクチャ・シーケンス中に生じる可視モーション・ジャダが最小である、前記第1のフォーマットのピクチャ・シーケンス内のフィールドまたはフレームの位置を決定し、
全体として任意の隣接するフレーム間の平均距離が前記第2のフォーマットのピクチャ・シーケンスの平均距離に相当するように、上記の位置のいくつかにおいて不規則なフィールドまたはフレーム挿入距離で、前記第1のフォーマットのピクチャ・シーケンスにフィールドまたはフレームを挿入し、
前記第1のフォーマットのピクチャ・シーケンスを、前記不規則に挿入されたフィールドおよび/またはフレームと共に、前記第2のフォーマットのピクチャ・シーケンスのフォーマットで提示するようになされている手段を含む。
本発明の有利なさらなる実施形態は、各従属請求項に開示してある。
添付の図面を参照して、本発明の例示的な実施形態について述べる。
図1において、ピックアップおよびエラー補正ステージPECを含むディスク・ドライブは、ディスクDから24pフォーマットの符号化されたビデオおよびオーディオ信号を読み取る。その出力信号は、トラック・バッファおよびデマルチプレクサ・ステージTBMを通ってビデオ・デコーダVDECおよびオーディオ・デコーダADECにそれぞれ送られる。制御装置CTRLは、PEC、TBM、VDECおよびADECを制御することができる。TV受信機またはディスプレイ(図示せず)とディスク・プレーヤの間のユーザ・インターフェースUIおよび/またはインターフェースIFを使用して、プレーヤ出力を24fpsモードまたは25fpsモードの何れかに切り替える。インターフェースIFは、どのモード(1つまたは複数)をTV受信機またはディスプレイが処理し提示することができるかを自動的に確認することができる。
再生モード情報は、有線もしくは無線により、または光学的にTV受信機またはディスプレイ装置に接続されたインターフェースIFが受信する特徴データ(すなわちTV受信機またはディスプレイにおいてどの表示モードが利用可能であるかに関するデータ)から、自動的に得られる。前記インターフェースIFは、特徴データを定期的に受信することも、あるいは前記TV受信機またはディスプレイ装置に対して対応する要求を送信した後で受信することもできる。あるいは、再生モード情報は、対応する要求をユーザに対して表示した後で、ユーザ・インターフェースUIにより入力される。ビデオ・デコーダVDECからの出力が25fps出力の場合には、制御装置CTRLまたはビデオ・デコーダVDEC自体が、どの時間的位置においてビデオ・デコーダがフィールドまたはフレームを繰り返すかを、復号されたビデオ信号の特性から決定する。本発明のいくつかの実施形態では、これらの時間的位置は、以下で説明するようにオーディオ・デコーダADECから入来する1つまたは複数のオーディオ信号によっても制御される。
本発明は、例えばディジタル・セット・トップ・ボックスやディジタルTV受信機など、ディスク・プレーヤ以外のタイプの装置で使用することもできる。その場合には、ディスク・ドライブおよびトラック・バッファを含むフロントエンドが、ディジタル信号用のチューナで置き換えられる。
図3は、既知の24pから25fpsへの変換を行うために24フレームごと、すなわちt秒、t+1秒、t+2秒、t+3秒などの時点で1つのフレームが繰り返される、規則的なパターンの繰返しフレームを示す。図4は、既知の24pから25fpsへの変換を行うために24フィールドごと、すなわちt秒、t+0.5秒、t+1秒、t+1.5秒、t+2秒などの時点で1つのフィールドが繰り返される、規則的なパターンの繰返しフィールドを示す。この種の処理は、ディスプレイ装置がインタレース出力を有する場合に適用することができる。フレーム繰返しに比べて、ジャダが生じる時間軸上の位置の数は2倍になるが、各「ジャダ・インスタンス(judder instance)」の強度は半分になる。トップ・フィールドは、ソース・シーケンスの指示されたフレームの第1のライン、第3のライン、第5のラインなどから得られ、ボトム・フィールドはソース・シーケンスの指示されたフレームの第2のライン、第4のライン、第6のラインなどから得られる。
図5は、フレーム繰返しが起こる時間的位置t秒、t+1秒、t+2秒、t+3秒などの時点に印を付した、図3による規則的なフレーム繰返しの時間表を示す図である。
本発明の、等距離でない(または不規則な)位置における繰返しフィールドまたは繰返しフレームの適応型挿入を行うためには、対応する制御情報が必要である。素材に関するコンテンツ情報およびピクチャ信号特性は、MPEG−2 VideoやMPEG−4 Video、MPEG−4 Video part 10などの方式によってピクチャ・シーケンスが圧縮されると直ちに入手可能になる。これらの方式は、おそらくDVDなど現世代の放送およびパッケージ・メディアだけなく、ブルー・レーザ技術に基づくディスクなど、将来のメディアにも使用されることになるものと思われる。
本発明の文脈において有用なピクチャ信号特性または情報としては、以下が挙げられる。
− 生成および/または伝送される動きベクトル、
− エンコーダによって生成されるシーン変更情報、
− DC変換係数の分析により得られる平均輝度または強度情報、および
− AC変換係数の分析により得られる平均テクスチャ強度情報。
このようなピクチャ信号特性は、エンコーダから、ディスクまたは放送を介して、MPEGユーザ・データまたは私用データとしてデコーダに転送することができる。あるいは、ビデオ・デコーダがこれらの情報を収集または計算し、提供することもできる。
動きベクトル情報を活用するために、目に見える動きのある大きな領域を現在のフレームが含むかどうかを判定することができるように、各フレームの動きベクトルMVのセットを収集して処理する。これは、フレームまたはフィールドを複製する際に、最もモーション・ジャダが生じやすいのがこれらの領域だからである。このような領域の有無を判定するためには、以下のように、パン動作の指標として、フレームについて平均絶対ベクトル長AvgMViを計算すればよい。
Figure 0004766567
ここで、「i」はフレーム番号を示し、「VX」および「VY」は画像のx(水平)方向およびy(垂直)方向の動きベクトルの数である。従って、VXおよびVYは、通常は、それぞれの方向の画像サイズを動き推定のブロック・サイズで割ることによって得られる。
1つのフレーム内の複数の動きベクトルが、現在のフレームまでの時間的距離が異なる別々の参照フレームを指す場合には、この距離の正規化因子RDistx,yがさらに必要となる。
Figure 0004766567
さらに複雑な処理を用いる別の実施形態では、各画像の動きセグメンテーションを計算する。すなわち、長さおよび方向が類似した動きベクトルを有する隣接したブロックの1つまたは複数のクラスタを決定して、動きの方向が異なる、十分に大きな複数の動いている領域を検出する。このような場合には、例えば以下のように平均動きベクトルを計算することができる。
Figure 0004766567
ここで、AvgMVcは識別されたクラスタ「c」の平均動きベクトル長である。
この手法は、識別されたどのブロック・クラスタの動きの一部でもなく、またモーション・ジャダの視認性に有意な寄与をしない、画像内の無作為に動く小さなオブジェクトの動きベクトルの影響がなくなるので有利である。この処理では、動いている領域が強いテクスチャを有する、または鮮鋭な縁部を有するかどうかを、AvgMVの重み係数として考慮に入れることもできる。これは、それによりモーション・ジャダの視認性が高まるからである。テクスチャ強度に関する情報は、送信もしくは受信された、または再生された予測誤差のAC変換係数を統計分析することによって最も好都合に得ることができる。
原則として、テクスチャ強度は、オリジナルの画像ブロックを分析することによって決定すべきである。しかし、多くの場合に、動き補償予測を用いた符号化後のこのような強いテクスチャを有するブロックでは、テクスチャの少ないブロックよりも高い予測誤差エネルギーがそれらのAC係数に存在することになる。従って、ビデオ・シーケンスの特定の時間的位置におけるモーション・ジャダの許容差MJTは、以下のように表すことができる。
Figure 0004766567
ここで、以下のような一般的特性があるものとする。
− テクスチャ強度および縁部強度の値が一定であれば、MJTは1/AvgMVに比例する。
− AvgMVおよび縁部強度の値が一定であれば、MJTは1/(テクスチャ強度)に比例する。
− AvgMVおよびテクスチャ強度の値が一定であれば、MJTは1/(縁部強度)に比例する。
図6は、ソース・シーケンスの例示的なモーション・ジャダ許容差値MJT(t)を示す図である。
モーション・ジャダ許容差値の現在の大きさは、図7aに示すように、得られる25fpsシーケンスにおける挿入された繰返しフレームまたはフィールドの分布、すなわちフレームまたはフィールドの繰返し距離FRDに影響を及ぼすことが好ましい。繰返しフレームの挿入が早い、または遅いと、図7bに示すように、ビデオ・トラックに対してオーディオ・トラックの負または正の遅延が生じる。すなわち、様々なビデオ提示遅延が生じる。モーション・ジャダ許容差MJTからフレームまたはフィールドの繰返し距離FRDへのマッピングを適用する際には、オーディオに対する両方向への許容可能な最大のビデオ遅延を考慮する。
この制御問題の1つの考えられる解決策を、図8に示す。フレームまたはフィールドの繰返し距離FRDは、ビデオ遅延VDおよびモーション・ジャダ許容差MJTの関数として表される。
Figure 0004766567
ここで、以下の一般的特性があるものとする。
− VDの値が一定であれば、FRDは1/MJTに比例する。
− MJTの値が一定であれば、FRDは1/VDに比例する。
この関係は、図8に示すように、モーション・ジャダ許容差が小さい(例えば動きの程度が高い)場合には挿入された繰返しフレーム間の最適な間隔より長いことが好ましく、モーション・ジャダ許容差が大きい(例えば動きの程度が平均より低い)場合には最適な間隔より短いことが好ましい、モーション・ジャダ許容差値に応じて変化するFRD=f(VD)の特性関数で表すことができる。最適なフィールドまたはフレームの繰返し距離は、FRDoptで示してある。最大許容ビデオ遅延は、VDmaxで示してある。負方向への最大許容ビデオ遅延は、VDminで示してある。
シーン変更位置における短いフリーズ・フレーム効果が気にならないものと考えられるので、ビデオ・エンコーダ(またはビデオ・デコーダ)が生成するシーン変更情報を利用して、これらの位置において1つまたは複数の繰返しフィールドまたはフレームを挿入することができる。繰返し数は、現在のビデオ遅延の程度によって決まる。同じ理由から、繰返しフィールドまたはフレームは、フェード・トゥ・ブラック(fade−to−black)シーケンス、フェード・トゥ・ホワイト(fade−to−white)シーケンス、または任意の色へのフェードの後で挿入することができる。これらの位置はすべて、非常に高いMJT値を有する。
特に、その他のピクチャ・コンテンツにおいて、個々の位置でのモーション・ジャダ強度を低減するためにフィールドのみが繰り返される場合でも、これらの位置では繰返しフレームを使用することができる。一般に、繰返しフレームおよび繰返しフィールドは変換後のピクチャ・シーケンス内に共存することができる。
通常は、少なくとも1人の話者が実際にシーン内に見えていれば、知覚されるリップ・シンク(lip−sync)の許容遅延範囲を観察するだけでよい。従って、オーディオ提示とビデオ提示の間の遅延は、視認できる話者がいない間に上述の範囲より大きくなる可能性がある。このようなことは、通常、動きの速いシーン中に起こる。従って、図9に示すように、ビデオ遅延限界VDminおよびVDmaxを、
− 発話または短い音声ピーク(音を立ててドアを閉じるような特殊な事象によって引き起こされる)が検出され、且つ動きの遅いシーンまたは静止したシーンが検出された場合の、リップ・シンク許容可能値VDminLipSyncおよびVDmaxLipSyncと、
− それ以外の場合の、より大きなVDの値VDminとVDmax
の間で切り替える、または滑らかに移行させるという、付加的な制御を行うことができる。
例えば、主に用いられるマルチチャネル・オーディオの場合には、映画中の発話の大部分が中心チャネルに符号化されるので、中心チャネルを左チャネルおよび右チャネルに対して評価することによって、発話の検出を得ることができる。中心チャネルが、左チャネルおよび右チャネルのエネルギー分布とは大きく異なる集中的なエネルギーの時間分布を示す場合には、発話が存在する可能性が高い。
局所的なフレーム繰返し距離を適応的に決定する上述のすべての制御は、ビデオ・シーケンスの単一パスに有効である。しかし、本発明の制御は、多くのプロフェッショナルMPEG−2エンコーダで実行される2パス・エンコード処理の恩恵を受ける。その場合、第1のパスは、動き強度曲線、シーンカット位置、ならびに厳密なリップ・シンクを必要とするシーンやブラック・フレームなどの数、番号、位置および長さを収集するために使用される。その後、現在処理中のフレームおよびその過去についての利用可能な情報だけでなく、過去のフレームおよび将来のフレームの近傍についての利用可能な情報も考慮に入れた、修正した制御方式を適用することができる。
Figure 0004766567
ここで、「i」は現在のフレーム番号を示し、「k」はその隣のフレームを指す通し番号である。この各関数の一般的特徴は、MJT(i)がその周囲のMJTの値より小さい場合にはFRDが増大し、MJT(i)がその周囲のMJTの値より大きい場合にはFRDが減少する、というものである。
関連するピクチャ信号特性は、MPEGユーザ・データまたは私用データとして、エンコーダからディスクまたは放送信号を介してデコーダに転送することができる。
本発明の別の実施形態では、特定の状況において、計算コストをかけずに、フレームの繰返しではなくフレームの動き補償補間を適用することができる。このような動き補償補間では、伝送された現在のフレームの動きベクトルを利用することができる。一般に、これらの動きベクトルは、シーンの実際の動きを示すのではなく、最適な予測利得が得られるように最適化されているので、動き補償フレーム補間には適さない。しかし、受信した動きベクトルをデコーダで分析した結果、そのシーンで均一なパンが行われていることが分かった場合には、現在のフレームとその前のフレームの間を確度の高いフレームで補間することができる。パンを行うということは、フレーム内のすべての動きベクトルの長さおよび方向が同じ、またはほぼ同じであることを意味する。従って、補間されるフレームは、その直前のフレームを、現在のフレームの平均動きベクトルが示す距離の半分だけ平行移動することによって生成することができる。直前のフレームが現在のフレームの動き補償予測の参照フレームであり、補間されるフレームが現在のフレームと直前のフレームの間でその両方から等距離に位置すると仮定する。予測フレームが直前のフレームではない場合には、平均動きベクトルの適当なスケーリングを行う。受信した動きベクトルからズームを決定することができる場合にも、同じように考えればよい。ズームは、ズーム中心で動きベクトルがゼロになり、このズーム中心の周りの中心向き(反対向き)の動きベクトルの長さが増大し、動きベクトルの長さがズーム中心からの距離に関連して増大することを特徴とする。
図10のaから図11のbに示すように、この種の動き補償補間は、フレームを繰り返す場合に比べて改善されたモーション・ジャダの挙動を生じるので有利である。24fpsフォーマットの図10aおよび25fpsフォーマットへの変換後の図10bは、フレーム(垂直方向のバーで示す)および垂直方向に移動するオブジェクトの動きの軌道、ならびに「フリーズ・フレーム」を生じる1回のフレーム繰返しを示す。図11aは、動き補間フレームの挿入を示す。このフレームは、図11bに示すように、増大させた目標フレーム・レート25fpsで提示されたときに、「フリーズ・フレーム」ではなく「動きの遅いフレーム」となる。
上記に開示したフレームおよび/またはフィールドの繰返しならびにフレーム・レート変換の補間の制御は、MPEG−2(またはそれと同様の)圧縮システムのエンコーダ側およびデコーダ側の両方で適用することができる。これは、場合によっては信頼性の高いシーン変更指示が含まれないこともあるが、ほとんどのサイド情報が、何れの側でも利用可能であるからである。しかし、エンコーダの高品質のピクチャ・シーケンス特性の知識を活用するために、繰返しまたは補間の対象となるフィールドまたはフレームの位置を、(MPEG−2またはその他の方式で)圧縮された24fpsビデオ信号によって搬送することができる。フィールドの時間的順序を示すフラグ(top_field_first)および第1のフィールドの表示のための繰返しを示すフラグ(repeat_first_field)は、MPEG−2のシンタックスに既に存在している。同じビデオ信号についての24fpsから30fpsへの変換および24fpsから25fpsへの変換の両方の変換パターンを通知する必要がある場合には、2つの一連のフラグのうちの一方を各ピクチャの適当なユーザ・データ・フィールドで搬送することができる。
24fpsおよび25fpsという値ならびに上述のその他の数値は、本発明のその他の適用分野にも同様に適応可能な例示的な値である。
本発明は、
− パッケージ・メディア(DVD、ブルーレーザ・ディスクなど)、
− ビデオ・オン・デマンドやニア・ビデオ・オン・デマンドなどのダウンロード・メディア、および
− 放送メディア、に適用することができる。
本発明は、光ディスク・プレーヤまたは光ディスク・レコーダ、例えばHDDレコーダやPCなどのハードディスク・レコーダ、セットトップ・ボックス、あるいはTV受信機に適用することができる。
本発明のディスク・プレーヤを示す簡略ブロック図である。 24pソース・ピクチャ・シーケンスに3:2プル・ダウンを適用して60iピクチャ・シーケンスを生成する様子を示す図である。 規則的なパターンの繰返しフレームを示す図である。 規則的なパターンの繰返しフィールドを示す図である。 図3による規則的なフレーム繰返しの時間表である。 ビデオ・シーケンスの例示的なモーション・ジャダ許容値を示す図である。 フィールドまたはフレーム繰返しの例示的な不規則な時間的位置と、その結果生じる様々な提示遅延を示す図である。 フィールドまたはフレーム繰返しの例示的な不規則な時間的位置と、その結果生じる様々な提示遅延を示す図である。 ビデオ遅延およびモーション・ジャダ許容差の関数として表されるフレームまたはフィールドの繰返し距離を示す図である。 最大および最小のビデオ遅延が、必要とされるリップ・シンクの程度によって決まる、図8のフレームまたはフィールドの繰返し距離関数を示す図である。 図10aは動き補償を行わない、繰返しフレームを含む24fpsフォーマットのフレームを示す図である。図10bは図10aに関連する25fpsフォーマットのフレーム出力を示す図である。 図11aは動き補償を行う、繰返しフレームを含む24fpsフォーマットのフレームを示す図である。図11bは図11aに関連する25fpsフォーマットのフレーム出力を示す図である。

Claims (19)

  1. 第1のフレーム周波数を有する第1のフォーマットのピクチャ・シーケンスから、前記第1のフレーム周波数より高い一定のフレーム周波数を有する第2のフォーマットのピクチャ・シーケンスを構築するための、前記第1のフォーマットのピクチャ・シーケンスへの追加のフィールドまたはフレームの挿入を制御する方法であり、
    対応する追加のフィールドまたはフレームの挿入によって前記第2のフォーマットのピクチャ・シーケンス中に生じる可視モーション・ジャダが最小である、前記第1のフォーマットのピクチャ・シーケンス内のフィールドまたはフレームの位置を決定するステップと、
    全体として任意の隣接するフレーム間の平均距離が前記第2のフォーマットのピクチャ・シーケンスの平均距離に相当するように、前記位置のいくつかにおいて、不規則なフィールドまたはフレーム挿入距離で、前記第1のフォーマットのピクチャ・シーケンスにフィールドまたはフレームを挿入するステップと、
    前記第1のフォーマットのピクチャ・シーケンスを、前記不規則に挿入されたフィールドおよび/またはフレームと共に、前記第2のフォーマットのピクチャ・シーケンスのフォーマットで提示するステップとを含む方法であって、
    オーディオ・トラックに対するビデオ・トラックの遅延量は所定の許容遅延範囲内に制限され、
    以下の各条件が満たされる場合には、即ち、
    −動きの遅いシーンまたは静止したシーンが検出され、および
    −前記第1のフォーマットのピクチャ・シーケンスに割り当てられたオーディオ情報中で発話または短い音声ピークが検出される場合には、
    知覚リップ・シンクを得るために、前記第2のフォーマットのピクチャ・シーケンスにおいて前記許容遅延範囲を小さくする、前記方法。
  2. 前記第1のフォーマットのピクチャ・シーケンスに割り当てられたオーディオ情報中の発話が、マルチチャネル・オーディオにおいて、左チャネルおよび右チャネルに対して、中心チャネルが、左チャネルおよび右チャネルのエネルギー分布とは大きく異なる集中的なエネルギーの時間分布を示すかどうかを評価することによって検出される、請求項1に記載の方法。
  3. 前記第1のフォーマットのピクチャ・シーケンスが、記憶媒体に記憶または記録される、あるいはディジタルTV信号として放送または転送される、請求項1または2に記載の方法。
  4. 前記記憶媒体が光ディスクまたはハードディスクである、請求項3に記載の方法。
  5. 前記第1のフォーマットのピクチャ・シーケンス中の前記フィールドまたはフレームの挿入位置が、ピクチャ・コンテンツが動く大きな領域を含まないフレームまたはフィールドであり、前記動きが、動きベクトルを評価することによって決定される、請求項1から4の何れか1つに記載の方法。
  6. 前記第1のフォーマットのピクチャ・シーケンス中の前記フィールドまたはフレームの挿入位置が、シーン変更、あるいはフェード・トゥ・ブラック、フェード・トゥ・ホワイト、または任意の色へのフェードが起きるフレームまたはフィールドである、請求項1から5の何れか1つに記載の方法。
  7. 前記挿入されるフィールドまたはフレームが、前記第2のフォーマットのピクチャ・シーケンスにおいて出力される前に動き補償される、請求項1から6の何れか1つに記載の方法。
  8. 前記第1のフォーマットのピクチャ・シーケンスがMPEG−2ピクチャ・シーケンスであり、前記第1のフォーマットのピクチャ・シーケンス中へのフィールドまたはフレームの前記挿入が、フィールドの時間的順序を示すフラグ、または第1のフィールドの表示のための繰返しを示すフラグを評価することによって制御され、前記フラグが、前記第1のフォーマットのピクチャ・シーケンスの各ピクチャのユーザ・データ・フィールドに入った状態で搬送される、請求項1から7の何れか1つに記載の方法。
  9. 前記第1のフレーム周波数が24Hzであり、前記第2のフォーマットのピクチャ・シーケンスのフレーム周波数が25Hzである、請求項1から8の何れか1つに記載の方法。
  10. 挿入するフィールドまたはフレームについての位置を示すフラグが、前記第1のフォーマットのピクチャ・シーケンスのユーザ・データ・フィールドで搬送される、請求項1に記載の方法。
  11. 第1のフレーム周波数を有する第1のフォーマットのピクチャ・シーケンスから、前記第1のフレーム周波数より高い一定のフレーム周波数を有する第2のフォーマットのピクチャ・シーケンスを構築するための、前記第1のフォーマットのピクチャ・シーケンスへの追加のフィールドまたはフレームの挿入を制御する装置であり、
    対応する追加のフィールドまたはフレームの挿入によって前記第2のフォーマットのピクチャ・シーケンス中に生じる可視モーション・ジャダが最小である、前記第1のフォーマットのピクチャ・シーケンス内のフィールドまたはフレームの位置を決定し、
    全体として任意の隣接するフレーム間の平均距離が前記第2のフォーマットのピクチャ・シーケンスの平均距離に相当するように、前記位置のいくつかにおいて不規則なフィールドまたはフレーム挿入距離で、前記第1のフォーマットのピクチャ・シーケンスにフィールドまたはフレームを挿入し、
    前記第1のフォーマットのピクチャ・シーケンスを、前記不規則に挿入されたフィールドおよび/またはフレームと共に、前記第2のフォーマットのピクチャ・シーケンスのフォーマットで提示するようになされた手段を含む装置であって、
    前記手段によって、
    オーディオ・トラックに対するビデオ・トラック遅延量は所定の許容遅延範囲内に制限され、
    以下の各条件が満たされる場合には、即ち、
    −動きの遅いシーンまたは静止したシーンが検出され、および
    −前記第1のフォーマットのピクチャ・シーケンスに割り当てられたオーディオ情報中で発話または短い音声ピークが検出される場合には、
    知覚リップ・シンクを得るために、前記第2のフォーマットのピクチャ・シーケンスにおいて、前許容遅延範囲を小さくする、前記装置。
  12. 光ディスク・プレーヤ、光ディスク・レコーダ、ハードディスク・レコーダ、セットトップ・ボックス、TV受信機またはPCである装置であって、オリジナルの第1のフォーマットのピクチャ・シーケンス、または前記第2のフォーマットのピクチャ・シーケンスの何れかを出力し、その選択が、ディスプレイ装置を含む装置に接続されたインターフェースから自動的に受信される、またはユーザ・インターフェースから受信される再生モード情報によって制御される、請求項11に記載の装置。
  13. 前記第1のフォーマットのピクチャ・シーケンスに割り当てられたオーディオ情報中の発話が、マルチチャネル・オーディオにおいて、左チャネルおよび右チャネルに対して、中心チャネルが、左チャネルおよび右チャネルのエネルギー分布とは大きく異なる集中的なエネルギーの時間分布を示すかどうかを評価することによって検出される、請求項11または12に記載の装置。
  14. 前記第1のフォーマットのピクチャ・シーケンスが、記憶媒体に記憶または記録される、あるいはディジタルTV信号として放送または転送される、請求項11から13の何れか1つに記載の装置。
  15. 前記第1のフォーマットのピクチャ・シーケンス中の前記フィールドまたはフレームの挿入位置が、ピクチャ・コンテンツが動く大きな領域を含まないフレームまたはフィールドであり、前記動きが、動きベクトルを評価することによって決定される、請求項11から14の何れか1つに記載の装置。
  16. 前記第1のフォーマットのピクチャ・シーケンス中の前記フィールドまたはフレームの挿入位置が、シーン変更、あるいはフェード・トゥ・ブラック、フェード・トゥ・ホワイト、または任意の色へのフェードが起きるフレームまたはフィールドである、請求項11から15の何れか1つに記載の装置。
  17. 前記挿入されるフィールドまたはフレームが、前記第2のフォーマットのピクチャ・シーケンスにおいて出力される前に動き補償される、請求項11から16の何れか1つに記載の装置。
  18. 前記第1のフォーマットのピクチャ・シーケンスがMPEG−2ピクチャ・シーケンスであり、前記第1のフォーマットのピクチャ・シーケンス中へのフィールドまたはフレームの前記挿入が、フィールドの時間的順序を示すフラグ、または第1のフィールドの表示のための繰返しを示すフラグを評価することによって制御され、前記フラグが、前記第1のフォーマットのピクチャ・シーケンスの各ピクチャのユーザ・データ・フィールドに入った状態で搬送される、請求項11から17の何れか1つに記載の装置。
  19. 前記第1のフレーム周波数が24Hzであり、前記第2のフォーマットのピクチャ・シーケンスのフレーム周波数が25Hzである、請求項11から18の何れか1つに記載の装置。
JP2006549890A 2004-01-21 2004-11-04 第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置 Expired - Fee Related JP4766567B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP04090021.9 2004-01-21
EP04090021A EP1558033A1 (en) 2004-01-21 2004-01-21 Method and apparatus for controlling the insertion of additional fields or frames into a picture sequence to change its format
PCT/EP2004/012483 WO2005071956A1 (en) 2004-01-21 2004-11-04 Method and apparatus for controlling the insertion of additional fields or frames into a first format picture sequence in order to construct therefrom a second format picture sequence

Publications (3)

Publication Number Publication Date
JP2007519348A JP2007519348A (ja) 2007-07-12
JP2007519348A5 JP2007519348A5 (ja) 2007-12-20
JP4766567B2 true JP4766567B2 (ja) 2011-09-07

Family

ID=34626528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006549890A Expired - Fee Related JP4766567B2 (ja) 2004-01-21 2004-11-04 第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置

Country Status (7)

Country Link
US (1) US20080232784A1 (ja)
EP (2) EP1558033A1 (ja)
JP (1) JP4766567B2 (ja)
CN (1) CN100581235C (ja)
BR (1) BRPI0418350B1 (ja)
DE (1) DE602004018984D1 (ja)
WO (1) WO2005071956A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006082150A2 (en) * 2005-02-07 2006-08-10 Thomson Licensing METHOD AND APPARATUS FOR REPLAYING A VIDEO SIGNAL AND ONE OR MORE AUDIO SIGNALS RELATED TO AUDIO/VIDEO DATA THAT ARE BASED ON A 24Hz FRAME FREQUENCY VIDEO SIGNAL
EP1720166A1 (en) 2005-05-04 2006-11-08 Deutsche Thomson-Brandt Gmbh Method and apparatus for authoring a 24p audio/video data stream by supplementing it with additional 50i format data items
US8605779B2 (en) * 2007-06-20 2013-12-10 Microsoft Corporation Mechanisms to conceal real time video artifacts caused by frame loss
JP4296218B1 (ja) * 2008-02-21 2009-07-15 シャープ株式会社 映像表示装置
EP2104103A1 (en) * 2008-03-20 2009-09-23 British Telecommunications Public Limited Company Digital audio and video clip assembling
EP2104105A1 (en) * 2008-03-20 2009-09-23 British Telecommunications Public Limited Company Digital audio and video clip encoding
US8279344B2 (en) 2009-12-14 2012-10-02 Qnx Software Systems Limited Synchronization of video presentation by video cadence modification
CN103188565A (zh) * 2011-12-30 2013-07-03 北京朝歌数码科技股份有限公司 频道切换系统及方法
US10368031B2 (en) 2014-02-27 2019-07-30 Dolby Laboratories Licensing Corporation Systems and methods to control judder visibility
CN110248132B (zh) * 2019-05-31 2020-12-01 成都东方盛行电子有限责任公司 一种视频帧率插值方法
KR20210028880A (ko) 2019-09-05 2021-03-15 삼성전자주식회사 디스플레이 장치 및 그 제어 방법

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06178274A (ja) * 1992-11-30 1994-06-24 Sony Corp 動画像復号化装置
US5450140A (en) * 1993-04-21 1995-09-12 Washino; Kinya Personal-computer-based video production system
SG74566A1 (en) * 1995-08-23 2000-08-22 Sony Corp Encoding/decoding fields of predetermined field polarity apparatus and method
US5708719A (en) * 1995-09-07 1998-01-13 Rep Investment Limited Liability Company In-home theater surround sound speaker system
JPH1079915A (ja) * 1996-09-02 1998-03-24 Mitsubishi Electric Corp 記録再生装置
US6233253B1 (en) * 1997-05-23 2001-05-15 Thomson Licensing S.A. System for digital data format conversion and bit stream generation
GB2326781B (en) * 1997-05-30 2001-10-10 British Broadcasting Corp Video and audio signal processing
DE69928134D1 (de) * 1998-04-03 2005-12-08 Miranda Technologies Inc Vorrichtung zur Erkennung von Kantenrichtungen
US6181382B1 (en) * 1998-04-03 2001-01-30 Miranda Technologies Inc. HDTV up converter
US7660512B2 (en) * 2003-10-16 2010-02-09 Microsoft Corporation Systems and methods for managing frame rates during multimedia playback

Also Published As

Publication number Publication date
BRPI0418350B1 (pt) 2019-07-09
EP1558033A1 (en) 2005-07-27
DE602004018984D1 (de) 2009-02-26
CN1906937A (zh) 2007-01-31
CN100581235C (zh) 2010-01-13
US20080232784A1 (en) 2008-09-25
EP1707002A1 (en) 2006-10-04
JP2007519348A (ja) 2007-07-12
BRPI0418350A (pt) 2007-05-02
WO2005071956A1 (en) 2005-08-04
EP1707002B1 (en) 2009-01-07

Similar Documents

Publication Publication Date Title
US7295757B2 (en) Advancing playback of video data based on parameter values of video data
JP4790776B2 (ja) 多重化装置、多重化方法、再生装置、再生方法、記録方法および再生システム
JP5011278B2 (ja) 24pオーディオ/ビデオデータストリームを更なる50iフォーマットのデータアイテムで補充することで24pオーディオ/ビデオデータストリームをオーサリングする方法及び装置
JP4766567B2 (ja) 第1のフォーマットのピクチャ・シーケンスから第2のフォーマットのピクチャ・シーケンスを構築するための、第1のフォーマットのピクチャ・シーケンスへの追加フィールドまたは追加フレームの挿入を制御する方法および装置
JP4954901B2 (ja) 24Hzフレーム周波数のビデオ信号に基づくオーディオ/ビデオ・データに関係するビデオ信号および一つまたは複数のオーディオ信号を再生するための方法および装置
JP2011151721A (ja) 画像処理装置、画像処理方法、およびプログラム
JP4513873B2 (ja) 映像処理装置、及び映像処理方法
KR20050056162A (ko) 정보 처리 장치 및 방법, 프로그램 및 기록 매체
JP2007519348A5 (ja)
JP2006050230A (ja) フレームレート変換方法、変換装置、画像信号記録装置および再生装置
JP2009507447A (ja) 異なる解像度におけるビデオ再生システム
MXPA06007738A (en) Method and apparatus for controlling the insertion of additional fields or frames into a first format picture sequence in order to construct therefrom a second format picture sequence
JP2012029216A (ja) 再生装置、再生方法、およびプログラム
EP1689179A1 (en) Method and apparatus for replaying a video signal and one or more audio signals related to audio/video data that are based on a 24Hz frame frequency video signal
EP1549065A1 (en) Method and apparatus for selecting the replay mode for a picture sequence that is stored or recorded in a first format on a storage medium
JP4641023B2 (ja) 映像信号再生装置
EP1549066A2 (en) Method and apparatus for replay mode selection
CN109874050A (zh) 家庭影院控制总线的优先级调度
JPH0775055A (ja) 映像信号処理方法および映像信号処理装置
KR20020070501A (ko) 압축 인코딩된 비디오의 압축 해제
JP2009232087A (ja) 映像情報再生装置及び方法、映像情報再生システム、映像情報再生システムの制御方法、並びにコンピュータプログラム
JP2008301275A (ja) 映像出力装置及び映像出力方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071031

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071031

RD05 Notification of revocation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7425

Effective date: 20080319

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080415

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100804

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20101028

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20101105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110223

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110516

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110608

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110609

R150 Certificate of patent or registration of utility model

Ref document number: 4766567

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees