JP4339680B2 - ビデオ圧縮フレームの補間 - Google Patents

ビデオ圧縮フレームの補間 Download PDF

Info

Publication number
JP4339680B2
JP4339680B2 JP2003512817A JP2003512817A JP4339680B2 JP 4339680 B2 JP4339680 B2 JP 4339680B2 JP 2003512817 A JP2003512817 A JP 2003512817A JP 2003512817 A JP2003512817 A JP 2003512817A JP 4339680 B2 JP4339680 B2 JP 4339680B2
Authority
JP
Japan
Prior art keywords
frame
weight
representation
bidirectional prediction
frames
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2003512817A
Other languages
English (en)
Other versions
JP2004538691A (ja
Inventor
ガリー エー デモス
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of JP2004538691A publication Critical patent/JP2004538691A/ja
Application granted granted Critical
Publication of JP4339680B2 publication Critical patent/JP4339680B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/577Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明はビデオ圧縮に関し、詳細には、MPEG等の符号化および復号化システムにおけるビデオ圧縮フレームの改良された補間に関する。
MPEGの背景
MPEG−2およびMPEG−4は、画像シーケンスをよりコンパクトな符号化データの形で表わす効率的な方法を提供するビデオシンタックスを定義する国際ビデオ圧縮標準規格である。符号化ビットの言語は、「シンタックス」である。例えば、僅かなトークンでサンプルの全ブロックを表すことができる(例えば、MPEG−2では64サンプル)。両方のMPEG標準規格には、復号化(再構成)処理も記述されており、符号化ビットを、コンパクトな表現から元のフォーマットの近似画像シーケンスへ写像する。例えば、符号化ビットストリーム内のフラグは、後続のビットを、離散コサイン変換(DCT)アルゴリズムで復号化する前に、予測アルゴリズムで先に処理すべきかどうかを知らせる。復号化処理を含むアルゴリズムは、これらのMPEG標準規格により定義されているセマンティックスにより規定されている。このシンタックスは、空間冗長性、時間冗長性、一様な動き、空間マスキング等の共通のビデオ特性を活用するように適用され得る。実際、これらMPEG標準規格は、データフォーマットはもとよりプログラミング言語も定義している。MPEGデコーダは、入力されるデータストリームを解析し、復号化できなければならないが、データストリームが対応するMPEGシンタックスに準拠している限り、広く多様な可能なデータ構造および圧縮技法を用いることができる(セマンティックスが整合性をもたないために、技術的には標準規格から逸脱することはあるが)。代替シンタックス内に必要なセマンティックスを持つことも可能である。
これらMPEG標準規格は、イントラフレーム(フレーム内)およびインターフレーム(フレーム間)法を含む多様な圧縮法を用いる。ほとんどの映像シーンでは、動きが前景において生じている間、背景は比較的静止したままである。背景が動くこともあるが、多くのシーンは冗長である。これらMPEG標準規格は、「イントラ」フレームまたは「Iフレーム」と呼ばれる基準フレームを作成することにより圧縮を開始する。Iフレームは、他のフレームを参照せずに圧縮されるので、フレーム全体の映像情報を含んでいる。Iフレームは、ランダムアクセスのためのエントリーポイントをデータビットストリームに提供するが、中程度にしか圧縮できない。Iフレームを表すデータは、12から15フレーム毎にビットストリームに配置されるのが普通である(状況によっては、Iフレーム間にもっと広い間隔を設けることも有用である)。従って、基準Iフレーム間にあるフレームの僅かな部分だけが、両側を挟むIフレームと異なるので、その画像の差分だけが捕捉され、圧縮され、そして格納される。2種類のフレームが、かかる差分のために用いられる。すなわち、予測フレームつまりPフレーム、および双方向補間フレームつまりBフレームである。
Pフレームは、一般に過去のフレーム(Iフレームまたは以前のPフレームのいずれか)を参照して符号化され、一般には後続のPフレームに参照されて用いられる。Pフレームはかなり高い圧縮を受ける。Bフレームは、最も高い圧縮量を提供するが、符号化されるために過去と未来の両参照フレームを必要とする。標準圧縮技術で双方向フレームが参照フレームとして用いられることはない。
マクロブロックは、画像ピクセルからなる領域である。MPEG−2では、マクロブロックは、8×8のDCTブロック4つを集めた16×16ピクセルであり、Pフレームについては1つの動きベクトル、Bフレームについては1つまたは2つの動きベクトルを伴う。Pフレーム内のマクロブロックは、イントラフレームまたはインターフレーム(予測フレーム)符号化のいずれかを用いて個別に符号化され得る。Bフレーム内のマクロブロックは、イントラフレーム符号化、順方向予測符号化、逆方向予測符号化、または、順方向および逆方向の両方向(すなわち、双方向補間)予測符号化を用いて個別に符号化され得る。僅かに異なってはいるが類似の構造が、MPEG−4ビデオ符号化で用いられている。
符号化されると、MPEGデータビットストリームは、一連のI、PおよびBフレームを備える。シーケンスはI、PおよびBフレームのほとんどいかなるパターンを構成してもよい(それらの配置に多少の意味的制限はある)。しかしながら、産業上の実施においては、一定のパターン(例えば、IBBPBBPBBPBBPBB)を有することが通常である。
動きベクトル予測
MPEG−2およびMPEG−4(およびH.263等の類似の標準規格)では、B型(双方向予測)フレームの使用が圧縮の効率に有利であることが分かっている。各マクロブロックに対する動きベクトルは、以下の3つの方法のいずれかにより予測できる:
1)以前のIまたはPフレームから順方向へ予測する(すなわち、非双方向予測フレーム)。
2)後続のIまたはPフレームから逆方向へ予測する。
3)後続および以前のIまたはPフレームの両方から双方向に予測する。
モード1は、Pフレームに用いる順方向予測法と同一である。モード2は、後続フレームから逆方向に働くこと以外、同じ考え方である。モード3は、以前および後続のフレームからの情報を組み合わせる補間モードである。
これら3つのモードに加えて、MPEG−4は、第2の補間動きベクトル予測モード、すなわち、後続のPフレームからの動きベクトルおよびデルタ値を用いる直接モード予測もサポートする。後続のPフレームの動きベクトルは、以前のPまたはIフレームを指し示す。ある比率を用いて後続のPフレームからの動きベクトルに重み付けをする。その比率は、後続のPおよび以前のP(またはI)フレームに対する現在のBフレームの相対的時間位置である。
図1はフレームの時系列と先行技術に基づくMPEG−4直接モード動きベクトルである。MPEG−4直接モード(モード4)の概念は、間にある各Bフレームにおけるマクロブロックの動きが、直後のPフレームにおいて同じ位置を符号化するのに用いられた動きに近くなりそうだということである。後続するPフレームから得られる比例する動きベクトルに小さな補正をするために、デルタ(delta)が用いられる。動きベクトル(MV)101、102、103に与えられる比例した重みが、以前のPまたはIフレーム105と後続のPフレーム106の間の「距離」の関数として、中間のBフレーム104a、104bそれぞれに対して示されている。中間のBフレーム104a、104bそれぞれに割り当てられた動きベクトルは、続くPフレームに対する動きベクトルを割り当てられた重み値倍し、デルタ値を加えたものに等しい。
MPEG−2の場合、符号化の際に、Bフレームに対する全ての予測モードは検査され、各マクロブロックに対して最良の予測を見つけるために比較される。予測が十分でなければ、そのマクロブロックは、「I」(「イントラ」)マクロブロックとして、独立した形で符号化される。符号化モードは順方向(モード1)、逆方向(モード2)、双方向(モード3)の間の最良モードあるいはイントラとして選択される。MPEG−4の場合、イントラの選択は認められない。代わりに直接モードが4番目の選択となる。さらに最良の符号化モードは、何らかの最良一致基準に基づいて選択される。MPEG−2およびMPEG−4の基準ソフトウエアエンコーダでは、DC一致(差の絶対値の合計(Sum of Absolute Difference)すなわち「SAD」)を用いて最良の一致が決定される。
MPEGでは、連続するBフレームの数は「M」パラーメータの値によって決定される。M−1は各Pフレームと続くP(またはI)フレーム間のBフレームの数である。したがって、M=3の場合、図1に示されるように、各P(またはI)フレーム間に2つのBフレームがある。主にMの値、したがって連続するBフレームの数を制限するのは、P(またはI)フレーム間の動き変化の量が大きくなることである。Bフレームの数を多くすることは、P(またはI)フレーム間の時間が長くなることを意味する。それゆえに、効率と動きベクトルによる符号化範囲の制限が中間にあるBフレームの数の最終的な制限を生み出している。
復号化されるPフレームはそれぞれ次の後続Pフレームを予測するための開始点として用いられるので、Pフレームは動画ストリームとともに「エネルギー変化」を順方向に運ぶということに注意することも重要である。しかしながら、Bフレームは使用後廃棄される。それゆえに、Bフレームを生成するために用いられるいかなるビットもそのフレームのためだけに用いられ、Pフレームと異なり、後続フレームを援助するための補正を提供しない。
本発明は、各フレームが複数のピクセルからなるビデオ画像圧縮システムにおいて1つ以上の双方向予測中間フレームの画質を改良するための方法、システムおよびコンピュータプログラムに向けられている。
一側面では、本発明は、連続する双方向予測中間フレームを挟む非双方向予測フレームにおける対応するピクセル値の重みの比として、各双方向予測中間フレームの各ピクセルの値を決定する。一実施例では、重みの比は、両側を挟む非双方向予測フレーム間の距離の関数である。他の実施例では、重みの比は、両側を挟む非双方向予測フレームのフレーム間距離と両側を挟む非双方向予測フレームの均等平均(equal average)との混合された関数である。
本発明の他の側面は、線形空間または元の非線形な表現とは異なる他の最適化された非線形空間における表現上で、ピクセル値の補間が実行されることである。
本発明の1つ以上の実施の形態の詳細を添付図面と以下の説明で述べる。本発明の他の特徴、目的、そして利点は、その説明と図面、および請求の範囲から明らかとなろう。なお、種々の図において同様な要素には同様な参照符号を付する。
詳細な説明
概観
本発明の一側面は、各P(またはI)フレーム間に2つのBフレームを提供する3のM値を使用することが一般的であるという認識に基づいている。しかしながら、M=2およびM=4またはそれより大きな値も全て有用である。M値(Bフレームの数足す1)はまたフレームレートと自然な関係を生じることに留意することは特に重要である。映画の速度である毎秒24フレーム(24fps)では、フレーム間の1/24秒の時間距離は十分なフレーム間変化をもたらしうる。しかしながら、60fpsや72fpsあるいはそれより高いフレームレートでは、隣接するフレーム間の時間距離は相応して減少する。したがって、フレームレートが増大するにつれて、Bフレームの数を大きくする(すなわちM値を大きくする)ことが有用になり、圧縮の効率に有益になる。
本発明のもう一つの側面は、MPEG−2およびMPEG−4ビデオ圧縮が両方とも単純化し過ぎた補間法を利用しているとの認識に基づいている。例えばモード3の場合には、あるフレームの各マクロブロックに対する双方向予測は、2つの対応する動きベクトルによって置換されるとき、後続および以前のフレームのマクロブロックの均等平均である。この均等平均は、M値が2(すなわち1つの中間Bフレーム)の場合には、以前および後続のP(またはI)フレームから時間的に等しい距離にBフレームがあるため、適切である。しかしながら、すべてのより大きなM値に対しては、対称中心にあるBフレーム(すなわちM=4,6,8等の場合の真ん中のフレーム)だけが均等な重みを用いることに最適となろう。同様に、MPEG−4直接モード4において、動きベクトルは比例するように重み付けされるとしても、各中間Bフレームに対する予測ピクセル値は以前のP(またはI)フレームと後続のPフレームの均等な比となっている。
それゆえに、M>2の場合、各Bフレームに対する予測ピクセル値に適切な比例重み付けを適用することで改良ができる。現在のBフレームでの各ピクセルに対する比例重みは、以前および後続のP(またはI)フレームに関する現在のBフレームの相対的な位置に対応する。それゆえに、M=3の場合、最初のBフレームは、以前のフレームの(動きベクトルが調整された)対応するピクセル値の2/3と、後続のフレームの(動きベクトルが調整された)対応するピクセル値の1/3を用いる。
図2は、フレームの時系列と本発明のこの側面に基づく比例ピクセル重み値である。各中間Bフレーム201a、201bの各マクロブロック内のピクセル値は以前のPまたはIフレームAと続くPまたはIフレームBの間の「距離」の関数として重み付けされる。つまり、双方向予測Bフレームの各ピクセル値は、両側を挟む非双方向予測フレームAおよびBの対応するピクセル値の重み付けされた組み合わせである。M=3の場合であるこの例では、最初のBフレーム201aに対する重みは2/3A+1/3Bとなり、2番目のBフレーム201bに対する重みは1/3A+2/3Bとなる。従来のMPEGシステムで割り当てられる均等平均重みも示されている。各Bフレーム201a、201bに対するMPEG−1、2および4の重みは、(A+B)/2となる。
拡張されたダイナミックレンジおよびコントラストレンジへの適用
Mが2より大きいと、中間Bフレームにおけるピクセル値の比例重み付けは、多くの場合、双方向(モード3)および直接(モード4)符号化の効果を改良する。実例となるケースには、フェードアウトやクロスディゾルブのような一般的な映画やビデオの編集効果が含まれる。MPEG−2とMPEG−4の両方の場合で、単純なDC一致の使用および一般的なM=3(すなわち2つの中間Bフレーム)の使用は、Bフレームに対する均等な比に帰着することとなるため、これらのビデオ効果の種類は、問題のある符号化の実例である。かかる場合の符号化は比例Bフレーム補間を用いることで改良される。
また、拡張されたダイナミックレンジおよびコントラストレンジに対して、比例Bフレーム補間は、符号化効率改良の直接的な応用を有する。画像符号化において通常起こるのは、照明の変化である。これは、対象が次第に影(淡い影の端)の中に入る(あるいは外に出る)ときに起こる。対数の符号化表現が輝度に対して用いられる(例えば対数輝度Yにより具体化されるように)ならば、照明の輝度変化はDCオフセット量の変化になるだろう。照明の輝度が半分に落ちれば、ピクセル値は全て等しい量だけ減少する。それゆえに、この変化を符号化するため、AC一致が見つけられるべきであり、かつ、符号化されたDC差がその領域に適用されるべきである。Pフレーム内に符号化されているDC差は、間にあるBフレームそれぞれにも同様に比例して適用されるべきである(本出願と同時に出願され、本発明の譲受人へ譲渡された「圧縮画像の色度情報を改良するための方法およびシステム」("Method and System for Improving Compressed Image Chroma Information”)と題する係属中の米国特許第09/905,039号を参照のこと。対数符号化表現に関する追加情報として引用して本明細書に組み込む。)。
照明の変化に加えて、コントラストの変化も比例Bフレーム補間による利益を得る。例えば、飛行機が雲や霞から飛び出し、観察者へ向かって移動するにつれて、そのコントラストは次第に増加する。このコントラストの増加は、Pフレームの符号化マクロブロックにおけるDCTのAC係数において、振幅の増大として表される。この場合もやはり、間にあるBフレームのコントラスト変化は比例補間(proportional interpolation)により最もよく近似され、符号化効率を改良する。
比例Bフレーム補間の使用によるダイナミックレンジおよびダイナミックコントラスト符号化効率の改良は、フレームレートが高くなり、M値が増大するにつれてますます重要になる。
時相階層化(temporal layering)への高M値の適用
符号化効率を維持し、あるいは増進すると同時に、M値従って両側を挟むPおよび/またはIフレーム間のBフレームの数を増加して本発明の実施例を用いることは、時相階層化を含む多くの応用を提供する。例えば、「先端的テレビのための時相および解像度の階層化」("Temporal and Resolution Layering for Advanced Television”)と題する米国特許第5,988,863号(本発明の譲受人へ譲渡され、引用して本明細書に組み込む。)では、Bフレームは、階層化された時相の(フレーム)レートに適した構造であることが特筆されている。かかるレートの自由度は、利用可能なBフレームの数に関係する。例えば、Bフレームが1つ(M=2)の場合、72fpsのストリーム内では、36fpsの時相層を復号化でき、または60fpsストリーム内では、30fpsの時相層を復号化できる。Bフレームが3つ(M=4)の場合、72fpsストリーム内では、36fpsと18fps両方の時相層を復号化でき、60fpsストリーム内では、30fpsと15fps両方の時相層を復号化できる。120fpsストリーム内でM=10を用いると、12fps、24fpsおよび60fpsの時相層を復号化できる。144fpsストリームにM=4を用いると、72fpsおよび36fpsの時相層が復号化できる。
「時相および解像度の階層化の向上」("Enhancements to Temporal and Resolution Layering”)と題する係属中の米国特許出願第09/545,233号(本発明の譲受人へ譲渡され、引用して本明細書に組み込む。)に記述されているように、24fpsでの動きぼけ特性を改良するために、全てのN番目フレームを取り出すことの改良として、120fpsや72fpsの複数のフレームは復号化され、比例して混合される。
「動き補償とフレームレート変換のためのシステムと方法」("System and Method for Motion Compensation and Frame Rate Conversion”)と題する係属中の米国特許出願第09/435,277号(本発明の譲受人へ譲渡され、引用して本明細書に組み込む。)に記述されている方法を利用して、より高いフレームレートでも合成され得る。例えば、72fpsのカメラ原本は、動き補償フレームレート変換を用いて、毎秒288フレームの実効的なフレームレートを作り出すことができる。M=12を用いれば、48fpsと24fpsの両フレームレートを得ることができるだけでなく、144fps、96fpsおよび32fps(そしてもちろん元の72fps)のような他の有用なレートを得ることができる。この方法によるフレームレート変換は、整数倍であることを必要としない。例えば、120fpsの実効レートは72fpsの元データから生成され得、さらに、(M=10を用いると)60fpsおよび24fpsレートの両方に対する元データとしても用いられ得る。
それゆえに、Bフレーム補間の性能を最適化することは、時相階層化に有益である。上記の比例Bフレーム補間は、より大きなBフレーム数をより効率的に機能せしめ、したがって、これらの受益を可能とする。
混合されたBフレーム補間比
Bフレームのピクセル値に対する動き補償モード予測子として、均等平均重み付けが従来のシステムで用いられてきた1つの理由は、特定のBフレームの前後にあるP(またはI)フレームがノイズを多く含むかもしれず、したがって不十分に一致するかもしれないということにある。均等な混合は、補間された動き補償ブロックにおいて、ノイズを最大限減少する。残差は量子化DCT関数を用いて符号化される。もちろん、動き補償の比との一致が良好であるほど、要求される残差ビットは少なくなり、結果として得られる画質も高くなる。
影や霞に入ったり出たりする対象がある場合に、M>2ならば、真の比はより良好な予測を提供する。しかしながら、明るさやコントラストが変化しないときは、均等重み付けはより良好な予測子となるかもしれない。なぜなら、動きベクトルに沿ってマクロブロックを順方向へ移動させる際の誤差が、逆方向へ移動するブロックからの誤差で平均化され、ゆえに、半分だけ各々における誤差が減少するからである。そうだとしても、Bフレームのマクロブロックは、離れたP(またはI)フレームよりも、より近くにあるP(またはI)フレームと、より強い相関関係を持ちそうである。
それゆえに、局所的なコントラストや明るさの変化があるような一定の状況においては、Bフレームマクロブロックのピクセル重み付けに対して(輝度と色度の両方について)真の比を利用することが望ましい。他の状況においては、MPEG−2およびMPEG−4と同様に、均等な比を利用することが、より最適かもしれない。
これら2つの比の技法(均等平均対フレーム距離比)から、混合したものも作ることができる。例えば、M=3の場合には、1/3および2/3の3/4を比とし、均等平均の1/4と組み合わせることで、2つの比は3/8と5/8になる。この技法は「混合因子」Fを用いて、一般化され、
Weight=F・(FrameDistanceProportionalWeight)+(1−F)・(EqualAverageWeight)
となる。実用的な混合因子Fの範囲は、完全な比例補間を示す1から、完全な均等平均を示す0までである(逆数をとってもよい)。
図3は、フレームの時系列と本発明のこの側面に基づく比例および均等ピクセル重み値の混合である。各中間Bフレーム301a、301bの各マクロブロックのピクセル値は、以前のPまたはIフレームAと続くPまたはIフレームB間の「時間距離」の関数として、およびAとBの均等平均の関数として重み付けされる。この例は、M=3および混合因子F=3/4の場合であり、1番目のBフレーム301aに対する混合された重みは5/8A+3/8B(すなわち比例重みである2/3A+1/3Bの3/4倍に均等平均の重みである(A+B)/2の1/4倍を加えたもの)となる。同様に、2番目のBフレーム301bに対する重みは3/8A+5/8Bとなる。
混合因子の値は、完全な符号化全体について、または各GOP(group of picture)、Bフレームの範囲、各Bフレーム、あるいはBフレーム内の各領域(例えば、可能な限り細かく、各マクロブロックあるいは8x8モードでPベクトルを用いるMPEG−4直接モードの場合には、個別の8x8動きブロックさえも含む)について設定できる。
ビット節約を促進するために、そして通常、混合比は各マクロブロックに伝えられるほど重要ではないという事実を反映し、混合の最適な使用は圧縮される画像の種類に関係するはずである。例えば、フェードやディゾルブしている画像や全体の明るさやコントラストが次第に変化している画像に対しては、混合因子Fを1かそれに近い値(すなわち比例補間を選択すること)とすることが、一般的に最適である。かかる明るさやコントラストの変化がない連続する画像に対しては、2/3や1/2や1/3のようなより小さな混合因子値が最良の選択となり、それによって、いくらかの均等平均補間の利益と同様に、いくらかの比例補間の利益が保たれる。0から1の範囲内の全ての混合因子値は一般に有用であり、与えられたいかなるBフレームに対しても、この範囲内のある特定の値が最適となる。
広いダイナミックレンジと広いコントラストレンジの画像に対しては、局所的な領域の特性に依存して、混合因子は局所的に決定できる。しかしながら一般には、広い範囲の明るさやコントラストは、混合因子値が均等平均補間よりむしろ完全な比例補間を支持するように促す。
場面の特定の種類から得られる知識を用いて、場面の種類によって混合因子の表を作成するのではあるが、最適な混合因子は一般には経験的に決定される。例えば、画像変化特性の決定を使用して、フレームや領域の混合比を選択できる。あるいは、Bフレームは多くの混合因子の候補(フレーム全体と領域のどちらかに対して)を用いて符号化でき、同時に、それぞれが画質を最適化し(例えば最大信号雑音比(SNR)によって決定される)、さらに、最も少ないビット数となるために評価される。これらの候補評価は混合比の最良値を選択するために用いられる。画像変化特性と符号化の質/効率の両方の組み合わせも、用いることができる。
もちろん、シーケンスの真ん中付近のBフレームや、低M値の結果得られるBフレームは、算出される比がすでに均等平均に近くなるため、ほとんど比例補間による影響を受けない。しかしながら高M値の場合、端に位置するBフレームは、混合因子の選択により著しく影響を受ける。ここで留意すべきは、隣接する両方のP(またはI)フレームからの大きな比をすでに有するため、均等平均から外れることによる利益がほとんど、あるいはまったく得られないより中央近くの位置と比べて、これらの端の位置に対しては、均等平均をより多く利用するように混合因子を異ならせられることである。例えばM=5の場合、1番目と4番目のBフレームは、より多くの均等平均を混合するような混合因子Fを用いるが、2番目と3番目の真ん中にあるBフレームは、厳密に2/5と3/5の均等平均な比を用いてもよい。比対平均の混合因子が変化する場合、それは圧縮されるビットストリーム中にまたは付け足し情報として、デコーダに伝達される。
静的で一般的な混合因子が必要となる場合(値を伝達する方法の欠如による)、2/3が通常最適に近い値となり、エンコーダとデコーダの両方において、Bフレーム補間に対する静的な値として選択できる。例えばF=2/3を混合因子として用いると、M=3の場合、次のフレームの比は7/18(7/18=2/3*1/3+1/3*1/2)および11/18(11/18=2/3*2/3+1/3*1/2)となる。
線形補間
圧縮に用いられる輝度値は非線形である。非線形表現の様々な形式での使用は、対数、指数(様々な冪に対する)および黒補正を伴う指数(ビデオ信号に一般に用いられる)を含む。
狭いダイナミックレンジにわたって、またはすぐ近くの領域の補間に対しては、これらの近接する補間は区分的線形補間を表すので、非線形表現は許容範囲にある。それゆえに、輝度の微小変化は、線形補間により妥当に近似される。しかしながら、広いダイナミックレンジと広いコントラストレンジの画像で生じるように輝度が大きく変化する場合、非線形信号を線形信号として取り扱うことは不正確となるだろう。通常のコントラストレンジの画像についてさえ、線形なフェードおよびクロスディゾルブは線形補間により劣化され得る。フェードやクロスディゾルブの中には、非線形なフェードおよびディゾルブ率を利用するものがあり、さらに複雑になる。
それゆえに、比例混合の使用に対するさらなる改良は、線形空間、または元の非線形な輝度表現と異なる他の最適化された非線形空間で表現されるピクセル値に対する補間を実行することである。
例えばこれは、最初に(以前および後続のP(またはI)フレームからの)2つの非線形輝度信号を線形表現あるいは別の非線形表現に変換することで、達成してもよい。それから比例混合を適用し、その後逆変換を適用し、画像の元の非線形輝度表現で、混合された結果を生成する。しかしながら、比例関数は輝度信号のより最適な表現で実行されるだろう。
霞や曇りにおける変化と結びついたコントラスト変化で生じるように、色がフェードし、またはより飽和しつつあるときに、この線形または非線形変換を輝度に加えて色値に、有益に適用することも可能である。
実施例
図4は、コンピュータに実装され得る方法として本発明の例示的な実施形態を示すフロー図である。
ステップ400:ビデオ画像圧縮システムにおいてBフレームを算出するための直接および補間モードに対して、フレーム距離比、および、均等重みと元データ(例えば、ビデオ画像ストリーム)から入力されるシーケンスの両側を挟む少なくとも2つの非双方向予測フレームから得られるフレーム距離比との混合、のうちの1つを使用して、2つ以上の双方向予測中間フレームの入力シーケンスの各ピクセルに適用する補間値を決定する。
ステップ401:フレーム内の領域や1つ以上のフレームのような画像単位に関して、補間値を最適化する。補間値は、符号化セッション全体に対して静的に設定してもよいし、場面、GOP、フレーム、フレーム群毎、またはフレーム内の局所に対し動的に設定してもよい。
ステップ402:さらに場面の種類や符号化の簡潔さに関して、補間値を最適化する。例えば、補間値は静的に設定してもよく(2/3を比例に、かつ1/3を均等平均に)、均等平均に近いフレームに対しては比例的に設定し、隣接するP(またはI)フレームの近くでは均等平均と混合させて設定してもよく、フェードおよびクロスディゾルブのように場面全体の特性に基づいて動的に設定してもよく、局所的なコントラストレンジおよび局所的なダイナミックレンジのような局所的な画像領域の特性に基づいて動的に(かつ局所的に)設定してもよく、最大の符号化SNRおよび生成される最小の符号化ビットのような符号化性能に基づいて動的に(かつ局所的に)設定してもよい。
ステップ403:静的に補間値を決定しない場合は、デコーダに適切な比の量を伝達する。
ステップ404:任意で、各フレームに対する輝度(および任意で色度)情報を線形あるいは別の非線形表現に変換し、さらに静的に補間値を決定しない場合は、その代替混合表現をデコーダに伝達する。
ステップ405:決定した補間値を用いて、比例ピクセル値を求める。
ステップ406:必要に応じて(ステップ404により)、元の表現に再変換する。
実装
本発明は、ハードウエアもしくはソフトウエアまたは両者の組み合わせ(例えば、プログラマブル・ロジック・アレー)で実装してもよい。特に規定のない限り、本発明の一部として含まれるアルゴリズムは、如何なる特定のコンピュータまたは他の装置と本質的に関連しない。特に、本明細書の教示に従って書かれたプログラムを有する各種の汎用マシンを用いることができ、あるいはより特化した装置(例えば、集積回路)を構成して特定の機能を実行すると更に便利になろう。このように、本発明は、1台以上のプログラマブルコンピュータシステム上の1つ以上のコンピュータプログラムに実装でき、各システムは、少なくとも1つのプロセッサ、少なくとも1つのデータ記憶システム(揮発性または不揮発性メモリおよび/または記憶素子を含む)、少なくとも1つの入力装置またはポート、および少なくとも1つの出力装置またはポートを備える。プログラムコードを入力データに適用して本明細書で説明した機能を実行するとともに、出力情報を生成する。出力情報は、既知の方法で1台以上の出力装置に適用される。
コンピュータシステムと通信するための、任意の所望するコンピュータ言語(機械語、アセンブリ言語、または高レベル手続き型言語、論理型言語、またはオブジェクト指向プログラム言語を含む)で、かかるプログラムをそれぞれ実装してよい。いずれにしても、言語は、コンパイラ型言語でもインタープリタ型言語でもよい。
本明細書で説明した手段を実行するためのコンピュータシステムにより、汎用または特定用途のプログラマブルコンピュータにより可読な記憶媒体または装置(例えば、固体メモリか媒体、または磁気式か光学式媒体)が読み込まれる際に、コンピュータを構成するとともに操作するため、かかるコンピュータプログラムはそれぞれ、その記憶媒体または装置に格納するかダウンロードされるのが好ましい。本発明のシステムは、コンピュータプログラムで構成されたコンピュータ可読の記憶媒体として実施されると考えられてもよく、その場合、そのように構成された記憶媒体は、コンピュータシステムを特定のかつ予め定義された方法で動作させて、本明細書で説明した機能を実行する。
本発明の多くの実施の形態を説明してきた。それにもかかわらず、本発明の趣旨と範囲から逸脱することなく、多様な改変がなされるだろうことは言うまでもない。例えば、上記のステップの幾つかは順不同であってもよく、従って、説明したものと異なる順序で実行してもよい。よって、他の実施の形態は、以下の請求の範囲内にある。
図1は、フレームの時系列と先行技術に基づくMPEG−4直接モード動きベクトルである。 図2は、フレームの時系列と本発明の第一の側面に基づく比例ピクセル重み値である。 図3は、フレームの時系列と本発明の第二の側面に基づく比例ピクセル重み値と均等ピクセル重み値の混合である。 図4は、コンピュータに実装され得る方法として本発明の例示的な実施形態を示すフロー図である。

Claims (33)

  1. 各フレームが複数のピクセルを備えるビデオ画像圧縮システムにおいて、連続する2つ以上の双方向予測中間フレームの画質を改良するための方法であって、前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセル値に重みweightを用いて重み付けした比として、各双方向予測中間フレームの各ピクセル値を決定するステップを含む方法において、
    前記重みweightが、
    weight=F・(frame distance proportional weight)
    +(1−F)・(equal average weight)
    であり、ここで、
    Fは、0から1の範囲にある選択された混合因子であり、
    “frame distance proportional weight”は、各双方向予測中間フレームとその両側を挟む前記非双方向予測フレームとの距離に基づく重みであり、
    “equal average weight”は、前記両側を挟む非双方向予測フレームの前記対応するピクセル値を均等平均するための1/2という重みである方法。
  2. さらに、少なくとも1つのフレームの中の選択された領域に対する前記混合因子Fを最適化するステップを含む請求項1の方法。
  3. さらに、選択された範囲のフレームに対する前記混合因子Fを最適化するステップを含む請求項1の方法。
  4. さらに、少なくとも1つのフレーム内での場面特性の関数として、前記混合因子Fを最適化するステップを含む請求項1の方法。
  5. 前記混合因子Fは、前記両側を挟む非双方向予測フレームに関する双方向予測フレームの位置の関数として変化する請求項1の方法。
  6. さらに、
    (a)少なくとも2つの混合因子Fの候補を選択するステップと、
    (b)少なくとも1つの双方向予測中間フレームに対するピクセル値を決定する際に、混合因子Fの前記候補を適用し、対応するフレームの評価セットを決定するステップと、
    (c)各フレームの評価セットを符号化するステップと、
    (d)少なくとも1つの圧縮特性に関して、それぞれのかかる符号化されたフレームの評価セットを評価するステップと、
    (e)所望の圧縮特性を有する1つのかかるフレームの評価セットを選択するステップと、
    (f)最終的な混合因子Fとして、前記選択されたフレームの評価セットに対応する混合因子Fの前記候補を選択するステップとを含む請求項1の方法。
  7. 前記圧縮特性は、符号化中に生成されるビット数である請求項6の方法。
  8. 前記圧縮特性は、信号雑音比の大きさである請求項6の方法。
  9. 各フレームが、第一の非線形表現における輝度と色度の特性を有する複数のピクセルを備え、
    前記各ピクセル値を決定するステップが、
    (a)かかる複数のピクセルの前記輝度および色度のうちの少なくとも1つの特性を第二の表現に変換するステップと、
    (b)前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセルの前記輝度および色度の特性の値に前記重みweightを用いて重み付けした比として、かかる第二の表現において、各双方向予測中間フレームの各ピクセルの前記輝度および色度の特性の値を決定するステップと、
    (c)かかる複数のピクセルを前記第二の表現から前記第一の表現へ変換して戻すステップとを含む請求項1の方法。
  10. 前記第二の表現は、線形表現である請求項9の方法。
  11. 前記第二の表現は、前記第一の非線形表現と異なる非線形表現である請求項9の方法。
  12. 各フレームが複数のピクセルを備えるビデオ画像圧縮システムにおいて、連続する2つ以上の双方向予測中間フレームの画質を改良するためにコンピュータ可読な媒体上に記憶されたコンピュータプログラムであって、前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセル値に重みweightを用いて重み付けした比として、各双方向予測中間フレームの各ピクセル値を決定することをコンピュータに実行させるための命令を備えるコンピュータプログラムにおいて、
    前記重みweightが、
    weight=F・(frame distance proportional weight)
    +(1−F)・(equal average weight)
    であり、ここで、
    Fは、0から1の範囲にある選択された混合因子であり、
    “frame distance proportional weight”は、各双方向予測中間フレームとその両側を挟む前記非双方向予測フレームとの距離に基づく重みであり、
    “equal average weight”は、前記両側を挟む非双方向予測フレームの前記対応するピクセル値を均等平均するための1/2という重みであるコンピュータプログラム。
  13. さらに、少なくとも1つのフレームの中の選択された領域に対する前記混合因子Fを最適化することをコンピュータに実行させるための命令を含む請求項12のコンピュータプログラム。
  14. さらに、選択された範囲のフレームに対する前記混合因子Fを最適化することをコンピュータに実行させるための命令を含む請求項12のコンピュータプログラム。
  15. さらに、少なくとも1つのフレーム内での場面特性の関数として、前記混合因子Fを最適化することをコンピュータに実行させるための命令を含む請求項12のコンピュータプログラム。
  16. 前記混合因子Fは、前記両側を挟む非双方向予測フレームに関する双方向予測フレームの位置の関数として変化する請求項12のコンピュータプログラム。
  17. さらに、
    (a)少なくとも2つの混合因子Fの候補を選択することと、
    (b)少なくとも1つの双方向予測中間フレームに対するピクセル値を決定する際に、混合因子Fの前記候補を適用し、対応するフレームの評価セットを決定することと、
    (c)各フレームの評価セットを符号化することと、
    (d)少なくとも1つの圧縮特性に関して、それぞれのかかる符号化されたフレームの評価セットを評価することと、
    (e)所望の圧縮特性を有する1つのかかるフレームの評価セットを選択することと、
    (f)最終的な混合因子Fとして、前記選択されたフレームの評価セットに対応する混合因子Fの前記候補を選択することとをコンピュータに実行させるための命令を含む請求項12のコンピュータプログラム。
  18. 前記圧縮特性は、符号化中に生成されるビット数である請求項17のコンピュータプログラム。
  19. 前記圧縮特性は、信号雑音比の大きさである請求項17のコンピュータプログラム。
  20. 各フレームが、第一の非線形表現における輝度と色度の特性を有する複数のピクセルを備え、
    (a)かかる複数のピクセルの前記輝度および色度のうちの少なくとも1つの特性を第二の表現に変換することと、
    (b)前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセルの前記輝度および色度の特性の値に前記重みweightを用いて重み付けした比として、かかる第二の表現において、各双方向予測中間フレームの各ピクセルの前記輝度および色度の特性の値を決定することと、
    (c)かかる複数のピクセルを前記第二の表現から前記第一の表現へ変換して戻すことと、
    を含む方法によって各ピクセルの値をコンピュータに決定させるための命令を備える請求項12のコンピュータプログラム。
  21. 前記第二の表現は、線形表現である請求項20のコンピュータプログラム。
  22. 前記第二の表現は、前記第一の非線形表現と異なる非線形表現である請求項20のコンピュータプログラム。
  23. 各フレームが複数のピクセルを備えるビデオ画像圧縮システムにおいて、連続する2つ以上の双方向予測中間フレームの画質を改良するためのシステムであって、
    (a)前記連続する双方向予測中間フレームの両側を挟む、少なくとも2つの非双方向予測フレームを入力する手段と、
    (b)前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセル値に重みweightを用いて重み付けした比として、各双方向予測中間フレームの各ピクセル値を決定する手段とを含むシステムにおいて、
    前記重みweightが、
    weight=F・(frame distance proportional weight)
    +(1−F)・(equal average weight)
    であり、ここで、
    Fは、0から1の範囲にある選択された混合因子であり、
    “frame distance proportional weight”は、各双方向予測中間フレームとその両側を挟む前記非双方向予測フレームとの距離に基づく重みであり、
    “equal average weight”は、前記両側を挟む非双方向予測フレームの前記対応するピクセル値を均等平均するための1/2という重みであるシステム。
  24. さらに、少なくとも1つのフレームの中の選択された領域に対する前記混合因子Fを最適化する手段を含む請求項23のシステム。
  25. さらに、選択された範囲のフレームに対する前記混合因子Fを最適化する手段を含む請求項23のシステム。
  26. さらに、少なくとも1つのフレーム内での場面特性の関数として、前記混合因子Fを最適化する手段を含む請求項23のシステム。
  27. 前記混合因子Fは、前記両側を挟む非双方向予測フレームに関する双方向予測フレームの位置の関数として変化する請求項23のシステム。
  28. さらに、
    (a)少なくとも2つの混合因子Fの候補を選択する手段と、
    (b)少なくとも1つの双方向予測中間フレームに対するピクセル値を決定する際に、混合因子Fの前記候補を適用し、対応するフレームの評価セットを決定する手段と、
    (c)各フレームの評価セットを符号化する手段と、
    (d)少なくとも1つの圧縮特性に関して、それぞれのかかる符号化されたフレームの評価セットを評価する手段と、
    (e)所望の圧縮特性を有する1つのかかるフレームの評価セットを選択する手段と、
    (f)最終的な混合因子Fとして、前記選択されたフレームの評価セットに対応する混合因子Fの前記候補を選択する手段とを含む請求項23のシステム。
  29. 前記圧縮特性は、符号化中に生成されるビット数である請求項28のシステム。
  30. 前記圧縮特性は、信号雑音比の大きさである請求項28のシステム。
  31. 各フレームが、第一の非線形表現における輝度と色度の特性を有する複数のピクセルを備え、
    (a)かかる複数のピクセルの前記輝度および色度のうちの少なくとも1つの特性を第二の表現に変換する手段と、
    (b)前記連続する双方向予測中間フレームの両側を挟む非双方向予測フレームにおいて対応するピクセルの前記輝度および色度の特性の値に前記重みweightを用いて重み付けした比として、かかる第二の表現において、各双方向予測中間フレームの各ピクセルの前記輝度および色度の特性の値を決定する手段と、
    (c)かかる複数のピクセルを前記第二の表現から前記第一の表現へ変換して戻す手段とを含む請求項23のシステム。
  32. 前記第二の表現は、線形表現である請求項31のシステム。
  33. 前記第二の表現は、前記第一の非線形表現と異なる非線形表現である請求項31のシステム。
JP2003512817A 2001-07-11 2002-07-11 ビデオ圧縮フレームの補間 Expired - Lifetime JP4339680B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/904,203 US6816552B2 (en) 2001-07-11 2001-07-11 Interpolation of video compression frames
PCT/US2002/022063 WO2003007119A2 (en) 2001-07-11 2002-07-11 Interpolation of video compression frames

Publications (2)

Publication Number Publication Date
JP2004538691A JP2004538691A (ja) 2004-12-24
JP4339680B2 true JP4339680B2 (ja) 2009-10-07

Family

ID=25418759

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003512817A Expired - Lifetime JP4339680B2 (ja) 2001-07-11 2002-07-11 ビデオ圧縮フレームの補間

Country Status (9)

Country Link
US (1) US6816552B2 (ja)
EP (1) EP1405425A4 (ja)
JP (1) JP4339680B2 (ja)
KR (1) KR20040028921A (ja)
CN (1) CN100373791C (ja)
AU (1) AU2002316666B2 (ja)
CA (1) CA2452504C (ja)
MX (1) MXPA04000221A (ja)
WO (1) WO2003007119A2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9238375B2 (en) 2013-02-12 2016-01-19 Dover Europe Sàrl Tape drive and method of operation
US9272531B2 (en) 2013-02-13 2016-03-01 Dover Europe Sarl Tape drive and method of operation of a tape drive
US9340052B2 (en) 2011-08-10 2016-05-17 Markem-Imaje Industries Limited Motor control system

Families Citing this family (103)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US8374237B2 (en) 2001-03-02 2013-02-12 Dolby Laboratories Licensing Corporation High precision encoding and decoding of video images
JP2003003979A (ja) * 2001-06-25 2003-01-08 Toshiba Kyaria Kk 流体機械
US8111754B1 (en) 2001-07-11 2012-02-07 Dolby Laboratories Licensing Corporation Interpolation of video compression frames
US7266150B2 (en) 2001-07-11 2007-09-04 Dolby Laboratories, Inc. Interpolation of video compression frames
US20030112863A1 (en) 2001-07-12 2003-06-19 Demos Gary A. Method and system for improving compressed image chroma information
EP1827027A1 (en) * 2002-01-18 2007-08-29 Kabushiki Kaisha Toshiba Video encoding method and apparatus and video decoding method and apparatus
JP2004007379A (ja) * 2002-04-10 2004-01-08 Toshiba Corp 動画像符号化方法及び動画像復号化方法
US7003035B2 (en) 2002-01-25 2006-02-21 Microsoft Corporation Video coding methods and apparatuses
KR100508798B1 (ko) * 2002-04-09 2005-08-19 엘지전자 주식회사 쌍방향 예측 블록 예측 방법
JP2004007563A (ja) * 2002-04-19 2004-01-08 Matsushita Electric Ind Co Ltd 動画像符号化方法および動画像復号化方法
JP4130783B2 (ja) * 2002-04-23 2008-08-06 松下電器産業株式会社 動きベクトル符号化方法および動きベクトル復号化方法
US20040001546A1 (en) 2002-06-03 2004-01-01 Alexandros Tourapis Spatiotemporal prediction for bidirectionally predictive (B) pictures and motion vector prediction for multi-picture reference motion compensation
US7787539B2 (en) * 2002-07-17 2010-08-31 Broadcom Corporation Decoding and presentation time stamps for MPEG-4 advanced video coding
KR100865034B1 (ko) 2002-07-18 2008-10-23 엘지전자 주식회사 모션 벡터 예측 방법
US7154952B2 (en) 2002-07-19 2006-12-26 Microsoft Corporation Timestamp-independent motion vector prediction for predictive (P) and bidirectionally predictive (B) pictures
JP4007594B2 (ja) * 2002-09-26 2007-11-14 株式会社東芝 動画像符号化装置及び方法、動画像符号化方式変換装置及び方法
JP2004179687A (ja) * 2002-11-22 2004-06-24 Toshiba Corp 動画像符号化/復号化方法及び装置
US7506267B2 (en) * 2003-12-23 2009-03-17 Intel Corporation Compose rate reduction for displays
US7616220B2 (en) * 2003-12-23 2009-11-10 Intel Corporation Spatio-temporal generation of motion blur
JP4366277B2 (ja) * 2004-09-21 2009-11-18 キヤノン株式会社 撮像装置及びその制御方法
US8903196B2 (en) * 2005-10-05 2014-12-02 Texas Instruments Incorporated Video presentation at fractional speed factor using time domain interpolation
US8335252B2 (en) * 2006-09-07 2012-12-18 Thomson Licensing Method and apparatus for encoding groups of pictures of a video sequence, each of said groups including an intra encoded picture and more than two encoded pictures
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data
JP2008306512A (ja) * 2007-06-08 2008-12-18 Nec Corp 情報提供システム
US8254455B2 (en) 2007-06-30 2012-08-28 Microsoft Corporation Computing collocated macroblock information for direct mode macroblocks
JP5098081B2 (ja) * 2007-07-19 2012-12-12 オリンパス株式会社 画像処理方法および画像処理装置
US8194741B2 (en) 2007-10-12 2012-06-05 Broadcom Corporation Method and system for processing B pictures with missing or invalid forward reference pictures
US8749703B2 (en) * 2008-02-04 2014-06-10 Broadcom Corporation Method and system for selecting interpolation as a means of trading off judder against interpolation artifacts
WO2010014760A1 (en) * 2008-08-01 2010-02-04 Zoran Corporation Video encoder with an integrated temporal filter for denoising
CN102113326A (zh) 2008-08-04 2011-06-29 杜比实验室特许公司 重叠块差异估计和补偿体系结构
CN101729885B (zh) * 2008-10-24 2011-06-08 安凯(广州)微电子技术有限公司 一种图像像素插值方法及系统
JP5325638B2 (ja) 2008-11-26 2013-10-23 日立コンシューマエレクトロニクス株式会社 画像復号化方法
JP2010130510A (ja) * 2008-11-28 2010-06-10 Brother Ind Ltd 印刷装置及びプログラム
JP4692615B2 (ja) * 2008-11-28 2011-06-01 ブラザー工業株式会社 印刷装置及びプログラム
JP4692614B2 (ja) * 2008-11-28 2011-06-01 ブラザー工業株式会社 印刷装置及びプログラム
US8189666B2 (en) 2009-02-02 2012-05-29 Microsoft Corporation Local picture identifier and computation of co-located information
US9986175B2 (en) 2009-03-02 2018-05-29 Flir Systems, Inc. Device attachment with infrared imaging sensor
US10244190B2 (en) 2009-03-02 2019-03-26 Flir Systems, Inc. Compact multi-spectrum imaging with fusion
US9235876B2 (en) 2009-03-02 2016-01-12 Flir Systems, Inc. Row and column noise reduction in thermal images
US9473681B2 (en) 2011-06-10 2016-10-18 Flir Systems, Inc. Infrared camera system housing with metalized surface
USD765081S1 (en) 2012-05-25 2016-08-30 Flir Systems, Inc. Mobile communications device attachment with camera
US9517679B2 (en) 2009-03-02 2016-12-13 Flir Systems, Inc. Systems and methods for monitoring vehicle occupants
US9451183B2 (en) 2009-03-02 2016-09-20 Flir Systems, Inc. Time spaced infrared image enhancement
US9674458B2 (en) 2009-06-03 2017-06-06 Flir Systems, Inc. Smart surveillance camera systems and methods
US9635285B2 (en) 2009-03-02 2017-04-25 Flir Systems, Inc. Infrared imaging enhancement with fusion
US9843742B2 (en) 2009-03-02 2017-12-12 Flir Systems, Inc. Thermal image frame capture using de-aligned sensor array
US9208542B2 (en) 2009-03-02 2015-12-08 Flir Systems, Inc. Pixel-wise noise reduction in thermal images
US9948872B2 (en) 2009-03-02 2018-04-17 Flir Systems, Inc. Monitor and control systems and methods for occupant safety and energy efficiency of structures
US9756264B2 (en) 2009-03-02 2017-09-05 Flir Systems, Inc. Anomalous pixel detection
US10757308B2 (en) 2009-03-02 2020-08-25 Flir Systems, Inc. Techniques for device attachment with dual band imaging sensor
US9998697B2 (en) 2009-03-02 2018-06-12 Flir Systems, Inc. Systems and methods for monitoring vehicle occupants
EP2425397A4 (en) * 2009-04-27 2015-07-01 Blackberry Ltd CONVERSION OF MORPHOLOGICAL SHAPE DEFINITIONS SWF FOR A VECTOR GRAPHIC RENDER
US8810578B2 (en) * 2009-04-27 2014-08-19 Blackberry Limited Conversion of SWF shape definitions for vector graphics rendering
US9716843B2 (en) 2009-06-03 2017-07-25 Flir Systems, Inc. Measurement device for electrical installations and related methods
US10091439B2 (en) 2009-06-03 2018-10-02 Flir Systems, Inc. Imager with array of multiple infrared imaging modules
US9292909B2 (en) 2009-06-03 2016-03-22 Flir Systems, Inc. Selective image correction for infrared imaging devices
US9843743B2 (en) 2009-06-03 2017-12-12 Flir Systems, Inc. Infant monitoring systems and methods using thermal imaging
US9819880B2 (en) 2009-06-03 2017-11-14 Flir Systems, Inc. Systems and methods of suppressing sky regions in images
US9756262B2 (en) 2009-06-03 2017-09-05 Flir Systems, Inc. Systems and methods for monitoring power systems
JP5343739B2 (ja) 2009-07-02 2013-11-13 ブラザー工業株式会社 出力装置及びプログラム
US8995526B2 (en) 2009-07-09 2015-03-31 Qualcomm Incorporated Different weights for uni-directional prediction and bi-directional prediction in video coding
US9161057B2 (en) 2009-07-09 2015-10-13 Qualcomm Incorporated Non-zero rounding and prediction mode selection techniques in video encoding
US9848134B2 (en) 2010-04-23 2017-12-19 Flir Systems, Inc. Infrared imager with integrated metal layers
US9706138B2 (en) 2010-04-23 2017-07-11 Flir Systems, Inc. Hybrid infrared sensor array having heterogeneous infrared sensors
US9207708B2 (en) 2010-04-23 2015-12-08 Flir Systems, Inc. Abnormal clock rate detection in imaging sensor arrays
US20120173577A1 (en) * 2010-12-30 2012-07-05 Pelco Inc. Searching recorded video
TWI419570B (zh) * 2011-01-03 2013-12-11 Novatek Microelectronics Corp 多媒體裝置及其移動補償方法
WO2012115420A2 (ko) 2011-02-23 2012-08-30 엘지전자 주식회사 필터링을 이용한 화면 내 예측 방법 및 이러한 방법을 사용하는 장치
TWI519139B (zh) * 2011-04-14 2016-01-21 聯詠科技股份有限公司 資料處理方法及數位影像處理裝置
US10079982B2 (en) 2011-06-10 2018-09-18 Flir Systems, Inc. Determination of an absolute radiometric value using blocked infrared sensors
US9143703B2 (en) 2011-06-10 2015-09-22 Flir Systems, Inc. Infrared camera calibration techniques
CA2838992C (en) 2011-06-10 2018-05-01 Flir Systems, Inc. Non-uniformity correction techniques for infrared imaging devices
US10389953B2 (en) 2011-06-10 2019-08-20 Flir Systems, Inc. Infrared imaging device having a shutter
US10169666B2 (en) 2011-06-10 2019-01-01 Flir Systems, Inc. Image-assisted remote control vehicle systems and methods
US10051210B2 (en) 2011-06-10 2018-08-14 Flir Systems, Inc. Infrared detector array with selectable pixel binning systems and methods
US9706137B2 (en) 2011-06-10 2017-07-11 Flir Systems, Inc. Electrical cabinet infrared monitor
US9235023B2 (en) 2011-06-10 2016-01-12 Flir Systems, Inc. Variable lens sleeve spacer
EP2719166B1 (en) 2011-06-10 2018-03-28 Flir Systems, Inc. Line based image processing and flexible memory system
US9961277B2 (en) 2011-06-10 2018-05-01 Flir Systems, Inc. Infrared focal plane array heat spreaders
US9058653B1 (en) 2011-06-10 2015-06-16 Flir Systems, Inc. Alignment of visible light sources based on thermal images
CN103748867B (zh) 2011-06-10 2019-01-18 菲力尔系统公司 低功耗和小形状因子红外成像
US9509924B2 (en) 2011-06-10 2016-11-29 Flir Systems, Inc. Wearable apparatus with integrated infrared imaging module
US9900526B2 (en) 2011-06-10 2018-02-20 Flir Systems, Inc. Techniques to compensate for calibration drifts in infrared imaging devices
US10841508B2 (en) 2011-06-10 2020-11-17 Flir Systems, Inc. Electrical cabinet infrared monitor systems and methods
EP2750384B1 (en) 2011-09-21 2020-07-22 LG Electronics Inc. Intra prediction method and an apparatus for decoding an image
US9811884B2 (en) 2012-07-16 2017-11-07 Flir Systems, Inc. Methods and systems for suppressing atmospheric turbulence in images
US9628790B1 (en) 2013-01-03 2017-04-18 Google Inc. Adaptive composite intra prediction for image and video compression
US20140245350A1 (en) * 2013-02-27 2014-08-28 Blendagram, Inc. System for and method of processing a video clip to identify an occluding object
US9973692B2 (en) 2013-10-03 2018-05-15 Flir Systems, Inc. Situational awareness by compressed display of panoramic views
US9609343B1 (en) 2013-12-20 2017-03-28 Google Inc. Video coding using compound prediction
US11297264B2 (en) 2014-01-05 2022-04-05 Teledyne Fur, Llc Device attachment with dual band imaging sensor
CN105765973B (zh) * 2015-03-31 2018-06-08 深圳市大疆创新科技有限公司 一种图像编码的方法及编码装置
WO2017062885A1 (en) * 2015-10-08 2017-04-13 Sharp Laboratories Of America, Inc. Systems and methods for reducing artifacts in temporal scalable layers of video
US10805627B2 (en) 2015-10-15 2020-10-13 Cisco Technology, Inc. Low-complexity method for generating synthetic reference frames in video coding
US10136155B2 (en) 2016-07-27 2018-11-20 Cisco Technology, Inc. Motion compensation using a patchwork motion field
EP3568978A1 (en) 2017-01-13 2019-11-20 Google LLC Compound prediction for video coding
US20180332298A1 (en) * 2017-05-10 2018-11-15 Futurewei Technologies, Inc. Bidirectional Prediction In Video Compression
US10880573B2 (en) 2017-08-15 2020-12-29 Google Llc Dynamic motion vector referencing for video coding
US10284869B2 (en) 2017-09-28 2019-05-07 Google Llc Constrained motion field estimation for hardware efficiency
WO2020031782A1 (ja) * 2018-08-10 2020-02-13 ソニー株式会社 受信装置、受信方法、送信装置および送信方法
CN112215237B (zh) * 2020-11-06 2023-10-13 泰康保险集团股份有限公司 图像处理方法及装置、电子设备和计算机可读存储介质
US20220405987A1 (en) * 2021-06-18 2022-12-22 Nvidia Corporation Pixel blending for neural network-based image generation

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5151784A (en) * 1991-04-30 1992-09-29 At&T Bell Laboratories Multiple frame motion estimation
US5198901A (en) * 1991-09-23 1993-03-30 Matsushita Electric Corporation Of America Derivation and use of motion vectors in a differential pulse code modulation system
JP3545000B2 (ja) 1992-11-02 2004-07-21 ソニー株式会社 画像信号符号化装置、画像信号復号化装置
JPH06350995A (ja) * 1993-06-10 1994-12-22 Casio Comput Co Ltd 動画像処理方法
US5438374A (en) * 1993-12-10 1995-08-01 At&T Corp. System and method for filtering video signals
US5442407A (en) 1994-03-22 1995-08-15 Matsushita Electric Corporation Of America Video signal noise reduction system using time-varying filter coefficients
JPH09182083A (ja) 1995-12-27 1997-07-11 Matsushita Electric Ind Co Ltd ビデオ画像符号化方法及び復号化方法とその装置
US5852565A (en) * 1996-01-30 1998-12-22 Demografx Temporal and resolution layering in advanced television
US6957350B1 (en) * 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5825680A (en) * 1996-06-21 1998-10-20 Digital Equipment Corporation Method and apparatus for performing fast division
US6172768B1 (en) * 1998-02-05 2001-01-09 Canon Kabushiki Kaisha Halftoning with changeable error diffusion weights
JPH11239351A (ja) * 1998-02-23 1999-08-31 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、復号方法、符号化器、復号器、動画像符号化プログラムおよび動画像復号プログラムを記録した記録媒体
US6215824B1 (en) 1998-05-01 2001-04-10 Boom Corporation Transcoding method for digital video networking
US6629104B1 (en) * 2000-11-22 2003-09-30 Eastman Kodak Company Method for adding personalized metadata to a collection of digital images

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9340052B2 (en) 2011-08-10 2016-05-17 Markem-Imaje Industries Limited Motor control system
US9975366B2 (en) 2011-08-10 2018-05-22 Markem-Imaje Industries Limited Motor control system
US9238375B2 (en) 2013-02-12 2016-01-19 Dover Europe Sàrl Tape drive and method of operation
US9272531B2 (en) 2013-02-13 2016-03-01 Dover Europe Sarl Tape drive and method of operation of a tape drive

Also Published As

Publication number Publication date
US6816552B2 (en) 2004-11-09
WO2003007119A2 (en) 2003-01-23
JP2004538691A (ja) 2004-12-24
CN1526204A (zh) 2004-09-01
KR20040028921A (ko) 2004-04-03
CA2452504A1 (en) 2003-01-23
MXPA04000221A (es) 2005-03-07
CA2452504C (en) 2009-12-08
AU2002316666B2 (en) 2006-11-02
EP1405425A2 (en) 2004-04-07
EP1405425A4 (en) 2006-02-08
CN100373791C (zh) 2008-03-05
US20030112871A1 (en) 2003-06-19
WO2003007119A3 (en) 2003-04-10

Similar Documents

Publication Publication Date Title
JP4339680B2 (ja) ビデオ圧縮フレームの補間
US20210021864A1 (en) Interpolation of video compression frames
AU2002316666A1 (en) Interpolation of video compression frames
US8111754B1 (en) Interpolation of video compression frames
JP2005516433A (ja) ビデオ圧縮システムのための動き推定

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20080408

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20080415

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080428

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090217

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090514

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090609

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090702

R150 Certificate of patent or registration of utility model

Ref document number: 4339680

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120710

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130710

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term