JP4402219B2 - ビデオ・データ中のフラッシュ・フレームの検出および符号化 - Google Patents
ビデオ・データ中のフラッシュ・フレームの検出および符号化 Download PDFInfo
- Publication number
- JP4402219B2 JP4402219B2 JP27260499A JP27260499A JP4402219B2 JP 4402219 B2 JP4402219 B2 JP 4402219B2 JP 27260499 A JP27260499 A JP 27260499A JP 27260499 A JP27260499 A JP 27260499A JP 4402219 B2 JP4402219 B2 JP 4402219B2
- Authority
- JP
- Japan
- Prior art keywords
- frame
- picture
- flash
- flash sequence
- frames
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
Description
【発明の属する技術分野】
本発明は、画像処理に関し、特に、ビデオ圧縮処理に関する。
【0002】
【従来の技術】
ビデオ圧縮処理における第一の目標は、得られる圧縮ビデオ・ビットストリームの再生の間、許容できるレベルの画質を依然として維持しつつ、ビデオ画像のシーケンスを表示するために使用されるビット数を減らすことである。多くのビデオ圧縮利用における別の目標は、例えば伝送帯域幅および/または再生処理制約を満たすために、比較的均一なビットレートを維持することである。ビデオ圧縮処理は、ビットレートと再生品質との間でトレードオフを含んでいることが多い。このトレードオフは、通常、圧縮ビデオ・ビットストリームに符合化された各画像の再生品質を選択的に減少させることにより原ビデオ・シーケンス中の画像を符合化するために使用されるビットの平均数を削減することを含んでいる。
【0003】
MPEG(Moving Picture Experts Group)標準に基づくような多くのビデオ圧縮システムは、他の以前に符号化されたピクチャから予測を行うことにより圧縮能力の多くを得ている。この明細書では用語「フレーム」が使用されるが、当業者であれば、この明細書の教示がビデオ・ピクチャ(ビデオ・フレームおよびビデオ・フィールドの双方を含む用語)に一般的にあてはまることが理解できるであろう。
【0004】
MPEGコーダは、三つの主要なタイプのフレームI、PおよびBを有している。Iフレームは、他のどのフレームにも関係なく独立に符号化される。Pフレームは、以前に符号化されたPまたはIフレームから得られる参照フレームと自身との間の動き補償された差分として符号化される。IおよびPフレームは、他のフレームを符号化するための参照フレームを生成するために使用できることから、アンカー・フレーム(anchor frame)と呼ばれる。Bフレーム中のマクロブロックは、(1)前のアンカー・フレーム(すなわち順方向予測)、(2)次のアンカー・フレーム(すなわち逆方向予測)、あるいは(3)前および次のアンカー・フレームの平均(すなわち、内挿的予測または双方向予測)のいずれかと自身との間の差分として符号化される。Bフレームは、他のフレームを予測するために使用されることのない非アンカー・フレームである。このように、Bフレーム中の誤差は、他のフレームに伝搬せず、持続時間にわたって一つのピクチャにある。人間の視覚システムは、非常に短い持続時間の誤差に対してはあまり不快感を覚えない点に注意する。
【0005】
MPEG標準は、特定の一連のフレームタイプに対して制約を設けていないが、多くのコーダは、I、PおよびBフレームの繰返しパターンを単に用いている。Bフレームは、前のフレームからだけでなく未来のフレームからも予測することができるので、Bフレームは、それらを囲むアンカー・フレームの後、復号器に送信しなければならない。この「順序の乱れた(out-of-order)」復号化を効率良くするため、これらのフレームは、対応する圧縮ビデオ・ビットストリームに時間順序を外れて符合化される。
【0006】
図1は、ビデオ・フレームの一つのストリームを再順序づけして圧縮ビデオ・ビットストリームに符合化する従来のビデオ圧縮システム100のブロック図を示している。システム100は、連続したアンカー・フレームの各ペアの間に二つのBフレームを有する繰返しフレームパターン(例えば15フレームGOP(group of pictures、ピクチャ・グループ)用のIBBPBBPBBPBBPBBPBB)に基づくビデオ符号化方式を実施する。図2の表Iは、フレームの時間順序(フレームが入力ビデオストリームに現れる順序)と、それらのフレームがシステム100によって圧縮ビデオ・ビットストリームに符号化される順序との関係を示している。表Iは、ビットストリームを生成するためにビデオ・フレームの再順序づけに使用されるスイッチ104のタップ位置も示している。
【0007】
フレームは、フレーム0から開始し、次にフレーム1というような時間順序でシステム100のビデオ入力に提供される。新しいフレームの各々がビデオ入力に与えられると、フレーム遅延バッファ102cに格納されたフレームがタップT0で利用可能にされ、新しいフレームはタップT3で利用可能にされる。2位置スイッチ104に関して選択された位置に応じて、符号器106は、タップT0のフレームかタップT3のフレームを符号化する。符号器106が選択されたフレームを符号化すると、フレーム遅延バッファ102bに格納されたフレームがフレーム遅延バッファ102cに移され、フレーム遅延バッファ102aに格納されたフレームがフレーム遅延バッファ102bに移され、新しいフレームはフレーム遅延バッファ102aに格納される。
【0008】
ビデオストリームの開始時には、フレーム0がビデオ入力に提供され、したがってタップT3に提供されると、スイッチ104がタップT3に配置され、符号器106がフレーム0をIフレーム(すなわち、表I中のI0)として符合化できるようになる。この後、全てのフレーム遅延バッファ102が満杯になるまで符号器106の処理が一時的に中断され、フレーム0がバッファ102cに格納されてタップT0で提供され、フレーム1がバッファ102bに格納され、フレーム2がバッファ102aに格納され、フレーム3がビデオ入力およびタップT3で提供されるようになっている。このとき、フレーム3をPフレーム(すなわち、表IのP3)として符号化できるように、スイッチ104は再びタップT3に配置される。
【0009】
次の処理サイクルでは、フレーム1がバッファ102cに格納されてタップT0で提供され、フレーム2がバッファ102bに格納され、フレーム3がバッファ102aに格納され、フレーム4がビデオ入力およびタップT3で提供される。このとき、フレーム1をBフレームとして符号化できるように、スイッチ104はタップT0に配置される(すなわち、表I中のB1)。
【0010】
次の処理サイクルでは、フレーム2がバッファ102cに格納されてタップT0で提供され、フレーム3がバッファ102bに格納され、フレーム4がバッファ102aに格納され、フレーム5がビデオ入力およびタップT3で提供される。このとき、フレーム2をBフレーム(すなわち、表I中のB2)として符号化できるように、スイッチ104は再びタップT0に配置される。
【0011】
次の処理サイクルでは、フレーム3がバッファ102cに格納されてタップT0で提供され、フレーム4がバッファ102bに格納され、フレーム5がバッファ102aに格納され、フレーム6がビデオ入力およびタップT3で提供される。このとき、フレーム6をPフレーム(すなわち、表IのP6)として符号化できるように、スイッチ104はタップT3に再配置される。
【0012】
表Iに示されるように、この処理は、GOPパターン(IBBPBBPBBPBBPBB)に従って、Bフレームを符号化するためにタップT0に配置され、アンカー(IまたはP)フレームを符号化するためにタップT3に配置されるスイッチ104を用いて、ビデオストリーム中の各15フレームGOP中の各フレームに対して続けられる。
【0013】
一部のビデオストリームは、フラッシュ・フレームを含んでいる。本明細書の目的のために、フラッシュ・フレームのシーケンスは、そのフラッシュ・シーケンスの直前のフレームとそのフラッシュ・シーケンスの直後のフレームの双方に比較的弱く相関した一つ以上の連続フレームからなるセットとして定義される。ここで、フラッシュ・シーケンスの直前及び直後のフレームは、相互に比較的強く相関している。フラッシュ・シーケンスの一般的な例は、イベント(例えばバスケットボール・ゲーム)で静止画カメラマンによって作り出される現象である。一つのビデオストリームにおいて、カメラマンのフラッシュは、通常、ほとんど白い、あるいは少なくとも前後のフレームよりも極めて高い輝度の単一フレームを作り出す。このようなフラッシュ・フレーム(すなわち、1フレーム・フラッシュ・シーケンス)は、時間的に近いフレームと弱く相関することになる。
【0014】
一部の符号器は、相互にあまり相関のない一対の連続フレームを探すことによって、「シーン・カット」を検出することができる。ここで、その相関の度合いは、歪み測度(例えば、動き補償フレーム間画素差の平均絶対偏差(MAD))を用いて特徴づけることができる。これに応じて、このような符号器は、次の予定されたアンカー・フレーム時刻にIフレームを挿入することがある(すなわち、場合によって、正規に予定されたPフレームをIフレームに置き換える)。このような符号器は、フラッシュ・シーケンスを誤ってシーン・カットと識別することになる。これは、フラッシュ・シーケンス中の第一フレームとその直前のフレームとの間の大きな歪みに基づいている。このようなシーン・カットは、個々の孤立したフラッシュ・フレームに関して検出されるとともに、マルチフレーム・フラッシュ・シーケンスに関しても検出される。
【0015】
単一のフラッシュ・フレーム(例えばカメラマンのフラッシュ)を引き起こすイベントが、平均では、繰返しGOPパターンのタイミングに対してランダムに発生すると仮定すると、フラッシュ・フレームは、表Iの15フレームGOPパターンに対して3回に1回の割合でアンカー(IまたはP)フレーム1に当たることになる。これが起こると、符号器は、フラッシュ・フレームをシーン・カットとして識別し、フラッシュ・フレームをIフレームとして符号化する。符号器がそのシーン・カット用の処理を検出及び調整しないとしても、平均して全フラッシュ・フレームの1/3は、依然としてアンカー・フレームとして符号化される。
【0016】
【発明が解決しようとする課題】
しかしながら、フラッシュ・フレームをIフレームとして符号化することは非常に悪い考え方である。というのも、その場合、フラッシュ・フレームは、GOP中のフレームの残りを予測するアンカー・フレームとなるが、このフレームは、GOP中の他のフレームと弱く相関することになり、全GOP(通常は1/2秒)が劣悪に符号化される(すなわち、限られたビットレート必要条件を満たすために高い量子化レベルが必要となる)からである。
【0017】
例えば、表Iに示されるシーケンスにおいて、フレーム6が孤立フラッシュ・フレームであると仮定する。GOPパターンによると、フレーム6は、Pフレーム(すなわちP6)として符号化するためにフレーム3から予測されることになっている。フレーム6はフラッシュ・フレームなので、このフレームは、おそらくフレーム3と弱く相関している。その結果、P6を良好にするためにはあまりに多くのビットが必要になり、さもなければP6は劣悪に符号化される(すなわち、大きな量子化誤差を生じる)ことになる。さらにまた、フレーム6は、フレーム9をPフレームとして符合化するための予測フレームである。ここでも、フラッシュ・フレームであるフレーム6がおそらくはフレーム9と弱く相関しているので、フレーム9は、その計上されたビット割当てを超過するか、あるいは劣悪に符号化される。フレーム9が劣悪に符号化されると、それぞれBフレームB7およびB8として符合化されることになっているフレーム7および8は、関連付けされていないフラッシュ・フレーム(P6)または劣悪に符号化されたフレーム(P9)から予測されるという悪い選択肢を有することになる。いずれにせよ、B7およびB8もおそらくは劣悪に符号化されることになる。
【0018】
次に、フレーム9はフレーム12の予測子であるので、P9からの誤差は、フレーム12に伝搬する。十分なビットを費やせば、これらの誤差の一部を低減することはできる。さらにまた、BフレームB10およびB11は、画質か効率のいずれかにおいて苦しむことになる。最終的な影響は、劣悪に相関した単一のフラッシュ・フレームによって多くのフレームが劣悪に符号化されるようになり、これによって、膨大な数のフレームについてビデオ再生の品質に悪影響を及ぼしうることである。
【0019】
【課題を解決するための手段】
本発明は、ビデオストリーム中の一以上のフラッシュ・フレームからなるシーケンスを検出および符号化する方式に関する。本発明によれば、一つ以上の連続フラッシュ・フレームからなるシーケンスの発生が、短いフレーム・シーケンスを探すことによってビデオストリーム中で検出される。この短いシーケンスでは、そのシーケンス中の一つ以上のフレームがそのシーケンスの直前及び直後のフレームと極めて弱く相関しているが、そのシーケンスの直前及び直後のフレームは相互に極めて強く相関している。このとき、コーダは、効率良くフラッシュ・シーケンスを符号化するために適切な動作をとる。例えば、各フラッシュ・フレーム・シーケンスが一つのフレームしか含まないという一つの実現可能な態様では、孤立フラッシュ・フレームがI、PおよびBフレームからなる繰返しGOPパターンのどこに入るようになっていようとも、その孤立フラッシュ・フレームがBフレームとして符号化される。この場合、Bフレームは他のフレーム用の予測子としては使用されないので、フラッシュ・フレームを符合化する際に発生する誤差はフラッシュ・フレームのみに限られる。他の態様では、他の符号化オプションも実現可能である。
【0020】
ある態様では、本発明は、ビデオストリームを処理する方法に基づいている。フラッシュ・シーケンスは、ビデオストリーム中で検出される。このフラッシュ・シーケンスは、一つ以上の連続ピクチャのセットである。ここで、(1)フラッシュ・シーケンスの前のピクチャは、フラッシュ・シーケンスと弱く相関し、(2)フラッシュ・シーケンスの後のピクチャは、フラッシュ・シーケンスと弱く相関し、(3)フラッシュ・シーケンスの前のピクチャは、フラッシュ・シーケンスの後のピクチャと強く相関している。ビデオ処理は、ビデオストリームに対応する圧縮ビデオ・ビットストリームの一部分を生成するために、フラッシュ・シーケンスの検出に基づいて調整される。
【0021】
別の態様では、本発明はビデオストリームを処理するシステムである。このシステムは、(a)直列に接続された複数の遅延バッファと、(b)前記遅延バッファの任意の一つの出力からピクチャ・データを受信するように配置される構成のマルチタップ・スイッチと、(c)ピクチャ・データを受信して、ビデオストリームに対応する圧縮ビデオ・ビットストリームに符号化するように前記スイッチに接続されたビデオ符号器と、(d)ビデオストリーム中のフラッシュ・シーケンスを検出するように構成されたフラッシュ検出器と、を備えている。フラッシュ・シーケンスは、一つ以上の連続したピクチャからなるセットである。ここで、(1)フラッシュ・シーケンスの前のピクチャは、フラッシュ・シーケンスと弱く相関し、(2)フラッシュ・シーケンスの後のピクチャは、フラッシュ・シーケンスと弱く相関し、(3)フラッシュ・シーケンスの前のピクチャは、フラッシュ・シーケンスの後のピクチャに強く相関している。このビデオ符号器は、圧縮ビデオ・ビットストリームの一部分を生成するために、フラッシュ検出器によるフラッシュ・シーケンスの検出に基づいてビデオ処理を調整する。
【0022】
本発明の他の態様、特徴および利点は、以下の詳細な説明、特許請求の範囲および添付の図面から十分に明らかになる。
【0023】
【発明の実施の形態】
ビデオストリーム中のフラッシュ・フレームを取り扱う実現可能な方針には、様々なものがある。シングルフレーム・フラッシュ・シーケンスに関して、一つの方針は、全ての孤立フラッシュ・フレームが必ずBフレームとして符号化されるようにすることである。Bフレームは表示された後、デコーダによって廃棄され、他のフレームに関する予測を導くためには使用されないので、B符号化フラッシュ・フレーム中の誤差は、そのフレーム自身にしか現れず、伝搬することはない。さらに、単一のフラッシュ・フレームはほぼ完全に白く、フラッシュの効果しか与えないことから、このフレームは、大きな忠実度で符号化する必要はない。これは特に、このフレームが他のフレームを予測するために使用されないことに起因する。たとえフラッシュ・フレームが通常GOPパターンのもとでBフレームとして符号化されるようにすでに予定されていたとしても、フラッシュ・フレームを符号化するために使用する必要があるのは極めて少数のビットだけであり、その他のビットは他の周辺フレームの品質改善に使用するようにすることができる可能性がある。
【0024】
ある方針によれば、フラッシュ・フレームが通常GOPパターンのもとでPフレームとして符号化される予定の場合、そのフレームは、代わりにBフレームとして符号化される。その直後のフレーム(これは、通常GOPパターンのもとではBフレームとして符号化されていたであろうフレームである)は、代わりにPフレームとして符号化され、そのフラッシュ・フレームを含む周辺Bフレームを符号化するためのアンカー・フレームとして使用される。例えば、表Iに示されるビデオ・シーケンス中のフレーム6がフラッシュ・フレームである場合、このフレームは、Pフレームとして符号化される代わりにBフレーム(すなわちB6)として符号化され、フレーム7は、通常GOPパターンのもとであればBフレームとして符号化されるところを、Pフレーム(すなわちP7)として符号化される。P7は、フレーム4、5および6を符号化するためのアンカー・フレームであるので、このフレームは、ビットストリームにおいてフレーム4、5および6の前に符号化されなければならない。
【0025】
この方針のある実施態様では、フラッシュ・フレームが発生するGOPを1フレーム延長することができる(例えば、前の例のフレーム10および13は、通常GOPパターンにおけるフレーム9および12の代わりにPフレームとして符号化され、結果的に16フレームGOPが得られる)。
【0026】
別の実施態様では、GOPにおける後続の処理は、GOPの全体的なサイズが増えないようにすることができる(例えば、GOP内のアンカー・フレームのより後のペア間におけるBフレームの数を減少させることにより)。前の例を続けると、フレーム7をPフレームとしての符号化し、フレーム6をBフレームとして符号化した後、フレーム9はPフレームとして符号化され、その後、フレーム8がBフレームとして符号化されるので、ただ一つのBフレーム(B8)だけが二つのPフレーム(P7およびP9)に基づいて符号化される。それ以降は通常GOPパターンが適用され、GOPの元の15フレームサイズが維持される。この実施態様は、その長さを変えることなくGOP内のピクチャ・タイプを再配置するだけであるという点で、前の拡張GOP実施態様を上回る利点を有している。このため、レート制御システムによって決定される全体的なGOPビット割当てを変更する必要はない。
【0027】
どちらの実施態様でも、フラッシュ・フレームが通常GOPパターンのもとでBフレームとして符号化されるようにすでに予定されていた場合、このフレームはBフレームとして維持されるが、すでに示唆したように、そのビット割当てを削減できる可能性がある。
【0028】
フラッシュ・フレームが通常GOPパターンのもとでIフレームとして符号化されるように予定されていた場合、多数の実現可能な実施態様が考えられる。フラッシュ・フレームは、前のGOPを1フレーム延長しつつBフレームとして符号化することができる。ある実施態様では、次のGOPは、1フレームだけ遅延させられるが、GOPパターンは通常に戻る。別の実施態様では、影響を受ける二つのGOPが二つの通常GOPと同じフレーム数をともに有するようにするため、GOPパターンから1フレームを必然的に落とすように次のGOPにおける処理が調整される。その第二のGOPの後、後続のGOPに対しては、処理は通常GOPパターンに戻る。
【0029】
実現可能な別の手法は、元々Iフレームとして予定されていたフラッシュ・フレームを1フレームGOPの孤立Iフレームとして符号化し、その後、すぐ次のフレームを、通常GOPか1フレーム削減されたGOPのIフレームとして符号化する。これらの実施態様は、全てのフラッシュ・フレームがBフレームとして符号化される実施態様よりも、ビット割当ての観点からは望ましくない可能性がある。
【0030】
実現可能な別の方針は、孤立フラッシュ・フレームを圧縮ビデオ・ビットストリームから省略することによって孤立フラッシュ・フレームを完全にスキップする。さらに別の方針は、フラッシュ・フレーム・データの代わりに他のデータを用いる。これは、様々な方法で実施することができる。例えば、フラッシュ・フレームは、完全に白いBフレームとして符号化してもよい。この他に、復号器が二つの対応するアンカー・フレーム間の平均としてフラッシュ・フレームを復号化するように、フラッシュ・フレームを補正データなしで双方向予測Bフレームとして符号化してもよい。別の実施態様では、フラッシュ・フレームを最も近いアンカー・フレームと同一になるように指定してもよい。さらに別の実施態様では、フラッシュ・フレーム・データを、フラッシュ・フレームの前後のフレーム間の補間に対応するビデオ・データに置き換えてもよい。この補間には、動きベクトル補間および画素レベル補間が含まれていてもよい。
【0031】
マルチフレーム・フラッシュ・シーケンスに関しては、フラッシュ・シーケンス中の第一フレームがIフレームとして符号化され、そのシーケンス中の残りのフラッシュ・フレームが最終的にその第一Iフレームに基づいてBフレーム、場合によってはPフレームとして予測される固有のGOPパターンを有する独自のGOPとして各フラッシュ・シーケンスを符合化するようにビデオ圧縮処理を調整することができる。この後、フラッシュ・シーケンスの直後のフレームは、次のGOPの初めにIフレームとして符号化して、通常GOPパターンへ戻すことができる。
【0032】
マルチフレーム・フラッシュ・シーケンスに対する別の方針は、フラッシュ・シーケンスがどんなに長くても全てのフラッシュ・フレームをBフレームとして符号化する。もちろん、フラッシュ・シーケンスを比較的短いシーンから区別するために、フラッシュ・シーケンスの許容サイズに制限を付ける必要がある。その実施方法によっては、許容フラッシュ・シーケンスを、シングルフレームの孤立フラッシュ・フレームの場合に限定することも可能である。
【0033】
図3は、本発明のある実施形態に従って、ビデオ・フレームのストリームを再順序づけし、圧縮ビデオ・ビットストリームに符合化するビデオ圧縮システム300のブロック図を示している。システム300は、五つのフレーム遅延バッファ302、5位置スイッチ304、ビデオ符号器306、およびフラッシュ・フレーム検出器308を備えている。システム300は、システム100と同じ15フレームGOPパターン(すなわち、IBBPBBPBBPBBPBB)で動作するように設計されている。しかしながら、システム300は、ビデオストリーム中の孤立フラッシュ・フレーム(すなわち、1フレーム・フラッシュ・シーケンス)の存在を検出し、全てのフラッシュ・フレームがBフレームとして符号化されることを指示する方針に従ってビデオ圧縮処理を調整するように設計されている。
【0034】
図4の表IIは、フレームの時間順序(フレームが入力ビデオストリームに現れる順序)とフラッシュ・フレームが検出されないときにシステム300によってこれらのフレームが圧縮ビデオ・ビットストリームに符号化される順序との関係を示している。表IIは、ビットストリームを生成するためにビデオ・フレームを再順序づけするために使用されるスイッチ304のタップ位置も示している。フレームは、フレーム0から開始し、次にフレーム1、といった時間順序でシステム300のビデオ入力に提供される。新しいフレームの各々がビデオ入力に提供されるに伴い、フレーム遅延バッファ302eに格納されたフレームがタップT0で利用可能にされ、フレーム遅延バッファ302dに格納されたフレームはタップT1で利用可能にされ、フレーム遅延バッファ302cに格納されたフレームはタップT2で利用可能にされ、フレーム遅延バッファ302bに格納されたフレームはタップT3で利用可能にされ、フレーム遅延バッファ302aに格納されたフレームはタップT4で利用可能にされる。
【0035】
5位置スイッチ304に対して選択される位置に応じて、符号器306は、対応するタップにおいて利用可能なフレームを符号化する。符号器306が選択されたフレームを符号化するに伴い、バッファ302dに格納されたフレームはバッファ302eに移され、バッファ302cに格納されたフレームはバッファ302dに移され、バッファ302bに格納されたフレームはバッファ302cに移され、バッファ302aに格納されたフレームはバッファ302bに移され、新しいフレームは302aバッファに格納される。
【0036】
ビデオストリームの開始時、処理は短い遅延の後に開始する。図6は、フレーム2がビデオ圧縮システム300へのビデオ入力に提供されるときのシステム300の状態を示している。ここで、フレーム0はバッファ302bに格納され、タップT3で提供され、フレーム1はバッファ302aに格納され、タップT4で提供される。このとき、スイッチ304は、符号器306がフレーム0をIフレーム(すなわち、表II中のI0)として符合化できるようにするためにタップT3に配置されている。
【0037】
この後、全てのバッファ302が満杯になるまで、符号器306の処理は一時的に中断させられる。図7は、フレーム5がビデオ圧縮システム300へのビデオ入力に提供されるときのシステム300の状態を示している。ここで、フレーム0はバッファ302eに格納され、タップT0で提供され、フレーム1はバッファ302dに格納され、タップT1で提供される。フレーム2はバッファ302cに格納されてタップT2で提供され、フレーム3はバッファ302bに格納されてタップT3で提供され、フレーム4はバッファ302aに格納されてタップT4で提供される。このとき、フレーム3をPフレーム(すなわち、表IIのP3)として符号化できるように、スイッチ304は再びタップT3に配置される。
【0038】
図8は、フレーム6がビデオ圧縮システム300へのビデオ入力に提供される次の処理サイクルにおけるシステム300の状態を示している。ここで、フレーム1はバッファ302eに格納されてタップT0で提供され、フレーム2はバッファ302dに格納されてタップT1で提供される。フレーム3はバッファ302cに格納されてタップT2で提供され、フレーム4はバッファ302bに格納されてタップT3で提供され、フレーム5はバッファ302aに格納されてタップT4で提供される。このとき、フレーム1をBフレーム(すなわち、表II中のB1)として符号化できるように、スイッチ304はタップT0に配置される。
【0039】
図9は、フレーム7がビデオ圧縮システム300へのビデオ入力に提供される次の処理サイクルにおけるシステム300の状態を示している。ここで、フレーム2はバッファ302eに格納されてタップT0で提供され、フレーム3はバッファ302dに格納されてタップT1で提供される。フレーム4はバッファ302cに格納されてタップT2で提供され、フレーム5はバッファ302bに格納されてタップT3で提供され、フレーム6はバッファ302aに格納されてタップT4で提供される。このとき、フレーム2をBフレーム(すなわち、表II中のB1)として符号化できるように、スイッチ304は再びタップT0に配置される。
【0040】
図10は、フレーム8がビデオ圧縮システム300へのビデオ入力に提供される次の処理サイクルにおけるシステム300の状態を示している。ここで、フレーム3はバッファ302eに格納されてタップT0で提供され、フレーム4はバッファ302dに格納されてタップT1で提供される。フレーム5はバッファ302cに格納されてタップT2で提供され、フレーム6はバッファ302bに格納されてタップT3で提供され、フレーム7はバッファ302aに格納されてタップT4で提供される。このとき、フレーム6をPフレーム(すなわち、表II中のP6)として符号化できるように、スイッチ304はタップT3に再配置される。
【0041】
この処理は、Bフレームを符号化するためにタップT0に配置され、アンカー・フレームを符号化するためにタップT3に配置される(これは、表IIに示されている)スイッチ304を用いて、ビデオストリーム中の各15フレームGOP内の各フレームに対して続けられる。表IIは、表Iと同一であることに注意してほしい。これは、システム300がビデオストリーム中にフラッシュ・フレームを検出しない場合、本発明の図3のビデオ圧縮システム300の処理が図1の従来技術ビデオ圧縮システム100の処理と同じGOPパターンを作り出すという望ましい結果を示している。
【0042】
新しいフレームの各々(図3のフレームA)がシステム300へのビデオ入力に提供されるのに伴って、フラッシュ・フレーム検出器308は、ビデオストリーム中の新しいフレームAおよび直前の二つのフレーム(すなわち、バッファ302aに格納されたフレームFおよびバッファ302bに格納されたフレームB)を分析し、フレームFがフラッシュ・フレームであるか否かを判断する。(i)フレームFが十分にフレームAと相関しておらず、(ii)フレームFが十分にフレームBと相関しておらず、(iii)フレームAが強くフレームBと相関している場合、検出器308は、フレームFがフラッシュ・フレームであると判断する。一方、上記三つの条件の一つ以上が満たされない場合、検出器308は、フレームFがフラッシュ・フレームでないと判断する。第三の条件(すなわち、フレームAとBの比較)は、誤ってシーン・カットをフラッシュ・フレームとして特徴づけることを避けるために使用される。
【0043】
二つのフレームの相関の特徴づけは、特定の実施態様に応じて、様々な方法で実現することができる。例えば、動き推定を用いてフレーム間歪み(例えば、二つのフレーム間の平均絶対偏差(MAD))の測度を生成することができ、この測度を適切なスレッショルドレベルと比較して、二つのフレームが強く相関しているか、あるいは十分に相関していないかを判断することができる。フレームAおよびBが相互に強く相関しているか否か(すなわち第三の条件)を判断するために使用されるスレッショルドレベルは、フレームAとFやフレームFとBが相互に十分に相関していないか否か(最初の二つの条件)を判断するために使用されるスレッショルドレベルとは異なる場合があることに注意すべきである。
【0044】
フラッシュ・フレーム検出器308は、特定のフレームFがフラッシュ・フレームであると判断すると、適切な制御信号をスイッチ304および符号器306に送信し、これに応じて次のビデオ処理サイクルから開始するこれらの機器の処理を調整する。図5の表IIIは、ビデオストリーム中のフレーム6がフラッシュ・フレームであると検出器308が判断した場合において、フレームの時間順序(これらのフレームが入力ビデオストリームに現れる順序)とこれらのフレームがシステム300によって圧縮ビデオ・ビットストリームに符号化される順序との関係を本発明のある実現可能な実施態様に従って示している。表IIIは、ビットストリームを生成するためにビデオ・フレームを再順序づけするために使用されるスイッチ304のタップ位置も示している。表IIIに示されるように、システム300の処理の結果は、ビデオストリームの最初の三つのフレーム(フレーム0−2)に関しては、表IIに示されるシステム300の処理結果と同じである。しかしながら、それ以降は結果が異なっている。
【0045】
図8は、フラッシュ・フレーム6がシステム300へのビデオ入力に提供されるときのビデオ圧縮システム300の状態を示している。このとき、フラッシュ・フレーム検出器308は、フレーム6、5および4をそれぞれフレームA、FおよびBとして解析する。フレーム6はフラッシュ・フレームなので、おそらくフレーム5かフレーム4のいずれかと強く相関していないが、フレーム5および4は、相互に強く相関する可能性が高い(フラッシュ・フレーム6が、他の強く相関したフレームからなるシーケンスの中間のどこかで発生すると仮定している。)。フレーム6は、フレームA(すなわちフレーム6)が十分にフレームF(すなわちフレーム5)と相関していないという第一の条件を満たすが、フレームA(すなわちフレーム6)がフレームB(すなわちフレーム4)と弱く相関する可能性が高く、フレームF(すなわちフレーム5)がフレームB(すなわちフレーム4)と強く相関する可能性が高いので、フラッシュ・フレーム検出のための他の二つ条件は満たされない。このため、フラッシュ・フレーム検出器308は、フレーム5(すなわち、現在のフレームF)がフラッシュ・フレームではないと判断する。そして、検出器308は、次の処理サイクルのためにタップT0に配置されるスイッチ304に対して、表IIIに示されるようにBフレームとして符号化するためにフレーム2を符号器306に提供するように指示する。
【0046】
図9は、フレーム7がシステム300へのビデオ入力に提供されるときのビデオ圧縮システム300の状態を示している。このとき、フラッシュ・フレーム検出器308は、フレーム7、6および5をそれぞれフレームA、FおよびBとして解析する。フレーム6はフラッシュ・フレームなので、おそらくフレーム7ともフレーム5とも強くは相関していないが、フレーム7とフレーム5は、相互に強く相関する可能性が高い。この場合、フラッシュ・フレーム検出のための三つの条件すべてが満たされ、フラッシュ・フレーム検出器308は、フレーム6(すなわち、現在のフレームF)がフラッシュ・フレームであると判断する。そして、検出器308は、表IIIに示されるようにフレーム7をPフレームとして符号化するためにフレーム7を符号器306に提供するため、スイッチ304に命令を出して、スイッチ304が次の処理サイクル(図10を参照)に関してタップT4に配置されるようにする。
【0047】
図10〜12は、それぞれフレーム8、9および10がシステム300へのビデオ入力に提供されるときのビデオ圧縮システム300の状態を示している。これらの各場合では、フラッシュ・フレーム検出器308は、現在のフレームFがフラッシュ・フレームではないと判断する。そして、検出器308は、表IIIに示されるようにフレーム4、5および6をBフレームとして符号化するためにこれらのフレームをそれぞれ符号器306に提供するため、スイッチ304に命令を出して、スイッチ304が次の処理サイクル(図11〜13を参照)に関してタップT0に配置されるようにする。
【0048】
図13は、フレーム11がシステム300へのビデオ入力に提供されるときのビデオ圧縮システム300の状態を示している。この場合、フラッシュ・フレーム検出器308は、表IIIに示されるようにフレーム9をPフレームとして符号化するためにフレーム9を符号器306に提供するため、スイッチ304に命令を出して、スイッチ304が次の処理サイクル(図14を参照)に関してタップT2に配置されるようにする。このようにして、ビデオ圧縮処理は、GOPのサイズを拡大しないように調整される。今後、表IIIに示される処理結果は、表IIに示される処理結果と再び一致する。
【0049】
一般に、スイッチ304は、フレームをBフレームとして符合化するためにタップT0に配置され、フレームをPフレームとして符合化するためにタップTMに配置される(Mは、Pフレームと前のアンカー・フレームとの間隔)。このため表IIIによれば、P3とP7の間隔が4フレームであるから、スイッチ304は、フレーム7をPフレームとして符号化するためにT4に配置される。また、P7とP9の間隔が2フレームであるから、スイッチ304は、フレーム9をPフレームとして符号化するためにT2に配置される。
【0050】
また、検出器308は、スイッチシーケンス制御信号をスイッチ304に送信することに加えて、フラッシュ・フレームに割り当てられるビットの数に符号器306が適切な修正を加えることができるように、フラッシュ・フレームが検出されると、ビット割当て制御信号を符号器306に送信し、符号器306に通知を行う。一つの可能性は、フラッシュ・フレームに割り当てられるビットの数を大きく削減し、これらのビットを他のフレームに再分配することである。このビット再割当ては、アンカー・フレーム間隔の変更が行われるかどうかに関わらず行うことができる。すなわち、フラッシュ・フレームが通常GOPパターンのもとでBフレームとして符号化されるようにすでに予定されている場合にビット再割当てを依然として行って利益を得ることができる。
【0051】
用途に応じて、図3のビデオ圧縮システム300は、リアルタイム処理か、あるいは非リアルタイム処理のために、ハードウェア(例えば、デジタル信号処理(DSP)チップの集積回路)か、あるいはソフトウェア(例えば、汎用マイクロプロセッサに載るもの)で実施することができる。
【0052】
図3のビデオ圧縮システム300は、二つのBフレームが、通常、連続したアンカー・フレームの各ペア間で符号化されるGOPパターン用のビデオストリーム中の孤立フラッシュ・フレームを検出して処理するように設計されている。本発明はまた、他のGOPパターン用に実施し、および/またはマルチフレーム・フラッシュ・シーケンスを検出して処理するように実施することもできる。ただし、このような実施は、更なるフレーム遅延を必要とすることがあり、その結果、このような実施の有用性を、レイテンシが問題となりえない非リアルタイム用途に制限する可能性がある。持続時間中の奇数個のフィールドであるフラッシュ・フレームの検出を可能にするため、図3の各フレーム遅延バッファを二つの「フィールド遅延」バッファで置き換えられることが分かる。
【0053】
本発明によれば、正規に予定されたアンカー・フレームがフラッシュ・フレームであると判断されると、ビデオ処理が調整される。本明細書ですでに述べた実施形態では、フラッシュ・フレームをBフレームとして符号化し、次のアンカー・フレームの発生を1フレーム遅らせることによってビデオ処理が調整される。この他に、本発明は、アンカー・フレームを1フレーム遅らせるのでなく、GOP構造のなかでアンカー・フレームを1フレーム進めることによって実施することもできる。これらの実施態様では、フラッシュ・フレームの直前のフレーム(通常は、Bフレームとして符号化されることになる)が代わりにアンカー・フレームとして符号化され、フラッシュ・フレームはBフレームとして符号化される。その場合、GOPのサイズを1フレーム削減することができ(図15の表IVの例を参照)、あるいはGOPにおける後続の処理を(例えば、GOP中のアンカー・フレームの後続ペア間におけるBフレームの数を増やすことによって)調整し、GOPサイズが変わらないようにすることができる(図16の表Vの例を参照)。GOPのサイズを削減できるようにすることにより、(表IVのタップ位置によって示されるように)他の一部の実施態様よりも少ないメモリで本発明を実施することができる。
【0054】
ここまで、本発明の説明は、直列に接続された複数の遅延バッファを有する実施態様との関連で行ってきた。本発明は、直列に接続された一組のディスクリート遅延バッファを使用して実施することもできる。この他に、本発明は、種々のフレームを格納するために単一のメモリ素子を使用して実施することもできる。この場合、異なるフレームを参照するために一つ以上のメモリ・ポインタが使用される。これにより、この単一メモリ素子を、直列接続された多重バッファとして効率良く動作させる。「直列に接続された複数の遅延バッファ」という表現は、双方の実施態様、そしておそらくは当業者が認識する他の実施態様を含むものとして理解される。
【0055】
本発明は、これらの方法を実行する方法および装置の形で具体化することができる。本発明は、また、有形の媒体(例えばフロッピーディスケット、CD‐ROM、ハードディスク、または他の任意の機械読取り可能な記憶媒体)に具体化されるプログラムコードの形に具体化することができる。ここで、プログラムコードが機械(例えばコンピュータ)にロードされて実行されると、この機械は、本発明を実施する装置となる。また、本発明は、例えば、記憶媒体に記憶されるプログラムコードや、機械にロードされ、および/または機械によって実行されるプログラムコードや、伝達媒体を介して(例えば、電気配線もしくはケーブル接続を介して、ファイバ光学によって、または電磁放射を介して)伝送されるプログラムコードの形に具体化することもできる。ここで、プログラムコードが機械(例えばコンピュータ)にロードされて実行されると、この機械は、本発明を実施する装置になる。汎用プロセッサ上で実施される場合、これらのプログラムコード部は、プロセッサと組み合わさって特定の論理回路と類似の動作をする独特な装置を提供する。
【0056】
当業者であれば、本発明の性質を説明するために記述および図示した詳細、材料、および部品の配置に、特許請求の範囲に表される本発明の原理と範囲から逸脱することなく種々の変形を加えることができる。
【図面の簡単な説明】
【図1】ビデオ・フレームのストリームを再順序づけして圧縮ビデオ・ビットストリームに符合化する従来のビデオ圧縮システムのブロック図である。
【図2】表Iを示す図である。この表は、フレームの時間順序と符号化順序との関係を示すとともに、時間順序から符号化順序にビデオ・フレームを再順序づけするために使用される図1のシステムのスイッチのタップ位置を示している。
【図3】本発明の一つの実施形態に従って、ビデオ・フレームのストリームを再順序づけし、圧縮ビデオ・ビットストリームに符合化するビデオ圧縮システムのブロック図である。
【図4】表IIを示す図である。この表は、フレームの時間順序と符号化順序との関係を示すとともに、フラッシュ・フレームを有しないGOPに関して時間順序から符号化順序にビデオ・フレームを再順序づけするために使用される図3のシステムのスイッチのタップ位置を示している。
【図5】表IIIを示す図である。この表は、フレームの時間順序と符号化順序との関係を示すとともに、フレーム6にフラッシュ・フレームを有するGOPに関して時間順序から符号化順序にビデオ・フレームを再順序づけするために使用される図3のシステムのスイッチのタップ位置を示している。
【図6】フレーム2が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図7】フレーム5が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図8】フレーム6が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図9】フレーム7が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図10】フレーム8が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図11】フレーム9が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図12】フレーム10が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図13】フレーム11が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図14】フレーム12が図3のシステムのビデオ入力に提供されるときの図3のシステムの状態を示す図である。
【図15】表IVを示す図である。この表は、フレームの時間順序と符号化順序との関係を示すとともに、フレーム6にフラッシュ・フレームを有するGOPに関して時間順序から符号化順序にビデオ・フレームを再順序づけするために使用される図3のシステムのスイッチのタップ位置を示している。ここで、このアンカー・フレームは、GOP構造が改良されており、GOPサイズが1フレーム低減されている。
【図16】表Vを示す図である。この表は、フレームの時間順序と符号化順序との関係を示すとともに、フレーム6にフラッシュ・フレームを有するGOPに関して時間順序から符号化順序にビデオ・フレームを再順序づけするために使用される図3のシステムのスイッチのタップ位置を示している。ここで、このアンカー・フレームは、GOP構造が改良されており、GOPサイズは維持されている。
【符号の説明】
300…ビデオ圧縮システム、302…フレーム遅延バッファ、304…スイッチ、306…ビデオ符号器、308…フラッシュ・フレーム検出器。
Claims (10)
- ビデオストリームを処理する方法であって、
(a)ビデオストリーム中のフラッシュ・シーケンスを検出するステップであって、前記フラッシュ・シーケンスは、一以上の連続ピクチャからなるセットであり、前記フラッシュ・シーケンスの前のピクチャ及び前記フラッシュ・シーケンスの後のピクチャは、前記フラッシュ・シーケンスと弱く相関し、前記フラッシュ・シーケンスの前のピクチャは、前記フラッシュ・シーケンスの後のピクチャと強く相関している、ステップと、
(b)前記フラッシュ・シーケンスの検出に基づいてビデオ処理の間、一以上のピクチャの順序を調整し、前記ビデオストリームに対応する圧縮ビデオ・ビットストリームの一部分を生成するステップと、を備え、
前記フラッシュ・シーケンスを検出するステップは、
(1)前記フラッシュ・シーケンスの前のピクチャが、前記フラッシュ・シーケンスと弱く相関しているか否か、
(2)前記フラッシュ・シーケンスの後のピクチャが、前記フラッシュ・シーケンスと弱く相関しているか否か、及び
(3)前記フラッシュ・シーケンスの前のピクチャが、前記フラッシュ・シーケンスの後のピクチャと強く相関しているか否か
を判断するステップを含んでいる、方法。 - ステップ(b)が、前記フラッシュ・シーケンスを符号化するために使用されるビットの割当てを調整するステップを含んでいる、請求項1記載の方法。
- ステップ(b)が、前記ビデオストリーム内の他のピクチャを符号化するための参照として使用されない非アンカー・ピクチャとして前記フラッシュ・シーケンス内の各ピクチャを符号化するステップを含んでいる、請求項1記載の方法。
- 前記ビデオ処理は、I、PまたはBピクチャのいずれかとしてピクチャを符号化するステップを含んでおり、
ステップ(b)は、前記フラッシュ・シーケンス内の各ピクチャをBピクチャとして符号化するステップを含んでいる、請求項3記載の方法。 - ステップ(b)が、前記フラッシュ・シーケンスの直後のピクチャをアンカー・ピクチャとして符号化するステップを更に含んでいる、請求項4記載の方法。
- ステップ(b)が、前記フラッシュ・シーケンスの直前のピクチャをアンカー・ピクチャとして符号化するステップを更に含んでいる、請求項4記載の方法。
- ビデオストリームを処理するシステムであって、
(a)直列に接続された複数の遅延バッファと、
(b)前記遅延バッファのいずれか一つの出力からピクチャ・データを受信するように配置される構成のマルチタップ・スイッチと、
(c)前記ピクチャ・データを受信して、前記ビデオストリームに対応する圧縮ビデオ・ビットストリームに符号化するように前記スイッチに接続されたビデオ符号器と、
(d)前記ビデオストリーム中のフラッシュ・シーケンスを検出するように構成されたフラッシュ検出器と、
を備え、前記フラッシュ・シーケンスは、一以上の連続ピクチャからなるセットであり、前記フラッシュ・シーケンスの前のピクチャ及び前記フラッシュ・シーケンスの後のピクチャは、前記フラッシュ・シーケンスと弱く相関し、前記フラッシュ・シーケンスの前のピクチャは、前記フラッシュ・シーケンスの後のピクチャと強く相関しており、
前記フラッシュ検出器は、
(1)前記フラッシュ・シーケンスの前のピクチャが、前記フラッシュ・シーケンスと弱く相関しているか否か、
(2)前記フラッシュ・シーケンスの後のピクチャが、前記フラッシュ・シーケンスと弱く相関しているか否か、及び
(3)前記フラッシュ・シーケンスの前のピクチャが、前記フラッシュ・シーケンスの後のピクチャと強く相関しているか否か
を判断するように構成されており、
前記ビデオ符号器が、前記フラッシュ検出器による前記フラッシュ・シーケンスの検出に基づいてビデオ処理の間、一以上のピクチャの順序を調整し、前記圧縮ビデオ・ビットストリームの一部分を生成するようになっているシステム。 - 直列に接続された(N+1)個の遅延バッファを備える請求項7記載のシステムであって、各バッファは、対応する出力タップを有しており、タップT0は、直列接続の最後のバッファに対応し、タップT1は、直列接続の最後から二番目のバッファに対応し、…、タップTNは、直列接続の最初のバッファに対応しており、
前記スイッチは、前記(N+1)個のタップのいずれかに配置されるように構成された(N+1)位置スイッチであり、
前記スイッチは、タップT0に配置されると、ピクチャを非アンカー・ピクチャとして符号化し、
前記スイッチは、タップTM(Mは、直前のアンカー・ピクチャと現在のアンカー・ピクチャとの間隔)に配置されると、ピクチャをアンカー・ピクチャとして符号化する、請求項7記載のシステム。 - 前記ビデオ符号器は、前記フラッシュ・シーケンス内の各ピクチャを、前記ビデオストリーム内の他のピクチャを符号化するための参照として使用されない非アンカー・ピクチャとして符号化する、請求項7記載のシステム。
- 前記ビデオ処理は、I、PまたはBピクチャのいずれかとしてピクチャを符号化するステップを含んでおり、
前記ビデオ符号器は、前記フラッシュ・シーケンス内の各ピクチャをBピクチャとして符号化する、請求項9記載のシステム。
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US10170198P | 1998-09-25 | 1998-09-25 | |
US60/101701 | 1999-03-31 | ||
US09/282123 | 1999-03-31 | ||
US09/282,123 US6580829B1 (en) | 1998-09-25 | 1999-03-31 | Detecting and coding flash frames in video data |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000115778A JP2000115778A (ja) | 2000-04-21 |
JP4402219B2 true JP4402219B2 (ja) | 2010-01-20 |
Family
ID=26798531
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27260499A Expired - Lifetime JP4402219B2 (ja) | 1998-09-25 | 1999-09-27 | ビデオ・データ中のフラッシュ・フレームの検出および符号化 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6580829B1 (ja) |
EP (1) | EP0989755A2 (ja) |
JP (1) | JP4402219B2 (ja) |
Families Citing this family (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7038736B2 (en) * | 2000-09-21 | 2006-05-02 | Canon Kabushiki Kaisha | Moving image processing apparatus and method, and computer readable memory |
JP4541825B2 (ja) * | 2004-10-15 | 2010-09-08 | キヤノン株式会社 | 動画像符号化装置及びその制御方法 |
US8780957B2 (en) * | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
KR20070117660A (ko) | 2005-03-10 | 2007-12-12 | 콸콤 인코포레이티드 | 컨텐트 적응적 멀티미디어 처리 |
US8879856B2 (en) * | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Content driven transcoder that orchestrates multimedia transcoding using content information |
US7860327B2 (en) * | 2005-10-06 | 2010-12-28 | Sony Corporation | Systems and methods for enhanced coding gain |
US20070206117A1 (en) * | 2005-10-17 | 2007-09-06 | Qualcomm Incorporated | Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video |
US8654848B2 (en) * | 2005-10-17 | 2014-02-18 | Qualcomm Incorporated | Method and apparatus for shot detection in video streaming |
US8948260B2 (en) * | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US20070171280A1 (en) * | 2005-10-24 | 2007-07-26 | Qualcomm Incorporated | Inverse telecine algorithm based on state machine |
KR100667830B1 (ko) * | 2005-11-05 | 2007-01-11 | 삼성전자주식회사 | 다시점 동영상을 부호화하는 방법 및 장치 |
JP4621585B2 (ja) * | 2005-12-15 | 2011-01-26 | 株式会社東芝 | 画像処理装置及び画像処理方法 |
JP4677351B2 (ja) * | 2006-02-17 | 2011-04-27 | キヤノン株式会社 | 動き補償器、動き補償処理方法、コンピュータプログラム及び記憶媒体 |
JP4585981B2 (ja) * | 2006-03-10 | 2010-11-24 | キヤノン株式会社 | 画像符号化方法及び画像符号化装置 |
US9131164B2 (en) * | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
WO2008028333A1 (en) * | 2006-09-01 | 2008-03-13 | Thomson Licensing | Method and apparatus for encoding a flash picture occurring in a viedo sequence, and for decoding corresponding data for a flash picture |
JP4886479B2 (ja) * | 2006-11-15 | 2012-02-29 | 日本放送協会 | 動きベクトル補正装置、動きベクトル補正プログラム、補間フレーム生成装置及び映像補正装置 |
GB2447058A (en) * | 2007-02-28 | 2008-09-03 | Tandberg Television Asa | Compression of video signals containing fades and flashes |
CN103124354B (zh) * | 2007-09-28 | 2016-01-20 | 杜比实验室特许公司 | 处理视频信息 |
US9628811B2 (en) * | 2007-12-17 | 2017-04-18 | Qualcomm Incorporated | Adaptive group of pictures (AGOP) structure determination |
JP5880737B2 (ja) * | 2013-01-17 | 2016-03-09 | Nttエレクトロニクス株式会社 | 動画像符号化装置 |
JP6156686B2 (ja) * | 2013-02-20 | 2017-07-05 | パナソニックIpマネジメント株式会社 | 画像処理装置 |
JP6582994B2 (ja) * | 2014-01-14 | 2019-10-02 | 日本電気株式会社 | 画像処理装置、画像処理方法及びプログラム |
JP2016171519A (ja) * | 2015-03-13 | 2016-09-23 | 日本電気株式会社 | 映像処理装置、映像出力システム、映像処理方法、および映像処理プログラム |
US10412383B2 (en) * | 2017-08-15 | 2019-09-10 | Google Llc | Compressing groups of video frames using reversed ordering |
CN110417577B (zh) * | 2019-06-18 | 2021-11-26 | 东华大学 | 一种混杂数据流分流量峰值预测方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5471176A (en) * | 1994-06-07 | 1995-11-28 | Quantum Corporation | Glitchless frequency-adjustable ring oscillator |
JPH08214265A (ja) * | 1995-01-31 | 1996-08-20 | Sony Corp | 符号化データの再生方法および再生装置 |
US5708767A (en) * | 1995-02-03 | 1998-01-13 | The Trustees Of Princeton University | Method and apparatus for video browsing based on content and structure |
US5654751A (en) * | 1995-05-31 | 1997-08-05 | Bell Atlantic Network Services, Inc. | Testing jig and method of testing video using testing jig |
US5774593A (en) * | 1995-07-24 | 1998-06-30 | University Of Washington | Automatic scene decomposition and optimization of MPEG compressed video |
JPH09130732A (ja) * | 1995-11-01 | 1997-05-16 | Matsushita Electric Ind Co Ltd | シーンチェンジ検出方法および動画像編集装置 |
MY118360A (en) * | 1996-04-30 | 2004-10-30 | Nippon Telegraph & Telephone | Scheme for detecting shot boundaries in compressed video data using inter-frame/inter field prediction coding and intra-frame/intra-field coding |
KR100194923B1 (ko) * | 1996-06-21 | 1999-06-15 | 윤종용 | 동영상 정보 검색장치 및 방법 |
US5920518A (en) * | 1997-02-11 | 1999-07-06 | Micron Technology, Inc. | Synchronous clock generator including delay-locked loop |
US6240103B1 (en) * | 1997-03-21 | 2001-05-29 | Scientific-Atlanta, Inc. | Method and apparatus for detecting and preventing bandwidth overflow in a statistical multiplexer |
US6014694A (en) * | 1997-06-26 | 2000-01-11 | Citrix Systems, Inc. | System for adaptive video/audio transport over a network |
US5987179A (en) * | 1997-09-05 | 1999-11-16 | Eastman Kodak Company | Method and apparatus for encoding high-fidelity still images in MPEG bitstreams |
-
1999
- 1999-03-31 US US09/282,123 patent/US6580829B1/en not_active Expired - Lifetime
- 1999-09-14 EP EP99307263A patent/EP0989755A2/en not_active Withdrawn
- 1999-09-27 JP JP27260499A patent/JP4402219B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
EP0989755A2 (en) | 2000-03-29 |
JP2000115778A (ja) | 2000-04-21 |
US6580829B1 (en) | 2003-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4402219B2 (ja) | ビデオ・データ中のフラッシュ・フレームの検出および符号化 | |
US8320451B2 (en) | Replacement of frame data in a video stream signal | |
US7848428B2 (en) | System and method for reducing visible artifacts in video coding using multiple reference pictures | |
JP2008109637A (ja) | 動画像符号化装置及びその方法 | |
US20110069757A1 (en) | Content adaptive video encoder and coding method | |
TWI377844B (ja) | ||
JPH08154247A (ja) | 圧縮画像データ処理装置及び方法 | |
JP4223567B2 (ja) | 符号化ビデオシーケンスの切り替え方法及び装置 | |
JP2003179884A (ja) | プルダウン信号検出装置、プルダウン信号検出方法、高解像度化画像処理装置、高解像度化画像処理方法、画像符号化装置および画像符号化方法 | |
KR20090046812A (ko) | 비디오 압축 방법 | |
WO2004045216A1 (en) | Video streaming device and method of control for switchable video streams | |
JP2006203597A (ja) | ディジタル画像復号装置及び方法 | |
JP2002027483A (ja) | 画像符号化装置、画像復号化装置および記憶媒体 | |
JP2001285868A (ja) | 動画像符号列切替装置及び動画像符号列切替方法 | |
KR20010075579A (ko) | 비디오형 또는 필름형 이미지를 포함하는 프레임들의시퀀스를 인코딩하는 방법 및 장치 | |
JPH11355782A (ja) | 映像信号の多チャネル符号化装置 | |
US10856002B2 (en) | Method, device and system for method of encoding a sequence of frames in a video stream | |
JP3428332B2 (ja) | 画像符号化方法及び装置、並びに画像伝送方法 | |
JP3946804B2 (ja) | 画像符号化制御方法 | |
JP2004015351A (ja) | 符号化装置及び方法、プログラム、記録媒体 | |
US7289564B2 (en) | Video encoding method with support for editing when scene changed | |
JP2011129979A (ja) | 画像処理装置 | |
JP3918509B2 (ja) | 動画像編集装置、動画像編集方法、動画像復号化装置及び動画像復号化方法 | |
JP2914368B1 (ja) | 時報に合わせた動画像信号符号化方法及び装置 | |
JPH1093969A (ja) | 動画像符号化装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20050720 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20050720 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20050720 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060905 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090519 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20090819 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20090824 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090924 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091020 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091029 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4402219 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121106 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121106 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131106 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |