JP2009512400A - ビデオストリーミングにおけるショット検出のための方法および装置 - Google Patents
ビデオストリーミングにおけるショット検出のための方法および装置 Download PDFInfo
- Publication number
- JP2009512400A JP2009512400A JP2008536770A JP2008536770A JP2009512400A JP 2009512400 A JP2009512400 A JP 2009512400A JP 2008536770 A JP2008536770 A JP 2008536770A JP 2008536770 A JP2008536770 A JP 2008536770A JP 2009512400 A JP2009512400 A JP 2009512400A
- Authority
- JP
- Japan
- Prior art keywords
- frame
- selected frame
- metric
- difference
- shot event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 122
- 238000001514 detection method Methods 0.000 title description 23
- 230000033001 locomotion Effects 0.000 claims abstract description 61
- 238000012545 processing Methods 0.000 claims abstract description 44
- 230000008569 process Effects 0.000 claims description 68
- 230000008859 change Effects 0.000 claims description 51
- 230000002123 temporal effect Effects 0.000 claims description 12
- 230000003044 adaptive effect Effects 0.000 claims description 3
- 230000003362 replicative effect Effects 0.000 claims 1
- 230000002457 bidirectional effect Effects 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 22
- 239000013598 vector Substances 0.000 description 12
- 230000005540 biological transmission Effects 0.000 description 10
- 238000004891 communication Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 10
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 238000004088 simulation Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 241000023320 Luma <angiosperm> Species 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- OSWPMRLSEDHDFF-UHFFFAOYSA-N methyl salicylate Chemical compound COC(=O)C1=CC=CC=C1O OSWPMRLSEDHDFF-UHFFFAOYSA-N 0.000 description 2
- 229920001690 polydopamine Polymers 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/14—Picture signal circuitry for video frequency region
- H04N5/147—Scene change detection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/87—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/114—Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/142—Detection of scene cut or scene change
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/177—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/179—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
- H04N19/577—Motion compensation with bidirectional frame interpolation, i.e. using B-pictures
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Studio Devices (AREA)
- Image Analysis (AREA)
- Television Signal Processing For Recording (AREA)
Abstract
本発明は、マルチメディアデータを処理するデバイスおよび方法を含む。このような方法は、複数のビデオフレーム中の、選択されたフレームと、近接したフレームに対する差を示す少なくとも1つのメトリックを取得することと、少なくとも1つのメトリックに基づいて、選択されたフレーム中のショットイベントを決定することと、ショットイベントに基づいて、選択されたフレームを適応的にエンコードすることとを含み、メトリックは、双方向の動き情報と輝度差情報とを含む。
【選択図】 図2
【選択図】 図2
Description
特許に対する本出願は、2005年10月17日に出願され、この出願の譲受人に譲渡され、参照により明白にここに組み込まれている、“ビデオストリーミングにおけるショット検出のための方法および装置”と題する仮出願第60/727,644号に対する優先権を主張する。
本発明は一般的にマルチメディアデータ処理に向けられており、より詳細には、ショット検出処理に基づいて、マルチメディアデータをエンコードすることに向けられている。
ショット検出は、シーン変化が生じたことを示すデータを、ピクチャのグループ(GOP)中のフレームがいつ表すかについて決定することに関する。一般的に、GOP内で、フレームは、任意の2つまたは3つ(またはより多い)の近接したフレームにおいて著しい変化を有しないかもしれず、あるいは、遅い変化または速い変化があるかもしれない。もちろん、必要な場合、特定のアプリケーションに依存して、これらのシーン変化の分類は、より多数のレベルの変化にさらに分解できる。
ショットまたはシーン変化を検出することは、ビデオの効率的なエンコーディングのために重要である。一般に、GOPが著しく変化していないとき、GOPの開始におけるIフレームには、ビデオを効率的にエンコードできる多数の予測フレームが後に続き、それにより、ビデオの後のデコーディングおよび表示は視覚的に受け入れできるものになる。しかしながら、シーンが、急にまたはゆっくりと変化しているとき、後にデコードされて視覚的に受け入れ可能な結果を生成するために、追加的なIフレームと、より少ない予測エンコーディング(PフレームおよびBフレーム)とを使用するかもしれない。ショット検出と、ショット検出の結果を使用する対応するエンコーディングとにおける改善により、コーディング効率を改善させ、GOP分割に関係付けられた技術における他の問題を克服できる。
ここで記述した発明の装置および方法のそれぞれは、いくつかの観点を有し、それらの観点のどの1つも、その望ましい属性に対して単独で役割を果たすものではない。本発明の範囲を限定することなく、本発明のより顕著な特徴をこれから簡潔に論じる。この記述を考慮した後、特に“詳細な説明”と題する段落を読んだ後、マルチメディアデータを処理する装置および方法に対して、本発明の特徴がいかに改良をもたらすかを理解するだろう。
マルチメディアデータを処理する方法において、方法は、複数のビデオフレーム中の、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得することと、少なくとも1つのメトリックに基づいて、選択されたフレームに関係付けられたショットイベントを決定することと、ショットイベントに基づいて、選択されたフレームを適応的にエンコードすることとを含み、少なくとも1つのメトリックは、選択されたフレームと、選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む。1つの観点において、少なくとも1つのメトリックを取得することは、少なくとも1つのメトリックを計算することを含む。選択されたフレームが、急なシーン変化であることをショットイベントが示す場合、選択されたフレームをIフレームとして適応的にエンコードできる。選択されたフレームが、遅いシーン変化を含む複数のフレームの一部分であることをショットイベントが示す場合、選択されたフレームをPフレームまたはBフレームのいずれかとしてエンコードできる。別の観点において、選択されたフレームが少なくとも1つのカメラのフラッシュライトを含むことをショットイベントが示す場合、特別な処理を必要とするものとして、選択されたフレームを識別できる。このような特別な処理の例は、ビデオからの選択されたフレームの除去、選択されたフレームに時間的に近接したフレームを複製すること、および選択されたフレームの代わりに複製されたフレームを用いることを含む。いくつかの観点において、選択されたフレームが、急なシーン変化、遅いシーン変化の一部分または少なくとも1つのカメラのフラッシュライトを含むことをショットイベントは示す。いくつかの観点において、選択されたフレームが、急なシーン変化、遅いシーン変化の一部分または少なくとも1つのカメラのフラッシュライトを含むことをショットイベントが示さない場合、適応的にエンコードすることは、選択されたフレームをIフレームとしてエンコードすることを含む。
別の観点において、マルチメディアデータを処理する装置は、複数のビデオフレーム中の、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得するように構成された動き補償器と、少なくとも1つのメトリックに基づいて、選択されたフレームに関係付けられたショットイベントを決定するように構成されたショット分類器と、ショットイベントに基づいて、選択されたフレームを適応的にエンコードするように構成されたエンコーダとを含み、少なくとも1つのメトリックは、双方向の動き情報と輝度情報とを含む。
別の観点において、マルチメディアデータを処理する装置は、複数のビデオフレーム中の、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得する手段と、少なくとも1つのメトリックに基づいて、選択されたフレームに関係付けられたショットイベントを決定する手段と、ショットイベントに基づいて、選択されたフレームを適応的にエンコードする手段とを含み、少なくとも1つのメトリックは、選択されたフレームと、選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む。選択されたフレームが、急なシーン変化であることをショットイベントが示す場合、適応的にエンコードする手段は、選択されたフレームをIフレームとしてエンコードできる。別の観点において、選択されたフレームが、遅いシーン変化を含む複数のフレームの一部分であることをショットイベントが示す場合、適応的にエンコードする手段は、選択されたフレームをPフレームまたはBフレームのいずれかとしてエンコードする手段を含むことができる。別の観点において、ショットイベントは、選択されたフレームが、少なくとも1つのカメラのフラッシュライトを含むことを示し、適応的にエンコードする手段は、特別な処理を必要とするものとして、選択されたフレームを識別して、エンコードする手段を含むことができる。
別の観点において、機械読み取り可能媒体は、マルチメディアデータを処理する命令を含み、ここで命令は、実行時に、複数のビデオフレーム中の、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得することと、少なくとも1つのメトリックに基づいて、選択されたフレームに関係付けられたショットイベントを決定することと、ショットイベントに基づいて、選択されたフレームを適応的にエンコードすることとを機械に行わせ、少なくとも1つのメトリックは、選択されたフレームと、選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む。
別の観点において、マルチメディアデータを処理するプロセッサは、複数のビデオフレーム中の、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得し、少なくとも1つのメトリックに基づいて、選択されたフレームに関係付けられたショットイベントを決定し、ショットイベントに基づいて、選択されたフレームを適応的にエンコードする構成を備えるように構成されており、少なくとも1つのメトリックは、選択されたフレームと、選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む。
以下の説明において、観点の完全な理解を提供するために、特定の詳細な説明を与える。しかしながら、これらの特定の詳細な説明なく、観点を実施できることが当業者に理解されるだろう。例えば、不必要な詳細な説明で観点を不明瞭にしないために、通信システムおよびビデオ処理デバイスは、ブロック図で示されているかもしれない。
既存のエンコーディングシステムの性能を向上させる、ショット検出ならびに、エンコーディングのシステムおよび方法に対する、ある発明の観点をここで記述する。このような観点は、ビデオデータの近接したフレーム間の統計的な比較を含む統計量(すなわちメトリック)を利用して、急なシーン変化が生じたかどうか、シーンがゆっくりと変化しているかどうか、またはビデオエンコーディングを特に複雑にさせることがある、カメラのフラッシュライトがシーン中にあるかどうかを決定する。プリプロセッサから統計量を取得して、エンコーディングデバイスに対して送ることができ、または、(例えば、動き補償を実行するように構成されたプロセッサにより)エンコーディングデバイス中で統計量を発生させることができる。結果として生じる統計量は、シーン変化の検出決定を支援する。トランスコーディングを行うシステムにおいては、適切なプリプロセッサまたは構成可能プロセッサが存在することが多い。プリプロセッサが、動き補償支援のデインターレーシングを実行する場合、動き補償の統計量が使用可能であり、使用できる状態にある。
ここで記述するショット検出器は、単に、前のフレーム、現在のフレームおよび次のフレームから統計量を利用でき、それによりアルゴリズムは待ち時間が非常に少ない。ショット検出器は、急なシーン変化、クロスフェイディングおよび他の遅いシーン変化、ならびにカメラのフラッシュライトを含む、いくつかの異なるタイプのショットイベントを区別する。エンコーダにおいて異なる戦略により異なるタイプのショットイベントを決定することにより、エンコーディング効率および視覚の品質が高められる。
ここでの、“1つの観点”、“観点”、“いくつかの観点”または“ある観点”に対する言及は、観点に関連して記述した、特定の、特徴、構造または特性のうちの1つ以上を、ショット検出およびエンコーディングシステムの少なくとも1つの観点中に含めることができることを意味する。明細書中のさまざまな箇所におけるこのようなフレーズの登場は、必ずしもすべてが同一の観点に言及するわけではなく、他の観点を相互に含まない別個または代替えの観点でもない。さらに、さまざまな特徴を記述するが、それらは、いくつかの観点により示され、他の観点によっては示されないかもしれない。同様に、さまざまな要求を記述するが、それらは、いくつかの観点に対する要求であって、他の観点に対する要求ではないかもしれない。
ここで使用される“マルチメディアデータ”は、ビデオデータ(オーディオデータを含むことができる)、オーディオデータ、またはビデオデータとオーディオデータとの両方を含む広い用語である。特にことわらない限り、画像あるいは、テキスト、画像および/またはオーディオデータを含んでいる画像の、1つ以上のシリーズまたはシーケンスを言及するような、広い用語としてここで使用される“ビデオデータ”または“ビデオ”を、マルチメディアデータに言及するために使用でき、またはそれらの用語を区別なく使用してもよい。
図1は、ストリーミングマルチメディアを配信する通信システム10のブロック図である。図1中で示したような、非常に多数の端末に対するデジタル圧縮ビデオの送信において、このようなシステムは応用を見い出す。デジタルビデオ源は、例えば、デジタルケーブルまたは衛星供給、あるいはデジタル化されるアナログ源とすることができる。ビデオ源は送信機構2中で処理され、そこでビデオ源はエンコードされ、ネットワーク4を通して1つ以上の端末6に送信するために搬送波上に変調される。端末6は、受信したビデオをデコードし、一般に、ビデオの一部を少なくとも表示する。ネットワーク4は、エンコードされたデータの送信に適した、任意のタイプの通信ネットワーク、ワイヤードまたはワイヤレスを指す。例えば、ネットワーク4は、セル電話ネットワーク、ワイヤードまたはワイヤレスの、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)あるいはインターネットとすることができる。端末6は、セル電話機、PDA、家庭用または商業用ビデオ表示機器、コンピュータ(ポータブル、ラップトップ、ハンドヘルド、PCおよび、より大きなサーバベースのコンピュータシステム)およびマルチメディアデータを使用できるパーソナルエンターテイメントデバイスを含むが、これらに限定されない、データを受信および表示できる任意のタイプの通信デバイスとすることができる。
図2は、いくつかの観点にしたがって、マルチメディアデータをエンコードするデジタル送信機構のいくつかのコンポーネントのブロック図である。デジタル送信機構2中の受信機21は、デジタルビデオ源を受け取り、ビデオを処理およびエンコードするために、ビデオをエンコーディングコンポーネント(または装置)22に提供する。エンコーディングコンポーネント22は、動き補償器23、ショット分類器24およびビデオを処理するエンコーダ25を含む。
動き補償器23は、ビデオ中のフレームに関して双方向の動き情報を決定するように構成できる。1つ以上の差のメトリック、例えば、絶対差の総和(SAD)または絶対差の総和(SSD)を決定し、1つ以上のフレームに対する輝度情報(例えば、マクロブロック(MB)の輝度平均または差)、輝度ヒストグラムの差、およびフレーム差のメトリックを含む他の情報を計算するように、補償器23を構成することもでき、これらの例は、式1−3に関連して記述する。ショット分類器は、動き補償器により決定される情報を使用して、ビデオ中のフレームを“ショット”の2つ以上のカテゴリに分類するように構成できる。エンコーダは、ショットの分類に基づいて、複数のフレームを適応的にエンコードするように構成されている。式1−10に関連して、動き補償器、ショット分類器およびエンコーダを以下で記述する。
ハードウェア、ソフトウェア、ファームウェア、ミドルウェア、マイクロコードまたはそれらについての任意の組み合わせにより、エンコーディングコンポーネント22、そのコンポーネントおよびその中に含まれるプロセスを実現できる。例えば、動き補償器23、ショット分類器24およびエンコーダ25は、スタンドアローンコンポーネントであってもよく、別のデバイスのコンポーネント中にハードウェア、ファームウェア、ミドルウェアとして組み込まれていてもよく、あるいは、プロセッサまたはそれらの組み合わせ上で実行される、マイクロコードまたはソフトウェア中で実現されていてもよい。ソフトウェア、ファームウェア、ミドルウェアまたはマイクロコード中で実現されるとき、動き補償を実行するプログラムコードまたはコードセグメント、ショットを、分類およびエンコードするプロセスを、記憶媒体のような、機械読み取り可能媒体中に記憶してもよい。コードセグメントは、手続き、関数、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、あるいは命令、データ構造、またはプログラムステートメント、の任意の組み合わせを表してもよい。情報、データ、引き数、パラメータまたはメモリコンテンツを渡すおよび/または受け取ることにより、コードセグメントは、別のコードセグメントまたはハードウェア回路に結合されていてもよい。
図3Aは、いくつかの観点にしたがった、ショット検出のためのプロセッサ31を備え、検出されたショットに基づいてエンコードするマルチメディア処理デバイス30のブロック図である。いくつかの観点において、図3中のマルチメディア処理デバイス30は、図2中のエンコーディングコンポーネント22とすることもできる。マルチメディア処理デバイス30に対して外部にある情報源によりデジタルビデオ源を提供でき、マルチメディア処理デバイス30中の通信モジュール36に対してデジタルビデオ源を通信できる。マルチメディア処理デバイス30は、プロセッサ31と通信する記憶媒体25を含み、プロセッサ31および記憶媒体25の両方は、通信モジュール36と通信する。プロセッサ31は、動き補償器32、ショット分類器およびエンコーダを含み、それらは、動き情報を発生させ、ビデオデータのフレーム中のショットを分類し、ビデオデータをエンコードするように動作できる。動き補償器、ショット分類器およびエンコーダは、ビデオを処理して、式1−10に関連して以下に記述する情報を決定できる。特に、プロセッサ31は、複数のビデオフレームの、近接したフレーム間の差を示すメトリックを取得し、メトリックに基づいて、複数のビデオフレーム中のショット変化を決定し、ショット変化に基づいて、複数のフレームを適応的にエンコードする構成を有することができる。メトリックは、双方向の動き情報と輝度情報とを含んでいる。いくつかの観点において、メトリックは、プロセッサ31に対して外部にあるデバイスまたはプロセスにより計算でき、プロセッサ31も、マルチメディア処理デバイス30に対して外部にあるものとすることができ、メトリックは、別のデバイスまたはメモリを介して、直接的にまたは間接的にプロセッサ31に通信することができる。プロセッサ31により、例えば、プロセッサ31の動き補償器32により、メトリックを計算することもできる。
マルチメディア処理デバイス30は、さらなる処理および/または送信のために、他のデバイス、例えば、端末6(図1)に対してエンコードされたビデオを提供できる。エンコードされたビデオは、いくつかの観点において、基本レイヤおよびエンハンスメントレイヤを含むことができる、多重レイヤ化され、エンコードされたスケーラブルなビデオとすることができる。スケーラブルなレイヤエンコーディングは、ここの譲受人により所有されている“2つのレイヤエンコーディングと1つのレイヤデコーディングを有するスケーラブルビデオコーディング”と題する、同時継続中の米国特許出願第11/373,604号(代理人ドケット第050078号)にさらに記述されており、その全体は、参照により、ここに組み込まれている。図3Bは、ショット検出と、検出されたショットに基づいてエンコードするためのマルチメディア処理デバイス30の別の例示的な観点のブロック図である。マルチメディア処理デバイス30は、モジュール37のような、選択されたフレームと、選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得する手段を含む。マルチメディア処理デバイス30はまた、モジュール37により決定されている、少なくとも1つのメトリックに基づいて、選択されたフレーム中のショットイベントを決定するモジュール38のような、ショットイベントを決定する手段を含む。ショットイベントを決定する例示的なプロセスは、以下の式4−9を使用する。マルチメディア処理デバイス30はまた、モジュール39のような、ショットイベントに基づいて、選択されたフレームを適応的にエンコードする手段を含む。1つの観点において、選択されたフレームが急なシーン変化であることをショットイベントが示す場合、モジュール39は、選択されたフレームをIフレームとして適応的にエンコードできる。別の観点において、選択されたフレームが、遅いシーン変化を含む複数のフレームの一部であることをショットイベントが示す場合、モジュール39は、選択されたフレームをPフレームまたはBフレームのいずれかとして適応的にエンコードできる。別の観点において、選択されたフレームが、少なくとも1つのカメラのフラッシュライトを含むことをショットイベントが示す場合、モジュール39は、特別な処理を必要とするものとして、選択されたフレームを適応的に識別でき、特別な処理は、選択されたフレームをドロップすること、選択されたフレームに近接したフレームを複製すること、選択されたフレームに対して、複製されたフレームを使用すること、選択されたフレームに近接したフレームを補間して、選択されたフレームに取って代わる新しいフレームを形成すること、選択されたフレームに関してエラーの隠匿を実行すること、または選択されたフレームに対して、別の予め定められたエンコーディングプロセスを実行することを含むことができる。
いくつかの観点において、汎用目的のプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラム可能ゲートアレイ(FPGA)または他のプログラム可能論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、あるいはここで記述した機能を実行するために設計された、これらの任意の組み合わせにより、図2、3Aおよび3B、ならびに、ここで開示した他の例および図に関連して記述した、さまざまな例示的な論理ブロック、コンポーネント、モジュールおよび回路を実現または実行してもよい。図2で示したような汎用目的のプロセッサはマイクロプロセッサでもよいが、代わりに、プロセッサは任意の従来のプロセッサ、制御装置、マイクロ制御装置、または状態遷移機械であってもよい。計算デバイスの組み合わせ、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに関連した1つ以上のマイクロプロセッサ、または他の任意のこのような構成として、プロセッサを実現してもよい。
ビデオエンコーディングは通常、構造化されたピクチャのグループ(GOP)に動作する。GOPは通常、イントラコード化されたフレーム(Iフレーム)から開始し、一連のP(予測)またはB(双方向)フレームが後に続く。通常、Iフレームは、フレームを表示するためのすべてのデータを記憶することができ、Bフレームは、先行および後続のフレーム中のデータに依拠し(例えば、先行フレームから変化したデータを含んでいるだけか、または次のフレーム中のデータとは異なるデータを含んでいるだけである)、Pフレームは、先行フレームから変化したデータを含む。
一般的な使用では、エンコードされたビデオにおいて、Iフレームには、PフレームおよびBフレームが所々に置かれる。サイズ(例えば、フレームをエンコードするために使用されるビット数)に関して、Iフレームは通常、Pフレームよりずっと大きく、Pフレームは、Bフレームより大きい。効率的なエンコーディング、送信およびデコーディング処理のために、GOPの長さは、大きいIフレームからの有効損失を減少させるために十分長くあるべきであり、エンコーダとデコーダとの間の不整合、またはチャネル障害と戦うために十分短くあるべきである。さらに、同じ理由のために、Pフレーム中のマクロブロック(MB)をイントラコード化できる。
しばしば不必要とされるIフレームを固定した間隔で挿入する代わりに、シーン変化検出をビデオエンコーダに対して使用して、適切なGOPの長さを決定し、GOPの長さに基づいて、Iフレームを挿入できる。実際的なストリーミングビデオシステムにおいて、通信チャネルは通常、ビットエラーまたはパケット損失により、損なわれる。IフレームまたはIMBをどこに配置するかは、デコードされたビデオ品質および視覚体験に、著しく影響を与えるかもしれない。1つのエンコーディングスキームは、並べて置かれた前のピクチャまたはピクチャの部分から著しい変化を有するピクチャまたはピクチャの部分に対して、イントラコード化されたフレームを使用することである。通常、動き推定により、これらの領域を、効果的に、および効率的に予測することができず、このような領域が、インターフレームコーディング技術(例えば、BフレームおよびPフレームを使用するエンコーディング)から除外される場合、より効率的にエンコーディングを実施できる。チャネル障害の情況において、それらの領域は、エラー伝搬を被りやすいが、イントラフレームエンコーディングにより、エラー伝搬を減少させることができ、または除去(またはほとんどそのように)できる。
GOPビデオの、選択されたフレームまたは一部分を、2つまたはより多いカテゴリに分類でき、それぞれのフレームまたは部分は、特定の実施に依存してもよい異なるイントラフレームエンコーディング基準を有することができる。例示的な例として、ビデオ中の選択されたフレームを処理して、選択されたフレームが、ある“ショットイベント”を含んでいるかどうかを決定でき、あるショットイベントを使用して、その内容に基づいて、フレームを3つのカテゴリのうちの1つに分類できる。すなわち、それぞれのカテゴリは、フレームまたはフレームの一部により取り込まれるショットイベントのタイプを示している。これらの3つのカテゴリは、急なシーン変化、クロスフェイディングおよび/または他の遅いシーン変化の部分、あるいは“カメラのフラッシュライト”としても呼ばれる、少なくとも1つのカメラのフラッシュを含んでいるフレームのようなものである。
急なシーン変化として分類されるフレームは、前のフレームから著しく異なるフレームを含む。これらの急なシーン変化は通常、ビデオの編集または発生の間のカメラ動作により引き起こされる。例えば、異なるカメラから発生したビデオは、カメラが異なる視点を有するため、急なシーン変化を含むことがある。また、ビデオを録画している間に、カメラの視野を急に変えることは、急なシーン変化を結果として生じることがある。急なシーン変化として分類されるフレームのコンテンツは、前のフレームのコンテンツと異なるため、急なシーン変化のフレームは通常、Iフレームとしてエンコードされるべきである。
遅いシーン変化の一部分として分類されるフレームは、クロスフェイディングおよび他の遅いシーン変化、またはシーンの遅い切り換えを有するビデオを含む。いくつかの例において、このことは、カメラショットのコンピュータ処理により引き起こされることがある。2つの異なるシーンの段階的な混合は、人間の目に対しては、より心地よく見えるかもしれないが、ビデオコーディングに対して課題を与える。何らかのゆっくりと変化するシーンに対して、動き補償は、それらのフレームのビットレートを効果的に減少させないかもしれない。いくつかの情況において、より多くのイントラコード化されたMBを、これらのフレームに対して使用できる。
フレームはカメラのフラッシュライトを有するものとして分類され、すなわち、カメラフラッシュイベントは、1つ以上のカメラのフラッシュを含むコンテンツを有するフレームを含むことができる。このようなフラッシュは、持続期間が比較的短く(例えば、1つのフレーム)、フラッシュを描写しているフレーム中の画素が、近接したフレーム上の対応するエリアに比べて、通常高い輝度を表すように、極端に明るいものとすることができる。カメラのフラッシュライトは、突然に、そして、迅速に、ピクチャの輝度をシフトする。通常、カメラのフラッシュライトの持続期間は、人間の視覚システム(HVS)の時間的なマスキング持続期間より短く、それは通常44msと規定されている。人間の目は、これらの短いバーストの明るさの質に対して敏感でなく、それ故に、それらをきめ粗くエンコードできる。フラッシュライトのフレームは、動き補償により効果的に取り扱うことができず、そして、フラッシュライトのフレームは、未来のフレームに対して、不良な予測候補であるため、これらのフレームのきめの粗いエンコーディングは、未来のフレームのエンコーディング効率を減少させない。“人工の”高い輝度のため、フラッシュライトとして分類されたシーンを使用して、他のフレームを予測すべきではなく、同一の理由のため、他のフレームを効率的に使用して、これらのフレームを予測することはできない。いったん識別されると、これらのフレームは、比較的高い量の処理を必要とするかもしれないため、除外することができる。1つのオプションは、カメラのフラッシュライトを含むことが決定されたフレームを除去し、それらの場所におけるDC係数をエンコードすることであり、このような解決は、簡単であり、計算的に速く、エンコーディングの間に多くのビットを節約できる。
上述のタイプのシーン変化のいずれかがフレーム中で検出されるとき、ショットイベントが宣言され、検出されたシーンタイプを使用して、フレームをどのようにエンコードできるかを決定できる。言い換えれば、決定されたショットイベントに基づいて、フレームを適応的にエンコードできる。ショット検出は、エンコーディング品質を向上させるのに役に立つだけでなく、ビデオコンテンツのサーチおよびインデックス付けを識別する際の支援となることもある。シーン検出プロセスの1つの観点を以下で記述する。
図4は、GOP上で動作し、ビデオフレーム中のショット検出に基づいて、ビデオをエンコードするための、いくつかの観点において使用できるプロセス40を図示する。ここでプロセス40の一部分(すなわちサブプロセス)は、図5−10に関連して、記述および図示されている。エンコーディングコンポーネント22(図2)またはプロセッサ31は、プロセス40を組み込むように構成できる。プロセス40が開始した後、プロセス40はブロック42に進み、ここでは、メトリック(情報)がビデオフレームに対して取得され、メトリックは、近接したフレーム間の差を示す情報を含んでいる。近接したフレーム間で生じた変化を後に決定することになる、双方向の動き情報と輝度ベースの情報をメトリックは含み、ショット分類のためにそれらの情報を使用できる。このようなメトリックは、別のデバイスまたはプロセスから取得でき、あるいは、例えば、エンコーディングコンポーネント22またはプロセッサ31により計算できる。メトリック生成の例示的な例を、図5中のプロセスAおよび式1−10に関連して記述する。
プロセス40は次にブロック44に進み、ここでは、ビデオ中のショット変化が、メトリックに基づいて決定される。どのようなタイプのショットがフレーム中に含まれているかに関する2つ以上のカテゴリ、例えば、急なシーン変化、ゆっくりと変化しているシーン、または高輝度値(カメラのフラッシュ)を含んでいるシーンに、ビデオフレームを分類できる。ある実施のエンコーディングは、他のカテゴリを必要とするかもしれない。ショット分類の例示的な例は、図6中のプロセスBに関連して記述し、それぞれ図8−10中のプロセスD、EおよびFに関連してより詳細に記述する。
いったんフレームが分類されると、プロセス40はブロック46に進み、ここでは、ショット分類の結果を使用して、フレームは、エンコードすることができ、またはエンコードするために指定できる。このようなショット分類の結果は、イントラコード化されるフレームまたは予測フレーム(例えば、PフレームまたはBフレーム)によりフレームをエンコードするかどうかに影響を与えることができる。図7中のプロセスCは、ショット結果を使用するエンコーディングスキームの例を示す。
図5は、ビデオのメトリックを取得するプロセスの例を図示する。図5は、図4のブロック42中で生じる、いくつかのステップを図示する。さらに図5を参照すると、ブロック52において、プロセスAは、ビデオの、双方向の動き推定および補償情報を取得または決定する。フレームに関して、双方向の動き推定を実行し、後のショット分類のために使用できる動き補償情報を決定するように、図2および3の動き補償器23を構成できる。プロセスAは次にブロック54に進み、ここでは、プロセスAは、現在のすなわち選択されたフレームと、1つ以上の近接したフレームとに対して、輝度差のヒストグラムを含む輝度情報を発生させる。最後に、プロセスAはブロック56に続き、ここでは、フレーム中に含まれるショットを示すメトリックが計算される。1つのこのようなメトリックは、式4および10中の2つの例において示されるフレーム差のメトリックである。動き情報、輝度情報およびフレーム差のメトリックを決定する例示的な例を、以下で記述する。
動き補償
双方向の動き推定/補償を実行するために、現在のフレームのすべての8x8ブロックを、最も近接した隣接するフレームの、1つは過去におけるものであり、1つは未来におけるものである2つのフレーム中のブロックに整合させる双方向の動き補償器により、ビデオシーケンスを前処理できる。動き補償器は、すべてのブロックに対して動きベクトルと差のメトリックとを生成する。図11は、この概念を図示し、現在のフレームCの画素を過去のフレームPと未来の(すなわち次の)フレームNとに整合させる例を示しており、整合された画素に対する動きベクトル、過去の動きベクトルMVPおよび未来の動きベクトルMVNを描写する。双方向の動きベクトルの生成と、関連するエンコーディングとの例示的な観点の簡潔な説明を以下で続ける。
双方向の動き推定/補償を実行するために、現在のフレームのすべての8x8ブロックを、最も近接した隣接するフレームの、1つは過去におけるものであり、1つは未来におけるものである2つのフレーム中のブロックに整合させる双方向の動き補償器により、ビデオシーケンスを前処理できる。動き補償器は、すべてのブロックに対して動きベクトルと差のメトリックとを生成する。図11は、この概念を図示し、現在のフレームCの画素を過去のフレームPと未来の(すなわち次の)フレームNとに整合させる例を示しており、整合された画素に対する動きベクトル、過去の動きベクトルMVPおよび未来の動きベクトルMVNを描写する。双方向の動きベクトルの生成と、関連するエンコーディングとの例示的な観点の簡潔な説明を以下で続ける。
図13は、例えば、MPEG−4における動きベクトル決定プロセスおよび予測フレームエンコーディングの例を図示する。図13中で記述したプロセスは、図5のブロック52中で生じることができる例示的なプロセスのより詳細な説明図である。図13において、現在のピクチャ134は、5x5のマクロブロックから構成されており、この例におけるマクロブロックの数は任意である。マクロブロックは、16x16の画素から構成されている。8ビットの輝度値(Y)と2つの8ビットのクロミナンス値(CrおよびCb)により、画素を規定できる。
MPEGにおいては、Y、CrおよびCb成分は、4:2:0フォーマットで記憶でき、ここでCrおよびCb成分は、XおよびY方向において2だけダウンサンプリングされている。したがって、それぞれのマクロブロックは、256のY成分、64のCr成分および64のCb成分からなる。現在のピクチャ134のマクロブロック136は、現在のピクチャ134とは異なる時点における参照ピクチャ132から予測される。サーチは参照ピクチャ132において実行され、Y、CrおよびCb値の観点から、エンコードされている現在のマクロブロック136に最も近い、最も整合するマクロブロック138の位置を突きとめる。参照ピクチャ132中の最も整合するマクロブロック138の位置は、動きベクトル140でエンコードされる。参照ピクチャ132は、デコーダが、現在のピクチャ134の構成の前に再構成することになるIフレームまたはPフレームとすることができる。最も整合するマクロブロック138が、現在のマクロブロック136から減算され(Y、CrおよびCb成分のそれぞれに対する差が計算される)、残余エラー142を結果として生じる。残余エラー142は、2D離散コサイン変換(DCT)144によりエンコードされ、次に量子化146される。量子化146を実行して、例えば、高い周波数係数に対してより少ないビットを割り当てる一方で、低い周波数係数に対してより多いビットを割り当てることにより、空間圧縮を提供できる。情報を識別する動きベクトル140および参照ピクチャ134に加えて、残余エラー142の量子化された係数は、現在のマクロブロック136を表すエンコードされた情報である。エンコードされた情報は、今後の使用のためにメモリ中に記憶させることができ、あるいは、例えば、エラー訂正または画像画質向上のために操作でき、あるいはネットワーク4を通して送信できる。
後の動き推定および補償のための参照フレームの一部として使用するために、エンコードされた動きベクトル140に加えて、残余エラー142のエンコードされ、量子化された係数を使用して、エンコーダにおいて現在のマクロブロック136を再構成できる。エンコーダは、このPフレームの再構成のために、デコーダの手続きをエミュレートすることができる。デコーダのエミュレーションは、エンコーダとデコーダが同一の参照ピクチャにより動作することになる。さらなるインターコーディングのために、エンコーダ中で実施されようと、またはデコーダ中で実施されようと、再構成プロセスがここで与えられる。参照フレーム(または参照されているピクチャまたはフレームの一部)が再構成された後に、Pフレームの再構成を開始できる。エンコードされ、量子化された係数は、逆量子化150され、次に、2D逆DCTすなわちIDCT152が実行され、デコードされた、または再構成された残余エラー154を結果として生じる。エンコードされた動きベクトル140はデコードされて、すでに再構成された参照ピクチャ132中の、すでに再構成された最も整合するマクロブロック156の位置を突きとめるために使用される。再構成された残余エラー154は、再構成された最も整合するマクロブロック156に加算されて、再構成されたマクロブロック158を形成する。再構成されたマクロブロック158は、メモリ中に記憶し、単独で、または他の再構成されたマクロブロックとともにピクチャ中で表示し、あるいは、画像画質向上のためにさらに処理することができる。
Bフレーム(または双方向の予測によりコード化された何らかのセクション)を使用するエンコーディングは、現在のピクチャ中の領域と、前のピクチャ中の最も整合する予測領域および後のピクチャ中の最も整合する予測領域との間の時間冗長を使用できる。後の最も整合する予測領域と前の最も整合する予測領域は結合されて、結合された双方向の予測領域を形成する。現在のピクチャ領域と、最も整合する結合された双方向の予測領域との差は、残余エラー(すなわち予測エラー)である。後の参照ピクチャ中の最も整合する予測領域および前の参照ピクチャ中の最も整合する予測領域の位置は、2つの動きベクトルでエンコードできる。
輝度ヒストグラム差
1つの観点において、動き補償器は、すべてのブロックに対して差のメトリックを生成できる。差のメトリックは、あるフレーム中のブロックと、時間的に近接した前のフレームおよび時間的に近接した次のフレーム中の対応するブロックとの間の輝度差に基づいている。差のメトリックは、例えば、平方差の総和(SSD)または絶対差の総和(SAD)を含むことができる。一般性を失うことなく、ここではSADを例示的な例として使用する。
1つの観点において、動き補償器は、すべてのブロックに対して差のメトリックを生成できる。差のメトリックは、あるフレーム中のブロックと、時間的に近接した前のフレームおよび時間的に近接した次のフレーム中の対応するブロックとの間の輝度差に基づいている。差のメトリックは、例えば、平方差の総和(SSD)または絶対差の総和(SAD)を含むことができる。一般性を失うことなく、ここではSADを例示的な例として使用する。
ここでSADPおよびSADNは、それぞれ、選択されたフレームに対して、前方向および後方向の差のメトリックの絶対差の総和である。“ゼロによる除算”エラーを防ぐために、分母は、小さい正の数εを含むことに注目すべきである。分母中のまとまりの影響との均衡をとるために、分子も値εを含む。例えば、前のフレーム、現在のフレームおよび次のフレームがまったく同じである場合、動きサーチは、SADP=SADN=0を生じるはずである。このケースにおいて、上述の計算は、0または無限大の代わりに、γ=1を生成する。
輝度ヒストグラムは、すべてのフレームに対して計算できる。一般に、マルチメディア画像は、8ビットの輝度の深さ(例えば、“ビンズ”の数)を有する。いくつかの観点にしたがって、輝度ヒストグラムを計算するために使用される輝度の深さを16に設定して、ヒストグラムを取得できる。他の観点において、輝度の深さは、処理されているデータのタイプ、利用できる計算能力、または他の予め定められた基準に依存するかもしれない適切な数に設定できる。いくつかの観点において、データのコンテンツのような、計算されたまたは受信されたメトリックに基づいて、輝度の深さをダイナミックに設定できる。
ここで、NPiは、前のフレームに対するi番目のビンにおけるブロックの数であり、NCiは、現在のフレームに対するi番目のビンにおけるブロックの数であり、Nは、フレーム中のブロックの総数である。前および現在のフレームの輝度ヒストグラムの差が完全に異なる(すなわち、ばらばらである)場合、λ=2である。
である。
図6は、ビデオに対して、取得された、または決定されたメトリックを使用して、ショット(すなわちシーン)変化の3つのカテゴリを決定するプロセスBの例を図示する。図6は、図4のブロック44の1つの観点において生じる、いくつかのステップを図示する。再度図6を参照すると、ブロック62において、フレームが、急なシーン変化であると指定されるための、いくつかの条件または1つ以上の基準を満たすかどうかをプロセスBは最初に決定する。図8中のプロセスDは、この決定の例を図示する。プロセスBは次にブロック64に進み、ここでは、プロセスBは、フレームがゆっくりと変化しているシーンの一部であるかを決定する。図9中のプロセスCは、ゆっくりと変化しているシーンを決定する例を図示する。最後に、ブロック66において、フレームが、カメラのフラッシュ、言い換えれば、前のフレームとは異なっている大きな輝度値を含んでいるかどうかをプロセスBは決定する。図10中のプロセスFは、カメラのフラッシュを含んでいるフレームを決定する例を図示する。これらのプロセスの例示的な例を以下で記述する。
急なシーン変化
図8は、急なシーン変化を決定するプロセスを図示するフロー図である。図8は、図6のブロック62のいくつかの観点において生じることがある、いくつかのステップをさらに詳しく述べる。ブロック82において、フレーム差のメトリックDが、式4中で示される基準を満たす場合、
図8は、急なシーン変化を決定するプロセスを図示するフロー図である。図8は、図6のブロック62のいくつかの観点において生じることがある、いくつかのステップをさらに詳しく述べる。ブロック82において、フレーム差のメトリックDが、式4中で示される基準を満たす場合、
ここでAは、アプリケーションにより選ばれる定数であり、T1は、しきい値(例えば、しきい基準)である。しきい値が満たされる場合、ブロック84において、プロセスDは、フレームを急なシーン変化として指定し、この例において、さらなるショット分類を必要としなくてもよい。
1つの例において、A=1、かつ、T1=5に設定すると、良い検出性能を達成することをシミュレーションは示す。現在のフレームが、急なシーン変化のフレームである場合、γcは大きくなるはずであり、γpは小さくなるはずである。単独のγcの代わりに、比
を使用でき、それによりメトリックは、情況の活動レベルに標準化される。
輝度ヒストグラムの差ラムダ(λ)が、非線形的な方法で式4中で使用されていることに注目すべきである。図12は、λ*(2λ+1)が凸関数であることを図示する。ラムダ(λ)が小さい(例えば、ゼロに近い)とき、λ*(2λ+1)の寄与は、比較的小さい。しかしながら、λがより大きくなるとき、関数λ*(2λ+1)は、増加した重みを有する。1.4より大きい任意のラムダ(λ)に対して、しきい値T1が5に設定される場合、急なシーン変化が検出される。
クロスフェイディングおよび遅いシーン変化
図9は、図6のブロック64中で生じることがある、いくつかの観点のさらなる詳細を図示する。図9を参照すると、ブロック92において、フレームが、遅いシーン変化を描写している一連のフレームの一部であるかどうかをプロセスEは決定する。フレーム差のメトリックDが、式5中で示した、第1のしきい値T1より小さく、かつ、第2のしきい値T2より大きいかまたは等しい場合、現在のフレームがクロスフェイディングまたは他の遅いシーン変化であることをプロセスEは決定する。
図9は、図6のブロック64中で生じることがある、いくつかの観点のさらなる詳細を図示する。図9を参照すると、ブロック92において、フレームが、遅いシーン変化を描写している一連のフレームの一部であるかどうかをプロセスEは決定する。フレーム差のメトリックDが、式5中で示した、第1のしきい値T1より小さく、かつ、第2のしきい値T2より大きいかまたは等しい場合、現在のフレームがクロスフェイディングまたは他の遅いシーン変化であることをプロセスEは決定する。
ある数の連続的なフレームに対して、T1は、式4中で使用されるのと同じしきい値であり、T2は、別のしきい値である。一般的に、実施における可能性ある差のため、基準T1およびT2は、通常の実験またはシミュレーションにより決定される。式5における基準が満たされる場合、ブロック94において、プロセスEは、フレームを、ゆっくり変化しているシーンの一部として分類する。フレームのさらなる分類を必要としなくてもよく、選択されたフレームに対するショット分類は終了する。
カメラフラッシュライトイベント
図10中で示したプロセスFは、現在のフレームがカメラのフラッシュライトを含んでいるかどうかを決定できるプロセスの例である。この例示的な観点のカメラにおいて、輝度ヒストグラムの統計量を使用して、現在のフレームがカメラのフラッシュライトを含んでいるかどうかを決定する。ブロック102において示したように、現在のフレームの輝度が、前のフレームの輝度および次のフレームの輝度より大きいかどうかを最初に決定することにより、プロセスFは、カメラのフラッシュのイベントが、選択されたフレーム中にあるかどうかを決定する。そうでない場合、フレームは、カメラのフラッシュのイベントではないが、そうである場合、フレームは、カメラのフラッシュのイベントであるかもしれない。ブロック104において、後方向の差のメトリックが、あるしきい値より大きいかまたは等しいかどうかを、そして、前方向の差のメトリックが、しきい値より大きいかまたは等しいかどうかをプロセスFは決定し、これらの条件の両方が満たされる場合、ブロック106において、プロセスFは、現在のフレームを、カメラのフラッシュライトを有するものとして分類する。
図10中で示したプロセスFは、現在のフレームがカメラのフラッシュライトを含んでいるかどうかを決定できるプロセスの例である。この例示的な観点のカメラにおいて、輝度ヒストグラムの統計量を使用して、現在のフレームがカメラのフラッシュライトを含んでいるかどうかを決定する。ブロック102において示したように、現在のフレームの輝度が、前のフレームの輝度および次のフレームの輝度より大きいかどうかを最初に決定することにより、プロセスFは、カメラのフラッシュのイベントが、選択されたフレーム中にあるかどうかを決定する。そうでない場合、フレームは、カメラのフラッシュのイベントではないが、そうである場合、フレームは、カメラのフラッシュのイベントであるかもしれない。ブロック104において、後方向の差のメトリックが、あるしきい値より大きいかまたは等しいかどうかを、そして、前方向の差のメトリックが、しきい値より大きいかまたは等しいかどうかをプロセスFは決定し、これらの条件の両方が満たされる場合、ブロック106において、プロセスFは、現在のフレームを、カメラのフラッシュライトを有するものとして分類する。
1つの例示的な例において、式6および7中で示したように、ブロック102において、プロセスFは、前のフレームの平均輝度を引いた、現在のフレームの平均輝度が、しきい値T3に等しいかまたは超えているかどうかを決定し、そして、プロセスFは、次のフレームの平均輝度を引いた、現在のフレームの平均輝度が、しきい値T3より大きいかまたは等しいかどうかも決定する。
式6および7の基準が満たされない場合、現在のフレームは、カメラのフラッシュライトを含むものとして分類されず、プロセスFは戻る。式6および7中で示した基準が満たされる場合、プロセスFはブロック104に進み、ここでは、プロセスFは、後方向の差のメトリックSADPおよび前方向の差のメトリックSADNが、以下の式8および9中で示したような、あるしきい値T4より大きいか、または等しいかどうかを決定する。
は、次のフレームの平均輝度であり、SADPおよびSADNは、それぞれ、現在のフレームに関係付けられた、前方向および後方向の差のメトリックである。式8および9中で示した基準が満たされない場合、プロセスFは戻り、基準が満たされる場合、ショットイベントは、フレームが少なくとも1つのカメラのフラッシュライトを含んでいることを示す。
記述したプロセスの実施は、しきい値を含む動作パラメータの差となるので、しきい値T3の値は一般的に、通常の実験により決定される。SAD値が決定に含まれる。その理由は、カメラのフラッシュは一般的に、1フレームだけをとり、そして輝度差のために、前方向および後方向の両方からの動き補償を使用して、このフレームを十分予測できないからである。
いくつかの観点において、しきい値T1、T2、T3およびT4のうちの1つ以上が、予め定められ、このような値は、エンコーディングデバイス中のショット分類器に組み込まれる。一般的に、これらのしきい値は、ショット検出の特定の実施の試験を通して選択される。いくつかの観点において、しきい値T1、T2、T3およびT4のうちの1つ以上は、ショット分類器に供給された情報(例えば、メタデータ)を使用することに基づいた、またはショット分類器そのものにより計算された情報に基づいた処理の間に(例えば、ダイナミックに)設定できる。
図7を参照すると、図7は、選択されたフレームのショット分類に基づいて、ビデオに対するエンコーディングパラメータを決定するための、またはビデオをエンコードするためのプロセスCを示す。ブロック70において、プロセスCは、選択されたフレームが、急なシーン変化として分類されたかどうかを決定する。そうである場合、ブロック71において、現在のフレームは、急なシーン変化として分類され、フレームは、Iフレームとしてエンコードでき、GOPの境界を決定できる。そうでない場合、プロセスCは、ブロック72に進み、現在のフレームが、ゆっくりと変化しているシーンの一部として分類される場合、ブロック73において、現在のフレームおよびゆっくりと変化しているシーン中の他のフレームは、予測フレーム(例えば、PフレームまたはBフレーム)としてエンコードできる。プロセスCは次にブロック74に進み、ここでは、プロセスCは、現在のフレームが、1つ以上のカメラのフラッシュ(フラッシュライト)を含んでいるシーンとして分類されたかどうかをチェックする。そうである場合、ブロック75において、フレームは、特別な処理に対するものとして識別できる。特別な処理は、例えば、選択されたフレームの除去、近接したフレームの複製および選択されたフレームに対する代用(例えば、前または後のフレーム)、またはフレームに対して特定の係数をエンコードすることを含むことができる。フレームが、1つ以上のカメラのフラッシュを含んでいるものとして分類されなかった場合、選択されたフレームに対して、特定のショットイベントが決定されず、選択されたフレームは、他の1つ以上の基準にしたがってエンコードでき、Iフレームとしてエンコードでき、または選択されたフレームがエンコードされないように、スキップ(例えば、ドロップ)できる。エンコーダ25(例えば、図2)またはプロセッサ31(例えば、図3におけるプロセッサ31中のエンコーダ34において)中で、プロセスCは実現できる。
上述した観点において、圧縮すべきフレームと、それに近接した2つのフレームとの間の差の量は、フレーム差のメトリックDにより示されている。著しい量の単調な輝度変化が検出される場合、それは、フレーム中のクロスフェイド効果を意味する。クロスフェイドが顕著になればなるほど、Bフレームを使用することにより、より大きい利得が達成されるかもしれない。いくつかの観点において、以下の式10中で示すように、修正されたフレーム差のメトリックが使用される。
は、それぞれ、現在のフレームと前のフレームとの間の輝度差、および現在のフレームと次のフレームとの間の輝度差であり、Δは、実施に依存できるので、通常の実験中で決定できる定数を表し、αは、0と1との間の値を有する重み変数である。
ルーマシフトの不変の傾向が観察され、シフト強度が十分大きい場合、修正されたフレーム差のメトリックD1は、オリジナルのフレーム差のメトリックDとわずかに異なる。D1は、Dと等しいかまたは小さい。ルーマの変化が安定(dP=dN)している場合、修正されたフレーム差のメトリックD1は、(1−α)の最も低い比率だけ、オリジナルのフレーム差のメトリックDよりも小さい。
以下の表1は、急なシーン変化検出を追加することによる性能の改善を示す。非シーン変化(NSC)とシーン変化(SC)との両方のケースにおけるIフレームの総数は、およそ同一である。NSCのケースにおいては、Iフレームは、全体のシーケンスの間に均一に配置されるが、一方、SCのケースにおいては、Iフレームは、急なシーン変化のフレームに割り当てられるだけである。
一般的に、PSNRに関して、0.2〜0.3dBの向上を達成できると見ることができる。シミュレーションの結果は、ショット検出器が、上述したショットイベントを決定することにおいて、非常に正確であることを示す。通常のクロスフェイド効果を有する5つのクリップのシミュレーションは、Δ=5.5およびα=0.4において、0.226031dBのPSNRの利得が、同じビットレートで達成されることを示す。
フローチャート、フロー図、構造図またはブロック図として描写されるプロセスとして、ここで記述したショット検出およびエンコーディングの観点を記述してもよいことが注目される。図中で示したフローチャートは、シーケンシャルなプロセスとして動作を記述してもよいが、動作の多くは、並行して、または同時に実行できる。さらに、動作の順序を並べ換えてもよい。プロセスは、その動作が完了するときに終了する。プロセスは、方法、関数、手続き、サブルーチン、サブプログラム等に対応してもよい。プロセスが関数に対応するとき、その終了は、呼び出している関数または主関数に対する関数の戻りに対応する。
ここで開示したデバイスの1つ以上の要素を、デバイスの動作に影響を与えることなく並べ換えてもよいことも当業者に明らかなはずである。同様に、ここで開示したデバイスの1つ以上の要素を、デバイスの動作に影響を与えることなく組み合わせてもよい。さまざまな異なる技術および技法のいくつかを使用して、情報およびマルチメディアデータを表してもよいことを当業者は理解するだろう。電子ハードウェア、ファームウェア、コンピュータソフトウェア、ミドルウェア、マイクロコードまたはこれらの組み合わせとして、ここで開示した例に関して記述したさまざまな実例となる論理ブロック、モジュール、およびアルゴリズムステップを実現してもよいことを、当業者はさらに理解するであろう。ハードウェアおよびソフトウェアのこの互換性を明瞭に図示するために、さまざまな実例となるコンポーネント、ブロック、モジュール、回路、およびステップをそれらの機能の点から一般的に上述した。このような機能がハードウェアまたはソフトウェアとして実現されるかどうかは、特定の用途およびシステム全体に課される設計制約によって決まる。それぞれの特定の用途に対してさまざまな方法で、当業者は記述した機能を実現するかもしれないが、このような実現決定は、開示した方法の範囲から逸脱を生じさせるものとして解釈すべきではない。
例えば、ここで開示したショット検出およびエンコーディングの、例および図に関して記述した方法またはアルゴリズムのステップを、ハードウェア中で直接、プロセッサにより実行されるソフトウェアモジュール中で、またはその2つの組み合わせ中で具体化してもよい。方法およびアルゴリズムは、セル電話機、コンピュータ、ラップトップコンピュータ、PDAならびに、あらゆるタイプの個人およびビジネスの通信デバイスに対するビデオのワイヤレス送信を含む通信技術に特に応用できる。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバルディスク、CD−ROM、または技術的に知られている他の任意の形態の記憶媒体中に存在してもよい。プロセッサが記憶媒体から情報を読み取ることができ、記憶媒体に情報を書き込むことができるように、例示的な記憶媒体はプロセッサに結合されている。代替では、記憶媒体はプロセッサと一体化されていてもよい。プロセッサおよび記憶媒体は、特定用途向け集積回路(ASIC)中に存在してもよい。ASICはワイヤレスモデム中に存在してもよい。代替では、プロセッサおよび記憶媒体は、ワイヤレスモデム中にディスクリートコンポーネントとして存在してもよい。
さらに、汎用目的のプロセッサ、デジタル信号プロセッサ(DSP)、特定用途向け集積回路(ASIC)、フィールドプログラム可能ゲートアレイ(FPGA)または他のプログラム可能論理デバイス、ディスクリートゲートまたはトランジスタ論理、ディスクリートハードウェアコンポーネント、あるいはここで記述した機能を実行するために設計された、これらの任意の組み合わせにより、ここで開示した例に関して記述した、さまざまな実例となる論理ブロック、コンポーネント、モジュールおよび回路を実現または実行してもよい。汎用目的のプロセッサはマイクロプロセッサでもよいが、代わりに、プロセッサは任意の従来のプロセッサ、制御装置、マイクロ制御装置、または状態遷移機械であってもよい。計算デバイスの組み合わせ、例えば、DSPとマイクロプロセッサとの組み合わせ、複数のマイクロプロセッサ、DSPコアに関連した1つ以上のマイクロプロセッサ、または他の任意のこのような構成として、プロセッサを実現してもよい。
いかなる当業者であっても開示した方法および装置を作りまたは使用できるように、開示した例の記述をこれまでに提供している。これらの例に対してさまざまな修正が当業者に容易に明らかになり、開示した方法および装置の精神または範囲から逸脱することなく、ここで規定した原理を、追加されるかもしれない他の例および追加的な要素に適用してもよい。観点の記述は、例示的であり、かつ、特許請求の範囲を限定しないように向けられている。
Claims (38)
- マルチメディアデータを処理する方法において、
前記方法は、
複数のビデオフレーム中の、選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得することと、
前記少なくとも1つのメトリックに基づいて、前記選択されたフレームに関係付けられたショットイベントを決定することと、
前記ショットイベントに基づいて、前記選択されたフレームを適応的にエンコードすることとを含み、
前記少なくとも1つのメトリックは、前記選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む方法。 - 少なくとも1つのメトリックを取得することは、前記少なくとも1つのメトリックを計算することを含む請求項1記載の方法。
- 前記ショットイベントは、前記選択されたフレームが、急なシーン変化であることを示し、適応的にエンコードすることは、前記選択されたフレームをIフレームとしてエンコードすることを含む請求項1記載の方法。
- 前記ショットイベントは、前記選択されたフレームが、遅いシーン変化を含んでいる複数のフレームの一部であることを示し、適応的にエンコードすることは、前記選択されたフレームを、PフレームまたはBフレームのいずれかとしてエンコードすることを含む請求項1記載の方法。
- 前記ショットイベントは、前記選択されたフレームが、少なくとも1つのカメラのフラッシュライトを含むことを示し、適応的にエンコードすることは、前記選択されたフレームを、特別な処理を必要とするものとして識別し、エンコードすることを含む請求項1記載の方法。
- 前記特別な処理は、前記選択されたフレームがエンコードされないように、前記選択されたフレームをスキップすることを含む請求項5記載の方法。
- 前記特別な処理は、前記選択されたフレームに時間的に近接したフレームを複製することと、前記複製されたフレームを前記選択されたフレームの代わりに用いることとを含む請求項5記載の方法。
- 前記ショットイベントは、前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部、または少なくとも1つのカメラのフラッシュライトを含んでいることを示す請求項1記載の方法。
- 前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部、または少なくとも1つのカメラのフラッシュライトを含むことを前記ショットイベントが示さない場合、適応的にエンコードすることは、前記選択されたフレームをIフレームとしてエンコードすることを含む請求項1記載の方法。
- 前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部、または少なくとも1つのカメラのフラッシュライトを含むことを前記ショットイベントが示さない場合、適応的にエンコードすることは、前記選択されたフレームをドロップすることを含む請求項1記載の方法。
- 前記少なくとも1つのメトリックは、フレーム差のメトリックを含み、ショットイベントを決定することは、前記フレーム差のメットリックが、第1のしきい値T1より大きい場合に、前記選択されたフレームが、急なシーンであると決定することを含む請求項1記載の方法。
- 前記選択されたフレームに対する前記フレーム差のメトリックは、第1の差のメトリックと、第2の差のメトリックとの比に基づいており、前記第1の差のメトリックは、前記選択されたフレームと前の時間的に近接したフレームとの間の差と、前記選択されたフレームと次の時間的に近接したフレームとの間の差との比を含み、前記第2の差のメトリックは、前記前のフレームとそれに時間的に近接した前のフレームとの間の差と、前記前のフレームと前記選択されたフレームとの間の差との比を含む請求項11記載の方法。
- 前記選択されたフレームに対する前記フレーム差のメトリックは、γCとγPとの比を含み、ここでγCは、前記現在の選択されたフレームに対する、前方向と後方向との、差のメトリックの比であり、γPは、前記現在の選択されたフレームに対して、時間的に近接した前のフレームに対する、前方向と後方向との、差のメトリックの比である請求項11記載の方法。
- 前記フレーム差のメトリックは、前記選択されたフレームに対して時間的に前のフレームと、前記選択されたフレームとに関係付けられた輝度ヒストグラムの差に基づいている請求項11記載の方法。
- 前記選択されたフレームが、急なシーン変化であると決定されず、かつ、前記選択されたフレームと、近接したフレームとの間の差が、前記第1のしきい値T1より小さく、かつ、第2のしきい値T2より大きいかまたは等しいことを前記フレーム差のメトリックが示す場合、ショットイベントを決定することは、前記選択されたフレームが遅いシーン変化の一部であると決定することを含む請求項11記載の方法。
- 前記ショットイベントを決定することは、
前記選択されたフレームと、前記選択されたフレームに時間的に近接した前のフレームと、前記選択されたフレームに時間的に近接した次のフレームとの平均輝度を決定することと、
前記選択されたフレームが、急なフレームまたは遅い変化のフレームであると決定されず、前記選択されたフレームに時間的に近接した前のフレームの平均輝度を引いた、前記選択されたフレームの平均輝度が、第3のしきい値T3に等しいかまたは超え、前記選択されたフレームに時間的に近接した次のフレームの平均輝度を引いた、前記選択されたフレームの平均輝度が、第3のしきい値T3に等しいかまたは超え、前記選択されたフレームに関係付けられた、前方向の差のメトリックおよび後方向の差のメトリックが、両方とも、第4のしきい値T4に等しいかまたは超える場合、前記選択されたフレームが少なくとも1つのカメラのフラッシュライトを含んでいると決定することとを含む請求項15記載の方法。 - 前記ショットイベントを決定することは、少なくとも1つのしきい値に対して、前記選択されたフレームの輝度差情報を評価することを含む請求項1記載の方法。
- 前記ショットイベントは、3つ以上のショットタイプに分類される請求項1記載の方法。
- 少なくとも1つのメトリックを取得することは、双方向の動き補償を実行して、双方向の動き情報を発生させることを含み、前記双方向の動き情報と輝度差情報は、前記双方向の動き補償に基づいて、前記選択されたフレームに対して決定される請求項1記載の方法。
- ショットイベントを決定することは、複数のしきい値に対して、前記少なくとも1つのメトリックを評価することを含む請求項1記載の方法。
- マルチメディアデータを処理する装置において、
複数のビデオフレーム中の、選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得するように構成された動き補償器と、
前記少なくとも1つのメトリックに基づいて、前記選択されたフレームに関係付けられたショットイベントを決定するように構成されたショット分類器と、
前記ショットイベントに基づいて、前記選択されたフレームを適応的にエンコードするように構成されたエンコーダとを具備し、
前記少なくとも1つのメトリックは、双方向の動き情報と輝度情報とを含む装置。 - マルチメディアデータを処理する装置において、
複数のビデオフレーム中の、選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得する手段と、
前記少なくとも1つのメトリックに基づいて、前記選択されたフレームに関係付けられたショットイベントを決定する手段と、
前記ショットイベントに基づいて、前記選択されたフレームを適応的にエンコードする手段とを具備し、
前記少なくとも1つのメトリックは、前記選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む装置。 - 前記ショットイベントは、前記選択されたフレームが、急なシーン変化であることを示し、前記適応的にエンコードする手段は、前記選択されたフレームをIフレームとしてエンコードする手段を備える請求項22記載の装置。
- 前記ショットイベントは、前記選択されたフレームが、遅いシーン変化を含んでいる複数のフレームの一部であることを示し、前記適応的にエンコードする手段は、前記選択されたフレームを、PフレームまたはBフレームのいずれかとしてエンコードする手段を備える請求項22記載の装置。
- 前記ショットイベントは、前記選択されたフレームが、少なくとも1つのカメラのフラッシュライトを含むことを示し、前記適応的にエンコードする手段は、前記選択されたフレームを、特別な処理を必要とするものとして識別する手段を備える請求項22記載の装置。
- 前記特別な処理は、前記選択されたフレームがエンコードされないように、前記選択されたフレームをスキップまたはドロップすることを含む請求項22記載の装置。
- 前記特別な処理は、前記選択されたフレームに時間的に近接したフレームを複製し、前記複製されたフレームを前記選択されたフレームの代わりに用いる手段を含む請求項26記載の装置。
- 前記ショットイベントは、前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部を含み、または少なくとも1つのカメラのフラッシュライトを含んでいることを示す請求項22記載の装置。
- 前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部、または少なくとも1つのカメラのフラッシュライトを含むことを前記ショットイベントが示さない場合、前記適応的にエンコードする手段は、前記選択されたフレームをIフレームとしてエンコードする手段を備える請求項22記載の装置。
- 前記選択されたフレームが、急なシーン変化、遅いシーン変化の一部、または少なくとも1つのカメラのフラッシュライトを含むことを前記ショットイベントが示さない場合、適応的にエンコードする手段は、前記選択されたフレームをドロップすることを含む請求項22記載の装置。
- 前記少なくとも1つのメトリックは、フレーム差のメトリックを含み、前記ショットイベントを決定する手段は、前記フレーム差のメットリックが、第1のしきい値T1より大きい場合に、前記選択されたフレームが、急なシーンであると決定する手段を備える請求項22記載の装置。
- 前記選択されたフレームに対する前記フレーム差のメトリックは、第1の差のメトリックと、第2の差のメトリックとの比に基づいており、前記第1の差のメトリックは、前記選択されたフレームと前の時間的に近接したフレームとの間の差と、前記選択されたフレームと次の時間的に近接したフレームとの間の差との比を含み、前記第2の差のメトリックは、前記前のフレームとそれに時間的に近接した前のフレームとの間の差と、前記前のフレームと前記選択されたフレームとの間の差との比を含む請求項31記載の装置。
- 前記選択されたフレームに対する前記フレーム差のメトリックは、γCとγPとの比を含み、ここでγCは、前記現在の選択されたフレームに対する、前方向と後方向との、差のメトリックの比であり、γPは、前記選択されたフレームに対して、時間的に近接した前のフレームに対する、前方向と後方向との、差のメトリックの比である請求項31記載の装置。
- 前記フレーム差のメトリックは、前記選択されたフレームに対して時間的に前の近接したフレームと、前記選択されたフレームとに関係付けられた輝度ヒストグラムの差に基づいている請求項31記載の装置。
- 前記選択されたフレームが、急なシーン変化として分類されず、かつ、前記選択されたフレームと、近接したフレームとの間の差が、前記第1のしきい値T1より小さく、かつ、第2のしきい値T2より大きいかまたは等しいことを前記フレーム差のメトリックが示す場合、前記ショットイベントを決定する手段は、前記選択されたフレームを遅いシーン変化として分類する手段を備える請求項31記載の装置。
- ショットイベントを決定する手段は、
前記選択されたフレームと、時間的に近接した前のフレームと、時間的に近接した次のフレームとの平均輝度を決定する手段と、
前記選択されたフレームが、急なフレームまたは遅い変化のフレームであると決定されず、前記選択されたフレームに時間的に近接した前のフレームの平均輝度を引いた、前記選択されたフレームの平均輝度が、第3のしきい値T3に等しいかまたは超え、前記選択されたフレームに時間的に近接した次のフレームの平均輝度を引いた、前記選択されたフレームの平均輝度が、第3のしきい値T3に等しいかまたは超え、前記選択されたフレームに関係付けられた、前方向の差のメトリックおよび後方向の差のメトリックが、両方とも、第4のしきい値T4に等しいかまたは超える場合、前記選択されたフレームをカメラのフラッシュのシーンとして分類する手段とを備える請求項35記載の装置。 - マルチメディアデータを処理する命令を含む機械読み取り可能媒体において、
前記命令は、実行時に、
複数のビデオフレーム中の、選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得することと、
前記少なくとも1つのメトリックに基づいて、前記選択されたフレームに関係付けられたショットイベントを決定することと、
前記ショットイベントに基づいて、前記選択されたフレームを適応的にエンコードすることとを機械に行わせ、
前記少なくとも1つのメトリックは、前記選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含む機械読み取り可能媒体。 - マルチメディアデータを処理するプロセッサにおいて、
前記プロセッサは、
複数のビデオフレーム中の、選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとの間の差を示す少なくとも1つのメトリックを取得し、
前記少なくとも1つのメトリックに基づいて、前記選択されたフレームに関係付けられたショットイベントを決定し、
前記ショットイベントに基づいて、前記選択されたフレームを適応的にエンコードする構成を具備し、
前記少なくとも1つのメトリックは、前記選択されたフレームと、前記選択されたフレームに時間的に近接したフレームとに関係付けられた、双方向の動き情報と輝度差情報とを含むプロセッサ。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US72764405P | 2005-10-17 | 2005-10-17 | |
PCT/US2006/040712 WO2007047758A1 (en) | 2005-10-17 | 2006-10-17 | Method and apparatus for shot detection in video streaming |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2009512400A true JP2009512400A (ja) | 2009-03-19 |
Family
ID=37758803
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008536770A Pending JP2009512400A (ja) | 2005-10-17 | 2006-10-17 | ビデオストリーミングにおけるショット検出のための方法および装置 |
Country Status (9)
Country | Link |
---|---|
US (1) | US8654848B2 (ja) |
EP (1) | EP1938580A1 (ja) |
JP (1) | JP2009512400A (ja) |
KR (1) | KR20080068716A (ja) |
CN (1) | CN101326809A (ja) |
AR (1) | AR055450A1 (ja) |
CL (1) | CL2006002797A1 (ja) |
TW (1) | TW200803518A (ja) |
WO (1) | WO2007047758A1 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016174363A (ja) * | 2009-09-22 | 2016-09-29 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | シグナリング又はブロック生成を用いた拡張ブロック−要求ストリーミングシステム |
Families Citing this family (52)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110126255A1 (en) * | 2002-12-10 | 2011-05-26 | Onlive, Inc. | System and method for remote-hosted video effects |
US8155178B2 (en) | 2007-10-30 | 2012-04-10 | Sony Corporation | 16k mode interleaver in a digital video broadcasting (DVB) standard |
US8780957B2 (en) * | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
KR20070117660A (ko) * | 2005-03-10 | 2007-12-12 | 콸콤 인코포레이티드 | 컨텐트 적응적 멀티미디어 처리 |
US8879635B2 (en) * | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
US20070206117A1 (en) * | 2005-10-17 | 2007-09-06 | Qualcomm Incorporated | Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video |
US8948260B2 (en) * | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US20070171280A1 (en) * | 2005-10-24 | 2007-07-26 | Qualcomm Incorporated | Inverse telecine algorithm based on state machine |
US9131164B2 (en) * | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
JP2007288299A (ja) * | 2006-04-13 | 2007-11-01 | Hitachi Ltd | 配信システム、情報処理装置、配信方法及びプログラム |
JP2008066851A (ja) * | 2006-09-05 | 2008-03-21 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、並びに、プログラム |
EP2109992A2 (en) * | 2007-01-31 | 2009-10-21 | Thomson Licensing | Method and apparatus for automatically categorizing potential shot and scene detection information |
US8345769B1 (en) * | 2007-04-10 | 2013-01-01 | Nvidia Corporation | Real-time video segmentation on a GPU for scene and take indexing |
US8358381B1 (en) | 2007-04-10 | 2013-01-22 | Nvidia Corporation | Real-time video segmentation on a GPU for scene and take indexing |
WO2009016474A2 (en) * | 2007-07-31 | 2009-02-05 | Bighand Ltd. | System and method for efficiently providing content over a thin client network |
US8063942B2 (en) * | 2007-10-19 | 2011-11-22 | Qualcomm Incorporated | Motion assisted image sensor configuration |
US20090109341A1 (en) * | 2007-10-30 | 2009-04-30 | Qualcomm Incorporated | Detecting scene transitions in digital video sequences |
US8104055B2 (en) * | 2007-11-14 | 2012-01-24 | Mavs Lab. Inc. | Method of identifying target synchronization point pair through scan-line image matching scheme |
EP2301251A4 (en) * | 2008-06-25 | 2012-12-26 | Ericsson Telefon Ab L M | LINES EVALUATION-RATE CONTROL |
KR101522985B1 (ko) | 2008-10-31 | 2015-05-27 | 삼성전자주식회사 | 영상처리 장치 및 방법 |
EP2187647A1 (en) * | 2008-11-12 | 2010-05-19 | Sony Corporation | Method and device for approximating a DC coefficient of a block of pixels of a frame |
US8396114B2 (en) * | 2009-01-29 | 2013-03-12 | Microsoft Corporation | Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming |
US8311115B2 (en) * | 2009-01-29 | 2012-11-13 | Microsoft Corporation | Video encoding using previously calculated motion information |
US8270473B2 (en) * | 2009-06-12 | 2012-09-18 | Microsoft Corporation | Motion based dynamic resolution multiple bit rate video encoding |
US9917874B2 (en) | 2009-09-22 | 2018-03-13 | Qualcomm Incorporated | Enhanced block-request streaming using block partitioning or request controls for improved client-side handling |
EP2507787A4 (en) | 2009-11-30 | 2013-07-17 | Semiconductor Energy Lab | Liquid crystal display device, control method therefor and electronic device therefor |
US8705616B2 (en) * | 2010-06-11 | 2014-04-22 | Microsoft Corporation | Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures |
US8451384B2 (en) * | 2010-07-08 | 2013-05-28 | Spinella Ip Holdings, Inc. | System and method for shot change detection in a video sequence |
US8723914B2 (en) * | 2010-11-19 | 2014-05-13 | Cisco Technology, Inc. | System and method for providing enhanced video processing in a network environment |
US20120287987A1 (en) * | 2011-05-13 | 2012-11-15 | Madhukar Budagavi | Coding of Scene Changes Using Picture Dropping |
US9232233B2 (en) * | 2011-07-01 | 2016-01-05 | Apple Inc. | Adaptive configuration of reference frame buffer based on camera and background motion |
US9591318B2 (en) | 2011-09-16 | 2017-03-07 | Microsoft Technology Licensing, Llc | Multi-layer encoding and decoding |
US11089343B2 (en) | 2012-01-11 | 2021-08-10 | Microsoft Technology Licensing, Llc | Capability advertisement, configuration and control for video coding and decoding |
US10713499B2 (en) * | 2012-04-23 | 2020-07-14 | Conduent Business Services, Llc | Real-time video triggering for traffic surveillance and photo enforcement applications using near infrared video acquisition |
US20140181668A1 (en) | 2012-12-20 | 2014-06-26 | International Business Machines Corporation | Visual summarization of video for quick understanding |
KR20150029592A (ko) | 2013-09-10 | 2015-03-18 | 주식회사 케이티 | 스케일러블 비디오 신호 인코딩/디코딩 방법 및 장치 |
US20150117515A1 (en) * | 2013-10-25 | 2015-04-30 | Microsoft Corporation | Layered Encoding Using Spatial and Temporal Analysis |
US9609338B2 (en) | 2013-10-25 | 2017-03-28 | Microsoft Technology Licensing, Llc | Layered video encoding and decoding |
US20150189222A1 (en) * | 2013-12-30 | 2015-07-02 | Google Inc. | Content-adaptive chunking for distributed transcoding |
US20160112707A1 (en) * | 2014-10-15 | 2016-04-21 | Intel Corporation | Policy-based image encoding |
CA2972961C (en) * | 2015-01-05 | 2021-06-01 | Arris Enterprises Llc | Using motion compensated temporal filter (mctf) statistics for scene change detection when a fade, dissolve or cut occurs |
CN105608233A (zh) * | 2016-02-26 | 2016-05-25 | 北京大学 | 一种基于改进的om特征的视频拷贝检测方法 |
US10686969B2 (en) | 2016-07-08 | 2020-06-16 | NETFLIX Inc. | Detecting shot changes in a video |
WO2018044803A1 (en) * | 2016-08-30 | 2018-03-08 | Dolby Laboratories Licensing Corporation | Real-time reshaping of single-layer backwards-compatible codec |
CN109792523B (zh) * | 2016-08-30 | 2022-11-04 | 杜比实验室特许公司 | 单层后向兼容编解码器的实时整形 |
IL305702B1 (en) | 2016-10-05 | 2024-03-01 | Dolby Laboratories Licensing Corp | Messaging information volume source color |
CN108109592B (zh) | 2016-11-25 | 2022-01-25 | 株式会社半导体能源研究所 | 显示装置及其工作方法 |
EP3328051B1 (en) | 2016-11-29 | 2019-01-02 | Axis AB | Method for controlling an infrared cut filter of a video camera |
EP3337174B1 (en) * | 2016-12-14 | 2021-04-07 | Alcatel-Lucent España | Method and device for transmission of content |
CN109151469B (zh) * | 2017-06-15 | 2020-06-30 | 腾讯科技(深圳)有限公司 | 视频编码方法、装置及设备 |
KR102523510B1 (ko) | 2017-09-28 | 2023-04-18 | 애플 인크. | 이벤트 카메라를 이용한 정적 이미지들의 생성 |
CN111369482B (zh) * | 2020-03-03 | 2023-06-23 | 北京市商汤科技开发有限公司 | 图像处理方法及装置、电子设备和存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08102938A (ja) * | 1994-09-30 | 1996-04-16 | Sony Corp | 画像符号化装置 |
JPH08214210A (ja) * | 1993-12-17 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | 映像カット点検出方法及び装置 |
JPH09284770A (ja) * | 1996-04-13 | 1997-10-31 | Sony Corp | 画像符号化装置および方法 |
JP2000115778A (ja) * | 1998-09-25 | 2000-04-21 | Sarnoff Corp | ビデオ・デ―タ中のフラッシュ・フレ―ムの検出および符号化 |
JP2000295626A (ja) * | 1999-04-08 | 2000-10-20 | Mitsubishi Electric Corp | 多段画像符号化装置 |
Family Cites Families (238)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US655068A (en) * | 1899-08-11 | 1900-07-31 | Robert B Elliott | Fender for cultivators. |
FR2646047B1 (fr) | 1989-04-13 | 1995-08-04 | Telediffusion Fse | Procede et installation de codage et de transmission d'images animees sous forme numerique a bas debit |
JP2909239B2 (ja) * | 1991-03-27 | 1999-06-23 | 株式会社東芝 | 高能率符号化記録再生装置 |
JP3189292B2 (ja) | 1991-05-09 | 2001-07-16 | 松下電器産業株式会社 | 走査線補間装置 |
KR0121328B1 (ko) * | 1991-12-13 | 1997-11-17 | 사또오 후미오 | 디지탈 신호 기록 재생 장치 |
IT1252546B (it) | 1991-12-18 | 1995-06-19 | Alcatel Italia | Metodo e sistema per adattare il ciclo di frequenza di refresh alla complessita' dell'immagine |
US5289276A (en) * | 1992-06-19 | 1994-02-22 | General Electric Company | Method and apparatus for conveying compressed video data over a noisy communication channel |
FR2700090B1 (fr) | 1992-12-30 | 1995-01-27 | Thomson Csf | Procédé de désentrelacement de trames d'une séquence d'images animées. |
EP0627853B1 (en) * | 1993-06-03 | 2000-11-15 | Matsushita Electric Industrial Co., Ltd. | Picture reproduction apparatus and picture decoding apparatus |
EP0710422B1 (en) | 1993-07-19 | 1998-09-30 | BRITISH TELECOMMUNICATIONS public limited company | Detecting errors in video images |
CA2127151A1 (en) | 1993-09-21 | 1995-03-22 | Atul Puri | Spatially scalable video encoding and decoding |
US5991502A (en) * | 1993-10-04 | 1999-11-23 | Matsushita Electric Industrial Co., Ltd. | Optical recording device which calculates distances between I-frames and records I-frame addresses in a sector |
AU681185B2 (en) * | 1993-10-22 | 1997-08-21 | Sony Corporation | apparatus and method for recording and reproducing digital video data |
JP2734953B2 (ja) | 1993-12-16 | 1998-04-02 | 日本電気株式会社 | Cdma受信装置 |
US5642294A (en) * | 1993-12-17 | 1997-06-24 | Nippon Telegraph And Telephone Corporation | Method and apparatus for video cut detection |
US5446491A (en) * | 1993-12-21 | 1995-08-29 | Hitachi, Ltd. | Multi-point video conference system wherein each terminal comprises a shared frame memory to store information from other terminals |
JP3149303B2 (ja) * | 1993-12-29 | 2001-03-26 | 松下電器産業株式会社 | デジタル画像符号化方法及びデジタル画像復号化方法 |
US5592226A (en) * | 1994-01-26 | 1997-01-07 | Btg Usa Inc. | Method and apparatus for video data compression using temporally adaptive motion interpolation |
US6798834B1 (en) * | 1996-08-15 | 2004-09-28 | Mitsubishi Denki Kabushiki Kaisha | Image coding apparatus with segment classification and segmentation-type motion prediction circuit |
KR100213015B1 (ko) | 1994-03-31 | 1999-08-02 | 윤종용 | 양자화 방법 및 회로 |
US6091460A (en) * | 1994-03-31 | 2000-07-18 | Mitsubishi Denki Kabushiki Kaisha | Video signal encoding method and system |
US5508752A (en) * | 1994-04-12 | 1996-04-16 | Lg Electronics Inc. | Partial response trellis decoder for high definition television (HDTV) system |
JPH07298272A (ja) * | 1994-04-28 | 1995-11-10 | Canon Inc | 映像符号化装置 |
US5706386A (en) * | 1994-05-24 | 1998-01-06 | Sony Corporation | Image information recording method and apparatus, image information reproducing method and apparatus and editing method and system |
DE69529579D1 (de) | 1994-06-17 | 2003-03-13 | Snell & Wilcox Ltd | Komprimieren eines aus kompressionskodierten Videosignalen nach deren Teildekodierung kombinierten Signales |
US5521644A (en) | 1994-06-30 | 1996-05-28 | Eastman Kodak Company | Mechanism for controllably deinterlacing sequential lines of video data field based upon pixel signals associated with four successive interlaced video fields |
KR100213018B1 (ko) | 1994-07-30 | 1999-08-02 | 윤종용 | 동화상 부호화장치 |
SG74566A1 (en) * | 1995-08-23 | 2000-08-22 | Sony Corp | Encoding/decoding fields of predetermined field polarity apparatus and method |
JPH0974566A (ja) * | 1995-09-04 | 1997-03-18 | Sony Corp | 圧縮符号化装置及び圧縮符号化データの記録装置 |
JP3813070B2 (ja) | 1995-09-29 | 2006-08-23 | 松下電器産業株式会社 | 光ディスクを再生する再生装置 |
EP0847199B1 (en) * | 1995-09-29 | 1999-04-28 | Matsushita Electric Industrial Co., Ltd. | Method, disc and device for encoding seamless-connection of telecine-converted video data |
JPH09130732A (ja) * | 1995-11-01 | 1997-05-16 | Matsushita Electric Ind Co Ltd | シーンチェンジ検出方法および動画像編集装置 |
US5835163A (en) * | 1995-12-21 | 1998-11-10 | Siemens Corporate Research, Inc. | Apparatus for detecting a cut in a video |
US5682204A (en) * | 1995-12-26 | 1997-10-28 | C Cube Microsystems, Inc. | Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level |
US5821991A (en) * | 1996-02-28 | 1998-10-13 | C-Cube Microsystems, Inc. | Method and apparatus for inverse telecine process by correlating vectors of pixel differences |
US6157674A (en) * | 1996-03-21 | 2000-12-05 | Sony Corporation | Audio and video data transmitting apparatus, system, and method thereof |
US7095874B2 (en) | 1996-07-02 | 2006-08-22 | Wistaria Trading, Inc. | Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data |
US6643506B1 (en) | 1996-08-07 | 2003-11-04 | Telxon Corporation | Wireless software upgrades with version control |
US5793895A (en) * | 1996-08-28 | 1998-08-11 | International Business Machines Corporation | Intelligent error resilient video encoder |
KR100389893B1 (ko) | 1996-11-09 | 2003-09-19 | 삼성전자주식회사 | 영상 특성 분류법을 이용한 영상 부호화 장치 |
FR2756399B1 (fr) | 1996-11-28 | 1999-06-25 | Thomson Multimedia Sa | Procede et dispositif de compression video pour images de synthese |
US6553068B1 (en) | 1997-03-12 | 2003-04-22 | Matsushita Electric Industrial Co., Ltd. | Video signal coding method and device adapted to control code amounts according to the characteristics of pictures |
JP3679606B2 (ja) | 1997-04-18 | 2005-08-03 | キヤノン株式会社 | 符号化装置及び方法並びに符号化プログラムが記録されたコンピュータ可読記録媒体 |
US6333950B1 (en) * | 1997-04-18 | 2001-12-25 | Canon Kabushiki Kaisha | Encoding apparatus and method and computer readable recording medium in which encoding program has been recorded |
JP3588970B2 (ja) * | 1997-04-30 | 2004-11-17 | ソニー株式会社 | 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法 |
US5864369A (en) | 1997-06-16 | 1999-01-26 | Ati International Srl | Method and apparatus for providing interlaced video on a progressive display |
US6012091A (en) * | 1997-06-30 | 2000-01-04 | At&T Corporation | Video telecommunications server and method of providing video fast forward and reverse |
KR100226722B1 (ko) * | 1997-07-30 | 1999-10-15 | 구자홍 | 동영상 움직임 벡터 추정 방법 |
US5978029A (en) | 1997-10-10 | 1999-11-02 | International Business Machines Corporation | Real-time encoding of video sequence employing two encoders and statistical analysis |
US6574211B2 (en) | 1997-11-03 | 2003-06-03 | Qualcomm Incorporated | Method and apparatus for high rate packet data transmission |
US5956026A (en) | 1997-12-19 | 1999-09-21 | Sharp Laboratories Of America, Inc. | Method for hierarchical summarization and browsing of digital video |
JP3738939B2 (ja) * | 1998-03-05 | 2006-01-25 | Kddi株式会社 | 動画像のカット点検出装置 |
DE69830471T2 (de) | 1998-03-09 | 2006-08-10 | Sony Deutschland Gmbh | Interpolator mit einem gewichteten Medianfilter |
US6895048B2 (en) * | 1998-03-20 | 2005-05-17 | International Business Machines Corporation | Adaptive encoding of a sequence of still frames or partially still frames within motion video |
US6538688B1 (en) | 1998-07-02 | 2003-03-25 | Terran Interactive | Method and apparatus for performing an automated inverse telecine process |
JP2000032474A (ja) | 1998-07-08 | 2000-01-28 | Sharp Corp | 動画像符号化装置 |
JP2000059774A (ja) | 1998-08-06 | 2000-02-25 | Nippon Telegr & Teleph Corp <Ntt> | 映像符号化制御装置 |
EP1119979B1 (en) * | 1998-09-29 | 2013-01-23 | General Instrument Corporation | Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder |
JP3921841B2 (ja) * | 1998-10-16 | 2007-05-30 | ソニー株式会社 | 信号処理装置および方法、ならびに、記録装置、再生装置および記録再生装置 |
JP2000209553A (ja) | 1998-11-13 | 2000-07-28 | Victor Co Of Japan Ltd | 情報信号記録装置及び再生装置 |
US6297848B1 (en) | 1998-11-25 | 2001-10-02 | Sharp Laboratories Of America, Inc. | Low-delay conversion of 3:2 pulldown video to progressive format with field averaging |
JP3260713B2 (ja) | 1998-12-21 | 2002-02-25 | 日本電気株式会社 | 無線基地局のプログラムダウンロード方式 |
US6618507B1 (en) | 1999-01-25 | 2003-09-09 | Mitsubishi Electric Research Laboratories, Inc | Methods of feature extraction of video sequences |
DE60031905T2 (de) * | 1999-04-02 | 2007-04-12 | Matsushita Electric Industrial Co., Ltd., Kadoma | Vorrichtungen zur Übertragung und Empfang von bewegten Bildern sowie Aufzeichnungsmedium für bewegte Bilder |
JP3591712B2 (ja) | 1999-04-02 | 2004-11-24 | 松下電器産業株式会社 | 動画送信装置及び動画受信装置 |
US6325805B1 (en) | 1999-04-23 | 2001-12-04 | Sdgi Holdings, Inc. | Shape memory alloy staple |
EP1092321A1 (en) | 1999-04-30 | 2001-04-18 | Koninklijke Philips Electronics N.V. | Video encoding method with selection of b-frame encoding mode |
JP4287538B2 (ja) * | 1999-04-30 | 2009-07-01 | パナソニック株式会社 | 画像信号切替方法及び装置並びにこれを用いたデジタル撮像カメラ及び監視システム |
GB2352350B (en) | 1999-07-19 | 2003-11-05 | Nokia Mobile Phones Ltd | Video coding |
JP3669619B2 (ja) | 1999-09-06 | 2005-07-13 | 富士通株式会社 | 無線端末装置のソフトウェア更新方法及びその装置 |
US6370672B1 (en) * | 1999-11-01 | 2002-04-09 | Lsi Logic Corporation | Determining the received data rate in a variable rate communications system |
GB2359918A (en) | 2000-03-01 | 2001-09-05 | Sony Uk Ltd | Audio and/or video generation apparatus having a metadata generator |
JP2001169251A (ja) | 1999-12-03 | 2001-06-22 | Sony Corp | 記録装置および方法、ならびに、再生装置および方法 |
US7116717B1 (en) | 1999-12-15 | 2006-10-03 | Bigband Networks, Inc. | Method and system for scalable representation, storage, transmission and reconstruction of media streams |
US7093028B1 (en) * | 1999-12-15 | 2006-08-15 | Microsoft Corporation | User and content aware object-based data stream transmission methods and arrangements |
US6449002B1 (en) * | 1999-12-21 | 2002-09-10 | Thomson Licensing S.A. | Truncated metric for NTSC interference rejection in the ATSC-HDTV trellis decoder |
JP2001045494A (ja) | 2000-01-01 | 2001-02-16 | Mitsubishi Electric Corp | 画像符号化装置 |
JP2001204026A (ja) | 2000-01-21 | 2001-07-27 | Sony Corp | 画像情報変換装置及び方法 |
US6600836B1 (en) | 2000-01-28 | 2003-07-29 | Qualcomm, Incorporated | Quality based image compression |
WO2001058166A1 (en) * | 2000-02-01 | 2001-08-09 | Koninklijke Philips Electronics N.V. | Video encoding with a two step motion estimation for p-frames |
US6574279B1 (en) | 2000-02-02 | 2003-06-03 | Mitsubishi Electric Research Laboratories, Inc. | Video transcoding using syntactic and semantic clues |
US6542546B1 (en) | 2000-02-02 | 2003-04-01 | Mitsubishi Electric Research Laboratories, Inc. | Adaptable compressed bitstream transcoder |
US6490320B1 (en) | 2000-02-02 | 2002-12-03 | Mitsubishi Electric Research Laboratories Inc. | Adaptable bitstream video delivery system |
JP3960451B2 (ja) | 2000-03-06 | 2007-08-15 | Kddi株式会社 | シーン特性検出型動画像符号化装置 |
SE0000766L (sv) | 2000-03-08 | 2001-06-25 | Sem Ab | Krets för tändförställning, varvtalsbegränsning och förhindrande av baklängesgång i magnettändsystem |
AU780811B2 (en) | 2000-03-13 | 2005-04-21 | Sony Corporation | Method and apparatus for generating compact transcoding hints metadata |
US20020154705A1 (en) | 2000-03-22 | 2002-10-24 | Walton Jay R. | High efficiency high performance communications system employing multi-carrier modulation |
JP2003530786A (ja) * | 2000-04-07 | 2003-10-14 | スネル アンド ウィルコックス リミテッド | ビデオ信号処理方法 |
US6867814B2 (en) * | 2000-04-18 | 2005-03-15 | Silicon Image, Inc. | Method, system and article of manufacture for identifying the source type and quality level of a video sequence |
US6507618B1 (en) * | 2000-04-25 | 2003-01-14 | Hewlett-Packard Company | Compressed video signal including independently coded regions |
EP1152621A1 (en) | 2000-05-05 | 2001-11-07 | STMicroelectronics S.r.l. | Motion estimation process and system. |
US6647061B1 (en) | 2000-06-09 | 2003-11-11 | General Instrument Corporation | Video size conversion and transcoding from MPEG-2 to MPEG-4 |
KR100708091B1 (ko) | 2000-06-13 | 2007-04-16 | 삼성전자주식회사 | 양방향 움직임 벡터를 이용한 프레임 레이트 변환 장치 및그 방법 |
JP2002010259A (ja) * | 2000-06-21 | 2002-01-11 | Mitsubishi Electric Corp | 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体 |
EP1172681A3 (en) * | 2000-07-13 | 2004-06-09 | Creo IL. Ltd. | Blazed micro-mechanical light modulator and array thereof |
US20040125877A1 (en) * | 2000-07-17 | 2004-07-01 | Shin-Fu Chang | Method and system for indexing and content-based adaptive streaming of digital video content |
KR20020010171A (ko) | 2000-07-27 | 2002-02-04 | 오길록 | 블록 정합 움직임 추정을 위한 적응적 예측 방향성 탐색방법 |
FI120125B (fi) | 2000-08-21 | 2009-06-30 | Nokia Corp | Kuvankoodaus |
JP2002094994A (ja) | 2000-09-19 | 2002-03-29 | Nec Corp | 動画再生処理装置および動画再生処理方法 |
US7038736B2 (en) * | 2000-09-21 | 2006-05-02 | Canon Kabushiki Kaisha | Moving image processing apparatus and method, and computer readable memory |
WO2002025925A2 (en) | 2000-09-22 | 2002-03-28 | Koninklijke Philips Electronics Nv | Hybrid temporal-snr fine granular scalability video coding |
US7095814B2 (en) | 2000-10-11 | 2006-08-22 | Electronics And Telecommunications Research Institute | Apparatus and method for very high performance space-time array reception processing using chip-level beamforming and fading rate adaptation |
JP2002125227A (ja) | 2000-10-11 | 2002-04-26 | Sony Corp | 画像情報変換装置及び方法 |
CN1248508C (zh) | 2000-11-23 | 2006-03-29 | 皇家菲利浦电子有限公司 | 视频解码方法 |
EP1209624A1 (en) | 2000-11-27 | 2002-05-29 | Sony International (Europe) GmbH | Method for compressed imaging artefact reduction |
US7058130B2 (en) * | 2000-12-11 | 2006-06-06 | Sony Corporation | Scene change detection |
US7203238B2 (en) * | 2000-12-11 | 2007-04-10 | Sony Corporation | 3:2 Pull-down detection |
US6934335B2 (en) * | 2000-12-11 | 2005-08-23 | Sony Corporation | Video encoder with embedded scene change and 3:2 pull-down detections |
US6744474B2 (en) * | 2000-12-13 | 2004-06-01 | Thomson Licensing S.A. | Recursive metric for NTSC interference rejection in the ATSC-HDTV trellis decoder |
US6807234B2 (en) * | 2000-12-19 | 2004-10-19 | Intel Corporation | Method and apparatus for constellation mapping and bitloading in multi-carrier transceivers, such as DMT-based DSL transceivers |
GB2372394B (en) | 2000-12-22 | 2004-09-22 | Matsushita Electric Ind Co Ltd | Interpolation apparatus and video signal processing apparatus including the same |
CA2330854A1 (en) * | 2001-01-11 | 2002-07-11 | Jaldi Semiconductor Corp. | A system and method for detecting a non-video source in video signals |
US6987728B2 (en) * | 2001-01-23 | 2006-01-17 | Sharp Laboratories Of America, Inc. | Bandwidth allocation system |
JP4336051B2 (ja) | 2001-01-31 | 2009-09-30 | 株式会社エヌ・ティ・ティ・ドコモ | 無線通信端末、発呼制限方法及びプログラム |
US6721361B1 (en) * | 2001-02-23 | 2004-04-13 | Yesvideo.Com | Video processing system including advanced scene break detection methods for fades, dissolves and flashes |
JP2004531925A (ja) * | 2001-03-05 | 2004-10-14 | インタービデオインコーポレイテッド | 圧縮されたビデオビットストリームにおける冗長な動きベクトルを符号化し復号するシステム及び方法 |
KR100783396B1 (ko) * | 2001-04-19 | 2007-12-10 | 엘지전자 주식회사 | 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법 |
US20020163964A1 (en) * | 2001-05-02 | 2002-11-07 | Nichols James B. | Apparatus and method for compressing video |
US6909745B1 (en) | 2001-06-05 | 2005-06-21 | At&T Corp. | Content adaptive video encoder |
KR100803115B1 (ko) | 2001-06-07 | 2008-02-14 | 엘지전자 주식회사 | 적응 안테나 어레이가 구비된 wcdma 시스템에서의 신호 처리 방법 이를 위한 시스템 |
KR100393066B1 (ko) | 2001-06-11 | 2003-07-31 | 삼성전자주식회사 | 적응 움직임 보상형 디-인터레이싱 장치 및 그 방법 |
JP2002051336A (ja) | 2001-06-15 | 2002-02-15 | Sharp Corp | 画像符号化装置及び画像復号装置 |
US7483581B2 (en) * | 2001-07-02 | 2009-01-27 | Qualcomm Incorporated | Apparatus and method for encoding digital image data in a lossless manner |
JP2003037844A (ja) | 2001-07-23 | 2003-02-07 | Sharp Corp | 動画像符号化装置 |
KR100440953B1 (ko) | 2001-08-18 | 2004-07-21 | 삼성전자주식회사 | 영상 압축 비트 스트림의 트랜스코딩 방법 |
US6959044B1 (en) * | 2001-08-21 | 2005-10-25 | Cisco Systems Canada Co. | Dynamic GOP system and method for digital video encoding |
US7359466B2 (en) | 2001-08-24 | 2008-04-15 | Lucent Technologies Inc. | Signal detection by a receiver in a multiple antenna time-dispersive system |
US6784942B2 (en) | 2001-10-05 | 2004-08-31 | Genesis Microchip, Inc. | Motion adaptive de-interlacing method and apparatus |
TW536918B (en) | 2001-11-01 | 2003-06-11 | Aiptek Int Inc | Method to increase the temporal resolution of continuous image series |
JP2003209837A (ja) | 2001-11-09 | 2003-07-25 | Matsushita Electric Ind Co Ltd | 動画像符号化方法及び動画像符号化装置 |
AU2002343220A1 (en) * | 2001-11-09 | 2003-05-19 | Matsushita Electric Industrial Co., Ltd. | Moving picture coding method and apparatus |
US6847680B2 (en) | 2001-12-17 | 2005-01-25 | Mitsubishi Electric Research Laboratories, Inc. | Method for detecting talking heads in a compressed video |
KR100446083B1 (ko) | 2002-01-02 | 2004-08-30 | 삼성전자주식회사 | 움직임 추정 및 모드 결정 장치 및 방법 |
US20030142762A1 (en) * | 2002-01-11 | 2003-07-31 | Burke Joseph P. | Wireless receiver method and apparatus using space-cover-time equalization |
US7139551B2 (en) | 2002-01-19 | 2006-11-21 | Sasken Communication Technologies Ltd. | System and method for automatically downloading software applications to a remote terminal |
JP2003224847A (ja) | 2002-01-29 | 2003-08-08 | Sony Corp | 画像符号化装置とその方法、および、画像復号化装置とその方法 |
US6996186B2 (en) | 2002-02-22 | 2006-02-07 | International Business Machines Corporation | Programmable horizontal filter with noise reduction and image scaling for video encoding system |
KR100850705B1 (ko) | 2002-03-09 | 2008-08-06 | 삼성전자주식회사 | 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치 |
ATE490649T1 (de) * | 2002-03-27 | 2010-12-15 | British Telecomm | Videokodierung und -übertragung |
US20030185302A1 (en) * | 2002-04-02 | 2003-10-02 | Abrams Thomas Algie | Camera and/or camera converter |
CA2380105A1 (en) * | 2002-04-09 | 2003-10-09 | Nicholas Routhier | Process and system for encoding and playback of stereoscopic video sequences |
KR100468726B1 (ko) | 2002-04-18 | 2005-01-29 | 삼성전자주식회사 | 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법 |
US6985635B2 (en) * | 2002-04-22 | 2006-01-10 | Koninklijke Philips Electronics N.V. | System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding |
JP3926203B2 (ja) | 2002-05-15 | 2007-06-06 | シャープ株式会社 | コンテンツ表示装置、コンテンツ表示プログラム、該プログラムを記録した記録媒体、およびコンテンツ表示方法 |
KR100850706B1 (ko) * | 2002-05-22 | 2008-08-06 | 삼성전자주식회사 | 적응적 동영상 부호화 및 복호화 방법과 그 장치 |
FR2840495B1 (fr) | 2002-05-29 | 2004-07-30 | Canon Kk | Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage |
US7436890B2 (en) * | 2002-06-05 | 2008-10-14 | Kddi R&D Laboratories, Inc. | Quantization control system for video coding |
JP2004023288A (ja) | 2002-06-13 | 2004-01-22 | Kddi R & D Laboratories Inc | 動画像符号化のための前処理方式 |
KR100553082B1 (ko) | 2002-06-20 | 2006-02-15 | 엘지전자 주식회사 | 이동통신 단말기의 무선 데이터 다운로드 이어받기 장치및 방법 |
US7167507B2 (en) | 2002-07-01 | 2007-01-23 | Lucent Technologies Inc. | Equalizer and method for performing equalization in a wireless communications system |
US7136417B2 (en) | 2002-07-15 | 2006-11-14 | Scientific-Atlanta, Inc. | Chroma conversion optimization |
CA2491761A1 (en) | 2002-07-16 | 2004-01-22 | Thomson Licensing S.A. | Interleaving of base and enhancement layers for hd-dvd |
US7089313B2 (en) | 2002-07-25 | 2006-08-08 | Matsushita Electric Industrial Co., Ltd. | Protocol independent communication system for mobile devices |
EP1537575A1 (en) | 2002-08-21 | 2005-06-08 | Thomson Licensing S.A. | Watermarking digital data at a user device |
US20040045038A1 (en) | 2002-08-29 | 2004-03-04 | Duff John F. | System and method for the synchronized activation of external devices in association with video programs |
US6904081B2 (en) | 2002-08-30 | 2005-06-07 | Motorola, Inc. | Spread spectrum receiver apparatus and method |
GB0222562D0 (en) | 2002-09-28 | 2002-11-06 | Koninkl Philips Electronics Nv | Method and apparatus for encoding image and or audio data |
JP4294933B2 (ja) | 2002-10-16 | 2009-07-15 | 富士通株式会社 | マルチメディアコンテンツ編集装置およびマルチメディアコンテンツ再生装置 |
KR100501933B1 (ko) | 2002-11-21 | 2005-07-18 | 삼성전자주식회사 | 멀티미디어 데이터 암호화 압축방법 및 장치 |
KR20050086705A (ko) | 2002-11-22 | 2005-08-30 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 가변 길이 코딩된 데이터 스트림을 위한 트랜스코더 |
BRPI0307197B1 (pt) | 2002-11-25 | 2018-06-19 | Godo Kaisha Ip Bridge 1 | Método de compensação de movimento, método de codificação de imagem e método de decodificação de imagem |
WO2004054270A1 (en) | 2002-12-10 | 2004-06-24 | Koninklijke Philips Electronics N.V. | A unified metric for digital video processing (umdvp) |
WO2004057460A2 (en) | 2002-12-20 | 2004-07-08 | Koninklijke Philips Electronics N.V. | Segment-based motion estimation |
US7154555B2 (en) * | 2003-01-10 | 2006-12-26 | Realnetworks, Inc. | Automatic deinterlacing and inverse telecine |
US7039855B2 (en) | 2003-01-22 | 2006-05-02 | Lsi Logic Corporation | Decision function generator for a Viterbi decoder |
BRPI0406991A (pt) | 2003-01-28 | 2006-01-10 | Thomson Licensing | Difusão alternada de modo robusto |
KR20040079084A (ko) | 2003-03-06 | 2004-09-14 | 삼성전자주식회사 | 시간적 복잡도를 고려한 적응적 동영상 부호화와 그 장치 |
US7062260B2 (en) | 2003-03-27 | 2006-06-13 | Nokia Corporation | Fetching application and driver for extension device from network |
US7075581B1 (en) * | 2003-06-03 | 2006-07-11 | Zoran Corporation | Interlaced-to-progressive scan conversion based on film source detection |
KR100518580B1 (ko) * | 2003-06-10 | 2005-10-04 | 삼성전자주식회사 | 인버스 텔레시네 변환장치 및 변환방법 |
MXPA05013570A (es) | 2003-06-16 | 2006-08-18 | Thomson Licensing | Metodo de decodificacion y aparato que permite un cambio de canal rapido de video comprimido. |
KR101047541B1 (ko) | 2003-06-19 | 2011-07-08 | 톰슨 라이센싱 | 저-복잡도의 공간 스케일러블 디코딩을 위한 방법 및 장치 |
KR100505694B1 (ko) * | 2003-07-09 | 2005-08-02 | 삼성전자주식회사 | 직접 계산 방식에 의한 코드화 직교 주파수 분할 다중화수신기의 채널 상태 평가 장치 및 그 방법 |
US7406123B2 (en) | 2003-07-10 | 2008-07-29 | Mitsubishi Electric Research Laboratories, Inc. | Visual complexity measure for playing videos adaptively |
GB0316387D0 (en) | 2003-07-12 | 2003-08-13 | Ncr Int Inc | Software updates |
JP4198732B2 (ja) | 2003-07-14 | 2008-12-17 | インターデイジタル テクノロジー コーポレーション | クラスタ多経路干渉抑制回路を有する高性能無線受信器 |
US7356073B2 (en) | 2003-09-10 | 2008-04-08 | Nokia Corporation | Method and apparatus providing an advanced MIMO receiver that includes a signal-plus-residual-interference (SPRI) detector |
US20050076057A1 (en) | 2003-10-03 | 2005-04-07 | Puneet Sharma | Method and system for transferring video and audio files to portable computing devices |
US7840112B2 (en) * | 2003-10-08 | 2010-11-23 | Intel Corporation | Gradually degrading multimedia recordings |
JP2005123732A (ja) | 2003-10-14 | 2005-05-12 | Matsushita Electric Ind Co Ltd | デブロックフィルタ処理装置およびデブロックフィルタ処理方法 |
KR20050037293A (ko) * | 2003-10-18 | 2005-04-21 | 삼성전자주식회사 | 영상신호의 아티팩트 억제장치 및 그 방법 |
US7780886B2 (en) * | 2003-10-21 | 2010-08-24 | Certainteed Corporation | Insulation product having directional facing layer thereon and method of making the same |
EP2051510B1 (en) | 2003-10-30 | 2013-08-14 | Panasonic Corporation | Mobile-terminal-orientated transmission method and apparatus |
US7420618B2 (en) * | 2003-12-23 | 2008-09-02 | Genesis Microchip Inc. | Single chip multi-function display controller and method of use thereof |
EP2485187A1 (en) | 2004-01-21 | 2012-08-08 | Qualcomm Incorporated | Application-based value billing in a wireless subscriber network |
US7483077B2 (en) * | 2004-01-30 | 2009-01-27 | Broadcom Corporation | Method and system for control of a multi-field deinterlacer including providing visually pleasing start-up and shut-down |
WO2005074147A1 (en) | 2004-01-30 | 2005-08-11 | Universite Laval | Multi-user adaptive array receiver and method |
US20050168656A1 (en) | 2004-01-30 | 2005-08-04 | Wyman Richard H. | Method and system for quantized historical motion for motion detection in motion adaptive deinterlacer |
US7324583B2 (en) | 2004-02-13 | 2008-01-29 | Nokia Corporation | Chip-level or symbol-level equalizer structure for multiple transmit and receiver antenna configurations |
KR100596705B1 (ko) | 2004-03-04 | 2006-07-04 | 삼성전자주식회사 | 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템 |
KR100586883B1 (ko) * | 2004-03-04 | 2006-06-08 | 삼성전자주식회사 | 비디오 스트리밍 서비스를 위한 비디오 코딩방법, 프리디코딩방법, 비디오 디코딩방법, 및 이를 위한 장치와, 이미지 필터링방법 |
US7339980B2 (en) | 2004-03-05 | 2008-03-04 | Telefonaktiebolaget Lm Ericsson (Publ) | Successive interference cancellation in a generalized RAKE receiver architecture |
US20050201478A1 (en) | 2004-03-10 | 2005-09-15 | Holger Claussen | Modulation in a mobile telecommunications system |
US20050222961A1 (en) | 2004-04-05 | 2005-10-06 | Philippe Staib | System and method of facilitating contactless payment transactions across different payment systems using a common mobile device acting as a stored value device |
US20050231635A1 (en) | 2004-04-16 | 2005-10-20 | Lin Ken K | Automated inverse telecine process |
EP1592250A1 (en) * | 2004-04-30 | 2005-11-02 | Matsushita Electric Industrial Co., Ltd. | Film-mode detection in video sequences |
US7991053B2 (en) | 2004-05-04 | 2011-08-02 | Qualcomm Incorporated | Method and apparatus to enable acquisition of media in streaming applications |
US7430336B2 (en) | 2004-05-06 | 2008-09-30 | Qualcomm Incorporated | Method and apparatus for image enhancement for low bit rate video compression |
DE102004026433A1 (de) | 2004-05-29 | 2005-12-22 | Schott Ag | Nanoglaspulver und deren Verwendung |
US7536626B2 (en) | 2004-06-18 | 2009-05-19 | Qualcomm Incorporated | Power control using erasure techniques |
EP1615447B1 (en) | 2004-07-09 | 2016-03-09 | STMicroelectronics Srl | Method and system for delivery of coded information streams, related network and computer program product therefor |
JP4145275B2 (ja) * | 2004-07-27 | 2008-09-03 | 富士通株式会社 | 動きベクトル検出・補償装置 |
KR20060011281A (ko) | 2004-07-30 | 2006-02-03 | 한종기 | 트랜스코더에 적용되는 해상도 변환장치 및 방법 |
JP2006074684A (ja) | 2004-09-06 | 2006-03-16 | Matsushita Electric Ind Co Ltd | 画像処理方法及び装置 |
US7474701B2 (en) | 2004-09-23 | 2009-01-06 | International Business Machines Corporation | Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames |
US7528887B2 (en) * | 2004-10-08 | 2009-05-05 | Broadcom Corporation | System and method for performing inverse telecine deinterlacing of video by bypassing data present in vertical blanking intervals |
US7660987B2 (en) | 2004-10-29 | 2010-02-09 | Baylis Stephen W | Method of establishing a secure e-mail transmission link |
KR100592882B1 (ko) | 2004-12-13 | 2006-06-26 | 한국전자통신연구원 | 세션 초기화 프로토콜(sip) 기능이 없는 이동 단말에인터넷 프로토콜 멀티미디어 서브시스템을 통한 세션초기화 프로토콜 기반 인스턴스 메시징 서비스 제공방법,시스템 및 이를 위한 인스턴스 메시징 프록시 서버 |
US20060153294A1 (en) | 2005-01-12 | 2006-07-13 | Nokia Corporation | Inter-layer coefficient coding for scalable video coding |
US8780957B2 (en) * | 2005-01-14 | 2014-07-15 | Qualcomm Incorporated | Optimal weights for MMSE space-time equalizer of multicode CDMA system |
US20060166739A1 (en) | 2005-01-25 | 2006-07-27 | Jeng-Tay Lin | Operating method for a wireless recreation system |
KR20060088461A (ko) | 2005-02-01 | 2006-08-04 | 엘지전자 주식회사 | 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치 |
US8144824B2 (en) | 2005-03-10 | 2012-03-27 | Qualcomm Incorporated | Trend influenced time tracking |
US8693540B2 (en) | 2005-03-10 | 2014-04-08 | Qualcomm Incorporated | Method and apparatus of temporal error concealment for P-frame |
EP2268042B1 (en) | 2005-03-10 | 2014-07-02 | Qualcomm Incorporated | A decoder architecture for optimized error management in streaming multimedia |
US7995656B2 (en) | 2005-03-10 | 2011-08-09 | Qualcomm Incorporated | Scalable video coding with two layer encoding and single layer decoding |
KR20070117660A (ko) | 2005-03-10 | 2007-12-12 | 콸콤 인코포레이티드 | 컨텐트 적응적 멀티미디어 처리 |
US7929776B2 (en) | 2005-03-10 | 2011-04-19 | Qualcomm, Incorporated | Method and apparatus for error recovery using intra-slice resynchronization points |
WO2006113019A1 (en) | 2005-04-14 | 2006-10-26 | Thomson Licensing | Method and apparatus for slice adaptive motion vector coding for spatial scalable video encoding and decoding |
US20060239347A1 (en) * | 2005-04-25 | 2006-10-26 | Ashish Koul | Method and system for scene change detection in a video encoder |
US20060271990A1 (en) * | 2005-05-18 | 2006-11-30 | Rodriguez Arturo A | Higher picture rate HD encoding and transmission with legacy HD backward compatibility |
KR100716998B1 (ko) * | 2005-05-24 | 2007-05-10 | 삼성전자주식회사 | 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체 |
KR100718134B1 (ko) * | 2005-07-21 | 2007-05-14 | 삼성전자주식회사 | 비트율에 적응적인 영상 데이터 이진 산술 부호화/복호화장치 및 방법 |
US8879635B2 (en) * | 2005-09-27 | 2014-11-04 | Qualcomm Incorporated | Methods and device for data alignment with time domain boundary |
AT502881B1 (de) * | 2005-10-05 | 2007-08-15 | Pirker Wolfgang Ddr | Zahnimplantat |
US8948260B2 (en) | 2005-10-17 | 2015-02-03 | Qualcomm Incorporated | Adaptive GOP structure in video streaming |
US9521584B2 (en) | 2005-10-17 | 2016-12-13 | Qualcomm Incorporated | Method and apparatus for managing data flow through a mesh network |
US20070206117A1 (en) | 2005-10-17 | 2007-09-06 | Qualcomm Incorporated | Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video |
US7916784B2 (en) * | 2005-10-20 | 2011-03-29 | Broadcom Corporation | Method and system for inverse telecine and field pairing |
US7433982B2 (en) | 2005-10-21 | 2008-10-07 | Microsoft Corporation | Transferable component that effectuates plug-and-play |
US20070171280A1 (en) | 2005-10-24 | 2007-07-26 | Qualcomm Incorporated | Inverse telecine algorithm based on state machine |
JP4984503B2 (ja) | 2005-11-28 | 2012-07-25 | 富士通株式会社 | 携帯端末装置およびソフトウェアインストール方法 |
US7587569B2 (en) * | 2005-12-19 | 2009-09-08 | Yahoo! Inc. | System and method for removing a storage server in a distributed column chunk data store |
US7705913B2 (en) * | 2005-12-20 | 2010-04-27 | Lsi Corporation | Unified approach to film mode detection |
US7835904B2 (en) | 2006-03-03 | 2010-11-16 | Microsoft Corp. | Perceptual, scalable audio compression |
US9131164B2 (en) * | 2006-04-04 | 2015-09-08 | Qualcomm Incorporated | Preprocessor method and apparatus |
JP4929819B2 (ja) * | 2006-04-27 | 2012-05-09 | 富士通株式会社 | 映像信号の変換装置及び方法 |
JP5412739B2 (ja) * | 2008-03-26 | 2014-02-12 | 富士通株式会社 | 光増幅装置 |
-
2006
- 2006-10-03 US US11/538,421 patent/US8654848B2/en not_active Expired - Fee Related
- 2006-10-17 CL CL200602797A patent/CL2006002797A1/es unknown
- 2006-10-17 WO PCT/US2006/040712 patent/WO2007047758A1/en active Application Filing
- 2006-10-17 CN CNA2006800460155A patent/CN101326809A/zh active Pending
- 2006-10-17 JP JP2008536770A patent/JP2009512400A/ja active Pending
- 2006-10-17 KR KR1020087011802A patent/KR20080068716A/ko not_active Application Discontinuation
- 2006-10-17 AR ARP060104528A patent/AR055450A1/es unknown
- 2006-10-17 EP EP06817115A patent/EP1938580A1/en not_active Ceased
- 2006-10-17 TW TW095138252A patent/TW200803518A/zh unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH08214210A (ja) * | 1993-12-17 | 1996-08-20 | Nippon Telegr & Teleph Corp <Ntt> | 映像カット点検出方法及び装置 |
JPH08102938A (ja) * | 1994-09-30 | 1996-04-16 | Sony Corp | 画像符号化装置 |
JPH09284770A (ja) * | 1996-04-13 | 1997-10-31 | Sony Corp | 画像符号化装置および方法 |
JP2000115778A (ja) * | 1998-09-25 | 2000-04-21 | Sarnoff Corp | ビデオ・デ―タ中のフラッシュ・フレ―ムの検出および符号化 |
JP2000295626A (ja) * | 1999-04-08 | 2000-10-20 | Mitsubishi Electric Corp | 多段画像符号化装置 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016174363A (ja) * | 2009-09-22 | 2016-09-29 | クゥアルコム・インコーポレイテッドQualcomm Incorporated | シグナリング又はブロック生成を用いた拡張ブロック−要求ストリーミングシステム |
Also Published As
Publication number | Publication date |
---|---|
EP1938580A1 (en) | 2008-07-02 |
AR055450A1 (es) | 2007-08-22 |
KR20080068716A (ko) | 2008-07-23 |
US20070160128A1 (en) | 2007-07-12 |
TW200803518A (en) | 2008-01-01 |
US8654848B2 (en) | 2014-02-18 |
CN101326809A (zh) | 2008-12-17 |
WO2007047758A1 (en) | 2007-04-26 |
CL2006002797A1 (es) | 2008-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8654848B2 (en) | Method and apparatus for shot detection in video streaming | |
US9131164B2 (en) | Preprocessor method and apparatus | |
RU2402885C2 (ru) | Классификация контента для обработки мультимедийных данных | |
EP2227019B1 (en) | Redundant data encoding methods and device | |
JP5259608B2 (ja) | 映像符号化における参照フレームのサーチを軽減する装置及び方法 | |
KR101019010B1 (ko) | 전처리기 방법 및 장치 | |
EP1938615A1 (en) | Adaptive gop structure in video streaming | |
JP2009532741A6 (ja) | プリプロセッサ方法および装置 | |
EP1574072A1 (en) | Video encoding with skipping motion estimation for selected macroblocks | |
US9432694B2 (en) | Signal shaping techniques for video data that is susceptible to banding artifacts | |
JP2010232734A (ja) | 画像符号化装置及び画像符号化方法 | |
US8503520B2 (en) | Method and apparatus for encoding a flash picture occurring in a video sequence, and for decoding corresponding data for a flash picture | |
EP1921866A2 (en) | Content classification for multimedia processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100907 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20101207 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20101214 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110426 |