JP5318561B2 - マルチメディア処理のためのコンテンツ分類 - Google Patents

マルチメディア処理のためのコンテンツ分類 Download PDF

Info

Publication number
JP5318561B2
JP5318561B2 JP2008500935A JP2008500935A JP5318561B2 JP 5318561 B2 JP5318561 B2 JP 5318561B2 JP 2008500935 A JP2008500935 A JP 2008500935A JP 2008500935 A JP2008500935 A JP 2008500935A JP 5318561 B2 JP5318561 B2 JP 5318561B2
Authority
JP
Japan
Prior art keywords
multimedia data
value
complexity
determining
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008500935A
Other languages
English (en)
Other versions
JP2008533841A (ja
Inventor
ラビーンドラン、ビジャヤラクシュミ・アール.
バーミディパティ、ファニクマー
ウォーカー、ゴードン・ケント
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Qualcomm Inc
Original Assignee
Qualcomm Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Inc filed Critical Qualcomm Inc
Publication of JP2008533841A publication Critical patent/JP2008533841A/ja
Application granted granted Critical
Publication of JP5318561B2 publication Critical patent/JP5318561B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/236Assembling of a multiplex stream, e.g. transport stream, by combining a video stream with other content or additional data, e.g. inserting a URL [Uniform Resource Locator] into a video stream, multiplexing software data into a video stream; Remultiplexing of multiplex streams; Insertion of stuffing bits into the multiplex stream, e.g. to obtain a constant bit-rate; Assembling of a packetised elementary stream
    • H04N21/2365Multiplexing of several video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • H04N19/198Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters including smoothing of a sequence of encoding parameters, e.g. by averaging, by choice of the maximum, minimum or median value
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/87Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving scene cut or scene change detection in combination with video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4347Demultiplexing of several video streams

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)

Description

米国特許法119条の下における優先権の主張
本特許出願は、米国特許法119条(e)項の下で、2005年3月10日に出願し、本発明の譲受人に譲渡され、参照により本明細書に明示的に組み込まれている仮出願第60/660,677号の優先権を主張するものである。
本発明の分野は、マルチメディアデータのコンテンツに基づいてマルチメディアデータの分析、分類、定量化、および表現を行う圧縮アルゴリズムによるマルチメディアデータ処理に関する。
インターネットおよび無線通信の普及が、インターネットおよび/または移動/無線チャネルを介してメディアをストリーミングするマルチメディアサービスの需要を増大させている。IP(インターネットプロトコル)ネットワークでは、マルチメディアデータは、サーバによって提供されることが可能であり、1つまたは複数の有線クライアントまたは無線クライアントによってストリーミングされることが可能である。有線接続には、ダイヤルアッププロトコル、ISDN(デジタル総合サービス網)プロトコル、ケーブルプロトコル、デジタル加入者線プロトコル(まとめて、xDSLと呼ばれる)、ファイバネットワーク、LAN(ローカルエリアネットワーク)、WAN(ワイドエリアネットワーク)、およびその他が含まれる。無線通信を利用する電子デバイスには、電話機(例えば、セル電話機)、PDA(パーソナルデータアシスタント)、ハンドヘルドコンピュータおよびポータブルコンピュータ、ならびにその他が含まれる。これらのアプリケーションのすべてではないにしても、ほとんどにおいて、帯域幅要件および/または帯域幅制限により、マルチメディアデータ処理が、マルチメディアデータの分析、定量化、および表現を行うマルチメディア圧縮アルゴリズムを組み込んだ源符号器を利用して、「最小限の」数のビットを費やすことによって最大限の情報を伝送することが必要とされる。そのようなアルゴリズムの特性は、それぞれに大きく異なり、このことは、それらのアルゴリズムのパフォーマンス(圧縮効率やビットレートなどの)の広範囲に及ぶばらつきにつながる。圧縮アルゴリズムを使用するマルチメディア処理の特性は、コンテンツに基づき、多種多様であることが可能であり、このことは、それらの処理のパフォーマンス(圧縮効率やビットレートなどの)の広範囲に及ぶばらつきにつながる可能性がある
仮出願第60/660,677号
一部のマルチメディアデータ処理スキームは、いくつかのタイプの情報を使用して、マルチメディアデータを分類する。通常、イメージ分類アルゴリズムは、何らかの形態のイメージセグメント化方法に基づく。イメージクラスタ化アルゴリズムが、MPEG−7(フォトクラスタ化)のためのMPEGにおいて提案されている。現在、提案され、文献で説明されているイメージ分類アルゴリズムは、マルチメディアデータの数学的態様および統計的態様に基づいている。マルチメディアデータを処理し、符号化するための改良された方法およびデバイスが、有線通信においても、無線通信においても幅広い応用先を有する可能性があり、当技術分野において、そのような処理の特性を利用し、かつ/または変更して、そのような処理の特徴が、既存の製品を改良する際、および、まだ開発されていない新たな製品を作成する際に活用されることが可能であるようにすることが、有益であろう。
本発明の装置および方法のそれぞれは、いくつかの態様を有し、それらの態様のいずれも単独で、本発明の望ましい属性をひとえに担うことはない。本発明の範囲を限定することなしに、本発明のより顕著な特徴を以下に簡単に説明する。この説明を考慮した後、特に、「発明を実施するための最良の形態」という題名のセクションを読んだ後、マルチメディアデータ処理装置およびマルチメディアデータ処理方法の改良の特徴が、理解されよう。
一態様では、マルチメディアデータを処理する方法が、マルチメディアデータの複雑度を判定すること、判定された複雑度に基づいてマルチメディアデータを分類すること、およびマルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定することを含む。また、方法は、マルチメディアデータの空間的複雑度および時間的複雑度を判定することも含み、マルチメディアデータを分類することは、空間的複雑度をテクスチャ値に関連付けること、時間的複雑度をモーション値に関連付けること、およびテクスチャ値およびモーション値に基づいてコンテンツ分類をマルチメディアデータに割り当てることを含むことが可能である。
別の態様では、マルチメディアデータを処理するための装置が、マルチメディアデータの複雑度を判定するための手段と、判定された複雑度に基づいてマルチメディアデータを分類するための手段と、マルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定するための手段とを含む。
別の態様では、マルチメディアデータを処理するように構成されたデバイスが、マルチメディアデータの複雑度を判定するように構成され、判定された複雑度に基づいてマルチメディアデータを分類するように構成され、マルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定するようにさらに構成されたプロセッサを含む。
別の態様では、マルチメディアデータを処理するための方法を実体化するためのコンピュータ可読媒体が、マルチメディアデータの複雑度を判定すること、判定された複雑度に基づいてマルチメディアデータを分類すること、およびマルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定することを含む。
別の態様では、マルチメディアデータを処理するための装置が、マルチメディアデータの複雑度を判定する第1のディターミナと、判定された複雑度に基づいてマルチメディアデータを分類するコンテンツクラシファイアと、マルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定する第2のディターミナとを含む。一部の態様では、複雑度には、マルチメディアデータの空間的複雑度、および/またはマルチメディアデータの時間的複雑度が含まれ、マルチメディアデータの分類は、空間的複雑度および/または時間的複雑度に基づくことが可能である。
さらに他の態様では、マルチメディアデータを処理するための方法および装置が、マルチメディアデータの複雑度を判定するための方法または手段と、判定された複雑度に基づいてマルチメディアデータを分類するための方法または手段とを含む。マルチメディアデータを処理するための方法および装置が、マルチメディアデータの複雑度を判定するための方法または手段と、判定された複雑度に基づき、少なくとも1つのマルチメディアプロセスから選択を行うための方法または手段とを含むことが可能である。マルチメディアデータを処理するための方法および装置が、マルチメディアデータの複雑度を判定するための方法または手段と、マルチメディアデータの複雑度に基づいて符号化プロセスセットを選択するための方法または手段とを含むことが可能である。マルチメディアデータを処理するための方法および装置が、判定された複雑度に基づいてマルチメディアデータを分類するための方法または手段と、マルチメディアデータの分類に基づいてマルチメディアデータを符号化するためのビットレートを決定するための方法または手段とを含むことが可能である。マルチメディアデータを処理するための方法および装置が、マルチメディアデータの複雑度を判定するための方法または手段と、マルチメディアデータの複雑度に基づいて復号プロセスセットを選択するための方法または手段とを含むことが可能である。マルチメディアデータを処理するための方法および装置が、マルチメディアデータの複雑度を判定するための方法または手段と、判定された複雑度に基づいてマルチメディアデータを分類するための方法または手段と、マルチメディアデータの分類に基づいて復号プロセスセットを選択するための方法または手段とを含むことが可能である。方法および装置は、コンピュータ可読媒体および/またはプロセッサによって実施されることが可能であることに留意されたい。
以下の詳細な説明は、使用されることが可能な、いくつかの実施形態を対象とする。しかし、開示される諸実施形態は、多数の異なる仕方で実施されることが可能である。本明細書において「一実施形態」または「或る実施形態」について述べることは、その実施形態に関連して説明される特徴、構造、または特性が、少なくとも1つの実施形態に含まれることを意味する。本明細書の様々な箇所における「一実施形態では」、「一実施形態によれば」、または「一部の実施形態では」という句の出現は、必ずしもすべて、同一の実施形態について述べているわけではなく、別々の実施形態、または代替の実施形態が、他の実施形態と相互排他的であるわけでもない。さらに、一部の実施形態が示し、他の実施形態が示さないことが可能な、様々な特徴が、説明される。同様に、一部の実施形態に関して要件であるが、他の実施形態に関しては要件ではない可能性がある、様々な要件が、説明される。
以下の説明は、実施例の完全な理解をもたらす詳細を含む。しかし、実施例は、或る実施例または実施形態におけるプロセスまたはデバイスのすべての詳細が、本明細書で説明されない、または示されない場合でも、実施されることが可能であることが、当業者には理解されよう。例えば、不必要な詳細で実施例を不明瞭にしないように、電気コンポーネントが、そのコンポーネントのすべての電気接続、またはすべての電気要素は示さないブロック図で示されることが可能である。その他、そのようなコンポーネント、その他の構造および技術が、実施例をさらに説明するように、詳細に示される可能性がある。
マルチメディアデータのコンテンツ(例えば、1つまたは複数のコンテンツ分類)に基づいてマルチメディアデータをカテゴリに分類することを利用する、マルチメディアデータを符号化するための装置および方法の実施例が、本明細書で説明される。説明される方法および装置は、マルチメディアデータの空間的特性および時間的特性を判定すること、およびマルチメディアデータの複雑度の特性の1つまたは複数に基づいてマルチメディアデータを分類することに基づき、マルチメディアデータを符号化するための技術を提供する。それらの方法および装置は、マルチメディアデータ処理アルゴリズムおよび圧縮アルゴリズムが、マルチメディアデータのコンテンツカテゴリに基づいて「調整」されることを可能にして、コンテンツ情報を使用してマルチメディアデータを符号化するのに使用される方法および装置を最適化し、人間の目、または品質レベルの別の測度(measure)によって認識されるマルチメディアデータの所望される品質レベルを効率的に提供する。
本明細書で使用される「マルチメディアデータ」は、ビデオデータ(オーディオデータを含むことが可能な)、オーディオデータ、またはビデオデータとオーディオデータの両方を含む広い用語である。テキストまたはイメージ情報および/またはオーディオデータを含むイメージシーケンスを指す、本明細書で広い用語として使用される「ビデオデータ」または「ビデオ」は、特に明記しない限り、マルチメディアデータを指すように使用されることが可能である(例えば、これらの用語は、区別なく使用されることが可能である)。
マルチメディアコーデックシステムは、一般に、異なるコンテンツタイプを考慮に入れない。代わりに、符号化は、すべてのコンテンツタイプに関して同様の仕方で行われる。
通常、マルチメディアデータは、一定の品質、または一定のビットレートで符号化される。一定のビットレートで符号化することは、低い活動のセクションと高い活動のセクションに関して符号化されたビデオの品質の相違につながる。例えば、スポーツクリップを含む新たなシーケンスが、各セクションに割り当てられた同一の数のビットで符号化される可能性がある。観られる際、スポーツクリップセクションは、語り手の顔(talking head)のセクションより低い品質であると知覚され、全体的な結果が、許容できない可能性がある。一定の品質で符号化することは、ビットレートの非効率な使用につながる。低い活動のビデオを高い品質で符号化することは、不必要に高いビットレートを使用して、帯域幅の浪費がもたらされる。シーケンスにおける一般的なコンテンツタイプだけに基づいてではなく、ビデオシーケンスにおけるテクスチャおよび動きに基づいてマルチメディアデータを分類することにより、ビットレートが、その特定のデータに関する実際のテクスチャを有する動き(textured motion)に基づき、そのシーケンスにわたって調整されることが可能である。より良好なビット管理、および利用可能なビット予算の、よりインテリジェントな使用をもたらすことが可能なコンテンツ分類が、様々なアプリケーションにおいて使用されることが可能である。例えば、一部の実施形態では、1つのコンテンツ分類が、ビデオデータシーン変化検出に関して使用されることが可能である。
(マルチメディアデータの通信)
クライアントデバイスに通信されるマルチメディアデータは、通常、圧縮される。MPEG−xおよびH.26xとして知られるビデオ符号化標準のペアが、固定長または可変長の源符号化技術を使用するビデオ、オーディオ、およびその他の情報の圧縮および伝送によく適した、データ処理技術およびデータ操作技術(本明細書で、混成符号化と呼ぶ)を説明する。特に、前述した標準、およびその他の混成符号化の標準および技術は、例として、フレーム内符号化技術(例えば、ランレングス符号化、ハフマン符号化などの)、およびフレーム間符号化技術(例えば、前方予測符号化および後方予測符号化、動き補償などの)を使用して、マルチメディア情報を圧縮する。具体的には、マルチメディア処理システムのケースでは、混成マルチメディア符号化システムが、フレーム内動き補償符号化および/またはフレーム間動き補償符号化を使用するマルチメディアフレームの予測ベースの圧縮符号化を特徴とする。少なくともある程度、コンテンツ分類に基づく符号化が、そのような圧縮アルゴリズムに組み込まれて、マルチメディア処理をさらに最適化することが可能である。本明細書で説明される実施例は、ビデオ符号化標準、MPEGおよびH.26xに向けて書かれるが、他のビデオ符号化標準の同様の使用も、適用可能である。
フレーム間符号化とは、他のいずれのピクチャ(フィールドまたはフレーム)も基準とすることなしに、ピクチャを符号化することを指すが、イントラ符号化された(intra−coded)ピクチャは、他のピクチャのための基準として使用されることが可能である。フレーム内、イントラ符号化されたフレーム、およびIフレームという用語はすべて、本願明細書全体で使用されるイントラ符号化を使用して形成されたビデオオブジェクトの例である。
インタ符号化または予測符号化とは、別のピクチャを基準としてピクチャ(フィールドまたはフレーム)を符号化することを指す。イントラ符号化されたピクチャと比べて、インタ符号化されたピクチャ、つまり、予測ピクチャは、より高い効率で符号化されることが可能である。本明細書全体で使用されるインタ符号化されたピクチャの例が、(Pフレームとも呼ばれる、前方予測または後方予測された)予測フレーム、および(Bフレームとも呼ばれる)双方向予測フレームである。インタ符号化を表す他の用語には、ハイパス符号化(high−pass coding)、残差符号、動き補償補間、および当業者には周知のその他の用語が含まれる。
スケーラブル符号化として知られている技術は、イントラ符号化されたピクチャ、および異なるインタ符号化されたピクチャ(PフレームまたはBフレームなどの)を、例えば、基本階層(base layer)および拡張階層(enhancement layer)などの、ビットストリームにおける異なる階層に分割することができる。スケーラブル符号化は、スケーラブルなビットストリームが、ネットワーク帯域幅の変動に適合するように適応させられることが可能な動的チャネルにおいて有用である。誤りが生じがちなチャネルにおいて、スケーラブル符号化は、基本階層と拡張階層の同等でない誤り保護を介して、堅牢さを高めることができる。より重要な階層に、より良好な誤り保護が適用されることが可能である。
(マルチメディアデータを符号化すること)
図1は、マルチメディアデータのコンテンツを分類するため、そのようなデータを符号化するため、通信するため、および復号するための一般的な通信システムのブロック図である。システム100は、符号化デバイス105と、復号デバイス110とを含む。符号化デバイス105は、イントラ符号化コンポーネント115と、予測符号化コンポーネント120とを含む符号化コンポーネント185を含む。符号化デバイス105は、メモリコンポーネント130と、通信コンポーネント175と、コンテンツ分類コンポーネント190とをさらに含む。符号化デバイス105は、通信コンポーネント175の中に含まれる通信ロジックを使用して、外部源135からデータを受信することができる。外部源135は、例えば、外部メモリ、インターネット、ライブのビデオおよび/またはオーディオフィード(feed)であることが可能であり、データを受信することは、有線通信および/または無線通信を含むことが可能である。外部源135の中に含まれるデータは、生の(符号化されていない)フォーマットであることも、符号化された状態であることも可能である。イントラ符号化コンポーネント115が、フレームのイントラ符号化される部分(スライス、マクロブロック、およびサブマクロブロック)を符号化するのに使用される。予測符号化コンポーネント120が、前方予測、後方予測、および双方向予測を含め、フレームの予測部分を符号化するのに使用される。符号化の後、符号化されたフレームは、メモリコンポーネント130または外部メモリの中に格納される。外部メモリは、外部源135内部に、または別個のメモリコンポーネント(図示せず)内部に含まれることが可能である。
符号化デバイス105は、メモリコンポーネント130、および符号化デバイス105内部のその他のコンポーネントの1つまたは複数と通信するプロセッサ187を含む。プロセッサ187は、符号器のその他のコンポーネントのいずれに関する処理も実行することができ、メイン符号化プロセスを含むことが可能である。一部の実施形態では、プロセッサ187は、別個のコンポーネント(図示するように)ではなく、代わりに、プロセッサ機能は、符号器105のその他のコンポーネントの1つまたは複数に組み込まれることが可能である。
通信コンポーネント175は、ネットワーク140と連携してデータ伝送(Tx)のために使用されるロジックを含む。ネットワーク140は、電話システム、ケーブルシステム、および光ファイバシステムなどの有線システム、または無線システムの一部であることが可能である。無線通信システムの場合、ネットワーク140は、例えば、符号分割多元接続(CDMAまたはCDMA2000)通信システムの一部を含むことが可能であり、あるいは、代替として、システムは、周波数分割多元接続(FDMA)システム、直交周波数分割多重化(OFDM)システム、サービス業界に関するGSM/GPRS(汎用パケット無線サービス)/EDGE(拡張データGSM環境)またはTETRA(地上基盤無線)移動電話技術などの時間分割多元接続(TDMA)システム、広帯域符号分割多元接続(WCDMA)システム、高データ転送速度(1xEV−DOまたは1xEV−DOゴールドマルチキャスト)システム、または、一般に、技術の組合せを使用する任意の無線通信システムであることが可能である。符号化されたフレームは、ネットワーク140を介して伝送される(Tx)。符号化デバイス105によって実行される符号化プロセスについて、以下により完全に説明する。
コンテンツ分類コンポーネント190は、外部源135から受信されたマルチメディアデータのデータコンテンツの分類を判定するためのロジックを含む。マルチメディアデータを分類するのに、人間視覚モデルを使用して、イメージおよび/またはモーションイメージシーケンスにおける空間的コンテキストおよび/または時間的コンテキストに関して、視覚信号の輝度の摂動(perturbation)に対する人間の目の感度が定量化される。また、目の空間的マスキング効果および時間的マスキング効果も、考慮に入れられる。一態様は、動き推定アルゴリズムまたはブロックマッチングアルゴリズムを使用して、ビデオの時間的態様を表現することを含む。マルチメディアデータと関係する情報、例えば、ビデオデータの空間的複雑度値および時間的複雑度値は、符号器105の1つまたは複数のコンポーネントによって算出され、ビデオにおける空間的効果および動き効果の知覚可能性(perceptibility)と併せて使用されて、ビデオデータのコンテンツが、2つ以上のカテゴリに分類される。そのような分類は、前/後処理アルゴリズムおよび圧縮(例えば、シーン変化検出、レート制御、FRUC)アルゴリズムにおいて使用されることが可能である。コンテンツ分類は、来るべきビデオデータ(例えば、スーパフレーム)において、どのようなタイプのコンテンツを予期すべきかについての信頼できる推定を符号器105に提供することを、符号器105が、コンテンツ分類に基づいて、或る特定のレベルの視覚的に知覚される品質を実現する適切なビットレート割り当てを決定することができるように、さらに、他のフレームタイプの判定目的で、行う。スーパフレームは、コンテンツクラスを判定するため、伝送するための単位として、さらに他の任意の目的で使用される、通常は、1秒分のデータに相等する、所定の期間または時間枠にわたるメタデータセットである。コンテンツ分類は、人間の目によって知覚されるマルチメディアデータの特性、例えば、空間的複雑度および時間的複雑度に基づくことが可能である。マルチメディア処理アルゴリズムは、様々なコンテンツタイプのために最適化されることが可能であり、マルチメディアデータを符号化する際、および通信する際のパフォーマンスに関して安定および制御をもたらす。
符号化コンポーネント185は、コンテンツ分類コンポーネント190によって使用されるように、処理情報(例えば、マクロブロックの)を提供することができる。例えば、符号化コンポーネント185は、Dcsat値、コントラスト比の値、MV(動きベクトル)、およびSAD(絶対ピクセル差の合計)などの人間視覚感度メトリックを含む、マルチメディアデータからの情報を計算することができる。符号化コンポーネント185は、その情報をメモリコンポーネント130の中に格納して、その情報が、マルチメディアデータの空間的複雑度および時間的複雑度、データのテクスチャおよび動きを判定し、次に、結果のコンテンツ分類を判定するように、コンテンツ分類コンポーネント190によって取り出されるように利用可能であるようにすることができる。別の態様では、コンテンツ分類コンポーネント190、あるいはプロセッサ187のような別のコンポーネントが、マルチメディアデータから、その情報の少なくとも一部を計算する。
(復号プロセス)
復号デバイス110は、イントラ復号コンポーネント145、予測復号コンポーネント150、メモリコンポーネント160、プロセッサ167、および通信コンポーネント180を含め、符号化デバイス105内部のコンポーネントのいくつかと同様のコンポーネントを含む。復号デバイス110は、ネットワーク140を介して、または外部ストレージ165から伝送された、符号化されたデータを受信する。通信コンポーネント180は、ネットワーク140と連携して、符号化されたデータを受信するために(Rx)使用されるロジックとともに、外部ストレージ165から符号化されたデータを受信するためのロジックを含む。外部ストレージ165は、例えば、外部RAMまたは外部ROM、あるいはリモートサーバであることも可能である。イントラ復号コンポーネント145は、イントラ符号化されたデータを復号するのに使用される。予測復号コンポーネント150は、インタ符号化されたデータを復号するのに使用される。プロセッサ167は、メモリコンポーネント160、および復号デバイス110内部のその他のコンポーネントの1つまたは複数と通信している。プロセッサ167は、復号器のその他のコンポーネントのいずれに関する処理も実行することができ、メイン復号プロセスを含むことが可能である。予測復号コンポーネント150は、(前方予測または後方予測された)PフレームとBフレームをともに復号する。Pフレームを復号するために使用される同一のサブコンポーネントを直列に利用して、複数の基準を使用してBフレームが復号されることが可能である。
Bフレームに関する複数の基準は、前方基準フレームと後方基準フレームの中にあること、ともに同一の基準フレームの中にあること、ともに別々の前方基準フレームの中にあること、またはともに後方基準フレームの中にあることが可能である。
復号の後、復号されたフレームは、ディスプレイコンポーネント170を使用して表示されること、あるいは内部メモリ160または外部ストレージ165の中に格納されることが可能である。ディスプレイコンポーネント170は、ディスプレイスクリーンを含め、ビデオディスプレイのハードウェアやロジックなどの部分を含む復号デバイスの不可分の部分であることが可能であり、あるいはコンポーネント170は、外部周辺デバイスであることが可能である。復号デバイス110によって実行される復号プロセスについて、以下により完全に説明する。
(例示的なMPEGを符号化すること)
通常のMPEG復号器において、予測符号化されたピクセルブロック(例えば、1つまたは複数の動きベクトル、および残差誤り成分を含むブロック)は、基準フレームを基準として復号される(イントラフレーム、または別の予測されたフレームが、基準フレームの役割をすることができる場合)。図2は、GOP(Group of Pictures)に関するフレーム依存関係を表す、従来のMPEG−4シンプルプロファイルデータストリームを示す図である。GOP10は、初期のIフレーム12と、その後に続く、いくつかの前方予測されたPフレーム14で構成される。先行するIフレームまたはPフレームに対するPフレームの依存関係のため、それらのPフレーム14のいずれが失われることも、他のPフレームを復号する際に極めて重要である可能性がある情報の損失をもたらす可能性がある。Pフレームの損失または削除は、例えば、ビデオジッタ、または復号器が、次のGOPの先頭の印である次のIフレーム16まで、復号を続けることができないことをもたらす可能性がある。
Pフレーム(または任意のインタ符号化されたセクション)は、現在のピクチャの中の或る領域と、基準ピクチャの中の最もよく合致する予測領域との間の時間的冗長性を活用することができる。現在の領域と、最もよく合致する基準予測領域との間の差は、残差誤り(または予測誤り)として知られる。基準フレームの中の最もよく合致する予測領域の位置は、動きベクトルにおいて符号化されることが可能である。プロセッサ167は、復号器110のその他のコンポーネントのいずれに関する処理も実行することができ、メイン復号プロセスを含むことが可能である。一部の実施形態では、プロセッサ167は、別個のコンポーネントであることが不可能であるが、代わりに、プロセッサ機能は、復号器110のその他のコンポーネントの1つまたは複数に組み込まれることが可能である。
図3は、例えば、MEPG−4におけるPフレーム構築プロセスの例の図である。プロセス300は、5×5個のマクロブロックで構成される現在のピクチャ305を含み、この例におけるマクロブロックの数は、任意である。マクロブロックは、関連するピクセルのグループであり、この例では、16×16個までのピクセルで構成される。ピクセルは、8ビットの輝度値(Y)と、2つの8ビットのクロミナンス値(CrおよびCb)とによって定義されることが可能である。MPEGでは、Y成分、Cr成分、およびCb成分は、4:2:0フォーマットで格納されることが可能であり、ただし、Cr成分およびCb成分は、X方向およびY方向で1/2にダウンサンプリングされる(down−sampled by 2)。したがって、各マクロブロックは、256のY成分、64のCr成分、および64のCb成分から成る。
現在のピクチャ305のマクロブロック315は、現在のピクチャ305とは異なる時点における基準ピクチャ310から予測される。符号化される現在のマクロブロック315にY値、Cr値、およびCb値の点で最も近い、最もよく合致するマクロブロック320を探し出す探索が、基準ピクチャ310において行われる。当業者に知られている、最もよく合致するマクロブロック320を探索する方法には、a)現在のマクロブロック315と基準ピクチャ310マクロブロック315との間のSAD(絶対ピクセル差の合計)を最小にすること、b)SSD(2乗されたピクセル差の合計)を最小にすること、およびc)レート歪みの点で費用を最小にすること、その他が含まれる。基準ピクチャ310における最もよく合致するマクロブロック320の位置は、動きベクトル325において符号化される。基準ピクチャ310は、現在のピクチャ305の構築に先立って復号器が再構築したIフレームまたはPフレームであることが可能である。最もよく合致するマクロブロック320が、現在のマクロブロック315から引かれて(Y成分、Cr成分、およびCb成分のそれぞれに関する差が、計算されて)、残差誤り330がもたらされる。残差誤り330は、2D離散コサイン変換(DCT)335を使用して符号化され、次に、量子化340される。
量子化340は、例えば、低い周波数の係数に、より多くのビットを割り当てながら、高い周波数の係数に、より少ないビットを割り当てることにより、空間的圧縮を提供するように実行されることが可能である。残差誤り330の量子化された係数、ならびに情報を同定する動きベクトル325および基準ピクチャ310が、現在のマクロブロック315を表す符号化された情報である。符号化された情報は、将来の使用のためにメモリの中に格納されること、または、例えば、誤り訂正またはイメージ向上の目的で操作されること、またはネットワーク345を介して伝送されることが可能である。
残差誤り330の符号化された、量子化された係数、ならびに符号化された動きベクトル325は、その後の動き推定および動き補償のための基準フレームの一部として使用されるように、符号器において現在のマクロブロック315を再構築するのに使用されることが可能である。符号器は、このPフレーム再構築のために復号器の手続きをエミュレートすることができる。復号器のエミュレーションは、符号器と復号器がともに同一の基準ピクチャを扱うことをもたらす可能性がある。符号器において行われるか、さらなるインタ符号化のために行われるか、または復号器において行われるかにかかわらず、再構築プロセスを、以下に提示する。Pフレームの再構築は、基準フレーム(または基準とされるピクチャまたはフレームの一部分)が再構築された後、開始されることが可能である。符号化された、量子化された係数が、逆量子化350され、次に、2D逆DCT、つまり、IDCT355が、実行されて、復号された、つまり、再構築された残差誤り360がもたらされる。符号化された動きベクトル325が、既に再構築済みの基準ピクチャ310において、既に再構築済みの、最もよく合致するマクロブロック365を探し出すのに使用される。再構築された残差誤り360が、次に、再構築された、最もよく合致するマクロブロック365に追加されて、再構築されたマクロブロック370を形成する。再構築されたマクロブロック370は、メモリの中に格納される、独立に、もしくは、他の再構築されたマクロブロックとともにピクチャにおいて表示される、またはイメージ向上のためにさらに処理されることが可能である。
(マルチメディアデータのコンテンツ分類)
図4は、図1に示されるコンテンツ分類コンポーネント190のブロック図である。コンテンツ分類コンポーネント190は、マルチメディアデータの空間的複雑度および時間的複雑度を判定するように構成され、さらに、テクスチャ値を空間的複雑度に関連付け、モーション値を時間的複雑度に関連付けるようにも構成された複雑度コンポーネント192を含む。符号化されるマルチメディアデータに関して、コンテンツ分類コンポーネント190は、データのコンテンツと関係する前処理された情報をメモリ130から取り出す。この情報には、例えば、1つまたは複数のDcsat値、コントラスト比の値、MV(動きベクトル)、およびSAD(絶対ピクセル差の合計)が含まれることが可能である。
この情報が、プリプロセッサ(例えば、図1の符号化コンポーネント185またはプロセッサ187)によって算出されない諸態様では、分類コンポーネント190が、この情報を計算する機能を含むことが可能である。
一般に、マルチメディアデータは、1つまたは複数のイメージシーケンスまたはフレームシーケンスを含む。各フレームは、処理のためにピクセルのブロックに分割されることが可能である。空間的複雑度は、フレーム内の空間的詳細レベルの測度を一般的に表す広い用語である。主に単純な、または変化しない、またはあまり変化しない輝度およびクロミナンスの領域を有するシーンは、低い空間的複雑度を有する可能性がある。空間的複雑度は、ビデオデータのテクスチャに関連付けられる。空間的複雑度は、この態様では、局所的空間周波数および周囲照明(ambient lighting)の関数として各ブロックに関して計算される、Dcsatと呼ばれる人間視覚感度メトリックに基づく。当業者は、視覚的イメージの空間周波数パターン、ならびに照明特性およびコントラスト特性を使用して、人間視覚系を利用するための技術を認識している。人間視覚系の遠近感の限界を利用するための、いくつかの感度メトリックが、知られており、本明細書で説明される方法と一緒に使用されることが可能である。
時間的複雑度は、フレームシーケンスの中のフレーム間で基準とされるマルチメディアデータにおける動きのレベルの測度を一般的に表すのに使用される広い用語である。ほとんど、または全く動きを有さないシーン(例えば、ビデオデータのフレームシーケンス)は、低い時間的複雑度を有する。時間的複雑度は、各マクロブロックに関して計算されることが可能であり、1つのフレームと別のフレーム(例えば、基準フレーム)との間のDcsat値、動きベクトル、および絶対ピクセル差の合計に基づくことが可能である。
(シーン変化検出)
シーン変化検出は、固定の間隔でIフレームを挿入することにより、ビットを浪費することなしに、ビデオ符号化システムが、ビットをインテリジェントに節約する、いずれのビデオ符号化システムにも必要なステップである。以下の説明は、シーン変化がどのように検出されることが可能であるか、およびコンテンツ分類における、シーン変化の、その後の使用を示す。
GOPの長さは、大きいIフレームからの効率的損失を小さくするのに十分なだけ長く、符号器と復号器の間の不適合、またはチャネル障害に対処するのに十分なだけ短いことが可能である。加えて、Pフレームの中のMB(マクロブロック)が、同一の理由でイントラ符号化されることが可能である。
実際的なストリーミングビデオシステムにおいて、通信チャネルには、通常、ビット誤りまたはパケット損失によって障害が生じる。どこにIフレームまたはI MBを配置するかは、復号されたビデオ品質、および見る体験(viewing experience)に大きな影響を与える可能性がある。経験則は、配列された先行するピクチャまたはピクチャ部分から大きく変化しているピクチャまたはピクチャ部分に関して、イントラ符号化を使用することである。それらの領域は、動き推定を使用して、効果的に、効率的に予測することはできない。したがって、それらの領域は、インタ符号化技術から除外される。チャネル障害の文脈において、それらの領域は、誤り伝播を被る可能性が高い。イントラ符号化を使用して、誤り伝播を減らすことができる。
イントラ更新される必要がある領域は、3つのカテゴリとして分類されることが可能である。
(1)急なシーン変化 このカテゴリには、通常、カメラ操作によって生じる、前のフレームとは大きく異なるフレームが含まれる。それらのフレームのコンテンツは、前のフレームのコンテンツとは異なるので、急なシーン変化のフレームは、Iフレームとして符号化されることが可能である。
(2)クロスフェージング、およびその他のゆっくりしたシーン変化 このカテゴリには、通常、カメラショットのコンピュータ処理によって生じる、シーンのゆっくりした切り替わりが含まれる。異なる2つのシーンが徐々に混ざり合うことは、人間の目に、より感じよく見える可能性があるが、ビデオ符号化に課題をもたらす。動き補償は、それらのフレームのビットレートを効果的に低減することができない。より多くのイントラMBが、それらのフレームのために更新される必要がある。
(3)カメラフラッシュライト カメラフラッシュライトは、ピクチャの輝度を突然に、迅速に変える。通常、カメラフラッシュライトの時間は、通常、44ミリ秒であると定義されるHVS(人間視覚系)の時間的マスキング期間より短い。人間の目は、それらの短い明るさのバーストの品質に反応せず、したがって、それらのバーストは、粗く符号化されることが可能である。フラッシュライトフレームは、動き補償で有効に扱うことができず、将来のフレームに関する不良な予測候補であるため、それらのフレームを粗く符号化することによって、将来のフレームの符号化効率が低下することはない。
以上のフレームのいずれかが検出されると、ショットイベントが宣言される。ショット検出は、符号化品質を向上させるのに役立つだけでなく、ビデオコンテンツ検索/索引付けの助けにもなることが可能である。1つの検出アルゴリズムを以下に説明する。
シーケンスは、双方向動き補償器で前処理される。補償器は、図11に示されるとおり、現在のフレームの8×8ブロックを、このフレームの最も近接した近傍フレームの、1つは過去の、1つは将来の2つのフレームのブロックと照合する。動き補償器は、すべてのブロックに関して動きベクトル、および差分メトリックを生成する。差分メトリックは、SSD(2乗差分の合計)またはSAD(絶対差分の合計)であることが可能である。
一般性を逸することなく、SADを本明細書における例として使用する。
すべてのフレームに関して、SAD比が、以下のとおり計算される。すなわち、
Figure 0005318561
ただし、SADおよびSADは、それぞれ、前方差分メトリックおよび後方差分メトリックのSADである。この分母は、「0による除算」の誤りを防止するように、小さい正の値εを含むことに留意されたい。また、分子(nominator)も、分母における結合の効果とバランスをとるようにεを含む。例えば、前のフレーム、現在のフレーム、および次のフレームが同一である場合、動き検出(motion search)は、SAD=SAD=0をもたらす。この場合、前述の計算ジェネレータγ=0または無限大ではなく、1である。
また、すべてのフレームの輝度ヒストグラムも求める。通常、輝度深度(luminance depth)が8ビットであるイメージを扱う。この輝度深度に関して、ビンの数を16に設定して、ヒストグラムを得ることができる。以下のメトリックは、ヒストグラム差分を評価する。
Figure 0005318561
ただし、NPiは、前のフレームに関する第i番のビンにおけるブロックの数であり、NCiは、現在のフレームに関する第i番のビンにおけるブロックの数であり、Nは、フレーム内のブロックの総数である。明らかに、前のフレームのヒストグラムと現在のフレームのヒストグラムが、互いに素である場合、λ=2である。
急なシーン変化のフレームは、数式3に示されるとおり、以下の基準が満たされた場合、宣言される。
Figure 0005318561
ただし、Aは、アプリケーションによって選択される定数であり、Tは、しきい値である。シミュレーションは、A=1、かつT=1が、良好な検出パフォーマンスを実現することを示す。現在のフレームが、急なシーン変化のフレームである場合、γは、大きいことが可能であり、γは、小さいことが可能である。Mをシーン変化強度メトリックと呼ぶ。γ単独ではなく、比
Figure 0005318561
を使用して、メトリックが、コンテキストの活動レベルに対して正規化されるようにすることができる。
前述の基準は、輝度ヒストグラム差λを非線形の仕方で使用することに留意されたい。
図12を参照すると、これは、凸関数であることを見て取ることができる。λが、小さい(0に近い)場合、それは、ほとんどプリエンファシスではない。λが大きくなるほど、より多くのエンファシスが、関数によって導かれる。このプリエンファシスの場合には、1.4より大きい任意のλに関して、しきい値Tが、5に設定されている場合、急なシーン変化が検出される。
クロスフェージング、およびその他のゆっくりしたシーン変化は、或る数の連続するフレームに関して、T≦M≦Tである場合に検出され、ただし、Tは、しきい値である。
カメラフラッシュライトイベントを検出するのに、輝度ヒストグラム統計を使用することができる。例えば、フラッシュライトイベントは、通常、輝度ヒストグラムが、より明るい側に移ることを生じさせる。以下の基準が、カメラフラッシュライトイベントを検出するのに課せられることが可能である。
Figure 0005318561
=30が、良好な検出パフォーマンスを実現する。SAD値を含める理由は、カメラフラッシュが、通常、1フレームを要し、輝度差に起因して、そのフレームを、前方方向と後方方向の両方からの動き補償を使用して、うまく予測することができないためである。
図1を再び参照すると、コンテンツ分類コンポーネント190は、動きベクトル、および絶対ピクセル差分の合計を計算する機能を含むことが可能であるものの、通常、その他の符号化コンポーネントが、その情報を計算することができ、そのデータをコンテンツ分類コンポーネント190に提供する。また、Dcsat値も、複雑度コンポーネント192、または符号器105の別のコンポーネント、あるいはプロセッサ187によって計算されることが可能である。
代替として、コントラスト比が、フレームの空間的複雑度を算出する際に使用されることが可能である。第1に、フレームの中の各マクロブロックに関するコントラスト比が、計算される。所与のマクロブロックに関するコントラスト比は、そのマクロブロックの近傍マクロブロックに関する平均輝度に基づいて計算される。図5は、各マクロブロックが、16×16個のピクセルである、ビデオフレーム内の9つのマクロブロックのグループを示す。μは、所与のマクロブロック1〜9に関する平均値を表す。中央マクロブロックブロックであるマクロブロック5(CR)に関するコントラスト比計算は、以下の数式を使用して計算される。すなわち、
Figure 0005318561
ただし、MBLUMAは、マクロブロック5に関する平均輝度コントラストを表す。マクロブロック1〜4およびマクロブロック6〜9に関するコントラスト比も、同様に計算される。フレームのコントラスト比は、フレーム内の9つのマクロブロックの各マクロブロックのコントラスト比値の平均をとることによって得られる。また、9つのマクロブロックのコントラスト比の標準偏差も計算され、各フレーム内のテクスチャの変動の量の指標をもたらす。
(コンテンツ分類メトリックを決定すること)
コンテンツ分類メトリックが、コントラスト比値、コントラスト比値の標準偏差、およびフレーム差分メトリックを使用して決定されることが可能である。
(フレーム差分メトリック)
コンテンツ分類モジュールのための他方の入力は、プリプロセッサにおいて計算されるフレーム差分メトリックである。フレーム差分メトリックは、予測(predictor)マクロブロックと現在のマクロブロック(図3、成分325)の間のSAD(絶対差分の合計)として表現される残差エネルギーとともに、動きの量(例えば、動きベクトル、つまり、MV)を考慮に入れて、連続する2つのフレーム間の差分の測度を与える。また、フレーム差分は、双方向または単方向の予測効率の測度も与える。
動き補償された逆インタレースを場合により実行するプリプロセッサから受け取られた動き情報に基づくフレーム差分メトリックの一例は、以下のとおりである。ディインタレーサ(deinterlacer)が、双方向動き推定を実行し、このため、双方向動きベクトルおよびSAD情報が、利用できる。
各マクロブロックに関するSAD_MVによって表されるフレーム差分は、以下のように導き出されることが可能である。すなわち、
Figure 0005318561
ただし、MV=Square_root(MV +MV )、SAD=min(SAD,SAD)、ただし、SADは、後方基準フレームから計算されたSADであり、SADは、前方基準フレームから計算されたSADである。
フレーム差分を推定するもう1つのアプローチは、以下のようにメトリック、ガンマを計算することによる。すなわち、
Figure 0005318561
ただし、SADおよびSADは、それぞれ、前方差分メトリックおよび後方差分メトリックのSADである。この分母は、「0による除算」の誤りを防止するように、小さい正の値εを含むことに留意されたい。また、分子も、分母における結合の効果とバランスをとるようにεを含む。
また、すべてのフレームの輝度ヒストグラムも求める。通常、輝度深度(luminance depth)が8ビットであるイメージを扱う。この輝度深度に関して、ビンの数を16に設定して、ヒストグラムを得ることができる。以下のメトリックは、ヒストグラム差分を評価する。
Figure 0005318561
ただし、NPiは、前のフレームに関する第i番のビンにおけるブロックの数であり、NCiは、現在のフレームに関する第i番のビンにおけるブロックの数であり、Nは、フレーム内のブロックの総数である。明らかに、前のフレームのヒストグラムと現在のフレームのヒストグラムが、互いに素である場合、λ=2である。
フレーム差分メトリックを、数式9に示されるとおり計算する。すなわち、
Figure 0005318561
(分類手続き)
コントラスト比値およびフレーム差分値を以下のように利用して、所与のビデオシーケンスにおける特徴を確実に予測することが可能な、最終のビデオコンテンツ分類メトリックが得られる。提案されるアルゴリズムは、R−D曲線ベースの分析から得られる分類と同様に、コンテンツを8つの可能なクラスに分類できることが可能である。
アルゴリズムは、シーンの複雑度、およびそのスーパフレームにおけるシーン変化出現回数に応じて、各スーパフレームに関して、0から1までの範囲の値を出力する。
プリプロセッサ内部のコンテンツ分類モジュールが、各スーパフレームに関して以下のステップを実行して、フレームコントラスト値およびフレーム差分値からコンテンツ分類メトリックを得る。
(1)マクロブロックコントラスト値から平均フレームコントラストおよびフレームコントラスト偏差を計算する。
(2)フレームコントラスト値およびフレーム差分値が、それぞれ、40および5である、シミュレーションから得られた値を使用して正規化される。
(3)コンテンツ分類メトリックの計算のために使用される一般化された数式は、以下のとおりである。すなわち、
Figure 0005318561
ただし、CCW1、CCW2、CCW3、およびCCW4は、重み係数である。これらの値は、CCW1に関して0.2、CCW2に関して0.9、CCW3に関して0.1、およびCCW4に関して−0.00009であるように選択される。
(4)スーパフレームにおけるシーン変化の回数を特定する。シーン変化の回数に応じて、以下のケースの1つが実行される。
(a)シーン変化なし スーパフレームにおいてシーン変化が全くない場合、メトリックは、以下の数式で示されるとおり、フレーム差分値に完全に依存する。
Figure 0005318561
(b)単一回のシーン変化 スーパフレームにおいて観察された単一回のシーン変化が存在する場合、以下のとおり、デフォルトの数式を使用して、メトリックが計算される。すなわち、
Figure 0005318561
(c)2つのシーン変化 所与のスーパフレームにおいてせいぜい2回のシーン変化が存在することが観察された場合、最初のスーパフレームは、いずれにしても、最後のスーパフレームによって迅速に更新されるので、以下の数式で示されるとおり、最後のスーパフレームには、最初のスーパフレームより、大きい重みが与えられる。すなわち、
Figure 0005318561
(d)3回以上のシーン変化 所与のスーパフレームが、3つを超える(例えば、N個の)Iフレームを有することが観察された場合、以下の数式で示されるとおり、最後のIフレームには、より大きい重みが与えられ、他のすべてのIフレームには、0.05という重みが与えられる。
Figure 0005318561
(5)フレーム差分平均が、0.05未満である、少ない動きのシーンの場合におけるメトリックに関して、補正が要求される。(CCOFFSET)0.33のオフセットが、CCMetricに加算される。
複雑度コンポーネント192は、Dcsat値、動きベクトル、および絶対差分の合計を使用して、マクロブロック(または指定された量のビデオデータ)に関する空間的複雑度を示す値を算出する。時間的複雑度は、フレーム差分メトリックの測度によって判定される。フレーム差分メトリックは、動きの量(動きベクトルを伴う)、およびフレーム間の絶対差分の合計を考慮に入れて、連続する2つのフレーム間の差分を測定する。
(帯域幅マップ生成)
人間の視覚的品質Vは、符号化複雑度Cと、割り当てられたビット数B(帯域幅とも呼ばれる)の両方の関数であることが可能である。符号化複雑度メトリックCは、人間視覚から見た空間周波数および時間周波数を考慮することに留意されたい。人間の目がより感じやすい歪みに関して、複雑度値は、それに相応して、より高い。通常、Vは、Cにおいて単調に減少し、Bにおいて単調に増加するものと想定することができる。
一定の視覚的品質を実現するのに、数式15および数式16で表現される基準を満たす帯域幅(B)が、符号化されるべき第i番のオブジェクト(フレームまたはMB)に割り当てられる。
Figure 0005318561
数式15および/または数式16において、Cは、第i番のオブジェクトの符号化複雑度であり、Bは、合計の利用可能な帯域幅であり、Vは、或るオブジェクトに関して達せられる視覚的品質である。人間の視覚的品質は、数式として定式化することが困難である。したがって、前述の数式セットは、正確に定義されていない。しかし、3Dモデルが、すべての変数において連続的であるものと想定される場合、帯域幅比
Figure 0005318561
は、(C,V)ペアの近傍内で不変であるものとして扱われることが可能である。帯域幅比βは、数式17において定義される。
Figure 0005318561
すると、ビット割当て問題は、数式18で表現されるとおり、定義されることが可能である。
Figure 0005318561
前述の数式18において、δは、「近傍」を示す。
符号化複雑度は、空間的な人間視覚感度と、時間的な人間視覚感度の両方によって影響される。ジロ(Girod)の人間視覚モデルは、空間的複雑度を定義するのに使用されることが可能なモデルの例である。このモデルは、局所的空間周波数、および周囲照明を考慮する。もたらされるメトリックは、Dcsatと呼ばれる。プロセスにおける前処理の時点で、ピクチャが、イントラ符号化されるべきか、インタ符号化されるべきかは、未知であり、その両方に関する帯域幅比が、生成される。イントラ符号化されるピクチャの場合、帯域幅比は、数式19で表現される。すなわち、
Figure 0005318561
前述の数式において、Yは、MBの平均輝度成分であり、αINTRAは、輝度の2乗、およびその後に続くDcsat項に関する重み係数であり、β0INTRAは、
Figure 0005318561
を補償する正規化係数である。例えば、αINTRA=4の値が、良好な視覚的品質を実現する。倍率β0INTRAの値は、ビットが、異なるビデオオブジェクトのβINTRA間の比に応じて割り当てられる限り、重要ではない。
この関係を理解するのに、帯域幅は、符号化複雑度につれて対数的に割り当てられることに留意されたい。輝度2乗項は、大きさのより大きい係数が、符号化するのに、多くのビットを使用するという事実を反映する。対数が負の値になるのを防ぐように、1が、括弧内の項に加算される。他の底を有する対数も、使用されることが可能である。
時間的複雑度は、フレーム差分メトリックの測度によって判定される。フレーム差分メトリックは、SADとともに動きの量(動きベクトルを伴う)も考慮に入れて、連続する2つのフレーム間の差分を測定する。
インタ符号化されるピクチャに関するビット割当ては、空間的複雑度とともに、時間的複雑度も考慮する必要がある。このことが、以下に、数式20で表現される。すなわち、
Figure 0005318561
数式20において、MVおよびMVは、現在のMBに関する前方動きベクトルおよび後方動きベクトルである。イントラの数式(INTRA formula)におけるYが、2乗された差分の合計を表すSSDで置き換えられていることを認めることができる。
数式6における‖MV+MVの役割を理解するのに、人間視覚系の以下の特性に留意されたい。すなわち、滑らかな、予測可能な動き(小さい‖MV+MV)を受ける領域が、注意を引き、目によって追跡されることが可能であり、通常、静止した領域が許容する以上の歪みを許容することができない。しかし、速い、または予測できない動き(大きい‖MV+MV)を受ける領域は、追跡されることが不可能であり、相当な量子化を許容することができる。実験は、αINTER=1、γ=0.001が、良好な視覚的品質を実現することを示す。
(テクスチャ値およびモーション値を算出すること)
マルチメディアデータにおける各マクロブロックに関して、分類コンポーネント194は、テクスチャ値を空間的複雑度に関連付け、モーション値を時間的複雑度に関連付ける。テクスチャ値は、マルチメディアデータの輝度値と関係し、低いテクスチャ値は、データの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、データの近傍ピクセルの輝度値の大きい変化を示す。一態様によれば、テクスチャ値およびモーション値が計算されると、分類コンポーネント194は、動き情報とテクスチャ情報の両方を考慮することにより、コンテンツ分類メトリック(例えば、コンテンツ分類)を決定する。分類コンポーネント194は、分類されるビデオデータに関するテクスチャを、マクロブロックの輝度値の複雑度を一般的に示す相対的テクスチャ値、例えば、「低」テクスチャ、「中」テクスチャ、または「高」テクスチャに関連付ける。また、分類コンポーネント194は、分類されるビデオデータに関して計算されたモーション値を、マクロブロックの動きの量を一般的に示す相対的モーション値、例えば、「低」モーション、「中」モーション、または「高」モーションに関連付ける。代替の諸実施形態では、動きおよびテクスチャに関して、より少ない、またはより多いカテゴリが、使用されることが可能である。次に、コンテンツ分類メトリックが、関連するテクスチャ値およびモーション値を考慮することにより、決定される。
図6は、テクスチャ値およびモーション値が、コンテンツ分類にどのように関連付けられるかを例示する分類チャートの例を示す。当業者は、そのような分類チャートを実施する多くのやり方、例えば、ルックアップテーブルまたはデータベースで実施するやり方に精通している。分類チャートは、ビデオデータコンテンツの所定の評価に基づいて、生成される。ビデオデータ分類を判定するのに、「低」、「中」、または「高」のテクスチャ値(「x軸」上の)が、「低」、「中」、または「高」のモーション値(「y軸」上の)と相互参照される。交差ブロックの中で示されるコンテンツ分類が、ビデオデータに割り当てられる。例えば、「高」のテクスチャ値と「中」のモーション値は、7という分類をもたらす。図6は、この例では、異なる8つのコンテンツ分類に関連する相対的テクスチャ値とモーション値の様々な組合せを示す。他のいくつかの実施形態では、より多い、またはより少ない分類が、使用されることが可能である。
(ビットレート決定)
前述したとおり、もたらされるマルチメディアデータコンテンツ分類は、前/後処理アルゴリズムおよび圧縮アルゴリズムにおいて使用されて、ビデオの知覚的品質を一定に保ちながら、ビット管理を効果的に向上させることが可能である。例えば、分類メトリックは、シーン変化検出、符号化ビットレート割当て制御、およびFRUC(フレームレートアップコンバージョン)のためのアルゴリズムにおいて使用されることが可能である。CODEC(圧縮器/伸張器)システムおよびデジタル信号処理アルゴリズムが、ビデオデータ通信において一般に使用され、帯域幅を節約するように構成されることが可能であるが、品質と帯域幅節約の間にトレードオフが、存在する。最良のCODECは、最小のビデオ品質低下を生じさせながら、最も多くの帯域幅節約をもたらす。
一態様では、ビットレートコンポーネント196が、コンテンツ分類を使用して、ビットレート(例えば、マルチメディアデータを符号化するために割り当てられるビットの数)を決定し、そのビットレートを、他のプロセスおよびコンポーネント、例えば、図1の符号化コンポーネント185によって使用されるように、メモリの中に格納する。ビデオデータの分類から決定されたビットレートは、一定した品質レベルでマルチメディアデータを提供しながら、帯域幅を節約するのに役立つことが可能である。一態様では、異なるビットレートが、異なる8つのコンテンツ分類のそれぞれに関連付けられることが可能であり、次に、そのビットレートを使用して、マルチメディアデータが符号化される。もたらされる効果は、マルチメディアデータの異なるコンテンツ分類に、符号化するための異なる数のビットが割り当てられるものの、知覚される品質は、ディスプレイ上で見られる際、同様である、または一定していることである。
一般に、より高いコンテンツ分類を有するマルチメディアデータは、より高いレベルの動きおよび/またはテクスチャを示し、符号化される際、より多くのビットが割り当てられる。より低い分類(より少ないテクスチャおよび動きを示す)を有するマルチメディアデータには、より少ないビットが割り当てられる。特定のコンテンツ分類のマルチメディアデータに関して、ビットレートは、そのマルチメディアデータを見るための選択された目標知覚品質レベルに基づいて、決定されることが可能である。マルチメディアデータ品質を判定することは、人間が、マルチメディアデータを見て、格付けすることによって判定されることが可能である。一部の代替の実施形態では、マルチメディアデータ品質の推定は、例えば、信号対雑音比アルゴリズムを使用する自動試験システムによって行われることが可能である。一態様では、標準品質レベル(例えば、5)のセット、ならびに特定の各品質レベルを実現するのに必要とされる、対応するビットレートが、各コンテンツ分類のマルチメディアデータに関して前もって決定される。品質レベルのセットを判定するのに、或る特定のコンテンツ分類のマルチメディアデータが、或る特定のビットレートを使用して符号化された場合のマルチメディアデータの視覚的に知覚される品質の数値的指標を提供するMOS(平均オピニオンスコア)を生成することにより、評価されることが可能である。MOSは、1から5までの範囲内の単一の数値として表現されることが可能であり、1は、最低の知覚品質であり、5は、最高の知覚品質である。他の実施形態では、MOSは、5つより多い、または5より少ない品質レベルを有することが可能であり、各品質レベルの異なる記述が、使用されることが可能である。
マルチメディアデータ品質を判定することは、人間が、マルチメディアデータを見て、格付けすることによって判定されることが可能である。一部の代替の実施形態では、マルチメディアデータ品質の推定は、例えば、信号対雑音比アルゴリズムを使用する自動試験システムによって行われることが可能である。一態様では、標準品質レベル(例えば、5)のセット、ならびに特定の各品質レベルを実現するのに必要とされる、対応するビットレートが、各コンテンツ分類のマルチメディアデータに関して前もって決定される。
或るコンテンツ分類のマルチメディアデータに関する視覚的に知覚される品質レベルとビットレートの間の関係を知ることは、目標(例えば、所望される)品質レベルを選択することによって決定されることが可能である。ビットレートを決定するのに使用される目標品質レベルは、事前選択されること、ユーザによって選択されること、ユーザからの入力、または別のプロセスからの入力を要求する自動プロセスまたは半自動プロセスを介して選択されること、あるいは所定の基準に基づいて、符号化デバイスまたは符号化システムによって動的に選択されることが可能である。目標品質レベルは、例えば、符号化アプリケーションのタイプ、またはマルチメディアデータを受信するクライアントデバイスのタイプに基づいて、選択されることが可能である。
(コンテンツ分類の判定)
コンテンツ分類曲線、およびコンテンツ分類曲線が導き出されるレート歪み曲線が、ビデオデータを分類するのに先立って生成される。識別されたマルチメディアデータ分類に関して、許容できるビットレートは、ビデオデータの特定の分類に関して、目標品質レベルと特定のレート歪みとの交差ポイントを求めることによって決定される。ビットレートは、その交差ポイントに対応するポイントであり、ビットレートは、より低い目標品質レベルが選択されると、低下することが可能である。例えば、目標品質レベルが、「良好」ではなく、「許容可能」であるように選択された場合、例えば、クラス6として分類されたビデオデータを、レート5のビットレートで符号化することが、今度は、およそレート4のビットレートを要求することが可能である。
図6および図7で参照される8つのマルチメディアデータコンテンツ分類を判定するのに、様々なタイプのコンテンツを含むマルチメディアデータシーケンスが、平均ビットレートおよび平均輝度ピークPSNR(信号対雑音比)を獲得するのに使用されることが可能である。シーケンスに関する平均ビットレートは、R−D(レート−歪み)曲線を形成する平均PSNRに対してプロットされる。例えば、多数のマルチメディアデータシーケンスに関するR−D曲線が、x軸が平均ビットレート(kbps)であり、y軸が、平均輝度PSNR(db)であるグラフ形式で表されることが可能である。シーケンスに関するR−D曲線は、異なるいくつかのクラスタに入り、マルチメディアデータシーケンスが、次に、R−D曲線のそれらのクラスタに基づいて、異なるグループ(やはり、曲線)に分類される。一実施例では、5つのグループが、最初に形成され、各グループは、そのクラスタに入るすべてのシーケンスの平均をとることによって得られる。クラスタはそれぞれ、1つまたは複数のシーケンスを含むことが可能である。また、各グループに関する標準偏差も、グループを形成する特定のシーケンスから計算されることが可能である。他の実施例では、ビデオデータシーケンスは、使用されるシーケンスに応じて、5つ未満のグループを形成するようにクラスタ化されても、5つより多くのグループを形成するようにクラスタ化されてもよい。この実施例では、グループの数(5)は、ビデオデータのさらなる分析に基づいて、後に増加される。同様に、より多い、またはより少ないグループが、他の一部の態様において最初に形成される場合、そのような態様は、さらなるシーケンスを評価することに基づいて、グループの数をさらに増やすこと、または減らすことも含むことが可能である。この最初の5つのグループは、所与のスーパフレームにおける様々なレベルの動きおよびテクスチャを表す5つのクラスに対応する。例えば、クラス1は、低い動き、および低いテクスチャ(LM,LT)を有するスーパフレームを表し、クラス2は、中程度の動き、および低いテクスチャ(MM,LT)を有するスーパフレームを表し、クラス3は、中程度の動き、および中程度のテクスチャ(MM,LT)を有するスーパフレームを表し、クラス4は、高い動き、および中程度のテクスチャ(HM,MT)を有するスーパフレームを表し、クラス5は、高い動き、および高いテクスチャ(HM,HT)を有するスーパフレームを表す。
次に、利用可能なすべてのソースシーケンスからの各スーパフレームが、それぞれのクラスに各スーパフレームが入るかどうかを試験するように分類される。マルチメディアデータの様々なシーケンスを試験すること、および前に定義された5つのグループに当てはまらない他の様々なシーケンスに対処するように反復プロセスを使用することにより、初期分類が、精緻化され、新たなセットの変更されたR−D曲線が、獲得されることが可能である。この実施例では、クラスタの数は、5つから8つに増やされており、さらなるクラスが、形成されており、より大きいクラス番号は、マルチメディアデータにおけるより大きい動き、およびより高いレベルのテクスチャを表す。
この実施例では、それらのR−D曲線が、次に、マルチメディアデータを分類する際の、それらの曲線の使用を容易にするようにモデル化された。ビットレートと、信号の輝度PSNRとの間の関係は、対数関数であるため、R−D曲線は、以下の形態の対数関数を使用してモデル化されることが可能である。すなわち、ypsnr=aln(レート)+b,a>0である。この実施例において、パラメータaおよびbの値は、以下のとおり再現される。すなわち、
クラス a b
1 5.0874 −13.038
2 5.1765 −20.790
3 5.9369 −32.149
4 5.2884 −27.498
5 5.3435 −30.421
6 5.1642 −29.173
7 5.0773 −32.890
8 5.0813 −37.631
すべてのリアルタイムサービスが、ビットレート割り当てにかかわらず、同様の知覚される品質を有するように動作するように設計されたマルチメディア処理システムは、表示のために一定したマルチメディアデータを提供する。このため、リアルタイムサービスに関する品質メトリック(例えば、PSNR)は、割り当てられたビットレートとともに単調に増大するものと見込まれる。PSNRの等しい品質により、マルチメディアデータの知覚される一定した品質は、必ずしも生じないため、既存のクラスは、PSNR以外の別の品質メトリックに基づいて、変更された。マルチメディアデータの同一の知覚される品質を実現するのに、すべてのクラスが、同様の品質メトリックを有するように、対応するオフセットを追加することにより、コンテンツ分類曲線が、変更された。オフセット修正された数式もやはり、ypsnr=aln(レート)+b+オフセットという対数形式である。説明される実施例では、8つのコンテンツクラスのそれぞれに関するオフセット値は、9.833、−5.831、−4.335、−2.064、−0.127、0.361、4.476、および6.847である。
コンテンツ分類の1つの用途は、ビデオデータシーン変化検出のためである。フレーム差分メトリックまたはコントラスト比値またはコンテンツ分類メトリックが、フレームシーケンスにおける先行するフレームおよび将来のフレームに対して比較的高い場合、その特定のフレームは、シーン変化、または新たなショットであると判定する。
図8は、マルチメディアデータを分類することに基づいてビットレートを決定するためのプロセス200の一実施例を示すフローチャートである。また、実施例は、フローチャート、流れ図、構造図、またはブロック図として表されることが可能なプロセスとして説明されてもよいことにも留意されたい。フローチャートは、動作を順次プロセスとして説明することが可能であるが、動作の多くは、並行に、または同時に実行されることが可能であり、プロセスは、繰り返されることが可能である。加えて、動作の順序は、並べ替えられることが可能であり、図示されていない動作が、実行されることが可能であり、あるいは図示されている動作が、プロセスの応用先の状況に応じて、省かれることが可能である。
本明細書で説明されるプロセスは、方法、ファンクション、手続き、ソフトウェアプログラム、またはソフトウェアプログラムの一部に相当することが可能である。プロセスが、ファンクションに相当する場合、プロセスの終了は、ファンクションが、呼び出しファンクションまたはメインファンクションに戻ることに相当する。ソフトウェアプログラム、モジュール、コンポーネント、サブルーチン、またはサブプログラムとしてのプロセスの説明は、広い説明であり、特に明記しない限り、すべての実施形態が同一の形で実施されることを要求することを意図するものではない。代わりに、そのような動作は、通常、ハードウェア、ソフトウェア、ミドルウェア、ファームウェア、またはマイクロコードで実施されることが可能であることが、当業者には認識されよう。単一のコンポーネント、プログラム、またはモジュールとして説明される動作の機能が、2つ以上のコンポーネント、モジュール、プログラム、例えば、サブモジュール、サブプログラム、またはサブルーチンで実施されてもよい。
プロセス200は、例えば、図1に示される、符号化デバイス105、およびデバイス105のコンポーネントによって実行されることが可能である。符号化された、または符号化されていないビデオデータが、外部源135から符号化デバイス105によって受信される。プロセス200において、ステップ205が、ビデオデータの複雑度を判定する。一部の実施形態では、符号化コンポーネント185が、ビデオデータの空間的複雑度および時間的複雑度を判定するのに使用される情報、例えば、動きベクトル、少なくとも1つのDcsat値、マクロブロックの絶対差分の合計を計算する。一部の実施形態では、コンテンツ分類コンポーネント190が、マルチメディアデータの時間的複雑度および空間的複雑度を判定するのに必要とされる情報の少なくとも一部を計算する。コンテンツ分類コンポーネント190などの分類手段は、判定された複雑度に基づき、マルチメディアデータを分類することができる(ステップ210)。ステップ210の結果、マルチメディアデータは、いくつかのコンテンツ分類の1つ(例えば、8つのコンテンツ分類の1つ)に分類される。ステップ215で、プロセス200が、複数のコンテンツ分類におけるマルチメディアデータを見るための品質値を決定し、これは、通常、プロセス200の開始に先立って行われる。データ品質レベルを判定することは、人間が、マルチメディアデータを見て、格付けすることによって判定されることが可能であり、あるいは、一部の代替の実施形態では、マルチメディアデータ品質の推定は、例えば、信号対雑音比アルゴリズムを使用する自動データ評価システムによって行われることが可能である。品質レベルは、事前選択されること、ユーザによって選択されること、ユーザからの入力、または別のプロセスからの入力を要求する自動プロセスまたは半自動プロセスを介して選択されることが可能である。代替として、品質レベルは、例えば、マルチメディアデータを見るための所望される、または要求される品質レベルと関係する所定の基準に基づき、システムの動作中、符号化デバイスまたは符号化システムによって動的に選択されることが可能である。
プロセス200は、ビデオデータの分類、および所望される目標品質レベルに基づき、ビデオデータを符号化するためのビットレートを決定した。ビデオデータを符号化するためのビットレートは、そのスーパフレームに属する個々のフレームサイズ推定を加算することによって決定されることが可能である。個々のフレームサイズ推定は、2つの形で計算されることが可能である。1つのアプローチでは、スーパフレームにおける各フレームのサイズの推定が、帯域幅比に基づいて計算され、次に、スーパフレームのサイズが、フレームサイズの一次結合として推定されることが可能である。
(フレームサイズに基づいてスーパフレームサイズを推定すること)
フレームサイズは、前に符号化されたフレーム、およびフレームの帯域幅比に応じて推定される。IIR(無限インパルス応答)フィルタを使用して、フレームサイズを推定した場合、実際のサイズと、シミュレーションからの推定されたサイズとの間で、強い相関が観察される。BWR(帯域幅比)が、MPEG−2復号器における動きベクトルおよびSADに基づき、プリプロセッサにおいて計算される。
以下のとおり、フレームサイズとBWRの間の単純明快な直線関係を想定する。すなわち、
Figure 0005318561
フレームサイズを推定するための手続きを以下に説明する。(1)ガンマと呼ばれる量が、符号化された各フレームに関して、フレームサイズとBWRの比として計算される。

Figure 0005318561
(2)符号化されるべき各フレームに関して、以下のIIRフィルタを使用して、重みが計算される。
Figure 0005318561
このため、フレームサイズは、以下のとおり推定される。すなわち、
Figure 0005318561
この手続きは、PフレームとBフレームの両方に関して使用されることが可能であり、連続するPフレームは、先行する符号化されたPフレームから推定され、Bフレームは、先行する符号化されたBフレームから推定される。1つのアプローチでは、Temporal_BWRが、フレーム内のすべてのマクロブロックに関するBeta_inter(前述した)の合計であることが可能である。Iフレームの場合、FIRフィルタが、IIRフィルタよりも正確な結果をもたらすことが観察される。このため、Iフレームに関して、推定は、以下のとおり獲得される。すなわち、
Figure 0005318561
スーパフレームサイズは、そのスーパフレームにおけるすべてのフレーム推定の合計である。
(スーパフレームサイズ全体を推定すること)
別のアプローチでは、スーパフレームサイズが、全体的に推定されることが可能である。スーパフレームサイズは、前に符号化されたスーパフレーム、およびスーパフレーム全体の帯域幅比に応じて、推定されることが可能である。前述の第1のアプローチに関して説明されたIIR(無限インパルス応答)フィルタを使用して、スーパフレームサイズが推定されることが可能である。
この場合も、スーパフレーム全体に関して、スーパフレームサイズと、帯域幅比によって表されるスーパフレーム複雑度との間で、直線関係が想定されることが可能である。すなわち、
Figure 0005318561
スーパフレームサイズを推定するための手続きは、以下のとおり説明されることが可能である。すなわち、
(1)シータと呼ばれる量が、以下の数式で示されるとおり、完全なスーパフレームに関して、スーパフレームサイズとBWRの間の比として計算される。すなわち、
Figure 0005318561
(2)符号化されるべき各スーパフレームに関して、以下のIIRフィルタを使用して、重みが計算される。
Figure 0005318561
スーパフレームサイズは、以下のとおり推定されることが可能である。すなわち、
Figure 0005318561
所与のスーパフレームに関する帯域幅比は、そのスーパフレームにおける個々のフレームに関する帯域幅比の一次結合を使用して推定される。スーパフレームにおけるフレームタイプは、IBPまたはIBBPなどの、固定のGOP構造に基づくことが可能である。
スーパフレームにおけるフレームタイプは、前述したフレーム差分メトリックに基づいて、判定される。イントラしきい値およびインタしきい値が、その所与のスーパフレームにおけるコンテンツタイプの分類に基づいて、決定される。それらのしきい値に基づき、フレームは、フレームのフレーム差分が、intra_thresholdを超える場合、Iフレームであると宣言され、フレームのフレーム差分が、イントラしきい値とインタしきい値の間にある場合、Pフレームであると宣言され、フレーム差分が、inter_thresholdを下回る場合、Bフレームであると宣言される。
前述したDscatおよびジロのモデルを使用して導き出されるBeta_Intraとして記述される空間的帯域幅比を使用して、イントラフレームのサイズが推定される。
別のアプローチは、空間的帯域幅比が、前述したコントラスト比、またはその量を表す他の任意のメトリックに基づく場合である。
Dscatおよびジロのモデル、ならびに前述したMVおよびSADを使用して導き出されるBeta_Intraとして記述される時間的帯域幅比を使用して、インタのサイズが推定される。別のアプローチは、時間的帯域幅比が、前述したSAD_MVメトリック、あるいはフレームにおける動きの量またはレベルを表す他の任意のメトリックに基づく場合である。
図8を再び参照すると、ステップ221で、プロセス200が、ステップ215で決定されたビットレートを、例えば、マルチメディアデータのさらなる処理のために使用して、無線ネットワーク上の通信のためにマルチメディアデータを符号化する。
図9は、図8に示されるポイント「A」とポイント「B」の間でマルチメディアデータを処理するさらなる動作のためのプロセス201を示すフローチャートである。プロセス201が、ステップ206でマルチメディアデータの空間的複雑度を判定する。空間的複雑度を判定することは、プロセス201が、マルチメディアデータのブロックに関して、少なくともDcsat値を計算することを要求し、この計算は、ステップ207で実行される。ステップ207は、図1にともに示される、符号化コンポーネント185またはコンテンツ分類コンポーネント190によって実行されることが可能である。Dcsat値を計算するプロセスについては、前述した。ステップ240に進むと、プロセス201は、その時点で、マルチメディアデータの時間的複雑度を判定する。ステップ209が、少なくとも1つのデータブロックに関する少なくとも1つの動きベクトルを算出し、これは、通常、符号化コンポーネント185によって行われる。ステップ211で、プロセス201は、マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連するSAD(絶対差分の合計)を算出する。ステップ211における計算もやはり、通常、符号化コンポーネント185によって行われる。ステップ210に進むと、プロセス201は、判定された複雑度に基づき、マルチメディアデータを分類する。マルチメディアデータを分類するのに、ステップ255で、空間的複雑度が、テクスチャ値に関連付けられる。また、ステップ260に示されるとおり、時間的複雑度が、モーション値に関連付けられる。最後に、ステップ265で、プロセス201は、ステップ255およびステップ260でそれぞれ決定されたテクスチャ値およびモーション値に基づき、マルチメディアデータにコンテンツ分類を割り当てる。プロセス201のステップは、図9のステップ215で示されるとおり、プロセス200が、ビットレートを決定することに進む「B」で終了する。
所与の知覚品質のためにマルチメディアデータ複雑度、および対応する符号化レートまたは圧縮比を推定するコンテンツ分類およびプロセスは、可変レートストリームの統計的多重化における利得を向上させるように拡張されることが可能である。前述した方法および装置を活用する、そのようなマルチプレクサは、マルチメディアアプリケーションにおける動的に変化するコンテンツのために、一様な品質多重化が出力されることも可能にする。そのようなマルチプレクサを以下に説明する。
(マルチプレクサ)
一部の実施形態では、前述したビット管理のためにマルチプレクサが使用されることが可能である。例えば、マルチプレクサが、ビットレート割当て制御を提供するように実施されることが可能である。推定された複雑度が、マルチプレクサに供給されることが可能であり、すると、マルチプレクサは、多重化されるビデオチャネルの集合に、それらのビデオチャネルに関して予期される符号化複雑度に応じて、利用可能な帯域幅を割り当てることができ、これにより、多重化されたビデオストリームの集合に対する帯域幅が、比較的一定している場合でも、特定のチャネルの品質が、比較的一定のままであることが可能になる。
図10は、複数のマルチメディアストリームまたはマルチメディアチャネル1002の符号化を示すシステム図である。マルチメディアストリーム1002は、それぞれの符号器1004によって符号化され、符号器1004は、MUX(マルチプレクサ)1006と通信しており、MUX1006は、伝送媒体1008と通信している。例えば、マルチメディアストリーム1002は、ニュースチャネル、スポーツチャネル、映画チャネルなどの、様々なコンテンツチャネルに対応することが可能である。符号器1004は、マルチメディアストリーム1002を、システムのために指定された符号化フォーマットに符号化する。ビデオストリームの符号化の文脈で説明されているが、開示される技術の原理および利点は、例えば、オーディオストリームを含むマルチメディアストリームに、一般に適用可能である。符号化されたマルチメディアストリームは、マルチプレクサ1006に供給され、マルチプレクサ1006は、様々な符号化されたマルチメディアストリームを組み合わせて、その複合ストリームを、伝送のために伝送媒体1008に送る。
伝送媒体1008は、DirectTV(登録商標)などのデジタル衛星通信、デジタルケーブル、有線および無線のインターネット通信、光ネットワーク、セル電話網などの、ただし、以上には限定されない、様々な媒体に対応することが可能である。伝送媒体1008は、例えば、RF(無線周波数)への変調を含むことが可能である。通常、スペクトル制約などのため、伝送媒体は、限られた帯域幅を有し、マルチプレクサ1006から伝送媒体へのデータは、比較的一定のビットレート(CBR)に保たれる。
従来のシステムでは、マルチプレクサ1006の出力におけるCBR(固定ビットレート)の使用は、マルチプレクサ1006に入力される、符号化されたマルチメディアストリームまたはビデオストリームもやはり、CBRであることを要求する。背景技術で説明されるとおり、ビデオコンテンツを符号化する際のCBRの使用は、通常、望ましくない、可変の視覚的品質をもたらす可能性がある。
図示されるシステムでは、符号器1004の2つ以上が、入力データの予期される符号化複雑度を通信する。符号器1004の1つまたは複数が、マルチプレクサ1006から、応答として、適合されたビットレート制御を受信することが可能である。これにより、比較的複雑なビデオを符号化することを見込む符号器1004が、それらのビデオフレームのために、準可変ビットレートの形で、より高いビットレート、またはより高い帯域幅(フレーム当たり、より多くのビット)を受け取ることが可能になる。これにより、マルチメディアストリーム1002が、より一定した視覚的品質で符号化されることが可能になる。比較的複雑なビデオを符号化する特定の符号器1004によって使用される追加の帯域幅は、符号器が、固定ビットレートで動作するように実施されたとした場合に、他のビデオストリーム1004を符号化するために、さもなければ使用されたであろうビットから来る。これにより、マルチプレクサ1006の出力が、CBR(固定ビットレート)に保たれる。
個別のマルチメディアストリーム1002は、比較的「バースト性」である、つまり、使用される帯域幅が変化することが可能であるが、複数のビデオストリームの累積合計は、それほどバースト性ではない。それほど複雑でないビデオを符号化するチャネルからのビットレートは、例えば、マルチプレクサ1006によって、比較的複雑なビデオを符号化するチャネルに再割当てされることが可能であり、これにより、組み合わされたビデオストリーム全体の視覚的品質が向上することが可能である。
符号器1004は、一緒に符号化され、多重化されるべきビデオフレームセットの複雑度の指標をマルチプレクサ1006に供給する。マルチプレクサ1006の出力は、伝送媒体1008のために指定されたビットレート以下である出力をもたらさなければならない。複雑度の指標は、選択されたレベルの品質を提供するように、前述したコンテンツ分類に基づくことが可能である。マルチプレクサ1006は、複雑度の指標を分析し、様々な符号器1004に、割り当てられた数のビットまたは帯域幅を提供し、符号器1004は、その情報を使用して、セットの中のビデオフレームを符号化する。これにより、ビデオフレームセットが、個々に可変のビットレートであるが、それでも、グループとして固定ビットレートを実現することが可能になる。
また、コンテンツ分類は、任意の汎用の圧縮器に関して、マルチメディアの品質ベースの圧縮一般を可能にする際にも使用されることが可能である。
コンテンツ分類、および本明細書で説明される方法および装置は、任意のマルチメディアデータの品質ベース、かつ/またはコンテンツベースのマルチメディア処理において使用されることが可能である。一例は、任意の汎用の圧縮器に関するマルチメディアの圧縮一般における使用である。別の例は、補間動作、再サンプリング動作、拡張動作、復元動作、およびプレゼンテーション動作などの、任意の伸張器(decompressor)または復号器またはポストプロセッサにおける伸張または復号においてである。
様々な実施形態の諸態様は、示されるフレームが、動いているイメージ(例えば、動いている、または変化するイメージを表現する、関連するフレームのシーケンス)、または静止しているイメージ(例えば、変化しない、またはゆっくり変化するイメージ)を、テキストであれ、画像であれ、表示するマルチメディアデータを含め、後の表示のためにマルチメディアデータを符号化するように構成された任意のデバイスで実施されることが可能である。より詳細には、一部の実施形態は、移動電話機、無線デバイス、PDA(パーソナルデジタルアシスタント)、ハンドヘルドコンピュータもしくはポータブルコンピュータ、および表示のためのマルチメディアデータを受信するように構成された他のそのような有線もしくは無線の通信デバイスなどの、ただし、以上には限定されない、通信のために使用されることが可能な、様々な電子デバイスで実施される、またはそのようなデバイスに関連付けられることが可能であることが、企図される。
マルチメディアデータを、無線電話機、PDA、ラップトップコンピュータなどのクライアントデバイスに通信することには、大量のデータを伝送すること、および処理することがかかわる。ほとんどのマルチメディアアプリケーションは、符号器に供給されるマルチメディアフレームシーケンスが、内容に基づいて分類された場合、品質の利益を高めることが可能であったはずである。コンテンツ分類が、利用可能である場合、役立つことが可能な、マルチメディア通信システムにおける、いくつかのアプリケーションが、存在する。例えば、コンテンツ分類は、所定の見る品質を得るためにマルチメディアデータを符号化するのに必要とされるビットレートを決定する際に、役立つことが可能であり、所与のフレームに関する最良のフレームタイプを決定するのにも使用されることが可能である。
情報および信号は、様々な異なる技術および技法のいずれを使用して表現されてもよいことが、当業者には理解されよう。例えば、以上の説明全体にわたって言及されるデータ、命令、コマンド、情報、信号、ビット、記号、およびチップは、電圧、電流、電磁波、磁場もしくは磁気粒子、光場もしくは光粒子(optical particles)、または以上の任意の組合せによって表現されることが可能である。
本明細書で開示される実施例に関連して説明される、様々な例示的な論理ブロック、モジュール、およびアルゴリズムステップは、電子ハードウェア、ファームウェア、コンピュータソフトウェア、ミドルウェア、マイクロコード、または以上の組合せとして実施されることが可能であることが、当業者にはさらに理解されよう。ソフトウェアとハードウェアの、この互換性を明確に示すのに、様々な例示的なコンポーネント、ブロック、モジュール、回路、およびステップが、それらの機能の点で、以上に一般的に説明されてきた。そのような機能が、ハードウェアとして実施されるか、またはソフトウェアとして実施されるかは、全体的なシステムに課せられた特定のアプリケーション制約および設計制約に依存する。当業者は、説明される機能を、特定の各アプリケーションのために様々な形で実施することができるが、そのような実施決定が、開示される方法の範囲からの逸脱を生じさせると解釈されてはならない。
本明細書で開示される実施例に関連して説明される、様々な例示的な論理ブロック、コンポーネント、モジュール、および回路は、汎用プロセッサ、DSP(デジタルシグナルプロセッサ)、ASIC(特定用途向け集積回路)、FPGA(フィールドプログラマブルゲートアレイ)もしくは他のプログラマブル論理デバイス、ディスクリートのゲートもしくはトランジスタロジック、ディスクリートのハードウェアコンポーネント、または本明細書で説明される諸機能を実行するように設計された、以上の任意の組合せを使用して、実施される、または実行されることが可能である。汎用プロセッサは、マイクロプロセッサであることが可能であるが、代替では、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態マシンであることが可能である。また、プロセッサは、コンピューティングデバイスの組合せとして、例えば、DSPとマイクロプロセッサの組合せとして、複数のマイクロプロセッサとして、DSPコアと連携する1つまたは複数のマイクロプロセッサとして、または他の任意のそのような構成として実施されてもよい。
本明細書で開示される実施例に関連して説明される方法またはアルゴリズムのステップは、ハードウェアで直接に実現されても、プロセッサによって実行されるソフトウェアモジュールで実現されても、その2つの組合せで実現されてもよい。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROMメモリ、レジスタ、ハードディスク、リムーバブルディスク、CD−ROM、または当技術分野で知られている他の任意の形態の記憶媒体の中に存在することが可能である。例示的な記憶媒体は、プロセッサが、記憶媒体から情報を読み取ることができ、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替では、記憶媒体は、プロセッサと一体になっていてもよい。プロセッサおよび記憶媒体は、ASIC(特定用途向け集積回路)の中に存在することが可能である。ASICは、無線モデムの中に存在することが可能である。代替では、プロセッサおよび記憶媒体は、無線モデム内部の別々のコンポーネントとして存在してもよい。
開示される実施例の以上の説明は、当業者が、開示される方法および装置を作成する、または使用することを可能にするように提供される。それらの実施例の様々な変形が、当業者には容易に明らかとなり、本明細書で定義される原理は、他の実施例に適用されることも可能であり、さらなる要素が、開示される方法および装置の趣旨または範囲を逸脱することなく、追加されることが可能である。
ストリーミングマルチメディアデータを符号化するため、および復号するための一般的な通信システムのブロック図である。 MPEG−4シンプルプロファイルデータストリームを示す図である。 MPEG−4におけるPフレーム構築プロセスの例を示す図である。 コンテンツ分類コンポーネントを示すブロック図である。 各マクロブロックに関する平均値を示すビデオフレーム内のマクロブロックグループの概略図である。 テクスチャ値およびモーション値に基づくイメージ分類の例を示すチャートである。 コンテンツ分類曲線、および視覚的に知覚された品質値を使用してビットレートを決定する例を示すグラフである。 マルチメディアデータを分類するためのプロセスを示すフローチャートである。 マルチメディアデータのコンテンツ分類に基づいてマルチメディアデータを符号化するためのプロセスを示すフローチャートである。 複数のマルチメディアストリームまたはマルチメディアチャネルの符号化を示す系統図である。 動き補償を示す図である。 大きいラムダのプリエンファシスを示すグラフである。

Claims (55)

  1. マルチメディアデータを処理する方法であって、
    マルチメディアデータの複雑度を判定することと、
    前記判定された複雑度に基づいて前記マルチメディアデータを分類することと、
    前記マルチメディアデータの分類に基づいて、前記マルチメディアデータに異なるレート歪み曲線を割り当てることと、
    前記マルチメディアデータの分類に基づいて割り当てられたレート歪み曲線および所望の目標品質レベルに基づいて、前記マルチメディアデータを符号化するためのビットレートを決定することを含み、
    複雑度を判定することは、前記マルチメディアデータの空間的複雑度および時間的複雑度を判定することを含み、
    前記マルチメディアデータを分類することは、前記空間的複雑度をテクスチャ値に関連付けること、前記時間的複雑度をモーション値に関連付けること、および、前記テクスチャ値および前記モーション値に基づき、前記マルチメディアデータにコンテンツ分類を割り当てることを含み、
    前記テクスチャ値は、前記マルチメディアデータの輝度値と関係し、低いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の大きい変化を示し、
    前記モーション値は、前記マルチメディアデータの少なくとも1つのブロックの動きの量と関係し、低いモーション値は、前記ブロックの動きが小さいことを示し、高いモーション値は、前記ブロックの動きが大きいことを示す方法。
  2. 空間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのDcsat値に基づく請求項1に記載の方法。
  3. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのMV(動きベクトル)に基づく請求項1に記載の方法。
  4. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対ピクセル差分の合計にさらに基づく請求項3に記載の方法。
  5. 前記マルチメディアデータを分類することは、複数のコンテンツ分類の中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項1に記載の方法。
  6. 前記複数のコンテンツ分類におけるマルチメディアデータを見るための視覚的品質値を決定することをさらに含む請求項5に記載の方法。
  7. 前記マルチメディアデータを通信するためのビットレートを、該マルチメディアデータの分類に基づいて決定することをさらに含む請求項5に記載の方法。
  8. ビットレートを決定することは、マルチメディアデータを見るための視覚的品質値に基づき、ビットレートをコンテンツ分類に関連付けることを含む請求項7に記載の方法。
  9. ビットレートを決定することは、前記分類に基づいて前記マルチメディアデータの少なくとも1つのブロックを符号化するために割り当てられるべきビットの数を決定することを含む請求項1に記載の方法。
  10. 空間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのDcsat値に基づく請求項1に記載の方法。
  11. 空間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのコントラスト比値に基づく請求項1に記載の方法。
  12. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのMV(動きベクトル)に基づく請求項1に記載の方法。
  13. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対ピクセル差分の合計にさらに基づく請求項12に記載の方法。
  14. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのSAD_MV値に基づく請求項1に記載の方法。
  15. 時間的複雑度を判定することは、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのフレーム差分値に基づく請求項1に記載の方法。
  16. 前記マルチメディアデータを分類することは、複数のコンテンツ分類の中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項1に記載の方法。
  17. マルチメディアデータを処理するための装置であって、
    マルチメディアデータの複雑度を判定するための手段と、
    前記判定された複雑度に基づいて前記マルチメディアデータを分類するための手段と、
    前記マルチメディアデータの分類に基づいて、前記マルチメディアデータに異なるレート歪み曲線を割り当てるための手段と、
    前記マルチメディアデータの分類に基づいて割り当てられたレート歪み曲線および所望の目標品質レベルに基づいて、前記マルチメディアデータを符号化するためのビットレート決定するための手段とを含み、
    複雑度を判定することは、前記マルチメディアデータの空間的複雑度、および前記マルチメディアデータの時間的複雑度を判定することを含み、
    前記分類する手段は、前記空間的複雑度をテクスチャ値に関連付けるための手段と、前記時間的複雑度をモーション値に関連付けるための手段と、前記テクスチャ値および前記モーション値に基づき、前記マルチメディアデータにコンテンツ分類を割り当てるための手段とを含み、
    前記テクスチャ値は、前記マルチメディアデータの輝度値と関係し、低いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の大きい変化を示し、
    前記モーション値は、前記マルチメディアデータの少なくとも1つのブロックの動きの量と関係し、低いモーション値は、前記ブロックの動きが小さいことを示し、高いモーション値は、前記ブロックの動きが大きいことを示す装置。
  18. 前記空間的複雑度を判定するための前記手段は、前記マルチメディアデータの少なくとも1つのブロックに関する少なくとも1つのDcsat値を算出するための手段を含む請求項17に記載の装置。
  19. 前記ビットレート決定手段は、前記分類に基づいて前記マルチメディアデータの少なくとも1つのブロックを符号化するために割り当てられるべきビットの数を決定するための手段を含む請求項17に記載の装置。
  20. 前記時間的複雑度を判定するための前記手段は、前記マルチメディアデータの少なくとも1つのブロックに関する少なくとも1つのMV(動きベクトル)を算出するための手段を含む請求項17に記載の装置。
  21. 前記時間的複雑度を判定するための前記手段は、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対差分の合計を算出するための手段をさらに含む請求項17に記載の装置。
  22. 前記分類する手段は、複数のコンテンツ分類の中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項17に記載の装置。
  23. 前記マルチメディアデータを通信するためのビットレートを、該マルチメディアデータの分類に基づいて決定するための手段をさらに含む請求項17に記載の装置。
  24. ビットレートを決定することは、前記分類にビットレートを関連付けることを含み、前記ビットレートは、マルチメディアデータを見るための視覚的品質レベルに基づく請求項23に記載の装置。
  25. 前記分類における視覚的品質値を決定するための手段をさらに含む請求項24に記載の装置。
  26. 空間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロックに関する少なくとも1つのDcsat値を算出するための手段に基づく請求項17に記載の装置。
  27. 空間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロックに関する少なくとも1つのコントラスト比値を算出するための手段に基づく請求項17に記載の装置。
  28. 時間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロックに関する少なくとも1つのMV(動きベクトル)を算出するための手段に基づく請求項17に記載の装置。
  29. 時間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対ピクセル差分の合計にさらに基づく請求項28に記載の装置。
  30. 時間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのSAD_MV値を算出するための手段に基づく請求項17に記載の装置。
  31. 時間的複雑度を判定するための手段は、前記マルチメディアデータの少なくとも1つのブロックに関して算出される少なくとも1つのフレーム差分値を算出するための手段に基づく請求項17に記載の装置。
  32. 前記マルチメディアデータを分類するための手段は、コンテンツ分類の中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項17に記載の装置。
  33. マルチメディアデータの複雑度を判定し、前記判定された複雑度に基づいて前記マルチメディアデータを分類し、前記マルチメディアデータの分類に基づいて、前記マルチメディアデータに異なるレート歪み曲線を割り当て、前記マルチメディアデータの分類に基づいて割り当てられたレート歪み曲線および所望の目標品質レベルに基づいて、前記マルチメディアデータを符号化するためのビットレートを決定するように構成されたプロセッサを含み、
    前記プロセッサは、前記マルチメディアデータの前記空間的複雑度を判定し、前記マルチメディアデータの前記時間的複雑度を判定し、前記空間的複雑度をテクスチャ値に関連付けること、および前記時間的複雑度をモーション値に関連付けること、ならびに前記テクスチャ値および前記モーション値に基づいて前記マルチメディアデータにコンテンツ分類を割り当てることにより、前記マルチメディアデータを分類するようにさらに構成され
    前記テクスチャ値は、前記マルチメディアデータの輝度値と関係し、低いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の大きい変化を示し、
    前記モーション値は、前記マルチメディアデータの少なくとも1つのブロックの動きの量と関係し、低いモーション値は、前記ブロックの動きが小さいことを示し、高いモーション値は、前記ブロックの動きが大きいことを示すデバイス。
  34. 前記空間的複雑度は、前記マルチメディアデータの少なくとも1つのブロックに関連するDscat値に基づく請求項33に記載のデバイス。
  35. 前記時間的複雑度は、前記マルチメディアデータの少なくとも1つのブロックに関連する少なくとも1つのMV(動きベクトル)に基づく請求項33に記載のデバイス。
  36. 前記時間的複雑度は、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対差分の合計にさらに基づく請求項35に記載のデバイス。
  37. 前記マルチメディアデータは、複数のコンテンツ分類の中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項33に記載のデバイス。
  38. 前記プロセッサは、前記マルチメディアデータを通信するためのビットレートを、該マルチメディアデータのコンテンツ分類に基づいて決定するようにさらに構成される請求項37に記載のデバイス。
  39. 前記プロセッサは、複数の分類におけるマルチメディアデータを見るための視覚的品質値を決定するようにさらに構成される請求項33に記載のデバイス。
  40. 前記プロセッサは、コンテンツ分類にビットレートを関連付けることによってビットレートを決定するように構成され、前記関連付けは、マルチメディアデータを見るための視覚的品質値に基づく請求項33に記載のデバイス。
  41. ビットレートを決定するように構成されることは、前記マルチメディア分類に基づいて前記マルチメディアデータの少なくとも1つのブロックを符号化するために割り当てられるべきビットの数を決定するように構成されることを含む請求項33に記載のデバイス。
  42. マルチメディアデータの複雑度を判定することと、
    前記判定された複雑度に基づいてマルチメディアデータを分類することと、
    前記マルチメディアデータの分類に基づいて、前記マルチメディアデータに異なるレート歪み曲線を割り当てることと、
    前記マルチメディアデータの分類に基づいて割り当てられたレート歪み曲線および所望の目標品質レベルに基づいて、前記マルチメディアデータを符号化するためのビットレートを決定することと、
    を含むマルチメディアデータを処理するための方法を実体化するためのコンピュータ可読媒体であって、
    前記複雑度を判定する前記方法は、前記マルチメディアデータの前記空間的複雑度および前記時間的複雑度を判定することを含み、
    前記マルチメディアデータを分類することは、前記空間的複雑度をテクスチャ値に関連付けること、前記時間的複雑度をモーション値に関連付けること、および、前記テクスチャ値および前記モーション値に基づき、前記マルチメディアデータにコンテンツ分類を割り当てることを含み、
    前記テクスチャ値は、前記マルチメディアデータの輝度値と関係し、低いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の大きい変化を示し、
    前記モーション値は、前記マルチメディアデータの少なくとも1つのブロックの動きの量と関係し、低いモーション値は、前記ブロックの動きが小さいことを示し、高いモーション値は、前記ブロックの動きが大きいことを示すコンピュータ可読媒体。
  43. 前記マルチメディアデータを分類する前記方法は、複数のコンテンツの中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項42に記載のコンピュータ可読媒体。
  44. 前記方法は、前記マルチメディアデータ分類に基づいて前記マルチメディアデータを通信するためのビットレートを決定することをさらに含む請求項42に記載のコンピュータ可読媒体。
  45. ビットレートを決定する前記方法は、視覚的品質値に基づいてコンテンツ分類にビットレートを関連付けることを含み、前記視覚的品質値は、マルチメディアデータを見るための人間によって知覚される品質レベルを含む請求項42に記載のコンピュータ可読媒体。
  46. ビットレートを決定する前記方法は、前記分類に基づいて前記マルチメディアデータの少なくとも1つのブロックを符号化するために割り当てられるべきビットの数を決定することを含む請求項42に記載のコンピュータ可読媒体。
  47. マルチメディアデータを処理するための装置であって、
    マルチメディアデータの複雑度を判定する第1のディターミナ(determiner)と、
    前記判定された複雑度に基づいて前記マルチメディアデータを分類するコンテンツクラシファイア(classifier)と、
    前記マルチメディアデータの分類に基づいて、前記マルチメディアデータに異なるレート歪み曲線を割り当てるアロケータと、
    前記マルチメディアデータの分類に基づいて割り当てられたレート歪み曲線および所望の目標品質レベルに基づいて、前記マルチメディアデータを符号化するためのビットレートを決定する第2のディターミナとを含み、
    前記第1のディターミナは、前記マルチメディアデータの空間的複雑度、および前記マルチメディアデータの時間的複雑度を判定し、
    前記クラシファイアは、前記空間的複雑度をテクスチャ値に関連付けること、前記時間的複雑度をモーション値に関連付けること、および、前記テクスチャ値および前記モーション値に基づき、前記マルチメディアデータにコンテンツ分類を割り当てることにより、前記マルチメディアデータを分類し、
    前記テクスチャ値は、前記マルチメディアデータの輝度値と関係し、低いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の小さい変化を示し、高いテクスチャ値は、前記マルチメディアデータの近傍ピクセルの輝度値の大きい変化を示し、
    前記モーション値は、前記マルチメディアデータの少なくとも1つのブロックの動きの量と関係し、低いモーション値は、前記ブロックの動きが小さいことを示し、高いモーション値は、前記ブロックの動きが大きいことを示す装置。
  48. 前記空間的複雑度は、前記マルチメディアデータの少なくとも1つのブロックに関連する少なくとも1つのDcsat値に基づく請求項47に記載の装置。
  49. 前記時間的複雑度は、前記マルチメディアデータの少なくとも1つのブロックに関連する少なくとも1つのMV(動きベクトル)に基づく請求項47に記載の装置。
  50. 前記時間的複雑度は、前記マルチメディアデータの少なくとも1つのブロック、および基準ブロックに関連する絶対ピクセル差分の合計にさらに基づく請求項49に記載の装置。
  51. 前記分類に基づいて前記マルチメディアデータを通信するためのビットレートを決定することをさらに含む請求項47に記載の装置。
  52. ビットレートを決定することは、マルチメディアデータを見るための視覚的品質値に基づき、前記マルチメディアデータ分類にビットレートを関連付けることを含む請求項47に記載の装置。
  53. 前記ビットレートを決定することは、前記分類に基づいて前記マルチメディアデータの少なくとも1つのブロックを符号化するために割り当てられるべきビットの数を決定することを含む請求項47に記載の装置。
  54. 複数のコンテンツ分類におけるマルチメディアデータを見るための視覚的品質値を決定するための第3のディターミナをさらに含む請求項47に記載の装置。
  55. 複数のコンテンツの中から、前記マルチメディアデータに、コンテンツ分類を割り当てることを備える請求項47に記載の装置。
JP2008500935A 2005-03-10 2006-03-10 マルチメディア処理のためのコンテンツ分類 Active JP5318561B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US60/660,677 2004-04-08
US66067705P 2005-03-10 2005-03-10
PCT/US2006/008484 WO2006099082A2 (en) 2005-03-10 2006-03-10 Content adaptive multimedia processing

Related Child Applications (2)

Application Number Title Priority Date Filing Date
JP2011242313A Division JP2012075136A (ja) 2005-03-10 2011-11-04 マルチメディア処理のためのコンテンツ分類
JP2012279890A Division JP2013085287A (ja) 2005-03-10 2012-12-21 マルチメディア処理のためのコンテンツ分類

Publications (2)

Publication Number Publication Date
JP2008533841A JP2008533841A (ja) 2008-08-21
JP5318561B2 true JP5318561B2 (ja) 2013-10-16

Family

ID=36589187

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2008500935A Active JP5318561B2 (ja) 2005-03-10 2006-03-10 マルチメディア処理のためのコンテンツ分類
JP2011242313A Pending JP2012075136A (ja) 2005-03-10 2011-11-04 マルチメディア処理のためのコンテンツ分類
JP2012279890A Pending JP2013085287A (ja) 2005-03-10 2012-12-21 マルチメディア処理のためのコンテンツ分類

Family Applications After (2)

Application Number Title Priority Date Filing Date
JP2011242313A Pending JP2012075136A (ja) 2005-03-10 2011-11-04 マルチメディア処理のためのコンテンツ分類
JP2012279890A Pending JP2013085287A (ja) 2005-03-10 2012-12-21 マルチメディア処理のためのコンテンツ分類

Country Status (16)

Country Link
US (1) US9197912B2 (ja)
EP (1) EP1867173A2 (ja)
JP (3) JP5318561B2 (ja)
KR (1) KR20070117660A (ja)
CN (2) CN101697591A (ja)
AR (1) AR052601A1 (ja)
AU (1) AU2006223416A1 (ja)
BR (1) BRPI0608282A2 (ja)
CA (1) CA2600750A1 (ja)
CL (2) CL2006000541A1 (ja)
IL (1) IL185828A0 (ja)
MX (1) MX2007011084A (ja)
NO (1) NO20075130L (ja)
RU (1) RU2402885C2 (ja)
TW (1) TW200704200A (ja)
WO (1) WO2006099082A2 (ja)

Families Citing this family (128)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7383421B2 (en) * 2002-12-05 2008-06-03 Brightscale, Inc. Cellular engine for a data processing system
CA2491522C (en) * 2002-07-01 2014-12-09 E G Technology Inc. Efficient compression and transport of video over a network
US8780957B2 (en) 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
JP4725127B2 (ja) * 2005-02-16 2011-07-13 ソニー株式会社 復号装置および方法、記録媒体、並びにプログラム
ES2336824T3 (es) * 2005-03-10 2010-04-16 Qualcomm Incorporated Arquitectura de decodificador para gestion de errores optimizada en flujo continuo multimedia.
AR052601A1 (es) 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
US8693540B2 (en) * 2005-03-10 2014-04-08 Qualcomm Incorporated Method and apparatus of temporal error concealment for P-frame
US7925955B2 (en) * 2005-03-10 2011-04-12 Qualcomm Incorporated Transmit driver in communication system
US7714939B2 (en) * 2005-04-05 2010-05-11 Samsung Electronics Co., Ltd. Reliability estimation of temporal noise estimation
US7974193B2 (en) 2005-04-08 2011-07-05 Qualcomm Incorporated Methods and systems for resizing multimedia content based on quality and rate information
US7653085B2 (en) 2005-04-08 2010-01-26 Qualcomm Incorporated Methods and apparatus for enhanced delivery of content over data network
US7483388B2 (en) * 2005-06-23 2009-01-27 Cisco Technology, Inc. Method and system for sending a multimedia stream in an IP multicast network
WO2007014216A2 (en) 2005-07-22 2007-02-01 Cernium Corporation Directed attention digital video recordation
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
US8126283B1 (en) * 2005-10-13 2012-02-28 Maxim Integrated Products, Inc. Video encoding statistics extraction using non-exclusive content categories
US8149909B1 (en) * 2005-10-13 2012-04-03 Maxim Integrated Products, Inc. Video encoding control using non-exclusive content categories
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US7451293B2 (en) * 2005-10-21 2008-11-11 Brightscale Inc. Array of Boolean logic controlled processing elements with concurrent I/O processing and instruction sequencing
US8112513B2 (en) * 2005-11-30 2012-02-07 Microsoft Corporation Multi-user display proxy server
JP2009523292A (ja) * 2006-01-10 2009-06-18 ブライトスケール インコーポレイテッド 並列処理システムにおけるマルチメディア・データ処理をスケジューリングするための方法及び装置
US8792555B2 (en) 2006-01-31 2014-07-29 Qualcomm Incorporated Methods and systems for resizing multimedia content
US8005140B2 (en) * 2006-03-17 2011-08-23 Research In Motion Limited Soft decision and iterative video coding for MPEG and H.264
US9131164B2 (en) 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
KR100834625B1 (ko) * 2006-07-27 2008-06-02 삼성전자주식회사 비디오 인코딩 데이터율 제어를 위한 실시간 장면 전환검출 방법
US20080244238A1 (en) * 2006-09-01 2008-10-02 Bogdan Mitu Stream processing accelerator
US20080059467A1 (en) * 2006-09-05 2008-03-06 Lazar Bivolarski Near full motion search algorithm
US8392595B2 (en) * 2006-09-15 2013-03-05 France Telecom Method and device for adapting a scalable data stream, corresponding computer program product and network element
JP5766915B2 (ja) * 2007-01-31 2015-08-19 トムソン ライセンシングThomson Licensing 潜在的なショット及びシーンの検出情報を自動的に分類する方法及び装置
JP4875007B2 (ja) * 2007-02-09 2012-02-15 パナソニック株式会社 動画像符号化装置、動画像符号化方法、及び、動画像復号化装置
GB2447058A (en) * 2007-02-28 2008-09-03 Tandberg Television Asa Compression of video signals containing fades and flashes
US8582647B2 (en) * 2007-04-23 2013-11-12 Qualcomm Incorporated Methods and systems for quality controlled encoding
US8090016B2 (en) * 2007-05-17 2012-01-03 Zoran Corporation Activity normalization for video encoding
KR101382618B1 (ko) * 2007-08-21 2014-04-10 한국전자통신연구원 콘텐츠 정보 생성 방법 및 콘텐츠 정보를 이용한 콘텐츠처리 장치
WO2009032255A2 (en) * 2007-09-04 2009-03-12 The Regents Of The University Of California Hierarchical motion vector processing method, software and devices
KR100939435B1 (ko) * 2007-10-29 2010-01-28 에스케이 텔레콤주식회사 영상 분석 장치 및 방법
JP5006763B2 (ja) * 2007-11-05 2012-08-22 キヤノン株式会社 画像符号化装置及びその制御方法、コンピュータプログラム
US8938005B2 (en) 2007-11-05 2015-01-20 Canon Kabushiki Kaisha Image encoding apparatus, method of controlling the same, and computer program
EP2101503A1 (en) * 2008-03-11 2009-09-16 British Telecommunications Public Limited Company Video coding
WO2010009770A1 (en) * 2008-07-25 2010-01-28 Telefonaktiebolaget Lm Ericsson (Publ) A method for the estimation of spatio-temporal homogeneity in video sequences
CN101686383B (zh) * 2008-09-23 2013-05-01 Utc消防和保安美国有限公司 通过网络传输媒体的方法及系统
US8457194B2 (en) 2008-09-29 2013-06-04 Microsoft Corporation Processing real-time video
US8913668B2 (en) * 2008-09-29 2014-12-16 Microsoft Corporation Perceptual mechanism for the selection of residues in video coders
FR2936926B1 (fr) * 2008-10-06 2010-11-26 Thales Sa Systeme et procede de determination de parametres de codage
WO2010057170A1 (en) 2008-11-17 2010-05-20 Cernium Corporation Analytics-modulated coding of surveillance video
EP2200319A1 (en) 2008-12-10 2010-06-23 BRITISH TELECOMMUNICATIONS public limited company Multiplexed video streaming
US8311115B2 (en) 2009-01-29 2012-11-13 Microsoft Corporation Video encoding using previously calculated motion information
US8396114B2 (en) 2009-01-29 2013-03-12 Microsoft Corporation Multiple bit rate video encoding using variable bit rate and dynamic resolution for adaptive video streaming
EP2219342A1 (en) 2009-02-12 2010-08-18 BRITISH TELECOMMUNICATIONS public limited company Bandwidth allocation control in multiple video streaming
FI20095273A0 (fi) * 2009-03-17 2009-03-17 On2 Technologies Finland Oy Digitaalinen videokoodaus
US8270473B2 (en) * 2009-06-12 2012-09-18 Microsoft Corporation Motion based dynamic resolution multiple bit rate video encoding
KR20180030255A (ko) 2009-11-30 2018-03-21 가부시키가이샤 한도오따이 에네루기 켄큐쇼 액정 표시 장치, 액정 표시 장치의 구동 방법, 및 이 액정 표시 장치를 구비하는 전자기기
US8705616B2 (en) 2010-06-11 2014-04-22 Microsoft Corporation Parallel multiple bitrate video encoding to reduce latency and dependences between groups of pictures
US20110321104A1 (en) * 2010-06-24 2011-12-29 Worldplay (Barbados) Inc. System and method for mass distribution of high quality video
CN101977309B (zh) * 2010-06-30 2012-07-25 无锡中星微电子有限公司 码率控制方法及装置
EP2405661B1 (en) 2010-07-06 2017-03-22 Google, Inc. Loss-robust video transmission using two decoders
EP2434826A1 (en) * 2010-08-30 2012-03-28 NTT DoCoMo, Inc. Method and apparatus for allocating network rates
JP5349429B2 (ja) * 2010-08-30 2013-11-20 Kddi株式会社 符号量低減装置および符号化装置
US9036695B2 (en) * 2010-11-02 2015-05-19 Sharp Laboratories Of America, Inc. Motion-compensated temporal filtering based on variable filter parameters
US8837601B2 (en) * 2010-12-10 2014-09-16 Netflix, Inc. Parallel video encoding based on complexity analysis
US8891831B2 (en) 2010-12-14 2014-11-18 The United States Of America, As Represented By The Secretary Of The Navy Method and apparatus for conservative motion estimation from multi-image sequences
US9547911B2 (en) 2010-12-14 2017-01-17 The United States Of America, As Represented By The Secretary Of The Navy Velocity estimation from imagery using symmetric displaced frame difference equation
CN103493481A (zh) * 2011-01-28 2014-01-01 艾艾欧有限公司 基于场景的适应性比特率控制
JP6072678B2 (ja) * 2011-04-25 2017-02-01 シャープ株式会社 画像符号化装置、画像符号化方法、画像符号化プログラム、画像復号装置、画像復号方法及び画像復号プログラム
US20120275511A1 (en) * 2011-04-29 2012-11-01 Google Inc. System and method for providing content aware video adaptation
US8767821B2 (en) 2011-05-09 2014-07-01 Google Inc. System and method for providing adaptive media optimization
EP2536143B1 (en) * 2011-06-16 2015-01-14 Axis AB Method and a digital video encoder system for encoding digital video data
EP2536144A1 (en) * 2011-06-17 2012-12-19 Thomson Licensing Method and device of lossy compress-encoding an image
WO2012174740A1 (en) * 2011-06-24 2012-12-27 Technicolor (China) Technology Co., Ltd. Method and device for assessing packet defect caused degradation in packet coded video
WO2013019517A1 (en) 2011-08-02 2013-02-07 Ciinow, Inc. A method and mechanism for efficiently delivering visual data across a network
US9591318B2 (en) 2011-09-16 2017-03-07 Microsoft Technology Licensing, Llc Multi-layer encoding and decoding
US9432704B2 (en) * 2011-11-06 2016-08-30 Akamai Technologies Inc. Segmented parallel encoding with frame-aware, variable-size chunking
US20130142250A1 (en) * 2011-12-06 2013-06-06 Broadcom Corporation Region based classification and adaptive rate control method and apparatus
US9094684B2 (en) * 2011-12-19 2015-07-28 Google Technology Holdings LLC Method for dual pass rate control video encoding
JP5722761B2 (ja) * 2011-12-27 2015-05-27 株式会社ソニー・コンピュータエンタテインメント 動画圧縮装置、画像処理装置、動画圧縮方法、画像処理方法、および動画圧縮ファイルのデータ構造
US9014265B1 (en) 2011-12-29 2015-04-21 Google Inc. Video coding using edge detection and block partitioning for intra prediction
US11089343B2 (en) 2012-01-11 2021-08-10 Microsoft Technology Licensing, Llc Capability advertisement, configuration and control for video coding and decoding
US9438918B2 (en) * 2012-04-23 2016-09-06 Intel Corporation Frame level rate control using motion estimated distortions
US9042441B2 (en) 2012-04-25 2015-05-26 At&T Intellectual Property I, Lp Apparatus and method for media streaming
JP5409842B2 (ja) * 2012-05-22 2014-02-05 キヤノン株式会社 画像符号化装置及びその制御方法、コンピュータプログラム
WO2014001605A1 (en) * 2012-06-28 2014-01-03 Ant-Advanced Network Technologies Oy Processing and error concealment of digital signals
JP2014063259A (ja) * 2012-09-20 2014-04-10 Fujitsu Ltd 端末装置,及び処理プログラム
US9491459B2 (en) * 2012-09-27 2016-11-08 Qualcomm Incorporated Base layer merge and AMVP modes for video coding
EP2909990B1 (en) * 2012-10-18 2019-01-16 VID SCALE, Inc. Decoding complexity for mobile multimedia streaming
US20140112384A1 (en) * 2012-10-22 2014-04-24 General Instrument Corporation Algorithms for determining bitrate for a statistical multiplexing system using scene change
US8948529B1 (en) 2012-10-30 2015-02-03 Google Inc. Multi-pass encoding
CN104782124B (zh) * 2012-12-17 2018-09-07 英特尔公司 利用编码器硬件对视频内容进行预处理
RU2533852C2 (ru) * 2012-12-26 2014-11-20 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ кодирования/декодирования многоракурсной видеопоследовательности на основе адаптивной компенсации локальных различий яркости при межкадровом предсказании (варианты)
CN107578781B (zh) * 2013-01-21 2021-01-29 杜比实验室特许公司 利用响度处理状态元数据的音频编码器和解码器
KR102158002B1 (ko) 2013-01-21 2020-09-21 돌비 레버러토리즈 라이쎈싱 코오포레이션 프로그램 라우드니스 및 경계 메타데이터를 가진 오디오 인코더 및 디코더
US9053366B2 (en) * 2013-02-20 2015-06-09 Honeywell International Inc. System and method for detecting motion in compressed video
US9210424B1 (en) 2013-02-28 2015-12-08 Google Inc. Adaptive prediction block size in video coding
US9607003B2 (en) * 2013-03-14 2017-03-28 Massachusetts Institute Of Technology Network coded storage with multi-resolution codes
US9313493B1 (en) 2013-06-27 2016-04-12 Google Inc. Advanced motion estimation
US9344218B1 (en) * 2013-08-19 2016-05-17 Zoom Video Communications, Inc. Error resilience for interactive real-time multimedia applications
CN105519114A (zh) 2013-09-10 2016-04-20 株式会社Kt 用于对可扩展视频信号进行编码/解码的方法及装置
US9485456B2 (en) 2013-12-30 2016-11-01 Akamai Technologies, Inc. Frame-rate conversion in a distributed computing system
CN105335595A (zh) * 2014-06-30 2016-02-17 杜比实验室特许公司 基于感受的多媒体处理
US20160112707A1 (en) * 2014-10-15 2016-04-21 Intel Corporation Policy-based image encoding
CN104410863B (zh) * 2014-12-11 2017-07-11 上海兆芯集成电路有限公司 图像处理器以及图像处理方法
EP3073738A1 (en) * 2015-03-26 2016-09-28 Alcatel Lucent Methods and devices for video encoding
CN104811694B (zh) * 2015-04-28 2017-03-08 华为技术有限公司 一种视频数据质量评估的方法和装置
US10551162B2 (en) 2015-05-06 2020-02-04 North Carolina State University Code-modulated phased-array interferometric imaging
CN104902275B (zh) * 2015-05-29 2018-04-20 宁波菊风系统软件有限公司 一种控制视频通信质量甜点的方法
JP6231046B2 (ja) * 2015-06-24 2017-11-15 株式会社ドワンゴ 動画データ配信管理装置、動画データ配信管理方法、プログラム
JP2017529710A (ja) 2015-07-31 2017-10-05 エスゼット ディージェイアイ テクノロジー カンパニー リミテッドSz Dji Technology Co.,Ltd 検索エリアを評価する方法
CN107852491B (zh) * 2015-07-31 2021-09-14 深圳市大疆创新科技有限公司 传感器辅助的码率控制方法
FR3040849A1 (fr) * 2015-09-04 2017-03-10 Stmicroelectronics (Grenoble 2) Sas Procede de compression d'un flux de donnees video
US9807416B2 (en) 2015-09-21 2017-10-31 Google Inc. Low-latency two-pass video coding
EP3151562B1 (en) 2015-09-29 2020-06-17 Dolby Laboratories Licensing Corporation Feature based bitrate allocation in non-backward compatible multi-layer codec via machine learning
CN105426515B (zh) 2015-12-01 2018-12-18 小米科技有限责任公司 视频归类方法及装置
US10902043B2 (en) 2016-01-03 2021-01-26 Gracenote, Inc. Responding to remote media classification queries using classifier models and context parameters
CN108109592B (zh) 2016-11-25 2022-01-25 株式会社半导体能源研究所 显示装置及其工作方法
US10834406B2 (en) 2016-12-12 2020-11-10 Netflix, Inc. Device-consistent techniques for predicting absolute perceptual video quality
WO2018140158A1 (en) * 2017-01-30 2018-08-02 Euclid Discoveries, Llc Video characterization for smart enconding based on perceptual quality optimization
US11076179B2 (en) * 2017-06-13 2021-07-27 DISH Technologies L.L.C. Viewership-balanced video multiplexing
EP3662470B1 (en) * 2017-08-01 2021-03-24 Dolby Laboratories Licensing Corporation Audio object classification based on location metadata
CN108024146A (zh) * 2017-12-14 2018-05-11 深圳Tcl数字技术有限公司 新闻界面自动设置方法、智能电视及计算机可读存储介质
TW201942870A (zh) * 2018-04-03 2019-11-01 香港商科科串流股份有限公司 位元率優化系統及方法
FR3082689B1 (fr) * 2018-06-13 2020-09-11 Ateme Procede d'analyse de la complexite d'un contenu multimedia source pour une diffusion a la demande
CN110876082B (zh) * 2018-08-31 2020-12-29 网宿科技股份有限公司 一种视频帧的复杂度的确定方法及装置
CN110876060B (zh) * 2018-08-31 2022-07-15 网宿科技股份有限公司 一种编码过程中的码率调整方法及装置
US10992938B2 (en) * 2018-09-28 2021-04-27 Ati Technologies Ulc Spatial block-level pixel activity extraction optimization leveraging motion vectors
US10778938B2 (en) * 2018-12-20 2020-09-15 Hulu, LLC Video chunk combination optimization
US11924449B2 (en) 2020-05-19 2024-03-05 Google Llc Multivariate rate control for transcoding video content
CN113038142B (zh) * 2021-03-25 2022-11-01 北京金山云网络技术有限公司 视频数据的筛选方法、装置及电子设备
US12022086B2 (en) * 2022-08-24 2024-06-25 Synamedia Vividtec Holdings, Inc. Content-adaptive encoder configuration
CN116800976B (zh) * 2023-07-17 2024-03-12 武汉星巡智能科技有限公司 伴睡婴幼儿时音视频压缩和还原方法、装置及设备

Family Cites Families (277)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2646047B1 (fr) 1989-04-13 1995-08-04 Telediffusion Fse Procede et installation de codage et de transmission d'images animees sous forme numerique a bas debit
JP2909239B2 (ja) * 1991-03-27 1999-06-23 株式会社東芝 高能率符号化記録再生装置
JP3189292B2 (ja) 1991-05-09 2001-07-16 松下電器産業株式会社 走査線補間装置
KR0121328B1 (ko) * 1991-12-13 1997-11-17 사또오 후미오 디지탈 신호 기록 재생 장치
IT1252546B (it) 1991-12-18 1995-06-19 Alcatel Italia Metodo e sistema per adattare il ciclo di frequenza di refresh alla complessita' dell'immagine
JPH05344492A (ja) 1992-06-11 1993-12-24 Ricoh Co Ltd フレーム間予測符号化方式
US5289276A (en) 1992-06-19 1994-02-22 General Electric Company Method and apparatus for conveying compressed video data over a noisy communication channel
JP2611607B2 (ja) 1992-06-29 1997-05-21 日本ビクター株式会社 シーンチェンジ検出装置
FR2700090B1 (fr) * 1992-12-30 1995-01-27 Thomson Csf Procédé de désentrelacement de trames d'une séquence d'images animées.
JP2979900B2 (ja) 1993-05-26 1999-11-15 日本ビクター株式会社 記録媒体
EP0627853B1 (en) 1993-06-03 2000-11-15 Matsushita Electric Industrial Co., Ltd. Picture reproduction apparatus and picture decoding apparatus
KR960704440A (ko) 1993-07-19 1996-08-31 베리 조지 윌리엄 로이드 비디오 영상에서의 에러를 검출하는 방법과 에러 검출장치(detecting errors in video images)
CA2127151A1 (en) 1993-09-21 1995-03-22 Atul Puri Spatially scalable video encoding and decoding
US5991502A (en) 1993-10-04 1999-11-23 Matsushita Electric Industrial Co., Ltd. Optical recording device which calculates distances between I-frames and records I-frame addresses in a sector
AU681185B2 (en) 1993-10-22 1997-08-21 Sony Corporation apparatus and method for recording and reproducing digital video data
JP3173257B2 (ja) 1993-11-09 2001-06-04 松下電器産業株式会社 符号化方法と符号化装置
JP2734953B2 (ja) * 1993-12-16 1998-04-02 日本電気株式会社 Cdma受信装置
JP2839132B2 (ja) 1993-12-17 1998-12-16 日本電信電話株式会社 映像カット点検出方法及び装置
US5642294A (en) 1993-12-17 1997-06-24 Nippon Telegraph And Telephone Corporation Method and apparatus for video cut detection
US5446491A (en) 1993-12-21 1995-08-29 Hitachi, Ltd. Multi-point video conference system wherein each terminal comprises a shared frame memory to store information from other terminals
JP3149303B2 (ja) 1993-12-29 2001-03-26 松下電器産業株式会社 デジタル画像符号化方法及びデジタル画像復号化方法
US5592226A (en) 1994-01-26 1997-01-07 Btg Usa Inc. Method and apparatus for video data compression using temporally adaptive motion interpolation
JP3197420B2 (ja) * 1994-01-31 2001-08-13 三菱電機株式会社 画像符号化装置
US6798834B1 (en) * 1996-08-15 2004-09-28 Mitsubishi Denki Kabushiki Kaisha Image coding apparatus with segment classification and segmentation-type motion prediction circuit
KR100213015B1 (ko) * 1994-03-31 1999-08-02 윤종용 양자화 방법 및 회로
US6091460A (en) * 1994-03-31 2000-07-18 Mitsubishi Denki Kabushiki Kaisha Video signal encoding method and system
US5508752A (en) 1994-04-12 1996-04-16 Lg Electronics Inc. Partial response trellis decoder for high definition television (HDTV) system
JPH07298272A (ja) 1994-04-28 1995-11-10 Canon Inc 映像符号化装置
US5706386A (en) * 1994-05-24 1998-01-06 Sony Corporation Image information recording method and apparatus, image information reproducing method and apparatus and editing method and system
EP0845908B1 (en) 1994-06-17 2003-02-05 Snell & Wilcox Limited Compressing a signal combined from compression encoded video signals after partial decoding thereof
US5521644A (en) 1994-06-30 1996-05-28 Eastman Kodak Company Mechanism for controllably deinterlacing sequential lines of video data field based upon pixel signals associated with four successive interlaced video fields
KR100213018B1 (ko) * 1994-07-30 1999-08-02 윤종용 동화상 부호화장치
JP3755155B2 (ja) 1994-09-30 2006-03-15 ソニー株式会社 画像符号化装置
JPH0918782A (ja) 1995-06-29 1997-01-17 Sony Corp 映像信号処理方法及び装置
SG74566A1 (en) 1995-08-23 2000-08-22 Sony Corp Encoding/decoding fields of predetermined field polarity apparatus and method
JPH0974566A (ja) 1995-09-04 1997-03-18 Sony Corp 圧縮符号化装置及び圧縮符号化データの記録装置
US5745645A (en) * 1995-09-29 1998-04-28 Matsushita Electric Industrial Co., Ltd. Method and an apparatus for encoding telecine-converted video data for seamless connection
JPH09130732A (ja) 1995-11-01 1997-05-16 Matsushita Electric Ind Co Ltd シーンチェンジ検出方法および動画像編集装置
US5835163A (en) 1995-12-21 1998-11-10 Siemens Corporate Research, Inc. Apparatus for detecting a cut in a video
US5682204A (en) 1995-12-26 1997-10-28 C Cube Microsystems, Inc. Video encoder which uses intra-coding when an activity level of a current macro-block is smaller than a threshold level
US5821991A (en) 1996-02-28 1998-10-13 C-Cube Microsystems, Inc. Method and apparatus for inverse telecine process by correlating vectors of pixel differences
US5929902A (en) 1996-02-28 1999-07-27 C-Cube Microsystems Method and apparatus for inverse telecine processing by fitting 3:2 pull-down patterns
US6157674A (en) 1996-03-21 2000-12-05 Sony Corporation Audio and video data transmitting apparatus, system, and method thereof
GB9607645D0 (en) 1996-04-12 1996-06-12 Snell & Wilcox Ltd Processing of video signals prior to compression
JPH09284770A (ja) 1996-04-13 1997-10-31 Sony Corp 画像符号化装置および方法
JPH1013826A (ja) 1996-06-21 1998-01-16 Sony Corp 画像符号化装置および画像符号化方法、画像復号化装置および画像復号化方法、画像送信装置、画像受信装置、並びに記録媒体
US7095874B2 (en) * 1996-07-02 2006-08-22 Wistaria Trading, Inc. Optimization methods for the insertion, protection, and detection of digital watermarks in digitized data
US6643506B1 (en) * 1996-08-07 2003-11-04 Telxon Corporation Wireless software upgrades with version control
US5793895A (en) 1996-08-28 1998-08-11 International Business Machines Corporation Intelligent error resilient video encoder
KR100389893B1 (ko) 1996-11-09 2003-09-19 삼성전자주식회사 영상 특성 분류법을 이용한 영상 부호화 장치
FR2756399B1 (fr) 1996-11-28 1999-06-25 Thomson Multimedia Sa Procede et dispositif de compression video pour images de synthese
EP0905981B1 (en) * 1997-03-12 2006-06-28 Matsushita Electric Industrial Co., Ltd. Video signal coding method and coding device
JPH10313463A (ja) 1997-03-12 1998-11-24 Matsushita Electric Ind Co Ltd 映像信号符号化方法及び符号化装置
JP3679606B2 (ja) 1997-04-18 2005-08-03 キヤノン株式会社 符号化装置及び方法並びに符号化プログラムが記録されたコンピュータ可読記録媒体
US6333950B1 (en) 1997-04-18 2001-12-25 Canon Kabushiki Kaisha Encoding apparatus and method and computer readable recording medium in which encoding program has been recorded
JP3588970B2 (ja) * 1997-04-30 2004-11-17 ソニー株式会社 信号符号化方法、信号符号化装置、信号記録媒体及び信号伝送方法
FR2764156B1 (fr) * 1997-05-27 1999-11-05 Thomson Broadcast Systems Dispositif de pretraitement pour codage mpeg ii
US5864369A (en) * 1997-06-16 1999-01-26 Ati International Srl Method and apparatus for providing interlaced video on a progressive display
US6012091A (en) 1997-06-30 2000-01-04 At&T Corporation Video telecommunications server and method of providing video fast forward and reverse
KR100226722B1 (ko) 1997-07-30 1999-10-15 구자홍 동영상 움직임 벡터 추정 방법
US5978029A (en) * 1997-10-10 1999-11-02 International Business Machines Corporation Real-time encoding of video sequence employing two encoders and statistical analysis
US6574211B2 (en) * 1997-11-03 2003-06-03 Qualcomm Incorporated Method and apparatus for high rate packet data transmission
US5956026A (en) 1997-12-19 1999-09-21 Sharp Laboratories Of America, Inc. Method for hierarchical summarization and browsing of digital video
US6115499A (en) 1998-01-14 2000-09-05 C-Cube Semiconductor Ii, Inc. Repeat field detection using checkerboard pattern
US6175650B1 (en) 1998-01-26 2001-01-16 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
WO1999043157A1 (en) 1998-02-19 1999-08-26 Motorola Inc. System and method for non-causal encoding of video information for improved streaming thereof
JP3649370B2 (ja) 1998-02-25 2005-05-18 日本ビクター株式会社 動き補償符号化装置及び動き補償符号化方法
JP3738939B2 (ja) 1998-03-05 2006-01-25 Kddi株式会社 動画像のカット点検出装置
DE69830471T2 (de) 1998-03-09 2006-08-10 Sony Deutschland Gmbh Interpolator mit einem gewichteten Medianfilter
US6895048B2 (en) * 1998-03-20 2005-05-17 International Business Machines Corporation Adaptive encoding of a sequence of still frames or partially still frames within motion video
US6538688B1 (en) * 1998-07-02 2003-03-25 Terran Interactive Method and apparatus for performing an automated inverse telecine process
JP2000032474A (ja) 1998-07-08 2000-01-28 Sharp Corp 動画像符号化装置
JP2000059774A (ja) 1998-08-06 2000-02-25 Nippon Telegr & Teleph Corp <Ntt> 映像符号化制御装置
US6580829B1 (en) 1998-09-25 2003-06-17 Sarnoff Corporation Detecting and coding flash frames in video data
EP1119979B1 (en) 1998-09-29 2013-01-23 General Instrument Corporation Method and apparatus for detecting scene changes and adjusting picture coding type in a high definition television encoder
JP3921841B2 (ja) * 1998-10-16 2007-05-30 ソニー株式会社 信号処理装置および方法、ならびに、記録装置、再生装置および記録再生装置
JP2000209553A (ja) 1998-11-13 2000-07-28 Victor Co Of Japan Ltd 情報信号記録装置及び再生装置
US6297848B1 (en) 1998-11-25 2001-10-02 Sharp Laboratories Of America, Inc. Low-delay conversion of 3:2 pulldown video to progressive format with field averaging
JP3260713B2 (ja) * 1998-12-21 2002-02-25 日本電気株式会社 無線基地局のプログラムダウンロード方式
US6618507B1 (en) 1999-01-25 2003-09-09 Mitsubishi Electric Research Laboratories, Inc Methods of feature extraction of video sequences
JP3588564B2 (ja) 1999-03-31 2004-11-10 株式会社東芝 映像データ記録装置
US6724819B1 (en) 1999-04-02 2004-04-20 Matsushitas Electric Industrial Co., Ltd. Moving picture transmission apparatus, moving picture reception apparatus, and moving picture data record medium
JP3591712B2 (ja) 1999-04-02 2004-11-24 松下電器産業株式会社 動画送信装置及び動画受信装置
JP2000295626A (ja) 1999-04-08 2000-10-20 Mitsubishi Electric Corp 多段画像符号化装置
US6325805B1 (en) * 1999-04-23 2001-12-04 Sdgi Holdings, Inc. Shape memory alloy staple
WO2000067486A1 (en) 1999-04-30 2000-11-09 Koninklijke Philips Electronics N.V. Video encoding method with selection of b-frame encoding mode
JP4287538B2 (ja) 1999-04-30 2009-07-01 パナソニック株式会社 画像信号切替方法及び装置並びにこれを用いたデジタル撮像カメラ及び監視システム
GB2352350B (en) * 1999-07-19 2003-11-05 Nokia Mobile Phones Ltd Video coding
JP3669619B2 (ja) * 1999-09-06 2005-07-13 富士通株式会社 無線端末装置のソフトウェア更新方法及びその装置
US6370672B1 (en) 1999-11-01 2002-04-09 Lsi Logic Corporation Determining the received data rate in a variable rate communications system
GB2359918A (en) 2000-03-01 2001-09-05 Sony Uk Ltd Audio and/or video generation apparatus having a metadata generator
US6639943B1 (en) 1999-11-23 2003-10-28 Koninklijke Philips Electronics N.V. Hybrid temporal-SNR fine granular scalability video coding
JP2001169251A (ja) 1999-12-03 2001-06-22 Sony Corp 記録装置および方法、ならびに、再生装置および方法
US7116717B1 (en) 1999-12-15 2006-10-03 Bigband Networks, Inc. Method and system for scalable representation, storage, transmission and reconstruction of media streams
US7093028B1 (en) * 1999-12-15 2006-08-15 Microsoft Corporation User and content aware object-based data stream transmission methods and arrangements
US6449002B1 (en) 1999-12-21 2002-09-10 Thomson Licensing S.A. Truncated metric for NTSC interference rejection in the ATSC-HDTV trellis decoder
JP2001045494A (ja) 2000-01-01 2001-02-16 Mitsubishi Electric Corp 画像符号化装置
JP2001204026A (ja) 2000-01-21 2001-07-27 Sony Corp 画像情報変換装置及び方法
IL134182A (en) * 2000-01-23 2006-08-01 Vls Com Ltd Method and apparatus for visual lossless pre-processing
US6600836B1 (en) * 2000-01-28 2003-07-29 Qualcomm, Incorporated Quality based image compression
CN1168320C (zh) 2000-02-01 2004-09-22 皇家菲利浦电子有限公司 对图像预测编码的方法及视频编码器
US6574279B1 (en) 2000-02-02 2003-06-03 Mitsubishi Electric Research Laboratories, Inc. Video transcoding using syntactic and semantic clues
US6490320B1 (en) 2000-02-02 2002-12-03 Mitsubishi Electric Research Laboratories Inc. Adaptable bitstream video delivery system
US6542546B1 (en) * 2000-02-02 2003-04-01 Mitsubishi Electric Research Laboratories, Inc. Adaptable compressed bitstream transcoder
JP3960451B2 (ja) 2000-03-06 2007-08-15 Kddi株式会社 シーン特性検出型動画像符号化装置
SE0000766L (sv) 2000-03-08 2001-06-25 Sem Ab Krets för tändförställning, varvtalsbegränsning och förhindrande av baklängesgång i magnettändsystem
KR100844816B1 (ko) 2000-03-13 2008-07-09 소니 가부시끼 가이샤 간결한 트랜스코딩 힌트 메타데이터를 생성하는 방법 및장치
US20020154705A1 (en) 2000-03-22 2002-10-24 Walton Jay R. High efficiency high performance communications system employing multi-carrier modulation
US7009656B2 (en) 2000-04-07 2006-03-07 Snell & Wilcox Limited Video signal processing
WO2001080559A2 (en) 2000-04-18 2001-10-25 Silicon Image Method, system and apparatus for identifying the source type and quality level of a video sequence
US6507618B1 (en) * 2000-04-25 2003-01-14 Hewlett-Packard Company Compressed video signal including independently coded regions
EP1152621A1 (en) * 2000-05-05 2001-11-07 STMicroelectronics S.r.l. Motion estimation process and system.
JP4517453B2 (ja) 2000-05-30 2010-08-04 ソニー株式会社 画像情報変換装置及び方法並びに符号化装置及び方法
JP2001346214A (ja) 2000-06-05 2001-12-14 Sony Corp 画像情報変換装置及び方法
US6647061B1 (en) * 2000-06-09 2003-11-11 General Instrument Corporation Video size conversion and transcoding from MPEG-2 to MPEG-4
KR100708091B1 (ko) 2000-06-13 2007-04-16 삼성전자주식회사 양방향 움직임 벡터를 이용한 프레임 레이트 변환 장치 및그 방법
JP2002010259A (ja) 2000-06-21 2002-01-11 Mitsubishi Electric Corp 画像符号化装置及び画像符号化方法及び画像符号化プログラムを記録した記録媒体
EP1172681A3 (en) * 2000-07-13 2004-06-09 Creo IL. Ltd. Blazed micro-mechanical light modulator and array thereof
US20040125877A1 (en) 2000-07-17 2004-07-01 Shin-Fu Chang Method and system for indexing and content-based adaptive streaming of digital video content
JP4517475B2 (ja) 2000-07-26 2010-08-04 ソニー株式会社 画像情報変換装置及び方法並びに符号化装置及び方法
KR20020010171A (ko) 2000-07-27 2002-02-04 오길록 블록 정합 움직임 추정을 위한 적응적 예측 방향성 탐색방법
FI120125B (fi) * 2000-08-21 2009-06-30 Nokia Corp Kuvankoodaus
JP2002064817A (ja) 2000-08-21 2002-02-28 Kddi Research & Development Laboratories Inc オブジェクトスケーラブル符号化装置
JP3903703B2 (ja) 2000-09-01 2007-04-11 株式会社日立製作所 順次走査変換回路
JP2002094994A (ja) * 2000-09-19 2002-03-29 Nec Corp 動画再生処理装置および動画再生処理方法
US7038736B2 (en) 2000-09-21 2006-05-02 Canon Kabushiki Kaisha Moving image processing apparatus and method, and computer readable memory
EP1319309B1 (en) 2000-09-22 2006-11-22 Koninklijke Philips Electronics N.V. Hybrid temporal-snr fine granular scalability video coding
JP2002101416A (ja) 2000-09-25 2002-04-05 Fujitsu Ltd 画像制御装置
JP2002125227A (ja) 2000-10-11 2002-04-26 Sony Corp 画像情報変換装置及び方法
US7095814B2 (en) * 2000-10-11 2006-08-22 Electronics And Telecommunications Research Institute Apparatus and method for very high performance space-time array reception processing using chip-level beamforming and fading rate adaptation
KR100895725B1 (ko) 2000-11-23 2009-04-30 엔엑스피 비 브이 비디오 비트스트림 디코딩 방법 및 비디오 디코더
EP1209624A1 (en) 2000-11-27 2002-05-29 Sony International (Europe) GmbH Method for compressed imaging artefact reduction
US7058130B2 (en) 2000-12-11 2006-06-06 Sony Corporation Scene change detection
US7203238B2 (en) * 2000-12-11 2007-04-10 Sony Corporation 3:2 Pull-down detection
US6934335B2 (en) 2000-12-11 2005-08-23 Sony Corporation Video encoder with embedded scene change and 3:2 pull-down detections
US6744474B2 (en) 2000-12-13 2004-06-01 Thomson Licensing S.A. Recursive metric for NTSC interference rejection in the ATSC-HDTV trellis decoder
US6807234B2 (en) 2000-12-19 2004-10-19 Intel Corporation Method and apparatus for constellation mapping and bitloading in multi-carrier transceivers, such as DMT-based DSL transceivers
GB2372394B (en) 2000-12-22 2004-09-22 Matsushita Electric Ind Co Ltd Interpolation apparatus and video signal processing apparatus including the same
CA2330854A1 (en) 2001-01-11 2002-07-11 Jaldi Semiconductor Corp. A system and method for detecting a non-video source in video signals
US6987728B2 (en) 2001-01-23 2006-01-17 Sharp Laboratories Of America, Inc. Bandwidth allocation system
JP4336051B2 (ja) * 2001-01-31 2009-09-30 株式会社エヌ・ティ・ティ・ドコモ 無線通信端末、発呼制限方法及びプログラム
US6721361B1 (en) 2001-02-23 2004-04-13 Yesvideo.Com Video processing system including advanced scene break detection methods for fades, dissolves and flashes
JP2004531925A (ja) 2001-03-05 2004-10-14 インタービデオインコーポレイテッド 圧縮されたビデオビットストリームにおける冗長な動きベクトルを符号化し復号するシステム及び方法
KR100783396B1 (ko) * 2001-04-19 2007-12-10 엘지전자 주식회사 부호기의 서브밴드 분할을 이용한 시공간 스케일러빌러티방법
US6947598B2 (en) * 2001-04-20 2005-09-20 Front Porch Digital Inc. Methods and apparatus for generating, including and using information relating to archived audio/video data
US20020163964A1 (en) 2001-05-02 2002-11-07 Nichols James B. Apparatus and method for compressing video
US6909745B1 (en) * 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
KR100803115B1 (ko) 2001-06-07 2008-02-14 엘지전자 주식회사 적응 안테나 어레이가 구비된 wcdma 시스템에서의 신호 처리 방법 이를 위한 시스템
KR100393066B1 (ko) * 2001-06-11 2003-07-31 삼성전자주식회사 적응 움직임 보상형 디-인터레이싱 장치 및 그 방법
JP2002051336A (ja) 2001-06-15 2002-02-15 Sharp Corp 画像符号化装置及び画像復号装置
US7483581B2 (en) * 2001-07-02 2009-01-27 Qualcomm Incorporated Apparatus and method for encoding digital image data in a lossless manner
JP2003037844A (ja) 2001-07-23 2003-02-07 Sharp Corp 動画像符号化装置
KR100440953B1 (ko) 2001-08-18 2004-07-21 삼성전자주식회사 영상 압축 비트 스트림의 트랜스코딩 방법
US6959044B1 (en) 2001-08-21 2005-10-25 Cisco Systems Canada Co. Dynamic GOP system and method for digital video encoding
US7359466B2 (en) * 2001-08-24 2008-04-15 Lucent Technologies Inc. Signal detection by a receiver in a multiple antenna time-dispersive system
US6784942B2 (en) 2001-10-05 2004-08-31 Genesis Microchip, Inc. Motion adaptive de-interlacing method and apparatus
TW536918B (en) 2001-11-01 2003-06-11 Aiptek Int Inc Method to increase the temporal resolution of continuous image series
JP2003209837A (ja) 2001-11-09 2003-07-25 Matsushita Electric Ind Co Ltd 動画像符号化方法及び動画像符号化装置
CN1511420A (zh) * 2001-11-09 2004-07-07 松下电器产业株式会社 运动图像编码方法和装置
US6847680B2 (en) 2001-12-17 2005-01-25 Mitsubishi Electric Research Laboratories, Inc. Method for detecting talking heads in a compressed video
US20030118097A1 (en) 2001-12-21 2003-06-26 Koninklijke Philips Electronics N.V. System for realization of complexity scalability in a layered video coding framework
KR100446083B1 (ko) 2002-01-02 2004-08-30 삼성전자주식회사 움직임 추정 및 모드 결정 장치 및 방법
US20030142762A1 (en) * 2002-01-11 2003-07-31 Burke Joseph P. Wireless receiver method and apparatus using space-cover-time equalization
US7139551B2 (en) 2002-01-19 2006-11-21 Sasken Communication Technologies Ltd. System and method for automatically downloading software applications to a remote terminal
JP2003224847A (ja) 2002-01-29 2003-08-08 Sony Corp 画像符号化装置とその方法、および、画像復号化装置とその方法
US6700935B2 (en) 2002-02-08 2004-03-02 Sony Electronics, Inc. Stream based bitrate transcoder for MPEG coded video
US6996186B2 (en) * 2002-02-22 2006-02-07 International Business Machines Corporation Programmable horizontal filter with noise reduction and image scaling for video encoding system
KR100850705B1 (ko) 2002-03-09 2008-08-06 삼성전자주식회사 시공간적 복잡도를 고려한 적응적 동영상 부호화 방법 및그 장치
DE60335178D1 (de) * 2002-03-27 2011-01-13 British Telecomm Videokodierung und -übertragung
US20030185302A1 (en) 2002-04-02 2003-10-02 Abrams Thomas Algie Camera and/or camera converter
CA2380105A1 (en) 2002-04-09 2003-10-09 Nicholas Routhier Process and system for encoding and playback of stereoscopic video sequences
KR100468726B1 (ko) 2002-04-18 2005-01-29 삼성전자주식회사 실시간 가변 비트율 제어를 수행하는 부호화 장치 및 방법
US6985635B2 (en) * 2002-04-22 2006-01-10 Koninklijke Philips Electronics N.V. System and method for providing a single-layer video encoded bitstreams suitable for reduced-complexity decoding
JP4135395B2 (ja) 2002-04-26 2008-08-20 日本電気株式会社 符号化パケット伝送受信方法およびその装置ならびにプログラム
JP3926203B2 (ja) 2002-05-15 2007-06-06 シャープ株式会社 コンテンツ表示装置、コンテンツ表示プログラム、該プログラムを記録した記録媒体、およびコンテンツ表示方法
KR100850706B1 (ko) 2002-05-22 2008-08-06 삼성전자주식회사 적응적 동영상 부호화 및 복호화 방법과 그 장치
FR2840495B1 (fr) * 2002-05-29 2004-07-30 Canon Kk Procede et dispositif de selection d'une methode de transcodage parmi un ensemble de methodes de transcodage
JP2004023288A (ja) * 2002-06-13 2004-01-22 Kddi R & D Laboratories Inc 動画像符号化のための前処理方式
US7436890B2 (en) * 2002-06-05 2008-10-14 Kddi R&D Laboratories, Inc. Quantization control system for video coding
CN1231055C (zh) 2002-06-10 2005-12-07 成都威斯达芯片有限责任公司 电视中传送电影场景的数字检测装置
KR100553082B1 (ko) 2002-06-20 2006-02-15 엘지전자 주식회사 이동통신 단말기의 무선 데이터 다운로드 이어받기 장치및 방법
US7167507B2 (en) * 2002-07-01 2007-01-23 Lucent Technologies Inc. Equalizer and method for performing equalization in a wireless communications system
US7136417B2 (en) 2002-07-15 2006-11-14 Scientific-Atlanta, Inc. Chroma conversion optimization
KR20050027111A (ko) 2002-07-16 2005-03-17 톰슨 라이센싱 에스.에이. Hd-dvd를 위한 기본 및 확장 계층의 인터리빙
KR100500196B1 (ko) 2002-07-20 2005-07-12 학교법인 한국정보통신학원 멀티미디어 메타데이터의 오류 내성 부호화/복호화 장치및 방법
US7089313B2 (en) * 2002-07-25 2006-08-08 Matsushita Electric Industrial Co., Ltd. Protocol independent communication system for mobile devices
WO2004019336A1 (en) 2002-08-21 2004-03-04 Thomson Licensing S.A. Watermarking digital data at a user device
US20040045038A1 (en) * 2002-08-29 2004-03-04 Duff John F. System and method for the synchronized activation of external devices in association with video programs
US6904081B2 (en) 2002-08-30 2005-06-07 Motorola, Inc. Spread spectrum receiver apparatus and method
GB0222562D0 (en) 2002-09-28 2002-11-06 Koninkl Philips Electronics Nv Method and apparatus for encoding image and or audio data
JP4294933B2 (ja) 2002-10-16 2009-07-15 富士通株式会社 マルチメディアコンテンツ編集装置およびマルチメディアコンテンツ再生装置
CN100438609C (zh) 2002-10-22 2008-11-26 皇家飞利浦电子股份有限公司 带有降质的图像处理单元
KR100501933B1 (ko) 2002-11-21 2005-07-18 삼성전자주식회사 멀티미디어 데이터 암호화 압축방법 및 장치
WO2004049722A1 (en) 2002-11-22 2004-06-10 Koninklijke Philips Electronics N.V. Transcoder for a variable length coded data stream
EP3349461B1 (en) * 2002-11-25 2020-02-19 Godo Kaisha IP Bridge 1 Method for coding and decoding b pictures in direct mode
KR20040046320A (ko) 2002-11-27 2004-06-05 엘지전자 주식회사 동영상 부호화 방법
AU2003283723A1 (en) 2002-12-10 2004-06-30 Koninklijke Philips Electronics N.V. A unified metric for digital video processing (umdvp)
JP2006512029A (ja) 2002-12-20 2006-04-06 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ セグメントベース動き推定
US7154555B2 (en) 2003-01-10 2006-12-26 Realnetworks, Inc. Automatic deinterlacing and inverse telecine
US7039855B2 (en) * 2003-01-22 2006-05-02 Lsi Logic Corporation Decision function generator for a Viterbi decoder
US8059711B2 (en) 2003-01-28 2011-11-15 Thomson Licensing Robust mode staggercasting
JP2004248124A (ja) 2003-02-17 2004-09-02 Nippon Telegr & Teleph Corp <Ntt> 階層的画像符号化装置および階層的画像復号装置
KR20040079084A (ko) 2003-03-06 2004-09-14 삼성전자주식회사 시간적 복잡도를 고려한 적응적 동영상 부호화와 그 장치
US7062260B2 (en) * 2003-03-27 2006-06-13 Nokia Corporation Fetching application and driver for extension device from network
US7075581B1 (en) * 2003-06-03 2006-07-11 Zoran Corporation Interlaced-to-progressive scan conversion based on film source detection
KR100518580B1 (ko) 2003-06-10 2005-10-04 삼성전자주식회사 인버스 텔레시네 변환장치 및 변환방법
BRPI0411433B1 (pt) 2003-06-16 2018-10-16 Thomson Licensing método e aparelho de decodificação permitindo mudança rápida de canal de vídeo comprimido
JP2007524280A (ja) 2003-06-19 2007-08-23 トムソン ライセンシング 低複雑性空間スケーラブル復号化のための方法および装置
KR100546333B1 (ko) * 2003-06-25 2006-01-26 삼성전자주식회사 감지 증폭기 드라이버 및 이를 구비하는 반도체 장치
KR100505694B1 (ko) 2003-07-09 2005-08-02 삼성전자주식회사 직접 계산 방식에 의한 코드화 직교 주파수 분할 다중화수신기의 채널 상태 평가 장치 및 그 방법
US7406123B2 (en) 2003-07-10 2008-07-29 Mitsubishi Electric Research Laboratories, Inc. Visual complexity measure for playing videos adaptively
GB0316387D0 (en) * 2003-07-12 2003-08-13 Ncr Int Inc Software updates
TWI357728B (en) * 2003-07-14 2012-02-01 Interdigital Tech Corp High performance wireless receiver with cluster mu
US7356073B2 (en) * 2003-09-10 2008-04-08 Nokia Corporation Method and apparatus providing an advanced MIMO receiver that includes a signal-plus-residual-interference (SPRI) detector
US20050076057A1 (en) * 2003-10-03 2005-04-07 Puneet Sharma Method and system for transferring video and audio files to portable computing devices
US7840112B2 (en) 2003-10-08 2010-11-23 Intel Corporation Gradually degrading multimedia recordings
JP2005123732A (ja) * 2003-10-14 2005-05-12 Matsushita Electric Ind Co Ltd デブロックフィルタ処理装置およびデブロックフィルタ処理方法
KR20050037293A (ko) 2003-10-18 2005-04-21 삼성전자주식회사 영상신호의 아티팩트 억제장치 및 그 방법
US7780886B2 (en) * 2003-10-21 2010-08-24 Certainteed Corporation Insulation product having directional facing layer thereon and method of making the same
EP2051510B1 (en) 2003-10-30 2013-08-14 Panasonic Corporation Mobile-terminal-orientated transmission method and apparatus
US7420618B2 (en) * 2003-12-23 2008-09-02 Genesis Microchip Inc. Single chip multi-function display controller and method of use thereof
EP2485187A1 (en) * 2004-01-21 2012-08-08 Qualcomm Incorporated Application-based value billing in a wireless subscriber network
US20050168656A1 (en) * 2004-01-30 2005-08-04 Wyman Richard H. Method and system for quantized historical motion for motion detection in motion adaptive deinterlacer
EP1709745A4 (en) 2004-01-30 2012-03-14 Univ Laval MULTI-USER ADAPTIVE NETWORK RECEIVER AND CORRESPONDING METHOD
US7529426B2 (en) 2004-01-30 2009-05-05 Broadcom Corporation Correlation function for signal detection, match filters, and 3:2 pulldown detection
US7483077B2 (en) * 2004-01-30 2009-01-27 Broadcom Corporation Method and system for control of a multi-field deinterlacer including providing visually pleasing start-up and shut-down
US7557861B2 (en) 2004-01-30 2009-07-07 Broadcom Corporation Reverse pull-down video using corrective techniques
US7324583B2 (en) 2004-02-13 2008-01-29 Nokia Corporation Chip-level or symbol-level equalizer structure for multiple transmit and receiver antenna configurations
KR100596705B1 (ko) 2004-03-04 2006-07-04 삼성전자주식회사 비디오 스트리밍 서비스를 위한 비디오 코딩 방법과 비디오 인코딩 시스템, 및 비디오 디코딩 방법과 비디오 디코딩 시스템
KR100586883B1 (ko) * 2004-03-04 2006-06-08 삼성전자주식회사 비디오 스트리밍 서비스를 위한 비디오 코딩방법, 프리디코딩방법, 비디오 디코딩방법, 및 이를 위한 장치와, 이미지 필터링방법
US7339980B2 (en) * 2004-03-05 2008-03-04 Telefonaktiebolaget Lm Ericsson (Publ) Successive interference cancellation in a generalized RAKE receiver architecture
US20050201478A1 (en) * 2004-03-10 2005-09-15 Holger Claussen Modulation in a mobile telecommunications system
US20050222961A1 (en) 2004-04-05 2005-10-06 Philippe Staib System and method of facilitating contactless payment transactions across different payment systems using a common mobile device acting as a stored value device
US20050231635A1 (en) 2004-04-16 2005-10-20 Lin Ken K Automated inverse telecine process
EP1592250A1 (en) 2004-04-30 2005-11-02 Matsushita Electric Industrial Co., Ltd. Film-mode detection in video sequences
US7991053B2 (en) 2004-05-04 2011-08-02 Qualcomm Incorporated Method and apparatus to enable acquisition of media in streaming applications
US7430336B2 (en) 2004-05-06 2008-09-30 Qualcomm Incorporated Method and apparatus for image enhancement for low bit rate video compression
DE102004026433A1 (de) 2004-05-29 2005-12-22 Schott Ag Nanoglaspulver und deren Verwendung
US7536626B2 (en) * 2004-06-18 2009-05-19 Qualcomm Incorporated Power control using erasure techniques
EP1615447B1 (en) 2004-07-09 2016-03-09 STMicroelectronics Srl Method and system for delivery of coded information streams, related network and computer program product therefor
JP4145275B2 (ja) * 2004-07-27 2008-09-03 富士通株式会社 動きベクトル検出・補償装置
KR20060011281A (ko) 2004-07-30 2006-02-03 한종기 트랜스코더에 적용되는 해상도 변환장치 및 방법
JP2006074684A (ja) 2004-09-06 2006-03-16 Matsushita Electric Ind Co Ltd 画像処理方法及び装置
US7474701B2 (en) * 2004-09-23 2009-01-06 International Business Machines Corporation Single pass variable bit rate control strategy and encoder for processing a video frame of a sequence of video frames
US7528887B2 (en) * 2004-10-08 2009-05-05 Broadcom Corporation System and method for performing inverse telecine deinterlacing of video by bypassing data present in vertical blanking intervals
US7660987B2 (en) * 2004-10-29 2010-02-09 Baylis Stephen W Method of establishing a secure e-mail transmission link
KR100592882B1 (ko) * 2004-12-13 2006-06-26 한국전자통신연구원 세션 초기화 프로토콜(sip) 기능이 없는 이동 단말에인터넷 프로토콜 멀티미디어 서브시스템을 통한 세션초기화 프로토콜 기반 인스턴스 메시징 서비스 제공방법,시스템 및 이를 위한 인스턴스 메시징 프록시 서버
US20060153294A1 (en) * 2005-01-12 2006-07-13 Nokia Corporation Inter-layer coefficient coding for scalable video coding
US8780957B2 (en) * 2005-01-14 2014-07-15 Qualcomm Incorporated Optimal weights for MMSE space-time equalizer of multicode CDMA system
US20060166739A1 (en) * 2005-01-25 2006-07-27 Jeng-Tay Lin Operating method for a wireless recreation system
KR20060088461A (ko) * 2005-02-01 2006-08-04 엘지전자 주식회사 영상신호의 엔코딩/디코딩시에 영상블록을 위한 모션벡터를베이스 레이어 픽처의 모션벡터로부터 유도하는 방법 및장치
US8165167B2 (en) 2005-03-10 2012-04-24 Qualcomm Incorporated Time tracking for a communication system
AR052601A1 (es) 2005-03-10 2007-03-21 Qualcomm Inc Clasificacion de contenido para procesamiento de multimedia
ES2336824T3 (es) 2005-03-10 2010-04-16 Qualcomm Incorporated Arquitectura de decodificador para gestion de errores optimizada en flujo continuo multimedia.
US8693540B2 (en) * 2005-03-10 2014-04-08 Qualcomm Incorporated Method and apparatus of temporal error concealment for P-frame
US7995656B2 (en) 2005-03-10 2011-08-09 Qualcomm Incorporated Scalable video coding with two layer encoding and single layer decoding
US7929776B2 (en) 2005-03-10 2011-04-19 Qualcomm, Incorporated Method and apparatus for error recovery using intra-slice resynchronization points
JP2008536451A (ja) * 2005-04-14 2008-09-04 トムソン ライセンシング 空間スケーラブルビデオ符号化及び復号化向けスライス適応型動きベクトル符号化のための方法及び装置
US20060239347A1 (en) 2005-04-25 2006-10-26 Ashish Koul Method and system for scene change detection in a video encoder
US20060271990A1 (en) 2005-05-18 2006-11-30 Rodriguez Arturo A Higher picture rate HD encoding and transmission with legacy HD backward compatibility
KR100716998B1 (ko) * 2005-05-24 2007-05-10 삼성전자주식회사 블록화 현상을 감소시키기 위한 부호화 및 복호화 장치 및그 방법과, 이를 구현하기 위한 프로그램이 기록된 기록매체
US8879856B2 (en) * 2005-09-27 2014-11-04 Qualcomm Incorporated Content driven transcoder that orchestrates multimedia transcoding using content information
AT502881B1 (de) * 2005-10-05 2007-08-15 Pirker Wolfgang Ddr Zahnimplantat
US20070206117A1 (en) * 2005-10-17 2007-09-06 Qualcomm Incorporated Motion and apparatus for spatio-temporal deinterlacing aided by motion compensation for field-based video
US8948260B2 (en) 2005-10-17 2015-02-03 Qualcomm Incorporated Adaptive GOP structure in video streaming
US8654848B2 (en) * 2005-10-17 2014-02-18 Qualcomm Incorporated Method and apparatus for shot detection in video streaming
US9521584B2 (en) * 2005-10-17 2016-12-13 Qualcomm Incorporated Method and apparatus for managing data flow through a mesh network
US7916784B2 (en) 2005-10-20 2011-03-29 Broadcom Corporation Method and system for inverse telecine and field pairing
US7433982B2 (en) 2005-10-21 2008-10-07 Microsoft Corporation Transferable component that effectuates plug-and-play
US20070171280A1 (en) * 2005-10-24 2007-07-26 Qualcomm Incorporated Inverse telecine algorithm based on state machine
JP4984503B2 (ja) * 2005-11-28 2012-07-25 富士通株式会社 携帯端末装置およびソフトウェアインストール方法
US7587569B2 (en) 2005-12-19 2009-09-08 Yahoo! Inc. System and method for removing a storage server in a distributed column chunk data store
US7705913B2 (en) * 2005-12-20 2010-04-27 Lsi Corporation Unified approach to film mode detection
US7835904B2 (en) 2006-03-03 2010-11-16 Microsoft Corp. Perceptual, scalable audio compression
US9131164B2 (en) * 2006-04-04 2015-09-08 Qualcomm Incorporated Preprocessor method and apparatus
JP4929819B2 (ja) 2006-04-27 2012-05-09 富士通株式会社 映像信号の変換装置及び方法
JP5412739B2 (ja) 2008-03-26 2014-02-12 富士通株式会社 光増幅装置

Also Published As

Publication number Publication date
CN101171843B (zh) 2010-10-13
CL2006000541A1 (es) 2008-01-04
RU2007137462A (ru) 2009-04-20
RU2402885C2 (ru) 2010-10-27
JP2008533841A (ja) 2008-08-21
EP1867173A2 (en) 2007-12-19
JP2013085287A (ja) 2013-05-09
BRPI0608282A2 (pt) 2009-12-15
WO2006099082A2 (en) 2006-09-21
JP2012075136A (ja) 2012-04-12
CN101697591A (zh) 2010-04-21
CL2009000412A1 (es) 2009-06-12
NO20075130L (no) 2007-10-09
AU2006223416A1 (en) 2006-09-21
IL185828A0 (en) 2008-01-06
AR052601A1 (es) 2007-03-21
MX2007011084A (es) 2007-11-15
TW200704200A (en) 2007-01-16
KR20070117660A (ko) 2007-12-12
US20060222078A1 (en) 2006-10-05
CA2600750A1 (en) 2006-09-21
WO2006099082A3 (en) 2007-09-20
US9197912B2 (en) 2015-11-24
CN101171843A (zh) 2008-04-30

Similar Documents

Publication Publication Date Title
JP5318561B2 (ja) マルチメディア処理のためのコンテンツ分類
RU2377737C2 (ru) Способ и устройство для преобразования с повышением частоты кадров с помощью кодера (ea-fruc) для сжатия видеоизображения
US8654848B2 (en) Method and apparatus for shot detection in video streaming
WO2021244341A1 (zh) 图像编码方法及装置、电子设备及计算机可读存储介质
EP2227019B1 (en) Redundant data encoding methods and device
US9071841B2 (en) Video transcoding with dynamically modifiable spatial resolution
Zatt et al. Gop structure adaptive to the video content for efficient H. 264/AVC encoding
EP1921866A2 (en) Content classification for multimedia processing
KR100770873B1 (ko) 영상 부호화시 비트율 제어 방법 및 장치
Zhou et al. Error-resilient video coding of H. 264/AVC based on network-adaptive intra refresh and reference selection refresh
Yu et al. Half-pixel motion estimation bypass based on a linear model
JP2005217499A (ja) 画像処理装置、画像処理プログラムおよび画像処理方法
Yin et al. An efficient mode decision algorithm for real-time high-definition H. 264/AVC transcoding

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110726

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20111025

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20111101

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111104

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120221

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120518

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20120529

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121221

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20130214

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130402

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130611

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130710

R150 Certificate of patent or registration of utility model

Ref document number: 5318561

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250