JP2014514883A - 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法 - Google Patents

引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法 Download PDF

Info

Publication number
JP2014514883A
JP2014514883A JP2014509677A JP2014509677A JP2014514883A JP 2014514883 A JP2014514883 A JP 2014514883A JP 2014509677 A JP2014509677 A JP 2014509677A JP 2014509677 A JP2014509677 A JP 2014509677A JP 2014514883 A JP2014514883 A JP 2014514883A
Authority
JP
Japan
Prior art keywords
video
video stream
adaptation
parameter
application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2014509677A
Other languages
English (en)
Inventor
ドウルグ,ジエラール
ヌーリー,マルバン
Original Assignee
アルカテル−ルーセント
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by アルカテル−ルーセント filed Critical アルカテル−ルーセント
Publication of JP2014514883A publication Critical patent/JP2014514883A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0117Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving conversion of the spatial resolution of the incoming video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/23418Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234318Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by decomposing into objects, e.g. MPEG-4 objects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234345Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements the reformatting operation being performed only on part of the stream, e.g. a region of the image or a time segment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234381Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the temporal resolution, e.g. decreasing the frame rate by frame skipping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/24Monitoring of processes or resources, e.g. monitoring of server load, available bandwidth, upstream requests
    • H04N21/2402Monitoring of the downstream path of the transmission network, e.g. bandwidth available
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/414Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance
    • H04N21/41407Specialised client platforms, e.g. receiver in car or embedded in a mobile appliance embedded in a portable device, e.g. video client on a mobile phone, PDA, laptop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/845Structuring of content, e.g. decomposing content into time segments
    • H04N21/8453Structuring of content, e.g. decomposing content into time segments by locking or enabling a set of features, e.g. optional functionalities in an executable program

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Graphics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

受信器による適合されたビデオストリームの受信の際に遂行されることになる引き続くアプリケーションを容易にするために入力ビデオストリームVを適合させるための方法は、品質要件パラメータQR、帯域幅制限パラメータBW、および空間パラメータx、yから制御パラメータAVPを決定するステップと、前記制御パラメータAVPによって前記入力ビデオストリームVの時空間適合を遂行して、そのことにより、前記受信器へのプロビジョニングのための前記適合されたビデオストリームAVを生成するステップとを含む。

Description

本発明は、受信器による適合されたビデオストリームの受信の際に引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法に関する。
移動電話などの移動端末に関しては、リアルタイムでのビデオ送信の品質は、ネットワークの利用可能な帯域幅により制限される。例えば専門家からの緊急の診断が要求される一方で、単純な移動電話のみが事故の場所でビデオを作製するために利用可能である場合の、例えば物体認識または遠隔医療のアプリケーションなどの、リアルタイムでのビデオフレームの分析に依拠するアプリケーションに関しては、移動電話により送信および/または受信されるビデオフレームが、これらのビデオ画像の固有の低品質のために低質の認識結果を招くことになる。顔認識アプリケーションでは実際に、十分な分解能を伴う顔領域の非常に鮮明な画像を必要とする。同様に専門医は、緊急の治療のために自分の所見および対応する診断を形成するために、例えば創傷の鮮明な画像を必要とする場合がある。
自動化された画像認識アプリケーションの場合、そのようなアプリケーションは、受信端での移動電話では常に利用可能であるとは限らない多くの処理能力もまたさらに必要とする。さらに莫大なデータベースメモリが、例えば前もって認識された物体の特徴部を記憶するために必要とされる場合がある。この量のメモリもまた、通常の移動電話では利用可能でない。
すべてのこれらの難点の結果として現在では、移動電話端末により受信または生成されるビデオ画像に関して、自動的に、または人間によってのいずれでも、リアルタイムの物体認識/判断などのアプリケーションを遂行することは可能でない。
したがって上述の問題に対する解決策を提供することが、本発明の実施形態の目的である。
本発明の実施形態によればこの目的は、受信器による適合されたビデオストリームの受信の際に遂行されることになる引き続くアプリケーションを容易にするために入力ビデオストリームを適合させるための方法であって、品質要件パラメータ、帯域幅制限パラメータ、および空間パラメータから制御パラメータを決定するステップと、前記制御パラメータによって前記入力ビデオストリームの時空間適合を遂行して、そのことにより、前記受信器へのプロビジョニングのための前記適合されたビデオストリームを生成するステップとを含む方法のプロビジョニングにより実現される。
通信ネットワークを介した送信後に、修正または適合されたビデオに関する物体認識などのある種のアプリケーションを実行するために必要とされる最低限のレベルを決定するパラメータである品質要件パラメータ、通信ネットワークを介した送信の間の修正されたビデオの固有の送信制限を表す帯域幅制限パラメータの、認識のこの特定のアプリケーションを受ける必要があるビデオシーケンスのピクチャ内の関心領域を指示する空間パラメータとの組み合わせが、入力ビデオストリームを適合させるために使用されることになる1組の最適化された制御パラメータをもたらすことになる。この適合は、異なる複数の画像のいくつかの領域が適合されることになる一方で他のものは適合されないことになることを意味する空間適合、または、いくつかのフレームもしくはそれらの一部分が例えばビデオから除外され得る一方で他のものは除外され得ないことを意味する時間適合、または、両方の組み合わせである場合がある。
第1の実施形態では前記時空間適合は、前記アプリケーションに関して関連性のない複数の画像の区域の分解能を、前記アプリケーションに関連性のある画像のこれらの区域に対して減少することにより遂行される。
このことは、例えば医者が、移動ネットワークを介して送信されるビデオから患者の外傷を分析しなければならない場合に役立つ場合がある。高品質ビデオが生成され、そのビデオが引き続いて、例えば、この遠距離の専門家の受信器に帯域幅が制限されたネットワークを介して送信されるために、例えば患者の外傷に関係付けられる区域内で高分解能を維持するだけであり、画像の他の部分は適合の処理の間にぼかされた状態となり、そのことにより、この帯域幅が低減されたネットワークを介した適合されたビデオによる送信を可能にするなどのように構成される場合、受信されるビデオ画像は、この適合されたビデオに関する物体認識および/または物体判断などのこの遠距離のサービスを可能にするのにそれでも十分となる。
別の実施形態では前記時空間適合は、前記アプリケーションに関して関連性のない画像の部分のフレームレートを、前記アプリケーションに関して関連性のある画像のこれらの部分に対して減少することにより遂行される。
このことは、例えば動いている物体がビデオストリームから認識されることになる場合に関心を引き起こし得るものである。単に、動いている物体が位置するこれらのフレームを重点的に取り扱い、したがってこれらのフレームを保留し、一方で他のフレームのいくつかまたは一部分を外し、そのことにより、これらの一部分でのフレームレートを減少することにより、ビデオは、認識されることになる物体に関連性のある領域内の高品質を保つように構成され得る。同時に関心領域ではないこれらの領域に対する品質は、適合されたビデオを移送する必要がある通信ネットワークの帯域幅の制約に準拠しながら低下されることになる。
本発明は、入力ビデオストリームを適合させるためのビデオ適合デバイスであって、前記入力ビデオストリームの時空間適合を遂行するときに使用されて、そのことにより、適合されたビデオストリームを生成するための制御パラメータを決定するように構成され、前記ビデオ適合デバイスに提供される品質要件パラメータ、帯域幅制限パラメータ、および空間パラメータから前記制御パラメータを計算するようにさらに構成されるビデオ適合デバイスの実施形態にさらに関する。
第1の実施形態ではこのビデオ適合デバイスは、前記空間パラメータにより規定される領域の外側の前記ビデオストリームの複数の画像の区域の分解能を減少することにより、前記時空間適合を遂行するようにさらに構成される。
別の実施形態ではビデオ適合デバイスは、前記空間パラメータにより規定される領域の外側の前記ビデオストリームの画像の部分のフレームレートを減少することにより、前記時空間適合を遂行するようにさらに構成される。
別の実施形態ではビデオ適合デバイスは、前記入力ビデオストリームに関して物体検出演算を遂行して、そのことにより、検出された物体特徴部を生成するようにさらに構成される。
現実の物体認識と比較されるとはるかに少ない資源を必要とするそのような粗い物体検出は、例えば、さらに認識されることになる物体に関係付けられる空間パラメータを識別するために役立つ場合がある。この物体検出は、将来の物体認識を容易にするために、または、識別される物体に関するいくつかの情報を受信器に前もって提供するためになどで、適合されたビデオストリームとともにさらに送信され得るさらなるメタデータを決定するときにもまた使用され得る。
本発明は、そのようなビデオ適合デバイスと、適合されたビデオストリームを符号化し、そのことにより、符号化され適合されたビデオストリームを提供するための符号化器と、通信ネットワークを経由して受信器デバイスに向けて前記符号化され適合されたビデオストリームをさらに送信するための手段とを備える端末の実施形態にさらに関する。
そのような端末は、移動端末または固定端末であり得る。GSM(登録商標)ネットワークなどの従来の移動通信ネットワークの帯域幅における現在の制約に関して、移動端末は、そのようなビデオ適合デバイスの存在から多くの利益を得ることが可能である。これに対して多くのユーザにより共有されるローカルネットワークなどの低減された帯域幅を伴う固定ネットワークでも、固定端末内のそのようなビデオ適合デバイスの存在によって、以前はこれらの環境のもとでは可能でなかった物体認識などのアプリケーションが可能になり得る。
別の実施形態では端末は、前記ビデオ適合デバイスに結合され、前記端末のカプセル化デバイスへのプロビジョニングのために前記検出された物体特徴部からメタデータを生成するように構成されるビデオ記述器手段をさらに備え、前記カプセル化デバイスは、前記受信器デバイスへのプロビジョニングのために、前記符号化され適合されたビデオストリームおよび前記メタデータから、拡張され符号化され適合されたビデオパケットを生成するように構成される。
本発明は、前の請求項のいずれかに記載の端末に通信可能に結合される受信器デバイスであって、前記符号化され適合されたビデオストリームを復号化して、そのことにより、前記適合されたビデオストリームを提供するための復号器を備える受信器デバイスの実施形態にさらに関する。
ある実施形態では受信器デバイスは、前記適合されたビデオストリームに関して物体認識を遂行するように構成されるビデオ物体認識モジュールをさらに備え得る。
さらに別の実施形態では受信器デバイスは、通信ネットワークのアプリケーションサーバの一部分であり、そのアプリケーションサーバ自体は、前記ビデオ物体認識モジュールに対する要件パラメータを記憶するための、および、前記品質要件パラメータとして前記要件パラメータを前記端末の前記ビデオ適合デバイスに提供するための手段を備え得る。
本発明は、上記で説明されたような端末に通信可能に結合される、通信ネットワークのアプリケーションサーバであって、前記アプリケーションサーバのアプリケーションサービスモジュールへのプロビジョニングのために前記符号化され適合されたビデオストリームを復号化するための復号器であり、前記アプリケーションサービスモジュールが前記適合されたビデオストリームに関してアプリケーションを遂行するように構成される復号器と、前記アプリケーションサービスモジュールに対する要件パラメータを記憶するための、および、前記品質要件パラメータとして前記要件パラメータを前記端末の前記ビデオ適合デバイスに提供するための手段とを備えるアプリケーションサーバの実施形態にさらに関する。
ある実施形態ではアプリケーションサービスモジュールは、前記適合されたビデオストリームに関して物体認識を遂行するように構成されるビデオ物体認識モジュールを備える。
特許請求の範囲において使用される用語「結合される」は、直接接続のみに限定的であると解釈されるべきではないことが注目されるべきである。したがって語句「デバイスBに結合されるデバイスA」の範囲は、デバイスAの出力がデバイスBの入力に直接接続されるデバイスまたはシステムに限定されるべきではない。その語句は、他のデバイスまたは手段を含む経路であり得る、Aの出力とBの入力との間の経路が存在することを意味する。
特許請求の範囲において使用される用語「備える」は、その後にリストアップされる手段に限定的であると解釈されるべきではないことが注目されるべきである。したがって語句「手段AおよびBを備えるデバイス」の範囲は、構成要素AおよびBのみからなるデバイスに限定されるべきではない。その語句は、本発明に関しては、デバイスの他にはない関連性のある構成要素がAおよびBであることを意味する。
付随する図面に関連して行われる実施形態の以下の説明を参照することにより、本発明の上記および他の目的および特徴がより明らかとなり、本発明自体が最良に理解されることになる。
方法の異なる複数の実施形態のステップを遂行するように構成されるアプリケーションサーバの実施形態に協働的に結合される第1の端末MT1/MT1’の高レベルの実施形態を概略的に示す図である。 方法の異なる複数の実施形態のステップを遂行するように構成されるアプリケーションサーバの実施形態に協働的に結合される第1の端末MT1/MT1’の高レベルの実施形態を概略的に示す図である。 方法の異なる複数の実施形態のステップを遂行するように構成されるアプリケーションサーバの実施形態に協働的に結合される第1の端末MT1/MT1’の高レベルの実施形態を概略的に示す図である。 方法の異なる複数の実施形態のステップを遂行するように構成されるアプリケーションサーバの実施形態に協働的に結合される第1の端末MT1/MT1’の高レベルの実施形態を概略的に示す図である。 方法の高レベルの実施形態を示す図である。 方法の高レベルの実施形態を示す図である。 方法の高レベルの実施形態を示す図である。 適合されたビデオパラメータを計算するための図2a−cのステップ500のより詳述された実装形態を示す図である。 ビデオの時空間適合および符号化を遂行するための図2a−cの組み合わされたステップ600および700のより詳述された実装形態を示す図である。 方法の他の実施形態を遂行するための第1の端末MT1の他の高レベルの実施形態を概略的に示す図である。 方法の他の実施形態を遂行するための第1の端末MT1の他の高レベルの実施形態を概略的に示す図である。
説明および図面は、本発明の原理を単に例示するものである。したがって、たとえ本明細書で明示的に説明されなくとも、または示されなくとも、本発明の原理を実施し、本発明の趣旨および範囲の範囲内に含まれる様々な配置構成を当業者が考案可能になることが十分認識されよう。さらに、本明細書に列挙されるすべての例は、(1人または複数の)発明者により当技術分野の振興のために与えられる本発明の原理および概念を理解する際に読者の一助となるように、単に教育的な目的のものであることが明確に主として意図されるものであり、そのような具体的に列挙される実施例および条件への限定を伴わないと解釈されるべきである。さらに本発明の原理、態様、および実施形態、ならびにそれらの具体例を列挙する本明細書でのすべての記載は、それらの均等物を包含することが意図される。
本明細書での任意のブロック図が、本発明の原理を実施する例示の回路網の概念図を表すことは、当業者により十分認識されるはずである。同様に、コンピュータ可読媒体の形で実質的に表され得るものであり、その結果コンピュータまたはプロセッサにより、そのようなコンピュータまたはプロセッサが明示的に示されようとそうでなかろうと実行され得る様々な処理を、任意のフローチャート、フロー図、状態遷移図、擬似コード等々が表すことが十分認識されよう。
図1aは、好ましくは、正しそうであるとは限らないが、移動電話、ラップトップ、PDA、ゲーミングデバイス、タブレットPC等のような移動端末であり得る第1の端末MT1の第1の実施形態の概略図を示す。図1aに図示される実施形態ではこの第1の端末は、例えばこの移動端末により生成または受信されるビデオ画像に関する自動物体認識などのサービスまたはアプリケーションを可能にする目的で、ネットワーク内のアプリケーションサーバASと協働的に動作するように構成される。これに対して図5a−bに図示される実施形態では第1の端末MT1は、ネットワーク内のアプリケーションサーバと協働的に動作せず、方法の他の実施形態を遂行するためのスタンドアローンデバイスとして使用され得る。このことは例えば、ビデオが第1の端末で記録され、そのビデオが引き続いて適合され、符号化され、例えば医師の別の端末に向けて送信され、その人が、受信および復号化された適合されたビデオに関して自分自身で物体認識を行うことが可能である遠隔医療アプリケーションのために使用され得る。
すべての実施形態では端末MT1は、入力ビデオストリームのビデオ画像パラメータを適合させるための、および、これらのパラメータによって入力ビデオビットストリームV自体の適合を遂行するためのビデオ適合デバイスVADを備える。図1a−dでは破線により表示されるVADは、例えば移動端末MT1のカメラCAMにより生成される符号化されていない入力ビデオビットストリームVを受信するように、および、次の段落でさらに解説されるように、適合されたビデオビットストリームAVを提供するように構成される。
物体認識のアプリケーションを可能にするための以下の実施形態が説明されることになる。これに対して、他の実施形態が他のアプリケーションを遂行するために想像され得ることは明らかである。当業者は、そのような他のアプリケーションに対する本文献で提示される教示に基づいて、そのような他のアプリケーションに対する実施形態を想像するようになされる。
大部分の実施形態ではVADは、例えばソフトまたはハードのユーザ入力によってユーザにより生成される場合があり、そうでなければ、例えば物体認識または遠隔医療のサービスにユーザが申し込む場合にアプリケーションにより生成される場合もある、トリガ信号UTによってユーザにより活動化され得る。図1aの実施形態ではVADは、入来するビデオフレーム内の特定の物体または事象を前もって検出するように構成されるビデオ物体検出器VODモジュールをさらに備える。したがってVODは、太い白色の矢印により図示されるこのビデオ入力ビットストリームVを受信するように構成される。本文献において前に述べられたようにこの入力ビデオストリーム自体は、端末自体のカメラCAMにより生成され得るが、これに対して他の実施形態ではこのビデオ入力ビットストリームは、例えばMMSまたは他の送信による別のユーザから受信される復号化されたビットストリームであり得る。VODは、所望される物体または事象を検出するために、この入力ビデオビットストリームの1つまたは複数のフレームを分析するようにさらに構成される。物体検出演算は、物体認識と比較されるとより少ない処理資源を必要とするので、そのようなVODモジュールは、例えば中央プロセッサの一部分として移動電話の内部に容易に組み込まれることが可能である。VODは例えば、連続的なフレームでの場面の変更を分析すること等により、顔、建物、物体、…、あるいは事象を検出することが可能である。
ビデオ物体検出器VODの出力は、例えば「顔」、「車」、「フットボールの試合」などの一連の大まかに認識された物体または事象である。この出力は、「DO」として図1に図示されている。この出力データDOは、物体および/またはフレーム内のその位置を記述するメタデータを一般的に含む。
そのようなビデオ物体検出モジュールを備えない、ビデオ適合デバイスの他の実施形態が存在するということは一言されるべきである。このことは、例えば図5bを説明するときに示されることになる。
情報DOは、動的ビデオコントローラDVCと表示される、ビデオ適合デバイスの別のモジュールに提供される。図1a−dに図示される実施形態ではこの動的ビデオコントローラは、この場合では物体認識である要求されるサービスに関する情報を索出するように構成される。この目的で動的ビデオコントローラは、図1a−dの例ではアプリケーションサーバAS上にある物体認識モジュールVORであるアプリケーションにより必要とされるような、ビデオ品質の最低限のレベルを反映するパラメータを索出するように構成される。この索出は、信号「品質要求」により図1aに示されるように、DVCからアプリケーションサーバASへの要求により行われ得る。図1aではこの信号は、動的ビデオコントローラDVCの内部の品質マネージャモジュールQMにより生成および送信されるが、そのような特定の範囲設定は、他の実装形態では必要とされない場合がある。この要求はその後、アプリケーションサーバASから戻るメッセージにより応答されることになり、そのメッセージは、この個別のアプリケーションを実行するためにサーバASの内部のアプリケーションモジュールVORにより必要とされる品質要件に関する情報を含むことになる。図1aでは要求が、アプリケーションサーバAS内のアプリケーションモジュールVORの内部のリポジトリモジュールRに送出され、そのリポジトリモジュールにより返答されるが、そのような専用のリポジトリモジュールを用いない他の実施形態が存在する。
品質要件パラメータは、QRと表示され、物体認識アプリケーションに対しては、一般には最低限の画素密度に対応する最低限の分解能、動いている物体の場合での必要とされるフレームの数、2次元での画素の数で表現される認識されることになる物体の最低限の必要とされるサイズ、与えられた窓での輝度の微分の大きさとして表現される鮮明度、最低限の数の色レベルとして表現される色スケール、画像内のテクスチャを特徴付けるために使用されるランダム性の統計的尺度として規定されるエントロピー等に対する値を含み得る。
これらの品質要件パラメータQRは、いくつかの実施形態では、アプリケーションサーバからのメッセージからQMにより抽出され、これらのパラメータを受信するための空間区域範囲設定モジュールSADに転送される。後者のモジュールは、アプリケーションサーバに向けての、および/または、例えば図5a−bの実施形態を説明するときに示されることになるような遠隔医療のようなアプリケーションのための別の移動端末に向けてのビデオの送信のために、これらの品質要件パラメータQRがネットワークでの利用可能な帯域幅に準拠するかどうかをチェックするようにさらに構成される。
図5a−bに図示されるような実施形態に関しては、QRパラメータは、あらかじめ設定され、QMモジュール自体の内部に記憶され得るということは一言されるべきである。その場合QRパラメータは、もはやアプリケーションサーバに要求される必要はなく、QMはメモリの機能性を有する。
したがってSADモジュールは、QMから品質パラメータQRを受信し、第1の端末MT1の内部の帯域幅マネージャBWMから帯域幅情報BWをさらに受信する。そのような帯域幅マネージャは、本発明に関連性のない第1の端末内の他の機能ブロックにより共有され得る別個のモジュールであり得る。このことは例えば、通信チャネルでの利用可能な帯域幅の最新のステータスを受信するためにMT1と基地局との間で頻繁に通信がある移動ネットワークでの事例であり得る。あるいはそのような帯域幅マネージャBWMは、動的ビデオコントローラの内部に、またはVAD自体の中に組み込まれる場合もある。
図1aの実施形態では帯域幅マネージャBWMは、例えばアプリケーションサーバに配備されるプローブトラフィック受信器Pと通信可能である別個のモジュールとして図示されている。この通信は、リアルタイムで利用可能な帯域幅の略語であるBARTなどのアクティブ測定を含み得る。
図5a−bの実施形態では移動端末は、適合されたビデオをアプリケーションサーバにではなく、代わりに、通信ネットワークの別の、場合によってはあらかじめ決定された移動端末または他の端末に送信することになる。この場合には帯域幅マネージャBWMは、MT1と他の端末との間の帯域幅を測定するように構成される。図1aの実施形態に関してと同様の技法が、例えば両方の端末間の基地局または他のネットワーク要素内のプローブトラフィック受信器Pによって使用される場合がある。
帯域幅要件BWが、高品質ビデオがアプリケーションサーバに向けて、または別の移動端末に向けてネットワークを介して送信されることが可能であるというようなものである場合、動的ビデオコントローラDVCは、VADの別のモジュールSTAに制御信号を提供することになる。STAは時空間ビデオ品質適合器であり、DVCはこの場合にSTAに、入力ビデオビットストリームVは、さらに修正される必要はなく、MT1のビデオ符号化器Eにただ転送されるだけでよいということを通知することになる。図面に描き過ぎないように、この制御信号は図1a−dおよび図5a−bには示されない。
他方でネットワークの帯域幅要件BWが、高品質ビデオの、そのビデオに関する物体認識を可能にするための送信が、手動または自動のいずれでも可能ではないというようなものであるならば、動的ビデオコントローラDVCは、ビデオビットストリームを適合させるように時空間ビデオ品質適合器STAに命令しなければならない。この適合は、帯域幅要件に準拠する一方で、検出される物体に関して、またはVODが存在しない場合では、画像自体の上で手動で指示される物体に関して遂行されることになる、自動または手動の物体認識サービスなどのサービスをそれでも可能にするようなものでなければならない。そのような適合を可能にするためにDVCは、認識されることになる個別の物体が位置するビデオビットストリームのフレーム内の区域に関するさらなる情報を受信する。その上この情報は、図1aの実施形態で図示されるように、グラフィカルユーザインターフェースGUIを介してユーザ自身により提供される場合がある。その場合ユーザは、例えば、さらに認識される必要がある物体の周囲の、ビデオビットストリームのフレーム上の指示される矩形すなわち区域の形式にしたがってユーザ情報UIを提供する。グラフィカルユーザインターフェースGUIは、この情報を、動的ビデオコントローラにより理解可能な適切なフォーマットに変換することになる。この情報は、図1aおよび図5a−bにx、yと表示される。
あるいは完全に自動化された実装形態は、図1bに図示される実施形態に示されるように、ビデオ物体検出器に結合されるビデオ物体追跡モジュールVOTに依拠する場合もある。そのようなビデオ物体追跡モジュールVOTは、追跡されることになる物体に関するDO情報をVODから受信し、その情報から、連続的なフレームで詳細にさらに認識される必要があるこの物体を識別および追跡することが可能である。したがってビデオ入力ビットストリームVは、VOTにさらに提供されなければならない。図1bでは、VODが次のフレームをVOTにさらに提供する実施形態が示されているが、他の実施形態ではビデオ入力ビットストリームは、カメラまたはビデオ入力デバイス自体からVOTに直接提供される場合もある。すべてのこれらの実施形態では、ビデオの引き続く画像において認識されることになる物体の場所に関する、x、yと表示される空間情報がDVCに提供される。大部分の実施形態ではこの空間情報はSADに提供され、SADは、その空間情報から、帯域幅制限BWおよび品質要件QRから、すべてのこれらの要件に準拠するようにビデオのフレームをどのように適合させるかを時空間ビデオ品質適合器に命令するためのパラメータを計算するように構成される。STAによるこの適合は、認識されることになる物体に関係付けられないフレームのすべての区域において、認識されることになる物体が位置するフレームのこれらの領域内で高品質画像部分を維持するだけであるように、分解能および色レベルを低減することを含み得る。
物体が動いているか否かに応じて、さらに時間分解能が低減される場合があり、このことは例えば、認識されることになる物体を包含しないフレームのために、送信されることになる1秒あたりのフレームがより少なくなることにつながる。これらの制御パラメータは、図1a−dおよび図5a−bにVAPと表示される。
図3は、これらのAVPパラメータがどのように計算され得るかの可能な実装形態を示す。この実施形態では入力として、帯域幅BW、高分解能区域のサイズx、y、および、この実施形態では正しい認識を可能にするために必要とされる最低限のフレームサイズである1つのQRパラメータを使用する。入力ビデオVからさらに、1秒あたりのフレームの初期数が計算される。次いで、帯域幅制限および最低限の必要とされるフレームサイズを考慮に入れて、1秒あたりのフレームの初期数に基づく大域的な適合されたビデオのフレームレートの推定値である、AVPパラメータに対する第1の値が計算される。物体認識を可能にするための高分解能を維持する必要がある区域のサイズx、yに基づいて、および、適合されたビデオの大域的なフレームレートのこの第1の推定値に基づいて、高品質区域のフレームレートがさらに計算される。この計算は、低品質区域に対する利用可能なフレームレートを決定するために使用される。この低分解能のフレームレートが、低分解能の区域に対する最低限のフレームレートを規定するしきい値1より依然として高い場合、このことは、AVPパラメータに対する初期の推定された値が正しく、したがってこれらのAVPパラメータが、HQにより略される高品質の区域に対するフレームレート、LQにより略される低品質の区域に対するフレームレート、および、これらの区域に対する色空間の初期値の形式にしたがって出力されることになるということを意味する。これらの初期値は、入力ビデオ自体の元の値である場合があり、または他の実施形態では何らかの最低限のデフォルト値である場合がある。
このより低い分解能の区域に対する利用可能な帯域幅が、第1のしきい値により指示されるような利用可能である帯域幅より低い場合、高分解能区域に対するフレームレートは適合されなければならず、あるいは、低品質区域に対する色空間が適合される場合がある。図3では、両方の選択肢が並列に置かれている。次に高品質区域に対する計算されたフレームレートが低すぎて、しきい値2より低い場合、および、低品質区域の色空間が同様に低すぎる場合、高品質区域の色空間が適合される。その後すべての適合された値が、大域的な適合されたフレームレート、ならびに高品質および低品質の部分のフレームレートの計算のための次の反復のステップにおいて再び使用されることになり、ついには低品質部分に対する決定されたフレームレートが受け入れ可能なものになる。この段階で、このように提供されるパラメータがAVPとして出力される。
これが単にAVPパラメータの計算に関する例示的な実施形態であったということ、および多くの他の可能性が存在するということは当業者には明白である。いくつかの実施形態ではさらに、高分解能区域に対する適合された値が、QR要件および利用可能な帯域幅等を考慮して計算されることになる。
サーバ側の画像処理アルゴリズムにより要求されるビデオ品質情報および空間区域範囲設定に基づいて、動的ビデオコントローラDVCは、異なる複数の領域、色空間符号化、部分画像分解能等に対するフレームレートに対して適合された値をこのように算出することが可能である。これらの適合されたビデオパラメータは、AVPと表示され、動的ビデオコントローラDVCにより時空間ビデオ品質適合器STAに提供される。
この時空間ビデオ品質適合器STAは、動的ビデオコントローラによりリアルタイムで提供されるこれらの指定された決定されたパラメータを入力として入手し、それに応じて入力ビデオビットストリームを適合させる。
ビデオV自体の適合は、適合されることになる異なる複数の区域を識別するマスクを各々のフレームに関して算出することにより遂行され得るものであり、したがってこれらの区域は、場合によってはxおよびyの初期値により指示されたようなものとは異なり、品質が低下させられ得る区域は、品質がその元の値を維持することが可能である区域とは別個に適合される。その後両方の部分は、新しいフレームの統合または構築のいずれかを行うために使用される。このことは、高品質区域が低品質区域と比較されるとより高いフレームレートを有する場合の事例である。この適合されたビデオは、AVと表示され、次に、適合されたビデオ入力ビットストリームを圧縮およびカプセル化する符号化器、例えば従来のH.264MPEG符号化器に提供される。符号化器の出力は、図1aでEAVと表示される符号化され適合されたビデオである。
代替実施形態では符号化およびビデオ適合は、図4に示されるような統合されたステップで行われ得る。この実施形態では、STAおよび符号化器ENCの動作は単一のデバイスに統合される。この統合された実装形態は、得られたAVPパラメータを入力として使用しており、符号化器マネージャは、低品質区域適合器/符号化器に、AVPLQと表示される低品質区域に対するAVPパラメータを発送し、一方でAVPHQと表示される高品質区域に対するAVPパラメータが、高品質区域適合器/符号化器に発送される。
適合ステップの間、ビデオ記述器VDと表示される追加的なモジュールが、符号化されたビデオの対応するメタデータをさらに生成し得る。これらのメタデータは、各々のフレームの開始バイト、フレームの長さ、高品質を伴う部分画像の局在場所などの情報を含む。VDモジュールは、各々のフレーム内の検出される物体の位置を全体的に記述するDOメタデータを受信する。MDメタデータは、この情報を、分解能、色の数等のような符号化パラメータによってさらに完全なものにする。このことは、物体認識アルゴリズムのいくつかは色に基づくので、引き続く物体認識手順の間に役立つ場合がある。加えて、物体認識を遂行すべきフレームの内部の実際の領域がどれであるかを物体認識モジュールに指示することがさらに役立つ場合がある。これらの実際の座標は、DOメタデータに存在するような、より早期に決定された粗い指示とは異なる場合がある。そのような追加的なVDモジュールは、図1c−dの実施形態に示されている。
図1c−dでMDと表示されるこれらのメタデータが生成される場合、それらは、図1c−dのENCと表示される追加的なカプセル化ステップの間に、符号化され適合されたビデオに付加され得る。そのようなビデオカプセル化器は、符号化され適合されたビデオビットストリームおよびメタデータビットストリームをコンテナに入れ、図1c−dに示されるようにアプリケーションサーバASにデータを送出する。
このアプリケーションサーバは、EAVまたはEEAVを復号化するための復号器DEC、および、復号化された適合されたビデオストリームAVの特定の一部分に関して複雑な物体または事象を認識することを担当するビデオ物体認識器VORなどのアプリケーションモジュールを備える受信器デバイスRDを備え得る。
立ち上げ時にそのようなビデオ物体認識器VORは、その能力を説明し、物体または事象を認識可能であるために必要なその画像品質要件をリポジトリRに登録することが可能である。これらのパラメータは例えば、物体の最低限のサイズ、物体と画像のへりとの間の最低限の距離、色彩要件、露出の特性、鮮明度等を指定する。
メタデータが最終的なカプセル化ステップの間に付加された、符号化され適合されたビデオファイルEEAVの受信の際に、VORは、メタデータにより指定されるようなフレームのこれらの一部分に認識処理を制約するように、メタデータMDを前もって使用することが可能である。あるいはビデオ物体認識器は、メタデータが、符号化され適合されたビデオストリームEAVにおいて提供されなかった場合、検出処理自体を含む認識全体を遂行する可能性がある。したがって図1a−bに示されるようなこの解決策は、実施形態が図1c−dに示される、前に説明された解決策ほど最適ではないことになる。
認識処理の間、サブフレームから抽出される特徴部は、物体を識別するためにデータベースのデータと比較され得る。物体が認識されるならば、物体記述が生成され、本文献で説明されない異なる他のアプリケーションにより使用され得る。この記述は、適合されたビデオビットストリームにさらに付加され得るものであり、そのビットストリームは、再度符号化され、別の端末MTRに関する別のユーザに転送され得る。このように修正され符号化されたビデオビットストリームは、図1a−bではEAVMと、および図1c−dではEEAVMと表示される。
図5a−bは、受信器デバイスがアプリケーションサーバの一部分ではなく、別の端末MT2の一部分である、または別の端末MT2からなる方法の実施形態を示す。さらにこれらの実施形態では受信器デバイスMT2は、受信され符号化され適合されたビデオストリームEAVまたは受信され符号化され拡張され適合されたビデオストリーム(図5a−bには示されない)を復号化するための復号器DECを備える。遠隔医療アプリケーションの例に関しては、復号化されたビデオがディスプレイに送出され、そのディスプレイ上で医師または専門家が、適合されたビデオを確認し、自分自身で判断を行うことが可能である。移動端末であり得る、むしろ必然的に移動端末でなければならないこの第2の端末MT2が自動物体検出モジュールを備える場合、やはりこのモジュールは、図1a−dに関してアプリケーションサーバで行われたのと同様の形で自動物体検出を遂行することが可能である。
図2a−bは、図1a−dでの実施形態で遂行される異なる複数のステップを含む方法の実施形態を説明し、一方で図2cは、図5a−bの実施形態に対する事例であるような、後での人による判断のためにビデオが適合されるだけである場合でのステップを説明する。ステップ1000は、ステップ200および650および750と同様に随意である。
すべてのこれらの実施形態に対して、円滑な動作、ビデオ物体検出器、動的ビデオコントローラ、および時空間ビデオ品質適合器の間の良好な同期が必要とされることは明白である。当業者はこれを得るための技法に関して知識があり、図面に描き過ぎないように、そのような同期を実現するための制御モジュールは図面には示されない。
第1の移動端末からアプリケーションサーバへの、および別の移動端末への符号化され適合されたビデオビットストリームの送信のために使用されるネットワークが、任意のタイプの電気通信ネットワークまたはデータネットワークであり得ることもまた明らかである。そのようなネットワークまたはネットワークの一部分は、任意の1つまたは複数の異なる、有線/RFケーブル、RFワイヤレスなどの送信媒体、および/または、SONET、DOCSIS、IEEE規格802.3、802.11、802.15、802.16、ATM、X.25、フレームリレー、3GPP、3GPP2、WAP、SIP、UDP、RTP、H.323、LTE等のような通信プロトコルもしくはネットワーキングプロトコルを利用することが可能である。
本発明の原理が特定の装置に関して上記で説明されたが、この説明は、実施例にすぎず、添付される特許請求の範囲で定義されるような本発明の範囲に関する限定としてではなく行われることが明確に理解されるべきである。

Claims (12)

  1. 受信器による適合されたビデオストリームの受信の際に遂行されることになる引き続くアプリケーションを容易にするために入力ビデオストリーム(V)を適合させるための方法であって、品質要件パラメータ(QR)、帯域幅制限パラメータ(BW)、および空間パラメータ(x、y)から制御パラメータ(AVP)を決定するステップと、前記制御パラメータ(AVP)によって前記入力ビデオストリーム(V)の時空間適合を遂行して、そのことにより、前記受信器へのプロビジョニングのための前記適合されたビデオストリーム(AV)を生成するステップとを含む、方法。
  2. 前記時空間適合が、前記アプリケーションに関して関連性のない前記入力ビデオストリームの複数の画像の区域の分解能を、前記アプリケーションに関連性のある前記入力ビデオストリームの前記画像のこれらの区域に対して減少することにより遂行される、請求項1に記載の方法。
  3. 前記時空間適合が、前記アプリケーションに関して関連性のない前記入力ビデオストリームの画像の部分のフレームレートを、前記アプリケーションに関して関連性のある前記入力ビデオストリームの画像のこれらの部分に対して減少することにより遂行される、請求項1または2に記載の方法。
  4. 前記アプリケーションが物体認識のステップを含む、請求項1から3のいずれか一項に記載の方法。
  5. 入力ビデオストリーム(V)を適合させるためのビデオ適合デバイス(VAD)であって、前記入力ビデオストリーム(V)の時空間適合を遂行するときに使用されて、そのことにより、適合されたビデオストリーム(AV)を生成するための制御パラメータ(AVP)を決定するように構成され、前記ビデオ適合デバイス(VAD)に提供される品質要件パラメータ(QR)、帯域幅制限パラメータ(BW)、および空間パラメータ(x、y)から前記制御パラメータ(AVP)を計算するようにさらに構成される、ビデオ適合デバイス(VAD)。
  6. 前記空間パラメータ(x、y)により規定される領域の外側の前記入力ビデオストリームの複数の画像の区域の分解能を減少することにより、前記時空間適合を遂行するようにさらに構成される、請求項5に記載のビデオ適合デバイス(VAD)。
  7. 前記空間パラメータにより規定される領域の外側の前記入力ビデオストリームの画像の部分のフレームレートを減少することにより、前記時空間適合を遂行するようにさらに構成される、請求項5または6に記載のビデオ適合デバイス(VAD)。
  8. 前記入力ビデオストリームに関して物体検出演算を遂行して、そのことにより、検出された物体特徴部(DO)を生成するようにさらに構成される、請求項5から7のいずれか一項に記載のビデオ適合デバイス(VAD)。
  9. 請求項5から8のいずれかに記載のビデオ適合デバイス(VAD)と、適合されたビデオストリーム(AV)を符号化し、そのことにより、符号化され適合されたビデオストリーム(EAV)を提供するための符号化器(E)と、通信ネットワークを経由して受信器デバイス(AS;MT2)に向けて前記符号化され適合されたビデオストリーム(EAV)をさらに送信するための手段とを備える、端末(MT1;MT1’)。
  10. 前記ビデオ適合デバイス(VAD)に結合され、前記端末(MT1)のカプセル化デバイス(END)へのプロビジョニングのために前記検出された物体特徴部(DO)からメタデータ(MD)を生成するように構成されるビデオ記述器手段(VD)をさらに備え、前記カプセル化デバイス(END)が、前記受信器デバイス(AS)へのプロビジョニングのために、前記符号化され適合されたビデオストリーム(EAV)および前記メタデータ(MD)から、拡張され符号化され適合されたビデオパケット(EEAV)を生成するように構成される、請求項8および9に記載の端末(MT1’)。
  11. 請求項9または10に記載の端末(MT1;MT1’)に通信可能に結合される、通信ネットワークのアプリケーションサーバ(AS)であって、前記アプリケーションサーバのアプリケーションサービス(VOR)モジュールへのプロビジョニングのために前記符号化され適合されたビデオストリーム(EAV)を復号化するための復号器(DEC)であり、前記アプリケーションサービスモジュール(VOR)が前記適合されたビデオストリームに関してアプリケーションを遂行するように構成される復号器(DEC)を備え、前記アプリケーションサービスモジュールに対する要件パラメータを記憶するための、および、前記品質要件パラメータ(QR)として前記要件パラメータを前記端末(MT1;MT1’)の前記ビデオ適合デバイス(VAD)に提供するための手段(R)を備える、アプリケーションサーバ(AS)。
  12. 前記アプリケーションサービスモジュールが、前記適合されたビデオストリーム(AV)に関して物体認識を遂行するように構成されるビデオ物体認識モジュール(VOR)を備える、請求項11に記載のアプリケーションサーバ(AS)。
JP2014509677A 2011-05-11 2012-05-03 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法 Pending JP2014514883A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP11305570.1 2011-05-11
EP11305570A EP2523145A1 (en) 2011-05-11 2011-05-11 Method for dynamically adapting video image parameters for facilitating subsequent applications
PCT/EP2012/058121 WO2012152649A1 (en) 2011-05-11 2012-05-03 Method for dynamically adapting video image parameters for facilitating subsequent applications

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2016041816A Division JP6247324B2 (ja) 2011-05-11 2016-03-04 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法

Publications (1)

Publication Number Publication Date
JP2014514883A true JP2014514883A (ja) 2014-06-19

Family

ID=44281012

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2014509677A Pending JP2014514883A (ja) 2011-05-11 2012-05-03 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法
JP2016041816A Expired - Fee Related JP6247324B2 (ja) 2011-05-11 2016-03-04 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2016041816A Expired - Fee Related JP6247324B2 (ja) 2011-05-11 2016-03-04 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法

Country Status (6)

Country Link
US (1) US20140146877A1 (ja)
EP (1) EP2523145A1 (ja)
JP (2) JP2014514883A (ja)
KR (1) KR20140006102A (ja)
CN (1) CN103518210A (ja)
WO (1) WO2012152649A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10567795B2 (en) 2012-01-20 2020-02-18 Sony Corporation Logical intra mode naming in HEVC video coding

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201419846A (zh) * 2012-11-09 2014-05-16 Inst Information Industry 動態解析度調節方法系統與動態解析度調節方法
US9628528B2 (en) * 2013-07-19 2017-04-18 Electronics And Telecommunications Research Institute Apparatus and method for providing content
GB201318658D0 (en) 2013-10-22 2013-12-04 Microsoft Corp Controlling resolution of encoded video
US20150286719A1 (en) * 2014-04-03 2015-10-08 Sony Corporation Recognizing and registering faces in video
CN104980411B (zh) * 2014-04-14 2020-07-10 腾讯科技(深圳)有限公司 视频通话的控制方法、服务器、终端及视频通话系统
US9696414B2 (en) 2014-05-15 2017-07-04 Sony Corporation Proximity detection of candidate companion display device in same room as primary display using sonic signaling
US10070291B2 (en) 2014-05-19 2018-09-04 Sony Corporation Proximity detection of candidate companion display device in same room as primary display using low energy bluetooth
DE112015002681B4 (de) * 2014-06-06 2022-09-29 Mitsubishi Electric Corporation Bild-analyseverfahren, bild-analysevorrichtung, bild-analysesystem und tragbare bild-analysevorrichtung
CN104219539B (zh) * 2014-09-29 2018-10-30 公安部第一研究所 一种基于td-lte信道检测的视频编码与传输的方法
KR102656605B1 (ko) * 2014-11-05 2024-04-12 삼성전자주식회사 복수의 단말기들 간의 화면 공유를 제어하는 방법, 장치 및 기록 매체
CA3004793A1 (en) 2015-11-09 2017-05-18 Thomson Licensing Method and device for adapting the video content decoded from elementary streams to the characteristics of a display
KR101776430B1 (ko) * 2015-12-14 2017-09-07 현대자동차주식회사 차세대 연료펌프 일체형 디젤 연료필터
US10418955B2 (en) * 2017-04-10 2019-09-17 Language Line Services, Inc. Process for acoustic amplification in a mobile device application
KR102383117B1 (ko) 2017-07-21 2022-04-06 삼성전자주식회사 디스플레이 장치, 디스플레이 방법 및 디스플레이 시스템
US10861421B2 (en) * 2018-09-27 2020-12-08 Mediatek Inc. Adaptive control of GPU rendered frame quality
KR102656963B1 (ko) * 2019-04-03 2024-04-16 삼성전자 주식회사 전자 장치 및 전자 장치의 제어 방법
FR3105905B1 (fr) * 2019-12-26 2022-12-16 Thales Sa Procédés de transmission et de réception de flux, dispositifs et programme d'ordinateur associés

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341076A (ja) * 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> 画像通信システム,通信会議システム,階層符号化装置,サーバ装置,画像通信方法,画像通信プログラムおよび画像通信プログラム記録媒体
JP2008533837A (ja) * 2005-03-09 2008-08-21 クゥアルコム・インコーポレイテッド ビデオテレフォニーに関する関心領域抽出
JP2009005238A (ja) * 2007-06-25 2009-01-08 Sony Computer Entertainment Inc 符号化処理装置および符号化処理方法
JP2009188792A (ja) * 2008-02-07 2009-08-20 Sony Corp 画像送信装置、画像受信装置、画像送受信システム、画像送信プログラムおよび画像受信プログラム
JP2010141770A (ja) * 2008-12-15 2010-06-24 Brother Ind Ltd サーバ装置、同サーバ装置のプログラム、テレビ会議支援方法、テレビ会議端末装置、及びテレビ会議システム
JP2010278968A (ja) * 2009-06-01 2010-12-09 Panasonic Corp 画像符号化伝送表示装置及び画像符号化伝送表示方法

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11355756A (ja) * 1998-06-04 1999-12-24 Oki Electric Ind Co Ltd 動画データの蓄積および配信方法
EP1249002B1 (en) * 2000-01-13 2011-03-16 Digimarc Corporation Authenticating metadata and embedding metadata in watermarks of media signals
JP4560897B2 (ja) * 2000-06-02 2010-10-13 ソニー株式会社 通信装置、通信方法及び媒体
US20020080878A1 (en) * 2000-10-12 2002-06-27 Webcast Technologies, Inc. Video apparatus and method for digital video enhancement
US7899243B2 (en) * 2000-11-06 2011-03-01 Evryx Technologies, Inc. Image capture and identification system and process
US7016532B2 (en) * 2000-11-06 2006-03-21 Evryx Technologies Image capture and identification system and process
US6909745B1 (en) * 2001-06-05 2005-06-21 At&T Corp. Content adaptive video encoder
US7167519B2 (en) * 2001-12-20 2007-01-23 Siemens Corporate Research, Inc. Real-time video object generation for smart cameras
US7751805B2 (en) * 2004-02-20 2010-07-06 Google Inc. Mobile image-based information retrieval system
IL162921A0 (en) * 2004-07-08 2005-11-20 Hi Tech Solutions Ltd Character recognition system and method
US7263205B2 (en) * 2004-12-06 2007-08-28 Dspv, Ltd. System and method of generic symbol recognition and user authentication using a communication device with imaging capabilities
CN101167365A (zh) * 2005-03-09 2008-04-23 高通股份有限公司 用于视频电话的感兴趣区域处理
US8581981B2 (en) * 2006-04-28 2013-11-12 Southwest Research Institute Optical imaging system for unmanned aerial vehicle
US8489987B2 (en) * 2006-07-31 2013-07-16 Ricoh Co., Ltd. Monitoring and analyzing creation and usage of visual content using image and hotspot interaction
JP2009246642A (ja) * 2008-03-31 2009-10-22 Kddi Corp 映像伝送装置、映像表示装置および映像伝送システム
US20100246669A1 (en) * 2009-03-25 2010-09-30 Syclipse Technologies, Inc. System and method for bandwidth optimization in data transmission using a surveillance device
US20100296583A1 (en) * 2009-05-22 2010-11-25 Aten International Co., Ltd. Image processing and transmission in a kvm switch system with special handling for regions of interest

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005341076A (ja) * 2004-05-26 2005-12-08 Nippon Telegr & Teleph Corp <Ntt> 画像通信システム,通信会議システム,階層符号化装置,サーバ装置,画像通信方法,画像通信プログラムおよび画像通信プログラム記録媒体
JP2008533837A (ja) * 2005-03-09 2008-08-21 クゥアルコム・インコーポレイテッド ビデオテレフォニーに関する関心領域抽出
JP2009005238A (ja) * 2007-06-25 2009-01-08 Sony Computer Entertainment Inc 符号化処理装置および符号化処理方法
JP2009188792A (ja) * 2008-02-07 2009-08-20 Sony Corp 画像送信装置、画像受信装置、画像送受信システム、画像送信プログラムおよび画像受信プログラム
JP2010141770A (ja) * 2008-12-15 2010-06-24 Brother Ind Ltd サーバ装置、同サーバ装置のプログラム、テレビ会議支援方法、テレビ会議端末装置、及びテレビ会議システム
JP2010278968A (ja) * 2009-06-01 2010-12-09 Panasonic Corp 画像符号化伝送表示装置及び画像符号化伝送表示方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10567795B2 (en) 2012-01-20 2020-02-18 Sony Corporation Logical intra mode naming in HEVC video coding
US10623772B2 (en) 2012-01-20 2020-04-14 Sony Corporation Logical intra mode naming in HEVC video coding
US11012712B2 (en) 2012-01-20 2021-05-18 Sony Corporation Logical intra mode naming in HEVC video coding
US11412255B2 (en) 2012-01-20 2022-08-09 Sony Corporation Logical intra mode naming in HEVC video coding

Also Published As

Publication number Publication date
JP2016129416A (ja) 2016-07-14
KR20140006102A (ko) 2014-01-15
WO2012152649A1 (en) 2012-11-15
US20140146877A1 (en) 2014-05-29
CN103518210A (zh) 2014-01-15
JP6247324B2 (ja) 2017-12-13
EP2523145A1 (en) 2012-11-14

Similar Documents

Publication Publication Date Title
JP6247324B2 (ja) 引き続くアプリケーションを容易にするためにビデオ画像パラメータを動的に適合させるための方法
JP5859111B2 (ja) 対象オブジェクトベースの画像処理
CN107277423B (zh) 丢包重传的方法及装置
CN103517072B (zh) 视频通信方法和设备
JP5766877B2 (ja) 類似度、視覚的品質、および関心に基づくフレーム符号化選択
EP2986020B1 (en) Method and apparatus for adjusting video quality based on network environment
US9344678B2 (en) Information processing apparatus, information processing method and computer-readable storage medium
KR101989842B1 (ko) 단말기 및 그것의 영상 처리 방법
KR20180039402A (ko) 영상 표시 장치 및 영상 표시 방법
CN108933917A (zh) 一种视频回传方法及装置
CN103686056B (zh) 会议终端及该会议终端的视频处理方法
CN111696039A (zh) 图像处理方法及装置、存储介质和电子设备
CN110996122B (zh) 视频帧传输方法、装置、计算机设备及存储介质
CN107079132B (zh) 在视频电话中的端口重配置之后馈送经帧内译码的视频帧
KR100961391B1 (ko) 화상 통화 중 저장된 영상 관리 방법 및 영상 관리 장치 및그 장치를 포함하는 시스템
CN110753243A (zh) 图像处理方法、图像处理服务器及图像处理系统
CN104038741A (zh) 一种视频数据的投影方法
CN116962613A (zh) 数据传输方法及装置、计算机设备、存储介质
CN107025638B (zh) 图像处理的方法及装置
CN104717516A (zh) 一种多媒体数据的传输方法及装置
US9830946B2 (en) Source data adaptation and rendering
Kim et al. Experimental Assessment of 1D-DCT Based Display Field Communication Scheme
EP4375947A1 (en) Point cloud data transmission device, point cloud data transmission method, point cloud data reception device, and point cloud data reception method
KR101967651B1 (ko) 영상 표시 방법, 장치 및 컴퓨터 판독 가능한 기록매체
JP4434164B2 (ja) 輪郭データを利用した画像転送

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20141110

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141209

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150305

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20151104