JP2010520693A - 画像データの関心領域を考慮した映像伝送方法および装置 - Google Patents

画像データの関心領域を考慮した映像伝送方法および装置 Download PDF

Info

Publication number
JP2010520693A
JP2010520693A JP2009552282A JP2009552282A JP2010520693A JP 2010520693 A JP2010520693 A JP 2010520693A JP 2009552282 A JP2009552282 A JP 2009552282A JP 2009552282 A JP2009552282 A JP 2009552282A JP 2010520693 A JP2010520693 A JP 2010520693A
Authority
JP
Japan
Prior art keywords
interest
region
image
video
video sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009552282A
Other languages
English (en)
Inventor
マイケル ジェイムズ ニー、
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Snell Advanced Media Ltd
Original Assignee
Snell Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Snell Ltd filed Critical Snell Ltd
Publication of JP2010520693A publication Critical patent/JP2010520693A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/16Analogue secrecy systems; Analogue subscription systems
    • H04N7/173Analogue secrecy systems; Analogue subscription systems with two-way working, e.g. subscriber sending a programme selection signal
    • H04N7/17309Transmission or handling of upstream communications
    • H04N7/17318Direct or substantially direct transmission and handling of requests
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/387Composing, repositioning or otherwise geometrically modifying originals
    • H04N1/393Enlarging or reducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/234Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
    • H04N21/2343Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements
    • H04N21/234363Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving reformatting operations of video signals for distribution or compliance with end-user requests or end-user device requirements by altering the spatial resolution, e.g. for clients with a lower screen resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/238Interfacing the downstream path of the transmission network, e.g. adapting the transmission rate of a video stream to network bandwidth; Processing of multiplex streams
    • H04N21/2383Channel coding or modulation of digital bit-stream, e.g. QPSK modulation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/258Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
    • H04N21/25808Management of client data
    • H04N21/25833Management of client data involving client hardware characteristics, e.g. manufacturer, processing or storage capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/262Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists
    • H04N21/26208Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints
    • H04N21/26216Content or additional data distribution scheduling, e.g. sending additional data at off-peak times, updating software modules, calculating the carousel transmission frequency, delaying a video stream transmission, generating play-lists the scheduling operation being performed under constraints involving the channel capacity, e.g. network bandwidth
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/25Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
    • H04N21/266Channel or content management, e.g. generation and management of keys and entitlement messages in a conditional access system, merging a VOD unicast channel into a multicast channel
    • H04N21/2662Controlling the complexity of the video stream, e.g. by scaling the resolution or bitrate of the video stream based on the client capabilities
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6106Network physical structure; Signal processing specially adapted to the downstream path of the transmission network
    • H04N21/6131Network physical structure; Signal processing specially adapted to the downstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/60Network structure or processes for video distribution between server and client or between remote clients; Control signalling between clients, server and network components; Transmission of management data between server and client, e.g. sending from server to client commands for recording incoming content stream; Communication details between server and client 
    • H04N21/61Network physical structure; Signal processing
    • H04N21/6156Network physical structure; Signal processing specially adapted to the upstream path of the transmission network
    • H04N21/6181Network physical structure; Signal processing specially adapted to the upstream path of the transmission network involving transmission via a mobile phone network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/222Studio circuitry; Studio devices; Studio equipment
    • H04N5/262Studio circuits, e.g. for mixing, switching-over, change of character of image, other special effects ; Cameras specially adapted for the electronic generation of special effects
    • H04N5/2628Alteration of picture size, shape, position or orientation, e.g. zooming, rotation, rolling, perspective, translation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Databases & Information Systems (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computer Graphics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

映像を伝送する際に制限された帯域幅の効率的な使用を可能にするために、関心領域が各画像において決定される。符号化の前に、該画像は関心領域の内部で適用された倍率を用いて空間的にスケーリングされる。スケーリングされた画像は次に圧縮符号化される。復号の後該スケーリングを逆にすることができるように、関心領域の位置を特定するメタデータが伝送映像に添付される。

Description

本発明は比較的低い帯域幅伝送用の映像素材を処理することに関し、典型的には小型スクリーンディスプレイに関する。
小さな携帯型ディスプレイへの映像素材の伝送には相当な関心が持たれている。テレビおよび映画用に生成された映像素材は、利用可能なデータレートが低く、小型ディスプレイの解像度が本質的に低いので、そのような伝送には適さないことが多い。
この問題に対する1つの解は、最も重要なアクションを含んだ画像領域の部分を選択し、小型ディスプレイにこの「関心領域(region of interest)」のみを伝送することである。
しかしながら、該関心領域の選択は、その後画像の他の部分を見る選択肢をもはや持たない視聴者に課されている。したがって、システムの限定された解像度を最大限利用しながら、視聴者が自分の視聴する範囲を関心領域に限定すべきかどうかを選択可能にする伝送方法が必要とされている。
本発明は、一態様において、ビデオシーケンスの1つまたは2つ以上の画像が、拡大が該画像内の関心領域に適用され、縮小がその関心領域外で適用されるように、符号化処理に先立って空間的にスケーリングされる映像伝送方法および装置からなる。該空間的スケーリングファクタは、関心領域内の点における最大値から関心領域外の最小値まで単調に減少してもよい。該関心領域の位置はシーケンス中に変えることができる。
好都合に、関心領域の位置は、伝送映像に添付されるメタデータとして伝送される。関心領域の大きさおよび形状、または空間要素が画像全体にわたって変化する関数も、メタデータとして伝送することができる。関心のある中心を特定する座標のみを送ることには重要な利点があり、メタデータに割り当てられる帯域幅を最小限にするだろう。関心領域の位置のみならず該領域の大きさまたは形状(すなわち空間的スケーリングファクタが2次元で変化する関数)を変えることによって、いくつかの利点をさらに提供することができる。
符号化処理に先立った該空間的スケーリングは復号化処理の後で適切に逆にされる。
好ましい実施形態では、前記ビデオシーケンスの画像はピクセルで構成され、該スケーリング処理は画像を構成するピクセル数を変えない。
空間周波数拡張を縮小された画像部分に適用することができる。
好都合に、該空間周波数拡張の強度は前記空間的スケーリングファクタに依存して変化する。
当然ながら、伝送(transmission)(本明細書でこの用語を用いているとき)は、より特化したテレビ伝送技法のみならずインターネットアクセス、無線配信、およびモバイル電話に関連した種々の技術も含んだ種々の形態を取ることができる。
ここで、本発明の例を、図面を参照して説明する。
(a)空間的マッピング関数のグラフを示している。(b)空間的マッピング関数のグラフを示している。 本発明の実施形態による映像の前符号化処理のブロックダイアグラムを示している。 本発明の実施形態による映像の後符号化処理を示している。
本発明では、伝送される画像(ビデオシーケンスの形成部分)は、最も重要な情報を含んだ該画像内の関心領域を拡大する空間的マッピング関数に従って、伝送に先立ってスケーリングされる。通常、画像の外形サイズ(すなわちピクセル数)は変えられないので、使用中の、より多くの有効なピクセルが関心領域を表すことを可能にするように、関心領域から遠い画像部分はサイズが縮小される。次の伝送処理では、画像は、小型ディスプレイへの低帯域幅伝送を容易にするように、空間的にダウンサンプリングされる(できる限りデータ圧縮処理の一部として)。関心領域を拡大することは、そうしなければダウンサンプリングの結果生じるであろう解像度の劣化を回避する(または低減する)。空間的マッピング関数は、最大倍率が関心領域の中心に適用され、最小倍率(それは1未満であろう)が関心領域の中心から最も遠い画像部分に適用され、中間の倍率が他のところに適用されるように、滑らかに変化するスケーリングファクタに対応する。このように、スケーリングファクタは関心領域の中心の値から単調に減少する。
図1aは、適切な、滑らかに変化するマッピング関数の例を示している。同図は出力画素位置対入力画素位置のグラフであり、該関数は曲線(1)によって示されている。グラフの軸はピクセル座標が正規化された値である、すなわち、0は画像の一方のエッジを表し、1は画像の反対側のエッジを表し、1/2は画像の中心を表す。図1では、関心領域の中心が画像の中心に対応すると仮定されている。
曲線(1)の数式は次のとおりである。
x≦1/2の値に対して、y=x/2(1−x)
および
x≧1/2の値に対して、y=(3x−1)/2x
画素位置がこの関数に従ってマッピングされた場合、画像の特定の点の倍率は関数の勾配y’(一次導関数)と等しくなる。これは次式で与えられる。
値x≦1/2に対して、y’=1/2(1−x)2
また、該関数は点x=1/2について対称である。
したがって、(関連する座標軸方向の)倍率は両画像エッジで1/2、画像中心(すなわち推量された関心領域の中心)で2となる。
関心領域の中心が座標値1/2を持たない場合には、異なったマッピング関数が必要となる。図1bは、関心領域の中心座標が0.15から0.5までの範囲にある場合の適切なマッピング関数の一群を示している。各図示の関数については、関心領域の中心に対応する曲線上の点が小さな円形のマーカーで示されている。各曲線の傾斜(すなわち倍率値)は関心領域の中心で常に2であるが、両エッジの倍率は関心領域の中心の位置に依存し、関心領域が中心に位置しない場合、互いに反対にある両エッジは異なる倍率値を持つ。
関心領域の中心座標と1/2との差をパラメータS(Sは正の値を持つ。また、関心領域が座標系の原点に向かって移動すると仮定する)で示すと、図1bに示した曲線群を定義する数式は次式のとおりである。
x≦1/2の値に対して、y=x/2(1−S)(1−S−x)
および
x≧1/2の値に対して、
y={(1−2S)/(2−2S)}+{2(x−1/2+S)/[1+b(x−1/2+S)]}
ここで、bは次式を満足するような変数である。
b=(2+4S−8S2)/(1+2S)
上記の数式は、関心領域の中心が画像の中心より座標原点により近い場合にのみ適用される。関心領域の中心が原点からさらに離れている場合のマッピングは、点(0,0)と(1,1)とが交換されるように、図1aの座標軸の目盛りを単に逆にすることによって得ることができる。
これまでのところ、一方向のマッピングのみを説明した。通常、類似のマッピングが水平方向および垂直方向に適用されるだろう。これは、非正方形画像については、倍率が等方的にならないことを意味している。もしこれが望ましくないと考えられる場合には、等方的な倍率を達成する代替のマッピングを導き出すことも可能である。
図2は、伝送に先立って画像を変更するビデオプリプロセッサの例を示している。同図では、プログレッシブ方式でスキャンされ、タイミング参照情報が付加され、ラスター順に整列されたピクセデータ値のストリームとして画像が表されると仮定しているが、当業者には、他の形態を用いることができ、説明した処理の他の実施も可能である(特に画像または画像のシーケンスがコンピュータの1つまたは2つ以上のデータファイルで表される場合)ことが認識されるであろう。
図2を参照して、入力ビデオ信号(201)が、タイミング参照情報を用いて各ピクセルの水平および垂直の直角座標(203)を導き出すタイミングデコーダ(202)に加えられる。これらの座標は、各ピクセルのそれぞれの水平および垂直のピクセルシフト値、ΔH(205)およびΔV(206)を導き出す倍率ルックアップテーブル(204)に渡される。これらのピクセルシフト値(正または負であってもよい)は距離に相当し、各ピクセルは関連するピクセルマッピングを適用するために移動される必要がある。
例えば、図1では、座標1/4にあるピクセルは座標位置1/6にシフトされることになる。負方向において必要とされる移動はこれらの座標値間の差であり、マッピング関数(1)と直線y=x(3)との間の距離Δ(2)によって図1に示されている。
図2に戻り、倍率ルックアップテーブル(204)は関心領域の座標(207)も受け取る。これらの座標は作業者がまたは自動的な方法(例えばWO2007/093780に記載の前景セグメントの重心を決定する方法)によって決定することができる。これらの座標は、ΔH(205)およびΔV(206)の適切な値を決定することによって、関心領域の中心に最大倍率を持つ滑らかに変化するマッピング関数にルックアップテーブル(204)を適用することを可能にする。
関心領域の中心から遠い画像のそれらの部分はサイズが縮小され(すなわち、ピクセルマッピング処理は入力ピクセルを互いに近くなるように効果的にシフトさせる)、この結果高い空間周波数のエイリアスが引き起こされる。これを回避するために、入力ビデオ信号(201)は2次元のアンチエイリアスローパスフィルター(208)にも供給される。このフィルターは、最低倍率の領域内のエイリアスを許容レベルに低減するように選択された遮断周波数を持っている。例えば、図1に示したマッピング関数の最小倍率は1/2であるので、入力ラスターの垂直および水平サンプリング周波数の1/4、すなわちそれぞれの垂直および水平ナイキスト周波数の1/2で適切なフィルターが遮断する。
アンチエイリアスフィルター(208)からの出力は、フィルタリングされていない入力(201)とクロスフェーダー(209)において結合される。該クロスフェーダーは、現在のピクセルに適用される倍率の大きさを示しているルックアップテーブル(204)からの倍率信号(210)によって制御される。この値は、これらの倍率の2乗の和の平方根のような水平倍率と垂直倍率との組み合わせである。
倍率信号(210)が、現在のピクセルが拡大されるべきことを示している場合、クロスフェーダー(209)は、フィルタリングされていないビデオ入力信号(201)をその出力(211)に送る。倍率信号(210)が、最小倍率が適用されるべきことを示している場合、クロスフェーダー(209)はアンチエイリアスフィルター(208)からの出力をその出力(211)に送る。1未満の他の倍率値に対して、クロスフェーダーは、倍率値(210)に応じて線形に変化する大きさを持つ、フィルタリングされた信号とフィルタリングされていない信号との混合信号を出力する。
クロスフェーダー(209)からのビデオ信号(211)は、それぞれの水平および垂直のピクセルシフト値ΔH(205)およびΔV(206)を適用するピクセルシフター(212)で処理される。これには逐次的な水平および垂直移動処理を用いることができる。
整数のピクセルシフト値は、ピクセル値のストリームに適切な遅延を適用することによって得ることができる。必要なシフトの任意の非整数部も、所要位置に先行および後続するピクセルの値の簡単なバイリニア補間(bi−linear interpolation)によって得ることができる。
ピクセルシフト処理から発生したビデオ信号(213)は、関心領域の中心で拡大され、関心領域の中心から遠い位置で縮小された画像を表す。この信号は、次の伝送システム、例えば圧縮符号化装置およびCOFDM RF送信機への入力とされる。関心領域を表すピクセル数が増加するにつれ、また他の領域を表すピクセル数が減少するにつれ、関心領域の伝送品質は改善される。
伝送された信号が従来通りに復号、表示された場合、それは当然幾何学的に歪むであろう。図2のシステムによって持ち込まれた幾何学的歪は、1つまたは2つ以上の画像が表示される前に元に戻されるのが好ましい。これを可能にするためには、ビデオ信号(213)と共に関心領域の位置を伝送する必要がある。これは、ビデオ信号に付加されたメタデータとして、関心領域の座標を伝送することによって行うことができる。図2のシステムからの出力(214)がこのデータを表している。
表示に先立って幾何学的歪を元に戻す方法の一例を、図3に示している。同図を参照すると、受信ビデオ信号(301)(例えば圧縮された伝送チャネルを通過した後の図2の出力(213))が、現在のピクセルの水平座標および垂直座標(303)を回復するタイミングデコーダ(302)への入力である。これらの座標は、ビデオ信号(301)に関連して搬送されたメタデータから関心領域(307)の座標も受け取る逆倍率ルックアップテーブル(304)への入力である。
逆倍率ルックアップテーブル(304)は、必要な水平および垂直ピクセルシフト、ΔH(305)およびΔV(306)を導き出す。それらのΔH、ΔVは、図2のピクセルシフター(212)によって実行されるシフトを元に戻すように、ピクセルシフター(312)によってビデオ信号(301)に適用される。
ピクセルシフター(312)からの出力は、クロスフェーダー(309)および2次元の空間周波数拡張フィルター(308)への入力である。該拡張フィルターの目的は、関心領域の中心から離れた領域内の劣化した空間的解像度の部分にいくつかの主観的な補正を提供することである。適切な(1次元)フィルターは次式によって与えられる。
F(P)=−1/4(P-1)+3/2(P0)−1/4(P1
ここで、
-1は前のピクセルの値、
0は現在のピクセルの値、
1は次のピクセルの値である。
必要な2次元フィルターは、上記フィルターを2度(1度は垂直に、もう1度は水平に)逐次的に適用することによって得ることができる。
逆倍率ルックアップテーブル(304)からの倍率信号(310)は、図2のクロスフェーダー(209)に対する方法と類似した方法でクロスフェーダー(309)を制御する。現在のピクセルが拡大された領域にある場合、クロスフェーダー(309)は、ピクセルシフター(312)のフィルタリングされていない出力を選択し、現在のピクセルが最大限縮小された領域にある場合、フィルター(308)の出力が選択され、中間の縮小値が適用された場合には、フィルタリングされた信号とフィルタリングされていない信号との混合信号が、縮小の度合いに比例して形成される。
クロスフェーダー(309)からの出力(313)は表示に適している。画像の一部を拡大することができ(恐らくビューア―によって制御される別の処理において)、該部分が関心領域に相当する場合には、改善された解像度が提供される。他のある部分が選択されている場合にはより低い解像度で伝送されていたであろうが、この損失に対するある主観的な補正は、拡張フィルター(308)の動作によって提供される。視聴者がズームしたい画像部分が関心領域として正確に特定される範囲で、かなりの利点が達成された。(本発明を用いないで)制限された帯域幅を通して画像を伝送する際に達成できなかった解像度で、その部分を表示することができる。関心領域のサイズを画像から画像にまたはシーケンスからシーケンスに変えることを可能にする(上で議論した)任意の技法(または空間的スケーリングファクタが画像上で変化する関数)が、ズームする領域を視聴者が選択することによって予測可能な信頼度を考慮して、ここで用いられてもよい。
本発明の代替の実施形態も可能である。他の滑らかに変化するピクセルマッピング関数を用いることができるであろうし、倍率を関心領域の中心からのある所定距離での定数値(1次元または2次元のいずれかでの)に保持することができるであろう。
空間周波数拡張処理(フィルター(308)およびクロスフェーダー(309))は、空間的マッピングの反転の後で適用されるよりもむしろプリプロセッサ(図2)に含まれているであろう。
2次元処理は、逐次的な水平および垂直の処理に置き換えることができる。より大きな開口のフィルターをアンチエイリアス、ピクセルシフト、および拡張に用いることができる。該処理は、リアルタイム以外のもので行うことができる。該処理は、専用のハードウェアを用いて、プログラマブルデータまたはビデオ処理装置上で動作するソフトウェアを用いて、または専用の装置とプログラム可能な装置との組み合わせを用いて行うことができる。

Claims (15)

  1. 画像のビデオシーケンスを受信するステップと、
    関心領域の位置がシーケンスの少なくとも2つの画像の間で変化する、いくつかの画像の関心領域を決定するステップと、
    拡大が画像内の関心領域に適用され、縮小がその関心領域外で適用されるように、前記関心領域内の点における最大値から前記関心領域外の最小値まで単調に減少する空間的スケーリングファクタを用いて、いくつかの画像を空間的にスケーリングするステップと、
    空間的にスケーリングされた前記画像を含むビデオシーケンスを圧縮符号化するステップと、
    圧縮符号化された前記ビデオシーケンスを伝送するステップと、
    伝送された前記ビデオシーケンスを復号するステップと、
    好ましくは、映像を表示するために空間的スケーリングを元に戻すステップと、
    を含む映像伝送方法。
  2. 前記関心領域の位置は伝送ビデオに付加されるメタデータとして伝送される、請求項1に記載の方法。
  3. 空間周波数拡張が縮小された画像部分に適用され、該空間周波数拡張の強度は前記空間的スケーリングファクタに依存して変化する、請求項1または2に記載の方法。
  4. 拡大が画像内の関心領域に適用され、縮小がその関心領域外で適用され、空間的スケーリングファクタが前記関心領域内の点における最大値から前記関心領域外の最小値まで単調に減少するように、ビデオシーケンスの1つまたは2つ以上の画像が符号化処理に先立って空間的にスケーリングされる伝送用のビデオ処理方法であって、前記関心領域の位置はシーケンス中に変化する方法。
  5. 前記関心領域の位置は伝送映像に付加されるメタデータとして伝送される、請求項4に記載の方法。
  6. 前記ビデオシーケンスの画像はピクセルで構成され、前記スケーリングの処理は画像を構成するピクセル数を変えない、請求項4または5に記載の方法。
  7. 符号化処理に先立ってビデオシーケンスを処理する装置であって、
    画像のビデオシーケンスを受け取るビデオ入力と、
    1つの画像から他の画像へと変化することが許可された関心領域の画像の位置を決定または又は受信する関心領域ユニットと、
    拡大が画像内の前記関心領域に適用され、縮小がその関心領域外で適用されるように、前記関心領域内の点における最大値から前記関心領域外の最小値まで単調に減少する空間的スケーリングファクタを用いて、画像が空間的にスケーリングされる空間的スケーリング装置と、
    圧縮符号化及び次の伝送のために、前記スケーリングされた画像を含むビデオシーケンスをエンコーダに出力するビデオ出力と、
    を有する装置。
  8. 前記伝送映像に付加されるメタデータとして、前記関心領域の位置を伝送することを可能にするメタデータ出力を更に有する、請求項7に記載の装置。
  9. 前記ビデオシーケンスの画像はピクセルで構成され、前記スケーリングの処理は画像を構成するピクセル数を変えない、請求項7または8に記載の装置。
  10. 前記空間的スケーリングファクタによって強度が制御されるアンチエイリアスフィルターをさらに有する、請求項7から9のいずれか1項に記載の装置。
  11. 前の符号化処理で適用された可変の空間的スケーリングを元に戻すように、復号化処理の後でビデオシーケンスを処理する方法であって、
    前記復号化処理の後で最大の縮小が適用される画像の位置が、前記ビデオシーケンスに付加されるメタデータによって規定され、該スケーリングファクタは前記画像の位置から前記画像内の他の位置における最大値まで距離と共に単調に増加する、
    方法。
  12. 前記ビデオシーケンスの画像はピクセルで構成され、前記可変の空間的スケーリングを逆にする処理は、画像を構成するピクセル数を変えない、請求項11に記載の方法。
  13. 前記復号化処理の後で、空間周波数拡張が拡大された画像部分に適用され、該空間周波数拡張の強度は該拡大に依存して変化する、請求項11または12に記載の方法。
  14. 前の符号化処理で適用された可変の空間的スケーリングを元に戻すように、復号化処理の後でビデオシーケンスを処理する装置であって、
    復号器から画像のビデオシーケンスを受け取るビデオ入力と、
    1つの画像から他の画像へと変化することが許可された関心領域であって、最大の縮小が適用される関心領域の画像の位置を受け取るメタデータ入力と、
    縮小が関心領域に適用され、拡大が該関心領域の外に適用されるように、画像が空間的にスケーリングされる空間的スケーリング装置と、
    ディスプレイに前記ビデオシーケンスを提供するビデオ出力と、
    を有する装置。
  15. 空間的スケーリングファクタによって強度が制御される空間的拡張フィルターを有する、請求項14に記載の装置。
JP2009552282A 2007-03-05 2008-03-05 画像データの関心領域を考慮した映像伝送方法および装置 Pending JP2010520693A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB0704226.0A GB2447245B (en) 2007-03-05 2007-03-05 Video transmission
PCT/GB2008/050158 WO2008107721A1 (en) 2007-03-05 2008-03-05 Video transmission considering a region of interest in the image data

Publications (1)

Publication Number Publication Date
JP2010520693A true JP2010520693A (ja) 2010-06-10

Family

ID=37965941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009552282A Pending JP2010520693A (ja) 2007-03-05 2008-03-05 画像データの関心領域を考慮した映像伝送方法および装置

Country Status (5)

Country Link
US (1) US20100110298A1 (ja)
EP (1) EP2130377A1 (ja)
JP (1) JP2010520693A (ja)
GB (1) GB2447245B (ja)
WO (1) WO2008107721A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140011264A (ko) * 2012-07-17 2014-01-28 삼성전자주식회사 영상 제공 시스템 및 방법

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8456380B2 (en) * 2008-05-15 2013-06-04 International Business Machines Corporation Processing computer graphics generated by a remote computer for streaming to a client computer
TWI420906B (zh) * 2010-10-13 2013-12-21 Ind Tech Res Inst 興趣區域之追蹤系統與方法及電腦程式產品
CN102752588B (zh) * 2011-04-22 2017-02-15 北京大学深圳研究生院 使用空间缩放预测的视频编解码方法
WO2013052025A1 (en) 2011-10-03 2013-04-11 Hewlett-Packard Development Company, L.P. Region selection for counterfeit determinations
US8724912B2 (en) * 2011-11-14 2014-05-13 Fujifilm Corporation Method, apparatus, and program for compressing images, and method, apparatus, and program for decompressing images
GB2511730A (en) * 2013-01-28 2014-09-17 Microsoft Corp Spatially adaptive video coding
EP2863638A1 (en) * 2013-10-17 2015-04-22 BAE Systems PLC A method of reducing video content of a video signal of a scene for communication over a communications link
GB201318658D0 (en) 2013-10-22 2013-12-04 Microsoft Corp Controlling resolution of encoded video
US20150262404A1 (en) * 2014-03-13 2015-09-17 Huawei Technologies Co., Ltd. Screen Content And Mixed Content Coding
EP3113159A1 (en) 2015-06-30 2017-01-04 Thomson Licensing Method and device for processing a part of an immersive video content according to the position of reference parts
US10848768B2 (en) * 2018-06-08 2020-11-24 Sony Interactive Entertainment Inc. Fast region of interest coding using multi-segment resampling
US11164279B2 (en) 2019-09-19 2021-11-02 Semiconductor Components Industries, Llc Systems and methods for authenticating image data
US11792420B2 (en) * 2019-11-04 2023-10-17 Qualcomm Incorporated Methods and apparatus for foveated compression
WO2022097921A1 (ko) * 2020-11-09 2022-05-12 삼성전자 주식회사 영상 내 관심 오브젝트 영역을 위한 ai 부호화 장치 및 방법, 및 ai 복호화 장치 및 방법
WO2024077797A1 (en) * 2022-10-11 2024-04-18 Guangdong Oppo Mobile Telecommunications Corp., Ltd. Method and system for retargeting image

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050025371A1 (en) * 1998-03-20 2005-02-03 Mitsubishi Electric Corporation Method and apparatus for compressing and decompressing images
JP2005518032A (ja) * 2002-02-12 2005-06-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 空間最適化テクスチャ・マップ
JP2006262390A (ja) * 2005-03-18 2006-09-28 Toa Corp 画像圧縮伸張法、画像圧縮装置及び画像伸張装置

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH1115956A (ja) * 1997-06-26 1999-01-22 Hitachi Eng Co Ltd 地図情報表示装置
JP3597780B2 (ja) * 1998-03-20 2004-12-08 ユニヴァーシティ オブ メリーランド 注目領域に対する有損失/無損失の画像符号化
JP4697500B2 (ja) * 1999-08-09 2011-06-08 ソニー株式会社 送信装置および送信方法、受信装置および受信方法、並びに記録媒体
US20020080878A1 (en) * 2000-10-12 2002-06-27 Webcast Technologies, Inc. Video apparatus and method for digital video enhancement
CN100559859C (zh) * 2004-07-13 2009-11-11 皇家飞利浦电子股份有限公司 空间和snr可伸缩图像压缩、解压缩的方法和设备
JP4578197B2 (ja) * 2004-09-29 2010-11-10 三洋電機株式会社 画像表示装置
US20070024706A1 (en) * 2005-08-01 2007-02-01 Brannon Robert H Jr Systems and methods for providing high-resolution regions-of-interest

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050025371A1 (en) * 1998-03-20 2005-02-03 Mitsubishi Electric Corporation Method and apparatus for compressing and decompressing images
JP2005518032A (ja) * 2002-02-12 2005-06-16 インターナショナル・ビジネス・マシーンズ・コーポレーション 空間最適化テクスチャ・マップ
JP2006262390A (ja) * 2005-03-18 2006-09-28 Toa Corp 画像圧縮伸張法、画像圧縮装置及び画像伸張装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200501031004; 金澤知典(外4名): '「離散ウェーブレット変換に基づく携帯端末用画像符号化手法」' 画像電子学会誌 第33巻,第5号, 20040925, 第705〜711頁, 画像電子学会 *
JPN6012026731; 金澤知典(外4名): '「離散ウェーブレット変換に基づく携帯端末用画像符号化手法」' 画像電子学会誌 第33巻,第5号, 20040925, 第705〜711頁, 画像電子学会 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140011264A (ko) * 2012-07-17 2014-01-28 삼성전자주식회사 영상 제공 시스템 및 방법
KR102091137B1 (ko) * 2012-07-17 2020-03-20 삼성전자주식회사 영상 제공 시스템 및 방법

Also Published As

Publication number Publication date
GB2447245B (en) 2011-12-28
US20100110298A1 (en) 2010-05-06
WO2008107721A1 (en) 2008-09-12
EP2130377A1 (en) 2009-12-09
GB2447245A (en) 2008-09-10
GB0704226D0 (en) 2007-04-11

Similar Documents

Publication Publication Date Title
JP2010520693A (ja) 画像データの関心領域を考慮した映像伝送方法および装置
JP5744374B2 (ja) 画像の縮尺を変更して縮尺変更画像を生成する方法および装置
US6600517B1 (en) System and method for improving the sharpness of a video image
RU2419243C1 (ru) Устройство и способ обработки изображений и устройство и способ отображения изображений
CN105230033B (zh) 利用自适应频率强度受控变换来创建图像中的细节
US8300987B2 (en) Apparatus and method for generating a detail-enhanced upscaled image
CN105230032B (zh) 利用自适应频率提高来创建图像中的细节
KR20030007817A (ko) 비디오 화상의 스케일링가능한 해상도 개선
US9066025B2 (en) Control of frequency lifting super-resolution with image features
JP2014085892A (ja) 画像処理装置
KR20150129687A (ko) 주파수 리프팅으로 이미지에서 디테일 생성
US8665377B2 (en) Video information processing apparatus and recording medium having program recorded therein
KR100754735B1 (ko) 에지 신호 성분을 이용한 효율적인 영상 확대 방법 및 이를위한 장치
KR20090043290A (ko) 분할 영상 처리 장치 및 방법 그리고 제어 인자 계산 장치
JP2006078552A (ja) 画像拡大装置
JP2010171624A (ja) 輪郭補正回路及び補間画素生成回路
KR20100046398A (ko) 영상표시기기 및 그의 영상 확대 방법
JP2017223765A (ja) 表示制御装置および表示方法
JP6708490B2 (ja) 画像処理方法および画像処理装置
KR20150128677A (ko) 적응적 개선 메커니즘 전자 시스템 및 이의 동작 방법
JP2012114687A (ja) 画像処理装置及び画像処理方法
JP2014006653A (ja) リンギングを除去する映像処理方法とそのプログラム及びその映像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110304

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120529

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20120820

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20120827

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121127