JP2016187191A - 映像補間方法及び映像補間装置 - Google Patents

映像補間方法及び映像補間装置 Download PDF

Info

Publication number
JP2016187191A
JP2016187191A JP2016105692A JP2016105692A JP2016187191A JP 2016187191 A JP2016187191 A JP 2016187191A JP 2016105692 A JP2016105692 A JP 2016105692A JP 2016105692 A JP2016105692 A JP 2016105692A JP 2016187191 A JP2016187191 A JP 2016187191A
Authority
JP
Japan
Prior art keywords
unit
filter
pixel
interpolation
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2016105692A
Other languages
English (en)
Inventor
アルシナ,エレナ
Alshina Elena
アルシン,アレクサンダー
Alshin Alexander
シルヤコフ,ニコライ
Shlyakhov Nikolay
チェー,ビョン−ドゥ
Byeong-Doo Choi
ホン,ユン−ミ
Yoon-Mi Hong
ハン,ウ−ジン
Woo-Jin Han
リー,テミー
Tammy Lee
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of JP2016187191A publication Critical patent/JP2016187191A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/4007Scaling of whole images or parts thereof, e.g. expanding or contracting based on interpolation, e.g. bilinear interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/17Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method
    • G06F17/175Function evaluation by approximation methods, e.g. inter- or extrapolation, smoothing, least mean square method of multidimensional data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • H04N19/517Processing of motion vectors by encoding
    • H04N19/52Processing of motion vectors by encoding by predictive encoding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/523Motion estimation or motion compensation with sub-pixel accuracy
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • H04N19/82Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation involving filtering within a prediction loop
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/01Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level
    • H04N7/0135Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes
    • H04N7/014Conversion of standards, e.g. involving analogue television standards or digital television standards processed at pixel level involving interpolation processes involving the use of motion vectors

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computational Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Discrete Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Image Processing (AREA)
  • Television Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】映像信号のインター予測を正確に行うために、予測ブロック生成において整数ピクセル単位のピクセル値間を補間して分数ピクセル単位のピクセル値を生成する方法及び装置を提供する。【解決手段】映像を補間する方法は、複数の異なるフィルタのうち、整数ピクセル単位のピクセル値間を補間するための第1フィルタを補間位置によって選択する段階と、前記選択された第1フィルタを用いて、前記整数ピクセル単位のピクセル値間を補間して、少なくとも一つの分数ピクセル単位のピクセル値を生成する段階と、を含む。【選択図】図14

Description

本発明は、映像を補間する方法及びその装置に係り、さらに詳しくは、整数ピクセル単位のピクセル値間を補間する方法及びその装置に関する。
従来技術による映像符号化、復号化方法では、映像を符号化するために一つのピクチャーをマクロブロックに分割する。次いで、インター予測またはイントラ予測を用いてそれぞれのマクロブロックを予測符号化する。
インター予測は、ピクチャー間の時間的な重複性を除去して映像を圧縮する方法であって、動き推定符号化が代表的な例である。動き推定符号化は、少なくとも一つの参照ピクチャーを用いて現在ピクチャーのブロックをそれぞれ予測する。所定の評価関数を用いて、現在ブロックと最も類似した参照ブロックを所定の検索範囲で検索する。
現在ブロックを参照ブロックに基づいて予測し、現在ブロックから予測結果として生成された予測ブロックを差し引いて生成された残差ブロックを符号化する。この時、予測をさらに正確に行うために参照ピクチャーの検索範囲に対して補間を行って、整数ピクセル単位より小さなピクセル単位のサブピクセルを生成し、生成されたサブピクセルに基づいてインター予測を行う。
本発明が解決しようとする技術的課題は、整数ピクセル単位のピクセル値間を補間して分数ピクセル単位のピクセル値を生成する方法及び装置を提供するところにあり、前記方法を行うためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供するところにある。
前記技術的課題を解決するための本発明の一実施形態による映像を補間する方法は、複数の異なるフィルタのうち、整数ピクセル単位のピクセル値間を補間するための第1フィルタを補間位置によって選択する段階と、前記選択された第1フィルタを用いて、前記整数ピクセル単位のピクセル値間を補間して、少なくとも一つの分数ピクセル単位のピクセル値を生成する段階と、を含む。
本発明のさらに他の実施形態によれば、前記補間方法は、前記複数の異なるフィルタのうち、前記分数ピクセル単位のピクセル値間を補間するための第2フィルタを補間位置によって選択する段階と、前記選択された第2フィルタを用いて、前記分数ピクセル単位のピクセル値間を補間する段階と、をさらに含む。
本発明のさらに他の実施形態によれば、前記第1フィルタは、異なる周波数の複数の基底関数を用いて、前記整数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする。
本発明のさらに他の実施形態によれば、前記第2フィルタは、異なる周波数の複数の基底関数を用いて、前記生成された少なくとも一つの分数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする。
前記技術的課題を解決するための本発明の一実施形態による映像を補間する装置は、複数の異なるフィルタのうち、整数ピクセル単位のピクセル値間を補間するための第1フィルタを補間位置によって選択するフィルタ選択部と、前記選択された第1フィルタを用いて、前記整数ピクセル単位のピクセル値間を補間して少なくとも一つの分数ピクセル単位のピクセル値を生成する補間部と、を備える。
本発明の他の実施形態によれば、前記フィルタ選択部は、前記複数の異なるフィルタのうち、前記分数ピクセル単位のピクセル値間を補間するための第2フィルタを補間位置によって選択し、前記補間部は、前記選択された第2フィルタを用いて、前記分数ピクセル単位のピクセル値間を補間することを特徴とする。
前記技術的課題を解決するために本発明は、前記補間方法を行うためのプログラムを記録したコンピュータで読み取り可能な記録媒体を提供する。
本発明の他の実施形態によって映像を補間する方法は、異なる周波数を持つ複数の基底関数を用いて空間領域のピクセル値を変換する段階と、前記複数の基底関数の位相を変更する段階と、前記ピクセル値を変換することで獲得された複数の係数を、前記位相の変更された複数の基底関数を用いて逆変換する段階と、を含むことを特徴とする。
本発明によれば、変換及び逆変換に基づいて映像をさらに正確に補間することができて、さらに高い効率で映像を符号化、復号化できる。また、補間された映像をユーザにディスプレイすることで、映像機器を用いるユーザの満足度を高めることができる。
本発明の一実施形態による映像符号化装置を示す図面である。 本発明の一実施形態による映像復号化装置を示す図面である。 本発明の一実施形態による階層的符号化単位を示す図面である。 本発明の一実施形態による符号化単位に基づいた映像符号化部を示す図面である。 本発明の一実施形態による符号化単位に基づいた映像復号化部を示す図面である。 本発明の一実施形態による最大符号化単位、サブ符号化単位及び予測単位を示す図面である。 本発明の一実施形態による符号化単位及び変換単位を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び変換単位の分割形態を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び変換単位の分割形態を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び変換単位の分割形態を示す図面である。 本発明の一実施形態による符号化単位、予測単位及び変換単位の分割形態を示す図面である。 本発明の一実施形態による映像を補間する装置を示す図面である。 本発明の一実施形態による映像補間装置の2次元補間方法を説明するための図面である。 本発明の一実施形態による補間領域を説明するための図面である。 本発明の一実施形態による1次元補間の例を示す図面である。 本発明の一実施形態による映像補間装置の1次元補間方法を説明するための図面である。 本発明のさらに他の実施形態による映像を補間する装置を示す図面である。 本発明の一実施形態による2次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による最適化された1次元補間フィルタを示す図面である。 本発明の一実施形態による1次元補間フィルタを用いた多様な方向のピクセル値を補間する方法を説明する図面である。 本発明の一実施形態による1次元補間フィルタを用いた多様な方向のピクセル値を補間する方法を説明する図面である。 本発明の一実施形態による2次元補間方法を説明するための図面である。 本発明の一実施形態による1次元補間フィルタを用いた2次元補間方法を説明するためのフローチャートである。 本発明の他の実施形態による1次元補間フィルタを用いた2次元補間方法を説明するためのフローチャートである。 本発明の一実施形態による映像を補間する方法を説明するためのフローチャートである。 本発明の他の実施形態による映像を補間する方法を説明するためのフローチャートである。 本発明のさらに他の実施形態による映像を補間する方法を説明するためのフローチャートである。 本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す図面である。 本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す図面である。 本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す図面である。 本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す図面である。 本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す図面である。
以下では、図面を参照して本発明の実施形態を詳細に説明する。構成要素を並べる前に先行される‘少なくとも一つの’などの表現は、構成要素の全体リストを修正するためのものであり、それぞれの構成要素を修飾するものではない。本明細書で“映像”は、ビデオの静止画または動画、すなわち、ビデオそのものを示す。
図1は、本発明の一実施形態による映像符号化装置を示す。図1を参照すれば、本発明の一実施形態による映像符号化装置100は、最大符号化単位分割部110、符号化深度決定部120、映像データ符号化部130及び符号化情報符号化部140を備える。
最大符号化単位分割部110は、最大サイズの符号化単位である最大符号化単位に基づいて現在フレームまたは現在スライスを分割できる。現在フレームまたは現在スライスを、少なくとも一つの最大符号化単位に分割できる。
本発明の一実施形態によれば、最大符号化単位及び深度を用いて符号化単位が表現される。前述したように、最大符号化単位は、現在フレームの符号化単位のうちサイズの最も大きい符号化単位を示し、深度は、符号化単位が階層的に縮小した程度を示す。深度が大きくなりつつ、符号化単位は、最大符号化単位から最小符号化単位まで縮小し、最大符号化単位の深度は最小深度と定義され、最小符号化単位の深度は最大深度と定義される。最大符号化単位は、深度が大きくなるにつれて深度別符号化単位のサイズは低減するので、k深度のサブ符号化単位は、kより大きい深度の複数のサブ符号化単位を含む。
符号化されるフレームのサイズが大きくなるにつれて、さらに大きい単位で映像を符号化すれば、さらに高い映像圧縮率で映像を符号化できる。しかし、符号化単位を大きくし、そのサイズを固定させれば、変わり続ける映像の特性を反映して効率的に映像を符号化きない。
例えば、海または空などの平坦な領域を符号化する時には符号化単位を大きくするほど圧縮率が向上するが、人々またはビルなどの複雑な領域を符号化する時には、符号化単位を小さくするほど圧縮率が向上する。
このために本発明の一実施形態は、フレームまたはスライスごとに異なるサイズの最大映像符号化単位を設定し、最大深度を設定する。最大深度は、符号化単位が縮小される最大回数を意味するので、最大深度によって最大映像符号化単位に含まれた最小符号化単位大きさが可変的に設定可能になる。
符号化深度決定部120は最大深度を定める。最大深度は、R−Dコスト(Rate−Distortion Cost)計算に基づいて定められる。最大深度は、フレームまたはスライスごとに異なって定められるか、またはそれぞれの最大符号化単位ごとに異なって定められる。決定された最大深度は符号化情報符号化部140に出力され、最大符号化単位別映像データは映像データ符号化部130に出力される。
最大深度は、最大符号化単位に含まれる最も小さなサイズの符号化単位、すなわち、最小符号化単位を意味する。言い換えれば、最大符号化単位は、異なる深度によって異なるサイズのサブ符号化単位に分割される。図8Aないし図8Dを参照して詳細に後述する。また、最大符号化単位に含まれた異なるサイズのサブ符号化単位は、異なるサイズの処理単位に基づいて予測または変換される。変換は、空間ドメインのピクセル値を周波数ドメインの係数に変換し、離散コサイン変換(discrete cosine transform)またはKLT(Karhunen Loever Transform)である。
言い換えれば、映像符号化装置100は、映像符号化のための複数の処理段階を、多様なサイズ及び多様な形態の処理単位に基づいて行える。映像データの符号化のためには、予測、変換、エントロピー符号化などの処理段階を経るが、すべての段階にわたって同じサイズの処理単位が用いられてもよく、段階別に異なるサイズの処理単位を用いることができる。
例えば、映像符号化装置100は、所定の符号化単位を予測するために符号化単位と異なる処理単位を選択する。
符号化単位のサイズが2N×2N(但し、Nは、正の整数)である場合、予測のための処理単位は、2N×2N、2N×N、N×2N、N×Nなどでありうる。言い換えれば、符号化単位の高さまたは幅のうち少なくとも一つを半分にする形態の処理単位に基づいて動き予測が行われてもよい。以下、予測の基礎になる処理単位は‘予測単位’と言う。
予測モードは、イントラモード、インタモード及びスキップモードのうち少なくとも一つであり、特定予測モードは、特定サイズまたは形態の予測単位に対してのみ行われる。例えば、イントラモードは、正方形である2N×2N、N×Nサイズの予測単位に対してのみ行われる。また、スキップモードは、2N×2Nサイズの予測単位に対してのみ行われる。符号化単位の内部に複数の予測単位があるならば、それぞれの予測単位に対して予測を行って符号化誤差の最も小さな予測モードが選択される。
また、映像符号化装置100は、符号化単位と異なるサイズの処理単位に基づいて映像データを変換できる。符号化単位の変換のために、符号化単位より小さいか、または同じサイズのデータ単位に基づいて変換が行われる。以下、変換の基礎になる処理単位を‘変換単位’という。
符号化深度決定部120は、ラグランジュの乗数(Lagrangian Multiplier)基盤の率−歪曲最適化技法を用いて、最大符号化単位に含まれたサブ符号化単位を定められる。言い換えれば、最大符号化単位がいかなる形態の複数のサブ符号化単位に分割されるかを定められるが、ここで複数のサブ符号化単位は、深度によってサイズが異なる。次いで、映像データ符号化部130は、符号化深度決定部120で定められた分割形態に基づいて、最大符号化単位を符号化してビットストリームを出力する。
符号化情報符号化部140は、符号化深度決定部120で定められた最大符号化単位の符号化モードに関する情報を符号化する。最大符号化単位の分割形態に関する情報、最大深度に関する情報及び深度別サブ符号化単位の符号化モードに関する情報を符号化してビットストリームを出力する。サブ符号化単位の符号化モードに関する情報は、サブ符号化単位の予測単位に関する情報、予測単位別予測モード情報、サブ符号化単位の変換単位に関する情報などを含む。
最大符号化単位の分割形態に関する情報は、それぞれの符号化単位に対して分割如何を示す情報である。例えば、最大符号化単位を分割して符号化する場合、最大符号化単位に対して分割如何を示す情報を符号化し、最大符号化単位を分割して生成されたサブ符号化単位を再び分割して符号化する場合にも、それぞれのサブ符号化単位に対して分割如何を示す情報を符号化する。分割如何を示す情報は、分割如何を示すフラグ情報でありうる。
最大符号化単位ごとに異なるサイズのサブ符号化単位が存在し、それぞれのサブ符号化単位ごとに符号化モードに関する情報が定められねばならないので、一つの最大符号化単位に対しては、少なくとも一つの符号化モードに関する情報が定められる。
映像符号化装置100は、深度が大きくなるにつれて最大符号化単位の高さ及び幅を半分にして、サブ符号化単位を生成できる。すなわち、k深度の符号化単位のサイズが2N×2Nならば、k+1深度の符号化単位のサイズはN×Nである。
したがって、一実施形態による映像符号化装置100は、映像の特性を考慮した最大符号化単位のサイズ及び最大深度に基づいて、それぞれの最大符号化単位ごとに最適の分割形態を定められる。映像特性を考慮して可変的に最大符号化単位のサイズを調節し、異なる深度のサブ符号化単位に最大符号化単位を分割して映像を符号化することで、多様な解像度の映像をさらに効率的に符号化できる。
図2は、本発明の一実施形態による映像復号化装置を示す。図2を参照すれば、本発明の一実施形態による映像復号化装置200は、映像データ獲得部210、符号化情報抽出部220及び映像データ復号化部230を備える。
映像関連データ獲得部210は、映像復号化装置200が受信したビットストリームをパージングして、最大符号化単位別に映像データを獲得して映像データ復号化部230に出力する。映像データ獲得部210は、現在フレームまたはスライスに対するヘッダから、現在フレームまたはスライスの最大符号化単位に関する情報を抽出できる。言い換えれば、ビットストリームを最大符号化単位に分割して、映像データ復号化部230をして最大符号化単位ごとに映像データを復号化させる。
符号化情報抽出部220は、映像復号化装置200が受信したビット列をパージングして、現在フレームに対するヘッダから、最大符号化単位、最大深度、最大符号化単位の分割形態、サブ符号化単位の符号化モードに関する情報を抽出する。分割形態及び符号化モードに関する情報は、映像データ復号化部230に出力される。
最大符号化単位の分割形態に関する情報は、最大符号化単位に含まれた深度によって異なるサイズのサブ符号化単位に関する情報を含む。前述したように分割形態に関する情報は、それぞれの符号化単位に対して符号化された分割如何を示す情報(例えば、フラグ情報)でありうる。符号化モードに関する情報は、サブ符号化単位別予測単位に関する情報、予測モードに関する情報及び変換単位に関する情報などを含む。
映像データ復号化部230は、符号化情報抽出部で抽出された情報に基づいて、それぞれの最大符号化単位の映像データを復号化して現在フレームを復元する。
最大符号化単位の分割形態に関する情報に基づいて、映像データ復号化部230は、最大符号化単位に含まれたサブ符号化単位を復号化できる。復号化過程は、イントラ予測及び動き補償を含むインター予測過程及び逆変換過程を含む。
映像データ復号化部230は、サブ符号化単位の予測のために、サブ符号化単位別予測単位に関する情報及び予測モードに関する情報に基づいて、イントラ予測またはインター予測を行える。また、映像データ復号化部230は、サブ符号化単位の変換単位に関する情報に基づいて、サブ符号化単位ごとに逆変換を行える。
図3は、本発明の一実施形態による階層的符号化単位を示す。図3を参照すれば、本発明による階層的符号化単位は、幅×高さが64×64である符号化単位から、32×32、16×16、8×8、及び4×4を含む。正方形状の符号化単位以外にも、幅×高さが64×32、32×64、32×16、16×32、16×8、8×16、8×4、4×8である符号化単位が存在できる。
図3を参照すれば、解像度が1920×1080である映像データ310に対して、最大符号化単位のサイズは64×64、最大深度が2に設定されている。
解像度が1920×1080である他の映像データ320に対して、最大符号化単位のサイズは64×64、最大深度が3に設定されている。解像度が352×288であるビデオデータ330に対して、最大符号化単位のサイズは16×16、最大深度は1に設定されている。
解像度が高いか、またはデータ量が多い場合、圧縮率向上だけではなく映像特性を正確に反映するために、符号化サイズの最大サイズが相対的に大きいことが望ましい。したがって、映像データ330に比べて、解像度の高い映像データ310及び320は、最大符号化単位のサイズが64×64に選択される。
最大深度は、階層的符号化単位で総階層数を示す。映像データ310の最大深度は2であるので、映像データ310の符号化単位315は、長軸サイズが64である最大符号化単位から、深度の増大につれて長軸サイズが32、16であるサブ符号化単位まで含む。
一方、映像データ330の最大深度は1であるので、映像データ330の符号化単位335は、長軸サイズが16である最大符号化単位から、深度の増大につれて長軸サイズが8、4である符号化単位まで含む。
映像データ320の最大深度は3であるので、ビデオデータ320の符号化単位325は、長軸サイズが64である最大符号化単位から、深度の増大につれて長軸サイズが32、16、8、4であるサブ符号化単位まで含む。深度が増大するほどさらに小さなサブ符号化単位に基づいて映像を符号化するため、さらに細密な場面を含んでいる映像を好適に符号化できる。
図4は、本発明の一実施形態による符号化単位に基づいた映像符号化部を示す。イントラ予測部410は、現在フレーム405のうちイントラモードの予測単位に対してイントラ予測を行い、動き推定部420及び動き補償部425は、インタモードの予測単位に対して、現在フレーム405及び参照フレーム495を用いてインター予測及び動き補償を行う。
イントラ予測部410、動き推定部420及び動き補償部425から出力された予測単位に基づいて残差値が生成され、生成された残差値は、変換部430及び量子化部440を経て量子化された変換係数として出力される。
量子化された変換係数は、逆量子化部460、逆変換部470を通じて再び残差値に復元され、復元された残差値は、デブロッキング部480及びループフィルタリング部490を経て後処理されて参照フレーム495に出力される。量子化された変換係数は、エントロピー符号化部450を経てビットストリーム455として出力されうる。
本発明の一実施形態による映像符号化方法によって符号化するために、映像符号化部400の構成要素であるイントラ予測部410、動き推定部420、動き補償部425、変換部430、量子化部440、エントロピー符号化部450、逆量子化部460、逆変換部470、デブロッキング部480及びループフィルタリング部490は、いずれも最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づいて映像符号化過程を処理する。
図5は、本発明の一実施形態による符号化単位に基づいた映像復号化部を示す。ビットストリーム505がパージング部510を経て、復号化対象である符号化された映像データ及び復号化のために必要な符号化情報がパージングされる。符号化された映像データは、エントロピー復号化部520及び逆量子化部530を経て逆量子化されたデータとして出力され、逆変換部540を経て残差値に復元される。残差値は、イントラ予測部550のイントラ予測の結果または動き補償部560の動き補償結果と加算されて符号化単位別に復元される。復元された符号化単位は、デブロッキング部570及びループフィルタリング部580を経て、次の符号化単位または次のフレームの予測に用いられる。
本発明の一実施形態による映像復号化方法によって復号化するために、映像復号化部400の構成要素であるパージング部510、エントロピー復号化部520、逆量子化部530、逆変換部540、イントラ予測部550、動き補償部560、デブロッキング部570及びループフィルタリング部580が、いずれも最大符号化単位、深度によるサブ符号化単位、予測単位及び変換単位に基づいて映像復号化過程を処理する。
特に、イントラ予測部550、動き補償部560は、最大符号化単位及び深度を考慮してサブ符号化単位内の予測単位及び予測モードを定め、逆変換部540は、変換単位のサイズを考慮して逆変換を行う。
図6は、本発明の一実施形態による最大符号化単位、サブ符号化単位及び予測単位を示す。
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、映像特性を考慮して符号化、復号化を行うために、階層的な符号化単位を用いる。最大符号化単位及び最大深度は映像の特性によって適応的に設定されるか、またはユーザの要求に応じて多様に設定される。
本発明の一実施形態による符号化単位の階層構造600は、最大符号化単位610の高さ及び幅が64であり、最大深度が4である場合を示す。符号化単位の階層構造600の縦軸に沿って深度が増大し、深度の増加によってサブ符号化単位620ないし650の幅及び高さが縮小する。また、符号化単位の階層構造600の横軸に沿って、最大符号化単位610及びサブ符号化単位620ないし650の予測単位が図示されている。
最大符号化単位610は、深度が0であり、符号化単位のサイズ、すなわち、幅及び高さが64×64である。縦軸に沿って深度が増大し、サイズ32×32である深度1のサブ符号化単位620、サイズ16×16である深度2のサブ符号化単位630、サイズ8×8である深度3のサブ符号化単位640、サイズ4×4である深度4のサブ符号化単位650が存在する。サイズ4×4である深度4のサブ符号化単位650は最小符号化単位である。
図6を参照すれば、それぞれの深度別に横軸に沿って予測単位の例示が図示されている。すなわち、深度0の最大符号化単位610の予測単位は、サイズ64×64の符号化単位610と同一であるか、またはそれより小さなサイズ64×64の予測単位610、サイズ64×32の予測単位612、サイズ32×64の予測単位614、サイズ32×32の予測単位616でありうる。
深度1のサイズ32×32の符号化単位620の予測単位は、サイズ32×32の符号化単位620と同一であるか、またはそれより小さなサイズ32×32の予測単位620、サイズ32×16の予測単位622、サイズ16×32の予測単位624、サイズ16×16の予測単位626でありうる。
深度2のサイズ16×16の符号化単位630の予測単位は、サイズ16×16の符号化単位630と同一であるか、またはそれより小さなサイズ16×16の予測単位630、サイズ16×8の予測単位632、サイズ8×16の予測単位634、サイズ8×8の予測単位636でありうる。
深度3のサイズ8×8の符号化単位640の予測単位は、サイズ8×8の符号化単位640と同一であるか、またはそれより小さなサイズ8×8の予測単位640、サイズ8×4の予測単位642、サイズ4×8の予測単位644、サイズ4×4の予測単位646でありうる。
最後に、深度4のサイズ4×4の符号化単位650は、最大深度の符号化単位であり、予測単位は、サイズ4×4の予測単位650、サイズ4×2の予測単位652、サイズ2×4の予測単位654、サイズ2×2の予測単位656である。
図7は、本発明の一実施形態による符号化単位及び変換単位を示す。
本発明の一実施形態による映像符号化装置100及び映像復号化装置200は、最大符号化単位そのまま符号化するか、または最大符号化単位より小さいか、または同じサブ符号化単位に最大符号化単位を分割して符号化する。符号化過程中に変換のための変換単位のサイズも、符号化単位及び予測単位と関係なく最も高い圧縮率のためのサイズに選択される。例えば、現在符号化単位710が64×64サイズである時、32×32サイズの変換単位720を用いて変換が行われてもよい。
図8Aないし図8Dは、本発明の一実施形態による符号化単位、予測単位及び変換単位の分割形態を示す。
図8A及び図8Bは、本発明の一実施形態による符号化単位及び予測単位を示す。
図8Aは、最大符号化単位810を符号化するために、本発明の一実施形態による映像符号化装置100が選択した分割形態を示す。映像符号化装置100は、多様な形態に最大符号化単位810を分割し、符号化した後で多様な分割形態の符号化結果をR−Dコストに基づいて比べて、最適の分割形態を選択する。最大符号化単位810をそのまま符号化することが最適である場合には、図8Aないし図8Dのように、最大符号化単位810を分割せずに最大符号化単位800を符号化してもよい。
図8Aを参照すれば、深度0である最大符号化単位810を、深度1以上のサブ符号化単位に分割して符号化する。最大符号化単位810を4つの深度1のサブ符号化単位に分割した後、全部または一部の深度1のサブ符号化単位を、再び深度2のサブ符号化単位に分割する。
深度1のサブ符号化単位のうち右側上部に位置しているサブ符号化単位及び左側下部に位置しているサブ符号化単位が、深度2以上のサブ符号化単位に分割された。深度2以上のサブ符号化単位のうち一部は、再び深度3以上のサブ符号化単位に分割されうる。
図8Bは、最大符号化単位810に対する予測単位の分割形態を示す。図8Bを参照すれば、最大符号化単位に対する予測単位860は、最大符号化単位810と異なって分割される。言い換えれば、サブ符号化単位それぞれに対する予測単位は、サブ符号化単位より小さい。
例えば、深度1のサブ符号化単位のうち右側下部に位置しているサブ符号化単位854に対する予測単位は、サブ符号化単位854より小さい。深度2のサブ符号化単位814、8、16、818、828、850、852のうち一部のサブ符号化単位815、816、850、852に対する予測単位は、サブ符号化単位より小さい。
また、深度3のサブ符号化単位822、832、848に対する予測単位は、サブ符号化単位より小さい。予測単位は、それぞれのサブ符号化単位を高さまたは幅方向に半分にした形態であってもよく、高さ及び幅方向に4分した形態であってもよい。
図8C及び図8Dは、本発明の一実施形態による予測単位及び変換単位を示す。
図8Cは、図8Bに示した最大符号化単位810に対する予測単位の分割形態を示し、図8Dは、最大符号化単位810の変換単位の分割形態を示す。
図8Dを参照すれば、変換単位870の分割形態は、予測単位860と異なって設定される。
例えば、深度1の符号化単位854に対する予測単位が高さを半分にした形態に選択されるとしても、変換単位は、深度1の符号化単位854のサイズと同じサイズに選択されうる。同様に、深度2の符号化単位814、850に対する予測単位が深度2の符号化単位814、850の高さを半分にした形態に選択されるとしても、変換単位は、深度2の符号化単位814、850の元来のサイズと同じサイズに選択されうる。
予測単位よりさらに小さなサイズに変換単位が選択されてもよい。例えば、深度2の符号化単位852に対する予測単位が、幅を半分にした形態に選択された場合に、変換単位は、予測単位よりさらに小さなサイズである、高さ及び幅を半分にした形態に選択されうる。
図9は、本発明の一実施形態による映像を補間する装置を示す。
映像の補間は、低画質の映像を高画質に変換する時に用いられる。インターレース(interlace)映像をプログレッシブ映像に変換する時に用いられてもよく、低画質の映像をアップサンプリングして高画質の映像に変換する時に用いられてもよい。また、図4の映像符号化装置400が映像を符号化する時、動き推定部420及び動き補償部425は、補間された参照フレームを用いてインター予測を行える。参照フレーム495を補間して高画質の映像を生成し、高画質の映像に基づいて動き推定及び補償を行うことで、インター予測の正確度を高めることができる。同様に、映像復号化装置500が映像を復号化する時にも、動き補償部550は、補間された参照フレームを用いて動き補償を行うことで、インター予測の正確度を高めることができる。
図9を参照すれば、本発明の一実施形態による映像補間装置900は、変換部910及び逆変換部920を備える。変換部910は、異なる周波数の複数の基底関数を用いてピクセル値を変換する。変換は、空間ドメインのピクセル値を周波数ドメインの係数に変換するすべての変換であり、前述した離散コサイン変換でありうる。整数ピクセル単位のピクセル値を、複数の基底関数を用いて変換する。ピクセル値は、輝度成分に対するピクセル値であってもよく、彩度(chroma)成分に対するピクセル値であってもよい。基底関数には制限がなく、空間ドメインのピクセル値を周波数ドメインの値に変換するあらゆる変換でありうる。例えば、基底関数は、離散コサイン変換及び逆離散コサイン変換のためのコサイン関数であってもよい。また、サイン基底、多項基底(polynomial basis)などの多様な基底関数が用いられうる。また、離散コサイン変換は、変形離散コサイン変換、ウィンドウを用いた変形離散コサイン変換でありうる。
逆変換部920は、変換部910で変換に用いられた複数の基底関数の位相を変更し、位相変更された複数の基底関数を用いて変換部910で生成された複数の係数、すなわち、周波数ドメインの値を逆変換する。以下では、変換部910及び逆変換部920が行う変換及び逆変換を、2次元離散コサイン変換及び1次元離散コサイン変換を例として挙げて説明する。
<2次元離散コサイン変換及び逆変換>
図10は、本発明の一実施形態による映像補間装置900の2次元補間方法を説明するための図面である。図10を参照すれば、映像補間装置900は、空間ドメインの整数ピクセル単位のピクセル値、すなわち、所定ブロック1000の‘O’位置のピクセル値間を補間して、補間位置である‘X’位置のピクセル値を生成する。‘X’位置のピクセル値は、α及びαによって補間位置が定められる分数ピクセル単位のピクセル値である。図10は、所定のブロック1000が4×4である場合を例として説明するが、ブロックのサイズは4×4に限定されず、さらに大きいかまたはさらに小さなサイズのブロックに対して2次元離散コサイン変換及び2次元逆離散コサイン変換を行って分数ピクセル単位のピクセル値を生成できるということは、当業者が容易に分かる。
変換部910は、先ず整数ピクセル単位のピクセル値を2次元離散コサイン変換する。2次元離散コサイン変換は、次の数式(1)を計算することで行われる。
Figure 2016187191
ここで、Cは、2次元離散コサイン結果として生成される周波数ドメインの係数を含むブロックであり、REFは、離散コサイン変換の対象である所定のブロック1000であり、D(x)はx軸、すなわち、水平方向離散コサイン変換のための行列であり、D(y)はy軸、すなわち、垂直方向離散コサイン変換のための行列である。この時、D(x)及びD(y)は、次の数式(2)のように定義される。
Figure 2016187191
k及びlは、前記条件を満たす整数であって、Dkl(x)は、D(x)行列のk行、l列を意味し、Sは、正方行列D(x)の横及び縦のサイズである。
Figure 2016187191
k及びlは、前記条件を満たす整数であって、Dkl(y)は、D(y)行列のk行、l列を意味し、Sは、正方行列D(y)の横及び縦のサイズである。
変換部910が、数式(1)を計算して所定のブロック1000を2次元離散コサイン変換すれば、逆変換部910は、次の数式(4)を計算して変換部910に生成された周波数ドメインの係数を2次元逆離散コサイン変換する。
Figure 2016187191
Pは、逆離散コサイン変換結果として生成された補間位置、すなわち、‘X’位置のピクセル値を含むブロックである。数式(2)と比較すれば、ブロックCを逆離散コサイン変換するために、ブロックCの両側にW(x)及びW(y)を乗じる。W(x)は、水平方向逆離散コサイン変換のための行列であり、W(y)は、垂直方向逆離散コサイン変換のための行列である。
ところが、前述したように逆変換部910が2次元逆離散コサイン変換を行う時には、位相の変更された基底関数を用いるところ、以下の数式(5)及び(6)のようにW(x)及びW(y)が定義されうる。
Figure 2016187191
l及びkは、前記条件を満たす整数であって、Wlk(x)は、W(x)行列のl行、k列を意味し、Sは、正方行列W(x)の横及び縦のサイズである。αは、図10に示したように水平方向補間位置を意味するところ、1/2、1/4、3/4、1/8、3/8、5/8、7/8、1/16、…などの多様な分数値でありうる。分数値には制限がなく、αは、分数ではない実数値であってもよい。
Figure 2016187191
l及びkは、前記条件を満たす整数であって、Wlk(y)は、W(y)行列のl行、k列を意味し、Sは、正方行列W(y)の横及び縦のサイズである。αは、図10に示したように垂直方向補間位置を意味するところ、1/2、1/4、3/4、1/8、3/8、5/8、7/8、1/16、…などの多様な分数値でありうる。分数値には制限がなく、αは、分数ではない実数値であってもよい。
数式(5)及び数式(6)を数式(2)及び数式(3)と比較すれば、逆変換部910で用いる基底関数、すなわち、コサイン関数の位相がそれぞれ2α及び2αによって変更されたことが分かる。逆変換部910が、数式(5)及び数式(6)の位相変更された複数のコサイン関数に基づいて2次元逆離散コサイン変換を行えば、図10の補間位置、すなわち、“X”位置のピクセル値が生成される。
図11は、本発明の一実施形態による補間領域を説明するための図面である。
図9の変換部910及び逆変換部920が、2次元離散コサイン変換及び2次元逆離散コサイン変換を用いて補間位置のピクセル値を生成する時、補間の対象になるブロック、すなわち、補間領域1110より大きいサイズの領域1120を用いることができる。一般的に補間の正確度は、補間領域1110の境界で低くなる。補間のためには補間位置に隣接しているピクセル値との相関関係を考慮せねばならないが、図9の映像補間装置900は、ブロック400内部のピクセル値を2次元離散コサイン変換し、逆離散コサイン変換するため、ブロック400外部のピクセル値との相関関係が考慮されないからである。
したがって、本発明による映像補間装置900は、補間領域1110及び補間領域1100に隣接している領域を含む大きいサイズのブロック1120に対して補間を行い、動き補償するときには補間領域1110のピクセル値を用いる。
<1次元離散コサイン変換及び逆変換>
図12は、本発明の一実施形態による1次元補間の例を示す。図12を参照すれば、映像補間装置900は、空間ドメインの整数ピクセル単位のピクセル値1210及び1220の間を補間して補間位置のピクセル値1200を生成する。αによって補間位置が定められる分数ピクセル単位のピクセル値1200である。図13を参照して詳細に説明する。
図13は、本発明の一実施形態による映像補間装置900の1次元補間方法を説明するための図面である。図13を参照すれば、整数ピクセルの二つのピクセル値1210及び1220の間を補間して分数ピクセル単位のピクセル値1200を生成するために、ピクセル値1210及び1220を含む隣接している複数のピクセル値1310及び1320を用いる。言い換えれば、−(M−1)番目からM番目までの2M個のピクセル値を1次元離散コサイン変換し、位相変更された基底関数に基づいて1次元逆離散コサイン変換することで0番目と1番目ピクセルの間を補間できる。図13は、M=6である場合を示したが、Mが必ずしも6であるものではなく、Mは0ではない正の整数でありうるということは当業者ならば容易に分かるであろう。
また、図12及び図13は、水平方向のピクセル値間を補間する場合を例として挙げて説明したが、垂直方向のピクセル値間または対角方向のピクセル値間を補間する場合にも、後述する補間方法が同様に適用されるということは当業者ならば容易に分かるであろう。これについては、図18A及び図18Bを参照して後述する。
変換部910は、先ず整数ピクセル単位のピクセル値を1次元離散コサイン変換する。1次元離散コサイン変換は、次の数式(7)を計算することで行われる。
Figure 2016187191
p(l)は、−(M−1)番目からM番目までのピクセル値、例えば、図13の−5番目から6番目までのピクセル値1310及び1320であり、Cは、ピクセル値を1次元離散コサイン変換した結果として生成された複数の係数である。この時、kは、数式(7)の条件を満たす正の整数である。
変換部910が数式(7)を計算して、ピクセル値1310及び1320を1次元離散コサイン変換すれば、逆変換部910は、次の数式(8)を計算して、変換部910に生成された周波数ドメインの係数を逆変換する。
Figure 2016187191
αは、図13に示したように、2つのピクセル値間の補間位置を意味するところ、1/2、1/4、3/4、1/8、3/8、5/8、7/8、1/16…などの多様な分数値でありうる。分数値には制限がなく、αは、分数ではない実数値であってもよい。P(α)は、1次元逆離散コサイン変換結果として生成される補間位置のピクセル値1200を意味する。数式(7)と比較すれば、逆離散コサイン変換に用いられる基底関数であるコサイン関数の位相は、整数lによって定められる代りに分数αによって定められるので、1次元離散コサイン変換に用いられる基底関数の位相と異なる。
図14は、本発明のさらに他の実施形態による映像を補間する装置を示す。図14を参照すれば、本発明のさらに他の実施形態による映像補間装置1400は、フィルタ選択部1410及び補間部1420を備える。図9の映像補間装置900は、映像の変換及び位相変更された複数の基底関数に基づいた逆変換を行う装置である。しかし、映像補間装置900にピクセル値が入力される度に、変換及び逆変換を行うためには多量の演算が必要なため、映像処理システムの映像処理速度を低下させる恐れがある。
したがって、映像の変換及び位相変更された複数の基底関数に基づいた逆変換を行うためのフィルタの係数をあらかじめ計算しておき、映像補間装置1400に入力される空間ドメインのピクセル値を予め計算されたフィルタを用いてフィルタリングすれば、周波数ドメインへの変換なしに空間ドメインで速く映像補間を行える。
フィルタ選択部1410は、補間位置に関する情報を受信して補間に用いられるフィルタを選択する。フィルタは、前述したように異なる周波数の複数の基底関数を用いてピクセル値を変換し、位相変更された基底関数を用いて変換した結果として生成された複数の係数を再び逆変換するためのフィルタである。補間位置によってフィルタの係数が異なるので、補間位置によってフィルタを選択する。
図9に関して前述したように、異なる周波数の複数の基底関数を用いてピクセル値を変換した後、補間位置によって逆変換のための基底関数の位相を異なって変更する。次いで、位相変更された基底関数を用いて逆変換すれば、該当の補間位置のピクセル値を補間できる。言い換えれば、整数ピクセル位置のピクセル値に基づいて変換を行い、補間位置によって異なる基底関数に基づいて逆変換を行えば、すべての補間位置に対して分数ピクセル位置のピクセル値を生成できるということを意味する。したがって、図14に示したフィルタ選択部1410は、変換及び異なる基底関数に基づいた逆変換のための複数のフィルタをあらかじめ設定し、補間位置の情報を参照して異なるフィルタのうち一つを選択する。
補間部1420は、フィルタ選択部1410で選択されたフィルタを用いて補間を行う。フィルタ選択部1410に選択されたフィルタに基づいて、整数ピクセル単位の複数のピクセル値をフィルタリングすることで補間を行う。補間結果、所定の補間位置のピクセル値、すなわち、分数ピクセル単位のピクセル値が生成される。2次元フィルタを用いて整数ピクセル単位の複数のピクセル値を含むブロックをフィルタリングすることで、図10に示したように、α及びα補間位置の複数のピクセル値が生成される。また、1次元フィルタを用いて、整数ピクセル単位の複数のピクセル値を含む行または列をフィルタリングすることで、図13に示したようなα補間位置のピクセル値が生成される。以下では、2次元フィルタ及び1次元フィルタを用いた補間方法を、図面を参照して詳細に説明する。
<2次元フィルタ>
数式(4)に関して前述したように、
Figure 2016187191
である。これを整理すれば、次の数式(9)の通りである。
Figure 2016187191
F(x)は、REFブロックを水平方向に変換し、位相変更された複数の基底関数を用いて水平方向に逆変換するためのフィルタである。F(y)は、REFブロックを垂直方向に変換し、位相変更された複数の基底関数を用いて垂直方向に逆変換するためのフィルタである。例えば、F(x)は、REFブロックを水平方向に離散コサイン変換し、位相変更された複数のコサイン関数を用いて、水平方向に逆離散コサイン変換するためのフィルタである。また、F(y)は、REFブロックを垂直方向に離散コサイン変換し、位相変更された複数のコサイン関数を用いて垂直方向に逆離散コサイン変換するためのフィルタである。
数式(2)、(3)、(5)、(6)によって、フィルタF(x)及びF(y)は、次の数式(10)及び(11)のように定義される。
Figure 2016187191
k及びlは、前記条件を満たす整数であり、Fkl(x)は、F(x)行列のk行、l列を意味し、Sは、正方行列W(x)及びD(x)の横及び縦のサイズである。W(x)及びD(x)のサイズが同一であるので、横及び縦のサイズもいずれも同一である。Wkn(x)は、数式(5)に関して前述したW(x)行列のk行、n列を意味し、Dnl(x)は、数式(2)に関して前述したD(x)行列のn行、l列を意味する。
Figure 2016187191
k及びlは、前記条件を満たす整数であり、Fkl(y)は、F(y)行列のk行、l列を意味し、Sは、正方行列W(y)及びD(y)の横及び縦のサイズである。W(y)及びD(y)のサイズが同一であるので、横及び縦のサイズもいずれも同一である。Wnl(y)は、数式(5)に関して前述したW(y)行列のn行、l列を意味し、Dkn(y)は、数式(2)に関して前述したD(y)行列のk行、n列を意味する。
ところが、フィルタF(x)及びF(y)のビット深さを大きくして補間を行えば、さらに正確なフィルタリングが可能である。したがって、本発明の一実施形態は、F(x)及びF(y)の係数に所定の値を乗じて元来の係数より大きい値にし、大きい値の係数を含むフィルタを用いて映像を補間できる。この時、数式(9)を次の数式(12)のように修正できる。
Figure 2016187191
F’(x)は、F(x)の係数にスケーリングのためのファクター‘S’を乗じ、整数に四捨五入したフィルタであり、F’(y)は、F(y)の係数に‘S’を乗じ、整数に四捨五入したフィルタである。スケーリングされたフィルタを用いて補間を行ったので、補間位置のピクセル値を計算した後、スケーリングの効果を相殺するために‘S’でさらに割る。
図15は、本発明の一実施形態による2次元補間フィルタを示す。図15を参照すれば、数式(2)によってスケーリングされたフィルタ係数を示す。αが1/4、1/2及び3/4である時の2次元補間フィルタF’(x)が図示されている。F(x)の係数にスケーリングファクター(scaling factor)213を乗じたF’(x)のフィルタが図示されており、αが1/4、1/2及び3/4である場合、2次元補間フィルタF’(y)は、F’(x)をトランスポーズして用いられる。
フィルタ選択部1410が、補間位置に基づいて図14のフィルタのうち一つを選択すれば、補間部1420は、数式(9)または数式(12)を計算して補間位置のピクセル値を生成する。
<1次元フィルタ>
数式(7)による1次元離散コサイン変換を行列式で表現すれば、次の数式(13)の通りである。
Figure 2016187191
ここで、Cは、数式(7)に関して前述した2M個の係数に対する2M×1行列であり、REFは、数式(7)に関して前述した整数ピクセル単位のピクセル値、すなわち、P−(M−1),…Pピクセル値に対する2M×1行列である。補間に用いられる整数ピクセル位置のピクセル値の数、すなわち、2Mは、1次元補間フィルタのタップ数を意味する。Dは、1次元離散コサイン変換のための正方行列であって、次の数式(14)のように定義される。
Figure 2016187191
k及びlは、前記条件を満たす整数であり、Dklは、数式(13)の1次元離散コイン変換のための正方行列Dのk行、l列を意味する。Mは、数式(13)のMと同じMである。
数式(8)による、位相変更された複数の基底関数を用いた1次元逆離散コサイン変換を行列式で表現すれば、次の数式(15)の通りである。
Figure 2016187191
ここで、P(α)は、数式(8)のP(α)と同一であり、W(α)は、位相変更された複数の基底関数を用いた1次元逆離散コサイン変換のための1×2M行列であって、次の数式(16)のように定義される。
Figure 2016187191
kは、前記条件を満たす整数であり、W(α)は、数式(15)に関して前述したW(α)行列のk列を意味する。数式(13)及び(15)に基づいて、1次元離散コサイン変換及び位相変更された複数の基底関数を用いた1次元逆離散コサイン変換のためのフィルタF(α)は、次の数式(17)のように定義できる。
Figure 2016187191
k及びlは、前記条件を満たす整数であり、F(α)は、F(α)のl列を意味し、W(α)及びDは、数式(13)のW(α)及びDと同一である。
2次元補間フィルタと同様に1次元補間フィルタF(α)も、ビット深さを大きくしてフィルタリングの正確度を高めることができる。F(α)の係数に所定の値を乗じ、大きい値の係数を含むフィルタF(α)を用いて映像を補間できる。
例えば、F(α)にスケーリングのための値として2ScalingBitsを乗じた後、補間を行える。この時、数式(17)の
Figure 2016187191
を次のように修正できる。
Figure 2016187191
F’(α)は、F(α)の係数にスケーリングファクター‘2ScalingBits’を乗じ、整数に四捨五入して生成されたスケーリングされたフィルタであり、REFは、数式(17)のREF行列のl行であり、‘2ScalingBits−1’は、フィルタリングされたピクセル値の四捨五入のために加算される値である。スケーリングされたフィルタとピクセル値に対する行列とを乗じて補間位置αのピクセル値を求めた後、‘2ScalingBits−1’を加算して四捨五入し、‘Scaling Bits’ビットほどビットシフトしてスケーリングの効果を相殺する。
前述した数式で四捨五入は、フィルタ係数を量子化する方法の一実施形態であるところ、フィルタ係数の量子化方法をさらに一般化すれば、次の数式(19)及び(20)によってフィルタ係数が修正され、最適化される。
Figure 2016187191
ここで、F(α)は、量子化されないフィルタのl番目の係数であり、フィルタf’(α)は、量子化されたフィルタのl番目の係数である。εは、量子化程度によって選択できる任意の実数であるところ、例えば、0.2*F(α)でありうる。前記数式(19)によれば、前述した数式(13)ないし(17)によって、実数であるF(α)が計算されれば、F(α)は、前記数式(19)を満たす範囲内のf’l(α)で修正することで、F(α)を量子化された値に変換する。
フィルタ係数が所定のスケーリングファクターによってスケーリングされる場合には、数式(19)による量子化は、次の数式(20)のように修正される。
Figure 2016187191
前記数式(20)によれば、pは、スケーリングファクターであって、2ScalingBitsであり、スケーリングされたフィルタ係数p*F(α)はF’(α)に変換される。
図16Aないし図16Fは、本発明の一実施形態による1次元補間フィルタを示す。
前述した数式(18)で言及したスケーリングされたフィルタが、タップ数及び補間位置によって図示される。図16Aないし図16Fは、それぞれ4−タップフィルタ、6−タップフィルタ、8−タップフィルタ、10−タップフィルタ、12−タップフィルタ及び14−タップフィルタを示す。図16Aないし図16Fはいずれも、フィルタ係数のスケーリングファクターが“256”である場合、すなわち、“ScalingBits”が“8”である場合を示す。
図16Aないし図16Fのフィルタの係数は、高周波成分に対する係数を含む。これは、補間及び予測の正確性を高めることはできるが、高周波成分を含むことで映像圧縮の効率を低下させる恐れがある。図9に関して前述したように、補間は、さらに高い効率で映像を圧縮することを目的にする。ところが、補間及び予測の正確性のみ高くなり、圧縮率は低くなれば、補間の本来の目的を果たせない。このために、図16Aないし図16Fの係数をさらに高い圧縮率のために調整できる。
例えば、フィルタ係数全体の絶対値のサイズを小さくし、フィルタの中央に位置している係数にさらに大きい加重値を乗じることができる。図16Bの1/2補間位置のピクセル値を生成するための6−タップフィルタを例として挙げれば、{11,−43,160,160,−43,11,}で“11”、“−43”及び“160”の絶対値のサイズが小さくなるように係数を調整し、中央に位置している“160”のみに加重値を乗じることでフィルタ係数を調整できる。
図17Aないし図17Yは、本発明の一実施形態による最適化された1次元補間フィルタを示す。
図16Aないし図16Fに示したフィルタをハードウェア具現に好適に調整することもできる。コンピュータで数式(17)または(18)の計算を行う時、算術計算、すなわち、2進数のビットシフト及び加算が最小化されるようにフィルタ係数を最適化できる。
図17A及び図17Bを参照すれば、それぞれのフィルタに対して補間のためのフィルタリングを行う時、必要な計算量が“adding”及び“shift”と図示されている。図17Aないし図17Mのフィルタは、該当補間位置で“adding”及び“shift”が最小化するように最適化された係数を含む。
図17A及び図17Bは、8ビットoffsetによってスケーリングされた1/4ピクセルの正確度で映像を補間するための、最適化された6タップフィルタ及び12タップフィルタを示す。図17C、図17D及び図17Eは、8ビットoffsetによってスケーリングされた1/4ピクセルの正確度で映像を補間するための8タップフィルタを示す。図17C、図17D及び図17Eのフィルタは、フィルタ係数の最適化如何及び/または最適化方法によって区分される。図17F及び図17Gは、6ビットoffsetによってスケーリングされた1/4ピクセルの正確度で補間するための8タップフィルタを示す。図17F及び図17Gのフィルタは、フィルタ係数の最適化方法によって区分される。
図17Hは、6ビットoffsetによってスケーリングされた1/8ピクセルの正確度で映像を補間するための、最適化された6タップフィルタを示す。図17Iは、8ビットoffsetによってスケーリングされた1/8ピクセルの正確度で映像を補間するための、最適化された6タップフィルタを示す。
図17J及び図17Kは、5ビットoffsetによってスケーリングされた1/8ピクセルの正確度で映像を補間するための、最適化された4タップフィルタを示す。図17J及び図17Kのフィルタは、フィルタ係数の最適化方法によって区分される。図17L及び図17Mは、8ビットoffsetによってスケーリングされた1/8ピクセルの正確度で映像を補間するための最適化された4タップフィルタを示す。図17L及び図17Mのフィルタも、フィルタ係数の最適化方法によって区分される。
図17N及び図17Yは、8ビットoffsetによってスケーリングされた1/8ピクセルの正確度で映像を補間するための、最適化された4タップフィルタ、6タップフィルタ、8タップフィルタ、10タップフィルタ及び12タップフィルタを示す。図17Aないし図17Mに図示されたフィルタに比べれば、フィルタ係数のうち一部の値が異なるだけであり、1/8補間位置を補間するためのフィルタの係数と7/8補間位置を補間するためのフィルタの係数とが互いに対称であり、2/8補間位置を補間するためのフィルタの係数と6/8補間位置を補間するためのフィルタの係数とが互いに対称であり、3/8補間位置を補間するためのフィルタの係数と5/8補間位置を補間するためのフィルタの係数とが互いに対称であるという点は同一である。
図23Aないし図23Eは、本発明の一実施形態による1次元補間フィルタのスケーリング及び四捨五入方法を示す。
前述したように、補間フィルタリング方法は離散コサイン変換及び逆変換を用いるため、1次元補間フィルタは、絶対値が1以下のフィルタ係数を含む。したがって、数式(12)に関して前述したように、2ScalingBitsほど乗じてフィルタ係数をスケーリングし、スケーリングされた係数を四捨五入して整数にした後、補間に用いる。
図23Aは、2ScalingBitsによってスケーリングされたフィルタ係数を示す。12タップフィルタである場合を図示し、スケーリングされただけであり、まだ整数に四捨五入されていない係数を含む。
図23Aのスケーリングされたフィルタ係数を小数点の第1桁で四捨五入して整数にすれば、図23Bに示した通りである。図23Bの補間フィルタを検討すれば、スケーリング後に四捨五入されたフィルタ係数の和が256にならないフィルタがある。1/8補間位置のピクセル値を補間するためのフィルタ、3/8補間位置のピクセル値を補間するためのフィルタ、5/8補間位置のピクセル値を補間するためのフィルタ及び7/8補間位置のピクセル値を補間するためのフィルタのフィルタ係数をいずれも加えれば、256にならない。8ビットScalingBitsによってスケーリングされたフィルタのフィルタ係数の和は、256にならねばならないのにもかかわらず、フィルタ係数を四捨五入する過程で誤差が発生する。
フィルタ係数の和が一定でないのは、補間位置によってピクセル値のサイズが異なることを意味し、これを解決するために、フィルタ係数を調整して正規化したフィルタを生成できる。図23Bのフィルタのフィルタ係数を調整して生成された正規化されたフィルタは、図23Cに図示される。
図23Bと図23Cとを比較すれば、1/8補間位置のピクセル値を補間するためのフィルタ、3/8補間位置のピクセル値を補間するためのフィルタ、5/8補間位置のピクセル値を補間するためのフィルタ及び7/8補間位置のピクセル値を補間するためのフィルタのフィルタ係数のうち一部を調整して、全体フィルタ係数の和が256に正規化されたことが分かる。
図23D及び図23Eは、8タップフィルタに対するスケーリングされたフィルタ及び正規化されたフィルタを示す。2ScalingBitsによってスケーリングされた8タップフィルタが図23Dと同一である時、図23Dに図示された8タップフィルタを小数点の第1桁で四捨五入した後、全体フィルタ係数の和が256になるように正規化したフィルタは、図23Eに示した通りである。図23Eに示したところによれば、一部のフィルタ係数が図23Dに示した8タップフィルタのフィルタ係数を四捨五入した値と異なるということが分かる。全体フィルタ係数の和が256になるように一部のフィルタ係数を調整したからである。
図23B及び図23Cに示したように、スケーリング及び/または四捨五入によって少なくとも一つのフィルタ係数が異なるところ、図16Aないし図16Fまたは図17Aないし図17Yに示したフィルタで、少なくとも一つのフィルタ係数が所定の誤差範囲(例えば、±1または±2)内で異なる1次元補間フィルタも本発明の範囲に含まれるということは、当業者ならば容易に分かるであろう。
フィルタ選択部1410が、補間位置に基づいて、図16Aないし図16Fまたは図17Aないし図17Yのフィルタのうち一つを選択すれば、補間部1420は、数式(17)または(18)を計算して補間位置のピクセル値を生成する。フィルタ選択部1410がフィルタを選択するに当って、補間位置以外に他の要素、例えば、インター予測の方向、ループフィルタタイプ、ブロック内のピクセル位置などの要素も考慮できる。補間されるブロックのサイズによって異なるサイズ(すなわち、異なるタップ)のフィルタを選択してもよく、補間のためのフィルタリングの方向によって、異なるサイズのフィルタを選択してもよい。例えば、補間されるブロックが大きければ、サイズの大きいフィルタを選択してもよく、垂直方向に補間する場合には、メモリ接近を最小化するために、サイズの小さなフィルタのフィルタを選択してもよい。
実施形態によってフィルタの選択に関する情報が別途に符号化される。例えば、映像補間が映像の符号化過程で行われる場合には、いかなるフィルタを用いて補間したかを復号化する側で知っていて初めて、符号化過程で用いられたフィルタと同じフィルタを用いて映像を補間し、復号化できる。このために、補間に用いられたフィルタを特定できる情報が映像とともに符号化されてもよい。但し、フィルタの選択が以前の符号化結果、すなわち、コンテキストに基づいて行われる場合には、フィルタ選択に関する情報を別途に符号化する必要がない。
補間結果として生成されたピクセル値がピクセル値の最小値より小さいか、または最大値より大きければ、最小値または最大値に調整する。例えば、補間結果として生成されたピクセル値が最小値である“0”より小さければ“0”に調整し、最大値である“255”より大きければ“255”に調整する。
映像の符号化過程でインター予測をさらに正確に行うために補間を行う場合には、補間フィルタを特定するための情報も共に符号化されうる。言い換えれば、フィルタ選択部1410がいかなるフィルタを選択したかを示す情報を、映像パラメータとして映像と共に符号化できる。補間フィルタの選択は、符号化単位またはスライスまたはピクチャーごとに異なるので、フィルタ選択に関する情報も、符号化単位またはスライス単位またはピクチャー単位で、映像と共に符号化されうる。しかし、フィルタ選択が暗黙的なルールによってなされる場合には、フィルタ選択に関する情報が映像と共に符号化されなくてもよい。
補間部1420が補間を行う多様な実施形態について、図18A、図18B及び19を参照して詳細に説明する。
図18A及び図18Bは、本発明の一実施形態による1次元補間フィルタを用いた多様な方向のピクセル値を補間する方法を説明する。図18A及び図18Bを参照すれば、1次元来のピクセル値を1次元離散コサイン変換し、位相変更された複数の基底関数を用いて1次元逆離散コサイン変換するための1次元補間フィルタを用いて、多様な方向の補間位置のピクセル値を生成できる。
図18Aを参照すれば、垂直方向に隣接しているP1802とP1804との間を補間して、垂直方向の補間位置αのピクセル値P(α)を生成できる。図13に比べれば、水平方向に配列されたピクセル値1310及び1320の代りに、垂直方向に配列されたピクセル値1810及び1820を用いて補間を行うという点のみ異なるだけであり、数式(13)ないし(18)に関して前述した補間方法がそのまま適用されうる。
図18Bの実施形態も、図18Aの実施形態と同様に、水平方向に配列されたピクセル値1310及び1320の代りに、対角方向に配列されたピクセル値1840及び1850を用いるという点のみ異なるだけであり、隣接している2つのピクセル値1832及び1834の間を補間して補間位置αのピクセル値1830を生成する方法は、数式(13)ないし(18)に関して前述した補間方法と同一である。
図19Aは、本発明の一実施形態による2次元補間方法を説明するための図面である。図19Aを参照すれば、整数ピクセル単位のピクセル値1900ないし1906に基づいて、分数ピクセル単位のピクセル値1910ないし1950が生成される。
先ず、映像補間装置1400のフィルタ選択部1410は、整数ピクセル単位のピクセル値1900ないし1906の間に存在する分数ピクセル単位のピクセル値1910、1920、1930及び1940を生成するための1次元補間フィルタを選択する。図14に関して前述したように、補間位置によって異なるフィルタが選択される。例えば、上部に位置している二つのピクセル値1900及び1902の間のピクセル値1910を補間するためのフィルタは、分数ピクセル単位のピクセル値1912、1914及び1916それぞれに対して異なって選択されうる。1/2ピクセル単位のピクセル値1914を生成するためのフィルタと、1/4ピクセル単位のピクセル値1912及び1916とを生成するためのフィルタとが異なる。また、同じ1/4ピクセル単位のピクセル値1912及び1916も異なるフィルタに基づいて生成される。図14に関して前述したように、それぞれの補間位置ごとに逆変換のための基底関数の位相変更程度が異なるので、補間のために選択されるフィルタも異なる。
同様に、整数ピクセル単位のピクセル値1900ないし1906の間の異なる分数ピクセル単位のピクセル値1920、1930及び1940も、補間位置によって異なって選択された1次元補間フィルタに基づいて生成される。
フィルタ選択部1410が、整数ピクセル単位のピクセル値1900ないし1906の間の分数ピクセル単位のピクセル値1910、1920、1930及び1940を生成するためのフィルタを選択すれば、補間部1420は、選択されたフィルタに基づいてそれぞれの補間位置における分数ピクセル単位のピクセル値を生成する。本発明によれば、それぞれの補間位置のピクセル値を生成するためのフィルタがあらかじめ計算されているので、すべての補間位置のピクセル値を整数ピクセル単位のピクセル値に基づいて生成できる。
言い換えれば、1/4ピクセル単位のピクセル値1912及び1916は、整数ピクセル単位のピクセル値1900及び1920に基づいて直接生成され、1/2ピクセル単位のピクセル値1914を先ず計算し、整数ピクセル単位のピクセル値1900及び1902及び1/2ピクセル単位のピクセル値1914に基づいて1/4ピクセル単位のピクセル値1912及び1916を生成する必要がない。映像補間を、ピクセル単位が低くなるにつれて順次に行う必要がないため、速い速度で映像補間を行える。
しかし、本発明の他の実施形態によれば、補間位置によって本発明による補間方法と従来技術による補間方法とを結合してもよい。例えば、1/2ピクセル単位及び1/4ピクセル単位のピクセル値は、本発明による補間フィルタを用いて、整数ピクセル単位のピクセル値1900及び1920から直接生成し、1/8ピクセル単位のピクセル値は、1/4ピクセル単位のピクセル値に、従来技術による線形補間フィルタを適用して生成してもよい。また、1/2ピクセル単位のピクセル値のみ、本発明による補間フィルタを用いて整数ピクセル単位のピクセル値1900及び1920から直接生成し、1/4ピクセル単位のピクセル値は、1/2ピクセル単位のピクセル値に、従来技術による線形補間フィルタを適用して生成し、1/8ピクセル単位のピクセル値は、1/4ピクセル単位のピクセル値に、従来技術による線形補間フィルタを適用して生成してもよい。
補間結果、整数ピクセル単位のピクセル値1900ないし1906の間の分数ピクセル単位のピクセル値1910、1920、1930及び1940がいずれも生成されれば、フィルタ選択部1410は、分数ピクセル単位のピクセル値1910、1920、1930及び1940の間を補間するための1次元補間フィルタを再び選択する。整数ピクセル単位のピクセル値1900ないし1906の間を補間するために、フィルタを選択する時と同様に、補間位置によって異なるフィルタを選択する。
補間部1420は、フィルタ選択部1410で選択されたフィルタによって、補間位置それぞれに対応する分数ピクセル単位のピクセル値1950を生成する。分数ピクセル単位のピクセル値1910、1920、1930及び1940の間の他の分数ピクセル単位のピクセル値1950が生成される。
図19Bは、本発明の一実施形態による1次元補間フィルタを用いた2次元補間方法を説明するための図面である。図19Bを参照すれば、1次元補間フィルタを用いて垂直方向補間及び水平方向補間を繰り返して行うことで、2次元補間位置のピクセル値を生成できる。
整数ピクセル単位のピクセル値REF(i,j)1960及びREF(i+1,j)1964の間を水平方向に補間してTemp(i,j)を生成する。また、REF(i,j+1)1962及びREF(i+1,j+1)1966の間を水平方向に補間してTemp(i,j+1)を生成する。次いで、Temp(i,j)及びTemp(i,j+1)の間を垂直方向に補間して2次元補間位置のP(i,j)を生成する。
1次元補間フィルタは、前述した1次元離散コサイン変換及び位相変更された複数の基底関数に基づいた1次元逆離散コサイン変換のためのフィルタでありうる。また、1次元補間フィルタは、数式(17)に関して前述したスケーリングされたフィルタでありうるが、スケーリングされたフィルタに基づいて水平及び垂直方向補間を行う場合、次の数式(21)を計算することで補間を行える。
Figure 2016187191
F’(α)及びF’(α)は、数式(18)のF’(α)に対応する。但し、垂直方向の補間位置と水平方向の補間位置とが異なるので、補間位置によって異なる1次元補間フィルタが選択される。
水平方向の補間及び垂直方向の補間を行う時に、水平補間後にStageBits1によって最初のビットシフティングが行われ、垂直補間が行われた後でStageBits2が行われる。(すなわち、TotalBits=StageBits1+StageBits2)Stage1Bits1が0に設定されるならば、最初のビットシフティングは行われない。
したがって、F’(α)のスケーリングファクターが“2bit1”であり、F’(α)のスケーリングファクターが“2bit2”である時、数式(21)の“bits”は“bits=bit1+bit2”である。また、TotalBits=‘bit1’+‘bit2’である。
図19Cは、本発明のさらに他の実施形態による1次元補間フィルタを用いた2次元補間方法を説明するための図面である。図19Cを参照すれば、1次元補間フィルタを用いて垂直方向補間及び水平方向補間を繰り返して行うことで2次元補間位置のピクセル値を生成できる。
整数ピクセル単位のピクセル値REF(i,j)1960及びREF(i,j+1)1962の間を垂直方向に補間してTemp(i,j)を生成する。また、REF(i,j+1)1964及びREF(i+1,j+1)1966の間を垂直方向に補間してTemp(i+1,j)を生成する。次いで、Temp(i,j)及びTemp(i+1,j)の間を水平方向に補間して2次元補間位置のP(i,j)を生成する。スケーリングされたフィルタに基づいて水平及び垂直方向補間を行う場合、次の数式(22)を計算することで補間を行える。
Figure 2016187191
図20は、本発明の一実施形態による映像を補間する方法を説明するためのフローチャートである。図20を参照すれば、段階2010で、本発明の一実施形態による映像補間装置900は、異なる周波数の複数の基底関数を用いて空間ドメインのピクセル値を変換する。ピクセル値は、所定のブロックに含まれた複数のピクセル値であってもよく、水平または垂直方向に配列されたピクセル値の行または列であってもよい。
変換は、2次元離散コサイン変換または1次元離散コサイン変換であり、これについて変換部910、数式(1)、(2)、(3)及び7に関して前述した。
段階2020で、映像補間装置900は、段階2010の変換に用いられた複数の基底関数の位相を変更する。α及びαによって定められる2次元補間位置またはαにより定められる1次元補間位置によって、変換に用いられた複数の基底関数の位相を変更する。
段階2030で、映像補間装置900は、段階2020で位相が変更された複数の基底関数を用いて、段階2010の変換結果として生成された複数の係数を逆変換する。段階2010で、変換結果として生成された複数の係数を逆変換して補間位置のピクセル値を生成する。
段階2010の変換が2次元離散コサイン変換であったならば、段階2030で映像補間装置900は、位相変更された複数のコサイン関数を用いて、複数の離散コサイン係数を2次元逆離散コサイン変換して2次元補間位置のピクセル値を生成する。
段階2010の変換が、ピクセル値の行または列に対する1次元離散コサイン変換であれば、段階2030で映像補間装置900は、位相変更された複数のコサイン関数を用いて複数の離散コサイン係数を1次元逆離散コサイン変換して、1次元補間位置のピクセル値を生成する。
位相変更された複数の基底関数及びこれに基づく逆変換は、逆変換部920、数式(4)、(5)、(6)及び(8)に関して前述した。
図21は、本発明の他の実施形態による映像を補間する方法を説明するためのフローチャートである。図21を参照すれば、段階2110で、本発明の一実施形態による映像補間装置1400は、変換及び位相変更された複数の基底関数に基づいた逆変換のためのフィルタを、補間位置に基づいて選択する。補間位置に基づく離散コサイン変換、及び位相変更された複数のコサイン関数に基づく逆離散コサイン変換のためのフィルタを選択する。補間されるピクセル値が所定のブロックである場合には、2次元離散コサイン変換及び2次元逆離散コサイン変換のためのフィルタをα及びαに基づいて選択し、補間されるピクセル値が行または列である場合には、1次元離散コサイン変換及び1次元逆離散コサイン変換のためのフィルタをαに基づいて選択する。図15または図16Aないし図16Fまたは図17に示したフィルタのうち一つを、補間位置に基づいて選択できる。補間位置はもとより他の要素を考慮してフィルタのサイズを選択できるということは、フィルタ選択部1410及び図17に関して前述した。
段階2120で、映像補間装置1400は、段階2110で選択されたフィルタに基づいて補間を行う。段階2110で補間位置に基づいて選択されたフィルタを用いて、空間ドメインのピクセル値をフィルタリングすることで、2次元補間位置のピクセル値または1次元補間位置のピクセル値を生成する。フィルタを用いた補間は、数式(9)ないし(19)に関して前述した。
図22は、本発明のさらに他の実施形態による映像を補間する方法を説明するためのフローチャートである。図22を参照すれば、段階2210で、映像補間装置1400は、整数ピクセル単位のピクセル値1900ないし1906の間を補間するためのフィルタを、補間位置によって異なって選択する。本発明の一実施形態による映像補間方法によれば、分数ピクセル単位のピクセル値1910、1920、1930及び1940が、整数ピクセル単位のピクセル値1900ないし1906から直接生成される。したがって、映像補間装置1400は、補間位置それぞれに対応する補間フィルタを段階2210で選択する。
段階2220で、映像補間装置1400は、段階2210で補間位置によって異なって選択されたフィルタに基づいて整数ピクセル単位のピクセル値1900ないし1906の間を補間して、少なくとも一つの分数ピクセル単位のピクセル値1910、1920、1930及び1940を生成する。
段階2230で、映像補間装置1400は、段階2220で生成された分数ピクセル単位のピクセル値1910、1920、1930及び1940の間を補間するためのフィルタを、補間位置によって異なって選択する。図19の分数ピクセル単位のピクセル値1910、1920、1930及び1940の間の他の分数ピクセル単位のピクセル値1950を生成するためのフィルタを、補間位置によって異なって選択する。
段階2240で、映像補間装置1400は、段階2230で選択されたフィルタに基づいて分数ピクセル単位のピクセル値1910、1920、1930及び1940を補間して、他の分数ピクセル単位のピクセル値1950を生成する。
以上のように、本発明はたとえ限定された実施形態及び図面によって説明されたにしても、本発明が前記の実施形態に限定されるものではなく、これは当業者ならば、これらの記載より多様な修正及び変形が可能であろう。したがって、本発明の思想は、特許請求の範囲のみによって把握されねばならず、これと均等または等価的な変形はいずれも本発明の思想の範ちゅうに属するといえる。また、本発明によるシステムは、コンピュータで読み取り可能な記録媒体にコンピュータで読み取り可能なコードとして具現できる。
例えば、本発明の例示的な実施形態による映像符号化装置、映像復号化装置、映像符号化部、映像復号化部及び映像補間装置は、図1、2、4、5、9及び14に示したような装置それぞれのユニットにカップリングされたバス、前記バスに結合された少なくとも一つのプロセッサを備える。また、命令、受信されたメッセージまたは生成されたメッセージを保存するために前記バスに結合されて、前述したような命令を行うための少なくとも一つのプロセッサにカップリングされたメモリを備える。
また、コンピュータで読み取り可能な記録媒体は、コンピュータシステムによって読み取られるデータが保存されるすべての記録装置を含む。記録媒体の例としては、ROM、RAM、CD−ROM、磁気テープ、フロッピー(登録商標)ディスク、光データ保存装置などを含む。また、コンピュータで読み取り可能な記録媒体は、ネットワークに連結されたコンピュータシステムに分散されて、分散方式でコンピュータで読み取れるコードが保存されて実行される。
以下、本願により教示される手段を例示的に列挙する。
(付記1)
映像を補間する方法において、
複数の異なるフィルタのうち、整数ピクセル単位のピクセル値間を補間するための第1フィルタを補間位置によって選択する段階と、
前記選択された第1フィルタを用いて、前記整数ピクセル単位のピクセル値間を補間して、少なくとも一つの分数ピクセル単位のピクセル値を生成する段階と、を含むことを特徴とする映像補間方法。
(付記2)
前記複数の異なるフィルタのうち、前記生成された少なくとも一つの分数ピクセル単位のピクセル値間を補間するための第2フィルタを補間位置によって選択する段階と、
前記第2フィルタを用いて、前記少なくとも一つの分数ピクセル単位のピクセル値間を補間する段階と、をさらに含むことを特徴とする付記1に記載の映像補間方法。
(付記3)
前記第1フィルタは、
異なる周波数の複数の基底関数を用いて、前記整数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする付記2に記載の映像補間方法。
(付記4)
前記第2フィルタは、
異なる周波数の複数の基底関数を用いて、前記生成された少なくとも一つの分数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする付記3に記載の映像補間方法。
(付記5)
映像を補間する装置において、
複数の異なるフィルタのうち、整数ピクセル単位のピクセル値間を補間するための第1フィルタを補間位置によって選択するフィルタ選択部と、
前記選択された第1フィルタを用いて、前記整数ピクセル単位のピクセル値間を補間して少なくとも一つの分数ピクセル単位のピクセル値を生成する補間部と、を備えることを特徴とする映像補間装置。
(付記6)
前記フィルタ選択部は、前記複数の異なるフィルタのうち、前記生成された少なくとも一つの分数ピクセル単位のピクセル値間を補間するための第2フィルタを補間位置によって選択し、
前記補間部は、前記選択された分数ピクセル単位のピクセル値間を補間するためのフィルタに基づいて、前記生成された少なくとも一つの分数ピクセル単位のピクセル値間を補間することを特徴とする付記5に記載の映像補間装置。
(付記7)
前記第1フィルタは、
異なる周波数の複数の基底関数を用いて、前記整数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする付記6に記載の映像補間装置。
(付記8)
前記第2フィルタは、
異なる周波数の複数の基底関数を用いて、前記生成された少なくとも一つの分数ピクセル単位のピクセル値を変換し、位相変更された複数の基底関数を用いて、前記変換結果として生成された複数の係数を逆変換するための空間ドメインのフィルタであることを特徴とする付記7に記載の映像補間装置。
(付記9)
付記1に記載の方法を行うためのプログラムを記録したコンピュータで読み取り可能な記録媒体。
(付記10)
前記選択されたフィルタの係数をスケーリングファクターほど乗じることで前記選択されたフィルタがスケールされ、
前記少なくとも一つの分数ピクセル単位のピクセル値を生成する段階は、前記スケールされた、選択されたフィルタを用いて、前記整数ピクセル単位のピクセル値間を補間する段階を含むことを特徴とする付記1に記載の映像補間方法。
(付記11)
前記第1フィルタを選択する段階は、
前記補間位置、及び前記整数ピクセル単位を含むブロックのサイズと、前記補間のためのフィルタリングの方向のうち少なくとも一つに基づいて、前記第1フィルタを選択する段階を含むことを特徴とする付記1に記載の映像補間方法。
特開平11−238121号公報 特開2002−152745 国際公開第2007/146574号

Claims (3)

  1. 映像補間装置が行う動き補償のために映像を補間する方法において、
    整数画素単位の第1画素値に8-タップ補間フィルタを適用して、2/4画素位置の画素値を生成する段階と、
    前記生成された2/4画素位置の画素値を利用せずに前記整数画素単位の第1画素値に補間フィルタを適用して、1/4画素位置または3/4画素位置の画素値を生成する段階と、
    整数画素単位の第2画素値に4-タップ補間フィルタを適用して、1/8または3/8画素位置の画素値を生成する段階とを含み、
    前記2/4画素位置の画素値を生成するための8-タップ補間フィルタは8つの係数で構成され、
    前記1/8画素位置または3/8画素位置の画素値を生成するための4-タップ補間フィルタは4つの係数で構成されることを特徴とする動き補償のための映像補間方法。
  2. 前記2/4-画素位置の画素値を生成する段階は、
    前記8タップ補間フィルタの係数の総和が1になりうるようにするためのスケーリングファクタを利用して、前記8タップ補間フィルタを適用して生成された画素値をスケーリングする段階を含み、
    前記スケーリングファクタは64であることを特徴とする請求項1に記載の動き補償のための映像補間方法。
  3. 整数画素単位の第1画素値に8-タップ補間フィルタを適用して2/4画素位置の画素値を生成し、前記生成された2/4画素位置の画素値を利用せずに前記整数画素単位の第1画素値に補間フィルタを適用して、1/4画素位置または3/4画素位置の画素値を生成し、整数画素単位の第2画素値に4-タップ補間フィルタを適用して、1/8または3/8画素位置の画素値を生成するプロセッサを備え、
    前記2/4画素位置の画素値を生成するための8-タップ補間フィルタは8つの係数で構成され、
    前記1/8画素位置又は3/8画素位置の画素値を生成するための4−タップ補間フィルタは4つの係数で構成されることを特徴とする動き補償のための映像補間装置。
JP2016105692A 2010-04-05 2016-05-26 映像補間方法及び映像補間装置 Pending JP2016187191A (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US32084710P 2010-04-05 2010-04-05
US61/320,847 2010-04-05
US36749810P 2010-07-26 2010-07-26
US61/367,498 2010-07-26
KR1020100095956A KR101682147B1 (ko) 2010-04-05 2010-10-01 변환 및 역변환에 기초한 보간 방법 및 장치
KR10-2010-0095956 2010-10-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013503672A Division JP2013524678A (ja) 2010-04-05 2011-04-05 変換及び逆変換に基づいた補間方法及び装置

Publications (1)

Publication Number Publication Date
JP2016187191A true JP2016187191A (ja) 2016-10-27

Family

ID=45028064

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013503672A Pending JP2013524678A (ja) 2010-04-05 2011-04-05 変換及び逆変換に基づいた補間方法及び装置
JP2016105692A Pending JP2016187191A (ja) 2010-04-05 2016-05-26 映像補間方法及び映像補間装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013503672A Pending JP2013524678A (ja) 2010-04-05 2011-04-05 変換及び逆変換に基づいた補間方法及び装置

Country Status (13)

Country Link
US (6) US8676000B2 (ja)
EP (1) EP2556675A4 (ja)
JP (2) JP2013524678A (ja)
KR (6) KR101682147B1 (ja)
CN (5) CN105955933B (ja)
AU (1) AU2011239142B2 (ja)
BR (1) BR112012025307B1 (ja)
CA (5) CA2887940C (ja)
MX (1) MX2012011646A (ja)
MY (1) MY153844A (ja)
RU (5) RU2612612C2 (ja)
WO (1) WO2011126287A2 (ja)
ZA (5) ZA201208292B (ja)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101682147B1 (ko) 2010-04-05 2016-12-05 삼성전자주식회사 변환 및 역변환에 기초한 보간 방법 및 장치
EP2592833A4 (en) * 2010-07-09 2014-12-03 Samsung Electronics Co Ltd IMAGE INTERPOLATION METHOD AND APPARATUS
US8848779B2 (en) * 2010-07-15 2014-09-30 Sharp Laboratories Of America, Inc. Method of parallel video coding based on block size
US8873617B2 (en) * 2010-07-15 2014-10-28 Sharp Laboratories Of America, Inc. Method of parallel video coding based on same sized blocks
US8855188B2 (en) * 2010-07-15 2014-10-07 Sharp Laboratories Of America, Inc. Method of parallel video coding based on mapping
US9172972B2 (en) 2011-01-05 2015-10-27 Qualcomm Incorporated Low complexity interpolation filtering with adaptive tap size
EP4425925A2 (en) 2011-01-07 2024-09-04 Nokia Technologies Oy Motion prediction in video coding
US9049454B2 (en) 2011-01-19 2015-06-02 Google Technology Holdings Llc. High efficiency low complexity interpolation filters
US20120224639A1 (en) * 2011-03-03 2012-09-06 General Instrument Corporation Method for interpolating half pixels and quarter pixels
US20120230407A1 (en) 2011-03-11 2012-09-13 General Instrument Corporation Interpolation Filter Selection Using Prediction Index
US9264725B2 (en) 2011-06-24 2016-02-16 Google Inc. Selection of phase offsets for interpolation filters for motion compensation
MX2013015056A (es) * 2011-07-01 2014-06-23 Motorola Mobility Llc Filtro de interpolacion de sub-pixel conjunto para prediccion temporal.
US8948248B2 (en) * 2011-07-21 2015-02-03 Luca Rossato Tiered signal decoding and signal reconstruction
FR2980068A1 (fr) * 2011-09-13 2013-03-15 Thomson Licensing Procede de codage et de reconstruction d'un bloc de pixels et dispositifs correspondants
AU2012200345B2 (en) * 2012-01-20 2014-05-01 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map residual coefficients of a transform unit
CN102833550A (zh) * 2012-09-03 2012-12-19 北京大学深圳研究生院 一种低复杂度的分像素插值滤波器
US20140078394A1 (en) * 2012-09-17 2014-03-20 General Instrument Corporation Selective use of chroma interpolation filters in luma interpolation process
KR101654814B1 (ko) 2012-09-28 2016-09-22 브이아이디 스케일, 인크. 비디오 코딩에서 크로마 신호 향상을 위한 교차-평면 필터링
US10291827B2 (en) * 2013-11-22 2019-05-14 Futurewei Technologies, Inc. Advanced screen content coding solution
US9463057B2 (en) * 2014-01-16 2016-10-11 Amendia, Inc. Orthopedic fastener
US10638143B2 (en) 2014-03-21 2020-04-28 Futurewei Technologies, Inc. Advanced screen content coding with improved color table and index map coding methods
US10091512B2 (en) 2014-05-23 2018-10-02 Futurewei Technologies, Inc. Advanced screen content coding with improved palette table and index map coding methods
WO2016072722A1 (ko) 2014-11-04 2016-05-12 삼성전자 주식회사 영상 특성을 반영한 보간 필터를 이용하는 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
US10200713B2 (en) * 2015-05-11 2019-02-05 Qualcomm Incorporated Search region determination for inter coding within a particular picture of video data
EP4404572A3 (en) * 2015-07-08 2024-10-16 InterDigital Madison Patent Holdings, SAS Enhanced chroma coding using cross plane filtering
CN105427258B (zh) * 2015-11-25 2018-09-14 惠州Tcl移动通信有限公司 圆形图案显示平滑的优化处理方法、系统及智能设备
US10009622B1 (en) 2015-12-15 2018-06-26 Google Llc Video coding with degradation of residuals
CN108476319A (zh) * 2016-01-11 2018-08-31 三星电子株式会社 图像编码方法和设备以及图像解码方法和设备
US11494547B2 (en) * 2016-04-13 2022-11-08 Microsoft Technology Licensing, Llc Inputting images to electronic devices
US10341659B2 (en) * 2016-10-05 2019-07-02 Qualcomm Incorporated Systems and methods of switching interpolation filters
US10728548B2 (en) * 2017-04-04 2020-07-28 Futurewei Technologies, Inc. Processing reference samples used for intra-prediction of a picture block
JP7026450B2 (ja) * 2017-04-24 2022-02-28 ソニーグループ株式会社 送信装置、送信方法、受信装置および受信方法
JP6982990B2 (ja) 2017-06-19 2021-12-17 ソニーグループ株式会社 送信装置、送信方法、受信装置および受信方法
EP3471418A1 (en) * 2017-10-12 2019-04-17 Thomson Licensing Method and apparatus for adaptive transform in video encoding and decoding
US10841610B2 (en) * 2017-10-23 2020-11-17 Avago Technologies International Sales Pte. Limited Block size dependent interpolation filter selection and mapping
BR112020008896A2 (pt) 2017-11-07 2020-10-20 Huawei Technologies Co., Ltd. filtro de interpolação para um aparelho e método de interpredição para codificação de vídeo
JP7109558B2 (ja) 2018-02-14 2022-07-29 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 適応型補間フィルタ
GB2574380A (en) * 2018-05-30 2019-12-11 Realvnc Ltd Processing image data
CN108848380B (zh) * 2018-06-20 2021-11-30 腾讯科技(深圳)有限公司 视频编码和解码方法、装置、计算机设备及存储介质
US10674151B2 (en) * 2018-07-30 2020-06-02 Intel Corporation Adaptive in-loop filtering for video coding
GB2577339A (en) * 2018-09-24 2020-03-25 Sony Corp Image data encoding and decoding
KR102584455B1 (ko) 2018-09-24 2023-10-05 후아웨이 테크놀러지 컴퍼니 리미티드 품질 최적화된 디블로킹을 수행하기 위한 이미지 처리 디바이스 및 방법
CN111083489B (zh) 2018-10-22 2024-05-14 北京字节跳动网络技术有限公司 多次迭代运动矢量细化
WO2020098643A1 (en) 2018-11-12 2020-05-22 Beijing Bytedance Network Technology Co., Ltd. Simplification of combined inter-intra prediction
KR20210089149A (ko) * 2018-11-16 2021-07-15 베이징 바이트댄스 네트워크 테크놀로지 컴퍼니, 리미티드 인터 및 인트라 통합 예측 모드 가중치
CN117319644A (zh) 2018-11-20 2023-12-29 北京字节跳动网络技术有限公司 基于部分位置的差计算
WO2020177756A1 (en) 2019-03-06 2020-09-10 Beijing Bytedance Network Technology Co., Ltd. Size dependent inter coding
CN113767623B (zh) 2019-04-16 2024-04-02 北京字节跳动网络技术有限公司 用于视频编解码的自适应环路滤波
WO2020256324A1 (ko) * 2019-06-18 2020-12-24 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN114600466A (zh) * 2019-08-29 2022-06-07 Lg电子株式会社 基于交叉分量滤波的图像编码设备和方法
EP4029254B1 (en) 2019-10-03 2023-11-15 Huawei Technologies Co., Ltd. Encoder, decoder and corresponding methods using interpolation filtering

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05507830A (ja) * 1990-06-01 1993-11-04 トムソン コンシユーマ エレクトロニクス インコーポレイテツド 2段補間システム
JPH10134175A (ja) * 1996-10-29 1998-05-22 Sony Corp 画像処理装置および方法
JP2003219426A (ja) * 2002-01-23 2003-07-31 Sony Corp 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
JP2004120732A (ja) * 2002-09-06 2004-04-15 Fujitsu Ltd 動画像符号化装置及び動画像復号装置
JP2009523336A (ja) * 2006-01-11 2009-06-18 華為技術有限公司 スケーラブルビデオ符号化における補間を実行する方法および装置

Family Cites Families (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4327177A1 (de) 1993-08-13 1995-02-16 Putzmeister Maschf Anordnung zum Öffnen und Schließen einer Verschlußkappe
US5774598A (en) * 1993-11-30 1998-06-30 Polaroid Corporation System and method for sample rate conversion of an image using discrete cosine transforms
CA2171335A1 (en) * 1993-11-30 1995-06-08 Munib A. Wober Coding methods and apparatus for scaling and filtering images using discrete cosine transforms
US5845015A (en) * 1995-10-12 1998-12-01 Sarnoff Corporation Method and apparatus for resizing images using the discrete cosine transform
US6539120B1 (en) * 1997-03-12 2003-03-25 Matsushita Electric Industrial Co., Ltd. MPEG decoder providing multiple standard output signals
JPH10322705A (ja) * 1997-05-21 1998-12-04 Sony Corp 動き検出及び動き補償予測回路
DE19730305A1 (de) * 1997-07-15 1999-01-21 Bosch Gmbh Robert Verfahren zur Erzeugung eines verbesserten Bildsignals bei der Bewegungsschätzung von Bildsequenzen, insbesondere eines Prädiktionssignals für Bewegtbilder mit bewegungskompensierender Prädiktion
JP3042459B2 (ja) * 1997-08-25 2000-05-15 日本電気株式会社 映像表示装置
JPH11238121A (ja) * 1998-02-20 1999-08-31 Dainippon Screen Mfg Co Ltd 画像補間方法および画像補間装置
US6819333B1 (en) * 2000-05-12 2004-11-16 Silicon Graphics, Inc. System and method for displaying an image using display distortion correction
GB2365646B (en) * 2000-07-31 2004-10-13 Sony Uk Ltd Image processor and method of processing images
JP2002152745A (ja) * 2000-11-13 2002-05-24 Sony Corp 画像情報変換装置及び方法
JP2002197454A (ja) * 2000-12-27 2002-07-12 Sony Corp 画像変換装置及び方法
FR2820255A1 (fr) 2001-01-26 2002-08-02 France Telecom Procedes de codage et de decodage d'images, dispositifs, systemes, signaux et applications correspondants
FR2829345B1 (fr) 2001-09-06 2003-12-12 Nextream Sa Dispositif et procede de codage d'images video par compensation de mouvement
US6950469B2 (en) * 2001-09-17 2005-09-27 Nokia Corporation Method for sub-pixel value interpolation
JP2003122338A (ja) * 2001-10-18 2003-04-25 Sony Corp 画像変換装置、画像表示装置および画像変換方法
US7110459B2 (en) 2002-04-10 2006-09-19 Microsoft Corporation Approximate bicubic filter
JP4120301B2 (ja) * 2002-04-25 2008-07-16 ソニー株式会社 画像処理装置およびその方法
MXPA05000335A (es) * 2002-07-09 2005-03-31 Nokia Corp Metodo y sistema para seleccionar tipo de filtro de interpolacion en codificacion de video.
US8300690B2 (en) * 2002-07-16 2012-10-30 Nokia Corporation Method for random access and gradual picture refresh in video coding
US20040081238A1 (en) 2002-10-25 2004-04-29 Manindra Parhy Asymmetric block shape modes for motion estimation
WO2004064406A1 (en) * 2003-01-10 2004-07-29 Thomson Licensing S.A. Defining interpolation filters for error concealment in a coded image
JP3997171B2 (ja) * 2003-03-27 2007-10-24 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像符号化方法、動画像符号化プログラム、動画像復号装置、動画像復号方法、及び動画像復号プログラム
KR100468786B1 (ko) * 2003-04-02 2005-01-29 삼성전자주식회사 방향성을 예측하고 다항식 필터로 보간을 수행하여스케일링 해상도를 높이는 보간기, 이를 구비한 스케일링장치, 및 그 방법
RU2305377C2 (ru) * 2003-05-20 2007-08-27 Корпорация "САМСУНГ ЭЛЕКТРОНИКС Ко., Лтд." Способ уменьшения искажения сжатого видеоизображения и устройство для его реализации
HUP0301368A3 (en) 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
CN100394792C (zh) * 2003-07-08 2008-06-11 皇家飞利浦电子股份有限公司 运动补偿图像信号内插单元、图像处理设备和生成内插图像的方法
US7515072B2 (en) * 2003-09-25 2009-04-07 International Rectifier Corporation Method and apparatus for converting PCM to PWM
CN1216495C (zh) * 2003-09-27 2005-08-24 浙江大学 视频图像亚像素插值的方法和装置
CN1256849C (zh) * 2003-11-04 2006-05-17 浙江大学 1/4像素精度插值的方法和装置
KR20050045746A (ko) 2003-11-12 2005-05-17 삼성전자주식회사 계층 구조의 가변 블록 크기를 이용한 움직임 추정 방법및 장치
US6999105B2 (en) * 2003-12-04 2006-02-14 International Business Machines Corporation Image scaling employing horizontal partitioning
NO320114B1 (no) * 2003-12-05 2005-10-24 Tandberg Telecom As Forbedret utregning av interpolerte pixelverdier
JP2005217532A (ja) * 2004-01-27 2005-08-11 Canon Inc 解像度変換方法及び解像度変換装置
KR20050121627A (ko) 2004-06-22 2005-12-27 삼성전자주식회사 동영상 코덱의 필터링 방법 및 필터링 장치
US20050281339A1 (en) 2004-06-22 2005-12-22 Samsung Electronics Co., Ltd. Filtering method of audio-visual codec and filtering apparatus
KR20070030223A (ko) * 2004-06-23 2007-03-15 코닌클리케 필립스 일렉트로닉스 엔.브이. 픽셀 보간
US7430238B2 (en) * 2004-12-10 2008-09-30 Micronas Usa, Inc. Shared pipeline architecture for motion vector prediction and residual decoding
US7623575B2 (en) * 2005-01-05 2009-11-24 Lsi Corporation Method and apparatus for sub-pixel motion compensation
WO2006109135A2 (en) * 2005-04-11 2006-10-19 Nokia Corporation Method and apparatus for update step in video coding based on motion compensated temporal filtering
US20060285590A1 (en) 2005-06-21 2006-12-21 Docomo Communications Laboratories Usa, Inc. Nonlinear, prediction filter for hybrid video compression
DE602005012504D1 (de) * 2005-08-22 2009-03-12 Panasonic Corp Kombinierter OFDM und Wavelet Mehrträger Sende-Empfänger
JP4643454B2 (ja) 2006-01-10 2011-03-02 株式会社東芝 動画像復号装置及び動画像復号方法
KR100728031B1 (ko) 2006-01-23 2007-06-14 삼성전자주식회사 가변 블록 크기 움직임 예측을 위한 부호화 모드 결정 방법및 장치
US8644643B2 (en) * 2006-06-14 2014-02-04 Qualcomm Incorporated Convolution filtering in a graphics processor
JP4178480B2 (ja) * 2006-06-14 2008-11-12 ソニー株式会社 画像処理装置、画像処理方法、撮像装置および撮像方法
CN100551073C (zh) * 2006-12-05 2009-10-14 华为技术有限公司 编解码方法及装置、分像素插值处理方法及装置
CN101212672B (zh) * 2006-12-30 2011-01-05 安凯(广州)微电子技术有限公司 视频内容自适应的亚像素插值方法和装置
KR101369746B1 (ko) * 2007-01-22 2014-03-07 삼성전자주식회사 적응적 보간 필터를 이용한 영상 부호화, 복호화 방법 및장치
KR100842558B1 (ko) 2007-01-26 2008-07-01 삼성전자주식회사 동영상 부호화를 위한 블록 모드 결정 방법 및 그 장치
EP1983759A1 (en) * 2007-04-19 2008-10-22 Matsushita Electric Industrial Co., Ltd. Estimation of separable adaptive interpolation filters for hybrid video coding
US8023562B2 (en) 2007-09-07 2011-09-20 Vanguard Software Solutions, Inc. Real-time video coding/decoding
EP2208181A2 (en) 2007-10-05 2010-07-21 Nokia Corporation Video coding with pixel-aligned directional adaptive interpolation filters
US8090031B2 (en) * 2007-10-05 2012-01-03 Hong Kong Applied Science and Technology Research Institute Company Limited Method for motion compensation
EP2048886A1 (en) * 2007-10-11 2009-04-15 Panasonic Corporation Coding of adaptive interpolation filter coefficients
KR100952340B1 (ko) 2008-01-24 2010-04-09 에스케이 텔레콤주식회사 시공간적 복잡도를 이용한 부호화 모드 결정 방법 및 장치
JP2009182776A (ja) * 2008-01-31 2009-08-13 Hitachi Ltd 符号化装置、復号化装置、および、動画像符号化方法、動画像復号化方法
US8731062B2 (en) * 2008-02-05 2014-05-20 Ntt Docomo, Inc. Noise and/or flicker reduction in video sequences using spatial and temporal processing
KR20100105680A (ko) 2008-03-07 2010-09-29 가부시끼가이샤 도시바 동화상 부호화/복호화 방법 및 장치
US8971412B2 (en) 2008-04-10 2015-03-03 Qualcomm Incorporated Advanced interpolation techniques for motion compensation in video coding
US8831086B2 (en) 2008-04-10 2014-09-09 Qualcomm Incorporated Prediction techniques for interpolation in video coding
US8705622B2 (en) * 2008-04-10 2014-04-22 Qualcomm Incorporated Interpolation filter support for sub-pixel resolution in video coding
KR101517768B1 (ko) 2008-07-02 2015-05-06 삼성전자주식회사 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101530549B1 (ko) 2008-10-10 2015-06-29 삼성전자주식회사 적응적 1차원 필터 세트를 이용한 영상 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20110017719A (ko) * 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
KR101750046B1 (ko) 2010-04-05 2017-06-22 삼성전자주식회사 트리 구조에 따른 부호화 단위에 기반한 인루프 필터링을 수반하는 비디오 부호화 방법과 그 장치 및 복호화 방법과 그 장치
KR101682147B1 (ko) * 2010-04-05 2016-12-05 삼성전자주식회사 변환 및 역변환에 기초한 보간 방법 및 장치
CN105049844B (zh) * 2010-09-30 2017-07-28 三星电子株式会社 通过使用平滑插值滤波器对图像进行插值的方法和装置
CN102833550A (zh) * 2012-09-03 2012-12-19 北京大学深圳研究生院 一种低复杂度的分像素插值滤波器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05507830A (ja) * 1990-06-01 1993-11-04 トムソン コンシユーマ エレクトロニクス インコーポレイテツド 2段補間システム
JPH10134175A (ja) * 1996-10-29 1998-05-22 Sony Corp 画像処理装置および方法
JP2003219426A (ja) * 2002-01-23 2003-07-31 Sony Corp 画像情報符号化装置及び方法、画像情報復号装置及び方法、並びにプログラム
JP2004120732A (ja) * 2002-09-06 2004-04-15 Fujitsu Ltd 動画像符号化装置及び動画像復号装置
JP2009523336A (ja) * 2006-01-11 2009-06-18 華為技術有限公司 スケーラブルビデオ符号化における補間を実行する方法および装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ELENA ALSHINA ET AL., "CE3: EXPERIMENTAL RESULTS OF DCTIF BY SAMSUNG, JPN6017030911, 20 January 2011 (2011-01-20), ISSN: 0003764156 *
ELENA ALSHINA ET AL., EXPERIMENTAL RESULTS OF 4 TAPS/5 BITS CHROMA DCTIF IN HM2.0, JPN6017030912, 16 March 2011 (2011-03-16), ISSN: 0003764157 *

Also Published As

Publication number Publication date
CA2887944C (en) 2017-03-21
RU2580057C2 (ru) 2016-04-10
KR20110112176A (ko) 2011-10-12
RU2612613C2 (ru) 2017-03-09
CA2887940C (en) 2017-09-05
CN105955933B (zh) 2018-12-07
ZA201600681B (en) 2016-11-30
CN105955933A (zh) 2016-09-21
KR20150035936A (ko) 2015-04-07
US9424625B2 (en) 2016-08-23
CA2887940A1 (en) 2011-10-13
ZA201600680B (en) 2016-11-30
CA2887944A1 (en) 2011-10-13
CA2795626A1 (en) 2011-10-13
RU2015116169A (ru) 2015-09-20
ZA201600679B (en) 2016-11-30
AU2011239142A1 (en) 2012-11-01
EP2556675A4 (en) 2015-08-26
MY153844A (en) 2015-03-31
BR112012025307A2 (ja) 2017-09-12
RU2015116279A (ru) 2015-09-10
KR20150035938A (ko) 2015-04-07
RU2612611C2 (ru) 2017-03-09
ZA201208292B (en) 2016-09-28
WO2011126287A3 (en) 2012-01-26
CA2887941A1 (en) 2011-10-13
MX2012011646A (es) 2012-11-29
CA2887942C (en) 2017-03-21
RU2015116277A (ru) 2015-09-10
RU2612614C2 (ru) 2017-03-09
EP2556675A2 (en) 2013-02-13
US20150178891A1 (en) 2015-06-25
US20140198996A1 (en) 2014-07-17
US20150178892A1 (en) 2015-06-25
KR101682147B1 (ko) 2016-12-05
RU2612612C2 (ru) 2017-03-09
CN102939760A (zh) 2013-02-20
CN105959698B (zh) 2019-03-12
CN106131566B (zh) 2019-06-14
US9547886B2 (en) 2017-01-17
RU2015116285A (ru) 2015-09-20
US20150178893A1 (en) 2015-06-25
WO2011126287A2 (en) 2011-10-13
KR101682149B1 (ko) 2016-12-02
US9390470B2 (en) 2016-07-12
US9436975B2 (en) 2016-09-06
CN105959698A (zh) 2016-09-21
CN106231310A (zh) 2016-12-14
KR20150035937A (ko) 2015-04-07
CN102939760B (zh) 2016-08-17
CA2887941C (en) 2017-03-21
US20110243471A1 (en) 2011-10-06
CA2887942A1 (en) 2011-10-13
CN106231310B (zh) 2019-08-13
KR101682148B1 (ko) 2016-12-02
CA2795626C (en) 2017-02-14
ZA201600703B (en) 2016-11-30
US8676000B2 (en) 2014-03-18
US20150178890A1 (en) 2015-06-25
JP2013524678A (ja) 2013-06-17
CN106131566A (zh) 2016-11-16
KR101682151B1 (ko) 2016-12-02
AU2011239142B2 (en) 2015-07-02
RU2012146739A (ru) 2014-07-10
KR101682150B1 (ko) 2016-12-02
US9262804B2 (en) 2016-02-16
KR20150035939A (ko) 2015-04-07
BR112012025307B1 (pt) 2022-01-11
KR101682152B1 (ko) 2016-12-02
KR20150035940A (ko) 2015-04-07

Similar Documents

Publication Publication Date Title
JP2016187191A (ja) 映像補間方法及び映像補間装置
JP6114420B2 (ja) 非対称形の補間フィルタを利用して、映像を補間する方法及びその装置
JP5890520B2 (ja) 画像の輝度成分を用いて画像の色差成分を予測する方法及び予測装置
US9317896B2 (en) Image interpolation method and apparatus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170328

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170628

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170822

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20171122

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20180327