WO2016064185A1 - 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치 - Google Patents

최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치 Download PDF

Info

Publication number
WO2016064185A1
WO2016064185A1 PCT/KR2015/011137 KR2015011137W WO2016064185A1 WO 2016064185 A1 WO2016064185 A1 WO 2016064185A1 KR 2015011137 W KR2015011137 W KR 2015011137W WO 2016064185 A1 WO2016064185 A1 WO 2016064185A1
Authority
WO
WIPO (PCT)
Prior art keywords
graph
signal
prediction
vector
transform
Prior art date
Application number
PCT/KR2015/011137
Other languages
English (en)
French (fr)
Inventor
새드아미르
흐슈안 챠오융
에네스 에길메즈힐라미
Original Assignee
엘지전자(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자(주) filed Critical 엘지전자(주)
Priority to KR1020167036419A priority Critical patent/KR101901355B1/ko
Priority to CN201580064109.4A priority patent/CN107005712B/zh
Priority to EP15853353.9A priority patent/EP3211894B1/en
Priority to JP2017522065A priority patent/JP6356912B2/ja
Priority to US15/520,968 priority patent/US10425649B2/en
Publication of WO2016064185A1 publication Critical patent/WO2016064185A1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45CPURSES; LUGGAGE; HAND CARRIED BAGS
    • A45C11/00Receptacles for purposes not provided for in groups A45C1/00-A45C9/00
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45CPURSES; LUGGAGE; HAND CARRIED BAGS
    • A45C13/00Details; Accessories
    • A45C13/10Arrangement of fasteners
    • A45C13/1069Arrangement of fasteners magnetic
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45FTRAVELLING OR CAMP EQUIPMENT: SACKS OR PACKS CARRIED ON THE BODY
    • A45F5/00Holders or carriers for hand articles; Holders or carriers for use while travelling or camping
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/107Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/19Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding using optimisation based on Lagrange multipliers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/96Tree coding, e.g. quad-tree coding
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45CPURSES; LUGGAGE; HAND CARRIED BAGS
    • A45C11/00Receptacles for purposes not provided for in groups A45C1/00-A45C9/00
    • A45C2011/002Receptacles for purposes not provided for in groups A45C1/00-A45C9/00 for portable handheld communication devices, e.g. mobile phone, pager, beeper, PDA, smart phone
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45FTRAVELLING OR CAMP EQUIPMENT: SACKS OR PACKS CARRIED ON THE BODY
    • A45F5/00Holders or carriers for hand articles; Holders or carriers for use while travelling or camping
    • A45F2005/008Hand articles fastened to the wrist or to the arm or to the leg
    • AHUMAN NECESSITIES
    • A45HAND OR TRAVELLING ARTICLES
    • A45FTRAVELLING OR CAMP EQUIPMENT: SACKS OR PACKS CARRIED ON THE BODY
    • A45F2200/00Details not otherwise provided for in A45F
    • A45F2200/05Holder or carrier for specific articles
    • A45F2200/0516Portable handheld communication devices, e.g. mobile phone, pager, beeper, PDA, smart phone

Definitions

  • Graphs are a form of data representation useful for describing the geometry of data in many applications. Signal processing based on these graphs can be used to generalize concepts such as sampling, filtering, Fourier transform, etc., using a graph where each signal sample represents a vertex and the relationships of the signals are represented by graph edges with positive weights. Can be. This method can be replaced by the characteristics of the graph in sampling and sequence processing by separating it from the process of acquiring the signal. Thus, more efficient graph-based signal processing methods are required in many applications as well as video compression.
  • All video coding standards include signal prediction as one of its basic elements, and its compression efficiency is strongly influenced by the accuracy and reliability of the prediction method.
  • many practical problems arise when applying tools to complex signals such as audio, images and video. For example, it is very difficult to measure model parameters reliably. This is because model parameters can vary considerably if they are from different sources or even the same source.
  • the use of prediction in compression is fundamental and has important differences from other applications.
  • many prediction methods actually used for signal compression have a problem that they are based on experimental statistics.
  • graph models have been proposed for signal processing and compression. This is because graph models can model some local signal characteristics, such as edge and discontinuity, in a way that is much more concise and more suitable for compression than that provided by general statistical figures.
  • the spectral decomposition of the Laplacian matrix of the graph provides a form of Fourier analysis that is suitable for a signal that fits the graph model.
  • the present invention seeks to provide a method for finding better predictors with low complexity when given a graph modeling the statistical correlation between variables.
  • the present invention also provides a method of defining an optimization prediction algorithm based on a linear combination of eigenvectors and a cost function based on the distribution of eigenvalues of the graph Laplacian.
  • the present invention provides a method of finding a predictive value using a convex optimization formulation and a method of using graph characteristics.
  • Graph-based signal modeling to which the present invention is applied can be a powerful tool. Specifically, the present invention can obtain an prediction value with low complexity and further improve prediction performance by providing an optimization prediction algorithm that performs graph-based prediction using an optimization function.
  • the present invention is applicable to any graph signal as well as a graph signal having a regular structure, thereby avoiding excessive overhead of the bit rate required for encoding the graph signal.
  • the present invention can improve compression efficiency by adaptively utilizing the statistical properties of the signal in other parts of the video sequence.
  • FIG. 2 is a schematic block diagram of a decoder in which decoding of a video signal is performed as an embodiment to which the present invention is applied.
  • FIG. 3 shows examples of graphs used to model statistical relationships within 8x8 blocks in a video frame according to an embodiment to which the present invention is applied.
  • FIG. 4 is an embodiment to which the present invention is applied and shows an arbitrary graph defined by signal vectors and edge weights for vertices.
  • FIG. 5 illustrates a schematic block diagram of an encoder for processing a graph-based signal as an embodiment to which the present invention is applied.
  • FIG. 6 illustrates a schematic block diagram of a decoder for processing a graph-based signal as an embodiment to which the present invention is applied.
  • FIG. 7 illustrates an internal block diagram of a graph-based transform unit according to an embodiment to which the present invention is applied.
  • FIG. 8 is a flowchart illustrating a process of obtaining an optimized prediction vector based on a graph signal according to an embodiment to which the present invention is applied.
  • FIG. 9 is a flowchart illustrating a process of decoding a video signal using graph-based prediction in an embodiment to which the present invention is applied.
  • a method of performing graph-based prediction using a graph signal comprising: obtaining a context signal; Generating a graph signal based on a graph parameter set; Obtaining a graph-based transform matrix based on the graph signal, the graph-based transform matrix including an eigenvector; Obtaining a predictive vector using the optimal transform vector calculated through the optimization function; And generating a prediction signal using the prediction vector, wherein the optimization function has the eigenvalue of the context signal, the graph Laplacian matrix, and the eigenvector as variables.
  • the present invention may further include calculating a graph Laplacian matrix based on the graph signal, wherein the graph-based transform matrix includes a spectral decomposition of the graph Laplacian matrix. spectral decomposition).
  • the optimization function is represented by an unconstrained optimization function based on a Lagrange multiplier, and the unconstrained optimization function is represented by a new M-dimensional vector. It is done.
  • the present invention includes the steps of encoding a prediction error; And transmitting the encoded prediction error.
  • the present invention also provides a method of decoding a video signal based on graph-based prediction, the method comprising: receiving the video signal including a graph parameter set and a residual signal; Obtaining a graph-based transform matrix comprising eigenvectors based on the graph parameter set; Obtaining a predictive vector using the optimal transform vector calculated through the optimization function; Generating a prediction signal using the prediction vector; And reconstructing the video signal by adding the prediction signal and the residual signal, wherein the optimization function has a eigenvalue and an eigenvector of a graph Laplacian matrix as variables. It provides a method characterized by.
  • the present invention in the apparatus for performing graph-based prediction using a graph signal, generating a graph signal based on a graph parameter set, based on the graph signal
  • a graph-based transform unit obtaining a graph-based transform matrix including an eigenvector
  • a prediction unit for obtaining a context signal obtaining a prediction vector using an optimal transform vector calculated through an optimization function, and generating a prediction signal using the prediction vector.
  • An apparatus is characterized by having the eigenvalue of the context signal, the graph Laplacian matrix, and the eigenvector as variables.
  • the graph-based transform unit calculates a graph Laplacian matrix based on the graph signal, and the graph-based transform matrix is a spectral decomposition of the graph Laplacian matrix. spectral decomposition).
  • the present invention may further include an entropy encoding unit for encoding the prediction error and transmitting the encoded prediction error.
  • the present invention provides an apparatus for decoding a video signal based on graph-based prediction, comprising: entropy decoding for receiving the video signal including a graph parameter set and a residual signal part; An inverse transform unit obtaining a graph-based transform matrix including an eigenvector based on the graph parameter set; A prediction unit obtaining a prediction vector using an optimal transform vector calculated through an optimization function and generating a prediction signal using the prediction vector; And a reconstruction unit for reconstructing the video signal by adding the prediction signal and the residual signal, wherein the optimization function includes a context signal, an eigenvalue of the graph Laplacian matrix, and the eigenvector as variables. It provides a device characterized by.
  • signals, data, samples, pictures, frames, blocks, etc. may be appropriately replaced and interpreted in each coding process.
  • the statistical characteristics of the video signal vary greatly depending on the video type or within each frame. Thus, even when using simpler statistical models or automatic learning, the present invention has the difficulty of reliably measuring continuously changing model parameters. In addition, if the model is too simple or the parameters do not reflect the actual characteristics of the signal, the prediction may not be accurate. In fact, the prediction accuracy is lower as the model complexity increases.
  • the encoder can access all the data that requires encoding. This can make a very important difference because the encoder can send side information that can improve the decoder's prediction. For example, the encoder can encode additional information about the model type and its parameters used.
  • Prediction methods used in current video coding methods rely mostly on the encoding of side information, and only very minor assumptions about statistical models, e.g. pixel copying, simple interpolation, etc. It is used.
  • geometric models are being used to represent video features such as edges, instead of using a traditional statistical distribution.
  • the video coding standard uses simple interpolation only for intra frame prediction, which selects between even pixel distribution models or constant pixel values along a set of 33 directions.
  • inter frame prediction assumes an inter-frame motion model and uses interpolation for fractional pixel motion.
  • Graph signal processing is a new approach that generalizes the most basic techniques that have been used in signal processing. Graph signal processing generalizes empirical techniques based on geometrical features that enable strong integration of image features in the prediction process. It can be combined with statistical analysis, but it is not necessary to derive a complete statistical model.
  • FIG. 1 is a schematic block diagram of an encoder in which encoding of a video signal is performed as an embodiment to which the present invention is applied.
  • the encoder 100 may include an image splitter 110, a transformer 120, a quantizer 130, an inverse quantizer 140, an inverse transformer 150, a filter 160, and a decoder. It may include a decoded picture buffer (DPB) 170, an inter predictor 180, an intra predictor 185, and an entropy encoder 190.
  • DPB decoded picture buffer
  • the image divider 110 may divide an input image (or a picture or a frame) input to the encoder 100 into one or more processing units.
  • the processing unit may be a Coding Tree Unit (CTU), a Coding Unit (CU), a Prediction Unit (PU), or a Transform Unit (TU).
  • CTU Coding Tree Unit
  • CU Coding Unit
  • PU Prediction Unit
  • TU Transform Unit
  • the terms are only used for the convenience of description of the present invention, the present invention is not limited to the definition of the terms.
  • the term coding unit is used as a unit used in encoding or decoding a video signal, but the present invention is not limited thereto and may be appropriately interpreted according to the present invention.
  • the encoder 100 may generate a residual signal by subtracting a prediction signal output from the inter predictor 180 or the intra predictor 185 from the input image signal, and generate the residual signal. Is transmitted to the converter 120.
  • the transformer 120 may generate a transform coefficient by applying a transform technique to the residual signal.
  • the conversion process may be applied to pixel blocks having the same size as the square, or may be applied to blocks of variable size rather than square.
  • the converter 120 may obtain a graph signal using a graph parameter.
  • the converter 120 may obtain a graph signal using at least one of a vertex parameter set and an edge parameter set.
  • the transform unit 120 may obtain an optimized graph-based transform kernel based on an optimization function.
  • the optimization function may be represented by an unconstrained optimization function using a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the transform unit 120 may obtain a prediction vector using an optimal transform vector calculated through the optimization function, and the prediction vector may be used to generate a prediction signal.
  • the prediction vector may be obtained based on a linear combination between an eigenvector of the graph Laplacian matrix and a cost function based on a distribution of the eigenvalues.
  • the quantization unit 130 may quantize the transform coefficients and transmit the quantized coefficients to the entropy encoding unit 190, and the entropy encoding unit 190 may entropy code the quantized signal and output the bitstream.
  • the quantized signal output from the quantization unit 130 may be used to generate a prediction signal.
  • the quantized signal may restore the residual signal by applying inverse quantization and inverse transformation through the inverse quantization unit 140 and the inverse transform unit 150 in the loop.
  • a reconstructed signal may be generated by adding the reconstructed residual signal to a prediction signal output from the inter predictor 180 or the intra predictor 185.
  • the filtering unit 160 applies filtering to the reconstruction signal and outputs it to the reproduction apparatus or transmits the decoded picture buffer to the decoding picture buffer 170.
  • the filtered signal transmitted to the decoded picture buffer 170 may be used as the reference picture in the inter predictor 180. As such, by using the filtered picture as a reference picture in the inter prediction mode, not only image quality but also encoding efficiency may be improved.
  • the decoded picture buffer 170 may store the filtered picture for use as a reference picture in the inter prediction unit 180.
  • the inter prediction unit 180 performs temporal prediction and / or spatial prediction to remove temporal redundancy and / or spatial redundancy with reference to a reconstructed picture.
  • the reference picture used to perform the prediction is a transformed signal that has been quantized and dequantized in units of blocks at the time of encoding / decoding in the previous time, blocking artifacts or ringing artifacts may exist. have.
  • the inter prediction unit 180 may interpolate the signals between pixels in sub-pixel units by applying a lowpass filter in order to solve performance degradation due to discontinuity or quantization of such signals.
  • the subpixel refers to a virtual pixel generated by applying an interpolation filter
  • the integer pixel refers to an actual pixel existing in the reconstructed picture.
  • the interpolation method linear interpolation, bi-linear interpolation, wiener filter, or the like may be applied.
  • the interpolation filter may be applied to a reconstructed picture to improve the precision of prediction.
  • the inter prediction unit 180 generates an interpolation pixel by applying an interpolation filter to integer pixels, and uses an interpolated block composed of interpolated pixels as a prediction block. You can make predictions.
  • the intra predictor 185 may predict the current block by referring to samples around the block to which current encoding is to be performed.
  • the intra prediction unit 185 may perform the following process to perform intra prediction. First, reference samples necessary for generating a prediction signal may be prepared. The prediction signal may be generated using the prepared reference sample. Then, the prediction mode is encoded. In this case, the reference sample may be prepared through reference sample padding and / or reference sample filtering. Since the reference sample has been predicted and reconstructed, there may be a quantization error. Accordingly, the reference sample filtering process may be performed for each prediction mode used for intra prediction to reduce such an error.
  • a prediction signal generated through the inter predictor 180 or the intra predictor 185 may be used to generate a reconstruction signal or to generate a residual signal.
  • FIG. 2 is a schematic block diagram of a decoder in which decoding of a video signal is performed as an embodiment to which the present invention is applied.
  • the decoder 200 may include an entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 230, a filtering unit 240, and a decoded picture buffer unit (DPB) 250. ), An inter predictor 260, and an intra predictor 265.
  • the reconstructed video signal output through the decoder 200 may be reproduced through the reproducing apparatus.
  • the decoder 200 may receive a signal output from the encoder 100 of FIG. 1, and the received signal may be entropy decoded through the entropy decoding unit 210.
  • the output signal may include a graph parameter set and prediction vector information.
  • the prediction vector information may be determined based on a linear combination between an eigenvector of the graph Laplacian matrix and a cost function based on a distribution of the eigenvalues.
  • the prediction vector information may be determined based on an optimization function having an eigenvalue and an eigenvector of the graph Laplacian matrix as variables.
  • the optimization function may be represented by an unconstrained optimization function using a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the decoder 200 may generate a prediction signal based on the prediction vector information. This may be performed by the inter prediction unit 260, but the present invention is not limited thereto.
  • the inverse quantization unit 220 obtains a transform coefficient from the entropy decoded signal using the quantization step size information.
  • the obtained transform coefficients may be applied to various embodiments described in the transform unit 120 of FIG.
  • the inverse transform unit 230 inversely transforms the transform coefficient to obtain a residual signal.
  • a reconstructed signal is generated by adding the obtained residual signal to a prediction signal output from the inter predictor 260 or the intra predictor 265.
  • the filtering unit 240 applies filtering to the reconstructed signal and outputs the filtering to the reproducing apparatus or transmits it to the decoded picture buffer unit 250.
  • the filtered signal transmitted to the decoded picture buffer unit 250 may be used as the reference picture in the inter predictor 260.
  • the embodiments described by the filtering unit 160, the inter prediction unit 180, and the intra prediction unit 185 of the encoder 100 are respectively the filtering unit 240, the inter prediction unit 260, and the decoder. The same may be applied to the intra predictor 265.
  • FIG. 3 shows examples of graphs used to model statistical relationships within 8x8 blocks in a video frame according to an embodiment to which the present invention is applied.
  • FIG. 3 illustrates an example of a graph defined as a square block of image pixels.
  • the present invention provides two embodiments of graph types that can be used for processing 8 ⁇ 8 pixel blocks in an image or video. Each pixel is associated with a graph vertex, whose value is the value of the graph vertex.
  • the graph edge may mean a line connecting graph vertices.
  • the graph edge is used to represent any form of statistical dependence in the signal, where a positive weight may indicate its strength.
  • each vertex may be connected to all other vertices, and a weight of zero may be assigned to the edges connecting the unrelated or weakly associated vertices.
  • an edge with a weight of zero may be completely removed.
  • the edges connecting the graph vertices may be preset according to signal characteristics.
  • vertices may be placed on a one-dimensional array for an audio signal, on a two-dimensional array for an image, and on a three-dimensional array for a video frame.
  • the time axis may be the third dimension.
  • the graph edge may be defined such that each vertex is connected to the four adjacent vertices nearest to it.
  • block boundaries may be handled differently.
  • each vertex may be defined to be connected to the eight adjacent vertices nearest thereto.
  • the present invention may be applicable to any graph setting.
  • Equation 1 The Laplacian matrix of the graph signal G is expressed by Equation 1 below.
  • Graph G and how the matrix is defined are not described in detail herein. It is only assumed here that the graph can be defined by some technique that takes advantage of the characteristics of the signals defined for the graph type. Therefore, in the present invention, when a graph is generated by performing signal modeling using matrices D and A, a transform kernel U may be generated as shown in Equation 2 through an eigen-decomposition process.
  • represents an eigenvalue of the graph Laplacian matrix
  • U represents an eigenvector, which may be a graph based transformation matrix
  • L represents a graph Laplacian matrix
  • the columns of the graph-based transformation matrix U contain the eigenvectors of the graph Laplacian matrix L, and the diagonal matrix is the intrinsic of the corresponding graph Laplacian matrix L. Values may be expressed as in Equation 3 below.
  • eigenvectors are not defined in a unique form, but for the purposes of the present invention, all eigenvectors are real values because the graph Laplacian matrix L is symmetric, and at least one Decomposition may be present.
  • the graph-based Fourier transform of the signal vector g in the graph signal G may be defined as in Equation 4 below.
  • h represents a transform vector
  • U T represents a transpose matrix of the graph-based transform matrix U
  • g represents a vector of the graph signal G.
  • FIG. 4 is an embodiment to which the present invention is applied and shows an arbitrary graph defined by signal vectors and edge weights for vertices.
  • a method in which a signal is defined by any graph G.
  • the graph signal is defined as each graph vertex and can be represented by the G-dimensional vector g.
  • Graph characteristics can be defined by non-negative weights on each graph edge.
  • FIG. 4 an arbitrary graph having a graph characteristic defined by a signal vector defined at its vertices and a non-negative edge weight is shown.
  • the vertex values may be divided into two sets, where the two sets may mean a signal x to be predicted and a context signal y.
  • x1, x2,... , x6 represents a signal to be predicted
  • y1, y2,... , y5 represents a context signal.
  • the signal x to be predicted may mean an original signal
  • the context signal y may mean a signal reconstructed according to a loop.
  • x and y may form a signal g in the graph model.
  • the present invention can decompose the graph signal g as shown in Equation 5 below.
  • g represents a graph signal
  • x represents a signal to be predicted
  • y represents a context signal
  • Equation 6 the graph-based transformation matrix T may be represented by Equation 6 below.
  • T represents a graph-based transformation matrix and A and M each represent a matrix.
  • Equation 4 may be rewritten as Equation 7 based on Equations 5 and 6 below.
  • Equation 7 may be written as Equation 8 below.
  • I and 0 represent an identity matrix and a zero matrix of dimensions corresponding to each matrix product.
  • FIG. 5 illustrates a schematic block diagram of an encoder for processing a graph-based signal as an embodiment to which the present invention is applied.
  • the encoder 500 to which the present invention is applied includes a graph-based transform unit 510, a quantizer 520, an inverse quantizer 530, an inverse transform unit 540, a buffer 550, and a predictor. 560, and an entropy encoding unit 570.
  • the encoder 500 receives a video signal and generates a prediction error by subtracting the predicted signal output from the predictor 560 from the video signal.
  • the generated prediction error is transmitted to the graph-based transform unit 510, and the graph-based transform unit 510 generates a transform coefficient by applying a transform scheme to the prediction error.
  • the graph-based transformation unit 510 may calculate a graph-based transformation matrix, and may perform transformation using this.
  • the graph-based converter 510 may perform the embodiments described herein.
  • the graph-based transform unit 510 may obtain an optimized graph-based transform kernel based on an optimization function.
  • the optimization function may be represented by an unconstrained optimization function using a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the graph-based transform unit 510 may obtain a prediction vector by using an optimal transform vector calculated through the optimization function, and the prediction vector may be used to generate a prediction signal.
  • the prediction vector may be obtained based on a linear combination between an eigenvector of the graph Laplacian matrix and a cost function based on a distribution of the eigenvalues.
  • the obtained prediction vector may be transmitted to the inverse transformer 540 to be inversely transformed, and the inverse transformed prediction vector may be transmitted to the predictor 56 to be used to generate a prediction signal.
  • the prediction vector may be transmitted to the entropy encoding unit 570 to be encoded.
  • Embodiments of the graph-based converter 510 may be included in the converter 120 of FIG. 1 or may be performed as a separate function block.
  • the prediction method to which the present invention is applied is described as being performed by the graph-based transform unit 510, the present invention is not limited thereto.
  • the prediction method to which the present invention is applied may be performed by a separate functional block or may be performed by the inter prediction unit 180 / prediction unit 560.
  • the present invention may be represented by a degree matrix corresponding to G (W).
  • the degree matrix is a diagonal matrix including information about the order of each vertex, and may be defined as in Equation 10 below.
  • the degree may mean the number of sides connected to one vertex.
  • Equation 12 Equation 12 below.
  • the orthogonal matrix satisfies the following equation (14).
  • the columns of the eigen matrix U include the eigenvectors of L, and the eigenvalues of L can be expressed as in Equation 15 below.
  • eigenvectors are not defined in a unique form, but for the purposes of the present invention, because L is symmetric, all eigenvectors are real values and at least one decomposition exists. Should be considered This can be applied to any matrix satisfying Equation (14).
  • the present invention may define a vector function as shown in Equation (16).
  • p (y) represents the predicted value of the M-dimensional random vector given the N-dimensional vector y.
  • the present invention can find an optimal prediction function p * (y) through an optimization function as shown in Equation 17.
  • Equation 18 shows a function measuring prediction error.
  • the present invention has a minimum squared error problem as shown in equation (19).
  • p * (y) represents the optimal prediction function
  • x represents the original signal
  • p (y) is the predicted value of the M-dimensional random vector given the N-dimensional vector y. Indicates.
  • the optimal predictor may be as shown in Equation 20 below.
  • P represents an MxN matrix and y represents an N-dimensional vector.
  • Equation 22 The optimal linear predictor matrix for the squared-error measure can be calculated as shown in Equation 22 below.
  • the present invention does not assume the actual theory of the probabilistic model, but is based on empirical observation that the high frequency components corresponding to the larger eigenvalues typically have a lower magnitude.
  • the present invention provides a method to decompose the graph-based prediction. That is, the information of the graph signal G may be used to predict y from x. This is done as follows.
  • the edge weights of the graph signal G can be determined and the graph Laplacian matrix L can be calculated.
  • spectral decomposition of the graph Laplacian matrix L may be performed to determine a vector having a transformation matrix T and an eigenvalue ⁇ .
  • Equation 24 Third, based on the spectral decomposition result, an optimal transform vector h * (y) may be calculated as shown in Equation 24 below.
  • a prediction vector p (y) may be calculated based on Equation 25 using Equation 24.
  • Equation 29 can be defined using Equation 28 below.
  • Equation 31 may be obtained by solving an unconstrained optimization problem of Equation 30 below.
  • an objective function such as Equation 32 can be defined as a quadratic function.
  • W is a semi-positive matrix based on ⁇ .
  • W can be simply defined as in Equation 33 below.
  • the present invention may implicitly consider the dependence of the matrix W based on ⁇ , and analyze the solution of the following equation (34).
  • Lagrange multipliers can be used to find the optimal solution.
  • the equations defined in Equation 27 are all linear, and the present invention may have a matrix form as in Equation 35 below.
  • Equation 40 Equation 40
  • the quadratic function may be a special case of a convex function such as
  • w k ( ⁇ k ) is a nonnegative weight and ⁇ k ⁇ 1 defines the relative increase in the penalty for the large transform value.
  • Such parameters may be chosen such that non-probable coefficients have small values.
  • the quantization unit 520 quantizes the transform coefficients generated through the above process and transmits the quantized coefficients to the entropy encoding unit 570.
  • the entropy encoding unit 570 performs entropy coding on the quantized signal and outputs an entropy coded signal.
  • the quantized signal output by the quantization unit 520 may be used to generate a prediction signal.
  • the inverse quantization unit 530 and the inverse transform unit 540 in the loop of the encoder 500 may perform inverse quantization and inverse transformation on the quantized signal so that the quantized signal is restored to a prediction error. Can be.
  • the reconstructed signal may be generated by adding the reconstructed prediction error to the prediction signal output by the prediction unit 560.
  • the buffer 550 stores the reconstructed signal for future reference by the predictor 560.
  • the prediction unit 560 may generate a prediction signal using a signal previously restored and stored in the buffer 550.
  • the present invention relates to the efficient prediction of the region in the target image using the region in the anchor image.
  • the anchor image may mean a reference image, a reference picture or a reference frame.
  • the efficiency can be determined by calculating the mean-squared error, which quantifies the rate-distortion cost or distortion in the prediction error.
  • the present invention identifies vertices and edges in a graph and proposes a method for encoding or decoding residual signal.
  • embodiments of the present invention may perform various embodiments through the graph-based converter 510.
  • the graph-based converter 510 may be included in the encoder 500 or the decoder 700.
  • FIG. 6 illustrates a schematic block diagram of a decoder for processing a graph-based signal as an embodiment to which the present invention is applied.
  • the decoder 600 of FIG. 6 receives a signal output by the encoder 500 of FIG. 5.
  • the output signal may include a graph parameter set and a residual signal.
  • a graph based transformation matrix may be obtained based on the graph parameter set, and the graph based transformation matrix may include an eigenvector.
  • the prediction vector may be obtained using an optimal transform vector, and the optimal transform vector may be calculated through an optimization function.
  • the prediction vector may be obtained based on a linear combination of a transform vector and an eigenvector, and the transform vector may be determined using a cost function based on a distribution of eigenvalues of the graph Laplacian matrix. have.
  • the optimization function may be represented by an unconstrained optimization function using a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the decoder 600 may generate a prediction signal based on the prediction vector information. This may be performed by the prediction unit 650, but the present invention is not limited thereto.
  • the entropy decoding unit 610 performs entropy decoding on the received signal.
  • the inverse quantization unit 620 obtains a transform coefficient from the entropy decoded signal based on the information on the quantization step size.
  • the inverse transform unit 630 obtains a prediction error by performing an inverse transform on the transform coefficients.
  • the inverse transform may mean an inverse transform for the graph-based transform obtained by the encoder 500.
  • the reconstructed signal is generated by adding the obtained prediction error to the prediction signal output by the prediction unit 650, which is performed by a reconstruction unit (not shown).
  • the buffer 640 stores the reconstructed signal for future reference by the predictor 650.
  • the prediction unit 650 generates a prediction signal based on a signal previously restored and stored in the buffer 640 and a prediction vector to which the present invention is applied.
  • graph-based transform obtained based on graph parameters may be used in the encoder 600 or the decoder 600.
  • FIG. 7 illustrates an internal block diagram of a graph-based transform unit according to an embodiment to which the present invention is applied.
  • the graph-based transform unit 510 includes a graph parameter extractor 511, a graph signal generator 512, a graph-based transform calculator 513, a transform performer 514, and a transform optimizer ( 515 and a graph-based predictor 516.
  • the present invention is not limited thereto, and each functional unit in the graph-based converter 510 may operate as a separate functional unit or may be included in another functional unit to operate.
  • the graph parameter extractor 511 may extract a graph parameter in a graph corresponding to the target unit of the residual signal.
  • the graph parameter may include at least one of a vertex parameter and an edge parameter.
  • the vertex parameter may include at least one of a vertex position and a vertex number
  • the edge parameter may include at least one of an edge weight value and an edge weight number.
  • the graph parameter may be defined as a predetermined number of sets.
  • the graph signal generator 512 may generate a graph signal based on the graph parameter extracted from the graph parameter extractor 511. In this case, a graph Laplacian matrix may be calculated from the graph signal.
  • the graph-based transform calculator 513 may obtain a graph-based transform matrix based on the graph parameter or the graph parameter set.
  • the graph-based transformation matrix may include an eigenvector.
  • the graph-based transformation calculator 513 may calculate a graph Laplacian matrix based on the graph parameter or the graph parameter set.
  • the graph-based transformation matrix may be obtained through spectral decomposition of the graph Laplacian matrix.
  • the transformation performer 514 may perform transformation using a graph-based transformation matrix.
  • the transform optimizer 515 may calculate an optimal transform vector through an optimization function.
  • the optimization function may be expressed as an unconstrained optimization function using a Lagrange multiplier.
  • the unconstrained optimization function may be represented by a new M-dimensional vector.
  • Equation 24 or 34 may be used as the optimization function, and the optimal transform vector may be obtained using Equation 18, Equation 25, or Equation 36. .
  • the graph-based prediction unit 516 may obtain a prediction vector by using the calculated optimal transform vector.
  • the prediction vector may be obtained based on a linear combination of transform vectors and eigenvectors, and the transform vector may be determined using a cost function based on the distribution of eigenvalues of the graph Laplacian matrix.
  • the prediction vector may be obtained by using Equation 19 or Equation 37.
  • the prediction vector may be encoded and transmitted to a decoder or derived from a decoder.
  • a transmission method for example, a vector value or a vector value difference may be transmitted, but the present invention is not limited thereto.
  • FIG. 8 is a flowchart illustrating a process of obtaining an optimized prediction vector based on a graph signal according to an embodiment to which the present invention is applied.
  • the encoder may generate a prediction signal from the received video signal, and generate a residual signal by subtracting the prediction signal from the video signal.
  • a transform is performed on the residual signal, and a graph-based transform or graph-based prediction may be performed by applying a graph-based signal processing technique.
  • a method of performing graph based prediction based on the graph signal will be described.
  • the encoder may determine a graph parameter set corresponding to the target unit of the video signal (S810). For example, at least one of a vertex parameter and an edge weight of the graph signal G may be determined.
  • the encoder may generate a graph signal based on a graph parameter set, and calculate a graph Laplacian matrix L based on the graph signal (S820).
  • the encoder may perform spectral decomposition of the graph Laplacian matrix L to determine a vector having a transform matrix T and an eigenvalue ⁇ , and obtain a graph-based transform matrix based on the spectral decomposition result. It may be (S830). In this case, the graph-based transformation matrix may include an eigenvector.
  • the encoder may obtain an optimal transform vector through an optimization function (S840).
  • Equation 24 or Equation 34 may be used as the optimization function
  • the optimal transform vector may be obtained using Equation 18, Equation 25, or Equation 36.
  • the optimization function may have a context signal, an eigenvalue and an eigenvector of the graph Laplacian matrix as variables.
  • the optimization function may be represented by an unconstrained optimization function based on a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the encoder may calculate a prediction vector using the optimal transform vector (S850).
  • the prediction vector is obtained based on a linear combination of a transform vector and the eigenvectors, and the transform vector is determined using a cost function based on a distribution of eigenvalues of the graph Laplacian matrix.
  • Equation 19 or Equation 37 may be used as a prediction function.
  • the calculated prediction vector may be used to generate a prediction signal.
  • the prediction vector may be encoded and transmitted to a decoder or derived at the decoder.
  • FIG. 9 is a flowchart illustrating a process of decoding a video signal using graph-based prediction in an embodiment to which the present invention is applied.
  • the decoder to which the present invention is applied may receive a video signal including a graph parameter set and a residual signal (S910).
  • the graph-based transformation matrix may be obtained based on the graph parameter set.
  • the residual signal may be reconstructed using the obtained graph-based transformation matrix (S930).
  • the decoder may calculate the optimal transform vector through the optimization function (S940).
  • the optimization function may have a context signal, an eigenvalue and an eigenvector of the graph Laplacian matrix as variables.
  • the optimization function may be represented by an unconstrained optimization function based on a Lagrange multiplier, and the unconstrained optimization function may be represented by a new M-dimensional vector.
  • the decoder may acquire a prediction vector using the optimal transform vector (S950). This may be performed in the prediction unit or the inverse transform unit of the decoder.
  • the prediction vector is obtained based on a linear combination of a transform vector and the eigenvectors, and the transform vector may be determined using a cost function based on the distribution of eigenvalues of the graph Laplacian matrix.
  • the decoder may generate a prediction signal based on the prediction vector (S960).
  • the decoder may reconstruct the video signal by adding the generated prediction signal and the residual signal (S970).
  • the present invention can obtain an prediction value with low complexity by further providing an optimization prediction algorithm that performs graph-based prediction using an optimization function, and further improve prediction performance.
  • the embodiments described herein may be implemented and performed on a processor, microprocessor, controller, or chip.
  • the functional units illustrated in FIGS. 1, 2, 5, 6, and 7 may be implemented by a computer, a processor, a microprocessor, a controller, or a chip.
  • the decoder and encoder to which the present invention is applied include a multimedia broadcasting transmitting and receiving device, a mobile communication terminal, a home cinema video device, a digital cinema video device, a surveillance camera, a video chat device, a real time communication device such as video communication, a mobile streaming device, Storage media, camcorders, video on demand (VoD) service providing devices, internet streaming service providing devices, three-dimensional (3D) video devices, video telephony video devices, and medical video devices Can be used for
  • the processing method to which the present invention is applied can be produced in the form of a program executed by a computer, and can be stored in a computer-readable recording medium.
  • Multimedia data having a data structure according to the present invention can also be stored in a computer-readable recording medium.
  • the computer readable recording medium includes all kinds of storage devices for storing computer readable data.
  • the computer-readable recording medium may include, for example, a Blu-ray disc (BD), a universal serial bus (USB), a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, and an optical data storage device. Can be.
  • the computer-readable recording medium also includes media embodied in the form of a carrier wave (eg, transmission over the Internet).
  • the bit stream generated by the encoding method may be stored in a computer-readable recording medium or transmitted through a wired or wireless communication network.

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Telephone Set Structure (AREA)

Abstract

본 발명은, 그래프 신호를 이용하여 그래프 기반 예측(graph-based prediction)을 수행하는 방법에 있어서, 컨텍스트 신호(context signal)를 획득하는 단계; 그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성하는 단계; 상기 그래프 신호에 기초하여 그래프 기반 변환 행렬(graph-based transform matrix)을 획득하는 단계, 상기 그래프 기반 변환 행렬은 고유 벡터(eigenvector)를 포함함; 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하는 단계; 및 상기 예측 벡터를 이용하여 예측 신호를 생성하는 단계를 포함하되, 상기 최적화 함수는 상기 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 방법을 제공한다.

Description

최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치
본 발명은 그래프 기반의 신호 처리 방법 및 장치에 관한 것이며, 보다 상세하게는, 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 기술에 관한 것이다.
종래의 이산 시간 신호 처리 기술은 대부분 아날로그 신호의 처리 및 필터링으로부터 진화해오고 있지만, 정규적으로 조직된 데이터의 샘플링과 같이 몇 가지 공통적인 가정으로 인해 제한되어 왔다. 비디오 압축 분야는 기본적으로 동일한 가정에 기반하고 있으며, 단지 다차원적 신호의 처리로 일반화되었을 뿐이다.
그래프는 많은 응용 분야에 있어서 데이터의 기하학적 구조를 기술하는데 유용한 데이터 표현 형태이다. 이러한 그래프에 기반한 신호 처리는 각 신호 샘플이 꼭지점(vertex)을 나타내며 신호의 관계들이 양의 가중치를 가지는 그래프 에지로 나타내어지는 그래프를 사용하여 샘플링, 필터링, 푸리에(Fourier) 변환 등과 같은 개념들을 일반화할 수 있다. 이 방식은 신호를 획득하는 과정과 분리함으로써 샘플링 및 시퀀스 처리에 있어서 그래프의 특성으로 대체할 수 있다. 따라서, 보다 효율적인 그래프 기반의 신호 처리 방법이 비디오 압축 분야뿐만 아니라 많은 응용 분야에서 요구된다.
모든 비디오 코딩 표준은 그 기본 요소들 중의 하나로 신호 예측을 포함하고 있고, 그 압축 효율은 예측 방법의 정확성과 신뢰성에 의해 강한 영향을 받는다. 신호의 통계적 모델에 기초하는 신호 예측을 위한 많은 이론적인 툴들이 있다. 그러나, 오디오, 이미지, 비디오와 같은 복잡한 신호들에 툴들을 적용할 때 많은 실질적인 문제점들이 발생한다. 예를 들어, 모델 파라미터를 신뢰성있게 측정하는 것은 매우 어렵다. 왜냐하면 모델 파라미터들은 다른 소스들 또는 심지어 동일한 소스일 경우에도 상당히 바뀔 수 있기 때문이다. 중요한 것은, 압축에 있어서 예측의 이용은 기본이며 다른 어플리케이션들과 중요한 차이점을 갖는다는 것이다. 그러나, 신호의 압축을 위해 실제로 이용되는 많은 예측 방법들은 실험적인 통계에 바탕을 두고 있다는 문제점이 있다.
또한, 신호 처리 및 압축을 위해 새로운 그래프 모델들이 제안되어 왔다. 이는, 그래프 모델들이 에지 및 불연속성과 같은 일부 국소적인 신호 특성들을, 일반적인 통계적 수치에 의해 제공되는 것보다 훨씬 더 간결하고 압축에 더 적합한 방식으로 모델링할 수 있기 때문이다. 예를 들어, 그래프의 라플라시안 매트릭스의 스펙트럼 분해는 그래프 모델에 맞는 신호에 적합한 푸리에 분석의 형태를 제공한다.
따라서, 본 발명은 변수들 간의 통계적 상관관계를 모델링하는 그래프가 주어져 있을 때, 저복잡도로 보다 나은 예측자를 찾기 위한 방법을 제공하고자 한다.
본 발명은, 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법을 제공한다.
또한, 본 발명은, 그래프 라플라시안의 고유값들(eigenvalues)의 분포(distribution)에 기초한 비용 함수와 고유벡터들(eigenvectors)의 선형 결합에 기초하여 최적화 예측 알고리즘을 정의하는 방법을 제공한다.
또한, 본 발명은 컨벡스 최적화 공식(convex optimization formulation)을 이용하여 예측값을 찾는 방법 및 그래프 특성을 이용하는 방법을 제공한다.
본 발명이 적용되는 그래프 기반의 신호 모델링은 강력한 도구가 될 수 있다. 구체적으로, 본 발명은 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 최적화 예측 알고리즘을 제공함으로써 저복잡도로 예측값을 획득할 수 있고, 나아가 예측 성능을 향상시킬 수 있다.
또한, 본 발명은 규칙적인 구조의 그래프 신호 뿐만 아니라 임의의 그래프 신호에 대해서도 적용가능함으로써, 그래프 신호를 인코딩하기 위해 필요한 비트 레이트의 과도한 오버헤드를 피할 수 있다.
또한, 본 발명은 비디오 시퀀스의 다른 부분들에서 신호의 통계적 특성을 적응적으로 이용함으로써 압축 효율을 향상시킬 수 있다.
도 1은 본 발명이 적용되는 실시예로서, 비디오 신호의 인코딩이 수행되는 인코더의 개략적인 블록도를 나타낸다.
도 2는 본 발명이 적용되는 실시예로서, 비디오 신호의 디코딩이 수행되는 디코더의 개략적인 블록도를 나타낸다.
도 3은 본 발명이 적용되는 일 실시예에 따라 비디오 프레임 내 8×8 블록 내에서의 통계적 관계를 모델링하기 위해 사용된 그래프의 예들을 나타낸다.
도 4는 본 발명이 적용되는 일 실시예로써, 꼭지점에 대한 신호 벡터와 에지 가중치로 정의된 임의의 그래프를 나타낸다.
도 5는 본 발명이 적용되는 실시예로서, 그래프 기반의 신호를 처리하는 인코더의 개략적 블록도를 예시한다.
도 6은 본 발명이 적용되는 실시예로서, 그래프 기반의 신호를 처리하는 디코더의 개략적 블록도를 예시한다.
도 7은 본 발명이 적용되는 일실시예로서, 그래프 기반 변환부의 내부 블록도를 나타낸다.
도 8은 본 발명이 적용되는 일실시예로, 그래프 신호에 기초하여 최적화된 예측 벡터를 획득하는 과정을 설명하기 위한 흐름도이다.
도 9는 본 발명이 적용되는 일실시예로, 그래프 기반 예측을 이용하여 비디오 신호를 디코딩하는 과정을 설명하기 위한 흐름도이다.
본 발명은, 그래프 신호를 이용하여 그래프 기반 예측(graph-based prediction)을 수행하는 방법에 있어서, 컨텍스트 신호(context signal)를 획득하는 단계; 그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성하는 단계; 상기 그래프 신호에 기초하여 그래프 기반 변환 행렬(graph-based transform matrix)을 획득하는 단계, 상기 그래프 기반 변환 행렬은 고유 벡터(eigenvector)를 포함함; 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하는 단계; 및 상기 예측 벡터를 이용하여 예측 신호를 생성하는 단계를 포함하되, 상기 최적화 함수는 상기 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 방법을 제공한다.
또한, 본 발명에서, 상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고, 상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정되는 것을 특징으로 한다.
또한, 본 발명은, 상기 그래프 신호에 기초하여 그래프 라플라시안 행렬(graph Laplacian matrix)을 산출하는 단계를 더 포함하고, 상기 그래프 기반 변환 행렬(graph-based transform matrix)은 상기 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득되는 것을 특징으로 한다.
또한, 본 발명에서, 상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현되는 것을 특징으로 한다.
또한, 본 발명은, 예측 에러를 인코딩하는 단계; 및 상기 인코딩된 예측 에러를 전송하는 단계를 더 포함하는 것을 특징으로 한다.
또한, 본 발명은, 그래프 기반 예측(graph-based prediction)에 기초하여 비디오 신호를 디코딩하는 방법에 있어서, 그래프 파라미터 셋(graph parameter set)과 레지듀얼 신호를 포함하는 상기 비디오 신호를 수신하는 단계; 상기 그래프 파라미터 셋에 기초하여 고유 벡터를 포함하는 그래프 기반 변환 행렬을 획득하는 단계; 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하는 단계; 상기 예측 벡터를 이용하여 예측 신호를 생성하는 단계; 및 상기 예측 신호와 상기 레지듀얼 신호를 합하여 상기 비디오 신호를 복원하는 단계를 포함하되, 상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 방법을 제공한다.
또한, 본 발명은, 그래프 신호를 이용하여 그래프 기반 예측(graph-based prediction)을 수행하는 장치에 있어서, 그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성하고, 상기 그래프 신호에 기초하여 고유 벡터(eigenvector)를 포함하는 그래프 기반 변환 행렬(graph-based transform matrix)을 획득하는 그래프 기반 변환부; 및 컨텍스트 신호(context signal)를 획득하고, 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하고, 상기 예측 벡터를 이용하여 예측 신호를 생성하는 예측부를 포함하되, 상기 최적화 함수는 상기 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 장치를 제공한다.
또한, 본 발명에서, 상기 그래프 기반 변환부는 상기 그래프 신호에 기초하여 그래프 라플라시안 행렬(graph Laplacian matrix)을 산출하고, 상기 그래프 기반 변환 행렬(graph-based transform matrix)은 상기 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득되는 것을 특징으로 한다.
또한, 본 발명은, 예측 에러를 인코딩하고, 상기 인코딩된 예측 에러를 전송하는 엔트로피 인코딩부를 더 포함하는 것을 특징으로 한다.
또한, 본 발명은, 그래프 기반 예측(graph-based prediction)에 기초하여 비디오 신호를 디코딩하는 장치에 있어서, 그래프 파라미터 셋(graph parameter set)과 레지듀얼 신호를 포함하는 상기 비디오 신호를 수신하는 엔트로피 디코딩부; 상기 그래프 파라미터 셋에 기초하여 고유 벡터를 포함하는 그래프 기반 변환 행렬을 획득하는 역변환부; 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하고, 상기 예측 벡터를 이용하여 예측 신호를 생성하는 예측부; 및 상기 예측 신호와 상기 레지듀얼 신호를 합하여 상기 비디오 신호를 복원하는 복원부를 포함하되, 상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 장치를 제공한다.
이하, 첨부된 도면을 참조하여 본 발명의 실시예의 구성과 그 작용을 설명하며, 도면에 의해서 설명되는 본 발명의 구성과 작용은 하나의 실시예로서 설명되는 것이며, 이것에 의해서 본 발명의 기술적 사상과 그 핵심 구성 및 작용이 제한되지는 않는다.
아울러, 본 발명에서 사용되는 용어는 가능한 한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 특정한 경우는 출원인이 임의로 선정한 용어를 사용하여 설명한다. 그러한 경우에는 해당 부분의 상세 설명에서 그 의미를 명확히 기재하므로, 본 발명의 설명에서 사용된 용어의 명칭만으로 단순 해석되어서는 안 될 것이며 그 해당 용어의 의미까지 파악하여 해석되어야 함을 밝혀두고자 한다.
또한, 본 명세서에서 제시된 실시예들이 비디오 신호 처리에 관한 것이지만, 본 발명은 비디오 신호 처리에만 기반한 것으로 추론되어서는 안 되며, 일반적인 그래프 기반의 신호 처리 방법에도 적용될 수 있을 것이다.
또한, 본 발명에서 사용되는 용어들은 발명을 설명하기 위해 선택된 일반적인 용어들이나, 유사한 의미를 갖는 다른 용어가 있는 경우 보다 적절한 해석을 위해 대체 가능할 것이다. 예를 들어, 신호, 데이터, 샘플, 픽쳐, 프레임, 블록 등의 경우 각 코딩 과정에서 적절하게 대체되어 해석될 수 있을 것이다.
실제로, 비디오와 같이 아주 복잡하고 다양한 신호의 정확한 통계적 모델은 없다. 따라서, 본 명세서에서는 통계 모델을 형성하는 확률 분포 f(x|y) 또는 f(x, y)는 이미 알고 있다는 가정에 기초한다.
비디오 신호의 통계적 특성은 비디오 타입에 따라, 또는 각 프레임 내에서 크게 변한다. 그래서, 보다 단순한 통계적 모델이나 자동 학습(automatic learning)을 이용할 때 조차도, 본 발명은 계속적으로 변하는 모델 파라미터들을 신뢰성 있게 측정하는 어려움이 있다. 또한, 모델이 너무 간단하거나, 그 파라미터들이 신호의 실제 특성을 반영하지 못한다면, 예측이 정확하지 않을 수 있다. 사실, 예측 정확도는 모델 복잡도가 증가할수록 더 낮아진다.
따라서, 본 발명은 예측 성능을 향상시키기 위한 더 강력한 접근을 필요로 한다.
압축에 적용되는 예측과 관련된 또 다른 중요한 이슈는, 전통적인 통계적 접근과 다르게, 인코더가 인코딩을 필요로 하는 모든 데이터에 접근할 수 있다는 것이다. 인코더는 디코더의 예측을 향상시킬 수 있는 부가 정보를 전송할 수 있기 때문에 이는 매우 중요한 차이를 만들 수 있다. 예를 들어, 인코더는 이용되는 모델 타입과 그 파라미터에 대한 부가 정보를 인코딩 할 수 있다.
현재 비디오 코딩 방법에 이용되는 예측 방법들은 부가 정보(side information)의 인코딩에 대부분 의존하고 있고, 통계적 모델, 예를 들어, 픽셀 복사(pixel copying), 단순 보간(simple interpolation) 등에 대한 아주 사소한 가정만을 이용하고 있다는 것이다. 게다가, 에지와 같은 비디오 특징들을 표현하기 위해, 전통적인 통계적 분포를 이용하는 대신, 기하학적 모델들이 이용되고 있다.
예를 들어, 비디오 코딩 표준은, 고른 픽셀 분포 모델 또는 33개 방향 셋에 따른 일정 픽셀 값들 사이에서 선택하는, 인트라 프레임 예측에 대해 오로지 단순 보간을 이용한다. 그리고, 인터 프레임 예측은 프레임 간 움직임 모델을 가정하고, 소수 픽셀 움직임에 대해 보간을 이용한다.
이러한 접근의 주된 문제는, 기하학적 모델이 매우 제한적이고, 현재 비디오 코딩 표준이 직선 에지 또는 움직임 변화와 같은 특징을 충분히 활용하고 있다는 점이다.
한편, 그래프 신호 처리는, 신호 처리에 이용되어 온 가장 기본적인 기술들을 일반화하는 새로운 접근 방식이다. 그래프 신호 처리는, 이미지 특징들의 강력한 통합을 예측 과정에서 가능하게 하는, 기하학적 특징들에 기초한 경험적 기술을 일반화한다. 통계적 분석과 결합될 수 있지만, 완전한 통계적 모델을 유도하여야 할 필요는 없다.
적절한 그래프 에지 가중치를 선택하는 방법은 모든 형태의 그래프 신호 처리의 핵심적인 부분임이 명확하다. 그러나, 본 명세서에서는 본 발명과 직접적으로 연관되어 있지 않기 때문에 상세히 논의하지 않을 것이다. 이하에서는, 상기에서 설명한 통계적 모델, 기하학적 모델 및 그래프 모델들이 갖는 문제점을 해결하는, 최적화 예측 방법을 설명하도록 한다.
도 1은 본 발명이 적용되는 실시예로서, 비디오 신호의 인코딩이 수행되는 인코더의 개략적인 블록도를 나타낸다.
도 1을 참조하면, 인코더(100)는 영상 분할부(110), 변환부(120), 양자화부(130), 역양자화부(140), 역변환부(150), 필터링부(160), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer)(170), 인터 예측부(180), 인트라 예측부(185) 및 엔트로피 인코딩부(190)를 포함하여 구성될 수 있다.
영상 분할부(110)는 인코더(100)에 입력된 입력 영상(Input image)(또는, 픽쳐, 프레임)를 하나 이상의 처리 유닛으로 분할할 수 있다. 예를 들어, 상기 처리 유닛은 코딩 트리 유닛(CTU: Coding Tree Unit), 코딩 유닛(CU: Coding Unit), 예측 유닛(PU: Prediction Unit) 또는 변환 유닛(TU: Transform Unit)일 수 있다.
다만, 상기 용어들은 본 발명에 대한 설명의 편의를 위해 사용할 뿐이며, 본 발명은 해당 용어의 정의에 한정되지 않는다. 또한, 본 명세서에서는 설명의 편의를 위해, 비디오 신호를 인코딩 또는 디코딩하는 과정에서 이용되는 단위로써 코딩 유닛이라는 용어를 사용하지만, 본 발명은 그에 한정되지 않으며 발명 내용에 따라 적절하게 해석 가능할 것이다.
인코더(100)는 입력 영상 신호에서 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)를 감산하여 잔여 신호(residual signal)를 생성할 수 있고, 생성된 잔여 신호는 변환부(120)로 전송된다.
변환부(120)는 잔여 신호에 변환 기법을 적용하여 변환 계수(transform coefficient)를 생성할 수 있다. 변환 과정은 정사각형의 동일한 크기를 갖는 픽셀 블록에 적용될 수도 있고, 정사각형이 아닌 가변 크기의 블록에도 적용될 수 있다.
본 발명의 일실시예로, 상기 변환부(120)는 그래프 파라미터를 이용하여 그래프 신호를 획득할 수 있다.
본 발명의 다른 일실시예로, 상기 변환부(120)는 꼭지점 파라미터 셋과 에지 파라미터 셋 중 적어도 하나를 이용하여 그래프 신호를 획득할 수 있다.
본 발명의 다른 일실시예로, 상기 변환부(120)는 최적화 함수에 기초하여 최적화된 그래프 기반 변환 커널을 획득할 수 있다. 이때, 상기 최적화 함수는 라그랑지 승수를 이용하여 비제한 최적화 함수(unconstrained optimization function)로 표현될 수 있고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
본 발명의 다른 일실시예로, 상기 변환부(120)는 상기 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득할 수 있고, 상기 예측 벡터는 예측 신호를 생성하기 위해 이용될 수 있다. 이때, 상기 예측 벡터는 상기 그래프 라플라시안 행렬의 고유 벡터(eigenvector)와 상기 고유값(eigenvalue)의 분포에 기초하는 비용 함수 간의 선형 결합에 기초하여 획득될 수 있다.
양자화부(130)는 변환 계수를 양자화하여 엔트로피 인코딩부(190)로 전송하고, 엔트로피 인코딩부(190)는 양자화된 신호(quantized signal)를 엔트로피 코딩하여 비트스트림으로 출력할 수 있다.
양자화부(130)로부터 출력된 양자화된 신호(quantized signal)는 예측 신호를 생성하기 위해 이용될 수 있다. 예를 들어, 양자화된 신호(quantized signal)는 루프 내의 역양자화부(140) 및 역변환부(150)를 통해 역양자화 및 역변환을 적용함으로써 잔여 신호를 복원할 수 있다. 복원된 잔여 신호를 인터 예측부(180) 또는 인트라 예측부(185)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성될 수 있다.
한편, 위와 같은 압축 과정에서 인접한 블록들이 서로 다른 양자화 파라미터에 의해 양자화됨으로써 블록 경계가 보이는 열화가 발생될 수 있다. 이러한 현상을 블록킹 열화(blocking artifacts)라고 하며, 이는 화질을 평가하는 중요한 요소 중의 하나이다. 이러한 열화를 줄이기 위해 필터링 과정을 수행할 수 있다. 이러한 필터링 과정을 통해 블록킹 열화를 제거함과 동시에 현재 픽쳐에 대한 오차를 줄임으로써 화질을 향상시킬 수 있게 된다.
필터링부(160)는 복원 신호에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼(170)에 전송한다. 복호 픽쳐 버퍼(170)에 전송된 필터링된 신호는 인터 예측부(180)에서 참조 픽쳐로 사용될 수 있다. 이처럼, 필터링된 픽쳐를 화면간 예측 모드에서 참조 픽쳐로 이용함으로써 화질 뿐만 아니라 부호화 효율도 향상시킬 수 있다.
복호 픽쳐 버퍼(170)는 필터링된 픽쳐를 인터 예측부(180)에서의 참조 픽쳐로 사용하기 위해 저장할 수 있다.
인터 예측부(180)는 복원 픽쳐(reconstructed picture)를 참조하여 시간적 중복성 및/또는 공간적 중복성을 제거하기 위해 시간적 예측 및/또는 공간적 예측을 수행한다. 여기서, 예측을 수행하기 위해 이용되는 참조 픽쳐는 이전 시간에 부호화/복호화 시 블록 단위로 양자화와 역양자화를 거친 변환된 신호이기 때문에, 블로킹 아티팩트(blocking artifact)나 링잉 아티팩트(ringing artifact)가 존재할 수 있다.
따라서, 인터 예측부(180)는 이러한 신호의 불연속이나 양자화로 인한 성능 저하를 해결하기 위해, 로우패스 필터(lowpass filter)를 적용함으로써 픽셀들 사이의 신호를 서브 픽셀 단위로 보간할 수 있다. 여기서, 서브 픽셀은 보간 필터를 적용하여 생성된 가상의 화소를 의미하고, 정수 픽셀은 복원된 픽쳐에 존재하는 실제 화소를 의미한다. 보간 방법으로는 선형 보간, 양선형 보간(bi-linear interpolation), 위너 필터(wiener filter) 등이 적용될 수 있다.
보간 필터는 복원 픽쳐(reconstructed picture)에 적용되어 예측의 정밀도를 향상시킬 수 있다. 예를 들어, 인터 예측부(180)는 정수 픽셀에 보간 필터를 적용하여 보간 픽셀을 생성하고, 보간 픽셀들(interpolated pixels)로 구성된 보간 블록(interpolated block)을 예측 블록(prediction block)으로 사용하여 예측을 수행할 수 있다.
인트라 예측부(185)는 현재 부호화를 진행하려고 하는 블록의 주변에 있는 샘플들을 참조하여 현재 블록을 예측할 수 있다. 상기 인트라 예측부(185)는 인트라 예측을 수행하기 위해 다음과 같은 과정을 수행할 수 있다. 먼저, 예측 신호를 생성하기 위해 필요한 참조 샘플을 준비할 수 있다. 그리고, 준비된 참조 샘플을 이용하여 예측 신호를 생성할 수 있다. 이후, 예측 모드를 부호화하게 된다. 이때, 참조 샘플은 참조 샘플 패딩 및/또는 참조 샘플 필터링을 통해 준비될 수 있다. 참조 샘플은 예측 및 복원 과정을 거쳤기 때문에 양자화 에러가 존재할 수 있다. 따라서, 이러한 에러를 줄이기 위해 인트라 예측에 이용되는 각 예측 모드에 대해 참조 샘플 필터링 과정이 수행될 수 있다.
상기 인터 예측부(180) 또는 상기 인트라 예측부(185)를 통해 생성된 예측 신호(prediction signal)는 복원 신호를 생성하기 위해 이용되거나 잔여 신호를 생성하기 위해 이용될 수 있다.
도 2는 본 발명이 적용되는 실시예로서, 비디오 신호의 디코딩이 수행되는 디코더의 개략적인 블록도를 나타낸다.
도 2를 참조하면, 디코더(200)는 엔트로피 디코딩부(210), 역양자화부(220), 역변환부(230), 필터링부(240), 복호 픽쳐 버퍼(DPB: Decoded Picture Buffer Unit)(250), 인터 예측부(260) 및 인트라 예측부(265)를 포함하여 구성될 수 있다.
그리고, 디코더(200)를 통해 출력된 복원 영상 신호(reconstructed video signal)는 재생 장치를 통해 재생될 수 있다.
디코더(200)는 도 1의 인코더(100)로부터 출력된 신호을 수신할 수 있고, 수신된 신호는 엔트로피 디코딩부(210)를 통해 엔트로피 디코딩될 수 있다. 이때, 상기 출력된 신호는 그래프 파라미터 셋(graph parameter set)과 예측 벡터 정보를 포함할 수 있다. 상기 예측 벡터 정보는 상기 그래프 라플라시안 행렬의 고유 벡터(eigenvector)와 상기 고유값(eigenvalue)의 분포에 기초하는 비용 함수 간의 선형 결합에 기초하여 결정된 것일 수 있다.
다른 예로, 상기 예측 벡터 정보는, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 고유 벡터(eigenvector)를 변수로 갖는 최적화 함수에 기초하여 결정된 것일 수 있다. 이 경우, 상기 최적화 함수는 라그랑지 승수를 이용하여 비제한 최적화 함수(unconstrained optimization function)로 표현될 수 있고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
상기 디코더(200)는 상기 예측 벡터 정보에 기초하여 예측 신호를 생성할 수 있다. 이는 인터 예측부(260)에서 수행될 수 있으나, 본 발명은 이에 한정되지 않는다.
역양자화부(220)에서는 양자화 스텝 사이즈 정보를 이용하여 엔트로피 디코딩된 신호로부터 변환 계수(transform coefficient)를 획득한다. 여기서, 획득된 변환 계수는 상기 도 1의 변환부(120)에서 설명한 다양한 실시예들이 적용된 것일 수 있다.
역변환부(230)에서는 변환 계수를 역변환하여 잔여 신호(residual signal)를 획득하게 된다.
획득된 잔여 신호를 인터 예측부(260) 또는 인트라 예측부(265)로부터 출력된 예측 신호(prediction signal)에 더함으로써 복원 신호(reconstructed signal)가 생성된다.
필터링부(240)는 복원 신호(reconstructed signal)에 필터링을 적용하여 이를 재생 장치로 출력하거나 복호 픽쳐 버퍼부(250)에 전송한다. 복호 픽쳐 버퍼부(250)에 전송된 필터링된 신호는 인터 예측부(260)에서 참조 픽쳐로 사용될 수 있다.
본 명세서에서, 인코더(100)의 필터링부(160), 인터 예측부(180) 및 인트라 예측부(185)에서 설명된 실시예들은 각각 디코더의 필터링부(240), 인터 예측부(260) 및 인트라 예측부(265)에도 동일하게 적용될 수 있다.
도 3은 본 발명이 적용되는 일 실시예에 따라 비디오 프레임 내 8×8 블록 내에서의 통계적 관계를 모델링하기 위해 사용된 그래프의 예들을 나타낸다.
상기 도 3은 이미지 픽셀의 정사각형 블록으로 정의된 그래프의 예를 나타낸다. 상기 도3을 참조하면, 본 발명은 이미지 또는 비디오 내의 8×8 픽셀 블록의 처리를 위해 사용될 수 있는 그래프 타입의 두 가지 실시예를 제공한다. 각 픽셀은 그래프 꼭지점에 연관되며, 상기 픽셀의 값은 그래프 꼭지점의 값이 된다.
그래프 에지는 그래프 꼭지점을 연결하는 선을 의미할 수 있다. 상기 그래프 에지는 신호 내의 어떠한 형태의 통계적 의존성을 나타내기 위해 사용되며, 이 때 양의 가중치는 그 강도를 나타낼 수 있다. 예를 들어, 각 꼭지점은 모든 다른 꼭지점에 연결될 수 있으며, 0의 가중치는 서로 연관되지 않거나 약하게 연관된 꼭지점들을 연결하는 에지에 할당될 수 있다. 다만, 표현의 간단화를 위해, 0의 가중치를 갖는 에지는 완전히 제거될 수 있다.
본 발명의 다른 실시예로, 그래프 꼭지점을 연결하는 에지들은 신호 특성에 따라 사전에 설정될 수 있다. 예를 들어, 꼭지점들은 오디오 신호에 대해서는 1차원 배열 상에, 이미지에 대해서는 2차원 배열 상에, 또한 비디오 프레임에 대해서는 3차원 배열 상에 배치될 수 있다. 이때, 상기 3차원 배열의 경우에는 시간 축이 3번째 차원이 될 수 있다. 예를 들어, 도 3(a)의 그래프에서, 그래프 에지는 각각의 꼭지점이 그로부터 가장 가까운 4개의 인접 꼭지점들에 연결되도록 정의될 수 있다. 다만, 블록 경계의 경우는 다르게 취급될 수 있다. 또한, 도 3(b)의 그래프에서는 각각의 꼭지점이 그로부터 가장 가까운 8개의 인접 꼭지점들에 연결되도록 정의될 수 있다.
한편, 본 발명은 어떠한 그래프 설정에도 적용 가능할 수 있다.
그래프 신호 G의 라플라시안 행렬은 다음 수학식 1과 같다.
수학식 1
Figure PCTKR2015011137-appb-M000001
여기서, D는 차수 행렬(Degree matrix)을 나타내고, 예를 들어 상기 차수 행렬은 각 꼭지점의 차수에 대한 정보를 포함하는 대각 행렬(diagonal matrix)을 의미할 수 있다. A는 인접 픽셀과의 연결 관계(edge)를 가중치로 나타내는 인접 행렬(adjacency matrix)을 나타낸다.
그래프 G 및 그 행렬이 정의되는 방법은 본 명세서에서는 상세히 설명하지 않는다. 본 명세서에서는 단지 그래프가 그래프 타입에 대해 정의된 신호들의 특성들을 이용하는 몇몇 기술로 정의될 수 있다고 가정할 뿐이다. 따라서, 본 발명은 행렬 D, A를 이용하여 신호 모델링을 수행하여 그래프를 생성하면 고유 분해(eigen-decomposition) 과정을 통해 다음 수학식 2와 같이 변환 커널 U를 생성할 수 있다.
수학식 2
Figure PCTKR2015011137-appb-M000002
여기서, Λ는 그래프 라플라시안 행렬의 고유값(eigenvalue)을 나타내고, U는 고유 벡터(eigenvector)을 나타내고, 이는 그래프 기반 변환 행렬일 수 있다. L은 그래프 라플라시안 행렬(graph Laplacian matrix)을 나타낸다.
그래프 기반 변환 행렬 U의 행들(columns)은 그래프 라플라시안 행렬(graph Laplacian matrix) L의 고유 벡터(eigenvectors)를 포함하고, 대각 행렬(diagonal matrix)은 대응되는 그래프 라플라시안 행렬(graph Laplacian matrix) L의 고유값(eigenvalues)에 대해 다음 수학식 3과 같이 표현될 수 있다.
수학식 3
Figure PCTKR2015011137-appb-M000003
일반적으로 고유 벡터(eigenvectors)는 특유의 형태로 정의되지 않지만, 본 발명의 목적에 따라, 그래프 라플라시안 행렬(graph Laplacian matrix) L이 대칭적이기 때문에 모든 고유 벡터(eigenvectors)는 실수값이고, 적어도 하나의 분해(decomposition)는 존재할 수 있다. 그래프 신호G 에서 신호 벡터g의 그래프 기반 푸리에 변환은 다음 수학식 4와 같이 정의될 수 있다.
수학식 4
Figure PCTKR2015011137-appb-M000004
여기서, h는 변환 벡터를 나타내고, UT는 그래프 기반 변환 행렬 U의 전치 행렬을 나타내며, g는 그래프 신호 G의 벡터를 나타낸다.
상기에서 설명한 그래프 신호에 대한 기본적인 정의에 기초하여, 이하에서 본 발명의 실시예들을 구체적으로 설명하도록 한다.
도 4는 본 발명이 적용되는 일 실시예로써, 꼭지점에 대한 신호 벡터와 에지 가중치로 정의된 임의의 그래프를 나타낸다.
본 발명의 일실시예에서는, 신호가 임의의 그래프 G로 정의되는 방법을 제공한다. 예를 들어, 그래프 신호는 각 그래프 꼭지점으로 정의되고, G차원 벡터 g에 의해 표현될 수 있다. 그래프 특성들은 각 그래프 에지 상의 음이 아닌 가중치들에 의해 정의될 수 있다.
상기 도 4의 경우, 그 꼭지점들에 정의된 신호 벡터와 음이 아닌 에지 가중치에 의해 정의된 그래프 특성을 가진 임의의 그래프를 나타낸다. 여기서, 꼭지점 값들은 2개의 셋으로 분할될 수 있고, 여기서 상기 2개의 셋은 예측될 신호 x와 컨텍스트 신호(context signal) y를 의미할 수 있다. 상기 도 4에서 x1, x2, …, x6는 예측될 신호를 나타내고, y1, y2, …, y5는 컨텍스트 신호(context signal)를 나타낸다. 예를 들어, 하기 도 5에서와 같이, 상기 예측될 신호 x는 원 신호를 의미할 수 있고, 컨텍스트 신호(context signal) y는 루프에 따라 복원된 신호를 의미할 수 있다.
상기 도 4에서 살펴본 바와 같이, 본 발명이 컨텍스트 신호 y로부터 신호 x를 예측하고자 한다고 가정하면, 그래프 모델에서 x와 y는 신호 g를 형성할 수 있다.
벡터 표기법에 따라, 본 발명은 그래프 신호 g를 수학식 5와 같이 분해할 수 있다.
수학식 5
Figure PCTKR2015011137-appb-M000005
여기서, g는 그래프 신호를 나타내고, x는 예측될 신호를 나타내며, y는 컨텍스트 신호를 나타낸다.
한편, 그래프 기반 변환 행렬 T는 다음 수학식 6과 같이 나타낼 수 있다.
수학식 6
Figure PCTKR2015011137-appb-M000006
여기서, T는 그래프 기반 변환 행렬을 나타내고, A 및 M은 각각 행렬을 나타낸다.
그리고, 상기 수학식 4는 상기 수학식 5 및 수학식 6에 기초하여 다음 수학식 7과 같이 다시 쓰여질 수 있다.
수학식 7
Figure PCTKR2015011137-appb-M000007
여기서, h는 G(=M+N) 차원을 갖는다.
한편, TT = T-1이므로, 상기 수학식 7은 다음 수학식 8과 같이 쓰여질 수 있다.
수학식 8
Figure PCTKR2015011137-appb-M000008
이때, 다음 수학식 9의 조건을 만족한다.
수학식 9
Figure PCTKR2015011137-appb-M000009
여기서, I 와 0은 각 행렬 산출물(matrix products)에 대응되는 차원의 자기 행렬(identity matrix) 및 제로 행렬(0 matrix)을 나타낸다.
이와 같은 정의에 기초하여, 이하에서는 본 발명의 실시예를 보다 상세히 설명하도록 한다.
도 5는 본 발명이 적용되는 실시예로서, 그래프 기반의 신호를 처리하는 인코더의 개략적 블록도를 예시한다.
상기 도 5을 살펴보면, 본 발명이 적용되는 인코더(500)는 그래프 기반 변환부(510), 양자화부(520), 역양자화부(530), 역변환부(540), 버퍼(550), 예측부(560), 및 엔트로피 인코딩부(570)을 포함한다.
인코더(500)는 비디오 신호를 수신하고 상기 비디오 신호로부터 상기 예측부(560)에서 출력된 예측된 신호를 차감하여 예측 에러를 생성한다. 상기 생성된 예측 에러는 상기 그래프 기반 변환부(510)으로 전송되고, 상기 그래프 기반 변환부(510)은 변환 방식을 상기 예측 에러에 적용함으로써 변환 계수를 생성한다. 이때, 상기 그래프 기반 변환부(510)는 그래프 기반 변환 행렬을 산출할 수 있고, 이를 이용하여 변환을 수행할 수 있다. 또한, 상기 그래프 기반 변환부(510)는 본 명세서에 기재된 실시예들을 수행할 수 있다.
본 발명이 적용되는 다른 실시예로, 상기 그래프 기반 변환부(510)는 최적화 함수에 기초하여 최적화된 그래프 기반 변환 커널을 획득할 수 있다. 이때, 상기 최적화 함수는 라그랑지 승수를 이용하여 비제한 최적화 함수(unconstrained optimization function)로 표현될 수 있고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
또한, 상기 그래프 기반 변환부(510)는 상기 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득할 수 있고, 상기 예측 벡터는 예측 신호를 생성하기 위해 이용될 수 있다. 이때, 상기 예측 벡터는 상기 그래프 라플라시안 행렬의 고유 벡터(eigenvector)와 상기 고유값(eigenvalue)의 분포에 기초하는 비용 함수 간의 선형 결합에 기초하여 획득될 수 있다.
상기 획득된 예측 벡터는 역변환부(540)로 전송되어 역변환될 수 있고, 역변환된 예측 벡터는 예측부(56)로 전송되어 예측 신호를 생성하기 위해 이용될 수 있다. 또는 상기 예측 벡터는 엔트로피 인코딩부(570)로 전송되어 인코딩될 수도 있다.
상기 그래프 기반 변환부(510)의 실시예들은 도 1의 변환부(120)에 포함되어 수행될 수 있고, 또는 별개의 기능 블록으로 수행될 수도 있다. 그리고, 본 발명이 적용되는 예측 방법도 상기 그래프 기반 변환부(510)에서 수행되는 것으로 설명하고 있으나, 본 발명은 이에 한정되지 않는다. 예를 들어, 본 발명이 적용되는 예측 방법은 별개의 기능 블록으로 수행되거나 또는 인터 예측부(180)/예측부(560)에서 수행될 수 있다.
본 발명이 적용되는 예측 방법의 실시예들은 이하에서 보다 상세히 설명하도록 한다.
그래프 기반 예측(Graph-based prediction)
그래프의 푸리에 변환을 정의하기 위해, 본 발명은 G(W)에 대응되는 차수 행렬(degree matrix)로 표현될 수 있다. 여기서, 차수 행렬(degree matrix)은 각 꼭지점의 차수에 대한 정보를 포함하는 대각 행렬(diagonal matrix)로, 아래 수학식 10과 같이 정의될 수 있다. 예를 들어, 상기 차수는 한 꼭지점에 이어져 있는 변의 수를 의미할 수 있다.
수학식 10
Figure PCTKR2015011137-appb-M000010
그래프 라플라시안 행렬 L= D-W 이고, 따라서 그래프 라플라시안 행렬 Li,j는 다음 수학식 11과 같다.
수학식 11
Figure PCTKR2015011137-appb-M000011
이때, 행렬 T를 그래프 푸리에 변환이라 정의하면, 행렬 T는 다음 수학식 12와 같다.
수학식 12
Figure PCTKR2015011137-appb-M000012
여기서, U는 L을 대각화하는 고유 행렬을 나타내고, L은 다음 수학식 13과 같다.
수학식 13
Figure PCTKR2015011137-appb-M000013
그리고, 직교 행렬은 다음 수학식 14를 만족한다.
수학식 14
Figure PCTKR2015011137-appb-M000014
이러한 정의에 기초하여, 고유 행렬(eigen matrix) U의 행들(columns)은 L의 고유 벡터(eigenvectors)를 포함하고, L의 고유값(eigenvalues)은 다음 수학식 15와 같이 표현될 수 있다.
수학식 15
Figure PCTKR2015011137-appb-M000015
일반적으로 고유 벡터(eigenvectors)는 특유의 형태로 정의되지 않지만, 본 발명의 목적에 따라, L이 대칭적이기 때문에 모든 고유 벡터(eigenvectors)는 실수값이고, 적어도 하나의 분해(decomposition)는 존재함을 고려해야 한다. 이는 수학식 14를 만족하는 어떠한 행렬에도 적용 가능하다.
랜덤 신호의 예측은 고전적인 통계적 문제이다. 일반적인 방식으로, 본 발명은 벡터 함수를 수학식 16과 같이 정의할 수 있다.
수학식 16
Figure PCTKR2015011137-appb-M000016
여기서, p(y)는 N차원 벡터y가 주어졌을 때 M차원 랜덤 벡터(random vector)의 예측 값(predicted value)을 나타낸다.
조건적 확률 분포 f(x|y)를 알고 있다고 가정하면, 본 발명은 수학식 17과 같은 최적화 함수를 통해 최적의 예측 함수 p*(y)를 찾을 수 있다.
수학식 17
Figure PCTKR2015011137-appb-M000017
여기서, p*(y)는 최적의 예측 함수를 나타내고, x는 원 신호를 나타내며, p(y)는 N차원 벡터y가 주어졌을 때 M차원 랜덤 벡터(random vector)의 예측 값(predicted value)을 나타낸다. 그리고, Ex|y{·}는 조건부 기대 연산자(conditional expectation operator)를 나타낸다.
그리고, 수학식 18은 예측 에러를 측정하는 함수(function measuring prediction error)를 나타낸다.
수학식 18
Figure PCTKR2015011137-appb-M000018
예를 들어, D가 유클리디안 거리(Euclidean distance)를 측정할 때, 본 발명은 수학식 19와 같은 최소 제곱 에러 문제(minimum squared error problem)를 갖는다.
수학식 19
Figure PCTKR2015011137-appb-M000019
여기서, p*(y)는 최적의 예측 함수를 나타내고, x는 원 신호를 나타내며, p(y)는 N차원 벡터y가 주어졌을 때 M차원 랜덤 벡터(random vector)의 예측 값(predicted value)을 나타낸다.
이 경우, 최적 예측값(optimal predictor )은 다음 수학식 20과 같을 수 있다.
수학식 20
Figure PCTKR2015011137-appb-M000020
선형 예측과 같은 특별한 경우가 적용되는 경우, 본 발명은 수학식 21과 같이 표현할 수 있다.
수학식 21
Figure PCTKR2015011137-appb-M000021
여기서, P는 MxN 행렬을 나타내고, y는 N차원 벡터를 나타낸다.
제곱 에러 측정 (squared-error measure)에 대한 최적의 선형 예측 행렬(optimal linear predictor matrix)은 다음 수학식 22와 같이 계산될 수 있다.
수학식 22
Figure PCTKR2015011137-appb-M000022
또한, 본 발명이 적용되는 예측 알고리즘(prediction algorithm)을 설명하기 위해, 목적 함수(objective function)의 정의를 더 가정할 필요가 있다.
수학식 23
Figure PCTKR2015011137-appb-M000023
상기 수학식 23에서, Ω(h,λ)는 변환 h 가 얼마나 일어날 것 같지 않은지(how "improbable" is transform h)를 측정하기 위해, 그래프 라플라시안 고유값 λ의 벡터를 이용한다. 이 함수를 최소화하는 변환 벡터 h는 더 개연성 있는 신호(more probable signals)에 대응된다.
본 발명은 확률 모델의 실제 이론을 가정하는 것이 아니라, 더 큰 고유값에 대응되는 고주파수 성분이 전형적으로 더 작은 크기(lower magnitude)를 갖는다는 경험적 관찰에 기초한다.
이러한 정의에 따라, 본 발명은 그래프 기반 예측을 분해하는 방법(how to decompose the graph-based prediction )을 제공한다. 즉, x로부터 y를 예측하기 위해 그래프 신호 G의 정보를 이용할 수 있다. 이는 다음과 같은 과정을 따른다.
첫째, 그래프 신호 G 의 에지 가중치들을 결정하고, 그래프 라플라시안 행렬 L을 계산할 수 있다.
둘째, 변환 행렬 T 및 고유값(eigenvalue) λ를 갖는 벡터를 결정하기 위해 그래프 라플라시안 행렬 L의 스펙트럼 분해(spectral decomposition)을 수행할 수 있다.
셋째, 상기 스펙트럼 분해 결과에 기초하여, 다음 수학식 24와 같이 최적의 변환 벡터 h*(y)를 산출할 수 있다.
수학식 24
Figure PCTKR2015011137-appb-M000024
넷째, 상기 수학식 24를 이용하는 다음 수학식 25에 기초하여 예측 벡터 p(y)를 산출할 수 있다.
수학식 25
Figure PCTKR2015011137-appb-M000025
본 발명의 다른 실시예로, 그래프 가중치 셋을 미리 정의하는 것도 가능하다. 그럼으로써 모든 예측 벡터들에 대해, 라플라시안 계산 및 변환 행렬 계산과 관련된 위 첫번째 단계 및 두번째 단계를 반복하지 않을 수 있다.
그래프 기반 변환 최적화(Graph-based transform optimization)
본 발명의 그래프 기반 예측 알고리즘에서, 다음 수학식 26의 최적화 문제에 대한 더 효율적인 해법을 찾기 위해 몇 가지 특별한 특징을 활용할 수 있다.
수학식 26
Figure PCTKR2015011137-appb-M000026
여기서, Ω(h,λ)는 변환 h 가 얼마나 일어날 것 같지 않은지(how "improbable" is transform h)를 측정하기 위한 목적 함수(objective function)를 나타내고, λ 벡터는 그래프 라플라시안 고유값을 나타낸다. 그리고, “s.t.”는 “subject to”의 약어로, 최적화 함수에 대한 제한식을 따른다는 것을 나타낸다. 만약, Ω(h,λ)가 연속적이고 미분가능하다면(continuous and differentiable), 본 발명은 벡터 s에 의해 표현된 라그랑지 승수 셋(a set of Lagrange multipliers)을 이용할 수 있고, 다음 수학식 27에 의해 정의된 수식 시스템을 해결할 수 있다.
수학식 27
Figure PCTKR2015011137-appb-M000027
그러나, 행렬 A 및 M이 직교 부분 공간(orthogonal subspaces)을 발생시키기 때문에, 본 발명은 M차원 벡터 z를 정의하고 다음 수학식 28을 이용하여, 수학식 29를 획득할 수 있다.
수학식 28
Figure PCTKR2015011137-appb-M000028
수학식 29
Figure PCTKR2015011137-appb-M000029
그리고, 다음 수학식 30의 비제한 최적화 문제(unconstrained optimization problem)를 해결하여 수학식 31을 획득할 수 있다.
수학식 30
Figure PCTKR2015011137-appb-M000030
수학식 31
Figure PCTKR2015011137-appb-M000031
상기와 같은 그래프 기반 변환 최적화 과정을 통해 최적화된 변환 벡터를 획득할 수 있게 된다.
2차 목적 함수의 정의(Definition of Quadratic objective function)
본 발명은 다음 수학식 32와 같은 목적 함수를 2차 함수로써 정의할 수 있다.
수학식 32
Figure PCTKR2015011137-appb-M000032
여기서, W는 λ에 기초하는 세미-포지티브(semi-positive)의 행렬이다. 예를 들어, W는 다음 수학식 33과 같이 간단하게 정의할 수 있다.
수학식 33
Figure PCTKR2015011137-appb-M000033
표시의 단순화를 위해, 본 발명은 암시적으로 λ에 기초하는 행렬 W의 의존성을 고려하고, 다음 수학식 34의 해를 분석할 수 있다.
수학식 34
Figure PCTKR2015011137-appb-M000034
최적의 해를 찾기 위해 라그랑지 승수를 이용할 수 있다. 2차 목적 함수의 경우에, 상기 수학식 27에 정의된 수식들은 모두 선형이고, 본 발명은 다음 수학식 35와 같은 행렬 형태를 가질 수 있다.
수학식 35
Figure PCTKR2015011137-appb-M000035
만약 W가 단수(singular)가 아니면, 다음 수학식 36 및 수학식 37과 같이 표현될 수 있다.
수학식 36
Figure PCTKR2015011137-appb-M000036
수학식 37
Figure PCTKR2015011137-appb-M000037
이를 h에 대해 풀면, 본 발명은 다음 수학식 38을 획득할 수 있고, 예측 값은 수학식 39와 같다.
수학식 38
Figure PCTKR2015011137-appb-M000038
수학식 39
Figure PCTKR2015011137-appb-M000039
본 발명의 다른 실시예로, W가 단수(singular)일 때의 경우를 다음과 같이 설명할 수 있다. 2차 목적함수에 대한 수학식 30의 대응되는 버전은 다음 수학식 40과 같다.
수학식 40
Figure PCTKR2015011137-appb-M000040
최적의 해는 다음 수학식 41 및 수학식 42에 의해 정의될 수 있고, 결과적으로 수학식 43을 획득할 수 있다.
수학식 41
Figure PCTKR2015011137-appb-M000041
수학식 42
Figure PCTKR2015011137-appb-M000042
수학식 43
Figure PCTKR2015011137-appb-M000043
본 발명이 적용되는 다른 실시예로, 최적의 변환 벡터를 선택하기 위한 목적 함수를 선택하는 다른 방법을 제공한다. 예를 들어, 2차 함수는 다음 수학식 44와 같은 컨벡스 함수(convex function)의 특별한 경우일 수 있다.
수학식 44
Figure PCTKR2015011137-appb-M000044
여기서, wkk) 는 음이 아닌 가중치이고, αk≥1 는 큰 변환 값에 대한 페널티의 상대적 증가를 정의한다. 그러한 파라미터들은 개연성 없는 계수들이 작은 값을 갖도록 선택될 수 있다.
한편, 상기 양자화부(520)는 상기와 같은 과정을 통해 생성된 변환 계수를 양자화하여 상기 양자화된 계수를 엔트로피 인코딩부(570)으로 전송한다.
상기 엔트로피 인코딩부(570)은 상기 양자화된 신호에 대한 엔트로피 코딩을 수행하고 엔트로피 코딩된 신호를 출력한다.
상기 양자화부(520)에 의해 출력된 상기 양자화된 신호는 예측 신호를 생성하기 위해 사용될 수 있다. 예를 들어, 상기 인코더(500)의 루프 내의 상기 역양자화부(530) 및 상기 역변환부(540)은 상기 양자화된 신호가 예측 에러로 복원되도록 상기 양자화된 신호에 대한 역양자화 및 역변환을 수행할 수 있다. 복원된 신호는 상기 복원된 예측 에러를 상기 예측부(560)에 의해 출력된 예측 신호에 더함으로써 생성될 수 있다.
상기 버퍼(550)는 예측부(560)의 향후 참조를 위해 복원된 신호를 저장한다.
상기 예측부(560)은 이전에 복원되어 상기 버퍼(550)에 저장된 신호를 사용하여 예측 신호를 생성할 수 있다. 이러한 경우, 본 발명은 앵커(anchor) 이미지 내 영역을 사용하여 목표 이미지 내 영역을 효율적으로 예측하는 것에 관련된 것이다. 여기서, 상기 앵커 이미지는 참조 이미지, 참조 픽쳐 또는 참조 프레임을 의미할 수 있다. 효율은 율-왜곡(Rate-Distortion) 비용 또는 예측 에러 내 왜곡을 정량화하는 평균 제곱 에러를 산출함으로써 결정될 수 있다.
본 발명은 그래프 내의 꼭지점과 에지를 식별하며, 잔여값 신호를 인코딩 또는 디코딩하는 방법을 제안한다. 예를 들어, 본 발명의 실시예들은 그래프 기반 변환부(510)를 통해 다양한 실시예들을 수행할 수 있다. 상기 그래프 기반 변환부(510)는 상기 인코더(500) 또는 상기 디코더(700)에 포함될 수 있다.
도 6은 본 발명이 적용되는 실시예로서, 그래프 기반의 신호를 처리하는 디코더의 개략적 블록도를 예시한다.
도 6의 디코더(600)는 도 5의 인코더(500)에 의해 출력된 신호를 수신한다. 이때, 상기 출력된 신호는 그래프 파라미터 셋(graph parameter set)과 레지듀얼 신호를 포함할 수 있다. 상기 그래프 파라미터 셋에 기초하여 그래프 기반 변환 행렬을 획득할 수 있고, 상기 그래프 기반 변환 행렬은 고유 벡터를 포함할 수 있다. 그리고, 예측 벡터는 최적의 변환 벡터를 이용하여 획득될 수 있으며, 상기 최적의 변환 벡터는 최적화 함수를 통해 산출될 수 있다. 이때, 상기 예측 벡터는 변환 벡터와 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득될 수 있고, 상기 변환 벡터는 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정될 수 있다.
한편, 상기 최적화 함수는 라그랑지 승수를 이용하여 비제한 최적화 함수(unconstrained optimization function)로 표현될 수 있고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
상기 디코더(600)는 상기 예측 벡터 정보에 기초하여 예측 신호를 생성할 수 있다. 이는 예측부(650)에서 수행될 수 있으나, 본 발명은 이에 한정되지 않는다.
상기 엔트로피 디코딩부(610)은 수신된 신호에 대한 엔트로피 디코딩을 수행한다. 상기 역양자화부(620)은 양자화 단계 크기에 대한 정보를 기초로 하여 상기 엔트로피 디코딩된 신호로부터 변환 계수를 획득한다.
상기 역변환부(630)은 변환 계수에 대한 역변환을 수행함으로써 예측 에러를 취득한다. 이때, 상기 역변환은 상기 인코더(500)에서 획득된 그래프 기반 변환에 대한 역변환을 의미할 수 있다.
복원된 신호는 상기 획득된 예측 에러를 상기 예측부(650)에 의해 출력된 예측 신호에 더함으로써 생성되며, 이는 복원부(미도시)에서 수행된다.
상기 버퍼(640)는 상기 예측부(650)의 향후 참조를 위해 상기 복원된 신호를 저장한다.
상기 예측부(650)은 이전에 복원되어 상기 버퍼(640)에 저장된 신호와 본 발명이 적용되는 예측 벡터를 기반으로 예측 신호를 생성한다.
본 발명에서, 그래프 파라미터에 기초하여 획득된 그래프 기반 변환은 상기 인코더(600) 또는 상기 디코더(600)에서 사용될 수 있다.
도 7은 본 발명이 적용되는 일실시예로서, 그래프 기반 변환부의 내부 블록도를 나타낸다.
도 7을 참조하면, 그래프 기반 변환부(510)는 그래프 파라미터 추출부(511), 그래프 신호 생성부(512), 그래프 기반 변환 산출부(513), 변환 수행부(514), 변환 최적화부(515) 및 그래프 기반 예측부(516)를 포함할 수 있다. 다만, 본 발명은 이에 한정되지 않으며, 상기 그래프 기반 변환부(510) 내 각 기능 유닛들은 별개의 기능 유닛으로 동작할 수 있고, 또는 다른 기능 유닛에 포함되어 동작할 수도 있을 것이다.
그래프 파라미터 추출부(511)는 잔여 신호의 타겟 유닛에 대응되는 그래프 내 그래프 파라미터를 추출할 수 있다. 예를 들어, 상기 그래프 파라미터는 꼭지점 파라미터, 및 에지 파라미터 중 적어도 하나를 포함할 수 있다. 상기 꼭지점 파라미터는 꼭지점 위치 및 꼭지점 개수 중 적어도 하나를 포함하고, 상기 에지 파라미터는 에지 가중치 값 및 에지 가중치 개수 중 적어도 하나를 포함할 수 있다. 또한, 상기 그래프 파라미터는 일정 개수의 셋(set)으로 정의될 수 있다.
그래프 신호 생성부(512)는 상기 그래프 파라미터 추출부(511)로부터 추출된 그래프 파라미터에 기초하여 그래프 신호를 생성할 수 있다. 이때, 상기 그래프 신호로부터 그래프 라플라시안 행렬을 산출할 수 있다.
그래프 기반 변환 산출부(513)는 상기 그래프 파라미터 또는 그래프 파라미터 셋에 기초하여 그래프 기반 변환 행렬(graph-based transform matrix)을 획득할 수 있다. 이때, 상기 그래프 기반 변환 행렬은 고유 벡터(eigenvector)를 포함할 수 있다.
또한, 그래프 기반 변환 산출부(513)는 상기 그래프 파라미터 또는 그래프 파라미터 셋에 기초하여 그래프 라플라시안 행렬을 산출할 수 있다. 이 경우, 상기 그래프 기반 변환 행렬은 상기 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득될 수 있다.
변환 수행부(514)는 그래프 기반 변환 행렬을 이용하여 변환을 수행할 수 있다.
변환 최적화부(515)는 최적화 함수를 통해 최적의 변환 벡터를 산출할 수 있다. 여기서, 상기 최적화 함수는 라그랑지 승수를 이용하여 비제한 최적화 함수(unconstrained optimization function)로 표현될 수 있다. 그리고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다. 예를 들어, 상기 최적화 함수로 상기 수학식 24또는 상기 수학식 34가 이용될 수 있고, 상기 최적의 변환 벡터는 상기 수학식 18, 상기 수학식 25 또는 상기 수학식 36을 이용하여 획득될 수 있다.
그래프 기반 예측부(516)는 상기 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득할 수 있다. 상기 예측 벡터는 변환 벡터와 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득될 수 있고, 상기 변환 벡터는 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정될 수 있다. 예를 들어, 상기 예측 벡터는 상기 수학식 19 또는 상기 수학식 37을 이용하여 획득될 수 있다.
또한, 상기 예측 벡터는 인코딩되어 디코더에 전송되거나, 디코더에서 유도될 수도 있다. 전송 방법으로는 예를 들어, 벡터 값을 전송하거나 벡터 값 차이를 전송할 수도 있으나, 본 발명은 이에 한정되지 않는다.
도 8은 본 발명이 적용되는 일실시예로, 그래프 신호에 기초하여 최적화된 예측 벡터를 획득하는 과정을 설명하기 위한 흐름도이다.
인코더는 수신된 비디오 신호로부터 예측 신호를 생성하고, 비디오 신호에서 예측 신호를 감산하여 잔여 신호를 생성할 수 있다. 상기 잔여 신호에 대해 변환이 수행되는데, 이때 그래프 기반 신호 처리 기술을 적용하여 그래프 기반 변환 또는 그래프 기반 예측을 수행할 수 있다. 이하에서는, 그래프 신호에 기초하여 그래프 기반 예측을 수행하는 방법을 설명한다.
먼저, 인코더는 비디오 신호의 타겟 유닛에 대응되는 그래프 파라미터 셋을 결정할 수 있다(S810). 예를 들어, 그래프 신호 G 의 꼭지점 파라미터 및 에지 가중치 중 적어도 하나를 결정할 수 있다.
그리고, 인코더는 그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성할 수 있고, 그래프 신호에 기초하여 그래프 라플라시안 행렬 L을 산출할 수 있다(S820).
인코더는 변환 행렬 T 및 고유값(eigenvalue) λ을 갖는 벡터를 결정하기 위해 그래프 라플라시안 행렬 L의 스펙트럼 분해(spectral decomposition)을 수행할 수 있고, 상기 스펙트럼 분해 결과에 기초하여 그래프 기반 변환 행렬을 획득할 수 있다(S830). 이때, 상기 그래프 기반 변환 행렬은 고유 벡터(eigenvector)를 포함할 수 있다.
인코더는 최적화 함수를 통해 최적의 변환 벡터를 획득할 수 있다(S840). 이때, 상기 최적화 함수로 상기 수학식 24 또는 상기 수학식 34가 이용될 수 있고, 상기 최적의 변환 벡터는 상기 수학식 18, 상기 수학식 25 또는 상기 수학식 36을 이용하여 획득될 수 있다. 여기서, 상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 고유 벡터(eigenvector)를 변수로 가질 수 있다. 그리고, 상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
그리고, 인코더는 상기 최적의 변환 벡터를 이용하여 예측 벡터를 산출할 수 있다(S850). 여기서, 상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고, 상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정될 수 있다. 예를 들어, 예측 함수로 상기 수학식 19 또는 상기 수학식 37가 이용될 수 있다.
한편, 상기 산출된 예측 벡터는 예측 신호를 생성하기 위해 이용될 수 있다. 또는 다른 예로, 상기 예측 벡터는 인코딩되어 디코더로 전송되거나, 디코더에서 유도될 수도 있다.
도 9는 본 발명이 적용되는 일실시예로, 그래프 기반 예측을 이용하여 비디오 신호를 디코딩하는 과정을 설명하기 위한 흐름도이다.
본 발명이 적용되는 디코더는 그래프 파라미터 셋과 레지듀얼 신호를 포함하는 비디오 신호를 수신할 수 있다(S910).
그리고, 그래프 파라미터 셋에 기초하여 그래프 기반 변환 행렬을 획득할 수 있다(S920). 상기 획득된 그래프 기반 변환 행렬을 이용하여 레지듀얼 신호를 복원할 수 있다(S930).
한편, 디코더는 최적화 함수를 통해 최적의 변환 벡터를 산출할 수 있다(S940). 이때, 상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 고유 벡터(eigenvector)를 변수로 가질 수 있다. 그리고, 상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현될 수 있다.
디코더는 상기 최적의 변환 벡터를 이용하여 예측 벡터를 획득할 수 있다(S950). 이는 디코더의 예측부 또는 역변환부에서 수행될 수 있다. 상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고, 상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정될 수 있다.
그리고, 디코더는 상기 예측 벡터에 기초하여 예측 신호를 생성할 수 있다(S960).
디코더는, 상기 생성된 예측 신호와 레지듀얼 신호를 합하여 비디오 신호를 복원할 수 있다(S970).
이와 같이, 본 발명은 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 최적화 예측 알고리즘을 제공함으로써 저복잡도로 예측값을 획득할 수 있고, 나아가 예측 성능을 향상시킬 수 있다.
상기 기술된 것과 같이, 본 발명에서 설명한 실시예들은 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다. 예를 들어, 상기 도 1, 도 2, 도 5, 도 6 및 도 7에서 도시한 기능 유닛들은 컴퓨터, 프로세서, 마이크로 프로세서, 컨트롤러 또는 칩 상에서 구현되어 수행될 수 있다.
또한, 본 발명이 적용되는 디코더 및 인코더는 멀티미디어 방송 송수신 장치, 모바일 통신 단말, 홈 시네마 비디오 장치, 디지털 시네마 비디오 장치, 감시용 카메라, 비디오 대화 장치, 비디오 통신과 같은 실시간 통신 장치, 모바일 스트리밍 장치, 저장 매체, 캠코더, 주문형 비디오(VoD) 서비스 제공 장치, 인터넷 스트리밍 서비스 제공 장치, 3차원(3D) 비디오 장치, 화상 전화 비디오 장치, 및 의료용 비디오 장치 등에 포함될 수 있으며, 비디오 신호 및 데이터 신호를 처리하기 위해 사용될 수 있다.
또한, 본 발명이 적용되는 처리 방법은 컴퓨터로 실행되는 프로그램의 형태로 생산될 수 있으며, 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 본 발명에 따른 데이터 구조를 가지는 멀티미디어 데이터도 또한 컴퓨터가 판독할 수 있는 기록 매체에 저장될 수 있다. 상기 컴퓨터가 판독할 수 있는 기록 매체는 컴퓨터로 읽을 수 있는 데이터가 저장되는 모든 종류의 저장 장치를 포함한다. 상기 컴퓨터가 판독할 수 있는 기록 매체는, 예를 들어, 블루레이 디스크(BD), 범용 직렬 버스(USB), ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크 및 광학적 데이터 저장 장치를 포함할 수 있다. 또한, 상기 컴퓨터가 판독할 수 있는 기록 매체는 반송파(예를 들어, 인터넷을 통한 전송)의 형태로 구현된 미디어를 포함한다. 또한, 인코딩 방법으로 생성된 비트 스트림이 컴퓨터가 판독할 수 있는 기록 매체에 저장되거나 유무선 통신 네트워크를 통해 전송될 수 있다.
이상, 전술한 본 발명의 바람직한 실시예는, 예시의 목적을 위해 개시된 것으로, 당업자라면 이하 첨부된 특허청구범위에 개시된 본 발명의 기술적 사상과 그 기술적 범위 내에서, 다양한 다른 실시예들을 개량, 변경, 대체 또는 부가 등이 가능할 것이다.

Claims (20)

  1. 그래프 신호를 이용하여 그래프 기반 예측(graph-based prediction)을 수행하는 방법에 있어서,
    컨텍스트 신호(context signal)를 획득하는 단계;
    그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성하는 단계;
    상기 그래프 신호에 기초하여 그래프 기반 변환 행렬(graph-based transform matrix)을 획득하는 단계, 상기 그래프 기반 변환 행렬은 고유 벡터(eigenvector)를 포함함;
    최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하는 단계; 및
    상기 예측 벡터를 이용하여 예측 신호를 생성하는 단계
    를 포함하되,
    상기 최적화 함수는 상기 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 방법.
  2. 제1항에 있어서,
    상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고,
    상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정되는 것을 특징으로 하는 방법.
  3. 제1항에 있어서,
    상기 그래프 신호에 기초하여 그래프 라플라시안 행렬(graph Laplacian matrix)을 산출하는 단계를 더 포함하고,
    상기 그래프 기반 변환 행렬(graph-based transform matrix)은 상기 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득되는 것을 특징으로 하는 방법.
  4. 제1항에 있어서,
    상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현되는 것을 특징으로 하는 방법.
  5. 제1항에 있어서,
    예측 에러를 인코딩하는 단계; 및
    상기 인코딩된 예측 에러를 전송하는 단계
    를 더 포함하는 것을 특징으로 하는 방법.
  6. 그래프 기반 예측(graph-based prediction)에 기초하여 비디오 신호를 디코딩하는 방법에 있어서,
    그래프 파라미터 셋(graph parameter set)과 레지듀얼 신호를 포함하는 상기 비디오 신호를 수신하는 단계;
    상기 그래프 파라미터 셋에 기초하여 고유 벡터를 포함하는 그래프 기반 변환 행렬을 획득하는 단계;
    최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하는 단계;
    상기 예측 벡터를 이용하여 예측 신호를 생성하는 단계; 및
    상기 예측 신호와 상기 레지듀얼 신호를 합하여 상기 비디오 신호를 복원하는 단계
    를 포함하되,
    상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 방법.
  7. 제6항에 있어서,
    상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고,
    상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정되는 것을 특징으로 하는 방법.
  8. 제7항에 있어서,
    상기 비용 함수는 상기 변환 벡터의 컨벡스 함수(convex function)이고, 상기 컨벡스 함수(convex function)는 변환 벡터 성분의 가중치된 P-norm(weighted P-norm of the transform vector components)을 포함하는 것을 특징으로 하는 방법.
  9. 제8항에 있어서,
    상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현된 것을 특징으로 하는 방법.
  10. 제6항에 있어서,
    상기 그래프 기반 변환 행렬은 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득된 것을 특징으로 하는 방법.
  11. 그래프 신호를 이용하여 그래프 기반 예측(graph-based prediction)을 수행하는 장치에 있어서,
    그래프 파라미터 셋(graph parameter set)에 기초하여 그래프 신호를 생성하고, 상기 그래프 신호에 기초하여 고유 벡터(eigenvector)를 포함하는 그래프 기반 변환 행렬(graph-based transform matrix)을 획득하는 그래프 기반 변환부; 및
    컨텍스트 신호(context signal)를 획득하고, 최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하고, 상기 예측 벡터를 이용하여 예측 신호를 생성하는 예측부
    를 포함하되,
    상기 최적화 함수는 상기 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 장치.
  12. 제11항에 있어서,
    상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고,
    상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정되는 것을 특징으로 하는 장치.
  13. 제11항에 있어서,
    상기 그래프 기반 변환부는 상기 그래프 신호에 기초하여 그래프 라플라시안 행렬(graph Laplacian matrix)을 산출하고,
    상기 그래프 기반 변환 행렬(graph-based transform matrix)은 상기 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득되는 것을 특징으로 하는 장치.
  14. 제11항에 있어서,
    상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현되는 것을 특징으로 하는 장치.
  15. 제11항에 있어서,
    예측 에러를 인코딩하고, 상기 인코딩된 예측 에러를 전송하는 엔트로피 인코딩부
    를 더 포함하는 것을 특징으로 하는 장치.
  16. 그래프 기반 예측(graph-based prediction)에 기초하여 비디오 신호를 디코딩하는 장치에 있어서,
    그래프 파라미터 셋(graph parameter set)과 레지듀얼 신호를 포함하는 상기 비디오 신호를 수신하는 엔트로피 디코딩부;
    상기 그래프 파라미터 셋에 기초하여 고유 벡터를 포함하는 그래프 기반 변환 행렬을 획득하는 역변환부;
    최적화 함수를 통해 산출된 최적의 변환 벡터를 이용하여 예측 벡터를 획득하고, 상기 예측 벡터를 이용하여 예측 신호를 생성하는 예측부; 및
    상기 예측 신호와 상기 레지듀얼 신호를 합하여 상기 비디오 신호를 복원하는 복원부
    를 포함하되,
    상기 최적화 함수는 컨텍스트 신호, 그래프 라플라시안 행렬의 고유값(eigenvalue)과 상기 고유 벡터(eigenvector)를 변수로 갖는 것을 특징으로 하는 장치.
  17. 제16항에 있어서,
    상기 예측 벡터는 변환 벡터와 상기 고유 벡터(eigenvectors)의 선형 결합에 기초하여 획득되고,
    상기 변환 벡터는 상기 그래프 라플라시안 행렬의 고유값(eigenvalue)의 분포에 기초하는 비용 함수를 이용하여 결정되는 것을 특징으로 하는 장치.
  18. 제17항에 있어서,
    상기 비용 함수는 상기 변환 벡터의 컨벡스 함수(convex function)이고, 상기 컨벡스 함수(convex function)는 변환 벡터 성분의 가중치된 P-norm(weighted P-norm of the transform vector components)을 포함하는 것을 특징으로 하는 장치.
  19. 제18항에 있어서,
    상기 최적화 함수는 라그랑지 승수에 기초하는 비제한 최적화 함수(unconstrained optimization function)로 표현되고, 상기 비제한 최적화 함수(unconstrained optimization function)는 새로운 M차원 벡터에 의해 표현된 것을 특징으로 하는 장치.
  20. 제16항에 있어서,
    상기 그래프 기반 변환 행렬은 그래프 라플라시안 행렬의 스펙트럼 분해(spectral decomposition)를 통해 획득된 것을 특징으로 하는 장치.
PCT/KR2015/011137 2014-10-21 2015-10-21 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치 WO2016064185A1 (ko)

Priority Applications (5)

Application Number Priority Date Filing Date Title
KR1020167036419A KR101901355B1 (ko) 2014-10-21 2015-10-21 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치
CN201580064109.4A CN107005712B (zh) 2014-10-21 2015-10-21 使用优化函数执行基于图形的预测的方法和装置
EP15853353.9A EP3211894B1 (en) 2014-10-21 2015-10-21 Method and apparatus for performing graph-based prediction by using optimization function
JP2017522065A JP6356912B2 (ja) 2014-10-21 2015-10-21 最適化関数を用いてグラフベース予測を実行する方法及び装置
US15/520,968 US10425649B2 (en) 2014-10-21 2015-10-21 Method and apparatus for performing graph-based prediction using optimization function

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201462066365P 2014-10-21 2014-10-21
US62/066,365 2014-10-21

Publications (1)

Publication Number Publication Date
WO2016064185A1 true WO2016064185A1 (ko) 2016-04-28

Family

ID=55748008

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2015/011137 WO2016064185A1 (ko) 2014-10-21 2015-10-21 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치

Country Status (6)

Country Link
US (2) US10425649B2 (ko)
EP (1) EP3211894B1 (ko)
JP (1) JP6356912B2 (ko)
KR (1) KR101901355B1 (ko)
CN (1) CN107005712B (ko)
WO (1) WO2016064185A1 (ko)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9723116B2 (en) * 2012-09-25 2017-08-01 Jean Edrice Georges Restraining system for handheld electronic devices
US9706829B2 (en) * 2014-07-21 2017-07-18 Rocky Gabriel Tilney Portable docking device
US10255358B2 (en) 2014-12-30 2019-04-09 Facebook, Inc. Systems and methods for clustering items associated with interactions
US10123840B2 (en) 2015-02-13 2018-11-13 Scapa Flow, Llc System and method for medical device placement in bone
USD771613S1 (en) * 2015-08-11 2016-11-15 Griffin Technology, Inc. Case for portable electronic communications device
USD772211S1 (en) * 2015-08-13 2016-11-22 Griffin Technology, Inc. Case for portable electronic communications device
USD772857S1 (en) * 2015-09-23 2016-11-29 Griffin Technology, Inc. Case for portable electronic communications device
USD781836S1 (en) * 2015-10-19 2017-03-21 Modne, Inc. Phone case
USD781839S1 (en) * 2015-10-19 2017-03-21 Modne, Inc. Phone case
USD781837S1 (en) * 2015-10-19 2017-03-21 Modne, Inc. Phone case
WO2017135661A1 (ko) * 2016-02-01 2017-08-10 엘지전자 주식회사 그래프 기반 분리 가능한 변환 (graph-based separable transform)을 이용하여 비디오 신호를 인코딩 / 디코딩하는 방법 및 장치
CN105807861A (zh) * 2016-03-28 2016-07-27 永德利硅橡胶科技(深圳)有限公司 平板电脑保护壳
US20180063306A1 (en) * 2016-08-23 2018-03-01 Bruce Allen Scannell, JR. Cell Phone Case with Reconfigurable Plates
US10703297B1 (en) * 2016-08-26 2020-07-07 Apple Inc. System for holding devices in a passenger vehicle
USD787498S1 (en) * 2016-09-15 2017-05-23 Jinliang Chen Case for electronic communications device
USD860980S1 (en) * 2016-10-28 2019-09-24 Spigen, Inc. Case for a cellular phone
USD861655S1 (en) * 2016-10-28 2019-10-01 Spigen, Inc. Case for a cellular phone
IT201600122898A1 (it) * 2016-12-02 2018-06-02 Ecole Polytechnique Fed Lausanne Epfl Metodi e apparati per codificare e decodificare immagini o flussi video digitali
US20180192031A1 (en) * 2017-01-03 2018-07-05 Leslie C. Hardison Virtual Reality Viewing System
FR3061423B1 (fr) * 2017-01-03 2020-10-23 Ilyu Ensemble comportant un brassard et une pochette pour smartphone
IT201700052116A1 (it) * 2017-05-15 2018-11-15 Romano Lepore Dispositivo porta smartphone o telefono cellulare
USD848996S1 (en) * 2017-07-07 2019-05-21 Spigen Korea Co., Ltd. Case for electronic communications device
USD857683S1 (en) * 2017-07-27 2019-08-27 Spigen Korea Co., Ltd. Case for electronic communications device
USD848997S1 (en) * 2017-07-27 2019-05-21 Spigen Korea Co., Ltd. Case for electronic communications device
EP3668426A4 (en) 2017-08-14 2021-10-20 Circinus Medical Technology, LLC SYSTEM AND METHOD USING EXTENDED REALITY WITH SHAPE FITTING TO PLACE A MEDICAL DEVICE IN THE BONE
USD878346S1 (en) * 2017-08-16 2020-03-17 Spigen, Inc. Phone case
USD839860S1 (en) * 2017-08-18 2019-02-05 Spigen Korea Co., Ltd. Case for electronic communications device
USD839259S1 (en) * 2017-09-01 2019-01-29 Spigen Korea Co., Ltd. Case for electronic communications device
USD839258S1 (en) * 2017-09-01 2019-01-29 Spigen Korea Co., Ltd. Case for electronic communications device
USD839863S1 (en) * 2017-11-10 2019-02-05 Spigen Korea Co., Ltd. Case for electronic communications device
US10927868B2 (en) * 2018-02-01 2021-02-23 Image Builders Marketing, Inc. Decorative cover assembly for vehicle
USD881866S1 (en) 2018-09-14 2020-04-21 Spigen Korea Co., Ltd. Case for smart phone
US20200093231A1 (en) * 2018-09-25 2020-03-26 1LSS Inc. Magnetically coupled wallet accessory for mobile device
EP3935581A4 (en) 2019-03-04 2022-11-30 Iocurrents, Inc. DATA COMPRESSION AND COMMUNICATION USING MACHINE LEARNING
EP3955841A4 (en) * 2019-04-15 2023-04-12 Circinus Medical Technologies LLC ATTACHMENT APPARATUS FOR ATTACHING A MEDICAL ALIGNMENT DEVICE FOR ALIGNING A TOOL
JP7194292B2 (ja) * 2019-04-17 2022-12-21 アップル インコーポレイテッド 無線位置特定可能タグ
US10915578B1 (en) 2019-09-06 2021-02-09 Digital Asset Capital, Inc. Graph outcome determination in domain-specific execution environment
CN110807392B (zh) * 2019-10-25 2022-09-06 浙江大华技术股份有限公司 编码控制方法以及相关装置
US11432014B2 (en) * 2019-10-25 2022-08-30 Qualcomm Incorporated Parametric graph-based separable transforms for video coding
US11242012B1 (en) * 2020-04-07 2022-02-08 Jason Bell Attachable holder for a mobile device
US11219299B1 (en) * 2020-08-11 2022-01-11 Melissa Pimentel Electronic tablet holder assembly
US11839279B2 (en) * 2020-09-22 2023-12-12 Apple Inc. Magnetically attachable wallet
US11724651B2 (en) * 2020-12-30 2023-08-15 Shahroukh M. Kazempour Smart phone mount for vehicles
KR102358678B1 (ko) * 2021-01-14 2022-02-08 영남대학교 산학협력단 대규모 소셜 네트워크 분석 방법 및 이를 수행하기 위한 장치
US11388967B1 (en) 2021-07-07 2022-07-19 Logan R. Riley Device protector
EP4383498A1 (en) 2022-12-06 2024-06-12 CSEM Centre Suisse d'Electronique et de Microtechnique SA - Recherche et Développement Method of forecasting power production/consumption in a distributed network

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110093532A (ko) * 2010-02-12 2011-08-18 삼성전자주식회사 그래프 기반 화소 예측을 이용한 영상 부호화/복호화 시스템 및 방법 그리고 깊이 맵 부호화 시스템 및 방법
KR20110135787A (ko) * 2010-06-11 2011-12-19 삼성전자주식회사 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법
KR20140116194A (ko) * 2012-01-13 2014-10-01 퀄컴 인코포레이티드 비디오 코딩에서 변환 계수 데이터를 코딩하기 위한 콘텍스트들의 결정

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7374142B2 (en) * 2003-03-27 2008-05-20 Carnevali Jeffrey D Magnetic mounting apparatus
US8121618B2 (en) * 2009-10-28 2012-02-21 Digimarc Corporation Intuitive computing methods and systems
WO2011098488A1 (en) * 2010-02-11 2011-08-18 Thomson Licensing Method for coding and for reconstruction of a block of an image sequence
EP2360927A3 (en) * 2010-02-12 2011-09-28 Samsung Electronics Co., Ltd. Image encoding/decoding system using graph based pixel prediction and encoding system and method
US9087375B2 (en) * 2011-03-28 2015-07-21 Sony Corporation Image processing device, image processing method, and program
KR20140042845A (ko) * 2011-06-14 2014-04-07 조우 왕 지각적 비디오 코딩을 위한 구조적 유사성 기반의 레이트-왜곡 최적화 방법 및 시스템
US9116665B2 (en) * 2011-10-10 2015-08-25 AFC Trident, Inc. Modular protective cover with accessory slot for portable electronic device
US8708151B2 (en) * 2012-01-12 2014-04-29 Rokform Llc Case and mount system for handheld electronic device
US8870143B2 (en) * 2012-02-21 2014-10-28 Dmitry Kubin Low profile secure asymmetrical turn-lock coupling mechanism with magnetic rotational orientation locks
JP6188005B2 (ja) * 2012-06-21 2017-08-30 大学共同利用機関法人情報・システム研究機構 濃淡画像符号化装置及び復号装置
US8936222B1 (en) * 2013-11-27 2015-01-20 James W. Bastian System and method for magnetically supporting a device upon a structure
US9616821B2 (en) * 2013-11-28 2017-04-11 David ELHARAR Apparatus for securing a mobile device to a steering wheel
CN103929642B (zh) * 2014-04-24 2017-04-12 北京航空航天大学 一种hevc变换系数的熵编码上下文模型偏移值快速计算方法
US9706829B2 (en) * 2014-07-21 2017-07-18 Rocky Gabriel Tilney Portable docking device
US20160150861A1 (en) * 2014-12-02 2016-06-02 Aevoe International Ltd. Mountable case assembly
US9397719B1 (en) * 2015-06-17 2016-07-19 Airo Collective, Inc. Mobile device holder
US9800283B2 (en) * 2015-06-17 2017-10-24 Airo Collective, Inc. Mobile device holder

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20110093532A (ko) * 2010-02-12 2011-08-18 삼성전자주식회사 그래프 기반 화소 예측을 이용한 영상 부호화/복호화 시스템 및 방법 그리고 깊이 맵 부호화 시스템 및 방법
KR20110135787A (ko) * 2010-06-11 2011-12-19 삼성전자주식회사 엣지-적응 변환을 이용한 영상 부호화/복호화 시스템 및 방법
KR20140116194A (ko) * 2012-01-13 2014-10-01 퀄컴 인코포레이티드 비디오 코딩에서 변환 계수 데이터를 코딩하기 위한 콘텍스트들의 결정

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CHA ZHANG ET AL.: "Analyzing the optimality of predictive transform coding using graph-based models.", IEEE SIGNAL PROCESS LETTERS, vol. 20, no. 1, 27 November 2012 (2012-11-27), pages 106 - 109, XP011476604 *
DAVID I SHUMAN ET AL.: "The emerging field of signal processing on graphs : Extending i:Pnding high-dimensional data analysis to networks and other irregular domains.", IEEE SIGNAL PROCESSING MAGAZINE, vol. 30, no. 3, 31 May 2013 (2013-05-31), pages 89 - 98, XP011514759 *
See also references of EP3211894A4 *

Also Published As

Publication number Publication date
CN107005712B (zh) 2020-01-03
KR20170016381A (ko) 2017-02-13
EP3211894A1 (en) 2017-08-30
KR101901355B1 (ko) 2018-09-21
JP2017536033A (ja) 2017-11-30
US10425649B2 (en) 2019-09-24
EP3211894A4 (en) 2018-05-02
EP3211894B1 (en) 2020-03-04
CN107005712A (zh) 2017-08-01
US20170359584A1 (en) 2017-12-14
US20160106202A1 (en) 2016-04-21
JP6356912B2 (ja) 2018-07-11

Similar Documents

Publication Publication Date Title
WO2016064185A1 (ko) 최적화 함수를 이용하여 그래프 기반 예측을 수행하는 방법 및 장치
WO2018070790A1 (ko) 영상의 부호화/복호화 방법 및 장치
WO2015190839A1 (ko) 임베디드 블록 파티셔닝을 이용하여 비디오 신호를 인코딩, 디코딩하는 방법 및 장치
WO2018221817A1 (ko) 영상 코딩 시스템에서 인트라 예측에 따른 영상 디코딩 방법 및 장치
WO2017179835A1 (ko) 인트라 예측 기반의 비디오 신호 처리 방법 및 장치
WO2017065525A2 (ko) 영상을 부호화 또는 복호화하는 방법 및 장치
WO2017014585A1 (ko) 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2018236028A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2018236031A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치
WO2019117640A1 (ko) 영상 코딩 시스템에서 인터 예측에 따른 영상 디코딩 방법 및 장치
WO2020218793A1 (ko) Bdpcm에 기반한 영상 코딩 방법 및 그 장치
WO2015076634A1 (en) Method and apparatus for encoding and decoding video signal using adaptive sampling
WO2016129872A1 (ko) 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2018038554A1 (ko) 이차 변환을 이용한 비디오 신호의 인코딩/디코딩 방법 및 장치
WO2016190690A1 (ko) 적응적인 분리가능한 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2011126287A2 (en) Method and apparatus for performing interpolation based on transform and inverse transform
WO2017010850A1 (ko) 분리 가능한 그래프 기반 변환을 이용하여 비디오 신호를 처리하는 방법 및 장치
WO2015009132A1 (en) Hierarchical motion estimation method and apparatus based on adaptive sampling
WO2020116961A1 (ko) 이차 변환에 기반한 영상 코딩 방법 및 그 장치
WO2019245261A1 (ko) 영상 부호화/복호화 방법 및 장치
WO2020141879A1 (ko) 영상 코딩 시스템에서 서브 블록 기반 시간적 머지 후보를 사용하는 어파인 움직임 예측에 기반한 영상 디코딩 방법 및 장치
WO2021040398A1 (ko) 팔레트 이스케이프 코딩 기반 영상 또는 비디오 코딩
WO2017030418A1 (ko) 다중 그래프 기반 모델에 따라 최적화된 변환을 이용하여 비디오 신호를 인코딩/ 디코딩하는 방법 및 장치
WO2017195917A1 (ko) 비디오 코딩 시스템에서 인트라 예측 방법 및 장치
WO2016200235A1 (ko) 인트라 예측 모드 기반 영상 처리 방법 및 이를 위한 장치

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15853353

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20167036419

Country of ref document: KR

Kind code of ref document: A

ENP Entry into the national phase

Ref document number: 2017522065

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 15520968

Country of ref document: US

REEP Request for entry into the european phase

Ref document number: 2015853353

Country of ref document: EP