KR20180100976A - Method and apparatus for picture encoding/decoding using deep neural network based blur image learning - Google Patents

Method and apparatus for picture encoding/decoding using deep neural network based blur image learning Download PDF

Info

Publication number
KR20180100976A
KR20180100976A KR1020170027582A KR20170027582A KR20180100976A KR 20180100976 A KR20180100976 A KR 20180100976A KR 1020170027582 A KR1020170027582 A KR 1020170027582A KR 20170027582 A KR20170027582 A KR 20170027582A KR 20180100976 A KR20180100976 A KR 20180100976A
Authority
KR
South Korea
Prior art keywords
image
blur
neural network
deep neural
images
Prior art date
Application number
KR1020170027582A
Other languages
Korean (ko)
Inventor
기명석
김휘용
이주영
정세윤
정순흥
최진수
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020170027582A priority Critical patent/KR20180100976A/en
Publication of KR20180100976A publication Critical patent/KR20180100976A/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

Disclosed are a method and an apparatus which can increase compression efficiency by encoding a still image and/or a moving image after performing blur-preprocessing for each block included in the image based on a learning result using a deep neural network, instead of directly encoding the image, and restoring blur images at the time of decoding. An image encoding method according to an embodiment of the present disclosure includes the following steps: dividing an image to be encoded into one or more unit areas; deriving a restoration parameter or blur level for each of the unit areas; performing blurring for each of the unit areas to obtain blur images; and encoding the blurred image. The step of deriving a restoration parameter or blur level for each of the unit areas may be performed by using a model generated through a process of determining one or more sample images and restoration parameters for each of the blurred images of the sample images. The blur level for the unit area may be determined based on the complexity of the unit area.

Description

딥 신경망 기반 블러 영상 학습을 이용한 영상 부호화/복호화 방법 및 장치 {METHOD AND APPARATUS FOR PICTURE ENCODING/DECODING USING DEEP NEURAL NETWORK BASED BLUR IMAGE LEARNING}TECHNICAL FIELD [0001] The present invention relates to a method and apparatus for image encoding / decoding using a deep neural network-based blurred image learning,

본 개시는 정지 영상 및/또는 동영상 압축 시, 원 영상이 아닌 단계적 블러 영상을 입력하여 압축 효율을 높이기 위한 것이다. 보다 구체적으로, 샘플 영상과 샘플 영상들의 단계적 블러 영상들을 딥 신경망(deep neural network)을 이용하여 학습을 수행하고, 실제 부호화 대상 영상에 이를 적용하여 블러된 영상을 부호화하고, 압축된 영상을 복호화 후 블러 영상에 블러 복원 학습 결과를 적용하여 원 영상으로 복구하는 방법 및 장치에 관한 것이다.The present disclosure is intended to increase the compression efficiency by inputting a stepwise blurred image rather than an original image in still image and / or moving image compression. More specifically, the step blur images of the sample image and the sample images are subjected to learning using a deep neural network, the blurred image is encoded by applying the blurred image to the actual encoding target image, and the compressed image is decoded To a method and apparatus for recovering an original image by applying a blur reconstruction learning result to the blur image.

정지 영상 및/또는 동영상을 압축하기 위한 기존의 압축 알고리즘은 기본적으로 영상을 블록 단위로 나누고, 해당 블록에 영상의 중복된 데이터를 제거하기 위해 다양한 알고리즘을 적용하는 방식이 이용된다.A conventional compression algorithm for compressing a still image and / or a moving image is basically a method of dividing an image into blocks and applying various algorithms to remove redundant data of the image in the block.

이러한 영상의 중복된 데이터는 불필요한 중복(redundancy)과 가시성(visibility)에 기반을 두고 있다. 불필요한 중복은 동일 정보를 두 번 이상 전송할 때 발생하는 공간적 및/또는 시간적 중복 정보를 제거하는 것이다. 가시성은 인간의 눈은 색의 변화에 둔감하다는 점에 근거하여 색 정보는 휘도(밝기) 정보보다 저해상도로 전송해도 무방하다는 점을 이용한 것이다. The redundant data in these images is based on redundancy and visibility. Unnecessary redundancy is to remove spatial and / or temporal redundancy information that occurs when the same information is transmitted more than once. Visibility is based on the fact that human eyes are insensitive to color changes, and color information can be transmitted at a lower resolution than luminance (brightness) information.

영상 압축이란 기본적으로 입력된 원 영상 이미지를 분석하여 중복 정보를 최대한 줄여 인코딩하고 이를 다시 복원하여 최대한 원본에 가깝게 복원하는 행위이다.Image compression is basically the act of analyzing the input original image and reducing redundant information as much as possible, and restoring it to restore it as close as possible to the original.

일반적인 정지/동영상 비디오 압축 기법은 앞서 말한 바와 같이 영상을 먼저 블록 단위로 나누고 각 블록 단위로 다양한 예측 정보를 이용하여 중복 정보를 줄이고, 이를 변환 기법을 통해 사람이 인지할 수 있는 범위 밖의 정보를 줄이고 양자화 기법을 통해 압축하는 방법을 이용한다. As described above, a general still / moving image video compression technique divides an image into blocks first, reduces redundant information by using various prediction information in units of blocks, and reduces information beyond a human perception through a conversion technique We use the compression method through the quantization technique.

그러나 이러한 압축 방법들은 기본적으로 원 정보를 손실시킨 후 이를 다시 복원하는 방법을 사용하며, 한 번 손실된 정보를 다시 완전하게 복원하기에는 한계가 존재한다. However, these compression methods basically use a method of recovering original information after loss of the original information, and there is a limitation in completely restoring lost information once.

한편 상기 서술한 바를 이루기 위해 영상의 부호화 수행 전에 영상에 전처리(pre-processing) 및/또는 후처리(post-processing)를 적용하는 것은 영상 압축에 큰 영향을 미칠 수 있다. 만약 원 영상을 부호화기에 입력하기 전에, 전처리기를 통해 블러시켜 입력 및 부호화를 수행하고, 복호화 후 후처리기를 이용하여 블러 영상을 복원할 수 있다면 부호화 효율을 높을 수 있다. 그러나 블러 영상에서 원 영상을 복원하는 것은 영상 처리 분야에서 매우 어려운 일이다. 또한, 영상에 대해 블러 영상을 변환에 의해 원 영상으로 복원하는 함수를 구할 수 있다 하여도 이는 해당 영상에만 동작할 가능성이 높다. 따라서, 다른 영상에 상기 변환 함수를 그대로 적용하면 제대로 블러 복원이 동작하지 않을 수 있다. On the other hand, applying pre-processing and / or post-processing to an image before encoding an image may have a large effect on image compression in order to achieve the above-described description. If the original image can be input and encoded by blurring through the preprocessor before the original image is input to the encoder, and the blurred image can be reconstructed using the post processor after decoding, the encoding efficiency can be increased. However, restoring original image from blur image is very difficult in image processing field. In addition, even if a function of restoring the blur image to an original image by conversion can be obtained, it is highly likely to operate only on the corresponding image. Therefore, if the transform function is directly applied to another image, the blur reconstruction may not operate properly.

따라서, 블러 영상을 이용한 영상의 부호화 및 복호화를 효율적이고 효과적으로 수행할 수 있는 방안이 요구된다.Accordingly, there is a need for a method capable of effectively and effectively encoding and decoding an image using a blurred image.

본 개시의 기술적 과제는 딥 신경망을 이용하여 원 영상과 블러 영상들 간의 관계를 학습시켜 블러 영상에서 원 영상을 복원하는 방법 및 장치를 제공하는 것이다. SUMMARY OF THE INVENTION The present invention provides a method and apparatus for restoring an original image in a blurred image by learning a relationship between an original image and blurred images using a deep neural network.

본 개시의 다른 기술적 과제는 정지 영상 및/또는 동영상 부호화 시 원 화질의 영상을 부호화하는 것이 아니라 블록 별로 단계 블러된 영상을 입력함으로써 압축 용량을 줄일 수 있는 방법 및 장치를 제공하는 것이다.It is another object of the present invention to provide a method and apparatus for reducing a compression capacity by inputting a step-blurred image for each block, rather than coding an original image for still image and / or moving image coding.

본 개시의 또 다른 기술적 과제는 블러된 영상을 부호화한 뒤 이를 복호화 시, 딥 신경망의 학습된 결과를 이용하여 블러된 영상에서 원 화질의 영상을 복원할 수 있는 부호화 전처리 및/또는 후처리에 대한 방법 및 장치를 제공하는 것이다.According to another aspect of the present invention, there is provided a method for encoding and decoding a blurred image, which is capable of restoring an original image in a blurred image using a learned result of a deep neural network, A method and an apparatus.

본 개시에서 이루고자 하는 기술적 과제들은 이상에서 언급한 기술적 과제들로 제한되지 않으며, 언급하지 않은 또 다른 기술적 과제들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The technical objects to be achieved by the present disclosure are not limited to the above-mentioned technical subjects, and other technical subjects which are not mentioned are to be clearly understood from the following description to those skilled in the art It will be possible.

본 개시의 일 양상에 따르면 영상 부호화 방법이 제공될 수 있다. 상기 방법은 부호화 대상 영상을 하나 이상의 단위 영역으로 분할하는 단계, 상기 단위 영역의 각각에 대한 복원 파라미터 또는 블러 레벨을 유도하는 단계, 상기 단위 영역의 각각에 대해 블러를 수행하여 블러 영상을 획득하는 단계 및 상기 블러 영상을 부호화하는 단계를 포함할 수 있다. According to one aspect of the present disclosure, a video encoding method can be provided. The method includes dividing an image to be encoded into one or more unit areas, deriving a restoration parameter or blur level for each unit area, blurring each of the unit areas to obtain a blur image And encoding the blurred image.

본 개시에 따른 영상 부호화 방법에 있어서, 상기 단위 영역의 각각에 대한 복원 파라미터 또는 블러 레벨을 유도하는 단계는 하나 이상의 샘플 영상과 상기 샘플 영상의 단계별 블러 영상의 각각에 대한 복원 파라미터를 결정하는 과정을 통해 생성된 모델을 이용하여 수행될 수 있다. In the image encoding method according to the present disclosure, the step of deriving the reconstruction parameter or the blur level for each of the unit areas may include determining a reconstruction parameter for each of the one or more sample images and the blurred images of the sample images, Lt; RTI ID = 0.0 > model.

본 개시에 따른 영상 부호화 방법에 있어서, 상기 단위 영역에 대한 블러 레벨은 상기 단위 영역의 복잡도에 기초하여 결정될 수 있다.In the image encoding method according to the present disclosure, the blur level for the unit area may be determined based on the complexity of the unit area.

본 개시에 대하여 위에서 간략하게 요약된 특징들은 후술하는 본 개시의 상세한 설명의 예시적인 양상일 뿐이며, 본 개시의 범위를 제한하는 것은 아니다.The features briefly summarized above for this disclosure are only exemplary aspects of the detailed description of the disclosure which follow, and are not intended to limit the scope of the disclosure.

본 개시에 따르면, 정지 영상 및/또는 동영상을 바로 부호화하지 않고 딥 신경망을 이용하여 학습된 결과를 바탕으로 영상에 포함된 블록 별로 블러 전처리를 수행한 후 이를 부호화하고, 복호화 시 블러 영상을 복원하여 압축 효율을 높일 수 있는 방법 및 장치가 제공될 수 있다.According to the present disclosure, blur preprocessing is performed for each block included in an image based on the result of learning using a deep neural network without directly coding still images and / or moving images, and then the blur preprocessing is performed. A method and an apparatus capable of increasing the compression efficiency can be provided.

본 개시에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 개시가 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.The effects obtainable from the present disclosure are not limited to the effects mentioned above, and other effects not mentioned can be clearly understood by those skilled in the art from the description below will be.

도 1은 본 개시의 일 실시 예에 따른 영상의 부/복호화기의 구성 및 동작을 설명하기 위한 도면이다.
도 2는 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 학습 모듈(110)의 구성 및 동작을 설명하기 위한 도면이다.
도 3은 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 전처리 모듈(120)의 구성 및 동작을 설명하기 위한 도면이다.
도 4는 본 개시의 일 실시 예에 따라, 원 영상과 원 영상을 블러시킨 블러 영상들을 입력하여 복원 파라미터를 학습하는 과정을 설명하기 위한 도면이다.
도 5는 영상의 복잡도에 따라 블러 단계를 적응적으로 적용한 예를 도시한 도면이다.
도 6은 본 개시에 따른 딥 신경망 기반 영상 부호화 동작에 따른 영상 변화를 설명하기 위한 도면이다.
도 7은 본 개시에 따른 딥 신경망 기반 영상 복호화 동작에 따른 영상 변화를 설명하기 위한 도면이다.
도 8은 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 부호화 과정을 설명하기 위한 도면이다.
도 9는 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 복호화 과정을 설명하기 위한 도면이다.
FIG. 1 is a view for explaining the configuration and operation of an image decoder / decoder according to an embodiment of the present disclosure.
FIG. 2 is a diagram for explaining the configuration and operation of the deep neural network-based image learning module 110 according to an embodiment of the present disclosure.
FIG. 3 is a diagram for explaining the configuration and operation of a deep neural network-based image preprocessing module 120 according to an embodiment of the present disclosure.
4 is a diagram for explaining a process of learning reconstruction parameters by inputting blurred images obtained by blurring an original image and an original image according to an embodiment of the present disclosure.
5 is a diagram showing an example of adaptively applying blur steps according to the complexity of an image.
6 is a diagram for explaining an image change according to a deep neural network based image encoding operation according to the present disclosure.
7 is a view for explaining an image change according to a deep neural network based image decoding operation according to the present disclosure.
FIG. 8 is a diagram for explaining a de-neural network-based image encoding process according to an embodiment of the present disclosure.
FIG. 9 is a diagram for explaining a DIP-based image decoding process according to an embodiment of the present disclosure.

이하에서는 첨부한 도면을 참고로 하여 본 개시의 실시 예에 대하여 본 개시가 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나, 본 개시는 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. Hereinafter, embodiments of the present disclosure will be described in detail with reference to the accompanying drawings, which will be easily understood by those skilled in the art. However, the present disclosure may be embodied in many different forms and is not limited to the embodiments described herein.

본 개시의 실시 예를 설명함에 있어서 공지 구성 또는 기능에 대한 구체적인 설명이 본 개시의 요지를 흐릴 수 있다고 판단되는 경우에는 그에 대한 상세한 설명은 생략한다. 그리고, 도면에서 본 개시에 대한 설명과 관계없는 부분은 생략하였으며, 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.In the following description of the embodiments of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present disclosure rather unclear. Parts not related to the description of the present disclosure in the drawings are omitted, and like parts are denoted by similar reference numerals.

본 개시에 있어서, 어떤 구성요소가 다른 구성요소와 "연결", "결합" 또는 "접속"되어 있다고 할 때, 이는 직접적인 연결관계뿐만 아니라, 그 중간에 또 다른 구성요소가 존재하는 간접적인 연결관계도 포함할 수 있다. 또한 어떤 구성요소가 다른 구성요소를 "포함한다" 또는 "가진다"고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 배제하는 것이 아니라 또 다른 구성요소를 더 포함할 수 있는 것을 의미한다.In the present disclosure, when an element is referred to as being "connected", "coupled", or "connected" to another element, it is understood that not only a direct connection relationship but also an indirect connection relationship May also be included. Also, when an element is referred to as " comprising "or" having "another element, it is meant to include not only excluding another element but also another element .

본 개시에 있어서, 제1, 제2 등의 용어는 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용되며, 특별히 언급되지 않는 한 구성요소들간의 순서 또는 중요도 등을 한정하지 않는다. 따라서, 본 개시의 범위 내에서 일 실시 예에서의 제1 구성요소는 다른 실시 예에서 제2 구성요소라고 칭할 수도 있고, 마찬가지로 일 실시 예에서의 제2 구성요소를 다른 실시 예에서 제1 구성요소라고 칭할 수도 있다. In the present disclosure, the terms first, second, etc. are used only for the purpose of distinguishing one element from another, and do not limit the order or importance of elements, etc. unless specifically stated otherwise. Thus, within the scope of this disclosure, a first component in one embodiment may be referred to as a second component in another embodiment, and similarly a second component in one embodiment may be referred to as a first component .

본 개시에 있어서, 서로 구별되는 구성요소들은 각각의 특징을 명확하게 설명하기 위함이며, 구성요소들이 반드시 분리되는 것을 의미하지는 않는다. 즉, 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있고, 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 따라서, 별도로 언급하지 않더라도 이와 같이 통합된 또는 분산된 실시 예도 본 개시의 범위에 포함된다. In the present disclosure, the components that are distinguished from each other are intended to clearly illustrate each feature and do not necessarily mean that components are separate. That is, a plurality of components may be integrated into one hardware or software unit, or a single component may be distributed into a plurality of hardware or software units. Thus, unless otherwise noted, such integrated or distributed embodiments are also included within the scope of this disclosure.

본 개시에 있어서, 다양한 실시 예에서 설명하는 구성요소들이 반드시 필수적인 구성요소들은 의미하는 것은 아니며, 일부는 선택적인 구성요소일 수 있다. 따라서, 일 실시 예에서 설명하는 구성요소들의 부분집합으로 구성되는 실시 예도 본 개시의 범위에 포함된다. 또한, 다양한 실시 예에서 설명하는 구성요소들에 추가적으로 다른 구성요소를 포함하는 실시 예도 본 개시의 범위에 포함된다. In the present disclosure, the components described in the various embodiments are not necessarily essential components, and some may be optional components. Thus, embodiments consisting of a subset of the components described in one embodiment are also included within the scope of the present disclosure. Also, embodiments that include other elements in addition to the elements described in the various embodiments are also included in the scope of the present disclosure.

인공지능 분야에 있어 딥 러닝의 등장은 기계 학습 분야에 있어 크나큰 성공을 가져왔다. 기본적으로 딥 러닝이란 인공 신경망에서 발전한 형태의 인공 지능으로, 뇌의 뉴런과 유사한 정보 입출력 계층을 활용해 데이터를 학습하는 것으로서, 신경망 계층을 다층으로 구성하는 심층 신경망을 통해 구현될 수 있다.The emergence of deep learning in the field of artificial intelligence has made great success in the field of machine learning. Basically, deep learning is a type of artificial intelligence developed from artificial neural networks. It learns data by using information input / output hierarchy similar to brain neurons, and can be implemented through a neural network composed of multiple layers of neural networks.

딥 러닝은 매우 방대한 양의 데이터를 학습하여, 새로운 데이터가 입력될 경우 학습 결과를 바탕으로 확률적으로 가장 높은 답을 선택하기 때문에 영상의 환경이 바뀌어도 적응적으로 동작할 수 있다. Deep learning learns a very large amount of data, and when new data is input, it chooses the highest answer with probability based on the learning result, so it can adaptively operate even if the environment of the image changes.

본 개시는 상기 딥 신경망 기술을 이용하여 방대한 양의 샘플 영상과 해당 영상들의 단계별 블러 영상들을 학습시키고, 원 영상과 단계별 블러 영상들 간의 복원 파라미터를 구할 수 있다. 이후, 높은 압축 효율을 얻기 위해 원 영상을 입력하는 대신 단계별 블러 영상을 부호화기에 입력하고 부호화된 영상과 함께 복원 파라미터를 전송할 수 있다. 복호화기에서 영상 복원 시에는, 복호화된 영상에 다시 복원 파라미터를 적용하여 원 영상을 복원할 수 있다.In the present disclosure, a tremendous amount of sample images and step-by-step blur images of the images can be learned using the deep neural network technique, and restoration parameters between the original image and the blur images can be obtained. Instead of inputting the original image, a blurred image may be input to the encoder and a restoration parameter may be transmitted along with the encoded image to obtain high compression efficiency. When restoring an image at a decoder, an original image can be restored by applying restoration parameters to the decoded image again.

이하 첨부된 도면을 참조하여 본 개시를 구성하는 장치 및 동작 방법을 본 개시의 실시 예를 참조하여 상세히 설명한다. 하기 설명에서는 구체적인 블록 모듈에 대해 설명하고 있는데 이는 본 개시의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐 본 개시의 범위 내에서 변형이나 변경이 이루어 질 수 있다. DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An apparatus and an operation method constituting the present disclosure with reference to the accompanying drawings will be described in detail with reference to the embodiments of the present disclosure. The following description refers to a specific block module, which is provided for a more general understanding of the present disclosure, and variations and modifications may be made within the scope of the present disclosure.

상술한 문제점을 해결하기 위한 본 개시의 구성은 크게 샘플 영상들을 학습하여 영상 복원 파라미터 및/또는 블러 레벨을 구하는 단계, 학습이 완료된 딥 신경망에 부호화의 대상인 원 영상을 입력하여 블러 영상으로 변환하는 단계, 블러된 영상을 부호화 하는 단계, 부호화된 영상을 복호화하고 이를 전 단계에서 구해진 영상 복원 파라미터와 함께 학습된 딥 신경망에 입력하여 원 영상으로 복원하는 단계를 포함할 수 있다. According to another aspect of the present invention, there is provided a method of decoding an image, the method comprising: obtaining image restoration parameters and / or blur levels by learning sample images; inputting an original image, which is an object to be encoded, A step of encoding the blurred image, a step of decoding the encoded image, and inputting the decoded image into the learned neural network, together with the image restoration parameters obtained in the previous step, to restore the original image.

도 1은 본 개시의 일 실시 예에 따른 영상의 부/복호화기의 구성 및 동작을 설명하기 위한 도면이다. FIG. 1 is a view for explaining the configuration and operation of an image decoder / decoder according to an embodiment of the present disclosure.

본 개시의 일 실시 예에 따른 영상 부/복호화 시스템은 딥 신경망 기반 영상 학습 모듈(110), 딥 신경망 기반 영상 전처리 모듈(120), 영상 부호화 모듈(130), 영상 복호화 모듈(140) 및/또는 딥 신경망 기반 영상 후처리 모듈(150)을 포함하여 구성될 수 있다.The image encoding / decoding system according to an embodiment of the present disclosure includes a deep neural network based image learning module 110, a deep neural network based image preprocessing module 120, an image encoding module 130, an image decoding module 140 and / And a deep neural network based image post-processing module 150.

도 2는 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 학습 모듈(110)의 구성 및 동작을 설명하기 위한 도면이다.FIG. 2 is a diagram for explaining the configuration and operation of the deep neural network-based image learning module 110 according to an embodiment of the present disclosure.

딥 신경망 기반 영상 학습 모듈(110)은 샘플 영상들을 학습하는 기능을 수행할 수 있다. 도 2에 도시된 바와 같이, 딥신경만 기반 영상 학습 모듈(110)은 샘플 영상 DB부(210), 영상 분할부(220), 영상 블록 블러부(230), 영상 블러 복원부(240) 및/또는 블러 레벨 결정부(250)를 포함하여 구성될 수 있다. 또한, 딥 신경망 기반 영상 학습 모듈(110)은 복수의 기능을 수행하는 딥 신경망 모델의 결합으로 구현될 수도 있다.The deep neural network based image learning module 110 may perform a function of learning sample images. 2, the deep nerve-based image learning module 110 includes a sample image DB unit 210, an image divider 220, a video block blur unit 230, an image blur reconstruction unit 240, And / or a blur level determination unit (250). Also, the deep neural network based image learning module 110 may be implemented as a combination of a deep neural network model that performs a plurality of functions.

샘플 영상 DB부(210)는 전처리를 실제 수행하기 전에 학습을 위한 샘플 영상 DB를 위한 저장 장치일 수 있다. 샘플 영상 DB부(210)는 다양한 크기와 장면으로 구성된 영상들을 포함할 수 있다. 샘플 영상 DB부(210)의 영상들은 학습의 편의를 위해 영상의 특성 및/또는 카테고리 별로 태깅될 수 있다.The sample image DB unit 210 may be a storage device for a sample image DB for learning before actually performing the preprocessing. The sample image DB unit 210 may include images of various sizes and scenes. The images of the sample image DB unit 210 may be tagged according to image characteristics and / or categories for convenience of learning.

영상 분할부(220)는 학습을 위한 영상이 입력될 때 딥 신경망에서 이를 학습하기 위해 적당한 패치 단위로 영상을 분할하여 딥 신경망으로 입력하는 기능을 수행할 수 있다. 상기 패치의 크기는 딥 신경망의 하드웨어 및/또는 소프트웨어적 계층망의 레벨 및/또는 영상의 특성, 예컨대, 영상의 전체 크기에 따라 달라질 수 있다.The image divider 220 may perform a function of dividing an image into a unit of an appropriate patch to input the image for learning into the deep neural network to learn it in the deep neural network. The size of the patch may vary depending on the level of the hardware and / or software layer network of the deep neural network and / or the characteristics of the image, e.g., the total size of the image.

영상 블록 블러부(230)는 분할된 영상 블록에 대해 영상 블러를 수행할 수 있다. 영상 블러를 수행하기 위한 블러 레벨은 단계적으로 조정될 수 있다. 예컨대, 최초로 수행되는 영상 블러의 블러 레벨은 가장 낮은 레벨(예컨대, 블러 레벨 1)로 설정될 수 있다.The image block blur unit 230 may perform image blur on the divided image blocks. The blur level for performing image blur can be adjusted stepwise. For example, the blur level of the first-performed image blur can be set to the lowest level (e.g., blur level 1).

영상 블러 복원부(240)는 블러된 영상을 다시 역과정을 통해 원영상에 가깝게 복원할 수 있다. 블러된 영상을 원영상으로 복원하는 과정에서, 해당 블러 레벨에 대한 복원 파라미터가 유도될 수 있다. 예컨대, 원 샘플 영상과 샘플 영상들에 단계적 블러를 적용한 단계적 블러 영상들을 입력받아 이를 분석하고 학습을 수행함으로써 복원 파라미터를 구하는 기능을 수행할 수 있다. The image blur reconstruction unit 240 can restore the blurred image close to the original image through the inverse process. In the process of restoring the blurred image to the original image, a restoration parameter for the blur level can be derived. For example, it is possible to perform the function of obtaining the restoration parameters by inputting the step blur images in which the step blur is applied to the original sample images and the sample images, analyzing the blur images, and performing learning.

영상 블록 블러부(230)와 영상 블러 복원부(240)의 동작은 블러 레벨을 조정해 나가면서 복수 회 수행될 수 있다. 예컨대, 블러 레벨 1에 대해 영상 블러 및 영상 복원이 수행된 뒤, 블러 레벨을 재조정하여 상기 동작을 반복할 수 있다. 예컨대, 블러 레벨 1에 대한 영상 블로 및 영상 복원이 수행된 뒤, 블러 레벨 2에 대해 영상 블러 및 영상 복원을 수행할 수 있다. 상기 동작은 블러 레벨 1부터 시작하여, 소정의 블러 레벨 n(n은 2 이상의 정수)까지 반복 수행될 수 있다.The operations of the image block blurring unit 230 and the image blurring restoring unit 240 may be performed a plurality of times while adjusting the blur level. For example, after performing image blur and image restoration for blur level 1, the blur level may be readjusted to repeat the operation. For example, image blur and image restoration for blur level 1 may be performed, and image blur and image restoration may be performed for blur level 2. [ The above operation can be repeatedly performed from a blur level 1 to a predetermined blur level n (n is an integer of 2 or more).

블러 레벨 1부터 블러 레벨 n까지, 블러 레벨을 조정하면서 영상 블러 및 영상 복원을 수행하는 경우, 영상 블러 복원부(240)는 블러 레벨 n 영상에 대한 영상 복원을 바로 수행하지 않고, 이전 단계, 예컨대, 블러 레벨 n-1 영상과의 가중치를 이용하여 영상을 복원할 수 있다.When image blur and image reconstruction are performed while adjusting the blur level from blur level 1 to blur level n, the image blur reconstruction unit 240 does not directly perform image reconstruction for the blur level n image, , And the blur level n-1 image.

블러 레벨 결정부(250)는 상기 결과를 바탕으로 원영상으로 복원이 가능한 최적의 블러 레벨을 결정할 수 있다. 예컨대, 패치 단위로 입력된 영상을 분석하여 복잡도에 따라 어느 단계(레벨)의 블러를 선택할 경우에 최적의 복원이 가능한지를 학습하고, 학습 후에는 그 결과를 이용하여 블러 레벨을 결정하는 기능을 수행할 수 있다. 최적의 블러 레벨이 결정되면, 해당 블러 레벨에 대한 복원 파라미터가 결정될 수 있다.The blur level determination unit 250 can determine an optimal blur level that can be restored to the original image based on the result. For example, by analyzing an image input by a patch unit, it is learned which optimum level of restoration is possible when a blur of a certain level (level) is selected according to complexity, and after learning, a function of determining a blur level by using the result is performed can do. Once the optimal blur level is determined, a restoration parameter for that blur level can be determined.

도 3은 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 전처리 모듈(120)의 구성 및 동작을 설명하기 위한 도면이다.FIG. 3 is a diagram for explaining the configuration and operation of a deep neural network-based image preprocessing module 120 according to an embodiment of the present disclosure.

딥 신경망 기반 영상 전처리 모듈(120)은 학습이 완료된 딥 신경망 모델을 이용할 수 있다. 도 3에 도시된 바와 같이, 딥 신경망 기반 영상 전처리 모듈(120)은 영상 분할부(310), 딥 신경만 기반 학습 모델(320), 블러 레벨 결정부(330) 및/또는 영상 블러부(340)를 포함하여 구성될 수 있다.The deep neural network based image preprocessing module 120 may use a deep neural network model that has been learned. 3, the deep neural network based image preprocessing module 120 includes an image segmentation unit 310, a deep nerve-based learning model 320, a blur level determination unit 330, and / or an image blur unit 340 ). ≪ / RTI >

딥 신경망 기반 영상 전처리 모듈(120)은 부호화 대상 영상, 즉 원 영상을 입력받을 수 있다. 영상 분할부(310)는 입력된 부호화 대상 영상을 소정의 크기를 갖는 패치 단위로 분할할 수 있다. 영상 분할부(310)는 영상의 특징에 기초하여 입력된 영상을 분할할 수 있다. The deep neural network-based image preprocessing module 120 can receive an encoding target image, that is, an original image. The image divider 310 can divide the inputted encoding target image into patch units having a predetermined size. The image divider 310 can divide the input image based on the characteristics of the image.

분할된 영상은 딥 신경망 기반 학습 모델(320) 및/또는 블러 레벨 결정부(330)에 입력될 수 있다. 딥 신경망 기반 학습 모델(320)은 도 2를 참조하여 설명한 딥 신경망 기반 학습 모듈에 의해 학습된 복수 개의 모델을 포함할 수 있다. The divided image may be input to the deep neural network-based learning model 320 and / or the blur level determination unit 330. The deep neural network based learning model 320 may include a plurality of models learned by the deep neural network based learning module described with reference to FIG.

블러 레벨 결정부(330)는 딥 신경망 기반 학습 모델(320)을 이용하여 입력된 분할 영상의 블러 레벨을 결정할 수 있다. 블러 레벨의 결정에는 전술한 딥 신경망 기반 학습의 결과가 이용될 수 있다. 입력받은 분할 영상(예컨대, 패치)의 각각에 대해 상기 블러 레벨을 결정하는 동작을 수행하여, 각각의 분할 영상에 대한 최적의 블러 레벨을 결정할 수 있다. 최적의 블러 레벨이 결정되면, 그에 따라 영상 복원 파라미터가 결정될 수 있으며, 이 경우에도 딥 신경망 기반 학습 결과가 이용될 수 있다.The blur level determination unit 330 can determine the blur level of the input divided image using the deep neural network based learning model 320. [ The results of the above-described deep neural network based learning can be used to determine the blur level. The blur level may be determined for each input divided image (e.g., patch) to determine an optimal blur level for each divided image. Once the optimal blur level is determined, the image restoration parameters can be determined accordingly, and in this case also the deep neural network based learning results can be used.

영상 블러부(340)는 결정된 블러 레벨에 따라 각 분할 영상을 영상 블러 처리하여 패치별 블러 영상을 출력할 수 있다. 이때, 블러 레벨에 관한 정보 및/또는 영상 복원 파라미터에 관한 정보가 함께 출력될 수 있다.The image blur unit 340 may blur each divided image according to the determined blur level to output a blur image for each patch. At this time, information on blur level and / or information on image restoration parameters may be output together.

도 4는 본 개시의 일 실시 예에 따라, 원 영상과 원 영상을 블러시킨 블러 영상들을 입력하여 복원 파라미터를 학습하는 과정을 설명하기 위한 도면이다.4 is a diagram for explaining a process of learning reconstruction parameters by inputting blurred images obtained by blurring an original image and an original image according to an embodiment of the present disclosure.

도 4에서, X는 원 영상을 의미한다. 원 영상(X)은 블러 레벨이 각각 1 내지 n인 n개의 딥 신경망(convolution n)에 각각 입력될 수 있다. 즉, 도 4에서, convolution n은 원 영상(X)을 블러 레벨 n으로 블러시키기 위한 딥 신경망을 의미한다. 블러 레벨이 상이한 영상 사이에는 가중 복원 파라미터가 유도될 수 있다. 예컨대, 전술한 바와 같이, 블러 레벨 n 영상을 복원하기 위해, 블러 레벨 n-1 영상과의 가중치가 이용될 수 있으며, 도 4에서, W는 이 가중치를 의미한다. 영상을 블러시키기 위한 각각의 딥 신경망(convolution n)은 다른 딥 신경망과의 사이에서 상기 가중 복원 파라미터(Wn)를 유도할 수 있다.In FIG. 4, X denotes an original image. The original image X can be input to n deep neural networks (convolution n) having blur levels of 1 to n, respectively. That is, in FIG. 4, convolution n denotes a deep neural network for blurring the original image X at blur level n. A weighted restoration parameter can be derived between images with different blur levels. For example, as described above, to restore the blur level n image, a weight with the blur level n-1 image may be used, and in FIG. 4, W means this weight. Each deep neural network (convolution n) for blurring an image can derive the weighted restoration parameter Wn with another deep neural network.

각각의 딥 신경망(convolution n)으로부터 각각의 블러 레벨로 블러된 영상 g1(X) 내지 gn(X)가 출력될 수 있으며, gn(X)는 원 영상(X)을 레벨 n으로 블러시킨 블러 영상을 의미한다.Images g1 (X) to gn (X) blurred at respective blur levels can be output from respective deep neural networks (convolution n), and gn (X) is a blur image obtained by blurring the original image X at level n .

각각의 블러 레벨로 블러된 영상은 Recon으로 입력될 수 있다. Recon은 각각의 레벨로 블러된 영상을 복원하기 위한 딥 신경망을 의미한다. 각각의 블러 레벨로 블러된 영상 g1(X) 내지 gn(X)는 Recon에서 복원되어 D(x1) 내지 D(xn)으로 출력될 수 있다. D(xn)은 레벨 n으로 블러된 영상을 Recon에서 복원한 영상을 의미한다.Images blurred at each blur level can be input to Recon. Recon means a deep neural network for reconstructing an image blurred at each level. The images g1 (X) to gn (X) blurred at respective blur levels can be restored in Recon and output as D (x1) to D (xn). D (xn) denotes an image obtained by reconstructing an image blurred at level n from Recon.

각각의 레벨로 블러된 후, Recon에서 복원된 각각의 복원 영상은 L로 입력될 수 있다. L은 복원된 영상들의 최적화된 블러 레벨을 결정하는 역할을 수행할 수 있다. After each level is blurred, each reconstructed image reconstructed in Recon can be input as L. L may play a role in determining an optimized blur level of reconstructed images.

또한, 딥 신경망 기반 영상 학습 모듈(110)은 원 영상(X)과 원 영상을 단계별로 블러시킨 블러 영상들(g1(X), g2(X) … gn(X))을 입력받아, 원 영상과 블러 영상들과의 복원을 위한 복원 파라미터를 구할 수 있다. 이러한 학습 과정을 통해 새로운 영상이 입력되더라도 영상에 적응적으로 복원 파라미터를 구할 수 있게 된다. The deep neural network based image learning module 110 receives the blur images g 1 (X), g 2 (X) ... g n (X) blurring the original image X and the original image step by step , Restoration parameters for reconstruction of the original image and blur images can be obtained. Even if a new image is input through the learning process, restoration parameters can be obtained adaptively to the image.

도 5는 영상의 복잡도에 따라 블러 단계를 적응적으로 적용한 예를 도시한 도면이다.5 is a diagram showing an example of adaptively applying blur steps according to the complexity of an image.

영상의 블러 단계 결정시 전체 영상에 대해 단일한 블러 단계를 적용할 수 있다. 경우에 따라서는, 영상 전체에 대해 단일한 블러 단계를 적용할 경우 영상 내의 특징에 따라 복원의 정확도가 달라질 수 있다. 예컨대, 영상 전체에 대해 단일 블러 함수를 적용할 경우, 장면이 단순한 부분은 쉽게 복원이 가능하지만 영상의 장면이 복잡한 부분은 노이즈가 발생할 가능성이 있다. 이런 경우에 대처하기 위해, 본 개시의 일 실시 예에 따르면, 영상 학습 시 복원 파라미터와 더불어 영상의 복잡도에 따라 어떤 블러 단계를 적용해야 최적의 복원이 가능한지도 같이 학습하는 것이 바람직할 수 있다. 영상의 복잡도에 따라 블러 단계를 적응적으로 적용하는 실시 예에 따르면, 실제 부호화 대상 영상의 입력 시 영상의 블록 또는 패치 단위로 블러 단계를 적응적으로 결정할 수 있으므로, 장면이 복잡한 영상의 경우에도 최적의 복원이 가능할 수 있다. A single blur step can be applied to the entire image when determining the blur step of the image. In some cases, when a single blur step is applied to the entire image, the accuracy of reconstruction may vary depending on the characteristics of the image. For example, when a single blur function is applied to an entire image, a simple portion of a scene can be easily restored, but noise in a portion where a scene of the image is complicated may occur. In order to cope with such a case, according to one embodiment of the present disclosure, it may be desirable to learn, in addition to the restoration parameters at the time of image learning, a certain blur step according to the complexity of the image so as to determine whether optimal restoration is possible. According to the embodiment in which the blur step is adaptively applied according to the complexity of the image, the blur step can be adaptively determined in blocks or patch units of the image upon input of the actual image to be encoded, May be possible.

도 5에 도시된 바와 같이, 입력 영상은 복수의 단위 영역으로 분할될 수 있다. 각각의 단위 영역에 대한 영상의 복잡도에 기초하여, 각 단위 영역에 대한 블러 레벨이 결정될 수 있다. 예컨대, 영상의 복잡도가 낮은 단위 영역(510 내지 530, 570 내지 590)에 대해서는 높은 블러 레벨(블러 레벨 4)을 적용할 수 있다. 또한, 영상의 복잡도가 중간인 단위 영역(540, 560)에 대해서는 중간 블러 레벨(블러 레벨 2)을 적용할 수 있다. 또한, 영상의 복잡도가 높은 단위 영역(550)에 대해서는 낮은 블러 레벨(블러 레벨 1)을 적용할 수 있다.As shown in FIG. 5, the input image may be divided into a plurality of unit areas. Based on the complexity of the image for each unit area, the blur level for each unit area can be determined. For example, a high blur level (blur level 4) can be applied to the unit areas 510 to 530 and 570 to 590 having low image complexity. Further, an intermediate blur level (blur level 2) can be applied to the unit areas 540 and 560 in which the image complexity is intermediate. Further, a low blur level (blur level 1) can be applied to the unit area 550 having a high image complexity.

도 5에 도시된 바와 같이, 영상을 구성하는 각 단위 영역의 복잡도에 따라, 블러 레벨을 적응적으로 적용할 경우, 최적의 복원이 가능할 수 있다. 그러나, 구성의 복잡도가 고려되어야 하는 경우에는 영상 전체에 단일한 블러 레벨을 적용할 수도 있다.As shown in FIG. 5, when the blur level is adaptively applied according to the complexity of each unit area constituting an image, optimal restoration can be performed. However, if the complexity of the configuration is to be considered, a single blur level may be applied to the entire image.

샘플 영상들의 학습이 완료되고 딥 신경망 기반 영상 학습 모듈이 구성되면 실제 부호화를 위한 영상을 입력할 수 있다. 이때 영상은 정지 영상 및/또는 동영상(비디오)일 수 있다.Once the learning of the sample images is completed and the deep neural network based image learning module is constructed, the image for the actual encoding can be inputted. At this time, the image may be a still image and / or a moving image (video).

도 6은 본 개시에 따른 딥 신경망 기반 영상 부호화 동작에 따른 영상 변화를 설명하기 위한 도면이다.6 is a diagram for explaining an image change according to a deep neural network based image encoding operation according to the present disclosure.

도 7은 본 개시에 따른 딥 신경망 기반 영상 복호화 동작에 따른 영상 변화를 설명하기 위한 도면이다.7 is a view for explaining an image change according to a deep neural network based image decoding operation according to the present disclosure.

도 6 및 도 7의 각 영상은, 부호화기 및 복호화기의 각 모듈에 입력되는 영상과 각 모듈로부터 출력되는 영상에 대응될 수 있다. 전술한 바와 같이, 영상의 복잡도에 따라 적응적으로 블러 레벨을 적용할 수 있으나, 도 6 및 도 7에 도시한 예에서는 설명의 편의상 하나의 영상에 단일 블러 단계를 적용한 것이다.6 and 7 may correspond to an image input to each module of the encoder and decoder and an image output from each module. As described above, the blur level can be applied adaptively according to the complexity of the image. However, in the example shown in Figs. 6 and 7, a single blur step is applied to one image for convenience of explanation.

도 1, 도 6 및 도 7을 참조하여 설명하면, 원 영상(610)을 입력으로 하여 딥 신경망 기반 영상 전처리기 모듈(120)에서 출력된 블러 영상(620)은 패치 별 복원 파라미터와 함께 영상 부호화 모듈(130)로 입력될 수 있다. 영상 부호화 모듈(130)은 블러 영상(620)에 대해 압축을 수행하여 부호화 영상(630)을 출력할 수 있다. 블러 영상(620)에 대한 압축은 원 영상(610)을 바로 압축하는 경우에 비해 높은 효율을 가질 수 있다. 영상 부호화 모듈(130)은 블러 영상(620)을 압축한 부호화 영상(630)과 함께, 영상을 복원하기 위한 복원 파라미터를 출력할 수 있다. 부호화 영상(630)과 복원 파라미터는 비트스트림에 포함되어 영상 복호화 모듈(140)로 전송될 수 있다. 1, 6, and 7, the blur image 620 output from the deep neural network-based image preprocessing module 120 with the original image 610 as input is subjected to image encoding Module 130 as shown in FIG. The image encoding module 130 may compress the blur image 620 and output the encoded image 630. [ Compression of blur image 620 may have higher efficiency than compression of original image 610 directly. The image encoding module 130 may output a restoration parameter for restoring an image together with the encoded image 630 obtained by compressing the blur image 620. [ The coded image 630 and the restoration parameter may be included in the bitstream and transmitted to the image decoding module 140. [

영상 복호화 모듈(140)은 영상의 재생을 위해 입력된 부호화 영상(710)에 대해 영상 복호화를 수행하여 복호화 영상(720)을 출력할 수 있다. 영상 복호화 모듈(140)이 출력한 복호화 영상이 일반적인 영상 코덱을 이용해 복호화된 영상이라면 바로 출력 장치를 통해 렌더링이 가능하다. 영상 복호화 모듈(140)이 복호화한 영상이 본 개시에 따라 부호화된 블러 영상이라면 영상 복호화 모듈(140)은 블러된 복호화 영상(720)을 출력할 수 있다. 영상 복호화 모듈(140)이 블러된 복호화 영상(720)을 출력하는 경우, 딥 신경망 기반 영상 후처리 모듈(150)을 통해 영상을 후처리하여 블러 복원 영상(730)을 생성하는 과정이 더 수행될 수 있다. The image decoding module 140 may perform image decoding on the input encoded image 710 and output the decoded image 720 to reproduce the image. If the decoded image output from the image decoding module 140 is an image decoded using a general image codec, the image can be directly rendered through the output device. If the image decoded by the image decoding module 140 is a blurred image coded according to the present disclosure, the image decoding module 140 can output the blurred decoded image 720. [ When the image decoding module 140 outputs the blurred decoded image 720, a process of post-processing the image through the deep neural network based image post-processing module 150 to generate the blurred restoration image 730 is further performed .

또한, 딥 신경망 기반 영상 후처리 모듈(150)의 동작의 다른 실시 예를 설명하면, 복호화 영상(720)은 전술한 바와 같이 영상의 복잡도에 따라 패치 별로 다른 블러 레벨이 적용되어 있을 수 있다. 이 경우, 복호화 영상(720)은 패치 별로 함께 입력된 복원 파라미터를 이용하여 영상을 처리함으로써, 각 패치를 원 영상으로 복원하는 기능을 수행할 수 있다.In another embodiment of the operation of the de-neural network based image post-processing module 150, the decoded image 720 may have different blur levels for each patch depending on the complexity of the image as described above. In this case, the decoded image 720 can perform a function of restoring each patch into an original image by processing the image using restoration parameters input together for each patch.

본 개시의 일 실시 예에 따르면 원 영상(740)에 근사한 블러 복원 영상(730)을 효율적으로 복원할 수 있으므로, 압축 효율의 향상과 함께, 높은 품질의 복원 영상을 생성할 수 있다.According to one embodiment of the present disclosure, since the blurred reconstruction image 730 approximate to the original image 740 can be efficiently reconstructed, it is possible to improve the compression efficiency and generate a reconstructed image of high quality.

도 8은 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 부호화 과정을 설명하기 위한 도면이다.FIG. 8 is a diagram for explaining a de-neural network-based image encoding process according to an embodiment of the present disclosure.

단계 S810에서는, 먼저 딥 신경망 기반 영상 부/복호화 시스템을 구성하기 위해서, 블러 영상들로부터 원 영상을 복원하고 영상의 복잡도에 따른 최상의 블러 레벨 선택을 위한 샘플 영상들의 영상 복원 파라미터 및/또는 블러 레벨의 선택에 대한 학습이 수행될 수 있다.In step S810, in order to construct a deep neural network-based image encoding / decoding system, an original image is reconstructed from blur images and an image restoration parameter of sample images for selecting the best blur level according to the complexity of the image and / Learning about the selection can be performed.

학습이 완료된 후, 단계 S820에서, 실제 부호화 대상 영상을 입력받을 수 있다. 단계 S830에서, 입력된 영상은 블록 또는 패치 단위(단위 분할 영역)로 분할하여 입력될 수 있다. 단계 S840에서, 단위 분할 영역의 복잡도에 따라 단위 분할 영역 별로 블러 레벨을 적응적으로 선택할 수 있다. 단계 S850에서, 적응적으로 선택된 블러 레벨에 대한 복원 파라미터를 획득할 수 있다. 단계 S860에서, 각각의 단위 분할 영역에 대한 영상 블러가 수행될 수 있다. 단계 S870에서, 단위 분할 영역 별로 블러가 적용된 영상은 부호화기로 입력되어 부호화될 수 있다. After the learning is completed, in step S820, the actual encoding target image can be input. In step S830, the input image may be divided into blocks or patch units (unit division areas) and input. In step S840, the blur level can be adaptively selected for each unit division area according to the complexity of the unit division area. In step S850, a restoration parameter for the blur level adaptively selected may be obtained. In step S860, image blurring for each unit division area may be performed. In step S870, an image to which the blur is applied for each unit division region may be input to an encoder and coded.

도 9는 본 개시의 일 실시 예에 따른 딥 신경망 기반 영상 복호화 과정을 설명하기 위한 도면이다.FIG. 9 is a diagram for explaining a DIP-based image decoding process according to an embodiment of the present disclosure.

단계 S910에서 도 8을 참조하여 설명된 부호화 과정을 통해 생성된 비트스트림이 입력될 수 있다. 단계 S920에서 영상 복호화가 수행될 수 있다. 압축되어 입력된 영상은 복호화 모듈에 입력되어 부호화의 역동작을 통해 복호화를 수행하며 복호화가 수행된 영상은 딥 신경망 기반 영상 후처리 모듈에 입력될 수 있다(단계 S930). 딥 신경망 기반 영상 후처리 모듈은 딥 신경망 기반 영상 전처리 모듈에서 학습된 결과를 이용하여 동작할 수 있다. 단계 S940에서, 딥 신경망 기반 영상 후처리 모듈은 입력된 입력된 복호화 영상과 단위 분할 영역(블록 또는 패치)별 복원 파라미터 및/또는 블러 레벨을 이용하여, 블러 영상을 복원할 수 있다. 단계 S950에서, 복원된 블러 영상은 출력 장치를 통해 렌더링될 수 있다.In step S910, the bitstream generated through the encoding process described with reference to FIG. 8 may be input. In step S920, image decoding may be performed. The compressed image is input to the decoding module to perform decoding through the inverse operation of encoding, and the decoded image may be input to the deep neural network-based image post-processing module (step S930). The deep neural network based image post-processing module can operate using the results learned in the deep neural network based image preprocessing module. In step S940, the deep neural network based image post-processing module may restore the blurred image using the input decoded image and the restoration parameter and / or blur level for each unit partition area (block or patch). In step S950, the restored blurred image may be rendered through the output device.

본 개시의 예시적인 방법들은 설명의 명확성을 위해서 동작의 시리즈로 표현되어 있지만, 이는 단계가 수행되는 순서를 제한하기 위한 것은 아니며, 필요한 경우에는 각각의 단계가 동시에 또는 상이한 순서로 수행될 수도 있다. 본 개시에 따른 방법을 구현하기 위해서, 예시하는 단계에 추가적으로 다른 단계를 포함하거나, 일부의 단계를 제외하고 나머지 단계를 포함하거나, 또는 일부의 단계를 제외하고 추가적인 다른 단계를 포함할 수도 있다.Although the exemplary methods of this disclosure are represented by a series of acts for clarity of explanation, they are not intended to limit the order in which the steps are performed, and if necessary, each step may be performed simultaneously or in a different order. In order to implement the method according to the present disclosure, the illustrative steps may additionally include other steps, include the remaining steps except for some steps, or may include additional steps other than some steps.

본 개시의 다양한 실시 예는 모든 가능한 조합을 나열한 것이 아니고 본 개시의 대표적인 양상을 설명하기 위한 것이며, 다양한 실시 예에서 설명하는 사항들은 독립적으로 적용되거나 또는 둘 이상의 조합으로 적용될 수도 있다.The various embodiments of the disclosure are not intended to be all-inclusive and are intended to illustrate representative aspects of the disclosure, and the features described in the various embodiments may be applied independently or in a combination of two or more.

또한, 본 개시의 다양한 실시 예는 하드웨어, 펌웨어(firmware), 소프트웨어, 또는 그들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우, 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다. In addition, various embodiments of the present disclosure may be implemented by hardware, firmware, software, or a combination thereof. In the case of hardware implementation, one or more application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays A general processor, a controller, a microcontroller, a microprocessor, and the like.

본 개시의 범위는 다양한 실시 예의 방법에 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 애플리케이션, 펌웨어(firmware), 프로그램 등), 및 이러한 소프트웨어 또는 명령 등이 저장되어 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함한다. The scope of the present disclosure is to be accorded the broadest interpretation as understanding of the principles of the invention, as well as software or machine-executable instructions (e.g., operating system, applications, firmware, Instructions, and the like are stored and are non-transitory computer-readable medium executable on the device or computer.

Claims (1)

부호화 대상 영상을 하나 이상의 단위 영역으로 분할하는 단계;
상기 단위 영역의 각각에 대한 복원 파라미터 또는 블러 레벨을 유도하는 단계;
상기 단위 영역의 각각에 대해 블러를 수행하여 블러 영상을 획득하는 단계; 및
상기 블러 영상을 부호화하는 단계를 포함하고,
상기 단위 영역의 각각에 대한 복원 파라미터 또는 블러 레벨을 유도하는 단계는,
하나 이상의 샘플 영상과 상기 샘플 영상의 단계별 블러 영상의 각각에 대한 복원 파라미터를 결정하는 과정을 통해 생성된 모델을 이용하여 수행되고,
상기 단위 영역에 대한 블러 레벨은,
상기 단위 영역의 복잡도에 기초하여 결정되는 것을 특징으로 하는 영상 부호화 방법.
Dividing an image to be encoded into one or more unit areas;
Deriving a restoration parameter or blur level for each of the unit areas;
Performing blurring on each of the unit areas to obtain blur images; And
And encoding the blurred image,
Wherein deriving a reconstruction parameter or a blur level for each of the unit areas comprises:
A reconstruction parameter for each of the one or more sample images and the blurred image of each of the blurred images of the sample image,
Wherein the blur level for the unit area is a blur level,
Wherein the determination is made based on the complexity of the unit area.
KR1020170027582A 2017-03-03 2017-03-03 Method and apparatus for picture encoding/decoding using deep neural network based blur image learning KR20180100976A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170027582A KR20180100976A (en) 2017-03-03 2017-03-03 Method and apparatus for picture encoding/decoding using deep neural network based blur image learning

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170027582A KR20180100976A (en) 2017-03-03 2017-03-03 Method and apparatus for picture encoding/decoding using deep neural network based blur image learning

Publications (1)

Publication Number Publication Date
KR20180100976A true KR20180100976A (en) 2018-09-12

Family

ID=63592962

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170027582A KR20180100976A (en) 2017-03-03 2017-03-03 Method and apparatus for picture encoding/decoding using deep neural network based blur image learning

Country Status (1)

Country Link
KR (1) KR20180100976A (en)

Cited By (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020080751A1 (en) * 2018-10-19 2020-04-23 삼성전자 주식회사 Encoding method and apparatus thereof, and decoding method and apparatus thereof
US20200126185A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Artificial intelligence (ai) encoding device and operating method thereof and ai decoding device and operating method thereof
WO2020080623A1 (en) * 2018-10-19 2020-04-23 삼성전자 주식회사 Method and apparatus for ai encoding and ai decoding of image
WO2020080665A1 (en) * 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
KR20200073078A (en) * 2018-12-13 2020-06-23 주식회사 픽스트리 Image processing device of learning parameter based on machine Learning and method of the same
KR20200073079A (en) * 2018-12-13 2020-06-23 주식회사 픽스트리 Image processing device of learning parameter based on machine Learning and method of the same
WO2020141814A1 (en) * 2019-01-03 2020-07-09 Samsung Electronics Co., Ltd. Display apparatus, image providing apparatus, and methods of controlling the same
KR20200095589A (en) 2019-01-18 2020-08-11 한국항공대학교산학협력단 Advanced system and method for video compression
US10819992B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Methods and apparatuses for performing encoding and decoding on image
US10817989B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
US10817987B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
WO2020231691A1 (en) * 2019-05-15 2020-11-19 Disney Enterprises, Inc. Content adaptive optimization for neural data compression
CN112396560A (en) * 2019-08-16 2021-02-23 通用电气精准医疗有限责任公司 System and method for deblurring medical images using a deep neural network
US10950009B2 (en) 2018-10-19 2021-03-16 Samsung Electronics Co., Ltd. AI encoding apparatus and operation method of the same, and AI decoding apparatus and operation method of the same
KR102245682B1 (en) * 2019-11-11 2021-04-27 연세대학교 산학협력단 Apparatus for compressing image, learning apparatus and method thereof
WO2021091178A1 (en) * 2019-11-08 2021-05-14 Samsung Electronics Co., Ltd. Artificial intelligence (ai) encoding apparatus and operating method thereof and ai decoding apparatus and operating method thereof
WO2021101243A1 (en) * 2019-11-20 2021-05-27 Samsung Electronics Co., Ltd. Apparatus and method for using ai metadata related to image quality
KR20210061906A (en) * 2019-11-20 2021-05-28 삼성전자주식회사 Apparatus and method of using AI metadata related to image quality
WO2021210761A1 (en) * 2020-04-14 2021-10-21 삼성전자 주식회사 Ai down-scaling apparatus and operating method therefor, and ai up-scaling apparatus and operating method therefor
US11182876B2 (en) 2020-02-24 2021-11-23 Samsung Electronics Co., Ltd. Apparatus and method for performing artificial intelligence encoding and artificial intelligence decoding on image by using pre-processing
US11190784B2 (en) 2017-07-06 2021-11-30 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
CN113793276A (en) * 2021-09-02 2021-12-14 清华大学 Method for regional self-adaptive deblurring of picture according to fuzzy severity
US11275866B2 (en) * 2019-07-17 2022-03-15 Pusan National University Industry-University Cooperation Foundation Image processing method and image processing system for deep learning
US11395001B2 (en) 2019-10-29 2022-07-19 Samsung Electronics Co., Ltd. Image encoding and decoding methods and apparatuses using artificial intelligence
US11495037B2 (en) 2019-07-05 2022-11-08 Samsung Electronics Co., Ltd. Artificial intelligence processor and method of performing neural network operation thereof
US11616988B2 (en) 2018-10-19 2023-03-28 Samsung Electronics Co., Ltd. Method and device for evaluating subjective quality of video
KR102565318B1 (en) * 2022-09-29 2023-08-10 아주대학교 산학협력단 Method and apparatus for acquiring continuous images from blurred image

Cited By (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11190784B2 (en) 2017-07-06 2021-11-30 Samsung Electronics Co., Ltd. Method for encoding/decoding image and device therefor
US11170534B2 (en) 2018-10-19 2021-11-09 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US11170472B2 (en) 2018-10-19 2021-11-09 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
WO2020080665A1 (en) * 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US11288770B2 (en) 2018-10-19 2022-03-29 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
US11616988B2 (en) 2018-10-19 2023-03-28 Samsung Electronics Co., Ltd. Method and device for evaluating subjective quality of video
US11200702B2 (en) 2018-10-19 2021-12-14 Samsung Electronics Co., Ltd. AI encoding apparatus and operation method of the same, and AI decoding apparatus and operation method of the same
US20200126185A1 (en) 2018-10-19 2020-04-23 Samsung Electronics Co., Ltd. Artificial intelligence (ai) encoding device and operating method thereof and ai decoding device and operating method thereof
US11190782B2 (en) 2018-10-19 2021-11-30 Samsung Electronics Co., Ltd. Methods and apparatuses for performing encoding and decoding on image
US10819992B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Methods and apparatuses for performing encoding and decoding on image
US10817989B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
US10832447B2 (en) 2018-10-19 2020-11-10 Samsung Electronics Co., Ltd. Artificial intelligence encoding and artificial intelligence decoding methods and apparatuses using deep neural network
US10817985B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
US11647210B2 (en) 2018-10-19 2023-05-09 Samsung Electronics Co., Ltd. Methods and apparatuses for performing encoding and decoding on image
US10817988B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US10819993B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Methods and apparatuses for performing encoding and decoding on image
US10825205B2 (en) 2018-10-19 2020-11-03 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10825139B2 (en) 2018-10-19 2020-11-03 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
US10825204B2 (en) 2018-10-19 2020-11-03 Samsung Electronics Co., Ltd. Artificial intelligence encoding and artificial intelligence decoding methods and apparatuses using deep neural network
US10825206B2 (en) 2018-10-19 2020-11-03 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10825203B2 (en) 2018-10-19 2020-11-03 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10817987B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US20210358083A1 (en) 2018-10-19 2021-11-18 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US10817986B2 (en) 2018-10-19 2020-10-27 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US10937197B2 (en) 2018-10-19 2021-03-02 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
US10950009B2 (en) 2018-10-19 2021-03-16 Samsung Electronics Co., Ltd. AI encoding apparatus and operation method of the same, and AI decoding apparatus and operation method of the same
US11170473B2 (en) 2018-10-19 2021-11-09 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US11748847B2 (en) 2018-10-19 2023-09-05 Samsung Electronics Co., Ltd. Method and apparatus for streaming data
US11720997B2 (en) 2018-10-19 2023-08-08 Samsung Electronics Co.. Ltd. Artificial intelligence (AI) encoding device and operating method thereof and AI decoding device and operating method thereof
US11688038B2 (en) 2018-10-19 2023-06-27 Samsung Electronics Co., Ltd. Apparatuses and methods for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080751A1 (en) * 2018-10-19 2020-04-23 삼성전자 주식회사 Encoding method and apparatus thereof, and decoding method and apparatus thereof
US11663747B2 (en) 2018-10-19 2023-05-30 Samsung Electronics Co., Ltd. Methods and apparatuses for performing artificial intelligence encoding and artificial intelligence decoding on image
WO2020080623A1 (en) * 2018-10-19 2020-04-23 삼성전자 주식회사 Method and apparatus for ai encoding and ai decoding of image
US11943454B2 (en) 2018-12-13 2024-03-26 Pixtree Co., Ltd. Image processing apparatus and operation method for learning parameters based on machine learning
KR20200073078A (en) * 2018-12-13 2020-06-23 주식회사 픽스트리 Image processing device of learning parameter based on machine Learning and method of the same
WO2020122478A3 (en) * 2018-12-13 2020-08-06 주식회사 픽스트리 Image processing device learning parameters on basis of machine learning and operation method for same
KR20200073079A (en) * 2018-12-13 2020-06-23 주식회사 픽스트리 Image processing device of learning parameter based on machine Learning and method of the same
WO2020141814A1 (en) * 2019-01-03 2020-07-09 Samsung Electronics Co., Ltd. Display apparatus, image providing apparatus, and methods of controlling the same
US11308650B2 (en) 2019-01-03 2022-04-19 Samsung Electronics Co., Ltd. Display apparatus, image providing apparatus, and methods of controlling the same
KR20200095589A (en) 2019-01-18 2020-08-11 한국항공대학교산학협력단 Advanced system and method for video compression
US11057634B2 (en) 2019-05-15 2021-07-06 Disney Enterprises, Inc. Content adaptive optimization for neural data compression
WO2020231691A1 (en) * 2019-05-15 2020-11-19 Disney Enterprises, Inc. Content adaptive optimization for neural data compression
US11495037B2 (en) 2019-07-05 2022-11-08 Samsung Electronics Co., Ltd. Artificial intelligence processor and method of performing neural network operation thereof
US11275866B2 (en) * 2019-07-17 2022-03-15 Pusan National University Industry-University Cooperation Foundation Image processing method and image processing system for deep learning
CN112396560A (en) * 2019-08-16 2021-02-23 通用电气精准医疗有限责任公司 System and method for deblurring medical images using a deep neural network
US11405637B2 (en) 2019-10-29 2022-08-02 Samsung Electronics Co., Ltd. Image encoding method and apparatus and image decoding method and apparatus
US11395001B2 (en) 2019-10-29 2022-07-19 Samsung Electronics Co., Ltd. Image encoding and decoding methods and apparatuses using artificial intelligence
WO2021091178A1 (en) * 2019-11-08 2021-05-14 Samsung Electronics Co., Ltd. Artificial intelligence (ai) encoding apparatus and operating method thereof and ai decoding apparatus and operating method thereof
US11720998B2 (en) 2019-11-08 2023-08-08 Samsung Electronics Co., Ltd. Artificial intelligence (AI) encoding apparatus and operating method thereof and AI decoding apparatus and operating method thereof
KR102245682B1 (en) * 2019-11-11 2021-04-27 연세대학교 산학협력단 Apparatus for compressing image, learning apparatus and method thereof
KR20210061906A (en) * 2019-11-20 2021-05-28 삼성전자주식회사 Apparatus and method of using AI metadata related to image quality
US11636626B2 (en) 2019-11-20 2023-04-25 Samsung Electronics Co., Ltd. Apparatus and method of using AI metadata related to image quality
WO2021101243A1 (en) * 2019-11-20 2021-05-27 Samsung Electronics Co., Ltd. Apparatus and method for using ai metadata related to image quality
CN114731455A (en) * 2019-11-20 2022-07-08 三星电子株式会社 Apparatus and method for using AI metadata related to image quality
US11182876B2 (en) 2020-02-24 2021-11-23 Samsung Electronics Co., Ltd. Apparatus and method for performing artificial intelligence encoding and artificial intelligence decoding on image by using pre-processing
WO2021210761A1 (en) * 2020-04-14 2021-10-21 삼성전자 주식회사 Ai down-scaling apparatus and operating method therefor, and ai up-scaling apparatus and operating method therefor
US11989852B2 (en) 2020-04-14 2024-05-21 Samsung Electronics Co., Ltd. AI downscaling apparatus and operating method thereof, and AI upscaling apparatus and operating method thereof
CN113793276A (en) * 2021-09-02 2021-12-14 清华大学 Method for regional self-adaptive deblurring of picture according to fuzzy severity
CN113793276B (en) * 2021-09-02 2024-04-26 清华大学 Method for self-adaptively deblurring picture in different areas according to blurring severity
KR102565318B1 (en) * 2022-09-29 2023-08-10 아주대학교 산학협력단 Method and apparatus for acquiring continuous images from blurred image

Similar Documents

Publication Publication Date Title
KR20180100976A (en) Method and apparatus for picture encoding/decoding using deep neural network based blur image learning
US20220078418A1 (en) Method and apparatus of neural network based processing in video coding
KR102287947B1 (en) Apparatus and method for performing artificial intelligence encoding and artificial intelligence decoding of image
KR102285738B1 (en) Method and apparatus for assessing subjective quality of a video
JP7143529B2 (en) IMAGE RESTORATION METHOD AND DEVICE, ELECTRONIC DEVICE, AND STORAGE MEDIUM
Zhang et al. Davd-net: Deep audio-aided video decompression of talking heads
CN115606179A (en) CNN filter for learning-based downsampling for image and video coding using learned downsampling features
CN114868401A (en) Coding scheme for video data using downsampling/upsampling and depth map non-linear filtering
WO2020261314A1 (en) Image encoding method and image decoding method
CN114096987A (en) Video processing method and device
KR102287942B1 (en) Apparatus and method for performing artificial intelligence encoding and artificial intelligence decoding of image using pre-processing
CN115552905A (en) Global skip connection based CNN filter for image and video coding
KR20190127090A (en) Method and Apparatus for Just Noticeable Quantization Distortion based Perceptual Video Coding using Machine Learning
KR20210056179A (en) AI encoding apparatus and operating method for the same, and AI decoding apparatus and operating method for the same
CN116349225A (en) Content adaptive online training method and apparatus for deblocking in block-by-block image compression
KR102245682B1 (en) Apparatus for compressing image, learning apparatus and method thereof
JP2022548374A (en) A Coding Scheme for Immersive Video Using Asymmetric Downsampling and Machine Learning
JP7443564B2 (en) Video decoding method, apparatus, and computer program, and video encoding method
CN111901595B (en) Video coding method, device and medium based on deep neural network
JP2016525295A (en) Multilevel spatio-temporal resolution enhancement of video
KR20220063063A (en) A method and an apparatus for performing artificial intelligence encoding and artificial intelligence decoding
BR102021001287A2 (en) METHOD TO COMPRESS LIGHT-FIELD DATA
WO2024077740A1 (en) Convolutional neural network for in-loop filter of video encoder based on depth-wise separable convolution
CN115988201B (en) Method, apparatus, electronic device and storage medium for encoding film grain
KR102421718B1 (en) A method and an apparatus for performing artificial intelligence encoding and artificial intelligence decoding