KR20220154940A - Apparatus and Method for Selecting Skip Frames - Google Patents

Apparatus and Method for Selecting Skip Frames Download PDF

Info

Publication number
KR20220154940A
KR20220154940A KR1020210062514A KR20210062514A KR20220154940A KR 20220154940 A KR20220154940 A KR 20220154940A KR 1020210062514 A KR1020210062514 A KR 1020210062514A KR 20210062514 A KR20210062514 A KR 20210062514A KR 20220154940 A KR20220154940 A KR 20220154940A
Authority
KR
South Korea
Prior art keywords
skip
frame
frames
skippable
image
Prior art date
Application number
KR1020210062514A
Other languages
Korean (ko)
Other versions
KR102620281B1 (en
Inventor
이상윤
손한빈
이형민
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Priority to KR1020210062514A priority Critical patent/KR102620281B1/en
Publication of KR20220154940A publication Critical patent/KR20220154940A/en
Application granted granted Critical
Publication of KR102620281B1 publication Critical patent/KR102620281B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/002Image coding using neural networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/149Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Algebra (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The present invention provides a skip frame selecting apparatus and method. The apparatus comprises: a frame setting unit which sets skip-enable frames and fixed frames among multiple frames of an input image; a skip frame selection unit which is implemented as pre-learned artificial neural networks, determines whether each of skip-enable frames is skipped from skip-enable frames and frames adjacent to each of skip-enable frames according to learned method and activates or deactivates a skip flag; and an encoder which encodes remaining frames except for skip frames having the skip flag activated therein by a predetermined method and acquires an encoded image. The skip frame selection unit is pre-learned based on compression rates of the encoded image according to whether skip frames are excluded, and picture differences between a decoded image decoding the encoded image and a restoration image which restores the skip frames according to whether skip frames are excluded. Therefore, the present invention can improve the compression rates while maintaining a quality of video images.

Description

스킵 프레임 선별 장치 및 방법{Apparatus and Method for Selecting Skip Frames}Skip frame selection apparatus and method {Apparatus and Method for Selecting Skip Frames}

본 발명은 스킵 프레임 선별 장치 및 방법에 관한 것으로, 인공 신경망을 이용한 스킵 프레임 선별 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for selecting a skip frame, and relates to an apparatus and method for selecting a skip frame using an artificial neural network.

영상 압축 기법에서는 다수 프레임 중 일부 프레임을 스킵하여 전체 프레임 수를 줄임으로써 압축을 수행하는 프레임 스키핑 기법이 제안된 바 있다.In video compression techniques, a frame skipping technique has been proposed in which compression is performed by skipping some frames among multiple frames to reduce the total number of frames.

프레임 스키핑 기법은 다수 프레임의 비디오 영상에서 시간적인 중복성을 제거하기 위해 일부 프레임을 제거하여 프레임의 수를 줄이는 기법으로 크게 두가지 방식으로 적용되었다. 첫번째는 우선 제한적 스트리밍 환경에서 단순히 비트율을 조절하기 위해 프레임을 스킵하여 전송하는 방식이다. 두번째는 프레임 보간 기법을 통한 프레임 복원을 고려하여, 입력 영상의 모션에 따라 프레임을 선별적으로 스킵하는 방식이다. 즉 프레임 스키핑 기법은 단순히 고정된 주기로 프레임을 스킵하는 기법에서, 입력 영상의 모션을 분석하여 적응적으로 프레임을 선택하여 스킵하는 방식으로 발전하여 비디오 영상의 압축률을 향상시켰다.The frame skipping technique is a technique that reduces the number of frames by removing some frames in order to remove temporal redundancy in a video image of multiple frames, and is largely applied in two ways. The first is a method of simply skipping and transmitting frames to adjust the bit rate in a limited streaming environment. The second method is a method of selectively skipping frames according to the motion of an input image in consideration of frame restoration through frame interpolation. That is, the frame skipping technique has evolved from a technique of simply skipping frames at a fixed cycle to a technique of adaptively selecting and skipping frames by analyzing the motion of an input image, thereby improving the compression rate of video images.

그러나 이러한 기존의 프레임 스키핑 기법은 코덱에 따른 영상 인코딩 및 디코딩시의 영상 품질 변화나 프레임 보간을 통해 복원되는 프레임의 품질 등을 충분하게 고려하지 못한 방식으로 프레임을 선별하였다. 즉 단순히 비트율을 조절하기 위해 고정된 프레임 또는 임의의 프레임을 스킵하는 경우, 이후 스킵된 프레임을 프레임 보간 기법으로 복구할지라도 영상 품질이 크게 저하되어 비트율의 이득 대비 화질 손실이 매우 크게 나타나는 문제가 있다. 그리고 프레임 보간 기법을 통한 프레임 복원을 고려하여 프레임을 스킵하는 경우에도, 입력 영상의 모션에 기초하여 기지정된 방식으로 선택되는 프레임을 스킵함에 따라, 코덱 보간되어 생성되는 프레임의 품질이 저하되는 문제가 있으며, 압축률을 크게 향상시키기 어렵다는 한계가 있다.However, these conventional frame skipping techniques select frames in a way that does not sufficiently consider changes in video quality during video encoding and decoding according to codecs or the quality of frames restored through frame interpolation. That is, when a fixed frame or an arbitrary frame is simply skipped to adjust the bit rate, even if the skipped frame is subsequently restored by frame interpolation, the image quality is greatly deteriorated, resulting in a very large loss of image quality compared to the gain of the bit rate. . In addition, even when frames are skipped in consideration of frame restoration through frame interpolation, the quality of frames generated by codec interpolation is degraded as frames selected in a predetermined manner based on the motion of the input video are skipped. However, there is a limitation that it is difficult to greatly improve the compression ratio.

한국 등록 특허 제10-2207736호 (2021.01.20 등록)Korean Registered Patent No. 10-2207736 (registered on 2021.01.20)

본 발명의 목적은 인코딩 및 디코딩된 이후 프레임 보간으로 획득되는 프레임의 품질을 고려하여 스킵 프레임을 선별할 수 있는 스킵 프레임 선별 장치 및 방법을 제공하는데 있다.An object of the present invention is to provide an apparatus and method for selecting a skip frame by considering the quality of a frame obtained through frame interpolation after encoding and decoding.

본 발명의 다른 목적은 비디오 영상의 품질을 유지하면서 압축률을 향상시킬 수 있는 스킵 프레임 선별 장치 및 방법을 제공하는데 있다.Another object of the present invention is to provide an apparatus and method for selecting a skip frame capable of improving a compression rate while maintaining the quality of a video image.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 스킵 프레임 선별 장치는 입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 프레임 설정부; 미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 스킵 프레임 선별부; 및 상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 인코더를 포함하되, 상기 스킵 프레임 선별부는 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습된다.In order to achieve the above object, an apparatus for selecting skip frames according to an embodiment of the present invention includes a frame setting unit configured to set skippable frames and fixed frames among a plurality of frames of an input image; Implemented as a pre-learned artificial neural network, skip frame selection for activating or inactivating a skip flag by determining whether to skip each of the skippable frames from each of the skippable frames and adjacent frames of each of the skippable frames according to the learned method. wealth; and an encoder that obtains an encoded image by encoding frames other than the skip frame in which the skip flag is activated in a predetermined manner, wherein the skip frame selector determines a compression rate of the encoded image and an encoded image according to whether the skip frame is excluded or not. It is pre-learned based on a picture quality difference between a decoded image obtained by decoding and a reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded.

상기 스킵 프레임 선별부는 상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습될 수 있다.The skip frame selection unit calculates the compression rate of an encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of a decoded image obtained by decoding the same according to a predetermined method, so that the compression rate and the image quality are the axes. The compression rate of the encoded image obtained by projecting into the coordinates of the dimensional space and encoding a plurality of frames excluding the skip frame and the image quality of the reconstructed image obtained by decoding and reconstructing the skip frame are calculated and projected into the coordinates of the 2D space, and the two coordinates are calculated. It can be learned based on the displacement of the liver.

상기 스킵 프레임 선별부는 학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화할 수 있다.The skip frame selector may obtain a skip probability value for the skippable frame according to a learned method, and deactivate or activate a skip flag according to whether the obtained skip probability value is greater than or equal to a predetermined reference value.

상기 스킵 프레임 선별부는 상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습될 수 있다.The skip frame selector obtains a fitting function that follows the pattern of the compression rate and image quality projected in the two-dimensional space when the skip frame is not excluded, and the obtained fitting function and the compression rate projected when the skip frame is excluded It can be learned based on displacement between coordinates of image quality.

상기 스킵 프레임 선별부는 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습될 수 있다.When the skip frame selector excludes the skip frame, a difference between a displacement between the projected compression rate and image quality coordinates and the fitting function and the skip probability value may be back-propagated and learned as a loss.

상기 스킵 프레임 선별부는 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습될 수 있다.The skip frame selector determines whether a displacement between the projected compression rate and image quality coordinates and the fitting function is greater than or equal to a predetermined reference displacement when skip frames are excluded, and an activation or inactivation state of the skip flag. The loss obtained by comparison can be back-propagated and learned.

상기 프레임 설정부는 상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정할 수 있다.The frame setting unit may set a fixed frame at a predetermined interval from an initial frame among the plurality of frames and set remaining frames as skippable frames.

상기 프레임 설정부는 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 스킵 프레임 선별부로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가할 수 있다.The frame setting unit applies each skippable frame and an adjacent frame of the skippable frame to the skip frame selector, except when a skip flag for the adjacent frame is already activated, and applies the next skippable frame and the adjacent frame. can

상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 스킵 프레임 선별 방법은 입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 단계; 미리 학습된 인공 신경망을 이용하여, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 단계; 및 상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 단계를 포함하되, 상기 인공 신경망은 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습된다.To achieve the above object, a method for selecting skip frames according to another embodiment of the present invention includes setting skippable frames and fixed frames among a plurality of frames of an input image; activating or inactivating a skip flag by determining whether each of the skippable frames is skipped from each of the skippable frames and adjacent frames of each of the skippable frames according to a learned method using a pre-learned artificial neural network; and obtaining an encoded image by encoding frames other than the skip frame in which the skip flag is activated in a predetermined manner, wherein the artificial neural network calculates a compression rate of the encoded image and the encoded image according to whether the skip frame is excluded or not. It is pre-learned based on the difference in quality between the decoded decoded image and the reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded.

따라서, 본 발명의 실시예에 따른 스킵 프레임 선별 장치 및 방법은 코덱에 따른 인코딩 및 디코딩된 이후 프레임 보간으로 획득되는 프레임의 품질을 사전에 고려하여 스킵 프레임을 선별함으로써, 비디오 영상의 품질을 유지하면서 압축률을 향상시킬 수 있다.Therefore, the skip frame selection apparatus and method according to an embodiment of the present invention considers the quality of frames obtained by frame interpolation after encoding and decoding according to a codec in advance to select skip frames, thereby maintaining the quality of video images. The compression rate can be improved.

도 1은 본 발명의 일 실시예에 따른 영상 압축 및 복원 시스템을 나타낸다.
도 2는 도 1의 영상 압축 및 복원 시스템의 영상 압축 및 복원 개념을 설명하기 위한 도면이다.
도 3은 도 1의 스킵 프레임 보간부의 상세 구성의 일 예를 나타낸다.
도 4는 도 1의 프레임 선별 학습부의 상세 구성의 일 예를 나타낸다.
도 5는 도 1의 스킵 프레임 선별부를 학습시키는 개념을 설명하기 위한 도면이다.
도 6은 압축률과 화질에 따른 손실을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 스킵 프레임 선별 방법을 나타낸다.
1 shows an image compression and restoration system according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining the concept of image compression and restoration of the image compression and restoration system of FIG. 1 .
FIG. 3 shows an example of a detailed configuration of the skip frame interpolator of FIG. 1 .
FIG. 4 shows an example of a detailed configuration of the frame selection learning unit of FIG. 1 .
FIG. 5 is a diagram for explaining the concept of learning the skip frame selector of FIG. 1 .
6 is a diagram for explaining loss according to compression rate and image quality.
7 shows a skip frame selection method according to an embodiment of the present invention.

본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention and its operational advantages and objectives achieved by the practice of the present invention, reference should be made to the accompanying drawings illustrating preferred embodiments of the present invention and the contents described in the accompanying drawings.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다. Hereinafter, the present invention will be described in detail by describing preferred embodiments of the present invention with reference to the accompanying drawings. However, the present invention may be embodied in many different forms and is not limited to the described embodiments. And, in order to clearly describe the present invention, parts irrelevant to the description are omitted, and the same reference numerals in the drawings indicate the same members.

명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. Throughout the specification, when a part "includes" a certain component, it means that it may further include other components, not excluding other components unless otherwise stated. In addition, terms such as "... unit", "... unit", "module", and "block" described in the specification mean a unit that processes at least one function or operation, which is hardware, software, or hardware. And it can be implemented as a combination of software.

도 1은 본 발명의 일 실시예에 따른 영상 압축 및 복원 시스템을 나타내고, 도 2는 도 1의 영상 압축 및 복원 시스템의 영상 압축 및 복원 개념을 설명하기 위한 도면이다.1 shows an image compression and restoration system according to an embodiment of the present invention, and FIG. 2 is a diagram for explaining the concept of image compression and restoration of the image compression and restoration system of FIG. 1 .

도 1을 참조하면, 본 실시예에 따른 영상 압축 및 복원 시스템은 연속하는 다수 프레임으로 구성된 입력 영상을 인가받아 기지정된 방식으로 압축하는 영상 압축 장치(100)와 압축된 영상을 인가받아 기지정된 방식으로 복원하는 영상 복원 장치(200)를 포함할 수 있다.Referring to FIG. 1, an image compression and restoration system according to the present embodiment includes an image compression device 100 that receives an input image composed of a plurality of consecutive frames and compresses it in a predetermined method and a compressed image in a predetermined method It may include an image restoration device 200 that restores to .

영상 압축 장치(100)가 영상을 압축하는 방식에서는 크게 화면 내 예측을 기반으로 하는 압축 기술과 화면간 예측을 기반으로 하는 압축 기술로 구분될 수 있다. 화면 내 예측 기술은 동일 프레임 내에서 인접한 픽셀은 서로 상관성이 높다는 성질을 이용하여, 화면 내에서 예측 가능한 픽셀을 제거함으로써 공간적 중복성이 최소화되도록 압축하는 방식으로 픽셀 스킵 기법으로 볼 수 있다. 그리고 화면 간 예측 기술은 연속하는 다수의 프레임은 시간적으로 높은 상관성을 갖는다는 성질을 이용하여, 다수 프레임에서 예측 가능한 프레임을 제거함으로써 시간적 중복성이 최소화되도록 압축하는 방식으로 프레임 스킵 기법으로 볼 수 있다.A method of compressing an image by the video compression apparatus 100 can be largely divided into a compression technique based on intra-prediction and a compression technique based on inter-prediction. The intra-prediction technique can be regarded as a pixel skipping technique, which compresses to minimize spatial redundancy by removing predictable pixels in a picture using the property that adjacent pixels within the same frame have high correlation with each other. In addition, the inter-prediction technique uses the property that a plurality of consecutive frames has high temporal correlation and removes predictable frames from the plurality of frames to compress them so that temporal redundancy is minimized. It can be seen as a frame skipping technique.

영상 압축 장치(100)는 화면 내 예측 및 화면 간 예측 중 적어도 하나를 이용하여 압축을 수행할 수도 있으나, 화면 간 예측을 기반으로 프레임을 제거하는 프레임 스킵 기법은 압축률에 대비하여 복원된 프레임의 화질 손실이 커 실제로는 압축에는 거의 이용되고 있지 않은 실정이다. 이에 본 실시예에서 영상 압축 장치(100)는 복원되는 영상의 프레임의 품질을 고려하여, 화질 저하를 방지할 수 있으면서 동시에 압축률을 높일 수 있는 프레임을 선별하고, 선별된 프레임을 스킵하여 압축함으로써 프레임 스킵 기법이 실질적으로 영상 압축에 이용될 수 있도록 한다.The video compression apparatus 100 may perform compression using at least one of intra-prediction and inter-prediction. However, the frame skipping technique for removing frames based on inter-prediction is based on the compression rate and the image quality of the restored frame. The loss is large, so it is hardly used for compression in practice. Therefore, in this embodiment, the image compression device 100 considers the quality of the frame of the image to be restored, selects a frame capable of preventing deterioration of image quality and simultaneously increases the compression rate, skips the selected frame, and compresses the frame. The skip technique can be practically used for image compression.

이에 도 1의 영상 압축 장치(100)는 본 발명에 따른 스킵 프레임 선별 장치라고 할 수 있다. 스킵 프레임 선별 장치(100)는 프레임 설정부(110), 스킵 프레임 선별부(120) 및 인코더(130)를 포함할 수 있다.Accordingly, the video compression device 100 of FIG. 1 may be referred to as a skip frame selection device according to the present invention. The skip frame selection device 100 may include a frame setting unit 110 , a skip frame selection unit 120 and an encoder 130 .

프레임 설정부(110)는 압축 대상이 되는 연속하는 다수 프레임으로 구성된 영상을 인가받고, 인가된 영상의 다수 프레임 중에서 제거될 수 있는 스킵 가능 프레임과 제거되어서는 안되는 고정 프레임을 설정한다. 상기한 바와 같이 화면 간 예측을 기반으로 하는 프레임 스킵 기법은 스킵되는 프레임과 인접한 프레임들 사이의 시간적 상관성을 기반으로 하므로, 다수의 프레임이 연속적으로 스킵되면 시간적 상관성이 낮아져 스킵된 프레임을 정상적으로 복구할 수 없게 되는 문제가 발생한다.The frame setting unit 110 receives an image composed of a plurality of consecutive frames to be compressed, and sets skippable frames that can be removed and fixed frames that must not be removed among the plurality of frames of the applied image. As described above, since the frame skipping technique based on inter-prediction is based on the temporal correlation between the skipped frame and adjacent frames, if a number of frames are consecutively skipped, the temporal correlation is lowered and the skipped frame can be restored normally. An impossible problem arises.

이러한 문제를 방지하기 위해서 본 실시예의 스킵 프레임 선별 장치(100)에서 프레임 설정부(110)는 연속하는 다수의 프레임을 제거 가능한 스킵 가능 프레임과 제거되어서는 안되는 고정 프레임으로 구분할 수 있다. 이때 프레임 설정부(110)는 다수의 프레임에서 스킵 가능 프레임과 고정 프레임을 기지정된 주기에 따라 설정할 수 있다.In order to prevent this problem, in the skip frame selection device 100 of the present embodiment, the frame setter 110 can divide a plurality of consecutive frames into skippable frames that can be removed and fixed frames that must not be removed. At this time, the frame setting unit 110 may set skippable frames and fixed frames in a plurality of frames according to a predetermined cycle.

가장 단순한 일 예로서 프레임 설정부(110)는 다수의 프레임을 시간 순서에 따라 고정 프레임과 스킵 가능 프레임으로 교대로 설정할 수 있다. 즉 홀수번째 프레임을 고정 프레임으로 설정하고, 짝수 번째 프레임은 스킵 가능 프레임으로 설정할 수도 있다. 이는 스킵 가능 프레임에 시간적으로 인접한 2개의 프레임이 고정 프레임으로 설정됨에 따라 스킵 가능 프레임을 용이하게 복원할 수 있도록 하기 위함이다.As the simplest example, the frame setting unit 110 may alternately set a plurality of frames into fixed frames and skippable frames according to time order. That is, odd-numbered frames may be set as fixed frames, and even-numbered frames may be set as skippable frames. This is to ensure that the skippable frame can be easily restored as two frames temporally adjacent to the skippable frame are set as fixed frames.

또한 프레임 설정부(110)는 다수의 프레임에서 초기 프레임 이후 4의 주기로 고정 프레임을 설정하고, 설정된 고정 프레임 사이의 프레임을 스킵 가능 프레임으로 설정할 수 있다. 고정 프레임과 스킵 가능 프레임을 교대로 설정하는 경우, 스킵 가능 프레임을 용이하게 복원할 수 있는 장점이 있는 반면, 본 실시예에서는 화질 저하를 고려하여 스킵 가능 프레임을 모두 스킵하지 않으므로, 압축률의 개선 효과가 크지 않을 수 있다. 이에 스킵 프레임 선별 장치(100)는 다수의 프레임 중 고정 프레임의 비율을 줄이고 스킵 가능 프레임의 비율을 높임으로써, 짝수번째 프레임뿐만 아니라 일부 홀수번째 프레임도 스킵될 수 있도록 하여, 스킵 가능한 프레임 수를 증가시킴으로써 압축율이 개선되도록 할 수 있다. 상기한 바와 같이, 4개 프레임 주기로 고정 프레임을 설정하는 경우, 고정 프레임 사이의 3개의 프레임이 스킵 가능 프레임으로 설정된다.In addition, the frame setting unit 110 may set fixed frames in a cycle of 4 after the initial frame in a plurality of frames, and set frames between the set fixed frames as skippable frames. When the fixed frame and the skippable frame are alternately set, there is an advantage in that the skippable frame can be easily restored. However, in the present embodiment, since all skippable frames are not skipped in consideration of image quality degradation, the compression rate is improved. may not be large. Accordingly, the skip frame selection apparatus 100 increases the number of skippable frames by reducing the ratio of fixed frames and increasing the ratio of skippable frames, so that not only even-numbered frames but also some odd-numbered frames can be skipped. By doing so, the compression ratio can be improved. As described above, when the fixed frames are set in a cycle of 4 frames, 3 frames between the fixed frames are set as skippable frames.

프레임 설정부(110)는 다수의 프레임 중 고정 프레임과 스킵 가능 프레임이 설정되면, 다수의 프레임에서 기지정된 순서로 기지정된 개수의 프레임을 순차적으로 선택하여 스킵 프레임 선별부(120)로 전달한다. 일 예로 프레임 설정부(110)는 연속하는 3개씩의 프레임을 순차적으로 스킵 프레임 선별부(120)로 전달할 수 있다. 이때 프레임 설정부(110)는 고정 프레임과 스킵 가능 프레임의 설정에 따라 스킵 프레임 선별부(120)로 전달할 프레임을 상이하게 선택할 수 있다.When a fixed frame and a skippable frame are set among a plurality of frames, the frame setting unit 110 sequentially selects a predetermined number of frames in a predetermined order from the plurality of frames and transmits them to the skip frame selection unit 120 . For example, the frame setter 110 may sequentially transmit three consecutive frames to the skip frame selector 120 . At this time, the frame setter 110 may differently select a frame to be transmitted to the skip frame selector 120 according to the settings of the fixed frame and the skippable frame.

만일 프레임 설정부(110)가 다수의 프레임에서 고정 프레임과 스킵 가능 프레임을 교대로 설정하고, 3개씩의 프레임을 전송하는 경우, 프레임 설정부(110)는 우선 제1 내지 제3 프레임을 전송하고, 이후 제3 내지 제5 프레임을 전송하는 방식으로 스킵 가능 프레임이 중앙 위치하는 방식으로 순차적으로 3개씩의 프레임을 선택하여 전송할 수 있다. 이는 고정 프레임이 3개의 프레임의 중앙에 위치하여 전송되어, 스킵 프레임 선별부(120)에서 스킵 프레임으로 선별되더라도 고정 프레임은 스킵될 수 없으므로 무의미하기 때문이다.If the frame setting unit 110 alternately sets fixed frames and skippable frames in a plurality of frames and transmits three frames each, the frame setting unit 110 first transmits the first to third frames, , Then, in a manner in which the third to fifth frames are transmitted, three frames may be sequentially selected and transmitted in such a manner that the skippable frame is located in the center. This is because the fixed frame is positioned at the center of three frames and transmitted, and even if the skip frame selector 120 selects the skip frame, the fixed frame cannot be skipped, so it is meaningless.

또한 프레임 설정부(110)는 이전 스킵 프레임 선별부(120)에서 선별된 스핍 프레임이, 다시 스킵 프레임 선별부(120)로 전달되지 않도록 프레임을 선택할 수 있다. 상기한 바와 같이, 만일 3개의 프레임이 스킵 가능 프레임으로 설정될지라도 연속하는 2개 이상의 프레임이 스킵되는 경우, 스킵된 프레임을 정상적으로 복원하기 어렵다는 문제가 있다. 이러한 문제가 발생하는 것을 방지하기 위해, 프레임 설정부(110)는 스킵 프레임 선별부(120)가 이전 전송된 프레임에 대해 스킵 프레임으로 선별한 경우, 이미 선별된 스킵 프레임을 기반으로 화면간 예측, 즉 프레임 보간 가능성을 추정하지 않도록 스킵 프레임을 제외한 순서로 기지정된 개수의 프레임을 스킵 프레임 선별부(120)로 전달한다.In addition, the frame setter 110 may select frames so that the skip frames selected by the previous skip frame selector 120 are not transmitted to the skip frame selector 120 again. As described above, even if three frames are set as skippable frames, if two or more consecutive frames are skipped, it is difficult to restore the skipped frames normally. In order to prevent this problem from occurring, the frame setting unit 110, when the skip frame selection unit 120 selects a previously transmitted frame as a skip frame, performs inter-prediction based on the previously selected skip frame; That is, a predetermined number of frames are delivered to the skip frame selection unit 120 in an order excluding skip frames so as not to estimate frame interpolation possibility.

일 예로 제2 내지 제4 프레임이 스킵 가능 프레임으로 설정된 경우일지라도, 제1 내지 제3 프레임을 스킵 프레임 선별부(120)으로 전송하여, 스킵 프레임 선별부(120)에서 제2 프레임이 스킵 프레임으로 선별되면, 이미 제2 프레임이 스킵될 것으로 확정되었으므로, 제2 및 제4 프레임으로부터 제3 프레임을 예측할 수 없게 된다. 따라서 프레임 설정부(110)는 제2 내지 제4 프레임을 스킵 프레임 선별부(120)으로 전송하여 제3 프레임의 스킵 여부를 판별할 필요가 없다. 이 경우 프레임 설정부(110)는 스킵 프레임으로 선별된 제2 프레임을 스킵하여, 제3 내지 제5 프레임을 선택하여 스킵 프레임 선별부(120)로 전송할 수 있다.For example, even when the second to fourth frames are set as skippable frames, the first to third frames are transmitted to the skip frame selector 120, and the skip frame selector 120 determines that the second frame is a skip frame. If selected, since it has already been determined that the second frame will be skipped, the third frame cannot be predicted from the second and fourth frames. Therefore, the frame setting unit 110 does not need to determine whether to skip the third frame by transmitting the second to fourth frames to the skip frame selector 120 . In this case, the frame setting unit 110 may skip the second frame selected as the skip frame, select the third to fifth frames, and transmit them to the skip frame selection unit 120 .

프레임 설정부(110)는 스킵 프레임 선별부(120)가 인가된 프레임의 스킵 여부를 판별한 결과로 출력하는 스킵 플래그를 인가받아, 스킵 프레임 선별부(120)로 전송할 다수의 프레임에 스킵 플래그에 대응하는 프레임을 포함할지 여부를 결정할 수 있다.The frame setting unit 110 receives the skip flag output as a result of determining whether or not the frame applied by the skip frame selection unit 120 is skipped, and assigns the skip flag to a plurality of frames to be transmitted to the skip frame selection unit 120. You can decide whether or not to include the corresponding frame.

스킵 프레임 선별부(120)는 미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 프레임 설정부(110)에서 인가된 다수의 프레임 중 기지정된 위치의 프레임의 스킵 여부를 판별하고, 판별 결과에 따라 스킵 플래그를 출력한다.The skip frame selection unit 120 is implemented as a pre-learned artificial neural network, determines whether or not to skip a frame at a predetermined position among a plurality of frames applied from the frame setting unit 110 according to the learned method, and determines whether or not to skip the frame according to the determination result. Outputs skip flags accordingly.

스킵 프레임 선별부(120)는 일 예로 다수의 컨볼루션 커널(Convolution Kenel)과 완전 연결 레이어(Fully Connected Layer)를 포함하는 컨볼루션 신경망(Convolution Neural Network: CNN)으로 구현될 수 있다. 스킵 프레임 선별부(120)는 다수의 프레임이 인가되면, 다수의 프레임 중 가운데 위치하는 프레임의 미리 학습된 방식에 따라 복원될 프레임의 화질을 고려한 복원 가능성을 분석하여 스킵 여부를 판별한다. 이때, 스킵 프레임 선별부(120)는 후술하는 인코더(130) 및 디코더(210)의 인코딩과 디코딩 과정에 따른 프레임 화질 변화를 함께 고려하여 스킵 여부를 판별할 수 있다. 그리고 판별 결과에 따라 스킵 플래그의 값을 변경하여 출력할 수 있다. 여기서 스킵 플래그는 해당 프레임을 스킵하는 것으로 판별한 경우 1의 값을 갖는 반면, 스킵하지 않는 것으로 판별한 경우 0의 값을 갖도록 이진값으로 출력될 수도 있다. 그러나 경우에 따라서 스킵 프레임 선별부(120)는 스킵 확률값을 획득하고, 획득된 스킵 확률값이 미리 지정된 기준값 이상인지 여부에 따라 스킵 플래그를 0 또는 1로 비활성화 또는 활성화하여 출력하도록 구성될 수도 있다.The skip frame selection unit 120 may be implemented as an example of a convolution neural network (CNN) including a plurality of convolution kernels and fully connected layers. When a plurality of frames are applied, the skip frame selector 120 determines whether to skip by analyzing the possibility of restoring a frame positioned in the middle among the plurality of frames in consideration of the picture quality of the frame to be restored according to a pre-learned method. In this case, the skip frame selector 120 may determine whether to skip by considering frame quality changes according to encoding and decoding processes of the encoder 130 and the decoder 210, which will be described later. In addition, the value of the skip flag may be changed and output according to the determination result. Here, the skip flag may have a value of 1 when it is determined that the corresponding frame is skipped, whereas it may be output as a binary value to have a value of 0 when it is determined that the corresponding frame is not skipped. However, in some cases, the skip frame selection unit 120 may be configured to obtain a skip probability value, inactivate or activate a skip flag to 0 or 1 according to whether the obtained skip probability value is greater than or equal to a predetermined reference value, and output the result.

상기한 바와 같이 스킵 프레임 선별부(120)는 인공 신경망으로 구현되므로, 미리 학습되어야만 정상적으로 동작을 수행할 수 있으며, 스킵 프레임 선별부(120)의 학습 방법은 후술하도록 한다.As described above, since the skip frame selector 120 is implemented as an artificial neural network, it must be trained in advance to perform normal operations, and a learning method of the skip frame selector 120 will be described later.

인코더(130)는 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그에 따라 프레임 설정부(110)에 입력된 다수의 프레임 중 스킵되지 않는 것으로 판별된 프레임을 인가받아 미리 지정된 방식에 따라 인코딩하여 인코딩 영상을 출력한다. 이때 인코더(130)는 다수 프레임 각각에 대한 스킵 플래그를 함께 인코딩하여 인코딩 영상을 획득할 수 있으며, 인코딩 영상을 비트스트림(bitstream) 형태로 영상 복원 장치(200)로 전송할 수 있다.The encoder 130 receives frames determined as not to be skipped among a plurality of frames input to the frame setting unit 110 according to the skip flag output from the skip frame selection unit 120, and encodes and encodes them according to a predetermined method. output the video In this case, the encoder 130 may obtain an encoded image by encoding a skip flag for each of a plurality of frames together, and may transmit the encoded image to the image restoration apparatus 200 in the form of a bitstream.

한편, 영상 복원 장치(200)는 스킵 프레임 선별 장치(100)에서 전송되는 인코딩 영상을 인가받아 미리 지정된 방식에 따라 디코딩하고, 디코딩된 영상에서 스킵된 프레임을 복구하여 입력 영상을 복원한다.Meanwhile, the image restoration device 200 receives the encoded image transmitted from the skip frame selection device 100, decodes it according to a predetermined method, and recovers the skipped frame from the decoded image to restore the input image.

영상 복원 장치(200)는 디코더(210) 및 스킵 프레임 보간부(220)를 포함할 수 있다. 우선 디코더(210)는 인코딩 영상을 인가받아 미리 지정된 방식에 따라 디코딩하여 디코딩 영상을 획득한다. 여기서 디코더(210)는 인코더(130)의 지정된 인코딩 방식에 대응하는 방식으로 디코딩을 수행하며, 인코더(130)의 인코딩 방식과 디코더(210)의 디코딩 방식은 영상 압축 및 복원 시스템에서 이용하는 것으로 설정된 코덱(Codec)에 따라 미리 지정된다.The image restoration apparatus 200 may include a decoder 210 and a skip frame interpolator 220 . First, the decoder 210 receives an encoded image and decodes it according to a predetermined method to obtain a decoded image. Here, the decoder 210 performs decoding in a manner corresponding to the designated encoding method of the encoder 130, and the encoding method of the encoder 130 and the decoding method of the decoder 210 are codecs set to be used in the video compression and restoration system. (Codec) pre-specified.

그리고 디코더(210)는 인코딩 영상을 디코딩함으로써 인코딩 영상에 포함된 스킵 플래그를 디코딩 영상과 함께 획득할 수 있다.Also, the decoder 210 may obtain a skip flag included in the encoded image together with the decoded image by decoding the encoded image.

스킵 프레임 보간부(220)는 디코더(210)로부터 디코딩 영상과 스킵 플래그를 인가받고, 인가된 스킵 플래그에 따라 스킵 프레임 선별 장치(100)에서 전송시에 제외된 스킵 프레임을 판별하고, 판별된 스킵 프레임의 인접 프레임을 기반으로 스킵 프레임을 프레임 보간 기법에 따라 복원한다.The skip frame interpolator 220 receives the decoded image and the skip flag from the decoder 210, determines the skip frame excluded during transmission in the skip frame selection device 100 according to the applied skip flag, and determines the skip frame determined. The skip frame is reconstructed according to the frame interpolation technique based on the frames adjacent to the frame.

즉 본 발명의 영상 압축 및 복원 시스템은 도 2에 도시된 바와 같이, 다수의 프레임으로 구성된 비디오 입력인 입력 영상을 인가받아 다수 프레임 중 제거할 스킵 프레임을 판별하여 제거하고 나머지 프레임의 영상을 인코딩하여 인코딩 영상을 비트스트림 형태로 전송하고, 비트스트림 형태로 전송된 인코딩 영상을 디코딩하고, 스킵된 프레임을 프레임 보간 기법으로 복구하여 입력 영상을 재구축할 수 있다.That is, as shown in FIG. 2, the video compression and restoration system of the present invention receives input video, which is a video input composed of a plurality of frames, determines and removes skip frames to be removed among the plurality of frames, and encodes the video of the remaining frames. The input video may be reconstructed by transmitting the encoded video in a bitstream format, decoding the encoded video transmitted in the bitstream format, and restoring the skipped frame using a frame interpolation technique.

이때 스킵 프레임 선별 장치(100)는 인코더(130) 및 디코더(210)의 인코딩과 디코딩 및 스킵 프레임 보간부(220)의 프레임 보간에 따른 복원된 영상의 화질 변화를 고려하여 다수의 프레임의 스킵 여부를 판별하여 프레임을 스킵하여 전송함으로써, 복원되는 영상의 화질 저하를 방지하면서 프레임 스킵에 따른 압축률 향상 효과를 획득할 수 있다.At this time, the skip frame selection apparatus 100 determines whether a plurality of frames are skipped in consideration of the quality change of the reconstructed image according to the encoding and decoding of the encoder 130 and the decoder 210 and the frame interpolation of the skip frame interpolator 220. It is possible to obtain an effect of improving a compression rate according to frame skipping while preventing deterioration in image quality of a restored image by skipping and transmitting frames by determining .

프레임 선별 학습부(300)는 학습 시에 구비되어 스킵 프레임 선별부(120)를 학습시킨다. 인공 신경망으로 구현되는 스킵 프레임 선별부(120)는 영상 압축 및 복원 시스템의 실제 활용 이전에 미리 학습되어야 하며, 이에 프레임 선별 학습부(300)는 스킵 프레임 선별부(120)가 인코더(130) 및 디코더(210)의 인코딩과 디코딩 및 스킵 프레임 보간부(220)의 프레임 보간에 따른 복원된 영상의 화질 변화에 따라 프레임의 스킵 여부를 판별하도록 학습시킨다. 프레임 선별 학습부(300)에 대한 상세한 설명은 후술하도록 한다.The frame selection learning unit 300 is provided during learning and allows the skip frame selection unit 120 to learn. The skip frame selection unit 120 implemented as an artificial neural network must be trained in advance before actual use of the image compression and restoration system. The decoder 210 is trained to determine whether to skip a frame according to the quality change of the reconstructed image according to the encoding and decoding and the frame interpolation of the skip frame interpolator 220. A detailed description of the frame selection learning unit 300 will be described later.

도 3은 도 1의 스킵 프레임 보간부의 상세 구성의 일 예를 나타내고, 도 4는 도 3의 스킵 프레임 보간부의 학습 방법의 일 예를 나타낸다.FIG. 3 shows an example of a detailed configuration of the skip frame interpolator of FIG. 1 , and FIG. 4 shows an example of a learning method of the skip frame interpolator of FIG. 3 .

두 개의 프레임 사이의 상관성을 이용하여 두 프레임 사이의 가운데 프레임을 획득하는 프레임 보간 기법은 잘 알려진 기법으로 다양한 방식으로 구현될 수 있다. 종래 프레임 보간 기법은 주로 수치 해석적 기법으로 인접 프레임들에서 블록 단위로 서로 유사한 블록을 검출하여 유사 블록의 위치 변화와 블록값의 차이를 기반으로 중간 프레임의 각 블록을 복원하는 기법이 이용되었다. 그러나 최근 인공 신경망의 발전에 따라 프레임 보간 기법 또한 인공 신경망을 이용하여 수행되는 경우가 대부분이며, 이에 본 실시예에서도 스킵 프레임 보간부(220)는 인공 신경망으로 구현되어 스킵 프레임을 복원하는 것으로 가정한다.A frame interpolation technique for obtaining a middle frame between two frames using correlation between two frames is a well-known technique and can be implemented in various ways. The conventional frame interpolation technique is mainly a numerical analysis technique, and a technique of detecting blocks similar to each other block by block in adjacent frames and reconstructing each block of an intermediate frame based on a change in position of the similar block and a difference in block value is used. However, with the recent development of artificial neural networks, most of the frame interpolation techniques are also performed using artificial neural networks. Therefore, in this embodiment, it is assumed that the skip frame interpolator 220 is implemented with artificial neural networks to restore skip frames. .

도 3을 참조하면, 스킵 프레임 보간부(220)는 특징 추출부(221), 특징 보간부(222), 특징 상관부(223), 프레임 획득부(224)를 포함할 수 있다.Referring to FIG. 3 , the skip frame interpolator 220 may include a feature extraction unit 221, a feature interpolation unit 222, a feature correlation unit 223, and a frame acquisition unit 224.

특징 추출부(221)는 디코더(210)에서 디코딩된 영상의 다수의 프레임 중 스킵 플래그에 의해 지정된 스킵 프레임에 인접한 기지정된 개수(여기서는 일예로 2개)의 프레임을 인가받고, 미리 학습된 방식에 따라 인가된 프레임 각각의 특징을 추출하여 다수의 특징맵을 획득한다. 특징 추출부(221)는 제1 및 제2 특징 추출부(2211, 2312)를 포함할 수 있다.The feature extractor 221 receives a predetermined number of frames adjacent to the skip frame designated by the skip flag among a plurality of frames of the image decoded by the decoder 210 (here, two as an example), and uses a pre-learned method. Accordingly, a plurality of feature maps are obtained by extracting features of each applied frame. The feature extractor 221 may include first and second feature extractors 2211 and 2312 .

제1 특징 추출부(2211)는 다수의 프레임에서 스킵 프레임을 기준으로 시간적으로 이전 순서의 프레임을 인가받아 특징을 추출하여 제1 특징맵을 출력하고, 제2 특징 추출부(2212)는 다수의 프레임에서 스킵 프레임을 기준으로 시간적으로 다음 순서의 프레임을 인가받아 특징을 추출하여 제2 특징맵을 출력한다.The first feature extractor 2211 extracts a feature from a frame in temporal order based on the skip frame in multiple frames and outputs a first feature map, and the second feature extractor 2212 outputs a first feature map. A second feature map is output by extracting a feature by receiving a frame sequentially next to the frame based on the skip frame.

특징 보간부(222)는 특징 추출부(221)의 제1 및 제2 특징 추출부(2211, 2312)에서 각각 획득된 제1 및 제2 특징맵을 인가받고, 인가된 제1 및 제2 특징맵을 미리 지정된 방식에 따라 보간하여 보간 특징맵을 획득한다. 이때 특징 보간부(222)는 기지정된 수학적 장식에 따라 제1 및 제2 특징맵을 보간하여 보간 특징맵을 획득할 수도 있으나, 특징 보간부(222) 또한 인공 신경망으로 구현되어 학습된 방식에 따라 보간 특징맵을 획득할 수도 있다.The feature interpolator 222 receives the first and second feature maps respectively obtained from the first and second feature extractors 2211 and 2312 of the feature extractor 221, and the applied first and second features. An interpolation feature map is obtained by interpolating the map according to a predetermined method. At this time, the feature interpolator 222 may obtain an interpolated feature map by interpolating the first and second feature maps according to a predetermined mathematical decoration. An interpolation feature map may be obtained.

특징 상관부(223)는 제1 및 제2 특징맵 및 보간 특징맵을 인가받아 미리 학습된 방식에 따라 제1 특징맵과 보간 특징맵 및 제2 특징맵 사이의 시간적 상관성을 반영하여 제1 및 제2 특징맵 및 보간 특징맵 각각에 대응하는 제1 및 제2 히든맵 및 보간 히든맵을 출력한다. 특징 상관부(223)는 일 예로 인공 신경망 중에서 시간적 상관성을 반영하는 LSTM(Long Short-Term Memory)으로 구현될 수 있다.The feature correlation unit 223 receives the first and second feature maps and the interpolation feature map, and reflects the temporal correlation between the first feature map, the interpolation feature map, and the second feature map according to a pre-learned method, thereby generating the first and second feature maps. First and second hidden maps and interpolation hidden maps corresponding to the second feature map and the interpolation feature map, respectively, are output. For example, the feature correlation unit 223 may be implemented as a long short-term memory (LSTM) that reflects temporal correlation among artificial neural networks.

프레임 획득부(224)는 제1 및 제2 프레임 획득부(2241, 2342)과 보간 프레임 획득부(2243)를 포함할 수 있다. 제1 프레임 획득부(2241)는 제1 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임의 이전 프레임에 대응하는 제1 프레임을 획득하고, 제2 프레임 획득부(2242)는 제2 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임의 이후 프레임에 대응하는 제2 프레임을 획득할 수 있다. 그리고 보간 프레임 획득부(2243)는 보간 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임에 대응하는 보간 프레임을 획득한다. 제1 및 제2 프레임 획득부(2241, 2342)과 보간 프레임 획득부(2243) 각각은 일 예로 컨볼루션 신경망으로 구현될 수 있다.The frame acquisition unit 224 may include first and second frame acquisition units 2241 and 2342 and an interpolation frame acquisition unit 2243 . The first frame acquisition unit 2241 receives the first hidden map and acquires a first frame corresponding to a previous frame of the skip frame according to a previously learned method, and the second frame acquisition unit 2242 acquires the second hidden map. may be applied and a second frame corresponding to a frame following the skip frame may be acquired according to a pre-learned method. Further, the interpolation frame acquisition unit 2243 receives the interpolation hidden map and obtains an interpolation frame corresponding to the skip frame according to a pre-learned method. Each of the first and second frame acquisition units 2241 and 2342 and the interpolation frame acquisition unit 2243 may be implemented as, for example, a convolutional neural network.

이와 같이, 스킵 프레임 보간부(220)가 스킵 플래그에 의해 지정된 스킵 프레임에서 시간적으로 인접한 이전 및 이후 프레임을 인가받아, 보간 프레임을 획득할 뿐만아니라, 보간 프레임의 이전 및 이후 프레임인 제1 및 제2 프레임 또한 다시 획득하는 것은 스킵 프레임 보간부(220)가 단순히 보간 프레임을 획득하는데 그치지 않고, 인코더(130) 및 디코더(210)에서 인코딩 및 디코딩 과정에서 발생할 수 있는 화질 저하를 보상할 수 있도록 하기 위해서이다.As such, the skip frame interpolator 220 obtains interpolated frames by receiving temporally adjacent previous and subsequent frames from the skip frame designated by the skip flag, and obtains interpolated frames, as well as first and subsequent frames of the interpolated frame. 2 frames are also acquired again so that the skip frame interpolator 220 does not stop at simply obtaining an interpolated frame, but compensates for the degradation of picture quality that may occur in the encoding and decoding processes in the encoder 130 and the decoder 210. It is for

인공 신경망으로 구성되는 프레임 획득부(224)는 제1 및 제2 프레임 및 보간 프레임을 각각 대응하는 입력 영상의 프레임, 즉 입력 영상에서 선별된 스킵 프레임과 스킵 프레임의 이전 및 이후 프레임과 비교하여 손실을 계산하고, 계산된 손실을 역전파함으로써 학습될 수 있다. 이때, 입력 영상의 프레임이 스킵 프레임 보간부(220)에 입력되는 과정에는 코덱에 의해 지정된 인코더(130) 및 디코더(210)의 인코딩 및 디코딩 과정이 포함된다. 따라서 스킵 프레임 보간부(220)가 제1 및 제2 프레임 및 보간 프레임을 입력 영상의 대응하는 프레임과 비교하여 획득된 손실에 따라 학습되면, 스킵 프레임 보간부(220)는 단순히 보간 프레임만을 획득하는 것이 아니라, 인코딩 및 디코딩 과정에서 발생할 수 있는 제1 및 제2 프레임의 화질 저하를 함께 보상할 수 있다.The frame acquisition unit 224 composed of an artificial neural network compares the first and second frames and the interpolation frame with corresponding frames of the input image, i.e., skip frames selected from the input image and frames before and after the skip frame, thereby resulting in loss. It can be learned by calculating , and backpropagating the calculated loss. At this time, the process of inputting the frame of the input image to the skip frame interpolator 220 includes encoding and decoding processes of the encoder 130 and the decoder 210 designated by the codec. Therefore, when the skip frame interpolator 220 compares the first and second frames and the interpolated frame with the corresponding frame of the input image and learns according to the acquired loss, the skip frame interpolator 220 simply obtains only the interpolated frame. Instead, it is possible to compensate for deterioration in picture quality of the first and second frames that may occur during encoding and decoding processes.

한편, 스킵 프레임 보간부(220)는 보간 프레임의 이전 및 이후 프레임인 제1 및 제2 프레임 또한 다시 획득하지 않도록 구성될 수도 있으며, 이 경우, 제1 및 제2 프레임 획득부(2241, 2342)는 생략될 수 있다. 경우에 따라서는 특징 상관부(223) 또한 생략되어, 보간 프레임 획득부(2243)가 보간 특징맵으로부터 곧바로 보간 프레임을 획득하도록 구성될 수도 있다. 이와 같이 스킵 프레임 보간부(220)가 보간 프레임만을 획득하도록 구성되는 경우, 스킵 프레임 보간부(220)는 스킵 프레임 선별 장치(100)에서 제거된 스킵 프레임과 보간 프레임 사이의 차이만을 비교하여 손실을 계산하고, 계산된 손실을 역전파함으로써, 학습될 수 있다.Meanwhile, the skip frame interpolator 220 may also be configured not to reacquire first and second frames, which are frames before and after the interpolated frame. In this case, the first and second frame obtainers 2241 and 2342 can be omitted. In some cases, the feature correlation unit 223 may also be omitted, so that the interpolation frame obtaining unit 2243 directly obtains an interpolation frame from an interpolation feature map. In this way, when the skip frame interpolator 220 is configured to obtain only the interpolated frame, the skip frame interpolator 220 compares only the difference between the skip frame removed by the skip frame selection device 100 and the interpolated frame to reduce loss. By computing and backpropagating the computed loss, it can be learned.

도 4는 도 1의 프레임 선별 학습부의 상세 구성의 일 예를 나타내고, 도 5는 도 1의 스킵 프레임 선별부를 학습시키는 개념을 설명하기 위한 도면이며, 도 6은 압축률과 화질에 따른 손실을 설명하기 위한 도면이다.4 shows an example of a detailed configuration of the frame selection learning unit of FIG. 1, FIG. 5 is a diagram for explaining the concept of learning the skip frame selection unit of FIG. 1, and FIG. It is a drawing for

도 4를 참조하면, 프레임 선별 학습부(300)는 압축률 계산부(310), 영상 화질 측정부(320), 2차원 투영부(330) 및 손실 계산부(340)를 포함할 수 있다.Referring to FIG. 4 , the frame selection learning unit 300 may include a compression rate calculating unit 310 , an image quality measuring unit 320 , a 2D projection unit 330 and a loss calculating unit 340 .

도 5를 참조하여, 도 4의 프레임 선별 학습부(300)의 동작을 설명하면, 압축률 계산부(310)는 입력 영상에서 연속하는 다수의 프레임(x1, x, x2)이 스킵 되지 않고 모두 기지정된 비디오 코덱에 따라 인코더(130)에서 인코딩된 경우의 압축률(R1)을 계산하여 획득한다. 또한 압축률 계산부(310)는 다수의 프레임(x1, x, x2) 중 스킵 프레임 선별부(120)에 의해 스킵되는 것으로 선택된 프레임(x)을 제외한 나머지 프레임(x1, x2)이 인코더(130)에서 인코딩된 경우의 압축률(R2)을 계산하여 획득한다.Referring to FIG. 5 , the operation of the frame selection learning unit 300 of FIG. 4 is described. A compression rate (R 1 ) in the case of encoding in the encoder 130 according to a pre-specified video codec is calculated and obtained. In addition, the compression rate calculation unit 310 determines that the remaining frames (x 1 , x 2 ) except for the frame (x) selected to be skipped by the skip frame selector 120 among the plurality of frames (x 1 , x, x 2 ) It is obtained by calculating the compression rate (R 2 ) when encoded by the encoder 130.

한편 영상 화질 측정부(320)는 입력 영상의 다수의 프레임(x1, x, x2)이 스킵되지 않고 인코딩되어 전송된 후, 디코더(210)에 의해 디코딩된 디코딩 영상을 입력 영상의 대응하는 프레임(x1, x, x2)과 비교하여, 입력 영상의 다수의 프레임(x1, x, x2)에 대비한 디코딩 영상의 화질(D1)을 계산한다. 또한 영상 화질 측정부(320)는 입력 영상의 다수의 프레임(x1, x, x2) 중 적어하나의 프레임(x)이 스킵되어 인코딩된 후, 디코더(210)에 의해 디코딩되고, 스킵 프레임 보간부(220)에서 보간되어 획득된 다수의 복원 프레임을 입력 영상의 프레임(x1, x, x2)과 비교하여, 입력 영상의 다수의 프레임(x1, x, x2)에 대비한 복원 프레임의 화질(D2)을 계산한다.Meanwhile, the image quality measurer 320 converts the decoded image decoded by the decoder 210 to the corresponding frame of the input image after a plurality of frames (x 1 , x, x 2 ) of the input image are encoded and transmitted without being skipped. Compared with the frame (x 1 , x, x 2 ), the quality (D 1 ) of the decoded image is calculated in comparison with the plurality of frames (x 1 , x, x 2 ) of the input image. In addition, the image quality measurer 320 performs encoding by skipping at least one frame (x) among a plurality of frames (x 1 , x, x 2 ) of the input image, and then decodes the skip frame by the decoder 210. A plurality of reconstructed frames interpolated and obtained by the interpolator 220 are compared with frames (x 1 , x, x 2 ) of the input image, and prepared for a plurality of frames (x 1 , x, x 2 ) of the input image The image quality (D 2 ) of the restored frame is calculated.

즉 프레임 스킵 여부에 따른 압축률(R1, R2)와 프레임 화질(D1, D2)을 각각 계산한다.That is, compression rates (R 1 , R 2 ) and frame quality (D 1 , D 2 ) according to frame skipping are calculated, respectively.

2차원 투영부(330)는 프레임을 스킵 여부에 따라 계산된 압축률(R1, R2)과 프레임 화질(D1, D2)을 도 6에 도시된 바와 같이 압축률과 왜곡 수준을 2개의 축으로 하는 2차원 공간 상의 좌표에 투영한다. 도 6에서 파란색 라인(3 Frame)은 프레임이 스킵되지 않은 경우에 압축률에 대비한 프레임 화질의 왜곡 수준을 나타내고, 붉은색 라인(2 Frame)은 프레임 스킵에 따른 압축률에 대비한 프레임 화질의 왜곡 수준을 나타낸다.The 2D projection unit 330 converts the compression rate (R 1 , R 2 ) and the frame quality (D 1 , D 2 ) calculated according to whether frames are skipped, as shown in FIG. 6 , into two axes It is projected onto coordinates on a two-dimensional space. In FIG. 6, the blue line (3 Frame) represents the distortion level of frame quality in comparison to the compression rate when no frame is skipped, and the red line (2 Frame) represents the distortion level of frame quality in comparison to the compression rate due to frame skipping. indicates

이에 손실 계산부(340)는 스킵 플래그에 따라 2차원 좌표계에서 프레임을 스킵하지 않은 상태의 압축률과 화질(R1, D1)과 프레임을 스킵한 상태의 압축률과 화질(R2, D2) 사이의 변위(D)를 계산하고, 계산된 변위(D)가 기지정된 기준 변위(Dref) 이상이면, 프레임을 스킵하지 않아야 하는 것으로 판별하여 스킵 판별값을 출력할 수 있다. 이 때 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그는 프레임을 스킵하지 않도록 비활성화되어 출력되어야 한다. 그에 반해, 계산된 변위(D)가 기지정된 기준 변위(Dref) 미만이면, 프레임을 스킵해야 하는 것으로 판별하여 스킵 판별값을 출력한다. 이때 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그는 프레임을 스킵하도록 활성화되어야 한다.Accordingly, the loss calculation unit 340 calculates the compression rate and image quality (R 1 , D 1 ) in a state where no frame is skipped and the compression rate and image quality (R 2 , D 2 ) in a state where the frame is skipped in the two-dimensional coordinate system according to the skip flag. A displacement (D) between the frames is calculated, and if the calculated displacement (D) is greater than or equal to a predetermined reference displacement (D ref ), it is determined that the frame should not be skipped, and a skip discrimination value may be output. At this time, the skip flag output from the skip frame selector 120 must be inactivated so as not to skip the frame. On the other hand, if the calculated displacement (D) is less than the predetermined reference displacement (D ref ), it is determined that the frame should be skipped, and a skip determination value is output. At this time, the skip flag output from the skip frame selector 120 should be activated to skip the frame.

이에 손실 계산부(340)는 학습 과정에서 스킵 프레임 선별부(120)에서 실제 출력된 스킵 플래그의 활성화 또는 비활성화 상태와 손실 계산부(340)에서 판별한 스킵 판별값을 비교하여 손실을 계산하여 역전파함으로써, 스킵 프레임 선별부(120)를 학습시킬 수 있다.Accordingly, the loss calculation unit 340 compares the activation or inactivation state of the skip flag actually output from the skip frame selection unit 120 in the learning process with the skip discrimination value determined by the loss calculation unit 340 to calculate the loss and reverse the result. By propagating, the skip frame selector 120 can be trained.

다만 스킵 플래그가 상기한 바와 같이 이진값으로 출력되고, 손실 계산부(340) 또한 스킵 여부만을 판단하여 서로 동일한지 여부만을 판단하는 경우, 학습 시간이 길어질 수 있다. 이에 스킵 프레임 선별부(120)가 스킵 확률값을 출력하고, 스킵 확률값을 기반으로 스킵 플래그를 활성화 또는 비활성화하도록 구성된 경우, 획득된 스킵 확률값과 계산된 변위(D)를 정규화한 값의 차이를 손실로 계산하여 역전파함으로써 학습을 수행할 수도 있다.However, when the skip flag is output as a binary value as described above and the loss calculation unit 340 also determines whether the skip flag is the same or not, the learning time may be increased. Accordingly, when the skip frame selector 120 outputs a skip probability value and is configured to activate or deactivate a skip flag based on the skip probability value, the difference between the obtained skip probability value and the normalized value of the calculated displacement (D) is the loss. Learning can also be performed by calculating and backpropagating.

한편, 도 6의 파란색 라인과 같이 스킵하지 않은 상태의 압축률과 화질(R1, D1)에 따른 2차원 패턴을 모두 획득하는 것은 매우 번거로운 작업이다. 이에 프레임을 스킵하지 않은 경우에 압축률(R1)과 프레임 화질(D1) 사이의 관계가 획득되면, 이를 보라색 라인과 같이 3차 함수(F(x) = a3x3+ a2x2+ a1x+ a0) 형태로 피팅(Fitting)하여 피팅 함수(Fitting Function)를 획득하고, 피팅 함수(Fitting Function)와 프레임을 스킵한 상태의 압축률과 화질(R2, D2) 사이의 변위(D)를 계산하여 손실을 계산할 수도 있다.Meanwhile, as shown in the blue line of FIG. 6 , it is a very cumbersome task to acquire all of the two-dimensional patterns according to the compression ratio and image quality (R 1 , D 1 ) in a non-skipping state. Accordingly, when the relationship between the compression rate (R 1 ) and the frame quality (D 1 ) is obtained when the frame is not skipped, it is expressed as a cubic function (F(x) = a 3 x 3 + a 2 x 2 as shown in the purple line). + a 1 x+ a 0 ) to obtain a fitting function, and the displacement between the fitting function and the compression rate and image quality (R 2 , D 2 ) in the state of skipping frames You can also calculate the loss by calculating (D).

도 7은 본 발명의 일 실시예에 따른 스킵 프레임 선별 방법을 나타낸다.7 shows a skip frame selection method according to an embodiment of the present invention.

도 1 내지 도 6을 참조하여, 도 7의 스킵 프레임 선별 방법을 설명하면, 스킵 프레임 선별 방법(S10)은 우선 입력 영상의 다수의 프레임 중 고정 및 스킵 가능 프레임을 기지정된 방식으로 설정한다(S11). 이때 우선 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정할 수 있다.Referring to FIGS. 1 to 6, the skip frame selection method of FIG. 7 is described. In the skip frame selection method (S10), fixed and skippable frames among a plurality of frames of an input image are set in a predetermined manner (S11). ). In this case, first of the plurality of frames, a fixed frame may be set at a predetermined interval from an initial frame, and the remaining frames may be set as skippable frames.

고정 및 스킵 가능 프레임이 설정되면, 스킵 가능 프레임의 스킵 여부를 판별하도록 미리 학습된 인공 신경망으로 순차적으로 연속하여 기지정된 개수씩 인가한다(S12). 이때, 이전 스킵되는 것으로 판별된 스킵 프레임은 포함되지 않도록 한다.When the fixed and skippable frames are set, a pre-learned artificial neural network is sequentially and continuously applied by a predetermined number to determine whether to skip skippable frames (S12). In this case, skip frames previously determined to be skipped are not included.

학습된 인공 신경망은 학습된 방식에 따라 인가된 프레임 중 기지정된 위치의 프레임의 스킵 여부를 판별한다(S13). 이때 인공 신경망은 입력된 프레임들로부터 프레임이 스킵되는 경우에 이후 지정된 코덱에 의해 인코딩 및 디코딩 되고, 스킵된 프레임이 보간되어 복원된 영상의 화질을 고려하여 스킵 여부를 판별하도록 학습될 수 있다.The learned artificial neural network determines whether to skip a frame at a predetermined position among applied frames according to the learned method (S13). In this case, when a frame is skipped from the input frames, the artificial neural network is encoded and decoded by a designated codec, and the skipped frame is interpolated to learn to determine skipping in consideration of the quality of the reconstructed image.

만일 스킵 프레임으로 판별되면, 스킵 플래그를 활성화한다. 이때 스킵 플래그는 0 또는 1의 이진값을 가질 수 있으며, 일 예로 스킵 플래그는 1로 활성화되어 출력될 수 있다. 경우에 따라서는 인공 신경망으로부터 스킵 확률값이 획득되고, 획득된 스킵 확률값이 기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화할 수도 있다.If it is determined as a skip frame, a skip flag is activated. In this case, the skip flag may have a binary value of 0 or 1, and for example, the skip flag may be activated and output as 1. In some cases, a skip probability value may be obtained from an artificial neural network, and a skip flag may be deactivated or activated according to whether the obtained skip probability value is greater than or equal to a predetermined reference value.

스킵 플래그가 활성화되면, 활성화된 스킵 플래그에 대응하는 프레임을 제외한 나머지 프레임들을 코덱에 의해 지정된 방식에 따라 순차적으로 인코딩하여 인코딩 영상을 획득한다(S15). 이때 스킵 플래그 또한 함께 인코딩되어 인코딩 영상에 포함된다.When the skip flag is activated, an encoded image is obtained by sequentially encoding the frames other than the frame corresponding to the activated skip flag according to a method specified by the codec (S15). At this time, the skip flag is also encoded and included in the encoded image.

스킵 프레임 선별 방법(S10)은 인코딩 영상을 획득하는 것으로 완료될 수 있으나, 스킵되고 인코딩되어 압축된 영상은 이후 입력 영상과 유사하게 복원될 수 있어야 한다. 이에 이하에서는 영상 복원 방법을 추가적으로 설명한다. 영상 복원 방법(S20)에서는 우선 인코딩된 프레임을 인가받아 코덱에 의해 지정된 방식에 따라 디코딩하여 디코딩 영상을 획득한다(S21). 인코딩 영상이 디코딩됨에 따라 디코딩 영상에서는 스킵 플래그가 복구된다.The skip frame selection method ( S10 ) may be completed by obtaining an encoded image, but the skipped, encoded, and compressed image should then be reconstructed similarly to the input image. Accordingly, an image restoration method will be additionally described below. In the image restoration method (S20), first, an encoded frame is received and decoded according to a method specified by a codec to obtain a decoded image (S21). As the encoded image is decoded, the skip flag is restored in the decoded image.

그리고 복구된 스킵 플래그 중 활성화된 스킵 플래그가 검출되는지 판별한다(S22). 만일 활성화된 스킵 플래그가 검출되면, 검출된 스킵 플래그에 시간적으로 인접한 이전 및 이후 프레임을 추출한다(S23). 그리고 추출된 인접 프레임을 기지정된 방식으로 보간하여 보간 프레임을 획득한다(S24). 이때 보간 프레임은 기지정된 수학적 방식에 따라 획득되거나 미리 학습된 인공 신경망을 이용하여 획득될 수 있다. 또한 인공 신경망을 이용하여 획득되는 경우, 코덱에 따른 인코딩 및 디코딩 과정에서 발생하는 인접 프레임의 왜곡을 함께 보상하도록 인공 신경망이 미리 학습될 수도 있다.Then, it is determined whether an activated skip flag is detected among the recovered skip flags (S22). If an activated skip flag is detected, previous and subsequent frames temporally adjacent to the detected skip flag are extracted (S23). Then, an interpolated frame is obtained by interpolating the extracted adjacent frame in a predetermined manner (S24). In this case, the interpolation frame may be obtained according to a predetermined mathematical method or may be obtained using a pre-learned artificial neural network. In addition, when obtained using an artificial neural network, the artificial neural network may be trained in advance to compensate for distortion of adjacent frames generated during encoding and decoding processes according to a codec.

보간 프레임이 획득되면, 인접 프레임 사이에 보간 프레임을 배치하여 입력 영상을 복원한 복원 영상을 획득한다(S25).When interpolation frames are acquired, interpolation frames are arranged between adjacent frames to obtain a reconstructed image obtained by reconstructing an input image (S25).

여기서 프레임의 스킵 여부를 판별하는 인공 신경망은 프레임을 스킵하지 않고 인코딩한 압축률(R1)과 프레임을 스킵하여 인코딩한 압축률(R2) 및 프레임을 스킵하지 않고 인코딩된 인코딩 영상들을 디코딩하여 획득된 디코딩 영상의 왜곡 수준(D1)을 프레임을 스킵하여 인코딩 및 디코딩하고 스킵된 프레임을 보간하여 삽입한 다수의 복원 프레임의 왜곡 수준(D2)에 따른 변위(D)를 계산하고, 계산된 변위를 정규화한 정규화된 변위와 스킵 확률값 사이의 오차를 손실로 계산하여 역전파하여 학습될 수 있다. 또는 변위(D)에 따른 스킵 여부와 스킵 플래그의 이진값을 비교하여 손실로 역전파함으로써 학습될 수도 있다.Here, the artificial neural network that determines whether or not to skip a frame is obtained by decoding the compression rate encoded without skipping the frame (R 1 ), the compression rate encoded by skipping the frame (R 2 ), and the encoded images encoded without skipping the frame. The distortion level (D 1 ) of the decoded image is encoded and decoded by skipping frames, and the displacement (D) is calculated according to the distortion level (D 2 ) of a plurality of restored frames inserted by interpolating the skipped frames, and the calculated displacement It can be learned by backpropagating by calculating the error between the normalized displacement and the skip probability value as a loss. Alternatively, it may be learned by comparing skipping according to displacement (D) with the binary value of the skip flag and performing backpropagation with a loss.

본 발명에 따른 방법은 컴퓨터에서 실행시키기 위한 매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다. 여기서 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스 될 수 있는 임의의 가용 매체일 수 있고, 또한 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함하며, ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등을 포함할 수 있다.The method according to the present invention may be implemented as a computer program stored in a medium for execution on a computer. Here, computer readable media may be any available media that can be accessed by a computer, and may also include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data, including read-only memory (ROM) dedicated memory), random access memory (RAM), compact disk (CD)-ROM, digital video disk (DVD)-ROM, magnetic tape, floppy disk, optical data storage device, and the like.

본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.Although the present invention has been described with reference to the embodiments shown in the drawings, this is only exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom.

따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 청구범위의 기술적 사상에 의해 정해져야 할 것이다.Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the appended claims.

100: 스킵 프레임 선별 장치 200: 영상 복원 장치
300: 프레임 선별 학습부 110: 프레임 설정부
120: 스킵 프레임 선별부 130: 인코더
210: 디코더 220: 스킵 프레임 보간부
310: 압축률 계산부 320: 영상 화질 측정부
330: 2차원 투영부 340: 손실 계산부
100: skip frame selection device 200: image restoration device
300: frame selection learning unit 110: frame setting unit
120: skip frame selector 130: encoder
210: decoder 220: skip frame interpolator
310: compression ratio calculation unit 320: image quality measurement unit
330: 2-dimensional projection unit 340: loss calculation unit

Claims (16)

입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 프레임 설정부;
미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 스킵 프레임 선별부; 및
상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 인코더를 포함하되,
상기 스킵 프레임 선별부는 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습되는 스킵 프레임 선별 장치.
a frame setting unit configured to set a skippable frame and a fixed frame among a plurality of frames of an input image;
Implemented as a pre-learned artificial neural network, skip frame selection for activating or inactivating a skip flag by determining whether to skip each of the skippable frames from each of the skippable frames and adjacent frames of each of the skippable frames according to the learned method. wealth; and
An encoder for obtaining an encoded image by encoding the remaining frames except for the skip frame in which the skip flag is activated in a predetermined manner,
The skip frame selection unit pre-learns based on a compression rate of an encoded image according to whether the skip frame is excluded or a quality difference between a decoded image obtained by decoding the encoded image and a reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded. skip frame selector.
제1항에 있어서, 상기 스킵 프레임 선별부는
상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습되는 스킵 프레임 선별 장치.
The method of claim 1, wherein the skip frame selector
The compression rate of the encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of the decoded image obtained by decoding the same are calculated according to a predetermined method, and the compression rate and the image quality are calculated as coordinates in a two-dimensional space as axes. Projecting, calculating the compression rate of the encoded image encoding a plurality of frames excluding the skip frame and the quality of the reconstructed image obtained by decoding it and reconstructing the skip frame, and projecting it to the coordinates of the two-dimensional space, based on the displacement between the two coordinates Learned skip frame selection device.
제2항에 있어서, 상기 스킵 프레임 선별부는
학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화하는 스킵 프레임 선별 장치.
The method of claim 2, wherein the skip frame selector
A skip frame selection device for obtaining a skip probability value for the skippable frame according to a learned method, and inactivating or activating a skip flag according to whether or not the obtained skip probability value is greater than or equal to a predetermined reference value.
제3항에 있어서, 상기 스킵 프레임 선별부는
상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습되는 스킵 프레임 선별 장치.
The method of claim 3, wherein the skip frame selector
A fitting function following a pattern of compression rate and picture quality projected in the two-dimensional space when the skip frame is not excluded is obtained, and a fitting function is obtained, and when the skip frame is excluded, the coordinates between the projected compression rate and the picture quality are obtained. A skip frame selection device that learns based on displacement.
제4항에 있어서, 상기 스킵 프레임 선별부는
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습되는 스킵 프레임 선별 장치.
The method of claim 4, wherein the skip frame selector
An apparatus for selecting skip frames in which, when skip frames are excluded, a difference between a displacement between a projected compression ratio and image quality coordinates and the fitting function and the skip probability value is back-propagated as a loss and learned.
제4항에 있어서, 상기 스킵 프레임 선별부는
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습되는 스킵 프레임 선별 장치.
The method of claim 4, wherein the skip frame selector
Loss obtained by comparing the activation or inactivation state of the skip flag with a skip discrimination value determined according to whether the displacement between the coordinates of the projected compression rate and image quality and the fitting function when excluding the skip frame is equal to or greater than a predetermined reference displacement A skip frame selector that is learned through backpropagation.
제1항에 있어서, 상기 프레임 설정부는
상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정하는 스킵 프레임 선별 장치.
The method of claim 1, wherein the frame setting unit
A skip frame selection device for setting fixed frames at predetermined intervals from an initial frame among the plurality of frames and setting remaining frames as skippable frames.
제7항에 있어서, 상기 프레임 설정부는
상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 스킵 프레임 선별부로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가하는 스킵 프레임 선별 장치.
The method of claim 7, wherein the frame setting unit
A skip frame selector for applying each skippable frame and an adjacent frame of the skippable frame to the skip frame selector, except for a case where a skip flag for the adjacent frame is already activated, and a next skippable frame and an adjacent frame. .
입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 단계;
미리 학습된 인공 신경망을 이용하여, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 단계; 및
상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 단계를 포함하되,
상기 인공 신경망은 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습되는 스킵 프레임 선별 방법.
setting a skippable frame and a fixed frame among a plurality of frames of an input image;
activating or inactivating a skip flag by determining whether each of the skippable frames is skipped from each of the skippable frames and adjacent frames of each of the skippable frames according to a learned method using a pre-learned artificial neural network; and
Obtaining an encoded image by encoding remaining frames other than the skip frame in which the skip flag is activated in a predetermined manner,
The artificial neural network is pre-learned based on the compression rate of the encoded image according to whether or not the skip frame is excluded and the quality difference between the decoded image obtained by decoding the encoded image and the reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded How to select skip frames.
제9항에 있어서, 상기 인공 신경망은
상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습되는 스킵 프레임 선별 방법.
The method of claim 9, wherein the artificial neural network
The compression rate of the encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of the decoded image obtained by decoding the same are calculated according to a predetermined method, and the compression rate and the image quality are calculated as coordinates in a two-dimensional space as axes. Projecting, calculating the compression rate of the encoded image encoding a plurality of frames excluding the skip frame and the quality of the reconstructed image obtained by decoding it and reconstructing the skip frame, and projecting it to the coordinates of the two-dimensional space, based on the displacement between the two coordinates Learned skip frame screening method.
제10항에 있어서, 상기 스킵 플래그를 활성화 또는 비활성화하는 단계는
학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화하는 스킵 프레임 선별 방법.
11. The method of claim 10, wherein activating or deactivating the skip flag
A skip frame selection method for obtaining a skip probability value for the skippable frame according to a learned method, and inactivating or activating a skip flag according to whether or not the obtained skip probability value is greater than or equal to a predetermined reference value.
제11항에 있어서, 상기 인공 신경망은
상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습되는 스킵 프레임 선별 방법.
The method of claim 11, wherein the artificial neural network
A fitting function following a pattern of compression rate and picture quality projected in the two-dimensional space when the skip frame is not excluded is obtained, and a fitting function is obtained, and when the skip frame is excluded, the coordinates between the projected compression rate and the picture quality are obtained. A skip frame screening method learned based on displacement.
제12항에 있어서, 상기 인공 신경망은
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습되는 스킵 프레임 선별 방법.
The method of claim 12, wherein the artificial neural network
A method for selecting skip frames in which, when skip frames are excluded, a difference between a displacement between a projected compression ratio and image quality coordinates and the fitting function and the skip probability value is back-propagated as a loss and learned.
제12항에 있어서, 상기 인공 신경망은
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습되는 스킵 프레임 선별 방법.
The method of claim 12, wherein the artificial neural network
Loss obtained by comparing the activation or inactivation state of the skip flag with a skip discrimination value determined according to whether the displacement between the coordinates of the projected compression rate and image quality and the fitting function when excluding the skip frame is equal to or greater than a predetermined reference displacement A method for selecting skip frames that are learned through backpropagation.
제9항에 있어서, 상기 고정 프레임을 설정하는 단계는
상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정하는 스킵 프레임 선별 방법.
10. The method of claim 9, wherein setting the fixed frame
A skip frame selection method of setting a fixed frame at a predetermined interval from an initial frame among the plurality of frames and setting remaining frames as skippable frames.
제15항에 있어서, 상기 고정 프레임을 설정하는 단계는
상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 인공 신경망으로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가하는 스킵 프레임 선별 방법.
16. The method of claim 15, wherein setting the fixed frame
Each skippable frame and an adjacent frame of the skippable frame are applied to the artificial neural network, except when a skip flag for the adjacent frame is already activated, and a next skippable frame and an adjacent frame are applied.
KR1020210062514A 2021-05-14 2021-05-14 Apparatus and Method for Selecting Skip Frames KR102620281B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210062514A KR102620281B1 (en) 2021-05-14 2021-05-14 Apparatus and Method for Selecting Skip Frames

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210062514A KR102620281B1 (en) 2021-05-14 2021-05-14 Apparatus and Method for Selecting Skip Frames

Publications (2)

Publication Number Publication Date
KR20220154940A true KR20220154940A (en) 2022-11-22
KR102620281B1 KR102620281B1 (en) 2023-12-29

Family

ID=84236251

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210062514A KR102620281B1 (en) 2021-05-14 2021-05-14 Apparatus and Method for Selecting Skip Frames

Country Status (1)

Country Link
KR (1) KR102620281B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008236789A (en) * 2001-03-05 2008-10-02 Intervideo Inc Method for selecting video sequence frame to be skipped during execution of encoding process
KR102207736B1 (en) 2020-01-14 2021-01-26 한국과학기술원 Frame interpolation, apparatus and method using deep neural network

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008236789A (en) * 2001-03-05 2008-10-02 Intervideo Inc Method for selecting video sequence frame to be skipped during execution of encoding process
KR102207736B1 (en) 2020-01-14 2021-01-26 한국과학기술원 Frame interpolation, apparatus and method using deep neural network

Also Published As

Publication number Publication date
KR102620281B1 (en) 2023-12-29

Similar Documents

Publication Publication Date Title
KR100636606B1 (en) The image processing equipment, the image processing method and the provision medium
JP5580453B2 (en) Direct mode encoding and decoding apparatus
US5134478A (en) Method and apparatus for compressing and decompressing a digital video signal using predicted and error images
KR100738241B1 (en) Image processing apparatus
KR100817732B1 (en) Coding apparatus and method, decoding apparatus and method, data processing system, and storage medium
JP5144545B2 (en) Moving picture codec apparatus and method
JPH02172389A (en) High efficient coding system for animated picture signal
JPH07193822A (en) Motion prediction processor and device therefor
JP7563864B2 (en) Videoconferencing based on adaptive face reconstruction and face restoration
US7424130B2 (en) Coding apparatus and method, decoding apparatus and method, data processing system, storage medium, and signal
CN112004114B (en) Video processing method and device, readable storage medium and electronic equipment
KR20220154940A (en) Apparatus and Method for Selecting Skip Frames
JPH10506505A (en) Synchronization method for continuous digital video
CN114827666B (en) Video processing method, device and equipment
EP0993199A2 (en) Apparatus and method for image data coding with additional data embedding
JPH0686247A (en) Receiver/reproducer for digital picture signal
KR20130121913A (en) Method and apparatus for measuring quality of video based on frame loss pattern
US6288654B1 (en) Data conversion apparatus, data conversion method, and recording medium
KR101471010B1 (en) Method and system for video quality measurement
JP4099687B2 (en) Image processing apparatus, image processing method, and medium
CN117376606A (en) Video frame supplementing method and device, electronic equipment and storage medium
JPH08265751A (en) Picture reproducing device by mpeg system
KR100275543B1 (en) A high-speed mapping parameter detection device and its detection method
JP4264606B2 (en) Data processing apparatus and data processing method
JP2621341B2 (en) Predictive coding method for video using background prediction and its apparatus

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant