KR20220154940A - Apparatus and Method for Selecting Skip Frames - Google Patents
Apparatus and Method for Selecting Skip Frames Download PDFInfo
- Publication number
- KR20220154940A KR20220154940A KR1020210062514A KR20210062514A KR20220154940A KR 20220154940 A KR20220154940 A KR 20220154940A KR 1020210062514 A KR1020210062514 A KR 1020210062514A KR 20210062514 A KR20210062514 A KR 20210062514A KR 20220154940 A KR20220154940 A KR 20220154940A
- Authority
- KR
- South Korea
- Prior art keywords
- skip
- frame
- frames
- skippable
- image
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 100
- 230000006835 compression Effects 0.000 claims abstract description 75
- 238000007906 compression Methods 0.000 claims abstract description 75
- 238000013528 artificial neural network Methods 0.000 claims abstract description 30
- 238000006073 displacement reaction Methods 0.000 claims description 26
- 230000003213 activating effect Effects 0.000 claims description 7
- 238000010187 selection method Methods 0.000 claims description 7
- 230000000415 inactivating effect Effects 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 4
- 230000002779 inactivation Effects 0.000 claims description 4
- 238000012216 screening Methods 0.000 claims 2
- 230000008569 process Effects 0.000 description 8
- 230000002123 temporal effect Effects 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 3
- 230000006866 deterioration Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012888 cubic function Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000005034 decoration Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T9/00—Image coding
- G06T9/002—Image coding using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/149—Data rate or code amount at the encoder output by estimating the code amount by means of a model, e.g. mathematical model or statistical model
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Algebra (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
Description
본 발명은 스킵 프레임 선별 장치 및 방법에 관한 것으로, 인공 신경망을 이용한 스킵 프레임 선별 장치 및 방법에 관한 것이다.The present invention relates to an apparatus and method for selecting a skip frame, and relates to an apparatus and method for selecting a skip frame using an artificial neural network.
영상 압축 기법에서는 다수 프레임 중 일부 프레임을 스킵하여 전체 프레임 수를 줄임으로써 압축을 수행하는 프레임 스키핑 기법이 제안된 바 있다.In video compression techniques, a frame skipping technique has been proposed in which compression is performed by skipping some frames among multiple frames to reduce the total number of frames.
프레임 스키핑 기법은 다수 프레임의 비디오 영상에서 시간적인 중복성을 제거하기 위해 일부 프레임을 제거하여 프레임의 수를 줄이는 기법으로 크게 두가지 방식으로 적용되었다. 첫번째는 우선 제한적 스트리밍 환경에서 단순히 비트율을 조절하기 위해 프레임을 스킵하여 전송하는 방식이다. 두번째는 프레임 보간 기법을 통한 프레임 복원을 고려하여, 입력 영상의 모션에 따라 프레임을 선별적으로 스킵하는 방식이다. 즉 프레임 스키핑 기법은 단순히 고정된 주기로 프레임을 스킵하는 기법에서, 입력 영상의 모션을 분석하여 적응적으로 프레임을 선택하여 스킵하는 방식으로 발전하여 비디오 영상의 압축률을 향상시켰다.The frame skipping technique is a technique that reduces the number of frames by removing some frames in order to remove temporal redundancy in a video image of multiple frames, and is largely applied in two ways. The first is a method of simply skipping and transmitting frames to adjust the bit rate in a limited streaming environment. The second method is a method of selectively skipping frames according to the motion of an input image in consideration of frame restoration through frame interpolation. That is, the frame skipping technique has evolved from a technique of simply skipping frames at a fixed cycle to a technique of adaptively selecting and skipping frames by analyzing the motion of an input image, thereby improving the compression rate of video images.
그러나 이러한 기존의 프레임 스키핑 기법은 코덱에 따른 영상 인코딩 및 디코딩시의 영상 품질 변화나 프레임 보간을 통해 복원되는 프레임의 품질 등을 충분하게 고려하지 못한 방식으로 프레임을 선별하였다. 즉 단순히 비트율을 조절하기 위해 고정된 프레임 또는 임의의 프레임을 스킵하는 경우, 이후 스킵된 프레임을 프레임 보간 기법으로 복구할지라도 영상 품질이 크게 저하되어 비트율의 이득 대비 화질 손실이 매우 크게 나타나는 문제가 있다. 그리고 프레임 보간 기법을 통한 프레임 복원을 고려하여 프레임을 스킵하는 경우에도, 입력 영상의 모션에 기초하여 기지정된 방식으로 선택되는 프레임을 스킵함에 따라, 코덱 보간되어 생성되는 프레임의 품질이 저하되는 문제가 있으며, 압축률을 크게 향상시키기 어렵다는 한계가 있다.However, these conventional frame skipping techniques select frames in a way that does not sufficiently consider changes in video quality during video encoding and decoding according to codecs or the quality of frames restored through frame interpolation. That is, when a fixed frame or an arbitrary frame is simply skipped to adjust the bit rate, even if the skipped frame is subsequently restored by frame interpolation, the image quality is greatly deteriorated, resulting in a very large loss of image quality compared to the gain of the bit rate. . In addition, even when frames are skipped in consideration of frame restoration through frame interpolation, the quality of frames generated by codec interpolation is degraded as frames selected in a predetermined manner based on the motion of the input video are skipped. However, there is a limitation that it is difficult to greatly improve the compression ratio.
본 발명의 목적은 인코딩 및 디코딩된 이후 프레임 보간으로 획득되는 프레임의 품질을 고려하여 스킵 프레임을 선별할 수 있는 스킵 프레임 선별 장치 및 방법을 제공하는데 있다.An object of the present invention is to provide an apparatus and method for selecting a skip frame by considering the quality of a frame obtained through frame interpolation after encoding and decoding.
본 발명의 다른 목적은 비디오 영상의 품질을 유지하면서 압축률을 향상시킬 수 있는 스킵 프레임 선별 장치 및 방법을 제공하는데 있다.Another object of the present invention is to provide an apparatus and method for selecting a skip frame capable of improving a compression rate while maintaining the quality of a video image.
상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른 스킵 프레임 선별 장치는 입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 프레임 설정부; 미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 스킵 프레임 선별부; 및 상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 인코더를 포함하되, 상기 스킵 프레임 선별부는 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습된다.In order to achieve the above object, an apparatus for selecting skip frames according to an embodiment of the present invention includes a frame setting unit configured to set skippable frames and fixed frames among a plurality of frames of an input image; Implemented as a pre-learned artificial neural network, skip frame selection for activating or inactivating a skip flag by determining whether to skip each of the skippable frames from each of the skippable frames and adjacent frames of each of the skippable frames according to the learned method. wealth; and an encoder that obtains an encoded image by encoding frames other than the skip frame in which the skip flag is activated in a predetermined manner, wherein the skip frame selector determines a compression rate of the encoded image and an encoded image according to whether the skip frame is excluded or not. It is pre-learned based on a picture quality difference between a decoded image obtained by decoding and a reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded.
상기 스킵 프레임 선별부는 상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습될 수 있다.The skip frame selection unit calculates the compression rate of an encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of a decoded image obtained by decoding the same according to a predetermined method, so that the compression rate and the image quality are the axes. The compression rate of the encoded image obtained by projecting into the coordinates of the dimensional space and encoding a plurality of frames excluding the skip frame and the image quality of the reconstructed image obtained by decoding and reconstructing the skip frame are calculated and projected into the coordinates of the 2D space, and the two coordinates are calculated. It can be learned based on the displacement of the liver.
상기 스킵 프레임 선별부는 학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화할 수 있다.The skip frame selector may obtain a skip probability value for the skippable frame according to a learned method, and deactivate or activate a skip flag according to whether the obtained skip probability value is greater than or equal to a predetermined reference value.
상기 스킵 프레임 선별부는 상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습될 수 있다.The skip frame selector obtains a fitting function that follows the pattern of the compression rate and image quality projected in the two-dimensional space when the skip frame is not excluded, and the obtained fitting function and the compression rate projected when the skip frame is excluded It can be learned based on displacement between coordinates of image quality.
상기 스킵 프레임 선별부는 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습될 수 있다.When the skip frame selector excludes the skip frame, a difference between a displacement between the projected compression rate and image quality coordinates and the fitting function and the skip probability value may be back-propagated and learned as a loss.
상기 스킵 프레임 선별부는 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습될 수 있다.The skip frame selector determines whether a displacement between the projected compression rate and image quality coordinates and the fitting function is greater than or equal to a predetermined reference displacement when skip frames are excluded, and an activation or inactivation state of the skip flag. The loss obtained by comparison can be back-propagated and learned.
상기 프레임 설정부는 상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정할 수 있다.The frame setting unit may set a fixed frame at a predetermined interval from an initial frame among the plurality of frames and set remaining frames as skippable frames.
상기 프레임 설정부는 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 스킵 프레임 선별부로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가할 수 있다.The frame setting unit applies each skippable frame and an adjacent frame of the skippable frame to the skip frame selector, except when a skip flag for the adjacent frame is already activated, and applies the next skippable frame and the adjacent frame. can
상기 목적을 달성하기 위한 본 발명의 다른 실시예에 따른 스킵 프레임 선별 방법은 입력 영상의 다수의 프레임 중 스킵 가능 프레임과 고정 프레임을 설정하는 단계; 미리 학습된 인공 신경망을 이용하여, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 단계; 및 상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 단계를 포함하되, 상기 인공 신경망은 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습된다.To achieve the above object, a method for selecting skip frames according to another embodiment of the present invention includes setting skippable frames and fixed frames among a plurality of frames of an input image; activating or inactivating a skip flag by determining whether each of the skippable frames is skipped from each of the skippable frames and adjacent frames of each of the skippable frames according to a learned method using a pre-learned artificial neural network; and obtaining an encoded image by encoding frames other than the skip frame in which the skip flag is activated in a predetermined manner, wherein the artificial neural network calculates a compression rate of the encoded image and the encoded image according to whether the skip frame is excluded or not. It is pre-learned based on the difference in quality between the decoded decoded image and the reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded.
따라서, 본 발명의 실시예에 따른 스킵 프레임 선별 장치 및 방법은 코덱에 따른 인코딩 및 디코딩된 이후 프레임 보간으로 획득되는 프레임의 품질을 사전에 고려하여 스킵 프레임을 선별함으로써, 비디오 영상의 품질을 유지하면서 압축률을 향상시킬 수 있다.Therefore, the skip frame selection apparatus and method according to an embodiment of the present invention considers the quality of frames obtained by frame interpolation after encoding and decoding according to a codec in advance to select skip frames, thereby maintaining the quality of video images. The compression rate can be improved.
도 1은 본 발명의 일 실시예에 따른 영상 압축 및 복원 시스템을 나타낸다.
도 2는 도 1의 영상 압축 및 복원 시스템의 영상 압축 및 복원 개념을 설명하기 위한 도면이다.
도 3은 도 1의 스킵 프레임 보간부의 상세 구성의 일 예를 나타낸다.
도 4는 도 1의 프레임 선별 학습부의 상세 구성의 일 예를 나타낸다.
도 5는 도 1의 스킵 프레임 선별부를 학습시키는 개념을 설명하기 위한 도면이다.
도 6은 압축률과 화질에 따른 손실을 설명하기 위한 도면이다.
도 7은 본 발명의 일 실시예에 따른 스킵 프레임 선별 방법을 나타낸다.1 shows an image compression and restoration system according to an embodiment of the present invention.
FIG. 2 is a diagram for explaining the concept of image compression and restoration of the image compression and restoration system of FIG. 1 .
FIG. 3 shows an example of a detailed configuration of the skip frame interpolator of FIG. 1 .
FIG. 4 shows an example of a detailed configuration of the frame selection learning unit of FIG. 1 .
FIG. 5 is a diagram for explaining the concept of learning the skip frame selector of FIG. 1 .
6 is a diagram for explaining loss according to compression rate and image quality.
7 shows a skip frame selection method according to an embodiment of the present invention.
본 발명과 본 발명의 동작상의 이점 및 본 발명의 실시에 의하여 달성되는 목적을 충분히 이해하기 위해서는 본 발명의 바람직한 실시예를 예시하는 첨부 도면 및 첨부 도면에 기재된 내용을 참조하여야만 한다. In order to fully understand the present invention and its operational advantages and objectives achieved by the practice of the present invention, reference should be made to the accompanying drawings illustrating preferred embodiments of the present invention and the contents described in the accompanying drawings.
이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 설명함으로써, 본 발명을 상세히 설명한다. 그러나, 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며, 설명하는 실시예에 한정되는 것이 아니다. 그리고, 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략되며, 도면의 동일한 참조부호는 동일한 부재임을 나타낸다. Hereinafter, the present invention will be described in detail by describing preferred embodiments of the present invention with reference to the accompanying drawings. However, the present invention may be embodied in many different forms and is not limited to the described embodiments. And, in order to clearly describe the present invention, parts irrelevant to the description are omitted, and the same reference numerals in the drawings indicate the same members.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라, 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "...부", "...기", "모듈", "블록" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다. Throughout the specification, when a part "includes" a certain component, it means that it may further include other components, not excluding other components unless otherwise stated. In addition, terms such as "... unit", "... unit", "module", and "block" described in the specification mean a unit that processes at least one function or operation, which is hardware, software, or hardware. And it can be implemented as a combination of software.
도 1은 본 발명의 일 실시예에 따른 영상 압축 및 복원 시스템을 나타내고, 도 2는 도 1의 영상 압축 및 복원 시스템의 영상 압축 및 복원 개념을 설명하기 위한 도면이다.1 shows an image compression and restoration system according to an embodiment of the present invention, and FIG. 2 is a diagram for explaining the concept of image compression and restoration of the image compression and restoration system of FIG. 1 .
도 1을 참조하면, 본 실시예에 따른 영상 압축 및 복원 시스템은 연속하는 다수 프레임으로 구성된 입력 영상을 인가받아 기지정된 방식으로 압축하는 영상 압축 장치(100)와 압축된 영상을 인가받아 기지정된 방식으로 복원하는 영상 복원 장치(200)를 포함할 수 있다.Referring to FIG. 1, an image compression and restoration system according to the present embodiment includes an
영상 압축 장치(100)가 영상을 압축하는 방식에서는 크게 화면 내 예측을 기반으로 하는 압축 기술과 화면간 예측을 기반으로 하는 압축 기술로 구분될 수 있다. 화면 내 예측 기술은 동일 프레임 내에서 인접한 픽셀은 서로 상관성이 높다는 성질을 이용하여, 화면 내에서 예측 가능한 픽셀을 제거함으로써 공간적 중복성이 최소화되도록 압축하는 방식으로 픽셀 스킵 기법으로 볼 수 있다. 그리고 화면 간 예측 기술은 연속하는 다수의 프레임은 시간적으로 높은 상관성을 갖는다는 성질을 이용하여, 다수 프레임에서 예측 가능한 프레임을 제거함으로써 시간적 중복성이 최소화되도록 압축하는 방식으로 프레임 스킵 기법으로 볼 수 있다.A method of compressing an image by the
영상 압축 장치(100)는 화면 내 예측 및 화면 간 예측 중 적어도 하나를 이용하여 압축을 수행할 수도 있으나, 화면 간 예측을 기반으로 프레임을 제거하는 프레임 스킵 기법은 압축률에 대비하여 복원된 프레임의 화질 손실이 커 실제로는 압축에는 거의 이용되고 있지 않은 실정이다. 이에 본 실시예에서 영상 압축 장치(100)는 복원되는 영상의 프레임의 품질을 고려하여, 화질 저하를 방지할 수 있으면서 동시에 압축률을 높일 수 있는 프레임을 선별하고, 선별된 프레임을 스킵하여 압축함으로써 프레임 스킵 기법이 실질적으로 영상 압축에 이용될 수 있도록 한다.The
이에 도 1의 영상 압축 장치(100)는 본 발명에 따른 스킵 프레임 선별 장치라고 할 수 있다. 스킵 프레임 선별 장치(100)는 프레임 설정부(110), 스킵 프레임 선별부(120) 및 인코더(130)를 포함할 수 있다.Accordingly, the
프레임 설정부(110)는 압축 대상이 되는 연속하는 다수 프레임으로 구성된 영상을 인가받고, 인가된 영상의 다수 프레임 중에서 제거될 수 있는 스킵 가능 프레임과 제거되어서는 안되는 고정 프레임을 설정한다. 상기한 바와 같이 화면 간 예측을 기반으로 하는 프레임 스킵 기법은 스킵되는 프레임과 인접한 프레임들 사이의 시간적 상관성을 기반으로 하므로, 다수의 프레임이 연속적으로 스킵되면 시간적 상관성이 낮아져 스킵된 프레임을 정상적으로 복구할 수 없게 되는 문제가 발생한다.The
이러한 문제를 방지하기 위해서 본 실시예의 스킵 프레임 선별 장치(100)에서 프레임 설정부(110)는 연속하는 다수의 프레임을 제거 가능한 스킵 가능 프레임과 제거되어서는 안되는 고정 프레임으로 구분할 수 있다. 이때 프레임 설정부(110)는 다수의 프레임에서 스킵 가능 프레임과 고정 프레임을 기지정된 주기에 따라 설정할 수 있다.In order to prevent this problem, in the skip
가장 단순한 일 예로서 프레임 설정부(110)는 다수의 프레임을 시간 순서에 따라 고정 프레임과 스킵 가능 프레임으로 교대로 설정할 수 있다. 즉 홀수번째 프레임을 고정 프레임으로 설정하고, 짝수 번째 프레임은 스킵 가능 프레임으로 설정할 수도 있다. 이는 스킵 가능 프레임에 시간적으로 인접한 2개의 프레임이 고정 프레임으로 설정됨에 따라 스킵 가능 프레임을 용이하게 복원할 수 있도록 하기 위함이다.As the simplest example, the
또한 프레임 설정부(110)는 다수의 프레임에서 초기 프레임 이후 4의 주기로 고정 프레임을 설정하고, 설정된 고정 프레임 사이의 프레임을 스킵 가능 프레임으로 설정할 수 있다. 고정 프레임과 스킵 가능 프레임을 교대로 설정하는 경우, 스킵 가능 프레임을 용이하게 복원할 수 있는 장점이 있는 반면, 본 실시예에서는 화질 저하를 고려하여 스킵 가능 프레임을 모두 스킵하지 않으므로, 압축률의 개선 효과가 크지 않을 수 있다. 이에 스킵 프레임 선별 장치(100)는 다수의 프레임 중 고정 프레임의 비율을 줄이고 스킵 가능 프레임의 비율을 높임으로써, 짝수번째 프레임뿐만 아니라 일부 홀수번째 프레임도 스킵될 수 있도록 하여, 스킵 가능한 프레임 수를 증가시킴으로써 압축율이 개선되도록 할 수 있다. 상기한 바와 같이, 4개 프레임 주기로 고정 프레임을 설정하는 경우, 고정 프레임 사이의 3개의 프레임이 스킵 가능 프레임으로 설정된다.In addition, the
프레임 설정부(110)는 다수의 프레임 중 고정 프레임과 스킵 가능 프레임이 설정되면, 다수의 프레임에서 기지정된 순서로 기지정된 개수의 프레임을 순차적으로 선택하여 스킵 프레임 선별부(120)로 전달한다. 일 예로 프레임 설정부(110)는 연속하는 3개씩의 프레임을 순차적으로 스킵 프레임 선별부(120)로 전달할 수 있다. 이때 프레임 설정부(110)는 고정 프레임과 스킵 가능 프레임의 설정에 따라 스킵 프레임 선별부(120)로 전달할 프레임을 상이하게 선택할 수 있다.When a fixed frame and a skippable frame are set among a plurality of frames, the
만일 프레임 설정부(110)가 다수의 프레임에서 고정 프레임과 스킵 가능 프레임을 교대로 설정하고, 3개씩의 프레임을 전송하는 경우, 프레임 설정부(110)는 우선 제1 내지 제3 프레임을 전송하고, 이후 제3 내지 제5 프레임을 전송하는 방식으로 스킵 가능 프레임이 중앙 위치하는 방식으로 순차적으로 3개씩의 프레임을 선택하여 전송할 수 있다. 이는 고정 프레임이 3개의 프레임의 중앙에 위치하여 전송되어, 스킵 프레임 선별부(120)에서 스킵 프레임으로 선별되더라도 고정 프레임은 스킵될 수 없으므로 무의미하기 때문이다.If the
또한 프레임 설정부(110)는 이전 스킵 프레임 선별부(120)에서 선별된 스핍 프레임이, 다시 스킵 프레임 선별부(120)로 전달되지 않도록 프레임을 선택할 수 있다. 상기한 바와 같이, 만일 3개의 프레임이 스킵 가능 프레임으로 설정될지라도 연속하는 2개 이상의 프레임이 스킵되는 경우, 스킵된 프레임을 정상적으로 복원하기 어렵다는 문제가 있다. 이러한 문제가 발생하는 것을 방지하기 위해, 프레임 설정부(110)는 스킵 프레임 선별부(120)가 이전 전송된 프레임에 대해 스킵 프레임으로 선별한 경우, 이미 선별된 스킵 프레임을 기반으로 화면간 예측, 즉 프레임 보간 가능성을 추정하지 않도록 스킵 프레임을 제외한 순서로 기지정된 개수의 프레임을 스킵 프레임 선별부(120)로 전달한다.In addition, the
일 예로 제2 내지 제4 프레임이 스킵 가능 프레임으로 설정된 경우일지라도, 제1 내지 제3 프레임을 스킵 프레임 선별부(120)으로 전송하여, 스킵 프레임 선별부(120)에서 제2 프레임이 스킵 프레임으로 선별되면, 이미 제2 프레임이 스킵될 것으로 확정되었으므로, 제2 및 제4 프레임으로부터 제3 프레임을 예측할 수 없게 된다. 따라서 프레임 설정부(110)는 제2 내지 제4 프레임을 스킵 프레임 선별부(120)으로 전송하여 제3 프레임의 스킵 여부를 판별할 필요가 없다. 이 경우 프레임 설정부(110)는 스킵 프레임으로 선별된 제2 프레임을 스킵하여, 제3 내지 제5 프레임을 선택하여 스킵 프레임 선별부(120)로 전송할 수 있다.For example, even when the second to fourth frames are set as skippable frames, the first to third frames are transmitted to the
프레임 설정부(110)는 스킵 프레임 선별부(120)가 인가된 프레임의 스킵 여부를 판별한 결과로 출력하는 스킵 플래그를 인가받아, 스킵 프레임 선별부(120)로 전송할 다수의 프레임에 스킵 플래그에 대응하는 프레임을 포함할지 여부를 결정할 수 있다.The
스킵 프레임 선별부(120)는 미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 프레임 설정부(110)에서 인가된 다수의 프레임 중 기지정된 위치의 프레임의 스킵 여부를 판별하고, 판별 결과에 따라 스킵 플래그를 출력한다.The skip
스킵 프레임 선별부(120)는 일 예로 다수의 컨볼루션 커널(Convolution Kenel)과 완전 연결 레이어(Fully Connected Layer)를 포함하는 컨볼루션 신경망(Convolution Neural Network: CNN)으로 구현될 수 있다. 스킵 프레임 선별부(120)는 다수의 프레임이 인가되면, 다수의 프레임 중 가운데 위치하는 프레임의 미리 학습된 방식에 따라 복원될 프레임의 화질을 고려한 복원 가능성을 분석하여 스킵 여부를 판별한다. 이때, 스킵 프레임 선별부(120)는 후술하는 인코더(130) 및 디코더(210)의 인코딩과 디코딩 과정에 따른 프레임 화질 변화를 함께 고려하여 스킵 여부를 판별할 수 있다. 그리고 판별 결과에 따라 스킵 플래그의 값을 변경하여 출력할 수 있다. 여기서 스킵 플래그는 해당 프레임을 스킵하는 것으로 판별한 경우 1의 값을 갖는 반면, 스킵하지 않는 것으로 판별한 경우 0의 값을 갖도록 이진값으로 출력될 수도 있다. 그러나 경우에 따라서 스킵 프레임 선별부(120)는 스킵 확률값을 획득하고, 획득된 스킵 확률값이 미리 지정된 기준값 이상인지 여부에 따라 스킵 플래그를 0 또는 1로 비활성화 또는 활성화하여 출력하도록 구성될 수도 있다.The skip
상기한 바와 같이 스킵 프레임 선별부(120)는 인공 신경망으로 구현되므로, 미리 학습되어야만 정상적으로 동작을 수행할 수 있으며, 스킵 프레임 선별부(120)의 학습 방법은 후술하도록 한다.As described above, since the
인코더(130)는 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그에 따라 프레임 설정부(110)에 입력된 다수의 프레임 중 스킵되지 않는 것으로 판별된 프레임을 인가받아 미리 지정된 방식에 따라 인코딩하여 인코딩 영상을 출력한다. 이때 인코더(130)는 다수 프레임 각각에 대한 스킵 플래그를 함께 인코딩하여 인코딩 영상을 획득할 수 있으며, 인코딩 영상을 비트스트림(bitstream) 형태로 영상 복원 장치(200)로 전송할 수 있다.The
한편, 영상 복원 장치(200)는 스킵 프레임 선별 장치(100)에서 전송되는 인코딩 영상을 인가받아 미리 지정된 방식에 따라 디코딩하고, 디코딩된 영상에서 스킵된 프레임을 복구하여 입력 영상을 복원한다.Meanwhile, the
영상 복원 장치(200)는 디코더(210) 및 스킵 프레임 보간부(220)를 포함할 수 있다. 우선 디코더(210)는 인코딩 영상을 인가받아 미리 지정된 방식에 따라 디코딩하여 디코딩 영상을 획득한다. 여기서 디코더(210)는 인코더(130)의 지정된 인코딩 방식에 대응하는 방식으로 디코딩을 수행하며, 인코더(130)의 인코딩 방식과 디코더(210)의 디코딩 방식은 영상 압축 및 복원 시스템에서 이용하는 것으로 설정된 코덱(Codec)에 따라 미리 지정된다.The
그리고 디코더(210)는 인코딩 영상을 디코딩함으로써 인코딩 영상에 포함된 스킵 플래그를 디코딩 영상과 함께 획득할 수 있다.Also, the
스킵 프레임 보간부(220)는 디코더(210)로부터 디코딩 영상과 스킵 플래그를 인가받고, 인가된 스킵 플래그에 따라 스킵 프레임 선별 장치(100)에서 전송시에 제외된 스킵 프레임을 판별하고, 판별된 스킵 프레임의 인접 프레임을 기반으로 스킵 프레임을 프레임 보간 기법에 따라 복원한다.The
즉 본 발명의 영상 압축 및 복원 시스템은 도 2에 도시된 바와 같이, 다수의 프레임으로 구성된 비디오 입력인 입력 영상을 인가받아 다수 프레임 중 제거할 스킵 프레임을 판별하여 제거하고 나머지 프레임의 영상을 인코딩하여 인코딩 영상을 비트스트림 형태로 전송하고, 비트스트림 형태로 전송된 인코딩 영상을 디코딩하고, 스킵된 프레임을 프레임 보간 기법으로 복구하여 입력 영상을 재구축할 수 있다.That is, as shown in FIG. 2, the video compression and restoration system of the present invention receives input video, which is a video input composed of a plurality of frames, determines and removes skip frames to be removed among the plurality of frames, and encodes the video of the remaining frames. The input video may be reconstructed by transmitting the encoded video in a bitstream format, decoding the encoded video transmitted in the bitstream format, and restoring the skipped frame using a frame interpolation technique.
이때 스킵 프레임 선별 장치(100)는 인코더(130) 및 디코더(210)의 인코딩과 디코딩 및 스킵 프레임 보간부(220)의 프레임 보간에 따른 복원된 영상의 화질 변화를 고려하여 다수의 프레임의 스킵 여부를 판별하여 프레임을 스킵하여 전송함으로써, 복원되는 영상의 화질 저하를 방지하면서 프레임 스킵에 따른 압축률 향상 효과를 획득할 수 있다.At this time, the skip
프레임 선별 학습부(300)는 학습 시에 구비되어 스킵 프레임 선별부(120)를 학습시킨다. 인공 신경망으로 구현되는 스킵 프레임 선별부(120)는 영상 압축 및 복원 시스템의 실제 활용 이전에 미리 학습되어야 하며, 이에 프레임 선별 학습부(300)는 스킵 프레임 선별부(120)가 인코더(130) 및 디코더(210)의 인코딩과 디코딩 및 스킵 프레임 보간부(220)의 프레임 보간에 따른 복원된 영상의 화질 변화에 따라 프레임의 스킵 여부를 판별하도록 학습시킨다. 프레임 선별 학습부(300)에 대한 상세한 설명은 후술하도록 한다.The frame
도 3은 도 1의 스킵 프레임 보간부의 상세 구성의 일 예를 나타내고, 도 4는 도 3의 스킵 프레임 보간부의 학습 방법의 일 예를 나타낸다.FIG. 3 shows an example of a detailed configuration of the skip frame interpolator of FIG. 1 , and FIG. 4 shows an example of a learning method of the skip frame interpolator of FIG. 3 .
두 개의 프레임 사이의 상관성을 이용하여 두 프레임 사이의 가운데 프레임을 획득하는 프레임 보간 기법은 잘 알려진 기법으로 다양한 방식으로 구현될 수 있다. 종래 프레임 보간 기법은 주로 수치 해석적 기법으로 인접 프레임들에서 블록 단위로 서로 유사한 블록을 검출하여 유사 블록의 위치 변화와 블록값의 차이를 기반으로 중간 프레임의 각 블록을 복원하는 기법이 이용되었다. 그러나 최근 인공 신경망의 발전에 따라 프레임 보간 기법 또한 인공 신경망을 이용하여 수행되는 경우가 대부분이며, 이에 본 실시예에서도 스킵 프레임 보간부(220)는 인공 신경망으로 구현되어 스킵 프레임을 복원하는 것으로 가정한다.A frame interpolation technique for obtaining a middle frame between two frames using correlation between two frames is a well-known technique and can be implemented in various ways. The conventional frame interpolation technique is mainly a numerical analysis technique, and a technique of detecting blocks similar to each other block by block in adjacent frames and reconstructing each block of an intermediate frame based on a change in position of the similar block and a difference in block value is used. However, with the recent development of artificial neural networks, most of the frame interpolation techniques are also performed using artificial neural networks. Therefore, in this embodiment, it is assumed that the
도 3을 참조하면, 스킵 프레임 보간부(220)는 특징 추출부(221), 특징 보간부(222), 특징 상관부(223), 프레임 획득부(224)를 포함할 수 있다.Referring to FIG. 3 , the
특징 추출부(221)는 디코더(210)에서 디코딩된 영상의 다수의 프레임 중 스킵 플래그에 의해 지정된 스킵 프레임에 인접한 기지정된 개수(여기서는 일예로 2개)의 프레임을 인가받고, 미리 학습된 방식에 따라 인가된 프레임 각각의 특징을 추출하여 다수의 특징맵을 획득한다. 특징 추출부(221)는 제1 및 제2 특징 추출부(2211, 2312)를 포함할 수 있다.The
제1 특징 추출부(2211)는 다수의 프레임에서 스킵 프레임을 기준으로 시간적으로 이전 순서의 프레임을 인가받아 특징을 추출하여 제1 특징맵을 출력하고, 제2 특징 추출부(2212)는 다수의 프레임에서 스킵 프레임을 기준으로 시간적으로 다음 순서의 프레임을 인가받아 특징을 추출하여 제2 특징맵을 출력한다.The
특징 보간부(222)는 특징 추출부(221)의 제1 및 제2 특징 추출부(2211, 2312)에서 각각 획득된 제1 및 제2 특징맵을 인가받고, 인가된 제1 및 제2 특징맵을 미리 지정된 방식에 따라 보간하여 보간 특징맵을 획득한다. 이때 특징 보간부(222)는 기지정된 수학적 장식에 따라 제1 및 제2 특징맵을 보간하여 보간 특징맵을 획득할 수도 있으나, 특징 보간부(222) 또한 인공 신경망으로 구현되어 학습된 방식에 따라 보간 특징맵을 획득할 수도 있다.The
특징 상관부(223)는 제1 및 제2 특징맵 및 보간 특징맵을 인가받아 미리 학습된 방식에 따라 제1 특징맵과 보간 특징맵 및 제2 특징맵 사이의 시간적 상관성을 반영하여 제1 및 제2 특징맵 및 보간 특징맵 각각에 대응하는 제1 및 제2 히든맵 및 보간 히든맵을 출력한다. 특징 상관부(223)는 일 예로 인공 신경망 중에서 시간적 상관성을 반영하는 LSTM(Long Short-Term Memory)으로 구현될 수 있다.The
프레임 획득부(224)는 제1 및 제2 프레임 획득부(2241, 2342)과 보간 프레임 획득부(2243)를 포함할 수 있다. 제1 프레임 획득부(2241)는 제1 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임의 이전 프레임에 대응하는 제1 프레임을 획득하고, 제2 프레임 획득부(2242)는 제2 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임의 이후 프레임에 대응하는 제2 프레임을 획득할 수 있다. 그리고 보간 프레임 획득부(2243)는 보간 히든맵을 인가받아 미리 학습된 방식에 따라 스킵 프레임에 대응하는 보간 프레임을 획득한다. 제1 및 제2 프레임 획득부(2241, 2342)과 보간 프레임 획득부(2243) 각각은 일 예로 컨볼루션 신경망으로 구현될 수 있다.The
이와 같이, 스킵 프레임 보간부(220)가 스킵 플래그에 의해 지정된 스킵 프레임에서 시간적으로 인접한 이전 및 이후 프레임을 인가받아, 보간 프레임을 획득할 뿐만아니라, 보간 프레임의 이전 및 이후 프레임인 제1 및 제2 프레임 또한 다시 획득하는 것은 스킵 프레임 보간부(220)가 단순히 보간 프레임을 획득하는데 그치지 않고, 인코더(130) 및 디코더(210)에서 인코딩 및 디코딩 과정에서 발생할 수 있는 화질 저하를 보상할 수 있도록 하기 위해서이다.As such, the
인공 신경망으로 구성되는 프레임 획득부(224)는 제1 및 제2 프레임 및 보간 프레임을 각각 대응하는 입력 영상의 프레임, 즉 입력 영상에서 선별된 스킵 프레임과 스킵 프레임의 이전 및 이후 프레임과 비교하여 손실을 계산하고, 계산된 손실을 역전파함으로써 학습될 수 있다. 이때, 입력 영상의 프레임이 스킵 프레임 보간부(220)에 입력되는 과정에는 코덱에 의해 지정된 인코더(130) 및 디코더(210)의 인코딩 및 디코딩 과정이 포함된다. 따라서 스킵 프레임 보간부(220)가 제1 및 제2 프레임 및 보간 프레임을 입력 영상의 대응하는 프레임과 비교하여 획득된 손실에 따라 학습되면, 스킵 프레임 보간부(220)는 단순히 보간 프레임만을 획득하는 것이 아니라, 인코딩 및 디코딩 과정에서 발생할 수 있는 제1 및 제2 프레임의 화질 저하를 함께 보상할 수 있다.The
한편, 스킵 프레임 보간부(220)는 보간 프레임의 이전 및 이후 프레임인 제1 및 제2 프레임 또한 다시 획득하지 않도록 구성될 수도 있으며, 이 경우, 제1 및 제2 프레임 획득부(2241, 2342)는 생략될 수 있다. 경우에 따라서는 특징 상관부(223) 또한 생략되어, 보간 프레임 획득부(2243)가 보간 특징맵으로부터 곧바로 보간 프레임을 획득하도록 구성될 수도 있다. 이와 같이 스킵 프레임 보간부(220)가 보간 프레임만을 획득하도록 구성되는 경우, 스킵 프레임 보간부(220)는 스킵 프레임 선별 장치(100)에서 제거된 스킵 프레임과 보간 프레임 사이의 차이만을 비교하여 손실을 계산하고, 계산된 손실을 역전파함으로써, 학습될 수 있다.Meanwhile, the
도 4는 도 1의 프레임 선별 학습부의 상세 구성의 일 예를 나타내고, 도 5는 도 1의 스킵 프레임 선별부를 학습시키는 개념을 설명하기 위한 도면이며, 도 6은 압축률과 화질에 따른 손실을 설명하기 위한 도면이다.4 shows an example of a detailed configuration of the frame selection learning unit of FIG. 1, FIG. 5 is a diagram for explaining the concept of learning the skip frame selection unit of FIG. 1, and FIG. It is a drawing for
도 4를 참조하면, 프레임 선별 학습부(300)는 압축률 계산부(310), 영상 화질 측정부(320), 2차원 투영부(330) 및 손실 계산부(340)를 포함할 수 있다.Referring to FIG. 4 , the frame
도 5를 참조하여, 도 4의 프레임 선별 학습부(300)의 동작을 설명하면, 압축률 계산부(310)는 입력 영상에서 연속하는 다수의 프레임(x1, x, x2)이 스킵 되지 않고 모두 기지정된 비디오 코덱에 따라 인코더(130)에서 인코딩된 경우의 압축률(R1)을 계산하여 획득한다. 또한 압축률 계산부(310)는 다수의 프레임(x1, x, x2) 중 스킵 프레임 선별부(120)에 의해 스킵되는 것으로 선택된 프레임(x)을 제외한 나머지 프레임(x1, x2)이 인코더(130)에서 인코딩된 경우의 압축률(R2)을 계산하여 획득한다.Referring to FIG. 5 , the operation of the frame
한편 영상 화질 측정부(320)는 입력 영상의 다수의 프레임(x1, x, x2)이 스킵되지 않고 인코딩되어 전송된 후, 디코더(210)에 의해 디코딩된 디코딩 영상을 입력 영상의 대응하는 프레임(x1, x, x2)과 비교하여, 입력 영상의 다수의 프레임(x1, x, x2)에 대비한 디코딩 영상의 화질(D1)을 계산한다. 또한 영상 화질 측정부(320)는 입력 영상의 다수의 프레임(x1, x, x2) 중 적어하나의 프레임(x)이 스킵되어 인코딩된 후, 디코더(210)에 의해 디코딩되고, 스킵 프레임 보간부(220)에서 보간되어 획득된 다수의 복원 프레임을 입력 영상의 프레임(x1, x, x2)과 비교하여, 입력 영상의 다수의 프레임(x1, x, x2)에 대비한 복원 프레임의 화질(D2)을 계산한다.Meanwhile, the
즉 프레임 스킵 여부에 따른 압축률(R1, R2)와 프레임 화질(D1, D2)을 각각 계산한다.That is, compression rates (R 1 , R 2 ) and frame quality (D 1 , D 2 ) according to frame skipping are calculated, respectively.
2차원 투영부(330)는 프레임을 스킵 여부에 따라 계산된 압축률(R1, R2)과 프레임 화질(D1, D2)을 도 6에 도시된 바와 같이 압축률과 왜곡 수준을 2개의 축으로 하는 2차원 공간 상의 좌표에 투영한다. 도 6에서 파란색 라인(3 Frame)은 프레임이 스킵되지 않은 경우에 압축률에 대비한 프레임 화질의 왜곡 수준을 나타내고, 붉은색 라인(2 Frame)은 프레임 스킵에 따른 압축률에 대비한 프레임 화질의 왜곡 수준을 나타낸다.The
이에 손실 계산부(340)는 스킵 플래그에 따라 2차원 좌표계에서 프레임을 스킵하지 않은 상태의 압축률과 화질(R1, D1)과 프레임을 스킵한 상태의 압축률과 화질(R2, D2) 사이의 변위(D)를 계산하고, 계산된 변위(D)가 기지정된 기준 변위(Dref) 이상이면, 프레임을 스킵하지 않아야 하는 것으로 판별하여 스킵 판별값을 출력할 수 있다. 이 때 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그는 프레임을 스킵하지 않도록 비활성화되어 출력되어야 한다. 그에 반해, 계산된 변위(D)가 기지정된 기준 변위(Dref) 미만이면, 프레임을 스킵해야 하는 것으로 판별하여 스킵 판별값을 출력한다. 이때 스킵 프레임 선별부(120)에서 출력되는 스킵 플래그는 프레임을 스킵하도록 활성화되어야 한다.Accordingly, the
이에 손실 계산부(340)는 학습 과정에서 스킵 프레임 선별부(120)에서 실제 출력된 스킵 플래그의 활성화 또는 비활성화 상태와 손실 계산부(340)에서 판별한 스킵 판별값을 비교하여 손실을 계산하여 역전파함으로써, 스킵 프레임 선별부(120)를 학습시킬 수 있다.Accordingly, the
다만 스킵 플래그가 상기한 바와 같이 이진값으로 출력되고, 손실 계산부(340) 또한 스킵 여부만을 판단하여 서로 동일한지 여부만을 판단하는 경우, 학습 시간이 길어질 수 있다. 이에 스킵 프레임 선별부(120)가 스킵 확률값을 출력하고, 스킵 확률값을 기반으로 스킵 플래그를 활성화 또는 비활성화하도록 구성된 경우, 획득된 스킵 확률값과 계산된 변위(D)를 정규화한 값의 차이를 손실로 계산하여 역전파함으로써 학습을 수행할 수도 있다.However, when the skip flag is output as a binary value as described above and the
한편, 도 6의 파란색 라인과 같이 스킵하지 않은 상태의 압축률과 화질(R1, D1)에 따른 2차원 패턴을 모두 획득하는 것은 매우 번거로운 작업이다. 이에 프레임을 스킵하지 않은 경우에 압축률(R1)과 프레임 화질(D1) 사이의 관계가 획득되면, 이를 보라색 라인과 같이 3차 함수(F(x) = a3x3+ a2x2+ a1x+ a0) 형태로 피팅(Fitting)하여 피팅 함수(Fitting Function)를 획득하고, 피팅 함수(Fitting Function)와 프레임을 스킵한 상태의 압축률과 화질(R2, D2) 사이의 변위(D)를 계산하여 손실을 계산할 수도 있다.Meanwhile, as shown in the blue line of FIG. 6 , it is a very cumbersome task to acquire all of the two-dimensional patterns according to the compression ratio and image quality (R 1 , D 1 ) in a non-skipping state. Accordingly, when the relationship between the compression rate (R 1 ) and the frame quality (D 1 ) is obtained when the frame is not skipped, it is expressed as a cubic function (F(x) = a 3 x 3 + a 2 x 2 as shown in the purple line). + a 1 x+ a 0 ) to obtain a fitting function, and the displacement between the fitting function and the compression rate and image quality (R 2 , D 2 ) in the state of skipping frames You can also calculate the loss by calculating (D).
도 7은 본 발명의 일 실시예에 따른 스킵 프레임 선별 방법을 나타낸다.7 shows a skip frame selection method according to an embodiment of the present invention.
도 1 내지 도 6을 참조하여, 도 7의 스킵 프레임 선별 방법을 설명하면, 스킵 프레임 선별 방법(S10)은 우선 입력 영상의 다수의 프레임 중 고정 및 스킵 가능 프레임을 기지정된 방식으로 설정한다(S11). 이때 우선 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정할 수 있다.Referring to FIGS. 1 to 6, the skip frame selection method of FIG. 7 is described. In the skip frame selection method (S10), fixed and skippable frames among a plurality of frames of an input image are set in a predetermined manner (S11). ). In this case, first of the plurality of frames, a fixed frame may be set at a predetermined interval from an initial frame, and the remaining frames may be set as skippable frames.
고정 및 스킵 가능 프레임이 설정되면, 스킵 가능 프레임의 스킵 여부를 판별하도록 미리 학습된 인공 신경망으로 순차적으로 연속하여 기지정된 개수씩 인가한다(S12). 이때, 이전 스킵되는 것으로 판별된 스킵 프레임은 포함되지 않도록 한다.When the fixed and skippable frames are set, a pre-learned artificial neural network is sequentially and continuously applied by a predetermined number to determine whether to skip skippable frames (S12). In this case, skip frames previously determined to be skipped are not included.
학습된 인공 신경망은 학습된 방식에 따라 인가된 프레임 중 기지정된 위치의 프레임의 스킵 여부를 판별한다(S13). 이때 인공 신경망은 입력된 프레임들로부터 프레임이 스킵되는 경우에 이후 지정된 코덱에 의해 인코딩 및 디코딩 되고, 스킵된 프레임이 보간되어 복원된 영상의 화질을 고려하여 스킵 여부를 판별하도록 학습될 수 있다.The learned artificial neural network determines whether to skip a frame at a predetermined position among applied frames according to the learned method (S13). In this case, when a frame is skipped from the input frames, the artificial neural network is encoded and decoded by a designated codec, and the skipped frame is interpolated to learn to determine skipping in consideration of the quality of the reconstructed image.
만일 스킵 프레임으로 판별되면, 스킵 플래그를 활성화한다. 이때 스킵 플래그는 0 또는 1의 이진값을 가질 수 있으며, 일 예로 스킵 플래그는 1로 활성화되어 출력될 수 있다. 경우에 따라서는 인공 신경망으로부터 스킵 확률값이 획득되고, 획득된 스킵 확률값이 기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화할 수도 있다.If it is determined as a skip frame, a skip flag is activated. In this case, the skip flag may have a binary value of 0 or 1, and for example, the skip flag may be activated and output as 1. In some cases, a skip probability value may be obtained from an artificial neural network, and a skip flag may be deactivated or activated according to whether the obtained skip probability value is greater than or equal to a predetermined reference value.
스킵 플래그가 활성화되면, 활성화된 스킵 플래그에 대응하는 프레임을 제외한 나머지 프레임들을 코덱에 의해 지정된 방식에 따라 순차적으로 인코딩하여 인코딩 영상을 획득한다(S15). 이때 스킵 플래그 또한 함께 인코딩되어 인코딩 영상에 포함된다.When the skip flag is activated, an encoded image is obtained by sequentially encoding the frames other than the frame corresponding to the activated skip flag according to a method specified by the codec (S15). At this time, the skip flag is also encoded and included in the encoded image.
스킵 프레임 선별 방법(S10)은 인코딩 영상을 획득하는 것으로 완료될 수 있으나, 스킵되고 인코딩되어 압축된 영상은 이후 입력 영상과 유사하게 복원될 수 있어야 한다. 이에 이하에서는 영상 복원 방법을 추가적으로 설명한다. 영상 복원 방법(S20)에서는 우선 인코딩된 프레임을 인가받아 코덱에 의해 지정된 방식에 따라 디코딩하여 디코딩 영상을 획득한다(S21). 인코딩 영상이 디코딩됨에 따라 디코딩 영상에서는 스킵 플래그가 복구된다.The skip frame selection method ( S10 ) may be completed by obtaining an encoded image, but the skipped, encoded, and compressed image should then be reconstructed similarly to the input image. Accordingly, an image restoration method will be additionally described below. In the image restoration method (S20), first, an encoded frame is received and decoded according to a method specified by a codec to obtain a decoded image (S21). As the encoded image is decoded, the skip flag is restored in the decoded image.
그리고 복구된 스킵 플래그 중 활성화된 스킵 플래그가 검출되는지 판별한다(S22). 만일 활성화된 스킵 플래그가 검출되면, 검출된 스킵 플래그에 시간적으로 인접한 이전 및 이후 프레임을 추출한다(S23). 그리고 추출된 인접 프레임을 기지정된 방식으로 보간하여 보간 프레임을 획득한다(S24). 이때 보간 프레임은 기지정된 수학적 방식에 따라 획득되거나 미리 학습된 인공 신경망을 이용하여 획득될 수 있다. 또한 인공 신경망을 이용하여 획득되는 경우, 코덱에 따른 인코딩 및 디코딩 과정에서 발생하는 인접 프레임의 왜곡을 함께 보상하도록 인공 신경망이 미리 학습될 수도 있다.Then, it is determined whether an activated skip flag is detected among the recovered skip flags (S22). If an activated skip flag is detected, previous and subsequent frames temporally adjacent to the detected skip flag are extracted (S23). Then, an interpolated frame is obtained by interpolating the extracted adjacent frame in a predetermined manner (S24). In this case, the interpolation frame may be obtained according to a predetermined mathematical method or may be obtained using a pre-learned artificial neural network. In addition, when obtained using an artificial neural network, the artificial neural network may be trained in advance to compensate for distortion of adjacent frames generated during encoding and decoding processes according to a codec.
보간 프레임이 획득되면, 인접 프레임 사이에 보간 프레임을 배치하여 입력 영상을 복원한 복원 영상을 획득한다(S25).When interpolation frames are acquired, interpolation frames are arranged between adjacent frames to obtain a reconstructed image obtained by reconstructing an input image (S25).
여기서 프레임의 스킵 여부를 판별하는 인공 신경망은 프레임을 스킵하지 않고 인코딩한 압축률(R1)과 프레임을 스킵하여 인코딩한 압축률(R2) 및 프레임을 스킵하지 않고 인코딩된 인코딩 영상들을 디코딩하여 획득된 디코딩 영상의 왜곡 수준(D1)을 프레임을 스킵하여 인코딩 및 디코딩하고 스킵된 프레임을 보간하여 삽입한 다수의 복원 프레임의 왜곡 수준(D2)에 따른 변위(D)를 계산하고, 계산된 변위를 정규화한 정규화된 변위와 스킵 확률값 사이의 오차를 손실로 계산하여 역전파하여 학습될 수 있다. 또는 변위(D)에 따른 스킵 여부와 스킵 플래그의 이진값을 비교하여 손실로 역전파함으로써 학습될 수도 있다.Here, the artificial neural network that determines whether or not to skip a frame is obtained by decoding the compression rate encoded without skipping the frame (R 1 ), the compression rate encoded by skipping the frame (R 2 ), and the encoded images encoded without skipping the frame. The distortion level (D 1 ) of the decoded image is encoded and decoded by skipping frames, and the displacement (D) is calculated according to the distortion level (D 2 ) of a plurality of restored frames inserted by interpolating the skipped frames, and the calculated displacement It can be learned by backpropagating by calculating the error between the normalized displacement and the skip probability value as a loss. Alternatively, it may be learned by comparing skipping according to displacement (D) with the binary value of the skip flag and performing backpropagation with a loss.
본 발명에 따른 방법은 컴퓨터에서 실행시키기 위한 매체에 저장된 컴퓨터 프로그램으로 구현될 수 있다. 여기서 컴퓨터 판독가능 매체는 컴퓨터에 의해 액세스 될 수 있는 임의의 가용 매체일 수 있고, 또한 컴퓨터 저장 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함하며, ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광데이터 저장장치 등을 포함할 수 있다.The method according to the present invention may be implemented as a computer program stored in a medium for execution on a computer. Here, computer readable media may be any available media that can be accessed by a computer, and may also include all computer storage media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data, including read-only memory (ROM) dedicated memory), random access memory (RAM), compact disk (CD)-ROM, digital video disk (DVD)-ROM, magnetic tape, floppy disk, optical data storage device, and the like.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 이는 예시적인 것에 불과하며, 본 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다.Although the present invention has been described with reference to the embodiments shown in the drawings, this is only exemplary, and those skilled in the art will understand that various modifications and equivalent other embodiments are possible therefrom.
따라서, 본 발명의 진정한 기술적 보호 범위는 첨부된 청구범위의 기술적 사상에 의해 정해져야 할 것이다.Therefore, the true technical protection scope of the present invention should be determined by the technical spirit of the appended claims.
100: 스킵 프레임 선별 장치
200: 영상 복원 장치
300: 프레임 선별 학습부
110: 프레임 설정부
120: 스킵 프레임 선별부
130: 인코더
210: 디코더
220: 스킵 프레임 보간부
310: 압축률 계산부
320: 영상 화질 측정부
330: 2차원 투영부
340: 손실 계산부100: skip frame selection device 200: image restoration device
300: frame selection learning unit 110: frame setting unit
120: skip frame selector 130: encoder
210: decoder 220: skip frame interpolator
310: compression ratio calculation unit 320: image quality measurement unit
330: 2-dimensional projection unit 340: loss calculation unit
Claims (16)
미리 학습된 인공 신경망으로 구현되어, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 스킵 프레임 선별부; 및
상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 인코더를 포함하되,
상기 스킵 프레임 선별부는 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습되는 스킵 프레임 선별 장치.a frame setting unit configured to set a skippable frame and a fixed frame among a plurality of frames of an input image;
Implemented as a pre-learned artificial neural network, skip frame selection for activating or inactivating a skip flag by determining whether to skip each of the skippable frames from each of the skippable frames and adjacent frames of each of the skippable frames according to the learned method. wealth; and
An encoder for obtaining an encoded image by encoding the remaining frames except for the skip frame in which the skip flag is activated in a predetermined manner,
The skip frame selection unit pre-learns based on a compression rate of an encoded image according to whether the skip frame is excluded or a quality difference between a decoded image obtained by decoding the encoded image and a reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded. skip frame selector.
상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습되는 스킵 프레임 선별 장치.The method of claim 1, wherein the skip frame selector
The compression rate of the encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of the decoded image obtained by decoding the same are calculated according to a predetermined method, and the compression rate and the image quality are calculated as coordinates in a two-dimensional space as axes. Projecting, calculating the compression rate of the encoded image encoding a plurality of frames excluding the skip frame and the quality of the reconstructed image obtained by decoding it and reconstructing the skip frame, and projecting it to the coordinates of the two-dimensional space, based on the displacement between the two coordinates Learned skip frame selection device.
학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화하는 스킵 프레임 선별 장치.The method of claim 2, wherein the skip frame selector
A skip frame selection device for obtaining a skip probability value for the skippable frame according to a learned method, and inactivating or activating a skip flag according to whether or not the obtained skip probability value is greater than or equal to a predetermined reference value.
상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습되는 스킵 프레임 선별 장치.The method of claim 3, wherein the skip frame selector
A fitting function following a pattern of compression rate and picture quality projected in the two-dimensional space when the skip frame is not excluded is obtained, and a fitting function is obtained, and when the skip frame is excluded, the coordinates between the projected compression rate and the picture quality are obtained. A skip frame selection device that learns based on displacement.
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습되는 스킵 프레임 선별 장치.The method of claim 4, wherein the skip frame selector
An apparatus for selecting skip frames in which, when skip frames are excluded, a difference between a displacement between a projected compression ratio and image quality coordinates and the fitting function and the skip probability value is back-propagated as a loss and learned.
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습되는 스킵 프레임 선별 장치.The method of claim 4, wherein the skip frame selector
Loss obtained by comparing the activation or inactivation state of the skip flag with a skip discrimination value determined according to whether the displacement between the coordinates of the projected compression rate and image quality and the fitting function when excluding the skip frame is equal to or greater than a predetermined reference displacement A skip frame selector that is learned through backpropagation.
상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정하는 스킵 프레임 선별 장치.The method of claim 1, wherein the frame setting unit
A skip frame selection device for setting fixed frames at predetermined intervals from an initial frame among the plurality of frames and setting remaining frames as skippable frames.
상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 스킵 프레임 선별부로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가하는 스킵 프레임 선별 장치.The method of claim 7, wherein the frame setting unit
A skip frame selector for applying each skippable frame and an adjacent frame of the skippable frame to the skip frame selector, except for a case where a skip flag for the adjacent frame is already activated, and a next skippable frame and an adjacent frame. .
미리 학습된 인공 신경망을 이용하여, 학습된 방식에 따라 상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임 각각의 인접 프레임으로부터 상기 스킵 가능 프레임 각각의 스킵 여부를 판별하여 스킵 플래그를 활성화 또는 비활성화하는 단계; 및
상기 스킵 플래그가 활성화된 스킵 프레임을 제외한 나머지 프레임을 기지정된 방식으로 인코딩하여 인코딩 영상을 획득하는 단계를 포함하되,
상기 인공 신경망은 상기 스킵 프레임의 제외 여부에 따른 인코딩 영상의 압축률과 인코딩 영상을 디코딩한 디코딩 영상과 상기 스킵 프레임의 제외 여부에 따라 스킵 프레임을 복원한 복원 영상 사이의 화질 차이에 기초하여 미리 학습되는 스킵 프레임 선별 방법.setting a skippable frame and a fixed frame among a plurality of frames of an input image;
activating or inactivating a skip flag by determining whether each of the skippable frames is skipped from each of the skippable frames and adjacent frames of each of the skippable frames according to a learned method using a pre-learned artificial neural network; and
Obtaining an encoded image by encoding remaining frames other than the skip frame in which the skip flag is activated in a predetermined manner,
The artificial neural network is pre-learned based on the compression rate of the encoded image according to whether or not the skip frame is excluded and the quality difference between the decoded image obtained by decoding the encoded image and the reconstructed image obtained by reconstructing the skip frame according to whether or not the skip frame is excluded How to select skip frames.
상기 스킵 프레임을 제외하지 않은 상기 입력 영상의 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩한 디코딩 영상의 화질을 미리 지정된 방식에 따라 계산하여 압축률과 화질을 축으로 하는 2차원 공간의 좌표로 투영하고, 상기 스킵 프레임을 제외한 다수의 프레임을 인코딩한 인코딩 영상의 압축률과 이를 디코딩하고 스킵 프레임을 복원한 복원 영상의 화질을 계산하여 상기 2차원 공간의 좌표로 투영하여 두 좌표 간의 변위를 기반으로 학습되는 스킵 프레임 선별 방법.The method of claim 9, wherein the artificial neural network
The compression rate of the encoded image obtained by encoding a plurality of frames of the input image not excluding the skip frame and the quality of the decoded image obtained by decoding the same are calculated according to a predetermined method, and the compression rate and the image quality are calculated as coordinates in a two-dimensional space as axes. Projecting, calculating the compression rate of the encoded image encoding a plurality of frames excluding the skip frame and the quality of the reconstructed image obtained by decoding it and reconstructing the skip frame, and projecting it to the coordinates of the two-dimensional space, based on the displacement between the two coordinates Learned skip frame screening method.
학습된 방식에 따라 상기 스킵 가능 프레임에 대한 스킵 확률값을 획득하고, 획득된 스킵 확기지정된 기준값 이상인지 여부에 따라 스킵 플래그를 비활성화 또는 활성화하는 스킵 프레임 선별 방법.11. The method of claim 10, wherein activating or deactivating the skip flag
A skip frame selection method for obtaining a skip probability value for the skippable frame according to a learned method, and inactivating or activating a skip flag according to whether or not the obtained skip probability value is greater than or equal to a predetermined reference value.
상기 2차원 공간에 상기 스킵 프레임을 제외하지 않은 경우에 투영된 압축률과 화질의 패턴을 추종하는 피팅 함수를 획득하고, 획득된 피팅 함수와 스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표 사이의 변위를 기반으로 학습되는 스킵 프레임 선별 방법.The method of claim 11, wherein the artificial neural network
A fitting function following a pattern of compression rate and picture quality projected in the two-dimensional space when the skip frame is not excluded is obtained, and a fitting function is obtained, and when the skip frame is excluded, the coordinates between the projected compression rate and the picture quality are obtained. A skip frame screening method learned based on displacement.
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위와 상기 스킵 확률값 사이의 차가 손실로 역전파되어 학습되는 스킵 프레임 선별 방법.The method of claim 12, wherein the artificial neural network
A method for selecting skip frames in which, when skip frames are excluded, a difference between a displacement between a projected compression ratio and image quality coordinates and the fitting function and the skip probability value is back-propagated as a loss and learned.
스킵 프레임을 제외한 경우에 투영된 압축률과 화질의 좌표와 상기 피팅 함수 사이의 변위가 기지정된 기준 변위 이상인지 여부에 따라 결정되는 스킵 판별값과 상기 스킵 플래그의 활성화 또는 비활성화 상태를 비교하여 획득되는 손실이 역전파되어 학습되는 스킵 프레임 선별 방법.The method of claim 12, wherein the artificial neural network
Loss obtained by comparing the activation or inactivation state of the skip flag with a skip discrimination value determined according to whether the displacement between the coordinates of the projected compression rate and image quality and the fitting function when excluding the skip frame is equal to or greater than a predetermined reference displacement A method for selecting skip frames that are learned through backpropagation.
상기 다수의 프레임 중 초기 프레임으로부터 기지정된 간격으로 고정 프레임을 설정하고 나머지 프레임을 스킵 가능 프레임으로 설정하는 스킵 프레임 선별 방법.10. The method of claim 9, wherein setting the fixed frame
A skip frame selection method of setting a fixed frame at a predetermined interval from an initial frame among the plurality of frames and setting remaining frames as skippable frames.
상기 스킵 가능 프레임 각각과 상기 스킵 가능 프레임의 인접 프레임을 상기 인공 신경망으로 인가하되, 인접 프레임에 대한 스킵 플래그가 이미 활성화된 경우를 제외하여 다음 스킵 가능 프레임과 인접 프레임을 인가하는 스킵 프레임 선별 방법.16. The method of claim 15, wherein setting the fixed frame
Each skippable frame and an adjacent frame of the skippable frame are applied to the artificial neural network, except when a skip flag for the adjacent frame is already activated, and a next skippable frame and an adjacent frame are applied.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210062514A KR102620281B1 (en) | 2021-05-14 | 2021-05-14 | Apparatus and Method for Selecting Skip Frames |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210062514A KR102620281B1 (en) | 2021-05-14 | 2021-05-14 | Apparatus and Method for Selecting Skip Frames |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220154940A true KR20220154940A (en) | 2022-11-22 |
KR102620281B1 KR102620281B1 (en) | 2023-12-29 |
Family
ID=84236251
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210062514A KR102620281B1 (en) | 2021-05-14 | 2021-05-14 | Apparatus and Method for Selecting Skip Frames |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102620281B1 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008236789A (en) * | 2001-03-05 | 2008-10-02 | Intervideo Inc | Method for selecting video sequence frame to be skipped during execution of encoding process |
KR102207736B1 (en) | 2020-01-14 | 2021-01-26 | 한국과학기술원 | Frame interpolation, apparatus and method using deep neural network |
-
2021
- 2021-05-14 KR KR1020210062514A patent/KR102620281B1/en active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008236789A (en) * | 2001-03-05 | 2008-10-02 | Intervideo Inc | Method for selecting video sequence frame to be skipped during execution of encoding process |
KR102207736B1 (en) | 2020-01-14 | 2021-01-26 | 한국과학기술원 | Frame interpolation, apparatus and method using deep neural network |
Also Published As
Publication number | Publication date |
---|---|
KR102620281B1 (en) | 2023-12-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR100636606B1 (en) | The image processing equipment, the image processing method and the provision medium | |
JP5580453B2 (en) | Direct mode encoding and decoding apparatus | |
US5134478A (en) | Method and apparatus for compressing and decompressing a digital video signal using predicted and error images | |
KR100738241B1 (en) | Image processing apparatus | |
KR100817732B1 (en) | Coding apparatus and method, decoding apparatus and method, data processing system, and storage medium | |
JP5144545B2 (en) | Moving picture codec apparatus and method | |
JPH02172389A (en) | High efficient coding system for animated picture signal | |
JPH07193822A (en) | Motion prediction processor and device therefor | |
JP7563864B2 (en) | Videoconferencing based on adaptive face reconstruction and face restoration | |
US7424130B2 (en) | Coding apparatus and method, decoding apparatus and method, data processing system, storage medium, and signal | |
CN112004114B (en) | Video processing method and device, readable storage medium and electronic equipment | |
KR20220154940A (en) | Apparatus and Method for Selecting Skip Frames | |
JPH10506505A (en) | Synchronization method for continuous digital video | |
CN114827666B (en) | Video processing method, device and equipment | |
EP0993199A2 (en) | Apparatus and method for image data coding with additional data embedding | |
JPH0686247A (en) | Receiver/reproducer for digital picture signal | |
KR20130121913A (en) | Method and apparatus for measuring quality of video based on frame loss pattern | |
US6288654B1 (en) | Data conversion apparatus, data conversion method, and recording medium | |
KR101471010B1 (en) | Method and system for video quality measurement | |
JP4099687B2 (en) | Image processing apparatus, image processing method, and medium | |
CN117376606A (en) | Video frame supplementing method and device, electronic equipment and storage medium | |
JPH08265751A (en) | Picture reproducing device by mpeg system | |
KR100275543B1 (en) | A high-speed mapping parameter detection device and its detection method | |
JP4264606B2 (en) | Data processing apparatus and data processing method | |
JP2621341B2 (en) | Predictive coding method for video using background prediction and its apparatus |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |