KR102163556B1 - Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain - Google Patents

Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain Download PDF

Info

Publication number
KR102163556B1
KR102163556B1 KR1020180025837A KR20180025837A KR102163556B1 KR 102163556 B1 KR102163556 B1 KR 102163556B1 KR 1020180025837 A KR1020180025837 A KR 1020180025837A KR 20180025837 A KR20180025837 A KR 20180025837A KR 102163556 B1 KR102163556 B1 KR 102163556B1
Authority
KR
South Korea
Prior art keywords
prediction coding
coding units
intra mode
encoded
scene change
Prior art date
Application number
KR1020180025837A
Other languages
Korean (ko)
Other versions
KR20180121340A (en
Inventor
최윤식
홍은기
황현수
Original Assignee
연세대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단 filed Critical 연세대학교 산학협력단
Publication of KR20180121340A publication Critical patent/KR20180121340A/en
Application granted granted Critical
Publication of KR102163556B1 publication Critical patent/KR102163556B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 실시예들은 프레임 별로 전체 예측 부호화 단위 중 인트라 예측 부호화 단위의 비율을 산출하고, 상기 인트라 예측 부호화 단위의 비율에 기반하여 장면 전환 후보를 선출하며, 스킵 모드로 부호화되는 예측 부호화 단위의 개수를 전체 예측 부호화 단위의 개수에서 배제하고, 인트라 예측 부호화 단위에 기반하여 산출된 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출함으로써, 압축 영역에서 영상의 밝기에 강인한 장면 전환 평가 기준을 통해 최종적으로 실제 장면 전환에 근접한 프레임을 검출할 수 있는 야간 영상의 장면 전환 검출 방법 및 장치를 제공한다.In the present embodiments, a ratio of an intra prediction coding unit among all prediction coding units is calculated for each frame, a scene change candidate is selected based on the ratio of the intra prediction coding unit, and the number of prediction coding units encoded in the skip mode is total By excluding from the number of prediction coding units and detecting a scene change using the complexity and edge histogram calculated based on the intra prediction coding unit, the actual scene change is finally achieved through a scene change evaluation criterion that is robust to the brightness of the image in the compressed region. It provides a method and apparatus for detecting a scene change of a night image capable of detecting a frame close to a frame.

Description

압축 영역에서 야간 영상의 장면 전환 검출 방법 및 장치 {Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain}[Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain}

본 발명이 속하는 기술 분야는 압축 영상에서 장면 전환을 검출하는 방법 및 장치에 관한 것이다.The technical field to which the present invention pertains relates to a method and apparatus for detecting a scene change in a compressed image.

이 부분에 기술된 내용은 단순히 본 실시예에 대한 배경 정보를 제공할 뿐 종래기술을 구성하는 것은 아니다.The content described in this section merely provides background information on the present embodiment and does not constitute the prior art.

네트워크 전송 기술의 발달과 동영상 부호화 기술의 발달로 실시간 고화질 대용량 동영상 콘텐츠의 수요가 폭발적으로 증가하고 있다. 동영상은 재생 시간과 파일 용량이 비교적 크기 때문에 시청자가 주어진 시간 동안 동영상의 내용을 전체적으로 빠르게 파악하기가 곤란하다. 동영상의 핵심 정보를 담은 키 프레임을 동영상 내에서 검출할 경우, 시청자가 검출된 키 프레임만을 가지고도 동영상의 전체적인 내용을 비교적 빠르게 대략적으로 파악할 수 있다.With the development of network transmission technology and video encoding technology, the demand for real-time high-definition large-capacity video content is exploding. Since the video has a relatively large playback time and file size, it is difficult for a viewer to quickly grasp the overall contents of the video during a given time. When a key frame containing key information of a video is detected in the video, a viewer can roughly grasp the overall content of the video relatively quickly even with only the detected key frame.

일반적으로, 시간상에서 동영상의 장면간 급격한 전환이 이루어지는 프레임을 키 프레임으로 판단한다. 새로운 장면 정보는 장면 전환이 발생한 프레임과 인접한 이전 프레임간의 상관성이 없는 것을 기초하여 판단한다. 기존의 장면 전환 검출 기법은 크게 공간 영역에서의 장면 전환 검출 방식과 압축 영역에서의 장면 전환 검출 방식이 있다.In general, a frame in which a rapid transition between scenes of a video is made in time is determined as a key frame. The new scene information is determined based on the fact that there is no correlation between the frame in which the scene change occurred and the adjacent previous frame. Existing scene change detection techniques are largely divided into a scene change detection method in a spatial domain and a scene change detection method in a compressed area.

공간 영역에서 에지 히스토그램을 이용하는 방식은 프레임 별로 히스토그램 빈의 개수를 총 (부영상의 개수*에지 방향의 개수)만큼 갖고, 에지 분포를 빈으로 하는 히스토그램을 만든 다음, 인접한 프레임들의 에지 히스토그램 차이를 이용하여 장면 전환 여부를 판단한다. 이러한 방식은 공간 영역에서 에지 히스토그램을 구성하기 위해 실제 프레임별 픽셀의 그레이 레벨 값이 필요하므로, 압축된 영상에 대하여 복호화 과정을 거쳐야 한다. 또한 에지 분포를 검출하기 위해서는 다시 부영상을 k개의 영상 블록으로 나누고, 영상 블록을 또 다시 n개의 부블록으로 나누어 부블록의 평균 그레이 레벨값에 필터 계수를 적용하여 필터링 과정을 거쳐야 하는 문제가 있다.The method of using the edge histogram in the spatial domain is to have the total number of histogram bins per frame (number of sub-images * number of edge directions), create a histogram with the edge distribution as bins, and then use the edge histogram difference between adjacent frames. Determine whether to change the scene. In this method, since gray level values of actual pixels per frame are required to construct an edge histogram in the spatial domain, a compressed image must be decoded. In addition, in order to detect the edge distribution, there is a problem in that the sub-picture is divided into k video blocks, the video block is divided into n sub-blocks, and a filter coefficient is applied to the average gray level value of the sub-blocks to undergo a filtering process. .

압축 영역에서 화면 내 예측을 이용한 장면 전환 검출하는 방식은 영상에서 세밀하게 묘사된 부분은 비교적 작은 크기의 화면 내 예측 블록으로 부호화되는 경향에 근거하여 프레임별 화면 내 예측 블록의 예측 크기가 작을수록 복잡도가 높다고 판단한다. 프레임 별로 화면 내 예측 모드로 부호화된 블록의 분포 변화를 가지고 장면 전환 여부를 판단한다. 이러한 방식은 화면 내 예측 모드로 부호화된 블록만이 존재하는 프레임을 고려하기 때문에, 화면 내 예측 모드로 부호화된 프레임이 존재하지 않거나, 화면 간 예측 모드로 부호화 된 블록이 같이 분포할 경우 해당 검출 방법을 사용할 수 없는 문제가 있다.The method of detecting scene change using intra-prediction in the compressed region is based on the tendency that the detailed part of the image is encoded as a relatively small intra-prediction block. I judge that is high. A scene change is determined based on a distribution change of a block encoded in an intra prediction mode for each frame. Since this method considers frames in which only blocks encoded in the intra prediction mode exist, the detection method when there is no frame encoded in the intra prediction mode or blocks encoded in the inter prediction mode are distributed together. There is a problem that cannot be used.

한국등록특허공보 제10-0816013호 (2008.03.17.)Korean Registered Patent Publication No. 10-0816013 (2008.03.17.)

본 발명의 실시예들은 야간 영상 또는 야간 저조도 영상에 대하여 스킵 모드로 부호화되는 블록의 개수를 전체 블록의 개수에서 배제하여 인트라 모드 부호화 블록의 비율을 산출하므로, 프레임이 충분히 장면 전환 후보의 자격을 갖춤에도 낮은 밝기로 인한 스킵 모드 블록들에 의해 검출되지 못하는 문제를 해결하는 데 주된 목적이 있다.Embodiments of the present invention calculate the ratio of intra-mode encoded blocks by excluding the number of blocks encoded in the skip mode for a night image or a low-light image at night from the total number of blocks, so that a frame is sufficiently qualified as a scene change candidate. Edo has a main purpose to solve the problem of not being detected by skip mode blocks due to low brightness.

본 발명의 명시되지 않은 또 다른 목적들은 하기의 상세한 설명 및 그 효과로부터 용이하게 추론할 수 있는 범위 내에서 추가적으로 고려될 수 있다.Still other objects, not specified, of the present invention may be additionally considered within the range that can be easily deduced from the following detailed description and effects thereof.

본 실시예의 일 측면에 의하면, 컴퓨팅 디바이스에 의한 야간 영상의 장면 전환 검출 방법에 있어서, 야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 단계, 및 상기 압축 영역에서, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 단계를 포함하는 야간 영상의 장면 전환 검출 방법을 제공한다.According to an aspect of the present embodiment, in a method for detecting a scene change of a night image by a computing device, a ratio of a prediction coding unit in a compression region encoded in an intra mode from a frame of an image captured at night is calculated, and the intra Selecting a scene change candidate using the ratio of the prediction coding units in the compression region encoded in the mode, and extracting from the compression region based on the intra mode of the prediction coding unit in the compression region encoded in the intra mode It provides a method for detecting a scene change of a night image including the step of detecting a scene change using a complexity and an edge histogram.

본 실시예의 다른 측면에 의하면, 야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 후보 선출부, 및 상기 압축 영역에서, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 장면 판단부를 포함하는 야간 영상의 장면 전환 검출 장치를 제공한다.According to another aspect of the present embodiment, a ratio of prediction coding units in a compression region encoded in an intra mode from a frame of an image photographed at night is calculated, and a ratio of prediction coding units in a compression region encoded in the intra mode is calculated. A candidate selection unit that selects a scene change candidate using, and in the compression region, detects a scene change using a complexity and edge histogram extracted based on an intra mode of a prediction coding unit in the compression region encoded in the intra mode. It provides an apparatus for detecting a scene change of a night image including a scene determination unit.

본 실시예의 또 다른 측면에 의하면, 프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 비일시적(Non-Transitory) 컴퓨터 판독 가능한 매체에 기록되어 야간 영상의 장면 전환 검출을 위한 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램 명령어들이 컴퓨팅 디바이스의 적어도 하나의 프로세서에 의해 실행되는 경우에, 야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 단계, 및 상기 압축 영역에서, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 단계를 포함한 동작들을 수행하는 컴퓨터 프로그램을 제공한다.According to another aspect of the present embodiment, a computer program for detecting a scene change of a night image by being recorded on a non-transitory computer-readable medium including computer program instructions executable by a processor, the computer program instruction When they are executed by at least one processor of the computing device, the ratio of prediction coding units in the compression region encoded in the intra mode from the frame of the image captured at night is calculated, and in the compression region encoded in the intra mode Selecting a scene change candidate using the ratio of the prediction coding units of, and in the compression region, using a complexity and edge histogram extracted based on the intra mode of the prediction coding unit in the compression region encoded in the intra mode. There is provided a computer program that performs operations including detecting a scene change.

이상에서 설명한 바와 같이 본 발명의 실시예들에 의하면, 프레임 별로 전체 예측 부호화 단위 중 인트라 예측 부호화 단위의 비율을 산출하고, 상기 인트라 예측 부호화 단위의 비율에 기반하여 장면 전환 후보를 선출하며, 스킵 모드로 부호화되는 예측 부호화 단위의 개수를 전체 예측 부호화 단위의 개수에서 배제하고, 압축 영역에서 인트라 예측 모드를 기반으로 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출함으로써, 고화질 동영상 압축 표준인 H.264 또는 HEVC 표준안의 구문에 크게 의존적이지 않고, 비교적 구문 독립적으로 간편하게 기존 표준안 내에서 유연하게 구현할 수 있고, 압축 영역에서 영상의 완전한 복호화 없이 영상의 밝기에 강인한 장면 전환 평가 기준을 통해 최종적으로 실제 장면 전환에 근접한 프레임을 검출할 수 있는 효과가 있다.As described above, according to embodiments of the present invention, a ratio of an intra prediction coding unit among all prediction coding units for each frame is calculated, a scene change candidate is selected based on the ratio of the intra prediction coding unit, and a skip mode The number of prediction coding units encoded by is excluded from the total number of prediction coding units, and a scene change is detected using a complexity and an edge histogram based on an intra prediction mode in the compression region, thereby using H.264 or a high definition video compression standard. It is not very dependent on the syntax of the HEVC standard, and can be implemented flexibly within the existing standard with relatively simple syntax independent, and through the scene change evaluation standard that is robust to the brightness of the image without complete decoding of the image in the compressed area There is an effect of being able to detect adjacent frames.

여기에서 명시적으로 언급되지 않은 효과라 하더라도, 본 발명의 기술적 특징에 의해 기대되는 이하의 명세서에서 기재된 효과 및 그 잠정적인 효과는 본 발명의 명세서에 기재된 것과 같이 취급된다.Even if it is an effect not explicitly mentioned herein, the effect described in the following specification expected by the technical features of the present invention and the provisional effect thereof are treated as described in the specification of the present invention.

도 1은 영상 부호화 장치를 예시한 도면이다.
도 2는 영상 복호화 장치를 예시한 도면이다.
도 3은 본 발명의 일 실시예에 따른 장면 전환 검출 장치를 예시한 블록도이다.
도 4는 본 발명의 일 실시예에 따른 장면 전환 검출 장치가 HEVC 예측 모드에 따라 PU 단위로 분할하는 것을 예시한 도면이다.
도 5는 본 발명의 일 실시예에 따른 장면 전환 검출 장치가 참조하는 화면 내 예측 모드에 따른 에지 방향을 예시한 도면이다.
도 6은 본 발명의 일 실시예에 따른 장면 전환 검출 장치가 한 프레임으로부터 복잡도 및 에지 히스토그램을 구성하는 것을 예시한 도면이다.
도 7은 본 발명의 일 실시예에 따른 장면 전환 검출 장치가 율-왜곡 최적화에 의해 예측 모드를 결정하는 것을 예시한 도면이다.
도 8은 본 발명의 다른 실시예에 따른 장면 전환 검출 방법을 예시한 흐름도이다.
도 9는 본 발명의 일 실시예에 따른 장면 전환 검출 장치가 처리하는 야간 블랙박스 촬영 영상 중 한 장면의 매크로블록 모드 분포를 나타낸 것이다.
1 is a diagram illustrating an image encoding apparatus.
2 is a diagram illustrating an image decoding apparatus.
3 is a block diagram illustrating a scene change detection apparatus according to an embodiment of the present invention.
FIG. 4 is a diagram illustrating that a scene change detection apparatus according to an embodiment of the present invention divides into a PU unit according to an HEVC prediction mode.
5 is a diagram illustrating an edge direction according to an intra prediction mode referenced by a scene change detection apparatus according to an embodiment of the present invention.
6 is a diagram illustrating that a scene change detection apparatus according to an embodiment of the present invention constructs a complexity and edge histogram from one frame.
7 is a diagram illustrating that a scene change detection apparatus according to an embodiment of the present invention determines a prediction mode by rate-distortion optimization.
8 is a flowchart illustrating a method for detecting a scene change according to another embodiment of the present invention.
9 is a diagram illustrating a macroblock mode distribution of a scene among night black box captured images processed by the scene change detection apparatus according to an embodiment of the present invention.

이하, 본 발명을 설명함에 있어서 관련된 공지기능에 대하여 이 분야의 기술자에게 자명한 사항으로서 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략하고, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다.Hereinafter, in describing the present invention, when it is determined that the subject matter of the present invention may be unnecessarily obscured as matters apparent to those skilled in the art with respect to known functions related to the present invention, a detailed description thereof will be omitted, and some embodiments of the present invention will be described. It will be described in detail through exemplary drawings.

도 1은 영상 부호화 장치를 예시한 도면이다.1 is a diagram illustrating an image encoding apparatus.

도 1을 참조하면, 상기 영상 부호화 장치(100)는 움직임 예측부(111), 움직임 보상부(112), 인트라 예측부(120), 스위치(115), 감산기(125), 변환부(130), 양자화부(140), 엔트로피 부호화부(150), 역양자화부(160), 역변환부(170), 가산기(175), 필터부(180) 및 참조영상 버퍼(190)를 포함한다.Referring to FIG. 1, the image encoding apparatus 100 includes a motion prediction unit 111, a motion compensation unit 112, an intra prediction unit 120, a switch 115, a subtractor 125, and a transform unit 130. , A quantization unit 140, an entropy encoding unit 150, an inverse quantization unit 160, an inverse transform unit 170, an adder 175, a filter unit 180, and a reference image buffer 190.

영상 부호화 장치(100)는 입력 영상에 대해 인트라(Intra) 모드 또는 인터(Inter) 모드로 부호화를 수행하고 비트스트림을 출력한다. 이하 본 발명의 실시예에서는 인트라 예측은 화면 내 예측, 인터 예측은 화면 간 예측과 동일한 의미로 사용될 수 있다. 예측 단위에 대한 최적의 예측 방법을 결정하기 위해 예측 단위에 대해 화면 내 예측 방법 및 화면 간 예측 방법이 선택적으로 사용될 수 있다. 영상 부호화 장치(100)는 입력 영상의 원본 블록에 대한 예측 블록을 생성한 후, 원본 블록과 예측 블록의 차분을 부호화한다.The image encoding apparatus 100 encodes an input image in an intra mode or an inter mode, and outputs a bitstream. Hereinafter, in an embodiment of the present invention, intra prediction may have the same meaning as intra prediction, and inter prediction may have the same meaning as inter prediction. In order to determine an optimal prediction method for the prediction unit, an intra prediction method and an inter prediction method may be selectively used for the prediction unit. The image encoding apparatus 100 generates a prediction block for an original block of an input image, and then encodes a difference between the original block and the prediction block.

화면 내 예측 모드인 경우, 인트라 예측부(120)(또는 화면 내 예측부도 동일한 의미를 가지는 용어로 사용될 수 있음)는 현재 블록 주변의 이미 부호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성한다.In the case of the intra prediction mode, the intra prediction unit 120 (or the intra prediction unit can also be used as a term having the same meaning) performs spatial prediction using pixel values of an already coded block around the current block. Create a block.

화면 간 예측 모드인 경우, 움직임 예측부(111)는, 움직임 예측 과정에서 참조 영상 버퍼(190)에 저장되어 있는 참조 영상에서 입력 블록과 가장 매치가 잘 되는 영역을 찾아 움직임 벡터를 구한다. 움직임 보상부(112)는 움직임 벡터를 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성한다.In the case of the inter prediction mode, the motion prediction unit 111 finds a region in the reference image stored in the reference image buffer 190 that best matches the input block in the motion prediction process to obtain a motion vector. The motion compensation unit 112 generates a prediction block by performing motion compensation using a motion vector.

감산기(125)는 입력 블록과 생성된 예측 블록의 차분에 의해 잔여 블록(Residual Block)을 생성한다. 변환부(130)는 잔여 블록에 대해 변환(Transform)을 수행하여 변환 계수(Transform Coefficient)를 출력한다. 그리고 양자화부(140)는 입력된 변환 계수를 양자화 파라미터에 따라 양자화하여 양자화된 계수(Quantized Coefficient)를 출력한다. 엔트로피 부호화부(150)는 입력된 양자화된 계수를 확률 분포에 따라 엔트로피 부호화하여 비트스트림(Bit Stream)을 출력한다.The subtractor 125 generates a residual block based on the difference between the input block and the generated prediction block. The transform unit 130 outputs a transform coefficient by performing transform on the residual block. Further, the quantization unit 140 quantizes the input transform coefficient according to the quantization parameter and outputs a quantized coefficient. The entropy encoding unit 150 entropy-encodes the input quantized coefficients according to a probability distribution and outputs a bit stream.

HEVC 역시 인트라 예측 부호화(화면 내 예측 부호화) 또는 인터 예측 부호화(화면 간 예측 부호화)를 수행한다. 인터 예측 부호화시 현재 부호화된 영상은 참조 영상으로 사용되기 위해 복호화되어 저장될 필요가 있다. 따라서 양자화된 계수는 역양자화부(160)에서 역양자화되고 역변환부(170)에서 역변환된다. 역양자화, 역변환된 계수는 가산기(175)를 통해 예측 블록과 더해지고 복원 블록이 생성된다.HEVC also performs intra prediction encoding (intra prediction encoding) or inter prediction encoding (inter prediction encoding). During inter prediction encoding, the currently encoded image needs to be decoded and stored in order to be used as a reference image. Accordingly, the quantized coefficients are inverse quantized by the inverse quantization unit 160 and inversely transformed by the inverse transform unit 170. The inverse quantized and inverse transformed coefficients are added to the prediction block through an adder 175 and a reconstructed block is generated.

복원 블록은 필터부(180)를 거치고, 필터부(180)는 디블록킹 필터(Deblocking Filter) 및 SAO(Sample Adaptive Offset) 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(180)는 적응적 인루프(in-loop) 필터로 불릴 수도 있다. 디블록킹 필터는 블록 간의 경계에 생긴 블록 왜곡을 제거할 수 있다. SAO는 코딩 에러를 보상하기 위해 픽셀값에 적정 오프셋(offset) 값을 더해줄 수 있다. 필터부(180)를 거친 복원 블록은 참조 영상 버퍼(190)에 저장된다. The reconstructed block passes through the filter unit 180, and the filter unit 180 may apply at least one of a deblocking filter and a sample adaptive offset (SAO) to a reconstructed block or a reconstructed picture. The filter unit 180 may also be referred to as an adaptive in-loop filter. The deblocking filter can remove block distortion occurring at the boundary between blocks. SAO may add an appropriate offset value to a pixel value to compensate for a coding error. The reconstructed block that has passed through the filter unit 180 is stored in the reference image buffer 190.

도 2는 영상 복호화 장치를 예시한 도면이다.2 is a diagram illustrating an image decoding apparatus.

도 2를 참조하면, 영상 복호화 장치(200)는 엔트로피 복호화부(210), 역양자화부(220), 역변환부(230), 인트라 예측부(240), 움직임 보상부(250), 필터부(260) 및 참조 영상 버퍼(270)를 포함한다.Referring to FIG. 2, the image decoding apparatus 200 includes an entropy decoding unit 210, an inverse quantization unit 220, an inverse transform unit 230, an intra prediction unit 240, a motion compensation unit 250, and a filter unit. 260) and a reference image buffer 270.

영상 복호화 장치(200)는 부호화기에서 출력된 비트스트림을 입력 받아 인트라 모드 또는 인터 모드로 복호화를 수행하고 재구성된 영상, 즉 복원 영상을 출력한다. 인트라 모드인 경우 화면 내 예측 모드를 사용하여 예측 블록을 생성하고 인터 모드인 경우 화면 간 예측 방법을 사용하여 예측 블록을 생성한다. 영상 복호화 장치(200)는 입력 받은 비트스트림으로부터 잔여 블록(Residual Block)을 얻고 예측 블록을 생성한 후 잔여 블록과 예측블록을 더하여 재구성된 블록, 즉 복원 블록을 생성한다.The image decoding apparatus 200 receives the bitstream output from the encoder, performs decoding in an intra mode or an inter mode, and outputs a reconstructed image, that is, a reconstructed image. In the case of intra mode, a prediction block is generated using an intra prediction mode, and in the case of an inter mode, a prediction block is generated using an inter prediction method. The image decoding apparatus 200 obtains a residual block from the received bitstream, generates a prediction block, and then adds the residual block and the prediction block to generate a reconstructed block, that is, a reconstructed block.

엔트로피 복호화부(210)는 입력된 비트스트림을 확률 분포에 따라 엔트로피 복호화하여 양자화된 계수(Quantized Coefficient)를 출력한다. 양자화된 계수는 역양자화부(220)에서 역양자화되고 역변환부(230)에서 역변환되며, 양자화된 계수가 역양자화/역변환된 결과, 잔여 블록(Residual Block)이 생성된다.The entropy decoding unit 210 entropy-decodes the input bitstream according to a probability distribution and outputs a quantized coefficient. The quantized coefficients are inverse quantized by the inverse quantization unit 220 and inversely transformed by the inverse transform unit 230, and as a result of the inverse quantization/inverse transformation of the quantized coefficients, a residual block is generated.

화면 내 예측 모드인 경우, 인트라 예측부(240)(또는 화면 간 예측부)는 현재 블록 주변의 이미 부호화된 블록의 픽셀값을 이용하여 공간적 예측을 수행하여 예측 블록을 생성한다.In the case of the intra prediction mode, the intra prediction unit 240 (or the inter prediction unit) generates a prediction block by performing spatial prediction using pixel values of an already coded block around the current block.

화면 간 예측 모드인 경우, 움직임 보상부(250)는 움직임 벡터 및 참조 영상 버퍼(270)에 저장되어 있는 참조영상을 이용하여 움직임 보상을 수행함으로써 예측 블록을 생성한다.In the case of the inter prediction mode, the motion compensation unit 250 generates a prediction block by performing motion compensation using a motion vector and a reference image stored in the reference image buffer 270.

잔여 블록과 예측 블록은 가산기(255)를 통해 더해지고, 더해진 블록은 필터부(260)를 거친다. 필터부(260)는 디블록킹 필터 및 SAO 중 적어도 하나 이상을 복원 블록 또는 복원 픽쳐에 적용할 수 있다. 필터부(260)는 재구성된 영상, 즉 복원 영상을 출력한다. 복원 영상은 참조 영상 버퍼(270)에 저장되어 화면 간 예측에 사용될 수 있다. The residual block and the prediction block are added through the adder 255, and the added block passes through the filter unit 260. The filter unit 260 may apply at least one of a deblocking filter and an SAO to a reconstructed block or a reconstructed picture. The filter unit 260 outputs a reconstructed image, that is, a reconstructed image. The reconstructed image may be stored in the reference image buffer 270 and used for inter prediction.

부호화/복호화 장치의 예측 성능을 향상시키기 위한 방법에는 보간(Interpolation) 영상의 정확도를 높이는 방법과 차신호를 예측하는 방법이 있다. 여기서 차신호란 원본 영상과 예측 영상과의 차이를 나타내는 신호이다.Methods for improving the prediction performance of an encoding/decoding apparatus include a method of increasing the accuracy of an interpolation image and a method of predicting a difference signal. Here, the difference signal is a signal representing the difference between the original image and the predicted image.

본 발명에서 '차신호'는 문맥에 따라 '차분 신호', '잔여 블록' 또는 '차분 블록'으로 대체되어 사용될 수 있으며, 해당 기술분야에서 통상의 지식을 가진 자는 발명의 사상, 본질에 영향을 주지 않는 범위 내에서 이를 구분할 수 있을 것이다.In the present invention, the'difference signal' may be replaced with'difference signal','residual block' or'difference block' depending on the context, and those of ordinary skill in the art may have an influence on the spirit and nature of the invention. You will be able to distinguish this within the scope not given.

본 발명의 실시예에서는 설명의 편의상 코딩 유닛(Coding Unit, CU)을 부호화 단위라는 용어로 사용하지만, 부호화뿐만 아니라 복호화를 수행하는 단위가 될 수도 있다. 이하, 본 발명의 실시예에서 설명하는 영상 부호화 방법은, 각 모듈의 기능에서 맞게 구현될 수 있고 이러한 부호화기 및 복호화기는 본 발명의 권리범위에 포함된다. 즉, 본 발명의 실시예에서 후술할 영상 부호화/복호화 방법은 영상 부호화기 및 영상 복호화기에 포함된 각 구성부에서 수행될 수 있다. 구성부의 의미는 하드웨어적인 의미뿐만 아니라 알고리즘을 통해 수행될 수 있는 소프트웨어적인 처리 단위도 포함할 수 있다.In an embodiment of the present invention, for convenience of description, a coding unit (CU) is used as a term of a coding unit, but may be a unit that performs not only encoding but also decoding. Hereinafter, the video encoding method described in the embodiment of the present invention can be implemented in accordance with the function of each module, and such an encoder and a decoder are included in the scope of the present invention. That is, an image encoding/decoding method to be described later in an exemplary embodiment of the present invention may be performed by each component included in the image encoder and the image decoder. The meaning of the component may include not only a hardware meaning but also a software processing unit that can be performed through an algorithm.

도 1, 도 2의 실시예에 따른 영상 부호화/복호화에서는, 영상의 효율적인 부호화를 위해, 표준에 따른 압축의 기본 단위를 기준으로 부호화를 진행한다. 예컨대, H.264의 부호화 단위는 매크로블록이고, HEVC에서는 단일 크기의 부호화 단위가 다양한 크기로 확장된 CU 구조가 정의될 수 있다. In image encoding/decoding according to the exemplary embodiments of FIGS. 1 and 2, encoding is performed based on a basic unit of compression according to a standard for efficient encoding of an image. For example, the coding unit of H.264 is a macroblock, and in HEVC, a CU structure in which a coding unit of a single size is extended to various sizes may be defined.

본 명세서에서 블록 또는 예측 부호화 단위는 부호화/복호화의 단위를 의미한다. 부호화/복호화 과정에서, 영상은 소정의 크기로 분할되어 부호화/복호화된다. H.264에서 블록(예측 부호화 단위)은 매크로블록으로 불릴 수 있고, HEVC에서 블록(예측 부호화 단위)은 CU, PU, TU 등으로도 불릴 수도 있으며, 하나의 블록은 더 작은 크기의 하위 블록으로 분할될 수도 있다. In the present specification, a block or prediction coding unit means an encoding/decoding unit. In the encoding/decoding process, an image is divided into a predetermined size and encoded/decoded. In H.264, a block (prediction coding unit) may be referred to as a macroblock, and in HEVC, a block (prediction coding unit) may be referred to as CU, PU, TU, etc., and one block is a smaller-sized sub-block. It can also be divided.

압축의 기본 단위인 기존의 H.264에서의 매크로 블록(Macro Block, MB)이 HEVC(High-Efficiency Video Coding)에서 코딩 트리 유닛(Coding Tree Unit, CTU)으로 대체되었다. 이때, MB의 크기는 16x16크기를 가지는 것에 반해, CTU의 크기는 16x16, 32x32, 64x64 중 하나를 선택할 수 있다. 그리고 하나의 CTU는 다시 하위 코딩 유닛(Coding Unit, CU)들로 나누어질 수 있고, 이러한 CU는 다시 예측 유닛(Prediction Unit, PU)와 변환 유닛(Transform Unit, TU)으로 나누어진다. The macroblock (MB) of the existing H.264, which is the basic unit of compression, has been replaced with a coding tree unit (CTU) in High-Efficiency Video Coding (HEVC). In this case, while the size of the MB has a size of 16x16, the size of the CTU can be selected from one of 16x16, 32x32, and 64x64. In addition, one CTU may be further divided into sub-coding units (CUs), and this CU is further divided into a prediction unit (PU) and a transform unit (TU).

각 CU는 64x64 내지 8x8의 크기를 가질 수 있으며, PU는 64x64 내지 4x4의 크기를 가질 수 있고, TU는 32x32 내지 4x4의 크기를 가질 수 있다. 따라서 HEVC의 경우 H.264에 비해 다양한 크기의 블록 및 주파수 변환을 지원한다. H.264에서는 인트라 예측(Intra-Prediction, 화면 내 예측)에 9개의 예측 방향을 가지는 것에 반해, HEVC는 35가지의 예측 방향을 사용한다. 인터 예측(Inter-Prediction, 화면 간 예측)의 경우에도 기존 H.264의 인터 예측의 경우 최대 블록 사이즈가 16x16까지 제한되어 있는 반면, HEVC에서는 4x4에서 64x64까지 다양한 블록 사이즈를 취급할 수 있도록 확장되었다.Each CU may have a size of 64x64 to 8x8, a PU may have a size of 64x64 to 4x4, and a TU may have a size of 32x32 to 4x4. Therefore, HEVC supports block and frequency conversion of various sizes compared to H.264. In H.264, intra prediction (Intra-Prediction, intra prediction) has 9 prediction directions, whereas HEVC uses 35 prediction directions. In the case of inter-prediction (inter-prediction), the maximum block size is limited to 16x16 in the case of the existing H.264 inter prediction, whereas in HEVC, it has been extended to handle various block sizes from 4x4 to 64x64. .

CU는 비디오 부호화기에서 부호화가 수행되는 하나의 단위로서, 쿼드 트리 구조(Quad Tree Structure)를 기초로 깊이(Depth) 정보를 가지고 계층적으로 분할될 수 있다. CU는 8Х8, 16Х16, 32Х32, 64Х64 등 다양한 크기를 가질 수 있다. 또한 가장 큰 크기의 CU를 LCU(Largest Coding Unit), 가장 작은 크기의 CU를 SCU(Smallest Coding Unit)라 한다. SCU를 제외한 모든 CU는 split_flag 정보를 할당하여 그 값에 따라 해당 CU가 분할된 영역인지 아닌지를 지시하게 된다. 부호화기는 다양한 비디오 신호 특성에 따라, 부호화 과정에서 LCU의 크기를 조절할 수도 있다. CU는 인트라 또는 인터 예측에 사용되도록 PU(Prediction Unit)으로 분할될 수 있으며, 변환 및 양자화를 위해 TU(Transform Unit)으로 분할될 수 있다. A CU is a unit in which encoding is performed in a video encoder, and may be hierarchically divided with depth information based on a quad tree structure. CUs can have various sizes, such as 8Х8, 16Х16, 32Х32, 64Х64. In addition, the largest CU is referred to as LCU (Largest Coding Unit), and the smallest CU is referred to as SCU (Smallest Coding Unit). All CUs except the SCU allocate split_flag information to indicate whether the corresponding CU is a divided region or not according to the value. The encoder may adjust the size of the LCU in the encoding process according to various video signal characteristics. The CU may be divided into a prediction unit (PU) to be used for intra or inter prediction, and may be divided into a transform unit (TU) for transformation and quantization.

PU는 예측 및/또는 움직임 보상 수행의 기본 단위를 의미한다. PU는 복수의 파티션(Partition)으로 분할될 수 있으며, 각각의 파티션은 PU 파티션(Prediction Unit Partition)으로 불린다. PU가 복수의 파티션으로 분할된 경우, PU 파티션은 예측 및/또는 움직임 보상 수행의 기본단위가 될 수 있다. 이하, 본 발명의 실시예에서는 PU는 PU 파티션을 의미할 수도 있다.PU means a basic unit of performing prediction and/or motion compensation. The PU may be divided into a plurality of partitions, and each partition is referred to as a PU partition (Prediction Unit Partition). When the PU is divided into a plurality of partitions, the PU partition may be a basic unit for performing prediction and/or motion compensation. Hereinafter, in an embodiment of the present invention, PU may mean a PU partition.

HEVC(High Efficiency Video Coding)에서는 향상된 움직임 벡터 예측(Advanced Motion Vector Prediction, AMVP)에 기반한 움직임 벡터 예측(Motion Vector Prediction) 방법을 사용한다.High Efficiency Video Coding (HEVC) uses a Motion Vector Prediction method based on Advanced Motion Vector Prediction (AMVP).

향상된 움직임 벡터 예측에 기반한 움직임 벡터 예측 방법에서는 부호화/복호화 대상 블록의 주변에 위치하는 복원 블록의 움직임 벡터(Motion Vector, MV)뿐만 아니라, 참조 픽쳐(Reference Picture) 내에서 부호화/복호화 대상 블록과 동일한 위치 또는 대응되는 위치에 존재하는 블록의 움직임 벡터를 이용할 수 있다. 이때. 참조 픽쳐 내에서 부호화/복호화 대상 블록과 동일한 위치 또는 공간적으로 대응되는 위치에 존재하는 블록을 동등 위치 블록(Collocated Block), 동등 위치 블록의 움직임 벡터를 동등 위치 움직임 벡터(Collocated Motion Vector) 또는 시간적 움직임 벡터(Temporal Motion Vector)라고 부른다. 그러나, 동동 위치 블록(Collocated Block)은 참조 픽쳐의 부호화/복호화 대상 블록과 반드시 동일한 위치에 존재하는 블록만이 아니라, 부호화/복호화 대상 블록과 위치가 유사한, 즉 대응되는 위치에 존재하는 블록일 수도 있다.In the motion vector prediction method based on the improved motion vector prediction, not only the motion vector (MV) of the reconstructed block located around the encoding/decoding target block, but also the same as the encoding/decoding target block within the reference picture. A motion vector of a block existing at a position or a corresponding position may be used. At this time. In the reference picture, a block existing at the same position or spatially corresponding to the encoding/decoding target block is a collocated block, and the motion vector of the equal position block is a collocated motion vector or temporal motion It is called a vector (Temporal Motion Vector). However, the collocated block is not only a block that always exists at the same position as the encoding/decoding target block of the reference picture, but may be a block that has a similar position to the encoding/decoding target block, that is, exists at a corresponding position. have.

움직임 정보 병합(Motion Information Merge) 방법에서는 움직임 정보를 주변에 위치하는 복원 블록뿐만 아니라 동등 위치 블록으로부터도 유추하여, 부호화/복호화 대상 블록의 움직임 정보로 이용한다. 이때, 움직임 정보는 인터 예측 시에 필요한 참조 픽쳐 인덱스(Reference Picture Index), 움직임 벡터, 단방향(Uni-Direction) 또는 양방향(Bi-Direction) 등을 나타내는 인터 예측 모드 정보, 참조 픽쳐 리스트(Reference Picture List), 인트라 예측 모드로 부호화되었는지 인터 예측 모드로 부호화되었는지에 관한 예측 모드(Prediction Mode) 정보 중 적어도 하나 이상을 포함하는 정보이다.In the motion information merge method, motion information is inferred not only from a neighboring reconstructed block but also from an equally positioned block, and used as motion information of an encoding/decoding target block. In this case, the motion information is inter prediction mode information indicating a reference picture index, motion vector, uni-direction or bi-direction required for inter prediction, and a reference picture list. ), information including at least one of prediction mode information on whether it is encoded in an intra prediction mode or an inter prediction mode.

부호화/복호화 대상 블록에서 예측된 움직임 벡터(Predicted Motion Vector)는 부호화/복호화 대상 블록과 공간적으로 인접한 주변 블록의 움직임 벡터뿐만 아니라, 부호화/복호화 대상 블록과 시간적으로 인접한 블록인 동등 위치 블록의 움직임 벡터일 수도 있다.The predicted motion vector in the encoding/decoding target block is not only a motion vector of a neighboring block spatially adjacent to the encoding/decoding target block, but also a motion vector of an equal position block that is a block temporally adjacent to the encoding/decoding target block. May be.

도 3은 장면 전환 검출 장치를 예시한 블록도이다. 3 is a block diagram illustrating a scene change detection apparatus.

도 3에 도시한 바와 같이, 장면 전환 검출 장치(300)는 후보 선출부(310), 및 장면 판단부(320)를 포함한다. 장면 전환 검출 장치(300)는 도 3에서 예시적으로 도시한 다양한 구성요소들 중에서 일부 구성요소를 생략하거나 다른 구성요소를 추가로 포함할 수 있다.As illustrated in FIG. 3, the scene change detection apparatus 300 includes a candidate selection unit 310 and a scene determination unit 320. The scene change detection apparatus 300 may omit some of the various components exemplarily illustrated in FIG. 3 or may additionally include other components.

장면 전환 검출 장치(300)는 스킵 모드로 부호화되는 예측 부호화 단위의 개수는 전체 예측 부호화 단위의 개수에서 배제하여 화면 내 예측 부호화 단위의 비율을 산출하므로, 프레임이 충분히 장면 전환 후보의 자격을 갖춤에도 불구하고 낮은 밝기로 인한 스킵 모드 예측 부호화 단위들에 의해 검출되지 못하는 문제를 해결한다.The scene change detection apparatus 300 calculates the ratio of intra prediction coding units by excluding the number of prediction coding units encoded in the skip mode from the total number of prediction coding units, so even if the frame sufficiently qualifies as a scene change candidate. Nevertheless, a problem in which skip mode prediction coding units due to low brightness cannot be detected is solved.

후보 선출부(310)는 압축 영역에서 프레임 별로 전체 예측 부호화 단위 중 인트라 모드로 부호화된 예측 부호화 단위의 비율을 산출한다. 후보 선출부(310)는 인트라 모드로 부호화된 예측 부호화 단위의 비율에 기반하여 장면 전환 후보 프레임을 선출한다. 후보 선출부(310)는 전체 예측 부호화 단위의 개수에서 스킵 모드로 부호화되는 예측 부호화 단위의 개수를 배제하고, 인트라 모드로 부호화된 예측 부호화 단위의 비율을 산출한다.The candidate selector 310 calculates a ratio of a prediction coding unit encoded in an intra mode among all prediction coding units for each frame in the compression region. The candidate selector 310 selects a scene change candidate frame based on a ratio of prediction coding units encoded in the intra mode. The candidate selector 310 excludes the number of prediction coding units encoded in the skip mode from the total number of prediction coding units, and calculates a ratio of the prediction coding units encoded in the intra mode.

장면 판단부(320)는 압축 영역에서 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드에 기반하여 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출한다.The scene determiner 320 detects a scene change using a complexity and an edge histogram based on an intra mode of a prediction coding unit encoded in an intra mode in the compressed region.

전체적으로 낮은 명도를 갖는 영상 플레임에서 예측 부호화 단위의 부호화 모드는 대부분 스킵 모드로 부호화되기 때문에, 단순히 인트라 모드로 부호화된 블록의 비율로 장면 전환 후보를 선출하면, 야간 영상 또는 야간 저조도 영상과 같이 전체적으로 낮은 밝기의 영상에서 선출된 후보의 정확도에 문제가 있다. Since most of the coding modes of predictive coding units are coded in skip mode in an image frame having low brightness as a whole, if a scene change candidate is simply selected by the ratio of blocks coded in intra mode, overall low-light images such as night images or low-light images There is a problem with the accuracy of the candidates selected from the brightness image.

후보 선출부(310)는 스킵 모드로 부호화된 블록의 개수로 인한 문제를 개선하여 장면 전환 후보를 검출한다. 후보 선출부(310)는 인트라 모드로 부호화된 블록의 비율을 임계 값과 비교한 결과에 따라 후보 프레임을 선출한다. 후보 선출부(310)는 1차적으로 장면 전환 후보 프레임을 검출할 때 수학식 1과 같이 프레임의 인트라 모드 부호화 블록 비율을 산출한다.The candidate selection unit 310 detects a scene change candidate by improving a problem due to the number of blocks encoded in the skip mode. The candidate selection unit 310 selects a candidate frame according to a result of comparing the ratio of blocks encoded in the intra mode with a threshold value. When the candidate selection unit 310 primarily detects a scene change candidate frame, it calculates an intra-mode coding block ratio of the frame as shown in Equation (1).

Figure 112018022096361-pat00001
Figure 112018022096361-pat00001

인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율(R1)은 프레임에 속하는 전체 예측 부호화 단위의 개수(Ntotal)에서 스킵 모드로 부호화된 예측 부호화 단위의 개수(Nskip)를 제외하여 산출된다. 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은 전체 예측 부호화 단위위에서 스킵 모드로 부호화된 예측 부호화 단위를 제외하고 인터 모드로 부호화된 예측 부호화 단위의 개수(Ninter) 및 인트라 모드로 부호화된 예측 부호화 단위의 개수(Nintra)를 합한 수를 분모로 하고, 인트라 모드로 부호화된 예측 부호화 단위의 개수(Nintra)를 분자로 한다. 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은 기 설정된 기준 명도 값보다 낮은 명도 값을 갖는 영상에 대하여, 인트라 모드로 부호화된 예측 부호화 단위의 개수(Nintra) 및 스킵 모드로 부호화된 예측 부호화 단위의 개수(Nskip) 간의 관계를 고려하여 산출될 수 있다. H.264에서의 예측 부호화 단위(블록)는 매크로블록을 의미할 수 있고, HEVC에서의 예측 부호화 단위(블록)는 PU를 의미할 수 있다.The ratio (R 1 ) of prediction coding units in the compression region encoded in the intra mode is from the number of prediction coding units (N total ) belonging to the frame to the number of prediction coding units encoded in the skip mode (N skip ). Is calculated. The ratio of the prediction coding units in the compression region encoded in the intra mode is the number of prediction coding units encoded in the inter mode (N inter ) and the ratio of the prediction coding units encoded in the inter mode except for the prediction coding units encoded in the skip mode over the entire prediction coding units (N inter ) The sum of the number of predicted coding units (N intra ) is used as the denominator, and the number of prediction coding units (N intra ) encoded in the intra mode is used as the numerator. The ratio of the prediction coding units in the compression region encoded in the intra mode is the number of prediction coding units (N intra ) encoded in the intra mode and the number of prediction coding units encoded in the intra mode (N intra ) for an image having a brightness value lower than the preset reference brightness value. It may be calculated by considering a relationship between the number of prediction coding units (N skip ). A prediction coding unit (block) in H.264 may mean a macroblock, and a prediction coding unit (block) in HEVC may mean a PU.

도 4에서는 HEVC 예측 모드에 따른 PU 단위로 분할된 블록이 예시되어 있다. HEVC는 PU 단위를 사용하여 Intra/Inter/Skip으로 블록을 분할한다. 본 실시예는 HEVC 표준으로 부호화된 동영상에 대하여 PU 단위를 기반으로 인트라 모드 부호화 블록 비율을 산출할 수 있다. PU 단위에 기반한 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율(R2)은 수학식 2과 같이 표현된다.In FIG. 4, a block divided by PU according to the HEVC prediction mode is illustrated. HEVC divides a block into Intra/Inter/Skip using a PU unit. In this embodiment, an intra mode coding block ratio may be calculated based on a PU unit for a video coded according to the HEVC standard. The ratio R 2 of the prediction coding unit in the compression region encoded in the intra mode based on the PU unit is expressed as Equation 2.

Figure 112018022096361-pat00002
Figure 112018022096361-pat00002

수학식 2에서 PUtotal은 한 프레임 내의 전체 PU의 개수, PUskip은 한 프레임 내의 skip 모드로 예측된 PU의 개수, 그리고 PUintra는 한 프레임 내의 intra 모드로 예측된 PU의 개수를 나타낸다.In Equation 2, PU total denotes the total number of PUs in one frame, PU skip denotes the number of PUs predicted in the skip mode in one frame, and PU intra denotes the number of PUs predicted in the intra mode in one frame.

본 실시예들은 H.264 또는 HEVC 뿐만 아니라 다른 압축 표준안의 경우도, 수학식 1 및 수학식 2와 유사하게 각 표준안의 예측 부호화 단위를 척도로 삼아서 인트라 모드의 부호화 비율을 수식으로 산출할 수 있다.In the present embodiments, in the case of not only H.264 or HEVC, but also other compression standards, similarly to Equations 1 and 2, the coding ratio of the intra mode may be calculated by using the prediction coding unit in each standard as a measure. .

도 5는 장면 전환 검출 장치가 참조하는 화면 내 예측 모드에 따른 에지 방향이고, 도 6은 장면 전환 검출 장치가 한 프레임으로부터 복잡도 및 에지 히스토그램을 구성하는 것을 예시한 도면이다.5 is an edge direction according to an intra prediction mode referenced by the scene change detection apparatus, and FIG. 6 is a diagram illustrating that the scene change detection apparatus constructs a complexity and edge histogram from one frame.

장면 판단부(320)는 압축 영역에서 인트라 모드로 부호화된 블록의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출한다. The scene determination unit 320 detects a scene change by using the edge histogram and the complexity extracted based on the intra mode of the block encoded in the intra mode in the compressed region.

장면 판단부(320)는 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드의 크기에 따라 복잡도를 산출한다. 장면 판단부(320)는 영상에서 세밀하게 묘사된 부분은 비교적 작은 크기의 화면 내 예측 부호화 단위로 부호화되는 경향에 근거하여 프레임별 인트라 예측 부호화 단위의 예측 크기가 작을수록 복잡도가 높다고 판단한다.The scene determiner 320 calculates the complexity according to the size of the intra mode of the prediction coding unit encoded in the intra mode. The scene determiner 320 determines that the smaller the prediction size of the intra prediction coding unit for each frame is, the higher the complexity, based on a tendency that a detailed portion of the image is encoded in a relatively small intra prediction coding unit.

장면 판단부(320)는 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드의 예측 방향에 따라 에지 히스토그램을 산출한다. 장면 판단부(320)는 인트라 예측시 모드별 예측 방향을 참조하여 에지를 분류한다. 에지 히스토그램은 무방향 에지 대신 넌-에지 빈을 포함한다. The scene determiner 320 calculates an edge histogram according to the prediction direction of the intra mode of the prediction coding unit encoded in the intra mode. The scene determination unit 320 classifies an edge by referring to a prediction direction for each mode during intra prediction. The edge histogram contains non-edge bins instead of undirected edges.

장면 판단부(320)는 복잡도 및 에지 히스토그램 차(Complexity and Edge Histogram Bin Difference, CEH)를 이용하며, 복잡도 및 에지 히스토그램 차는 각 장면 전환 후보 프레임에 속해 있는 매크로블록들의 복잡도와 에지 분포를 각각의 히스토그램 빈(bin)으로 구성된다. 장면 판단부(320)는 인접 프레임 간의 히스토그램 빈의 차이의 절대값의 합이 사전 설정한 임계값보다 크면 해당 프레임에서 장면 전환이 발생했다고 판단한다. 복잡도 및 에지 히스토그램 차에 관한 관계식이 수학식 3과 같이 표현된다.The scene determination unit 320 uses a complexity and edge histogram difference (CEH), and the complexity and edge histogram difference is a histogram of the complexity and edge distribution of macroblocks belonging to each scene change candidate frame. It consists of bins. If the sum of the absolute values of the difference between the histogram bins between adjacent frames is greater than a preset threshold, the scene determination unit 320 determines that a scene change has occurred in the corresponding frame. A relational expression regarding the complexity and edge histogram difference is expressed as in Equation 3.

Figure 112018022096361-pat00003
Figure 112018022096361-pat00003

수학식 3에서 CEHBi(t)는 t번째 장면 전환 후보 프레임의 i번째 히스토그램 빈의 값을 나타낸다. CEHBi(t-1)은 t-1번째 장면 전환 후보 프레임의 I번째 히스토그램 빈의 값을 나타낸다. Ts는 장면 전환 최종 후보 검출을 위해 사전 설정한 임계값이다. 즉, 인접한 프레임 간 동일한 종류에 해당하는 히스토그램 빈 차이의 절댓값의 합을 취하고 이를 최종 장면 전환 검출에 사용한다.In Equation 3, CEHB i (t) represents the value of the i-th histogram bin of the t-th scene change candidate frame. CEHB i (t-1) represents the value of the I th histogram bin of the t-1 th scene change candidate frame. T s is a preset threshold for detecting the final candidate for scene change. That is, the sum of the absolute values of the histogram bin differences corresponding to the same type between adjacent frames is taken and used for the final scene change detection.

HEVC의 최적 예측 모드 방법 결정 과정은 율-왜곡 최적화(Rate-Distortion Optimization)에 의해 결정된다. 이는 수학식 4의 라그랑주 계수법(Lagrange Multiplier)을 이용한 비용함수의 최적화를 수행하여 비용함수(cost function)가 최소가 되는 모드로 결정한다.The process of determining the optimal prediction mode method of HEVC is determined by rate-distortion optimization. This is determined as a mode in which the cost function is minimized by performing optimization of the cost function using the Lagrange Multiplier of Equation 4.

Figure 112018022096361-pat00004
Figure 112018022096361-pat00004

수학식 4에서 Jmode는 최소화하려는 비용함수이다. SSE는 블록간의 오차를 나타내는 Sum of Squared Error이며, ωchroma는 색차 성분을 위한 가중치이고, λmode는 라그랑주 계수이다. SSE, ωchroma, λmode를 구체화하면, 수학식 5와 같이 표현된다.In Equation 4, J mode is a cost function to be minimized. SSE is a Sum of Squared Error representing the error between blocks, ω chroma is a weight for a color difference component, and λ mode is a Lagrange coefficient. If SSE, ω chroma , and λ mode are specified, it is expressed as in Equation 5.

Figure 112018022096361-pat00005
Figure 112018022096361-pat00005

도 7에서는 각각의 예측 모드에 따라 수학식 4의 비용함수를 최소하기 위한 예측 모드 결정 과정이 도시되어 있다. Skip 모드의 경우, 처음 Early_Skip 및 CBF_Fast 조건이 만족하면 최적 모드를 Skip으로 바로 결정한다. Early_Skip의 경우 잔여 블록의 계수가 모두 0이고, 움직임 벡터의 차(Motion Vector Difference)가 0인지 조건을 확인한다. 만약 Early_Skip 조건을 만족하지 못하면, 잔여 블록의 계수가 0인지를 확인하는 CBF_Fast 조건을 확인하고, 만족하지 못하면 다시 Skip 모드에 대한 수학식 4를 계산한다. 이후 다른 모드에 대한 비용 함수들을 수학식 4를 이용하여 계산하고, 최소의 비용함수를 찾아서 최종적으로 해당 예측 모드로 부호화를 수행한다.7 illustrates a process of determining a prediction mode for minimizing the cost function of Equation 4 according to each prediction mode. In the case of Skip mode, when the conditions of Early_Skip and CBF_Fast are satisfied for the first time, the optimal mode is immediately determined as Skip. In the case of Early_Skip, a condition is checked whether the coefficients of the residual blocks are all 0 and the motion vector difference is 0. If the Early_Skip condition is not satisfied, the CBF_Fast condition for checking whether the coefficient of the residual block is 0 is checked, and if not, Equation 4 for the Skip mode is calculated again. Thereafter, cost functions for other modes are calculated using Equation 4, the minimum cost function is found, and finally encoding is performed in the corresponding prediction mode.

야간의 저조도 영상의 경우, 부호화될 블록이 Early_skip 및 CBF_Fast 조건을 만족하거나, 최소의 비용함수가 Skip 모드로 수학식 2의 결과가 되는 블록이 주간의 고조도 영상에 비해 증가하므로, 본 실시예의 장면 전환을 결정하는 과정에서 Skip 모드를 배제하는 것이 야간에서의 장면 전환을 보다 정확하게 검출할 수 있음을 파악할 수 있다.In the case of a low-illuminance image at night, the block to be coded satisfies the Early_skip and CBF_Fast conditions, or the block resulting from Equation 2 in the Skip mode increases compared to the high-illuminance image in the daytime. It can be seen that excluding the Skip mode in the process of determining the transition can more accurately detect the scene transition at night.

장면 전환 검출 장치에 포함된 구성요소들이 도 3에서는 분리되어 도시되어 있으나, 복수의 구성요소들은 상호 결합되어 적어도 하나의 모듈로 구현될 수 있다. 구성요소들은 장치 내부의 소프트웨어적인 모듈 또는 하드웨어적인 모듈을 연결하는 통신 경로에 연결되어 상호 간에 유기적으로 동작한다. 이러한 구성요소들은 하나 이상의 통신 버스 또는 신호선을 이용하여 통신한다.Although components included in the scene change detection apparatus are shown separately in FIG. 3, a plurality of components may be combined with each other to be implemented as at least one module. Components are connected to a communication path connecting a software module or a hardware module inside the device and operate organically with each other. These components communicate using one or more communication buses or signal lines.

장면 전환 검출 장치는 하드웨어, 펌웨어, 소프트웨어 또는 이들의 조합에 의해 로직회로 내에서 구현될 수 있고, 범용 또는 특정 목적 컴퓨터를 이용하여 구현될 수도 있다. 장치는 고정배선형(Hardwired) 기기, 필드 프로그램 가능한 게이트 어레이(Field Programmable Gate Array, FPGA), 주문형 반도체(Application Specific Integrated Circuit, ASIC) 등을 이용하여 구현될 수 있다. 또한, 장치는 하나 이상의 프로세서 및 컨트롤러를 포함한 시스템온칩(System on Chip, SoC)으로 구현될 수 있다.The scene change detection apparatus may be implemented in a logic circuit by hardware, firmware, software, or a combination thereof, or may be implemented using a general purpose or specific purpose computer. The device may be implemented using a hardwired device, a Field Programmable Gate Array (FPGA), an Application Specific Integrated Circuit (ASIC), or the like. In addition, the device may be implemented as a System on Chip (SoC) including one or more processors and controllers.

장면 전환 검출 장치는 하드웨어적 요소가 마련된 컴퓨팅 디바이스 또는 서버에 소프트웨어, 하드웨어, 또는 이들의 조합하는 형태로 탑재될 수 있다. 컴퓨팅 디바이스 또는 서버는 각종 기기 또는 유무선 통신망과 통신을 수행하기 위한 통신 모뎀 등의 통신장치, 프로그램을 실행하기 위한 데이터를 저장하는 메모리, 프로그램을 실행하여 연산 및 명령하기 위한 마이크로프로세서 등을 전부 또는 일부 포함한 다양한 장치를 의미할 수 있다.The scene change detection apparatus may be mounted in software, hardware, or a combination thereof on a computing device or server provided with a hardware element. Computing devices or servers include all or part of a communication device such as a communication modem for performing communication with various devices or wired/wireless communication networks, a memory storing data for executing a program, and a microprocessor for calculating and commanding a program. It can mean various devices including.

도 8은 본 발명의 다른 실시예에 따른 장면 전환 검출 방법을 예시한 흐름도이다. 장면 전환 검출 방법은 컴퓨팅 디바이스에 의하여 수행될 수 있으며, 장면 전환 검출 장치가 수행하는 동작에 관한 상세한 설명과 중복되는 설명은 생략하기로 한다.8 is a flowchart illustrating a method for detecting a scene change according to another embodiment of the present invention. The scene change detection method may be performed by the computing device, and a detailed description of an operation performed by the scene change detection apparatus and a duplicate description will be omitted.

단계 S810에서, 컴퓨팅 디바이스는 압축 영역에서 야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 예측 부호화 단위의 비율을 산출하고, 인트라 모드로 부호화된 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출한다. 인트라 모드로 부호화된 예측 부호화 단위의 비율은 프레임에 속하는 전체 예측 부호화 단위에서 스킵 모드로 부호화된 예측 부호화 단위의 개수를 제외하여 산출된다. 인트라 모드로 부호화된 예측 부호화 단위의 비율은 전체 예측 부호화 단위에서 스킵 모드로 부호화된 예측 부호화 단위을 제외하고 인터 모드로 부호화된 예측 부호화 단위의 개수 및 인트라 모드로 부호화된 예측 부호화 단위의 개수를 합한 수를 분모로 하고, 인트라 모드로 부호화된 예측 부호화 단위의 개수를 분자로 한다. 인트라 모드로 부호화된 예측 부호화 단위의 비율은 기 설정된 기준 명도 값보다 낮은 명도 값을 갖는 영상에 대하여, 인트라 모드로 부호화된 예측 부호화 단위의 개수 및 스킵 모드로 부호화된 예측 부호화 단위의 개수 간의 관계를 고려하여 산출될 수 있다. 장면 전환 후보를 선출하는 단계(S810)는 인트라 모드로 부호화된 예측 부호화 단위의 비율을 임계 값과 비교한 결과에 따라 후보 프레임을 선출한다.In step S810, the computing device calculates a ratio of the prediction coding units encoded in the intra mode from the frames of the image captured at night in the compression region, and selects a scene change candidate using the ratio of the prediction coding units encoded in the intra mode. do. The ratio of the prediction coding units encoded in the intra mode is calculated by excluding the number of prediction coding units encoded in the skip mode from all the prediction coding units belonging to the frame. The ratio of the prediction coding units encoded in the intra mode is the sum of the number of prediction coding units encoded in the inter mode and the number of prediction coding units encoded in the intra mode excluding the prediction coding units encoded in the skip mode from all the prediction coding units. Is the denominator, and the number of prediction coding units encoded in the intra mode is taken as the numerator. The ratio of the prediction coding units encoded in the intra mode is the relationship between the number of prediction coding units encoded in the intra mode and the number of prediction coding units encoded in the skip mode for an image having a brightness value lower than a preset reference brightness value. Can be calculated by taking into account. In the step S810 of selecting a scene change candidate, a candidate frame is selected according to a result of comparing the ratio of the prediction coding units encoded in the intra mode with a threshold value.

단계 S820에서, 컴퓨팅 디바이스는 압축 영역에서 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출한다. 장면 전환을 검출하는 단계(S820)는 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드의 크기에 따라 복잡도를 산출하고, 인트라 모드로 부호화된 예측 부호화 단위의 인트라 모드의 예측 방향에 따라 에지 히스토그램을 산출한다. 에지 히스토그램은 넌-에지 빈을 포함할 수 있다.In step S820, the computing device detects a scene change by using the edge histogram and the complexity extracted based on the intra mode of the prediction coding unit encoded in the intra mode in the compression region. In the step of detecting a scene change (S820), the complexity is calculated according to the size of the intra mode of the prediction coding unit encoded in the intra mode, and the edge histogram is calculated according to the prediction direction of the intra mode of the prediction coding unit encoded in the intra mode. do. The edge histogram may include non-edge bins.

도 9는 본 발명의 실시예들에 따른 장면 전환 검출 장치 및 방법이 처리하는 야간 블랙박스 촬영 영상 중 한 장면의 매크로블록 모드 분포를 나타낸 것이다.9 is a diagram illustrating a macroblock mode distribution of a scene among night black box captured images processed by a scene change detection apparatus and method according to embodiments of the present invention.

해당 프레임은 버스가 이전 프레임들에서 계속 등장하고 있던 뒤의 차를 추월하고 있는 장면으로, 장면 전환이 발생한 것에 해당한다. 영상에서 적색으로 표시된 매크로블록이 화면 내 모드로 부호화된 인트라 모드 매크로블록, 청색은 화면 간 모드로 부호화된 인터 모드 매크로블록, 그리고 흑색이 스킵 모드 매크로블록이다. 각 모드의 비율은 각각 36.85%, 26.12%, 그리고 37.03%이다. 스킵 모드를 포함하여 산출된 인트라 모드 매크로블록의 비율은 36.85%이며 임계값(예컨대, 50%)보다 작기 때문에, 후보로 선출되지 않는다. 하지만, 실시예들에 따라 1차 장면 전환 후보 검출식을 적용한다면 스킵 모드의 매크로블록만큼 제외한 전체 매크로블록 대 인트라 모드 매크로블록의 비율(36.85/(36.85+26.12)*100=58.52%)이 임계값(예컨대, 50%)보다 충분히 크게 되므로, 해당 프레임은 장면 전환 후보로 검출될 수 있다.The frame is a scene in which the bus continues to appear in the previous frames and is passing the car after, and corresponds to the scene change. In the image, a macroblock indicated in red is an intra mode macroblock encoded in an intra-mode mode, blue is an inter mode macroblock encoded in an inter-screen mode, and black is a skip mode macroblock. The percentage of each mode is 36.85%, 26.12%, and 37.03%, respectively. Since the ratio of intra mode macroblocks calculated including the skip mode is 36.85% and is smaller than the threshold (eg, 50%), it is not selected as a candidate. However, if the first scene change candidate detection equation is applied according to the embodiments, the ratio of all macroblocks excluding skip mode macroblocks to intra mode macroblocks (36.85/(36.85+26.12)*100=58.52%) is critical Since it becomes sufficiently larger than the value (eg, 50%), the frame may be detected as a scene change candidate.

본 실시예들은 프레임 별로 전체 블록 중 화면 내 부호화된 블록의 비율을 산출하고, 상기 화면 내 부호화된 블록의 비율에 기반하여 장면 전환 후보를 선출하며, 스킵 모드로 부호화되는 블록의 개수를 상기 전체 블록의 개수에서 배제하고, 압축 영역에서 화면 내 예측에 기반하여 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출함으로써, 고화질 동영상 압축 표준인 H.264 또는 HEVC 표준안의 구문에 크게 의존적이지 않고, 비교적 구문 독립적으로 간편하게 기존 표준안 내에서 유연하게 구현할 수 있고, 압축 영역에서 영상의 완전한 복호화 없이 영상의 밝기에 강인한 장면 전환 평가 기준을 통해 최종적으로 실제 장면 전환에 근접한 프레임을 검출할 수 있다.In the present embodiments, a ratio of an intra-screen coded block is calculated for each frame, a scene change candidate is selected based on the ratio of the intra-screen coded blocks, and the number of blocks coded in the skip mode is determined as the total block. By excluding from the number of and detecting scene changes using the complexity and edge histograms based on intra prediction in the compressed region, it is not very dependent on the syntax of the H.264 or HEVC standard, which is a high-definition video compression standard, and is relatively syntax independent. It can be easily and flexibly implemented within the existing standard, and finally a frame close to the actual scene change can be detected through the scene change evaluation criteria robust to the brightness of the image without complete decoding of the image in the compressed region.

도 8에서는 각각의 과정을 순차적으로 실행하는 것으로 기재하고 있으나 이는 예시적으로 설명한 것에 불과하고, 이 분야의 기술자라면 본 발명의 실시예의 본질적인 특성에서 벗어나지 않는 범위에서 도 8에 기재된 순서를 변경하여 실행하거나 또는 하나 이상의 과정을 병렬적으로 실행하거나 다른 과정을 추가하는 것으로 다양하게 수정 및 변형하여 적용 가능할 것이다.In FIG. 8, each process is described as sequentially executing, but this is only illustrative, and those skilled in the art may change the order shown in FIG. 8 within the scope not departing from the essential characteristics of the embodiment of the present invention. Or, by executing one or more processes in parallel, or adding other processes, various modifications and variations may be applied.

본 실시예들에 따른 동작은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 매체에 기록될 수 있다. 컴퓨터 판독 가능한 매체는 실행을 위해 프로세서에 명령어를 제공하는 데 참여한 임의의 매체를 나타낸다. 컴퓨터 판독 가능한 매체는 프로그램 명령, 데이터 파일, 데이터 구조 또는 이들의 조합을 포함할 수 있다. 예를 들면, 자기 매체, 광기록 매체, 메모리 등이 있을 수 있다. 컴퓨터 프로그램은 네트워크로 연결된 컴퓨터 시스템 상에 분산되어 분산 방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수도 있다. 본 실시예를 구현하기 위한 기능적인(Functional) 프로그램, 코드, 및 코드 세그먼트들은 본 실시예가 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있을 것이다.The operations according to the embodiments may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. Computer-readable medium refers to any medium that has participated in providing instructions to a processor for execution. The computer-readable medium may include program instructions, data files, data structures, or a combination thereof. For example, there may be a magnetic medium, an optical recording medium, a memory, and the like. Computer programs may be distributed over networked computer systems to store and execute computer-readable codes in a distributed manner. Functional programs, codes, and code segments for implementing the present embodiment may be easily inferred by programmers in the technical field to which the present embodiment belongs.

본 실시예들은 본 실시예의 기술 사상을 설명하기 위한 것이고, 이러한 실시예에 의하여 본 실시예의 기술 사상의 범위가 한정되는 것은 아니다. 본 실시예의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 실시예의 권리범위에 포함되는 것으로 해석되어야 할 것이다.These embodiments are for explaining the technical idea of the present embodiment, and the scope of the technical idea of the present embodiment is not limited by these embodiments. The scope of protection of this embodiment should be interpreted by the following claims, and all technical ideas within the scope equivalent thereto should be construed as being included in the scope of the present embodiment.

300: 장면 전환 검출 장치
310: 후보 선출부
320: 장면 판단부
300: scene change detection device
310: Candidate elections
320: scene determination unit

Claims (13)

컴퓨팅 디바이스에 의한 야간 영상의 장면 전환 검출 방법에 있어서,
야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 단계; 및
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 단계를 포함하며,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은,
기 설정된 기준 명도 값보다 낮은 명도 값을 갖는 영상에 대하여, 인트라 모드로 부호화된 예측 부호화 단위의 개수 및 스킵 모드로 부호화된 예측 부호화 단위의 개수 간의 관계를 고려하여 산출되는 것을 특징으로 하는 야간 영상의 장면 전환 검출 방법.
In the method for detecting a scene change of a night image by a computing device,
Calculating a ratio of prediction coding units in a compressed region encoded in intra mode from a frame of an image captured at night, and selecting a scene change candidate using the ratio of prediction coding units in the compressed region encoded in the intra mode step; And
And detecting a scene change using an edge histogram and a complexity extracted based on an intra mode of a prediction coding unit in the compression region encoded in the intra mode,
The ratio of prediction coding units in the compression region encoded in the intra mode is,
For an image having a brightness value lower than a preset reference brightness value, the image is calculated by considering a relationship between the number of prediction coding units encoded in the intra mode and the number of prediction coding units encoded in the skip mode. Scene change detection method.
제1항에 있어서,
상기 압축 영역에서의 예측 부호화 단위는 H.264의 매크로 블록 또는 HEVC의 예측 유닛을 의미하고,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은 상기 프레임에 속하는 전체 예측 부호화 단위에서 상기 스킵 모드로 부호화된 예측 부호화 단위의 개수를 제외하여 산출되는 것을 특징으로 하는 야간 영상의 장면 전환 검출 방법.
The method of claim 1,
The prediction coding unit in the compression region means a macroblock of H.264 or a prediction unit of HEVC,
A scene change of a night image, characterized in that the ratio of prediction coding units in the compression region encoded in the intra mode is calculated by excluding the number of prediction coding units encoded in the skip mode from all prediction coding units belonging to the frame Detection method.
제1항에 있어서,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은,
전체 예측 부호화 단위에서 상기 스킵 모드로 부호화된 예측 부호화 단위를 제외하고 인터 모드로 부호화된 예측 부호화 단위의 개수 및 상기 인트라 모드로 부호화된 예측 부호화 단위의 개수를 합한 수를 분모로 하고, 상기 인트라 모드로 부호화된 예측 부호화 단위의 개수를 분자로 하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 방법.
The method of claim 1,
The ratio of prediction coding units in the compression region encoded in the intra mode is,
In all prediction coding units, the sum of the number of prediction coding units encoded in the inter mode and the number of prediction coding units encoded in the intra mode excluding the prediction coding units encoded in the skip mode is used as the denominator, and the intra mode A method for detecting a scene change of a night image, characterized in that the number of predictive coding units encoded as a numerator is used.
삭제delete 제1항에 있어서,
상기 장면 전환 후보를 선출하는 단계는,
상기 인트라 모드로 부호화된 예측 부호화 단위의 비율을 임계 값과 비교한 결과에 따라 후보 프레임을 선출하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 방법.
The method of claim 1,
The step of selecting the scene change candidate,
And selecting a candidate frame based on a result of comparing a ratio of the prediction coding units encoded in the intra mode with a threshold value.
제1항에 있어서,
상기 장면 전환을 검출하는 단계는,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드의 크기에 따라 상기 복잡도를 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드의 예측 방향에 따라 상기 에지 히스토그램을 산출하고, 상기 에지 히스토그램은 넌-에지 빈을 포함하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 방법.
The method of claim 1,
The step of detecting the scene change,
The complexity is calculated according to the size of the intra mode of the prediction coding unit in the compression region encoded in the intra mode, and the edge histogram according to the prediction direction of the intra mode of the prediction coding unit in the compression region encoded in the intra mode And the edge histogram includes a non-edge bin.
야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 후보 선출부; 및
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 장면 판단부를 포함하며,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은,
기 설정된 기준 명도 값보다 낮은 명도 값을 갖는 영상에 대하여, 인트라 모드로 부호화된 예측 부호화 단위의 개수 및 스킵 모드로 부호화된 예측 부호화 단위의 개수 간의 관계를 고려하여 산출되는 것을 특징으로 하는 야간 영상의 장면 전환 검출 장치.
Calculating a ratio of prediction coding units in a compressed region encoded in intra mode from a frame of an image captured at night, and selecting a scene change candidate using the ratio of prediction coding units in the compressed region encoded in the intra mode Candidate elections; And
A scene determination unit for detecting a scene change using a complexity and an edge histogram extracted based on an intra mode of a prediction coding unit in the compression region encoded in the intra mode,
The ratio of prediction coding units in the compression region encoded in the intra mode is,
For an image having a brightness value lower than a preset reference brightness value, the image is calculated by considering a relationship between the number of prediction coding units encoded in the intra mode and the number of prediction coding units encoded in the skip mode. Scene change detection device.
제7항에 있어서,
상기 압축 영역에서의 예측 부호화 단위는 H.264의 매크로 블록 또는 HEVC의 예측 유닛을 의미하고,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은 상기 프레임에 속하는 전체 예측 부호화 단위에서 상기 스킵 모드로 부호화된 예측 부호화 단위의 개수를 제외하여 산출되는 것을 특징으로 하는 야간 영상의 장면 전환 검출 장치.
The method of claim 7,
The prediction coding unit in the compression region means a macroblock of H.264 or a prediction unit of HEVC,
A scene change of a night image, characterized in that the ratio of prediction coding units in the compression region encoded in the intra mode is calculated by excluding the number of prediction coding units encoded in the skip mode from all prediction coding units belonging to the frame Detection device.
제7항에 있어서,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은,
전체 예측 부호화 단위에서 상기 스킵 모드로 부호화된 예측 부호화 단위를 제외하고 인터 모드로 부호화된 예측 부호화 단위의 개수 및 상기 인트라 모드로 부호화된 예측 부호화 단위의 개수를 합한 수를 분모로 하고, 상기 인트라 모드로 부호화된 예측 부호화 단위의 개수를 분자로 하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 장치.
The method of claim 7,
The ratio of prediction coding units in the compression region encoded in the intra mode is,
In all prediction coding units, the sum of the number of prediction coding units encoded in the inter mode and the number of prediction coding units encoded in the intra mode excluding the prediction coding units encoded in the skip mode is used as the denominator, and the intra mode A scene change detection apparatus for a night image, characterized in that the number of predictive coding units encoded as numerators is used as a numerator.
삭제delete 제7항에 있어서,
상기 후보 선출부는,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 임계 값과 비교한 결과에 따라 후보 프레임을 선출하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 장치.
The method of claim 7,
The candidate election unit,
And selecting a candidate frame according to a result of comparing a ratio of a prediction coding unit in a compression region encoded in the intra mode with a threshold value.
제7항에 있어서,
상기 장면 판단부는,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드의 크기에 따라 상기 복잡도를 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드의 예측 방향에 따라 상기 에지 히스토그램을 산출하고, 상기 에지 히스토그램은 넌-에지 빈을 포함하는 것을 특징으로 하는 야간 영상의 장면 전환 검출 장치.
The method of claim 7,
The scene determination unit,
The complexity is calculated according to the size of the intra mode of the prediction coding unit in the compression region encoded in the intra mode, and the edge histogram according to the prediction direction of the intra mode of the prediction coding unit in the compression region encoded in the intra mode And the edge histogram includes a non-edge bin.
프로세서에 의해 실행 가능한 컴퓨터 프로그램 명령어들을 포함하는 비일시적(Non-Transitory) 컴퓨터 판독 가능한 매체에 기록되어 야간 영상의 장면 전환 검출을 위한 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램 명령어들이 컴퓨팅 디바이스의 적어도 하나의 프로세서에 의해 실행되는 경우에,
야간에 촬영된 영상의 프레임으로부터 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 산출하고, 상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율을 이용하여 장면 전환 후보를 선출하는 단계; 및
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 인트라 모드를 기반으로 추출한 복잡도 및 에지 히스토그램을 이용하여 장면 전환을 검출하는 단계를 포함한 동작들을 수행하며,
상기 인트라 모드로 부호화된 압축 영역에서의 예측 부호화 단위의 비율은,
기 설정된 기준 명도 값보다 낮은 명도 값을 갖는 영상에 대하여, 인트라 모드로 부호화된 예측 부호화 단위의 개수 및 스킵 모드로 부호화된 예측 부호화 단위의 개수 간의 관계를 고려하여 산출되는 것을 특징으로 하는 컴퓨터 프로그램.
A computer program for detecting a scene change of a night image by being recorded in a non-transitory computer-readable medium including computer program instructions executable by a processor, the computer program instructions being stored in at least one processor of a computing device. If implemented by,
Calculating a ratio of prediction coding units in a compressed region encoded in intra mode from a frame of an image captured at night, and selecting a scene change candidate using the ratio of prediction coding units in the compressed region encoded in the intra mode step; And
Performing operations including detecting a scene change using an edge histogram and a complexity extracted based on an intra mode of a prediction coding unit in a compression region encoded in the intra mode,
The ratio of prediction coding units in the compression region encoded in the intra mode is,
A computer program, characterized in that, for an image having a brightness value lower than a preset reference brightness value, it is calculated by considering a relationship between the number of prediction coding units encoded in the intra mode and the number of prediction coding units encoded in the skip mode.
KR1020180025837A 2017-04-28 2018-03-05 Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain KR102163556B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020170055276 2017-04-28
KR20170055276 2017-04-28

Publications (2)

Publication Number Publication Date
KR20180121340A KR20180121340A (en) 2018-11-07
KR102163556B1 true KR102163556B1 (en) 2020-10-07

Family

ID=64363340

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180025837A KR102163556B1 (en) 2017-04-28 2018-03-05 Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain

Country Status (1)

Country Link
KR (1) KR102163556B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007134986A (en) * 2005-11-10 2007-05-31 Kddi Corp Shot boundary detection device
KR100816013B1 (en) * 2007-01-23 2008-03-21 (주)엑스퍼넷 Apparatus and method for detecting scene change from compressed moving picture

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007134986A (en) * 2005-11-10 2007-05-31 Kddi Corp Shot boundary detection device
KR100816013B1 (en) * 2007-01-23 2008-03-21 (주)엑스퍼넷 Apparatus and method for detecting scene change from compressed moving picture

Also Published As

Publication number Publication date
KR20180121340A (en) 2018-11-07

Similar Documents

Publication Publication Date Title
EP3777169B1 (en) Device and method for decoding video data in multiple reference line prediction
EP3158751B1 (en) Encoder decisions based on results of hash-based block matching
EP3120556B1 (en) Encoder-side decisions for screen content encoding
GB2531004A (en) Residual colour transform signalled at sequence level for specific coding modes
US11770548B2 (en) Device and method for coding video data based on one or more reference lines
US10924733B2 (en) Device and method for coding video data based on mode list including different mode groups
JP7351908B2 (en) Encoder, decoder, and corresponding method of deblocking filter adaptation
KR20210018470A (en) Encoder, Decoder, and Corresponding Method Deriving Boundary Strength of Deblocking Filter
KR102558803B1 (en) Method and apparatus for prediction of residual signal
US20230090025A1 (en) Methods and systems for performing combined inter and intra prediction
KR101603887B1 (en) Method for coding data by fast coding unit decision in high efficiency video coding
KR20140127385A (en) Method for decision of coding unit splittng
KR102163556B1 (en) Method and Apparatus for Detecting Scene Change of Nighttime Image in Compression Domain
KR102170570B1 (en) Method and Apparatus for Synthesizing Video Including Key Frame in Compression Domain
CN110958452B (en) Video decoding method and video decoder
US20200036991A1 (en) Device and method for coding video data with block sub-partition and reference sample selection
KR102140271B1 (en) Fast intra coding method and apparatus using coding unit split based on threshold value
RU2822447C2 (en) Method and equipment for mutual prediction
CN118042136A (en) Encoding and decoding method and device
CN116647683A (en) Quantization processing method and device
CN117941352A (en) Inter prediction method, encoder, decoder, and storage medium
WO2023212254A1 (en) Methods and devices for high precision intra prediction

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right