KR20230040285A - Method and system for detecting an object region based on bitstream information of image information - Google Patents

Method and system for detecting an object region based on bitstream information of image information Download PDF

Info

Publication number
KR20230040285A
KR20230040285A KR1020220115556A KR20220115556A KR20230040285A KR 20230040285 A KR20230040285 A KR 20230040285A KR 1020220115556 A KR1020220115556 A KR 1020220115556A KR 20220115556 A KR20220115556 A KR 20220115556A KR 20230040285 A KR20230040285 A KR 20230040285A
Authority
KR
South Korea
Prior art keywords
value
frames
parameter values
average value
decoding parameter
Prior art date
Application number
KR1020220115556A
Other languages
Korean (ko)
Inventor
김동기
박상인
Original Assignee
주식회사 핀텔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 핀텔 filed Critical 주식회사 핀텔
Publication of KR20230040285A publication Critical patent/KR20230040285A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06T5/002
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/70Denoising; Smoothing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/11Region-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/20Analysis of motion
    • G06T7/246Analysis of motion using feature-based methods, e.g. the tracking of corners or segments
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • GPHYSICS
    • G08SIGNALLING
    • G08BSIGNALLING OR CALLING SYSTEMS; ORDER TELEGRAPHS; ALARM SYSTEMS
    • G08B21/00Alarms responsive to a single specified undesired or abnormal condition and not otherwise provided for
    • G08B21/02Alarms for ensuring the safety of persons
    • G08B21/04Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons
    • G08B21/0407Alarms for ensuring the safety of persons responsive to non-activity, e.g. of elderly persons based on behaviour analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Psychiatry (AREA)
  • Business, Economics & Management (AREA)
  • Emergency Management (AREA)
  • Gerontology & Geriatric Medicine (AREA)
  • General Health & Medical Sciences (AREA)
  • Social Psychology (AREA)
  • Psychology (AREA)
  • Human Computer Interaction (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

The present invention relates to a method and system for detecting an object region based on bitstream information of image information. The present invention relates to a method and system for detecting an object region based on bitstream information of image information that include; based on the bitstream information of the image information, based on whether the average value of a decoding parameter value in each of a plurality of frames exceeds a preset threshold value, determining whether the corresponding decoding parameter value is noise; and based on the decoding parameter value having no noise, detecting the object region.

Description

영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템 {Method and system for detecting an object region based on bitstream information of image information} Method and system for detecting an object region based on bitstream information of image information {Method and system for detecting an object region based on bitstream information of image information}

본 발명은 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템으로서, 영상정보의 비트스트림정보에 기반하여, 복수의 프레임 각각에서의 디코딩파라미터값의 평균값이 기설정된 임계값을 초과하는 지 여부에 기초하여, 해당 디코딩파라미터값이 노이즈인지 여부를 판단하고, 노이즈가 제거된 디코딩파라미터값에 기초하여, 객체영역을 검출할 수 있는, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템에 관한 것이다.The present invention is a method and system for detecting an object region based on bitstream information of image information, wherein the average value of decoding parameter values in each of a plurality of frames exceeds a predetermined threshold based on the bitstream information of image information. Based on whether the corresponding decoding parameter value is noise, it is determined whether the corresponding decoding parameter value is noise, and the object region is determined based on the bitstream information of the image information, which can detect the object region based on the decoding parameter value from which the noise is removed. It relates to a method and system for detection.

영상데이터 분석기술이란, CCTV, 블랙박스 등의 촬영장치로부터 수집되는 영상데이터에 기반하여 인물, 물체 등의 객체를 인식하여 트래킹하여 객체의 이동경로를 추적하거나, 범죄나 화재와 같은 유의미한 이벤트를 감지하는 기술이다. Video data analysis technology is based on video data collected from filming devices such as CCTVs and black boxes to recognize and track objects such as people and objects to track the movement path of objects or detect meaningful events such as crimes and fires. It is a technique to

한편, 최근 들어 촬영장치의 해상도, 프레임 등의 성능이 발전하면서 영상데이터 크기가 급격히 커짐에 따라, 영상데이터 분석에 요구되는 연산량 또한 증가하고 있다. 즉 영상데이터 크기가 커질수록 영상을 분석하는 데 소요되는 시간과 비용이 증가하여, 적은 비용으로 실시간 영상분석이 가능한 기술에 대한 개발필요성이 요구되고 있다.On the other hand, as the size of image data rapidly increases with the recent development of performance such as resolution and frame of photographing devices, the amount of calculation required for image data analysis also increases. That is, as the size of the image data increases, the time and cost required to analyze the image increase, so there is a need to develop a technology capable of real-time image analysis at a low cost.

구체적으로, 종래의 영상분석 기술에서 영상 내의 객체를 검출, 및 해당 객체에 의한 이벤트를 감지하기 위해서는, H.264 및 H.265 등의 코덱으로 압축된 영상데이터를 디코딩한 후 복원된 영상에 대해서 영상분석을 수행한다. 구체적으로 (선행문헌 1)은 “영상처리 기술을 이용한 사각지대 위험요소 검출 방법 및장치”로서 입력되는 영상에서 위험요소가 배경에 비해 부각되도록 전처리하여 위험요소(이벤트)를 검출하는 구성을 개시하고 있다.Specifically, in order to detect an object in an image and an event by the object in the conventional image analysis technology, image data compressed with codecs such as H.264 and H.265 is decoded and then the restored image is perform video analysis. Specifically, (Prior Document 1) discloses a configuration for detecting risk factors (events) by preprocessing so that risk factors are highlighted compared to the background in the input image as "a blind spot risk element detection method and apparatus using image processing technology", there is.

그러나 해당 특허에 의한 영상분석기술은 “영상” 자체에 대한 분석이 수행되는 것으로서, 영상이 디코딩되기 전의 비트스트림정보에 기반하여, 객체를 검출하고 이벤트를 감지함으로써, 적은 연산량으로 영상분석을 수행할 수 있는 구성에 대해서는 개시하는 바가 없다. However, the image analysis technology according to the patent is an analysis of the “image” itself, and based on the bitstream information before the image is decoded, it is possible to perform image analysis with a small amount of computation by detecting objects and events. There is no disclosure of possible configurations.

국내공개특허 KR 10-2010-0018734 ADomestic Patent Publication KR 10-2010-0018734 A

본 발명은 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템으로서, 영상정보의 비트스트림정보에 기반하여, 복수의 프레임 각각에서의 디코딩파라미터값의 평균값이 기설정된 임계값을 초과하는 지 여부에 기초하여, 해당 디코딩파라미터값이 노이즈인지 여부를 판단하고, 노이즈가 제거된 디코딩파라미터값에 기초하여, 객체영역을 검출할 수 있는, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템을 제공하는 것을 목적으로 한다.The present invention is a method and system for detecting an object region based on bitstream information of image information, wherein the average value of decoding parameter values in each of a plurality of frames exceeds a predetermined threshold based on the bitstream information of image information. Based on whether the corresponding decoding parameter value is noise, it is determined whether the corresponding decoding parameter value is noise, and the object region is determined based on the bitstream information of the image information, which can detect the object region based on the decoding parameter value from which the noise is removed. It is an object to provide a method and system for detecting it.

상기와 같은 과제를 해결하기 위하여, 1 이상의 프로세서 및 1 이상의 메모리를 갖는 컴퓨팅시스템에서 수행되는 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법으로서, 프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 대한 정보를 포함하는 비트스트림정보를 수신하는 비트스트림정보수신단계; 복수의 블록 각각에 대하여, 기설정된 N개(N은 2 이상의 자연수)의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 평균값인 제1평균값을 산출하고, 상기 제1평균값이 기설정된 제1임계값을 초과하는 지 여부에 기초하여, 디코딩파라미터값이 노이즈로 판단되는 경우에 상기 제1평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는 제1노이즈제거단계; 제1노이즈제거단계가 수행된 디코딩파라미터값에 기초하여, 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 2 이상에 기초하여 종합파라미터값을 도출하는 종합파라미터값도출단계; 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 종합파라미터값의 평균값인 제2평균값을 산출하고, 상기 제2평균값이 기설정된 제2임계값을 초과하는 지 여부에 기초하여, 종합파라미터값이 노이즈로 판단되는 경우에 상기 제2평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 2 이상의 디코딩파라미터값을 0으로 변환하는 제2노이즈제거단계; 및 제2노이즈제거단계가 수행된 종합파라미터값에 기초하여, 각각의 프레임에서, 해당 프레임에 포함되는 블록 중 종합파라미터값이 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출하는 객체영역검출단계;를 포함하는, 객체영역을 검출하는 방법을 제공한다.In order to solve the above problem, a method of detecting an object area based on bitstream information of image information performed in a computing system having one or more processors and one or more memories is provided. a bitstream information receiving step of receiving bitstream information including information on a plurality of decoding parameter values for each block; For each of a plurality of blocks, a first average value, which is an average value for any one of a plurality of decoding parameter values in a plurality of predetermined N frames (N is a natural number of 2 or more) is calculated, and the first average value is a predetermined If the decoding parameter value is determined to be noise based on whether it exceeds 1 threshold, the corresponding decoding parameter value for the corresponding block is converted to 0 in any one of the N plurality of frames in which the first average value is calculated. A first noise removal step to do; Comprehensive parameter values for deriving comprehensive parameter values based on at least two of a plurality of decoding parameter values in a plurality of preset N frames for each of a plurality of blocks, based on the decoding parameter values for which the first noise removal step has been performed. derivation step; For each of a plurality of blocks, a second average value, which is an average value of a plurality of comprehensive parameter values in a plurality of predetermined N frames, is calculated, and based on whether the second average value exceeds a predetermined second threshold value, a second noise removal step of converting two or more decoding parameter values of a corresponding block to 0 in any one of a plurality of N frames in which the second average value is calculated when the comprehensive parameter value is determined to be noise; and object area detection for detecting an object area by clustering blocks in which the comprehensive parameter value exceeds the object threshold among the blocks included in the frame in each frame based on the comprehensive parameter value on which the second noise removal step is performed. Provides a method for detecting an object area, including; step.

본 발명의 일 실시예에서는, 상기 블록은, 프레임 각각에서 해당 프레임에 포함되는 복수의 매크로블록 혹은 상기 매크로블록을 구성하는 서브블록을 포함할 수 있다.In one embodiment of the present invention, the block may include a plurality of macroblocks included in a corresponding frame in each frame or subblocks constituting the macroblock.

본 발명의 일 실시예에서는, 상기 디코딩파라미터값은, 프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함할 수 있다.In one embodiment of the present invention, the decoding parameter value is a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for each of a plurality of blocks included in the frame in each frame. One or more of them may be included.

본 발명의 일 실시예에서는, 상기 종합파라미터값은, 상기 블록에 대한, 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 2 이상의 디코딩파라미터값에 대한 가중평균값일 수 있다.In one embodiment of the present invention, the comprehensive parameter value is a weight for at least two decoding parameter values among a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for the block. may be an average value.

본 발명의 일 실시예에서는, 상기 종합파라미터값은, 하기의 [식 1]로 결정될 수 있다.In one embodiment of the present invention, the comprehensive parameter value may be determined by the following [Equation 1].

[식 1][Equation 1]

Figure pat00001
Figure pat00001

(여기서 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값은 해당 블록에 대한 디코딩파라미터,

Figure pat00002
,
Figure pat00003
,
Figure pat00004
,
Figure pat00005
,
Figure pat00006
는 각각의 디코딩파라미터값에 대한 가중치)(Here, the data size value, angle value, block size value, residual value, and quantization parameter value are decoding parameters for the corresponding block,
Figure pat00002
,
Figure pat00003
,
Figure pat00004
,
Figure pat00005
,
Figure pat00006
is the weight for each decoding parameter value)

본 발명의 일 실시예에서는, 상기 제1노이즈제거단계는, 상기 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 상기 제1평균값이 해당 디코딩파라미터값에 대해 기설정된 제1임계값을 초과하는 경우에, 상기 기설정된 N개의 복수의 프레임 중 가장 앞선 프레임에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환할 수 있다.In one embodiment of the present invention, in the first noise removal step, the first average value for any one of a plurality of decoding parameter values in the plurality of N frames is preset for the corresponding decoding parameter value. When the threshold value is exceeded, a corresponding decoding parameter value for a corresponding block in the first frame among the predetermined N plurality of frames may be converted to 0.

본 발명의 일 실시예에서는, 상기 기설정된 N개의 복수의 프레임은, 노이즈를 제거하고자 하는 특정 프레임을 기준으로, 해당 프레임과 전후로 인접하는 연속된 기설정된 N개의 복수의 프레임이고, 슬라이딩 윈도우 알고리즘에 기반하여, 시간에 따라 흐르는 복수의 프레임별로 단계적으로 설정될 수 있다.In one embodiment of the present invention, the predetermined N plurality of frames are successive predetermined N plurality of frames adjacent to the corresponding frame in front and back, based on a specific frame to remove noise, and a sliding window algorithm Based on this, it may be set in stages for each of a plurality of frames flowing according to time.

본 발명의 일 실시예에서는, 상기 제2노이즈제거단계는, 상기 기설정된 N개의 복수의 프레임에서 종합파라미터값에 대한 상기 제2평균값이, 종합파라미터값에 대해 기설정된 제2임계값을 초과하는 경우에, 상기 기설정된 N개의 복수의 프레임 중 어느 하나의 프레임에서 해당 블록에 대한 모든 디코딩파라미터값을 0으로 변환할 수 있다. In one embodiment of the present invention, in the second noise removal step, the second average value of comprehensive parameter values in the plurality of N frames exceeds a second threshold value preset for comprehensive parameter values. In this case, all decoding parameter values for a corresponding block in any one of the predetermined N frames may be converted to 0.

상기와 같은 과제를 해결하기 위하여, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 시스템으로서, 프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 대한 정보를 포함하는 비트스트림정보를 수신하는 비트스트림정보수신부; 복수의 블록 각각에 대하여, 기설정된 N개(N은 2 이상의 자연수)의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 평균값인 제1평균값을 산출하고, 상기 제1평균값이 기설정된 제1임계값을 초과하는 지 여부에 기초하여, 디코딩파라미터값이 노이즈로 판단되는 경우에 상기 제1평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는 제1노이즈제거부; 제1노이즈제거단계가 수행된 디코딩파라미터값에 기초하여, 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 2 이상에 기초하여 종합파라미터값을 도출하는 종합파라미터값도출부; 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 종합파라미터값의 평균값인 제2평균값을 산출하고, 상기 제2평균값이 기설정된 제2임계값을 초과하는 지 여부에 기초하여, 종합파라미터값이 노이즈로 판단되는 경우에 상기 제2평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 2 이상의 디코딩파라미터값을 0으로 변환하는 제2노이즈제거부; 및 제2노이즈제거단계가 수행된 종합파라미터값에 기초하여, 각각의 프레임에서, 해당 프레임에 포함되는 블록 중 종합파라미터값이 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출하는 객체영역검출부;를 포함하는, 객체영역을 검출하는 시스템을 제공한다.In order to solve the above problem, a system for detecting an object region based on bitstream information of image information includes information on a plurality of decoding parameter values for each of a plurality of blocks included in the corresponding frame in each frame. a bitstream information receiving unit for receiving bitstream information to be transmitted; For each of a plurality of blocks, a first average value, which is an average value for any one of a plurality of decoding parameter values in a plurality of predetermined N frames (N is a natural number of 2 or more) is calculated, and the first average value is a predetermined If the decoding parameter value is determined to be noise based on whether it exceeds 1 threshold, the corresponding decoding parameter value for the corresponding block is converted to 0 in any one of the N plurality of frames in which the first average value is calculated. a first noise removal unit; Comprehensive parameter values for deriving comprehensive parameter values based on at least two of a plurality of decoding parameter values in a plurality of preset N frames for each of a plurality of blocks, based on the decoding parameter values for which the first noise removal step has been performed. extraction unit; For each of a plurality of blocks, a second average value, which is an average value of a plurality of comprehensive parameter values in a plurality of predetermined N frames, is calculated, and based on whether the second average value exceeds a predetermined second threshold value, a second noise removal unit for converting two or more decoding parameter values of a corresponding block to 0 in any one of a plurality of N frames in which the second average value is calculated when the comprehensive parameter value is determined to be noise; and an object area detection unit configured to detect an object area by clustering blocks whose comprehensive parameter value exceeds an object threshold among blocks included in the corresponding frame in each frame based on the comprehensive parameter value on which the second noise removal step is performed. Provides a system for detecting an object area, including;

본 발명의 일 실시예에 따르면, 영상정보가 디코딩되기 전의 비트스트림정보에 포함되는, 복수의 프레임에서 복수의 블록 각각에 대한 디코딩파라미터값에 기초하여 객체영역을 검출할 수 있다. According to an embodiment of the present invention, an object region may be detected based on a decoding parameter value for each of a plurality of blocks in a plurality of frames, which is included in bitstream information before video information is decoded.

본 발명의 일 실시예에 따르면, 블록에 대한 복수의 디코딩파라미터값 각각에 대하여, 기설정된 N개의 복수의 프레임에서 해당 블록의 해당 디코딩파라미터값에 대한 제1평균값이 제1임계값을 초과하는 지 여부에 기초하여, 해당 디코딩파라미터값이 노이즈인지 여부를 판단할 수 있다. According to an embodiment of the present invention, for each of a plurality of decoding parameter values for a block, whether a first average value of corresponding decoding parameter values of a corresponding block in a plurality of predetermined N frames exceeds a first threshold value Based on whether or not, it can be determined whether the corresponding decoding parameter value is noise.

본 발명의 일 실시예에 따르면, 블록에 대한 복수의 디코딩파라미터값의 가중평균값인 종합파라미터값에 대하여, 기설정된 N개의 복수의 프레임에서 해당 블록의 종합파라미터값에 대한 제2평균값이 제2임계값을 초과하는 지 여부에 기초하여, 해당 블록에 대한 복수의 디코딩파라미터값이 노이즈인지 여부를 판단할 수 있다. According to an embodiment of the present invention, for a comprehensive parameter value that is a weighted average value of a plurality of decoding parameter values for a block, the second average value for the comprehensive parameter value of the block in a plurality of preset N frames is the second threshold Based on whether the value exceeds the value, it may be determined whether a plurality of decoding parameter values for a corresponding block are noise.

본 발명의 일 실시예에 따르면, 노이즈가 제거된 블록 각각에 대한 복수의 디코딩파라미터값에 기초하여, 해당 블록에 대한 객체의 존재여부 및 이동성 정보를 나타내는 종합파라미터값을 산출할 수 있다. According to an embodiment of the present invention, based on a plurality of decoding parameter values for each block from which noise has been removed, a comprehensive parameter value representing whether an object exists and mobility information for a corresponding block may be calculated.

본 발명의 일 실시예에 따르면, 종합파라미터값이 객체임계값을 초과하는 복수의 블록들을 클러스터링하여 객체영역을 검출할 수 있다. According to an embodiment of the present invention, an object region may be detected by clustering a plurality of blocks having a comprehensive parameter value exceeding an object threshold value.

도 1은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 시스템의 전체적인 구조를 개략적으로 도시한다.
도 2는 H.264, 및 H.265를 포함하는 1 이상의 코덱방식에 따라 영상정보가 인코딩된 비트스트림정보의 구조를 개략적으로 도시한다.
도 3은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템의 순서도를 개략적으로 도시한다.
도 4는 본 발명의 일 실시예에 따른, 비트스트림정보수신단계에서 수신하는 복수의 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값을 포함하는 비트스트림정보를 도시한다.
도 5는 본 발명의 일 실시예에 따른, 제1노이즈제거단계를 도시한다.
도 6은 본 발명의 일 실시예에 따른, 제2노이즈제거단계를 도시한다.
도 7은 본 발명의 일 실시예에 따른, 객체영역검출단계를 도시한다.
도 8은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역이 검출되는 일례를 도시한다.
도 9는 본 발명의 일 실시예에 따른, 검출된 객체영역을 도시한다.
도 10은 본 발명의 일 실시예에 따른 인코딩 되는 영상을 생성하는 인코더 시스템을 개략적으로 도시한다.
도 11은 영상 데이터의 프레임들의 예들을 개략적으로 도시한 도면이다.
도 12는 본 발명의 일 실시예에 따른 컴퓨팅장치의 내부 구성을 개략적으로 도시한다.
1 schematically illustrates the overall structure of a system for detecting an object area based on bitstream information of image information according to an embodiment of the present invention.
2 schematically shows the structure of bitstream information in which video information is encoded according to one or more codec schemes including H.264 and H.265.
3 schematically illustrates a flow chart of a method and system for detecting an object region based on bitstream information of image information according to an embodiment of the present invention.
4 illustrates bitstream information including a plurality of decoding parameter values for each of a plurality of blocks included in a plurality of frames received in the bitstream information receiving step according to an embodiment of the present invention.
5 shows a first noise removal step, according to an embodiment of the present invention.
6 shows a second noise removal step, according to an embodiment of the present invention.
7 illustrates an object area detection step according to an embodiment of the present invention.
8 illustrates an example in which an object region is detected based on bitstream information of image information according to an embodiment of the present invention.
9 illustrates a detected object area according to an embodiment of the present invention.
10 schematically illustrates an encoder system for generating an encoded video according to an embodiment of the present invention.
11 is a diagram schematically illustrating examples of frames of image data.
12 schematically illustrates the internal configuration of a computing device according to an embodiment of the present invention.

이하에서는, 다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.In the following, various embodiments and/or aspects are disclosed with reference now to the drawings. In the following description, for purposes of explanation, numerous specific details are set forth in order to facilitate a general understanding of one or more aspects. However, it will also be appreciated by those skilled in the art that such aspect(s) may be practiced without these specific details. The following description and accompanying drawings describe in detail certain illustrative aspects of one or more aspects. However, these aspects are exemplary and some of the various methods in principle of the various aspects may be used, and the described descriptions are intended to include all such aspects and their equivalents.

또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.Moreover, various aspects and features will be presented by a system that may include a number of devices, components and/or modules, and the like. It should also be noted that various systems may include additional devices, components and/or modules, and/or may not include all of the devices, components, modules, etc. discussed in connection with the figures. It must be understood and recognized.

본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '~부', '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어를 의미할 수 있다."Example", "example", "aspect", "exemplary", etc., used herein should not be construed as preferring or advantageous to any aspect or design being described over other aspects or designs. . The terms '~unit', 'component', 'module', 'system', 'interface', etc. used below generally mean a computer-related entity, and for example, hardware, hardware It may mean a combination of and software, software.

또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다.Also, the terms "comprises" and/or "comprising" mean that the feature and/or element is present, but excludes the presence or addition of one or more other features, elements and/or groups thereof. It should be understood that it does not.

또한, 제1, 제2 등과 같이 서수를 포함하는 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.In addition, terms including ordinal numbers, such as first and second, may be used to describe various components, but the components are not limited by the terms. These terms are only used for the purpose of distinguishing one component from another. For example, a first element may be termed a second element, and similarly, a second element may be termed a first element, without departing from the scope of the present invention. The terms and/or include any combination of a plurality of related recited items or any of a plurality of related recited items.

또한, 본 발명의 실시예들에서, 별도로 다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 발명의 실시예에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, in the embodiments of the present invention, unless otherwise defined, all terms used herein, including technical or scientific terms, are generally understood by those of ordinary skill in the art to which the present invention belongs. has the same meaning as Terms such as those defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related art, and unless explicitly defined in the embodiments of the present invention, an ideal or excessively formal meaning not be interpreted as

도 1은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 시스템의 전체적인 구조를 개략적으로 도시한다.1 schematically illustrates the overall structure of a system for detecting an object area based on bitstream information of image information according to an embodiment of the present invention.

도 1에 도시된 바와 같이, 본 발명의 객체영역검출시스템은 광의로 수신한 영상정보를 처리하는 객체영역검출부(2000), 영상디코딩부(1000), 및 영상분석부(3000)를 포함한다. 비트스트림정보란 규약된 코덱에 따라 영상정보가 인코딩된 데이터로서, 구체적으로는 가변크기 블록을 이용하여 영상정보가 인코딩된 데이터일 수 있다. 바람직하게는 H.264, 및 H.265를 포함하는 1 이상의 코덱방식에 따라 영상정보가 인코딩된 데이터일 수 있다.As shown in FIG. 1, the object area detection system of the present invention includes an object area detection unit 2000 that processes received image information in a broad sense, an image decoding unit 1000, and an image analysis unit 3000. Bitstream information is data in which image information is encoded according to a standardized codec, and specifically, may be data in which image information is encoded using a variable size block. Preferably, image information may be encoded data according to one or more codec schemes including H.264 and H.265.

한편, 영상정보란 객체영역검출시스템에 기저장되어 있는 데이터, 혹은 실시간으로 CCTV, 모니터링 장치 등의 영상촬영장치로부터 수신되는 데이터일 수 있다.Meanwhile, the image information may be data previously stored in the object area detection system or data received in real time from an image capturing device such as a CCTV or monitoring device.

영상디코딩부(1000)는 H.264, 및 H.265를 포함하는 1 이상의 코덱방식에 인코딩된 영상을 디코딩 혹은 복호화하기 위한 장치로서, 구체적으로는 상기 코덱방식에 대한 복호화방식에 따라 구성될 수 있다.The image decoding unit 1000 is a device for decoding or decoding an image encoded in one or more codec methods including H.264 and H.265, and may be specifically configured according to a decoding method for the codec method. there is.

영상분석부(3000)는 복호화된 영상에 대하여, 객체인식, 추적, 식별 등의 영상분석단계를 수행하고, 그 목적에 따라 전처리부, 특징정보추출부, 특징정보분석부, 등의 다양한 구성을 포함할 수 있다.The image analysis unit 3000 performs image analysis steps such as object recognition, tracking, and identification on the decoded image, and uses various components such as a pre-processing unit, a feature information extraction unit, and a feature information analysis unit according to the purpose. can include

한편, 본 발명에서는 영상분석부(3000)의 영상분석속도를 개선하기 위하여, 객체영역검출부(2000)를 도입하였다. 객체영역검출부(2000)는 영상정보가 디코딩되기 전의 비트스트림정보 자체에 기초하여 객체영역을 검출할 수 있다. 구체적으로 객체영역검출부(2000)는 비트르스트림정보에 포함되는, 영상정보의 복수의 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 기초하여, 영상 내의 객체영역을 검출할 수 있고, 이에 대한 정보를 영상분석부(3000)로 제공할 수 있다.Meanwhile, in the present invention, in order to improve the image analysis speed of the image analysis unit 3000, the object area detection unit 2000 is introduced. The object region detection unit 2000 may detect an object region based on bitstream information itself before image information is decoded. Specifically, the object region detection unit 2000 may detect an object region in an image based on a plurality of decoding parameter values for each of a plurality of blocks included in a plurality of frames of image information included in bitstream information, , information about this may be provided to the image analysis unit 3000.

결과적으로 영상분석부(3000)는 전체 영상에 대해 객체인식, 특징점추출, 전처리 등의 영상분석을 수행하는 것이 아니라, 객체영역검출부(2000)에 의해 전달받은 객체영역에 대해서만 영상분석을 수행함으로써, 영상분석에 필요한 연산부하량을 대폭 경감할 수 있다.As a result, the image analysis unit 3000 does not perform image analysis such as object recognition, feature point extraction, and pre-processing on the entire image, but only on the object area transmitted by the object area detection unit 2000. By performing image analysis, The computational load required for image analysis can be greatly reduced.

본 발명의 일 실시예에서, 객체영역검출부(2000)는 비트스트림정보수신부, 제1노이즈제거부, 종합파라미터값도출부, 제2노이즈제거부 중 1 이상의 구성요소를 포함하는 형태로 구현될 수 있다. In one embodiment of the present invention, the object region detection unit 2000 may be implemented in a form including one or more components of a bitstream information receiving unit, a first noise removal unit, a comprehensive parameter value derivation unit, and a second noise removal unit. there is.

본 발명의 일 실시예에서, 상기 객체영역검출부(2000), 영상디코딩부(1000), 및 영상분석부(3000)는 1 이상의 프로세서 및 1 이상의 메모리를 포함하는, 단일 혹은 2 이상의 컴퓨팅장치가 결합된 형태로 구성될 수 있다.In one embodiment of the present invention, the object region detection unit 2000, the image decoding unit 1000, and the image analysis unit 3000 are combined by a single or two or more computing devices including one or more processors and one or more memories. can be made in the form of

도 2는 H.264, 및 H.265를 포함하는 1 이상의 코덱방식에 따라 영상정보가 인코딩된 비트스트림정보의 구조를 개략적으로 도시한다. 2 schematically shows the structure of bitstream information in which video information is encoded according to one or more codec schemes including H.264 and H.265.

도 2의 (a)에 도시된 비트스트림정보는 복호화가 수행되기 전의 데이터로서, 이와 같은 비트스트림정보는 NAL(Network Abstraction Layer)로 이루어져 있고, 각각의 NAL은 Nal Unit 과 페이로드로서의 RBSP(Raw Byte Sequence Payload)로 이루어진다. NAL은 SPS, PPS 와 같은 파라미터 정보가 기재된 단위 혹은 VCL(Video Coding Layer) 에 해당하는 Slice 데이터가 기재된 단위에 해당할 수 있다.The bitstream information shown in (a) of FIG. 2 is data before decoding is performed, and such bitstream information is composed of NAL (Network Abstraction Layer), and each NAL is Nal Unit and RBSP (Raw Byte Sequence Payload). The NAL may correspond to a unit in which parameter information such as SPS and PPS is described, or a unit in which slice data corresponding to VCL (Video Coding Layer) is described.

VCL에 해당하는 SLICE NAL은 헤더와 데이터로 구성되어 있고, 여기서 데이터는 복수의 매크로블록 필드와 구분자 필드로 이루어진다. SLICE NAL corresponding to VCL consists of a header and data, where the data consists of a plurality of macroblock fields and a delimiter field.

한편 도 2의 (b)에 도시된 바와 같이, 매크로블록의 데이터필드는 블록의 크기 등의 정보를 포함하는 타입(Type) 필드; 인트라모드로 인코딩되었는 지 혹은 인터모드로 인코딩되었는 지에 대한 정보, 및 인터모드인 경우에 기준프레임정보 및 모션벡터정보를 포함하는 예측타입(Prediction Type) 필드; 디코딩시 입력된 이전 픽쳐 비트열을 유지하기 위한 정보를 포함하는 CPB(Coded Picture Buffer) 필드; 양자화 파라미터에 대한 정보를 포함하는 QP(Quantization Parameter) 필드; 및 해당 블록의 색상에 대한 DCT 계수에 대한 정보를 포함하는 DATA 필드를 포함한다. Meanwhile, as shown in (b) of FIG. 2, the data field of a macroblock includes a type field including information such as the size of the block; a prediction type field including information on whether the encoding is done in intra mode or inter mode, and reference frame information and motion vector information in the case of inter mode; a Coded Picture Buffer (CPB) field containing information for maintaining a bit string of a previous picture input during decoding; a Quantization Parameter (QP) field including information about a quantization parameter; and a DATA field including information on DCT coefficients for the color of the corresponding block.

또한, 매크로블록이 복수의 서브블록을 포함하는 경우, 도 2의 (b)의 2번째 열에 도시된 타입-예측타입-CPB-QP-DATA의 데이터 유닛이 복수개로 연결될 수 있다.In addition, when a macroblock includes a plurality of subblocks, a plurality of data units of type-prediction type-CPB-QP-DATA shown in the second column of FIG. 2 (b) may be connected.

이와 같이, 비트스트림정보란, 영상정보가 인코딩되어 생성되고, 복호화 되기 전의 데이터이고, 영상정보를 구성하는 복수의 프레임 각각에 포함되는 복수의 블록(매크로블록 혹은 서브블록) 각각에 대한 복수의 디코딩파라미터값을 포함할 수 있다. 구체적으로 상기 복수의 디코딩파라미터값은 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함할 수 있다.As described above, bitstream information is data generated by encoding and decoding video information, and a plurality of decodings for each of a plurality of blocks (macroblocks or subblocks) included in each of a plurality of frames constituting the video information. Can contain parameter values. Specifically, the plurality of decoding parameter values may include one or more of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value.

전술한 바와 같이 본 발명에서는 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 기초하여, 객체영역을 검출할 수 있고, 이하에서는 해당 과정을 보다 상세히 설명하도록 한다.As described above, in the present invention, an object region can be detected based on a plurality of decoding parameter values for each of a plurality of blocks included in each of a plurality of frames, and the corresponding process will be described in detail below.

도 3은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법 및 시스템의 순서도를 개략적으로 도시한다.3 schematically illustrates a flow chart of a method and system for detecting an object region based on bitstream information of image information according to an embodiment of the present invention.

도 3에 도시된 바와 같이, 1 이상의 프로세서 및 1 이상의 메모리를 갖는 컴퓨팅시스템에서 수행되는 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법으로서, 프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 대한 정보를 포함하는 비트스트림정보를 수신하는 비트스트림정보수신단계; 복수의 블록 각각에 대하여, 기설정된 N개(N은 2 이상의 자연수)의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 평균값인 제1평균값을 산출하고, 상기 제1평균값이 기설정된 제1임계값을 초과하는 지 여부에 기초하여, 디코딩파라미터값이 노이즈로 판단되는 경우에 상기 제1평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는 제1노이즈제거단계; 제1노이즈제거단계가 수행된 디코딩파라미터값에 기초하여, 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 2 이상에 기초하여 종합파라미터값을 도출하는 종합파라미터값도출단계; 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 종합파라미터값의 평균값인 제2평균값을 산출하고, 상기 제2평균값이 기설정된 제2임계값을 초과하는 지 여부에 기초하여, 종합파라미터값이 노이즈로 판단되는 경우에 상기 제2평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 2 이상의 디코딩파라미터값을 0으로 변환하는 제2노이즈제거단계; 및 제2노이즈제거단계가 수행된 종합파라미터값에 기초하여, 각각의 프레임에서, 해당 프레임에 포함되는 블록 중 종합파라미터값이 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출하는 객체영역검출단계;를 포함할 수 있다.As shown in FIG. 3, a method of detecting an object region based on bitstream information of image information performed in a computing system having one or more processors and one or more memories, comprising a plurality of blocks included in each frame. a bitstream information receiving step of receiving bitstream information including information on a plurality of decoding parameter values for each; For each of a plurality of blocks, a first average value, which is an average value for any one of a plurality of decoding parameter values in a plurality of predetermined N frames (N is a natural number of 2 or more) is calculated, and the first average value is a predetermined If the decoding parameter value is determined to be noise based on whether it exceeds 1 threshold, the corresponding decoding parameter value for the corresponding block is converted to 0 in any one of the N plurality of frames in which the first average value is calculated. A first noise removal step to do; Comprehensive parameter values for deriving comprehensive parameter values based on at least two of a plurality of decoding parameter values in a plurality of preset N frames for each of a plurality of blocks, based on the decoding parameter values for which the first noise removal step has been performed. derivation step; For each of a plurality of blocks, a second average value, which is an average value of a plurality of comprehensive parameter values in a plurality of predetermined N frames, is calculated, and based on whether the second average value exceeds a predetermined second threshold value, a second noise removal step of converting two or more decoding parameter values of a corresponding block to 0 in any one of a plurality of N frames in which the second average value is calculated when the comprehensive parameter value is determined to be noise; and object area detection for detecting an object area by clustering blocks in which the comprehensive parameter value exceeds the object threshold among the blocks included in the frame in each frame based on the comprehensive parameter value on which the second noise removal step is performed. step; may be included.

전술한 바와 같이, 도 3의 단계들은 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하기 위한 단계들에 해당하고, 객체영역검출부(2000)에 의해 수행될 수 있다.As described above, the steps of FIG. 3 correspond to steps for detecting an object region based on bitstream information of image information, and may be performed by the object region detector 2000 .

S1단계에서, 객체영역검출부(2000)는 비트스트림정보를 수신할 수 있다. 전술한 바와 같이, 비트스트림정보는 영상정보를 구성하는 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값을 포함할 수 있다.In step S1, the object region detection unit 2000 may receive bitstream information. As described above, bitstream information may include a plurality of decoding parameter values for each of a plurality of blocks included in each of a plurality of frames constituting image information.

구체적으로 상기 디코딩파라미터값은 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함할 수 있다.Specifically, the decoding parameter value may include one or more of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value.

즉, 비트스트림정보는 영상정보가 인코딩되는 과정에서 생성되는, 복수의 프레임에 포함되는 복수의 블록 각각에 대한 1 이상의 디코딩파라미터값을 포함할 수 있다. That is, the bitstream information may include one or more decoding parameter values for each of a plurality of blocks included in a plurality of frames, which are generated in the process of encoding video information.

한편, 빛의 산란, 고스트 현상 등의 요인으로 영상정보에 노이즈가 발생할 수 있고, 노이즈가 반영된 영상정보가 인코딩되어 생성되는 비트스트림정보 또한 노이즈를 포함할 수 있다. 즉, 복수의 프레임에 포함되는 복수의 블록 각각에 대한 1 이상의 디코딩파라미터값 중 어떤 값은 노이즈에 왜곡된 데이터에 해당할 수 있다.Meanwhile, noise may occur in image information due to factors such as light scattering and ghosting, and bitstream information generated by encoding image information reflecting the noise may also include noise. That is, a certain value among one or more decoding parameter values for each of a plurality of blocks included in a plurality of frames may correspond to data distorted by noise.

본 발명에서는 복수의 블록 각각에 대한 복수의 디코딩파라미터값이 노이즈에 해당하는 지 여부를 판단하고, 노이즈가 정제된 데이터에 기초하여 객체영역을 검출할 수 있다. In the present invention, it is possible to determine whether a plurality of decoding parameter values for each of a plurality of blocks correspond to noise, and to detect an object region based on data from which the noise has been refined.

구체적으로는 기설정된 N개의 프레임에서 디코딩파라미터값의 평균값에 기초하여, 해당 디코딩파라미터값이 노이즈에 의한 것인지 여부를 판단할 수 있다. Specifically, based on the average value of decoding parameter values in the preset N frames, it may be determined whether the corresponding decoding parameter value is caused by noise.

한편, 상기 블록은 예시적으로 (16x16) 형태의 매크로블록, 혹은 (8x8, 4x4 등) 형태의 서브블록일 수 있다.Meanwhile, the block may be a (16x16) macroblock or a (8x8, 4x4, etc.) subblock.

S2단계, S3.1단계, 및 S3.2단계는 제1노이즈제거단계로서, 객체영역검출부(2000)의 제1노이즈제거부에 의해 수행될 수 있다. 또한, 제1노이즈제거단계는 복수의 블록 각각에 대한 복수의 디코딩파라미터값 중 1 이상, 바람직하게는 복수의 블록 각각에 대한 모든 디코딩파라미터값 각각에 대해 수행될 수 있다. Steps S2, S3.1, and S3.2 are first noise removal steps, which may be performed by the first noise removal unit of the object area detection unit 2000. Also, the first noise removal step may be performed for at least one of a plurality of decoding parameter values for each of a plurality of blocks, preferably for all decoding parameter values for each of a plurality of blocks.

S2단계에서, 객체영역검출부(2000)는 특정 블록의 복수의 디코딩파라미터값 중 어느 하나에 대하여, 기설정된 N개의 복수의 프레임에서 해당 디코딩파라미터값에 대한 제1평균값을 산출할 수 있다.In step S2, the object region detection unit 2000 may calculate a first average value for corresponding decoding parameter values in a plurality of preset N frames for any one of a plurality of decoding parameter values of a specific block.

바람직하게는 복수의 블록 각각의 복수의 디코딩파라미터값 각각에 대하여, 기설정된 N개의 복수의 프레임에서, 해당 블록에 대한 복수의 디코딩파라미터값 각각에 대한 제1평균값을 산출할 수 있다.Preferably, for each of a plurality of decoding parameter values of each of a plurality of blocks, a first average value for each of a plurality of decoding parameter values for a corresponding block may be calculated in a plurality of preset N frames.

더 바람직하게는, 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 각각에 대하여, 기설정된 N개의 복수의 프레임에서 각각에 대한 제1평균값을 산출할 수 있다. More preferably, for each of the motion vector value, data size value, angle value, block size value, residual value, and quantization parameter value, a first average value for each of a plurality of preset N frames may be calculated. .

한편, 상기 기설정된 N개의 복수의 프레임은, 노이즈를 제거하고자 하는 프레임과 인접하는 복수의 프레임일 수 있다. 구체적으로 첫번째 프레임에 대한 제1평균값은 첫번째 프레임을 포함하고, 첫번째 프레임 이후로 연속되는 기설정된 N개의 프레임, 예시적으로 1 내지 7프레임에서의 디코딩파라미터값의 평균값일 수 있다. Meanwhile, the plurality of predetermined N frames may be a plurality of frames adjacent to a frame from which noise is to be removed. Specifically, the first average value for the first frame may be an average value of decoding parameter values in predetermined N frames including the first frame and succeeding after the first frame, eg, 1 to 7 frames.

또는, 본 발명의 다른 실시예에서, 5번째 프레임에 대한 제1평균값은, 5번째 프레임을 포함하고, 5번째 프레임 전후로 연속되는 기설정된 N개의 프레임, 예시적으로 2 내지 8프레임에서의 디코딩파라미터값의 평균값일 수 있다. Alternatively, in another embodiment of the present invention, the first average value for the 5th frame is a decoding parameter in predetermined N frames, exemplarily frames 2 to 8, including the 5th frame and continuing before and after the 5th frame. It may be an average value of the values.

한편, 본 발명의 다른 실시예에서는 예시의 7개 프레임보다 더 많거나 적은 프레임에 대해 상기 과정이 수행될 수 있다. 이와 같이 상기 기설정된 N개의 복수의 프레임에서의 프레임 개수 N은 2 이상의 자연수로서, 다수의 프레임에서의 디코딩파라미터값의 평균값이 도출될 수 있다.Meanwhile, in another embodiment of the present invention, the above process may be performed for more or less frames than the 7 frames of the example. In this way, the number N of frames in the plurality of N predetermined frames is a natural number equal to or greater than 2, and an average value of decoding parameter values in the plurality of frames may be derived.

객체영역검출부(2000)는 도출된 제1평균값이, 해당 디코딩파라미터값에 대해 기설정된 제1임계값을 초과하는 지 여부에 따라 해당 디코딩파라미터값이 노이즈인지 여부를 판단할 수 있다.The object region detector 2000 may determine whether the corresponding decoding parameter value is noise according to whether or not the derived first average value exceeds a first predetermined threshold value for the corresponding decoding parameter value.

구체적으로 특정 블록의 특정 디코딩파라미터값에 대한 제1평균값이, 제1임계값을 초과하는 경우에 S3.1단계가 수행되고, 데이터값이 유지될 수 있다. 즉, 객체영역검출부(2000)는 특정 디코딩파라미터값에 대한 제1평균값이 해당 디코딩파라미터값에 대한 제1임계값을 초과하는 경우에 해당 데이터를 노이즈가 아닌 유의미한 데이터로 판단하여 데이터값을 유지할 수 있다.Specifically, when the first average value of the specific decoding parameter value of the specific block exceeds the first threshold value, step S3.1 is performed, and the data value may be maintained. That is, the object region detection unit 2000 may maintain the data value by determining the corresponding data as meaningful data rather than noise when the first average value for a specific decoding parameter value exceeds the first threshold value for the corresponding decoding parameter value. there is.

반대로, 특정 블록의 특정 디코딩파라미터값에 대한 제1평균값이, 해당 디코딩파라미터값에 대한 제1임계값 이하인 경우에 S3.2단계가 수행되고, 디코딩파라미터값이 0으로 변환될 수 있다. 구체적으로 제1평균값은 기설정된 N개의 복수의 프레임에서 특정 디코딩파라미터값의 평균값이고, 상기 기설정된 N개의 복수의 프레임, 즉 제1평균값을 산출한 복수의 프레임 중 어느 하나에서 해당 디코딩파라미터값을 0으로 변환할 수 있다.Conversely, when the first average value of a specific decoding parameter value of a specific block is less than or equal to the first threshold value for the corresponding decoding parameter value, step S3.2 is performed, and the decoding parameter value can be converted to 0. Specifically, the first average value is an average value of a specific decoding parameter value in a plurality of N predetermined frames, and the corresponding decoding parameter value in any one of the plurality of predetermined N frames, that is, a plurality of frames in which the first average value is calculated. can be converted to 0.

즉, 객체영역검출부(2000)는 특정 디코딩파라미터값에 대한 제1평균값이 제1임계값 이하인 경우에, 해당 데이터를 노이즈로 판단하여 제1평균값을 산출한 복수의 프레임 중 어느 하나에서 디코딩파라미터값을 0으로 변환할 수 있다.That is, when the first average value for a specific decoding parameter value is less than or equal to the first threshold value, the object region detection unit 2000 determines the corresponding data as noise and determines the decoding parameter value in any one of a plurality of frames in which the first average value is calculated. can be converted to 0.

바람직하게는, 객체영역검출부(2000)는 특정 디코딩파라미터값에 대한 제1평균값이 제1임계값 이하인 경우에, 제1평균값을 산출한 N개의 복수의 프레임 중 가장 앞선 프레임에서 해당 블록의 해당 디코딩파라미터값을 0으로 변환할 수 있다.Preferably, the object region detection unit 2000, when the first average value for a specific decoding parameter value is equal to or less than the first threshold value, performs decoding of the corresponding block in the earliest frame among the N plurality of frames in which the first average value is calculated. The parameter value can be converted to 0.

이와 같이 제1노이즈제거단계는 복수의 블록 각각에 포함되는 복수의 디코딩파라미터값 각각에 대하여, 기설정된 N개의 복수의 프레임에서의 복수의 디코딩파라미터값 각각에 대한 제1평균값에 기초하여, 제1평균값이 제1임계값을 초과하는 지 여부에 따라 해당 디코딩파라미터값이 노이즈에 의한 것인지 여부를 판단할 수 있다.In this way, the first noise removal step is based on a first average value for each of a plurality of decoding parameter values in a plurality of predetermined N frames for each of a plurality of decoding parameter values included in each of a plurality of blocks, Depending on whether the average value exceeds the first threshold value, it may be determined whether the corresponding decoding parameter value is caused by noise.

S4단계에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대하여, 해당 블록에 포함되는 2 이상의 디코딩파라미터값에 기초하여, 종합파라미터값을 도출할 수 있다.In step S4, for each of a plurality of blocks included in each of a plurality of frames, a comprehensive parameter value may be derived based on two or more decoding parameter values included in the corresponding block.

구체적으로 종합파라미터값은 해당 블록에 포함되는 2 이상의 디코딩파라미터값에 대한 평균값일 수 있다. Specifically, the comprehensive parameter value may be an average value of two or more decoding parameter values included in the corresponding block.

바람직하게는, 종합파라미터값은 해당 블록에 포함되는 모든 디코딩파라미터값에 대한 가중평균값일 수 있다.Preferably, the comprehensive parameter value may be a weighted average value of all decoding parameter values included in the corresponding block.

전술한 바와 같이, 디코딩파라미터값은 해당 블록에 대한 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값일 수 있고, 종합파라미터값이란 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 2 이상에 대한 평균값, 바람직하게는 모든 디코딩파라미터값에 대한 가중평균값일 수 있다.As described above, the decoding parameter value may be a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for a corresponding block, and a comprehensive parameter value is a motion vector value, a data size value, It may be an average value of two or more of an angle value, a block size value, a residual value, and a quantization parameter value, preferably a weighted average value of all decoding parameter values.

또한, 종합파라미터값은 제1노이즈제거단계가 수행되어 노이즈가 정제된 디코딩파라미터값에 기초하여 산출될 수 있다. In addition, the comprehensive parameter value may be calculated based on the decoded parameter value whose noise is refined by performing the first noise removal step.

S5단계에서, 객체영역검출부(2000)는 특정 블록의 종합파라미터값에 대하여, 기설정된 N개의 복수의 프레임에서 종합파라미터값에 대한 제2평균값을 산출할 수 있다.In step S5, the object region detection unit 2000 may calculate a second average value of comprehensive parameter values in a plurality of predetermined N frames with respect to comprehensive parameter values of a specific block.

바람직하게는 특정 블록에 대한 종합파라미터값에 대하여, 기설정된 N개의 복수의 프레임에서 해당 블록에 대한 종합파라미터값의 제2평균값을 산출할 수 있다. Preferably, with respect to comprehensive parameter values for a specific block, a second average value of comprehensive parameter values for a corresponding block may be calculated in a plurality of predetermined N frames.

한편, 상기 기설정된 N개의 복수의 프레임은, 노이즈를 제거하고자 하는 프레임과 인접하는 복수의 프레임일 수 있다. 구체적으로 첫번째 프레임에 대한 제2평균값은 첫번째 프레임을 포함하고, 첫번째 프레임 이후로 연속되는 기설정된 N개의 프레임, 예시적으로 1 내지 7프레임에서의 종합파라미터값의 평균값일 수 있다. Meanwhile, the plurality of predetermined N frames may be a plurality of frames adjacent to a frame from which noise is to be removed. Specifically, the second average value for the first frame may be an average value of comprehensive parameter values in predetermined N frames including the first frame and succeeding after the first frame, eg, 1 to 7 frames.

또는, 본 발명의 다른 실시예에서, 5번째 프레임에 대한 제2평균값은, 5번째 프레임을 포함하고, 5번째 프레임 전후로 연속되는 기설정된 N개의 프레임, 예시적으로 2 내지 8프레임에서의 종합파라미터값의 평균값일 수 있다.Alternatively, in another embodiment of the present invention, the second average value for the 5th frame is a comprehensive parameter in predetermined N frames, exemplarily 2 to 8 frames, including the 5th frame and continuing before and after the 5th frame. It may be an average value of the values.

한편, 본 발명의 다른 실시예에서는 예시의 7개 프레임보다 더 많거나 적은 프레임에 대해 상기 과정이 수행될 수 있다. 이와 같이 상기 기설정된 N개의 복수의 프레임에서의 프레임 개수 N은 2 이상의 자연수로서, 다수의 프레임에서의 종합파라미터값의 평균값이 도출될 수 있다.Meanwhile, in another embodiment of the present invention, the above process may be performed for more or less frames than the 7 frames of the example. In this way, the number N of frames in the plurality of N predetermined frames is a natural number greater than or equal to 2, and an average value of comprehensive parameter values in the plurality of frames may be derived.

객체영역검출부(2000)는 도출된 제2평균값이, 종합파라미터값에 대해 기설정된 제2임계값을 초과하는 지 여부에 따라 해당 종합파라미터값이 노이즈인지 여부를 판단할 수 있다.The object region detection unit 2000 may determine whether the corresponding comprehensive parameter value is noise according to whether or not the derived second average value exceeds a preset second threshold value for the comprehensive parameter value.

구체적으로 특정 블록의 종합파라미터값에 대한 제2평균값이, 제2임계값을 초과하는 경우에 S6.1단계가 수행되고, 데이터값이 유지될 수 있다. 즉, 객체영역검출부(2000)는 종합파라미터값에 대한 제2평균값이 제2임계값을 초과하는 경우에 해당 데이터를 노이즈가 아닌 유의미한 데이터로 판단하여 데이터값을 유지할 수 있다.Specifically, when the second average value of the comprehensive parameter values of the specific block exceeds the second threshold value, step S6.1 is performed, and the data value may be maintained. That is, when the second average value of the comprehensive parameter values exceeds the second threshold value, the object region detection unit 2000 may determine the corresponding data as meaningful data rather than noise and maintain the data value.

여기서 종합파라미터값의 데이터를 유지한다라는 것은, 종합파라미터값을 도출한 2 이상의 디코딩파라미터값의 데이터값을 유지하는 것을 의미한다. 즉, 본 발명의 일 실시예에서 종합파라미터값이 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값에 대한 가중평균값일 때, 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 각각에 대한 데이터값이 유지될 수 있다.Here, retaining the data of the comprehensive parameter value means maintaining data values of two or more decoding parameter values from which the comprehensive parameter value is derived. That is, in one embodiment of the present invention, when the comprehensive parameter value is a weighted average value for the motion vector value, data size value, angle value, block size value, residual value, and quantization parameter value, the motion vector value, data size value, Data values for each of an angle value, a block size value, a residual value, and a quantization parameter value may be maintained.

반대로, 특정 블록의 종합파라미터값에 대한 제2평균값이, 제2임계값을 이하인 경우에 S6.2단계가 수행되고, 해당 블록에 대한 복수의 디코딩파라미터값 중 2 이상이 0으로 변환될 수 있다. 구체적으로 제2평균값은 기설정된 N개의 복수의 프레임에서 특정 블록에 대한 종합파라미터값의 평균값이고, 상기 기설정된 N개의 복수의 프레임, 즉 제2평균값을 산출한 복수의 프레임 중 어느 하나에서 해당 블록에 대한 복수의 디코딩파라미터값 중 2 이상을 0으로 변환할 수 있다.Conversely, when the second average value of the comprehensive parameter values of a specific block is less than or equal to the second threshold value, step S6.2 is performed, and two or more of the plurality of decoding parameter values for the corresponding block can be converted to 0. . Specifically, the second average value is an average value of comprehensive parameter values for a specific block in a plurality of preset N frames, and the block in any one of the plurality of preset N frames, that is, a plurality of frames in which the second average value is calculated. Two or more of the plurality of decoding parameter values for may be converted to 0.

즉, 객체영역검출부(2000)는 종합파라미터값에 대한 제2평균값이 제2임계값 이하인 경우에, 해당 데이터를 노이즈로 판단하여 제2평균값을 산출한 복수의 프레임 중 어느 하나에서 해당 블록에 대한 복수의 디코딩파라미터값 중 2 이상을 0으로 변환할 수 있다.That is, the object region detection unit 2000 determines that the corresponding data is noise when the second average value of the comprehensive parameter values is less than or equal to the second threshold value, and in any one of a plurality of frames in which the second average value is calculated, the corresponding block Two or more of a plurality of decoding parameter values may be converted to 0.

바람직하게는, 객체영역검출부(2000)는 종합파라미터값에 대한 제2평균값이 제2임계값 이하인 경우에, 제2평균값을 산출한 복수의 프레임 중 가장 앞선 프레임에서 해당 블록에 대한 복수의 디코딩파라미터값 중 2 이상을 0으로 변환할 수 있다.Preferably, the object region detection unit 2000, when the second average value of the comprehensive parameter values is equal to or less than the second threshold value, determines the plurality of decoding parameters for the corresponding block in the first frame among the plurality of frames in which the second average value is calculated. 2 or more of the values can be converted to 0.

더욱 바람직하게는, 객체영역검출부(2000)는 종합파라미터값에 대한 제2평균값이 제2임계값 이하인 경우에, 제2평균값을 산출한 복수의 프레임 중 가장 앞선 프레임에서 해당 블록에 대한 모든 디코딩파라미터값을 0으로 변환할 수 있다.More preferably, the object region detection unit 2000, when the second average value of the comprehensive parameter values is equal to or less than the second threshold value, detects all decoding parameters for the corresponding block in the first frame among the plurality of frames in which the second average value is calculated. The value can be converted to 0.

이와 같이 제2노이즈제거단계는 복수의 블록 각각에서 도출되는 종합파라미터값에 대하여, 기설정된 N개의 복수의 프레임에서의 종합파라미터값에 대한 제2평균값을 산출하고, 제2평균값이 제2임계값을 초과하는 지 여부에 따라 해당 종합파라미터값이 노이즈에 의한 것인지 여부를 판단할 수 있다. In this way, the second noise removal step calculates a second average value for comprehensive parameter values in a plurality of predetermined N frames with respect to comprehensive parameter values derived from each of a plurality of blocks, and the second average value is a second threshold value. Depending on whether it exceeds , it can be determined whether the corresponding comprehensive parameter value is due to noise.

S7단계에서, 객체영역검출부(2000)는 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 종합파라미터값이 기설정된 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출할 수 있다.In step S7 , the object region detection unit 2000 may detect the object region by clustering blocks in which a comprehensive parameter value for each of a plurality of blocks included in each of a plurality of frames exceeds a preset object threshold value.

구체적으로 전술한 제1노이즈제거단계, 및 제2노이즈제거단계가 수행됨으로써 노이즈로 판단되는 디코딩파라미터값은 0으로 변환될 수 있고, 노이즈가 제거된 디코디파라미터값에 기초하여 산출되는 종합파라미터값은 해당 블록에 대한 객체의 존재여부와 이동성 정보를 내포할 수 있다.Specifically, as the above-described first noise removal step and second noise removal step are performed, the decoding parameter value determined to be noise can be converted to 0, and the comprehensive parameter value calculated based on the decode parameter value from which the noise is removed. may contain object existence and mobility information for a corresponding block.

객체영역검출부(2000)는 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대하여, 종합파라미터값이 객체임계값을 초과하는 지 여부에 기초하여, 해당 블록이 객체영역에 해당하는 지 여부를 판별할 수 있다.For each of a plurality of blocks included in each of a plurality of frames, the object region detection unit 2000 determines whether the corresponding block corresponds to the object region based on whether the comprehensive parameter value exceeds the object threshold value. can

즉, 객체영역검출부(2000)는 객체임계값을 초과하는 종합파리미터값을 가지는 복수의 블록 중 기설정된 거리 이내에 인접하는 1 이상의 블록들을 클러스터링하여, 하나의 객체영역으로 판단할 수 있다.That is, the object region detection unit 2000 may cluster one or more adjacent blocks within a predetermined distance among a plurality of blocks having comprehensive parameter values exceeding the object threshold value, and determine them as one object region.

한편, 전술한 제1임계값, 제2임계값, 및 객체임계값에 대한 기준치는 해당 영상으로부터 도출된 통계적 수치 혹은 시스템에서 지금까지 영상처리를 통하여 도출된 통계적 수치 혹은 입력된 수치에 의하여 구현될 수 있다.On the other hand, the reference values for the first threshold value, the second threshold value, and the object threshold value described above may be implemented by statistical values derived from the corresponding image or statistical values derived through image processing so far in the system or input values. can

도 4는 본 발명의 일 실시예에 따른, 비트스트림정보수신단계에서 수신하는 복수의 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값을 포함하는 비트스트림정보를 도시한다.4 illustrates bitstream information including a plurality of decoding parameter values for each of a plurality of blocks included in a plurality of frames received in the bitstream information receiving step according to an embodiment of the present invention.

본 발명의 일 실시예에서, 상기 블록은, 프레임 각각에서 해당 프레임에 포함되는 복수의 매크로블록 혹은 상기 매크로블록을 구성하는 서브블록을 포함할 수 있다.In one embodiment of the present invention, the block may include a plurality of macroblocks included in a corresponding frame in each frame or subblocks constituting the macroblock.

또한 상기 디코딩파라미터값은, 프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함할 수 있다.In addition, the decoding parameter value may include one or more of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for each of a plurality of blocks included in the corresponding frame in each frame. there is.

도 4의 (a)에 도시된 바와 같이, 비트스트림정보는 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값을 포함할 수 있다.As shown in (a) of FIG. 4, bitstream information may include a plurality of decoding parameter values for each of a plurality of blocks included in each of a plurality of frames.

예시적으로 도 4의 (a)는 복수의 프레임(1 내지 7프레임) 중 특정 프레임(4프레임)에 포함되는 복수의 블록(B1 내지 B3) 중 특정 블록(B3)에 대한 복수의 디코딩파라미터값(모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값)을 도시하고 있다.4(a) shows a plurality of decoding parameter values for a specific block B3 among a plurality of blocks B1 to B3 included in a specific frame (4 frames) among a plurality of frames (1 to 7 frames). (Motion vector value, data size value, angle value, block size value, residual value, quantization parameter value) are shown.

결과적으로는 도 4의 (b)에 도시된 바와 같이, 비트스트림정보는 복수의 프레임(1 내지 7프레임) 각각에 포함되는 복수의 블록(B1 내지 B3) 각각에 대한 복수의 디코딩파라미터값(D1 내지 D7)을 포함할 수 있다.As a result, as shown in (b) of FIG. 4, the bitstream information is a plurality of decoding parameter values (D1) for each of a plurality of blocks (B1 to B3) included in each of a plurality of frames (frames 1 to 7). to D7).

한편, 도 4에서는 예시적으로 1 내지 7프레임에서의 디코딩파라미터값을 도시하고 있으나, 바람직한 실시예에서는 영상을 구성하는 다수의 프레임 각각에 디코딩파라미터값을 포함할 수 있고, 후술하는 도 5 및 6에서의 단계들은 (예시의 1 내지 7프레임에 한정되지 않고)영상을 구성하는 다수의 프레임 각각에 대한 디코딩파라미터값에 기초하여 수행될 수 있다.Meanwhile, although FIG. 4 exemplarily shows decoding parameter values in frames 1 to 7, in a preferred embodiment, decoding parameter values may be included in each of a plurality of frames constituting an image, and FIGS. 5 and 6 described later. Steps in may be performed based on decoding parameter values for each of a plurality of frames constituting an image (not limited to frames 1 to 7 in the example).

일례로, 도 5 및 6에서의 기설정된 N개의 복수의 프레임은 10개, 20개, 혹은 이보다 많거나 적은 개수의 프레임에 해당할 수 있다. For example, the predetermined number of N frames in FIGS. 5 and 6 may correspond to 10, 20, or more or less frames.

본 발명의 일 실시예에 따르면, 이와 같이 인코딩된 영상정보가 디코딩(복호화)되기 전의 데이터인 비트스트림정보에 기반하여 객체영역을 검출할 수 있다. 구체적으로는 노이즈가 제거되어 정제된 데이터에 기반하여 객체영역을 검출할 수 있다.According to an embodiment of the present invention, the object region can be detected based on bitstream information, which is data before decoding (decoding) the encoded video information. Specifically, the object region may be detected based on data refined by removing noise.

도 5는 본 발명의 일 실시예에 따른, 제1노이즈제거단계를 도시한다. 5 shows a first noise removal step, according to an embodiment of the present invention.

도 5에 도시된 바와 같이, 상기 제1노이즈제거단계는, 상기 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 상기 제1평균값이 해당 디코딩파라미터값에 대해 기설정된 제1임계값을 초과하는 경우에, 상기 기설정된 N개의 복수의 프레임 중 가장 앞선 프레임에서 해당 블록에 대한 디코딩파라미터값을 0으로 변환할 수 있다.As shown in FIG. 5, in the first noise removal step, the first average value for any one of a plurality of decoding parameter values in the plurality of N frames is preset for the corresponding decoding parameter value. When the threshold value is exceeded, the decoding parameter value of the corresponding block in the first frame among the plurality of N frames may be converted to 0.

또한, 상기 기설정된 N개의 복수의 프레임은, 노이즈를 제거하고자 하는 특정 프레임을 기준으로, 해당 프레임과 전후로 인접하는 연속된 기설정된 N개의 복수의 프레임이고, 슬라이딩 윈도우 알고리즘에 기반하여, 시간에 따라 흐르는 복수의 프레임별로 단계적으로 설정될 수 있다.In addition, the predetermined N plurality of frames are consecutive predetermined N plurality of frames adjacent to the corresponding frame in front and back, based on a specific frame to remove noise, and based on a sliding window algorithm, according to time It may be set in stages for each of a plurality of flowing frames.

또한, 상기 종합파라미터값은, 상기 블록에 대한, 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 2 이상의 디코딩파라미터값에 대한 가중평균값일 수 있다. Also, the comprehensive parameter value may be a weighted average value of two or more decoding parameter values among a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for the block.

또한, 상기 종합파라미터값은, 하기의 [식 1]로 결정될 수 있다.In addition, the comprehensive parameter value may be determined by the following [Equation 1].

[식 1][Equation 1]

Figure pat00007
Figure pat00007

(여기서 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값은 해당 블록에 대한 디코딩파라미터,

Figure pat00008
,
Figure pat00009
,
Figure pat00010
,
Figure pat00011
,
Figure pat00012
는 각각의 디코딩파라미터값에 대한 가중치)(Here, the data size value, angle value, block size value, residual value, and quantization parameter value are decoding parameters for the corresponding block,
Figure pat00008
,
Figure pat00009
,
Figure pat00010
,
Figure pat00011
,
Figure pat00012
is the weight for each decoding parameter value)

도 5의 (a)는 특정 블록에 대하여, 복수의 프레임에서의 특정 디코딩파라미터값(a1 내지 a7)을 도시하고 있다. 본 발명에서는 복수의 프레임 각각에서의 해당 디코딩파라미터값이 노이즈에 의한 것인 지 여부를 판단한다.5(a) shows specific decoding parameter values (a 1 to a 7 ) in a plurality of frames for a specific block. In the present invention, it is determined whether a corresponding decoding parameter value in each of a plurality of frames is due to noise.

구체적으로 디코딩파라미터값 a1에 대한 노이즈를 판단하는 경우를 보면, 우선 기설정된 개수(예시의 경우 5개)의 복수의 프레임(1프레임 내지 5프레임)에서 해당 디코딩파라미터값(a1 내지 a5)에 대한 평균값인 제1평균값(aavg.1)을 산출한다.Specifically, in the case of determining the noise for the decoding parameter value a 1 , first, the corresponding decoding parameter values (a 1 to a 5 ) Calculate the first average value (a avg.1 ), which is the average value for

바람직하게는, 디코딩파라미터값 a1에 대한 1프레임과 전후로 인접하고 연속되는 복수의 프레임(1프레임 내지 5프레임)에서 해당 디코딩파라미터값(a1 내지 a5)에 대한 평균값인 제1평균값(aavg.1)을 산출한다.Preferably, a first average value ( a ), which is an average value for the corresponding decoding parameter values (a 1 to a 5 ) in one frame for the decoding parameter value a 1 and a plurality of adjacent and successive frames ( 1 frame to 5 frames) in front and back avg.1 ).

이어서, 산출된 제1평균값(aavg.1)이 해당 디코딩파라미터값(a)에 대해 기설정된 제1임계값(a제1임계값)을 초과하는 지 여부를 판단한다.Subsequently, it is determined whether the calculated first average value (a avg.1 ) exceeds a predetermined first threshold value (a first threshold value a) for the corresponding decoding parameter value (a).

도시된 바와 같이, 제1평균값(aavg.1)이 제1임계값(a제1임계값)을 초과하는 경우 해당 디코딩파라미터값은 유효한 데이터로 판단되고, 데이터값이 유지된다. As shown, when the first average value (a avg.1 ) exceeds the first threshold value (a first threshold value ), the corresponding decoding parameter value is determined as valid data and the data value is maintained.

반면 노이즈로 판단되어 제거되는 디코딩파라미터값 a3에 대한 노이즈를 판단하는 경우를 보면, 우선 기설정된 개수(예시의 경우 5개)의 복수의 프레임(3프레임 내지 7프레임)에서 해당 디코딩파라미터값(a3 내지 a7)에 대한 평균값인 제1평균값(aavg.3)을 산출한다.On the other hand, in the case of determining the noise for the decoding parameter value a 3 that is determined to be noise and removed, the corresponding decoding parameter value ( A first average value (a avg.3 ), which is an average value for a 3 to a 7 ), is calculated.

바람직하게는, 디코딩파라미터값 a3에 대한 3프레임과 전후로 인접하고 연속되는 복수의 프레임(3프레임 내지 7프레임)에서 해당 디코딩파라미터값(a3 내지 a7)에 대한 평균값인 제1평균값(aavg.3)을 산출한다.Preferably, the first average value (a), which is an average value for the corresponding decoding parameter values (a 3 to a 7 ) in 3 frames for the decoding parameter value a 3 and a plurality of adjacent and successive frames ( 3 frames to 7 frames) avg.3 ).

이어서, 산출된 제1평균값(aavg.3)이 해당 디코딩파라미터값(a)에 대해 기설정된 제1임계값(a제1임계값)을 초과하는 지 여부를 판단한다.Next, it is determined whether the calculated first average value (a avg.3 ) exceeds a predetermined first threshold value (a first threshold value a) for the corresponding decoding parameter value (a).

도시된 바와 같이, 제1평균값(aavg.3)이 제1임계값(a제1임계값) 이하인 경우 해당 디코딩파라미터값(a3)은 노이즈로 판단되어 0으로 변환될 수 있다. 구체적으로 제1평균값(aavg.3)이 제1임계값(a제1임계값) 이하인 경우, 제1평균값(aavg.3)이 산출된 기설정된 N개의 복수의 프레임(3프레임 내지 7프레임) 중 어느 하나(3프레임)에서 해당 블록에 대한 디코딩파라미터값(a3)이 0으로 변환될 수 있다.As shown, when the first average value (a avg.3 ) is less than or equal to the first threshold value (a first threshold value ), the corresponding decoding parameter value (a 3 ) may be determined as noise and converted to 0. Specifically, when the first average value (a avg.3 ) is less than or equal to the first threshold value (a first threshold value ), a plurality of predetermined N frames (3 frames to 7 frames) in which the first average value (a avg.3 ) is calculated. In any one (three frames) of frames), the decoding parameter value (a 3 ) for the corresponding block may be converted to 0.

바람직하게는, 제1평균값(aavg.3)이 산출된 기설정된 N개의 복수의 프레임(3프레임 내지 7프레임) 중 가장 앞선 프레임(3프레임)에서 해당 블록에 대한 디코딩파라미터값(a3)이 0으로 변환될 수 있다.Preferably, the decoding parameter value (a 3 ) of the corresponding block in the first frame (3 frames) among the preset N plurality of frames (3 frames to 7 frames) in which the first average value (a avg.3 ) is calculated. can be converted to 0.

한편 도 5의 (a)에서 디코딩파라미터값 a1 및 a3에 대한 노이즈를 판단할 때, 제1평균값을 산출하는 프레임구간(기설정된 N개의 복수의 프레임)이 상이하게 설정되었음을 알 수 있다.Meanwhile, when determining the noise for the decoding parameter values a 1 and a 3 in FIG. 5 (a), it can be seen that the frame interval (a plurality of preset N frames) for calculating the first average value is set differently.

구체적으로 디코딩파라미터값 a1에 대한 제1평균값(aavg.1)은 1프레임 내지 5프레임에서의 디코딩파라미터값 a1 내지 a5의 평균값이고, 디코딩파라미터값 a3에 대한 제1평균값(aavg.3)은 3프레임 내지 7프레임에서의 디코딩파라미터값 a3 내지 a7의 평균값이다.Specifically, the first average value (a avg.1 ) for the decoding parameter value a 1 is the average value of decoding parameter values a 1 to a 5 in frames 1 to 5 , and the first average value (a avg.1) for the decoding parameter value a 3 avg.3 ) is an average value of decoding parameter values a 3 to a 7 in frames 3 to 7.

동일한 방식으로 디코딩파라미터값 a2에 대한 제1평균값은 2프레임 내지 6프레임에서의 디코딩파라미터값, 디코딩파라미터값 a4에 대한 제1평균값은 4프레임 내지 8프레임에서의 디코딩파라미터값에 기초하여 산출될 수 있다.In the same manner, the first average value for the decoding parameter value a 2 is calculated based on the decoding parameter value in the 2nd to 6th frames, and the first average value for the decoding parameter value a 4 is calculated based on the decoding parameter value in the 4th to 8th frames. It can be.

이와 같이, 기설정된 N개의 복수의 프레임구간이 슬라이딩 윈도우 알고리즘에 기반하여, 복수의 프레임 각각에 단계적으로 적용될 수 있다. In this way, a plurality of predetermined N frame periods may be applied to each of the plurality of frames step by step based on the sliding window algorithm.

이와 같이, 본 발명에서는 제1평균값을 산출하는 프레임구간인 “기설정된 N개의 복수의 프레임”이 시간에 따라 흐르는 프레임별로 단계적으로 적용됨으로써, 복수의 프레임에서 불규칙적으로 생성되는 노이즈를 단계적으로 제거할 수 있다. As described above, in the present invention, by stepwisely applying "a plurality of N predetermined frames", which is a frame period for calculating a first average value, to each frame flowing according to time, noise generated irregularly in a plurality of frames can be gradually removed. can

이를 도 5의 (b)에서 설명하면, 특정 블록에 대한 디코딩파라미터값이 1 내지 5프레임 각각에서 2,3,2,1,1일 때, 1프레임에 대한 제1평균값은 기설정된 개수(3개)의 복수의 프레임(1 내지 3프레임)에서의 디코딩파라미터값의 평균값인 2+3+2/3=2.3으로 산출될 수 있다.Referring to (b) of FIG. 5, when the decoding parameter value for a specific block is 2,3,2,1,1 in each of 1 to 5 frames, the first average value for 1 frame is a predetermined number (3 ) may be calculated as 2+3+2/3=2.3, which is an average value of decoding parameter values in a plurality of frames (frames 1 to 3).

한편, 상기 제1평균값이 기설정된 제1임계값(예를 들어 2)를 초과하는 경우, 1프레임에서 해당 블록에 대한 디코딩파라미터값 2는 유지될 수 있다.On the other hand, when the first average value exceeds the first preset threshold value (eg, 2), the decoding parameter value 2 for the block in one frame may be maintained.

반면에, 3프레임에 대한 제1평균값은 기설정된 개수(3개)의 복수의 프레임(3 내지 5프레임)에서의 디코딩파라미터값의 평균값인 2+1+1/3=1.3으로 산출될 수 있다.On the other hand, the first average value for 3 frames may be calculated as 2 + 1 + 1/3 = 1.3, which is the average value of decoding parameter values in a predetermined number (3) of a plurality of frames (3 to 5 frames). .

한편, 상기 제1평균값이 기설정된 제1임계값(예를 들어 2) 이하인 경우, 3프레임에 대한 디코딩파라미터값 2는 0으로 변환될 수 있다. Meanwhile, when the first average value is equal to or less than a preset first threshold value (eg, 2), the decoding parameter value 2 for 3 frames may be converted to 0.

한편, 전술한 바와 같이 본 발명의 일 실시예에서, 디코딩파라미터값은 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함할 수 있고, 상기 제1노이즈제거단계는 복수의 디코딩파라미터값 각각에 대해 수행될 수 있다.Meanwhile, as described above, in one embodiment of the present invention, the decoding parameter value may include one or more of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value. The first noise removal step may be performed for each of a plurality of decoding parameter values.

구체적으로 본 발명의 일 실시예에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 데이터크기값에 임계치를 적용하여, 임계치보다 낮은 블록에 대한 데이터크기값은 0으로 변환한 후, 기설정된 N개의 복수의 프레임에서 데이터크기값에 대한 제1평균값을 산출하여, 제1평균값이 제1임계값 이하인 경우에 해당 블록에 대한 데이터크기값을 0으로 변환할 수 있다. Specifically, in one embodiment of the present invention, a threshold is applied to a data size value for each of a plurality of blocks included in each of a plurality of frames, the data size value for a block lower than the threshold is converted to 0, and then a predetermined A first average value of data size values in a plurality of N frames may be calculated, and when the first average value is equal to or less than a first threshold value, the data size value of the corresponding block may be converted to 0.

또는 본 발명의 일 실시예에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 각도값을 90도 단위의 4개의 채널로 분류하고, 기설정된 N개의 복수의 프레임에서 채널별로 각도값에 대한 제1평균값을 산출하여, 제1평균값이 제1임계값 이하인 경우에 해당 블록에 대한 각도값을 0으로 변환할 수 있다. Alternatively, in one embodiment of the present invention, the angle values for each of the plurality of blocks included in each of the plurality of frames are classified into four channels in units of 90 degrees, and the angle values for each channel in the plurality of N frames are preset. A first average value is calculated, and when the first average value is less than or equal to a first threshold value, an angle value for the corresponding block may be converted to 0.

또는 본 발명의 일 실시예에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 블록크기값을 정규화하고(예를 들어, 모든 블록크기값이 0 내지 255 이내가 되도록) 임계치를 적용하여, 임계치보다 낮은 블록에 대한 블록크기값은 0으로 변환한 후, 기설정된 N개의 복수의 프레임에서 블록크기값에 대한 제1평균값을 산출하여, 제1평균값이 제1임계값 이하인 경우에 해당 블록에 대한 블록크기값을 0으로 변환할 수 있다. Alternatively, in one embodiment of the present invention, by normalizing block size values for each of a plurality of blocks included in each of a plurality of frames (eg, so that all block size values are within 0 to 255) and applying a threshold, After converting the block size value for a block lower than the threshold value to 0, a first average value for block size values in a plurality of N frames is calculated, and when the first average value is less than or equal to the first threshold value, the corresponding block block size can be converted to 0.

또는 본 발명의 일 실시예에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 레지듀얼값을 정규화하고(예를 들어, 모든 레지듀얼값이 0 내지 255 이내가 되도록) 임계치를 적용하여, 임계치보다 낮은 블록에 대한 레지듀얼값은 0으로 변환한 후, 기설정된 N개의 복수의 프레임에서 레지듀얼값에 대한 제1평균값을 산출하여, 제1평균값이 제1임계값 이하인 경우에 해당 블록에 대한 레지듀얼값을 0으로 변환할 수 있다.Alternatively, in one embodiment of the present invention, by normalizing residual values for each of a plurality of blocks included in each of a plurality of frames (eg, so that all residual values are within 0 to 255) and applying a threshold, After converting the residual value for a block lower than the threshold to 0, a first average value for the residual values in a plurality of N frames is calculated, and when the first average value is less than the first threshold value, the corresponding block Residual values for can be converted to 0.

이어서, 복수의 프레임에서 해당 블록에 대한 레지듀얼값을 이진화하여, 0 또는 255의 값으로 변환할 수 있다. Subsequently, a residual value of a corresponding block in a plurality of frames may be binarized and converted into a value of 0 or 255.

또는 본 발명의 일 실시예에서, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 양자화파라미터값을 정규화하고(예를 들어, 모든 양자화파라미터값이 0 내지 255 이내가 되도록) 임계치를 적용하여, 임계치보다 낮은 블록에 대한 양자화파라미터값은 0으로 변환한 후, 기설정된 N개의 복수의 프레임에서 양자화파라미터값에 대한 제1평균값을 산출하여, 제1평균값이 제1임계값 이하인 경우에 해당 블록에 대한 양자화파라미터값을 0으로 변환할 수 있다. Alternatively, in one embodiment of the present invention, by normalizing quantization parameter values for each of a plurality of blocks included in each of a plurality of frames (eg, so that all quantization parameter values are within 0 to 255) and applying a threshold, After converting the quantization parameter value for a block lower than the threshold value to 0, a first average value for the quantization parameter value in a plurality of N frames is calculated, and when the first average value is less than or equal to the first threshold value, the corresponding block It is possible to convert the quantization parameter value to 0.

이와 같이, 데이터 형태가 상이한 복수의 디코딩파라미터값별로 상이한 규칙으로 제1노이즈제거단계가 수행될 수 있다. As such, the first noise removal step may be performed according to different rules for each of a plurality of decoding parameter values having different data types.

도 5의 (c)는 제1노이즈제거단계가 수행된 후의 복수의 프레임에 포함되는 복수의 블록 각각에 대한 디코딩파라미터값을 도시한다. 도시된 바와 같이, 제1노이즈제거단계가 수행됨으로써, 복수의 디코딩파라미터값 중 노이즈로 판단되는 특정 프레임에서의 특정 블록에 대한 특정 디코딩파라미터값이 0으로 변환될 수 있다.(예시의, 1프레임의 B1블록의 디코딩파라미터값 D1, 4프레임의 B1블록의 디코딩파라미터값 D7)5(c) shows decoding parameter values for each of a plurality of blocks included in a plurality of frames after the first noise removal step is performed. As shown, by performing the first noise removal step, a specific decoding parameter value for a specific block in a specific frame determined to be noise among a plurality of decoding parameter values may be converted to 0. (For example, 1 frame. Decoding parameter value of B1 block of 1 , decoding parameter value of B1 block of 4 frames D 7 )

한편, 제2노이즈제거단계를 수행하기에 앞서 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 종합파라미터값이 산출될 수 있다. 구체적으로 종합파라미터값은 해당 블록에 대한 2 이상의 디코딩파라미터값에 대한 가중평균값이다.Meanwhile, prior to performing the second noise removal step, comprehensive parameter values for each of a plurality of blocks included in each of a plurality of frames may be calculated. Specifically, the comprehensive parameter value is a weighted average value of two or more decoding parameter values for a corresponding block.

바람직하게는 종합파라미터값은 해당 블록에 대한 모든 디코딩파라미터값에 대한 가중평균값이다.Preferably, the comprehensive parameter value is a weighted average value of all decoding parameter values for a corresponding block.

더 바람직하게는 종합파라미터값은 해당 블록에 대한 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값의 가중평균값이다.More preferably, the comprehensive parameter value is a weighted average value of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for a corresponding block.

도 5의 (c)에 도시된 바와 같이, 1프레임의 B1블록에 대한 종합파라미터값 d1은 해당 블록에 대한 모든 디코딩파라미터값(D1 내지 D7)에 대한 가중평균값이다.As shown in (c) of FIG. 5, the comprehensive parameter value d 1 for block B1 of one frame is a weighted average value of all decoding parameter values (D 1 to D 7 ) for the corresponding block.

마찬가지로, 4프레임의 B1블록에 대한 종합파라미터값 d4는 해당 블록에 대한 모든 디코딩파라미터값(D1 내지 D7)에 대한 가중평균값이고, 7프레임의 B1블록에 대한 종합파라미터값 d7은 해당 블록에 대한 모든 디코딩파라미터값(D1 내지 D7)에 대한 가중평균값이다.Similarly, the comprehensive parameter value d 4 for the B1 block of the 4th frame is the weighted average value of all decoding parameter values (D 1 to D 7 ) for the corresponding block, and the comprehensive parameter value d 7 for the B1 block of the 7th frame corresponds to It is a weighted average value of all decoding parameter values (D 1 to D 7 ) for the block.

이와 같이, 종합파라미터값은 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 2 이상에 대한 가중평균값, 바람직하게는 모든 디코딩파라미터값에 대한 가중평균값으로서, 크기와 방향성을 가지는 벡터값으로 산출될 수 있고, 이는 해당 블록에서의 객체의 존재여부 및 이동성 정보를 의미할 수 있다.In this way, the comprehensive parameter value is a weighted average value of two or more of the motion vector value, data size value, angle value, block size value, residual value, and quantization parameter value, preferably all decoding parameter values As a weighted average value, It can be calculated as a vector value having size and direction, which can mean the presence or absence of an object in a corresponding block and mobility information.

한편, 2 이상의 디코딩파라미터값에 기초하여 종합파라미터값을 산출함에 있어 각 디코딩파라미터값마다 상이한 가중치가 부여될 수 있다. Meanwhile, in calculating a comprehensive parameter value based on two or more decoding parameter values, different weights may be assigned to each decoding parameter value.

즉, 종합파라미터값은 하기의 [식 1]과 같은 방식으로 산출될 수 있다.That is, the comprehensive parameter value can be calculated in the same way as in [Equation 1] below.

[식 1][Equation 1]

Figure pat00013
Figure pat00013

(여기서 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값은 해당 블록에 대한 디코딩파라미터,

Figure pat00014
,
Figure pat00015
,
Figure pat00016
,
Figure pat00017
,
Figure pat00018
는 각각의 디코딩파라미터값에 대한 가중치)(Here, the data size value, angle value, block size value, residual value, and quantization parameter value are decoding parameters for the corresponding block,
Figure pat00014
,
Figure pat00015
,
Figure pat00016
,
Figure pat00017
,
Figure pat00018
is the weight for each decoding parameter value)

도 6은 본 발명의 일 실시예에 따른, 제2노이즈제거단계를 도시한다. 6 shows a second noise removal step, according to an embodiment of the present invention.

도 6에 도시된 바와 같이, 상기 제2노이즈제거단계는, 상기 기설정된 N개의 복수의 프레임에서 종합파라미터값에 대한 상기 제2평균값이, 종합파라미터값에 대해 기설정된 제2임계값을 초과하는 경우에, 상기 기설정된 N개의 복수의 프레임 중 어느 하나의 프레임에서 해당 블록에 대한 모든 디코딩파라미터값을 0으로 변환할 수 있다. As shown in FIG. 6, in the second noise removal step, the second average value of comprehensive parameter values in the plurality of N frames exceeds a second threshold value preset for comprehensive parameter values. In this case, all decoding parameter values for a corresponding block in any one of the predetermined N frames may be converted to 0.

도 6의 (a)는 특정 블록에 대하여, 복수의 프레임에서의 종합파라미터값(d1 내지 d7)을 도시하고 있다. 본 발명에서는 복수의 프레임 각각에 대한 종합파라미터값이 노이즈에 의한 것인 지 여부를 판단한다.FIG. 6(a) shows comprehensive parameter values (d 1 to d 7 ) in a plurality of frames for a specific block. In the present invention, it is determined whether a comprehensive parameter value for each of a plurality of frames is due to noise.

구체적으로 종합파라미터값 d1에 대한 노이즈를 판단하는 경우를 보면, 우선 기설정된 개수(예시의 경우 5개)의 복수의 프레임(1프레임 내지 5프레임)에서 종합파라미터값(d1 내지 d5)에 대한 평균값인 제2평균값(davg.1)을 산출한다.Specifically, looking at the case of determining the noise for the comprehensive parameter value d 1 , first, the comprehensive parameter values (d 1 to d 5 ) in a plurality of frames (frames 1 to 5) of a predetermined number (5 in the case of the example) A second average value (d avg.1 ), which is the average value for , is calculated.

바람직하게는, 종합파라미터값 d1에 대한 1프레임과 전후로 인접하고 연속되는 복수의 프레임(1프레임 내지 5프레임)에서 종합파라미터값(d1 내지 d5)에 대한 평균값인 제2평균값(davg.1)을 산출한다.Preferably, the second average value (d avg ), which is an average value for the comprehensive parameter values (d 1 to d 5 ) in one frame for the comprehensive parameter value d 1 and a plurality of adjacent and successive frames (1 frame to 5 frames) .1 ).

이어서, 산출된 제2평균값(davg.1)이 종합파라미터값에 대해 기설정된 제2임계값(d제2임계값)을 초과하는 지 여부를 판단한다.Subsequently, it is determined whether the calculated second average value (d avg.1 ) exceeds a predetermined second threshold value (d second threshold value ) for the comprehensive parameter value.

도시된 바와 같이, 제2평균값(davg.1)이 제2임계값(d제2임계값)을 초과하는 경우 해당 종합파라미터값은 유효한 데이터로 판단되고, 해당 블록에 대한 2 이상의 디코딩파라미터값의 데이터값이 유지된다.As shown, when the second average value (d avg.1 ) exceeds the second threshold value (d second threshold value ), the corresponding comprehensive parameter value is determined as valid data, and two or more decoding parameter values for the corresponding block The data value of is maintained.

반면 종합파라미터값 d3에 대한 노이즈를 판단하는 경우를 보면, 우선 기설정된 개수(예시의 경우 5개)의 복수의 프레임(3프레임 내지 7프레임)에서 종합파라미터값(d3 내지 d7)에 대한 평균값인 제2평균값(davg.3)을 산출한다.On the other hand, looking at the case of determining the noise for the comprehensive parameter value d 3 , first, in a plurality of frames (3 frames to 7 frames) of a predetermined number (5 in the case of the example), the comprehensive parameter values (d 3 to d 7 ) Calculate the second average value (d avg.3 ), which is the average value for

바람직하게는, 종합파라미터값 d3에 대한 3프레임과 전후로 인접하고 연속되는 복수의 프레임(3프레임 내지 7프레임)에서 종합파라미터값(d3 내지 d7)에 대한 평균값인 제2평균값(davg.3)을 산출한다.Preferably, the second average value (d avg ), which is an average value for the comprehensive parameter values (d 3 to d 7 ) in 3 frames for the comprehensive parameter value d 3 and a plurality of adjacent and successive frames ( 3 frames to 7 frames) in front and back .3 ).

이어서, 산출된 제2평균값(aavg.3)이 해당 디코딩파라미터값(a)에 대해 기설정된 제2임계값(d제2임계값)을 초과하는 지 여부를 판단한다.Subsequently, it is determined whether the calculated second average value (a avg.3 ) exceeds a predetermined second threshold value (d second threshold value ) for the corresponding decoding parameter value (a).

도시된 바와 같이, 제2평균값(davg.3)이 제2임계값(d제2임계값) 이하인 경우, 제2평균값(davg.3)이 산출된 기설정된 N개의 복수의 프레임(3프레임 내지 7프레임) 중 어느 하나(3프레임)에서 해당 블록에 대한 2 이상의 디코딩파라미터값은 노이즈로 판단되어 0으로 변환될 수 있다. 바람직하게는 해당 블록에 대한 모든 디코딩파라미터값이 0으로 변환될 수 있다.As shown, when the second average value (d avg.3 ) is less than or equal to the second threshold value (d second threshold value ), the second average value (d avg.3 ) is calculated in a plurality of preset N frames (3). Two or more decoding parameter values for a corresponding block in any one (3 frames) of frames to 7 frames may be determined as noise and converted to 0. Preferably, all decoding parameter values for a corresponding block can be converted to 0.

더욱 바람직하게는, 제2평균값(davg.3)이 산출된 기설정된 N개의 복수의 프레임(3프레임 내지 7프레임) 중 가장 앞선 프레임(3프레임)에서 해당 블록에 대한 모든 디코딩파라미터값이 0으로 변환될 수 있다.More preferably, all decoding parameter values for a corresponding block in the first frame (3 frames) among a plurality of predetermined N frames (3 frames to 7 frames) in which the second average value (d avg.3 ) is calculated are 0 can be converted to

한편 도 6의 (a)에서 종합파라미터값 d1 및 d3에 대한 노이즈를 판단할 때, 제2평균값을 산출하는 프레임구간(기설정된 N개의 복수의 프레임)이 상이하게 설정되었음을 알 수 있다.Meanwhile, when determining the noise for the comprehensive parameter values d 1 and d 3 in (a) of FIG. 6 , it can be seen that the frame interval (a plurality of preset N frames) for calculating the second average value is set differently.

구체적으로 종합파라미터값 d1에 대한 제2평균값(davg.1)은 1프레임 내지 5프레임에서의 종합파라미터값 d1 내지 d5의 평균값이고, 종합파라미터값 d3에 대한 제2평균값(davg.3)은 3프레임 내지 7프레임에서의 종합파라미터값 d3 내지 d7의 평균값이다.Specifically, the second average value (d avg.1 ) for the comprehensive parameter value d 1 is the average value of the comprehensive parameter values d 1 to d 5 in frames 1 to 5, and the second average value (d avg.1) for the comprehensive parameter value d 3 avg.3 ) is an average value of comprehensive parameter values d 3 to d 7 in frames 3 to 7.

동일한 방식으로 종합파라미터값 d2에 대한 제2평균값은 2프레임 내지 6프레임에서의 종합파라미터값, 종합파라미터값 d4에 대한 제2평균값은 4프레임 내지 8프레임에서의 종합파라미터값에 기초하여 산출될 수 있다.In the same way, the second average value for the comprehensive parameter value d 2 is calculated based on the comprehensive parameter value in the 2nd to 6th frames, and the second average value for the comprehensive parameter value d 4 is calculated based on the comprehensive parameter value in the 4th to 8th frames. It can be.

이와 같이, 기설정된 N개의 복수의 프레임구간이 슬라이딩 윈도우 알고리즘에 기반하여, 복수의 프레임 각각에 단계적으로 적용될 수 있다.In this way, a plurality of predetermined N frame periods may be applied to each of the plurality of frames step by step based on the sliding window algorithm.

이와 같이, 본 발명에서는 제2평균값을 산출하는 프레임구간인 “기설정된 N개의 복수의 프레임”이 시간에 따라 흐르는 프레임별로 단계적으로 적용됨으로써, 복수의 프레임에서 불규칙적으로 생성되는 노이즈를 단계적으로 제거할 수 있다. As described above, in the present invention, by stepwisely applying "preset N multiple frames", which is a frame period for calculating the second average value, for each frame flowing over time, noise generated irregularly in a plurality of frames can be removed step by step. can

이를 도 6의 (b)에서 설명하면, 특정 블록에 대한 복수의 디코딩파라미터값이 1프레임에서 2,1,3,2일 ‹š, 1프레임에서 종합파라미터값은 2+1+3+2/4=2로 산출될 수 있다. 이 때, 각각의 디코딩파라미터값에 대한 가중치는 고려하지 않았다.If this is explained in (b) of FIG. 6, a plurality of decoding parameter values for a specific block are 2, 1, 3, and 2 in 1 frame, and the total parameter value in 1 frame is 2+1+3+2/ It can be calculated as 4=2. At this time, the weight for each decoding parameter value is not considered.

이와 같은 단계를 각 프레임에서 수행하여, 1 내지 5프레임 각각에서의 종합파라미터값이 2,3,2,1,1으로 산출되었다. By performing these steps in each frame, comprehensive parameter values in each of frames 1 to 5 were calculated as 2,3,2,1,1.

1프레임에 대한 제2평균값은 기설정된 개수(3개)의 복수의 프레임(1 내지 3프레임)에서의 종합파라미터값의 평균값인 2+3+2/3=2.3으로 산출될 수 있다.The second average value for one frame may be calculated as 2+3+2/3=2.3, which is an average value of comprehensive parameter values in a plurality of frames (1 to 3 frames) of a predetermined number (3).

한편, 상기 제2평균값이 기설정된 제2임계값(예를 들어 2)를 초과하는 경우, 1프레임에 대한 모든 디코딩파라미터값(2,1,3,2)은 유지될 수 있다.Meanwhile, when the second average value exceeds the predetermined second threshold value (eg, 2), all decoding parameter values (2, 1, 3, and 2) for one frame may be maintained.

반면에, 3프레임에 대한 제2평균값은 기설정된 개수(3개)의 복수의 프레임(3 내지 5프레임)에서의 디코딩파라미터값의 평균값인 2+1+1/3=1.3으로 산출될 수 있다.On the other hand, the second average value for 3 frames may be calculated as 2 + 1 + 1/3 = 1.3, which is the average value of decoding parameter values in a predetermined number (3) of a plurality of frames (3 to 5 frames). .

한편, 상기 제2평균값이 기설정된 제2임계값(예를 들어 2) 이하인 경우, 3프레임에 대한 모든 디코딩파라미터값(2,2,2,2)의 값은 0으로 변환될 수 있다. Meanwhile, when the second average value is equal to or less than a predetermined second threshold value (eg, 2), all decoding parameter values (2,2,2,2) for 3 frames may be converted to 0.

도 6의 (c)는 제2노이즈제거단계가 수행된 후의 복수의 프레임에 포함되는 복수의 블록 각각에 대한 디코딩파라미터값을 도시한다. 도시된 바와 같이, 제2노이즈제거단계가 수행됨으로써, 복수의 디코딩파라미터값 중 노이즈로 판단되는 특정 프레임에서의 특정 블록에 대한 2 이상의 디코딩파라미터값이 0으로 변환될 수 있다6(c) shows decoding parameter values for each of a plurality of blocks included in a plurality of frames after the second noise removal step is performed. As shown, by performing the second noise removal step, two or more decoding parameter values for a specific block in a specific frame determined to be noise among a plurality of decoding parameter values may be converted to 0.

구체적으로 1프레임의 B1블록에 대한 종합파라미터값 d1이 노이즈로 판단되는 경우에, B1블록에 대한 2 이상의, 바람직하게는 모든 디코딩파라미터값(D1 내지 D7)이 0으로 변환될 수 있다. Specifically, when the comprehensive parameter value d 1 for the B1 block of one frame is determined to be noise, two or more, preferably all decoding parameter values (D 1 to D 7 ) for the B1 block may be converted to 0. .

동일하게 4프레임의 B1블록에 대한 종합파라미터값 d4가 노이즈로 판단되는 경우에, B1블록에 대한 2 이상의, 바람직하게는 모든 디코딩파라미터값(D1 내지 D7)이 0으로 변환될 수 있다.Similarly, when the comprehensive parameter value d 4 for the B1 block of 4 frames is determined to be noise, two or more, preferably all decoding parameter values (D 1 to D 7 ) for the B1 block may be converted to 0. .

이를 도 5의 (c)의 제1노이즈제거단계와 비교하면, 제1노이즈제거단계는 복수의 디코딩파라미터값 각각에 대해 수행되어, 해당 블록에서 노이즈로 판단되는 특정 디코딩파라미터값이 0으로 변환되는 과정이고, 제2노이즈제거단계는 복수의 디코딩파라미터값에 대한 가중평균값인 종합파라미터값에 대해 수행되어, 종합파라미터값이 노이즈로 판단되는 경우, 해당 블록에 대한 모든 디코딩파라미터값이 0으로 변환되는 과정이다.Comparing this with the first noise removal step of FIG. 5 (c), the first noise removal step is performed for each of a plurality of decoding parameter values, and a specific decoding parameter value determined to be noise in the corresponding block is converted to 0. process, and the second noise removal step is performed on the comprehensive parameter value, which is the weighted average value of a plurality of decoding parameter values, and when the comprehensive parameter value is determined to be noise, all decoding parameter values for the corresponding block are converted to 0 It is a process.

도 7은 본 발명의 일 실시예에 따른, 객체영역검출단계를 도시한다.7 illustrates an object area detection step according to an embodiment of the present invention.

전술한 바와 같이, 본 발명에서는 제1노이즈제거단계 및 제2노이즈제거단계를 수행함으로써, 복수의 프레임 각각에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값이 노이즈에 의한 것인지 여부를 판단하고, 노이즈로 판단되는 디코딩파라미터값을 0으로 변환할 수 있다. As described above, in the present invention, by performing the first noise removal step and the second noise removal step, it is determined whether a plurality of decoding parameter values for each of a plurality of blocks included in each of a plurality of frames are caused by noise, , decoding parameter values determined as noise may be converted to 0.

도 7의 (a)에 도시된 바와 같이, 노이즈가 제거된 2 이상의 디코딩파라미터값에 의해 산출되는 종합파라미터값은 해당 블록에 대한, 객체의 존재여부 및 이동성정보를 포함할 수 있다. 바람직하게는 종합파라미터값은 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값에 대한 가중평균값으로, 크기와 각도를 가지는 벡터 형태의 데이터로 산출될 수 있다.As shown in (a) of FIG. 7 , a comprehensive parameter value calculated by two or more decoded parameter values from which noise has been removed may include object existence and mobility information for a corresponding block. Preferably, the comprehensive parameter value is a weighted average value of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value, and can be calculated as vector data having a size and an angle.

도 7의 (b)는 복수의 블록 각각에 대한 종합파라미터값에 기초하여 검출된 객체영역을 도시한다. 도시된 바와 같이, 종합파라미터값은 복수의 블록 각각에 대하여, 크기와 각도를 가지는 벡터 형태의 데이터로 산출될 수 있다.7(b) shows an object region detected based on the comprehensive parameter value for each of a plurality of blocks. As shown, the comprehensive parameter value may be calculated as data in the form of a vector having a size and an angle for each of a plurality of blocks.

객체영역검출부(2000)는 종합파라미터값이 객체임계값을 초과하는 복수의 블록들(예시의 #2,#3,#6,#7)을 클러스터링하고, 클러스터링된 블록들의 최외곽점을 꼭지점으로 하는 사각형형태의 바운딩박스를 부여하여 객체영역을 설정할 수 있다.The object area detection unit 2000 clusters a plurality of blocks (#2, #3, #6, and #7 in the example) in which the comprehensive parameter value exceeds the object threshold value, and uses the outermost points of the clustered blocks as vertices. It is possible to set the object area by giving a bounding box in the form of a rectangle.

바람직하게는, 복수의 프레임 각각에 포함되는 복수의 블록에 대한 종합파라미터값에 기초하여, 인접하거나 기설정된 거리 이내에 위치하는 1 이상의 블록들을 클러스터링하여, 복수의 프레임 각각에서 객체영역이 검출될 수 있다.Preferably, the object region may be detected in each of the plurality of frames by clustering one or more blocks located adjacent to or within a predetermined distance based on comprehensive parameter values of the plurality of blocks included in each of the plurality of frames. .

도 8은 본 발명의 일 실시예에 따른, 영상정보의 비트스트림정보에 기반하여 객체영역이 검출되는 일례를 도시한다.8 illustrates an example in which an object region is detected based on bitstream information of image information according to an embodiment of the present invention.

도 8의 (a)는 노이즈에 의한 블록들을 도시한다. 도시된 바와 같이 노이즈는 불규칙적인 위치, 및 프레임에서 간헐적으로 나타날 수 있다. 즉, 노이즈는 연속되는 프레임이 아닌 특정 프레임 혹은 아주 짧은 프레임에서 순간적으로 나타났다 사라지는 형태로 발생한다. 즉, 노이즈에 의한 디코딩파라미터값들은 기설정된 N개의 복수의 프레임동안 연속적으로 유의미한(임계값 이상의) 데이터값을 유지하지 못하므로, 제1노이즈제거단계 및 제2노이즈제거단계에서 제거(0으로 변환)될 수 있다. 8(a) shows blocks caused by noise. As shown, noise can appear at irregular locations and intermittently in frames. That is, noise is generated in the form of instantaneously appearing and disappearing in a specific frame or a very short frame rather than in consecutive frames. That is, since the decoding parameter values due to noise do not continuously maintain significant (above the threshold value) data values for a plurality of preset N frames, they are removed (converted to 0) in the first and second noise removal steps. ) can be

도 8의 (b)는 객체에 의한 블록들을 도시한다. 객체에 의한 디코딩파라미터값들은 기설정된 N개의 복수의 프레임동안 연속적으로 유의미한(임계값 이상의) 데이터값을 유지하므로, 제1노이즈제거단계 및 제2노이즈제거단계에서 제거되지 않을 수 있다. 8(b) shows blocks by objects. Decoding parameter values by objects continuously maintain significant (threshold or more) data values for a plurality of preset N frames, so they may not be removed in the first noise removal step and the second noise removal step.

도 8의 (c)는 객체임계값을 초과하는 종합파라미터값을 복수의 블록들을 클러스터링하여 검출된 객체영역을 도시한다. 도시된 바와 같이, 객체영역은 인접하거나 기설정된 거리 이내에 위치하는 복수의 블록들을 클러스터링하고, 블록의 최외곽점을 꼭지점으로 하는 바운딩박스를 부여하여 설정될 수 있다.8(c) shows an object region detected by clustering a plurality of blocks with comprehensive parameter values exceeding the object threshold value. As shown, the object area may be set by clustering a plurality of blocks adjacent to each other or located within a predetermined distance and assigning a bounding box having an outermost point of the block as a vertex.

또한, 복수의 프레임에서, 검출된 객체영역별로 식별정보를 부여하여 트래킹할 수 있다. Also, in a plurality of frames, tracking may be performed by assigning identification information to each detected object area.

도 9는 본 발명의 일 실시예에 따른, 검출된 객체영역을 도시한다.9 illustrates a detected object area according to an embodiment of the present invention.

전술한 바와 같이, 본 발명에서는 영상정보가 디코딩 되기 전의 비트스트림정보에 기반하여 객체영역을 검출하여 영상분석을 수행할 수 있다. 즉 도 9에서 검출된 객체영역은 영상정보 자체에 대한 객체검출 알고리즘에 의해 검출된 것이 아니라, 도 8의 (c)에서와 같이 디코딩되기 전의 비트스트림정보에 기반하여 검출된 객체영역에 해당한다.As described above, in the present invention, image analysis may be performed by detecting an object region based on bitstream information before image information is decoded. That is, the object region detected in FIG. 9 corresponds to an object region detected based on bitstream information before being decoded, as shown in FIG. 8(c), rather than detected by an object detection algorithm for image information itself.

도 10은 본 발명의 일 실시예에 따른 인코딩 되는 영상을 생성하는 인코더 시스템을 개략적으로 도시한다. 도시된 인코더(10)는 도 1에서 영상정보를 인코딩하여 비트스트림정보를 생성하기 위해, DCT부(Discrete Cosine Transform)(11), 양자화부(Quantization)(12), 역양자화부(Inverse Quantization; IQ)(13), 역변환부 (Inverse Discrete Cosine Transform;IDCT)(14), 프레임 메모리(15), 움직임 추정 및 보상부(Motion Estimation and Compensation; ME/MC)(16) 및 가변 길이 코딩부(Variable Length Coding; VLC)(17)를 포함할 수 있다. 마찬가지로, 상기 영상디코딩부(1000)는 상기 인코딩부의 구성에 상응하게 구성됨이 바람직하다. 10 schematically illustrates an encoder system for generating an encoded video according to an embodiment of the present invention. The illustrated encoder 10 includes a DCT unit (Discrete Cosine Transform) 11, a quantization unit 12, and an inverse quantization unit to generate bitstream information by encoding video information in FIG. 1; IQ) 13, an inverse discrete cosine transform (IDCT) 14, a frame memory 15, a motion estimation and compensation (ME/MC) 16, and a variable length coding unit ( Variable Length Coding (VLC) 17 may be included. Similarly, the image decoding unit 1000 is preferably configured to correspond to the configuration of the encoding unit.

이에 대해 간략하게 설명을 하자면, DCT부(11)는 공간적 상관성을 제거하기 위해 기설정된 사이즈 (예를들어 4 ×4) 픽셀 블록 단위로 입력되는 영상 데이터에 대해 DCT 연산을 수행한다. 이후, 양자화부(12)는 DCT부(11)에서 얻어진 DCT 계수에 대해 양자화를 수행하여, 몇 개의 대표 값으로 표현함으로써, 고효율 손실 압축을 수행한다.To briefly explain this, the DCT unit 11 performs a DCT operation on input image data in units of pixel blocks of a preset size (for example, 4x4) in order to remove spatial correlation. Thereafter, the quantization unit 12 performs quantization on the DCT coefficients obtained by the DCT unit 11 and expresses them with several representative values, thereby performing highly efficient lossy compression.

또한, 역양자화부(13)는 양자화부(12)에서 양자화된 영상 데이터를 역양자화한다. 역변환부(14)는 역양자화부(13)에서 역양자화된 영상 데이터에 대해 IDCT 변환을 수행한다. 프레임 메모리(15)는 역변환부(14)에서 IDCT 변환된 영상데이터를 프레임 단위로 저장한다. In addition, the inverse quantization unit 13 inversely quantizes the image data quantized by the quantization unit 12 . The inverse transform unit 14 performs IDCT transformation on the image data inversely quantized by the inverse quantization unit 13 . The frame memory 15 stores the IDCT-converted image data in the inverse transform unit 14 in units of frames.

한편, 움직임 추정 및 보상부(16)는 입력되는 현재 프레임의 영상데이터와 프레임 메모리부(15)에 저장된 이전 프레임의 영상 데이터를 이용하여 매크로 블록당 움직임 벡터(Motion Vector; MV)를 추정하여 블록정합오차 (blockmatching error)에 해당되는 SAD(sum of absolute difference)를 계산한다. Meanwhile, the motion estimating and compensating unit 16 estimates a motion vector (MV) for each macroblock by using the video data of the current frame and the video data of the previous frame stored in the frame memory unit 15. Calculate the SAD (sum of absolute difference) corresponding to the block matching error.

가변길이 코딩부(17)는 움직임 추정 및 보상부(16)에서 추정된 움직임 벡터에 따라 DCT및 양자화 처리된 데이터에서 통계적 중복성을 제거한다.The variable length coding unit 17 removes statistical redundancy from DCT and quantized data according to the motion vector estimated by the motion estimation and compensation unit 16 .

도 11은 영상 데이터의 프레임들의 예들을 개략적으로 도시한 도면이다. 일반적인 동영상의 비디오 부분은 I 프레임(도 11에서 “I”로 도시한 프레임), P 프레임(도 11에서 “P”로 도시한 프레임), 및 B 프레임(도 11에서 “B”로 도시한 프레임)으로 구성된다. I 프레임은 키 프레임으로써 전체 이미지를 모두 포함하고, 동영상 파일에 있어서 억세스 포인트로 기능할 수 있으며, 독립적으로 인코딩된 프레임에 해당하며 낮은 압축률을 가지고 있다. 11 is a diagram schematically illustrating examples of frames of image data. The video portion of a general motion picture includes I frames (frames indicated by “I” in FIG. 11), P frames (frames indicated by “P” in FIG. 11), and B frames (frames indicated by “B” in FIG. 11). ) is composed of An I frame includes all images as a key frame, can function as an access point in a video file, corresponds to an independently encoded frame, and has a low compression rate.

한편, P 프레임의 경우, 이전의 I 프레임 혹은 P 프레임을 참조하여 순방향 예측에 의하여 만들어지는 프레임으로서 독립적으로 인코딩된 프레임에 해당하지 않는다. 이와 같은 P 프레임은 I 프레임에 비해 높은 압축률을 가지고 있다. 여기서, “이전”의 프레임이라는 것은 바로 전 프레임뿐만 아니라 해당 프레임 전에 존재하는 복수의 프레임 중 하나를 의미하고, “이후”의 프레임이라는 것은 바로 다음 프레임뿐만 아니라 해당 프레임 다음 에 존재하는 복수의 프레임 중 하나를 의미한다. Meanwhile, in the case of a P frame, a frame created by forward prediction by referring to a previous I frame or P frame does not correspond to an independently encoded frame. Such a P frame has a higher compression ratio than an I frame. Here, the “previous” frame means not only the previous frame but also one of a plurality of frames that exist before the corresponding frame, and the “after” frame means not only the immediately following frame but also one of a plurality of frames existing after the corresponding frame. means one

한편, B 프레임의 경우, 이전의 프레임 및 이후의 프레임을 참조하여 순방향 및 역방향 예측에 의하여 만들어지는 프레임으로서 독립적으로 인코딩된 프레임에 해당하지 않는다. 이와 같은 B 프레임은 I, P 프레임에 비해 높은 압축률을 가지고 있다. On the other hand, in the case of a B frame, it is a frame created by forward and backward prediction with reference to previous and subsequent frames, and does not correspond to an independently encoded frame. Such a B frame has a higher compression ratio than I and P frames.

따라서, 상기 독립적으로 인코딩된 프레임은 I 프레임에 해당하고, 비독립적으로 인 코딩된 프레임은 나머지 B 프레임 혹은 P 프레임에 해당할 수 있다. 상기 B, P 프레임은 참조프레임에 해당하고, 바람직하게는, 상기 객체영역검출부(2000)는 이와 같은 참조프레임에 대하여 객체영역검출을 수행한다.Accordingly, the independently encoded frame may correspond to an I frame, and the non-independently encoded frame may correspond to the remaining B frames or P frames. The B and P frames correspond to reference frames, and preferably, the object region detection unit 2000 performs object region detection on these reference frames.

도 12는 본 발명의 일 실시예에 따른 컴퓨팅장치의 내부 구성을 개략적으로 도시한다.12 schematically illustrates the internal configuration of a computing device according to an embodiment of the present invention.

상술한 도 1에 도시된 객체영역검출부는 상기 도 12에 도시된 컴퓨팅장치(11000)의 구성요소들을 포함할 수 있다.The object area detection unit illustrated in FIG. 1 may include components of the computing device 11000 illustrated in FIG. 12 .

도 12에 도시된 바와 같이, 컴퓨팅장치(11000)는 적어도 하나의 프로세서(processor)(11100), 메모리(memory)(11200), 주변장치 인터페이스(peripheral interface)(11300), 입/출력 서브시스템(I/O subsystem)(11400), 전력 회로(11500) 및 통신 회로(11600)를 적어도 포함할 수 있다. 이때, 컴퓨팅장치(11000)는 도 1에 도시된 객체영역검출부에 해당될 수 있다.As shown in FIG. 12, a computing device 11000 includes at least one processor 11100, a memory 11200, a peripheral interface 11300, an input/output subsystem ( It may include at least an I/O subsystem (11400), a power circuit (11500), and a communication circuit (11600). In this case, the computing device 11000 may correspond to the object area detection unit shown in FIG. 1 .

메모리(11200)는 일례로 고속 랜덤 액세스 메모리(high-speed random access memory), 자기 디스크, 에스램(SRAM), 디램(DRAM), 롬(ROM), 플래시 메모리 또는 비휘발성 메모리를 포함할 수 있다. 메모리(11200)는 컴퓨팅장치(11000)의 동작에 필요한 소프트웨어 모듈, 명령어 집합 또는 그 밖에 다양한 데이터를 포함할 수 있다.The memory 11200 may include, for example, high-speed random access memory, magnetic disk, SRAM, DRAM, ROM, flash memory, or non-volatile memory. . The memory 11200 may include a software module, a command set, or other various data necessary for the operation of the computing device 11000.

이때, 프로세서(11100)나 주변장치 인터페이스(11300) 등의 다른 컴포넌트에서 메모리(11200)에 액세스하는 것은 프로세서(11100)에 의해 제어될 수 있다.In this case, access to the memory 11200 from other components, such as the processor 11100 or the peripheral device interface 11300, may be controlled by the processor 11100.

주변장치 인터페이스(11300)는 컴퓨팅장치(11000)의 입력 및/또는 출력 주변장치를 프로세서(11100) 및 메모리 (11200)에 결합시킬 수 있다. 프로세서(11100)는 메모리(11200)에 저장된 소프트웨어 모듈 또는 명령어 집합을 실행하여 컴퓨팅장치(11000)을 위한 다양한 기능을 수행하고 데이터를 처리할 수 있다.Peripheral interface 11300 may couple input and/or output peripherals of computing device 11000 to processor 11100 and memory 11200 . The processor 11100 may execute various functions for the computing device 11000 and process data by executing software modules or command sets stored in the memory 11200 .

입/출력 서브시스템은 다양한 입/출력 주변장치들을 주변장치 인터페이스(11300)에 결합시킬 수 있다. 예를 들어, 입/출력 서브시스템은 모니터나 키보드, 마우스, 프린터 또는 필요에 따라 터치스크린이나 센서 등의 주변장치를 주변장치 인터페이스(11300)에 결합시키기 위한 컨트롤러를 포함할 수 있다. 다른 측면에 따르면, 입/출력 주변장치들은 입/출력 서브시스템을 거치지 않고 주변장치 인터페이스(11300)에 결합될 수도 있다.The input/output subsystem can couple various input/output peripherals to peripheral interface 11300. For example, the input/output subsystem may include a controller for coupling a peripheral device such as a monitor, keyboard, mouse, printer, or touch screen or sensor to the peripheral device interface 11300 as needed. According to another aspect, input/output peripherals may be coupled to the peripheral interface 11300 without going through the input/output subsystem.

전력 회로(11500)는 단말기의 컴포넌트의 전부 또는 일부로 전력을 공급할 수 있다. 예를 들어 전력 회로(11500)는 전력 관리 시스템, 배터리나 교류(AC) 등과 같은 하나 이상의 전원, 충전 시스템, 전력 실패 감지 회로(power failure detection circuit), 전력 변환기나 인버터, 전력 상태 표시자 또는 전력 생성, 관리, 분배를 위한 임의의 다른 컴포넌트들을 포함할 수 있다.The power circuit 11500 may supply power to all or some of the terminal's components. For example, power circuit 11500 may include a power management system, one or more power sources such as a battery or alternating current (AC), a charging system, a power failure detection circuit, a power converter or inverter, a power status indicator or power It may contain any other components for creation, management and distribution.

통신 회로(11600)는 적어도 하나의 외부 포트를 이용하여 다른 컴퓨팅장치와 통신을 가능하게 할 수 있다.The communication circuit 11600 may enable communication with another computing device using at least one external port.

또는 상술한 바와 같이 필요에 따라 통신 회로(11600)는 RF 회로를 포함하여 전자기 신호(electromagnetic signal)라고도 알려진 RF 신호를 송수신함으로써, 다른 컴퓨팅장치와 통신을 가능하게 할 수도 있다.Alternatively, as described above, the communication circuit 11600 may include an RF circuit and transmit/receive an RF signal, also known as an electromagnetic signal, to enable communication with other computing devices.

이러한 도 12의 실시예는, 컴퓨팅장치(11000)의 일례일 뿐이고, 컴퓨팅장치(11000)는 도 12에 도시된 일부 컴포넌트가 생략되거나, 도 8에 도시되지 않은 추가의 컴포넌트를 더 구비하거나, 2개 이상의 컴포넌트를 결합시키는 구성 또는 배치를 가질 수 있다. 예를 들어, 모바일 환경의 통신 단말을 위한 컴퓨팅장치는 도 12에 도시된 컴포넌트들 외에도, 터치스크린이나 센서 등을 더 포함할 수도 있으며, 통신 회로(11600)에 다양한 통신방식(WiFi, 3G, LTE, Bluetooth, NFC, Zigbee 등)의 RF 통신을 위한 회로가 포함될 수도 있다. 컴퓨팅장치(11000)에 포함 가능한 컴포넌트들은 하나 이상의 신호 처리 또는 어플리케이션에 특화된 집적 회로를 포함하는 하드웨어, 소프트웨어, 또는 하드웨어 및 소프트웨어 양자의 조합으로 구현될 수 있다.The embodiment of FIG. 12 is just one example of the computing device 11000, and the computing device 11000 may omit some components shown in FIG. 12, further include additional components not shown in FIG. 8, or 2 It may have a configuration or arrangement combining two or more components. For example, a computing device for a communication terminal in a mobile environment may further include a touch screen or a sensor in addition to the components shown in FIG. , Bluetooth, NFC, Zigbee, etc.) may include a circuit for RF communication. Components that may be included in the computing device 11000 may be implemented as hardware including one or more signal processing or application-specific integrated circuits, software, or a combination of both hardware and software.

본 발명의 실시예에 따른 방법들은 다양한 컴퓨팅장치를 통하여 수행될 수 있는 프로그램 명령(instruction) 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 특히, 본 실시예에 따른 프로그램은 PC 기반의 프로그램 또는 모바일 단말 전용의 어플리케이션으로 구성될 수 있다. 본 발명이 적용되는 어플리케이션은 파일 배포 시스템이 제공하는 파일을 통해 컴퓨팅장치(11000)에 설치될 수 있다. 일 예로, 파일 배포 시스템은 컴퓨팅장치(11000)의 요청에 따라 상기 파일을 전송하는 파일 전송부(미도시)를 포함할 수 있다.Methods according to embodiments of the present invention may be implemented in the form of program instructions that can be executed through various computing devices and recorded in computer readable media. In particular, the program according to the present embodiment may be composed of a PC-based program or a mobile terminal-specific application. An application to which the present invention is applied may be installed in the computing device 11000 through a file provided by a file distribution system. For example, the file distribution system may include a file transmission unit (not shown) that transmits the file according to a request of the computing device 11000 .

이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPGA(field programmable gate array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 어플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.The device described above may be implemented as a hardware component, a software component, and/or a combination of hardware components and software components. For example, devices and components described in the embodiments may include, for example, a processor, a controller, an arithmetic logic unit (ALU), a digital signal processor, a microcomputer, a field programmable gate array (FPGA) , a programmable logic unit (PLU), microprocessor, or any other device capable of executing and responding to instructions. The processing device may run an operating system (OS) and one or more software applications running on the operating system. A processing device may also access, store, manipulate, process, and generate data in response to execution of software. For convenience of understanding, there are cases in which one processing device is used, but those skilled in the art will understand that the processing device includes a plurality of processing elements and/or a plurality of types of processing elements. It can be seen that it can include. For example, a processing device may include a plurality of processors or a processor and a controller. Other processing configurations are also possible, such as parallel processors.

소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로 (collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨팅장치 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.Software may include a computer program, code, instructions, or a combination of one or more of the foregoing, which configures a processing device to operate as desired or processes independently or collectively. The device can be commanded. Software and/or data may be any tangible machine, component, physical device, virtual equipment, computer storage medium or device, intended to be interpreted by or to provide instructions or data to a processing device. , or may be permanently or temporarily embodied in a transmitted signal wave. Software may be distributed on networked computing devices and stored or executed in a distributed manner. Software and data may be stored on one or more computer readable media.

실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method according to the embodiment may be implemented in the form of program instructions that can be executed through various computer means and recorded on a computer readable medium. The computer readable medium may include program instructions, data files, data structures, etc. alone or in combination. Program commands recorded on the medium may be specially designed and configured for the embodiment or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. - includes hardware devices specially configured to store and execute program instructions, such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of program instructions include high-level language codes that can be executed by a computer using an interpreter, as well as machine language codes such as those produced by a compiler. The hardware devices described above may be configured to operate as one or more software modules to perform the operations of the embodiments, and vice versa.

이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다. 그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.As described above, although the embodiments have been described with limited examples and drawings, those skilled in the art can make various modifications and variations from the above description. For example, the described techniques may be performed in an order different from the method described, and/or components of the described system, structure, device, circuit, etc. may be combined or combined in a different form than the method described, or other components may be used. Or even if it is replaced or substituted by equivalents, appropriate results can be achieved. Therefore, other implementations, other embodiments, and equivalents of the claims are within the scope of the following claims.

Claims (9)

1 이상의 프로세서 및 1 이상의 메모리를 갖는 컴퓨팅시스템에서 수행되는 영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 방법으로서,
프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 대한 정보를 포함하는 비트스트림정보를 수신하는 비트스트림정보수신단계;
복수의 블록 각각에 대하여, 기설정된 N개(N은 2 이상의 자연수)의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 평균값인 제1평균값을 산출하고, 상기 제1평균값이 기설정된 제1임계값을 초과하는 지 여부에 기초하여, 디코딩파라미터값이 노이즈로 판단되는 경우에 상기 제1평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는 제1노이즈제거단계;
제1노이즈제거단계가 수행된 디코딩파라미터값에 기초하여, 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 2 이상에 기초하여 종합파라미터값을 도출하는 종합파라미터값도출단계;
복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 종합파라미터값의 평균값인 제2평균값을 산출하고, 상기 제2평균값이 기설정된 제2임계값을 초과하는 지 여부에 기초하여, 종합파라미터값이 노이즈로 판단되는 경우에 상기 제2평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 2 이상의 디코딩파라미터값을 0으로 변환하는 제2노이즈제거단계; 및
제2노이즈제거단계가 수행된 종합파라미터값에 기초하여, 각각의 프레임에서, 해당 프레임에 포함되는 블록 중 종합파라미터값이 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출하는 객체영역검출단계;를 포함하는, 객체영역을 검출하는 방법.
A method of detecting an object region based on bitstream information of image information performed in a computing system having one or more processors and one or more memories, the method comprising:
A bitstream information receiving step of receiving bitstream information including information about a plurality of decoding parameter values for each of a plurality of blocks included in a corresponding frame in each frame;
For each of a plurality of blocks, a first average value, which is an average value for any one of a plurality of decoding parameter values in a plurality of predetermined N frames (N is a natural number of 2 or more) is calculated, and the first average value is a predetermined If the decoding parameter value is determined to be noise based on whether it exceeds 1 threshold, the corresponding decoding parameter value for the corresponding block is converted to 0 in any one of the N plurality of frames in which the first average value is calculated. A first noise removal step to do;
Comprehensive parameter values for deriving comprehensive parameter values based on at least two of a plurality of decoding parameter values in a plurality of preset N frames for each of a plurality of blocks, based on the decoding parameter values for which the first noise removal step has been performed. derivation step;
For each of a plurality of blocks, a second average value, which is an average value of a plurality of comprehensive parameter values in a plurality of predetermined N frames, is calculated, and based on whether the second average value exceeds a predetermined second threshold value, a second noise removal step of converting two or more decoding parameter values of a corresponding block to 0 in any one of a plurality of N frames in which the second average value is calculated when the comprehensive parameter value is determined to be noise; and
An object region detection step of detecting an object region by clustering blocks in which the comprehensive parameter value exceeds the object threshold among the blocks included in the corresponding frame in each frame based on the comprehensive parameter value on which the second noise removal step is performed. A method for detecting an object area, including;
청구항 1에 있어서,
상기 블록은,
프레임 각각에서 해당 프레임에 포함되는 복수의 매크로블록 혹은 상기 매크로블록을 구성하는 서브블록을 포함하는, 객체영역을 검출하는 방법.
The method of claim 1,
The block is
A method of detecting an object region, wherein each frame includes a plurality of macroblocks included in the corresponding frame or subblocks constituting the macroblocks.
청구항 1에 있어서,
상기 디코딩파라미터값은,
프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 1 이상을 포함하는, 객체영역을 검출하는 방법.
The method of claim 1,
The decoding parameter value is,
A method of detecting an object region, wherein each frame includes at least one of a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for each of a plurality of blocks included in the corresponding frame.
청구항 1에 있어서,
상기 종합파라미터값은,
상기 블록에 대한, 모션벡터값, 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값 중 2 이상의 디코딩파라미터값에 대한 가중평균값인, 객체영역을 검출하는 방법.
The method of claim 1,
The comprehensive parameter value is,
A method for detecting an object region, which is a weighted average value of two or more decoding parameter values among a motion vector value, a data size value, an angle value, a block size value, a residual value, and a quantization parameter value for the block.
청구항 4에 있어서,
상기 종합파라미터값은,
하기의 [식 1]로 결정되는, 객체영역을 검출하는 방법.
[식 1]
Figure pat00019

(여기서 데이터크기값, 각도값, 블록크기값, 레지듀얼값, 양자화파라미터값은 해당 블록에 대한 디코딩파라미터,
Figure pat00020
,
Figure pat00021
,
Figure pat00022
,
Figure pat00023
,
Figure pat00024
는 각각의 디코딩파라미터값에 대한 가중치)
The method of claim 4,
The comprehensive parameter value is,
A method for detecting an object area, determined by the following [Equation 1].
[Equation 1]
Figure pat00019

(Here, the data size value, angle value, block size value, residual value, and quantization parameter value are decoding parameters for the corresponding block,
Figure pat00020
,
Figure pat00021
,
Figure pat00022
,
Figure pat00023
,
Figure pat00024
is the weight for each decoding parameter value)
청구항 1에 있어서,
상기 제1노이즈제거단계는,
상기 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 상기 제1평균값이 해당 디코딩파라미터값에 대해 기설정된 제1임계값을 초과하는 경우에,
상기 기설정된 N개의 복수의 프레임 중 가장 앞선 프레임에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는, 객체영역을 검출하는 방법.
The method of claim 1,
The first noise removal step,
When the first average value for any one of the plurality of decoding parameter values in the predetermined N plurality of frames exceeds the first predetermined threshold value for the corresponding decoding parameter value,
A method of detecting an object region by converting a corresponding decoding parameter value for a corresponding block in the first frame among the plurality of preset N frames to 0.
청구항 1에 있어서,
상기 기설정된 N개의 복수의 프레임은,
노이즈를 제거하고자 하는 특정 프레임을 기준으로, 해당 프레임과 전후로 인접하는 연속된 기설정된 N개의 복수의 프레임이고,
슬라이딩 윈도우 알고리즘에 기반하여, 시간에 따라 흐르는 복수의 프레임별로 단계적으로 설정되는, 객체영역을 검출하는 방법.
The method of claim 1,
The predetermined N plurality of frames,
Based on a specific frame from which noise is to be removed, a plurality of consecutive predetermined N frames adjacent to the corresponding frame in front and back,
Based on a sliding window algorithm, a method for detecting an object region, which is set step by step for each of a plurality of frames flowing according to time.
청구항 1에 있어서,
상기 제2노이즈제거단계는,
상기 기설정된 N개의 복수의 프레임에서 종합파라미터값에 대한 상기 제2평균값이, 종합파라미터값에 대해 기설정된 제2임계값을 초과하는 경우에,
상기 기설정된 N개의 복수의 프레임 중 어느 하나의 프레임에서 해당 블록에 대한 모든 디코딩파라미터값을 0으로 변환하는, 객체영역을 검출하는 방법.
The method of claim 1,
The second noise removal step,
When the second average value of the comprehensive parameter values in the preset N plurality of frames exceeds the second threshold value preset for the comprehensive parameter values,
A method of detecting an object region by converting all decoding parameter values for a corresponding block in any one of the predetermined N frames to 0.
영상정보의 비트스트림정보에 기반하여 객체영역을 검출하는 시스템으로서,
프레임 각각에서 해당 프레임에 포함되는 복수의 블록 각각에 대한 복수의 디코딩파라미터값에 대한 정보를 포함하는 비트스트림정보를 수신하는 비트스트림정보수신부;
복수의 블록 각각에 대하여, 기설정된 N개(N은 2 이상의 자연수)의 복수의 프레임에서 복수의 디코딩파라미터값 중 어느 하나에 대한 평균값인 제1평균값을 산출하고, 상기 제1평균값이 기설정된 제1임계값을 초과하는 지 여부에 기초하여, 디코딩파라미터값이 노이즈로 판단되는 경우에 상기 제1평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 해당 디코딩파라미터값을 0으로 변환하는 제1노이즈제거부;
제1노이즈제거단계가 수행된 디코딩파라미터값에 기초하여, 복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 디코딩파라미터값 중 2 이상에 기초하여 종합파라미터값을 도출하는 종합파라미터값도출부;
복수의 블록 각각에 대하여, 기설정된 N개의 복수의 프레임에서 복수의 종합파라미터값의 평균값인 제2평균값을 산출하고, 상기 제2평균값이 기설정된 제2임계값을 초과하는 지 여부에 기초하여, 종합파라미터값이 노이즈로 판단되는 경우에 상기 제2평균값이 산출된 N개의 복수의 프레임 중 어느 하나에서 해당 블록에 대한 2 이상의 디코딩파라미터값을 0으로 변환하는 제2노이즈제거부; 및
제2노이즈제거단계가 수행된 종합파라미터값에 기초하여, 각각의 프레임에서, 해당 프레임에 포함되는 블록 중 종합파라미터값이 객체임계값을 초과하는 블록들을 클러스터링하여 객체영역을 검출하는 객체영역검출부;를 포함하는, 객체영역을 검출하는 시스템.

A system for detecting an object area based on bitstream information of image information,
a bitstream information receiving unit for receiving bitstream information including information about a plurality of decoding parameter values for each of a plurality of blocks included in a corresponding frame in each frame;
For each of a plurality of blocks, a first average value, which is an average value for any one of a plurality of decoding parameter values in a plurality of predetermined N frames (N is a natural number of 2 or more) is calculated, and the first average value is a predetermined If the decoding parameter value is determined to be noise based on whether it exceeds 1 threshold, the corresponding decoding parameter value for the corresponding block is converted to 0 in any one of the N plurality of frames in which the first average value is calculated. a first noise removal unit to;
Comprehensive parameter values for deriving comprehensive parameter values based on at least two of a plurality of decoding parameter values in a plurality of preset N frames for each of a plurality of blocks, based on the decoding parameter values for which the first noise removal step has been performed. extraction unit;
For each of a plurality of blocks, a second average value, which is an average value of a plurality of comprehensive parameter values in a plurality of predetermined N frames, is calculated, and based on whether the second average value exceeds a predetermined second threshold value, a second noise removal unit for converting two or more decoding parameter values of a corresponding block to 0 in any one of a plurality of N frames in which the second average value is calculated when the comprehensive parameter value is determined to be noise; and
an object region detection unit for detecting an object region by clustering blocks in which the comprehensive parameter value exceeds an object threshold among blocks included in the corresponding frame in each frame based on the comprehensive parameter value on which the second noise removal step is performed; Including, the system for detecting the object area.

KR1020220115556A 2021-09-15 2022-09-14 Method and system for detecting an object region based on bitstream information of image information KR20230040285A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020210123481 2021-09-15
KR20210123481 2021-09-15

Publications (1)

Publication Number Publication Date
KR20230040285A true KR20230040285A (en) 2023-03-22

Family

ID=86005753

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020220115560A KR20230040287A (en) 2021-09-15 2022-09-14 Method and system for detecting an object falling based on bitstream information of image information
KR1020220115556A KR20230040285A (en) 2021-09-15 2022-09-14 Method and system for detecting an object region based on bitstream information of image information
KR1020220115557A KR20230040286A (en) 2021-09-15 2022-09-14 Method and system for detecting an object throwing based on bitstream information of image information

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020220115560A KR20230040287A (en) 2021-09-15 2022-09-14 Method and system for detecting an object falling based on bitstream information of image information

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220115557A KR20230040286A (en) 2021-09-15 2022-09-14 Method and system for detecting an object throwing based on bitstream information of image information

Country Status (1)

Country Link
KR (3) KR20230040287A (en)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100018734A (en) 2008-08-07 2010-02-18 주식회사 만도 Method and apparatus for discriminating dangerous object in dead zone by using image processing

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100018734A (en) 2008-08-07 2010-02-18 주식회사 만도 Method and apparatus for discriminating dangerous object in dead zone by using image processing

Also Published As

Publication number Publication date
KR20230040286A (en) 2023-03-22
KR20230040287A (en) 2023-03-22

Similar Documents

Publication Publication Date Title
VR An enhanced coding algorithm for efficient video coding
US10349060B2 (en) Encoding video frames using generated region of interest maps
CN111670580B (en) Progressive compressed domain computer vision and deep learning system
KR102261669B1 (en) Artificial Neural Network Based Object Region Detection Method, Device and Computer Program Thereof
Abbasi Aghamaleki et al. Malicious inter-frame video tampering detection in MPEG videos using time and spatial domain analysis of quantization effects
CN114363623A (en) Image processing method, image processing apparatus, image processing medium, and electronic device
KR101149522B1 (en) Apparatus and method for detecting scene change
US9712828B2 (en) Foreground motion detection in compressed video data
JP5713797B2 (en) Video surveillance device
Jiang et al. Detection of double compressed HEVC videos using GOP-based PU type statistics
Wang et al. End-to-end compression towards machine vision: Network architecture design and optimization
Chakraborty et al. MAGIC: Machine-learning-guided image compression for vision applications in Internet of Things
Shen et al. A novel method for lossless compression of arbitrarily shaped regions of interest in hyperspectral imagery
KR102132335B1 (en) Object Region Detection Method, Device and Computer Program Thereof
Xia et al. Visual sensitivity-based low-bit-rate image compression algorithm
KR102345258B1 (en) Object Region Detection Method, Device and Computer Program Thereof
KR20230040285A (en) Method and system for detecting an object region based on bitstream information of image information
Panagidi et al. Optimal Grouping-of-Pictures in IoT video streams
KR102530635B1 (en) Object Region Detection Method, Device and Computer Program For Traffic Information and Pedestrian Information Thereof
KR102557904B1 (en) The Method of Detecting Section in which a Movement Frame Exists
KR102592089B1 (en) Moving Frame Detecting Method, Device and Computer Program Thereof
JP2014158164A (en) Image encoder
Nami et al. Lightweight Multitask Learning for Robust JND Prediction using Latent Space and Reconstructed Frames
Beniwal et al. Assessing the impact of video compression on background subtraction
US20240013426A1 (en) Image processing system and method for image processing