KR101076272B1 - Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof - Google Patents

Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof Download PDF

Info

Publication number
KR101076272B1
KR101076272B1 KR1020100001560A KR20100001560A KR101076272B1 KR 101076272 B1 KR101076272 B1 KR 101076272B1 KR 1020100001560 A KR1020100001560 A KR 1020100001560A KR 20100001560 A KR20100001560 A KR 20100001560A KR 101076272 B1 KR101076272 B1 KR 101076272B1
Authority
KR
South Korea
Prior art keywords
sad
roi
interest
region
width
Prior art date
Application number
KR1020100001560A
Other languages
Korean (ko)
Other versions
KR20110081413A (en
Inventor
박현욱
전동산
정천성
김동윤
하정석
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020100001560A priority Critical patent/KR101076272B1/en
Publication of KR20110081413A publication Critical patent/KR20110081413A/en
Application granted granted Critical
Publication of KR101076272B1 publication Critical patent/KR101076272B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/395Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

본 발명은 분산 비디오 코딩(distributed video coding) 및 영상에서 관심영역을 추출하는 기술에 관한 것이다.
본 발명에 따른 분산 비디오 코딩(distributed video coding, DVC)을 위한 전체영상 단위 관심영역(region of interest, ROI) 추출방법은 MAD(mean absolute difference) 맵을 생성하는 단계, MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.
본 발명에 의하면, 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감할 수 있다.
The present invention relates to distributed video coding and a technique for extracting a region of interest from an image.
According to the present invention, a method for extracting a region of interest (ROI) for distributed video coding (DVC) may include generating a mean absolute difference (MAD) map, and using SAD (MAD map). sum of absolute difference) generating a distribution chart and determining a region of interest using the SAD distribution chart.
According to the present invention, it is possible to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.

Description

분산 비디오 코딩을 위한 픽셀 도메인 기반의 관심영역 추출방법 및 컴퓨터 판독가능 매체{METHOD FOR EXTRACTING REGION OF INTEREST BASED ON PIXEL DOMAIN FOR DISTRIBUTED VIDEO CODING AND COMPUTER READABLE MEDIUM THEREOF}FIELD OF EXTRACTING REGION OF INTEREST BASED ON PIXEL DOMAIN FOR DISTRIBUTED VIDEO CODING AND COMPUTER READABLE MEDIUM THEREOF}

본 발명은 분산 비디오 코딩(distributed video coding) 및 영상에서 관심영역을 추출하는 기술에 관한 것이다.The present invention relates to distributed video coding and a technique for extracting a region of interest from an image.

현재 비디오 표준 압축기술인 MPEG과 H.26x 기술들은 압축률을 높이기 위해 연속적인 프레임의 상관성을 이용하여 프레임 간의 예측부호기술(inter-frame predictive coding)을 사용한다. 이 기술에서 사용하는 움직임 예측 (motion estimation)으로 인해, 일반적으로 부호기의 복잡도가 복호기의 복잡도보다 5배에서 10배 정도 높다. 이런 비대칭 비디오 구조는 한 번 압축하고 여러 번 복호하는 방송용 시스템이나 주문형 비디오 시스템 (video on demand)에 적합하다.MPEG and H.26x technologies, which are the current video standard compression techniques, use inter-frame predictive coding using continuous frame correlation to increase the compression rate. Due to the motion estimation used in this technique, the complexity of the encoder is generally about 5 to 10 times higher than the complexity of the decoder. This asymmetric video structure is well suited for broadcast systems or video on demand that compress once and decode multiple times.

그러나 최근 요구되는 비디오 응용 제품인 무선 감시 비디오 센서, 무선 PC 카메라, 휴대용 단말기의 카메라, 일회용 비디오 카메라와 같은 응용 제품들은 메모리와 전력이 제한되어 있고, 계산 능력의 한계 등으로 인해 비디오 부호화를 할 때 높은 복잡도의 알고리즘을 수행하기 어렵다.However, recently demanded video applications, such as wireless surveillance video sensors, wireless PC cameras, portable terminal cameras, and disposable video cameras, have limited memory and power and have high computational limitations due to limitations in computing power. It is difficult to perform algorithms of complexity.

따라서 새로운 응용 분야의 제품들은 기존의 비디오 부호 방식인 예측부호기술이 아니라, 낮은 복잡도로 비디오 부호화 할 수 있는 새로운 개념의 비디오 부호화 기술이 필요했다. 최근 분산 비디오 코딩(distributed video coding, DVC)이 새로운 응용 분야에 적합한 비디오 부호화 기술로 주목을 받고 있다.Therefore, new application products needed a new concept of video encoding technology that can encode video with low complexity, not predictive coding technology which is a conventional video coding method. Recently, distributed video coding (DVC) has attracted attention as a video coding technology suitable for new applications.

지난 수년간 분산 비디오 코딩은 1970년대에 발표된 두 개의 정보 이론을 근거로 연구되고 있다. 그 중 하나는 1973년 발표된 Slepian-Wolf 정리로 상관성이 있는 소스 X와 Y를 독립적으로 각각 부호화 하여도 결합 복호화를 한다면, 두 소스를 결합 부호화 한 것과 같은 압축 효율을 얻을 수 있는 것을 말한다. Slepian- Wolf 부호는 분산 소스 코딩을 의미하고, 무손실 압축이다. 다른 하나는 1976년에 발표된 Wyner-Ziv 정리로 Slepian-Wolf 부호를 확장하여 복호기에서 보조정보(side information, SI)를 이용할 때, 손실 압축의 이론적 경계를 제시하였다.Over the years, distributed video coding has been studied based on two information theories published in the 1970s. One of them is the Slepian-Wolf theorem, which was released in 1973, and it is possible to achieve the same compression efficiency as the joint coding of two sources if the joint decoding is performed even if the correlated sources X and Y are independently encoded. Slepian-Wolf code means distributed source coding and is lossless compression. The other is the Wyner-Ziv theorem, published in 1976, which extends the Slepian-Wolf code to provide the theoretical boundary of lossy compression when using side information (SI) in the decoder.

이러한 분산 소스 코딩을 이용하여 영상 프레임을 독립적으로 부호화하면, 움직임 보상(motion compensation) 및 움직임 예측과 같은 프레임 사이의 통계적 의존성을 계산하는 것과 같이 복잡도가 높은 처리과정 없이 압축이 가능하여 부호기의 복잡도를 낮출 수 있다. 뿐만 아니라 현재 분산 비디오 코딩은 MPEG과 같은 기존의 인트라(intra) 코딩과 가까운 성능을 얻을 수 있다.When the image frames are independently encoded using this distributed source coding, the complexity of the encoder can be reduced by compressing without complicated processing such as calculating statistical dependencies between frames such as motion compensation and motion prediction. Can be lowered. In addition, current distributed video coding can achieve performance close to conventional intra coding such as MPEG.

2002년에 분산 비디오 코딩의 실제적인 설계 구조인 Wyner-Ziv(WZ) 비디오가 발표되면서 분산 비디오 코딩이 현재까지 광범위하게 연구되고 있다. WZ 비디오 부호의 큰 장점은 부호기에서 복잡하게 수행되던 프레임 간의 예측부호기술을 사용하지 않고, 각 프레임을 서로 독립적으로 압축하여 부호기의 복잡도를 낮춘 것이다.In 2002, Wyner-Ziv (WZ) video, the actual design structure of distributed video coding, was released and distributed video coding has been extensively studied. The great advantage of WZ video coding is that the complexity of the encoder is reduced by compressing each frame independently of each other without using the inter-frame predictive coding technique that was complicatedly performed in the encoder.

그러나 부호기의 복잡도가 줄어든 만큼 복호기의 복잡도는 증가했다. 즉, 프레임간의 보조정보를 생성하는데 복호기가 사용되어 복호기의 복잡도가 증가하였다.However, the complexity of the decoder increased as the complexity of the encoder decreased. That is, a decoder is used to generate auxiliary information between frames, thereby increasing the complexity of the decoder.

분산 비디오 코딩의 복호기의 복잡도를 줄이기 위해서는 복호화 자체의 복잡도를 줄이거나 피드백 채널로 인해 발생되는 복호 지연 문제를 해결해야 한다. 후자의 방법으로 부호기에서 WZ 프레임의 적절한 비트율을 추정하여 압축하는 부호기 제어 방법과 부호기와 복호기에서 비트율 추정이 진행되는 이종 제어 방법이 있다. 그러나 이 방법들은 피드백으로 인해 발생되는 복호 지연 문제만 다루고 있고, 부호기 및 복호기의 직접적인 복잡도를 줄이는 알고리즘은 없다.To reduce the complexity of the decoder of distributed video coding, it is necessary to reduce the complexity of the decoding itself or solve the decoding delay problem caused by the feedback channel. As the latter method, there are an encoder control method for estimating and compressing an appropriate bit rate of a WZ frame at an encoder and a heterogeneous control method for bit rate estimation at an encoder and a decoder. However, these methods deal only with the decoding delay problem caused by feedback, and there is no algorithm which reduces the direct complexity of the encoder and decoder.

본 발명에서는 낮은 분산 비디오 코딩의 복잡도를 줄이기 위한 알고리즘을 제안한다. WZ 프레임에서 관심영역(region of interest, ROI)을 추출하여 선택적으로 부호화하는 알고리즘을 제안한다.The present invention proposes an algorithm for reducing the complexity of low distributed video coding. We propose an algorithm that selectively extracts regions of interest (ROI) from WZ frames and selectively encodes them.

WZ 프레임 내에는 영상의 배경과 같이 움직임의 변화가 적은 영역이 있고, 물체 또는 사람과 같이 움직임의 변화가 많은 영역이 있다. 따라서 WZ 프레임 전체를 부호화하는 것이 아니라, WZ 프레임에서 움직임이 많이 일어났거나 움직임의 변화가 심한 영역을 관심영역으로 정의하여, 관심영역에 대해 부호화를 선택적으로 한다. 이를 통해 WZ 프레임의 비트율이 절감되고, 왜곡율(rate distortion)도 감소하며, 부호기 및 복호기의 복잡도를 낮춘다.In the WZ frame, there is an area where the change of movement is small, such as the background of an image, and there is an area where the change of movement is large, such as an object or a person. Therefore, instead of encoding the entire WZ frame, an encoding region is selectively selected for the region of interest by defining a region of interest in which a lot of motion or a change of movement is severe in the WZ frame. This reduces the bit rate of the WZ frame, reduces the rate distortion, and reduces the complexity of the encoder and decoder.

본 발명은 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감하는 것을 목적으로 한다.An object of the present invention is to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.

본 발명에 따른 영상의 관심영역(region of interest, ROI)을 추출하는 방법은 영상에 대한 MAD(mean absolute difference) 맵을 생성하는 단계, MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A method of extracting a region of interest (ROI) of an image according to the present invention includes generating a mean absolute difference (MAD) map of an image, and generating a SAD (sum of absolute difference) distribution map using the MAD map. And determining a region of interest using the SAD distribution chart.

MAD 맵은 이전 키프레임(key frame)과 다음 키프레임의 절대값 차이의 평균값을 이용하여 생성하고, MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하는 것이 바람직하다.MAD map is generated by using the average value of absolute difference between previous key frame and next key frame, and each pixel included in MAD map and key frame has height position information and width position information. It is preferable to include.

SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고, 수직 SAD 분포도는 소정의 너비위치에서 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 더하여 생성하고, 수평 SAD 분포도는 소정의 높이위치에서 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 수평 방향으로 더하여 생성하는 것이 바람직하다.The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart. A vertical SAD distribution chart is generated by adding MAD values of each pixel included in the MAD map at a predetermined width position, and the horizontal SAD distribution chart is a MAD map at a predetermined height position. It is preferable to generate the MAD value included in each pixel included in the horizontal direction.

관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고, 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고, 관심영역의 높이위치정보는 관심영역의 높이에 속하는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고, 관심영역의 너비위치정보는 관심영역의 너비에 속하는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는 것이 바람직하다.The ROI is a rectangle having a height smaller than the height of the entire image and a width smaller than the width of the entire image. Each pixel included in the ROI includes height position information and width position information, and height position information of the ROI. Indicates the height position of the ROI where the sum of the horizontal SAD values belonging to the height of the ROI is the largest, and the width position information of the ROI is the position where the sum of the vertical SAD values belonging to the width of the ROI is the largest. It is preferable to indicate the width position of the region of interest.

관심영역의 높이위치정보는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고, 관심영역의 너비위치정보는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는 것이 바람직하다.The height location information of the ROI includes height location information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest, and the width location information of the ROI is the location where the sum of the vertical SAD values is the largest. It is preferable to include height position information of the leftmost pixel of the ROI.

본 발명에 따른 영상에 대한 관심영역(ROI) 추출방법은 ARM(absolute residual map)을 생성하는 단계, ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A method of extracting a region of interest (ROI) for an image according to the present invention includes generating an absolute residual map (ARM), generating a sum of absolute difference (SAD) distribution using the ARM, and using the SAD distribution map. Determining a step.

ARM은 이전 키프레임과 다음 키프레임의 절대값 차이를 이용하여 생성하고, ARM 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는 것이 바람직하다.The ARM is generated using the absolute difference between the previous keyframe and the next keyframe, and each pixel included in the ARM and the keyframe preferably includes height position information and width position information.

SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고, 수직 SAD 분포도는 소정의 너비위치에서 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하고, 수평 SAD 분포도는 소정의 높이위치에서 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하는 것이 바람직하다.The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart. A vertical SAD distribution chart is generated by adding ARM values of each pixel included in the ARM at a predetermined width position, and the horizontal SAD distribution chart is included in the ARM at a predetermined height position. It is preferable to generate by adding the ARM value of each pixel.

관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고, 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고, 관심영역의 높이위치정보는 관심영역의 높이에 속하는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고, 관심영역의 너비위치정보는 관심영역의 너비에 속하는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는 것이 바람직하다.The ROI is a rectangle having a height smaller than the height of the entire image and a width smaller than the width of the entire image. Each pixel included in the ROI includes height position information and width position information, and height position information of the ROI. Indicates the height position of the ROI where the sum of the horizontal SAD values belonging to the height of the ROI is the largest, and the width position information of the ROI is the position where the sum of the vertical SAD values belonging to the width of the ROI is the largest. It is preferable to indicate the width position of the region of interest.

관심영역의 높이위치정보는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고, 관심영역의 너비위치정보는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는 것이 바람직하다.
The height location information of the ROI includes height location information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest, and the width location information of the ROI is the location where the sum of the vertical SAD values is the largest. It is preferable to include height position information of the leftmost pixel of the ROI.

본 발명에 따른 영상에 대한 관심영역(ROI) 추출방법은 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계, 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계 및 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함한다.A method of extracting a region of interest (ROI) for an image according to the present invention includes dividing an image into M blocks (where M is an integer), calculating a block SAD (sum of absolute difference) of each block, and a block SAD value. Selecting a region of interest block using;

블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 블록의 높이 및 너비로 더하여 구하고, 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는 것이 바람직하다.The block SAD obtains the difference between the previous key frame and the next key frame by adding the height and width of the block, and preferably, each pixel included in the block SAD and the key frame includes the height position information and the width position information. .

관심영역 블록은 블록 SAD 값이 큰 순서대로 N 개(1< N ≤M, N은 정수)를 선택하는 것이 바람직하다.The region of interest block is preferably selected from N (1 <N ≤ M, N is an integer) in order of increasing block SAD value.

본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상의 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 MAD 맵을 생성하는 단계, MAD 맵을 이용하여 SAD 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, extracting a region of interest (ROI) of an image, comprises: generating a MAD map, using a SAD map Generating a distribution chart and determining a region of interest using the SAD distribution map.

본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 ARM을 생성하는 단계, ARM을 이용하여 SAD 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium for extracting a region of interest (ROI) for an image comprises: generating an ARM, a SAD distribution diagram using the ARM And generating a region of interest using the SAD distribution map.

본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계, 각 블록의 블록 SAD를 계산하는 단계 및 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고, 상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고, 상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium for extracting a region of interest (ROI) for an image comprises M blocks (where M is an integer). Dividing, calculating a block SAD of each block, and selecting a region of interest block using a block SAD value, wherein the block SAD takes an absolute value of a difference between a previous key frame and a next key frame. Each pixel included in the block SAD and the key frame includes height position information and width position information.

본 발명에 의하면, 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감할 수 있다.According to the present invention, it is possible to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.

도 1은 본 발명의 일 실시예에 따른 분산 비디오 코딩에서 관심영역 추출방법을 나타내는 도면이다.
도 2a는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법에 사용된 영상(200)을 나타내는 도면이다.
도 2b는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법을 나타내는 순서도이다.
도 3a는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수직 SAD 분포도를 나타내는 도면이다.
도 3b는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수평 SAD 분포도를 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법을 사용하여 홀 모니터 영상에 대해서 관심영역을 추출한 결과를 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 프레임 단위 관심영역 추출방법을 나타내는 순서도이다.
도 6a는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하는 영상을 나타낸 도면이다.
도 6b는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 나타내는 순서도이다.
도 6c는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하여 관심영역을 추출한 결과를 나타내는 도면이다.
1 is a diagram illustrating a region of interest extraction method in distributed video coding according to an embodiment of the present invention.
2A is a diagram illustrating an image 200 used in a method for extracting an entire region of interest unit of interest according to an embodiment of the present invention.
2B is a flowchart illustrating a method of extracting an entire region of interest unit of interest according to an embodiment of the present invention.
3A is a diagram illustrating a vertical SAD distribution diagram of an image 200 used in an ROI extraction method of an entire image unit according to an embodiment of the present invention.
3B is a diagram illustrating a horizontal SAD distribution diagram of an image 200 used in an ROI extraction method of an entire image unit according to an exemplary embodiment.
FIG. 4 is a diagram illustrating a result of extracting a region of interest with respect to a hall monitor image by using a method of extracting a region of interest in an entire image unit according to an embodiment of the present invention.
5 is a flowchart illustrating a method of extracting a region of interest region per frame according to an embodiment of the present invention.
FIG. 6A is a diagram illustrating an image using a method of extracting a block of interest region according to an embodiment of the present invention. FIG.
6B is a flowchart illustrating a method of extracting an ROI in a block unit according to an embodiment of the present invention.
FIG. 6C is a diagram illustrating a result of extracting a region of interest using a block-based region of interest extraction method according to an embodiment of the present invention. FIG.

이하, 본 발명의 바람직한 실시예의 상세한 설명이 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 인용부호들 및 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 인용부호들로 나타내고 있음에 유의해야 한다.DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, detailed descriptions of preferred embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that reference numerals and like elements among the drawings are denoted by the same reference numerals as much as possible even though they are shown in different drawings.

본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
In describing the present invention, when it is determined that the detailed description of the related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.

관심영역 추출을 통한 분산 비디오 코딩(Distributed Video Coding Using Region Extraction distributeddistributed videovideo codingcoding , , DVCDVC ))

도 1은 본 발명의 일 실시예에 따른 분산 비디오 코딩에서 관심영역 추출방법을 나타내는 도면이다.1 is a diagram illustrating a region of interest extraction method in distributed video coding according to an embodiment of the present invention.

픽셀 도메인 분산 비디오 코딩의 부호화하는 과정을 보면, 기존의 분산 비디오 코딩과 같이 프레임 영상을 홀수 프레임과 짝수 프레임으로 분류하여 각각을 키프레임(

Figure 112010001132518-pat00001
)과 Wyner-Ziv(WZ) 프레임(
Figure 112010001132518-pat00002
)으로 나누어 처리한다. 여기서 홀수 프레임과 짝수 프레임의 구별은 프레임 카운팅을 시작하는 시간 색인을 0으로 할 것인지, 1로 할 것인지에 따라 구별되며, 이하 본 발명의 명세서에서는 프레임 카운팅을 시작하는 색인을 1로 하여 설명할 것이며, 따라서 키프레임의 시간 색인은 홀수가 되고, WZ 프레임의 시간 색인은 짝수가 된다. 키프레임의 시간 색인이 짝수가 되고, WZ 프레임의 시간 색인이 홀수가 될 수도 있다.키프레임과 WZ 프레임은 서로 독립적으로 부호화되며, H.264 인트라 인코더(intra encoder, 101)는 키프레임을 H.264 인트라 부호화를 한다.In the encoding process of pixel domain distributed video coding, as in the conventional distributed video coding, a frame image is classified into odd frames and even frames, and each of them is keyframe (
Figure 112010001132518-pat00001
) And Wyner-Ziv (WZ) frames (
Figure 112010001132518-pat00002
Divided by) Here, the distinction between the odd frame and the even frame is distinguished according to whether the time index for starting frame counting is 0 or 1, and in the following specification, the index for starting frame counting will be described as 1, Therefore, the temporal index of the keyframe becomes odd, and the temporal index of the WZ frame becomes even. The temporal indexes of the keyframes may be even, and the temporal indexes of the WZ frames may be odd. The keyframes and the WZ frames are encoded independently of each other, and the H.264 intra encoder 101 encodes the keyframes in H. Perform .264 intra coding.

관심영역 추출부(102)는 WZ 프레임을 부호화하기 위해 관심영역(

Figure 112010001132518-pat00003
)을 추출하여, 추출된 관심영역(
Figure 112010001132518-pat00004
)을 부호화부(103)에 전달한다. 관심영역(
Figure 112010001132518-pat00005
)을 추출하는 구체적인 방법은 아래에서 설명한다.The ROI extractor 102 may encode an ROI in order to encode a WZ frame.
Figure 112010001132518-pat00003
), The extracted ROI (
Figure 112010001132518-pat00004
) Is transmitted to the encoder 103. Area of interest (
Figure 112010001132518-pat00005
The specific method of extracting a) is described below.

부호화부(103)는 추출된 관심영역(

Figure 112010001132518-pat00006
)만을 부호화하여 압축한다.The encoder 103 extracts the extracted ROI (
Figure 112010001132518-pat00006
) Is encoded and compressed.

픽셀 도메인 분산 비디오 코딩의 복호화하는 과정을 보면, H.264 인트라 디코더(104)가 H.264 인트라 복호를 수행하고, 복호된 키프레임(

Figure 112010001132518-pat00007
,
Figure 112010001132518-pat00008
)을 보조정보 생성부(105)로 전달한다.In the decoding process of the pixel domain distributed video coding, the H.264 intra decoder 104 performs H.264 intra decoding, and the decoded keyframe (
Figure 112010001132518-pat00007
,
Figure 112010001132518-pat00008
) Is transmitted to the auxiliary information generator 105.

보조정보 생성부(105)는 복호된 키프레임(

Figure 112010001132518-pat00009
,
Figure 112010001132518-pat00010
)을 이용하여 WZ 프레임과 닮은 보조정보(
Figure 112010001132518-pat00011
)를 생성하게 된다.The auxiliary information generating unit 105 is a decoded key frame (
Figure 112010001132518-pat00009
,
Figure 112010001132518-pat00010
), Which is similar to the WZ frame,
Figure 112010001132518-pat00011
Will be generated.

복호화부(106)는 보조정보 생성부(105)에서 생성된 보조정보(

Figure 112010001132518-pat00012
) 및 부호화부(103)에서 얻어진 WZ 프레임의 압축된 정보(
Figure 112010001132518-pat00013
)를 이용하여 WZ 프레임의 비트 스트림(
Figure 112010001132518-pat00014
)을 생성 된다.The decoding unit 106 generates the auxiliary information generated by the auxiliary information generating unit 105 (
Figure 112010001132518-pat00012
) And the compressed information of the WZ frame obtained by the encoder 103 (
Figure 112010001132518-pat00013
), The bit stream of the WZ frame (
Figure 112010001132518-pat00014
Is generated.

마지막 단계로 재구성부(107)는 비트 스트림(

Figure 112010001132518-pat00015
) 및 보조정보(
Figure 112010001132518-pat00016
)를 이용하여 최종적으로 WZ 프레임(
Figure 112010001132518-pat00017
)을 복원한다.
As a last step, the reconstruction unit 107 performs a bit stream (
Figure 112010001132518-pat00015
) And ancillary information (
Figure 112010001132518-pat00016
) And finally the WZ frame (
Figure 112010001132518-pat00017
Restore).

전체영상 단위 관심영역(Whole video unit of interest regionregion ofof interestinterest , , ROIROI ) 추출방법) Extraction Method

도 2a는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법에 사용된 영상(200)을 나타내는 도면이다.2A is a diagram illustrating an image 200 used in a method for extracting an entire region of interest unit of interest according to an embodiment of the present invention.

영상(200)은 홀 모니터(hall monitor) 영상이며, 영상(200)은 복도 중앙 영역에 위치한 두 명의 사람(201,202), 복도 양쪽의 벽(205, 206) 및 세 개의 출입문(203, 204, 207)을 포함한다.Image 200 is a hall monitor image, which is two people 201 and 202 located in the center area of the corridor, walls 205 and 206 on both sides of the corridor, and three doors 203, 204 and 207. ).

일반적으로 홀 모니터 영상에서 관심영역을 추출할 경우 움직임(motion)이 많은 복도 중앙 영역을 관심영역으로 추출하는 것이 바람직하다. 그러나 이것은 직관적인 결과이고, 이하 체계적인 방법으로 관심영역을 찾는 방법을 설명한다.In general, when the ROI is extracted from the hall monitor image, it is preferable to extract the center area of the corridor with a lot of motion as the ROI. However, this is an intuitive result and the following describes how to find a region of interest in a systematic manner.

도 2b는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법을 나타내는 순서도이다.2B is a flowchart illustrating a method of extracting an entire region of interest unit of interest according to an embodiment of the present invention.

전체영상 단위 관심영역 추출방법은 Wyner-Ziv(WZ) 프레임을 부호화하기 전에 영상(200) 전체에 대해서 관심영역을 추출하는 방법을 말한다. 전체영상 단위 관심영역 추출 방법은 다음과 같은 절차로 수행된다.The entire image unit ROI extraction method refers to a method of extracting an ROI for the entire image 200 before encoding a Wyner-Ziv (WZ) frame. The method of extracting the whole image unit of interest region is performed by the following procedure.

먼저 전체영상의 프레임들 사이에 MAD(mean absolute difference) 맵을 생성한다(S201).First, a MAD (mean absolute difference) map is generated between frames of the entire image (S201).

그 후 생성된 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성한다(S202).Thereafter, a SAD distribution is generated using the generated MAD map (S202).

그 후 생성된 SAD 분포도를 이용하여 관심영역을 결정한다(S203).After that, the region of interest is determined using the generated SAD distribution (S203).

이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.

MADMAD (( meanmean absoluteabsolute differencedifference )맵 생성Create map

MAD(mean absolute difference)는 절대값 차이의 평균값을 의미한다.Mean absolute difference (MAD) means the average value of absolute differences.

MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하며, MAD 맵은 전체영상의 이전 키프레임(key frame)과 다음 키프레임과의 절대값 차이의 평균값을 이용하여 구한다.Each pixel in the MAD map and keyframe contains height and width location information, and the MAD map is the absolute difference between the previous keyframe and the next keyframe of the entire image. Calculate using the average value of.

아래 수식(1)과 같이 키프레임들의 절대값의 차를 구하고, 이를 모두 더하여 평균을 구한다.As shown in Equation (1) below, the difference between the absolute values of the key frames is obtained and the sum is added to find the average.

Figure 112010001132518-pat00018
Figure 112010001132518-pat00018

Figure 112010001132518-pat00019
...(1)
Figure 112010001132518-pat00019
...(One)

여기서

Figure 112010001132518-pat00020
은 시간 색인이 2n-1 번째인 키프레임을 의미하고,
Figure 112010001132518-pat00021
는 2n-1 번째 프레임의 높이위치정보인 x, 너비위치정보인 y인
Figure 112010001132518-pat00022
위치의 픽셀 값을 의미한다. 그리고 N은 전체 키프레임의 개수를 의미하고,
Figure 112010001132518-pat00023
는 각각 프레임의 높이(height)와 너비(width)를 의미한다.here
Figure 112010001132518-pat00020
Means a keyframe with a time index of 2n-1th,
Figure 112010001132518-pat00021
X is the height position information of the 2n-1th frame and y is the width position information
Figure 112010001132518-pat00022
The pixel value of the position. And N is the total number of keyframes,
Figure 112010001132518-pat00023
Are the height and width of the frame, respectively.

수식(1)을 통해서 구한

Figure 112010001132518-pat00024
을 높이위치정보(x), 너비위치정보인 (y)로 2차원 맵(map)으로 나타낸 것이 MAD 맵이다.
Obtained by Equation (1)
Figure 112010001132518-pat00024
MAD map is represented by height position information (x) and width position information (y) as two-dimensional maps.

SADSAD 분포도 생성 Generate distribution

SAD(sum of absolute difference) 분포도는 절대값의 차이를 합한 값을 일정기준의 위치에 따른 분포 정도를 나타낸다.The SAD (sum of absolute difference) distribution shows the distribution of the sum of the absolute values according to the position of a certain standard.

SAD 분포도는 앞서 MAD 맵을 생성하는 과정에서 구한

Figure 112010001132518-pat00025
를 이용하여 구하며, SAD 분포도는 수직 SAD 분포도와 수평 SAD 분포도가 있다.The SAD distribution map was obtained from the process of generating the MAD map.
Figure 112010001132518-pat00025
The SAD distribution chart has a vertical SAD distribution and a horizontal SAD distribution.

도 3a는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수직 SAD 분포도를 나타내는 도면이다.3A is a diagram illustrating a vertical SAD distribution diagram of an image 200 used in an ROI extraction method of an entire image unit according to an embodiment of the present invention.

수직 SAD 분포도는 MAD 맵에 포함됨 각 픽셀의 높이위치정보를 수직 방향으로 더하여 생성한다. 즉,

Figure 112010001132518-pat00026
에서 일정기준을 너비(y)로 두고, 특정한 너비(y)에 대응하는 높이(x)값을 수직으로 더한다.The vertical SAD distribution map is generated by adding the height position information of each pixel included in the MAD map in the vertical direction. In other words,
Figure 112010001132518-pat00026
In Figure 3, a certain criterion is defined as width (y), and the height (x) corresponding to a specific width (y) is added vertically.

구체적인 수식은 아래 수식(2.a)와 같다.The specific formula is shown in the following formula (2.a).

Figure 112010001132518-pat00027
...(2.a)
Figure 112010001132518-pat00027
... (2.a)

수직 SAD 분포도를 보면 너비(width, y)가 대략 30 ~ 110 부분의 SAD 값(301)이 주변보다 상대적으로 더 크다. 결국 전체영상에서 너비(width, y)가 30 ~ 110 부분이 관심영역의 너비위치가 될 것이다. 관심영역 너비위치 결정 여부는 아래에서 체계적인 방법으로 관심영역을 찾는 방법으로 설명한다.Looking at the vertical SAD distribution, the width (y) of the SAD value 301 of about 30 to 110 parts is relatively larger than the surroundings. As a result, the width (y) of 30 to 110 of the whole image will be the width position of the ROI. The determination of the location of the ROI is described below by finding the ROI in a systematic manner.

도 3b는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수평 SAD 분포도를 나타내는 도면이다.3B is a diagram illustrating a horizontal SAD distribution diagram of an image 200 used in an ROI extraction method of an entire image unit according to an exemplary embodiment.

수평 SAD 분포도는 MAD 맵에 포함됨 각 픽셀의 너비위치정보를 수평 방향으로 더하여 생성한다. 즉,

Figure 112010001132518-pat00028
에서 일정기준을 높이(x)로 두고, 특정한 높이(x)에 대응하는 너비(y)값을 수평으로 더한다.The horizontal SAD distribution map is created by adding the width position information of each pixel in the horizontal direction. In other words,
Figure 112010001132518-pat00028
Set a certain criterion as height (x) in, and horizontally add the width (y) value corresponding to the specific height (x).

구체적인 수식은 아래 수식(2.b)와 같다.The specific formula is shown in the following formula (2.b).

Figure 112010001132518-pat00029
...(2.b)
Figure 112010001132518-pat00029
... (2.b)

수평 SAD 분포도를 보면 높이(height, x)가 대략 30 ~ 120 부분의 SAD 값(302)이 주변보다 상대적으로 더 크다. 결국 전체영상에서 높이(height, x)가 30 ~ 120 부분이 관심영역의 높이위치가 될 것이다. 관심영역 높이위치 결정 여부는 아래에서 체계적인 방법으로 관심영역을 찾는 방법으로 설명한다.
Looking at the horizontal SAD distribution, the height (x) of approximately 30 to 120 parts of the SAD value 302 is relatively larger than the surroundings. Eventually, the height (height, x) of 30 to 120 in the whole image will be the height position of the ROI. The determination of the height location of the ROI is described below by finding the ROI in a systematic manner.

관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 결정) decision

관심영역(ROI) 결정은 수직 SAD 분포도

Figure 112010001132518-pat00030
와 수평 SAD 분포도
Figure 112010001132518-pat00031
를 기반으로 관심영역의 위치
Figure 112010001132518-pat00032
를 결정하는 것이다.ROI determination is based on vertical SAD distribution
Figure 112010001132518-pat00030
And horizontal SAD distribution
Figure 112010001132518-pat00031
Location of region of interest
Figure 112010001132518-pat00032
To determine.

관심영역의 높이위치(

Figure 112010001132518-pat00033
)를 찾기 위해서는 아래 수식 (3.a)와 같이 먼저 도 3b에 나타낸 수평 SAD 분포도에서 관심영역의 높이 (
Figure 112010001132518-pat00034
) 크기의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 첫 높이가 바로 관심 영역의 세로 위치(
Figure 112010001132518-pat00035
)이다.The height of the region of interest
Figure 112010001132518-pat00033
) To find the height of the region of interest in the horizontal SAD distribution plot shown in Figure 3b, as shown in equation (3.a) below:
Figure 112010001132518-pat00034
As you move the window of size from beginning to end, you must find the window with the largest sum of SAD values that belong to that window. The first height of the window with the largest sum of SAD values is then the vertical position of the region of interest (
Figure 112010001132518-pat00035
)to be.

Figure 112010001132518-pat00036
...(3.a)
Figure 112010001132518-pat00036
... (3.a)

또한, 같은 방법으로 관심영역의 너비위치(

Figure 112010001132518-pat00037
)를 찾기 위해서는 아래 수식 (3.b)와 같이 도 3a에 나타낸 수직 SAD 분포도에서 관심영역의 너비 (
Figure 112010001132518-pat00038
) 크기의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 첫 너비 위치가 바로 관심 영역의 너비 위치(
Figure 112010001132518-pat00039
)이다.Also, in the same way, the width position of the region of interest (
Figure 112010001132518-pat00037
), The width of the region of interest in the vertical SAD distribution plot shown in Figure 3a as shown in equation (3.b) below.
Figure 112010001132518-pat00038
As you move the window of size from beginning to end, you must find the window with the largest sum of SAD values that belong to that window. The first width position of the window with the largest sum of SAD values is then the width position of the region of interest (
Figure 112010001132518-pat00039
)to be.

Figure 112010001132518-pat00040
...(3.b)
Figure 112010001132518-pat00040
... (3.b)

여기서

Figure 112010001132518-pat00041
Figure 112010001132518-pat00042
는 각각 관심영역의 높이크기와 너비크기를 의미한다.here
Figure 112010001132518-pat00041
Wow
Figure 112010001132518-pat00042
Are the height and width of the ROI, respectively.

도 4는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법을 사용하여 홀 모니터 영상에 대해서 관심영역을 추출한 결과를 나타내는 도면이다.FIG. 4 is a diagram illustrating a result of extracting a region of interest with respect to a hall monitor image by using a method of extracting a region of interest in an entire image unit according to an embodiment of the present invention.

전체영상(200)에서 홀 모니터 영상에서 관심영역을 추출할 경우 움직임이 많은 복도 중앙 영역을 관심영역으로 추출하는 것이 바람직하고, 본 발명에 따른 전체영상 단위의 관심영역 추출방법을 사용한 결과 도 4와 같이 관심영역(410)이 결정된다.When the region of interest is extracted from the hall monitor image from the whole image 200, it is preferable to extract the center region of the corridor with a lot of motion as the region of interest. Likewise, the region of interest 410 is determined.

여기서 관심영역의 높이크기(

Figure 112010001132518-pat00043
) 및 너비크기(
Figure 112010001132518-pat00044
)는 임의로 조정이 가능한 값이고, 일반적으로는 전체영상의 높이크기 및 너비크기(
Figure 112010001132518-pat00045
)의 절반으로 설정한다.Where the height of the region of interest (
Figure 112010001132518-pat00043
) And width size (
Figure 112010001132518-pat00044
) Is a value that can be arbitrarily adjusted, and in general, the height size and width size (
Figure 112010001132518-pat00045
Set to half of).

본 발명에 따르면 키프레임은 부호기와 복호기가 동시에 가지는 정보이므로 다른 정보없이 키프레임만을 이용하여 관심영역을 추출이 가능하다. 따라서 부호기가 관심영역에 대한 정보를 복호기에 알려주지 않아도 복호기가 부호기와는 독립적으로 관심영역을 추출하여 복호화 과정에 사용할 수 있는 장점이 있다.
According to the present invention, since the key frame is information that the encoder and the decoder have at the same time, the ROI can be extracted using only the key frame without any other information. Therefore, even if the encoder does not inform the decoder about the region of interest, the decoder can extract the region of interest independently from the encoder and use it in the decoding process.

프레임(frame( frameframe ) 단위 관심영역(Unit of interest ( regionregion ofof interestinterest , , ROIROI ) 추출방법) Extraction Method

앞서 설명한 전체영상 단위 관심영역 추출방법은 전체영상을 부호화하기 전에 한 번만 수행되지만, 프레임 단위 관심영역 추출방법은 각각의 프레임을 부호화하기 전에 매번 수행된다. 프레임 단위 관심영역 추출방법은 다음과 같은 절차로 수행된다.The above-described method of extracting a region of interest of an entire image unit is performed only once before encoding the entire image, but the method of extracting a region of interest of a frame unit is performed each time before encoding each frame. The method of extracting an ROI in a frame unit is performed by the following procedure.

도 5는 본 발명의 일 실시예에 따른 프레임 단위 관심영역 추출방법을 나타내는 순서도이다.5 is a flowchart illustrating a method of extracting a region of interest region per frame according to an embodiment of the present invention.

먼저 각각의 프레임에 대해서 ARM(absolute residual map)을 생성한다(S501).First, an absolute residual map (ARM) is generated for each frame (S501).

그 후 생성된 ARM을 이용하여 SAD(sum of absolute difference) 분포도를 생성한다(S502).Then, using the generated ARM to generate a sum of absolute difference (SAD) distribution (S502).

그 후 생성된 SAD 분포도를 이용하여 관심영역을 결정한다(S503).After that, the region of interest is determined using the generated SAD distribution (S503).

이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.

ARMARM (( absoluteabsolute residualresidual mapmap ) 생성) produce

먼저

Figure 112010001132518-pat00046
번째 프레임을 부호화 한다고 가정하면, 아래 수식 (4)와 같이 이전(
Figure 112010001132518-pat00047
) 프레임과 다음(
Figure 112010001132518-pat00048
) 프레임의 절대값 차이인 ARM(Absolute Residual Map)을 생성한다.first
Figure 112010001132518-pat00046
Assuming that the first frame is to be encoded, the previous (
Figure 112010001132518-pat00047
) Frame and the next (
Figure 112010001132518-pat00048
Absolute Residual Map (ARM), which is the absolute difference of frames, is generated.

Figure 112010001132518-pat00049
...(4)
Figure 112010001132518-pat00049
...(4)

여기서

Figure 112010001132518-pat00050
는 시간 색인인 n 번째 프레임을 의미하고,
Figure 112010001132518-pat00051
n번째 프레임의 높이위치정보(x) 및 너비위치정보(y)의 위치
Figure 112010001132518-pat00052
의 픽셀값을 의미한다.
here
Figure 112010001132518-pat00050
Means the nth frame, which is the time index,
Figure 112010001132518-pat00051
Is the position of height position information (x) and width position information (y) of the nth frame.
Figure 112010001132518-pat00052
Means the pixel value of.

SADSAD 분포도 생성 Generate distribution

SAD(sum of absolute difference) 분포도는 절대값의 차이를 합한 값을 일정기준의 위치에 따른 분포 정도를 나타낸다.The SAD (sum of absolute difference) distribution shows the distribution of the sum of the absolute values according to the position of a certain standard.

SAD 분포도는 앞서 ARM을 생성하는 과정에서 구한

Figure 112010001132518-pat00053
를 이용하여 구하며, SAD 분포도는 수직 SAD 분포도와 수평 SAD 분포도가 있다.SAD distribution was obtained from the previous ARM generation process.
Figure 112010001132518-pat00053
The SAD distribution chart has a vertical SAD distribution and a horizontal SAD distribution.

수직 SAD 분포도는 ARM에 포함됨 각 픽셀의 높이위치정보를 수직 방향으로 더하여 생성한다. 구체적인 수식은 아래 수식(5.a)와 같다.The vertical SAD distribution map is included in ARM. It is generated by adding height position information of each pixel in the vertical direction. The specific formula is shown in the following formula (5.a).

Figure 112010001132518-pat00054
...(5.a)
Figure 112010001132518-pat00054
... (5.a)

수평 SAD 분포도는 ARM에 포함됨 각 픽셀의 너비위치정보를 수평 방향으로 더하여 생성한다. 구체적인 수식은 아래 수식(5.b)와 같다.The horizontal SAD distribution map is included in ARM. It is created by adding the width position information of each pixel in the horizontal direction. The specific formula is shown in the following formula (5.b).

Figure 112010001132518-pat00055
...(5.b)
Figure 112010001132518-pat00055
... (5.b)

관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 결정) decision

관심영역 결정은 수직 SAD 분포도

Figure 112010001132518-pat00056
와 수평 SAD 분포도
Figure 112010001132518-pat00057
를 기반으로 관심영역의 위치
Figure 112010001132518-pat00058
를 결정하는 것이다.Region of interest determination is a vertical SAD distribution
Figure 112010001132518-pat00056
And horizontal SAD distribution
Figure 112010001132518-pat00057
Location of region of interest
Figure 112010001132518-pat00058
To determine.

관심영역의 높이위치(

Figure 112010001132518-pat00059
)를 찾기 위해서는 아래 수식 (6.a)와 같이 먼저 수평 SAD 분포도에서 관심영역의 높이 크기(
Figure 112010001132518-pat00060
)의 창을 처음부터 끝까지 이동하면서 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 높이 위치가 바로 관심영역 의 높이(
Figure 112010001132518-pat00061
)이다.The height of the region of interest
Figure 112010001132518-pat00059
) To find the height size of the ROI in the horizontal SAD distribution plot (6.a)
Figure 112010001132518-pat00060
As you move through the windows of), you must find the window with the largest sum of the SAD values that belong to the window. Then, the height position of the window with the largest sum of SAD values is the height of the region of interest (
Figure 112010001132518-pat00061
)to be.

Figure 112010001132518-pat00062
...(6.a)
Figure 112010001132518-pat00062
... (6.a)

또한, 같은 방법으로 관심영역의 너비위치(

Figure 112010001132518-pat00063
)를 찾기 위해서는 아래 수식 (6.b)와 같이 먼저 수직 SAD 분포도에서 관심영역의 너비크기(
Figure 112010001132518-pat00064
)의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 너비 위치가 바로 관심영역의 너비위치(
Figure 112010001132518-pat00065
)를 찾는다.Also, in the same way, the width position of the region of interest (
Figure 112010001132518-pat00063
) To find the width size of the region of interest in the vertical SAD distribution plot (6.b).
Figure 112010001132518-pat00064
Move the window of) from start to finish and find the window with the largest sum of SAD values that belong to that window. After that, the width of the window with the largest sum of SAD values is the width of the region of interest (
Figure 112010001132518-pat00065
Find).

Figure 112010001132518-pat00066
...(6.b)
Figure 112010001132518-pat00066
... (6.b)

블록(block( blockblock ) 단위 관심영역(Unit of interest ( ROIROI ) 추출방법) Extraction Method

도 6a는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하는 영상을 나타낸 도면이다.FIG. 6A is a diagram illustrating an image using a method of extracting a block of interest region according to an embodiment of the present invention. FIG.

영상에는 사람(601)이 있으며 주변 배경과 비교하여 움직임이 있는 사람의 영역은 사각형보다는 삼각형(602)에 가깝다.There is a person 601 in the image and the area of the person with motion compared to the surrounding background is closer to the triangle 602 than to the rectangle.

앞서 소개한 전체영상 단위 관심영역 추출방법 및 프레임 단위 관심영역 추출방법의 관심영역의 모양은 직사각형으로 고정되고 그 직사각형의 높이 및 너비의 크기만 변화가 가능하다. 그러나 이는 움직임(motion)의 변화가 큰 영역이 전체영상에서 특정영역에 몰려있는 경우가 아닌 도 5와 같은 영상에서는 적합하지 않다. 즉 하나의 큰 관심영역을 추출하는 전체영상 단위 관심영역 추출방법 및 프레임 단위 관심영역 추출방법은 도 5와 같은 영상에서는 효율성 측면에서 바람직하지 않다.The shape of the ROI of the entire image unit ROI extraction method and the frame unit ROI extraction method is fixed as a rectangle, and only the height and width of the rectangle can be changed. However, this is not suitable for an image as shown in FIG. 5, unless a region having a large change in motion is concentrated in a specific region in the whole image. That is, the entire image unit ROI extraction method and the frame unit ROI extraction method for extracting one large ROI are not preferable in terms of efficiency in the image of FIG. 5.

따라서 움직임의 변화가 큰 부분이 다양한 영상에 적합한 관심영역을 추출하기 위해서는 여러 개의 작은 관심영역을 추출하거나 관심영역의 크기도 바뀌어야 한다.Therefore, in order to extract a region of interest suitable for various images in which a large change in motion is required, several small regions of interest must be extracted or the size of the region of interest must also be changed.

위와 같은 문제를 해결하기 위해 프레임 영상을 작은 크기의 복수개의 블록으로 나누고, 움직임이 많은 블록을 선택하고, 선택된 블록들은 제안된 블록 단위 ROI를 구성한다.In order to solve the above problem, the frame image is divided into a plurality of blocks of small size, a block having a lot of motion is selected, and the selected blocks constitute a proposed block unit ROI.

이때 선택된 블록들의 개수는 선택된 블록의 전체 면적이 앞서 설명한 전체영상 단위 및 프레임 단위 관심영역 추출방법을 사용하여 추출한 관심영역의 크기와 같게 정한다. 블록 단위 ROI 추출 방법은 다음과 같은 절차로 수행된다.In this case, the number of selected blocks is determined such that the total area of the selected blocks is equal to the size of the ROI extracted by using the above-described method of extracting the ROI and the image unit. The block-based ROI extraction method is performed by the following procedure.

도 6b는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 나타내는 순서도이다.6B is a flowchart illustrating a method of extracting an ROI in a block unit according to an embodiment of the present invention.

먼저 전체영상을 M 개(M 은 정수)의 블록으로 분할한다(S601). 여기서 블록의 개수 M은 임의로 정할 수 있으며, 블록의 개수가 많을수록 각각의 블록의 크기는 작아진다.First, the whole image is divided into M blocks (M is an integer) (S601). Here, the number M of blocks can be arbitrarily determined, and the larger the number of blocks, the smaller the size of each block.

그 후 각 블록의 블록 SAD(sum of absolute difference)를 계산한다(S602).Thereafter, a block sum of absolute difference (SAD) of each block is calculated (S602).

그 후 계산된 블록 SAD 값을 이용하여 관심영역 블록들을 선택한다(S603).Thereafter, the ROI blocks are selected using the calculated block SAD value (S603).

이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.

블록 block SADSAD (( sumsum ofof absoluteabsolute differencedifference ) 계산) Calculation

블록 단위 관심영역 추출방법은 앞서 설명한 프레임 단위 관심영역 추출 방법과 같이 각각의 프레임을 부호화하기 전에 매번 수행된다.The block unit of interest region extraction method is performed every time before each frame is encoded, as in the frame unit region of interest extraction method described above.

먼저

Figure 112010001132518-pat00067
번째 프레임을 부호화한다고 가정하면, 아래 수식 (7)과 같이 이전(
Figure 112010001132518-pat00068
) 프레임과 다음(
Figure 112010001132518-pat00069
) 프레임의 차이값의 절대값을 취하고 이를 블록의 높이 및 너비로 더하여 계산한다.first
Figure 112010001132518-pat00067
Assuming that the first frame is to be encoded, the previous (
Figure 112010001132518-pat00068
) Frame and the next (
Figure 112010001132518-pat00069
) Is calculated by taking the absolute value of the difference of the frames and adding it to the height and width of the block.

Figure 112010001132518-pat00070
...(7)
Figure 112010001132518-pat00070
... (7)

여기서

Figure 112010001132518-pat00071
은 시간 색인이 2n 번째 프레임을 의미하고, i는 각각의 분할된 블록의 높이위치를 의미하며, j는 각각의 분할된 블록의 너비위치를 나타낸다. i 및 j 값의 범위는
Figure 112010001132518-pat00072
Figure 112010001132518-pat00073
이 된다.here
Figure 112010001132518-pat00071
Denotes a 2n-th frame of time index, i denotes a height position of each divided block, and j denotes a width position of each divided block. i and j values range
Figure 112010001132518-pat00072
Figure 112010001132518-pat00073
Becomes

여기서 h는 분할된 블록의 높이의 크기를 의미하고, w는 분할된 블록의 너비의 크기를 의미한다.
Here, h means the size of the height of the divided block, w is the size of the width of the divided block.

관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 블록 선택Block selection

블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계이다. 움직임이 많은 영역이 관심영역이므로 각각의 블록이 가지는 블록 SAD 값이 큰 블록들을 선택한다. 블록 SAD 값이 큰 순서대로 N 개를 선택한다. 여기서 N은 정수이며, 그 범위는 (1< N≤ M)이 되며, M은 앞서 전체영상을 분할하는 블록의 전체 개수이다.In this step, the ROI block is selected using the block SAD value. Since the region with much motion is the region of interest, blocks having a large block SAD value of each block are selected. N blocks are selected in order of block SAD values. Where N is an integer, and the range is (1 <N ≦ M), where M is the total number of blocks for dividing the entire image.

보통은 블록 SAD 값이 큰 순서대로 선택된 블록들의 개수는 선택된 블록의 전체 면적이 앞서 설명한 전체영상 단위 및 프레임 단위 관심영역 추출방법을 사용하여 추출한 관심영역의 크기와 같게 정한다.In general, the number of blocks selected in order of increasing block SAD value is determined so that the total area of the selected blocks is equal to the size of the ROI extracted by using the above-described method of extracting ROIs by the entire image unit and frame.

도 6c는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하여 관심영역을 추출한 결과를 나타내는 도면이다.FIG. 6C is a diagram illustrating a result of extracting a region of interest using a block-based region of interest extraction method according to an embodiment of the present invention. FIG.

사람(601)의 움직임을 복수개의 작은 블록(610)을 사용하여 관심영역을 추출하였고, 이는 전체영상 단위 및 프레임 단위로 관심영역을 추출하는 방법보다 효율성 측면에서 바람직하다.
The region of interest is extracted by using the plurality of small blocks 610 for the movement of the person 601, which is preferable in terms of efficiency than the method of extracting the region of interest by the whole image unit and the frame unit.

이상에서 보는 바와 같이, 본 발명이 속하는 기술 분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시 될 수 있다는 것을 이해할 수 있을 것이다. As described above, those skilled in the art to which the present invention pertains will understand that the present invention may be implemented in other specific forms without changing the technical spirit or essential features.

그러므로 이상에서 기술한 실시 예는 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 하고, 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Therefore, the embodiments described above are to be understood in all respects as illustrative and not restrictive, and the scope of the present invention is indicated by the following claims rather than the above description, and the meaning and scope of the claims and All changes or modifications derived from the equivalent concept should be interpreted as being included in the scope of the present invention.

101: 인트라 인코더
102: 관심영역 추출부
103: 부호화부
104: 인트라 디코더부
105: 보조정보 생성부
106: 복호화부
401: 관심영역
610: 관심영역 블록
101: intra encoder
102: region of interest extraction unit
103: encoder
104: intra decoder unit
105: auxiliary information generator
106: decryption unit
401: region of interest
610: region of interest block

Claims (16)

영상의 관심영역(region of interest, ROI)을 추출하는 방법으로서,
상기 영상에 대한 MAD(mean absolute difference) 맵을 생성하는 단계;
상기 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 영상의 관심영역 추출방법.
As a method of extracting a region of interest (ROI) of an image,
Generating a mean absolute difference (MAD) map for the image;
Generating a sum of absolute difference (SAD) distribution map using the MAD map; And
And determining a region of interest using the SAD distribution map.
제1항에 있어서,
상기 MAD 맵은 이전 키프레임(key frame)과 다음 키프레임의 절대값 차이의 평균값을 이용하여 생성하고,
상기 MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하는, 영상의 관심영역 추출방법.
The method of claim 1,
The MAD map is generated using an average value of an absolute difference between a previous key frame and a next key frame.
Each pixel included in the MAD map and the key frame includes height location information and width location information.
제2항에 있어서,
상기 SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고,
상기 수직 SAD 분포도는 소정의 너비위치에서 상기 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 더하여 생성하고,
상기 수평 SAD 분포도는 소정의 높이위치에서 상기 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 수평 방향으로 더하여 생성하는, 영상의 관심영역 추출방법.
The method of claim 2,
The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart,
The vertical SAD distribution map is generated by adding MAD values of each pixel included in the MAD map at a predetermined width position,
The horizontal SAD distribution map is generated by adding a MAD value of each pixel included in the MAD map in a horizontal direction at a predetermined height position.
제3항에 있어서,
상기 관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고,
상기 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고,
상기 관심영역의 높이위치정보는 상기 관심영역의 높이에 속하는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고,
상기 관심영역의 너비위치정보는 상기 관심영역의 너비에 속하는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는, 영상의 관심영역 추출방법.
The method of claim 3,
The ROI is a rectangle having a height smaller than the height of the entire image and having a width smaller than the width of the entire image.
Each pixel included in the ROI includes height location information and width location information.
The height position information of the ROI indicates a height position of the ROI in which the sum of the horizontal SAD values belonging to the height of the ROI is the largest.
The width position information of the region of interest indicates a width position of the region of interest in which the sum of the vertical SAD values belonging to the width of the region of interest is the largest position.
제4항에 있어서,
상기 관심영역의 높이위치정보는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고,
상기 관심영역의 너비위치정보는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는, 영상의 관심영역 추출방법.
The method of claim 4, wherein
The height position information of the ROI includes height position information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest.
The width position information of the ROI includes height position information of the leftmost pixel of the ROI where the sum of the vertical SAD values is the largest.
영상에 대한 관심영역(ROI) 추출방법에 있어서,
ARM(absolute residual map)을 생성하는 단계;
상기 ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 관심영역 추출방법.
In the ROI extraction method for an image,
Generating an absolute residual map (ARM);
Generating a sum of absolute difference (SAD) distribution map using the ARM; And
And determining a region of interest using the SAD distribution map.
제6항에 있어서,
상기 ARM은 이전 키프레임과 다음 키프레임의 절대값 차이를 이용하여 생성하고,
상기 ARM 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 관심영역 추출방법.
The method of claim 6,
The ARM is generated using the absolute difference between the previous keyframe and the next keyframe,
Each pixel included in the ARM and the key frame includes height position information and width position information.
제7항에 있어서,
상기 SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고,
상기 수직 SAD 분포도는 소정의 너비위치에서 상기 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하고,
상기 수평 SAD 분포도는 소정의 높이위치에서 상기 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하는, 관심영역 추출방법.
The method of claim 7, wherein
The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart,
The vertical SAD distribution chart is generated by adding an ARM value of each pixel included in the ARM at a predetermined width position,
The horizontal SAD distribution chart is generated by adding an ARM value of each pixel included in the ARM at a predetermined height position.
제8항에 있어서,
상기 관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고,
상기 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고,
상기 관심영역의 높이위치정보는 상기 관심영역의 높이에 속하는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고,
상기 관심영역의 너비위치정보는 상기 관심영역의 너비에 속하는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는, 관심영역 추출방법.
The method of claim 8,
The ROI is a rectangle having a height smaller than the height of the entire image and having a width smaller than the width of the entire image.
Each pixel included in the ROI includes height location information and width location information.
The height position information of the ROI indicates a height position of the ROI in which the sum of the horizontal SAD values belonging to the height of the ROI is the largest.
Width position information of the region of interest indicates a width position of the region of interest in which the sum of the vertical SAD values belonging to the width of the region of interest is the largest;
제9항에 있어서,
상기 관심영역의 높이위치정보는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고,
상기 관심영역의 너비위치정보는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는, 관심영역 추출방법.
10. The method of claim 9,
The height position information of the ROI includes height position information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest.
The width position information of the ROI includes height position information of the leftmost pixel of the ROI where the sum of the vertical SAD values is the largest.
영상에 대한 관심영역(ROI) 추출방법에 있어서,
상기 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계;
상기 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계; 및
상기 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고,
상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고,
상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 관심영역 추출방법.
In the ROI extraction method for an image,
Dividing the image into M blocks (M is an integer);
Calculating a block sum of absolute difference (SAD) of each block; And
Selecting the ROI block using the block SAD value;
The block SAD is obtained by adding the difference between the previous keyframe and the next keyframe to the height and width of the block,
Each pixel included in the block SAD and the key frame includes height position information and width position information.
삭제delete 제11항에 있어서,
상기 관심영역 블록은 상기 블록 SAD 값이 큰 순서대로 N 개(1< N ≤M, N은 정수)를 선택하는, 관심영역 추출방법.
The method of claim 11,
And the region of interest block selects N pieces (1 <N ≦ M, N is an integer) in order of increasing block SAD value.
청구항 14은(는) 설정등록료 납부시 포기되었습니다.Claim 14 was abandoned when the registration fee was paid. 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상의 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체로서, 상기 이하의 단계들은,
MAD(mean absolute difference)맵을 생성하는 단계;
상기 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 컴퓨터 판독가능 매체.
A computer readable medium containing computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) of an image, wherein the following steps comprise:
Generating a mean absolute difference (MAD) map;
Generating a sum of absolute difference (SAD) distribution map using the MAD map; And
And determining a region of interest using the SAD distribution map.
청구항 15은(는) 설정등록료 납부시 포기되었습니다.Claim 15 was abandoned upon payment of a registration fee. 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체로서, 상기 이하의 단계들은,
ARM(absolute residual map)을 생성하는 단계;
상기 ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 컴퓨터 판독가능 매체.
A computer readable medium comprising computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) for an image, the following steps:
Generating an absolute residual map (ARM);
Generating a sum of absolute difference (SAD) distribution map using the ARM; And
And determining a region of interest using the SAD distribution map.
청구항 16은(는) 설정등록료 납부시 포기되었습니다.Claim 16 was abandoned upon payment of a setup registration fee. 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체로서, 상기 이하의 단계들은,
영상을 M 개(M 은 정수)의 블록으로 분할하는 단계;
상기 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계; 및
상기 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고,
상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고,
상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 컴퓨터 판독가능 매체.
A computer readable medium comprising computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) for an image, the following steps:
Dividing the image into M blocks (M is an integer);
Calculating a block sum of absolute difference (SAD) of each block; And
Selecting the ROI block using the block SAD value;
The block SAD is obtained by adding the difference between the previous keyframe and the next keyframe to the height and width of the block,
And each pixel included in the block SAD and a keyframe includes height position information and width position information.
KR1020100001560A 2010-01-08 2010-01-08 Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof KR101076272B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100001560A KR101076272B1 (en) 2010-01-08 2010-01-08 Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100001560A KR101076272B1 (en) 2010-01-08 2010-01-08 Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof

Publications (2)

Publication Number Publication Date
KR20110081413A KR20110081413A (en) 2011-07-14
KR101076272B1 true KR101076272B1 (en) 2011-10-26

Family

ID=44919921

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100001560A KR101076272B1 (en) 2010-01-08 2010-01-08 Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof

Country Status (1)

Country Link
KR (1) KR101076272B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102195669B1 (en) * 2018-12-03 2020-12-28 주식회사 리메드 Apparatus for transmitting image
CN110120012B (en) * 2019-05-13 2022-07-08 广西师范大学 Video stitching method for synchronous key frame extraction based on binocular camera
CN110363197B (en) * 2019-06-22 2023-05-23 东北电力大学 Video region of interest extraction method based on improved visual background extraction model

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100663483B1 (en) 2005-08-09 2007-01-02 삼성전자주식회사 Apparatus and method of unmanned surveillance using an omni-directional camera

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100663483B1 (en) 2005-08-09 2007-01-02 삼성전자주식회사 Apparatus and method of unmanned surveillance using an omni-directional camera

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
논문 1 : BRUNEL UNIV. 2009

Also Published As

Publication number Publication date
KR20110081413A (en) 2011-07-14

Similar Documents

Publication Publication Date Title
US10110902B2 (en) Method and apparatus for encoding/decoding motion vector
WO2006073116A1 (en) Video encoding method and device, video decoding method and device, program thereof, and recording medium containing the program
JP2015165695A (en) Method and apparatus for decoding image
CN102595132A (en) Distributed video encoding and decoding method applied to wireless sensor network
KR101076272B1 (en) Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof
KR20160030140A (en) Method and apparatus for decoding image
KR101477545B1 (en) Method for decoding motion vector
KR101477546B1 (en) Apparatus for decoding motion vector
KR101617796B1 (en) Method and apparatus for decoding image
KR101454664B1 (en) Method for decoding motion vector
KR101606812B1 (en) Method and apparatus for decoding image

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140930

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151002

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee