KR101076272B1 - Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof - Google Patents
Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof Download PDFInfo
- Publication number
- KR101076272B1 KR101076272B1 KR1020100001560A KR20100001560A KR101076272B1 KR 101076272 B1 KR101076272 B1 KR 101076272B1 KR 1020100001560 A KR1020100001560 A KR 1020100001560A KR 20100001560 A KR20100001560 A KR 20100001560A KR 101076272 B1 KR101076272 B1 KR 101076272B1
- Authority
- KR
- South Korea
- Prior art keywords
- sad
- roi
- interest
- region
- width
- Prior art date
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/59—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/176—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/30—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
- H04N19/395—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability involving distributed video coding [DVC], e.g. Wyner-Ziv video coding or Slepian-Wolf video coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
본 발명은 분산 비디오 코딩(distributed video coding) 및 영상에서 관심영역을 추출하는 기술에 관한 것이다.
본 발명에 따른 분산 비디오 코딩(distributed video coding, DVC)을 위한 전체영상 단위 관심영역(region of interest, ROI) 추출방법은 MAD(mean absolute difference) 맵을 생성하는 단계, MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.
본 발명에 의하면, 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감할 수 있다.The present invention relates to distributed video coding and a technique for extracting a region of interest from an image.
According to the present invention, a method for extracting a region of interest (ROI) for distributed video coding (DVC) may include generating a mean absolute difference (MAD) map, and using SAD (MAD map). sum of absolute difference) generating a distribution chart and determining a region of interest using the SAD distribution chart.
According to the present invention, it is possible to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.
Description
본 발명은 분산 비디오 코딩(distributed video coding) 및 영상에서 관심영역을 추출하는 기술에 관한 것이다.The present invention relates to distributed video coding and a technique for extracting a region of interest from an image.
현재 비디오 표준 압축기술인 MPEG과 H.26x 기술들은 압축률을 높이기 위해 연속적인 프레임의 상관성을 이용하여 프레임 간의 예측부호기술(inter-frame predictive coding)을 사용한다. 이 기술에서 사용하는 움직임 예측 (motion estimation)으로 인해, 일반적으로 부호기의 복잡도가 복호기의 복잡도보다 5배에서 10배 정도 높다. 이런 비대칭 비디오 구조는 한 번 압축하고 여러 번 복호하는 방송용 시스템이나 주문형 비디오 시스템 (video on demand)에 적합하다.MPEG and H.26x technologies, which are the current video standard compression techniques, use inter-frame predictive coding using continuous frame correlation to increase the compression rate. Due to the motion estimation used in this technique, the complexity of the encoder is generally about 5 to 10 times higher than the complexity of the decoder. This asymmetric video structure is well suited for broadcast systems or video on demand that compress once and decode multiple times.
그러나 최근 요구되는 비디오 응용 제품인 무선 감시 비디오 센서, 무선 PC 카메라, 휴대용 단말기의 카메라, 일회용 비디오 카메라와 같은 응용 제품들은 메모리와 전력이 제한되어 있고, 계산 능력의 한계 등으로 인해 비디오 부호화를 할 때 높은 복잡도의 알고리즘을 수행하기 어렵다.However, recently demanded video applications, such as wireless surveillance video sensors, wireless PC cameras, portable terminal cameras, and disposable video cameras, have limited memory and power and have high computational limitations due to limitations in computing power. It is difficult to perform algorithms of complexity.
따라서 새로운 응용 분야의 제품들은 기존의 비디오 부호 방식인 예측부호기술이 아니라, 낮은 복잡도로 비디오 부호화 할 수 있는 새로운 개념의 비디오 부호화 기술이 필요했다. 최근 분산 비디오 코딩(distributed video coding, DVC)이 새로운 응용 분야에 적합한 비디오 부호화 기술로 주목을 받고 있다.Therefore, new application products needed a new concept of video encoding technology that can encode video with low complexity, not predictive coding technology which is a conventional video coding method. Recently, distributed video coding (DVC) has attracted attention as a video coding technology suitable for new applications.
지난 수년간 분산 비디오 코딩은 1970년대에 발표된 두 개의 정보 이론을 근거로 연구되고 있다. 그 중 하나는 1973년 발표된 Slepian-Wolf 정리로 상관성이 있는 소스 X와 Y를 독립적으로 각각 부호화 하여도 결합 복호화를 한다면, 두 소스를 결합 부호화 한 것과 같은 압축 효율을 얻을 수 있는 것을 말한다. Slepian- Wolf 부호는 분산 소스 코딩을 의미하고, 무손실 압축이다. 다른 하나는 1976년에 발표된 Wyner-Ziv 정리로 Slepian-Wolf 부호를 확장하여 복호기에서 보조정보(side information, SI)를 이용할 때, 손실 압축의 이론적 경계를 제시하였다.Over the years, distributed video coding has been studied based on two information theories published in the 1970s. One of them is the Slepian-Wolf theorem, which was released in 1973, and it is possible to achieve the same compression efficiency as the joint coding of two sources if the joint decoding is performed even if the correlated sources X and Y are independently encoded. Slepian-Wolf code means distributed source coding and is lossless compression. The other is the Wyner-Ziv theorem, published in 1976, which extends the Slepian-Wolf code to provide the theoretical boundary of lossy compression when using side information (SI) in the decoder.
이러한 분산 소스 코딩을 이용하여 영상 프레임을 독립적으로 부호화하면, 움직임 보상(motion compensation) 및 움직임 예측과 같은 프레임 사이의 통계적 의존성을 계산하는 것과 같이 복잡도가 높은 처리과정 없이 압축이 가능하여 부호기의 복잡도를 낮출 수 있다. 뿐만 아니라 현재 분산 비디오 코딩은 MPEG과 같은 기존의 인트라(intra) 코딩과 가까운 성능을 얻을 수 있다.When the image frames are independently encoded using this distributed source coding, the complexity of the encoder can be reduced by compressing without complicated processing such as calculating statistical dependencies between frames such as motion compensation and motion prediction. Can be lowered. In addition, current distributed video coding can achieve performance close to conventional intra coding such as MPEG.
2002년에 분산 비디오 코딩의 실제적인 설계 구조인 Wyner-Ziv(WZ) 비디오가 발표되면서 분산 비디오 코딩이 현재까지 광범위하게 연구되고 있다. WZ 비디오 부호의 큰 장점은 부호기에서 복잡하게 수행되던 프레임 간의 예측부호기술을 사용하지 않고, 각 프레임을 서로 독립적으로 압축하여 부호기의 복잡도를 낮춘 것이다.In 2002, Wyner-Ziv (WZ) video, the actual design structure of distributed video coding, was released and distributed video coding has been extensively studied. The great advantage of WZ video coding is that the complexity of the encoder is reduced by compressing each frame independently of each other without using the inter-frame predictive coding technique that was complicatedly performed in the encoder.
그러나 부호기의 복잡도가 줄어든 만큼 복호기의 복잡도는 증가했다. 즉, 프레임간의 보조정보를 생성하는데 복호기가 사용되어 복호기의 복잡도가 증가하였다.However, the complexity of the decoder increased as the complexity of the encoder decreased. That is, a decoder is used to generate auxiliary information between frames, thereby increasing the complexity of the decoder.
분산 비디오 코딩의 복호기의 복잡도를 줄이기 위해서는 복호화 자체의 복잡도를 줄이거나 피드백 채널로 인해 발생되는 복호 지연 문제를 해결해야 한다. 후자의 방법으로 부호기에서 WZ 프레임의 적절한 비트율을 추정하여 압축하는 부호기 제어 방법과 부호기와 복호기에서 비트율 추정이 진행되는 이종 제어 방법이 있다. 그러나 이 방법들은 피드백으로 인해 발생되는 복호 지연 문제만 다루고 있고, 부호기 및 복호기의 직접적인 복잡도를 줄이는 알고리즘은 없다.To reduce the complexity of the decoder of distributed video coding, it is necessary to reduce the complexity of the decoding itself or solve the decoding delay problem caused by the feedback channel. As the latter method, there are an encoder control method for estimating and compressing an appropriate bit rate of a WZ frame at an encoder and a heterogeneous control method for bit rate estimation at an encoder and a decoder. However, these methods deal only with the decoding delay problem caused by feedback, and there is no algorithm which reduces the direct complexity of the encoder and decoder.
본 발명에서는 낮은 분산 비디오 코딩의 복잡도를 줄이기 위한 알고리즘을 제안한다. WZ 프레임에서 관심영역(region of interest, ROI)을 추출하여 선택적으로 부호화하는 알고리즘을 제안한다.The present invention proposes an algorithm for reducing the complexity of low distributed video coding. We propose an algorithm that selectively extracts regions of interest (ROI) from WZ frames and selectively encodes them.
WZ 프레임 내에는 영상의 배경과 같이 움직임의 변화가 적은 영역이 있고, 물체 또는 사람과 같이 움직임의 변화가 많은 영역이 있다. 따라서 WZ 프레임 전체를 부호화하는 것이 아니라, WZ 프레임에서 움직임이 많이 일어났거나 움직임의 변화가 심한 영역을 관심영역으로 정의하여, 관심영역에 대해 부호화를 선택적으로 한다. 이를 통해 WZ 프레임의 비트율이 절감되고, 왜곡율(rate distortion)도 감소하며, 부호기 및 복호기의 복잡도를 낮춘다.In the WZ frame, there is an area where the change of movement is small, such as the background of an image, and there is an area where the change of movement is large, such as an object or a person. Therefore, instead of encoding the entire WZ frame, an encoding region is selectively selected for the region of interest by defining a region of interest in which a lot of motion or a change of movement is severe in the WZ frame. This reduces the bit rate of the WZ frame, reduces the rate distortion, and reduces the complexity of the encoder and decoder.
본 발명은 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감하는 것을 목적으로 한다.An object of the present invention is to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.
본 발명에 따른 영상의 관심영역(region of interest, ROI)을 추출하는 방법은 영상에 대한 MAD(mean absolute difference) 맵을 생성하는 단계, MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A method of extracting a region of interest (ROI) of an image according to the present invention includes generating a mean absolute difference (MAD) map of an image, and generating a SAD (sum of absolute difference) distribution map using the MAD map. And determining a region of interest using the SAD distribution chart.
MAD 맵은 이전 키프레임(key frame)과 다음 키프레임의 절대값 차이의 평균값을 이용하여 생성하고, MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하는 것이 바람직하다.MAD map is generated by using the average value of absolute difference between previous key frame and next key frame, and each pixel included in MAD map and key frame has height position information and width position information. It is preferable to include.
SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고, 수직 SAD 분포도는 소정의 너비위치에서 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 더하여 생성하고, 수평 SAD 분포도는 소정의 높이위치에서 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 수평 방향으로 더하여 생성하는 것이 바람직하다.The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart. A vertical SAD distribution chart is generated by adding MAD values of each pixel included in the MAD map at a predetermined width position, and the horizontal SAD distribution chart is a MAD map at a predetermined height position. It is preferable to generate the MAD value included in each pixel included in the horizontal direction.
관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고, 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고, 관심영역의 높이위치정보는 관심영역의 높이에 속하는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고, 관심영역의 너비위치정보는 관심영역의 너비에 속하는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는 것이 바람직하다.The ROI is a rectangle having a height smaller than the height of the entire image and a width smaller than the width of the entire image. Each pixel included in the ROI includes height position information and width position information, and height position information of the ROI. Indicates the height position of the ROI where the sum of the horizontal SAD values belonging to the height of the ROI is the largest, and the width position information of the ROI is the position where the sum of the vertical SAD values belonging to the width of the ROI is the largest. It is preferable to indicate the width position of the region of interest.
관심영역의 높이위치정보는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고, 관심영역의 너비위치정보는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는 것이 바람직하다.The height location information of the ROI includes height location information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest, and the width location information of the ROI is the location where the sum of the vertical SAD values is the largest. It is preferable to include height position information of the leftmost pixel of the ROI.
본 발명에 따른 영상에 대한 관심영역(ROI) 추출방법은 ARM(absolute residual map)을 생성하는 단계, ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A method of extracting a region of interest (ROI) for an image according to the present invention includes generating an absolute residual map (ARM), generating a sum of absolute difference (SAD) distribution using the ARM, and using the SAD distribution map. Determining a step.
ARM은 이전 키프레임과 다음 키프레임의 절대값 차이를 이용하여 생성하고, ARM 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는 것이 바람직하다.The ARM is generated using the absolute difference between the previous keyframe and the next keyframe, and each pixel included in the ARM and the keyframe preferably includes height position information and width position information.
SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고, 수직 SAD 분포도는 소정의 너비위치에서 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하고, 수평 SAD 분포도는 소정의 높이위치에서 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하는 것이 바람직하다.The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart. A vertical SAD distribution chart is generated by adding ARM values of each pixel included in the ARM at a predetermined width position, and the horizontal SAD distribution chart is included in the ARM at a predetermined height position. It is preferable to generate by adding the ARM value of each pixel.
관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고, 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고, 관심영역의 높이위치정보는 관심영역의 높이에 속하는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고, 관심영역의 너비위치정보는 관심영역의 너비에 속하는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는 것이 바람직하다.The ROI is a rectangle having a height smaller than the height of the entire image and a width smaller than the width of the entire image. Each pixel included in the ROI includes height position information and width position information, and height position information of the ROI. Indicates the height position of the ROI where the sum of the horizontal SAD values belonging to the height of the ROI is the largest, and the width position information of the ROI is the position where the sum of the vertical SAD values belonging to the width of the ROI is the largest. It is preferable to indicate the width position of the region of interest.
관심영역의 높이위치정보는 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고, 관심영역의 너비위치정보는 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는 것이 바람직하다.
The height location information of the ROI includes height location information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest, and the width location information of the ROI is the location where the sum of the vertical SAD values is the largest. It is preferable to include height position information of the leftmost pixel of the ROI.
본 발명에 따른 영상에 대한 관심영역(ROI) 추출방법은 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계, 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계 및 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함한다.A method of extracting a region of interest (ROI) for an image according to the present invention includes dividing an image into M blocks (where M is an integer), calculating a block SAD (sum of absolute difference) of each block, and a block SAD value. Selecting a region of interest block using;
블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 블록의 높이 및 너비로 더하여 구하고, 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는 것이 바람직하다.The block SAD obtains the difference between the previous key frame and the next key frame by adding the height and width of the block, and preferably, each pixel included in the block SAD and the key frame includes the height position information and the width position information. .
관심영역 블록은 블록 SAD 값이 큰 순서대로 N 개(1< N ≤M, N은 정수)를 선택하는 것이 바람직하다.The region of interest block is preferably selected from N (1 <N ≤ M, N is an integer) in order of increasing block SAD value.
본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상의 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 MAD 맵을 생성하는 단계, MAD 맵을 이용하여 SAD 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, extracting a region of interest (ROI) of an image, comprises: generating a MAD map, using a SAD map Generating a distribution chart and determining a region of interest using the SAD distribution map.
본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 ARM을 생성하는 단계, ARM을 이용하여 SAD 분포도를 생성하는 단계 및 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium for extracting a region of interest (ROI) for an image comprises: generating an ARM, a SAD distribution diagram using the ARM And generating a region of interest using the SAD distribution map.
본 발명에 따른 컴퓨터로 하여금 이하의 단계들을 수행하게 하는 컴퓨터 실행가능 명령어를 포함하고, 영상에 대한 관심영역(ROI)을 추출하는 컴퓨터 판독가능 매체는 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계, 각 블록의 블록 SAD를 계산하는 단계 및 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고, 상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고, 상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함한다.A computer readable medium including computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium for extracting a region of interest (ROI) for an image comprises M blocks (where M is an integer). Dividing, calculating a block SAD of each block, and selecting a region of interest block using a block SAD value, wherein the block SAD takes an absolute value of a difference between a previous key frame and a next key frame. Each pixel included in the block SAD and the key frame includes height position information and width position information.
본 발명에 의하면, 분산 비디오 코딩을 위한 관심영역을 추출하여 부호화기 및 복호화기의 복잡도를 낮추고, 처리하는 비트율을 절감할 수 있다.According to the present invention, it is possible to extract a region of interest for distributed video coding, to reduce complexity of an encoder and a decoder, and to reduce a bit rate of processing.
도 1은 본 발명의 일 실시예에 따른 분산 비디오 코딩에서 관심영역 추출방법을 나타내는 도면이다.
도 2a는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법에 사용된 영상(200)을 나타내는 도면이다.
도 2b는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법을 나타내는 순서도이다.
도 3a는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수직 SAD 분포도를 나타내는 도면이다.
도 3b는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수평 SAD 분포도를 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법을 사용하여 홀 모니터 영상에 대해서 관심영역을 추출한 결과를 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 프레임 단위 관심영역 추출방법을 나타내는 순서도이다.
도 6a는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하는 영상을 나타낸 도면이다.
도 6b는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 나타내는 순서도이다.
도 6c는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하여 관심영역을 추출한 결과를 나타내는 도면이다.1 is a diagram illustrating a region of interest extraction method in distributed video coding according to an embodiment of the present invention.
2A is a diagram illustrating an
2B is a flowchart illustrating a method of extracting an entire region of interest unit of interest according to an embodiment of the present invention.
3A is a diagram illustrating a vertical SAD distribution diagram of an
3B is a diagram illustrating a horizontal SAD distribution diagram of an
FIG. 4 is a diagram illustrating a result of extracting a region of interest with respect to a hall monitor image by using a method of extracting a region of interest in an entire image unit according to an embodiment of the present invention.
5 is a flowchart illustrating a method of extracting a region of interest region per frame according to an embodiment of the present invention.
FIG. 6A is a diagram illustrating an image using a method of extracting a block of interest region according to an embodiment of the present invention. FIG.
6B is a flowchart illustrating a method of extracting an ROI in a block unit according to an embodiment of the present invention.
FIG. 6C is a diagram illustrating a result of extracting a region of interest using a block-based region of interest extraction method according to an embodiment of the present invention. FIG.
이하, 본 발명의 바람직한 실시예의 상세한 설명이 첨부된 도면들을 참조하여 설명될 것이다. 도면들 중 인용부호들 및 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 인용부호들로 나타내고 있음에 유의해야 한다.DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, detailed descriptions of preferred embodiments of the present invention will be described with reference to the accompanying drawings. It should be noted that reference numerals and like elements among the drawings are denoted by the same reference numerals as much as possible even though they are shown in different drawings.
본 발명을 설명함에 있어, 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략한다.
In describing the present invention, when it is determined that the detailed description of the related known function or configuration may unnecessarily obscure the subject matter of the present invention, the detailed description thereof will be omitted.
관심영역 추출을 통한 분산 비디오 코딩(Distributed Video Coding Using Region Extraction distributeddistributed videovideo codingcoding , , DVCDVC ))
도 1은 본 발명의 일 실시예에 따른 분산 비디오 코딩에서 관심영역 추출방법을 나타내는 도면이다.1 is a diagram illustrating a region of interest extraction method in distributed video coding according to an embodiment of the present invention.
픽셀 도메인 분산 비디오 코딩의 부호화하는 과정을 보면, 기존의 분산 비디오 코딩과 같이 프레임 영상을 홀수 프레임과 짝수 프레임으로 분류하여 각각을 키프레임()과 Wyner-Ziv(WZ) 프레임()으로 나누어 처리한다. 여기서 홀수 프레임과 짝수 프레임의 구별은 프레임 카운팅을 시작하는 시간 색인을 0으로 할 것인지, 1로 할 것인지에 따라 구별되며, 이하 본 발명의 명세서에서는 프레임 카운팅을 시작하는 색인을 1로 하여 설명할 것이며, 따라서 키프레임의 시간 색인은 홀수가 되고, WZ 프레임의 시간 색인은 짝수가 된다. 키프레임의 시간 색인이 짝수가 되고, WZ 프레임의 시간 색인이 홀수가 될 수도 있다.키프레임과 WZ 프레임은 서로 독립적으로 부호화되며, H.264 인트라 인코더(intra encoder, 101)는 키프레임을 H.264 인트라 부호화를 한다.In the encoding process of pixel domain distributed video coding, as in the conventional distributed video coding, a frame image is classified into odd frames and even frames, and each of them is keyframe ( ) And Wyner-Ziv (WZ) frames ( Divided by) Here, the distinction between the odd frame and the even frame is distinguished according to whether the time index for starting frame counting is 0 or 1, and in the following specification, the index for starting frame counting will be described as 1, Therefore, the temporal index of the keyframe becomes odd, and the temporal index of the WZ frame becomes even. The temporal indexes of the keyframes may be even, and the temporal indexes of the WZ frames may be odd. The keyframes and the WZ frames are encoded independently of each other, and the H.264
관심영역 추출부(102)는 WZ 프레임을 부호화하기 위해 관심영역()을 추출하여, 추출된 관심영역()을 부호화부(103)에 전달한다. 관심영역()을 추출하는 구체적인 방법은 아래에서 설명한다.The
부호화부(103)는 추출된 관심영역()만을 부호화하여 압축한다.The
픽셀 도메인 분산 비디오 코딩의 복호화하는 과정을 보면, H.264 인트라 디코더(104)가 H.264 인트라 복호를 수행하고, 복호된 키프레임(, )을 보조정보 생성부(105)로 전달한다.In the decoding process of the pixel domain distributed video coding, the H.264
보조정보 생성부(105)는 복호된 키프레임(, )을 이용하여 WZ 프레임과 닮은 보조정보()를 생성하게 된다.The auxiliary
복호화부(106)는 보조정보 생성부(105)에서 생성된 보조정보() 및 부호화부(103)에서 얻어진 WZ 프레임의 압축된 정보()를 이용하여 WZ 프레임의 비트 스트림()을 생성 된다.The
마지막 단계로 재구성부(107)는 비트 스트림() 및 보조정보()를 이용하여 최종적으로 WZ 프레임()을 복원한다.
As a last step, the
전체영상 단위 관심영역(Whole video unit of interest regionregion ofof interestinterest , , ROIROI ) 추출방법) Extraction Method
도 2a는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법에 사용된 영상(200)을 나타내는 도면이다.2A is a diagram illustrating an
영상(200)은 홀 모니터(hall monitor) 영상이며, 영상(200)은 복도 중앙 영역에 위치한 두 명의 사람(201,202), 복도 양쪽의 벽(205, 206) 및 세 개의 출입문(203, 204, 207)을 포함한다.
일반적으로 홀 모니터 영상에서 관심영역을 추출할 경우 움직임(motion)이 많은 복도 중앙 영역을 관심영역으로 추출하는 것이 바람직하다. 그러나 이것은 직관적인 결과이고, 이하 체계적인 방법으로 관심영역을 찾는 방법을 설명한다.In general, when the ROI is extracted from the hall monitor image, it is preferable to extract the center area of the corridor with a lot of motion as the ROI. However, this is an intuitive result and the following describes how to find a region of interest in a systematic manner.
도 2b는 본 발명의 일 실시예에 따른 전체영상 단위 관심영역 추출방법을 나타내는 순서도이다.2B is a flowchart illustrating a method of extracting an entire region of interest unit of interest according to an embodiment of the present invention.
전체영상 단위 관심영역 추출방법은 Wyner-Ziv(WZ) 프레임을 부호화하기 전에 영상(200) 전체에 대해서 관심영역을 추출하는 방법을 말한다. 전체영상 단위 관심영역 추출 방법은 다음과 같은 절차로 수행된다.The entire image unit ROI extraction method refers to a method of extracting an ROI for the
먼저 전체영상의 프레임들 사이에 MAD(mean absolute difference) 맵을 생성한다(S201).First, a MAD (mean absolute difference) map is generated between frames of the entire image (S201).
그 후 생성된 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성한다(S202).Thereafter, a SAD distribution is generated using the generated MAD map (S202).
그 후 생성된 SAD 분포도를 이용하여 관심영역을 결정한다(S203).After that, the region of interest is determined using the generated SAD distribution (S203).
이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.
MADMAD (( meanmean absoluteabsolute differencedifference )맵 생성Create map
MAD(mean absolute difference)는 절대값 차이의 평균값을 의미한다.Mean absolute difference (MAD) means the average value of absolute differences.
MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하며, MAD 맵은 전체영상의 이전 키프레임(key frame)과 다음 키프레임과의 절대값 차이의 평균값을 이용하여 구한다.Each pixel in the MAD map and keyframe contains height and width location information, and the MAD map is the absolute difference between the previous keyframe and the next keyframe of the entire image. Calculate using the average value of.
아래 수식(1)과 같이 키프레임들의 절대값의 차를 구하고, 이를 모두 더하여 평균을 구한다.As shown in Equation (1) below, the difference between the absolute values of the key frames is obtained and the sum is added to find the average.
...(1) ...(One)
여기서 은 시간 색인이 2n-1 번째인 키프레임을 의미하고, 는 2n-1 번째 프레임의 높이위치정보인 x, 너비위치정보인 y인 위치의 픽셀 값을 의미한다. 그리고 N은 전체 키프레임의 개수를 의미하고, 는 각각 프레임의 높이(height)와 너비(width)를 의미한다.here Means a keyframe with a time index of 2n-1th, X is the height position information of the 2n-1th frame and y is the width position information The pixel value of the position. And N is the total number of keyframes, Are the height and width of the frame, respectively.
수식(1)을 통해서 구한 을 높이위치정보(x), 너비위치정보인 (y)로 2차원 맵(map)으로 나타낸 것이 MAD 맵이다.
Obtained by Equation (1) MAD map is represented by height position information (x) and width position information (y) as two-dimensional maps.
SADSAD 분포도 생성 Generate distribution
SAD(sum of absolute difference) 분포도는 절대값의 차이를 합한 값을 일정기준의 위치에 따른 분포 정도를 나타낸다.The SAD (sum of absolute difference) distribution shows the distribution of the sum of the absolute values according to the position of a certain standard.
SAD 분포도는 앞서 MAD 맵을 생성하는 과정에서 구한 를 이용하여 구하며, SAD 분포도는 수직 SAD 분포도와 수평 SAD 분포도가 있다.The SAD distribution map was obtained from the process of generating the MAD map. The SAD distribution chart has a vertical SAD distribution and a horizontal SAD distribution.
도 3a는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수직 SAD 분포도를 나타내는 도면이다.3A is a diagram illustrating a vertical SAD distribution diagram of an
수직 SAD 분포도는 MAD 맵에 포함됨 각 픽셀의 높이위치정보를 수직 방향으로 더하여 생성한다. 즉, 에서 일정기준을 너비(y)로 두고, 특정한 너비(y)에 대응하는 높이(x)값을 수직으로 더한다.The vertical SAD distribution map is generated by adding the height position information of each pixel included in the MAD map in the vertical direction. In other words, In Figure 3, a certain criterion is defined as width (y), and the height (x) corresponding to a specific width (y) is added vertically.
구체적인 수식은 아래 수식(2.a)와 같다.The specific formula is shown in the following formula (2.a).
...(2.a) ... (2.a)
수직 SAD 분포도를 보면 너비(width, y)가 대략 30 ~ 110 부분의 SAD 값(301)이 주변보다 상대적으로 더 크다. 결국 전체영상에서 너비(width, y)가 30 ~ 110 부분이 관심영역의 너비위치가 될 것이다. 관심영역 너비위치 결정 여부는 아래에서 체계적인 방법으로 관심영역을 찾는 방법으로 설명한다.Looking at the vertical SAD distribution, the width (y) of the
도 3b는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법에 사용된 영상(200)의 수평 SAD 분포도를 나타내는 도면이다.3B is a diagram illustrating a horizontal SAD distribution diagram of an
수평 SAD 분포도는 MAD 맵에 포함됨 각 픽셀의 너비위치정보를 수평 방향으로 더하여 생성한다. 즉, 에서 일정기준을 높이(x)로 두고, 특정한 높이(x)에 대응하는 너비(y)값을 수평으로 더한다.The horizontal SAD distribution map is created by adding the width position information of each pixel in the horizontal direction. In other words, Set a certain criterion as height (x) in, and horizontally add the width (y) value corresponding to the specific height (x).
구체적인 수식은 아래 수식(2.b)와 같다.The specific formula is shown in the following formula (2.b).
...(2.b) ... (2.b)
수평 SAD 분포도를 보면 높이(height, x)가 대략 30 ~ 120 부분의 SAD 값(302)이 주변보다 상대적으로 더 크다. 결국 전체영상에서 높이(height, x)가 30 ~ 120 부분이 관심영역의 높이위치가 될 것이다. 관심영역 높이위치 결정 여부는 아래에서 체계적인 방법으로 관심영역을 찾는 방법으로 설명한다.
Looking at the horizontal SAD distribution, the height (x) of approximately 30 to 120 parts of the
관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 결정) decision
관심영역(ROI) 결정은 수직 SAD 분포도 와 수평 SAD 분포도 를 기반으로 관심영역의 위치를 결정하는 것이다.ROI determination is based on vertical SAD distribution And horizontal SAD distribution Location of region of interest To determine.
관심영역의 높이위치()를 찾기 위해서는 아래 수식 (3.a)와 같이 먼저 도 3b에 나타낸 수평 SAD 분포도에서 관심영역의 높이 () 크기의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 첫 높이가 바로 관심 영역의 세로 위치()이다.The height of the region of interest ) To find the height of the region of interest in the horizontal SAD distribution plot shown in Figure 3b, as shown in equation (3.a) below: As you move the window of size from beginning to end, you must find the window with the largest sum of SAD values that belong to that window. The first height of the window with the largest sum of SAD values is then the vertical position of the region of interest ( )to be.
...(3.a) ... (3.a)
또한, 같은 방법으로 관심영역의 너비위치()를 찾기 위해서는 아래 수식 (3.b)와 같이 도 3a에 나타낸 수직 SAD 분포도에서 관심영역의 너비 () 크기의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 첫 너비 위치가 바로 관심 영역의 너비 위치()이다.Also, in the same way, the width position of the region of interest ( ), The width of the region of interest in the vertical SAD distribution plot shown in Figure 3a as shown in equation (3.b) below. As you move the window of size from beginning to end, you must find the window with the largest sum of SAD values that belong to that window. The first width position of the window with the largest sum of SAD values is then the width position of the region of interest ( )to be.
...(3.b) ... (3.b)
여기서 와 는 각각 관심영역의 높이크기와 너비크기를 의미한다.here Wow Are the height and width of the ROI, respectively.
도 4는 본 발명의 일 실시예에 따른 전체영상 단위의 관심영역 추출방법을 사용하여 홀 모니터 영상에 대해서 관심영역을 추출한 결과를 나타내는 도면이다.FIG. 4 is a diagram illustrating a result of extracting a region of interest with respect to a hall monitor image by using a method of extracting a region of interest in an entire image unit according to an embodiment of the present invention.
전체영상(200)에서 홀 모니터 영상에서 관심영역을 추출할 경우 움직임이 많은 복도 중앙 영역을 관심영역으로 추출하는 것이 바람직하고, 본 발명에 따른 전체영상 단위의 관심영역 추출방법을 사용한 결과 도 4와 같이 관심영역(410)이 결정된다.When the region of interest is extracted from the hall monitor image from the
여기서 관심영역의 높이크기() 및 너비크기()는 임의로 조정이 가능한 값이고, 일반적으로는 전체영상의 높이크기 및 너비크기()의 절반으로 설정한다.Where the height of the region of interest ( ) And width size ( ) Is a value that can be arbitrarily adjusted, and in general, the height size and width size ( Set to half of).
본 발명에 따르면 키프레임은 부호기와 복호기가 동시에 가지는 정보이므로 다른 정보없이 키프레임만을 이용하여 관심영역을 추출이 가능하다. 따라서 부호기가 관심영역에 대한 정보를 복호기에 알려주지 않아도 복호기가 부호기와는 독립적으로 관심영역을 추출하여 복호화 과정에 사용할 수 있는 장점이 있다.
According to the present invention, since the key frame is information that the encoder and the decoder have at the same time, the ROI can be extracted using only the key frame without any other information. Therefore, even if the encoder does not inform the decoder about the region of interest, the decoder can extract the region of interest independently from the encoder and use it in the decoding process.
프레임(frame( frameframe ) 단위 관심영역(Unit of interest ( regionregion ofof interestinterest , , ROIROI ) 추출방법) Extraction Method
앞서 설명한 전체영상 단위 관심영역 추출방법은 전체영상을 부호화하기 전에 한 번만 수행되지만, 프레임 단위 관심영역 추출방법은 각각의 프레임을 부호화하기 전에 매번 수행된다. 프레임 단위 관심영역 추출방법은 다음과 같은 절차로 수행된다.The above-described method of extracting a region of interest of an entire image unit is performed only once before encoding the entire image, but the method of extracting a region of interest of a frame unit is performed each time before encoding each frame. The method of extracting an ROI in a frame unit is performed by the following procedure.
도 5는 본 발명의 일 실시예에 따른 프레임 단위 관심영역 추출방법을 나타내는 순서도이다.5 is a flowchart illustrating a method of extracting a region of interest region per frame according to an embodiment of the present invention.
먼저 각각의 프레임에 대해서 ARM(absolute residual map)을 생성한다(S501).First, an absolute residual map (ARM) is generated for each frame (S501).
그 후 생성된 ARM을 이용하여 SAD(sum of absolute difference) 분포도를 생성한다(S502).Then, using the generated ARM to generate a sum of absolute difference (SAD) distribution (S502).
그 후 생성된 SAD 분포도를 이용하여 관심영역을 결정한다(S503).After that, the region of interest is determined using the generated SAD distribution (S503).
이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.
ARMARM (( absoluteabsolute residualresidual mapmap ) 생성) produce
먼저 번째 프레임을 부호화 한다고 가정하면, 아래 수식 (4)와 같이 이전() 프레임과 다음() 프레임의 절대값 차이인 ARM(Absolute Residual Map)을 생성한다.first Assuming that the first frame is to be encoded, the previous ( ) Frame and the next ( Absolute Residual Map (ARM), which is the absolute difference of frames, is generated.
...(4) ...(4)
여기서 는 시간 색인인 n 번째 프레임을 의미하고, 은 n번째 프레임의 높이위치정보(x) 및 너비위치정보(y)의 위치의 픽셀값을 의미한다.
here Means the nth frame, which is the time index, Is the position of height position information (x) and width position information (y) of the nth frame. Means the pixel value of.
SADSAD 분포도 생성 Generate distribution
SAD(sum of absolute difference) 분포도는 절대값의 차이를 합한 값을 일정기준의 위치에 따른 분포 정도를 나타낸다.The SAD (sum of absolute difference) distribution shows the distribution of the sum of the absolute values according to the position of a certain standard.
SAD 분포도는 앞서 ARM을 생성하는 과정에서 구한 를 이용하여 구하며, SAD 분포도는 수직 SAD 분포도와 수평 SAD 분포도가 있다.SAD distribution was obtained from the previous ARM generation process. The SAD distribution chart has a vertical SAD distribution and a horizontal SAD distribution.
수직 SAD 분포도는 ARM에 포함됨 각 픽셀의 높이위치정보를 수직 방향으로 더하여 생성한다. 구체적인 수식은 아래 수식(5.a)와 같다.The vertical SAD distribution map is included in ARM. It is generated by adding height position information of each pixel in the vertical direction. The specific formula is shown in the following formula (5.a).
...(5.a) ... (5.a)
수평 SAD 분포도는 ARM에 포함됨 각 픽셀의 너비위치정보를 수평 방향으로 더하여 생성한다. 구체적인 수식은 아래 수식(5.b)와 같다.The horizontal SAD distribution map is included in ARM. It is created by adding the width position information of each pixel in the horizontal direction. The specific formula is shown in the following formula (5.b).
...(5.b)
... (5.b)
관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 결정) decision
관심영역 결정은 수직 SAD 분포도 와 수평 SAD 분포도 를 기반으로 관심영역의 위치를 결정하는 것이다.Region of interest determination is a vertical SAD distribution And horizontal SAD distribution Location of region of interest To determine.
관심영역의 높이위치()를 찾기 위해서는 아래 수식 (6.a)와 같이 먼저 수평 SAD 분포도에서 관심영역의 높이 크기()의 창을 처음부터 끝까지 이동하면서 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 높이 위치가 바로 관심영역 의 높이()이다.The height of the region of interest ) To find the height size of the ROI in the horizontal SAD distribution plot (6.a) As you move through the windows of), you must find the window with the largest sum of the SAD values that belong to the window. Then, the height position of the window with the largest sum of SAD values is the height of the region of interest ( )to be.
...(6.a) ... (6.a)
또한, 같은 방법으로 관심영역의 너비위치()를 찾기 위해서는 아래 수식 (6.b)와 같이 먼저 수직 SAD 분포도에서 관심영역의 너비크기()의 창을 처음부터 끝까지 이동하면서 그 창에 속하는 SAD 값들의 합이 가장 큰 창을 찾아야 한다. 그 후, SAD 값들의 합이 가장 큰 창의 너비 위치가 바로 관심영역의 너비위치()를 찾는다.Also, in the same way, the width position of the region of interest ( ) To find the width size of the region of interest in the vertical SAD distribution plot (6.b). Move the window of) from start to finish and find the window with the largest sum of SAD values that belong to that window. After that, the width of the window with the largest sum of SAD values is the width of the region of interest ( Find).
...(6.b)
... (6.b)
블록(block( blockblock ) 단위 관심영역(Unit of interest ( ROIROI ) 추출방법) Extraction Method
도 6a는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하는 영상을 나타낸 도면이다.FIG. 6A is a diagram illustrating an image using a method of extracting a block of interest region according to an embodiment of the present invention. FIG.
영상에는 사람(601)이 있으며 주변 배경과 비교하여 움직임이 있는 사람의 영역은 사각형보다는 삼각형(602)에 가깝다.There is a
앞서 소개한 전체영상 단위 관심영역 추출방법 및 프레임 단위 관심영역 추출방법의 관심영역의 모양은 직사각형으로 고정되고 그 직사각형의 높이 및 너비의 크기만 변화가 가능하다. 그러나 이는 움직임(motion)의 변화가 큰 영역이 전체영상에서 특정영역에 몰려있는 경우가 아닌 도 5와 같은 영상에서는 적합하지 않다. 즉 하나의 큰 관심영역을 추출하는 전체영상 단위 관심영역 추출방법 및 프레임 단위 관심영역 추출방법은 도 5와 같은 영상에서는 효율성 측면에서 바람직하지 않다.The shape of the ROI of the entire image unit ROI extraction method and the frame unit ROI extraction method is fixed as a rectangle, and only the height and width of the rectangle can be changed. However, this is not suitable for an image as shown in FIG. 5, unless a region having a large change in motion is concentrated in a specific region in the whole image. That is, the entire image unit ROI extraction method and the frame unit ROI extraction method for extracting one large ROI are not preferable in terms of efficiency in the image of FIG. 5.
따라서 움직임의 변화가 큰 부분이 다양한 영상에 적합한 관심영역을 추출하기 위해서는 여러 개의 작은 관심영역을 추출하거나 관심영역의 크기도 바뀌어야 한다.Therefore, in order to extract a region of interest suitable for various images in which a large change in motion is required, several small regions of interest must be extracted or the size of the region of interest must also be changed.
위와 같은 문제를 해결하기 위해 프레임 영상을 작은 크기의 복수개의 블록으로 나누고, 움직임이 많은 블록을 선택하고, 선택된 블록들은 제안된 블록 단위 ROI를 구성한다.In order to solve the above problem, the frame image is divided into a plurality of blocks of small size, a block having a lot of motion is selected, and the selected blocks constitute a proposed block unit ROI.
이때 선택된 블록들의 개수는 선택된 블록의 전체 면적이 앞서 설명한 전체영상 단위 및 프레임 단위 관심영역 추출방법을 사용하여 추출한 관심영역의 크기와 같게 정한다. 블록 단위 ROI 추출 방법은 다음과 같은 절차로 수행된다.In this case, the number of selected blocks is determined such that the total area of the selected blocks is equal to the size of the ROI extracted by using the above-described method of extracting the ROI and the image unit. The block-based ROI extraction method is performed by the following procedure.
도 6b는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 나타내는 순서도이다.6B is a flowchart illustrating a method of extracting an ROI in a block unit according to an embodiment of the present invention.
먼저 전체영상을 M 개(M 은 정수)의 블록으로 분할한다(S601). 여기서 블록의 개수 M은 임의로 정할 수 있으며, 블록의 개수가 많을수록 각각의 블록의 크기는 작아진다.First, the whole image is divided into M blocks (M is an integer) (S601). Here, the number M of blocks can be arbitrarily determined, and the larger the number of blocks, the smaller the size of each block.
그 후 각 블록의 블록 SAD(sum of absolute difference)를 계산한다(S602).Thereafter, a block sum of absolute difference (SAD) of each block is calculated (S602).
그 후 계산된 블록 SAD 값을 이용하여 관심영역 블록들을 선택한다(S603).Thereafter, the ROI blocks are selected using the calculated block SAD value (S603).
이하에서는 각각의 단계에 대하여 상세히 설명하도록 한다.
Hereinafter, each step will be described in detail.
블록 block SADSAD (( sumsum ofof absoluteabsolute differencedifference ) 계산) Calculation
블록 단위 관심영역 추출방법은 앞서 설명한 프레임 단위 관심영역 추출 방법과 같이 각각의 프레임을 부호화하기 전에 매번 수행된다.The block unit of interest region extraction method is performed every time before each frame is encoded, as in the frame unit region of interest extraction method described above.
먼저 번째 프레임을 부호화한다고 가정하면, 아래 수식 (7)과 같이 이전() 프레임과 다음() 프레임의 차이값의 절대값을 취하고 이를 블록의 높이 및 너비로 더하여 계산한다.first Assuming that the first frame is to be encoded, the previous ( ) Frame and the next ( ) Is calculated by taking the absolute value of the difference of the frames and adding it to the height and width of the block.
...(7) ... (7)
여기서 은 시간 색인이 2n 번째 프레임을 의미하고, i는 각각의 분할된 블록의 높이위치를 의미하며, j는 각각의 분할된 블록의 너비위치를 나타낸다. i 및 j 값의 범위는 이 된다.here Denotes a 2n-th frame of time index, i denotes a height position of each divided block, and j denotes a width position of each divided block. i and j values range Becomes
여기서 h는 분할된 블록의 높이의 크기를 의미하고, w는 분할된 블록의 너비의 크기를 의미한다.
Here, h means the size of the height of the divided block, w is the size of the width of the divided block.
관심영역(Area of interest ( regionregion ofof interestinterest , , ROIROI ) 블록 선택Block selection
블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계이다. 움직임이 많은 영역이 관심영역이므로 각각의 블록이 가지는 블록 SAD 값이 큰 블록들을 선택한다. 블록 SAD 값이 큰 순서대로 N 개를 선택한다. 여기서 N은 정수이며, 그 범위는 (1< N≤ M)이 되며, M은 앞서 전체영상을 분할하는 블록의 전체 개수이다.In this step, the ROI block is selected using the block SAD value. Since the region with much motion is the region of interest, blocks having a large block SAD value of each block are selected. N blocks are selected in order of block SAD values. Where N is an integer, and the range is (1 <N ≦ M), where M is the total number of blocks for dividing the entire image.
보통은 블록 SAD 값이 큰 순서대로 선택된 블록들의 개수는 선택된 블록의 전체 면적이 앞서 설명한 전체영상 단위 및 프레임 단위 관심영역 추출방법을 사용하여 추출한 관심영역의 크기와 같게 정한다.In general, the number of blocks selected in order of increasing block SAD value is determined so that the total area of the selected blocks is equal to the size of the ROI extracted by using the above-described method of extracting ROIs by the entire image unit and frame.
도 6c는 본 발명의 일 실시예에 따른 블록 단위 관심영역 추출방법을 사용하여 관심영역을 추출한 결과를 나타내는 도면이다.FIG. 6C is a diagram illustrating a result of extracting a region of interest using a block-based region of interest extraction method according to an embodiment of the present invention. FIG.
사람(601)의 움직임을 복수개의 작은 블록(610)을 사용하여 관심영역을 추출하였고, 이는 전체영상 단위 및 프레임 단위로 관심영역을 추출하는 방법보다 효율성 측면에서 바람직하다.
The region of interest is extracted by using the plurality of
이상에서 보는 바와 같이, 본 발명이 속하는 기술 분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시 될 수 있다는 것을 이해할 수 있을 것이다. As described above, those skilled in the art to which the present invention pertains will understand that the present invention may be implemented in other specific forms without changing the technical spirit or essential features.
그러므로 이상에서 기술한 실시 예는 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로 이해해야만 하고, 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.Therefore, the embodiments described above are to be understood in all respects as illustrative and not restrictive, and the scope of the present invention is indicated by the following claims rather than the above description, and the meaning and scope of the claims and All changes or modifications derived from the equivalent concept should be interpreted as being included in the scope of the present invention.
101: 인트라 인코더
102: 관심영역 추출부
103: 부호화부
104: 인트라 디코더부
105: 보조정보 생성부
106: 복호화부
401: 관심영역
610: 관심영역 블록101: intra encoder
102: region of interest extraction unit
103: encoder
104: intra decoder unit
105: auxiliary information generator
106: decryption unit
401: region of interest
610: region of interest block
Claims (16)
상기 영상에 대한 MAD(mean absolute difference) 맵을 생성하는 단계;
상기 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 영상의 관심영역 추출방법.
As a method of extracting a region of interest (ROI) of an image,
Generating a mean absolute difference (MAD) map for the image;
Generating a sum of absolute difference (SAD) distribution map using the MAD map; And
And determining a region of interest using the SAD distribution map.
상기 MAD 맵은 이전 키프레임(key frame)과 다음 키프레임의 절대값 차이의 평균값을 이용하여 생성하고,
상기 MAD 맵 및 키프레임에 포함된 각 픽셀은 높이(height)위치정보 및 너비(width)위치정보를 포함하는, 영상의 관심영역 추출방법.
The method of claim 1,
The MAD map is generated using an average value of an absolute difference between a previous key frame and a next key frame.
Each pixel included in the MAD map and the key frame includes height location information and width location information.
상기 SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고,
상기 수직 SAD 분포도는 소정의 너비위치에서 상기 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 더하여 생성하고,
상기 수평 SAD 분포도는 소정의 높이위치에서 상기 MAD 맵에 포함된 각 픽셀이 가지는 MAD 값을 수평 방향으로 더하여 생성하는, 영상의 관심영역 추출방법.
The method of claim 2,
The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart,
The vertical SAD distribution map is generated by adding MAD values of each pixel included in the MAD map at a predetermined width position,
The horizontal SAD distribution map is generated by adding a MAD value of each pixel included in the MAD map in a horizontal direction at a predetermined height position.
상기 관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고,
상기 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고,
상기 관심영역의 높이위치정보는 상기 관심영역의 높이에 속하는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고,
상기 관심영역의 너비위치정보는 상기 관심영역의 너비에 속하는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는, 영상의 관심영역 추출방법.
The method of claim 3,
The ROI is a rectangle having a height smaller than the height of the entire image and having a width smaller than the width of the entire image.
Each pixel included in the ROI includes height location information and width location information.
The height position information of the ROI indicates a height position of the ROI in which the sum of the horizontal SAD values belonging to the height of the ROI is the largest.
The width position information of the region of interest indicates a width position of the region of interest in which the sum of the vertical SAD values belonging to the width of the region of interest is the largest position.
상기 관심영역의 높이위치정보는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고,
상기 관심영역의 너비위치정보는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는, 영상의 관심영역 추출방법.
The method of claim 4, wherein
The height position information of the ROI includes height position information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest.
The width position information of the ROI includes height position information of the leftmost pixel of the ROI where the sum of the vertical SAD values is the largest.
ARM(absolute residual map)을 생성하는 단계;
상기 ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 관심영역 추출방법.
In the ROI extraction method for an image,
Generating an absolute residual map (ARM);
Generating a sum of absolute difference (SAD) distribution map using the ARM; And
And determining a region of interest using the SAD distribution map.
상기 ARM은 이전 키프레임과 다음 키프레임의 절대값 차이를 이용하여 생성하고,
상기 ARM 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 관심영역 추출방법.
The method of claim 6,
The ARM is generated using the absolute difference between the previous keyframe and the next keyframe,
Each pixel included in the ARM and the key frame includes height position information and width position information.
상기 SAD 분포도는 수직 SAD 분포도 및 수평 SAD 분포도를 포함하고,
상기 수직 SAD 분포도는 소정의 너비위치에서 상기 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하고,
상기 수평 SAD 분포도는 소정의 높이위치에서 상기 ARM에 포함된 각 픽셀이 가지는 ARM 값을 더하여 생성하는, 관심영역 추출방법.
The method of claim 7, wherein
The SAD distribution chart includes a vertical SAD distribution chart and a horizontal SAD distribution chart,
The vertical SAD distribution chart is generated by adding an ARM value of each pixel included in the ARM at a predetermined width position,
The horizontal SAD distribution chart is generated by adding an ARM value of each pixel included in the ARM at a predetermined height position.
상기 관심영역은 전체영상의 높이보다 작은 높이를 가지고, 전체영상의 너비보다 작은 너비를 가지는 사각형이고,
상기 관심영역에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하고,
상기 관심영역의 높이위치정보는 상기 관심영역의 높이에 속하는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 높이위치를 나타내고,
상기 관심영역의 너비위치정보는 상기 관심영역의 너비에 속하는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 너비위치를 나타내는, 관심영역 추출방법.
The method of claim 8,
The ROI is a rectangle having a height smaller than the height of the entire image and having a width smaller than the width of the entire image.
Each pixel included in the ROI includes height location information and width location information.
The height position information of the ROI indicates a height position of the ROI in which the sum of the horizontal SAD values belonging to the height of the ROI is the largest.
Width position information of the region of interest indicates a width position of the region of interest in which the sum of the vertical SAD values belonging to the width of the region of interest is the largest;
상기 관심영역의 높이위치정보는 상기 수평 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 상단 픽셀의 높이 위치정보를 포함하고,
상기 관심영역의 너비위치정보는 상기 수직 SAD 값들의 합이 가장 큰 위치가 되는 관심영역의 가장 왼쪽 픽셀의 높이 위치정보를 포함하는, 관심영역 추출방법.
10. The method of claim 9,
The height position information of the ROI includes height position information of the top pixel of the ROI where the sum of the horizontal SAD values is the largest.
The width position information of the ROI includes height position information of the leftmost pixel of the ROI where the sum of the vertical SAD values is the largest.
상기 영상을 M 개(M 은 정수)의 블록으로 분할하는 단계;
상기 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계; 및
상기 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고,
상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고,
상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 관심영역 추출방법.
In the ROI extraction method for an image,
Dividing the image into M blocks (M is an integer);
Calculating a block sum of absolute difference (SAD) of each block; And
Selecting the ROI block using the block SAD value;
The block SAD is obtained by adding the difference between the previous keyframe and the next keyframe to the height and width of the block,
Each pixel included in the block SAD and the key frame includes height position information and width position information.
상기 관심영역 블록은 상기 블록 SAD 값이 큰 순서대로 N 개(1< N ≤M, N은 정수)를 선택하는, 관심영역 추출방법.
The method of claim 11,
And the region of interest block selects N pieces (1 <N ≦ M, N is an integer) in order of increasing block SAD value.
MAD(mean absolute difference)맵을 생성하는 단계;
상기 MAD 맵을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 컴퓨터 판독가능 매체.
A computer readable medium containing computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) of an image, wherein the following steps comprise:
Generating a mean absolute difference (MAD) map;
Generating a sum of absolute difference (SAD) distribution map using the MAD map; And
And determining a region of interest using the SAD distribution map.
ARM(absolute residual map)을 생성하는 단계;
상기 ARM 을 이용하여 SAD(sum of absolute difference) 분포도를 생성하는 단계; 및
상기 SAD 분포도를 이용하여 관심영역을 결정하는 단계를 포함하는, 컴퓨터 판독가능 매체.
A computer readable medium comprising computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) for an image, the following steps:
Generating an absolute residual map (ARM);
Generating a sum of absolute difference (SAD) distribution map using the ARM; And
And determining a region of interest using the SAD distribution map.
영상을 M 개(M 은 정수)의 블록으로 분할하는 단계;
상기 각 블록의 블록 SAD(sum of absolute difference)를 계산하는 단계; 및
상기 블록 SAD 값을 이용하여 관심영역 블록을 선택하는 단계를 포함하고,
상기 블록 SAD는 이전 키프레임과 다음 키프레임의 차이를 절대값을 취하여 상기 블록의 높이 및 너비로 더하여 구하고,
상기 블록 SAD 및 키프레임에 포함된 각 픽셀은 높이위치정보 및 너비위치정보를 포함하는, 컴퓨터 판독가능 매체.A computer readable medium comprising computer executable instructions for causing a computer to perform the following steps, wherein the computer readable medium extracts a region of interest (ROI) for an image, the following steps:
Dividing the image into M blocks (M is an integer);
Calculating a block sum of absolute difference (SAD) of each block; And
Selecting the ROI block using the block SAD value;
The block SAD is obtained by adding the difference between the previous keyframe and the next keyframe to the height and width of the block,
And each pixel included in the block SAD and a keyframe includes height position information and width position information.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100001560A KR101076272B1 (en) | 2010-01-08 | 2010-01-08 | Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100001560A KR101076272B1 (en) | 2010-01-08 | 2010-01-08 | Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110081413A KR20110081413A (en) | 2011-07-14 |
KR101076272B1 true KR101076272B1 (en) | 2011-10-26 |
Family
ID=44919921
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100001560A KR101076272B1 (en) | 2010-01-08 | 2010-01-08 | Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101076272B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102195669B1 (en) * | 2018-12-03 | 2020-12-28 | 주식회사 리메드 | Apparatus for transmitting image |
CN110120012B (en) * | 2019-05-13 | 2022-07-08 | 广西师范大学 | Video stitching method for synchronous key frame extraction based on binocular camera |
CN110363197B (en) * | 2019-06-22 | 2023-05-23 | 东北电力大学 | Video region of interest extraction method based on improved visual background extraction model |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100663483B1 (en) | 2005-08-09 | 2007-01-02 | 삼성전자주식회사 | Apparatus and method of unmanned surveillance using an omni-directional camera |
-
2010
- 2010-01-08 KR KR1020100001560A patent/KR101076272B1/en not_active IP Right Cessation
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100663483B1 (en) | 2005-08-09 | 2007-01-02 | 삼성전자주식회사 | Apparatus and method of unmanned surveillance using an omni-directional camera |
Non-Patent Citations (1)
Title |
---|
논문 1 : BRUNEL UNIV. 2009 |
Also Published As
Publication number | Publication date |
---|---|
KR20110081413A (en) | 2011-07-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10110902B2 (en) | Method and apparatus for encoding/decoding motion vector | |
WO2006073116A1 (en) | Video encoding method and device, video decoding method and device, program thereof, and recording medium containing the program | |
JP2015165695A (en) | Method and apparatus for decoding image | |
CN102595132A (en) | Distributed video encoding and decoding method applied to wireless sensor network | |
KR101076272B1 (en) | Method for extracting region of interest based on pixel domain for distributed video coding and computer readable medium thereof | |
KR20160030140A (en) | Method and apparatus for decoding image | |
KR101477545B1 (en) | Method for decoding motion vector | |
KR101477546B1 (en) | Apparatus for decoding motion vector | |
KR101617796B1 (en) | Method and apparatus for decoding image | |
KR101454664B1 (en) | Method for decoding motion vector | |
KR101606812B1 (en) | Method and apparatus for decoding image |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140930 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20151002 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |