KR101220816B1 - 화면내 에지를 검출하는 방법 - Google Patents

화면내 에지를 검출하는 방법 Download PDF

Info

Publication number
KR101220816B1
KR101220816B1 KR1020120047364A KR20120047364A KR101220816B1 KR 101220816 B1 KR101220816 B1 KR 101220816B1 KR 1020120047364 A KR1020120047364 A KR 1020120047364A KR 20120047364 A KR20120047364 A KR 20120047364A KR 101220816 B1 KR101220816 B1 KR 101220816B1
Authority
KR
South Korea
Prior art keywords
edge
segment
map
binary
edge map
Prior art date
Application number
KR1020120047364A
Other languages
English (en)
Inventor
박천수
Original Assignee
상명대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 상명대학교 산학협력단 filed Critical 상명대학교 산학협력단
Priority to KR1020120047364A priority Critical patent/KR101220816B1/ko
Application granted granted Critical
Publication of KR101220816B1 publication Critical patent/KR101220816B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/12Edge-based segmentation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T3/00Geometric image transformations in the plane of the image
    • G06T3/40Scaling of whole images or parts thereof, e.g. expanding or contracting
    • G06T3/403Edge-driven scaling; Edge-based scaling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/10Segmentation; Edge detection
    • G06T7/155Segmentation; Edge detection involving morphological operators
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20021Dividing image into blocks, subimages or windows

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

개시된 에지 검출 방법은 비디오 프레임을 블록 단위로 구획하는 단계, 타겟 블록에서 에지 세그먼트를 검출하는 단계 및 상기 타겟 블록에서 검출된 에지 세그먼트들을 연결하여 에지맵을 생성하는 단계를 포함한다. 상기 에지 세그먼트를 검출하는 단계는 타겟 블록 내 각 픽셀에 대해 밝기 변화율(Intensity gradient)을 계산하는 단계, 상기 밝기 변화율을 기초로 상기 타겟 블록 내 에지 세그먼트의 위치를 나타내는 이진 에지맵(binary edge map)을 생성하는 단계, 상기 이진 에지맵에서 노이즈를 제거하는 단계 및 상기 노이즈가 제거된 이진 에지맵에서 복수의 에지 라인이 검출되는 경우 가장 외곽의 에지 세그먼트를 제외한 나머지 에지 세그먼트는 제거하는 단계를 포함하며, 상기 에지맵을 생성하는 단계는 상기 에지 세그먼트의 끝점(end point)을 결정하는 단계 및 상기 에지 세그먼트의 끝점 사이의 간극(gap)을 채워서 각 에지 세그먼트를 연결하는 단계를 포함한다.

Description

화면내 에지를 검출하는 방법{METHOD OF DETECTING AN EDGE ON SCREEN}
개시된 기술은 비디오 화면 내에 포함된 객체의 에지를 검출하는 방법에 관한 것으로서, 화면내 예측(Intra prediction) 성능을 높이고 비디오의 인코딩 효율을 향상시킬 수 있는 에지 검출 방법에 관한 것이다.
비디오 컨텐츠에 대한 수요가 증가하면서 이종의 네트워크들을 통해 비디오 컨텐츠가 브로드캐스팅 또는 스트리밍되고 있다. 또한, 디지털 디바이스의 종류와 네트워크의 종류가 다양해지면서 비디오 컨텐츠는 다양한 디바이스와 다양한 네트워크를 통해 다수의 사용자에게 제공되고 있다.
비디오 컨텐츠 제공자는 H.264/SVC를 이용하여 상기와 같이 다양한 디바이스와 네트워크가 존재하는 환경에서 각 사용자에게 적절한 비디오 컨텐츠를 제공할 수 있다. 제공자는 H.264/SVC 인코딩 기법을 이용하여 비디오 데이터를 복수의 계층(layer)으로 나누어 인코딩하고, 수신기는 해당 수신기와 네트워크의 자원 상황에 따라 적정한 계층의 비트 스트림을 디코딩하여 출력한다.
화면내 예측(Intra prediction)은 비디오 데이터의 공간적 중복(spatial redundancy)을 줄일 수 있는 효과적인 방법으로, H.264/AVC와 SVC는 라인 바이 라인(Line by line) 화면내 예측 기법을 사용한다. 특히, SVC의 베이스 계층(base layer, BL)은 H.264/AVC 표준과 호환되므로, H.264/AVC의 화면내 예측 기법이 SVC의 베이스 계층 프레임을 인코딩하는데 사용된다.
SVC에서 향상 계층(enhancement layer, EL)의 프레임은 낮은 계층과 현재 계층의 프레임을 사용하여 예측될 수 있으며, SVC 표준은 향상 계층의 코딩 성능을 향상시키기 위해 여러 가지 계층간 예측(inter-layer prediction) 기법을 사용한다. 그 가운데 계층간 화면내 예측(inter-layer intra prediction, ILIP) 기법은 계층간 예측을 통해 향상 계층의 화면내 예측 프레임(intra frame)을 인코딩할 수 있다.
개시된 기술은 화면내 예측(Intra prediction) 성능을 높이고 비디오의 인코딩 효율을 향상시킬 수 있는 에지 검출 방법을 제공한다. 개시된 기술은 에지를 기준으로 나뉘어지는 각 영역에 대해 다른 타입의 예측 기법을 사용할 수 있도록 정확한 에지 검출 방법을 제공한다.
개시된 기술의 일 실시예에 따른 에지 검출 방법은 비디오 프레임을 블록 단위로 구획하는 단계, 타겟 블록에서 에지 세그먼트를 검출하는 단계 및 상기 타겟 블록에서 검출된 에지 세그먼트들을 연결하여 에지맵을 생성하는 단계를 포함한다. 상기 에지 세그먼트를 검출하는 단계는 타겟 블록 내 각 픽셀에 대해 밝기 변화율(Intensity gradient)을 계산하는 단계, 상기 밝기 변화율을 기초로 상기 타겟 블록 내 에지 세그먼트의 위치를 나타내는 이진 에지맵(binary edge map)을 생성하는 단계, 상기 이진 에지맵에서 노이즈를 제거하는 단계 및 상기 노이즈가 제거된 이진 에지맵에서 복수의 에지 라인이 검출되는 경우 가장 외곽의 에지 세그먼트를 제외한 나머지 에지 세그먼트는 제거하는 단계를 포함하며, 상기 에지맵을 생성하는 단계는 상기 에지 세그먼트의 끝점(end point)을 결정하는 단계 및 상기 에지 세그먼트의 끝점 사이의 간극(gap)을 채워서 각 에지 세그먼트를 연결하는 단계를 포함한다.
상기 이진 에지맵에서 노이즈를 제거하는 단계는 고립된 위치의 픽셀을 제거하여 노이즈를 제거한다.
상기 에지 세그먼트를 검출하는 단계는 수평 방향(horizontal direction)의 밝기 변화율을 계산하여 수평 방향의 이진 에지맵을 생성하고, 수직 방향(vertital direction)의 밝기 변화율을 계산하여 수직 방향의 이진 에지맵을 생성한다.
상기 에지 세그먼트의 끝점을 결정하는 단계는 모폴로지컬 필터(morphological filter)를 이용하여 상기 이진 에지맵을 필터링하여 상기 끝점을 결정한다.
상기 에지 세그먼트를 연결하는 단계는 상기 에지 세그먼트들의 끝점 사이를 채우는데 필요한 비용을 계산하는 단계 및 상기 계산된 비용이 최소인 경로에 위치한 점(point)을 채우는 단계를 포함한다.
상기 끝점 사이를 채우는데 필요한 비용은 하기 수학식을 통해 계산된다.
Figure 112012035710957-pat00001
{단, J(Si(pm +,pm +1 -))는 끝점 사이를 채우는데 필요한 비용,
Si(pm +,pm +1 -)는 m번 세그먼트의 일 끝점(pm +)과 m+1번 세그먼트의 일 끝점(pm +1 -)을 연결하는 i번 경로,
x,y는 픽셀의 x축 및 y축 좌표,
G(x,y)는 x,y 좌표에 위치한 픽셀의 밝기 변화율}
상기 계산된 비용이 최소인 경로에 위치한 점(point)을 채우는 단계는 상기 비용이 최소인 경로가 복수인 경우에는 상기 비용이 최소인 경로들 중 유클리디언 거리(Euclidean distance)가 최소인 경로에 위치한 점을 채운다.
상기 에지맵을 생성하는 단계는 수평 방향의 이진 에지맵을 기초로 에지 세그먼트를 연결하여 수평 방향 에지맵을 생성하고, 수직 방향의 이진 에지맵을 기초로 에지 세그먼트를 연결하여 수직 방향 에지맵을 생성한다.
개시된 기술에 따른 에지 검출 방법은 프레임에 포함된 객체의 에지를 정확하게 검출할 수 있다. 해당 에지 검출 방법을 기초로 화면내 예측(Intra prediction) 성능을 높일 수 있고 비디오의 인코딩 효율을 향상시킬 수 있다.
도 1은 H.264/SVC를 통해 비디오를 인코딩하여 다수의 사용자에게 비디오 컨텐츠를 제공하는 것을 내는 도면이다.
도 2는 개시된 기술의 일 실시예에 따른 에지 검출 방법을 나타내는 흐름도이다.
도 3은 에지 세그먼트를 검출하는 과정을 설명하기 위한 흐름도이다.
도 4는 고립된 픽셀을 제거하는 과정을 설명하기 위한 도면이다.
도 5는 에지 세그먼트를 연결하여 에지맵을 생성하는 과정을 설명하기 위한 흐름도이다.
도 6은 에지 세그먼트의 끝점(end point)을 결정하는 과정을 설명하기 위한 도면이다.
도 7은 에지 세그먼트 사이의 간극(gap)을 채워 에지 세그먼트를 연결하는 과정을 설명하기 위한 도면이다.
개시된 기술의 실시예들에 관한 설명은 개시된 기술의 구조적 내지 기능적 설명들을 위하여 예시된 것에 불과하므로, 개시된 기술의 권리범위는 본문에 설명된 실시예들에 의하여 제한되는 것으로 해석되어서는 아니 된다. 즉, 개시된 기술의 실시예들은 다양한 변경이 가능하고 여러 가지 형태를 가질 수 있으므로 개시된 기술의 기술적 사상을 실현할 수 있는 균등물들을 포함하는 것으로 이해되어야 한다.
개시된 기술에서 기재된 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한 복수의 표현을 포함하는 것으로 이해되어야 하고, "포함하다" 또는 "가지다" 등의 용어는 실시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
개시된 기술에서 기술한 각 단계들은 문맥상 명백하게 특정 순서를 기재하지 않은 이상 명기된 순서와 다르게 일어날 수 있다. 즉, 각 단계들은 명기된 순서와 동일하게 일어날 수도 있고 실질적으로 동시에 수행될 수도 있으며 반대의 순서대로 수행될 수도 있다.
도 1은 H.264/SVC를 통해 비디오를 인코딩하여 다수의 사용자에게 비디오 컨텐츠를 제공하는 것을 내는 도면이다.
도 1을 참조하면, 컨텐츠 제공자(contents provider)(120)는 SVC(Scalable Video Coding) 인코더를 포함하며, 이종의 네트워크들(130, 140)을 통해 다양한 디지털 디바이스들(150a, 150b, 150c)로 비디오 컨텐츠를 제공한다.
SVC 인코더는 원본 비디오(110)를 인코딩하여 각각 다른 품질을 갖는 비트 스트림(Scalable bit stream)을 출력한다. 예를 들어, SVC 인코더는 원본 비디오(110)를 기저 계층(BL, Base Layer), 제1 향상 계층(EL, Enhancement Layer) 및 제2 향상 계층으로 구성된 비트 스트림으로 인코딩할 수 있다.
컨텐츠 제공자(120)는 네트워크 자원 상태나 디바이스의 성능에 따라 적절한 품질의 비트 스트림을 디지털 디바이스로 전송한다. 예를 들어, 네트워크 자원이 한정된 네트워크(130)를 이용하는 디지털 디바이스(150a)의 경우, 컨텐츠 제공자(120)는 기저 계층의 비트 스트림만 전송하여 상대적으로 낮은 품질의 비디오 컨텐츠를 디바이스(150a)에 제공한다. 네트워크 자원이 충분한 네트워크(140)를 이용하는 디지털 디바이스(150b, 150c)의 경우, 컨텐츠 제공자(120)는 기저 계층과 함께 향상 계층의 비트 스트림을 전송하여 높음 품질의 비디오 컨텐츠를 디바이스(150b, 150c)에 제공할 수 있다.
화면내 예측(Intra prediction)은 비디오 데이터의 공간적 중복(spatial redundancy)을 줄일 수 있는 효과적인 방법으로, H.264/SVC는 H.264/AVC와 같이 라인 바이 라인(Line by line) 화면내 예측 기법을 사용한다. 그러나, 객체의 경계 또는 에지(edge)에 위치한 블록(block)의 경우 화면내 예측 정확도가 떨어질 수 있으며, 이는 인코딩 효율을 떨어뜨리는 요인이될 수 있다. 따라서, 화면에 포함된 에지를 정확하게 검출하는 것이 인코딩 효율을 높이는 데 사용될 수 있다.
하기에서는 개시된 기술의 실시예에 따른 에지 검출 방법을 설명한다.
도 2는 개시된 기술의 일 실시예에 따른 에지 검출 방법을 나타내는 흐름도이다.
도 2를 참조하면, 에지 검출 방법은 타겟 블록에서 에지 세그먼트(edge segment)를 검출하는 단계(S210) 및 검출된 에지 세그먼트를 연결하여 에지맵을 생성하는 단계(S220)를 포함한다. 인코더는 비디오 프레임을 블록 단위로 구획하여 인코딩하므로, 블록 단위로 에지 세그먼트를 검출하고 해당 블록에 대한 에지맵을 생성한다. 인코더는 각 블록에 대한 에지맵을 연결하여 프레임 전체의 에지를 검출할 수 있다.
도 3은 에지 세그먼트를 검출하는 과정을 설명하기 위한 흐름도이다.
화면 내에서 에지가 위치하는 영역은 높은 밝기 변화율(intensity gradient) 값을 갖는다. 따라서, 인코더는 타겟 블록내 밝기 변화율을 계산하여 타겟 블록 내 에지를 검출할 수 있다(단계 S310). 인코더는 타겟 블록내 각 픽셀에 대해 수평 방향(horizontal direction)과 수직 방향(vertical direction)으로 각각 밝기 변화율을 계산하여 각 방향으로 계산된 밝기 변화율을 기초로 에지 세그먼트를 검출하고, 각 방향에 대한 에지맵을 생성한다.
인코더는 하기의 수학식 1을 통해 각 픽셀에 대한 밝기 변화율을 계산한다.
Figure 112012035710957-pat00002
Gh(x,y)는 블록 내 x,y 좌표에 위치한 픽셀의 수평 방향 밝기 변화율 값을 나타내고, x는 변화율(gradient) 연산을 나타낸다. B(x,y)는 블록 내 x,y 좌표에 위치한 픽셀의 픽셀값을 나타낸다.
인코더는 계산된 밝기 변화율 값을 기초로 타겟 블록 내 에지 세그먼트의 위치를 나타내는 이진 에지맵(binary edge map)을 생성한다(단계 S320). 인코더는 계산된 밝기 변화율 값이 소정의 문턱 값(Threshold)을 갖는 영역을 탐지하여 이진 에지맵을 생성할 수 있다. 이진 에지맵은 하기의 수학식 2를 통해 표현될 수 있다.
Figure 112012035710957-pat00003
Eh(x,y)는 수평 방향의 이진 에지맵을 나타내며, x,y는 블록 내 좌표 위치 값을 나타낸다. 이진 에지맵의 각 좌표는 타겟 블록의 각 좌표에 대응된다.
x,y 좌표에 위치한 픽셀의 수평 방향 밝기 변화율 값이 문턱 값보다 큰 경우 해당 위치는 1의 값을 가지고 그 외에는 모두 0의 값을 가지므로, 이진 에지맵은 타겟 블록내의 에지의 위치를 이진 값으로 표현할 수 있다.
이진 에지맵을 생성한 후, 인코더는 이진 에지맵에서 노이즈를 제거한다(단계 S330). 인코더는 이진 에지맵에서 고립된 위치의 픽셀을 제거하여 노이즈를 제거할 수 있다. 해당 픽셀의 주변에 이진 값이 1인 픽셀이 없는 경우, 해당 픽셀은 고립된 위치의 픽셀로 볼 수 있다.
도 4는 고립된 픽셀을 제거하는 과정을 설명하기 위한 도면이다.
도 4를 참조하면, 타겟 블록에 대응되는 이진 에지맵(410)내에 유색 영역은 값이 1인 영역을 나타내며, 백색 영역은 값이 0인 영역을 나타낸다. 제1 픽셀(420)은 주변의 8개 영역의 값이 0이므로 고립될 픽셀에 해당하며, 제2 픽셀(430)은 우상부 픽셀과 하부 픽셀이 각각 1인 값을 갖는 픽셀이므로 고립된 픽셀에 해당하지 않는다. 인코더는 고립된 픽셀(420)을 노이즈로 판단하여 이진 에지맵(410)에서 해당 영역을 제거하여 해당 픽셀의 값을 0으로 만든다. 이진 값이 1인 픽셀들이 연결되어 있는 경우 해당 픽셀들의 집합은 에지 세그먼트(L1, L2, L3)로 볼 수 있다.
인코더는 타겟 블록에 대응되는 이진 에지맵에 복수의 에지 라인이 포함되어 있는지 판단하여(단계 S340), 복수의 에지 라인이 포함되어 있는 경우 가장 외곽의 에지 세그먼트를 선택하고 나머지 에지 세그먼트는 제거한다(단계 S350).
예를 들어, 동일한 수평 라인에 에지 세그먼트가 존재하는 경우, 객체의 경계면은 가장 외곽의 에지일 가능성이 높으므로 가장 외곽에 위치하는 에지 세그먼트를 제외한 나머지 에지 세그먼트는 제거한다. 예를 들어, (x1,y) 좌표의 픽셀과 (x2,y) 좌표의 픽셀의 이진 값이 1이고 각각 다른 에지 세그먼트에 포함되어 있는 경우, x1<x2이면 (x1,y) 좌표의 픽셀을 포함하는 에지 세그먼트가 객체의 경계면에 해당할 가능성이 높다. 따라서, 인코더는 (x1,y) 좌표의 픽셀을 포함하는 에지 세그먼트를 제외한 (x2,y) 좌표의 픽셀을 포함하는 에지 세그먼트를 이진 에지맵에서 제외한다.
상기와 같은 과정을 통해 인코더는 이진 에지맵에서 타겟 블록내 객체의 경계에 해당하는 가장 외곽의 에지 세그먼트를 얻을 수 있다. 상기에서는 수평 방향의 이진 에지맵과 에지 세그먼트를 얻는 방법을 설명하였으나, 인코더는 수직 방향에 대해서도 동일한 방법으로 이진 에지맵과 에지 세그먼트를 얻을 수 있다.
상기 과정을 통해 얻은 이진 에지맵에 포함된 에지 세그먼트 사이에는 간격(gap)이 있으므로, 해당 간격을 채워 완전한 에지를 얻을 수 있다.
도 5는 에지 세그먼트를 연결하여 완전한 에지를 포함하는 에지맵을 생성하는 과정을 설명하기 위한 흐름도이다.
인코더는 이진 에지맵에 포함된 각 에지 세그먼트의 끝점(end point)을 결정한다(단계 S510). 인코더는 모폴로지컬 필터(morphological filter)를 이용하여 상기 이진 에지맵에 포함된 각 에지 세그먼트의 끝점을 얻을 수 있다.
도 6은 에지 세그먼트의 끝점(end point)을 결정하는 과정을 설명하기 위한 도면이다.
L={L1,L2,L3,...LM}는 에지 세그먼트를 나타내고, Pm={Pm +,Pm -}은 Lm번째 에지 세그먼트의 각 끝점을 나타내며, 는 블록의 경계 픽셀(boundary pixel)을 나타낸다.
끝점이 경계 픽셀에 포함되는 경우에는 해당 끝점은 에지 세그먼트의 끝점에서 제외한다. 예를 들어, L1 에지 세그먼트의 경우, 끝점 가운데 하나가 경계 픽셀에 포함되므로 경계 픽셀에 포함된 끝점을 제외한 p1 +만 끝점에 해당한다. L2 에지 세그먼트의 경우, 끝점은 p2 +와 p2 -를 포함하여 2개가 된다.
각 에지 세그먼트의 끝점이 결정된 경우, 인코더는 에지 세그먼트 사이의 간격을 채워 에지 세그먼트를 연결한다(단계 S520). 인코더는 각 에지 세그먼트의 간격을 채워 모든 에지 세그먼트가 연결될 때까지 S520 단계를 수행한다(단계 S530).
에지 세그먼트 사이의 간격을 채우기 위해 인코더는 이웃하는 에지 세그먼트들의 끝점 사이를 채우는데 필요한 비용을 계산하고, 계산된 비용이 최소인 경로에 위치한 점(point)을 채운다.
도 7은 에지 세그먼트 사이의 간극(gap)을 채워 에지 세그먼트를 연결하는 과정을 설명하기 위한 도면이다. 도 7에서 (a)는 에지 세그먼트의 끝점 사이를 연결하는 과정을 설명하는 도면이며, (b)는 에지 세그먼트의 일 끝점과 블록의 경계 픽셀 사이를 연결하는 과정을 설명하는 도면이다.
끝점 사이를 채우는데 필요한 비용은 GFC(Gap Filling Cost)로 정의하고, GFC를 구하는 식은 하기 수학식 3과 같다.
Figure 112012035710957-pat00004
J(Si(pm +,pm+1 -))는 끝점 사이를 채우는데 필요한 비용(GFC)을 나타내며, Si(pm +,pm+1 -)는 m번 세그먼트의 일 끝점(pm +)과 m+1번 세그먼트의 일 끝점(pm+1 -)을 연결하는 i번 경로를 나타낸다. x,y는 픽셀의 x축 및 y축 좌표를 나타내며, G(x,y)는 x,y 좌표에 위치한 픽셀의 밝기 변화율을 나타낸다. GFC는 경로에 위치하는 각 픽셀의 밝기 변화율을 구하여 해당 밝기 변화율에 1을 더한 역값을 통해 얻을 수 있다.
인코더는 끝점 사이를 연결하는 가능한 각 경로에 대해 구한 비용을 기초로 비용이 최소인 경로를 선택하고, 해당 경로에 위치한 점(또는 픽셀)을 채운다.
비용이 최소인 경로를 선택하는 것은 하기의 수학식 4로 표현할 수 있다.
Figure 112012035710957-pat00005
S*는 비용이 최소인 경로를 나타낸다.
만약 비용이 최소인 경로가 복수인 경우에는, 인코더는 비용이 최소인 경로들 중 2차원 유클리디언 거리(Euclidean distance)가 최소인 경로를 선택하여 해당 경로에 위치한 점의 이진 값을 1로 채운다.
블록의 가장 외곽에 위치한 에지 세그먼트(L1, LM)의 끝점 가운데 블록의 경계 픽셀에 가까운 끝점(p1 -,pM +)이 있는 경우에는, 해당 끝점은 블록의 경계 픽셀에 연결한다.
인코더는 끝점(p1 -,pM +)과 소정 거리에 있는 경계 픽셀들 사이에 간격을 채우는데 필요한 비용(GFC)를 구하여 해당 비용이 최소인 경로를 구하고, 해당 경로에 위치한 점을 채워 에지 세그먼트와 경계 픽셀을 연결할 수 있다.
상기와 같은 과정을 통해 인코더는 완전한 에지를 포함하는 에지맵을 얻을 수 있다. 상기에서는 수평 방향의 에지와 에지맵을 얻는 방법을 설명하였으나, 인코더는 수직 방향에 대해서도 동일한 방법으로 에지와 에지맵을 얻을 수 있다.
인코더는 상기와 같은 과정을 통해 얻은 각 블록에 대한 에지맵을 기초로, 프레임에 포함된 에지를 검출할 수 있다.
상기에서는 개시된 기술의 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
110: 원본 비디오 120: 컨텐츠 제공자
130: 제1 네트워크 140: 제2 네트워크
150a, 150b, 150c: 디지털 디바이스

Claims (8)

  1. 비디오 프레임에서 에지를 검출하는 방법에 있어서,
    상기 프레임을 블록 단위로 구획하는 단계;
    타겟 블록에서 에지 세그먼트를 검출하는 단계; 및
    상기 타겟 블록에서 검출된 에지 세그먼트들을 연결하여 에지맵을 생성하는 단계를 포함하고,
    상기 에지 세그먼트를 검출하는 단계는
    타겟 블록 내 각 픽셀에 대해 밝기 변화율(Intensity gradient)을 계산하는 단계;
    상기 밝기 변화율을 기초로 상기 타겟 블록 내 에지 세그먼트의 위치를 나타내는 이진 에지맵(binary edge map)을 생성하는 단계;
    상기 이진 에지맵에서 노이즈를 제거하는 단계; 및
    상기 노이즈가 제거된 이진 에지맵에서 복수의 에지 라인이 검출되는 경우 일측 방향을 기준으로 가장 외곽의 에지 세그먼트를 제외한 나머지 에지 세그먼트는 제거하는 단계를 포함하며,
    상기 에지맵을 생성하는 단계는
    상기 에지 세그먼트의 끝점(end point)을 결정하는 단계; 및
    상기 에지 세그먼트의 끝점 사이의 간극(gap)을 채워서 각 에지 세그먼트를 연결하는 단계를 포함하는 에지 검출 방법.
  2. 제1항에 있어서, 상기 이진 에지맵에서 노이즈를 제거하는 단계는
    고립된 위치의 픽셀을 제거하여 노이즈를 제거하는 에지 검출 방법.
  3. 제1항에 있어서, 상기 에지 세그먼트를 검출하는 단계는
    수평 방향(horizontal direction)의 밝기 변화율을 계산하여 수평 방향의 이진 에지맵을 생성하고, 수직 방향(vertital direction)의 밝기 변화율을 계산하여 수직 방향의 이진 에지맵을 생성하는 에지 검출 방법.
  4. 제1항에 있어서, 상기 에지 세그먼트의 끝점을 결정하는 단계는
    모폴로지컬 필터(morphological filter)를 이용하여 상기 이진 에지맵을 필터링하여 상기 끝점을 결정하는 에지 검출 방법.
  5. 제1항에 있어서, 상기 에지 세그먼트를 연결하는 단계는
    상기 에지 세그먼트들의 끝점 사이를 채우는데 필요한 비용을 계산하는 단계; 및
    상기 계산된 비용이 최소인 경로에 위치한 점(point)을 채우는 단계를 포함하는 에지 검출 방법.
  6. 제5항에 있어서, 상기 비용은 하기 수학식을 통해 계산하는 에지 검출 방법.
    Figure 112012069548874-pat00006

    단, J(Si(pm +,pm+1 -))는 끝점 사이를 채우는데 필요한 비용
    Si(pm +,pm+1 -)는 m번 세그먼트의 일 끝점(pm +)과 m+1번 세그먼트의 일 끝점(pm+1 -)을 연결하는 i번 경로
    x,y는 픽셀의 x축 및 y축 좌표
    G(x,y)는 x,y 좌표에 위치한 픽셀의 밝기 변화율Gh(x,y)는 x,y 좌표에 위치한 픽셀의 수평(horizontal)방향 밝기 변화율
  7. 제5항에 있어서, 상기 계산된 비용이 최소인 경로에 위치한 점(point)을 채우는 단계는
    상기 비용이 최소인 경로가 복수인 경우에는 상기 비용이 최소인 경로들 중 유클리디언 거리(Euclidean distance)가 최소인 경로에 위치한 점을 채우는 에지 검출 방법.
  8. 제1항에 있어서, 상기 에지맵을 생성하는 단계는
    수평 방향의 이진 에지맵을 기초로 에지 세그먼트를 연결하여 수평 방향 에지맵을 생성하고, 수직 방향의 이진 에지맵을 기초로 에지 세그먼트를 연결하여 수직 방향 에지맵을 생성하는 에지 검출 방법.
KR1020120047364A 2012-05-04 2012-05-04 화면내 에지를 검출하는 방법 KR101220816B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120047364A KR101220816B1 (ko) 2012-05-04 2012-05-04 화면내 에지를 검출하는 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120047364A KR101220816B1 (ko) 2012-05-04 2012-05-04 화면내 에지를 검출하는 방법

Publications (1)

Publication Number Publication Date
KR101220816B1 true KR101220816B1 (ko) 2013-01-10

Family

ID=47841582

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120047364A KR101220816B1 (ko) 2012-05-04 2012-05-04 화면내 에지를 검출하는 방법

Country Status (1)

Country Link
KR (1) KR101220816B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190109911A (ko) * 2018-03-19 2019-09-27 한국전자통신연구원 픽셀들로부터 출력된 신호들의 크기들에 기반하여 이미지의 윤곽을 추출하기 위한 이미지 센서 및 방법
CN114671214A (zh) * 2022-05-27 2022-06-28 新风光电子科技股份有限公司 基于高压变频器的煤矿输送皮带调速方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510952A (ja) 1997-07-16 2001-08-07 サムソン エレクトロニクス カンパニー リミテッド 信号適応フィルタリング方法、信号適応フィルタ及びこれを記録した記録媒体
KR20070076337A (ko) * 2006-01-18 2007-07-24 삼성전자주식회사 에지영역 판단장치 및 에지영역 판단방법
KR20110129158A (ko) * 2010-05-25 2011-12-01 경북대학교 산학협력단 영상 처리 시스템에서의 객체 후보 영역 검출 방법 및 시스템

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001510952A (ja) 1997-07-16 2001-08-07 サムソン エレクトロニクス カンパニー リミテッド 信号適応フィルタリング方法、信号適応フィルタ及びこれを記録した記録媒体
KR20070076337A (ko) * 2006-01-18 2007-07-24 삼성전자주식회사 에지영역 판단장치 및 에지영역 판단방법
KR20110129158A (ko) * 2010-05-25 2011-12-01 경북대학교 산학협력단 영상 처리 시스템에서의 객체 후보 영역 검출 방법 및 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190109911A (ko) * 2018-03-19 2019-09-27 한국전자통신연구원 픽셀들로부터 출력된 신호들의 크기들에 기반하여 이미지의 윤곽을 추출하기 위한 이미지 센서 및 방법
KR102376471B1 (ko) * 2018-03-19 2022-03-21 한국전자통신연구원 픽셀들로부터 출력된 신호들의 크기들에 기반하여 이미지의 윤곽을 추출하기 위한 이미지 센서 및 방법
CN114671214A (zh) * 2022-05-27 2022-06-28 新风光电子科技股份有限公司 基于高压变频器的煤矿输送皮带调速方法

Similar Documents

Publication Publication Date Title
ES2732013T3 (es) Predicción de vector de movimiento temporal basada en subunidad de predicción (PU) en la HEVC y diseño de sub-PU en la 3d-hevc
KR102640992B1 (ko) 포인트 클라우드 프로세싱
JP5970609B2 (ja) 3dビデオ符号化における統一された視差ベクトル導出の方法と装置
TW201739250A (zh) 視訊編碼的方法與裝置
SA517382334B1 (ar) تحديد نسق استخلاص معلومات الحركة في تشفير فيديو
EP2983365A1 (en) Image prediction coding method and image coder
US20170116461A1 (en) Image processing device and image processing method
CN104284192B (zh) 图像处理设备和图像处理方法
RU2014153748A (ru) Определение режима внутрикадрового предсказания блока кодирования изображения и блока декодирования изображения
CN105393541A (zh) 使用基于深度的块分割编解码纹理块的方法和装置
HRP20230425T1 (hr) Odabir prediktora vektora kretanja
CN105308968A (zh) 允许有效多视图/层编码的编码概念
TWI688266B (zh) 用於圖像和視訊編解碼的畫面內預測融合的方法和裝置
TW201215161A (en) Image prediction encoding device, image prediction encoding method, image prediction encoding program, image prediction decoding device, image prediction decoding method, and image prediction decoding program
KR20140074302A (ko) 움직임 벡터 예측을 위한 움직임 벡터 목록을 작성하는 방법 및 장치
US11689738B2 (en) Multi-view coding with exploitation of renderable portions
CN105122809A (zh) 帧内编码的预测值派生的方法和装置
KR102126511B1 (ko) 보충 정보를 이용한 영상 프레임의 보간 방법 및 장치
KR101220816B1 (ko) 화면내 에지를 검출하는 방법
Chen et al. Sum-of-gradient based fast intra coding in 3D-HEVC for depth map sequence (SOG-FDIC)
JP5950605B2 (ja) 画像処理システム、及び、画像処理方法
JP2015002429A (ja) 符号化装置及び監視システム
KR20140005232A (ko) 예측 값을 형성하기 위한 방법들 및 디바이스들
CN105637869A (zh) 用于确定视频译码块的分区的角落视频部分的方法
WO2016115736A1 (en) Additional intra prediction modes using cross-chroma-component prediction

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160118

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20171222

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee