KR20080071537A - 이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어모듈 및 기계-판독 가능 매체 - Google Patents

이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어모듈 및 기계-판독 가능 매체 Download PDF

Info

Publication number
KR20080071537A
KR20080071537A KR1020080068214A KR20080068214A KR20080071537A KR 20080071537 A KR20080071537 A KR 20080071537A KR 1020080068214 A KR1020080068214 A KR 1020080068214A KR 20080068214 A KR20080068214 A KR 20080068214A KR 20080071537 A KR20080071537 A KR 20080071537A
Authority
KR
South Korea
Prior art keywords
image element
image
perimeter
occluded
categories
Prior art date
Application number
KR1020080068214A
Other languages
English (en)
Other versions
KR100896668B1 (ko
Inventor
레옹 보튜
패트릭 가이 하프너
Original Assignee
에이티 앤드 티 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에이티 앤드 티 코포레이션 filed Critical 에이티 앤드 티 코포레이션
Publication of KR20080071537A publication Critical patent/KR20080071537A/ko
Application granted granted Critical
Publication of KR100896668B1 publication Critical patent/KR100896668B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

이미지 요소를 복수의 카테고리들 중 하나의 카테고리로 분류하기 위한 방법, 시스템, 및 기계-판독가능 매체가 제공되며, 이미지 요소의 폐색되지 않은 둘레(unoccluded perimeter)와 이미지 요소의 폐색된 둘레간의 비에 기초하여 이미지 요소를 할당하는 단계와, 이미지 요소가 분류된 카테고리와 연관된 코딩 방식에 따라 이미지 요소를 코딩하는 단계를 포함한다. 예시적인 응용들은 이미지 압축을 포함하며, 카테고리들은 이미지 전경 및 배경층들을 포함한다.
전경층, 배경층, 카테고리, 코딩, 둘레

Description

이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어 모듈 및 기계-판독 가능 매체{method of processing image data, system for processing images, software module and machine-readable medium}
발명의 분야
본 발명은 일반적으로는 이미지 처리에 관한 것으로, 특히, 이미지 요소들을 분류하기 위한 방법들, 시스템들, 및 기계-판독가능 매체(machine-readable media)에 관한 것이다.
배경 기술
많은 이미지들이 이미지의 픽셀에 근거한 표현에 의존하지 않는 전산화된(computerized) 방법들을 사용하여 생성된다. 예를 들어, 텍스트 처리 소프트웨어는 텍스트, 폰트들, 색들, 삽입된 이미지들 등과 같은 이미지의 고-레벨 요소들을 설명하는 구조화된 페이지 정보를 사용하여 이미지를 표시한다. 이러한 구조화된 페이지 정보는 MSWord™ doc, Adobe™ PDF, 또는 PostScript™ 파일들과 같은 매우 다양한 파일 포맷들에서 비롯한 것이다. 프린트되거나, 그렇지 않으면 렌더링될 경우, 정보는 이미지를 점차적으로 구성하는 오버레이(overlay)된 이미지의 시퀀스로 변환될 수도 있다.
종종 이러한 이미지들을 압축, 즉, 인코딩할 필요가 있다. 일반적으로, 이미지 요소들은 몇가지 분류 기준에 기초하여 전경 또는 배경 중 하나로서 우선 분류된다. 분류 후에, 전경은 흥미있는 요소들을 포함하고 있기 때문에, 보다 높은 해상도(resolution)로 인코딩된다. 이에 반해, 배경은 통상적으로 흥미가 덜한 요소들을 포함하고 있기 때문에, 보다 낮은 해상도로 인코딩된다. 이와 같은 코딩 방식이 종래 기술, 예를 들어, MPEG, JPEG 등에 잘 알려져 있다. 따라서, 요소 분류의 품질은 이러한 이미지들의 압축율과 비디오 품질에 굉장히 영향을 미친다. 이 때문에, 분류를 효과적으로 수행하는 것이 중요하다.
구조화된 페이지 정보로부터 렌더링된 이미지들에 대한 현재의 요소 분류 접근법들은 전경으로서 이미지 내의 모든 텍스트와 배경으로서 모든 다른 세부 항목(detail)들을 분류하는 단계와, 전경으로서 모든 단색(monochrome) 요소들과 배경으로서 모든 다른 것들을 분류하는 단계, 및 배경으로서 그려진 제 1 요소와 전경으로서 모든 다른 것들을 분류하는 단계를 포함한다. 그러나, 이러한 모든 접근법들은, 흥미있는 요소들이 사실상 전경 요소들일 경우, 배경 분류에 대한 기준을 충족시키도록 때때로 렌더링되기 때문에, 지리학적 맵들에 대해 특히 비효과적이다. 그 결과, 이러한 흥미있는 요소들이 보다 낮은 해상도로 잘못 인코딩된다. 이로서, 이러한 요소들의 압축 효율 및 비디오 품질이 현저히 떨어진다.
따라서, 종래 기술 분야에서 일반적으로 이미지 요소들, 특히, 구조화된 페이지 정보로부터 렌더링된 이미지 요소들, 예를 들어, 전자 문서들을 분류하는 효과적인 방법에 대한 필요성이 있다.
발명의 개요
본 발명은 복수의 카테고리들 중 하나의 카테고리로서 이미지 요소들을 분류하기 위한 방법을 제공한다. 이 방법은 이미지 요소의 폐색되지 않은 둘레(unoccluded perimeter)와 다른 이미지 요소들에 의해 폐색된(occluded) 이미지 요소의 둘레간의 비(ratio)에 기초하여 이미지 요소를 분류하는 것을 포함한다. 이후, 이미지 요소는 이미지 요소가 분류되어 있는 카테고리와 연관된 코딩 방식에 따라 코딩될 수도 있다.
본 발명의 실시예들은 요소의 폐색되지 않은 둘레와 요소의 폐색된 둘레간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리로서 이미지 요소들을 분류하기 위한 기술을 제공한다. 이미지 요소의 폐색된 둘레는 전형적으로 다른 이미지 요소들이 그 위에 오버레이될 때 요소의 패색되지 않은 둘레와 상이하다. 그러므로, 상기 비는 이미지 요소가 다른 이미지 요소들에 의해 블록되는 양의 양호한 추정을 제공할 수 있다. 고도로 패색된 이미지 요소들에 대한 "푸싱(Pushing)" 코딩 에러들은 고도로 압축된 이미지의 지각 품질(perceived quality)을 효과적으로 개선할 수 있다.
본 발명은 이미지 압축에 적용될 수도 있고, 여기서 이미지 요소들은 전경 및 배경층들 중 하나에 속하는 것으로서 분류될 수도 있다. 도 1a는 본 발명을 실시하는 이미지 압축 시스템의 블록도이다. 시스템은 렌더링 엔진(10), 분류기(20), 전경 코더(30), 배경 코더(40)를 포함한다. 렌더링 엔진(10)은 압축될 이미지를 생성한다. 렌더링 엔진(10)은 프린트 드라이버 또는 텍스트 처리 소프트웨어일 수 있지만 여기에 한정되지 않는다. 분류기(20)는 전경 또는 배경 요소들 중 하나로서 그 이미지 요소들을 분류함으로써 이미지를 처리한다. 전경으로서 분류된 요소들은 전경 코더(30)에 의한 임의의 코딩 기술에 따라 코딩될 수도 있다. 유사하게, 배경으로서 분류된 요소들은 배경 코더(40)에 의한 임의의 코딩 기술에 따라 코딩될 수도 있다. 예시적인 코딩 기술들은 종래기술에 잘 알려져 있다. 이와 같은 기술들은 예를 들어, Journal of Electronic Imaging, 7(3):410-425, 1998, L. Bottou 등에 의한 "High Quality Document Image Compression with DJVu" 에 기재된 코딩 기술과 독립적으로 또는 그와 관련하여 사용될 수도 있다. 전형적으로, 전경 및 배경 코딩 기술들은 낮은 손실의 이미지 품질을 갖는 전경 이미지 요소들의 압축을 제공하도록 선택될 것이다. 반면, 배경 이미지 요소들은 보다 높은 압축과 상대적으로 더 높은 손실의 이미지 품질로 코딩될 것이다.
이미지 압축 응용은 예시적인 목적만을 위한 것이며, 본 발명은 또한 이미지 요소 분류가 실행되는 경우의 임의의 적용에 사용될 수도 있다는 것이 이해될 것이다. 또한, 카테고리들의 수는 2개로 한정되지 않는 것도 이해될 것이다.
전형적인 이미지 압축에서, 이미지 요소의 폐색되지 않은 둘레와 폐색된 둘레간의 낮은 비는, 요소가 배경층에 속하는 것으로서 분류되었는지를 나타낼 수도 있고, 요소들의 경계들에 대한 임의의 코딩 에러들은 전경층으로부터의 다른 폐색하는 요소들에 의해 불명료해지기 쉽다. 그러므로, 코딩 에러들은 주목되지 않을 것이다. 대조적으로, 이미지 요소의 폐색되지 않은 둘레와 폐색된 둘레간의 높은 비는, 경계들에 대한 코딩 에러들이 그들이 다른 요소들에 의해 불명료하게 되지 않을 것이기 때문에 관찰될 것이라는 것을 나타낼 수도 있다. 이 경우, 그것은 전경층에서 요소를 코딩하기에 적절할 수 있다. 그러므로, 본 발명은 높은 압축율 및 압축된 이미지의 개선된 시각 품질을 제공한다.
전경 요소들을 인코딩하기 위한 비트들의 수는 요소의 시각 부분의 둘레 Poccluded(즉, 다른 요소들에 의해 폐색되는 요소 형태 부분들을 제거한 후)에 비례할 수도 있다. 배경 요소들에 의한 폐색들로부터 발생하는 배경 요소들의 에지들은 폐색하는 전경 요소들의 경계에 의해 한정될 수도 있다. 그래서, 배경 요소들을 인코 딩하기 위한 비트들의 수는 배경 요소들의 폐색된 부분들을 제외함으로써 감소될 수도 있고, 이는 전경 요소들의 일부로서 이미 인코딩될 수도 있다. 그러므로, 배경 요소들을 인코딩하기 위한 비트들의 수는 전경 요소들에 의한 폐색들로부터 기인하지 않는 둘레 부분들(perimeter segments)의 길이(Punoccluded)에 비례할 수도 있다. 또한, 비례 계수는 요소 경계를 따르는 색 차이들에 의존한다.
도 1b는 본 발명의 실시예에 따른 방법의 흐름도이다. 본 발명에 따르면, 이미지 분류 시스템은 이미지 요소의 폐색되지 않은 둘레(Punoccluded)(100)와 다른 이미지 요소들에 의해 폐색될 때의 이미지 요소의 둘레(Poccluded)(110)를 계산한다. 이 시스템은 이들 계산된 값들의 비와 미리 정해진 문턱값(T)(120)을 비교한다:
Figure 112008050495724-PAT00001
(1)
Punoccluded 대 Poccluded의 비가 문턱값을 초과하면, 그때 시스템은 이미지 요소를 전경층(140)에 속하는 것으로서 분류한다. 그렇지 않으면, 시스템은 이미지 요소를 배경층(130)에 속하는 것으로서 분류한다. 전형적인 문턱값(T)은 80%이다. 그후, 시스템은 요소 분류(150)에 기초하여 전경 또는 배경 코딩 방식 중 하나를 이용하여 이미지 요소를 코딩한다.
선택적으로, 시스템은 전경 또는 배경층에 몇몇 미리 정해진 유형들의 이미지 요소들을 할당한다. 예를 들어, 시스템은 전경층에 텍스트 및 심볼들을 미리 할당할 수도 있다. 전경이 보다 높은 해상도로 인코딩될 수도 있기 때문에, 전경으로 서의 인코딩 텍스트 및 심볼들은 그것들의 판독 능력을 개선한다.
몇몇 양상들이 선택적일 수 있으므로, 본 발명의 모든 또는 일부들이 이미지 요소들을 분류하기 위한 다른 방법들과 관련하여 사용될 수 있다는 것이 이해된다. 예를 들면, 텍스트가 전경층에 자동으로 할당될 수 있다면, 그 방법은 분문의 이미지 요소들에 적용될 필요가 없다.
본 발명에 따라 처리된 이미지 요소는 처음에 이미지 요소의 구성 요소들과 이미지에서 그 좌표들을 기술하는 구조화된 페이지 정보로서 표시될 수 있다. 대부분의 이들 구성 요소들은 "직사각형 채우기", "선 그리기", 또는 "하나의 텍스트 그리기"와 같은 단순한 동작들이다. 이들 동작들은 고른 색상(solid color)을 요소 형상(element shape)이라 불리우는 한 세트의 특정 부분들에 할당한다. 나중의 동작들은 보다 빠른 동작들에 의해 발생된 이미지 데이터를 덮어쓸 수 있다. 인쇄 동작들이 완료될 때, 이들은 완료된 인쇄된 출력(종종 페이지)을 행한다.
본 발명에 있어서, 시스템은 그 구조화된 페이지 정보로부터 이미지 요소를 처리해서, 이미지 요소 좌표들이 판독되어 전경 및 배경층들과 비교된다. 이러한 비교로부터, 시스템은 이미지 요소의 폐색된 부분들을 결정한다. 다음으로, 시스템은 이미지 요소를 전경 또는 배경층들 중 하나로 옮긴다.
도 2는 이미지 요소의 둘레를 계산하기 위한 전형적인 방법에 대한 흐름도이다. 이 방법은 전경 및 배경층들과 이미지 요소 형상들 간의 다수의 불 연산(boolean operation) 연산을 행한다. 이 실시예에서, 이들 층들 및 형상들은 런 길이 인코딩(run length encoding)을 사용하여 표시될 수 있다. 런 길이 인코딩에 서, 층들과 이미지 요소들의 각 주사선(또는 행)은 검정 및 흔 비트들의 연속적인 런(run)들을 설명하는 길이들의 시퀀스에 의해 표시된다. 런은 주사선의 왼쪽에서 오른쪽 주사시 만나게 되는 0들(흰 비트들) 또는 1들(검정 비트들)의 연속적인 그룹이다. 예시적인 목적을 위해, 검정 비트들은 이미지 요소들을 나타내고, 흰흰은 비요소(non-element) 공간을 나타낸다. 따라서, 시스템은 층 또는 요소 형상의 각 주사선을 왼쪽에서 오른쪽으로 주사하여, "검정 비트" 런들 상에 단일 패스를 만듦으로써 런 길이 인코딩된 층 또는 요소 형상의 둘레를 계산한다(200).
각 "검정 비트" 런에 대해, 시스템은 런 길이의 2배, 즉, 비트들의 수 및 2배의 폭을 부가함으로써 런의 둘레(r)를 계산한다(205). 길이 및 폭의 값들은 상부 및 하부 길이들 및 종단 폭들을 각각 고려하기 위해 2배가 된다. 그 후, 시스템은 런 및 다음 주사선에서 인접한 런, 즉 런에 인접하고 동일한 층 또는 요소 형상의 일부인 다음 주사선에서의 런 비트들, 사이의 각 접촉 부분들의 길이(l)를 계산한다(210).
모든 런들을 처리한 후, 시스템은 R을 산출하기 위한 모든 둘레(r)와, L을 산출하기 위한 모든 접촉 길이들(l)을 합한다(220). 인접 런들의 둘레가 동일한 접촉 길이를 포함하므로, 시스템은 중복 포함을 고려하기 위해 그 합(L)과 2를 곱한다. 시스템은 층 또는 요소 형상의 둘레를 P=R-2L로서 계산한다(230).
도 3은 전형적인 이미지 요소에 대해 도 2에서의 둘레 계산을 도시한다. 이러한 예에서, 이미지 요소(300)는 5개의 주사선들로 이루어져 있다. 제 3 주사선을 제외하면, 각 주사선은 단일의 "검은 비트" 런을 가지며, "흰 비트" 런에 의해 2개로 분리된다. 시스템은 각 "검은 비트" 런(310)의 둘레(r)를 결정한다. 다음으로, 시스템은 런들(310)의 둘레들(r)의 합(R)을 계산한다. 시스템은 인접한 런들간의 접촉 부분들(320)을 검출하고 그것들의 모든 길이들(l)을 합하며, 2L을 산출하기 위해 합을 2로 곱한다. 이미지 요소(300)의 둘레(P)는 R-2L과 동일하다.
둘레 계산은 단지 예시적인 목적을 위한 것이며, 다른 기술들에 의해 계산된 둘레가 본 발명에 사용될 수도 있다는 것을 알 것이다. 이러한 기술들은 한정되지 않지만, 윤곽 매핑(contour-mapping) 및 영역 확장(region-growing)을 포함한다.
도 4는 도 2의 방법을 사용하여, 예를 들면, 이미지 요소가 전경 또는 배경층들 중 하나에 속하는 것으로서 분류되도록 시스템이 둘레들을 계산하는 이미지 요소들의 폐색되지 않거나 폐색된 부분들을 검출하기 위한 예시적인 방법을 나타낸다. 먼저, 시스템은 전경 및 배경으로서 분류될 이미지 요소들을 표시하기 위해 두 개의 빈 층들(F 및 B)을 생성한다. 이후, 시스템은 최상위 요소에서 시작하여, 최하위 요소를 향해 진행하는 모든 이미지 요소에 대해 다음을 수행한다.
시스템은 이미지 요소의 둘레(Poriginal)를 계산한다(400). 이것은 이미지 요소가 폐색없이 나타날 수 있기 때문에 이미지 요소의 원래의 형상의 둘레이다. 이후, 시스템은 현재의 이미지 요소 위에 그려진 배경 이미지 요소들에 의해 폐색된 이미지 요소 형상의 부분을 결정한다(405). 이것은 이미지 요소 형상 및 현재의 배경(B)의 교차점을 계산함으로써 달성된다. 예를 들면, 주어진 이미지 요소부(i)에 대해, 현재의 배경부(B(i))가 값을 가지면, 이때 이미지 요소부(i)는 폐색 및 제거 된 것으로 지정된다.
처리된 제 1 이미지 요소, 즉, 최상위 요소에 대해, 배경(B)이 제거해야 할 폐색된 부분이 없도록 비어있다. 후속 요소들에 대해, 배경이 이전에 처리된 폐색 요소들을 포함하면, 시스템은 이미지 요소 형상으로부터 폐색된 부분들을 제거한다(410).
다음에, 시스템은 현 이미지 요소 위에 그려진 전경 이미지 요소들에 의해 폐색된 그 결과로서 생긴 요소 형상의 부분을 결정한다(420). 이것은 이미지 요소 형상과 현재의 전경(F)의 교차점을 계산함으로써 달성된다. 예를 들면, 주어진 이미지 요소부(i)에 대해, 현재의 전경부(F(i))가 값을 가지면, 이후 이미지 요소부(i)는 폐색 및 제거된 것으로 지정된다.
처리된 제 1 이미지 요소, 즉, 최상위 요소에 대해, 전경(F)은 제거해야 할 폐색된 부분이 없도록 비어 있다. 후속 요소들에 대해, 전경이 이전에 처리된 폐색 요소들을 포함하면, 시스템은 폐색된 부분들을 이미지 요소 형상으로부터 제거한다(425). 이후, 시스템은 전경 및 배경 요소들에 의해 폐색된 부분들의 둘레(Pocclusion)를 계산한다(430).
결과 이미지 요소 형상은 이미지 요소의 가시적인 부분들만을 포함한다. 시스템은 요소의 폐색된 둘레(Poccluded)와 요소의 폐색되지 않은 둘레(Punoccluded)를 계산하고(440), 여기서
Poccluded = R - 2L (2)
전술한 바와 같이, 가시적인 부분들의 둘레, 및
Figure 112008050495724-PAT00002
(3)
가시 경계의 둘레, 여기서, 폐색된 둘레와 원래의 둘레들의 합은 이미지 요소의 폐색되지 않은 둘레와 제거되는 폐색된 부분들의 둘레를 더한 것의 2배와 동일하다.
도 5a 내지 도 5c는 본 발명의 방법에 따라 검출된 이미지 요소의 예시적인 폐색된 부분들과 폐색되지 않은 부분들을 도시한다. 도 5a는 'ab' 이미지 요소(710)에 의해 패색되는 다각형 이미지 요소(700)를 도시한다. 다각형(700)의 폐색된 둘레(Poccluded)는, 즉, 제거된 폐색된 부분들을 갖는 가시적인 부분들의 둘레는 도 5b에 도시된다. 다각형(700)의 폐색되지 않은 둘레(Punoccluded), 즉, 불연속적인 가시 경계들(굵은 검은 선들로 표시됨)은 도 5c에 도시된다.
도 6은 다각형(700)의 폐색되지 않은 둘레를 결정하기 위해 사용되는 식(3)으로부터의 계산을 도시한다. 원래의 둘레들 및 폐색된 둘레들(Poriginal 및 Poccluded)의 합은 폐색되지 않은 둘레(Punoccluded)와 폐색된 부분들의 둘레(Poccluded)을 더한 것의 2배와 동일하다.
이미지 요소들의 폐색된 부분들과 폐색되지 않은 부분들을 검출하는 방법은 단지 예시적인 것일 뿐임을 이해해야 하며, 이 방법의 수 많은 변경들이 본 발명에 의해 사용될 수 있다.
선택적으로, 색 차이(δ)는 다음 비에 포함될 수 있다.
Figure 112008050495724-PAT00003
(4)
색 차이는 이미지 요소의 색이 얼마나 가까이 배경색과 매칭되느냐를 결정하기 위해 사용될 수 있다. 이 색들이 가깝게 매칭되면, 그 후 이미지 요소의 에지들이 충분히 구별되지 않아, 배경에 속하는 요소의 가능성이 높아진다.
일반적으로, 이미지 요소에 대한 다수의 패스들은 요소가 전경 또는 배경에 속하는지의 여부를 결정하기 위해 사용된다. 이것은, 현재 요소 아래에 위치된 요소들이 배경 요소들보다는 전경 요소들로 판별될 수 있고, 따라서 현재 요소의 둘레에 영향을 줄 수도 있기 때문에 행해진다. 본 발명에서, 색 차이의 계산은 현재 요소의 가능성의 추정이 배경에 할당되도록 허용하므로, 이미지 요소에 대한 단일 패스가 전경이 되어야 할지 배경이 되어야 할지를 결정할 수 있게 한다.
색 차이의 계산은 매우 비용이 많이 들 수도 있기 때문에, 2개의 예시적인 단일화들이 사용될 수도 있다. 도 7a는 제 1 예의 흐름도이다. 시스템은 요소 경계와 각각의 인접 배경 요소들간의 색 차이를 계산한다(500). 그 후에, 시스템은 δ로서 이들 색 차이들 중 가장 큰 것을 선택한다(510).
도 7b는 제 2 예를 도시한다. 시스템은 미리 정해진 수의 배경 요소들을 선택한다(550). 시스템은 배경 요소의 전체적인 크기 및 형태에 따라서 이미지 요소들에 대한 사전의 통과(preliminary pass) 동안 이들 배경 요소들을 발견적으로 결정한다. 즉, 경계 박스(bounding box)(즉, 요소 주위의 가상 경계)에 비하여 넓은 영역 및 현재 이미지 요소와 중첩하는 넓은 영역을 갖는, 입체(solid)의 직사각형 과 같은 이미지 요소는 잠재적인 배경 요소이다. 이와 같이, 이미지 요소는 색 차이를 계산하기 위해 사용될 수 있다. 반대로, 경계 박스에 비해 작은 영역 및 현재 이미지 요소와 중첩하는 작은 영역을 갖는, 길고 얇은 커브와 같은 이미지 요소는 잠재적인 배경 요소가 아니다. 이와 같이, 이미지 요소는 색 차이를 계산하기 위해 사용되지 않을 수 있다.
시스템이 배경 요소들을 선택한 후에, 시스템은 각각의 선택된 인접 배경 요소들 및 요소 경계의 색 차이를 계산한다(560). 시스템은 그 후에 δ로서 색 차이를 평균한다.
색 차이를 계산하기 위해 설명된 방법들은, 단지 예시적인 목적을 위한 것이며, 색 차이를 계산하기 위한 많은 기술들이 본 발명에서 사용될 수도 있음이 이해될 것이다. 이러한 기술들은, 이에 한정되지는 않지만, 경사 측정(gradient measurements)을 포함한다.
도 8은 본 발명의 다른 실시예에 따른 방법의 흐름도이다. 본 발명에 따르면, 이미지 분류 시스템은 전경층(F) 및 배경층(B)이 비워지도록 초기화한다(580). 그 후에, 시스템은 각각의 이미지 요소를 반복적으로 분류한다(582).
각각의 이미지 요소에 대하여, 시스템은 다음을 수행한다. 시스템은 전경 및 배경층들과 교차하는 이미지 요소의 부분을 결정하고(583), 그 후에 이미지 요소들의 폐색된 부분들로서 교차부를 식별하여 제거한다(584). 시스템은 그 후에 이미지 요소의 폐색되지 않은 둘레(Punoccluded)를 계산하고(585), 이미지 요소의 폐색된 둘 레(Poccluded)를 계산한다(586). 시스템은 식(1)에서와 같이, 미리 정해진 문턱값(T)과 그들의 계산된 둘레들의 비를 비교한다. 만일 Punoccluded 대 Poccluded의 비가 문턱값을 초과하면, 시스템은 이미지 요소를 전경층에 속하는 것으로서 분류한다(589). 그렇지 않으면, 그 후 시스템은 이미지 요소를 배경층에 속하는 것으로서 분류한다(588). 예시적인 문턱값(T)은 80%이다. 선택적으로, 시스템은 식(4)에서와 같이, 상기 비의 색 차이를 포함한다.
모든 이미지 요소들이 분류된 후에, 시스템은 그 후, 그들 각각의 코딩 방식들을 사용하여 전경 및 배경을 코딩한다(590).
도 9는 본 발명에 따라 분리될 수도 있는 예시적인 전자적으로 생성된 이미지를 도시한다. 시스템은 서로의 상부에 그려진 기본적인 이미지 요소들(610 내지 655)의 시퀀스로 이미지(600)을 분해하고, 시퀀스의 전면(front)(610) 및 후면(back)(655)은 각각 시퀀스 내의 최상 및 최하인 이미지 요소들을 나타낸다. 즉, 시스템은 전면 이미지 요소를 마지막에, 후면 이미지 요소를 처음에 프린트한다. 시스템은 주어진 이미지 포맷을 처리하는 프린팅 소프트웨어를 사용하여 도 9에 도시되어 있는 것과 같이 기본적인 이미지 요소들(610 내지 655)을 개별적으로 프린트 할 것이다.
본 발명에 따르면, 시스템은 우선 전경과 배경으로 분류될 이미지 요소들을 나타내는 빈 전경과 배경층들(F 및 B)을 준비한다. 그 후에, 시스템은 본 발명의 방법에 따라 제 1 요소(610)를 처리한다. 즉, 시스템은, 예를 들어, 도 2의 둘레 계산을 이용하여 제 1 요소의 원래 형상의 둘레(Poriginal)를 계산한다. 그 후에, 시스템은, 예를 들어, 도 4에서와 같이 현재 이미지 요소 위에 도시된 배경과 전경 이미지 요소들에 의해 폐색된 제 1 요소 형상의 부분들을 결정한다. 층들(F 및 B)은 이 시점에 비어있기 때문에, 제 1 요소는 폐색되지 않으며 그 부분들은 제거되지 않는다. 따라서, 이들 비-존재(non-existent) 폐색 부분들의 둘레(Pocclusion)는 0이다.
이제, 시스템은 식(2)와 식(3)으로부터 제 1 요소의 둘레들(Poccluded, Punoccluded)을 계산한다. 선택적으로, 시스템은, 예를 들어, 도 7a 또는 도 7b의 방법에 따라 제 1 요소와 배경 사이의 색 차이를 계산할 수 있다. 그후, 시스템은 폐색된 둘레 및 폐색되지 않은 둘레의 비를 계산한다. 그 비에 기초하여, 시스템은 제 1 요소를, 예를 들어, 도 1b에 도시된 바와 같이 전경과 배경층의 하나에 속하는 것으로서 분류한다. 제 1 요소가 폐색되지 않았기 때문에, 폐색된 둘레 및 폐색되지 않은 둘레는 동일하다. 따라서, 제 1 요소는 1의 비를 가지거나, 또는 색 차이를 가지고 그보다 크다. 문턱값이 80%(즉, 0.8)로 설정되면, 그 후 제 1 요소는 전경에 할당된다. 시스템은 그후에 제 1 요소를 포함하기 위해 전경층(F)을 갱신한다.
요소들(610, 615, 620, 630, 및 635)에 의해 폐색된, 폐색 이미지 요소(650)의 경우에, 층들(F 및 B)은 요소들(610 내지 645)이 요소(650)에 앞서 처리되어 분류되므로 비어 있지 않다. 따라서, 시스템은 요소(650)의 폐색된 부분들을 결정하 여 제거한다. 요소(650)의 폐색된 둘레(Poccluded)는 폐색되지 않은 둘레(Punoccluded) 보다 클 수도 있다. 이와 같이, 둘레들 간의 비는 문턱값보다 작을 수도 있다. 이 경우에, 시스템은 배경으로서 요소(650)를 분류한다.
시스템은 이미지 요소(610 내지 655)에 대해 본 발명의 방법을 반복하여, 분류된 이미지 요소들이 발생되도록 하고, 그 후에 시스템은 효과적으로 인코딩한다.
본 발명의 메커니즘들 및 방법들은 본 발명의 개시에 따라 프로그래밍된 범용 마이크로프로세서를 이용하여 구현될 수 있다. 따라서, 본 발명은 또한 본 발명에 따른 방법을 수행하기 위해 처리기에 의해 실행될 수 있는 명령들을 포함하는 기계-판독가능한 매체를 포함할 수 있다. 이 매체는 전자 명령들(electronic instructions)을 저장하기에 적절한 플로피 디스크, 광디스크, CD-ROM들, 또는 임의 유형의 매체를 포함하는 임의 유형의 디스크에 제한되지 않고 그 것들을 포함할 수 있다.
도 10은 본 발명을 구현할 수 있는 컴퓨터 시스템의 일실시예의 블록도이다. 시스템(700)은 본 발명의 실시예들에 따른 처리기(720)와 통신하는 버스(710), 시스템 메모리 모듈(730), 및 저장 장치(740)를 포함할 수 있지만, 이에 제한되지 않는다.
본 발명을 구현하기 위해 사용되는 소프트웨어의 구조는 임의의 원하는 형태를 취할 수도 있음을 이해할 것이다, 예를 들어, 예시된 방법은 단일 프로그램 또는 다수의 프로그램들로 구현될 수 있다.
본 발명의 다수의 수정들과 변형들이 상기 교시들에 비추어 가능하다. 따라서, 첨부된 청구항들의 범위 내에서, 본 발명은 본 명세서에 구체적으로 설명된 것과는 달리 실시될 수 있다.
본 발명을 통해, 이미지 요소들을 이미지 요소의 폐색되지 않은 둘레와 이미지 요소의 폐색된 둘레간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리로서 분류하기 위한 기술이 제공된다.
도 1a는 본 발명을 구체화하는 시스템의 블록도.
도 1b는 본 발명의 방법의 실시예의 흐름도.
도 2는 이미지 요소 둘레를 계산하기 위한 예시적인 단계들의 흐름도.
도 3은 도 2의 방법에 따라서 계산된 예시적인 둘레를 도시한 도면.
도 4는 폐색된 둘레와 폐색되지 않은 둘레를 계산하기 위한 예시적인 단계들의 흐름도.
도 5a 내지 도 5c는 도 4의 방법에 따라 계산된 예시적인 폐색된 둘레와 폐색되지 않은 둘레들을 도시하는 도면.
도 6은 폐색되지 않은 둘레 계산을 도시하는 도면.
도 7a 및 도 7b는 이미지 요소의 색 차이(color difference)를 계산하기 위한 예시적인 단계들의 흐름도.
도 8은 본 발명의 방법의 또 다른 실시예의 흐름도.
도 9는 도 1b 또는 도 8의 방법들이 적용될 수도 있는, 서로의 상부에 그려진 예시적인 이미지 요소들의 시퀀스로서 분해된 예시적인 전자적으로 생성된 이미지를 도시하는 도면.
도 10은 본 발명을 구현할 수 있는 컴퓨터 시스템의 일 실시예의 블록도.
* 도면의 주요 부분에 대한 부호의 설명 *
10 : 렌더링 엔진 20 : 분류기
30 : 전경 코더 40 : 배경 코더
720 : 처리기 730 : 메모리

Claims (26)

  1. 이미지 데이터를 처리하는 방법에 있어서:
    이미지 요소를 상기 이미지 요소의 폐색되지 않은 둘레(unoccluded perimeter)와 상기 이미지 요소의 폐색된 둘레(occluded perimeter)간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리에 할당하는 단계를 포함하는, 이미지 데이터 처리 방법.
  2. 제 1 항에 있어서,
    상기 복수의 카테고리들 중 상기 하나의 카테고리와 연관된 코딩 방식에 따라 상기 이미지 요소를 코딩하는 단계를 더 포함하는, 이미지 데이터 처리 방법.
  3. 제 1 항에 있어서,
    상기 이미지 요소의 형상을 결정하는 단계를 더 포함하는, 이미지 데이터 처리 방법.
  4. 제 3 항에 있어서,
    상기 이미지 요소의 형상을 결정하는 단계는 상기 이미지 요소의 폐색된 부분들을 제거하는 단계를 더 포함하는, 이미지 데이터 처리 방법.
  5. 제 1 항에 있어서,
    상기 복수의 카테고리들은 전경층과 배경층을 포함하는, 이미지 데이터 처리 방법.
  6. 제 1 항에 있어서,
    상기 이미지 요소를 할당하기 전에:
    전경층 및 배경층과 교차하는 상기 이미지 요소의 부분들을 결정하는 단계;
    상기 교차 부분들을 상기 이미지 요소의 폐색된 부분들로서 식별하는 단계;
    상기 이미지 요소의 형상을 결정하기 위해 상기 폐색된 부분들을 제거하는 단계; 및
    상기 이미지 요소의 상기 폐색되지 않은 둘레 및 상기 폐색된 둘레를 계산하는 단계를 더 포함하는, 이미지 데이터 처리 방법.
  7. 제 1 항에 있어서,
    상기 폐색되지 않은 둘레는 상기 이미지 요소의 원래 둘레, 상기 이미지 요소의 상기 폐색된 둘레 및 폐색된 부분들의 둘레에 기초하여 계산되는, 이미지 데이터 처리 방법.
  8. 제 1 항에 있어서,
    상기 폐색된 둘레는 상기 이미지 요소의 각 수평 주사선의 둘레들의 합, 상 기 이미지 요소의 각 수평 주사선과 다음의 수평 주사선간의 접촉 부분들의 길이들의 합에 기초하여 계산되는, 이미지 데이터 처리 방법.
  9. 제 1 항에 있어서,
    상기 비는 상기 이미지 요소와 적어도 하나의 인접한 이미지 요소간의 색 차이, 상기 폐색되지 않은 둘레, 상기 폐색된 둘레에 기초하는, 이미지 데이터 처리 방법.
  10. 제 9 항에 있어서,
    상기 색 차이는 상기 이미지 요소와 상기 적어도 하나의 인접한 이미지 요소간의 색 차이들 중 가장 크도록 계산되는, 이미지 데이터 처리 방법.
  11. 제 9 항에 있어서,
    상기 색 차이는 미리 정해진 수의 상기 적어도 하나의 인접한 이미지 요소와 상기 이미지 요소간의 색 차이들 중 평균이 되도록 계산되는, 이미지 데이터 처리 방법.
  12. 제 1 항에 있어서,
    상기 비가 미리 정해진 문턱값을 초과하면, 상기 이미지 요소는 상기 복수의 카테고리들 중 하나의 카테고리로서 분류되는, 이미지 데이터 처리 방법.
  13. 제 2 항에 있어서,
    복수의 카테고리들과 연관된 상기 코딩 방식들은 각각의 이미지 압축 방식들이고, 상기 배경층의 압축 방식은 상기 전경층의 압축 방식보다 상대적으로 높은 압축율과 이미지 손실을 갖는 코딩된 출력을 실현하는, 이미지 데이터 처리 방법.
  14. 이미지들을 처리하는 시스템에 있어서:
    프로세서;
    이미지 요소를 상기 이미지 요소의 폐색되지 않은 둘레와 상기 이미지 요소의 폐색된 둘레간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리로서 분류하도록 상기 프로세서를 제어하는 수단으로서, 상기 폐색되지 않은 둘레는 불연속적인 가시 경계(discontinuous visual boundary)인, 상기 프로세서 제어 수단을 포함하는, 이미지 처리 시스템.
  15. 제 14 항에 있어서,
    이미지 요소를 생성하는 수단을 더 포함하는, 이미지 처리 시스템.
  16. 제 14 항에 있어서,
    상기 복수의 카테고리들은 전경층과 배경층을 포함하는, 이미지 처리 시스템.
  17. 제 14 항에 있어서,
    상기 복수의 카테고리들 중 하나의 카테고리와 연관된 코딩 방식에 따라 상기 이미지 요소를 코딩하는 수단을 더 포함하는, 이미지 처리 시스템.
  18. 이미지 데이터를 처리하는 소프트웨어 모듈로서, 상기 모듈은 이미지 요소를 상기 이미지 요소의 폐색되지 않은 둘레와 상기 이미지 요소의 폐색된 둘레간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리에 할당하도록 계산 장치를 제어하는 명령들을 포함하고, 상기 폐색되지 않은 둘레는 불연속적인 가시 경계인, 소프트웨어 모듈.
  19. 기계-판독가능 매체로서, 상기 매체는 이미지 요소를 상기 이미지 요소의 폐색되지 않은 둘레와 상기 이미지 요소의 폐색된 둘레간의 비에 기초하여 복수의 카테고리들 중 하나의 카테고리로서 분류하는 단계를 수행하도록 계산 장치를 제어하는 프로그램 명령들을 포함하는 기계-판독가능 매체.
  20. 제 19 항에 있어서,
    상기 프로그램 명령들은 상기 복수의 카테고리들 중 하나의 카테고리와 연관된 코딩 방식에 따라 상기 이미지 요소를 코딩하는 것을 더 포함하는, 기계-판독가능 매체.
  21. 제 19 항에 있어서,
    상기 복수의 카테고리들은 전경층 및 배경층을 포함하는, 기계-판독가능 매체.
  22. 제 21 항에 있어서,
    상기 복수의 카테고리들과 연관된 상기 코딩 방식들은 각각의 이미지 압축 방식들이고, 상기 배경층의 압축 방식은 상기 전경층의 압축 방식보다 상대적으로 높은 압축율과 이미지 손실을 갖는 코딩된 출력을 실현하는, 기계-판독가능 매체.
  23. 제 19 항에 있어서,
    상기 비는 상기 이미지 요소와 적어도 하나의 인접한 이미지 요소간의 색 차이, 상기 폐색되지 않은 둘레, 상기 폐색된 둘레에 기초하는, 기계-판독가능 매체.
  24. 제 23 항에 있어서,
    상기 색 차이는 상기 이미지 요소와 상기 적어도 하나의 인접한 이미지 요소간의 색 차이들 중 가장 크도록 계산되는, 기계-판독가능 매체.
  25. 제 24 항에 있어서,
    상기 색 차이는 미리 정해진 수의 상기 적어도 하나의 인접한 이미지 요소와 상기 이미지 요소간의 색 차이들 중 평균이 되도록 계산되는, 기계-판독가능 매체.
  26. 제 19 항에 있어서,
    상기 비가 미리 정해진 문턱값을 초과하면, 상기 이미지 요소는 상기 복수의 카테고리들 중 상기 하나의 카테고리로서 분류되고, 그렇지 않은 경우, 상기 이미지 요소는 상기 복수의 카테고리들 중 다른 카테고리로서 분류되는, 기계-판독가능 매체.
KR1020080068214A 2001-02-01 2008-07-14 이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어모듈 및 기계-판독 가능 매체 KR100896668B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US26554401P 2001-02-01 2001-02-01
US60/265,544 2001-02-01

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020020005903A Division KR100873583B1 (ko) 2001-02-01 2002-02-01 이미지 요소를 분류하기 위한 방법 및 시스템

Publications (2)

Publication Number Publication Date
KR20080071537A true KR20080071537A (ko) 2008-08-04
KR100896668B1 KR100896668B1 (ko) 2009-05-14

Family

ID=23010895

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080068214A KR100896668B1 (ko) 2001-02-01 2008-07-14 이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어모듈 및 기계-판독 가능 매체

Country Status (2)

Country Link
JP (1) JP4351411B2 (ko)
KR (1) KR100896668B1 (ko)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11213156A (ja) * 1998-01-29 1999-08-06 Canon Inc 画像処理装置および方法、記録媒体
FR2776798A1 (fr) * 1998-03-24 1999-10-01 Philips Electronics Nv Procede de traitement d'images incluant des etapes de segmentation d'une image multidimensionnelle et appareil d'imagerie medicale utilisant ce procede
JP2000050259A (ja) * 1998-08-03 2000-02-18 Hitachi Telecom Technol Ltd 動画像符号化装置および動画像復号装置
AU5603300A (en) * 1999-06-11 2001-01-02 Pulsent Corporation Method and apparatus for digital image segmentation

Also Published As

Publication number Publication date
KR100896668B1 (ko) 2009-05-14
JP2003051007A (ja) 2003-02-21
JP4351411B2 (ja) 2009-10-28

Similar Documents

Publication Publication Date Title
US9830535B2 (en) Method and system for classifying image elements
EP1310912B1 (en) Image processing method, apparatus and system
US7433535B2 (en) Enhancing text-like edges in digital images
US7639880B2 (en) Compressing a multivalue image with control of memory space requirement
US7532767B2 (en) Removing ringing and blocking artifacts from JPEG compressed document images
JP2003228712A (ja) イメージからテキスト状のピクセルを識別する方法
US8024655B2 (en) Compressing page descriptions while preserving high quality
EP0949579A2 (en) Multiple size reductions for image segmentation
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US20070076965A1 (en) Image encoding apparatus
US9471857B2 (en) Overcoat processing mechanism
KR100896668B1 (ko) 이미지 데이터 처리 방법, 이미지 처리 시스템, 소프트웨어모듈 및 기계-판독 가능 매체
Chang et al. Color gradient vectorization for SVG compression of comic image
JP2003216957A (ja) 画素を分類するための方法およびシステム
Navin et al. Data Oriented Model of image: as a framework for image processing
JP2000040153A (ja) 画像処理方法、画像処理プログラムを記録した媒体及び画像処理装置
JP2004094854A (ja) 減色処理方法

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120329

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130329

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee