KR20040092564A

KR20040092564A - 경계선 분포를 이용한 스캔 영상의 상역 분리 방법

Info

Publication number: KR20040092564A
Application number: KR1020030026046A
Authority: KR
Inventors: 전승홍; 홍두의; 조남익
Original assignee: 주식회사신도리코
Priority date: 2003-04-24
Filing date: 2003-04-24
Publication date: 2004-11-04
Also published as: KR100537827B1

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야

본 발명은 경계선 분포를 이용한 스캔 영상의 상역 분리 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.

2. 발명이 해결하려고 하는 기술적 과제

본 발명은 스캔 영상의 배경 밝기를 구하고 상기 스캔 영상을 소정의 크기로 블록화하여 구한 상기 각 블록들의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 이용하여 상기 스캔 영상을 배경영역 또는 화상영역 또는 문자영역으로 분리하기 위한 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있음.

3. 발명의 해결방법의 요지

본 발명은, 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계를포함한다.

4. 발명의 중요한 용도

본 발명은 복합기, 복사기, 스캐너 등에 이용됨.

Description

경계선 분포를 이용한 스캔 영상의 상역 분리 방법{Method for the Separation of text and Image in Scanned Documents using the Distribution of Edges}

본 발명은 경계선 분포를 이용한 스캔 영상의 상역 분리 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 더욱 상세하게는 광전 변환소자(CCD : Charge Coupled Device) 또는 접촉 이미지 센서(CIS : Contact Image Sensor) 등에 의해 스캐닝된 문서영상을 배경영역과 화상영역 및 문자영역으로 분리하기 위한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.

그림이 포함된 문서를 일반 문서저장 시스템이나 팩스에서와 같이 이진 처리및 압축을 하게 되면 심각한 정보의 손실이 생긴다. 이를 해결하기 위하여 256 그레이-레벨(Gray-Level) 또는 컬러 화상 자체로 압축해야 하는데 이것은 이진압축과 비교하면 화상에서의 정보의 손실은 적지만 압축의 효율면에서 크게 떨어진다. 반면, 압축률을 높이기 위하여 JPEG(Joint Photographic Coding Experts Group) 방식으로 저장할 때 양자화를 크게 하면 문자 부분에 많은 에러가 발생한다.

따라서, 화상이 포함된 문서영상을 효율적으로 처리하고 압축하기 위해서는 화상 부분은 그레이-레벨(Gray-Level)이나 컬러로 JPEG 방식의 압축을 하고, 문자 부분은 JBIG(Joint Bi-level Image Group) 방식으로 압축해야 한다. 이를 위해서는 문서영상에서 화상영역과 문자영역을 분리하는 방법이 필요하다.

보통, 주어진 영상을 분석하여 화상영역과 문자영역으로 분리하는 방법으로는 주파수 분석을 이용한 방법이 주로 사용된다. 이를 위해서, FFT(Fast Fourier Transform)를 사용하거나 혹은 N(가로)*M(세로)개의 화소로 이루어진 국소영역에서 이웃하는 화소(가로 방향 혹은 세로 방향)와의 계조차를 계산하여, 이 계조차값의 분포를 이용하는 방법 등이 주로 사용된다.

사진 등과 같이 연속계조를 가지는 화상은 그 특성상 계조가 완만하게 변화하는 저주파 특성을 가지고 있다. 따라서, 이러한 연속계조 영상을 N*M개의 국소영역으로 나누어 이 국소영역을 FFT 변환하면 문자영역에 비해서 자주파의 값이 크게 나타나게 된다. 반대로 문자영역의 경우는 문자 획의 경계 부분에서 계조가 급격하게 변화하기 때문에, FFT 변환시 사진 등의 연속계조 화상영역에 비해서 고주파 부분의 값이 크게 나타난다.

그러나, FFT는 계산 특성상 상당히 많은 수학적 연산을 필요로 하기 때문에 실시간으로 화상을 분석하기에는 적절하지 못하다. 따라서, 계조차를 이용하여 주파수 분석을 대신하는 방법이 많이 사용되는데, 이는 해당 국소영역에서 이웃하는 화소와의 계조차를 계산하여, 이 값의 분포(Histogram)에 있어서 0에 가까운 작은 값들이 많다면 저주파가 강한 화상 즉, 사진 등의 연속계조 화상영역으로 판별할 수 있고, 반대로 이웃하는 화소와의 계조차값 분포에 큰 값들이 다수 존재하고 나머지 계조차값이 0인 것이 전체 분포의 대다수를 차지한다면 고주파가 강한 것이므로 문자영역으로 판별한다.

여기서, 문자영역의 계조차값이 0인 것이 전체 분포의 대다수를 차지하는 이유는, 문자의 배경이 대개의 경우 흰색이거나 흰색이 아니더라도 일정한 밝기를 가지는 경우가 대부분이며, 문자 또한 획의 경계 부분을 제외한 획 내부는 일정한 색 즉, 대부분의 경우 검정색이기 때문이다.

최근 인쇄기술의 발전으로 많은 서적, 신문, 잡지 등에서 이진 출력화상이 사용되고 있고 집집마다 보급된 잉크젯 프린터나 레이저 프린터의 출력물 또한 이진 출력화상이다. 이러한 이진 출력화상은 오차 확산법이나 디더 스크린을 사용한 이진화를 통해서 연속계조 영상을 망처리하여 출력하기 때문에 사람의 눈에는 연속계조 화상으로 보이나 실제로는 이진 화상으로 FFT 변환시 연속계조 화상과 달리 고주파 성분이 매우 강하게 나타난다. 따라서, 종래의 방법으로는 문자영역에 포함되어 있는 이진 화상을 분리하는데 용이하지 못하다는 문제점이 있다.

본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, 스캔 영상의 배경 밝기를 구하고 상기 스캔 영상을 소정의 크기로 블록화하여 구한 상기 각 블록들의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 이용하여 상기 스캔 영상을 배경영역 또는 화상영역 또는 문자영역으로 분리하기 위한 경계선 분포를 이용한 스캔 영상의 상역 분리 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.

도 1 은 본 발명에 따른 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 대한 일실시예 전체 흐름도.

도 2 는 본 발명에 따른 화상과 문자에 대한 경계선 분산의 누적분포그래프.

도 3 은 본 발명에 따른 화상과 문자에 대한 경계선의 분산을 평균 밝기를 반전시킨 값으로 정규화한 값의 누적분포그래프.

도 4 는 본 발명에 따른 입력 영상의 상역 분리 과정에 대한 일실시예 흐름도.

도 5 는 본 발명에 따른 배경의 밝기를 구하는 과정에 대한 일실시예 흐름도.

도 6 은 본 발명에 따른 경계선의 분산을 구하는 과정에 대한 일실시예 흐름도.

도 7 은 본 발명에 따른 경계선 분포를 이용한 스캔 화상의 상역 분리 방법에 대한 일실시예 상세 흐름도.

도 8 은 본 발명을 수행한 후에 후처리 과정을 수행한 결과를 나타내는 일예시도.

* 도면의 주요 부분에 대한 부호의 설명

21 : 화상에 대한 경계선 분산의 누적분포그래프

22 : 문자에 대한 경계선 분산의 누적분포그래프

31 : 화상에 대한 경계선 분산을 정규화시킨 누적분포그래프

32 : 문자에 대한 경계선 분산을 정규화시킨 누적분포그래프

상기 목적을 달성하기 위한 본 발명의 방법은, 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계를 포함하는 것을 특징으로 한다.

한편, 본 발명은, 경계선 분포를 이용하여 스캔 영상의 상역을 분리하기 위하여, 프로세서를 구비한 스캔 영상의 상역 분리 장치에, 화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 기능; 상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 기능; 상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 기능; 상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 기능; 및 상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.

도 1 은 본 발명에 따른 경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 대한 일실시예 전체 흐름도이다.

먼저, 입력된 전체 영상에 포함된 배경의 밝기(Intensity)를 구하고, 입력된 전체 영상을 16*16 픽셀(Pixel) 크기의 블록으로 나눈다. 그리고, 나누어진 다수 블록들에 대한 경계선과 경계선의 분산, 밝기의 평균과 분산을 구한다. 이후, 이를 이용하여 각 블록들을 배경블록 또는 화상블록 또는 문자블록으로 분류한다.

그리고, 분류 과정에서 포함된 노이즈를 비롯하여 화상, 문자의 일부분이 부분적인 특성에 의해 잘못 분류된 것을 수정한다. 이를 위하여 문맥적 판단 방식을 이용한다. 또한, 문서에 포함되는 대부분의 화상은 직사각형의 형태임을 이용하여 분류된 화상을 직사각형으로 만들어 주어 부분적으로 잘못 분류된 화상을 바로 잡고 화상의 경계가 확실히 화상에 포함되도록 만든다. 이를 위하여 선행적으로 화상에 대해 블랍 컬러링(Blob Coloring)을 수행하여 화상마다 다른 번호를 부여한다. 이 과정으로 인하여 문서에 포함된 화상을 따로 추출할 수도 있다.

여기서, 화상과 문자가 포함되어 있는 영상을 분류하는 방법에 대해 좀 더 상세히 살펴보면, 일반적으로 화상은 연속적인 톤을 가지고 문자는 밝기(Intensity)의 차이가 큰 화이트(White)와 블랙(Black)이 계속 교차한다. 따라서, 화상은 전반적으로 작은 경계선(Edge)을 갖고 문자는 화이트와 블랙이 교차하는 부분에서 큰 경계선을 가지게 된다.

하지만, 단지 블록내 경계선의 총합이나 평균 등으로는 화상 블록과 문자 블록을 확실히 분류하기가 어렵다. 그 이유는 화상 블록은 각 픽셀의 경계선이 작지만 모든 픽셀이 어느 정도 크기의 값을 가지고 있는 반면, 문자 블록은 화이트와 블랙이 교차하는 부분에서의 경계선이 크지만 그 범위가 매우 좁고 나머지 부분은 화이트의 단색이므로 경계선이 0 또는 극히 작은 값을 가져, 단순한 합에서는 분리에 이용할 수 있을 만큼의 뚜렷한 차이를 얻을 수 없기 때문이다.

이러한 화상 블록과 문자 블록에서의 경계선 특성을 잘 반영할 지표로 제시된 것이 바로 경계선의 분산이다. 비슷한 경계선이 계속되는 화상 블록은 분산이 매우 작고, 반대로 경계선이 0에 가까운 부분과 매우 큰 부분이 같이 존재하는 문자 블록의 경우는 분산이 매우 크다. 도 2 에 도시된 바와 같이, 화상의 경계선 분산이 문자의 경계선 분산에 비해 작은 쪽으로 몰려 분포하는 경향을 가진다는 것을 알 수 있다. 따라서, 일정한 기준을 정하여 그보다 큰 값을 가지는 블록은 문자로, 작은 값을 가지는 블록은 화상으로 분류할 수 있다. 이 때, 화상이 문자보다 큰 값을 가져 글자로 잘못 분류되는 경우를 가능한 적게 하기 위해서 기준을 약간 크게 잡아야 한다.

하지만, 이러한 방식만으로는 잘못 분류되는 경우가 생긴다. 우선, 화상 블록의 경계선 분산이 큰 경우 글자로 잘못 분류된다. 이는 주로 화상에서 밝은색과 어두운색의 경계를 포함하는 블록이나 화상과 배경의 경계에 속하는 블록에 해당되는데, 이러한 블록은 경계를 나타내는 것이므로 대부분 두께가 1~2블록인 선을 이루어 분포한다.

즉, 화상으로 분류된 블록들 사이에 문자로 분류된 블록이 포함된 형태이다. 하지만, 경계선의 분산으로 분류할 시에 이미 화상이 문자로 분류되는 경우가 적도록 기준값을 높게 잡았으므로 그 수가 많지 않다. 따라서, 후처리 과정인 문맥적 판단(Context-Based Determination)에서 대부분 수정이 가능하다.

문제가 되는 것은 기준보다 작은 경우에 문자가 속하는 것이다. 이는 블록 내에 문자가 일부분만이 포함되는 경우 즉, 문자와 여백 사이, 문자와 문자 사이뿐만 아니라 문자 내의 획과 획 사이에서 생기기도 하고, 문자가 제대로 포함되더라도 블랙의 밝기가 충분히 작지 않은 경우에 발생하기도 한다.

이를 해결하기 위하여 블록의 경계선 분산을 그 블록의 평균 밝기를 반전시킨 값으로 정규화한 값을 이용한다. 여기서, 정규화는 평균 밝기를 반전시킨 값으로 여러번 나눌수록 화상의 경계선 분산과 문자의 경계선 분산의 차이가 조금씩 뚜렷해지지만 그 차이가 매우 작다. 따라서, 한번의 정규화 과정으로 충분히 정확한 분류가 가능하다.

각 화상 블록과 문자 블록에 대해 경계선의 분산이 작은 경우에 이용되는 경계선의 분산을 평균 밝기를 반전시킨 값으로 정규화한 값을 누적시킨 누적분포는 도 3 에 도시되어 있다. 도 3 에 도시된 바와 같이, 문자 블록의 경계선 분산값이 화상 블록의 값에 비해 매우 큰 것을 알 수 있다. 이러한 특성을 이용하여 경계선의 분산이 작은 블록을 영상과 문자로 쉽게 분류할 수 있다.

여기서, 블록의 평균 밝기를 반전시킨 값은 문서의 256 그레이-레벨(Gray-Level) 영상을 예로 들었을 때, 255에서 평균 밝기를 뺀 값을 의미한다.

다음으로, 화상과 문자가 포함되어 있는 영상에서 배경을 분류하는 방법에 대해 살펴보겠다.

문서의 배경은 일반적으로 화이트에 가까운 단색으로 이루어져 있다. 따라서, 이를 경계선만을 고려하여 분류하면 경계선의 분산값이 매우 작으므로 화상으로 분류된다. 그러나, 배경은 전체문서의 상당한 영역을 차지하고 있으므로 문자와 같이 이진 압축되거나 따로 분리되어야 압축의 효율이 커지므로 배경을 따로 분류해야 한다.

이를 위하여, 배경은 흰색에 가깝다는 점과 단색으로 이루어져 있다는 점을 이용하여 문서영상에 대해 밝기가 큰(256 그레이-레벨을 예로 들었을 때 206이상) 픽셀에 대해 밝기에 따른 히스토그램을 그리고 그 중 최빈값을 주어진 문서영상의 배경 밝기로 정한다. 그리고, 분류 과정에서 경계선에 따른 분류를 하기 이전에 블록내의 밝기의 분산이 충분히 작고 밝기의 평균이 미리 구해둔 배경의 밝기와 가깝거나 더 밝으면 이를 배경으로 분류한다.

도 4 는 본 발명에 따른 입력 영상의 상역 분리 과정에 대한 일실시예 흐름도이다.

도 4 에 도시된 바와 같이, 영상이 입력되면 입력된 전체 영상에 포함된 배경의 밝기(Intensity)를 구하고, 입력된 전체 영상을 16*16 픽셀(Pixel) 크기의 블록으로 나눈다. 그리고, 나누어진 다수 블록들에 대한 경계선과 경계선의 분산, 밝기의 평균과 분산을 구한다. 이후, 이를 이용하여 각 블록들을 배경블록 또는 화상블록 또는 문자블록으로 분류한다.

도 5 는 본 발명에 따른 배경의 밝기를 구하는 과정에 대한 일실시예 흐름도이다.

도 5 에 도시된 바와 같이, 256 그레이-레벨(Gray-Level)로 된 문서 영상을 입력으로 받아 전체 영상의 픽셀중 205보다 큰 밝기를 가지는 픽셀들만을 대상으로 밝기에 관한 히스토그램(Histogram)을 그린다. 그리고, 완성된 히스토그램으로부터 가장 많이 나타나는 밝기(최빈값)를 찾아 이를 배경의 밝기로 정한다.

도 6 은 본 발명에 따른 경계선의 분산을 구하는 과정에 대한 일실시예 흐름도이다.

도 6 에 도시된 바와 같이, 16*16 픽셀 크기의 블록을 입력으로 받아 경계선 분산을 구하는데 이용되는 경계선을 먼저 구한 후, 경계선의 분산을 구한다. 그리고, 이 과정에서 부가적으로 밝기의 평균과 분산도 구한다. 반면, 블록의 모든 픽셀의 밝기는 이미 가지고 있는 값으로 따로 구하지 않는다. 여기서, 경계선의 분산을 구하는 방법으로는 가장 널리 사용되는 방식인 소벨 오퍼레이터(SobelOperator)를 이용한다.

이를 좀 더 상세히 살펴보면, 하나의 픽셀에 대응하는 경계선은 가로방향과 세로방향의 두가지인데 글자의 획은 가로 방향일 수도, 세로 방향일 수도 또는 대각선 방향일 수도 있기 때문에 이 세 방향을 모두 커버할 수 있도록 가로방향 경계선과 세로방향 경계선을 모두 구한다. 따라서, 한 블록 내에서 구할 수 있는 경계선은 모두 16*16*2 = 512개이며, 이로부터 경계선의 분산을 구한다.

여기서, 좌표(x, y)에서의 경계선(edge)은 하기의 [수학식 1]과 같이 정의한다. 단는 픽셀(x, y)의 밝기이다.

또한, 경계선의 분산은 하기의 [수학식 2]와 같이 정의한다. 여기서, 블록이 시작되는 픽셀을 좌표 (0, 0)이라 할때 i열 j행에 위치한 블록이라면 전체 영상에서 그 블록이 시작되는 픽셀은 (j*16, i*16)이 된다.

또한, 블록의 평균 밝기와 블록의 분산은 하기의 [수학식 3]과 같이 정의한다.

도 7 은 본 발명에 따른 경계선 분포를 이용한 스캔 화상의 상역 분리 방법에 대한 일실시예 상세 흐름도이다.

먼저, 화상영역과 문자영역이 포함된 영상이 입력되면(701) 전체 영상의 배경 밝기를 구한다(702). 이후, 전체 영상을 16*16 픽셀 크기의 블록으로 나눈다(703). 그리고, 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구한다(704).

이후, 전체 영상의 배경 밝기와 각 블록의 평균 밝기와 밝기의 분산 및 경계선 분산을 이용하여 다음과 같은 분류 과정을 진행한다.

먼저, 경계선 분산에 의한 분류를 하기 이전에 블록내의 밝기의 분산이 충분히 작고 즉, 소정의 임계치보다 작고 블록의 밝기의 평균이 배경의 밝기보다 더 밝거나 비슷하면(705, 706) 이를 배경영역으로 분류한다(707). 반면, 블록내의 밝기의 분산이 소정의 임계치보다 작고 블록의 평균 밝기가 배경의 밝기보다 밝지 않으면(705, 706) 이를 화상영역으로 분류한다(710).

한편, 블록내의 밝기의 분산이 소정의 임계치보다 크고(705) 경계선의 분산이 소정의 임계치보다 크면(708) 이를 문자영역으로 분류한다(711). 반면, 블록내의 밝기의 분산이 소정의 임계치보다 크고(705) 경계선의 분산이 소정의 임계치보다 크지 않으면(708) 화상영역내에 문자영역이 포함되어 있는 경우이므로 블록의 분산을 그 블록의 평균 밝기를 반전시킨 값으로 정규화한 값을 이용한다.

즉, 정규화된 값이 소정의 임계치보다 큰가를 비교하여(709) 크면 문자영역으로 분류하고(711) 크지 않으면 화상영역으로 분류한다(710).

상기와 같은 과정을 통하여 화상과 문자가 포함된 영상을 쉽게 배경영역, 화상영역, 문자영역으로 분리할 수 있다.

다음으로, 후처리 과정인 문맥적 판단, 블랍 컬러링, 그림의 사각화 과정에 대해 좀 더 살펴보겠다.

영상의 분류 단계에서 분류된 블록들은 어느 정도의 오류를 포함하는데, 이는 주로 배경이나 문자 부분에 섞인 노이즈로 인한 경우, 굵은 문자의 일부분이 화상으로 분류된 경우, 화상중 밝은색과 어두운색의 경계부가 문자로 분류되는 경우 등이 대부분이다. 이러한 블록들은 대체로 혼자 떨어져 점점이 존재하거나 선을 이루어 존재하는 것이 보통이다. 따라서, 이를 바로잡기 위해서 주변 블록이 무엇으로 분류되었는지 참고하여 자신을 다시 분류하는 문맥적 판단 방법(Context-based Determinition)을 이용한다. 여기서, 오류를 포함하는 블록들이 선으로 존재하는 경우가 있으므로 가로 방향과 세로 방향의 블록들을 동시에 참고하는 것보다 각 방향에 대해 각각 시행해야 한다.

이를 좀 더 상세히 살펴보면, 상역 분리가 완료된 영상에서 배경블록과 문자블록은 0, 화상블록은 1 로 표시되어 있다. 이 때, i열 j행에 위치한 블록의 종류를=0, 1 이라고 할 때 가로 방향의 문맥적 판단은 하기의 [수학식 4]와 같다.

또한, 세로 방향의 문맥적 판단은 하기의 [수학식 5]와 같다.

한편, 상기와 같은 문맥적 판단 과정을 거친 영상은 블랍 컬러링에 의해 각각의 연속적인 번호가 부여된다. 그러면, 그림의 사각화 과정에서 블랍 컬러링에 의해 부여된 연속적인 번호를 이용하여 그림 모양을 직사각형 모양으로 맞춰준다.

블랍 컬러링에 의해 배경영역 및 문자영역은 0으로 표시되고 그림에는 1,2,3...의 번호가 부여된 상태이다. 미리 각 화상의 상하좌우의 좌표를 저장할 공간을 만들고 번호가 부여된 블록들을 하나하나 확인하여 화상을 만날 때마다 그 번호에 해당하는 좌표를 계속 갱신하면 그 화상의 상하좌우의 마지막에 해당하는 좌표를 쉽게 알 수 있다. 이렇게 구한 좌표로 구성되는 직사각형의 내부의 블록에 모두 같은 번호를 할당하면 화상을 직사각형으로 바꾸는 작업이 끝난다. 이 작업을 통해 화상내에 여전히 존재할 수 있었던 잘못 분류된 문자블록(실제로 문자일 수도 있다. 다만 화상을 배경으로 하는 문자라면 화상으로 분류되는 것이 옳을 것이다.)을 제거하고 화상의 경계부가 확실히 화상에 포함되도록 할 수 있다. 이 때, 배경, 문자의 일부가 256 그레이-레벨(Gray-Level)로 압축되는 것은 정보 손실의 측면에서 문제될 것이 없지만, 화상이 이진압축되는 것은 심각한 문제이다. 따라서, 직사각형을 맞추면서 화상이 약간 더 넓어지는 것은 큰 문제는 아니다.

또한, 부가적으로 작은 화상은 오류로 보고 배경, 문자로 다시 분류할 수 있다. 이는 앞에서 구한 화상의 좌표를 이용하면 화상의 면적을 쉽게 구할 수 있고, 이를 전체 문서영상의 면적과 비교함으로써 가능하다. 본 발명에서는 일실시예로 화상의 면적이 전체 면적의 1/700 보다 작으면 화상을 삭제하도록 하였다. 물론 화상은 삭제되더라도 번호는 계속 연속적으로 유지된다.

도 8 은 본 발명을 수행한 후에 후처리 과정을 수행한 결과를 나타내는 일예시도이다.

원래의 문서영상(81)을 상역 분리한 후, 후처리 과정인 문맥적 판단 과정을 거친 결과(82)를 최종적으로 사각화하여 얻은 결과(83)를 나타낸다.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 형태로 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다. 이러한 과정은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있으므로 더 이상 상세히 설명하지 않기로 한다.

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.

상기와 같은 본 발명은, 전자 입력 화상뿐만 아니라, 다양한 해상도를 지원하는 복합기나 복사기 및 스캐너 등에 적용되어 스캐닝된 화상에 대해서도 전자화상과 동일하게 처리할 수 있는 효과가 있다.

또한, 본 발명은, 다양한 해상도를 지원하는 복합기나 복사기 및 스캐너 등에 적용되어 화상영역들 중에서 특정 화상영역을 독취할 수 있게 할뿐만 아니라, 분리된 영역의 특성에 맞는 알고리즘을 적용하여 화상의 품질을 높이고 처리속도를 단축시킬 수 있는 효과가 있다.

또한, 본 발명은, 연산 능력이 떨어지는 임베디드 시스템에 적용되어 가능한 빠른 시간에 간단한 연산으로 상역을 분리하여 임베디드 시스템의 성능을 향상시킬 수 있는 효과가 있다.

Claims

경계선 분포를 이용한 스캔 영상의 상역 분리 방법에 있어서,

화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 단계;

상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 단계;

상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 단계;

상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 단계; 및

상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 단계

를 포함하는 경계선 분포를 이용한 스캔 영상의 상역 분리 방법.
제 1 항에 있어서,

상기 제 4 단계는,

상기 제 3 단계에서 구한 블록의 밝기 분산이 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 클 경우, 상기 블록을 배경영역으로 판별하는 제 6 단계;

상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 7 단계;

상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 제 2 임계치보다 큰 경우, 상기 블록을 문자영역으로 판별하는 제 8 단계;

상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 제 3 임계치보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 9 단계; 및

상기 제 3 단계에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 상기 제 3 임계치보다 클 경우, 상기 블록을 문자영역으로 판별하는 제 10 단계

를 포함하는 경계선 분포를 이용한 스캔 영상의 상역 분리 방법.
경계선 분포를 이용하여 스캔 영상의 상역을 분리하기 위하여, 프로세서를 구비한 스캔 영상의 상역 분리 장치에,

화상영역과 문자영역이 포함된 영상을 입력받아 상기 영상의 배경 밝기를 구하는 제 1 기능;

상기 입력받은 영상을 소정의 크기로 블록화하는 제 2 기능;

상기 블록화된 각 블록의 평균 밝기와 밝기의 분산 및 경계선과 경계선 분산을 구하는 제 3 기능;

상기 구한 밝기의 분산, 평균 밝기 및 경계선 분산을 이용하여 각 블록을 배경영역, 화상영역 또는 문자영역으로 분리하는 제 4 기능; 및

상기 분리된 배경영역, 화상영역, 문자영역에 대한 후처리 과정을 수행하여 오류를 보정하는 제 5 기능

을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
제 3 항에 있어서,

상기 제 4 기능은,

상기 제 3 기능에서 구한 블록의 밝기 분산이 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 클 경우, 상기 블록을 배경영역으로 판별하는 제 6 기능;

상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작고, 상기 블록의 평균 밝기가 배경의 밝기에서 소정의 값을 뺀 값보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 7 기능;

상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 제 2 임계치보다 큰 경우, 상기 블록을 문자영역으로 판별하는 제 8 기능;

상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 제 3 임계치보다 크지 않을 경우, 상기 블록을 화상영역으로 판별하는 제 9 기능; 및

상기 제 3 기능에서 구한 블록의 밝기 분산이 상기 제 1 임계치보다 작지 않고, 상기 블록의 경계선 분산이 상기 제 2 임계치보다 크지 않으면서, 상기 블록의 경계선 분산을 상기 블록의 평균밝기를 반전시킨 값으로 정규화한 값이 상기 제 3 임계치보다 클 경우, 상기 블록을 문자영역으로 판별하는 제 10 기능

을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.