KR100226804B1

KR100226804B1 - 문서형식 판별방법

Info

Publication number: KR100226804B1
Application number: KR1019970002779A
Authority: KR
Inventors: 조문증
Original assignee: 구자홍; 엘지전자주식회사
Priority date: 1997-01-30
Filing date: 1997-01-30
Publication date: 1999-10-15
Also published as: KR19980066965A

Abstract

문서형식 판별방법에 관한 것으로, 입력된 문서를 스캐닝 후 균일한 입력영상을 만드는 전처리 단계와, 상기 균일한 입력영상을 화소열 평활화한 후 다시 역 화소열 평활화를 하는 단계와, 상기 역 화소열 평활화된 입력된 영상의 영역구조 데이터를 생성하여 이미 등록되어 있는 기준 문서의 영역 구조 데이터 베이스와 비교하여 문서를 판별하는 단계로 이루어져 비슷한 정보를 포함하고 있는 여러 종류의 문서의 영상을 가지고 입력된 문서의 종류가 어떤것인지 판별할 수 있다.

Description

문서형식 판별방법{method for judging document type}

본 발명은 입력된 문서영상이 어떤 형식인지 판별하는 문서형식 판별방법에 관한 것이다.

도 1은 일반적인 문서형식 판별방법을 설명하기 위한 플로우챠트로써, 먼저, 입력된 문서를 스캐닝하여 문서영상을 만든다(S11).

문서영상내의 잡영을 없애기도 하고, 문서의 기울어짐을 잡기도하고, 경우에 따라 흐리게 입력된 문서 영상의 향상과정을 거치기도 하는 전처리 과정을 거친다(S12).

이렇게 전치리가 된 문서 영상은 마크 추출과정을 통해 주어진 위치에 마크 영상을 추출하게 된다.(S13)

일반적으로 스캐닝과정(S11)에서 문서의 위치가 변화되기 때문에 이러한 변화에 무관하게 정확히 마크 위치를 찾는다.

마크영상이 추출되면 문서 판별과정에서 추출된 영상에서 마크의 수, 마크의 모양에 따라 문서의 종류를 판별하게 된다(S14).

즉, 각 문서에 일정한 위치에 특별한 표시를 하여 입력된 영상에 표시된 마크의 여부에 따라 문서의 형식을 인식하게 된다, 예를 들어 문서에 일정한 위치에 하나의 X 표가 있으면 1번 문서, 두 개의 X 표가 있으면 2번 문서같이 판별하는 것이다.

종래 기술에 따른 문서형식 판별방법은 문서를 인쇄할 때 인식이라는 관점에서 잘 구성이 되었다면 정확하게 문서를 판별할 수 있지만 일반적으로 만들어진 문서에는 마크를 만들지 않고, 문서를 인쇄하기 때문에 종래의 방법을 사용할 수 없는 문제점이 발생된다.

또한, 필요에 따라 여러 종류의 문서를 한 번에 처리하는 경우 각 문서간의 마크가 호환성이 없는 문제점이 발생된다.

본 발명은 비슷한 정보를 포함하고 있는 여러 종류의 문서의 영상을 가지고 입력된 문서의 종류가 어떤 것인지를 판별할 수 있는 문서형식 판별방법을 제공하는데 그 목적이 있다.

도 1은 일반적인 문서형식 판별방법을 설명하기 위한 플로우챠트

도 2는 본 발명에 따른 문서형식 판별방법을 설명하기 위한 플로우챠트

도 3은 본 발명에 따른 스캐닝된 문서 영상을 보여주는 도면

도 4는 본 발명에 따른 화소열 평활화 결과를 보여주는 도면

도 5는 본 발명에 따른 역화소열 평활화 결과를 보여주는 도면

본 발명에 따른 문서형식 판별방법의 특징은 전처리 후 화소열 평활화하고, 다시 역 화소열 평활화를 한다. 그리고, 입력된 영상의 영역구조 데이터를 생성하여 이미 등록되어 있는 기준 문서의 영역 구조 데이터 베이스와 비교하여 문서를 판별함에 있다.

이하, 본 발명에 따른 문서형식 판별방법을 첨부된 도면을 참조하여 설명하면 다음과 같다.

도 2는 본 발명에 따른 문서형식 판별방법을 설명하기 위한 플로우챠트로써, 본 발명에 따른 문서형식 판별방법을 간단히 설명하면 입력된 문서를 스캐닝하여 문서영상을 만들고(S21), 이 문서영상의 기울어짐(Skew)을 보정하는 전처리 과정을 수행한다(S22).

이때 입력된 문서영상은 입력상태에 따라 많은 잡영이나 변화가 일어나기 때문에 전치리 과정을 통해 균일한 입력 영상을 만든다.

그 다음 이 문서를 가지고 화소열 평활화(Run-length Smoothing)를 하고(S23), 다시 역 화소열 평활화(Inverse Run-length Smoothing)을 하게된다(S24).

이렇게 만들어진 영상은 입력된 문서영상에서 문자열로 표시되는 부분이 하나의 사각형으로 나타나게 된다.

이런 영상에서 영역구조 데이터를 만들게 되는데 이 데이터는 각 문자열로 만들어지는 사각형의 열로 표시되어 진다(S25).

그 다음 만들어진 영역 구조 데이터와 이미 등록되어 있는 기준 문서의 영역 구조 데이터 베이스와 비교하여 최종적으로 문서를 판별한다(S26).

이러한 본 발명에 따른 문서형식 판별방법의 각 과정에 대하여 더욱 상세히 설명하면 다음과 같다.

도 3은 본 발명에 따른 스캐닝된 문서 영상을 보여주는 도면이고, 도 4는 본 발명에 따른 화소열 평활화 결과를 보여주는 도면이고, 도 5는 본 발명에 따른 역화소열 평활화 결과를 보여주는 도면이다.

먼저, 입력된 문서를 스캐닝하고, 문서 영상의 기울어짐을 보정하는 단계(S21, S22)에서는 보통 사용자가 문서를 넣을 때 발생하는 문서영상의 기울어짐을 보정하여 도 3과 같이 전처리 과정을 수행한다.

이 전처리 과정 후 문서 영상에서 영역 구조 데이터를 만들어 내기 위해 화소열 평활화 과정(S23)을 거치게된다. 이 과정(S23)은 입력된 영상에서 일정한 거리 내에 있는 두 검은 화소 사이를 검은 화소로 바꾸게 된다.

이 과정(S23)은 수평방향과 수직방향에 대해 각각 화소열 평활화 과정(S23)을 거친다. 따라서 도 4와 같이 화소열 평활화 과정(S23) 이후에는 문자열이 하나의 사각형으로 표시된다.

그러나, 문서 영상 내에 포함되어 있는 잡영에 의해 정확한 사각형이 만들어지지 않고, 원하지 않는 문자영역이 추출되기도 한다.

그리고 화소 평활화 후에는 이 화소 평활화 과정과 반대로 배경화소를 기준으로 역화소열 평활화 과정을 수행하게 된다(S24). 즉, 도 5와 같이 일정한 거리 내에 있는 두 배경화소 사이를 배경화소로 바꾸게 된다.

이러한 과정(S24)으로 화소열 평활화 과정으로 만들어진 영상에서 잡영으로 만들어진 영역들을 제거하여 비교적 안정적으로 문자열 부분이 사각형으로 변환된다.

화소열 평활화 과정(S23)과 역 화소열 평활화 과정(S24)을 통해 만들어진 영상으로부터 영역 구조를 기술하는 데이터를 만들어내야 문서의 형식을 판별할 수 있다.

앞의 역 화소열 평활화 과정(S24)까지의 과정으로 문서 영상에 포함되어 있는 문자열이 사각형으로 표시되는데, 이들 사각형을 데이터화 하기 위해 각 사각형의 위치를 찾게 된다.

결과적으로 만들어지는 데이터는 사각형의 열로 영역구조 데이터가 생성된다(S25).

하나의 사각형을 표시하기 위해서는 레프트(left), 톱(top), 라이트(right), 바텀(bottom)의 4가지 요소가 필요하다.

이것을 수식으로 표시하면 R = {Rl, Rt, Rr, Rb}이다.

따라서, 하나의 문서영상을 표현하는 영역구조 데이터는 다음과 같다.

F = {R1, R2, …, Rn) (n은 영상에서의 사각형의 개수)

이렇게 만들어진 데이터는 각기 다른 문서의 구조에 따라 고유한 값을 가지게 된다.

문서의 형식을 등록하는 경우, 이 값을 데이터베이스에 저장하고, 이 저장되어 있는 문서 형식들의 영역 구조 데이터의 데이터베이스와 입력된 문서 영상의 영역구조 데이터의 데이터 베이스와 비교하여 문서의 형식을 판별하게 된다(S26). 즉, 가장 유사한 문서 형식을 판단하게 된다.

먼저, 유사한 문서 형식을 판단하기 위해 같은 영역 수를 갖는 데이터베이스 요소들을 선택한다.

그 다음 기준이 되는 영역을 선택한다. 즉 기준이 되는 영역은 위로부터 가로 길이의 1/2 이상이 되는 폭을 가지는 영역을 기준으로 삼게된다. 이렇게 기준 영역이 선택되면 기준 영역의 위치를 기준으로 X축 오프셋과 Y축 오프셋이 구해지게 된다.

이렇게 오프셋을 구하는 이유는 문서들은 스캐닝되는 상태에 따라 이동이 발생할 수 있기 때문에 같은 문서라도 스캐닝 후의 영역들이 매번 움직이게 된다.

따라서, 오프셋을 정하게 되면 영역이 이동을 하더라도 상대위치에 따라 값이 조정되므로 항상 일정한 값을 가지게 만들 수 있다.

문서의 판별은 데이터베이스의 기준 문서의 영역구조 데이터와 입력된 문서의 영역구조 데이터외 비유사도를 계산하여 가장 작은 값을 갖는 것으로 문서를 판별하게 된다.

여러개의 영역으로 이루어진 문서의 비유사도는 각 영역의 영역 비유사도의 평균값으로 정의되어진다.

다음은 영역 비유사도를 구하는 식이다.

여기서, 데이터 베이스의 하나의 요소를 R로 표시하고, 입력된 문서 영상의 하나의 영역을 I로 표시하면 영역 비유사도 Cost는 다음과 같다.

Wcross = min(Rr-Rl, Ir-Il)

Hcross = min(Rb-Rt, Ib-It)

Rl, Rt, Rr, Rb

Cost =(Wcross*Hcross-Wdiff*Hdiff)/(Rr - Rl)*(Rb - Rt)

이렇게 하나의 영역에 대한 영역 비유사도가 계산되어지고, 전체 영상에 대한 비유사도는 각 영역 비유사도의 평균으로 계산되어진다.

그리고, 최종적인 문서의 판별은 데이터베이스에 있는 모든 요소 중에 영역의 개수가 같은 모든 요소에 대한 비유사도를 계산하고, 이중에서 가장 작은 비유사도를 갖는 요소로 문서를 최종적으로 판별한다.

이와 같은 본 발명에 따른 문서형식 판별방법은 다양한 응용이 가능한데 그 중 하나의 실시의 예는 신용카드 전표형식 판별에 응용될 수 있다.

본 발명에 따른 문서형식 판별방법은 비슷한 정보를 포함하고 있는 여러 종류의 문서의 영상을 가지고 입력된 문서의 종류가 어떤 것인지 판별할 수 있는 효과가 있다.

즉, 현재 신용카드 전표는 필기 전표를 비롯하여 다양한 기계에 의해 출력되는 인쇄체 전표들이 있고, 이들 전표들을 자동화하기 위해 입력 영상에서 문서의 종류를 판별하는 것이 필수적이므로 신용카드 전표 형식 판별, 그외 보험 청약서 종류판별, 지로 판별 등에 사용될 수 있다.

Claims

입력된 문서를 스캐닝 후 균일한 입력영상을 만드는 전처리 단계와,

상기 균일한 입력영상을 화소열 평활화한 후 다시 역 화소열 평활화를 하는 단계와,

상기 역 화소열 평활화된 입력된 영상의 영역구조 데이터를 생성하여 이미 등록되어 있는 기준 문서의 영역 구조 데이터 베이스와 비교하여 문서를 판별하는 단계로 이루어짐을 특징으로 하는 문서형식 판별방법.
제 1 항에 있어서,

상기 문서를 판별하는 단계의 기준 문서의 영역 구조 데이터 베이스와 비교는

상기 입력된 영상의 생성된 영역구조 데이터와 같은 영역 수를 갖는 데이터베이스 요소들을 선택하는 단계와,

기준이 되는 영역을 선택하는 단계로 이루어짐을 특징으로 하는 문서형식 판별방법.
제 1 항에 있어서,

상기 문서를 판별하는 단계는

데이터베이스의 기준 문서의 영역구조 데이터와 입력된 문서의 영역구조 데이터의 전체 영역에 대한 비유사도를 계산하여 가장 작은 값을 갖는 것으로 최종 문서로 판별함을 특징으로 하는 문서형식 판별방법.