KR930012142B1

KR930012142B1 - 문서인식장치의 개별문자 절출방법

Info

Publication number: KR930012142B1
Application number: KR1019910022942A
Authority: KR
Inventors: 노희호
Original assignee: 주식회사 금성사; 이헌조
Priority date: 1991-12-13
Filing date: 1991-12-13
Publication date: 1993-12-24
Also published as: KR930014175A

Abstract

내용 없음.

Description

문서인식장치의 개별문자 절출방법

제1도는 종래 문서인식장치에 있어서의 문자분리 동작 흐름도.

제2도는 본 발명을 수행하기 위한 문서인식장치의 시스템 구성도.

제3도는 제2도 문서인식장치의 동작설명에 대한 신호흐름도.

제4도는 제3도 개별문자 절출과정을 보다 상세하게 도시한 신호 흐름도.

제5도는 제4도 분리문자 융합과정을 보다 상세하게 도시한 신호 흐름도.

제6도는 제4도의 접촉문자를 포함한 단어검출 및 접촉문자 절단과정을 보다 상세하게 도시한 신호 흐름도.

제7도는 제4도 영자/숫자등이 속하는 단어검출 및 접촉문자 절취과정을 보다 상세하게 도시한 신호 흐름도.

제8도는 본 발명 개별문자 절출방법을 설명하기 위한 문자열과 수직 히스토그램도.

제9도는 본 발명을 설명하기 위한 반피치문자와 한글이 있는 단어의 예시도.

제10도는 본 발명을 설명하기 위한 접촉문자의 예시도.

제11도는 본 발명의 설명을 위한 접촉문자의 예시도.

* 도면의 주요부분에 대한 부호의 설명

1 : 스캐너 2 : 스캐너 인터페이스

3 : 호스트컴퓨터 4 : 호스트 인터페이스

5 : DSP 6:버퍼

7 : DRAM 콘트롤러 8, 9, 10 : 메모리

본 발명은 문서인식장치에 있어서의 개별문자 절출에 관한 것으로, 좀더 상세하게는 한글이나 한자, 영자 및 부호/숫자 등이 혼용되어 있는 문서(이하, ＂종합문서＂라 한다)를 인식하기 위한 문서인식장치의 개별문자 절출방법에 관한 것이다.

종래의 문서인식장치에 있어서의 문서인식방법은 스캐너로부터 입력된 2치화 영상에 대하여 문서의 수평방향의 누적 흑화소수를 구해 이 값과 임계값을 비교하여 문자열의 상하 위치를 구해 문서로부터 문자열을 분리한다.

다음에 분리된 문자열 각각에 대하여 제1도와 같은 과정으로 개별문자를 절출해 낸다.

상기 종래의 과정을 상세히 설명하면 다음과 같다.

먼저 제1도의 S2단계는 개별문자 절출후보 위치의 결정 단계로 후보위치는 문자열에 대해 수직방향의 흑화소 히스토그램을 구해 수직방향의 누적 흑화소 수를 이용하여 개별문자의 시작점과 끝점을 구해 개별문자를 추출한다.

S3단계는 개별문자의 시작점과 끝점을 이용하여 각 문자들의 평균 폭과 각 문자들 사이의 평균 간격을 구한다.

이 값들이 구해지면 이를 이용하여 분리된 문자를 융합하고 접촉문자를 분리하는 과정으로 S4단계에서 수행한다.

이를 좀더 자세히 설명하면 인접 개별문자의 가로 폭이 평균문자 폭보다 작고 두 문자를 합한 몫의 폭이 이미 구한 피치와 비슷하면 이 두 인접 개별문자를 합쳐 하나의 문자로 만든다.

또한 비슷한 방법으로 접촉 문자는 그 가로 크기가 이미 구한 평균 문자 피치와 일정량 크므로 피치 정보를 이용하여 이를 절단한다.

이와 같은 종래의 기술은 문자열에서 수직흑화소수에 의하여 각 개별문자를 분리하고 각 개별문자의 평균폭과 스페이스의 평균 피치를 이용하여 물리적으로 인접 문자를 합하거나 절단하는 종래의 방법은 순수 한글만 있을때만 가능하다.

일예를들면 ＂11과＂라는 문자열에 대해서는 11이 합쳐진 하나의 문자로 되게 된다.

또한 많은 문자가 접촉되어 있는 경우 문자의 평균 피치가 커져 이들 접촉 문자가 정피치 문자로 분류되어 인접한 두 한글이 융합되는 치명적인 경우가 생길 수 있으며 한글 문서가 순수하게 한글만으로 구성되는 경우는 없고 적어도 부호/숫자를 포함하고 있으며 영자나 한자를 포함하는 경우도 다수 있다.

그러므로 종래의 기술로는 한글로 구성되어 있는 문서에 정확하게 개별문자를 분리할 수 없으며 하물며 영어등이 포함되어 있는 경우에는 더욱더 그러하다.

따라서 본 발명의 목적은 문서의 구성이 단어별로 이루어짐에 착안하여 단어정보와 문자의 평균높이 및 폭정보를 이용하여 여러문자가 혼용되어 있는 문서로부터 개별문자를 분리하고, 특히 한단어내에 다른 종류의 문자가 있는 경우 즉, 영어와 한글이 한단어를 이루는 경우 및 숫자와 한글이 이루는 경우에도 정확하게 개별문자를 분리할 수 있도록 문서인식장치의 개별문자 절출방법에 제공함에 있다.

이와 같은 본 발명의 목적을 달성하기 위한 방법은 스캔과정과 문자열 추출과정을 순차 통해 얻어진 입력 화상으로부터 그림영역과 문자영역을 분리하여 문자영역에 대해 문자열을 추출하는 문자열 추출과정과, 상기 추출된 문자열에 대해 개별문자를 절출하는 개별문자 절출과정과, 상기 절출된 개별문자로부터 각각의 문자종류를 인식하는 문자인식과정으로 이루어진 문서인식방법에 있어서, 상기 개별문자 절출과정에 이루어져 문자열 추출과정으로부터 추출된 문자열로부터 수직투영 영상을 이용하여 개별문자를 절 출하고 각 절출된 블럭에 대하여 플래그를 결정하는 제1단계와, 상기 절출된 개별문자로부터 평균 정피치 문자의 폭과 높이를 구하고 이를 이용하여 블럭의 플래그를 보정하는 제2단계와, 상기 추출블럭과 블럭 사이의 여백을 검출하는 제3단계와, 상기 개별문자로부터 한글의 자모가 분리된 경우와 같은 분리문자를 융합하는 제4단계와, 상기 개별문자로부터 접촉문자를 포함하는 단어를 검출하여 상기 단어정보와 문자의 평균 높이와 폭정보로 접촉문자를 절단하는 제5단계와, 반피치 문자가 존재하는 단어를 검출하여 이 단어중의 접촉문자를 분리하는 제6단계와, 상기 개별문자로부터 반피치 문자가 포함되어 있는 단어를 조사하여 접촉되어 있는 반피치 문자를 절취하여 제7단계로 이루어짐으로써 달성되는 것으로, 이하 본 발명을 첨부한 도면에 의거 상세히 설명하면 다음과 같다.

제2도는 본 발명을 수행하기 위한 문서인식장치의 시스템 구성도로서, 이에 도시한 바와같이, 문서인식장치의 전반적인 동작을 제어하는 호스트 컴퓨터(3)와, 제3도의 흐름을 주로 처리하는 디지탈 시그널 프로세서 칩(DSP 칩)(5)과, 문서로부터 2진 화상을 발생시키는 스캐너(1), 스캐너와 호스트컴퓨터(3), 스캐너와 DSP칩(5) 사이를 연결하여 주는 스캐너인터페이스(2)와, DSP칩의 처리결과 및 DSP칩에서 수행되는 프로그램을 저장하고 있는 프로그램 메모리(8)와 데이터 메모리(9) 및 스캐너에서 입력되는 입력화상정보를 저장하는 화상메모리(10)와, 이를 제어하는 디램컨트롤러(7), 디에스피(DSP) 칩(5)과 디램(DRAM) 컨트롤러 사이의 데이터 전송을 매개하여 버퍼(6)와, 디에스피 칩과 호스트 컴퓨터 사이의 정보를 전달하는 호스트인터페이스(4)로 구성되어 있다.

제3도는 본 발명의 문서화상의 인식 흐름도로서 입력문서로부터 2치 화상을 발생시키는 스캔과정(11)과, 입력영상으로부터 그림부분과 문자부분을 구별하고 문자부분에 대해 문자열을 분리하는 문자열 추출과정(12)과, 각 문자열로부터 개별문자를 절출하는 개별문자 절출과정(13)과, 절출된 각 개별문자를 인식하는 인식과정(14)과, 오인식된 부분을 수정 보완하는 후처리 과정(15)으로 구성된다.

제4도는 본 발명에 따른 개별문자 절출과정의 흐름도로서, 각 문자열로부터 개별문자를 절출하여 절취된 각 블럭의 플래그를 결정하는 단계(100)와, 평균 문자폭/높이를 계산하고 플래그를 보정하는 단계(300)와, 블럭의 뒤에 여백이 있는가 없는가를 결정하는 여백검출단계(400)와, 한글의 자모가 분리된 경우와 같은 분리문자를 융합하는 분리문자 융합단계(500)와, 접촉문자를 포함한 단어를 검출하여 이를 절단하고(600) 블럭의 플래그를 보정하는 단계(700)와, 영어/숫자 등 즉 반피치 문자가 포함되어 있는 단어를 조사하여 접촉되어 있는 반피치 문자를 절취하는 단계(800)로 구성되어 있다.

제5도는 상기 제4도중 분리문자 융합단계(500)의 상세흐름도이고 제6도는 상기 제4도중 접촉문자를 포함한 단어검출 및 접촉문자 절취단계(600)의 상세 흐름도이고 제7도는 상기 4도중 반피치 문자가 속하는 단어를 검출하여 접촉문자를 절취하는 단계(800)의 상세 흐름도이다.

먼저 입력문서를 상기 제2도의 스캐너(1)가 호스트컴퓨터(3)의 제어하에 독취하여 화상메모리(10)에 화상정보가 저장된다.

이 정보를 이용하여 DSP 칩이 영역분할 프로그램을 수행하여 문자열을 분리, 각 문자열 정보를 데이터 메모리(9)에 저장한다.

다음에 프로그램 메모리(8)에 저장되어 있는 개별문자 절출 프로그램을 이용하여 디에스피칩(5)는 제4도의 흐름으로 개별문자를 절취하는 동작을 수행한다.

상기 제4도의 상세한 설명은 다음과 같다.

먼저 입력문서는 제3도의 단계(12)에 의하여 그림영역과 문자영역으로 분리되고 각 문자열의 좌표정보는 데이터메모리(9)에 저장되어 있다.

상기 단계(100)는 이 문자의 좌표 정보를 이용하여 입력화상으로부터 문자열을 추출하는 부분이고, 상기 단계(200)는 입력 문자열에 대하여 각 개별문자를 절출하고 절출된 문자 블럭의 종류가 무엇인지를 블럭의 플래그 값을 써서 결정하는 부분이다.

플래그(flag)가 0이면 반피치 문자 즉 영자나 숫자/부호, 한글의 자.모, 분리된 한자나 한글을 의미하고 플래그가 1이면 정피치 문자로 한글이나 한자를 나타내고 플래그가 2이면 접촉문자를 나타낸다. 개별문자의 절취는 수직방향의 히스트그램을 이용한다.

제8도에 문자열 영상과 수직 히스토그램(투영량)이 도시되어 있다. 제8도에 나타낸 것과 같이 각 블럭의 시작위치(S₁-S_n)와 끝위치(E₁-E_n)를 구한다.

상기 시작위치와 끝위치는 수직 투영량을 P₁-P_n이라 할때 P_n-1=0이고 P_n＞0인 점을 문자 블럭의 시작위치로 하고 P_n＞0이고 P_n+1=0인점 P_n을 블럭의 끝위치로 한다.

시작점과 끝점이 주어지면 이들을 좌우로 하여 블럭의 상단(T). 하단(B)의 위치를 결정한다.

이와 같이 하여 각 문자블럭의 상, 하, 좌, 우단의 위치가 결정된다.

다음에 각 블럭의 플래그 값은 문자열의 높이를(SH)라 할때 다음의 조건으로 결정된다.

3*SH/2＜=(E-S) →flg=2(접촉문자)

SH/2(E-S)＜3*SH/2이고 (T-B-1)＜(E-S) → flg=1(정피치 문자)

위 경우 외 → flg=0(반피치 문자)

상기 개별문자 절출 및 플래그 결정단계(200) 다음에 평균 문자 폭/높이 결정 및 블럭 플래그 보정단계(300)가 다음과 같은 방법으로 수행한다.

문자열의 블럭 중에 플래그가 1인 블럭의 쪽의 합을 구하고 높이의 합을 구해 플래그 1인 블럭의 갯수로 나누어 평균 문자 폭(AW), 높이(AH)를 구한 다음 이들을 이용하여 블럭의 플래그를 다음과 같이 보정한다.

대상 블럭의 폭을(CW)라 하고 높이를(CH), 플래그를(cflg)라 하면 (cflg=0 또는 cflg=2)이고 │CW+CH-AH-AW│←(AH+AH)/7를 만족하면 대상 블럭의 플래그(cflg)를 1로 보정하고 cflg=1이고 (CW-AW)＞AW/3를 만족하면 cflg=2로 cflg=1이고 (AH+AW-CH-CW)＞(AW+AH)/6를 만족하면 cflg=0로 대상 블럭의 플래그(cflg)를 보정한다.

상기와 같이 단계(300)가 끝이나면 여백검출 단계(400)가 다음과 같은 방법으로 행해진다. 이 단계는 블럭 다음에 여백(blank)의 존재 유무를 결정하는 것이다.

문자열의 첫 블럭부터 시작하여 마지막 블럭까지 각 믈럭의 폭과 높이가 2보다 작으면 잡음 블럭으로 보아 이를 삭제하고 각 블럭의 평균간격(AINT)을 구한다. 이 평균 블럭 간격은 블럭의 갯수가 일정 값(6개) 이상일 때만 구하고 블럭의 갯수가 그 이하이면 평균 문자 간격의 실효가 의문이 되므로 AINT=0으로 한다.

상기의 값이 구해지면 다음과 같이 여백의 존부를 결정한다.

AINT가 0이 아닐때는 S_n-E_n-1＞2*AINT/3이면 블럭(n) 다음에 여백이 있다고 본다.

AINT=0일때는 S_n-E_n-1＞2*AW/3이면 블럭(n) 다음에 여백이 있다고 본다.

상기 여백검출 과정(400)이 끝이나면 분리문자의 융합단계(500)가 행해지는데 이 과정은 제5도를 중심으로 설명한다.

먼저 문자열에서 단어를 추출한다. 단어를 여백(blank)으로 구분되어 있다.

이와 같이 단어를 추출하는 이유는 한글, 영자등이 혼용되어 있는 경우 이들이 단어 단위로 구분되어 있을 확률이 높기 때문에 본 발명에서 이 단어 정보를 이용하여 문자분리를 행한다.

이와 같은 목적으로 문자열의 시작단계(501)에 대하여 여백을 가진 블럭인가 아닌가를 블럭의 여백 플래그(bflg)를 조사하여 판단한다(502).

즉, 여백 플래그(bflg)가 1이면 여백이 있는 블럭이고 그렇치 않으면 여백을 갖지 아니하는 블럭이다.

상기 판단단계(502)에서 여백블럭이 구해지면 이 블럭의 단어의 미자막 블럭이 되고[(503)의 be] 단어의 시작블럭은 여백을 조사하기 시작한 첫 블럭이 된다.[(503)의 bs].

다음에 단어의 시작블럭(bs)과 끝블럭(be)이 구해지면 이 단어의 정피치 문자가 포함되어 있는가를 조사한다.(504)

정피치 문자는 블럭플래그가 1인 블럭이므로 쉽게 조사된다.

상기 판단단계(504)에서 정피치 문자가 없는 단어이면(505)단계를 실행하고 그렇지 않으면 (506)단계를 수행한다.

상기 (505)단계에서는 반피치 문자로만 이루어진 단어(즉 한글이 모두 분리된 경우이거나(제9도 참조)영어단어인 경우)에 대하여 반피치 블럭의 크기와 좌표의 구성이 지그재그 형태를 이루는가 여부를 조사한다.

구성이 지그재그 형태를 이루면 한글의 자모가 모두 분리되어 있는 경우로 간주하고 두 블럭씩 결합하는 결합모듈(506)로 처리가 이동하고 지그재그 형태를 이루지 아니하면 영어 단어이므로 융합을 하지 아니하고(507), (508)의 단계로 이동처리한다.

지그재그의 구성이란 제10도에 나타난 경우와 같이 한글의 자모가 모두 분리되어 나타는 경우를 말한다.

다음은 상기 결합모듈(506)에 대하여 설명한다.

결합모듈은 단어에 반 피치문자가 존재하는 경우 이들을 결합시키는 단계이다.

상기 단계(504)로부터 정피치 문자가 있는 경우에는 반피치 문자가 한글의 자모 또는 한자가 분리된 경우, 한글이 분리된 경우로 생각할 수 있으므로 반피치 문자를 융합시킨다.

마찬가지로 반피치 문자로만 구성된 경우라도 상기 단계(505)의 조건을 만족하면 단어내의 반피치 문자를 차례로 융합한다. 이 과정이 끝나면 문자열의 끝 블럭이 나올 때까지(508) 상기 과정을 반복한다.

상기 제4도의 분리문자 융합단계(500) 후에는 접촉문자를 포함한 단어 검출 및 접촉문자 절단단계(600)가 수행된다.

이 과정을 제6도를 이용하여 설명하다.

시작단계(601)에서 문자열의 첫블럭부터 시작하여 접촉문자 블럭(flg=2)여부를 조사한다(602).

접촉문자가 감지되면 이 접촉문자가 포함되어 있는 단어의 첫블럭과 끝블럭을 구하고 이 단어에 포함되어 있는 블럭의 종류의 갯수를 구한다(603).

플래그 0인 블럭의 갯수(c0)와 플래그 1인 블럭의 갯수(c1)가 구해지면 단계(604)의 조건을 만족하는가를 조사하여 이를 만족하면 즉 접촉문자를 포함하고 있는 단어 중에 정피치 문자가 없고 반피치 문자만 있는 경우로 이는 영어만이 단어를 이루는 경우 몇개의 알파벳이 불어 접촉문자로 이루어진 경우가 될 수도 있으므로 단계(605)에서와 같이 접촉문자를 전후로 하여 지그재그를 조사하여 지그재그 구성을 하고 있으면 반피치 문자들을 결합시키고(606) 그렇치 않으면 반피치 문자를 기준으로 접촉문자를 절단한다(607).

상기 판단단계(604)의 조건을 만족하지 않으면 접촉문자를 포함하는 단어 중에 반피치 문자가 없는 경우이므로(607)의 절취 단계는 정피치 문자를 기준으로 접촉문자를 절단한다.

절취모듈 단계(607)는 다음과 같이 구성된다.

제11도는 접촉문자의 예를 나타낸 것이다.

접촉블럭의 폭을 cw라 하고 이와 평균문자 폭을 이용하여 다음과 같이 이들의 비율(con)을 구한다.

con=cw/AW(평균문자 폭)

다음 제11도의 접촉문자 블럭의 시작점(ㄱ)부터 평균문자폭(AW)의 3/4되는 위치를 a라 하면 제11도의 b의 위치는 다음과 같이 구해진다.

con ＞ 1일때 b=a+AW/2

위 외 b=ㄴ-AW/2

상기와 같이 a, b가 구해지면 이 사이의 투영량중에서 가장 작은 값(mini)과 이때의 위치(minlx)를 구한다.

다음에 취소 투영량(mini)의 값이 4이하이면 (minlx)위치에서 블럭을 절단한다. 이렇게 절단되어 생성되는 블럭의 플래그 값은 다음과 같이 정해진다. 절단된 블럭중에 앞의 블럭을 bb, 뒷 블럭을 aa라 할때 bb의 플래그는

3*AW/2 ＜=(minx-ㄱ)일때 2

(AW/5+1)＜=(AW-minlx+ㄱ)＜3*AW/2 일때 0

위 외 1의 값을 갖는다.

블럭 bb의 높이를 bbh라 하면 플래그는 다음과 같이 정해진다.

(ㄴ-minlx-AW)＜=(aw/5+1)이고, (bbh+ㄴ-minlx-AH-AW)＜=(AH+AW/7)일때 1 상기 경우가 아니고 (ㄴ-minlx-AW)＞AW/4이고 bbh＜AH이면 플래그를 2로 하고 상기 두 조건을 만족하지 않으면 플래그를 0으로 한다.

상기 제6도의 절취모듈 단계(607)의 처리가 끝나면 다음 블럭에 대하여 상기 단계(608)(609)의 과정을 반복한다.

이제제4도의 (600)과정까지 수행되어 분리문자가 융합되고(500), 접촉문자가 분리되어 (600)문자열의 각 블럭의 플래그 값이 변화되었다.

이 변화된 플래그를 이용하여 평균문자 폭(AW) 및 높이(AH)를 보정하는 단계(700)를 두어 평균문자 크기를 보정한다.

다음은 영어/숫자 등 즉 반피치 문자가 속하는 단어를 검출하여 접촉되어 있는 문자를 분리하는 단계(800)에 대하여 제7도를 참조하여 설명한다.

먼저 문자열의 시작단계(801)부터 시작하여 문자열의 끝블럭(809)까지 각 블럭의 플래그(c, flg)가 0이고 블럭의 높이(c, hgt)가 평균문자 높이(AH)의 1/3보다 큰가를 조사 판단한다(802).

상기 판단단계(802)의 조건을 만족하면 상기에서 설명한 방법과 마친가지로 이 블럭을 포함하는 단어의 시작블럭(bs)과 끝블럭(be)과 이 단어내의 각 문자 종류의 갯수(c0,c1,c2:0,1,2는 플래그 값)를 구하고(803) c1과 c2의 값을 조사(804)하여 이들이 모두 0일때 즉 단어가 반피치 문자만으로 구성되어 있는 경우는(805)의 과정을 수행한다.

단어가 모두 반피치 문자로 구성되어 있는 경우에 한글이 분리되어 있는가의 여부를 조사해야 하는데 그 이유를 제9도를 참조로 설명한다.

「20개」가 한단어로 구성되어 있는 경우 문자 블럭은 (2,0,ㄱ,ㅐ)로 분리되는 경우가 생긴다.

이 경우 반피치 문자만의 단어이므로 제5도의 (505)에 의하여 지그재그 여부가 조사되는데 ㄱ과 ㅐ는 지그재그 형태이나 2와 0은 그러하지 아니하므로 이 단어는 (506)의 결합모듈에 의하여 융합되지 아니한다. 영어와 한글 조사가 한단어를 이룰 경우에는 이런 문제가 발생한다. 그러므로 종합문서를 처리할때는 이런 문제를 고려하여야 만 한다.

제7도의 (805)는 이런 문제를 해결하기 위한 과정으로 반피치문자만으로 구성되어 있는 단어는 한글이 단어의 뒷부분에 포함될 수 있으므로(조사로서) 단어의 뒷부분의 지그재그 형태를 이용하여 이를 만족하는 두 블럭을 융합하는 블럭이 평균 문자폭/높이와 일정관계가 있을때 이를 융합한다.

상기 단계(806)는 반피치 문자가 접촉되어 있는 경우 이들을 절취하는 단계이다.

상기 판단단계(804)의 조건을 만족하는 것이 (806)단계에서 다시 처리되는 이유는 영어의 경우 반피치 문자가 접촉되어 그것이 다시 반피치로 분류되는 경우가 있으므로 이를 처리하기 위한 것이다.

상기 단계(806)는 제6도의 단계(607)에서 절취방법과 마찬가지로 최소 흑화소 점을 기준으로 절취되는 두 블럭의 크기와 그 단어내의 반피치 문자와의 크기 비교를 하여 절취점의 위치를 좌우로 옮기면서 절취를하고 플래그를 0으로 부여한다.

이외에도 본 발명은 한글, 한자, 영어, 숫자, 부호 등이 포함되어 있는 모든 문서를 인식할 수 있는 수단은 제공함과 아울러 한글만으로 구성된 문서에 대하여도 제3도의 (800)단계를 제외하면 약간의 수정을 가하여 적용이 가능하고 영어로만 구성된 문서에 대하여도 적용이 가능하다.

그리고 문자 절출시 각 블럭이 여백정보를 보지하고 있으므로 인식 코드를 이용한 문서 재구성시 또는 단어단위의 오인식 수정을 할 수 있게 한다.

이상과 같이 본 발명은 문자열의 높이 정보를 이용하므로 접촉문자가 많이 있는 경우에도 이들이 접촉되어 있다는 것을 문자열의 높이 정보를 이용하여 알 수 있어 접촉문자를 정확하게 절취할 수 있는 뛰어난 효과가 있고, 문자종류에 관계없이 문서를 인식할 수 있게 함으로써 문서인식 장치개발의 실효성을 높이는 효과가 있다.

Claims

스캔과정과 문자열 추출과정을 순차 통해 얻어진 입력화상으로부터 그림영역과 문자영역을 분리하여 문자영역에 대해 문자열을 추출하는 문자열 추출과정과, 상기 추출된 문자열에 대해 개별문자를 절출하는 개별문자 절출과정과, 상기 절출된 개별문자로부터 각각의 문자종류를 인식하는 문자인식과정으로 이루어진 문서인식방법에 있어서, 상기 개별문자 절출과정에 이루어져 문자열 추출과정으로부터 추출된 문자열로부터 수직투영 영상을 이용하여 개별문자를 절출하고 각 절출된 블럭에 대하여 플래그를 결정하는 제1단계와, 상기 절출된 개별문자로부터 평균 정피치 문자의 폭과 높이를 구하고 이를 이용하여 블럭의 플래그를 보정하는 제2단계와, 상기 추출블럭과 블럭 사이의 여백을 검출하는 제3단계와, 상기 개별문자로부터 한글의 자모가 분리된 경우와 같은 분리문자를 융합하는 제4단계와, 상기 개별문자로부터 접촉문자를 포함하는 단어를 검출하여 상기 단어정보와 문자의 평균 높이와 폭정보로 접촉문자를 절단하는 제5단계와, 상기 개별 문자로부터 반피치 문자가 포함되어 있는 단어를 조사하여 접촉되어 있는 반피치 문자를 절취하는 제6단계로 이루어짐을 특징으로 한 문서인식장치의 개별문자 절출방법.
제1항에 있어서, 상기 개별문자의 절출은 문자열에 대하여 수직 투영량을 이용하고 각 절출 블럭의 플래그는 블럭의 폭이 문자열 높이의 일정값(th1)이상이면 접촉문자로, 블럭의 폭이 문자열 높이의 일정값(th2)이상이고 블럭 높이의 일정값(th3)보다 크면 정피치 문자로, 상기 경우외에는 반피치문자로 정해지는 문서인식장치의 개별문자 절출방법.
제1항에 있어서, 상기 블럭과 블럭사이의 여백을 검출하는 제3단계는 문자열에 포함되어 있는 블럭의 갯수가 일정값(th4) 이상이면 블럭과 블럭 사이의 거리의 평균을 구하고, 블럭사이의 간격이 평균값의 일정 배율값 이상이면 양 블럭사이에 여백이 존재하는 경우로, 블럭의 갯수가 일정값 이하이면 정피치 문자의 평균폭과 블럭 사이의 간격을 비교하여 여백을 검출하는 문서인식장치의 개별문자 절출방법.
제1항에 있어서, 문자를 융합하는 제4단계는 여백정보를 이용하여 먼저 단어를 구별한 다음 각 단어를 구성하는 블럭의 플래그와 단어내의 블럭의 위치구성(지그재그 정보)과 문자의 평균크기정보를 이용하여 분리문자를 결합하는 문서인식장치의 개별문자 검출방법.
제1항에 있어서, 상기 제5단계는 각 블럭의 접촉문자를 조사하여 이를 포함하는 단어의 시작블럭과 끝블럭을 찾아 이 단어를 구성하는 블럭의 위치구성과 각 종류의 블럭의 갯수를 구해 반피치 블럭을 결합하고, 접촉문자를 평균문자 크기정보와 플래그정보 접촉문자의 일정범위내의 최소 수직 투영량과 최소 투영량이 존재하는 위치정보를 이용하여 개별문자를 절출하는 문서인식장치의 개별문자 절출방법.
제1항에 있어서, 제6단계는 일정크기의 반피치 문자(영자, 숫자 부호)가 속하는 단어를 검출하여 이를 구성하는 단어가 전주 반피치 문자로 구성되어 있으면 한글의 분리여부를 조사하여 한글이 분리되어 있으면 이를 융합하고, 접촉문자를 단어내의 반피치문자의 크기 정보, 최소 수직 투영량의 위치정보를 이용하여 접촉문자를 분리하고 반피치 문자만으로 구성되어 있지 않은 경우는 바로 접촉문자를 분리하는 문서인식장치의 개별문자 절출방법.