KR930007083B1

KR930007083B1 - 문자인식에서의 후보문자 분류방법

Info

Publication number: KR930007083B1
Application number: KR1019900007667A
Authority: KR
Inventors: 최재균
Original assignee: 주식회사 금성사; 이헌조
Priority date: 1990-05-26
Filing date: 1990-05-26
Publication date: 1993-07-29
Also published as: KR910020594A

Abstract

내용 없음.

Description

문자인식에서의 후보문자 분류방법

제1도는 종래의 통계적 문자인식방법에 대한 신호흐름도.

제2도는 본 발명의 후보문자 분류에 의한 통계적 문자인식 신호흐름도.

제3도는 본 발명에 적용되는 8×8 메쉬의 예시도.

제4도는 본 발명의 후보문자 특징을 반복 검출하여 평균치를 구하는 예를 보인 설명도.

제5도는 본 발명에 적용되는 메쉬의 좌, 우 특징을 보인 설명도.

제6도는 하나의 문자를 좌, 우, 하로 분류하여 보인 설명도.

제7도는 본 발명 후보문자 분류용 레퍼런스 데이타 추출과정을 보인 신호흐름도.

제8도는 제7도 왼쪽의 병렬 특징을 추출하는 과정을 보인 신호흐름도.

제9도는 제7도 아래쪽의 특징을 추출하는 과정을 보인 신호흐름도.

제10도는 제8도 및 제9도에 따른 특징의 평균값 및 분산값을 정규화하는 예를 보인 설명도.

제11도는 문자의 크기를 적당한 크기로 정규화한 예시도.

제12도는 본 발명 후보문자 분류방법이 적용되는 하드웨어 블록도.

제13도는 본 발명 후보문자 분류방법의 전체 신호흐름도.

* 도면의 주요부분에 대한 부호의 설명

1 : 스캐너 2 : 스캐너 인터페이스

3 : 디지탈신호 처리소자 4 : 어드레스 디코더

5 : 버퍼 6 : 메모리

7 : 호스트 인터페이스 8 : 호스트컴퓨터

9 : 보조기억장치

본 발명은 통계적인 방법으로 문자를 인식하는 방법중 전처리 단계에 관한 것으로, 특히 한글과 같이 인식의 대상이 되는 문자수가 많을 경우 발생하는 인식률의 저하 및 인식속도의 하락을 피하기 위해서 미리 인식의 후보가 될 수 있는 문자를 골라내는 후보문자 분류방법에 관한 것이다.

종래의 통계적인 문자인식방법은 제1도에 도시된 바와 같이, 문자이미지가 입력단으로부터 입력되면 그 이미지에 대해 특징을 추출하고, 문자인식장치의 내부에 미리 저장되어진 각 문자마다의 레퍼런스와 각각 비교하여 입력이미지와 가장 유사하다고 판단이 되는 문자를 인식결과로 삼는다.

그런데, 상기와 같은 종래의 문자인식방법에 있어서는 주로 영문이나 일본의 가나문자와 같이 수십자 내외의 문자체계를 갖는 문자에 대해서는 고속 정확한 인식이 가능하지만 최대 수만에서 수십만 글자의 문자체계를 갖는 한글이나 한자와 같은 모아쓰기 문자는, 그 구조 또한 복잡하게 되므로 인식률이 저하될뿐 아니라 인식에 걸리는 속도도 상당히 느려지게 되는 문제점이 있었다.

본 발명은 상기와 같은 종래의 문제점을 감안하여 문자인식의 속도를 향상시키게 창안한 것으로, 레퍼런스 대상문자를 동일한 특징을 가진 후보문자로 미리 분류해 놓은 다음, 미지의 문자가 입력될때, 상기 후보문자분류시와 동일한 특징을 추출한 다음 미리 저장되어 있는 후보문자의 특징과 그 유사도를 비교하여 입력된 문자의 후보문자군을 선택하고 그 후보문자내에서 인식과정을 수행함으로써, 인식속도의 향상과 동시에 인식률을 높이기 위한 후보문자를 분류하는 방법을 제공함에 있다.

상기와 같은 목적을 수행하기 위한 본 발명은 미지의 문자 이미지이미지를 입력하여 왼쪽, 오른쪽, 아래쪽에 관한 레퍼런스 데이타를 입력하고, 왼쪽, 오른쪽에 대해서 각 메쉬(Mesh) 영역별로 백색 화소수의 계산 및 변화값을 계산해서 아래쪽방향의 타입을 결정하고, 상기 레퍼런스 데이타와 미지의 이미지에서 구한 값과의 유사도가 일정값 이하인 것만을 고르는 것을 특징으로 하는 것이다.

레퍼런스 데이타란 통계적인 문자 인식방법에서 사용되는 것으로 인식의 대상이 되는 모든자에 대해서 그 문자만이 가지는 고유한 특징을 추출한후 저장한 데이타를 말한다.

즉, 만일 KSC5601 완성형 한글을 대상으로 인식 시스템을 구성하기 위해서는 KSC5601 코드의 한글이 2350자로 구성되기때문에 각 글자에 대한 고유의 특징은 적어도 1개가 되며 최소 2350개의 레퍼런스 데이타가 필요하게 된다.

그런데 인식 시스템에서 각 글자가 가지고 있는 고유의 특징을 구하는데 있어서는 상당한 주의가 필요하다. 문자인식, 특히 이미 문서상에 인쇄된 문자를 인식 대상으로 하는 오프라인(off line) 인식에서는 입력장치인 스캐너로부터 들어오는 영상이 아무리 똑같은 문자를 독취(讀取)한다고 하더라도 외부의 잡음 및 입력조건에 따라 조금씩 다르므로 같은 문자에 대해서 아주 여러번 독취하여 그에 대한 평균값을 취한후 고유특징을 추출하여야 한다.

또한, 통계적방법에서 만일 인식의 대상이 되는 문자가 영어나 일본어처럼 작은 수를 가지면 별문제는 없으나 한글이나 한자의 경우는 대상이 되는 문자가 대단히 많기때문에(한글의 경우 조합이 가능한 문자가 14,000자가 넘음) 각각의 고유 특징으로 인식을 시도한다면 많은 시간이 걸리고 또 부정확해질 우려가 있다. 따라서 미리 인식에 사용되는 특징과는 별도로 같은 특징을 가질 수 있는 여러개의 문자 군(群)으로 분류를 한뒤 인식을 시도하면 빠르고 정확한 인식을 할 수 있는 잇점이 있다.

일예로, 상기 2350자의 문자특징을 미리 특징이 비슷한 것끼리 모아 50개의 군으로 분류를 한다면, 각 군당 약 47개의 문자 특징들이 존재하게 되고, 이에 따라 어떤 문자의 이미지를 입력받아 분류를 위한 특징을 취출하고, 그 특징으로 미리 정의한 50개 분류군의 대표값과 비교하여 가장 유사한 분류군을 선택하며, 다시 선택된 분류군내의 47자중 인식용 특징으로 비교를 하여 가장 유사한 것으로 인식을 하게 되면, 97번의 비교만으로 문자인식이 가능해진다.

이하 첨부한 도면에 의해 상세히 설명한다.

제5도는 본 발명에 적용되는 메쉬의 좌, 우특징을 보인 설명도로서 n×n 메쉬에 의하여 특징을 추출하는 것으로, 이의 특징추출은 왼쪽 특징추출, 아래쪽 특징추출 및 오른쪽 특징추출로 이루어지며, 그 특징추출후 레퍼런스 데이타를 생성한후 비교에 의해 문자를 인식하게 된다.

이와 같이 하여 왼쪽 특징추출 및 오른쪽 특징추출은 제8도에 도시한 바와 같이 수행되고, 아래쪽 특징추출은 제9도에 도시한 바와 같이 수행되며, 레퍼런스 데이타 생성은 제4도에 도시한 바와 같이 수행되고, 비교는 제3도에 도시한 바와 같이 수행되게 구성한다.

제12도는 본 발명 후보문자 분류방법이 적용되는 하드웨어 블록도로서, 이에 도시한 바와 같이, 이미지를 스캔하는 스캐너(1)와, 인에이블신호

, 데이타(DATA)에 의해 스캔하는 이미지를 처리하는 스캐너 인터페이스(2)와, 인터럽트인식신호

, 인터럽트신호

, 명령신호(COM), 데이타(Data)에 의해 상기 스캐너 인터페이스(2)를 처리하고, 어드레스(Address), 데이타(Data), 입출력요구신호(I/ORQ)를 통해 어드레스디코더(4), 버퍼(5), 호스트 인터페이스(7)를 처리하는 디지탈신호 처리소자(3)와, 상기 어드레스 디코더(4), 버퍼(5)를 통해 이미지를 기억하는 메모리(6)와, 상기 호스트 인터페이스(7), 보조기억장치(9)를 통해 결과를 보면서 사용자가 입력을 주는 호스트컴퓨터(8)로 구성한다.

이하, 상기와 같이 구성된 본 발명의 작용효과를 설명한다.

우선 하드웨어적인 설명은 호스트컴퓨터(8)에서 사용자가 시작명령을 내리면 호스트 인터페이스(7)를 통하여 입출력요구신호(I/ORQ)로 디지탈신호 처리소자(3)에 명령이 내려지고, 이때 디지탈신호 처리소자(3)는 명령신호(COM)를 통해 스캐너 인터페이스(2)로 명형을 전송한후 스캐너(1)로 인에이블

를 보내면 스캐너(1)는 주어진 문자 이미지를 스캐닝한다.

여기서, 메모리(6)에는 후보문자 추출 및 레퍼런스 데이타를 상주하고 있다.

이와 같이 하여 스캐너(1)가 동작하면 스캐너(1)의 데이타(Data)가 스캐너 인터페이스(2), 디지탈신호처리소자(3), 버퍼(5)를 통해 메모리(6)에 저장되며, 이때 디지탈신호 처리소자(3)는 어드레스 디코더(4)를 통해 메모리(6)에 어드레스(Address)를 계산하여 정해진 번지수로 저장한다.

이와 같이 하여 얻어진 결과는 메모리(6)의 데이타(Data)가 버퍼(5)를 통해 디지탈신호 처리소자(3)에 보내짐과 아울러 호스트 인터페이스(7)를 통해 호스트컴퓨터(8)로 보내지게 된다.

이때 결과의 보관을 위해 보조기억장치(9)를 이용하고, 디지탈신호 처리소자(3)가 어떤 프로세싱을 할 동안에는 인터럽스신호를 스캐너 인터페이스(2)로 보내어 스캐너(1)의 동작을 멈추게 한다.

이하, 상기와 같은 하드웨어 기능을 갖는 본 발명의 후보문자 분류방법을 흐름도를 참조하여 상세히 설명한다.

제2도는 본 발명의 후보문자 분류에 의한 통계적 문자인식과정을 개략적으로 보인 신호흐름도로서, 이에 도시한 바와 같이 우선, 미지의 인식대상 문자의 이미지가 스캐너등을 통해 입력되는 단계와, 상기 입력문자로 인식될 가능성이 높은 문자의 그룹인 후보문자를 알아내기 위해 후보문자분류용 특징을 추출하는 단계와, 상기 추출된 특징에 의해 입력문자가 속하는 후보문자군을 알아내는 단계와, 상기 입력문자의 인식용 특징을 추출하는 단계와, 상기 인식용 특징을 후보문자내의 레퍼런스 문자들과 비교하는 단계와 가장 유사한 특징을 가진 문자를 인식결과로 출력하는 단계로 이루어진다.

본 발명의 주요 목적인 후보문자의 분류방법은 상기 제2도의 특징을 가진 문자끼리 n개의 후보문자 그룹으로 미리 나누어 놓는 일로 이 과정은 인식에 선행되어져 미리 메모리에 저장되어 있어야 한다. 이렇게 후보문자로 문자가 분류되면 특정문자를 인식하고자 할때 전체 비교문자를 전부 비교대상으로 하는 것이 아니라 입력문자의 후보문자의 분류특징과 유사한 특징을 가진 후보문자군을 선택하여 그 후보문자내의 레퍼런스문자만을 인식비교대상으로 하여 인식을 진행함으로써 인식률을 대폭 향상시킬 수 있게 된다.

분류용 특징으로는 제11도에 도시한 바와 같이, 원래의 문자 이미지의 사이즈가 다양하기때문에 우선 32×32 도트 매트릭스 이미지로 변환을 시키고, 제5도에 도시한 바와 같이, 정방향의 n×n 메쉬를 정의하여 제3도에 도시한 바와 같이 문자에 씌운다. 여기서 보통 n은 4 혹은 8을 쓰고 제3도에서 보면 왼쪽, 오른쪽, 각기 세로방향으로 8개의 영역으로 나눌수가 있고, 각기 8개씩의 영역에서 처음 문자의 흑화소를 만날 때까지의 백화소수의 합을 각 영역의 1차 특징으로 정의한다.

한편, 후보문자분류의 특징으로 왼쪽특징, 오른쪽특징 및 아래쪽특징의 3가지가 되는데, 왼쪽특징 및 오른쪽특징은 제3도에서와 같이 L₁-L₈, R₁-R₈로 정의하고, 제7도의 흐름도와 같은 과정을 수행한다.

먼저 기준문자 전체를 대상으로 특징을 추출하여 분류하기 위하여, 각 문자에 대해 스캐너등으로 입력시켜 문자이미지를 만든후, 상기 문자이미지에 외접하는 박스(BO×)를 만든후, 그 크기를 정규화시킨후, N×N개의 화소를 갖는 메쉬를 정의하여 특징을 추출한다. 특징은 좌, 우, 아래방향으로 세가지 특징을 추출한다.

먼저 좌에서 우로 스캔할때 최초의 문자를 만날때까지의 거리(최초의 흑화소를 만날때까지의 백화소의 수)인 우방향특징, 우에서 좌로 스캔할때 최초의 문자를 만날때까지의 거리(최초의 흑화소를 만날때까지의 백화소의 수)인 좌방향특징을 구하되, 충분히 근거있는 값이 될 수 있도록 M회 반복실시하여 이 평균값과 분산을 특징기준으로 한다. 다음 아래방향특징은 메쉬의 아래방향으로 일정한 임계치를 갖는 높이로 좌에서 우로 스캔하여 이때, 만나게 되는 문자의 횟수(흑화소수와 만나는 횟수)와 그 길이에 따라 문자의 구조적 특징을 추출한다. 이때 역시 특징값이 통계적 의미를 갖도록 제4도에서와 같이 같은 문자에 대하여 M회 반복 실시하며, 이때 한번이라도 다른 특징결과가 나오면 그 문자는 그 후보문자군에서 제외시킨다. 이와 같이 충분히 근거있는 특징을 반복추출하여 이에 따라 이 세가지 특징조건을 모두 만족하는 문자들은(LOGICAL AND)같은 후보문자군내에 있는 것으로 보아 후보문자를 분류한다.

이때 분류기준이 되는 특징값은 좌우방향 특징의 경우 평균값과 분산을 기준으로 구해진 백화소수에다 연산자를 이용하여 일정한 값으로 정규화하여 메모리에 저장하고 아래방향 특징도 각 특징의 종류에 따라 몇가지 타입으로 나누어 이를 저장한다. 이 저장된 특징값은 이후 인식과정시 미지의 문자가 속하는 후보문자군을 알아낼때 사용된다.

제6도에 도시한 바와 같이, 좌, 우, 하방향의 검정색 부분이 처음 문자획을 만날때까지의 거리를 뜻한다. 또한 좌, 우의 메쉬의 영역을 8개로 나눈다고 가정하면 제3도 및 제8도에 도시한 바와 같이, L₁-L₈, R₁-R₈까지로 구분을 짓고, 각 영역의 백화수소를 sum[Li], sum[Ri], i=1∼8, 대상으로 되는 문자수를 N개라 가정하고

와 같이 구해지고 각 영역에서의 평균^Mi와 분산 σ가 구해진다.

따라서 이 Total sum R[i], Total sum L[i], i=1∼8에 대한 평균 MLi(왼쪽 각 메쉬의 평균), MRi(오른쪽 각 메쉬의 평균), σLi(왼쪽 각 메쉬의 분산), σRi(오른쪽 각 메쉬의 분산)을 구하고, 이러한 값들이 충분히 타당성 있는 값을 갖기 위해서는 수차례의 반복을 거치며 그에 따른 값을 갖기 위해서는 수차례의 반복을 거치며 그에 따른 최종의

(m화하여 평균)을 구하여 최종 특정기준으로 삼는다.

그리고 상기와 같은 값으로 제10도에 도시한 바와 같이 식을 세워 각 문자에 대해서 왼쪽 8개, 오른쪽 8개의 특정값을 1, -4의 값으로 정규화하고, 이것을 다시 임의의 m회 반복한후 제4도 및 제7도에 도시한 바와 같이, 이 값의 평균을 취하여 최종 왼쪽, 오른쪽 레퍼런스 값으로 삼는다.

한편 아래쪽의 레퍼런스 값을 생성하는 루틴은 제9도에 도시한 바와 같이, 아래쪽 레퍼런스를 한글의 구조에 의해서 생성하도록 하였는데 주로 세로획에 포인트를 두고 결정한다.

아래에서 어떤 임계값의 높이로 좌에서 우로 조사하여 만나는 획의 수와 위치를 파악하여, 그획이 1개인 상태에서, (1). 그 길이가 문자폭의 2/3보다 길면 세번째형(Type 3)인 것으로, 일예로 그, 오,… (2). (1) 이외에 그 길이가 문자폭의 1/3보다 크면 두번째형(Type 2)인 것으로, 일예로 곤, 공, 놀, 돔,… (3) 나머지 경우이면 첫번째형인 것으로, 일예로 가, 녹, 과,…를 나타내며, 그획이 2개인 상태에서 (1) 두획의 길이가 문자폭의 1/3보다 작으면서 한 획은 중심선을 기준으로 왼쪽, 나머지는 오른쪽에 있으면 n번째형(Type 4)인 것으로, 일예로 규, 놋, 뀨,… (2) (1)이 아닐경우 첫번째 형(Type 1)인 것으로, 일예로 많,… 를 나타낸다. 그리고 그 이외의 경우에는 다섯번째 형(Type 5)인 것으로, 일예로

…을 나타낸다.

상기와 같이 좌, 우방향의 특징이 각 글자마다 결정되면 제4도 및 제7도와 같이 충분히 통계적 값을 가질 수 있도록 m회 반복하여, 나온 결과를 논리 앤드를 취하여 m회 반복시 한번이라도 다른값을 갖는 경우를 리던던시로 간주하고, 분류시 그 특징을 제외한다.

상기와 같은 반복으로 최종 레퍼런스 데이타가 만들어지면 어떤 문자 이미지가 입력되었을때 앞과 같은 방법으로 특징을 추출하고, 그 추출된 특징과 이미 만들어진 레퍼런스 값과 비교하여 그 유사도가 임계값보다 작은 경우를 후보문자로 간주하여 추출한다.

즉, 제13도의 흐름도에 도시한 바와 같이 어떤 문자 이미지가 입력되었을때 그 문자에 외접하는 박스(Box)를 계산하고, 문자크기를 정규화한후 8×8 메쉬를 만들고, 그 좌, 우의 L₁-L₈. R₁-R₈의 백화소수를 계산하고 연산자에 의해 1부터 4의 값으로 정규화하며, 아래방향의 형식을 결정하며, 이와 같이 구해진 3가지의 특징 데이타를 저장된 레퍼런스 데이타와 비교하여 후보문자 분류군을 선택한다.

이상에서 상세히 설명한 바와 같이 본 발명은 알파벳과 같은 풀어쓰기 문자와는 체계가 다른 한글과 한자와 같이 모아쓰기 문자의 통계적 방법으로 인식할때 그 대상이 되는 글자가 수천-수만자가 되므로 인식율 저하와 인식시간이 많이 걸릴때 그 대상이 되는 문자를 대폭 줄일 수 있어 인식율 증대와 인식시간을 대폭 줄일 수 있는 효과가 있는 것이다.

Claims

통계적 문자인식의 후보문자 분류방법에 있어서, 입력된 문자의 이미지의 크기를 정규화하는 단계와, 상기 정규화된 문자에 대해 N×N 메쉬를 정의하는 단계와, 상기 정의된 문자이미지의 각 영역에 대해 좌에서 우방향으로 스캔할때 최초의 문자를 만날때까지의 거리인 우방향특징, 우에서 좌로 스캔할때 최초의 문자를 만날때까지의 거리인 좌방향특징, 문자의 방향에서 임계치의 높이로 좌에서 우로 스캔할때 문자와 만나는 횟수 및 그 거리인 아래방향 특징을 추출하여 몇개의 타입으로 나누는 특징 추출단계와, 상기 추출된 특정값에 의해 세가지가 동시에 만족되는 문자들을 동일한 그룹으로 화일하는 단계로 이루어진 것을 특징으로 하는 문자인식에서의 후보문자 분류방법.
제1항에 있어서, 상기 좌, 우방향 특징추출단계는 충분한 M회 반복하여 그 평균값과 분산에 의해 특징을 추출하고, 연산자에 의해 일정한 값으로 정규화하는 것을 특징으로 하는 문자인식에서의 후보문자 분류방법.
제1하에 있어서, 상기 아래방향 특징추출단계는 충분한 M회 반복하여 한번도 다른 특징결과를 갖지 않을 때만 그 결과를 특징값으로 갖는 것을 특징으로 하는 문자인식에서의 후보문자 분류방법.