KR940007935B1

KR940007935B1 - 문자 인식을 위한 후보 분류 방법

Info

Publication number: KR940007935B1
Application number: KR1019920010923A
Authority: KR
Inventors: 정찬의
Original assignee: 주식회사 금성사; 이헌조
Priority date: 1992-06-23
Filing date: 1992-06-23
Publication date: 1994-08-29
Also published as: KR940001011A

Abstract

내용 없음.

Description

문자 인식을 위한 후보 분류 방법

제 1 도는 종래의 런-렝스(Run-Length) 기법에 의한 연결 구조도.

제 2 도의 a 내지 e는 종래 LAG(Line Adjacenct Graph) 기법에 의한 방향별 추출 자획의 예시도.

제 3 도는 제 2 도에 의한 방향별 스트로크에 대한 분할 영역도.

제 4 도는 본 발명 문자 인식을 위한 후보 분류 방법의 흐름도.

제 5 도는 제 4 도에 의한 후보 문자 분류 과정도.

제 6 도는 본 발명 후보 문자 분류기의 구성도.

제 7 도는 본 발명 디지탈 시그널 프로세서가 내장된 컴퓨터 시스템의 구성도.

제 8 도는 본 발명에 의한 마스크의 각 계수 및 대응 화소를 나타낸 도표.

제 9 도는 본 발명에 의한 방향 코드를 보인도.

제10도의 a 내지 g는 각 방향별 획성분 추출과정을 보인 예시도.

제11도의 a 내지 h는 각 자획별 추출과정을 보인 예시도.

제12도 자획별 특징 영역 분할도.

* 도면의 주요부분에 대한 부호의 설명

31 : 스트로크 추출부 32 : 콘트롤러

33 : 스트로크 계산기 34 : 저장부

35 : 어드레스 디코더 C1-C_n: 후보문자등록 레지스터

본 발명은 문자의 자획을 추출하는 문자 인식에 있어서 인식을 위한 후보문자를 선택하기 위한 것으로, 특히 세선화를 하지 않고, 문자로 부터 경사/수직/수평획을 추출한 뒤 이들의 크기를 구하여 후보 문자를 선택하는데 적합하도록 한 문자 인식을 위한 후보 분류 방법에 괸한 것이다.

종래의 문자 인식은 접근 방식에 따라 통게적 방법과 구조적 방법으로 대별되는데, 문자 인식방법의 구현에 있어서 문자의 자획 정보를 이용한 인식방법을 설계하기 위해서는 문자의 자획을 특징으로 추출하여야 한다.

그러나 통계적 방식에 의한 인식방법을 설계하는 경우 통상 자소를 구성하는 특성이 다른 각각의 자획성분을 추출하지 않고 메쉬(mesh)라고 불리우는 격자모양의 방(window)를 문자에 씌워서 각 메쉬내에 있는 문자의 화소(혹화소)수를 계산하여 그 메쉬의 특정값으로 지정한다.

각각의 메쉬의 특정값을 그 문자의 특징량으로 하여 기준 데이타의 특징량과 비교한뒤 유사도가 가장 큰 문자를 입력 문자로 인식하는 방법이다.

구조적 방식에 의한 인식방법 설계시에는 대개 문자의 자획 정보를 이용하며, 이때 문자의 자획을 추출하는 방법으로는 입력 문자를 세선화하고 이 세선화된 영상에서 미리 정의된 방향 코드를 추출하여 특정방향의 방향 성분만을 선택하는 방법을 이용하고 있다.

그런데, 상기와 같은 일반적인 방법에 의하지 않는, 즉 세선화 과정을 필요로 하지 않은 자획추출 방법으로는 런-렝스(Run-Length)기법과 LAG(Line Adjacenct Graph) 기법에 의한 방법이 있는데, 먼저 런-렝스기법은 영상을 주사하는 동안 연속적으로 나타나는 흑화소를 런(Run)이라 하고, 이때, 이 런의 크기 즉 화소수의 수를 런-렝스라 한다.

그리고, LAG는 런-렝스에 의해 추출된 각 수평선상의 런(Run)들에 대해 이들이 연속적으로 수평선상에서 상하로 연결된 경우 그 런(Run)들을 연결된 하나의 그룹으로 처리하는 방법으로서 제 1 도에 도시된 바와같이 런 A와 B는 이웃한 수평선상에서 서로 연결되어 있을 때, 그 연결여부는 A×1≤B×2 그리고 B×1≤A×2를 만족하면 두개의 런이 연결된 것으로 판단한다.

상기와 같은 방법으로 특정 방향의 자획을 추출하는 방법은 대한민국에 특허 공고된 " 스트로크 근사 직선 추출에 의한 문자인식 방법"으로 공고번호 91-5385에 설명되어 있고 이를 제 2 도 및 제 3 도를 참조하여 설명하면 다음과 같다.

영상을 주사중 횡방향으로 일정 갯수 이상 연결된 화소가 2주사라인 이상에 걸쳐 종방향으로 연결된 집합체를 형성하고 있는 것이 검출될 때 이 화소의 집합체를 횡방향 스트로크(제 2 도의 a)로 인정하고, 횡방향으로 일정 갯수보다 적은 갯수만으로 연결된 화소가 종방향으로 신장하는 집합체를 형성하고 있는 것이 검출될 때 그 화소의 집합체를 종방향 스트로크(제 2 도의 b)로 인정하며, 횡방향으로 일정 갯수보다 더 적은 갯수만으로 연결된 화소가 좌축 하강 또는 경사 방향으로 신장하는 집합체를 형성하고 있는 것이 검출될 때 그 화소의 집합체를 좌측하강 경사방향 스트로크c 또는 우측하강 경사방향 스트로크d로 인정함으로써 특정 방향의 자획을 추출한다.

이와같은 방법에 의해 추출된 각 방향별 추출 자획의 예를 보인 것이 제 2 도의 e에 도시한 "硏"이다.

상기 방법에 의한 문자 식별 방법은 제 3 도에 도시한 바와같이 분할된 각 영역에서 각 방향별로 추출한 스트로크의 수(갯수)를 산출하여 후보문자를 선택한다.

둘째는 거리를 이용하는 방법으로서 어떤 흑화소로 부터 4 방향으로 촉수를 눌러 백화소와 만나기 직전까지의 유클리드 기하학거리(Euclidean distance)를 계산하여 가장 큰 값을 갖는 방향의 코드를 흑점 영역에 할당한 뒤 방향별 흑화소의 영역을 만들어 낸다.

그러나, 이와같이 세선화하여 자획을 추출하는 종래 기술에 있어서 스트로크의 수(갯수)를 산출하여 후보문자를 선택하는 방법은 한글과 같이 모아쓰기 문자의 경우 두개 이상의 자소가 서로 연결되는 경우가 빈번히 발생할때 획의 수 만으로 후보를 결정하게 되면 후보의 수가 증가하게 되어 인식시간과 인식율의 저하를 초래하게 되는 문제점을 안고 있다.

따라서 종래의 문제점을 해결하기 위하여 본 발명은 입력된 개별문자의 크기에 따라 문자의 정규화 과정을 수행하고, 특정한 3방향으로의 밝기 변화가 검출된 영상들을 논리적으로 조합하여 빗침과 내림의 두 경사획을 추출한뒤, 다시 각각의 영상에 대해 y방향과 x방향으로의 밝기 변화가 검출된 영상들을 논리적으로 조합하여 수평획과 수직획을 추출하고 기준문자와 매칭시켜 후보문자를 선택 및 인식 저장하도록 함으로써 시스템 구성을 간결하게 할 수 있고 처리시간을 단축시킬 수 있도록 한 문자 인식을 위한 후보 분류 방법을 창안한 것으로, 이하 첨부한 도면을 참조하여 상세히 설명하면 다음과 같다.

제 7 도는 본 발명의 동작을 보다 빠르게 실행시키기 위한 장치로서 제 6 도와 같은 후보문자 분류기능이 들어 있는 디지탈 시그널 프로세서(DSP) 1, 2(5)(6)와, 상기 디지탈 시그널 프로세서 1, 2(5)(6)에 종속되어 있는 로컬(Local) 메모리(9)(10)와, 상기 디지탈 시그널 프로세서 1, 2(5)(6)에 엑세스 가능한 입력영상을 저장하는 글로벌(Global) 메모리(8)와, 상기 디지탈 시그널 프로세서(5)(6)의 동작을 조정하는 제어로직부(2)와 조정로직부(3)로 구성되어 있다.

상기 본 장치의 동작을 살펴보면 이는 스캐너(4)로 부터 받아들인 문서 영상을 글로벌(Global) 메모리(8)에 저장된 후 디지탈 시그널 프로세서 1(5) 또는 2(6)에 의해서 문자열 분리 및 개별문자 절출을 수행하고 그 결과를 글로벌 메모리(8)내의 특정한 영역에 저장하도록 한다.

여기서 두개의 디지탈 시그널 프로세서 1, 2(5)(6)는 서로 다른 임무를 동시에 수행하며 이는 제어로직부(2)와 조정로직부(3)에 의해 조정된다.

즉, 디지탈 시그널 프로세서 1(5)가 문서의 영역분할 및 개별문다 절출 과정까지를 수행하다면 그 다음 디지탈 시그널 프로세서 2(6)는 문자의 인식 과정을 수행하게 되며 또한 서로 반대의 임무를 실행할 수도 있다.

따라서, 디지탈 시그널 프로세서 2(6)가 인식과정을 수행하도록 임무가 주어진다면, 디지탈 시그널 프로세서 2(6)는 글로벌 메모리(8)의 특정영역에서 개별문자의 영역 정보를 읽은 후 그 영역에 해당하는 글로벌 메모리(8)의 영상데이타를 로컬 메모리(9)(10)로 옮겨와 본 발명의 진행절차에 따라 특징 추출 및 후보 분류를 수행하게 된다.

최종적으로 인식된 결과는 로컬 메모리(10)의 인식결과부에 격납하게 된다.

제 6 도는 본 발명 후보 문자 분류기의 구성도로서, 입력된 문자 크기의 정규화를 행한 뒤 콘트롤러(32)에 의해 지정된 해당 영역에 속하는 스트로크(stroke)만을 추출하는 스트로크 추출부(31)와, 이 스트로크 추출부(31)의 출력 데이타를 입력받아 스트로크 길이를 정규화함과 아울러 스트로크 크기를 계산하는 스트로크 게산기(33)와, 이 스트로크 계산기(33)에서 계산된 크기(magnitude)와 기준갑(RF1-RF8)을 비교하여 각 영역별로 입력 문자와 동일한 클래스(class)에 속한 문자를 후부 문자로 선택하여 어드레스 디코더(35)의 디코딩상태에 따라 후보문자 등록 레지스터(C1-C_n)에 저장하는 저장부(34)로 구성한다.

이와같이 구성된 본 발명의 작용, 효과를 상세히 설명하면 다음과 같다.

자획 추출 방법은 추출하고자 하는 자획에 대응하는 특정 방향으로의 영상의 밝기 변화를 검출함으로써 원하는 방향의 자획을 추출하는데, 공간 영역(spatial domain)에서의 영상처리방법은 다음과 같이 정의된다.

g(x, y)=T[f(x, y)] ━━━━━━━━━━━━━━━━━━━━━━━ (1)

여기서 f(x, y)는 영상입력을 g(x, y)는 입력영상 f(x, y)에 어떤 연산 또는 처리 T가 가해져 얻어진 영상을 나타내고, T는 입력영상에 화소단위로 적용되는 변환(transform 또는 mapping)을 행하는 연산자(operator)로 입력 영상에서 미리 정의된 주변 화소들의 값에 의해 결정된다.

이러한 접근 방식에서는 2차원 배열(array)로 표시되는 마스크(또는 템플리트(template), 필터(filter), 윈도우(window)등으로도 불리워짐)의 이용을 근본으로 하고 있는데, 이 마스크를 구성하고 있는 배열의 각 원소들은 영상에서 주어진 특징으로 검출하기 위해 미리 정의된 계수(또는 웨이트(weight)를 갖게 된다.

제 8 도의 a는 본 발명에서 사용하는 3×3 마스크의 예로써 W1-W9는 마스크의 각 계수를 나타내고 b는 그 마스크가 입력 영상에 적용될 때 대응하는 화소를 나타낸 것으로 영상 g(x, y)는 다음과 같다.

g(x, y)=T[f(x, y)]

=W1×f(x-1, y-1)+W2×f(x-1, y)+W3×f(x-1, y+1)+

W4×f(x, y-1)+W5×f(x, y)+W6×f(x, y+1)+W7×f(x+1, y-1)+

W8×f(x+1, y)+W9×f(x+1, y+1)

상기 계수와 대응되는 화소 값을 열 백터로 표현하면,

와 같이 이 두 벡터를 내적하면 W'×X=W1×X1+W2×X2+……W9×X9 얻을 수 있다.

즉, 식(1)은 g(x, y)=T[f(x, y)]=W'×X……(2)로 표현 가능하며 여기서 [X1…X9]는 마스크내에서 계수W의 자표에 대응하는 화소의 값을 나타낸다.

본 발명에서는 식(2)를 특정 방향별로 영상의 밝기 변화를 검출하기 위해 다음과 같이 정의하고 그에 적합한 계수 벡터를 설정하여 원하는 방향의 자획 성분을 추출하고자 한다. 즉,

Gh=W'h×X

Gv=W'v×X

Gt=W't×X

로 정의하고, 여기서 Gh, Gv, Gt는 각각 수평, 수직 경사방향의 그래디언트(gridient)이고 W'h, W'v, W't는 각 방향에 대응하는 계수로 이루어진 벡터이다.

경사 방향의 획 추출을 위해서 3방향으로의 방향성 변화량 검출을 하게 되는데, 여기서 3방향이란 수평 또는 수직방향의 제 1 방향과 상기 제 1 방향의 우측경사방향의 제 2 방향 및 상기 제 1 방향의 좌측경사방향의 제 3 방향을 말하며, 수직방향(S)을 기준으로 하면 S, SE, SW 방향이고, E축 방향을 기준으로 하면 E, NE, SE 방향이며, N축 방향을 기준으로 하면 N, NE, NW 방향이 거, W를 기준으로 하면 W, NW, SW방향이다. 이때 3방향을 각각 제 9 도에서 S, SW, SE라 하면 이는 다음과 같이 정의된다.

Gt=W'SxX

=W'SWxX

=W'SExX

이때의 각각의 계수벡터는

W'S=W4+W6+W7+W8+W9-2W5-(W1+W2+W3)……………………(3)

W'SW=W1+W4+W7+W8+W9-2W5-(W2+W3+W6)…………………(4)

W'SE=W3+W6+W7+W8+W9-2W5-(W1+W2+W4)…………………(5)

그리고 수평/수직획 추출을 위한 벡터는 각각

Gh=W'hxX…………………………………………………………………………(6)

Gv=W'vxX…………………………………………………………………………(7)

이고, 계수벡터는 W'h=W5-W2, W'v=W5-W4이다.

입력된 문자에 대해 정규화된 문자(제10도의 b)에 대해 각 방향변 획 성분 추출식이 적용된 제10도의 c 내지 e에 나타낸 바와같이 각각 S, SW, SE 방향의 획 성분을 구하여 얻은 영상에 대해 각각 빗침과 내림 성분의 경사획을 추출하고 다음 수평과 수직성분과 획을 추출한다.

첫째, 빗침 획 추출방법은 상기 방향별 획 성분 추출에서 얻은 방향 S와 SW의 두 영상에 동일 좌표의 화소값을 다음 같은 논리적 연산을 적용하여 추출하는데, 구하고자 하는 획영상을 B(x, y)라 하면, S(x, y)의 화소값에 따라

와 같이 각각 논리합(OR)과 논리곱(AND)으로 표현되고 이와같은 식을 적용함으로써 빗침 획 영상을 구한다.

제10도의 f는 상기와 같은 방법에 의해 추출된 빗침 획의 예이다.

상기와 같은 결과는 측정방향 즉 방향 S, SW, SE로부터 구한 것이지만, 다른 일정한 방향의 영상으로부터도 동일한 결과를 얻을 수 있다.

즉, 제 9 도에서 방향 N, NW, NE의 조합에서, 방향 W, NW, SW의 조합에서, 그리고 방향 E, NE, SE의 조합에서도 동일한 결과를 얻을 수 있다.

이 말은 E, W, S, N방향과 이 방향으로부터 순방향과 역방향으로 각각 45도(degree)방향의 획 성분을 구하고 이들을 조합함으로써 원하는 획 성분을 얻을 수 있다.

둘째, 내림 획 추출방법으로 내림 혹은 빗침 획 추출과정과 동일한 과정을 수행하는데, 다만 방향 S와 SE의 두 영상에 대해 동일한 논리적 연산을 적용하는데, 구하고자 하는 빗침 획 영상을 N(x, y)라 하면, S(x, y)의 화소값에 따라

와 같이 각각 논리합과 논리곱으로 표현되고 이와같은 식을 이용함으로써 내림 획 영상을 구한다.

상기와 같은 방법에 의한 내림획의 추출예를 제10도의 g에 보였다.

한편, SW(x, y)와 SE(x, y)의 두 영상에 대해 상기와 같은 방법을 적용하여도 동일한 효과를 얻을 수 있다.

세째, 수평획 추출 방법으로 수평획은 영상에서 수직방향, 즉 제 2 도의 X축 방향으로의 영상의 밝기 변화를 검출함으로써 추출되어질 수 있으며 y방향으로의 영상 밝기 변화는 상기 식(6)과 그 계수 벡터를 이용한다.

그러나, 수직방향으로의 밝기변화 검출시엔 경사획 성분도 함게 추출(제11도의 c)되므로 이를 효과적으로 제거해 주어야만 명확한 수평획 성분의 검출이 가능하다.

먼저 식(6)과 그 계수 벡터로부터 y방향으로의 밝기 변화가 검출된 영상 F(x, y)를 얻고(제11도의 c), 이 영상에 내포된 빗침 획 성분을 제거하기 위해

와 같은 수직방향으로의 방향성 획 성분이 추출된 영상 H'(x, y)와 빗침획 영상 B(x, y)을 논리곱(AND)으로 처리하므로써 빗침획이 제거된 영상 H"(x, y)를 얻을 수 있다.

이는 제11도의 d에 도시한 바와 같다.

그러나 영상 H"(x, y)에는 여전히 내림획 성분이 잔존함으로 이 역시 제거되어야 하며 상기 빗침획 성분제거와 유사하게

함으로써 내림획 마저 제거된 수평획만 존재하는 영상 H(x, y)을 얻게 된다.

이는 제11도의 e에 도시한 바와같다.

네째, 수직의 추출방법은 상기 수평획 추출방법과 유사하며 다른 것은 다만 영상에서 수형방향 즉 제 6 도에서 y방향으로의 영상의 밝기 변화를 검출한다는 것과 그에 다른 수평 방향으로의 영상 밝기 변화 검출을 위해 식(7)과 그 계수벡터를 이용한다는 차이점이 있다.

수평획 추출시와 마찬가지로 수평 방향으로의 밝기 변화 검출시 경사의 성분이 함께 추출(제11도의 f)되므로 이를 제거해 주어야만 명확한 수직획 성분의 검출이 가능하다.

먼저 식(7)과 그 계수 벡터로부터 수평방향으로의 밝기 변화가 검출된 영상 V'(x, y)을 얻고 (제11도의 f, 이 영상에 내포된 빗침획 성분을 제거하기 위해

와 같은 수평방향으로의 방향성 획 성분이 추출된 영상 V'(x, y)와 빗침획 영상 B(x, y)을 논리곱(AND)으로 처리함으로써 빗침획이 제거된 영상 V"(x, y)을 얻을 수 있다(제11도의 g))

그러나 영상 V"(x, y)에는 여전히 내림획 성분이 잔존함으로 이 역시 제거되야 하며 상기 빗침획 성분제거와 유사하게

함으로써 내림획 마저 제거된 수직획막 존재하는 영상 V(x, y)을 얻는다.

이는 제11도의 h에 도시한 바와같다.

제 4 도는 본 발명 문자 인식을 위한 후보 분류 방법의 흐름도로서, 먼저 입력 문자열에서 각각의 개별문자를 절출한 뒤 이 절출된 문자의 크기를 구하여 문자에 대해 정규화(nomalization)를 수행한 다음 정규화된 문자에 대해 자획 성분을 특징으로 추출하고, 다시 레퍼런스(reference)와 매칭하여 유사한 특성을 갖는 후보 문자를 선택하여 인식 및 결과를 저장하여 처리하도록 하는데, 이 과정으로 설명하면 다음과 같다.

먼저 제10도의 a와 같은 입력문자의 크기를 M(가로)×M(세로)으로 문자 크기의 정규화를 행한(제10도의 b)뒤 이를 등간격으로 L등분하여 제12도의 a에서와 같이 영역의 크기를 지정하는데, 빗침획에 대한 영역은 제12도에서와 같이 초성 빗침 영역은 b로 종성 빗침 영역은 c로 정의하고, 마찬가지로 수평획과 수직획의 영역은 d 및 e와 같이 정의한다.

따라서 본 발명에서는 8개의 특징 영역이 존재한다.

이와같이 해당 영역에 속하는 스트로크 만을 스트로크 추출부(31)에서 선택된 스트로크들의 데이타는 스트로크 계산기(33)로 전송된다.

그러면 스트로크 게산기(33)에서는 추출되는 스트로크의 길이가 항상 일정치 않으므로 클래스(class) 분류시 오류를 유발시킬 수 있고 또한 구축된 레퍼런스(reference)의 정확도를 떨어뜨릴 수 있으므로 이를 방지하기 위하여 스트로크의 길이를 정규화 하는데, 이 정규화 방법은 스트로크 길이에 대응하는 웨이트(Weight)를 곱해주는 것이다.

또한, 빗침, 수평, 수직 스트로크 크기 계산은 다음과 같은 식에 의해 처리된다.

여기서, i = 0.1.…n으로 각 특징 영역에서의 스트로크 수이고, d=3으로 수평ㆍ 수직획 영역에서의 서브리전(subregion)을 나타내며, Wi는 각 스트로크에 대응하는 웨이트이다.

상기에서와 같이 각 방향별 획 성분 검출 및 자획별 추출과정을 거쳐 영상을 얻게 되면 후보문자를 선택하기 위하여 분할된 문자 영역내에서 추출된 방향별 자획의 크기를 상기 설명에서와 같이 스트로크 계산기(33)에서 산출된 값과 기준값(RF₁-RF₈)을 비교하여 각 영역별로 입력 문자와 동일한 클래스(class)에 속한 후보 문자로 선택한다.

이와같이 선택된 후보 문자들은 후보문자등록 레지스터(C₁-C_n)에 격납되는데, 이때 후보 문자는 분류도로서 저장되는데 분류도는 2개의 값으로 표현된다.

즉, 후보 문자가 8개 특징영역의 클래스(class)에서 얼마나 중복되어 분포하는가를 나타내는 중복분포율과 얼마나 정확하게 분류되었는가를 예측하는 분류 확률의 값을 후보문자등록 레지스터(C₁-C_n)의 해당 후보문자의 메모리 영역에 저장한다.

이상에서 상세히 설명한 바와같이 종래 획 추출방법과는 다른 특정 방향으로의 영상의 밝기 변화를 검출하는 단순한 기법을 이용함으로써 시스템 구성을 간결하게 할 수 있고, 그에 따라 처리시간이 단출될 뿐만 아니라 잡음에 대해서도 종래에 비해 강하며, 통계적 방식에 의해 인식 시스템을 설계한 경우 인식의 정확도를 높일 수 있도록 한 효과가 있다.

Claims

입력된 개별 문자의 크기를 구해서 문자 크기에 따른 문자의 정규화를 수행하는 정규화단계와, 상기 정규화단계를 거쳐 정규화된 문자 영상으로부터 수평 또는 수직방향의 제 1 방향과 상기 제 1 방향의 우측경사 방향의 제 2 방향 및 상기 제 1 방향의 좌측경사방향의 제 3 방향의 각기 다른 3방향별로 방향성 자획 성분을 추출하는 방향별 획 성분 검출단계와, 상기 방향별 획 성분 검출단계에서 추출된 3개의 방향성 획 성분을 논리적으로 조합하여 빗침과 내림의 경사획, 수평획과 수직획을 추출해내는 특징 추출단계와, 상기 특징 추출단계에서 추출한 특징을 분류한 후 레퍼런스와 비교하여 후보 문자를 선택한 그 선택 후보문자를 인식한 다음 격납하도록 하는 인식 및 저장단계로 진행됨을 특징으로 하는 문자인식을 위한 후보 분류 방법.
제 1 항에 있어서, 방향별 획 성분 검출단계는 정규화된 문자영상으로부터 수직방향(S), 수직방향(S)에 대해 좌측으로 경사진 방향인 빗침획방향(SW), 수직방향(S)에 대해 우측으로 경상진 방향인 내림획방향(SE)의 3방향으로 방향별 획 성분을 검출하며, 상기 S, SW의 두방향으로부터 논리적 연산을 적용하여 빗침획 영상을 추출하고, 상기 S, SE의 두방향으로부터 논리적 연산을 적용하여 내침획 영상을 추출하고, 문자영역에서 수직방향(y방향)으로서 밝기변화가 검출된 영상과 빗침획 영상 또는 내림획영상으로부터 논리적 연산을 적용하여 수평획 영상을 추출하고 문자영상에서 수평방향(x방향)으로서, 밝기변화가 검출된 영상과 빗침획 영상 또는 내림획 영상으로부터 논리적 연산을 적용하여 수직획 영상을 추출함으로써 특정방향의 자획을 추출함을 특징으로 하는 문자 인식을 위한 후보 분류 방법.
제 1 항에 있어서, 인식 및 저장단계는 후보 문자를 선택하기 위하여 입력문자 영역을 8개의 특징 영역으로 나누고 각 특징 영역에 지정되어 있는 스트로크 추출기를 통하여 해당 영역에서의 스트로크만을 추출하고, 이들의 크기(길이)에 대응하는 임의의 웨이트를 곱하여 자획의 길이를 정규화하며, 정규화된 자획의 길이를 모두 합한 값을 그 특징 영역의 크기로 지정하는 과정을 8개의 특징영역에서 동일한 방법으로 반복한 후 구해진 각 영역의 크기를 해당영역의 크기와 비교하여 입력문자의 클래스(class)를 결정하고 각 특징영역에서 입력문자와 동일한 클래스에 속한 문자들을 골라내어 이들을 후보문자로 지정한 뒤 이들의 후보문자가 8개 특징영역에서 얼마나 분포하는 가를 나타내는 중복분포율과 얼마나 정확하게 분류되었는가를 예측하는 분류확률의 값을 계산하여 이 두개의 값을 분류도로서 후보문자등록 레지스터에 격납하는 것을 특징으로 하는 문자인식을 위한 후보 분류 방법.