KR940003634B1

KR940003634B1 - 문자 인식 시스템의 문자형 자동 선택 방법

Info

Publication number: KR940003634B1
Application number: KR1019900001214A
Authority: KR
Inventors: 장재수
Original assignee: 삼성전자 주식회사; 정용문
Priority date: 1990-01-31
Filing date: 1990-01-31
Publication date: 1994-04-25
Also published as: KR910014840A

Abstract

내용 없음.

Description

문자 인식 시스템의 문자형 자동 선택 방법

제1도는 통상적인 기술에 의한 문자 인식 시스템의 개략적인 구성을 도시한 개요도.

제2도는 본 발명에 따른 문자형 자동 선택 방법을 실시하기에 적합한 문자 인식 시스템의 개략적인 구성을 도시한 개요도.

제3a도는 제2도에 도시된 문자 인식 시스템을 작동하기 위한 문자형 자동 선택 방법의 바람직한 일 실시예의 주 흐름도, b도는 a도에 따른 주 흐름도를 설명하기 위한 제1서브루틴 인식 처리과정 흐름도. c도는 a도에 의한 주 흐름도를 설명하기 위한 제2서브루틴 인식 처리과정 흐름도.

제4a도는 통상적인 기술에 의한 문자형 롬의 구성도, b도는 본 발명에 따른 문자형 롬의 구성도.

본 발명은 문자 인식 시스템의 문자형 자동 선택 방법에 관한 것으로, 특히 문자 인식 시스템의 인식 가능한 인쇄체 문자형을 확대하는데 있어서 데이타 베이스의 구성과 인식 절차의 개선을 통해 자동적으로 문자형을 탐지하여 인식 시간을 현저히 줄일 수 있도록 하는 문자형 자동 선택 방법에 관한 것이다.

인쇄체 영문, 숫자용 인식 장치에 이용되는 인식 기술은 데이타 베이스 시스템에 문자형의 종류나 크기에 좌우되지 않는 단점수(End Point number), 교점수, 교각등의 특징값을 포함하거나 문자형의 변화에 민감한 흑점수, 투사(Projection)등의 특징값을 포함하게 된다.

상기 데이타 베이스 시스템에 단점수, 교점수, 교각등의 특징값이 포함되는 경우 문자형의 종류에 관계없이 인식 처리할 수 있는 시스템의 구현이 가능하나 이 시스템은 속도가 느리고 단가가 높기 때문에 주로 필기체 문자 인식 장치에 이용된다. 따라서, 상용화된 인쇄체 문자 인식 장치는 상기와 같이 데이타 베이스 시스템에 문자형의 변화에 민감한 흑점수, 투사(Projection)등의 특징값을포함하는 인식 기술을 주로 사용한다.

제1도는 통상적인 문자 인식 시스템의 개략적인 구성을 도시한 개요도이다. 즉,동도면에서 문서(10)는 소정 갯수(i) 문자형중의 하나로 기록되어 있으며 주사수단(20)은 이 문서(10)를 읽어 광전변환을 통해 전기적 신호로 바꾸고 이를 다시 디지탈 신호로 변환하여 이진 데이타 전체를 제1메모리수단(30)에 저장한다. 이때 분리수단(40)은 제1메모리수단(30)으로부터 이진 데이타를 전송받아 문자 신호 부분만을 분리하여 제2메모리수단(50)에 저장한다. 상기 제2메모리수단(50)에 저장된 문자 신호는 특징값 추출수단(60)에 전송되어 문자 신호로부터 인식에 필요한 소정 갯수의 특징값을 추출한다. 상기 특징값 추출수단(60)에서 추출된 특징값은 제3메모리수단(70)에서 일시적으로 저장된 후에 제어수단(80)으로 전송한다. 한편 판별수단(100)에서는 제3메모리수단(70)의 어드레스와 문자형 기억수단(90)의 어드레스를 일일히 비교하여 제4a도와 같은 문자형 롬 구성도에서 보는 바와 같이 ASCII 데이타 형태로 제4메모리수단(110)에 전송한다. 상기와 같은 통상적인 문자 인식 장치는 인식 수행전에 오퍼레이터가 인식하고자 하는 문자형에 해당하는 문자형 기억수단(90)의 롬(ROM)을 미리 지정하거나, i개의 롬(ROM) 내용을 모두 인식하고자 하는 문자의 특징을 가지고 있는 제3메모리수단(70)과 일일히 비교하는 절차를 밟아 인식 속도에 상당한 영향을 미치게 되는 문제점이 있다.

따라서 본 발명은 상기 문제점을 해결하기 위하여 창출한 것으로서 오퍼레이터가 직접 수동으로 문자형 롬(ROM)을 지정하지 않아도 시스템이 자동적으로 해당 문자형 롬(ROM)을 탐색할 수 있도록 함으로써 인식 속도에 크게 영향을 주지 않도록 하는 문자 인식 시스템의 문자형 자동 선택 방법을 제공하는데 그 목적이 있다.

상기 목적을 달성하기 이하여 본 발명은, 문자의 수와 초기 문자형 롬(ROM)의 갯수를 설정하고 카운터수단의 어드레스를 0으로 초기화하는 제1과정 ; 상기 제1과정을 수행하고나서 제3메모리수단으로부터 특징 벡터를 독취하여 모든 문자형 기억 수단의 롬에 있는 라이브러리 특징 벡터와 일일이 비교함으로써 이 라이브러리 특징 벡터중에서 특징 벡터와 가장 유사한 값을 찾아서 해당 ASCII 값을 제4메모리수단에 세이브하는 한편 카운터수단의 롬 카운터 어드레스를 “1”만큼 증가시키는 제2과정 ; 상기 제2과정을 수행한 카운터수단의 모든 롬 카운터 어드레스를 합한 값과 상기 제1과정에서 설정된 문자의 수와 비교하여 이 문자의 수가 크거나 같으면 상기 제2과정을 반복 수행하고, 이 롬 카운터 어드레스를 합한 값이 크면 롬 카운터 어드레스 내용을 차례로 나열하여 최상값을 갖는 소정 갯수의 롬 카운터를 탐색하는 제3과정 ; 상기 제3과정에서의 롬 카운터 갯수가 “1”인지를 검사하여 “1”보다 크면 제1서브루틴 문자 인식과정을 반복적으로 수행하고 “1”이면 제2서브루틴 인식 처리과정을 수행하는 제4과정으로 구성함을 특징으로 한다.

이하 첨부한 도면을 참조하여 본 발명을 보다 상세히 기술하기로 한다.

제2도는 본 발명에 의한 문자형 자동 선택 방법을 수행하기 위한 문자 인식 시스템의 개략적인 구성을 도시한 개요도이다.

제2도에 있어서, 문서(10)는 소정 갯수(i) 문자형중의 하나로 기록되어 있으며 주사수단(20)은 이 문서(10)를 읽어 광전변환을 통해 전기적 신호로 바꾸고 이를 다시 디지탈 신호로 변환하여 이진 데이타 전체를 제1메모리수단(30)에서 저장한다. 이때 분리수단(40)은 제1메모리수단(30)으로부터 이진 데이타를 전송받아 문자신호 부분만을 분리하여 제2메모리수단(50)에 저장한다. 상기 제2메모리수단(50)에 저장된 문자신호는 특징값 추출수단(60)에 전송되어 문자 신호로부터 인식에 필요한 소정 갯수의 특징값인 (Xo'~Xj')를 추출한다. 상기 특징값 추출수단(60)에서 추출된 특징값(Xo'~Xj')은 제3메모리수단(70)에서 일시적으로 저장된 후에 제어수단(80)으로 전송한다. 한편 판별수단(100)에서는 제3메모리수단(70)의 어드레스와 문자형 기억수단(90)의 어드레스를 일일이 비교하여 ASCII 데이타 형태로 제4메모리수단(120)에 전송한다. 이때 제4b도와 같은 문자형 롬 구성도에서 보는 바와 같이 문자형 기억수단(90)이 문자 롬에 해당되는 카운터수단(110)의 롬 어드레스 값은 “1”만큼 증가하게 되는데 상기의 시스탬 제어는 제어수단(80)이 각 모듈의 흐름을 조절함으로써 이루어진다.

제3a도, b도, c도는 제2도에 도시된 분자 인식 시스템을 수행하기 위한 문자형 자동 선택 방법의 바람직한 일실시예 주흐름도와 제1, 2서브루틴 인식 과정 흐름도이다.

제3a에 있어서, 인식 비교 대상 무자형 롬의 갯수를 줄이기 이해 사용되는 문자의 수(P)가 최초의 P에 의해 선정되는 초기 문자형 롬의 갯수(Q)를 적절하게 설정하고(제1단계) 제2도에 따른 카운터수단(110)을 구성하는 인식 가능한 소정 갯수(i)의 롬 카운터 어드레스를 0으로 초기화 한다(2단계), 상기 2단계를 수행하고 나서 제3메모리수단(70)으로부터 Xo'~Xj'개의 특징 벡터를 읽고(3단계), 이 특징 벡터를 제4b도에서와 같이 문자형 기억수단(90)을 구성하고 있는 소정 갯수(i)의 문자형 롬에 내장되어 있는 i×m개의 라이브러리(Libary) 특징 벡터(Xo, o~Xo, j)(X₁, o~X₁, j)(Xi-₁, o~Xi-₁, j)와 일일이 비교한다(4단계). 상기 4단계의 라이브러리 특징 벡터 i×m개 중에서 특징 벡터와 가장 유사한 값 한개를 찾아낸다(5단계). 이때, 상기 5단계에서 벡터의 항간의 거리 또는 비율의 합이 최소가 되는 경우를 가장 유사한 것으로 판단의 기준을 삼는다.

한편, 상기 5단계에서 특징 벡터와 가장 유사한 값을 찾으면 제4b도에서 도시되어 있듯이 제어수단(80)은 가장 근사한 것으로 판정된 라이브러리 특징 벡터 값에 해당되는 문자코드(ASCII) 값과 롬 넘버(ROM#)의 어드레스를 알 수 있으므로 인식된 결과로서 이 ASCII 값을 제4메모리수단(120)에 전송한다(6단계). 상기 6단계에서 카운터수단(110)을 구성하는 소정 갯수(i)의 롬 카운터중에서 가장 근사한 것으로 판정된 라이브러리 특징 벡터 값에 해당되는 롬 카운터의 어드레스를 “1”만큼 증가시킨다(7단계). 상기 7단계를 수행하고 나서 모든 롬 카운터의 내용을 합한 값(SUM)을 P값과 비교하여 이 P값보다 작거나 같을 경우 상기 3~7단계를 반복 수행하고(8단계) SUM 값이 P값보다 크게 되는 순간 롬 카운터의 어드레스를 차례로 탐색하여 상위 값을 갖는 Q개의 롬 카운터를 찾아낸다(9~10단계). 상기 9~10단계를 수행하고 나서 Q값이 1인지 즉, 문자형 롬 1개로 고정되는지를 검사하여 이 Q값이 1이면 제2서브루틴 인식과정(13단계)으로 이행하고 이 Q값이 1보다 크면 제1서브루틴 인식과정(12단계)을 수행한다. 상기 12단계를 수행하고 나서 11단계로 복귀하여 Q값이 1이될때까지 계속 검사한다.

제3b도는 a도에 따른 주 흐름도를 설명하기 위한 제1서브루틴 인식과정의 흐름도이다.

제3b도에 있어서, 문자형 기억수단(90)을 구성하고 있는 문자형 롬이 회초 i개에서 Q개로 고정된 상태에서 제2도에 따른 카운터수단(110)을 구성하는 인식 가능한 소정 갯수(i)의 롬 카운터 어드레스를 0으로 초기화 한다((12a단계). 상기 12a단계를 수행하고 나서 제3메모리수단(70)으로부터 Xo'~Xj'개의 특징백터를 읽고(12b단계) 이 특징 벡터를 Q개의 문자형 롬에 있는 Q×m개의 라이브러이 특징 벡터와 일일이 비교한다(12c단계). 상기 12c단계의 라이브러리 특징 벡터 Q×m개중에서 특징 벡터(Xo'~Xj')와 가장 유사한 값 한개를 탐색하여(12d단계) 이 특징 벡터와 가장 유사한 값을 찾으면 제4b도에 도시되어 있듯이 제어수단(80)은 가장 근사한 것으로 판정된 라이브러리 특징 벡터값에 해당되는 ASCII 값과 롬 넘버(ROM#)의 어드레스를 알 수 있으므로, 인식된 결과로서 이 ASCII 값을 제4메모리수단(120)에 전송한다(12e단계). 상기 12e단계에서 카운터수단(110)을 구성하는 소정 갯수(i)의 롬 카운터 중에서 가장 근사한 것으로 판정된 라이브러리 특징 벡터값에 해당되는 롬 카운터의 어드레스를 “1”만큼 증가시킨다(12f단계). 상기 12f단계를 수행하고 나서 모든 롬 카운터의 내용을 합한 값(SUM)을 P값과 비교하여 이 P값보다 작거나 같을 경우 상기 12b~12f단계를 반복 수행하고(12단계) SUM값이 P값보다 크게 되는 순간 롬 카운터의 어드레스를 차례로 탐색하여(12h단계) Q값을 하나 줄인다(12i단계). 상기 12i단계를 수행하고 나서 롬 카운터의 크기 배열중 상위 값을 갖는 Q개의 롬 카운터를 찾아낸다(12j단계). 여기에서 Q값은 상기 12i단계에 의해 최초의 Q보다 “1”만큼 작은 값으로 비교대상 문자형 롬의 갯수가 하나 줄게 됨을 뜻한다. 상기 12j단계를 수행하고 나서 a도의 11단계로 복귀하여 Q값이 “1”이 될때까지 제1서브루틴 인식과정(12단계)를 반복 수행한다.

제3c도는 a도에 의한 주 흐름도를 설명하기 위한 제2서브루틴 인식과정의 흐름도이다.

제3c도에 있어서, 문자형 기억수단(90)의 문자형 롬이 1개로 고정된 경우이므로 제3메모리수단(70)으로부터 특정 벡터를 읽는다(13a단계). 상기 13a단계를 수행하고 나서 특징 벡터를 고정된 문자형 롬에 있는 m개의 라이브러리 특징 벡터와 일일이 비교하여(13b단계) m개의 라이브러리 특징 벡터중 특징 벡터(Xo'~Xj')가 가장 근사한 1개의 라이브러리 특징 벡터 값을 탐색한다(13c단계). 상기 13c단계에서 탐색된 특징 벡터에 해당하는 문자코드(ASCII) 값이 인식되어 제4메모리수단(120)으로 전송된다(13d단계). 상기 13d단계를 수행한 결과 문서(10)내의 모든 문자를 인식처리하였는지 여부를 검사하여(13e단계) 문자가 모두 인식처리되지 않았을 경우 상기 13a~13d단계를 반복 수행하고 문자가 모두 인식처리됐을 경우 시스템 동작을 완료한다(13f단계).

상술한 바와 같이 본 발명은 문자형 범위내에 한가지 자형으로 구성된 문자를 인식 처리할 경우 처음 몇 문자 이후의 인식시간은 단일 문자형만을 인식하는 시스템의인식 속도와 동일하도록 하고 오퍼레이터가 임의의 문자를 구성하는 문자형을 알지 못한 상태에서도 인식을 수행할 수 있는 이점이 있다.

Claims

문자 인식 시스템에 있어서, 문자의 수와 초기 문자형 롬(ROM)의 갯수를 설정하고 카운터수단의 어드레스를 0으로 초기화하는 제1과정 ; 상기 제1과정을 수행하고나서 제3메모리수단으로부터 특징 벡터를 독취하여 모든 문자형 기억수단의 롬에 있는 라이브러리(Library) 특징 벡터와 일일이 비교함으로써 이 라이브러리 특징 벡터중에서 특징 벡터와 가장 유사한 값을 찾아서 해당 ASCII 값을 제4메모리수단에 세이브하는 한편 카운터수단의 롬 카운터 어드레스를 “1”만큼 증가시키는 제2과정 ; 상기 제2과정을 수행한 카운터수단의 모든 롬 카운터 어드레스를 합한 값과 상기 제1과정에서 설정된 문자의 수와 비교하여 이 문자의 수가 크거나 같으면 상기 제2과정을 반복 수행하고, 이 롬 카운터 어드레스를 합한 값이 크면 롬 카운터 어드레스 내용을 차례로 나열하여 최상값을 갖는 소정 갯수의 롬 카운터를 탐색하는 제3과정 ; 그리고 상기 제3과정에서의 롬 카운터 갯수가 “1”인지를 검사하여 “1”보다 크면 제1서브루틴 문자 인식과정을 반복적으로 수행하고 “1”이면 제2서브루틴 인식 처리과정을 수행하는 제4과정으로 구성함을 특징으로 하는 문자 인식 시스템의 문자형 자동 선택 방법.
제1항에 있어서, 문자 인식 시스템을 작동하기 위한 문자형 자동 선택 방법의 제4과정을 수행하는 제1서브루틴 문자 인식과정에서, 문자형 롬이 상위값으로 고정된 상태에서 인식가능한 소정 갯수의 롬 카운터 어드레스를 0으로 초기화하여 특징 벡터를 읽고 이 특징 벡터를 라이브러리 특징 벡터와 일일이 비교하는 제1A과정 ; 상기 제1A과정의 라이브러리 특징 벡터중에서 특징 벡터와 가장 유사한 값 한개를 탐색하여 가장 근사한 것으로 판정된 라이브러리 특징 벡터 값에 해당하는 문자코드(ASCII) 값을 제4메모리 수단에 전송하는 제1B과정 ; 상기 제1B과정을 수행하고 나서 가장 근사한 것으로 판정된 라이브러리 특징 벡터 값에 해당되는 롬 카운터의 어드레스를 “1”만큼 증가시키는 제1C과정 ; 상기 제1C과정을 수행하고 나서 모든 롬 카운터의 내용을 합한 값을 문자의 수와 비교하여 이 문자의 수보다 작거나 같을 경우 상기 제1A~1C과정을 수행하는 제1D과정 ; 그리고 상기 제1D과정에서 모든 롬 카운터의 내용을 합한 값이 문자의 수보다 크게되는 순간 롬 카운터의 어드레스를 차례로 탐색하여 초기 문자형 롬의 갯수를 하나 줄여 상위값을 롬 카운터를 찾아내는 제1E과정으로 구성함을 특징으로 하는 문자 인식 시스템의 문자형 자동 선택 방법.
제1항에 있어서, 문자 인식 시스템을 작동하기 위한 문자형 자동 선택 방법의 제4과정을 수행하는 제2서브루틴 인식 처리과정에서, 문자형 롬이 1개로 고정된 상태에서 특징 벡터를 읽어 라이브러리 특징 벡터와 가장 근사한 1개의 라이브러리 특징 벡터 값을 탐색하는 제2A과정 ; 상기 제2A과정에서 탐색된 특징 벡터에 해당하는 문자코드(ASCII) 값을 인식하여 문서 내의 모든 문자를 인식 처리하였는지 여부를 검사하여 문자가 모두 인식 처리됐을 경우 시스템 동작을 완료하는 제2B과정으로 구성됨을 특징으로 하는 문자 인식 시스템의 문자형 자동 선택방법.