KR100315428B1

KR100315428B1 - 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및그 방법

Info

Publication number: KR100315428B1
Application number: KR1019990061946A
Authority: KR
Inventors: 지수영; 오원근; 문경애; 황영섭; 장대근
Original assignee: 오길록; 한국전자통신연구원
Priority date: 1999-12-24
Filing date: 1999-12-24
Publication date: 2001-11-26
Also published as: KR20010083265A; US6665437B1

Abstract

본 발명은 영상처리 기술 중 패턴인식 분야의 인쇄체 문자인식을 위한 문자 특징 추출 장치 및 그 방법에 관한 것으로서, 입력 문자 영상의 문자 부분과 배경 부분의 기하학적인 특징을 일정한 크기의 그물눈(mesh)에서 추출하여 다국어 문서내의 문자인식율을 향상시키기 위한, 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및 그 방법을 제공하기 위하여, 입력된 다국어 문자들을 표준양식에 의하여 출력한 후 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 수단; 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 수단; 그물눈에서의 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 수단; 및 추출된 특징으로부터 각각의 문자들의 특징을 추출하여 저장하는 수단을 포함하며, 문자인식 시스템 등에 이용됨.

Description

다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및 그 방법{Character Feature Extraction Apparatus And Method For Recognition Of Multi-Language Printed Document}

본 발명은 영상처리 기술 중 패턴인식 분야의 인쇄체 문자인식 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체에 관한 것이다.

일반적으로 쓰이는 문서의 대부분은 한국어, 영어, 숫자, 특수기호, 한자등과 같이 다국어 문서로 구성된 복잡한 문서가 특징이다.

따라서, 이러한 문서내에 포함된 다국어 문자를 인식하기 위하여는 다양한 입력문자 영상에 적합한 특징을 추출하는 것이 가장 기본적이고 중요한 작업이라 할 수 있다.

이와 관련한 종래의 기술로는, 단일 언어 인식을 위한 기술과 방법이 주종을 이루고 있으며, 다중 폰트에 대한 것도 소개되었지만, 다국어 인식을 위한 문자 특징 추출에 관한 것으로서 입력 문자 영상에 대하여 일정한 규격의 매쉬모양의 형태에서 문자 부분과 배경 부분 모두를 한 글자의 특징으로 하여 문자의 특징을 추출하는 시스템은 아직 개발된 사례가 없다.

즉, 상기와 같은 종래의 기술에 있어서는 문서내에 포함된 다국어 문자를 인식할 수 없다는 문제점이 있었다.

본 발명은 상기 문제점을 해결하기 위하여 안출된 것으로, 입력 문자 영상의 문자 부분과 배경 부분의 기하학적인 특징을 일정한 크기의 그물눈(mesh)에서 추출하여 다국어 문서내의 문자인식율을 향상시키기 위한, 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치 및 그 방법과 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공하는데 그 목적이 있다.

도 1 은 본 발명에 따른 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치의 일실시예 구성도.

도 2 는 본 발명에 따른 다국어 인쇄체 문서인식을 위한 문자 특징 추출 방법의 일실시예 흐름도.

도 3 은 본 발명이 적용되는 표준 문자의 특징 데이터베이스를 생성하기 위하여 표준 문자 코드표에 따라 글자들을 프린트하여 표준 입력 문자 셋을 구축한 일예시도.

도 4 는 본 발명이 적용되는 프린트된 문자에 대하여 여러 농도와 해상도에 따라 문서 입력장치인 스캐너로 표준 문자영상 데이터베이스를 구축한 일예시도.

도 5 는 본 발명이 적용되는 입력 문자영상의 크기 정규화 과정을 나타낸 일예시도.

도 6 은 본 발명이 적용되는 누적된 그물눈 특징으로의 변환 과정을 나타낸 일예시도.

도 7 은 본 발명이 적용되는 스트로크 부분의 특징 추출 과정을 나타낸 일예시도.

도 8 은 본 발명이 적용되는 넌-스트로크 부분의 특징 추출 과정을 나타낸 일예시도.

상기 목적을 달성하기 위한 본 발명은, 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치에 있어서, 입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 데이터베이스 구축 수단; 상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 변환 수단; 상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 특징 추출 수단; 및 상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 문자 특징 추출 수단을 포함한다.

또한, 본 발명은 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치에 적용되는 문자 특징 추출 방법에 있어서, 입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 제 1 단계; 상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 제 2 단계; 상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 제 3 단계; 및 상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 제 4 단계를 포함한다.

또한, 본 발명은 다국어 인쇄체 문서인식을 위한 문자 특징 추출을 위하여, 대용량 프로세서를 구비한 문자 특징 추출 장치에, 입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 제 1 기능; 상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 제 2 기능; 상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 제 3 기능계; 및 상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 제 4 기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체를 제공한다.

본 발명에 의하면, 종래의 획일적인 간격에 따라 그물눈에서 문자부분만 문자의 특징으로 추출한 방법보다 문자인식률을 향상시킬 수 있다.

이하, 도 1 내지 도 8 을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.

도 1 은 본 발명에 따른 다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치의 일실시예 구성도이다.

도면에 도시된 바와 같이 본 발명에 따른 문자 특징 추출 장치는, 문자 특징을 추출하고자 하는 문자를 입력하기 위한 입력장치(101), 입력된 각종 폰트의 다국어 문자들을 일정한 양식에 의하여 여러 문자의 크기로 프린터로 출력하여 표준 입력문자 셋을 구축하기 위한 표준 입력 문자 셋 구축장치(102), 표준 입력문자 셋을 영상입력 장치인 스캐너로 해상도와 농도를 달리하여 문자영상을 받아 표준 문자 영상 데이터베이스를 구축하는 데이터베이스 구축장치(103), 입력된 문자영상에 대하여 일정한 크기로 정규화하는 크기 정규화 장치(104), 크기 정규화 한 문자영상들에 대하여 3 X 3 마스크 오퍼레이션(mask operation)을 통하여 16 X 16 크기의 그물눈 모양의 특징으로 변환하는 변환 장치(105), 그물눈에서의 각 글자들의 지형적인 정보들 중 글자부분에 대한 특징을 추출하는 스트로크 특징 추출 장치(106), 그물눈에서의 각 글자들의 지형적인 정보들 중 배경부분에 대한 특징을 추출하는 넌-스트로크 추출 장치(107), 스트로크 특징 및 넌-스트로크 특징으로부터 문자의 특징을 추출하는 문자 특징 추출 장치(108) 및 추출된 정보를 저장하는 저장장치(109)를 포함한다.

도 2 는 본 발명에 따른 다국어 인쇄체 문서인식을 위한 문자 특징 추출 방법의 일실시예 흐름도이며, 도 3 은 본 발명이 적용되는 표준 문자의 특징 데이터베이스를 생성하기 위하여 표준 문자 코드표에 따라 글자들을 프린트하여 표준 입력 문자 셋을 구축한 일예시도이고, 도 4 는 본 발명이 적용되는 프린트된 문자에 대하여 여러 농도와 해상도에 따라 문서 입력장치인 스캐너로 표준 문자영상 데이터베이스를 구축한 일예시도이다. 또한, 도 5 는 본 발명이 적용되는 입력 문자영상의 크기 정규화 과정을 나타낸 일예시도이고, 도 6 은 본 발명이 적용되는 누적된 그물눈 특징으로의 변환 과정을 나타낸 일예시도이며, 도 7 은 본 발명이 적용되는 스트로크 부분의 특징 추출 과정을 나타낸 일예시도이고, 도 8 은 본 발명이 적용되는 넌-스트로크 부분의 특징 추출 과정을 나타낸 일예시도이다.

우선, 첫 번째 과정으로 표준 문자의 특징 데이터베이스(DB)를 생성하기 위하여 입력된 문자 영상에 대하여(201) 표준 문자 코드표에 따라 글자들을 프린트 하여 표준 입력 문자 셋(Sets)을 구축한다(202).

즉, 다국어 문서내에 있는 여러 모양과 크기를 갖는 문자의 특징을 추출하기 위한 첫 단계로서 일정한 규격에 의하여 문자들을 정렬한 후 표준문자 코드표에 따라 글자들을 프린트하여 표준 입력 문자 셋(Sets)을 구축한다. 이러한 문자 셋을 도시한 것이 도 3 이다.

두 번째 과정은, 프린트된 표준 입력 문자 셋을 가지고 여러 농도와 해상도에 따라 문서 입력장치인 스캐너로 표준 문자영상 데이터베이스(DB)를 구축한다(203).

즉, 표준 입력 문자 셋(Sets)을 가지고 문서영상 입력장치인 스캐너를 통하여 스캐너가 제공하는 여러가지 형태의 입력해상도와 농도에 따라 각각 스캐닝을 하여 표준 문자영상 데이터베이스(DB)를 구한다. 표준 문자영상 데이터베이스를 도시한 것이 도 4 이다.

세 번째 과정은, 입력 문자영상의 크기 정규화 과정이다(204).

즉, 표준문자의 특징 데이터베이스를 얻기 위해서는 각종 크기로 들어오는 입력문자 영상(501 내지 503)에 대하여 일정한 크기로 크기 정규화(Size Normalization) 과정을 거쳐야 한다.

본 발명에서는 어느 크기의 문자이든 48 X 48 사이즈로 크기 정규화 과정을 거친다. 이러한 크기 정규화된 문자(504)를 도시한 것이 도 5 이다.

네 번째 과정은, 누적된 그물눈(Mesh) 특징으로의 변환 과정이다(205).

즉, 본 발명에서는 앞 단계에서 48 X 48 사이즈로 크기 정규화한 문자영상 (601)들에 대하여 3 X 3 마스크 오퍼레이션(mask operation)을 통하여(602) 16 X 16 크기의 그물눈 모양의 특징(603)으로 변환한다. 이것을 가지고 각 문자들의 특징추출에 사용한다. 16 x 16 의 각 그물눈(mesh) 값은 0 에서 9 까지의 값을 갖는다. 다음으로 각 그물눈 가치(mesh value)를 8개의 위치 좌표로 변환(604)한 후 같은 종류의 각 글자의 위치좌표 값을 모두 누적하여 저장한다.

다섯 번째 과정은, 스트로크(Stroke) 부분의 특징 추출 과정이다(206).

즉, 상기 네 번째 과정에서 얻어진 누적된 그물눈(Mesh) 특징값(604)을 가지고 스트로크(stroke) 부분의 특징을 구하는 과정은 다음과 같다.

16 X 16 그물눈(mesh)을 4 X 4 영역(총 16개이고 각각은 4 X 4 그물눈(mesh)로 구성)으로 분할 한다(701).

4 X 4 그물눈(mesh)의 스트로크(stroke) 누적빈도와 해밍 거리(Hammingdistance) 누적 값을 계산하여 이 두 값중 최고 값을 지정하여 선정한다(702,703).

총 16개 위치의 가중치 합을 일정한 정수 값으로 정규화한다.

16개 값의 큰 순서대로 정렬(sorting)하여 스트로크 특징(stroke feature)을 선택한다(704).

여섯 번째 과정은, 넌-스트로크(Non-stroke) 부분의 특징 추출 과정이다(207)

즉, 상기 네 번째 과정에서 얻어진 누적된 그물눈(Mesh) 특징 값(604)을 가지고 넌-스트로크(non-stroke) 부분의 특징을 구하는 과정은 다음과 같다.

그물눈(mesh)의 상,하,좌,우측 좌표(경계좌표)를 제외한 내부 14 X 14 그물눈(mesh) 좌표를 총 9개 영역으로 분할한다(801).

각 9개의 영역은 5 X 5 그물눈(mesh) 4개, 5 X 4 그물눈(mesh) 4개, 4 X 4 그물눈(mesh) 1개로 구성된다.

총 9개 영역의 배경 누적빈도와 해밍 거리(Hamming distance) 누적 값을 계산하여 이 두 값중 최고 값을 지정하여 선정한다(802,803).

총 9개 위치의 가중치 합을 일정한 정수 값으로 정규화한다.

9개 값의 큰 순서대로 정렬(sorting)하여 넌-스트로크 특징(non-stroke feature)을 선택한다(804).

일곱 번째 과정은, 문자 특징 추출 과정이다(208).

즉, 상기 다섯 번째 과정과 여섯 번째 과정을 통하여 얻어진 특징벡터(704,804)를 가지고 본 발명에서는 각 문자에 대하여 총 25 차원의 특징벡터를(좌표값, 누적빈도값) 추출하여 데이터베이스를 구축한다.

이러한 특징벡터에 대한 데이터베이스를 이용하므로써, 다양한 형태의 다중언어의 입력 글자의 크기나 변형에 관계없이 인식률을 향상시킬 수 있다.

이상에서 설명한 본 발명은, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 본 발명의 기술적 사상을 벗어나지 않는 범위내에서 여러 가지 치환, 변형 및 변경이 가능하므로 전술한 실시예 및 첨부된 도면에 한정되는 것이 아니다.

상기와 같은 본 발명에서 제시한 문자 특징 추출 방법에 의하면, 그물눈에서의 글자 부분과 배경 부분 모두에 대하여 특징 값을 취하므로 다양한 형태의 다중언어의 입력 글자의 크기나 변형에 관계없이 인식률을 향상시킬 수 있는 우수한 효과가 있다.

Claims

다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치에 있어서,

입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 데이터베이스 구축 수단;

상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 변환 수단;

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 특징 추출 수단; 및

상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 문자 특징 추출 수단

을 포함하는 문자 특징 추출 장치.
제 1 항에 있어서,

상기 데이터베이스 구축 수단은,

입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 여러 문자의 크기로 출력하여 표준 입력문자 셋을 구축하는 표준 입력 문자 셋 구축 수단; 및

상기 표준 입력 문자 셋을 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 표준 문자 영상 데이터베이스 구축 수단

을 포함하는 문자 특징 추출 장치.
제 1 항에 있어서,

상기 변환 수단은,

상기 표준 문자 영상 데이터베이스의 각각의 문자 영상에 대하여 48 X 48 사이즈의 크기로 정규화하는 정규화 수단; 및

크기 정규화한 상기 각각의 문자 영상들에 대하여 그물눈 모양의 특징으로 변환하는 특징 변환 수단

을 포함하는 문자 특징 추출 장치.
제 1 항 내지 제 3 항 중 어느 한 항에 있어서,

상기 특징 추출 수단은,

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분에 대한 특징을 추출하는 스트로크 특징 추출 수단; 및

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 배경부분에 대한 특징을 추출하는 넌-스트로크 특징 추출 수단

을 포함하는 문자 특징 추출 장치.
다국어 인쇄체 문서인식을 위한 문자 특징 추출 장치에 적용되는 문자 특징 추출 방법에 있어서,

입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 제 1 단계;

상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 제 2 단계;

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 제 3 단계; 및

상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 제 4 단계

를 포함하는 문자 특징 추출 방법.
제 5 항에 있어서,

상기 제 1 단계는,

입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 여러 문자의 크기로 출력하여 표준 입력문자 셋을 구축하는 제 5 단계; 및

상기 표준 입력 문자 셋을 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 제 6 단계

를 포함하는 문자 특징 추출 방법.
제 5 항에 있어서,

상기 제 2 단계는,

상기 표준 문자 영상 데이터베이스의 각각의 문자 영상에 대하여 48 X 48 사이즈의 크기로 정규화하는 제 5 단계; 및

크기 정규화한 상기 각각의 문자 영상들에 대하여 그물눈 모양의 특징으로 변환하는 제 6 단계

를 포함하는 문자 특징 추출 방법.
제 5 항 내지 제 7 항 중 어느 한 항에 있어서,

상기 제 3 단계는,

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분에 대한 특징을 추출하는 제 7 단계; 및

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 배경부분에 대한 특징을 추출하는 제 8 단계

를 포함하는 문자 특징 추출 방법.
다국어 인쇄체 문서인식을 위한 문자 특징 추출을 위하여, 대용량 프로세서를 구비한 문자 특징 추출 장치에,

입력된 각종 폰트의 다국어 문자들을 표준양식에 의하여 출력한 후 그 결과를 영상입력 장치로 입력받아 표준 문자 영상 데이터베이스를 구축하는 제 1 기능;

상기 표준 문자 영상 데이터베이스의 각각의 문자 영상을 일정한 크기로 정규화하여 그물눈 모양의 특징으로 변환하는 제 2 기능;

상기 그물눈에서의 상기 각각의 문자들에 대한 지형적인 정보들 중 글자부분과 배경부분에 대한 특징을 추출하는 제 3 기능계; 및

상기 추출된 특징으로부터 상기 각각의 문자들의 특징을 추출하여 저장하는 제 4 기능

을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.