KR200331200Y1

KR200331200Y1 - 프렉탈 차원을 이용한 문자인식장치

Info

Publication number: KR200331200Y1
Application number: KR20-2003-0024170U
Authority: KR
Inventors: 손영우
Original assignee: 손영우
Priority date: 2003-07-25
Filing date: 2003-07-25
Publication date: 2003-10-22

Abstract

본 고안은 프렉탈 차원을 이용한 문자인식장치를 개시한다. 본 고안의 장치 문자 이미지를 입력하기 위한 이미지 스캐너와, 상기 입력된 문자 이미지를 전처리하기 위한 전처리기와, 상기 전처리된 문자 이미지로부터 m개의 1차 특징을 추출하기 위한 특징 추출기와, 상기 추출된 m 특징값들을 다음 어트랙트 변환함수 H'(X_k+1, Y_k+1) = {y_k+ 1 - a(x_k+ cf_i)², b(x_k+ cf_i)}(여기서, k = 0, 1 2, 3, ---, n, i = 1, 2, 3, ---, m , a = 0.55, b = 0.3)에 의해 문자 어트랙터 궤적을 생성하는 문자 어트랙터와, 얻어진 문자 어트렉터를 프랙탈 차원 해석에 따라 정보 차원값과 정보비트를 산출하는 프랙탈 차원 해석기와, 정보 차원값에 의해 문자를 대분류하고 상기 정보 비트값에 의해 문자를 상세분류하여 문자를 인식하는 문자인식기를 포함한다.

따라서, 본 고안에서는 오분류 빈도가 높은 혼동문자들을 고정도로 인식할 수 있다.

Description

프렉탈 차원을 이용한 문자인식장치{apparatus for recognizing character using fractal dimension}

본 고안은 프렉탈 차원을 이용한 문자인식장치에 관한 것으로서 특히 유사한 문자들 사이의 특징 패턴의 미세한 차이를 인식하기 위하여 미세한 차이를 고감도 식별할 수 있는 문자 어트랙터 생성장치에 관한 것이다.

문자 인식 기술은 스캐너나 펜 입력기기 등을 이용하여 입력된 문서 영상으로부터 각종 문자 정보를 분리, 인식하는 수단을 제공함으로써, 수작업에 의존하던 자료 입력 방식을 자동화할 수 있다.

따라서 한글, 한자, 영어 등의 문자 인식에 관한 많은 고안이 있었으며, 신문이나 잡지 보고서 등의 복잡한 문서를 인식하기 위한 고안도 활발히 진행되고 있다. 지금까지 고안된 대표적인 문자 인식 방법으로는 저장된 문자 영상과의 정합정도를 인식하는 원형 정합법(Template Matching Method), 문자 영상의 특징 벡터의유클리디안 거리로 인식하는 통계적 방법(Statistical Method), 그리고 문자를 구성하는 요소들의 구조적 연관성을 비교하여 인식하는 구조적 방법(Structural Method) 등이 있다.

1990년대에 와서는 한글 문자를 인식하는데, 어느 정도의 변형이나 불완전한 입력에 대해서도 잘 작동하는 신경망을 사용하려는 여러 시도가 있었다.

하지만 한글은 가능한 문자의 수가 큰 규모일 뿐만 아니라, 비교적 적은 수의 기본 자모가 서로 결합하여 문자를 만들기 때문에 문자간에 유사성이 커서 한글문자 인식은 매우 어려운 문제이다. 이러한 유사성이 큰 문자는 오인식을 발생시키는 혼동문자로서, 종래에는 오인식된 문자를 수정하는 후처리 과정에서 처리를 하거나 혼동문자 인식부를 따로 두어 해결하였다, 또한 종래에는 한글 찾기순 상위 990자를 대상으로 문자의 망특징 히스토그램 값을 이용하여 어트랙터를 구성하고, 어트랙터의 차원값을 구한 다음, 문자 자체의 박스 카운팅차원(Box-Counting Dimension)을 함께 특징으로 사용하여 96.03%의 인식율을 보였다.

기존 고안의 문자 인식 방법은 주로문자 영상의 망특징 또는 투영 특징, 교차 거리 특징 등을 추출하여 신경망을 이용하여 인식하는 방법이 대부분이다.

하지만 이들 대부분이 신경망의 일반화 능력에 너무 의존하였기 때문에 한글과 같이 문자의 모양이 단순하면서도 유사성이 많은 혼동문자에 대해서는 많은 오인식을 유발하였다. 따라서 이러한 혼동 문자를 인식하기 위해서는 새로운 문자 특징 추출 방법이 필요하다.

본 고안의 목적은 상술한 종래 기술의 문제점을 해결하기 위하여

유사한 문자들 사이의 특징 패턴의 미세한 차이를 인식하기 위하여 미세한 차이를 고감도 식별할 수 있는 카오스 이론의 스트레인지 어트랙터(Strange Attractor)를 생성하는 에농 함수를 이용하여, 문자 어트랙터를 생성할 수 있는 문자 어트랙터 생성장치를 제공하는 데 있다.

도 1은 본 고안에 의한 프렉탈 차원을 이용한 문자인식장치의 블록도.

도 2는 본 고안의 한글 6형식의 구조를 설명하기 위한 도면.

도 3은 3×3 마스크를 나타낸 도면.

도 4는 연결성을 설명하기 위한 도면.

도 5는 본 고안에 의한 망특징을 추출하기 위한 서브 영역 구조를 나타낸 도면.

도 6은 도 5의 망특징의 추출결과를 나타낸 그래프.

도 7은 본 고안에 의한 투영특징을 추출하기 위한 서브 영역 구조를 나타낸 도면.

도 8은 도 7의 투영특징의 추출결과를 나타낸 그래프.

도 9는 본 고안에 의한 교차거리 특징을 추출하기 위한 서브 영역 구조를 나타낸 도면.

도 10는 도 9의 교차거리 특징의 추출결과를 나타낸 그래프.

도 11는 에농 시스템의 시계열과 어트랙터 궤적을 나타낸 도면.

도 12 및 도 13은 본 고안에 의한 혼동문자의 문자 어트랙터를 비교하기 위한 도면들.

도 14는 한글 6형식 혼동문자 '훨'에 대한 어트랙터의 Box-Counting의 예를 나타낸 도면.

*도면의 주요부분에 대한 부호의 설명*

10 : 이미지 스캐너 20 : 전처리기

30 : 특징 추출기 40 : 문자 어트렉터

50 : 프렉탈 차원 해석기 60 : 문자인식기

상기 목적을 달성하기 위하여 본 고안의 장치는 문자 이미지를 입력하기 위한 이미지 스캐너와, 상기 입력된 문자 이미지를 전처리하기 위한 전처리기와, 상기 전처리된 문자 이미지로부터 m개의 1차 특징을 추출하기 위한 특징 추출기와, 상기 추출된 m 특징값들을 다음 어트랙트 변환함수 H'(X_k+1, Y_k+1) = {y_k+ 1 - a(x_k+ cf_i)², b(x_k+ cf_i)}(여기서, k = 0, 1 2, 3, ---, n , i = 1, 2, 3, ---, m , a = 0.55, b = 0.3)에 의해 문자 어트랙터 궤적을 생성하는 문자 어트랙터와, 얻어진 문자 어트렉터를 프랙탈 차원 해석에 따라 정보 차원값과 정보비트를 산출하는 프랙탈 차원 해석기와, 정보 차원값에 의해 문자를 대분류하고 상기 정보 비트값에 의해 문자를 상세분류하여 문자를 인식하는 문자인식기를 포함한다.

이하, 첨부한 도면을 참조하여 본 발명의 바람직한 실시예를 구체적으로 설명하고자 한다. 이 실시예는 이 기술에 숙련된 자들이 본 발명을 실시할 수 있게 충분히 상세하게 기술한다.

도 1을 참조하면, 본 고안의 프렉탈 차원을 이용한 문자인식장치는 이미지스캐너(10), 전처리기(20), 특징 추출기(30), 문자 어트렉터(40), 프렉탈 차원해석기(50) 및 문자인식기(60)를 포함한다.

이미지 스캐너(10)는 일반적인 이미지 스캐너로서 문서 등에 인쇄된 문자 나 숫자 등을 스캐닝하여 문자 이미지 데이터를 생성한다.

전처리기(20)는 소프트웨어적으로 구성하거나 전처리용 전용칩으로 제공될 수 있다. 입력된 개별문자 이미지를 평활화, 선형화 및 정규화 처리를 수행한다.

특징 추출기(30)는 전처리된 개별 문자 이미지로부터 특징 추출 알고리즘을 수행하여 망, 투영 및 교차거리 특징 등을 추출한다.

문자 어트렉터(40)는 추출된 특징값들을 1차원적인 시계열로 정리하고 정리된 시계열을 변환함수를 통하여 2차원 어트렉터 궤적으로 변환한다.

프렉탈 차원 해석기(50)는 복수의 서브 영역들에서 2차원 어트렉터 궤적의 분포율을 산출하여 정보 차원값과 정보 비트값을 생성한다.

문자인식기(60)에서는 정보 차원값에 응답하여 문자의 대분류하고 정보 비트값에 응답하여 문자의 상세분류하여 최종적으로 문자를 인식한다.

이하, 본 고안에 의한 문자 어트렉트 생성 알고리즘을 설명하고자 한다.

1. 한글의 구조 분석

한글은 조합 문자로서 기본 자모 24자(자음 14자, 모음 10자)가 초성, 중성, 종성으로 반복 조합되어 구성된다. 이론적으로 조합 가능한 한글 문자는 총 11,172자 이나, 실제로 많이 사용되는 자수는 1,500자 내외이다.

한글은 조합 문자이면서 한자와는 달리 모음의 배치와 받침의 존재여부에 따라 문자를 6가지 형식으로 분류하고 있다. 한글 6형식은 1972년 이주근이 제안한 정의로써 초성, 중성, 종성의 배치에 따라 도 2의 6개의 형식으로 구분되어 진다.

〈 표 1 〉에서 알 수 있듯이 2형식인 가로모임 받침글자가 약 45.5%정도로 많이 쓰이고, 3형식인 세로모임 글자는 91자에 지나지 않음을 알 수 있다.

[표 1]

이처럼 한글은 위에서 언급한 6형식에 따라 자음과 모음의 배치가 정해진 글자이며 매우 과학적인 문자이나 구조적으로 유사성이 아주 높아 자소의 추출 및 인식을 행하는 데는 어려움이 많다.

문자의 유사성은 한 문자에 다른 문자가 완전히 포개지고 그 차가 극히 적은 것을 말하는데 이러한 유사성은 구조적 유사성과 위상적(topological) 유사성으로 나눌 수 있다. 즉, 구조적 특성의 예로 "각, 걱, 긱"은 모음에 연결된 횡선분을 제외하고는 완전히 포개어져 인식을 어렵게 하며, 또한 위상적 특성의 예로 "국" 을 180도 회전하면 "논"과 동일하므로 인식에 있어 어려움이 따른다.

따라서 본 고안에서는 한글 문자의 유사성에 따라 오인식 빈도가 높은 혼동문자를 선정하고, 이를 상기 6형식에 따라 분류한 예를 〈 표 2 〉에 나타내었다.

[표 2]

〈 표 2 〉에서 알 수 있듯이 KSC-5601 한글 표준 2,350자 중 혼동 문자 수는 총 305자로, 12.9%를 차지하고 있다. 〈 표 3 〉에는 본 고안에 사용될 혼동문자 그룹을 나타내었다.

[표 3]

2. 전처리

전처리 단계는 문자 특징 추출단계에서 필요한 정보는 강화하고 불필요한 정보는 줄임으로써 문자인식오류를 최소화하는 단계이다. 따라서 전처리 단계에서는 문서 입력시 발생되는 하드웨어적인 잡영을 제거하고, 입력영상의 불완전한 패턴을 직선, 직각화하여 문자의 특징점을 보다 정확하게 찾을 수 있도록 한다. 본 고안에서는 평활화, 선형화, 정규화의 세 종류의 전처리 과정을 거친다.

2-1. 평활화

우선 3×3 마스크에 대한 중심화소와 8방향의 이웃화소를 도 3과 같이 정의한다.

중심화소 P(0)가 0인 경우에 4방향이웃화소 {P(2),P(4), P(6), P(8)} 중 흑화소의 수가 3개 이상일 경우에는 이를 잡음으로 판단하여 P(0)를 1로 설정한다.

중심화소 P(0)가 1인 경우에는 8방향주변화소 {P(1), P(2), … , P(8)} 중에서 흑화소가 2개 미만일 경우 잡음으로 판단하여 P(0)를 0로 설정하며, 2개인 경우에는 그 연결성을 고려하여 도 4에 도시한 바와 같이 보존되어야 할 얇은 선의 성분인가를 판단해서 얇은 선의 성분이면 흑화소를 그대로 유지하고 그렇지 않으면 P(0)를 0으로 설정한다.

8방향 이웃화소가 보존되어야 할 얇은 성분인가를 판단하기 위한 C값을 C = [(P(1) + P(7) + P(8)) - (P(3) + P(4) + P(5))] * [(P(1) +P(2) + P(3)) - (P(5) + P(6) + P(7))]과 같이 설정하여, C값이 0이 되는 경우는 얇은 선의 성분으로 판단하고 0이 아닌 경우에는 잡음으로 판단한다.

2-2. 선형화

평활화된 영상을 직선, 직각화하는 단계로 입력 영상데이터의 불완전성으로 인한 불필요한 특징점 발생을 최소화함으로써 인식률의 향상에 그 목적이 있다. 다음의 〈 표 4 〉와 같이 이웃화소들을 표현할 때, 주목점 S(n) = 1에 대해

① R(n-2) + R(n-1) + R(n) + R(n+1) = 0

② S(n-2) + S(n-1) + S(n) = 1

③ T(n-2) + T(n-1) + T(n) = 3

을 만족하면 R행에서 R(n)을 중심으로 0으로 연결되어 있고, T행에서 T(n)을 중심으로 1로 연결되어 있는 임계열 n-i, n+j를 찾는다. 이렇게 i와 j가구해지면S(n-i)에서부터 S(n+j)까지 총화소수를 세어서 과반수면 임계열내의 모든 화소를 0으로 변환하고 그렇지 않으면 1로 변환한다.

[표 4]

2-3. 정규화

문자의 특징 추출 전단계로써 다양한 문자의 종류와 크기에 적응할 수 있도록 하기 위해 개별 추출된 문자를 정규화 하여야 한다. 입력된 인식 대상의 문자영상을 40 × 40 크기의 영상데이터로 정규화 시킨다.

40 × 40의 크기는 일반 문서의 대부분의 문자인 10 point 크기의 문자를 300dpi의 스캐너로 입력했을 때의 크기이다.

정규화 방법은 일반적으로 선형 정규화방법과 비선형 정규화방법을 고려할 수 있는데 비선형 정규화방법은 문자 영상의 변형을 방지하는 장점이 있으나 알고리즘이 매우 복잡하므로 처리 시간이 많이 소요된다. 그리고 기존의 선형정규화방법은 문자 영상 크기를 축소할 경우 획의 두께가 얇은 획들은 삭제되거나, 반대로 두꺼운 획을 갖는 복잡한 문자의 경우에는 인접한 획들이 서로 붙어서 문자의 특징을 정확하게 추출할 수 없는 단점이 있다. 따라서 본 고안에서는 개선된 선형 정규화 방법을 이용하여 안정된 정규화 패턴을 얻는다.

3. 문자의 1차 특징 추출

문자인식방법은, 특징의 종류에 따라, 2차원문자영상을 그 자체로 이용하는 방법과 문자의 모양을 잘 기술할 수 있는 특징을 추출하여 인식하는 방법으로 나눌 수 있다. 문자영상을 그대로 인식하는 방법은 특징 추출과정을 간소화시킬 수 있으며, 특징추출과정에서 생길 수 있는 정보의 손실을 막을 수 있지만, 인식 과정에서 계산량이 증가하므로 비효율적이다.

다양한 문자 특징추출방법에 대하여 많은 고안이 진행되어 왔으며 대표적인 특징으로 망특징, 투영특징, 교차거리특징 등이 있다.

3-1. 망특징

망 특징(Mesh Feature)은 문자 영상을 수직과 수평축으로 N × M 개의 부 영역으로 나눈 뒤 각 영역 안의 흑화소의 밀도를 나타내며, 이 방법은 부분적인 영상 해석에 유용하다.

본 고안에서는 도 5와 같이 40 × 40의 정규화 데이터에 대해 다음과 같은 크기로 영역을 분할하여 전체 47개 영역에 대하여 각각의 흑화소의 수를 구한다.

(1) 40 × 40 : 1개 영역

(2) 20 × 20 및 중앙(20 × 20) : 5개 영역

(3) 10 × 10 : 16개 영역

(4) 10 × 20 : 8개 영역

(5) 20 × 10 : 8개 영역

(6) 가상영역을 포함한 20 × 20 : 9개 영역

이후 위에 정의한 크기의 메쉬 내에 존재할 수 있는 총 화소수로 나누어 얻은 0과 1 사이의 값을 도 6의 망 특징으로 한다.

3-2. 투영 특징

투영 특징(Projection Feature)은 수직 축으로 N번, 수평축으로 M번 주사했을 때, 만나는 흑화소의 개수를 누적하여 획의 특징을 나타내는 특징이다. 잡음에 영향을 덜 받으며, 동일 축 상에 존재하는 긴 획을 잘 표현한다.

본 고안에서는 도 7과 같은 방법으로 40 × 40의 정규화 데이터에 대해 다음과 같은 크기로 영역을 분할한 후, 전체 22개의 영역으로부터 600개의 특징을 구한다. 도 8에는 구해진 투영특징의 추출결과를 시계열로 나타낸 것이다.

(1) 40 × 40 : 1개 영역 (80개)

(2) 20 × 20 및 중앙(20 × 20) : 5개 영역 (200개)

(3) 10 × 10 : 16개 영역 (320개)

3-3. 교차거리 특징

교차거리 특징(Cross Distance Feature)은 수직 축으로 N번, 수평축으로 M번 주사했을 때, 최초의 흑화소를 만날 때까지의 거리를 구하는 방법이다. 이 방법은 전체적인 외형을 잘 표현하지만, 잡음 성분에 의해 민감한 반응을 보일 수도 있다. 본 고안에서는 도 9와 같은 방법을 이용하여 40 × 40의 정규화 데이터에 대해 상, 하, 좌, 우의 4 방향에서 160개의 특징을 구한다. 도 10에는 구해진 교차거리 특징의 추출결과를 시계열로 나타내 것이다.

3-4 1차 특징값의 재설정

문자 영상으로부터 1차 추출한 총 807개의 망, 투영, 교차거리 특징값에 대해 시스템의 기계적 잡음에 의한 영향을 줄이고, 양질의 정보를 다음 단계인 어트랙터 추출 모델에 전달하기 위해 1차 추출한 개별 문자 특징값(cfi)를 다음과 같이 단계별로 재설정 한다. 여기서 i= 1, 2, 3, .. , 807 이다.

(1) cfi 〈 0.1일 경우, cfi = 0.0로 재설정

(2) 0.1 cfi 〈 0.2 일 경우, cfi = 0.15로 재설정

(3) 0.2 cfi 〈 0.3 일 경우, cfi = 0.25로 재설정

(9) 0.8 cfi 〈 0.9 일 경우, cfi = 0.85로 재설정

(10) cfi 0.9 일 경우, cfi = 1.0으로 재설정 한다.

이와 같이 하여 한 개별 문자에 대해 총 807개의 특징값을 구하고 구해진 특징값을 시계열로 정리한다.

4. 어트랙터 추출 모델

본 고안에서는 카오스 이론을 문자인식에 적용하기 위해 문자 영상으로부터 구한 재설정된 1차 특징을 수정된 에농 시스템에 대입하여 문자 어트랙터를 재구성한 후, 먼저 어트랙터 궤도의 분포를 정성적으로 분석함으로써 혼동문자들이 구별 가능한지를 살펴본다.

4-1. 제안된 시스템의 어트랙터 추출 모델

에농 어트랙터는 로렌츠 시스템의 동력학계(Dynamic System)를 단순화한 모델로 부메랑과 같은 모양을 하고 있다. 에농 시스템은 1차원의 동력학계에서 2차원적인 변환에 의해 고차원의 스트레인지 어트랙터를 이끌어 낸다. 또한 에농 시스템은 log 변환에서 발생하는 카오스에 대한 분석과 유사하게 단순한 반면, 로렌츠 어트랙터와 같이 좀 더 복잡한 어트랙터의 특징도 포함하고 있다. 2차원에서 발생하는 에농 시스템의 팽창과 수축(Stretch-and-Fold) 작용은 x 와 y의 2차원 좌표로 표현할 수 있다. 그러므로 에농 시스템의 변환 함수는 평면에서 발생하는 어핀 변환(Affine Transformation)과 유사하게 동작한다. 에농 시스템의 변환 함수 H(X, Y)는 다음의 수학식2과 같다.

[수학식2]

에농 시스템은 log변환과 유사하게 임의의 상수인 a, b 그리고 시작점인(x0, y0)에 민감하게 반응한다. 다시 말해서 카오스 이론의 특징인 초기 조건에 민감한 의존성을 보여준다. 에농은 초기 조건으로 a=1 4, b=0.3 그리고 (x0, y0) = (0, 0) 으로 하였다. 시작점 (x0, y0)와 피드백에 의해 발생하는 점들로 어트랙터가 재구성된다. 이러한 피드백이 있는 변환 함수 H(Xk+1, Yk+1)는 다음의 수학식3과 같다.

[수학식3]

도 11에는 에농 시스템의 x, y축 시계열 데이터와 재구성된 어트랙터를 나타내었다.

본 고안에서는 망, 투영, 교차거리 특징을 이용하여 추출한 문자 영상의 1차 특징(cfi)을 반영하기 위해, 에농 어트랙터 생성 모델을 수정하여 문자 어트랙터를 재구성하였다. 수정된 에농 시스템의 변환 함수 H'(Xk+1, Yk+1)는 다음 수학식4와같다.

[수학식4]

여기서, k = 0, 1, 2, 3, ..., n 이며, i =1, 2, 3, .. 807 (1차 특징 추출값)이다.

4-2. 시스템의 매개변수 설정

아울러, 본 고안에서는 문자특징을 잘 반영하는 시스템의 매개변수를 찾기 위해 반복 실험하였다. 실험에서는 매개변수 b를 0.3으로 고정해 놓고, a를 조정하는 방법을 선택하였다. 〈 표 5 〉에는 매개변수 설정실험 결과를 나타낸다.

본 고안에서는 최적의 문자 어트랙터를 재구성하는 파라미터로 a=0.55, b=0.3을 선정하였다.

[표 5]

도 12 및 도 13을 참조하면, 본 고안에 의한 혼동문자들 간의 어트랙터를 구성하는 점들이 서로 상이한 궤적을 그리고 있어 정성적으로 서로 다른 문자임을 구별할 수 있다.

5. 프랙탈 차원 특징 추출

재구성된 문자 어트랙터로부터, 카오스적 특성을 정량적으로 평가하기 위해프랙탈 차원을 구한다. 본 고안에서는 프랙탈 차원을 나타내는 Box-Counting Dimension과 Natural Measure, 그리고 Information Bit, Information Dimension값을 구하여 문자의 최종 인식을 수행한다.

5-1. 프랙탈 차원(fractal dimension)

많은 종류의 자연물에서 찾아볼 수 있는 형상은 유클리드 기하학으로는 해석하기 어려운 매우 복잡함을 가지고 있다. 예를 들면, 물체의 표면, 산맥과 해안선의 형상 및 구름의 모양은 불규칙한 것으로 보이지만 일정한 규칙하에 자기 복제를 순환적으로 반복하고 있으며, 자기 유사성(self-similarity)과 반복성의 의미로 해석되는 것을 프랙탈 구조라고 한다.

프랙탈 구조는 재구성된 어트랙터에서의 공간 채움성의 척도(measure space filling)와 복잡성을 나타내는 프랙탈 차원(Fractal Dimension)으로 평가되며 실수의 형태로 나타나며, 표면 거칠기와 같은 미소구조부터 지형과 같은 확대된 구조까지 복잡한 형상을 해석하는 유용한 수단으로 사용된다. 이처럼 프랙탈 차원은 시계열 신호에 대하여 재구성된 어트랙터의 기하학적 특징을 표현하며, 신호의 카오스적인 정도에 따라 그 값이 달라진다. 따라서 어트랙터의 고유한 특성으로 프랙탈 차원을 사용할 수 있어 동역학 시스템의 거동을 정량화 하는 척도로 많이 이용되고 있으며, 미세한 어트렉터의 변동을 프랙탈 차원값에 반영한다.

5-2. Box-Counting Dimension

Box-Counting Dimension은 모든 과학 분야에서 가장 많이 사용되는 측정 방법으로 컴퓨터에 의해 간단하며 자동적인 계산이 가능하다. 평면이나 삼차원 공간상에 존재하는 점이나 곡선 또는 형상을 크기가 s인 격자 N(s)로서 전체를 분할하였을 때, 요소가 포함된 격자의 개수는 격자의 크기에 반비례하여 늘어나게 된다.

본 고안에서는 Box-Counting Dimension을 계산하기 위해서, 먼저 재구성된 문자 어트랙터를 포함하는 전체 사각형 영역을 정의하고 이 영역을 1로 정의하여 정해진 크기인 s로 전체 영역을 분할한다. 그리고는 어트랙터를 포함하는 분할 영역의수를 헤아린다. 이렇게 어트랙터를 포함하는 분할 영역의 수를 N(s)라 하면 Box-Counting Dimension, Df 는 다음의 수학식 5로부터 구한다.

[수학식5]

도 14에는 한글 6형식 혼동문자 '훨'에 대한 어트랙터의 Box-Counting의 예를 나타내었다. 한글 '훨'의 경우에는 박스의 크기 S를 1/8로 하여 전체 영역을 분할한 경우 Box-Counting 차원, Df 는 1.486477이다.

5-3. Natural Measure

앞서 구한 Box-Counting Dimension은 단지 어트랙터를 포함하고 있는 분할영역의 수만을 카운팅하므로 어트랙터의 차원을 실제 반영한다고 보기는 어렵기 때문에 미세한 패턴을 분리하는 데 곧바로 적용하기에는 문제가 있다. 즉, 분할된 영역이 어트랙터를 포함하는지 또는 포함하지 않는지 만을 나타내므로 정보를 손실하는 경우가 발생한다. 따라서 Box-Counting Dimension 방법의 이러한 결점을 보완하기 위해서는 분할된 영역들이 얼마나 많은 어트랙터의 궤도를 포함하고 있느냐에 따라 가중치를 가져야 한다. 즉 분할 영역내의 어트랙터가 전체 어트랙터 영역을 기준으로 할 때 어느 정도의어트랙터를 포함하고 있는지를 백분율로 나타낼 수 있는데 이를 Natural Measure,(B)라고 하고 다음의 수학식6으로부터 구한다.

[수학식6]

여기서는 x가 분할된 영역 B 안에 있으면 1, 아니면 0의 값을 가진다. 즉 다음과 같다.

그리고는 전체 어트랙터를 구성하는 영역중 분할 영역 B 에 포함되어 있는 궤도의 수를 나타낸다.

본 고안에서는 다음의 수학식7을 이용해서 Natural Measure 특징값을 추출하였다.

[수학식7]

여기서 N은 전체 분할된 영역을 나타내고, n은 전체 어트랙터를 구성하는 화소의 수를 나타낸다.

〈 표 6 〉에는 한글 6형식 혼동문자 '훨'에 대한 어트랙터의 Natural Measure 계산 결과를 나타낸다.

[표 6]

5-4. Information Bit ＆ Dimension

Information의 이론적인 기반은 1948년 Clande Shannon에 의해 제안되었다. Natural Measure에 의해 분할영역 내에 포함되어 있는 어트랙터의 가중치를 계산하므로써 단순한 Box-Count 방법을 논리적인 접근으로 바꿀 수 있다. 따라서 어트랙터가 자주 지나가는 부분은 거의 지나가지 않는 영역에 비해 큰 영향을 가질 것이다. 어트랙터를 구성하는 한 점은 Natural Measure의 기준에 의해 무작위로 추출된다. Information Bit는 분할 영역 S안에 어트랙터가 존재하는 올바른 box가 발견될 때까지 질문되어지는 질문의 평균 개수를 의미한다. 어느 포인트가 어디에 있는지를 알기 위한 최적의 방법을 찾는 방법으로 반씩 나누어 질문을 해 보는 방법을 생각할 수 있다. 선택된 절반의 박스에 포인트가 존재하는가 아닌가를 알아보고 존재할 경우에는 선택된 범위에서, 존재하지 않을 경우에는 선택되지 않은 범위에서 질문을 계속 해 나감으로써 원하는 포인트가 포함 되어 있는 box를 선택 할 수 있는 방법을 의미한다.

이러한 Information Bit, I(s) 는 Natural Measure로 부터 구해진 값을 이용하여 다음의 수학식8로부터 구한다.

[수학식8]

Information Bit는 상기 수학식 8과 같이 log의 밑면을 2를 기준으로 한 자연대수를 취하여 구해지는 데, 이러한 자연대수를 취하는 이점으로는 I(s)가 비트(bit) 단위로 주어진다는 것이다.

본 고안에서는 다음 수학식9를 이용하여 각 영역별 Information Bit를 계산한 후, 수학식10를 이용하여 전체 I(s)를 구하였다.

[수학식9]

[수학식10]

여기서 Pk = mk / n 으로 mk는 k번째 분할 영역에 포함되어 있는 화소의 수이고, n은 전체 어트랙터를 구성하는 화소의 수이다. 그리고 N은 전체 분할 영역을 나타낸다.

또한 Information Bit는 분할 영역 S의 크기가 작으면 작을수록 더 많은 정보를 얻을 수 있다. 즉 어트랙터의 분할 영역을 두 배로 작게 쪼개면 그 많큼 더 많은 정보를 얻을 수 있다. 〈 표 7 〉 에는 S=1/8일 경우의 한글 "훨"에 대한 각 영역별 Information Bit계산 결과를 나타낸다.

[표 7]

계산결과, 6형식 '훨'의 경우 s= 1/8일 경우 I(s)= 3.403446 이며, s= 1/16일 경우에는 I(s)=4.418930 이다.

한편 Information Dimension, DI는 정보 차원을 의미하며, 앞서 구한 Information Bit를 이용하여 다음의 수학식 11로부터 구한다.

[수학식11]

계산 결과, 6형식 '훨'의 경우 s= 1/8일 경우에는 DI (8)= 1.134482 이고, s= 1/16일 경우에는DI (16)= 1.04732 이다.

이처럼 Information Dimension 은 프랙탈 차원과 마찬가지로 비정수 값으로 나타나며, 고유 에농 어트랙터를 대상으로 한 정보 차원 계산값은 1.230.02 이며, 프랙탈 차원값은 1.280.01이다.

본 고안에서는 문자 영상의 프랙탈 차원 특징으로는 전체 어트랙터 영역 중 분할된 영역(S) 내에 얼마나 많은 어트랙터를 포함하는지를 백분율로 나타내는 Natural Measur값을 토대로, 값의 변화 폭이 적은 Information Dimension 값을 구하여 대분류 특징으로 삼는다.

또한 상세 분류에는 상대적으로 변화 폭이 큰 Information Bit를 이용하여 최종 문자를 인식한다.

혼동 문자 그룹 Box counting Dimension 값의 분포 범위는 1.194(쌈) ~ 1.619(푯)으로 나타났다. 또한, Information Dimension값의 분포는0.852(맛) ~ 1.204(릎)으로 나타났으며, 이를 이용하여 0.05 단계로 그룹화함을 원칙으로 하나, 이때 그룹에 속한 문자수가 10개 미만 일 경우에는 0.05씩 증가 시켜 가면서 그룹화 한다. 따라서 혼동문자 그룹의 경우는 총 5개의 그룹으로 대분류 하였다. 그룹당 문자수는 최소 22자, 최대 114자 이다. 또한 상세 분류에 사용될 Information Bit값의 분포는 2.557(맛) ~ 3.612(릎)으로 나타났다.

검토결과, 재구성된 개별 문자 어트랙터로부터 프랙탈 차원을 나타내는 Information Dimension 과 Information Bit값을 최종 문자 특징으로 이용함으로써, 서로 근소한 차이(0.000003 이내)를 보이는 '죈'과 '혤' 두 글자를 제외하고는 모두 분류가 가능해 99.3%의 분류율 나타냈다.

재구성된 문자 어트랙터의 프랙탈 차원값은 Box Counting 크기 S값에 따라 달리 나타난다. 혼동문자 그룹뿐만 아니라 이를 확장한 한글 2,350자에 대한 최적의 문자 영상을 반영하는 특징값을 구하기 위하여, 재구성된 문자 어트랙터로부터 Box Counting 크기 S값의 변화에 따른 문자 영상의 프랙탈 차원의 변동 폭을 조사한다.

S값의 변화에 따른 각각의 Box Counting Dimension과 Natural Measure, Information Bit, Information Dimension 등을 차례로 구한 후, 이를 비교 분석하여 최적의 S값을 구한다. 또한 분류 및 인식은 혼동문자와 마찬가지로 대분류에는 Information Dimension 값을, 상세 분류에는 Information Bit를 이용하여 최종 문자를 인식한다.

Box count의 크기를 나타내는 S값을 1/4 ∼ 1/16까지 변화시켜 가며 실험한 결과, Box counting Dimension과 Information Dimension 값은 약간 변동은 있으나, 거의 안정되어 있다고 볼 수 있는 반면에 Information Bit값은 민감하게 변화한다. 따라서 대분류 그룹 수는 6∼7개로 큰 차이가 없으나, 개별 문자들의 소속 그룹이 부분적으로 달라지는 경우가 발생한다. 아래의 〈 표 8 〉에는 S값에 크기에 따른 그룹수 및 그룹별 최소, 최대 차원값을 나타내는 문자를 나타내었다

[표 8]

종합적으로 분석 결과 S=1/4 일 경우에는 Box count의 크기를 너무 크게 설정함으로써, 개별 문자 어트랙터의 특징을 제대로 반영한다고 볼 수 없으며, 반대로 S=1/16일 경우에는 상대적으로 Box count의 크기를 너무 작게 설정함으로써, 개별 문자의 어트랙터의 특성 변화에 너무 민감하게 반응한다. 따라서 한글 문자 어트랙터 분석에 있어 최적의 Box count 크기는 개별 문자 어트랙트의 특성을 가장 잘 반영하고 있다고 판단되는 S=1/8이 적당하다. 따라서 KSC 5601 한글 2,350자에대하여 실험한 결과 99.49%의 분류율을 보였다.

상술한 본 고안의 실험결과 한글 2,350자에 대하여 99.49%의 분류율을 나타내어 제안된 방법의 유효성을 보였다. 본 고안에서는 기존의 어트랙터 구성 방법과는 다른 방법으로 문자 패턴에서의 카오스 현상을 찾기 위해 노력하였다. 문자 인식 분야 뿐만 아니라 지문 인식, 얼굴 화상 인식, 서명 인식 등 개인 인증 분야에 폭 넓게 응용할 수 있다.

Claims

문자 이미지를 입력하기 위한 이미지 스캐너;

상기 입력된 문자 이미지를 전처리하기 위한 전처리기;

상기 전처리된 문자 이미지로부터 m개의 1차 특징을 추출하기 위한 특징 추출기; 및

상기 추출된 m 특징값들을 다음 어트랙트 변환함수 H'(X_k+1, Y_k+1)에 의해 문자 어트랙터로 변환하는 문자 어트랙터;

H'(X_k+1, Y_k+1) = {y_k+1 - a(x_k+cf_i)², b(x_k+ cf_i)}

(여기서, k = 0, 1 2, 3, ---, n

i = 1, 2, 3, ---, m

a = 0.55, b = 0.3이다. )

상기 얻어진 문자 어트렉터를 프랙탈 차원 해석에 따라 정보 차원값과 정보비트를 산출하는 프랙탈 차원 해석기; 및

상기 정보 차원값에 의해 문자를 대분류하고 상기 정보 비트값에 의해 문자를 상세분류하여 문자를 인식하는 문자인식기를 구비한 것을 특징으로 하는 프랙탈 차원을 이용한 문자인식장치.
제1항에 있어서, 상기 특징값들은 각 개별문자의 망, 투영 및 교차거리를 포함하는 것을 특징으로 하는 프랙탈 차원을 이용한 문자인식장치.
제1항에 있어서, 상기 프랙탈 차원 해석시 어트랙터 박스를서브 영역으로 분할하는 것을 특징으로 하는 프랙탈 차원을 이용한 문자인식장치.