KR100317350B1

KR100317350B1 - 신경망을이용한문자인식방법

Info

Publication number: KR100317350B1
Application number: KR1019940033152A
Authority: KR
Inventors: 이영태
Original assignee: 구자홍; 엘지전자주식회사
Priority date: 1994-12-07
Filing date: 1994-12-07
Publication date: 2002-04-24
Also published as: KR960025219A

Abstract

본 발명은 신경망을 이용한 문자인식방법에 관한 것으로, 종래에는 신경망을 이용한 문자인식시스템에서 특징추출방법에는 정규화된 영상을 그대로 사용하는 경우 많은 입력수로 인하여 인식시간이 길어지고 문자의 두께변화에 적응하지 못하게 되는 점과, 교차거리특징의 경우 문자의 외곽모양을 표현하고 있지만 문자의 내부 모양은 구별하지 못한다는 등의 문제점이 있다. 따라서 본 발명은 오차성능지수를 새롭게 포함하여 오차역전달법에 의해 신경회로망을 학습시리즈로서 학습성능을 향상시키고 문자인식성능을 향상시키도록 한다.

Description

신경망을 이용한 문자인식방법

본 발명은 문자인식시스템의 인식률을 향상시키기 위한 것으로, 특히 신경회로망의 학습성능을 향상시키고 학습속도를 개선할 수 있도록 한 신경망을 이용한 문자인식방법에 관한 것이다.

종래 문자인식방법은 제 1 도에 도시된 바와같이 스캐너로 부터 문자입력시 그 문자로 부터 문자열분리 및 문자영역을 추출하는 제l단계와, 상기 제1단계에서 분리된 문자의 특징을 추출하는 제2단계와, 상기 제2단계에서 추출된 특징들을 분류하는 제3단계와, 상기 제3단계에서 추출된 특징들로 부터 문자를 인식하는 제4단계로 이루어진다.

상기에서와 같은 단계로 인식되는 문자인식에 대하여 살펴보면 다음과 같다.

스캐너로 부터 입력문자에 대한 2진영상이 입력되면 그 영상을 입력받는 문자분리부에서 2진영상에 대하여 문서의 수펑방향에 대한 누적흑화소를 구하여 이 구해진 값과 임계값을 비교하여 문자열의 상하위치를 구해 문자열을 분리한다.

이와같이 문자열이 분리되고 나면 상기에서와 같은 방법으로 수직방향의 누적 흑화소를 구하고 그 구한값과 임계값을 비교하여 문자영역을 추출하여 특징추출부로 전달하여 준다.

그러면, 상기 특징추출부에서는 문자인식을 위한 특징을 추출하기 위하여 먼저 분리된 개별문자 영상을 정규화하고, 이 정규화된 영상으로부터 교차거리 투영, 교차값등을 사용하여 특징을 추출하는데, 여기서 교차거리특징은 문자영상의 경계선으로 부터 스트로크와 만나는 점까지의 거리이고, 투영특징은 수직축과 수평축으로 검출선을 주사하였을때 만나는 검은 화소수를 더하여 구하며, 교차특징은 수직과 수평방향으로 검출선을 주사하였을때 만나는 스트로크의 수를 더한값이다.

상기에서와 같이 교차거리특지이나 투영 및 교차특징을 이용하여 추출된 특징을 신경회로망에 학습시키기 위해 형태가 비슷한 패턴들의 평균값을 사용하여 입력값을 구하여 사용하고, 출력은 서로다른 패턴들과 구별되도륵 인위적인 값을 정하여 사용한다.

상기에서 얻어진 특징들을 문자인식부로 전달하면, 상기 문자인식부에서는 입력된 특징들을 분류하고 그 분류된 특징들로 부터 문자를 인식하고 인식된 문자를 출력시킨다.

그러나, 이와같은 종래의 기술에 있어서 신경망을 이용한 문자인식시 스템에서 특징추출방법에 많은 단점을 가지고 있는데, 먼저 정규화된 영상을 그대로 사용하는 경우 많은 입력수로 인하여 인식시간이 길어지고 무자의 두께변화에 적응하지 못하게 되는 점과, 교차거리특징의 경우 문자의 외곽모앙을 표현하고 있지만 문자의 내부 모양은 구별하지 못한다는 점과, 투영특징의 경우 문자의 두께변화에 적응하지 못하는 점과, 교차특징의 경우 스트로크 두께변화에는 잘 적응하지만 잡음에 의한 변화에 민감한 단점을 갖고 있다.

또한, 특징들의 장단점을 이용하여 복합적으로 특징들을 구성하고 있지만 많은 특징들을 입력으로 사용함으로서 문자인식 시간이 길어지고, 특징분류에서 출력값을 인위적으로 결정함으로써 입력 및 출력의 상호관계가 많은 비선형요소를 포함하고 있을 수 있으므로 신경망의 학습률을 저하시키는 요인이 되어서 문자인식성능을 저하시키며, 또한 패턴을 학습시킬때 오차성능지수는 패턴의 특성에 관계없이 학습시킴으로서 학습성능이 특정한 패턴에 대해서는 좋지못한 결과를 나타내는 문제점이 있다.

따라서, 본 발명의 목적은 문자를 고속으로 인식하고 인식률을 향상시킬 수 있또록 한 신경망을 이용한 문자인식방법을 제공함에 있다.

상기 목적을 달성하기 위한 본 발명은 문서를 이진영상으로 입력하는 단계와, 상기 단계에서 입력된 이진영상으로 부터 문자열 및 개별문자를 분리하는 단계와, 상기 단계에서 분리된 개별문자 영상의 특징을 추출하기 위해 개별문자영상을 nxn으로 정규화하는 단계와, 상기 단계에서 정규화된 영상을 가로 및 세로로 m등분하여 (n/m)×(n/m)그물눈을 형성하는 단계와, 상기 단계에서 헝성된 그물눈의 행태를 구하는 단계와, 상기 단계에서 이웃하는 그물눈의 형태와의 상호관계를 구하는 단개로 이루어지는 특징추출단계와, 상기 단계에서 구해진 특징을 신경회로망의 입력으로 하여 문자를 인식하는 단계로 이루어진다.

상기 단계를 실행하기 위한 장치는 제 1 도에 도시된 바와같이 문서인식 시스템의 전반적인 동작을 제어하는 호스트컴퓨터(13)와, 문서로 부터 데이타를 읽어들여 이진영상을 발생시켜주는 스캐너(11)와, 스캐너(11)로 부터 스캐너 인터페이스(12)를 통해 입력되는 데이타를 처리한 영상데이타를 화상메모리(26)에 저장시키는 디지탈신호 처리부(15)와, 상기 디지탈신호 처리부(15)에서 수행되는 프로그램을 저장하고 있는 프로그램 메모리(18)와 데이타메모리(19)와, 상기데이타메모리(20)를 제어하는 디램콘트롤러(17)와, 상기 디지탈신호 처리부(15)와, 디램콘트롤러(17) 사이의 데이타 전송을 매개하는 버퍼(16)와, 상기 디지탈데이타 처리부(15)와 버퍼(16)와 호스트컴퓨터(13) 사이의 정보를 전달하는 호스트 인터페이스(14)로 구성한다.

이와같이 구성된 본 발명의 작용 및 효과에 대하여 상세히 설명하면 다음과 같다.

스캐너(11)가 문서로 부터 문자를 읽어들인 후 이진영상으로 변환시켜 스캐너 인터페이스(12)로 전달하여 주면, 상기 스캐너 인터페이스(12)가 디지탈신호 처리부(15)로 전달하여 줌에 따라 상기 디지탈신호 처리부(]5)는 프로그램 메모리(16)와 데이타메모리(19)에 저장되어 있는 프로그램이나 데이타정보를 이용하여 문자를 인식하게 되는데, 이에 대하여 살펴보자.

상기 스캐너(11)를 통해 입력되는 이진영상으로 부터 문자열을 분리하고 그 분리된 문자열로 부터 개별문자를 분리하고, 다시 그 개별문자로 분리된 영상으로 부터 특징추출을 행한다.

특징추출은 제 3 도에서와 같이 개별문자로 분리된 영상을 32×32로 정규화하고, 그 정규화된 영상을 가로 및 세로방향으로 4등분하여 제 5도에서와 같이 8×8그물눈을 형성한다.

이와같은 방법으로 형성된 16개의 그물눈에 대하여 각각 그물눈 형태를 구하는데, 여기서 그물눈, 행태는 제 6 도에서와 같이 10가지로 정한다.

여기서 제 7 도에 의거하여 그물눈 행태를 구하는 방법은 먼저 그물눈에 분포되어 있는 흑화소의 누적흑화소수를 구하여 그 누적흑화소수가 그물눈의 총 면적에 1/10 이하이면 흑화소가 없는 것으로 간주하고 제 6 도에서 "형태1"로 정하고, 상기에서 누적흑화소수가 8/10 이상이면 흑화소가 전체적으로 분포되어 있는것으로 간주하고 제 6 도에서 "형태6"으로 정한다.

그리고 "형태2"부터 "형태9" 까지는 각 형태의 모양에 가장 가까운 형태를 각 그물눈의 특징형태로 정한다.

이상에서와 같이 특징이 추출되면 다음으로 분류를 행하는데 이는 각 그물눈에서 특징형태를 추출한 다음 바로 이웃하는 그물눈의 형태와 상호관계를 구하는데, 이는 동일한 문자이지만 두꺼운 문자와 얇은 문자를 구별하지 못했던 종래의 인식시스템을 보완하는 것이다.

즉, 제 8 도에서와 같이 인접한 그물눈의 방향도는 4방향을 가지고 있는데, 각 방향별로 누적흑화소의 분포비와 형태변화로 각 특징들을 분류한다.

그 분류된 특징은 이미 학습시켜 놓은 제 4 도의 신경회로망의 입력층으로 입력되고 다시 은닉층과 출력층을 통해 나오게 되면 이는 제 9 도에 도시한 바와같은 알고리듬을 거쳐 문자를 인식하게 되는데, 먼저 신경회로망을 통해 출력된 값은 미리 정의해 놓은 기준값과 비교하여 오차가 제일 작은값을 가지는 패턴을 입력된 문자의 인식결과로 저장하게 되는데, 이때 인식후보문자의 오차가 임계치보다 적은 값을 가지는 후보문자가 여러개 있을 수 있다.

그것은 상호 유사한 패턴을 가지는 문자들인데 이를 구별하기 위하여는 전역적인 특징추출보다는 국부적인 특징을 이용하여 인식하는 것이 효과적이다.

이에 대하여 예를들면, 서로 유사한 문자중 g와 9의 경우 "9"라는 영상이 입력되어 특징추출방법에 의하여 특징이 추출되어 신경회로망을 통과하였다면 신경회로망의 출력값은 이상적인 경우라면 9라고 인식하여야 하나 신경망의 출력값은 9와 g를 비슷한 오차로써 출력하게 되어 두문자를 정확히 구별하기 힘들어진다.

이와같은 경우 서로다른 많은 패턴들을 분류하기 위해 전체 패턴들과 구별되는 특징으로 서로 비교함으로써 야기되는 문제가 되므로 상기의 9와 g 두 문자만을 구별하는 특징을 추출한다먼 보다 정확히 인식할 수 있게된다.

그리고, 신경망의 출력값과 기준값과의 오차가 어떤 하나의 패턴만 매우작고 그외의 패턴과는 매우 크다면 이는 유사한 패턴이 없는 경우로써 오차가 제일작은 패턴을 인식결과로 저장하면 되는것이다.

상기 인식단계에서 신경망의 가중치는 다음과 같이 학습이 이루어지게 되는테, 이는 제 4 도에서 입력층은 i개의 입력노드를 가지고 있으며 은닉층은 j개, 그리고 출력층은 k개의 노드를 가지고 있고, Wij는 입력층 1번째 뉴런과 출력층 k번째 뉴런상이의 가중치를 나타내며, Wjk는 은닉층 j번째 뉴런과 출력층 k번째 뉴런사이의 가중치를 나타낸다.

신경회로망의 학습은 오차역전달방법을 학습시키며, 본 발명에서는 새로운 신경망의 오차성능지수를 제안하였는데 이는 다음과 같다.

오차 = 1/2 xF( )xΣ(신경망의 출력층 뉴런값 - 학습패턴의 출력값)²

일반적인 오차성능지수에 함수F( )가 새롭게 첨부되어 있다.

F( )는 입력문자의 모호정도에 따른 인식신뢰지수로서 다음과 같은 비선형요소로 표현된다.

F( ) = 1 - (X²/1+X²)

X는 한 문자와 다른 문자들사이의 HD(Hamming Distance)가 임계치보다 적은 문자수이다.

따라서, 모호한 문자수가 많은 문자의 패턴일 경우는 F( )의 값이 적어지게 되어 학습시킬 오차는 매우 작게되어 자기자신의 패턴만 학습하는 효과가 나타난다.

이상에서 상세히 설명한 바와같이 본 발명은 오차성능지수를 새로 포함한 오차역전달방법을 사용하여 신경회로망을 학습시켜 학습성능을 향상시키고 문자인식성능을 항상시키도록 한 효과가 있다.

재 1 도는 본 발명의 문자인식시스탬 구성도,

제 2 도는 본 발명의 신경망을 이용한 문자인식방법 흐름도.

제 3 도는 제 2 도에서 특징추출시 동작흐름도.

제 4 도는 신경회로망의 구조도,

제 5 도는 그물눈(8×8)의 조직도.

제 6 도는 제 5 도에서 그물눈의 형태도.

제 7 도는 제 5 도에서 그물눈의 형태 흐름도.

제 8 도는 제 5 도에서인접한 그물눈의 방향도.

제 9 도는 제 2 도에 따른 문자인식 흐름도.

*** 도면의 주요부분에 대한 부호의 설명 ***

11 : 스캐너 12 : 스캐너 인터페이스

13 : 호스트컴퓨터 14 : 호스트 인터페이스

15 : 디지탈신호처리부 16 : 버퍼

17 : 디램 콘트롤러 18 : 프로그램 메모리

19 : 데이타 메모리 20 : 화상메모리

Claims

문서를 이진영상으로 입력하는 단계와, 상기 단계에서 입력된 이진영상으로 부터 문자열 및 개별문자를 분리하는 단계와, 상기 단계에서 분리된 개별문자 영상의 특징을 추출하기 위해 개별문자영상을 nxn으로 정규화하는 단계와, 상기 단계에서 정규화된 영상을 가로 및 세로로 m등분하여 (n/m)x(n/m)그물눈을 형성하는 단계와, 상기 단계에서 형성된 그물눈의 형태를 구하는 단계와, 상기 단계에서 이웃하는 그물눈의 형태와의 상호관계를 구하여 특징추출 및 특징분류하는 단계와, 상기 단계에서 구해진 특징을 신경회로망의 출력값으로 하여 문자를 인식하는 단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
제1항에 있어서, 그물눈의 형태는 입력되는 그물눈의 영상으로 부터 그물눈에 분포되어 있는 흑화소의 누적흑화소수를 구하는 제1단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 1/10이하이면 흑화소가 없는 것으로 간주하고 이를 형태l로 정하는 제2단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 8/10이상이면 흑화소가 전체적으로 분포되어 있는 것으로 간주하고 이를 형태10으로 정하는 제3단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 1/10이상과 8/10이하 사이에 존재하면 누적흑화소에 따라 형태1부터 형태9까지 각각 설정하고 저장하도록 하는 제4단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
제1항에 있어서, 특징분류는 특징형태를 추출한 그물눈의 인접한 그물눈의 4방향별로 누적흑화소의 분포비와 형태변화도 각각의 특징들을 분류하도륵 한 것을 특정으로 하는 신경망을 이용한 문자인식방법.
제1항에 있어서, 문자인식은 신경망의 출력값을 미리 정의해놓은 오차성능지수와 비교하여 오차를 구하는 단계와, 상기 단계에서 구한 인식후보문자의 오차성능지수를 소정의 임계치와 비교하는 단계와, 상기 단계에서 인식후보문자의 오차성능지수가 임계치보다 적은값을 가지는 후보문자를 구한 후 그의 특징추출을 행하여 문자를 인식하는 단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
제4항에 있어서, 오차성능지수는 1/2 xF( )xΣ(신경망의 출력층 뉴런값 - 학습패턴의 출력값)²(단, F( )는 입력문자의 모호정도에 따른 인식신뢰지수로서 F( ) = 1 - (X²/1+X²)이고, X는 한 문자와 다른 문자들사이의 HD가 임계치보다 적은 문자수) 으로 오차역전달방법을 사용하여 신경회로망을 학습시킬 때 사용하도록 한 것을 특징으로 하는 신경망을 이용한 문자인식방법.