KR100317350B1 - 신경망을이용한문자인식방법 - Google Patents

신경망을이용한문자인식방법 Download PDF

Info

Publication number
KR100317350B1
KR100317350B1 KR1019940033152A KR19940033152A KR100317350B1 KR 100317350 B1 KR100317350 B1 KR 100317350B1 KR 1019940033152 A KR1019940033152 A KR 1019940033152A KR 19940033152 A KR19940033152 A KR 19940033152A KR 100317350 B1 KR100317350 B1 KR 100317350B1
Authority
KR
South Korea
Prior art keywords
character
neural network
mesh
image
error
Prior art date
Application number
KR1019940033152A
Other languages
English (en)
Other versions
KR960025219A (ko
Inventor
이영태
Original Assignee
구자홍
엘지전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 구자홍, 엘지전자주식회사 filed Critical 구자홍
Priority to KR1019940033152A priority Critical patent/KR100317350B1/ko
Publication of KR960025219A publication Critical patent/KR960025219A/ko
Application granted granted Critical
Publication of KR100317350B1 publication Critical patent/KR100317350B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • G06V20/63Scene text, e.g. street names
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 신경망을 이용한 문자인식방법에 관한 것으로, 종래에는 신경망을 이용한 문자인식시스템에서 특징추출방법에는 정규화된 영상을 그대로 사용하는 경우 많은 입력수로 인하여 인식시간이 길어지고 문자의 두께변화에 적응하지 못하게 되는 점과, 교차거리특징의 경우 문자의 외곽모양을 표현하고 있지만 문자의 내부 모양은 구별하지 못한다는 등의 문제점이 있다. 따라서 본 발명은 오차성능지수를 새롭게 포함하여 오차역전달법에 의해 신경회로망을 학습시리즈로서 학습성능을 향상시키고 문자인식성능을 향상시키도록 한다.

Description

신경망을 이용한 문자인식방법
본 발명은 문자인식시스템의 인식률을 향상시키기 위한 것으로, 특히 신경회로망의 학습성능을 향상시키고 학습속도를 개선할 수 있도록 한 신경망을 이용한 문자인식방법에 관한 것이다.
종래 문자인식방법은 제 1 도에 도시된 바와같이 스캐너로 부터 문자입력시 그 문자로 부터 문자열분리 및 문자영역을 추출하는 제l단계와, 상기 제1단계에서 분리된 문자의 특징을 추출하는 제2단계와, 상기 제2단계에서 추출된 특징들을 분류하는 제3단계와, 상기 제3단계에서 추출된 특징들로 부터 문자를 인식하는 제4단계로 이루어진다.
상기에서와 같은 단계로 인식되는 문자인식에 대하여 살펴보면 다음과 같다.
스캐너로 부터 입력문자에 대한 2진영상이 입력되면 그 영상을 입력받는 문자분리부에서 2진영상에 대하여 문서의 수펑방향에 대한 누적흑화소를 구하여 이 구해진 값과 임계값을 비교하여 문자열의 상하위치를 구해 문자열을 분리한다.
이와같이 문자열이 분리되고 나면 상기에서와 같은 방법으로 수직방향의 누적 흑화소를 구하고 그 구한값과 임계값을 비교하여 문자영역을 추출하여 특징추출부로 전달하여 준다.
그러면, 상기 특징추출부에서는 문자인식을 위한 특징을 추출하기 위하여 먼저 분리된 개별문자 영상을 정규화하고, 이 정규화된 영상으로부터 교차거리 투영, 교차값등을 사용하여 특징을 추출하는데, 여기서 교차거리특징은 문자영상의 경계선으로 부터 스트로크와 만나는 점까지의 거리이고, 투영특징은 수직축과 수평축으로 검출선을 주사하였을때 만나는 검은 화소수를 더하여 구하며, 교차특징은 수직과 수평방향으로 검출선을 주사하였을때 만나는 스트로크의 수를 더한값이다.
상기에서와 같이 교차거리특지이나 투영 및 교차특징을 이용하여 추출된 특징을 신경회로망에 학습시키기 위해 형태가 비슷한 패턴들의 평균값을 사용하여 입력값을 구하여 사용하고, 출력은 서로다른 패턴들과 구별되도륵 인위적인 값을 정하여 사용한다.
상기에서 얻어진 특징들을 문자인식부로 전달하면, 상기 문자인식부에서는 입력된 특징들을 분류하고 그 분류된 특징들로 부터 문자를 인식하고 인식된 문자를 출력시킨다.
그러나, 이와같은 종래의 기술에 있어서 신경망을 이용한 문자인식시 스템에서 특징추출방법에 많은 단점을 가지고 있는데, 먼저 정규화된 영상을 그대로 사용하는 경우 많은 입력수로 인하여 인식시간이 길어지고 무자의 두께변화에 적응하지 못하게 되는 점과, 교차거리특징의 경우 문자의 외곽모앙을 표현하고 있지만 문자의 내부 모양은 구별하지 못한다는 점과, 투영특징의 경우 문자의 두께변화에 적응하지 못하는 점과, 교차특징의 경우 스트로크 두께변화에는 잘 적응하지만 잡음에 의한 변화에 민감한 단점을 갖고 있다.
또한, 특징들의 장단점을 이용하여 복합적으로 특징들을 구성하고 있지만 많은 특징들을 입력으로 사용함으로서 문자인식 시간이 길어지고, 특징분류에서 출력값을 인위적으로 결정함으로써 입력 및 출력의 상호관계가 많은 비선형요소를 포함하고 있을 수 있으므로 신경망의 학습률을 저하시키는 요인이 되어서 문자인식성능을 저하시키며, 또한 패턴을 학습시킬때 오차성능지수는 패턴의 특성에 관계없이 학습시킴으로서 학습성능이 특정한 패턴에 대해서는 좋지못한 결과를 나타내는 문제점이 있다.
따라서, 본 발명의 목적은 문자를 고속으로 인식하고 인식률을 향상시킬 수 있또록 한 신경망을 이용한 문자인식방법을 제공함에 있다.
상기 목적을 달성하기 위한 본 발명은 문서를 이진영상으로 입력하는 단계와, 상기 단계에서 입력된 이진영상으로 부터 문자열 및 개별문자를 분리하는 단계와, 상기 단계에서 분리된 개별문자 영상의 특징을 추출하기 위해 개별문자영상을 nxn으로 정규화하는 단계와, 상기 단계에서 정규화된 영상을 가로 및 세로로 m등분하여 (n/m)×(n/m)그물눈을 형성하는 단계와, 상기 단계에서 헝성된 그물눈의 행태를 구하는 단계와, 상기 단계에서 이웃하는 그물눈의 형태와의 상호관계를 구하는 단개로 이루어지는 특징추출단계와, 상기 단계에서 구해진 특징을 신경회로망의 입력으로 하여 문자를 인식하는 단계로 이루어진다.
상기 단계를 실행하기 위한 장치는 제 1 도에 도시된 바와같이 문서인식 시스템의 전반적인 동작을 제어하는 호스트컴퓨터(13)와, 문서로 부터 데이타를 읽어들여 이진영상을 발생시켜주는 스캐너(11)와, 스캐너(11)로 부터 스캐너 인터페이스(12)를 통해 입력되는 데이타를 처리한 영상데이타를 화상메모리(26)에 저장시키는 디지탈신호 처리부(15)와, 상기 디지탈신호 처리부(15)에서 수행되는 프로그램을 저장하고 있는 프로그램 메모리(18)와 데이타메모리(19)와, 상기데이타메모리(20)를 제어하는 디램콘트롤러(17)와, 상기 디지탈신호 처리부(15)와, 디램콘트롤러(17) 사이의 데이타 전송을 매개하는 버퍼(16)와, 상기 디지탈데이타 처리부(15)와 버퍼(16)와 호스트컴퓨터(13) 사이의 정보를 전달하는 호스트 인터페이스(14)로 구성한다.
이와같이 구성된 본 발명의 작용 및 효과에 대하여 상세히 설명하면 다음과 같다.
스캐너(11)가 문서로 부터 문자를 읽어들인 후 이진영상으로 변환시켜 스캐너 인터페이스(12)로 전달하여 주면, 상기 스캐너 인터페이스(12)가 디지탈신호 처리부(15)로 전달하여 줌에 따라 상기 디지탈신호 처리부(]5)는 프로그램 메모리(16)와 데이타메모리(19)에 저장되어 있는 프로그램이나 데이타정보를 이용하여 문자를 인식하게 되는데, 이에 대하여 살펴보자.
상기 스캐너(11)를 통해 입력되는 이진영상으로 부터 문자열을 분리하고 그 분리된 문자열로 부터 개별문자를 분리하고, 다시 그 개별문자로 분리된 영상으로 부터 특징추출을 행한다.
특징추출은 제 3 도에서와 같이 개별문자로 분리된 영상을 32×32로 정규화하고, 그 정규화된 영상을 가로 및 세로방향으로 4등분하여 제 5도에서와 같이 8×8그물눈을 형성한다.
이와같은 방법으로 형성된 16개의 그물눈에 대하여 각각 그물눈 형태를 구하는데, 여기서 그물눈, 행태는 제 6 도에서와 같이 10가지로 정한다.
여기서 제 7 도에 의거하여 그물눈 행태를 구하는 방법은 먼저 그물눈에 분포되어 있는 흑화소의 누적흑화소수를 구하여 그 누적흑화소수가 그물눈의 총 면적에 1/10 이하이면 흑화소가 없는 것으로 간주하고 제 6 도에서 "형태1"로 정하고, 상기에서 누적흑화소수가 8/10 이상이면 흑화소가 전체적으로 분포되어 있는것으로 간주하고 제 6 도에서 "형태6"으로 정한다.
그리고 "형태2"부터 "형태9" 까지는 각 형태의 모양에 가장 가까운 형태를 각 그물눈의 특징형태로 정한다.
이상에서와 같이 특징이 추출되면 다음으로 분류를 행하는데 이는 각 그물눈에서 특징형태를 추출한 다음 바로 이웃하는 그물눈의 형태와 상호관계를 구하는데, 이는 동일한 문자이지만 두꺼운 문자와 얇은 문자를 구별하지 못했던 종래의 인식시스템을 보완하는 것이다.
즉, 제 8 도에서와 같이 인접한 그물눈의 방향도는 4방향을 가지고 있는데, 각 방향별로 누적흑화소의 분포비와 형태변화로 각 특징들을 분류한다.
그 분류된 특징은 이미 학습시켜 놓은 제 4 도의 신경회로망의 입력층으로 입력되고 다시 은닉층과 출력층을 통해 나오게 되면 이는 제 9 도에 도시한 바와같은 알고리듬을 거쳐 문자를 인식하게 되는데, 먼저 신경회로망을 통해 출력된 값은 미리 정의해 놓은 기준값과 비교하여 오차가 제일 작은값을 가지는 패턴을 입력된 문자의 인식결과로 저장하게 되는데, 이때 인식후보문자의 오차가 임계치보다 적은 값을 가지는 후보문자가 여러개 있을 수 있다.
그것은 상호 유사한 패턴을 가지는 문자들인데 이를 구별하기 위하여는 전역적인 특징추출보다는 국부적인 특징을 이용하여 인식하는 것이 효과적이다.
이에 대하여 예를들면, 서로 유사한 문자중 g와 9의 경우 "9"라는 영상이 입력되어 특징추출방법에 의하여 특징이 추출되어 신경회로망을 통과하였다면 신경회로망의 출력값은 이상적인 경우라면 9라고 인식하여야 하나 신경망의 출력값은 9와 g를 비슷한 오차로써 출력하게 되어 두문자를 정확히 구별하기 힘들어진다.
이와같은 경우 서로다른 많은 패턴들을 분류하기 위해 전체 패턴들과 구별되는 특징으로 서로 비교함으로써 야기되는 문제가 되므로 상기의 9와 g 두 문자만을 구별하는 특징을 추출한다먼 보다 정확히 인식할 수 있게된다.
그리고, 신경망의 출력값과 기준값과의 오차가 어떤 하나의 패턴만 매우작고 그외의 패턴과는 매우 크다면 이는 유사한 패턴이 없는 경우로써 오차가 제일작은 패턴을 인식결과로 저장하면 되는것이다.
상기 인식단계에서 신경망의 가중치는 다음과 같이 학습이 이루어지게 되는테, 이는 제 4 도에서 입력층은 i개의 입력노드를 가지고 있으며 은닉층은 j개, 그리고 출력층은 k개의 노드를 가지고 있고, Wij는 입력층 1번째 뉴런과 출력층 k번째 뉴런상이의 가중치를 나타내며, Wjk는 은닉층 j번째 뉴런과 출력층 k번째 뉴런사이의 가중치를 나타낸다.
신경회로망의 학습은 오차역전달방법을 학습시키며, 본 발명에서는 새로운 신경망의 오차성능지수를 제안하였는데 이는 다음과 같다.
오차 = 1/2 xF( )xΣ(신경망의 출력층 뉴런값 - 학습패턴의 출력값)2
일반적인 오차성능지수에 함수F( )가 새롭게 첨부되어 있다.
F( )는 입력문자의 모호정도에 따른 인식신뢰지수로서 다음과 같은 비선형요소로 표현된다.
F( ) = 1 - (X2/1+X2)
X는 한 문자와 다른 문자들사이의 HD(Hamming Distance)가 임계치보다 적은 문자수이다.
따라서, 모호한 문자수가 많은 문자의 패턴일 경우는 F( )의 값이 적어지게 되어 학습시킬 오차는 매우 작게되어 자기자신의 패턴만 학습하는 효과가 나타난다.
이상에서 상세히 설명한 바와같이 본 발명은 오차성능지수를 새로 포함한 오차역전달방법을 사용하여 신경회로망을 학습시켜 학습성능을 향상시키고 문자인식성능을 항상시키도록 한 효과가 있다.
재 1 도는 본 발명의 문자인식시스탬 구성도,
제 2 도는 본 발명의 신경망을 이용한 문자인식방법 흐름도.
제 3 도는 제 2 도에서 특징추출시 동작흐름도.
제 4 도는 신경회로망의 구조도,
제 5 도는 그물눈(8×8)의 조직도.
제 6 도는 제 5 도에서 그물눈의 형태도.
제 7 도는 제 5 도에서 그물눈의 형태 흐름도.
제 8 도는 제 5 도에서인접한 그물눈의 방향도.
제 9 도는 제 2 도에 따른 문자인식 흐름도.
*** 도면의 주요부분에 대한 부호의 설명 ***
11 : 스캐너 12 : 스캐너 인터페이스
13 : 호스트컴퓨터 14 : 호스트 인터페이스
15 : 디지탈신호처리부 16 : 버퍼
17 : 디램 콘트롤러 18 : 프로그램 메모리
19 : 데이타 메모리 20 : 화상메모리

Claims (5)

  1. 문서를 이진영상으로 입력하는 단계와, 상기 단계에서 입력된 이진영상으로 부터 문자열 및 개별문자를 분리하는 단계와, 상기 단계에서 분리된 개별문자 영상의 특징을 추출하기 위해 개별문자영상을 nxn으로 정규화하는 단계와, 상기 단계에서 정규화된 영상을 가로 및 세로로 m등분하여 (n/m)x(n/m)그물눈을 형성하는 단계와, 상기 단계에서 형성된 그물눈의 형태를 구하는 단계와, 상기 단계에서 이웃하는 그물눈의 형태와의 상호관계를 구하여 특징추출 및 특징분류하는 단계와, 상기 단계에서 구해진 특징을 신경회로망의 출력값으로 하여 문자를 인식하는 단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
  2. 제1항에 있어서, 그물눈의 형태는 입력되는 그물눈의 영상으로 부터 그물눈에 분포되어 있는 흑화소의 누적흑화소수를 구하는 제1단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 1/10이하이면 흑화소가 없는 것으로 간주하고 이를 형태l로 정하는 제2단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 8/10이상이면 흑화소가 전체적으로 분포되어 있는 것으로 간주하고 이를 형태10으로 정하는 제3단계와, 상기 제1단계에서 구한 누적흑화소수가 그물눈의 총 면적에 1/10이상과 8/10이하 사이에 존재하면 누적흑화소에 따라 형태1부터 형태9까지 각각 설정하고 저장하도록 하는 제4단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
  3. 제1항에 있어서, 특징분류는 특징형태를 추출한 그물눈의 인접한 그물눈의 4방향별로 누적흑화소의 분포비와 형태변화도 각각의 특징들을 분류하도륵 한 것을 특정으로 하는 신경망을 이용한 문자인식방법.
  4. 제1항에 있어서, 문자인식은 신경망의 출력값을 미리 정의해놓은 오차성능지수와 비교하여 오차를 구하는 단계와, 상기 단계에서 구한 인식후보문자의 오차성능지수를 소정의 임계치와 비교하는 단계와, 상기 단계에서 인식후보문자의 오차성능지수가 임계치보다 적은값을 가지는 후보문자를 구한 후 그의 특징추출을 행하여 문자를 인식하는 단계로 이루어진 것을 특징으로 하는 신경망을 이용한 문자인식방법.
  5. 제4항에 있어서, 오차성능지수는 1/2 xF( )xΣ(신경망의 출력층 뉴런값 - 학습패턴의 출력값)2(단, F( )는 입력문자의 모호정도에 따른 인식신뢰지수로서 F( ) = 1 - (X2/1+X2)이고, X는 한 문자와 다른 문자들사이의 HD가 임계치보다 적은 문자수) 으로 오차역전달방법을 사용하여 신경회로망을 학습시킬 때 사용하도록 한 것을 특징으로 하는 신경망을 이용한 문자인식방법.
KR1019940033152A 1994-12-07 1994-12-07 신경망을이용한문자인식방법 KR100317350B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940033152A KR100317350B1 (ko) 1994-12-07 1994-12-07 신경망을이용한문자인식방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940033152A KR100317350B1 (ko) 1994-12-07 1994-12-07 신경망을이용한문자인식방법

Publications (2)

Publication Number Publication Date
KR960025219A KR960025219A (ko) 1996-07-20
KR100317350B1 true KR100317350B1 (ko) 2002-04-24

Family

ID=37531785

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940033152A KR100317350B1 (ko) 1994-12-07 1994-12-07 신경망을이용한문자인식방법

Country Status (1)

Country Link
KR (1) KR100317350B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20230055335A (ko) 2021-10-18 2023-04-25 고려대학교 산학협력단 생물학적 뇌 모사 스파이킹 신경망을 이용한 이미지 인식 장치, 방법 및 이를 위한 컴퓨터 판독가능 프로그램

Also Published As

Publication number Publication date
KR960025219A (ko) 1996-07-20

Similar Documents

Publication Publication Date Title
Pal et al. Handwritten English character recognition using neural network
CN108960080B (zh) 基于主动防御图像对抗攻击的人脸识别方法
US8594431B2 (en) Adaptive partial character recognition
CN112966691B (zh) 基于语义分割的多尺度文本检测方法、装置及电子设备
CN111488826A (zh) 一种文本识别方法、装置、电子设备和存储介质
CN109948533B (zh) 一种文本检测方法、装置、设备及可读存储介质
CN114187311A (zh) 一种图像语义分割方法、装置、设备及存储介质
CN109299303B (zh) 基于可变形卷积与深度网络的手绘草图检索方法
CN111222589A (zh) 图像文本识别方法、装置、设备及计算机存储介质
Vellasques et al. Filtering segmentation cuts for digit string recognition
RU2363047C1 (ru) Способ обнаружения текста в растровом изображении (варианты) и способ выявления спама, содержащего растровые изображения
CN115240178A (zh) 一种票据图像的结构化信息提取方法及系统
KR100390569B1 (ko) 크기와 회전에 무관한 지능형 얼굴검출 방법
Ovodov Optical braille recognition using object detection neural network
CN111832390B (zh) 一种手写古文字检测方法
KR100317350B1 (ko) 신경망을이용한문자인식방법
CN113379001B (zh) 针对图像识别模型的处理方法及装置
CN112800259B (zh) 一种基于边缘闭合与共性检测的图像生成方法及系统
Chung et al. Handwritten character recognition by Fourier descriptors and neural network
CN114283431A (zh) 一种基于可微分二值化的文本检测方法
Kumar et al. A survey on touching character segmentation
Shinde et al. Automatic Data Collection from Forms using Optical Character Recognition
Tripathy et al. System for Oriya handwritten numeral recognition
CN113159071A (zh) 一种跨模态图像-文本关联异常检测方法
Suriya et al. Effective Tamil character recognition using supervised machine learning algorithms

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070918

Year of fee payment: 7

LAPS Lapse due to unpaid annual fee