KR970002424B1 - 후보문자분류방법 - Google Patents

후보문자분류방법 Download PDF

Info

Publication number
KR970002424B1
KR970002424B1 KR1019940006337A KR19940006337A KR970002424B1 KR 970002424 B1 KR970002424 B1 KR 970002424B1 KR 1019940006337 A KR1019940006337 A KR 1019940006337A KR 19940006337 A KR19940006337 A KR 19940006337A KR 970002424 B1 KR970002424 B1 KR 970002424B1
Authority
KR
South Korea
Prior art keywords
component
candidate character
extracting
slope
neural network
Prior art date
Application number
KR1019940006337A
Other languages
English (en)
Inventor
이영태
Original Assignee
엘지전자 주식회사
구자홍
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엘지전자 주식회사, 구자홍 filed Critical 엘지전자 주식회사
Priority to KR1019940006337A priority Critical patent/KR970002424B1/ko
Application granted granted Critical
Publication of KR970002424B1 publication Critical patent/KR970002424B1/ko

Links

Landscapes

  • Character Discrimination (AREA)
  • Image Analysis (AREA)

Abstract

내용없음.

Description

후보문자분류방법
제1도는 본 발명에 따른 후보문자분류방법을 수행하기 위한 플로우 챠트.
제2도는 특징추출과정의 개략 플로우 챠트.
제3도는 특징추출과정의 상세 플로우 챠트.
제4도는 특징추출과정을 설명하기 위한 도면.
제5도는 문자인식시스템의 학습구조도.
제6도는 식별신경망의 구조도.
* 도면의 주요부분에 대한 부호의 설명
10 : 문자인식시스템 20 : 식별신경회로망
30 : 오차검출부
본 발명은 후보문자분류방법에 관한 것으로서, 더욱 상세하게는 문자영상의 정규화 과정을 하지 않고 문자영상으로부터 각각의 방향별로 문자의 형태 즉, 직선, 내밀획(\), 빗침획성분(/)을 추출한 뒤 이들을 신경회로망으로 학습시켜 후보문자를 선택하도록 한 후보문자분류방법에 관한 것이다.
일반적으로 종래의 후보문자분류방법은 스캐너를 통하여 입력된 문자영상을 문자분리과정에서 각각의 문자로 분리한다.
그리고 분리된 문자에서 피쳐를 뽑기 쉽게 하기 위해 문자의 크기를 정규화하는 정규화 과정을 거쳐 피쳐를 추출해내어 신경망의 입력으로 사용한다.
그리고 일반적으로 사용되는 피쳐는 교차거리, 메쉬, 문자의 폭과 높이의 비등이며, 신경회로망은 다층신경회로망을 사용하며, 학습방법은 오차를 감소시키는 방향으로 가중치(Weight)를 변화시키는 역전달(Back-Propagation) 방법을 사용한다.
그리고 신경망을 통한 값을 오차성능지수를 통하여 오인식여부를 결정하고 오인식된 문자는 분리부로 다시 보내어 상기의 과정을 다시 거치도록 되어 있다.
그러나 상기와 같은 종래의 방법에서는 특징추출시 직선, 사선, 곡선의 형태를 인식하는 경우에 형태가 유사한 문자에 대해서도 문턱값(Threshold Value)에 따라 직선이나 사선, 곡선중에 반드시 하나를 선택하도록 되어 있어서 오인식하는 경우가 발생한다.
또한, 신경망의 활성함수의 기울기가 고정되어 있음에 따라 조기포화현상을 일으켜 학습속도가 느려지는 단점이 있었다.
본 발명은 이러한 점을 해결하기 위한 것으로, 본 발명의 목적은 각각의 방향별로 문자의 형태를 추출한 뒤 신경회로망으로 학습시켜 후보문자를 선택하도록 하며, 이때 식별신경망의 활성함수의 기울기가 자동조정되도록 하여 학습속도가 개선되도록 한 후보문자분류방법을 제공함에 있다.
이러한 목적을 달성하기 위한 본 발명의 특징은 입력영상으로부터 개별문자를 절출하는 절출단계와, 상기 절출단계에서 절출된 문자로부터 특징을 추출하는 특징추출단계와, 상기 특징추출단계에서 추출된 특징을 입력으로 하여 후보문자를 분리하는 신경회로망을 이용한 후보문자분류단계와, 오차에 따라 후보문자인식여부를 결정하는 인식단계로 이루어지는 후보문자분류방법에 있다.
이하, 본 발명의 일실시예를 첨부도면을 참조로 하여 상세히 설명한다.
제1도는 본 발명에 따른 후보문자분류방법을 수행하기 위한 전체적인 플루우 챠트로써, 영상이미지로부터 개별문자를 절출한 뒤, 절출된 문자에 대해 특징을 추출한다(단계 S10-S30).
상기 단계(S30)에서의 특징추출은 문자의 외곽모양을 방향별로 추출하며, 추출된 특징들은 후보문자 분류를 위한 식별신경회로망의 입력으로 사용되며, 식별신경회로망은 영상이미지의 외곽형태에 따라 분류한다(단계 S40)
그리고 상기 식별신경회로망의 출력과 저장되어 있는 기준값을 비교하여 오차값을 얻으며, 얻어진 오차 값에 따라 후보문자의 인식여부를 결정하며(단계 S50) 결정된 결과는 메모리에 저장된다.
상기와 같은 전체적인 플로우에 따라 수행되는 본 발명을 제2도 내지 제6도와 함께 설명한다.
우선, 상기 단계(S30)에서의 특징추출은 제2도의 플로우 챠트에 의해 수행된다.
이는 영상이미지를 좌측, 우측, 위, 아래의 각각의 방향별로 프로젝션하여 교차거리를 구한 다음, 직선성분의 크기 및 위치, 내림획 성분의 크기 및 기울기 그리고 빗침 획 성분의 크기 및 기울기를 구한다(S31-S34).
그리고 상기 각 단계(S32-S34)에서의 직선성분의 크기 및 위치, 내림획성분의 크기, 빗침획 성분의 크기는 제3도의 플로우 챠트에 의해 구해진다.
먼저, 영상이미지를 좌측, 우측, 위, 아래의 각 방향별로 플로젝션하여 교차거리(Cross)를 구한다(단계 S35).
여기서, 교차거리는 영상이미지를 프로젝션할 경우 첫번째 흑화소점까지의 거리를 말한다.
즉, 제4도에서 좌측에서 우측으로 스캔시 교차거리는 2, 4, 6, 8임을 보여준다(A 문자를 예를들음.)
그리고 이때 스캐닝을 제일 밑면부터 위면까지 즉, 0부터 문자의 높이(Height)까지 수행하게 되는데, 스캐닝을 수행하면서 현재의 스캐닝이 어느 단계까지 되었는지를 판단한다(단계 S36).
즉, 제4도에서 a단계까지 되었는지, b단계까지 되었는지, c단계까지 되었는지, d단계까지 되었는지를 판단한다.
만일, 현재 스캐닝하고 있는 높이가 a보다 낮다면 단계(S37)로 진행하여 현재 스캐닝에 의해 얻어진 교차거리의 크기와 문자 폭(Width)을 일정등분하였을 경우의 각각의 위치점의 크기(이하, TH라 칭함) 즉, 제4도에서 1, 2, 3, 4, 5와 비교를 하게 된다.
즉, 상기 단계(S37)에서는 상기 단계(S35)에서 구한 교차거리와 상기 TH값을 비교하게 되는 것이며, 만일 교차거리가 TH값보다 작거나 또는 같다고 판단되면 메모리의 일정번지(Size[n])에 교차거리값을 저장하고, 상기 단계(S36)로 리턴하여 단계(S36)-(S37)를 반복수행한다.
그리고 상기 단계(S37)에서 교차거리가 TH값보다 크다고 판단되면 상기 메모리 번지(Size[n])가 아닌 다른 번지에 저장하고 단계(S36)로 리턴한다(단계 S39).
상기 단계(S35)-(S39)를 계속적으로 반복수행하다가 상기 단계(S35)에서 문자의 높이(Height) 위치인 제4도의 e점까지 스캐닝을 하였다고 판단되면 즉, 현재 문자의 최고 높이(e)까지 모두 스캐닝하였다고 판단되면 단계(S36a)로 진행하여 메모리의 각각의 번지에 저장된 교차거리의 평균값을 구한 후 활성함수를 통과시켜 성분비를 구한다(단계 S36a, S36b).
한편, 상기에서 구해진 메모리 번지(Size[n])의 값은 한문자 영상의 부분적인 직선크기를 나타내며 상기 Size[n]의 최대값은 그 문자의 최대직선을 나타낸다.
그리고 일반적으로 최대직선의 크기는 임계값에 따라 결정되지만 본 발명에서는 비선형요소를 포함하는 활성함수를 통과시킴으로써 문자영상의 조그만 변화에도 대처할 수 있게 되며, 활성함수는 다음과 같다.
여기서, x=Size[n], m=1
또한, 사선 성분의 크기도 상기 제3도의 플로우 챠트에 의해 구한다.
그리고 사선 성분의 기울기는 다음과 같이 구해진다.
기울기=Pro[n+1]-Pro[n]
여기서, 상기 Pro[n+1]과 Pro[n]은 문자영상의 폭과 높이에 대한 상대적인 위치정보값이며, 상기 기울기값의 부호가 양수이면 내림획 성분이며, 음수이면 빗침획 성분 요소이다. 그리고 이들 정보도 마찬가지고 활성함수를 통과시킨다.
한편, 제5도는 문자인식시스템의 학습 구조도를 도시한 것으로, 식별신경회로망은 제6도와 같은 다층신경회로망의 구조를 갖는다.
그리고 제5도에서 입력은 특징추출된 입력이며, 문자인식시스템(10)의 출력(Out1)은 실제데이타 베이스에 있는 데이터값이며, 식별신경회로망(20)의 출력(Out2)은 식별신경로회망(20)에서 인식한 값으로 오차검출부(30)에서 문자인식시스템(10)의 출력(Out1)에서 식별신경회로망(20)의 출력(Out2)을 감산한 값이 오차값이 된다.
그리고 학습을 위한 에러결정함수는 다음과 같다.
E-1/2Σ(Out1-Out2)2
한편, 학습시 사용되는 활성함수의 기울기(m)는 일반적으로 1고정되어 있지만 본 발명에서는 기울기를 자동조정함으로써 학습속도를 개선하게 되는데, 활성함수의 기울기는 오차성능지수를 만족하는 오차를 보다 작을 때까지 능동적으로, 보정하면 되며, 보정된 기울기식은 다음과 같다.
,여기서 x=netk
netk=ΣWjkYi
여기서, 상기 Wjk는 가중치(Weight)이며, Yi는 상기 가중치(Wjk)와 입력값(Xi)의 곱셈값이다.
한편, 제1도에서 단계(S50)는 단계(S40)에서의 출력값과 시스템에 정해져 있는 기준값을 비교하여 그 오차값이 시스템에서 정하는 허용치를 초과하게 되면 상기 단계(S30)로 리턴하여 상기 단계(S30-S50)를 반복수행하고, 허용치 이하의 오차를 가질 경우에는 그 값을 최종 출력값으로 내보내게 된다.
그리고 오차값이 허용치를 시스템에서 정하는 범위보다 초과하게 되면 그 값은 리젝트되게 된다.
이상에서 살펴본 바와 같이 본 발명은 입력된 문자영상으로부터 각각의 방향별로 직선, 내림획, 밧침획 성분을 추출하여 이들을 신경회로망으로 학습시켜 후보문자를 선택함으로써 기존의 획추출방법에서 구별하기 어려운 영상이미지의 획을 각 성분별로 나타낼 수 있게 되므로 그에 따라 잡음 및 이미지 형태변화에 적응하기 쉽게 되며, 식별신경망의 기울기를 자동으로 조정함으로써 학습속도를 개선하게 되는 효과가 있다.

Claims (3)

  1. 입력영상으로부터 개별문자를 절출하는 절출단계와, 상기 절출단계에서 절출된 문자로부터 특징을 추출하는 특징추출단계와, 상기 특징추출단계에서 추출된 특징을 입력으로 학습시 활성함수의 기울기를 자동조정하여 후보문자를 분리해내는 신경회로망을 이용한 후보문자분류단계와, 시스템에 정해진 기준값과 상기 후보문자분류단계의 출력을 비교하여 그 비교결과에 따른 오차에 따라 후보문자 인식여부를 결정하는 인식단계로 이루어짐을 특징으로 하는 후보문자분류방법.
  2. 제1항에 있어서, 상기 특징추출단계는 입력영상의 방향별 교차거리를 구하는 단계와, 직선성분의 위치 및 크기를 구하는 단계와, 내림확성분의 크기 및 기울기를 구하는 단계와, 빗침확성분의 크기 및 기울기를 구하는 단계와, 상기 각 성분을 활성함수를 통과시킨 후 저장하는 단계로 이루어짐을 특징으로 하는 후보문자분류방법.
  3. 제2항에 있어서, 상기 직선성분, 내림획성분, 빗침획성분은 프로젝션을 통한 교차거리로써 구함을 특징으로 하는 후보문자분류방법.
KR1019940006337A 1994-03-29 1994-03-29 후보문자분류방법 KR970002424B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019940006337A KR970002424B1 (ko) 1994-03-29 1994-03-29 후보문자분류방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019940006337A KR970002424B1 (ko) 1994-03-29 1994-03-29 후보문자분류방법

Publications (1)

Publication Number Publication Date
KR970002424B1 true KR970002424B1 (ko) 1997-03-05

Family

ID=19379821

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019940006337A KR970002424B1 (ko) 1994-03-29 1994-03-29 후보문자분류방법

Country Status (1)

Country Link
KR (1) KR970002424B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7544550B2 (en) 2004-07-05 2009-06-09 Samsung Mobile Display Co., Ltd. Method of fabricating semiconductor device and semiconductor fabricated by the same method

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7544550B2 (en) 2004-07-05 2009-06-09 Samsung Mobile Display Co., Ltd. Method of fabricating semiconductor device and semiconductor fabricated by the same method

Similar Documents

Publication Publication Date Title
US6970601B1 (en) Form search apparatus and method
US5633954A (en) System and method for character recognition with normalization
US9665768B2 (en) Process of handwriting recognition and related apparatus
CN111401372A (zh) 一种扫描文档图文信息提取与鉴别的方法
US7283669B2 (en) Fine segmentation refinement for an optical character recognition system
CN110210413A (zh) 一种基于深度学习的多学科试卷内容检测与识别系统及方法
US7233697B2 (en) Character recognition device and a method therefor
CN112836650A (zh) 一种质量检验报告扫描图像表格语义解析方法与系统
CN116824608A (zh) 基于目标检测技术的答题卡版面分析方法
CN115880566A (zh) 一种基于视觉分析的智能阅卷系统
CN114581932A (zh) 一种图片表格线提取模型构建方法及图片表格提取方法
KR100498683B1 (ko) 문자 인식장치 및 그 방법과 문자인식 프로그램을 기록한 컴퓨터 판독 가능한 기록매체
CN109948598B (zh) 文档版面智能化分析方法及装置
US7095894B2 (en) Method and computer program product for recognizing italicized text
Chi et al. A two-stage binarization approach for document images
KR970002424B1 (ko) 후보문자분류방법
Chu et al. Text detection in manga by deep region proposal, classification, and regression
KR100449486B1 (ko) 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
Chiou et al. Recognition of Chinese business cards
Siddique et al. An absolute Optical Character Recognition system for Bangla script Utilizing a captured image
WO2000016264A1 (en) Line object vectorization in colour/grayscale images
Koga et al. A recognition method of machine-printed monetary amounts based on the two-dimensional segmentation and the bottom-up parsing
KR100317350B1 (ko) 신경망을이용한문자인식방법
JPH0795336B2 (ja) 文字認識方式

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
G160 Decision to publish patent application
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20070221

Year of fee payment: 11

LAPS Lapse due to unpaid annual fee