KR20080076433A - 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템 - Google Patents

해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템 Download PDF

Info

Publication number
KR20080076433A
KR20080076433A KR1020070016335A KR20070016335A KR20080076433A KR 20080076433 A KR20080076433 A KR 20080076433A KR 1020070016335 A KR1020070016335 A KR 1020070016335A KR 20070016335 A KR20070016335 A KR 20070016335A KR 20080076433 A KR20080076433 A KR 20080076433A
Authority
KR
South Korea
Prior art keywords
pattern
recognition
character
term
database
Prior art date
Application number
KR1020070016335A
Other languages
English (en)
Other versions
KR100894870B1 (ko
Inventor
하순호
김영호
Original Assignee
하순호
김영호
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 하순호, 김영호 filed Critical 하순호
Priority to KR1020070016335A priority Critical patent/KR100894870B1/ko
Publication of KR20080076433A publication Critical patent/KR20080076433A/ko
Application granted granted Critical
Publication of KR100894870B1 publication Critical patent/KR100894870B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Character Discrimination (AREA)

Abstract

본 발명은 종래기술에 적용되는 신경망 알고리즘보다 향상된 해마 신경망 학습 알고리즘을 적용하여 문자인식을 수행하도록 하므로써 이미지로부터의 문자 인식율을 더욱 높일 수 있도록 하기 위한 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 제공한다. 본 발명은 단기인식 데이터베이스(36) 및 장기인식 데이터베이스(38)를 구비한 인식 유니트(30)를 사용하여 문자인식을 수행한다. 인식 유니트(30)는 스캔 유니트(20)로부터 문서 이미지를 전송받고, 문서 이미지로부터 인식대상문자의 문자이미지를 추출한 후, 추출된 문자이미지를 전처리하여 텍스트로 변환하며, 변환된 텍스트로부터 문자의 특징들을 추출하여 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 사용하여 추출된 문자의 특징들과 조건이 맞는 패턴을 획득하여 인식결과가 출력되도록 한다. 이와 같은 본 발명에 따르면, 종래기술과 달리 인식대상문자의 패턴과 특성의 개수에 한정되지 않고, 인식 데이터베이스의 안정성을 확보하면서도 이를 자유롭게 증가시킬 수 있는 해마 신경망 학습 알고리즘을 이용하여 이루어지므로 문자 인식율을 최대화시킬 수 있다.

Description

해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템{CHARACTER RECOGNITION METHOD AND SYSTEM USING HIPPOCAMPAL NEURAL NETWORK LEARNING ALGORITHM}
도 1은 문서인식기술이 적용되는 예를 설명하기 위한 도면;
도 2는 종래 문서인식방법에 적용되는 신경망 알고리즘의 개념을 설명하기 위한 도면;
도 3은 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 설명하기 위한 도면;
도 4는 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템을 설명하기 위한 도면;
도 5는 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법을 설명하기 위한 플로우챠트;
도 6은 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템의 일례를 보여주는 도면;
도 7은 도 6에서 보인 시스템을 사용하여 최초의 인식데이터베이스를 구성하기 위한 학습 데이트의 일례를 보여주는 도면;
도 8은 도 7의 학습 데이터를 텍스트로 변환한 결과를 보여주는 도면;
도 9a 및 도 9b는 워드 프로세서로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면;
도 10a 및 도 10b는 필기체 숫자로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면;
도 11a 및 도 11b는 필기체 문자로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면이다.
* 도면의 주요 부분에 대한 부호의 설명 *
10 : 문서인식시스템
20 : 스캔 유니트
30 : 인식 유니트
32 : 프로세서
34 : 인식 처리프로그램
36 : 단기인식 데이터베이스(DB)
38 : 장기인식 데이터베이스(DB)
40 : 출력 유니트
본 발명은 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 관한 것으로, 좀 더 구체적으로는 종래기술에 적용되는 신경망 알고리즘보다 향상된 해마 신경망 학습 알고리즘을 적용하여 문자인식을 수행하도록 하므로써 이미지로부터의 문자 인식율을 더욱 높일 수 있도록 하기 위한 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 관한 것이다.
현재, 다양한 산업분야에서 문자인식기술의 향상이 요구되고 있다. 예컨대, 은행, 카드회사, 관공서 등 대량의 서류를 신속하고 정확하게 처리하거나, 로봇 응용기술에서 자동제어 능력을 향상시키기 위해 더욱 향상된 문자인식기술이 요구되고 있는 것이다. 일례로, 은행이나 카드 회사 등에서는 카드의 발급시, 도 1에서 보는 바와 같은, 카드 신청서를 작성하도록 하고, 이를 스캔 처리를 통해 이미지로 변환한 다음, 그 이미지로부터 필요한 정보(각 기재 항목, 서명 등)를 추출하여 전산처리를 위한 데이터 베이스를 형성할 수 있도록 하고 있다. 이때, 데이터 베이스를 형성하기 위해 이미지로부터 서명 및 사진 등의 이미지 추출은 이미지 획득기술을 통해 이루어지고, 텍스트로 이루어지는 각 기재 항목의 추출은 문자인식기술을 통해 이루어지게 된다.
이때, 이와 같은 문자인식과 관련된 다양한 기술이 제안되어 있다. 예컨대, 대한민국 특허공보 공고번호 특1991-0005390호 "자동문서처리 및 영문자 인식방법", 특1993-0008060호 "문서 인식방법", 특1994-0009749호 "글자 분할 방법", 특1994-0007615호 "문자인식에서 좌, 우 거리모양을 이용한 후보문자 분류방법", 등록특허공보 공고번호 제10-0214680호 "문자 인식방법", 공개특허공보 공개번호 특2002-0067850호 "문서인식시스템 및 그 방법" 및 등록특허공보 등록번호 제10-0582514호 "문자 인식 장치 및 방법" 등은 문자인식을 효과적으로 수행하기 위한 기술을 제안하고 있는 것이다.
그러나, 이와 같은 종래기술은 문자인식기술의 일부분에서는 나름대로 그 전단계의 기술에 비해 향상되었다 할지라도, 신경망 알고리즘으로 알려져 있는 문자인식방법을 적용하고 있어, 문자인식능력의 확장이 어렵고, 사람에 따라 다양하게 변화되는 필기체를 효과적으로 인식하기 어려운 문제점이 있는 것이다. 즉, 종래기술의 문자인식방법에 적용되는 신경망 알고리즘은, 도 2에서 보는 바와 같이, 어떤 문자("가")를 인식할 때 패턴(P1, ..., P4)의 특성(C1, ..., C6)과는 상관없이 특징 개수가 모두 동일하게 비교된다. 따라서, 종래기술에 따른 문자인식방법은, 도 2에서 보는 바와 같이, 설정된 패턴(P1, ..., P4)과 특성(C1, ..., C6)의 개수에 한정되고, 이를 증가시키기 위해서는 다시 패턴과 특성을 다시 설정해야 하는 문제점이 있는 것이다.
따라서, 종래기술에 따른 문서인식기술이 적용된 시스템은 특정문자의 인식시 한정된 패턴과 특성을 사용하여 이루어지게 되므로, 다양한 필기체를 효과적으로 인식할 수 없어 작업자가 별도로 입력하는 작업이 병행되어 하므로 실질 적용에 있어서 오히려 불편을 초래하는 문제점이 있는 것이다.
따라서, 본 발명은 이와 같은 종래 기술의 문제점을 개선하여 문자 인식율을 최대화시킬 수 있는 새로운 형태의 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 제공하는 하는 것을 목적으로 한다.
특히, 본 발명은 종래기술에 적용되는 신경망 알고리즘보다 향상된 해마 신경망 학습 알고리즘을 적용하여 문자인식을 수행하도록 하므로써 이미지로부터의 문자 인식율을 더욱 높일 수 있는 새로운 형태의 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 제공하는 하는 것을 목적으로 한다.
또한, 본 발명은 설정된 패턴과 특성의 개수에 한정되고, 이를 증가시키기 위해서는 다시 패턴과 특성을 다시 설정해야 하는 종래기술과 달리 인식대상문자의 패턴과 특성의 개수에 한정되지 않고, 인식 데이터베이스의 안정성을 확보하면서도 이를 자유롭게 증가시킬 수 있는 새로운 형태의 해마 신경망 학습 알고리즘을 이용 한 문자인식방법 및 시스템을 제공하는 하는 것을 목적으로 한다.
상술한 목적을 달성하기 위한 본 발명의 특징에 의하면, 본 발명의 문서를 스캔하여 얻은 문서 이미지에서 인식대상문자의 문자이미지를 추출하는 단계와; 상기 추출된 문자이미지를 전처리하여 텍스트로 변환하고, 상기 변환된 텍스트로부터 문자의 특징들을 추출하는 단계와; 패턴의 출력회수로 설정된 문턱치 이상의 패턴들로 이루어지는 장기인식 데이터베이스에서 상기 추출된 문자의 특징들과 동일한 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력되도록 하는 제 1 패턴 출력단계와; 상기 제 1 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 문턱치 이하의 패턴들로 이루어지는 단기인식 데이터베이스에서 상기 추출된 문자의 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력되도록 하는 제 2 패턴 출력단계와; 상기 제 2 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 장기인식 데이터베이스에서 패턴의 특성의 차이로 설정된 호감치 이상의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력되도록 하는 제 3 패턴 출력단계 및; 상기 제 3 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 단기인식 데이터베이스에서 상기 호감치 이상을 갖는 패턴 중에서 최대의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력되도록 하는 제 4 패턴 출력단계를 포함한다.
이와 같은 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방 법에서 상기 제 3 패턴 출력단계는 상기 설정된 호감치 이상의 호감치를 갖는 패턴을 상기 제 3 패턴 출력단계에서 출력되는 패턴의 하부에 연결되도록 시냅스로 형성하므로써 상기 장기인식 데이터베이스를 갱신하는 단계를 더 구비할 수 있다.
이와 같은 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법에서 상기 제 2 패턴 출력단계는 출력되는 패턴의 문턱치를 지정된 값만큼 갱신시키는 단계를 더 구비하고, 상기 제 4 패턴 출력단계는 상기 추출된 문자의 특징들로 이루어지는 새로운은 패턴을 형성하므로써 상기 단기인식 데이터베이스를 갱신하는 단계를 더 구비할 수 있다.
상술한 목적을 달성하기 위한 본 발명의 다른 특징에 의하면, 문서를 스캔하여 문서 이미지를 형성하기 위한 스캔 유니트(20)와; 상기 스캔 유니트(20)로부터 문서 이미지를 전송받고, 상기 문서 이미지로부터 인식대상문자의 문자이미지를 추출한 후, 상기 추출된 문자이미지를 전처리하여 텍스트로 변환하며, 상기 변환된 텍스트로부터 문자의 특징들을 추출하여 인식결과가 출력되도록 하기 위한 인식 유니트(30)를 포함하되; 상기 인식 유니트(30)는 패턴의 출력회수로 설정된 문턱치 이하의 패턴들로 이루어지는 단기인식 데이터베이스(36)와, 상기 문턱치 이상의 패턴들로 이루어지는 장기인식 데이터베이스(38) 및, 인식처리 프로그램(34)을 구동시키고, 상기 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 사용하여 상기 추출된 문자의 특징들과 조건이 맞는 패턴을 획득하여 상기 인식결과가 출력 되도록 하는 프로세서(32)를 구비한다.
도 3은 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 설명하기 위한 도면이다.
도 3을 참조하면, 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법은 문턱치와 호감치를 기준으로 하여 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)로 구성되는 인식 데이터베이스를 사용하므로써 이루어진다.
이때, 문턱치는 인식대상문자의 최종 인식결과에 해당하는 패턴의 출력회수를 기준으로 단기인식 데이터베이스(36)의 패턴(P100, P101, P102, ...)을 장기인식 데이터베이스(38)의 패턴(P1, P2, P3, ...)으로 변환하도록 하기 위한 설정값이다. 예컨대, 인식처리 프로그램상에서 문턱치를 5로 지정한다면, 단기인식 데이터베이스(36)에서 5번 이상 출력되는 패턴은 장기인식 데이터베이스(38)로 갱신되므로써 추후 문자인식시 그 처리속도를 높일 수 있도록 하는 것이다.
그리고, 호감치는 패턴(인식결과로 출력되는 문자)의 특성(C1, ...., C10)의 차이를 기준으로 패턴의 지정을 구별하기 위해 설정되는 값으로, 장기인식 데이터베이스(36)의 특정 패턴에 대해 설정된 호감치 이상을 갖는 경우 그 패턴의 시냅스(synapse, S1, S2)로 형성되어 장기인식 데이터베이스(36)에 저장된다. 또한, 이 호감치는 인식대상문자의 특성들이 장기인식 데이터베이스(36)의 특정 패턴에 대해 설정된 호감치 이하를 갖고, 단기인식 데이터베이스(36)의 특정 패턴과 일치하지 않는 경우 단기인식 데이터베이스(36)에서 최대한 근접되는 특정 패턴을 취하면서 특성들을 달리하는 새로운 패턴으로 형성하도록 하는 기준이 된다. 예컨대, 도 3에서 장기인식 데이터베이스(36)의 패턴 P1가 C1, C2, C3, C4, C5, C6로 이루어지는 특성들을 갖는 경우, 호감치가 1(여기서는 설명의 편의를 위해 숫자로 표현하였다)로 설정된다면, 인식대상문자의 특성들이 C1, C2, C3, C4, C5, C7으로 이루어지는 경우, 이 인식대상문자는 패턴 P1에 대한 호감치가 1이 되어 패턴 P1으로 인식결과로 출력되고, 패턴 P1의 시냅스로 형성되면서 장기인식 데이터베이스(38)를 갱신하게 된다. 그리고, 인식대상문자의 특성들이 C1, C2, C3, C4, C9, C10으로 이루어지는 경우, 이 인식대상문자는 패턴 P1에 대한 호감치가 2가 되므로, 단기인식 데이터베이스(36)에서 최대한 근접되는 특정 패턴을 취하면서 새로운 패턴 P100으로 형성되면서 단기인식 데이터베이스(36)를 갱신하게 된다. 이와 같은 호감치의 도입은 문자인식을 위한 데이터베이스의 갱신시 신규 패턴이 입력되었을 때 기존 패턴이 소멸되므로써 발생되는 인식율의 저하와 혼란을 효과적으로 방지하고, 문자인식을 위한 데이터베이스를 안정적으로 유지하면서 확대생산할 수 있도록 한다.
인간의 해마 시스템은 과거 수십 년 동안 광범위하게 연구되어 왔다. 공학부분에서 많이 응용되고 있는 신경망은 뇌의 학습-기억 활동을 모태로 다양한 분야 에서 응용되고 있다. 해마 신경망의 학습 알고리즘은 추출한 특징 배열들을 해마 신경 구조의 3단계 과정을 거쳐 단기기억과 장기기억으로 나누고 오인식이 일어나는 단계에서 동적으로 뉴런의 개수를 증가시켜서 새로운 기억으로 만들며, 재학습의 단점을 극복하는 것으로 알려져 있다(Kandel, E.R. et al., "Principles of Neural Science, 4th edition", McGraw-Hill, 2000; Zheru Chi, Jing Wu and Hong Yan, "Handwritten Numeral Recognition Using Self-Organizing Maps and Fuzzy Rules", Pattern Recognition, Vol.28, No.1, pp. 59-66, 1995; 이케가야 유지, 이토이 시게사토, "해마", 은행나무, 2003; Dayan, P. and Abbott, L.F., "Theoretical Neuroscience", MIT press, 2001; Ventriglia, F. and Maio, V.D., "Synaptic fusion pore structure and AMPA receptor activation according to Brownian simulation of glutamate diffusion", Biological Cybernetics, Vol. 88, No, 3, 2003, 민병경, "민병경의 재미있는 뇌 과학 이야기", http://mind21.net/scienceall-7.htm. 등). 본 발명은 이와 같은 해마 신경망의 학습 알고리즘의 원리를 문자인식에 적용하는 것을 기술적 특징으로 한다.
이하 본 발명의 바람직한 실시예를 첨부된 도면 도 4 및 도 11b에 의거하여 상세히 설명한다. 한편 각 도면에서 일반적인 문서를 스캔하여 이미지화하는 기술, 문서이미지로부터 인식하고자 하는 문자이미지를 추출하는 기술, 추출된 문자이미지를 텍스트로 변환하는 기술, 변환된 텍스트로부터 특징들을 추출하는 기술 등 문자 또는 문서인식과 관련되어 종래 제안된 기술 및 이 분야의 관련된 기술로 부터 용이하게 알 수 있는 구성과 그에 대한 작용 및 효과에 대한 도시 및 상세한 설명은 간략히 하거나 생략하고 본 발명과 관련된 부분들을 중심으로 도시하였다.
도 4는 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템을 설명하기 위한 도면이고, 도 5는 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법을 설명하기 위한 플로우챠트이다.
도 4를 참조하면, 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템(10)은 스캔 유니트(20) 및 인식 유니트(30)를 구비하여 이루어진다. 그리고, 인식 유니트(30)에서 처리된 결과를 처리하기 위한 프린터 등의 출력 유니트(50)가 구비된다. 이때, 스캔 유니트(20)는 문서를 스캔하여 문서 이미지를 형성하는 것으로, 대표적으로 스캐너가 사용된다. 그리고, 인식 유니트(30)는 스캔 유니트(20)로부터 문서 이미지를 전송받고, 문서 이미지로부터 인식대상문자의 문자이미지를 추출한 후, 추출된 문자이미지를 전처리하여 텍스트로 변환하며, 변환된 텍스트로부터 문자의 특징들을 추출하여 인식결과가 출력되도록 한다.
본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템(10)에서 인식 유니트(30)는 통상 데이터 처리를 위해 사용되는 컴퓨터이다. 이와 같은 인식 유니트(30)에는 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인 식방법을 구현하기 위한 인식처리 프로그램(34), 단기인식 데이터베이스(36) 및 장기인식 데이터베이스(38)를 구비하여 이루어진다. 이때, 단기인식 데이터베이스(36)는 패턴의 출력회수로 설정된 문턱치 이하의 패턴들로 이루어지고, 장기인식 데이터베이스(38)는 문턱치 이상의 패턴들로 이루어진다. 이와 같은 인식 유니트(30)는 프로세서(32)에서 인식처리 프로그램(34)을 구동시키고, 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 사용하여 추출된 문자의 특징들과 조건이 맞는 패턴을 획득하여 인식결과가 출력되도록 한다.
도 5를 참조하면, 상술한 바와 같은 해마 신경망 학습 알고리즘을 이용한 문자인식시스템(10)을 사용한 문자인식방법은 먼저, 문서를 스캔하여 얻은 문서 이미지에서 인식대상문자의 문자이미지를 추출한다(S100). 다음, 추출된 문자이미지를 전처리하여 텍스트로 변환(S112)하고, 세선화 과정(S114) 등을 통해 변환(S110)된 텍스트로부터 문자의 특징들을 추출한다(S120). 이와 같은 과정은 일반적으로 제공되고 있는 기술을 적용할 수 있는 것이므로 상세한 설명은 생략한다.
이와 같은 과정이 완료되면, 전술한 인식 유니트(30)에서는 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 적용하여 제 1 패턴 출력단계(S130), 제 2 패턴 출력단계(S140), 제 3 패턴 출력단계(S150) 및 제 4 패턴 출력단계(S160)로 이루어지는 인식과정이 이루어진다. 이때, 제 1 패턴 출력단계(S130)는 패턴의 출력회수로 설정된 문턱치 이상의 패턴들로 이루어지는 장기인식 데이터베이스(38)에서 추출된 문자의 특징들과 동일한 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력(S170)되도록 한다. 그리고, 제 2 패턴 출력단계(S140)는 제 1 패턴 출력단계(S130)에서 동일한 패턴이 없는 경우, 문턱치 이하의 패턴들로 이루어지는 단기인식 데이터베이스(36)에서 추출된 문자의 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력(S170)되도록 한다. 그리고, 제 3 패턴 출력단계(S150)는 제 2 패턴 출력단계(S140)에서 동일한 패턴이 없는 경우 장기인식 데이터베이스(38)에서 패턴의 특성의 차이로 설정된 호감치 이상의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력(S170)되도록 한다. 또한, 제 4 패턴 출력단계(S160)는 제 3 패턴 출력단계(S150)에서 동일한 패턴이 없는 경우 단기인식 데이터베이스(36)에서 호감치 이상을 갖는 패턴 중에서 최대의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력되도록 한다.
한편, 전술한 제 2 패턴 출력단계(S140), 제 3 패턴 출력단계(S150) 및 제 4 패턴 출력단계(S160)는 문턱치 및 호감치와 관련된 후속 단계를 동시에 진행한다. 즉, 제 2 패턴 출력단계(S140)는 출력되는 패턴의 문턱치를 지정된 값(예컨대, 1만큼 상승)만큼 갱신시키는 과정(S142)을 진행하고, 제 3 패턴 출력단계(S150)는 설정된 호감치 이상의 호감치를 갖는 패턴을 제 3 패턴 출력단계(S150)에서 출력되는 패턴의 하부에 연결되도록 시냅스로 형성하므로써 장기인식 데이터베이스(38)를 갱신하며(S152), 제 4 패턴 출력단계(S160)는 추출된 문자의 특징들로 이루어지는 새로운 패턴을 형성하므로써 단기인식 데이터베이스(36)를 갱신(S162)하게 된다.
도 6은 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식시스템의 일례를 보여주는 도면이고, 도 7은 도 6에서 보인 시스템을 사용하여 최초의 인식데이터베이스를 구성하기 위한 학습 데이트의 일례를 보여주는 도면이며, 도 8은 도 7의 학습 데이터를 텍스트로 변환한 결과를 보여주는 도면이고, 도 9a 및 도 9b는 워드 프로세서로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면이며, 도 10a 및 도 10b는 필기체 숫자로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면이고, 도 11a 및 도 11b는 필기체 문자로 작성된 인식실험 샘플 및 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 따라 출력된 결과를 보여주는 도면이다.
도 6을 참조하면, 본 발명의 바람직한 실시예에 따른 시스템은 카메라를 적용하여 문서를 스캔하는 스캐너(스캔 유니트)와, 이 스캐너로부터 문서이미지를 전송받아 처리하는 인식 유니트인 컴퓨터로 구성된다. 스캐너는 카메라를 사용하여 문서의 이미지를 읽어 들인 후, 문서이미지를 USB 2.0 통신프로토콜 방식으로 컴퓨터로 전송하게 된다. 전송된 문서이미지는 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법으로 판독하게 되고, 지정된 어플리케이션에 사용되게 된다.
이와 같은 시스템을 사용하여 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법의 인식정도를 확인하기 위해 도 7에서와 같이 사람이 손으로 쓴 필기체 문자로 이루어지는 학습 데이터를 사용하여 최초의 인식데이터베이스를 구성하였다. 이때, 학습 데이터는 필기체 문자의 학습을 위해 샘플 필기체 문자 100가지의 자료를 준비했다. 준비된 학습 데이터는 임의의 100사람이 영문자 a부터 z까지 쓴 이미지를 사용했다. 이와 같은 학습 데이터의 이미지를 텍스트로 변환하는 프로그램을 사용하여, 도 8에서 보는 바와 같이 텍스트 파일로 변환한다. 변환된 텍스트 파일은 프로그램 소스내에 저장시키고 학습에 사용하여 본 발명에 적용하기 위한 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 구성하였다.
이와 같이 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)가 준비된 후 인식실험을 실시하였다. 이와 같은 실험은 인식률과 시간의 결과에 중점을 두었다. 문자는 영문에 한정하며, 워드 프로세서로 작성한 문서, 필기체 숫자 그리고 필기체 영문자를 인식하는 실험을 하였다. 또한, 필기체 영문자는 소문자만을 실험하였으며, 학습 데이터 역시 소문자로 국한했다.
실험과정을 보면, 도 9a와 같이 워드 프로세서로 작성된 인식실험 샘플에 대한 인식결과는 도 9b와 같이 출력되었고, 도 10a와 같이 필기체 숫자로 작성된 인 식실험 샘플에 대한 인식결과는 도 10b와 같이 출력되었으며, 도 11a와 같이 필기체 문자로 작성된 인식실험 샘플에 대한 인식결과는 도 11b와 같이 출력되었다. 이때, 워드 프로세서를 제외한 필기체 숫자와 영문자는 20명의 사람들로부터 샘플을 구하여 실험을 하였고, 그 중 비교적 특이한 필체인 4가지의 필기체 문자 인식 결과는 다음 [표 1]과 같았다.
Figure 112007014492821-PAT00001
이와 같이 [표 1]을 보면, 본 발명에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 의하면, 필기체 숫자에서는 5를 인식하지 못하는 경우가 있었고, 9는 1로 오인식하는 경우가 있었으며, 필기체 문자에서는 i를 t로 j를 i로 l을 인식하지 못하는 경우가 있었지만, 특이한 필기체를 대상으로 하였는데도 불구하고, 보통 알아보기 쉬운 글자체라 판단할 수 있는 필체들은 모두 인식함을 알 수 있다.
따라서, 본 발명에 따르면, 일반 사람이 알아볼 수 있는 정도의 필기체 문자 및 숫자는 거의 완벽한 인식할 수 있으므로, 현재 사무실 혹은 공공기관이나 은행 등에서 사람이 직접 문서를 확인하고 타이핑을 해야하는 경우에 보다 능률적인 작업환경을 구축할 수 있다.
상술한 바와 같은, 본 발명의 바람직한 실시예에 따른 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템을 상기한 설명 및 도면에 따라 도시하였지만, 이는 예를 들어 설명한 것에 불과하며 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 다양한 변화 및 변경이 가능하다는 것을 이 분야의 통상적인 기술자들은 잘 이해할 수 있을 것이다.
본 발명에 의한 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및 시스템에 의하면, 종래기술과 달리 인식대상문자의 패턴과 특성의 개수에 한정되지 않고, 인식 데이터베이스의 안정성을 확보하면서도 이를 자유롭게 증가시킬 수 있는 해마 신경망 학습 알고리즘을 이용하여 이루어지므로 문자 인식율을 최대화시킬 수 있다. 특히, 본 발명은 증권사, 카드회사, 은행, 공공기관 등 필기체가 많은 서류를 대량으로 처리해야 하는 곳에서 문자의 인식율을 극대화시켜 처리과정의 안정성을 확보할 수 있으므로, 스캔을 통해 문서이미지를 형성하는 단계부터 데이터베이 스로 형성하는 과정을 자동화로 구축할 수 있도록 한다.

Claims (4)

  1. 문서를 스캔하여 얻은 문서 이미지에서 인식대상문자의 문자이미지를 추출하는 단계와;
    상기 추출된 문자이미지를 전처리하여 텍스트로 변환하고, 상기 변환된 텍스트로부터 문자의 특징들을 추출하는 단계와;
    패턴의 출력회수로 설정된 문턱치 이상의 패턴들로 이루어지는 장기인식 데이터베이스에서 상기 추출된 문자의 특징들과 동일한 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력되도록 하는 제 1 패턴 출력단계와;
    상기 제 1 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 문턱치 이하의 패턴들로 이루어지는 단기인식 데이터베이스에서 상기 추출된 문자의 특징들을 갖는 패턴을 추적하여 동일한 패턴이 출력되도록 하는 제 2 패턴 출력단계와;
    상기 제 2 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 장기인식 데이터베이스에서 패턴의 특성의 차이로 설정된 호감치 이상의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력되도록 하는 제 3 패턴 출력단계 및;
    상기 제 3 패턴 출력단계에서 동일한 패턴이 없는 경우 상기 단기인식 데이터베이스에서 상기 호감치 이상을 갖는 패턴 중에서 최대의 호감치를 갖는 패턴을 추적하여 해당하는 패턴이 출력되도록 하는 제 4 패턴 출력단계를 포함하는 것을 특징으로 하는 해마 신경망 학습 알고리즘을 이용한 문자인식방법.
  2. 제 1 항에 있어서,
    상기 제 3 패턴 출력단계는 상기 설정된 호감치 이상의 호감치를 갖는 패턴을 상기 제 3 패턴 출력단계에서 출력되는 패턴의 하부에 연결되도록 시냅스로 형성하므로써 상기 장기인식 데이터베이스를 갱신하는 단계를 더 구비하는 것을 특징으로 하는 해마 신경망 학습 알고리즘을 이용한 문자인식방법.
  3. 제 1 항 또는 제 2 항에 있어서,
    상기 제 2 패턴 출력단계는 출력되는 패턴의 문턱치를 지정된 값만큼 갱신시키는 단계를 더 구비하고,
    상기 제 4 패턴 출력단계는 상기 추출된 문자의 특징들로 이루어지는 새로운은 패턴을 형성하므로써 상기 단기인식 데이터베이스를 갱신하는 단계를 더 구비하는 것을 특징으로 하는 해마 신경망 학습 알고리즘을 이용한 문자인식방법.
  4. 문서를 스캔하여 문서 이미지를 형성하기 위한 스캔 유니트(20)와;
    상기 스캔 유니트(20)로부터 문서 이미지를 전송받고, 상기 문서 이미지로부터 인식대상문자의 문자이미지를 추출한 후, 상기 추출된 문자이미지를 전처리하여 텍스트로 변환하며, 상기 변환된 텍스트로부터 문자의 특징들을 추출하여 인식결과 가 출력되도록 하기 위한 인식 유니트(30)를 포함하되;
    상기 인식 유니트(30)는 패턴의 출력회수로 설정된 문턱치 이하의 패턴들로 이루어지는 단기인식 데이터베이스(36)와,
    상기 문턱치 이상의 패턴들로 이루어지는 장기인식 데이터베이스(38) 및,
    인식처리 프로그램(34)을 구동시키고, 상기 단기인식 데이터베이스(36)와 장기인식 데이터베이스(38)를 사용하여 상기 추출된 문자의 특징들과 조건이 맞는 패턴을 획득하여 상기 인식결과가 출력되도록 하는 프로세서(32)를 구비하는 것을 특징으로 하는 해마 신경망 학습 알고리즘을 이용한 문자인식시스템.
KR1020070016335A 2007-02-16 2007-02-16 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템 KR100894870B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070016335A KR100894870B1 (ko) 2007-02-16 2007-02-16 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070016335A KR100894870B1 (ko) 2007-02-16 2007-02-16 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템

Publications (2)

Publication Number Publication Date
KR20080076433A true KR20080076433A (ko) 2008-08-20
KR100894870B1 KR100894870B1 (ko) 2009-04-24

Family

ID=39879689

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070016335A KR100894870B1 (ko) 2007-02-16 2007-02-16 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템

Country Status (1)

Country Link
KR (1) KR100894870B1 (ko)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509947A (zh) * 2018-01-29 2018-09-07 佛山市南海区广工大数控装备协同创新研究院 一种基于人工神经网络的自动识别打磨方法
KR102125056B1 (ko) 2019-03-26 2020-06-19 부산대학교 산학협력단 혼합문자 자동인식을 위한 문자 및 서적 생성 시스템 및 방법 그리고 이를 이용한 검색 시스템 및 방법
CN112115949A (zh) * 2020-09-24 2020-12-22 深圳爱莫科技有限公司 一种烟草证件以及订单的光学文字识别方法
CN112215216A (zh) * 2020-09-10 2021-01-12 中国东方电气集团有限公司 一种图像识别结果的字符串模糊匹配系统及方法
CN117754464A (zh) * 2023-07-28 2024-03-26 嘉兴市安得特种设备科技有限公司 一种铝压铸件的智能打磨控制方法与系统

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105956626A (zh) * 2016-05-12 2016-09-21 成都新舟锐视科技有限公司 基于深度学习的对车牌位置不敏感的车牌识别方法
KR20210034869A (ko) 2019-09-23 2021-03-31 한국전력공사 수기 표 이미지의 디지털 이미지 변환 방법

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100306848B1 (ko) 1999-06-19 2001-09-24 윤덕용 신경회로망을 이용한 선택적 주의집중 방법

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108509947A (zh) * 2018-01-29 2018-09-07 佛山市南海区广工大数控装备协同创新研究院 一种基于人工神经网络的自动识别打磨方法
KR102125056B1 (ko) 2019-03-26 2020-06-19 부산대학교 산학협력단 혼합문자 자동인식을 위한 문자 및 서적 생성 시스템 및 방법 그리고 이를 이용한 검색 시스템 및 방법
CN112215216A (zh) * 2020-09-10 2021-01-12 中国东方电气集团有限公司 一种图像识别结果的字符串模糊匹配系统及方法
CN112115949A (zh) * 2020-09-24 2020-12-22 深圳爱莫科技有限公司 一种烟草证件以及订单的光学文字识别方法
CN112115949B (zh) * 2020-09-24 2024-05-28 深圳爱莫科技有限公司 一种烟草证件以及订单的光学文字识别方法
CN117754464A (zh) * 2023-07-28 2024-03-26 嘉兴市安得特种设备科技有限公司 一种铝压铸件的智能打磨控制方法与系统
CN117754464B (zh) * 2023-07-28 2024-05-17 嘉兴市安得特种设备科技有限公司 一种铝压铸件的智能打磨控制方法与系统

Also Published As

Publication number Publication date
KR100894870B1 (ko) 2009-04-24

Similar Documents

Publication Publication Date Title
Dutta et al. Improving CNN-RNN hybrid networks for handwriting recognition
KR100894870B1 (ko) 해마 신경망 학습 알고리즘을 이용한 문자인식방법 및시스템
Shelke et al. A novel multi-feature multi-classifier scheme for unconstrained handwritten devanagari character recognition
Hashim et al. A comparative study among handwritten signature verification methods using machine learning techniques
Sulong et al. Offline handwritten signature identification using adaptive window positioning techniques
Sudharshan et al. Handwritten signature verification system using deep learning
Djoudjai et al. Open writer identification from offline handwritten signatures by jointing the one-class symbolic data analysis classifier and feature-dissimilarities
Noor et al. Offline handwritten signature recognition using convolutional neural network approach
Prashanth et al. DWT based offline signature verification using angular features
Angadi et al. Offline signature recognition system using radon transform
Abdul-Haleem Offline handwritten signature verification based on local ridges features and haar wavelet transform
Kalita et al. A combined approach of feature selection and machine learning technique for handwritten character recognition
Mioulet et al. Exploring multiple feature combination strategies with a recurrent neural network architecture for off-line handwriting recognition
Rangari et al. Cursive handwriting recognition using CNN with VGG-16
Kunte et al. A bilingual machine-interface OCR for printed Kannada and English text employing wavelet features
Ajao et al. Yoruba handwriting word recognition quality evaluation of preprocessing attributes using information theory approach
Douma et al. A comparison of Pattern Recognition Approaches for Recognizing Handwriting in Arabic Letters
Ebrahim Classification of Arabic Autograph as Genuine‎ And Forged through a Combination of New‎ Attribute Extraction Techniques
Shekar et al. Offline Signature verification using CNN and SVM classifier
Mangoli et al. Optical character recognition for cursive handwriting
Desai et al. Signature Verification and Forgery Recognition System Using KNN, Backpropagation and CNN
Padmashali et al. Handwritten Digit Recognition Using Deep Learning
Chugh et al. Kohonen Networks for Offline Signature Verification
Saleem et al. Handwritten Recognition of Character and Number Using Convolutional Neural Network and Support Vector Machine
Harris et al. An Improved Signature Forgery Detection using Modified CNN in Siamese Network

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
N231 Notification of change of applicant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130415

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140325

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee