KR101801153B1 - 기계학습 기반의 문자 인식 시스템 - Google Patents

기계학습 기반의 문자 인식 시스템 Download PDF

Info

Publication number
KR101801153B1
KR101801153B1 KR1020160184254A KR20160184254A KR101801153B1 KR 101801153 B1 KR101801153 B1 KR 101801153B1 KR 1020160184254 A KR1020160184254 A KR 1020160184254A KR 20160184254 A KR20160184254 A KR 20160184254A KR 101801153 B1 KR101801153 B1 KR 101801153B1
Authority
KR
South Korea
Prior art keywords
handwritten
machine learning
text
data
handwritten information
Prior art date
Application number
KR1020160184254A
Other languages
English (en)
Inventor
이경민
김진우
김형욱
권영은
Original Assignee
이경민
김진우
김형욱
권영은
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이경민, 김진우, 김형욱, 권영은 filed Critical 이경민
Priority to KR1020160184254A priority Critical patent/KR101801153B1/ko
Application granted granted Critical
Publication of KR101801153B1 publication Critical patent/KR101801153B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06K9/00402
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06K9/3283
    • G06K9/6256
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • G06K2209/01
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

본 기술은 기계 학습 기반의 문서 인식 시스템을 개시된다. 본 발명의 구체적인 예에 따르면, 새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하고 구축된 글체에 대한 모델 및 입력된 필체 정보에 대해 기계 학습 알고리즘을 수행하여 입력된 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성함에 따라, 기존의 OCR 및 기계 학습 알고리즘을 이용하여 종이의 인쇄체뿐만 아니라 손글씨의 필체에 대한 문서 인식율을 극대화할 수 있다.

Description

기계학습 기반의 문자 인식 시스템{SYSTEM FOR RECOGNITING CHARACTER BASED ON MACHINE LEARNING}
본 발명은 기계학습 기반의 문자 인식 시스템에 관한 것으로서, 더욱 상세하게는 개인의 필체 정보 및 기 구축된 글체에 대한 모델을 토대로 기계학습을 수행하여 종이의 인쇄체 및 손글씨의 필체에 대한 문자 인식율을 향상시킬 수 있도록 한 기술에 관한 것이다.
컴퓨터 기술(예를 들어, 마이크로프로세서 속도, 메모리 용량, 데이터 전송 대역폭, 소프트웨어 기능 등)의 발달은 일반적으로 다양한 산업에서 증가된 컴퓨터 애플리케이션에 기여했다. 예를 들어, 컴퓨터 기반의 의사결정 지원 시스템은 광 문자 인식(Optical Character Recognition: OCR) 및 관련된 텍스트 인식 애플리케이션과 같은 인식 시스템에서 일반적으로 이용된다.
통상적으로, 스캐너 또는 광 이미저(imager)는 처음에 그림을 "디저털화"하기 위해(예를 들어, 컴퓨팅 시스템내로 이미지를 입력하기 위해) 개발되었다. 그 후, 그러한 시스템은 그외 다른 인쇄 및 활자 소재에 적용되었고, OCR 시스템은 점차 다수의 컴퓨터 애플리케이션으로 확장되었다. 일반적으로, OCR 기술은 가능한 글꼴의 종류의 제한되거나 한정된 선택을 인식하도록 조정된다. 그러한 시스템은 일반적으로 문자를 기존 글꼴의 데이터베이스와 비교함으로써 문자를 "인식"할 수 있다. 글꼴이 일관성이 없다고 여겨지면, OCR 기술은 그러한 일관성 없는 텍스트의 비인식(non-recognition)을 나타내기 위해, 식별 불가능하거나 존재하지 않는 문자를 반환한다.
게다가, 필기(handwriting) 인식은 텍스트 인식보다 훨씬 더 도전적인 시나리오임이 입증되었다. 일반적으로, 사람의 필기는 필법을 통해 나타나는 개인주의적 스타일을 예시한다. 따라서, 당연히, 필기 패턴은 동일한 문자라도 다양한 형태를 나타낸다. 명백하게, 특정 문자에 대한 가능한 모든 필기 형태의 저장은 실행 불가능하다.
그러한 필기 문자와 관련된 패턴을 인식하기 위한 여러 가지 방법이 개발되었다. 대부분의 필기 인식 시스템은 신경망(Neural Nets), HMM(Hidden Markov Models) 또는 KNN(K-Nerest-Neighbor) 방법에 기초한 인식기를 이용한다. 일반적으로, 그러한 시스템은 문자의 전체 모양에 기초하여 문자를 분류하는 작업에서 합리적으로 잘 실행한다. 예를 들어, 유사도 레벨은 패턴들 사이의 거리 치수를 생성함으로써 판정될 수 있다.
그러나, 일반적으로 오프라인 필기 인식으로 알려져 있는 이미지 내의 필기된 텍스트의 인식은 정형화된 인쇄체만을 인식하는 OCR 및 특허 펜 및 패드를 이용하여 문자인식을 실행함에 따라 손글씨체의 경우 문자 인식률이 떨어지는 문제점이 있었다.
이에 본 출원인은 기존의 OCR(Optical Character Reader) 방식에 기 구축된 글체에 대한 모델과 입력된 손글씨의 필체 정보에 대해 기계학습 알고리즘을 수행하여 종이의 인쇄체 및 손글씨의 글체에 대한 문서 인식율을 향상시킬 수 있는 방안을 제안하고자 한다.
이에 본 발명은 새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하고 구축된 글체에 대한 모델 및 입력된 필체 정보에 대해 기계 학습 알고리즘을 수행하여 입력된 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성함에 따라, 기존의 OCR 및 기계 학습 알고리즘을 이용하여 종이의 인쇄체뿐만 아니라 손글씨의 필체에 대한 문서 인식율을 극대화할 수 있는 기계학습 기반의 문자 인식 시스템을 제공하고자 한다.
전술한 목적을 달성하기 위한 본 발명의 기술적 과제는,
개인 별 손글씨의 필체 정보를 획득하는 OCR 단말; 및
상기 OCR 단말을 통해 입력된 필체 정보를 텍스트 형태로 인식하여 표시하는 문자인식 서버를 포함하는 것을 특징으로 한다.
바람직하게 상기 문자인식 서버는, 상기 OCR 단말로부터 획득된 손글씨의 필체 정보를 수신하는 디스패치부; 새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하는 기계 학습 DB; 디스패치부의 손글씨의 필체 정보 입력 시 분석 데이터를 생성하는 분석부; 및 상기 분석부의 분석 데이터에 의거 동작하여 입력된 손글씨의 필체 정보와 기계 학습 DB의 구축된 모델을 토대로 기계 학습 알고리즘을 수행하여 입력된 손글씨의 필체 정보에 대한 문서인식 데이터를 생성하고 생성된 문서인식 데이터를 상기 디스패치부를 통해 OCR 단말로 전송하는 엔진부를 포함할 수 있다.
바람직하게 상기 엔진부는 OCR 단말을 통해 수집된 손글씨의 글체의 이미지를 텍스트 형태로 변환하기 위한 전처리를 수행하는 전처리 모듈; 상기 전처리 완료된 이미지 형태의 손글씨의 글체를 기계 학습 알고리즘을 수행하여 텍스트 형태의 문서 인식 데이터로 변환하는 OCR 모듈; 및 OCR 모듈의 문서인식 데이터를 기 정해진 후리스틱 알고리즘을 수행하여 보정하는 보정 모듈을 포함할 수 있다.
본 발명에 따르면, 새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하고 구축된 글체에 대한 모델 및 입력된 필체 정보에 대해 기계 학습 알고리즘을 수행하여 입력된 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성함에 따라, 기존의 OCR 및 기계 학습 알고리즘을 이용하여 종이의 인쇄체뿐만 아니라 손글씨의 필체에 대한 문서 인식율을 극대화할 수 있는 효과를 얻는다.
이에 본 발명에 의하면 문서인식 데이터의 편집 및 테그 서비스가 가능한 문서 에디터 기능을 부가하여 시간, 및 업무의 효율성, 접근성 및 직관성 등의 편리성을 제공할 수 있는 잇점을 가진다.
본 명세서에서 첨부되는 다음의 도면들은 본 발명의 바람직한 실시 예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니된다.
도 1은 본 발명의 실시 예에 따른 기계학습 기반의 문자 인식 시스템의 개략적인 구성을 보인 도이다.
도 2는 본 발명의 실시 예에 따른 문자 인식 시스템의 OCR 단말의 세부적인 구성을 보인 도이다.
도 3은 본 발명의 실시 예에 따른 문자인식 서버의 세부적인 구성을 보인 도이다.
도 4는 본 발명의 실시 예에 따른 문자 인식 시스템의 문자인식 서버의 엔진부의 세부적인 구성을 보인 도이다.
이하에서는 도면을 참조하여 본 발명의 실시예들을 보다 상세하게 설명한다.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 후술되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 수 있으며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하고, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의될 뿐이다.
본 명세서에서 사용되는 용어에 대해 간략히 설명하고, 본 발명에 대해 구체적으로 설명하기로 한다.
본 발명에서 사용되는 용어는 본 발명에서의 기능을 고려하면서 가능한 현재 널리 사용되는 일반적인 용어들을 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 판례, 새로운 기술의 출현 등에 따라 달라질 수 있다. 또한, 특정한 경우는 출원인이 임의로 선정한 용어도 있으며, 이 경우 해당되는 발명의 설명 부분에서 상세히 그 의미를 기재할 것이다. 따라서 본 발명에서 사용되는 용어는 단순한 용어의 명칭이 아닌, 그 용어가 가지는 의미와 본 발명의 전반에 걸친 내용을 토대로 정의되어야 한다.
명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에서 사용되는 "부"라는 용어는 소프트웨어, FPGA 또는 ASIC과 같은 하드웨어 구성요소를 의미하며, "부"는 어떤 역할들을 수행한다. 그렇지만 "부"는 소프트웨어 또는 하드웨어에 한정되는 의미는 아니다. "부"는 어드레싱할 수 있는 저장 매체에 있도록 구성될 수도 있고 하나 또는 그 이상의 프로세서들을 재생시키도록 구성될 수도 있다.
따라서, 일 예로서 "부"는 소프트웨어 구성요소들, 객체지향 소프트웨어 구성요소들, 클래스 구성요소들 및 태스크 구성요소들과 같은 구성요소들과, 프로세스들, 함수들, 속성들, 프로시저들, 서브루틴들, 프로그램 코드의 세그먼트들, 드라이버들, 펌웨어, 마이크로 코드, 회로, 데이터, 데이터베이스, 데이터 구조들, 테이블들, 어레이들 및 변수들을 포함한다. 구성요소들과 "부"들 안에서 제공되는 기능은 더 작은 수의 구성요소들 및 "부"들로 결합되거나 추가적인 구성요소들과 "부"들로 더 분리될 수 있다.
아래에서는 첨부한 도면을 참고하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략한다.
이하에서는 본 발명의 실시 예를 첨부된 도면에 의거 구체적으로 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 문서인식 시스템의 개략적인 구성을 보인 도이고, 도 2는 도 1에 도시된 문서인식 시스템(S)의 OCR 단말(100)의 세부적인 구성을 보인 도이고, 도 3은 도 1에 도시된 문서인식 서버의 세부적인 구성을 보인 도이며, 도 4는 도 2에 도시된 문서인식 서버의 분석부의 세부적인 구성을 보인 도이다. 도 1 내지 도 4를 참조하면, 본 발명의 실시 예에 따른 문석인식 시스템(S)은, OCR 단말(100)로부터 획득된 손글씨의 필체 정보에 대해 모델을 구축하고 구축된 모델링을 통해 도출된 글체 학습 데이터를 토대로 입력된 손글씨의 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성하여 OCR 단말(100)로 전달하도록 구비될 수 있고, 이에 시스템(S)는 OCR 단말(100) 및 문서인식 서버(200)를 포함할 수 있다.
OCR 단말(100)은 개인 별 소지한 단말로서, 개인의 손글씨의 필체 정보를 획득하고 획득된 손글씨의 필체 정보를 문서인식 서버(200)로 전달하도록 구비될 수 있고, 이러한 OCR 단말(100)은, 수신부(110) 및 아두이노(120)의 구성을 갖춘다,
OCR 단말(100)은 개인 별 손글씨의 필체 정보를 문자인식 서버(200)로 전달하기 위한 실시예로 본 실시 예와 관련된 구성요소들만 이 도시되어 있다. 따라서, 도 1에 도시된 구성요소들 외에 다른 범용적인 구성요소들이 더 포함될 수 있음을 본 실시 예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
수신부(110)는 종이의 인쇄체 정보 및 사용자에 의거 종이에 적은 손글씨의 필체 정보 중 적어도 하나를 이미지 형태로 획득하도록 구비될 수 있으며, 종이 등에 적은 손글씨의 필체 정보를 이미지 형태로 획득하는 일련의 과정은 종이 인쇄된 손글씨의 글체를 이미지 형태로 인식하는 기존의 OCR 방식과 동일 또는 유사하다.
이러한 손글씨의 필체 정보는 개인 식별 데이터를 포함하고, 손글씨의 필체 정보는 아두이노(120)로 전달된다. 이에 아두이노(120)는 이미지 형태의 손글씨의 필체 정보를 네트워크를 통해 문서인식 서버(200)로 전달된다.
이때 아두이노(120)는 근거리 통신망을 이용하여 문자인식 서버(200)로 손글씨의 필체 정보를 전송하는 와이파이 통신망을 이용하며, Node.js를 사용한 Express 서버를 운영하여 Web을 통해 필체 정보를 문자인식 서버(200)에 제공한다. 여기서, Express는 통상의 웹 어플리케이션 서버로 현재 웹 페이지 형태로 제공하고 있는 이미지 표현으로 본 발명에서는 이러한 이미지 표현을 그대로 사용될 수 있다. 이에 와이파이 통신망은 Node.js에 있어서 Server-Side 플랫폼으로 Open Source의 사용이 가능하다.
또한 본 발명의 설명 상의 편의를 위해 아두이노(120)을 포함하는 것으로 설명하고 있으나, 아두이노(120)는 Raspberry Pi와 결합하여 손글씨의 필체 정보를 무선 네트워크를 통해 문자인식 서버(200)로 전달될 수 있다. 같은 네트워크 내에 있는 기기들은 라즈베리파이 3 웹을 통해 문서인식 서버(200)에 접속하여 유무선 공유기를 통해 인터넷에 접속된 라즈베리파이 3는 문서인식 서버(200)로 손글씨의 필체 정보를 전달할 수 있다.
그리고, Raspberry Pi는 손글씨의 필체 정보를 빅데이터로 처리할 수 있는 데이터베이스가 필요함에 따라 빅데이터 기반인 Mongo DB를 이용하여 데이터를 수집하고 처리할 수 있고, 독립된 서버에 설치할 수 있다. 또한 라즈베리파이 3내에서 작동하는 Express는 웹 어플리케이션 서버로 현재 웹페이지 형태로 제공하고 있는 데이터 표현에 사용될 수 있다.
Raspberry Pi는 Node.js를 사용한 Express 서버를 운영하여 Web을 통해 데이터를 제공한다. 여기서, Raspberry Pi는 아두이노(120) 에서 수신한 손글씨의 필체 정보를 정제하고 자체 알고리즘을 통해 분석하여 분석한 데이터를 웹이나 앱을 통해서 사용자에게 제공할 수 있다. Node.js에 있어서, Server-Side 플랫폼으로 아래의 Open Sourece를 사용 가능하게 하였다.
문자인식 서버(200)는 도 2에 도시된 바와 같이, 디스패치부(210), 기계 학습 DB(220), 분석부(230), 및 엔진부(240)를 포함할 수 있다. 본 실시 예에 따른 각 모듈(module) 또는 부는 독립하여 동작 가능한 단위를 나타내며, 소프트웨어 모듈 및 하드웨어 모듈을 모두 포함할 수 있다. 또한, 본 실시 형태에서 디스패치부(210), 기계 학습 DB(220), 분석부(230), 및 엔진부(240)는 설명의 편의상 문서인식 서버(200)에 종속적으로 구성하는 것을 예시하고 있으나, 문서인식 서버(200)와 각 기능별로 독립적으로 구성될 수 있으며, 하나 또는 그 이상의 서버에 상기 기능들이 통합되어 구비될 수 있다. 또한, 설명의 편의에 따라 본 발명과 관련된 구성에 대해서는 설명함에 유의하여야 한다. 필요에 따라 도시된 서버들 외 광고 관련 등과 같은 다양한 기능을 제공하기 위한 서버들이 추가로 포함될 수 있을 것이다.
디스패치부(210)는 수신된 손글씨의 필체 정보를 개인 식별 정보에 대응하여 저장한 후 분석부(230)로 전달한다.
디스패치부(210)는 손글씨의 필체 정보를 빅데이터로 처리할 수 있는 데이터베이스로서, 빅데이터 기반의 몽고디비(Mongo DB)를 이용하여 필체 정보를 수집하고 처리할 수 있다.
기계 학습 DB(220)는 새로운 폰트를 저장하는 기능을 이용하여 손글씨의 필체 정보를 학습 데이터로 저장하여 손글씨의 필체에 대한 모델을 구축한다.
분석부(230)는 수신된 손글씨의 필체 정보를 로우 데이터로 활용하여 분석하기 위한 분석 데이터를 생성하고 생성된 분석 데이터는 엔진부(240)로 전달되며, 엔진부(240)는 수신된 분석 데이터에 의거 구동한다.
엔진부(240)는 수신된 로우 데이터와 기계 학습 DB(224)에 구축된 글체 학습 데이터를 토대로 기계 학습 알고리즘을 수행하여 문서인식 데이터를 생성할 수 있으며, 이에 엔진부(240)는 전처리모듈(241), OCR 모듈(242), 및 보정 모듈(243)을 포함한다. 본 실시 예에 따른 각 모듈(module)은 독립하여 동작 가능한 단위를 나타내며, 소프트웨어 모듈 및 하드웨어 모듈을 모두 포함할 수 있다.
기계 학습 알고리즘은 배깅(bagging), 선형 회귀, 비선형적으로 모델링하는 다층 신경망 회귀, 지지벡터 회귀(Support Vector Regression, SVR), 비지도 학습기법의 하나로 EM(Expectation-maximization) 클러스터링 등 다양한 알고리즘 등 다양한 알고리즘을 포함할 수 있으며, 본 발명에서는 이에 한정하지 아니한다. 즉, 엔진부(240)는 기계 학습 DB(220)를 통해 로우 데이터에 대해 다수의 붓스트랩 자료를 생성하고 각 붓스크랩 자료를 모델링한 후 결합하여 학습 데이터값인 문서인식 데이터를 산출할 수 있다. 이때 붓스크랩 자료는 단순 복원 임의 추출법을 통해 로우 데이터의 크기와 같은 표본 자료이다.
전처리 모듈(241)은 상기 OCR 단말(100)의 이미지 형태의 손글씨의 필체 정보를 문자 인식이 가능한 텍스트 형태로 변환하기 위한 전처리를 수행한다. 이때 전처리 방식은 명암 제거, 노이즈 제거, 종이의 기울기 제거 등의 이미지 프로세싱을 통해 수행된다. 여기서 이미지 프로세싱을 통해 수행하는 이미지 형태의 정보를 전처리 과정은 본 발명의 실시 예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
한편, OCR 모듈(242)는 전처리된 이미지 형태의 손글씨의 필체 정보를 문자 인식하여 문서인식 데이터를 생성할 수 있다. 즉, OCR 모듈(242)는 전처리된 이미지 형태의 손글씨의 필체 정보 및 기계 학습 DB(220)에 구축된 모델의 학습 데이터를 토대로 기계 학습 알고리즘을 수행하여 문서인식 데이터가 도출된다.
그리고, OCR 모듈(242)의 문서인식 데이터를 수신한 보정 모듈(243)은 다른 크기와 대 소문자에 대한 문자 인식을 위해 문장의 위치에 따라 대소문자를 구분하는 휴리스틱 알고리즘을 통해 수신된 문서인식 데이터를 보정한다. 여기서, 문장의 위치에 따른 휴리스틱 알고리즘을 수행하는 일련의 과정은 본 발명의 실시 예와 관련된 기술분야에서 통상의 지식을 가진 자라면 이해할 수 있다.
시간, 및 업무의 효율성, 접근성 및 직관성 등의 편리성을 제공하기 위해, 본 발명의 실시 예에 의거 생성된 문서인식 데이터의 편집 및 태그 서비스가 가능한 문서 에디터 기능을 부가할 수 있다.
본 발명의 실시 예에 의하면, 새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하고 구축된 글체에 대한 모델 및 입력된 필체 정보에 대해 기계 학습 알고리즘을 수행하여 입력된 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성함에 따라, 기존의 OCR 및 기계 학습 알고리즘을 이용하여 종이의 인쇄체뿐만 아니라 손글씨의 필체에 대한 문서 인식율을 극대화할 수 있게 된다. 그에 더하여 문서인식 데이터의 편집 및 테그 서비스가 가능한 문서 에디터 기능을 부가하여 시간, 및 업무의 효율성, 접근성 및 직관성 등의 편리성을 제공할 수 있게 된다.
이상에서 대표적인 실시 예를 통하여 본 발명을 상세하게 설명하였으나, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 상술한 실시 예에 대하여 본 발명의 범주에서 벗어나지 않는 한도 내에서 다양한 변형이 가능함을 이해할 것이다. 그러므로 본 발명의 권리 범위는 설명한 실시 예에 국한되어 정해져서는 안 되며, 후술하는 특허청구범위뿐만 아니라 특허청구범위와 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태에 의하여 정해져야 한다.
새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하고 구축된 글체에 대한 모델 및 입력된 필체 정보에 대해 기계 학습 알고리즘을 수행하여 입력된 필체 정보에 대한 텍스트 형태의 문서인식 데이터를 생성함에 따라, 기존의 OCR 및 기계 학습 알고리즘을 이용하여 종이의 인쇄체뿐만 아니라 손글씨의 필체에 대한 문서 인식율을 극대화할 수 있는 기계 학습 기반의 문서 인식 시스템에 대한 운용의 정확성 및 신뢰도 측면, 더 나아가 성능 효율 면에 매우 큰 진보를 가져올 수 있으며, 문서인식 시스템의 시판 또는 영업의 가능성이 충분할 뿐만 아니라 현실적으로 명백하게 실시할 수 있는 정도이므로 산업상 이용가능성이 있는 발명이다.

Claims (3)

  1. 개인 별 손글씨의 필체 정보를 획득하는 OCR 단말; 및
    상기 OCR 단말을 통해 입력된 필체 정보를 텍스트 형태로 인식하여 표시하는 문자인식 서버를 포함하고,
    상기 문자인식 서버는,
    상기 OCR 단말로부터 획득된 손글씨의 필체 정보를 수신하는 디스패치부;
    새로운 폰트를 저장하는 기능을 이용하여 필체 정보를 글체 학습 데이터로 저장하여 글체에 대한 모델을 구축하는 기계 학습 DB;
    디스패치부의 손글씨의 필체 정보 입력 시 분석 데이터를 생성하는 분석부; 및
    상기 분석부의 분석 데이터에 의거 동작하여 입력된 손글씨의 필체 정보와 기계 학습 DB의 구축된 모델을 토대로 기계 학습 알고리즘을 수행하여 입력된 손글씨의 필체 정보에 대한 문서인식 데이터를 생성하고 생성된 문서인식 데이터를 상기 디스패치부를 통해 OCR 단말로 전송하는 엔진부를 포함하는 것을 특징으로 하는 기계 학습 기반의 문서 인식 시스템.
  2. 삭제
  3. 제1항에 있어서, 상기 엔진부는
    상기 OCR 단말을 통해 수집된 손글씨의 글체의 이미지를 텍스트 형태로 변환하기 위한 전처리를 수행하는 전처리 모듈;
    상기 전처리 완료된 이미지 형태의 손글씨의 글체를 기계 학습 알고리즘을 수행하여 텍스트 형태의 문서 인식 데이터로 변환하는 OCR 모듈; 및
    상기 OCR 모듈의 문서인식 데이터를 기 정해진 후리스틱 알고리즘을 수행하여 보정하는 보정 모듈을 포함하는 것을 특징으로 하는 기계 학습 기반의 문서 인식 시스템.

KR1020160184254A 2016-12-30 2016-12-30 기계학습 기반의 문자 인식 시스템 KR101801153B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160184254A KR101801153B1 (ko) 2016-12-30 2016-12-30 기계학습 기반의 문자 인식 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160184254A KR101801153B1 (ko) 2016-12-30 2016-12-30 기계학습 기반의 문자 인식 시스템

Publications (1)

Publication Number Publication Date
KR101801153B1 true KR101801153B1 (ko) 2017-11-27

Family

ID=60810775

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160184254A KR101801153B1 (ko) 2016-12-30 2016-12-30 기계학습 기반의 문자 인식 시스템

Country Status (1)

Country Link
KR (1) KR101801153B1 (ko)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102003221B1 (ko) * 2018-01-03 2019-07-24 엔에이치엔 주식회사 필기 이미지 데이터 생성 시스템 및 이를 이용한 필기 이미지 데이터 생성 방법
KR102043693B1 (ko) * 2018-09-28 2019-11-12 김지성 기계 학습 기반의 문서 관리 시스템
KR20200020305A (ko) 2018-08-17 2020-02-26 에스케이플래닛 주식회사 문자 인식을 위한 방법 및 장치
KR20200055840A (ko) 2018-11-12 2020-05-22 전자부품연구원 선별적 딥러닝을 이용한 문자 인식 장치 및 방법
CN112016361A (zh) * 2019-05-30 2020-12-01 深圳市希科普股份有限公司 一种基于ocr技术的带笔的平板电脑文本识别系统
CN112766125A (zh) * 2021-01-12 2021-05-07 徐州金林人工智能科技有限公司 一种基于机器学习算法的试题上传工具及其上传方法
KR20210122481A (ko) * 2020-04-01 2021-10-12 오스템임플란트 주식회사 전자 차트 관리 방법, 전자 차트 관리 서버 및 기록 매체
KR20210128603A (ko) * 2020-04-17 2021-10-27 네이버 주식회사 폰트 생성 방법 및 시스템
KR20220085313A (ko) * 2020-12-15 2022-06-22 네이버 주식회사 손글씨 폰트 생성 서비스를 제공하는 방법 및 시스템
CN114881612A (zh) * 2022-05-31 2022-08-09 湖南匠云创新科技有限公司 工程资料的一体化打印撰写实现方法、装置、设备及介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102003221B1 (ko) * 2018-01-03 2019-07-24 엔에이치엔 주식회사 필기 이미지 데이터 생성 시스템 및 이를 이용한 필기 이미지 데이터 생성 방법
KR20200020305A (ko) 2018-08-17 2020-02-26 에스케이플래닛 주식회사 문자 인식을 위한 방법 및 장치
KR102043693B1 (ko) * 2018-09-28 2019-11-12 김지성 기계 학습 기반의 문서 관리 시스템
KR20200055840A (ko) 2018-11-12 2020-05-22 전자부품연구원 선별적 딥러닝을 이용한 문자 인식 장치 및 방법
CN112016361A (zh) * 2019-05-30 2020-12-01 深圳市希科普股份有限公司 一种基于ocr技术的带笔的平板电脑文本识别系统
KR20210122481A (ko) * 2020-04-01 2021-10-12 오스템임플란트 주식회사 전자 차트 관리 방법, 전자 차트 관리 서버 및 기록 매체
KR102376649B1 (ko) * 2020-04-01 2022-03-22 오스템임플란트 주식회사 전자 차트 관리 방법, 전자 차트 관리 서버 및 기록 매체
KR20210128603A (ko) * 2020-04-17 2021-10-27 네이버 주식회사 폰트 생성 방법 및 시스템
KR102376231B1 (ko) * 2020-04-17 2022-03-21 네이버 주식회사 폰트 생성 방법 및 시스템
KR20220085313A (ko) * 2020-12-15 2022-06-22 네이버 주식회사 손글씨 폰트 생성 서비스를 제공하는 방법 및 시스템
KR102501631B1 (ko) 2020-12-15 2023-02-20 네이버 주식회사 손글씨 폰트 생성 서비스를 제공하는 방법 및 시스템
CN112766125A (zh) * 2021-01-12 2021-05-07 徐州金林人工智能科技有限公司 一种基于机器学习算法的试题上传工具及其上传方法
CN114881612A (zh) * 2022-05-31 2022-08-09 湖南匠云创新科技有限公司 工程资料的一体化打印撰写实现方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
KR101801153B1 (ko) 기계학습 기반의 문자 인식 시스템
JP6831480B2 (ja) テキスト検出分析方法、装置及びデバイス
Khan et al. KNN and ANN-based recognition of handwritten Pashto letters using zoning features
US10133965B2 (en) Method for text recognition and computer program product
JP6838209B1 (ja) 文書画像解析装置、文書画像解析方法およびプログラム
Rashad et al. Isolated printed Arabic character recognition using KNN and random forest tree classifiers
KR20190072074A (ko) 악성 코드 검출 방법 및 시스템
CN112052825B (zh) 用于处理图像的方法、装置、设备以及存储介质
Kamisetty et al. Digitization of Data from Invoice using OCR
Akinbade et al. An adaptive thresholding algorithm-based optical character recognition system for information extraction in complex images
CN110414622B (zh) 基于半监督学习的分类器训练方法及装置
Bresler et al. Recognizing off-line flowcharts by reconstructing strokes and using on-line recognition techniques
Nayak et al. Odia running text recognition using moment-based feature extraction and mean distance classification technique
Viard-Gaudin et al. Recognition-directed recovering of temporal information from handwriting images
Aravinda et al. Template matching method for Kannada handwritten recognition based on correlation analysis
CN113673528A (zh) 文本处理方法、装置、电子设备和可读存储介质
US9208381B1 (en) Processing digital images including character recognition using ontological rules
CN111275110B (zh) 图像描述的方法、装置、电子设备及存储介质
KR102043693B1 (ko) 기계 학습 기반의 문서 관리 시스템
Sueiras Continuous offline handwriting recognition using deep learning models
Elakkiya et al. Tamil text recognition using KNN classifier
Smitha et al. Document image analysis using imagemagick and tesseract-ocr
Ali et al. UOCR: A ligature based approach for an Urdu OCR system
Hakro et al. A Study of Sindhi Related and Arabic Script Adapted languages Recognition
KR102331440B1 (ko) 신경망을 이용한 텍스트 인식 시스템 및 그 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant