KR100957508B1 - System and method for recognizing optical characters - Google Patents

System and method for recognizing optical characters Download PDF

Info

Publication number
KR100957508B1
KR100957508B1 KR1020080049655A KR20080049655A KR100957508B1 KR 100957508 B1 KR100957508 B1 KR 100957508B1 KR 1020080049655 A KR1020080049655 A KR 1020080049655A KR 20080049655 A KR20080049655 A KR 20080049655A KR 100957508 B1 KR100957508 B1 KR 100957508B1
Authority
KR
South Korea
Prior art keywords
character
document
image
learning
character recognition
Prior art date
Application number
KR1020080049655A
Other languages
Korean (ko)
Other versions
KR20090123523A (en
Inventor
장동식
박상성
신영근
정원교
장진우
이경호
Original Assignee
고려대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 고려대학교 산학협력단 filed Critical 고려대학교 산학협력단
Priority to KR1020080049655A priority Critical patent/KR100957508B1/en
Publication of KR20090123523A publication Critical patent/KR20090123523A/en
Application granted granted Critical
Publication of KR100957508B1 publication Critical patent/KR100957508B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/32Normalisation of the pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

광학 문자 인식 시스템 및 방법이 개시된다. 광학 문자 인식 시스템은 문서 형식 설정부, 이미지 등록부, 문자 인식부, 및 데이터 저장부를 포함한다. 문서 형식 설정부는 문자 인식을 하고자 하는 문서의 형식 및 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정하며, 이미지 등록부는 문자 인식을 수행할 문서 이미지를 입력한다. 또한, 문자 인식부는 문서 이미지가 문서 형식 설정부에서 설정된 문서의 형식에 해당할 경우, 인식 영역 내의 문자를 문자 학습에 의해 생성된 기준 값과 비교하여 인식하고, 데이터 저장부는 문서 형식 설정부, 이미지 등록부 및 문자 인식부에서 발생한 데이터를 저장한다. 이러한 구성으로 입력된 임의의 문서가 인식 영역이 설정된 문서 형식에 해당될 경우, 필요한 부분만을 빠르게 인식하여 문자 인식의 효율성을 높이고, 대량으로 문자 인식을 가능하게 할 수 있다. Disclosed are an optical character recognition system and method. The optical character recognition system includes a document format setting unit, an image registration unit, a character recognition unit, and a data storage unit. The document format setting unit sets a format of a document to be recognized and a recognition area to perform character recognition in the document, and the image register unit inputs a document image to perform character recognition. In addition, when the document image corresponds to the document format set in the document format setting unit, the character recognition unit recognizes a character in the recognition area by comparing with a reference value generated by character learning, and the data storage unit recognizes the document format setting unit and the image. Stores data generated by the register and character recognition unit. When any document inputted in such a configuration corresponds to a document format in which a recognition area is set, it is possible to quickly recognize only a necessary portion to increase the efficiency of character recognition and enable character recognition in large quantities.

OCR, 광학 문자 인식, 인식 영역 OCR, optical character recognition, recognition area

Description

광학 문자 인식 시스템 및 방법{System and method for recognizing optical characters}System and method for recognizing optical characters

본 발명은 광학 문자 인식 시스템 및 방법에 관한 것으로, 보다 상세하게는 문자 인식을 하고자하는 영역을 미리 설정하여, 입력된 문서에서 설정된 영역만을 문자 인식하기 위한 광학 문자 인식 시스템 및 방법에 관한 것이다. The present invention relates to an optical character recognition system and method. More particularly, the present invention relates to an optical character recognition system and method for recognizing only an area set in an input document by presetting an area for character recognition.

최근 들어 문서나 서류 등의 보관에 대한 중요성이 커지고 있다. 그리하여 종이의 형태로 관리하던 문서나 서류들을 편리하게 관리하기 위해 전자화시키고 있는데, 이러한 종이로 되어 있는 서류들을 전자화시키기 위해서는 사람들이 해당 서류를 보고 직접 수작업으로 일일이 입력해야 한다는 번거로움이 있었다. Recently, the importance of archiving documents and documents is increasing. Therefore, the documents and documents that were managed in the form of paper are being digitalized for convenient management. In order to electronically convert the documents in paper, people have to see the documents and manually enter them manually.

현재는, 이러한 번거로움을 줄이기 위해 문서나 서류를 스캔하고, 스캔한 이미지에서 광학 문자 인식 기술(OCR)을 이용해 문자를 추출하는 방식을 통해 전자화시키고 있다. Today, to reduce this hassle, digitalization is achieved by scanning documents or documents and extracting characters from the scanned images using optical character recognition technology (OCR).

광학 문자 인식(OCR: Optical Character Recognition)이란, 스캐너를 통해 입력된 문서 영상에서 문자에 해당하는 부분의 내용을 인식하는 기술을 말한다. Optical Character Recognition (OCR) refers to a technology for recognizing the content of a portion of a document image input through a scanner.

그러나 광학 문자 인식을 이용한 문자 인식에서도 문제점이 존재하는데, 이 는 일반적으로 광학 문자 인식을 이용할 경우, 문서 전체를 읽어서 전체 문서를 인식하는 형식으로 주로 구현되기 때문이다. 즉, 광학 문자 인식을 통해 문자 인식을 한 이후에, 인식된 전체 문서에서 필요한 부분과 필요하지 않은 부분을 일일이 분류해야 하는 번거로움이 있다는 것이 문제점이라고 할 수 있다. However, there is a problem in character recognition using optical character recognition, because in general, optical character recognition is mainly implemented in the form of reading the entire document to recognize the entire document. That is, after character recognition through optical character recognition, there is a problem in that it is necessary to separately classify necessary parts and unnecessary parts of the entire recognized document.

본 발명은 이와 같은 종래의 문제점을 해결하기 위해 안출된 것으로서, 입력된 임의의 문서가 인식 영역이 설정된 문서 형식에 해당될 경우, 필요한 부분만을 빠르게 인식할 수 있어 문자 인식의 효율성을 높이고, 대량으로 문자 인식을 가능하게 하기 위한 광학 문자 인식 시스템 및 방법을 제공하는 것을 목적으로 한다. The present invention has been made to solve such a conventional problem, and when any input document corresponds to a document format in which a recognition area is set, only necessary portions can be quickly recognized, thereby improving the efficiency of character recognition and in large quantities. It is an object of the present invention to provide an optical character recognition system and method for enabling character recognition.

상기 목적을 달성하기 위해 본 발명에 따른 광학 문자 인식 시스템은 문서 형식 설정부, 이미지 등록부, 문자 인식부, 및 데이터 저장부를 포함한다. In order to achieve the above object, the optical character recognition system according to the present invention includes a document format setting unit, an image registration unit, a character recognition unit, and a data storage unit.

문서 형식 설정부는 문자 인식을 하고자 하는 문서의 형식 및 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정하며, 이미지 등록부는 문자 인식을 수행할 문서 이미지를 입력한다. The document format setting unit sets a format of a document to be recognized and a recognition area to perform character recognition in the document, and the image register unit inputs a document image to perform character recognition.

또한, 문자 인식부는 문서 이미지가 문서 형식 설정부에서 설정된 문서의 형식에 해당할 경우, 인식 영역 내의 문자를 문자 학습에 의해 생성된 기준 값과 비교하여 인식하고, 데이터 저장부는 문서 형식 설정부, 이미지 등록부 및 문자 인식부에서 발생한 데이터를 저장한다. In addition, when the document image corresponds to the document format set in the document format setting unit, the character recognition unit recognizes a character in the recognition area by comparing with a reference value generated by character learning, and the data storage unit recognizes the document format setting unit and the image. Stores data generated by the register and character recognition unit.

이러한 구성으로 입력된 임의의 문서가 인식 영역이 설정된 문서 형식에 해당될 경우, 필요한 부분만을 빠르게 인식하여 문자 인식의 효율성을 높이고, 대량으로 문자 인식을 가능하게 할 수 있다. When any document inputted in such a configuration corresponds to a document format in which a recognition area is set, it is possible to quickly recognize only a necessary portion to increase the efficiency of character recognition and enable character recognition in large quantities.

문자 인식부는 문서 이미지의 전체 크기를 조절하고 이미지의 픽셀 값을 이 진화하여 문자를 인식할 수 있는데, 이로 인해 문자와 배경을 확실하게 구분할 수 있다. The character recognition unit adjusts the overall size of the document image and evolves the pixel values of the image to recognize the characters, thereby clearly distinguishing the characters from the background.

또한, 문자 인식부는 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 가진 픽셀 중, 최하단 픽셀들을 연결하여 라인을 식별함으로써 문자를 인식할 수 있다. In addition, the character recognition unit may recognize a character by identifying the line by connecting the lowest pixels among pixels having a pixel value indicating a character in the binarized document image.

또한, 문자 인식부는 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화 하여 문자를 인식할 수 있다. Also, the character recognizer may recognize a character by grouping pixels adjacent to each other among pixels having a pixel value indicating a character in the binary document image.

본 발명에 따른 광학 문자 인식 시스템은 문자의 기준 값을 생성하기 위해 다수의 문자 이미지를 학습하여 데이터 저장부에 저장하는 문자 학습부를 더 포함할 수 있다. The optical character recognition system according to the present invention may further include a character learner that learns a plurality of character images and stores them in a data storage to generate a reference value of the character.

문자 학습부는 학습할 이미지의 전체 크기를 조절하고 이미지의 픽셀 값을 이진화하여 문자를 학습할 수 있으며, 이진화된 학습 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화 하여 문자를 학습할 수 있다. The character learning unit can learn characters by adjusting the overall size of the image to be learned and binarizing pixel values of the image, and grouping pixels adjacent to each other among pixels having pixel values referring to characters in the binarized learning image. Can learn.

또한, 문자 학습부는 그룹화된 픽셀을 미리 설정된 크기로 정규화하고, 정규화된 그룹을 미리 지정되어 있는 학습 데이터에 대응하여 문자를 학습할 수 있다. In addition, the character learning unit may normalize the grouped pixels to a predetermined size, and learn the character corresponding to the predetermined learning data in the normalized group.

또한, 본 발명은 문자 인식을 하고자 하는 문서의 형식 및 상기 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정하여 저장하는 문서 형식 설정 단계, 문자 인식을 하고자 수행할 문서 이미지를 입력하는 이미지 등록 단계, 문서 이미지가 문서 형식 설정 단계에서 설정된 문서의 형식에 해당할 경우, 인식 영역 내의 문자를 문자 학습에 의해서 생성된 기준 값과 비교하여 인식하고 저장하는 문자 인식 단계를 포함하는 것을 특징으로 하는 광학 문자 인식 방법을 제공한다. The present invention also provides a document format setting step of setting and storing a format of a document for character recognition and a recognition area for character recognition in the document, an image registration step of inputting a document image for character recognition; If the document image corresponds to the format of the document set in the document format setting step, optical character recognition comprising a character recognition step of recognizing and storing the characters in the recognition area compared with the reference value generated by the character learning Provide a method.

이때, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 인식 단계는 인식 영역 내의 문자를 상기 기준 값과 비교하기 전에, 문서 이미지의 전체 크기를 미리 설정된 규격에 맞게 축소하고, 축소된 이미지의 픽셀 값을 이진화하는 문서 이미지 변환 단계를 포함하는 것이 바람직하다. In this case, in the optical character recognition method according to the present invention, before the character in the recognition area is compared with the reference value, the entire size of the document image is reduced to meet a preset standard, and the pixel value of the reduced image is reduced. It is preferable to include the document image conversion step of binarizing.

또한, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 인식 단계는 문서 이미지 변환 단계 이후에, 이진화된 문서 이미지가 설정된 문서의 형식에 해당할 경우, 이진화된 이미지에서 문자를 지칭하는 픽셀 값을 가진 픽셀 중, 최하단 픽셀들을 연결하여 라인을 식별하는 문서 이미지 라인 식별 단계를 더 포함하는 것이 바람직하다.Further, in the optical character recognition method according to the present invention, the character recognition step has a pixel value indicating a character in the binarized image when the binarized document image corresponds to the set document format after the document image conversion step. Among the pixels, it is preferable to further include a document image line identification step of connecting the lowest pixels to identify the line.

또한, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 인식 단계는 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화 하는 문서 문자 그룹 생성 단계를 더 포함하는 것이 바람직하다.Also, in the optical character recognition method according to the present invention, the character recognition step further includes a document character group generation step of grouping pixels adjacent to each other among pixels having a pixel value indicating a character in the binarized document image. desirable.

본 발명에 따른 광학 문자 인식 방법은 문서 형식 설정 단계 이전에, 문자의 기준 값을 생성하기 위해 다수의 문자 이미지를 학습하여 저장하는 문자 학습 단계를 더 포함할 수 있다. The optical character recognition method according to the present invention may further include a character learning step of learning and storing a plurality of character images to generate a reference value of the character before the document format setting step.

이때, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 학습 단계는 다수의 문자 이미지를 학습하기 전에, 미리 설정된 규격에 맞게 학습할 이미지의 전체 크기를 축소하고, 축소된 이미지의 픽셀 값을 이진화하는 학습 이미지 변환 단 계를 포함하는 것이 바람직하다. At this time, in the optical character recognition method according to the present invention, before learning a plurality of character images, the character learning step is to reduce the overall size of the image to be learned according to a preset standard, and to binarize the pixel value of the reduced image It is preferable to include a learning image conversion step.

또한, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 학습 단계는 이진화된 학습 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화 하는 학습 문자 그룹 생성 단계를 더 포함하는 것이 바람직하다.Also, in the optical character recognition method according to the present invention, the character learning step further includes a step of generating a learning character group for grouping adjacent pixels among pixels having pixel values indicating a character in the binarized learning image. desirable.

또한, 본 발명에 따른 광학 문자 인식 방법에 있어서, 문자 학습 단계는 학습 문자 그룹 생성 단계 이후에, 그룹화된 픽셀을 미리 설정된 크기로 정규화 하여 미리 지정되어 있는 학습 데이터에 대응하는 문자 지정 단계를 더 포함하는 것이 바람직하다.Also, in the optical character recognition method according to the present invention, the character learning step further includes a character designation step corresponding to a predetermined learning data by normalizing the grouped pixels to a preset size after the learning character group generation step. It is desirable to.

또한, 본 발명에 따른 광학 문자 인식 방법에 있어서 둘 이상의 그룹화된 픽셀들의 이격 거리가 미리 설정된 이격 거리 범위 내에 위치할 경우, 하나의 그룹으로 그룹화할 수 있다. Further, in the optical character recognition method according to the present invention, when the separation distance of two or more grouped pixels is located within a preset separation distance range, the group may be grouped into one group.

본 발명은 정형화된 문서 양식에 사용자가 기재한 문자의 인식을 수행함에 있어서, 정형화된 양식 중 사용자가 기재하는 영역을 문자 인식 대상 영역으로 사전에 설정하고, 문자 인식을 수행할 때 문서 양식 전체에 문서 인식을 수행하는 대신에 문자 인식 대상 영역에 대해서만 문자 인식을 수행함으로써 문자 인식 속도를 향상시키고 보다 정확한 문자 인식이 가능하게 되어, 전체적으로 문자 인식의 효율을 향상시킬 수 있다. In the present invention, in the recognition of the characters written by the user in the standardized document form, the area of the standardized form is set in advance as a character recognition target area, and when the character recognition is performed, By performing character recognition only on the character recognition target area instead of performing document recognition, the character recognition speed can be improved and more accurate character recognition can be achieved, thereby improving the efficiency of the character recognition as a whole.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시 예를 설명한다. 발 명의 이해를 보다 명확하게 하기 위해 동일한 구성요소에 대해서는 상이한 도면에서도 동일한 부호를 사용하도록 한다. Hereinafter, exemplary embodiments of the present invention will be described with reference to the accompanying drawings. In order to more clearly understand the present invention, like reference numerals designate like elements in different drawings.

도 1은 본 발명에 따른 광학 문자 인식 시스템의 일 실시 예의 개략적인 블록도이다. 1 is a schematic block diagram of an embodiment of an optical character recognition system according to the present invention.

문자 인식을 하고자하는 영역이 미리 설정된 문서 형식을 이용하여, 입력된 문서 이미지에서 설정된 영역만을 문자 인식하기 위한 광학 문자 인식 시스템은 문자 학습부(100), 문서 형식 설정부(200), 이미지 등록부(300), 문자 인식부(400), 및 데이터 저장부(500)를 포함한다. An optical character recognition system for recognizing only a region set in an input document image by using a document format in which an area to be recognized by text is preset is a character learning unit 100, a document format setting unit 200, and an image register unit ( 300, a character recognition unit 400, and a data storage unit 500.

문자 학습부(100)는 문자의 기준 값을 생성하기 위해 다수의 문자 이미지를 학습하여 데이터 저장부(500)에 저장한다. 도 2는 기준 값이 되는 문자 이미지의 실시 예를 도시한 도면으로, 문자 이미지 학습시 도 2에 도시된 바와 같은 다양한 서체의 문자 이미지를 사전에 정의된 순서에 따라서 입력하여 학습을 수행할 수 있다.The character learner 100 learns a plurality of character images and stores them in the data storage unit 500 to generate a reference value of the character. FIG. 2 is a diagram illustrating an embodiment of a text image serving as a reference value. When learning a text image, the text image of various fonts as illustrated in FIG. 2 may be input in a predefined order to perform learning. .

즉, 도 2에 도시된 문자 이미지를 입력하고, 해당 이미지에 대한 픽셀 값의 정보를 추출하여 문자 학습부(100)에서 기준 값을 생성하여 데이터 저장부(500)에 저장하는 것이다. That is, the text image shown in FIG. 2 is input, information about pixel values of the corresponding image is extracted, the reference value is generated by the text learner 100, and stored in the data storage 500.

이때, 문자의 글씨체(예컨대, 굴림체, 고딕체, 명조체, 궁서체 등)가 다른 다수의 문자 이미지의 픽셀 값 정보를 추출하여 기준 값을 생성하는 것이 바람직하며, 이로 인해 문자 인식시의 정확성을 높일 수 있다. In this case, it is preferable to generate a reference value by extracting pixel value information of a plurality of character images having different fonts (eg, Arial, Gothic, Ming and Korean fonts, etc.), thereby increasing accuracy in character recognition. .

문서 형식 설정부(200)는 문자 인식을 하고자 하는 문서의 형식 및 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정한다. 즉, 고정된 양식을 가진 문서들(예컨대, 보험 계약서, 금융 상품 계약서 등)은 고객으로부터 직접 작성되는 부분이 한정되어 있으므로 문자 인식을 하기 전에 인식을 하기 위한 문서의 형식과 그 형식에서 필요한 인식 영역(고객으로부터 직접 작성되는 부분)을 미리 설정해놓는 것이다. The document format setting unit 200 sets a format of a document to be recognized and a recognition area to perform character recognition in the document. In other words, documents with fixed forms (eg, insurance contracts, financial product contracts, etc.) have a limited portion that can be directly written by the customer. (The parts that are written directly by the customer) are set in advance.

이러한 문서의 형식과 인식 영역은 벡터로 설정할 수 있는데, 벡터의 형식은 '[문서 이름, 데이터 순서, 좌하 좌표, 우하 좌표, 좌상 좌표, 우상 좌표]'로 나타낼 수 있다. 여기에서 데이터 순서는 0부터 시작할 수 있다. The format and recognition area of the document may be set as a vector, and the format of the vector may be expressed as' [document name, data order, lower left coordinate, lower right coordinate, upper left coordinate, upper right coordinate]. Here the data order can start at zero.

예컨대, '보험증서 1'이라는 문서에서 인식하고자 하는 영역의 위치 사각형의 좌표가 '(100, 150), (200, 150), (100, 180), (200, 180)'과 '(300, 150), (400, 150), (300, 180), (400, 180)'와 같이 두 군데일 경우, 벡터의 형식은 '[보험증서 1, 0, 100,150, 200,150, 100,180, 200,180]'과 '[보험증서 1, 1, 300,150, 400,150, 300,180, 400,180]'로 나타낼 수 있다. For example, the coordinates of the location rectangle of the area to be recognized in the document 'Insurance Certificate 1' are represented as' (100, 150), (200, 150), (100, 180), (200, 180) 'and' (300, 150), (400, 150), (300, 180), (400, 180) ', the format of the vector is' [insurance certificate 1, 0, 100,150, 200,150, 100,180, 200,180]' It can be represented as '[insurance certificate 1, 1, 300, 150, 400, 150, 300, 180, 400, 180]'.

이미지 등록부(300)는 문자 인식을 수행할 문서 이미지를 입력한다. 이미지 등록부(300)로는 문서를 이미지화할 수 있는 스캐너와 같은 장치들이 해당될 수 있다. The image registration unit 300 inputs a document image to perform character recognition. The image register 300 may correspond to a device such as a scanner capable of imaging a document.

또한, 문자 인식부(400)는 문서 이미지가 문서 형식 설정부(200)에서 설정된 문서의 형식에 해당할 경우, 설정된 인식 영역 내의 문자를 문자 학습에 의해 생성된 기준 값과 비교하여 인식한다. 즉, 이미지 등록부(300)를 통해 임의의 문서 이미지가 입력되었을 때, 자동으로 문서 이미지의 형식을 인식하여 임의의 문서가 문 서 형식 설정부(200)에서 설정된 문서 형식들 중 일치하는 것이 있을 경우, 해당되는 형식의 설정된 영역 내의 문자를 인식하는 것이다. In addition, when the document image corresponds to the format of the document set by the document format setting unit 200, the character recognition unit 400 recognizes the character in the set recognition area by comparing it with a reference value generated by character learning. That is, when an arbitrary document image is input through the image register unit 300, when the document image is automatically recognized by the document format setting unit 200, the document format is automatically recognized. In other words, it recognizes the characters in the set area of the corresponding format.

여기에서, 자동으로 문서 이미지의 형식을 인식하기 위해, 상술한 문서 형식 설정부(200)에서 인식 영역을 설정할 경우, 문서의 명칭이 위치한 영역을 포함하여 지정하는 것이 바람직할 것이다. Here, in order to automatically recognize the format of the document image, when setting the recognition area in the above-described document format setting unit 200, it may be preferable to include the area where the name of the document is located.

데이터 저장부(500)는 문서 형식 설정부(200), 이미지 등록부(300) 및 문자 인식부(400)에서 발생한 데이터를 저장한다. The data storage unit 500 stores data generated by the document format setting unit 200, the image registration unit 300, and the character recognition unit 400.

즉, 문서 형식 설정부(200)에서 발생한 인식 영역이 설정된 문서 형식 데이터, 이미지 등록부(300)에서 발생한 문자 인식을 하고자 하는 임의의 문서 이미지 데이터, 및 문자 인식부(400)에서 발생한 문자 인식이 완료된 데이터를 저장할 수 있다. That is, the document format data in which the recognition area generated by the document format setting unit 200 is set, any document image data to be recognized by the image register unit 300, and the character recognition generated by the character recognition unit 400 are completed. Data can be saved.

여기에서, 인식 영역이 설정된 문서의 형식은 상술한 바와 같이 '[보험증서 1, 0, 100,150, 200,150, 100,180, 200,180]'의 벡터 형식으로 저장될 수 있다.In this case, the format of the document in which the recognition area is set may be stored in a vector format of '[insurance certificate 1, 0, 100, 150, 200, 150, 100, 180, 200, 180]' as described above.

이러한 구성으로, 입력된 임의의 문서가 인식 영역이 설정된 문서 형식에 해당될 경우, 필요한 부분만을 빠르게 인식할 수 있어 문자 인식의 효율성을 높일 수 있고, 대량으로 문자 인식을 가능하게 할 수 있다. With such a configuration, when any input document corresponds to a document format in which a recognition area is set, only necessary portions can be quickly recognized, thereby increasing the efficiency of character recognition and enabling character recognition in large quantities.

도 3은 본 발명에 따른 광학 문자 인식 방법 중에서 문자 인식 단계의 전처리 단계인 문자 학습 단계(S100) 및 문서 형식 설정 단계(S200)를 나타낸 일 실시 예의 개략적인 흐름도이다. 3 is a schematic flowchart of an embodiment showing a character learning step S100 and a document format setting step S200 which are preprocessing steps of a character recognition step in the optical character recognition method according to the present invention.

문자 학습 단계(S100)는 먼저 문자 인식시 이용되는 문자의 기준 값을 생성 하기 위해 학습할 문자 이미지를 입력한다(S110).Character learning step (S100) first inputs a character image to learn in order to generate a reference value of the character used in character recognition (S110).

다음으로, 입력된 이미지의 전체 크기를 조절하고 이미지의 전체 픽셀을 이진화한다(S120). 이미지 전체 크기의 조절은 미리 설정되어 있는 일정한 규격에 맞게 조절할 수 있는데, 데이터의 크기를 줄이기 위해 미리 설정되어 있는 규격보다 작은 크기의 이미지는 조절하지 않고, 큰 크기의 이미지만 축소하는 방식으로 이미지 크기를 조절할 수 있다. Next, the entire size of the input image is adjusted and the entire pixels of the image are binarized (S120). The overall size of the image can be adjusted to a preset standard. To reduce the size of the data, the image size is reduced by reducing only the large sized image without adjusting the size of the smaller sized image. Can be adjusted.

이렇게 크기가 조절된 이미지들은 전체 픽셀을 0(흰색) 또는 1(검은색)의 바이너리로 구분하여 이진화한다. 0은 배경을 지칭하고, 1은 문자를 지칭하며, 이로 인해 문자와 배경을 확실하게 구분할 수 있다. These resized images are binarized by dividing the entire pixel into 0 (white) or 1 (black) binaries. 0 refers to the background, 1 refers to the character, which makes it possible to clearly distinguish between the character and the background.

다음으로, 이진화된 이미지에서 문자 인식을 효율적으로 하기 위해 라인 식별을 하는데(S130), 도 4의 일반적인 라인 식별의 실시 예를 도시한 도면을 참조하면, 이미지에 라인을 생성하는 것이 아니라 1로 인식된 문자 픽셀들 중 최하위에 위치한 픽셀을 연결하여 라인(1a)으로 인식하는 것이다. 이때, 최하위에 위치한 픽셀을 중심으로 좌상(2), 중상(3), 우상(4), 좌(5), 우(6), 좌하(7), 중하(8), 우하(9)와 같이 인접한 8방향에 위치한 픽셀의 유사도를 측정하여 임의의 라인이 끝나는 마지막 점을 찾을 수 있다. Next, line identification is performed for efficient character recognition in the binarized image (S130). Referring to FIG. 4, an example of general line identification is illustrated. The pixel located at the lowest of the displayed character pixels is connected and recognized as a line 1a. At this time, the upper left (2), the middle upper (3), the upper right (4), the left (5), the right (6), the lower left (7), the lower middle (8), the lower right (9) around the pixel located at the lowest By measuring the similarity of pixels located in adjacent eight directions, we can find the last point where any line ends.

라인 식별 단계(S130)는 문자 학습 단계(S100)에서 생략되어도 무방할 것이다. The line identification step S130 may be omitted in the character learning step S100.

라인이 식별되면, 각 라인별로 서로 이웃하고 있는 픽셀 값이 1인 문자를 지칭하는 픽셀들끼리 그룹화한다(S140). 이 경우에도, 라인 식별 단계(S130)에서와 마찬가지로 픽셀의 유사도를 측정하는데, 유사도 측정을 통한 그룹화 방법은 후에도 6을 참조하여 상세히 설명할 것이다. If a line is identified, pixels that refer to characters having pixel values of 1 adjacent to each other are grouped together (S140). In this case as well, the similarity of the pixels is measured as in the line identification step S130, and the grouping method through the similarity measurement will be described in detail later with reference to FIG. 6.

다음으로, 그룹화된 학습 이미지 픽셀을 미리 설정된 크기에 맞도록 정규화시키고, 정규화된 문자 이미지에 미리 지정된 학습 데이터를 지정한다(S150). 예컨대, 도 5를 참조하면, 그룹화된 학습 이미지 픽셀의 크기가 10×20 또는 30×40일 경우 모두 미리 설정된 크기인 20×30으로 정규화시킬 수 있다. 본 발명에서는 20×30의 크기로 정규화하지만, 다른 크기로 정규화하여도 무방할 것이다.Next, the grouped training image pixels are normalized to fit the preset size, and the predetermined training data is assigned to the normalized character image (S150). For example, referring to FIG. 5, when the size of the grouped training image pixels is 10 × 20 or 30 × 40, all of the grouped training image pixels may be normalized to 20 × 30, which is a preset size. In the present invention, it is normalized to a size of 20 × 30, but may be normalized to other sizes.

정규화된 문자에 미리 지정된 학습 데이터를 지정하는 예를 들어보면, 도 2에 도시된 문자 이미지를 학습시켰을 경우, 지정되는 문자는 학습 데이터인 'A, B, C, D,…, Z, a, b, c, …, z, 0, 1, 2, …, 9'가 될 것이다. 학습 데이터는 정해진 것이므로 첫 번째로 그룹화된 것은 'A'이고, 두 번째로 그룹화된 것은 'B'이고, 마지막으로 그룹화된 것은 '9'가 된다. As an example of designating the predetermined learning data to the normalized text, when the text image shown in Fig. 2 is learned, the designated text is' A, B, C, D,... , Z, a, b, c,... , z, 0, 1, 2,... Will be 9 '. Since the training data is fixed, the first grouping is 'A', the second grouping is 'B', and the last grouping is '9'.

이와 같이 학습 데이터에 지정된 다수의 학습 이미지를 통합하여 문자의 기준 값을 생성한다(S160).In this way, a plurality of learning images specified in the learning data are integrated to generate a reference value of the character (S160).

본 발명에서는 이러한 문자 학습 단계(S100)를 상술한 방법 대신에 현재 사용되고 있는 어떠한 문자 학습 방법을 사용하더라도 무방할 것이다. In the present invention, any character learning method currently used may be used instead of the above-described method.

다음으로, 문서 형식 설정 단계(S200)가 이어지는데, 인식하고자 하는 문서의 형식을 저장한 다음(S210), 문서의 형식에서 문자 인식을 수행하고자 하는 영역을 저장한다(S220).Next, the document format setting step (S200) is continued, and stores the format of the document to be recognized (S210), and then stores an area to perform character recognition in the format of the document (S220).

'금융 상품 계약서'를 예로 들어보면, 인식하고자 하는 문서의 형식에는 금 융 상품 가입자의 신상 정보, 가입하고자 하는 금융 상품명, 상품 만기일, 이율, 이체일, 및 이체 계좌번호 등의 내용을 기록할 수 있도록 형성된 영역들이 포함될 수 있다. For example, in the case of a 'financial product agreement', the form of the document to be recognized may include information on the subscriber's personal information, the financial product name to be subscribed to, the product expiration date, the interest rate, the transfer date, and the transfer account number. Formed areas may be included.

또한, 문자 인식을 수행하고자 하는 영역은 상술한 금융 상품 계약서를 구성하고 있는 다수의 영역에서 계약자가 자필로 작성해야 하는 공란이 될 수 있으며, 이 공란들의 좌표를 저장한다. In addition, the area in which the character recognition is to be performed may be a blank that the contractor must write in a plurality of areas constituting the above-described financial instrument contract, and stores the coordinates of the blanks.

도 6은 도 3을 참조하여 상술한 유사도 측정을 통한 학습 이미지 픽셀 그룹화 단계(S140)의 실시 예를 나타낸 흐름도이다. FIG. 6 is a flowchart illustrating an embodiment of training image pixel grouping step S140 by measuring similarity described above with reference to FIG. 3.

도 3의 학습 이미지 라인 식별 단계(S130)에서 먼저 이진화된 학습 이미지의 모든 픽셀들을 미 방문점으로 세팅한다(S141). 그리고 나서, 미 방문점의 픽셀 값을 검색하는데(S142), 처음에는 방문한 픽셀이 없으므로 전체 이미지의 맨 처음 픽셀부터 시작할 수 있다. In the training image line identification step (S130) of FIG. 3, first, all pixels of the binarized training image are set as non-visit points (S141). Then, to retrieve the pixel value of the non-visit point (S142), since there is no visited pixel at first, the first pixel of the entire image may be started.

다음으로, 각 픽셀별로 문자를 지칭하는 픽셀 값인 1을 가진 픽셀인지를 확인하여(S143), 문자를 지칭하지 않는 픽셀 값인 0을 가진 픽셀이라면 다시 미 방문점의 픽셀 값을 검색하게 되는데, 이 경우에는, 이전에 방문한 픽셀을 제외하고, 다음 미 방문 픽셀의 값을 검색할 수 있다. 만약, 검색한 픽셀이 문자를 지칭하는 픽셀 값인 1을 가지고 있다면, 새로운 번호로 그룹화를 시작한다(S144). Next, it is checked whether each pixel has a pixel value of 1, which refers to a character (S143), and if the pixel has a value of 0, which does not refer to a character, the pixel value of the non-visit point is searched again. S may retrieve the value of the next unvisited pixel, except for the previously visited pixel. If the retrieved pixel has a pixel value of 1 indicating a character, grouping starts with a new number (S144).

이때, 도 4에 도시된 바와 같이, 검색한 1 값을 가진 픽셀을 중심으로 인접한 8방향(2 내지 9)의 픽셀 중에서 미 방문 픽셀이 픽셀 값 1을 가졌는지를 확인하여(S145), 픽셀 값 1을 가진 픽셀이 있을 경우 같은 번호로 그룹화 한다(S146). 그 리고 나서, 가장 최근에 그룹화된 픽셀을 중심으로 다시 단계 S145부터 반복한다. At this time, as shown in FIG. 4, it is checked whether the non-visited pixel has the pixel value 1 among the pixels in the eight directions (2 to 9) adjacent to the pixel having the searched 1 value (S145). If there are pixels with, the same number is grouped (S146). Then, the process is repeated from step S145 again with respect to the most recently grouped pixels.

이때, 인접한 8방향의 픽셀 중에서 픽셀 값 1을 가진 미 방문 픽셀이 하나도 없을 경우에는 이진화된 학습 이미지의 모든 픽셀을 방문하였는지를 확인하여(S147), 모든 픽셀을 방문하였다면 그룹화를 종료하고, 미 방문 픽셀이 존재할 경우에는 단계 S142로 돌아가서 미 방문점의 픽셀 값 검색부터 다시 시작한다.In this case, when there are no unvisited pixels having the pixel value 1 among the adjacent 8-direction pixels, it is checked whether all pixels of the binarized learning image have been visited (S147). If there exists, the process returns to step S142 and starts again from the pixel value search of the non-visit point.

도 7은 본 발명에 따른 광학 문자 인식 방법 중에서 문자 인식 단계를 나타낸 일 실시 예의 개략적인 흐름도이다. 7 is a schematic flowchart of an embodiment showing a character recognition step in the optical character recognition method according to the present invention.

도 3의 문자 학습 단계(S100) 및 문서 형식 설정 단계(S200)가 종료되면 문자 인식 단계가 실행된다. When the character learning step S100 and the document format setting step S200 of FIG. 3 are completed, the character recognition step is executed.

이미지 등록부(300)를 통해 문자 인식하고자 하는 임의의 문서 이미지가 입력(S300)되면, 입력된 문서 이미지의 전체 크기를 상술한 도 3의 설명에서 언급한 학습 이미지 축소 및 이진화 단계(S120)와 동일한 방식으로 축소하고 이진화시킨다(S400). If any document image to be recognized by the character through the image registration unit 300 is input (S300), the entire size of the input document image is the same as the learning image reduction and binarization step (S120) mentioned in the above description of FIG. Reduce and binarize in a manner (S400).

이렇게 이진화된 문서 이미지가 문서 형식 설정 단계(S200)에서 설정된 문서 형식에 해당할 경우, 문서 이미지는 상술한 도 3의 설명에서 언급한 학습 이미지 라인 식별 단계(S130) 내지 학습 이미지 픽셀 그룹화 단계(S140)에서와 동일한 방식으로 문서 이미지 라인을 식별하고(S500) 문서 이미지 픽셀을 그룹화한다(S600).When the binarized document image corresponds to the document format set in the document format setting step S200, the document image may include the learning image line identification step S130 to the learning image pixel grouping step S140 mentioned in the above description of FIG. 3. The document image lines are identified in the same manner as in (S500), and the document image pixels are grouped (S600).

문서 이미지가 설정된 문서 형식에 해당하는지 여부는 상술한 도 2의 설명에서 언급된 벡터의 형식을 이용하여 알 수 있다. 즉, '[문서 이름, 데이터 순서, 좌하 좌표, 우하 좌표, 좌상 좌표, 우상 좌표]'의 벡터 형식으로 문서 형식이 설정되 었을 경우, 입력된 문서 이미지에 '문서 이름'을 설정한 영역의 좌표를 적용하여, 영역 내의 문자를 인식함으로써 알 수 있다. Whether the document image corresponds to the set document format can be known using the format of the vector mentioned in the above description of FIG. 2. That is, if the document format is set in the vector format of [Document Name, Data Order, Lower Left Coordinate, Right Lower Coordinate, Upper Left Coordinate, Upper Right Coordinate], the coordinates of the area where 'Document Name' is set in the input document image By applying, it can be known by recognizing the characters in the area.

즉, 본 발명에서는 '문서 이름' 영역이 후술할 나머지 문자 인식 단계를 거쳐서 먼저 문자 인식된 후, 설정된 문서 형식에 해당하는 문서 이미지에서만 나머지 설정 영역 내의 문자 인식을 실행할 수 있다. That is, in the present invention, after the character is first recognized through the remaining character recognition step to be described later, character recognition in the remaining setting region may be performed only on the document image corresponding to the set document format.

다음으로, 그룹화한 문서 이미지 픽셀의 크기 또한 상술한 도 3의 설명에서 언급한 문자 지정 단계(S150)에서의 그룹화된 문서 이미지 픽셀의 크기를 미리 설정된 크기에 맞도록 정규화시키는 방식과 동일한 방식으로 정규화시킨다(S700).Next, the size of the grouped document image pixels is also normalized in the same manner as the method of normalizing the size of the grouped document image pixels in the character specifying step S150 mentioned in the above description of FIG. Let (S700).

이후, 저장된 문서 형식에서 설정된 문자 인식 영역 중, '문서 이름'을 제외한 나머지 영역에 해당하는 좌표 영역 내의 그룹화된 문서 이미지 픽셀을 문자 인식한다(S800). 이때, 아래의 수학식 1에 따라서 문자 학습 단계(S100)에서 생성한 문자의 기준 값과, 인식하려는 문서 이미지 픽셀의 MSE(Mean Square Error) 값을 비교하여 문자 인식을 할 수 있다. Thereafter, among the character recognition areas set in the stored document format, text recognition is performed on the grouped document image pixels in the coordinate area corresponding to the remaining areas except for the 'document name' (S800). In this case, character recognition may be performed by comparing the reference value of the character generated in the character learning step S100 with the mean square error (MSE) value of the document image pixel to be recognized according to Equation 1 below.

Figure 112008038184512-pat00001
Figure 112008038184512-pat00001

MSE 값을 구하는 수학식은 위와 같고, T는 타깃(Target)으로, 20×30으로 정규화된 학습한 문자의 기준 값을 의미하고, I는 입력(Input)으로, 20×30으로 정규 화된 입력 문서 이미지의 그룹화된 픽셀을 의미한다. The equation for obtaining MSE value is as above, T is target, the reference value of the learned character normalized to 20 × 30, I is input, and the input document image normalized to 20 × 30. Means grouped pixels.

상기 수학식 1을 상세히 서술해보면, MSE 값은 각 픽셀별로 타깃에서 입력의 픽셀 값을 뺀 값의 절대 값을 모두 합한 다음, 20×30으로 정규화된 하나의 이미지를 구성하고 있는 픽셀의 총 개수로 나누었을 때의 평균값을 의미한다. Referring to Equation 1 in detail, the MSE value is the total number of pixels constituting one image normalized to 20 × 30 after adding up the absolute values of the target minus the pixel value of the input for each pixel. The mean value when divided.

즉, MSE 값이 클수록 타깃과 입력의 픽셀 오차가 크다는 것으로 간주할 수 있고, MSE 값을 백분율로 나타내어 그 값이 사전에 정의된 오차 범위(예컨대, 25%)를 초과할 경우에는 기준 값에 해당하는 문자가 아닌 것으로 간주할 수 있다. In other words, the larger the MSE value, the larger the pixel error between the target and the input, and the MSE value is expressed as a percentage. If the value exceeds the predefined error range (for example, 25%), it corresponds to the reference value. Can be considered non-characters.

예컨대, 도 8을 참조하여 MSE 값을 구해보면, M×N=20×30=600이므로, 20×30의 이미지는 600개의 픽셀로 구성되어 있음을 알 수 있다. For example, referring to FIG. 8, the MSE value can be seen that since M × N = 20 × 30 = 600, the 20 × 30 image is composed of 600 pixels.

각 픽셀별로 타깃에서 입력의 픽셀 값을 뺀 값의 절대 값을 계산해보면, |T(x6y11)-I(x6y11)|=1, |T(x7y12)-I(x7y12)|=1, |T(x8y8)-I(x8y8)|=1, |T(x8y9)-I(x8y9)|=1, |T(x11y8)-I(x11y8)|=1, |T(x11y9)-I(x11y9)|=1, |T(x14y17)-I(x14y17)|=1, |T(x15y16)-I(x15y16)|=1, |T(x15y20)-I(x15y20)|=1, |T(x16y19)-I(x16y19)|=1, |T(x16y23)-I(x16y23)|=1, |T(x17y22)-I(x17y22)|=1 (이미지에서 굵게 표시된 픽셀들의 계산 값을 의미함)을 제외한 나머지 픽셀의 계산 값은 0이므로, 절대 값의 합은 12이다. For each pixel, calculate the absolute value of the target minus the pixel value of the input: | T (x6y11) -I (x6y11) | = 1, | T (x7y12) -I (x7y12) | = 1, | T ( x8y8) -I (x8y8) | = 1, | T (x8y9) -I (x8y9) | = 1, | T (x11y8) -I (x11y8) | = 1, | T (x11y9) -I (x11y9) | = 1, | T (x14y17) -I (x14y17) | = 1, | T (x15y16) -I (x15y16) | = 1, | T (x15y20) -I (x15y20) | = 1, | T (x16y19) -I (x16y19) | = 1, | T (x16y23) -I (x16y23) | = 1, | T (x17y22) -I (x17y22) | = 1 (meaning the calculated value of the bold pixels in the image) Since the remaining pixel count is 0, the sum of absolute values is 12.

즉, 12/600을 백분율로 고치면 2%가 나와 25%를 초과하지 않으므로 도 8에 도시한 문서 이미지는 타깃 이미지에 해당하는 문자로 간주되어 문자 인식될 수 있다. That is, if 12/600 is modified as a percentage, 2% does not exceed 25%, and thus the document image shown in FIG. 8 may be regarded as a character corresponding to the target image and may be recognized.

상술한 단계를 거쳐 문자 인식이 완료된 입력 문서는 데이터 저장부(500)에 저장된다(S900).The input document in which character recognition is completed through the above-described steps is stored in the data storage unit 500 (S900).

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한, 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The invention can also be embodied as computer readable code on a computer readable recording medium. Computer-readable recording media include all kinds of recording devices that store data that can be read by a computer system. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage, and the like, which are also implemented in the form of a carrier wave (for example, transmission over the Internet). It also includes. The computer readable recording medium can also be distributed over network coupled computer systems so that the computer readable code is stored and executed in a distributed fashion.

이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다. So far I looked at the center of the preferred embodiment for the present invention. Those skilled in the art will appreciate that the present invention can be implemented in a modified form without departing from the essential features of the present invention. Therefore, the disclosed embodiments should be considered in descriptive sense only and not for purposes of limitation. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the scope will be construed as being included in the present invention.

도 1은 본 발명에 따른 광학 문자 인식 시스템의 일 실시 예의 개략적인 블록도.1 is a schematic block diagram of an embodiment of an optical character recognition system in accordance with the present invention.

도 2는 기준 값이 되는 문자 이미지의 실시 예를 도시한 도면.2 is a diagram illustrating an embodiment of a text image serving as a reference value.

도 3은 본 발명에 따른 광학 문자 인식 방법 중에서 문자 인식 단계의 전처리 단계인 문자 학습 단계 및 문서 형식 설정 단계를 나타낸 일 실시 예의 개략적인 흐름도.3 is a schematic flowchart of an embodiment showing a character learning step and a document format setting step which are preprocessing steps of a character recognition step in the optical character recognition method according to the present invention;

도 4는 일반적인 라인 식별의 실시 예를 도시한 도면.4 illustrates an embodiment of general line identification.

도 5는 그룹화된 이미지 픽셀의 크기를 정규화시키는 실시 예를 도시한 도면.5 illustrates an embodiment of normalizing the size of grouped image pixels.

도 6은 도 3의 유사도 측정을 통한 학습 이미지 픽셀 그룹화 단계의 실시 예를 나타낸 흐름도.6 is a flowchart illustrating an embodiment of a training image pixel grouping step using the similarity measure of FIG. 3.

도 7은 본 발명에 따른 광학 문자 인식 방법 중에서 문자 인식 단계를 나타낸 일 실시 예의 개략적인 흐름도.7 is a schematic flowchart of an embodiment showing a character recognition step in the optical character recognition method according to the present invention.

도 8은 MSE 값을 비교하여 문자 인식을 하는 타깃 이미지와 입력 이미지의 실시 예를 도시한 도면.8 is a diagram illustrating an embodiment of a target image and an input image for character recognition by comparing MSE values.

Claims (18)

문자 인식을 하고자 하는 문서의 형식 및 상기 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정하는 문서 형식 설정부; A document format setting unit for setting a format of a document to be recognized for text and a recognition area for performing character recognition in the document; 문자 인식을 수행할 문서 이미지를 입력하는 이미지 등록부; An image register for inputting a document image to perform character recognition; 상기 문서 이미지가 상기 문서 형식 설정부에서 설정된 문서의 형식에 해당할 경우, 상기 인식 영역 내의 문자를 문자 학습에 의해 생성된 기준값과 비교하여 인식하는 문자 인식부; 및A text recognition unit for recognizing a character in the recognition area by comparing with a reference value generated by character learning, when the document image corresponds to a format of a document set by the document format setting unit; And 상기 문서 형식 설정부, 상기 이미지 등록부 및 상기 문자 인식부에서 발생한 데이터를 저장하는 데이터 저장부; 를 포함하고,A data storage unit for storing data generated by the document format setting unit, the image registration unit, and the character recognition unit; Including, 상기 문자 인식부는, The character recognition unit, 상기 문서 이미지의 전체 크기를 조절하고 이미지의 픽셀 값을 이진화하며, 상기 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화하여 문자를 인식하는 것을 특징으로 하는 광학 문자 인식 시스템.Adjusting the overall size of the document image, binarize the pixel value of the image, and the optical recognition of the character by grouping pixels adjacent to each other among the pixels having a pixel value indicating a character in the binary document image Character recognition system. 삭제delete 제 1항에 있어서,The method of claim 1, 상기 문자 인식부는, The character recognition unit, 상기 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 가진 픽셀 중, 최하단 픽셀들을 연결하여 라인을 식별함으로써 문자를 인식하는 것을 특징으로 하는 광학 문자 인식 시스템.And recognizing a character by concatenating the lowest pixels among the pixels having a pixel value indicating a character in the binarized document image to identify a line. 삭제delete 제 1항에 있어서,The method of claim 1, 상기 문자의 기준 값을 생성하기 위해 다수의 문자 이미지를 학습하여 상기 데이터 저장부에 저장하는 문자 학습부; 를 더 포함하는 것을 특징으로 하는 광학 문자 인식 시스템.A text learning unit learning and storing a plurality of text images to generate a reference value of the text; Optical character recognition system further comprises. 제 5항에 있어서,The method of claim 5, 상기 문자 학습부는, The character learning unit, 상기 학습할 이미지의 전체 크기를 조절하고 이미지의 픽셀 값을 이진화하여 문자를 학습하는 것을 특징으로 하는 광학 문자 인식 시스템.And characterizing the image by adjusting the overall size of the image to be learned and binarizing pixel values of the image. 제 6항에 있어서,The method of claim 6, 상기 문자 학습부는, The character learning unit, 상기 이진화된 학습 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화 하여 문자를 학습하는 것을 특징으로 하는 광학 문자 인식 시스템.And a group of adjacent pixels among pixels having a pixel value indicating a character in the binarized learning image to learn a character. 제 7항에 있어서,The method of claim 7, wherein 상기 문자 학습부는, The character learning unit, 상기 그룹화된 픽셀을 미리 설정된 크기로 정규화하고, 상기 정규화된 그룹을 미리 지정되어 있는 학습 데이터에 대응하여 문자를 학습하는 것을 특징으로 하는 광학 문자 인식 시스템.And normalizing the grouped pixels to a preset size, and learning the character corresponding to the predetermined training data. 문자 인식을 하고자 하는 문서의 형식 및 상기 문서에서 문자 인식을 수행하고자 하는 인식 영역을 설정하여 저장하는 문서 형식 설정 단계; A document format setting step of setting and storing a format of a document to be subjected to text recognition and a recognition area to perform text recognition in the document; 문자 인식을 하고자 수행할 문서 이미지를 입력하는 이미지 등록 단계; 및An image registration step of inputting a document image to be performed for character recognition; And 상기 문서 이미지가 상기 문서 형식 설정 단계에서 설정된 문서의 형식에 해당할 경우, 인식 영역 내의 문자를 문자 학습에 의해서 생성된 기준값과 비교하여 인식하고 저장하는 문자 인식 단계; 를 포함하고,A character recognition step of recognizing and storing a character in a recognition area in comparison with a reference value generated by character learning, when the document image corresponds to a format of a document set in the document format setting step; Including, 상기 문자 인식 단계는,The character recognition step, 상기 인식 영역 내의 문자를 상기 기준값과 비교하기 전에, 상기 문서 이미지의 전체 크기를 미리 설정된 규격에 맞게 축소하고, 축소된 이미지의 픽셀 값을 이진화하는 문서 이미지 변환 단계; 및A document image conversion step of reducing the overall size of the document image to a preset standard and binarizing pixel values of the reduced image before comparing the characters in the recognition area with the reference value; And 상기 이진화된 문서 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화하는 문서 문자 그룹 생성 단계; 를 포함하는 것을 특징으로 하는 광학 문자 인식 방법.Generating a document character group grouping pixels adjacent to each other among pixels having a pixel value indicating a character in the binarized document image; Optical character recognition method comprising a. 삭제delete 제 9항에 있어서,The method of claim 9, 상기 문자 인식 단계는,The character recognition step, 문서 이미지 변환 단계 이후에, 상기 이진화된 문서 이미지가 상기 설정된 문서의 형식에 해당할 경우, 상기 이진화된 이미지에서 문자를 지칭하는 픽셀 값을 가진 픽셀 중, 최하단 픽셀들을 연결하여 라인을 식별하는 문서 이미지 라인 식별 단계; 를 더 포함하는 것을 특징으로 하는 광학 문자 인식 방법.After the document image converting step, when the binarized document image corresponds to the set document format, a document image which connects the lowest pixels among the pixels having pixel values referring to characters in the binarized image to identify a line. Line identification step; Optical character recognition method further comprises. 삭제delete 제 9항에 있어서,The method of claim 9, 상기 문서 형식 설정 단계 이전에, 상기 문자의 기준 값을 생성하기 위해 다수의 문자 이미지를 학습하여 저장하는 문자 학습 단계; 를 더 포함하는 것을 특징으로 하는 광학 문자 인식 방법.A text learning step of learning and storing a plurality of text images to generate a reference value of the text before the document format setting step; Optical character recognition method further comprises. 제 13항에 있어서,The method of claim 13, 상기 문자 학습 단계는,The character learning step, 다수의 문자 이미지를 학습하기 전에, 미리 설정된 규격에 맞게 학습할 이미지의 전체 크기를 축소하고, 축소된 이미지의 픽셀 값을 이진화하는 학습 이미지 변환 단계; 를 포함하는 것을 특징으로 하는 광학 문자 인식 방법.Before learning a plurality of text images, the learning image conversion step of reducing the overall size of the image to be learned in accordance with a predetermined standard, and binarizing the pixel value of the reduced image; Optical character recognition method comprising a. 제 14항에 있어서,15. The method of claim 14, 상기 문자 학습 단계는,The character learning step, 상기 이진화된 학습 이미지에서 문자를 지칭하는 픽셀 값을 갖는 픽셀들 중 서로 인접하는 픽셀들을 그룹화하는 학습 문자 그룹 생성 단계; 를 더 포함하는 것을 특징으로 하는 광학 문자 인식 방법.Generating a learning character group grouping pixels adjacent to each other among pixels having a pixel value indicating a character in the binarized learning image; Optical character recognition method further comprises. 제 15항에 있어서,The method of claim 15, 상기 문자 학습 단계는,The character learning step, 상기 학습 문자 그룹 생성 단계 이후에, 상기 그룹화된 픽셀을 미리 설정된 크기로 정규화하여 미리 지정되어 있는 학습 데이터에 대응하는 문자 지정 단계; 를 더 포함하는 것을 특징으로 하는 광학 문자 인식 방법.A character designating step corresponding to a predetermined learning data by normalizing the grouped pixels to a preset size after the learning character group generating step; Optical character recognition method further comprises. 제 9항 또는 제 15항에 있어서,The method according to claim 9 or 15, 둘 이상의 그룹화된 픽셀들의 이격 거리가 미리 설정된 이격 거리 범위 내에 위치할 경우, 하나의 그룹으로 그룹화하는 것을 특징으로 하는 광학 문자 인식 방법.And when the separation distance of two or more grouped pixels is located within a preset separation distance range, grouping into one group. 제 9항, 제 11항, 및 제 13항 내지 제 16항 중 어느 한 항의 광학 문자 인식 방법을 컴퓨터에서 판독할 수 있고, 실행 가능한 프로그램 코드로 기록한 기록 매체.17. A recording medium in which the optical character recognition method of any one of claims 9, 11, and 13-16 is readable by a computer, and recorded with executable program code.
KR1020080049655A 2008-05-28 2008-05-28 System and method for recognizing optical characters KR100957508B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080049655A KR100957508B1 (en) 2008-05-28 2008-05-28 System and method for recognizing optical characters

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080049655A KR100957508B1 (en) 2008-05-28 2008-05-28 System and method for recognizing optical characters

Publications (2)

Publication Number Publication Date
KR20090123523A KR20090123523A (en) 2009-12-02
KR100957508B1 true KR100957508B1 (en) 2010-05-14

Family

ID=41685749

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080049655A KR100957508B1 (en) 2008-05-28 2008-05-28 System and method for recognizing optical characters

Country Status (1)

Country Link
KR (1) KR100957508B1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104778432B (en) * 2014-01-10 2018-10-12 上海携程商务有限公司 Image-recognizing method
KR102196110B1 (en) * 2018-12-31 2020-12-29 주식회사 포스코아이씨티 Robot Process Automation System including Optical Character Recognition
CN113836971B (en) * 2020-06-23 2023-12-29 中国人寿资产管理有限公司 Visual information reproduction method, system and storage medium after image type scanning piece identification

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050079378A (en) * 2004-02-05 2005-08-10 한국과학기술원 Method and system for digitalizing a large volume of documents based on character recognition with adaptive training module to real data
US20060108444A1 (en) * 2004-11-12 2006-05-25 Jonathan Yeh Sprinkler housing with side inlet

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050079378A (en) * 2004-02-05 2005-08-10 한국과학기술원 Method and system for digitalizing a large volume of documents based on character recognition with adaptive training module to real data
US20060108444A1 (en) * 2004-11-12 2006-05-25 Jonathan Yeh Sprinkler housing with side inlet

Also Published As

Publication number Publication date
KR20090123523A (en) 2009-12-02

Similar Documents

Publication Publication Date Title
CN109376658B (en) OCR method based on deep learning
US8494273B2 (en) Adaptive optical character recognition on a document with distorted characters
KR101769918B1 (en) Recognition device based deep learning for extracting text from images
US20050185841A1 (en) Automatic document reading system for technical drawings
CN112508011A (en) OCR (optical character recognition) method and device based on neural network
JP3602596B2 (en) Document filing apparatus and method
JP2012008791A (en) Form recognition device and form recognition method
CN110728687B (en) File image segmentation method and device, computer equipment and storage medium
CN112784220B (en) Paper contract tamper-proof verification method and system
JP3851742B2 (en) Form processing method and apparatus
US10628702B1 (en) Method of matching a query image to a template image and extracting information from the query image
CN115687643A (en) Method for training multi-mode information extraction model and information extraction method
KR100957508B1 (en) System and method for recognizing optical characters
US20200026970A1 (en) System and Method for Processing Character Images and Transforming Font Within a Document
CN114758341A (en) Intelligent contract image identification and contract element extraction method and device
CN110796145A (en) Multi-certificate segmentation association method based on intelligent decision and related equipment
CN113496115B (en) File content comparison method and device
CN117076455A (en) Intelligent identification-based policy structured storage method, medium and system
US7865130B2 (en) Material processing apparatus, material processing method, and material processing program product
CN114494678A (en) Character recognition method and electronic equipment
CN112287763A (en) Image processing method, apparatus, device and medium
JP3476595B2 (en) Image area division method and image binarization method
JP2001022883A (en) Character recognizing system and recording medium for realizing function for the same
CN117807291B (en) Intelligent identification interaction processing method and platform for business materials
CN115131806B (en) Method and system for identifying OCR (optical character recognition) image information of various certificates based on deep learning

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130405

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140304

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee