KR20220005243A - Sharing and recognition method and device of handwritten scanned document - Google Patents

Sharing and recognition method and device of handwritten scanned document Download PDF

Info

Publication number
KR20220005243A
KR20220005243A KR1020200082815A KR20200082815A KR20220005243A KR 20220005243 A KR20220005243 A KR 20220005243A KR 1020200082815 A KR1020200082815 A KR 1020200082815A KR 20200082815 A KR20200082815 A KR 20200082815A KR 20220005243 A KR20220005243 A KR 20220005243A
Authority
KR
South Korea
Prior art keywords
document
attribute
handwritten
image
electronic document
Prior art date
Application number
KR1020200082815A
Other languages
Korean (ko)
Inventor
김밀알
Original Assignee
김밀알
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김밀알 filed Critical 김밀알
Priority to KR1020200082815A priority Critical patent/KR20220005243A/en
Publication of KR20220005243A publication Critical patent/KR20220005243A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/20Combination of acquisition, preprocessing or recognition functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/002D [Two Dimensional] image generation
    • G06T11/60Editing figures and text; Combining figures or text
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition

Abstract

A method for recognizing and sharing a handwritten scanned electronic file according to an embodiment of the present invention includes the steps of: acquiring the image of a document including handwriting recorded by a document author; recognizing at least one handwritten character from the acquired image; analyzing the structure of the document based on the recognized handwriting; distributing and storing the analyzed result as an attribute factor and an attribute-combined electronic document together with an image in a distributed storage server; extracting the attribute-combined electronic document from a distributed storage server based on a search request received from a document user and an attribute factor; and providing the extracted attribute combination electronic document to the document user.

Description

수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치 {SHARING AND RECOGNITION METHOD AND DEVICE OF HANDWRITTEN SCANNED DOCUMENT}Method and device for recognizing and sharing handwritten scanned electronic files {SHARING AND RECOGNITION METHOD AND DEVICE OF HANDWRITTEN SCANNED DOCUMENT}

본 발명은 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치에 관한 것으로, 더욱 상세하게는 문서저작자가 수기로 기록한 문자, 숫자, 도형 등을 정보기기를 통하여 인식시켜 생성된 전자문서를 문서사용자가 공유하고 재 편집할 수 있도록 하기 위한 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치에 관한 것이다.The present invention relates to a method and apparatus for recognizing and sharing a handwritten scanned electronic file, and more particularly, to an electronic document generated by recognizing letters, numbers, figures, etc. written by a document author by hand through an information device. It relates to a method and apparatus for recognizing and sharing handwritten scanned electronic files for sharing and re-editing by document users.

종래의 수기 인식 기술 및 장치는 수기된 필체를 구성하는 글자나 각 획들을 인식하는 알고리즘이 복잡하고 불안정하여 수기된 필체의 인식률이 낮고 비효율적인 문제점이 있었다. 또한, 수기로 저작된 문서를 스캔하여 저장하거나 공유하려고 할 때, 사람이 직접 입력시킨 키워드, 주제어 외에는 빠르고 정확하게 글자의 구성을 찾기 어려우며, 각각의 글자를 다른 전자문서에 복사하기 어려운 점이 존재하였다. Conventional handwriting recognition technology and apparatus have problems in that the recognition rate of handwritten handwriting is low and inefficient because an algorithm for recognizing letters or each stroke constituting the handwritten handwriting is complex and unstable. In addition, when trying to scan and save or share a document written by hand, it is difficult to quickly and accurately find the composition of characters other than keywords and keywords entered by humans, and it is difficult to copy each character to another electronic document.

본 발명은 상기와 같은 문제점을 해결하기 위해 고안된 것으로, 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치를 제공하는데 그 목적이 있다.The present invention was devised to solve the above problems, and an object of the present invention is to provide a method for recognizing and sharing a handwritten scanned electronic file and an apparatus therefor.

본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식 방법은 문서저작자에 의하여 기록된 수기로 작성된 문자를 포함하는 문서에 대한 이미지를 획득하는 단계; 이미지로부터 적어도 하나의 필기체 문자를 인식하는 단계; 인식된 필체에 기초하여 문서의 구조와 속성을 분석하는 단계; 분석된 결과를 속성팩터로써 이미지와 함께 속성결합전자문서로 분산 저장 서버에 분산 저장하는 단계; 문서사용자로부터 수신된 검색 요청 및 속성팩터에 기초하여 분산 저장 서버로부터 속성결합전자문서를 추출하는 단계; 및 추출된 속성결합전자문서를 문서사용자에게 제공하는 단계를 포함할 수 있다.A method for recognizing a handwritten scanned electronic file according to an embodiment of the present invention includes: acquiring an image of a document including handwritten characters recorded by a document author; recognizing at least one cursive character from the image; analyzing the structure and properties of the document based on the recognized handwriting; Distributing and storing the analyzed result as an attribute factor as an attribute-combined electronic document with an image in a distributed storage server; extracting the attribute binding electronic document from the distributed storage server based on the attribute factor and the search request received from the document user; and providing the extracted attribute combination electronic document to a document user.

발명의 일 실시예에 따른 수기된 필체가 인식되어 생성된 전자문서의 공유를 위한 장치는 문서저작자에 의하여 기록된 수기된 필체를 포함하는 문서에 대한 이미지를 획득하기 위한 이미지 획득부; 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하기 위한 문자 인식부; 인식된 필체에 기초하여 문서의 구조를 분석하는 구조 분석부, 분석된 결과가 속성팩터로써 이미지와 함께 속성결합전자문서로 분산 저장되는 분산 저장 서버; 문서사용자로부터 검색 요청을 수신하기 위한 속성 검색부; 수신된 검색 요청 및 속성팩터에 기초하여 분산 저장 서버로부터 속성결합전자문서를 추출하기 위한 속성결합전자문서 추출부; 및 추출된 속성결합전자문서를 문서사용자에게 제공하기 위한 출력부를 포함할 수 있다.According to an embodiment of the present invention, an apparatus for sharing an electronic document generated by recognizing handwritten handwriting includes an image obtaining unit for obtaining an image of a document including handwritten handwriting recorded by a document author; a character recognition unit for recognizing at least one handwritten character from the acquired image; a structure analysis unit analyzing the structure of a document based on the recognized handwriting, a distributed storage server in which the analyzed result is distributed and stored as an attribute-combined electronic document together with an image as an attribute factor; an attribute search unit for receiving a search request from a document user; an attribute binding electronic document extraction unit for extracting an attribute binding electronic document from a distributed storage server based on the received search request and attribute factor; and an output unit for providing the extracted attribute combination electronic document to a document user.

본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 공유 방법 및 그 장치를 이용하여 문서저작자는 수기로 작성된 노트, 자료, 서류 등의 여러 가지 문서들을 전자문서화하여 분산 저장 서버에 분산 저장하거나 디지털 이미지들을 속성팩터와 결합하여 속성결합전자문서로서 분산 저장 서버에 저장할 수 있다. 또한, 문서사용자는 자신이 필요로 하는 수기로 작성된 스캔본 전자파일을 분산 저장 서버에서 검색하여 속성결합전자문서를 추출할 수 있으며, 추출한 속성결합전자문서를 편집하고 저장할 수 있다. 따라서, 문서저작자는 종이, 태블릿 PC 등과 같이 매체를 가리지않고 자유롭게 필기하여 기록하고 수기된 필체가 기록된 문서 등을 속성결합전자문서로써 변환시켜 분산 저장 서버에 저장해 둘 수 있고, 이러한 속성결합전자문서에는 필기체 분석을 통하여 추출되어 생성된 속성팩터가 부가되어 있을 수 있고, 저작자와 사용자 간에 속성결합전자문서가 상호 공유될 수 있다. 다시 말해서, 속성팩터를 이용하여 문서저작자뿐만 아니라 문서사용자도 수기로 작성된 스캔본 전자파일을 빠르고 정확하게 검색하거나 편집할 수 있으므로 속성결합전자문서의 공유가 가능하다.Using the method and the device for recognizing and sharing handwritten scanned electronic files according to an embodiment of the present invention, the document author converts various documents such as handwritten notes, data, and documents into electronic documents and stores them in a distributed storage server. Distributed storage or combining digital images with attribute factors can be stored in a distributed storage server as an attribute-combined electronic document. In addition, the document user can extract the attribute-combined electronic document by searching the distributed storage server for the handwritten scanned electronic file that he or she needs, and can edit and store the extracted attribute-coupled electronic document. Therefore, the document author can freely write and record regardless of media such as paper or tablet PC, and convert the document in which the handwritten handwriting is recorded into an attribute-coupled electronic document and store it in a distributed storage server, and such attribute-combined electronic document Attribute factors extracted and generated through cursive analysis may be added to , and an attribute-combined electronic document may be mutually shared between an author and a user. In other words, by using the attribute factor, not only the document author but also the document user can quickly and accurately search or edit the handwritten scanned electronic file, so that the attribute-combined electronic document can be shared.

도 1은 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 전자파일을 문서저작자와 문서사용자가 공유하는 방법을 개략적으로 나타낸 도면이다.
도 2는 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 공유 방법을 나타내는 순서도이다.
도 3은 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 공유 장치를 나타낸 블럭도이다.
도 4는 본 발명의 일 실시예에 따른 화면이 표시된 단말기를 도시한 그림이다.
1 is a diagram schematically illustrating a method of recognizing a handwritten scanned electronic file and sharing an electronic file between a document author and a document user according to an embodiment of the present invention.
2 is a flowchart illustrating a method of recognizing and sharing a handwritten scanned electronic file according to an embodiment of the present invention.
3 is a block diagram illustrating an apparatus for recognizing and sharing a handwritten scanned electronic file according to an embodiment of the present invention.
4 is a diagram illustrating a terminal on which a screen is displayed according to an embodiment of the present invention.

아래에서는 첨부한 도면을 참조하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본 발명의 실시예를 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art can easily implement them. However, the present invention may be embodied in several different forms and is not limited to the embodiments described herein. And in order to clearly explain the present invention in the drawings, parts irrelevant to the description are omitted, and similar reference numerals are attached to similar parts throughout the specification.

명세서 전체에서 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있음을 의미한다. 또한, 명세서에 기록된 "...부", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어 또는 소프트웨어로 구현되거나 하드웨어와 소프트웨어의 결합으로 구현될 수 있다. 또한, 명세서 전체에서 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, "그 중간에 다른 소자를 사이에 두고" 연결되어 있는 경우도 포함한다.In the entire specification, when a part "includes" a certain element, this means that other elements may be further included, rather than excluding other elements, unless otherwise stated. In addition, terms such as "...unit" and "module" recorded in the specification mean a unit that processes at least one function or operation, which may be implemented as hardware or software, or a combination of hardware and software. have. In addition, throughout the specification, when a part is "connected" with another part, this includes not only the case of being "directly connected" but also the case of being connected "with another element in the middle".

이하 첨부된 도면을 참고하여 본 발명을 상세히 설명하기로 한다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 전자파일을 문서저작자와 문서사용자가 공유하는 방법을 개략적으로 나타낸 도면이다.1 is a diagram schematically illustrating a method of recognizing a handwritten scanned electronic file and sharing an electronic file between a document author and a document user according to an embodiment of the present invention.

도 1을 참조하면, 수기로 작성된 스캔본 전자파일을 공유하기 위해서 문서저작자는 수기로 기록된 노트, 자료, 데이터 등을 디지털 이미지화 할 수 있다. 예를 들면, 도 1 의 저작문서 A는 문서저작자가 작성한 노트이거나, 문서저작자가 디지털 이미지화 하기를 원하는 수기된 필체가 기록된 서류, 데이터, 자료 등의 문서가 될 수 있다.Referring to FIG. 1 , in order to share a handwritten scanned electronic file, a document author may digitally image handwritten notes, data, and data. For example, the writing document A of FIG. 1 may be a note written by the document author or may be a document, data, material, etc., in which handwritten handwriting that the document author desires to be digitally imaged is recorded.

예를 들면, 문서저작자는 수기된 필체가 기록된 저작문서 A를 스캐너 또는 카메라 등의 디지털 이미지화 할 수 있는 장치를 이용하여 수기된 필체를 포함하는 문서에 대한 디지털 이미지를 획득할 수 있다.For example, the document author may obtain a digital image of the document including the handwritten handwriting by using a device capable of digitalizing the written document A on which the handwritten handwriting is recorded, such as a scanner or a camera.

다음으로, 문서저작자는 필기체 또는 수기 인식 장치를 이용하여, 획득된 디지털 이미지에서 적어도 하나의 수기된 필체가 인식되게 할 수 있다. 예를 들면, 본 발명의 일 실시예에 따른 수기 인식 장치를 통하여 디지털 이미지로부터 윤곽선이 추출되거나 골격선이 추출되어 보정, 이진화 및 세선화 과정이 수행되는 전처리과정(preprocessing), 특징점 추출 및 추출된 특징점에 기초하여 기본 도형 및 복합 도형이 추출되고, 자소가 생성되며, 생성된 자소에 상응하는 자음 또는 모음이 결정되는 본처리과정 및 결정된 자음과 모음이 결합되는 후처리 과정(post processing)을 거쳐 적어도 하나의 수기된 필체가 인식될 수 있다.Next, the document author may use a cursive or handwriting recognition device to recognize at least one handwritten handwriting in the acquired digital image. For example, a preprocessing process in which outlines or skeleton lines are extracted from a digital image and correction, binarization and thinning processes are performed through the handwriting recognition device according to an embodiment of the present invention, feature point extraction and extraction Basic figures and complex figures are extracted based on the feature points, grapheme is generated, a main processing process in which a consonant or vowel corresponding to the generated grapheme is determined, and a post processing process in which the determined consonants and vowels are combined. At least one handwritten handwriting may be recognized.

다음으로, 적어도 하나의 필기 문자가 인식된 전자문서에 대하여 속성팩터 생성 및 결합을 위해서, 문서의 구조 분석 및 속성이 검출될 수 있다. 즉 문서의 구조 분석 및 속성 검출 과정은 수기된 필체가 인식된 문서 안에서 문자, 도형, 수식, 키워드, 위치, 크기 등의 좌표를 확인하는 과정이 될 수 있다. 예를 들어, 수기된 필체가 인식된 문서 안에서 문서 구조 분석 및 속성 검출을 위해 문자, 도형, 수식, 키워드, 위치, 크기 등의 좌표를 확인하고, 이에 대응한 속성팩터를 생성하고, 수기된 필체가 인식된 문서 이미지와 대응 속성팩터를 결합하거나 결합하여 저장할 수 있다.Next, in order to generate and combine attribute factors with respect to the electronic document in which at least one handwritten character is recognized, the structure analysis and attributes of the document may be detected. That is, the process of analyzing the structure of the document and detecting the attributes may be a process of confirming the coordinates of characters, figures, formulas, keywords, positions, sizes, etc. in the document in which the handwritten handwriting is recognized. For example, in a document in which a handwritten handwriting is recognized, coordinates such as text, figure, formula, keyword, location, size, etc. are checked for document structure analysis and property detection, a corresponding property factor is generated, and handwritten handwriting is identified. may combine or combine the recognized document image and the corresponding attribute factor and store it.

다음으로, 문서저작자는 수기로 인식된 저작문서 A, 즉 디지털 이미지화되어 글자로 인식된 저작문서 A를 분산 저장 서버에 업로드(upload) 할 수 있다.Next, the author of the document may upload the writing document A recognized by hand, that is, the writing document A digitally imaged and recognized as letters to the distributed storage server.

분산 저장 서버에 업로드된 저작문서 A는 수기된 필체가 인식된 디지털 이미지 및 구조분석 및 속성 검출 후 생성된 속성팩터들을 포함하도록 구성될 수 있고, 이에따라 분산 저장 서버에 저장된 저작문서 A 는 결합되어 있는 속성팩터에 기초하여 분류되거나 검색될 수 있다. 즉, 수기된 필체가 인식된 저작문서 A를 결합된 속성팩터를 이용하여, 각 검색어, 주제어, 키워드에 따라서 속성정보DB와 연동하여 속성팩터로써 결합하여 저장할 수 있다. 이와 같이 속성팩터와 결합, 분류하는 과정은 분산 저장 서버에서 이루어 질 수도 있으나, 문서저작자가 저작문서 A의 구조 분석 및 속성 검출 후, 또는 저작문서 A를 분산 저장 서버에 업로드하는 과정에서 자신이 직접 속성정보DB에서 선정하여 저작문서 A와 속성팩터를 결합하여 저장할 수도 있다.The authoring document A uploaded to the distributed storage server may be configured to include a digital image in which the handwritten handwriting is recognized and the property factors generated after structural analysis and property detection, and accordingly, the authoring document A stored in the distributed storage server is combined It may be classified or searched based on the attribute factor. That is, by using the combined attribute factor, the written document A in which the handwritten handwriting is recognized can be combined and stored as an attribute factor by interworking with the attribute information DB according to each search word, main word, and keyword. The process of combining and classifying attribute factors as described above may be performed in the distributed storage server, but the document author himself/herself directly It is also possible to select from the attribute information DB and store it by combining the author document A and the attribute factor.

도 1을 참조하면, 문서사용자는 수기로 작성된 문서를 검색하기 위해서, 분산 저장 서버에서 속성정보DB 의 속성팩터와 관련된 검색어로 검색을 요청할 수 있다. 여기에서 수기된 필체가 인식된 저작문서 A는 속성팩터와 결합하여 저장된 상태로 속성결합전자문서 A 로 지칭될 수 있다. 즉, 속성결합전자문서란 디지털 이미지와 여러 가지 정보가 결합된 속성팩터를 포함하는 파일의 형태를 지칭하는 것으로, 문서사용자는 검색을 통하여 속성결합전자문서 A 를 저장소 등으로부터 추출해낼 수 있다.Referring to FIG. 1 , in order to search for a handwritten document, a document user may request a search with a search word related to an attribute factor of an attribute information DB in the distributed storage server. Here, the written document A in which the handwritten handwriting is recognized may be referred to as an attribute-coupled electronic document A in a stored state in combination with the attribute factor. That is, the attribute-combined electronic document refers to the form of a file including an attribute factor in which a digital image and various information are combined.

또한, 문서사용자는 추출한 속성결합전자문서를 자신의 필요에 따라 편집하여 분산 저장 서버에 저장 또는 업로드 할 수 있다. 예를 들면, 문서사용자는 추출한 속성결합전자문서 A에다 자신이 직접 필기체나 워드 프로세서 등의 디지털 장치로 새로운 정보를 부가적으로 입력하여 저장할 수 있으며, 속성결합전자문서 A는 부가된 새로운 정보에 따라서 관련된 속성팩터가 새로 결합하여 속성결합전자문서 A' 로 분산 저장 서버에 저장될 수 있다.In addition, the document user can edit the extracted attribute-combined electronic document according to his or her needs and store or upload it to the distributed storage server. For example, the document user can additionally input and store new information with a digital device, such as a cursive or word processor, directly to the extracted attribute-combined electronic document A, and the attribute-combined electronic document A is based on the added new information. Relevant attribute factors may be newly combined and stored in the distributed storage server as attribute-combined electronic document A'.

도 2는 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일을 공유하는 방법을 나타내는 순서도이다.2 is a flowchart illustrating a method of sharing a handwritten scanned electronic file according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일을 공유하는 방법은, 문서저작자에 의하여 기록된 수기된 필체를 포함하는 문서에 대한 이미지를 획득하는 단계(S110), 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하는 단계(S120), 인식된 필체에 기초하여 문서의 구조를 분석하는 단계(S130), 분석된 결과를 속성팩터로써 이미지와 함께 분산 저장 서버에 분산 저장하는 단계(S140), 문서사용자로부터 수신된 검색 요청 및 속성팩터에 기초하여 분산 저장 서버로부터 속성결합전자문서를 추출하는 단계(S150) 및 추출된 속성결합전자문서를 문서사용자에게 제공하는 단계(S160)를 포함할 수 있다.A method of sharing a handwritten scanned electronic file according to an embodiment of the present invention includes: obtaining an image of a document including handwritten handwriting recorded by a document author (S110); Recognizing a single handwritten character (S120), analyzing the structure of the document based on the recognized handwriting (S130), and distributing and storing the analyzed result in a distributed storage server together with an image as an attribute factor ( S140), extracting the attribute binding electronic document from the distributed storage server based on the search request and the attribute factor received from the document user (S150) and providing the extracted attribute binding electronic document to the document user (S160) can do.

먼저, 수기로 작성된 스캔본 전자파일을 공유하기 위해서, 문서저작자는 단계 S110에서 수기된 필체를 포함하는 문서에 대한 이미지를 획득할 수 있다. 예를 들면, 획득한 이미지는 수기된 필체가 포함된 문서를 카메라 등으로 직접 촬영하거나, 스캐너를 통하여 스캔함으로써 실시간으로 획득된 문서에 대한 디지털 이미지 파일일 수 있다. 또한, 유선 또는 무선으로 연결 가능한 외부의 장치(예컨대, 인터넷 서버 등)에 이미 저장된 이미지 파일일 수도 있다.First, in order to share the handwritten scanned electronic file, the document author may obtain an image of the document including the handwritten handwriting in step S110. For example, the acquired image may be a digital image file of a document acquired in real time by directly photographing a document including handwritten handwriting with a camera or scanning it through a scanner. Also, it may be an image file already stored in an external device (eg, an Internet server, etc.) that can be connected by wire or wirelessly.

다음으로, 단계 S120에서 문서저작자는 수기 인식 장치 또는 수기 인식 장치 등을 통하여 획득한 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식할 수 있다.Next, in step S120, the document author may recognize at least one handwritten character from an image acquired through a handwriting recognition device or a handwriting recognition device.

본 발명의 일 실시예에 따른 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하는 단계는, 획득된 이미지에 대하여 보정, 이진화 및 세선화 과정을 수행하고, 수행된 이미지에 대하여 특징점을 추출하여 추출된 특징점에 기초하여 수기로부터 획을 분리하거나 결합함으로써 기본 도형 및 복합 도형을 추출하고 자소를 생성하며, 생성된 자소에 상응하는 자음 또는 모음을 결정하는 단계 및 결정된 자음 또는 모음을 결합하여 적어도 하나의 수기로 작성된 문자를 추정하는 단계를 포함할 수 있다.The step of recognizing at least one handwritten character from the acquired image according to an embodiment of the present invention includes performing correction, binarization and thinning processes on the acquired image, and extracting feature points from the performed image. Extracting basic figures and complex figures by separating or combining strokes from handwriting based on the extracted feature points, generating grapheme, determining consonants or vowels corresponding to the generated grapheme, and combining the determined consonants or vowels to at least one It may include the step of estimating the handwritten character of the.

예를 들면, 수기된 필체를 인식하는 방법은 전처리 과정(preprocessing), 특징 추출 및 매칭(matching)을 하는 본처리 과정, 후처리 과정(post-processing) 등으로 이루어질 수 있다.For example, a method for recognizing handwritten handwriting may include preprocessing, a main processing process for feature extraction and matching, post-processing, and the like.

전처리 과정은 문자에서 특징을 추출하기 위해 의미있는 패턴으로 재표현하는 것이고, 수기된 필체를 인식하기 위해서 전처리 과정은 이미지를 획득하면서 윤곽선을 추출하거나 골격선을 추출하는 단계를 포함할 수 있다. 즉, 이미지에서 잡영과 문자의 왜곡을 방지하기 위해서, 획득한 이미지에 대하여 보정, 이진화 및 세선화 과정을 수행할 수 있다.The pre-processing process is to re-express as a meaningful pattern in order to extract features from characters, and to recognize the handwritten handwriting, the pre-processing process may include extracting an outline or a skeleton line while acquiring an image. That is, in order to prevent noise and distortion of characters in the image, correction, binarization, and thinning processes may be performed on the acquired image.

본처리 과정에서는 인식된 필기체 이미지에서 교점 및 첨단점, 중심선 기법에 의한 획의 분리와 결합을 진행하고, 꺽임점에 의하여 기본 도형으로 해체하고 자소 오토마타를 이용하여 자음과 모음을 추출할 수 있다. 따라서, 전처리 과정에서 수행된 이미지에 대하여 특징점을 추출하여 추출된 특징점에 기초하여 수기로부터 획을 분리하거나 결합함으로써 기본 도형 및 복합 도형을 추출하고 자소를 생성하며, 생성된 자소에 상응하는 자음 또는 모음을 결정하는 단계를 포함할 수 있다.In the main processing process, the separation and combination of strokes using the intersection point, tip point, and centerline technique are performed in the recognized cursive image, and it is decomposed into a basic figure by the bending point, and consonants and vowels can be extracted using grapheme automata. Therefore, by extracting key points from the image performed in the pre-processing process and separating or combining strokes from handwriting based on the extracted key points, basic figures and complex figures are extracted and grapheme is generated, and consonants or vowels corresponding to the generated grapheme may include the step of determining

다음으로 추출된 자음과 모음에서 한글 오토마타를 이용하여 한글 코드를 추출하는 것으로, 후처리 과정은 결정된 자음 또는 모음을 결합하여 적어도 하나의 수기로 작성된 문자를 추정하는 단계를 포함할 수 있다.Next, the Hangul code is extracted from the extracted consonants and vowels by using the Hangul automata, and the post-processing process may include estimating at least one handwritten character by combining the determined consonants or vowels.

본 발명의 일 실시예에 따르면, 수기 인식 장치는 수기된 필체의 이미지를 얻는 입력부와 얻어진 이미지에 대하여 보정, 이진화, 세선화 과정이 진행되는 전처리부와 전처리된 이미지에 대하여 특징점을 추출하고, 획을 분리하거나 결합하여 기본도형 및 복합도형을 추출하고, 자소를 생성하는 분석처리부와 처리된 이미지를 한글코드로 변환하여 글자로 인식하는 후처리부를 포함할 수 있다.According to an embodiment of the present invention, the handwriting recognition apparatus includes an input unit for obtaining an image of handwritten handwriting, a preprocessing unit for correcting, binarizing, and thinning the obtained image, and extracting feature points from the preprocessed image, and a stroke It may include an analysis processing unit that extracts basic and complex shapes by separating or combining , and an analysis processing unit that generates grapheme, and a post-processing unit that converts the processed image into Hangul codes and recognizes them as characters.

단계 S130에서, 인식된 필체에 기초하여 문서의 구조를 분석할 수 있다. 즉, 획득한 이미지에서 적어도 하나의 수기로 작성된 문자를 인식하여 문서 안에서의 문자 및 숫자 또는 그림, 도형 등을 파악할 수 있으며, 파악된 문자, 도형 등에 따라서 문서 구조를 분석할 수 있다.In step S130, the structure of the document may be analyzed based on the recognized handwriting. That is, by recognizing at least one handwritten character from the acquired image, it is possible to recognize characters and numbers, pictures, and figures in the document, and analyze the document structure according to the identified characters and figures.

본 발명의 일 실시예에 따르면, 인식된 필체에 기초하여 문서의 구조를 분석하는 단계는, 문서에 포함된 문자, 숫자, 도형, 수식 등의 형태 정보와 크기, 위치, 컬러 등의 속성 정보와 출현 횟수, 대표 키워드 중 적어도 하나에 대한 정보를 획득하는 단계를 포함할 수 있다.According to an embodiment of the present invention, the step of analyzing the structure of a document based on the recognized handwriting includes form information such as letters, numbers, figures, and formulas included in the document, and attribute information such as size, position, color, etc. It may include obtaining information on at least one of the number of appearances and the representative keyword.

또한, 문자, 도형 또는 수식의 위치는 문서의 기준점에 기초하여 파악될 수 있다. 예를 들어, 기준점은 이미지화된 문서의 좌측 또는 우측의 최상단 또는 최하단의 픽셀 등을 지칭할 수 있다. 크기는 전술한 위치값에 기초하여 상대적으로 파악될 수 있으며, 인식된 문자, 도형 또는 수식의 출현 빈도를 누적하여 출연 횟수를 파악할 수 있다. 또한, 문자, 도형 또는 수식에 포함되어 문서 내에서 자주 출현되거나 각각의 의미를 포괄하는 상위 개념의 단어 등이 대표 키워드로써 파악될 수 있다. 또한, 픽셀값에 기초하여 문자, 도형 또는 수식의 컬러 정보가 파악될 수 있다.Also, the position of the character, figure, or formula may be determined based on the reference point of the document. For example, the reference point may refer to a pixel at the top or bottom of the left or right side of the imaged document, or the like. The size may be relatively determined based on the above-described position value, and the number of appearances may be determined by accumulating the frequency of appearance of recognized characters, figures, or formulas. In addition, words, figures, or formulas that frequently appear in documents or have higher-level concepts encompassing respective meanings may be identified as representative keywords. In addition, color information of a character, a figure, or a formula may be recognized based on the pixel value.

단계 S140에서, 문서저작자는 분석된 결과를 속성팩터로서 이미지와 함께 분산 저장 서버에 분산 저장할 수 있다. 즉, 수기된 필체가 인식된 문서의 구조를 인식된 문자, 도형, 수식 등으로 분석하고, 분석된 결과를 속성정보DB의 속성팩터로 추출하여 수기된 필체가 인식된 문서 이미지와 함께 분산 저장 서버에 저장할 수 있다.In step S140, the document author may distribute and store the analyzed result together with the image as an attribute factor in a distributed storage server. That is, the structure of the document in which the handwritten handwriting is recognized is analyzed with the recognized characters, figures, and formulas, and the analyzed result is extracted as a property factor of the property information DB, and a distributed storage server together with the document image in which the handwritten handwriting is recognized can be stored in

또한, 수기된 필체가 인식된 문서 이미지는 문서저작자에 의하여 속성팩터가 결합되어 저장될 수도 있고, 수기된 필체가 인식된 문서가 이미지로서 분산 저장 서버에 업로드 된 후에 속성팩터와 결합하여 저장될 수도 있다.In addition, the document image in which the handwritten handwriting is recognized may be stored by combining the attribute factor by the document author, and after the document in which the handwritten handwriting is recognized is uploaded to the distributed storage server as an image, it may be stored in combination with the attribute factor. have.

본 발명의 일 실시예에 따르면, 속성팩터에는 문자, 숫자, 도형, 수식 등의 형태 정보와 크기, 위치, 컬러 등의 속성 정보와 출현 횟수, 대표 키워드 중 적어도 하나에 대한 정보가 포함될 수 있다. 예를 들어, 속성팩터는 문서의 분석 결과로 검색어로 분류되는 것이기 때문에, 문서의 분석하는 데 필요한 문서에 포함된 문자, 도형 또는 수식, 크기, 위치 등의 적어도 하나를 속성팩터로 이용할 수 있다.According to an embodiment of the present invention, the attribute factor may include information on at least one of shape information such as letters, numbers, figures, and formulas, attribute information such as size, location, and color, the number of appearances, and representative keywords. For example, since the attribute factor is classified as a search word as a result of analysis of a document, at least one of characters, figures or formulas, size, and position included in a document required to analyze the document may be used as the attribute factor.

단계 S150에서, 문서사용자로부터 수신된 검색 요청 및 속성팩터에 기초하여 분산 저장 서버로부터 속성결합전자문서를 추출할 수 있다. 즉 문서사용자는 필요한 정보가 포함된 필기체 문서를 검색하기 위해서 분산 저장 서버에 속성팩터와 관련된 검색어로 검색 요청을 할 수 있고, 그 결과로 분산 저장 서버로부터 속성결합전자문서를 추출할 수 있다. 전술한 바와 같이 속성결합전자문서는 수기된 필체가 인식된 문서와 속성팩터가 결합된 형태로, 수기된 필체가 인식된 이미지와 여러 가지 정보가 결합된 속성팩터의 형태가 될 수 있다.In step S150, the attribute binding electronic document may be extracted from the distributed storage server based on the attribute factor and the search request received from the document user. That is, the document user may make a search request to the distributed storage server with a search term related to the attribute factor in order to search for a cursive document including necessary information, and as a result, the attribute-binding electronic document may be extracted from the distributed storage server. As described above, the attribute combination electronic document may be in the form of a document in which the handwritten handwriting is recognized and an attribute factor, and may be in the form of an attribute factor in which an image in which the handwritten handwriting is recognized and various information are combined.

본 발명의 일 실시예에 따르면, 문서사용자로부터 입력받은 검색어 및 검색어 관련 정보가 포함된 속성팩터에 기초하여, 분산 저장 서버에 저장된 속성결합전자문서에 포함된 본문, 제목 및 키워드 중 적어도 하나를 검색하여 매칭되는 속성결합전자문서를 추출하는 단계를 포함할 수 있다.According to an embodiment of the present invention, at least one of the text, title, and keywords included in the attribute-combined electronic document stored in the distributed storage server is retrieved based on the attribute factor including the search term input from the document user and the search term-related information. and extracting the matching attribute combination electronic document.

또한, 검색어는 문서 구조를 분석하는데 사용된 문자, 도형, 수식, 크기, 위치 등의 속성팩터를 이용할 수 있으므로, 검색어가 본문, 제목, 키워드에 포함되어 있지 않더라도 속성결합전자문서에 포함된 일부분의 문자, 수식, 도형, 컬러 등 속성팩터와 관련된다면, 이와 일치하는 속성결합전자문서도 추출할 수 있다.In addition, since the search term can use attribute factors such as characters, figures, formulas, size, and position used to analyze the document structure, even if the search term is not included in the body, title, or keyword, the If it is related to attribute factors such as text, formula, figure, color, etc., it is possible to extract an attribute-combined electronic document matching the same.

단계 S160에서, 검색되어 추출된 속성결합전자문서는 문서사용자에게 제공될 수 있다.In step S160, the retrieved and extracted attribute combination electronic document may be provided to the document user.

본 발명의 일 실시예에 따르면, 문서사용자로부터 수신된 편집 신호에 기초하여 추출된 속성결합전자문서를 편집하는 단계 및 편집된 속성결합전자문서를 분산 저장 서버에 저장하는 단계를 더 포함할 수 있다.According to an embodiment of the present invention, the method may further include editing the extracted attribute-combined electronic document based on the editing signal received from the document user and storing the edited attribute-combined electronic document in a distributed storage server. .

즉, 문서사용자는 추출된 속성결합전자문서를 자신의 필요에 따라 편집하고 가공하여 저장할 수 있다. 예를 들면, 문서사용자는 속성결합전자문서를 검색하고 추출한 후, 필기체 또는 워드 프로세서 등의 디지털 장치로 속성결합전자문서를 수정 및 편집할 수 있고, 다른 사용자와의 공유를 위해 다시 분산 저장 서버에 업로드 할 수 있다. 편집 신호는 문서에 포함된 문자, 도형 및 수식 중 적어도 하나를 추가, 삭제 또는 변경하기 위한 명령어 등을 포함할 수 있다. 또한, 문서사용자에 의해 편집되거나 편집된 속성결합전자문서는 문서사용자의 결정에 의하여 수동으로 저장되거나 소정의 시간 간격에 따라 자동으로 저장될 수 있다.That is, the document user can edit, process, and store the extracted attribute-combined electronic document according to his or her needs. For example, after a document user searches for and extracts an attribute-combined electronic document, the document user can modify and edit the attribute-combined electronic document with a digital device such as a cursive or word processor, and store it again in a distributed storage server for sharing with other users. can be uploaded The edit signal may include a command for adding, deleting, or changing at least one of characters, figures, and equations included in the document. In addition, the attribute-combined electronic document edited or edited by the document user may be manually stored according to a decision of the document user or automatically stored according to a predetermined time interval.

또한, 문서사용자에게 제공될 이미지 또는 속성결합전자문서는 편집이 가능한 이미지(또는 속성결합전자문서)이거나 편집이 불가하도록 미리 설정된 이미지(또는 속성결합전자문서)일 수 있다. 다시 말해서, 문서저작자는 자신이 타인에게 공유할 문서의 이미지 또는 속성결합전자문서에 대하여 편집이 가능하거나 불가능하도록 미리 설정할 수 있다. 문서저작자는 무단의 문서 편집이 불가능하도록 문서에 대하여 암호화된 코드를 결합해 둘 수 있다. 이러한 암호화된 코드는 이미지를 분산 저장 서버에 저장하는 단계 또는 분산 저장 서버에서 속성결합전자문서화 되는 단계에서 부여되도록 할 수 있다. 문서의 이미지(또는 속성결합전자문서)가 편집이 가능한 경우 문서사용자는 제공된 이미지(또는 속성결합전자문서)를 자유롭게 편집할 수 있을 것이나, 문서의 이미지(또는 속성결합전자문서)가 편집이 불가능하도록 설정된 경우 문서사용자는 문서저작자로부터 문서 편집을 위한 암호화된 코드 정보를 별도로 제공받아야 한다.In addition, the image or attribute combination electronic document to be provided to the document user may be an editable image (or attribute combination electronic document) or an image (or attribute combination electronic document) preset to be impossible to edit. In other words, the document author may preset the image or attribute combination electronic document to be shared with others so that editing is possible or impossible. The document author may bind an encrypted code to the document to prevent unauthorized editing of the document. This encrypted code can be given in the step of storing the image in a distributed storage server or in the step of being electronically documented in combination with an attribute in the distributed storage server. If the image (or attribute-combined electronic document) of the document is editable, the document user will be able to freely edit the provided image (or attribute-combined electronic document). If set, the document user must separately receive encrypted code information for document editing from the document author.

도 3은 본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 공유 장치(1000)를 나타낸 블럭도이다.3 is a block diagram illustrating an apparatus 1000 for recognizing and sharing a handwritten scanned electronic file according to an embodiment of the present invention.

본 발명의 일 실시예에 따른 수기로 작성된 스캔본 전자파일의 인식과 공유 장치(1000)는 문서저작자에 의하여 기록된 수기된 필체를 포함하는 문서에 대한 이미지를 획득하기 위한 이미지 획득부(100), 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하기 위한 문자 인식부(200), 인식된 필체에 기초하여 문서의 구조를 분석하는 구조 분석부(300), 분석된 결과가 속성팩터로써 이미지와 함께 저장되는 분산 저장 서버(400), 문서사용자로부터 검색 요청을 수신하기 위한 속성 검색부(500), 수신된 검색 요청 및 속성팩터에 기초하여 분산 저장 서버로부터 속성결합전자문서를 추출하기 위한 속성결합전자문서 추출부(600) 및 추출된 속성결합전자문서를 문서사용자에게 제공하기 위한 출력부(700)를 포함할 수 있다.An apparatus 1000 for recognizing and sharing a handwritten scanned electronic file according to an embodiment of the present invention is an image acquisition unit 100 for obtaining an image for a document including handwritten handwriting recorded by a document author. , a character recognition unit 200 for recognizing at least one handwritten character from the acquired image, a structure analysis unit 300 for analyzing the structure of a document based on the recognized handwriting, and the analyzed result is an image as an attribute factor The distributed storage server 400 stored together with the attribute search unit 500 for receiving a search request from a document user, and an attribute for extracting the attribute binding electronic document from the distributed storage server based on the received search request and attribute factor It may include a combined electronic document extraction unit 600 and an output unit 700 for providing the extracted attribute combined electronic document to a document user.

이미지 획득부(100)는 수기된 필체를 포함하는 문서에 대한 이미지를 획득하기 위한 것으로, 수기된 필체가 포함된 문서를 직접 촬영할 수 있는 카메라 또는 스캔할 수 있는 스캐너 또는 문서에서 이미지를 획득할 수 있는 다양한 디지털 장치를 포함할 수 있다.The image acquisition unit 100 is for acquiring an image of a document including the handwritten handwriting, and may obtain an image from a camera capable of directly photographing a document including the handwritten handwriting, a scanner capable of scanning, or a document. It may include a variety of digital devices.

문자 인식부(200)는 이미지 획득부(100)를 통해 얻어진 이미지에서 적어도 하나의 글자를 인식하기 위한 것으로, 글자 인식 장치를 포함할 수 있다.The character recognition unit 200 is for recognizing at least one character in an image obtained through the image acquisition unit 100 , and may include a character recognition device.

예를 들어, 문자 인식부(200)는 획득된 이미지에 대하여 보정, 이진화 및 세선화 과정을 수행하고, 수행된 이미지에 대하여 특징점을 추출하여 추출된 특징점에 기초하여 수기로부터 획을 분리하거나 결합함으로써 기본 도형 및 복합 도형을 추출하고 자소를 생성하며, 생성된 자소에 상응하는 자음 또는 모음을 결정하고, 결정된 자음 또는 모음을 결합하여 적어도 하나의 수기로 작성된 문자를 추정할 수 있는 수기 인식 장치를 포함할 수 있다.For example, the character recognition unit 200 performs correction, binarization, and thinning processes on the obtained image, extracts feature points from the performed image, and separates or combines strokes from handwriting based on the extracted feature points. Includes a handwriting recognition device capable of extracting basic figures and complex figures and generating grapheme, determining consonants or vowels corresponding to the generated grapheme, and estimating at least one handwritten character by combining the determined consonants or vowels can do.

구조 분석부(300)는 인식된 수기된 필체를 이용하여 문서를 분석하기 위한 것으로, 문서 내의 문자를 분석하는 문자 분석부, 숫자, 기호 등을 분석할 수 있는 숫자, 기호 분석부, 문서 내의 문자의 위치, 크기 등을 파악할 수 있는 위치 분석부 등을 포함할 수 있고, 문서를 분석하기 위한 모든 장치를 포함할 수 있다.The structure analysis unit 300 is for analyzing a document using the recognized handwritten handwriting, and includes a character analysis unit that analyzes characters in a document, a number and symbol analysis unit that can analyze numbers and symbols, and characters in a document. It may include a location analyzer capable of determining the location, size, etc. of the , and may include all devices for analyzing a document.

분산 저장 서버(400)는 수기된 필체가 인식된 문서를 인식된 문자, 도형 또는 수식 등의 대표 키워드, 또는 문서, 수식, 도형의 위치, 크기 등으로 문서를 분석하고 파악하여 수기된 필체가 인식된 이미지를 여러 가지 속성팩터와 결합하여 속성결합전자문서로 분산 저장할 수 있는 장소로서, 정보 장치의 프로그램이나 데이터 즉 속성결합전자문서 등의 각종 데이터 자원 및 자원 간의 관련까지 포함하여 저장하는 자원 관리 데이터 베이스를 포함할 수 있다.The distributed storage server 400 analyzes and grasps the document in which the handwritten handwriting is recognized as representative keywords such as recognized characters, figures or formulas, or the position and size of documents, formulas, figures, etc., and recognizes the handwritten handwriting. Resource management data that stores various data resources such as information device programs and data, i.e., attribute-combined electronic document, and the relationship between resources, as a place where the image is combined with various attribute factors and stored as an attribute-combined electronic document. It may include a base.

속성 검색부(500)는 문서사용자가 속성결합전자문서를 검색하도록 문서사용자의 검색 요청을 수신하는 곳으로, 분산 저장 서버에 접근하기 위한 속성 입력을 수신할 수 있다. 예를 들면, 속성 검색부는 외부 입력을 수신하기 위한 통신 장치를 포함할 수 있고, 인터넷 등으로 연결된 디지털 입력 장치, 즉, 분산 저장 서버와 유,무선으로 연결된 사용자 입력 인터페이스 등을 포함할 수 있다.The attribute search unit 500 receives a search request of a document user so that the document user searches for an attribute-combined electronic document, and may receive an attribute input for accessing the distributed storage server. For example, the property search unit may include a communication device for receiving an external input, and may include a digital input device connected to the Internet, that is, a user input interface connected to a distributed storage server by wire or wirelessly.

속성결합전자문서 추출부(600)는 문서사용자의 검색 요청에 의하여 분산 저장 서버에서 속성결합전자문서를 추출하는 역할을 할 수 있는 장치로, 문서사용자의 검색 요청에 의한 검색어를 속성팩터와 비교하여 매칭되는 속성결합전자문서를 추출할 수 있다. 즉 속성결합전자문서 추출부(600)는 검색어를 속성팩터와 비교, 매칭하여 속성결합전자문서를 추출하기 위하여, 프로세서(Processor)를 탑재한 장치(예컨대, 컴퓨터, 노트북, 스마트폰, 랩탑 등), 또는 그와 유사한 장치를 포함할 수 있다.The attribute-combined electronic document extraction unit 600 is a device capable of extracting an attribute-combined electronic document from a distributed storage server according to a search request of a document user, and compares the search word by the document user's search request with the attribute factor. Matching attribute combination electronic document can be extracted. That is, the attribute-combined electronic document extraction unit 600 compares and matches the search word with the attribute factor to extract the attribute-combined electronic document, a device equipped with a processor (eg, computer, notebook, smartphone, laptop, etc.) , or a similar device.

출력부(700)부는 추출된 속성결합전자문서를 문서사용자에게 제공하는 역할을 할 수 있는 장치로, 분산 저장 서버와 유, 무선으로 연결되어 속성결합전자문서 추출부(600)에서 추출한 속성결합전자문서를 문서사용자에게 제공할 수 있다. 예를 들면, 출력부(700)는 문서사용자에게 속성결합전자문서를 제공할 수 있는 정보기기(예컨대, 노트북, 컴퓨터, 스마트폰, 스마트 TV 등)를 포함할 수 있다.The output unit 700 is a device that can serve to provide the extracted attribute-combined electronic document to document users, and is connected to a distributed storage server by wire or wirelessly, and the attribute-combined electronic document extracted by the attribute-combined electronic document extraction unit 600 Documents can be provided to document users. For example, the output unit 700 may include an information device (eg, a notebook computer, a smart phone, a smart TV, etc.) capable of providing an attribute-combined electronic document to a document user.

본 발명의 일 실시예에 따르면, 수기된 필체가 인식되어 생성된 전자문서의 공유를 위한 장치는 문서사용자로부터 수신된 편집 신호에 기초하여 추출된 속성결합전자문서를 편집하기 위한 속성결합전자문서 편집부를 더 포함할 수 있다.According to an embodiment of the present invention, an apparatus for sharing an electronic document generated by recognizing a handwritten handwriting is an attribute combining electronic document editing unit for editing an attribute combining electronic document extracted based on an editing signal received from a document user may further include.

본 발명은 커팅부, 제 1 트랜스퍼 및 제 2 트랜스퍼, 콤바인부를 포함할 수 있다.The present invention may include a cutting unit, a first transfer and a second transfer, and a combine unit.

커팅부는 데이터를 분할하여 복수 개의 조각들을 생성하고, 조각들의 각각에 어드레스를 부여할 수 있다. 여기서, 조각들의 어드레스는 복수 개의 문자 및 숫자의 조합으로 이루어질 수 있다.The cutting unit may generate a plurality of pieces by dividing the data, and may assign an address to each of the pieces. Here, the addresses of the pieces may be composed of a combination of a plurality of letters and numbers.

또한, 커팅부는 각각의 어드레스를 고려하여 조합 규칙을 생성할 수 있다. 여기서, 조합 규칙은 복수 개의 데이터 조각들을 각각의 어드레스를 바탕으로 하여 분할되기 이전의 데이터로 조합할 수 있도록 하는 규칙을 의미한다.Also, the cutting unit may generate a combination rule in consideration of each address. Here, the combination rule refers to a rule that allows a plurality of data pieces to be combined into data before being divided based on each address.

제 1 트랜스퍼는 복수 개의 데이터 조각들을 임의의 순서로 전송할 수 있다. 여기서, 복수 개의 데이터 조각들은 각각 부여된 어드레스와 함께 전송될 수 있다.The first transfer may transmit a plurality of data pieces in an arbitrary order. Here, a plurality of data pieces may be transmitted together with an assigned address, respectively.

제 2 트랜스퍼는 제 1 트랜스퍼에 의해 전송된 복수 개의 데이터 조각들에 대응되는 조합 규칙을 전송할 수 있다. 여기서, 제 2 트랜스퍼는 제 1 트랜스퍼에 의한 복수 개의 데이터 조각들의 전송에 대하여 시차를 두고 조합 규칙을 전송하는 것이 바람직할 수 있다. The second transfer may transmit a combination rule corresponding to the plurality of data pieces transmitted by the first transfer. Here, it may be preferable that the second transfer transmits the combination rule with a time difference with respect to the transmission of the plurality of data pieces by the first transfer.

이상 본 명세서에서 설명한 기능적 동작과 본 주제에 관한 실시형태들은 본 명세서에서 개시한 구조들 및 그들의 구조적인 등가물을 포함하여 디지털 전자 회로나 컴퓨터 소프트웨어, 펌웨어 또는 하드웨어에서 혹은 이들 중 하나 이상의 조합에서 구현 가능하다.The functional operations described in this specification and the embodiments related to the present subject matter can be implemented in a digital electronic circuit, computer software, firmware, or hardware, including the structures disclosed herein and structural equivalents thereof, or in a combination of one or more thereof do.

본 명세서에서 기술하는 주제의 실시형태는 하나 이상의 컴퓨터 프로그램 제품, 다시 말해 데이터 처리 장치에 의한 실행을 위하여 또는 그 동작을 제어하기 위하여 유형의 프로그램 매체 상에 인코딩되는 컴퓨터 프로그램 명령에 관한 하나 이상의 모듈로서 구현될 수 있다. 유형의 프로그램 매체는 전파형 신호이거나 컴퓨터로 판독 가능한 매체일 수 있다. 전파형 신호는 컴퓨터에 의한 실행을 위하여 적절한 수신기 장치로 전송하기 위한 정보를 인코딩하기 위하여 생성되는 예컨대 기계가 생성한 전기적, 광학적 혹은 전자기 신호와 같은 인공적으로 생성된 신호이다. 컴퓨터로 판독 가능한 매체는 기계로 판독 가능한 저장장치, 기계로 판독 가능한 저장 기판, 메모리 장치, 기계로 판독 가능한 전파형 신호에 영향을 미치는 물질의 조합 혹은 이들 중 하나 이상의 조합일 수 있다.Embodiments of the subject matter described herein are one or more computer program products, ie, one or more modules directed to computer program instructions encoded on a tangible program medium for execution by or for controlling the operation of a data processing apparatus. can be implemented. A tangible program medium may be a radio wave signal or a computer-readable medium. A radio wave signal is an artificially generated signal, eg a machine-generated electrical, optical or electromagnetic signal, that is generated to encode information for transmission to an appropriate receiver device for execution by a computer. The computer-readable medium may be a machine-readable storage device, a machine-readable storage substrate, a memory device, a combination of materials that affect a machine-readable radio wave signal, or a combination of one or more of these.

컴퓨터 프로그램(프로그램, 소프트웨어, 소프트웨어 어플리케이션, 스크립트 혹은 코드로도 알려져 있음)은 컴파일되거나 해석된 언어나 선험적 혹은 절차적 언어를 포함하는 프로그래밍 언어의 어떠한 형태로도 작성될 수 있으며, 독립형 프로그램이나 모듈, 컴포넌트, 서브루틴 혹은 컴퓨터 환경에서 사용하기에 적합한 다른 유닛을 포함하여 어떠한 형태로도 전개될 수 있다.A computer program (also known as a program, software, software application, script or code) may be written in any form of any programming language, including compiled or interpreted language or a priori or procedural language, and may be written as a stand-alone program or module; It can be deployed in any form, including components, subroutines, or other units suitable for use in a computer environment.

컴퓨터 프로그램은 파일 시스템의 파일에 반드시 대응하는 것은 아니다. 프로그램은 요청된 프로그램에 제공되는 단일 파일 내에, 혹은 다중의 상호 작용하는 파일(예컨대, 하나 이상의 모듈, 하위 프로그램 혹은 코드의 일부를 저장하는 파일) 내에, 혹은 다른 프로그램이나 데이터를 보유하는 파일의 일부(예컨대, 마크업 언어 문서 내에 저장되는 하나 이상의 스크립트) 내에 저장될 수 있다.A computer program does not necessarily correspond to a file in a file system. A program may be in a single file provided to the requested program, or in multiple interacting files (eg, files that store one or more modules, subprograms, or portions of code), or portions of files that hold other programs or data. (eg, one or more scripts stored within a markup language document).

컴퓨터 프로그램은 하나의 사이트에 위치하거나 복수의 사이트에 걸쳐서 분산되어 통신 네트워크에 의해 상호 접속된 다중 컴퓨터 또는 하나의 컴퓨터 상에서 실행되도록 전개될 수 있다.The computer program may be deployed to be executed on one computer or multiple computers located at one site or distributed over a plurality of sites and interconnected by a communication network.

부가적으로, 본 명세서에서 기술하는 논리 흐름과 구조적인 블록도는 개시된 구조적인 수단의 지원을 받는 대응하는 기능과 단계의 지원을 받는 대응하는 행위 및/또는 특정한 방법을 기술하는 것으로, 대응하는 소프트웨어 구조와 알고리즘과 그 등가물을 구축하는 데에도 사용 가능하다. Additionally, the logic flows and structural block diagrams described herein describe corresponding acts and/or specific methods supported by corresponding functions and steps supported by the disclosed structural means, and corresponding software. It can also be used to build structures and algorithms and their equivalents.

본 명세서에서 기술하는 프로세스와 논리 흐름은 입력 데이터 상에서 동작하고 출력을 생성함으로써 기능을 수행하기 위하여 하나 이상의 컴퓨터 프로그램을 실행하는 하나 이상의 프로그래머블 프로세서에 의하여 수행 가능하다.The processes and logic flows described herein may be performed by one or more programmable processors executing one or more computer programs to perform functions by operating on input data and generating output.

컴퓨터 프로그램의 실행에 적합한 프로세서는, 예컨대 범용 및 특수 목적의 마이크로프로세서 양자 및 어떤 종류의 디지털 컴퓨터의 어떠한 하나 이상의 프로세서라도 포함한다. 일반적으로, 프로세서는 읽기 전용 메모리나 랜덤 액세스 메모리 혹은 양자로부터 명령어와 데이터를 수신할 것이다. Processors suitable for the execution of computer programs include, for example, both general and special purpose microprocessors and any one or more processors of any kind of digital computer. Typically, the processor will receive instructions and data from read-only memory, random access memory, or both.

컴퓨터의 핵심적인 요소는 명령어와 데이터를 저장하기 위한 하나 이상의 메모리 장치 및 명령을 수행하기 위한 프로세서이다. 또한, 컴퓨터는 일반적으로 예컨대 자기, 자기광학 디스크나 광학 디스크와 같은 데이터를 저장하기 위한 하나 이상의 대량 저장 장치로부터 데이터를 수신하거나 그것으로 데이터를 전송하거나 혹은 그러한 동작 둘 다를 수행하기 위하여 동작가능 하도록 결합되거나 이를 포함할 것이다. 그러나, 컴퓨터는 그러한 장치를 가질 필요가 없다.A key element of a computer is one or more memory devices for storing instructions and data and a processor for executing instructions. In addition, a computer is generally operably coupled to receive data from, transmit data to, or both of one or more mass storage devices for storing data, such as, for example, magnetic, magneto-optical disks or optical disks. or will include However, the computer need not have such a device.

본 기술한 설명은 본 발명의 최상의 모드를 제시하고 있으며, 본 발명을 설명하기 위하여, 그리고 당업자가 본 발명을 제작 및 이용할 수 있도록 하기 위한 예를 제공하고 있다. 이렇게 작성된 명세서는 그 제시된 구체적인 용어에 본 발명을 제한하는 것이 아니다. The present description sets forth the best mode of the invention, and provides examples to illustrate the invention, and to enable any person skilled in the art to make or use the invention. The specification thus prepared does not limit the present invention to the specific terms presented.

따라서, 상술한 예를 참조하여 본 발명을 상세하게 설명하였지만, 당업자라면 본 발명의 범위를 벗어나지 않으면서도 본 예들에 대한 개조, 변경 및 변형을 가할 수 있다. 요컨대 본 발명이 의도하는 효과를 달성하기 위해 도면에 도시된 모든 기능 블록을 별도로 포함하거나 도면에 도시된 모든 순서를 도시된 순서 그대로 따라야만 하는 것은 아니며, 그렇지 않더라도 얼마든지 청구항에 기재된 본 발명의 기술적 범위에 속할 수 있다는 점을 밝힌다.Accordingly, although the present invention has been described in detail with reference to the above-described examples, those skilled in the art can make modifications, changes, and modifications to the examples without departing from the scope of the present invention. In short, in order to achieve the intended effect of the present invention, it is not necessary to separately include all the functional blocks shown in the drawings or follow all the orders shown in the drawings. indicate that it may be within the scope

Claims (9)

수기로 작성된 스캔본 전자파일의 인식과 공유 방법에 있어서,
문서저작자에 의하여 기록된 수기된 필체를 포함하는 문서에 대한 이미지를 획득하는 단계;
상기 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하는 단계;
상기 인식된 필체에 기초하여 상기 문서의 구조를 분석하고 속성을 추출하는 단계;
상기 분석된 결과를 속성팩터로써 상기 이미지와 함께 속성결합전자문서로 분산 저장 서버에 분산 저장하는 단계;
문서사용자로부터 수신된 검색 요청 및 상기 속성팩터에 기초하여 상기 분산 저장 서버로부터 상기 속성결합전자문서를 추출하는 단계;
상기 추출된 속성결합전자문서를 상기 문서사용자가 편집하는 단계; 및
상기 추출된 속성결합전자문서를 상기 문서사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
A method for recognizing and sharing a handwritten scanned electronic file, the method comprising:
acquiring an image of a document including handwritten handwriting recorded by a document author;
recognizing at least one handwritten character from the acquired image;
analyzing the structure of the document based on the recognized handwriting and extracting attributes;
Distributing and storing the analyzed result as an attribute factor as an attribute binding electronic document together with the image in a distributed storage server;
extracting the attribute-combined electronic document from the distributed storage server based on the attribute factor and the search request received from the document user;
editing the extracted attribute-combined electronic document by the document user; and
and providing the extracted attribute-combined electronic document to the document user.
제 1 항에 있어서,
상기 인식된 필체에 기초하여 상기 문서의 구조를 분석하는 단계는,
상기 문서에 포함된 문자, 숫자, 도형, 수식 등의 형태 정보와 크기, 위치, 컬러 등의 속성 정보와 출현 횟수, 대표 키워드 중 적어도 하나에 대한 정보를 획득하는 단계를 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
The method of claim 1,
Analyzing the structure of the document based on the recognized handwriting includes:
Handwriting comprising the step of acquiring information on at least one of shape information such as letters, numbers, figures, and formulas included in the document, attribute information such as size, location and color, number of appearances, and representative keywords included in the document How to recognize and share scanned electronic files created with
제 2 항에 있어서,
상기 속성팩터에는 상기 문자, 숫자, 도형, 수식 등의 형태 정보와 크기, 위치, 컬러 등의 속성 정보와 출현 횟수, 대표 키워드 중 적어도 하나에 대한 정보가 포함되는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
3. The method of claim 2,
The handwritten scan copy, characterized in that the attribute factor includes information on at least one of shape information such as letters, numbers, figures, and formulas, attribute information such as size, position, and color, number of appearances, and representative keywords How to recognize and share electronic files.
제 2 항에 있어서,
상기 속성결합전자문서를 추출하는 단계는,
상기 문서사용자로부터 입력받은 검색어 및 상기 검색어 관련 정보가 포함된 속성팩터에 기초하여, 상기 분산 저장 서버에 저장된 속성결합전자문서에 포함된 본문, 제목 및 키워드 중 적어도 하나를 검색하여 매칭되는 속성결합전자문서를 추출하는 단계를 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
3. The method of claim 2,
The step of extracting the attribute combination electronic document,
Based on the search word received from the document user and the attribute factor including the search word related information, at least one of the text, title, and keyword included in the attribute binding electronic document stored in the distributed storage server is searched and matched. A method for recognizing and sharing a handwritten scanned electronic file, comprising the step of extracting the document.
제 1 항에 있어서,
상기 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하는 단계는,
상기 획득된 이미지에 대하여 보정, 이진화 및 세선화 과정을 수행하고, 상기 과정이 수행된 이미지에 대하여 특징점을 추출하여 추출된 특징점에 기초하여 상기 수기로부터 획을 분리하거나 결합함으로써 기본 도형 및 복합 도형을 추출하고 자소를 생성하며, 생성된 자소에 상응하는 자음 또는 모음을 결정하는 단계; 및
상기 결정된 자음 또는 모음을 결합하여 적어도 하나의 수기로 작성된 문자를 추정하는 단계를 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
The method of claim 1,
Recognizing at least one handwritten character from the acquired image comprises:
A basic figure and a complex figure are obtained by performing correction, binarization and thinning processes on the obtained image, extracting feature points from the image on which the process is performed, and separating or combining strokes from the handwriting based on the extracted feature points extracting, generating a grapheme, and determining a consonant or vowel corresponding to the generated grapheme; and
and estimating at least one handwritten character by combining the determined consonants or vowels.
제 1 항에 있어서,
상기 문서사용자로부터 수신된 편집 신호에 기초하여 상기 추출된 속성결합전자문서를 편집하는 단계; 및
상기 편집된 속성결합전자문서를 상기 분산 저장 서버에 저장하는 단계를 더 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
The method of claim 1,
editing the extracted attribute-combined electronic document based on the editing signal received from the document user; and
The method of recognizing and sharing a handwritten scanned electronic file, characterized in that it further comprises the step of storing the edited attribute-combined electronic document in the distributed storage server.
제 6 항에 있어서,
상기 편집 신호는 상기 문서에 포함된 문자, 도형 및 수식 중 적어도 하나를 추가, 삭제 또는 변경하기 위한 신호이고, 상기 편집된 속성결합전자문서는 상기 문서사용자의 결정에 의하여 수동으로 저장되거나 소정의 시간 간격에 따라 자동으로 저장되는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유 방법.
7. The method of claim 6,
The edit signal is a signal for adding, deleting, or changing at least one of characters, figures, and formulas included in the document, and the edited attribute-combined electronic document is manually stored according to the decision of the document user or is stored for a predetermined time. A method for recognizing and sharing handwritten scanned electronic files, characterized in that they are automatically saved at intervals.
수기된 필체가 인식되어 생성된 전자문서의 공유를 위한 장치에 있어서,
문서저작자에 의하여 기록된 수기된 필체를 포함하는 문서에 대한 이미지를 획득하기 위한 이미지 획득부;
상기 획득된 이미지로부터 적어도 하나의 수기로 작성된 문자를 인식하기 위한 문자 인식부;
상기 인식된 필체에 기초하여 상기 문서의 구조를 분석하는 구조 분석부;
상기 분석된 결과가 속성팩터로써 상기 이미지와 함께 속성결합전자문서로 분산 저장되는 분산 저장 서버;
문서사용자로부터 검색 요청을 수신하기 위한 속성 검색부;
상기 수신된 검색 요청 및 상기 속성팩터에 기초하여 상기 분산 저장 서버로부터 상기 속성결합전자문서를 추출하기 위한 속성결합전자문서 추출부; 및
상기 추출된 속성결합전자문서를 상기 문서사용자에게 제공하기 위한 출력부를 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유를 위한 장치.
In an apparatus for sharing an electronic document generated by recognizing handwritten handwriting,
an image acquisition unit for acquiring an image of a document including handwritten handwriting recorded by a document author;
a character recognition unit for recognizing at least one handwritten character from the acquired image;
a structure analysis unit that analyzes the structure of the document based on the recognized handwriting;
a distributed storage server in which the analyzed result is distributed and stored as an attribute binding electronic document together with the image as an attribute factor;
an attribute search unit for receiving a search request from a document user;
an attribute-combined electronic document extraction unit for extracting the attribute-combined electronic document from the distributed storage server based on the received search request and the attribute factor; and
and an output unit for providing the extracted attribute-combined electronic document to the document user.
제 8 항에 있어서,
상기 문서사용자로부터 수신된 편집 신호에 기초하여 상기 추출된 속성결합전자문서를 편집하기 위한 속성결합전자문서 편집부를 더 포함하는 것을 특징으로 하는 수기로 작성된 스캔본 전자파일의 인식과 공유를 위한 장치.
9. The method of claim 8,
The apparatus for recognizing and sharing a handwritten scanned electronic file, characterized in that it further comprises an attribute combining electronic document editing unit for editing the extracted attribute combining electronic document based on the editing signal received from the document user.
KR1020200082815A 2020-07-06 2020-07-06 Sharing and recognition method and device of handwritten scanned document KR20220005243A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200082815A KR20220005243A (en) 2020-07-06 2020-07-06 Sharing and recognition method and device of handwritten scanned document

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200082815A KR20220005243A (en) 2020-07-06 2020-07-06 Sharing and recognition method and device of handwritten scanned document

Publications (1)

Publication Number Publication Date
KR20220005243A true KR20220005243A (en) 2022-01-13

Family

ID=79342003

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200082815A KR20220005243A (en) 2020-07-06 2020-07-06 Sharing and recognition method and device of handwritten scanned document

Country Status (1)

Country Link
KR (1) KR20220005243A (en)

Similar Documents

Publication Publication Date Title
US10445569B1 (en) Combination of heterogeneous recognizer for image-based character recognition
US10671799B2 (en) Generating digital document content from a digital image
US10013624B2 (en) Text entity recognition
CN109284729B (en) Method, device and medium for acquiring face recognition model training data based on video
CN108073910B (en) Method and device for generating human face features
US10867171B1 (en) Systems and methods for machine learning based content extraction from document images
JP4698289B2 (en) Low resolution OCR for documents acquired with a camera
Arai et al. Automatic e-comic content adaptation
US10943107B2 (en) Simulating image capture
CN109034069B (en) Method and apparatus for generating information
JP2004318879A (en) Automation technology of comparing image content
KR102002024B1 (en) Method for processing labeling of object and object management server
Isheawy et al. Optical character recognition (ocr) system
KR101552525B1 (en) A system for recognizing a font and providing its information and the method thereof
JP2019520662A (en) Content-based search and retrieval of trademark images
CN112115936A (en) Text recognition method and device, storage medium and electronic equipment
US20150347818A1 (en) Method, system, and application for obtaining complete resource according to blob images
US9691004B2 (en) Device and method for service provision according to prepared reference images to detect target object
US10482393B2 (en) Machine-based learning systems, methods, and apparatus for interactively mapping raw data objects to recognized data objects
US11163821B2 (en) Image extraction apparatus, image extraction method, and recording medium storing an image extraction program
KR20210086836A (en) Image data processing method for searching images by text
JP2022536320A (en) Object identification method and device, electronic device and storage medium
KR102440198B1 (en) VIDEO SEARCH METHOD AND APPARATUS, COMPUTER DEVICE, AND STORAGE MEDIUM
RU2597163C2 (en) Comparing documents using reliable source
KR101800975B1 (en) Sharing method and apparatus of the handwriting recognition is generated electronic documents