WO2021194075A1 - Document recognition method and device therefor - Google Patents

Document recognition method and device therefor Download PDF

Info

Publication number
WO2021194075A1
WO2021194075A1 PCT/KR2021/000860 KR2021000860W WO2021194075A1 WO 2021194075 A1 WO2021194075 A1 WO 2021194075A1 KR 2021000860 W KR2021000860 W KR 2021000860W WO 2021194075 A1 WO2021194075 A1 WO 2021194075A1
Authority
WO
WIPO (PCT)
Prior art keywords
document
feature
coordinates
area
extraction
Prior art date
Application number
PCT/KR2021/000860
Other languages
French (fr)
Korean (ko)
Inventor
서동완
이진곤
황진하
Original Assignee
주식회사 신한디에스
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 신한디에스 filed Critical 주식회사 신한디에스
Publication of WO2021194075A1 publication Critical patent/WO2021194075A1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

Disclosed are a document recognition method and a device therefor. The document recognition device: defines one or more reference extraction areas and multiple reference feature areas in a reference document; detects multiple feature areas from a digital document; generates an extraction area obtained by changing the position, the slope, the size, or the shape of a reference extraction area on the basis of differences between coordinates of the reference feature areas and those of the feature areas detected from the digital document; and recognizes and stores information located in the extraction area in the digital document.

Description

문서 인식 방법 및 그 장치Document recognition method and device
본 발명의 실시 예는 문서 인식 방법 및 그 장치에 관한 것으로, 보다 상세하게는 종이 등의 문서에 기재된 정보를 컴퓨터에서 읽을 수 있는 데이터로 만들기 위하여 인식하는 방법 및 그 장치에 관한 것이다.An embodiment of the present invention relates to a method for recognizing a document and an apparatus therefor, and more particularly, to a method and apparatus for recognizing information written in a document such as paper to make computer-readable data.
최근 컴퓨터 관련 기술이 발달함에 따라 각 기업에서는 대부분의 업무가 디지털화되어 가고 있다. 또한 빅데이터, 인공지능 등의 기술발전으로 과거 서면으로 보관하던 자료들의 정보를 컴퓨터가 읽을 수 있는 데이터로 변환하는 방법에 관심이 높아지고 있다.With the recent development of computer-related technologies, most of the work of each company is going digital. Also, with the development of technologies such as big data and artificial intelligence, interest is growing in how to convert the information stored in writing in the past into computer-readable data.
종래에 종이 등의 서면 자료를 스캔하여 디지털문서로 변환하여 저장한다. 그러나 문서의 디지털화 과정에서 다양한 변형(예를 들어, 뒤틀림, 밀림, 축소 등)이 발생하므로, 문서 내 정보의 인식 정확도가 낮아지는 문제점이 존재한다.Conventionally, documents such as paper are scanned and converted into digital documents and stored. However, since various deformations (eg, warping, pushing, shrinking, etc.) occur in the process of digitizing a document, there is a problem in that the recognition accuracy of information in the document is lowered.
본 발명의 실시 예가 이루고자 하는 기술적 과제는, 문서의 디지털화 과정에서 변형이 발생하여도 디지털문서의 정보를 정확하게 인식할 수 있는 방법 및 그 장치를 제공하는 데 있다.An aspect of the present invention is to provide a method and an apparatus for accurately recognizing information in a digital document even when deformation occurs in the process of digitizing the document.
상기의 기술적 과제를 달성하기 위한, 본 발명의 실시 예에 따른 문서 인식 방법의 일 예는, 기준문서 내 적어도 하나 이상의 기준특징영역과 적어도 하나 이상의 기준추출영역을 정의하는 단계; 디지털문서에서 적어도 하나 이상의 특징영역을 검출하는 단계; 상기 기준특징영역과 상기 디지털문서에서 검출된 특징영역의 좌표 차이를 기초로 상기 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성하는 단계; 및 상기 디지털문서에서 상기 추출영역에 위치한 정보를 인식하고 저장하는 단계;를 포함한다.In order to achieve the above technical object, an example of a document recognition method according to an embodiment of the present invention includes the steps of defining at least one reference feature area and at least one reference extraction area in a reference document; detecting at least one feature area in the digital document; generating an extraction region in which the position, slope, size or shape of the reference extraction region is changed based on a difference in coordinates between the reference feature region and the feature region detected in the digital document; and recognizing and storing information located in the extraction area in the digital document.
상기의 기술적 과제를 달성하기 위한, 본 발명의 실시 예에 따른 문서인식장치의 일 예는, 기준문서 내 적어도 하나 이상의 기준특징영역과 적어도 하나 이상의 기준추출영역을 정의하는 기준설정부; 디지털문서에서 적어도 하나 이상의 특징영역을 검출하는 특징검출부; 상기 기준특징영역과 상기 디지털문서에서 검출된 특징영역의 좌표 차이를 기초로 상기 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성하는 추출영역파악부; 및 상기 디지털문서에서 상기 추출영역에 위치한 정보를 인식하고 저장하는 정보인식부;를 포함한다.In order to achieve the above technical object, an example of a document recognition apparatus according to an embodiment of the present invention includes: a reference setting unit defining at least one reference feature area and at least one reference extraction area in a reference document; a feature detection unit for detecting at least one feature region in a digital document; an extraction region grasping unit generating an extraction region in which a position, inclination, size or shape of the reference extraction region is changed based on a difference in coordinates between the reference feature region and the feature region detected in the digital document; and an information recognition unit for recognizing and storing information located in the extraction area in the digital document.
본 발명의 실시 예에 따르면, 문서의 디지털화 과정에서 변형이 발생하여도 디지털문서의 정보를 정확하게 인식할 수 있다. 또한, 문서 전체가 아닌 일부 영역을 지정하여 원하는 정보만을 선별적으로 인식할 수 있어 사용자에게 편의성과 효율성을 제공할 수 있다.According to an embodiment of the present invention, even if deformation occurs in the process of digitizing the document, it is possible to accurately recognize the information of the digital document. In addition, it is possible to selectively recognize only desired information by designating a partial area rather than the entire document, thereby providing convenience and efficiency to the user.
도 1은 본 발명의 실시 예에 따른 문서 인식 방법의 개념을 도시한 도면,1 is a view showing the concept of a document recognition method according to an embodiment of the present invention;
도 2는 본 발명의 실시 예에 따른 기준특징영역 및 기준추출영역을 설정한 일 예를 도시한 도면,2 is a view showing an example of setting a reference feature area and a reference extraction area according to an embodiment of the present invention;
도 3은 실제 문서에 본 발명의 실시 예에 따른 기준특징영역 등을 설정한 예를 도시한 도면,3 is a view showing an example of setting a reference feature area, etc. according to an embodiment of the present invention in an actual document;
도 4는 본 발명의 실시 예에 따른 기준특징영역을 설정하는 방법의 일 예를 도시한 흐름도,4 is a flowchart illustrating an example of a method for setting a reference feature area according to an embodiment of the present invention;
도 5 내지 도 7은 본 발명의 실시 예에 따른 디지털문서의 추출영역을 생성하는 다양한 방법의 예를 도시한 도면,5 to 7 are views showing examples of various methods of generating an extraction area of a digital document according to an embodiment of the present invention;
도 8은 본 발명의 실시 예에 따라 기준문서에서 정의한 기준추출영역을 스캔과정에서 변형된 디지털문서에 단순 중첩하여 표시한 도면, 8 is a diagram showing a reference extraction area defined in a reference document according to an embodiment of the present invention by simply superimposing it on a digital document transformed in the scanning process;
도 9는 본 발명의 실시 예에 따른 기준추출영역을 디지털문서에 맞게 변형하여 디지털문서에 중첩하여 표시한 도면,9 is a view showing a modified reference extraction area according to an embodiment of the present invention to fit a digital document and superimposed on the digital document;
도 10은 본 발명의 실시 예에 따른 문서 인식 방법의 일 예를 도시한 흐름도, 그리고,10 is a flowchart illustrating an example of a document recognition method according to an embodiment of the present invention;
도 11은 본 발명의 실시 예에 따른 문서인식장치의 일 예의 구성을 도시한 도면이다.11 is a diagram showing the configuration of an example of a document recognition apparatus according to an embodiment of the present invention.
이하에서, 첨부된 도면들을 참조하여 본 발명의 실시 예에 따른 문서 인식 방법 및 그 장치에 대해 상세히 설명한다.Hereinafter, a document recognition method and an apparatus according to an embodiment of the present invention will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 실시 예에 따른 문서 인식 방법의 개념을 도시한 도면이다.1 is a diagram illustrating the concept of a document recognition method according to an embodiment of the present invention.
도 1을 참조하면, 종이 등의 문서(100)를 스캐너 등을 통해 스캔하여 디지털문서(110)로 변환한다. 여기서 디지털문서(110)는 컴퓨터상에서 볼 수 있는 상태의 전자문서(예를 들어, 이미지 파일 형태 등)를 의미한다. 종이 문서(100)를 디지털문서(110)로 변환하는 종래의 다양한 방법이 본 실시 예에 적용될 수 있다. Referring to FIG. 1 , a document 100 such as paper is scanned through a scanner or the like and converted into a digital document 110 . Here, the digital document 110 refers to an electronic document (eg, in the form of an image file, etc.) that can be viewed on a computer. Various conventional methods for converting a paper document 100 into a digital document 110 may be applied to this embodiment.
문서인식장치는 디지털문서(110)의 전체 또는 일부 영역에 위치한 정보를 컴퓨터가 읽을 수 있는 데이터로 변환하여 저장한다. 예를 들어, 디지털문서(110)가 이미지 파일인 경우에, 문서인식장치(110)는 디지털문서의 일부 영역을 추출하고, 추출한 영역에 존재하는 문자 또는 숫자 등의 이미지를 컴퓨터가 읽을 수 있는 데이터로 변환하여 저장한다. The document recognition device converts and stores information located in all or part of the digital document 110 into computer-readable data. For example, when the digital document 110 is an image file, the document recognition device 110 extracts a partial area of the digital document, and computer-readable data such as characters or numbers existing in the extracted area. Convert to and save
도 2는 본 발명의 실시 예에 따른 기준특징영역 및 기준추출영역을 설정한 일 예를 도시한 도면이다. 도 3은 실제 문서에 본 발명의 실시 예에 따른 기준특징영역 등을 설정한 예를 도시한 도면이다.2 is a diagram illustrating an example of setting a reference feature area and a reference extraction area according to an embodiment of the present invention. 3 is a diagram illustrating an example of setting a reference feature area according to an embodiment of the present invention in an actual document.
도 2를 참조하면, 기준문서(200) 내 적어도 하나 이상의 기준특징영역(210,212,214,216) 및 적어도 하나 이상의 기준추출영역(220)이 설정된다. 여기서 기준문서(200)는 기준특징영역(210,212,214,216) 및 기준추출영역(220)을 설정하는데 사용한 디지털문서를 의미한다. 기준문서(200)는 전자파일(예를 들어, 'MS-Word' 파일 등)로 저장된 디지털문서이거나 종이 문서를 스캔하여 디지털화한 이미지 형태의 문서일 수 있다. Referring to FIG. 2 , at least one reference feature area 210 , 212 , 214 , 216 and at least one reference extraction area 220 in the reference document 200 are set. Here, the reference document 200 refers to a digital document used to set the reference feature areas 210 , 212 , 214 , and 216 and the reference extraction area 220 . The reference document 200 may be a digital document stored as an electronic file (eg, 'MS-Word' file, etc.) or a document in the form of an image obtained by scanning a paper document and digitizing it.
기준특징영역(210,212,214,216)은 기준문서(200)의 기본 양식에 존재하는 문자, 숫자, 로고, 그림, 패턴, 또는 이들의 조합 중 적어도 하나 이상의 특징을 포함하는 영역이다. 예를 들어, 도 3과 같이 기준문서(300)의 기본 양식에 존재하는 'MEDITERANEAN', 'LADING', 'PARTICULARS', 'Measurement' 등의 문자열을 포함하는 영역을 기준특징영역(310,312,314,316)으로 설정할 수 있다.The reference feature regions 210 , 212 , 214 , and 216 are regions including at least one or more features of letters, numbers, logos, pictures, patterns, or combinations thereof existing in the basic form of the reference document 200 . For example, as shown in FIG. 3, an area including strings such as 'MEDITERANEAN', 'LADING', 'PARTICULARS', and 'Measurement' existing in the basic form of the reference document 300 is set as the reference feature area (310,312,314,316). can
각 기준특징영역(210,212,214,216)에 포함되는 특징은 서로 다를 수 있다. 예를 들어, 기준문서(200)의 기본 양식 여러 곳에 존재하는 'abc' 문자열을 기준특징영역을 구성하는 특징으로 정의하면, 서로 다른 위치의 복수 개의 기준특징영역이 검출될 수 있으므로 기준문서(200) 내 유일하게 존재하는 특징들을 각각의 기준특징영역(210,212,214,216)에 사용할 수 있다. The features included in each of the reference feature regions 210 , 212 , 214 , and 216 may be different from each other. For example, if the 'abc' character string existing in several places of the basic form of the reference document 200 is defined as a characteristic constituting the reference characteristic area, a plurality of reference characteristic areas at different positions can be detected, so that the reference document 200 ) can be used for each of the reference feature regions 210 , 212 , 214 and 216 .
다른 실시 예로, 동일한 특징이 기준문서(200)의 다양한 위치에 존재한다면, 동일한 특징으로 구성된 기준특징영역을 정의할 수도 있다. 예를 들어, 제1 특징정보 내지 제4 특징정보(210,212,214,216)에 포함되는 특징이 모두 'abc' 문자열로 동일할 수 있다.As another embodiment, if the same feature exists in various positions of the reference document 200, a reference feature region composed of the same feature may be defined. For example, all of the features included in the first to fourth feature information 210 , 212 , 214 , and 216 may be the same as the 'abc' character string.
본 실시 예는 기준문서 대비 디지털문서의 변형을 용이하게 파악할 수 있도록 네 모서리 부분에 위치한 4개의 기준특징영역(210,212,214,216)을 도시하고 있으나, 이는 하나의 예일 뿐 기준특징영역(210,212,214,216)의 개수 및 위치 등은 실시 예에 따라 다양하게 변형 가능하다. 예를 들어, 제1 기준특징영역만이 존재할 수 있다. 이 경우에 제1 기준특징영역의 네 모서리의 좌표(a1,b1,c1,d1)를 이용하여 기준문서 대비 디지털문서의 변형을 파악할 수 있다. Although this embodiment shows four reference feature areas 210, 212, 214, and 216 located at the four corners so that the deformation of the digital document can be easily identified compared to the reference document, this is only an example. The number and location of the reference feature areas 210, 212, 214, 216 The etc. can be variously modified according to an embodiment. For example, only the first reference feature region may exist. In this case, the deformation of the digital document compared to the reference document can be grasped using the coordinates (a1, b1, c1, d1) of the four corners of the first reference feature area.
기준추출영역(220)은 디지털문서로부터 추출할 정보를 정의한 영역이다. 본 실시 예는 설명의 편의를 위하여 하나의 기준추출영역(220)을 도시하고 있으나, 기준추출영역(220)의 개수 및 위치는 실시 예에 따라 다양하게 변형 가능하다.The reference extraction area 220 is an area in which information to be extracted from a digital document is defined. Although this embodiment shows one reference extraction region 220 for convenience of explanation, the number and position of the reference extraction region 220 may be variously modified according to embodiments.
문서인식장치는 기준문서(200) 내 기준특징영역(210,212,214,216) 및 기준추출영역(220)이 설정되면 해당 영역들의 좌표를 파악하여 저장한다. 문서인식장치는 각 기준특징영역(210,212,214,216)과 각 기준추출영역(220)에 대하여 적어도 하나 이상의 좌표(예를 들어, 사각형의 모서리 중 적어도 하나 이상의 좌표 또는 사각형 영역 내 적어도 하나 이상의 좌표 등)를 파악하여 저장할 수 있다. When the reference feature regions 210 , 212 , 214 , 216 and the reference extraction region 220 are set in the reference document 200 , the document recognition apparatus detects and stores the coordinates of the corresponding regions. The document recognition apparatus recognizes at least one or more coordinates (eg, at least one or more coordinates among corners of a rectangle or at least one or more coordinates within a rectangular region, etc.) for each reference feature region 210 , 212 , 214 , 216 and each reference extraction region 220 . can be saved.
문서인식장치는 사용자가 기준문서(200) 내 기준특징영역(210,212,214,216)과 기준추출영역(220)을 설정할 수 있는 사용자 인터페이스를 제공할 수 있다. 예를 들어, 문서인식장치는 기준문서(200)를 화면에 표시하고, 사용자로 하여금 특정 영역을 선택할 수 있는 도구를 제공할 수 있다. 사용자는 마우스 등의 입력장치 또는 터치스크린을 통해 화면에 표시된 기준문서(200)에서 기준특징영역(210,212,214,216)과 기준추출영역(220)을 선택할 수 있다. 다른 실시 예로 기준특징영역은 문서인식장치에 의해 자동으로 정의될 수 있으며 이에 대해서는 도 4에서 살펴본다.The document recognition apparatus may provide a user interface through which the user can set the reference feature areas 210 , 212 , 214 , 216 and the reference extraction area 220 in the reference document 200 . For example, the document recognition apparatus may display the reference document 200 on the screen and provide a tool for the user to select a specific area. The user may select the reference feature regions 210 , 212 , 214 , 216 and the reference extraction region 220 from the reference document 200 displayed on the screen through an input device such as a mouse or a touch screen. In another embodiment, the reference feature area may be automatically defined by the document recognition device, which will be described with reference to FIG. 4 .
도 4는 본 발명의 실시 예에 따른 기준특징영역을 설정하는 방법의 일 예를 도시한 흐름도이다.4 is a flowchart illustrating an example of a method for setting a reference feature region according to an embodiment of the present invention.
도 2 및 도 4를 함께 참조하면, 문서인식장치는 기준문서 내 기본 양식에 존재하는 문자, 숫자, 로고, 그림, 패턴, 또는 이들의 조합 등으로 구성된 특징을 파악한다(S400). 예를 들어, 문서인식장치는 스캐닝하여 생성한 복수의 디지털문서에 공통으로 나타나는 특징(즉, 기본 양식에 해당하는 부분)을 딥러닝(deep learning)을 이용하여 파악할 수 있다. 다른 실시 예로, 문서인식장치는 기준문서에서 미리 정의된 특징(예를 들어, 바코드, QR 코드, 십자가 형태의 정렬 이미지 등)을 파악할 수 있다. 또 다른 실시 예로, 문서인식장치는 특징을 파악하는 영역을 기준문서의 모서리 부분으로 한정할 수 있다. Referring to FIGS. 2 and 4 together, the document recognition apparatus recognizes the characteristics composed of letters, numbers, logos, pictures, patterns, or combinations thereof existing in the basic form in the reference document (S400). For example, the document recognition apparatus may identify a feature (ie, a portion corresponding to a basic form) that is common to a plurality of digital documents generated by scanning using deep learning. In another embodiment, the document recognition apparatus may recognize a predefined characteristic (eg, a barcode, a QR code, a cross-shaped alignment image, etc.) in the reference document. In another embodiment, the document recognition apparatus may limit the area for recognizing the characteristics to the corner portion of the reference document.
문서인식장치는 파악된 특징을 포함하는 적어도 하나 이상의 기준특징영역을 설정한다(S410). 그리고 문서인식장치는 적어도 하나 이상의 기준추출영역을 정의한다(S420). 기준추출영역은 사용자 인터페이스를 통해 사용자로부터 입력받을 수 있다. 문서인식장치는 기준특징영역 및 기준추출영역에 대한 적어도 하나 이상의 좌표를 파악하여 저장한다.The document recognition apparatus sets at least one reference feature area including the identified feature (S410). And the document recognition apparatus defines at least one reference extraction area (S420). The reference extraction area may be input from the user through the user interface. The document recognition apparatus identifies and stores at least one or more coordinates for the reference feature area and the reference extraction area.
도 5 내지 도 7은 본 발명의 실시 예에 따른 디지털문서의 추출영역을 생성하는 다양한 방법의 예를 도시한 도면이다.5 to 7 are diagrams illustrating examples of various methods of generating an extraction area of a digital document according to an embodiment of the present invention.
도 5 내지 도 7을 참조하면, 문서인식장치는 디지털문서(500,600,700)에서 특징영역(510~516,610~616,710~716)을 파악한다. 예를 들어, 기준특징정보가 도 3과 같이 정의된 경우에, 문서인식장치는 디지털문서(500,600,700)에서 'MEDITERANEAN', 'LADING', 'PARTICULARS', 'Measurement' 등의 특징정보가 존재하는 영역을 찾는다. 문서인식장치는 기준특징영역(2210,212,214,216)의 좌표값에 해당하는 디지털문서(500,600,700)의 일정 영역을 검색하여 디지털문서(500,600,700)에서 특징정보가 존재하는 특징영역(510~516,610~616,710~716)을 신속하게 검출할 수 있다.5 to 7 , the document recognition apparatus recognizes the feature areas 510 to 516,610 to 616,710 to 716 in the digital document 500,600,700. For example, when the reference characteristic information is defined as shown in FIG. 3 , the document recognition apparatus is an area in which characteristic information such as 'MEDITERANEAN', 'LADING', 'PARTICULARS', 'Measurement', etc. exists in the digital documents 500 , 600 , and 700 . look for The document recognition apparatus searches a certain area of the digital document (500,600,700) corresponding to the coordinate values of the reference characteristic area (2210,212,214,216), and the characteristic area (510-516,610-616,710-716) in which the characteristic information exists in the digital document (500,600,700) ) can be detected quickly.
문서인식장치는 기준문서(200)에서 정의된 기준특징영역(210,212,214,216)과 디지털문서(500)에서 추출한 특징영역(510~516,610~616,710~716)의 좌표를 비교하여 두 문서 사이의 변형을 파악하고, 해당 변형을 반영하여 기준문서(200)에서 정의된 기준추출영역(220)의 위치, 기울기, 크기 또는 모양을 변경한 추출영역(520,620,720)을 생성한다. 예를 들어, 문서인식장치는 기준특징영역(210,212,214,216)의 좌표와 디지털문서(500,600,700)에서 검출한 특징영역(510~516,610~616,710~716)의 좌표를 비교하여 기준문서(200) 대비 디지털문서(500,600,700)의 이동, 회전, 축소나 확대, 또는 뒤틀림을 파악한 후 이를 기준추출영역(220)의 좌표에 반영하여 디지털문서(500,600,700)의 정보 영역 추출을 위한 추출영역(520,620,720)을 생성한다. The document recognition device compares the coordinates of the reference feature regions (210,212,214,216) defined in the reference document 200 and the feature regions (510-516,610-616,710-716) extracted from the digital document 500 to determine the transformation between the two documents, , to reflect the corresponding deformation to generate the extraction areas (520, 620, 720) in which the position, inclination, size or shape of the reference extraction area 220 defined in the reference document 200 is changed. For example, the document recognition device compares the coordinates of the reference feature regions 210,212,214,216 with the coordinates of the feature regions 510-516,610-616,710-716 detected from the digital documents 500,600,700 and compares the coordinates of the reference document 200 with the digital document ( After identifying the movement, rotation, reduction, enlargement, or distortion of 500,600,700), it is reflected in the coordinates of the reference extraction area 220 to generate the extraction areas 520,620,720 for extracting the information area of the digital document 500,600,700.
기준문서(200)의 기준추출영역(220)을 구성하는 네 모서리(a5,b5,c5,d5)의 좌표가 디지털문서의 어느 위치로 맵핑되는지 파악하여 디지털문서에서 정보를 추출한 추출영역(520,620,720)을 파악할 수 있다. 기준문서가 변형되어 디지털문서가 되는 것이므로, 기준문서 대비 디지털문서에 어떤 변형이 발생하였는지를 알면 이미지 사이의 변형에 따른 좌표값의 맵핑관계를 구하는 종래의 다양한 방법을 적용하여 기준추출영역의 좌표 변환값을 알 수 있다.Extraction areas (520, 620, 720) in which information is extracted from a digital document by identifying where the coordinates of the four corners (a5, b5, c5, d5) constituting the reference extraction area 220 of the reference document 200 are mapped to where in the digital document can figure out Since the reference document is transformed into a digital document, if you know what transformation has occurred in the digital document compared to the reference document, you can apply various conventional methods to find the mapping relationship of the coordinate values according to the transformation between images, and the coordinate transformation value of the reference extraction area can be known
또 다른 예로, 기준특징영역의 좌표와 기준추출영역의 좌표를 기준으로 기준특징영역의 상대적 위치 및 크기를 파악한 후 디지털문서의 특징영역의 좌표로부터 상대적 위치 및 크기를 가지는 추출영역을 생성할 수 있다. As another example, after determining the relative position and size of the reference feature region based on the coordinates of the reference feature region and the coordinates of the reference extraction region, an extraction region having a relative position and size can be generated from the coordinates of the feature region of the digital document. .
디지털문서(500)가 기준문서(200) 대비 축소한 경우에 추출영역(520)을 생성하는 예가 도 5에 도시되어 있다. 도 5를 참조하면, 문서인식장치는 기준문서(200)의 기준특징영역(210,212,214,216)의 좌표와 디지털문서(500)의 특징영역(510,512,514,516)의 좌표를 비교하여 디지털문서(500)가 기준문서(200) 대비 얼마만큼 축소되었는지 파악할 수 있다. An example of generating the extraction area 520 when the digital document 500 is reduced compared to the reference document 200 is shown in FIG. 5 . 5, the document recognition apparatus compares the coordinates of the reference feature regions 210, 212, 214, 216 of the reference document 200 with the coordinates of the feature regions 510, 512, 514,516 of the digital document 500, and the digital document 500 is the reference document ( 200), you can see how much it has been reduced.
예를 들어, 문서인식장치는 기준문서(200)의 제1 기준특징정보(210)와 제2 기준특징정보(212) 사이의 거리와 디지털문서(500)의 제1 특징정보(510)와 제2 특징정보(512) 사이의 거리 비를 이용하여 가로의 축소 비율을 파악할 수 있고, 기준문서(200)의 제1 기준특징정보(210)와 제3 기준특징정보(214) 사이의 거리와 디지털문서(500)의 제1 특징정보(510)와 제3 특징정보(514) 사이의 거리 비를 이용하여 세로의 축소 비율을 파악할 수 있다. 문서인식장치는 가로 및 세로의 축소비율을 기초로 기준문서(200)의 기준추출영역(220)의 좌표를 디지털문서(500)에 맞도록 변환한 추출영역(520)을 생성할 수 있다. For example, the document recognition apparatus may include a distance between the first reference characteristic information 210 and the second reference characteristic information 212 of the reference document 200 and the first characteristic information 510 and the second reference characteristic information of the digital document 500 . The horizontal reduction ratio can be grasped by using the distance ratio between the two characteristic information 512, and the distance between the first reference characteristic information 210 and the third reference characteristic information 214 of the reference document 200 and the digital A vertical reduction ratio may be determined using the distance ratio between the first characteristic information 510 and the third characteristic information 514 of the document 500 . The document recognition apparatus may generate the extraction area 520 in which the coordinates of the reference extraction area 220 of the reference document 200 are converted to fit the digital document 500 based on the horizontal and vertical reduction ratios.
예를 들어, 디지털문서(5000가 기준문서(200) 대비 가로방향 및 세로방향으로 각각 10% 축소되었다고 하자. 기준문서(200)와 디지털문서(500)의 중심이 동일하고 중심이 좌표계의 원점이라고 하면, 좌표계의 1사분면에 존재하는 기준추출영역(220)의 좌표값 (x,y)는 (x - |x * 0.1| , y - |y* 0.1|)로 변환된다. 기준문서(200)와 디지털문서(500)의 중심이 일치하지 않으면, 두 중심의 차이를 기준추출영역(220)의 좌표값에 추가 반영할 수 있다. For example, suppose that the digital document 5000 is reduced by 10% in the horizontal and vertical directions compared to the reference document 200, respectively. The center of the reference document 200 and the digital document 500 is the same, and the center is the origin of the coordinate system. Then, the coordinate value (x,y) of the reference extraction region 220 existing in the first quadrant of the coordinate system is converted into (x - |x * 0.1| , y - |y* 0.1|). and the center of the digital document 500 do not coincide, the difference between the two centers may be additionally reflected in the coordinate value of the reference extraction area 220 .
디지털문서(600)에 뒤틀림이 발생한 경우에 추출영역(620)을 생성하는 예가 도 6에 도시되어 있다. 도 6을 참조하면, 문서인식장치는 기준문서(200)의 기준특징영역(210,212,214,216)의 좌표와 디지털문서(600)의 특징영역(610,612,614,616)의 좌표를 비교하여 디지털문서(600)가 기준문서(200) 대비 어떤 형태로 뒤틀려 있는지 파악할 수 있다. An example of generating the extraction area 620 when distortion occurs in the digital document 600 is illustrated in FIG. 6 . 6, the document recognition apparatus compares the coordinates of the reference feature regions 210,212,214,216 of the reference document 200 with the coordinates of the feature regions 610,612,614,616 of the digital document 600, and the digital document 600 is the reference document ( 200), you can figure out what kind of distortion it is.
예를 들어, 문서인식장치는 기준문서(200)의 제1 기준특징정보(210)와 제2 기준특징정보(214) 사이의 기울기 및 제3 기준특징정보(214)와 제4 기준특징정보(216) 사이의 기울기와 디지털문서(600)의 제1 특징정보(610)와 제2 특징정보(612) 사이의 기울기 및 제3 특징정보(614) 및 제4 특징정보(616) 사이의 기울기를 이용하여 문서가 오른쪽으로 갈수록 좁아지는 형태로 변형이 존재함을 알 수 있다. 문서인식장치는 그 변형을 기준추출영역(220)의 좌표에 반영하여 디지털문서(600)의 정보 추출을 위한 추출영역(620)을 생성할 수 있다. For example, the document recognition apparatus includes a slope between the first reference characteristic information 210 and the second reference characteristic information 214 of the reference document 200, and the third reference characteristic information 214 and the fourth reference characteristic information ( 216), the slope between the first characteristic information 610 and the second characteristic information 612 of the digital document 600, and the slope between the third characteristic information 614 and the fourth characteristic information 616 It can be seen that there is a deformation in the form that the document becomes narrower as it goes to the right. The document recognition apparatus may generate the extraction area 620 for extracting information of the digital document 600 by reflecting the deformation on the coordinates of the reference extraction area 220 .
도 7은 또 다른 형태의 뒤틀림이 발생한 경우를 도시하고 있다. 도 7을 참조하면, 문서인식장치는 기준문서(200)의 제1 내지 제4 기준특징정보(210,212,214,216)의 좌표와 디지털문서(700)의 제1 내지 제4 특징정보(710,712,714,716)의 좌표를 비교하여 디지털문서(700)가 기준문서(200) 대비 기울어져 있음을 알 수 있다. 문서인식장치는 해당 변형에 따라 기준추출영역(200)의 좌표값을 변형하여 추출영역(720)을 생성할 수 있다.7 illustrates a case in which another form of distortion occurs. Referring to FIG. 7 , the document recognition apparatus compares the coordinates of the first to fourth reference characteristic information 210 , 212 , 214 , 216 of the reference document 200 with the coordinates of the first to fourth characteristic information 710 , 712 , 714 , 716 of the digital document 700 . Thus, it can be seen that the digital document 700 is inclined relative to the reference document 200 . The document recognition apparatus may generate the extraction area 720 by transforming the coordinate values of the reference extraction area 200 according to the corresponding deformation.
도 5 내지 도 7은 본 발명의 이해를 돕기 위하여 몇 가지 예를 제시하고 있으며, 실제 디지털화 과정에서 발생하는 디지털문서의 변형은 다양한 형태일 수 있다. 본 실시 예는 디지털문서에서 검출한 특징영역의 좌표와 기준문서의 기준특징영역의 좌표를 비교하여 기준문서의 기준추출영역 좌표가 디지털문서의 어디로 맵핑되는지 파악하는 과정을 통해 어떠한 형태의 변형이 있어도 그에 맞는 추출영역을 생성할 수 있다. 5 to 7 show some examples to help the understanding of the present invention, and the deformation of the digital document occurring in the actual digitization process may be in various forms. This embodiment compares the coordinates of the feature region detected in the digital document with the coordinates of the reference feature region of the reference document to figure out where the coordinates of the reference extraction region of the reference document are mapped in the digital document. A suitable extraction area can be created.
다른 실시 예로, 하나의 기준특징영역만(예를 들어, 제1 기준특징영역(210))을 사용하는 경우에, 하나의 기준특징영역(210)의 네 모서리의 좌표(a1,b1,c1,d1)와 이에 대응하는 디지털문서의 특징영역의 네 모서리의 좌표를 비교하여 기준문서 대비 디지털문서의 위치, 기울기, 크기 또는 모양을 변형을 파악한 후 이를 기준추출영역에 반영하여 디지털문서의 추출영역을 파악할 수 있다.In another embodiment, when only one reference feature region (eg, the first reference feature region 210) is used, the coordinates (a1, b1, c1) of the four corners of one reference feature region 210 are By comparing d1) and the coordinates of the four corners of the characteristic area of the corresponding digital document, the position, inclination, size or shape of the digital document compared to the reference document is identified and reflected in the standard extraction area to determine the extraction area of the digital document. can figure out
도 8은 본 발명의 실시 예에 따라 기준문서에서 정의한 기준추출영역을 스캔과정에서 변형된 디지털문서에 단순 중첩하여 표시한 도면이고, 도 9는 본 발명의 실시 예에 따른 기준추출영역을 디지털문서에 맞게 변형하여 디지털문서에 중첩하여 표시한 도면이다.8 is a diagram showing a reference extraction area defined in a reference document according to an embodiment of the present invention by simply superimposing it on a digital document transformed in the scanning process, and FIG. It is a drawing that is displayed overlaid on a digital document after being transformed to fit.
도 8을 참조하면, 기준추출영역(320,322,324,326,328,330)이 디지털문서(800)의 정보 표시영역을 벗어나므로 필요한 정보를 정확하게 추출할 수 없다. 이에 반해, 도 9를 참조하면, 디지털문서(800)에 맞게 변형된 추출영역(910,914,916,918,920)을 이용하여 필요한 정보를 정확하게 추출할 수 있다.Referring to FIG. 8 , since the reference extraction areas 320 , 322 , 324 , 326 , 328 and 330 are out of the information display area of the digital document 800 , necessary information cannot be accurately extracted. On the other hand, referring to FIG. 9 , necessary information can be accurately extracted using the extraction regions 910 , 914 , 916 , 918 and 920 modified to fit the digital document 800 .
도 10은 본 발명의 실시 예에 따른 문서 인식 방법의 일 예를 도시한 흐름도이다.10 is a flowchart illustrating an example of a document recognition method according to an embodiment of the present invention.
도 10을 참조하면, 문서인식장치는 기준문서 내 적어도 하나 이상의 기준특징영역 및 적어도 하나 이상의 기준추출영역을 정의한다(S1000). 기준특징영역 및 기준추출영역은 사용자로부터 직접 선택받거나 자동으로 정의될 수 있다. 기준특징영역을 정의하는 방법의 일 예가 도 4에 도시되어 있다.Referring to FIG. 10 , the document recognition apparatus defines at least one reference feature area and at least one reference extraction area within the reference document ( S1000 ). The reference feature area and the reference extraction area may be directly selected by the user or automatically defined. An example of a method for defining a reference feature region is shown in FIG. 4 .
문서인식장치는 디지털문서의 특징영역을 검출한다(S1010). 문서인식장치는 기준문서의 기준특징영역과 디지털문서의 특징영역을 비교하여 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성한다(S1020).The document recognition apparatus detects a characteristic area of the digital document (S1010). The document recognition apparatus compares the reference feature area of the reference document with the feature area of the digital document to generate an extraction area in which the position, inclination, size or shape of the reference extraction area is changed (S1020).
문서인식장치는 추출영역에 위치한 문자나 숫자 등을 인식하여 저장한다. 예를 들어, 문서인식장치는 OCR(Optical Character Recognition) 기술 등 종래의 다양한 문자 인식 프로그램 등을 이용하여 추출영역에 위치한 문자나 숫자 등을 자동 인식하여 저장할 수 있다.The document recognition device recognizes and stores characters or numbers located in the extraction area. For example, the document recognition apparatus may automatically recognize and store characters or numbers located in the extraction area using various conventional character recognition programs such as OCR (Optical Character Recognition) technology.
도 11은 본 발명의 실시 예에 따른 문서인식장치의 일 예의 구성을 도시한 도면이다.11 is a diagram showing the configuration of an example of a document recognition apparatus according to an embodiment of the present invention.
도 11을 참조하면, 문서인식장치(1100)는 기준설정부(1110), 특징검출부(1120), 추출영역파악부(1130) 및 정보인식부(1140)를 포함한다. 문서인식장치는 메모리, 프로세서, 입출력장치 등을 포함하는 컴퓨터로 구현될 수 있으며, 기준설정부(1110) 등의 각 구성은 소프트웨어로 구현되어 메모리에 로딩된 후 프로세서에 의해 실행될 수 있다.Referring to FIG. 11 , the document recognition apparatus 1100 includes a reference setting unit 1110 , a feature detection unit 1120 , an extraction region determining unit 1130 , and an information recognition unit 1140 . The document recognition apparatus may be implemented as a computer including a memory, a processor, an input/output device, and the like, and each component of the reference setting unit 1110 may be implemented as software, loaded into a memory, and then executed by the processor.
기준설정부(1110)는 기준문서 내 적어도 하나 이상의 기준특징영역 및 적어도 하나 이상의 기준추출영역을 설정한다. 일 실시 예로, 기준설정부(1110)는 사용자가 기준특징영역 및 기준추출영역을 설정할 수 있는 사용자 인터페이스를 제공할 수 있다. 다른 실시 예로, 기준설정부(1110)는 딥러닝이나 이미지 비교 프로그램 등 종래의 다양한 알고리즘을 이용하여 기준문서의 기본 양식에 존재하는 문자, 숫자, 로고, 그림, 패턴 또는 이들의 조합 중 적어도 하나 이상의 특징정보를 추출하고, 그 특징정보로 구성되는 복수의 특징영역을 자동으로 설정할 수 있다.The reference setting unit 1110 sets at least one reference feature area and at least one reference extraction area in the reference document. As an embodiment, the reference setting unit 1110 may provide a user interface through which the user can set the reference feature area and the reference extraction area. In another embodiment, the reference setting unit 1110 uses at least one or more of letters, numbers, logos, pictures, patterns, or combinations thereof existing in the basic form of the reference document using various conventional algorithms such as deep learning or image comparison programs. It is possible to extract the characteristic information and automatically set a plurality of characteristic areas composed of the characteristic information.
특징검출부(1120)는 디지털문서에서 특징영역을 검출한다. 예를 들어, 기준특징영역을 정의하는 특징정보가 문자열이나 숫자열인 경우에, 특징검출부(1120)는 디지털문서에서 해당 문자열이나 숫자열이 존재하는 영역을 검색한다. 이때 특징검출부(1120)는 디지털문서에서 문자열이나 숫자열을 하나의 이미지로 간주하여 동일한 이미지가 존재하는 부분을 찾을 수 있으며, 이때 딥러닝 기술을 적용하거나 아니면 이미지 비교 분석하는 종래의 다양한 알고리즘이 적용될 수 있다. 또는 특징검츨부(1120)는 문자인식 기능을 이용하여 해당 문자열이나 숫자열을 파악할 수 있다.The feature detection unit 1120 detects a feature region in the digital document. For example, when the feature information defining the reference feature area is a character string or a number string, the feature detecting unit 1120 searches for an area in the digital document in which the corresponding character string or number string exists. At this time, the feature detection unit 1120 may find a part in which the same image exists by considering a string or a string of numbers in a digital document as one image, and in this case, deep learning technology is applied or various conventional algorithms for image comparison and analysis are applied. can Alternatively, the feature detection unit 1120 may use a character recognition function to determine the corresponding character string or number string.
추출영역파악부(1130)는 기준문서의 기준특징영역과 디지털문서에서 검출된 특징영역의 좌표 차이를 기초로 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성한다. 디지털문서의 추출영역을 생성하는 다양한 예가 도 5 내지 도 7에 도시되어 있다.The extraction region determining unit 1130 generates an extraction region in which the position, inclination, size or shape of the reference extraction region is changed based on the coordinate difference between the reference feature region of the reference document and the feature region detected in the digital document. Various examples of generating an extraction area of a digital document are shown in FIGS. 5 to 7 .
정보인식부(1140)는 디지털문서에서 추출영역에 존재하는 문자나 숫자 등을 인식하여 저장한다. 예를 들어, 추출영역에 'abc'의 글자가 존재하면, 정보인식부는 'abc'의 글자를 종래의 다양한 문자 인식 알고리즘을 이용하여 인식한 후 컴퓨터가 읽을 수 있는 데이터로 변환하여 저장한다.The information recognition unit 1140 recognizes and stores letters or numbers existing in the extraction area in the digital document. For example, if a character of 'abc' exists in the extraction area, the information recognition unit recognizes the character of 'abc' using various conventional character recognition algorithms, and then converts it into computer-readable data and stores it.
본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 프로그램 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광데이터 저장장치 등이 있다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can also be embodied as computer readable program code on a computer readable recording medium. The computer-readable recording medium includes all kinds of recording devices in which data readable by a computer system is stored. Examples of the computer-readable recording medium include ROM, RAM, CD-ROM, magnetic tape, floppy disk, and optical data storage device. In addition, the computer-readable recording medium is distributed in a network-connected computer system so that the computer-readable code can be stored and executed in a distributed manner.
이제까지 본 발명에 대하여 그 바람직한 실시 예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시 예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far, the present invention has been looked at with respect to preferred embodiments thereof. Those of ordinary skill in the art to which the present invention pertains will understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is indicated in the claims rather than the foregoing description, and all differences within the scope equivalent thereto should be construed as being included in the present invention.

Claims (7)

  1. 기준문서 내 적어도 하나 이상의 기준특징영역과 적어도 하나 이상의 기준추출영역을 정의하는 단계;defining at least one reference feature area and at least one reference extraction area in the reference document;
    디지털문서에서 적어도 하나 이상의 특징영역을 검출하는 단계;detecting at least one feature area in the digital document;
    상기 기준특징영역과 상기 디지털문서에서 검출된 특징영역의 좌표 차이를 기초로 상기 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성하는 단계; 및generating an extraction region in which the position, slope, size or shape of the reference extraction region is changed based on a difference in coordinates between the reference feature region and the feature region detected in the digital document; and
    상기 디지털문서에서 상기 추출영역에 위치한 정보를 인식하고 저장하는 단계;를 포함하는 것을 특징으로 하는 문서 인식 방법.and recognizing and storing information located in the extraction area in the digital document.
  2. 제 1항에 있어서, The method of claim 1,
    상기 기준특징영역은, 상기 기준문서의 기본 양식에 존재하는 문자, 숫자, 로고, 그림, 패턴 중 적어도 하나 이상으로 구성된 특징을 포함하는 영역이고,The reference feature area is an area including a feature composed of at least one or more of letters, numbers, logos, pictures, and patterns existing in the basic form of the reference document,
    상기 검출하는 단계는, 상기 특징과 상기 디지털문서를 비교하여 복수의 특징영역을 검출하는 단계를 포함하는 것을 특징으로 하는 문서 인식 방법.The detecting may include detecting a plurality of feature regions by comparing the feature with the digital document.
  3. 제 1항에 있어서, 상기 정의하는 단계는,The method of claim 1, wherein the defining step comprises:
    복수의 기준특징영역을 설정하고 각 기준특징영역의 좌표를 파악하여 저장하거나, 하나의 기준특징영역에 대하여 복수의 좌표를 파악하여 저장하는 단계;를 포함하는 것을 특징으로 하는 문서 인식 방법.A document recognition method comprising: setting a plurality of reference feature areas and identifying and storing the coordinates of each reference feature area, or identifying and storing a plurality of coordinates for one reference feature area.
  4. 제 1항에 있어서, 상기 추출영역을 생성하는 단계는,The method of claim 1, wherein the generating of the extraction region comprises:
    상기 기준특징영역의 좌표와 상기 디지털문서에서 검출한 특징영역 좌표를 비교하여 상기 기준문서 대비 상기 디지털문서의 이동, 회전, 축소나 확대, 또는 뒤틀림을 파악하는 단계;Comparing the coordinates of the reference feature region with the coordinates of the feature region detected in the digital document to determine movement, rotation, reduction, enlargement, or distortion of the digital document compared to the reference document;
    상기 파악된 이동, 회전 또는 축소나 확대, 또는 뒤틀림을 반영하여 상기 기준추출영역의 좌표에 대한 변형 좌표를 산출하는 단계; 및calculating transformation coordinates for the coordinates of the reference extraction area by reflecting the identified movement, rotation, reduction, enlargement, or distortion; and
    상기 변형 좌표로 이루어진 추출영역을 생성하는 단계;를 포함하는 것을 특징으로 하는 문서 인식 방법.and generating an extraction region composed of the transformation coordinates.
  5. 기준문서 내 적어도 하나 이상의 기준특징영역과 적어도 하나 이상의 기준추출영역을 정의하는 기준설정부;a reference setting unit defining at least one reference feature area and at least one reference extraction area in the reference document;
    디지털문서에서 적어도 하나 이상의 특징영역을 검출하는 특징검출부;a feature detection unit for detecting at least one feature region in a digital document;
    상기 기준특징영역과 상기 디지털문서에서 검출된 특징영역의 좌표 차이를 기초로 상기 기준추출영역의 위치, 기울기, 크기 또는 모양을 변경한 추출영역을 생성하는 추출영역파악부; 및an extraction region grasping unit generating an extraction region in which a position, inclination, size or shape of the reference extraction region is changed based on a difference in coordinates between the reference feature region and the feature region detected in the digital document; and
    상기 디지털문서에서 상기 추출영역에 위치한 정보를 인식하고 저장하는 정보인식부;를 포함하는 것을 특징으로 하는 문서인식장치.and an information recognition unit for recognizing and storing information located in the extraction area in the digital document.
  6. 제 5항에 있어서, 상기 추출영역파악부는,The method of claim 5, wherein the extraction region determining unit,
    상기 기준특징영역의 좌표와 상기 디지털문서에서 검출한 특징영역 좌표를 비교하여 상기 기준문서 대비 상기 디지털문서의 이동, 회전, 축소나 확대, 또는 뒤틀림을 파악하고, 상기 파악된 이동, 회전 또는 축소나 확대, 또는 뒤틀림을 반영하여 상기 기준추출영역의 좌표에 대한 변형 좌표를 산출하고, 상기 변형 좌표로 이루어진 추출영역을 생성하는 것을 특징으로 하는 문서인식장치.By comparing the coordinates of the reference feature region with the coordinates of the feature region detected in the digital document, the movement, rotation, reduction, enlargement, or distortion of the digital document compared to the reference document is identified, and the identified movement, rotation or reduction or A document recognition apparatus, characterized in that by reflecting enlargement or distortion, calculating deformation coordinates with respect to the coordinates of the reference extraction area, and generating an extraction area composed of the deformation coordinates.
  7. 제 1항에 기재된 방법을 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium in which a program for performing the method according to claim 1 is recorded.
PCT/KR2021/000860 2020-03-23 2021-01-22 Document recognition method and device therefor WO2021194075A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR10-2020-0035221 2020-03-23
KR1020200035221A KR102256667B1 (en) 2020-03-23 2020-03-23 Method for recognizing documents and apparatus therefor

Publications (1)

Publication Number Publication Date
WO2021194075A1 true WO2021194075A1 (en) 2021-09-30

Family

ID=76137355

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2021/000860 WO2021194075A1 (en) 2020-03-23 2021-01-22 Document recognition method and device therefor

Country Status (2)

Country Link
KR (1) KR102256667B1 (en)
WO (1) WO2021194075A1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113792361A (en) * 2021-09-17 2021-12-14 合肥艾克斯特智能科技有限公司 Part marking method and device based on DXF file and storable medium
KR102473059B1 (en) * 2021-10-28 2022-12-02 주식회사 테스트뱅크 Digitized reference book element extraction system and method the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100390264B1 (en) * 1995-04-10 2003-09-22 리버스 테크놀로지, 인크. System and method for automatic page registration and automatic area detection during form processing
KR101585029B1 (en) * 2015-05-13 2016-01-13 (주)코드원시스템 Recognition and classification system of document
KR101801217B1 (en) * 2012-11-13 2017-11-24 교도 인사쯔 가부시키가이샤 Two-dimensional code
KR20190131631A (en) * 2018-04-19 2019-11-27 한밭대학교 산학협력단 Automatic classification apparatus and method of document type based on visual attention model implemented by deep learninig and character recognition
KR102082301B1 (en) * 2013-09-30 2020-02-27 삼성전자주식회사 Method, apparatus and computer-readable recording medium for converting document image captured by camera to the scanned document image

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2822189B2 (en) 1988-05-19 1998-11-11 ソニー株式会社 Character recognition apparatus and method
KR100587763B1 (en) 2000-02-01 2006-06-09 주식회사 위즈맥스 The method of providing multimedia files combined with advertisements over the Internet

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100390264B1 (en) * 1995-04-10 2003-09-22 리버스 테크놀로지, 인크. System and method for automatic page registration and automatic area detection during form processing
KR101801217B1 (en) * 2012-11-13 2017-11-24 교도 인사쯔 가부시키가이샤 Two-dimensional code
KR102082301B1 (en) * 2013-09-30 2020-02-27 삼성전자주식회사 Method, apparatus and computer-readable recording medium for converting document image captured by camera to the scanned document image
KR101585029B1 (en) * 2015-05-13 2016-01-13 (주)코드원시스템 Recognition and classification system of document
KR20190131631A (en) * 2018-04-19 2019-11-27 한밭대학교 산학협력단 Automatic classification apparatus and method of document type based on visual attention model implemented by deep learninig and character recognition

Also Published As

Publication number Publication date
KR102256667B1 (en) 2021-05-26

Similar Documents

Publication Publication Date Title
CN1842122B (en) Apparatus and method for processing annotation data
WO2021194075A1 (en) Document recognition method and device therefor
Yanikoglu et al. Pink Panther: a complete environment for ground-truthing and benchmarking document page segmentation
US7961950B2 (en) Image processing apparatus, method thereof, and its control method
US7747108B2 (en) Image processing apparatus and its method
US5642473A (en) Paper saving reprographic device
EP0738987A2 (en) Processing machine readable forms
JP4785655B2 (en) Document processing apparatus and document processing method
JP4630777B2 (en) Method, apparatus, computer program and storage medium for changing digital document
JP4574503B2 (en) Image processing apparatus, image processing method, and program
US7864985B1 (en) Automatic operator-induced artifact detection in document images
US5887088A (en) Inputting device and inputting method for information processing system
WO2022039330A1 (en) Ocr-based document analysis system and method using virtual cell
JP2007004621A (en) Document management supporting device, and document management supporting method and program
WO2023075434A1 (en) Machine learning-based digital reference book provision system using bounding boxes
WO2011093568A1 (en) Method for recognizing layout-based print medium page
WO2011049408A2 (en) Method for reading code displayed on printed materials
KR20210077251A (en) Database building device that can build a knowledge database from a table-inserted image and operating method thereof
US5854860A (en) Image filing apparatus having a character recognition function
US7920742B2 (en) Image processing apparatus, program and recording medium for document registration
JP2008158777A (en) Image processing apparatus and method, computer program, and storage medium
EP0996080A2 (en) System and method for automatic region selection
JP3536165B2 (en) Image processing device and image output device
KR102300475B1 (en) Electronic device that can convert a table-inserted image into an electronic document and operating method thereof
WO2023149618A1 (en) System and method for providing digital reference book according to copyright ownership

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 21775921

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 21775921

Country of ref document: EP

Kind code of ref document: A1