KR102605381B1 - System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications - Google Patents

System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications Download PDF

Info

Publication number
KR102605381B1
KR102605381B1 KR1020220138661A KR20220138661A KR102605381B1 KR 102605381 B1 KR102605381 B1 KR 102605381B1 KR 1020220138661 A KR1020220138661 A KR 1020220138661A KR 20220138661 A KR20220138661 A KR 20220138661A KR 102605381 B1 KR102605381 B1 KR 102605381B1
Authority
KR
South Korea
Prior art keywords
module
item
equipment
string
specification value
Prior art date
Application number
KR1020220138661A
Other languages
Korean (ko)
Inventor
박관용
박창영
박성현
Original Assignee
(주)미래환경플랜건축사사무소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)미래환경플랜건축사사무소 filed Critical (주)미래환경플랜건축사사무소
Priority to KR1020220138661A priority Critical patent/KR102605381B1/en
Application granted granted Critical
Publication of KR102605381B1 publication Critical patent/KR102605381B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2210/00Indexing scheme for image generation or computer graphics
    • G06T2210/12Bounding box

Abstract

설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법이 개시된다. 설비 명판의 문자열을 광학 인식하는 광학 인식 모듈; 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 항목/설비사양값 구별 모듈; 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈을 구성한다. 상술한 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 의하면, 특정한 포맷이 없는 설비 명판을 자동으로 인식하고 오류를 정정하여 디지털 데이터를 생성하도록 구성됨으로써, 건물 에너지 성능 평가를 위한 기초 자료를 정확하고 효율적으로 확보할 수 있는 효과가 있다.A facility nameplate optical character reading system and method for automatic recognition of facility specifications are disclosed. An optical recognition module that optically recognizes strings on equipment nameplates; an item/equipment specification value discrimination module that distinguishes the strings optically recognized by the optical recognition module by designating them as item and equipment specification values, respectively; Configure a facility specification value output module that outputs each item and facility specification value distinguished from the item/equipment specification value distinction module. According to the equipment nameplate optical character reading system and method for automatic recognition of the above-described equipment specifications, it is configured to automatically recognize equipment nameplates without a specific format, correct errors, and generate digital data, thereby providing a basis for evaluating building energy performance. It has the effect of securing data accurately and efficiently.

Description

설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법{SYSTEM AND METHOD OF READING EQUIPMENT NAMEPLATE OPTICAL CHARACTER FOR AUTOMATIC RECOGNITION OF EQUIPMENT SPECIFICATIONS}Equipment nameplate optical character reading system and method for automatic recognition of equipment specifications {SYSTEM AND METHOD OF READING EQUIPMENT NAMEPLATE OPTICAL CHARACTER FOR AUTOMATIC RECOGNITION OF EQUIPMENT SPECIFICATIONS}

본 발명은 광학 문자 판독 시스템 및 방법에 관한 것으로서, 구체적으로는 설비 명판 광학 문자 판독 시스템 및 방법에 관한 것이고, 좀 더 구체적으로는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 관한 것이다.The present invention relates to an optical character reading system and method, and more specifically to a system and method for optical character reading of equipment nameplates, and more specifically to a system and method for optical character reading of equipment nameplates for automatic recognition of equipment specifications. will be.

건물을 리모델링(remodeling)하는 경우, 건물의 에너지 성능을 개선하기 위해선 기존 건물의 성능을 평가하는 에너지 진단이 선행되어야 한다.When remodeling a building, energy diagnosis to evaluate the performance of the existing building must be conducted first in order to improve the building's energy performance.

이때, 건물의 에너지 소비량, 효율 등을 조사하기 위해서 건물 내 설비의 명판에 표시된 사양 정보가 필요하다.At this time, in order to investigate the building's energy consumption and efficiency, specification information displayed on the nameplate of the equipment in the building is needed.

기존에는 건물 에너지 진단을 위해 검사자가 직접 건물을 돌아다니며 모든 설비 명판을 확인하고 사양 정보를 디지털 데이터로 옮기는 작업을 한다. 이러한 작업은 전문가의 노동력에 크게 의존하는 작업이기 때문에 작업자별 기재 방법의 차이나 기입 과정의 인적 실수로 인한 오류가 발생하는 문제점이 있다. 기본적인 사양 정보의 오류는 건물 에너지 진단의 오류로 이어지기 때문에 매우 중요한 기초 작업이라고 볼 수 있다.Previously, to diagnose building energy, an inspector personally walked around the building, checked all equipment nameplates, and transferred specification information into digital data. Because this work relies heavily on the labor of experts, there are problems with errors occurring due to differences in entry methods for each worker or human errors during the entry process. This can be considered a very important basic work because errors in basic specification information can lead to errors in building energy diagnosis.

한편, 기존에는 신용카드나 신분증의 광학 문자 판독(optical character recognition) 기술이 있다. 이러한 광학 문자 판독 기술은 신분증 등의 양식에서 문자가 표시되는 위치가 일정하다는 점을 이용하거나, 주민등록번호나 이름 등의 값의 형식이 일정하다는 점을 이용하고 있다.Meanwhile, there is existing optical character recognition technology for credit cards or ID cards. This optical character reading technology takes advantage of the fact that the position where characters are displayed in forms such as ID cards is constant, or the format of values such as resident registration numbers or names is constant.

그러나, 설비 명판은 모델명, 소비전력, 냉난방능력 등 기기의 종류와 제조사/모델에 따라 명판의 형식과 인식 항목이 다양하며, 각 항목에 대응되는 알파벳 코드, 숫자와 단위(W, kcal/h, Hz 등)의 형식이 달라 종래의 광학 문자 판독 기술을 그대로 이용할 수 없는 문제점이 있다.However, the format and recognition items of the equipment nameplate vary depending on the type and manufacturer/model of the equipment, such as model name, power consumption, and heating/cooling capacity. The alphabet code, number, and unit (W, kcal/h, There is a problem that the conventional optical character reading technology cannot be used as is due to the different formats (Hz, etc.).

등록특허공보 10-0627195Registered Patent Publication 10-0627195 공개특허공보 10-2022-0066475Public Patent Publication 10-2022-0066475

본 발명의 목적은 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템을 제공하는 데 있다.The purpose of the present invention is to provide an equipment nameplate optical character reading system for automatic recognition of equipment specifications.

본 발명의 다른 목적은 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법을 제공하는 데 있다.Another object of the present invention is to provide a method for reading optical characters on equipment nameplates for automatic recognition of equipment specifications.

상술한 본 발명의 목적에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템은, 설비 명판의 문자열을 광학 인식하는 광학 인식 모듈; 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 항목/설비사양값 구별 모듈; 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈을 포함하도록 구성될 수 있다.The equipment nameplate optical character reading system for automatic recognition of equipment specifications according to the purpose of the present invention described above includes an optical recognition module that optically recognizes a string of the equipment nameplate; an item/equipment specification value discrimination module that distinguishes the strings optically recognized by the optical recognition module by designating them as item and equipment specification values, respectively; It may be configured to include a facility specification value output module that outputs items and facility specification values distinguished from the item/equipment specification value distinction module, respectively.

여기서, 상기 항목은 설비 사양에 관한 항목으로 구성되고, 상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성될 수 있다.Here, the item consists of an item related to equipment specifications, and the equipment specification value may consist of a physical specification value of the item.

상술한 본 발명의 다른 목적에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법은, 광학 인식 모듈이 설비 명판의 문자열을 광학 인식하는 단계; 항목/설비사양값 구별 모듈이 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 단계; 설비사양값 출력 모듈이 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 단계를 포함하도록 구성될 수 있다.The optical character reading method of a facility nameplate for automatic recognition of facility specifications according to another object of the present invention described above includes the steps of: an optical recognition module optically recognizing a character string on a facility nameplate; A step in which an item/equipment specification value discrimination module designates and distinguishes the string optically recognized by the optical recognition module as an item and a facility specification value, respectively; The equipment specification value output module may be configured to include a step of outputting items and equipment specification values distinguished from the item/equipment specification value distinction module, respectively.

여기서, 상기 항목은 설비 사양에 관한 항목으로 구성되고, 상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성될 수 있다.Here, the item consists of an item related to equipment specifications, and the equipment specification value may consist of a physical specification value of the item.

상술한 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 의하면, 특정한 포맷이 없는 설비 명판을 자동으로 인식하고 오류를 정정하여 디지털 데이터를 생성하도록 구성됨으로써, 건물 에너지 성능 평가를 위한 기초 자료를 정확하고 효율적으로 확보할 수 있는 효과가 있다.According to the equipment nameplate optical character reading system and method for automatic recognition of the above-described equipment specifications, it is configured to automatically recognize equipment nameplates without a specific format, correct errors, and generate digital data, thereby providing a basis for evaluating building energy performance. It has the effect of securing data accurately and efficiently.

도 1은 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 경계 상자 구분 결과를 나타내는 예시도이다.
도 3은 본 발명의 일 실시예에 따른 경계 상자 수정 결과의 예시도이다.
도 4는 본 발명의 일 실시예에 따른 항목-설비사양값 인식 결과의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법의 흐름도이다.
Figure 1 is a block diagram of a facility nameplate optical character reading system for automatic recognition of facility specifications according to an embodiment of the present invention.
Figure 2 is an exemplary diagram showing the result of bounding box classification according to an embodiment of the present invention.
Figure 3 is an exemplary diagram of a bounding box correction result according to an embodiment of the present invention.
Figure 4 is an exemplary diagram of the result of item-equipment specification value recognition according to an embodiment of the present invention.
Figure 5 is a flowchart of a facility nameplate optical character reading method for automatic recognition of facility specifications according to an embodiment of the present invention.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.Since the present invention can make various changes and have various embodiments, specific embodiments will be illustrated in the drawings and detailed descriptions will be given for carrying out the invention. However, this is not intended to limit the present invention to specific embodiments, and should be understood to include all changes, equivalents, and substitutes included in the spirit and technical scope of the present invention. While describing each drawing, similar reference numerals are used for similar components.

제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.Terms such as first, second, A, and B may be used to describe various components, but the components should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another. For example, a first component may be named a second component, and similarly, the second component may also be named a first component without departing from the scope of the present invention. The term and/or includes any of a plurality of related stated items or a combination of a plurality of related stated items.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.When a component is said to be "connected" or "connected" to another component, it is understood that it may be directly connected to or connected to the other component, but that other components may exist in between. It should be. On the other hand, when it is mentioned that a component is “directly connected” or “directly connected” to another component, it should be understood that there are no other components in between.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terms used in this application are only used to describe specific embodiments and are not intended to limit the invention. Singular expressions include plural expressions unless the context clearly dictates otherwise. In this application, terms such as “comprise” or “have” are intended to designate the presence of features, numbers, steps, operations, components, parts, or combinations thereof described in the specification, but are not intended to indicate the presence of one or more other features. It should be understood that this does not exclude in advance the possibility of the existence or addition of elements, numbers, steps, operations, components, parts, or combinations thereof.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by a person of ordinary skill in the technical field to which the present invention pertains. Terms defined in commonly used dictionaries should be interpreted as having a meaning consistent with the meaning in the context of the related technology, and unless explicitly defined in the present application, should not be interpreted in an ideal or excessively formal sense. No.

이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, preferred embodiments according to the present invention will be described in detail with reference to the attached drawings.

도 1은 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템의 블록 구성도이다. 그리고 도 2는 본 발명의 일 실시예에 따른 경계 상자 구분 결과를 나타내는 예시도이고, 도 3은 본 발명의 일 실시예에 따른 경계 상자 수정 결과의 예시도이고, 도 4는 본 발명의 일 실시예에 따른 항목-설비사양값 인식 결과의 예시도이다.Figure 1 is a block diagram of a facility nameplate optical character reading system for automatic recognition of facility specifications according to an embodiment of the present invention. And Figure 2 is an exemplary diagram showing a bounding box classification result according to an embodiment of the present invention, Figure 3 is an exemplary diagram showing a bounding box correction result according to an embodiment of the present invention, and Figure 4 is an exemplary diagram showing an embodiment of the present invention. This is an example of the item-equipment specification value recognition result according to the example.

도 1을 참조하면, 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템(100)은 광학 인식 모듈(110), 경계 상자 구분 모듈(120), 항목 저장 모듈(130), 설비 사양값 단위 저장 모듈(140), 경계 상자 수정 모듈(150), 문자열 유사도 판단 모듈(160), 문자열 후처리 모듈(170), 항목/설비사양값 구별 모듈(180), 항목/설비사양값 출력 모듈(190)을 포함하도록 구성될 수 있다.Referring to Figure 1, the equipment nameplate optical character reading system 100 for automatic recognition of equipment specifications according to an embodiment of the present invention includes an optical recognition module 110, a bounding box classification module 120, and an item storage module ( 130), equipment specification value unit storage module 140, bounding box modification module 150, string similarity judgment module 160, string post-processing module 170, item/equipment specification value distinction module 180, item/ It may be configured to include a facility specification value output module 190.

이하, 세부적인 구성에 대하여 설명한다.Hereinafter, the detailed configuration will be described.

광학 인식 모듈(110)은 설비 명판의 문자열을 광학 인식하도록 구성될 수 있다. 광학 인식 모듈(110)은 OCR(optical character recognition) 기술을 이용하여 문자열을 광학 인식할 수 있다.The optical recognition module 110 may be configured to optically recognize a string on a facility nameplate. The optical recognition module 110 can optically recognize character strings using optical character recognition (OCR) technology.

경계 상자 구분 모듈(120)은 광학 인식 모듈(110)에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분하도록 구성될 수 있다. 여기서, 경계 상자는 설비 명판의 각 문자열에 대한 경계 상자(boundary box) 형태로 표시되는 것으로서, 도 2에서 녹색 박스 형태의 표시이다.The bounding box classification module 120 may be configured to generate and distinguish bounding boxes for each string based on the string optically recognized by the optical recognition module 110. Here, the boundary box is displayed in the form of a boundary box for each character string on the equipment nameplate, and is displayed in the form of a green box in FIG. 2.

경계 상자 구분 모듈(120)은 여러 경계 상자의 행을 인식하고 글자의 위치와 간격에 따라 추정하여 구분을 하도록 구성될 수 있다. 도 2의 a)는 광학 문자 인식을 통해 설정된 경계 상자를 나타낸다.The bounding box classification module 120 may be configured to recognize rows of multiple bounding boxes and classify them by estimating the positions and spacing of letters. Figure 2a) shows a bounding box set through optical character recognition.

한편, 경계 상자 구분 모듈(120)은 각 경계 상자의 y축 중심 좌표가 그 왼쪽의 경계 상자의 y축 중심 좌표와 일치하면 동일한 행의 경계 상자로 인식할 수 있다.Meanwhile, the bounding box classification module 120 can recognize the bounding boxes as bounding boxes of the same row if the y-axis center coordinate of each bounding box matches the y-axis center coordinate of the bounding box on its left.

한편, 설비 명판은 항목과 항목의 설비 사양값의 쌍들이 반복적으로 나타내는 형태로 구성된다. 도 2에서 보면, 항목은 크기, 냉방능력, 난방능력, 전원, 소비전류, 표준풍량, 운전전류 등이고, 각 항목의 설비 사양값은 각 항목의 오른쪽에 그 물리량을 나타내는 숫자와 단위로 나타나 있다.Meanwhile, the equipment nameplate is composed of pairs of items and their equipment specification values that are repeatedly displayed. In Figure 2, the items include size, cooling capacity, heating capacity, power, current consumption, standard air volume, and operating current, and the equipment specification values for each item are shown in numbers and units representing the physical quantity to the right of each item.

항목 저장 모듈(130)은 설비 명판의 각 항목이 미리 저장되도록 구성될 수 있다. 항목은 설비 사양에 관한 항목으로서 도 2의 냉방능력, 난방능력, 크기 등이 이에 해당된다.The item storage module 130 may be configured to store each item of the equipment nameplate in advance. The items are related to equipment specifications and include cooling capacity, heating capacity, size, etc. in Figure 2.

설비 사양값 단위 저장 모듈(140)은 설비 명판의 각 항목의 설비 사양값에 대한 단위가 미리 저장되도록 구성될 수 있다.The equipment specification value unit storage module 140 may be configured to store in advance the units for the equipment specification values of each item on the equipment nameplate.

경계 상자 수정 모듈(150)은 항목 저장 모듈(130)에 저장된 각 항목 및 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 경계 상자 구분 모듈(120)에서 구분된 경계 상자를 수정하도록 구성될 수 있다.The bounding box modification module 150 refers to each item stored in the item storage module 130 and the units pre-stored in the facility specification value unit storage module 140 to modify the bounding box divided in the bounding box division module 120. It can be configured.

구체적으로는 경계 상자 수정 모듈(140)은 한글을 포함하는 경계 상자의 앞과 마지막 문자가 단위인 경계 상자의 뒤에서 경계 상자를 구분하도록 수정할 수 있다.Specifically, the bounding box modification module 140 can modify the bounding box to distinguish between the front of the bounding box containing Hangul and the rear of the bounding box whose last character is the unit.

그런데, 여기서, 경계 상자 내의 문자열 인식에는 오류가 많이 있을 수 있다. 문자열의 내용이나 단위가 정해져 있지 않고, 문자, 숫자, 단위의 포맷이나 위치가 일정하지 않기 때문에 문자열 인식에 오류가 많이 생긴다. 특히, 경계 상자는 1차적으로 글자의 위치와 간격에 따라 추정되기 때문에 도 3의 a)에서 '형'과 '식'과 같이 '형식'이라는 하나의 단어가 분리되어 각각의 경계 상자로 구분될 수 있다는 문제점이 있다.However, here, there may be many errors in string recognition within the bounding box. Because the content or unit of the string is not determined, and the format or location of letters, numbers, and units are not constant, many errors occur in string recognition. In particular, since the bounding box is primarily estimated based on the position and spacing of the letters, one word 'form', like 'form' and 'formula' in a) of Figure 3, is separated and divided into individual bounding boxes. There is a problem that can be done.

경계 상자 수정 모듈(150)은 이러한 오류를 해결하는 방향으로 경계 상자를 수정하도록 구성될 수 있다. 예를 들어, '형'의 경계 상자와 '식'의 경계 상자를 합쳐서 '형식'의 하나의 경계 상자로 수정할 수 있다. 도 3은 이러한 경계 상자 수정 모듈(150)의 수정에 의해 수정된 경계 상자를 예시하고 있다.The bounding box correction module 150 may be configured to modify the bounding box in a way that corrects these errors. For example, the bounding box of 'Type' and the bounding box of 'Formula' can be combined and modified into one bounding box of 'Form'. Figure 3 illustrates a bounding box modified by modification of the bounding box modification module 150.

문자열 유사도 판단 모듈(160)은 항목 저장 모듈(130)에 저장된 각 항목과 경계 상자 수정 모듈(150)에 의해 수정된 각 경계 상자의 문자열의 유사도를 각각 대비하도록 구성될 수 있다. 이러한 문자열 유사도의 판단은 여러 문자열 중 항목에 해당되는 문자열을 찾아내기 위한 것이다. 도 4에서는 '형식'이라는 항목과 '냉동능력'이라는 각각의 항목에 대해 문자열 유사도를 판단하여 문자열의 항목을 인식하는 것을 예시하고 있다.The string similarity determination module 160 may be configured to compare the similarity between each item stored in the item storage module 130 and the string of each bounding box modified by the bounding box modification module 150. This determination of string similarity is to find a string that corresponds to an item among several strings. Figure 4 illustrates recognizing string items by determining string similarity for each item 'format' and 'freezing ability'.

한편, 문자열에는 다양한 오류가 있을 수 있다.Meanwhile, strings may contain various errors.

문자열 후처리 모듈(170)은 이러한 오류를 바로잡도록 구성될 수 있다.String post-processing module 170 may be configured to correct these errors.

즉, 문자열 후처리 모듈(170)은 문자열 유사도 판단 모듈(160)의 유사도 대비 결과 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 후처리를 수행하도록 구성될 수 있다.That is, the string post-processing module 170 may be configured to perform post-processing on strings that are determined to be similar according to a predetermined standard as a result of the similarity comparison of the string similarity determination module 160.

예를 들어, 설비 명판에 표시된 설비 성능 중 값 부분의 숫자 '0'은 알파벳 'O'로, 단위 부분의 특수문자 '/'은 알파벳 'l'로 잘못 인식되는 경우가 잦다. 이를 바로잡기 위해 숫자 혹은 ','에 뒤따르는 대소문자 'O' 숫자 '0'으로 변환하도록 구성될 수 있다. 또한, '/'를 알파벳 'l'로 치환한 단위 데이터 세트와 인식된 설비 항목값의 마지막 글자가 일치하는 경우, 단위를 올바른 표기로 수정하도록 구성될 수 있다. 표 2의 3~4행은 두 번째 규칙의 적용 예시이다. 'kglh'로 잘못 인식된 단위 'kg/h'를 바로잡았으며, 숫자로 추정되는 '5,OOO'과 '5OO'의 알파벳 'O'를 숫자 '0'으로 변환할 수 있다.For example, the number '0' in the value part of the equipment performance displayed on the equipment nameplate is often mistakenly recognized as the alphabet 'O', and the special character '/' in the unit part is often mistakenly recognized as the alphabet 'l'. To correct this, it can be configured to convert the upper and lower case letter 'O' followed by a number or ',' to the number '0'. In addition, if the last letter of the recognized equipment item value matches the unit data set in which '/' is replaced with the alphabet 'l', the unit can be configured to be corrected to the correct notation. Rows 3 and 4 of Table 2 are examples of application of the second rule. The unit 'kg/h', which was incorrectly recognized as 'kglh', has been corrected, and the alphabet 'O' in '5,OOO' and '5OO', which are presumed to be numbers, can be converted to the number '0'.

표 1은 이러한 문자열 후처리에 대한 예시를 나타내고 있다.Table 1 shows an example of this string post-processing.

한편, 항목/설비사양값 구별 모듈(180)은 문자열 후처리 모듈(170)에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 앞서 지정된 항목에 대한 설비 사양값으로 지정하여 구별하도록 구성될 수 있다. 도 4의 c)는 항목과 설비 사양값의 쌍으로 구별되어 표시되어 있다.Meanwhile, the item/equipment specification value distinction module 180 designates the string post-processed in the string post-processing module 170 as an item, and stores the string in another bounding box in advance in the facility specification value unit storage module 140. It can be configured to distinguish by referring to the stored units and specifying them as equipment specification values for previously specified items. In Figure 4c), pairs of items and equipment specifications are displayed separately.

항목/설비사양값 출력 모듈(190)은 항목/설비사양값 구별 모듈(180)에서 구별되는 항목 및 설비 사양값을 각각 출력하도록 구성될 수 있다.The item/equipment specification value output module 190 may be configured to output items and equipment specification values distinguished from the item/equipment specification value distinction module 180, respectively.

도 5는 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법의 흐름도이다.Figure 5 is a flowchart of a facility nameplate optical character reading method for automatic recognition of facility specifications according to an embodiment of the present invention.

도 5를 참조하면, 광학 인식 모듈(110)이 설비 명판의 문자열을 광학 인식한다(S101).Referring to FIG. 5, the optical recognition module 110 optically recognizes the string on the equipment nameplate (S101).

다음으로, 경계 상자 구분 모듈(120)이 광학 인식 모듈(110)에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분한다(S102).Next, the bounding box classification module 120 generates and distinguishes bounding boxes for each string based on the string optically recognized by the optical recognition module 110 (S102).

다음으로, 경계 상자 수정 모듈(150)이 항목 저장 모듈(130)에 저장된 각 항목 및 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 경계 상자 구분 모듈(120)에서 구분된 경계 상자를 수정한다(S103).Next, the bounding box modification module 150 refers to each item stored in the item storage module 130 and the units pre-stored in the facility specification value unit storage module 140 to separate the bounding boxes in the bounding box division module 120. Modify (S103).

다음으로, 문자열 유사도 판단 모듈(160)이 항목 저장 모듈(130)에 저장된 각 항목과 경계 상자 수정 모듈(150)에 의해 수정된 경계 상자의 문자열의 유사도를 각각 대비한다(S104).Next, the string similarity determination module 160 compares the similarity between each item stored in the item storage module 130 and the string of the bounding box modified by the bounding box modification module 150 (S104).

다음으로, 문자열 후처리 모듈(170)이 문자열 유사도 판단 모듈(160)의 유사도 대비 결과, 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 후처리를 수행한다(S105).Next, the string post-processing module 170 performs post-processing on strings that are determined to be similar according to a predetermined standard as a result of the similarity comparison of the string similarity determination module 160 (S105).

다음으로, 항목/설비사양값 구별 모듈(180)이 문자열 후처리 모듈(170)에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 지정된 항목에 대한 설비 사양값으로 지정하여 구별한다(S106).Next, the item/facility specification value distinction module 180 designates the string on which post-processing has been performed in the string post-processing module 170 as an item, and stores the string in another bounding box in the facility specification value unit storage module 140. Referring to pre-stored units, they are distinguished by designating them as equipment specification values for designated items (S106).

다음으로, 설비사양값 출력 모듈(190)이 항목/설비사양값 구별 모듈(180)에서 구별되는 항목 및 설비 사양값을 각각 출력한다(S107).Next, the equipment specification value output module 190 outputs the items and equipment specification values distinguished from the item/equipment specification value distinction module 180 (S107).

이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the description has been made with reference to the above examples, those skilled in the art can understand that various modifications and changes can be made to the present invention without departing from the spirit and scope of the present invention as set forth in the claims below. There will be.

110: 광학 인식 모듈
120: 경계 상자 구분 모듈
130: 항목 저장 모듈
140: 설비 사양값 단위 저장 모듈
150: 경계 상자 수정 모듈
160: 문자열 유사도 판단 모듈
170: 문자열 후처리 모듈
180: 항목/설비사양값 구별 모듈
190: 항목/설비사양값 출력 모듈
110: Optical recognition module
120: Bounding box separation module
130: Item storage module
140: Equipment specification value unit storage module
150: Bounding box modification module
160: String similarity judgment module
170: String post-processing module
180: Item/equipment specification value distinction module
190: Item/equipment specification value output module

Claims (4)

설비 명판의 문자열을 광학 인식하는 광학 인식 모듈;
상기 광학 인식 모듈에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분하는 경계 상자 구분 모듈;
설비 명판의 각 항목이 미리 저장되는 항목 저장 모듈;
설비 명판의 각 항목의 설비 사양값에 대한 단위가 미리 저장되는 설비 사양값 단위 저장 모듈;
상기 항목 저장 모듈에 저장된 각 항목 및 상기 설비 사양값 단위 저장 모듈에 미리 저장된 단위를 참조하여 상기 경계 상자 구분 모듈에서 구분된 경계 상자를 수정하는 경계 상자 수정 모듈;
상기 항목 저장 모듈에 저장된 각 항목과 상기 경계 상자 수정 모듈에 의해 수정된 각 경계 상자의 문자열의 유사도를 각각 대비하는 문자열 유사도 판단 모듈;
상기 문자열 유사도 판단 모듈의 유사도 대비 결과 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 오류를 바로잡도록 후처리를 수행하는 문자열 후처리 모듈;
상기 문자열 후처리 모듈에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 상기 설비 사양값 단위 저장 모듈에 미리 저장된 단위를 참조하여 앞서 지정된 항목에 대한 설비 사양값으로 지정하여 구별하는 항목/설비사양값 구별 모듈;
상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈;을 포함하며,
상기 항목은 설비 사양에 관한 항목으로 구성되고,
상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성되는 것을 특징으로 하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템.
An optical recognition module that optically recognizes strings on facility nameplates;
a bounding box classification module that generates and distinguishes bounding boxes for each string based on the string optically recognized by the optical recognition module;
an item storage module in which each item of the equipment nameplate is stored in advance;
A facility specification value unit storage module in which the units for the facility specification value of each item of the facility name plate are stored in advance;
a bounding box modification module that modifies a bounding box classified in the bounding box division module by referring to each item stored in the item storage module and a unit pre-stored in the facility specification value unit storage module;
a string similarity judgment module that compares the similarity between each item stored in the item storage module and the string of each bounding box modified by the bounding box modification module;
a string post-processing module that performs post-processing to correct errors on strings that are determined to be similar according to a predetermined standard as a result of similarity comparison of the string similarity judgment module;
In the string post-processing module, the post-processed string is designated as an item, and the string in another bounding box is differentiated by designating it as the equipment specification value for the previously specified item by referring to the unit pre-stored in the equipment specification value unit storage module. Module for distinguishing item/equipment specification values;
It includes a facility specification value output module that outputs the items and facility specification values distinguished from the item/equipment specification value distinction module, respectively,
The above items consist of items related to equipment specifications,
The facility nameplate optical character reading system for automatic recognition of facility specifications, characterized in that the facility specification value consists of the physical specification value of the item.
삭제delete 광학 인식 모듈이 설비 명판의 문자열을 광학 인식하는 단계;
경계 상자 구분 모듈이 상기 광학 인식 모듈에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분하는 단계;
경계 상자 수정 모듈이 항목 저장 모듈에 저장된 각 항목 및 설비 사양값 단위 저장 모듈에 미리 저장된 단위를 참조하여 상기 경계 상자 구분 모듈에서 구분된 경계 상자를 수정하는 단계;
문자열 유사도 판단 모듈이 상기 항목 저장 모듈에 저장된 각 항목과 상기 경계 상자 수정 모듈에 의해 수정된 각 경계 상자의 문자열의 유사도를 각각 대비하는 단계;
문자열 후처리 모듈이 상기 문자열 유사도 판단 모듈의 유사도 대비 결과 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 오류를 바로잡도록 후처리를 수행하는 단계;
항목/설비사양값 구별 모듈이 상기 문자열 후처리 모듈에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 상기 설비 사양값 단위 저장 모듈에 미리 저장된 단위를 참조하여 앞서 지정된 항목에 대한 설비 사양값으로 지정하여 구별하는 단계;
설비사양값 출력 모듈이 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 단계;를 포함하며,
상기 항목은 설비 사양에 관한 항목으로 구성되고,
상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성되는 것을 특징으로 하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법.
A step where the optical recognition module optically recognizes a string on a facility nameplate;
A bounding box classification module generating and distinguishing bounding boxes for each string based on the string optically recognized by the optical recognition module;
A bounding box modification module modifying the bounding box divided by the bounding box classification module by referring to each item stored in the item storage module and the unit pre-stored in the equipment specification value unit storage module;
A string similarity determination module comparing the similarity between each item stored in the item storage module and the string of each bounding box modified by the bounding box modification module;
Post-processing, by a string post-processing module, to correct errors on strings that are determined to be similar according to a predetermined standard based on a similarity comparison result of the string similarity determination module;
The item/equipment specification value distinction module designates the string for which post-processing has been performed in the string post-processing module as an item, and the string in another bounding box is added to the previously specified item by referring to the unit pre-stored in the facility specification value unit storage module. A step of distinguishing by designating equipment specification values for each device;
It includes a step of the equipment specification value output module outputting each item and equipment specification value distinguished from the item/equipment specification value discrimination module,
The above items consist of items related to equipment specifications,
The equipment specification value is a facility nameplate optical character reading method for automatic recognition of facility specifications, characterized in that it consists of the physical specification value of the item.
삭제delete
KR1020220138661A 2022-10-25 2022-10-25 System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications KR102605381B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020220138661A KR102605381B1 (en) 2022-10-25 2022-10-25 System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020220138661A KR102605381B1 (en) 2022-10-25 2022-10-25 System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications

Publications (1)

Publication Number Publication Date
KR102605381B1 true KR102605381B1 (en) 2023-11-23

Family

ID=88974457

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020220138661A KR102605381B1 (en) 2022-10-25 2022-10-25 System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications

Country Status (1)

Country Link
KR (1) KR102605381B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100627195B1 (en) 1998-04-01 2006-09-22 윌리엄 피터만 System and method for searching electronic documents created with optical character recognition
KR102282025B1 (en) * 2021-02-08 2021-07-28 로지스원 주식회사 Method for automatically sorting documents and extracting characters by using computer
KR20220066475A (en) 2020-11-16 2022-05-24 엔에이치엔 주식회사 Device and system for deep learning-based optical character recognition

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100627195B1 (en) 1998-04-01 2006-09-22 윌리엄 피터만 System and method for searching electronic documents created with optical character recognition
KR20220066475A (en) 2020-11-16 2022-05-24 엔에이치엔 주식회사 Device and system for deep learning-based optical character recognition
KR102282025B1 (en) * 2021-02-08 2021-07-28 로지스원 주식회사 Method for automatically sorting documents and extracting characters by using computer

Similar Documents

Publication Publication Date Title
US6834121B2 (en) Apparatus for rough classification of words, method for rough classification of words, and record medium recording a control program thereof
JP2004139484A (en) Form processing device, program for implementing it, and program for creating form format
JP5621777B2 (en) Non-transitory computer-readable medium storing word recognition device, method and program, and shipment sorting device
JP4661921B2 (en) Document processing apparatus and program
JP2012083951A (en) Information processing equipment, information processing method and program
JP6831951B2 (en) Image recognition system
JP6458239B1 (en) Image recognition system
US11816923B2 (en) Face image candidate determination apparatus for authentication, face image candidate determination method for authentication, program, and recording medium
JP2008204226A (en) Form recognition device and its program
US8170290B2 (en) Method for checking an imprint and imprint checking device
JP2000285190A (en) Method and device for identifying slip and storage medium
KR102605381B1 (en) System and method of reading equipment nameplate optical character for automatic recognition of equipment specifications
US20180067916A1 (en) Analysis apparatus, analysis method, and recording medium
US20070172130A1 (en) Structural description of a document, a method of describing the structure of graphical objects and methods of object recognition.
CN111291535A (en) Script processing method and device, electronic equipment and computer readable storage medium
CN110942075A (en) Information processing apparatus, storage medium, and information processing method
JP5601533B2 (en) Business card management apparatus and method
JP4521466B2 (en) Form processing device
JP2009146245A (en) Image comparing method, apparatus and program
JPH06124366A (en) Address reader
CN113269101A (en) Bill identification method, device and equipment
JP6784274B2 (en) Image processing equipment, image processing methods and programs
JP2022095391A (en) Information processing apparatus and information processing program
JP2013105344A (en) Business form processing system and business form processing method
US20130272610A1 (en) Image Processing Apparatus that Groups Objects Within Image

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant