WO2024090821A1 - 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법 - Google Patents

설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법 Download PDF

Info

Publication number
WO2024090821A1
WO2024090821A1 PCT/KR2023/014968 KR2023014968W WO2024090821A1 WO 2024090821 A1 WO2024090821 A1 WO 2024090821A1 KR 2023014968 W KR2023014968 W KR 2023014968W WO 2024090821 A1 WO2024090821 A1 WO 2024090821A1
Authority
WO
WIPO (PCT)
Prior art keywords
equipment
item
module
facility
specification value
Prior art date
Application number
PCT/KR2023/014968
Other languages
English (en)
French (fr)
Inventor
박관용
박창영
박성현
Original Assignee
(주)미래환경플랜건축사사무소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)미래환경플랜건축사사무소 filed Critical (주)미래환경플랜건축사사무소
Publication of WO2024090821A1 publication Critical patent/WO2024090821A1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/12Detection or correction of errors, e.g. by rescanning the pattern
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means

Definitions

  • the present invention relates to an optical character reading system and method, and more specifically to a system and method for optical character reading of equipment nameplates, and more specifically to a system and method for optical character reading of equipment nameplates for automatic recognition of equipment specifications. will be.
  • optical character recognition technology for credit cards or ID cards.
  • This optical character reading technology takes advantage of the fact that the position where characters are displayed in forms such as ID cards is constant, or the format of values such as resident registration numbers or names is constant.
  • the format and recognition items of the equipment nameplate vary depending on the type and manufacturer/model of the equipment, such as model name, power consumption, and heating/cooling capacity.
  • the alphabet code, number, and unit W, kcal/h, There is a problem that the conventional optical character reading technology cannot be used as is due to the different formats (Hz, etc.).
  • the purpose of the present invention is to provide an equipment nameplate optical character reading system for automatic recognition of equipment specifications.
  • Another object of the present invention is to provide a method for reading optical characters on equipment nameplates for automatic recognition of equipment specifications.
  • the equipment nameplate optical character reading system for automatic recognition of equipment specifications includes an optical recognition module that optically recognizes a string of the equipment nameplate; an item/equipment specification value discrimination module that distinguishes the strings optically recognized by the optical recognition module by designating them as item and equipment specification values, respectively; It may be configured to include a facility specification value output module that outputs items and facility specification values distinguished from the item/equipment specification value distinction module, respectively.
  • the item consists of an item related to equipment specifications
  • the equipment specification value may consist of a physical specification value of the item.
  • the optical character reading method of a facility nameplate for automatic recognition of facility specifications includes the steps of: an optical recognition module optically recognizing a character string on a facility nameplate; A step in which an item/equipment specification value discrimination module designates and distinguishes the string optically recognized by the optical recognition module as an item and a facility specification value, respectively;
  • the equipment specification value output module may be configured to include a step of outputting items and equipment specification values distinguished from the item/equipment specification value distinction module, respectively.
  • the item consists of an item related to equipment specifications
  • the equipment specification value may consist of a physical specification value of the item.
  • the equipment nameplate optical character reading system and method for automatic recognition of the above-described equipment specifications it is configured to automatically recognize equipment nameplates without a specific format and correct errors to generate digital data, thereby providing a basis for evaluating building energy performance. It has the effect of securing data accurately and efficiently.
  • Figure 1 is a block diagram of a facility nameplate optical character reading system for automatic recognition of facility specifications according to an embodiment of the present invention.
  • Figure 2 is an exemplary diagram showing the result of bounding box classification according to an embodiment of the present invention.
  • Figure 3 is an exemplary diagram of a bounding box correction result according to an embodiment of the present invention.
  • Figure 4 is an exemplary diagram of the result of item-equipment specification value recognition according to an embodiment of the present invention.
  • Figure 5 is a flowchart of a facility nameplate optical character reading method for automatic recognition of facility specifications according to an embodiment of the present invention.
  • first, second, A, and B may be used to describe various components, but the components should not be limited by the terms. The above terms are used only for the purpose of distinguishing one component from another.
  • a first component may be named a second component without departing from the scope of the present invention, and similarly, the second component may also be named a first component.
  • the term and/or includes any of a plurality of related stated items or a combination of a plurality of related stated items.
  • Figure 1 is a block diagram of a facility nameplate optical character reading system for automatic recognition of facility specifications according to an embodiment of the present invention.
  • Figure 2 is an exemplary diagram showing a bounding box classification result according to an embodiment of the present invention
  • Figure 3 is an exemplary diagram showing a bounding box correction result according to an embodiment of the present invention
  • Figure 4 is an exemplary diagram showing an embodiment of the present invention. This is an example of the result of item-equipment specification value recognition according to an example.
  • the equipment nameplate optical character reading system 100 for automatic recognition of equipment specifications includes an optical recognition module 110, a bounding box classification module 120, and an item storage module ( 130), equipment specification value unit storage module 140, bounding box modification module 150, string similarity judgment module 160, string post-processing module 170, item/equipment specification value distinction module 180, item/ It may be configured to include a facility specification value output module 190.
  • the optical recognition module 110 may be configured to optically recognize a string on a facility nameplate.
  • the optical recognition module 110 can optically recognize character strings using optical character recognition (OCR) technology.
  • OCR optical character recognition
  • the bounding box classification module 120 may be configured to generate and distinguish bounding boxes for each string based on the string optically recognized by the optical recognition module 110.
  • the boundary box is displayed in the form of a boundary box for each character string on the equipment nameplate, and is displayed in the form of a green box in FIG. 2.
  • the bounding box classification module 120 may be configured to recognize rows of multiple bounding boxes and classify them by estimating the positions and spacing of letters.
  • Figure 2a) shows a bounding box set through optical character recognition.
  • the bounding box classification module 120 can recognize the bounding boxes as bounding boxes of the same row if the y-axis center coordinate of each bounding box matches the y-axis center coordinate of the bounding box on its left.
  • the equipment nameplate is composed of pairs of items and their equipment specification values that are repeatedly displayed.
  • the items include size, cooling capacity, heating capacity, power, current consumption, standard air volume, and operating current, and the facility specification values for each item are shown in numbers and units representing the physical quantity to the right of each item.
  • the item storage module 130 may be configured to store each item of the equipment nameplate in advance.
  • the items are related to equipment specifications and include cooling capacity, heating capacity, size, etc. in Figure 2.
  • the equipment specification value unit storage module 140 may be configured to store in advance the units for the equipment specification values of each item on the equipment nameplate.
  • the bounding box modification module 150 refers to each item stored in the item storage module 130 and the units pre-stored in the facility specification value unit storage module 140 to modify the bounding box divided in the bounding box division module 120. It can be configured.
  • the bounding box modification module 140 can be modified to distinguish between the front of the bounding box containing Hangul and the rear of the bounding box whose last character is the unit.
  • the bounding box correction module 150 may be configured to modify the bounding box in a way that corrects these errors.
  • the bounding box of 'Type' and the bounding box of 'Formula' can be combined and modified into one bounding box of 'Form'.
  • Figure 3 illustrates a bounding box modified by modification of the bounding box modification module 150.
  • the string similarity determination module 160 may be configured to compare the similarity between each item stored in the item storage module 130 and the string of each bounding box modified by the bounding box modification module 150. This determination of string similarity is to find a string that corresponds to an item among several strings.
  • Figure 4 illustrates recognizing string items by determining string similarity for each item 'format' and 'freezing ability'.
  • strings may contain various errors.
  • String post-processing module 170 may be configured to correct these errors.
  • the string post-processing module 170 may be configured to perform post-processing on strings that are determined to be similar according to a predetermined standard as a result of the similarity comparison of the string similarity determination module 160.
  • the number '0' in the value part of the equipment performance displayed on the equipment nameplate is often mistakenly recognized as the alphabet 'O', and the special character '/' in the unit part is often mistakenly recognized as the alphabet 'l'.
  • it can be configured to convert the upper and lower case letter 'O' followed by a number or ',' to the number '0'.
  • the unit can be configured to be corrected to the correct notation.
  • Rows 3 and 4 of Table 2 are examples of application of the second rule.
  • the unit 'kg/h' which was incorrectly recognized as 'kglh', has been corrected, and the alphabet 'O' in '5,OOO' and '5OO', which are presumed to be numbers, can be converted to the number '0'.
  • Table 1 shows an example of this string post-processing.
  • the item/equipment specification value distinction module 180 designates the string post-processed in the string post-processing module 170 as an item, and stores the string in another bounding box in advance in the facility specification value unit storage module 140. It can be configured to distinguish by referring to the stored units and specifying them as equipment specification values for previously specified items. In Figure 4c), pairs of items and equipment specifications are displayed separately.
  • the item/equipment specification value output module 190 may be configured to output items and equipment specification values distinguished from the item/equipment specification value distinction module 180, respectively.
  • Figure 5 is a flowchart of a facility nameplate optical character reading method for automatic recognition of facility specifications according to an embodiment of the present invention.
  • the optical recognition module 110 optically recognizes the string on the equipment nameplate (S101).
  • the bounding box classification module 120 generates and distinguishes bounding boxes for each string based on the string optically recognized by the optical recognition module 110 (S102).
  • the bounding box modification module 150 refers to each item stored in the item storage module 130 and the units pre-stored in the facility specification value unit storage module 140 to separate the bounding boxes in the bounding box division module 120. Modify (S103).
  • the string similarity determination module 160 compares the similarity between each item stored in the item storage module 130 and the string of the bounding box modified by the bounding box modification module 150 (S104).
  • the string post-processing module 170 performs post-processing on strings that are determined to be similar according to a predetermined standard as a result of the similarity comparison of the string similarity determination module 160 (S105).
  • the item/facility specification value distinction module 180 designates the string on which post-processing has been performed in the string post-processing module 170 as an item, and stores the string in another bounding box in the facility specification value unit storage module 140. Referring to pre-stored units, they are distinguished by designating them as equipment specification values for designated items (S106).
  • the equipment specification value output module 190 outputs the items and equipment specification values distinguished from the item/equipment specification value distinction module 180 (S107).
  • the present invention as described above can be widely used in the text reading field.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법이 개시된다. 설비 명판의 문자열을 광학 인식하는 광학 인식 모듈; 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 항목/설비사양값 구별 모듈; 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈을 구성한다. 상술한 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 의하면, 특정한 포맷이 없는 설비 명판을 자동으로 인식하고 오류를 정정하여 디지털 데이터를 생성하도록 구성됨으로써, 건물 에너지 성능 평가를 위한 기초 자료를 정확하고 효율적으로 확보할 수 있는 효과가 있다.

Description

설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법
본 발명은 광학 문자 판독 시스템 및 방법에 관한 것으로서, 구체적으로는 설비 명판 광학 문자 판독 시스템 및 방법에 관한 것이고, 좀 더 구체적으로는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 관한 것이다.
건물을 리모델링(remodeling)하는 경우, 건물의 에너지 성능을 개선하기 위해선 기존 건물의 성능을 평가하는 에너지 진단이 선행되어야 한다.
이때, 건물의 에너지 소비량, 효율 등을 조사하기 위해서 건물 내 설비의 명판에 표시된 사양 정보가 필요하다.
기존에는 건물 에너지 진단을 위해 검사자가 직접 건물을 돌아다니며 모든 설비 명판을 확인하고 사양 정보를 디지털 데이터로 옮기는 작업을 한다. 이러한 작업은 전문가의 노동력에 크게 의존하는 작업이기 때문에 작업자별 기재 방법의 차이나 기입 과정의 인적 실수로 인한 오류가 발생하는 문제점이 있다. 기본적인 사양 정보의 오류는 건물 에너지 진단의 오류로 이어지기 때문에 매우 중요한 기초 작업이라고 볼 수 있다.
한편, 기존에는 신용카드나 신분증의 광학 문자 판독(optical character recognition) 기술이 있다. 이러한 광학 문자 판독 기술은 신분증 등의 양식에서 문자가 표시되는 위치가 일정하다는 점을 이용하거나, 주민등록번호나 이름 등의 값의 형식이 일정하다는 점을 이용하고 있다.
그러나, 설비 명판은 모델명, 소비전력, 냉난방능력 등 기기의 종류와 제조사/모델에 따라 명판의 형식과 인식 항목이 다양하며, 각 항목에 대응되는 알파벳 코드, 숫자와 단위(W, kcal/h, Hz 등)의 형식이 달라 종래의 광학 문자 판독 기술을 그대로 이용할 수 없는 문제점이 있다.
<선행기술 문헌>
대한민국 등록특허공보 10-0627195
대한민국 공개특허공보 10-2022-0066475
본 발명의 목적은 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템을 제공하는 데 있다.
본 발명의 다른 목적은 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법을 제공하는 데 있다.
상술한 본 발명의 목적에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템은, 설비 명판의 문자열을 광학 인식하는 광학 인식 모듈; 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 항목/설비사양값 구별 모듈; 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈을 포함하도록 구성될 수 있다.
여기서, 상기 항목은 설비 사양에 관한 항목으로 구성되고, 상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성될 수 있다.
상술한 본 발명의 다른 목적에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법은, 광학 인식 모듈이 설비 명판의 문자열을 광학 인식하는 단계; 항목/설비사양값 구별 모듈이 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 단계; 설비사양값 출력 모듈이 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 단계를 포함하도록 구성될 수 있다.
여기서, 상기 항목은 설비 사양에 관한 항목으로 구성되고, 상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성될 수 있다.
상술한 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법에 의하면, 특정한 포맷이 없는 설비 명판을 자동으로 인식하고 오류를 정정하여 디지털 데이터를 생성하도록 구성됨으로써, 건물 에너지 성능 평가를 위한 기초 자료를 정확하고 효율적으로 확보할 수 있는 효과가 있다.
도 1은 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템의 블록 구성도이다.
도 2는 본 발명의 일 실시예에 따른 경계 상자 구분 결과를 나타내는 예시도이다.
도 3은 본 발명의 일 실시예에 따른 경계 상자 수정 결과의 예시도이다.
도 4는 본 발명의 일 실시예에 따른 항목-설비사양값 인식 결과의 예시도이다.
도 5는 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법의 흐름도이다.
본 발명은 다양한 변경을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시 예들을 도면에 예시하고 발명을 실시하기 위한 구체적인 내용에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 각 도면을 설명하면서 유사한 참조부호를 유사한 구성요소에 대해 사용하였다.
제1, 제2, A, B 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다. 및/또는 이라는 용어는 복수의 관련된 기재된 항목들의 조합 또는 복수의 관련된 기재된 항목들 중의 어느 항목을 포함한다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다.
본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가지고 있다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 본 발명에 따른 바람직한 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템의 블록 구성도이다. 그리고 도 2는 본 발명의 일 실시예에 따른 경계 상자 구분 결과를 나타내는 예시도이고, 도 3은 본 발명의 일 실시예에 따른 경계 상자 수정 결과의 예시도이고, 도 4는 본 발명의 일 실시예에 따른 항목-설비사양값 인식 결과의 예시도이다.
도 1을 참조하면, 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템(100)은 광학 인식 모듈(110), 경계 상자 구분 모듈(120), 항목 저장 모듈(130), 설비 사양값 단위 저장 모듈(140), 경계 상자 수정 모듈(150), 문자열 유사도 판단 모듈(160), 문자열 후처리 모듈(170), 항목/설비사양값 구별 모듈(180), 항목/설비사양값 출력 모듈(190)을 포함하도록 구성될 수 있다.
이하, 세부적인 구성에 대하여 설명한다.
광학 인식 모듈(110)은 설비 명판의 문자열을 광학 인식하도록 구성될 수 있다. 광학 인식 모듈(110)은 OCR(optical character recognition) 기술을 이용하여 문자열을 광학 인식할 수 있다.
경계 상자 구분 모듈(120)은 광학 인식 모듈(110)에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분하도록 구성될 수 있다. 여기서, 경계 상자는 설비 명판의 각 문자열에 대한 경계 상자(boundary box) 형태로 표시되는 것으로서, 도 2에서 녹색 박스 형태의 표시이다.
경계 상자 구분 모듈(120)은 여러 경계 상자의 행을 인식하고 글자의 위치와 간격에 따라 추정하여 구분을 하도록 구성될 수 있다. 도 2의 a)는 광학 문자 인식을 통해 설정된 경계 상자를 나타낸다.
한편, 경계 상자 구분 모듈(120)은 각 경계 상자의 y축 중심 좌표가 그 왼쪽의 경계 상자의 y축 중심 좌표와 일치하면 동일한 행의 경계 상자로 인식할 수 있다.
한편, 설비 명판은 항목과 항목의 설비 사양값의 쌍들이 반복적으로 나타내는 형태로 구성된다. 도 2에서 보면, 항목은 크기, 냉방능력, 난방능력, 전원, 소비전류, 표준풍량, 운전전류 등이고, 각 항목의 설비 사양값은 각 항목의 오른쪽에 그 물리량을 나타내는 숫자와 단위로 나타나 있다.
항목 저장 모듈(130)은 설비 명판의 각 항목이 미리 저장되도록 구성될 수 있다. 항목은 설비 사양에 관한 항목으로서 도 2의 냉방능력, 난방능력, 크기 등이 이에 해당된다.
설비 사양값 단위 저장 모듈(140)은 설비 명판의 각 항목의 설비 사양값에 대한 단위가 미리 저장되도록 구성될 수 있다.
경계 상자 수정 모듈(150)은 항목 저장 모듈(130)에 저장된 각 항목 및 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 경계 상자 구분 모듈(120)에서 구분된 경계 상자를 수정하도록 구성될 수 있다.
구체적으로는 경계 상자 수정 모듈(140)은 한글을 포함하는 경계 상자의 앞과 마지막 문자가 단위인 경계 상자의 뒤에서 경계 상자를 구분하도록 수정할 수 있다.
그런데, 여기서, 경계 상자 내의 문자열 인식에는 오류가 많이 있을 수 있다. 문자열의 내용이나 단위가 정해져 있지 않고, 문자, 숫자, 단위의 포맷이나 위치가 일정하지 않기 때문에 문자열 인식에 오류가 많이 생긴다. 특히, 경계 상자는 1차적으로 글자의 위치와 간격에 따라 추정되기 때문에 도 3의 a)에서 '형'과 '식'과 같이 '형식'이라는 하나의 단어가 분리되어 각각의 경계 상자로 구분될 수 있다는 문제점이 있다.
경계 상자 수정 모듈(150)은 이러한 오류를 해결하는 방향으로 경계 상자를 수정하도록 구성될 수 있다. 예를 들어, '형'의 경계 상자와 '식'의 경계 상자를 합쳐서 '형식'의 하나의 경계 상자로 수정할 수 있다. 도 3은 이러한 경계 상자 수정 모듈(150)의 수정에 의해 수정된 경계 상자를 예시하고 있다.
문자열 유사도 판단 모듈(160)은 항목 저장 모듈(130)에 저장된 각 항목과 경계 상자 수정 모듈(150)에 의해 수정된 각 경계 상자의 문자열의 유사도를 각각 대비하도록 구성될 수 있다. 이러한 문자열 유사도의 판단은 여러 문자열 중 항목에 해당되는 문자열을 찾아내기 위한 것이다. 도 4에서는 '형식'이라는 항목과 '냉동능력'이라는 각각의 항목에 대해 문자열 유사도를 판단하여 문자열의 항목을 인식하는 것을 예시하고 있다.
한편, 문자열에는 다양한 오류가 있을 수 있다.
문자열 후처리 모듈(170)은 이러한 오류를 바로잡도록 구성될 수 있다.
즉, 문자열 후처리 모듈(170)은 문자열 유사도 판단 모듈(160)의 유사도 대비 결과 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 후처리를 수행하도록 구성될 수 있다.
예를 들어, 설비 명판에 표시된 설비 성능 중 값 부분의 숫자 '0'은 알파벳 'O'로, 단위 부분의 특수문자 '/'은 알파벳 'l'로 잘못 인식되는 경우가 잦다. 이를 바로잡기 위해 숫자 혹은 ','에 뒤따르는 대소문자 'O' 숫자 '0'으로 변환하도록 구성될 수 있다. 또한, '/'를 알파벳 'l'로 치환한 단위 데이터 세트와 인식된 설비 항목값의 마지막 글자가 일치하는 경우, 단위를 올바른 표기로 수정하도록 구성될 수 있다. 표 2의 3~4행은 두 번째 규칙의 적용 예시이다. 'kglh'로 잘못 인식된 단위 'kg/h'를 바로잡았으며, 숫자로 추정되는 '5,OOO'과 '5OO'의 알파벳 'O'를 숫자 '0'으로 변환할 수 있다.
표 1은 이러한 문자열 후처리에 대한 예시를 나타내고 있다.
Figure PCTKR2023014968-appb-img-000001
한편, 항목/설비사양값 구별 모듈(180)은 문자열 후처리 모듈(170)에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 앞서 지정된 항목에 대한 설비 사양값으로 지정하여 구별하도록 구성될 수 있다. 도 4의 c)는 항목과 설비 사양값의 쌍으로 구별되어 표시되어 있다.
항목/설비사양값 출력 모듈(190)은 항목/설비사양값 구별 모듈(180)에서 구별되는 항목 및 설비 사양값을 각각 출력하도록 구성될 수 있다.
도 5는 본 발명의 일 실시예에 따른 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법의 흐름도이다.
도 5를 참조하면, 광학 인식 모듈(110)이 설비 명판의 문자열을 광학 인식한다(S101).
다음으로, 경계 상자 구분 모듈(120)이 광학 인식 모듈(110)에서 광학 인식된 문자열을 기준으로 각 문자열의 경계 상자를 생성하여 구분한다(S102).
다음으로, 경계 상자 수정 모듈(150)이 항목 저장 모듈(130)에 저장된 각 항목 및 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 경계 상자 구분 모듈(120)에서 구분된 경계 상자를 수정한다(S103).
다음으로, 문자열 유사도 판단 모듈(160)이 항목 저장 모듈(130)에 저장된 각 항목과 경계 상자 수정 모듈(150)에 의해 수정된 경계 상자의 문자열의 유사도를 각각 대비한다(S104).
다음으로, 문자열 후처리 모듈(170)이 문자열 유사도 판단 모듈(160)의 유사도 대비 결과, 소정 기준에 따라 유사하다고 판단되는 문자열에 대해 후처리를 수행한다(S105).
다음으로, 항목/설비사양값 구별 모듈(180)이 문자열 후처리 모듈(170)에서 후처리가 수행된 문자열을 항목으로 지정하고, 다른 경계 상자의 문자열을 설비 사양값 단위 저장 모듈(140)에 미리 저장된 단위를 참조하여 지정된 항목에 대한 설비 사양값으로 지정하여 구별한다(S106).
다음으로, 설비사양값 출력 모듈(190)이 항목/설비사양값 구별 모듈(180)에서 구별되는 항목 및 설비 사양값을 각각 출력한다(S107).
이상 실시예를 참조하여 설명하였지만, 해당 기술 분야의 숙련된 당업자는 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
상기한 바와 같은 본 발명은 문자 판독 분야에 널리 이용될 수 있다.
110: 광학 인식 모듈
120: 경계 상자 구분 모듈
130: 항목 저장 모듈
140: 설비 사양값 단위 저장 모듈
150: 경계 상자 수정 모듈
160: 문자열 유사도 판단 모듈
170: 문자열 후처리 모듈
180: 항목/설비사양값 구별 모듈
190: 항목/설비사양값 출력 모듈

Claims (4)

  1. 설비 명판의 문자열을 광학 인식하는 광학 인식 모듈;
    상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 항목/설비사양값 구별 모듈;
    상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 설비사양값 출력 모듈을 포함하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템.
  2. 제1항에 있어서,
    상기 항목은 설비 사양에 관한 항목으로 구성되고,
    상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성되는 것을 특징으로 하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템.
  3. 광학 인식 모듈이 설비 명판의 문자열을 광학 인식하는 단계;
    항목/설비사양값 구별 모듈이 상기 광학 인식 모듈에서 광학 인식된 문자열을 항목 및 설비 사양값으로 각각 지정하여 구별하는 단계;
    설비사양값 출력 모듈이 상기 항목/설비사양값 구별 모듈에서 구별되는 항목 및 설비 사양값을 각각 출력하는 단계를 포함하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법.
  4. 제3항에 있어서,
    상기 항목은 설비 사양에 관한 항목으로 구성되고,
    상기 설비 사양값은 상기 항목의 물리적인 사양값으로 구성되는 것을 특징으로 하는 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 방법.
PCT/KR2023/014968 2022-10-25 2023-09-27 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법 WO2024090821A1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020220138661A KR102605381B1 (ko) 2022-10-25 2022-10-25 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법
KR10-2022-0138661 2022-10-25

Publications (1)

Publication Number Publication Date
WO2024090821A1 true WO2024090821A1 (ko) 2024-05-02

Family

ID=88974457

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/KR2023/014968 WO2024090821A1 (ko) 2022-10-25 2023-09-27 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법

Country Status (2)

Country Link
KR (1) KR102605381B1 (ko)
WO (1) WO2024090821A1 (ko)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170036280A (ko) * 2015-09-24 2017-04-03 전남대학교산학협력단 전주 관리 프로그램 및 그 프로그램을 갖는 휴대단말
KR20210026695A (ko) * 2019-08-31 2021-03-10 한화시스템 주식회사 수주 입찰 제안서 생성을 위한 ocr 기반의 정량자료 가공 시스템 및 방법
KR20210080203A (ko) * 2019-12-20 2021-06-30 (주)린치핀 스마트 물류 시스템을 위한 온라인 파츠북 서비스를 지원하는 모바일 단말기
KR102282025B1 (ko) * 2021-02-08 2021-07-28 로지스원 주식회사 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
KR20220135742A (ko) * 2021-03-31 2022-10-07 주식회사 포스코아이씨티 안전 관리비 통합 관리부를 포함하는 작업 안전 관리 시스템 및 그 방법

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU770515B2 (en) 1998-04-01 2004-02-26 William Peterman System and method for searching electronic documents created with optical character recognition
KR102480235B1 (ko) 2020-11-16 2022-12-22 엔에이치엔클라우드 주식회사 딥러닝 기반 광학문자인식 장치 및 그 시스템

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20170036280A (ko) * 2015-09-24 2017-04-03 전남대학교산학협력단 전주 관리 프로그램 및 그 프로그램을 갖는 휴대단말
KR20210026695A (ko) * 2019-08-31 2021-03-10 한화시스템 주식회사 수주 입찰 제안서 생성을 위한 ocr 기반의 정량자료 가공 시스템 및 방법
KR20210080203A (ko) * 2019-12-20 2021-06-30 (주)린치핀 스마트 물류 시스템을 위한 온라인 파츠북 서비스를 지원하는 모바일 단말기
KR102282025B1 (ko) * 2021-02-08 2021-07-28 로지스원 주식회사 컴퓨터를 이용한 문서 분류 및 문자 추출 방법
KR20220135742A (ko) * 2021-03-31 2022-10-07 주식회사 포스코아이씨티 안전 관리비 통합 관리부를 포함하는 작업 안전 관리 시스템 및 그 방법

Also Published As

Publication number Publication date
KR102605381B1 (ko) 2023-11-23

Similar Documents

Publication Publication Date Title
WO2015023035A1 (ko) 전치사 교정 방법 및 이를 수행하는 장치
WO2012053867A1 (en) Method and apparatus for recognizing an emotion of an individual based on facial action units
WO2023008696A1 (ko) 주소정보 처리 방법 및 이를 위한 시스템
WO2019093675A1 (ko) 빅데이터 분석을 위한 데이터 병합 장치 및 방법
CN107704888A (zh) 一种基于联合聚类深度学习神经网络的数据识别方法
CN109784339A (zh) 图片识别测试方法、装置、计算机设备及存储介质
WO2024090821A1 (ko) 설비 사양의 자동 인식을 위한 설비 명판 광학 문자 판독 시스템 및 방법
CN111259184B (zh) 一种面向新零售的图像自动标注系统及方法
WO2021172700A1 (ko) 이미지로부터 추출한 텍스트의 블록화 시스템 및 그 방법
CN114331316A (zh) 基于ai和rpa的订单信息录入方法、装置、设备和介质
WO2021091124A1 (ko) 복수의 파일들 각각에 대한 피쳐들의 분포 정보를 기초로 기준 파일에 대한 유사 파일의 탐색이 가능한 전자 장치 및 동작 방법
CN113269101A (zh) 一种票据识别方法、装置和设备
CN106462749A (zh) 用于自动建立表征两个技术图的数据记录的方法
CN115185939B (zh) 多源数据的数据处理方法
WO2022177372A1 (ko) 인공지능을 이용하여 튜터링 서비스를 제공하기 위한 시스템 및 그에 관한 방법
WO2015137715A1 (ko) 전자펜을 이용하는 정보 제공 장치 및 그의 정보 제공 방법
WO2024029661A1 (ko) 의료 검사 판독지의 디지털 정형화 방법
KR100571080B1 (ko) 문서 인식 장치 및 우편 구분기
WO2022060082A1 (ko) 시약병 특징을 이용한 영상분석 시약정보 수집 방법 및 장치
WO2015133774A1 (ko) 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
JP2013097561A (ja) 単語間空白検出装置、単語間空白検出方法及び単語間空白検出用コンピュータプログラム
WO2020213757A1 (ko) 단어 유사도 판단 방법
WO2024043622A1 (ko) 셀 id 복원 방법 및 이를 이용한 제조 공정 시스템
WO2023095991A1 (ko) 전자 문서 학습용 컨텐츠 내 문항 영역 및 유형 자동 추출 시스템 및 그 방법
WO2024106721A1 (ko) 인공지능 기반의 광학적 문자 판독 모델을 활용한 스마트팜 영농데이터 변환 시스템

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 23882928

Country of ref document: EP

Kind code of ref document: A1