KR102465029B1 - Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology - Google Patents

Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology Download PDF

Info

Publication number
KR102465029B1
KR102465029B1 KR1020170035043A KR20170035043A KR102465029B1 KR 102465029 B1 KR102465029 B1 KR 102465029B1 KR 1020170035043 A KR1020170035043 A KR 1020170035043A KR 20170035043 A KR20170035043 A KR 20170035043A KR 102465029 B1 KR102465029 B1 KR 102465029B1
Authority
KR
South Korea
Prior art keywords
reference number
description
reference numerals
drawings
numbers
Prior art date
Application number
KR1020170035043A
Other languages
Korean (ko)
Other versions
KR20180106546A (en
Inventor
강민수
황재성
노석현
Original Assignee
(주)광개토연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)광개토연구소 filed Critical (주)광개토연구소
Priority to KR1020170035043A priority Critical patent/KR102465029B1/en
Publication of KR20180106546A publication Critical patent/KR20180106546A/en
Priority to KR1020220145600A priority patent/KR102515657B1/en
Application granted granted Critical
Publication of KR102465029B1 publication Critical patent/KR102465029B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/106Display of layout of documents; Previewing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/10Image acquisition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/18Extraction of features or characteristics of the image
    • G06V30/1801Detecting partial patterns, e.g. edges or contours, or configurations, e.g. loops, corners, strokes or intersections
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/42Document-oriented image-based pattern recognition based on the type of document
    • G06V30/422Technical drawings; Geographical maps

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Document Processing Apparatus (AREA)
  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 도면 상의 도면 부호 및 명세서 상의 도면 부호의 설명 간의 연계 및 결합 콘텐츠를 제공하는 인공 지능 기술 기반의 정보 처리 방법 및 장치에 관한 것이다. 특허 도면에 포함되어 있는 도면 부호에 도면 부호의 설명이 표시되는데 사용되는 도면 부호의 설명 표시 도면 콘텐츠가 제공되도록 처리하는 방법으로서,
본 발명의 컴퓨터 장치는
적어도 하나 이상의 타 장치로부터 개별 도면 단위, 개별 특허 단위 또는 기설정된 단위로 도면 부호의 설명 표시 도면 콘텐츠 요청 정보를 수신하는 단계;
상기 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하는 도면 부호의 설명 표시 도면 콘텐츠를 입수하는 단계;
상기 수신된 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하여 도면 부호의 설명 표시 도면 콘텐츠를 상기 타 장치로 전송하는 단계;를 포함하는 방식으로 프로세싱 되며,
상기 도면 부호의 설명 표시 도면 콘텐츠는
(A1) 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고, (A2) 상기 인식된 도면 포함 도면 부호에 대응하는 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계; (B) 상기 컴퓨터 장치가 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 인식하는 단계; (C) 상기 컴퓨터 장치가 상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 포함하는 방식으로 프로세싱 되어 생성된다.
본 발명을 활용하면 도면에 나타나 있는 도면 부호의 주변에 도면 부호의 설명이 배치되게 할 수 있어, 도면 포함 도면 부호가 지칭하는 바를 명확하고 빠르게 인지할 수 있다. 이에 따라, 도면의 가독성이 좋아질 뿐만 아니라, 도면을 통해서 특허의 기술 사상을 이해하는 속도와 정확성이 높아지게 된다.
The present invention relates to an information processing method and apparatus based on artificial intelligence technology that provides linkage and combined content between reference numerals in drawings and descriptions of reference numerals in the specification. A method of processing a reference number included in a patent drawing to provide an explanatory drawing content of a reference number used to indicate a description of the reference number, the method comprising:
The computer device of the present invention is
receiving, from at least one or more other devices, drawing content request information indicating a reference number in an individual drawing unit, an individual patent unit, or a preset unit;
obtaining the descriptive-indicating drawing content of the reference-sign corresponding to the descriptive-indicating drawing content request information;
In response to the received drawing content request information of the reference number, the step of transmitting the description display drawing content of the reference number to the other device;
The explanatory display drawing content of the reference numerals is
(A1) recognizing reference numerals included in drawings, (A2) generating reference number attribute set information including drawings corresponding to the recognized reference numerals; (B) recognizing, by the computer device, descriptions of reference numerals with specifications in the specification of the patent and reference numbers corresponding to the reference numbers with the specification; (C) the computer device uses the reference number with the drawing, the reference number with the specification, and the description of the reference number, and the reference number used for the description of the reference number is arranged at a preset position of the reference number with the drawing It is generated by processing in a manner including; generating description batch data of
By utilizing the present invention, it is possible to arrange the description of the reference numerals around the reference numerals shown in the drawings, so that it is possible to clearly and quickly recognize what the reference numerals including the drawings refer to. Accordingly, not only the readability of the drawing is improved, but also the speed and accuracy of understanding the technical idea of the patent through the drawing is increased.

Description

도면 상의 도면 부호 및 명세서 상의 도면 부호의 설명 간의 연계 및 결합 콘텐츠를 제공하는 인공 지능 기술 기반의 정보 처리 방법 및 장치{Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology}TECHNICAL FIELD [0002] An artificial intelligence technology-based information processing method and apparatus for providing linkage and combined contents between reference numbers on drawings and descriptions of reference numbers on specifications Figure Numbers in Patent Description Based on Artificial Intelligence Technology}

본 발명은 도면 상의 도면 부호 및 명세서 상의 도면 부호의 설명 간의 연계 및 결합 콘텐츠를 제공하는 인공 지능 기술 기반의 정보 처리 방법 및 장치에 관한 것으로서 더욱 더 상세하게는 특허 도면 이미지에 포함된 도면 부호의 주위에 도면 부호의 설명이 표시되는 도면 상의 도면 부호 및 명세서 상의 도면 부호의 설명 간의 연계 및 결합 콘텐츠를 제공하는 인공 지능 기술 기반의 정보 처리 방법 및 장치에 대한 것이다.The present invention relates to an artificial intelligence technology-based information processing method and apparatus for providing linkage and combined content between reference numbers on drawings and descriptions of reference numbers on the specification, and more particularly, around reference numbers included in patent drawing images. It relates to an information processing method and apparatus based on artificial intelligence technology that provides linkage and combined content between reference numbers in drawings and descriptions of reference numbers in the specification in which descriptions of reference numerals are displayed.

특허 출원서에는 특허 명세서 및 도면을 포함하고 있다. 특허 도면 중에는 도면 부호에 대한 표시가 다수 포함되어 있는 도면이 많다. 하지만, 도면은 이미지 형태로 제공되고 있고, 도면 부호는 간략한 숫자 또는 숫자+문자 형태로 되어 있는 경우가 많아, 도면 부호만으로는 그 도면 부호가 지칭하는 대상을 정확하게 파악하기 어려운 문제가 있었다.The patent application includes the patent specification and drawings. Among the patent drawings, there are many drawings that include a large number of indications for reference numerals. However, the drawings are provided in the form of images, and the reference numbers are in the form of simple numbers or numbers + letters in many cases, so there is a problem in that it is difficult to accurately identify the objects indicated by the reference numbers only with the reference numbers.

도 25와 도 30은 본 통상적인 도면에 도면 부호가 나타나 있지만, 도면 부호에 대한 설명이 부가되어 있지 않아, 도면 부호가 지칭하는 정확하고 빠르게 파악하기 어려운 종래의 특허 도면에 대한 예시이다.25 and 30 are examples of conventional patent drawings that are difficult to grasp accurately and quickly because reference numerals are shown in the present general drawings, but descriptions of the reference numerals are not added.

이러한 도면 부호에 대한 도면 부호의 설명은 특허 명세서(주로 발명의 상세한 설명 등)에 나타나 있다. 하지만, 특허 도면과 특허 명세서는 공간적으로 분리되어 있을 뿐만 아니라, 특허 명세서에는 긴 문장 속에 전체 특허 내용에 대응되는 많은 도면 부호 및 도면 부호의 설명이 모두 포함되어 있어, 특정한 도면에 포함되어 있는 특정한 도면 부호에 대한 도면 부호의 설명을 빠르게 찾아 내기란 쉽지 않을 수 있다.Descriptions of reference numerals for these reference numerals appear in the patent specification (mainly the detailed description of the invention, etc.). However, not only the patent drawings and the patent specification are spatially separated, but also a number of reference signs and descriptions of reference numbers corresponding to the entire patent content are included in the patent specification in a long sentence, so a specific drawing included in a specific drawing It can be difficult to quickly find a description of a reference number for a reference number.

국가에 따라, 도면 부호의 설명만 따로 분리하여 기재하도록 권장하는 경우도 있지만, 이 경우에도 특허 전체에 대한 도면 부호 및 도면 부호의 설명이 맵핑되어 있어, 특정한 도면을 보고 있는 사람이 자신이 보고 있는 도면에 포함되어 있는 도면 부호에 대한 도면 부호의 설명만을 추출하기가 쉽지 않은 점이 있다.Depending on the country, there are cases where it is recommended to separately describe only the reference numerals, but even in this case, the reference numerals and the descriptions of the reference numerals for the entire patent are mapped, so that a person who is looking at a specific drawing is There is a point in which it is not easy to extract only the description of the reference numerals included in the drawings.

또한, 1개의 도면에 다수의 도면 부호가 있는 경우, 그 도면 부호마다 도면 부호의 설명이 나타나 있지 않으면, 도면 부호가 지칭하는 바를 정확하게 파악하기란 쉬운 일이 아니다. 도 30은 이러한 예를 잘 나타내 주고 있다.In addition, when there are a plurality of reference numerals in one drawing, it is not easy to accurately grasp what the reference numerals are referring to unless explanations of the reference numerals are shown for each of the reference numerals. 30 shows such an example well.

본 발명은 도면에 있는 도면 포함 도면 부호가 지칭하는 대상을 빠르고 명확하게 파악하지 못하는 종래의 불편함을 없애기 위한 것이다.The present invention is to eliminate the conventional inconvenience of not quickly and clearly grasping the object indicated by the reference numerals including the drawings in the drawings.

KR1020120032773 A1KR1020120032773 A1 KR1020160147950 A1KR10201601147950 A1

본 발명이 해결하고자 하는 첫번째 과제는 인공 지능 기술 기반의 머신 러닝을 사용하는 도면 부호를 포함하는 특허 도면 이미지에 도면 부호의 설명을 맵핑 처리하는 방법을 제시하는 것이다.The first problem to be solved by the present invention is to propose a method of mapping the description of the reference number to the patent drawing image including the reference number using machine learning based on artificial intelligence technology.

본 발명이 해결하고자 하는 두번째 과제는 인공 지능 기술 기반의 머신 러닝을 사용하는 도면 부호를 포함하는 특허 도면 이미지에 도면 부호의 설명을 맵핑 처리하는 장치를 제시하는 것이다.The second problem to be solved by the present invention is to present an apparatus for mapping the description of the reference numerals to the patent drawing image including the reference numerals using machine learning based on artificial intelligence technology.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 특허 도면에 포함되어 있는 도면 부호에 도면 부호의 설명이 표시되는데 사용되는 도면 부호의 설명 표시 도면 콘텐츠가 제공되도록 처리하는 방법으로서,In order to achieve the technical problem to be achieved by the present invention, as a method of processing to provide description display drawing content of the reference number used to display the description of the reference number in the reference number included in the patent drawing,

컴퓨터 장치가 적어도 하나 이상의 타 장치로부터 개별 도면 단위, 개별 특허 단위 또는 기설정된 단위로 도면 부호의 설명 표시 도면 콘텐츠 요청 정보를 수신하는 단계; 상기 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하는 도면 부호의 설명 표시 도면 콘텐츠를 입수하는 단계; 상기 수신된 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하여 도면 부호의 설명 표시 도면 콘텐츠를 상기 타 장치로 전송하는 단계;를 포함하며,Receiving, by the computer device, the drawing content request information indicating the reference numerals in units of individual drawings, individual patents, or preset units from at least one or more other devices; obtaining the descriptive-indicating drawing content of the reference-sign corresponding to the descriptive-indicating drawing content request information; and transmitting, to the other device, the content of the drawing with the description of the reference numeral in response to the received request information for the description of the reference drawing.

상기 도면 부호의 설명 표시 도면 콘텐츠는 특허의 적어도 하나 이상의 도면 부호가 포함된 도면에 상기 도면 부호에 대응되는 적어도 하나 이상의 도면 부호의 설명이 표시되도록 처리하는 방법으로서, (A) 컴퓨터 장치가 (A1) 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고, (A2) 상기 인식된 도면 포함 도면 부호에 대응하는 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계; (B) 상기 컴퓨터 장치가 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 인식하는 단계; (C) 상기 컴퓨터 장치가 상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 포함하는 것을 특징으로 하는 방법을 제시한다.The description display of the reference numerals is a method of processing such that descriptions of at least one or more reference numerals corresponding to the reference numerals are displayed in a drawing including at least one reference numeral of a patent, wherein (A) the computer device (A1) ) recognizing a reference number included in a drawing, and (A2) generating reference number attribute set information including a drawing corresponding to the recognized reference number; (B) recognizing, by the computer device, descriptions of reference numerals with specifications in the specification of the patent and reference numbers corresponding to the reference numbers with the specification; (C) the computer device uses the reference number with the drawing, the reference number with the specification, and the description of the reference number, and the reference number used for the description of the reference number is arranged at a preset position of the reference number with the drawing A method comprising: generating description batch data of

상기 (A1) 단계는 (A11) 상기 도면에서 숫자가 포함된 문자열을 인식하는 단계; (A12) 상기 문자열을 처리하여 상기 도면 포함 도면 부호를 결정하는 단계; 및 (A13) 상기 도면 포함 도면 부호에 대하여 도면 포함 도면 부호의 속성 정보를 생성하는 단계;를 더 포함하는 것이 바람직하다.The step (A1) includes: (A11) recognizing a character string including numbers in the drawing; (A12) processing the character string to determine the reference number including the drawing; and (A13) generating attribute information of reference numerals including drawings with respect to the reference numerals including drawings.

상기 (A12) 단계는 1) 추출된 상기 문자열이 숫자만으로 되어 있거나, 숫자와 문자의 비율이 기 설정된 비율 이하이거나, 기 설정된 길이 이하이거나, 기 설정된 도면 포함 도면 부호의 결정 패턴 규칙에 대응되는 경우에는 도면 포함 도면 부호로 결정하는 제1 도면 포함 도면 부호 결정 방법, 2) 추출된 상기 문자열이 상기 명세서 포함 도면 부호 또는 상기 명세서 포함 도면 부호 이전에 생성되는 명세서 포함 도면 부호 후보 집합을 구성하는 문자열과 일치, 기 설정된 기준 이상으로의 포함, 기 설정된 기준 이상으로의 부분 일치가 충족되는 경우, 상기 도면 포함 도면 부호로 결정하는 제2 도면 포함 도면 부호 결정 방법, 3) 추출된 상기 문자열이 다른 도면에서도 기 설정된 회수 이상으로 출현하는 경우에는 도면 포함 도면 부호로 결정하는 제3 도면 포함 도면 부호 결정 방법, 중 어느 하나의 방법을 사용하거나, 어느 2 이상의 방법을 결합하여 사용하는 것인 것이 바람직하다.In step (A12), 1) the extracted character string consists of only numbers, or the ratio of numbers and letters is less than or equal to a preset ratio, or less than a preset length, or corresponds to a decision pattern rule of preset reference numerals including drawings. a first method for determining reference numbers including drawings, 2) a character string constituting the reference number including the specification or a reference number candidate set including the specification generated before the reference number including the specification; A second method for determining reference numerals with drawings that determines the reference numbers including drawings when matching, including more than a preset standard, and partial matching with more than a preset standard are satisfied; When it appears more than a preset number of times, it is preferable to use any one method of the third reference number determination method including drawings, which is determined by reference numbers including drawings, or to use a combination of any two or more methods.

상기 (A13) 단계에서 상기 도면 포함 도면 부호의 속성 정보는 상기 도면 포함 도면 부호의 속성 정보는 상기 도면 포함 도면 부호의 후보의 문자열을 필수적으로 포함하고, 상기 문자열의 위치 정보, 길이, 방향, 폰트 크기 중 어느 하나 이상을 선택적으로 포함하는 것인 것이 바람직하다.In the step (A13), the attribute information of the reference number including drawings essentially includes the character string of the reference number including the drawing candidate, and the position information, length, direction, and font of the reference number. It is preferable to selectively include any one or more of the sizes.

상기 (B) 단계는 상기 명세서가 마크업 언어로 작성되어 있는 경우, (B1a) 도면 부호에 대응하는 명세서 포함 도면 부호의 태그부를 인식하고, 상기 명세서 포함 도면 부호의 태그부에서 상기 명세서 포함 도면 부호를 추출하는 단계; (B2a) 상기 명세서 포함 도면 부호의 태그부를 기준으로 상기 명세서 포함 도면 부호의 태그부와의 기 설정된 위치에 있는 문자열 블록을 추출하는 단계; 및 (B3a) 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정하는 단계;를 더 포함하는 것이며, 상기 명세서가 마크업 언어로 작성되어 있지 않은 경우, (B1b) 기 설정된 명세서 포함 도면 부호 식별 규칙을 적용하여, 상기 명세서 포함 도면 부호를 추출하는 단계; (B2b) 상기 명세서 포함 도면 부호를 기준으로 상기 명세서 포함 도면 부호와의 기 설정된 위치에 있는 문자열 블록을 추출하는 단계; 및 (B3b) 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정하는 단계;를 더 포함하는 것이 바람직하다.In the step (B), when the specification is written in a markup language, (B1a) recognizes the tag part of the reference number including the specification corresponding to the reference number, and the reference number including the specification in the tag part of the reference number including the specification extracting; (B2a) extracting a character string block at a preset position with the tag part of the reference reference including the specification based on the tag portion of the reference number including the specification; and (B3a) determining a description candidate of a reference number from the extracted character string; if the specification is not written in a markup language, (B1b) a reference number identification rule including a preset specification applying, extracting the reference numerals including the specification; (B2b) extracting a character string block at a preset position with the reference number including the specification based on the reference number including the specification; and (B3b) determining candidates for description of reference numerals from the extracted character string.

상기 (B3a) 또는 상기 (B3b) 단계는 상기 문자열 블록이 비기호 텍스트 문자열을 포함는 경우, 1) 상기 태그부에서 가장 가까운 도면 부호의 설명 시작 식별자 이후부터 상기 태그부 시작까지의 문자열을 도면 부호의 설명 후보를 결정하는 제1 도면 부호의 설명 후보 결정 방법, 2) 상기 태그부에서 설정된 n번째 가까운 도면 부호의 설명 시작 식별자까지의 문자열 부분을 추출하고, 기 설정된 도면 부호의 설명 후보 결정 규칙을 적용하여 도면 부호의 설명 후보를 결정하는 제2 도면 부호의 설명 후보 결정 방법 중 어느 하나 이상의 방법을 사용하는 것인 것이 바람직하다.In the step (B3a) or (B3b), when the character string block includes a non-signed text string, 1) the character string from the description start identifier of the reference number closest to the tag unit to the start of the tag unit A method for determining a description candidate of a first reference number for determining a description candidate, 2) extracting the character string part up to the description start identifier of the nth nearest reference reference set in the tag unit, and applying a preset description candidate determination rule of the reference number It is preferable to use any one or more methods among the methods for determining the description candidates of the second reference numerals to determine the description candidates for the reference numerals.

상기 (B3a) 단계 또는 상기 (B3b) 단계 이후에 (B4) 상기 명세서 포함 도면 부호에 대응되는 적어도 하나 이상의 상기 도면 부호의 설명 후보를 입수하고, 도면 부호의 설명 결정 규칙을 참고하여 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 결정하는 단계;를 더 포함하는 것이 바람직하다.After step (B3a) or step (B3b), (B4) obtain at least one candidate for description of the reference number corresponding to the reference number including the specification, and refer to the description decision rule of the reference number, the drawing including the specification It is preferable to further include; determining a description of the reference number corresponding to the reference number.

상기 도면 포함 도면 부호와 상기 도면 부호의 설명에 대한 결합 속성 데이터를 생성하는 것은 (C1) 상기 도면 포함 도면 부호와 상기 도면 부호의 설명에 대한 맵핑 데이터를 생성하는 단계; 및 (C2) 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계; 상기 (C1) 단계는 상기 명세서 포함 도면 부호를 매개로 상기 도면 포함 도면 부호와 상기 도면 부호의 설명을 (확률적으로) 맵핑하는 것인 것이 바람직하다.Generating the combined attribute data for the reference numbers with drawings and the descriptions of the reference numbers may include (C1) generating mapping data for the reference numbers with drawings and the descriptions of the reference numbers; and (C2) generating descriptive arrangement data of a reference number used in which the description of the reference number is arranged at a preset position of the reference number including the drawing; It is preferable that the step (C1) is to (probabilistically) map the reference numerals including the drawings and the descriptions of the reference numbers via the reference numerals including the specification.

상기 (C2) 단계는 상기 도면마다 생성되는 것이며, 상기 도면 부호의 설명 배치 데이터는 상기 도면 포함 도면 부호별로 대응되는 도면 부호의 설명의 배치 여부, 배치 우선 순위, 배치 위치, 배치 방향, 텍스트 속성 정보, 축약 표현 사용 여부, 계층 정보, 공통 텍스트 기반 계열 정보, 및 기타 도면 부호의 설명 메타 정보 중 어느 하나 이상을 포함하는 도면 부호의 설명 표시 제어 정보를 것인 것이 바람직하다.Step (C2) is generated for each drawing, and the descriptive arrangement data of the reference number includes information on whether the description of the reference number corresponding to each reference number including the drawing is arranged, arrangement priority, arrangement position, arrangement direction, and text attribute information. , it is preferable that the description display control information of the reference number including any one or more of whether to use abbreviation, hierarchical information, common text-based series information, and other reference symbol description meta information.

상기 (C2) 단계는 상기 도면마다 생성되는 것이며, (C21) 상기 도면에서 선택되는 적어도 하나 이상의 상기 도면 포함 도면 부호별로 상기 도면 포함 도면 부호의 위치 정보를 고려한, 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명의 배치를 위한 도면 부호의 설명 배치 최소 공간을 탐색하는 단계; (C22) 상기 도면 부호의 설명 배치 최소 공간이 적어도 2 이상의 도면 포함 도면 부호에 대해 겹침이 발생하는 지를 탐색하는 단계; (C23) 겹침의 발생 여부에 대응하여 도면 부호의 설명 배치 전략 데이터를 생성하는 단계; (C24) 상기 도면 부호의 설명 배치 전략 데이터를 참조하여 도면 부호의 설명 배치 데이터를 생성하는 단계; 상기 도면 부호의 설명은 도면 부호의 설명 속성 정보를 포함하고 있는 것이며, 상기 도면 부호의 설명 속성 정보는 도면 독립적 도면 부호의 설명 속성 정보와 도면 종속적 도면 부호의 설명 속성 정보로 구분될 수 있는 것인 것이며, 상기 도면 독립적 도면 부호의 설명 속성 정보는 도면 부호의 설명 텍스트, 도면 부호의 설명 텍스트의 길이, 관련된 도면 부호의 설명에 대응되는 도면 포함 도면 부호 또는 명세서 포함 도면 부호, 도면 부호의 설명 텍스트에 대한 적어도 하나 이상의 언어로 된 번역 도면 부호의 설명 텍스트 중 어느 하나 이상을 포함하고 있거나, 상기 도면 종속적 도면 부호의 설명 속성 정보는 도면에서의 도면 부호의 설명의 배치 여부, 배치 우선 순위, 집단적 배치 여부 중 어느 하나 이상을 포함하고 있는 것인 것이 바람직하다.The step (C2) is generated for each drawing, and (C21) a drawing corresponding to the reference number including the drawing in consideration of the location information of the reference number including the drawing for each at least one reference number including the drawing selected in the drawing searching for a minimum space for arrangement of descriptions of reference numerals for placement of descriptions of reference symbols; (C22) searching whether the minimum space of description arrangement of the reference numerals overlaps with respect to at least two or more reference numerals; (C23) generating descriptive arrangement strategy data of reference numerals in response to whether or not overlapping occurs; (C24) generating descriptive arrangement data of reference numerals with reference to the descriptive arrangement strategy data of the reference numerals; The description of the reference number includes descriptive attribute information of the reference number, and the descriptive attribute information of the reference number can be divided into descriptive attribute information of a drawing-independent reference number and descriptive attribute information of a drawing-dependent reference number , and the descriptive attribute information of the drawing-independent reference number is in the descriptive text of the reference number, the length of the descriptive text of the reference number, the reference number including the drawing corresponding to the description of the reference number or the reference number including the specification, the description text of the reference number includes any one or more of the descriptive texts of the translated reference numbers in at least one or more languages, or the descriptive attribute information of the drawing-dependent reference numbers indicates whether the description of the reference numbers in the drawing is arranged, the priority of arrangement, whether the group arrangement It is preferable to include any one or more of them.

상기 (C21) 단계에서 상기 도면 부호의 설명 배치 최소 공간을 탐색하는 단계는 도면 부호의 설명 텍스트의 길이, 상기 도면의 물리적 경계에서의 상기 도면 포함 도면 부호의 위치, 상기 도면 포함 도면 부호의 방향 중 어느 하나 이상을 반영하여 탐색하는 것인 것이 바람직하다.In the step (C21), the step of searching for the minimum space for the descriptive arrangement of the reference number is one of the length of the descriptive text of the reference number, the position of the reference number including the reference number in the physical boundary of the drawing, and the direction of the reference number including the reference number. It is preferable to search by reflecting any one or more.

(C211) 상기 2 이상의 근접 도면 포함 도면 부호 클러스터를 발굴하는 단계; (C212) 상기 근접 도면 포함 도면 부호 클러스터의 표시 밀도를 계량하는 단계; (C213) 상기 표시 밀도가 기 설정된 수준 이상인 경우에는 상기 (C23) 단계를 실시하지 않고, 적어도 하나 이상의 도면 내 여백 공간의 위치 정보를 생성하는 단계;를 포함하며, 상기 (C213) 단계에서 상기 도면 내 여백 공간의 위치 정보를 생성하는 것은 (C2131), 상기 근접 도면 포함 도면 부호 클러스터에 포함되는 전체 도면 포함 도면 부호 또는 적어도 하나 이상의 도면 포함 도면 부호를 추출하는 단계; 및 (C2132) 상기 추출된 도면 포함 도면 부호 및 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명이 표시되기 위한 필요 여백 공간을 계산하는 단계; (C2133) 계산된 상기 필요 여백 공간에 대응되며, 도면 상에 할당되는 도면 내 여백 공간의 위치를 결정하는 단계;를 포함하는 것인 것이 바람직하다.(C211) excavating a reference number cluster including the two or more adjacent drawings; (C212) metering the display density of the cluster of reference numerals including the adjacent figures; and (C213) generating position information of at least one blank space in at least one drawing without performing step (C23) when the display density is equal to or higher than a preset level; Generating the location information of the blank space (C2131) may include: extracting all reference numbers including drawings or at least one reference number including drawings included in the reference reference cluster including adjacent drawings; and (C2132) calculating the required blank space for displaying the extracted reference numbers and a description of the reference numbers corresponding to the reference numbers; (C2133) Corresponding to the calculated required blank space, and determining a position of the blank space in the drawing allocated on the drawing; preferably, it includes.

상기 도면 부호의 설명 배치 전략 데이터에는 상기 도면 포함 도면 부호와 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명이 기 설정된 거리 이상으로 떨어져 있는 경우에는 상기 도면 포함 도면 부호와 상기 도면 부호의 설명 간의 연결성이 시각적으로 인지 될 수 있는 연결 표시 데이터가 더 포함되는 것인 것이 바람직하다.In the description arrangement strategy data of the reference number, when the description of the reference number including the reference number and the reference number corresponding to the reference number is more than a preset distance, the connection between the reference number including the drawing and the description of the reference number It is preferable that this visually recognizable connection display data is further included.

상기 (C22) 단계는 도면 부호의 설명 배치 최소 공간은 상기 도면 부호의 설명 또는 상기 도면 부호의 설명에 대응되는 축약형 도면 부호의 설명의 조합별로 탐색되는 것인 것이며, 상기 (C23) 단계의 상기 도면 부호의 설명 배치 전략 데이터는 상기 도면 포함 도면 부호마다 상기 도면 부호의 설명 또는 상기 축약형 도면 부호의 설명 중 어느 하나를 표시할 것인지에 대한 선택 전략 데이터를 더 포함하는 것인 것이 바람직하다.In the step (C22), the minimum space for the description arrangement of the reference numerals is to be searched for each combination of the description of the reference number or the description of the abbreviated reference number corresponding to the description of the reference number, and in the above step (C23) It is preferable that the description arrangement strategy data of the reference numerals further include selection strategy data on whether to display either the description of the reference number or the description of the abbreviated reference number for each reference number including the drawing.

(D) 상기 도면 부호의 설명 배치 데이터를 사용하여 적어도 하나 이상의 레이어를 포함하는 도면 부호의 설명 레이어 데이터를 생성하는 단계;를 더 포함하며, 상기 도면 부호의 설명 레이어 데이터는 레이어별로 표시되는 레이어별 도면 부호의 설명 배치 데이터를 포함하고 있는 것인 것이 바람직하다.(D) generating descriptive layer data of reference numerals including at least one or more layers using the descriptive arrangement data of the reference numerals; It is preferable that the description and arrangement data of the reference numerals are included.

상기 컴퓨터 장치가 (E) 도면 번호에 대응되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 더 포함하며, 상기 (E) 단계는 (E1) 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계; (E2) 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 번호의 설명을 인식하고, 상기 도면 부호의 설명에 대응하는 도면 부호의 설명 속성 집합 정보를 생성하는 단계; 및 (E3) 상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 포함하는 것인 것이 바람직하다.The computer device further includes (E) generating descriptive arrangement data of reference numerals corresponding to reference numbers, wherein step (E) recognizes (E1) reference numerals included in the drawing and draws the drawing generating embedded reference sign attribute set information; (E2) recognizing a description of a reference number with a specification and a reference number corresponding to the reference number with the specification in the specification of the patent, and generating description attribute set information of the reference number corresponding to the description of the reference number; and (E3) using the reference numerals including the drawings, the reference numbers including the specifications, and the descriptions of the reference numbers, and the description of the reference numbers used for the description of the reference numbers to be placed at a preset position of the reference numbers including the drawings. It is preferable to include; generating data.

상기 컴퓨터 장치가 상기 (A) 단계 이전에 (A0) 상기 도면이 2 이상의 도면 번호가 다른 복합 도면인 경우, 상기 복합 도면을 전처리하는 단계;를 더 포함하며, 상기 (A0) 단계는 (A01) 상기 도면에서 도면 번호의 개수를 식별하는 단계; 및 (A02) 상기 도면 번호의 개수가 2 이상인 경우, 상기 도면을 도면 번호의 개수만큼 절단하여 독립 도면 데이터를 생성하는 단계;를 더 포함하는 것이 바람직하다.The computer device further includes (A0) pre-processing the composite drawing when the drawing is a composite drawing having two or more different reference numbers before step (A), wherein step (A0) includes (A01) identifying the number of reference numbers in the drawing; and (A02) when the number of the reference numbers is two or more, generating independent drawing data by cutting the drawings by the number of reference numbers.

(F) 상기 컴퓨터 장치가 가공 도면 데이터를 생성하거나 도면 연동 데이터를 생성하는 단계;를 더 포함하며, 상기 (F) 단계는 상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 물리적으로 삽입되어 있는 가공 도면 파일을 생성하는 제1 가공 도면 데이터 생성 방법, 상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면과 도면 부호의 설명 배치 데이터가 논리적으로 다른 레이어에 존재하도록 하는 1개의 가공 도면 파일을 생성하는 제2 가공 도면 데이터 생성 방법, 상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면 파일과 도면 부호의 설명 배치 데이터가 포함된 파일은 물리적으로 다른 파일이며, 상기 도면 파일이 호출될 때, 상기 도면 파일과 상기 도면 부호의 설명 배치 데이터가 포함된 파일이 연동되어 실시간 결합이 지원되도록 상기 도면 파일을 가공하는 제3 가공 도면 데이터 생성 방법 및 상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면 파일과 도면 부호의 설명 배치 데이터가 포함된 파일은 물리적으로 다른 파일이며, 상기 도면 파일이 호출될 때, 상기 도면 파일과 상기 도면 부호의 설명 배치 데이터가 포함된 파일이 연동되는 실시간 결합을 지원하는 도면 연동 데이터를 생성하는 방법 중 어느 하나 이상을 실시하는 것인 것이 바람직하다.(F) generating, by the computer device, processing drawing data or generating drawing linkage data; wherein the step (F) is a drawing including a drawing on the drawing by using the descriptive arrangement data of the reference numerals A first machining drawing data generation method for generating a machined drawing file in which descriptions of at least one reference number are physically inserted at a preset position of the reference number, including drawings on the drawing using the description arrangement data of the reference numbers Second machining drawing data generation that generates one machined drawing file so that descriptions of at least one reference number appear at a preset position of the reference number, but the drawing and the description arrangement data of the reference number exist in logically different layers Method, using the descriptive arrangement data of the reference numerals so that the description of at least one reference number appears at a preset position of the reference number including the drawing on the drawing, wherein the drawing file and the descriptive arrangement data of the reference number are included The file is a physically different file, and when the drawing file is called, the drawing file and the file including the description and arrangement data of the reference numerals are interlocked to support real-time coupling of the drawing file. Third processed drawing data for processing the drawing file Using the generation method and the descriptive arrangement data of the reference numbers, the description of at least one reference number appears at a preset position of the reference number including the drawing on the drawing, and the drawing file and the description arrangement data of the reference number are included The file is a physically different file, and when the drawing file is called, any one of methods for generating drawing interworking data supporting real-time coupling in which the drawing file and the file including the description and arrangement data of the reference numerals are interlocked It is preferable to implement the above.

본 발명이 이루고자 하는 다른 기술적 과제를 달성하기 위하여,In order to achieve another technical task to be achieved by the present invention,

특허 도면에 포함되어 있는 도면 부호에 도면 부호의 설명이 표시되는데 사용되는 도면 부호의 설명 표시 도면 콘텐츠가 제공되도록 처리하는 방법을 처리하는 컴퓨터 장치에 있어서,A computer device for processing a method of processing to provide a description display drawing content of a reference number used to indicate a description of a reference number in a reference number included in a patent drawing, the method comprising:

상기 컴퓨터 장치가 적어도 하나 이상의 타 장치로부터 개별 도면 단위, 개별 특허 단위 또는 기설정된 단위로 도면 부호의 설명 표시 도면 콘텐츠 요청 정보를 수신하는 단계; 상기 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하는 도면 부호의 설명 표시 도면 콘텐츠를 입수하는 단계; 상기 수신된 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하여 도면 부호의 설명 표시 도면 콘텐츠를 상기 타 장치로 전송하는 단계;를 포함하며,receiving, by the computer device, drawing content request information indicating a reference number in an individual drawing unit, an individual patent unit, or a preset unit from at least one or more other devices; obtaining the descriptive-indicating drawing content of the reference-sign corresponding to the descriptive-indicating drawing content request information; and transmitting, to the other device, the content of the drawing with the description of the reference numeral in response to the received request information for the description of the reference drawing.

상기 도면 부호의 설명 표시 도면 콘텐츠는 상기 컴퓨터 장치가(A) (A1) 특허 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고, (A2) 상기 인식된 도면 포함 도면 부호에 대응하는 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계를 수행하는 프로세스; (B) 상기 컴퓨터 장치가 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 인식하는 단계를 수행하는 프로세스; 및 상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계를 수행하는 프로세스를 포함하는 것을 특징으로 하는 장치를 제시한다.The description display drawing content of the reference number indicates that the computer device (A) (A1) recognizes the reference number included in the patent drawing, and (A2) the reference number corresponding to the recognized reference number includes the reference number. a process for performing the step of generating attribute set information; (B) a process for the computer device to perform a step of recognizing, in the specification of the patent, a reference numeral with a specification and a description of a reference number corresponding to the reference numeral with the specification; and using the reference number including the drawing, the reference number including the specification, and the description of the reference number, and generating the description arrangement data of the reference number used for the description of the reference number to be disposed at a preset position of the reference number including the drawing An apparatus is provided, comprising a process for performing the steps of:

(D) 상기 도면 부호의 설명 배치 데이터를 사용하여 적어도 하나 이상의 레이어를 포함하는 도면 부호의 설명 레이어 데이터를 생성하는 단계를 수행하는 프로세스;더 포함하는 것이 바람직하다.(D) a process of performing the step of generating descriptive layer data of reference numerals including at least one or more layers by using the descriptive arrangement data of the reference numerals; it is preferable to further include.

(E) 도면 번호에 대응되는 도면 부호의 설명 배치 데이터를 생성하는 단계를 수행하는 프로세스; 및 (A0) 상기 도면이 2 이상의 도면 번호가 다른 복합 도면인 경우, 상기 복합 도면을 전처리하는 단계를 수행하는 프로세스; 중 어느 하나 이상을 더 포함하는 것이 바람직하다.(E) a process of performing the step of generating descriptive arrangement data of reference numbers corresponding to reference numbers; and (A0) if the drawing is a composite drawing having two or more different reference numbers, the process of performing pre-processing of the composite drawing; It is preferable to further include any one or more.

(F) 상기 컴퓨터 장치가 가공 도면 데이터를 생성하는 단계를 수행하는 프로세서;를 더 포함하는 것이 바람직하다.(F) a processor for performing the step of generating the processing drawing data by the computer device; it is preferable to further include.

본 발명을 활용하면 다음과 같은 효과가 있다.Utilizing the present invention has the following effects.

첫째, 도면에 나타나 있는 도면 부호의 주변에 도면 부호의 설명이 배치되어 있어, 도면 포함 도면 부호가 지칭하는 바를 명확하고 빠르게 인지할 수 있다. 이에 따라, 도면의 가독성이 좋아질 뿐만 아니라, 도면을 통해서 특허의 기술 사상을 이해하는 속도와 정확성이 높아지게 된다.First, descriptions of reference numerals are arranged around the reference numerals shown in the drawings, so that it is possible to clearly and quickly recognize what the reference numerals including the drawings refer to. Accordingly, not only the readability of the drawing is improved, but also the speed and accuracy of understanding the technical idea of the patent through the drawing is increased.

둘째, 도면의 도면 포함 도면 부호에 대한 속성 정보와 도면 부호의 설명 속성 정보를 분리하여 관리하는 경우, 도면 포함 도면 부호에 도면 부호의 설명을 맵핑하는 정확도를 체계적으로 향상시킬 수 있다. Second, when attribute information on reference numbers including drawings in drawings and description attribute information of reference signs are managed separately, the accuracy of mapping descriptions of reference numbers to reference numbers with drawings can be systematically improved.

셋째, 도면 부호의 설명에 칼라나 크기 등과 같은 도면 부호의 설명 속성을 부여하는 등과 같이 도면을 통한 기술 파악의 속도와 체계성의 향상을 위한 다양한 부가 서비스를 결합할 수 있게 된다.Third, it is possible to combine various additional services for improving the speed and systematization of technology identification through drawings, such as assigning descriptive attributes of reference numbers, such as color or size, to descriptions of reference numbers.

넷째, 도면 포함 도면 부호에 맵핑되는 도면 부호의 설명을 오리지널 언어가 아닌 다른 언어로 처리하는 경우, 도면의 도면 포함 도면 부호가 지칭하는 대상을 사용자가 원하는 언어로 파악할 수 있게 된다.Fourth, when the description of the reference numerals mapped to the reference numerals including the drawings is processed in a language other than the original language, it is possible to grasp the object indicated by the reference numerals including the drawings in the language desired by the user.

다섯째, 특허 명세서를 기계 번역할 경우, 도면의 도면 포함 도면 부호가 지칭하는 대상도 기계 번역하여 도면 포함 도면 부호 주위에 기계 번역된 도면 부호의 설명을 배치할 수 있게 된다.Fifth, when the patent specification is machine-translated, the machine-translated object is also machine-translated by the reference numerals including the drawings, so that the descriptions of the machine-translated reference numbers can be arranged around the reference numerals including the drawings.

도 1은 본 발명의 컴퓨터 장치에 대한 일 실시예적 구현예이다.
도 2는 본 발명의 컴퓨터 장치의 파일 저장부에 대한 일 실시예적 구현예이다.
도 3은 본 발명의 컴퓨터 장치의 DB부에 대한 일 실시예적 구현예이다.
도 4는 본 발명의 컴퓨터 장치의 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 5는 본 발명의 컴퓨터 장치의 도면 포함 도면 부호의 인식 프로세스에 대한 일 실시예적 구현예이다.
도 6은 본 발명의 컴퓨터 장치의 숫자 포함 문자열 인식 프로세스에 대한 일 실시예적 구현예이다.
도 7은 본 발명의 컴퓨터 장치의 도면 포함 도면 부호의 명세서 포함 도면 부호 조회 프로세스에 대한 일 실시예적 구현예이다.
도 8은 본 발명의 컴퓨터 장치의 도면 포함 도면 부호의 속성 정보 생성 프로세스에 대한 일 실시예적 구현예이다.
도 9는 본 발명의 컴퓨터 장치의 명세서 포함 도면 부호 및 도면 부호의 설명 정보의 생성 프로세스에 대한 일 실시예적 구현예이다.
도 10은 본 발명의 컴퓨터 장치의 도면 부호의 설명 결정 프로세스에 대한 일 실시예적 구현예이다.
도 11은 본 발명의 컴퓨터 장치의 도면 포함 도면 부호와 상기 도면 부호의 설명의 맵핑 데이터 생성 전 명세서 포함 도면 부호와 도면 부호의 설명의 맵핑 프로세스에 대한 일 실시예적 구현예이다.
도 12는 본 발명의 컴퓨터 장치의 명세서 포함 도면 부호를 매개로 도면 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n) 생성 프로세스에 대한 일 실시예적 구현예이다.
도 13은 본 발명의 컴퓨터 장치의 도면 부호의 설명 배치 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 14는 본 발명의 컴퓨터 장치의 도면 부호의 설명 배치 프로세스에 대한 일 실시예적 구현예이다.
도 15는 본 발명의 컴퓨터 장치의 다른 도면 부호의 설명 배치 프로세스에 대한 일 실시예적 구현예이다.
도 16은 본 발명의 컴퓨터 장치의 근접 도면 포함 도면 부호 클러스터 발굴 프로세스에 대한 일 실시예적 구현예이다.
도 17은 본 발명의 컴퓨터 장치의 도면 내 여백 공간의 위치 정보를 생성 프로세스에 대한 일 실시예적 구현예이다.
도 18은 본 발명의 컴퓨터 장치의 도면 부호의 설명 레이어 처리 프로세스에 대한 일 실시예적 구현예이다.
도 19는 본 발명의 컴퓨터 장치의 도면 부호의 설명 배치 데이터를 생성 프로세스에 대한 일 실시예적 구현예이다.
도 20은 본 발명의 컴퓨터 장치의 복합 도면을 전처리 프로세스에 대한 일 실시예적 구현예이다.
도 21은 본 발명의 컴퓨터 장치의 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 22는 본 발명의 컴퓨터 장치의 다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 23은 본 발명의 컴퓨터 장치의 또다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 24는 본 발명의 컴퓨터 장치의 또다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.
도 25는 본 발명 사상 적용 전의 도면에 대한 예시이다.
도 26은 본 발명 사상 적용 후의 사용자가 체감할 수 있는 도면에 대한 예시이다.
도 27은 본 발명 사상이 적용된 도면 부호의 설명 레이어에 대한 예시이다.
도 28은 도면 부호의 설명 레이어에 오리지널 도면 부호의 설명이 아닌 번역된 도면 부호의 설명이 나타나는 일 예시이다.
도 29는 번역된 도면 부호의 설명이 적용된 사용자가 체감할 수 있는 도면에 대한 예시이다.
도 30은 본 발명 사상 적용 전의 도면에 대한 다른 예시이다.
도 31은 본 발명 사상 적용 후의 사용자가 체감할 수 있는 도면에 대한 다른 예시이다.
도 32은 본 발명 사상이 적용된 도면 부호의 설명 레이어에 대한 다른 예시이다.
도 33는 도면 부호의 설명 레이어에 오리지널 도면 부호의 설명이 아닌 번역된 도면 부호의 설명이 나타나는 다른 예시이다.
도 34는 번역된 도면 부호의 설명이 적용된 사용자가 체감할 수 있는 도면에 대한 다른 예시이다.
1 is an exemplary embodiment of a computer device of the present invention.
2 is an exemplary embodiment of the file storage unit of the computer device of the present invention.
3 is an exemplary embodiment of the DB unit of the computer device of the present invention.
4 is an exemplary embodiment of the processing drawing data generating process of the computer device of the present invention.
5 is an exemplary implementation of a process for recognizing reference numerals inclusive of figures in a computer device of the present invention;
6 is an exemplary implementation of a process for recognizing a character string including numbers in a computer device of the present invention.
Fig. 7 is an exemplary implementation of the reference numeral inquiry process with reference numerals of reference numerals in the computer device of the present invention.
Fig. 8 is an exemplary embodiment of a process for generating attribute information of reference numerals including drawings of a computer device according to the present invention.
Fig. 9 is an exemplary implementation of a process for generating specification-included reference numerals and descriptive information of a computer device of the present invention;
Fig. 10 is an exemplary implementation of a process for determining a description of a reference numeral of a computer device of the present invention;
11 is an exemplary embodiment of a mapping process of reference numerals with drawings and descriptions of reference numbers before generation of mapping data of reference numbers with drawings and descriptions of the reference numbers of the computer device of the present invention;
12 is an exemplary embodiment of a process for generating mapping data (1:1 or 1:n) for reference numerals with drawings and descriptions of reference numerals via reference numerals with specifications of the computer device of the present invention.
Fig. 13 is an exemplary implementation of the process for generating descriptive batch data of reference numerals of a computer device of the present invention;
Fig. 14 is one embodiment implementation of the description arrangement process of the reference numerals of the computer device of the present invention.
Fig. 15 is one embodiment implementation of the description arrangement process of another reference numeral of the computer device of the present invention.
16 is an exemplary implementation of a process for excavating reference clusters with a close-up view of a computer device of the present invention;
17 is an exemplary implementation of a process for generating position information of a blank space in a drawing of a computer device of the present invention;
Fig. 18 is an exemplary implementation of a process for processing a descriptive layer of a reference numeral of a computer device of the present invention;
19 is an exemplary implementation of the process of generating descriptive batch data of reference numerals of a computer device of the present invention;
20 is an exemplary embodiment of a process for preprocessing a composite diagram of a computer device of the present invention;
21 is an exemplary embodiment of the processing drawing data generating process of the computer device of the present invention.
22 is an exemplary embodiment of another processing drawing data generating process of the computer device of the present invention.
23 is an exemplary embodiment of another processing drawing data generating process of the computer device of the present invention.
Fig. 24 is an exemplary embodiment of another processing drawing data generating process of the computer device of the present invention.
25 is an illustration of the drawing before application of the inventive concept.
26 is an example of a drawing that a user can feel after applying the spirit of the present invention.
27 is an example of a description layer of a reference numeral to which the spirit of the present invention is applied.
28 is an example in which descriptions of translated reference numbers instead of descriptions of original reference numerals appear in the description layer of reference numbers.
29 is an example of a drawing that a user can experience to which explanations of translated reference numerals are applied.
30 is another example of the drawing before application of the inventive concept.
31 is another example of a drawing that a user may feel after applying the spirit of the present invention.
32 is another example of a description layer of a reference numeral to which the spirit of the present invention is applied.
33 is another example in which descriptions of translated reference numbers instead of descriptions of original reference numerals appear in the description layer of reference numbers.
34 is another example of a drawing that a user can experience to which explanations of translated reference numerals are applied.

후술하는 본 발명에 대한 상세한 설명은, 본 발명의 목적들, 기술적 해법들 및 장점들을 분명하게 하기 위하여 본 발명이 실시될 수 있는 특정 실시예를 예시로서 도시하는 첨부 도면을 참조한다. 이들 실시예는 통상의 기술자가 본 발명을 실시할 수 있기에 충분하도록 상세히 설명된다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The following detailed description of the present invention refers to the accompanying drawings, which show by way of illustration a specific embodiment in which the present invention may be practiced, in order to clarify the objects, technical solutions and advantages of the present invention. These embodiments are described in sufficient detail to enable those skilled in the art to practice the present invention.

본 명세서에서 OCR 등의 기술을 적용할 때, 딥러닝 등과 같은 머신 러닝 기반의 모델링이 포함될 수 있다. 이때, '모델링'또는 '모델 생성'은 절차에 따라 머신 러닝(machine running)을 수행함을 일컫는 용어인 바, 인간의 교육 활동과 같은 정신적 작용을 지칭하도록 의도된 것이 아님을 통상의 기술자는 잘 이해할 수 있을 것이다.When applying a technology such as OCR in the present specification, machine learning-based modeling such as deep learning may be included. At this time, a person skilled in the art will understand that 'modeling' or 'model creation' is a term referring to performing machine running according to a procedure, and is not intended to refer to a mental operation such as human educational activity. will be able

또한, 본 발명의 상세한 설명 및 청구항들에 걸쳐, '포함하다'라는 단어 및 그것의 변형은 다른 기술적 특징들, 부가물들, 구성요소들 또는 단계들을 제외하는 것으로 의도된 것이 아니다. 통상의 기술자에게 본 발명의 다른 목적들, 장점들 및 특성들이 일부는 본 설명서로부터, 그리고 일부는 본 발명의 실시로부터 드러날 것이다. 아래의 예시 및 도면은 실례로서 제공되며, 본 발명을 한정하는 것으로 의도된 것이 아니다.Also, throughout this description and claims, the word 'comprise' and variations thereof are not intended to exclude other technical features, additions, components or steps. Other objects, advantages and characteristics of the present invention will become apparent to a person skilled in the art in part from this description and in part from practice of the present invention. The following illustrations and drawings are provided by way of illustration and are not intended to limit the invention.

더욱이 본 발명은 본 명세서에 표시된 실시예들의 모든 가능한 조합들을 망라한다. 본 발명의 다양한 실시예는 서로 다르지만 상호 배타적일 필요는 없음이 이해되어야 한다. 예를 들어, 여기에 기재되어 있는 특정 형상, 구조 및 특성은 일 실시예에 관련하여 본 발명의 정신 및 범위를 벗어나지 않으면서 다른 실시예로 구현될 수 있다. 또한, 각각의 개시된 실시예 내의 개별 구성요소의 위치 또는 배치는 본 발명의 정신 및 범위를 벗어나지 않으면서 변경될 수 있음이 이해되어야 한다. 따라서, 후술하는 상세한 설명은 한정적인 의미로서 취하려는 것이 아니며, 본 발명의 범위는, 적절하게 설명된다면, 그 청구항들이 주장하는 것과 균등한 모든 범위와 더불어 첨부된 청구항에 의해서만 한정된다. 도면에서 유사한 참조 부호는 여러 측면에 걸쳐서 동일하거나 유사한 기능을 지칭한다.Moreover, the invention encompasses all possible combinations of the embodiments indicated herein. It should be understood that the various embodiments of the present invention are different but need not be mutually exclusive. For example, certain shapes, structures, and characteristics described herein with respect to one embodiment may be implemented in other embodiments without departing from the spirit and scope of the invention. In addition, it should be understood that the location or arrangement of individual components within each disclosed embodiment may be changed without departing from the spirit and scope of the present invention. Accordingly, the detailed description set forth below is not intended to be taken in a limiting sense, and the scope of the present invention, if properly described, is limited only by the appended claims, along with all scope equivalents to those claimed. Like reference numerals in the drawings refer to the same or similar functions throughout the various aspects.

본 명세서에서 달리 표시되거나 분명히 문맥에 모순되지 않는 한, 단수로 지칭된 항목은, 그 문맥에서 달리 요구되지 않는 한, 복수의 것을 아우른다. 이하, 통상의 기술자가 본 발명을 용이하게 실시할 수 있도록 하기 위하여, 본 발명의 바람직한 실시예들에 관하여 첨부된 도면을 참조하여 상세히 설명하기로 한다.Unless otherwise indicated herein or otherwise clearly contradicted by context, items referred to in the singular encompass the plural unless the context requires otherwise. Hereinafter, in order to enable those skilled in the art to easily practice the present invention, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings.

본 명세서에서 “특허”의 개념은 광의의 개념으로서, 특정 국가의 특허 뿐만 아니라, 각 국가의 특허의 모든 특허를 포함하는 개념이며, 개별 특허 또는 전세계의 공개/등록된 특허에 포함된 서지 정보, 가공 서지 정보, 명세서에 포함된 정보, 도면 정보 또는 이 정보의 가공 정보를 포함하는 것으로 이해되어야 한다.In this specification, the concept of "patent" is a broad concept, and includes not only a specific country's patent, but also all patents of each country's patents, and includes bibliographic information included in individual patents or published/registered patents around the world; It should be understood to include processing bibliographic information, information contained in the specification, drawing information, or processing information of this information.

본 발명의 컴퓨팅 장치(1000)는 전형적으로 컴퓨터 하드웨어(예컨대, 컴퓨터 프로세서(1100)(1100), 메모리, 스토리지, 입력 장치 및 출력 장치, 기타 기존의 컴퓨터 시스템의 구성요소들을 포함할 수 있는 클라이언트 컴퓨터 및 서버 컴퓨터; 전자 통신선, 라우터, 스위치 등등과 같은 전자 통신 장치; 네트워크 부착 스토리지(NAS) 및 스토리지 영역 네트워크(SAN)와 같은 전자 정보 스토리지 시스템)와 컴퓨터 소프트웨어(즉, 컴퓨터 하드웨어로 하여금 특정의 방식으로 기능하게 하는 인스트럭션들)의 조합을 활용하여 원하는 시스템 성능을 달성한다.The computing device 1000 of the present invention is typically a client computer, which may include computer hardware (eg, computer processors 1100 and 1100 , memory, storage, input and output devices, and other components of conventional computer systems). and server computers; electronic communication devices such as telecommunication lines, routers, switches, etc.; electronic information storage systems such as network attached storage (NAS) and storage area networks (SANs)) and computer software (i.e., computer hardware that cause computer hardware to operate in a specific manner. ) to achieve the desired system performance.

이하, 도면을 참조하면서 더욱 더 상세하게 설명한다.Hereinafter, it will be described in more detail with reference to the drawings.

도 1은 본 발명의 컴퓨터 장치(1000)에 대한 일 실시예적 구현예이다.1 is an exemplary embodiment of a computer device 1000 of the present invention.

상기 컴퓨터 장치(1000)는 프로세서(1100), 파일 저장부(1200), DB부(1300)를 포함하고 있으며, 선택적으로 통신부(1400) 및 유무선 네트워크(3000)를 더 포함하고 있을 수 있다. 상기 컴퓨터 장치(1000)는 상기 유무선 네트워크(3000)를 통하여 적어도 하나 이상의 타 장치(2000)와 통신하면서 데이터를 입수하거나 전송할 수 있다. 상기 타 장치(2000)(2000)의 예는 상기 컴퓨팅 장치(1000)를 사용하는 사용자의 컴퓨터(개인용 컴퓨터 또는 서버 또는 기타 장치(2000))나, 상기 컴퓨팅 장치(1000)에 데이터를 제공해 주거나 데이터를 받는 서버나 장치일 수 있다.The computer device 1000 includes a processor 1100 , a file storage unit 1200 , and a DB unit 1300 , and may optionally further include a communication unit 1400 and a wired/wireless network 3000 . The computer device 1000 may acquire or transmit data while communicating with at least one or more other devices 2000 through the wired/wireless network 3000 . Examples of the other devices 2000 and 2000 include a computer (a personal computer or server or other device 2000 ) of a user who uses the computing device 1000 , or provides data to the computing device 1000 , or provides data It can be a server or device that receives

상기 컴퓨팅 장치(1000)는 본 발명의 방법에 따라 데이터를 처리한다. 아래에서 상술되는 바와 같이 본 발명의 방법이 컴퓨터 하드웨어 및 소프트웨어의 조합을 활용하여 구현될 것이라는 점은 통상의 기술자는 용이하게 이해할 것이다.The computing device 1000 processes data according to the method of the present invention. It will be readily understood by those skilled in the art that the method of the present invention will be implemented utilizing a combination of computer hardware and software as detailed below.

도 2는 본 발명의 컴퓨터 장치(1000)의 파일 저장부(1200)에 대한 일 실시예적 구현예이다.2 is an exemplary embodiment of the file storage unit 1200 of the computer device 1000 of the present invention.

상기 파일 저장부(1200)에는 도면 파일 저장부(1210)(1200) 및 명세서 파일 저장부(1220)(1200)가 있으며 상기 도면 파일 저장부(1210)(1200)에는 오리지널 도면 파일 저장부(1211)(1210)(1200)를 포함하며, 선택적으로 가공 도면 파일 저장부(1212)(1210)(1200)가 있을 수 있다. 특허 full text 데이터는 통상적으로 XML 등과 같은 마크업 언어로 된 명세서 파일을 포함하고 있으며, 도면이 있는 경우 하나 이상의 도면 파일로 구성되어 있다. 상기 도면 파일에는 개념적으로 분리된 2개의 도면(예, fig1 및 fig2)가 물리적으로 1개의 이미지 파일에 포함되어 있을 수 있다. 가공 도면 파일은 본 발명 사상에 따라 가공한 도면 파일이다. 가공 도면 파일에는 2가지 가공 도면이 포함될 수 있다. 첫째는 본 발명 사상을 적용하여, 오리지널 도면 파일에 포함되어 있는 도면 포함 도면 부호에 직접적으로 또는 간접적으로(연결 또는 연동 또는 결합 가능하게) 도면 부호의 설명 배치 데이터가 표시될 수 있도록 처리한 가공 도면 파일이다. 둘째는 1개의 물리적 도면에 개념적으로 분리 가능한 2개 이상의 도면이 포함되어 있을 경우, 그 도면을 물리적으로 분리하고, 본 발명 사상을 적용한 가공 도면 파일이다.The file storage unit 1200 includes drawing file storage units 1210 and 1200 and specification file storage units 1220 and 1200, and the drawing file storage unit 1210 and 1200 includes an original drawing file storage unit 1211. ) 1210 and 1200 , and optionally there may be processing drawing file storage units 1212 , 1210 , 1200 . Patent full text data typically includes a specification file in a markup language such as XML, and if there is a drawing, it is composed of one or more drawing files. In the drawing file, two conceptually separated drawings (eg, fig1 and fig2) may be physically included in one image file. The processed drawing file is a drawing file processed according to the spirit of the present invention. The machining drawing file may include two machining drawings. First, by applying the idea of the present invention, a processing drawing processed so that the explanatory and arrangement data of the reference numbers can be displayed directly or indirectly (connection, interlocking, or combination possible) on the reference numbers included in the original drawing file It is a file. Second, when two or more conceptually separable drawings are included in one physical drawing, the drawings are physically separated and a processed drawing file to which the idea of the present invention is applied.

도 3은 본 발명의 컴퓨터 장치(1000)의 DB부(1300)에 대한 일 실시예적 구현예이다.3 is an exemplary embodiment of the DB unit 1300 of the computer device 1000 of the present invention.

상기 DB부(1300)에는 도면 기반 데이터부(1310), 명세서 기반 데이터부(1320), 도면 부호의 설명 배치 데이터 데이터부(1330)를 포함하고 있으며, 선택적으로 가공 규칙 데이터부(1340) 또는 집계 데이터부(1350)를 더 포함하고 있을 수 있다. 상기 도면 기반 데이터부(1310)는 개별 특허의 개별 도면 파일별로 도면에서 추출한 데이터를 포함하고 있다. 상기 도면 기반 데이터부(1310)에는 도면 포함 도면 부호 및 도면 포함 도면 부호별 도면 포함 도면 부호의 속성 정보가 저장되어 있다. 상기 명세서 기반 데이터부(1320)에는 명세서 포함 도면 부호, 도면 부호의 설명, 도면 부호의 설명 속성 데이터 등이 포함되어 있다. 상기 도면 부호의 설명 배치 데이터부에는 상기 도면 포함 도면 부호에 대응되는 상기 도면 부호의 설명을 배치하기 위한 배치 방법 데이터가 포함되어 있다.The DB unit 1300 includes a drawing-based data unit 1310, a specification-based data unit 1320, and an explanation arrangement data data unit 1330 of reference numerals, and optionally a processing rule data unit 1340 or aggregation. It may further include a data unit 1350 . The drawing-based data unit 1310 includes data extracted from drawings for each individual drawing file of an individual patent. The drawing-based data unit 1310 stores reference numbers including drawings and attribute information of reference numbers including drawings for each reference number. The specification-based data unit 1320 includes specification-included reference numerals, descriptions of reference numerals, description attribute data of reference numerals, and the like. The description arrangement data part of the reference number includes arrangement method data for arranging the description of the reference number corresponding to the reference number including the drawing.

도 4는 본 발명의 컴퓨터 장치(1000)의 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.4 is an exemplary embodiment of the processing drawing data generation process of the computer device 1000 of the present invention.

도 4에서 예시되듯이 상기 컴퓨터 장치(1000)는 입력된 도면에서 도면 포함 도면 부호의 인식 및 도면 포함 도면 부호 집합 데이터를 생성(S11)하고, 입력된 특허 명세서에서 명세서 포함 도면 부호 및 도면 부호의 설명을 인식(S12)하고, 도면 부호의 설명 배치 데이터 생성(S13)하고, 가공 도면 데이터 생성(S14)하는 방식으로 프로세싱 한다.As illustrated in FIG. 4 , the computer device 1000 recognizes reference numerals including drawings in the input drawing and generates reference reference set data including drawings (S11), The description is recognized (S12), the description arrangement data of the reference numerals is generated (S13), and the processing drawing data is generated (S14).

먼저, 도 5를 참조하면서 본 발명의 컴퓨터 장치(1000)의 도면 포함 도면 부호의 인식 프로세스를 설명한다. 도 5에서 예시되듯이 상기 컴퓨터 장치(1000)는 광학 문자 인식 처리를 통하여 적어도 하나 이상의 문자열 인식 정보를 생성(S21)하고, 문자열을 처리하여 상기 도면 포함 도면 부호를 결정(S22)하고, 도면 포함 도면 부호에 대하여 도면 포함 도면 부호의 속성 정보를 생성(S23)하는 방식으로 프로세싱 한다. 광학 문자 인식(optical character recognition)은 이미지 데이터에서 숫자를 포함한 문자를 인식한다. OCR 자체에 대한 상세한 기법은 당업자에게 당연한 것(OCR에 대한 서적, 논문 및 공개/상용 소프트웨어 등이 다량으로 나와 있음)으로 본 발명의 설명에서는 상세한 설명을 생략한다. 다만, 본 발명에서는 통상적인 OCR을 통해서는 도면에 포함된 문자열을 인식하는 경우, 다음과 같은 3가지 문제점이 발생한다.First, a process for recognizing reference numerals including drawings of the computer device 1000 of the present invention will be described with reference to FIG. 5 . As illustrated in FIG. 5 , the computer device 1000 generates at least one or more character string recognition information through optical character recognition processing (S21), processes the character string to determine the reference number including the drawing (S22), and includes the drawing Processing is performed in a manner of generating (S23) attribute information of reference numerals including drawings with respect to reference numerals. Optical character recognition recognizes characters including numbers in image data. Detailed techniques for OCR itself are natural to those skilled in the art (books, papers, and public/commercial software on OCR are presented in large quantities), and detailed descriptions are omitted from the description of the present invention. However, in the present invention, when a character string included in a drawing is recognized through conventional OCR, the following three problems occur.

첫째, 인식된 문자열 중에는 도면 포함 도면 부호인 것도 있을 수 있지만, 도면 포함 도면 부호가 아닌 것도 다수 있을 수 있다. 대표적인 예가, 프로세스 다이어그램의 박스에 있는 문자열 내용이다. 이들은 문자열로 되어 있지만, 도면 포함 도면 부호가 아니다. 따라서, 인식된 문자열 중에서 도면 포함 도면 부호인 것과 도면 포함 도면 부호가 아닌 것을 구분해 내는 것이 핵심적인 문제가 된다.First, some of the recognized character strings may be reference numerals including drawings, but there may be many others that are not reference numbers including drawings. A typical example is the content of a string in a box in a process diagram. Although these are character strings, they are not reference numerals with drawings. Therefore, it is a key problem to distinguish between a reference number including a drawing and a reference number not including a drawing among the recognized character strings.

둘째, 도면을 구성하는 다양한 선이나 형상 등은 크거나 작은 블록 단위로 부분 부분 떼어 놓고 보면 숫자나 문자처럼 보이는 것이 많다. OCR은 이미지를 스캔하면서 스캔 되는 블록이 문자나 숫자가 되는 가를 판단하는 방식을 취하는 경우가 많다. 이때, 세로 선 등을 대문자 "I"나 소문자 "L"로 인식하는 경우가 많으며, 세로로 내려 오다 왼쪽으로 휘어지는 선을 "J"로, 좌우로 굽어지는 선을 "S" 등으로 인식하는 경우도 많다. 실제로 도면 부호가 아닌데, 부분 부분의 생긴 형태 때문에 문자로 오 인식 하는 경우는 도면을 구성하는 이미지 뿐만 아니라, 도면의 각 부분과 도면 부호의 설명을 이어주는 선에서도 많이 발생한다.Second, the various lines or shapes that make up the drawings often look like numbers or letters when you separate them in large or small block units. OCR often takes a method of determining whether the scanned block is a letter or number while scanning the image. In this case, vertical lines are often recognized as uppercase letters "I" or lowercase letters "L", and lines that bend to the left after descending vertically are recognized as "J", and lines that bend left and right are recognized as "S", etc. also many Although it is not actually a reference number, the case of misrecognition as a character due to the shape of the partial part occurs not only in the image constituting the drawing, but also in the line connecting each part of the drawing and the description of the reference number.

이와 같이 통상적인 OCR 기술을 그대로 특허 도면에 적용하는 경우, 엄청나게 많은 오인식이 발생하게 된다. 본 발명 사상은 이러한 문제를 체계적으로 해결하는 기술 사상을 포함하고 있다.In this way, when the conventional OCR technology is applied to the patent drawings as it is, a huge number of misrecognitions occur. The idea of the present invention includes a technical idea for systematically solving these problems.

물론, 광학 문자 인식을 수행할 때, 특허 도면에 빈번하기 나타나는 숫자, 문자 및 기호에 대한 인식율을 높이기 위해 머신 러닝을 사용할 수 있다. 이를 위해서, 먼저 숫자, 문자 및 기호별로 다량의 데이터를 수집(예, 숫자 "2"로 인식되어야 할 숫자 "2"에 대응될 수 있는 부분 이미지들(도면 이미지에서 숫자 2에 해당하는 부분만 발췌하여 별도의 이미지 파일로 저장하는 방식으로 생성 및 수집됨))한다. 이어, 수집 데이터를 훈련용 데이터(training set)와 테스트 데이터(test set)으로 나누고(경우에 따라서는 검증용 데이터(validation set)를 별도로 준비할 수 있음), CNN(convolution neural network) 등과 같은 딥러닝 알고리즘 또는 기타 머신 러닝 알고리즘을 적용하여 학습을 진행시켜 특허 도면에 나타나는 도면 부호의 인식에 특화된 이미지 인식 알고리즘(모델)을 생성한다. 이어, 생성된 이미지 인식 알고리즘을 광학 문자 인식 루틴에 포함시킨다. 광학 문자 인식 과정에서, 특정한 이미지 블록이 문자 또는 숫자인지와 어떤 문자 또는 숫자인지를 결정하는데, 도면 부호의 인식에 특화된 이미지 인식 알고리즘(모델)이 사용될 수 있다. 도면 부호의 인식에 특화된 이미지 인식 알고리즘(모델)을 통하여, 통상적인 광학 문자 인식 알고리즘보다 더 정확하고 합목적적인 도면 부호의 인식이 가능하게 된다.Of course, when performing optical character recognition, machine learning can be used to increase the recognition rate for numbers, letters, and symbols that frequently appear in patent drawings. To this end, first, a large amount of data is collected for each number, letter, and symbol (eg, partial images that can correspond to the number “2” to be recognized as the number “2” (only the part corresponding to the number 2 in the drawing image is extracted) to be created and collected in a way that is saved as a separate image file)). Then, the collected data is divided into a training set and a test set (in some cases, a validation set can be prepared separately), and deep processing such as a convolution neural network (CNN), etc. By applying a learning algorithm or other machine learning algorithm to advance learning, an image recognition algorithm (model) specialized for the recognition of reference signs appearing in patent drawings is generated. The generated image recognition algorithm is then incorporated into an optical character recognition routine. In the optical character recognition process, an image recognition algorithm (model) specialized for recognizing reference numerals may be used to determine whether a specific image block is a character or a number and which character or number it is. Through an image recognition algorithm (model) specialized in recognizing reference numerals, it is possible to recognize reference numbers more accurately and purposely than conventional optical character recognition algorithms.

도 6은 본 발명의 컴퓨터 장치(1000)의 숫자 포함 문자열 인식 프로세스에 대한 일 실시예적 구현예이다.6 is an exemplary embodiment of a process for recognizing a character string including numbers in the computer device 1000 of the present invention.

도 6에서 예시되듯이 상기 컴퓨터 장치(1000)는 문자열 블록에서 문자열 인식(S31)하고, (마름모)인식된 문자열에서 숫자가 포함되어 있는가(S32)하고, Yes인 경우 인식된 문자열 추출(S33)하고, No인 경우 인식된 문자열 버림(S38)하는 방식으로 프로세싱 한다. 상기 컴퓨터 장치(1000)는 (S33) 이후에는 선택적으로 숫자 포함 문자열의 분할(S34) 처리를 수행할 수 있다. 상기 컴퓨터 장치(1000)는 (S33) 또는 (S34) 이후에 분할된 숫자 포함 문자열이 도면 포함 도면 부호의 결정 패턴 규칙에 속하는가를 판단(S35)하고, Yes 일 경우 도면 포함 도면 부호의 결정 패턴 규칙에 부합하는 분할 문자열만 추출(S36)하고, No일 경우 숫자 포함 문자열 버림(S37)처리를 수행한다.As illustrated in FIG. 6 , the computer device 1000 recognizes a character string in the character string block (S31), (Rhombus) whether a number is included in the recognized character string (S32), and if yes, extracts the recognized character string (S33) and, in the case of No, the recognized character string is discarded (S38). After ( S33 ), the computer device 1000 may selectively perform division ( S34 ) of the character string including numbers. The computer device 1000 determines whether the character string including numbers divided after (S33) or (S34) belongs to the determination pattern rule of reference numerals including drawings (S35), and if yes, the determination pattern rules of reference numbers including drawings Extracts only the split character string that matches (S36), and if it is No, discards the character string including the number (S37).

상기 컴퓨터 장치(1000)는 특정 블록이 문자(문자 블록)일 경우, 문자 블록과 기 설정된 위치에 있는 다른 블록이 문자인 경우, 두 블록을 연결하는 처리를 수행한다. 문자 블록에서 인식되는 문자 방향으로 문자 블록에서 인식하는 문자의 크기를 고려한 기 설정된 거리 이내에 있는 문자 블록의 문자는 기 설정된 위치의 한 예가 될 수 있다. 문자와 문자 사이의 거리를 장평(character spacing)이라도 하는데, 통상적으로 1개 문자의 크기(예를 들면 띄어쓰기(space))보다는 훨씬 작다. 상기 컴퓨터 장치(1000)는 인식된 문자가 영어나 한국어 등 가로쓰기를 하는 문자인 경우, 문자의 방향이 통상적인 방향(예, 수평 방향으로 배향)이면, 오른쪽으로 기 설정된 위치 이내(예를 들면 장평 33~200%에 있는 글자)에 있는 문자는 연결하는 처리는 수행할 수 있다. 한편, 인식된 문자가 수직 방향으로 배향된 경우, 수직 방향에 있는 블록에 있는 문자를 대상으로 연결 처리를 수행한다. 상기와 같은 연결 처리를 수행하면 문자열 블록이 생성되게 된다. 상기 컴퓨터 장치(1000)는 문자 블록 간의 연결이 마무리 되면 문자열을 인식(S31)할 수 있게 된다. 상기 연결 처리에서 문자 뿐만 아니라 도면 부호에 빈번하게 등장하는 표식(예를 들면, "-" 또는 "_" 등)은 문자처럼 취급하여 처리한다.When a specific block is a character (character block), when the character block and another block at a preset position are characters, the computer device 1000 performs a process of linking the two blocks. A character of the character block within a preset distance in consideration of the size of the character recognized in the character block in the direction of the character recognized in the character block may be an example of the preset position. The distance between characters is also called character spacing, which is usually much smaller than the size of one character (eg, space). When the recognized character is a character written horizontally, such as English or Korean, if the direction of the character is in a normal direction (eg, oriented in a horizontal direction), within a preset position to the right (eg, Characters in length 33~200%) can be linked. On the other hand, when the recognized character is oriented in the vertical direction, the concatenation process is performed on the character in the block in the vertical direction. When the above concatenation processing is performed, a string block is created. When the connection between the character blocks is completed, the computer device 1000 can recognize the character string ( S31 ). In the above connection process, not only characters but also marks (eg, "-" or "_") frequently appearing in reference numerals are treated as characters.

이어, 문자열 인식 과정을 거친 문자열을 대상으로 도면 포함 도면 부호의 후보를 생성하는 정보 처리를 설명한다. 상기 컴퓨터 장치(1000)는 인식된 문자열에서 숫자가 포함되어 있는가를 판단(S32)하고, Yes인 경우, 인식된 문자열 추출(S33)하고 아닌 경우에는 인식된 문자열 버림(S38) 처리한다. 이때, 인식된 문자열이 긴 문자열(띄어쓰기가 포함되어 있는 경우 등)인 경우에는 그 문자열에서 숫자가 포함되어 있는 문자열을 분할(S34) 처리한다. 만약, 인식된 문자열에서 띄어쓰기가 포함되어 있지 않거나, 문자열 인식 단계나 문자열 추출 단계에서 인식 또는 추출의 단위가 단일 단어 표현인 경우에는 문자열을 분할(S34)하는 프로세스를 불필요할 수 있다. 단일 단어 표현이란 띄어쓰기가 없는 문자열로, 그 문자열은 숫자, 알파벳, 문자만으로 구성된 문자열이거나, 이러한 문자열과 "-" 또는 "_" 등과 같은 기 설정된 도면 포함 도면 부호 포함 기호를 포함하는 문자열을 말한다.Next, information processing for generating candidates for reference numerals including drawings for character strings that have undergone the character string recognition process will be described. The computer device 1000 determines whether a number is included in the recognized character string (S32), and if yes, extracts the recognized character string (S33), and discards the recognized character string (S38) if not. At this time, if the recognized character string is a long character string (such as when spaces are included), the character string including numbers in the character string is divided (S34). If a space is not included in the recognized character string, or when the unit of recognition or extraction is a single word expression in the character string recognition step or the character string extraction step, the process of dividing the character string ( S34 ) may be unnecessary. A single word expression is a character string without spaces, and the character string is a character string composed only of numbers, alphabets, and characters, or a character string including such character strings and symbols including preset drawings including "-" or "_".

바람직하게는 (S31) 단계에서 문자열의 인식 처리는 단일 단어 표현 단위로 처리하는 것이 좋다.Preferably, the character string recognition processing in step (S31) is preferably performed in a single word expression unit.

상기 컴퓨터 장치(1000)는 상기 숫자 포함 문자열 또는 단일 단어 표현이 도면 포함 도면 부호의 결정 패턴 규칙에 속하는 지를 조회(S35) 처리를 수행하고, Yes인 경우에는 도면 포함 도면 부호의 결정 패턴 규칙에 부합하는 분할 문자열만 추출(S36)하고, No인 경우에는 숫자 포함 문자열 버림(S37) 처리한다.The computer device 1000 performs inquiry (S35) processing whether the character string including numbers or the single word expression belongs to the determination pattern rule of reference numerals including drawings, and if yes, conforms to the determination pattern rules of reference numbers including drawings Extracts only the split character string to be used (S36), and in the case of No, the character string including the number is discarded (S37).

상기 도면 포함 도면 부호의 결정 패턴 규칙은 다음과 같은 규칙 중 적어도 하나 이상을 포함하고 있을 수 있다.The decision pattern rule of the reference numerals including the drawings may include at least one or more of the following rules.

첫째, 숫자가 포함되어 있지 않은 문자열은 도면 포함 도면 부호가 아니다.First, a character string that does not include a number is not a reference numeral with a drawing.

둘째, 문자열에 숫자와 문자가 함께 포함되어 있는 경우, 다음과 같은 하위 기준을 적용한다.Second, if the string contains both numbers and letters, the following sub-criteria are applied.

1) 문자로 시작하는 경우에는 시작하는 문자의 글자수는 숫자를 구성하는 글자수보다 작거나 같다.1) In case of starting with a letter, the number of letters of the starting letter is less than or equal to the number of letters constituting the number.

2) 문자로 끝나는 경우에는 끝나는 문자의 글자수는 숫자를 구성하는 글자수보다 작거나 같다.2) In the case of ending with a letter, the number of letters in the ending letter is less than or equal to the number of letters constituting the number.

셋째, 도면 포함 도면 부호 포함 기호는 문자열의 처음도 될 수 없고 마지막도 될 수 없다.Third, the symbol including the reference number including the drawing cannot be the beginning or the last of the character string.

넷째, 문자열의 전체 길이는 기 설정된 한계(예, 6~7 글자) 이내이다.Fourth, the total length of the character string is within a preset limit (eg, 6 to 7 characters).

다섯째, 도면 포함 도면 부호 포함 기호가 아닌 구두점이나 기호는 도면 포함 도면 부호 구성에서 제외된다.Fifth, punctuation marks or symbols that are not symbols with reference numerals with drawings are excluded from the composition of reference numbers with drawings.

도면 포함 도면 부호의 결정 패턴 규칙은 가공 규칙 데이터부(1340)에 저장될 수 있다.The decision pattern rule of reference numerals including drawings may be stored in the processing rule data unit 1340 .

한편, 특정한 도면에서 인식된 개별적인 문자를 사용하여 문자를 연결할 때, 연결하는 방식이나 정책 등에 따라, 여러 종류 이상의 도면 포함 도면 부호의 후보가 생성될 수 있게 된다. 예를 들면, 특정한 도면에서 "A12"라고 인식되는 문자열과 아주 가까운 곳에 "25"라는 문자열이 있을 수 있다. "A12"와 "25" 사이의 거리가 "A12" 내부를 구성하는 "A" ,"1", "2" 사이의 장평보다는 길지만, 문자 1개 이상보다는 가까울 때와 같이, 거리에서 모호성이 존재하는 경우가 빈번하게 존재한다. 이때, 도면 포함 도면 부호는 각각 "A12"와 "25"와 같이 2개일 수도 있지만, "A1225"일 수도 있다. 이와 같이 모호성이 존재하는 경우, 각 문자열을 어디까지 연결할 것인지가 문제시 된다. 본 발명 사상에서 명세서 포함 도면 부호를 문자열 인식 단계에서 우선적으로 사용하지 않는 한, 상기 컴퓨터 장치(1000)는 "A12"와 "25"라는 문자열 및 "A1225"도 도면 포함 도면 부호의 후보로 생성한다. 이 경우 "A12"와 "25"라는 문자열 및 "A1225" 각각에 대해서 위치나 폰트 크기 등과 같은 도면 포함 도면 부호의 속성 정보를 생성함을 물론일 것이다.On the other hand, when linking characters using individual characters recognized in a specific drawing, candidates for reference numerals including more than one type of drawing may be generated according to a connection method or policy. For example, there may be a character string "25" very close to a character string recognized as "A12" in a specific drawing. An ambiguity exists in the distance, such as when the distance between "A12" and "25" is longer than the lengths between "A" , "1", and "2" that make up the interior of "A12", but closer than one or more characters. There are often cases where At this time, the reference numerals including the drawings may be two, such as “A12” and “25”, respectively, but may also be “A1225”. When such ambiguity exists, how far to concatenate each string becomes a problem. In the spirit of the present invention, unless the reference numerals with the specification are preferentially used in the character string recognition step, the computer device 1000 also generates the character strings “A12” and “25” and “A1225” as candidates for the reference numerals with the drawings. . In this case, of course, attribute information of reference numerals including drawings, such as positions and font sizes, for each of the character strings "A12" and "25" and "A1225" will be generated.

상기 컴퓨터 장치(1000)는 상기 도면 포함 도면 부호의 결정 패턴 규칙을 통과하는 문자열을 도면 포함 도면 부호의 후보로 처리한다. 1개의 이미지에서는 n개의 도면 포함 도면 부호의 후보가 생성될 수 있고, 이들은 도면 포함 도면 부호의 후보 집합을 구성하게 된다.The computer device 1000 processes a character string that passes the decision pattern rule of reference numbers with drawings as candidates for reference numbers with drawings. In one image, n number of reference number candidates may be generated, and they constitute a candidate set of reference number including drawings.

한편, 도면 포함 도면 부호의 결정 패턴 규칙을 통과하는 문자열 중에서도 도면 포함 도면 부호가 아닌 경우가 상당히 많을 수 있다. 그 이유 중 일부는 다음과 같다.On the other hand, among the character strings that pass the decision pattern rule of reference numerals with drawings, there may be many cases that are not reference numbers with drawings. Some of the reasons are:

첫째, 도면에 있는 문장형, 구문형 문자열이다. 예를 들면, 프로세스 도면을 박스 내에 있는 다양한 문장이나 구문 등을 구성하는 각 단어 중에서 숫자가 포함되어 있는 많은 단어는 도면 포함 도면 부호의 결정 패턴 규칙을 통과한다. 예를 들어, "A380"이라는 문자열이 있을 때, 이 문자열이 보잉사의 비행기 기종을 표현한다고 하더라도, 도면 포함 도면 부호의 결정 패턴 규칙을 통과한다.First, it is a sentence-type and syntax-type character string in the drawing. For example, among each word constituting various sentences or phrases in a process drawing box, many words including numbers pass the decision pattern rule of reference numerals including drawings. For example, when there is a character string "A380", even if the character string represents an airplane model of Boeing Corporation, it passes the decision pattern rule of reference numerals with drawings.

둘째, 숫자나 문자로 오 인식된 이미지가 숫자나 문자와 연결되는 경우에도 도면 포함 도면 부호의 결정 패턴 규칙을 통과할 가능성이 높다. 도 27에서 예시되는 바와 같이, 1개의 도면에 도면 부호가 많이 있는 경우에는 도면 또한 복잡한 구성을 가지는 경우가 많다. 이 때, 도면에는 다수의 도면 포함 도면 부호가 이미지 곳곳에 배치되어 있게 되고(도면 이미지에서 도면 포함 도면 부호의 밀도가 높음), 도면 포함 도면 부호와 구성 요소 간을 연결하는 선도 복잡하게 된다. 이런 경우에는 문자로 오 인식되는 이미지 부분 부분이 실제 문자와 연결되어 잘못된 문자열을 구성하게 된다.Second, even when an image incorrectly recognized as a number or letter is connected with a number or letter, it is highly likely to pass the decision pattern rule of reference numerals including drawings. As illustrated in FIG. 27 , when there are many reference numerals in one drawing, the drawing also often has a complicated configuration. At this time, in the drawing, a number of reference numerals including drawings are arranged in various places in the image (the density of reference numbers including drawings in the drawing image is high), and the line connecting the reference numbers including drawings and components is complicated. In this case, the part of the image that is mistakenly recognized as a character is connected to the actual character to form an incorrect character string.

셋째, 오 인식된 이미지 부분 부분이 서로 연결되어 문자열로 출력되고, 이 문자열이 도면 포함 도면 부호의 결정 패턴 규칙을 통과할 수 있다. 예를 들면, 세로 선 2개를 숫자 "1" 및 "1"로 좌우로 굽어지는 선을 "3"으로 인식해 "113"이라는 문자열을 만들어 내는 경우를 들 수 다.Third, the misrecognized image part parts are connected to each other and output as a character string, and this character string can pass the decision pattern rule of reference numerals including drawings. For example, two vertical lines are recognized as numbers "1" and "1", and a line that bends left and right is recognized as "3" to create the string "113".

본 발명에서는 상기의 문제를 해결하는 2가지 방법을 제시한다.The present invention proposes two methods for solving the above problems.

첫번째 방법은 명세서에서 추출되는 명세서 포함 도면 부호를 활용하여, 추출된 명세서 포함 도면 부호와 입수된 도면 포함 도면 부호의 후보를 맵핑 처리하고, 맵핑된 도면 포함 도면 부호의 후보만을 도면 포함 도면 부호로 처리하는 후단계 맵핑 방법이다. 이 방법은 도 7에서 예시되어 있다.The first method utilizes the reference number extracted from the specification to process the mapping process between the extracted reference reference number and the obtained reference reference number candidate, and only the candidates for the mapped reference reference number are processed as the reference reference number with the reference number. This is a post-step mapping method. This method is illustrated in FIG. 7 .

둘째 방법은 도면 포함 도면 부호의 후보 집합의 생성 전 단계에서 명세서 포함 도면 부호를 활용하는 전단계 필터링 방법이다. 명세서 포함 도면 부호를 활용하면 1) 시작하는 문자열의 종류가 정해지고, 2) 특정한 문자 다음에 올 수 있는 문자열도 정해지게 되기 때문에, 문자열을 인식하는 단계부터 오인식의 가능성이 훨씬 줄일 수 있을 뿐만 아니라 들게 된다. 특히, 문자열 블록의 연결 시 특정한 문자열 블록과 다른 문자열 블록을 연결할 것인지를 결정할 때 특별한 효과를 발휘하게 되다. 이를 통해서 연결이 없었다면 도면 포함 도면 부호가 되지 못하는(명세서 포함 도면 부호에 없는 도면 포함 도면 부호) 문자열들이 연결을 통해서 우연히 도면 포함 도면 부호처럼 취급되는(명세서 포함 도면 부호에 있는 도면 포함 도면 부호와 결과적으로 같은 문자열 표현이 되어, 결과적으로 도면 부호의 설명이 결합되어 버리게 되는) 문제도 미연에 방지될 수 있게 된다. 이를 위해서는 문자열 추출 단계(A11) 단계에서 명세서 포함 도면 부호 집합을 조회하는 단계를 처리하여야 한다. 물론, (A11) 단계 이전에 명세서 포함 도면 부호 집합을 생성해 놓는 것이 전제된다. 한편, 명세서 포함 도면 부호 후보 집합을 구성하는 명세서 상의 문단에서 "figure +number" 또는 "도+number" 등과 같은 도면을 지칭하는 표현이 있는 경우, 그 문단에서 나오는 명세서 포함 도면 부호는 특정 도면에 특화성 높은 명세서 포함 도면 부호로 처리되고, 명세서 포함 도면 부호와 도면 번호는 맵핑되어 저장될 수 있다. 이를 통해서 상기 명세서 포함 도면 부호 후보 집합이 도면 단위로 구축될 수 있다. 도면 단위로 명세서 포함 도면 부호 후보 집합이 존재하는 경우, 이 데이터를 활용하면 도면 포함 도면 부호의 후보 집합의 전단계 필터링을 더욱 더 정밀하게 처리할 수 있게 된다. 실제 도면 포함 도면 부호의 후보 집합에 대해 명세서 포함 도면 부호를 맵핑 시킬 때, 모호성(ambiguity)이 존재하는 경우가 아주 많다. 특히, 도면이 흐리거나 해상도가 낮거나, 폰트가 깔끔하지 못하거나, 도면 포함 도면 부호가 아주 많은 경우 등에서는 다양한 모호성이 존재한다. 이때, 도면별로 생성된 명세서 포함 도면 부호 후보 집합은 특정 도면에서 추출되는 도면 포함 도면 부호의 후보의 처리에서 추가 가중치 부여 요소로 작용할 수 있게 된다. 예를 들면, 특정한 도면(예, 도면 1)에서 인식된 특정한 도면 포함 도면 부호의 후보의 문자열 중 특정한 1개의 문자의 정확도가 낮은 경우(예, 문자 "I" 또는 숫자 '1"인지 명쾌하게 분류되지 못하는 경우), 그 특정한 도면과 관련된 명세서의 설명 부분에서 생성하는 명세서 포함 도면 부호를 참조하여, 인식된 문자의 정확도를 높일 수 있다. 예시의 경우에서도 도면 1에서는 문자 " I "없는 경우, 그 문자는 숫자 "1"로 인식하게 되면, 결과적으로 문자열의 인식율이 높아지게 된다.The second method is a pre-filtering method that utilizes reference numerals with a specification in the stage before generation of a candidate set of reference numerals with drawings. If the reference numerals included in the specification are used, 1) the type of the starting character string is determined, and 2) the character string that can come after a specific character is also determined. will hear In particular, when concatenating string blocks, it has a special effect when deciding whether to concatenate a specific string block with another string block. Through this, character strings that would not be a reference number with a drawing if there was no connection (reference number with drawing not in reference number with specification) are treated like reference number with drawing by chance through connection (reference number with drawing in reference number with specification and consequential number) The same character string expression as , resulting in the description of the reference numerals being combined) can also be prevented in advance. To this end, in the character string extraction step (A11) step, the step of inquiring the reference set including the specification should be processed. Of course, it is presumed that the reference numeral set including the specification is generated before the step (A11). On the other hand, if there is an expression referring to a drawing such as “figure +number” or “figure + number” in a paragraph on the specification constituting the reference number candidate set including the specification, the reference number including the specification included in the paragraph is specialized for a specific drawing It is treated as a reference number with a high-quality specification, and the reference number and reference number with the specification may be mapped and stored. Through this, the reference number candidate set including the specification may be constructed in units of drawings. If there is a reference number candidate set with a specification in units of drawings, by using this data, it is possible to more precisely process the pre-filtering of the reference number candidate set including drawings. When mapping a reference number with a specification to a candidate set of reference numbers with an actual drawing, ambiguity often exists. In particular, various ambiguities exist in the case where the drawing is blurry, the resolution is low, the font is not neat, or there are many reference numerals including the drawing. In this case, the set of reference numeral candidates with specification generated for each drawing can act as an additional weighting factor in the processing of reference numeral candidates extracted from a specific drawing. For example, when the accuracy of one specific character among the character strings of candidates for a specific drawing-included reference number recognized in a specific drawing (eg, FIG. 1) is low (eg, whether the letter "I" or the number '1" is clearly classified If not), the accuracy of the recognized characters can be increased by referring to the reference numerals generated in the description part of the specification related to the specific drawing. Even in the case of an example, in FIG. When a character is recognized as the number "1", the recognition rate of the character string is increased as a result.

이어, 도 7을 참조하면서 상기 첫번째 방법에 대해서 더욱 더 상세하게 설명한다.Next, the first method will be described in more detail with reference to FIG. 7 .

도 7은 본 발명의 컴퓨터 장치(1000)의 도면 포함 도면 부호의 명세서 포함 도면 부호 조회 프로세스에 대한 일 실시예적 구현예이다.7 is an exemplary implementation of a reference number inquiry process including a reference number of a reference number in the computer device 1000 of the present invention.

상기 컴퓨터 장치(1000)는 도면 포함 도면 부호의 후보 문자열을 명세서 포함 도면 부호 후보 집합에 조회(S41)하여, 도면 포함 도면 부호의 후보 문자열을 명세서 포함 도면 부호 또는 명세서 포함 도면 부호 후보 집합에 존재하는 경우, 도면 포함 도면 부호의 후보 문자열을 도면 포함 도면 부호로 인정(S43)하고, 아닌 경우 도면 포함 도면 부호의 후보 문자열 버림(S44) 처리하는 방식으로 프로세싱 한다. The computer device 1000 inquires (S41) the candidate character string of the reference number including the drawing in the reference number candidate set including the specification, and the candidate string of the reference number including the reference number exists in the reference number including the specification or the reference number candidate set including the specification. In this case, the candidate character string of the reference number including the drawing is recognized as the reference number including the drawing (S43), and if not, the candidate character string of the reference number including the drawing is discarded (S44).

이어, 도 8을 참조하면서, 상기 컴퓨터 장치(1000)가 도면 포함 도면 부호의 속성 정보를 처리하는 프로세스에 대해서 설명한다. 도 8은 본 발명의 컴퓨터 장치(1000)의 도면 포함 도면 부호의 속성 정보 생성 프로세스에 대한 일 실시예적 구현예이다. Next, a process in which the computer device 1000 processes attribute information of reference numerals including drawings will be described with reference to FIG. 8 . FIG. 8 is an embodiment of a process for generating attribute information of reference numerals including drawings in the computer device 1000 of the present invention.

도면 포함 도면 부호의 속성 정보의 처리는 2가지 방법이 있다.There are two methods of processing attribute information of reference numerals including drawings.

첫째 방법은 도면 포함 도면 부호의 후보에 대해서 속성 정보를 먼저 생성한 후에 도면 포함 도면 부호의 후보가 도면 포함 도면 부호인지를 판단하는 방법이다. 상기 컴퓨터 장치(1000)는 인식된 문자열에서 추출된 도면 포함 도면 부호의 후보 문자열 입수(S51)하고, 도면 포함 도면 부호의 후보 문자열에 대응되는 문자열의 속성 정보 생성(S52)하고, 도면 포함 도면 부호의 후보 문자열이 도면 포함 도면 부호인가를 판단하고 Yes인 경우, 도면 포함 도면 부호의 후보 문자열에 대응되는 문자열의 속성 정보를 도면 포함 도면 부호의 속성 정보로 처리(S54)하고, No인 경우 문자열에 대해 버림(S55) 처리한다. 물론, 상기 컴퓨터 장치(1000)는 문자열 인식 시에 그 문자열에 대응되는 도면 상의 위치 정보, 문자열의 길이, 폰트의 크기 등과 같은 속성 정보를 생성하고 저장하게 된다.The first method is a method of first generating attribute information with respect to a reference number candidate with drawings, and then determining whether a reference number candidate with a drawing number is a reference number candidate. The computer device 1000 obtains ( S51 ) a candidate character string of a reference numeral with a drawing extracted from the recognized character string, generates attribute information of a character string corresponding to the candidate character string of a reference numeral with a drawing ( S52 ), and generates ( S52 ) the reference character with the drawing It is determined whether the candidate character string is a reference character with drawings, and if Yes, the attribute information of the character string corresponding to the candidate character string of the reference character with the drawing is processed as attribute information of the reference character including the drawing (S54), and if No, the character string is added to the character string. It is discarded (S55). Of course, when recognizing a character string, the computer device 1000 generates and stores attribute information such as location information on a drawing corresponding to the character string, the length of the character string, and the size of the font.

둘째 방법은, 도면 포함 도면 부호의 후보가 도면 포함 도면 부호인지를 먼저 판단한 다음, 도면 포함 도면 부호에 대해서 도면 포함 도면 부호의 속성 정보를 생성하는 방법이다.The second method is a method of first determining whether a candidate for reference numerals with drawings is a reference number with drawings, and then generating attribute information of reference numbers with drawings for the reference numbers with drawings.

상기 컴퓨터 장치(1000)는 인식된 문자열에서 추출된 도면 포함 도면 부호의 후보 문자열 입수(S51)하고, 도면 포함 도면 부호의 후보 문자열이 도면 포함 도면 부호인가를 판단하고, Yes인 경우 도면 포함 도면 부호의 후보 문자열에 대응되는 문자열의 속성 정보를 도면 포함 도면 부호의 속성 정보로 처리(S62)하고, 도면 포함 도면 부호의 후보 문자열에 대응되는 문자열의 속성 정보 생성(S)하고, No인 경우 문자열 버림(S63) 처리하는 방식으로 프로세싱 한다.The computer device 1000 obtains ( S51 ) candidate character strings of reference numerals with drawings extracted from the recognized character strings, determines whether the candidate character strings of reference numerals with drawings are reference numbers with drawings, and if yes, the reference characters with drawings Processes the attribute information of the character string corresponding to the candidate character string of the drawing as attribute information of the reference number including drawings (S62), generates attribute information of the character string corresponding to the candidate character string of the reference number including the drawing (S), and if No, discards the character string (S63) The processing is performed in the processing method.

도면 포함 도면 부호의 속성 정보에는 도면 포함 도면 부호의 위치(직사각형의 도면 포함 도면 부호 블록에 대응되는 4개의 꼭지점 좌표값), 도면 포함 도면 부호 폰트의 크기, 배향(우향, 상향, 하향 등), 구성(숫자만, 문자+숫자 등), 도면 포함 도면 부호가 나타나는 특정한 도면 번호 및 도면 포함 도면 부호가 나타나는 전체 개수) 등이 있을 수 있다.Attribute information of reference numbers with drawings includes the location of reference numbers with drawings (four vertex coordinate values corresponding to rectangular reference blocks with drawings), the size of reference number fonts with drawings, and orientation (right, upward, downward, etc.), configuration (numeric only, letter+number, etc.), the specific reference number in which the reference number with drawing appears, and the total number in which the reference number with drawing appears.

이어, 명세서 포함 도면 부호 및 도면 부호의 설명 데이터의 생성에 대해서 설명한다. 명세서 포함 도면 부호 및 도면 부호의 설명 데이터의 생성은 도면에서 도면 포함 도면 부호의 인식보다 먼저 처리되어 있는 것이 바람직하다. Next, the generation of the reference numerals including the specification and the explanatory data of the reference numerals will be described. It is preferable that the generation of the reference numerals with the specification and the descriptive data of the reference numerals is processed prior to the recognition of the reference numerals with the reference in the drawings.

도 9는 본 발명의 컴퓨터 장치(1000)의 명세서 포함 도면 부호 및 도면 부호의 설명 정보의 생성 프로세스에 대한 일 실시예적 구현예이다.9 is an exemplary embodiment of a process for generating specification-included reference numbers and descriptive information of the computer device 1000 of the present invention.

명세서 포함 도면 부호 및 도면 부호의 설명 데이터는 명세서 데이터를 처리하여 생성된다. 명세서 데이터가 XML 등과 같은 마크업 언어로 되어 있는 경우와, 태그가 없는 단순 텍스트인 경우에는 경우가 있다. 상기 컴퓨터 장치(1000)는 명세서 입수(S71)하고, 명세서가 마크업 언어로 작성되어 있는가를 판단(S72)할 수 있다. 명세서가 마크업 언어로 되어 있는 경우, 도면 부호에 대응하는 명세서 포함 도면 부호의 태그부를 인식하고, 명세서 포함 도면 부호의 태그부에서 상기 명세서 포함 도면 부호를 추출(S73)하고, 명세서 포함 도면 부호의 태그부와의 기 설정된 위치에 있는 문자열을 추출(S74)하고, 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정(S75)한다.The specification-included reference numbers and descriptive data of reference numbers are generated by processing the specification data. There are cases where the specification data is in a markup language such as XML, and there are cases where it is simple text without tags. The computer device 1000 may obtain the specification (S71) and determine whether the specification is written in a markup language (S72). When the specification is in a markup language, the tag portion of the reference number with the specification corresponding to the reference number is recognized, the reference number with the specification is extracted from the tag portion of the reference number with the specification (S73), and the reference number of the reference number with the specification is recognized. A character string at a preset position with the tag unit is extracted (S74), and a description candidate of a reference numeral is determined from the extracted character string (S75).

예를 들어, 하기와 같은 명세서 내용이 있다고 하자.For example, suppose there is the following specification content.

<p id="p-0033" num="0032"><p id="p-0033" num="0032">

A second purpose of the laminated flexureA second purpose of the laminated flexure

<b>304</b><b>304</b>

may be to provide a plurality of electrical paths to facilitate signal transmission to/from the read headmay be to provide a plurality of electrical paths to facilitate signal transmission to/from the read head

<b>310</b><b>310</b>

. For that second purpose, the laminated flexure. For that second purpose, the laminated flexure

<b>304</b><b>304</b>

may include a plurality of electrically conductive traces that are defined in an electrically conductive (e.g. copper) sub-layer of the laminated flexuremay include a plurality of electrically conductive traces that are defined in an electrically conductive (e.g. copper) sub-layer of the laminated flexure

<b>304</b><b>304</b>

. Such electrically conductive traces may be insulated from a support layer (e.g. stainless steel) by a dielectric layer (e.g. polyimide). The electrically conductive traces may extend away from the read head. Such electrically conductive traces may be insulated from a support layer (e.g. stainless steel) by a dielectric layer (e.g. polyimide). The electrically conductive traces may extend away from the read head

<b>310</b><b>310</b>

along a flexure tailalong a flexure tail

<b>305</b><b>305</b>

of the laminated flexureof the laminated flexure

<b>304</b><b>304</b>

, to reach a portion of the flex cable (not shown) that includes a preamplifier chip near the body of the actuator (e.g. actuator, to reach a portion of the flex cable (not shown) that includes a preamplifier chip near the body of the actuator (e.g. actuator

<b>32</b><b>32</b>

ofof

<figref idref="DRAWINGS">FIG. 1</figref><figref idref="DRAWINGS">FIG. 1</figref>

).).

</p></p>

이 문단의 문단 ID는 "p-0033"이고, 문단 번호는 "0032"이다. <figref idref="DRAWINGS">FIG. 1</figref>The paragraph ID of this paragraph is "p-0033" and the paragraph number is "0032". <figref idref="DRAWINGS">FIG. 1</figref>

라는 문자열에서 이 문단은 " FIG. 1"과 관계되고 있다는 것을 알 수 있다. 한편, 상기의 예에서는 명세서 포함 도면 부호는 <b> 태그 사이에 존재한다는 것을 알 수 있고, "<b>문자열<b>"는 명세서 포함 도면 부호의 태그부가 된다. 상기 컴퓨터 장치(1000)는 상기 명세서 포함 도면 부호의 태그부를 처리하여 명세서 포함 도면 부호를 추출한다. 이어 상기 컴퓨터 장치(1000)는 명세서 포함 도면 부호의 태그부와의 기 설정된 위치에 있는 문자열을 추출(S74)한다. 예시적으로 상기 컴퓨터 장치(1000)는 명세서 포함 도면 부호의 시작 지점(앞에 있는 <b> 태그)에서 역 방향으로 문자열을 읽어 나가면서 다음 예시와 같은 도면 부호의 설명 후보 조건을 만족하는 위치까지의 문자열을 추출한다.It can be seen from the string " Fig. 1 " that this paragraph is related. On the other hand, in the above example, it can be seen that the reference number including the specification exists between the <b> tags, and "<b> string <b>" becomes the tag part of the reference number including the specification. The computer device 1000 processes the tag part of the reference number including the specification to extract the reference number including the specification. Then, the computer device 1000 extracts the character string at a preset position with the tag part of the reference numeral including the specification (S74). Exemplarily, the computer device 1000 reads the character string in the reverse direction from the starting point (<b> tag in front) of the reference number including the specification to the position that satisfies the description candidate condition of the reference number as shown in the following example. extract a string

문자열이 영어인 경우,If the string is English,

1) 첫번째 부정관사를 만나기 직전까지의 문자열1) The string just before the first indefinite article

2) 첫번째 the said, said 또는 the를 만나기 직전까지의 문자열2) The string right before the first the said, said or the

3) at least 숫자, one or more 등과 같은 기 설정된 도면 부호의 설명 후보 관련 표현 직전까지의 문자열3) A character string up to immediately before the description candidate-related expression of a preset reference number, such as at least number, one or more, etc.

4) 기 설정된 n번째 단어까지 위 1) 또는 2)조건 중에 해당하는 문자열이 없는 경우, 첫번째 복수형 명사까지의 문자열4) If there is no string corresponding to any of the above 1) or 2) conditions up to the nth word, the string up to the first plural noun

5) 1), 2) 및 3)이 모두 성립하지 않는 상태에서 문장의 시작까지의 문자열5) A character string up to the beginning of a sentence in the state where 1), 2) and 3) are not all satisfied

도면 부호의 설명 후보 조건은 가공 규칙 데이터부(1340)에 저장될 수 있다.The description candidate conditions of reference numerals may be stored in the processing rule data unit 1340 .

문자열이 영어가 아닌 한글 등이 경우, the나 the said 에 대응되는 표현(예를 들면 "상기")을 정관사나 the said 대신에 적용한다.If the character string is in Korean other than English, the expression corresponding to the or the said (eg, "above") is applied instead of the definite article or the said.

상기의 도면 부호의 설명 후보 조건을 적용하는 경우, 상기의 명세서 내용에서 하기 표 1과 같은 도면 부호의 설명 후보 집합을 생성할 수 있다.When the above-described candidate description conditions for reference numerals are applied, a set of description candidates for reference numerals as shown in Table 1 below may be generated from the above specification.

명세서 포함 도면 부호reference number with specification 도면 부호의 설명 후보Candidates for description of reference numerals 나온 회수number of times 304304 laminated flexurelaminated flexure 1One 310310 read headread head 1One 305305 flexure tailflexible tail 1One 3232 actuatoractuator 1One

본 발명 사상을 설명하기 위해서 In order to explain the idea of the present invention

...near the body of the actuator (e.g. actuator...near the body of the actuator (e.g. actuator

<b>32</b><b>32</b>

"에서는 "e.g."등이 도면 부호의 설명 후보 조건에 없기 때문에, "actuator"가 추출되는 것으로 처리하였다.In ", since "e.g." and the like are not in the description candidate conditions of reference numerals, "actuator" is processed as being extracted.

같은 명세서 상에서 다음과 같은 내용이 있다고 하자.Let's say we have the following in the same specification:

... The HSA... The HSA

<b>30</b><b>30</b>

includes an actuator comprising an actuator bodyincludes an actuator comprising an actuator body

<b>32</b><b>32</b>

and one or more actuator armsand one or more actuator arms

<b>36</b><b>36</b>

extending from the actuator bodyextending from the actuator body

<b>32</b><b>32</b>

. The actuator body. The actuator body

<b>32</b><b>32</b>

includes a bore and a pivot bearing cartridgeincludes a bore and a pivot bearing cartridge

상기의 도면 부호의 설명 후보 조건을 적용하는 경우, 상기의 명세서 내용에서 하기 표 2와 같은 도면 부호의 설명 후보 집합을 생성할 수 있다.When the above-described candidate description conditions for reference numerals are applied, a set of description candidates for reference numerals as shown in Table 2 below can be generated in the above specification.

명세서 포함 도면 부호reference number with specification 도면 부호의 설명Explanation of reference numerals 나온 회수number of times 3030 HASHAS 1One 3636 actuator armsactuator arms 1One 3232 actuator bodyactuator body 33

상기 표 1 및 표 2와 같은 데이터는 명세서 기반 데이터부(1320)에 저장되며, 집계 정보는 집계 데이터부(1350)에도 저장될 수 있다.The data shown in Tables 1 and 2 may be stored in the specification-based data unit 1320 , and aggregate information may also be stored in the aggregate data unit 1350 .

상기 컴퓨터 장치(1000)는 명세서 입수(S71)하고, 명세서가 마크업 언어로 작성되어 있는가를 판단(S72)할 수 있다. 명세서가 마크업 언어로 되어 있지 않은 경우, 상기 컴퓨터 장치(1000)는 명세서 포함 도면 부호 식별 규칙을 적용하여, 상기 명세서 포함 도면 부호를 추출(S76)하고, 명세서 포함 도면 부호를 기준으로 상기 명세서 포함 도면 부호와의 기 설정된 위치에 있는 문자열을 추출(S77)하고, 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정(S78) 처리하는 방식으로 프로세싱 한다.The computer device 1000 may obtain the specification (S71) and determine whether the specification is written in a markup language (S72). If the specification is not in markup language, the computer device 1000 applies the specification-included reference number identification rule to extract the specification-containing reference number (S76), and includes the specification-containing reference number based on the specification-containing reference number (S76). A character string at a preset position with the reference number is extracted (S77), and a description candidate of the reference number is determined from the extracted character string (S78).

상기 명세서 포함 도면 부호 식별 규칙은 1) "좌괄호+명세서 포함 도면 부호+우괄호" 등과 같은 명세서 상에서 명세서 포함 도면 부호를 표현하는 방식 등과 같은 명시적 규칙성이 있는 경우에는 그 규칙을 적용하여 처리한다. (대한민국 특허 명세서에서는 명세서 포함 도면 부호는 관행적으로 괄호 내에 표현한다.) 괄호 안에는 명세서 포함 도면 부호가 아닌 다른 문자열이 포함되는 경우도 다수 있으므로, 괄호 안에 포함되어 있는 문자열 중에서, 명세서 포함 도면 부호를 결정하는 것은 다음과 같은 조건을 적용한다. 한편, 괄호 등과 같은 관행적인 명세서 포함 도면 부호 식별 규칙이 없는 경우에는 "띄어쓰기+명세서 포함 도면 부호+띄어쓰기" 등과 같은 무방식의 경우에도 동등한 조건을 적용할 수 있다.The above specification-included reference number identification rule is 1) If there is an explicit regularity such as a method of expressing reference numbers including specifications in a specification such as "left parenthesis + specification-containing reference number + right parenthesis", the rule is applied and processed do. (In the Korean patent specification, reference numerals with specifications are conventionally expressed in parentheses.) Since there are many cases where a character string other than a reference number with a specification is included in parentheses, among the character strings included in parentheses, reference numerals with a specification are included. The decision is subject to the following conditions: On the other hand, if there is no conventional specification-included reference mark identification rule such as parentheses, equivalent conditions may be applied even in the case of no method such as "space + specification-included reference mark + space".

첫째, 문자열이 2단어 이상(띄어쓰기가 있는 경우)에는 명세서 포함 도면 부호가 아니다.First, if the character string is two or more words (if there is a space), it is not a reference numeral including the specification.

둘째, 숫자가 포함되어 있지 않은 문자열은 명세서 포함 도면 부호가 아니다.Second, a character string that does not include a number is not a reference numeral with a specification.

셋째, 문자열에 숫자와 문자가 함께 포함되어 있는 경우, 다음과 같은 하위 기준을 적용한다.Third, if the string contains both numbers and letters, the following sub-criteria are applied.

1) 문자로 시작하는 경우에는 시작하는 문자의 글자수는 숫자를 구성하는 글자수보다 작거나 같다.1) In case of starting with a letter, the number of letters of the starting letter is less than or equal to the number of letters constituting the number.

2) 문자로 끝나는 경우에는 끝나는 문자의 글자수는 숫자를 구성하는 글자수보다 작거나 같다.2) In the case of ending with a letter, the number of letters in the ending letter is less than or equal to the number of letters constituting the number.

셋째, 명세서 포함 도면 부호 포함 기호는 문자열의 처음도 될 수 없고 마지막도 될 수 없다.Third, the symbol including the reference number including the specification cannot be the first or the last of the character string.

넷째, 문자열의 전체 길이는 기 설정된 한계(예, 6~7 글자) 이내이다.Fourth, the total length of the character string is within a preset limit (eg, 6 to 7 characters).

다섯째, 명세서 포함 도면 부호 포함 기호가 아닌 구두점이나 기호는 명세서 포함 도면 부호 구성에서 제외된다.Fifth, punctuation marks or symbols other than the reference numerals included in the specification are excluded from the configuration of the reference numerals included in the specification.

명세서 포함 도면 부호 식별 규칙은 가공 규칙 데이터부(1340)에 저장될 수 있다.The specification-included reference number identification rule may be stored in the processing rule data unit 1340 .

마크업 언어로 되어 있지 않은 명세서에서 명세서 포함 도면 부호가 결정되었을 때, 도면 부호의 설명을 결정하는 것은 마크업 언어로 되어 있는 명세서에서와 동일하다.When a reference number containing a specification is determined in a specification that is not in the markup language, determining the description of the reference number is the same as in the specification in the markup language.

그런데, 명세서 포함 도면 부호와 도면 부호의 설명 후보 간에는 원칙적으로 단일 명세서 내에서의 표현의 일관성의 원칙상 1:1 관계가 성립해야 하나, 사실 상 1:1 관계가 성립하지 않는 경우가 다수 있을 수 있다. 이유는 다음을 포함한다.However, in principle, a 1:1 relationship should be established between the reference numerals included in the specification and the description candidates for the reference numerals in principle in terms of consistency of expression within a single specification, but in fact, there may be many cases where the 1:1 relationship is not established. have. Reasons include:

첫째, 명세서를 작성하는 사람의 실수나 오류 때문이다. 다른 표현에 동일 명세서 포함 도면 부호를 적용하거나, 동일 명세서 포함 도면 부호에 다른 표현이 사용되는 경우 등이다.First, it is due to the mistake or error of the person writing the specification. A case in which a reference number having the same specification is applied to a different expression, or a different expression is used for a reference number having the same specification, and the like.

둘째, 명세서를 작성 프로그램 또는 명세서 전산화 프로그램 또는 명세서 가공 프로그램에서의 실수나 오류가 있을 수 있다.Second, there may be mistakes or errors in the specification creation program, specification computerization program, or specification processing program.

셋째, 도면 부호의 설명 후보 조건의 불완비성 또는 도면 부호의 설명 후보 조건을 적용하는 프로그램의 불완전성 때문이다. 도면 부호의 설명 후보 조건을 아무리 다양하고 엄격하게 준비한다고 하더라도 1)도면 부호의 설명 후보 조건을 벗어나는 표현의 존재 가능성 항상 있고, 2) 도면 부호의 설명 후보 조건 간에 충돌 관계나 우선 순위 적용에서 예외 상황이 발생할 수 있게 된다.Third, it is due to the incompleteness of the description candidate condition for reference numerals or the incompleteness of the program for applying the description candidate conditions for reference numerals. No matter how diversified and strictly prepared the description candidate conditions for reference numbers are, 1) there is always a possibility of an expression that deviates from the description candidate conditions of reference numbers, and 2) there is an exception situation in the application of priority or conflict between the description candidate conditions of reference numbers. this can happen

이 때 어느 명세서 포함 도면 부호에 어느 도면 부호의 설명을 맵핑할 것인가를 결정하는 것이 중요하게 된다. 도 10내지 도 12를 참조하면서 설명한다.At this time, it becomes important to determine which reference numeral description is mapped to which specification reference numeral. It will be described with reference to FIGS. 10 to 12 .

도 10은 본 발명의 컴퓨터 장치(1000)의 도면 부호의 설명 결정 프로세스에 대한 일 실시예적 구현예이다.Fig. 10 is an exemplary implementation of the process of determining the description of the reference numerals of the computer device 1000 of the present invention.

도 10에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 부호의 설명 후보를 입수(S81)하고, 도면 부호의 설명 후보에 도면 부호의 설명 결정 규칙을 적용(S82)하고, 도면 부호의 설명을 결정(S83) 처리하는 방식으로 프로세싱 한다.As illustrated in FIG. 10 , the computer device 1000 obtains ( S81 ) the reference candidates for description, applies the reference decision decision rule to the reference candidates ( S82 ), and determines the description of the reference numerals ( S82 ). (S83) The processing is performed in the processing method.

도 11은 본 발명의 컴퓨터 장치(1000)의 도면 포함 도면 부호와 상기 도면 부호의 설명의 맵핑 데이터 생성 전 명세서 포함 도면 부호와 도면 부호의 설명의 맵핑 프로세스에 대한 일 실시예적 구현예이다.11 is an exemplary embodiment of a mapping process of reference numerals with drawings and descriptions of reference numbers before generating mapping data of reference numerals with drawings and descriptions of the reference numbers in the computer device 1000 of the present invention.

도 11에서 예시되듯이 상기 컴퓨터 장치(1000)는 명세서 전체에서 생성한 명세서 포함 도면 부호 및 도면 부호의 설명의 쌍 데이터 입수(S91)하고, (마름모)명세서 포함 도면 부호를 기준으로 전체 도면 부호의 설명이 유일(1:1 대응)한가를 조회 (S92)하고, Yes인 경우 명세서 포함 도면 부호와 도면 부호의 설명의 1:1 맵핑 처리(S93)한다. 한편, 상기 컴퓨터 장치(1000)는 1:1 대응 관계가 성립하지 않는 경우에는 도면 부호의 설명 결정 규칙을 적용한다. 상기 컴퓨터 장치(1000)는 도면 부호의 설명 중에서 최빈 도면 부호의 설명을 입수하고, 빈도 비율값을 확률값으로 처리하고 명세서 포함 도면 부호와 도면 부호의 설명의 확률 정보 포함 1:n 맵핑 처리(S94)하고, 명세서 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n)를 생성(S95)하는 방식으로 프로세싱 할 수 있다.As illustrated in FIG. 11 , the computer device 1000 obtains pair data (S91) of reference numerals and descriptions of reference numerals generated throughout the specification, and (rhombus) of all reference numbers based on reference numerals including specifications. Whether the description is unique (1:1 correspondence) is inquired (S92), and if yes, 1:1 mapping processing (S93) of the reference numerals including the specification and the description of the reference numerals is performed. On the other hand, when the 1:1 correspondence is not established, the computer device 1000 applies the explanation determination rule of reference numerals. The computer device 1000 obtains the description of the most frequent reference number from the description of the reference number, processes the frequency ratio value as a probability value, and performs 1:n mapping processing including the reference number including the specification and the probability information of the description of the reference number (S94) and mapping data (1:1 or 1:n) for the description of the reference numerals and the reference numerals included in the specification is generated (S95).

도 12는 본 발명의 컴퓨터 장치(1000)의 명세서 포함 도면 부호를 매개로 도면 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n) 생성 프로세스에 대한 일 실시예적 구현예이다.12 is an exemplary embodiment of a process for generating mapping data (1:1 or 1:n) for reference numerals with drawings and descriptions of reference numerals via reference numerals including specifications of the computer device 1000 of the present invention. to be.

도 12에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 포함 도면 부호를 입수(S101)하고, (마름모)도면 포함 도면 부호에 대응되는 명세서 포함 도면 부호가 존재하는가를 조회 (S102)하고, Yes 인 경우, 도면 포함 도면 부호와 명세서 포함 도면 부호의 맵핑(S103)하고, 명세서 포함 도면 부호를 매개로 도면 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n) 생성(S104)하며, No 인 경우 명세서 포함 도면 부호가 존재하지 않는 도면 포함 도면 부호임을 저장하여, 이 도면 포함 도면 부호가 도면 포함 도면 부호와 도면 부호의 설명의 맵핑 처리에서 배제될 수 있도록 처리(S105)하는 방식으로 프로세싱 한다.As illustrated in FIG. 12 , the computer device 1000 obtains reference numbers including drawings (S101), inquires (S102) whether reference numbers with specifications corresponding to reference numbers with drawings (rhombus) exist (S102), and selects Yes. In this case, mapping of reference numbers with drawings and reference numbers with specifications (S103), and generation of mapping data (1:1 or 1:n) for descriptions of reference numbers with drawings and reference numbers through reference numbers with specifications as a medium (S104) ) and, in the case of No, storing the reference number including the drawing that does not exist, and processing (S105) so that this reference number with the drawing can be excluded from the mapping process of the description of the reference number with the drawing process in a way

상기 컴퓨터 장치(1000)는 본 발명에서는 동일 명세서 포함 도면 부호에 적어도 2 이상의 도면 부호의 설명 후보가 대응되어 있을 때 도면 부호의 설명을 결정할 때 예시적으로 다음과 같은 도면 부호의 설명 결정 규칙을 적용할 수 있다.In the present invention, the computer device 1000 exemplarily applies the following reference decision determination rules when determining the description of a reference number when at least two or more reference candidates for description correspond to reference numerals including the same specification. can do.

1) 빈도가 가장 높은 도면 부호의 설명 후보1) Candidates for description of the most frequent reference numerals

2) 명세서 내에서 명세서 포함 도면 부호와 도면 부호의 설명 간의 맵핑 관계를 처리해 놓은 정보가 있는 경우, 그 맵핑 관계 처리 정보를 반영한 도면 부호의 설명 후보2) If there is information in which the mapping relationship between the reference numerals included in the specification and the description of the reference numerals is processed in the specification, the description candidates for the reference numerals reflecting the mapping relationship processing information

3)1) 또는 2)가 없는 경우, 길이가 가장 짧은 도면 부호의 설명 후보3) In the absence of 1) or 2), description candidates for the shortest reference number

도면 부호의 설명 결정 규칙은 가공 규칙 데이터부(1340)에 저장될 수 있다.The description decision rules of reference numerals may be stored in the processing rule data unit 1340 .

위의 2가지 표에서 명세서 포함 도면 부호 "32"는 "actuator"가 1회, "actuator body" 가 3회가 등장하였다. 상기 우선 순위 원칙에 따라 명세서 포함 도면 부호 "32"에 대한 도면 부호의 설명은 "actuator body"가 되게 된다.In the above two tables, in the reference numeral "32" including the specification, "actuator" appeared once and "actuator body" appeared three times. In accordance with the above priority principle, the description of the reference numeral "32" including the specification becomes "actuator body".

상기 컴퓨터 장치(1000)는 하기 표 3과 같은 명세서 포함 도면 부호와 도면 부호의 설명의 맵핑 데이터 및 도면 부호의 설명 속성 정보를 생성한다.The computer device 1000 generates mapping data of reference numerals including specifications and descriptions of reference numerals and description attribute information of reference numerals as shown in Table 3 below.

명세서 포함 도면 부호reference number with specification 도면 부호의 설명Explanation of reference numerals 나온 회수number of times 확률(비율)Probability (ratio) 단어수word count 구성 문자수number of configuration characters 304304 laminated flexurelaminated flexure 1One 100%(1/1)100% (1/1) 22 1717 310310 read headread head 1One 100%(1/1)100% (1/1) 22 99 305305 flexure tailflexible tail 1One 100%(1/1)100% (1/1) 22 1212 3030 HASHAS 1One 100%(1/1)100% (1/1) 1One 33 3636 actuator armsactuator arms 1One 100%(1/1)100% (1/1) 22 1313 3232 actuator bodyactuator body 33 75%(3/4)75% (3/4) 22 1313

상기 표 3과 같은 데이터는 명세서 기반 데이터부(1320)에 저장되며, 집계 정보는 집계 데이터부(1350)에도 저장될 수 있다.The data shown in Table 3 is stored in the specification-based data unit 1320 , and aggregate information may also be stored in the aggregate data unit 1350 .

상기 구성 문자수는 도면 부호의 설명을 배치하기 위한 도면 부호의 설명 배치 데이터를 생성하는데 중요하게 활용된다. 도면 부호의 설명이 길면 길수록 도면 부호의 설명을 표시하기 위한 공간의 크기도 커져야 하기 때문에, 긴 도면 부호의 설명의 경우에는 다른 도면 부호의 설명과 충돌/겹칩이 발생할 가능성이 높기 때문에, 긴 도면 부호의 설명이 다량으로 포함되어 있는 경우에는 도면 부호의 설명 간의 배치가 아주 중요하게 된다.The number of constituent characters is importantly utilized to generate description arrangement data of reference numbers for arranging descriptions of reference numerals. The longer the description of the reference number, the larger the size of the space for displaying the description of the reference number must be. When the description of the reference numerals is included in a large amount, the arrangement between the descriptions of reference numerals becomes very important.

도 12는 본 발명의 컴퓨터 장치(1000)의 명세서 포함 도면 부호를 매개로 도면 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n) 생성 프로세스에 대한 일 실시예적 구현예이다.12 is an exemplary embodiment of a process for generating mapping data (1:1 or 1:n) for reference numerals with drawings and descriptions of reference numerals via reference numerals including specifications of the computer device 1000 of the present invention. to be.

도 12에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 포함 도면 부호를 입수(S101)하고, 도면 포함 도면 부호에 대응되는 명세서 포함 도면 부호가 존재하는 가를 조회 (S102)하고, Yes 인 경우, 도면 포함 도면 부호와 명세서 포함 도면 부호의 맵핑(S103)하고, 명세서 포함 도면 부호를 매개로 도면 포함 도면 부호와 도면 부호의 설명에 대한 맵핑 데이터(1:1 또는 1:n) 생성(S104)하다. 한편, 상기 컴퓨터 장치(1000)는 도면 포함 도면 부호에 대응되는 명세서 포함 도면 부호가 존재하지 않는 경우에는 명세서 포함 도면 부호가 존재하지 않는 도면 포함 도면 부호임을 저장하여, 이 도면 포함 도면 부호가 도면 포함 도면 부호와 도면 부호의 설명의 맵핑 처리에서 배제될 수 있도록 처리(S105)하는 방식으로 프로세싱 한다.As illustrated in FIG. 12 , the computer device 1000 obtains reference numbers including drawings ( S101 ), inquires ( S102 ) whether or not reference numbers with specifications corresponding to reference numbers with drawings exist ( S102 ), and if yes, drawings Mapping (S103) of reference numerals including reference numerals and reference numerals including specifications is performed, and mapping data (1:1 or 1:n) for descriptions of reference numerals including reference numerals and reference numbers is generated (S104) through reference numerals including specifications. On the other hand, the computer device 1000 stores a reference number including a drawing that does not exist if a reference number with a specification corresponding to a reference number with a drawing does not exist, and this reference number with a drawing includes the reference number. Processing is performed in such a way as to be excluded from the mapping processing of reference numerals and descriptions of reference numerals (S105).

상기와 같은 방법을 통해서 도면 포함 도면 부호와 도면 부호의 설명 간의 맵핑 관계가 생성되면, 도면 부호의 설명을 도면 포함 도면 부호에 표현하는 방법을 처리할 수 있게 된다. 먼저, 도면 부호의 설명을 도면 포함 도면 부호에 표현하게 하기 위해서 도면 부호의 설명을 어떻게 도면 포함 도면 부호가 포함된 이미지에 배치할 것인가에 대한 데이터인 도면 부호의 설명 배치 데이터를 생성해야 한다. When the mapping relationship between the reference numerals including the drawings and the descriptions of the reference numerals is created through the above method, the method of expressing the descriptions of the reference numerals in the reference numerals including the drawings can be processed. First, in order to express the description of the reference numerals in the reference numerals including the drawings, it is necessary to generate the description arrangement data of the reference numbers, which is data on how to arrange the descriptions of the reference numbers in the image including the reference numbers.

도 13은 본 발명의 컴퓨터 장치(1000)의 도면 부호의 설명 배치 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.Fig. 13 is an exemplary implementation of the process for generating descriptive batch data of reference numerals of the computer device 1000 of the present invention.

도 13에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 포함 도면 부호별 도면 부호의 설명 배치 최소 공간을 탐색(S111)하고, 도면 부호의 설명 배치 최소 공간이 적어도 2 이상의 도면 포함 도면 부호에 대해 겹침이 발생하는 지를 탐색(S112)하고, 겹침이 발생하는 도면 포함 도면 부호 집합과 겹침이 발생하지 않는 도면 포함 도면 부호 집합의 분리(S113)하는 처리를 먼저 수행한다. 이어, 상기 컴퓨터 장치(1000)는 겹침 발생하는 도면 포함 도면 부호 집합에 포함된 도면 부호의 설명 배치 전략 데이터의 생성(S114) 및 도면 부호의 설명 배치 전략 데이터를 참조하여 부호의 설명 배치 데이터를 생성(S115)하거나, 겹침 발생하지 않는 도면 포함 도면 부호 집합에 포함된 도면 부호의 설명 배치 전략 데이터 생성(S116) 및 도면 부호의 설명 배치 전략 데이터를 참조하여 부호의 설명 배치 데이터 생성(S117)하는 방식으로 프로세싱 한다.As exemplified in FIG. 13 , the computer device 1000 searches for a minimum space for description and arrangement of reference numbers for each reference number including drawings ( S111 ), and the minimum space for description and placement of reference numbers overlaps with respect to at least two reference numbers including drawings. Whether this occurs is searched (S112), and a process of separating (S113) a reference set including a drawing in which the overlap occurs and a reference set including a drawing in which an overlap does not occur is performed first. Next, the computer device 1000 generates descriptive arrangement data of reference numbers included in the reference set including the overlapping drawings ( S114 ) and generates descriptive arrangement data of the reference numbers by referring to the descriptive arrangement strategy data of the reference numbers ( S114 ). (S115) or by reference to the descriptive arrangement strategy data generation (S116) of the reference numbers included in the reference set including the drawings that do not overlap, and the descriptive placement data generation (S117) of the reference numbers by referring to the descriptive placement strategy data of the reference numbers (S117) processed with

이때, 상기 컴퓨터 장치(1000)는 상기 도면 부호의 설명의 단어수를 고려하여 단어 단위로 2행 이상으로 분절하여 배치하여 겹칩이 발생하는 지를 탐색(S112b)하는 방법도 예비적으로 적용할 수 있다. 이러한 예비적 방법은 상기 도면 부호의 설명이 3단어 이상인 경우 아주 유용하게 활용될 수 있다. 상기 도면 부호의 설명 배치 최소 공간은 도면 부호의 설명의 길이 및 도면 부호의 설명이 표시되는 도면 부호의 설명 폰트의 크기에 의존성을 가진다. 상기 도면 부호의 설명 폰트의 크기는 도면 포함 도면 부호의 폰트 크기와 동일할 수도 있지만 더 작은 크기가 되는 것이 바람직할 것이다. 이유는 도면 부호의 설명의 길이가 도면 포함 도면 부호의 길이에 비하여 훨씬 더 큰 경우가 대부분이기 때문이다. 한편, 상기 도면 부호의 설명의 색깔은 도면 포함 도면 부호의 색깔과 일치할 수도 있지만, 일치하지 않는 것이 식별력 또는 가독성에 있어서 더욱 더 바람직할 것이다.In this case, the computer device 1000 may also preliminarily apply a method of searching (S112b) whether overlapping chips occur by segmenting and arranging two or more lines in units of words in consideration of the number of words in the description of the reference numerals. . This preliminary method can be very usefully utilized when the description of the reference numerals is three or more words. The minimum space for the description arrangement of the reference number depends on the length of the description of the reference number and the size of the description font of the reference number in which the description of the reference number is displayed. The size of the explanatory font of the reference number may be the same as the font size of the reference number including the drawing, but preferably a smaller size. The reason is that in most cases, the length of the description of the reference numerals is much larger than the length of the reference numerals including the drawings. On the other hand, although the color of the description of the reference numerals may coincide with the color of the reference numerals including the drawings, it will be more preferable in terms of distinguishing power or readability if they do not match.

한편, 상기 컴퓨터 장치(1000)는 폰트 크기의 조절이나 2행 이상의 개행 처리를 통해서도 상기 도면 부호의 설명의 충돌/겹침 현상을 피할 수 없는 경우에는 다음과 같은 3가지 중 어느 하나 이상을 적용하는 프로세스를 수행한다.On the other hand, when the computer device 1000 cannot avoid the collision/overlapping phenomenon of the description of the reference numerals even through the adjustment of the font size or the processing of two or more lines of newline, any one or more of the following three processes is applied. carry out

1) 충돌/겹침 현상이 발생하는 도면 부호의 설명 간의 색깔이나 폰트 종류나 폰트 크기를 달리하는 방법1) How to change the color, font type, or font size between the descriptions of reference numerals in which the collision/overlapping phenomenon occurs

2) 충돌/겹침 현상이 발생하는 도면 부호의 설명 중 어느 하나 이상을 축약 표기하는 경우(예를 들면 3단어 중 2단어만 표시하는 등과 같은 축약 표기 처리)2) In the case of abbreviated description of any one or more of the descriptions of the reference numerals in which the collision/overlapping phenomenon occurs (for example, abbreviation processing such as displaying only 2 words out of 3 words)

3) 충돌/겹침 현상이 발생하는 도면 부호의 설명 중 어느 하나 이상을 도면의 여백 공간에 표기하고, 선택적으로 여백 공간에 표기된 도면 부호의 설명과 이에 대응하는 도면 포함 도면 부호 간을 연결선으로 연결하여 도면 포함 도면 부호에 대응되는 도면 부호의 설명을 쉽게 발견할 수 있도록 처리하는 방법3) Mark any one or more of the descriptions of the reference numerals in which the collision/overlapping phenomenon occurs in the blank space of the drawing, and optionally connect the description of the reference numerals marked in the blank space and the corresponding reference numerals with a connecting line. How to easily find descriptions of reference numbers corresponding to reference numbers with drawings

도 14 내지 도 16에는 도 13의 도면 부호의 설명 배치 프로세스 이외에도 다른 도면 부호의 설명 배치 프로세스가 개시되어 있다.In addition to the explanatory arrangement process of reference numerals in FIG. 13 , other explanatory arrangement processes are disclosed in FIGS. 14 to 16 .

도 14는 본 발명의 컴퓨터 장치(1000)의 도면 부호의 설명 배치 프로세스에 대한 일 실시예적 구현예이다.Fig. 14 is an exemplary implementation of the description arrangement process of the reference numerals of the computer device 1000 of the present invention.

도 14에서 예시되듯이 상기 컴퓨터 장치(1000)는 제n 도면 포함 도면 부호 위치 좌표, 제n 도면 부호의 설명 텍스트 입수(S121)하고, 제n 도면 부호의 설명 텍스트의 길이를 입수(S122)하고, 제n 도면 부호의 설명 텍스트의 길이를 반지름으로 하고, 제n 도면 포함 도면 부호 블록의 우측면 중심에서 제n 도면 부호의 설명 텍스트 길이를 반지름으로 하는 반원을 형성(S123)하고, 반원의 내에서 기 설정된 각도 단위로 제n 도면 부호의 설명 텍스트 공간과 제1 내지 제n-1 도면 부호의 설명 텍스트가 최소로 충돌하는 각도 결정(S124)하고, 결정된 최소 충돌 각도 데이터를 저장(S125)하는 방식으로 프로세싱 한다.As illustrated in FIG. 14 , the computer device 1000 obtains the position coordinates of the reference numerals including the n-th reference number, the explanatory text of the n-th reference number (S121), and obtains the length of the description text of the n-th reference number (S122), , forming a semicircle with the length of the explanatory text of the nth reference number as the radius, and the length of the explanatory text of the nth reference number as the radius at the center of the right side of the reference block including the nth drawing (S123), and within the semicircle A method of determining the minimum collision angle between the explanatory text space of the n-th reference number and the explanatory text of the first to n-1 reference numerals in a preset angle unit (S124), and storing the determined minimum collision angle data (S125) processed with

도 15는 본 발명의 컴퓨터 장치(1000)의 다른 도면 부호의 설명 배치 프로세스에 대한 일 실시예적 구현예이다.15 is an exemplary implementation of the description arrangement process of another reference numeral of the computer device 1000 of the present invention.

도 15에서 예시되듯이 상기 컴퓨터 장치(1000)는 제n 도면 포함 도면 부호 위치 좌표, 제n 도면 부호의 설명 텍스트 입수(S131)하고, 제n 도면 부호의 설명 텍스트의 길이를 입수(S132)하고, 제n도면 포함 도면 부호 블록의 하단에 제1 내지 제n-1 도면 부호의 설명 텍스트와 최소로 충돌하는 각도로 제n 도면 부호의 설명 텍스트 공간을 결정(S133)하고, 결정된 최소 충돌 각도 데이터를 저장(S134)하는 방식으로 프로세싱 한다.As illustrated in FIG. 15 , the computer device 1000 obtains the position coordinates of the reference numerals including the nth drawing, the explanatory text of the nth reference number (S131), and obtains the length of the description text of the nth reference number (S132), , determine the explanatory text space of the n-th reference number at an angle that minimally collides with the description text of the first to n-1 reference numbers at the bottom of the reference block including the n-th drawing (S133), and the determined minimum collision angle data is processed in such a way as to store (S134).

도 16은 본 발명의 컴퓨터 장치(1000)의 근접 도면 포함 도면 부호 클러스터 발굴 프로세스에 대한 일 실시예적 구현예이다.16 is an exemplary implementation of a process for excavating reference clusters with a close-up view of the computer device 1000 of the present invention.

도 16에서 예시되듯이 상기 컴퓨터 장치(1000)는 2 이상의 근접 도면 포함 도면 부호 클러스터를 발굴(S141)하고, 근접 도면 포함 도면 부호 클러스터의 표시 밀도를 계량(S142)하고, (마름모) 표시 밀도가 기 설정된 수준 이상인가? (S143)하고, (Yes) 도면 부호의 설명 배치 전략 데이터를 생성하지 않고, 도면 내 여백 공간의 위치 정보를 생성(S144)하고, (No) 도면 부호의 설명 배치 전략 데이터를 생성(S145)하는 방식으로 프로세싱 한다.As illustrated in FIG. 16 , the computer device 1000 excavates (S141) two or more reference number clusters including adjacent drawings, measures the display density of reference number clusters including adjacent drawings (S142), and (Rhombus) display density is Is it above the preset level? (S143), (Yes) to generate position information of the blank space in the drawing (S144) without generating explanatory arrangement strategy data for reference numerals (S144), and (No) to generate explanatory arrangement strategy data for reference marks (S145) process in a way

도 17은 본 발명의 컴퓨터 장치(1000)의 도면 내 여백 공간의 위치 정보를 생성 프로세스에 대한 일 실시예적 구현예이다.17 is an exemplary implementation of a process for generating position information of a blank space in a drawing of the computer device 1000 of the present invention.

도 17에서 예시되듯이 상기 컴퓨터 장치(1000)는 근접 도면 포함 도면 부호 클러스터에 포함되는 전체 도면 포함 도면 부호 또는 적어도 하나 이상의 도면 포함 도면 부호를 추출(S151)하고, 추출된 도면 포함 도면 부호 및 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명이 표시되기 위한 필요 여백 공간을 계산(S152)하고, 계산된 상기 필요 여백 공간에 대응되며, 도면 상에 할당되는 도면 내 여백 공간의 위치를 결정(S153) 처리하는 방식으로 프로세싱 한다.As exemplified in FIG. 17 , the computer device 1000 extracts ( S151 ) all reference numerals including drawings or at least one reference number included in the adjacent reference reference cluster, and extracts the extracted reference numbers and the reference numbers including drawings. A required blank space for displaying a description of a reference number corresponding to a reference numeral including a drawing is calculated (S152), and the position of the blank space in the drawing that corresponds to the calculated necessary blank space and is allocated on the drawing is determined (S153) ) processing method.

여백 공간에 표시되는 도면 부호의 설명은 겹침/충돌이 발생하는 도면 부호의 설명을 대상으로 하며, 상대적으로 중요도가 낮은 도면 부호의 설명이 여백 공간에 표시되도록 처리하는 것이 바람직할 것이다. 상대적으로 중요도가 낮은 도면 부호의 설명의 예시는 다른 도면에서도 빈번하게 등장하는 도면 부호의 설명이거나, 반대로 상위 계층의 도면 포함 도면 부호에 대응되는 도면 부호의 설명을 들 수 있다.The description of the reference numerals displayed in the blank space is targeted for the description of the reference numerals in which overlap/collision occurs, and it would be preferable to process the description of the reference numerals with relatively low importance to be displayed in the blank space. Examples of the description of reference numerals having relatively low importance include descriptions of reference numerals frequently appearing in other drawings, or, conversely, descriptions of reference numerals corresponding to reference numerals including drawings of higher layers.

상기 도면 부호의 설명은 도면 이미지에 강한 결합(hard binding) 방식으로 처리되어 물리적으로 일체(단일 파일에 도면 포함 도면 부호와 도면 부호의 설명이 모두 존재하는 방식 또는 레이어 개념이 적용되지 않는 방식)로 존재할 수도 있다. 하지만, 사용자의 컴퓨터에 도면이 표시될 때, 도면 이미지와 도면 부호의 설명 레이어 정보가 결합되어 제공되는 약한 결합(soft binding) 방식이 더욱 더 바람직할 수 있다. 이를 위하여, 상기 컴퓨터 장치(1000)가 도면 부호의 설명 레이어를 도면 이미지와는 독립적으로 생성하고, 도면 부호의 설명 레이어 정보를 도면 이미지와는 독립적으로 저장한다. 도면 이미지와 도면 부호의 설명 레이어 정보가 독립적으로 관리되면, 상기 컴퓨터 장치(1000) 또는 상기 컴퓨터 장치(1000)의 기능을 사용하는 제3의 시스템의 사용자에 의해 특정한 도면이 호출될 때, 상기 도면에 대응되는 도면 부호의 설명 레이어 정보도 함께 호출 될 수 있다. 도면 부호의 설명 레이어를 구성하고 및 도면 부호의 설명 레이어를 도면 포함 도면 부호에 겹쳐서 사용자에게 제공되는 것은 상기 컴퓨터 장치(1000), 상기 제3의 시스템 또는 사용자 컴퓨터에서 처리될 수도 있다.The description of the reference number is processed in a hard binding method to the drawing image, so that it is physically integrated (a method in which both a reference number including a drawing and a description of a reference number exist in a single file or a method in which the layer concept is not applied) may exist. However, when the drawing is displayed on the user's computer, a soft binding method in which the drawing image and the description layer information of the reference numerals are combined and provided may be more preferable. To this end, the computer device 1000 generates a description layer of a reference number independently of the drawing image, and stores the description layer information of the reference number independently of the drawing image. If the drawing image and the descriptive layer information of the reference numerals are independently managed, when a specific drawing is called by a user of the computer device 1000 or a third system using a function of the computer device 1000, the drawing Descriptive layer information of reference numerals corresponding to may also be called. Composing the description layer of reference numerals and providing the user with the description layer of reference numerals overlaid on reference numerals including drawings may be processed by the computer device 1000 , the third system or the user computer.

도면 이미지와 도면 부호의 설명 레이어 정보가 독립적으로 관리되는 것의 장점에는 다음과 같은 것이 있다.Advantages of independently managing the drawing image and the descriptive layer information of the reference numerals are as follows.

첫째, 도면 이미지 데이터는 변동성이 거의 없지만 도면 이미지 데이터에서 추출하는 도면 포함 도면 부호 및 도면 포함 도면 부호에 대응되는 도면 부호의 설명은 상대적으로 변동성이 클 수 있다. 도면 포함 도면 부호의 인식의 정확도, 도면 포함 도면 부호와 명세서 포함 도면 부호의 맵핑, 명세서에서 도면 부호의 설명 추출 및 명세서 포함 도면 부호와 도면 부호의 설명에 대한 맵핑은 정보 처리 방식이나 정책, 우선 순위 등에 따라 가변적일 수 있다. 따라서, 도면 이미지와 도면 부호의 설명을 강하게 결합하는 경우, "도면 포함 도면 부호 vs. 도면 부호의 설명"에서 변동이 발생하는 경우에는 과거에 생성되어 있던 가공 도면을 폐기해야 하는 문제가 발생할 수도 있다.First, although there is little variability in the drawing image data, the reference numerals with drawings extracted from the drawing image data and the description of the reference numbers corresponding to the reference numbers including the drawing may have relatively large variability. Accuracy of recognition of reference numerals with drawings, mapping of reference numbers with drawings and reference numbers with specifications, extraction of descriptions of reference numbers from specifications, and mapping of reference numbers with drawings and descriptions of reference numbers are related to information processing methods or policies, priorities and the like may be variable. Therefore, when a drawing image and a description of a reference number are strongly combined, if there is a change in "a reference number with a drawing vs. a description of a reference number", there may be a problem of discarding the processed drawings that have been created in the past. .

둘째, 도면 부호의 설명은 번역의 대상이 될 수 있다. 영어로 된 도면 부호의 설명을 기계 번역 등의 번역을 수행하여 자신이 원하는 언어로 표시되게 하기 위해서는 번역 기능을 제공하는 프로그램/서비스도 필요하지만 무엇보다도 도면 부호의 설명이 이미지가 아닌 텍스트로 인지될 수 있어야 한다.Second, descriptions of reference numerals may be subject to translation. A program/service that provides a translation function is also required in order to perform translation such as machine translation for the description of the reference mark in English and display it in the desired language. should be able

셋째, 도면 부호의 설명을 표시하는 방법이 지속적으로 변동할 수도 있다. 도면 부호의 설명 배치 데이터를 구성하는 내용이 달라지거나 업데이트 되는 경우, 변경 또는 업데이트가 반영된 도면 부호의 설명이 제공될 필요가 있다.Third, the method of displaying the description of the reference numerals may be continuously changed. When the content constituting the arrangement data is changed or updated, it is necessary to provide a description of the reference numerals in which the change or update is reflected.

도 18은 본 발명의 컴퓨터 장치(1000)의 도면 부호의 설명 레이어 처리 프로세스에 대한 일 실시예적 구현예이다.18 is an exemplary implementation of a process for processing a descriptive layer of reference numerals in the computer device 1000 of the present invention.

도 18에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 부호의 설명 배치 데이터 입수(S161)하고, 도면 부호의 설명 레이어 데이터 생성(S162)하고, 도면 부호의 설명 레이어 데이터를 저장하거나, 도면 부호의 설명 레이어 데이터로 도면 부호의 설명 레이어 파일을 생성하여 저장(S163)하는 방식으로 프로세싱 한다. 상기 도면 부호의 설명 레이어 데이터는 레이어를 구성할 수 있는 도면 부호의 설명과 관련된 데이터를 말한다. 레이어를 구성하기 위한 최소 정보는 "도면 부호의 설명 + 도면 부호의 설명의 배치 위치"일 수 있다. 도면 부호의 설명 레이어 파일As illustrated in FIG. 18 , the computer device 1000 obtains descriptive arrangement data of reference numerals (S161), generates descriptive layer data of reference numerals (S162), stores descriptive layer data of reference numerals, or Processing is performed in such a way that a description layer file of reference numerals is created as the description layer data and stored (S163). The description layer data of the reference number refers to data related to the description of the reference number constituting the layer. The minimum information for constituting the layer may be "a description of a reference number + an arrangement position of a description of a reference number". Descriptive Layer File of Reference Signs

도 19는 본 발명의 컴퓨터 장치(1000)의 도면 부호의 설명 배치 데이터를 생성 프로세스에 대한 일 실시예적 구현예이다.19 is an exemplary implementation of a process for generating descriptive batch data of reference numerals of a computer device 1000 of the present invention.

도 19에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면 포함 도면 부호를 인식하고 도면 포함 도면 부호 속성 집합 정보를 생성(S171)하고, 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 번호의 설명을 인식하고, 상기 도면 부호의 설명에 대응하는 도면 부호의 설명 속성 집합 정보를 생성(S172)하고, 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성(S173)하는 방식으로 프로세싱 한다.As exemplified in FIG. 19 , the computer device 1000 recognizes reference numerals including drawings and generates reference number attribute set information including drawings ( S171 ), and corresponds to reference numerals including drawings and reference numbers including specifications in the specification of a patent. Recognizes the description of the reference number, generates the description attribute set information of the reference number corresponding to the description of the reference number (S172), and the description of the reference number is used to be arranged at a preset position of the reference number including the drawing Processing is performed in such a way that the description arrangement data of the reference numerals is generated (S173).

많은 도면에서 도면 포함 도면 부호는 계층형으로 구성되는 경우가 많다. 예를 들면, 1000이 최상위 도면 포함 도면 부호라면, 1100이나 1200은 차상위 도면 포함 도면 부호인 경우가 많으며, 1111또는 1111a 등은 최하위 도면 포함 도면 부호인 경우가 많다. 이와 같은 계층 구조를 반영하여 도면 포함 도면 부호에 대응되는 도면 부호의 설명의 폰트 크기를 계층 구조의 속성에 연동하여 조절하거나, 색깔을 다르게 부여할 수도 있을 것이다. 예를 들면 하기 표 4와 같은 도면 부호의 설명 배치 데이터를 생성할 수 있다.In many drawings, reference numerals including drawings are often organized in a hierarchical manner. For example, if 1000 is the highest-order reference numeral, 1100 or 1200 are often the second-most high-order reference numerals, and 1111 or 1111a are often the lowest-order reference numerals. By reflecting such a hierarchical structure, the font size of the description of the reference numerals corresponding to the reference numerals including the drawings may be adjusted in association with the properties of the hierarchical structure, or different colors may be assigned. For example, description arrangement data of reference numerals as shown in Table 4 below may be generated.

도면 포함 도면 부호Drawings with Drawings 도면 부호의 설명 단어수Number of descriptive words in reference numbers 도면 부호의 설명 길이Description Length of Reference Numbers 도면 부호의 설명 폰트 상대 크기Description Font Relative Size of Reference Numbers 도면 부호의 설명 색깔Descriptive color of reference numbers 도면 부호의 설명 위치Description Location of Reference Numbers 개행 처리newline processing 도면 부호의 설명 축약 적용Apply descriptive abbreviations for reference numbers 10001000 1One 1010 big blackblack 우측right xx xx 11001100 22 1515 middle blueblue 우측right xx xx 11101110 22 2020 cow sky blue(투명도 75%)sky blue (transparency 75%) 아래under xx oo 11111111 33 3030 count sky blue(투명도 50%)sky blue (50% transparency) 아래 하단bottom bottom xx oo 11201120 33 1515 cow dark blue(투명도 75%)dark blue (transparency 75%) 우측right oo xx 12001200 22 1515 middle BrownBrown 우측 상단in the upper-right xx xx

상기 표 4와 같은 데이터는 도면 기반 데이터부(1310)에 저장되며, 집계 정보는 집계 데이터부(1350)에도 저장될 수 있다.The data shown in Table 4 may be stored in the drawing-based data unit 1310 , and aggregate information may also be stored in the aggregate data unit 1350 .

상기 예시의 도면 부호의 설명 위치 칼럼에서 "우측"은 도면 포함 도면 부호의 문자열의 나열 방향인 우향과 같은 방향의 연장되는 위치에 도면 부호의 설명이 표시됨을 의미한다. 한편, 도면 포함 도면 부호의 문자열 나열 방향이 우향인 경우에라도 도면 부호의 설명은 도면 포함 도면 부호의 아래 또는 위에 표시될 수도 있다. 통상적인 도면 포함 도면 부호의 문자열 나열 방향은 우향인 것이 일반적이나 경우에 따라서는 상향 또는 하향 또는 일정한 각도를 가지는 방향도 있다. 이 경우에도 문자열의 나열 방향의 연장 방향에 도면 부호의 설명이 표시되는 것이 통상적으로 바람직하다."Right" in the description position column of reference numerals in the above example means that descriptions of reference numbers are displayed at positions extending in the same direction as the right direction, which is the arrangement direction of character strings of reference numerals including drawings. On the other hand, even when the string arrangement direction of the reference numerals including the drawings is to the right, the descriptions of the reference numerals may be displayed below or above the reference numerals including the drawings. In general, the string arrangement direction of reference numerals including drawings is to the right, but in some cases, there is also a direction having an upward or downward direction or a certain angle. Also in this case, it is generally preferable that the descriptions of reference numerals are displayed in the extending direction of the string arrangement direction.

상기 도면 부호의 설명 위치는 정확하게 지정될 필요성이 있다. 가장 보편적인 방법은 도면 부호의 설명 위치를 결정하기 위한 4개의 좌표값(도면 부호의 설명이 표시되는 직사각형 도면 부호의 설명 블록에 대응되는 4개의 꼭지점의 좌표값)을 도입하는 것이다. 도면 포함 도면 부호의 위치 정보도 4개의 좌표값으로 구성되는 것이 바람직할 것이다.The explanatory positions of the reference numerals need to be precisely designated. The most common method is to introduce four coordinate values (coordinate values of four vertices corresponding to the description block of a rectangular reference number in which the description of the reference number is indicated) for determining the description position of the reference number. It will be preferable that the location information of reference numerals including drawings also consists of four coordinate values.

도 20은 본 발명의 컴퓨터 장치(1000)의 복합 도면을 전처리 프로세스에 대한 일 실시예적 구현예이다.20 is an exemplary implementation of a process for preprocessing a composite diagram of the computer device 1000 of the present invention.

도 20에서 예시되듯이 상기 컴퓨터 장치(1000)는 도면에서 도면 번호의 개수를 식별(S181)하고, 도면 번호의 개수가 2 이상인 경우, 상기 도면을 도면 번호의 개수만큼 절단하여 독립 도면 데이터를 생성(S182)하는 방식으로 프로세싱 한다.As illustrated in FIG. 20 , the computer device 1000 identifies the number of drawing numbers in the drawing ( S181 ), and when the number of drawing numbers is 2 or more, the drawing is cut by the number of drawing numbers to generate independent drawing data. (S182) to process.

도면 번호의 개수는 "Fig. + 숫자"나 "도 + 숫자"와 같은 독립적인 도면 번호를 가지는 표현이 단일 도면 이미지 파일에 몇 개 존재하는 가를 파악하는 것을 말한다. 상기 컴퓨터 장치(1000)는 독립적인 도면 번호를 가지는 표현 단위로 도면을 물리적으로 분할 처리하고, 분할된 도면을 대상으로 본 발명 사상을 적용할 수 있다.The number of drawing numbers refers to determining how many expressions with independent drawing numbers such as "Fig. + number" or "Figure + number" exist in a single drawing image file. The computer device 1000 may physically divide a drawing into an expression unit having an independent reference number, and apply the inventive concept to the divided drawing.

이어, 상기 컴퓨터 장치(1000)가 가공 도면 데이터를 생성하는 프로세스에 대해서 설명한다.Next, a process in which the computer device 1000 generates processed drawing data will be described.

도 21은 본 발명의 컴퓨터 장치(1000)의 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.21 is an exemplary embodiment of the processing drawing data generation process of the computer device 1000 of the present invention.

도 21에서 예시되듯이 상기 컴퓨터 장치(1000)는 오리지널 도면 파일 입수(S191)하고, 도면 파일에 대응되는 도면 부호의 설명 배치 데이터 입수(S192)하고, 도면 부호의 설명 배치 데이터를 참조하여 도면 포함 도면 부호 주변에 도면 부호의 설명을 물리적으로 삽입한 가공 도면 파일을 생성(S193)하는 방식으로 프로세싱 한다. 가공 도면 파일은 가공 도면 파일 저장부(1212)에 저장된다. 이때, 가공 도면 파일은 상기 도면 부호의 설명을 적어도 1개 이상의 다른 언어로 번역한 번역 도면 부호의 설명을 사용하여 제작할 수도 있을 것이다.As illustrated in FIG. 21 , the computer device 1000 obtains an original drawing file (S191), obtains descriptive arrangement data of reference numerals corresponding to the drawing file (S192), and includes drawings with reference to the descriptive arrangement data of reference numbers Processing is performed in a manner of generating a processed drawing file in which the description of the reference number is physically inserted around the reference number (S193). The machining drawing file is stored in the machining drawing file storage unit 1212 . In this case, the processed drawing file may be produced using the description of the translated reference numerals translated into at least one or more other languages.

상기 컴퓨터 장치(1000)는 1개의 특허에 포함되어 있는 복수 개의 도면에 대하여, 도 21에 나타나 있는 단계를 수행하여 가공 도면 파일을 저장할 수 있다. 상기 컴퓨터 장치(1000)는 개별 도면에 대한 요청이 있는 경우, 저장된 가공 도면 파일을 호출하여 전송한다.The computer device 1000 may store a processed drawing file by performing the steps shown in FIG. 21 for a plurality of drawings included in one patent. When there is a request for an individual drawing, the computer device 1000 calls and transmits the stored processed drawing file.

한편, 상기 컴퓨터 장치(1000)는 가공 도면 파일을 포함하는 가공 공보 파일을 생성하여 저장할 수 있을 것이다. 상기 컴퓨터 장치(1000)는 종래의 공보 파일 제작 시에 사용하는 오리지널 도면을 본 발명의 가공 도면 파일을 대체하여 사용하는 방식으로 공보 파일(pdf 또는 기타 파일 포맷의 파일)을 생성할 수 있다.Meanwhile, the computer device 1000 may generate and store a machining publication file including a machining drawing file. The computer device 1000 may generate a publication file (a file in a pdf or other file format) by using the original drawing used in the production of the conventional publication file as a substitute for the processed drawing file of the present invention.

상기 컴퓨터 장치(1000)는 개별 특허에 대한 요청이 있는 경우에는 생성된 상기 가공 도면 파일을 전송해 줄 수 있다.The computer device 1000 may transmit the generated processed drawing file when there is a request for an individual patent.

도 22는 본 발명의 컴퓨터 장치(1000)의 다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.22 is an exemplary embodiment of another processing drawing data generation process of the computer device 1000 of the present invention.

도 22에서 예시되듯이 상기 컴퓨터 장치(1000)는 오리지널 도면 파일 입수(S201)하고, 도면 파일에 대응되는 도면 부호의 설명 배치 데이터 입수(S202)하고, 도면 부호의 설명 배치 데이터 레이어 생성(S203)하고, 오리지널 도면 레이어와 도면 부호의 설명 배치 데이터 레이어가 논리적으로 결합(soft binding)된 가공 도면 파일을 생성(S204)하는 방식으로 프로세싱 한다. 논리적으로 결합(soft binding)된 가공 도면 파일은 가공 도면 파일 저장부(1212)에 저장될 수도 있지만, 저장하지 않고 실시간 생성 및 사용 후 저장하지 않을 수도 있다.As illustrated in FIG. 22 , the computer device 1000 obtains an original drawing file (S201), obtains descriptive arrangement data of reference numerals corresponding to the drawing file (S202), and creates a descriptive arrangement data layer of reference numbers (S203) and processing in such a way that a processing drawing file in which the original drawing layer and the description arrangement data layer of the reference numerals are logically combined (soft binding) is generated (S204). The logically coupled (soft binding) machining drawing file may be stored in the machining drawing file storage unit 1212, but may not be saved in real time without saving and after use.

상기 컴퓨터 장치(1000)는 1개의 특허에 포함되어 있는 복수 개의 도면에 대하여, 도 22에 나타나 있는 단계를 수행하여 가공 도면 파일을 저장할 수 있다. 가공 도면 데이터를 저장하는 첫번째 방법은 오리지널 이미지가 있는 레이어 및 도 27, 도 28, 도 32, 도 33과 같은 도면 부호의 설명 배치 데이터가 실제로 배치되어 있는 도면 부호의 설명 레이어와 같은 2개 또는 그 이상의 레이어를 1개의 이미지 파일에 함께 저장하는 방식이다. 가공 도면 데이터를 저장하는 두번째 저장 방식은 오리지널 이미지가 있는 파일과 분리하여 도 27, 도 28, 도 32, 도 33과 같은 도면 부호의 설명 배치 데이터가 실제로 배치되어 있는 도면 부호의 설명 레이어가 별로의 파일로 저장하는 방식이다. 물론, 이때 두 파일 간의 상호 연결성이 용이하도록 하는 관계 맵핑 정보는 별도 데이터로 저장될 수 있다.The computer device 1000 may store the processed drawing file by performing the steps shown in FIG. 22 for a plurality of drawings included in one patent. The first method of storing the processing drawing data is two or more such as a layer with an original image and a description layer of a reference number in which the description arrangement data of reference numerals such as Figs. 27, 28, 32, 33 are actually placed. This is a method of saving the above layers together in one image file. The second storage method for storing processed drawing data is to separate the file with the original image, and the description layer of the reference number in which the description arrangement data of the reference number such as Figs. 27, 28, 32, and 33 is actually arranged How to save it as a file. Of course, in this case, the relationship mapping information that facilitates the interconnectivity between the two files may be stored as separate data.

상기 컴퓨터 장치(1000)는 개별 도면에 대한 요청이 있는 경우, 저장된 가공 도면 파일을 호출하여 전송한다. 이때, 저장 방식 및 개별 도면에 대한 요청 조건에 따라 제공되는 파일은 1개 또는 2개일 수 있다. 저장은 분리된 2개의 파일로 저장되었더라도, 요청이 1개의 파일로 요청되는 경우라면 1개의 파일로 결합하여 전송할 수 있을 것이다. 결합도 논리적 결합(soft binding) 또는 물리적 결합(physical binding) 중 어느 하나가 선택될 수 있을 것이다. 만약 타 장치(2000)가 논리적 결합된 이미지를 처리할 수 있을 경우, 논리적 결합으로 된 가공 이미지 데이터를 전송할 수 있을 것이다.When there is a request for an individual drawing, the computer device 1000 calls and transmits the stored processed drawing file. In this case, one or two files may be provided according to the storage method and request conditions for individual drawings. Even if the storage is saved as two separate files, if the request is requested as one file, it may be combined and transmitted as one file. As for the binding, either logical binding (soft binding) or physical binding (physical binding) may be selected. If the other device 2000 can process the logically combined image, the logically combined processed image data may be transmitted.

타 장치(2000)에 설치되거나 전송되거나 구동되거나 구동을 요청하는 프로그램(미도시)은 상기 가공 이미지 데이터에서 논리적으로 결합된 도면 부호의 설명 레이어에서 도면 부호의 설명을 읽어와서 번역 서비스를 제공하는 제3의 프로그램(미도시) 또는 제3의 서버(미도시)에 전송하고, 번역 결과를 전송 받아 도면 부호의 설명 레이어를 대체하거나, 도면 부호의 설명 레이어에 있는 도면 부호의 설명을 대체할 수 있도록 하는 정보 처리를 지원할 수도 있을 것이다.A program (not shown) installed, transmitted, driven, or requesting operation in another device 2000 reads the description of the reference number from the description layer of the reference number logically combined in the processed image data and provides a translation service Send to the third program (not shown) or a third server (not shown), and receive the translation result to replace the description layer of the reference number, or to replace the description of the reference number in the description layer of the reference number It may be able to support the processing of information.

한편, 상기 컴퓨터 장치(1000)는 특정한 언어로 된 도면 부호의 설명을 요청하는 타 장치(2000)이 있는 경우, 상기 도면 부호의 설명 레이어에서 도면 부호의 설명을 읽어와서 번역 서비스를 제공하는 자체 프로그램(미도시)나 자체 서버(미도시)나 제3의 프로그램(미도시) 또는 제3의 서버(미도시)에 전송하고, 번역 결과를 전송 받아, 도면 부호의 설명을 대체한 도면 부호의 설명 레이어 파일을 타 장치(2000)에 전송할 수 있을 것이다.On the other hand, when there is another device 2000 requesting an explanation of reference numerals in a specific language, the computer device 1000 reads the descriptions of the reference numbers from the description layer of the reference numbers and provides a translation service. (not shown) or its own server (not shown), a third program (not shown), or a third server (not shown), receives the translation result, and replaces the description of the reference number. The layer file may be transmitted to the other device 2000 .

그리고, 상기 컴퓨터 장치(1000)는 가공 도면 파일을 포함하는 가공 공보 파일을 생성하여 저장할 수 있을 것이다. In addition, the computer device 1000 may generate and store a machining publication file including a machining drawing file.

상기 컴퓨터 장치(1000)는 종래의 공보 파일 제작 시에 사용하는 오리지널 도면을 본 발명의 가공 도면 파일을 대체하여 사용하는 방식으로 공보 파일(pdf 또는 개별적인 가공 도면 이미지 파일 및 그 파일로의 링크가 포함된 xml 파일 또는 기타 파일 포맷의 파일)을 생성할 수 있다. 이때, 공보 파일이 다층 레이어 포맷의 이미지 파일을 허용하는 경우에는 상기 가공 이미지 파일은 오리지널 이미지 레이어와 도면 부호의 설명 레이어가 논리적 결합(soft binding)된 형태로 처리하는 것이 바람직할 것이다. 한편, 상기 공보 파일을 읽는 프로그램이 이미지 파일의 레이어를 허용하는 경우, 상기 컴퓨터 장치(1000)는 공보에 포함되어야 할 모든 도면 파일을 본 발명의 가공 도면 파일로 처리하여, 상기 프로그램이 읽을 수 있도록 제공할 수 있을 것이다.The computer device 1000 includes a publication file (pdf or individual processed drawing image file and a link to the file) in such a way that the original drawing used in the production of the conventional publication file is used instead of the processed drawing file of the present invention. xml file or other file format). At this time, when the publication file allows an image file in a multi-layered layer format, it is preferable to process the processed image file in a form in which the original image layer and the reference layer are logically combined (soft binding). On the other hand, when the program reading the publication file allows the layer of the image file, the computer device 1000 processes all drawing files to be included in the publication as the processed drawing file of the present invention so that the program can read it. will be able to provide

상기 컴퓨터 장치(1000)는 개별 특허에 대한 요청이 있는 경우에는 상기 컴퓨터 장치(1000)가 생성한 상기 가공 도면 파일을 전송해 줄 수 있다.When there is a request for an individual patent, the computer device 1000 may transmit the processed drawing file generated by the computer device 1000 .

상기의 본 발명 사상은 도 23 및 도 24와 관련하여서도 적용될 수 있는 범위 내에서는 그대로 또는 변형하여 적용될 수 있을 것이다.The spirit of the present invention may be applied as it is or modified within the range that can be applied also in relation to FIGS. 23 and 24 .

도 23은 본 발명의 컴퓨터 장치(1000)의 또다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.23 is an exemplary implementation of another processing drawing data generating process of the computer device 1000 of the present invention.

도 23에서 예시되듯이 상기 컴퓨터 장치(1000)는 오리지널 도면 파일 입수(S211)하고, 도면 파일에 대응되는 도면 부호의 설명 배치 데이터 입수(S212)하고, 도면 부호의 설명 배치 데이터 레이어 정보를 생성(S213)하고, 오리지널 도면 파일에 도면 부호의 설명 배치 데이터 레이어 정보의 연동을 지원하는 연동 정보 삽입(S214)하는 방식으로 프로세싱 한다. 오리지널 도면 파일에 삽입되어 있는 연동 정보를 통하여 상기 오리지널 도면 파일을 처리하는 프로세스는 도면 부호의 설명 배치 데이터 레이어 정보를 입수하여 오리지널 도면과 강한 결합 처리를 하거나 약한 결합 처리를 수행할 수 있다.As illustrated in FIG. 23 , the computer device 1000 obtains an original drawing file ( S211 ), obtains descriptive arrangement data of reference numbers corresponding to the drawing file ( S212 ), and generates descriptive arrangement data layer information of reference numbers ( S212 ). S213), and processing is performed in a manner of inserting (S214) interworking information supporting interworking of reference, arrangement data, and layer information of reference numerals in the original drawing file. The process of processing the original drawing file through the interlocking information inserted in the original drawing file may obtain the description arrangement data layer information of the reference numerals and perform strong coupling or weak coupling with the original drawing.

도 24는 본 발명의 컴퓨터 장치(1000)의 또다른 가공 도면 데이터 생성 프로세스에 대한 일 실시예적 구현예이다.24 is an exemplary implementation of another process drawing data generating process of the computer device 1000 of the present invention.

도 24에서 예시되듯이 상기 컴퓨터 장치(1000)는 오리지널 도면 파일 입수(S221)하고, 도면 파일에 대응되는 도면 부호의 설명 배치 데이터 입수(S222)하고, 도면 부호의 설명 배치 데이터 레이어 파일 생성(S223)하고, 오리지널 도면 파일과 도면 부호의 설명 배치 데이터 레이어 파일 간의 연동을 지원하는 도면 연동 데이터 생성(S224)하는 방식으로 프로세싱 한다. 오리지널 도면 파일에 삽입되어 있는 연동 정보를 통하여 상기 오리지널 도면 파일을 처리하는 프로세스는 도면 부호의 설명 배치 데이터 레이어 파일을 입수하여 오리지널 도면과 강한 결합 처리를 하거나 약한 결합 처리를 수행할 수 있다As illustrated in FIG. 24 , the computer device 1000 obtains an original drawing file (S221), obtains descriptive arrangement data for reference numerals corresponding to the drawing file (S222), and creates a descriptive arrangement data layer file for reference marks (S223) ) and processing in a manner of generating (S224) drawing interworking data that supports interworking between the original drawing file and the reference arrangement data layer file. The process of processing the original drawing file through the interlocking information inserted in the original drawing file may obtain the description arrangement data layer file of the reference number and perform strong coupling processing with the original drawing or weak coupling processing.

도 25는 본 발명 사상 적용 전의 도면에 대한 예시이다. 상대적으로 간단한 도면이나 이 도면의 도면 포함 도면 부호에는 도면 부호의 설명이 부가되어 있지 않다.25 is an illustration of the drawing before application of the inventive concept. Although it is a relatively simple drawing, the reference numerals in these drawings are not accompanied by descriptions of the reference numerals.

도 26은 본 발명 사상 적용 후의 사용자가 체감할 수 있는 도면에 대한 예시이다. 도 25의 도면에 도면 부호의 설명이 부가된 본 발명이 적용된 도면이다.26 is an example of a drawing that a user can feel after applying the spirit of the present invention. 25 is a view to which the present invention is applied to which descriptions of reference numerals are added to the drawing of FIG.

도 27은 본 발명 사상이 적용된 도면 부호의 설명 레이어에 대한 예시이다. 도 25의 도면과 관련된 도면 부호의 설명이 배치되어 있는 도면 부호의 설명 레이어 도면이다.27 is an example of a description layer of a reference numeral to which the spirit of the present invention is applied. It is an explanatory layer diagram of reference numerals in which descriptions of reference numerals related to the drawing of FIG. 25 are arranged.

도 28은 도면 부호의 설명 레이어에 오리지널 도면 부호의 설명이 아닌 번역된 도면 부호의 설명이 나타나는 일 예시이다. 도 25의 도면과 관련된 도면 부호의 설명이 다른 언어로 제공되는 도면 부호의 설명 레이어 도면이다.28 is an example in which descriptions of translated reference numbers instead of descriptions of original reference numerals appear in the description layer of reference numerals. It is an explanatory layer diagram of a reference number in which descriptions of reference numerals related to the drawing of FIG. 25 are provided in different languages.

도면 부호에 오리지널 도면 부호의 설명이 있는 경우, 기계 번역 또는 기타의 번역 과정을 통하여 번역된 도면 부호의 설명이 생성될 수 있을 것이다. 하기 표 5는 도 25와 관련된 오리지널 도면 부호의 설명과 다른 언어로 된 도면 부호의 설명이 쌍으로 나타나 있는 데이터의 예시가 된다.When a reference number has a description of the original reference number, the translated reference number description may be generated through machine translation or other translation process. Table 5 below is an example of data in which descriptions of original reference numerals related to FIG. 25 and descriptions of reference numerals in other languages are shown in pairs.

도면drawing 도면 부호drawing sign 도면 부호의 설명(오리지널)Explanation of reference numerals (original) 도면 부호의 설명(번역)Description (translation) of reference numerals fig. 10fig. 10 2424 substratesubstrate 기판Board fig. 10fig. 10 302302 thin-film transistor structuresthin-film transistor structures 박막 트랜지스터 구조체들thin film transistor structures fig. 10fig. 10 306306 Gate insulator layerGate insulator layer 게이트 절연체 층gate insulator layer fig. 10fig. 10 308308 silicon layer silicon layer 실리콘 층silicone layer fig. 10fig. 10 310310 silicon layer silicon layer 실리콘 층silicone layer fig. 10fig. 10 312312 Oxide layeroxide layer 산화물 층oxide layer fig. 10fig. 10 314314 gategate 게이트gate fig. 10fig. 10 316316 metal structuresmetal structures 금속 구조체들metal structures fig. 10fig. 10 318318 metal structuresmetal structures 금속 구조체들metal structures fig. 10fig. 10 320320 Passivation layerPassivation layer 패시베이션 층passivation layer fig. 10fig. 10 322322 metal structuresmetal structures 금속 구조체들metal structures

도 29는 번역된 도면 부호의 설명이 적용된 사용자가 체감할 수 있는 도면에 대한 예시이다.29 is an example of a drawing that a user can experience to which explanations of translated reference numerals are applied.

도 29는 본 발명 사상 적용 전의 도면에 대한 다른 예시이다. 상대적으로 간단한 도면이나 이 도면의 도면 포함 도면 부호에는 도면 부호의 설명이 부가되어 있지 않다.29 is another example of the drawing before the application of the spirit of the present invention. Although it is a relatively simple drawing, the reference numerals in these drawings are not accompanied by descriptions of the reference numerals.

도 30은 본 발명 사상 적용 전의 도면에 대한 다른 예시이다.30 is another example of the drawing before application of the inventive concept.

도 31은 본 발명 사상 적용 후의 사용자가 체감할 수 있는 도면에 대한 다른 예시이다. 도 30의 도면에 도면 부호의 설명이 부가된 본 발명이 적용된 도면이다.31 is another example of a drawing that a user may feel after applying the spirit of the present invention. It is a view to which the present invention is applied with explanations of reference numerals added to the drawing of FIG. 30 .

도 32은 본 발명 사상이 적용된 도면 부호의 설명 레이어에 대한 다른 예시이다. 도 30의 도면과 관련된 도면 부호의 설명이 배치되어 있는 도면 부호의 설명 레이어 도면이다.32 is another example of a description layer of a reference numeral to which the spirit of the present invention is applied. It is an explanatory layer diagram of reference numerals in which descriptions of reference numerals related to the drawing of FIG. 30 are arranged.

도 33는 도면 부호의 설명 레이어에 오리지널 도면 부호의 설명이 아닌 번역된 도면 부호의 설명이 나타나는 다른 예시이다. 도 30의 도면과 관련된 도면 부호의 설명이 다른 언어로 제공되는 도면 부호의 설명 레이어 도면이다.33 is another example in which descriptions of translated reference numbers instead of descriptions of original reference numerals appear in the description layer of reference numbers. It is an explanatory layer diagram of a reference number in which descriptions of reference numerals related to the drawing of FIG. 30 are provided in different languages.

하기 표 6는 도 30와 관련된 오리지널 도면 부호의 설명과 다른 언어로 된 도면 부호의 설명이 쌍으로 나타나 있는 데이터의 예시가 된다.Table 6 below is an example of data in which descriptions of original reference numerals related to FIG. 30 and descriptions of reference numerals in other languages are shown in pairs.

도면drawing 도면 부호drawing sign 도면 부호의 설명(오리지널)Explanation of reference numerals (original) 도면 부호의 설명(번역)Description (translation) of reference numerals fig. 3fig. 3 2424 substratesubstrate 기판Board fig. 3fig. 3 4242 light-emitting diode cathode terminallight-emitting diode cathode terminal 발광 다이오드 캐소드 단자light emitting diode cathode terminal fig. 3fig. 3 4444 light-emitting diode anode terminallight-emitting diode anode terminal 발광 다이오드 애노드 단자light emitting diode anode terminal fig. 3fig. 3 4646 dielectric layerdielectric layer 유전체 층dielectric layer fig. 3fig. 3 4747 Organic light-emitting diode emissive materialOrganic light-emitting diode emissive material 유기 발광 다이오드 방출 재료organic light emitting diode emitting material fig. 3fig. 3 5050 Planarization layerplanarization layer 편광 층polarization layer fig. 3fig. 3 5252 Thin-film transistor structuresThin-film transistor structures 박막 트랜지스터 구조체들thin film transistor structures fig. 3fig. 3 5454 buffer layerbuffer layer 버퍼 층buffer layer fig. 3fig. 3 5858 silicon transistorsilicon transistor 실리콘 트랜지스터silicon transistor fig. 3fig. 3 6060 oxide transistor oxide transistor 트랜지스터transistor fig. 3fig. 3 6262 polysilicon layerpolysilicon layer 폴리실리콘 층polysilicon layer fig. 3fig. 3 6464 gate insulator layergate insulator layer 게이트 절연체 층gate insulator layer fig. 3fig. 3 6666 metal layermetal layer 금속 층metal layer fig. 3fig. 3 6868 silicon nitride layersilicon nitride layer 실리콘 질화물 층silicon nitride layer fig. 3fig. 3 7070 silicon oxide layersilicon oxide layer 실리콘 산화물 층silicon oxide layer fig. 3fig. 3 7272 circuitrycircuitry 회로Circuit fig. 3fig. 3 7474 Source-drain contactsSource-drain contacts 소스-드레인 콘택들source-drain contacts fig. 3fig. 3 7676 Source-drain contactsSource-drain contacts 소스-드레인 콘택들source-drain contacts fig. 3fig. 3 8080 Oxide layeroxide layer 반도체성 산화물 층semiconducting oxide layer fig. 3fig. 3 8282 Source-drain terminalsSource-drain terminals 소스-드레인 단자들source-drain terminals fig. 3fig. 3 8484 Source-drain terminalsSource-drain terminals 소스-드레인 단자들source-drain terminals

도 34는 번역된 도면 부호의 설명이 적용된 사용자가 체감할 수 있는 도면에 대한 다른 예시이다.34 is another example of a drawing that a user can experience to which explanations of translated reference numerals are applied.

본 발명의 특허 정보 산업, 특허 정보 서비스 산업, 기술 정보 사업 및 기술 정보 서비스 산업에 광범위하게 활용할 수 있다.The present invention can be widely used in the patent information industry, the patent information service industry, the technical information business, and the technical information service industry.

1000 : 컴퓨터 장치
1100 : 프로세서
1200 : 파일 저장부
1300 : DB부
1400 : 통신부
3000 : 유무선 네트워크
2000 : 타 장치
1210 : 도면 파일 저장부
1211 : 오리지널 도면 파일 저장부
1212 : 가공 도면 파일 저장부
1220 : 명세서 파일 저장부
1310 : 도면 기반 데이터부
1320 : 명세서 기반 데이터부
1330 : 도면 부호의 설명 배치 데이터 데이터부
1340 : 가공 규칙 데이터부
1350 : 집계 데이터부
1000: computer device
1100 : Processor
1200: file storage
1300: DB part
1400: communication department
3000: wired and wireless network
2000: other devices
1210: drawing file storage unit
1211: original drawing file storage unit
1212: Processing drawing file storage unit
1220: statement file storage unit
1310: drawing-based data unit
1320: specification-based data unit
1330: Description arrangement data data part of reference numerals
1340: processing rule data part
1350: aggregate data unit

Claims (24)

특허 도면에 포함되어 있는 도면 부호에 도면 부호의 설명이 표시되는데 사용되는 도면 부호의 설명 표시 도면 콘텐츠가 제공되도록 처리하는 방법으로서,
컴퓨터 장치가
적어도 하나 이상의 타 장치로부터 개별 도면 단위, 개별 특허 단위 또는 기설정된 단위로 도면 부호의 설명 표시 도면 콘텐츠 요청 정보를 수신하는 단계;
상기 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하는 도면 부호의 설명 표시 도면 콘텐츠를 입수하는 단계;
상기 수신된 도면 부호의 설명 표시 도면 콘텐츠 요청 정보에 대응하여 도면 부호의 설명 표시 도면 콘텐츠를 상기 타 장치로 전송하는 단계;를 포함하며,
상기 도면 부호의 설명 표시 도면 콘텐츠는
(A) 상기 컴퓨터 장치가
(A1) 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고,
(A2) 상기 인식된 도면 포함 도면 부호에 대응하는 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계;
(B) 상기 컴퓨터 장치가 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 인식하는 단계;
(C) 상기 컴퓨터 장치가
상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 포함하며,
상기 (A1) 단계는
(A11) 상기 도면에서 숫자가 포함된 문자열을 인식하는 단계;
(A12) 상기 문자열을 처리하여 상기 도면 포함 도면 부호를 결정하는 단계; 및
(A13) 상기 도면 포함 도면 부호에 대하여 도면 포함 도면 부호의 속성 정보를 생성하는 단계;를 더 포함하는 것이며,
상기 (A12) 단계는
1) 상기 문자열이 숫자만으로 되어 있거나, 숫자와 문자의 비율이 기 설정된 비율 이하이거나, 기 설정된 길이 이하이거나, 기 설정된 도면 포함 도면 부호의 결정 패턴 규칙에 대응되는 경우에는 도면 포함 도면 부호로 결정하는 제1 도면 포함 도면 부호 결정 방식,
2) 추출된 상기 문자열이 i)상기 명세서 포함 도면 부호와 일치하거나, ii) 상기 명세서 포함 도면 부호 이전에 생성되는 명세서 포함 도면 부호 후보 집합을 구성하는 문자열과 ii-1)일치, ii-2)기 설정된 기준 이상으로의 포함 또는 ii-3)기 설정된 기준 이상으로의 부분 일치가 충족되는 경우, 추출된 상기 문자열을 상기 도면 포함 도면 부호로 결정하는 제2 도면 포함 도면 부호 결정 방식,
3) 추출된 상기 문자열이 다른 도면에서도 기 설정된 회수 이상으로 출현하는 경우에는 도면 포함 도면 부호로 결정하는 제3 도면 포함 도면 부호 결정 방식,
중 어느 하나의 방식을 사용하거나, 어느 2 이상의 방식을 결합하여 사용하는 것인 것을 특징으로 하는 방법.
A method of processing a reference number included in a patent drawing to provide an explanatory drawing content of a reference number used to indicate a description of the reference number, the method comprising:
computer device
receiving, from at least one or more other devices, drawing content request information indicating a reference number in an individual drawing unit, an individual patent unit, or a preset unit;
obtaining the descriptive-indicating drawing content of the reference-sign corresponding to the descriptive-indicating drawing content request information;
and transmitting, to the other device, the content of the drawing with the description of the reference numeral in response to the received request information for the description of the reference drawing.
The explanatory display drawing content of the reference numerals is
(A) the computer device
(A1) recognize the reference numerals included in the drawings,
(A2) generating reference number attribute set information with drawings corresponding to the recognized reference numbers;
(B) recognizing, by the computer device, descriptions of reference numerals with specifications in the specification of the patent and reference numbers corresponding to the reference numbers with the specification;
(C) the computer device
Using the reference number with the drawing, the reference number with the specification, and the description of the reference number, generating the description arrangement data of the reference number used for the description of the reference number to be arranged at a preset position of the reference number including the drawing step; including,
The step (A1) is
(A11) recognizing a character string including numbers in the drawing;
(A12) processing the character string to determine the reference number including the drawing; and
(A13) generating attribute information of the reference number including the drawing with respect to the reference number including the drawing;
The step (A12) is
1) If the character string consists of only numbers, the ratio of numbers and letters is less than or equal to a preset ratio, less than a preset length, or corresponds to a predetermined pattern rule of reference numerals including drawings, to be determined by reference numerals including drawings the method of determining the reference numerals including the first drawing;
2) the extracted character string i) matches the reference number including the specification, or ii) matches the character string constituting the reference number candidate set including the specification generated before the reference number including the specification; ii-1) matches, ii-2) A second reference number determination method including drawings in which the extracted character string is determined as the reference number including drawings when inclusion beyond a preset criterion or ii-3) partial matching greater than or equal to a predetermined criterion is satisfied;
3) When the extracted character string appears more than a preset number of times in other drawings, a third reference number determination method including drawings is determined by reference numbers including drawings;
Any one method or a method characterized in that it is used in combination of any two or more methods.
삭제delete 삭제delete 제 1항에 있어서,
상기 (A13) 단계에서 상기 도면 포함 도면 부호의 속성 정보는
상기 도면 포함 도면 부호의 속성 정보는 상기 도면 포함 도면 부호의 후보의 문자열을 필수적으로 포함하고,
상기 문자열의 위치 정보, 길이, 방향, 폰트 크기 중 어느 하나 이상을 선택적으로 포함하는 것인 것을 특징으로 하는 방법.
The method of claim 1,
In the step (A13), the attribute information of the reference numerals including drawings is
The attribute information of the reference number including the drawing essentially includes a character string of a candidate of the reference number including the drawing,
Method, characterized in that it selectively includes any one or more of position information, length, direction, and font size of the character string.
제 1항에 있어서,
상기 (B) 단계는
상기 명세서가 마크업 언어로 작성되어 있는 경우,
(B1a) 도면 부호에 대응하는 명세서 포함 도면 부호의 태그부를 인식하고, 상기 명세서 포함 도면 부호의 태그부에서 상기 명세서 포함 도면 부호를 추출하는 단계;
(B2a) 상기 명세서 포함 도면 부호의 태그부를 기준으로 상기 명세서 포함 도면 부호의 태그부와의 기 설정된 위치에 있는 문자열 블록을 추출하는 단계; 및
(B3a) 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정하는 단계;를 더 포함하는 것이며,
상기 명세서가 마크업 언어로 작성되어 있지 않은 경우,
(B1b) 기 설정된 명세서 포함 도면 부호 식별 규칙을 적용하여, 상기 명세서 포함 도면 부호를 추출하는 단계;
(B2b) 상기 명세서 포함 도면 부호를 기준으로 상기 명세서 포함 도면 부호와의 기 설정된 위치에 있는 문자열 블록을 추출하는 단계; 및
(B3b) 추출된 상기 문자열에서 도면 부호의 설명 후보를 결정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
The step (B) is
If the above specification is written in markup language,
(B1a) recognizing the tag portion of the reference number including the specification corresponding to the reference number, and extracting the reference number including the specification from the tag portion of the reference number including the specification;
(B2a) extracting a character string block at a preset position with the tag part of the reference reference including the specification based on the tag portion of the reference number including the specification; and
(B3a) determining a candidate for description of a reference number from the extracted character string;
If the above specification is not written in markup language,
(B1b) extracting the reference number including the specification by applying a preset reference number identification rule including the specification;
(B2b) extracting a character string block at a preset position with the reference number including the specification based on the reference number including the specification; and
(B3b) determining a description candidate of a reference number from the extracted character string;
제 5항에 있어서,
상기 (B3a) 또는 상기 (B3b) 단계는
상기 문자열 블록이 비기호 텍스트 문자열을 포함는 경우,
1) 상기 태그부에서 가장 가까운 도면 부호의 설명 시작 식별자 이후부터 상기 태그부 시작까지의 문자열을 도면 부호의 설명 후보를 결정하는 제1 도면 부호의 설명 후보 결정 방법,
2) 상기 태그부에서 설정된 n번째 가까운 도면 부호의 설명 시작 식별자까지의 문자열 부분을 추출하고, 기 설정된 도면 부호의 설명 후보 결정 규칙을 적용하여 도면 부호의 설명 후보를 결정하는 제2 도면 부호의 설명 후보 결정 방법 중 어느 하나 이상의 방법을 사용하는 것인 것을 특징으로 하는 방법.
6. The method of claim 5,
The step (B3a) or (B3b) is
If the string block contains an unsigned text string,
1) A method for determining a description candidate of a first reference number for determining a description candidate of a reference number from a character string from the description start identifier of the nearest reference number in the tag unit to the start of the tag portion;
2) Description of a second reference number that extracts the character string part up to the description start identifier of the nth nearest reference number set in the tag unit, and determines the description candidate of the reference number by applying the preset reference candidate determination rule A method, characterized in that using any one or more of the candidate determination methods.
제 5항에 있어서,
상기 (B3a) 단계 또는 상기 (B3b) 단계 이후에
(B4) 상기 명세서 포함 도면 부호에 대응되는 적어도 하나 이상의 상기 도면 부호의 설명 후보를 입수하고, 도면 부호의 설명 결정 규칙을 참고하여 상기 명세서 포함 도면 부호에 대응하는 도면 부호의 설명을 결정하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
6. The method of claim 5,
After step (B3a) or step (B3b)
(B4) obtaining at least one candidate for description of the reference number corresponding to the reference number including the specification, and determining the description of the reference number corresponding to the reference number including the specification by referring to the description decision rule of reference number; Method, characterized in that it further comprises.
제 1항에 있어서,
상기 도면 포함 도면 부호와 상기 도면 부호의 설명에 대한 결합 속성 데이터를 생성하는 것은
(C1) 상기 도면 포함 도면 부호와 상기 도면 부호의 설명에 대한 맵핑 데이터를 생성하는 단계; 및
(C2) 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
Generating the combined attribute data for the reference number including the drawing and the description of the reference number is
(C1) generating mapping data for the reference numerals including the drawings and the descriptions of the reference numerals; and
(C2) generating descriptive arrangement data of the reference number used for the description of the reference number to be arranged at a preset position of the reference number including the drawing;
제 8항에 있어서,
상기 (C1) 단계는 상기 명세서 포함 도면 부호를 매개로 상기 도면 포함 도면 부호와 상기 도면 부호의 설명을 (확률적으로) 맵핑하는 것인 것을 특징으로 하는 방법.
9. The method of claim 8,
The method (C1) is characterized in that the mapping of the reference numbers with the drawings and the descriptions of the reference numbers via the reference numbers with the specification as a medium (stochastic).
제 8항에 있어서,
상기 (C2) 단계는 상기 도면마다 생성되는 것이며,
상기 도면 부호의 설명 배치 데이터는 상기 도면 포함 도면 부호별로 대응되는 도면 부호의 설명의 배치 여부, 배치 우선 순위, 배치 위치, 배치 방향, 텍스트 속성 정보, 축약 표현 사용 여부, 계층 정보, 공통 텍스트 기반 계열 정보, 및 기타 도면 부호의 설명 메타 정보 중 어느 하나 이상을 포함하는 도면 부호의 설명 표시 제어 정보를 것인 것을 특징으로 하는 방법.
9. The method of claim 8,
Step (C2) is generated for each drawing,
The descriptive arrangement data of the reference numbers includes whether or not the description of the reference numbers corresponding to each reference number including the drawing is arranged, arrangement priority, arrangement position, arrangement direction, text attribute information, whether to use abbreviated expressions, hierarchical information, common text-based series A method according to claim 1, characterized in that the descriptive display control information of the reference number including any one or more of information, and other descriptive meta information of the reference number.
제 8항에 있어서,
상기 (C2) 단계는 상기 도면마다 생성되는 것이며,
(C21) 상기 도면에서 선택되는 적어도 하나 이상의 상기 도면 포함 도면 부호별로 상기 도면 포함 도면 부호의 위치 정보를 고려한, 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명의 배치를 위한 도면 부호의 설명 배치 최소 공간을 탐색하는 단계;
(C22) 상기 도면 부호의 설명 배치 최소 공간이 적어도 2 이상의 도면 포함 도면 부호에 대해 겹침이 발생하는 지를 탐색하는 단계;
(C23) 겹침의 발생 여부에 대응하여 도면 부호의 설명 배치 전략 데이터를 생성하는 단계;
(C24) 상기 도면 부호의 설명 배치 전략 데이터를 참조하여 도면 부호의 설명 배치 데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
9. The method of claim 8,
Step (C2) is generated for each drawing,
(C21) Minimum description arrangement of reference numbers for the arrangement of descriptions of reference numbers corresponding to the reference numbers including drawings, taking into account the location information of the reference numbers including drawings for each at least one reference number including drawings selected in the drawings exploring space;
(C22) searching whether the minimum space of description arrangement of the reference numerals overlaps with respect to at least two or more reference numerals;
(C23) generating descriptive arrangement strategy data of reference numerals in response to whether or not overlapping occurs;
(C24) generating descriptive arrangement data of reference numerals with reference to the descriptive arrangement strategy data of the reference numerals;
제 1항에 있어서,
상기 도면 부호의 설명은 도면 부호의 설명 속성 정보를 포함하고 있는 것이며,
상기 도면 부호의 설명 속성 정보는 도면 독립적 도면 부호의 설명 속성 정보와 도면 종속적 도면 부호의 설명 속성 정보로 구분될 수 있는 것인 것이며,
상기 도면 독립적 도면 부호의 설명 속성 정보는 도면 부호의 설명 텍스트, 도면 부호의 설명 텍스트의 길이, 관련된 도면 부호의 설명에 대응되는 도면 포함 도면 부호 또는 명세서 포함 도면 부호, 도면 부호의 설명 텍스트에 대한 적어도 하나 이상의 언어로 된 번역 도면 부호의 설명 텍스트 중 어느 하나 이상을 포함하고 있거나,
상기 도면 종속적 도면 부호의 설명 속성 정보는 도면에서의 도면 부호의 설명의 배치 여부, 배치 우선 순위, 집단적 배치 여부 중 어느 하나 이상을 포함하고 있는 것인 것을 특징으로 하는 방법.
The method of claim 1,
The description of the reference number includes the description attribute information of the reference number,
The descriptive attribute information of the reference numbers can be divided into the descriptive attribute information of the drawing-independent reference numbers and the descriptive attribute information of the drawing-dependent reference numbers,
The descriptive attribute information of the drawing-independent reference number is at least about the descriptive text of the reference number, the length of the descriptive text of the reference number, the reference number including the drawing or reference number including the specification corresponding to the description of the reference number, and the descriptive text of the reference number. contains any one or more of the descriptive text of translated reference numbers in one or more languages;
The method according to claim 1, wherein the description attribute information of the drawing-dependent reference numerals includes at least one of whether descriptions of reference numerals in the drawings are arranged, priority of arrangement, and whether or not collective arrangement is performed.
제 11항에 있어서,
상기 (C21) 단계에서
상기 도면 부호의 설명 배치 최소 공간을 탐색하는 단계는 도면 부호의 설명 텍스트의 길이, 상기 도면의 물리적 경계에서의 상기 도면 포함 도면 부호의 위치, 상기 도면 포함 도면 부호의 방향 중 어느 하나 이상을 반영하여 탐색하는 것인 것을 특징으로 하는 방법.
12. The method of claim 11,
In step (C21)
The step of searching for the descriptive arrangement minimum space of the reference number reflects any one or more of the length of the descriptive text of the reference number, the position of the reference number including the reference number in the physical boundary of the drawing, and the direction of the reference number including the reference number. A method, characterized in that it is to search.
제 11항에 있어서,
(C211) 상기 2 이상의 근접 도면 포함 도면 부호 클러스터를 발굴하는 단계;
(C212) 상기 근접 도면 포함 도면 부호 클러스터의 표시 밀도를 계량하는 단계;
(C213) 상기 표시 밀도가 기 설정된 수준 이상인 경우에는 상기 (C23) 단계를 실시하지 않고, 적어도 하나 이상의 도면 내 여백 공간의 위치 정보를 생성하는 단계;를 포함하며,
상기 (C213) 단계에서 상기 도면 내 여백 공간의 위치 정보를 생성하는 것은
(C2131), 상기 근접 도면 포함 도면 부호 클러스터에 포함되는 전체 도면 포함 도면 부호 또는 적어도 하나 이상의 도면 포함 도면 부호를 추출하는 단계; 및
(C2132) 상기 추출된 도면 포함 도면 부호 및 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명이 표시되기 위한 필요 여백 공간을 계산하는 단계;
(C2133) 계산된 상기 필요 여백 공간에 대응되며, 도면 상에 할당되는 도면 내 여백 공간의 위치를 결정하는 단계;를 포함하는 것인 것을 특징으로 하는 방법.
12. The method of claim 11,
(C211) excavating a reference number cluster including the two or more adjacent drawings;
(C212) metering the display density of the cluster of reference numerals including the adjacent figures;
(C213) If the display density is equal to or higher than a preset level, generating position information of at least one blank space in the drawing without performing the step (C23);
Generating the location information of the blank space in the drawing in step (C213) is
(C2131), extracting all reference numbers or at least one reference number including drawings included in the reference number cluster including adjacent drawings; and
(C2132) calculating the required blank space for displaying the extracted reference numerals and a description of the reference numerals corresponding to the reference numerals with drawings;
(C2133) determining the position of the blank space in the drawing that corresponds to the calculated required blank space and is allocated on the drawing;
제 11항에 있어서,
상기 도면 부호의 설명 배치 전략 데이터에는
상기 도면 포함 도면 부호와 상기 도면 포함 도면 부호에 대응되는 도면 부호의 설명이 기 설정된 거리 이상으로 떨어져 있는 경우에는 상기 도면 포함 도면 부호와 상기 도면 부호의 설명 간의 연결성이 시각적으로 인지 될 수 있는 연결 표시 데이터가 더 포함되는 것인 것을 특징으로 하는 방법.
12. The method of claim 11,
In the description arrangement strategy data of the reference numerals,
When the description of the reference number including the reference number and the reference number corresponding to the reference number is more than a preset distance, the connection between the reference number including the drawing number and the description of the reference number can be visually recognized. A method, characterized in that data is further included.
제 11항에 있어서,
상기 (C22) 단계는 도면 부호의 설명 배치 최소 공간은 상기 도면 부호의 설명 또는 상기 도면 부호의 설명에 대응되는 축약형 도면 부호의 설명의 조합별로 탐색되는 것인 것이며,
상기 (C23) 단계의 상기 도면 부호의 설명 배치 전략 데이터는 상기 도면 포함 도면 부호마다 상기 도면 부호의 설명 또는 상기 축약형 도면 부호의 설명 중 어느 하나를 표시할 것인지에 대한 선택 전략 데이터를 더 포함하는 것인 것을 특징으로 하는 방법.
12. The method of claim 11,
In the step (C22), the minimum space for the description arrangement of the reference numbers is to be searched for each combination of the description of the reference number or the description of the abbreviated reference number corresponding to the description of the reference number,
The description and arrangement strategy data of the reference numerals in the step (C23) further include selection strategy data for whether to display either the description of the reference number or the description of the abbreviated reference number for each reference number including the drawing A method characterized in that
제 1항에 있어서,
(D) 상기 도면 부호의 설명 배치 데이터를 사용하여 적어도 하나 이상의 레이어를 포함하는 도면 부호의 설명 레이어 데이터를 생성하는 단계;를 더 포함하며,
상기 도면 부호의 설명 레이어 데이터는 레이어별로 표시되는 레이어별 도면 부호의 설명 배치 데이터를 포함하고 있는 것인 것을 특징으로 하는 방법.
The method of claim 1,
(D) generating descriptive layer data of reference numerals including at least one or more layers by using the descriptive arrangement data of the reference numerals;
The method according to claim 1, wherein the descriptive layer data of the reference number includes descriptive arrangement data of the reference number for each layer displayed for each layer.
제 1항에 있어서,
상기 컴퓨터 장치가
(E) 도면 번호에 대응되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 더 포함하며,
상기 (E) 단계는
(E1) 도면에 포함되어 있는 도면 포함 도면 부호를 인식하고 도면 포함 도면 부호 속성 집합 정보를 생성하는 단계;
(E2) 상기 특허의 명세서에서 명세서 포함 도면 부호 및 상기 명세서 포함 도면 부호에 대응하는 도면 번호의 설명을 인식하고, 상기 도면 부호의 설명에 대응하는 도면 부호의 설명 속성 집합 정보를 생성하는 단계; 및
(E3) 상기 도면 포함 도면 부호, 상기 명세서 포함 도면 부호 및 상기 도면 부호의 설명을 사용하며, 상기 도면 부호의 설명이 상기 도면 포함 도면 부호의 기 설정된 위치에 배치되는데 사용되는 도면 부호의 설명 배치 데이터를 생성하는 단계;를 포함하는 것인 것을 특징으로 하는 방법.
The method of claim 1,
the computer device
(E) generating descriptive arrangement data of reference numbers corresponding to reference numbers; further comprising,
The step (E) is
(E1) recognizing the reference numerals included in the drawing and generating reference number attribute set information including the drawing;
(E2) recognizing a description of a reference number with a specification and a reference number corresponding to the reference number with the specification in the specification of the patent, and generating description attribute set information of the reference number corresponding to the description of the reference number; and
(E3) Explanatory arrangement data of the reference number used for using the reference number including the drawing, the reference number including the specification, and the description of the reference number, and the description of the reference number is arranged at a preset position of the reference number including the drawing A method, characterized in that it comprises;
제 1항에 있어서,
상기 컴퓨터 장치가
상기 (A) 단계 이전에
(A0) 상기 도면이 2 이상의 도면 번호가 다른 복합 도면인 경우, 상기 복합 도면을 전처리하는 단계;를 더 포함하며,
상기 (A0) 단계는
(A01) 상기 도면에서 도면 번호의 개수를 식별하는 단계; 및
(A02) 상기 도면 번호의 개수가 2 이상인 경우, 상기 도면을 도면 번호의 개수만큼 절단하여 독립 도면 데이터를 생성하는 단계;를 더 포함하는 것을 특징으로 하는 방법.
The method of claim 1,
the computer device
before step (A)
(A0) If the drawing is a composite drawing having two or more different reference numbers, the step of pre-processing the composite drawing; further comprising,
The step (A0) is
(A01) identifying the number of reference numbers in the drawing; and
(A02) when the number of the reference numbers is two or more, generating independent drawing data by cutting the drawings by the number of reference numbers.
제 1항에 있어서,
(F) 상기 컴퓨터 장치가 가공 도면 데이터를 생성하거나 도면 연동 데이터를 생성하는 단계;를 더 포함하며,
상기 (F) 단계는
상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 물리적으로 삽입되어 있는 가공 도면 파일을 생성하는 제1 가공 도면 데이터 생성 방식,
상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면과 도면 부호의 설명 배치 데이터가 논리적으로 다른 레이어에 존재하도록 하는 1개의 가공 도면 파일을 생성하는 제2 가공 도면 데이터 생성 방식,
상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면 파일과 도면 부호의 설명 배치 데이터가 포함된 파일은 물리적으로 다른 파일이며, 상기 도면 파일이 호출될 때, 상기 도면 파일과 상기 도면 부호의 설명 배치 데이터가 포함된 파일이 연동되어 실시간 결합이 지원되도록 상기 도면 파일을 가공하는 제3 가공 도면 데이터 생성 방식 및
상기 도면 부호의 설명 배치 데이터를 사용하여 상기 도면 상에 있는 도면 포함 도면 부호의 기 설정된 위치에 적어도 하나 이상의 도면 부호의 설명이 나타나도록 하되, 도면 파일과 도면 부호의 설명 배치 데이터가 포함된 파일은 물리적으로 다른 파일이며, 상기 도면 파일이 호출될 때, 상기 도면 파일과 상기 도면 부호의 설명 배치 데이터가 포함된 파일이 연동되는 실시간 결합을 지원하는 도면 연동 데이터를 생성하는 방식 중 어느 하나 이상을 실시하는 것인 것을 특징으로 하는 방법.
The method of claim 1,
(F) generating, by the computer device, processing drawing data or generating drawing linkage data; further comprising,
Step (F) is
A first processing drawing data generation method for generating a processing drawing file in which descriptions of at least one reference number are physically inserted at preset positions of reference numbers including drawings on the drawing by using the description arrangement data of the reference numbers ,
Using the descriptive arrangement data of the reference numerals, the description of at least one reference number appears at a preset position of the reference number including the drawing on the drawing, and the description arrangement data of the drawing and the reference number are logically different in layers. A second machining drawing data generation method of generating one machining drawing file to exist;
Using the descriptive arrangement data of the reference numerals, the description of at least one reference number appears at a preset position of the reference number including the drawing in the drawing, wherein the drawing file and the file including the descriptive arrangement data of the reference number are It is a physically different file, and when the drawing file is called, the drawing file and the file including the description and arrangement data of the reference numerals are interlocked and the drawing file is processed so that real-time coupling is supported. and
Using the descriptive arrangement data of the reference numerals, the description of at least one reference number appears at a preset position of the reference number including the drawing in the drawing, wherein the drawing file and the file including the descriptive arrangement data of the reference number are It is a physically different file, and when the drawing file is called, any one or more of the methods of generating drawing interworking data supporting real-time coupling in which the drawing file and the file including the description and arrangement data of the reference numerals are interlocked are implemented A method characterized in that
삭제delete 삭제delete 삭제delete 삭제delete
KR1020170035043A 2017-03-21 2017-03-21 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology KR102465029B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020170035043A KR102465029B1 (en) 2017-03-21 2017-03-21 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology
KR1020220145600A KR102515657B1 (en) 2017-03-21 2022-11-03 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170035043A KR102465029B1 (en) 2017-03-21 2017-03-21 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020220145600A Division KR102515657B1 (en) 2017-03-21 2022-11-03 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology

Publications (2)

Publication Number Publication Date
KR20180106546A KR20180106546A (en) 2018-10-01
KR102465029B1 true KR102465029B1 (en) 2022-11-10

Family

ID=63877476

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020170035043A KR102465029B1 (en) 2017-03-21 2017-03-21 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology
KR1020220145600A KR102515657B1 (en) 2017-03-21 2022-11-03 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020220145600A KR102515657B1 (en) 2017-03-21 2022-11-03 Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology

Country Status (1)

Country Link
KR (2) KR102465029B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112949254A (en) * 2021-02-25 2021-06-11 郎丽华 System and method for processing reference numbers of patent application files
KR102274081B1 (en) 2021-04-12 2021-07-07 사단법인 한국선급 Cognition system of object in ship's drawing using a deep-learning

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100319756B1 (en) 2000-01-21 2002-01-09 오길록 Method for analyzing structure of treatise typed of document image
JP2005293351A (en) 2004-04-01 2005-10-20 Fuji Xerox Co Ltd Image processor and image processing method

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070090321A (en) * 2006-03-02 2007-09-06 (주)윕스 System for extracting information from document, method thereof and recording medium thereof
KR20120032773A (en) 2010-09-29 2012-04-06 주식회사 디오텍 Augmented reality device using optical character reader and method thereof
KR101253502B1 (en) * 2011-01-18 2013-04-15 대한민국 System and method for displaying application document
US9514376B2 (en) 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
KR20160125931A (en) * 2016-10-11 2016-11-01 이현엽 System and Method of Providing Improved Readability Service in the Drawings of the Patent Documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100319756B1 (en) 2000-01-21 2002-01-09 오길록 Method for analyzing structure of treatise typed of document image
JP2005293351A (en) 2004-04-01 2005-10-20 Fuji Xerox Co Ltd Image processor and image processing method

Also Published As

Publication number Publication date
KR102515657B1 (en) 2023-03-31
KR20180106546A (en) 2018-10-01
KR20220154069A (en) 2022-11-21

Similar Documents

Publication Publication Date Title
KR20180107707A (en) Mapping Device and Method on between Patent Drawings Including Figure Numbers and Descriptions of the Figure Numbers Using Machine Learning Methodology Based on Using Artificial Intelligence Technology
KR102515657B1 (en) Device and Information Processing Method on Providing Mapping and Combination Contents between Figure Numbers in Patent Drawings and Names of Figure Numbers in Patent Description Based on Artificial Intelligence Technology
KR102385457B1 (en) Method on Mapping between Patent Drawings Including Figure Numbers and Descriptions of the Figure Numbers Using Machine Learning Methodology Based on Using Artificial Intelligence Technology
JP2973944B2 (en) Document processing apparatus and document processing method
JP5710624B2 (en) Method and system for extraction
KR101999152B1 (en) English text formatting method based on convolution network
US9384389B1 (en) Detecting errors in recognized text
US20020021838A1 (en) Adaptively weighted, partitioned context edit distance string matching
CN110334179B (en) Question-answer processing method, device, computer equipment and storage medium
JPH11505052A (en) System and method for reducing search range of lexical dictionary
Bai et al. Keyword spotting in document images through word shape coding
CN102375807A (en) Method and device for proofing characters
KR20200013130A (en) Device and Method on Data Processing of Descriptions of the Figure Numbers Corresponding to Figure Numbers on Patent Drawings Using Machine Learning Methodology Based on Using Artificial Intelligence Technology
JP4782346B2 (en) Method and apparatus for processing electronic documents
CN114612921B (en) Form recognition method and device, electronic equipment and computer readable medium
CN107977357A (en) Error correction method, device and its equipment based on user feedback
CN107832447A (en) User feedback error correction method, device and its equipment for mobile terminal
US20110178792A1 (en) Acquisition Of Out-Of-Vocabulary Translations By Dynamically Learning Extraction Rules
JP2020173779A (en) Identifying sequence of headings in document
CN112560425B (en) Template generation method and device, electronic equipment and storage medium
CN114970554B (en) Document checking method based on natural language processing
JP5353325B2 (en) Document data generation apparatus and document data generation method
CN113434672B (en) Text type intelligent recognition method, device, equipment and medium
CN115294593A (en) Image information extraction method and device, computer equipment and storage medium
CN108932231A (en) Machine translation method and device

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right