KR20220126369A - 여백을 활용한 특허 문서의 도면 표시 시스템 - Google Patents
여백을 활용한 특허 문서의 도면 표시 시스템 Download PDFInfo
- Publication number
- KR20220126369A KR20220126369A KR1020210030518A KR20210030518A KR20220126369A KR 20220126369 A KR20220126369 A KR 20220126369A KR 1020210030518 A KR1020210030518 A KR 1020210030518A KR 20210030518 A KR20210030518 A KR 20210030518A KR 20220126369 A KR20220126369 A KR 20220126369A
- Authority
- KR
- South Korea
- Prior art keywords
- description
- blank
- area
- size
- reference number
- Prior art date
Links
- 238000001514 detection method Methods 0.000 claims abstract description 28
- 238000000034 method Methods 0.000 claims description 18
- 239000000284 extract Substances 0.000 abstract description 8
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 238000012015 optical character recognition Methods 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 4
- 241000132092 Aster Species 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
- G06F16/5846—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using extracted text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/53—Querying
- G06F16/532—Query formulation, e.g. graphical querying
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/54—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/103—Formatting, i.e. changing of presentation of documents
- G06F40/109—Font handling; Temporal or kinetic typography
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/166—Editing, e.g. inserting or deleting
- G06F40/169—Annotation, e.g. comment data or footnotes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/189—Automatic justification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T11/00—2D [Two Dimensional] image generation
- G06T11/60—Editing figures and text; Combining figures or text
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/146—Aligning or centring of the image pick-up or image-field
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
- G06V30/422—Technical drawings; Geographical maps
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10—TECHNICAL SUBJECTS COVERED BY FORMER USPC
- Y10S—TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y10S707/00—Data processing: database and file management or data structures
- Y10S707/912—Applications of a database
- Y10S707/923—Intellectual property
- Y10S707/937—Intellectual property intellectual property searching
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Processing Or Creating Images (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
특허 문서의 도면에서 도면 부호를 인식하고, 도면 부호에 대한 설명을 특허 문서의 텍스트 내용에서 추출하여 화면 상에 표시하되, 도면의 여백에 각 도면 부호의 설명을 배치하는, 여백을 활용한 특허문서의 도면 표시 시스템에 관한 것으로서, 특허문서의 도면을 획득하여 각 도면(이하 당해 도면)을 화면 상에 표시하는 도면 획득부; 상기 당해 도면에서 도면 부호 및 그 위치를 검출하는 도면부호 검출부; 상기 특허문서의 상세한 설명을 참조하여, 상기 도면 부호에 대한 부호 설명을 추출하는 부호설명 추출부; 도면에서 여백 영역을 검출하는 여백 검출부; 및, 상기 여백 영역에 부호 설명을 배치하는 부호설명 배치부를 포함하는 구성을 마련한다.
상기와 같은 시스템에 의하면, 도면의 화면 상의 여백에 도면 부호의 설명을 배치함으로써, 도면 부호의 설명이 도면 이미지를 덮지 않으므로 도면과 설명을 한 눈에 모두 정확하게 파악할 수 있다.
상기와 같은 시스템에 의하면, 도면의 화면 상의 여백에 도면 부호의 설명을 배치함으로써, 도면 부호의 설명이 도면 이미지를 덮지 않으므로 도면과 설명을 한 눈에 모두 정확하게 파악할 수 있다.
Description
본 발명은 특허 문서의 도면에서 도면 부호를 인식하고, 도면 부호에 대한 설명을 특허 문서의 텍스트 내용에서 추출하여 화면 상에 표시하되, 도면의 여백에 각 도면 부호의 설명을 배치하는, 여백을 활용한 특허문서의 도면 표시 시스템에 관한 것이다.
일반적으로, 특허문서는 요약, 청구범위, 기술분야, 배경기술, 해결하려는 과제, 과제의 해결수단, 발명의 효과, 도면의 간단한 설명, 발명을 실시하기 위한 구체적 내용 등으로 구성되는 텍스트 부분과, 특허의 내용과 작용을 시각적으로 설명하는 그림, 그리고 그림에서 인출선을 통하여 특정부위를 지시하는 참조부호로 구성되는 이미지 형태의 도면부분으로 구성된다.
특허의 도면에서 그림은 특허내용을 상세히 설명하는 텍스트 부분을 보충 설명하고, 제3자가 발명이나 고안의 구성을 직관적이고 형상적으로 신속히 이해할 수 있도록 하는 작용을 하므로 특허내용의 이해하는데 대단히 중요하다.
그러나 기존 특허문서의 도면에서는 특허의 내용을 시각적으로 설명하기 위한 이미지 형태의 그림과, 그림에서 특정부위를 나타내는 참조부호 만이 표시되어 있으며, 참조부호가 의미하는 명칭이나 도면에 대한 간략설명이 직접적으로 도면에 표시되어 있지 않기 때문에 도면을 이해하고 파악하기 위하여는 특허문서 내의 텍스트 내에서 도면에 대한 해당부호의 명칭과 간략설명을 파악하여야 하는 번거러움이 있으며, 특히 특허문서에서 도면의 수가 많거나, 도면 내의 참조부호의 수가 많을수록 특허도면의 내용을 파악하는데 더욱 많은 시간과 노력을 필요로 한다.
즉, 사용자가 특허 문서를 통해 발명을 파악하려면 명세서에 포함되는 발명의 상세한 설명을 읽으면서 도면을 함께 파악해야 하나, 도면에는 숫자로 표시된 도면 부호만 존재하기 때문에, 사용자는 도면만으로는 발명을 파악하는데 한계가 있을 수 밖에 없다.
또한, 특허 문서를 검색할 수 있는 사이트에서 찾고자 하는 기술 키워드를 통해 검색하는 경우, 발명의 키워드를 통해 발명을 검색하고, 검색된 특허 문서의 도면을 열람할 수 있는 서비스들이 제공되고 있다. 그러나 검색된 특허문서의 도면에서 내가 찾고자 하는 키워드에 해당하는 부분이 어디인지 부호의 설명 등의 발명의 상세한 설명을 검토하며 파악해야 하는 어려움이 있다.
그러므로, 이러한 문제점을 해결하기 위해서, 도면의 도면 부호에 대한 설명을 추출하는 기술[특허문헌 1]이나, 도면에 도면 부호에 관한 설명을 표시하는 기술이 제시되고 있다[특허문헌 2,3]. 그러나 상기 선행기술들은 도면 상에서 도면 부호가 인식된 위치에 도면 설명을 표시한다.
도 1은 상기 선행기술들과 같이, 도면 부호의 위치에 도면 설명을 표시한 도면을 예시하고 있다. 그런데, 도 1에서 보는 바와 같이, 종래기술은 도면 부호의 설명을 도면의 이미지 상에 표시하므로, 도면 설명의 텍스트가 도면 이미지를 일부 덮어 보이지 않게 하는 문제점이 있다.
본 발명의 목적은 상술한 바와 같은 문제점을 해결하기 위한 것으로, 특허 문서의 도면에서 도면 부호를 인식하고, 도면 부호에 대한 설명을 특허 문서의 텍스트 내용에서 추출하여 화면 상에 표시하되, 도면의 여백에 각 도면 부호의 설명을 배치하는, 여백을 활용한 특허문서의 도면 표시 시스템을 제공하는 것이다.
또한, 본 발명의 목적은 도면 부호 설명을 도면 여백에 배치하되, 도면 부호의 위치에서 가장 가까운 위치와 방향에 해당 부호 설명을 배치하는, 여백을 활용한 특허문서의 도면 표시 시스템을 제공하는 것이다.
또한, 본 발명의 목적은 도면이 표시될 화면에서 도면의 이미지 객체 부분을 제외한 여백의 크기를 산출하고, 도면 부호의 설명의 전체 글자 수를 산정하여, 설명의 글자 또는 폰트의 크기를 설정하는, 여백을 활용한 특허문서의 도면 표시 시스템을 제공하는 것이다.
상기 목적을 달성하기 위해 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 관한 것으로서, 특허문서의 도면을 획득하여 각 도면(이하 당해 도면)을 화면 상에 표시하는 도면 획득부; 상기 당해 도면에서 도면 부호 및 그 위치를 검출하는 도면부호 검출부; 상기 특허문서의 상세한 설명을 참조하여, 상기 도면 부호에 대한 부호 설명을 추출하는 부호설명 추출부; 도면에서 여백 영역을 검출하는 여백 검출부; 및, 상기 여백 영역에 부호 설명을 배치하는 부호설명 배치부를 포함하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 도면 획득부는 해당 도면에서 회전 방향을 검출하고 도면이 회전된 경우 원래 방향으로 되돌리되, 해당 도면의 회전 방향을 해당 도면의 도면 부호의 회전 방향으로 결정하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 도면부호 검출부는 딥러닝 방식을 이용하여 해당 도면에서 도면 부호의 위치를 감지하고, 감지된 도면 부호의 위치에 바운딩 박스를 생성하고, 바운딩 박스 내를 OCR(Optical Character Recognition) 기능으로 해석하여 문자 또는 숫자를 인식하여 도면 부호를 검출하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 추출부는 상기 특허문서의 상세한 설명 내에서 도면 부호를 검출하고, 검출된 도면 부호의 직전에 위치된 문자열을 부호 설명으로 추출하되, 도면 부호를 포함하는 문장을 파싱하여, 직전 텍스트 중에서 주어나 목적어로 사용되는 문자열만을 추출하고, 도면 부호를 포함하는 문장이 다수 개이면, 다수의 문장에서 모두 해당 도면 부호의 직전 문자열을 추출하고, 추출된 문자열 중에서 가장 많은 빈도로 중복되는 문자열 부분을 해당 도면 부호의 설명으로 검출하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 여백 검출부는 해당 도면에서 영역의 경계가 가로변과 세로변 만으로 이루어진 여백 영역을 검출하고, 상기 여백 영역의 세로변의 길이와 영역 폭의 길이가 각각 사전에 정해진 길이 이상이 되도록 검출하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 세로변의 길이는 글자 높이 보다 크도록 설정되고, 여백 영역의 영역 폭은 사전에 정해진 최소 글자수의 너비로 설정되는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 여백 검출부는 해당 도면의 객체이 바운딩 박스와, 해당 도면이 표시되는 화면 상의 전체 영역의 캔버스 박스 간의 간격을 조절할 수 있는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 각 도면 부호의 부호 설명을 배치할 영역(이하 설명 영역)을 설정하고, 각 설명 영역이 다른 설명 영역과 겹치지 않도록 여백 영역 내에 배치하되, 상기 설명 영역의 크기는 해당 부호 설명의 글자 크기와 개수에 의해 결정되고, 글자 크기는 글자 높이와 너비로 결정되는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 하나의 도면 부호에 대하여 설명 영역을 줄의 개수에 따라 다수 개로 설정하되, 해당 개수의 줄 내에서 부호 설명을 배치할 때 설명 영역의 폭을 최소화 하도록 배치하는 설명 영역을 해당 줄 수의 설명 영역으로 설정하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 하나의 도면 부호에 대한 설명 영역이 적어도 2개이면, 각 설명 영역의 우선순위를 설정하되, 해당 설명 영역의 부호 설명의 길이에 따라 우선순위를 설정하거나, 설명 영역의 가로와 세로의 비율에 의해 우선순위를 설정하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 각 도면 부호의 위치에서 인접한 여백에 해당 도면 부호의 설명 영역을 먼저 배치하고, 이후에, 인접한 여백에 설명 영역을 배치하지 못한 도면 부호에 대하여 해당 도면 부호의 설명 영역을 나머지 여백 영역에 배치하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 인접한 여백에 설명 영역을 배치하지 못한 도면 부호에 대하여, 해당 도면 부호의 위치와 가장 가까운 여백 위치에 해당 도면 부호의 설명 영역을 배치하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 부호설명 배치부는 인접하지 않은 여백 위치에 설명 영역을 배치하는 경우, 해당 설명 영역과 해당 도면 부호 간에 연결선으로 연결하여 표시하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 시스템은, 여백 공간의 크기와, 전체 도면 부호의 부호 설명의 글자 양을 이용하여, 캔버스의 크기 또는 부호 설명의 글자 크기를 조절하는 크기 조절부를 더 포함하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 크기 조절부는 전체 여백 영역의 크기 대비 사전에 결정된 표준 크기에 의한 전체 설명 영역 크기의 비율을 산출하여, 사전에 정해진 최대 비율 보다 큰지를 판단하고, 최대 비율 보다 큰 경우, 상기 캔버스의 크기를 크게 조절하거나 상기 부호 설명의 글자 크기를 작게 조절하여 전체 설명 영역의 비율이 최대 비율 이하가 되도록 설정하는 것을 특징으로 한다.
또, 본 발명은 여백을 활용한 특허문서의 도면 표시 시스템에 있어서, 상기 크기 조절부는 크기 조절 후, 상기 여백 검출부를 통해 여백 영역을 다시 검출하고, 다시 검출된 여백 영역을 대상으로 전체 여백 영역의 크기를 산출하여 대비하는 것을 특징으로 한다.
상술한 바와 같이, 본 발명에 따른 여백을 활용한 특허문서의 도면 표시 시스템에 의하면, 도면의 화면 상의 여백에 도면 부호의 설명을 배치함으로써, 도면 부호의 설명이 도면 이미지를 덮지 않으므로 도면과 설명을 한 눈에 모두 정확하게 파악할 수 있는 효과가 얻어진다.
또한, 본 발명에 따른 여백을 활용한 특허문서의 도면 표시 시스템에 의하면, 도면 부호의 위치에서 가장 가까운 위치와 방향에 해당 부호 설명을 배치함으로써, 도면 부호와 그 부호 설명의 대응 관계를 직관적으로 용이하게 파악할 수 있는 효과가 얻어진다.
도 1은 종래기술에 따른 특허문서의 도면 상에서의 도면 부호의 설명 표시 방식을 나타낸 예시도.
도 2는 본 발명을 실시하기 위한 전체 시스템에 대한 구성도.
도 3은 본 발명의 일실시예에 따른 여백을 활용한 특허문서의 도면 표시 시스템의 구성에 대한 블록도.
도 4는 본 발명의 일실시예에 따른 도면에 대한 예시도로서, (a) 원래의 도면, (b) 회전하여 전처리한 도면에 대한 예시도.
도 5는 본 발명의 일실시예에 따른 도면에서 도면 부호를 검출한 예시도.
도 6은 본 발명의 일실시예에 따른 상세한 설명에서 도면 부호 및 그 부호 설명을 검출한 예시 표.
도 7은 본 발명의 일실시예에 따른 도면의 여백 영역을 검출한 예시도.
도 8은 본 발명의 일실시예에 따른 전체 도면 영역과 객체 바운딩 영역의 간격을 조절한 후의 도면의 여백 영역에 대한 예시도.
도 9는 본 발명의 일실시예에 따른 도면 부호의 설명 영역에 대한 예시도.
도 10은 본 발명의 일실시예에 따른 도면 부호의 인접한 여백에 배치한 부호 설명에 대한 예시도.
도 11은 본 발명의 일실시예에 따른 도면 부호의 인접하지 않은 여백에 배치한 부호 설명에 대한 예시도.
도 2는 본 발명을 실시하기 위한 전체 시스템에 대한 구성도.
도 3은 본 발명의 일실시예에 따른 여백을 활용한 특허문서의 도면 표시 시스템의 구성에 대한 블록도.
도 4는 본 발명의 일실시예에 따른 도면에 대한 예시도로서, (a) 원래의 도면, (b) 회전하여 전처리한 도면에 대한 예시도.
도 5는 본 발명의 일실시예에 따른 도면에서 도면 부호를 검출한 예시도.
도 6은 본 발명의 일실시예에 따른 상세한 설명에서 도면 부호 및 그 부호 설명을 검출한 예시 표.
도 7은 본 발명의 일실시예에 따른 도면의 여백 영역을 검출한 예시도.
도 8은 본 발명의 일실시예에 따른 전체 도면 영역과 객체 바운딩 영역의 간격을 조절한 후의 도면의 여백 영역에 대한 예시도.
도 9는 본 발명의 일실시예에 따른 도면 부호의 설명 영역에 대한 예시도.
도 10은 본 발명의 일실시예에 따른 도면 부호의 인접한 여백에 배치한 부호 설명에 대한 예시도.
도 11은 본 발명의 일실시예에 따른 도면 부호의 인접하지 않은 여백에 배치한 부호 설명에 대한 예시도.
이하, 본 발명의 실시를 위한 구체적인 내용을 도면에 따라서 설명한다.
또한, 본 발명을 설명하는데 있어서 동일 부분은 동일 부호를 붙이고, 그 반복 설명은 생략한다.
먼저, 본 발명을 실시하기 위한 전체 시스템의 구성을 도 2를 참조하여 설명한다.
도 2에서 보는 바와 같이, 본 발명을 실시하기 위한 전체 시스템의 일례는 사용자 단말(10)과 도면표시 시스템(30)으로 구성되고 서로 네트워크(80)로 연결된다. 또, 특허 문서 등 필요한 데이터를 저장하기 위한 데이터베이스(40)를 더 구비할 수 있다. 즉, 본 발명에 따른 특허 문서의 도면 표시 시스템(30)은 네트워크 상의 서버 시스템 또는 웹 어플리케이션으로 실시될 수 있다.
또한, 다른 일례로서, 본 발명에 따른 특허 문서의 도면 표시 시스템(30)은 특허문서를 열람하기 위한 특허열람 서버(50)와 연동하거나, 부속 기능의 시스템으로 구현될 수 있다. 즉, 특허열람 서버(50)가 사용자 단말(10)과 주된 인터페이스 및, 특허문서의 열람을 위한 주된 기능을 제공하고, 특허 도면과 관련하여 여백을 활용한 도면 표시 기능을 추가로 제공한다. 이때, 추가적인 도면 표시 기능을 도면표시 시스템(30)으로 구현될 수 있다. 또한, 도면 표시 시스템(30)은 독자적 기능의 시스템으로 구현되어 특허열람 서버(50)와 연동되거나, 특허열람 서버(50)의 부속 시스템으로 구현될 수 있다.
보다 구체적으로 설명하면, 특허열람 서버(50)는 특허 문서의 열람 서비스를 제공하는 서버로서, 특허문서를 보유하고, 보유한 특허문서의 검색, 열람 등을 위한 인터페이스를 제공한다.
특허 문서는 공개특허공보 또는 등록특허공보를 지칭한다. 특허 문서는 특허만이 아니라 실용신안도 포함될 수 있다. 실용신안은 권리의 내용만 다를 뿐 특허공보와 항목이 거의 동일하므로, 이하에서 특허 문서를 지칭할 때는 실용신안공보도 포함되는 것으로 한다. 한편, 특허 문서는 국내 또는 국외 특허공보를 모두 포함한다. 즉, 각국 특허청 또는 WIPO에서 발행되는 특허공보를 모두 해당될 수 있다.
또한, 특허문서는 서지사항, 청구범위, 상세한 설명, 도면 등 세부 항목으로 구분되어 저장된다. 또한, 특허문서는 세부 항목별로 데이터로 구분 관리되므로, 해당 항목으로 검색되거나 참조될 수 있도록 구성된다.
특히, 특허문서에서, 도면은 각 도 별로 이미지(이하 도면 이미지)로 저장되어 관리되고, 그 외 서지사항, 상세한 설명, 청구범위는 텍스트로 저장되어 관리된다. 따라서 상세한 설명, 청구범위 등의 항목에 대해 텍스트 검색 등이 서비스 된다. 또한, 서지사항은 특허번호, IPC 분류, 출원인, 발명자, 출원일 등으로 구성되고, 이들 항목별로 검색 등이 제공된다.
또한, 특허열람 서버(50)는 특허 문서의 열람을 위한 검색 서비스를 제공한다. 즉, 특허번호, 키워드, 세부 항목별 검색 등 다양한 검색 서비스를 제공하여, 사용자는 자신이 원하는 특허문서를 검색할 수 있다.
또한, 특허열람 서버(50)는 검색된 특허 문서의 내용을 열람할 수 있는 열람 서비스를 제공한다. 이때, 특허열람 서버(50)는 특허 문서의 전문을 열람하거나, 특허 문서의 세부항목별로 열람하는 등의 열람 서비스를 제공할 수 있다.
특히, 특허열람 서버(50)는 특허 문서의 도면을 열람하는 서비스를 제공하고, 이를 위한 인터페이스를 제공한다. 이때, 특허열람 서버(50)는 도면표시 시스템(30)과 연동하여, 도면을 가공하여 표시하는 서비스를 제공한다. 특히, 도면을 표시하는 화면 상에서, 도면 부호의 설명을 추가하여 표시한다.
한편, 바람직하게는, 특허열람 서버(50)는 웹 상에서 웹 서비스로 제공된다. 따라서 사용자는 사용자 단말(10)을 통해 특허열람 서버(50)에 접속하여, 특허 열람 서비스를 이용한다.
그 외에도 특허열람 서버(50)는 사용자 단말(10)에 설치되는 클라이언트(미도시)와 연동하여 서버-클라이언트 시스템으로 구현되어, 특허열람 서비스를 제공할 수 있다. 즉, 사용자 단말(10)에는 전용 특허 열람 클라이언트(또는 전용 어플리케이션)가 설치되어, 클라이언트를 통해 특허열람 서버(50)와 연동하여 특허 열람 서비스를 이용할 수 있다. 특히, 사용자 단말(10)이 모바일 단말인 경우, 클라이언트는 모바일 어플리케이션(어플, 앱) 등 일 수 있다.
다음으로, 사용자 단말(10)은 사용자가 사용하는 컴퓨팅 단말로서, PC, 노트북, 넷북, PDA, 스마트포나, 모바일 등의 통상의 컴퓨팅 단말기이다.
사용자는 사용자 단말(10)을 통해, 특허열람 서버(50)에 접속하여, 특허 검색, 특허 문서의 열람 등의 서비스를 이용한다. 사용자는 사용자 단말(10)을 통해 특허문서 열람 등의 서비스를 이용하므로, 이하에서, 사용자가 어떤 작업을 수행하는 것은 사용자 단말(10)에 의해 수행되는 것으로 해석된다.
또한, 바람직하게는, 사용자 단말(10)에는 웹 브라우저(미도시)나 전용 클라이언트 등이 설치되어, 이들 클라이언트 프로그램 시스템에 의해 특허열람 서버(50)에 접속하여, 특허 열람 서비스를 이용한다.
또한, 사용자 단말(10)에서 사용자가 입력된 특허열람을 위한 명령들이 입력되고, 이들 명령은 특허열람 서버(50)로 전달되고, 특허열람 서버(50)로부터 회신된 결과들은 사용자 단말(10)의 화면 상에 표시된다. 그런데, 해당 화면은 특허열람 서버(50)에서 만들어지거나, 특허열람 서버(50)에서 제공된 데이터에 의한 화면이다. 이하에서 편의상 화면 상에 결과가 표시되는 것으로 설명한다.
다음으로, 도면표시 시스템(30)은 네트워크 상의 서버 시스템 또는 웹 어플리케이션으로 실시되거나, 특허열람 서버(50)와 연동하거나, 부속 기능의 시스템으로 구현된다.
특히, 도면표시 시스템(30)은 특허 문서의 도면을 가공하여 화면 상에 표시한다. 즉, 도면표시 시스템(30)은 특허 문서의 도면에서 도면 부호를 인식하고, 도면 부호에 대한 설명을 특허 문서의 내용에서 추출하고, 도면의 여백에 각 도면 부호의 설명을 배치한다.
다음으로, 데이터베이스(40)는 열람된 특허문서를 저장하는 열람문서DB(41), 및, 특허문서의 각 도면의 도면 부호, 부호 위치, 부호 설명 등을 저장하는 도면정보DB(42) 등으로 이루어진다. 그러나 상기 데이터베이스(40)의 구성은 바람직한 일실시예일 뿐이며, 구체적인 장치를 개발하는데 있어서, 접근과 검색의 용이성 및 효율성 등을 감안하여 데이터베이스 구축이론에 의하여 다른 구조로 구성될 수 있다.
다음으로, 본 발명의 일실시예에 따른 도면표시 시스템(30)의 구성에 대하여 도 3을 참조하여 설명한다.
도 3에서 보는 바와 같이, 본 발명의 일실시예에 따른 도면표시 시스템(30)은 특허문서의 도면을 획득하는 도면 획득부(31), 도면에서 도면부호를 검출하는 도면부호 검출부(32), 도면 부호에 대한 부호 설명을 추출하는 부호설명 추출부(33), 도면에서 여백을 검출하는 여백 검출부(34), 및, 도면 여백에 부호 설명을 배치하는 부호설명 배치부(35)로 구성된다. 추가적으로, 부호설명의 글자크기를 조절하는 크기 조절부(36), 또는, 부호 설명의 위치를 편집하는 설명배치 편집부(37)를 더 포함하여 구성될 수 있다.
먼저, 도면 획득부(31)는 열람된 특허문서의 도면을 획득하여 화면 상에 표시한다.
앞서 설명한 바와 같이, 특허 문서는 공개특허공보 또는 등록특허공보를 지칭하며, 특허만이 아니라 실용신안도 포함된다. 또한, 국내 또는 국외 특허공보도 모두 대상이 된다.
특히, 특허 문서는 서지사항, 상세한 설명, 청구범위, 도면 등 세부 항목으로 구분되며, 서지사항은 특허번호, IPC 분류, 출원인, 발명자, 출원일 등으로 구성된다.
또한, 특허문서에서, 도면은 하나 이상의 다수의 도(그림)로 구성된다. 여기서, 도면은 도 전체를 지칭하고, 각 도는 개별적 하나의 그림을 지칭한다. 그러나 설명의 편의를 위하여 이하에서, 도면과 도를 혼용하여 사용한다. 즉, 개별적 하나의 도를 도면으로 혼용한다.
한편, 도면 획득부(31)에서 획득하는 도면은 하나의 특허문서를 대상으로 한다. 즉, 앞서 특허열람 서버(50)에 의해 검색된 하나의 특허 문서에 대해서, 해당 특허 문서의 도면을 열람하기 위한 것이다. 따라서 이하에서, 도면 부호 등도 해당 특허 문서 내에서 추출된다.
또한, 도면 획득부(31)는 해당 특허 문서의 도면 중에서 하나의 도(또는 도면)를 대상으로 화면 상에 표시한다. 특히, 사용자의 선택에 따라 다수의 도면 중에서 선택된 도면을 화면 상에 표시한다.
또한, 다수의 도면(또는 도)은 특허 문서에서 각각 도 번호가 부여된다. 예를 들어, "도 1(Fig. 1)"등과 같이 도 번호가 부여된다.
또한, 도면 획득부(31)는 각 도면에서 도면의 회전 방향을 검출하고, 도면이 회전된 경우 원래 방향으로 되돌린다. 이때, 도면의 회전 방향은 도면 부호의 회전 방향으로 결정한다. 도 4a의 예에서, 도면 부호가 왼쪽으로 90도 회전된 경우, 해당 도면을 그 반대 방향인 오른쪽으로 90도 회전하여, 도 4a와 같이 원래 방향으로 되돌린다.
한편, 바람직하게는, 도면 상에서 모든 도면 부호를 검출하지 않고 사전에 정해진 2-3개의 도면 부호만 검출하여, 도면 부호의 방향을 결정할 수 있다.
또한, 도면 획득부(31)는 사전에 정해진 규칙에 따라, 각 도면의 객체와 그 도면 부호만 남겨 두고 나머지(도면 객체와 관련이 없는 객체)를 삭제하여 제외한다. 도 3의 예에서, "FIG.1" 등과 같이, 도면 객체와 직접적인 관련이 없는 객체를 삭제한다. 도면 객체와 관련이 없는 객체는 사전에 규칙으로 정해진다.
즉, 도면 획득부(31)는 도면을 획득하고, 도면을 회전하거나 불필요한 객체를 삭제하는 등 전처리 작업을 수행한다.
이때, 도면 객체는 도면 상에서 표현하고자 하는 기술 구성의 대상을 말한다. 도면 객체의 각 구성에 도면 부호가 표시되거나, 도면 부호와 도면 객체의 각 구성 간에 연결선으로 연결되어 표시된다. 따라서 각 도면은 도면 객체와, 도면 부호, 연결선으로 구성된다.
다음으로, 도면부호 검출부(32)는 도면에서 도면부호 및 그 위치를 검출한다. 즉, 도면에서 도면 부호를 검출하고, 검출된 위치를 해당 도면 부호의 위치로 추정한다.
바람직하게는, 도면부호 검출부(32)는 딥러닝 등 신경망 방식을 기반으로 도면에서 도면 부호의 위치를 감지한다. 더욱 바람직하게는, 딥러닝 방식으로서 레티나넷(RetinaNet) 모델을 이용한다.
즉, 도면부호 검출부(32)는 일반적인 이미지 데이터 처리를 위한 사물 인식 기술과 다르게 흑백의 도형과 숫자만으로 이루어지는 특허 명세서의 도면에 특화된 레티나넷(RetinaNet) 모델을 이용한 사물 인식 기술을 사용하여 도면 내에 도면 부호의 위치를 검출하고, 도면 부호의 좌표 정보를 가져올 수 있다.
또한, 도면부호 검출부(32)는 감지된 도면 부호의 위치에 바운딩 박스(bounding box)를 생성한다. 도면부호 검출부(32)에 의해 생성되는 바운딩 박스는 검출된 도면 부호의 주변에 형성되는 사각형 테두리 형상을 가질 수 있다. 다만, 바운딩 박스는 시각적으로 노출되지 않을 수 있다. 예를 들어, 바운딩 박스는 투명색으로 구성될 수 있다.
도 5는 도면에서 도면 부호를 검출하고 검출된 부호에 바운딩 박스를 표시한 것을 나타내고 있다.
또한, 바람직하게는, 도면부호 검출부(32)는 특허 명세서의 도면에 특화된 OCR(Optical Character Recognition) 기능을 구비하고, 이를 이용하여 해당 좌표에 위치한 도면 부호를 텍스트 형식의 도면 부호로 인식하여 추출한다. 즉, 도면부호 검출부(32)는 도면 부호에 생성되는 바운딩 박스 내에서 OCR로 숫자 또는 문자를 인식하여 텍스트 형식의 도면 부호를 검출한다.
또한, 다른 실시예로서, 도면부호 검출부(32)는 딥러닝 알고리즘 또는 머신러닝 알고리즘을 기반으로 위치가 감지된 도면 부호에서 텍스트 형식의 도면 부호를 추출할 수 있다. 예시적으로, 도면부호 검출부(32)는 도면 부호에서 텍스트 형식의 도면 부호를 추출하기 위해 아스터(ASTER) 등 OCR 기능을 사용할 수 있다.
아스터(ASTER)는 정류(rectification) 네트워크와 인식(recognition) 네트워크로 구성되는 엔드투엔드(end-to-end) 신경망 모델로서, 이미지 또는 바운딩 박스 내에서 텍스트 또는 숫자를 인식하여 추출한다. 도면부호 검출부(32)는 아스터(ASTER)를 사전에 학습시키고, 바운딩 박스를 입력하여 텍스트 형식의 도면 부호를 추출한다.
앞서 도 5의 예에서, 도면 부호는 2, 4, 6, 8, 10, 12, 14, ... 등으로 추출된다.
다음으로, 부호설명 추출부(33)는 도면 부호에 대한 부호 설명을 추출한다.
즉, 부호설명 추출부(33)는 추출된 도면 부호에 대하여, 특허문서의 상세한 설명에서 도면 부호의 설명(부호 설명)을 추출한다.
구체적으로, 특허문서의 상세한 설명 내에서 도면 부호(또는 텍스트 형태의 도면 부호)를 검출하고, 검출된 도면 부호의 직전에 위치된 텍스트 또는 문자열을 부호 설명으로 추출한다.
특히, 도면 부호를 포함하는 문장을 파싱하여, 직전 텍스트 중에서 주어나 목적어로 사용되는 문자열만을 추출한다. 도면 부호를 포함하는 문장이 다수 개이면, 다수의 문장에서 모두 해당 도면 부호의 직전 문자열을 추출하고, 추출된 문자열 중에서 가장 많은 빈도로 중복되는 문자열 부분을 해당 도면 부호의 설명으로 설정한다. 예를 들어, "red patch 10", "patch 10"가 검출되는데 이때, "patch"의 중복 횟수가 가장 많으면, 도면 부호 "10"의 부호 설명을 "patch"로 정한다.
도 6은 도면 부호에 대한 부호 설명을 매핑한 결과를 나타내고 있다.
다음으로, 여백 검출부(34)는 도면에서 여백을 검출한다.
구체적으로, 여백 검출부(34)는 도면 이미지(각 도의 이미지)에서 여백 영역을 검출하되, 영역의 경계가 가로변과 세로변 만으로 이루어진 여백 영역을 검출한다.
바람직하게는, 세로변의 길이는 사전에 정해진 최소 길이 이상으로 길도록 설정한다. 특히, 세로변의 최소 길이는 글자 높이로 설정한다. 또한, 내부 영역의 폭의 길이는 사전에 정해진 최소 길이 이상으로 길도록 설정한다. 이때, 영역 폭의 최소 길이는 사전에 정해진 최소 글자수의 너비로 설정한다.
예를 들어, 영역의 폭을 최소 4글자의 너비로 설정하면, 최소 4개의 글자를 기재할 수 있는 길이이다. 즉, 세로변의 길이는 글자 높이이므로 한 줄의 글자를 기재할 수 있는 공간이 된다. 글 간격은 줄 간의 간격을 말하고, 글자 높이는 해당 글자의 높이이다. 그러나 글자 높이는 해당 글자가 차지하는 공간의 높이를 의미하므로, 줄 간격과 같은 것으로 본다.
또한, 바람직하게는, 여백 검출부(34)는 도면에서 색상을 이용하여 후보 여백 영역을 검출한다. 즉, 색상이 흰색(또는 바탕색)인 영역을 여백 영역으로 검출한다. 앞서와 같이, 세로변과 가로변으로 이루어진 영역으로 검출하되, 내부 영역의 폭과 세로변의 길이가 최소 길이 이상이 되는 영역을 검출한다.
도 7은 각 도면(각 도) 이미지 내에서 검출된 여백 영역을 예시하고 있다. 도면 내에서 회색 부분이 여백 영역이다. 도 7에서 보는 바와 같이, 도면의 객체 내에서도 여백 영역이 검출될 수 있다. 즉, 객체 내부의 바탕색 영역이 일정한 크기가 되면, 여백 영역으로 검출된다.
한편, 도면 객체의 바운딩 박스와, 전체 영역의 캔버스 박스 간의 간격은 크기 조절부(36)에 의해 조절될 수 있다. 이때, 도면 객체의 크기는 사전에 정해진다. 따라서 캔버스의 크기는 커지거나 줄어드는 등 변경될 수 있다. 즉, 캔버스 박스의 크기가 조절된다.
여기서, 객체의 바운딩 박스는 객체를 포함하는 최소 사각형을 말하고, 캔버스(또는 캔버스 박스)는 도면이 표시되는 화면 상의 영역을 말한다.
도 7의 예에서, A는 객체의 바운딩 박스를 나타내고, B는 캔버스를 나타낸다.
바운딩 박스와 캔버스 박스 간의 간격이 작은 경우, 여백 영역의 최소 길이 조건을 만족하지 못하여, 여백 영역에서 제외될 수 있다. 예를 들면, 도 8의 C와 D 부분과 같이, 좌측 또는 우측의 간격이 줄어들면, 여백 영역의 폭의 길이가 최소 기준 길이 보다 작기 때문에 여백 영역으로 검출되지 않는다.
다음으로, 부호설명 배치부(35)는 도면 여백에 부호 설명을 배치한다.
즉, 부호설명 배치부(35)는 각 도면 부호의 부호 설명을 배치할 영역(이하 설명 영역)을 설정하고, 각 설명 영역이 다른 설명 영역과 겹치지 않도록 여백 영역 내에 배치한다.
이때, 설명 영역의 크기는 부호 설명의 글자 크기와 개수 등에 의해 결정된다. 글자 크기는 글자의 높이와 너비로 구성된다. 글자 크기는 한 글자가 차지하는 공간을 말한다. 즉, 글자 크기와 폰트(글꼴)의 크기와는 구별된다.
또한, 부호설명 배치부(35)는 하나의 도면 부호에 대하여 설명 영역을 줄의 개수에 따라 다수 개를 설정한다. 이때, 줄의 개수는 사전에 정해진 최대 줄 수 이하로 한정한다. 바람직하게는, 줄의 최대 개수(또는 최대 줄 수)는 3개로 정한다. 줄바꿈은 단어 단위로 수행된다. 따라서 부호 설명의 단어 수에 따라 줄의 개수가 한정될 수 있다. 예를 들어, 부호 설명의 단어 수가 1개이면 한줄의 설명 영역만 설정되고, 단어의 수가 2개이면 1줄의 설명 영역과 2줄의 설명 영역으로 설정된다.
또한, 2줄 이상인 경우, 해당 개수의 줄 내에서 부호 설명을 배치할 때 설명 영역의 폭을 최소화 하도록 배치하는 설명 영역을 해당 줄 수의 설명 영역으로 설정한다.
도 9는 부호 설명의 줄 수에 따른 다수의 설명 영역을 예시하고 있다. 도 9의 예에서, 설명 영역 1은 줄 수가 1개인 경우이고, 설명 영역 2와 3은 각각 줄 수가 2개와 3개인 경우를 나타내고 있다.
또한, 부호설명 배치부(35)는 하나의 도면 부호에 대한 다수의 설명 영역이 설정되는 경우, 다수의 설명 영역 중 하나만 선택하여, 여백 영역에 배치한다.
특히, 부호설명 배치부(35)는 하나의 도면 부호에 대한 설명 영역이 적어도 2개이면, 부호 설명의 길이(또는 표준 길이)에 따라 각 설명 영역의 우선순위를 설정한다. 설명 영역의 폭이 사전에 정해진 표준 폭 보다 작으면서 줄 수가 최소인 설명 영역을 최우선 순위로 설정한다. 일례로서, 부호 설명이 표준 길이 이하인 경우, 1줄의 설명 영역이 최우선 순위로 설정된다. 표준 길이가 10이고 부호 설명의 길이가 15나 25인 경우, 각각 2줄과, 3줄의 설명 영역이 최우선 순위로 설정된다.
또는, 다른 실시예로서, 설명 영역의 가로와 세로의 길이 비율에 의해 각 설명 영역의 우선순위를 설정한다. 일례로서, 가로와 세로의 비율을 5:1로 설정하고, 이 비율에 가장 가까울수록 우선순위를 높게 설정한다.
부호설명 배치부(35)는 각 도면 부호에 대하여 최우선 순위의 설명 영역을 선정하여 설명 영역을 여백 영역 내에 배치하고, 최우선 순위의 설명 영역을 배치할 수 없으면 나머지 설명 영역들 중 하나를 여백 영역 내에 배치한다.
또한, 부호설명 배치부(35)는 각 도면 부호의 위치에서 인접한 여백에 해당 부호의 설명 영역을 먼저 배치하고, 이후에, 인접한 여백에 배치하지 못한 도면 부호의 설명 영역을 배치한다. 여기서 인접한 여백 위치(또는 인접한 여백)는 해당 도면 부호의 위치(또는 도면 부호의 바운딩 박스)에서 상하 좌우의 인접한 위치를 말한다.
즉, 부호설명 배치부(35)는 각 도면 부호에 대하여, 각 도면 부호의 인접한 여백 공간(여백 영역 내의 공간)에 해당 도면 부호의 설명 영역을 배치할 수 있으면, 해당 도면 부호의 설명 영역을 먼저 배치한다.
도 10은 각 도면 부호의 인접한 여백 공간에 설명 영역을 배치하는 것을 예시하고 있다. 도 10의 예에서, 도면 부호 "2", "10", "12", "14", "16", "18"만 인접한 위치에 도면 설명을 배치할 수 있다. 이때, 도면 부호 "4"에도 인접한 위치에 여백이 있으나, 해당 여백에는 도면 부호 "4"의 부호 설명 "sidewall section"을 기재할만큼 공간이 크지 않다.
또한, 부호설명 배치부(35)는 인접한 여백에 배치한 후, 배치되지 않은 각 도면 부호에 대해, 해당 도면 부호의 위치와 가장 가까운 여백(여백의 위치)에 해당 도면 부호의 설명 영역을 배치한다.
도 11은 인접한 여백에 배치되는 않은 각 도면 부호에 대하여, 가장 가까운 여백에 설명 영역을 배치한 것을 예시한 것이다. 도 11의 예에서, 도면 부호 "4", "6", "8", "20", "22", "24", "26"에 대해 각각 부호 설명을 가장 가까운 위치에 배치하고 있다.
또한, 부호설명 배치부(35)는 인접하지 않은 위치에 설명 영역을 배치하는 경우, 설명 영역과 해당 도면 부호 간에 연결선으로 연결하여 표시하거나, 도면 부호를 부호 설명에 추가한다. 도면 부호의 부호 설명에 도면 부호를 추가하는 경우, 도면 부호가 추가됨에 따라 설명 영역의 크기도 변경시킨다. 또한, 연결선과 도면 부호를 모두 추가하거나, 선택적으로 하나만 추가한다.
도 12는 인접하지 않은 위치에 배치된 부호 설명을 해당되는 도면 부호에 연결선으로 연결한 형태를 나타내고 있다.
다음으로, 크기 조절부(36)는 여백 공간의 크기와, 전체 도면 부호의 부호 설명의 글자 양을 이용하여, 캔버스(또는 캔버스 박스)의 크기 또는 부호 설명의 글자 크기를 조절한다. 특히, 전체 여백 공간의 크기 대비 부호 설명의 전체 설명 영역의 크기의 비율이 사전에 정해진 최대 비율 보다 작도록, 캔버스의 크기 또는 부호 설명의 글자 크기를 조절한다.
구체적으로, 크기 조절부(36)는 여백 공간의 크기를 산출한다. 바람직하게는, 픽셀 단위로 산출한다.
또한, 크기 조절부(36)는 부호 설명의 전체 설명 영역의 크기를 산출한다. 이때, 부호 설명의 전체 설명 영역은 해당 도면에 기재할 도면 부호의 부호 설명의 전체 글자 수를 산출하고, 해당 글자 수에 글자 크기를 곱하여 전체 설명 영역의 크기를 산출한다. 이때, 글자 수는 띄어쓰기를 위한 빈칸도 포함한다.
글자 크기는 한 글자가 표시되는 영역의 크기를 말한다. 글자 크기는 글자의 너비와 높이에 의해 결정된다. 글자 크기는 폰트 크기, 장평, 자간, 줄 간격 등 서식 변수에 의해 결정된다.
장평이란 글자의 세로 길이에 대한 폭(가로)의 %를 의미하고, 자간이란 한 글자 한 글자 간의 간격을 말한다. 줄 간격이란 글자가 2줄로 표기될 때 첫줄과 둘째줄과의 간격을 말한다.
또한, 글자 크기는 폰트(또는 글꼴)의 크기에 의해 영향을 받는다. 그러나, 글자 크기는 폰트 크기를 의미하지 않는다. 앞서 설명한 바와 같이, 글자 크기는 한 글자가 표시되는 영역의 크기를 말한다.
따라서 크기 조절부(36)는 폰트 크기, 장평, 자간, 줄 간격 등의 서식 변수를 변경하여, 글자 크기를 조절한다. 일례로서, 글자 크기를 줄이기 위해서, 폰트 크기, 장평, 자간, 줄 간격 등 전체 또는 그 일부를 줄일 수 있다.
글자 크기를 조절하는 과정을 구체적으로 설명한다.
한편, 바람직하게는, 크기 조절부(36)는 부호 설명의 글자 크기를 사전에 정해진 표준 크기로 설정해둔다.
먼저, 크기 조절부(36)는 전체 여백 크기 대비 표준 크기에 의한 전체 설명 영역 크기의 비율을 산출하여, 최대 비율 보다 큰지 판단한다. 최대 비율 보다 큰 경우, 글자 크기를 작게 조절하여 전체 설명 영역의 비율이 최대 비율 이하가 되도록 설정한다. 이때, 글자의 폰트 크기, 자간, 장평, 줄 간격의 변수를 조절하여 글자의 크기를 조절한다.
한편, 바람직하게는, 크기 조절부(36)는 글자 크기를 조절한 후, 여백 검출부(34)를 통해 여백을 다시 검출한다. 글자 크기가 변경되었으므로, 여백 영역도 달라질 수 있다. 따라서 크기 조절부(36)는 다시 검출된 여백 영역의 전체 크기 대비 전체 설명 영역의 크기의 비율을 다시 산출한다.
또한, 크기 조절부(36)는 사전에 최소 글자 크기를 설정해둔다. 그리고 최소 글자 크기로 설정하더라도 전체 설명 영역의 비율이 최대 비율 보다 크면, 캔버스의 크기를 크게 조절하여, 캔버스 박스와 도면 객체의 바운딩 박스의 간격을 넓힘으로써 여백 영역을 확장한다.
다음으로, 여백 영역을 조절하는 과정을 구체적으로 설명한다.
캔버스 박스의 크기를 조절하여, 캔버스 박스와 도면 객체의 바운딩 박스의 간격을 조절하고, 이를 통해, 여백 영역을 확장하거나 줄인다.
바람직하게는, 크기 조절부(36)는 사전에 표준 간격을 설정해둔다. 표준 간격은 상하의 표준 간격과, 좌우의 표준 간격으로 구분될 수 있다.
크기 조절부(36)는 캔버스 박스와 객체의 바운딩 박스의 간격이 표준 간격이 되도록, 캔버스의 크기를 조절한다.
그리고 크기 조절부(36)는 전체 여백 크기 대비 전체 설명 영역 크기의 비율을 산출하여, 최대 비율 보다 큰지 판단한다. 최대 비율 보다 큰 경우, 캔버스의 크기를 크게 조절하여 배치한 후, 비율을 다시 산출하여 최대 비율 보다 큰지 판단한다.
이때, 크기 조절부(36)는 캔버스의 크기를 조절한 후, 여백 검출부(34)를 통해 여백 영역을 다시 검출한다. 캔버스 박스와 객체의 바운딩 박스의 간격이 변경되었으므로, 여백 영역도 달라질 수 있다. 따라서 크기 조절부(36)는 다시 검출된 여백 영역의 전체 크기 대비 전체 설명 영역의 크기의 비율을 다시 산출한다.
그리고 크기 조절부(36)는 앞서 전체 여백 크기 대비 전체 설명 영역 크기의 비율을, 최대 비율과 비교하는 작업을 반복한다. 상기와 같은 과정을 반복하여, 전체 여백 크기 대비 전체 설명 영역 크기의 비율이 최대 비율 보다 커지도록, 도면 객체의 크기를 조절한다.
한편, 크기 조절부(36)는 도면 객체의 배치를 캔버스 중앙에 위치시킬 수도 있으나, 한쪽 면(상하좌우 면)으로 치우치게 위치시킬 수 있다. 예를 들어, 도면 객체의 바운딩 박스의 좌측면이 캔버스 박스의 좌측면과 최소 간격만 유지하도록, 도면 객체를 배치할 수 있다. 이러한 배치를 통해, 전체 여백 영역이 증가할 수 있다.
또한, 크기 조절부(36)는 캔버스의 크기를 조절할 때, 바운딩 박스의 한쪽 면이 글자 너비 또는 높이 단위로 조정되도록, 그 크기를 조절한다. 예를 들어, 상하 기준으로 볼 때, 글자 높이 단위로 도면 객체 또는 그 바운딩 박스의 높이를 조절한다. 또는 좌우 기준으로 볼 때, 글자 너비 단위로 도면 객체의 너비를 조절한다. 도면 객체 또는 바운딩 박스의 가로세로 비율은 동일하므로, 너비 또는 높이 중 하나를 조절하면, 나머지도 자동으로 조절된다.
다음으로, 설명배치 편집부(37)는 부호 설명의 위치를 편집한다.
또한, 설명배치 편집부(37)는 사용자의 입력에 따라 부호 설명의 위치를 변경하고, 이를 위한 편집 화면을 제공한다.
이상, 본 발명자에 의해서 이루어진 발명을 상기 실시 예에 따라 구체적으로 설명하였지만, 본 발명은 상기 실시 예에 한정되는 것은 아니고, 그 요지를 이탈하지 않는 범위에서 여러 가지로 변경 가능한 것은 물론이다.
10 : 사용자 단말
30 : 도면표시 시스템 31 : 도면 획득부
32 : 도면부호 검출부 33 : 부호설명 추출부
34 : 여백 검출부 35 : 부호설명 배치부
36 : 크기 조절부 37 : 설명배치 편집부
40 : 데이터베이스 41 : 열람문서DB
42 : 도면정보DB
50 : 특허열람 서버 80 : 네트워크
30 : 도면표시 시스템 31 : 도면 획득부
32 : 도면부호 검출부 33 : 부호설명 추출부
34 : 여백 검출부 35 : 부호설명 배치부
36 : 크기 조절부 37 : 설명배치 편집부
40 : 데이터베이스 41 : 열람문서DB
42 : 도면정보DB
50 : 특허열람 서버 80 : 네트워크
Claims (14)
- 여백을 활용한 특허문서의 도면 표시 시스템에 있어서,
특허문서의 도면을 획득하여 각 도면(이하 당해 도면)을 화면 상에 표시하는 도면 획득부;
상기 당해 도면에서 도면 부호 및 그 위치를 검출하는 도면부호 검출부;
상기 특허문서의 상세한 설명을 참조하여, 상기 도면 부호에 대한 부호 설명을 추출하는 부호설명 추출부;
도면에서 여백 영역을 검출하는 여백 검출부; 및,
상기 여백 영역에 부호 설명을 배치하는 부호설명 배치부를 포함하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제1항에 있어서,
상기 시스템은, 여백 공간의 크기와, 전체 도면 부호의 부호 설명의 글자 양을 이용하여, 캔버스의 크기 또는 부호 설명의 글자 크기를 조절하는 크기 조절부를 더 포함하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제2항에 있어서,
상기 크기 조절부는 전체 여백 영역의 크기 대비 사전에 결정된 표준 크기에 의한 전체 설명 영역 크기의 비율을 산출하여, 사전에 정해진 최대 비율 보다 큰지를 판단하고, 최대 비율 보다 큰 경우, 상기 캔버스의 크기를 크게 조절하거나 상기 부호 설명의 글자 크기를 작게 조절하여 전체 설명 영역의 비율이 최대 비율 이하가 되도록 설정하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제2항에 있어서,
상기 크기 조절부는 크기 조절 후, 상기 여백 검출부를 통해 여백 영역을 다시 검출하고, 다시 검출된 여백 영역을 대상으로 전체 여백 영역의 크기를 산출하여 대비하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제1항에 있어서,
상기 도면 획득부는 해당 도면에서 회전 방향을 검출하고 도면이 회전된 경우 원래 방향으로 되돌리되, 해당 도면의 회전 방향을 해당 도면의 도면 부호의 회전 방향으로 결정하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제1항에 있어서,
상기 여백 검출부는 해당 도면에서 영역의 경계가 가로변과 세로변 만으로 이루어진 여백 영역을 검출하고, 상기 여백 영역의 세로변의 길이와 영역 폭의 길이가 각각 사전에 정해진 길이 이상이 되도록 검출하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제6항에 있어서,
상기 세로변의 길이는 글자 높이 보다 크도록 설정되고, 여백 영역의 영역 폭은 사전에 정해진 최소 글자수의 글자 너비로 설정되는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제1항에 있어서,
상기 부호설명 배치부는 각 도면 부호의 부호 설명을 배치할 영역(이하 설명 영역)을 설정하고, 각 설명 영역이 다른 설명 영역과 겹치지 않도록 여백 영역 내에 배치하되, 상기 설명 영역의 크기는 해당 부호 설명의 글자 크기와 개수에 의해 결정되고, 글자 크기는 글자 높이와 글자 너비로 결정되는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제8항에 있어서,
상기 부호설명 배치부는 하나의 도면 부호에 대하여 설명 영역을 줄의 개수에 따라 다수 개로 설정하되, 해당 개수의 줄 내에서 부호 설명을 배치할 때 설명 영역의 폭을 최소화 하도록 배치하는 설명 영역을 해당 줄 수의 설명 영역으로 설정하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제9항에 있어서,
상기 부호설명 배치부는 하나의 도면 부호에 대한 설명 영역이 적어도 2개이면, 각 설명 영역의 우선순위를 설정하되, 해당 설명 영역의 부호 설명의 길이에 따라 우선순위를 설정하거나, 설명 영역의 가로와 세로의 비율에 의해 우선순위를 설정하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제1항에 있어서,
상기 부호설명 배치부는 각 도면 부호의 위치에서 인접한 여백에 해당 도면 부호의 설명 영역을 먼저 배치하고, 이후에, 인접한 여백에 설명 영역을 배치하지 못한 도면 부호에 대하여 해당 도면 부호의 설명 영역을 나머지 여백 영역에 배치하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제11항에 있어서,
상기 부호설명 배치부는 인접한 여백에 설명 영역을 배치하지 못한 도면 부호에 대하여, 해당 도면 부호의 위치와 가장 가까운 여백 위치에 해당 도면 부호의 설명 영역을 배치하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제12항에 있어서,
상기 부호설명 배치부는 인접하지 않은 여백 위치에 설명 영역을 배치하는 경우, 해당 설명 영역과 해당 도면 부호 간에 연결선으로 연결하여 표시하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
- 제2항에 있어서,
상기 크기 조절부는 폰트 크기, 장평, 자간, 줄 간격 중 어느 하나 이상의 서식 변수를 이용하여 글자 크기를 조절하는 것을 특징으로 하는 여백을 활용한 특허문서의 도면 표시 시스템.
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210030518A KR102627180B1 (ko) | 2021-03-09 | 2021-03-09 | 여백을 활용한 특허 문서의 도면 표시 시스템 |
PCT/KR2022/001317 WO2022191427A1 (ko) | 2021-03-09 | 2022-01-25 | 여백을 활용한 특허 문서의 도면 표시 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020210030518A KR102627180B1 (ko) | 2021-03-09 | 2021-03-09 | 여백을 활용한 특허 문서의 도면 표시 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20220126369A true KR20220126369A (ko) | 2022-09-16 |
KR102627180B1 KR102627180B1 (ko) | 2024-01-19 |
Family
ID=83226915
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020210030518A KR102627180B1 (ko) | 2021-03-09 | 2021-03-09 | 여백을 활용한 특허 문서의 도면 표시 시스템 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102627180B1 (ko) |
WO (1) | WO2022191427A1 (ko) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070071906A (ko) * | 2005-12-30 | 2007-07-04 | (주)광개토연구소 | 이미지 특허맵 제공 시스템 |
US20140200880A1 (en) * | 2007-06-06 | 2014-07-17 | Michael S. Neustel | Patent Analyzing System |
US20150259866A1 (en) * | 2014-03-14 | 2015-09-17 | Mccue Corporation | Protective barrier |
KR20160125931A (ko) | 2016-10-11 | 2016-11-01 | 이현엽 | 특허문서의 도면가독성 증진 서비스 제공을 위한 시스템 및 방법 |
KR20180106517A (ko) * | 2017-03-20 | 2018-10-01 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 도면 부호를 포함하는 특허 도면 이미지에 도면 부호의 설명을 맵핑 처리하는 방법 및 장치 |
KR20180107764A (ko) * | 2017-03-22 | 2018-10-02 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지에 도면 부호의 설명이 표시되도록 처리하는 방법 및 장치 |
KR20200013130A (ko) | 2018-07-12 | 2020-02-06 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지의 도면 부호에 대응되는 도면 부호의 설명 데이터 처리 방법 및 장치 |
JP2020068011A (ja) * | 2018-10-23 | 2020-04-30 | 雲拓科技有限公司Integral Search International Ltd. | 特許書類図面資料ガイド内容自動獲得表示設備 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101364745B1 (ko) * | 2005-12-29 | 2014-02-21 | 오즈미즈 피티와이. 엘티디. | 데이터를 이동 단말기에 표시하기 위한 방법 및 시스템 |
KR20070090321A (ko) * | 2006-03-02 | 2007-09-06 | (주)윕스 | 문서 정보 추출 시스템과 그 추출 방법 및 이를 기록한기록매체 |
KR101533655B1 (ko) * | 2012-10-26 | 2015-07-06 | 방경란 | 특허명세서 분석시스템 및 방법 |
KR20170122353A (ko) * | 2016-04-26 | 2017-11-06 | 주식회사 월콘 | 지식재산권 관리 방법 및 장치 |
-
2021
- 2021-03-09 KR KR1020210030518A patent/KR102627180B1/ko active IP Right Grant
-
2022
- 2022-01-25 WO PCT/KR2022/001317 patent/WO2022191427A1/ko active Application Filing
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20070071906A (ko) * | 2005-12-30 | 2007-07-04 | (주)광개토연구소 | 이미지 특허맵 제공 시스템 |
US20140200880A1 (en) * | 2007-06-06 | 2014-07-17 | Michael S. Neustel | Patent Analyzing System |
US20150259866A1 (en) * | 2014-03-14 | 2015-09-17 | Mccue Corporation | Protective barrier |
KR20160125931A (ko) | 2016-10-11 | 2016-11-01 | 이현엽 | 특허문서의 도면가독성 증진 서비스 제공을 위한 시스템 및 방법 |
KR20180106517A (ko) * | 2017-03-20 | 2018-10-01 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 도면 부호를 포함하는 특허 도면 이미지에 도면 부호의 설명을 맵핑 처리하는 방법 및 장치 |
KR20180107764A (ko) * | 2017-03-22 | 2018-10-02 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지에 도면 부호의 설명이 표시되도록 처리하는 방법 및 장치 |
KR20180107707A (ko) | 2017-03-22 | 2018-10-02 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지에 도면 부호의 설명이 표시되도록 맵핑 처리하는 방법 및 장치 |
KR20200013130A (ko) | 2018-07-12 | 2020-02-06 | (주)광개토연구소 | 인공 지능 기술 기반의 머신 러닝을 사용하는 특허 도면 이미지의 도면 부호에 대응되는 도면 부호의 설명 데이터 처리 방법 및 장치 |
JP2020068011A (ja) * | 2018-10-23 | 2020-04-30 | 雲拓科技有限公司Integral Search International Ltd. | 特許書類図面資料ガイド内容自動獲得表示設備 |
Also Published As
Publication number | Publication date |
---|---|
WO2022191427A1 (ko) | 2022-09-15 |
KR102627180B1 (ko) | 2024-01-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10726212B2 (en) | Presenting translations of text depicted in images | |
US10223345B2 (en) | Interactively predicting fields in a form | |
US9514216B2 (en) | Automatic classification of segmented portions of web pages | |
US7801358B2 (en) | Methods and systems for analyzing data in media material having layout | |
US20150134323A1 (en) | Presenting translations of text depicted in images | |
US20160275067A1 (en) | Domain-based generation of communications media content layout | |
WO2014005609A1 (en) | Paragraph alignment detection and region-based section reconstruction | |
US20210406453A1 (en) | Mapping annotations to ranges of text across documents | |
CN114359924A (zh) | 数据处理方法、装置、设备及存储介质 | |
JP2009110500A (ja) | ドキュメント処理装置、ドキュメント処理方法、ドキュメント処理装置のプログラム | |
CN114170423A (zh) | 一种图像文档版面识别方法、装置及其系统 | |
US11430166B1 (en) | Facilitating generation of number-bullet objects | |
KR20220126369A (ko) | 여백을 활용한 특허 문서의 도면 표시 시스템 | |
CN108491452A (zh) | 一种地理空间分布特征驱动的字符云位置配置方法 | |
KR102635715B1 (ko) | 특허 문서에 대한 워드 클라우드 표시 시스템 | |
KR102533523B1 (ko) | 명세서 내용을 함께 표시하는 부호 기반 도면 표시 시스템 | |
US11972196B1 (en) | Systems and methods for processing designs | |
US12079564B1 (en) | Systems and methods for processing designs | |
US11983804B1 (en) | Systems and methods for processing designs | |
CN114580349B (zh) | 内容处理方法、装置、计算机设备及计算机可读存储介质 | |
CN115759020A (zh) | 表格信息提取方法、表格模板配置方法和电子设备 | |
AU2023210536B1 (en) | Systems and methods for processing designs | |
AU2023210534B1 (en) | Systems and methods for processing designs | |
AU2023210535B1 (en) | Systems and methods for processing designs | |
AU2023210540B1 (en) | Systems and methods for processing designs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant |