KR101268503B1 - Method and its system for generation of patent maps - Google Patents
Method and its system for generation of patent maps Download PDFInfo
- Publication number
- KR101268503B1 KR101268503B1 KR1020110040828A KR20110040828A KR101268503B1 KR 101268503 B1 KR101268503 B1 KR 101268503B1 KR 1020110040828 A KR1020110040828 A KR 1020110040828A KR 20110040828 A KR20110040828 A KR 20110040828A KR 101268503 B1 KR101268503 B1 KR 101268503B1
- Authority
- KR
- South Korea
- Prior art keywords
- map generation
- database
- generation server
- map
- patent map
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/151—Transformation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
특허지도 생성 시스템 및 그 방법이 개시된다. 본 발명의 실시예에 따른 특허지도 생성 시스템은 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스, 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트, 클라이언트로부터 키워드를 전달받아 키워드를 사용하여 외부 특허 데이터베이스로부터 분석대상이 되는 특허문서들을 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들로부터 특허문서들 간의 유사성을 추출하여 비유사성 행렬을 생성하고, 비유사성 행렬을 이용하여 특허지도 및 특허정보를 생성하는 특허지도 생성 서버 및 특허문서, SAO 구조, 비유사성 행렬, 특허지도 및 특허정보를 저장하는 데이터베이스를 포함한다.A patent map generation system and method thereof are disclosed. The patent map generation system according to an embodiment of the present invention uses at least one external patent database for storing patent documents to be analyzed, at least one client receiving a keyword for the analysis target, and a keyword received from the client. After searching and collecting patent documents to be analyzed from an external patent database, the SAO structure is extracted from the patent documents, and similarities between the patent documents are extracted from the extracted SAO structures to generate dissimilarity matrices. It includes a patent map generation server for generating a patent map and patent information using a matrix and a database for storing patent documents, SAO structure, dissimilarity matrix, patent map and patent information.
Description
본 발명은 특허지도 생성 시스템 및 그 방법으로서, 더욱 상세하게는 특허문서의 자연어처리 분석에 의해 특허 공백지도, 특허 집중지역지도, 출원인 특허 경쟁지도, 특허 군집지도의 파악을 통해 의사결정을 지원하는 특허지도 생성 시스템 및 그 방법에 관한 것이다.
The present invention relates to a patent map generation system and method thereof, and more particularly, to support decision making by grasping a patent blank map, a patent concentrated region map, an applicant patent competition map, and a patent cluster map by natural language processing analysis of a patent document. A patent map generation system and method thereof.
특허는 기술의 진보를 반영하는 신뢰성 있는 최신정보의 보고이며, 따라서 특허분석은 기술동향 파악과 기술개발 전략의 수립에 필수적인 요소로 인식되어 왔다. 특허분석을 위한 다양한 도구들 중 특허지도는 특허문서로부터 정보를 추출하고 가공하여 특허들간의 관계를 시각화함으로써 기술관련 종사자들이 지적 재산권에 대한 추세를 한눈에 파악할 수 있도록 한다는 점에서 매우 유용한 도구이다.Patents are reports of reliable and up-to-date information that reflects technological advances. Therefore, patent analysis has been recognized as an essential element in identifying technology trends and establishing technology development strategies. Among the various tools for patent analysis, patent guidance is a very useful tool for extracting and processing information from a patent document and visualizing the relationship between patents so that technical personnel can grasp the trend of intellectual property right at a glance.
일반적으로 특허지도는 도 1과 같이 특허 데이터베이스로부터 수집된 특허문서가 포함하고 있는 서지적 정보 (예: 출원인, 등록연도, 기술분류 등), 기술적 정보 (예: 초록, 발명의 내용 등), 권리적 정보 (예: 청구항)로부터 분석을 위한 자료를 추출하여, 수집된 특허집합에 대한 전체적인 동향을 시각화함으로써 분석자의 이해를 돕는데 유용하게 사용되는 도구로 정의될 수 있다.Generally, a patent map includes bibliographic information (e.g., applicant, year of registration, technical classification, etc.), technical information (e.g., abstract, contents of invention, etc.) included in a patent document collected from a patent database as shown in FIG. By extracting data for analysis from historical information (eg claims) and visualizing the overall trend of the collected patent set, it can be defined as a tool useful for an analyst's understanding.
도 2는 특허지도의 일반적인 작성 절차도로서, 먼저 분석목적을 설정하면 그에 따른 분석을 위한 세부적인 기술영역을 확정할 수 있다. 다음으로 설정된 기술영역에 대해 수집하고자 하는 특허문서에 대한 조사범위 (예: 출원연도 구간, 기술관련 주제어 등)와 분석에 사용되는 방법 (예: 기술분류별 특허 수, 출원인별 특허 수 등)을 선정하여 자료를 가공한 후 시각화 도표를 작성할 수 있다. 분석자는 이러한 특허지도를 활용하여 기술분야별 특허 추세, 기업별 특허 추세 등과 같은 다양한 시각화 결과물을 활용하여 기술개발의 동향을 파악하거나 연구개발 정책수립을 위한 자료로 활용할 수 있다.2 is a general drawing procedure of a patent map. First, when an analysis objective is set, detailed technical areas for analysis may be determined. Next, select the research scope (e.g., filing year section, technical key words, etc.) for the patent document to be collected in the set technical area and the method used for analysis (e.g., number of patents by technology classification, number of patents by applicant, etc.) After processing the data, you can create visualization charts. Analysts can use these visualizations to identify trends in technology development and to use them as a resource for establishing R & D policies, using various visualization results such as patent trends by technology and patent trends by company.
하지만, 기존의 특허지도 작성방법들은 주로 연도별 특허 추이, 출원인별 특허 추이 등과 같이 계량화가 용이한 특허문서의 서지적 정보의 계량화를 통해 2차원의 도표로 표현하는 형태였다. 따라서 특허의 내용에 대한 분석을 기반으로 생성될 수 있는 특허 공백지역, 특허 집중지역지도, 출원인 특허 경쟁지도, 특허 군집지도의 생성과 이에 대한 분석을 지원하기는 어렵다. 특허 문서내용의 분석에는 기술적 정보 및 권리적 정보에 대한 분석이 요구된다. 그러나 특허 내용의 분석을 위해서 기존에는 전문가의 정성적 판단과 능력에 크게 의존하는 형태인데, 최근 기술의 발전은 기하급수적으로 이루어져 새로운 발명들을 특허화하고 있으므로 전문가의 능력에만 의존하는 것은 시간적 비용적 문제가 수반될 수 밖에 없다.
However, the existing patent mapping methods are mainly represented by two-dimensional diagrams through the quantification of bibliographic information of easy-to-quantify patent documents such as yearly patent trends and patent trends by applicants. Therefore, it is difficult to support the generation and analysis of patent blank areas, patent concentrated area maps, applicant patent competition maps, and patent cluster maps that can be generated based on analysis of the contents of patents. Analysis of patent document content requires analysis of technical information and rights information. However, in order to analyze the contents of the patent, it is conventionally highly dependent on the expert's qualitative judgment and ability. Since the recent development of the technology is exponential and patents new inventions, it is only a matter of time and cost to rely on the expert's ability. It must be accompanied.
본 발명은 상기와 같은 문제점을 해결하기 위해 제안된 특허지도 생성 시스템 및 그 방법에 관한 것으로, 자세하게는 특허문서로부터 기술정보와 권리정보의 내용에 대해 자연어처리를 통하여 특허의 발명적 특징과 관련되며 문서 내에 포함된 기술적 요소들간의 연관관계를 명시적으로 표현하는 주체-작용-대상 (SAO: subject-action-object) 구조들을 문장으로부터 추출하고, 특허별로 추출된 SAO 구조들간의 의미론적 문장 유사성을 계산함으로써 특허들간의 기술적 유사성을 계산한 후, 특허들을 저차원의 공간에 사상하여 특허지도를 생성할 수 있는 특허지도 생성 시스템 및 그 방법을 제공하는 것을 목적으로 한다.
The present invention relates to a system for generating a patent map and a method thereof proposed to solve the above problems. Specifically, the present invention relates to an inventive feature of a patent through natural language processing of technical information and rights information from a patent document. Extracts subject-action-object (SAO) structures expressly expressing associations between technical elements included in the document from sentences, and semantic sentence similarity between SAO structures extracted by patents It is an object of the present invention to provide a patent map generation system and method for generating a patent map by calculating the technical similarities between patents by calculating the patents and then mapping the patents to a low-dimensional space.
본 발명의 일 측면에 따르면, 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스; 상기 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트; 상기 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 상기 특허문서들로부터 SAO 구조를 추출하고, 추출된 상기 SAO 구조들로부터 상기 특허문서들 간의 유사성을 추출하여 비유사성 행렬을 생성하고, 상기 비유사성 행렬을 이용하여 특허지도 및 특허정보를 생성하는 특허지도 생성 서버; 및 상기 특허문서, SAO 구조, 비유사성 행렬, 특허지도 및 특허정보를 저장하는 데이터베이스를 포함하는 것을 특징으로 하는 특허지도 생성 시스템이 제공될 수 있다.According to an aspect of the invention, at least one external patent database for storing the patent documents to be analyzed; At least one client receiving a keyword for the analysis subject; Receives a keyword from the client, retrieves and collects the patent documents to be analyzed from the external patent database using the keyword, extracts an SAO structure from the patent documents, and extracts the patent from the extracted SAO structures. A patent map generation server extracting similarities between documents to generate a dissimilarity matrix, and generating a patent map and patent information using the dissimilarity matrix; And a database storing the patent document, the SAO structure, the dissimilarity matrix, the patent map, and the patent information.
이 때, 상기 특허지도 생성 서버는, 상기 분석대상에 대한 상기 키워드를 상기 클라이언트로부터 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스에서 상기 특허문서를 검색하여 수집한 후 상기 데이터베이스에 저장하는 특허문서 수집부; 상기 데이터베이스에 저장된 상기 특허문서로부터 상기 SAO 구조들을 추출하는 자연어 처리부; 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 상기 비유사성 행렬을 생성하는 유사성 분석부; 및 상기 비유사성 행렬을 사용하여 상기 특허지도 및 특허정보를 생성하는 특허 지도 생성부를 포함할 수 있다.In this case, the patent map generation server receives the keyword for the analysis target from the client, and collects the patent document using the keyword by searching for and collecting the patent document from the external patent database and storing it in the database. part; A natural language processor extracting the SAO structures from the patent document stored in the database; A similarity analyzer extracting semantic sentence similarities between the SAO structures to extract technical similarities between the patent documents, and generating the dissimilarity matrix between the patent documents; And a patent map generator configured to generate the patent map and patent information by using the dissimilarity matrix.
한편, 상기 특허 지도 생성부는 다차원척도법을 활용하여 상기 특허문서들 간의 관계를 저차원 공간에 사상하여 상기 특허지도 및 특허정보를 생성할 수 있다.Meanwhile, the patent map generator may generate the patent map and the patent information by mapping a relationship between the patent documents in a low dimensional space using a multi-dimensional scaling method.
한편, 상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출하는 것을 특징으로 하는 특허지도 생성 시스템.The natural language processor extracts the SAO structures from the technical information or the right information of the patent document.
한편, 상기 특허문서 수집부는, 상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드하는 특허문서 검색부; 및 다운로드 된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변화부를 포함할 수 있다.The patent document collection unit may include: a patent document search unit that searches for the patent documents in the external patent database and downloads the patent documents using the keyword; And a patent document format change unit configured to format-convert the downloaded patent document and store it in the database.
한편, 상기 자연어 처리부는, 상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및 미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함할 수 있다.On the other hand, the natural language processing unit, SAO structure extraction unit for extracting the SAO structure from the patent documents; And a stopword processing unit for removing the SAO structures including previously stored stopwords and storing the extracted SAO structures in the database.
이 때, 상기 자연어 처리부는, 상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함할 수 있다.In this case, the natural language processing unit may further include a patent document loading unit for loading the patent document stored in the database.
한편, 상기 유사성 분석부는, 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및 상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 비유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 비유사성 행렬 생성부를 포함할 수 있다.On the other hand, the similarity analysis unit, the similarity extraction unit for extracting the technical similarity between the patent documents by extracting the semantic sentence similarity between the SAO structures included in the patent documents; And a dissimilarity matrix generator for generating the dissimilarity matrix of all the pairs of patent documents by using the technical similarities between the patent documents, and storing the dissimilarity matrix in the database.
이 때, 상기 유사성 분석부는, 상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 포함할 수 있다.In this case, the similarity analysis unit may include a SAO structure loading unit loading the SAO structures from the database.
한편, 상기 특허 지도 생성부는, 상기 비유사성 행렬을 이용하여 상기 저차원 공간에 상기 특허문서들을 사상하고 상기 특허지도의 타입에 따라서 상기 특허정보 및 특허지도를 생성하고 상기 특허지도 및 특허정보를 상기 데이터베이스에 저장하는 특허 지도 정보 생성부를 포함하고, 상기 특허지도의 타입에 따라 상기 특허지도 및 특허정보가 달라질 수 있다.The patent map generator may map the patent documents in the low dimensional space using the dissimilarity matrix, generate the patent information and the patent map according to the type of the patent map, and generate the patent map and the patent information. The patent map information generating unit may be stored in a database. The patent map and patent information may vary according to the type of the patent map.
이 때, 상기 특허 지도 생성부는, 상기 데이터베이스에 저장된 상기 비유사성 행렬을 로딩하는 비유사성 행렬 로딩부를 더 포함할 수 있다.In this case, the patent map generation unit may further include a dissimilarity matrix loading unit for loading the dissimilarity matrix stored in the database.
본 발명의 다른 측면에 따르면, (a) 특허지도 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계; (b) 상기 특허지도 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계; (c) 상기 특허지도 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 유사성을 분석하여 비유사성 행렬을 생성하는 단계; 및 (d) 상기 특허지도 생성 서버가 상기 비유사성 행렬을 이용하여 특허지도 및 특허정보를 생성하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법이 제공될 수 있다.According to another aspect of the invention, (a) the patent map generation server collecting and storing patent documents from at least one external patent database; (b) the patent map generation server extracting the SAO structures from the technical information or the rights information of the patent documents through natural language processing and storing the SAO structures in a database; (c) the patent map generation server extracting semantic sentence similarities between the SAO structures and analyzing similarities between the patent documents to generate a dissimilarity matrix; And (d) generating, by the patent map generation server, a patent map and patent information using the dissimilarity matrix.
이 때, 상기 (a) 단계는, (a-1) 상기 특허지도 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계; (a-2) 상기 특허지도 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계; (a-3) 상기 특허지도 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및 (a-4) 상기 특허지도 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.In this case, step (a) may include: (a-1) retrieving the patent documents from the externally accessible external patent database using a keyword that is an analysis target through a communication network; (a-2) downloading the retrieved patent documents by the patent map generation server; (a-3) converting, by the patent map generation server, the technical information or the rights information of the patent documents into a text file; And (a-4) the patent map generation server storing the patent documents in the database.
한편, 상기 (a) 단계는, 상기 (a-1) 단계 이전에, 상기 특허지도 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함할 수 있다.On the other hand, step (a), before the step (a-1), the patent map generation server may further comprise the step of receiving the keyword to be analyzed from the client.
이 때, 상기 (a) 단계는, 상기 (a-2)와 (a-3) 단계 사이에, 상기 특허지도 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함할 수 있다.At this time, the step (a), between the (a-2) and (a-3) step, the patent map generation server among the retrieved patent documents among the retrieved patent documents that are not relevant to the analysis purpose of the client It may further comprise the step of receiving from.
한편, 상기 (a) 단계는, 상기 특허지도 생성 서버가 다운로드 된 특허문서들을 미리 정의된 식별자 이름으로 지정하여 상기 데이터베이스에 저장할 수 있다.Meanwhile, in the step (a), the patent map generation server may designate the downloaded patent documents as a predefined identifier name and store them in the database.
한편, 상기 (b) 단계는, (b-1) 상기 특허지도 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계; (b-2) 상기 특허지도 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계; (b-3) 상기 특허지도 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및 (b-4) 상기 특허지도 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.On the other hand, step (b), (b-1) the patent map generation server loading the patent documents stored in the database; (b-2) receiving, by the patent map generation server, an area to be analyzed in the patent documents; (b-3) the patent map generation server extracting the SAO structures by grasping the grammatical role of each word included in a sentence through natural language processing analysis on the text of the technical information or the rights information of the patent documents; ; And (b-4) removing the SAO structures including the stop word predefined by the patent map generation server and storing the SAO structures in the database.
이 때, 상기 (b) 단계는, 상기 특허지도 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함할 수 있다.In this case, the step (b) may further include the step of delivering the SAO structure extracted by the patent map generation server to the client.
한편, 상기 (c) 단계는, (c-1) 상기 특허지도 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계; (c-2) 상기 특허지도 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계; (c-3) 상기 특허지도 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계; (c-4) 상기 특허지도 생성 서버가 상기 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 기술적 유사성을 추출하는 단계; 및 (c-5) 상기 특허지도 생성 서버가 상기 특허문서들 간의 기술적 유사성을 사용하여 상기 비유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.On the other hand, step (c), (c-1) the patent map generation server receives the selected patent document set for analyzing the technical similarities between the patent documents and loading the SAO structures of the patent documents from the database Making; (c-2) receiving, by the patent map generation server, a threshold for automatically determining whether the SAO structures match; (c-3) extracting, by the patent map generation server, semantic sentence similarity between the SAO structures included in the patent documents with reference to conceptual relationship information defining a hierarchical structure of upper and lower relations between concepts; (c-4) extracting, by the patent map generation server, the technical similarities between the patent documents after determining whether the SAO structures match by using the semantic sentence similarity; And (c-5) the patent map generation server generating the dissimilarity matrix using technical similarities between the patent documents and storing the dissimilarity matrix in the database.
한편, 상기 (c) 단계는, 상기 특허지도 생성 서버가 상기 클라이언트에게 상기 비유사성 행열을 전달하는 단계를 더 포함할 수 있다.On the other hand, step (c) may further comprise the step of delivering the dissimilarity matrix by the patent map generation server to the client.
이 때, 상기 (d) 단계는, (d-1) 상기 특허지도 생성 서버가 상기 클라이언트로부터 선택된 상기 비유사성 행렬을 전달받아 상기 비유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계; (d-2) 상기 특허지도 생성 서버가 다차원척도법을 적용하여 상기 비유사성 행렬을 이용하여 저차원 공간에 상기 특허문서들을 사상하는 단계; 및 (d-3) 상기 특허지도 생성 서버가 특허지도의 타입에 따른 상기 특허정보 및 특허지도를 생성하여 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.In this case, step (d) may include: (d-1) the patent map generation server receiving the dissimilarity matrix selected from the client and loading the dissimilarity matrix from the database; (d-2) the patent map generation server applying the multidimensional scaling method to map the patent documents in a low dimensional space using the dissimilarity matrix; And (d-3) the patent map generation server generating the patent information and the patent map according to the type of the patent map and storing the patent information and the patent map in the database.
한편, 상기 (d) 단계는, 상기 특허지도 생성 서버가 상기 특허 지도 및 특허 정보를 상기 클라이언트에게 전달하는 단계를 더 포함할 수 있다.On the other hand, step (d), the patent map generation server may further comprise the step of delivering the patent map and patent information to the client.
이 때, 상기 특허지도의 타입은, 특허 공백지도, 특허 집중지역지도, 출원인 특허 경쟁지도 및 특허 군집지도 중에서 선택되는 어느 하나일 수 있다.
In this case, the type of the patent map may be any one selected from a patent blank map, a patent concentrated area map, an applicant patent competition map, and a patent cluster map.
본 발명의 일 실시예에 따른 특허지도 생성 시스템 및 그 방법은 특허문서의 내용분석을 통해 기술을 구성하는 요소들간의 관계를 명시적으로 표현하는 SAO 구조들간의 의미론적 유사성 분석을 통해 특허들 간의 기술적 유사성을 계산하여 특허지도를 작성함으로써, 특허 공백지도, 특허 집중지역 지도, 출원인별 연구개발 경쟁현황지도, 특허 군집지도와 같은 다양한 타입의 특허지도를 자동으로 생성함으로써 특허지도 작성 시간을 단축시킬 수 있고, 분석자의 의사결정을 지원하는데 유용하다.
The patent map generation system and method thereof according to an embodiment of the present invention provide a method of analyzing a semantic similarity between SAO structures expressing a relationship between elements constituting a technology through content analysis of a patent document. By creating technical maps by calculating technical similarities, various types of patent maps such as patent blank map, patent concentrated area map, R & D competition status map, and patent cluster map can be automatically generated to reduce patent mapping time. And is useful for supporting analyst decision making.
도 1은 특허지도의 일반적 정의에 대하여 설명하기 위한 도면이다.
도 2는 특허지도의 일반적인 작성 절차도이다.
도 3은 본 발명의 일 실시예에 따른 특허지도 생성 시스템의 전체 구성도이다.
도 4는 본 발명의 일 실시예에 따른 특허지도 생성 시스템의 특허지도 생성 서버의 상세 구성도이다.
도 5. 특허지도 생성 서버의 특허문서 수집부에 대한 상세 구성도이다.
도 6. 특허지도 생성 서버의 자연어 처리부에 대한 상세 구성도이다.
도 7. 특허지도 생성 서버의 유사성 분석부에 대한 상세 구성도이다.
도 8. 특허지도 생성 서버의 특허지도 생성부에 대한 상세 구성도이다.
도 9는 본 발명의 일 실시예에 따른 특허지도생성 시스템을 이용한 특허지도 생성방법을 사용하여 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정의 순서도이다.
도 10은 특허지도 생성 서버가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다.
도 11은 특허지도 생성 서버가 특허 비유사성 행렬을 생성하는 과정에 대한 순서도이다.
도 12는 특허 비유사성 행렬(patent dissimilarity matrix)을 생성하는 과정을 도시한 도면이다.
도 13은 생성된 비유사성 행렬의 예를 도시한 도면이다.
도 14는 특허지도 생성 서버가 특허지도를 생성하는 과정에 대한 순서도이다.
도 15a 내지 15f는 사용자가 특허 공백지역 또는 특허 집중지역에 관련된 특허지도를 선택한 경우에 본 발명의 일 실시예에 따른 특허지도 생성 시스템에 의해서 생성될 수 있는 특허지도를 도시하고 있다.
도 16은 사용자가 출원인별 특허 경쟁현황에 관한 특허지도를 선택한 경우에 본 발명의 일 실시예에 따른 특허지도 생성 시스템에 의해서 생성될 수 있는 특허지도를 도시하고 있다.
도 17은 본 발명의 일 실시예에 따른 특허지도 생성 시스템을 이용하여 특허 군집분석을 위해 생성될 수 있는 특허지도의 예시도이다.1 is a diagram for explaining a general definition of a patent map.
2 is a general drawing procedure of a patent map.
3 is an overall configuration diagram of a patent map generation system according to an embodiment of the present invention.
4 is a detailed configuration diagram of a patent map generation server of a patent map generation system according to an embodiment of the present invention.
5 is a detailed configuration diagram of a patent document collection unit of the patent map generation server.
6 is a detailed block diagram of the natural language processing unit of the patent map generation server.
7 is a detailed configuration diagram of the similarity analysis unit of the patent map generation server.
8. A detailed configuration diagram of a patent map generation unit of a patent map generation server.
9 is a flowchart illustrating a process of collecting and storing patent documents from an external patent database using a patent map generation method using a patent map generation system according to an embodiment of the present invention.
10 is a flowchart of a process in which a patent map generation server extracts and stores an SAO structure from a patent document.
11 is a flowchart illustrating a process of generating a patent dissimilarity matrix by a patent map generation server.
FIG. 12 illustrates a process of generating a patent dissimilarity matrix.
13 is a diagram illustrating an example of a generated dissimilarity matrix.
14 is a flowchart illustrating a process of generating a patent map by a patent map generation server.
15A to 15F illustrate patent maps that may be generated by a patent map generation system according to an embodiment of the present invention when a user selects a patent map related to a patent blank area or a patent concentrated area.
16 illustrates a patent map that may be generated by the patent map generation system according to an embodiment of the present invention when the user selects a patent map regarding patent competition status by applicant.
17 is an exemplary view of a patent map that can be generated for patent cluster analysis using the patent map generation system according to an embodiment of the present invention.
이하에서는 첨부한 도면을 참조하면서 본 발명의 실시예에 대한 구성 및 작용을 상세하게 설명하기로 한다.DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, configurations and operations of embodiments of the present invention will be described in detail with reference to the accompanying drawings.
도 3은 본 발명의 일 실시예에 따른 특허지도 생성 시스템의 전체 구성도이다. 도 4는 본 발명의 일 실시예에 따른 특허지도 생성 시스템의 특허지도 생성 서버의 상세 구성도이다.3 is an overall configuration diagram of a patent map generation system according to an embodiment of the present invention. 4 is a detailed configuration diagram of a patent map generation server of a patent map generation system according to an embodiment of the present invention.
도 3을 참조하면, 본 발명의 일 실시예에 따른 특허지도 생성 시스템(10)은 특허지도 생성 서버(100), 데이터베이스(200), 외부 특허 데이터베이스(300) 및 클라이언트(400)를 포함할 수 있다.Referring to FIG. 3, the patent
특허지도 생성 서버(100)는 클라이언트(400)로부터 키워드를 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)로부터 특허문서를 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들로부터 특허문서들간의 유사성을 추출하여 비유사성 행렬을 생성한 후 비유사성 행렬을 이용하여 특허지도를 생성한다.The patent
데이터베이스(200)는 특허문서, SAO 구조, 비유사성 행렬, 특허지도 및 특허정보를 저장한다. 본 발명의 일 실시예에 따른 특허 지도 생성 시스템에서는 데이터베이스가 특허지도 생성 서버(100)와 분리되어 있으나, 데이터베이스가 특허지도 생성 서버(100)에 포함될 수 있다. 또한, 데이터베이스가 다수 개 존재하여 본 발명의 일 실시예에 따른 특허 지도 생성 시스템에서 필요한 정보 즉, 특허문서, SAO구조, 비유사성 행렬, 특허지도 및 특허정보를 분리하여 저장할 수 있다.The
외부 특허 데이터베이스(300)는 분석대상이 되는 특허문서들을 저장하고 있는 외부의 데이터베이스이다.The
클라이언트(400)는 분석대상에 대한 키워드를 특허지도 생성 서버(100)에 전달한다. 또한, 특허지도 생성 서버(100)로부터 특허지도 및 특허정보를 전달받아 사용자 인터페이스에 도시할 수 있다.The
다음으로 특허지도 생성 서버(100)에 대하여 상세하게 설명한다. 도 4를 참조하면, 특허지도 생성 서버(100)는 특허문서 수집부(110), 자연어 처리부(120), 유사성 분석부(130) 및 특허 지도 생성부(140)를 포함할 수 있다.Next, the patent
특허문서 수집부(110)는 사용자 인터페이스를 통해 입력받은 키워드를 클라이언트(400)로부터 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)에서 특허문서를 검색하여 수집한 후 데이터베이스(200)에 저장한다.The patent
자연어 처리부(120)는 데이터베이스(200)에 저장된 특허문서의 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출한다. 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출할 때, 기술적 정보 또는 권리적 정보를 특허문서로부터 추출하여 텍스트 등의 파일형태로 변환하여 저장할 수 있다.The
유사성 분석부(130)는 SAO 구조들간의 의미론적 문장 유사성을 추출함으로써 특허들간의 기술적 유사성을 도출한 후 모든 특허들간의 기술적 비유사성을 담고 있는 비유사성 행렬을 생성한다.The
특허 지도 생성부(140)는 다차원척도법 (MDS: multidimensional scaling)을 활용하여 특허들간의 관계를 저차원 공간 (예: 2차원, 3차원 등)에 사상하여 특허지도 및 특허정보를 생성하여 시각화 정보를 제공한다. 다차원척도법은 개체들에 대한 유사성 자료나 개체를 설명하고자 하는 속성들에 대한 자료를 이용하여 저차원 공간상에 표현하는 기법이다. 이 방법은 주어진 차원 위에서 평가되는 개체들의 위치를 시각적으로 규명함으로써 분석자에게 종합적인 이해를 가능하도록 하는데 큰 장점이 있다. 다차원 척도법을 사용하여 특허지도 및 특허정보를 생성하는 좀 더 상세한 설명은 이하에서 설명될 본 발명의 일 실시예에 따른 특허지도 생성 시스템을 이용한 특허지도 생성 방법에서 상세하게 설명한다.The patent
다음으로, 특허문서 수집부(110)에 대해서 설명한다. 도 5를 참조하면, 특허문서 수집부(110)는 특허문서 검색부(111) 및 특허문서 포맷 변환부(112)를 포함할 수 있다.Next, the patent
특허문서 검색부(111)는 특허문서 수집 모듈로서, 도 5에 도시된 바와 같이, 특허문서를 검색하고 특허문서를 다운로드한다.The patent
특허문서 포맷 변화부(112)는 다운로드 된 특허문서를 포맷 변환하여 데이터베이스에 저장한다. 포맷을 변환할 때, 특허문서들의 기술적 정보 또는 권리적 정보를 추출하여 텍스트 파일 형식으로 변환할 수 있다.The patent
또한, 특허문서 수집부(110)는, 사용자가 본 발명의 일 실시예에 따른 특허지도 생성시스템(10)의 기능을 실행하기 위해, 특허문서 검색, 특허문서 내용 보기 및 편집, 수집된 특허문서의 저장과 같은 사용자 인터페이스를 제공할 수 있다.In addition, the patent
한편, 자연어 처리부(120)는, 도 6을 참조하면, 특허문서 로딩부(121), SAO 구조 추출부(122) 및 불용어 처리부(123)를 포함할 수 있다.Meanwhile, referring to FIG. 6, the
특허문서 로딩부(121)는 데이터베이스(200)에 저장된 특허문서를 로딩한다.The patent
SAO 구조 추출부(122)는 로딩된 특허문서로부터 SAO 구조를 추출한다. SAO 구조는 스탠포드 파서 (Stanford Parser)나 미니파 (MiniPar)와 같은 자연어처리 오픈 소스를 활용하여 추출할 수 있다.The
불용어 처리부(123)는 미리 저장되어 있는 불용어를 포함하고 있는 SAO 구조들을 제거하고, 추출된 SAO 구조를 데이터베이스(200)에 저장한다.The
또한, 자연어 처리부(120)는, 사용자가 본 발명의 일 실시예에 따른 특허지도 생성시스템(10)의 기능을 실행하기 위해, 특허문서 로딩, 불용어 설정, SAO 구조 확인과 편집 및 특허 SAO 구조를 데이터베이스에 저장하는 기능을 제공할 수 있다.In addition, the natural
한편, 유사성 분석부(130)는, 도 7을 참조하면, SAO 구조 로딩부(131), 유사성 추출부(132) 및 비유사성 행렬 생성부(133)를 포함할 수 있다.Meanwhile, referring to FIG. 7, the
SAO 구조 로딩부(131)는, 도 7에 도시된 바와 같이, 데이터베이스(200)에서 SAO 구조를 로딩한다. 이 때, SAO 구조를 데이터베이스로부터 로딩하지 않고, SAO 구조를 메모리에 상주시킬 수도 있다. 이렇게 함으로써, 본 발명의 일 실시예에 따른 특허지도 생성 시스템의 실행속도를 보다 향상시킬 수 있다.The SAO
유사성 추출부(132)는, 특허간 기술적 유사성 분석 모듈로서, 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성 계산을 통한 특허간 기술적 유사성을 추출한다. 단순히 단어 간의 일치여부를 활용하여 SAO 구조들 간의 유사성을 계산하는 것이 아니라, 개념 계층구조 내에 존재하는 단어들 간의 의미적 유사성을 계량화하여 측정한 후 SAO 구조들 간의 의미적 유사성을 측정하여 특허들 간의 기술적 유사성을 자동으로 측정할 수 있다. 특허들 간의 기술적 유사성을 측정하는 과정은 이하에서 설명될 본 발명의 일 실시예에 따른 특허지도 생성 시스템을 이용한 특허지도 생성 방법에서 상세하게 설명한다.The
비유사성 행렬 생성부(133)는 특허들간의 기술적 유사성을 이용하여 모든 특허쌍의 기술적 비유사성 행렬을 생성하고, 이를 데이터베이스(200)에 저장한다. 비유사성 행렬을 생성하는 보다 자세한 과정은 이하에서 설명될 본 발명의 일 실시예에 따른 특허지도 생성 시스템을 이용한 특허지도 생성 방법에서 설명한다.The
또한, 유사성 분석부(130)는, 사용자가 본 발명의 일 실시예에 따른 특허지도 생성시스템(10)의 기능을 실행하기 위해, 분석대상 특허 선택, 개념 관계 설정, 특허 비유사성 행렬 확인, 관련자료의 저장과 같은 사용자 인터페이스를 제공할 수 있다.In addition, the
한편, 특허 지도 생성부(140)는, 도 8을 참조하면, 비유사성 행렬 로딩부(141) 및 특허 지도 정보 생성부(142)를 포함할 수 있다.Meanwhile, referring to FIG. 8, the
비유사성 행렬 로딩부(141)는 데이터베이스(200)에 저장된 비유사성 행렬을 로딩한다. 본 발명의 일 실시예에 따른 특허지도 생성 시스템(10)에서는 비유사성 행렬을 데이터베이스로부터 로딩하였지만, 비유사성 행렬을 데이터베이스(200)로부터 로딩하지 않고 메모리에 비유사성 행렬을 상주시킬 수도 있다.The dissimilarity
특허 지도 정보 생성부(142)는 비유사성 행렬을 이용하여 저차원 공간에 특허문서들을 사상하고 특허지도의 타입에 따라서 특허정보 및 특허지도를 생성하고, 생성된 특허지도 및 특허정보를 데이터베이스에 저장한다. 본 발명의 일 실시예에 따른 특허지도 생성 시스템을 이용한 특허지도 생성 방법에서 상세하게 설명하겠지만, 본 발명의 일 실시예에 따른 특허지도 생성 시스템은 특허지도의 타입에 따라 사용자에게 다양한 특허지도 및 특허정보를 제공할 수 있다.
The patent map
다음으로, 본 발명의 일 실시예에 따른 특허지도생성 시스템을 이용한 특허지도 생성 방법에 대하여 설명한다.Next, a patent map generation method using a patent map generation system according to an embodiment of the present invention will be described.
도 9는 본 발명의 일 실시예에 따른 특허지도생성 시스템을 이용한 특허지도 생성방법을 사용하여 외부 특허 데이터베이스(300)로부터 특허문서를 수집하여 저장하는 과정의 순서도이다. 도 10은 특허지도 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다. 도 11은 특허지도 생성 서버(100)가 특허 비유사성 행렬을 생성하는 과정에 대한 순서도이다. 도 12는 특허 비유사성 행렬(patent dissimilarity matrix)을 생성하는 과정을 도시한 도면이다. 도 13은 생성된 비유사성 행렬의 예를 도시한 도면이다. 도 14는 특허지도 생성 서버가 특허지도를 생성하는 과정에 대한 순서도이다.
9 is a flowchart illustrating a process of collecting and storing patent documents from an
먼저, 특허지도 생성 서버(100)가 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정을 설명한다.First, a process of collecting and storing patent documents from an external patent database by the patent
도 9를 참조하면, 먼저, 클라이언트(400)가 사용자가 분석하고자 하는 기술과 관련된 주제어, 출원인, 연도 등의 검색조건을 입력받아 특허지도 생성 서버(100)에 전달한다(S110). 이후에, 특허지도 생성 서버(100)가 인트라넷 및 인터넷과 같은 통신망을 통해서 외부의 접속 가능한 외부 특허 데이터베이스(300)로부터 특허문서들을 검색한다(S120).Referring to FIG. 9, first, a
다음으로, 특허지도 생성 서버(100)가 검색된 특허문서를 다운로드 한다(S130). 이 때, 사용자가 검색된 특허문서들을 확인한 부 분석목적과 관련성이 없는 특허들을 제거한 후 특허문서 다운로드를 실행할 수 있다.Next, the patent
이후에, 특허지도 생성 서버(100)가 다운로드된 특허문서들의 집합을 미리 정의된 식별자 이름으로 지정한다(S140).Thereafter, the patent
다음으로, 특허지도 생성 서버(100)가 식별자가 지정된 특허문서들의 집합의 서지적 정보, 기술적 정보 및 권리적 정보를 텍스트 파일 등의 형태로 변환한다(S150).Next, the patent
마지막으로, 특허지도 생성 서버(100)가 특허문서를 데이터베이스(200)에 저장한다(S160).Finally, the patent
다음으로, 특허지도 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정을 설명한다.Next, a process of extracting and storing the SAO structure from the patent document by the patent
도 10을 참조하면, 먼저, 특허지도 생성 서버가(100)가 데이터베이스(200)에 저장되어 있는 특허문서들을 로딩한다(S210).Referring to FIG. 10, first, a patent
다음으로, 특허지도 생성 서버(100)가 특허문서에서 분석하고자 하는 영역을 입력받는다(S220).Next, the patent
이후에, 특허지도 생성 서버(100)가, SAO 구조를 추출하기 위하여, 특허문서의 기술적 내용 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할 (POS: part-of-speech)을 파악한다(S230).Subsequently, in order to extract the SAO structure, the patent
다음으로, 특허지도 생성 서버(100)가 단어들의 POS를 활용하여 명사구와 동사구를 각각 추출한 다음, 주어-동사-목적어의 문법적 패턴을 지니는 관계(SAO 구조)들을 추출하여 각 특허별로 정리한다(S240).Next, the patent
다음으로, 특허지도 생성 서버(100)가 특허별로 SAO 구조들이 모두 수집된 다음 미리 정의한 불용어를 포함하고 있는 SAO 구조들을 제거한다(S250). 다른 방법으로, 사용자에게 해당 SAO 구조들을 제시하고 이들을 제거할 것인지에 대해서 질의하는 형태로 기능이 구현될 수 있다.Next, the patent
이후에, 특허지도 생성 서버(100)가 클라이언트(400)에게 특허별 추출된 SAO 구조를 전달한다(S260). 클라이언트(400)에게 전달된 SAO구조를 사용자 인터페이스를 사용하여 사용자가 확인할 수 있다.Thereafter, the patent
마지막으로, 특허지도 생성 서버(100)가 SAO 구조를 데이터베이스(200)에 저장한다.Finally, the patent
다음으로 특허지도 생성 서버(100)가 특허 비유사성 행렬을 생성하는 과정에 대하여 설명한다.Next, a process of generating a patent dissimilarity matrix by the patent
도 11을 참조하면, 먼저, 특허지도 생성 서버(100)가 특허들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 특허문서집합의 SAO 구조를 데이터베이스(200)로부터 로딩한다(S310).Referring to FIG. 11, first, the patent
다음으로, 특허지도 생성 서버(100)가 SAO 구조 간의 일치여부에 대한 자동화된 판단을 위한 임계치(threshold)를 입력받는다(S320). 임계치 값은 SAO 구조 간의 일치여부를 엄격하게 적용할 것인지 완화시킬 것인지에 대한 기준이 된다.Next, the patent
이후에, 특허지도 생성 서버(100)가 개념들 간의 상하위 관계에 대한 계층구조를 정의하고 있는 워드넷 (WordNet) 또는 기술 도메인 온톨로지와 같은 개념관계 정보를 참조하여 각 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성을 추출한다(S330).Subsequently, SAO structures included in each patent by referring to the conceptual relationship information, such as WordNet or technology domain ontology, in which the patent
다음으로, 특허지도 생성 서버(100)가 추출된 각 특허들에 포함된 의미론적 문장 유사성을 사용하여 SAO 구조들 간의 일치여부를 판단한 후 특허들 간의 기술적 유사성을 추출한다(S340).Next, the patent
다음으로, 특허지도 생성 서버(100)가 특허들 간의 기술적 유사성을 사용하여 의미론적 비유사성 행열을 생성한다(S350).Next, the patent
이후에, 특허지도 생성 서버(100)가 클라이언트(400)에게 비유사성 행열을 전달한다(S360).Thereafter, the patent
마지막으로, 특허지도 생성 서버(100)가 특허 비유사성 행렬을 데이터베이스에 저장한다(S370).Finally, the patent
다음으로, 도 12를 참조하여, 특허 비유사성 행렬(patent dissimilarity matrix)을 생성하는 과정을 보다 자세하게 설명한다.Next, a process of generating a patent dissimilarity matrix will be described in more detail with reference to FIG. 12.
특허간의 유사성은 각 특허들이 포함하고 있는 SAO 구조들의 유사성을 측정함으로써 얻어질 수 있다. SAO 구조는 하나의 문장이며, 두 문장 간의 의미론적 문장 유사성 측정은 일반적으로 (1) 문장을 구성하는 단어 단위로 분리하는 토큰화 (tokenizing), (2) 단어의 원형화 (stemming), (3) 단어의 문법적 역할 파악 (POS tagging), (4) 문장에 있는 각 단어들의 적합한 의미(sense) 결정, (5) 품사정보를 고려한 단어들 간의 의미 유사성을 활용하여 계산될 수 있다.The similarity between patents can be obtained by measuring the similarity of SAO structures included in each patent. The SAO structure is a sentence, and the semantic sentence similarity measure between two sentences is generally (1) tokenizing, separating words into units of words, (2) stemming words, (3 ) Can be calculated using POS tagging, (4) determining the appropriate sense of each word in a sentence, and (5) semantic similarity between words considering parts of speech information.
문장에 있는 하나의 단어인 토큰(token) ti와 tj가 있을 때, 이들의 유사성은 0에서 1 사이의 값을 가지며 Resnik의 개념 분류체계 하에서의 두 토큰의 의미론적 유사도 (semantic similarity in a taxonomy)는 수학식 1과 같이 정의된다.When there is a single word in the sentence, tokens t i and t j , their similarities range from 0 to 1 and the semantic similarity in a taxonomy under Resnik's conceptual taxonomy. ) Is defined as in
여기서 lcs는 두 토큰들이 의미를 공유하는 최하 포섭개념(lowest common subsumer)이며, depth는 개념 계층구조(concept hierarchy)에서 토큰의 루트 노드 (root node)로부터의 깊이를 의미한다. 하나의 문장에 포함된 모든 단어들을 토큰으로 분리하게 되면, 두 문장간의 의미적 유사성 계산은 이분 그래프(bipartite graph)의 최대 매칭의 문제로 해석될 수 있으며, 따라서 SAO 구조들 간의 유사성은 0에서 1 사이의 값을 가질 수 있으며 수학식 2와 같이 정의될 수 있다.Where lcs is the lowest common subsumer where the two tokens share meaning, and depth is the depth from the root node of the token in the concept hierarchy. If all the words in a sentence are separated into tokens, the semantic similarity calculation between the two sentences can be interpreted as a problem of maximum matching of the bipartite graph, so the similarity between SAO structures is 0 to 1 It may have a value between and may be defined as Equation 2.
여기서 Ntoken은 문장 Si에 속해 있는 토큰의 개수를 의미하며, match는 두 문장 속에 존재하는 품사가 동일한 토큰들이 가지는 의미적 유사성의 합을 의미한다. 의미론적인 문장 유사도 측정은 의미는 유사하지만 다른 형태로 표기될 수 있는 문장들 간의 유사도를 측정하는데 유용하다.Where N token is the number of tokens in the sentence S i , and match is the sum of the semantic similarities of the same tokens in the two parts of the sentence. Semantic sentence similarity measurement is useful for measuring similarity between sentences that are similar in meaning but can be expressed in different forms.
이를 이용하여 두 SAO 구조들 간의 유사도가 계산되며, 두 SAO 구조가 동일한지 아닌지를 판별하기 위해 수학식 3과 같이 임계치(p)를 활용한다.Similarity between two SAO structures is calculated using this, and a threshold value p is used as shown in
즉, 두 SAO 구조의 유사도 값이 p보다 크면, 두 SAO 구조는 동일한 것으로 간주하고, 그렇지 않으면 두 SAO 구조는 다른 것으로 간주할 수 있다. p 값의 설정은 분석자의 판단에 따라 결정될 수 있으며, 임계치를 1에 깝게 설정하면 보다 엄격한 유사성 분석이 가능하며, 0에 가까울수록 느슨한 유사도 분석을 수행하게 된다. 다음으로 두 특허들간의 유사성은 이들이 얼마나 많은 SAO 구조들을 공유하는 지를 활용하여 수학식 4와 같이 정의될 수 있다.In other words, if the similarity value of the two SAO structures is greater than p , the two SAO structures may be considered identical, otherwise the two SAO structures may be considered different. The value of p can be determined according to the judgment of the analyst. If the threshold is set close to 1, a more rigorous similarity analysis can be performed. The closer to 0, the looser similarity analysis is performed. Next, the similarity between the two patents can be defined as shown in
여기서 NSAO(X)는 특허 X에 포함된 SAO 구조의 수, NSAO(X,Y)는 특허 X와 Y에 포함된 SAO 구조들 간의 유사도 판별값이 1인 SAO 구조 쌍의 개수이다.Where N SAO (X) is the number of SAO structures included in patent X, and N SAO (X, Y) is the number of SAO structure pairs having a similarity discrimination value of 1 between SAO structures included in patents X and Y.
다음 단계에서의 다차원 척도법을 적용하기 위해서는 두 특허들간의 비유사성이 계산될 필요가 있으며, 두 특허들간의 비유사성은 수학식 5와 같이 정의될 수 있다.In order to apply the multi-dimensional scaling method in the next step, the dissimilarity between the two patents needs to be calculated, and the dissimilarity between the two patents may be defined as in Equation 5.
수집된 특허집합의 크기가 N일 경우, 특허간 비유사성 행렬이 모든 특허들 간의 비유사성을 포함하는 NxN의 하삼각행렬(lower triangular matrix)의 형태로 생성될 수 있다. 도 13은 생성된 비유사성 행렬의 예시를 도시하고 있다.
When the size of the collected patent set is N, inter-patent dissimilarity matrix may be generated in the form of a lower triangular matrix of N × N including dissimilarity between all patents. 13 shows an example of the generated dissimilarity matrix.
다음으로, 특허지도 생성 서버(100)가 특허지도를 생성하는 과정에 대하여 설명한다.Next, a process of generating a patent map by the patent
도 14를 참조하면, 먼저 특허지도 생성 서버(100)가 클라이언트(400)로부터 선택된 의미론적 특허 비유사성 행렬을 전달받아 비유사성 행렬을 데이터베이스로부터 로딩한다(S410).Referring to FIG. 14, a patent
다음으로, 특허지도 생성 서버(100)가 다차원척도법(MDS)을 적용하여 저차원 공간(2차원 또는 3차원 공간)에 특허들을 사상한다(S420).Next, the patent
이후에, 클라이언트가 선택된 특허지도의 타입 (예: 특허 공백영역, 특허 집중영역, 저촉 가능성이 있는 특허들, 출원인별 특허 분포, 특허 군집)을 입력받아 특허지도 생성 서버(100)에 전달한다(S430).Subsequently, the client receives the type of the selected patent map (for example, patent blank area, patent concentration area, potentially infringing patents, patent distribution by applicant, and patent cluster) and delivers it to the patent map generation server 100 ( S430).
다음으로, 특허지도 생성 서버(100)가 특허의 서지정보 (예: 출원번호, 출원인, 특허 출원 및 등록 연도 등)와 특허맵핑 결과를 활용하여 특허지도의 타입에 따른 특허정보를 계산한 후 특허지도를 생성한다(S440).Next, the patent
다음으로, 특허지도 생성 서버(100)가 특허 지도 및 특허 정보를 클라이언트(400)에게 전달한다. 클라이언트(400)는 특허 지도 및 특허 정보를 사용자 인터페이스를 이용하여 사용자에게 전달한다(S450). 이로써 사용자가 시각적으로 특허지도 및 특허정보를 확인할 수 있다.Next, the patent
마지막으로, 특허지도 생성 서버(100)는 특허지도 및 특허 정보를 데이터베이스(200)에 저장한다(S460).Finally, the patent
한편, 도 15a 내지 15f는 사용자가 특허 공백지역 또는 특허 집중지역에 관련된 특허지도를 선택한 경우에 본 발명의 일 실시예에 따른 특허지도 생성 시스템에 의해서 생성될 수 있는 특허지도를 도시하고 있다.Meanwhile, FIGS. 15A to 15F illustrate patent maps that may be generated by a patent map generation system according to an embodiment of the present invention when a user selects a patent map related to a patent blank area or a patent concentrated area.
도 도 15a 내지 15f를 참조하면, 특허 공백 (vacuum) 또는 특허 집중지역 (hot spot)의 경우, 시간의 흐름에 따라서 그 영역을 가시화하여, 분석자가 보다 효과적인 이해가 가능하다. 특허 공백영역은 특허지도 상에 특허가 분포하지 않거나 거의 없는 영역이 될 수 있는데, 사용자가 공백영역을 드래그 앤 드롭으로 타원 또는 원의 형태로 영역을 설정하면, 본 발명의 일 실시예에 따른 특허지도 생성 시스템은 연도별 변화에 따른 해당 영역에 분포하는 특허들의 식별자 (출원번호, 등록번호 등), 공백영역 내의 특허 수 및 상기 공백 영역 내에 포함되는 특허들의 SAO 구조들을 사용자에게 제공할 수 있다.15A to 15F, in the case of a patent vacuum or a patent hot spot, the area is visualized over time, so that an analyst can understand more effectively. The patent blank area may be an area with little or no patent distribution on the patent map. When the user sets the area in the form of an ellipse or a circle by dragging and dropping the blank area, the patent according to an embodiment of the present invention. The map generation system may provide a user with identifiers (application number, registration number, etc.) of patents distributed in a corresponding area according to a yearly change, the number of patents in a blank area, and SAO structures of patents included in the blank area.
특허 집중지역을 도시하는 경우에는 연도 구간에 따라 특허들을 색깔 등을 통해 식별할 수 있도록 제공하여, 사용자가 연도별로 특허가 가장 밀집하는 영역을 파악하여 해당 영역에 대해 드래그 앤 드롭을 통해 해당 영역에 분포하는 특허들의 수 및 SAO 구조들을 파악하여, 사용자가 해당 특허 집중지역의 기술적 특성이 어떠한 것인지를 직접적으로 파악할 수 있다.In case of showing the patent concentrated area, patents can be identified according to the year section by color, so that the user can identify the area where the patent is most concentrated by year and drag and drop the area to the relevant area. By knowing the number of patents and SAO structures distributed, users can directly grasp the technical characteristics of the patent centralized area.
한편, 도 16은 사용자가 출원인별 특허 경쟁현황에 관한 특허지도를 선택한 경우에 본 발명의 일 실시예에 따른 특허지도 생성 시스템에 의해서 생성될 수 있는 특허지도를 도시하고 있다.Meanwhile, FIG. 16 illustrates a patent map that may be generated by the patent map generation system according to an embodiment of the present invention when the user selects a patent map regarding patent competition status by applicant.
도 16을 참조하면, 이 특허지도는 분석자가 출원인을 선택하여 선택적으로 기술개발 경쟁 현황을 분석할 수 있도록 지원한다. 출원인의 식별자는 색깔 등을 통해 시각적으로 구분될 수 있다. 분석자는 출원인들 간의 특허들이 겹치는 부분을 통해서 유사한 특허가 발생하고 있는 영역 (B로 표시)을 확인할 수 있다. 독립적인 영역에 하나의 출원인이 특허를 개발하는 경우(A로 표시)에는 독자적으로 하나의 기술에 그 출원인이 기술 개발 투자를 수행하고 있음을 간접적으로 파악할 수 있다.Referring to FIG. 16, this patent map assists the analyst in selecting an applicant and optionally analyzing the current state of competition in technology development. Applicant's identifier can be visually distinguished through color and the like. Analysts can identify areas where similar patents are occurring (labeled B) through overlapping patents between applicants. When an applicant develops a patent (indicated by A) in an independent area, it is possible to indirectly know that the applicant is independently making a technology development investment in a technology.
또한, 분석자가 상기 영역에 드래그 앤 드롭을 통해 타원 또는 원을 그리게 되면, 본 발명의 일 실시예에 따른 특허지도 생성 시스템이 해당 영역 내에 포함되는 특허의 식별자, 특허 수, 출원인, 특허별 SAO 구조들을 분석자에게 제공할 수 있다.In addition, when the analyst draws an ellipse or a circle by dragging and dropping in the region, the patent map generation system according to an embodiment of the present invention provides an identifier, patent number, applicant, and SAO structure of patents included in the region. Can be provided to the analyst.
한편, 도 17은 특허 군집분석을 위해 생성될 수 있는 특허지도의 예시도이다.On the other hand, Figure 17 is an illustration of a patent map that can be generated for patent cluster analysis.
도 17을 참조하면, 특허 군집은 수집된 특허 집합 내에서 유사한 특성을 지닌 SAO 구조들로 구성된 특허집합을 의미한다. MDS를 수행하여 특허들을 저차원의 공간상에 사상하게 되면, 각 특허들은 공간상의 좌표를 지닐 수 있게 되는데, 각 특허의 좌표값을 활용하고 다양한 클러스터링 알고리즘을 이용하여 군집을 파악할 수 있다.Referring to FIG. 17, a patent cluster refers to a patent set composed of SAO structures having similar characteristics in a collected patent set. When the patents are mapped in a low-dimensional space by performing an MDS, each patent may have a coordinate in space, and the clusters may be identified by using coordinate values of each patent and using various clustering algorithms.
특허 군집의 파악은 특허 포트폴리오관리나 특허 장벽 형성을 위한 특허 매입 등과 같은 기술전략의 수립에 이용될 수 있다. 사용자가 상기 제시된 특허지도들에 대해 개별적으로 분석한 정보들은 특허지도 데이터베이스에 저장될 수 있다.Identifying patent clusters can be used to formulate technology strategies, such as managing patent portfolios or buying patents to create patent barriers. Information analyzed by the user individually for the presented patent maps may be stored in a patent map database.
상술한 바와 같은 본 발명의 일 실시예에 따른 특허지도 생성 시스템은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체 (씨디롬, 램, 롬, 플로피디스크, 하드 디스크 및 광자기 디스크 등)에서 실행될 수 있으며, 본 발명의 일 실시예에 따른 특허지도 생성 시스템은 로컬 컴퓨터에서 단독으로 실행되거나 분산 컴퓨팅 환경에서 인터넷 또는 인트라넷을 통해 정보전송을 통해 구현될 수 있다.
The patent map generation system according to an embodiment of the present invention as described above may be implemented as a program and executed on a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.) In addition, the patent map generation system according to an embodiment of the present invention may be executed alone on a local computer or implemented through information transmission through the Internet or an intranet in a distributed computing environment.
이상으로 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징을 변경하지 않고 다른 구체적인 형태로 실시할 수 있다는 것을 이해할 수 있을 것이다. 따라서 이상에서 기술한 실시예는 모든 면에서 예시적인 것이며 한정적이 아닌 것이다.
While the present invention has been described in connection with what is presently considered to be practical exemplary embodiments, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, It will be understood. The embodiments described above are therefore to be considered in all respects as illustrative and not restrictive.
10 : 특허지도생성 시스템 100 : 특허지도 생성 서버
110 : 특허문서 수집부 111 : 특허 문서 검색부
112 : 특허 문서 포맷 변환부 120 : 자연어 처리부
121 : 특허 문서 로딩부 122 : SAO 구조 추출부
123 : 불용어 처리부 130 : 유사성 분석부
131 : SAO 구조 로딩부 132 : 유사성 추출부
133 : 비유사성 행렬 생성부 140 : 특허 지도 생성부
141 : 비유사성 행렬 로딩부 142 : 특허 지도 정보 생성부
200 : 데이터베이스 300 : 외부 특허 데이터베이스
400 : 클라이언트10: patent map generation system 100: patent map generation server
110: patent document collection unit 111: patent document search unit
112: patent document format conversion unit 120: natural language processing unit
121: Patent document loading unit 122: SAO structure extraction unit
123: stopword processing unit 130: similarity analysis unit
131: SAO structure loading unit 132: similarity extraction unit
133: dissimilarity matrix generator 140: patent map generator
141: dissimilarity matrix loading unit 142: patent map information generation unit
200: database 300: external patent database
400: client
Claims (23)
상기 데이터베이스에 저장된 상기 특허문서로부터 SAO 구조들을 추출하는 자연어 처리부;
상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 비유사성 행렬을 생성하는 유사성 분석부; 및
상기 비유사성 행렬을 사용하여 특허지도 및 특허정보를 생성하는 특허 지도 생성부;
를 포함하는 특허지도 생성 서버를 포함하며,
상기 특허 지도 생성부는,
상기 비유사성 행렬을 전달받아 다차원척도법을 활용하여 상기 특허문서들 간의 관계를 저차원 공간에 사상하고, 상기 특허지도의 선택된 타입에 따라서 상기 비유사성 행렬을 이용하여 상기 특허지도 및 특허정보를 생성하고, 상기 특허지도 및 특허정보를 상기 데이터베이스에 저장하는 특허 지도 정보 생성부를 포함하며,
상기 특허지도의 선택된 타입에 따라 상기 특허지도 및 특허정보가 달라지는 것을 특징으로 하는 특허지도 생성 시스템.
A patent document collection unit which receives a keyword for an analysis target from a client, searches for and collects a patent document from an external patent database using the keyword, and stores the patent document in a database;
A natural language processor extracting SAO structures from the patent document stored in the database;
A similarity analyzer for extracting semantic sentence similarities between the SAO structures to extract technical similarities between the patent documents, and then generating dissimilarity matrices between the patent documents; And
A patent map generator for generating a patent map and patent information using the dissimilarity matrix;
It includes a patent map generation server comprising a,
The patent map generation unit,
Receives the dissimilarity matrix and maps the relationship between the patent documents in a low dimensional space using a multidimensional scaling method, and generates the patent map and patent information using the dissimilarity matrix according to the selected type of the patent map. And a patent map information generator configured to store the patent map and patent information in the database.
The patent map generation system, characterized in that the patent map and the patent information is changed according to the selected type of the patent map.
상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 1,
The natural language processor extracts the SAO structures from the technical information or the right information of the patent document.
상기 특허문서 수집부는,
상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드하는 특허문서 검색부; 및
다운로드 된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변화부를 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 1,
The patent document collection unit,
A patent document search unit for searching the patent documents and downloading the patent documents from the external patent database using the keyword; And
And a patent document format changer configured to format convert the downloaded patent document and store it in the database.
상기 자연어 처리부는,
상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및
미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 1,
The natural language processing unit,
A SAO structure extraction unit for extracting SAO structures from the patent documents; And
And a stopword processing unit which removes the SAO structures including previously stored stopwords and stores the extracted SAO structures in the database.
상기 자연어 처리부는,
상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method according to claim 6,
The natural language processing unit,
The patent map generation system further comprises a patent document loading unit for loading the patent document stored in the database.
상기 유사성 분석부는,
상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및
상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 비유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 비유사성 행렬 생성부를 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 1,
The similarity analysis unit,
A similarity extraction unit for extracting semantic sentence similarities between the SAO structures included in the patent documents to extract technical similarities between the patent documents; And
And a dissimilarity matrix generator for generating the dissimilarity matrix of all the pairs of patent documents using the technical similarities between the patent documents, and storing the dissimilarity matrix in the database.
상기 유사성 분석부는,
상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 8,
The similarity analysis unit,
And a SAO structure loading unit for loading the SAO structures from the database.
상기 특허 지도 생성부는,
상기 데이터베이스에 저장된 상기 비유사성 행렬을 로딩하는 비유사성 행렬 로딩부를 더 포함하는 것을 특징으로 하는 특허지도 생성 시스템.
The method of claim 1,
The patent map generation unit,
And a dissimilarity matrix loading unit for loading the dissimilarity matrix stored in the database.
(a) 특허지도 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계;
(b) 상기 특허지도 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계;
(c) 상기 특허지도 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 유사성을 분석하여 비유사성 행렬을 생성하는 단계; 및
(d) 상기 특허지도 생성 서버가 상기 비유사성 행렬을 이용하여 특허지도 및 특허정보를 생성하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법.
12. A patent map generation method using the patent map generation system according to any one of claims 1, 4, 9, and 11.
(a) the patent map generation server collecting and storing patent documents from at least one external patent database;
(b) the patent map generation server extracting the SAO structures from the technical information or the rights information of the patent documents through natural language processing and storing the SAO structures in a database;
(c) the patent map generation server extracting semantic sentence similarities between the SAO structures and analyzing similarities between the patent documents to generate a dissimilarity matrix; And
and (d) generating a patent map and patent information by the patent map generation server using the dissimilarity matrix.
상기 (a) 단계는,
(a-1) 상기 특허지도 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계;
(a-2) 상기 특허지도 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계;
(a-3) 상기 특허지도 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및
(a-4) 상기 특허지도 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법.
13. The method of claim 12,
The step (a)
(a-1) searching for the patent documents by the patent map generation server from an externally accessible external patent database using a keyword to be analyzed through a communication network;
(a-2) downloading the retrieved patent documents by the patent map generation server;
(a-3) converting, by the patent map generation server, the technical information or the rights information of the patent documents into a text file; And
(a-4) The patent map generation server comprising the step of storing the patent documents in the database.
상기 (a) 단계는,
상기 (a-1) 단계 이전에, 상기 특허지도 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허지도 생성 방법.
The method of claim 13,
The step (a)
Before the step (a-1), the patent map generation server further comprises the step of receiving the keyword to be analyzed from the client to the patent map generation method characterized in that it further comprises.
상기 (a) 단계는,
상기 (a-2)와 (a-3) 단계 사이에, 상기 특허지도 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허지도 생성 방법.
The method of claim 13,
The step (a)
Between the steps (a-2) and (a-3), the patent map generation server further comprises the step of receiving from the client the patent documents irrelevant to the analysis purpose of the retrieved patent documents A patent map generation method.
상기 (a) 단계는,
상기 특허지도 생성 서버가 다운로드 된 특허문서들을 미리 정의된 식별자 이름으로 지정하여 상기 데이터베이스에 저장하는 것을 특징으로 하는 특허지도 생성 방법.
The method of claim 13,
The step (a)
The patent map generation server designates the downloaded patent document as a predefined identifier name and stores in the database.
상기 (b) 단계는,
(b-1) 상기 특허지도 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계;
(b-2) 상기 특허지도 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계;
(b-3) 상기 특허지도 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및
(b-4) 상기 특허지도 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법.
13. The method of claim 12,
The step (b)
(b-1) the patent map generation server loading the patent documents stored in the database;
(b-2) receiving, by the patent map generation server, an area to be analyzed in the patent documents;
(b-3) the patent map generation server extracting the SAO structures by grasping the grammatical role of each word included in a sentence through natural language processing analysis on the text of the technical information or the rights information of the patent documents; ; And
(b-4) removing the SAO structures including the stop word predefined by the patent map generation server and storing the SAO structures in the database.
상기 (b) 단계는,
상기 특허지도 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허지도 생성 방법.
18. The method of claim 17,
The step (b)
The patent map generation server further comprises the step of delivering the extracted SAO structure to the client.
상기 (c) 단계는,
(c-1) 상기 특허지도 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계;
(c-2) 상기 특허지도 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계;
(c-3) 상기 특허지도 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계;
(c-4) 상기 특허지도 생성 서버가 상기 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 기술적 유사성을 추출하는 단계; 및
(c-5) 상기 특허지도 생성 서버가 상기 특허문서들 간의 기술적 유사성을 사용하여 상기 비유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법.
13. The method of claim 12,
The step (c)
(c-1) the patent map generation server receiving a selected patent document set for analyzing technical similarities between the patent documents and loading the SAO structures of the patent documents from the database;
(c-2) receiving, by the patent map generation server, a threshold for automatically determining whether the SAO structures match;
(c-3) extracting, by the patent map generation server, semantic sentence similarity between the SAO structures included in the patent documents with reference to conceptual relationship information defining a hierarchical structure of upper and lower relations between concepts;
(c-4) extracting, by the patent map generation server, the technical similarities between the patent documents after determining whether the SAO structures match by using the semantic sentence similarity; And
and (c-5) the patent map generation server generating the dissimilarity matrix using technical similarities between the patent documents and storing the disparity in the database.
상기 (c) 단계는,
상기 특허지도 생성 서버가 상기 클라이언트에게 상기 비유사성 행열을 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허지도 생성 방법.
20. The method of claim 19,
The step (c)
The patent map generation server further comprises the step of delivering the dissimilarity matrix to the client.
상기 (d) 단계는,
(d-1) 상기 특허지도 생성 서버가 상기 클라이언트로부터 선택된 상기 비유사성 행렬을 전달받아 상기 비유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계;
(d-2) 상기 특허지도 생성 서버가 다차원척도법을 적용하여 상기 비유사성 행렬을 이용하여 저차원 공간에 상기 특허문서들을 사상하는 단계; 및
(d-3) 상기 특허지도 생성 서버가 특허지도의 타입에 따른 상기 특허정보 및 특허지도를 생성하여 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허지도 생성 방법.
13. The method of claim 12,
The step (d)
(d-1) the patent map generation server receiving the dissimilarity matrix selected from the client and loading the dissimilarity matrix from the database;
(d-2) the patent map generation server applying the multidimensional scaling method to map the patent documents in a low dimensional space using the dissimilarity matrix; And
(d-3) the patent map generating server generating the patent information and the patent map according to the type of the patent map, and storing the patent map in the database.
상기 (d) 단계는,
상기 특허지도 생성 서버가 상기 특허 지도 및 특허 정보를 상기 클라이언트에게 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허지도 생성 방법.
22. The method of claim 21,
The step (d)
The patent map generation server further comprises the step of delivering the patent map and patent information to the client.
상기 특허지도의 타입은,
특허 공백지도, 특허 집중지역지도, 출원인 특허 경쟁지도 및 특허 군집지도 중에서 선택되는 어느 하나인 것을 특징으로 하는 특허지도 생성 방법.22. The method of claim 21,
The type of the patent map,
A method of generating a patent map, characterized in that it is any one selected from a blank map, a patent concentrated area map, an applicant patent competition map, and a patent cluster map.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110040828A KR101268503B1 (en) | 2011-04-29 | 2011-04-29 | Method and its system for generation of patent maps |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020110040828A KR101268503B1 (en) | 2011-04-29 | 2011-04-29 | Method and its system for generation of patent maps |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120122588A KR20120122588A (en) | 2012-11-07 |
KR101268503B1 true KR101268503B1 (en) | 2013-06-04 |
Family
ID=47508827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020110040828A KR101268503B1 (en) | 2011-04-29 | 2011-04-29 | Method and its system for generation of patent maps |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101268503B1 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101528481B1 (en) * | 2014-08-29 | 2015-06-12 | 한국과학기술정보연구원 | Application technology and product discovery system by extracting, categorizing and analyzing the relation of functions |
KR102546476B1 (en) * | 2017-11-03 | 2023-06-27 | 아주대학교 산학협력단 | Apparatus and method for extracting technology Information |
CN108898321B (en) * | 2018-07-09 | 2021-08-24 | 西北工业大学 | Semantic template-based method for acquiring standard conflict parameters of manufacturing technical problem |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010075026A (en) * | 1998-09-09 | 2001-08-09 | 윌리엄 지. 바브릭 | Document semantic analysis/selection with knowledge creativity capability |
KR20100060734A (en) * | 2008-11-28 | 2010-06-07 | 한국과학기술원 | System for visualization of patent information by forming the keyword based semantic network and method therefor |
-
2011
- 2011-04-29 KR KR1020110040828A patent/KR101268503B1/en not_active IP Right Cessation
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20010075026A (en) * | 1998-09-09 | 2001-08-09 | 윌리엄 지. 바브릭 | Document semantic analysis/selection with knowledge creativity capability |
KR20100060734A (en) * | 2008-11-28 | 2010-06-07 | 한국과학기술원 | System for visualization of patent information by forming the keyword based semantic network and method therefor |
Also Published As
Publication number | Publication date |
---|---|
KR20120122588A (en) | 2012-11-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107992481B (en) | Regular expression matching method, device and system based on multi-way tree | |
US20210182328A1 (en) | System and method for hierarchically organizing documents based on document portions | |
CN111190900B (en) | JSON data visualization optimization method in cloud computing mode | |
CN108647322A (en) | The method that word-based net identifies a large amount of Web text messages similarities | |
JP2008210024A (en) | Apparatus for analyzing set of documents, method for analyzing set of documents, program implementing this method, and recording medium storing this program | |
Bykau et al. | Fine-grained controversy detection in Wikipedia | |
CN108304382A (en) | Mass analysis method based on manufacturing process text data digging and system | |
CN102508901A (en) | Content-based massive image search method and content-based massive image search system | |
KR101327514B1 (en) | System for patent network analysis using semantic patent similarity and method using the same | |
KR101268503B1 (en) | Method and its system for generation of patent maps | |
Nevzorova et al. | Towards a recommender system for the choice of UDC code for mathematical articles | |
JP5324677B2 (en) | Similar document search support device and similar document search support program | |
Lydia et al. | Clustering and indexing of multiple documents using feature extraction through apache hadoop on big data | |
Nazemi et al. | Comparison of full-text articles and abstracts for visual trend analytics through natural language processing | |
WO2009113494A1 (en) | Question and answer system which can provide descriptive answer using www as source of information | |
Nanba et al. | Automatic detection of survey articles | |
CN114238735B (en) | Intelligent internet data acquisition method | |
KR101880474B1 (en) | Keyword-based service provide method for high value added content information service and method and recording medium storing program for executing the same and recording medium storing program for executing the same | |
Yoon et al. | A conference paper exploring system based on citing motivation and topic | |
Wei et al. | Management of scientific documents and visualization of citation relationships using weighted key scientific terms | |
Wu et al. | High efficient methods of content-based 3D model retrieval | |
Kang et al. | Recognising informative Web page blocks using visual segmentation for efficient information extraction. | |
KR100809751B1 (en) | System and method for making analysis of document | |
Yu et al. | frances: cloud-based historical text mining with deep learning and parallel processing | |
Drobac et al. | The Laborious Cleaning: Acquiring and Transforming 19th-Century Epistolary Metadata |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
LAPS | Lapse due to unpaid annual fee |