KR101199527B1 - System and Method of technology structure analysis based on patent information - Google Patents
System and Method of technology structure analysis based on patent information Download PDFInfo
- Publication number
- KR101199527B1 KR101199527B1 KR1020100079367A KR20100079367A KR101199527B1 KR 101199527 B1 KR101199527 B1 KR 101199527B1 KR 1020100079367 A KR1020100079367 A KR 1020100079367A KR 20100079367 A KR20100079367 A KR 20100079367A KR 101199527 B1 KR101199527 B1 KR 101199527B1
- Authority
- KR
- South Korea
- Prior art keywords
- ipc
- technical
- code
- class
- field
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
본 발명은 특허정보에 기반한 기술구조 분석 시스템 및 방법에 관한 것으로서, 특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링하는 클러스터링 모듈, 상기 클러스터링 모듈에 의한 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 계층을 나누고, 각 계층별 기술분류 코드를 추출하는 핵심기술 분류코드 추출 모듈, 상기 핵심 기술분류코드 추출 모듈에서 추출된 각 계층별 기술분류 코드를 텍스트 마이닝하여 코워드(cowords)를 도출하고, 상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출하는 기술분야 도출 모듈을 포함한다.
따라서, 본 발명에 따르면, 특허 정보에 포함되어 있는 IPC Code(국제특허분류코드) 분류체계를 활용하여 기술구조를 만들고, 특허문헌정보를 활용하여 기술구조의 분야명을 도출하는 정량적인 분석을 가능하게 할 수 있다The present invention relates to a system and method for analyzing technical structure based on patent information, comprising: a clustering module for classifying a patent document according to a right type and clustering the classification results according to similarity of IPC codes, and each cluster by the clustering module. Text mining of the technical classification code extracted from the core technology classification code extraction module and the core technology classification code extraction module for dividing the layers by analyzing the IPC codes of the constituent patent documents, and extracting the technology classification code for each layer. And a technical field derivation module for deriving a technical field by deriving the cowords and matching the derived coords with the patent document information of the upper layer.
Therefore, according to the present invention, it is possible to use the IPC Code (International Patent Classification Code) classification system included in the patent information to create a technical structure, and use the patent document information to quantitatively analyze the field name of the technical structure. Can let
Description
본 발명은 특허정보에 기반한 기술구조 분석 시스템 및 방법에 관한 것으로, 더욱 상세하게는 특허 문헌을 권리유형 및 IPC(International Patent Classification, 국제특허분류) 코드의 유사도에 따라 클러스터링하고, 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 계층을 나누고, 각 계층별 기술분류 코드를 추출한 후, 각 계층별 기술 분류 코드를 텍스트 마이닝하여 코워드를 도출하고, 상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출하는 특허정보에 기반한 기술구조 분석 시스템 및 방법에 관한 것이다.
The present invention relates to a system and method for analyzing technical structures based on patent information, and more particularly, to cluster patent documents according to similarity between rights types and IPC codes. The IPC codes of the patent documents are analyzed to divide the layers, extract the technology classification codes for each layer, and then, by text mining the technology classification codes for each layer, derive the coords, and obtain the coords for each layer above the higher layers. The present invention relates to a technical structure analysis system and method based on patent information which derives a technical field by matching with patent document information.
신기술 개발에 활용되는 지식들은 종류나 형태 측면에서 매우 다양하지만 최근에는 기술의 최신 경향을 반영하는 특허에 관심이 집중되고 있다.The knowledge used in the development of new technologies varies greatly in terms of types and forms, but in recent years, attention has been focused on patents that reflect the latest trends in technology.
특허 정보는 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.Patent information has the characteristics of technical information, rights information and management information, and its importance is increasing in the global international competition. As the technical information, it is possible to know the trend of technology development and technical ideas applied to individual patents, and as the right information, it is possible to grasp the scope of rights of individual patents and the degree of nationalization of domestic and foreign rights.
특히, 기술 정보로서의 특허 정보는 기술 혁신에 대한 학술적 연구를 수행하는 연구자들에게뿐만 아니라 실제 기술을 개발하는 기술자들에게도 기술 변화의 추세와 기술 특성 파악에 매우 중요한 자료로 활용되고 있다. 따라서 특허 정보를 이용한 신 기술 발견 시스템의 개발은 과거 기술들의 특성을 매우 방대한 자료에 기초하여 분석할 수 있기 때문에 축적된 지식을 새로운 지식 창출에 이용한다는 측면에서 의미가 있다고 할 수 있다.In particular, the patent information as the technical information is used as a very important data for identifying trends and technical characteristics of technological change not only for researchers who perform academic research on technological innovation, but also for engineers who develop actual technologies. Therefore, the development of a new technology discovery system using patent information can be said to be meaningful in terms of using the accumulated knowledge to create new knowledge because the characteristics of the past technologies can be analyzed based on a very large amount of data.
이러한 이유에 의해 특허 동향을 분석하는 시스템이 필요하게 되었다. 특허동향분석 시스템은 사용자에 의한 기술분류에 중점을 두지 않는 특허동향분석 방식이 사용되고 있다. 즉, 사용자에 의한 특허 데이터의 기술분류 없이 IPC분류 등에 의해 자동적으로 기술분류하여 특허동향분석을 수행하는 방식이 사용되고 있으며, 기술분류에 사용자의 선택을 개입시키는 경우에는 몇몇 주제어를 미리 선정하도록 하는 방식을 사용한다.For this reason, a system for analyzing patent trends is needed. Patent trend analysis system uses a patent trend analysis method that does not focus on technical classification by the user. That is, a method of performing patent trend analysis by automatically classifying a technology by IPC classification or the like without using a technical classification of patent data by a user is used. When a user's selection is involved in the technology classification, several main words are selected in advance. Use
이러한 종래의 특허동향분석 시스템의 기술분류 방식은 특허검색과의 연관성, 기술분류 자체의 정확성에 문제가 있으며, 특히 분석목적에 따른 기술분류의 다양성을 수용하지 못하는 단점이 있다.The technology classification method of the conventional patent trend analysis system has a problem in relation to patent search and accuracy of the technology classification itself, and in particular, there is a disadvantage in that it cannot accommodate the diversity of technology classification according to the analysis purpose.
또한, 기술분류를 지원하는 특허동향분석 시스템에서는 단순히 전체 특허문서에서 텍스트 마이닝 기법에 의해 키워드를 추출하고, 그 키워드의 빈도수에 따라 기술분류를 하는 방식을 사용하고 있으나, 이는 기술분류의 정확도가 현저히 떨어지는 문제점을 가지고 있다.In addition, the patent trend analysis system supporting technical classification simply extracts keywords from the entire patent documents by text mining techniques and uses technical classification according to the frequency of the keywords. There is a problem falling.
사용자가 기술분류를 한 후 주제어를 선정하도록 하는 방식은 그 주제어의 빈도수에 따라 특허문헌을 기술분류하는 것으로서 기술분류의 정확도가 낮으며, 관념적인 주제어를 분석자의 기술상식에서 도출하도록 한다는 점에서 실제 특허문헌에 사용되는 용어와의 차이가 발생한다는 것을 무시할 수 없다. The method that allows the user to select the main word after the technical classification is to classify the patent literature according to the frequency of the main word, and the accuracy of the technical classification is low and the conceptual word is derived from the technical common sense of the analyst. It cannot be ignored that a difference with a term used in a patent document occurs.
또한, 특정 키워드를 기준으로 관련 특허들을 찾아내어 정성적으로 기술구조를 구축하는 방법론이 대부분이며, 불특정 다수의 특허들로부터 키워드를 찾아내어 클러스터를 구성하고, 대량의 특허들로 구성된 클러스터의 기술구조를 계량적 분석기법으로 패키징하는 방법론은 존재하지 않았다.In addition, most of the methodologies for qualitatively constructing a technical structure by finding related patents based on a specific keyword, forming a cluster by finding keywords from an unspecified number of patents, and the technical structure of a cluster composed of a large number of patents There is no methodology for packaging quantitative analysis.
또한, 특정 기술(제품)을 구성하기 위하여 관련된 특허들을 패키징하는 방법에 대한 연구들이 많이 이루어져 왔으나, 대부분 전문가의 분석에 의존하는 정성적인 방법론을 연구하는 수준에 머물러 있는 단점이 있다.
In addition, there have been many studies on how to package related patents in order to construct a specific technology (product), but most of them have the disadvantage of remaining at the level of researching qualitative methodologies depending on expert analysis.
본 발명은 상기한 문제점을 해결하기 위하여 안출한 것으로, 본 발명의 목적은 특허 정보에 포함되어 있는 IPC Code(국제특허분류코드) 분류체계를 활용하여 기술구조를 만들고, 특허문헌정보를 활용하여 기술구조의 분야명을 도출하는 특허정보에 기반한 기술구조 분석 시스템 및 방법을 제공하는데 있다.The present invention has been made to solve the above problems, the object of the present invention is to make a technical structure using the IPC Code (International Patent Classification Code) classification system included in the patent information, and to use the patent document information The present invention provides a technical structure analysis system and method based on patent information for deriving a field name of a structure.
본 발명의 다른 목적은 다수의 특허를 기술?제품 단위로 패키징하여, 기술사업화 시 개별특허가 갖는 활용제약을 극복할 수 있는 특허정보에 기반한 기술구조 분석 시스템 및 방법을 제공하는데 있다.
Another object of the present invention is to provide a technology structure analysis system and method based on patent information that can overcome the limitations of individual patents in the commercialization of technology by packaging a plurality of patents in technology and product units.
상기 목적들을 달성하기 위하여 본 발명에 따르면, 특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링하는 클러스터링 모듈, 상기 클러스터링 모듈에 의한 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 계층을 나누고, 각 계층별 기술분류 코드를 추출하는 핵심기술 분류코드 추출 모듈, 상기 핵심 기술분류코드 추출 모듈에서 추출된 각 계층별 기술분류 코드를 텍스트 마이닝하여 코워드(cowords)를 도출하고, 상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출하는 기술분야 도출 모듈을 포함하는 특허 정보에 기반한 기술 구조 분석 시스템이 제공된다. In order to achieve the above objects, according to the present invention, the patent document is classified according to the right type, the clustering module for clustering the classification results according to the similarity of the IPC code, of the patent documents constituting each cluster by the clustering module Core technology classification code extraction module for dividing layers by analyzing IPC codes, extracting technology classification codes for each layer, and text mining the technology classification codes for each layer extracted from the core technology classification code extraction module. And a technical structure analysis system based on patent information including a technical field derivation module for deriving a technical field by matching the derived corridors of each layer with patent document information of an upper layer.
상기 특허정보에 기반한 기술 구조 분석 시스템은 특허문헌정보의 소스로부터 특허문헌을 수집하는 수집 모듈을 더 포함하되, 상기 수집 모듈은 상기 수집된 특허 문헌을 데이터베이스에 저장한다. The technical structure analysis system based on the patent information further includes a collection module for collecting patent documents from a source of patent document information, wherein the collection module stores the collected patent documents in a database.
상기 데이터베이스는 상기 수집된 특허 문헌이 저장된 특허문헌정보 데이터베이스, 권리유형 정보가 저장된 권리유형 데이터베이스 및 IPC 코드에 대한 정보가 저장된 IPC 코드 데이터베이스를 포함한다. The database includes a patent document information database storing the collected patent documents, a rights type database storing right type information, and an IPC code database storing information on an IPC code.
또한, 상기 특허정보에 기반한 기술 구조 분석 시스템은 상기 기술 분야 도출 모듈에서 도출된 기술분야와 IPC 분류 체계를 매칭시켜 기술구조를 도출하는 기술 구조 도출 모듈을 더 포함할 수 있다. The technical structure analysis system based on the patent information may further include a technical structure derivation module for deriving a technical structure by matching the technical field derived from the technical field derivation module with the IPC classification system.
상기 클러스터링 모듈은 상기 수집된 특허 문헌을 권리유형에 따라 분류하는 권리유형 분류부, 상기 권리유형이 분류된 특허문헌을 IPC 코드에 따라 벡터화하고, IPC 코드의 유사도에 따라 클러스터링하는 데이터 변환부를 포함한다. The clustering module includes a right type classification unit for classifying the collected patent documents according to a right type, and a data converting unit for vectorizing the patent documents classified with the right type according to an IPC code and clustering according to the similarity of the IPC code. .
상기 핵심기술 분류코드 추출 모듈은 각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 일정 비율 이상인 IPC를 클래스 IPC로 선별하는 클래스(Class) 선별부, 상기 클래스 IPC별로 최빈값을 갖는 IPC를 서브 클래스 IPC로 선별하는 서브 클래스(Sub Class) 선별부, 상기 서브 클래스 IPC별로 최빈값을 갖는 IPC를 메인 그룹(Main Group) IPC로 선별하는 메인 그룹 선별부, 상기 메인 그룹 IPC를 분석하여 복수개의 코워드를 추출하고, 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드를 핵심 기술분류 코드로 도출하는 서브 그룹 도출부를 포함한다. The core technology classification code extraction module is a class selector for classifying IPCs having a certain proportion or more of IPCs of a patent document constituting each cluster as class IPCs, and IPCs having a mode value for each class IPC as subclass IPCs. A sub class selector for selecting, a main group selector for selecting an IPC having a mode value for each subclass IPC as a main group IPC, and extracting a plurality of codes by analyzing the main group IPC And a subgroup derivation unit for deriving an IPC code having a mode as a core technology classification code by applying the extracted weight for each codeword.
상기 클래스 선별부는 특허문헌의 IPC 비중이 10%이상인 IPC를 클래스 IPC로 선별한다. The class selector selects an IPC having a class IPC ratio of 10% or more as a class IPC.
상기 기술분야 도출 모듈은 상기 서브 그룹 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 상기 메인 그룹 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 메인 그룹의 기술 분야를 도출하는 메인 그룹 기술 분야 도출부, 상기 메인 그룹 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 상기 서브 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 서브 클래스의 기술 분야를 도출하는 서브 클래스 기술 분야 도출부, 상기 서브 클래스 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 상기 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클래스의 기술 분야를 도출하는 클래스 기술 분야 도출부, 상기 클래스 IPC와 매칭되는 디스크립션을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 상기 클러스터를 구성하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클러스터의 기술 분야를 도출하는 클러스터 기술 분야 도출부를 포함한다. The technical field deriving module extracts a predetermined number of keywords with high frequency by text mining a description matching the subgroup IPC, and compares the extracted keyword with a catchword index. After deriving, matching the derived code with the patent document information corresponding to the main group IPC, the main group technical field deriving unit for deriving the technical field of the main group of the code having the most frequent value, matching with the main group IPC Text mining the description to extract a certain number of keywords with a high frequency, and compare the extracted keyword with a catchword index (CATCHWORD INDEX) to derive a code, and then the derived code to the sub Corresponding to the patent literature information corresponding to the class IPC, the code having the mode is shown in the technical field of the subclass. The sub-class technical field deriving unit performs text mining on a description matching the sub-class IPC, extracts a predetermined number of keywords, and compares the extracted keywords with a catchword index. After deriving a word, a class description field derivation unit for deriving a technical field of a class having a codeword having a mode value by matching the derived code with the patent document information corresponding to the class IPC, a description matching the class IPC A text mining method extracts a predetermined number of keywords with high frequency, compares the extracted keyword with a catchword index, and derives a codeword, and then uses the derived code to construct the cluster. Clustering apparatus that derives the technical field of the cluster with the mode having the most frequent matched with the information Field includes deriving unit.
또한, 본 발명에 따르면, (a)특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링하는 단계, (b)상기 클러스터링된 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 계층을 나누고, 각 계층별 기술분류 코드를 추출하는 단계, (c)상기 추출된 각 계층별 기술 분류 코드를 텍스트 마이닝하여 코워드를 도출하는 단계, (d)상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출하는 단계를 포함하는 특허정보에 기반한 기술구조 분석 방법이 제공된다. In addition, according to the present invention, (a) classifying the patent documents according to the right type, clustering the classification results according to the similarity of the IPC code, (b) IPC of the patent documents constituting each clustered cluster Dividing the layers by analyzing the codes, extracting the technical classification codes for each layer, (c) deriving a codeword by text mining the extracted technical classification codes for each layer, and (d) each derived layer There is provided a technology structure analysis method based on patent information including the step of deriving a technical field by matching the star code with the patent document information of the upper layer.
상기 (c)단계는, 각 계층별 기술 분류 코드를 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하는 단계, 상기 추출된 키워드를 캐치워드 인덱스와 대조하여 코워드를 도출하는 단계를 포함한다. In the step (c), the method may include extracting a predetermined number of keywords having high frequency by text mining the description classification code of each layer, and deriving a coword by comparing the extracted keyword with a catchword index.
상기 (d)단계는, 각 계층별 코워드를 상위 계층의 특허문헌정보와 각각 매칭하여 최빈값을 갖는 코워드를 각 계층의 기술분야로 도출한다. In the step (d), the code for each layer is matched with the patent document information of the upper layer to derive the code having the mode to the technical field of each layer.
상술한 바와 같이 본 발명에 따르면, 특허 정보에 포함되어 있는 IPC Code(국제특허분류코드) 분류체계를 활용하여 기술구조를 만들고, 특허문헌정보를 활용하여 기술구조의 분야명을 도출하는 정량적인 분석을 가능하게 할 수 있다. As described above, according to the present invention, a technical structure is made by using the IPC Code (International Patent Classification Code) classification system included in the patent information, and quantitative analysis that derives the field name of the technical structure by using the patent document information. Can be enabled.
또한, 다수의 특허를 기술?제품 단위로 패키징하므로, 기술사업화 시 개별특허가 갖는 활용제약을 극복할 수 있다.
In addition, since a number of patents are packaged in technology and product units, it is possible to overcome the limitations of use of individual patents in the commercialization of technology.
도 1은 본 발명에 따른 특허 정보에 기반한 기술 구조 분석 시스템을 나타낸 도면.
도 2는 본 발명에 따른 기술 구조 분석 서버의 구성을 개략적으로 나타낸 블럭도.
도 3은 도 2에 도시된 클러스터링 모듈을 나타낸 도면.
도 4는 도2에 도시된 핵심 기술 분류 코드 추출 모듈을 나타낸 도면.
도 5는 도 2에 도시된 기술분야 도출 모듈을 나타낸 도면.
도 6은 본 발명에 따른 특허 정보에 기반한 기술 구조 분석 방법을 나타낸 흐름도.
도 7은 본 발명에 따른 핵심 기술 분류 코드 추출 방법을 설명하기 위한 예시도.
도 8은 본 발명에 따른 각 계층의 기술 분야를 도출하기 위한 방법을 설명하기 위한 예시도.
도 9는 본 발명에 따른 기술 구조 도출 방법을 설명하기 위한 예시도.1 is a view showing a technical structure analysis system based on patent information according to the present invention.
Figure 2 is a block diagram schematically showing the configuration of the technical structure analysis server according to the present invention.
3 shows the clustering module shown in FIG. 2;
4 illustrates the core technology classification code extraction module shown in FIG. 2;
FIG. 5 is a diagram illustrating a technical field derivation module illustrated in FIG. 2.
6 is a flowchart illustrating a technology structure analysis method based on patent information according to the present invention.
7 is an exemplary diagram for explaining a method for extracting a core technology classification code according to the present invention;
8 is an exemplary view for explaining a method for deriving a technical field of each layer according to the present invention.
9 is an exemplary view for explaining a method for deriving a technical structure according to the present invention.
본 발명의 전술한 목적과 기술적 구성 및 그에 따른 작용 효과에 관한 자세한 사항은 본 발명의 명세서에 첨부된 도면에 의거한 이하 상세한 설명에 의해 보다 명확하게 이해될 것이다.
Details of the above-described objects and technical configurations of the present invention and the effects thereof according to the present invention will be more clearly understood by the following detailed description based on the accompanying drawings.
도 1은 본 발명에 따른 특허 정보에 기반한 기술 구조 분석 시스템을 나타낸 도면이다. 1 is a view showing a technical structure analysis system based on patent information according to the present invention.
도 1을 참조하면, 특허 정보에 기반한 기술 구조 분석 시스템은 특허문헌 정보가 저장된 특허문헌 정보 데이터베이스 서버(100), 상기 특허문허 정보 데이터베이스 서버(100)로부터 특허 문헌을 수집하여 클러스터링 및 기술 분야를 도출하는 기술 구조 분석 서버(200)를 포함한다. Referring to FIG. 1, the technology structure analysis system based on patent information derives clustering and technical fields by collecting patent documents from a patent document
상기 기술 구조 분석 서버(200)는 상기 특허문헌 정보 데이터베이스 서버(100)로부터 특허문서를 수집하여 저장하고, 상기 저장된 특허문헌을 권리유형 및 IPC(International Patent Classification, 국제특허분류) 코드유형에 따라 분류하여 클러스터를 생성하고, 각 클러스터의 IPC 코드를 이용하여 핵심기술을 도출하고, 특허 문헌 정보를 통해 기술분야를 도출하는 역할을 수행한다. The technical
상기 기술 구조 분석 서버(200)가 특허문헌을 수집할 수 있는 방법은 다양하나, 크게 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것, 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 그 대표적인 예가 대한민국 특허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템, 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr,www.wisdomain.com 등이 있다.
The technical
도 2는 본 발명에 따른 기술 구조 분석 서버의 구성을 개략적으로 나타낸 블럭도, 도 3은 도 2에 도시된 클러스터링 모듈을 나타낸 도면, 도 4는 도2에 도시된 핵심 기술 분류 코드 추출 모듈을 나타낸 도면, 도 5는 도 2에 도시된 기술분야 도출 모듈을 나타낸 도면이다. 2 is a block diagram schematically showing a configuration of a technical structure analysis server according to the present invention, FIG. 3 is a diagram showing a clustering module shown in FIG. 2, and FIG. 4 is a diagram showing a core technology classification code extraction module shown in FIG. FIG. 5 is a diagram illustrating a technical field derivation module illustrated in FIG. 2.
도 2를 참조하면, 기술 구조 분석 서버(200)는 수집 모듈(210), 클러스터링 모듈(230), 핵심기술 분류코드 추출 모듈(250), 기술분야 도출 모듈(270), 기술 구조 분석 모듈(290)을 포함한다.Referring to FIG. 2, the technical
상기 수집 모듈(210)은 특허문헌정보의 소스로부터 특허문헌을 수집하여 데이터베이스(미도시)에 저장한다. 여기서, 상기 데이터베이스는 특허문헌정보 데이터베이스(미도시), 특허 보유기관의 Inventor 검색어(소속기관)를 포함하는 권리유형 데이터베이스(미도시) 및 기술적 특성을 포함하고 있는 IPC 코드 데이터베이스(미도시)를 포함한다. 상기 권리유형 데이터베이스에는 출연(연)?대학?민간이 각각 단독으로 특허권리를 보유하는 3개 권리 유형과 출연(연)?대학?기업이 공동으로 특허권리를 보유하는 7개의 권리유형이 저장되어 있다. 상기 IPC 코드 데이터베이스에는 IPC 코드에 대한 정보가 저장되어 있다. The
상기 클러스터링 모듈(230)은 상기 수집 모듈(210)에서 수집된 특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링하여 클러스터를 생성한다. The
즉, 상기 클러스터링 모듈(230)은 특허의 권리유형에 따라 활용범위가 달라지기 때문에 권리유형별 분포를 고려하여 IPC Code를 기준으로 코드분류체계가 유사한 특허들을 클러스터링(Clustering)한다.That is, the
상기 클러스터링 모듈(230)에 대해 도 3을 참조하면, 상기 클러스터링 모듈(230)은 특허 문헌을 권리유형에 따라 분류하는 권리유형 분류부(232), 상기 권리유형이 분류된 특허문헌을 IPC 코드에 따라 벡터화하고, IPC 코드의 유사도에 따라 클러스터링하는 데이터 변환부(234)를 포함한다.Referring to FIG. 3 for the
상기 권리유형 분류부(232)는 상기 수집모듈(210)에서 수집된 특허문헌을 상기 권리유형 DB에서 분류된 권리유형에 따라 분류한다. 즉, 상기 권리유형 분류부(232)는 상기 수집된 특허문헌에서 같은 소속기관의 문서를 호출하여 기술권리보유유형을 출연(연)?대학?민간이 각각 단독으로 특허권리를 보유하는 3개 권리 유형과 출연(연)?대학?기업이 공동으로 특허권리를 보유하는 7개의 권리유형으로 분류한다. The right
상기 데이터 변환부(234)는 상기 권리유형 분류부(232)에서 분류된 특허문헌을 IPC 코드에 따라 벡터화하고, IPC 코드가 유사한 특허들을 클러스터링하여 클러스터를 생성한다. The
상기 핵심기술 분류코드 추출 모듈(250)은 상기 클러스터링 모듈(230)에서 생성된 각 클러스터의 IPC 계층 구조를 분석하여 핵심 기술 분류 코드를 추출한다.The core technology classification
즉, 상기 핵심 기술분류 코드 추출모듈(250)은 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 그 빈도수에 따라 IPC를 선별하여 계층을 나누고, IPC 계층 구조를 분석하여 클러스터내 핵심 기술분류 코드를 도출한다.That is, the core technology classification
다시 말하면, 상기 핵심 기술 분류 코드 추출 모듈(250)은 각 클러스터를 구성하고 있는 특허문헌들의 IPC 코드를 분석하여 클래스, 서브 클래스, 메인 그룹, 서브 그룹의 IPC로 계층을 나눈다. 이때, 상기 핵심 기술 분류 코드 추출 모듈(250)은 상기 서브 그룹의 IPC 코드를 핵심 기술분류 코드로 도출하게 된다.In other words, the core technology classification
상기와 같은 역할을 수행하는 핵심기술 분류 코드 추출 모듈(250)에 대해 도 4를 참조하면, 핵심기술 분류 코드 추출 모듈(250)은 클래스 선별부(252), 서브 클래스 선별부(254), 메인 그룹 선별부(256), 서브 그룹 선별부(258)를 포함한다.Referring to FIG. 4 for the core technology classification
상기 클래스 선별부(252)는 각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 일정 비율 이상(예를 들면, 10% 이상임)인 IPC를 클래스 IPC로 선별한다.The
상기 서브 클래스 선별부(254)는 상기 클래스 선별부(252)에서 선별된 클래스 IPC별로 최빈값을 갖는 IPC를 서브 클래스 IPC로 선별한다. The
상기 메인 그룹 선별부(256)는 상기 서브 클래스(Sub Class) 선별부(254)에서 선별된 서브 클래스 IPC별로 최빈값을 갖는 IPC를 메인 그룹(Main Group) IPC로 선별한다. The
상기 서브 그룹 도출부(258)는 상기 메인 그룹 선별부(256)에서 선별된 메인 그룹 IPC를 분석하여 복수개의 코워드(co-words)를 추출하고, 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드를 핵심 기술분류 코드로 도출한다. The
즉, 상기 서브 그룹 도출부(258)는 메인 그룹 IPC의 Description을 분석하여 메인 그룹 IPC을 대표하는 코워드(Co-Words)를 추출하고, 추출된 코워드를 가장 많이 포함하고 있는 서브 그룹 IPC Code를 선별하여 핵심기술(Seed-Tech)분류 코드로 채택한다. 여기서, 상기 Description는 International Patent Classification User' Guide Description을 의미한다.That is, the
상기 기술 분야 도출 모듈(270)은 상기 핵심기술 분류코드 추출 모듈(250)에서 선별된 각 계층별 기술 분류 코드를 텍스트 마이닝하여 코워드(co-word)를 도출하고, 상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출한다.The technical
즉, 상기 기술 분야 도출 모듈(270)은 각 클러스터를 구성하고 있는 하위 계층의 IPC에 해당하는 IPC Main Description을 Text-Mining하여 빈도수가 높은 상위 30개의 키워드를 추출하고, 상기 추출된 키워드를 CATCHWORD INDEX와 대조하여 Co-words를 도출한다. 그런다음 상기 기술분야 도출 모듈(270)은 상기 하위 계층에 대한 상위 계층의 IPC Code를 구성하고 있는 특허문헌정보들과 상기 도출된 코워드를 매칭하여 최빈값을 갖는 코워드를 상기 상위 계층의 기술 분야로 도출한다. 여기서, 상기 CATCHWORD INDEX는 기술 용어를 알파벳순으로 표시하여 관련 용어를 찾는 경우에 해당하는 특허 분류가 무엇인지를 알 수 있도록 구성한 국제 특허 분류집을 말한다. That is, the technical
상기와 같은 과정을 통해 상기 기술 분야 도출 모듈(270)은 메인 그룹, 서브 클래스, 클래스 및 클러스터 계층에 대한 기술 분야를 도출한다. Through the above process, the technical
상기와 같은 역할을 수행하는 기술분야 도출 모듈(270)에 대해 도 4를 참조하면, 상기 기술분야 도출 모듈(270)은 메인 그룹 기술 분야 도출부(272), 서브 클래스 기술 분야 도출부(274), 클래스 기술 분야 도출부(276), 클러스터 기술 분야 도출부(278)를 포함한다.Referring to FIG. 4 for the technical
상기 메인 그룹 기술 분야 도출부(272)는 상기 서브 그룹 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한다. 그런다음 상기 메인 그룹 기술 분야 도출부(272)는 상기 도출된 코워드를 상기 메인 그룹 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 메인 그룹의 기술 분야로 도출한다. The main group technical
상기 서브 클래스 기술 분야 도출부(274)는 상기 메인 그룹 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한다. 그런다음 상기 서브 클래스 기술분야 도출부(274)는 상기 도출된 코워드를 상기 서브 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 서브 클래스의 기술 분야로 도출한다. The sub-class technical
상기 클래스 기술 분야 도출부(276)는 상기 서브 클래스 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한다. 그런다음 상기 클래스 기술분야 도출부(276)는 상기 도출된 코워드를 상기 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클래스의 기술 분야로 도출한다. The class description
상기 클러스터 기술 분야 도출부(378)는 상기 클래스 IPC와 매칭되는 디스크립션(Description)을 텍스트 마이닝하여 빈도수가 높은 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한다. 그런다음 상기 클러스터 기술 분야 도출부(278)는 상기 도출된 코워드를 상기 클러스터를 구성하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클러스터의 기술 분야로 도출한다.The cluster technical field derivation unit 378 extracts a predetermined number of keywords with high frequency by text mining a description matching the class IPC, and compares the extracted keyword with a catchword index. Derive a coinword Then, the cluster technical
상기 기술 구조 분석 모듈(290)은 상기 기술 분야 도출 모듈(270)에서 도출된 기술분야와 IPC 분류 체계를 매칭시켜 기술구조를 도출한다.
The technical
도 6은 본 발명에 따른 특허 정보에 기반한 기술 구조 분석 방법을 나타낸 흐름도, 도 7은 본 발명에 따른 핵심 기술 분류 코드 추출 방법을 설명하기 위한 예시도, 도 8은 본 발명에 따른 각 계층의 기술 분야를 도출하기 위한 방법을 설명하기 위한 예시도, 도 9는 본 발명에 따른 기술 구조 도출 방법을 설명하기 위한 예시도이다. 6 is a flowchart illustrating a method for analyzing technology structure based on patent information according to the present invention, FIG. 7 is an exemplary view for explaining a method for extracting a core technology classification code according to the present invention, and FIG. 8 is a description of each layer according to the present invention. 9 is an exemplary diagram for describing a method for deriving a field, and FIG. 9 is an exemplary diagram for describing a method for deriving a technical structure according to the present invention.
도 6을 참조하면, 기술 구조 분석 서버는 특허문헌을 수집하고(S600), 상기 수집된 특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링한다(S602).Referring to FIG. 6, the technical structure analysis server collects patent documents (S600), classifies the collected patent documents according to a right type, and clusters the classification results according to similarity of IPC codes (S602).
즉, 상기 기술 구조 분석 서버는 표1과 같이 기술권리 유형을 분류한다.That is, the technical structure analysis server classifies the technical right types as shown in Table 1.
A-2
A-3A-1
A-2
A-3
대학이 단독으로 특허를 출원한 경우
민간이 단독으로 특허를 출원한 경우When Appearance Applied for Patent
If a university has applied for a patent
When a private patent is filed
B-2
B-3
B-4
B-5
B-6
B-7B-1
B-2
B-3
B-4
B-5
B-6
B-7
대학이 공동으로 특허를 출원한 경우
민간이 공동으로 특허를 출원한 경우
출연(연)과 민간이공동으로 특허를 출원한 경우
출연(연)과 대학이 공동으로 특허를 출원한 경우
대학과 민간이 공동으로 특허를 출원한 경우
출연(연) 및 대학과 민간이 공동으로 특허를 출원한 경우When appearance appears jointly for patent
If a university jointly filed a patent
When a private patent is filed jointly
When a patent is filed by appearance and private cooperation
When patents are jointly filed
When a patent is filed jointly by a university and a private company
Applied patents and joint patent applications between universities and the private sector
그런 다음 상기 기술 구조 분석 서버는 상기 권리유형에 따라 분류된 결과를 IPC 코드의 유사도에 따라 클러스터링한다. The technical structure analysis server then clusters the results classified according to the right type according to the similarity of the IPC codes.
상기 S602의 수행 후, 상기 기술 구조 분석 서버는 상기 클러스터링된 각 클러스터에 대해 IPC 코드를 분석하여 계층을 나누고, IPC 계층 구조를 분석하여 핵심 기술 분류 코드를 추출한다(S604).After performing the step S602, the technical structure analysis server analyzes the IPC code for each clustered cluster to divide the layer, and analyzes the IPC hierarchical structure to extract the core technical classification code (S604).
상기 기술 구조 분석 서버가 핵심 기술 분류 코드를 추출하는 방법에 대해 도 7을 참조하여 설명하기로 한다.A method of extracting the core technology classification code by the technology structure analysis server will be described with reference to FIG. 7.
도 7을 참조하면, 상기 기술 구조 분석 서버가 각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 10% 이상인 C07(146개), C08(73개), B01(38개), C09(35개)를 클래스 IPC로 선별한다.Referring to FIG. 7, C07 (146), C08 (73), B01 (38), and C09 (35), in which the technical structure analysis server has an IPC weight ratio of 10% or more of the patent documents constituting each cluster. Is selected as the class IPC.
그런 다음 상기 기술 구조 분석 서버는 상기 선별된 클래스 IPC별로 최빈값을 갖는 C09K(30개), A61K(26개), B01J(24개) 등을 서브 클래스 IPC로 선별한다.Then, the technical structure analysis server selects C09K (30), A61K (26), B01J (24), etc., which have the mode for each of the selected class IPCs, as subclass IPCs.
그리고, 상기 기술 구조 분석 서버는 상기 선별된 서브 클래스 IPC별로 최빈값을 갖는 C09K011(27개), C07D403(18개), A23L009(12개) 등을 메인 그룹(Main Group) IPC로 선별한다.The technical structure analysis server selects C09K011 (27), C07D403 (18), A23L009 (12), and the like having a mode value according to the selected subclass IPCs as a main group IPC.
그런 다음 상기 기술 구조 분석 서버는 상기 선별된 메인 그룹 IPC의 내용을 확인하여 복수개의 코워드를 추출한다. 여기서, 상기 코워드는 키워드나 키 절을 포함할 수 있다.Then, the technical structure analysis server checks the contents of the selected main group IPC and extracts a plurality of words. Here, the codeword may include a keyword or a key clause.
상기 기술 구조 분석 서버는 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드 즉, C09K011-80을 핵심 기술분류 코드로 도출한다.The technical structure analysis server derives the IPC code having the mode, that is, C09K011-80 as the core technical classification code by applying the extracted weight for each codeword.
상기 S604의 수행 후, 상기 기술 구조 분석 서버는 상기 추출된 각 계층별 기술 분류 코드를 텍스트 마이닝하여 코워드를 도출하고(S606), 상기 도출된 각 계층별 코워드를 상위 그룹의 특허문헌정보와 매칭하여 기술분야를 도출한다(S608).After performing the step S604, the technical structure analysis server text mines the extracted technical classification code of each layer to derive a code (S606), and the derived code for each layer and the patent document information of the upper group The technical field is derived by matching (S608).
상기 기술 구조 분석 서버가 기술분야를 도출하는 방법에 대해 도 8을 참조하여 설명하기로 한다. A method of deriving the technical field by the technical structure analysis server will be described with reference to FIG. 8.
도 8을 참조하면, 핵심 기술 분류 코드가 C09K011-80인 경우, 상기 기술 구조 분석 서버는 C09K011-80에 해당하는 IPC Main Description(Main Group Level)을 대상으로 텍스트 마이닝하여 빈도수가 높은 상위 30개의 키워드를 추출하고, 상기 추출된 키워드를 캐취워드 인덱스와 대조하여 코워드를 추출한다. 여기서, 추출된 코워드는 fluorescent substance, emission luminance 등일 수 있다. Referring to FIG. 8, when the core technology classification code is C09K011-80, the technology structure analysis server performs text mining on IPC Main Description (Main Group Level) corresponding to C09K011-80, and generates the top 30 keywords with high frequency. Extracts a coword by comparing the extracted keyword with a catchword index. Here, the extracted code may be a fluorescent substance, emission luminance, and the like.
그런 다음 상기 기술 구조 분석 서버는 상기 추출된 코워드와 상위 계층의 C09K011 특허문헌 정보와 매칭하여 '형광물질'이라는 기술분야를 도출한다. 이때, 기술 분야는 특허문헌정보에서 코워드의 빈도, 코워드와 특허문헌정보와의 매칭 정도 등에 따라 전문가에 의해 미리 설정되어 있을 수 있다. The technical structure analysis server then derives a technical field of 'fluorescent material' by matching the extracted code with the information of C09K011 patent documents of the upper layer. At this time, the technical field may be preset by an expert according to the frequency of the code in the patent document information, the degree of matching between the code and the patent document information.
그런 다음 상기 기술 분석 서버는 C09K011에 해당하는 IPC Main Description(Main Group Level)을 대상으로 텍스트 마이닝하여 빈도수가 높은 상위 30개의 키워드를 캐취워드 인덱스와 대조하여 코워드를 추출하고, 상기 추출된 코워드와 그 계층의 상위 그룹에 포함된 C09K 특허문헌 정보와 매칭하여 '유기 인광 물질'을 도출한다. 상기 기술 분석 서버는 상기와 같은 방법을 이용하여 'Flat Panel 발광물질', 디스플레이 발광재료'라는 기술분야를 도출한다. Then, the technical analysis server performs text mining on IPC Main Description (Main Group Level) corresponding to C09K011, extracts a coword by comparing the top 30 keywords with a high frequency with a catchword index, and extracts the coward. And 'organic phosphors' are derived by matching the C09K patent document information included in the upper group of the hierarchy. The technical analysis server derives a technical field of 'Flat Panel light emitting material' and display light emitting material using the above method.
상기 S608의 수행 후, 상기 기술 구조 분석 서버는 상기 도출된 기술분야와 IPC 분류 체계를 매칭시켜 기술구조를 도출한다(S610).After performing S608, the technical structure analysis server derives the technical structure by matching the derived technical field with the IPC classification scheme (S610).
상기 기술 구조 분석 서버가 기술 구조를 도출하는 방법에 대해 도 9을 참조하여 설명하기로 한다. A method of deriving the technical structure by the technical structure analysis server will be described with reference to FIG. 9.
상기 기술 구조 분석 서버는 서브 그룹 IPC Code와 메인 그룹의 코워드를 매칭하여 Contours-Tech Domain을 도출한다.The technical structure analysis server derives a Contours-Tech Domain by matching the subgroup IPC Code and the main group code.
또한, 상기 기술구조 분석 서버는 상기 메인 그룹 IPC Code와 상기 서브 그룹의 코워드를 매칭하여 Adjacent-Tech를 도출한다.In addition, the technical structure analysis server derives Adjacent-Tech by matching the main group IPC Code and the sub-group's code.
또한, 상기 기술구조 분석 서버는 서브 클래스 IPC Code와 상기 메인 그룹의 코워드를 매칭하여 Class-Tech를 도출한다.In addition, the technical structure analysis server derives Class-Tech by matching subclass IPC Code and the code of the main group.
또한, 상기 기술구조 분석 서버는 클래스 IPC Code와 서브 클래스의 코워드를 매칭하여 Cluster-Tech를 도출한다.In addition, the technical structure analysis server derives Cluster-Tech by matching the class IPC Code and the subclass code.
즉, 상기 기술구조 분석 서버는 IPC 하위 Level의 Co- Word와 IPC 상위 Level의 특허문헌정보를 비교?분석하여 Seed-Tech(IPC Sub Group Level), Adjacent-Tech(IPC Main Group Level), Contours-Tech(IPC Sub Class level), Class-tech(IPC Class Level), Cluster-Tech로 구분한 추론형 모델(Analogy Model)을 도출한다.
In other words, the technical structure analysis server compares and analyzes the co-word of the IPC lower level and the patent document information of the IPC upper level and analyzes the Seed-Tech (IPC Sub Group Level), Adjacent-Tech (IPC Main Group Level), and Contours- We derive an analytic model classified into Tech (IPC Sub Class level), Class-tech (IPC Class Level), and Cluster-Tech.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
Thus, those skilled in the art will appreciate that the present invention may be embodied in other specific forms without departing from the spirit or essential characteristics thereof. It is therefore to be understood that the embodiments described above are to be considered in all respects only as illustrative and not restrictive. The scope of the present invention is defined by the appended claims rather than the detailed description and all changes or modifications derived from the meaning and scope of the claims and their equivalents are to be construed as being included within the scope of the present invention do.
100 : 특허문헌 정보 데이터베이스 서버 200 : 기술 구조 분석 서버
210 : 자료 수집 모듈 220 : 클러스터링 모듈
232 : 권리 유형 분류부 234 : 데이터 변환부
250 : 핵심기술 분류 코드 추출 모듈 252 : 클래스 선별부
254 : 서브 클래스 선별부 256 : 메인 그룹 선별부
258 : 서브 그룹 선별부 270 : 기술 분야 도출 모듈
272 : 메인 그룹 기술분야 도출부 274 : 서브 클래스 기술분야 도출부
276 : 클래스 기불분야 도출부 278 : 클러스터 기술분야 도출부
290 : 기술 구조 분석 모듈100: patent document information database server 200: technical structure analysis server
210: data collection module 220: clustering module
232: right type classification unit 234: data conversion unit
250: core technology classification code extraction module 252: class selector
254: sub class selector 256: main group selector
258: sub-group selector 270: technical field derivation module
272: Derivation part of the main group technical field 274: Derivation part of the subclass technical field
276: Class deduction field 278: Cluster technical field derivation unit
290: Technical Structure Analysis Module
Claims (13)
상기 클러스터링 모듈에 의한 각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 일정 비율 이상인 IPC를 클래스 IPC로 선별하고, 상기 클래스 IPC별로 최빈값을 갖는 IPC를 서브 클래스 IPC로 선별한 후, 상기 서브 클래스 IPC별로 최빈값을 갖는 IPC를 메인 그룹(Main Group) IPC로 선별하고, 상기 메인 그룹 IPC를 분석하여 복수개의 코워드를 추출 및 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드를 핵심 기술분류 코드로 도출하는, 각 계층별 기술분류 코드를 추출하는 핵심기술 분류코드 추출 모듈; 및
상기 핵심 기술분류코드 추출 모듈에서 추출된 각 계층별 기술분류 코드를 텍스트 마이닝하여 코워드(cowords)를 도출하고, 상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 매칭하여 기술분야를 도출하는 기술분야 도출 모듈;
을 포함하는 특허 정보에 기반한 기술 구조 분석 시스템.
A clustering module classifying the patent documents according to the right type and clustering the classification results according to the similarity of the International Patent Classification (IPC) code;
After classifying IPCs having a certain proportion or more of IPCs of the patent documents constituting each cluster by the clustering module as class IPCs, and classifying IPCs having mode values for each class IPC as subclass IPCs, The IPC having a mode is selected as a main group IPC, the main group IPC is analyzed, a plurality of codes are extracted, and the extracted weight is applied to the IPC code having a mode as a core technology classification code. A core technology classification code extraction module for extracting a technology classification code for each layer to be derived; And
The technology classification code of each layer extracted by the core technology classification code extraction module is text mined to derive cowords, and the derived technical field is matched with the patent document information of the upper layer. Deriving technical field derivation module;
Technical structure analysis system based on the patent information comprising a.
특허문헌정보의 소스로부터 특허문헌을 수집하는 수집 모듈을 더 포함하되,
상기 수집 모듈은 상기 수집된 특허 문헌을 데이터베이스에 저장하는 것을 특징으로하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 1,
Further comprising a collection module for collecting patent documents from a source of patent document information,
The collection module is a technical structure analysis system based on patent information, characterized in that for storing the collected patent documents in a database.
상기 데이터베이스는 상기 수집된 특허 문헌이 저장된 특허문헌정보 데이터베이스, 권리유형 정보가 저장된 권리유형 데이터베이스 및 IPC 코드에 대한 정보가 저장된 IPC 코드 데이터베이스를 포함하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 2,
The database includes a patent document information database storing the collected patent documents, a rights type database storing rights type information, and an IPC code database storing information on an IPC code.
상기 기술 분야 도출 모듈에서 도출된 기술분야와 IPC 분류 체계를 매칭시켜 기술구조를 도출하는 기술 구조 도출 모듈을 더 포함하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 1,
The technical structure analysis system based on patent information further comprising a technical structure derivation module for deriving a technical structure by matching the technical field derived from the technical field derivation module and the IPC classification system.
상기 클러스터링 모듈은,
상기 특허 문헌을 권리유형에 따라 분류하는 권리유형 분류부;
상기 권리유형이 분류된 특허문헌을 IPC 코드에 따라 벡터화하고, IPC 코드의 유사도에 따라 클러스터링하는 데이터 변환부;를 포함하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 1,
The clustering module,
A right type classification unit for classifying the patent document according to a right type;
And a data conversion unit for vectorizing the patent documents classified by the right type according to the IPC code, and clustering the patent documents according to the similarity of the IPC code.
상기 핵심기술 분류코드 추출 모듈은,
각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 일정 비율 이상인 IPC를 클래스 IPC로 선별하는 클래스(Class) 선별부;
상기 클래스 IPC별로 최빈값을 갖는 IPC를 서브 클래스 IPC로 선별하는 서브 클래스(Sub Class) 선별부;
상기 서브 클래스 IPC별로 최빈값을 갖는 IPC를 메인 그룹(Main Group) IPC로 선별하는 메인 그룹 선별부;및
상기 메인 그룹 IPC를 분석하여 복수개의 코워드를 추출하고, 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드를 핵심 기술분류 코드로 도출하는 서브 그룹 도출부;를 포함하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 1,
The core technology classification code extraction module,
A class selection unit for selecting IPCs having a specific ratio of IPCs of the patent documents constituting each cluster into class IPCs;
A sub class selector for selecting an IPC having a mode for each class IPC as a sub class IPC;
A main group selector configured to select an IPC having a mode value for each subclass IPC as a main group IPC; and
And a subgroup deriving unit for extracting a plurality of codes by analyzing the main group IPC, and deriving an IPC code having a mode as a core technology classification code by applying the extracted weight for each codeword. Technical structure analysis system based on patent information.
상기 클래스 선별부는 특허문헌의 IPC 비중이 10%이상인 IPC를 클래스 IPC로 선별하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 시스템.
The method according to claim 6,
The class selection unit is a technology structure analysis system based on patent information, characterized in that the IPC portion of the patent document is more than 10% of the IPC screening class IPC.
상기 기술분야 도출 모듈은,
서브 그룹 IPC와 매칭되는 디스크립션을 텍스트 마이닝하여 빈도수가 높은 미리 정해진 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스(CATCHWORD INDEX)와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 메인 그룹 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 메인 그룹의 기술 분야를 도출하는 메인 그룹 기술 분야 도출부;
상기 메인 그룹 IPC와 매칭되는 디스크립션을 텍스트 마이닝하여 빈도수가 높은 미리 정해진 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 서브 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 서브 클래스의 기술 분야를 도출하는 서브 클래스 기술 분야 도출부;
상기 서브 클래스 IPC와 매칭되는 디스크립션을 텍스트 마이닝하여 빈도수가 높은 미리 정해진 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 클래스 IPC에 해당하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클래스의 기술 분야를 도출하는 클래스 기술 분야 도출부;
상기 클래스 IPC와 매칭되는 디스크립션을 텍스트 마이닝하여 빈도수가 높은 미리 정해진 일정 개수의 키워드를 추출하고, 상기 추출된 키워드를 캐치워드 인덱스와 대조하여 코워드를 도출한 후, 상기 도출된 코워드를 상기 클러스터를 구성하는 특허문헌정보와 매칭하여 최빈값을 갖는 코워드를 클러스터의 기술 분야를 도출하는 클러스터 기술 분야 도출부;를 포함하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 시스템.
The method of claim 1,
The technical field derivation module,
The text mining description matching the subgroup IPC extracts a predetermined number of keywords with a high frequency, compares the extracted keyword with a catchword index, and then derives a coword, and then extracts the code. A main group technical field derivation unit for matching a word with patent document information corresponding to the main group IPC to derive a code field having a mode value of the main group;
After text mining the description matching the main group IPC, a predetermined number of keywords having a high frequency are extracted, and the extracted keywords are compared with a catchword index to derive a coword, and then subtract the derived coword. A subclass technical field derivation unit for deriving a technical field of a subclass with a code having a mode value matching the patent document information corresponding to the class IPC;
The text mining description matching the subclass IPC extracts a predetermined number of keywords having a high frequency, and compares the extracted keyword with a catchword index to derive a codeword and then classify the derived codeword. A class technical field derivation unit for deriving a technical field of a class having a codeword having a mode value matching the patent document information corresponding to the IPC;
The text mining description matching the class IPC extracts a predetermined number of keywords with a high frequency, compares the extracted keyword with a catchword index, derives a codeword, and then decodes the derived codeword. And a cluster technology field derivation unit for deriving a technology field of a cluster having a codeword matching the patent document information constituting the patent document information.
(a)특허 문헌을 권리유형에 따라 분류하고, 그 분류 결과를 IPC 코드의 유사도에 따라 클러스터링하는 단계;
(b)상기 클러스터링된 각 클러스터를 구성하고 있는 특허문헌의 IPC 비중이 미리 정해진 일정 비율 이상인 IPC를 클래스 IPC로 선별하고, 상기 클래스 IPC별로 최빈값을 갖는 IPC를 서브 클래스 IPC로 선별한 후, 상기 서브 클래스 IPC별로 최빈값을 갖는 IPC를 메인 그룹(Main Group) IPC로 선별하고, 상기 메인 그룹 IPC를 분석하여 복수개의 코워드를 추출 및 상기 추출된 코워드별 가중치를 적용하여 최빈값을 갖는 IPC 코드를 핵심 기술분류 코드로 도출하는, 각 계층별 기술분류 코드를 추출하는 단계;
(c)상기 추출된 각 계층별 기술 분류 코드를 텍스트 마이닝하여 코워드를 도출하는 단계;및
(d)상기 도출된 각 계층별 코워드를 상위 계층의 특허문헌정보와 각각 매칭하여 기술분야를 도출하는 단계;
를 포함하는 특허정보에 기반한 기술구조 분석 방법.
In the technical structure analysis server to analyze the technical structure based on the patent information,
(a) classifying the patent documents according to the type of rights and clustering the classification results according to the similarity of the IPC codes;
(b) classifying IPCs whose IPC specific gravity is greater than or equal to a predetermined ratio of the patent documents constituting the clustered clusters as class IPCs, and classifying IPCs having mode values for each class IPC as subclass IPCs; The IPC having a mode for each class IPC is selected as a main group IPC, the main group IPC is analyzed, a plurality of codes are extracted, and the weighted value of each extracted code is applied to core an IPC code having a mode. Extracting a technical classification code for each layer, which is derived as a technical classification code;
(c) text mining the extracted technical classification codes of each layer to derive a code; and
(d) deriving a technical field by matching the derived corridors of each layer with patent document information of an upper layer;
Technical structure analysis method based on the patent information, including.
상기 (d)단계 이후, 상기 도출된 기술분야와 IPC 분류 체계를 매칭시켜 기술구조를 도출하는 단계를 더 포함하는 특허정보에 기반한 기술구조 분석 방법.
10. The method of claim 9,
After the step (d), the technical structure analysis method based on patent information further comprising the step of deriving a technical structure by matching the derived technical field and IPC classification scheme.
상기 (a)단계 이전에, 특허문헌정보의 소스로부터 특허문헌을 수집하여 데이터베이스에 저장하는 단계를 더 포함하는 특허정보에 기반한 기술구조 분석 방법.
10. The method of claim 9,
Before the step (a), the method for analyzing the technical structure based on the patent information further comprising the step of collecting the patent document from the source of the patent document information and storing in the database.
상기 (c)단계는, 각 계층별 기술 분류 코드를 텍스트 마이닝하여 빈도수가 높은 미리 정해진 일정 개수의 키워드를 추출하는 단계;및
상기 추출된 키워드를 캐치워드 인덱스와 대조하여 코워드를 도출하는 단계;를 포함하는 특허정보에 기반한 기술구조 분석 방법.
10. The method of claim 9,
Step (c) may include: mining a predetermined number of keywords having a high frequency by text mining the technology classification code for each layer; and
And deriving a wordword by comparing the extracted keyword with a catchword index.
상기 (d)단계는, 각 계층별 코워드를 상위 계층의 특허문헌정보와 각각 매칭하여 최빈값을 갖는 코워드를 각 계층의 기술분야로 도출하는 것을 특징으로 하는 특허정보에 기반한 기술구조 분석 방법.
10. The method of claim 9,
In the step (d), the method of analyzing the technical structure based on the patent information, wherein a code having a mode value is derived to the technical field of each layer by matching the code of each layer with the patent document information of the upper layer, respectively.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100079367A KR101199527B1 (en) | 2010-08-17 | 2010-08-17 | System and Method of technology structure analysis based on patent information |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100079367A KR101199527B1 (en) | 2010-08-17 | 2010-08-17 | System and Method of technology structure analysis based on patent information |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120021789A KR20120021789A (en) | 2012-03-09 |
KR101199527B1 true KR101199527B1 (en) | 2012-11-09 |
Family
ID=46130020
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100079367A KR101199527B1 (en) | 2010-08-17 | 2010-08-17 | System and Method of technology structure analysis based on patent information |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101199527B1 (en) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101616544B1 (en) | 2014-03-03 | 2016-04-28 | 고려대학교 산학협력단 | Method for analyzing patent documents using a latent dirichlet allocation |
KR102221355B1 (en) * | 2020-07-27 | 2021-03-02 | 한국과학기술정보연구원 | Method and system for similarity evaluation of patent documents |
KR20220030002A (en) * | 2020-09-02 | 2022-03-10 | 최광석 | Terminal for providing patent searching and method of the same and server for providing patent searching and method of the same and patent searching system and mehod of the same |
KR20230141147A (en) | 2022-03-31 | 2023-10-10 | 서울대학교산학협력단 | Method and non-transitory computer-readable recording medium for classifying patent by technical field |
KR102593054B1 (en) * | 2022-05-09 | 2023-10-24 | 한국과학기술정보연구원 | Method and apparatus for evaluation of embedding model performance |
-
2010
- 2010-08-17 KR KR1020100079367A patent/KR101199527B1/en active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
KR20120021789A (en) | 2012-03-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110245981B (en) | Crowd type identification method based on mobile phone signaling data | |
Cantat-Gaudin et al. | Gaia DR2 unravels incompleteness of nearby cluster population: new open clusters in the direction of Perseus | |
Benfeldt Nielsen | A comprehensive review of data governance literature | |
KR101199527B1 (en) | System and Method of technology structure analysis based on patent information | |
CN102314519B (en) | Information searching method based on public security domain knowledge ontology model | |
CN107679160A (en) | Data processing method and device based on chart database | |
CN106294319A (en) | One is combined related cases recognition methods | |
CN104615734B (en) | A kind of community management service big data processing system and its processing method | |
Ho et al. | A data science approach to defining a data scientist | |
CN116384889A (en) | Intelligent analysis method for information big data based on natural language processing technology | |
CN116307566B (en) | Dynamic design system for large-scale building construction project construction organization scheme | |
CN111368515B (en) | Industry dynamic interactive report generation method and system based on PDF document fragmentation | |
CN105095436A (en) | Automatic modeling method for data of data sources | |
He et al. | Discovering strongly lensed quasar candidates with catalogue-based methods from DESI Legacy Surveys | |
KR20170030016A (en) | Method for analyzing promising technology using patent data | |
Mattas et al. | Agglomerative hierarchical clustering technique for partitioning patent dataset | |
AlShafeey et al. | Tech Mining Analysis: Renewable Energy Forecasting Using Artificial Intelligence Technologies | |
CN107577690B (en) | Recommendation method and recommendation device for mass information data | |
CN106503118B (en) | A kind of data acquisition system and its implementation based on HC-TABLE | |
KR101189068B1 (en) | System and Method on Navigating Niche Technological Areas Using Multi Dimensional Frame | |
Anongnart | Building Fexpert: System for searching experts in research university using K-MEANS algorithms | |
Barret et al. | Predicting the Environment of a Neighborhood: A Use Case for France. | |
Wei et al. | Knowledge discovering for document classification using tree matching in TEXPROS | |
Kumar et al. | Clustering and ranking social media users based on temporal analysis | |
Yusof et al. | MMCAR: Modified multi-class classification based on association rule |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20151102 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161005 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20170927 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20180809 Year of fee payment: 7 |