KR20100060734A - System for visualization of patent information by forming the keyword based semantic network and method therefor - Google Patents

System for visualization of patent information by forming the keyword based semantic network and method therefor Download PDF

Info

Publication number
KR20100060734A
KR20100060734A KR1020080119462A KR20080119462A KR20100060734A KR 20100060734 A KR20100060734 A KR 20100060734A KR 1020080119462 A KR1020080119462 A KR 1020080119462A KR 20080119462 A KR20080119462 A KR 20080119462A KR 20100060734 A KR20100060734 A KR 20100060734A
Authority
KR
South Korea
Prior art keywords
keyword
patent document
semantic network
unit
node
Prior art date
Application number
KR1020080119462A
Other languages
Korean (ko)
Other versions
KR101054824B1 (en
Inventor
박상찬
서종환
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020080119462A priority Critical patent/KR101054824B1/en
Publication of KR20100060734A publication Critical patent/KR20100060734A/en
Application granted granted Critical
Publication of KR101054824B1 publication Critical patent/KR101054824B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Abstract

PURPOSE: A patent information visualization system through a keyword semantic network configuration and a method thereof are provided to arrange a semantic network based on a time axis by building keywords of the semantic network. CONSTITUTION: A semantic network composing unit(300) sets a patent document group including the rest of keywords except for a common keyword as the lower node. A patent map constructing unit(400) searches patent application date of a patent document and the frequency included in patent document groups through the semantic network configuration unit about each node setting. The patent map constructing unit sets the frequency value and patent application date value as an arbitrary xy axis. The patent map constructing unit constructs a patent map by indicating the semantic network on a coordinate plane due to the xy value of each node.

Description

키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템 및 그 방법{SYSTEM FOR VISUALIZATION OF PATENT INFORMATION BY FORMING THE KEYWORD BASED SEMANTIC NETWORK AND METHOD THEREFOR}Patent information visualization system through keyword semantic network and its method {SYSTEM FOR VISUALIZATION OF PATENT INFORMATION BY FORMING THE KEYWORD BASED SEMANTIC NETWORK AND METHOD THEREFOR}

본 발명은 특허정보를 활용하여 기술의 동향을 파악하고 미래상을 예측하기 위한 분석 기술에 관한 것으로서, 더욱 상세하게는 키워드를 중심으로 특허정보를 시각화하는 특허정보 시각화 시스템 및 그 방법에 관한 것이다. The present invention relates to an analysis technology for grasping the trend of technology and predicting the future by using patent information, and more particularly, to a patent information visualization system and method for visualizing patent information based on keywords.

특허정보의 활용에 대한 연구는 크게 데이터 마이닝(Data Mining)을 적용하여 특허정보를 분석하는 것과, 특허정보와 분석결과를 시각화하는 방법에 대한 연구로 이루어지고 있다. 특히, 특허정보와 분석결과를 시각화하는 방법을 포괄적으로 특허맵이라고 하며, 기술의 발전이 급속하게 진행되고 개발비용이 증가함에 따라, 특허정보와 분석결과를 통해, 기술의 동향을 보다 쉽고 직관적으로 이해하고 미래상을 예측하도록 돕는 시각화방안은 필수적이며, 이에 대한 기술의 발명이 필요하다. The research on the utilization of patent information consists of analyzing the patent information by applying data mining and the method of visualizing the patent information and the analysis results. In particular, the method of visualizing patent information and analysis results is comprehensively referred to as a patent map. As technology advances rapidly and development costs increase, patent information and analysis results make it easier and more intuitive. Visualization to help understand and predict the future is essential, and the invention of the technology is required.

하지만, 현재의 특허맵은 몇 가지 단점을 지니고 있다. However, the current patent map has some disadvantages.

첫째, 특허정보는 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화 되지 않은 항목(청구항, 요약내용 등의 텍스트)으로 구성되는데, 현재 특허맵은 이중 어느 한쪽에 대한 내용만 반영하여, 균형 잡힌 특허분석과 시각화를 제공하지 못한다. First, the patent information consists of structured items (patent number, date of application, inventor, etc.) and unstructured items (text of claims, summary contents, etc.), and the current patent map reflects only one of the contents of It does not provide balanced patent analysis and visualization.

둘째, 대부분의 특허맵은 특허문서의 복잡한 네트워크로 조성되어있으며, 이는 결과적으로 특허정보를 통해 신기술의 발전상황과 미래상을 예측 할 수 있도록 하는 직관적인 시각을 제공하지 못한다.Secondly, most patent maps consist of a complex network of patent documents, which, as a result, do not provide an intuitive view to predict the development and future of new technologies through patent information.

본 발명은 상기와 같은 문제점을 감안하여 안출된 것으로, 기존의 특허맵과 달리, 특허정보의 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화 되지 않은 항목(청구항, 요약내용 등의 텍스트)을 모두 반영하여, 균형잡힌 특허분석과 시각화를 가능하게 하며, 키워드들의 시맨틱 네트워크(Semantic Network)를 구축하고, 이를 시간 축을 기준으로 정렬함으로써, 기술의 발전상황과 미래상을 보다 직관적으로 예측할 수 있는 시스템 및 그 방법을 제공함에 그 특징적인 목적이 있다. The present invention has been made in view of the above problems, unlike the existing patent map, structured items of patent information (patent number, application date, inventors, etc.) and unstructured items (claims, summary content, etc.) ), Which enables balanced patent analysis and visualization, constructs a semantic network of keywords, and sorts them on the time axis, so that technology development and future can be predicted more intuitively. Its purpose is to provide a system and a method thereof.

이러한 기술적 과제를 달성하기 위한 본 발명은 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템에 관한 것으로서, 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받아 특허문서를 검색하고, 검색된 특허문서상에 정의된 키워드를 추출한 후, 상기 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 키워드 추출부; 상기 키워드 추출부를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 특허문서 군집화부; 상기 특허문서 군집화부를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 시맨틱 네트워크 구성부; 상기 시맨틱 네트워크 구성부를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈 도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 특허맵 구축부; 를 포함하는 것을 특징으로 한다. The present invention for achieving the technical problem relates to a patent information visualization system by constructing a keyword semantic network, the user receives an initial keyword for searching a patent document in a specific technical field to search for a patent document, on the retrieved patent document A keyword extractor configured to extract a defined keyword and then combine the first keyword and the second keyword to form a keyword list; A patent document clustering unit configured to determine whether or not each of the keywords included in the keyword list is formed in a matrix and to cluster the patent documents with respect to the patent documents searched through the keyword extracting unit; Semantic network configuration for extracting common keywords among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit and setting them as new nodes, and setting patent document clusters including remaining keywords except common keywords as lower nodes. part; After retrieving the frequency count included in the clusters of patent documents and the patent application date of the patent document for each node set through the semantic network configuration unit, the frequency value and the patent application date value are set to arbitrary axes (x, y). A patent map constructing unit configured to establish a patent map by displaying the semantic network on the coordinate plane according to the x and y values of each node; Characterized in that it comprises a.

한편, 본 발명은 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 것으로서, (a) 상기 키워드 추출부가 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받고, 초기 키워드를 바탕으로 검색된 특허문서상에 정의된 제 2 키워드를 추출한 후, 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 과정; (b) 상기 특허문서 군집화부가 키워드 추출부를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 과정; (c) 상기 시맨틱 네트워크 구성부가 특허문서 군집화부를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 과정; 및 (d) 상기 특허맵 구축부가 시맨틱 네트워크 구성부를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시멘틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 과정; 을 포함하는 것을 특징으로 한다. Meanwhile, the present invention relates to a method for visualizing patent information by constructing a keyword semantic network. (A) The keyword extracting unit receives an initial keyword for searching a patent document in a specific technical field from a user, and searches for a patent based on the initial keyword. Extracting the second keyword defined on the document, and then integrating the first keyword and the second keyword to construct a keyword list; (b) a process of determining whether each of the keywords included in the keyword list is present in a matrix and clustering the patent documents with respect to the patent documents searched by the keyword extracting unit; (c) The semantic network component extracts a common keyword among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit, sets it as a new node, and subclasses a patent document cluster including remaining keywords except common keywords. Setting to a node; And (d) retrieving a frequency included in clusters of patent documents and a patent application date of a patent document for each node set through the semantic network configuration unit, and then obtaining a frequency value and a patent application date value. Establishing a patent map by setting the axes (x, y) and displaying the semantic network on the coordinate plane according to the x and y values of each node; Characterized in that it comprises a.

상기와 같은 본 발명에 따르면, 기존의 특허맵과 달리 특허정보의 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화되지 않은 항목(청구항, 요약내용 등의 텍스트)을 모두 반영하여, 균형 잡힌 특허분석과 시각화를 가능하게 한다. According to the present invention as described above, unlike the existing patent map, the balance by reflecting both the structured items of the patent information (patent number, application date, inventors, etc.) and unstructured items (claims, summaries, etc.) Enables captured patent analysis and visualization.

또한, 키워드들의 시맨틱 네트워크(Semantic Network)를 구축하고, 이를 시간 축을 기준으로 정렬하여, 정적인 특허정보 표현을 넘어 동적으로 특허정보를 표현해 주고, 보다 직관적으로 특허정보를 통해 신기술의 발전상황을 파악하고, 미래상을 예측할 수 있도록 한다. 이렇듯, 제안한 특허맵을 통해 서비스 산업 R&D를 위해 필수적인 신기술에 대한 직관적인 이해와 예측을 손쉬워 지며, 결과적으로 신기술 개발과 투자가 효과적으로 이루어지도록 하는데 기여할 수 있다.In addition, by building a semantic network of keywords and sorting them based on the time axis, expressing patent information dynamically beyond static patent information expression, and grasping the development of new technology through patent information more intuitively And predict the future. As such, the proposed patent map facilitates intuitive understanding and prediction of new technologies essential for service industry R & D, and consequently contributes to effective new technology development and investment.

본 발명의 구체적 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서 본 발명에 관련된 공지 기능 및 그 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 구체적인 설명을 생략하였음에 유의해야 할 것이다.Specific features and advantages of the present invention will become more apparent from the following detailed description based on the accompanying drawings. In the meantime, when it is determined that the detailed description of the known functions and configurations related to the present invention may unnecessarily obscure the subject matter of the present invention, it should be noted that the detailed description is omitted.

이하, 첨부된 도면을 참조하여 본 발명을 상세하게 설명한다. Hereinafter, with reference to the accompanying drawings will be described in detail the present invention.

본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템 및 그 방법에 관하여 도 1 내지 도 19 를 참조하여 설명하면 다음과 같다. Patent information visualization system and method through the keyword semantic network configuration according to the present invention will be described with reference to Figures 1 to 19 as follows.

이하의 설명을 통해 알 수 있겠으나, 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)은, 특허문서의 검색 및 해당 특허문서의 특허출원날짜 등을 검색하는 과정에서, 별도의 특허문서 DB(10)와 연동하여 검 색하는 것으로 이해하는 것이 바람직하다. As can be seen through the following description, the patent information visualization system (S) through the keyword semantic network configuration according to the present invention, in the process of searching for a patent document and the date of patent application of the patent document, etc. It is desirable to understand that the search in conjunction with the patent document DB (10).

도 1 은 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)(이하, '특허정보 시각화 시스템')을 개념적으로 도시한 구성도로서, 도시된 바와 같이 키워드 추출부(100), 특허문서 군집화부(200), 시맨틱 네트워크 구성부(300) 및 특허맵 구축부(400)를 포함하여 이루어진다. 1 is a block diagram conceptually showing a patent information visualization system S (hereinafter, referred to as a 'patent information visualization system') by constructing a keyword semantic network according to the present invention. As shown, the keyword extraction unit 100, Patent document clustering unit 200, the semantic network configuration unit 300 and a patent map construction unit 400 is made.

구체적으로, 키워드 추출부(100)는 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드(이하, '제 1 키워드')를 입력받아 특허문서를 검색하고, 검색된 특허문서상에 정의된 키워드(이하, '제 2 키워드')를 추출한 후, 상기 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 기능을 수행하는 바, 도 2 에 도시된 바와 같이 사용자 입력모듈(110), 특허문서 검색모듈(120), 키워드 추출모듈(130) 및 키워드 리스트 구성모듈(140)을 포함한다. In detail, the keyword extractor 100 searches for a patent document by receiving an initial keyword (hereinafter, referred to as 'first keyword') for searching a patent document in a specific technical field from a user, and searches for a keyword defined on the retrieved patent document (hereinafter referred to as “key keyword”). Extracts the second keyword, and then combines the first keyword and the second keyword to form a keyword list. As shown in FIG. 2, the user input module 110 and the patent document search are performed. Module 120, a keyword extraction module 130, and a keyword list construction module 140.

사용자 입력모듈(110)은 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는다. The user input module 110 receives a first keyword for searching a patent document related to a specific technical field from a user.

특허문서 검색모듈(120)은 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색한다.The patent document search module 120 is interlocked with a separate patent document DB (10) that can search for domestic and international patent documents, thereby searching for a predetermined number of patent documents using the first keyword.

키워드 추출모듈(130)은 상기 특허문서 검색모듈(120)을 통해 검색된 특허문서상에 정의된 출원 시의 키워드 즉, 특허 출원서에 기재된 색인어인 제 2 키워드를 추출한다. The keyword extraction module 130 extracts a keyword at the time of application defined on the patent document searched through the patent document search module 120, that is, a second keyword which is an index word described in the patent application.

키워드 리스트 구성모듈(140)은 상기 사용자 입력모듈(110)을 통해 사용자로 부터 입력받은 제 1 키워드와, 키워드 추출모듈(130)을 통해 추출한 제 2 키워드를 통합하여 키워드 리스트를 구성한다. The keyword list construction module 140 constructs a keyword list by combining the first keyword input from the user through the user input module 110 and the second keyword extracted through the keyword extraction module 130.

또한, 특허문서 군집화부(200)는 상기 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 기능을 수행하는 바, 도 3 에 도시된 바와 같이 매트릭스 구성모듈(210) 및 특허문서 군집화 모듈(220)을 포함한다. In addition, the patent document clustering unit 200 performs a function of clustering patent documents by determining whether each of the keywords included in the keyword list is present in the patent document searched through the keyword extraction unit 100. As shown in FIG. 3, the matrix configuration module 210 and the patent document clustering module 220 are included.

매트릭스 구성모듈(210)은 특허문서 검색모듈(120)을 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성한다. 이때, 도 4 에 도시된 바와 같이 해당 특허문서에 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기된다. 본 실시예에서, 검색된 특허문서(A,B,C,D)로 4개만을 설정하였으나, 본 발명이 이에 한정되지 않는다. The matrix configuration module 210 determines whether each of the keywords included in the keyword list is present in the matrix for each patent document searched through the patent document search module 120. In this case, as shown in FIG. 4, when the patent document appears, '1' is indicated and '0' when it does not appear. In the present embodiment, only four of the retrieved patent documents A, B, C, and D are set, but the present invention is not limited thereto.

특허문서 군집화 모듈(220)은 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 도 5 에 도시된 바와 같이 다수개의 특허문서 군집을 생성한다. The patent document clustering module 220 generates a plurality of patent document clusters as shown in FIG. 5 by repeatedly applying the k-mean algorithm whose attribute is the presence or absence value of each keyword to each patent document. .

참고로, k-mean 알고리즘이란, 일종의 클러스터링(clustering) 알고리즘으로서, 다수의 데이터가 잡다하게 분포를 이루고 있을 경우, 다수의 데이터가 어디에 많이 분포되어 있는지 알 수 있는 알고리즘을 의미한다. For reference, the k-mean algorithm is a kind of clustering algorithm. When a large number of data are miscellaneously distributed, the k-mean algorithm refers to an algorithm that knows where a large amount of data is distributed.

또한, 시맨틱 네트워크 구성부(300)는 상기 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 기능을 수행하는 바, 도 6 에 도시된 바와 같이 공통 키워드 추출모듈(310) 및 노드 설정모듈(320)을 포함한다.In addition, the semantic network configuration unit 300 extracts a common keyword among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit 200 and sets it as a new node, and sets the remaining keywords except common keywords. A function of setting a cluster of patent documents included as a lower node includes a common keyword extraction module 310 and a node setting module 320 as shown in FIG. 6.

공통 키워드 추출모듈(310)은 특허문서 군집화모듈(220)을 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출한다. 즉, 공통 키워드 추출모듈(310)은 도 7 에 도시된 바와 같이, 특허문서 군집 1(a,b,c) 과 특허문서 군집 2(c,d) 에 모두 포함된 공통 키워드 'c' 를 추출한다. The common keyword extraction module 310 extracts common keywords belonging to two or more patent document clusters from among keywords belonging to a plurality of patent document clusters generated through the patent document clustering module 220. That is, the common keyword extraction module 310 extracts the common keyword 'c' included in both the patent document group 1 (a, b, c) and the patent document group 2 (c, d), as shown in FIG. do.

노드 설정모듈(320)은 공통 키워드 추출모듈(310)을 통해 추출된 공통 키워드를 새로운 노드(이하, '제 1 노드')로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드로 설정한다. 즉, 노드 설정모듈(320)은 도 8 에 도시된 바와 같이 공통 키워드 'c' 를 제 1 노드로 설정하고, 공통 키워드 'c' 를 제외한 나머지 키워드들을 포함하는 특허문서 군집 1(a, b) 및 특허문서 군집 2(d) 를 각각 제 2 노드 및 제 3 노드로 설정한다.The node setting module 320 sets a common keyword extracted through the common keyword extraction module 310 as a new node (hereinafter, 'first node'), and draws a group of patent documents including the remaining keywords except for the common keyword. Set as a lower node. That is, the node setting module 320 sets the common keyword 'c' as the first node as shown in FIG. 8, and includes the patent document cluster 1 (a, b) including remaining keywords except the common keyword 'c'. And patent document group 2 (d) as the second node and the third node, respectively.

그리고, 특허맵 구축부(400)는 상기 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축하는 기능을 수행하는 바, 도 9 에 도시된 바와 같이 빈도수 설정모듈(410), 특허출원 날짜 설정모듈(420) 및 좌표값 설정모듈(430)을 포함한다. Then, the patent map building unit 400 retrieves the frequency included in the clusters of patent documents and the patent application date of the patent document for each node set through the semantic network configuration unit 300, and then the frequency value and the patent. By setting the application date value on an arbitrary axis (x, y) and displaying the semantic network on the coordinate plane according to the x, y value of each node, a function of constructing a patent map is shown. As described above, the frequency setting module 410 includes a patent application date setting module 420 and a coordinate value setting module 430.

빈도수 설정모듈(410)은 도 10 에 도시된 바와 같이 노드 설정모듈(320)을 통해 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수(Frequency) 값으로 설정한다. As shown in FIG. 10, the frequency setting module 410 calculates the number of times included in the plurality of patent document clusters with respect to keywords of each node set through the node setting module 320 as a frequency value. Set it.

특허출원 날짜 설정모듈(420)은 각 노드의 키워드들과 관련된 특허문서(A,B,C,D)들의 특허출원 날짜를 검색하고, 각 노드의 키워드가 포함된 특허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정한다. 즉, 도 11 에 도시된 바와 같이, 키워드 'c' 가 포함된 특허문서 A, B, C 중, 가장 빠른 특허출원 날짜를 갖는 'A' 의 특허출원 날짜가 제 1 노드의 특허출원 날짜 값으로 설정되며, 키워드 'a' 와 'b' 가 포함된 특허문서 A, B 중, 가장 빠른 특허출원 날짜를 갖는 'A' 의 특허출원 날짜가 제 2 노드의 특허출원 날짜 값으로 설정되며, 키워드 'd' 가 포함된 특허문서 C, D 중, 가장 빠른 특허출원 날짜를 갖는 'D' 의 특허출원 날짜가 제 3 노드의 특허출원 날짜 값으로 설정된다. The patent application date setting module 420 retrieves the patent application date of the patent documents (A, B, C, D) related to the keywords of each node, and among the patent documents including the keywords of each node, the fastest patent application The patent application date of the patent document with the date is set as the patent application date value of the node. That is, as shown in FIG. 11, of the patent documents A, B, and C including the keyword 'c', the patent application date of 'A' having the earliest patent application date is the patent application date value of the first node. The patent application date of 'A' having the earliest patent application date among the patent documents A and B including the keywords' a 'and' b 'is set as the patent application date value of the second node, and the keyword' Of the patent documents C and D including d ', the patent application date of' D 'having the earliest patent application date is set as the patent application date value of the third node.

좌표값 설정모듈(430)은 도 12 에 도시된 바와 같이 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축한다. 본 실시예에서, 각 노드의 빈도수 값을 y축으로, 특허출원 날짜 값을 x축으로 설정하였으나, 본 발명이 이에 한정되는 것은 아니다. As shown in FIG. 12, the coordinate value setting module 430 sets frequency values and patent application date values of each node to an arbitrary axis (x, y) in the coordinates of the nodes, respectively. Accordingly, the patent map is constructed by displaying the semantic network on the coordinate plane. In this embodiment, the frequency value of each node is set as the y-axis and the patent application date value is set as the x-axis, but the present invention is not limited thereto.

도 13 은 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 시맨틱 네트워크가 적용된 모습을 보여주는 일예시도이며, 도 14 는 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 최종적인 특허맵이 적용된 모습을 보여주는 일예시도이다.FIG. 13 is an exemplary view showing a semantic network according to the present invention with respect to ubiquitous computing technology, and FIG. 14 is an exemplary view showing a final patent map according to the present invention with respect to ubiquitous computing technology. to be.

상술한 키워드 추출부(100), 특허문서 군집화부(200), 시맨틱 네트워크 구성부(300) 및 특허맵 구축부(400)로 구성된 특허정보 시각화 시스템(S)을 이용한 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관하여 설명하면 다음과 같다. Patent through the keyword semantic network configuration using the patent information visualization system (S) consisting of the keyword extraction unit 100, the patent document clustering unit 200, the semantic network configuration unit 300 and the patent map construction unit 400 described above The information visualization method is as follows.

도 15 는 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 전체 흐름도로서, 도시된 바와 같이 키워드 추출부(100)가 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받고, 초기 키워드를 바탕으로 검색된 특허문서상에 정의된 제 2 키워드를 추출한 후, 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 제 1 과정(S100), 특허문서 군집화부(200)가 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 제 2 과정(S200), 시맨틱 네트워크 구성부(300)가 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 제 3 과정(S300), 및 특허맵 구축부(400)가 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시멘틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 과정(S400)을 포함하여 이루어진다. FIG. 15 is a flowchart illustrating a method for visualizing patent information by constructing a keyword semantic network according to the present invention. As illustrated, the keyword extractor 100 receives an initial keyword for searching a patent document in a specific technical field from a user. After extracting the second keyword defined on the searched patent document based on the initial keyword, the first step (S100) of constructing a keyword list by combining the first keyword and the second keyword, the patent document clustering unit 200 is a keyword For the patent documents searched through the extraction unit 100, the second process (S200) and the semantic network configuration unit 300 determine whether each of the keywords included in the keyword list are formed in a matrix, and cluster the patent documents. The patent document clustering unit 200 extracts a common keyword among the keywords belonging to the plurality of patent document clusters created by the new node. And a third process (S300) of setting a patent document cluster including remaining keywords except common keywords as lower nodes, and the patent map construction unit 400 for each node set through the semantic network configuration unit 300. After retrieving the frequency included in the patent document clusters and the patent application date of the patent document, the frequency value and the patent application date value are set to arbitrary axes (x, y), and according to the x and y values of each node. And a process of constructing a patent map by displaying the semantic network on a coordinate plane (S400).

도 16 은 본 발명에 따른 제 1 과정(S100)에 관한 세부 흐름도로서, 도시된 바와 같이, 키워드 추출부(100)의 사용자 입력모듈(110)은 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는다(S110).FIG. 16 is a detailed flowchart of a first process S100 according to the present invention. As shown in the drawing, the user input module 110 of the keyword extractor 100 may search for a patent document related to a specific technical field from a user. The first keyword is input (S110).

이후, 특허문서 검색모듈(120)은 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색한다(S120).Subsequently, the patent document search module 120 interworks with a separate patent document DB 10 capable of searching for domestic and foreign patent documents, thereby searching for a predetermined number of patent documents using the first keyword (S120).

또한, 키워드 추출모듈(130)은 상기 특허문서 검색모듈(120)을 통해 검색된 특허문서상에 정의된 출원 시의 키워드 즉, 특허 출원서에 기재된 색인어인 제 2 키워드를 추출한다(S130).In addition, the keyword extraction module 130 extracts a keyword at the time of application defined on the patent document searched through the patent document search module 120, that is, a second keyword which is an index word described in the patent application (S130).

그리고, 키워드 리스트 구성모듈(140)은 상기 사용자 입력모듈(110)을 통해 사용자로부터 입력받은 제 1 키워드와, 키워드 추출모듈(130)을 통해 추출한 제 2 키워드를 통합하여 키워드 리스트를 구성한다(S140).The keyword list construction module 140 constructs a keyword list by combining the first keyword input from the user through the user input module 110 and the second keyword extracted through the keyword extraction module 130 (S140). ).

도 17 은 본 발명에 따른 제 2 과정(S200)에 관한 세부 흐름도로서, 도시된 바와 같이 특허문서 군집화부(200)의 매트릭스 구성모듈(210)은 특허문서 검색모듈(120)을 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각 각의 출현 여부를 판단함으로써, 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기하는 매트릭스로 구성한다(S210).FIG. 17 is a detailed flowchart of a second process (S200) according to the present invention. As shown, the matrix configuration module 210 of the patent document clustering unit 200 is a patent document search module 120. By determining whether each of the keywords included in the keyword list is present, the document is constituted by a matrix represented by '1' when it appears and '0' when it does not appear (S210).

이후, 특허문서 군집화 모듈(220)은 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 다수개의 특허문서 군집을 생성한다(S220).Subsequently, the patent document clustering module 220 generates a plurality of patent document clusters by repeatedly applying a k-mean algorithm whose attribute is the presence or absence value of each keyword to each patent document (S220).

도 18 은 본 발명에 따른 제 3 과정(S300)에 관한 세부 흐름도로서, 도시된 바와 같이 시맨틱 네트워크 구성부(300)의 공통 키워드 추출모듈(310)은 특허문서 군집화모듈(220)을 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출한다(S310).18 is a detailed flowchart of a third process (S300) according to the present invention. As shown, the common keyword extraction module 310 of the semantic network configuration unit 300 is generated through the patent document clustering module 220. Among keywords belonging to a plurality of patent document clusters, a common keyword belonging to two or more patent document clusters is extracted (S310).

이후, 노드 설정모듈(320)은 공통 키워드 추출모듈(310)을 통해 추출된 공통 키워드를 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드들로 설정한다(S320).Thereafter, the node setting module 320 sets the common keyword extracted through the common keyword extraction module 310 as a new node, and sets a cluster of patent documents including the remaining keywords except the common keyword as its lower nodes. S320).

도 19 는 본 발명에 따른 제 4 과정(S400)에 관한 세부 흐름도로서, 도시된 바와 같이 특허맵 구축부(400)의 빈도수 설정모듈(410)은 노드 설정모듈(320)을 통해 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수(Frequency) 값으로 설정한다(S410).19 is a detailed flowchart of a fourth process (S400) according to the present invention. As shown, the frequency setting module 410 of the patent map building unit 400 is configured for each node set through the node setting module 320. For the keywords, the number of times included in the plurality of patent document clusters is calculated and set to a frequency value (S410).

이후, 특허출원 날짜 설정모듈(420)은 각 노드의 키워드들과 관련된 특허문서(A,B,C,D)들의 특허출원 날짜를 검색하고(S420), 각 노드의 키워드가 포함된 특 허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정한다(S430).Then, the patent application date setting module 420 retrieves the patent application date of the patent documents (A, B, C, D) associated with the keywords of each node (S420), the patent document containing the keywords of each node Of these, the patent application date of the patent document having the earliest patent application date is set to the patent application date value of the node (S430).

그리고, 좌표값 설정모듈(430)은 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축한다(S440).The coordinate value setting module 430 sets the frequency value and the patent application date value of each node to an arbitrary axis (x, y) on the node coordinates, and coordinates the semantic network according to each node x and y value. By displaying on a plane, a patent map is constructed (S440).

이상으로 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구성 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서, 그러한 모든 적절한 변경 및 수정과 균등물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다. As described above and described with reference to a preferred embodiment for illustrating the technical idea of the present invention, the present invention is not limited to the configuration and operation as shown and described as described above, it is a deviation from the scope of the technical idea It will be understood by those skilled in the art that many modifications and variations can be made to the invention without departing from the scope of the invention. Accordingly, all such suitable changes and modifications and equivalents should be considered to be within the scope of the present invention.

도 1 은 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)을 개념적으로 도시한 구성도.1 is a block diagram conceptually showing a patent information visualization system (S) through the keyword semantic network configuration in accordance with the present invention.

도 2 는 본 발명에 따른 키워드 추출부(100)에 관한 세부 구성도. 2 is a detailed block diagram of a keyword extracting unit 100 according to the present invention.

도 3 은 본 발명에 따른 특허문서 군집화부(200)에 관한 세부 구성도. Figure 3 is a detailed configuration of the patent document clustering unit 200 according to the present invention.

도 4 는 본 발명에 따른 키워드 리스트에 구성된 키워드 각각의 출현 여부를 매트릭스로 나타내는 일예시도. Figure 4 is an exemplary view showing in a matrix whether each of the keywords configured in the keyword list according to the present invention.

도 5 는 본 발명에 따른 특허문서 군집을 나타내는 일예시도. 5 is an exemplary view showing a group of patent documents according to the present invention.

도 6 은 본 발명에 따른 시맨틱 네트워크 구성부(300)에 관한 세부 구성도.6 is a detailed configuration diagram of the semantic network configuration unit 300 according to the present invention.

도 7 은 본 발명에 따른 다수개의 특허문서 군집에 모두 포함된 공통 키워드를 추출하는 모습을 나타내는 일예시도. 7 is an exemplary view illustrating a state in which a common keyword included in all of a plurality of patent document clusters according to the present invention is extracted.

도 8 은 본 발명에 따른 공통 키워드 및 나머지 키워드들을 포함하는 특허문서 군집을 노드로 설정하는 모습을 나타내는 일예시도. 8 is an exemplary view illustrating a state in which a cluster of patent documents including a common keyword and remaining keywords according to the present invention is set as a node.

도 9 는 본 발명에 따른 특허맵 구축부(400)에 관한 세부 구성도.9 is a detailed configuration diagram of a patent map construction unit 400 according to the present invention.

도 10 은 본 발명에 따른 각 노드에 빈도수 값을 나타내는 일예시도. 10 is an exemplary view showing a frequency value at each node according to the present invention.

도 11 은 본 발명에 따른 각 노드에 특허출원 날짜를 나타내는 일예시도.11 is an exemplary view showing a patent application date in each node according to the present invention.

도 12 는 본 발명에 따른 최종 구축된 특허맵을 나타내는 일예시도. 12 is an exemplary view showing a final constructed patent map according to the present invention.

도 13 은 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 시맨틱 네트워크가 적용된 모습을 보여주는 일예시도. 13 is an exemplary view showing a semantic network according to the present invention applied to a ubiquitous computing technology.

도 14 는 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 최종적인 특허맵 이 적용된 모습을 보여주는 일예시도.14 is an exemplary view showing a final patent map applied to the ubiquitous computing technology according to the present invention.

도 15 는 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 전체 흐름도.15 is a flowchart illustrating a patent information visualization method through constructing a keyword semantic network according to the present invention.

도 16 은 본 발명에 따른 제 1 과정(S100)에 관한 세부 흐름도. 16 is a detailed flowchart relating to a first process S100 according to the present invention.

도 17 은 본 발명에 따른 제 2 과정(S200)에 관한 세부 흐름도. 17 is a detailed flowchart of a second process (S200) according to the present invention.

도 18 은 본 발명에 따른 제 3 과정(S300)에 관한 세부 흐름도.18 is a detailed flowchart of a third process (S300) according to the present invention.

도 19 는 본 발명에 따른 제 4 과정(S400)에 관한 세부 흐름도.19 is a detailed flowchart of a fourth process (S400) according to the present invention.

** 도면의 주요 부분에 대한 부호의 설명 **** Description of symbols for the main parts of the drawing **

100: 키워드 추출부 200: 특허문서 군집화부100: keyword extraction unit 200: patent document clustering unit

300: 시맨틱 네트워크 구성부 400: 특허맵 구축부300: semantic network configuration unit 400: patent map construction unit

110: 사용자 입력모듈 120: 특허문서 검색모듈110: user input module 120: patent document search module

130: 키워드 추출모듈 140: 키워드 리스트 구성모듈130: keyword extraction module 140: keyword list configuration module

210: 매트릭스 구성모듈 220: 특허문서 군집화 모듈210: matrix configuration module 220: patent document clustering module

310: 공통 키워드 추출모듈 320: 노드 설정모듈310: common keyword extraction module 320: node configuration module

410: 빈도수 설정모듈 420: 특허출원 날짜 설정모듈410: frequency setting module 420: patent application date setting module

430: 좌표값 설정모듈 10: 특허문서 DB430: coordinate value setting module 10: patent document DB

Claims (13)

키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)에 있어서,In the patent information visualization system (S) through the keyword semantic network configuration, 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드(이하, '제 1 키워드')를 입력받아 특허문서를 검색하고, 검색된 특허문서상에 정의된 키워드(이하, '제 2 키워드')를 추출한 후, 상기 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 키워드 추출부(100); Search the patent document by receiving the initial keyword (hereinafter referred to as 'first keyword') for the patent document search in a specific technical field from the user, and extract the keyword (hereinafter referred to as 'second keyword') defined on the searched patent document. A keyword extracting unit (100) configured to form a keyword list by integrating the first keyword and the second keyword; 상기 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 특허문서 군집화부(200); A patent document clustering unit (200) configured to determine whether each of the keywords included in the keyword list is formed in a matrix, and to cluster the patent documents with respect to the patent documents searched through the keyword extraction unit (100); 상기 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 시맨틱 네트워크 구성부(300);Extract a common keyword among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit 200 and set it as a new node, and set a patent document cluster including remaining keywords except common keywords as a lower node. A semantic network configuration unit 300; 상기 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 특허맵 구축부(400); 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.After retrieving the frequency included in the clusters of patent documents and the patent application date of the patent document for each node set through the semantic network configuration unit 300, the frequency value and the patent application date value are set to a random axis (x, a patent map constructing unit 400 configured to set y) and constructing a patent map by displaying the semantic network on the coordinate plane according to the x and y values of each node; Patent information visualization system through the keyword semantic network configuration comprising a. 제 1 항에 있어서,The method of claim 1, 상기 키워드 추출부(100)는, The keyword extraction unit 100, 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는 사용자 입력모듈(110); A user input module 110 for receiving a first keyword for searching a patent document related to a specific technical field from a user; 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색하는 특허문서 검색모듈(120);A patent document search module 120 for searching a predetermined number of patent documents using the first keyword by interworking with a separate patent document DB 10 capable of searching domestic and foreign patent documents; 상기 특허문서 검색모듈(120)을 통해 검색된 특허문서상에 정의된 출원 시의 키워드인 특허 출원서에 기재된 색인어(이하, '제 2 키워드')를 추출하는 키워드 추출모듈(130); 및A keyword extraction module 130 for extracting an index word (hereinafter, “second keyword”) described in a patent application, which is a keyword at the time of application defined on a patent document searched through the patent document search module 120; And 상기 사용자 입력모듈(110)을 통해 사용자로부터 입력받은 제 1 키워드와, 상기 키워드 추출모듈(130)을 통해 추출한 제 2 키워드를 통합하여 키워드 리스트를 구성하는 키워드 리스트 구성모듈(140); 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.A keyword list construction module 140 for constructing a keyword list by integrating a first keyword input from a user through the user input module 110 and a second keyword extracted through the keyword extraction module 130; Patent information visualization system through the keyword semantic network configuration comprising a. 제 1 항에 있어서,The method of claim 1, 상기 특허문서 군집화부(200)는, The patent document clustering unit 200, 상기 키워드 추출부(100)를 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하는 매트릭스 구성모듈(210); 및 A matrix configuration module 210 for each patent document searched through the keyword extraction unit 100 to determine whether each of the keywords included in the keyword list is present or to form a matrix; And 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 다수개의 특허문서 군집을 생성하는 특허문서 군집화 모듈(220); 을 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.A patent document clustering module (220) for generating a plurality of patent document clusters by repeatedly applying a k-mean algorithm having an attribute of whether each keyword appears or not for each patent document; Patent information visualization system through the keyword semantic network configuration comprising a. 제 3 항에 있어서,The method of claim 3, wherein 상기 매트릭스 구성모듈(220)은, 상기 키워드 리스트에 구성된 각각의 키워드가 해당 특허문서에 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.The matrix configuration module 220, when each keyword configured in the keyword list appears in the corresponding patent document '1', if not appeared patent through the keyword semantic network configuration, characterized in that Information visualization system. 제 1 항에 있어서,The method of claim 1, 상기 시맨틱 네트워크 구성부(300)는, The semantic network configuration unit 300, 상기 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출하는 공통 키워드 추출모듈(310); 및 A common keyword extraction module 310 for extracting a common keyword belonging to two or more patent document clusters among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit 200; And 상기 공통 키워드 추출모듈(310)을 통해 추출된 공통 키워드를 새로운 노드(이하, '제 1 노드')로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드로 설정하는 노드 설정모듈(320); 을 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.A node that sets a common keyword extracted through the common keyword extraction module 310 as a new node (hereinafter, 'first node') and sets a group of patent documents including remaining keywords except common keywords as its lower nodes. Setting module 320; Patent information visualization system through the keyword semantic network configuration comprising a. 제 1 항에 있어서,The method of claim 1, 상기 특허맵 구축부(400)는, The patent map construction unit 400, 상기 시맨틱 네트워크 구성부(300)을 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수 값으로 설정하는 빈도수 설정모듈(410); A frequency setting module 410 for setting the semantic network configuration unit 300 to a frequency value by calculating a number of times included in a plurality of patent document clusters with respect to keywords of each node; 각 노드의 키워드들과 관련된 특허문서들의 특허출원 날짜를 검색하고, 각 노드의 키워드가 포함된 특허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정하는 특허출원 날짜 설정모듈(420); 및 Search the patent application date of the patent documents related to the keywords of each node, and the patent application date of the patent document having the earliest patent application date among the patent documents including the keyword of each node, and the patent application date value of the node. Patent application date setting module 420 to be set to; And 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축하는 좌표값 설정모듈(430); 을 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.The patent map is constructed by setting the frequency value of each node and the date of patent application on an arbitrary axis (x, y) in the coordinates of the nodes, and displaying the semantic network on the coordinate plane according to each node x, y value. Coordinate value setting module 430; Patent information visualization system through the keyword semantic network configuration comprising a. 제 6 항에 있어서,The method of claim 6, 상기 좌표값 설정모듈(430)은, 각 노드의 빈도수 값을 y축으로, 특허출원 날짜 값을 x축으로 설정하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템.The coordinate value setting module 430 sets the frequency value of each node on the y-axis and the patent application date value on the x-axis. 키워드 추출부(100), 특허문서 군집화부(200), 시맨틱 네트워크 구성부(300) 및 특허맵 구축부(400)로 구성된 특허정보 시각화 시스템(S)을 이용한 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 있어서,Patent information visualization through the keyword semantic network configuration using the patent information visualization system (S) consisting of the keyword extraction unit 100, patent document clustering unit 200, semantic network configuration unit 300 and patent map construction unit 400 In the method, (a) 상기 키워드 추출부(100)가 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받고, 초기 키워드를 바탕으로 검색된 특허문서상에 정의된 제 2 키워드를 추출한 후, 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 과정(S100);(a) The keyword extracting unit 100 receives an initial keyword for searching a patent document in a specific technical field from a user, extracts a second keyword defined on the searched patent document based on the initial keyword, and then extracts the first keyword and Integrating the second keyword to construct a keyword list (S100); (b) 상기 특허문서 군집화부(200)가 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 과정(S200);(b) the process of the patent document clustering unit 200 forming a matrix by determining whether each of the keywords included in the keyword list is present in the patent document searched through the keyword extracting unit 100, and clustering the patent documents ( S200); (c) 상기 시맨틱 네트워크 구성부(300)가 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집 을 하위 노드로 설정하는 과정(S300); 및 (c) The semantic network configuration unit 300 extracts a common keyword among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit 200 and sets it as a new node, and remaining keywords except common keywords. Setting a cluster of patent documents including a lower node (S300); And (d) 상기 특허맵 구축부(400)가 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시멘틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 과정; 을 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법.(d) After the patent map construction unit 400 searches for frequencies included in clusters of patent documents and patent application dates of patent documents for each node set through the semantic network configuration unit 300, the frequency values and Constructing a patent map by setting a patent application date value on an arbitrary axis (x, y) and displaying a semantic network on a coordinate plane according to the x and y values of each node; Patent information visualization method through the keyword semantic network configuration comprising a. 제 8 항에 있어서,The method of claim 8, 상기 (a) 과정은, The (a) process, (a-1) 상기 키워드 추출부(100)가 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는 단계;(a-1) receiving, by the keyword extracting unit, a first keyword for searching a patent document related to a specific technical field from a user; (a-2) 상기 키워드 추출부(100)가 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색하는 단계; (a-2) searching for a predetermined number of patent documents using the first keyword by interworking with the separate patent document DB 10 in which the keyword extracting unit 100 can search for domestic and international patent documents; (a-3) 상기 키워드 추출부(100)가 상기 (a-2) 단계를 통해 검색된 특허문서상에 정의된 출원 시의 키워드인 제 2 키워드를 추출하는 단계; 및 (a-3) the keyword extracting unit 100 extracting a second keyword which is a keyword at the time of application defined on the patent document searched through the step (a-2); And (a-4) 상기 키워드 추출부(100)가 상기 (a-1) 단계를 통해 사용자로부터 입력받은 제 1 키워드와, 상기 (a-3) 단계를 통해 추출한 제 2 키워드를 통합하여 키 워드 리스트를 구성하는 단계; 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법.(a-4) The keyword extraction unit 100 combines the first keyword input from the user through the step (a-1) and the second keyword extracted through the step (a-3) to combine the keyword list. Configuring a; Patent information visualization method through the keyword semantic network configuration comprising a. 제 8 항에 있어서,The method of claim 8, 상기 (b) 과정은, Step (b) is, (b-1) 상기 특허문서 군집화부(200)가 상기 키워드 추출부(100)를 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하는 단계; 및 (b-1) determining, by the patent document clustering unit 200, whether each of the keywords included in the keyword list appears for each patent document searched through the keyword extracting unit 100 and forming a matrix; And (b-2) 상기 특허문서 군집화부(200)가 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 다수개의 특허문서 군집을 생성하는 단계; 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법.(b-2) the patent document clustering unit 200 generating a plurality of patent document clusters by repeatedly applying a k-mean algorithm having an attribute of whether each keyword appears as an attribute to each patent document; ; Patent information visualization method through the keyword semantic network configuration comprising a. 제 8 항에 있어서,The method of claim 8, 상기 (c) 과정은, Step (c) is, (c-1) 상기 시맨틱 네트워크 구성부(300)가 특허문서 군집화부(200)을 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출하는 단계; 및 (c-1) the semantic network configuration unit 300 extracting a common keyword belonging to two or more patent document clusters from among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit 200; ; And (c-2) 상기 시맨틱 네트워크 구성부(300)가 상기 (c-1) 단계를 통해 추출된 공통 키워드를 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드들로 설정하는 단계; 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법.(c-2) The semantic network configuration unit 300 sets the common keyword extracted through the step (c-1) as a new node, and subordinates the patent document cluster including the remaining keywords except the common keyword. Setting up a network; Patent information visualization method through the keyword semantic network configuration comprising a. 제 8 항에 있어서,The method of claim 8, 상기 (d) 과정은, (D) process, (d-1) 상기 특허맵 구축부(400)가 상기 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수 값으로 설정하는 단계;(d-1) The patent map constructing unit 400 calculates the number of times included in the plurality of patent document clusters for the keywords of each node set through the semantic network constructing unit 300, and sets the frequency value. Making; (d-2) 상기 특허맵 구축부(400)가 각 노드의 키워드들과 관련된 특허문서들의 특허출원 날짜를 검색하고, 각 노드의 키워드가 포함된 특허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정하는 단계; 및 (d-2) The patent map construction unit 400 searches for patent application dates of patent documents related to keywords of each node, and has the earliest patent application date among patent documents including keywords of each node. Setting a patent application date of the document to a patent application date value of the node; And (d-3) 상기 특허맵 구축부(400)가 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축하는 단계; 를 포함하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법.(d-3) The patent map construction unit 400 sets frequency values and patent application date values of each node to an arbitrary axis (x, y) in the coordinates of the nodes, respectively, and according to each node x and y value. Constructing a patent map by displaying the semantic network on a coordinate plane; Patent information visualization method through the keyword semantic network configuration comprising a. 제 10 항에 있어서,The method of claim 10, 상기 (b-1) 단계에서, 상기 특허문서 군집화부(200)가 키워드 리스트에 구성된 각각의 키워드가 해당 특허문서에 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기하는 것을 특징으로 하는 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법. In the step (b-1), the patent document clustering unit 200 marks each keyword configured in the keyword list as '1' when it appears in the patent document and '0' when it does not appear. Patent information visualization method by constructing a keyword semantic network.
KR1020080119462A 2008-11-28 2008-11-28 Patent Information Visualization System and Method Using Keyword Semantic Network KR101054824B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080119462A KR101054824B1 (en) 2008-11-28 2008-11-28 Patent Information Visualization System and Method Using Keyword Semantic Network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080119462A KR101054824B1 (en) 2008-11-28 2008-11-28 Patent Information Visualization System and Method Using Keyword Semantic Network

Publications (2)

Publication Number Publication Date
KR20100060734A true KR20100060734A (en) 2010-06-07
KR101054824B1 KR101054824B1 (en) 2011-08-05

Family

ID=42361615

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080119462A KR101054824B1 (en) 2008-11-28 2008-11-28 Patent Information Visualization System and Method Using Keyword Semantic Network

Country Status (1)

Country Link
KR (1) KR101054824B1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101268503B1 (en) * 2011-04-29 2013-06-04 포항공과대학교 산학협력단 Method and its system for generation of patent maps
KR101292663B1 (en) * 2012-02-06 2013-08-13 한국과학기술정보연구원 System and method on emerging technology product portfolio generation based on firm's technology capability
KR101327514B1 (en) * 2011-07-28 2013-11-08 포항공과대학교 산학협력단 System for patent network analysis using semantic patent similarity and method using the same
CN106446129A (en) * 2016-09-19 2017-02-22 合肥清浊信息科技有限公司 Patent data analysis system
KR102029916B1 (en) * 2018-03-30 2019-10-08 주식회사 디 파트너스 Intellectual property right document based bigdata analyzing method for design material search
CN111767719A (en) * 2020-06-29 2020-10-13 北京百度网讯科技有限公司 Bibliographic generation method and device, computer system and readable storage medium
CN113688209A (en) * 2021-09-01 2021-11-23 江苏省城市规划设计研究院有限公司 Text semantic network construction method by adjusting dependency relationship of keywords

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104199809A (en) * 2014-04-24 2014-12-10 江苏大学 Semantic representation method for patent text vectors
KR20170030016A (en) 2016-05-09 2017-03-16 한국지질자원연구원 Method for analyzing promising technology using patent data

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100501244B1 (en) * 2002-05-30 2005-07-18 재단법인서울대학교산학협력재단 Method for Producing Patent Map and The System
KR20050034458A (en) * 2003-10-09 2005-04-14 엘지전자 주식회사 Information search system and method for display searched information
BRPI0515687A (en) * 2004-09-14 2008-07-29 Intellectual Property Bank device, program, and drawing method for the diagrammatic relationship of documents in chronological order
KR100816934B1 (en) * 2006-04-13 2008-03-26 엘지전자 주식회사 Clustering system and method using search result document

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101268503B1 (en) * 2011-04-29 2013-06-04 포항공과대학교 산학협력단 Method and its system for generation of patent maps
KR101327514B1 (en) * 2011-07-28 2013-11-08 포항공과대학교 산학협력단 System for patent network analysis using semantic patent similarity and method using the same
KR101292663B1 (en) * 2012-02-06 2013-08-13 한국과학기술정보연구원 System and method on emerging technology product portfolio generation based on firm's technology capability
CN106446129A (en) * 2016-09-19 2017-02-22 合肥清浊信息科技有限公司 Patent data analysis system
KR102029916B1 (en) * 2018-03-30 2019-10-08 주식회사 디 파트너스 Intellectual property right document based bigdata analyzing method for design material search
CN111767719A (en) * 2020-06-29 2020-10-13 北京百度网讯科技有限公司 Bibliographic generation method and device, computer system and readable storage medium
CN111767719B (en) * 2020-06-29 2023-08-22 北京百度网讯科技有限公司 Method and device for generating title, computer system and readable storage medium
CN113688209A (en) * 2021-09-01 2021-11-23 江苏省城市规划设计研究院有限公司 Text semantic network construction method by adjusting dependency relationship of keywords
CN113688209B (en) * 2021-09-01 2023-08-25 江苏省城市规划设计研究院有限公司 Text semantic network construction method by adjusting keyword dependency relationship

Also Published As

Publication number Publication date
KR101054824B1 (en) 2011-08-05

Similar Documents

Publication Publication Date Title
KR101054824B1 (en) Patent Information Visualization System and Method Using Keyword Semantic Network
Crescenzi et al. Clustering web pages based on their structure
JP5092165B2 (en) Data construction method and system
CN111460311A (en) Search processing method, device and equipment based on dictionary tree and storage medium
JP2009080624A (en) Information display device, method and program
JP2009104591A (en) Web document clustering method and system
KR20080028574A (en) Integrated search service system and method
JP5588811B2 (en) Data analysis support system and method
CN104077337B (en) Searching method and device
CN109144964A (en) log analysis method and device based on machine learning
CN110321446B (en) Related data recommendation method and device, computer equipment and storage medium
JP2019204246A (en) Learning data creation method and learning data creation device
JP5324677B2 (en) Similar document search support device and similar document search support program
CN115204889A (en) Text processing method and device, computer equipment and storage medium
CN110874366A (en) Data processing and query method and device
JP2009093556A (en) Index construction method, document retrieval apparatus and index construction program
JP2013030089A (en) Document retrieval system and document retrieval program
JP2012123675A (en) Method and system for extracting system component
JP2011100208A (en) Action estimation device, action estimation method, and action estimation program
CN113821514A (en) Data splitting method and device, electronic equipment and readable storage medium
JP5184987B2 (en) Index information creating apparatus, index information creating method and program
JP4525224B2 (en) Document management program, document management method, and document management apparatus
JP2007026116A (en) Concept search system and concept search method
JP6455087B2 (en) Form information processing program, form information processing apparatus, and form information processing method
KR101526312B1 (en) System and method for packaging research and development information services on pending national issues

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140724

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee