KR20100060734A - System for visualization of patent information by forming the keyword based semantic network and method therefor - Google Patents
System for visualization of patent information by forming the keyword based semantic network and method therefor Download PDFInfo
- Publication number
- KR20100060734A KR20100060734A KR1020080119462A KR20080119462A KR20100060734A KR 20100060734 A KR20100060734 A KR 20100060734A KR 1020080119462 A KR1020080119462 A KR 1020080119462A KR 20080119462 A KR20080119462 A KR 20080119462A KR 20100060734 A KR20100060734 A KR 20100060734A
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- patent document
- semantic network
- unit
- node
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/11—Patent retrieval
Abstract
Description
본 발명은 특허정보를 활용하여 기술의 동향을 파악하고 미래상을 예측하기 위한 분석 기술에 관한 것으로서, 더욱 상세하게는 키워드를 중심으로 특허정보를 시각화하는 특허정보 시각화 시스템 및 그 방법에 관한 것이다. The present invention relates to an analysis technology for grasping the trend of technology and predicting the future by using patent information, and more particularly, to a patent information visualization system and method for visualizing patent information based on keywords.
특허정보의 활용에 대한 연구는 크게 데이터 마이닝(Data Mining)을 적용하여 특허정보를 분석하는 것과, 특허정보와 분석결과를 시각화하는 방법에 대한 연구로 이루어지고 있다. 특히, 특허정보와 분석결과를 시각화하는 방법을 포괄적으로 특허맵이라고 하며, 기술의 발전이 급속하게 진행되고 개발비용이 증가함에 따라, 특허정보와 분석결과를 통해, 기술의 동향을 보다 쉽고 직관적으로 이해하고 미래상을 예측하도록 돕는 시각화방안은 필수적이며, 이에 대한 기술의 발명이 필요하다. The research on the utilization of patent information consists of analyzing the patent information by applying data mining and the method of visualizing the patent information and the analysis results. In particular, the method of visualizing patent information and analysis results is comprehensively referred to as a patent map. As technology advances rapidly and development costs increase, patent information and analysis results make it easier and more intuitive. Visualization to help understand and predict the future is essential, and the invention of the technology is required.
하지만, 현재의 특허맵은 몇 가지 단점을 지니고 있다. However, the current patent map has some disadvantages.
첫째, 특허정보는 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화 되지 않은 항목(청구항, 요약내용 등의 텍스트)으로 구성되는데, 현재 특허맵은 이중 어느 한쪽에 대한 내용만 반영하여, 균형 잡힌 특허분석과 시각화를 제공하지 못한다. First, the patent information consists of structured items (patent number, date of application, inventor, etc.) and unstructured items (text of claims, summary contents, etc.), and the current patent map reflects only one of the contents of It does not provide balanced patent analysis and visualization.
둘째, 대부분의 특허맵은 특허문서의 복잡한 네트워크로 조성되어있으며, 이는 결과적으로 특허정보를 통해 신기술의 발전상황과 미래상을 예측 할 수 있도록 하는 직관적인 시각을 제공하지 못한다.Secondly, most patent maps consist of a complex network of patent documents, which, as a result, do not provide an intuitive view to predict the development and future of new technologies through patent information.
본 발명은 상기와 같은 문제점을 감안하여 안출된 것으로, 기존의 특허맵과 달리, 특허정보의 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화 되지 않은 항목(청구항, 요약내용 등의 텍스트)을 모두 반영하여, 균형잡힌 특허분석과 시각화를 가능하게 하며, 키워드들의 시맨틱 네트워크(Semantic Network)를 구축하고, 이를 시간 축을 기준으로 정렬함으로써, 기술의 발전상황과 미래상을 보다 직관적으로 예측할 수 있는 시스템 및 그 방법을 제공함에 그 특징적인 목적이 있다. The present invention has been made in view of the above problems, unlike the existing patent map, structured items of patent information (patent number, application date, inventors, etc.) and unstructured items (claims, summary content, etc.) ), Which enables balanced patent analysis and visualization, constructs a semantic network of keywords, and sorts them on the time axis, so that technology development and future can be predicted more intuitively. Its purpose is to provide a system and a method thereof.
이러한 기술적 과제를 달성하기 위한 본 발명은 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템에 관한 것으로서, 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받아 특허문서를 검색하고, 검색된 특허문서상에 정의된 키워드를 추출한 후, 상기 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 키워드 추출부; 상기 키워드 추출부를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 특허문서 군집화부; 상기 특허문서 군집화부를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 시맨틱 네트워크 구성부; 상기 시맨틱 네트워크 구성부를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈 도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 특허맵 구축부; 를 포함하는 것을 특징으로 한다. The present invention for achieving the technical problem relates to a patent information visualization system by constructing a keyword semantic network, the user receives an initial keyword for searching a patent document in a specific technical field to search for a patent document, on the retrieved patent document A keyword extractor configured to extract a defined keyword and then combine the first keyword and the second keyword to form a keyword list; A patent document clustering unit configured to determine whether or not each of the keywords included in the keyword list is formed in a matrix and to cluster the patent documents with respect to the patent documents searched through the keyword extracting unit; Semantic network configuration for extracting common keywords among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit and setting them as new nodes, and setting patent document clusters including remaining keywords except common keywords as lower nodes. part; After retrieving the frequency count included in the clusters of patent documents and the patent application date of the patent document for each node set through the semantic network configuration unit, the frequency value and the patent application date value are set to arbitrary axes (x, y). A patent map constructing unit configured to establish a patent map by displaying the semantic network on the coordinate plane according to the x and y values of each node; Characterized in that it comprises a.
한편, 본 발명은 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 것으로서, (a) 상기 키워드 추출부가 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받고, 초기 키워드를 바탕으로 검색된 특허문서상에 정의된 제 2 키워드를 추출한 후, 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 과정; (b) 상기 특허문서 군집화부가 키워드 추출부를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 과정; (c) 상기 시맨틱 네트워크 구성부가 특허문서 군집화부를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 과정; 및 (d) 상기 특허맵 구축부가 시맨틱 네트워크 구성부를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시멘틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 과정; 을 포함하는 것을 특징으로 한다. Meanwhile, the present invention relates to a method for visualizing patent information by constructing a keyword semantic network. (A) The keyword extracting unit receives an initial keyword for searching a patent document in a specific technical field from a user, and searches for a patent based on the initial keyword. Extracting the second keyword defined on the document, and then integrating the first keyword and the second keyword to construct a keyword list; (b) a process of determining whether each of the keywords included in the keyword list is present in a matrix and clustering the patent documents with respect to the patent documents searched by the keyword extracting unit; (c) The semantic network component extracts a common keyword among keywords belonging to a plurality of patent document clusters generated by the patent document clustering unit, sets it as a new node, and subclasses a patent document cluster including remaining keywords except common keywords. Setting to a node; And (d) retrieving a frequency included in clusters of patent documents and a patent application date of a patent document for each node set through the semantic network configuration unit, and then obtaining a frequency value and a patent application date value. Establishing a patent map by setting the axes (x, y) and displaying the semantic network on the coordinate plane according to the x and y values of each node; Characterized in that it comprises a.
상기와 같은 본 발명에 따르면, 기존의 특허맵과 달리 특허정보의 구조화된 항목(특허번호, 출원날짜, 발명자 등)과 구조화되지 않은 항목(청구항, 요약내용 등의 텍스트)을 모두 반영하여, 균형 잡힌 특허분석과 시각화를 가능하게 한다. According to the present invention as described above, unlike the existing patent map, the balance by reflecting both the structured items of the patent information (patent number, application date, inventors, etc.) and unstructured items (claims, summaries, etc.) Enables captured patent analysis and visualization.
또한, 키워드들의 시맨틱 네트워크(Semantic Network)를 구축하고, 이를 시간 축을 기준으로 정렬하여, 정적인 특허정보 표현을 넘어 동적으로 특허정보를 표현해 주고, 보다 직관적으로 특허정보를 통해 신기술의 발전상황을 파악하고, 미래상을 예측할 수 있도록 한다. 이렇듯, 제안한 특허맵을 통해 서비스 산업 R&D를 위해 필수적인 신기술에 대한 직관적인 이해와 예측을 손쉬워 지며, 결과적으로 신기술 개발과 투자가 효과적으로 이루어지도록 하는데 기여할 수 있다.In addition, by building a semantic network of keywords and sorting them based on the time axis, expressing patent information dynamically beyond static patent information expression, and grasping the development of new technology through patent information more intuitively And predict the future. As such, the proposed patent map facilitates intuitive understanding and prediction of new technologies essential for service industry R & D, and consequently contributes to effective new technology development and investment.
본 발명의 구체적 특징 및 이점들은 첨부도면에 의거한 다음의 상세한 설명으로 더욱 명백해질 것이다. 이에 앞서 본 발명에 관련된 공지 기능 및 그 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는, 그 구체적인 설명을 생략하였음에 유의해야 할 것이다.Specific features and advantages of the present invention will become more apparent from the following detailed description based on the accompanying drawings. In the meantime, when it is determined that the detailed description of the known functions and configurations related to the present invention may unnecessarily obscure the subject matter of the present invention, it should be noted that the detailed description is omitted.
이하, 첨부된 도면을 참조하여 본 발명을 상세하게 설명한다. Hereinafter, with reference to the accompanying drawings will be described in detail the present invention.
본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템 및 그 방법에 관하여 도 1 내지 도 19 를 참조하여 설명하면 다음과 같다. Patent information visualization system and method through the keyword semantic network configuration according to the present invention will be described with reference to Figures 1 to 19 as follows.
이하의 설명을 통해 알 수 있겠으나, 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)은, 특허문서의 검색 및 해당 특허문서의 특허출원날짜 등을 검색하는 과정에서, 별도의 특허문서 DB(10)와 연동하여 검 색하는 것으로 이해하는 것이 바람직하다. As can be seen through the following description, the patent information visualization system (S) through the keyword semantic network configuration according to the present invention, in the process of searching for a patent document and the date of patent application of the patent document, etc. It is desirable to understand that the search in conjunction with the patent document DB (10).
도 1 은 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)(이하, '특허정보 시각화 시스템')을 개념적으로 도시한 구성도로서, 도시된 바와 같이 키워드 추출부(100), 특허문서 군집화부(200), 시맨틱 네트워크 구성부(300) 및 특허맵 구축부(400)를 포함하여 이루어진다. 1 is a block diagram conceptually showing a patent information visualization system S (hereinafter, referred to as a 'patent information visualization system') by constructing a keyword semantic network according to the present invention. As shown, the
구체적으로, 키워드 추출부(100)는 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드(이하, '제 1 키워드')를 입력받아 특허문서를 검색하고, 검색된 특허문서상에 정의된 키워드(이하, '제 2 키워드')를 추출한 후, 상기 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 기능을 수행하는 바, 도 2 에 도시된 바와 같이 사용자 입력모듈(110), 특허문서 검색모듈(120), 키워드 추출모듈(130) 및 키워드 리스트 구성모듈(140)을 포함한다. In detail, the
사용자 입력모듈(110)은 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는다. The user input module 110 receives a first keyword for searching a patent document related to a specific technical field from a user.
특허문서 검색모듈(120)은 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색한다.The patent
키워드 추출모듈(130)은 상기 특허문서 검색모듈(120)을 통해 검색된 특허문서상에 정의된 출원 시의 키워드 즉, 특허 출원서에 기재된 색인어인 제 2 키워드를 추출한다. The keyword extraction module 130 extracts a keyword at the time of application defined on the patent document searched through the patent
키워드 리스트 구성모듈(140)은 상기 사용자 입력모듈(110)을 통해 사용자로 부터 입력받은 제 1 키워드와, 키워드 추출모듈(130)을 통해 추출한 제 2 키워드를 통합하여 키워드 리스트를 구성한다. The keyword list construction module 140 constructs a keyword list by combining the first keyword input from the user through the user input module 110 and the second keyword extracted through the keyword extraction module 130.
또한, 특허문서 군집화부(200)는 상기 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 기능을 수행하는 바, 도 3 에 도시된 바와 같이 매트릭스 구성모듈(210) 및 특허문서 군집화 모듈(220)을 포함한다. In addition, the patent
매트릭스 구성모듈(210)은 특허문서 검색모듈(120)을 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성한다. 이때, 도 4 에 도시된 바와 같이 해당 특허문서에 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기된다. 본 실시예에서, 검색된 특허문서(A,B,C,D)로 4개만을 설정하였으나, 본 발명이 이에 한정되지 않는다. The
특허문서 군집화 모듈(220)은 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 도 5 에 도시된 바와 같이 다수개의 특허문서 군집을 생성한다. The patent
참고로, k-mean 알고리즘이란, 일종의 클러스터링(clustering) 알고리즘으로서, 다수의 데이터가 잡다하게 분포를 이루고 있을 경우, 다수의 데이터가 어디에 많이 분포되어 있는지 알 수 있는 알고리즘을 의미한다. For reference, the k-mean algorithm is a kind of clustering algorithm. When a large number of data are miscellaneously distributed, the k-mean algorithm refers to an algorithm that knows where a large amount of data is distributed.
또한, 시맨틱 네트워크 구성부(300)는 상기 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 기능을 수행하는 바, 도 6 에 도시된 바와 같이 공통 키워드 추출모듈(310) 및 노드 설정모듈(320)을 포함한다.In addition, the semantic
공통 키워드 추출모듈(310)은 특허문서 군집화모듈(220)을 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출한다. 즉, 공통 키워드 추출모듈(310)은 도 7 에 도시된 바와 같이, 특허문서 군집 1(a,b,c) 과 특허문서 군집 2(c,d) 에 모두 포함된 공통 키워드 'c' 를 추출한다. The common
노드 설정모듈(320)은 공통 키워드 추출모듈(310)을 통해 추출된 공통 키워드를 새로운 노드(이하, '제 1 노드')로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드로 설정한다. 즉, 노드 설정모듈(320)은 도 8 에 도시된 바와 같이 공통 키워드 'c' 를 제 1 노드로 설정하고, 공통 키워드 'c' 를 제외한 나머지 키워드들을 포함하는 특허문서 군집 1(a, b) 및 특허문서 군집 2(d) 를 각각 제 2 노드 및 제 3 노드로 설정한다.The
그리고, 특허맵 구축부(400)는 상기 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축하는 기능을 수행하는 바, 도 9 에 도시된 바와 같이 빈도수 설정모듈(410), 특허출원 날짜 설정모듈(420) 및 좌표값 설정모듈(430)을 포함한다. Then, the patent
빈도수 설정모듈(410)은 도 10 에 도시된 바와 같이 노드 설정모듈(320)을 통해 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수(Frequency) 값으로 설정한다. As shown in FIG. 10, the
특허출원 날짜 설정모듈(420)은 각 노드의 키워드들과 관련된 특허문서(A,B,C,D)들의 특허출원 날짜를 검색하고, 각 노드의 키워드가 포함된 특허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정한다. 즉, 도 11 에 도시된 바와 같이, 키워드 'c' 가 포함된 특허문서 A, B, C 중, 가장 빠른 특허출원 날짜를 갖는 'A' 의 특허출원 날짜가 제 1 노드의 특허출원 날짜 값으로 설정되며, 키워드 'a' 와 'b' 가 포함된 특허문서 A, B 중, 가장 빠른 특허출원 날짜를 갖는 'A' 의 특허출원 날짜가 제 2 노드의 특허출원 날짜 값으로 설정되며, 키워드 'd' 가 포함된 특허문서 C, D 중, 가장 빠른 특허출원 날짜를 갖는 'D' 의 특허출원 날짜가 제 3 노드의 특허출원 날짜 값으로 설정된다. The patent application
좌표값 설정모듈(430)은 도 12 에 도시된 바와 같이 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축한다. 본 실시예에서, 각 노드의 빈도수 값을 y축으로, 특허출원 날짜 값을 x축으로 설정하였으나, 본 발명이 이에 한정되는 것은 아니다. As shown in FIG. 12, the coordinate
도 13 은 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 시맨틱 네트워크가 적용된 모습을 보여주는 일예시도이며, 도 14 는 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 최종적인 특허맵이 적용된 모습을 보여주는 일예시도이다.FIG. 13 is an exemplary view showing a semantic network according to the present invention with respect to ubiquitous computing technology, and FIG. 14 is an exemplary view showing a final patent map according to the present invention with respect to ubiquitous computing technology. to be.
상술한 키워드 추출부(100), 특허문서 군집화부(200), 시맨틱 네트워크 구성부(300) 및 특허맵 구축부(400)로 구성된 특허정보 시각화 시스템(S)을 이용한 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관하여 설명하면 다음과 같다. Patent through the keyword semantic network configuration using the patent information visualization system (S) consisting of the
도 15 는 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 전체 흐름도로서, 도시된 바와 같이 키워드 추출부(100)가 사용자로부터 특정 기술분야의 특허문서 검색을 위한 초기 키워드를 입력받고, 초기 키워드를 바탕으로 검색된 특허문서상에 정의된 제 2 키워드를 추출한 후, 제 1 키워드 및 제 2 키워드를 통합하여 키워드 리스트를 구성하는 제 1 과정(S100), 특허문서 군집화부(200)가 키워드 추출부(100)를 통해 검색된 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각각의 출현 여부를 판단하여 매트릭스로 구성하고, 특허문서를 군집화 하는 제 2 과정(S200), 시맨틱 네트워크 구성부(300)가 특허문서 군집화부(200)를 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중 공통 키워드를 추출하여 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드를 포함하는 특허문서 군집을 하위 노드로 설정하는 제 3 과정(S300), 및 특허맵 구축부(400)가 시맨틱 네트워크 구성부(300)를 통해 설정된 각 노드에 대하여 특허문서 군집들에 포함되는 빈도수를 및 특허문서의 특허출원 날짜를 검색한 후, 빈도수 값 및 특허출원 날짜 값을 임의의 축(x, y)으로 설정하고, 각 노드의 x, y 값에 따라 시멘틱 네트워크를 좌표평면에 표시함으로써 특허맵을 구축하는 과정(S400)을 포함하여 이루어진다. FIG. 15 is a flowchart illustrating a method for visualizing patent information by constructing a keyword semantic network according to the present invention. As illustrated, the
도 16 은 본 발명에 따른 제 1 과정(S100)에 관한 세부 흐름도로서, 도시된 바와 같이, 키워드 추출부(100)의 사용자 입력모듈(110)은 사용자로부터 특정 기술분야와 관련된 특허문서 검색을 위한 제 1 키워드를 입력받는다(S110).FIG. 16 is a detailed flowchart of a first process S100 according to the present invention. As shown in the drawing, the user input module 110 of the
이후, 특허문서 검색모듈(120)은 국내외 특허문서가 검색가능한 별도의 특허문서 DB(10)와 연동됨으로써, 상기 제 1 키워드를 이용한 소정 개수의 특허문서를 검색한다(S120).Subsequently, the patent
또한, 키워드 추출모듈(130)은 상기 특허문서 검색모듈(120)을 통해 검색된 특허문서상에 정의된 출원 시의 키워드 즉, 특허 출원서에 기재된 색인어인 제 2 키워드를 추출한다(S130).In addition, the keyword extraction module 130 extracts a keyword at the time of application defined on the patent document searched through the patent
그리고, 키워드 리스트 구성모듈(140)은 상기 사용자 입력모듈(110)을 통해 사용자로부터 입력받은 제 1 키워드와, 키워드 추출모듈(130)을 통해 추출한 제 2 키워드를 통합하여 키워드 리스트를 구성한다(S140).The keyword list construction module 140 constructs a keyword list by combining the first keyword input from the user through the user input module 110 and the second keyword extracted through the keyword extraction module 130 (S140). ).
도 17 은 본 발명에 따른 제 2 과정(S200)에 관한 세부 흐름도로서, 도시된 바와 같이 특허문서 군집화부(200)의 매트릭스 구성모듈(210)은 특허문서 검색모듈(120)을 통해 검색된 각 특허문서에 대하여, 키워드 리스트에 구성된 키워드 각 각의 출현 여부를 판단함으로써, 출현한 경우 '1', 출현하지 않은 경우 '0' 으로 표기하는 매트릭스로 구성한다(S210).FIG. 17 is a detailed flowchart of a second process (S200) according to the present invention. As shown, the
이후, 특허문서 군집화 모듈(220)은 상기 각각의 특허문서에 대하여, 각 키워드들의 출현 여부 값을 속성으로 하는 k-mean 알고리즘을 반복 적용함으로써, 다수개의 특허문서 군집을 생성한다(S220).Subsequently, the patent
도 18 은 본 발명에 따른 제 3 과정(S300)에 관한 세부 흐름도로서, 도시된 바와 같이 시맨틱 네트워크 구성부(300)의 공통 키워드 추출모듈(310)은 특허문서 군집화모듈(220)을 통해 생성된 다수개의 특허문서 군집들에 속한 키워드 중, 2개 이상의 특허문서 군집에 속한 공통 키워드를 추출한다(S310).18 is a detailed flowchart of a third process (S300) according to the present invention. As shown, the common
이후, 노드 설정모듈(320)은 공통 키워드 추출모듈(310)을 통해 추출된 공통 키워드를 새로운 노드로 설정하고, 공통 키워드를 제외한 나머지 키워드들을 포함하는 특허문서 군집을 그 하위 노드들로 설정한다(S320).Thereafter, the
도 19 는 본 발명에 따른 제 4 과정(S400)에 관한 세부 흐름도로서, 도시된 바와 같이 특허맵 구축부(400)의 빈도수 설정모듈(410)은 노드 설정모듈(320)을 통해 설정된 각 노드의 키워드 들에 대해서, 다수개의 특허문서 군집들에 포함되는 횟수를 계산하여 빈도수(Frequency) 값으로 설정한다(S410).19 is a detailed flowchart of a fourth process (S400) according to the present invention. As shown, the
이후, 특허출원 날짜 설정모듈(420)은 각 노드의 키워드들과 관련된 특허문서(A,B,C,D)들의 특허출원 날짜를 검색하고(S420), 각 노드의 키워드가 포함된 특 허문서 중, 가장 빠른 특허출원 날짜를 갖는 특허문서의 특허출원 날짜를, 해당 노드의 특허출원 날짜 값으로 설정한다(S430).Then, the patent application
그리고, 좌표값 설정모듈(430)은 각 노드의 빈도수 값과 특허출원 날짜 값을 노드의 좌표상 임의의 축(x, y)으로 각각 설정하고, 각 노드 x, y 값에 따라 시맨틱 네트워크를 좌표평면에 표시함으로써, 특허맵을 구축한다(S440).The coordinate
이상으로 본 발명의 기술적 사상을 예시하기 위한 바람직한 실시예와 관련하여 설명하고 도시하였지만, 본 발명은 이와 같이 도시되고 설명된 그대로의 구성 및 작용에만 국한되는 것이 아니며, 기술적 사상의 범주를 일탈함이 없이 본 발명에 대해 다수의 변경 및 수정이 가능함을 당업자들은 잘 이해할 수 있을 것이다. 따라서, 그러한 모든 적절한 변경 및 수정과 균등물들도 본 발명의 범위에 속하는 것으로 간주되어야 할 것이다. As described above and described with reference to a preferred embodiment for illustrating the technical idea of the present invention, the present invention is not limited to the configuration and operation as shown and described as described above, it is a deviation from the scope of the technical idea It will be understood by those skilled in the art that many modifications and variations can be made to the invention without departing from the scope of the invention. Accordingly, all such suitable changes and modifications and equivalents should be considered to be within the scope of the present invention.
도 1 은 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 시스템(S)을 개념적으로 도시한 구성도.1 is a block diagram conceptually showing a patent information visualization system (S) through the keyword semantic network configuration in accordance with the present invention.
도 2 는 본 발명에 따른 키워드 추출부(100)에 관한 세부 구성도. 2 is a detailed block diagram of a
도 3 은 본 발명에 따른 특허문서 군집화부(200)에 관한 세부 구성도. Figure 3 is a detailed configuration of the patent
도 4 는 본 발명에 따른 키워드 리스트에 구성된 키워드 각각의 출현 여부를 매트릭스로 나타내는 일예시도. Figure 4 is an exemplary view showing in a matrix whether each of the keywords configured in the keyword list according to the present invention.
도 5 는 본 발명에 따른 특허문서 군집을 나타내는 일예시도. 5 is an exemplary view showing a group of patent documents according to the present invention.
도 6 은 본 발명에 따른 시맨틱 네트워크 구성부(300)에 관한 세부 구성도.6 is a detailed configuration diagram of the semantic
도 7 은 본 발명에 따른 다수개의 특허문서 군집에 모두 포함된 공통 키워드를 추출하는 모습을 나타내는 일예시도. 7 is an exemplary view illustrating a state in which a common keyword included in all of a plurality of patent document clusters according to the present invention is extracted.
도 8 은 본 발명에 따른 공통 키워드 및 나머지 키워드들을 포함하는 특허문서 군집을 노드로 설정하는 모습을 나타내는 일예시도. 8 is an exemplary view illustrating a state in which a cluster of patent documents including a common keyword and remaining keywords according to the present invention is set as a node.
도 9 는 본 발명에 따른 특허맵 구축부(400)에 관한 세부 구성도.9 is a detailed configuration diagram of a patent
도 10 은 본 발명에 따른 각 노드에 빈도수 값을 나타내는 일예시도. 10 is an exemplary view showing a frequency value at each node according to the present invention.
도 11 은 본 발명에 따른 각 노드에 특허출원 날짜를 나타내는 일예시도.11 is an exemplary view showing a patent application date in each node according to the present invention.
도 12 는 본 발명에 따른 최종 구축된 특허맵을 나타내는 일예시도. 12 is an exemplary view showing a final constructed patent map according to the present invention.
도 13 은 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 시맨틱 네트워크가 적용된 모습을 보여주는 일예시도. 13 is an exemplary view showing a semantic network according to the present invention applied to a ubiquitous computing technology.
도 14 는 유비쿼터스 컴퓨팅 기술에 대해, 본 발명에 따른 최종적인 특허맵 이 적용된 모습을 보여주는 일예시도.14 is an exemplary view showing a final patent map applied to the ubiquitous computing technology according to the present invention.
도 15 는 본 발명에 따른 키워드 시맨틱 네트워크 구성을 통한 특허정보 시각화 방법에 관한 전체 흐름도.15 is a flowchart illustrating a patent information visualization method through constructing a keyword semantic network according to the present invention.
도 16 은 본 발명에 따른 제 1 과정(S100)에 관한 세부 흐름도. 16 is a detailed flowchart relating to a first process S100 according to the present invention.
도 17 은 본 발명에 따른 제 2 과정(S200)에 관한 세부 흐름도. 17 is a detailed flowchart of a second process (S200) according to the present invention.
도 18 은 본 발명에 따른 제 3 과정(S300)에 관한 세부 흐름도.18 is a detailed flowchart of a third process (S300) according to the present invention.
도 19 는 본 발명에 따른 제 4 과정(S400)에 관한 세부 흐름도.19 is a detailed flowchart of a fourth process (S400) according to the present invention.
** 도면의 주요 부분에 대한 부호의 설명 **** Description of symbols for the main parts of the drawing **
100: 키워드 추출부 200: 특허문서 군집화부100: keyword extraction unit 200: patent document clustering unit
300: 시맨틱 네트워크 구성부 400: 특허맵 구축부300: semantic network configuration unit 400: patent map construction unit
110: 사용자 입력모듈 120: 특허문서 검색모듈110: user input module 120: patent document search module
130: 키워드 추출모듈 140: 키워드 리스트 구성모듈130: keyword extraction module 140: keyword list configuration module
210: 매트릭스 구성모듈 220: 특허문서 군집화 모듈210: matrix configuration module 220: patent document clustering module
310: 공통 키워드 추출모듈 320: 노드 설정모듈310: common keyword extraction module 320: node configuration module
410: 빈도수 설정모듈 420: 특허출원 날짜 설정모듈410: frequency setting module 420: patent application date setting module
430: 좌표값 설정모듈 10: 특허문서 DB430: coordinate value setting module 10: patent document DB
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080119462A KR101054824B1 (en) | 2008-11-28 | 2008-11-28 | Patent Information Visualization System and Method Using Keyword Semantic Network |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080119462A KR101054824B1 (en) | 2008-11-28 | 2008-11-28 | Patent Information Visualization System and Method Using Keyword Semantic Network |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20100060734A true KR20100060734A (en) | 2010-06-07 |
KR101054824B1 KR101054824B1 (en) | 2011-08-05 |
Family
ID=42361615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020080119462A KR101054824B1 (en) | 2008-11-28 | 2008-11-28 | Patent Information Visualization System and Method Using Keyword Semantic Network |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101054824B1 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101268503B1 (en) * | 2011-04-29 | 2013-06-04 | 포항공과대학교 산학협력단 | Method and its system for generation of patent maps |
KR101292663B1 (en) * | 2012-02-06 | 2013-08-13 | 한국과학기술정보연구원 | System and method on emerging technology product portfolio generation based on firm's technology capability |
KR101327514B1 (en) * | 2011-07-28 | 2013-11-08 | 포항공과대학교 산학협력단 | System for patent network analysis using semantic patent similarity and method using the same |
CN106446129A (en) * | 2016-09-19 | 2017-02-22 | 合肥清浊信息科技有限公司 | Patent data analysis system |
KR102029916B1 (en) * | 2018-03-30 | 2019-10-08 | 주식회사 디 파트너스 | Intellectual property right document based bigdata analyzing method for design material search |
CN111767719A (en) * | 2020-06-29 | 2020-10-13 | 北京百度网讯科技有限公司 | Bibliographic generation method and device, computer system and readable storage medium |
CN113688209A (en) * | 2021-09-01 | 2021-11-23 | 江苏省城市规划设计研究院有限公司 | Text semantic network construction method by adjusting dependency relationship of keywords |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104199809A (en) * | 2014-04-24 | 2014-12-10 | 江苏大学 | Semantic representation method for patent text vectors |
KR20170030016A (en) | 2016-05-09 | 2017-03-16 | 한국지질자원연구원 | Method for analyzing promising technology using patent data |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100501244B1 (en) * | 2002-05-30 | 2005-07-18 | 재단법인서울대학교산학협력재단 | Method for Producing Patent Map and The System |
KR20050034458A (en) * | 2003-10-09 | 2005-04-14 | 엘지전자 주식회사 | Information search system and method for display searched information |
BRPI0515687A (en) * | 2004-09-14 | 2008-07-29 | Intellectual Property Bank | device, program, and drawing method for the diagrammatic relationship of documents in chronological order |
KR100816934B1 (en) * | 2006-04-13 | 2008-03-26 | 엘지전자 주식회사 | Clustering system and method using search result document |
-
2008
- 2008-11-28 KR KR1020080119462A patent/KR101054824B1/en not_active IP Right Cessation
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101268503B1 (en) * | 2011-04-29 | 2013-06-04 | 포항공과대학교 산학협력단 | Method and its system for generation of patent maps |
KR101327514B1 (en) * | 2011-07-28 | 2013-11-08 | 포항공과대학교 산학협력단 | System for patent network analysis using semantic patent similarity and method using the same |
KR101292663B1 (en) * | 2012-02-06 | 2013-08-13 | 한국과학기술정보연구원 | System and method on emerging technology product portfolio generation based on firm's technology capability |
CN106446129A (en) * | 2016-09-19 | 2017-02-22 | 合肥清浊信息科技有限公司 | Patent data analysis system |
KR102029916B1 (en) * | 2018-03-30 | 2019-10-08 | 주식회사 디 파트너스 | Intellectual property right document based bigdata analyzing method for design material search |
CN111767719A (en) * | 2020-06-29 | 2020-10-13 | 北京百度网讯科技有限公司 | Bibliographic generation method and device, computer system and readable storage medium |
CN111767719B (en) * | 2020-06-29 | 2023-08-22 | 北京百度网讯科技有限公司 | Method and device for generating title, computer system and readable storage medium |
CN113688209A (en) * | 2021-09-01 | 2021-11-23 | 江苏省城市规划设计研究院有限公司 | Text semantic network construction method by adjusting dependency relationship of keywords |
CN113688209B (en) * | 2021-09-01 | 2023-08-25 | 江苏省城市规划设计研究院有限公司 | Text semantic network construction method by adjusting keyword dependency relationship |
Also Published As
Publication number | Publication date |
---|---|
KR101054824B1 (en) | 2011-08-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101054824B1 (en) | Patent Information Visualization System and Method Using Keyword Semantic Network | |
Crescenzi et al. | Clustering web pages based on their structure | |
JP5092165B2 (en) | Data construction method and system | |
CN111460311A (en) | Search processing method, device and equipment based on dictionary tree and storage medium | |
JP2009080624A (en) | Information display device, method and program | |
JP2009104591A (en) | Web document clustering method and system | |
KR20080028574A (en) | Integrated search service system and method | |
JP5588811B2 (en) | Data analysis support system and method | |
CN104077337B (en) | Searching method and device | |
CN109144964A (en) | log analysis method and device based on machine learning | |
CN110321446B (en) | Related data recommendation method and device, computer equipment and storage medium | |
JP2019204246A (en) | Learning data creation method and learning data creation device | |
JP5324677B2 (en) | Similar document search support device and similar document search support program | |
CN115204889A (en) | Text processing method and device, computer equipment and storage medium | |
CN110874366A (en) | Data processing and query method and device | |
JP2009093556A (en) | Index construction method, document retrieval apparatus and index construction program | |
JP2013030089A (en) | Document retrieval system and document retrieval program | |
JP2012123675A (en) | Method and system for extracting system component | |
JP2011100208A (en) | Action estimation device, action estimation method, and action estimation program | |
CN113821514A (en) | Data splitting method and device, electronic equipment and readable storage medium | |
JP5184987B2 (en) | Index information creating apparatus, index information creating method and program | |
JP4525224B2 (en) | Document management program, document management method, and document management apparatus | |
JP2007026116A (en) | Concept search system and concept search method | |
JP6455087B2 (en) | Form information processing program, form information processing apparatus, and form information processing method | |
KR101526312B1 (en) | System and method for packaging research and development information services on pending national issues |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20140724 Year of fee payment: 4 |
|
LAPS | Lapse due to unpaid annual fee |