KR102221267B1 - Device and method for providing technological competitive intelligence - Google Patents

Device and method for providing technological competitive intelligence Download PDF

Info

Publication number
KR102221267B1
KR102221267B1 KR1020180158342A KR20180158342A KR102221267B1 KR 102221267 B1 KR102221267 B1 KR 102221267B1 KR 1020180158342 A KR1020180158342 A KR 1020180158342A KR 20180158342 A KR20180158342 A KR 20180158342A KR 102221267 B1 KR102221267 B1 KR 102221267B1
Authority
KR
South Korea
Prior art keywords
topic
solution
item
keyword
company
Prior art date
Application number
KR1020180158342A
Other languages
Korean (ko)
Other versions
KR20200070809A (en
Inventor
윤장혁
이지호
정병기
고남욱
오승현
Original Assignee
건국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 건국대학교 산학협력단 filed Critical 건국대학교 산학협력단
Priority to KR1020180158342A priority Critical patent/KR102221267B1/en
Publication of KR20200070809A publication Critical patent/KR20200070809A/en
Application granted granted Critical
Publication of KR102221267B1 publication Critical patent/KR102221267B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Marketing (AREA)
  • Data Mining & Analysis (AREA)
  • Educational Administration (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치는, 특허 전문 데이터를 수집하는 수집부, 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부, 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부 및 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부를 포함할 수 있다.The apparatus for providing technology competition information according to an embodiment of the present application includes a collection unit for collecting patent full text data, a keyword extracting unit for extracting item-specific keywords from the patent full text data, and a topic to be solved through topic modeling from the item-specific keywords. And a topic definition unit defining a solution topic, and a construction unit for constructing a solution problem-solving means network and a solution problem-solving means positioning map based on the solution topic and solution topic.

Description

기술 경쟁 정보 제공 장치 및 방법{DEVICE AND METHOD FOR PROVIDING TECHNOLOGICAL COMPETITIVE INTELLIGENCE}Technology competition information providing device and method {DEVICE AND METHOD FOR PROVIDING TECHNOLOGICAL COMPETITIVE INTELLIGENCE}

본원은 기술 경쟁 정보 제공 장치 및 방법에 관한 것이다.The present application relates to a technology competition information providing apparatus and method.

기술경쟁 동향을 파악하는 것은 기업의 지속 가능 성장을 위해 필수적이다. 최근 기술개발의 불확실성이 증가하고 기술경쟁이 심화됨에 따라, 전략적으로 기술을 관리하고 동향을 파악하는 활동의 중요성이 점차 높아지고 있다. 또한 경쟁기업이 보유한 기술들은 잠재적 위험요소로 작용할 수 있기 때문에, 기술개발 과정에서 경쟁기업의 기술 동향을 파악하는 것은 매우 중요한 요소이다.Identifying trends in technology competition is essential for a company's sustainable growth. In recent years, as the uncertainty in technology development increases and technology competition intensifies, the importance of strategically managing technology and identifying trends is becoming increasingly important. In addition, since technologies possessed by competitors can act as potential risk factors, it is very important to understand the technology trends of competitors in the process of technology development.

기존의 기술 동향 파악은 전문가의 분석에 의존하는 정성적인 방법이 주로 이용되었으나, 기존의 방법은 평가 결과에 대한 객관성이 부족할 수 있으며, 시간 및 비용과 같은 자원의 소모가 크다는 한계점이 존재한다. 이러한 한계를 보완하기 위해 특허, 소셜 데이터 등 대량의 데이터를 이용한 정량적 분석 방법들이 연구된 바 있으며, 최근 데이터의 수집 경로가 다양해지고 고수준의 분석 방법이 보편화되면서 다양한 데이터를 이용한 연구들이 활발히 진행되고 있다. 그중 특허를 이용한 분석은 특허가 상업적 가치를 가지고 있는 기술에 대한 문서라는 특징 때문에, 기업의 의사결정과정과 기술 전략을 수립하기 위한 필수적인 단계로 인식되고 있다.Although the qualitative method relying on the analysis of experts was mainly used to grasp the existing technology trend, the existing method may lack objectivity for the evaluation result, and there is a limitation in that it consumes large resources such as time and cost. In order to compensate for these limitations, quantitative analysis methods using a large amount of data such as patents and social data have been studied. Recently, as data collection paths have been diversified and high-level analysis methods have become common, researches using various data are being actively conducted. . Among them, analysis using patents is recognized as an essential step for establishing a company's decision-making process and technology strategy because of the characteristic that patents are documents on technologies that have commercial value.

특허 기술의 분석 방식 중 주요하게 활용되는 텍스트 정보를 이용한 분석은 텍스트마이닝이나 자연어처리 기법 등을 활용하여 특허 텍스트를 분석하는 분석 기법이다. 그러나, 특허 텍스트 기반의 연구들은 특허명세서를 구성하는 항목들의 특성에 대한 고려 없이 청구항 도는 전문을 단지 하나의 평문(Plain Text)으로 인식하고 텍스트를 분석하였기 때문에, ‘배경기술’, ‘해결하려는 과제’, ‘과제의 해결수단’ 등과 같은 특허명세서의 항목별 특성을 활용하지 못하는 한계점이 있다.Among the analysis methods of patent technology, the analysis using text information, which is mainly used, is an analysis technique that analyzes patent text using text mining or natural language processing techniques. However, since studies based on patent text recognized the claims or full text as just one plain text and analyzed the text without considering the characteristics of the items constituting the patent specification,'background description' and'tasks to be solved. There is a limitation in that it is not possible to utilize the characteristics of each item of the patent specification, such as'means to solve the task'.

본원의 배경이 되는 기술은 한국특허공개공보 제10-1616544 호에 개시되어 있다.The technology behind the present application is disclosed in Korean Patent Laid-Open Publication No. 10-1616544.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 특허 명세서에 항목별로 기재된 사항으로부터 해결 과제와 해결 수단을 도출하고, 관심 기업의 해결과제 및 해결 수단의 동향을 분석할 수 있는 정보를 제공할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공하는 것을 목적으로 한다.The present application is intended to solve the problems of the prior art described above, and provides information that can derive the problem and solution to be solved from the items listed in the patent specification, and analyze the trend of the problem and solution of the interested company. It is an object of the present invention to provide an apparatus and method for providing technical competition information that can be used.

본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 해결 과제와 해결 수단으로부터 해결 과제-해결 수단 네트워크와 포지셔닝 맵을 구축할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공하는 것을 목적으로 한다.An object of the present application is to provide an apparatus and method for providing technical competition information capable of constructing a problem-solving means network and a positioning map from the problems and solutions to solve the problems of the prior art.

다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.However, the technical problem to be achieved by the embodiments of the present application is not limited to the technical problems as described above, and other technical problems may exist.

상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 기술 경쟁 정보 제공 방법에 있어서, (a) 특허 전문 데이터를 수집하는 단계, (b) 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 단계, (c) 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 단계 및 (d) 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 단계를 포함할 수 있다.As a technical means for achieving the above-described technical problem, in a method for providing technology competition information, (a) collecting patent full text data, (b) extracting item-specific keywords from the patent full text data, (c) Defining a solution topic and a solution topic through topic modeling from the keyword for each item, and (d) a solution to a solution network and a solution to a solution positioning map based on the solution topic and solution topic. It may include the step of building.

본원의 일 실시예에 따르면, 상기 (a) 단계는, (a1) 관심 기업을 선정하는 단계; 및 (a2) 관심 기업이 보유한 특허 전문 데이터를 수집하는 단계를 포함하고, 상기 (d) 단계는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다.According to an embodiment of the present application, the step (a) includes: (a1) selecting a company of interest; And (a2) collecting patent professional data owned by the interested company, wherein step (d) may establish a solution-to-solve means network and a solution-to-solve means positioning map for each interested company.

본원의 일 실시예에 따르면, 상기 (b) 단계는, 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출할 수 있다.According to the exemplary embodiment of the present application, in the step (b), the keyword for each item may be extracted from the background description item of the patent full text, the task item to be solved, and the solution means item of the task.

본원의 일 실시예에 따르면, 상기 (b) 단계는, 언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다.According to an exemplary embodiment of the present disclosure, in step (b), the keyword for each item may be extracted based on a language-independent keyword algorithm, and the obsolete keyword may be removed.

본원의 일 실시예에 따르면, 상기 (c) 단계는, 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다.According to an exemplary embodiment of the present disclosure, in step (c), the optimal number of topics may be determined from an average value of similarity between topics based on a topic model in which the number of topics is an input variable.

본원의 일 실시예에 따르면, 상기 (d)단계는, 대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하고, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다.According to an embodiment of the present application, in the step (d), the solution problem-solving means positioning map is constructed through correspondence analysis, and based on the number of patents in which the problem topic and the solution means topic are frequent at the same time, You can build a solution-to-solution network by assigning weights to the solution-topic and solution-topic.

본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치는, 특허 전문 데이터를 수집하는 수집부, 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부, 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부 및 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부를 포함할 수 있다.The apparatus for providing technology competition information according to an embodiment of the present application includes a collection unit for collecting patent full text data, a keyword extracting unit for extracting item-specific keywords from the patent full text data, and a topic to be solved through topic modeling from the item-specific keywords. And a topic definition unit defining a solution topic, and a construction unit for constructing a solution problem-solving means network and a solution problem-solving means positioning map based on the solution topic and solution topic.

본원의 일 실시예에 따르면, 상기 수집부는, 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집하되, 상기 구축부는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다.According to an embodiment of the present application, the collection unit selects a company of interest, and collects specialized patent data owned by the company of interest, but the construction unit includes a problem-solving means network and a solution-solving means positioning map for each interested company. Can build.

본원의 일 실시예에 따르면, 상기 키워드 추출부는, 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출할 수 있다.According to the exemplary embodiment of the present application, the keyword extracting unit may extract the keyword for each item from the background description item of the patent full text, the subject item to be solved, and the item solving means item.

본원의 일 실시예에 따르면, 상기 키워드 추출부는, 언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다.According to an embodiment of the present application, the keyword extracting unit may extract the keyword for each item based on a language-independent keyword algorithm and remove the unused keyword.

본원의 일 실시예에 따르면, 상기 토픽 정의부는, 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다.According to an exemplary embodiment of the present disclosure, the topic definition unit may determine the optimal number of topics from an average value of similarity between topics based on a topic model in which the number of topics is an input variable.

본원의 일 실시예에 따르면, 상기 구축부는, 대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하고, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다.According to an embodiment of the present application, the construction unit constructs the solution-solving means positioning map through correspondence analysis, and based on the number of patents in which the problem topic and the solution topic are frequent simultaneously, the solution topic topic The task-solution network can be built by assigning weights to the task and solution topics.

상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.The above-described problem solving means are merely exemplary and should not be construed as limiting the present application. In addition to the above-described exemplary embodiments, additional embodiments may exist in the drawings and detailed description of the invention.

전술한 본원의 과제 해결 수단에 의하면, 특허 명세서에 항목별로 기재된 사항으로부터 해결 과제와 해결 수단을 도출하고, 관심 기업의 해결과제 및 해결 수단의 동향을 분석할 수 있는 정보를 제공할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공할 수 있다.According to the above-described problem solving means of the present application, a technical competition that can provide information that can derive the problem to be solved and the solution means from the matters described by item in the patent specification, and analyze the trend of the problem to be solved and the solution of the interested company An information providing apparatus and method can be provided.

전술한 본원의 과제 해결 수단에 의하면, 해결 과제와 해결 수단으로부터 해결 과제-해결 수단 네트워크와 포지셔닝 맵을 구축할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공할 수 있다.According to the above-described problem solving means of the present application, it is possible to provide an apparatus and method for providing technical competition information capable of constructing a solution problem-solving means network and a positioning map from the problem and the solution.

도 1은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 구성을 도시한 도면이다.
도 2는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 토픽 모델링의 예를 도시한 도면이다.
도 3은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 포지셔닝 맵의 예를 도시한 도면이다.
도 4는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 네트워크의 예를 도시한 도면이다.
도 5는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 방법의 흐름을 도시한 도면이다.
1 is a diagram illustrating a configuration of an apparatus for providing technology contention information according to an embodiment of the present application.
2 is a diagram illustrating an example of topic modeling of an apparatus for providing technology contention information according to an embodiment of the present application.
3 is a diagram illustrating an example of a problem-solving means positioning map of the apparatus for providing technology contention information according to an embodiment of the present disclosure.
4 is a diagram illustrating an example of a problem-solving means network of a technology contention information providing apparatus according to an embodiment of the present application.
5 is a diagram illustrating a flow of a method for providing technology contention information according to an embodiment of the present application.

아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.Hereinafter, embodiments of the present application will be described in detail with reference to the accompanying drawings so that those of ordinary skill in the art may easily implement the present application. However, the present application may be implemented in various different forms and is not limited to the embodiments described herein. In addition, in the drawings, parts irrelevant to the description are omitted in order to clearly describe the present application, and similar reference numerals are attached to similar parts throughout the specification.

본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다. Throughout this specification, when a part is said to be "connected" with another part, this includes not only the case that it is "directly connected", but also the case that it is "electrically connected" with another element interposed therebetween. do.

본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.Throughout the present specification, when a member is positioned "on", "upper", "upper", "under", "lower", and "lower" of another member, this means that a member is located on another member. This includes not only the case where they are in contact but also the case where another member exists between the two members.

본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.In the entire specification of the present application, when a certain part "includes" a certain component, it means that other components may be further included, rather than excluding other components unless specifically stated to the contrary.

도 1은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 구성을 도시한 도면이다.1 is a diagram illustrating a configuration of an apparatus for providing technology contention information according to an embodiment of the present application.

도 1을 참조하면, 기술 경쟁 정보 제공 장치(100)는, 수집부(110), 키워드 추출부(120), 토픽 정의부(130) 및 구축부(140)를 포함할 수 있다. 수집부(110)는 특허 전문 데이터를 수집할 수 있다. 구체적으로, 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다. 본 기술 경쟁 정보 제공 장치(100)는 기술에 대한 특허 문서를 분석하여 해당 특허가 다루고 있는 기술이 근본적으로 해결하고자 하는 과제(problem) 즉, 목적과, 목적을 해결하기 위한 수단(solution)을 파악할 수 있다. 기술 경쟁 정보 제공 장치(100)는 목적과 수단의 관계를 해석하여 기업들의 경쟁 정보 분석을 위한 정보를 제공할 수 있으며, 이를 통해 보다 구체적인 기술 동향의 분석이 가능해 질 수 있다.Referring to FIG. 1, the apparatus 100 for providing technology contention information may include a collection unit 110, a keyword extraction unit 120, a topic definition unit 130, and a construction unit 140. The collection unit 110 may collect patent full text data. Specifically, the collection unit 110 may select a company of interest and collect specialized patent data held by the company of interest. The present technology competition information providing device 100 analyzes a patent document for a technology to identify a problem that the technology covered by the corresponding patent is to fundamentally solve, that is, the purpose and a solution for solving the purpose. I can. The technology competition information providing apparatus 100 may provide information for analyzing the competition information of companies by analyzing the relationship between the purpose and the means, and through this, it may be possible to analyze a more specific technology trend.

먼저, 기술 경쟁 정보를 제공하기 위해서는 관심 기술분야 및 관심 기술분야에 대한 관심 기업을 선정할 필요가 있다. 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다.First, in order to provide technology competition information, it is necessary to select a technology field of interest and a company of interest in the technology field of interest. The collection unit 110 may select a company of interest and collect specialized patent data held by the company of interest.

또한, 수집부(110)는 IP5의 CAF협약에 따라 특허 출원시 발명의 명칭, 도면의 간단한 설명, 발명의 설명, 특허청구범위 등의 항목이 기재된 특허 전문을 수집할 수 있다. In addition, the collection unit 110 may collect the full text of a patent in which items such as the name of the invention, a brief description of the drawings, a description of the invention, and the claims are described when a patent is applied for a patent according to the CAF agreement of IP5.

키워드 추출부(120)는 특허 전문 데이터로부터 항목별 키워드를 추출할 수 있다. 예시적으로, 키워드 추출부(120)는 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 항목별 키워드를 추출할 수 있다. 배경 기술 항목 및 해결하려는 과제 항목은 이전 발명에 대한 설명과 이전 발명이 해결하지 못한 문제점 등을 포함하고 있으므로, 해결 과제(problem)에 대한 키워드를 추출할 수 있다. 또한, 과제의 해결 수단 항목은 특허가 제안하는 기술적인 방법을 포함하고 있으므로, 해결 수단(solution)에 대한 키워드를 추출할 수 있다. 키워드 추출부(120)는 언어 독립적 키워드 알고리즘에 기초하여 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다. 키워드를 추출하는 기법에는 다양한 알고리즘이 존재하며, 키워드 추출부(120)는 언어 독립적 키워드 추출 알고리즘인 Rapid Automatic Keyword Extraction (RAKE)을 사용한다. 키워드 추출부(120)는 RAKE 알고리즘을 통해 추출된 키워드들 중, 기술적으로 의미가 없거나 문서를 작성할 때 통상적으로 사용하는 접속사 같은 불용키워드를 제거한다.The keyword extraction unit 120 may extract keywords for each item from the patent full text data. For example, the keyword extracting unit 120 may extract a keyword for each item from a background description item of a patent full text, a task item to be solved, and a solution item of the task. Since the background description item and the task item to be solved include a description of the previous invention and a problem that the previous invention did not solve, it is possible to extract a keyword for a problem to be solved. In addition, since the item for solving the problem includes a technical method proposed by the patent, a keyword for a solution can be extracted. The keyword extraction unit 120 may extract a keyword for each item based on a language-independent keyword algorithm, and may remove an unused keyword. Various algorithms exist for a keyword extraction technique, and the keyword extraction unit 120 uses Rapid Automatic Keyword Extraction (RAKE), which is a language-independent keyword extraction algorithm. The keyword extracting unit 120 removes keywords that are technically meaningless or useless keywords, such as conjunctions, which are commonly used when creating a document, among keywords extracted through the RAKE algorithm.

또한, 키워드 추출부(120)는 Python과 같은 프로그래밍 언어를 이용하여 발명의 상세한 설명의 항목으로부터 해결 과제 키워드와 해결 수단 키워드를 추출할 수 있다.In addition, the keyword extracting unit 120 may extract a solution keyword and a solution means keyword from the items of the detailed description of the invention using a programming language such as Python.

토픽 정의부(130)는 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 토픽 모델링이란 유사한 주제의 문서는 유사한 키워드를 포함한다는 전제로 이루어지는 소프트 클러스터링 방법이다. 상기 토픽은 키워드의 집합으로 이루어져 있으며, 토픽에 속하는 문서는 문서의 주제를 키워드 집합을 통해 정의할 수 있다. 토픽 모델링을 위한 모델에는 Latent Semantic Analysis(LSA), Probabilistic Latent Semantic Analysis(pLSA), Latent Dirichlet Allocatopn(LDA) 등이 있다. 그 중 LDA는 다른 모델들에 비해 과적합 문제가 적으며, 새로운 문서에 대해서도 쉽게 일반화를 할 수 있다는 장점이 있다. 또한 성능적으로도 우수하여 가장 널리 활용되는 모델이다. 따라서, 토픽 정의부(130)는 LDA모델을 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.The topic definition unit 130 may define a topic to be solved and a topic to be solved through topic modeling from keywords for each item. Topic modeling is a soft clustering method that is made on the premise that documents of similar subjects contain similar keywords. The topic consists of a set of keywords, and a document belonging to the topic may define the subject of the document through a set of keywords. Models for topic modeling include Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (pLSA), and Latent Dirichlet Allocatopn (LDA). Among them, LDA has the advantage of having fewer overfitting problems than other models, and being able to easily generalize to new documents. It is also the most widely used model because of its excellent performance. Accordingly, the topic definition unit 130 may define a topic to be solved and a topic to be solved by using the LDA model.

도 2는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 토픽 모델링의 예를 도시한 도면이다.2 is a diagram illustrating an example of topic modeling of an apparatus for providing technology contention information according to an embodiment of the present application.

토픽 정의부(130)는 키워드 추출부(120)에서 추출된 항목별 키워드의 집합을 이용하여 토픽 모델링을 진행할 수 있다. 또한, 토픽 정의부(130)는 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다. 구체적으로, 최적의 토픽 수를 결정하는 기법에는 토픽 수를 늘려가며 각 토픽 간 코사인 유사도의 평균값이 최하에 도달했다가 반등하는 지점의 토픽 수를 선정하는 기법과 토픽 간 코사인 유사도의 평균값이 안정화되기 시작하는 부근(Elbow Point)의 토픽 수를 선정하는 기법이 있다. 도 2를 참조하면, 토픽 정의부(130)는 Elbow Point에서의 토픽 수를 투입 변수로 활용하여 최적 토픽의 수로 결정할 수 있다.The topic definition unit 130 may perform topic modeling using a set of keywords for each item extracted by the keyword extraction unit 120. Also, the topic definition unit 130 may determine the optimal number of topics from an average value of similarity between topics based on a topic model in which the number of topics is an input variable. Specifically, in the method of determining the optimal number of topics, the method of selecting the number of topics at the point where the average value of the cosine similarity between each topic reaches the lowest and then rebounds while increasing the number of topics, and the average value of the cosine similarity between topics are stabilized. There is a technique to select the number of topics in the starting area (Elbow Point). Referring to FIG. 2, the topic definition unit 130 may determine the optimal number of topics by using the number of topics in an elbow point as an input variable.

토픽모델링의 결과물로 토픽-키워드 매트릭스와 토픽-문서 매트릭스가 산출될 수 있다. 토픽 정의부(130)는 토픽-문서 매트릭스를 통해 각 토픽에 할당된 문서(특허)를 확인 할 수 있으며, 토픽-키워드 매트릭스를 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.As a result of topic modeling, a topic-keyword matrix and a topic-document matrix may be calculated. The topic definition unit 130 may check a document (patent) assigned to each topic through the topic-document matrix, and may define a topic to be solved and a solution topic by using the topic-keyword matrix.

구축부(140)는 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 해결 과제 및 해결 수단과 기업의 관계를 파악하기 위해 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구체적으로, 구축부(140)는 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 대응일치 분석을 통해 해결 과제의 포지셔닝 맵과 해결 수단의 포지셔닝맵을 각각 구축할 수 있다. 상기 대응일치분석은 다차원척도 기법 중 하나이며 행과 열로 나타낼 수 있는 범주형 자료를 활용하여 행과 열의 유사성을 분석하고, 자료들의 상관관계를 2차원으로 파악할 수 있는 통계방법이다. 구축부(140)는 각 해결 과제 토픽 및 해결 수단 토픽에 대해 대응일치분석을 수행할 수 있다.The construction unit 140 may build a solution-to-solve means network and a solution-to-solve means positioning map on the basis of the solution-topic topic and the solution-measure topic. The construction unit 140 may construct a solution-to-solve means positioning map in order to grasp the relationship between the problem and the solution to be solved and the company. Specifically, the construction unit 140 may build a solution-to-solve means network and a solution-to-solve means positioning map for each interested company. The construction unit 140 may construct a positioning map of a problem to be solved and a positioning map of a solution to each other through correspondence analysis. Correspondence analysis is one of the multidimensional scale techniques, and is a statistical method capable of analyzing the similarity between rows and columns by using categorical data that can be represented by rows and columns, and to grasp the correlation between the data in two dimensions. The construction unit 140 may perform a correspondence analysis on each topic of the problem to be solved and the topic of the solution means.

도 3은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 포지셔닝 맵의 예를 도시한 도면이다.3 is a diagram illustrating an example of a problem-solving means positioning map of the apparatus for providing technology contention information according to an embodiment of the present disclosure.

도 3을 참조하면, 해결 과제-해결 수단 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽과 기업이 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있다는 것을 의미한다. 따라서 기업들이 동일한 해결 과제 토픽 및 해결 수단 토픽에 대해 가깝게 위치하면, 해당 해결 과제 토픽 및 해결 수단 토픽 분야에서 경쟁중인 기업들로 해석될 수 있으며, 반대로, 해결 과제 토픽 및 해결 수단 토픽과 상대적으로 가까운 기업이 없다면, 해당 영역은 아직 활발한 경쟁이 이루어지지 않는 영역으로 해석될 수 있다. 또한, 해결 수단 토픽으로부터 각 기업들의 기술 보유역량의 파악이 가능하며, 해결 과제 토픽으로부터 각 기업들이 해결하려는 세부 기술영역의 파악이 가능할 수 있다. 또한, 각 기업이 보유한 해결 과제와 해결 수단의 관계로부터 관심 기술 분야 내에서 유사한 세부 기술 영역에 속한 기업의 현황 파악이 가능할 수 있다.Referring to FIG. 3, the closer the company is to the solution topic or solution topic in the solution-to-solve means positioning map, the closer the company is to the subject to be solved or the solution topic. Therefore, if companies are located close to the same challenge topic and solution topic, they can be interpreted as competing companies in the corresponding solution topic and solution topic field. If there is no company, the area can be interpreted as an area where active competition has not yet occurred. In addition, it is possible to grasp each company's technology holding capability from the solution topic topic, and it is possible to grasp the detailed technology areas that each company is trying to solve from the solution topic topic. In addition, it is possible to grasp the current status of companies belonging to similar detailed technology areas within the technology area of interest from the relationship between the solutions to be solved by each company and the solution means.

구축부(140)는 관심 기업의 해결 과제, 해결 수단에 대한 기술 관심도 변화 파악을 위해 연 단위의 토픽 누적량(stock)을 산출할 수 있다. 토픽 누적량은 특허 출원일을 기준으로 특정 기간에 나타난 특허들의 누적량을 나타내며, 누적량의 분석을 통해 기업이 특정 기간 내에 어떤 토픽에 집중하였는지 파악할 수 있는 정보를 제공할 수 있다. 다시 말해, 토픽 누적량의 분석을 통해 관심 기업의 관심 기술 변화의 추적이 가능해 질 수 있다. The construction unit 140 may calculate an annual topic accumulation amount (stock) in order to grasp a change in the degree of technical interest in a solution to a company of interest and a solution to the solution. The topic cumulative amount represents the cumulative amount of patents appearing in a specific period based on the patent filing date, and through analysis of the cumulative amount, information that can be used to determine which topic the company focused on within a specific period can be provided. In other words, it is possible to track changes in technologies of interest of interested companies through analysis of the cumulative amount of topics.

도 4는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 네트워크의 예를 도시한 도면이다.4 is a diagram illustrating an example of a problem-solving means network of a technology contention information providing apparatus according to an embodiment of the present application.

구축부(140)는 기업별로 선정된 해결 과제 토픽 및 해결 수단 토픽을 연결하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 도 4를 참조하면, 해결 과제 토픽 및 해결 수단 토픽의 링크는 해결 과제-해결 수단 네트워크의 노드를 의미한다. 또한, 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 구체적으로, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수는 해결 과제 토픽 및 해결 수단 토픽의 링크 즉, 해결 과제 토픽 및 해결 수단 토픽 쌍의 수가 많을수록 해당 링크에 가중치가 부여될 수 있다. The construction unit 140 may establish a solution-to-solution network by connecting the solution-topic and solution-measure topics selected for each company. Referring to FIG. 4, a link of a solution topic and a solution means topic means a node of a solution-solution means network. In addition, the construction unit 140 may build a solution-solving means network by assigning weights to the problem-solving topic and the solution-measure topic based on the number of patents in which the problem-to-solve topic and the solution-measure topic frequently occur at the same time. Specifically, the number of patents in which the problem topic and the solution topic are frequent at the same time may be weighted as the number of links of the solution topic and the solution topic, that is, the number of the solution topic and the solution topic pair increases.

해결 과제-해결 수단 네트워크를 통해 해결 과제와 해결 수단에 대한 기업의 기술 역량 및 기술 집중도에 대한 정보를 제공할 수 있으며, 여러 기업의 해결 수단 및 해결 과제를 비교분석하여 같은 해결 과제에 대해 다른 해결 수단을 사용하는 기업들을 파악할 수 있으며. 이를 통해 보유한 해결 과제에 대한 새로운 해결 수단을 탐색할 수도 있다. 또한, 보유한 해결 수단을 기반으로 다른 해결 과제에 대한 사업 영역 확장의 가능성을 탐색할 수 있도록 할 수 있다.A solution network can provide information on a company's technical competence and technology concentration on the solution to be solved and the solution to be solved.The solution to the same problem can be solved by comparing and analyzing the solutions and challenges of different companies. You can identify the companies that are using the tool. Through this, you can also explore new solutions to your challenges. In addition, it is possible to explore the possibility of expanding the business area to other challenges based on the solutions they have.

또한, 구축부(140)는 기업별로 해결 과제-해결 수단 네트워크를 구축할 뿐만 아니라, 복수의 기업간 해결 과제-해결 수단 네트워크를 구축할 수 있다. 예시적으로, 해결 과제-해결 수단 네트워크에서 하나의 기업과 연계하여 정의된 해결 과제 토픽 및 해결 수단 토픽과 다른 기업과 연계하여 정의된 해결 과제 토픽 및 해결 수단 토픽은 서로 다른 색, 형태, 크기 중 어느 하나로 해결 과제-해결 수단 네트워크 상에 표시될 수 있다. 또한, 해결 과제 토픽 및 해결 수단 토픽의 링크의 색, 형태, 굵기 중 어느 하나가 각 기업마다 다르게 표시될 수 있다. 따라서, 기업간 해결 과제-해결 수단 네트워크를 통해 각 기업들이 공통적인 해결 과제 또는 해결 방안에 대한 파악이 가능할 수 있고, 동일한 해결 과제에 대해 서로 다른 해결 방안에 대한 현황 파악이 가능할 수 있다.In addition, the construction unit 140 may not only build a problem-solving means network for each company, but also build a plurality of problems-solving means network among a plurality of companies. For example, in the solution-to-solution network, a solution topic and solution topic defined in connection with one company, and a solution topic and solution topic defined in connection with another company are among different colors, shapes, and sizes. Either one can be displayed on the solution task-solution network. In addition, any one of the color, shape, and thickness of the link of the solution topic and the solution topic may be displayed differently for each company. Therefore, it is possible for each company to grasp a common problem or solution through a network of solutions between companies and solutions, and it may be possible to grasp the current status of different solutions for the same problem.

도 5는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 방법의 흐름을 도시한 도면이다.5 is a diagram illustrating a flow of a method for providing technology contention information according to an embodiment of the present application.

도 5에 도시된 기술 경쟁 정보 제공 방법은 앞선 도 1내지 도 4을 통해 설명된 기술 경쟁 정보 제공 방법(100)에 의하여 수행된다. 따라서, 이하 생략된 내용이라고 하더라도 도 1내지 도 4를 기술 경쟁 정보 제공 장치(100)에 대하여 설명된 내용은 도 5에도 동일하게 적용될 수 있다.The method for providing technology contention information illustrated in FIG. 5 is performed by the method 100 for providing technology contention information described with reference to FIGS. 1 to 4 above. Accordingly, even if the contents are omitted below, the contents described with respect to the apparatus 100 for providing technology contention information in FIGS. 1 to 4 may be equally applied to FIG. 5.

도 5를 참조하면, 단계 S510에서 수집부(110)는 특허 전문 데이터를 수집할 수 있다. 구체적으로, 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다. 또한, 수집부(110)는 IP5의 CAF협약에 따라 특허 출원시 발명의 명칭, 도면의 간단한 설명, 발명의 설명, 특허청구범위 등의 항목이 기재된 특허 전문을 수집할 수 있다. Referring to FIG. 5, in step S510, the collection unit 110 may collect patent full text data. Specifically, the collection unit 110 may select a company of interest and collect specialized patent data held by the company of interest. In addition, the collection unit 110 may collect the full text of a patent in which items such as the name of the invention, a brief description of the drawings, a description of the invention, and the claims are described when a patent is applied for a patent according to the CAF agreement of IP5.

단계 S520에서 키워드 추출부(120)는 특허 전문 데이터로부터 항목별 키워드를 추출할 수 있다. 예시적으로, 키워드 추출부(120)는 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 항목별 키워드를 추출할 수 있다. 키워드 추출부(120)는 RAKE를 통해 추출된 키워드들 중, 기술적으로 의미가 없거나 문서를 작성할 때 통상적으로 사용하는 접속사 같은 불용키워드를 제거한다. 또한, 키워드 추출부(120)는 Python과 같은 프로그래밍 언어를 이용하여발명의 상세한 설명의 항목으로부터 해결 과제 키워드와 해결 수단 키워드를 추출할 수 있다.In step S520, the keyword extracting unit 120 may extract a keyword for each item from the patent full text data. For example, the keyword extracting unit 120 may extract a keyword for each item from a background description item of a patent full text, a task item to be solved, and a solution item of the task. The keyword extraction unit 120 removes unused keywords such as conjunctions that are technically meaningless or commonly used when creating a document from among keywords extracted through RAKE. In addition, the keyword extracting unit 120 may extract a keyword for a solution and a keyword for a solution from the items of the detailed description of the invention using a programming language such as Python.

단계 S530에서 토픽 정의부(130)는 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 토픽 모델링이란 유사한 주제의 문서는 유사한 키워드를 포함한다는 전제로 이루어지는 소프트 클러스터링 방법이다. 상기 토픽은 키워드의 집합으로 이루어져 있으며, 토픽에 속하는 문서는 문서의 주제를 키워드 집합을 통해 정의할 수 있다. 예시적으로, 토픽 정의부(130)는 LDA모델을 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 또한, 토픽 정의부(130)는 키워드 추출부(120)에서 추출된 항목별 키워드의 집합을 이용하여 토픽 모델링을 진행할 수 있다. 또한, 토픽 정의부(130)는 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다. 토픽 정의부(130)는 토픽 수를 결정하는 기법 중 Elbow Point에서의 토픽 수를 투입 변수로 활용하여 최적 토픽의 수로 결정할 수 있다.In step S530, the topic definition unit 130 may define a topic to be solved and a topic to be solved through topic modeling from keywords for each item. Topic modeling is a soft clustering method that is made on the premise that documents of similar subjects contain similar keywords. The topic consists of a set of keywords, and a document belonging to the topic may define the subject of the document through a set of keywords. For example, the topic definition unit 130 may define a topic to be solved and a topic to be solved by using the LDA model. In addition, the topic definition unit 130 may perform topic modeling using a set of keywords for each item extracted by the keyword extraction unit 120. Also, the topic definition unit 130 may determine the optimal number of topics from an average value of similarity between topics based on a topic model in which the number of topics is an input variable. The topic definition unit 130 may determine the optimal number of topics by using the number of topics at the Elbow Point as an input variable among techniques for determining the number of topics.

토픽모델링의 결과물로 토픽-키워드 매트릭스와 토픽-문서 매트릭스가 산출될 수 있다. 토픽 정의부(130)는 토픽-문서 매트릭스를 통해 각 토픽에 할당된 문서(특허)를 확인 할 수 있으며, 토픽-키워드 매트릭스를 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.As a result of topic modeling, a topic-keyword matrix and a topic-document matrix may be calculated. The topic definition unit 130 may check a document (patent) assigned to each topic through the topic-document matrix, and may define a topic to be solved and a solution topic by using the topic-keyword matrix.

단계 S540에서 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 해결 과제 및 해결 수단과 기업의 관계를 파악하기 위해 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구체적으로, 구축부(140)는 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 대응일치 분석을 통해 해결 과제의 포지셔닝 맵과 해결 수단의 포지셔닝맵을 각각 구축할 수 있다. 또한, 구축부(140)는 각 해결 과제 토픽 및 해결 수단 토픽에 대해 대응일치분석을 수행할 수 있다.In step S540, the construction unit 140 may build a solution-to-solve means network and a solution-to-solve means positioning map based on the solution-topic topic and the solution-measure topic. The construction unit 140 may construct a solution-to-solve means positioning map in order to grasp the relationship between the problem and the solution to be solved and the company. Specifically, the construction unit 140 may build a solution-to-solve means network and a solution-to-solve means positioning map for each interested company. The construction unit 140 may construct a positioning map of a problem to be solved and a positioning map of a solution to each other through correspondence analysis. In addition, the construction unit 140 may perform a correspondence analysis for each topic to be solved and a topic to be solved.

구축부(140)는 관심 기업의 해결 과제, 해결 수단에 대한 기술 관심도 변화 파악을 위해 연 단위의 토픽 누적량(stock)을 산출할 수 있다. 토픽 누적량은 특허 출원일을 기준으로 특정 기간에 나타난 특허들의 누적량을 나타내며, 누적량의 분석을 통해 기업이 특정 기간 내에 어떤 토픽에 집중하였는지 파악할 수 있는 정보를 제공할 수 있다. 다시 말해, 토픽 누적량의 분석을 통해 관심 기업의 관심 기술 변화의 추적이 가능해 질 수 있다. The construction unit 140 may calculate an annual topic accumulation amount (stock) in order to grasp a change in the degree of technical interest in a solution to a company of interest and a solution to the solution. The topic cumulative amount represents the cumulative amount of patents appearing in a specific period based on the patent filing date, and through analysis of the cumulative amount, information that can be used to determine which topic the company focused on within a specific period can be provided. In other words, it is possible to track changes in technologies of interest of interested companies through analysis of the cumulative amount of topics.

구축부(140)는 기업별로 선정된 해결 과제 토픽 및 해결 수단 토픽을 연결하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 또한, 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 구체적으로, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수는 해결 과제 토픽 및 해결 수단 토픽의 링크 즉, 해결 과제 토픽 및 해결 수단 토픽 쌍의 수가 많을수록 해당 링크에 가중치가 부여될 수 있다. The construction unit 140 may establish a solution-to-solution network by connecting the solution-topic and solution-measure topics selected for each company. In addition, the construction unit 140 may build a solution-solving means network by assigning weights to the problem-solving topic and the solution-measure topic based on the number of patents in which the problem-to-solve topic and the solution-measure topic frequently occur at the same time. Specifically, the number of patents in which the problem topic and the solution topic are frequent at the same time may be weighted as the number of links of the solution topic and the solution topic, that is, the number of the solution topic and the solution topic pair increases.

본원의 일 실시 예에 따른, 기술 경쟁 정보 제공 방법은, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.The method of providing technology competition information according to an embodiment of the present disclosure may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. The computer-readable medium may include program instructions, data files, data structures, and the like alone or in combination. The program instructions recorded on the medium may be specially designed and configured for the present invention, or may be known and usable to those skilled in computer software. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tapes, optical media such as CD-ROMs and DVDs, and magnetic media such as floptical disks. -A hardware device specially configured to store and execute program instructions such as magneto-optical media, and ROM, RAM, flash memory, and the like. Examples of the program instructions include not only machine language codes such as those produced by a compiler, but also high-level language codes that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operation of the present invention, and vice versa.

전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.The foregoing description of the present application is for illustrative purposes only, and those of ordinary skill in the art to which the present application pertains will be able to understand that it can be easily modified into other specific forms without changing the technical spirit or essential features of the present application. Therefore, it should be understood that the embodiments described above are illustrative and non-limiting in all respects. For example, each component described as a single type may be implemented in a distributed manner, and similarly, components described as being distributed may also be implemented in a combined form.

본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.The scope of the present application is indicated by the claims to be described later rather than the detailed description, and all changes or modified forms derived from the meaning and scope of the claims and their equivalent concepts should be interpreted as being included in the scope of the present application.

100: 기술 경쟁 정보 제공 장치
110: 수집부
120: 키워드 추출부
130: 토픽 정의부
140: 구축부
100: technology competition information providing device
110: collection unit
120: keyword extraction unit
130: Topic Definition Department
140: construction

Claims (13)

컴퓨터로 구현되는 기술 경쟁 정보 제공 장치에 의해 각 단계가 수행되는 기술 경쟁 정보 제공 방법에 있어서,
(a) 특허 전문 데이터를 수집하는 단계;
(b) 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 단계;
(c) 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 단계; 및
(d) 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 단계;
를, 포함하고,
상기 (d)단계는,
대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하되,
상기 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽의 위치와 기업의 위치가 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있는 것으로 해석되고,
상기 포지셔닝 맵에 표시된 기업들이 동일한 해결 과제 토픽 또는 해결 수단 토픽에 대해 상대적으로 가깝게 위치하면, 상기 기업들은 해당 해결 과제 토픽 또는 해결 수단 토픽 분야에서 경쟁 중인 기업들로 해석되되, 해결 과제 토픽 또는 해결 수단 토픽과 상대적으로 가까운 기업이 없으면, 해당 해결 과제 토픽 또는 해결 수단 토픽 분야는 상대적으로 활발한 경쟁이 이루어지지 않는 것으로 해석되고,
상기 해결 과제 토픽 및 상기 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축하는 것인, 기술 경쟁 정보 제공 방법.
In the technology competition information providing method in which each step is performed by a technology competition information providing device implemented by a computer,
(a) collecting patent full text data;
(b) extracting keywords for each item from the patent full text data;
(c) defining a topic to be solved and a topic to be solved through topic modeling from the keyword for each item; And
(d) building a problem-solving means network and a problem-solving means positioning map based on the problem-solving means topic and the problem-solving means topic;
Including,
The step (d),
Construct the above-mentioned problem-solving means positioning map through correspondence analysis,
In the above positioning map, the closer the location of the problem topic or solution topic to the company's location is, the more the company is interpreted to be focusing on the corresponding problem topic or solution topic,
If the companies displayed on the positioning map are located relatively close to the same problem topic or solution topic, the companies are interpreted as competing companies in the corresponding problem topic or solution topic field, but the solution topic or solution If there is no company relatively close to the topic, it is interpreted that there is no relatively active competition in the subject to be solved or the topic of the solution,
The method of providing a technology competition information by assigning weights to the problem topic and the solution topic on the basis of the number of patents in which the problem topic and the solution topic are frequent simultaneously.
제1항에 있어서,
상기 (a) 단계는,
(a1) 관심 기업을 선정하는 단계; 및
(a2) 관심 기업이 보유한 특허 전문 데이터를 수집하는 단계,
를 포함하고,
상기 (d) 단계는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 것인, 기술 경쟁 정보 제공 방법.
The method of claim 1,
The step (a),
(a1) selecting a company of interest; And
(a2) collecting patent professional data owned by the interested company,
Including,
The step (d) is to build a solution-to-solve means network and a solution-to-solve means positioning map for each interested company.
제1항에 있어서,
상기 (b) 단계는,
특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출하는 것인, 기술 경쟁 정보 제공 방법.
The method of claim 1,
The step (b),
A method for providing technology competition information by extracting the keyword for each item from the background description item of the patent full text, the subject item to be solved, and the item solution means item of the subject.
제1항에 있어서,
상기 (b) 단계는,
언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거하는 것인, 기술 경쟁 정보 제공 방법.
The method of claim 1,
The step (b),
To extract the keyword for each item based on a language independent keyword algorithm, and to remove the obsolete keyword, technology competition information providing method.
제1항에 있어서,
상기 (c) 단계는,
토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽의 수를 결정하고, 토픽모델링으로부터 산출된 토픽-키워드 매트릭스에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽을 정의하는 것인, 기술 경쟁 정보 제공 방법.
The method of claim 1,
The step (c),
Based on a topic model in which the number of topics is an input variable, the number of topics to be solved and the number of topics to be solved is determined based on an average value of similarity between topics, and the number of topics-keyword matrix calculated from topic modeling is determined. To define a solution topic and the solution topic topic, technology competition information providing method.
삭제delete 기술 경쟁 정보 제공 장치에 있어서,
특허 전문 데이터를 수집하는 수집부;
상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부;
상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부; 및
상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부,
를 포함하고,
상기 구축부는
대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하되,
상기 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽의 위치와 기업의 위치가 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있는 것으로 해석되고,
상기 포지셔닝 맵에 표시된 기업들이 동일한 해결 과제 토픽 또는 해결 수단 토픽에 대해 상대적으로 가깝게 위치하면, 상기 기업들은 해당 해결 과제 토픽 또는 해결 수단 토픽 분야에서 경쟁중인 기업들로 해석되되, 해결 과제 토픽 또는 해결 수단 토픽과 상대적으로 가까운 기업이 없으면, 해당 해결 과제 토픽 또는 해결 수단 토픽 분야는 상대적으로 활발한 경쟁이 이루어지지 않는 것으로 해석되고,
상기 해결 과제 토픽 및 상기 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축하는 것인, 기술 경쟁 정보 제공 장치.
In the technology competition information providing device,
A collection unit for collecting patent professional data;
A keyword extracting unit for extracting a keyword for each item from the patent full text data;
A topic definition unit defining a topic to be solved and a topic to be solved through topic modeling from the keyword for each item; And
A construction unit for constructing a solution problem-solving means network and a solution-solving means positioning map on the basis of the problem-solving topic and the solution-measured topic,
Including,
The construction unit
Construct the above-mentioned problem-solving means positioning map through correspondence analysis,
In the above positioning map, the closer the location of the problem topic or solution topic to the company's location is, the more the company is interpreted to be focusing on the corresponding problem topic or solution topic,
If the companies displayed in the positioning map are located relatively close to the same problem topic or solution topic, the companies are interpreted as competing companies in the corresponding problem topic or solution topic field, but the solution topic or solution If there is no company relatively close to the topic, it is interpreted that there is no relatively active competition in the subject to be solved or the topic of the solution,
The technology competition information providing apparatus, wherein the problem-solving means network is constructed by assigning weights to the problem-solving topic and the solution-measure topic based on the number of patents in which the problem topic and the solution means topic are frequent at the same time.
제7항에 있어서,
상기 수집부는,
관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집하되,
상기 구축부는,
관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 것인, 기술 경쟁 정보 제공 장치.
The method of claim 7,
The collection unit,
Selecting companies of interest and collecting patent professional data owned by companies of interest,
The construction unit,
A technology competition information providing device that builds a problem-solving means network and a solution-solving means positioning map for each interested company.
제7항에 있어서,
상기 키워드 추출부는,
특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출하는 것인, 기술 경쟁 정보 제공 장치.
The method of claim 7,
The keyword extraction unit,
The technology competition information providing apparatus for extracting the keyword for each item from the background description item of the patent full text, the subject item to be solved, and the item solution means item of the subject.
제7항에 있어서,
상기 키워드 추출부는,
언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거하는 것인, 기술 경쟁 정보 제공 장치.
The method of claim 7,
The keyword extraction unit,
Extracting the keyword for each item based on a language-independent keyword algorithm, and removing unused keywords.
제7항에 있어서,
상기 토픽 정의부는,
토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽의 수를 결정하고, 토픽모델링으로부터 산출된 토픽-키워드 매트릭스에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽을 정의하는 것인, 기술 경쟁 정보 제공 장치.
The method of claim 7,
The topic definition unit,
Based on a topic model in which the number of topics is an input variable, the number of topics to be solved and the number of topics to be solved is determined based on an average value of similarity between topics, and the number of topics-keyword matrix calculated from topic modeling is determined. To define a solution topic and the solution topic topic, technology competition information providing apparatus.
삭제delete 제 1항 내지 제5항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체.A computer-readable recording medium storing a program for executing the method of any one of claims 1 to 5 on a computer.
KR1020180158342A 2018-12-10 2018-12-10 Device and method for providing technological competitive intelligence KR102221267B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180158342A KR102221267B1 (en) 2018-12-10 2018-12-10 Device and method for providing technological competitive intelligence

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180158342A KR102221267B1 (en) 2018-12-10 2018-12-10 Device and method for providing technological competitive intelligence

Publications (2)

Publication Number Publication Date
KR20200070809A KR20200070809A (en) 2020-06-18
KR102221267B1 true KR102221267B1 (en) 2021-03-02

Family

ID=71143287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180158342A KR102221267B1 (en) 2018-12-10 2018-12-10 Device and method for providing technological competitive intelligence

Country Status (1)

Country Link
KR (1) KR102221267B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102518843B1 (en) * 2022-07-12 2023-04-06 망고클라우드 주식회사 Enterprise content management system using a latene dirichlet allocation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057068A (en) 2017-09-20 2019-04-11 株式会社野村総合研究所 Information processor and computer program

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100966106B1 (en) * 2008-06-17 2010-06-28 한국과학기술원 Method for evaluating Technology and Service and forming Service-Oriented Technology Roadmap on the basis of Patent Information
KR20100127036A (en) * 2009-05-25 2010-12-03 엘지전자 주식회사 A method for providing idea maps by using classificaion in terms of viewpoints
KR101616544B1 (en) * 2014-03-03 2016-04-28 고려대학교 산학협력단 Method for analyzing patent documents using a latent dirichlet allocation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057068A (en) 2017-09-20 2019-04-11 株式会社野村総合研究所 Information processor and computer program

Also Published As

Publication number Publication date
KR20200070809A (en) 2020-06-18

Similar Documents

Publication Publication Date Title
Xu Understanding graph embedding methods and their applications
Berahmand et al. A modified DeepWalk method for link prediction in attributed social network
Kühl et al. Supporting customer-oriented marketing with artificial intelligence: automatically quantifying customer needs from social media
Weismayer et al. Identifying emerging research fields: a longitudinal latent semantic keyword analysis
Neshati et al. On dynamicity of expert finding in community question answering
US9251465B2 (en) System and methods for interactive displays based on associations for machine-guided rule creation
US10565233B2 (en) Suffix tree similarity measure for document clustering
Banerjee et al. Analyzing collective behavior from blogs using swarm intelligence
US9117174B2 (en) System for efficiently generating K-maximally predictive association rules with a given consequent
Kazai et al. Quality management in crowdsourcing using gold judges behavior
Santra et al. Classification of web log data to identify interested users using Naïve Bayesian classification
US20150242762A1 (en) Generating and displaying canonical rule sets with dimensional targets
Morales-Ramirez et al. Exploiting user feedback in tool-supported multi-criteria requirements prioritization
US20190340517A2 (en) A method for detection and characterization of technical emergence and associated methods
Al-Najran et al. A requirements specification framework for big data collection and capture
Jafarzadeh et al. A semantic approach to post-retrieval query performance prediction
Burleson et al. Engineering for global development: Characterizing the discipline through a systematic literature review
CN105159879A (en) Automatic determination method for network individual or group values
Kaur Web content classification: a survey
KR102221267B1 (en) Device and method for providing technological competitive intelligence
Wei et al. Algorithm of mining sequential patterns for web personalization services
Broda et al. Evaluation method for automated wordnet expansion
Nicoletti et al. Towards software architecture documents matching stakeholders’ interests
Pretolesi et al. Geometric Deep Learning Strategies for the Characterization of Academic Collaboration Networks
Alserafi et al. DS-Prox: Dataset proximity mining for governing the data lake

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant