KR102221267B1 - 기술 경쟁 정보 제공 장치 및 방법 - Google Patents

기술 경쟁 정보 제공 장치 및 방법 Download PDF

Info

Publication number
KR102221267B1
KR102221267B1 KR1020180158342A KR20180158342A KR102221267B1 KR 102221267 B1 KR102221267 B1 KR 102221267B1 KR 1020180158342 A KR1020180158342 A KR 1020180158342A KR 20180158342 A KR20180158342 A KR 20180158342A KR 102221267 B1 KR102221267 B1 KR 102221267B1
Authority
KR
South Korea
Prior art keywords
topic
solution
item
keyword
company
Prior art date
Application number
KR1020180158342A
Other languages
English (en)
Other versions
KR20200070809A (ko
Inventor
윤장혁
이지호
정병기
고남욱
오승현
Original Assignee
건국대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 건국대학교 산학협력단 filed Critical 건국대학교 산학협력단
Priority to KR1020180158342A priority Critical patent/KR102221267B1/ko
Publication of KR20200070809A publication Critical patent/KR20200070809A/ko
Application granted granted Critical
Publication of KR102221267B1 publication Critical patent/KR102221267B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Educational Administration (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Development Economics (AREA)
  • Databases & Information Systems (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치는, 특허 전문 데이터를 수집하는 수집부, 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부, 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부 및 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부를 포함할 수 있다.

Description

기술 경쟁 정보 제공 장치 및 방법{DEVICE AND METHOD FOR PROVIDING TECHNOLOGICAL COMPETITIVE INTELLIGENCE}
본원은 기술 경쟁 정보 제공 장치 및 방법에 관한 것이다.
기술경쟁 동향을 파악하는 것은 기업의 지속 가능 성장을 위해 필수적이다. 최근 기술개발의 불확실성이 증가하고 기술경쟁이 심화됨에 따라, 전략적으로 기술을 관리하고 동향을 파악하는 활동의 중요성이 점차 높아지고 있다. 또한 경쟁기업이 보유한 기술들은 잠재적 위험요소로 작용할 수 있기 때문에, 기술개발 과정에서 경쟁기업의 기술 동향을 파악하는 것은 매우 중요한 요소이다.
기존의 기술 동향 파악은 전문가의 분석에 의존하는 정성적인 방법이 주로 이용되었으나, 기존의 방법은 평가 결과에 대한 객관성이 부족할 수 있으며, 시간 및 비용과 같은 자원의 소모가 크다는 한계점이 존재한다. 이러한 한계를 보완하기 위해 특허, 소셜 데이터 등 대량의 데이터를 이용한 정량적 분석 방법들이 연구된 바 있으며, 최근 데이터의 수집 경로가 다양해지고 고수준의 분석 방법이 보편화되면서 다양한 데이터를 이용한 연구들이 활발히 진행되고 있다. 그중 특허를 이용한 분석은 특허가 상업적 가치를 가지고 있는 기술에 대한 문서라는 특징 때문에, 기업의 의사결정과정과 기술 전략을 수립하기 위한 필수적인 단계로 인식되고 있다.
특허 기술의 분석 방식 중 주요하게 활용되는 텍스트 정보를 이용한 분석은 텍스트마이닝이나 자연어처리 기법 등을 활용하여 특허 텍스트를 분석하는 분석 기법이다. 그러나, 특허 텍스트 기반의 연구들은 특허명세서를 구성하는 항목들의 특성에 대한 고려 없이 청구항 도는 전문을 단지 하나의 평문(Plain Text)으로 인식하고 텍스트를 분석하였기 때문에, ‘배경기술’, ‘해결하려는 과제’, ‘과제의 해결수단’ 등과 같은 특허명세서의 항목별 특성을 활용하지 못하는 한계점이 있다.
본원의 배경이 되는 기술은 한국특허공개공보 제10-1616544 호에 개시되어 있다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 특허 명세서에 항목별로 기재된 사항으로부터 해결 과제와 해결 수단을 도출하고, 관심 기업의 해결과제 및 해결 수단의 동향을 분석할 수 있는 정보를 제공할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공하는 것을 목적으로 한다.
본원은 전술한 종래 기술의 문제점을 해결하기 위한 것으로서, 해결 과제와 해결 수단으로부터 해결 과제-해결 수단 네트워크와 포지셔닝 맵을 구축할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공하는 것을 목적으로 한다.
다만, 본원의 실시예가 이루고자 하는 기술적 과제는 상기된 바와 같은 기술적 과제들로 한정되지 않으며, 또 다른 기술적 과제들이 존재할 수 있다.
상기한 기술적 과제를 달성하기 위한 기술적 수단으로서, 기술 경쟁 정보 제공 방법에 있어서, (a) 특허 전문 데이터를 수집하는 단계, (b) 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 단계, (c) 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 단계 및 (d) 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 단계를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 (a) 단계는, (a1) 관심 기업을 선정하는 단계; 및 (a2) 관심 기업이 보유한 특허 전문 데이터를 수집하는 단계를 포함하고, 상기 (d) 단계는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다.
본원의 일 실시예에 따르면, 상기 (b) 단계는, 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출할 수 있다.
본원의 일 실시예에 따르면, 상기 (b) 단계는, 언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다.
본원의 일 실시예에 따르면, 상기 (c) 단계는, 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다.
본원의 일 실시예에 따르면, 상기 (d)단계는, 대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하고, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다.
본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치는, 특허 전문 데이터를 수집하는 수집부, 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부, 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부 및 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부를 포함할 수 있다.
본원의 일 실시예에 따르면, 상기 수집부는, 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집하되, 상기 구축부는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다.
본원의 일 실시예에 따르면, 상기 키워드 추출부는, 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출할 수 있다.
본원의 일 실시예에 따르면, 상기 키워드 추출부는, 언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다.
본원의 일 실시예에 따르면, 상기 토픽 정의부는, 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다.
본원의 일 실시예에 따르면, 상기 구축부는, 대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하고, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다.
상술한 과제 해결 수단은 단지 예시적인 것으로서, 본원을 제한하려는 의도로 해석되지 않아야 한다. 상술한 예시적인 실시예 외에도, 도면 및 발명의 상세한 설명에 추가적인 실시예가 존재할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 특허 명세서에 항목별로 기재된 사항으로부터 해결 과제와 해결 수단을 도출하고, 관심 기업의 해결과제 및 해결 수단의 동향을 분석할 수 있는 정보를 제공할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공할 수 있다.
전술한 본원의 과제 해결 수단에 의하면, 해결 과제와 해결 수단으로부터 해결 과제-해결 수단 네트워크와 포지셔닝 맵을 구축할 수 있는 기술 경쟁 정보 제공 장치 및 방법을 제공할 수 있다.
도 1은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 구성을 도시한 도면이다.
도 2는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 토픽 모델링의 예를 도시한 도면이다.
도 3은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 포지셔닝 맵의 예를 도시한 도면이다.
도 4는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 네트워크의 예를 도시한 도면이다.
도 5는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 방법의 흐름을 도시한 도면이다.
아래에서는 첨부한 도면을 참조하여 본원이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 본원의 실시예를 상세히 설명한다. 그러나 본원은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본원을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
본원 명세서 전체에서, 어떤 부분이 다른 부분과 "연결"되어 있다고 할 때, 이는 "직접적으로 연결"되어 있는 경우뿐 아니라, 그 중간에 다른 소자를 사이에 두고 "전기적으로 연결"되어 있는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부재가 다른 부재 "상에", "상부에", "상단에", "하에", "하부에", "하단에" 위치하고 있다고 할 때, 이는 어떤 부재가 다른 부재에 접해 있는 경우뿐 아니라 두 부재 사이에 또 다른 부재가 존재하는 경우도 포함한다.
본원 명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함" 한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
도 1은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 구성을 도시한 도면이다.
도 1을 참조하면, 기술 경쟁 정보 제공 장치(100)는, 수집부(110), 키워드 추출부(120), 토픽 정의부(130) 및 구축부(140)를 포함할 수 있다. 수집부(110)는 특허 전문 데이터를 수집할 수 있다. 구체적으로, 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다. 본 기술 경쟁 정보 제공 장치(100)는 기술에 대한 특허 문서를 분석하여 해당 특허가 다루고 있는 기술이 근본적으로 해결하고자 하는 과제(problem) 즉, 목적과, 목적을 해결하기 위한 수단(solution)을 파악할 수 있다. 기술 경쟁 정보 제공 장치(100)는 목적과 수단의 관계를 해석하여 기업들의 경쟁 정보 분석을 위한 정보를 제공할 수 있으며, 이를 통해 보다 구체적인 기술 동향의 분석이 가능해 질 수 있다.
먼저, 기술 경쟁 정보를 제공하기 위해서는 관심 기술분야 및 관심 기술분야에 대한 관심 기업을 선정할 필요가 있다. 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다.
또한, 수집부(110)는 IP5의 CAF협약에 따라 특허 출원시 발명의 명칭, 도면의 간단한 설명, 발명의 설명, 특허청구범위 등의 항목이 기재된 특허 전문을 수집할 수 있다.
키워드 추출부(120)는 특허 전문 데이터로부터 항목별 키워드를 추출할 수 있다. 예시적으로, 키워드 추출부(120)는 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 항목별 키워드를 추출할 수 있다. 배경 기술 항목 및 해결하려는 과제 항목은 이전 발명에 대한 설명과 이전 발명이 해결하지 못한 문제점 등을 포함하고 있으므로, 해결 과제(problem)에 대한 키워드를 추출할 수 있다. 또한, 과제의 해결 수단 항목은 특허가 제안하는 기술적인 방법을 포함하고 있으므로, 해결 수단(solution)에 대한 키워드를 추출할 수 있다. 키워드 추출부(120)는 언어 독립적 키워드 알고리즘에 기초하여 항목별 키워드를 추출하고, 불용키워드를 제거할 수 있다. 키워드를 추출하는 기법에는 다양한 알고리즘이 존재하며, 키워드 추출부(120)는 언어 독립적 키워드 추출 알고리즘인 Rapid Automatic Keyword Extraction (RAKE)을 사용한다. 키워드 추출부(120)는 RAKE 알고리즘을 통해 추출된 키워드들 중, 기술적으로 의미가 없거나 문서를 작성할 때 통상적으로 사용하는 접속사 같은 불용키워드를 제거한다.
또한, 키워드 추출부(120)는 Python과 같은 프로그래밍 언어를 이용하여 발명의 상세한 설명의 항목으로부터 해결 과제 키워드와 해결 수단 키워드를 추출할 수 있다.
토픽 정의부(130)는 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 토픽 모델링이란 유사한 주제의 문서는 유사한 키워드를 포함한다는 전제로 이루어지는 소프트 클러스터링 방법이다. 상기 토픽은 키워드의 집합으로 이루어져 있으며, 토픽에 속하는 문서는 문서의 주제를 키워드 집합을 통해 정의할 수 있다. 토픽 모델링을 위한 모델에는 Latent Semantic Analysis(LSA), Probabilistic Latent Semantic Analysis(pLSA), Latent Dirichlet Allocatopn(LDA) 등이 있다. 그 중 LDA는 다른 모델들에 비해 과적합 문제가 적으며, 새로운 문서에 대해서도 쉽게 일반화를 할 수 있다는 장점이 있다. 또한 성능적으로도 우수하여 가장 널리 활용되는 모델이다. 따라서, 토픽 정의부(130)는 LDA모델을 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.
도 2는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 토픽 모델링의 예를 도시한 도면이다.
토픽 정의부(130)는 키워드 추출부(120)에서 추출된 항목별 키워드의 집합을 이용하여 토픽 모델링을 진행할 수 있다. 또한, 토픽 정의부(130)는 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다. 구체적으로, 최적의 토픽 수를 결정하는 기법에는 토픽 수를 늘려가며 각 토픽 간 코사인 유사도의 평균값이 최하에 도달했다가 반등하는 지점의 토픽 수를 선정하는 기법과 토픽 간 코사인 유사도의 평균값이 안정화되기 시작하는 부근(Elbow Point)의 토픽 수를 선정하는 기법이 있다. 도 2를 참조하면, 토픽 정의부(130)는 Elbow Point에서의 토픽 수를 투입 변수로 활용하여 최적 토픽의 수로 결정할 수 있다.
토픽모델링의 결과물로 토픽-키워드 매트릭스와 토픽-문서 매트릭스가 산출될 수 있다. 토픽 정의부(130)는 토픽-문서 매트릭스를 통해 각 토픽에 할당된 문서(특허)를 확인 할 수 있으며, 토픽-키워드 매트릭스를 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.
구축부(140)는 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 해결 과제 및 해결 수단과 기업의 관계를 파악하기 위해 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구체적으로, 구축부(140)는 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 대응일치 분석을 통해 해결 과제의 포지셔닝 맵과 해결 수단의 포지셔닝맵을 각각 구축할 수 있다. 상기 대응일치분석은 다차원척도 기법 중 하나이며 행과 열로 나타낼 수 있는 범주형 자료를 활용하여 행과 열의 유사성을 분석하고, 자료들의 상관관계를 2차원으로 파악할 수 있는 통계방법이다. 구축부(140)는 각 해결 과제 토픽 및 해결 수단 토픽에 대해 대응일치분석을 수행할 수 있다.
도 3은 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 포지셔닝 맵의 예를 도시한 도면이다.
도 3을 참조하면, 해결 과제-해결 수단 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽과 기업이 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있다는 것을 의미한다. 따라서 기업들이 동일한 해결 과제 토픽 및 해결 수단 토픽에 대해 가깝게 위치하면, 해당 해결 과제 토픽 및 해결 수단 토픽 분야에서 경쟁중인 기업들로 해석될 수 있으며, 반대로, 해결 과제 토픽 및 해결 수단 토픽과 상대적으로 가까운 기업이 없다면, 해당 영역은 아직 활발한 경쟁이 이루어지지 않는 영역으로 해석될 수 있다. 또한, 해결 수단 토픽으로부터 각 기업들의 기술 보유역량의 파악이 가능하며, 해결 과제 토픽으로부터 각 기업들이 해결하려는 세부 기술영역의 파악이 가능할 수 있다. 또한, 각 기업이 보유한 해결 과제와 해결 수단의 관계로부터 관심 기술 분야 내에서 유사한 세부 기술 영역에 속한 기업의 현황 파악이 가능할 수 있다.
구축부(140)는 관심 기업의 해결 과제, 해결 수단에 대한 기술 관심도 변화 파악을 위해 연 단위의 토픽 누적량(stock)을 산출할 수 있다. 토픽 누적량은 특허 출원일을 기준으로 특정 기간에 나타난 특허들의 누적량을 나타내며, 누적량의 분석을 통해 기업이 특정 기간 내에 어떤 토픽에 집중하였는지 파악할 수 있는 정보를 제공할 수 있다. 다시 말해, 토픽 누적량의 분석을 통해 관심 기업의 관심 기술 변화의 추적이 가능해 질 수 있다.
도 4는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 장치의 해결 과제-해결 수단 네트워크의 예를 도시한 도면이다.
구축부(140)는 기업별로 선정된 해결 과제 토픽 및 해결 수단 토픽을 연결하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 도 4를 참조하면, 해결 과제 토픽 및 해결 수단 토픽의 링크는 해결 과제-해결 수단 네트워크의 노드를 의미한다. 또한, 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 구체적으로, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수는 해결 과제 토픽 및 해결 수단 토픽의 링크 즉, 해결 과제 토픽 및 해결 수단 토픽 쌍의 수가 많을수록 해당 링크에 가중치가 부여될 수 있다.
해결 과제-해결 수단 네트워크를 통해 해결 과제와 해결 수단에 대한 기업의 기술 역량 및 기술 집중도에 대한 정보를 제공할 수 있으며, 여러 기업의 해결 수단 및 해결 과제를 비교분석하여 같은 해결 과제에 대해 다른 해결 수단을 사용하는 기업들을 파악할 수 있으며. 이를 통해 보유한 해결 과제에 대한 새로운 해결 수단을 탐색할 수도 있다. 또한, 보유한 해결 수단을 기반으로 다른 해결 과제에 대한 사업 영역 확장의 가능성을 탐색할 수 있도록 할 수 있다.
또한, 구축부(140)는 기업별로 해결 과제-해결 수단 네트워크를 구축할 뿐만 아니라, 복수의 기업간 해결 과제-해결 수단 네트워크를 구축할 수 있다. 예시적으로, 해결 과제-해결 수단 네트워크에서 하나의 기업과 연계하여 정의된 해결 과제 토픽 및 해결 수단 토픽과 다른 기업과 연계하여 정의된 해결 과제 토픽 및 해결 수단 토픽은 서로 다른 색, 형태, 크기 중 어느 하나로 해결 과제-해결 수단 네트워크 상에 표시될 수 있다. 또한, 해결 과제 토픽 및 해결 수단 토픽의 링크의 색, 형태, 굵기 중 어느 하나가 각 기업마다 다르게 표시될 수 있다. 따라서, 기업간 해결 과제-해결 수단 네트워크를 통해 각 기업들이 공통적인 해결 과제 또는 해결 방안에 대한 파악이 가능할 수 있고, 동일한 해결 과제에 대해 서로 다른 해결 방안에 대한 현황 파악이 가능할 수 있다.
도 5는 본원의 일 실시예에 따른 기술 경쟁 정보 제공 방법의 흐름을 도시한 도면이다.
도 5에 도시된 기술 경쟁 정보 제공 방법은 앞선 도 1내지 도 4을 통해 설명된 기술 경쟁 정보 제공 방법(100)에 의하여 수행된다. 따라서, 이하 생략된 내용이라고 하더라도 도 1내지 도 4를 기술 경쟁 정보 제공 장치(100)에 대하여 설명된 내용은 도 5에도 동일하게 적용될 수 있다.
도 5를 참조하면, 단계 S510에서 수집부(110)는 특허 전문 데이터를 수집할 수 있다. 구체적으로, 수집부(110)는 관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집할 수 있다. 또한, 수집부(110)는 IP5의 CAF협약에 따라 특허 출원시 발명의 명칭, 도면의 간단한 설명, 발명의 설명, 특허청구범위 등의 항목이 기재된 특허 전문을 수집할 수 있다.
단계 S520에서 키워드 추출부(120)는 특허 전문 데이터로부터 항목별 키워드를 추출할 수 있다. 예시적으로, 키워드 추출부(120)는 특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 항목별 키워드를 추출할 수 있다. 키워드 추출부(120)는 RAKE를 통해 추출된 키워드들 중, 기술적으로 의미가 없거나 문서를 작성할 때 통상적으로 사용하는 접속사 같은 불용키워드를 제거한다. 또한, 키워드 추출부(120)는 Python과 같은 프로그래밍 언어를 이용하여발명의 상세한 설명의 항목으로부터 해결 과제 키워드와 해결 수단 키워드를 추출할 수 있다.
단계 S530에서 토픽 정의부(130)는 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 토픽 모델링이란 유사한 주제의 문서는 유사한 키워드를 포함한다는 전제로 이루어지는 소프트 클러스터링 방법이다. 상기 토픽은 키워드의 집합으로 이루어져 있으며, 토픽에 속하는 문서는 문서의 주제를 키워드 집합을 통해 정의할 수 있다. 예시적으로, 토픽 정의부(130)는 LDA모델을 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다. 또한, 토픽 정의부(130)는 키워드 추출부(120)에서 추출된 항목별 키워드의 집합을 이용하여 토픽 모델링을 진행할 수 있다. 또한, 토픽 정의부(130)는 토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값으로부터 최적 토픽의 수를 결정할 수 있다. 토픽 정의부(130)는 토픽 수를 결정하는 기법 중 Elbow Point에서의 토픽 수를 투입 변수로 활용하여 최적 토픽의 수로 결정할 수 있다.
토픽모델링의 결과물로 토픽-키워드 매트릭스와 토픽-문서 매트릭스가 산출될 수 있다. 토픽 정의부(130)는 토픽-문서 매트릭스를 통해 각 토픽에 할당된 문서(특허)를 확인 할 수 있으며, 토픽-키워드 매트릭스를 활용하여 해결 과제 토픽 및 해결 수단 토픽을 정의할 수 있다.
단계 S540에서 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 해결 과제 및 해결 수단과 기업의 관계를 파악하기 위해 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구체적으로, 구축부(140)는 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축할 수 있다. 구축부(140)는 대응일치 분석을 통해 해결 과제의 포지셔닝 맵과 해결 수단의 포지셔닝맵을 각각 구축할 수 있다. 또한, 구축부(140)는 각 해결 과제 토픽 및 해결 수단 토픽에 대해 대응일치분석을 수행할 수 있다.
구축부(140)는 관심 기업의 해결 과제, 해결 수단에 대한 기술 관심도 변화 파악을 위해 연 단위의 토픽 누적량(stock)을 산출할 수 있다. 토픽 누적량은 특허 출원일을 기준으로 특정 기간에 나타난 특허들의 누적량을 나타내며, 누적량의 분석을 통해 기업이 특정 기간 내에 어떤 토픽에 집중하였는지 파악할 수 있는 정보를 제공할 수 있다. 다시 말해, 토픽 누적량의 분석을 통해 관심 기업의 관심 기술 변화의 추적이 가능해 질 수 있다.
구축부(140)는 기업별로 선정된 해결 과제 토픽 및 해결 수단 토픽을 연결하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 또한, 구축부(140)는 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축할 수 있다. 구체적으로, 해결 과제 토픽 및 해결 수단 토픽이 동시에 빈발한 특허의 수는 해결 과제 토픽 및 해결 수단 토픽의 링크 즉, 해결 과제 토픽 및 해결 수단 토픽 쌍의 수가 많을수록 해당 링크에 가중치가 부여될 수 있다.
본원의 일 실시 예에 따른, 기술 경쟁 정보 제공 방법은, 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
전술한 본원의 설명은 예시를 위한 것이며, 본원이 속하는 기술분야의 통상의 지식을 가진 자는 본원의 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 쉽게 변형이 가능하다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 예를 들어, 단일형으로 설명되어 있는 각 구성 요소는 분산되어 실시될 수도 있으며, 마찬가지로 분산된 것으로 설명되어 있는 구성 요소들도 결합된 형태로 실시될 수 있다.
본원의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본원의 범위에 포함되는 것으로 해석되어야 한다.
100: 기술 경쟁 정보 제공 장치
110: 수집부
120: 키워드 추출부
130: 토픽 정의부
140: 구축부

Claims (13)

  1. 컴퓨터로 구현되는 기술 경쟁 정보 제공 장치에 의해 각 단계가 수행되는 기술 경쟁 정보 제공 방법에 있어서,
    (a) 특허 전문 데이터를 수집하는 단계;
    (b) 상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 단계;
    (c) 상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 단계; 및
    (d) 상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 단계;
    를, 포함하고,
    상기 (d)단계는,
    대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하되,
    상기 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽의 위치와 기업의 위치가 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있는 것으로 해석되고,
    상기 포지셔닝 맵에 표시된 기업들이 동일한 해결 과제 토픽 또는 해결 수단 토픽에 대해 상대적으로 가깝게 위치하면, 상기 기업들은 해당 해결 과제 토픽 또는 해결 수단 토픽 분야에서 경쟁 중인 기업들로 해석되되, 해결 과제 토픽 또는 해결 수단 토픽과 상대적으로 가까운 기업이 없으면, 해당 해결 과제 토픽 또는 해결 수단 토픽 분야는 상대적으로 활발한 경쟁이 이루어지지 않는 것으로 해석되고,
    상기 해결 과제 토픽 및 상기 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축하는 것인, 기술 경쟁 정보 제공 방법.
  2. 제1항에 있어서,
    상기 (a) 단계는,
    (a1) 관심 기업을 선정하는 단계; 및
    (a2) 관심 기업이 보유한 특허 전문 데이터를 수집하는 단계,
    를 포함하고,
    상기 (d) 단계는, 관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 것인, 기술 경쟁 정보 제공 방법.
  3. 제1항에 있어서,
    상기 (b) 단계는,
    특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출하는 것인, 기술 경쟁 정보 제공 방법.
  4. 제1항에 있어서,
    상기 (b) 단계는,
    언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거하는 것인, 기술 경쟁 정보 제공 방법.
  5. 제1항에 있어서,
    상기 (c) 단계는,
    토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽의 수를 결정하고, 토픽모델링으로부터 산출된 토픽-키워드 매트릭스에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽을 정의하는 것인, 기술 경쟁 정보 제공 방법.
  6. 삭제
  7. 기술 경쟁 정보 제공 장치에 있어서,
    특허 전문 데이터를 수집하는 수집부;
    상기 특허 전문 데이터로부터 항목별 키워드를 추출하는 키워드 추출부;
    상기 항목별 키워드로부터 토픽 모델링을 통해 해결 과제 토픽 및 해결 수단 토픽을 정의하는 토픽 정의부; 및
    상기 해결 과제 토픽 및 해결 수단 토픽에 기초하여 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 구축부,
    를 포함하고,
    상기 구축부는
    대응일치 분석을 통해 상기 해결 과제-해결 수단 포지셔닝 맵을 구축하되,
    상기 포지셔닝 맵에서 해결 과제 토픽 또는 해결 수단 토픽의 위치와 기업의 위치가 가까울수록 해당 기업이 해당 해결 과제 토픽 또는 해결 수단 토픽에 집중하고 있는 것으로 해석되고,
    상기 포지셔닝 맵에 표시된 기업들이 동일한 해결 과제 토픽 또는 해결 수단 토픽에 대해 상대적으로 가깝게 위치하면, 상기 기업들은 해당 해결 과제 토픽 또는 해결 수단 토픽 분야에서 경쟁중인 기업들로 해석되되, 해결 과제 토픽 또는 해결 수단 토픽과 상대적으로 가까운 기업이 없으면, 해당 해결 과제 토픽 또는 해결 수단 토픽 분야는 상대적으로 활발한 경쟁이 이루어지지 않는 것으로 해석되고,
    상기 해결 과제 토픽 및 상기 해결 수단 토픽이 동시에 빈발한 특허의 수에 기초하여, 해결 과제 토픽과 해결 수단 토픽에 가중치를 부여하여 해결 과제-해결 수단 네트워크를 구축하는 것인, 기술 경쟁 정보 제공 장치.
  8. 제7항에 있어서,
    상기 수집부는,
    관심 기업을 선정하고, 관심 기업이 보유한 특허 전문 데이터를 수집하되,
    상기 구축부는,
    관심 기업 별로 해결 과제-해결 수단 네트워크 및 해결 과제-해결 수단 포지셔닝 맵을 구축하는 것인, 기술 경쟁 정보 제공 장치.
  9. 제7항에 있어서,
    상기 키워드 추출부는,
    특허 전문의 배경 기술 항목, 해결하려는 과제 항목 및 과제의 해결 수단 항목으로부터 상기 항목별 키워드를 추출하는 것인, 기술 경쟁 정보 제공 장치.
  10. 제7항에 있어서,
    상기 키워드 추출부는,
    언어 독립적 키워드 알고리즘에 기초하여 상기 항목별 키워드를 추출하고, 불용키워드를 제거하는 것인, 기술 경쟁 정보 제공 장치.
  11. 제7항에 있어서,
    상기 토픽 정의부는,
    토픽의 수를 투입 변수로 하는 토픽 모델에 기초하여, 토픽간 유사도의 평균값에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽의 수를 결정하고, 토픽모델링으로부터 산출된 토픽-키워드 매트릭스에 기초하여 상기 해결 과제 토픽 및 상기 해결 수단 토픽을 정의하는 것인, 기술 경쟁 정보 제공 장치.
  12. 삭제
  13. 제 1항 내지 제5항 중 어느 한 항의 방법을 컴퓨터에서 실행하기 위한 프로그램을 기록한 컴퓨터에서 판독 가능한 기록매체.
KR1020180158342A 2018-12-10 2018-12-10 기술 경쟁 정보 제공 장치 및 방법 KR102221267B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180158342A KR102221267B1 (ko) 2018-12-10 2018-12-10 기술 경쟁 정보 제공 장치 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180158342A KR102221267B1 (ko) 2018-12-10 2018-12-10 기술 경쟁 정보 제공 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20200070809A KR20200070809A (ko) 2020-06-18
KR102221267B1 true KR102221267B1 (ko) 2021-03-02

Family

ID=71143287

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180158342A KR102221267B1 (ko) 2018-12-10 2018-12-10 기술 경쟁 정보 제공 장치 및 방법

Country Status (1)

Country Link
KR (1) KR102221267B1 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102518843B1 (ko) * 2022-07-12 2023-04-06 망고클라우드 주식회사 Lda를 이용한 기업 컨텐츠 관리 시스템

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057068A (ja) 2017-09-20 2019-04-11 株式会社野村総合研究所 情報処理装置およびコンピュータプログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100966106B1 (ko) * 2008-06-17 2010-06-28 한국과학기술원 특허 정보를 이용한 기술과 서비스의 평가 및 서비스중심의 기술 로드맵 작성 방법
KR20100127036A (ko) * 2009-05-25 2010-12-03 엘지전자 주식회사 관점분류를 이용한 관점별 특허맵 제공 방법
KR101616544B1 (ko) * 2014-03-03 2016-04-28 고려대학교 산학협력단 Lda를 이용한 특허 문헌 분석 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019057068A (ja) 2017-09-20 2019-04-11 株式会社野村総合研究所 情報処理装置およびコンピュータプログラム

Also Published As

Publication number Publication date
KR20200070809A (ko) 2020-06-18

Similar Documents

Publication Publication Date Title
Xu Understanding graph embedding methods and their applications
Berahmand et al. A modified DeepWalk method for link prediction in attributed social network
Kühl et al. Supporting customer-oriented marketing with artificial intelligence: automatically quantifying customer needs from social media
Weismayer et al. Identifying emerging research fields: a longitudinal latent semantic keyword analysis
Neshati et al. On dynamicity of expert finding in community question answering
US9092734B2 (en) Systems and methods for interactive displays based on associations for machine-guided rule creation
Inzalkar et al. A survey on text mining-techniques and application
US9582761B2 (en) Generating and displaying canonical rule sets with dimensional targets
US9117174B2 (en) System for efficiently generating K-maximally predictive association rules with a given consequent
US20140304267A1 (en) Suffix tree similarity measure for document clustering
Santra et al. Classification of web log data to identify interested users using Naïve Bayesian classification
Tarmizi et al. A review on student attrition in higher education using big data analytics and data mining techniques
US20190340517A2 (en) A method for detection and characterization of technical emergence and associated methods
Al-Najran et al. A requirements specification framework for big data collection and capture
Burleson et al. Engineering for global development: Characterizing the discipline through a systematic literature review
Mehrotra et al. An intelligent clustering approach for improving search result of a website
CN105159879A (zh) 一种网络个体或群体价值观自动判别方法
Zhang Evaluation and analysis of human resource management mode and its talent screening factors based on decision tree algorithm
KR102221267B1 (ko) 기술 경쟁 정보 제공 장치 및 방법
CN102541913B (zh) 面向Web的VSM分类器训练、OSSP页面识别及OSS资源提取方法
Hogenboom et al. Mining economic sentiment using argumentation structures
Nicoletti et al. Towards software architecture documents matching stakeholders’ interests
JP5634859B2 (ja) サイトクラスタシステムおよびサイトクラスタ方法
Nguyen et al. Pagerank-based approach on ranking social events: a case study with flickr
Rodrigo et al. Efficient ensembles of distance‐based label ranking trees

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant