KR100899754B1 - 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법 - Google Patents

텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법 Download PDF

Info

Publication number
KR100899754B1
KR100899754B1 KR1020070063410A KR20070063410A KR100899754B1 KR 100899754 B1 KR100899754 B1 KR 100899754B1 KR 1020070063410 A KR1020070063410 A KR 1020070063410A KR 20070063410 A KR20070063410 A KR 20070063410A KR 100899754 B1 KR100899754 B1 KR 100899754B1
Authority
KR
South Korea
Prior art keywords
data
evaluation
registered
technology
module
Prior art date
Application number
KR1020070063410A
Other languages
English (en)
Other versions
KR20090002308A (ko
Inventor
류장환
최규오
김명선
Original Assignee
재단법인 한국특허정보원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 한국특허정보원 filed Critical 재단법인 한국특허정보원
Priority to KR1020070063410A priority Critical patent/KR100899754B1/ko
Publication of KR20090002308A publication Critical patent/KR20090002308A/ko
Application granted granted Critical
Publication of KR100899754B1 publication Critical patent/KR100899754B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • General Health & Medical Sciences (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Technology Law (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 기 등록된 특허공보로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 평가펙터를 도출한 후, 사용자로부터 등록특허의 기술평가를 의뢰받아 이를 분석하고 평가하여, 그 결과가 사용자에게 신속하고 정확하게 피드백 될 수 있도록 하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템 및 그 방법에 대한 것이다.
본 발명은 온라인망을 매개로 하여, 다수의 사용자 단말과 연결되며, 주기적으로 등록공고되는 대량의 특허공보데이터로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하고, 사용자로부터 상기 사용자 단말을 이용하여 온라인망을 통해 등록특허의 기술평가를 의뢰받아 상기 기반특허자료의 구축시와 같이 텍스트 마이닝 기법을 이용하여 분석한 후 상기 기등록특허자료와 의뢰특허자료를 비교하여 유사특허를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 그 결과가 사용자에게 사용자 단말을 통해 피드백 될 수 있도록 한다.
특허, 기술평가, 텍스트마이닝, 구문분석, 형태소분석, 시소러스

Description

텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템 및 그 방법{TECHNOLOGY EVALUATING SYSTEM AND METHOD OF REGISTRATION PATENT BY USING TEXT MINING}
도 1은 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템의 구성을 나타낸 시스템구성도,
도 2는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법을 나타낸 개략흐름도,
도 3a, 3b 및 3c는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법을 나타낸 상세흐름도,
도 4는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템을 이용한 일 실시예로 등록특허에 대한 기술평가결과 보고서의 레포트를 나타낸 도면이다.
* 도면의 주요부분에 대한 부호설명 *
1 : 사용자 단말 3 : 기술평가시스템서버
31 : 웹시스템관리서버 33 : 지재권정보서버
35 : 텍스트마이닝서버 37 : 등급평가서버
39 : 데이터베이스(DB)서버 351 : 구문분석모듈
353 : 형태소분석모듈 355 : 기등록특허벡터화모듈
357 : 의뢰특허벡터화모듈 359 : 정량데이터추출모듈
371 : 유사특허추출모듈 373 : 펙터별평가모듈
375 : 피드백모듈 391 : 웹시스템정보DB
392 : 특허공보DB 393 : 특허서지정보DB
394 : 기등록특허벡터화문서데이터DB
395 : 기등록특허정량적데이터DB
396 : 의뢰특허벡터화문서데이터DB 397 : 의뢰특허정량적데이터DB
398 : 평가펙터분류및정보DB
본 발명은 텍스트 마이닝 기법을 이용한 특허 기술평가 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는 기 등록된 특허공보로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 평가펙터를 도출한 후, 사용자로부터 등록특허의 기술평가를 의뢰받아 이를 분석하고 평가하여, 그 결과가 사용자에게 신속하고 정확하게 피드백 될 수 있도록 하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템 및 그 방법에 대한 것이다.
최근 들어, 우리나라 기업의 기술보호를 위한 지적재산권화 전략은 타 선진국과 비교하여도 손색이 없을 만큼의 많은 노력과 성과가 있었다. 이러한 과정에서 다수의 지적재산권을 보유하고 있는 지적재산권자의 입장에서는 보유하고 있는 지적재산권들의 등록 후 유지관리에 드는 비용과 노력이 상당한 부담중의 하나로 작용하고 있는게 사실이다. 또한, 기술변화가 워낙 급격히 이루어져 등록은 받았지만 더 이상은 유지가 불필요한 기술과, 보유하고 있는 기술 중 특히 집중 투자하여야 할 기술을 가려내는 것 또한 만만치 않은 과제이다.
이에, 지식재산권자는 한국특허정보원에서 제공하는 특허정보조사서비스 중 하나인 특허기술평가를 의뢰하여 해당 지적재산권의 등급평가를 평가받는데, 그 밖에도 다양한 용도로 특허기술평가를 의뢰하고 결과를 사용하는데, 특허의 유지관리, 특허의 활용 전략 제공, 연구기획 지원, 권리적, 경제적, 환경적인 측면을 동시에 검토하여 평점화 및 등급으로 평가, 발명평가, 중요발명 및 우선 순위 파악, 사업전략과 연계(전략적 제휴), R&D 기획 자원 할당, 금융기관 대출 목적의 기술담보 대출용 평가, 정부의 직/간접적인 기술개발지원 사업의 지원사업자(과제) 선정을 위한 평가, 무형자산 가치 산정을 위한 평가, 기술적, 경제적, 사회적인 측면을 동시에 검토하여 명확하고, 객관적인 자료를 바탕으로 고객의 보유기술에 대한 무형자산 기술가치를 현재가치로 평가, 발명자의 보상, 자산평가 (감가상각용), 기술 거래 (기술이전, M&A 등)를 위한 지적재산권 등의 기술평가, 기술담보 설정을 위한 지적재산권의 가치평가, 투자 유치용 등으로 그 활용 범위가 굉장히 넓다.
하지만, 이러한 등록특허의 기술평가 후 지적재산권자에게 레포트하는 과정인 데이터분석을 위해 소요되는 고급인력 기반의 시간 및 비용이 상당하며, 대부분의 작업이 수동으로 이루어져 보다 객관적인 기술평가 시스템 및 방법이 절실히 필요한 실정이다.
본 발명은 상기와 같은 문제점을 해결하기 위해 안출된 것으로써, 본 발명의 목적은 본 발명은 텍스트 마이닝 기법을 이용한 특허 기술평가 시스템 및 그 방법에 관한 것으로서, 더욱 상세하게는 기 등록된 특허공보로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 평가펙터를 도출한 후, 사용자로부터 등록특허의 기술평가를 의뢰받아 이를 분석하고 평가하여, 그 결과가 사용자에게 신속하고 정확하게 피드백 될 수 있도록 하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템 및 그 방법을 제공하는 데 있다.
상기한 바와 같은 목적을 달성하기 위하여 본 발명에서는 데이터의 텍스트 마이닝 기법을 이용한 기술평가 시스템에 있어서, 온라인망을 매개로 하여, 다수의 사용자 단말과 연결되며, 주기적으로 등록공고되는 대량의 특허공보데이터로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하고, 사용자로부터 상기 사용자 단말을 이용하여 온라인망을 통해 등록특허의 기술평가를 의뢰받아 상기 기반특허자료의 구축시와 같이 텍스트 마이닝 기법을 이용하여 분석한 후 상기 기등록특허자료와 의뢰특허자료를 비교하여 유사특허를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 그 결과가 사용자에게 사용자 단말을 통해 피드백 될 수 있도록 하는 기술평가시스템서버가 구비되는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템이 제공된다.
또한, 상기 기술평가시스템서버는, 시스템 운영과 관련한 각종 정보와 사용자 기초정보를 관리하며, 사용자 단말이 온라인 망을 매개로 기술평가시스템서버에 접속되면 해당 기술평가시스템의 이용에 필요한 데이터 및 관련 프로그램이 제공되도록 하는 웹시스템관리서버, 특허공보데이터와 특허서지사항데이터를 보유 및 관리하는 지재권정보서버, 기 등록된 특허공보데이터와 사용자 단말을 이용하여 온라인망을 통해 의뢰되는 사용자의 의뢰특허의 특허공보데이터에 대하여 구문분석을 실시하여 평가펙터지수의 요소값으로 사용될 정량적인 데이터를 추출하고, 형태소분석을 거쳐 의미있는 색인어를 추출하여 특허문서를 색인어에 대한 빈도정보로 표현되도록 벡터화하는 텍스트마이닝서버, 상기 텍스트마이닝서버로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터의 비교를 통해 얻어진 유사특허리스트를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 의뢰특 허의 등급을 산정하고 전체적인 평가결과가 사용자 단말로 피드백 될 수 있도록 하는 등급평가서버 및 상기 기술평가시스템에서 사용되는 웹시스템정보, 등록특허공보, 특허서지정보, 기 등록특허의 벡터화문서데이터, 기 등록특허의 정량적데이터, 평가펙터 분류 및 정보, 의뢰특허의 벡터화문서데이터 및 의뢰특허의 정량적데이터 등이 저장되고 관리되는 데이터베이스(DB) 서버를 포함하여 구성된다.
또한, 상기 텍스트마이닝서버는 상기 지재권정보서버로부터 특허공보데이터을 전달받아, 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 구문분석모듈, 상기 구문분석모듈에서 구문분석이 완료된 텍스트로부터 유의어 사전인 시소러스를 이용하여 색인어를 추출하는 형태소분석모듈, 상기 형태소분석모듈을 통해 색인어가 추출되면 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성된 벡터로 표현하는 기 등록특허의 벡터화모듈, 상기 기 등록특허의 벡터화모듈과 같이 각 의뢰특허문서에 대해서도 색인어에 대한 가중치로 구성되도록 하지만, 색인어 가중치가 기등록특허의 가중치와는 상이한 가중치가 적용되도록 하는 의뢰특허의 벡터화모듈 및 상기 구문분석모듈에서 구문분석이 완료된 텍스트로부터 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 하는 정량데이터추출모듈을 포함여 구성된다.
그리고, 상기 기 등록특허의 벡터화모듈의 색인어에 대한 가중치 수식은 아래와 같다.
[수학식 1]
Figure 112007046660609-pat00001
(여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
n : 색인어가 전체 문서에 출현한 빈도수
N : 전체 문서의 개수 이다.)
또한, 상기 의뢰특허의 벡터화모듈의 색인어에 대한 가중치 수식은 아래와 같다.
[수학식 2]
Figure 112007046660609-pat00002
(여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
maxtf : 현재 문서의 색인어 중 최대 빈도수
n : 색인어가 전체 문서에 출현한 빈도수
N : 전체 문서의 개수 이다.)
더불어, 상기 등급평가서버는 상기 텍스트마이닝서버로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터에 대해 특허문서의 각 항목별로 코사인 유사도 측정 알고리즘 적용에 따라 유사도를 산정하고, 항목별 가중치를 부여하여 유사특허를 추출하는 유사특허추출모듈, 상기 유사특허추출모듈에서 추출된 유사특허를 권리성, 상업성 및 기술성 대분류 평가항목으로 분리하고 각 대분류 별 다수의 세분류로 평가 펙터들에 대한 지수를 각각 도출하고, 통계적 분석을 수행하여 의뢰특허와 유사특허들의 등급을 산정하는 펙터별평가모듈 및 상기 펙터별평가모듈에서 펙터별 평가가 완료되어 등급산정까지 마친 의뢰특허에 대한 레포트를 작성하여 온라인망을 통해 사용자 단말로 사용자에게 전달될 수 있도록 하는 피드백모듈을 포함하여 구성된다.
또한, 상기 유사특허추출모듈의 코사인 유사도 측정 알고리즘의 수식은 아래와 같다.
[수학식 3]
Figure 112007046660609-pat00003
(여기서, -
Figure 112007046660609-pat00004
: 의뢰특허의 벡터화문서데이터
-
Figure 112007046660609-pat00005
: 기 등록특허의 벡터화문서데이터이다.)
그리고, 상기 유사특허추출모듈의 항목별 가중치를 부여에 따른 유사특허 추출의 수식은 아래와 같다.
[수학식 4]
Figure 112007046660609-pat00006
(여기서, - sim1: 발명의 명칭
- sim2: 요약
- sim3: 발명이 속하는 기술분야 및 그 분야의 종래 기술
- sim4: 발명의 효과
- sim5: 청구항
- w1~5 : 항목별 가중치 이다.)
이와 더불어, 상기 펙터별평가모듈의 대분류평가항목 중 권리성 평가의 세분류는, 권리의 연속성, 권리의 영향력, 권리의 폭, 권리의 변동성, 권리의 안정성, 권리의 위험도, 권리의 완성도, 청구항의 개수, 청구범위, 권리의 활용도 및 출원의 완성도이다.
그리고, 상기 펙터별평가모듈의 대분류평가항목 중 상업성 평가의 세분류는,상업적 신용도, 상업적 점유율, 상업적 활용성, 상업적 중요도, 상업적 기여도, 상업적 선점도, 상업적 대중성, 상업적 집중도, 국제협력도 및 상업적 실시성이다.
그리고, 상기 펙터별평가모듈의 대분류평가항목 중 기술성 평가의 세분류는,기술의 영향력, 기술의 집중도, 기술의 진보성, 기술의 융합도, 기술의 완전성, 기술의 포트폴리오, 기술의 사이클, 선행특허문헌수 및 선행비특허문헌수이다.
본 발명의 또 다른 특징은, 데이터의 텍스트 마이닝 기법을 이용한 기술평가 방법에 있어서, 주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버로부터 입수하여 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하는 기반특허자료분석구축단계, 사용자로부터 사용자 단말을 이용 하여 온라인망을 통해 웹시스템관리서버에서 제공하는 프론트페이지를 거쳐 등록된 특허의 기술평가를 의뢰받는 등록특허기술평가의뢰접수단계, 상기 등록특허기술평가의뢰접수단계에서 접수된 등록특허에 대한 데이터를 지재권정보서버로부터 입수하여 상기 기반특허자료의 구축시와 같이 텍스트 마이닝기법을 이용하여 분석한 후 의뢰특허자료를 구축하는 의뢰특허자료분석마련단계, 상기 기반특허자료분석구축단계를 통해 구축된 기반특허자료와 의뢰특허자료분석마련단계를 통해 구축된 의뢰특허자료를 비교하여 유사특허추출모듈을 통해 유사특허리스트를 추출하는 유사특허추출단계, 상기 유사특허추출단계에서 추출된 유사특허들을 다양한 종류의 펙터별 평가모듈을 통해 평가를 수행하는 펙터별평가단계 및 상기 펙터별평가단계에서 평가완료된 의뢰특허의 등급을 책정하여 사용자에게 전체적인 평가내용과 함께 피드백모듈을 통해 평가결과가 온라인망을 통해 사용자의 단말로 레포트될 수 있도록 하는 등급부여레포트단계를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법을 제공하는 데 있다.
그리고, 상기 기반특허자료분석구축단계는, 텍스트마이닝서버에서 주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버로부터 입수하여, 구문분석모듈을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 특허공보데이터의 구문분석단계, 상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 형태소분석모듈을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계, 상기 색인어추출단계에서 색인어가 추출되면 벡터화모듈을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성되도록 하고 이를 기 등록특허의 벡터화문서데이터베이스화 하는 기반데이터의벡터화단계 및 상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈을 통해 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 기 등록특허의 정략적데이터베이스화 하는 기반데이터의정량데이터추출단계를 포함하여 이루어진다.
또한, 상기 의뢰특허자료분석마련단계는, 텍스트마이닝서버에서 상기 등록특허기술평가의뢰접수단계에서 의뢰된 특허건의 특허공보데이터를 지재권정보서버로부터 입수하여, 구문분석모듈을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 특허공보데이터의 구문분석단계, 상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 형태소분석모듈을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계, 상기 색인어추출단계에서 색인어가 추출되면 의뢰특허 벡터화모듈을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성되도록 하고 이를 의뢰특허의 벡터화문서데이터베이스화 하는 의뢰특허의벡터화단계 및 상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈을 통해 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 의뢰특허의 정량적데이터베이스화 하는 의뢰특허의정량데이터추출단계를 포함하여 이루어진다.
(실시예)
이하, 첨부된 도면을 참조하여, 본 발명에 따른 텍스트 마이닝을 이용한 등록특허의 기술평가 시스템 및 그 방법을 좀더 상세히 설명하면 다음과 같다.
첨부된 도 1은 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템의 구성을 나타낸 시스템구성도, 도 2는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법을 나타낸 개략흐름도, 도 3a, 3b 및 3c는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법을 나타낸 상세흐름도, 도 4는 본 발명에 따른 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템을 이용한 일 실시예로 등록특허에 대한 기술평가결과 보고서의 레포트를 나타낸 도면이다.
우선, 도 1에 도시된 바와 같이, 본 발명에 따른 텍스트 마이닝을 이용한 등록특허의 기술평가 시스템은 온라인망을 매개로 하여, 다수의 사용자 단말(1)과 연결되며, 주기적으로 등록공고되는 대량의 특허공보데이터로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하고, 사용자로부터 상기 사용자 단말을 이용하여 온라인망을 통해 등록특허의 기술평가를 의뢰받아 상기 기반특허자료의 구축시와 같이 텍스트 마이닝 기법을 이용하여 분석한 후 상기 기등록특허자료와 의뢰특허자료를 비교하여 유사특허를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 그 결과가 사용자에게 사용자 단말을 통 해 피드백 될 수 있도록 하는 기술평가시스템서버(3)가 구비된다.
이때, 앞의 사용자 단말(1)로는 예컨대, 노트북PC, 데스크탑PC, 셀룰러폰(Cellular Phone), 피씨에스폰(PCS Phone), 동기식/비동기식 IMT-2000(International Mobile Telecommunication-2000), 팜PC(Palm Personal Computer), 개인용 디지털 보조기(PDA : Personal Digital Assistant), 스마트폰(Smart Phone), 왑폰(WAP Phone : Wireless Application Protocol Phone)등이 상황에 따라, 탄력적으로 선택될 수 있다.
이러한, 기술평가시스템서버(1)는 크게 웹시스템관리서버(31), 지재권정보서버(33), 텍스트마이닝서버(35), 등급평가서버(37) 및 데이터베이스서버(39)로 구성된다.
상기 웹시스템관리서버(31)는 시스템 운영과 관련한 각종 정보와 사용자 기초정보를 관리하며, 사용자 단말(1)이 온라인 망을 매개로 기술평가시스템서버(3)에 접속되면 해당 기술평가시스템의 이용에 필요한 데이터 및 관련 프로그램이 제공되도록 한다.
그리고, 상기 지재권정보서버(33)는 특허공보데이터와 특허서지사항데이터를 보유 및 관리한다.
또한, 상기 텍스트마이닝서버(35)는 기 등록된 특허공보데이터와 사용자 단말(1)을 이용하여 온라인망을 통해 의뢰되는 사용자 의뢰특허의 특허공보데이터에 대하여 구문분석을 실시하여 평가펙터지수의 요소값으로 사용될 정량적인 데이터를 추출하고, 형태소분석을 거쳐 의미있는 색인어를 추출하여 특허문서를 색인어에 대 한 빈도정보로 표현되도록 벡터화한다.
또한, 상기 등급평가서버(37)는 상기 텍스트마이닝서버(35)로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터의 비교를 통해 얻어진 유사특허리스트를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 의뢰특허의 등급을 산정하고 전체적인 평가결과가 사용자 단말(1)로 피드백 될 수 있도록 한다.
아울러, 상기 데이터데이스(DB) 서버(39)는 상기 기술평가시스템에서 사용되는 웹시스템정보, 등록특허공보, 특허서지정보, 기 등록특허의 벡터화문서데이터, 기 등록특허의 정량적데이터, 평가펙터 분류 및 정보, 의뢰특허의 벡터화문서데이터 및 의뢰특허의 정량적데이터 등이 저장되고 관리될 수 있도록 한다. 상기한 데이터베이스(DB) 서버(39)는 예를 들어, 오라클(Oracle), SQL(Structured Query Language) 서버, Informix 등의 주지된 관계형 데이터 관리 시스템(RDBMS : Relational Database Management System)을 이용하여 구성될 수 있다.
그리고, 상기 텍스트마이닝서버(35)는 상기 지재권정보서버(33)로부터 특허공보데이터을 전달받아, 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 구문분석모듈(351),
상기 구문분석모듈(351)에서 구문분석이 완료된 텍스트로부터 유의어 사전인 시소러스를 이용하여 색인어를 추출하는 형태소분석모듈(353),
상기 형태소분석모듈(353)을 통해 색인어가 추출되면 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산 에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성된 벡터로 표현하는 기 등록특허의 벡터화모듈(355),
상기 기 등록특허의 벡터화모듈(355)과 같이 각 의뢰특허문서에 대해서도 색인어에 대한 가중치로 구성되도록 하지만, 색인어 가중치가 기등록특허의 가중치와는 상이한 가중치가 적용되도록 하는 의뢰특허의 벡터화모듈(357) 및
상기 구문분석모듈(351)에서 구문분석이 완료된 텍스트로부터 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 하는 정량데이터추출모듈(359)을 포함하여 구성된다.
또한, 상기 기 등록특허의 벡터화모듈(355)의 색인어에 대한 가중치 수식은 공지된 정규화 가중치 수식을 사용하였으며 이는 아래와 같다.
[수학식 1]
Figure 112007046660609-pat00007
(여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
n : 색인어가 전체 문서에 출현한 빈도수
N : 전체 문서의 개수 이다.)
이는, 특정 문서 내에서는 여러 번 출현하지만 소량의 한정된 문서에만 나타나는 용어가 양질의 색인어라는 것을 식으로서 표현한 것이다. 또한, 각 문서마다 추출되는 텍스트의 길이가 다른 것으로 인한 형평성의 문제를 해결하기 위해 유클 리디언 벡터 길이(Euclidian Vector Length)로 나누어 줌으로써 이를 정규화(Normalize)하였다.
상기 의뢰특허의 벡터화모듈의 색인어에 대한 가중치 수식은 공지된 쿼리 문서에 대한 가중치 수식을 사용하였으며 이는 아래와 같다.
[수학식 2]
Figure 112007046660609-pat00008
(여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
maxtf : 현재 문서의 색인어 중 최대 빈도수
n : 색인어가 전체 문서에 출현한 빈도수
N : 전체 문서의 개수 이다.)
상기 tf값을 문서에 나타난 Maximum tf값으로 나누고, 그 값의 범위를 0.5~1.0으로 한정함으로써 정규화(Normalize)하였다.
그리고, 상기 등급평가서버(37)는, 상기 상기 텍스트마이닝서버(35)로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터에 대해 특허문서의 각 항목별로 코사인 유사도 측정 알고리즘 적용에 따라 유사도를 산정하고, 항목별 가중치를 부여하여 유사특허를 추출하는 유사특허추출모듈(371),
상기 유사특허추출모듈(371)에서 추출된 유사특허를 권리성, 상업성 및 기술성 대분류 평가항목으로 분리하고 각 대분류 별 다수의 세분류로 평가 펙터들에 대한 지수를 각각 도출하고, 통계적 분석을 수행하여 의뢰특허와 유사특허들의 등급 을 산정하는 펙터별평가모듈(373) 및
상기 펙터별평가모듈(373)에서 펙터별 평가가 완료되어 등급산정까지 마친 의뢰특허에 대한 레포트를 작성하여 온라인망을 통해 사용자 단말로 사용자에게 전달될 수 있도록 하는 피드백모듈(375)을 포함하여 구성된다.
또한, 상기 유사특허추출모듈(371)의 코사인 유사도 측정 알고리즘의 수식은 아래와 같다.
[수학식 3]
Figure 112007046660609-pat00009
(여기서, -
Figure 112007046660609-pat00010
: 의뢰특허의 벡터화문서데이터
-
Figure 112007046660609-pat00011
: 기 등록특허의 벡터화문서데이터이다.)
벡터공간 모델에서는 의뢰특허벡터(Q)와 기반데이터벡터(D)를 벡터공간에서 하나의 점으로 나타낸다. 이를 색인어가 2개일 때로 단순화하여 벡터공간에 표현한 모형은 아래의 그래프와 같다.
Figure 112007046660609-pat00012
상기 그래프에서 보여지듯이, 의뢰특허와 기반데이터의 유사도는 두 벡터
Figure 112007046660609-pat00013
Figure 112007046660609-pat00014
가 이루는 각 θ가 작을수록 유사함을 짐작할 수 있다. 따라서 Cosθ에 의해 유사도를 구할 수 있으며, 이는 두 벡터의 내적에 의해 구해진다.
그리고, 상기 유사특허추출모듈(371)의 항목별 가중치를 부여에 따른 유사특허 추출의 수식은 아래와 같다.
[수학식 4]
Figure 112007046660609-pat00015
(여기서, - sim1: 발명의 명칭
- sim2: 요약
- sim3: 발명이 속하는 기술분야 및 그 분야의 종래 기술
- sim4: 발명의 효과
- sim5: 청구항
- w1~5 : 항목별 가중치 이다.)
각 항목별 유사도 지수에 반영함으로써 유사특허 추출의 정확도 향상을 도모하였다.
그리고, 상기 펙터별평가모듈(373)의 대분류평가항목 중 권리성 평가의 세분류는, 권리의 연속성, 권리의 영향력, 권리의 폭, 권리의 변동성, 권리의 안정성, 권리의 위험도, 권리의 완성도, 독립항의 개수, 청구범위, 권리의 활용도 및 출원 의 완성도로 구성된다.
또한, 각 평가항목들의 상세한 평가방법은,
- 권리의 연속성: 연차료 데이터를 통한 현재까지 잔존하고 있는 유지연수로 계산된다.
- 권리의 영향력: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 피인용 횟수를 산출한다.
- 권리의 폭: 특허 청구범위에서 의미를 가지는 단어(명사, 복합명사, 구문 등)수를 추출하여 이용한다.
- 권리의 변동성: 출원 청구항 대비 등록청구항의 변동 개수로 계산된다.
- 권리의 안정성: 거절사정 데이터를 이용하여 인용문헌수로 산출한다.
- 권리의 위험도: 특허출원 발명자의 수로 산출된다.
- 권리의 완성도: 특허 청구항수에서 종속항이 차지하는 비율로 계산된다.
- 독립항의 개수: 독립 청구항의 개수이다.
- 청구범위: 대표 청구항의 문절수를 추출하여 이용한다.
- 권리의 활용도: 현재시점을 기준으로 특허등록 소멸일까지 남아있는 연수로 계산된다.
출원의 완성도: 특허권을 공유하고 있는 특허권자의 수로 계산된다.
권리성 평가 펙터 변수명 표준화변수명 권리성 가중치 코드명
권리의 연속성 r 1 (sr)1 α1 PR01
권리의 영향력 r 2 (sr)2 α2 PR02
권리의 폭 r 3 (sr)3 α3 PR03
권리의 변동성 r 4 (sr)4 α4 PR04
권리의 안정성 r 5 (sr)5 α5 PR05
권리의 위험도 r 6 (sr)6 α6 PR06
권리의 완성도 r 7 (sr)7 α7 PR07
청구항의 개수 r 8 (sr)8 α8 PR08
청구범위 r 9 (sr)9 α9 PR09
권리의 활용도 r 10 (sr)10 α10 PR10
출원의 완성도 r 11 (sr)11 α11 PR11
다음의 표준화 공식에 따라 각 변수에 대한 표준화를 통해 입력값을 정량화 한다.
[수학식 5]
Figure 112007046660609-pat00016
여기서, 특허성 평가 산출식은
[수학식 6]
Figure 112007046660609-pat00017
권리성 가중치 : αi(i=1, 2,…, 11)은 평가목적에 따라 유동적으로 입력할 수 있도록 하고 있으며, 입력된 값은 가중평균방식으로 평가 산출식에 적용된다.
그리고, 상기 펙터별평가모듈(373)의 대분류평가항목 중 상업성 평가의 세분류는, 상업적 신용도, 상업적 점유율, 상업적 활용성, 상업적 중요도, 상업적 기여도, 상업적 선점도, 상업적 대중성, 상업적 집중도, 국제협력도 및 상업적 실시성으로 구성된다.
또한, 각 평가항목들의 상세한 평가방법은,
- 상업적 신용도: 특허권자의 재무능력과 경영에 대한 신용도 평가로서 기업신용도 평가 데이터를 이용하여 산출한다.
- 상업적 점유율: 특허권자가 해당기술분야(기술분야는 IPC 분류를 사용한다.)에서 차지하고 있는 점유율(특허권자의 해당기술분야 건수 총합/ 해당기술분야 특허건수 총합)로 구해진다.
- 상업적 활용성: 명세서 상에 기재되어 있는 '실시예'를 추출하여 발명의 실시개수를 구한다.
- 상업적 중요도: 해외출원 국가수 및 지정 국가수를 의미한다.
- 상업적 기여도: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 피인용 횟수를 산출한다.
- 상업적 선점도: 특허출원부터 특허공개까지 걸린 기간(개월수)로 계산된다.
- 상업적 대중성: 특허권의 이해관계자인 특허권자수에 실시권자 수를 부여한다.
- 상업적 집중도: (특허권자의 해당기술분야 총건수/해당기술분야 총건수)를 (특허권자 총 등록건수/기술분야 전체 총 등록건수)로 나누어 계산한다.
- 국제협력도: 특허권자 국적을 이용하여 해외 특허권자와 공동으로 특허권을 소유하고 있는 횟수를 산출한다.
- 상업적 실시성: 명세서 상에 기재된 도면의 수를 산출하여 이용한다.
상업성 평가 펙터 변수명 표준화변수명 상업성 가중치 코드명
상업적 신용도 c 1 (sc)1 β1 PC01
상업적 점유율 c 2 (sc)2 β2 PC02
상업적 활용성 c 3 (sc)3 β3 PC03
상업적 중요도 c 4 (sc)4 β4 PC04
상업적 기여도 c 5 (sc)5 β5 PC05
상업적 선점도 c 6 (sc)6 β6 PC06
상업적 대중성 c 7 (sc)7 β7 PC07
상업적 집중도 c 8 (sc)8 β8 PC08
국제협력도 c 9 (sc)9 β9 PC09
상업적 실시성 c 10 (sc)10 β10 PC10
다음의 표준화 공식에 따라 각 변수에 대한 표준화를 통해 입력값을 정량화 한다.
[수학식 7]
Figure 112007046660609-pat00018
여기서, 특허성 평가 산출식은
[수학식 8]
Figure 112007046660609-pat00019
상업성 가중치 : βi(i=1, 2,…, 11)은 평가목적에 따라 유동적으로 입력할 수 있도록 하고 있으며, 입력된 값은 가중평균방식으로 평가 산출식에 적용된다.
그리고, 상기 펙터별평가모듈(373)의 대분류평가항목 중 기술성 평가의 세분류는, 기술의 영향력, 기술의 집중도, 기술의 진보성, 기술의 융합도, 기술의 완전성, 기술의 포트폴리오, 기술의 사이클, 선행특허문헌수 및 선행비특허문헌수로 구성된다.
또한, 각 평가항목들의 상세한 평가방법은,
- 기술의 영향력: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 피인용 횟수를 산출한다.
- 기술의 집중도: 유사특허 그룹에서 유사도 평균내에서 떨어진 값인 표준편차 통해 구해진다.
- 기술의 진보성: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 인용 횟수를 산출한다.
- 기술의 융합도: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 피인용된 특허들의 IPC의 이질성을 구해서 산출한다.
- 기술의 완전성: 특허출원 발명자의 수로 산출된다.
- 기술의 포트폴리오: 특허의 기술내용이 포트폴리오상 기술의 도입기, 기술의 발전기, 기술의 성숙기, 기술의 쇠퇴기의 어느 분야에 속하는 지를 판정하여 평가치를 부여한다.
- 기술의 사이클: 대상특허 출원 이후에 등록된 유사특허간 유사도를 이용하여 인용 특허의 출원년도를 대상특허 출원년도와의 차이를 구하고, 차이값 중 중간값으로 산출한다.
- 선행특허문헌수: 명세서 상에서 발명자 또는 출원인이 제시한 선행특허문헌수를 카운팅한다.
- 선행비특허문헌수: 명세서 상에서 발명자 또는 출원인이 제시한 선행비특허문헌수를 카운팅한다.
기술성 평가 펙터 변수명 표준화변수명 기술성 가중치 코드명
기술의 영향력 t 1 (st)1 ω1 PT01
기술의 집중도 t 2 (st)2 ω2 PT02
기술의 진보성 t 3 (st)3 ω3 PT03
기술의 융합도 t 4 (st)4 ω4 PT04
기술의 완전성 t 5 (st)5 ω5 PT05
기술의 포트폴리오 t 6 (st)6 ω6 PT06
기술의 사이클 t 7 (st)7 ω7 PT07
선행특허문헌수 t 8 (st)8 ω8 PT08
선행비특허문헌수 t 9 (st)9 ω9 PT09
다음의 표준화 공식에 따라 각 변수에 대한 표준화를 통해 입력값을 정량화 한다.
[수학식 9]
Figure 112007046660609-pat00020
여기서, 특허성 평가 산출식은
[수학식 10]
Figure 112007046660609-pat00021
상업성 가중치 : βi(i=1, 2,…, 11)은 평가목적에 따라 유동적으로 입력할 수 있도록 하고 있으며, 입력된 값은 가중평균방식으로 평가 산출식에 적용된다.
최종 평가점수(NPS: Net-Patent Score)는 NPS = AVERAGE (Yr:Yc:Yt)로 산출한다.
본 발명의 또 다른 특징인 텍스트 마이닝을 이용한 등록특허의 기술평가 방법을 도 2의 개략플로우와 도 3a, 3b 및 3c를 참고하여 상세히 설명하면 다음과 같다.
우선, 주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버(33)로부터 입수하여 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하는 기반특허자료분석구축단계(S1),
사용자로부터 사용자 단말(1)을 이용하여 온라인망을 통해 웹시스템관리서버(31)에서 제공하는 프론트페이지를 거쳐 등록된 특허의 기술평가를 의뢰받는 등록특허기술평가의뢰접수단계(S3),
상기 등록특허기술평가의뢰접수단계(S3)에서 접수된 등록특허에 대한 데이터를 지재권정보서버(33)로부터 입수하여 상기 기반특허자료의 구축시와 같이 텍스트 마이닝기법을 이용하여 분석한 후 의뢰특허자료를 구축하는 의뢰특허자료분석마련단계(S5),
상기 기반특허자료분석구축단계(S1)를 통해 구축된 기반특허자료와 의뢰특허자료분석마련단계(S5)를 통해 구축된 의뢰특허자료를 비교하여 유사특허추출모듈(371)을 통해 유사특허리스트를 추출하는 유사특허추출단계(S7),
상기 유사특허추출단계(S7)에서 추출된 유사특허들을 다양한 종류의 펙터별 평가모듈(373)을 통해 평가를 수행하는 펙터별평가단계(S9) 및
상기 펙터별평가단계(S9)에서 평가완료된 의뢰특허의 등급을 책정하여 사용자에게 전체적인 평가내용과 함께 피드백모듈(375)을 통해 평가결과가 온라인망을 통해 사용자의 단말(1)로 레포트될 수 있도록 하는 등급부여레포트단계(S11)로 이루어진다.
그리고, 상기 기반특허자료분석구축단계(S1)는, 텍스트마이닝서버(35)에서 주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버(33)로부터 입수(S101)하여, 구문분석모듈(351)을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 특허공보데이터의 구문분석단계(S103),
상기 구문분석단계(S103)에서 구문분석이 완료된 텍스트로부터 형태소분석모듈(353)을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계(S105),
상기 색인어추출단계(S105)에서 색인어가 추출되면 벡터화모듈(355)을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성되도록 하고 이를 기 등록특허의 벡터화문서데이터베이스화(S107) 하는 기반데이터의벡터화단계(S109) 및
상기 구문분석단계(S103)에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈(359)을 통해 정량적인 데이터를 추출(S111)하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 기 등록특허의 정략적데이터베이스화 하는 기반데이터의정량데이터추출단계(S113)로 이루어진다.
또한, 상기 의뢰특허자료분석마련단계(S5)는, 텍스트마이닝서버(35)에서 상기 등록특허기술평가의뢰접수단계(S3)에서 의뢰된 특허건의 특허공보데이터를 지재권정보서버(33)로부터 입수(S119)하여, 구문분석모듈(351)을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 의뢰특허공보데이터의 구문분석단계(S123),
상기 구문분석단계(S123)에서 구문분석이 완료된 텍스트로부터 형태소분석모듈(353)을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계(S125),
상기 색인어추출단계(S125)에서 색인어가 추출되면 의뢰특허 벡터화모듈(357)을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성(S127)되도록 하고 이를 의뢰특허의 벡터화문서데이터베이스화 하는 의뢰특허의벡터화단계(S129) 및
상기 구문분석단계(S123)에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈(359)을 통해 정량적인 데이터를 추출(S131)하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 의뢰특허의 정량적데이터베이스화 하는 의뢰특허의정량데이터추출단계(S133)로 상세과정이 이루어진다.
상기와 같은 과정에 따라 본 발명의 일 실시예를 직접 평가한 모형에서는 한국특허 평가에 적합한 형태의 통계적 모형을 통해 결과치를 산출하였으며 그 조건은 아래와 같으며, 그 결과는 도 4에 나타난 특허기술평가 보고서와 같다.
조건 1) 추출된 평가항목별 값을 표준화 모델을 통해 정형화한다.
조건 2) 평가목적 및 기술분야에 따라 각 평가펙터별 가중치를 부여한다.
조건 3) 특허평가모델을 통해 특허당 평가치를 구한다.
조건 4) 평가치를 100점 변환공식을 통해 100점 만점형태로 변형한다.
조건 5) 평가점수에 따라 10등급을 기준으로 하는 등급(A1, A2, A3, B1, B2, B3, B4, C1, C2, C3)을 부여한다.
상술한 바와 같이 본 발명에 따르면, 기술평가에 소요되는 비용과 시간을 거의 1/10 수준으로 절감할 수 있는 큰 효과가 있다. 그러므로, 다수의 지적재산권을 보유하고 있는 지적재산권자의 입장에서는 보유하고 있는 지적재산권들의 등록 후 유지관리 시 기술평가를 통해 이에 소요되는 비용과 노력을 보다 효과적으로 이용할 수 있는 장점이 있다. 또한, 기술평가 자체가 워낙 활용분야가 광범위하기 때문에 본 발명으로 인한 효과 또한 상당함을 기대할 수 있다.
본 발명에 대해 상기 실시예를 참고하여 설명하였으나, 이는 예시적인 것에 불과하며, 본 발명에 속하는 기술 분야의 통상의 지식을 가진 자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서 본 발명 의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

Claims (14)

  1. 데이터의 텍스트 마이닝 기법을 이용한 기술평가 시스템에 있어서,
    온라인망을 매개로 하여, 다수의 사용자 단말과 연결되며, 주기적으로 등록공고되는 대량의 특허공보데이터로부터 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하고, 사용자로부터 상기 사용자 단말을 이용하여 온라인망을 통해 등록특허의 기술평가를 의뢰받아 상기 기반특허자료의 구축시와 같이 텍스트 마이닝 기법을 이용하여 분석한 후 상기 기등록특허자료와 의뢰특허자료를 비교하여 유사특허를 추출하고, 권리성, 상업성, 및 기술성을 포함하는 평가항목별로 그룹화하고 그룹별 평가를 통해 종합점수를 계산하여 각 특허에 대한 등급을 부여하여 평가하여 그 결과가 사용자에게 사용자 단말을 통해 피드백 될 수 있도록 하는 기술평가시스템서버가 구비되는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  2. 청구항 1에 있어서, 상기 기술평가시스템서버는,
    시스템 운영과 관련한 각종 정보와 사용자 기초정보를 관리하며, 사용자 단말이 온라인 망을 매개로 기술평가시스템서버에 접속되면 해당 기술평가시스템의 이용에 필요한 데이터 및 관련 프로그램이 제공되도록 하는 웹시스템관리서버;
    특허공보데이터와 특허서지사항데이터를 보유 및 관리하는 지재권정보서버;
    기 등록된 특허공보데이터와 사용자 단말을 이용하여 온라인망을 통해 의뢰되는 사용자의 의뢰특허의 특허공보데이터에 대하여 구문분석을 실시하여 평가펙터지수의 요소값으로 사용될 정량적인 데이터를 추출하고, 형태소분석을 거쳐 의미있는 색인어를 추출하여 특허문서를 색인어에 대한 빈도정보로 표현되도록 벡터화하는 텍스트마이닝서버;
    상기 텍스트마이닝서버로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터의 비교를 통해 얻어진 유사특허리스트를 추출하고, 다양한 종류의 펙터별 평가항목으로 평가를 수행하여 의뢰특허의 등급을 산정하고 전체적인 평가결과가 사용자 단말로 피드백 될 수 있도록 하는 등급평가서버 및
    상기 기술평가시스템에서 사용되는 웹시스템정보, 등록특허공보, 특허서지정보, 기 등록특허의 벡터화문서데이터, 기 등록특허의 정량적데이터, 평가펙터 분류 및 정보, 의뢰특허의 벡터화문서데이터 및 의뢰특허의 정량적데이터 등이 저장되고 관리되는 데이터베이스(DB) 서버를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  3. 청구항 2에 있어서, 상기 텍스트마이닝서버는
    상기 지재권정보서버로부터 특허공보데이터을 전달받아, 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 구문분석모듈;
    상기 구문분석모듈에서 구문분석이 완료된 텍스트로부터 유의어 사전인 시소 러스를 이용하여 색인어를 추출하는 형태소분석모듈;
    상기 형태소분석모듈을 통해 색인어가 추출되면 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성된 벡터로 표현하는 기 등록특허의 벡터화모듈;
    상기 기 등록특허의 벡터화모듈과 같이 각 의뢰특허문서에 대해서도 색인어에 대한 가중치로 구성되도록 하지만, 색인어 가중치가 기등록특허의 가중치와는 상이한 가중치가 적용되도록 하는 의뢰특허의 벡터화모듈 및
    상기 구문분석모듈에서 구문분석이 완료된 텍스트로부터 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 하는 정량데이터추출모듈을 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  4. 청구항 3에 있어서,
    상기 기 등록특허의 벡터화모듈의 색인어에 대한 가중치 수식은 아래와 같은 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
    [수학식 1]
    Figure 112007046660609-pat00022
    (여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
    n : 색인어가 전체 문서에 출현한 빈도수
    N : 전체 문서의 개수 이다.)
  5. 청구항 3에 있어서,
    상기 의뢰특허의 벡터화모듈의 색인어에 대한 가중치 수식은 아래와 같은 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
    [수학식 2]
    Figure 112007046660609-pat00023
    (여기서, tf : term frequency로 색인어가 현재 문서에 출현한 빈도수
    maxtf : 현재 문서의 색인어 중 최대 빈도수
    n : 색인어가 전체 문서에 출현한 빈도수
    N : 전체 문서의 개수 이다.)
  6. 청구항 2에 있어서, 상기 등급평가서버는
    상기 텍스트마이닝서버로부터 기 등록특허의 벡터화문서데이터와 의뢰특허의 벡터화문서데이터에 대해 특허문서의 각 항목별로 코사인 유사도 측정 알고리즘 적용에 따라 유사도를 산정하고, 항목별 가중치를 부여하여 유사특허를 추출하는 유사특허추출모듈;
    상기 유사특허추출모듈에서 추출된 유사특허를 권리성, 상업성 및 기술성 대분류 평가항목으로 분리하고 각 대분류 별 다수의 세분류로 평가 펙터들에 대한 지수를 각각 도출하고, 통계적 분석을 수행하여 의뢰특허와 유사특허들의 등급을 산정하는 펙터별평가모듈 및
    상기 펙터별평가모듈에서 펙터별 평가가 완료되어 등급산정까지 마친 의뢰특허에 대한 레포트를 작성하여 온라인망을 통해 사용자 단말로 사용자에게 전달될 수 있도록 하는 피드백모듈을 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  7. 청구항 6 에 있어서, 상기 유사특허추출모듈의 코사인 유사도 측정 알고리즘의 수식은 아래와 같은 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
    [수학식 3]
    Figure 112007046660609-pat00024
    (여기서, -
    Figure 112007046660609-pat00025
    : 의뢰특허의 벡터화문서데이터
    -
    Figure 112007046660609-pat00026
    : 기 등록특허의 벡터화문서데이터이다.)
  8. 청구항 6에 있어서, 상기 유사특허추출모듈의 항목별 가중치를 부여에 따른 유사특허 추출의 수식은 아래와 같은 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
    [수학식 4]
    Figure 112007046660609-pat00027
    (여기서, - sim1: 발명의 명칭
    - sim2: 요약
    - sim3: 발명이 속하는 기술분야 및 그 분야의 종래 기술
    - sim4: 발명의 효과
    - sim5: 청구항
    - w1~5 : 항목별 가중치 이다.)
  9. 청구항 6에 있어서, 상기 펙터별평가모듈의 대분류평가항목 중 권리성 평가의 세분류는,
    권리의 연속성, 권리의 영향력, 권리의 폭, 권리의 변동성, 권리의 안정성, 권리의 위험도, 권리의 완성도, 청구항의 개수, 청구범위, 권리의 활용도 및 출원의 완성도를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  10. 청구항 6에 있어서, 상기 펙터별평가모듈의 대분류평가항목 중 상업성 평가의 세분류는,
    상업적 신용도, 상업적 점유율, 상업적 활용성, 상업적 중요도, 상업적 기여도, 상업적 선점도, 상업적 대중성, 상업적 집중도, 국제협력도 및 상업적 실시성을 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  11. 청구항 6에 있어서, 상기 펙터별평가모듈의 대분류평가항목 중 기술성 평가의 세분류는,
    기술의 영향력, 기술의 집중도, 기술의 진보성, 기술의 융합도, 기술의 완전성, 기술의 포트폴리오, 기술의 사이클, 선행특허문헌수 및 선행비특허문헌수를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템.
  12. 데이터의 텍스트 마이닝 기법을 이용한 기술평가 방법에 있어서,
    주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버로부터 입수하여 텍스트 마이닝 기법을 이용하여 기술평가의 기준이 되는 데이터를 추출하고, 추출된 데이터로부터 다양한 기준의 펙터 값을 도출하고 분석하여 기반특허자료를 구축하는 기반특허자료분석구축단계;
    사용자로부터 사용자 단말을 이용하여 온라인망을 통해 웹시스템관리서버에서 제공하는 프론트페이지를 거쳐 등록된 특허의 기술평가를 의뢰받는 등록특허기술평가의뢰접수단계;
    상기 등록특허기술평가의뢰접수단계에서 접수된 등록특허에 대한 데이터를 지재권정보서버로부터 입수하여 상기 기반특허자료의 구축시와 같이 텍스트 마이닝기법을 이용하여 분석한 후 의뢰특허자료를 구축하는 의뢰특허자료분석마련단계;
    상기 기반특허자료분석구축단계를 통해 구축된 기반특허자료와 의뢰특허자료분석마련단계를 통해 구축된 의뢰특허자료를 비교하여 유사특허추출모듈을 통해 유사특허리스트를 추출하는 유사특허추출단계;
    상기 유사특허추출단계에서 추출된 유사특허들을 권리성, 상업성, 및 기술성을 포함하는 평가항목별로 그룹화하고 그룹별 평가를 통해 종합점수를 계산하여 각 특허에 대한 등급을 부여함으로써 평가를 수행하는 펙터별평가단계 및
    상기 펙터별평가단계에서 평가완료된 의뢰특허의 등급을 책정하여 사용자에게 전체적인 평가내용과 함께 피드백모듈을 통해 평가결과가 온라인망을 통해 사용자의 단말로 레포트될 수 있도록 하는 등급부여레포트단계를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법.
  13. 청구항 12에 있어서, 상기 기반특허자료분석구축단계는,
    텍스트마이닝서버에서 주기적으로 등록공고되는 대량의 특허공보데이터를 지재권정보서버로부터 입수하여, 구문분석모듈을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 특허공보데이터의 구문분석단계;
    상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 형태소분석모듈을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계;
    상기 색인어추출단계에서 색인어가 추출되면 벡터화모듈을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성되도록 하고 이를 기 등록특허의 벡터화문서데이터베이스화 하는 기반데이터의벡터화단계 및
    상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈 을 통해 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출에 사용될 수 있도록 기 등록특허의 정략적데이터베이스화 하는 기반데이터의정량데이터추출단계를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법.
  14. 청구항 12에 있어서, 상기 의뢰특허자료분석마련단계는,
    텍스트마이닝서버에서 상기 등록특허기술평가의뢰접수단계에서 의뢰된 특허건의 특허공보데이터를 지재권정보서버로부터 입수하여, 구문분석모듈을 통해 항목별 텍스트를 추출하고 텍스트 내에 포함되어 있는 불필요한 태그를 제거하는 특허공보데이터의 구문분석단계;
    상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 형태소분석모듈을 통해 유의어사전인 시소러스를 이용하여 색인어를 추출하는 색인어추출단계;
    상기 색인어추출단계에서 색인어가 추출되면 의뢰특허 벡터화모듈을 통해 상기 색인어에 대한 출현 빈도수 정보를 구축하고, 이를 유사특허 추출을 위한 문서 간 유사도 측정 연산에 사용할 수 있도록 각 특허문서를 색인어에 대한 가중치로 구성되도록 하고 이를 의뢰특허의 벡터화문서데이터베이스화 하는 의뢰특허의벡터화단계 및
    상기 구문분석단계에서 구문분석이 완료된 텍스트로부터 정량데이터추출모듈을 통해 정량적인 데이터를 추출하여 특허서지사항데이터에 추가하여 펙터값 도출 에 사용될 수 있도록 의뢰특허의 정량적데이터베이스화 하는 의뢰특허의정량데이터추출단계를 포함하는 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 방법.
KR1020070063410A 2007-06-27 2007-06-27 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법 KR100899754B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070063410A KR100899754B1 (ko) 2007-06-27 2007-06-27 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070063410A KR100899754B1 (ko) 2007-06-27 2007-06-27 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법

Publications (2)

Publication Number Publication Date
KR20090002308A KR20090002308A (ko) 2009-01-09
KR100899754B1 true KR100899754B1 (ko) 2009-05-27

Family

ID=40485314

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070063410A KR100899754B1 (ko) 2007-06-27 2007-06-27 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법

Country Status (1)

Country Link
KR (1) KR100899754B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101336994B1 (ko) * 2011-07-25 2013-12-16 한국과학기술정보연구원 R&d 과제 평가 장치 및 방법
KR20170030016A (ko) 2016-05-09 2017-03-16 한국지질자원연구원 특허정보를 이용한 지질자원 분야 유망기술군 분석방법 및 시스템
KR101762252B1 (ko) 2016-04-08 2017-07-31 (주)윕스 아이디어 창출 지원 방법 및 이를 위한 지원 장치
KR102637313B1 (ko) * 2022-12-23 2024-02-20 한국건설기술연구원 Bim 입찰 문서의 기술 난이도를 평가하기 위한 장치 및 그 방법

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101053968B1 (ko) * 2009-12-15 2011-08-04 한국발명진흥회 특허 자동 평가 시스템의 특허 자동 평가 방법
KR101118057B1 (ko) * 2009-12-15 2012-02-24 한국발명진흥회 특허 자동 평가 시스템 및 상기 시스템에서의 평가 요소 정보 처리 방법
US20130282599A1 (en) * 2010-11-02 2013-10-24 Kwanggaeto Co., Ltd. Method of generating patent evaluation model, method of evaluating patent, method of generating patent dispute prediction model, method of generating patent dispute prediction information, and method and system for generating patent risk hedging information
KR101528481B1 (ko) * 2014-08-29 2015-06-12 한국과학기술정보연구원 요소기능의 추출, 분류 및 기능 간 관계분석을 통한 응용 기술 및 제품 발굴 시스템
KR102221913B1 (ko) * 2017-04-11 2021-03-02 위병준 연구개발 지원 시스템 및 이를 이용한 연구개발 지원 방법
KR101995011B1 (ko) * 2017-11-27 2019-07-02 한국발명진흥회 구조방정식 모델을 활용한 특허 평가 방법, 그 방법을 수행하는 시스템 및 그 방법이 수행되는 컴퓨터 프로그램이 저장된 컴퓨터 판독 가능한 저장 매체
KR102097210B1 (ko) * 2018-08-01 2020-05-27 김해동 P2p 담보 대출 금융 기술을 이용한 지식 재산 홍보 및 투자자 연결 서비스 방법과 그 장치
KR102136984B1 (ko) * 2018-08-31 2020-07-23 박장욱 기술 거래 서비스 제공방법 및 기술 거래 서버
KR102223531B1 (ko) 2018-11-01 2021-03-05 베스핀글로벌 주식회사 지능형 정보시스템 운영 성과 측정 방법
KR102065928B1 (ko) * 2018-11-16 2020-01-14 김정중 특허 평가 시스템
CN110134848B (zh) * 2019-05-14 2023-09-26 云南电网有限责任公司电力科学研究院 一种基于语义分析的科技成果转化分析方法及系统
KR102097244B1 (ko) * 2019-08-01 2020-05-27 김해동 P2p 지식 재산 담보 대출 금융 기술 서비스 방법 및 그 장치
KR102370227B1 (ko) * 2019-11-11 2022-03-03 한림대학교 산학협력단 연구문헌 중요도 평가 장치, 방법 및 프로그램
WO2024029966A1 (ko) * 2022-08-03 2024-02-08 재단법인대구경북과학기술원 청구항 분석에 기초하여 문헌의 가치를 평가하는 방법 및 그 방법을 수행하는 서버

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281358A (ja) * 2002-03-25 2003-10-03 Nri & Ncc Co Ltd 特許分析システム及び特許分析グラフ製造方法
KR20040086913A (ko) * 2003-04-03 2004-10-13 재단법인서울대학교산학협력재단 특허 정보의 텍스트 마이닝(Text Mining)에의한 기술 공백의 발견 방법과 그 시스템
JP2006318005A (ja) * 2005-05-10 2006-11-24 Ird:Kk 特許価値算出装置、特許価値算出方法およびプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003281358A (ja) * 2002-03-25 2003-10-03 Nri & Ncc Co Ltd 特許分析システム及び特許分析グラフ製造方法
KR20040086913A (ko) * 2003-04-03 2004-10-13 재단법인서울대학교산학협력재단 특허 정보의 텍스트 마이닝(Text Mining)에의한 기술 공백의 발견 방법과 그 시스템
JP2006318005A (ja) * 2005-05-10 2006-11-24 Ird:Kk 特許価値算出装置、特許価値算出方法およびプログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101336994B1 (ko) * 2011-07-25 2013-12-16 한국과학기술정보연구원 R&d 과제 평가 장치 및 방법
KR101762252B1 (ko) 2016-04-08 2017-07-31 (주)윕스 아이디어 창출 지원 방법 및 이를 위한 지원 장치
WO2017175912A1 (ko) * 2016-04-08 2017-10-12 (주)윕스 아이디어 창출 지원 방법 및 이를 위한 지원 장치
KR20170030016A (ko) 2016-05-09 2017-03-16 한국지질자원연구원 특허정보를 이용한 지질자원 분야 유망기술군 분석방법 및 시스템
KR102637313B1 (ko) * 2022-12-23 2024-02-20 한국건설기술연구원 Bim 입찰 문서의 기술 난이도를 평가하기 위한 장치 및 그 방법

Also Published As

Publication number Publication date
KR20090002308A (ko) 2009-01-09

Similar Documents

Publication Publication Date Title
KR100899754B1 (ko) 텍스트 마이닝 기법을 이용한 등록특허의 기술평가 시스템및 그 방법
CN112035742B (zh) 用户画像生成方法、装置、设备及存储介质
CN109783639B (zh) 一种基于特征提取的调解案件智能分派方法及系统
Tsui et al. Knowledge-based extraction of intellectual capital-related information from unstructured data
WO2022156328A1 (zh) 一种融合服务协作关系的Restful类型Web服务聚类方法
Weidlich et al. Matching business process models using positional passage-based language models
US20140379761A1 (en) Method and system for aggregate content modeling
CN115098650B (zh) 基于历史数据模型的评论信息分析方法及相关装置
CN114372731B (zh) 基于大数据的岗位目标制定方法、装置,设备及存储介质
CN111382279A (zh) 审单方法和装置
CN107798622A (zh) 一种识别用户意图的方法和装置
KR20200119365A (ko) 인공지능-빅데이터 기반의 화장품업체 협업시스템
CN111143394B (zh) 知识数据处理方法、装置、介质及电子设备
CN111210307A (zh) 以响应用户偏好为核心的科技服务链智能推荐系统及方法
CN114240494A (zh) 医疗项目成本核算方法、系统、电子设备及存储介质
CN114238781A (zh) 基于人工智能的信息推送方法、装置、设备及介质
CN112989053A (zh) 一种期刊推荐方法及装置
CN107609921A (zh) 一种数据处理方法及服务器
KR101671890B1 (ko) 거래관계 분석 장치 및 방법
CN117057866A (zh) 业务推荐方法和装置、电子设备及存储介质
CN107256268A (zh) 适用于企业数据库的语音检索方法
KR101456189B1 (ko) 특허 평가 엔진을 이용한 특허 자동 평가 방법 및 평가 서버
Taghaboni‐Dutta et al. An exploratory RFID patent analysis
CN110428150A (zh) 一种变革指数生成方法及装置
Tang et al. FinEntity: Entity-level Sentiment Classification for Financial Texts

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130308

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140415

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20170518

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180326

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190619

Year of fee payment: 11