KR101771634B1

KR101771634B1 - 특허 라이센싱 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체

Info

Publication number: KR101771634B1
Application number: KR1020110025697A
Authority: KR
Inventors: 강민수
Original assignee: (주)광개토연구소
Priority date: 2011-03-23
Filing date: 2011-03-23
Publication date: 2017-09-05
Also published as: KR20120108127A

Abstract

본 발명은 특허 라이센싱 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체에 관한 것이다.
본 발명을 실시하면 시스템적으로 신뢰성 있고 타당성 높은 특허 라이센싱 예측 정보를 생성할 수 있다.

Description

특허 라이센싱 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체{System, Media, Program and Method on Generating Patent Licensing Prediction Information}

본 발명은 특허 라이센싱 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체에 관한 것으로서, 더욱 더 상세하게는 라이센싱 예측 모델을 수립하고, 라이센싱 예측 모델값을 사용하는 특허 라이센싱 예측 정보 생성 방법, 그 방법을 실시하는 시스템, 그 방법을 실시하는 프로그램, 그 프로그램이 기록된 기록 매체에 관한 것이다.

특허 전쟁의 시대를 맞아 전세계적으로 특허 분쟁이 급증하고 있다. 종래에는 특허 분쟁이 발생한 분쟁 정보를 DB로 구축하고, 분쟁 정보를 분석해 주거나, 분쟁 발생 정보를 뉴스 레터 등으로 전송해 주거나, 분쟁 정보를 검색할 수 있도록 해 주는 수준에서 그쳤다. 이들 서비스는 과거에 발생한 특허 분쟁에 대한 서비스로 미래에 발생할 분쟁에 대한 예측 정보를 제공해 주지 못하였다. 이에 따라, 분쟁의 원고나 피고가 되는 기업 등은 각자 처해진 현실이나, 제품, 기술 및 특허 포트폴리오가 다른 바, 이들에게 특화된 분쟁 예측 정보를 제공해 주는 서비스의 도입이 절실히 필요하다. 나아가 체계적으로 라이센싱 대상 특허나 라이센시를 발견하거나, 크로스 라이센싱 대상자나 대상 특허를 발견하는 특허 정보 처리 방법 및 그 시스템도 필요성이 급증하고 있다.

본 발명이 해결하고자 하는 기술적 과제는 특허 라이센싱 예측 정보 생성 시스템의 라이센싱 예측 모델 생성 방법, 라이센싱 예측 정보 생성 방법, 그 방법이 기록된 컴퓨터가 실행할 수 있는 프로그램, 그 프로그램이 기록된 기록 매체 및 그 방법을 실시하는 시스템을 제시하는 것이다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, (A) 적어도 한 종류 이상의 특허 분쟁에 사용된 특허를 포함하는 적어도 하나 이상의 분쟁 특허 집합과 적어도 하나 이상의 비분쟁 특허 집합을 입수하는 단계; (B) 상기 분쟁 특허 집합을 구성하는 적어도 2 이상의 분쟁 특허들과 상기 비분쟁 특허 집합을 구성하는 적어도 2 이상의 비분쟁 특허들에 대하여 기 설정된 적어도 2 이상의 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 단계; 및 (C) 상기 분쟁 특허와 상기 비분쟁 특허에 대하여, 상기 분쟁 예측 요소값을 설명 변수값으로 하고, 상기 분쟁 특허에 부여된 분쟁 특허 부여값과 상기 분쟁 특허 부여값과 다르게 부여되며 상기 비분쟁 특허에 부여된 비분쟁 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 기 설정된 적어도 하나 이상의 분쟁 예측 모델을 생성하는 적어도 하나 이상의 분쟁 예측 모델을 수립하는 단계;를 포함하는 것을 특징으로 하는 특허 정보 시스템의 특허 분쟁 예측 모델 생성 방법을 제시한다.

상기 특허 분쟁에 사용된 특허는 사법부에 제기하는 특허 분쟁에 사용된 특허, 행정부에 제기하는 특허 분쟁에 사용된 특허, 특허 침해자에 대한 경고장에 사용된 특허, 특허 침해자에 대한 특허권의 행사에 사용된 특허 및 특허 로열티가 발생한 특허 중 어느 한 종류 이상인 것이 바람직하다.

상기 비분쟁 특허 집합의 크기는 상기 분쟁 특허 집합의 크기보다 같거나, 큰 것인 것이며, 상기 비분쟁 특허 집합은 상기 분쟁 특허 집합의 통계학적 속성 중 어느 하나 이상을 공유하면서 전체 특허 집합에서 추출되는 것인 제1 비분쟁 집합 생성 방법 및 랜덤(random)하게 추출되는 제2 비분쟁 집합 생성 방법 중에서 선택되는 어느 하나의 방법으로 생성되는 것인 것이 바람직하다.

상기 분쟁 예측 요소값은 분쟁 예측 요소별로 상기 분쟁 특허 집합과, 상기 비분쟁 특허 집합을 구성하는 개별 특허 단위로 생성되는 것이며, 상기 분쟁 예측 요소는 상기 개별 특허별 자기 속성 계열, 자타 속성 계열, 분야 속성 계열 중 어느 하나 이상의 속성 계열과 관련되는 것인 것이 바람직하다.

상기 분쟁 예측 요소에는 인용 관련 분쟁 예측 요소를 포함하고 있는 것이며, 상기 인용 관련 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성할 때는 직접 인용, 간접 인용, 잠재 인용 및 사슬 인용 중 어느 하나 이상의 인용을 사용하는 것이며, 상기 직접 인용, 간접 인용, 잠재 인용 및 사슬 인용 중 2 이상을 사용하는 방법은 각 인용의 종류별로 독립적으로 처리하여 기 설정된 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 제1 인용 사용 방법 및 2 이상의 인용을 복합적으로 사용하되, 각 인용의 종류별로 기 설정된 가중치를 부여하여 기 설정된 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 제2 인용 사용 방법 중 어느 하나 이상의 방법을 사용하는 것인 것이 바람직하다.

상기 분쟁 예측 요소에는 동일한 종류의 분쟁 예측 요소에 대하여 적어도 기간 설정을 달리하는 분쟁 예측 요소가 포함되어 있는 것이며, 상기 기간 설정은 상기 동일한 종류의 분유에 대하여 적어도 하나 이상이 설정되는 것인 것이 바람직하다.

상기 분쟁 예측 요소는 적어도 하나 이상의 인용 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 특허 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 유발자 관점 분쟁 예측 요소 및 적어도 하나 이상의 다분쟁 기술군 관점 분쟁 예측 요소 중에서 선택되는 어느 하나 이상을 포함하는 것인 것이 바람직하다.

상기 분쟁 특허에 상기 분쟁 특허 부여값을 부여하는 방법은, 상기 분쟁 특허의 속성에 따라 다르게 부여되는 제1 분쟁 특허 부여값 부여 방법 및 상기 분쟁 특허의 속성과 무관하게 분쟁 발생 여부로만 분쟁 특허 부여값을 부여하는 제2 분쟁 특허 부여값 부여 방법 중 어느 하나를 사용하는 것이 바람직하다.

상기 분쟁 특허의 속성은 복수 분쟁 속성, 공동 피고수 속성, 공동 참여 속성 중 어느 하나 이상인 것인 것이며, 상기 복수 분쟁 속성은 상기 분쟁 특허가 적어도 2 이상의 분쟁에 관련되는 속성인 것이며, 상기 공동 피고 속성은 상기 분쟁 특허가 적어도 2 이상의 피고를 상대로 분쟁을 제기하는 분쟁에 관련되는 속성인 것이며, 상기 공동 참여 속성은 상기 분쟁 특허가 관련된 분쟁에 적어도 하나 이상의 다른 분쟁 특허도 관련되는 속성인 것인 것이 바람직하다.

상기 제1 분쟁 특허 부여값 부여 방법을 채용하는 경우, 상기 분쟁 특허 부여값을 부여하는 방법은 상기 분쟁 특허가 복수 분쟁 속성을 가질 경우에는 상기 분쟁 특허 부여값을 복수 분쟁 속성을 가지지 않을 경우보다 높게 부여하는 것이거나, 상기 분쟁 특허가 공동 피고 속성을 가질 경우에는 상기 분쟁 특허 부여값을 공동 피고 속성을 가지지 않을 경우보다 높게 부여하는 것이거나 상기 분쟁 특허가 공동 참여 속성을 가질 경우에는 상기 분쟁 특허 부여값을 공동 참여 속성을 가지지 않을 경우보다 낮게 부여하는 것인 것이 바람직하다.

상기 제1 분쟁 특허 부여값 부여 방법을 채용하는 경우, 상기 분쟁 특허 부여값을 부여하는 방법은 상기 분쟁 특허가 상기 복수 분쟁 속성을 가지는 경우, 상기 분쟁 특허 부여값을 부여하는 방법은 상기 분쟁 특허가 관련되는 전체 분쟁수, 전체 분쟁의 시간별 분포 속성, 상기 전체 분쟁의 피고별 분포 속성 중 어느 하나 이상을 참조하여 부여되는 것인 것이거나, 상기 분쟁 특허가 상기 공동 피고 속성을 가지는 경우, 상기 분쟁 특허 부여값을 부여하는 방법은 상기 분쟁 특허가 관련되는 전체 피고수, 분쟁 당 평균 피고수, 분쟁당 피고수의 통계적 분포 속성 중 어느 하나 이상을 참조하여 부여되는 것인 것이거나, 상기 분쟁 특허가 상기 공동 참여 속성을 가지는 경우, 분쟁 특허 부여값을 부여하는 방법은 상기 분쟁 특허가 관련되는 분쟁에서 상기 분쟁 특허의 평균 지분, 상기 평균 지분의 통계적 분포 속성 중 어느 하나 이상을 참조하여 부여되는 것인 것이 바람직하다.

상기 통계학적 처리는 다중 회귀 분석인 것이 바람직하다.

상기 다중 회귀 분석은 기계 학습 계열의 비선형 알고리즘을 사용하는 것인 것이 바람직하다.

상기 기계 학습 계열의 비선형 알고리즘은 트리(tree)를 활용한 앙상블 기법을 사용하는 것인 것이 바람직하다.

상기 분쟁 예측 모델은 상기 분쟁 특허의 속성에 따라 다르게 부여되는 제1 분쟁 특허 부여값 부여 방법별, 사용되는 분쟁 예측 요소군별 및 사용되는 분쟁 특허 집합별 중 어느 하나 이상이 적용되어 생성되는 것인 것이 바람직하다.

사용되는 상기 분쟁 특허 집합은 사용자가 지정하는 속성을 충족하는 분쟁 특허 집합인 것인 것이 바람직하다.

(D) 상기 분쟁 예측 모델을 사용하여 입수되는 특허 집합에 속하는 특허들에 대하여 특허별로 분쟁 예측 모델값을 생성하는 단계;를 더 실시하며, 상기 입수되는 특허 집합은 전체 특허 집합 또는 기 설정된 특허 집합 또는 사용자가 지정한 특허 집합 또는 상기 사용자가 지정한 특허 집합과 관련된 관련 특허 집합 중 어느 하나 이상인 것이며, 생성된 상기 분쟁 예측 모델값은 상기 특허와 대응하여 임시 또는 영구적으로 저장되는 것인 것이거나, 상기 분쟁 예측 모델값을 요청한 자에게 전송하는 것인 것이 바람직하다.

상기 분쟁 예측 모델값을 생성하는 것은 기 설정된 주기를 따르거나 또는 기 설정된 조건의 충족 여부에 따라서 생성되는 것인 것이 바람직하다.

상기의 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기의 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램이 기록된 기록 매체를 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기의 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 분쟁 특허 집합을 구성하는 적어도 2 이상의 분쟁 특허들과 상기 비분쟁 특허 집합을 구성하는 적어도 2 이상의 비분쟁 특허들에 대하여 기 설정된 적어도 2 이상의 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 분쟁 예측 요소값 생성부; 상기 분쟁 특허와 상기 비분쟁 특허에 대하여, 상기 분쟁 예측 요소값을 설명 변수값으로 하고, 상기 분쟁 특허에 부여된 분쟁 특허 부여값과 상기 분쟁 특허 부여값과 다르게 부여되며 상기 비분쟁 특허에 부여된 비분쟁 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 기 설정된 적어도 하나 이상의 분쟁 예측 모델값을 생성하는 적어도 하나 이상의 분쟁 예측 모델을 수립하는 분쟁 예측 모델 생성부; 및 상기 분쟁 예측 모델을 사용하여 입수되는 특허 집합에 속하는 특허들에 대하여 특허별로 분쟁 예측 모델값을 생성하는 특허별 분쟁 예측 모델값 생성부;를 포함하여 분쟁 예측 정보를 처리하는 것을 특징으로 하는 특허 분쟁 예측 모델을 생성하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, (a) (a1) (a11) 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 먼저 입수하고, (a12) 상기 자기 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하거나, (a2) (a21) 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, (a22) 상기 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 자기 특허 집합을 입수하는 단계; (b) 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수하는 단계; 및 (c) 상기 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 분쟁 예측 정보를 생성하는 단계;를 포함하는 것을 특징으로 하는 특허 정보 시스템의 특허 분쟁 예측 정보 처리 방법을 제시한다.

상기 자기 특허 집합은 사용자가 생성하거나 관리하는 특허 집합인 사용자 관리 특허 집합이거나 상기 특허 정보 시스템이 생성하거나 관리하는 특허 집합인 시스템 관리 특허 집합인 것이며, 상기 자기 특허 집합은 기 설정된 집합 한정 옵션을 사용하여 한정되는 것이거나, 기 설정된 분할 기준을 적용하여 2 이상의 부분 특허 집합으로 분할 될 수 있는 것인 것이며, 상기 타겟 특허 집합은 사용자가 생성하거나 관리하는 특허 집합인 사용자 관리 특허 집합이거나 상기 특허 정보 시스템이 생성하거나 관리하는 특허 집합인 시스템 관리 특허 집합인 것이며, 상기 타겟 특허 집합은 기 설정된 집합 한정 옵션을 사용하여 한정되는 것이거나, 기 설정된 분할 기준을 적용하여 2 이상의 부분 특허 집합으로 분할 될 수 있는 것인 것이 바람직하다.

상기 타겟 특허 집합은 상기 자기 특허 집합을 구성하는 자기 특허들과 기 설정된 관련성을 가지는 특허들로 이루어지는 관련 특허 관계인 것이며, 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이 바람직하다.

상기 타겟 특허 집합을 구성하는 타겟 특허들은 2 이상의 자기 특허들과 기 설정된 관련성을 가질 수 있는 것인 것이며, 상기 관련성은 계량화 될 수 있는 것이며, 상기 계량화는 관련성 빈도 및 관련성 강도 중 어느 하나 이상을 포함하여 구성되는 것인 것이 바람직하다.

상기 관련성 빈도는 상기 타겟 특허에 대응되는 기 설정된 관련성을 가지는 자기 특허의 개수인 것이며, 상기 관련성 강도는 인용-피인용 특허 관계 정보, 유사 특허군 관계 정보 및 유사 기술 특허 관계 정보 중 어느 하나 이상을 사용하여 생성되는 것인 것이 바람직하다.

상기 인용-피인용 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 인용-피인용 깊이 정보 및 인용-피인용 종류 정보 중 어느 하나 이상을 사용하여 생성되는 것을 포함하는 것인 것이 바람직하다.

상기 유사 특허군 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허의 유사도 정보를 사용하여 생성되는 것인 것이며, 상기 유사도 정보는 상기 자기 특허와 상기 타겟 특허에서 추출되는 추출 키워드, 상기 자기 특허와 상기 타겟 특허의 레퍼런스(reference) 정보에서 생성되는 인용-피인용 정보, 상기 자기 특허와 상기 타겟 특허에서 추출되는 적어도 한 종류 이상의 특허 분류 및 상기 특허 분류가 속하는 특허 분류 체계 상의 상기 특허 분류의 적어도 한 단계 이상의 상위 특허 분류 중 어느 하나 이상의 활용을 포함하여 생성되는 것인 것이 바람직하다.

상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것인 것이 바람직하다.

상기 특허별 분쟁 예측 모델값은 적어도 하나 이상의 인용 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 특허 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 유발자 관점 분쟁 예측 요소 및 적어도 하나 이상의 다분쟁 기술군 관점 분쟁 예측 요소 중에서 선택되는 어느 하나 이상의 분쟁 예측 요소의 분쟁 예측 요소값을 사용하여 생성되는 것인 것이 바람직하다.

상기 특허별 분쟁 예측 모델값을 입수하는 것은 상기 타겟 특허에 대하여 실시간으로 상기 특허별 분쟁 예측 모델값을 생성하거나, 기 생성된 특허별 분쟁 예측 모델값을 저장하고 있는 특허별 분쟁 예측 모델값 DB에서 호출하는 것인 것이 바람직하다.

상기 생성되는 분쟁 예측 정보는 입수된 상기 자기 집합에 대응되는 타겟 특허별 분쟁 예측 정보, 입수된 상기 자기 집합에 대응되는 적어도 하나 이상의 타겟 특허군별 분쟁 예측 정보, 입수된 상기 자기 집합에 대응되는 타겟 특허 집합에 대한 분쟁 예측 정보, 적어도 하나 이상의 부분 자기 집합에 대응되는 타겟 특허별 분쟁 예측 정보, 적어도 하나 이상의 부분 자기 집합에 대응되는 적어도 하나 이상의 타겟 특허군별 분쟁 예측 정보 중 어느 하나 이상인 것이 바람직하다.

상기 분쟁 예측 정보는 기 설정된 적어도 하나 이상의 분쟁 예측 정보값, 적어도 하나 이상의 분쟁 예측 분석 정보, 적어도 하나 이상의 분쟁 예측 근거 정보 중 어느 하나 이상인 것이 바람직하다.

상기 (a12) 단계는 기 설정된 조건을 충족하는 특허만을 상기 타겟 특허로 입수하는 것인 것이거나, 상기 (a22) 단계는 기 설정된 조건을 충족하는 특허만을 자기 특허로 입수하는 것인 것이며, 상기 기 설정된 조건은 상기 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이 바람직하다.

상기 기 설정된 조건은 권리자 조건, 관련성 조건, 및 개별 특허 속성 조건 중 어느 하나 이상인 것이 바람직하다.

상기 타겟 특허 집합을 구성하는 적어도 하나 이상의 타겟 특허 및 상기 타겟 특허 집합에 대하여 기 설정된 분할 기준 또는 기 설정된 선별 기준을 적용한 적어도 하나 이상의 부분 타겟 특허 집합 중 어느 하나 이상은 기 설정된 랭킹을 가지는 것이며, 상기 랭킹은 상기 관련성 빈도, 상기 관련성 강도, 상기 분쟁 예측 모델값 및 사용자 입력 관련성 정보 중 어느 하나 이상을 사용하는 랭킹 생성 규칙에 따라서 생성되는 것인 것이 바람직하다.

상기 (a12) 단계의 상기 타겟 특허 집합의 입수는 분할된 상기 부분 자기 특허 집합별로 입수하는 것인 것이며, 이 경우 상기 (c) 단계의 상기 분쟁 예측 정보를 생성하는 것은 상기 부분 자기 특허 집합에 대응되는 부분 타겟 특허 집합별로 생성되는 것인 것이거나 상기 (a22) 단계의 상기 자기 특허 집합의 입수는 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 것이며, 이 경우 상기 (c) 단계의 상기 분쟁 예측 정보를 생성하는 것은 상기 부분 타겟 특허 집합에 대응되는 부분 자기 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 (a) 단계에서,(a1)의 방법이 선택되는 경우, 상기 (a11) 단계의 상기 자기 특허 집합의 입수는 적어도 2 이상의 자기 특허 집합의 입수인 것이며, 상기 (a12) 단계의 상기 타겟 특허 집합의 입수는 2 이상의 상기 자기 특허 집합별로 입수하는 것인 것이며, 상기 (c) 단계의 상기 분쟁 예측 정보를 생성하는 것은 2 이상의 상기 자기 특허 집합에 대응되는 타겟 특허 집합별로 생성되는 것인 것이거나 (a2)의 방법이 선택되는 경우, 상기 (a21) 단계의 상기 타겟 특허 집합의 입수는 적어도 2 이상의 타겟 특허 집합의 입수인 것이며, 상기 (a22) 단계의 상기 자기 특허 집합의 입수는 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 것이며, 상기 (c) 단계의 상기 분쟁 예측 정보를 생성하는 것은 2 이상의 상기 타겟 특허 집합에 대응되는 자기 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 타겟 특허 집합의 입수는 사용자가 생성하거나 선택하는 적어도 하나 이상의 사용자 특허 집합인 것이며, 상기 사용자 특허 집합이 상기 자기 특허 집합과 가지는 관련성은 상기 자기 특허 집합을 구성하는 자기 특허 중 적어도 어느 하나와 상기 사용자 특허 집합을 구성하는 타겟 특허 중 적어도 어느 하나가 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상의 관계를 계산할 수 있는 것인 것이 바람직하다.

상기 (c) 단계의 상기 분쟁 예측 정보를 생성하는 것은 자기 특허별로 생성되는 것이거나, 적어도 2 이상의 분할되거나 선별되는 자기 특허 집합별로 생성되는 것이거나, 적어도 2 이상의 분할되거나 선별되는 타겟 특허 집합별로 생성되는 것인 것이며, 상기 자기 특허 집합의 선별이나 분할 또는 상기 타겟 특허 집합의 선별이나 분할은 사용자에 의해서 선별되거나 분할되는 방식 또는 상시 시스템의 기 설정된 선별 기준이나 분할 기준에 의해 분할되는 방식 중 어느 하나 이상이 적용되는 것인 것이 바람직하다.

상기 기 설정된 선별 기준이나 분할 기준은 타겟 특허 집합을 구성하는 타겟 특허의 권리자명, 권리자 속성, 특허 기술 분류, 기 설정된 적어도 하나 이상의 평가값 중 어느 하나 이상인 것인 것이 바람직하다.

상기 권리자 속성은 상기 시스템이 지정하는 적어도 하나 이상의 속성 및 상기 사용자가 지정하는 적어도 하나 이상의 속성 중 어느 하나 이상인 것이거나, 상기 평가값은 상기 타겟 특허에 대한 적어도 하나 이상의 질적 평가 요소 중 어느 하나 이상을 사용하여 평가된 질적 평가 요소값인 것이 바람직하다.

상기 (b) 단계의 특허별 분쟁 예측 모델값의 입수는 입수된 1차 타겟 특허 집합에 대하여 기 설정된 집합 연산을 수행한 후에 생성되는 2차 타겟 특허 집합을 구성하는 2차 타겟 특허를 대상으로 실시되는 것이며, 상기 2차 타겟 특허 집합은 상기 1차 타겟 특허 집합을 구성하는 1차 타겟 특허에 대한 삭제, 상기 1차 타겟 특허 집합에 대한 한정 및 2차 타겟 특허 집합으로의 신규 특허 추가 중 어느 하나 이상이 실시되어 생성되는 것인 것이 바람직하다.

상기 (c) 단계의 상기 분쟁 예측 정보의 생성은 상기 사용자로부터 입수 받은 사용자 가중치 정보를 반영하여 생성되는 것인 것이며, 상기 사용자 가중치 정보는 상기 타겟 특허 집합을 구성하는 타겟 특허 중 어느 하나 이상에 대하여 개별 타겟 특허별로 상기 사용자가 설정하는 타겟 특허별 가중치 정보, 타겟 특허의 개별 속성에 설정하는 속성별 가중치 정보, 인용-피인용 관계에 대해 설정하는 인용-피인용 가중치 정보, 텍스트 마이닝 관계에 대해 설정하는 텍스트 마이닝 가중치 정보, 특허 분류상 유사 기술 특허 관계에 대해 설정하는 유사 기술 특허 관계 가중치 정보 중 어느 하나 이상인 것이 바람직하다.

상기 분쟁 예측 모델값은 분쟁 특허와 비분쟁 특허에 대하여, 분쟁 예측 요소값을 설명 변수값으로 하고, 상기 분쟁 특허에 부여된 분쟁 특허 부여값과 상기 분쟁 특허 부여값과 다르게 부여되며 상기 비분쟁 특허에 부여된 비분쟁 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 생성되는 것인 것이 바람직하다.

상기 통계학적 처리는 트리(tree)를 활용한 앙상블 기법을 사용하는 기계 학습 계열의 알고리즘을 사용하는 것인 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기의 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 분쟁 예측 정보를 처리하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 입수하는 자기 특허 집합 생성부; 상기 자기 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 생성하거나 입수하는 타겟 특허 집합 생성부; 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수하는 분쟁 예측 모델값 입수부; 및 상기 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 분쟁 예측 정보를 생성하는 분쟁 예측 정보 생성부;를 포함하는 것을 특징으로 하는 특허 분쟁 예측 정보를 처리하는 특허 정보 시스템을 제시한다.

상기 자기 특허 집합을 구성하는 자기 특허와 상기 타겟 특허 집합을 구성하는 타겟 특허 간에서 기 설정된 관련성을 계산하는 다중 관계성 처리 모듈;를 더 포함하며 상기 다중 관계성 처리 모듈이 계산하는 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, (I) (I1) (I11) 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 먼저 입수하고, (I12) 상기 자기 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하거나, (I2) (I21) 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, (I22) 상기 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 자기 특허 집합을 입수하는 단계; (J) 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 라이센싱 예측 모델값을 입수하는 단계; 및 (K) 상기 특허별 라이센싱 예측 모델값을 활용하여 적어도 하나 이상의 라이센싱 예측 정보를 생성하는 단계;를 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법을 제시한다.

상기 (I12) 단계에서 상기 타겟 특허 집합은 상기 자기 특허 집합을 구성하는 자기 특허의 최선일을 기준으로 하여 후출원인 것이거나, 상기 (I22) 단계에서 상기 자기 특허 집합은 상기 타겟 특허 집합을 구성하는 타겟 특허의 최선일을 기준으로 하여 선출원인 것인 것이 바람직하다.

상기 자기 특허와 상기 타겟 특허는 기 설정된 관련성을 가지는 특허들로 이루어지는 관련 특허 관계인 것이며, 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이며, 상기 타겟 특허 집합을 구성하는 타겟 특허들은 2 이상의 자기 특허들과 기 설정된 관련성을 가질 수 있는 것인 것이며, 상기 관련성은 계량화 될 수 있는 것이며, 상기 계량화는 관련성 빈도 및 관련성 강도 중 어느 하나 이상을 포함하여 구성되는 것인 것이 바람직하다.

상기 인용-피인용 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 인용-피인용 깊이 정보 및 인용-피인용 종류 정보 중 어느 하나 이상을 사용하여 생성되는 것을 포함하는 것이거나 상기 유사 특허군 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허의 유사도 정보를 사용하여 생성되는 것인 것이거나, 상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것이며, 상기 유사도 정보는 상기 자기 특허와 상기 타겟 특허에서 추출되는 추출 키워드, 상기 자기 특허와 상기 타겟 특허의 레퍼런스 정보에서 생성되는 인용-피인용 정보, 상기 자기 특허와 상기 타겟 특허에서 추출되는 적어도 한 종류 이상의 특허 분류 및 상기 특허 분류가 속하는 특허 분류 체계 상의 상기 특허 분류의 적어도 한 단계 이상의 상위 특허 분류 중 어느 하나 이상의 활용을 포함하여 생성되는 것인 것이며, 상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것인 것이 바람직하다.

상기 생성되는 라이센싱 예측 정보는 상기 타겟 집합에 대응되는 자기 특허별 라이센싱 예측 정보, 상기 타겟 집합에 대응되는 적어도 하나 이상의 자기 특허군별 라이센싱 예측 정보, 상기 타겟 집합에 대응되는 자기 특허 집합에 대한 라이센싱 예측 정보, 적어도 하나 이상의 부분 타겟 집합에 대응되는 자기 특허별 라이센싱 예측 정보, 적어도 하나 이상의 부분 타겟 집합에 대응되는 적어도 하나 이상의 자기 특허군별 라이센싱 예측 정보 중 어느 하나 이상인 것이 바람직하다.

상기 라이센싱 예측 정보는 기 설정된 적어도 하나 이상의 라이센싱 예측 정보값, 적어도 하나 이상의 라이센싱 예측 분석 정보, 적어도 하나 이상의 라이센싱 예측 근거 정보 중 어느 하나 이상인 것이 바람직하다.

상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 타겟 특허로 입수하는 것인 것이거나, 상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 분할된 상기 부분 자기 특허 집합별로 입수하는 것인 것이거나, 상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 2 이상의 상기 자기 특허 집합별로 입수하는 것인 것이며, 상기 기 설정된 조건은 상기 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며, 상기 타겟 특허 집합의 입수가 분할된 상기 부분 자기 특허 집합별로 입수하는 것인 경우, 상기 (d) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 상기 부분 자기 특허 집합에 대응되는 부분 타겟 특허 집합별로 생성되는 것인 것이며, 상기 타겟 특허 집합의 입수가 2 이상의 상기 자기 특허 집합별로 입수하는 것인 경우, 상기 (I) 단계의 상기 자기 특허 집합의 입수는 적어도 2 이상의 자기 특허 집합의 입수인 것이며, 상기 (d) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 2 이상의 상기 자기 특허 집합에 대응되는 타겟 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 (I22) 단계의 상기 자기 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 자기 특허로 입수하는 것인 것이거나, 상기 (I22) 단계의 상기 자기 특허 집합의 입수는 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 것이거나, 상기 (I22) 단계의 상기 자기 특허 집합의 입수는 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 것이며, 상기 기 설정된 조건은 상기 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며, 상기 자기 특허 집합의 입수가 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 경우, 상기 (d) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 상기 부분 타겟 특허 집합에 대응되는 부분 자기 특허 집합별로 생성되는 것인 것이며, 상기 자기 특허 집합의 입수가 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 경우, 상기 (I) 단계의 상기 타겟 특허 집합의 입수는 적어도 2 이상의 타겟 특허 집합의 입수인 것이며, 상기 (d) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 2 이상의 상기 타겟 특허 집합에 대응되는 자기 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 자기 특허 집합을 구성하는 자기 특허 및 적어도 하나 이상의 분할 기준 또는 적어도 하나 이상의 선별 기준이 적용된 적어도 하나 이상의 부분 자기 특허 집합 중 어느 하나 이상은 기 설정된 랭킹을 가지는 것이며, 상기 랭킹은 상기 관련성 빈도, 상기 관련성 강도 및 상기 라이센싱 예측 모델값 중 어느 하나 이상을 사용하는 랭킹 생성 규칙에 따라서 생성되는 것인 것이 바람직하다.

상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 적어도 2 이상의 분할되거나 선별되는 타겟 특허 집합별로 생성되는 것인 것이거나, 상기 (K) 단계의 상기 라이센싱 예측 정보의 생성은 상기 사용자로부터 입수 받은 사용자 가중치 정보를 반영하여 생성되는 것인 것이며, 상기 타겟 특허 집합의 선별이나 분할은 사용자에 의해서 선별되거나 분할되는 방식 또는 상시 시스템의 기 설정된 선별 기준이나 분할 기준에 의해 분할되는 방식 중 어느 하나 이상이 적용되는 것인 것이며, 상기 기 설정된 선별 기준이나 분할 기준은 타겟 특허 집합을 구성하는 타겟 특허의 권리자명, 권리자 속성, 특허 기술 분류, 기 설정된 적어도 하나 이상의 평가값 중 어느 하나 이상인 것인 것이며, 상기 사용자 가중치 정보는 상기 타겟 특허 집합을 구성하는 타겟 특허 중 어느 하나 이상에 대하여 개별 타겟 특허별로 상기 사용자가 설정하는 타겟 특허별 가중치 정보, 자기 특허의 개별 속성에 설정하는 속성별 가중치 정보, 인용-피인용 관계에 대해 설정하는 인용-피인용 가중치 정보, 텍스트 마이닝 관계에 대해 설정하는 텍스트 마이닝 가중치 정보, 특허 분류상 유사 기술 특허 관계에 대해 설정하는 유사 기술 특허 관계 가중치 정보 중 어느 하나 이상인 것이 바람직하다.

상기 (J) 단계의 특허별 분쟁 예측 모델값의 입수는 입수된 1차 타겟 특허 집합에 대하여 기 설정된 집합 연산을 수행한 후에 생성되는 2차 타겟 특허 집합을 구성하는 2차 타겟 특허를 대상으로 실시되는 것이며, 상기 2차 타겟 특허 집합은 상기 1차 타겟 특허 집합을 구성하는 1차 타겟 특허에 대한 삭제, 상기 1차 타겟 특허 집합에 대한 한정 및 2차 타겟 특허 집합으로의 신규 특허 추가 중 어느 하나 이상이 실시되어 생성되는 것인 것이 바람직하다.

상기 특허별 라이센싱 예측 모델값은 적어도 하나 이상의 인용 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 특허 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 유발자 관점 분쟁 예측 요소 및 적어도 하나 이상의 다분쟁 기술군 관점 분쟁 예측 요소 중에서 선택되는 어느 하나 이상의 분쟁 예측 요소의 분쟁 예측 요소값을 사용하여 생성되는 것인 것이 바람직하다.

상기 분쟁 예측 모델값은 라이센싱 특허와 비라이센싱 특허에 대하여, 라이센싱 예측 요소값을 설명 변수값으로 하고, 상기 라이센싱 특허에 부여된 라이센싱 특허 부여값과 상기 라이센싱 특허 부여값과 다르게 부여되며 상기 비라이센싱 특허에 부여된 비라이센싱 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 생성되는 것인 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 라이센싱 예측 정보 처리하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램이 기록된 기록 매체를 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램을 제시한다.본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 입수하거나 생성하는 자기 특허 집합 생성부; 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 입수하거나 생성하는 타겟 특허 집합 생성부; 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 라이센싱 예측 모델값을 입수하는 분쟁 예측 모델값 입수부; 및 상기 특허별 라이센싱 예측 모델값을 활용하여 적어도 하나 이상의 라이센싱 예측 정보를 생성하는 라이센싱 예측 정보 생성부;를 포함하는 것을 특징으로 하는 특허 라이센싱 예측 정보 처리하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, (i) (i1) (i11) 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, (i12) 상기 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 보완 특허 집합을 입수하거나, (i2) (i21) 적어도 하나 이상의 특허를 포함하는 보완 특허 집합을 먼저 입수하고, (i22) 상기 보완 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하는 단계; (j) 상기 보완 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수하는 단계; 및 (k) 상기 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 리스크 헤징 예측 정보를 생성하는 단계;를 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 리스크 헤징 예측 정보 처리 방법을 제시한다.

상기 (i12) 단계에서 상기 보완 특허 집합은 상기 타겟 특허 집합을 구성하는 타겟 특허의 최선일을 기준으로 하여 선출원인 것이거나, 상기 (i22) 단계에서 상기 타겟 특허 집합은 상기 타겟 특허 집합을 구성하는 보완 특허의 최선일을 기준으로 하여 후출원인 것인 것이 바람직하다.

상기 타겟 특허 집합은 적어도 하나 이상의 특허를 포함하는 자기 특허 집합과 기 설정된 관련성을 가지는 특허 집합이거나, 상기 자기 특허 집합과 기 설정된 관련성을 가지는 특허 집합의 부분 특허 집합이거나,기 설정된 상기 분쟁 예측 모델값 이상을 가지는 특허들로 구성되는 특허 집합이거나, 기 설정된 상기 분쟁 예측 모델값 이상을 가지는 특허들로 구성되는 특허 집합의 부분 특허 집합이거나, 상기 자기 특허 집합과의 관계에서 기 설정된 분쟁 예측 정보값 이상을 가지는 특허들로 구성되는 특허 집합이거나, 상기 자기 특허 집합과의 관계에서 기 설정된 분쟁 예측 정보값 이상을 가지는 특허들로 구성되는 특허 집합의 부분 특허 집합이거나 상기 자기 특허 집합과의 관계에서 기 설정된 분쟁 예측 정보값 이상을 가지는 특허 집합이거나, 상기 자기 특허 집합과의 관계에서 기 설정된 분쟁 예측 정보값 이상을 가지는 특허 집합의 부분 특허 집합인 것인 것이 바람직하다.

상기 타겟 특허와 상기 보완 특허는 기 설정된 관련성을 가지는 특허들로 이루어지는 관련 특허 관계인 것이며, 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이며, 상기 보완 특허 집합을 구성하는 보완 특허들은 2 이상의 타겟 특허들과 기 설정된 관련성을 가질 수 있는 것인 것이며, 상기 관련성은 계량화 될 수 있는 것이며, 상기 계량화는 관련성 빈도 및 관련성 강도 중 어느 하나 이상을 포함하여 구성되는 것인 것이 바람직하다.

상기 관련성 빈도는 상기 보완 특허에 대응되는 기 설정된 관련성을 가지는 타겟 특허의 개수인 것이며, 상기 관련성 강도는 인용-피인용 특허 관계 정보, 유사 특허군 관계 정보 및 유사 기술 특허 관계 정보 중 어느 하나 이상을 사용하여 생성되는 것인 것이 바람직하다.

상기 인용-피인용 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 인용-피인용 깊이 정보 및 인용-피인용 종류 정보 중 어느 하나 이상을 사용하여 생성되는 것을 포함하는 것이거나 상기 유사 특허군 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 타겟 특허와 상기 보완 특허의 유사도 정보를 사용하여 생성되는 것인 것이거나, 상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 타겟 특허와 상기 보완 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것이며, 상기 유사도 정보는 상기 타겟 특허와 상기 보완 특허에서 추출되는 추출 키워드, 상기 타겟 특허와 상기 보완 특허의 레퍼런스 정보에서 생성되는 인용-피인용 정보, 상기 타겟 특허와 상기 보완 특허에서 추출되는 적어도 한 종류 이상의 특허 분류 및 상기 특허 분류가 속하는 특허 분류 체계 상의 상기 특허 분류의 적어도 한 단계 이상의 상위 특허 분류 중 어느 하나 이상의 활용을 포함하여 생성되는 것인 것이며, 상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 타겟 특허와 상기 보완 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것인 것이 바람직하다.

상기 생성되는 리스크 헤징 예측 정보는 상기 보완 집합에 대응되는 타겟 특허별 리스크 헤징 예측 정보, 상기 보완 집합에 대응되는 적어도 하나 이상의 타겟 특허군별 리스크 헤징 예측 정보, 상기 보완 집합에 대응되는 타겟 특허 집합에 대한 리스크 헤징 예측 정보, 적어도 하나 이상의 부분 보완 집합에 대응되는 타겟 특허별 리스크 헤징 예측 정보, 적어도 하나 이상의 부분 보완 집합에 대응되는 적어도 하나 이상의 타겟 특허군별 리스크 헤징 예측 정보 중 어느 하나 이상인 것이 바람직하다.

상기 리스크 헤징 예측 정보는 기 설정된 적어도 하나 이상의 리스크 헤징 예측 정보값, 적어도 하나 이상의 라이센싱 예측 분석 정보, 적어도 하나 이상의 라이센싱 예측 근거 정보 중 어느 하나 이상인 것이 바람직하다.

상기 (i12) 단계의 상기 보완 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 보완 특허로 입수하는 것인 것이거나, 상기 (i12) 단계의 상기 보완 특허 집합의 입수는 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 것이거나, 상기 (i12) 단계의 상기 보완 특허 집합의 입수는 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 것이며, 상기 기 설정된 조건은 상기 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며, 상기 보완 특허 집합의 입수가 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 경우, 상기 (d) 단계의 상기 리스크 헤징 예측 정보를 생성하는 것은 상기 부분 타겟 특허 집합에 대응되는 부분 보완 특허 집합별로 생성되는 것인 것이며, 상기 보완 특허 집합의 입수가 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 경우, 상기 (i) 단계의 상기 타겟 특허 집합의 입수는 적어도 2 이상의 타겟 특허 집합의 입수인 것이며, 상기 (d) 단계의 상기 리스크 헤징 예측 정보를 생성하는 것은 2 이상의 상기 타겟 특허 집합에 대응되는 보완 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 보완 특허 집합의 입수에서 상기 기 설정된 조건은 시스템 또는 사용자가 선택하거나 설정하는 상기 보완 특허가 충족해야 하는 적어도 하나 이상의 권리자 속성 조건을 충족하는 것인 것이며, 상기 권리자 속성 정보는 권리자 규모 정보, 권리자 기관 유형 정보 및 상기 사용자가 선택하거나 지정하는 적어도 하나 이상의 특수 관계 권리자 군에 포함되는지 여부 중 어느 하나 이상인 것을

상기 (i22) 단계의 상기 타겟 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 타겟 특허로 입수하는 것인 것이거나, 상기 (i22) 단계의 상기 타겟 특허 집합의 입수는 분할된 상기 부분 보완 특허 집합별로 입수하는 것인 것이거나, 상기 (i22) 단계의 상기 타겟 특허 집합의 입수는 2 이상의 상기 보완 특허 집합별로 입수하는 것인 것이며, 상기 기 설정된 조건은 상기 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며, 상기 타겟 특허 집합의 입수가 분할된 상기 부분 보완 특허 집합별로 입수하는 것인 경우, 상기 (d) 단계의 상기 리스크 헤징 예측 정보를 생성하는 것은 상기 부분 보완 특허 집합에 대응되는 부분 타겟 특허 집합별로 생성되는 것인 것이며, 상기 타겟 특허 집합의 입수가 2 이상의 상기 보완 특허 집합별로 입수하는 것인 경우, 상기 (i) 단계의 상기 보완 특허 집합의 입수는 적어도 2 이상의 보완 특허 집합의 입수인 것이며, 상기 (d) 단계의 상기 리스크 헤징 예측 정보를 생성하는 것은 2 이상의 상기 보완 특허 집합에 대응되는 타겟 특허 집합별로 생성되는 것인 것이 바람직하다.

상기 타겟 특허 집합을 구성하는 타겟 특허 및 적어도 하나 이상의 분할 기준 또는 적어도 하나 이상의 선별 기준이 적용된 적어도 하나 이상의 부분 타겟 특허 집합 중 어느 하나 이상은 기 설정된 랭킹을 가지는 것이며, 상기 랭킹은 상기 관련성 빈도, 상기 관련성 강도 및 상기 분쟁 예측 모델값 중 어느 하나 이상을 사용하는 랭킹 생성 규칙에 따라서 생성되는 것인 것이 바람직하다.

상기 (k) 단계의 상기 리스크 헤징 예측 정보를 생성하는 것은 적어도 2 이상의 분할되거나 선별되는 보완 특허 집합별로 생성되는 것인 것이거나, 상기 (k) 단계의 상기 리스크 헤징 예측 정보의 생성은 상기 사용자로부터 입수 받은 사용자 가중치 정보를 반영하여 생성되는 것인 것이며, 상기 보완 특허 집합의 선별이나 분할은 사용자에 의해서 선별되거나 분할되는 방식 또는 상시 시스템의 기 설정된 선별 기준이나 분할 기준에 의해 분할되는 방식 중 어느 하나 이상이 적용되는 것인 것이며, 상기 기 설정된 선별 기준이나 분할 기준은 보완 특허 집합을 구성하는 보완 특허의 권리자명, 권리자 속성, 특허 기술 분류, 기 설정된 적어도 하나 이상의 평가값 중 어느 하나 이상인 것인 것이며, 상기 사용자 가중치 정보는 상기 보완 특허 집합을 구성하는 보완 특허 중 어느 하나 이상에 대하여 개별 보완 특허별로 상기 사용자가 설정하는 보완 특허별 가중치 정보, 타겟 특허의 개별 속성에 설정하는 속성별 가중치 정보, 인용-피인용 관계에 대해 설정하는 인용-피인용 가중치 정보, 텍스트 마이닝 관계에 대해 설정하는 텍스트 마이닝 가중치 정보, 특허 분류상 유사 기술 특허 관계에 대해 설정하는 유사 기술 특허 관계 가중치 정보 중 어느 하나 이상인 것이 바람직하다.

상기 (j) 단계의 특허별 분쟁 예측 모델값의 입수는 입수된 1차 보완 특허 집합에 대하여 기 설정된 집합 연산을 수행한 후에 생성되는 2차 보완 특허 집합을 구성하는 2차 보완 특허를 대상으로 실시되는 것이며, 상기 2차 보완 특허 집합은 상기 1차 보완 특허 집합을 구성하는 1차 보완 특허에 대한 삭제, 상기 1차 보완 특허 집합에 대한 한정 및 2차 보완 특허 집합으로의 신규 특허 추가 중 어느 하나 이상이 실시되어 생성되는 것인 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기 중 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 리스크 헤징 예측 정보를 처리하는 특허 정보 시스템을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 상기 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램을 제시한다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 입수하거나 생성하는 타겟 특허 집합 생성부; 적어도 하나 이상의 특허를 포함하는 보완 특허 집합을 입수하거나 생성하는 보완 특허 집합 생성부; 상기 보완 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수하는 분쟁 예측 모델값 입수부; 및 상기 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 리스크 헤징 예측 정보를 생성하는 리스크 헤징 예측 정보 생성부;를 포함하는 것을 특징으로 하는 특허 리스크 헤징 예측 정보를 처리하는 특허 정보 시스템을 제시한다.

상기 타겟 특허 집합을 구성하는 타겟 특허와 상기 보완 특허 집합을 구성하는 보완 특허 간에서 기 설정된 관련성을 계산하는 다중 관계성 처리 모듈;를 더 포함하며 상기 다중 관계성 처리 모듈이 계산하는 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이 바람직하다.

본 발명을 실시하면 다음과 같은 효과가 있다.

첫째, 시스템적으로 신뢰성 있고 타당성 높은 특허 분쟁 예측 모델을 생성할 수 있다.

둘째, 시스템적으로 신뢰성 있고 타당성 높은 특허 분쟁 예측 정보를 생성할 수 있다.

셋째, 시스템적으로 신뢰성 있고 타당성 높은 특허 라이센싱 예측 정보를 생성할 수 있다.

넷째, 시스템적으로 신뢰성 있고 타당성 높은 특허 리스크 헤징 정보를 생성할 수 있다.

도 1은 본 발명의 특허 정보 시스템의 사용 환경에 관한 일 실시예적 도면이다.
도 2는 본 발명의 특허 정보 시스템의 일 실시예적 구성에 관한 도면이다.
도 3은 본 발명의 특허 정보 시스템의 데이터부의 일 실시예적 구성에 관한 도면이다.
도 4는 본 발명의 데이터 가공부의 일 실시예적 구성에 관한 도면이다.
도 5는 본 발명의 특허 정보 서비스 지원부의 일 실시예적 구성에 관한 도면이다.
도 6은 본 발명의 특허 분석 정보 생성부의 일 실시예적 구성에 관한 도면이다.
도 7은 본 발명의 옵션 선택부의 일 실시예적 구성에 관한 도면이다.
도 8은 본 발명의 핵심 키워드 DB 의 일 실시예적 구성에 관한 도면이다.
도 9는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 일 실시예적 구성에 관한 도면이다.
도 10은 본 발명의 분쟁 예측 요소별 분쟁 예측 요소값 생성 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 11은 본 발명의 인용 특허 집합의 속성을 설명하기 위한 개념도이다.
도 12은 본 발명의 인용 특허 집합의 속성 중 전방 인용 특허 집합을 설명하기 위한 개념도이다.
도 13은 본 발명의 인용 특허 집합의 속성 중 후방 인용 특허 집합을 설명하기 위한 개념도이다.
도 14는 본 발명의 인용 특허 집합의 속성 중 전방 자기 인용 특허 집합과 후방 자기 인용 특허 집합을 설명하기 위한 개념도이다.
도 15는 본 발명의 인용 특허 집합의 속성 중 인용 발생 입수 특허 집합을 설명하기 위한 개념도이다.
도 16은 입수 특허 집합에 대한 인용 특허 집합으로서의 전방 인용 특허 집합과 후방 인용 특허 집합을 설명하는 개념도이다.
도 17은 입수 특허 집합에 대한 인용 특허 집합으로서의 전방 자기 인용 특허 집합과 후방 자기 인용 특허 집합을 설명하는 개념도이다.
도 18은 입수 특허 집합에 대한 인용 특허 집합으로서의 인용 발생 입수 특허 집합을 설명하는 개념도이다.
도 19는 조건을 가하여 한정된 입수 특허 집합에 대한 인용 특허 집합으로서의 전방 인용 특허 집합과 후방 인용 특허 집합을 설명하는 개념도이다. 전방 인용 특허 집합과 후방 인용 특허 집합도 입수 특허 집합에 한정을 가함에 따라 한정을 가하지 않은 입수 특허 집합에 대한 전방 인용 특허 집합과 후방 인용 특허 집합의 부분 집합이 됨을 보여 준다. 입수 특허 집합에 조건을 가하게 되면, 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합 모두가 한정을 가하지 않은 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합의 부분 집합이 된다.
도 20은 입수 특허 집합에 대한 인용 특허 집합으로서의 전방 인용 특허 집합과 후방 인용 특허 집합에 조건을 가하여 한정된 전방 인용 특허 집합과 한정된 후방 인용 특허 집합을 설명하는 개념도이다. 한정된 전방 인용 특허 집합이나 한정된 후방 인용 특허 집합과 마찬가지로 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합도 한정을 가하는 경우, 한정을 가하지 않은 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합의 부분 집합이 된다.
도 21은 본 발명의 제1종 잠재 인용 특허를 설명하기 위한 일 실시예적 개념도이다.
도 22는 본 발명의 제2종 잠재 인용 특허를 설명하기 위한 일 실시예적 개념도이다.
도 23은 본 발명의 제1종 사슬 인용 특허를 설명하기 위한 일 실시예적 개념도이다.
도 24은 본 발명의 제2종 사슬 인용 특허를 설명하기 위한 일 실시예적 개념도이다.
도 25는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 인용 관점의 분쟁 예측 요소값 생성 방법에 대한 일 실시예적 구성에 관한 도면이다.
도 26은 본 발명의 특허 분쟁 예측 정보 생성 시스템의 분쟁 예측 모델을 생성 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 27은 Gradient Boosting algorithm 알고리즘에 대한 요약을 설명하는 도면이다.
도 28은 Friedman(2002)이 새로이 stochastic gradient boosting algorithm을 제안한 알고리즘에 대한 요약을 설명하는 도면이다.
도 29는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 분쟁 예측 모델 생성 과정에 관한 일 실시예적 개념을 설명하는 도면이다.
도 30은 과적합 개념을 설명하기 위한 보조 도면이다.
도 31은 본 발명의 특허 분쟁 예측 정보 생성 시스템의 분쟁 예측 모델 생성 엔진이 부스팅 알고리즘을 통하여 분쟁 예측 모델을 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 32는 부스팅 알고리즘이 생성하는 스텀프(stump)의 예시에 관한 도면이다.
도 33은 5-fold cross validation 기법을 설명하기 위한 개념도이다.
도 34는 범주형 반응 변수에 대한 스텀프의 예시에 관한 도면이다.
도 35는 연속형 반응 변수에 적용되는 회귀 모델에 대한 스텀프의 예시에 관한 도면이다.
도 36은 본 발명의 특허 분쟁 예측 정보 생성 시스템이 분쟁 예측 모델값 생성하고 저장하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 37은 2 이상의 자기 특허가 2 이상의 타겟 특허와 각각 관계성을 가질 때, 각 관계마다 관계성 정보가 대응될 수 있음을 보여 주는 개념도이다.
도 38은 하나의 자기 특허가, 적어도 하나 이상의 타겟 특허와 기 설정된 관계성을 가질 때, 각 관계성에는 기 설정된 가중치가 부여될 수 있음을 보여 주는 개념도이다.
도 39는 본 발명의 특허 분쟁 예측 정보 생성 시스템이 분쟁 예측 정보를 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 40은 본 발명의 특허 분쟁 예측 정보 생성 시스템이 타겟 특허별 가중치 정보를 생성하고, 가중치 정보를 고려한 분쟁 예측 정보를 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 41은 본 발명의 특허 분쟁 예측 정보 생성 시스템이 생성하는 개별적인 분쟁 예측 정보의 예시적 종류 및 일 실시예적 분쟁 예측 정보 생성 순서를 보여 주는 도면이다.
도 42는 본 발명의 특허 분쟁 예측 정보 생성 시스템이 분할된 자기 특허 집합에 대응되는 타겟 특허 집합을 기준으로 한 분쟁 예측 정보 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 43은 본 발명의 특허 분쟁 예측 정보 생성 시스템이 분할된 타겟 특허 집합을 기준으로 한 분쟁 예측 정보 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 44는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 분쟁 예측 정보 분석 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 45는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 등급 부여 모델에 따른 등급 정보 생성 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 46은 본 발명의 특허 분쟁 예측 정보 생성 시스템의 신규 분쟁 파급 예측 정보 생성 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 47은 본 발명의 특허 분쟁 예측 정보 생성 시스템의 분쟁 정보 알람(alarm) 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 48은 본 발명의 특허 분쟁 예측 정보 생성 시스템의 리스크 헤징 예측 정보를 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 49는 본 발명의 특허 분쟁 예측 정보 생성 시스템의 크로스 라이센싱 예측 정보를 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.
도 50은 본 발명의 특허 라이센싱 예측 정보 생성 시스템의 일 실시예적 구성에 관한 도면이다.
도 51은 본 발명의 특허 라이센싱 예측 정보 생성 시스템이 라이센싱 예측 정보를 생성하는 방법에 관한 일 실시예적 구성에 관한 도면이다.

이하, 도면을 참조하면서, 본 발명 사상을 상세하게 설명한다.

본 발명의 특허 정보 시스템(10000)은 도 1에서 예시되어 있는 바와 같이, 유무선 네트워크(200)를 통하여 사용자 컴퓨터(100)에게 정보 서비스를 제공한다. 상기 특허 정보 시스템(10000)은 적어도 하나 이상의 연계 시스템(300)과 유무선 네트워크(200)로 연결되어 있을 수 있는데, 상기 연계 시스템(300)의 예는 특허 raw data를 제공하는 각국 특허청 또는 raw data 공급자의 시스템, 기업 정보 제공자의 시스템 등이 그 예가 될 수 있으며, 본 발명의 특허 정보 시스템(10000)의 서비스를 연계하여 제공하는 적어도 하나 이상의 시스템이 그 예가 될 수 있으며, 본 설명에 한정하지 않는다.

상기 특허 정보 시스템(10000)은 도 2에서 예시되어 있는 바와 같이, 크게 데이터부(1000) 및 데이터 가공부(2000), 검색 처리부(3100)와 회원용 관리부(3200)를 포함하는 특허 정보 서비스 지원부(3000), 특허 분석 정보 생성부(4000), 특허 분쟁 예측 시스템(5000), 특허 라이센싱 예측 시스템(6000) 또는 목적 특화 시스템부(20000) 등을 포함하고 있다.

상기 데이터부(1000)는 특허 데이터부(1100), 비특허 데이터부(1200), 핵심 키워드 DB(1300), 분류 메타데이터 DB(1400), 사용자 데이터부(1700), 기타 DB(1800), 목적 특화 데이터부(1900) 등 중 어느 하나 이상을 포함한다. 상기 특허 데이터부(1100)는 특허 명세서 파일부(1110)와 특허 DB(1120), 특허 분류 DB(1130), 기타 특허 데이터 DB(1140), 기타 분류 DB부 등을 포함하고 있다.

상기 특허 DB(1120)는 모든 특허에 대한 서지 사항과 명세서 본문, 도면 등을 필드별로 관리하며, 상기 명세서 본문을 구성하는 각종 필드(제목, 요약, 선행 기술, 특허 청구 범위, 발명의 상세한 설명 등)에서 추출한 핵심 키워드를 포함하고 있다. 한편, 상기 특허들은 상기 특허들에 대한 선행 기술 문건으로 인용 정보를 더 포함하고 있을 수 있다. 미국 특허 data를 예로 들면, 상기 인용 정보는 Reference에 포함된 정보들로, 미국 특허 문건 번호, 외국 특허 문건 번호, 비특허 문건에 대한 표시자 등이 포함되어 있다. 한편, 특허청 심사관이나 관련자에 의한 선행 기술 조사 정보, 심사관 의견 제출 시 참증 정보 등도 광의의 인용 정보가 된다. 특정 문건에 전방 인용 정보가 있는 경우, 상기 전방 인용 정보에 포함된 문건의 입장에서 보면 상기 특정 문건은 후방 인용 문건이 된다. 특정 문건을 기준으로 전방 인용 정보에 포함된 문건은 부모(parent) 문건이 되며, 상기 부모 문건을 기준으로 보면 상기 특정 문건은 자식(child) 문건이 된다. 이러한 child-parent 관계에 있는 정보를 DB로 처리하는 것은 당업자에게는 자명한 것으로 상세한 설명은 생략한다.

특허 문건의 서지 사항에는 발행 국가 정보, 각종 일자 정보, 각종 번호 정보, 적어도 하나 이상의 권리자 정보, 적어도 하나 이상의 발명자 정보, 적어도 하나 이상의 특허 분류 정보, 적어도 하나 이상의 우선권 정보 등이 포함되어 있다. 일자에는 출원일, 공개일, 등록일 및 기타 일자들이 있다. 각종 번호 정보에는 출원번호, 공개번호, 등록번호, 원출원 번호, 우선권 주장 번호 등이 있다. 권리자 정보는 출원인, 양수인, 특허권자 등이 있으며, 권리자의 변동이 있고, 변동이 관리되는 경우, 양도인과 양수인에 대한 정보 및 최종 권리자 정보가 있을 수 있다. 우선권 정보에는 우선권 주장 번호, 주장일자, 국가 등의 정보가 포함되어 있다. 한편, 분할출원이나 일부 계속 출원, 계속 출원 등이 있는 경우, 원출원 번호, 원출원일자 등의 정보가 부가되어 있다. 또한, 대표도, 제목, 요약, 색인어 등도 서지 사항에 포함되기도 한다. 한편, 가공된 서지 사항으로는 국내 패밀리 정보(분할출원, 변경출원이나 일부계속출원, 계속출원 관계에 있는 특허 출원)이나, 해외 패밀리 정보(조약 우선권 관계로 연관될 수 있는 출원, 국제출원 등)이 있을 수 있다. 한편, 자연어 처리 등을 통해서 특허 명세서 본문의 텍스트를 본문을 구성하는 각 필드별 또는 필드 통합별로 기 설정된 키워드 추출 방식으로 추출한 핵심 키워드 정보가 더 있을 수 있다.

특허 분류 정보는 공통적인 IPC 이외에도 USPC, FT, FI, ECLA 등과 같이 각 국가별로 자국만의 특별한 특허 분류가 있을 수 있다. 이와 같이 특허 분류는 계층 구조를 가진다. 본 발명의 특허 분류는 특허 분류는 IPC, USPC, FT, FI, ECLA를 포함한다. 인덱스(index)란, 캐치워드(catchword)라고 불리기도 하는 것으로, 단어, 구 또는 절에 적어도 하나 이상의 특허 분류를 대응해 놓은 체계를 말한다. 상기 인덱스 중 대표적인 것으로 IPC를 처리해 놓은 catchword가 있으며, 미국 특허청이 발행하는 index to USPC가 있다. 상기 인덱스도 특허 분류처럼 계층 구조를 가지는 경우가 많다. 상기 인덱스에는 제품명/부품명/요소기술 등에 해당하는 키워드가 내재되어 있는 경우가 많다. 상기 인덱스는 특허 분류를 용이하게 찾아 보기 쉽게 해 놓은 것으로 볼 수 있다. WIPO가 제공하는 IPC에 대한 캐치워드에 대한 정보는 2011년 3월 현재 http://www.wipo.int/ipc/itos4ipc/ITSupport_and_download_area/20100101/MasterFiles/에 있는 ipcr_catchwordindex_20100101.zip 파일로 입수 가능하다. 상기 파일에는 ABACUSES에 대하여 G06C 1/00이 대응되어 있음을 볼 수 있다. 이때, ABACUSES를 대하여 G06C 1/00에 대응되는 인덱스라 명명한다. 이에 따라, G06C 1/00은 Abacuses로 역맵핑 할 수 있다. 한편, 상기 파일의 내용 중 인덱스 ABARADING에서 알 수 있듯이, 상기 캐치워드 체계는 적어도 1단계 이상의 계층 구조를 가지고 있음을 알 수 있다. ABARADING은 2단계 계층임을 보여 준다. USPTO가 USPC에 대한 인덱스로 이들에 대한 정보는 2010년 3월 현재 http://www.uspto.gov/web/patents/classification/uspcindex/indextouspc.htm에서 확인할 수 있다. 상리 링크의 내용 중에서 인덱스 Abrading은 3단계의 계층으로 분류되어 있음을 알 수 있다. 인덱스 Abrading은 USPC 451/38에 대응되고 있음을 알 수 있으며, Abrading의 하위 인덱스에 Class 451 이외의 다른 Class의 특허 분류도 존재함을 알 수 있다. 상기 특허 분류와 관련된 일체의 사항은 특허 분류 DB(1130)에 저장된다.

핵심 키워드 DB(1300)는 추출된 핵심 키워드에 관한 정보를 저장하고 있다. 특허 문건에서 어떻게 핵심 키워드(공기쌍을 포함한다)를 추출하는지에 대해서는 후술한다. 핵심 키워드 DB(1300)에는 핵심 키워드별 메타 데이터 DB가 있는데, 이에는 핵심 키워드별 메타 정보가 저장된다. 핵심 키워드가 추출될 때는 키워드별로 어떤 특허 문건에서 추출되었는지에 대한 특허 문건 번호와 추출된 필드 및 상기 특정 특허 문건 번호의 특정 필드에서의 빈도(frequency)가 동시에 계산된다. 상기 특허 문건 번호의 서지 사항에는 각종 날짜 정보, 출원인 정보, 발명자 정보, 특허 분류 정보, reference 정보 등과 같은 각종 서지 사항 정보가 대응되게 된다. 따라서, 특정한 핵심 키워드에 대해서는 특허 문건 번호, 서지 사항, 필드 및 빈도가 대응될 수 있으며, 이러한 정보는 핵심 키워드 메타 데이터 DB(1310)의 기본적인 내용이 된다. 한편, 상기와 같은 핵심 키워드 메타 데이터 DB(1310)의 기본적인 내용이 있는 경우, 각 키워드별 증감율 데이터, 연관 분석(장바구니 분석이 한 예가 된다.) 결과 데이터, 및 각 핵심 키워드별 특허 분류 간의 맵핑 확률 데이터 등이 생성될 수 있으며, 이러한 데이터들도 핵심 키워드 메타 데이터 DB(1310)의 내용이 될 수 있다. 상기 핵심 키워드별 특허 분류 간의 맵핑 확률 데이터는 핵심 키워드 Ki가 있을 때, 이 Ki가 적어도 하나 이상의 특허 분류 Cj에 대응되는 확률, P(Cj(Ki))이 상기 맵핑 확률이 된다. Ki가 특허 문건 P1, P2, P3 및 P4에서 나왔고, P1, P2, P3는 C1의 분류가 되고, P4는 C2의 분류가 되는 경우, Ki가 C1에 대응될 확률은 3/4가 되고, C2에 대응될 확률은 1/4이 된다. 즉, 상기 P(Cj(Ki)) =(Ki가 추출된 특허 문건 중에서 Cj 분류를 가지는 특허 문건의 수)}/(Ki가 추출된 특허 문건의 수)가 된다. 한편, 상기 P(Cj(Ki))가 있는 경우, Cj를 대표하는 Ki들의 집합을 추출할 수 있을 것이다. 이때, KI의 Cj에 대한 P(Cj(Ki)) 또는 기설정된 메트릭(metric)이 높은 Ki들이 이러한 집합을 형성할 수 있다.

특허 분류 DB(1130)를 가공한 것에는 분류 메타 데이터 DB가 있는데, 이에는 특허 분류별 메타 정보가 저장된다. 특허 문건에는 적어도 한 종류 이상 및 적어도 하나 이상의 특허 분류가 대응되어 있으며, 상기 특허 문건 번호의 서지 사항에는 각종 날짜 정보, 출원인 정보, 발명자 정보, 특허 분류 정보, reference 정보 등과 같은 각종 서지 사항 정보가 대응되게 된다. 따라서, 특정한 특허 분류에 대해서는 특허 문건 번호, 서지 사항이 대응될 수 있으며, 이러한 정보는 특허 분류 메타 데이터 DB의 기본적인 내용이 된다. 한편, 상기와 같은 특허 분류 메타 데이터 DB의 기본적인 내용이 있는 경우, 각 특허 분류별 증감율 데이터, 연관 분석(장바구니 분석이 한 예가 된다.) 결과 데이터, 및 각 특허 분류별 특허 분류 간의 맵핑 확률 데이터, 점유율이나 활동율 등과 같은 특허 지표(일종의 메트릭)별로 특허 지표값이 높은 출원인 데이터나 발명자 데이터 등이 생성될 수 있으며, 이러한 데이터들도 특허 분류 메타 데이터 DB의 내용이 될 수 있다.

상기 사용자 데이터부(1700)는 상기 특허 정보 시스템(10000)을 사용하는 사용자의 일체의 관리 정보 및 사용자가 생성하거나 관리하는 정보가 저장된다. 한편, 목적 특화 데이터부(1900)에는 출원인 대표명화 정보 등을 포함하는 출원인 DB(1910), 각종 규칙(특허 지표나 분석 명령어 구문 등도 규칙이 된다.) 정보가 저장되는 규칙 데이터부(1920), 자연어 처리를 위한 사전(번역을 위한 대역어 사전, 시소러스 사전 등이 그 예가 된다.), 기타 사전(과학기술용어 사전, 논문에서 추출된 색인어 사전 등이 그 예가 된다.) 등과 같은 정보는 언어 데이터부(1930)에 저장되며, 표준 특허풀에 속하는 특허 등은 표준 특허풀 데이터부(1940)에 저장된다. 기타 상기 목적 특화 데이터부(1900)에는 특화된 목적에 부합하는 각종 데이터가 저장된다.

상기 데이터 가공부(2000)는 도 4에서 예시되어 있는 바와 같이, 특허 문건에서 적어도 하나 이상의 핵심 키워드를 추출하는 핵심 키워드 생성부(2100), 특허 분류에 대한 각종 메타 데이터를 생성하는 분류 메타 데이터 생성부(2200), 목적 특화된 데이터를 생성하는 목적 특화 데이터 생성부(2300), 주어진 특허 문건과 내용적으로 유사한 특허 집합을 생성하는 유사 특허 집합 생성부(2400), 연관 분석 결과가 있는 경우, 연관한 노드(node)들 및 상기 연관된 노드들 간의 관계 정보(에지(edge 정보))를 생성하는 네트워크 데이터 생성부(2500) 등이 있을 수 있다.

도 5에서 예시되는 특허 정보 서비스 지원부(3000)는 검색 처리를 수행하기 위한 검색 처리부(3100), 회원 관리와 관련된 회원용 관리부(3200), 상기 특허 정보 시스템(10000)이 제공하는 서비스나 데이터 등을 웹서비스나 SOA 방식 등으로 적어도 하나 이상의 사용자 컴퓨터(100)(본 발명의 사용자 컴퓨터(100)는 PC 등과 같은 개인용 컴퓨터나 휴대용 단말기 뿐만 아니라, 서버나 시스템 등과 같은 것도 본 발명의 특허 정보 시스템(10000)을 사용하는 한 본 발명의 사용자 컴퓨터(100)가 된다.) 플랫폼 서비스를 제공하기 위한 플랫폼 서비스 제공부, 전자 상거래 서비스를 제공하는 전자 상거래 서비스 제공부, 커뮤니티 서비스를 제공하는 커뮤니티 서비스 제공부(8500), 과금 서비스를 제공하는 과금 처리부(8600), 특허 문건 단위로 댓글을 달수 있도록 하고, 상기 댓글을 상기 특허 문건의 발명자나 출원인에게 전송하거나, 또는 상기 댓글을 상기 특허 문건을 오픈하는 사용자 컴퓨터(100)에 제공하는 기능을 수행하는 것을 포함하여 일체의 댓글 서비스를 처리하는 댓글 처리부(8700)를 포함한다. 상기 검색 처리부(3100)는 검색 엔진부(3110) 및 DB 쿼리 처리부(3120) 중 어느 하나 이상을 포함할 수 있다. 통상적인 DBMS는 SQL 검색 등을 지원하므로, 상기 DBMS는 상기 DB 쿼리 처리부(3120)의 기능을 수행할 수 있다.

도 6은 본 발명의 특허 분석 정보 생성부(4000)에 대한 일 실시예적 도면이다. 상기 특허 분석 정보 생성부(4000)는 입수된 임의의 적어도 하나 이상의 특허 문건 집합 또는 분석 대상 데이터 집합을 입수하고, 입수된 특허 문건 집합 또는 분석 대상 데이터 집합에 대한 기설정된 적어도 하나 이상의 분석 결과를 생성하는 기능을 수행한다. 특허 분석을 위한 특허 문건 집합 또는 분석 대상 데이터 집합의 입수는 분석 대상 입수부(4100)가 처리한다. 분석 결과의 생성은 특허 분석 처리부(4200)가 수행한다. 상기 특허 분석 처리부(4200)는 분석 지표 DB(4210)에 저장되어 있는 적어도 하나 이상의 분석 지표에 대한 분석 지표값을 생성하는 명령어를 입수하거나, 분석 명령 구문 DB(4220)에 저장되어 있는 분석 명령 구문을 입수하고, 이를 입수한 특허 문건 집합 또는 분석 대상 데이터 집합에 적용하여 분석 결과를 생성한다. 한편, 특허 분석에서 각종 옵션이 부가될 수 있는데, 이러한 옵션은 분석 옵션 처!!리부(4300)가 수행한다. 분석 옵션 처!!리부(4300)에는 분석 대상이 되는 특허 문건 집합이나 분석 대상 데이터를 한정하는 데이터 한정 옵션 처리부(4310), 분석 결과 중에 어떤 사항만을 표시할 것인지를 처리하는 표시 옵션 처!!리부(4320), 및 기타 특허 분석을 위한 각종 옵션을 처리하는 기타 옵션 처리부(4330) 및 사용자 컴퓨터(100)로부터 각종 옵션에 대한 선택 정보를 입수하고, 입수된 옵션 선택 정보를 특허 분석 처리부(4200)에 전달하는 옵션 선택부(4340)가 있다. 사용자에 전송되는 분석 결과는 분석 결과 리포팅부(4400)에서 생성된다. 리포팅의 형태는 표, 차트, 다이어그램(네트워크 다이어그램이 그 한 예가 된다.), 또는 기설정된 형식(예를 들면 pdf, 웹 페이지 등)의 문서 중 어느 하나 이상이 될 수 있다. 이들 각각의 생성은 표 생성부(4410), 차트 생성부(4420), 다이어그램 생성부(4430), 리포트 생성부(4440)가 담당한다. 집합 단위 인용 분석(4500)는 적어도 2 이상의 특허 문건 집합을 대상으로 기설정된 적어도 하나 이상의 분석 지표나 분석 명령 구문을 적용하여, 특허 분석 결과를 생성해 낸다. 이에 대해서는 후술한다.

도 7에서는 본 발명의 옵션 선택부(4340)에 대한 상세한 구성예를 보여 주고 있다. 옵션 선택부(4340)는 출원일, 공개일, 등록일, 우선일, 최선일 등과 같은 특허 문건의 기간과 관련된 한정을 수행하는 기간 한정부(4340-1), 권리자의 주소 중 국가 정보에 기초하여 국가를 한정하는 국가 한정부(4340-2), 적어도 하나 이상의 출원인에 대한 한정을 처리하는 출원인 한정부(4340-3), 적어도 하나 이상의 발명자에 대한 한정을 수행하는 발명자 한정부(4340-4), 적어도 하나 이상의 특허 분류의 종류별, 특허 분류의 깊이별, 및 특허 분류의 주특허 분류와 부특허분류별 중 어느 하나 이상에 대한 한정을 수행하는 특허 분류 한정부(4341-5), 특정 필드의 속성을 한정하는 필드 속성 한정부(4341-6), 개별 필드의 값에 대한 구체적 한정을 수행하는 개별 필드값 한정부(4341-7), 개별 특허의 구체적 속성에 대한 한정을 수행하는 개별 특허 속성값 한정부(2111-8), 및 기타 인용 깊이, 인용 종류(직접, 간접, 잠재, 사슬 등 중 어느 하나 이상), 및 인용 방향(전방, 후방)에 대한 한정 등과 같은 기타 한정을 수행하는 기타 한정부(4341-9) 등이 있다. 상기 필드에는 서지 사항을 구성하는 필드가 포함되며, 출원인, 발명자, 특허 분류 등이 있을 수 있다. 예를 들어, 출원인 중 기업, 기관, 대학, 개인 중에 대한 한정, 기업이라도 대기업과 중소기업 등과 같은 기업 규모에 기반한 한정이나, 발명자 중에서도 국내 발명자, 해외 발명자 등과 같은 발명자 주소에 기반한 한정 등이 그 예가 된다. 한편, 특허당 피인용 수가 기설정된 값 이상이 되는 출원인에 대한 한정, 최근 5년간 특허 출원 증가율이 25% 이상인 발명자에 대한 한정 등과 같은 것이 개별 필드값에 대한 한정이 된다. 그리고, 피인용수가 10회 이상인 특허, 특허 등급 평가에서 상위 10% 이내에 드는 특허, 또는 분쟁 발생 특허 등과 같은 개별 특허의 속성(피인용수, 특허 등급, 분쟁 발생 여부 등)에 대한 값을 기준으로 한 한정이 개별 특허 속성값 한정이 된다.

도 8은 본 발명의 핵심 키워드 DB(1300)의 일 실시예적 구성에 관한 도면이다. 핵심 키워드 DB(1300)에는 기술 키워드 DB(131), 제품 키워드 DB(132), 구문 키워드 DB(133) 및 핵심 키워드 메타 데이터 DB(1310)가 있다. 상기 핵심 키워드 DB(1300)는 각 특허 문건별로 추출한 핵심 키워드, 공기쌍 등에 관한 정보가 저장되어 있으며, 상기 제품 키워드 DB(132)에는 제품을 특징 짓는 각종 키워드나 공기쌍이, 구문 키워드 DB(133)에는 기술적 문제(예를 들면, 경량화, 금속 내 수소 함량 감소(to reduce the amount of hydrogen in metal에서 to 액션 + 액션 대상 + 대상의 소재 위치)를 표현하는 구문, 기술적 해결 방법을 표현하는 구문 등과 같이 특정한 속성을 가지는 구문을 표현하는 구문 키워드 집합에 대한 정보가 저장되어 있다. 한편, 상기 핵심 키워드 메타 데이터 DB(1310)에 대해서는 상기에서 설명한 바 이외에도, 키워드 간의 관계성(연관 분석의 결과로 키워드 간의 관계성 정보가 생성될 수 있다.) 정보가 저장되는 키워드 관계성 DB(1311), 특허 분류별로 그 특허 분류를 대표하는 키워드를 모아 놓은 특허 분류별 대표 키워드 DB(1312) 등이 포함되어 있을 수 있다.

도 9은 본 발명의 특허 분쟁 예측 정보 생성 시스템(5000)의 일 실시예적 구성을 보여 주는 도면이다.

상기 특허 분쟁 예측 정보 생성 시스템(5000)은 특허 분쟁 예측 정보를 생성하는 분쟁 예측 엔진(5100), 분쟁에 대한 각종 데이터를 저장하고 있는 분쟁 DB부(5200), 특허 분쟁에 대해서 시스템 및/또는 사용자의 관리 정보를 제어하는 분쟁 예측 관리부(5400), 분쟁 예측 모델을 생성하는 분쟁 예측 모델 엔진과 분쟁 예측 정보를 분석하는 분쟁 예측 정보 분석 엔진(5300)을 포함하고 있을 수 있다.

상기 분쟁 예측 엔진(5100)은 상기 사용자 또는 상기 특허 정보 시스템(10000) 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)이 생성하거나 관리하는 적어도 하나 이상의 특허로 구성된 자기 특허를 포함하는 자기 특허 집합을 생성하거나 특정하는 자기 특허 집합 생성부(5110), 상기 자기 특허 집합을 구성하는 자기 특허와 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허로 구성되는 타겟 특허 집합을 생성하거나, 상기 사용자가 생성하거나, 지정하는 타겟 특허로 구성되는 타겟 특허 집합을 입수하는 타겟 특허 집합 생성부(5120), 상기 특허별 분쟁 예측 모델값 생성부(5530)가 생성한 특허별 분쟁 예측 모델값을 입수하거나, 분쟁 예측 모델 생성부(5520)를 통하여 적어도 하나 이상의 지정된 특허의 분쟁 예측 모델값을 생성하도록 제어하여, 생성된 분쟁 예측 모델값을 입수하는 분쟁 예측 모델값 입수부(5130), 기 설정된 적어도 하나 이상의 분쟁 예측 정보를 생성하는 분쟁 예측 정보 생성부(5140)와 생성된 분쟁 예측 정보값을 제공하는 분쟁 예측 정보값 제공부(5150)를 포함하고 있다.

상기 분쟁 예측 모델 생성 엔진(5500)은 분쟁 예측 요소마다 기 설정된 분쟁 예측 요소값 생성 규칙에 따라 분쟁 예측 요소값을 생성하는 분쟁 예측 요소값 생성부(5510), 기 설정된 통계 알고리즘을 사용하여 적어도 하나 이상의 분쟁 예측 모델을 생성하는 분쟁 예측 모델 생성부(5520), 상기 분쟁 예측 모델로 특허별로 분쟁 예측 모델값을 생성하는 특허별 분쟁 예측 모델값 생성부(5530), 생성된 특허별 분쟁 예측 모델값을 제공하는 분쟁 예측 모델값 제공부(5540)를 포함하고 있을 수 있다.

한편, 상기 분쟁 예측 요소값 생성부(5510)는 생성되는 분쟁 예측 요소값의 속성에 따라, 인용 계열 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 인용 계열 분쟁 예측 요소값 생성부(5510), 제품이나 기술군 계열 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 제품/기술군 계열 분쟁 예측 요소값 생성부(5510), 권리자나 출원인, 발명자 등 주체 계열 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 주체 계열 분쟁 예측 요소값 생성부(5510), 사용자가 입력하거나 설정하는 적어도 하나 이상의 트롤(Patent Troll), 특허 기술 분류, 특허 집합, 경쟁사나 관계사, 표준 특허 등과 같은 기 설정된 속성을 가지는 특허군 등과 같이 사용자 계열 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성하는 사용자 입력 계열 분쟁 예측 요소값 생성부(5510)가 있다.

상기 분쟁 DB부(5200)에는 발생된 분쟁에 관한 정보를 저장하는 분쟁 발생 특허 DB(5210)가 있으며, 상기 분쟁 발생 DB부가 저장하는 정보에는 분쟁 고유 식별자 정보, 분쟁 처리 법원 정보, 적어도 하나 이상의 분쟁 대상 특허 정보(특허 번호, 및/또는 상기 특허 번호에 대응되는 서지 정보, 및/또는 명세서 정보, 및/또는 도면 정보, 및/또는 경과 정보 등 상기 특허 번호로 특정될 수 있는 일체의 특허 정보), 적어도 하나 이상의 원고 정보, 적어도 하나 이상의 피고 정보, 적어도 하나 이상의 소송 경과 정보, 소송 결과 정보, 소송 심급 정보 등이 저장되어 있을 수 있다. 한편, 상기 분쟁 DB부(5200)에는 분쟁 예측 요소 및 상기 분쟁 예측 요소별 분쟁 예측 요소값을 생성하는 규칙(SQL 명령문 등) 데이터를 분쟁 예측 요소 DB, 상기 분쟁 예측 모델을 저장하는 분쟁 예측 모델 DB, 특허별로 상기 분쟁 예측 요소값을 저장하는 분쟁 예측 요소값 DB(5220), 특허별로 상기 분쟁 예측 모델값을 저장하는 분쟁 예측 모델값 DB(5230)를 포함하고 있을 수 있다.

상기 분쟁 예측 관리부(5400)에는 특허 분쟁 관련된 데이터를 입수하고, 파싱(parsing) 등의 처리하는 분쟁 데이터 입수부(5410), 사용자가 입력하는 분쟁 관련 data 및 기타 사용자가 입력하는 특허 집합을 관리하는 사용자 입력 특허군 관리부 (5432), 분쟁 관련되어 상기 분쟁 예측 엔진(5100)이 생성하는 분쟁 정보 및, 특허 분쟁 예측과 관련하여 상기 사용자에게 상기 특허 분쟁 예측 정보 생성 시스템(5000)을 사용하도록 하며, 생성된 분쟁 예측 정보를 기 설정된 UI를 통하여 제공하는 분쟁 UI부(5431)를 포함하고 있을 수 있다. 상기 분쟁 예측 관리부(5400)는 상기 특허 분쟁 예측 정보 생성 시스템(5000)을 관리하는 분쟁 예측 시스템 관리부(5420)와 상기 특허 분쟁 예측 정보 생성 시스템(5000)을 사용하는 사용자를 관리하는 분쟁 예측 사용자 관리부(5430)를 더 포함하고 있을 수 있다. 상기 분쟁 예측 시스템 관리부(5420)는 기 설정된 분쟁 예측 정보의 생성을 위한 배치(batch) 처리를 수행하는 분쟁 예측 정보 배치 생성부(5421)를 더 포함하고 있을 수 있다. 상기 배치 처리는 기 설정된 권리자 단위, 기 설정된 특허 분류 단위, 상기 분쟁 예측 관리부(5400)가 관리하고 있는 사용자별 특허군 단위로 기 설정된 주기 또는 기 설정된 조건 성취(분쟁 예측 모델의 갱신 또는 분쟁 예측 요소값의 갱신, 신규 분쟁 데이터의 유입 등)에 따라 기 설정된 분쟁 예측 정보를 생성을 위한 처리를 말한다. 상기 분쟁 예측 사용자 관리부(5430)는 사용자가 입력하는 특허군을 관리하는 사용자 입력 특허군 관리부 (5432)를 더 포함하고 있을 수 있다.

상기 분쟁 예측 정보값 제공부(5150)는 특허 분쟁 정보나 특허 분쟁 예측 정보를 리포트 형식의 문서로 제공하기 위한 리포트를 생성하는 분쟁 정보 리포트 생성부(4440)를 포함하고 있으며, 상기 분쟁 정보 리포트 생성부(4440)가 생성하는 리포트는 분쟁 정보 입출력부를 통하여 사용자에게 전자 우편 등으로 메일링 또는 기 설정된 방식으로 리포팅할 수 있다.

상기 분쟁 예측 정보 분석 엔진(5300)은 주어진 특허 집합을 분할하는 특허 집합 분할부(5310), 특허 공격이 예상되는 특허군 정보를 생성하는 공격 예상 특허군 생성부, 특허 분쟁 리스크를 효과적으로 헤징하기 위한 정보를 생성하는 리스크 헤징 정보 생성부(5330)또는 크로스 라이센싱의 대상 후보 특허군을 발견하는 크로스 라이센싱 정보 생성부(5340), 또는 라이센싱 대상 정보를 생성하는 라이센싱 대상 정보 생성부를 포함하고 있을 수 있다.

먼저 도 10을 참조하면서, 분쟁 예측 모델의 생성을 설명한다. 상기 분쟁 예측 모델의 생성은 본 발명의 분쟁 예측 모델 생성 엔진(5500)이 수행한다. 상기 분쟁 예측 모델 생성 엔진(5500)은 분쟁 예측 요소별로 분쟁 예측 요소값 생성 규칙 정보를 입수(SL11)하고, 입력되는 상기 특허별 분쟁 예측 요소값을 생성(SL12)하고, 생성된 상기 특허별 분쟁 예측 요소값을 저장(SL13)한다. 상기 분쟁 예측 모델이 생성되기 위해서는 분쟁 예측 요소의 도출이 선행되어야 한다.

분쟁 예측 요소의 도출은 분쟁 특허에 대한 분석을 통해서 도출할 수 있다. 특허 분쟁이 일어난 특허(분쟁 대상 특허)들은 www.westlaw.com의 patent practitioner 등과 같은 온라인 사이트 등에서 유료 또는 무료로 입수할 수 있다. 이들 특허 분쟁 관련 데이터를 분석하면 분쟁이 일어난 특허들은 분쟁이 일어나지 않은 특허들과 다음과 같은 관점에서 구분되는 특징을 가진다. 상기 구분되는 특징에 기반하여 분쟁 예측 요소라는 변수 집합을 생성한다.

첫째, 분쟁 특허들은 인용 관계가 강하다. 분쟁 대상 특허들은 비분쟁 특허들보다 상대적으로 인용을 많이 받거나, 최근에 인용이 증가하는 등과 같은 경향이 있다. 특히, 분쟁 대상 특허와 소송 피고 간에는 강한 인용 관계가 존재하는 경우가 많다. 즉, 분쟁 대상 특허를 피고의 특허가 인용하는 관계가 성립하는 경우가 분쟁이 일어나지 않은 특허를 피고의 특허가 인용하는 관계가 성립하는 경우보다 상대적으로 더 많다. 이러한 인용 관계는 분쟁 대상 특허를 인용하는 후출원 특허들의 권리자(출원인) 정보 등과 같은 서지 사항을 입수하여, 입수된 서지 사항을 분석함으로써 알 수 있게 된다. 인용 관계가 분쟁 대상과 관련하여 중요한 역할을 하는 이유는 1) 특허들이 제품에 반영되는 경향이 강하고, 후출원 권리자가 자신의 제품의 기능(특히, 개선, 개량 기능)을 보호하기 위하여 그 기능과 관련된 특허를 출원하는 경우가 많으며, 2) 후출원 권리자의 특허권자가 선출원 권리자의 특허를 알고 있어 IDS 등으로 공개하거나, 선행 기술 조사, 특허청 심사관의 심사 과정에서 후출원 특허와 관련 있는 특허로 reference 등에 등재되는 경우가 많으며, 3) 선출원 권리자도 자신의 특허를 인용하는 후출원 권리자를 모니터링 하는 경우가 많으며, 4) 후출원 권리자로부터 많은 인용을 받는 선출원 권리자의 특허는 후출원 권리자의 제품에 반영되거나 강한 관련성을 가지는 경우가 많기 때문에(특히, 선출원 권리자의 특허의 청구항이 넓은 권리 범위를 가지는 경우에는 더욱 더 그러하다) 인용 관계는 분쟁과 상당히 강한 관련성을 가진다.

위와 같은 특허 분쟁과 인용과의 관계성에 따라, 다음과 같은 인용 관점 분쟁 예측 요소 후보군을 도출할 수 있다. 선출원 권리자의 개별 특허 관점에서, 개별 특허를 인용하는 후출원 특허를 대상으로 하여 하기 표 1과 같은 인용 관점 분쟁 예측 요소 후보군이 예시적으로 고려될 수 있다.

계열	계열 code	인용 관점 분쟁 예측 요소 후보군	비고
총개수	A1	총피인용수
최근 n년 개수	B1	최근 n년간 피인용수(n은 1개 이상이 될 수 있음, 이하 이 표에서는 동일하게 적용)
Self 개수	C1	자기 인용수, 최근 n년간 자기 인용수
Non-Self 개수	D1	비자기 인용수, 최근 n년간 비자기 피인용수
평균 개수	E1	청구항 당 A1~D1 모두, 피인용 특허수 당 피인용 권리자수, 피인용 특허수 당 피인용 특허 분류수, 피인용 특허수 당 피인용 권리자 종류수
속성치	F1	피인용 특허의 권리자를 기준으로 한 A1, B1, D1, E1 피인용 특허의 권리자 종류를 기준으로 한 A1, B1, D1, E1 피인용 특허의 권리자 종류별 비율을 기준으로 한 A1, B1, D1, E1 피인용 특허의 특허 분류를 기준으로 한 A1, B1, D1, E1
증감량 또는 증감율	G1	전기간 기준 A1~F1의 증감량 또는 증감율, 특정 기간 기준 A1~F1의 증감량 또는 증감율

Reference	H1	Reference수, Reference 중 특허수, Reference 중 특허 대비 논문수, Reference 특허 중 외국 특허수, Reference 중 국내 특허수/Reference 중 외국 특허수

상기 표 1에 대해서 설명한다. 권리자 종류는 기업, 기관, 대학, 개인으로 대별되며, 이는 다시 자국과 타국으로 대별될 수 있으며, 기업은 대기업과 소기업으로 구분될 수 있으며, 기업과 개인은 사적 주체, 기관과 대학은 공적 주체로 대별할 수 있으며, 다출원 주체와 소출원 주체로 대별할 수 있다. 미국 특허청이 발행하는 Maintenance Fee 정보에는 권리자에 대하여 Large Entity 여부에 대한 정보가 있으며, 다른 나라에 대해서는 권리자/출원인의 특허 출원수나 특허 등록수를 기준으로 다출원/다권리 주체와 소출원/소권리 주체로 구분할 수 있다. 기업이나, 기관, 대학의 구분은 출원인/권리자 명(name = organization name + organization type)에 포함된 조직 유형 정보로 파악할 수 있다. 예를 들어, name으로 Samsung Electronics Co. Ltd.가 있는 경우, Samsung Elelctronics은 organization name이 되고, Co. Ltd.는 organization type이 된다. 권리자 종류 비율은 기업 권리자/전체 권리자,(기업+개인)/(기관+대학) 등이 될 수 있다. Self는 개별 특허의 권리자와 피인용 특허의 권리자가 동일한 경우(소위 Self Citation)라는 것이며, Non-Self는 특정 특허의 권리자와 피인용 특허의 권리자가 다른 경우만 고려한다는 것을 말한다.

한편, 표기 항목의 수가 너무 많기 때문에 도입하는 "A1, B1, D1, E1"나 A1~D1와 같은 이러한 약식 표기에 대해 설명한다. 피인용 특허의 권리자를 기준으로 한 A1, B1, D1, E1라는 것에서 A1는 피인용 특허의 권리자 총개수, B1는 최근 n년간의 피인용 특허의 권리자 총개수, D1라는 것은 피인용 특허의 권리자 중에서 개별 특허의 권리자와 다른 권리자의 총개수, E1라는 것은 개별 특허의 청구항 수로 A1, B1, D1값을 나눈 값을 말한다. 이와 같이 약식 표기는 "요소부분 + 참조 부분의 범위"로 구성된다. 위 예에서 요소 부분은 "피인용 특허의 권리자"가 되고, 범위 부분은 피인용 특허의 권리자를 기준으로 한 분쟁 예측 요소 후보를 구성할 참조 부분의 범위가 된다.

한편, 특허 분류에 대해서는 특허 분류 종류(IPC, USPC, FT, FI, ECLA)별, 특허 분류 계층 구조상에서의 레벨(예를 들면, IPC의 경우, subclass나 main group 등)별, 주특허분류와 부특허분류의 사용 범위별 중 어느 하나 또는 2 이상의 조합별로 분쟁 예측 요소 후보값을 생성할 수 있을 것이다. 예를 들면, 하나의 특허에 USPC와 IPC가 모두 들어 있는 경우, 주 특허 분류만 사용하고, USPC는 class 단위에서 IPC는 subclass 단위 및 main group 단위에서와 같이 총 3개 종류에 대해서 분쟁 예측 요소 후보값을 생성할 수 있을 것이다. 분쟁 예측 요소 후보나 분쟁 예측 요소에 관한 한 특허 분류의 처리에 대해서는 이하 동일하게 적용된다.

본 발명에서 인용은 크게 4가지 종류가 있다. 첫째는 직접 인용(direct citation)으로 인용 깊이(depth) 1인 인용에 해당한다. 특허 P1의 레퍼런스(인용) 정보에 특허 P2가 있는 경우, P2는 P1의 부모(parent)가 되고, P1은 P2의 자식(child)가 된다. 이 경우, P2는 P1의 직접 인용, P1은 P2의 직접 피인용이 된다. 둘째는 간접 인용(indirect citation)으로 인용 depth 2 이상의 인용에 해당한다. P2의 레퍼런스에 P3가 있는 경우, P3는 P1의 인용 깊이 2의 간접 인용이 된다. 셋째는 잠재 인용(latent citation)이다. 넷째는 사슬 인용(chain citation)이다. 모든 종류의 인용은 후방(forward)와 전방(backward)로 나뉘어 진다. 상기 표 1과 같은 인용 관점의 다양한 분쟁 예측 요소 내지 분쟁 예측 요소 후보에 대한 분쟁 예측 요소값 내지는 분쟁 예측 요소 후보값은 상기 4가지 인용 종류별(상기 4가지 인용 종류별의 하위 종류별(예를 들어, 제1종 잠재 인용, 제2종 잠재 인용, 제1종 사슬 인용, 제2종 사슬 인용 등)을 포함할 수 있다. 이하, 같다.)로 별도로 생성되거나, 상기 4가지 인용 종류 중 어느 하나 이상을 단순 합산하거나, 상기 4가지 인용 종류에 따라 기 설정된 다른 가중치를 부여한 채 합산하는 방법으로 생성될 수 있을 것이다. 물론, 상기 분쟁 예측 요소값 내지 분쟁 예측 요소 후보값은 전방과 후방을 분리하여 생성되는 것이 타당할 것이다.

또한, 자사 특허를 자사 또는 자사와 기 설정된 밀접 관련(예, 계열사 관계 등)을 맺고 있는 출원인이 인용하는 경우를 협의의 자기 인용(self citation)이라 한다. 자기 인용은 자신과 레퍼런스가 기 설정된 공통 분모를 가지는 경우로, 상기 공통 분모에는 상기의 출원인 공통, 발명자 공통, 특허 분류 공통 등이 있을 수 있다.

상기 인용 특허 집합 생성부(5121)는 자기 특허 SSi에 대하여 적어도 하나 이상의 직접 인용 특허를 포함하는 직접 인용 특허 집합, 적어도 하나 이상의 간접 인용 특허를 포함하는 간접 인용 특허 집합, 적어도 하나 이상의 잠재 인용 특허를 포함하는 잠재 인용 특허 집합, 적어도 하나 이상의 사슬 인용 특허를 포함하는 사슬 인용 특허 집합 중 어느 하나 이상을 생성한다.

본 발명의 직접 인용과 관련된 레퍼런스 정보는 1) Pi의 출원인이나 권리자가 부여한 것(출원인 인용), 2) 심사관이 부여한 것(심사관 인용), 3) 선행 기술 조사를 통해서 부여 된 것(선행 기술 조사 인용), 4) 심사관의 Pi 심사 시 인용 참증으로 부여된 것(참증 인용) 중 어느 하나 이상이 포함된다. 상기 인용 특허 집합 생성부(5121)의 인용 특허 집합의 생성은 이와 같이 간접 인용 정보, 잠재 인용 정보 및 사슬 인용 정보도 상기 1) 내지 4) 종류 중 어느 하나 이상이 고려되어 생성된다.

이어, 도 11내지 도 20을 참조하면서 상기 입수된 자기 특허 집합, 인용 특허 집합, 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합에 대해서 설명한다.

도 11에서 I1 내지 I6 특허는 입수 특허 집합을 구성한다. I1은 P1을 인용하고, I2는 P2를 인용하며, I3는 P3와 P4를 인용하며, I4는 P5와 입수 특허 집합에 속하는 I4를 인용하며, I 4는 I 5를 인용하며, I5는 I6을 인용하고 있다. 한편, I1은 C1에 의해 인용되고 있으며, I2는 C2 내지 C4에 의해 인용되고 있다. 이때, 인용 특허 집합 I1 내지 I6에 대하여, P1 내지 P5 및 I5, I6이 전방 인용 특허 집합이 되며, C1 내지 C4 및 I4와 I5가 후방 인용 특허 집합이 된다. 도 12에서 알 수 있듯이, 인용 특허 집합이 I1 내지 I4로 한정이 되는 경우, 상기 전방 인용 특허 집합은 P1 내지 P5 및 I5가 돈다. 한편, 도 13에서 알 수 있듯이, 인용 특허 집합이 I1 내지 I3로 한정이 되는 경우, 상기 후방 인용 특허 집합은 C1 내지 P4가 된다.

도 14는 자기 인용 다이어그램의 개념을 보여 주고 있다. I4 내지 I6은 입수 특허 집합에 속하며, I4의 입장에서는 I5가 전방 인용이며, I6은 깊이 2의 전방 인용이며, I5의 입장에서는 I6이 전방 인용이고, I4가 후방 인용이며, I6의 입장에서는 I5가 후방 인용이며, I4가 깊이 2의 후방 인용이 된다. 따라서, I1 내지 I4로 입수 특허 집합이 한정되는 경우, I5가 깊이 1의 전방 자기 인용 특허 집합이 되며, I6은 깊이 2의 전방 자기 인용 특허 집합이 된다. 전방 자기 인용 특허 집합은 상기 I1 내지 I6이 동일한 권리자일 경우, 전방 자기 인용 특허 집합을 구성하는 I5 및/또는 I6은 동일한 권리자의 특허이므로 I5 및/또는 I6과 I4의 관계는 유사한 기술일 가능성이 높으며, I4는 I5 및/또는 I6을 개선하거나 개량한 기술일 가능성이 높으므로, 특정한 권리자의 기술 개발 동향(지속성, 집중 분야) 등을 알 수 있게 된다. 이는 후방 자기 인용 특허 집합의 경우도 마찬가지이다. 즉, 인용 특허 집합에 포함되는 특허에 대하여, 전방 자기 인용 특허 집합과 후방 자기 인용 특허 집합의 관계에 있는 특허들은 유관성이 강하게 되며, 그 권리자의 특허 포트폴리오에 있어서, 연속성, 개량성, 확장성과 포괄성 등을 표상하게 된다. 이는 상기 인용 특허 집합을 권리자의 관점에서 본 것이며, 발명자 단위로 인용 특허 집합을 한정하건, 특허 분류(기술 분야를 대변한다.)별로 인용 특허 집합을 한정하여 볼 경우도 마찬가지일 것이다. 즉, 인용 특허 집합에 있는 특정 발명자의 특허와 인용 발생 입수 특허 집합과 후방 자기 인용 특허 집합의 관계를 가지는 특허 중 동일 발명자의 특허들은 그 발명자를 기준으로 볼 때, 기술 개발이나 연구의 연속성 등을 표상할 수 있다. 이러한 결과를 볼 수 있는 것이 본 발명의 집단 단위 인용 분석의 특유한 효과가 된다.

이어, 인용 발생 입수 특허 집합에 대해서 설명한다. 인용 발생 입수 특허 집합은 입수 특허 집합을 구성하는 특허 중 적어도 1회 이상의 인용을 받은 특허군으로 이루어진다. 상기 인용을 인용 특허 집합을 구성하는 특허 중에서 I1, I2, I4, I5이 인용 발생 입수 특허 집합을 구성한다. 한편, 상기 인용 발생 입수 특허 집합 중에서 특별한 한정 중의 하나인 인용 발생 입수 특허 집합을 구성하는 특허 중 입수 특허 집합의 구성하는 특허를 제외하는 한정을 수행하면, 도 15와 같은 한정된 인용 발생 입수 특허 집합이 생성되게 된다. 만약 I1 내지 I6의 권리자가 동일하고, C1 내지 C4의 출원인이 I1 내지 I6의 권리자와 다르다면, I2는 타 권리자에 의해 가장 많은 인용을 받은 특허가 되어, 인용 발생 입수 특허 집합 중에서도 중요한 특허가 될 가능성이 높으며, 이러한 중요한 특허를 발명한 자도 중요 발명자가 될 가능성이 높다.

이어, 도 16 내지 도 20을 참조하면서 상기 입수된 자기 특허 집합, 인용 특허 집합, 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 및 인용 발생 입수 특허 집합에 대해서 설명한다. 도 16에서 IS(Input Set)는 입수 특허 집합을 의미하며, PIS(Parent of Input Set)은 전방 인용 특허 집합을, CIS(Child of Input Set)은 후방 인용 특허 집합을 의미한다. 도 17에서 CPIS(Cross-over Parent of Input Set)은 전방 자기 인용 특허 집합을, CCIS(Cross-over Child of Input Set)은 후방 자기 인용 특허 집합을 의미한다. CPIS(Cross-over Parent of Input Set)와 CCIS(Cross-over Child of Input Set)에 속하는 특허들은 IS에도 속한다. 도 18은 COIS(Citation Occurred IS)으로 인용 발생 입수 특허 집합을 의미한다. IS에 속하는 모든 특허들에 대한 후방 인용 특허 집합과 COIS에 속하는 모든 특허들에 대한 후방 인용 특허 집합은 동일하다는 특징이 있다.

도 19 내지 도 20은 한정이 발생하는 경우를 예시하고 있다. 이러한 한정은 직접 인용뿐만 아니라, 간접 인용, 잠재 인용 또는 사슬 인용을 통하여 생성되는 인용 특허 집합에 대해서도 동등하게 적용될 수 있다. 입수 특허 집합 IS에 특정한 한정이 가해 지면 SIS(Specified Input Set)이 생성되게 된다. 상기 SIS에 대한 한정된 전방 인용 특허 집합인 PSIS(Parent of Specified Input Set)과 한정된 후방 인용 특허 집합인 CSIS(Child of Specified Input Set)이 생성되게 된다. 도 20은 입수 특허 집합 IS에 대하여 전방 인용 특허 집합과 후방 인용 특허 집합이 생성되었을 때, 상기 전방 인용 특허 집합과 후방 인용 특허 집합에 대하여 기 설정된 한정을 수행했을 경우, 생성되는 한정된 전방 인용 특허 집합의 일종인 SPIS(Specified Parent of Input Set-전방 인용 특허 집합이 먼저 생성된 후, 그 전방 인용 특허 집합에 한정(specification)을 가함)과 후방 인용 특허 집합의 일종인 SCIS(Specified Child of Input Set)가 생성되게 된다.

한정은 본 발명의 옵션 선택부(4340)를 통해서 한정할 수 있으며, 도 7에는 옵션 선택부(4340)의 구성의 일 실시예를 보여 주고 있다. 상기 한정은 기간 한정, 국가 한정, 출원인 한정, 발명자 한정, 특허 분류 한정, 필드 속성 한정, 개별 필드값 한정, 개별 특허 속성값 한정, 기타 한정 등이 있으며, 이들 각각은 본 발명의 기간 한정부(4340-1), 국가 한정부(4340-2), 출원인 한정부(4340-3), 발명자 한정부(4340-4), 특허 분류 한정부(4341-5), 필드 속성 한정부(4341-6), 개별 필드값 한정부(4341-7), 개별 특허 속성값 한정부(2111-8), 기타 한정부(4341-9)가 수행한다. 기간 한정은 from ~ to 로 선택할 수 있으며, 기간의 기준은 출원일, 공개일, 등록일 등 여러 가지가 있을 수 있다. 국가의 한정은 우선권 주장 출원에 나와 있는 국가일 수 있으며(권리자의 국적) 발명자의 국적(발명자 주소 정보에 나옴)일 수도 있으며, 상태는 공개나 등록, 무효, 소멸 등 특허의 각종 현재 상황을 나타낸다. 특허 분류의 경우에는 IPC, USPC, FT, FI, ECLA에 대한 특허 분류 종류의 선택과, 메인 특허 분류인지 서브 특허 분류 인지의 종류의 선택과, 깊이(IPC의 경우 섹션, 클래스, 서브클래스, 메인그룹, 1 dot 서브 그룹, n dot 서브 그룹 등)의 선택 등이 있을 수 있다.한편, 수치값의 선택으로는 공동 발명자수, 공동 출원인 수, 피인용수, 특허 분류 수, 특허 등급, 특허 점수 등과 같은 개별 특허에 대하여 측정하거나, 계산되거나, 입수되는 필드별 수치값에 대한 선택이 있을 수 있다.

한정을 수행하는 방법은 기간 한정, 국가 한정, 권리자 한정, 발명자 한정, 특허 분류 한정 등이 있을 수 있으며, 이는 각각 기간 한정부(4340-1), 국가 한정부(4340-2), 출원인 한정부(4340-3), 발명자 한정부(4340-4) 및 특허 분류 한정부(4341-5)가 수행한다. 출원인 등을 한정할 때, 입수한 특허 집합에 포함된 권리자의 리스트를 보여 주고, 상기 특허 정보 시스템(10000)을 사용하는 사용자가 적어도 하나 이상의 권리자를 선택할 수 있게 한다. 이는 발명자 한정과 특허 분류 한정에서도 마찬가지이다.

이어, 특수한 한정을 소개한다. 먼저 필드 속성 한정이다. 예를 들어 특정한 권리자가 특허 괴물로 분류되거나, 경쟁사로 분류되는 경우, 특허 괴물이나 경쟁사 등이 특별한 필드 속성이 된다. 이는 특히 특허 괴물로 분류되는 권리자의 특허를 다수 인용하는 경우, 특허 분쟁이나 라이센스 요구 리스크가 커지게 되기 때문에 중요하다. 권리자는 출원인과 같은 필드이며, 출원인 필드 속성에는 특허 괴물이나 경쟁사(이러한 특허 괴물이나 경쟁사는 특정한 사용자별로 다를 수 있으며, 사용자별로 지정이 가능함은 물론이다 할 것이다.)뿐만 아니라, 권리자 속성(대학, 연구 기관, 기업)이나, 권리자 규모(대기업, 중소 기업), 권리자 속성(다출원 기업, 핵심 특허 다수 보유 기업, 특허 품질 지수가 높은 기업 등)과 같은 다양한 속성이 있을 수 있다. 발명자 등도 권리자와 마찬가지로 다양한 속성이 부여 될 수 있음은 당연할 것이다. 이러한 필드 속성의 한정은 본 발명의 필드 속성 한정부(4341-6)가 수행한다. 한편, 필드 속성이 값으로 존재할 때, 이러한 한정은 본 발명은 개별 필드값 한정부(4341-7)가 수행한다. 한편, 특정 특허 집합에 대하여 공동 출원인수 2주체 이상, 공동 발명자수 3인 이상, 특허 분류 개수 2개 이상, 피인용수 5회 이상 등과 같이 개별 필드의 필드값별로 필드값을 한정하여, 한정된 조건을 만족하는 특허군 만을 추출할 수도 있을 것이다. 이러한 한정은 개별 특허 속성값 한정부(4341-8) 가 수행한다. 한편, 기타 한정이 있는 경우 이러한 한정은 본 발명은 기타 한정부(4341-9)가 수행한다. 상기 한정 등은 포괄적으로 수행하는 것은 옵션 선택부(4340)의 기능이다. 상기 한정은 입수 특허 집합과 인용 특허 집합 모두에 대하여 수행할 수 있고, 상기 입수된 자기 특허 집합의 생성이 1차 입수 집합을 입수하고, 입수된 1차 입수 집합을 그대로 입수 특허 집합으로 처리하는 경우, 상기 1차 입수 집합에 대해서도, 상기 인용 특허 집합의 생성이 1차 대상 특허 집합을 생성하는 경우, 상기 1차 대상 특허 집합에 대해서도 한정될 수 있다. 이러한 한정이 수행되는 경우에 대해서는 도 19와 도 20에 잘 나타나 있다. 도 19에서는 입수 특허 집합에 추가적으로 한정하는 경우, 한정된 입수 특허 집합에 대해서 전방 인용 특허 집합도 한정되지 않은 입수 특허 집합에 대한 전방 인용 특허 집합보다 한정되며, 한정된 입수 특허 집합에 대해서 후방 인용 특허 집합도 한정되지 않은 입수 특허 집합에 대한 후방 인용 특허 집합보다 한정됨을 보여 주고 있다. 한편, 도 20은 입수 특허 집합에 대하여 전방 인용 특허 집합과 후방 인용 특허 집합이 생성될 때, 상기 전방 인용 특허 집합과 후방 인용 특허 집합에 한정을 가하여, 한정된 전방 인용 특허 집합과 후방 인용 특허 집합을 생성할 수 있음을 보여 준다. 특수한 한정으로 키워드 한정이 있다. 즉, 개별 특허들마다 핵심 키워드를 추출해 놓은 경우, 특정한 적어도 하나 이상의 키워드를 포함하거나 배제되거나 하는 등의 키워드 관련 조건으로 특허 집합을 한정할 수 있게 된다.

이어, 도 21 내지 도 22를 참조하면서 잠재 인용을 더욱 더 상세하게 설명한다. 상기 잠재 인용 특허에는 제1 종 잠재 인용 특허와 제2 종 잠재 인용 특허가 있다.

제1 종 잠재 인용 특허는 자기 특허(SSi)과 공통 부모 특허(예를 들면, P(SSi), SSi의 직접 인용 특허)를 가지는 특허 중에서, 자기 특허와 직접 인용 관계를 가지지 않으면서, 자기 특허의 기 설정된 기준일에 상기 인용 특허가 공개되어 입수 가능성이 있거나, 상기 인용 특허의 기 설성된 기준일에 자기 특허가 공개되어 입수 가능성이 있었던 특허를 말한다. 제1 종 잠재 인용은 도 21에서 LCP1과 LCP4와 같은 특허들이다. 제1 종 잠재 인용 특허 중 전방 제1 종 잠재 인용 특허(LCP1)를 찾기 위해서는 상기 자기 특허가 직접 인용하는 특허 집합(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허들도 그 대상이 될 수도 있다.)을 인용하는 특허 중 그 공개일이 자기 특허의 출원일보다 앞선 것을 찾으면 된다. 제1 종 잠재 인용 특허 중 후방 제1 종 잠재 인용 특허(LCP4)를 찾기 위해서는 상기 자기 특허가 직접 인용하는 특허 집합(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허들도 그 대상이 될 수도 있다.)을 인용하는 특허 중 자기 특허의 공개일 이후에 출원된 특허를 찾으면 된다.

제2 종 잠재 인용 특허는 자기 특허(SSi)과 공통 부모 특허(예를 들면, P(SSi), SSi의 직접 인용 특허)를 가지는 특허 중에서, 자기 특허와 직접 인용 관계를 가지지 않으면서, 자기 특허의 기 설정된 기준일에 상기 인용 특허가 공개되지 않아 입수 가능성이 없었거나, 상기 인용 특허의 기 설성된 기준일에 자기 특허가 공개되지 않아 입수 가능성이 없었던 특허를 말한다. 제 2종 잠재 인용 특허는 도 22에서 LCP2와 LCP3와 같은 특허들이다. 제2 종 잠재 인용 특허 중 전방 제2 종 잠재 인용 특허(LCP2)를 찾기 위해서는 상기 자기 특허가 직접 인용하는 특허 집합(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허들도 그 대상이 될 수도 있다.)을 인용하는 특허 중 출원일은 자기 특허의 출원일보다 빠르며, 공개일은 자기 특허의 출원일보다 늦은 것을 찾으면 된다. 제2 종 잠재 인용 특허 중 후방 제2 종 잠재 인용 특허(LCP3)를 찾기 위해서는 상기 자기 특허가 직접 인용하는 특허 집합(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허들도 그 대상이 될 수도 있다.)을 인용하는 특허 중 출원일이 자기 특허의 출원일보다 늦으며, 자기 특허의 공개일일보다 앞선 것을 찾으면 된다.

상기 기 설정된 기준일은 출원일로 처리하는 것이 바람직할 것이다. 엄격하게 말하면 상기 기준일은 자기 특허의 레퍼런스별로 레퍼런스를 입력하는 날짜(예를 들면, 심사관이 레퍼런스를 입력하는 경우, 그 입력일, 선행 기술 조사 문건의 입력의 경우에는 그 선행 조사 문건 조사일 등이 그 예가 될 것이다. 한편, IDS 제도가 있는 미국의 경우, 레퍼런스마다 제출일 등이 다를 수가 있다.)가 타당하나, 이는 사실상 data적으로 알기 어려운 문제가 있다. 한편, 출원일을 기준일로 할 경우 PCT 국제출원을 통하여 국내 단계로 진입하는 경우 국제출원일이 통상적인 출원일이 되나, 상기 기준일은 국제 출원의 경우에는 국내 단계에서의 출원일(filing date)으로 처리하는 것이 더욱 더 타당할 것이다.

이어, 도 23 내지 도 24를 참조하면서 사슬 인용 특허를 더욱 더 상세하게 설명한다. 상기 사슬 인용 특허에는 제1 종 사슬 인용 특허와 제2종 사슬 인용 특허가 있다.

상기 제1 종 사슬 인용 특허는 자기 특허(SSi)가 직접 인용하는 특허들인 직접 인용 특허(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허 또는 잠재 인용 특허들도 그 대상이 될 수도 있다.) 중에서, 상기 직접 인용 특허가 인용하는 특허와 상기 자기 특허가 공통 부모 특허를 가지는 경우가 있는 특허거나(예를 들면, WCP1), 자기 특허(SSi)를 직접 인용하는 특허들인 직접 인용 특허 중에서, 상기 직접 인용 특허가 인용하는 특허와 상기 자기 특허가 공통 부모 특허를 가지는 경우가 있는 특허(예를 들면, WCP4)를 말한다. 상기 제 1종 사슬 인용 특허는 도 23에 잘 도시되어 있다.

상기 제2 종 사슬 인용 특허는 자기 특허(SSi)가 직접 인용하는 특허(예를 들면, WCP2)(인용 깊이 1인 직접 인용뿐만 아니라 인용 깊이 2인 간접 인용 특허 또는 잠재 인용 특허들도 그 대상이 될 수도 있다.)의 적어도 하나 이상 인용 깊이의 직접 인용 특허(예를 들면, WCP3)와 상기 자기 특허가 공통 부모 특허(예를 들면, P(SSi))를 가지는 경우에 있어서, 상기 자기 특허(SSi)가 직접 인용하는 특허(WCP2) 및 상기 자기 특허(SSi)가 직접 인용하는 특허(WCP2)의 적어도 하나 이상 인용 깊이의 직접 인용 특허(WCP3)를 말한다. 한편, 상기 제2 종 사슬 인용 특허에는 상기 자기 특허(SSi)를 직접 인용하는 특허(예를 들면, WCP5)의 적어도 하나 이상 인용 깊이의 직접 인용 특허(예를 들면, WCP6)와 상기 자기 특허가 공통 부모 특허(예를 들면, P(SSi))를 가지는 경우에 있어서, 상기 자기 특허(SSi)를 직접 인용하는 특허(WCP5) 및 상기 자기 특허(SSi)를 직접 인용하는 특허(WCP5)의 적어도 하나 이상 인용 깊이의 직접 인용 특허(WCP6)를 말한다.

직접 인용 특허만으로 사슬 인용 특허를 찾기 위해서는 자기 특허가 직접 인용하는 특허들과 자기 특허로 사슬 인용 특허 집합을 구성한 다음, 상기 사슬 인용 특허 집합에서 인용-피인용 관계를 가지는 특허를 추출한다. 추출된 특허 중에서 자기 특허보다 출원일이 빠르면 전방, 자기 특허보다 출원일이 늦으면 후방이 된다. 한편, 추출된 특허 중에서, 자기 특허를 인용하거나, 자기 특허가 인용하는 관계가 되는 경우에는 제1종 사슬 인용 특허가 되고, 자기 특허와의 직접적인 인용 관계가 없으면 제 2종이 된다. 간접 인용 특허만으로 상기 사슬 인용 특허를 찾기 위해서는 자기 특허와 간접 인용 특허로 사슬 인용 특허 집합을 구성하여 동일한 정보 처리를 수행하면 된다. 한편, 잠재 인용 특허만으로 상기 사슬 인용 특허를 찾기 위해서는 자기 특허와 간접 인용 특허로 사슬 인용 특허 집합을 구성하여 동일한 정보 처리를 수행하면 된다. 한편, 자기 특허에 대하여, 직접 인용 특허, 간접 인용 특허, 및 잠재 인용 특허 중 어느 2 이상으로 사슬 인용 특허 집합을 구성한 다음에 동일한 정보 처리를 수행할 수도 있을 것이다.

상기 인용 관련된 모든 특허에 있어서, 전방과 후방은 상기 자기 특허와 상기 인용 특허들 간의 출원일을 기준으로 설정하는 것이 타당할 것이나, 최선일(우선권 주장 출원의 경우 우선일이 최선일이 되며, 우선권 주장이 없는 경우에는 통상의 출원일이 최선일이 된다.)을 기준으로 설정할 수도 있을 것이다.

본 발명에서의 인용과 관련된 상기 표 1과 같은 각각의 분쟁 예측 요소(후보)에 대한 분쟁 예측 요소(후보)값은 상기 직접 인용, 상기 간접 인용, 상기 잠재 인용, 상기 사슬 인용 중 어느 하나 이상의 인용 종류별로 생성해 놓을 수 있다. 나아가 상기 각각의 분쟁 예측 요소는 간접 인용의 깊이별 및/또는 잠재 인용이나 사슬 인용의 종류별로도 분쟁 예측 요소를 세분화할 수 있으며, 세분화된 분쟁 예측 요소별로 분쟁 예측 요소값을 생성할 수도 있을 것이다. 한편, 세분화하지 않는 경우, 간접 인용의 깊이 및 잠재 인용의 종류 중 실제 분쟁 예측 모델의 생성 시에 사용하는 범위는 상기 사용자 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 관리자가 선택할 수 있을 것이다.

특정 특허 집합(Self Set, SS)이 있을 때, 상기 특허 집합에 포함된 특허가 인용하는 특허군으로 형성되는 특허 집합은 선출원 특허 집합(Parent Set)이 될 수 있고, 특정한 조건을 만족하는 특허(예를 들면 상기 특허 집합에 포함된 특허를 인용하는 특허 중 최근 3년 이내 또는 특정 출원인 또는 특허 분류를 포함하는 특허 등) 등도 선출원 특허 집합(Parent Set)이 될 수 있다. 등록 특허가 이 선출원 특허 집합에 포함된 특허들의 임의의 조합은 선출원 특허군이 된다. 상기 특허 집합에 포함된 특허를 인용하는 특허군 또는 특정한 조건을 만족하면서 상기 특허 집합에 포함된 특허를 인용하는 특허군으로 형성되는 특허 집합은 후출원 특허 집합(Child Set)이 될 수 있다. 상기 후출원 특허 집합에 포함된 특허들의 임의의 조합은 후출원 특허군이 된다. 상기 인용 관점 분쟁 예측 요소값은 상기 특정 특허 집합별, 선출원 특허 집합별, 후출원 특허 집합별로도 생성될 수 있다. B라는 특정 특허 집합이 A라는 특허 집합의 후출원 특허 집합일 경우, A가 Self Set이 되고, B는 Child Set이 되며, B라는 특정 특허 집합이 C라는 특허 집합의 선출원 특허 집합일 경우, C가 Self Set이 되고, B는 Parent Set이 된다. 한편, 인용-피인용 관계의 특성상 B라는 특정 특허 집합이 A라는 특허 집합의 후출원 특허 집합일 경우, 반드시 B의 Parent Set이 A가 되는 것은 아니다. B의 Parent Set의 부분 집합이 A가 되는 것이 보통이다.

도 25는 표 1과 관련하여 인용 관점의 분쟁 예측 요소별 분쟁 예측 요소값을 생성하는 일 실시예적 방법을 도시하고 있다. 상기 분쟁 요소값 생성 엔진은 분쟁 예측 요소값 생성 대상이 되는 특허를 입수(SL21)하고, 입수된 특허의 직접 인용 특허를 입수하고 직접 인용 관련 분쟁 예측 요소값을 생성하거나, 입수된 특허의 간접 인용 특허를 입수하고 간접 인용 관련 분쟁 예측 요소값을 생성하거나, 입수된 특허의 잠재 인용 특허를 입수하고, 잠재 인용 관련 분쟁 예측 요소값을 생성하거나, 입수된 특허의 사슬 인용 특허를 입수하고 사슬 인용 관련 분쟁 예측 요소값을 생성(SL22)하고, 생성된 인용 관련 분쟁 예측 요소값을 저장(SL23)한다.

둘째, 다수의 분쟁 특허들은 2회 이상 분쟁을 일으키는 등과 같이 분쟁 특허 집합에는 특허 분쟁에 다수 참여하는 다분쟁 유발 특허가 존재한다. 등록된 모든 특허권에 대하여 고르게 분쟁이 유발되는 것이 아니라, 분쟁에 관련되는 분쟁 대상 특허는 소수이며, 특히 몇몇의 다분쟁 유발 특허가 다수의 분쟁을 유발시킨다. 상기 다분쟁 유발 특허는 특허 분쟁 정보를 분석함으로써도 알 수 있다. 특허 분쟁이 발생한 특허를 특허 분쟁별로 입수하여, 특허 분쟁과 관련된 특허 번호를 입수하고, 그 특허 번호 중 기 설정된 분쟁 참여 회수 이상인 것은 다분쟁 유발 특허가 된다. 이러한 분쟁 발생 특허는 제1종 다분쟁 유발 특허가 된다.

한편, 분쟁 발생은 되지 않았지만, 분쟁 가능성이 높은 특허들도 존재한다. 예를 들면, 특허 괴물 또는 특허 괴물의의 자회사, 유관 회사, 특허 괴물이 관리하는 대상 권리자의 적어도 하나 이상의 특허군들이나, 적어도 하나 이상의 표준 특허풀에 포함된 특허, 다분쟁 유발자가 보유하고 있는 특허군의 특허나 이들에 신규로 편입(편입 여부는 current assignee 정보를 처리함으로 알 수 있다.)된 특허들이 예가 된다. 이러한 예에 속하는 특허를 제2종 다분쟁 유발 특허라 한다.

한편, Reissue 특허, 다패밀리량 특허, 다패밀리량 증가 특허, 다피인용 특허, 피인용 증가 속도가 높은 특허 등과 같은 특허를 제3종 다분쟁 유발 특허라 한다.

개별 특허를 기준으로 상기 개별 특허 기준 다분쟁 유발 특허 관점 분쟁 예측 요소별로 상기 제1종, 제2종 및/또는 제3종 다분쟁 유발 개별 특허 인지의 여부는 개별 특허 기준 다분쟁 유발 특허 관점 분쟁 예측 요소값을 생성할 수 있다. 개별 특허 기준 다분쟁 유발 특허 관점 분쟁 예측 요소값은 Reissue 특허 해당 여부 등과 같이 해당되는 경우 1, 해당되지 않는 경우에는 0처럼 취급될 수도 있지만, 대부분의 다분쟁 유발 특허 관점 분쟁 예측 요소값은 0과 1이 아닌 값(예를 들어 패밀리량은 정수, 피인용 증가 속도는 유리수값이 될 수도 있다.)이 될 수도 있다. 한편, 개별 특허가 아닌 특허군 단위로 상기 다분쟁 유발 특허 관점 분쟁 예측 요소별로 상기 제1종, 제2종 및/또는 제3종 다분쟁 유발 특허 관점 분쟁 예측 요소값을 생성할 수 있다. 즉, n개의 특허로 이루어진 다분쟁 유발 특허군이 있을 때, 상기 n개의 특허 중에서 상기 다분쟁 유발 특허 관점 분쟁 예측 요소별로 다분쟁 유발 특허 관점 분쟁 예측 요소값을 생성할 수 있다. 이때 생성되는 다분쟁 유발 특허 관점 분쟁 예측 요소값은 카운트(합산 포함)값, 평균값(산술평균, 기하평균 등) 및 기 설정된 함수식값 중 어느 하나가 될 수 있다. 예를 들어 100개의 특허로 이루어진 특허군이 있을 때, Reissue 특허의 개수가 10개일 경우, 10이 카운트값이 될 수 있다. 한편, 동일한 Reissue 특허 10개라도 모집단(n)이 작을수록 그 모집단은 상대적으로 많은 Reissue특허를 포함하게 된다. 즉, Reissue값의 밀도가 높아지게 되며, 높은 밀도는 그 특허군이 분쟁과 관련될 가능성을 높이게 된다. 한편, 상기 밀도는 평균값으로 측정될 수 있을 것이다.

나아가, 상기 제1종, 제2종 및/또는 제3종 다분쟁 유발 개별 특허별 또는 상기 제1종, 제2종 및/또는 제3종 다분쟁 유발 개별 특허군별로 상기 인용 관점 분쟁 예측 요소 후보값들을 생성할 수 있음은 물론이다 할 것이다.

상기 다분쟁 유발 특허 관점에서 하기 표 2와 같은 분쟁 예측 요소 후보가 예시적으로 제시될 수 있을 것이다.

계열	계열 code	다분쟁 유발 특허 관점 분쟁 예측 요소 후보군	비고
총개수	A2	재분쟁수(분쟁참여수-1), 패밀리수, 권리자 변동수 또는 비발명자 assignee 변동수
최근n년 개수	B2	최근 n년간 A2(예, 최근 n년간 재분쟁수, 최근 n년간 패밀리수, 최근 n년간 권리자 변동수, 최근 n년간 비발명자 assignee 변동수)(n은 1개 이상이 될 수 있음, 이하 이 표에서는 동일하게 적용)
증감량 또는 증감율	C2	전기간 기준 A2~B2의 증감량, 특정 기간 기준 A2~B2의 증감율
여부	D2	Reissue특허 여부, 해외 특허 여부, 트롤 특허 여부
서지 사항	E2	출원 청구항수, 등록 청구항 수, 도면수, 페이지수, 특허 분류수, 특정 특허 분류 레벨 기준 이종 특허 분류수, 공동출원인수, 공동발명자수, 등록 소요 기간, 권리 유지 기간, 외국 발명자수, 외국 발명자 비율, 우선권 주장수, 등록 유지 기간
표준 또는 소속풀	E2	표준 특허풀 포함 여부, 표준 특허풀 포함수, 소속 특허풀 포함수
다중 분쟁	F2	분쟁참여수, 공동참여분쟁수, 분쟁당 공동참여 특허수, 총피고수, 참여분쟁당 피고수
다중 분쟁 증감	G2	최근 n년 간 F2, 전기간 기준 F2의 증감량, 특정 기간 기준 F2의 증감율
분쟁 분포	H2	최초 분쟁 연도, 최후 분쟁 연도, 최빈 분쟁 연도
경과 정보	I2	심판별 심판 제기 여부, 심판별 심판 제기 수, 우선심사청구 여부, 출원일과 심사청구일 차이, 출원일과 등록일 차이

셋째, 다분쟁 유발자가 존재한다. 다분쟁 유발자 정보는 특허 분쟁 정보를 입수하고, 특허 분쟁 정보에 포함된 특허 번호의 권리자 또는 원고(plaintiff)와 관련되어, 기 설정된 빈도(frequency) 또는 기 설정된 증가율 등의 각종 조건을 적용하여 적어도 하나 이상의 다분쟁 유발자를 추출할 수 있다. 분쟁 정보를 분석하여 생성하는 다분쟁 유발자를 제1종 다분쟁 유발자라 한다. 한편, 특허 괴물 또는 적어도 하나 이상의 특허풀에 기 설정된 개수 이상의 특허를 보유하고 있거나 기 설정된 조건(최근 개수, 고증가율)을 충족하는 특허를 보유하고 있는 권리자 등은 제2종 다분쟁 유발자라 한다. 그리고, 권리자들 중에서 그 권리자의 전체 특허 포트폴리오 또는 특정 시기 또는 특정 조건으로 결정되는 특허군의 특허 중에서 Reissue 특허 비중, 다패밀리량 특허 비중, 다패밀리량 증가 특허 비중, 다피인용 특허 비중, 피인용 증가 속도가 높은 특허 비중 등이 높은 특허군을 보유하는 권리자를 제3종 다분쟁 유발 권리자라 한다.

상기 다분쟁 유발자 관점에서 하기 표 3와 같은 분쟁 예측 요소 후보가 예시적으로 제시될 수 있을 것이다.

계열	계열 code	다분쟁 유발자 관점 분쟁 예측 요소 후보군	비고
다분쟁 제기자 관련성	A3	권리자의 분쟁 참여 회수, 권리자의 총 분쟁 참여 특허 보유수, 권리자의 특허 중 분쟁 참여 특허 비율
다분쟁 경험자 관련성	B3	권리자의 분쟁 피소 회수, 권리자의 분쟁 피소 회수 대비 분쟁 제기 회수 비율
표준 특허풀 참여자 관련성	C3	권리자의 표준 특허풀 참여 특허수, 권리자의 총 특허 중 표준 특허풀 비참여 특허수, 권리자의 특허 중 표준 특허풀 참여 특허 비율
최근n년 개수	D3	최근 n년간 A3~C3
증감량 또는 증감율	E3	최근 n년 기준 A3~C3 증감량, 최근 n년 기준 A3~C3 증감율
등록된 트롤 관련성	F3	권리자가 등록된 트롤인지 여부
권리자 기관 속성	G3	대기업 여부, 해외 기업 여부, 권리자의 기업/기관/대학/개인 여부
권리자 특허 포트폴리오 속성	H3	전체 출원청구항수, 특허출원 1건당 청구항 수, 발명자 1인당 청구항수, 전체 특허등록건수, 전체 등록청구항수, 특허등록율, 전체 유효특허건수, 유효특허잔존율, 유효특허의 평균잔존 소요기간, 특허 당 인용지수, 기술 영향력 지수, 기술력 지수, 기술진보 측정 지수, Innovation Speed Index(isi), 과학적 연계성, 과학력 지수, 과학적 연계지수, International Knowledge Flow(IKF), 기술 의존도, 기술 자립도, 공동 출원 비율, 공동 출원인수

n개의 특허로 이루어진 Set가 있을 때, 상기 n개의 특허 중에서 상기 다분쟁 유발자가 권리자로 되어 있는 특허의 카운트값, 평균값 및 기 설정된 함수식값 중 어느 하나 이상을 다분쟁 유발자 관점 분쟁 예측 요소값으로 할 수 있다. 예를 들어 100개의 특허로 이루어진 특허군이 있을 때, AA라는 다분쟁 유발자가 권리자로 된 특허의 개수가 10개일 경우, 10이 카운트값이 될 수 있다. 한편, 동일한 다분쟁 유발자가 권리자인 특허가 10개라도 모집단(n)이 작을수록 그 모집단은 상대적으로 많은 수의 다분쟁 유발자가 권리자로 된 특허를 포함하게 된다. 즉, 다분쟁 유발자 관련 밀도가 높아지게 되며, 높은 밀도는 그 특허군이 분쟁과 관련될 가능성을 높이게 된다. 한편, 상기 밀도는 평균값으로 측정될 수 있을 것이다.

나아가, 상기 제1종, 제2종 및/또는 제3종 다분쟁 유발자의 다분쟁 유발자의 전체 특허로 생성되는 특허군 또는 기 설정된 조건(특정 기간, 특정 특허 분류, 또는 특정 검색어 또는 기타 조건)을 충족하는 특허군 각각에 대하여 상기 인용 관점 분쟁 예측 요소 후보값을 생성해 놓을 수 있을 것이다.

넷째, 소송이 빈번하게 발생하는 다분쟁 기술군이 존재한다. 또한, 권리자가 자신이 보유하고 있는 특허 포트폴리오를 기준으로 분쟁을 다수 일으키는 기술군과 그렇지 않을 기술군이 존재하며, 기술군마다 권리자의 특허 포트폴리오가 다르며, 권리자의 주관적 중요도가 다를 수 있다. 권리자는 통상적으로 2 이상의 기술군(예를 들면 특허 분류)에 대하여 2 이상의 특허를 보유하고 있을 수 있고, 동일 권리자의 각 기술군에 포함된 특허마다 분쟁 발생 여부, 분쟁 제기 회수 등이 다를 수 있다.

예를 들면, 미국 특허 분쟁 정보에서 분쟁 유발 특허의 특허 분류 중에서 IPC 기준 G06F와 A61K에는 다른 특허 분류에 비하여 다수의 특허 분쟁이 발생함을 알 수 있다. 분쟁 유발 특허에는 적어도 한 종류 이상의 적어도 하나 이상의 특허 분류가 포함되어 있으며, 상기 특허 분류를 처리하여 적어도 하나 이상의 다분쟁 기술군을 추출한다. 상기 다분쟁 기술군은 IPC, USPC 또는 기타 특허 서지 사항에 포함되어 있는 특허 분류가 될 수 있다. 한편, 특허 분류 체계의 계층 구조상 다양한 계층별로의 다분쟁 기술군 정보를 생성할 수 있다. 예를 들어, H04B 7/26라는 특허 분류가 있을 때, H04B 7/26(2 dot Subgroup) 부모는 특허 분류 체계 상 차례로 H04B 7/24(1dot Subgroup), H04B 7/00(Main Group), H04B(Subclass), H04(Class), H(Section)가 된다. 따라서, n dot Subgroup부터 Main Group, Subclass, Class 등과 같이 각 계층별로 분쟁 발생 특허군의 특허 분류를 기준으로 적어도 하나 이상의 최빈 특허 분류를 추출할 수 있을 것이다. 이때, 주특허 분류(Main Classification)만으로 최빈 특허 분류를 추출할 지, 부특허 분류(Sub Classification)을 포함하여 최빈 특허 분류를 추출할 지는 시스템의 설정 또는 사용자의 선택에 따라 달라질 수 있다. 물론, 특허 분류 계층 구조상의 어느 깊이(IPC의 경우 Section에서 n dot Subgroup, USPC의 경우 Class에서 n dot Subgroup 등 특허 분류 체계의 종류마다 다를 수 있다.)를 선택할지도 시스템의 설정 또는 사용자의 선택에 따라 달라질 수 있다.

상기 다분쟁 기술군 관점에서 하기 표 4와 같은 분쟁 예측 요소 후보가 예시적으로 제시될 수 있을 것이다.

계열	계열 code	다분쟁 기술군 관점 분쟁 예측 요소 후보군	비고
다분쟁 기술군 관련성	A4	특허 분류 기준 분쟁 발생 회수, 특허 분류 기준 분쟁 제기 특허수, 특허 분류 기준 분쟁 제기자수, 특허 분류 기준 분쟁 피고자수, 특허 분류 기준 전체 특허수 대비 분쟁 발생 회수 비율, 특허 분류 기준 전체 특허수 대비 분쟁 제기 특허수 비율 특허 분류 기준 전체 특허수 대비 분쟁 제기자수 비율, 특허 분류 기준 전체 특허수 대비 분쟁 피고자수 비율
권리자 보유 특허군 한정 다분쟁 기술군 관련성	B4	권리자 보유 특허군 한정 특허 분류 기준 분쟁 발생 회수, 권리자 보유 특허군 한정 특허 분류 기준 분쟁 제기 특허수, 권리자 보유 특허군 한정 특허 분류 기준 분쟁 제기자수, 권리자 보유 특허군 한정 특허 분류 기준 분쟁 피고자수, 권리자 보유 특허군 한정 특허 분류 기준 전체 특허수 대비 분쟁 발생 회수 비율, 권리자 보유 특허군 한정 특허 분류 기준 전체 특허수 대비 분쟁 제기 특허수 비율 권리자 보유 특허군 한정 특허 분류 기준 전체 특허수 대비 분쟁 제기자수 비율, 권리자 보유 특허군 한정 특허 분류 기준 전체 특허수 대비 분쟁 피고자수 비율
권리자 기술 분야 포트폴리오 속성	C4	권리자 특허 분류 기준 점유율, 권리자 특허 분류 기준 집중율, 권리자 특허 분류 기준 활동율, 권리자 특허 분류 기준 H3 권리자 특허 분류 기준 특허당 평균 등록 유지 기간
최근n년 개수		최근 n년간 A4~C4
증감량 또는 증감율		최근 n년 기준 A4~C4 증감량, 최근 n년 기준 A4~C4 증감율
기술군 속성		기술의 경제적 수명

상기 표 4에서 특허 분류는 특허 분류 종류(예, IPC, USPC 등)별, 특허 분류 깊이(예, IPC의 경우, class, subclass, main group, n dot subgroup 등)별, 주특허분류별 또는 모든 특허분류별 중 어느 하나 또는 2 이상의 조합이 될 수 있을 것이다. 한편, 상기 표 4에서 권리자 보유 특허군 한정 특허 분류 기준이란, 특정 특허 Pi의 권리자가 보유하고 있는 특허군에 포함된 특허 분류만을 대상으로 생성되는 분쟁 예측 요소를 말한다. 예를 들어 C1 특허 분류의 특허 m개와 C2 특허 분류의 특허 n개를 보유하고 있는 A 권리자가 있을 경우, 상기 B4에 해당하는 분쟁 예측 요소값은 m개와 n개별로 구분지어 처리된다. 상기 A 권리자의 m개의 특허 중에서 2개가 분쟁을 제기한 특허이며, n개의 특허 중에는 분쟁을 제기한 특허가 1개 있는 경우, A 권리자의 권리자 보유 특허군 한정 특허 분류 기준 분쟁 제기 특허수라는 분쟁 예측 요소값은 C1에 대해서는 2, C2에 대해서는 1이 되며, 상기 권리자 보유 특허군 한정 특허 분류 기준 전체 특허수 대비 분쟁 제기 특허수 비율이라는 분쟁 예측 요소값은 C1에 대해서는 C1에 대해서는 2/m이 되며, C2에 대해서는 1/n이 된다.

한편, 상기 분쟁 예측 요소값 생성부(5510)는 사전에 또는 기 설정된 주기별로 또는 기 설정된 조건 성취를 기준으로 특허 DB(1120)에 속하는 모든 특허별로 또는 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합별로 표 1 내지 표 2의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성해 놓을 수 있을 것이다. 한편, 상기 분쟁 예측 요소값 생성부(5510)는 실시간으로 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합별 또는 개별 특허별로 표 1 내지 표 2의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성할 수 있을 것이다. 그리고, 상기 분쟁 예측 요소값 생성부(5510)는 사전에 또는 기 설정된 주기별로 또는 기 설정된 조건 성취를 기준으로 특허 DB(1120)에 속하는 모든 특허 권리자별로 또는 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합에 포함된 특허 권리자별로 표 3의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성해 놓을 수 있을 것이다. 한편, 상기 분쟁 예측 요소값 생성부(5510)는 실시간으로 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합에 포함된 특허 권리자별 또는 개별 특허의 특허 권리자에 대해서 표 3의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성할 수 있을 것이다.

또한, 상기 분쟁 예측 요소값 생성부(5510)는 사전에 또는 기 설정된 주기별로 또는 기 설정된 조건 성취를 기준으로 특허 DB(1120)에 속하는 모든 특허의 특허 분류별로 또는 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합에 포함된 특허의 특허 분류별로 또는 적어도 하나 이상의 특허 집합에 포함된 특허의 권리자를 기준으로 한 특허 분류별로 표 4의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성해 놓을 수 있을 것이다. 한편, 상기 분쟁 예측 요소값 생성부(5510)는 실시간으로 적어도 하나 이상의 특허로 구성되는 적어도 하나 이상의 특허 집합에 포함된 특허 분류별 또는 개별 특허의 특허 분류에 대해서 표 4의 어느 하나 이상 또는 전체 분쟁 예측 요소분의 분쟁 예측 요소값을 생성할 수 있을 것이다. 상기 분쟁 예측 요소값 생성부(5510)의 정보 처리의 대상이 되는 것은 기 설정된 특허 분류 종류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상의 적어도 하나 이상의 특허 분류 깊이 별로 생성될 수 있을 것이며, 상기 정보 처리는 특허 분류 종류별로 처리될 수도 있으며, 상기 정보 처리는 주특허분류만 사용하거나, 부특허 분류도 함께 사용하여 처리될 수도 있을 것이다. 예를 들면, 미국 특허의 경우, IPC와 USPC가 표기되어 있을 경우, IPC는 subclass 및 main group 단위로 각각 분쟁 예측 요소값을 생성하도록 처리하고, USPC의 경우에는 class 단위로 분쟁 예측 요소값을 생성할 수도 있을 것이다. 이때, IPC의 경우에는 주 특허 분류만 사용하고, USPC의 경우에는 부특허분류도 함께 고려(예를 들면, Pi 특허에 C1 주특허분류와 C2 부특허분류가 있는 경우, C2를 기준으로 분쟁 예측 요소값을 생성할 때, Pi를 정보 처리의 대상으로 처리하는 등)하여 상기 분쟁 예측 요소값을 생성할 수 있을 것이다.

한편, 상기 분쟁 예측 요소값 생성부(5510)가 특허 분류 기준으로 특정 특허 분류에 관한 정보 처리할 때, 상기 특정 특허 분류의 하위 특허 분류에 해당하는 특허들을 상기 특정 특허 분류의 정보 처리 시 포함되어 처리될 수 있다. 예를 들면, 상기 분쟁 예측 요소값 생성부(5510)는 H04B 7/24가 다분쟁 기술군일 경우, Main IPC로 H04B 7/24를 포함하는 특허로 된 특허군(물론, H04B 7/24를 Parent 특허 분류로 하는 Child 특허 분류가 있을 경우, 그 Child 특허 분류 모두를 포함하는 특허로 된 특허군을 포함한다. 이는 특허 분류의 계층 구조의 속성상 당연할 것이다.)로 생성되는 특허군 또는 기 설정된 조건(특정 기간, 특정 특허 분류, 또는 특정 검색어 또는 기타 조건)을 충족하는 특허군 각각에 대하여, 기 설정된 분쟁 예측 요소별 분쟁 예측 요소값을 생성한다.

분쟁 예측 요소와 분쟁 예측 요소 후보와의 관계에 대해서 설명한다. 분쟁 예측 요소 후보는 본질적으로 분쟁 예측 요소가 된다. 분쟁 예측 요소 후보를 대상으로 분쟁 예측 모델을 생성했을 때, 그 분쟁 예측 모델에 기여하는 바가 없거나, 기 설정된 수준 이하가 되는 분쟁 예측 요소 후보는 버릴 수 있고, 남은 것들이 분쟁 예측 요소가 될 수 있다. 하지만, 기여하는 바가 아주 미미하거나(모델의 생성에서 분쟁 예측 요소별로 모델에 대한 기여도가 순수하게 0인 경우는 통상적으로 없으며, 아주 미미한 경우가 대부분이다.) 기 설정된 수준 이하가 되는 분쟁 예측 요소를 분쟁 예측 모델에 포함시켜도 그러한 분쟁 예측 요소는 기여도(중요도)가 작으므로, 그러한 분쟁 예측 요소가 포함되어 있어도 분쟁 예측 모델값은 거의 달라지지 않는다. 따라서, 모든 분쟁 예측 요소 후보는 분쟁 예측 요소가 될 수 있다. 기여도(중요도)가 미미한 분쟁 예측 요소가 포함되는 경우에는 이러한 분쟁 예측 요소에 대해서도 분쟁 예측 요소값을 생성하고, 모델 생성에 반영해야 하고, 분쟁 예측 모델값을 생성하는데 이러한 분쟁 예측 요소에 대한 분쟁 예측 요소값을 반영해야 하므로, 컴퓨팅 파워의 소모 면에서 비경제적, 비효율적이 되는 면이 있으나, 컴퓨팅 파워가 충분하다면 많은 분쟁 예측 요소를 사용하는 것도 바람직한 방법이 될 수 있다.

상기 표 1 내지 표 4에 나타나는 분쟁 예측 요소에 대하여 사전에 기초적인 사전 통계 분석을 수행할 수 있다. 상기 분쟁 예측 모델 생성 엔진(5500)은 상기 분쟁 예측 요소 중 어느 하나 이상에 대하여, 분쟁 특허 집합과 비분쟁 특허 집합별로 상기 각 특허 집합에 속하는 개별 특허에 대하여 상기 분쟁 예측 요소값에 대한 기 설정된 통계량 및 통계 처리 정보를 생성한다. 상기 통계량은 상기 분쟁 예측 요소값의 평균, 분산, 표준편차, 분포 속성 등에 대한 수치값이며, 상기 통계 처리 정보에는 통계 분석에 대한 비교 그래프 등과 같은 시각화된 정보가 포함될 수 있다. 특정한 분쟁 예측 요소에 있어서, 분쟁 특허 집합에 대한 분쟁 예측 요소값과 비분쟁 특허 집합에 대한 분쟁 예측 요소값이 같거나 극히 유사한 경우에는 이러한 분쟁 예측 요소는 분쟁 예측 모델의 생성에 처음부터 배제시킬 수도 있다.(후보 단계에서 탈락시킴)

이어, 상기 분쟁 예측 요소값 생성부(5510)가 생성하는 분쟁 예측 요소값을 사용하여 분쟁 예측 모델을 생성하는 구체적 방법에 대하여 설명한다. 도 26에는 분쟁 예측 모델을 생성하는 일 실시예적 방법을 도시하고 있다. 상기 분쟁 예측 모델 생성 엔진(5500)은 적어도 한 종류 이상의 특허 분쟁에 사용된 특허를 포함하는 적어도 하나 이상의 분쟁 특허 집합과 적어도 하나 이상의 비분쟁 특허 집합을 입수(SL31)하고, 분쟁 특허 집합을 구성하는 적어도 2 이상의 분쟁 특허들과 비분쟁 특허 집합을 구성하는 적어도 2 이상의 비분쟁 특허들에 대하여 기 설정된 적어도 2 이상의 분쟁 예측 요소에 대한 분쟁 예측 요소값을 생성(SL32)하며, 분쟁 특허와 비분쟁 특허에 대하여, 분쟁 예측 요소값을 설명 변수값으로 하고, 분쟁 특허에 부여된 분쟁 특허 부여값과 분쟁 특허 부여값과 다르게 부여되며 비분쟁 특허에 부여된 비분쟁 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 기 설정된 적어도 하나 이상의 분쟁 예측 모델을 생성(SL33)한다. 이하, 분설한다.

분쟁 예측 모델의 생성을 위해 분쟁 특허 집합과 비분쟁 특허 집합을 생성이 우선적으로 진행된다. 분쟁 특허 집합은 분쟁을 일으킨 특허들로 구성되는 집합이다. 비분쟁 특허 집합은 분쟁을 일으키지 않은 특허들을 말하며, 분쟁을 일으키지 않은 특허들이 대다수이므로, 분쟁 예측 모델 생성에 사용되는 비분쟁 특허 집합은 샘플링을 통하여 별도로 구성된다. 전체 비분쟁 특허에 대하여 비분쟁 특허 집합의 생성을 위한 샘플링은 샘플 크기를 결정한 다음 1) 랜덤 추출, 2) 층화 추출, 3) 또는 기 설정된 통계학적 추출 방법을 사용한다. 비분쟁 특허 집합의 샘플 크기는 클수록 좋으나, 분쟁 특허 집합의 크기와 컴퓨팅 파워 등을 고려하여 결정하나, 분쟁 특허 집합의 크기보다 같거나 크게 설정할 필요가 있다. 층화 추출 방식을 선택할 경우, 비례 층화 추출이 타당한데, 비례 층화 추출은 상기 분쟁 특허군을 구성하는 분쟁 특허의 등록 연도나 출원 연도 등의 시간 분포 정보 및 특허 분류를 기준으로 하는 기술 분포 정보 중 어느 하나 이상을 고려하여 실행될 수 있다. 한편, 비례 층화 추출 시 특허 권리자가 분쟁을 다수 일으킨 경우, 그 권리자의 비분쟁 특허도 다수 추출할 수 있는 등과 같이 상기 분쟁 특허군을 구성하는 분쟁 특허의 권리자별 분쟁 특허수가 고려되는 층화 추출이 일부 실시될 수도 있고, 분쟁 발생 연도별 분쟁 특허 수를 일부 고려하는 층화 추출이 일부 실시될 수도 있을 것이다.

상기 분쟁 예측 모델 생성 엔진(5500)은 상기 분쟁 특허 집합과 상기 비분쟁 특허 집합을 각각 또는 서로 합친 다음 적어도 2 이상으로 분할하여, 분할된 제1 분쟁 특허 집합과 분할된 제1 비분쟁 특허 집합은 분쟁 예측 모델 생성용으로 사용하고, 분할된 제2 분쟁 특허 집합과 분할된 제2 비분쟁 특허 집합은 생성된 분쟁 예측 모델의 검증용으로 사용할 수 있다. 이때, 제1 분쟁 특허 집합과 제1 비분쟁 특허 집합의 크기가 제2 분쟁 특허 집합과 제2 비분쟁 특허 집합보다 큰 것이 바람직하다.

상기 분쟁 예측 요소값 생성부(5510)는 상기 분쟁 특허 집합과 상기 비분쟁 특허 집합을 구성하는 분쟁 특허와 비분쟁 특허에 대하여 분쟁 예측 요소별로 분쟁 예측 요소값을 생성하거나 입수한다.

상기 분쟁 예측 모델 생성부(5520)는 분쟁 특허 집합에 속하는 특허에 분쟁 특허 반응 변수값을 할당하고, 비분쟁 특허 집합에 속하는 특허에는 분쟁 특허 반응 변수값과 다른 비분쟁 특허 반응 변수값을 할당한다. 상기 분쟁 특허 반응 변수값을 할당하는 방법은 크게 1) 모든 분쟁 특허에 동일한 값을 대응시키는 방법, 2) 분쟁 특허의 속성에 따라 다른 값을 대응시키는 방법이 있다. 일반적으로 전자의 경우에는 통계 모델은 분류 모델을 사용하고, 후자의 경우에는 회귀 모델을 사용할 수 있으나, 후자의 경우에도 반응 변수의 설계에 따라 분류 모델이 사용될 수도 있다.

분쟁 특허의 속성에 따라 다른 반응 변수값을 대응시키는 방법은 1) 분쟁 특허의 분쟁 제기 회수를 반응 변수값으로 하는 방법, 2) 분쟁 특허의 분쟁 제기 회수를 기준으로 적어도 2 이상의 카테고리로 분류하고, 카테고리 값을 반응 변수값으로 하는 방법(예를 들면, 분쟁 제기 1회, 2회 이상으로 2분화 하는 방법이나 분쟁 특허별로 분쟁 회수의 분포를 고려하여 4분위로 4분화 하는 방법 등과 같은 n 분화 방법이 될 수 있다.), 3) 분쟁 특허의 분쟁 제기 회수 기준 n분위와 분쟁 제기 연도 기준 m 분위를 함께 고려하여 n*m개 셀로 구성된 매트릭스를 구성하고(각 셀의 분쟁 특허 개수는 최대한 동일하게 유지한다.) 각 셀별로 반응 변수값을 대응시키는 방법 등이 될 수 있다. 한편, 분쟁 특허 중 2심 이상과 관련된 분쟁 특허는 심급별로 독립된 분쟁으로 보아 분쟁 회수를 증가시키는 방법 또는 심급에 따라 다른 반응 변수값을 대응시키는 방법 등이 채용될 수 있을 것이다.

한편, 광의의 분쟁 특허 중에는 준분쟁 특허가 있을 수 있다. 준분쟁 특허는 분쟁에 준하는 특허로 1) 무효 심판이나 ITC 제소 등과 같은 비사법적인 행정적 분쟁과 관련된 제1종 준분쟁 특허, 2) 발송된 경고장에 포함된 특허나, 로열티 지급 요구를 받는 제2종 준분쟁 특허, 3) 로열티 지급 특허나 크로스 라이센스 체결 대상이 된 제3종 준분쟁 특허, 4) 기타 법률상의 권리 행사를 한 제4종 준분쟁 특허 등이 있을 수 있다. 상기 1)과 관련된 준분쟁 특허는 특허청이나 기타의 방법으로 데이터 수집이 상대적으로 용이한 반면, 2) 내지 4)는 사적인 영역에서 발생한 것으로 데이터 수집의 난감함이 있다. 하지만, 2) 내지 4)는 각 사용자별(예를 들면, 특정 기업 A를 위한 A에 특화된) 분쟁 예측 모델을 생성시킬 때는 각 사용자는 자신과 관련된 2) 내지 4)를 알 수 있으므로, 2) 내지 4)를 분쟁 예측 모델의 생성에 활용할 수 있을 것이다. 2) 내지 4)는 기업 맞춤형 분쟁 예측 모델의 생성에 중요하게 활용될 수 있다.

상기 준분쟁 특허에도 분쟁 특허(사법적 분쟁이 발생한 특허)과 동일한 반응 변수값을 대응시키는 방법과 분쟁 특허와 다른 반응 변수값을 대응시키는 방법이 있을 수 있는데, 후자가 상대적으로 더 바람직하다. 반응 변수값 대응의 가장 간단한 일례로, 분쟁 특허와 준분쟁 특허에는 모두 1을, 비분쟁 특허에는 모두 0을 대응하는 방법이 있을 수 있을 것이다.

상기 분쟁 예측 모델 생성부(5520)는 상기와 같이 분쟁 특허와 비분쟁 특허에 대한 설명 변수값인 분쟁 예측 모델별 분쟁 예측 모델값과 반응 변수값이 대응되게 되면, 상기 설명 변수값과 반응 변수값을 대상으로 기 설정된 적어도 하나 이상의 통계적 모델링 기법을 적용하여 분쟁 예측 모델을 생성하게 된다.

분쟁 특허와 준분쟁 특허에는 반응 변수값으로 모두 1을, 비분쟁 특허에는 모두 0이 대응되는 경우, 분쟁 예측 모델을 생성하는 것은 전형적인 분류(classification) 모델을 생성하는 것이 된다. 상기 분쟁 예측 모델 생성부(5520)가 분류 모델을 생성하는 방법은 다양한 통계적 기법이 동원될 수 있으며, 이러한 통계적 기법은 모두 본 발명에서 채용될 수 있으며, 본 발명의 통계적 처리 방법에 포함되며, 이러한 통계적 기법에 대해 상세히 설명하지 않는다고 하여 본 발명에서 배제하는 것은 아님은 분명할 것이다.

본 명세서에서는 분류 모델의 생성 방법의 한 예로 기계 학습 기법 트리(tree)를 바탕으로 한 앙상블(ensemble) 기법 중 부스팅(boosting) 기법을 사용하여 분류 모델을 생성하는 방법에 대해 상세하게 설명한다.(앙상블 기법을 사용하는 다른 방법으로 random forest 기법이 있다.) 도 27은 Gradient Boosting algorithm 알고리즘에 대한 요약을 설명하는 도면이며, 도 28은 Friedman(2002)이 새로이 stochastic gradient boosting algorithm을 제안한 알고리즘에 대한 요약을 설명하는 도면이며, 도 29는 본 발명의 특허 분쟁 예측 정보 생성 시스템(5000)의 분쟁 예측 모델 생성 과정에 관한 일 실시예적 개념을 설명하는 도면이다.

이어, 도 29 및 도 31을 참조하면서, 본 발명의 분쟁 예측 모델 생성부(5520)의 정보 처리 방법을 상세하게 설명한다. 상기 분쟁 예측 모델 생성부(5520)는 분쟁 특허들과 비분쟁 특허들에 대하여, 설명 변수인 분쟁 예측 요소별 분쟁 예측 요소값 생성(SLBO11)하고, 분쟁 특허에 분쟁 특허 대응 반응 변수값 설정하고, 비분쟁 특허에 비분쟁 특허 대응 반응 변수값 설정(SLBO12)한다. 이어, 상기 분쟁 예측 모델 생성부(5520)는 설명 변수들 중 어느 하나 이상에 대한 제1 스텀프를 생성(SLBO13)하고, 생성된 제1 스텀프로 구성된 제1 스텀프 집합으로 분쟁 예측 모델값을 생성(SLBO14)하고, 분쟁 예측 모델값을 검증(SLBO15)한다. 검증 결과 기 설정된 기준을 충족(SLBO16)하지 못하면, 트리 중요도 결정 후 오분류 특허 대상 가중치를 조절(SLBO17)하고, 설명 변수에 대한 제2 스텀프를 생성하고, 제1 스텀프 및 제2 제 2 스텀프로 분쟁 예측 모델값을 생성하고 분쟁 예측 모델값을 검증하고, 검증 결과 기 설정된 기준을 충족할 때까지 스텀프의 생성과, 생성된 스텀프들을 사용하여 분쟁 예측 모델값의 생성 및 분쟁 예측 모델값의 검증을 반복한다. 검증 결과 기 설정된 기준을 충족하는 경우, 그때까지 생성된 스텀프들을 접합하여 분쟁 예측 모델 결정(SLBO18)한다.

상기 분쟁 예측 모델 생성부(5520)는 설명 변수별로 스텀프(stump)를 생성한다. 경우에 따라서 스텀프 말고도 일반적인 트리(tree)를 사용할 수도 있다. 상기 분쟁 예측 모델 생성부(5520)는 분쟁 특허 집합을 구성하는 분쟁 특허와 비분쟁 특허 집합을 구성하는 비분쟁 특허의 설명 변수값을 분석하여 중요한 분쟁 예측 요소가 포함된 적어도 하나 이상의 스텀프를 생성한다. 스텀프는 1) 분쟁 예측 요소, 2) 분기(split) 지점, 3) 좌측 노드 예측값, 4) 우측 노드 예측값, 5) 분기 적용 불가 시의 예측값 등과 같이 5가지 정보를　 포함하여 구성된다. 분기를 생성하는 규칙(rule)은 주어진 손실 함수(Loss Function)를 최소화 하도록 분기 기점과 예측값을 찾도록 하는 것이 바람직하다. 상기의 경우, Loss Function 으로 Deviance나 Exponential loss 함수 등을 사용할 수 있다.

도 32는 생성된 스텀프의 일례를 보여 주고 있으며, 하기 표 5는 상기 스텀프 정보의 일례를 보여 주고 있다.

	SplitVar	SplitCodePred	LeftNode	RightNode	MissingNode	ErrorReduction	Weight	Prediction
0	11	0.5	1	2	3	802.9285468	22666	0.000128321
1	-1	0.007353469	-1	-1	-1	0	13327	0.007353469
2	-1	-0.010182157	-1	-1	-1	0	9339	-0.010182157
3	-1	0.000128321	-1	-1	-1	0	22666	0.000128321

상기 표 5에서 SplitVar는 분기되는 설명 변수(분쟁 예측 요소)를 말하며, 11이란 값은 11번째 설명 변수를 말한다. SplitCodePred는 설명 변수가 분기되는 분기 지점을 말하며, 0.5는 분기 지점값을 말한다. LeftNode는 좌측 노드를 표시하는 것으로 1이 대응되어 있으며, 1로 시작하는 세번째 행은 좌측 분기 시에 대한 정보를 알려 준다. 좌측 분기 시는 X11 <= 0.5인 경우로, 이 경우의 예측값은 0.007353469로 되며, 도 32에서는 0.007353을 표시되어 있다. RightNode는 우측 노드로 네번째 행에 이 경우의 정보값이 나타나 있으며, MissingNode는 분기 적용 불가(missing) 시에 대한 것으로 다섯번째 행에 이 경우의 정보값이 나타나 있다.

하기 표 6은 상기 표 5의 정보를 포함하여 다수의 스텀프가 생성되는 예시를 보여 준다.

SplitVar	SplitCodePred	LeftNode	RightNode	MissingNode	ErrorReduction	Weight
11	0.5	1	2	3	802.9285	22666
-1	0.007353	-1	-1	-1	0	13327
-1	-0.01018	-1	-1	-1	0	9339
-1	0.000128	-1	-1	-1	0	22666
11	0.5	1	2	3	773.5689	22666
-1	0.007046	-1	-1	-1	0	13238
-1	-0.01016	-1	-1	-1	0	9428
-1	-0.00011	-1	-1	-1	0	22666
11	0.5	1	2	3	785.034	22666
-1	0.007055	-1	-1	-1	0	13242
-1	-0.0103	-1	-1	-1	0	9424
-1	-0.00016	-1	-1	-1	0	22666

표 6에서 알 수 있듯이, 4개의 행이 하나의 스텀프에 대응된다. 상기 표 6에서는 설명 변수 11번에 대하여 적어도 3개 이상의 스텀프가 생성되고 있음을 보여 준다. 이와 같이 하나의 설명 변수에 대하여 하나 이상의 스텀프가 생성되는 경우가 다수 있게 된다.

상기 분쟁 예측 모델 생성부(5520)는 최초 스텀프 S1를 적용하여 분쟁 특허의 분쟁 예측 요소값과 비분쟁 특허의 분쟁 예측 요소값을 사용하여 분쟁 특허 집합의 분쟁 특허와 비분쟁 특허 집합의 비분쟁 특허별로 예측값(S1이 적용된 상기 3) 좌측 노드 예측값, 상기 4) 우측 노드 예측값 또는 상기 5) 분기 적용 불가 시의 예측값 중 어느 하나가 예측값이 된다.)을 생성한다. 최초 스텀프 S1은 최초의 분쟁 예측 모델 후보가 된다. 예측값은 모델 생성에 사용된 분쟁 특허와 비분쟁 특허마다 생성될 것이다. 이때, 상기 분쟁 예측 모델 생성부(5520)는 상기 분쟁 특허에 대한 반응 변수값과 분쟁 특허에 대한 예측값, 비분쟁 특허에 대한 반응 변수값과 비분쟁 특허에 대한 예측값을 분석하여 오분류율과 같은 예측 오류 정보를 생성해 낸다. 상기 분쟁 예측 모델 생성부(5520)는 tree의 중요도를 결정 후 잘못 분류한 분쟁 특허와 잘못 분류한 비분쟁 특허에 대하여 가중치(weight)을(강제적으로) 높이는 방법(예를 들면 빈도(frequency)를 높이는 등, 예를 들어 특정 특허 Pi가 분쟁 특허인데, 비분쟁 특허로 분류하면, Pi의 빈도를 1에서 그 이상으로 높임)을 사용하여 분쟁 특허 집합 데이터와 비분쟁 특허 집합 데이터를 재조정한다. 상기 재조정된 분쟁 특허 집합과 비분쟁 특허 집합에 대하여 두번째 스텀프인 S2를 생성해 낸다. 두번째 분쟁 예측 모델 후보는 S1과 S2로 이루어 진다. 이때, 상기 분쟁 예측 모델 생성부(5520)는 S1rhk S2를 적용하여 분쟁 특허와 비분쟁 특허의 예측값을 생성해 낸다. 상기 분쟁 특허와 상기 비분쟁 특허에 대하여, 분쟁 특허의 반응 변수값 및 비분쟁 특허의 반응 변수값과 S1과 S2로 구성되는 두번째 분쟁 예측 모델 후보가 생성한 예측값인 분쟁 예측 모델값을 비교 분석하여 예측 오류 정보를 생성한다. 상기 생성된 예측 오류 정보를 고려하여 분쟁 특허와 비분쟁 특허 데이터를 재조정한다. 상기와 같이 i 번째 스텀프 집합(SSi, ith Stump Set, S1 ~Si의 스텀프로 구성되는 집합으로 i번째 분쟁 예측 모델 후보가 된다.)으로 분쟁 특허 집합과 비분쟁 특허 집합을 구성하는 각 특허 Pi를 대상으로 예측값을 생성하고, 생성된 예측값과 Pi의 반응 변수값을 비교하여 오류 예측 정보를 생성하고, 생성된 오류 예측 정보를 참조하여 상기 분쟁 특허 집합 데이터와 비분쟁 특허 집합 데이터를 재조정하여 S_i ₊₁을 생성하고 i+1번째 스텀프 집합을 사용하는 i+1번째 분쟁 예측 모델 후보가 생성되게 된다.

상기와 같은 과정을 통하여 상당히 큰 n개의 스텀프 S1, S2, , Sn로 구성되는 스텀프 집합이 생성된다. 상기 각 스텀프 Si에 대하여, 1) 분쟁 예측 요소, 2) 분기(split) 지점, 3) 좌측 노드 예측값, 4) 우측 노드 예측값, 5) 분기 적용 불가 시의 예측값이 대응되게 된다. n개의 Si별 상기 1) 내지 5)가 분쟁 예측 모델 후보가 된다.

상기 분쟁 예측 모델 후보가 있는 경우, 상기 분쟁 예측 모델 후보를 사용하는 방법은 다음과 같다. 상기 분쟁 예측 모델 생성부(5520)는 임의의 특허 Pi에 대하여, Pi의 분쟁 예측 요소별 분쟁 예측 요소값을 상기 분쟁 예측 모델 후보에 입력한다. 상기 분쟁 예측 모델 생성부(5520)는 분쟁 예측 요소별로 분쟁 예측 요소값을 해당되는 적어도 하나 이상의 스텀프(아주 특별한 경우에는 해당되는 스텀프가 없을 수도 있으며, 이 경우 그 분쟁 예측 요소는 모델에서 사용되지 않는 분쟁 예측 요소가 된다.)별로 적용하여 스텀프별로의 예측값을 생성한다. 예측값은 상기 3) 좌측 노드 예측값, 상기 4) 우측 노드 예측값 또는 상기 5) 분기 적용 불가 시의 예측값 중 어느 하나가 된다. 생성된 예측값을 모든 스텀프에 대하여 합산하면 분쟁 예측 모델값이 생성되게 된다. 즉, 상기 분쟁 예측 모델 생성부(5520)는 상기 분쟁 예측 요소 후보인 스텀프 집합에 Pi의 분쟁 예측 요소별 분쟁 예측 요소값을 적용하여 생성되는 모든 예측값을 합산하는 방식으로 Pi별로 분쟁 예측 모델값을 생성한다. 분쟁 특허 반응 변수값을 1로 하고, 비분쟁 특허 반응 변수값을 0으로 할 경우, Pi별 분쟁 예측 모델값은 0에서 1사이 값이 된다. 이때, Pi의 분쟁 예측 모델값이 0.5를 기준으로 0.5 미만이면 Pi를 비분쟁 특허로 예측하는 것으로 하고, 0.5 이상이면 분쟁 특허로 예측하는 것으로 분류할 수 있다. 한편, Pi는 분쟁 특허이거나 비분쟁 특허이므로 Pi에 대응되는 반응 변수값이 참값이 되고, 이 참값과 예측값은 차이가 있게 되는 것이 일반적이다.

이어, 상기 분쟁 예측 모델 생성부(5520)가 최적 또는 타당성 높은 분쟁 예측 모델을 생성하는 방법에 대해 설명한다. n개의 스텀프를 사용하는 분쟁 예측 모델 후보가 있을 경우, 분쟁 예측 모델을 생성하는 것은 교차 검증(Cross Validation)을 통해서 생성한다. 통상적으로 n이 클수록 분쟁 예측 모델 후보를 생성하는 train set(분쟁 특허와 비분쟁 특허로 구성됨)에서의 예측 성능은 높아지나, n이 과도하게 커지면 과적합(over fitting)이 발생하여 test set(분할된 제2 분쟁 특허 집합과 분할된 제2 비분쟁 특허 집합이 생성된 분쟁 예측 모델 후보의 검증에 사용되면 이들이 test set이 될 수 있다.)에서의 예측 성능이 낮아지는 문제가 있게 된다. 따라서, 적정한 크기의 n을 결정하는 것이 중요하게 된다. 상기 분쟁 예측 모델 생성부(5520)는 생성된 분쟁 예측 모델 후보 M1, M2, , Mi에 대하여, test set에 포함되는 개별 특허 Pi에 대하여 분쟁 예측 모델값 Mi(Pi)를 생성한다. Mi(Pi)란 분쟁 예측 모델 후보 Mi에 Pi의 분쟁 예측 요소별 분쟁 예측 요소값을 적용하여 생성된 예측값을 말한다. 한편, 상기 Pi의 반응 변수값을 Y(Pi)라 한다. 상기 반응 변수값이 O과 1인 경우, Y(Pi)는 0 또는 1이 된다. 이어, 상기 분쟁 예측 모델 생성부(5520)는 test set을 구성하는 모든 특허 Pi에 대하여 Y(Pi), Mi(Pi) 값을 구하고 이 값들을 주어진 손실함수에 대입하여 그 합을 최소로 하는 Mi를 선정한다.

도 30에는 과적합의 개념이 표현된 개념도를 예시하고 있다. 도 30에서 붉은색 점과 푸른색 점을 구분하는 모델의 생성에서, 녹색 선과 같은 모델을 생성하면, train set에서는 굉장이 잘 구분하지만, 이런 경우 모델 생성에 참여하지 않은 test set에서는 오히려 예측 성능이 떨어지는 문제가 있게 된다. 이때, 검은색 선과 같은 모델을 생성하면 적정한 분류 모델이 되게 된다.

이어, shrinkage parameter에 대해서 설명한다. 상기 tree의 중요도를 결정하는 것은 tree 중요도 결정 알고리즘이 수행하는데, tree 중요도 결정 알고리즘에서 나온 tree 중요도 결정값에 shrinkage parameter를 곱하는 등과 같이 shrinkage parameter를 예측 모델 생성에 도입하면 모형의 성능이 좋아지게 된다. 상기 tree 중요도 결정 알고리즘에서 tree 중요도는 상기 분쟁 예측 요소별로 분기 지점을 변동시켜 가면서 교차 검증(Cross validation) 과정을 실행하면서 결정된다.

상기 분쟁 예측 모델 생성부(5520)가 분쟁 예측 모델을 생성할 때, 분쟁 특허 집합의 크기가 충분히 큰 경우에는(전체 특허 중 분쟁이 발생하지 않은 특허가 대다수이므로, 비분쟁 특허 집합의 크기는 충분히 크게 할 수 있다.) 상기 분쟁 특허 집합을 분할해도 되지만, 크기가 충분하지 않을 경우에는 n-fold Cross validation 기법을 사용할 수 있다. 도 33은 5-fold Cross validation 기법을 도식적으로 보여 주고 있다. 상기 분쟁 예측 모델 생성부(5520)는 분쟁 특허와 비분쟁 특허가 섞여 있는 자료를 5개의 집합으로 나눈 다음 각각의 경우마다 4개의 집합으로 모형을 구축하고 나머지 하나의 집합으로 test error을 구해서 이 오류가 가장 작은 모형을 선택하는 방법과 같이 n-fold Cross validation 방법을 실시할 수 있다.

상기에서는 2개의 범주에 대한 분류 모델에 대해서 설명하였다. 한편, n개의 범주(비분쟁, 분쟁, 다분쟁 등)에 대해서도 상기와 같은 분류 모델 방법이 적용될 수 있을 것이다. 분쟁 특허가 분쟁을 제기한 회수를 기준으로 1~기 설정된 값의 범위를 가지는 경우 분쟁으로 분류하고, 기 설정된 값을 초과할 경우에는 다분쟁으로 분류할 수 있을 것이다. 이 경우, 비분쟁에 대하여 반응 변수값을 0, 분쟁에 대해서는 1, 다분쟁에 대해서는 2를 대응시킬 수 있을 것이다. 이때, 상기 2는 숫자적 의미의 2라기 구분되는 범주로서 비분쟁도 아니면, 분쟁과는 다른 별개의 속성을 가지는 분류 집단으로 취급되는 것이 더 타당할 것이며, 2가 아닌 3이나 다른 수치값이 반응 변수값으로 할 수도 있을 것이다. 이 경우 반응 변수를 벡터로 표현할 수도 있다. 이를테면(1, 0, 0)인 자료는 반응변수가 첫 번째 범주에 속하는 자료를(0, 1, 0)인 자료는 반응변수가 두 번째 범주에 속하는 자료를 나타낸다.

이어, 도 34를 참조함녀서, A, B, C 3개의 범주를 대상으로 분류 모델의 생성 방법으로 n개의 분류 모델을 상기 분쟁 예측 모델을 생성하는 방법에 대해서 설명한다. 상기 도 32에서와는 달리 범주가 3개 이상인 경우는 각 범주마다 스텀프를 생성한다. 즉, A범주에 대한 스텀프, B범주에 대한 스텀프, C범주에 대한 스텀프를 각각 생성한다. 그 후 각각의 스텀프로부터 해당 범주에 속할 확률을 계산하여 확률이 가장 큰 범주로 각각의 자료를 할당한다. 예를 들어, 특정 자료 하나를 3개의 스텀프에 대입하여 각각의 예측값이-0.567, 0.456, 0.234 가 나왔다고 하면 범주B에 대한 예측값이 가장 크므로 이 자료는 B범주에 속할 확률이 가장 높다. 따라서 이 자료는 B범주로 분류하게 된다.

이어, 도 35를 참조하면서, 회귀(regression) 모델에 대해 설명한다. 회귀 모델은 반응 변수값이 연속형일 경우에 사용되는 통계 모형이다. 상기 분쟁 특허를 준분쟁 특허와 분쟁 특허로 대별하고, 준분쟁 특허는 분쟁과 관련하여 분쟁 특허에 비해 기 설정되는 중요도(예를 들어, 70%)를 가진다고 가정할 수 있다. 이 경우, 비분쟁 특허에 0, 준분쟁 특허에 0.7, 분쟁 특허에 1이라는 반응 변수값을 할당할 수도 있으며, 비분쟁 특허에 0, 준분쟁 특허에 1.4, 분쟁 특허 2라는 값을 할당할 수도 있을 것이다. 한편, 다분쟁 특허에 대하여, 분쟁마다 1을 할당할 수도 있을 것이며, 이 경우, 비분쟁 특허에 0, 1회 분쟁 제기 특허 1, 2회 분쟁 제기 특허 2, .., n회 분쟁 제기 특허는 n이라는 반응 변수값을 할당할 수 있을 것이다. 한편, 분쟁 회수를 n개의 범주로 구획하고, 각 범주에 대하여 1회 분쟁 제기 특허에 대한 기 설정된 중요도값(2~5회는 2, 6~20회는 3, 20회 초과는 3 등)을 할당하는 경우, 비분쟁 특허에 0, 1회 분쟁 제기 특허 1, 2~5회 분쟁 제기 특허는 2, 6~20회 분쟁 제기 특허는 3, 20회 초과 분쟁 제기 특허는 3이라는 값을 반응 변수값으로 할당할 수 있을 것이다. 한편, 준분쟁 특허에 대해서는 0.7과 같은 값을 할당할 수 있을 것이며, 준분쟁의 종류별로 중요도를 다르게 취급할 경우, 준분쟁 특허의 종류별로 다른 반응 변수값을 할당할 수 있을 것이다.

회귀 모델에서 분쟁 예측 모델을 생성하는 방법 또한 도 32에서와 같이 분류문제에서 사용한 것과 동일한 스텀프를 사용할 수 있다. 다만, 이 때 사용되는 손실함수는 이항분포의 우도함수로부터 유도된 deviance 함수가 아닌 정규분포로부터 유도된 최소제곱오차를 사용한다. 그리고 예측값의 의미 또한 달라지는데 분류 문제에서의 예측값은 해당 자료의 반응 변수 값이 1일 확률과 관련되 수치이지만 회귀 모형에서의 예측값은 반응변수 자체에 대한 예측값이라고 할 수 있다. 도 35에서, 설명 변수 X3에 대하여, 이 스텀프는 X3의 값이 18.6을 기준으로 분기 되고, 각 분기에 따른 예측값이 표시되어 있음을 알 수 있다.

회귀 문제에서 스텀프를 만드는 방법은 분류 문제와 전혀 다르지 않다. 다만 사용하는 손실 함수만 바뀌게 되고 바뀌 손실함수에 따라서 최적의 스텀프가 생성된다. 분류문제에서는 이항분포의 우도함수에 기반한 손실함수를 사용하고 회귀문제에서는 최소제곱오차를 손실함수로 사용한다. 그리고 예측값의 의미 또한 달라지는데 회귀 문제에서의 예측값은 반응 변수 자체를 예측한 것이고 분류 문제에서의 예측값은 반응 변수가 1을 값을 가질 확률과 관련된다.

한편, 상기 회귀 모델의 특수한 경우로서, 분쟁 특허만을 대상으로 한 분쟁 특허 중에서의 재분쟁 예측 모델을 생성할 수 있을 것이다. 이 경우, 샘플은 분쟁 특허로만 구성되고, 반응 변수값은 1) 분쟁 특허의 분쟁 제기 회수 또는 2) 재분쟁 제기 회수 또는 3) 분쟁 제기 회수의 범주 처리값 또는 4) 재분쟁 제기 회수의 범주 처리값이 된다. 1), 1회 분쟁 제기 특허는 1, 2회 분쟁 제기 특허는 2, n회 분쟁 제기 특허는 n이 반응 변수값으로 할당 될 수 있으며, 2) 1회 분쟁 제기 특허는 0, 2회 분쟁 제기 특허는 1, n회 분쟁 제기 특허는 n-1이 반응 변수값으로 할당 될 수 있으며, 3)의 예를 든다면, 1회 분쟁 제기 특허는 1, 2회~5회 분쟁 제기 특허는 2, 6~20회 분쟁 제기 특허는 3, 20를 초과하는 분쟁 제기 특허는 4가 반응 변수값으로 할당 될 수 있으며, 4)의 예를 든다면 1회 분쟁 제기 특허는 0, 2회~5회 분쟁 제기 특허는 1, 6~20회 분쟁 제기 특허는 2, 20를 초과하는 분쟁 제기 특허는 3이 반응 변수값으로 할당될 수도 있을 것이다.

상기 분쟁 예측 모델 생성부(5520)는 상기와 같은 반응 변수값으로 분쟁 특허 집합을 구성하는 분쟁 특허 Pi의 분쟁 예측 요소별 분쟁 예측 요소값으로 상기 분쟁 예측 모델의 생성에 대한 정보 처리 방법과 동일한 방법으로 재분쟁 예측 모델을 생성한다. 상기 재분쟁 예측 모델로 생성되는 값은 재분쟁 예측 모델값이 된다. 이 재분쟁 예측 모델이 필요한 이유는 사용자가 관심이 있는 특허가 재분쟁을 일으킬 것인지를 판단하거나, 얼마나 많은 분쟁을 일으킬 지를 판단하는데 활용될 수 있을 것이다.

한편, 상기에서 상기 분쟁 예측 모델 생성부(5520)는 분쟁의 발생 여부나 분쟁의 발생 회수를 중심으로 하는 분쟁 예측 모델의 생성에 대해 설명하였다. 이어, 상기 분쟁 예측 모델 생성부(5520)의 분쟁 제기 시점을 중심으로 하는 분쟁 시점 예측 모델의 생성 방법에 대해 설명한다. 분쟁 시점의 예측이란 특정 특허 Pi의 분쟁 예측 요소값으로 어느 시점에 분쟁을 제기하느냐를 예측하는 것이다.

이어, 도 36을 참조하면서, 본 발명의 특허별 분쟁 예측 모델값 생성부(5530)에 대하여 설명한다. 상기 특허별 분쟁 예측 모델값 생성부(5530)는 분쟁 예측 모델값을 생성하려는 특허를 입수(SL41)하고, 입수된 특허의 분쟁 예측 요소값을 생성 또는 입수(SL42)하고, 특허의 분쟁 예측 요소값을 분쟁 예측 모델에 입력하여 특허의 분쟁 예측 모델값을 생성(SL43)하고, 생성된 특허의 분쟁 예측 모델값 저장(SL44)한다.

상기 특허별 분쟁 예측 모델값 생성부(5530)는 Pi에 분쟁 예측 모델을 적용하여 분쟁 예측 모델값을 생성하는 기능을 수행한다. 상기 특허별 분쟁 예측 모델값 생성부(5530)는 분쟁 예측 모델의 생성에서도 기능할 수도 있으며(상기 분쟁 예측 모델 생성부(5520)에서도 Pi를 분쟁 예측 모델 후보를 적용하여 분쟁 예측 모델 후보에 대한 분쟁 예측 모델값을 생성하는 것을 설명한 바 있으며, 이 경우, 상기 특허별 분쟁 예측 모델값 생성부(5530)는 분쟁 예측 모델 생성부(5520)의 하위에서 작동하거나, 상기 분쟁 예측 모델 생성부(5520)가 특허별 분쟁 예측 모델값 생성부(5530)의 기능을 호출하여 사용할 수도 있다.) 분쟁 예측 모델 생성부(5520)와는 독립적으로 상기 분쟁 예측 모델 생성부(5520)가 생성한 분쟁 예측 모델을 사용하여 임의의 입력되는 특허 Pi별로 분쟁 예측 모델값을 생성하는데 사용될 수 있다. 상기 특허별 분쟁 예측 모델값 생성부(5530)는 특허 Pi에 대하여 분쟁 예측 요소값 생성부(5510)가 생성한 분쟁 예측 요소별 분쟁 예측 요소값을 분쟁 예측 모델(n개의 스텀프 집합으로 구성되는 SSn은 분쟁 예측 모델의 한 예가 된다. 다른 통계적 처리 기법을 사용하여 생성되는 분쟁 예측 모델도 본 발명의 분쟁 예측 모델이 된다.)에 적용하여 Pi의 분쟁 예측 모델값을 생성한다.

상기 분쟁 예측 모델값은 기 설정된 후처리를 거친 값이 될 수 있다. 이어, 상기 후처리에 대해서 설명한다. 모형을 구축할 때 사용한 자료(분쟁 특허 집합과 비분쟁 특허 집합)가 전체 모집단으로부터 랜덤하게 추출된 자료라면 상관이 없지만 그렇지 않은 경우에는 통계학적 후처리가 필요하다. 모집단(미국 특허의 경우, 약 400만 건)에서 분쟁 특허는 몇 만 건 정도 밖에 되지 않기 때문에 이러한 모집단에서 랜덤 표본(분쟁 특허 집합+비분쟁 특허 집합)을 사용하게 되면 표본의 크기가 아주 크지 않는 한 그 표본에 포함되는 분쟁 특허의 수가 굉장히 적기 때문에 좋은 모형을 만들기가 어렵게 된다. 샘플에 분쟁 특허를 가능한 한 많이 포함시켜 분석해서 그 특성을 제대로 파악하여야지 좋은 모형을 구축할 수 있으므로, case-control study 방법으로 자료를 분석하게 된다. 특허 자료의 경우 분쟁 특허에 대해서 이미 정보가 수집되어 있기 때문에 이와 대응되는 비분쟁 특허 자료만 임의로 추출하여 case-control study 방법으로 자료를 분석할 수 있다. 이 때 주의해야 할 점은 case-control 표본으로부터 얻은 점수는 원래 모집단에서 알고자 하는 점수가 아니기 때문에 원래 점수로 환원시켜 주는 절차가 필요하며, 이 경우 전체 모집단의 크기를 알아야 한다. 예를 들어, 미국 특허 자료의 경우 전체 모집단의 크기(약 400만 건)를 알기 때문에 Bayes 정리를 써서 쉽게 원래 점수를 구할 수가 있다. Bayes 정리로부터 유도 된 하기 수학식 1을 이용해서 상기 특허별 분쟁 예측 모델값 생성부(5530)는 최종적인 분쟁 예측 모델값(final score)를 구할 수가 있다. 하기 수학식 1 에서 n1은 표본의 분쟁 특허의 개수, n0는 표본의 비분쟁 특허의 개수, N1은 전체 분쟁 특허의 개수, N0는 전체 비분쟁 특허의 개수를 말한다. boosting score는 분쟁 예측 모델 생성부(5520)가 생성한 분쟁 예측 모델에 대하여 Pi에 대응되는 분쟁 예측 요소값을 적용한 분쟁 예측 모델값이 된다.

[수학식 1]

상기 수학식 1은 control 표본을 랜덤으로 추출하였을 경우 최종 점수를 구하는 방법이고 control 표본을 층화 추출 하였을 경우에는 식이 달라진다. 각 특허 분류를 기준으로 한 범주마다 그 크기가 다르고 분쟁 예측 모델값의 통계적 성질이 다르기 마련인데 이를 제대로 반영하기 위해서는 비분쟁 특허의 샘플링 시 분쟁 특허의 특허 분류에 대응되게 비분쟁 특허를 층화 추출하는 것이 고려된다. 각 특허 분류 범주마다 표본이 고르게 뽑힐 수 있도록 층화 추출을 이용한다. 층화 추출로 표본이 생성되었을 경우 최종 점수를 구하는 식은 하기 수학식 2와 같다. 여기서 s는 특허 분류 범주를 구분하는 인덱스이다. 예를 들면 n_1s는 s번째 특허 분류 범주에서 표본에 뽑은 분쟁 특허의 개수를 나타낸다.

[수학식 2]

상기와 같이 특허별 분쟁 예측 모델값 생성부(5530)는 특허별로 분쟁 예측 모델값을 생성한다. 한편, 상기 특허별 분쟁 예측 모델값 생성부(5530)는 특허 DB(1120)에 있는 모든 특허에 대하여 상기 분쟁 예측 모델값을 생성할 수 있을 것이며, 상기 특허 분쟁 예측 정보 생성 시스템(5000) 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 사용자가 지정하거나 관리하는 적어도 하나 이상의 특허로 구성되는 특허에 대하여 상기 분쟁 예측 모델값을 생성할 수 있을 것이다. 생성된 분쟁 예측 모델값은 상기 분쟁 예측 모델값 DB(5230)에 저장된다. 본 발명의 분쟁 예측 모델값 제공부(5540)는 외부로부터 적어도 하나 이상의 특허에 대한 분쟁 예측 모델값의 요청을 받는 경우, 상기 특허에 대한 분쟁 예측 모델값을 제공하는 기능을 수행한다. 상기 분쟁 예측 모델값 제공부(5540)는 사용자가 적어도 하나 이상의 특허를 선택하거나, 검색 결과 등으로 적어도 하나 이사의 특허 목록이 제시될 때, 상기 분쟁 예측 모델값 제공부(5540)는 상기 선택된 특허 또는 검색 결과에 분쟁 예측 모델값이 포함되도록 분쟁 예측 모델값을 제공할 수 있을 것이다.

이어, 도면을 참조하면서, 상기 분쟁 예측 모델을 통하여 분쟁 예측 정보를 생성하는 방법에 대해서 설명한다.

상기 분쟁 예측 엔진(5100)은 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 먼저 입수하고 자기 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하거나, 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 자기 특허 집합을 입수(SL51)한다. 이어, 상기 분쟁 예측 엔진(5100)은 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수(SL52)하고, 상기 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 분쟁 예측 정보를 생성(SL53)한다. 이하 분설한다.

먼저 자기 특허 집합(Self Set, SS)을 정의한다. 자기 특허 집합은 시스템의 기 설정된 입력 또는 사용자가 분쟁 예측 정보의 생성을 위하여 입력하는 입력에 대응되는 적어도 하나 이상의 특허를 포함하는 특허군으로 특정되는 특허 집합을 말한다. 상기 입력은 적어도 하나 이상의 특허 입력, 적어도 하나 이상의 권리자 입력, 적어도 하나 이상의 발명자 입력, 적어도 하나 이상의 특허 분류 입력 및 적어도 하나 이상의 검색식 입력 중 어느 하나 또는 어느 하나 이상의 조합인 것일 수 있다. 상기 검색식은 특허 DB(1120) 상에 저장된 특허를 호출할 수 있는 모든 필드에 대한 필드별, 필드 조합별 검색식을 당연히 포함하며, 특정 필드에 대한 검색 키워드의 입력을 당연히 포함한다. 예시적으로 사용자는 자사의 기술 분야 트리(tree), 국내, 또는 해외 또는 국가별 경쟁사나 유관 기업 트리, 자사 제품과 관련된 기능에 대응되는 기술 분야별 트리, 자사가 관리하는 적어도 하나 이사의 특허군에 대한 트리, 자사가 관심 있는 특허군을 호출할 수 있는 검색식 트리를 생성할 수 있으며, 각 트리의 종단 노드(end node)에는 사용자의 입력 또는 조건 또는 개별 특허 문건들이 대응되어 있을 수 있다. 상기 트리는 적어도 1개 계층 이상의 다단 트리일 수 있음은 당연할 것이다. IPC 계층 구조는 상기 다단 트리의 대표적인 예시가 된다. 상기 SS를 생성하는 것은 본 발명의 자기 특허 집합 생성부(5110)가 수행한다.

자기 특허 집합은 상기 사용자 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)이 생성하거나 선택하거나 지정하는 적어도 하나 이상의 공개 또는 등록 특허로 구성되는 특허 집합이다.상기 분쟁 예측 엔진(5100)의 자기 특허 집합 생성부(5110)는 적어도 하나 이상의 특허로 구성되는 자기 특허를 생성하거나 입수하여 자기 특허 집합을 구성한다. 상기 자기 특허 집합의 생성은 검색 엔진이나 DBMS를 통한 검색을 통해서 생성될 수도 있으며, 사용자가 저장하고 있는 적어도 하나 이상의 특허 집합 또는 상기 특허 집합의 연산 결과로 생성되는 특허 집합에 대한 지정 또는 상기 특허 집합에 포함된 적어도 하나 이상의 특허에 대한 지정을 통하여도 생성될 수 있다. 상기 자기 특허 집합은 상기 사용자의 소속 기관이 보유하는 특허일 필요는 없으며, 사용자가 관심을 가지고 지정하거나 선택하는 특허이면 충분하다. 상기 사용자는 다단계 계층 구조의 트리(tree) 방식으로 자신이 관심을 가지는 특허를 관리할 수 있을 것이다. 상기 트리를 구성하는 각 노드는 노드 명칭을 가지며, 각 노드에는 적어도 하나 이상의 특허들이 대응되어 있다.

상기 SSi를 도입하는 이유는 다음과 같다. 특허 분쟁은 본질적으로 원고의 특허권과 피고의 기계, 제품, 방법, 조성물(이하, 제품이라 한다)과의 관계의 문제이며, 원고의 특허와 피고의 특허 간의 문제가 아니다. 이에 따라, 피고의 제품을 시스템이 처리할 수 있는 데이터로 투사 또는 투영시키는 것이 필요하게 된다. 이에 따라, 본 시스템의 사용자는 자신이 관심이 있는 제품과 관련된 특허군을 시스템이 이해할 수 있도록 입력할 필요가 있게 된다. 상기 제품과 관련된 특허군의 입력의 예는 1) 자사의 제품의 기능, 구조, 방식, 재질 등 제품에 반영된 기술 중 특허화된 기술이 있는 경우, 그 특허들의 입력, 2) 자사의 특허가 없거나 부족한 경우, 자사의 제품과 관련된 타사의 특허, 3) 자사의 제품과 관련된 타인의 특허, 4) 자사의 제품과 관련된 기술 분야의 특허 분류 입력, 5) 자사의 제품과 관련된 특허를 검색할 수 있는 검색식의 입력 중 어느 하나 이상 또는 어느 하나 이상의 조합의 입력을 통하여 제품과 관련된 특허군을 특정할 수 있게 된다. 시스템은 직접적인 제품이 아닌, 제품이 투영된 특허군으로 특허 분쟁 예측 정보를 생성하게 된다.

상기 사용자가 상기 SS를 설정할 때도, 상기 SSi에 대하여 주관적인 가중치를 설정할 수 있다. 상기 가중치의 설정은 본 발명의 가중치 조절부(5143)에서 제공하는 UI를 통하여 수행한다. 상기 UI는 SS에 속하는 특허 리스트를 제공해 주고, 상기 특허 리스트에 사용자가 가중치나 중요도 또는 중요 등급을 입력할 수 있도록 하는 방식으로 수행한다. 이러한 가중치를 사용자 설정 SSi 가중치라 한다. 상기 사용자 설정 가중치는 상기 SSi로 생성되는 후술하는 TS에도 반영된다.

자기 특허 집합 SS에 속하는 특허를 SSi라 하자. 상기 SSi 개별 특허에 대하여 타겟 특허 집합(Target Set, TS)를 정의하자. TS는 사용자 또는 시스템이 SSi와 분쟁 예측 정보의 생성 목적으로 생성하거나 지정하거나, 입력하는 방식으로 특정되는 특허 집합을 말한다. 상기 TS를 생성하는 것은 본 발명의 타겟 특허 집합 생성부(5120)가 수행한다. 타겟 특허 집합은 자기 특허 집합에 포함되는 자기 특허와 기 설정된 관련성을 가지는 특허들인 타겟 특허를 포함하는 특허 집합이다. 본 발명의 타겟 특허 집합 생성부(5120)는 자기 특허 집합을 통하여 타겟 특허 집합을 생성하거나, 상기 사용자 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 지정이나 선택을 통하여 타겟 특허 집합을 생성한다. 전자에 대해서 상세히 설명한다. 상기 기 설정된 관련성은 1) 인용-피인용 특허 관계, 2) 텍스트 마이닝 기법 상의 유사 특허군 관계, 3) 특허 분류 상 유사 기술 특허 관계, 4) 사용자자 지정하는 특허로 구성되는 지정 특허군 관계 등이 있을 수 있다.

이어, 상기 분쟁 예측 엔진(5100)이, 기설정된 관계성 정보를 고려한 타겟 특허별 가중치 정보를 활용하여 분쟁 예측 정보를 생성하는 방법에 대해 설명한다. 상기 분쟁 예측 엔진(5100)은 자기 특허 집합을 입수(SL61)하고, 자기 특허 집합을 구성하는 개별 자기 특허별로 기 설정된 관계성을 가지는 타겟 특허를 추출하고 타겟 특허 집합을 생성(SL62)한다. 이어, 상기 분쟁 예측 엔진(5100)은 상기 타겟 특허에 대한 관계성 정보를 입수하거나 생성(SL63)한 다음, 상기 관계성 정보를 고려한 타겟 특허별 가중치 정보를 생성(SL64)하고, 상기 타겟 특허별 가중치 정보를 활용하여, 기 설정된 적어도 하나 이상의 분쟁 예측 정보를 생성(SL65)한다.

도 37에는 상기 자기 특허 집합을 구성하는 자기 특허들과 타겟 특허 집합을 구성하는 타겟 특허 간에 기 설정된 관계성이 설정되는 것을 도시해 주고 있다. 상기 관계성은 R(SSi, TSi)로 정의되는데, SSi와 TSi간에 성립되는 값이다. 도 37에서 알 수 있듯이, 하나의 SSi가 적어도 하나 이사의 TSi와 관련될 수 있고, 하나의 TSi가 적어도 하나 이상의 SSi와 관련되어 있을 수 있다. 상기 도관1에서 R(SS1, TS1), R(SS1, TS2)와 R(SS2, TS2)는 다를 수 있으며, 상기 TS2의 관점에서는 2개의 관계성 R(SS1, TS2)와 R(SS2, TS2)을 가진다. 상기 TSi에는 n개의 관계성을 가질 수 있으며, 상기 관계성은 TSi에 대한 가중치인 W(TSi)를 생성하는데 사용될 수 있다. 예를 들어, 상기 관계성이 텍스트 마이닝 상의 유사 특허군 관계일 때, R(SSi, TSi)는 SSi와 TSi간의 핵심 키워드를 기준으로 한 기 설정된 키워드 유사도 함수를 적용한 유사도의 정도가 될 수 있다. 한편, 상기 관계성이 인용일 경우, R(SSi, TSi)는 SSi와 TSi의 인용의 종류가 고려되어 부가되는 인용 관계성 함수값이 될 수 있을 것이다.

상기 인용-피인용 관계는 자기 특허와 타겟 특허가 1) 직접 인용, 2) 인용 깊이 n(n>1) 간접 인용, 3) 잠재 인용, 4) 사슬 인용 중 어느 하나 이상의 관계를 가지는 것이며, 이들에 대해서는 전술하였다. 개별 특허 Pi가 있는 경우, 각 인용 종류별로 기 설정된 다른 인용 가중치(Citation Weight)가 제공될 수 있다. 텍스트 마이닝 기법 상의 유사 특허군 관계는 자기 특허와 타겟 특허가 추출된 키워드를 기준으로 기 설정된 키워드 유사성을 가지는 것이며, 분류 상 유사 기술 특허 관계는 자기 특허와 타겟 특허가 특허 분류 체계 상에서 기 설정된 유사 기술 관계를 가지는 것을 말한다.

본 발명의 인용 특허 집합 생성부(5121)는 자기 특허 집합에 속하는 Pi에 대하여, 상기 Pi의 인용 종류별로 상기 Pi가 인용하는 선행 특허들로 인용 특허 집합을 생성하며, 상기 인용 특허 집합은 타겟 특허 집합의 한 예가 되거나 타겟 특허 집합의 부분 집합이 된다. 상기 인용 특허 집합을 생성할 때, 자기 특허 집합에 속하는 Pj 특허가 상기 인용 특허 집합에 포함될 수 있으며, 이 경우 인용 특허 집합에 Pj를 포함시킬 지의 여부는 타겟 특허 집합 생성 정책에 따른다. 한편, 상기 사용자는 상기 타겟 특허 집합 생성부(5120)가 타겟 특허 집합을 생성할 때, 특정 출원인(예를 들면 사용자가 A 기업에 속하는 경우, A 기업 또는 A 기업과 특정한 관계를 맺고 있는 출원인 등)의 특허 등과 같은 기 설정된 속성을 가지는 특허들을 배제시킬 수 있을 것이다. 물론, 상기 특정 출원인의 특허의 배제는 생성된 타겟 특허 집합에 대한 상기 사용자의 후처리(타겟 특허의 삭제, 추가 등)를 통해서 처리될 수도 있다.

이때, 인용 특허 집합인 TS에 속하는 특허인 TSi에는 가중치가 서로 다른 TSi를 가질 수 있다. 인용 특허 집합을 구성하는 인용 특허들은 1) 인용 종류 기반 인용 가중치, 2) 중복 기반 인용 가중치, 3) 간접 인용의 경우 인용 깊이 기반 인용 가중치, 4) 인용 개수 반비례 가중치, 5) 인용 진부화 가중치를 가진다. 인용 종류 기반 인용 가중치의 부여는 직접 인용에 가장 큰 가중치가 부여되고, 잠재 인용의 세부 종류별로 다른 가중치를 부여하고, 간접 인용의 경우, 인용의 깊이가 클수록 더 낮은 가중치를 부여하는 방식으로 부여될 수 있을 것이다. 상기 4) 인용 개수 반비례 가중치는 SSi에 레퍼런스 수가 많으면 많을수록 특정 레퍼런스의 상대적인 가중치를 낮게 가져가는 것이다. 최근 레퍼런스에 대한 남용(가급적 많은 특허나 논문 등의 자료를 레퍼런스에 추가하는 것)이 일어나고 있으며, 레퍼런스 개수가 너무 많을 경우, 사실상 레퍼런스의 역할을 수행하지 못하는 레퍼런스가 포함되어 있을 확률이 높다. 상기 인용 개수 반비례 가중치는 "상수/(레퍼런스 수 - 기 설정된 정수)"가 될 수 있으며, 이 식은 레퍼런스 수가 기 설정된 정수를 초과할 때만 적용된다. SSi와 TSi간의 출원일이 차이가 많이 날수록 동일한 특허 분류를 가지더라도 내용상 관련성이 강도가 떨어질 가능성이 클 수 있다. 따라서, TSi에 대하여 TSi와 SSi의 출원일의 차이값에 반비례 관계를 가지는 진부화 함수를 고려한 인용 진부화 가중치를 부가할 수 있다. 인용 진부화 가중치는 "상수/f(SSi의 출원일과 TSi의 출원일간의 경과 일수)"가 될 수 있다

한편, 서로 다른 n개의 SSi가 동일한 TSi를 인용할 수 있으므로, 이 경우 TSi의 중복 인용에 따른 가중치는 n이 되게 된다. 한편, SSi의 입장에서 자신이 직접 인용하는 인용 깊이 1인 parent 특허와 그 parent가 인용하는 인용 깊이 n(n>1)인 grand parent 특허를 동등한 가중치로 취급할 수는 없게 된다. 이때, 인용 깊이 n이 커질수록 지수적, 기하급수적 또는 산술급수적으로 감쇄하는 감쇄 팩터(factor)를 부가하여 인용 깊이에 따른 TSi의 가중치를 조절한다. 한편, TSi들 중에서 최근에 인용된 경우에 가중치를 더 부여하거나, 그 권리자가 트롤이나 다분쟁 권리자 또는 기타 사용자의 등록된 경쟁자인 경우 등과 같이 권리자의 속성에 따라 가중치를 더 부여하거나, 표준 특허풀에 소속된 특허이거나, 분쟁 발생 특허이거나 하는 등 그 특허가 기 설정된 속성을 가지는 경우 가중치를 더 부여할 수도 있을 것이다. 시스템에 의한 TS의 가중치의 설정은 본 발명의 가중치 조절부(5143)에서 수행한다.

SSi에 기반한 가중치에 대해서 설명한다. 사용자는 자신이 설정한 SSi 특허별로 자신의 주관적인 가중치인 사용자 설정 SSi 가중치를 부여할 수 있다. 인용 특허 집합 또는 유사 특허군 등으로 생성되는 TSi들은 SSi에 기반하기 때문에, SSi에 부여된 가중치는 TSi에도 부가될 수 있게 된다. 즉, 가중치가 아주 높은 특정한 SSi가 인용하는 특허군인 TSi는 가중치가 낮은 SSj가 인용하는 특허군인 TSj보다 더 높은 가중치를 가지도록 해야 한다. 따라서, TS를 구성하는 TSi들에는 SSi에 기반한 가중치인 사용자 설정 SSi 가중치 정보가 부가되어 있는 것이 더욱 바람직하다.

상기 TS의 대표적인 다른 예는 상기 SSi에 속하는 특허들에 대하여 텍스트 마이닝 기법을 통하여 생성되는 유사 특허군이다. 이에 대해 설명한다. 우선적으로 모든 개별 특허에 대하여 적어도 하나 이상의 키워드 후보를 추출한 다음, 키워드 후보 중에서 핵심 키워드를 추출하고 저장한 다음, 임의의 특허i에 대응되는 핵심 키워드군과 유사성이 높은 핵심 키워드를 가지는 적어도 하나 이상의 특허를 추출하여 유사 특허군을 생성한다. 상기 키워드 후보에는 키워드 쌍(공기쌍), 특허 분류 코드가 포함되어 키워드처럼 처리될 수 있다. 유사 특허군의 생성은 본 발명의 유사 특허군 생성부(5122)가 담당한다. 상기 유사 특허군 생성부(5122)는 SSi에 대하여 SSi를 대상으로 추출한 핵심 키워드 집합을 재료로 하여 상기 SSi와 유사한 선출원 유사 특허군을 추출한다. 상기 SSi와 선출원 유사 특허군 TS(SSi)을 생성한다. 상기 SSi와 TSi(SSi)간에는 유사도 점수를 가진다. 한편 SS를 구성하는 다른 특허(SSj)들에 대해서도 TS(SSj)를 생성하며, TS를 구성하는 TSi는 빈도(SSi와 i가 아닌 적어도 하나 이상의 j에 대응되는 SSj 모두 동일한 TSi를 유사 특허로 가질 수 있으며, 이 경우에는 TSi의 빈도는 2 이상이 되게 된다.)와 빈도수와 동일한 개수의 유사도를 가질 수 있다.

특히, 특허 분류의 경우, 복수 개의 특허 분류 각각이 핵심 키워드처럼 사용될 수 있을 것이다. 한편, 주 특허 분류에 가중치를 더 주는 방식으로 특허 분류마다 다른 가중치를 부여할 수 있을 것이다. 한편, 특허 분류 중 깊이가 깊은 n dot subclass 등에서 n이 클수록 특허 분류 체계 상에서 깊이가 깊은데, 이 깊은 특허 분류일수록 더 높은 가중치를 부여할 수 있다. 한편, H04B 7/26라는 특허 분류가 있을 때, H04B 7/26(2 dot Subgroup)의 부모에 해당하는 H04B 7/24(1dot Subgroup), H04B 7/00(Main Group) 등도 명시되어 나와있지는 않지만, 특허 명세서 상의 기술을 표상하는 것이므로, 핵심 키워드처럼 취급할 수 있을 것이다. 물론, H04B 7/26에 대한 가중치가 높고, H04B 7/24는 낮으며, H04B 7/00(Main Group)는 가장 낮게 설정할 수 있을 것이다. 나아가, 텍스트 마이닝 기법으로 유사 특허군을 생성할 때, 레퍼런스 정보(직접 인용, 간접 인용, 잠재 인용과 관련된 특허 번호)도 핵심 키워드처럼 취급하여, 유사 특허군의 생성에 활용 될 수 있을 것이다. 이 경우, 각 인용 종류별, 인용 깊이별로 상기 인용 관계 특허별로 같거나 다른 가중치가 부여될 수 있을 것이다.

유사 특허군을 생성하는 방법은 클러스터링 방법과 검색 엔진을 이용하는 방법이 있다. 클러스터링은 핵심 키워드 간의 거리에 기반하여 유사 특허군을 생성하는 방법이며, 가장 간단한 방법으로 K-Means 알고리즘이 있다. 한편, 검색 엔진은 자체 내에 랭킹 알고리즘을 포함하고 있기 때문에, 입력된 n개의 핵심 키워드의 입력이 있는 경우, 검색 대상 특허 문건 중에서 n개의 핵심 키워드를 다수 포함하고 있는 특허 문건을 출력해 주는데, 이 중 일정 개수 또는 일정 스코어 이상이 되는 특허군을 유사 특허군으로 처리할 수 있다. 이때, 각 핵심 키워드는 특허 명세서 상의 필드별로 다른 가중치를 가지도록 처리될 수 있음은 물론일 것이며(예를 들어, 발명의 명칭에 나온 핵심 키워드에 가중치를 가장 높게 주고, 특허 청구 범위에 나온 핵심 키워드에 대해서도 상대적으로 높은 가중치를 부여하며, 발명의 상세한 설명에만 나온 핵심 키워드에는 가장 낮은 가중치를 부여할 수 있을 것이다.), 검색 엔진이 키워드별 가중치를 입수 받을 수 있는 경우라면, 입력되는 n개의 핵심 키워드에 가중치를 부여하여 검색 엔진에 질의할 수 있을 것이다. 특히, 가중치가 포함된 n개의 핵심 키워드로 쿼리를 생성하고, 생성된 쿼리를 핵심 키워드 필드(추출된 핵심 키워드만을 모아 놓은 필드)에 질의하면 빠른 속도로 유사 특허군을 생성할 수 있을 것이다.

이어, 핵심 키워드를 생성하는 방법에 대해서 설명한다. 상기 키워드는 특허 명세서에 포함된 텍스트를 처리하여 생성할 수 있으며, 이는 본 발명의 상기 데이터 가공부(2000)의 핵심 키워드 생성부(2100)가 담당한다. 상기 핵심 키워드 생성부(2100)는 특허 명세서를 구성하는 각종 필드별에 대응된 구나 문장에서 키워드를 추출한다. 공기쌍의 추출은 근접 거리(1개의 문장 내 등 기 설정된 텀 간의 거리 기준을 충족하는 거리)에 있는 텀간의 조합을 통하여 추출한다. 상기 필드는 발명의 명칭, 특허 청구 범위, 요약, 발명의 상세한 설명, 산업상 이용 가능성, 효과, 종래의 기술(배경 기술) 등 특허 명세서를 구성하는 각종 필드 중 어느 하나 이상일 수 있다. 상기 핵심 키워드 생성부(2100)는 상기 필드에서 추출한 n개의 키워드에 대하여 핵심 키워드 집합을 생성한다. 상기 핵심 키워드 생성 시, 상기 핵심 키워드 생성부(2100)는 동의어 처리, 시소러스 처리 등을 수행하여 실질적으로 같거나, 동등하거나, 대등한 의미를 지니는 텀들은 묶어서 대표 텀으로 처리하여 핵심 키워드를 선정하는 것이 바람직하다. 한편, 상기 대표 텀으로 처리할 때, 사전 내지는 기계 번역기를 활용하여 1개 특허 문건에 나오는 2 이상의 언어에 대한 동의어, 시소러스 처리를 수행하는 것이 바람직할 것이다. 한편, 상기 대표 텀 내지는 상기 추출된 핵심 키워드는 상기 사전 내지는 기계 번역기를 통하여 적어도 하나 이상의 언어로 번역해 놓는 것이 더욱 바람직할 것이다. 자연어 처리를 통하여 키워드(통상적으로 이 기술 분야에서는 키워드를 텀(term)이라 부른다.) 또는 공기쌍을 추출하는 것은 자연어 처리 기술 분야에서 공지의 기술에 속한다. 추출된 n 개의 키워드(공기쌍 포함함은 당연할 것이다.)에 대하여, 기 설정된 핵심 키워드 선정 알고리즘을 적용하여 상기 특허 명세서를 대표할 수 있는 핵심 키워드 집합(핵심 공기쌍 집합이 선택적으로 포함됨은 당연할 것이다.)을 선정한다. 가장 빈번하게 사용되는 알고리즘은 TF(Term Frequency)와 IDF(Inverse Document Frequency)를 사용하는 것이다.

자연어 처리 기술 분야에서는 상기 TF와 IDF를 변수로 한 다양한 함수식이 공개되어 있으며, 필드별 가중치 등 기타의 복잡한 산식을 정책적으로 적용할 수 있음은 당연하다 할 것이다. 이때, 상기 좁은 의미의 키워드만으로 구성되는 핵심 키워드 집합, 상기 공기쌍만으로 구성되는 핵심 키워드 집합을 분리하여 생성하거나, 상기 좁은 의미의 키워드 및 상기 공기쌍을 동등하게 상기 알고리즘으로 처리한다. 상기 핵심 키워드 선정 알고리즘이 상기 공기쌍을 상기 좁은 의미의 핵심 키워드와 같이 처리하면, n개의 키워드 쌍에 대하여, 핵심 키워드 쌍 집합을 생성할 수 있다.

하기 수학식 3은 추출된 키워드에 대하여 핵심 키워드를 추출하는 알고리즘에 사용되는 수식의 일례이다.

[수학식 3]

tf : term frequency로 키워드(색인어)가 현재 문서에 출현한 빈도 수

N : 전체 문서의 개수

df : document frequency로 키워드가 출현한 문서 수

slope : 기울기(임의의 상수값, 조정가능)

ut : 전체 문서집합에서의 unique terms

pivot : 평균 문헌 길이(ut/N)

uf : 해당문서의 ut

Fwi : 필드별 가중치

한편, 상기 핵심 키워드 생성부(2100)가 2개 이상의 단어/어휘/어절로 구성되는 새로운 텀(term)을 추출할 때, 상기 새로운 텀이 기술적으로 의미를 가지는 텀인지를 판단하기 어려운 경우가 다수 있다. 이때, google.com과 같은 외부 검색 엔진을 활용하여 새로운 텀이 기술적 의미를 가지는 것인지를 결정하는 방법이 있을 수 있다. 상기 핵심 키워드 생성부(2100)는 상기 추출된 새로운 텀을 따옴표 처리(exact match를 처리하는 google.com의 검색어 처리 방식) 등과 같은 기 설정된 적어도 하나 이상의 처리를 수행한 다음, 상기 google.com과 같은 외부 검색 서비스 시스템에 전송하고, 상기 외부 검색 서비스 시스템으로부터 검색 결과를 전송 받고, 상기 검색 결과를 분석하여 기 설정된 기준이 충족되는 경우, 상기 추출된 새로운 텀을 정상적인 텀으로 처리한다. 상기 검색 결과의 분석은 검색 결과 수(hit 수, 그 질의어에 매칭되는 검색 결과가 몇 개인지를 가르쳐 줌)를 측정하는 것이며, 기 설정된 기준의 예로 영어의 경우, 1,000개 이상, 다른 언어의 경우에는 100개 이상 등이 될 수 있을 것이다. 예를 들어, 2010년 3월 현재 google.com에 "patent informatics"와 "patent informatics services"를 각각 질의하면, 67,300과 279개의 Results가 나오는데, 이 경우에는 "patent informatics"는 텀으로 취급하고, "patent informatics services"는 새로운 텀으로 취급하지 않을 수 있을 것이다. 한편, google.com등과 같은 검색 엔진이 아니라, wikipedia.org와 같은 용어에 대한 설명을 제공하는 시스템에 질의하여 그 term에 대한 설명이 존재하면, 새로운 텀으로 취급할 수 있다.

상기와 같은 핵심 키워드 선정 알고리즘을 통하면, 1개의 특허 문건에 대응되는 1개 이상의 핵심 키워드 집합(Keyword Set, 1개 이상의 핵심 빈도 유지 핵심 키워드 조합 집합이 선택적으로 포함될 수 있음은 당연할 것이다.) 즉, i번째 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)={K1(Pi), K2(Pi), ,,,, Ki(Pi), Kj(Pi),,,,Kn(Pi)}을 얻게 된다. 상기에서 i, j, n은 정수이며, Kn(Pi)란 i번째 특허 문건 Pi에서 선정된 n번째 핵심 키워드를 말한다. 1개의 특허 문건에 복수개의 핵심 키워드 집합이 대응될 수 있는데, 그 이유는 1) 특정 필드(예를 들면 특허 청구 범위 또는 요약), 2) 필드별로 다른 가중치를 부여, 3) 2 이상의 핵심 키워드 선정 알고리즘 사용, 4) IDF 계산의 기준 범위, 5) 텀 추출 방식 등의 다양한 이유가 있을 수 있다.) 상기 i번째 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)={K1(Pi), K2(Pi), ,,,, Ki(Pi), Kj(Pi),,,,Kn(Pi)}은 Pi 또는 Pi에 대응되는 키(key)값을 기준으로 핵심 키워드 DB(1300)에 저장될 수 있다.

한편, 본 발명의 핵심 키워드 메타 정보 생성부(2140)는 핵심 키워드별로 기 설정된 적어도 하나 이상의 메타 데이터를 생성하며, 생성된 핵심 키워드 메타 정보는 핵심 키워드 메타 정보 DB에 저장된다. 상기 핵심 키워드 메타 정보 생성부(2140)가 생성하는 핵심 키워드별 메타 데이터는 크게 2가지이다.

첫번째는 핵심 키워드간의 연관 정보이다. 모든 핵심 키워드는 상기 핵심 키워드가 나온 문건 Pi가 대응되게 된다. 따라서, 적어도 2 이상의 특허로 생성되는 특허군이 있을 때(상기 특허군의 예는 전체 특허, 일정 기간 동안의 전체 특허, 특정 특허 분류별 특허, 특정 권리자별 특허, 특정 발명자별 특허 등으로 구성될 수 있다.) 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)을 상기 특허군 단위로 연관 분석(association analysis, 예를 들면 소위 장바구니 분석)으로 처리하면, 핵심 키워드 간의 연관 정보가 생성되게 되며, 핵심 키워드 간의 연관 정보는 핵심 키워드 네트워크로 시각화 될 수 있다. 상기 핵심 키워드 네트워크를 본 발명의 네트워크 분석부(4700)가 분석할 수 있으며, 시각화는 본 발명의 데이터 시각화부(4700)이 수행할 수 있다.

두번째는 핵심 키워드별 대응 서지 정보이다. 특허 문건 Pi에 대응되는 핵심 키워드 집합 KS(Pi)은 모두 Pi의 모든 서지 사항 요소(출원일, 출원인, 발명자, 특허 분류, 레퍼런스 등등)이나, Pi에 대응되는 표 1 내지 표 4의 분쟁 예측 요소별 분쟁 예측 요소값이 대응되게 된다. 모든 분석 정보가 대응되게 된다. 따라서, 적어도 2 이상의 특허로 생성되는 특허군이 있을 때(상기 특허군의 예는 전체 특허, 일정 기간별 전체 특허, 특정 특허 분류별 특허, 특정 권리자별 특허, 특정 발명자별 특허 등으로 구성될 수 있다.) 상기 특허군을 기준으로 개별 핵심적인 키워드마다 적어도 하나 이상의 특허 문건이 대응될 수 있게 된다. 따라서, 상기 개별적인 핵심 키워드별로 상기 핵심 키워드를 자신의 핵심 키워드로 하는 상기 특허군의 특허 문건들을 대상으로 한 정량 분석 정보(출원수, 등록수, 출원수 증가량, 등록수 증가량, 기타 특허 집합들에 대한 임의의 정량 분석 정보)를 상기 개별적인 핵심 키워드의 메타 데이터가 될 수 있다. 상기와 같은 핵심 키워드별 메타 데이터를 활용하여 rising하는 핵심 키워드 등을 찾을 수 있게 되며, 상기 핵심 키워드 네트워크를 통합하여 활용하면, 상기 rising 하는 핵심 키워드를 중심으로 하는 핵심 키워드 네트워크를 알 수 있게 된다. 한편, 상기 핵심 키워드 네트워크를 구성하는 핵심 키워드 간의 에지(edge)에는 2개의 핵심 키워드가 대응되므로, 상기 2개의 핵심 키워드를 동시에 포함하는 특허 문건을 검색할 수 있게 된다.(검색 엔진이 Pi별로 추출한 핵심 키워드만을 별도의 검색 가능하도록 하기 위하여 핵심 키워드를 검색 인덱스에 포함시킬 수 있을 것이다.)

Pi에 대응되는 핵심 키워드 집합 KS(Pi)을 구성하는 개별 키워드를 상기 특허군 단위로 연관 분석(association analysis, 예를 들면 소위 장바구니 분석)으로 처리하면, 핵심 키워드 간의 연관 정보가 생성되게 되며, 핵심 키워드 간의 연관 정보는 핵심 키워드 네트워크로 시각화 될 수 있다.

한편, 상기 타겟 특허 집합 생성부(5120)의 유사 기술 특허군 생성부(5123)가 특허 분류를 활용하여 유사 특허군을 생성 방법을 설명한다. 자기 특허 SSi에 n개의 IPC와 m개의 고유 특허 분류(USPC를 예로 들어 설명한다)가 있는 경우, 상기 n개의 IPC와 상기 m개의 고유 특허 분류를 활용하여 유사 특허군을 생성한다. 상기 유사 기술 특허군 생성부(5123)는 IPC1 내지 IPCn별로 주특허 분류 또는 부특허 분류를 포함하여 이 IPC를 가지는 TS(IPC1),TS(IPCn)을 추출한다. 추출된 TS(IPCi)의 크기(TS(IPC1)에 속하는 특허의 개수가 크기가 된다.)를 s(TS(IPC1))라고 할 때, TS(IPCi)에 속하는 TSi(IPCi)에 대해서 1/s(TS(IPCi))의 가중치를 할당한다. 한편, TS(IPC1),TS(IPCn) 중 동일한 특허가 중복되어 있는 경우, 즉, SSi에서 2개 이상의 IPC가 있고, TS에 속하는 TSi 중에서 상기 2개 이상의 IPC가 일치하는 특허가 있는 경우, 일치되는 IPCi와 적어도 하나 이상의 IPCj에 대해서 1/s(TS(IPCi and IPCj))를 할당할 수 있다. TS(IPCi and IPCj)란 IPCi와 IPCj를 함께 가지는 TSi로 생성되는 TS를 말한다. 한편, 동일한 IPC는 아니더라도 기술 분류 체계 상 근접한 IPC의 경우에는 일정 수준 이상의 유사성을 가질 수 있다. 상기 유사 기술 특허군 생성부(5123)는 특허 분류 체계를 참조하여 SSi의 IPCi의 직상위 특허 분류 등과 같은 적어도 하나 이상의 상위 특허 분류를 추출하고, 상기 상위 특허 분류를 포함하는 특허 문건에 대해서는 상기 상위 특허 분류를 포함하는 TS의 크기에 반비례하는 가중치를 대응시킬 수 있을 것이다. 한편, 상기 유사 기술 특허군 생성부(5123)는 특허 분류 체계를 참조하여 SSi의 IPCi의 적어도 하나 이상의 하위 특허 분류를 추출하고, 상기 추출된 하위 특허 분류를 포함하는 특허 문건에 대해서는 상기 하위 특허 분류를 포함하는 TS의 크기에 반비례하는 가중치를 대응시킬 수 있을 것이다.

한편, SSi와 TSi간의 출원일이 차이가 많이 날수록 동일한 특허 분류를 가지더라도 내용상 비유사할 가능성이 클 수 있다. 따라서, 상기 가중치에 출원일의 차이값에 반비례 관계를 가지는 진부화 함수를 고려한 진부화 가중치를 곱할 수 있다. 진부화 가중치는 상수/f(SSi의 출원일과 TSi의 출원일간의 경과 일수)가 될 수 있다.

한편, 주특허 분류 이외의 부특허 분류를 활용한 유사 특허군 생성 시, SSi 나 TSi에 다수의 특허 분류가 포함되어 있는 경우, 특허 분류 개수가 많을수록 SSi의 특허 분류와 TSi의 특허 분류가 일치한다고 하더라도 기술의 내용상 일치할 확률이 낮아지게 된다. 따라서, 특허 분류의 개수에 따르는 희석율이 도입이 필요하게 된다. 희석율은 각 가중치에 곱하여 진다. 희석율은 SSi의 특허 분류 수에 반비례하며 및 TSi의 특허 분류수에 반비례한다. 한편, 희석율의 적용 시 일치하는 특허 분류가 주특허 분류에서 일치하는 경우, 주특허 분류 일치 가중치가 더 부여 될 수 있다. 즉, SSi의 주특허 분류와 TSi의 특허 분류가 일치하거나, SSi의 특허 분류와 TSi의 주특허 분류와 일치할 경우 분류 일치 가중치가 추가적으로 더 부여될 수 있다. 상기와 같은 방법으로 특허 분류를 활용하여 생성되는 TSi별로 기 설정된 가중치가 부여될 수 있을 것이다. USPC, FT, FI, ECLA와 같은 고유 특허 분류에 대해서도 IPC와 동일하게 처리한다. SSi에 대응되는 TSi가 2 종류 이상의 특허 분류와 관련되어 있을 때는 TSi의 가중치는 각 특허 분류 종류별로 합산할 수 있을 것이다.

상기와 같은 방법으로 SS에 속하는 개별 특허별로 유사 특허군을 생성할 수 있다. 생성되는 유사 특허의 개별 특허에는 유사도 점수가 배정되어 있을 수 있다. 따라서, SSi 전체 특허의 관점에서 유사 특허군 집합을 생성하는 것은 1) SS에 속하는 개별 특허별로 생성되는 유사 특허군 중에서 기 설정된 유사도 점수 이상이 되는 특허들로 생성하는 방법, 2) SS에 속하는 개별 특허별로 유사도 점수를 포함하는 유사 특허군을 생성하고, 생성된 유사 특허군을 합하고, 합친 전체 유사 특허군 중에서 개별 특허를 기준으로 유사도의 합계 점수(2회 이상 나타나는 유사 특허는 2개 이상의 유사도 점수를 가짐)를 기준으로 기 설정된 개수나 비율(SS의 특허 개수 대비 3~5배 등)의 유사 특허군 집합을 생성할 수 있다. 이와 같은 과정을 통하여 유사 특허군 집합에 포함되는 특허마다 유사도 합계 점수가 대응되게 된다. 상기 유사도 점수의 생성도 일종의 TSi에 대한 가중치가 되므로, 상기 유사도 점수의 설정은 본 발명의 가중치 조절부(5143)에서 수행한다.

상기 유사 특허군 집합에서 선출원 유사 특허군 집합을 생성할 수 있다. SSi가 다수 있을 때 이들의 특허 출원일이 범위(range)를 가질 수 있기 때문에, SS의 출원일을 일의적으로 특정하기 어려운 문제가 발생하여, 선출원 유사 특허군과 후출원 유사 특허군을 특정하기 어려워지는 문제가 발생한다. 선출원 유사 특허군 집합을 생성하는 방법은 1)SS에 속하는 개별 특허에서 유사 특허군을 생성할 때, 상기 개별 특허의 출원일보다 선출원인 유사 특허들로 유사 특허군을 생성하는 방법, 2)SS에 속하는 특허들의 출원인의 중앙값을 기준으로 전체 유사 특허군 중에서 중앙값보다 빠른 출원일을 가지는 경우, 그러한 속성을 가지는 특허군을 선출원 유사 특허군으로 하고, 그렇지 않은 속성을 가지는 특허군을 후출원 유사 특허군으로 처리하는 방법이 있을 수 있다.

상기 선출원 유사 특허군 집합을 생성하는 방법과 마찬가지로 후출원 유사 특허군 집합을 생성할 수 있음은 상기 설명으로 자명할 것이다.

상기 TS의 대표적인 또 다른 예는 사용자가 구성하는 사용자 구성 특허 집합이다. 상기 선출원/후출원 유사 특허군 집합이나, 선출원/후출원 인용 특허 집합 등에 대해서도 기간, 속성(권리자 속성, 특허 속성, 기술 분야 속성 등) 또는 검색어나 검색식 등으로 한정을 수행할 수 있지만, 본질적으로 일반적 특허 집합이다. 이에, 사용자는 자신의 검색식이나, 자신이 관리하는 특허 집합이나, 자신의 경쟁사의 특허나 유관사의 특허 등과 같은 임의의 특허 집합 한정 수단을 부가하여 자신만의 특허 집합을 생성할 수 있다. 예를 들면, 자신을 공격해온 A라는 권리자가 있을 때, A의 특허 포트폴리오에 속하는 특허 또는 공격해 온 특허 또는 공격해 온 특허의 유사 특허군에 속하는 특허 등의 특정된 특허 집합의 선출원 인용 특허 집합은 사용자 구성 특허 집합의 예가 될 수 있다. 사용자 구성 특허 집합을 생성하는 다른 방법은 상기 인용 특허 집합 및/또는 유사 특허군 집합 및/또는 사용자가 입력 또는 생성하는 특허 집합에 속하는 특허들 중에서 선별하는 방식으로 생성하는 것이다.

한편, 사용자 구성 특허 집합을 구성할 때, 상기 사용자는 상기 TSi에 대하여 주관적인 가중치를 설정할 수도 있을 것이다. 이러한 가중치는 사용자 설정 TSi 가중치라 한다. 상기 가중치의 설정은 본 발명의 가중치 조절부(5143)에서 제공하는 UI를 통하여 수행한다. 상기 UI는 TS에 속하는 특허 리스트를 제공해 주고, 상기 특허 리스트에 사용자가 가중치나 중요도 또는 중요 등급을 입력할 수 있도록 하는 방식으로 수행한다.

상기 TS의 대표적인 다른 예는 시스템이 제공하는 시스템 구성 특허 집합이다. 시스템은 SSi가 속하는 최빈 특허 분류 등과 같이 SS 또는 SSi를 대표하는 속성에 따라 SSi가 인용하는 선출원 특허들로 구성되는 협의의 선출원 인용 특허 집합이다. 한편, 상기 시스템은 최근 출원 또는 등록량이 급증하는 특허 집합 또는 대학이나 연구 기관의 특허, 특정 권리자(매각 예정 기업 등)의 특허 집합 등과 같이 시스템의 관리자 설정하는 다양한 특허 집합을 사용자에게 제시하여 선택 받거나, 디폴트로 처리하여 시스템 구성 특허 집합을 생성할 수 있게 된다.

이어, SS와 TS가 특정되는 경우, 상기 시스템의 정보 처리 방법에 대해서 설명한다. 먼저 분쟁 예측 방법에 대해 설명한다.

타겟 특허 집합 생성부(5120)에 의해 TS가 결정되면, TS에 속하는 모든 TSi에 대하여 상기 분쟁 예측 모델값 입수부(5130)는 분쟁 예측 모델 Sg에 대한 분쟁 예측 모델값인 Sg(TSi)를 입수하고, 저장한다. 상기 분쟁 예측 정보 생성부(5140)는 TS에 속하는 모든 TSi에 대한 Sg(TSi)값을 사용할 수도 있지만, 4분위수 등과 같은 n분위수 중 기 설정된 높은 분위에 속하는 Sg(TSi)들만을 처리 대상으로 하거나, Sg(TSi)값이 기 설정된 기준 이상이 것들만을 처리 대상으로 하는 등, 처리 대상에 대한 한정을 수행할 수 있다. 이러한 처리 대상의 한정은 시스템이 설정하거나, 사용자가 설정할 수 있을 것이다.

상기 분쟁 예측 정보 생성부(5140)는 상기 분쟁 예측 모델값 입수부(5130)가 입수한 Sg(TSi)에 대하여 다중 관계성 처리 모듈(5141)을 통하여 상기 Sg(TSi)에 기 설정된 가중치를 부가한다. Sg(TSi)에 부과되는 가중치는 TSi에 부과되는 가중치와 동일한 기원을 가진다. TSi에 부과되는 가중치는 1) SSi와의 관련성 가중치, 2) 중복 가중치, 3) 사용자가 SSi에 부여한 주관적 가중치, 4) TSi에 대하여 사용자가 부여한 주관적 가중치 중 어느 하나 이상을 사용하여 결정된다. TSi에 부과되는 가중치를 W(TSi)라 한다. 상기 TSi에 부과되는 가중치는 상기 TSi와 SSi와의 관계에도 영향을 받는다. 따라서, 상기 W(TSi)는 W(TSi)=W(TSi, SSi)가 될 수 있다. 상기 W(TSi, SSi)에는 사용자가 SSi에 부과하는 주관적인 가중치, SSi와 관련되는 TSi별 관련성 정도(상기 관련성 정도에는 적어도 2 이상의 SSi들이 하나의 TSi와 관련될 때(즉, SSi 기준으로 동일한 TSi에서 중복이 발생될 때)의 관련성을 포함한다.), TSi에 대하여 사용자가 부과하는 주관적 가중치가 고려되는 가중치 관계식이다.

상기 가중치와 관련된 정보의 처리는 본 발명의 가중치 조절부(5143)에서 제공하는 UI를 통하여 수행한다. 상기 사용자는 상기 가중치 조절부(5143)를 통하여 개별 특허 SSi나 TSi에 주관적 가중치를 부여할 수 있으며, 관련성의 종류나 세부적인 관련성별로 자신이 설정하는 가중치를 부여하거나 시스템이 부여한 가중치를 조절할 수 있으며, 상기 1) 내지 4)의 각 가중치 종류별로 각 가중치 종류의 적용 여부나 각 가중치 종류별로의 상대적인 가중치를 설정(예를 들면, 1)에 50%, 2)에 30%, 3)에 10%, 4)에 10% 등을 부여하는 것 등)하거나, 시스템이 상기 1) 내지 4)에 부여한 가중치를 조절할 수 있을 것이다.

상기 분쟁 예측 정보값 생성 모듈(5142)은 상기 Sg(TSi)와 상기 W(TSi)를 처리하여 TSi별로 분쟁 예측 정보 wf(Sg(TSi), W(TSi))를 생성한다. 여기서 wf는 처리식이며, wf의 간단한 예는 Sg(TSi)*W(TSi)이며, 가장 간단한 예를 가중치를 전혀 적용 않은 Sg(TSi)가 될 수 있다. 이와 같이 상기 분쟁 예측 정보 생성부(5140)는 타겟 특허 집합이 결정되면, 타겟 특허 집합의 TSi에 대하여 wf(Sg(TSi), W(TSi))를 생성한다. 상기 분쟁 예측 정보값 제공부(5150)는 상기 wf(Sg(TSi), W(TSi))를 요청자에게 제공한다. 상기 TSi별로 생성되는 wf(Sg(TSi), W(TSi))가 TS를 기준으로 한 SS 입장의 분쟁 예측 정보의 일례가 된다. 이어, 상기 분쟁 예측 정보 생성부(5140)는 타겟 특허 집합 전체에 대하여 적어도 하나 이상의 집합적 분쟁 예측 정보를 생성할 수 있다. 상기 집합적 분쟁 예측 정보 생성 함수를 f(TS)라 한다. f(TS)의 한 예는 TSi별 wf(Sg(TSi), W(TSi))의 총합, TSi별 wf(Sg(TSi), W(TSi))의 평균, 기 설정된 분위수나 기 설정된 상위%의 TSi별 wf(Sg(TSi), W(TSi))의 총합이나 평균, TSi별 wf(Sg(TSi), W(TSi))의 분포에 대한 기 설정된 통계 처리값, 상기 통계 처리값을 기 설정된 등급 부여 모델에 적용한 등급값 등이 f(TS)의 예가 될 수 있다.

도 38는 상기 분쟁 예측 정보값 생성 모듈(5142)이 1개의 특허에 대하여 분쟁 예측 정보 값을 생성하는 과정에 대한 모식도이다. 상기 도 38에서는 SSi가 n개의 TSi들과 각각 W(SSi, TSi)의 가중치를 가지는 것을 보여 주고 있다. 이 경우, 상기 분쟁 예측 정보값 생성 모듈(5142)은 상기 개별 특허 SSi에 대하여 하기와 같은 수식의 분쟁 예측 정보를 생성할 수 있다.

wf(Sg(TSi), W(TSi))(SSi) =

{Sg(TS1)*W(SSi,TS1)++ Sg(TSi) *W(SSi,TSi)++ Sg(TSn) *W(SSi,TSn)}/{W(SSi,TS1)++W(SSi,TSi)++ W(SSi,TSn)}

한편, 상기 분쟁 예측 정보는 n개의 개별 특허 SSi로 이루어진 SS 전체에 대하여 하기 수식과 같은 분쟁 예측 정보를 생성할 수 있다.

wf(Sg(TSi), W(TSi))(SS) = 1-{1-wf(Sg(TSi), W(TSi))(SS1)}{1-wf(Sg(TSi), W(TSi))(SSi)} {1-wf(Sg(TSi), W(TSi))(SSn)}

도 41은 본 발명의 분쟁 예측 정보 생성부(5140)가 생성하는 분쟁 예측 정보의 종류나 순서에 대한 일 실시예적 도면이다. 상기 분쟁 예측 정보 생성부(5140)은 먼저 개별적인 자기 특허별 분쟁 예측 정보를 생성(SL71)할 수 있다. 즉, 하나의 SSi에 대한 타겟 특허 집합을 생성한 다음, SSi에 대한 분쟁 예측 정보로서 TS를 구성하는 개별 TSi별 또는 TS별 분쟁 예측 정보를 생성할 수 있다. 한편, 상기 분쟁 예측 정보 생성부(5140)는 적어도 하나 이상이 자기 특허로 구성되는 자기 특허 집합별로 기설정된 분쟁 예측 정보를 생성(SL72)할 수 있다. 한편, 상기 분쟁 예측 정보 생성부(5140)는 개별적인 SSi에 대해서건 SS에 대해서건 구성되는 TS를 구성하는 타겟 특허별로 기설정된 분쟁 예측 정보를 생성(SL73)할 수 있다. 그리고, 상기 분쟁 예측 정보 생성부(5140)는 개별적인 SSi에 대해서건 SS에 대해서건 구성되는 타겟 특허 집합별로 기설정된 분쟁 예측 정보를 생성(SL74)할 수 있다.

이어, 도 42 내지 도 43을 참조하면서 집합 분할 개념을 적용한 분쟁 예측 정보 생성 방법에 대해 설명한다. 도 42는 본 발명의 특허 집합 분할부(5310)를 통하여 자기 특허 집합을 분할한 다음, 분할된 자기 특허 집합에 대한 분쟁 예측 정보를 생성하는 일 실시예적 방법을 도시하고 있다. 상기 분쟁 예측 엔진(5100)은 자기 특허 집합을 입수(SL81)하고, 상기 특허 집합 분할부(5310)를 통하여, 자기 특허 집합에 대한 분할 기준을 입수(SL82)하고, 분할된 자기 특허 집합에 대응되는 타겟 특허 집합 생성(SL83)한 다음, 분할된 자기 특허 집합에 대응되는 타겟 특허 집합을 기준으로 한 분쟁 예측 정보를 생성(SL84)한다.

도 43은 본 발명의 특허 집합 분할부(5310)를 통하여 타겟 특허 집합을 분할한 다음, 분할된 타겟 특허 집합에 대한 분쟁 예측 정보를 생성하는 일 실시예적 방법을 도시하고 있다. 상기 분쟁 예측 엔진(5100)은 자기 특허 집합을 입수(SL91)하고, 상기 자기 특허 집합에 대응되는 타겟 특허 집합을 생성(SL92)하고, 타겟 특허별 분쟁 예측 모델값을 생성(SL93)한다. 이어, 상기 상기 특허 집합 분할부(5310)를 통하여, 분할 기준을 입수한 후 상기 타겟 특허 집합을 분할(SL94)하고, 분할된 상기 타겟 특허 집합을 기준으로 한 분쟁 예측 정보 생성(SL95)를 생성한다. 이하, 분설한다.

상기 TS는 타겟 특허 집합이며, 상기 타겟 특허 집합은 적어도 하나 이상의 분할 기준을 적용하여 적어도 하나 이상의 유닛으로 분할할 수 있다. 상기 분할은 본 발명의 분쟁 예측 정보 분석 엔진(5300)의 특허 집합 분할부(5310)가 수행할 수 있다. 유닛으로 분리된 i번째 TS를 TSui라 하자. 이 경우 상기 분쟁 예측 정보 생성부(5140)는 TSui별로 wf(Sg(TSui), W(TSui))나 f(TSui)의 값이 생성될 수 있을 것이다. TS를 분할하는 방법은 1) 권리자별, 2) 기술군(IPC나, USPC를 활용할 수 있음)별, 3) 기간별, 4) 발명자별, 5) 국가별, 6) 권리자 속성별, 7) 적어도 하나 이상의 특정 키워드 포함 여부별, 8) 기타 특허 집합을 분할하거나 한정할 수 있는 조건별, 9) 특정된 속성을 가지는 특허군별, 및/또는 10) 상기 1) 내지 9)의 방법을 조합한 것들이 있을 수 있다. 상기 6)의 예는(1) 등록된 트롤 속성,(2) 다분쟁 유발자 등이 될 수 있다. 상기 9)의 특정된 속성의 예는(1) TS 중 SS와 유사성이 높은 특허군,(2) 사용자 설정 SSi 가중치가 기 설정된 랭킹, 수준, 범위 이상 높은 SSi에 대응되는 TSi들로 구성되는 특허군 등이 될 수 있다.

한편, 상기 SS는 자기 특허 집합이며, 상기 자기 특허 집합도 상기 타겟 특허 집합처럼 분할 방법을 통하여 하나 이상의 유닛으로 분할할 수 있을 것이다. 상기 분할된 i번째 SS를 SSui라 하며, 상기 SSui별로 생성되는 타겟 특허 집합인 TS(SSui)를 생성할 수 있을 것이며, 상기 TS(SSui)에 대하여 TS(SSui)별로 wf(Sg(TS(SSui)), W(TS(SSui)))나 f(TS(SSui))를 생성할 수 있을 것이다. 한편, 상기 TS(SSui)도 타겟 특허 집합이 일종이므로, 상기 분할 방법을 통하여 분할 할 수 있으며, 분할된 TSui(SSui)에 대하여도 wf(Sg(TSui(SSui)), W(TSui(SSui)))나 f(TSui(SSui))를 생성할 수 있을 것이다.

본 발명의 상기 분쟁 예측 정보 분석 엔진(5300)은 분쟁 예측 정보를 분석한다. 도 44에는 본 발명의 분쟁 예측 정보 분석 엔진(5300)의 정보 처리 방법에 대한 일 실시예적 구성이 나와 있다. 상기 분쟁 예측 정보 분석 엔진(5300)은 타겟 특허별 분쟁 예측 모델값 정보를 생성(SL101)한 다음, 자기 특허, 자기 특허 집합, 분할 자기 특허 집합 각각에 대한 타겟 특허, 타겟 특허 집합, 분할 타겟 특허 집합을 기준으로 한 분쟁 예측 모델값 또는 분쟁 예측 정보값을 생성(SL102)한다. 이어, 상기 분쟁 예측 정보 분석 엔진(5300)은 각 기준별 분쟁 예측 모델값 또는 분쟁 예측 정보값의 랭킹, 분포, 권리자별, 권리자 종류별, 발명자별, 특허 분류별 정량 분석을 수행(SL103)하거나, 타겟 특허의 서지 사항이나 분석 지표별 정량 분석을 수행(SL104)하여, 정량 분석 수행 결과값을 생성해 낸다.

상기 분쟁 예측 정보 분석 엔진(5300)의 분석 대상이 되는 분쟁 예측 정보는, SSi, TSi, wf(Sg(TSi), W(TSi)), f(TS)가 된다. 특히, TSi에는 서지 사항값과 상기 표 1 내지 표 4의 분쟁 예측 요소별 분쟁 예측 요소값이 있으며, 상기 서지 사항값과 분쟁 예측 요소값과 wf(Sg(TSi), W(TSi))은 다양한 정량 분석의 대상이 될 수 있다. 예를 들면, TS에 포함된 권리자별 TSi에 대한 wf(Sg(TSi), W(TSi))값으로, 특정 권리자가 SS에 얼마나 큰 분쟁 예측 정보값을 가지는 지를 분석할 수 있으며, 특정 권리자의 TSi에 대하여 가장 wf(Sg(TSi), W(TSi))값이 큰 TSi를 생성하는 등과 같이 wf(Sg(TSi), W(TSi))별 랭킹을 생성할 수 있을 것이다. 이를 통해서 SS를 소유하거나 SS와 관련 있는 제품을 생산하는 기업을 공격할 가능성이 높은 특허들 및 권리자를 효과적으로 선별할 수 있게 된다. 한편, 기 설정된 wf(Sg(TSi), W(TSi)) 이상을 가지는 TSi를 분석하여 최빈 발명자를 찾아, 최빈 발명자별 wf(Sg(TSi), W(TSi)) 정보를 생성할 수도 있을 것이다. 한편, wf(Sg(TSi), W(TSi))가 기 설정된 기준 이상이 되는 TSi 중에서 개인 권리자나 중소기업의 TSi를 추출할 수도 있을 것이다.

분쟁 예측 함수인 f에 대하여 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 정보값 또는 분쟁 예측 함수값이 나오면 분쟁 예측 함수값을 어떻게 구조화시켜 분쟁 예측 정보를 생성할 것인지는 본 발명의 분쟁 예측 정보 생성부(5140)에서 수행하며, 생성된 분쟁 예측 모델은 분쟁 예측 모델이 사용할 수 있다. 한편, 분쟁 예측 결과를 어떻게 출력할 것인지는 분쟁 예측 결과 출력부에서 수행한다. 실제 pdf 형태의 리포트나 전자 우편용 리포트는 본 발명의 특허 분쟁 정보 리포트 생성부(4440)가 담당하여 생성한다.

이어, 도 45를 참조하면서, 상기 분쟁 예측 엔진(5100)이 분쟁 예측 정보값에 기반하여 기 설정된 등급 정보를 생성하는 방법을 설명한다. 상기 분쟁 예측 엔진(5100)은 자기 특허, 자기 특허 집합, 분할 자기 특허 집합 각각에 대한 타겟 특허, 타겟 특허 집합, 분할 타겟 특허 집합을 기준으로 한 분쟁 예측 모델값 또는 분쟁 예측 정보값을 생성(SL111)한 다음, 등급 부여 모델에 따른 등급 정보를 생성(SL112)한다. 적어도 하나 이상의 집합적 분쟁 예측 정보 생성 함수인 f에 대하여 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 정보값이나 분쟁 예측 함수값이 나오면, 기 설정된 등급 부여 모델에 따라, 분쟁 예측 등급을 결정할 수 있다. 등급 부여 모델은 분쟁 예측 함수값 구간별로 등급을 부여하거나, 분쟁 예측 함수값의 분포를 고려하여, 분포에 기반한 등급 구간을 정하고, 정해진 등급 구간으로 예측 등급을 부여할 수 있을 것이다. 점수값이 있을 때, 이를 n개의 등급으로 나누는 모델은 다수가 있으며, 이는 당업자에게 당연할 것이다.

이어, 특허 분쟁 예측 정보 생성 시스템(5000)의 모델을 업그레이드하는 방법에 대해 설명한다. 시간이 경과할수록 분쟁 발생 특허들이 추가되는 경우, 추가된 분쟁 발생 특허들을 포함시켜서 기존 분쟁 예측 요소 또는 새로운 분쟁 예측 요소 집합으로 분쟁 예측 모델을 생성하고, 생성된 분쟁 예측 모델로 분쟁 예측 정보 생성할 수 있게 된다. 즉, 시간의 경과에 따라 Pi별 분쟁 예측 요소값이 달라지게 되고, 분쟁 예측 요소값이 달라지면, 분쟁 예측 모델이 달라지게 되고, 분쟁 예측 모델값과 분쟁 예측 정보값도 달라지게 된다. 한편, 상기 특허 분쟁 예측 정보 생성 시스템(5000)은 상기 특허 분쟁 예측 정보 생성 시스템(5000)이 관리하는 적어도 하나 이상의 특허 집합과 상기 사용자가 관리하는 적어도 하나 이상의 특허 집합을 대상으로, 적어도 하나 이상의 분쟁 예측 모델값과 분쟁 예측 정보값을 기 설정된 주기 또는 기 설정된 조건에 따라 배치 생성할 수 있게 된다.

이어, 도 46 내지 도 47을 참조하면서, 본 발명의 분쟁 파급 예측 엔진(5600)의 정보 처리 방법을 설명한다. 상기 분쟁 파급 예측 엔진(5600)은 신규한 개별 분쟁 특허 또는 신규한 분쟁 특허 집합을 입수(SL121)한 다음, 입수된 개별 분쟁 특허별로 또는 신규한 분쟁 특허 집합별로 타겟 특허 집합을 생성(SL122)한다. 이어, 상기 분쟁 파급 예측 엔진(5600)은 상기 타겟 특허 집합을 대상으로 권리자 분석을 포함한 기 설정된 정량 분석을 수행함(SL123)한다. 상기 분쟁 파급 예측 엔진(5600)은 사용자로부터 적어도 하나 이상의 자기 특허 집합 또는 자기 특허 집합을 생성할 수 있는 조건을 입수하여 등록(SL131)한 다음, 주기적 또는 기 설정된 조건 충족 시 자기 특허 집합별 또는 자기 특허 집합을 구성하는 자기 특허별로 분쟁 예측 정보를 생성(SL132)한다. 이어, 상기 분쟁 파급 예측 엔진(5600)은 생성된 분쟁 예측 정보를 사용자에게 리포팅(SL133)한다. 이하, 분설한다.

상기 분쟁 파급 예측 엔진(5600)은 적어도 하나 이상의 신규한 분쟁 특허가 입수되는 경우, 신규 발생 분쟁 분석부(5610)를 통하여 상기 분쟁 특허를 분석하여, 상기 신규한 분쟁 특허에 관한 분석 정보를 생성하거나, 또는 신규 발생 분쟁 파급 예측부(5620)를 통하여 상기 신규한 분쟁 특허에 관한 분쟁 파급 예측 정보를 생성하거나, 분쟁 파급 알림부(5630)를 통하여 상기 신규한 분쟁 특허에 관한 알림 처리를 수행한다.

먼저 상기 신규 발생 분쟁 분석부(5610)가 분석하는 정보는 상기 신규한 분쟁 특허가 분쟁을 일으킨 회수 및 회수의 시계열적 분포, 분쟁 당사자(피고 등)의 중복 여부 및 상기 신규한 분쟁 특허가 포함된 분쟁들에서 분쟁 당사자별 분쟁의 시계열적 분포 등을 분석한다. 한편, 기 설정된 기간 단위로 신규한 분쟁 특허에 대한 기 설정된 정량 분석 처리할 수 있다. 상기 정량 분석 처리는 권리자별, 분쟁 제기자별, 분쟁 특허별, 피고별, 발명자별, 특허 분류별, 분쟁 제기 일자별 정량 분석 정보를 생성하는 것을 포함한다.

상기 신규 발생 분쟁 파급 예측부(5620)는 신규한 분쟁 특허 각각을 자기 특허(SSi)처럼 취급하여 하여, 본 발명의 상기 타겟 특허 집합 생성부(5120)를 이용하여, 상기 자기 특허의 출원일(최선일 또는 우선일 기준이어도 된다.) 기준으로 후출원 특허로 구성되는 TS를 생성한다. 상기 생성된 TS에 대하여 TSi의 권리자 분석을 포함한 기 설정된 정량 분석 처리를 수행한다. 한편, 상기 신규 발생 분쟁 파급 예측부(5620)는 2 이상의 신규한 분쟁 특허들로 이루어진 신규 분쟁 특허 집합을 자기 특허 집합을 구성하고, 상기 자기 특허 집합을 대상으로 상기 타겟 특허 집합 생성부(5120)를 이용하여, 상기 자기 특허 집합의 SSi의 출원일(최선일 또는 우선일 기준이어도 된다.) 기준으로 후출원이 되는 TSi(SSi)를 생성하고, 생성된 TSi(SSi)로 TS를 구성한다. 상기 생성된 TS에 대하여 TSi의 권리자 분석을 포함한 기 설정된 정량 분석 처리를 수행한다. 이때, 상기 타겟 특허 집합을 구성하는 TSi에 대해서는 본 발명의 기 설정된 분쟁 예측 모델값 및 가중치가 부여되어 있음은 물론이다 할 것이며, 상기 분쟁 예측 모델값과 상기 가중치는 본 발명이 정량 분석에 활용됨은 당연하다 할 것이다.

이어, 사기 분쟁 파급 알림부(5630)를 사용하여 사용자별로 alert 서비스를 제공하는 방법에 대해서 설명한다. 사용자는 적어도 하나 이상의 SS를 설정할 수 있으며, 자신과 관련된 경쟁사 등의 권리자, 자신의 관심 특허, 자신의 관심 기술군(특허 분류로 등록) 등을 등록해 놓을 수 있다. 이때, 신규 특허 데이터의 발생 또는 권리자 변동 등과 같이 전체 특허 데이터에서 변동이 일어나거나, 새로운 트롤의 추가, 표준 특허풀의 추가 등이 발생하거나, 주기적으로 분쟁 발생 특허가 추가되는 경우, 상기 SS마다의 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 함수값이 변동되게 된다. 이때, 특정 시점(t=t1)에서의 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 함수값과 다른 시점(t=t2)에서의 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 함수값에서 기 설정된 값 이상이 변동되는 경우, 상기 시스템은 상기 사용자에게 변동의 발생 등에 대한 정보를 제공해 줄 수 있게 된다. 예를 들어, 최근 1달간에 특정 트롤이 그 트롤의 자회사로 적어도 하나 이상의 타인으로부터 n개의 특허를 매입(current assignee 정보로 알 수 있음)하는 event가 발생한 경우, 그 n개의 특허의 권리자 변동에 따라 현시점(t=t2)에서의 SS에 대한 상기 f(TS) 또는 f(TSui)별로 분쟁 예측 함수값에서 기 설정된 값 이상이 변동이 발생하여, 사용자에게 특허 분쟁 위험성이 현격하게 증가할 수도 있게 된다. 물론, 상기 시스템은 n개의 특허가 있을 때, 상기 특허에 대한 기 설정된 정량 분석(권리자 분석, 기술 분야 분석, 시계열 분석 등)을 수행해 줄 수 있음은 물론일 것이며, n개의 특허가 인용하는 parent 특허 집합을 입수해 줄 수 있을 것이며, parent 특허 집합에 대해서도 기 설정된 정량 분석을 수행해 줄 수 있을 것이다.

이어, 도 48을 참조하면서, 본 발명의 특허 분쟁 예측 정보 생성 시스템(5000)을 활용하여 리스크 헤징 예측 정보 생성에 대해 설명한다. 상기 리스크 헤징 예측 정보의 생성은 본 발명의 리스크 헤징 정보 생성부가 담당한다. 도 48에는 상기 리스크 헤징 정보 생성부의 정보 처리 방법의 일 실시예적 구성이 나와 있다. 상기 리스크 헤징 정보 생성부는 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 보완 특허 집합을 입수하거나, 적어도 하나 이상의 특허를 포함하는 보완 특허 집합을 먼저 입수하고 보완 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수(SL141)하고, 상기 보완 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수(SL142)하고, 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 리스크 헤징 예측 정보를 생성(SL143)한다. 이하, 더욱 더 상세하게 설명한다.

리스크 헤징 예측 정보에는 상기 SS와 관련된 TS가 있을 때, 상기 TS 전체 또는 분할된 적어도 하나 이상의 분할 TS에 대하여 특허 공격을 예상할 수 있는 보완 특허 집합의 일종인 리스크 헤징 특허 집합(Risk Hedging Set, RHS)를 생성하는 것과 RHS 중 이들 중 SS 또는 SS의 생성자가 지정하는 기 설정된 관계를 가지는 보완 특허 집합의 일종인 크로스 라이센싱 특허 집합(Cross Licensing Set, CLS)를 생성하는 것이 있다. 먼저 상기 리스크 헤징 정보 생성부가 RHS를 생성하는 방법에 대해서 설명한다. 상기 리스크 헤징 정보 생성부는 상기 TS 전체 또는 적어도 하나 이사의 분할 TS에 대한 사용자 또는 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 선택 정보를 입수한다. 상기 분할 TS는 상기 TS 중에서 권리자별 또는 특정 속성을 가지는 권리자별(트롤, 경쟁사, 분쟁 제기자, 분쟁 경험자 등)로 된 분할 TS일 수 있으며, 이들 중에서 분할 TS를 대상으로 특히 상기 wf(Sg(TSi), W(TSi))가 높은 분할 TSi를 다수 포함하고 있는 분할 TS나, 분할 TS를 대상으로 상기 f(TS)가 높은 분할 TS일 수 있다.

상기 리스크 헤징 정보 생성부는 상기 TS 또는 분할 TS(이하, 재투입 TS라 한다.)를 SS처럼 취급할 수 있다. 상기 재투입 TS를 마치 자기 특허 집합처럼 처리하면, 상기 타겟 특허 집합 생성부(5120)는 상기 재투입 TS에 대한 타겟 특허 집합인 TS(재투입 TS)를 생성하게 된다. 상기 분쟁 예측 요소값 생성부(5510)는 상기 TS(재투입 TS)를 구성하는 타겟 특허인 TSi(재투입 TS)에 대하여, 상기 표 1 내지 표 4의 분쟁 예측 요소별 분쟁 예측 요소값을 생성한다. 상기 분쟁 예측 모델값 입수부(5130)는 상기 생성된 상기 TSi(재투입 TS)의 분쟁 예측 요소값에 대한 분쟁 예측 모델값을 입수한다. 상기 분쟁 예측 정보 생성부(5140)는 상기 TSi(재투입 TS)에 대한 기 설정된 일체의 정보를 생성한다. 상기 분쟁 예측 정보 생성부(5140)가 생성하는 정보는 wf(Sg(TSi(재투입 TS)), W(TSi(재투입 TS))) 또는 f(TS(재투입 TS))일 수 있다.

상기 리스크 헤징 정보 생성부는 TSi(재투입 TS) 중 wf(Sg(TSi(재투입 TS)), W(TSi(재투입 TS)))가 기 설정된 수준 이상이 되는 특허나, wf(Sg(TSi(재투입 TS)), W(TSi(재투입 TS)))가 기 설정된 수준 이상이 되면서 그 출원인이 개인, 중소기업, 대학, 기관이 되거나, 기 설정된 리스크 헤징 속성을 가지는 권리자의 특허인 보완 특허 후보군 내지는 보완 특허군을 선별한다. 리스크 헤징 속성을 SS 또는 SS의 생성자의 입장에서 리스크를 헤징할 수 있는 속성으로, 자신을 공격할 가능성이 있는 자를 반격할 수 있거나 기타 특허 분쟁 리스크를 줄일 수 있는 속성을 말하며, 상기 속성이 강할수록 강한 보완 특허가 된다. 만약 SS에 특허 분쟁 위험이 높은 특정 권리자의 특허로 구성되는 TS가 특정한 특허군 A로부터 분쟁 위험 가능성이 높다면, 상기 특정한 특허군 A는 SS의 입장에서는 TS로부터의 리스크를 헤징할 가능성이 높은 보완 특허군이 된다. 따라서, 상기와 같은 보완 특허군 A를 발견하는 것이 상기 리스크 헤징 정보 생성부가 수행하는 정보 처리이다.

상기 분할 TS는 상기 특허 집합 분할부(5310)에서 수행한다. 상기 특정 권리자의 분할 TS가 있는 경우, 상기 리스크 헤징 정보 생성부는 상기 특허 집합 분할부(5310)로 하여금 상기 특정 권리자의 분할 TS에 대하여 다양한 분할 정책에 따른 적어도 하나 이상의 재분할 TS를 생성하도록 제어한다. 상기 재분할 TS별로 상기 리스크 헤징 정보 생성부는 TSi(재분할 TS) 중 wf(Sg(TSi(재분할 TS)), W(TSi(재분할 TS)))가 기 설정된 수준 이상이 되는 특허나, wf(Sg(TSi(재분할 TS)), W(TSi(재분할 TS)))가 기 설정된 수준 이상이 되면서 그 출원인이 개인, 중소기업, 대학, 기관이 되거나, 기 설정된 리스크 헤징 속성을 가지는 권리자의 특허를 선별한다. 상기 리스크 헤징 정보 생성부가 여러 개의 재분할 TS를 생성하고, 생성된 재분할 TS에 대한 특허군 A를 발견하는 것은 일종의 시뮬레이션일 수 있다. 한편, 상기 재분할은 상기 특정 권리자의 분할 TS를 구성하는 분할 TSi에 대하여 클러스터링을 적용하여, n개의 클러스터링 된 재분할 TS를 구성하거나, 상기 분할 TSi를 특허 분류별로 나누어 여러 개의 재분할 TS를 생성할 수 있을 것이다. 상기 재분할 TS별로 상기 리스크 헤징 정보 생성부가 정보 처리하는 것은 분할 TS의 권리자에 대한 반격을 고려할 때, 상기 분할 TS라는 넓은 범위를 대상으로 한 반격 가능한 특허군 A를 찾을 수도 있지만, 여러 개의 재분할 TS라는 좁은 범위를 대상으로 한 특화되면서도 강력한 반격 가능한 특허군 B를 찾을 수도 있기 때문이다.

이어, 도 49를 참조하면서, 본 발명의 크로스 라이센싱 정보 생성부(5340)의 정보 처리 방법에 대해서 설명한다. 상기 크로스 라이센싱 정보 생성부(5340)는 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 보완 특허 집합을 입수하거나, 적어도 하나 이상의 특허를 포함하는 보완 특허 집합을 먼저 입수하고 보완 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수(SL151)한 다음, 상기 보완 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 분쟁 예측 모델값을 입수(SL152)하고, 특허별 분쟁 예측 모델값을 활용하여 적어도 하나 이상의 크로스 라이센싱 예측 정보를 생성(SL153)한다. 이하, 더욱 더 상세히 설명한다.

상기 크로스 라이센싱 특허군은 본 발명의 크로스 라이센싱 정보 생성부(5340)가 생성한다. 상기 크로스 라이센싱 정보 생성부(5340)는 상기 분할 TS라는 넓은 범위를 대상으로 한 반격 가능한 특허군 A나 여러 개의 재분할 TS라는 좁은 범위를 대상으로 한 특화되면서도 강력한 반격 가능한 특허군 B 중에서 상기 SS에 포함되거나, SS를 생성하는 자가 지정하는 권리자(가장 대표적인 것이 자사, 계열사, 하청사, 원청사나 협력사, 특별한 관계를 맺고 있는 개인, 기관, 대학 등이 될 수 있다.)의 특허를 추출한다. 한편, 상기 크로스 라이센싱 정보 생성부(5340)는 상기 분할 TS에 대하여, TS(분할 TS)의 생성 시, 상기 SS 나, SS를 생성하는 자가 지정하는 권리자(가장 대표적인 것이 자사, 계열사, 하청사, 원청사나 협력사, 특별한 관계를 맺고 있는 개인, 기관, 대학 등이 될 수 있다.)의 특허를 한정하여 자신이 원하는 속성을 가지는 특허만을 대상으로 한정하여 상기 타겟 특허 집합 생성부(5120)를 통하여 TS(분할 TS)를 생성할 수 있다. 한편, 상기 크로스 라이센싱 정보 생성부(5340)는 상기 분쟁 예측 정보 생성부(5140)를 제어하여 상기 TS(분할 TS)를 구성하는 개별 특허인 TSi(분할 TS)에 대하여 wf(Sg(TSi(분할 TS)), W(TSi(분할 TS)))나, f(TS(분할 TS))를 생성하도록 한다. 통상적으로 SS와 TS(분할 TS)와는 일치하는 특허가 없을 가능성이 크나, SS를 구성하는 특허가 다수 있고, SS를 구성하는 특허들의 출원일이 넓게 분포되어 있으며, 일치하는 특허가 발생할 가능성도 배제하지 못한다.

이어, 본 발명의 특허 분쟁 예측 정보 생성 시스템(5000)을 구성하는 각 엔진과 DB 및 기능부를 활용하는 응용 시스템의 구성 및 그 응용 시스템의 정보 처리 방법에 대해서 설명한다. 대표적인 응용 시스템으로 특허 라이센싱 예측 모델 생성 시스템이 있다. 도 50에는 특허 라이센싱 예측 정보 생성 시스템(6000)의 일 실시예적 구성이 제시되어 있으며, 도 51에는 특허 라이센싱 예측 정보 생성 시스템(6000)의 정보 처리 방법에 대한 일 실시예적 구성이 제시되어 있다.

먼저 특허 라이센싱 예측 정보 생성 시스템(6000)부터 설명한다. 특허 분쟁이 발생하는 경우, 라이센싱으로 분쟁이 종료되는 경우가 많으며, 라이센싱 협상이 실패한 경우, 분쟁으로 비화되는 경우도 많다. 따라서, 특허 분쟁은 라이센싱과 동전의 양면 관계에 있다. 따라서, 특허 분쟁 예측 정보 생성 시스템(5000)의 기능을 대부분 그대로 활용하면, 특허 라이센싱 예측 정보 생성 시스템(6000)을 구성할 수 있게 되며, 대부분의 기능 모듈은 특허 라이센싱 예측 정보 생성 시스템(6000)의 경우와 특허 분쟁 예측 정보 생성 시스템(5000)의 경우에서 동일하게 작동한다. 다만, 특허 라이센싱 예측 정보 생성 시스템(6000)의 경우에는 특허 분쟁 예측 정보 생성 시스템(5000)과는 달리 상기 타겟 특허 집합 생성부(5120) 는 기 설정된 관련성을 가진 유사 특허군을 생성할 때, 자기 특허 집합의 SSi보다 후출원인 TSi를 대상으로 타겟 특허 집합을 생성한다는 큰 차이가 있다.

특허 분쟁 예측 정보 생성 시스템(5000)과 특허 라이센싱 예측 정보 생성 시스템(6000)의 관계에서 분쟁 예측 요소는 라이센싱 예측 요소에 대응되며, 분쟁 예측 모델은 라이센싱 예측 모델에 대응될 수 있으며, 분쟁 DB부(5200)는 라이센싱 DB부(6200), 분쟁 예측 정보 분석 엔진(5300)은 라이센싱 예측 정보 분석 엔진(6300), 분쟁 예측 관리부(5400)는 라이센싱 예측 관리부(6400), 분쟁 예측 모델 생성 엔진(5500)은 라이센싱 예측 모델 생성 엔진(6500)에 대응되며, 분쟁 예측 엔진(5100)은 라이센싱 예측 엔진(6100)에, 분쟁 예측 모델값 입수부(5130)는 라이센싱 예측 모델값 입수부(6130), 분쟁 예측 정보 생성부(5140)는 라이센싱 예측 정보 생성부(6140), 분쟁 예측 정보값 생성 모듈(5142)은 라이센싱 예측 정보값 생성 모듈(6142), 분쟁 예측 정보값 제공부(5150)는 라이센싱 예측 정보값 제공부(6150), 분쟁 예측 요소값 DB(5220)는 라이센싱 예측 요소값 DB(6220), 분쟁 예측 모델값 DB(5230)는 라이센싱 예측 모델값 DB(6230), 분쟁 예측 시스템 관리부(5420)는 라이센싱 예측 시스템 관리부(6420), 분쟁 예측 정보 배치 생성부(5421)는 라이센싱 예측 정보 배치 생성부(6421), 분쟁 예측 사용자 관리부(5430)는 라이센싱 예측 사용자 관리부(6430), 분쟁 UI부(5431)는 라이센싱 UI부(6431)로, 분쟁 예측 요소값 생성부(5510)는 라이센싱 예측 요소값 생성부(6510), 분쟁 예측 모델 생성부(5520)는 라이센싱 예측 모델 생성부(6520), 특허별 분쟁 예측 모델값 생성부(5530)는 특허별 라이센싱 예측 모델값 생성부, 분쟁 예측 모델값 제공부(5540)는 라이센싱 예측 모델값 제공부(6540), 공격 예상 정보 생성부는 라이센싱 예상 정보 생성부가 대응되므로, 특허 라이센싱 예측 정보 생성 시스템(6000)의 구성 및 정보 처리 방법에 대한 설명은 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 설명에서 상기의 대응되는 용어로 변경하는 것으로 당업자에게 충분할 것이다.

한편, 특허 라이센싱 예측 정보 생성 시스템(6000)에서도 특허 분쟁 예측 정보 생성 시스템(5000)의 분쟁 발생 특허 DB (5210)(6210), 분쟁 데이터 입수부(5410)(6410)는 동일하게 사용되며, 자기 특허 집합 생성부(5110)(6110), 타겟 특허 집합 생성부(5120)(6120), 인용 특허 집합 생성부 (5121)(6121), 유사 특허군 생성부(5122)(6122), 유사 기술 특허군 생성부(5123)(6123), 타겟 집합 입수부(5124)(6124), 옵션 처리부(6125)(5125), 다중 관계성 처리 모듈(5141)(6141), 가중치 조절부(5143)(6143)도 동일하게 사용된다. 특히, 상기 특허 라이센싱 예측 정보 생성 시스템(6000)이 라이센싱 예측 요소와 라이센싱 예측 모델을 생성할 때는 분쟁 발생 특허와 비분쟁 발생 특허를 사용하여 생성하므로, 분쟁 발생 특허 DB (5210)(6210)와 분쟁 데이터 입수부(5410)(6410)는 특허 분쟁 예측 정보 생성 시스템(5000)과 동일한 명칭으로 유지되게 된다. 본 문단에서는 특허 라이센싱 예측 정보 생성 시스템(6000)과 특허 분쟁 예측 정보 생성 시스템(5000)에서 명칭 변경 없이 동일하게 사용되는 구성 요소들에 대해서는 도면 부호를 병기하였다.

도 51에서 제시되는 바와 같이, 상기 특허 라이센싱 예측 정보 생성 시스템(6000)은 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 먼저 입수하고 자기 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하거나, 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, 타겟 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 자기 특허 집합을 입수(SL161)하고, 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 라이센싱 예측 모델값을 입수(SL16)하고, 특허별 라이센싱 예측 모델값을 활용하여 적어도 하나 이상의 라이센싱 예측 정보를 생성(SL163)한다. 상기 상기 특허 라이센싱 예측 정보 생성 시스템(6000)의 라이센싱 예측 정보의 생성은 상기 특허 분쟁 예측 정보 생성 시스템(5000)의 분쟁 예측 정보의 생성 방법을 준용하며, 준용되는 개별적인 라이센싱 예측 정보 생성 방법은 상기에서 상술한 분쟁 예측 정보의 생성 방법을 통하여 당업자에게 자명할 것이므로, 상세한 설명은 생략한다.

이어, 상기 특허 분쟁 정보 처리의 핵심이 되는 요소 기술 중의 하나인 집단 단위 인용 분석 정보 생성 방법에 대하여 도면을 참조하면서 상술한다.

도 6에는 본 발명의 집합 단위 인용 분석(4500)에 대한 일 실시예적 구성이 제시되어 있다. 상기 집합 단위 인용 분석(4500)는 적어도 2 이상의 복수 개의 특허 정보로 구성되는 특허 집합을 입수하여 입수 특허 집합을 생성하는 입수 특허 집합 생성부(4510)와 상기 입수된 자기 특허 집합에 포함된 개별 특허를 처리하여 적어도 하나 이상의 인용 특허 집합을 생성하는 대상 특허 집합 생성부(4520)와 상기 인용 특허 집합에 대하여 기 설정된 적어도 하나 이상의 인용 분석 목적별에 따른 인용 분석을 처리하는 인용 분석부(4530);를 포함하고 있다.

입수 특허 집합 생성부(4510)는 특허 집합을 입수하는 특허 집합 입수부(4511)과 입수한 특허 집합을 한정하는 입수 특허 집합 한정부(4512)를 포함하고 있다. 상기 입수 대상 특허 집합 생성부(4520)은 대상 특허 집합을 입수하는 대상 특허 집합 입수부(4522)과 대상 특허 집합을 한정하는 대상 특허 집합 한정부(4521)를 포함하고 있다. 대상 특허 집합 입수부(4522)가 입수하는 특허 집합은 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 인용 발생 입수 특허 집합 등이 있을 수 있다. 입수 대상 특허 집합 생성부(4520)이 특정한 조건을 가하여 대상 특허 집합을 한정하는 경우, 상기 조건을 반영하여, 데이터부(1000)로부터 대상 특허를 입수해 온다. 입수된 대상 특허군으로 상기 인용 특허 집합 생성부(4523)은 인용 특허 집합을 생성한다. 상기 인용 분석부(4530)는 인용 분석 목적을 선택하는 인용 분석 목적 선택부(4531)과 선택된 목적으로 인용 분석을 수행하는 인용 분석 실행부(4532)를 포함하고 있다. 한편, 상기 특허 정보 시스템(10000)은 적어도 하나 이상의 카데고리별로 특허 집합을 생성하고 관리할 수 있으며, 상기 특허 집합의 관리는 본 발명의 시스템 특허 집합 관리부이 수행한다. 상기 시스템 특허 집합 관리부의 하부에는 출원인별로 특정되는 특허 집합을 관리하는 출원인별 특허 집합 관리부와, 특허 분류별로 특정되는 특허 집합을 관리하는 특허분류별 특허 집합 관리부와 기타 분류나 카테고리별로 특정되는 특허 집합을 관리하는 기타 분류별 특허 집합 관리부등이 있다.

한편, 사용자들이 생성하는 특허 집합은 회원별 특허 집합 관리부가 수행한다.

특허 데이터부(1100)는 도 2에서 예시되어 있듯이, 특허 명세서 파일부(1110), 특허 DB(1120), 특허 분류 DB(1130) 등을 포함하고 있다. 특허 DB(1120)부는 모든 특허에 대한 서지 사항과 명세서 본문, 도면 등을 필드별로 관리하며, 상기 명세서 본문을 구성하는 각종 필드(제목, 요약, 선행 기술, 특허 청구 범위, 발명의 상세한 설명 등)에서 추출한 핵심 키워드를 포함하고 있다. 한편, 상기 특허들은 상기 특허들에 대한 선행 기술 문건으로 인용 정보를 더 포함하고 있을 수 있다. 미국 특허 data를 예로 들면, 상기 인용 정보는 Reference에 포함된 정보들로, 미국 특허 문건 번호, 외국 특허 문건 번호, 비분쟁 특허 문건에 대한 표시자 등이 포함되어 있다. 한편, 특허청 심사관이나 관련자에 의한 선행 기술 조사 정보, 심사관 의견 제출 시 참증 정보 등도 광의의 인용 정보가 된다. 특정 문건에 전방 인용 정보가 있는 경우, 상기 전방 인용 정보에 포함된 문건의 입장에서 보면 상기 특정 문건은 후방 인용 문건이 된다. 특정 문건을 기준으로 전방 인용 정보에 포함된 문건은 부모(parent) 문건이 되며, 상기 부모 문건을 기준으로 보면 상기 특정 문건은 자식(child) 문건이 된다. 이러한 child-parent 관계에 있는 정보를 DB로 처리하는 것은 당업자에게는 자명한 것으로 상세한 설명은 생략한다.

특허 문건의 서지 사항에는 발행 국가 정보, 각종 일자 정보, 각종 번호 정보, 적어도 하나 이상의 권리자 정보, 적어도 하나 이상의 발명자 정보, 적어도 하나 이상의 특허 분류 정보, 적어도 하나 이상의 우선권 정보 등이 포함되어 있다. 일자에는 출원일, 공개일, 등록일 및 기타 일자들이 있다. 각종 번호 정보에는 출원번호, 공개번호, 등록번호, 원출원 번호, 우선권 주장 번호 등이 있다. 권리자 정보는 출원인, 양수인, 특허권자 등이 있으며, 권리자의 변동이 있고, 변동이 관리되는 경우, 양도인과 양수인에 대한 정보 및 최종 권리자 정보가 있을 수 있다. 우선권 정보에는 우선권 주장 번호, 주장일자, 국가 등의 정보가 포함되어 있다. 한편, 분할출원이나 일부 계속 출원, 계속 출원 등이 있는 경우, 원출원 번호, 원출원일자 등의 정보가 부가되어 있다. 또한, 대표도, 제목, 요약, 색인어 등도 서지 사항에 포함되기도 한다. 한편, 가공된 서지 사항으로는 국내 패밀리 정보(분할출원, 변경출원이나 일부계속출원, 계속출원 관계에 있는 특허 출원)이나, 해외 패밀리 정보(조약 우선권 관계로 연관될 수 있는 출원, 국제출원 등)이 있을 수 있다. 한편, 자연어 처리 등을 통해서 특허 명세서 본문의 텍스트를 본문을 구성하는 각 필드별 또는 필드 통합별로 기 설정된 키워드 추출 방식으로 추출한 핵심 키워드 정보가 더 있을 수 있다. 특허 분류 정보는 공통적인 IPC 이외에도 USPC, FT, FI, ECLA 등과 같이 각 국가별로 자국만의 특별한 특허 분류가 있을 수 있다.

이어, 집합 단위 인용 분석(4500)의 정보 처리 방법을 더욱 더 자세히 설명한다.

상기 입수 특허 집합 생성부(4510)은 적어도 2 이상의 복수 개의 특허 정보로 구성되는 입수 특허 집합을 입수 받고, 상기 대상 특허 집합 생성부(4520)는 상기 입수 특허 문건 집합에 포함된 개별 특허를 처리하여 적어도 하나 이상의 대상 특허 집합을 생성하고, 상기 인용 분석부(4530)는 상기 대상 특허 집합에 대하여 기 설정된 적어도 하나 이상의 인용 분석을 처리한다.

한편, 도 20에서 알 수 있듯이, 상기 집합 단위 인용 분석(4500)는 입수 특허 집합 한정부(4512) 또는 옵션 선택부(4340)를 통하여 입수 특허 집합 또는 대상 특허 집합에 대한 한정을 수행하고, 상기 인용 분석 목적 선택부(4531)를 통하여 인용 분석 목적에 대한 선택 정보를 입수하고, 상기 인용 특허 집합 생성부(4523)를 통하여 한정된 특허 집합을 대상으로 인용 분석의 대상이 되는 인용 특허 집합 생성하고, 인용 분석 목적 선택부(4531)과 인용 분석 실행부(4532)를 통하여 인용 분석 대상 집합에 포함된 특허들을 대상으로 인용 분석 목적에 따른 분석 정보 생성한다.

본 발명의 인용 분석부(4530)는 인용 분석 목적 선택부(4531)를 활용하여 사용자로부터 인용 목적에 대한 선택을 입수 받는다. 인용 분석 목적은 인용 분석 결과에 나타나는 주요 정보가 무엇에 관한 것인지를 나타낸다. 인용 분석 목적의 예시로는 총량, 출원인/권리자, 발명자, 특허 분류, 개별 특허가 있을 수 있다. 상기 인용 분석 실행부(4532)는 인용과 관련된 기 설정된 특허 집합이 있는 경우, 상기 특허 집합에서의 특허 총량, 출원인/권리자별 특허 총량이나 시기별 특허 총량, 특허 분류별 특허 총량이나 시기별 특허 총량 등과 같은 기 설정된 적어도 하나 이상의 정량 분석을 수행할 수 있다. 상기 인용 분석 실행부(4532)에는 정량 분석을 수행하는 정량 분석부를 포함하고 있다. 상기 정량 분석은 필드별로 수행할 수도 있다. 한편, 상기 정량 분석은 시계열 분석을 포함하고 있을 수 있으며, 필드별 시계열 분석도 상기 정량 분석에 포함된다.

인용 방향은 전방 또는 후방 또는 인용 발생 입수 특허 집합 자체 중 어느 하나가 된다. 한편, 전방 인용 특허 집합이나 후방 인용 특허 집합은 중복을 허용하는 것인 타당하나 특수한 경우에는 중복을 허용하지 않는 선택을 사용자가 할 수 있다. 즉, 입수 특허 집합에 속하는 n개의 특허(I1,,,, ,In)가 동일한 특허 Pi를 인용하고 있는 경우, Pi는 n회의 가중치를 가지는 것으로 취급해야 함이 더 타당하다. 통상적으로 집합 연산(합집합 연산)을 수행하면, 중복되는 원소(Pi들)는 중복이 제거되어 1회로 취급되는데, 인용 분석의 취지상 이렇게 되는 것은 타당하지 않다. 따라서, 각 Pi들은 빈도(frequency) n을 유지하면서 처리되어야 한다.

한편, 한정이 있거나, 한정이 없는 상기 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 인용 발생 입수 특허 집합 등을 구성하는 특허군에 대하여 rising 분석(증감율 분석)을 수행할 수 있다. rising 분석이란, 개별적인 출원인별, 발명자별, 특허 분류별, 키워드별(키워드 쌍을 포함한다), 개별 문건별 또는 공동출원인별, 공동 발명자별, 특허 분류쌍별, 키워드 쌍별로 빈도 등에 대한 시계열 분석을 수행할 수 있게 된다. 한편, 상기 한정이 있거나, 한정이 없는 상기 전방 인용 특허 집합, 후방 인용 특허 집합, 전방 자기 인용 특허 집합, 후방 자기 인용 특허 집합, 인용 발생 입수 특허 집합 등을 구성하는 특허군에 대하여 신규 진입 분석을 수행할 수 있다. 신규 진입 분석이란, 특정한 cutoff(threshold)인 특정 시점을 정해 놓고, 그 시점 이전에는 없고 그 시점 이후에만 발생한 개별적인 출원인, 발명자, 특허 분류, 키워드, 개별 문건 또는 공동출원인, 공동 발명자, 특허 분류쌍, 키워드쌍을 추출할 수 있을 것이다. 한편, 신규 진입 분석의 일종으로 특정한 cutoff를 기준으로 출원인, 발명자, 특허 분류, 키워드, 개별 문건 또는 공동출원인, 공동 발명자, 특허 분류쌍, 키워드쌍의 빈도의 rising speed가 큰 출원인, 발명자, 특허 분류, 키워드, 개별 문건 또는 공동출원인, 공동 발명자, 특허 분류쌍, 키워드쌍을 추출할 수 있을 것이다.

한편, 인용 분석의 결과에 나오는 모든 수치마다에는 그 수치가 나온 조건이 할당될 수 있으므로(모든 조건은 SQO문으로 한정할 수 있다.) 그 수치에 클릭을 하면, 그 수치에 대응되는 특허 문건들을 호출할 수 있을 것임은 당업자에게 용이할 것이다. 이렇게 되면, 분석 수치에 대응되는 특허 문건을 입수 특허 집합으로 하여 다시 인용 분석을 수행할 수 있게 된다.

한편, 상기 네트워크 분석부(4700)는 공동 피고간의 연관 관계(association)을 네트워크를 분석할 수 있으며, 상기 데이터 시각화부(4710)는 공동 피고간의 네트워크를 시각화시킬 수 있게 된다. 예를 들어, 특허 분쟁i에 대하여, 피고i와 적어도 하나 이상의 피고j가 공동 피고가 되는 경우나, 분쟁 특허i에 대하여 피고i와 적어도 하나 이상의 피고j가 공동 피고가 되는 경우, 적어도 하나 이상의 특허 분쟁i를 포함하는 특허 분쟁 그룹별 또는 적어도 하나 이상의 분쟁 특허i를 포함하는 분쟁 특허 그룹별로 공동 피고간의 네트워크 분석을 수행할 수 있게 된다. 한편, 상기 네트워크 분석부(4700)는 분쟁 특허i마다 또는 특허 분쟁i마다 원고가 있으므로, 적어도 하나 이상의 특허 분쟁i를 포함하는 특허 분쟁 그룹별 또는 적어도 하나 이상의 분쟁 특허i를 포함하는 분쟁 특허 그룹별로 원고와 공동 피고를 포함하여 네트워크 분석을 수행할 수 있다. 이때, 원고와 피고 간의 관계는 방향성을 가지고, 공동 피고 간의 관계는 방향성이 없이 처리할 수 있게 된다. 이 경우, 특허 분쟁 그룹별 또는 분쟁 특허 그룹별로 네트워크 분석을 수행할 때, 원고의 개수가 가장 많게 되므로, 원고가 중심에 서게 된다. 상기 네트워크 분석부는 임의의 연관 관계를 네트워크 분석을 수행할 수 있다. 상기 네트워크 분석부(4700)가 분석하는 상기 연관 관계는 임의의 특허 집합을 기준으로, 동일한 특허 문건에 포함되는 다수의 핵심 키워드가 있을 경우나, 적어도 2 이상의 특허 분류가 있는 경우나, 적어도 2 이상의 발명자가 있는 경우나, 적어도 2 이상의 출원인이 있는 경우나, 적어도 2 이상의 인용 특허 문건이 있는 경우에도 동일하게 적용될 수 있다. 이와 같이, 단일한 대상에 2 이상의 대상이 동시에 존재하는 경우, 상기 단일한 대상이 n개 있을 때, 동시에 존재하는 상기 2 이상의 대상은 연관 관계를 가지게 되며, 네트워크 분석의 대상이 된다.

본 발명은 특허 정보 산업, 특허 정보 분석 산업, 법률 산업, 특허 컨설팅 산업, R&D 등에 광범위하게 활용될 수 있다.

100 : 사용자 컴퓨터
1000 : 데이터부
10000 : 특허 정보 시스템
1100 : 특허 데이터부
1110 : 특허 명세서 파일부
1120 : 특허 DB
1130 : 특허분류 DB
1140 : 기타 특허 데이터 DB
1200 : 비특허 데이터부
1210 : 비특허 파일부
1220 : 비특허 DB
1230 : 기업정보 DB
1240 : 기타 비특허 데이터 DB
1300 : 핵심 키워드 DB
131-1 : 기술 키워드 공기쌍 DB
131 : 기술 키워드 DB
1310 : 핵심 키워드 메타 데이터 DB
1311 : 키워드 관계성 DB
1312 : 특허 분류별 대표 키워드 DB
132-1 : 제품 키워드 공기쌍 DB
132 : 제품 키워드 DB
133-1 : 키워드 구문 공기쌍 DB
133-2 : 구문 키워드 공기쌍 DB
133-3 : 패턴별 구문 DB
133 : 구문 키워드 DB
1400 : 분류 메타데이터 DB
1700 : 사용자 데이터부
1800 : 기타 DB
1900 : 목적 특화 데이터부
1910 : 출원인 DB
1920 : 규칙 데이터부
1930 : 언어 데이터부
1940 : 표준 특허풀 데이터부
200 : 유무선 네트워크
2000 : 데이터 가공부
20000 : 목적 특화 시스템부
2032 : 인용 분석용 데이터 생성부
2100 : 핵심 키워드 생성부
21000 : 니치 기술 영역 발견 시스템
2110 : 키워드 추출부
2120 : 핵심 키워드 선정부
2130 : 구문 키워드 생성부
2140 : 핵심 키워드 메타 정보 생성부
2150 : 제품 키워드 생성부
2200 : 분류 메타 데이터 생성부
22000 : 특허 자동 평가 시스템
2210 : 분류 대표 핵심 키워드군 생성부
2220 : 분류간 맵핑 정보 생성부
2230 : 핵심 키워드 계층화부
2240 : 특허 자동 분류부
2300 : 목적 특화 데이터 생성부
23000 : 미래 기술 예측 시스템
2310 : 통계 분석용 데이터 생성부
2330 : 발견 분석용 데이터 생성부
2400 : 유사 특허 집합 생성부
24000 : 융합 정보 처리 시스템
2410 : 클러스터링 처리부
2500 : 네트워크 데이터 생성부
2510 : 노드 데이터 생성부
2520 : 에지 데이터 생성부
300 : 연계 시스템
3000 : 특허 정보 서비스 지원부
3100 : 검색 처리부
3110 : 검색 엔진부
3120 : DB 쿼리 처리부
3200 : 회원용 관리부
3210 : 회원 data부
3211 : 회원 문건 DB
3212 : 회원 맵핑 정보 DB
3213 : 회원 과금 DB
3220 : 회원 디렉토리 생성부
3230 : 회원 플래그 생성부
3240 : 회원 맵핑 정보 생성부
3241 : 회원 키워드 맵핑 정보 생성부
3242 : 회원 출원인 맵핑 정보 생성부
3300 : 플랫폼 서비스 제공부
3310 : 웹서비스 제공부
3311 : 웹서비스 계정 관리부
3312 : 웹서비스 인터페이스부
4000 : 특허 분석 정보 생성부
4100 : 분석 대상 입수부
4200 : 특허 분석 처리부
4210 : 분석 지표 DB
4220 : 분석 명령 구문 DB
4300 : 분석 옵션 처리부
4310 : 데이터 한정 옵션 처리부
4310 : 비교 분석부
4320 : What If 분석부
4320 : 표시 옵션 처리부
4330 : 기타 옵션 처리부
4330 : 편입/협의 분석부
4340 : 연관 분석부
4340 : 옵션 선택부
4341-1 : 기간 한정부
4341-2 : 국가 한정부
4341-3 : 출원인 한정부
4341-4 : 발명자 한정부
4341-5 : 특허 분류 한정부
4341-6 : 필드 속성 한정부
4341-7 : 개별 필드값 한정부
4341-8 : 개별 특허 속성값 한정부
4341-9 : 기타 한정부
4350 : Risk/기회 분석부
4360 : 2X2 분석부
4370 : 오픈이노베이션 대상 발견부
4400 : 분석 결과 리포팅부
4410 : 표 생성부
4420 : 차트 생성부
4430 : 다이어그램 생성부
4440 : 리포트 생성부
4500 : 집합 단위 인용 분석부
4510 : 입수 특허 집합 생성부
4511 : 특허 집합 입수부
4512 : 입수 특허 집합 한정부
4520 : 대상 특허 집합 생성부
4521 : 대상 특허 집합 한정부
4522-1 : 인용 특허 집합 입수부
4522-2 : 피인용 특허 집합 입수부
4522 : 대상 특허 집합 입수부
4523 : 인용 특허 집합 생성부
4530 : 인용 분석부
4531 : 인용 분석 목적 선택부
4532 : 인용 분석 실행부
4600 : 분석 결과 리포팅부
4700 : 네트워크 분석부
4710 : 데이터 시각화부
5000 : 특허 분쟁 예측 정보 생성 시스템
5100 : 분쟁 예측 엔진
5110 : 자기 특허 집합 생성부
5120 : 타겟 특허 집합 생성부
5121 : 인용 특허 집합 생성부
5122 : 유사 특허군 생성부
5123 : 유사 기술 특허군 생성부
5124 : 타겟 집합 입수부
5125 : 옵션 처리부
5130 : 분쟁 예측 모델값 입수부
5140 : 분쟁 예측 정보 생성부
5141 : 다중 관계성 처리 모듈
5142 : 분쟁 예측 정보값 생성 모듈
5143 : 가중치 조절부
5150 : 분쟁 예측 정보값 제공부
5200 : 분쟁 DB부
5210 : 분쟁 발생 특허 DB
5220 : 분쟁 예측 요소값 DB
5230 : 분쟁 예측 모델값 DB
5300 : 분쟁 예측 정보 분석 엔진
5310 : 특허 집합 분할부
5320 : 공격 예상군 정보 생성부
5330 : 리스크 헤징 정보 생성부
5340 : 크로스 라이센싱 정보 생성부
5400 : 분쟁 예측 관리부
5410 : 분쟁 데이터 입수부
5420 : 분쟁 예측 시스템 관리부
5421 : 분쟁 예측 정보 배치 생성부
5430 : 분쟁 예측 사용자 관리부
5431 : 분쟁 UI부
5432 : 사용자 입력 특허군 관리부
5500 : 분쟁 예측 모델 생성 엔진
5510 : 분쟁 예측 요소값 생성부
5520 : 분쟁 예측 모델 생성부
5530 : 특허별 분쟁 예측 모델값 생성부
5540 : 분쟁 예측 모델값 제공부
5600 : 분쟁 파급 예측 엔진
5610 : 신규 발생 분쟁 분석부
5620 : 신규 발생 분쟁 파급 예측부
5630 : 분쟁 파급 알림부
6000 : 특허 라이센싱 예측 정보 생성 시스템
6100 : 라이센싱 예측 엔진
6110 : 자기 특허 집합 생성부
6120 : 타겟 특허 집합 생성부
6121 : 인용 특허 집합 생성부
6122 : 유사 특허군 생성부
6123 : 유사 기술 특허군 생성부
6124 : 타겟 집합 입수부
6125 : 옵션 처리부
6130 : 라이센싱 예측 모델값 입수부
6140 : 라이센싱 예측 정보 생성부
6141 : 다중 관계성 처리 모듈
6142 : 라이센싱 예측 정보값 생성 모듈
6143 : 가중치 조절부
6150 : 라이센싱 예측 정보값 제공부
6200 : 라이센싱 DB부
6210 : 분쟁 발생 특허 DB
6220 : 라이센싱 예측 요소값 DB
6230 : 라이센싱 예측 모델값 DB
6300 : 라이센싱 예측 정보 분석 엔진
6310 : 특허 집합 분할부
6400 : 라이센싱 예측 관리부
6410 : 분쟁 데이터 입수부
6420 : 라이센싱 예측 시스템 관리부
6421 : 라이센싱 예측 정보 배치 생성부
6430 : 라이센싱 예측 사용자 관리부
6431 : 라이센싱 UI부
6432 : 사용자 입력 특허군 관리부
6500 : 라이센싱 예측 모델 생성 엔진
6510 : 라이센싱 예측 요소값 생성부
6520 : 라이센싱 예측 모델 생성부
6530 : 특허별 라이센싱 예측 모델값 생성부
6540 : 라이센싱 예측 모델값 제공부
8400 : 전자상거래 서비스 제공부
8410 : 전자상거래 대상 DB
8420 : 전자상거래 처리부
8430 : 오픈 마켓 생성부
8500 : 커뮤니티 서비스 제공부
8600 : 과금 처리부
8700 : 댓글 처리부
8710 : 댓글 수신부
8720 : 댓글 저장부
8730 : 동일성 판단부
8740 : 댓글 전달부
8800 : 번역 처리부

Claims

(I) (I1) (I11) 적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 먼저 입수하고, (I12) 상기 자기 특허 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 타겟 특허 집합을 입수하거나, (I2) (I21) 적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 먼저 입수하고, (I22) 상기 타켓 특허 집합과 기 설정된 관련성을 가지는 적어도 하나 이상의 자기 특허 집합을 입수하는 단계;
(J) 상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 라이센싱 예측 모델값을 입수하는 단계; 및
(K) 상기 특허별 라이센싱 예측 모델값을 활용하여 적어도 하나 이상의 라이센싱 예측 정보를 생성하는 단계;를 포함하는 것인 것이며,
상기 자기 특허와 상기 타겟 특허는 기 설정된 관련성을 가지는 특허들로 이루어지는 관련 특허 관계인 것이며,
상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것이며,
상기 타겟 특허 집합을 구성하는 타겟 특허들은 2 이상의 자기 특허들과 기 설정된 관련성를 가질 수 있는 것인 것이며,
상기 관련성은 계량화 될 수 있는 것이며, 상기 계량화는 관련성 빈도 및 관련성 강도 중 어느 하나 이상을 포함하여 구성되는 것인 것이며,
상기 관련성 빈도는 상기 타겟 특허에 대응되는 기 설정된 관련성을 가지는 자기 특허의 개수인 것이며, 상기 관련성 강도는 인용-피인용 특허 관계 정보, 유사 특허군 관계 정보 및 유사 기술 특허 관계 정보 중 어느 하나 이상을 사용하여 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 (I12) 단계에서 상기 타겟 특허 집합은 상기 자기 특허 집합을 구성하는 자기 특허의 최선일을 기준으로 하여 후출원인 것이거나, 상기 (I22) 단계에서 상기 자기 특허 집합은 상기 타겟 특허 집합을 구성하는 타겟 특허의 최선일을 기준으로 하여 선출원인 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
삭제
삭제
제 1항에 있어서,
상기 인용-피인용 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 인용-피인용 깊이 정보 및 인용-피인용 종류 정보 중 어느 하나 이상을 사용하여 생성되는 것을 포함하는 것이거나
상기 유사 특허군 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허의 유사도 정보를 사용하여 생성되는 것인 것이거나,
상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것이며,
상기 유사도 정보는 상기 자기 특허와 상기 타겟 특허에서 추출되는 추출 키워드, 상기 자기 특허와 상기 타겟 특허의 레퍼런스 정보에서 생성되는 인용-피인용 정보, 상기 자기 특허와 상기 타겟 특허에서 추출되는 적어도 한 종류 이상의 특허 분류 및 상기 특허 분류가 속하는 특허 분류 체계 상의 상기 특허 분류의 적어도 한 단계 이상의 상위 특허 분류 중 어느 하나 이상의 활용을 포함하여 생성되는 것인 것이며,
상기 유사 기술 특허 관계 정보로 상기 관련성 강도를 생성하는 것은 상기 자기 특허와 상기 타겟 특허에 포함되어 있는 적어도 한 종류 이상의 특허 분류에 대하여, 상기 특허 분류가 속하는 특허 분류 체계 상에서의 일치 깊이, 일치 빈도 및 일치 서열 중 어느 하나 이상을 활용하여 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 생성되는 라이센싱 예측 정보는
상기 타겟 특허 집합에 대응되는 자기 특허별 라이센싱 예측 정보, 상기 타겟 특허 집합에 대응되는 적어도 하나 이상의 자기 특허군별 라이센싱 예측 정보, 상기 타겟 특허 집합에 대응되는 자기 특허 집합에 대한 라이센싱 예측 정보, 적어도 하나 이상의 부분 타겟 집합에 대응되는 자기 특허별 라이센싱 예측 정보, 적어도 하나 이상의 부분 타겟 집합에 대응되는 적어도 하나 이상의 자기 특허군별 라이센싱 예측 정보 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 6항에 있어서,
상기 라이센싱 예측 정보는 기 설정된 적어도 하나 이상의 라이센싱 예측 정보값, 적어도 하나 이상의 라이센싱 예측 분석 정보, 적어도 하나 이상의 라이센싱 예측 근거 정보 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 타겟 특허로 입수하는 것인 것이거나,
상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 분할된 부분 자기 특허 집합별로 입수하는 것인 것이거나,
상기 (I12) 단계의 상기 타겟 특허 집합의 입수는 2 이상의 상기 자기 특허 집합별로 입수하는 것인 것이며,
상기 기 설정된 조건은 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며,
상기 타겟 특허 집합의 입수가 분할된 상기 부분 자기 특허 집합별로 입수하는 것인 것인 경우, 상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 상기 부분 자기 특허 집합에 대응되는 부분 타겟 특허 집합별로 생성되는 것인 것이며,
상기 타겟 특허 집합의 입수가 2 이상의 상기 자기 특허 집합별로 입수하는 것인 경우, 상기 (I) 단계의 상기 자기 특허 집합의 입수는 적어도 2 이상의 자기 특허 집합의 입수인 것이며, 상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 2 이상의 상기 자기 특허 집합에 대응되는 타겟 특허 집합별로 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 (I22) 단계의 상기 자기 특허 집합의 입수는 기 설정된 조건을 충족하는 특허만을 자기 특허로 입수하는 것인 것이거나,
상기 (I22) 단계의 상기 자기 특허 집합의 입수는 분할된 부분 타겟 특허 집합별로 입수하는 것인 것이거나,
상기 (I22) 단계의 상기 자기 특허 집합의 입수는 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 것이며,
상기 기 설정된 조건은 사용자가 설정하거나, 상기 특허 정보 시스템이 설정하는 것인 것이며, 상기 기 설정된 조건은 권리자 조건, 관련성 조건, 권리자 매출 규모, 권리자 최근 분쟁 피소 정보 및 개별 특허 속성 조건 중 어느 하나 이상인 것인 것이며,
상기 자기 특허 집합의 입수가 분할된 상기 부분 타겟 특허 집합별로 입수하는 것인 것인 경우, 상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 상기 부분 타겟 특허 집합에 대응되는 부분 자기 특허 집합별로 생성되는 것인 것이며,
상기 자기 특허 집합의 입수가 2 이상의 상기 타겟 특허 집합별로 입수하는 것인 경우, 상기 (I) 단계의 상기 타겟 특허 집합의 입수는 적어도 2 이상의 타겟 특허 집합의 입수인 것이며, 상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 2 이상의 상기 타겟 특허 집합에 대응되는 자기 특허 집합별로 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 자기 특허 집합을 구성하는 자기 특허 및 적어도 하나 이상의 분할 기준 또는 적어도 하나 이상의 선별 기준이 적용된 적어도 하나 이상의 부분 자기 특허 집합 중 어느 하나 이상은 기 설정된 랭킹을 가지는 것이며,
상기 랭킹은 관련성 빈도, 관련성 강도 및 상기 특허별 라이센싱 예측 모델값 중 어느 하나 이상을 사용하는 랭킹 생성 규칙에 따라서 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 (K) 단계의 상기 라이센싱 예측 정보를 생성하는 것은 적어도 2 이상의 분할되거나 선별되는 타겟 특허 집합별로 생성되는 것인 것이거나,
상기 (K) 단계의 상기 라이센싱 예측 정보의 생성은 사용자로부터 입수 받은 사용자 가중치 정보를 반영하여 생성되는 것인 것이며,
상기 타겟 특허 집합의 선별이나 분할은 사용자에 의해서 선별되거나 분할되는 방식 또는 상시 시스템의 기 설정된 선별 기준이나 분할 기준에 의해 분할되는 방식 중 어느 하나 이상이 적용되는 것인 것이며, 상기 기 설정된 선별 기준이나 분할 기준은 타겟 특허 집합을 구성하는 타겟 특허의 권리자명, 권리자 속성, 특허 기술 분류, 기 설정된 적어도 하나 이상의 평가값 중 어느 하나 이상인 것인 것이며,
상기 사용자 가중치 정보는 상기 타겟 특허 집합을 구성하는 타겟 특허 중 어느 하나 이상에 대하여 개별 타겟 특허별로 상기 사용자가 설정하는 타겟 특허별 가중치 정보, 자기 특허의 개별 속성에 설정하는 속성별 가중치 정보, 인용-피인용 관계에 대해 설정하는 인용-피인용 가중치 정보, 텍스트 마이닝 관계에 대해 설정하는 텍스트 마이닝 가중치 정보, 특허 분류상 유사 기술 특허 관계에 대해 설정하는 유사 기술 특허 관계 가중치 정보 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 (J) 단계의 특허별 라이센싱 예측 모델값의 입수는 입수된 1차 타겟 특허 집합에 대하여 기 설정된 집합 연산을 수행한 후에 생성되는 2차 타겟 특허 집합을 구성하는 2차 타겟 특허를 대상으로 실시되는 것이며,
상기 2차 타겟 특허 집합은 상기 1차 타겟 특허 집합을 구성하는 1차 타겟 특허에 대한 삭제, 상기 1차 타겟 특허 집합에 대한 한정 및 2차 타겟 특허 집합으로의 신규 특허 추가 중 어느 하나 이상이 실시되어 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 특허별 라이센싱 예측 모델값은
적어도 하나 이상의 인용 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 특허 관점 분쟁 예측 요소, 적어도 하나 이상의 다분쟁 유발자 관점 분쟁 예측 요소 및 적어도 하나 이상의 다분쟁 기술군 관점 분쟁 예측 요소 중에서 선택되는 어느 하나 이상의 분쟁 예측 요소의 분쟁 예측 요소값을 사용하여 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 1항에 있어서,
상기 특허별 라이센싱 예측 모델값은 라이센싱 특허와 비라이센싱 특허에 대하여, 라이센싱 예측 요소값을 설명 변수값으로 하고, 상기 라이센싱 특허에 부여된 라이센싱 특허 부여값과 상기 라이센싱 특허 부여값과 다르게 부여되며 상기 비라이센싱 특허에 부여된 비라이센싱 특허 부여값을 반응 변수값으로 하여 기 설정된 통계학적 처리를 수행하여 생성되는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
제 14항에 있어서,
상기 통계학적 처리는 트리(tree)를 활용한 앙상블 기법을 사용하는 기계 학습 계열의 알고리즘을 사용하는 것인 것을 특징으로 하는 특허 정보 시스템의 특허 라이센싱 예측 정보 처리 방법.
적어도 하나 이상의 특허를 포함하는 자기 특허 집합을 입수하거나 생성하는 자기 특허 집합 생성부;
적어도 하나 이상의 특허를 포함하는 타겟 특허 집합을 입수하거나 생성하는 타겟 특허 집합 생성부;
상기 타겟 특허 집합을 구성하는 개별 특허에 대하여 적어도 하나 이상의 특허별 라이센싱 예측 모델값을 입수하는 라이센싱 예측 모델값 입수부; 및
상기 특허별 라이센싱 예측 모델값을 활용하여 적어도 하나 이상의 라이센싱 예측 정보를 생성하는 라이센싱 예측 정보 생성부;를 포함하는 것을 특징으로 하는 특허 라이센싱 예측 정보 처리하는 특허 정보 시스템.
제 16항에 있어서,
상기 자기 특허 집합을 구성하는 자기 특허와 상기 타겟 특허 집합을 구성하는 타겟 특허 간에서 기 설정된 관련성을 계산하는 다중 관계성 처리 모듈;를 더 포함하며
상기 다중 관계성 처리 모듈이 계산하는 상기 기 설정된 관련성은 인용-피인용 특허 관계, 텍스트 마이닝 기법 상의 유사 특허군 관계, 특허 분류 상 유사 기술 특허 관계 중 어느 하나 이상인 것을 특징으로 하는 특허 라이센싱 예측 정보 처리하는 특허 정보 시스템.
제 1항 내지 제2항, 제5항 내지 제15항 중 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 라이센싱 예측 정보 처리하는 특허 정보 시스템.
제 1항 내지 제2항, 제5항 내지 제15항 중 어느 한 항의 방법을 실시하는 컴퓨터가 읽을 수 있는 프로그램이 기록된 기록 매체.
삭제