KR101160995B1

KR101160995B1 - 특허 분쟁 예측 장치 및 방법

Info

Publication number: KR101160995B1
Application number: KR1020090075828A
Authority: KR
Inventors: 김도전
Original assignee: 사단법인 한국전자정보통신산업진흥회; (주)윕스
Priority date: 2009-08-17
Filing date: 2009-08-17
Publication date: 2012-07-02
Also published as: KR20110018169A

Abstract

특허 분쟁 예측 장치 및 방법이 개시된다. 특허 분쟁을 예측하는 장치는, 특허권자 정보, 기술분류 정보 또는 이들의 조합을 포함하는 입력 데이터를 분석 단위별로 구분하여 저장하는 입력 데이터 저장부; 분쟁 가능성에 관한 분류 정보를 포함하는 출력 데이터를 상기 분석 단위별로 구분하여 저장하는 출력 데이터 저장부; 및 상기 입력 데이터가 상기 출력 데이터에 맞게 분류되도록 마이닝 모델을 생성하는 지도 학습부를 포함한다.

분쟁, 특허, 예측

Description

특허 분쟁 예측 장치 및 방법{Apparatus and method for forecasting patent trouble}

본 발명은 특허 정보 이용에 관한 것으로, 보다 상세하게 특허에 대한 다양한 정보를 이용하여 향후 분쟁 가능성을 예측하는 방법 및 장치에 관한 것이다.

특허 문서는 특허청을 통해 출원 공개 또는 등록 공개되는 문서들을 지칭한다. 이와 같은 특허 문서들은 인터넷을 통해 난립하는 일반적인 정보들과는 달리 특정한 기술적 흐름 또는 특정한 출원인의 연구 개발 방향 등과 같은 동향을 파악하는데 매우 유용하게 사용된다.

그러나, 현재 단순히 특허 동향을 조사 분석하여 제공할 뿐, 조사 분석된 정보들을 2차 가공하여 특허 분쟁 가능성을 예측하여 제공하지 못하는 문제가 있다.

본 발명은 특허에 대한 다양한 정보를 이용하여 분쟁 가능성을 예측하여 제 공할 수 있는 특허 분쟁 예측 장치 및 방법을 제공하기 위한 것이다.

본 발명의 일 측면에 따르면, 특허에 대한 분쟁 가능성을 예측할 수 있는 장치가 제공된다.

본 발명의 실시예에 따르면, 특허권자 정보, 기술분류 정보 또는 이들의 조합을 포함하는 입력 데이터를 분석 단위별로 구분하여 저장하는 입력 데이터 저장부; 분쟁 가능성에 관한 분류 정보를 포함하는 출력 데이터를 상기 분석 단위별로 구분하여 저장하는 출력 데이터 저장부; 및 상기 입력 데이터가 상기 출력 데이터에 맞게 분류되도록 마이닝 모델을 생성하는 지도 학습부를 포함하는 특허 분쟁 예측 장치가 제공될 수 있다.

상기 분류 정보는 과거 분쟁 유무이며, 상기 마이닝 모델은 신경망 모델이고, 상기 기술분류 정보는 기술 분류, 특허 분류 및 문헌 벡터를 포함할 수 있다.

상기 문헌 벡터는 상기 분석 단위별 특허에 대한 청구항으로부터 추출된 각 키워드 셋의 TF(term frequency)-IDF(inverse document frequency) 값의 크기일 수 있다.

상기 키워드 셋은 상기 분석 단위별 특허에 대한 청구항으로부터 추출된 키워드 셋의 대표화된 유사어를 차원일 수 있다.

상기 분석 단위는 1특허 또는 복수의 특허이며, 상기 분석 단위가 복수의 특허인 경우, 상기 분석 단위는 동일 특허권자 소유의 특허로써, 패밀리 특허, 인용 관계에 있는 동일 특허권자 소유의 특허, 문헌 벡터간 유사도가 기준값 이상인 동일 특허권자 소유의 특허 중 어느 하나 또는 이들의 조합일 수 있다.

상기 분석 단위가 복수의 특허인 경우, 상기 동일 특허권자 소유의 특허를 군집화하고, 상기 군집화된 각 특허에 대한 입력 데이터의 대표값을 산출하여 상기 분석 단위에 상응하는 입력 데이터를 구성할 수 있다.

상기 대표값은 평균값, 최대값, 최소값 및 합계 중 어느 하나를 이용하여 산출될 수 있다.

상기 입력 데이터는 적어도 둘 이상의 기술분류를 포함할 수 있다.

본 발명의 다른 측면에 따르면, 특허 분쟁 예측 장치가 특허에 대한 분쟁을 예측하는 방법이 제공된다.

본 발명의 실시예에 따르면, 특허 분쟁 예측 장치가 특허에 대한 분쟁을 예측하는 방법에 있어서, (a) 분석 단위별 특허에 대한 특허 정보 및 서지 정보 중 하나 이상을 이용하여 분쟁 예측을 위한 분석 단위별 특허에 대한 입력 데이터를 생성하여 데이터베이스에 등록하는 단계; (b) 상기 입력 데이터 중에서 등록된 특허에 상응하는 입력 데이터를 특허의 분쟁 여부를 예측하는 신경망에 입력하여 출력된 분쟁 예측 정보와 상기 등록된 특허에 상응하여 기설정된 분쟁 정보를 이용하여 상기 신경망의 가중치를 변경하여 학습하는 단계; 및 (c) 예측 대상 특허에 상응하는 입력 데이터를 상기 학습된 신경망에 입력하여 상기 예측 대상 특허에 대한 분쟁 예측 정보를 획득하는 단계를 포함하는 특허 분쟁 예측 방법이 제공될 수 있 다.

상기 (a) 단계는, 연관 규칙 알고리즘을 이용하여 상기 특허의 특허 정보에서 키워드 셋을 추출하는 단계; 상기 추출된 키워드 셋을 이용하여 TF(term frequency) 및 IDF(inverse document frequency)를 산출하는 단계; 및 상기 산출된 TF 및 IDF를 이용하여 상기 특허에 상응하는 문헌 벡터를 구성하는 단계를 포함할 수 있다.

상기 분석 단위는 1특허 또는 다특허이며, 상기 분석 단위가 다특허인 경우, 상기 (a) 단계는,

상기 분석 단위가 다특허인 경우, 상기 (a) 단계는, 상기 특허에 동일 특허권자 소유의 유사 특허를 군집화하는 단계; 및 상기 군집화된 유사 특허에 대한 대표값을 산출하는 단계를 포함할 수 있다.

상기 유사 특허를 추출하는 단계는, 패밀리 특허, 설정된 특허에 상응하여 직간접적으로 인용 또는 피인용된 특허 또는 문헌 벡터의 유사도가 기준값 이상인 특허 중 하나 이상을 유사 특허로써 추출하는 단계이다.

상기 입력 데이터는 상기 특허에 상응하는 문헌 벡터를 포함하여 복수의 기술 분류를 포함하되, 상기 (b) 단계 및 상기 (c) 단계는 상기 복수의 기술 분류 중 적어도 둘 이상의 기술 분류를 상기 신경망에 입력할 수 있다.

본 발명에 따른 특허 분쟁 예측 장치 및 방법을 제공함으로써, 특허에 대한 다양한 정보를 이용하여 분쟁 가능성을 예측하여 제공할 수 있다.

본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 도면에 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.

이하, 본 발명의 실시예를 첨부한 도면들을 참조하여 상세히 설명하기로 한다.

도 1은 본 발명의 실시예에 따른 특허 분쟁 예측 장치의 내부 구성을 걔략적으로 도시한 블록도이고, 도 2는 본 발명의 실시예에 따른 데이터 등록부의 내부 구성을 개략적으로 도시한 도면이며, 도 3은 본 발명의 실시예에 따른 문헌 벡터를 구성하는 방법을 나타낸 순서도이고, 도 4는 본 발명의 실시예에 따른 유사 특허를 클러스터링하는 방법을 나타낸 순서도이다.

도 1을 참조하면, 본 실시예에 따른 특허 분쟁 예측 장치(100)는 입력 데이터 저장부(110), 지도 학습부(120), 예측부(130), 보정부(140) 및 출력 데이터 저장부(150)를 포함하여 구성된다.

입력 데이터 저장부(110)는 분석 단위별 특허에 대한 특허 정보 및 서지 정보 중 하나 이상을 이용하여 분쟁 예측을 위한 입력 데이터를 가공하고, 가공된 입력 데이터를 데이터베이스(미도시)에 등록하는 기능을 수행한다.

예를 들어, 본 실시예에 따른 특허 분쟁 예측 장치(100)에서 생성하는 마이닝 모델이 신경망 모델인 경우, 입력 데이터는 출원일, 등록일, 청구항 수, 독립항수, 기술 분류, IPC와 같은 특허 분류, 문헌 벡터, 특허지수, 특허 소멸 여부, 권리 이전 정보, 특허권자 정보 등을 포함할 수 있다.

본 실시예에서는 기술분류, 특허 분류 및 문헌 벡터를 기술분류 정보라 칭하기로 한다.

또한, 본 실시예에서 특허 정보는 특허의 특허 문서에서 획득될 수 있는 정보인 것으로 칭하며, 이외의 해당 특허에 상응하여 각국 특허청에서 발행되거나 각 기업에 의해 획득되는 정보를 모두 통칭하여 서지정보라 칭하기로 한다.

또한, 입력 데이터는 특허권자 정보를 포함할 수 있으며, 특허권자 정보는 특허권자 명, 특허권자의 출원건수 또는/및 등록건수, 기술이전 건수, 과거 분쟁 건수 등을 포함할 수 있다.

다른 예를 들어, 마이닝 모델이 의사결정트리 모델과 같은 선형모델인 경우, 입력 데이터는 출원 체류기간(즉, 출원일과 등록일 사이의 기간), IPC-기술 분류 대응 확률값(전체 IPC 중 특정 IPC가 특정 기술 분류에 속하는 비율) 등과 같이 변수 상호간의 관계를 나타내는 별도의 변수를 더 포함할 수 있다.

또한, 입력 데이터는 설정되는 분석 단위에 따라 하나의 특허에 대한 특허 정보 및 서지 정보를 이용하여 가공될 수도 있으며, 복수의 특허에 대한 특허 정보 및 서지 정보를 이용하여 가공될 수도 있다. 즉, 분석 단위는 1특허 또는 복수의 특허로 설정될 수 있다.

도 2를 참조하여 입력 데이터 저장부(110)에 대해 보다 상세하게 설명하기로 한다.

입력 데이터 저장부(110)는 도 2에서 보여지는 바와 같이, 설정 모듈(210), 벡터 산출 모듈(220) 및 등록 모듈(230)을 포함하여 구성된다.

설정 모듈(210)은 특허 분석 단위를 설정하는 기능을 수행한다. 즉, 설정 모듈(210)은 사용자에 의해 입력된 정보에 상응하여 분석 단위를 설정한다. 예를 들 어, 분석 단위는 1특허 또는 다특허 중 어느 하나로 설정된다.

1특허는 하나의 특허에 상응하여 입력 데이터를 가공하여 등록하는 것을 나타내며, 다특허는 복수의 특허를 이용하여 입력 데이터를 가공하여 등록하는 것을 나타낸다.

설정된 분석 단위에 따라 등록 모듈(230)은 하나의 특허 또는 복수의 특허에 상응하여 입력 데이터를 등록할 수 있다.

본 실시예에서는 입력 데이터가 특허 정보 및 서지 정보 중 하나 이상을 이용하여 가공되어 등록되는 것을 가정하여 설명하나 이외에도 사용자에 의해 입력될 수도 있다.

벡터 산출 모듈(220)은 각 특허에 상응하여 문헌 벡터를 구성하는 기능을 수행한다. 도 3을 참조하여 벡터 산출 모듈(220)이 문헌 벡터를 구성하는 방법에 대해 설명하기로 한다.

벡터 산출 모듈(220)은 문헌 벡터를 구성하기 위해, 각 특허에 대한 특허 정보(예를 들어, 청구항)에 대해 미리 정해진 방법에 따라 키워드 셋을 추출한다(단계 310). 물론, 키워드 셋은 청구항 이외에도 다양한 특허 정보를 이용하여 추출될 수 있으나, 본 명세서에서는 이해와 설명의 편의를 도모하기 위해 키워드 셋이 특허의 청구항을 이용하여 추출되는 것을 가정하여 설명하기로 한다.예를 들어, 키워드 셋은 연관 규칙 알고리즘을 이용하여 추출되며, 연관 규칙 알고리즘은 apriori 알고리즘, aprioriTID 알고리즘, aprioriHybrid 알고리즘, DHP 알고리즘 중 어느 하나일 수 있다. 연관 규칙 알고리즘은 당업자에게는 자명한 사항이므로 이에 대해 서는 별도의 설명은 생략하기로 한다.

또한, 키워드 셋은 설정 조건에 따라 상이하게 추출될 수 있다. 여기서, 설정 조건은 문장 단위 및 절 단위 중 어느 하나일 수 있다.

만일 문장 단위로 설정된 경우, 키워드 셋은 각 특허의 각 청구항을 기본 단위로 하여 추출된다. 그러나 설정 조건이 절 단위인 경우, 키워드 셋은 청구항 내에 정해진 기호(예를 들어, 콤마, 세미콜론, 콜론 등)에 따라 각 청구항을 분리하여 추출된다.

또한, 키워드 셋은 워드(word) 단위로 추출될 수도 있으며, 구(pharse) 단위로 추출될 수도 있다.

연관 규칙 알고리즘을 이용하여 키워드 셋을 추출하는 방법은 당업자에게는 자명한 사항이므로, 키워드 셋을 추출하는 상세한 방법에 대해서는 설명을 생략하기로 한다.

키워드 셋이 추출되면, 벡터 산출 모듈(220)은 추출된 키워드 셋을 이용하여 TF-IDF를 산출하고, 이를 이용하여 해당 특허에 상응하는 문헌 벡터를 구성한다(단계 320).

즉, 벡터 산출 모듈(220)은 해당 특허의 특허 정보에서 키워드 셋이 나타나는 빈도를 산출한다. 이를 TF(term frequency)라 칭하기로 한다.

이어, 벡터 산출 모듈(220)은 키워드 셋이 존재하는 각 특허의 빈도를 산출하는데, 이를 DF(document frequency)라 칭하기로 한다. 여기서, 벡터 산출 모듈(220)은 빈도가 낮은 키워드 셋에 대해 높은 값으로 산출되도록 조정하고, 빈도 가 높은 키워드 셋에 대해 낮은 값이 산출되도록 각각 조정하여 IDF(inverse document frequency)를 산출한다.

이와 같이, IDF가 산출되면, 벡터 산출 모듈(220)은 TF에 IDF를 곱하여 각 키워드 셋의 가중치를 산출한다.

이어, 벡터 산출 모듈(220)은 가중치 집합을 문헌 벡터로써 구성할 수 있다.

여기서, 벡터 산출 모듈(220)은 키워드 셋이 너무 방대해지는 경우, 시스템의 전체적인 처리 속도를 저하시키며, 문헌 벡터가 왜곡되어 구성되므로, 이를 방지하기 위해 기등록된 유사어 정보를 이용하여 키워드 셋을 그룹화하여 클러스터링할 수 있다(단계 330).

예를 들어, 벡터 산출 모듈(220)은 유사어 정보를 이용하여 키워드 셋을 그룹화하고, IDF가 임계치 이상인 키워드 셋을 이용하여 문헌 벡터를 구성할 수 있다.

또한, 벡터 산출 모듈(220)은 구성된 문헌 벡터를 미리 정해진 알고리즘을 이용하여 클러스터링할 수 있다. 예를 들어, 벡터 산출 모듈(220)은 K-mean, K-medoids, cliqeue, Proclus, pcluster 중 어느 하나의 알고리즘을 이용하여 구성된 문헌 벡터를 클러스터링할 수 있다. 이들 알고리즘은 당업자에게는 자명한 사항이므로 이에 대한 별도의 설명은 생략하기로 한다.

등록 모듈(230)은 설정된 분석 단위에 상응하여 특허의 특허 정보 및 서지 정보를 이용하여 입력 데이터를 가공하여 데이터베이스에 등록하는 기능을 수행한다.

등록 모듈(230)은 문헌 벡터를 제외한 나머지 입력 데이터를 모두 가공하여 데이터베이스에 등록할 수 있다.

예를 들어, 등록 모듈(230)은 분석 단위가 1특허인 경우, 해당 특허에 대한 특허 정보 및 서지 정보를 이용하여 입력 데이터를 생성하여 데이터베이스에 등록할 수 있다.

그러나, 등록 모듈(230)은 분석 단위가 복수의 특허인 경우, 설정된 특허에 상응하는 유사 특허를 추출하고, 이를 군집화여 데이터베이스에 등록할 수 있다. 이하, 도 4를 참조하여 이에 대해 보다 상세히 설명하기로 한다.

단계 410에서 등록 모듈(230)은 설정된 특허에 상응하는 유사 특허를 데이터베이스에서 추출한다. 예를 들어, 등록 모듈(230)은 설정된 특허의 패밀리 특허, 동일 특허권자(또는 발명자)의 특허, 설정된 특허에 상응하여 직간접적으로 인용 또는 피인용된 특허 또는 문헌 벡터의 유사도가 기준값(예를 들어, 0.9) 이상인 특허 중 하나 이상의 특허를 유사 특허로써 추출할 수 있다.

단계 420에서 등록 모듈(230)은 유사 특허들을 군집화한다.

예를 들어, 등록 모듈(230)은 추출된 유사 특허에 상응하는 입력 데이터들을 각각 추출한다. 그리고, 등록 모듈(230)은 유사 특허에 상응하여 추출된 각 입력 데이터들을 대표화한다.

예를 들어, 등록 모듈(230)은 각각 추출된 입력 데이터들은 최소값, 평균값, 최대값 및 합계 중 하나 이상을 이용하여 대표화할 수 있다. 물론, 이외에도 중간값 과 같이 다양한 방법을 이용하여 대표화할 수 있음은 당연하다.

단계 430에서 등록 모듈(230)은 군집된 특허들을 비교하여 중복을 제거한다. 즉, 등록 모듈(230)은 군집된 특허들이 완전하게 동일한 경우 중복된 것으로 판단하여 이를 제거한다.

다시, 도 1을 참조하여, 입력 데이터 저장부(110)는 분석 조건별 특허의 특허 정보 및 서지 정보 중 하나 이상을 이용하여 입력 데이터를 가공하여 데이터베이스에 등록할 수 있다.

또한, 본 실시예에 따른 입력 데이터 저장부(110)는 생성된 입력 데이터를 정해진 방법에 따라 정규화하여 데이터베이스에 등록할 수도 있다. 예를 들어, 입력 데이터는 0~1 사이의 값으로 정규화되어 데이터베이스에 등록될 수 있다.

지도 학습부(120)는 입력 데이터 저장부(110)에 의해 등록된 입력 데이터 들 중에서 등록 특허에 상응하는 입력 데이터들을 형성된 신경망(neural network)에 입력하여 해당 신경망을 학습시키는 기능을 수행한다. 신경망의 동작에 대해서는 당업자에게는 자명한 사항이므로 이에 대한 별도의 설명은 생략하기로 한다. 본 실시예에서는 지도 학습부(120)가 마이닝 모델로써 신경망을 이용하는 것을 가정하여 이를 중점으로 설명하나 이외에도 의사결정트리 모델과 같은 선경 모델을 이용할 수도 있다.

즉, 지도 학습부(120)는 입력 데이터 저장부(110)에 등록된 입력 데이터가 하기에서 설명되는 출력 데이터 저장부(150)에 등록된 출력 데이터에 맞게 분류되도록 마이닝 모델(예를 들어, 신경망)을 생성하고, 이를 학습시키는 기능을 수행한다.

지도 학습부(120)는 등록 특허에 상응하는 입력 데이터를 형성된 신경망에 입력하여 출력된 분쟁 예측 정보와 당해 등록 특허에 상응하여 기설정된 분쟁 정보를 이용하여 신경망의 각 연결정보에 대한 가중치를 변경하여 당해 신경망을 학습시킨다.

이외에도 지도 학습부(120)는 분쟁 가능성에 관한 분류 정보를 포함하는 출력 데이터에 상응하도록 당해 입력 데이터에 저장부(110)에 등록된 입력 데이터를 이용하여 신경망을 학습시킬 수도 있다. 여기서, 분류 정보는 과거 분쟁 유무, 경고장 발/착송 정보, 표준 특허 및 유망 특허 중 하나 이상일 수 있다.

또한, 지도 학습부(120)는 입력 데이터 중에서 적어도 둘 이상의 기술분류 정보를 이용하여 신경망을 학습시킬 수 있다. 전술한 바와 같이, 기술분류 정보는 기술 분류, 특허 분류 및 문헌 벡터로써, 해당 기술분류 정보는 최소 두개의 조합으로 신경망에 입력된다. 즉, 기술 분류 및 특허 분류, 특허 분류 및 문헌 벡터, 문헌 벡터 및 기술 분류가 동시에 신경망에 입력되어 학습된다.

예측부(130)는 지도 학습부(120)에 의해 신경망 학습이 완료된 후, 예측 대상 특허에 상응하는 입력 데이터를 학습된 신경망에 입력하여 분쟁 예측 정보를 획득한다.

여기서, 예측부(130)는 예측 대상 특허에 상응하는 입력 데이터 중에서 분류 데이터는 복수의 분류 데이터를 함께 학습된 신경망에 입력하여 분쟁 예측 정보를 획득한다.

보정부(140)는 예측부(130)에 의해 획득된 분쟁 예측 정보를 미리 정해진 방 법에 따라 보정하는 기능을 수행한다. 예를 들어, 보정부(140)는 오분류 행렬을 이용하여 신경망에 대한 정확도를 산출하고, 산출된 정확도를 예측부(130)에서 획득된 분쟁 예측 정보에 곱하여 보정한다. 본 실시예에서 오분류행렬(misclassification matrix)은 당업자에게 자명한 사항이므로 이를 이용하여 신경망에 대한 정확도를 산출하는 방법에 대한 별도 설명은 생략하기로 한다.

출력 데이터 저장부(150)는 분류 단위별 특허에 대한 출력 데이터가 저장된다. 출력 데이터는 분쟁 가능성에 관한 분류 정보를 포함한다. 분류 정보는 과거 분쟁 유무, 과거 소송 유무, 심판 유무, 당사자계 재심사 유무, 경고 유무 등을 포함할 수 있다.

도 5는 본 발명의 실시예에 따른 특허 분쟁 예측 장치가 특허 분쟁을 예측하는 방법을 나타낸 순서도이다. 이하에서 설명되는 각각의 단계는 특허 분쟁 예측 장치의 각각의 내부 구성 요소에 의해 수행되어지나 이해와 설명의 편의를 도모하기 위해 특허 분쟁 예측 장치로 통칭하여 설명하기로 한다.

단계 510에서 특허 분쟁 예측 장치(100)는 분석 조건별 특허에 대한 특허 정보 및 서지 정보 중 하나 이상을 이용하여 분쟁 예측을 위한 입력 데이터를 가공하여 데이터베이스에 등록한다. 이는 이미 전술한 바와 동일하므로 이에 대한 별도의 설명은 생략하기로 한다.

단계 515에서 특허 분쟁 예측 장치(100)는 등록 특허에 대한 입력 데이터를 이용하여 신경망을 학습시킨다.

전술한 바와 같이, 등록 특허에 대한 입력 데이터를 신경망에 입력하여 출력된 분쟁 예측 정보와 기설정된 분쟁 정보를 이용하여 신경망의 각 연결정보들간의 가중치를 변경하여 신경망을 학습시킬 수 있다.

단계 520에서 특허 분쟁 예측 장치(100)는 예측 대상 특허의 입력 데이터를 학습된 신경망에 입력하여 당해 예측 대상 특허의 분쟁 예측 정보를 획득한다.

단계 525에서 특허 분쟁 예측 장치(100)는 신경망의 정확도를 이용하여 획득된 분쟁 예측 정보를 보정하여 출력한다.

전술한 바와 같이, 오분류 행렬을 이용하여 신경망의 정확도가 산출될 수 있으며, 산출된 정확도가 신경망의 정확도로써 설정될 수 있다. 이에 따라 특허 분쟁 예측 장치(100)는 설정된 정확도와 예측 대상 특허에 대해 획득된 분쟁 예측 정보를 곱하여 당해 분쟁 예측 정보를 보정할 수 있다.

상기에서는 본 발명의 바람직한 실시예를 참조하여 설명하였지만, 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허 청구의 범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.

도 1은 본 발명의 실시예에 따른 특허 분쟁 예측 장치의 내부 구성을 걔략적으로 도시한 블록도.

도 2는 본 발명의 실시예에 따른 데이터 등록부의 내부 구성을 개략적으로 도시한 도면.

도 3은 본 발명의 실시예에 따른 문헌 벡터를 구성하는 방법을 나타낸 순서도.

도 4는 본 발명의 실시예에 따른 유사 특허를 클러스터링하는 방법을 나타낸 순서도.

도 5는 본 발명의 실시예에 따른 특허 분쟁 예측 장치가 특허 분쟁을 예측하는 방법을 나타낸 순서도.

Claims

분석 단위별 특허에 대한 특허권자 정보, 기술분류 정보 또는 이들의 조합을 포함하는 입력 데이터에 대해 분석 단위가 다특허이면, 동일 특허권자 소유의 패밀리 특허, 상기 분석 단위별 특허에 상응하여 직간접적으로 인용 또는 피인용된 특허와 문헌 벡터의 유사도가 기준값 이상인 특허를 유사특허로 추출하여 군집화하고, 상기 군집화된 특허에 대한 입력 데이터의 대표값을 산출하여 상기 분석 단위에 상응하는 입력 데이터를 구성하여 저장하는 입력 데이터 저장부-상기 문헌 벡터는, 연관 규칙 알고리즘을 이용하여 상기 특허의 특허 정보에서 키워드 셋을 추출하고, 상기 추출된 키워드 셋을 이용하여 TF(term frequency) 및 IDF(inverse document frequency)를 산출하고, 상기 산출된 TF 및 IDF를 이용하여 상기 특허에 상응하여 구성됨;

분쟁 가능성에 관한 분류 정보를 포함하는 출력 데이터를 상기 분석 단위별로 구분하여 저장하는 출력 데이터 저장부;

상기 입력 데이터를 상기 출력 데이터에 맞게 분류하여 특허 분쟁 여부를 예측하기 위한 신경망 모델을 생성하고, 상기 입력 데이터 중에서 등록된 특허에 상응하는 입력 데이터를 특허 분쟁 여부를 예측하기 위한 상기 신경망 모델에 입력하여 출력된 분쟁 예측 정보와 상기 등록된 특허에 상응하여 기설정된 분쟁 정보를 이용하여 상기 신경망 모델을 학습시키는 지도 학습부; 및

예측 대상 특허에 상응하는 입력 데이터를 상기 학습된 신경망 모델에 입력하여 상기 예측 대상 특허에 대한 분쟁 예측 정보를 획득하는 예측부를 포함하는 특허 분쟁 예측 장치.
제1 항에 있어서,

상기 분류 정보는 과거 분쟁 유무인 것을 특징으로 하는 특허 분쟁 예측 장치.
삭제
제1 항에 있어서,

상기 기술분류 정보는 기술 분류, 특허 분류 및 문헌 벡터를 포함하는 것을 특징으로 하는 특허 분쟁 예측 장치.
제4 항에 있어서,

상기 문헌 벡터는 상기 분석 단위별 특허에 대한 청구항으로부터 추출된 각 키워드 셋의 TF(term frequency)-IDF(inverse document frequency) 값의 크기인 것을 특징으로 하는 특허 분쟁 예측 장치.
제5 항에 있어서,

상기 키워드 셋은 상기 분석 단위별 특허에 대한 청구항으로부터 추출된 키워드 셋의 대표화된 유사어를 차원으로 하는 것을 특징으로 하는 특허 분쟁 예측 장치.
삭제
삭제
삭제
제1 항에 있어서,

상기 대표값은 평균값, 최대값, 최소값 및 합계 중 어느 하나를 이용하여 산출되는 것을 특징으로 하는 특허 분쟁 예측 장치.
제1 항에 있어서,

상기 입력 데이터는 적어도 둘 이상의 기술분류를 포함하는 것을 특징으로 하는 특허 분쟁 예측 장치.
특허 분쟁 예측 장치가 특허에 대한 분쟁을 예측하는 방법에 있어서,

(a) 분석 단위별 특허에 대한 특허 정보 및 서지 정보 중 하나 이상을 포함하는 입력 데이터에 대해 분석 단위가 다특허이면, 동일 특허권자 소유의 패밀리 특허, 상기 분석 단위별 특허에 상응하여 직간접적으로 인용 또는 피인용된 특허와 문헌 벡터의 유사도가 기준값 이상인 특허를 유사특허로 추출하여 군집화하고, 상기 군집화된 특허에 대한 입력 데이터의 대표값을 산출하여 상기 분석 단위에 상응하는 입력 데이터를 구성하여 데이터베이스에 상기 구성된 입력 데이터를 입력데이터 저장부가 등록받아 저장하고, 분쟁 가능성에 관한 분류 정보를 포함하는 출력 데이터를 상기 분석 단위별로 구분하여 출력데이터 저장부가 입력받아 저장하는 단계-상기 문헌 벡터는, 연관 규칙 알고리즘을 이용하여 상기 특허의 특허 정보에서 키워드 셋을 추출하고, 상기 추출된 키워드 셋을 이용하여 TF(term frequency) 및 IDF(inverse document frequency)를 산출하고, 상기 산출된 TF 및 IDF를 이용하여 상기 특허에 상응하여 구성됨;

(b) 상기 입력 데이터를 상기 출력 데이터에 맞게 분류하여 특허 분쟁 여부를 예측하기 위한 신경망 모델을 생성하고, 상기 입력 데이터 중에서 등록된 특허에 상응하는 입력 데이터를 특허의 분쟁 여부를 예측하기 위한 상기 신경망 모델에 입력하여 출력된 분쟁 예측 정보와 상기 등록된 특허에 상응하여 기설정된 분쟁 정보를 이용하여 지도 학습부가 상기 신경망 모델을 학습시키는 단계; 및

(c) 예측부가 예측 대상 특허에 상응하는 입력 데이터를 상기 학습된 신경망 모델에 입력하여 상기 학습된 신경망 모델의 출력 데이터를 상기 예측 대상 특허에 대한 분쟁 예측 정보로 상기 신경망 모델로부터 획득하는 단계를 포함하는 특허 분쟁 예측 방법.
삭제
삭제
삭제
삭제
제12 항에 있어서,

상기 입력 데이터는 상기 특허에 상응하는 문헌 벡터를 포함하여 복수의 기술 분류를 포함하되,

상기 (b) 단계 및 상기 (c) 단계는 상기 복수의 기술 분류 중 적어도 둘 이상의 기술 분류를 상기 신경망 모델에 입력하는 것을 특징으로 하는 특허 분쟁 예측 방법.