KR20090063156A - 특허 정보 제공 방법 및 그 시스템

Info

Abstract

Description

Claims

KR20090063156A

Publication number: KR20090063156A
Application number: KR1020080126562A
Authority: KR
Inventors: 강민수
Original assignee: (주)광개토연구소; 강민수
Priority date: 2007-12-12
Filing date: 2008-12-12
Publication date: 2009-06-17
Also published as: WO2009075554A2; WO2009075554A3; KR101534155B1

본 발명은 특허 정보 제공 방법에 관한 것으로써, 다차원 특허 분석 정보를 포함하는 특허 정보 제공 방법 및 그 시스템에 관한 것이다.

본 발명을 실시하면, 다양한 종류의 특허 분석 결과를 제공받게 되는 장점이 있다.

특허 정보, 분석, 통계, 다차원

특허 정보 제공 방법 및 그 시스템{Patent Information Providing Method and System}

특허 정보는 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가 되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.

특허 정보를 입수할 수 있는 방법은 다양하나, 크게 1) 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것과 2) 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 및 3) 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 1)의 방법의 대표적인 예가 대한민국 특 허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템이 있으며, 2)의 대표적인 예로 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr, www.wisdomain.com 등 있다.

www.delphion.com 의 운영회사인 톰슨사이언티픽과 같은 각 국가의 민간 기업들은 특허 정보 데이터베이스를 구축해 놓고, 특허 검색 엔진을 통하여 입력된 검색식에 대해 다양한 방식으로 검색 결과를 제공해 주고 있다. 또한, 이들 특허 정보를 기반으로 한 다양한 종류의 분석 소프트웨어가 개발되어 있으며, www.micropatent.com의 운영사(톰슨사이언티픽에 인수 합병되었음)가 개발한 상표명 AUREKA로 보급되는 소프트웨어가 유명하다. 그리고, 세계 각국의 기술 선진 대기업들은 내부에 특허 검색 및 특허 관리 시스템을 구축하여 운영하고 있는 것으로 알려져 있으나, 외부에서 그 기업들의 특허 검색 및 특허 관리 시스템에 대해 접근하기가 어렵다.

이러한 특허 검색 및 특허 관리 시스템을 구축하기 위해서는 수십억원 이상의 비용이 지출되는 것이 통상이어서, 국내외 대부분의 중견 및 중소 벤처 기업들은 자체 특허 검색 및 특허 관리 시스템을 구축하고 있지 못하고 있다. 이들 중견 및 중소 벤처 기업들은 특허 전담 조직을 두고 있는 경우도 다수 있으며, 이들이 자사의 특허에 대한 관리 및 자사를 위한 특허 정보를 수집하고 있다. 하지만, 기업 규모가 작거나, 특허에 대한 의식이 크지 않은 기업들은 이러한 특허 전담 조직을 갖추고 있지 못하는 경우가 많다. 이들 기업들은 특허법률사무소나 로펌 등에 의뢰하여 자신의 특허를 관리하고 있는 수준에 거치고 있다.

이들 특허 전담 조직은 www.delphion.com 등과 같은 외부에서 접근 가능한 유무료 온라인 특허 정보 서비스 업체들을 이용하여, 이들이 제공해 주는 플랫폼으로 특허 정보를 수집, 관리하고 있다. 그리고, 기업 명의로 된 특허 출원의 대부분은 그 기업 소속 발명자들에 의해서 이루어 지며, 그 발명자는 자신의 발명과 관련된 국내외의 특허 정보를 수집하는 것이 전세계적인 추세가 된다. 그 이유가 특허 공개 기간의 존재에도 불구하고 전세계의 신기술 정보는 70% 이상이 특허 정보의 형태로 공개되며, 특허 정보가 논문 정보 등에 비해서 상업적으로 이용가능한 아이디어가 많기 때문으로 풀이된다. 하지만, 이들 발명자들의 상당 부분은 특허 검색에 익숙해 있지 않거나, 검색에 익숙한 자라 하더라도 www.deljphion.com 등과 같은 외부 특허 정보 서비스 제공업체에 접속하여 특허 정보를 입수 받고 있다.

통상적으로 발명자들은 특정 기술 분야에 대하여 수년 내지 십수년간 지속적으로 연구하는 것이 일반적이므로, 자신 발명한 기술 분야가 크게 변동되지 않는 것이 일반적이다. 그러므로, 자신이 발명한 기술 분야와 직접 또는 간접적으로 관련되는 분야에 관한 국내 또는 해외 각국의 특허 기술 정보는 발명자에게 유익한 정보가 될 것이다. 그러므로, 개별 기업 단위 뿐만 아니라, 그 기업 소속의 발명자 단위로 운영되며, 발명자 단위까지 최적화되어 특정 발명자 만을 위한 차별화된 특허 정보 서비스 시스템의 공급이 요청되어 왔으며, 이와 같은 특허 정보 서비스 시스템은 자체적으로 개발하고 유지할 수 없는 중견 및 중소벤처 기업들에게는 특허 정보에 대한 접근성을 크게 향상시킬 것이며, 자체적으로 개발 유지할 수 있는 기업들에게는 사내 특허 정보 유통의 새로운 플랫폼이 될 것이다.

또한, 기업 또는 발명자들이 자신이 관리하는 특허를 자동으로 분석하여, 이들과 관련된 경쟁 기업 및 경쟁 기술에 관한 분석 정보, 경쟁 기업 및 경쟁 기술에 대한 감시 정보 등이 자동으로 정리되어 기업 또는 발명자에게 직접 제공된다면, 기업 또는 발명자에게 편리할 것이다.

본 발명이 이루고자 하는 첫번째 기술적 과제는 특허 문건 정보에 대한 각종 전처리 방법과, 전처리된 특허 정보를 바탕으로 각종 특허 분석을 수행하기 위해 필요한 데이터 내지는 정보를 생성하는 방법 및 그 정보를 통해 각종 특허 분석을 수행하는 방법 및 그 특허 정보 시스템을 제시하는 것이다.

본 발명이 이루고자 하는 두번째 기술적 과제는 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별, 출원인별, 발명자별, 대리인별, 특허 분류 기호별 특허 정보 시스템을 구축하는 방법 및 그 시스템을 제시하는 것이다.

본 발명이 이루고자 하는 세번째 기술적 과제는 하위 특허 분류 기호를 자동으로 포함하는 감시, 검색, 디렉토리 및 분석 서비스를 제공하기 위한 정보 처리 방법 및 그 시스템을 제공하는 것이다.

본 발명이 이루고자하는 네번째 기술적 과제는 상기 첫번째 기술적 과제부터 세번째 기술적 과제까지의 특허 정보를 온라인 상에서 다수의 사용자들에게 서비스 하는 방법 및 그 특허 정보 시스템을 제시하는 것이다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 사용자의 컴퓨터에 특허 정보를 제공하는 시스템이, 특허 문건 집합에 대한 선택 정보를 입수 받는 단계; 상기 선택 정보를 기초로 처리 대상 특허 문건 집합이 특정되는 단계; 상기 특정된 처리 대상 특허 문건 집합에 대하여 적어도 하나 이상의 기설정된 처리를 수행하여 가공 특허 정보가 생성되는 단계;를 더 포함하며, 상기 처리 대상 특허 문건 집합을 특정하는 단계 및 상기 기설정된 계산을 수행하여 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 적어도 하나 이상의 특허 분류 기호를 활용하며, 상기 특허 분류 기호의 활용은 상기 선택 정보를 입수 받는 단계 및 상기 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 제1 특허 분류 기호가 주어졌을 때, 상기 제1 특허 분류 기호가 속하는 특허 분류 기호 체계 상에서 상기 제1 특허 분류 기호가 기설정된 레벨에 해당하는 경우, 상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것이며, 상기 특허 분류 기호는 국제 특허 분류(IPC), 미국 특허 분류(USPC), 일본의 파일 인덱스(FI), 일본의 F-term(FT), 유럽 특허 분류(ECLA) 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 제공 방법을 제공한다.

상기 기설정된 레벨은 도트 레벨(dot level)의 특허 분류 기호인 것이며, 상기 도트 레벨의 특허 분류 기호는 상기 특허 분류 기호 체계 상의 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것인 것이 바람직하다.

상기 도트 레벨의 특허 분류 기호는 상기 특허 분류 기호가 국제 특허 분류(IPC)인 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며, 미국 특허 분류(USPC)의 경우에는 서브클래스 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며, 일본의 파일 인덱스(FI)의 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며, 일본의 F-term(FT)일 경우에는 테마 코드 미만의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며, 유럽 특허 분류(ECLA)의 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것인 것이 바람직하다.

상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것은, 상기 제1 특허 분류 기호가 도트 레벨의 특허 분류 기호일 경우, 상기 도트 레벨의 제1 특허 분류 기호의 모든 하위 특허 분류 기호 및 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합 중 어느 하나 이상을 정보 처리의 대상으로 하는 것인 것이 바람직하다.

상기 선택 정보를 입수 받는 방법은 1) 사용자 컴퓨터로부터 검색식으로 입력 받는 방법, 2) 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법, 3) 상기 사용자가 사전에 생성해 놓은 적어도 하나 이상의 특허 문건 집합 중에서 선택된 특정 특허 문건 집합에 대한 선택 정보를 입수 받는 방법 및 4) 상기 시스템으로부터 기설정된 적어도 하나 이상의 조건을 제공받는 방법 중 어느 하나의 방법 이상이 사용되는 것인 것인 것이 바 람직하다.

상기 처리 대상 특허 문건 집합이 특정되는 단계는 상기 1) 내지 4)의 방법 중 어느 하나가 실시되었을 때, 상기 1) 내지 4)의 방법의 실시되는 과정에서 적어도 하나 이상의 제1 특허 분류 기호가 포함되어 있고, 상기 제1 특허 분류 기호가 도트 레벨의 특허 분류 기호일 경우, 상기 도트 레벨의 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합이 처리 대상 특허 문건 집합으로 특정되게 되는 것인 것이 바람직하다.

상기 도트 레벨의 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합이 처리 대상 특허 문건 집합으로 특정되게 되는 방법은, 상기 도트 레벨의 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호를 입수하고, 상기 제1 특허 분류 기호 및 상기 모든 하위 특허 분류 기호를 포함하는 검색식 또는 질의식으로 상기 처리 대상 특허 문건 집합이 특정되게 하는 방법인 것이 바람직하다.

상기 특허 문건 집합을 구성하는 개별 특허는 적어도 하나 이상의 기설정된 가중치 부여 정책에 따라 가중치가 부여된 특허를 하나 이상을 포함하며, 상기 가공 특허 정보는 상기 개별 특허에 부여된 가중치가 반영되어 생성되는 것인 것이 바람직하다.

상기 가중치 부여 정책은 상기 개별 특허와 관련된 1) 기설정된 카운팅 정보 및 2) 기설정된 계산값 정보 중 어느 하나 이상을 포함하여 계산되는 것이며, 상기 기설정된 카운팅 정보의 대상이 되는 카운팅 값은 1) 제1국 및 제2국 중 어느 하나 이상의 국가에서의 패밀리수, 2) 청구항 수 및 3) 피인용수 중 어느 하나 이상을 포함하는 것이며, 상기 기설정된 계산값 정보에는 1) 상기 특허의 발명자에 대한 적어도 하나 이상의 평가 점수, 2) 상기 특허의 출원인에 대한 적어도 하나 이상의 평가 점수, 3) 상기 발명자의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 4) 상기 출원인의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 5) 상기 출원인의 재무 정보를 반영한 적어도 하나 이상의 기설정된 계산값 및 6) 상기 특허에 포함된 특허 분류 기호 자체에 대한 적어도 하나 이상의 기설정된 계산값 중 어느 하나 이상을 포함하여 계산되는 것인 것이 바람직하다.

상기 가공 특허 정보가 상기 사용자의 컴퓨터에 제공될 때, 상기 특허 분류 기호 정보에 대응되는 가공 특허 정보가 제공되며, 상기 사용자의 컴퓨터로부터 상기 특허 분류 기호의 적어도 하나 이상의 하위 특허 분류 기호에 대한 가공 특허 정보가 요청될 때, 상기 가공 특허 정보는 상기 특허 분류 기호가 포함된 특허 분류 기호 체계 상에서, 상기 특허 분류 기호의 적어도 하나 이상의 직하위 특허 분류 기호에 대응되는 가공 특허 정보를 제공하는 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 사용자의 컴퓨터에 특허 정보를 제공하는 시스템이, 특허 문건 집합에 대한 선택 정보를 입수 받는 단계; 상기 선택 정보를 기초로 처리 대상 특허 문건 집합이 특정되는 단계; 상기 특정된 처리 대상 특허 문건 집합에 대하여 적어도 하나 이상의 기설정된 처리를 수행하여 가공 특허 정보가 생성되는 단계;를 더 포함하며, 상기 선택 정보를 입수 받는 방법은 1) 사용자 컴퓨터로부터 검색식으로 입력 받는 방법, 2) 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법, 3) 상기 사용자가 사전에 생성해 놓은 적어도 하나 이상의 특허 문건 집합 중에서 선택된 특정 특허 문건 집합에 대한 선택 정보를 입수 받는 방법 및 4) 상기 시스템으로부터 기설정된 적어도 하나 이상의 조건을 제공받는 방법 중 어느 하나의 방법 이상이 사용되는 것인 것인 것이며, 상기 가공 특허 정보는 상기 특정된 처리 대상 특허 문건 집합에 대한 적어도 하나 이상의 기설정된 분석 처리를 통하여 생성되는 적어도 하나 이상의 다차원 분석 정보인 것이며, 상기 다차원을 구성하는 개별적인 차원은 1)시간, 2)특허 분류 기호, 3) 출원인, 4) 발명자, 5) 대리인, 6) 국가, 7) 키워드 및 8) 융합 패턴 중에서 선택되는 어느 하나 이상인 것이며, 상기 다차원 분석 정보는 상기 처리 대상 특허 문건 집합을 대상으로 하여 상기 적어도 하나 이상의 개별적 차원에 대한 적어도 하나 이상의 기설정된 카운팅 값, 적어도 하나 이상의 기설정된 계산식에 의한 계산값, 적어도 하나 이상의 질의식에 의한 질의 결과값 및 적어도 하나 이상의 분석 처리 알고리즘에 대한 처리 결과값 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 제공 방법을 제공한다.

상기 분석 정보를 생성할 때, 상기 분석 정보는 상기 처리 대상 문건 집합에 포함된 특허 분류 기호에 대하여, 1) 모든 특허 분류를 포함하여 처리하는 방법 및 2) 주특허분류(main patent classification)만을 처리하는 방법 중에서 선택되는 어느 한 방법 이상을 사용하며, 상기 모든 특허 분류를 포함하여 처리하는 경우에는 a) 모든 특허 분류를 동등한 가중치로 처리하는 방법 및 b) 주특허분류(main patent classification)와 부특허분류(sub patent classification)에 대하여 다른 가중치로 처리하는 방법 중에서 선택되는 어느 하나 이상을 적용하여 분석 정보를 생성하는 것인 것이 바람직하다.

상기 분석 처리는 특허 분류 기호간의 융합 분석 처리이며, 상기 특허 분류 기호간의 융합 분석 처리는 상기 처리 대상 특허 문건 집합에 포함된 특허 문건 중 동일 특허 분류 체계 상의 2개 이상의 특허 분류 기호를 포함하는 특허 문건들을 대상으로 하여, 상기 특허 문건들에 포함된 상기 2개 이상의 특허 분류들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것이 바람직하다.

상기 특허 분류 기호 간의 융합 분석 처리에 있어서, 동일 특허 분류 체계 상에서 상기 2개 이상의 특허 분류 기호가 하나의 특허 문건에 포함되어 있을 경우, 상기 2개 이상의 특허 분류 기호가 상기 특허 분류 기호 체계 상의 최상위 특허 분류 기호가 아니거나 기설정된 레벨의 분류 기호가 아닌 경우, 상기 융합 분석 처리는 상기 2개 이상의 특허 분류 기호 각각에 대하여, 상기 2개 이상의 특허 분류 기호의 기설정된 레벨까지의 상위 특허 분류 기호를 포함하여 처리하는 것인 것이 바람직하다.

상기 융합 분석 처리는 상기 처리 대상 특허 문건 집합을 구성하는 개별 특허 문건에 대하여 1) 하나의 특허 문건의 기설정된 적어도 하나 이상의 필드에서 추출한 텍스트 정보를 기초로 생성되는 적어도 2 이상의 기술 키워드 간의 융합 분석 처리, 2) 공동 발명자가 있는 특허 문건에 대한 공동 발명자 간의 융합 분석 처리, 3) 공동 출원인이 있는 특허 문건에 대한 공동 출원인 간의 융합 분석 처리 및 4) 하나의 특허 문건의 인용 정보에 함께 포함되어 있는 인용 특허 문건들 간의 융합 분석 처리 중 어느 하나 이상을 포함하며, 상기 융합 분석 처리는 상기 특허 문건들에 포함된 상기 2개 이상의 기술 키워드, 공동 발명자, 공동 출원인, 공동 인용 특허 문건들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것이 바람직하다.

상기 융합 분석 처리 결과를 적어도 2개 이상의 노드를 포함하는 네트워크 다이어그램으로 시각화 처리하는 단계;를 더 포함하며, 상기 시각화 처리에는 상기 노드에 대한 정보 및 상기 노드와 노드를 연결하는 선에 대한 정보 중 어느 하나 이상을 더 포함하고 있는 것인 것이 바람직하다.

상기 노드와 노드를 연결하는 선에 대한 정보에는 수치 정보가 더 포함되어 있으며, 상기 사용자 컴퓨터로부터 상기 수치 또는 상기 선에 대한 선택 정보가 입수받는 단계; 상기 상기 수치 정보에 대응되는 근거 특허 문건 정보를 상기 처리 대상 특허 문건 집합이 포함되는 특허 정보 데이터베이스에서 추출하는 단계; 및 상기 추출된 근거 특허 문건 정보를 상기 사용자 컴퓨터에 전송하는 단계;를 더 포함하는 것이 바람직하다.

상기 처리 대상 문건 집합에 대하여, 상기 사용자 컴퓨터로부터 상기 처리 대상 문건 집합에 대한 변경 정보를 입수 받는 단계; 및 상기 입수 받은 변경 정보 를 기준으로 처리 대상 문건 집합을 특정하는 단계;를 더 포함하며, 상기 변경 정보의 입수는 상기 사용자 컴퓨터에 변경 정보의 입수를 위한 인터페이스를 제공하고, 상기 인터페이서에 대한 상기 사용자의 선택 정보를 입수받는 방식으로 수행되는 것인 것이며, 상기 인터페이스에는 1) 시간 종류 선택 인터페이스, 2) 시간 구간 선택 인터페이스, 3) 국가 선택 인터페이스 4) 특허 분류 기호 선택 인터페이스 5) 인용 특화 인터페이스, 6) 패밀리 정보 포함 선택 인터페이스, 7) 검색 후 선택 인터페이스 중 어느 하나 이상을 포함하며, 상기 시간 종류 인터페이스에는 출원일, 공개일 및 등록일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 시간 구간 선택 인터페이스는 시작 구간과 종료 구간 각각에 대한 년/월/주/일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 국가 선택 인터페이스는 적어도 2 이상의 국가에 대한 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 특허 분류 기호 선택 인터페이스는 특허 분류 기호의 종류 선택 인터페이스, 특허 분류 기호 레벨 선택 인터페이스, 메인 특허 분류 기호 및 서브 특허 분류 기호 선택 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 인용 특허 인터페이스에는 전방 인용과 후방 인용 중 어느 하나 이상의 선택에 관한 인용 방향 인터페이스, 인용 깊이의 선택에 관한 인용 깊이 인터페이스, 직접 인용과 간접 인용 중 어느 하나 이상의 인용의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 패밀리 정보 포함 선택 인터페이스에는 패밀리 정보 포함 여부 및 국가 범위의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페 이스를 포함하며, 상기 검색 후 선택 인터페이스는 상기 처리 대상 문건 집합을 검색 대상으로 하여 기설정된 필드 검색을 제시하고, 상기 필드에 사용자 컴퓨터로부터 검색어를 입수받고, 상기 검색어에 대응되는 검색 결과를 제공하고, 상기 검색 결과 중에서 적어도 하나 이상의 선택 정보를 입수 받아, 상기 선택 정보와 관련되는 특허 문건 집합만을 처리 대상 문건 집합으로 하도록 처리하는 인터페이스를 포함하는 것인 것이 바람직하다.

상기 분석 처리는 적어도 2 이상의 특허 문건을 1개의 분석 단위로 하는 집합 단위의 인용 분석 처리이며, 상기 집합 단위의 인용 분석 처리는 1)전방 인용 특허 문건 집합 대상 분석 처리, 2) 후방 인용 특허 문건 집합 대상 분석 처리 및 3) 인용 발생 자기 특허 문건 집합 대상 분석 처리 중 어느 하나 이상을 포함하며, 상기 1) 내지 3)의 분석 처리는 상기 1) 내지 3)의 분석 처리의 대상이 되는 특허 문건 집합에서 상기 적어도 하나 이상의 기설정된 다차원 분석 정보를 생성해 내는 것인 것이며, 상기 전방 인용 특허 문건 집합 대상 분석 처리를 위한 전방 인용 특허 문건 집합의 특정은 처리 대상 특허 문건 집합에 포함되어 있는 적어도 1 인용 깊이 이상의 인용 정보로 구성되는 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 후방 인용 특허 문건 집합 대상 분석 처리를 위한 후방 인용 특허 문건 집합의 특정은 처리 대상 특허 문건 집합을 인용하고 있는 적어도 1 인용 깊이 이상의 후출원 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 인용 발생 자기 특허 문건 집합 대상 분석 처리를 위한 인용 발생 자기 특허 문건 집합의 특정은 처리 대상 특허 문건 집합을 구성하는 특허 문건 중 적어도 1회 이상의 인용을 받은 특허 문건으로 구성되는 특허 문건 집합을 포함하는 방식으로 특정되는 것인 것이 바람직하다.

상기 집합 단위의 인용 분석 처리는 전방 인용 특허 문건 집합의 특정 시에는 상기 특허 문건 집합에 대한 간접 전방 인용 문건 집합을 더 포함하는 방식, 상기 후방 인용 특허 문건 집합의 특정 시에는 간접 후방 인용 문건 집합 중 어느 하나 이상을 더 포함하여 집합 단위의 인용 분석 처리를 수행하는 것인 것이며, 상기 간접 전방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 앞서면서, 상기 처리 대상 특허 문건이 인용하는 특허 문건을 동시에 인용하고 있는 특허 문건들로 구성되는 것이며, 상기 간접 후방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 늦으면서, 상기 처리 대상 특허 문건을 인용하는 특허 문건이 동시에 인용하고 있는 특허 문건들로 구성되는 것인 것이 바람직하다.

상기 다차원 분석 정보는 수치 정보가 포함되어 있는 표 형식으로 상기 사용자 컴퓨터에 전송되며, 상기 사용자 컴퓨터로부터 상기 수치에 대한 선택 정보가 입수받는 단계; 상기 상기 수치 정보에 대응되는 근거 특허 문건 정보를 상기 처리 대상 특허 문건 집합이 포함되는 특허 정보 데이터베이스에서 추출하는 단계; 및 상기 추출된 근거 특허 문건 정보를 상기 사용자 컴퓨터에 전송하는 단계;를 더 포함하는 것이 바람직하다.

상기 처리 대상 특허 문건 집합을 특정하는 단계 및 상기 기설정된 계산을 수행하여 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 적어도 하나 이상의 특허 분류 기호를 활용할 수 있으며, 상기 특허 분류 기호를 활용할 때의 상기 특허 분류 기호의 활용은 상기 선택 정보를 입수 받는 단계 및 상기 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 제1 특허 분류 기호가 주어졌을 때, 상기 제1 특허 분류 기호가 속하는 특허 분류 기호 체계 상에서 상기 제1 특허 분류 기호가 기설정된 레벨에 해당하는 경우, 상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것이며, 상기 특허 분류 기호는 국제 특허 분류(IPC), 미국 특허 분류(USPC), 일본의 파일 인덱스(FI), 일본의 F-term(FT), 유럽 특허 분류(ECLA) 중 어느 하나 이상인 것이 바람직하다.

상기 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법은 상기 사용자 컴퓨터에 적어도 하나 이상의 출원인을 포함하는 출원인 정보, 적어도 하나 이상의 특허 분류 기호를 포함하는 특허 분류 기호 정보, 적어도 하나 이상의 발명자를 포함하는 발명자 정보, 적어도 하나 이상의 대리인을 포함하는 대리인 정보 중 어느 하나 이상을 상기 사용자 컴퓨터에 제공하는 단계; 상기 사용자 컴퓨터로부터 상기 출원인, 상기 특허 분류 기호, 상기 발명자 정보, 상기 대리인 정보 중 어느 하나 이상에 대한 선택 정보를 입수 받는 단계; 및 상기 선택 정보로 특정되는 특허 문건 집합을 처리 대상 특허 문건 집 합으로 처리하여, 기설정된 다차원 분석 결과를 생성하여 상기 사용자 컴퓨터에 제공하는 단계;를 더 포함하는 것이 바람직하다.

상기 시스템은 상기 출원인별, 상기 특허 분류 기호별, 상기 발명자별 또는 상기 대리인별 다차원 분석 결과를 용이하고 신속하게 생성하기 위한 적어도 하나 이상의 중간 다차원 분석 결과 테이블을 생성하는 것이며, 상기 사용자 컴퓨터에게 기설정된 적어도 하나 이상의 출원인별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 특허 분류 기호별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 발명자별 다차원 분석 목록이나 메뉴 및 기설정된 적어도 하나 이상의 대리인별 다차원 분석 목록이나 메뉴 중 어느 하나 이상을 제공하는 단계; 상기 사용자 컴퓨터로부터 상기 다차원 분석 목록이나 메뉴에 대한 선택 정보를 입수하는 단계; 및 상기 선택 정보를 입수 받은 분석 목록이 상기 중간 다차원 분석 결과 테이블에서 입수할 수 있는 경우에는 상기 중간 다차원 분석 결과 테이블을 참조하여 상기 선택 정보를 입수 받은 분석 결과를 생성하여 상기 사용자 컴퓨터에 제공하는 단계;를 더 포함하는 것이 바람직하다.

본 발명이 이루고자 하는 기술적 과제를 달성하기 위하여, 사용자의 컴퓨터에 특허 정보를 제공하는 시스템이, 제1국에서 공개된 적어도 하나 이상의 특허 문건 정보를 입수 받는 단계; 상기 제1국 출원일과 상기 선택 정보를 입수 받은 날짜가 1년이 넘은 경우, 상기 선택 정보를 입수 받은 특허 문건에 대하여 1) PCT 출원 정보와 2) 제2국에서의 상기 제1국의 특허 문건을 우선권으로 하는 제2국 패밀리 정보, 및 3) 상기 제2국 패밀리 정보에 해당하는 제2국 특허 문건의 현재 상태 정 보 중 어느 하나 이상을 조회하는 단계; 상기 특허 문건에 대한 PCT 출원 정보가 없으며, 상기 제2국에서 상기 패밀리 정보가 없는 제1 경우, 상기 PCT 출원 정보가 있더라도 상기 제1국 출원일이 상기 선택 정보를 입수 받은 날짜로부터 기설정된 기관이 경과하고, 제2국 패밀리 정보가 없는 제2경우, 및 상기 제2국 패밀리 정보가 있더라도 상기 제2국 특허 문건의 현재 상태 정보가 취하, 소멸, 거절 결정 확정 및 무효 확정 중 어느 하나 이상이 된 제3의 경우 중 어느 하나에 해당하는지를 판단하는 단계; 및 상기 제1국의 특허 문건이 상기 제1 경우, 상기 제2 경우, 상기 제3 경우 중 어느 하나에 해당하는 경우에는 상기 제1국의 특허 문건 정보가 표시될 때, 상기 제1 경우, 상기 제2 경우, 상기 제3 경우 중 어느 하나에 해당함에 대응되는 기설정된 표시 정보를 상기 제1국의 특허 문건 정보의 기설정된 주변에 표시될 수 있도록 하여 상기 사용자의 컴퓨터에 상기 제1국의 특허 문건 정보와 상기 기설정된 표시 정보를 전송하는 단계;를 더 포함하며, 상기 제2국은 적어도 하나 이상인 것인 것을 특징으로 하는 특허 정보 제공 방법을 제공한다.

본 발명의 효과는 다음과 같다.

첫째, 각종 전처리를 통하여 특허 문건 정보 또는 특허 분류 기호 데이터 등과 같은 특허 관련 원천 데이터로부터 특허 정보 DB를 효과적으로 구축할 수 있다.

둘째, 입수된 출원인, 발명자, 대리인 정보만으로 계층적으로 통합된 출원인 명의 단위 특허 정보 시스템, 발명자 명의 단위 특허 정보 시스템 및 대리인 명의 단위 특허 정보 시스템을 생성할 수 있다.

셋째, 특허 분류 기호 정보의 전처리를 통하여 특허 검색, 각종 특허 분석, 특허 감시 등에서 하위 특허 분류 기호를 효과적으로 처리할 수 있어, 특허 검색, 특허 분석 및 특허 감시 서비스의 품질이 좋아진다. 특히, 하위 특허 분류 기호를 자동 포함하여 특허 정보를 생성함으로써, 생성되는 특허 정보의 품질이 좋아진다.

넷째, 특허 분류 기호, 기술 키워드 정보에 대한 융합 정보를 처리함으로써, 특허 분류 기호간, 기술 키워드 간 융합 경향을 파악할 수 있으며, 융합 속성을 본 발명의 특허 분석에 활용할 수 있다.

다섯째, 특허 문건 집합 단위로 인용 분석을 포함한 각종 분석으로 처리함으로써, 문건 집합의 크기, 종류 등에 독립적으로 특허 정보를 처리할 수 있게 된다.

여섯째, 공동 출원인, 공동 발명자, 함께 나온 공동 선행 인용 특허, 함께 나온 특허 분류 기호, 함께 나온 기술 키워드 등을 분석함으로써, 출원인, 발명자 등의 네트워크 관계 및 인용 특허들 상호 간의 네트워크 및 특허 분류 기호 간의 네트워크와 기술 키워드 간의 네트워크를 파악할 수 있게 되며, 이들 각각에 대한 분석 결과를 생성할 수 있게 된다.

일곱째, 제1국에서의 검색 결과로 나온 특허 문건에 대한 제2국에서의 배타권 행사 가능 여부를 판단할 수 있게 되어, 제2국에서의 제1국 특허 문건에 포함된 기술 정보에 대한 이용 가능성에 판단 근거를 제공해 줄 수 있게 된다.

전제 정보

공개되는 특허 문건의 형식 및 포함되어 있는 정보

각 국가의 특허청은 일정 조건을 갖춘 특허 출원 또는 특허 등록에 대하여 공개용 공보를 발행하고 있다. 공개되는 특허 정보에는 각 국가마다 차이가 있지만 크게 서지 사항에 관한 정보 및 특허 본문에 관한 정보를 포함하고 있다.

서지 사항에 관한 정보로서는 특허 문건 발행국에 관한 정보, 발명의 명칭, 출원인(assignee를 포함한다, 이하 같다)/특허권자(assignee를 포함한다, 이하 같다)에 관한 정보, 발명자에 관한 정보, 특허 분류 기호(IPC, USPC, FI, FT, ECLA 중에서 선택되는 어느 하나 이상, 이하 같다)에 관한 정보, 출원일 등의 각종 날짜에 관한 정보, 출원번호 등의 각종 번호에 관한 정보가 필수적으로 포함되어 있다. 또한, 초록 정보, 대표도가 있을 경우 대표도에 관한 정보, 인용(reference)에 관한 정보(출원인이 개시한 선행 기술에 관한 reference 정보, 심사관이 심사하거나 조사한 문건 또는 특허 분류 기호에 관한 정보 등 중의 어느 하나 이상을 말한다.), 우선권에 관한 정보, 심사관에 관한 정보 등이 선택적으로 존재할 수 있다. 상기 서지 사항의 내용으로 초록(abstract)에 관한 정보, 대표 청구항 또는 특허 청구 범위 중 제1항에 관한 정보가 더 포함되어 있을 수 있다.

본문에는 특허의 기술적 내용에 관한 정보들이 포함되어 있다. 통상적인 특허 문건의 본문에는 발명의 명칭에 관한 정보, 발명의 구성에 관한 정보, 특허 청구 범위에 관한 정보를 포함하고 있으며, 이들 이외에도 발명의 효과, 산업상 이용 가능성, 발명이 이루고자 하는 기술적 과제, 도면에 관한 설명, 종래의 기술 중 어 느 하나 이상이 포함되어 있다. 또한, 발명자의 선택 또는 특허 기술의 종류에 따라 필수적 또는 선택적으로 도면에 관한 정보가 더 포함되어 있다.

특허 분류 기호 정보 및 특허 분류 기호 체계의 존재

아울러, 각 특허 문건에는 적어도 하나 이상의 특허 분류 기호 체계 상의 적어도 하나 이상의 특허 분류 기호가 부여되어 있다. 대한민국, 미국, 일본, 유럽(EPO) 등의 각 국가가 발행하는 문건에는 IPC(International Patent Classification,국제 특허 분류) 기호가 부여되어 있으며, 각 국가별로 자국만의 특별한 분류 체계(미국 특허청의 경우 USPC 또는 UPC, 일본 특허청의 경우 F-

Term/FT, FI(File Index), 유럽 특허청의 경우 ECLA 등)를 가지고 있는 경우에는 그 특허 문건의 발행국 만의 특허 분류 기호가 부여되어 있다.

특허 분류 기호 체계들은 각 분류 기호에 "타이틀"이라는 해당 특허 분류 기호의 내용을 설명하는 부분이 1:1로 대응되어 있다. 한편, 각 특허 분류 기호 체계 상에서 일정 깊이(depth) 이하의 경우에는 각 특허 분류 기호들의 타이틀 정보에 도트(dot)가 부여되어 있는 경우가 있다. 하기의 예로부터 특허 분류 기호 체계의 계층성, 타이틀 정보의 존재, 타이틀 정보 앞에 분류 체계 상의 상대적인 위치에 관한 정보를 제공하는 도트의 존재를 보여 준다.

　　　　섹션　　　　　　　　　　　 : H　　　　　 전기

　　　　클래스　　　　　　　　　 : H01　　 기본적 전기소자

　　　　서브클래스　　　　　 : H01F　 자석

　　　　메인그룹　　　　　　　 : H01F 1/00　 자성재료를 특징으로 하는 자석 또는 자성체

　　　　1-도트 서브그룹 :　　　　　　 1/01 *무기재료로 된 것

　　　　2-도트 서브그룹 :　　　　　　　 1/03 **보자력에 의해 특징되는 것

　　　　3-도트 서브그룹 :　　　　　　　 1/032 ***경질 자성재료의 것

　　　　4-도트 서브그룹 :　　　　　　·　 1/04 **** 금속 또는 합금

　　　　5-도트 서브그룹 :　　　　　　　 1/047 *****조성물로 특징되는 합금

　　　　6-도트 서브그룹 :　　　　　　　 1/053 ******희토류 금속을 포함하는 것

상기 IPC를 예로 들어 설명하면, 모든 서브그룹에 해당하는 특허 분류 기호는 "서브클래스" + "숫자/숫자" 구조로 되어 있는데, 이 특허 분류 기호에 대응되는 타이틀에는 도트(dot)가 결합되어 있는 것이 대부분이다.(숫자/00을 제외하고는 대부분 도트가 결합되어 있으며, 통상 숫자/00은 메인그룹에 대응되는 기호이다.) 타이틀에 결합되어 있는 도트의 개수가 적을수록 그 타이틀은 그 주변과 비교할 때 상대적으로 상위 개념의 기술 분류이며, 도트의 개수가 많을수록 그 타이틀은 그 주변과 비교할 때 상대적으로 하위/세부 개념의 기술 분류이다.

상기의 예와 같이 IPC는 다단계 계층 구조(트리(tree)구조)로 되어 있다. 한편, USPC, FT 및 ECLA 등도 다단계 계층 구조를 가진다. 상기 각 특허 분류 기호의 다단계 계층 구조는 DB화 될 수 있을 것이다.

본 발명의 특허 정보 시스템(1)의 구성 소개

먼저 본 발명의 특허 정보 시스템(1)의 구조에 대해서 간략하게 설명한다.

도 1 및 도 13을 기준으로 설명한다.

본 발명의 특허 정보 시스템(1)은 유무선 네트워크(200)를 통하여 사용자 컴퓨터(300)와 연결되어 있다. 이때, 사용자 컴퓨터(300)는 PC, 노트북, 유무선 통신 단말기, 게임기 등의 사람을 전제로 한 컴퓨터와, 본 특허 정보 시스템(1)이 아닌 제3의 서버, 조직 또는 기관의 서버, 제3의 프로그램 모듈 등 상기 특허 정보 시스템(1)에 접속하는 임의의 컴퓨터를 말한다. 상기 특허 정보 시스템(1)이 웹서비스를 할 경우 상기 특허 정보 시스템(1)은 웹서비스 지원 모듈을 탑재하고 있어야 한다.

상기 특허 정보 시스템(1)은 특허 데이터 등 각종 데이터와 관계있는 DB부(20), 각종 전처리를 수행하는 전처리 모듈부(30), 특허 정보를 처리 및 분석하는 특허 정보 처리 기본 모듈(40), 회원 관리, 정책 관리 등과 같은 각종 지원을 담당하는 지원 모듈(50)(회원 정보 처리 모듈(501), 다국어 처리 모듈(502), 번역 모듈(503) 등이 탑재되어 있다), 특허 정보의 고급 분석과 직접 관계되는 특허 인텔리전스 모듈(60)(상기 특허 인텔리전스 모듈은 주로 특허 분석을 통하여 고급 특 허 정보를 생성하므로, 특허 분석 인텔리전스 모듈 또는 간략히 분석 모듈이라고 명명하기도 한다. 본 명세서에서는 이 양자 용어는 동등한 의미로 사용된다. 이하 같다.) 및 출원인 또는 발명자 또는 대리인 단위로 된 특허 정보 서비스 집합체를 생성하는 계층적으로 통합된 특허 정보 서비스 시스템이 있다.

상기 특허 정보 시스템(1)은 크게 6가지 구성 요소를 포함하여 구성 되어 있다.

첫째 구성 요소는 각종 전처리 모듈로 이들은 입수된 특허 문건에 대하여 각 목적별로의 각종 전처리를 수행하는 모듈들이다.

둘째 구성 요소는 특허 정보 처리 기본 모듈(40)로 이들에는 1) 검색 기능, 2) 분석 기능, 3) 감시 기능, 4) 분석 기능, 5) 특허 문건 집합 입수 기능, 6) 각종 다단계 디렉토리 생성 기능, 리포팅 기능을 수행하는 모듈을 포함한다.

세번째 구성 요소는 특허 분석 인텔리전스 모듈(60)로 이들에는 1) 인용 분석, 비교 분석 등을 포함한 각종 심화된 특허 분석 정보를 생성하는 모듈이다.

네번째 구성 요소는 특허 정보 서비스 시스템 생성 모듈로 출원인, 발명자, 대리인, 특허 분류 기호별 특허 정보 시스템(1)을 생성하는 모듈이다.

다섯번째 구성 요소는 지원 모듈(50)로 1) 회원 정보 처리, 2) 다국어 처리, 3) 번역 처리, 4) 웹서비스 처리 및 기타 본 발명 사상이 각종 네트워크(200) 환경 에서 서비스 될 수 있도록 하는 지원을 담당하는 구성 요소로 되어 있다.

여섯번째 구성 요소는 각종 DB로 이들 DB에는

1) 특허 문건 마스트 DB(202),

2) 특허 분류 기호 마스트 DB(203),

3) 주체 마스트 DB(204) 등의 각종 마스트 DB,

4) 분석과 관련된 각종 DB,

5) 각종 지원 DB(회원 DB(206-2), 메뉴 DB(206-3), 정책 DB(대표 어구 추출 정책 DB(206-1-1), 가중치 부여 정책 DB(206-1-2), 특허 지표 DB(206-1-3), 분석 질의식 DB(206-1-4)) 등),

6) 각종 2차 가공 DB(텍스트 마이닝 DB(207-1), 대표 어구 DB(207-2),

7) 복수 특허 분류 기호 관계 DB(207-3)) 등이 있을 수 있다.

상기 6가지 구성 요소는 대표적인 요소로 이외에도 본 발명의 명세서에 기재된 다른 구성은 본 발명의 시스템(1)에 포함됨은 당연할 것이며, 당업자에게 전산 시스템을 구성하기 위한 당연한 기능 및 모듈(방화벽, 회원 관리 등등)에 대해서는 별도로 언급하지 않는다.

상기 DB부(20)에는 DB를 관리하는 DBMS(201), 특허 문건을 통합하여 저장하고 있는 DB인 특허 문건 마스트 DB(202), 특허 분류 기호에 대한 정보를 저장하고 있는 특허 분류 기호 마스트 DB(203), 출원인, 발명자, 기업 등에 관한 정보를 저장하고 있는 주체 마스트 DB(204), 다차원 분석 결과를 저장하고 있는 다차원 분석용 연산 수행 결과 테이블 DB(205), 회원 및 각종 정책이나 옵션에 대한 정보를 저 장하고 있는 지원 DB부(206) 및/또는 각종 데이터를 가공한 결과물을 저장하고 있는 2차 가공 DB부(207) 등이 있다.

상기 메뉴 DB에는 각 국가 또는 각 언어별로 각 메뉴에 대한 표기법이 있으며, 본 발명의 특허 정보 시스(1)은 접속하는 사용자의 브라우저에 있는 로케일 정보를 읽어 그 로케일 정보에 대응되는 각 국가별/언어별 메뉴를 상기 메뉴 DB에서 추출하여 상기 추출된 언어로 된 메뉴로 화면을 생성하여 사용자에게 전송한다.

전처리 모듈부(30)

본 발명의 각종 전처리 모듈에 대해서 설명한다. 상기 전처리 모듈브(30)에는 1) 원천 특허 문건 처리 모듈(301-1), 2) 카운팅 전처리 모듈(3100), 3) 특허 분류 기호별 통계 전처리 모듈(3200), 4) 가중치 전처리 모듈(3300), 5) 인용 정보 전처리 모듈(3400), 6) 특허 분류 기호 전처리 모듈(301-3-1 또는 3500), 7) 출원인 대표명화 전처리 모듈(301-4-1-1 또는 3600), 8) 대표 어구 추출 전처리 모듈(3700), 9) 패밀리 정보 전처리 모듈(3800), 10) 복수 특허 분류 기호 관계성 전처리 모듈(3900), 11) 권리자 변동 정보 전처리 모듈(302), 12) 행정 처리 정보 입수 모듈(303) 중 어느 하나 이상이 더 포함되어 있을 수 있다.

원천 특허 문건 처리 모듈(301-1)

본 발명의 원천 특허 문건 처리 모듈(301-1)에 대해 설명한다. 상기 원천 특허 문건 처리 모듈(301-1)은 입수된 각 국가별(국제 출원된 특허 문건은 WIPO에서 공개한다. WIPO는 국가가 아니나, 기재의 편의상 국가별에 포함시켜서 설명한다.) 입수 특허 문건 데이터(XML, SGML 또는 기타 형식)을 처리한다.

상기 원천 특허 문건 처리 모듈(301-1)은 상기 입수 특허 문건 데이터를 입수하여 기설정된 처리를 수행한 다음, 상기 입수 특허 문건 데이터를 본 발명의 특허 정보 시스템(1)에서 처리 가능한 형식에 부합하는 특허 문건 데이터를 생성한다

상기 기설정된 처리에는 1) 오류 필터링, 2) 패턴화된 오류 수정, 3) 수동 오류 수정, 4) SGML 문건 데이터를 XML 문건 데이터로의 변환, 5) 표준 형식 변환 등이 있을 수 있다.

상기 원천 특허 문건 처리 모듈(301-1)은 입수되는 상기 입수 특허 문건 데이터를 기설정된 적어도 하나 이상의 오류 검증 필터(301-1-1)를 통과시켜 상기 입수 특허 문건 데이터가 본 발명의 특허 정보 시스템(1)에서 처리 가능한 형식에 부합하는지를 검증한다.

특허 문건 마스트 DB 생성 모듈(301-2)

본 발명의 특허 문건 마스트 DB 생성 모듈(301-2)은 상기 원천 특허 문건 처리 모듈(301-1)이 생성한 특허 문건 데이터 및 본 발명의 각종 전처리 모듈이 처리한 정보를 기초로 하여 특허 문건 마스트 DB(202)를 생성한다. 본 발명의 특허 문건 마스트 DB 생성 모듈(301-2)이 포함하고 있는 세부 모듈을 나열하면 다음과 같다. 1) 원천 서지사항 DB(202-1-1), 가공 서지사항 DB(202-1-2), 번역 서지사항 DB(202-1-3), 대표 도면 DB(202-1-4)를 생성하는 서지 사항 DB 생성 모듈(301-2-1)이 있다. 2)특허 문건 DB(202-2-1), 번역 특허 문건 DB(202-2-2), 가공 특허 문건 DB(202-2-3)을 생성하는 문건 DB 생성 모듈(301-2-2)이 있다. 3) 미국 assignee 변 동 DB(202-3-1), 권리 설정 변동 DB(202-3-2)를 생성하는 권리자 변동 DB 생성 모듈(301-2-3)이 있다. 4) 국가별 특허 상태 DB(202-4-1), 국가별 패밀리 DB(202-4-2)를 생성하는 패밀리 정보 DB 생성 모듈(301-2-4)이 있다. 5) 출원인 인용 정보 DB(202-5-1), 심사 인용 정보 DB(202-5-2)를 생성하는 인용 정보 DB 생성 모듈(301-2-5) 및 6) 행정 처리 정보 DB(202-6)를 생성하는 행정 처리 정보 DB 생성 모듈(301-2-6)이 있다.

상기 특허 문건 마스트 DB(202)에는 서지 사항 DB, 문건 DB, 권리 변동 정보 DB, 패밀리 정보 DB, 인용 정보 DB, 행정 처리 정보 DB 등이 있다.

상기 서지 사항 DB에는 특허 문건 데이터에서 직접 입수할 수 있는 원천 서지 사항 정보, 특허 문건 데이터 자체 또는 전체 특허 문건 데이터 집합을 대상으로 가공한 가공 서지 사항 정보, 각종 언어별로 상기 원천 서지 사항 및 가공 서지 사항 중 번역의 대상이 되어 번역된 언어별 번역 서지 사항 정보 및 기타 정보를 포함하고 있다. 상기 서지 사항 DB를 생성하는 것은 본 발명의 서지 사항 DB 생성 모듈이 담당한다.

상기 문건 DB에는 특허 문건 데이터 자체에 관한 특허 문건 데이터, 상기 특허 문건 데이터의 일부 또는 전부를 각종 언어로 번역한 언어별 번역 문건 데이터, 상기 특허 문건 데이터 또는 상기 언어별 번역 특허 문건 데이터를 pdf, doc, tiff, html 등과 같은 각종 파일 형식으로 변환한 가공 특허 문건 데이터를 포함하고 있다. 상기 각 특허 문건 데이터, 언어별 번역 특허 문건 데이터, 가공 특허 문건 데이터는 각각 특허 문건 DB, 번역 특허 문건 DB, 가공 특허 문건 DB의 형태로 존재할 수 있다. 상기 문건 DB를 생성하는 것은 본 발명의 문건 DB 생성 모듈이 담당한다.

상기 권리자 변동 정보 DB에는 미국 특허 문건을 대상으로 한 assignee 변동 정보 DB를 포함하고 있으며, 각국 특허청이 관리하는 각종 특허권자 및 특허출원인의 명의 정보의 변경 사항에 관한 정보 및 각종 실시권자의 설정 등록과 말소 등록에 관한 정보를 포함할 수 있다. 상기 권리자 변동 정보 DB를 생성하는 것은 본 발명의 권리자 변동 DB 생성 모듈이 담당한다.

상기 패밀리 정보 DB에는 개별 특허 문건과 관련된 각 국가별 패밀리 특허 문건에 관한 정보를 포함하고 있는 국가별 패밀리 데이터 및 각 패밀리 특허 문건의 각 국가에서의 상태(국가별 출원의 현 상태, 권리 취득 여부 등) 정보를 포함하고 있는 국가별 특허 상태 데이터를 포함할 수 있다. 상기 패밀리 정보 DB를 생성하는 것은 본 발명의 패밀리 정보 DB 생성 모듈이 담당한다.

상기 인용 정보 DB에는 특허 출원인이 인용한 인용 정보에 기초하여 생성되는 출원인 인용 정보 DB, 특정한 특허 출원에 대한 심사관의 심사 과정에서 인용된(주로 심사 대상 특허 출원의 신규성 및 진보성을 부정하기 위하여 인용되는 문건) 타 특허 문건심사 인용에 관한 정보에 기초하여 생성되는 심사 인용 정보 DB가 있다. 상기 인용 정보 DB를 생성하는 것은 본 발명의 인용 정보 DB 생성 모듈이 담당한다.

상기 행정 처리 정보 DB에는 각 특허 문건에 대하여 각국 특허청이 발생시키는 행정 처리 정보에 기초하여 생성되는 데이터를 포함하고 있다. 상기 행정 처리 정보 DB를 생성하는 것은 본 발명의 행정 처리 정보 DB 생성 모듈이 담당한다.

이어, 상기 서지 사항 DB 생성 모듈은 상기 특허 문건 데이터 및/또는 전체 특허 문건 데이터를 대상으로 각종 전처리 모듈 등이 가공한 정보를 입수하여 가공 서지 사항 데이터를 생성할 수 있으며, 상기 가공 서지 사항 데이터를 포함하고 있는 DB를 가공 서지 사항 DB라 한다. 상기 가공 서지 사항에는 1) 각종 카운팅 정보, 2) 각종 계산 및 평가 정보 등이 있을 수 있다.

각종 카운팅 정보를 예를 든다면, 1)출원인 수 및/또는 특허권자 수, 2) 발명자 수, 3) 출원 또는 등록 단계 등과 같은 각 단계별 청구항 수, 4) 명세서 페이지 수, 5) 도면 수, 6) 특허 분류 기호의 종류 수, 7) 각 종류의 특허 분류 기호의 수, 8) 레퍼런스(reference)수(=인용수)/피인용 수, 9) 심사 인용 수/피인용 수, 10) 심사관이 조사한 특허 분류 기호의 수, 11) 우선권 주장수, 12) 자국 포함 각 국가별 패밀리 특허 개수, 13) 전체 패밀리 개수, 14) 독립항 수, 15) 종속항 수, 16) 레퍼런스 중에서 국가 단위의 특허 수, 17) 레퍼런스 중에서 전체 특허 문건 수, 18) 레퍼런스 중에서 비특허 문건 수 등이 있을 수 있다. 상기와 같은 카운팅 정보를 처리하는 것은 본 발명의 카운팅 전처리 모듈이 담당한다. 상세한 것은 본 발명의 카운팅 전처리 모듈에서 설명한다.

각종 계산 및 평가 정보를 예로 든다면, 1) 그 특허 문건에 포함된 출원인의 그 특허 문건에 포함된 특허 분류 기호(그 특허 분류 기호 자체, 그 특허 분류 기호의 하위 특허 분류 기호 전체, 또는 직상위/차상위 특허 분류 기호 또는 그 특허 분류 기호의 메인그룹까지의 모든 단계의 특허 분류 기호를 대상으로 할 수도 있다.)에 대한 총출원수, 총등록수, 점유율, 집중율, 활동율(AI)등과 같은 각종 특허 지표를 계산한 값, 2) 그 특허 문건에 포함된 발명자의 그 특허 문건에 포함된 특허 분류 기호에 대한 각종 특허 지표를 계산한 값, 3) 각종 분석 지표 등이 있을 수 있으며, 상세한 것은 본 발명의 각종 전처리 모듈 및 분석 모듈에서 설명한다.

특허 분류 기호 마스트 DB 생성 모듈(301-3)

본 발명의 상기 전처리 모듈에는 특허 분류 기호 마스트 DB 생성 모듈(301-3)을 포함하고 있는데 상기 특허 분류 기호 마스트 DB 생성 모듈(301-3)이 생성하는 DB는 다음과 같다.

1) 각국의 특허청 또는 특허 원천 데이터 소스들로부터 입수되는 각종 특허 분류 기호의 raw data를 저장하고 있는 원천 특허 분류 기호 DB(203-1)이다.

2) 각종 특허 분류 기호를 본 발명의 특허 정보 시스템(1)의 용도에 맞게 변형한 특허 분류 기호를 저장하고 있는 변형 특허 분류 기호 DB(203-2)가 있으며, 이는 변형 특허 분류 기호 생성 모듈(301-3-3)이 생성한다.

3) 임의의 특허 분류 기호에 대한 모든 상위 특허 분류 기호를 모아서 저장하고 있는 총상위 특허 분류 기호 집합 DB(203-3)가 있으며, 이는 총상위 특허 분류 기호 집합 생성 모듈(301-3-1-1)이 생성한다.

4) 임의의 특허 분류 기호에 대한 직하위 또는 모든 하위 특허 분류 기호에 대한 정보를 저장하고 있는 하위 특허 분류 기호 집합 DB(203-4)가 있으며, 이는 특허 분류 기호 집합 생성 모듈(301-3-1-2)이 생성한다. 상기 하위 특허 분류 기호 집합 생성 모듈(301-3-1-2)에는 직하위 특허 분류 기호 집합만을 생성하는 직하위 특허 분류 기호 집합 생성 모듈(301-3-1-2-1)와 모든 하위 특허 분류 기호 집합을 생성하는 총하위 특허 분류 기호 집합 생성 모듈(301-3-1-2-2)이 있다.

5) 특허 분류 기호 체계를 트리 구조로 저장하고 있는 특허 분류 기호 트리 테이블 DB(203-5) 있으며, 이는 특허 분류 기호 트리 테이블 생성 모듈(미도시)이 생성한다.

6) 임의의 특허 분류 기호에 대한 총상위 특허 분류 기호를 레벨별로 저장하고 있는 총상위 특허 분류 기호 테이블 DB(203-6)가 있으며, 이는 총상위 특허 분류 기호 집합 생성 모듈(301-3-1-1)이 생성한다. 한편, 특허 분류 기호에서 갱신이 있을 경우, 이는 본 발명의 특허 분류 갱신 모듈(301-3-5)이 처리하며, 갱신된 특허 분류 기호에 대하여 관련된 기설정된 모듈이 기설정된 처리를 수행한다.

이하, 특허 분류 기호에 대해서 통합적으로 설명한다.

특허 분류 기호의 다단계성

다단계 계층(트리, tree) 구조로 되어 있는 각 특허 분류 기호는 특허 분류 기호 vs. 그 특허 분류 기호의 타이틀 정보의 대응 관계를 갖고 있다. 본 특허 명세서의 곳곳에서 이러한 예를 다수 제시되어 있다. 계층 구조 상에서 주어진 특허 분류 기호의 하위 특허 분류 기호 모두에 대한 정보를 입수하기 위해서는 검색 엔진(검색 모듈(401)과 검색 엔진은 동의어로서 본 발명에서 사용된다.) 또는 DBMS(201)에 확장자/와일드카드 등을 사용할 수 있다. 예를 들어, H01F의 하위 특허 분류에 관한 모든 정보를 입수하려면, 검색어 또는 질의어에 H01F에 확장자/와일드카드(예를 들어?)를 결합하여 질의하면 H01F의 모든 하위 특허 분류 기호를 입 수할 수 있다. 마찬가지로 H01F1/00의 하위 특허 분류에 관한 모든 정보를 입수하려면 "H01F1?"을 입력하면 된다. 하지만, 만약 H01F1/01의 하위 특허 분류에 관한 모든 정보를 입수하기 위해서는 "H01F1/01?"를 입력할 수 없다. 그 이유는 IPC 등의 특허 분류 기호의 타이틀 정보에 도트(dot)가 포함되는 특허 분류 기호들은 동일한 표시 패턴(예를 들어 IPC의 경우 메인그룹 표시+ / + 숫자, USPC의 경우 클래스번호+숫자, FT의 경우에는 숫자1자+영문자1자+3자리숫자+영문자2자+숫자 등)을 가지면서 도트의 수로서 상대적인 부모 자식(parent child) 관계/상위 하위 관계를 표시하기 때문이다. 즉, 타이틀 정보에 도트가 포함되어 있지 않은 경우에는 특허 분류 기호의 표기 체계 만으로도 부모 자식 관계/상위 하위 관계를 구별할 수 있지만, 그렇지 않은 경우에는 특허 분류 기호의 표기 체계 만으로는 구별할 수 없기 때문이다.

한편, 특허 분류 기호가 계층 구조를 가진다는 속성 상, 하위 특허 분류 기호에 해당하는 특허 문건은 상위 특허 분류 기호에도 해당되는 것이 마땅하다. 즉, 특정 특허 문건에 H01F1/04라는 특허 분류 기호가 할당되었다면, 이 특허 문건은 H01F1/032에도 해당되고, H01F1/03에도 해당되며, H01F1/01에도 해당되며, 당연히 H01F1/00에도 해당되게 된다. 이를 역으로 해석하면 H01F1/03과 관련되는 특허 정보에는 H01F1/03뿐만 아니라, 특허 분류 기호의 계층 구조 체계 상 H01F1/03의 하위에 있는 모든 특허 분류 기호에 관련된 특허 정보가 포함되어 있어야 한다. 즉, H01F1/03과 관련되는 특허 정보에는 당연히 H01F1/032, H01F1/04뿐만 아니라 특허 분류 기호 체계 상 H01F1/03의 하위에 있는 모든 특허 분류 기호에 관련된 특허 정 보가 포함되어야 한다.

도 14에서는 이와 같은 본 발명의 발명 사상이 적용되지 않은 경우의 한 예를 보여주고 있다. 도 14에서 알 수 있듯이 A61B 3/00에 대응되는 문건보다 그 하위 분류인 A61B 3/02에 대응되는 문건이 많이 나오고 있다.

하위 특허 분류 기호의 처리 방법 3가지

상기와 같은 이유로, 타이틀 정보에 도트가 포함되어 있는 특허 분류 기호에 대해서는 그 특허 분류 기호의 모든 하위 특허 분류 기호에 관한 정보를 포함하도록 처리할 필요가 있으며, 이와 같은 처리를 담당하는 것은 본 발명의 특허 분류 기호 마스트 DB 생성 모듈(301-3)에 포함되어 있는 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)이다.

주어진 특허 분류 기호에 대한 정보 추출의 모든 과정에는 그 하위 특허 분류 기호에 관한 특허 정보를 포함시킬 필요가 있으며, 그러한 정보 추출 과정의 대표적인 경우로서 1) 검색, 2) 통계, 3) 분석, 4) 감시, 5) 디렉토리 표시 등을 들 수 있다. 확장자(와일드카드)를 사용하지 못하는 상황에서 주어진 특허 분류 기호에 대하여 모든 하위 특허 분류 기호에 관한 정보를 포함시키기 위해서는 본질적으로 다음과 같은 과정 중 어느 하나의 처리가 필요하게 된다.

첫째, 주어진 특허 분류 기호에 대하여 특허 분류 기호 체계(트리 구조)를 깊이 우선 탐색 등의 방식으로 탐색하여 모든 하위 특허 분류 기호에 관한 정보를 입수한다. 이러한 정보 입수 과정은 질의/검색마다 매번 일어날 수 있다. 한편, 주어진 특허 분류 기호 체계(트리 구조)에 대하여 모든 특허 분류 기호 또는 타이틀 정보에 도트를 포함하고 있는 특허 분류 기호에 대한 모든 하위 특허 분류 기호를 입수하여 저장해 놓고, 질의/검색 시 저장된 모든 하위 특허 분류 기호에 관한 정보를 입수하는 방식을 취할 수도 있다. 트리 구조로 된 데이터가 주어졌을 때, 이 트리 구조를 구성하는 각 노드(node)에 대하여 깊이 우선 탐색 등의 방식으로 각 노드의 직하위 노드 및/또는 모든 하위 노드를 찾아 내는 것은 전산학의 기초에 해당하는 것이므로, 이에 대한 설명은 생략한다. 또한, 입수한 직하위 노드 및/또는 모든 하위 노드의 정보를 특정 노드에 대응시켜 저장하는 것 또한 기초적인 것이므로, 이에 대한 설명도 생략한다.

둘째, 모든 특허 분류 기호에 대하여 자신의 상위에 해당하는 특허 분류 기호에 관한 정보를 특허 분류 기호 체계(트리 구조)를 참조하여 단계별로 저장해 놓은 다음 주어진 특허 분류 기호가 있을 때, 이 특허 분류 기호가 최초로 나타나는 특정 단계를 찾아 내고, 그 특정 단계에 그 특허 분류 기호가 표기되어 있는 모든 특허 분류 기호에 관한 정보를 입수하는 방식을 취할 수도 있다.

셋째, 주어진 특허 분류 기호 체계(트리 구조)를 그 체계를 유지하면서 특허 분류 기호의 표기만을 변형시켜, 변형 특허 분류 기호를 생성하고, 변형 특허 분류 기호에 대하여 위 첫째와 둘째 방법을 실시할 수 있다. 한편, 특허 분류 기호 체계를 참조하여 변형하는 방식을 적절히 선택하면 범위(range) 검색/범위(range) 질의에 응답할 수 있도록 특허 분류 기호 표기를 변형할 수 있게 된다.

H04B 7/00를 통한 예시적 설명

본 발명에서는 IPC 7판 기준 메인그룹 H04B 7/00(타이틀은 무선전송시스템이 다.) 및 이의 하부에 해당하는 특허 분류 기호를 실시예로 들어 상기 특허 분류 기호들 간의 트리 구조를 설명하나, 이러한 방법 및 설명은 본 실시예에 한정되지 않고, 전 IPC 영역에 걸쳐 동일 또는 대등하게 적용됨은 물론이며, 타이틀에 도트 구조로서 계층의 상위와 하위를 표현하는 방식으로 포함하는 다른 특허 분류 기호 체계(예를 들면, USPC, FI, FT 또는 ECLA) 등에 대해서도 동일 또는 대등한 방식으로 적용된다.

메인그룹 H04B 7/00 및 이의 하부에 해당하는 특허 분류 기호 및 그 타이틀은 IPC 7판 기준으로 다음과 같은 구성을 가진다.

H04B 7/00 무선전송시스템, 즉, 방사전자계를 사용한 것

H04B 7/005 .전송의 제어 ; 등화

H04B 7/01 .위상편이의 저감

H04B 7/015 .반향효과의 저감

H04B 7/02 .다이버시티(diversity)시스템

H04B 7/04 .. 떨어져 배치된 복수의 독립공중선을 사용한 것

H04B 7/06 ...송신국에 있어서의 것

H04B 7/08 ...수신국에 있어서의 것

H04B 7/10 .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스 템을 사용한 것

H04B 7/12 ..주파수다이버시티 시스템

H04B 7/14 .릴레이(relay)시스템

H04B 7/145 ..수동 릴레이 시스템

H04B 7/15 ..능동 릴레이 시스템

H04B 7/155 ...기지국(ground based stations)

H04B 7/165 ....각도변조를 사용하는 것

H04B 7/17 ....펄스변조를 사용하는 것

H04B 7/185 ...우주국 또는 항공기탑재국(space based or airborne stations)

H04B 7/19 ....지구동기국(earth synchronization stations)

H04B 7/195 ....비동기국

H04B 7/204 ...다중악세스(multiple access )

H04B 7/208 ....주파수분할 다중악세스

H04B 7/212 ....시분할 다중악세스

H04B 7/216 ....코드분할 또는 스프레드-스펙트럼 다중 억세스

H04B 7/22 .산란파 전파시스템

H04B 7/24 .둘 또는 그 이상의 지점간의 통신을 위한 것

H04B 7/26 .. 적어도 하나의 지점이 이동될 수 있는 것

상기를 도트를 기준으로 트리 계층 구조를 더욱 쉽게 할 수 있도록 하면 다 음 표 1과 같은 표현될 수 있다.

[표 1]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹	4-도트서브그룹	타이틀
H04B 7/00					무선전송시스템
	H04B 7/005				.전송의 제어 ; 등화
	H04B 7/01				.위상편이의 저감
	H04B 7/015				.반향효과의 저감
	H04B 7/02				.다이버시티(diversity)시스템
		H04B 7/04			.. 떨어져 배치된 복수의 독립공중선을 사용한 것
			H04B 7/06		...송신국에 있어서의 것
			H04B 7/08		...수신국에 있어서의 것
		H04B 7/10			.. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
		H04B 7/12			..주파수다이버시티 시스템
	H04B 7/14				.릴레이(relay)시스템
		H04B 7/145			..수동 릴레이 시스템
		H04B 7/15			..능동 릴레이 시스템
			H04B 7/155		...기지국(ground based stations)
				H04B 7/165	....각도변조를 사용하는 것
				H04B 7/17	....펄스변조를 사용하는 것
			H04B 7/185		...우주국 또는 항공기탑재국
				H04B 7/19	....지구동기국
				H04B 7/195	....비동기국
			H04B 7/204		...다중악세스
				H04B 7/208	....주파수분할 다중악세스
				H04B 7/212	....시분할 다중악세스
				H04B 7/216	코드분할 또는 스프레드-스펙트럼 다중 억세스
	H04B 7/22				.산란파 전파시스템
	H04B 7/24				.둘 또는 그 이상의 지점간의 통신을 위한 것
		H04B 7/26			.. 적어도 하나의 지점이 이동될 수 있는 것

이때, 특허 분류 기호 체계(트리 구조)를 참조하여 자신의 상위에 있는 모든 특허 분류 기호를 입수하면 아래 표 2와 같은 총상위 특허 분류 기호 테이블을 생성할 수 있다. 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 IPC 뿐만 아니라, USPC, FT, ECLA, FI 등에 대해서도 생성할 수 있음은 물론이다 하겠다. 한편, 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 상기 특허 분류 기호들이 갱신될 때, 갱신된 특허 분류 기호 정보를 입수하여 상기 테이블도 갱신되는 것이 바람직하다. 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 본 발명의 총상위 특허 분류 기호 테이블 생성 모듈이 특허 분류 기호 마스트 DB로부터 특허 분류 기호를 입수 받아 생성한다. 상기 총상위 특허 분류 기호 테이블 생성 모듈은 특허 분류 기호에 관한 정보가 갱신될 때마다 상기 총상위 특허 분류 기호 테이블을 생성하는 것이 바람직하다. 상기 총상위 특허 분류 기호 테이블 생성 모듈은 본 발명의 변형 특허 분류 기호 DB에 대해서도 동일한 형태의 총상위 특허 분류 기호 테이블을 생성해 놓을 수 있을 것이다.

하기 표 2에서 각 필드인, IPC_ID는 특정 IPC의 ID를, S는 섹션 레벨, C는 클래스 레벨, SC는 서브클래스, MG는 메인그룹, 1dot는 타이틀 정보에 1개의 도트가 있는 레벨을, 2dot는 타이틀 정보에 2개의 도트가 있는 레벨을, 3dot는 타이틀 정보에 4개의 도트가 있는 레벨을, (그러므로, n dot는 타이틀 정보에 n개의 도트가 있는 레벨을 나타낸다), self는 IPC 자기 자신을 나타낸다.

[표 2]

IPC_ID	S	C	SC	MG	1dot	2dot	3dot	4dot	Self
69964	H	H04	H04B	H04B7/00					H04B7/00
69965	H	H04	H04B	H04B7/00	H04B7/005				H04B7/005
69966	H	H04	H04B	H04B7/00	H04B7/01				H04B7/01
69967	H	H04	H04B	H04B7/00	H04B7/015				H04B7/015
69968	H	H04	H04B	H04B7/00	H04B7/02				H04B7/02
69969	H	H04	H04B	H04B7/00	H04B7/02	H04B7/04			H04B7/04
69970	H	H04	H04B	H04B7/00	H04B7/02	H04B7/04	H04B7/06		H04B7/06
69971	H	H04	H04B	H04B7/00	H04B7/02	H04B7/04	H04B7/08		H04B7/08
69972	H	H04	H04B	H04B7/00	H04B7/02	H04B7/10			H04B7/10
69973	H	H04	H04B	H04B7/00	H04B7/02	H04B7/12			H04B7/12
69974	H	H04	H04B	H04B7/00	H04B7/14				H04B7/14
69975	H	H04	H04B	H04B7/00	H04B7/14	H04B7/145			H04B7/145
69976	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15			H04B7/15
69977	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/155		H04B7/155
69978	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/155	H04B7/165	H04B7/165
69979	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/155	H04B7/17	H04B7/17
69980	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/185		H04B7/185
69981	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/185	H04B7/19	H04B7/19
69982	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/185	H04B7/195	H04B7/195
69983	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/204		H04B7/204
69984	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/204	H04B7/208	H04B7/208
69985	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/204	H04B7/212	H04B7/212
69986	H	H04	H04B	H04B7/00	H04B7/14	H04B7/15	H04B7/204	H04B7/216	H04B7/216
69987	H	H04	H04B	H04B7/00	H04B7/22				H04B7/22
69988	H	H04	H04B	H04B7/00	H04B7/24				H04B7/24
69989	H	H04	H04B	H04B7/00	H04B7/24	H04B7/26			H04B7/26

즉, H04B7/06이라는 IPC 특허 분류 기호가 주어졌을 때, IPC 특허 분류 기호 체계를 참조하여 자신의 모든 부모 노드(트리 구조 상의 분기점 등을 노드(node)라 한다)를 찾으면, H, H04, H04B, H04B7/00, H04B7/02, H04B7/04, H04B7/06, H04B7/06이 되고, 이를 상기 필드 구조에 맞추어 정리하면, IPC_ID69970에 나와 있는 것과 같은 데이터를 생성할 수 있다.

상기 표 2와 같은 총상위 특허 분류 기호 테이블이 주어졌을 때, 주어진 특허 분류 기호의 모든 상위 특허 분류 기호를 입수하는 것은 1) self 필드에서 주어진 특허 분류 기호를 찾고, 찾은 특허 분류 기호의 행을 따라 상위 단계로 올라가면서 각 단계별로 특허 분류 기호를 획득하면 될 것이다. 상기와 같은 주어진 특허 분류 기호의 총상위 특허 분류 기호를 모아서 DB화 시켜 놓은 것이 본 발명의 총상위 특허 분류 기호 집합 DB이며, 상기 총상위 특허 분류 기호 테이블을 활용하여 특정한 특허 분류 기호의 모든 하위 특허 분류 기호를 추출하여 DB화 시켜 놓은 것이 본 발명의 하위 특허 분류 기호 집합 DB이다. 이때, 상기 총상위 특허 분류 기호 테이블을 활용하여 특정한 특허 분류 기호의 직하위 특허 분류 기호만을 추출할 수 있는데, 이러한 정보를 DB와 시켜 놓은 것이 본 발명의 직하위 특허 분류 기호 집합 DB이다.

상기 표 2와 같은 총상위 특허 분류 기호 테이블이 있을 때, 특정한 특허 분류 기호가 주어졌을 때, 그 특허 분류 기호 및 그 하위 모든 특허 분류 기호를 입수하는 방법에 대해서 H04B7/15를 예로써 설명한다. 1 단계로 먼저 Self에서 H04B7/15를 찾으면, IPC_ID69976에 있음을 알게 된다. 2단계로, 어느 레벨의 필드 에서 자기 자신과 동일한 특허 분류 기호가 대응되어 있는지를 찾으면 2 dot 레벨 필드임을 알게 된다. 3단계로, 2 dot 레벨 필드에서 H04B7/15가 있는 특허 분류 기호를 찾으면, 각각 H04B7/15, H04B7/155, H04B7/165, H04B7/17, H04B7/185, H04B7/19, H04B7/195, H04B7/204, H04B7/208, H04B7/212, H04B7/216이 된다. 이들이 H04B7/15 자신과 H04B7/15의 모든 하위 특허 분류 기호가 된다. 찾은 결과에서 자기 자신을 제외하면 자신의 모든 하위 특허 분류 기호를 자기 자신과 대응시킬 수 있음은 물론이다 하겠다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호 및 모든 하위 특허 분류 기호에 관한 정보로 하위 특허 분류 기호 집합 DB를 생성할 수 있다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호의 모든 하위 특허 분류 기호를 저장하면 총하위 특허 분류 기호 집합 DB를 생성할 수 있다. 그리고, 자기 자신을 포함한 모든 하위 특허 분류의 개수(여기서는 11개, 자기 자신을 제외하면 10개)를 카운팅할 수도 있을 것이다. 이러한 카운팅은 본 발명의 카운팅 전처리 모듈이 수행하는 것이 바람직하다.

한편, 여기서 자신의 직하위 특허 분류 기호만을 추출하는 방법을 생각해 보면, 상기 3단계를 수행할 때 3 dot 레벨 필드값이 null이 아니며(직하위에 값이 있음), 4 dot 레벨 필드값이 null인(직하위의 하위값은 없음) 특허 분류 기호를 찾으면, 각각 H04B7/155, H04B7/185, H04B7/204를 얻게 된다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호의 직 하위 특허 분류 기호를 저장하면 직하위 특허 분류 기호 집합 DB를 생성할 수 있다.

이때, 자신의 직하위 특허 분류 기호의 개수(여기서는 3)을 카운팅해 놓을 수 있을 것이며, 이러한 카운팅은 본 발명의 카운팅 전처리 모듈이 수행하는 것이 바람직할 것이다. 이와 같은 직하위 특허 분류 기호가 필요한 경우에는 단계별 펼침의 필요성 때문이다. 단계별 펼침이란 IPC 디렉토리 구조를 표시할 때, 각 레벨(섹션, 클래스, 서브클래스, 메인그룹, 1 도트 서브그룹, 2 도트 서브그룹, 3 도트 서브그룹, 4 도트 서브그룹, ... n 도트 서브그룹 등으로 단계별로 펼치는 것을 말하며, 그 단계에 있는 특허 분류 기호만을 표시해 준다. 한편, 이 경우 표시는 단계별 펼침이 되더라도 그 각 단계에 대한 값(검색 결과, 통계값, 계산값, 분석값 등의 모든 값)은 그 특정한 특허 분류 기호 및 그 특정한 특허 분류 기호의 모든 하위 특허 분류 기호를 모두 고려한 값으로 하는 것이 바람직할 것이다. 예를 들면, H04B7/15의 직하위를 펼쳤을 때, H04B7/155, H04B7/185, H04B7/204이 그 다음 단계로 나오더라도, H04B7/155에 대한 값은 H04B7/155 및 H04B7/155의 하위인 H04B 7/165와 H04B 7/165을 모두 포함하여 고려한 값이 H04B 7/155의 값으로 표시되어야 한다는 것을 의미한다. 물론, 특수한 경우에는(사용자의 선택 등) 그 특정한 특허 분류 기호만에 대한 값을 표시해 줄 수 있을 것이다.

상기와 같은 테이블 구조(상기 3단계로 자신의 하위 특허 분류 기호를 찾는데 사용되는 테이블을 말한)는 후술하는 검색, SQL 명령어로 필요한 정보를 입수할 때, 및 통계 분석 처리 등에서 활용될 수 있으며, 특히 분석 등의 편의를 위해 사전에 각 특허 분류 기호에 대하여 기설정된 규칙에 따르는 값을 계산해 놓을 경우(뷰(View), 물리적인 뷰(Materialized View, 다차원 분석용 연산 수행 결과 테이블), 큐브(Cube) 등)에 활용될 수 있다. 이러한 계산값을 계산할 때 롤업 연 산(roll up, 자신에 대한 값에 자신의 하부에 있는 대상에 대한 값들을 포함시켜 자신의 값으로 하는 것을 포함하는 개념이다.)이 활용되며, 이러한 롤업 연산의 경우 상기 테이블이 활용될 수 있다. 롤업 연산이란 예를 들면 연도값에는 각 분기별 값을 더하여 연도값을 생성할 수 있으며, 각 분기별 값은 각 분기를 이루는 월들의 값을 더하여 분기별 값을 생성할 수 있는 방식을 말한다. 특정 특허 분류 기호에 대한 값(예를 들면 연도별 출원수)을 계산할 때, 자기 자신에 대한 값과 자신의 하위 특허 분류 기호에 대한 값을 합하여 그 특허 분류 기호에 대한 값을 생성할 수 있다. 상세한 것은 본 발명의 분석에서 상술한다.

상기와 같은 방법으로 모든 IPC 코드/IPC 특허 분류 기호에 대해서 동일하게 처리하면, 모든 IPC 특허 분류 기호를 대상으로 하는 상기와 같은 형식의 테이블을 생성할 수 있고, 이러한 테이블 및 상기에서 언급한 각 언어별 타이틀 정보를 포함하여 원천 특허 분류 기호 DB 중 IPC에 해당하는 원천 IPC 특허 분류 기호 DB를 생성할 수 있다. 상기와 같은 방식으로 USPC, FT, FI, ECLA 등도 마찬가지의 테이블을 생성할 수 있게 된다.

H04B7/00이하에 있는 특허 분류 기호를 대상으로 하여, 특허 분류 기호 간의 child-parent 관계가 나타난 정보 구조의 구현예를 제시한다.

먼저, child 특허 분류 기호에 그 분류 기호가 속한 직상위 분류 기호인 parent(child -> parent)를 대응시키는 방법에 따른 결과이다. 그 예가 하기 표 3에 있다.

[표 3]

Child(자신)	Parent(자신의 parent)
H04B 7/005	7/00
H04B 7/01	7/00
H04B 7/015	7/00
H04B 7/02	7/00
H04B 7/04	H04B 7/02
H04B 7/06	H04B 7/04
H04B 7/08	H04B 7/04
H04B 7/10	H04B 7/02
H04B 7/12	H04B 7/02
H04B 7/14	7/00
H04B 7/145	H04B 7/14
H04B 7/15	H04B 7/14
H04B 7/155	H04B 7/15
H04B 7/165	H04B 7/155
H04B 7/17	H04B 7/155
H04B 7/185	H04B 7/15
H04B 7/19	H04B 7/185
H04B 7/195	H04B 7/185
H04B 7/204	H04B 7/15
H04B 7/208	H04B 7/204
H04B 7/212	H04B 7/204
H04B 7/216	H04B 7/204
H04B 7/22	7/00
H04B 7/24	7/00
H04B 7/26	H04B 7/24

이어서, 자기 자신의 직하위에 대한 모든 child 정보를 가지는 방법(parent -> child)에 대한 결과의 일실시예가 표 4에 있다.

[표 4]

Parent(자신)	Child(자신의 직하위 child)
H04B 7/00	H04B 7/005 H04B 7/01 H04B 7/015 H04B 7/02 H04B 7/14 H04B 7/22 H04B 7/24
H04B 7/005	null
H04B 7/01	null
H04B 7/015	null
H04B 7/02	H04B 7/04 H04B 7/10 H04B 7/12
H04B 7/04	H04B 7/06 H04B 7/08
H04B 7/06	null
H04B 7/08	null
H04B 7/10	null
H04B 7/12	null
H04B 7/14	H04B 7/145 H04B 7/15
H04B 7/145	null
H04B 7/15	H04B 7/155 H04B 7/185 H04B 7/204
H04B 7/155	H04B 7/165 H04B 7/17
H04B 7/165	null
H04B 7/17	null
H04B 7/185	H04B 7/19 H04B 7/195
H04B 7/19	null
H04B 7/195	null
H04B 7/204	H04B 7/208 H04B 7/212 H04B 7/216
H04B 7/208	null
H04B 7/212	null
H04B 7/216	null
H04B 7/22	null
H04B 7/24	H04B 7/26
H04B 7/26	null

디렉토리 생성 모듈(405)

본 발명의 디렉토리 생성 모듈(405)은 특허 분류 기호별 직하위 특허 분류 기호를 제공하고, 상기 특허 분류 기호 및 상기 직하위 특허 분류 기호에 대한 카운팅 값을 상기 특허 분류 기호 및 상기 직하위 특허 분류 기호 옆에 표시해 줄 수 있다. 상기 카운팅 값에는 1) 모든 하위 분류의 개수, 2) 직하위 특허 분류의 개수, 3) 분류의 깊이, 4) 모든 하위 분류에 대응되는 특허 문건의 수, 5) 직하위 특허 분류 기호에 대응되는 특허 문건의 수 중에서 선택되는 어느 하나 이상이 될 수가 있는데, 가급적 1), 2), 5)가 함께 표시 있는 것이 바람직하다. 상기 디렉토리 생성 모듈(405)은 상기 1) ~5) 중 어느 하나 이상을 본 발명의 i) 카운팅 전처리 모듈이 수행해 놓은 카운팅 값에서 읽어 오거나, ii) 후술하는 총량 분석용 다차원 분석용 연산 수행 결과 테이블 iii) 특허 분류 기호 트리 테이블, 또는 iv) 총상위 특허 분류 기호 테이블 중 어느 하나 이상에서 읽어와서, 상기 1) ~5)를표시해 줄 수 있다.

상기 특허 분류 기호 정보를 디렉토리 방식으로 배치할 때, 각 디렉토리에 색깔이나 아이콘 등의 기호 표시를 하여, 사용자의 접근성을 향상시킬 수 있다. 즉, 직하위 분류가 많은 경우, 모든 하위 분류가 많은 경우, 깊이가 깊은 경우, 해당 특허 문건이 많은 경우 등에 따라 다른 색깔을 부여하거나 기설정된 아이콘 등을 부여함으로써, 사용자가 그 디렉토리의 내부 속성(모든 하위 분류의 개수, 분류의 깊이, 특허 문건의 수 등)을 더 잘 알 수 있게 도울 수 있다. 특히, 특정 특허 분류 기호 디렉토리의 모든 하위 분류의 개수가 많거나 분류의 깊이가 많은 경우는 그 영역으로의 특허 출원이 많고, 기술이 다양하게 출원되고 있음을 방증하기 때문 에, 그렇지 못한 디렉토리보다 중요성이 더 클 경우가 많기 때문이다.

도 15는 본 발명의 디렉토리 생성 모듈(405)의 일 구현예를 보여주고 있다. 상기 도 15에서 알 수 있듯이, 디렉토리의 기설정된 단계부터는 적어도 하나 이상의 특허 분류 기호에 체크 박스를 할 수 있고, 이 체크 박스로 선택된 특허 분류 기호에 대하여, 국가 단위로 검색을 하거나, 특허 분류 기호 기준으로 한 특허 분석을 수행할 수 있음을 알 수 있다.

본 발명의 디렉토리 생성 모듈(405)은 적어도 하나 이상의 특허 분류 기호의 종류별로 다단계 특허 분류 기호 체계에 대응되는 특허 분류 기호에 대한 디렉토리를 생성하는 특허 분류 기호 활용 디렉토리 생성 모듈(405-1)과 본 발명의 명세서에서 소개하는 각종 분석 주제별 또는 기타 확정가능한 주제별 다단계 디렉토리를 생성하는 주제별 디렉토리 생성 모듈(405-2)이 있다. 상기 주제별 디렉토리 생성 모듈의 작동예는 도 ***에서 보여 주고 있다. 상기 디렉토리는 사용자 또는 상기 시스템(10)의 관리자가, 특정 주제에 맞게 다단계 계층 구조를 가지는 디렉토리를 생성하고, 상기 디렉토리에 검색식이나 질의식, 키워드, 특허 분류 기호 등과 같은 요소를 대응시켜 놓을 수 있고, 상기 시스템(10)은 상기 대응된 정보를 이용하여, 검색, 감시를 수행할 수 있고, 상기 검색 또는 감시된 결과에 대하여 본 명세서 상의 다양한 분석을 수행할 수 있다.

하위 계층 특허 분류 기호 처리 모듈

하위 계층 특허 분류 기호 처리 모듈은, 사용자가 입력하는 검색식 등에서 입수 받은 특허 분류 기호에 대하여, 상기 계층적 특허 분류 기호 데이터베이스를 통하여 상기 입수 받은 특허 분류 기호에 종속되는 하위 계층 특허 분류 기호를 찾아 내는 역할을 수행한다.

입수 받은 특허 분류 기호에 대해 하위 계층 특허 분류 기호에 해당하는 특허 문건이 검색 결과에 포함되게 하기 위해서는 다음과 같은 3가지 중 어느 하나 이상이 필요하며, 이러한 일을 상기 하위 계층 특허 분류 기호 처리 모듈이 수행한다.

첫째, 상기 계층적 특허 분류 기호 데이터베이스를 이용하여 입수 시점을 기준으로 하여 입수 받은 특허 분류 기호의 하위 계층 특허 분류 기호를 모두 찾아 낸다. 계층적 특허 분류 기호 데이터베이스 상의 특허 분류 기호들이 트리 구조를 가지고 있기 때문에 이를 찾아 낼 수 있게 된다. 입수 받은 검색식에 특정한 특허 분류 기호가 포함되어 있을 경우, 상기 트리 구조를 따라서 그 특허 분류 기호의 하위 계층의 모든 특허 분류 기호들을 찾아낼 수 있게 되고, 그 결과를 수정 검색식 생성 모듈에 전송하며, 수정 검색식 생성 모듈은 전송 받은 모든 특허 분류 기호들을 반영한 새로운 검색식을 생성하여 검색 엔진에 질의할 수 있다.

둘째, 사전에 모든 특허 분류 기호에 대하여 그 하위 계층 특허 분류 기호들을 찾아내어 매칭하여(매칭 테이블에) 저장해 놓고, 입수되는 검색식에서 특정 특허 분류 기호가 있을 경우, 그 특정 특허 분류 기호에 매칭된 하위 계층 특허 분류 기호들을 즉시 상기 수정 검색식 생성 모듈에 전송할 수 있다.

상기 하위 계층 특허 분류 기호 추출 모듈이 추출하는 하위 계층 특허 분류 기호의 범위는 크게 2가지가 있을 수 있다. 하나는 입수 받은 특허 분류 기호의 직 하위 특허 분류 기호만으로 추출하는 방법이며, 다른 하나는 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출하는 방법이다. 이때, 직하위 특허 분류 기호만을 추출하는 경우에도, 상기 추출된 직하위 특허 분류 기호들 각각에 대하여 다시 이들의 직하위 특허 분류 기호를 추출해 내며, 이와 같은 방식을 반복함으로써 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출해 낼 수 있다.

예를 들어 설명하면, 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우, 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이며, 하위의 모든 특허 분류 기호는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 된다.

H04B7/15, H04B7/155, H04B7/165, H04B7/17, H04B7/185, H04B7/19, H04B7/195, H04B7/204, H04B7/208, H04B7/212, H04B7/216가 된다.

상기와 같은 직하위 특허 분류 기호 및 모든 하위 특허 분류 기호를 추출하는 것은 상기 child -> parent 대응 관계에서나, parent -> child 대응 관계에서나 직접 또는 반복적으로(recursively) 용이하게 추출해 낼 수 있음은 당업자에게는 당연할 것이다.

상기 하위 계층 특허 분류 기호 추출 모듈은 추출된 하위 계층 특허 분류 기호를 주합하여 저장한다. 상기의 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호만을 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/185, 및 H04B 7/204^ 을 주합하여 저장하며, 하위의 모든 특허 분류 기호를 함께 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216^를 주합하여 저장한다.

수정 검색식 생성 모듈

수정 검색식 생성 모듈은 상기 주합된 특허 분류 기호를 원래의 기존 검색식과 통합하여 수정 검색식을 생성한다.

예를 들어 설명하면, 주어진 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15}일 경우에 상기 수정 검색식 생성 모듈은 주어진 검색식에서 IPC H04B 7/15를 찾아서, 직하위 또는 모든 하위 특허 분류 기호를 입수 받고 주합하여, ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/185 OR H04B 7/204} 또는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/165 OR H04B 7/17 OR H04B 7/185 OR H04B 7/19 OR H04B 7/195 OR H04B 7/204 OR H04B 7/208 OR H04B 7/212 OR H04B 7/216}와 같은 분류 기호가 통합된 수정된 검색식을 생성해 낸다. 바람직하게는 후자의 검색식이 좋다.

상기 하위 계층 특허 분류 기호 처리 모듈이 수행하는 역할을 요약하면, 입수되는 검색식에서 특허 분류 기호가 포함될 때, 그 특허 분류 기호의 하위 계층 특허 분류 기호에 관련된 정보를 찾아 내어 수정 검색식 생성 모듈이 처리할 수 있 도록 해 준다.

상기 검색 엔진은 사용자의 컴퓨터로부터 특허 분류 기호가 포함된 검색식을 입수 받는다 이때, 상기 입수된 검색식에 포함되어 있는 특허 분류 기호가 타이틀 정보에 도트를 포함하는 경우, 상기 특허 분류 기호 전처리 엔진을 통하여 특허 분류 기호 체계 상에서 하위 특허 분류 기호를 입수하고, 상기 입수한 특허 분류 기호를 OR로 묶고, 상기 OR로 묶은 하위 특허 분류 기호를 포함한 수정 검색식을 생성하고, 수정 검색식으로 검색을 수행한다. 상기 각 단계에 대해서는 상술한 바와 같다.

한편 통상적인 검색 엔진은 범위 검색을 지원한다. 예를 들어 설명하면, H04B 7/15의 경우라면, H04B 7/15 및 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 모두 or 관계로 묶어 검색 엔진에 질의하는 것 보다, From H04B 7/15 to H04B 7/216으로 질의하는 것이 훨씬 더 빨리 검색 결과를 응답 받을 수 있다. 이는 특히, 하위 계층 특허 분류 기호들이 많으면 많을수록 그 검색 속도의 차이는 커진다.

범위 검색을 위해서는 검색 엔진 또는 DBMS가이 범위에 대한 이형 범위 기호 처리를 지원하는가에 따라 생성되는 수정 검색식 구성 요소가 약간 상이하게 된다. 이형 범위 기호 처리란 ^A보다 크거나 같고, B 보다 작은 것^과 같이 범위의 양쪽에 쓰이는 기호가 다른 경우를 처리하는 것을 말한다. 이형 범위 기호 처리를 지원하는 경우에는, 입수된 특허 분류 기호에 대하여, ^(상기 입수된 특허 분류 기호보 다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)^라는 수정된 검색식 구성 요소를 생성한다. 이형 범위 기호 처리를 지원하지 않는 경우에는 ^{(상기 입수된 분류 기호) or (상기 입수된 특허 분류 기호보다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)}을 생성하게 된다. 물론, 사전식으로 배열되는 변형 특허 분류 기호를 사용하는 경우에는 그 변형 특허 분류 기호에 대해서 위와 같이 처리함은 물론이라 하겠다.

상기 입수되는 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15}라면, 이형 범위 기호 처리가 되는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC >= H04B 7/15 and IPC <H04B 7/22}^이 된다. 반면, 이형 범위 기호 처리가 되지 않는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 or (IPC > H04B 7/15 and IPC <H04B 7/22)}가 되게 된다.

이상과 같은 본 발명의 특허 분류 기호 전처리 엔진의 핵심은 주어진 특허 분류 기호가 있을 때, 그 특허 분류 기호의 모든 하위 계층(child) 또는 직하위 계층에 있는 하위 특허 분류도 자동으로 처리하여 검색, 분석, 감시 등의 모든 검색식 및 질의식에 반영될 수 있게 하는 기능에 있다.

수정된 검색식으로 검색 결과가 나오는 경우, 검색 결과의 디스플레이는 검색자의 선택에 따라 클러스터링(clustering)하여 제공될 수도 있다. 클러스터링이란, 검색 결과를 묶어서 그룹단위로 표현하는 방식으로, 본 발명에 적용하는 경우 다음과 같다. 클러스트링 되는 구조를 표현하는 클러스터링 창이 있거나, 클러스터링 레벨을 선택할 수 있을 때, 검색 결과를 기설정되거나 기선택된 클러스터링 레벨에 상응하는 도트 서브그룹 및 그 이하의 서브그룹의 검색 결과만 표현하며, 검색자로부터 하위 또는 상위 클러스터링 레벨이 선택되는 경우(상기 클러스터링 레벨에는 도트 레벨이 대응되어 있다) 상기 선택된 클러스터링 레벨에 상응하는 검색 결과를 표현한다.

상기의 H04B 7/00이 관련된 검색 결과를 통해 예를 들면, 1-도트 서브그룹 레벨의 클러스터링이 선택된 경우에는 상기 클러스터링 창에는 1-도트 서브그룹에 해당하는 7/005, H04B 7/01, H04B 7/015, H04B 7/02, H04B 7/14, H04B 7/22, H04B 7/24이 H04B 7/00의 하위 디렉토리 폴더 형태로 나타나고, 검색 결과는 H04B 7/00에 해당하는 모든 결과가 나온다. 이때, 검색자가 H04B 7/14를 선택했을 때는 그 직하위인 H04B 7/145, H04B 7/15가 하위 디렉토리 폴더 형태로 나타나고, 이 경우 검색 결과는 H04B 7/14 및 그 하부 특허 분류 기호에 해당하는 검색 결과만 표시된다. 다시 검색자가 H04B 7/15를 선택했을 경우에는 그 하위인 H04B 7/155, H04B 7/185, H04B 7/204가 표시되며, 검색 결과는 H04B 7/15 및 그 하위 특허 분류 기호에 해당하는 검색 결과만이 표시된다.

이때, 검색자의 편의를 위해서 클러스터링 창의 각 클러스트링 항목(디렉토리의 폴더명) 옆에 자신의 직하위에 몇 개의 특허 분류 기호가 있는 지와, 모든 하부 특허 분류 기호의 개수가 몇 개 있는지를 함께 또는 어느 하나만을 표시해 줄 수 있다. 그 특허 분류 기호 및 그 특허 분류 기호의 모든 하위 특허 분류 기호에 해당하는 특허 문헌의 개수를 표시해 줄 수도 있다. 이때, 출원 문헌수와 등록 문헌 수 2개 모두를 표시해 줄 수도 있으며, 출원 문헌수나 등록 문헌 수 1개만 표시해 줄 수도 있다. 예를 들면, 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이므로 ^3^을 표시해 주거나, 모든 하위의 특허 분류 기호가 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216이므로, ^10^을 표시해 줄 수 있다. 양자를 모두 표시하는 주는 것이 바람직한데, 그 이유는 직하위에는 분류가 적지만, 그 직하위의 하부에 엄청난 크기의 분류가 있을 수 있기 때문이다. 이는 특히 새롭게 떠오르는 신기술 분야 또는 기술 분화 속도 또는 세부 분류 증가 속도가 큰 첨단 기술 분야에서 더욱 그러할 것이다. 만약 직하위 분류의 개수만 표시해 주는 경우, 그 수치값이 적을 때 그 기술 분야의 중요성이 실제함에도 불구하고, 이를 파악할 수 없어 그 분류를 무시하고 넘어가는 사용자가 있을 수 있기 때문이다.

패밀리 정보 전처리 모듈

특허 패밀리란 특정 특허 문건과 국내, 또는 해외적으로 직접적으로 관련 있는 문건으로 구성된 문건 정보의 집합을 말한다. 통상적으로 하나의 국가 내에서, 1) 분할출원, 2) 변경 출원이나 이중출원, 3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국내 특허 패밀리를 이룬다. 통상적으로 하나의 출원을 기초로 한 1) 국제출원(PCT), 2) 조약 우선권 출원, 3) 상기 1) 또는 2)가 특정 국가의 특허청에 출원되었을 때의 각 국가별 출원 및 상기 3)의 출원에 관한 (1) 분할출원, (2) 변경 출원이나 이중출원, (3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국제 특허 패밀리를 이룬다. 본 발명의 특허 패밀리 정보를 전처리 하는 패밀리 정보 전처리 모듈에 대한 구성은 도 9에 잘 나타나 있다. 패밀리 정보를 처리하기 위해서는 그 정보를 처리하는 패밀리 정보 전처리 엔진(3810)이 필요하며, 패밀리 정보를 입수하기 위한 각종 DB가 필요하다. 필요한 DB의 예로는 조약 우선권 정보 DB(3671), PAJ DB(3673), KPA DB(3675), Inpadoc DB(3677), 기타 패밀리정보 DB(3830) 등이 있을 수 있다. 특히 Inpadoc DB(3677)가 중요한 역할을 한다.

상기 패밀리 정보 전처리 모듈은 특허 문건 마스트 DB의 가공과 업데이트와 밀접하게 관련이 있다. 그 이유는 특허 정보는 1) 신규한 문건이 지속적으로 발행되고, 2) 국가 단위로 입수되는 것이 대부분이며, 상기 각 국가별로 신규한 문건이 지속적을 발행되므로, 상기 패밀리 정보는 상기 1) 및/또는 2)에 따라 언제든지 변경될 가능성이 있기 때문이다. 즉, 상기 1) 또는 2)의 문건 입수 시 상기 패밀리 정보는 갱신되어야 할 필요가 있으며, 상기 1) 또는 2)의 문건 입수 시 패밀리 정보의 갱신은 본 발명의 패밀리 정보 전처리 모듈이 수행한다. 상기 패밀리 정보는 기존 문건 또는 신규 문건을 대상으로 원출원 정보 내지 우선권 정보에 특정 출원 번호가 존재하는 지를 통해서 발견할 수 있다.

상기 패밀리 정보 전처리 모듈의 상기 패밀리 정보 전처리 엔진이 패밀리 정 보를 처리하는 방법은 도 87에 나와 있다. 상기 패밀리 정보 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하고(S3720), 상기 특허 문건 정보에 우선권 주장 번호, 분할 출원, 변경 출원 또는 일부 계속 출원 등의 패밀리 정보가 있는 지를 파악하며(S3730), 패밀리 정보가 있는 경우, 상기 특허 문건의 정보를 패밀리 정보에 대응되는 패밀리 특허 문건의 고유 문건 번호와 관련 지어 특허 DB 또는 검색 인덱스에 저장하며(S3740), 선택적으로 입수된 특허 문건에 국가별 패밀리 정보의 개수를 카운팅하여 저장하거나 패밀리 특허 문건의 고유 문건 번호에 패밀리 정보의 개수에 관한 정보가 있을 때 그 개수에 가산한다(S3750).

상기 패밀리 정보 전처리 모듈이 처리한 패밀리 정보는 본 발명의 패밀리 정보 DB에 저장된다.

인용 정보 전처리 모듈

본 발명의 인용 정보 전처리 모듈에는 인용과 관련된 정보를 획득하는 인용 정보 획득 모듈(3400-1)과 인용 정보 기반하여 피인용 정보를 갱신하는 피인용 정보 갱신 모듈(3400-2) 중 어느 하나 이상을 포함하고 있다. 상기 인용 정보 획득 모듈은 출원인의 특허 문건에서 출원인이 인용한 정보에서 인용 관련 정보를 획득하는 출원인 인용 정보 획득 모듈(3400-1-1)과 심사관이 심사 과정에서 인용한 정보를 획득하는 심사 인용 정보 획득 모듈(3400-1-2)이 있다. 한편, 상기 출원인 인용 정보 획득 모듈(3400-1-1)에는 다시, 출원인 인용 특허 문건 정보 획득 모듈(3400-1-1-1)과 출원인 인용 비특허 문건 정보 획득 모듈(3400-1-1-2)이 있다. 상기 출원인 인용 특허 문건 정보 획득 모듈(3400-1-1)은 인용 정보가 특허 정보일 경우에 작동한다. 그리고, 심사 인용 정보 획득 모듈(3400-1-2)에는 심사관 인용 특허 문건 정보 획득 모듈(3400-1-1-1)과 심사관 인용 비특허 문건 정보 획득 모듈(3400-1-2)이 있다. 상기 인용 정보 전처리 모듈은 상기 인용 정보 획득 모듈이 획득한 인용 정보를 기설정된 방식으로 처리한다.

특허 인용 정보의 종류에는 1) 출원인이 선행 기술로서 타 특허를 인용하는 선행 기술 인용 정보와 2) 심사관이 특정 특허 문건을 심사할 때 인용하는 인용 참증으로서의 특허를 인용하는 참증 인용 정보 및 3) 간접 인용 정보가 있을 수 있다. 물론, 상기 인용은 국내외적으로 일어남은 당연할 것이다. 통상적으로 상기 첫번째 선행 기술로 타특허를 인용하는 것은 대한민국이나 일본에서는 종래 기술 문헌 정보에 있고, 미국에서는 레퍼런스(reference) 정보에 있다. 이러한 선행 기술 인용 정보는 특허 문건의 서지 사항 또는 본문에서 획득 가능하다. 또한, 많은 국가들이 참증 인용 정보를 공개하는데, 이는 특허청에서 공개하는 행정 정보 등에서 확인할 수도 있다. 본 명세서에서는 상기 선행 기술 인용 정보를 중점적으로 설명하나, 획득된 참증 인용 정보도 선행 기술 인용 정보처럼 다루어 질 수 있는 경우에는 상기 설명이 동등하게 준용 될 수 있을 것이다. 상기 간접 인용은 간접 전방 인용과 간접 후방 인용이 있다. 하나 이상의 처리 대상 특허 문건 집합이 있을 때, 이들 특허 문건 집합의 간접 전방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 앞서면서, 상기 처리 대상 특허 문건이 인용하는 특허 문건을 동시에 인용하고 있는 특허 문건들로 구성되는 것이다. 이들 특허 문건 집합의 상기 간접 후방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 늦으면서, 상기 처리 대상 특허 문건을 인용하는 특허 문건이 동시에 인용하고 있는 특허 문건들로 구성되는 것인 것이다. 이들 간접 인용은 주로 특허 출원일과 특허 공개 기간의 차이에서 기인하는 경우가 많다.

상기 선행 기술 인용 정보 및 상기 참증 인용 정보를 전처리하는 것은 본 발명의 인용 정보 전처리 모듈이 수행하며, 도 5에서 알 수 있듯이 상기 인용 정보 전처리 모듈에는 선행 기술 인용 정보를 전처리하는 선행 기술 인용 정보 전처리 모듈과 참증 인용 정보를 전처리하는 참증 인용 정보 전처리 모듈이 포함되어 있다. 통상적으로 특정 문건의 서지 사항 또는 본문에 전방 인용(backward citation)은 포함되어 있기 때문에, 전방 인용에 관한 문건 정보는 상기 특정 문건의 검색 인덱스 또는 특정 문건 정보에 저장되어 있다. 하지만, 상기 특정 문건에 관한 후방 인용(forward citation)은 그 특정 문건 정보에 저장되지 않고, 상기 특정 문건을 인용하는 문건의 검색 인덱스 또는 상기 인용하는 문건 정보에 저장되어 있다. 그러므로, 상기 특정 문건에 관한 후방 인용을 찾아서 상기 특정 문건과 관련 지어 저장할 필요가 있게 되고, 이러한 기능은 상기 선행 기술 인용 정보 전처리 모듈이 수행한다.

선행 기술 인용 정보 전처리 모듈

상기 선행 기술 인용 정보 전처리 모듈은 상기 특정 문건의 출원 번호 내지 상기 특정 문건의 고유 번호값을 상기 검색 인덱스 또는 DBMS에 질의함으로써, 상 기 특정 문건을 인용하고 있는 상기 특정 문건의 후방 인용 정보를 획득할 수 있다. 상기 선행 기술 인용 정보 전처리 모듈은 상기 획득한 상기 특정 문건의 후방 인용 정보를 상기 특정 문건의 인덱싱 과정에서 상기 인덱스에 포함시켜 놓을 수도 있고, 상기 특허 문건 마스트 DB에 상기 특정 문건의 후방 인용 정보로서 저장할 수 있다. 전방 인용 정보는 거의 변화가 없는 반면(출원인이 출월할 때 기재하는 것이며, 간혹 추가 등이 있을 수 있으나 전방 인용의 추가는 거의 발생하지 않는 것이 통상이다.) 후방 인용 정보는 특허 정보의 갱신 시 항상 모니터링 해야 하는 정보이다. 그러므로, 신규한 특허 문건이 발생해서, 검색 인덱스가 갱신되거나, 특허 문건 마스트 DB가 갱신되는 경우, 상기 선행 기술 인용 정보 전처리 모듈은 상기 특정 문건을 인용하고 있는 갱신 특허 문건이 있는 지를 질의하여, 후방 인용 정보를 갱신해야 한다.

인용 번호를 대표화하는 인용 정보 전처리 방법에 대해서는 도 88에 상세히 나와 있다. 상기 인용 정보 전처리 모듈은 특정 문건에 존재하는 적어도 하나 이상의 인용 번호를 입수 받고(S3820), 상기 인용 번호의 속성이 기설정된 인용 번호 속성이 아닌 인용 번호를 입수하고(S3830), 상기 입수된 인용 번호를 검색 엔진 또는 DBMS에 질의하여 상기 기설정된 속성의 인용 번호를 입수 받고(S3840), 상기 입수된 기설정된 속성의 인용 번호로 상기 입수 받은 인용 번호를 대표화한다(S3850).

특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함시킬 필요가 있으며, 이러한 과정의 일 실시예적 방법을 도 89가 도시하고 있다.

상기 인용 정보 전처리 모듈은 특정 문건 데이터를 입수하고(S3920), 상기 특정 문건 데이터에 포함된 출원번호, 등록번호, 공개번호 중 적어도 어느 하나 이상을 입수하며 (S3940), 상기 입수한 번호를 검색 엔진의 인용 필드에 질의하거나, DBMS로 인용 필드를 한정하여 질의하고(S3950), 상기 질의 결과로서 후방 인용 정보를 입수 받으며(S3960), 상기 후방 인용 정보를 상기 문건 데이터의 서지 사항에 포함시킨다(S3970).

참증 인용 정보 전처리 모듈

참증 인용 정보 전처리 모듈은 상기 선행 기술 인용 정보 전처리 모듈이 선행 기술 인용 정보를 대상으로 수행하는 역할을 참증 인용 정보를 대상으로 완전히 동일하게 수행한다.

카운팅 전처리 모듈

카운팅 전처리 모듈에 대해서 설명한다. 상기 카운팅 전처리 모듈에는 개별 문건 단위에서 카운팅 처리를 수행하는 개별 문건 단위 카운팅 전처리 모듈과 2이상의 문건 단위에서 카운팅 처리를 수행하는 복수 문건 단위 카운팅 전처리 모듈이 있다.

개별 문건 단위 카운팅 전처리 모듈

상기 개별 문건 단위 카운팅 전처리 모듈은 개별 특허 문건에 나와 있는 1)출원인 수 및/또는 특허권자 수, 2) 발명자 수, 3) 출원 또는 등록 단계 등과 같은 각 단계별 청구항 수, 4) 명세서 페이지 수, 5) 도면 수, 6) 특허 분류 기호의 종류 수, 7) 각 종류의 특허 분류 기호의 수, 8) 레퍼런스(reference)수, 9) 심사 인용 수, 10) 심사관이 조사한 특허 분류 기호의 수, 11) 우선권 주장수, 12) 국가별 패밀리 특허 개수, 13) 전체 패밀리 개수, 14) 독립항 수, 15) 종속항 수, 16) 레퍼런스 중에서 국가 단위의 특허 수, 17) 레퍼런스 중에서 전체 특허 문건 수, 18) 레퍼런스 중에서 비특허 문건 수 중에서 적어도 어느 하나 이상의 수치적 정보를 계산할 수 있다.

또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건 또는 상기 개별 특허 문건을 발행하는 특허청 등의 행정 처리 정보 등으로부터 1) 출원일로부터 등록일까지의 기간, 2) 우선일부터 출원일까지의 기간, 3) 출원일부터 심사청구일까지의 기간, 4) 의견제출통지일부터 의견서 제출일까지의 기간 정보 중 적어도 어느 하나 이상을 계산할 수 있다.

또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건 또는 행정 정보에서 개별 국가별로의 특정한 제도의 활용 또는 적용 여부에 관한 정보를 입수할 수 있는데, 그 정보로서는 1) 심사청구 제도의 활용 여부, 2) 분할 출원의 활용 여부, 3) 일부 계속 출원의 활용 여부, 4) 재발행 특허 제도의 활용 여부, 5) 우선심사 신청 여부, 5) 결정계 심판 활용 여부, 6) 비당사자계 소송 발생 여부 중 어느 하나 이상을 알아 낼 수 있으며, 상기 제도의 활용 또는 적용이 있는 경우에는 카운팅 값을 1로 하고, 그렇지 않을 경우에는 0으로 할 수 있을 것이다.

또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건과 관 련해서 상기 특허 문건 마스트 DB를 조사함으로써(검색 엔진 또는 DBMS를 사용하여) 적어도 하나 이상의 제2국에서의 상기 개별 특허 문건과 관련된 정보를 입수하고 카운팅할 수 있다. 상기와 같은 정보로는 1) 출원 국가수, 2) 등록 국가수, 3) 국제출원 여부, 4) 각 국가별 패밀리 수, 5) 전체 패밀리수 중 적어도 어느 하나 이상에 관한 정보를 알아 내어 카운팅할 수 있다.

또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 검색 엔진 또는 상기 DBMS를 통하여 1) forward citation(나를 인용하고 있는 국내외 다른 특허 문건들), 2) backward citation(내가 인용하는 이전 문건들), 3) 간접 인용 중 어느 하나 이상을 알아내어 카운팅할 수 있다.

또한 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 문건에 대한 1) 이의신청 여부, 2) 정보제공 여부, 3) 당사자계 심판 발생 여부 등에 대한 정보를 입수할 수 있다. 상기 1) 내지 3)에 관한 정보는 대한민국의 경우 대한민국 특허청 또는 특허심판원으로부터 직접 또는 조회 방식 등으로 입수할 수 있다.

상기 개별 문건 단위 카운팅 전처리 모듈이 카운팅한 값은 상기 특허 정보 마스트 DB 중 가공 서지 사항 DB에 저장되는 것이 바람직하다. 아울러, 상기 카운팅한 값은 특허 문건을 검색 엔진이 인덱싱할 때 생성되는 인덱스에 포함시키는 방식으로 저장되는 것이 더욱 바람직하다. 상기 카운팅 값이 상기 인덱스에 포함시키는 방법은 1) 상기 검색 엔진이 인덱싱을 할 때, 상기 개별 문건 단위 카운팅 전처리 모듈을 가동하여 카운팅 값을 획득하거나, 2) 상기 특허 정보 마스트 DB에 저장 된 카운팅 값을 입수하는 방식 중 어느 하나 이상이 사용될 수 있다.

상기 카운팅 전처리 모듈은 상기 특허 분류 기호 마스트 DB를 참조하여 각 특허 분류 기호에 대하여, 1) 총 하위 특허 분류 기호의 개수, 2) 직하위 특허 분류 기호의 개수 카운팅하여 그 카운팅 값을 상기 특허 분류 기호 마스트 DB에 저장해 놓을 수 있다.

카운팅 전처리 모듈이 카운팅을 처리하는 방식은 도 78에 잘 나타나 있다. 먼저 카운팅 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(S2820), 입수된 특허 문건 별로 적어도 하나 이상의 상기 개별 문건 단위 카운팅 전처리 모듈을 호출하며(S2830), 상기 개별 문건 단위 카운팅 전처리 모듈이 특허 문건 정보를 대상으로 카운팅 처리를 수행하며(S2840), 카운팅 처리 결과를 특허 문건 정보의 문건 고유 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2850)

복수 문건 단위 카운팅 전처리 모듈

이하, 상기 복수 문건 단위로 계산된 점수를 입수하는 모듈, 즉 복수 문건 단위 카운팅 전처리 모듈을 설명한다. 상기 복수 문건 단위 카운팅 전처리 모듈은 상기 대상 집합이 되는 복수 개의 문건에서 상기 개별 문건 단위 카운팅 전처리 모듈이 카운팅 해 놓은 정보를 취합하는 방식으로 점수를 입수한다. 즉, 상기 복수 문건 단위 카운팅 전처리 모듈은 적어도 2 이상의 문건 집합에 대하여 카운팅 데이 터를 생성한다.

가중치 전처리 모듈

문건 단위 가중치 전처리 모듈

하나의 특허 문건에 포함된 발명 사상의 가치를 시스템적으로 정확하게 측정한다는 것은 불가능하다. 하지만, 정확한 가치 측정이 불가능하다고 해서 모든 특허 문건의 가치를 동일하게 취급한다는 것도 비합리적일 수 있다. 그러므로, 본 발명에서는 시스템이 데이터로 파악할 수 있는 정보를 기반으로 하여 특허 문건의 가중치를 부여하는 방법을 개시한다. 상기 특허 문건의 가중치를 부여하는 기능은 본 발명의 문건 단위 가중치 전처리 모듈이 담당한다.

본 발명의 가중치 전처리 모듈은 문건 단위 가중치 전처리 모듈(3310)과 주체 단위 가중치 전처리 모듈(3330)이 있다. 상기 문건 단위 가중치 전처리 모듈(3310)에는 비용 지출 관점 가중치 전처리 모듈(3311), 인용 관점 가중치 전처리 모듈(3313), 분쟁 관점 가중치 전처리 모듈(3315), 및/또는 집중 관점 가중치 전처리 모듈(3317) 등을 포함하고 있을 수 있다. 그리고, 상기 주체 단위 가중치 전처리 모듈(3330)에는 출원인 단위 가중치 전처리 모듈(3331), 발명자 단위 가중치 전처리 모듈(3333), 및/또는 대리인 단위 가중치 전처리 모듈(3335) 등을 포함하고 있을 수 있다.

비용 지출 관점 가중치 전처리 모듈

확률적, 통계적 또는 사회적 관점에서, 더 많은 비용을 지불한 특허가 더 중요한 특허일 가능성이 높을 것이다. 동일 주체에서 비용의 합리적 배분의 관점에서 볼 때에도 이러한 가정이 성립할 가능성이 높으며, 경쟁 관계에 있는 다른 주체들 간에서도 이러한 가정이 성립할 가능성이 높다. 하나의 특허에 관하여 비용이 지불되는 구조를 보면 다음과 같은 가중치 부여 요소를 생각할 수 있다.

1) 양적인 관점으로 (1) 청구항의 수, 독립항의 수, 명세서의 양(페이지 수), 패밀리의 수 또는 특허 분류 기호의 개수 2) 상태적인 관점으로 출원 중인 특허, 등록된 특허, 거절된 특허 또는 포기된 특허인 경우, 3) 과정적인 관점으로 심사청구 여부, 우선심사 활용 여부, 심판 청구 여부, 국내 우선권 주장 여부 또는 분할 출원 여부, 4) 주체적 관점에서 출원인의 수 또는 발명자의 수, 5) 해외적 관점에서 국제 출원 활용 여부, 해외 국내 단계 진입된 나라 수 등과 같은 요소들이 특허 문건의 가치에 영향을 줄 수 있을 것이다. 이러한 가중치 부여 요소들은 개별 문건의 서지 사항 정보, 명세서 내용 정보 또는 행정 처리 정보 등에서 입수할 수 있다.

통상적으로 청구항의 수가 많거나 명세서의 양이 많으면 발명의 내용이 넓고 다양할 가능성이 있어 발명에 시간과 비용이 많이 들었을 가능성이 높으며, 대리인들도 더 많은 비용을 청구할 가능성이 높다. 또한, 패밀리 수가 많거나, 특허 분류 기호의 개수가 많을수록 발명의 포괄적일 가능성이 높을 것이다. 그리고, 출원 중인 특허보다는 등록된 특허가 더 비중이 높을 가능성이 높으며, 심사 청구를 한 특허 출원 또는 우선 심사 청구를 한 출원이 그렇지 않은 특허 출원보다 중요할 가능성이 더 높을 것이다. 출원인이 2이 이상일 경우에는 공동 출원이므로 2 이상의 다른 주체간의 협동 작업의 결과이므로, 그렇지 않은 경우보다 통계적으로 중요할 가 능성이 있으며, 발명자가 여러 명일 경우에도 여러 사람이 함께 머리를 맞대어 발명한 것이므로 통계적으로 중요할 가능성이 높을 것이다. 또한, 통상적으로 해외 출원은 국내 출원보다 비용 지출이 월등히 크기 때문에, 해외 출원이 있거나, 해외 출원이 많을 경우에는 그 출원인이 상당한 재정적 지출을 하게 되기 때문에, 적어도 그 출원인에게 그 특허는 상대적으로 중요성이 높다고 판단하는 것이 합리적이다.

상기와 같은 관점에서 하나의 문건에 대해서 가중치 부여 요소의 존재 및 수치를 파악(존부만이 문제시 될 경우에는 존재하지 않을 경우 수치는 0, 존재하면 1이 될 것이며, 청구항 개수와 같은 요소들은 1이상의 수치값으로 나올 것이다.)할 수 있을 것이며, 그 존재 및/또는 수치에 따라 상기 가중치 부여 요소별로 가중치 점수를 부여할 수 있을 것이다. 하나의 문건에 대해 상기 1) 내지 5)의 각 관점을 이루는 세부적인 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 비용 지출 관점 가중치 전처리 모듈이 수행한다.

상기 비용 지출 관점 가중치 전처리 모듈이 가중치를 처리하는 방법은 도 79에 잘 나타나 있다. 상기 비용 지출 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하고(S2920), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 비용 지출과 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S2930), 상기 특허 정보 처리 정책 DB에서 상기 특허 정보 상기 카운팅 기준별 가중치를 입수 한다(S2940). 이때, 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 DB에 저장된 특허 정보 처리 정책을 참조한다. 예를 들면, 상기 비용 지출 관점의 상기 특허 정보 처리 정책 DB의 청구항의 관점에서는 (청구항 수*0.1 + 독립항수*0.3) 등과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다. 그리고, 상기 비용 지출 관점 가중치 전처리 모듈은 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 비용 관점 가중치값을 생성하며(S2940), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2950).

인용 관점 가중치 전처리 모듈

논문과 마찬가지로 다수에게 많이 인용되는 특허가 중요한 특허일 가능성이 높다. 이러한 인용 관점에서 개별 문건의 가중치를 처리하는 모듈을 인용 관점 가중치 전처리 모듈이라 한다. 인용의 관점을 세부적으로 나누면 1) 후방 인용(forward citation)의 관점에서 전체 후방 인용의 수, 후방 인용의 깊이 수, 1단계 후방 인용의 수, 후방 인용의 평균 기간, 후방 인용의 시간 대비 집중도, 2) 심사관 인용의 관점에서 심사관의 인용 여부 등과 같은 가중치 부여 요소가 있을 수 있다. 즉, 자신의 특허에 대한 인용이 직접 또는 간접적(자신을 인용한 그 특허를 타 특허가 인용함)으로 많을수록, 직접적으로 인용하는 1단계 인용이 많을수록, 후방 인용의 평균 기간이 적절한 범위 내에 들수록, 자신의 특허를 인용하는 자가 시기적으로 최근 기단에 집중될수록, 그 특허의 중요성이 클 가능성이 높을 것이다. 또한, 심사관이 심사 과정에서 인용된 특허가 그렇지 않은 특허보다 중요성이 높을 수 있다. 상기 인용 관점 가중치 전처리 모듈이 인용 관점에서 가중치를 전처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈이 처리하는 방법과 대동소이하며, 도 80에 잘 나와 있다.

상기 인용 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하여(S3020), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 전방 인용 및/또는 후방 인용, 또는 심사 인용에 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S3030), 상기 특허 정보 처리 정책 DB를 참조하여 카운팅 기준별 가중치를 입수하고(S3040), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 인용 관점 가중치값을 생성하며(S3050), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3060) 이때, 인용에 관한 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 DB에 저장된 특허 정보 처리 정책을 참조한다. 예를 들면, 상기 인용 관점의 상기 특허 정보 처리 정책 DB에는 "후방 인용 카운팅 수*0.3"등과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다.

분쟁 관점 가중치 전처리 모듈

하나의 특허 문건과 관련해서 분쟁이 많을수록 그 특허의 중요성이 클 가능성이 높다. 특허 정보에서 파악할 수 있는 분쟁적 요소는 1) 무효 심판, 2) 이의신청, 3) 정보 제공, 4) 소극적 또는 적극적 권리범위 확인 심판 등이 있을 수 있다. 상기 분쟁적 관점에서의 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 분쟁 관점 가중치 전처리 모듈이 수행한다.

상기 분쟁 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 81에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다.

상기 분쟁 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하며(S3120), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 분쟁 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하고(S3130), 상기 특허 정보 처리 정책 DB를 참조하여 카운팅 기준별 가중치를 입수하며(S3140), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 분쟁 관점 가중치값을 생성하고(S3150), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3160).

즉, 상기 분쟁 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 분쟁의 수에 대한 카운팅을 수행하고, 각 카운팅 수에 대한 가중치를 특허 정보 처리 정책 DB로부터 입수하여 분쟁 관점 가중치값을 생성하는 것을 본질로 한다.

집중 관점 가중치 전처리 모듈

특정 시점을 기준으로 여러 주체가 집중하고 있는 기술 분야가 중요한 기술 분야일 가능성이 높을 것이다. 하나의 출원인이 여러 가지 기술 분야에 골고루 출원하는 경우는 거의 없으며, 자신이 중요하다고 생각하는 곳, 기술 투자가 집중되 는 곳에 다수를 출원하고, 중요도가 떨어진다고 생각되는 곳에서는 방어적으로 소수를 출원하는 것이 대부분이다. 그러므로, 하나의 출원이 속하는 기술 분야가 여러 출원인이 출원을 많이 하여 다른 기술 분야 대비 상대적으로 1) 출원수가 많거나, 출원의 증가율 또는 증가 속도 가 높거나, 3) 출원인의 수가 많거나, 4) 점유율의 변동이 기설정된 범위를 벗어나거나 하는 경우라면 그 기술 분야는 중요한 기술 분야일 가능성이 높을 것이다. 여러 출원인이 집중하는 분야는 상기 기술 매력도(technology attractiveness), 증가율, 증가 속도, 점유율의 변동 등과 같은 분석 요소로 측정 가능할 것이다. 이때 본 문단에서의 기술 분야는 IPC, USPC, FI, FT, ECLA 등과 같은 특허 문건에 포함되어 있는 계층화된 특허 분류 기호를 각 계층 단위에서 파악한 것이 바람직할 것이다. 물론, 하위 특허 분류 기호를 자동으로 포함하여 각 분석 요소별 수치값을 계산하는 것이 더욱 바람직할 것이다. 즉, IPC로 H04B 7/26가 있을 때, 이 IPC에 대한 각종 분석 요소별 수치값을 계산할 수도 있으며, H04B 7/00의 관점에서 각종 분석 요소별 수치값을 계산할 수도 있을 것이다. 이때, 상기 H04B 7/26의 계층적으로 하위 특허 분류 기호에 속하는 다른 특허 분류 기호들도 포함되어 계산되는 것이 더욱 바람직할 것이다. 집중의 관점에서 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 집중 관점 가중치 전처리 모듈이 수행한다.

상기 집중 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다. 즉, 각 개별 문건에 대한 서지 정보로 출원인/특허 권자의 그 기술분야에 대한 집중도/활동도/점유율 등과 같은 집중의 의미를 포함하는 특허 정보 분석 지표의 값을 측정하고, 각 값에 가중치를 특허 정보 처리 정책 DB로부터 입수하여 집중 관점 가중치값을 생성한다.

상기 집중 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 82에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다.

상기 집중 관점 가중치 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(S3220), 특허 문건 DB에서 출원인 정보, 특허 기술 분류 정보를 입수하며(S3230), 입수된 출원인 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 출원인의 집중도/활동도/점유율 중 적어도 하나 이상의 기준으로 그 값을 계산하며(S3240), 각 기준별 집중도/활동도/점유율에 대한 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3250), 상기 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하며(S3260), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3270).

상기 집중 관점 가중치 전처리 모듈은 출원인이 아닌 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식은 도 83에 나와 있다. 상기 집중 관점 가중치 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(3320), 특허 문건 정보에서 발명자 정보, 특허 기술 분류 정보를 입수하 며(S3330), 입수된 발명자 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 발명자의 집중도를 적어도 하나 이상의 기준으로 계산하고(S3340), 각 기준별 집중도에 대한 가중치 정보를 입수하며(S3350), 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하고(S3360), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3370).

주체 단위 가중치 전처리 모듈

하나의 특허 문건이 있을 때, 그 특허 문건에 개입되는 주체가 중요한 주체일 경우, 그 주체가 출원한 특허가 중요한 특허일 가능성이 높다. 이때 어떤 주체가 더 중요한 주체일 수 있을 가를 판단하는 것이 관건이다. 하나의 특허 문건 포함되는 주체는 출원인, 발명자 및 대리인이 있을 수 있다. 하나의 특허 문건에 대하여 상기 주체 관점에서 그 문건의 가중치를 전처리하는 기능을 수행하는 것을 주체 단위 가중치 전처리 모듈이라 한다. 도 4에서 알 수 있듯이 상기 주체 단위 가중치 전처리 모듈은 주체의 종류에 따라 출원인 단위 가중치 전처리 모듈, 발명자 단위 가중치 전처리 모듈, 대리인 단위 가중치 전처리 모듈이 있다.

출원인 단위 가중치 전처리 모듈

특정 문건에 포함되어 있는 기술 분야가 상기 문건의 출원인이 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 출원인이 집중하는 분야는 그 기술 분야로의 집중율, 점유율, AI 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 출원인 단위 가중치 전처리 모듈이 수행한다.

상기 출원인 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 84에 나와 있다. 상기 출원인 단위 가중치 전처리 모듈이 출원인 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3420), 기준에 부합하는 출원인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3430), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하고(S3440), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 출원인 단위 가중치값을 생성하며(S3450), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3460).

발명자 단위 가중치 전처리 모듈

특정 문건에 포함되어 있는 기술 분야가 상기 문건의 발명자가 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 발명자가 집중하는 분야는 그 기술 분야로의 그 발명자 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 발명자로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발 명의 발명자 단위 가중치 전처리 모듈이 수행한다.

상기 발명자 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 85에 나와 있다. 상기 발명자 단위 가중치 전처리 모듈이 발명자 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3520), 기준에 부합하는 발명자 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3530), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3540), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 발명자 단위 가중치값을 생성하며(S3550), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3560). 상기 가중치 정보에는 "과거 전체 출원대비 등록율*0.1+해외 출원 패밀리 수*0.5"과 같은 정책이 포함되어 있을 수 있다.

대리인 단위 가중치 전처리 모듈

특정 문건에 포함되어 있는 기술 분야가 상기 문건의 대리인이 집중하는 기술 분야인 경우라면 그 특허 명세서의 완성도는 그렇지 않은 대리인이 작성하는 경우보다 높을 것이다. 그러므로, 특정 문건의 대리인이 집중하는 분야는 그 기술 분야로의 그 대리인 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 대리인으로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 대리인 단위 가중치 전처리 모듈이 수행한다. 상기 대리인 단위의 가중치는 출원인 단위의 가중치나 상기 발명자 단위 가중치보다 중요도가 낮을 것이다.

상기 대리인 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 86에 나와 있다. 상기 대리인 단위 가중치 전처리 모듈이 대리인 단위로 가중치를 처리하기 위한 기준 정보를 입수하며(S3620), 기준에 부합하는 대리인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3630), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3640), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 대리인 단위 가중치값을 생성하며(S3650), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3660). 상기 가중치 정보에는 "출원대비 등록율*0.3"과 같은 정책이 포함되어 있을 수 있다.

본 발명의 문건 단위 가중치 전처리 모듈 및 주체 단위 가중치 전처리 모듈은 상기와 같은 적어도 하나 이상의 각 가중치 전처리 모듈이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 문건 단위의 가중치를 계산해 낸다. 이때, 각 관점의 가중치 부여 모듈 각각 또는 각 주체별 가중치 부여 모듈 각각은 자신이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 자신의 관점에서의 문건 단위의 가중치를 계산해 낼 수 있다. 상기의 각 가중치들은 관리자 또 는 사용자의 입력에 따라 다르게 부여될 수 있음은 물론이다 하겠다.

주체 마스트 DB 생성 모듈(301-4)

주체의 종류

특허 문건에 대하여 주체는 크게 1) 출원인, 2) 발명자, 3) 대리인이 있을 수 있다. 출원인에는 기업 등과 같은 조직과 개인이 있을 수 있다. 본 발명에서 상기 주체를 저장하고 관리하는 DB를 주체 마스트 DB(204)라고 하며, 상기와 같은 주체 마스트 DB(204)를 생성하는 모듈을 주체 마스트 DB 생성 모듈(301-4)이라 한다.

상기 주체 마스트 DB(204)에는 대표명화 된 출원인 명칭 DB, 대표명화 된 발명자 명칭 DB, 대표명화 된 대리인 명칭 DB를 더 포함할 수 있으며, 이와는 독립적으로 기업 정보 DB를 더 포함하고 있을 수 있다. 이들에 대해서 각각 설명한다.

주체 마스트 DB 생성 모듈(301-4)의 구성

본 발명의 주체 마스트 DB 생성 모듈(301-4)에는 대표명화 전처리 모듈(301-4-1) 포함되어 있다. 상기 대표명화 전처리 모듈은 출원인 대표명화를 처리하는 출원인 대표명화 전처리 모듈(301-4-1-1), 발명자를 대표명화 처리하는 발명자 대표명화 전처리 모듈(301-4-1-2), 대리인을 대표명화 처리하는 대리인 대표명화 전처리 모듈(301-4-1-3)중 어느 하나 이상을 포함하고 있다. 한편, 본 발명의 주체 마스트 DB 생성 모듈(301-4)에는 기업 정보 DB 생성 모듈이 더 포함되어 있을 수 있다. 기업 정보 DB에는 기업의 재무 정보, 회사 현황 정보, 회계 정보, 주생산품, 대표자, 법인등록번호, 사업자 번호, 웹사이트, 전화번호, 팩스 번호 중 어느 하나 이상이 더 포함되어 있을 수 있다. 상기 주체 마스트 DB(204)에는 세부적으로 기업 정보 DB(204-1), 대표명화된 출원인 명칭 DB(204-2), 대표명화된 발명자 명칭 DB(204-3), 대표명화된 대리인 명칭 DB(204-4), 및/또는 조직 정보 DB(204-5)을 더 포함하고 있을 수 있다.

대표 어구 추출 전처리 모듈

대표 어구의 개념

이어서, 본 발명의 대표 어구 추출 모듈에 대해서 설명한다. 먼저 대표 어구의 개념에 대해서 설명한다. 대표 어구(Representing Phrase)란 상기 대표 어구를 통해서, 특정한 문건 전체 또는 상기 특정한 문건의 일부분을 대표할 수 있는 단어 또는 2 이상의 단어로 구성되는 어구를 말한다. 본 발명의 대표 어구가 가지는 기본적인 속성은 주어지는 기설정된 대표 어구 추출 전체 문건 집합에서는 상당히 희박하게 나오면서, 주어지는 기설정된 대표 어구 추출 목표 문건 집합(1개의 대표 어구 추출 목적 문건을 포함한다) 또는 대표 어구 추출 목적 문건의 일부분 또는 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분에서는 기설정된 기준 이상으로 빈번하게 나오는 것이다.

상기 기설정된 대표 어구 추출 전체 문건 집합의 종류에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합 등이 그 예가 될 것이다.

한편, 상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합의 임의의 부분 집합(문건 1개에서부터 적어도 하나 이상의 특정한 속성(예를 들면 IPC 등의 특정한 특허 분류 기호, 출원인, 기간, 국가, 대리인 또는 발명자 또는 이들의 하나 이상의 조합 등)이 공통되는 문건들로 이루어진 부분 집합)이 될 수 있다.

다.

상기 대표 어구 추출 목표 문건 집합(타겟 집합을 포함하는 super set)은 상기 대표 어구 추출 전체 문건 집합(타겟 집합)과 상대적인 개념으로, 상기 대표 어구 추출 전체 문건 집합의 부분 집합이면 충분하나, 가급적 그 부분 집합의 크기는 작을수록 좋다. 상기 대표 어구 추출 목표 문건 집합의 예로는 1) 특정 출원 1개, 특정 기업의 모든 출원, 특정 발명자의 출원, 특정 발명자의 특정 IPC의 출원, 특정 기업의 특정 IPC의 모든 출원, 특정 IPC의 특정 연도의 모든 출원 등이 그 예가 될 것이다.

한편, 대표 어구 추출 목적 문건의 일부분의 예로는 특허 청구 범위, 특허 청구 범위 중의 독립항, 특허 청구 범위 중의 종속항, 발명의 효과나 산업상 이용 가능성, 요약 등이 그 예가 될 것이다. 한편, 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분은 상기 대표 어구 추출 목표 문건 집합을 구성하는 모든 문건의 전술한 특허 청구 범위 등이 될 것이다.

상기 대표 어구는 1) 명사만으로 구성되는 어구, 2) 명사와 동사만으로 구성되는 어구, 3) 형용사나 부사까지 포함되어 형성되는 어구가 있을 수 있다. 상기 대표 어구의 길이는 단어수를 기준으로 할 때 1~5개가 바람직하며, 2~3개가 더욱 바람직하다. 통상적으로 기술적 개념이 1개의 단어로 생성되기도 하지만, 많은 경우 2~3개의 단어로 기술적 개념 또는 기술적 작용 또는 효과를 구성하는 것이 많기 때문이다.

그리고, 상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합과 상대적인 개념으로, 상기 대표 어구 추출 전체 문건 집합의 부분 집합이면 충분하나, 가급적 그 부분 집합의 크기는 작을수록 좋다. 상기 대표 어구 추출 목표 문건 집합의 예로는 1) 특정 출원 1개, 특정 기업의 모든 출원, 특정 발명자의 출원, 특정 발명자의 특정 IPC의 출원, 특정 기업의 특정 IPC의 모든 출원, 특정 IPC의 특정 연도의 모든 출원 등이 그 예가 될 것이다.

이어, 상기 대표 어구 추출 과정을 상세히 설명한다. 상기 대표 어구 추출은 본 발명의 대표 어구 추출 전처리 모듈이 수행한다. 상기 본 발명의 대표 어구 추출 전처리 모듈에는 1) 각 언어별 형태소 분석 엔진(analyzer), 2) 어구 생성 엔진, 3) 어구별 카운팅 엔진, 4) 시소러스 사전/특허 기술 용어 사전 등을 비롯한 각종 사전 데이터베이스, 5) 대표 어구 추출 엔진을 포함한다. 상기 대표 어구 추출 전처리 모듈의 구성은 도 8에 잘 나타나 있다. 대표 어구를 추출해 내는 알고리즘을 포함하고 있는 대표 어구 추출 전처리 엔진(3710), 대표 어구를 추출하는 기준이 되는 정책에 관한 정보를 포함하고 있는 대표 어구 추출 정책 DB(3730), 대표 어구가 추출되었을 때 각 대표어구에 대한 빈도값 등의 각종 카운팅 또는 계산 정보 및 대표 어구가 어느 문건의 어느 위치(필드 등)에서 나왔는지에 관한 정보를 포함하고 있는 대표어구-빈도-출원번호 대응 DB(3750)가 포함되어 있다. 한편, 동의어나 유의어의 처리를 위한 시소러스 DB(3770) 및 2종 이상의 언어의 처리를 위한 번역 시스템을 활용하거나, 기번역된 사전을 이용하여 대표 어구에 대한 번역 정보를 포함하고 있는 대표 어구 번역 DB(3790)가 더 포함되어 있을 수 있다. 이하, 본 발명의 대표 어구 추출 전처리 엔진에 대해 더욱 상세하게 설명한다. 상기 대표 어구 추출 전처리 엔진은 문장이나 특정 필드의 문단 등이 입력되었을 때, 용어(terminology)를 추출(extraction)하는 기능을 수행한다.

상기 본 발명의 어구 생성 엔진은 어구 단위로 1~5개(바람직하게는 2~3개)의 어구 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 어구들을 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 abc, bcd, cde, def, efg 라는 어구별 어구를 생성한다. 상기 어구 생성 엔진은 주어지는 문건 또는 문건 부분에 대하여 문장 단위로 어구를 생성한다. 문건 부분에 대하여 어구를 생성하는 것의 일례로는 특허 청구 범위에 나오는 문장들을 대상으로 하여 상기 어구를 생성할 수 있을 것이다. 상기 배열의 생성 방법은 1) 하나의 문장 단위로 처리하되, 하나의 문장에서 추출된 어구가 n개 있을 때, 상기 n개의 어구에 대한 nC2, nC3, nC4, nC5로 하여 어구를 생성하는 방법(예를 들면, nC2가 적용될 때, 상기 어두들은 ab, ac, ad, ae, af, ag, bc, ...fg가 생성된다.), 2) 문건 단위에서 m개의 어구가 있을 경우, 문건 단위에서 상기 1)의 방법을 적용하는 방법, 3) 순차적으로 2~5개의 어구로 배열하는 방법(예를 들면, 2개의 어구가 순차적으로 배열된다고 할 때는 ab, bc, cd, de, ef, fg가 되며, 3개의 어구가 배열된다고 할 때는 abc, bcd, cde, def, efg가 된다. 물론, 2개 및 3개의 어구의 배열 모두를 사용할 수도 있을 것이다.)

한편, 상기 형태소 분석기를 통과한 상기 어구는 텀(term)이라고도 명명하기도 한다. 상기 텀은 형태소 분석기에서의 세팅값에 따라서 달라질 수 있다. 이때, 상기 세팅값의 예로는 1) 체언만 분리함, 2) 용언만 분리하되, 대표형만 추출함, 3) 형용사나 부사의 경우 대표형만 추출함 등이 그러한 예가 될 수 있다.

이어, 상기 어구별 카운팅 엔진은 상기 생성된 각 어구별로, (어구, 문건번호) 또는 (어구, 카운팅값) 정보를 필수적으로 생성하며, 바람직하게는 (어구, 카운팅값, 문건 번호) 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명(예를 들면 특허 청구 범위)) 정보를 생성하며, 더욱 바람직하게는 (어구, 카운팅값, 문건 번호, 문건 상의 위치필드명(예를 들면 특허 청구 범위)) 정보를 생성한다. 상기 어구별 카운팅 엔진은 대표 어구 DB(207-2)에 상기 생성한 정보를 저장한다. 하기 표 5은 상기 대표 어구 DB(207-2)에 포함되는 데이터의 일예를 나타낸다. 하기 표 5에 나타난 예는 국가별로 특정 어구에 대해서 생성되는 데이터의 일예를 보여주고 있다.

[표 5]

어구 ID	어구	어구 단어수	문서내 누적 카운팅값(문건 번호 기준)	국가 코드	문건 번호	어구 위치	...	"어구 절대 ID"
1	abc	3	1	KR	10-2003-0012345	특허청구범위		1
1	abc	3	2	KR	10-2003-0012345	특허청구범위		2
1	abc	3	3	KR	10-2003-0012345	발명의 상세한 설명		3
1	abc	3	4	KR	10-2003-0012345	발명의 상세한 설명		4
1	abc	3	5	KR	10-2003-0012345	발명의 상세한 설명		5
1	abc	3	6	KR	10-2003-0012345	발명의 상세한 설명		6
1	abc	3	7	KR	10-2003-0012345	발명의 상세한 설명		7
2	bcd	3	1	KR	10-2003-0012345	특허청구범위		8
2	bcd	3	2	KR	10-2003-0012345	특허청구범위		9
2	bcd	3	3	KR	10-2003-0012345	특허청구범위		10
2	bcd	3	4	KR	10-2003-0012345	발명의 상세한 설명		11
2	bcd	3	5	KR	10-2003-0012345	발명의 상세한 설명		12
2	bcd	3	6	KR	10-2003-0012345	발명의 상세한 설명		13
2	bcd	3	7	KR	10-2003-0012345	발명의 상세한 설명		14
...	...	...	...	...	...	...	...
1	abc	3	1	KR	10-2003-0056789	특허청구범위		150
1	abc	3	2	KR	10-2003-0056789	발명의 상세한 설명		151
1	abc	3	3	KR	10-2003-0056789	발명의 상세한 설명		152
...	...	...	...	...	...	...	...

상기 표 5에 나와 있는 데이터는 특허 문건 10-2003-0012345 및 10-2003-0056789으로 생성된 것임을 알 수 있으며, 어구 생성 엔진은 3개의 단위로 어구를 생성했음을 알 수 있다. 그리고, 상기 10-2003-0012345에서 상기 어구 abc는 특허 청구 범위에서 2회, 발명의 상세한 설명에서 5회가 나왔음을 알 수 있다. 또한, 어구 bcd는 특허 청구 범위에서 3회, 발명의 상세한 설명에서 4회가 나왔음을 알 수 있다. 또한, 어구 abc는 특허 문건 10-2003-0056789에서 특허청구범위에 1회, 발명의 상세한 설명에서 2회가 나왔음을 알 수 있다. 그러므로, 본 발명의 어구별 카운팅 엔진은 반복적으로 또는 재귀적으로 입수되는 모든 특허 문건에 대하여 상기 표 5과 같은 데이터를 생성할 수 있다. 아울러, 상기 어구 생성 엔진은 2개의 단위로 어구를 생성할 수 있을 것이며, 상기 2개의 단위로 생성되는 어구에 대하여, 본 발명의 어구별 카운팅 엔진은 상기 표11과 같은 데이터를 생성할 수 있음은 자명하다 할 것이다. 나아가 1개 또는 4~5개의 단위로도 상기 어구별 카운팅 엔진은 상기 표 5과 같은 데이터를 생성할 수 있을 것이다.

이때, 상기 어구별 ID를 생성하는 것이 문제시 될 수 있는데, 상기 어구별 ID를 생성하는 방법은 통상적인 DB 기술에서 자명한 것이나, 몇 가지 예시적인 방법을 제시한다. 첫째 방법은, 최초로 생성되는 어구에 대하여 순차적으로 ID를 부여하고, 다음으로 생성되는 어구에 대하여 기존에 있던 어구를 검색하여 없으면 새로운 ID를 부여하고, 있다면 기존의 ID를 부여한다. 이러한 과정을 모든 입수되는 어구마다 반복 또는 재귀적으로 수행한다. 둘째 방법은 어구에 대한 ID 부여 없이 입수되는 모든 어구에 대하여 순차적으로 임시 ID를 부여하여 상기 표11과 같은 데이터를 생성한 다음, 각 어구마다 하나씩 읽으면서 동일 어구에 대해서 동일한 정식 ID를 부여하며, 이러한 과정을 모든 정식 ID가 부여되지 않은 어구들을 대상으로 반복적으로 또는 재귀적으로 수행한다.

그리고, 본 발명의 상기 어구별 카운팅 엔진은 매 어구가 생성되어 처리될 때마다 어구 절대 ID를 생성하여 모든 어구마다 부여할 수 있다.

또한, 본 발명의 어구별 카운팅 엔진은 목표 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있다. 상기 목표 문건 집합에는 상기 표와 같이 하나의 문건을 기준으로 누적 카운팅 값을 계산할 수도 있으며, 하나의 문건 내의 특정한 필드(예를 들면 특허 청구 범위)로도 누적 카운팅이 가능함은 자명할 것이다.

또한, 본 발명의 어구별 카운팅 엔진은 전체 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있으며 상기 표 6와 같은 방식으로 저장할 수도 있을 것이다.(상기 예에서 전체 문건 집합을 특허 문건 10-2003-0012345 및 10-2003-0056789로 가정하고, 수치를 상기 표 기준으로 입력하였으며, 실제로는 훨씬 더 큰 전체 문건 집합을 대상으로 본 발명 사상이 적용된다.)

[표 6]

어구 ID	어구	누적 카운팅값(전체 문건 집합 기준)	관련 어구 절대 ID
...	...	...	...	...	...	...	...
1	abc	10	1, 2, 3, 4, 5, 6, 7, 150, 151, 152
2	bcd	7	8, 9, 10, 11, 12, 13, 14
...	...	...	...	...	...	...	...

또한, 본 발명의 어구별 카운팅 엔진은 문건 상의 특정 필드(예를 들면 특허 청구 범위 등)를 기준으로 하기 표 7과 같이 한 각 어구별 누적 카운팅 값을 생성할 수 있다.

[표 7]

어구 ID	어구	누적 카운팅값(특허청구범위기준)	관련 어구 절대 ID
...	...	...	...	...	...	...	...
1	abc	3	1, 2, 150
2	bcd	3	8, 9, 10
...	...	...	...	...	...	...

.........어, 본 발명의 대표 어구 추출 엔진에 대해서 설명한다. 대표 어구 추출 전체 문건 집합에서 추출한서 (어구, 문건 번호) 데이터가 있는 경우, 상기 데이터로 하기 표 8와 같은 (어구, 카운팅값, 문건 번호) 데이터가 생성하는 것은 용이할 것이다. 상기 (어구, 카운팅값, 문건 번호) 데이터는 동일한 어구가 있을 경우, 카운팅 값을 1씩 증가시켜 주는 방법으로 생성될 수 있을 것이다. 되었을 때, 본 발명의 대표 어구 추출 엔진은 (어구, 문건 번호) 데이터를 기초로 하여, (어구, 카운팅값, 문건 번호)을 생성할 수 있으며, (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터로, (어구, 카운팅값, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다. 상기와 같은 과정은 적어도 하나 이상의 대표 어구 추출 목표 문건 집합에 속하는 모든 문건에 대하여 수행할 수 있을 뿐만 아니라, 상기 대표 어구 추출 목표 문건 집합의 모집합이 되는 적어도 하나 이상의 대표 어구 추출 전체 문건 집합에 대해서도 수행할 수 있을 것이다.

대표 어구 추출 엔진은 대표 어구 추출 전체 문건 집합의 예로서 1) 1개 국가 DB에 속하는 모든 문건, 2) 주어진 적어도 하나 이상의 특허 분류 기호에 대응되는 모든 문건, 3) 특정한 출원인에 대한 모든 문건, 4) 특정한 발명자에 대한 모든 문건 또는 5) 이들 각각에 기간을 한정하여 생성되는 모든 문건, 또는 6) 이들 각각을 조합(합집합, 차집합, 교집합 등의 임의의 집합 연산을 포함한다)하여 생성되는 모든 문건에 대해서도 (어구, 문건 번호) 데이터 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다. 한편, 상기 대표 어구 추출 전체 문건 집합의 임의의 부분 집합에 대응되는 모든 문건에 대해서도 (어구, 문건 번호) 데이터 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다.

이때, 상기 대표 어구 추출 엔진은 적어도 하나 이상의 대표 어구 추출 전체 문건 집합 각각에 대하여 기설정된 적어도 하나 이상의 대표 어구 추출 목표 문건 집합에 대하여 각 어구 별로 1) 대표 어구 추출 목표 문건 집합에서의 빈도(frequency F) 및 2) 상기 대표 어구 추출 목표 문건 집합의 모집합이 되는 대표 어구 추출 전체 문건 집합에서의 빈도(total frequency, T)를 계산할 수 있을 것이다. 한편, 상기 대표 어구 추출 전체 문건 집합에서 어구 총수(All frequency, A)를 계산할 수 있음은 물론이며, 상기 대표 어구 추출 목표 문건 집합에서의 어구 총수(All frequency of target set, AT)를 계산할 수 있음도 물론이다 하겠다.

이때, 상기 대표 어구 추출 엔진은 대표 어구 추출 정책 DB를 참조하여 주어진 대표 어구 추출 전체 문건 집합에서 주어진 대표 어구 추출 목표 문건 집합의 대표 어구를 추출한다. 이때, 상기 대표 어구 추출 정책은 기설정된 조건 하에서 (어구, 어구의 확률값)에서 상기 어구의 확률값이 기설정된 기준 범위에 포함되는 지의 여부가 될 수 있다. 상기 확률값의 예로는 특정 어구별로의 F/T, F/A, F/AT값이 될 수 있을 것이다. 한편, 상기 대표 어구 추출 정책은 1) F, T, A, AT 값의 변동값(증감율, 증감속도), 2) F/T, F/A, F/AT의 변동(증감율, 증감속도)값이 기설정된 기준 범위를 만족하는 지도 될 수 있을 것이다. 이때, 상기 어구 추출 정책의 기설정된 조건은 기간별, 국가별, 출원인별, 발명자별, 또는 적어도 하나 이상의 특허 분류 기호 별 또는 기설정된 속성을 공유하는 문건 집합별로 상기 (어구, 어구의 확률값)에서 상기 어구의 확률값에 다른 기준 범위의 값을 대응시킬 수 있을 것이다. 상기 예를 들면, 특허 출원이 많은 IPC H 섹션에서 추출된 어구에 대한 확률값과 특허 출원인 적은 IPC D 섹션에서 추출된 어구의 확률값은 다르게 적용될 수도 있다는 것이다. 물론, 1) F, T, A, AT 값의 변동값(증감율, 증감속도), 2) F/T, F/A, F/AT의 변동(증감율, 증감속도)값에도 상기 어구가 추출된 문건 집합(대표 어구 추출 전체 문건 집합, 대표 어구 추출 목표 문건 집합)의 속성에 따라 유동적으로 다른 기준이 적용될 수 있을 것이다.

이하, 간략한 표로써 본 발명의 대표 어구 추출의 개념을 설명한다. 본 발명의 대표 어구 추출 엔진은 1) 전체 어구들의 출현 개수(frequency) 기준으로, 어구 ID별로 확률값(=특정 어구의 출현 개수/전체 어구 수)을 대응시키고, 기설정된 확률값 범위에 해당하는 어구들을 후보 대표 어구로 선정하고, 기설정된 대표 어구 선발 규칙을 참조하여, 목표 문건 집합별로의 대표 어구를 선정한다. 상기 출현 개수는 상기 각 특정 필드별로 계산될 수 있음은 자명할 것이다. 하기 표 8와 같은 예에서는 문건 번호별로 각 어구별 출현 개수를 카운팅하여 기설정된 대표 어구 추출 정책에 부합하는 상기 문건 번호별로 대표 어구를 추출할 수 있을 것이다.

[표 8]

구I어구	대표 어구 추출 목표 문건 집합문건에서의 출현개수(F)(frequency)	문건 번호	대표어구추출 전체 문건 집합에서의 출현개수(T)	F/T(%)출현개수/전체 출현개수(%)	T/A전체에서의 출현개수/전체 어구 총수(10억)(%)	어구 총수(A)
abc	40	#1	80000	0.05	0.008	1,000,000,000
abc	2	#2	80000	0.0025	0.008
abc	200	#3	80000	0.25	0.008
bcd	8	#1	200	4	0.00002
bcd	100	#2	200	50	0.00002
bcd	2	#4	200	0.1	0.00002
cde	15	#1	3000	0.5	0.0003
cde	100	#4	3000	3.3	0.0003

상기 표 8에서 알 수 있듯이, 모든 어구마다 이와 1:1로 대응되는 어구 절대 ID가 있을 것이다. 그러므로고, (어구, 문건 번호) 데이터는 (어구 절대 ID, 어구, 문건 번호) 데이터와 본질적으로 대등하다. 각 어구 절대 ID마다 어구 ID가 대응되며, 각 어구 절대 ID마다 상기 어구가 나온 문건 번호가 대응되어 있으며, 각 문건 번호 마다 서지 사항이 대응되어 있다. 그러므로, 상기 표 8의 문건 번호 및 문건 번호별 상기 어구 ID별 출현 개수를 입수하는 것은 목표 문건 집합의 한 예를 문건 번호로 하는 것일 수 있다. 마찬가지로, 상기 문건 번호 자리에 기설정된 레벨의 IPC가 대응될 수도 있으며, 특정한 출원인 또는 특정한 발명자 등이 대응될 수 있으며, 각 경우마다 각 목표 문건 집합별 어구 ID별 출현 개수를 카운팅할 수 있을 것이다. 상기 목표 문건 집합별 어구 ID별 출현 개수를 카운팅하는 것은 DBMMS에서는 테이블별 조인(join) 명령을 통해서 할 수 있을 것이다.

이때, 예를 들어, 상기 대표 어구 추출 정책 DB에 있는 상기 대표 어구 추출 정책을 이루는 한선발 규칙이 1) 전체 어구 개수 대비(예를 들면 10억 개) 전체에서의 출현개수(T)가 1/1000% 미만이고, 2) 목적하는 문건 번호에서의 출현 개수가 1/1,000,000% 이상이며, 3) 출현개수/전체 출현 개수(%)가 10%에서 1%이라고 할 때, 각 어구로 각 문건 번호의 대표 어구가 될 수 있는지를 검토한다. 어구 abc는 문건 번호 #1 내지 #4 어느 것에도 대표어구가 될 수 없고(조건 1) 위반), 어구 bcd는 문건 번호 #2에서만 상기 문건 번호를 대표하는 어구가 될 수 있으며,(문건 번호 1 및 문건 번호 4에서는 조건 2)위반), 어구 cde는 문건 번호 #4에서만 대표어구가 될 수 있다(문건 번호 1에서는 조건 3) 위반) 그러므로, 문건 번호 #1의 대 표 어구에는 상기, abc, bcd, cde는 포함되지 않으며, 문건 번호 #2의 대표 어구에는 bcd가 포함될 수 있으며, 문건 번호 #3에 대해서는 상기 어구 abc는 포함되지 않으며, 문건 번호 #4에 대해서는 어구 cde가 포함될 수 있게 된다.

상기와 같은 방법으로 본 발명의 대표 어구 추출 전처리 모듈은 검색 엔진의 인덱서(401-3) 및 상기 인덱스를 활용하여 어구별 카운팅 데이터를 생성할 수 있으며, 상기 어구별 카운팅 데이터를 바탕으로 하여 전술한 바와 같은 방식으로 문건별, 기설정된 문건 집합별, 특정 필드별 내용, 또는 기설정된 문건 집합에서 추출된 모든 특정 필드별 내용에서 대표 어구를 추출할 수 있게 된다. 예를 들면, 윗 문단에서 상기 문건 번호 #2에 대표 어구에는 bcd를 대응시킬 수 있게 된다. 이어, 대표 어구 추출 목표 문건 집합별로 대표 어구가 추출되었다면, 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건 단위로 저장될 수 있다. 즉, 하나의 대표 어구 추출 목표 문건 집합 단위 또는 상기 개별 문건에는 적어도 하나 이상의 대표 어구가 대응될 수 있다. 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합의 개별 필드 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건의 개별 필드 단위로 적어도 하나 이상이 대응될 수 있을 것이다. 예를 들면, 상기 문건 번호 #2에 어구 bcd를 대응시켜 저장할 수 있게 된다. 이때, 상기 #2를 호출하였을 때, 상기 어구 bcd를 표시하여 줄 수 있게 된다.

이때, 특정한 문건 번호에 대하여 너무 많은 대표 어구가 할당될 수 있게 된다. 즉, 특정한 문건에 대하여는 상기 예로 든 조건을 충족하는 대표 어구가 100개 가 될 수도 있으며, 이 경우, 4) 각 대표 어구마다 계산되는 출현 빈도(frequency)가 높은 순으로 10개 내지 30개의 대표 어구를 추출하는 규칙을 적용하여, 대표 어구의 개수를 제한할 수 있다. 한편, 특정한 문건에 대해서는 대표 어구가 1개 내지 없을 경우가 발생할 수 있는데, 이 경우에는 상기 예로든 조건에서 조건 3)을 완화하여 적용하여, 대표 어구의 숫자를 10개 내지 30개로 유지할 수 있을 것이다.

상기와 같은 과정을 모든 문건 내지는 모든 문건 집합에 대하여 반복적으로 수행하면, 모든 문건에 대하여 기설정된 개수 범위(예로 들면 10개 내지 30개)의 대표 어구를 대응시켜 놓을 수 있을 것이다. 그러므로, 상기와 같은 과정을 통하여 상기 문건 번호에 대응되는 대표 어구를 획득할 수 있게 된다. 그리고, 상기 대표 어구 및 상기 대표 어구에 대한 계산값(예로 들면, 상기 문건 번호의 문건에서의 출현개수, 전체에서의 출현개수 등)은 상기 문건 번호에 대한 서지 사항의 한 예로 취급되어 각종 분석에 활용될 수 있다.

상기 실시예에서는 출현 빈도의 계산을 문건 단위로 하였는데, 상기 출현 빈도는 다음과 같은 1) 문건 집합 또는 2) 문건 내부의 필드 단위(특허 청구 범위 등) 또는 3) 문건 집합의 모든 문건 내부의 필드(예를 들면 2000년부터 2005년까지 출원된 대한민국의 IPC H04B 7/02에 모든 문건에 포함된 특허청구범위 중 제 1항)에 포함된 내용을 단위로 하여 계산할 수도 있을 것이다. 이때, 하나의 문건 내부인 경우에는 하나의 문건과 동일하게 취급(문건 번호의 대응 관점)할 수 있을 것이다. 하지만, 2개 이상의 문건 집합의 경우에는 문건 번호의 대응 관계가 없어지는 것처럼 보일 수 있으나 아래 3 가지 방법 중 어느 하나의 방법을 사용하면 이 문제 를 용이하게 해결할 수 있을 것이다. 이는 1) 문건 집합에 속하는 개별 문건의 단위로 대표 어구를 추출한 다음, 상기 대표 어구들을 합집합 연산을 수행한 다음, 기설정된 범위(예로 들면 10개 내지 30개)로 대표 어구의 수를 한정하는 방법, 2) 만약 문건 번호별로 대표 어구가 이미 추출되어 있다면 상기 문건 집합에 속하는 문건 번호에 대응되는 대표 어구를 입수해서 합집합 연산을 수행한 다음, 기설정된 범위로 대표 어구의 수를 한정하는 방법, 3) 문건 집합에 속하는 모든 문건을 처리한 다음에 각 어구를 문건 번호가 아닌 문건 집합의 고유 ID에 대응하여 대표 어구를 추출하는 방법 중 어느 하나를 사용할 수 있을 것이다. 상기 3) 문건 집합의 모든 문건 내부의 필드에 포함된 내용 단위일 경우에도 상기 1) 합산 처리 내지 2) 문건 집합 고유 ID 대응 처리 방법이 사용될 수 있을 것이며, 만약 필드 단위로 대표 어구가 마련되어 있다면, 상기 3) 입수 후 합산 처리 방법이 사용될 수 있을 것이다.

이하, 형태소 분석 엔진과 연결된 검색 엔진의 인덱서(401-3)(indexer)을 활용하여 상기 대표 어구를 추출하는 방법을 설명한다. 검색 엔진을 사용하는 이유는 상기 검색 엔진은 통상적으로 검색어 값에 대한 개수를 카운팅하는데 뛰어난 성능을 가지고 있기 때문이며, 인덱서(401-3)가 인덱싱해 놓은 데이터를 DB용 데이터로 용이하게 변환할 수 있기 때문이다. 인덱서(401-3)는 입수되는 텀과 상기 텀이 나온 문건 번호 또는 경우에 따라서는 상기 텀이 나온 필드명을 저장한다. 예로 들면, (term 1, #1)은 상기 term 1이 문건 #1에서 입수되었다는 뜻이며, (CL:term 1, #1)은 상기 term 1이 상기 문건 #1의 특허 청구 범위(Claim, CL)라는 필드에서 입 수되었다는 뜻이다. 검색 엔진의 인덱스에는 상기 (term 1, #1)이나 (CL:term 1, #1)과 같은 데이터들이 엄청나게 많이 저장되어 있으며, 검색어로 term 1을 넣거나, 검색 필드를 특허 청구 범위로 한정하여 term 1을 입력할 경우, 검색 결과로서 문건 번호 #1을 출력해 준다. 한편, 검색 엔진은 상기 term 1이 전체 문건에서 몇 개가 들어가 있는지, 또는 특허 청구 범위에서 몇 개가 들어가 있는지를 아주 빠른 시간에 처리해 준다.(통상적으로 검색 엔진은 검색 결과의 전체 개수를 먼저 리턴해 주고, 이어서, 전체 개수 중 앞쪽 일부만을 먼저 보여 주는 형태를 취한다.)

이때, 본 발명의 어구 생성 엔진은 상기 형태소 분석 엔진(analyzer)를 통과한 n개의 /텀들을 입수 받고, 상기 입수 받은 n개의 텀들을 기설정된 방식으로 조합하여 조합된 텀들을 상기 문건 번호와 함께 검색 엔진의 상기 인덱서(401-3)에 전송할 수 있다. (이때, 상기 문건 번호를 이미 상기 인덱스가 알고 있는 경우에는 굳이 문건 번호까지 전송할 필요가 없다. 이해의 편의상 전송되는 조합된 텀의 출처로서의 문건 번호를 포함하여 전송한다고 한다.) 이때, 상기 텀들을 조합하는 방법은 전술한 바과 같이, 1) 1개 문장 단위로 처리하여 1개 문장에서 입수되는 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법, 2) 전체 문건 단위에 포함된 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법(이 경우에는 텀의 조합이 굉장히 커서 처리 시간이 길어지는 문제가 있으나, 가장 정밀한 어구 집합을 생성할 수 있다.), 3) 하나의 문장에서 2~5개의 텀별로 순차적으로 조합하는 방법 중 어느 하나 이상을 사용할 수 있다. 물론, 상기 전체 문건 단위의 처리 방법에는 문단 단위, 특정 필드 단위(특 허 청구 범위 등)의 처리 방식도 전술한 바와 같은 대응한 방식으로 취급될 수 있을 것이다.

예를 들어 설명하면 다음과 같다. 상기 본 발명의 어구 생성 엔진은 상기 출력된 를 입수 받아, 상기 단위로 1~5개(바람직하게는 2~3개)의 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 들을 형태소 별로 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 순차적으로 abc, bcd, cde, def, efg 라는 별 어구를 생성하거나 ab, ac, ad, ae, af, ag, bc,...fg와 같은 2개의 단위로 어구를 생성할 수 있다.(이에 대해서는 전술한 바와 같다). 이때, 상기 어구 생성 엔진은 상기 abc, bcd 나 ab, ac 등과 같은 어구(=복수 개의 텀들(multiple terms))를 상기 인덱서(401-3)에 전송한다. 인덱서(401-3)는 전송받은 어구(복수개의 텀들)들을 (abc, #1), (bcd, #1), (ab, #1), (ac, #1) 등과 같이 저장한다. 이때. 만약 필드들이 한정되는 경우라면, (CL : abc, #1), (CL : bcd, #1), (CL : ab, #1), (CL : ac, #1)과 같이 상기 어구(복수 개의 텀들)이 나온 구체적인 필드명까지 포함하여 인덱스(index)로 저장한다. 하기 표 9는 인덱스의 일 예를 보여 개념적인 테이블이다.

[표 9]

어구	문건 번호	필드
abc	#1	D
abc	#1	D
abc	#1	D
abc	#1	C
abc	#1	C
bcd	#1	D
bcd	#1	C
ac	#1	D

abc	#2	D
abc	#2	D
abc	#2	C

D는 발명의 상세한 설명(description), C는 특허청구범위(claim)을 나타낸다.

상기 표 9에서 어구 abc가 #1번 문건의 발명의 상세한 설명에서 3회가 나타났고, 특허 청구 범위에서 2회가 나타났으며, 상기 어구 bcd가 1번 문건의 발명의 상세한 설명에서 1회가 나타났고, 특허 청구 범위에서 1회가 나타났으며, 상기 어구 ac가 1번 문건의 발명의 상세한 설명에서 1회가 나타났음을 보여 주고 있다. 한편, 어구 abc가 #2번 문건의 발명의 상세한 설명에서 2회가 나타났고, 특허 청구 범위에서 1회가 나타났음을 보여 준다.

이때, 상기 본 발명의 어구별 카운팅 엔진은 상기 인덱스(index)의 데이터를 입수 받아, 상기 어구(복수개의 텀들)별의 개수 및 상기 어구가 나온 출처로서의 문건 번호에 관한 데이터를 생성한다. 상기 생성된 데이터는 전술한 방식으로 생성한 데이터와 동일하거나 대응한 것이며, 상기 인덱스를 대상으로 예를 들면 다음 표 10과 같을 수 있다.

[표 10]

어구 ID	어구	문건 번호	필드	출현회수
1	abc	#1	D	3
1	abc	#1	C	2
1	abc	#2	D	2
1	abc	#2	C	1
2	bcd	#1	D	1
2	bcd	#1	C	1
3	ac	#1	D	1

상기와 같은 방법으로 본 발명의 대표 어구 추출 전처리 모듈은 검색 엔진의 인덱서(401-3) 및 상기 인덱스를 활용하여 어구별 카운팅 데이터를 생성할 수 있으며, 상기 어구별 카운팅 데이터를 바탕으로 하여 전술한 바와 같은 방식으로 문건별, 기설정된 문건 집합별, 특정 필드별 내용, 또는 기설정된 문건 집합에서 추출된 모든 특정 필드별 내용에서 대표 어구를 추출할 수 있게 된다.

이어, 대표 어구 추출 목표 문건 집합별로 대표 어구가 추출되었다면, 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건 단위로 저장될 수 있다. 즉, 하나의 대표 어구 추출 목표 문건 집합 단위 또는 상기 개별 문건에는 적어도 하나 이상의 대표 어구가 대응될 수 있다. 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합의 개별 필드 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건의 개별 필드 단위로 적어도 하나 이상이 대응될 수 있을 것이다.

상기 본 발명의 대표 어구 추출 엔진은 어구에 대해서 문건 번호 정보를 함께 생성하는 것으로 설명하였다. 이는 문건 번호가 대응되어 있는 경우, 상기 어구를 대표 어구로 하는 문건 집합을 추출하기 용이하게 하기 위한 목적이 있다. 상기 어구를 대표 어구로 하는 문건 집합을 용이하게 추출할 수 있으면, 상기 문건 집합을 분석 대상 문건 집합으로 하여 다양한 분석을 수행할 수 있다. 예를 들어, "radio frequency identification tag"라는 어구를 대표 어구로 하는 문건 집합에 대하여, 1) 국가별/연도별/출원인별로 출원수/등록수/등록율/점유율/집중율/활동율 등과 같은 다양한 분석 지표 2) 국가별/연도별/출원인별 IPC 또는 기타 특허 분류 기호의 다단계별(depth)별 분포 분석, 3) 이 문건 집합의 세부 문건 집합별(출원인별, 특허 분류 기호별) 인용, 피인용 분석 등과 같이 하나의 문건 집합이 주어졌을 때 본 발명의 분석 모듈 및 특허 인텔리전스 모듈(60)이 지원하는 각종 분석을 수행할 수 있다. 그리고, 어구에 대하여 문건 번호를 대응시켜 놓지 않고, 검색 엔진을 통해서는 특정 어구를 포함하는 문건은 추출하는 경우, 그 특정 어구가 그 문건의 대표 어구인지를 판별할 수 없는 문제가 있다.

상기와 같은 대표 어구 정보 전처리 방법에 대해서는 도 105 내지 도 107에 잘 나타나 있다.

도 105를 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 대표 어구 추출을 위한 를 조합을 생성하는 방법을 간략히 설명한다.

상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5520), 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 어구(텀, term 또는 terminology)을 추출하며(S5530), 상기 추출된 에 대하여 기설정된 기준에 의한 2개 이상의 의 기설정된 방식으로의 가능한 모든 조합을 생성하며(S5540), 상기 생성된 의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하는(S5550) 방식으로 대표 어구 추출을 위한 를 조합을 생성한다.

도 106을 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 필드별/부분 문건 집합별 대표 어구 추출을 위한 를 조합을 생성하고, 기설정된 조건을 충족하는 의 조합을 추출하는 방법을 간략히 설명한다.

상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5620),

상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 (텀)을 추출하며(S5630), 상기 추출된 에 대하여 기설정된 기준에 의한 2개 이상의 의 가능한 모든 조합을 생성하고(S5640), 상기 생성된 의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하며(S5650), 상기 문건 집합을 구성하는 각 문건의 서지 사항을 입수하여 적어도 하나 이상의 기준으로 문건 부분 집합을 생성하며(S5660), 상기 문건 부분 집합에 한정된 상기 의 조합의 개수와 상기 문건 (전체) 집합에 속한 상기 의 조합의 개수를 입수하여, 문서 전체 또는 각종 필드별로 기설정된 조건을 충족하는 의 조합을 추출한다(S5670),

도 107을 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 대표 어구 추출을 위한 를 조합을 생성하고, 각 문건 집합별로 비교하는 방법을 간략히 설명한다.

상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 복수개의 문건 집합을 입수하고(S5720), 각 문건 집합별로 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 (텀)을 추출하며(S5730), 상기 추출된 의 조합을 생성하고((S5740), 상기 생성된 의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하며(S5750), 상기 의 조합을 기설정된 기준으로 상기 복수개의 문건 집합별로 비교한다(S5760)

복수 특허 분류 기호 관계성 전처리 모듈

하나의 특허 문건에 하나의 특허 분류 기호 체계에 속하는 2개 이상의 특허 분류 기호가 부여되어 있는 문건이 다수 있다. 다. 이러한 경향그리고, 은 1) 1특허 출원 범위의 확대, 2) 발명의 고도화, 3) 기술 융합화의 경향, 4) 특허 분류 기호 부여의 정밀화 등에 따라 하나의 특허 문건에 대하여 복수개의 특허 분류 기호가 부여되는 경향은 더욱 커지고 있다. 하나의 특허 문건에 2개 이상의 특허 분류 기호가 부여 되었다는 것은 그 특허 문건에는 2개 이상의 각 특허 분류 기호에 대응되는 2개 이상의 기술적 관점, 기술적 구성, 기술적 내용, 기술적 측면, 기술적 속성, 기술적 특징 요소와 같은 것들이 포함되어 있다는 것을 의미할 수 있다. 그러므로, 2개 이상의 특허 분류 기호가 부여 되어 있는 문건은 1개의 특허 분류 기호가 부여된 문건과 달리 취급할 필요가 있게 된다.

본 발명의 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 2개 이상의 특허 분류 기호가 부여된 문건만을 재료로 하여, 복수개의 특허 분류 기호간에 숨어 있는 관계성을 발견하여 활용하는 것을 목적의 하나로으로 한다. 상기 복수 특허 분류 기호 관계성 전처리 모듈은 IPC/UPC/FT 중의 어느 하나만을 기준으로 한(즉, 동일한 종류의 특허 분류 기호를 기준으로 한) 동종의 특허 분류 기호간의 숨어 있는 관계성을 발견하여, 기술의 융합에 대한 정보를 생성하는 것을 목적으로 하는 동종 복수 특허 분류 기호 관계성 전처리 모듈과, 하나의 문건에 IPC, UPC, FT 등 중에서 선택되는 2 이상의 특허 분류 기호가 포함되어 있을 때, 상기 2 이상의 특허 분류 기호간의 관계성을 파악하는 이종 복수 특허 분류 기호 관계성 전처리 모듈을 포함한다. 도 60은 상기 복수 특허 분류 기호 관계성 전처리 모듈의 구성, 동종 복수 특허 분류 기호 관계성 전처리 모듈의 구성 및 이종 복수 특허 분류 기호 관계성 전처리 모듈의 구성을 보여주고 있다.

동종 복수 특허 분류 기호 관계성 전처리 모듈

이하, 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 어느 하나의 문건에 한 종류의 복수개의 특허 분류 기호가 부여되어 있거나, 2종 이상의 특허 분류 기호가 부여되어 있더라도, 선택된 하나의 특허 분류 기호 체계 상의 복수개의 특허 분류 기호들을 처리하는 것을 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한다. 상기 복수개의 특허 분류 기호에 관한 처리를 담당하는 것은 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 엔진이 수행하며, 상기 수행의 결과는 본 발명의 동종 대표 어구 복수 특허 분류 기호 관계 DB(207-3)에 저장된다.

이론적으로 먼저 설명하고, 이어 구체적인 실례를 들어서 설명한다. 먼저, 가장 단순한 모델로 하나의 문건에 2개의 특허 분류 기호가 포함된 경우에 대한 복수 개의 특허 분류 기호에 대한 관계성 처리 방법을 제시한다. 하나의 특허 문건에 특허 분류 기호 A1와 특허 분류 기호 B1이 부여되어 있다고 가정하자. 이때, 특허 분류 기호 체계 상에서 A1의 직상위 노드(부모 특허 분류 기호)가 A2, A2의 직상위 노드가 A3라고 하며, 이러한 규칙이 계속될 때, A1의 상위 노드는 A2, A3, A4, ... An이 될 수 있다. 마찬가지로 B1에 대해서도, B2, B3, B4, ,Bn을 할당할 수 있게 된다. 이들 An, Bn들 중에서 가장 상위에 있는 것들은 섹션이 된다. 그리고, 섹션 위에는 그냥 IPC 등과 같은 특허 분류 기호 체계명이 있다고 하자. 이렇게 될 때, 상기 An들과 상기 Bn들은 적어도 섹션 또는 IPC라는 특허 분류 기호 체계명 하에서 적어도 하나 이상의 공통 노드를 가지게 된다.(섹션이 다른 등 가장 멀리 떨어져 있어도, IPC라는 동일 분류 기호 체계를 공유한다는 점에서는 일치한다.) 상기 공통 노드 중 상기 특허 분류 기호 체계 상에서 최하위 레벨에 있는 것을 최하위 공통 특허 분류 기호라 명명한다. 이때, A1과 B1의 최하위 공통 특허 분류 기호가 각각 Ai+1와 Bj+1라 하면, Ai+1 = Bj+1가 된다. 상기 주어진 하나의 특허 문건의 내용 상 A1과 B1이 함께 있는 경우, 상기 A1과 B1은 상기 특허 문건에 대하여 관계성을 가진다.(즉, 하나의 특허 문건에 나와 있는 발명 또는 발명들이 A1 및 B1의 속성을 독자적으로 또는 전체적으로 함께 갖고 있다는 뜻으로서의 관계성을 말한다.) 이때, 특허 분류 기호 체계의 본질 상 A1은 상기 B1의 모든 부모 노드인 B2, B3, ... Bj+)와 관계성을 가진다. 마찬가지로, B1은 A1의 모든 부모 노드인 A2, A3, ...A(i+1)와 관계성을 가진다. 이때, A1과 Bj+1의 관계성은 Bj+1와 Ai+1가 동일하 므로, 어짜피 부모 노드이므로, 그 관계성을 논할 필요가 없으며, 모든 A들과 Bj+1(=Ai+1)들의 관계성도 어짜피 부모 노드에 존재하는 것들이므로 별도로 논할 필요가 없다. 즉, 최하위 공통 부모 노드는 관계성 계산 테이블에서 고려하지 않는 것이 바람직할 것이다.

이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 복수개의 특허 문건 기호를 처리할 때, 상기 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 하기 표 11과 같은 데이터를 만들 수 있다. 이때, Ai+1과 Bj+1은 실제 테이블에서는 필요치 않는 셀들(Ai까지와 Bj까지만이 관계성 테이블에 필요함)이나, 설명의 편의(그 셀들에는 값이 없음을 보여 주기 위함)를 위해서 테이블에 표시한다. 즉, 실제 표에서는 Ai, Bj까지만으로 테이블이 구성된다.

[표 11]

	A1	A2		Ai	Ai+1
B1	1	1	1	1
B2	1	1	1	1
	1	1	1	1
Bj	1	1	1	1
Bj+1=Ai+1

즉, 상기 A1 ~ Ai와 B1 ~ Bj사이의 모든 교차되는 쌍(예를 들면 (A1, B1), ... (Ai, Bj) 등)은 상기 주어진 특허 문건을 매개로 하여 관련성 가진다고 할 수 있다.

대한민국 특허출원 제10-2005-0111868호에는 2006년 01월 자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 예시적으로 설명한다. H04B 7/26의 부모는 차례로 H04B 7/24, H04B 7/00, H04B, H04, H가 된다. H04B 7/15의 부모는 차례 로, H04B 7/14, H04B 7/00이 된다. 이 경우, 최하위 공통 특허 분류 기호는 H04B 7/00이 된다. 그러므로, 이를 표로 만들면 하기 표 12과 같다. H04B 7/00과 관련된 셀이 그 셀값이 아무 값도 없음은 위에서 설명한 바와 같다.

[표 12]

	H04B 7/26	H04B 7/24	H04B 7/00
H04B 7/15	1	1
H04B 7/14	1	1
H04B 7/00

그러므로, 대한민국 특허출원 제10-2005-0111868호를 기준으로, 9개의 교차되는 특허 분류 기호의 관련성 쌍이 생성되게 된다. 이때, 하나의 문건에 대하여 2 이상의 특허 분류 기호가 존재할 때, 맨 앞에 나오는 것을 주 특허 분류 기호라 하므로, 본 문건에서는 H04B 726이 주 특허 분류 기호가 되고, 상기 주 특허 분류 기호의 부모 노드에 있는 다른 상위 특허 분류 기호도 주어진 특허 문건에서 역시 주 특허 분류 기호로 취급된다. 상기 주 특허 분류 기호가 문제가 되는 것은 하나의 문건에 특허 분류 기호가 3개 이상 있을 때의 취급과 관련하여 중요한 역할을 한다. 특허 분류 기호가 3개 이상 있을 때는 아래와 같이 특허 분류 기호를 처리할 수 있다.

먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되 는 쌍에 관한 정보를 갖고 있다.

다음으로, 주 특허 분류 기호를 정하고, 상기 주 특허 분류 기호를 취하고, 다른 1개는 n-1개의 부 특허 분류 기호에서 취하여 n-1개의 조합을 취한 다음에 각 조합에 대하여 n-1개의 테이블을 얻고, 각 테이블에는 먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되는 쌍에 관한 정보를 갖고 있다. 이때, 주 특허 분류 기호와 관련되는 교차 쌍에 대해서는 주 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다. 그리고, n-1개의 부 특허 분류 기호에 대하여 n-1C2개의 조합을 얻고, 각 조합에 대하여 상기와 같은 처리를 하여 모든 교차되는 쌍에 관한 정보를 얻는다. 이때, 부 특허 분류 기호와 관련되는 교차 쌍에 대해서는 부 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다.

대한민국 특허출원 제10-2006-0012606호에는 2006년 01월 자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호가 있다. 상기 H04B 7/04의 부모 노드는 각각 H04B 7/02, H04B 7/00, H04B, H04, H가 있으며, H04B 7/155의 부모 노드는 각각 H04B 7/15, H04B 7/14, H04B 7/00, H04B, H04, H가 있으며, H04Q 7/30의 부모 노드는 각각 H04Q 7/20, H04Q 7/00, H04Q, H04, H가 있다. 이때, 최하위 공통 특허 분류 기호는 H04B 7/04와 H04B 7/155의 조합에 대한 H04B 7/00이며, H04B 7/155와 H04Q 7/30의 조합에 대해서는 H04이며, H04B 7/04와 H04Q 7/30에 대해서는 H04가 된다.

이때, 모든 특허 분류 기호에 대해 동등하게 취급하면, 아래와 같은 3C2 개수의 테이블이 나온다. 먼저 표 13는 H04B 7/04와 H04B 7/155의 관계성 테이블이다.

[표 13]

	H04B 7/04	H04B 7/02	H04B 7/00
H04B 7/155	1	1
H04B 7/15	1	1
H04B 7/14	1	1
H04B 7/00

다음으로 표 14은 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.

[표 14]

	H04B 7/04	H04B 7/02	H04B 7/00	H04B	H04
H04Q 7/30	1	1	1	1
H04Q 7/20	1	1	1	1
H04Q 7/00	1	1	1	1
H04Q	1	1	1	1
H04

다음으로, 표 15은 H04B 7/155와 H04Q 7/30의 관계성 테이블이다.

[표 15]

이때, 이어 가중치를 부여하는 방법에 대해서 설명한다. 가중치의 부여는 크게 2가지가 있다. 첫번째가 위에서 설명한 주 특허 분류 기호와의 관련성 테이블에 더 큰 가중치를 부여하고, 부 특허 분류 기호들 간의 관련성 테이블에 더 적은 가중치를 부여하는 방법이 있다. 예를 들면 주 특허 분류 기호와의 관련성 테이블에는 1을 부여하고, 부 특허 분류 기호와의 관련성 테이블에는 0.5를 부여하는 방법이 있을 것이다.

이렇게 되면 다음으로, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음 표 16와 같이 될 것이다.

[표 16]

	H04B 7/155	H04B 7/15	H04B 7/14	H04B 7/00	H04B	H04
H04Q 7/30	0.5	0.5	0.5	0.5	0.5
H04Q 7/20	0.5	0.5	0.5	0.5	0.5
H04Q 7/00	0.5	0.5	0.5	0.5	0.5
H04Q	0.5	0.5	0.5	0.5	0.5
H04

두번째는, 복수개의 특허 분류 기호를 가지고 있는 특허 문건에 대한 가중치를 균등하게 부여하는 방법이 있을 것이다. 예를 들면 2개의 특허 분류 기호를 가지고 있을 때는 각 특허 분류 기호의 관련성 쌍의 값이 1이 된다고 할 때, n개의 특허 분류 기호를 가지고 있는 특허 분류 기호의 쌍에 대해서는 그 관련성의 쌍의 값을 가능한 조합의 개수인 nC2를 나눈 값을 균등하게 할당할 수도 있다. 즉, 가중치를 1/(nC2)로 할 수도 있을 것이다. 예를 들면, 이와 같이 할 때, 상기, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음 표 17과 같은 것이다.

[표 17]

	H04B 7/155	H04B 7/15	H04B 7/14	H04B 7/00	H04B	H04
H04Q 7/30	1/3	1/3	1/3	1/3	1/3
H04Q 7/20	1/3	1/3	1/3	1/3	1/3
H04Q 7/00	1/3	1/3	1/3	1/3	1/3
H04Q	1/3	1/3	1/3	1/3	1/3
H04

세번째는 3개 이상의 특허 분류 기호를 가지는 문건에 대하여 주 특허 분류 기호와 관련된 쌍과, 부 특허 분류 기호와 관련된 쌍에 다른 가중치를 부여하는 방법이 있을 것이다. 예를 들어 n개의 특허 분류 기호가 있을 때, 주 분류와 관계되는 조합의 개수는 (n-1)이 되므로, 주 분류 기호와의 관련된 조합에 전체의 75%를 할당하고, 이들과 관련된 관련 쌍에는 0.75*1/(n-1)의 가중치를 부여할 수 있다. 부 특허 분류 기호들과 관련되는 모든 조합에 25%의 가중치를 부여할 때, 부 특허 분류 기호들과 관련되는 모든 쌍에는 0.25*1/((n-1)C2)의 가중치를 부여할 수 있을 것이다. 이때, 상기 %의 배분은 기설정된 값으로 조절할 수 있을 것이다. 예를 들면 n> 5일 때, 주 특허 분류 기호와 관련된 것들에 50%를, 부 특허 분류 기호와 관련된 것들에 50%를 배당할 수 있을 것이며, n= 4일 때는 60% 대 40%를, n=3일 때는 75% 대 25%를 할당할 수 있을 것이다. 즉, IPC 의 개수가 3보다 클 때에는 (sub IPC, Sub IPC) 특허 분류 기호 조합 쌍이 생기므로, (main IPC, Sub IPC) 특허 분류 기호 조합 쌍과 (Sub IPC, Sub IPC) 특허 분류 기호 조합 쌍에 대해 다른 가중치를 줄 수 있을 것이다.

n=3일 때는 75% 대 25%를 할당하면 다음과 같은 테이블이 생성될 수 있다. 먼저 하기 표 18는 H04B 7/04와 H04B 7/155의 관계성 테이블이다.

[표 18]

	H04B 7/04	H04B 7/02	H04B 7/00
H04B 7/155	0.75/2	0.75/2
H04B 7/15	0.75/2	0.75/2
H04B 7/14	0.75/2	0.75/2
H04Q 7/00

다음으로 하기 표 19는 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.

[표 19]

	H04B 7/04	H04B 7/02	H04B 7/00	H04B	H04
H04Q 7/30	0.75/2	0.75/2	0.75/2	0.75/2
H04Q 7/20	0.75/2	0.75/2	0.75/2	0.75/2
H04Q 7/00	0.75/2	0.75/2	0.75/2	0.75/2
H04Q	0.75/2	0.75/2	0.75/2	0.75/2
H04

다음으로, 하기 표 20은 H04B 7/155와 H04Q 7/30의 관계성 테이블이다.

[표 20]

	H04B 7/155	H04B 7/15	H04B 7/14	H04B 7/00	H04B	H04
H04Q 7/30	0.25/1	0.25/1	0.25/1	0.25/1	0.25/1
H04Q 7/20	0.25/1	0.25/1	0.25/1	0.25/1	0.25/1
H04Q 7/00	0.25/1	0.25/1	0.25/1	0.25/1	0.25/1
H04Q	0.25/1	0.25/1	0.25/1	0.25/1	0.25/1
H04

한편, 복수개의 특허 분류 기호를 가지는 개별 문건의 기여도를 문건 단위로 동일(가령 1)이라고 했을 때, 다음과 같은 가중치 부여 방법을 생각할 수 있다. 극단적인 예로써, 대한민국 특허 출원 제 10-2005-0042032호 문건에 H04B 7/02 및 H04B 7/14와 같이 2개의 특허 분류 기호가 나와 있고, 이들이 next sibling 관계일 때(즉, H04B 7/02 및 H04B 7/14 부모 노드가 H04B 7/00으로 동일하며, 그 부모 노드가 직상위 특허 분류 기호이다) 상기 H04B 7/02 및 H04B 7/14의 관계성 테이블은 오직 1개가 나오며, 그 테이블의 셀(cell) 또한 1개이다. 상기 대한민국 특허 출원 제 10-2005-0042032호 문건에 대한 테이블은 하기 표 21과 같다.

[표 21]

	H04B 7/02	H04B 7/00
H04B 7/14	1
H04B 7/00

이때, 상기 특정한 특허 문건에 대해서 H04B 7/02 및 H04B 7/14는 강력하게 관계되어 있다고 볼 수 있다. 한편, 상기 대한민국 특허출원 제10-2006-0012606호를 기준으로 했을 경우, 3개의 테이블에, 각 테이블마다 6개, 16개 및 20개의 셀을 가지게 된다. 이때, 상기 (H04B 7/02, H04B 7/14)라는 하나의 특허 분류 기호 조합을 기준으로 할 때, 대한민국 특허 출원 제 10-2005-0042032호 문건의 기여도와 상기 대한민국 특허출원 제10-2006-0012606호의 기여도를 어떻게 평가할 것인가의 문제가 발생한다. 상기 기여도의 가중치 처리는 다음과 같은 방법이 있을 것이다.

첫째, 관계성의 존재 내지는 발생을 기준으로 테이블이나 상기 테이블에서 발생하는 셀의 개수에 무관하게 어느 문건에서나 특정 특허 분류 기호의 조합 (Ai, Bj)(예를 들면, 상기 (H04B 7/02, H04B 7/14))를 동일한 값의 기여도 가중치(예를 들면 1)로 처리할 수 있다.

둘째, 상기 테이블의 개수 및 셀의 개수를 고려하여, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 각 특허 문건의 기여도 가중치를 다르게 하여 부여할 수 있을 것이다. 이때, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 기여도 가중치를 각 특허 문건에서 발생하는 모든 테이블에 존재하는 모든 셀의 총수로 나눈 것으로 할 수 있다. 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6+16+20)(=3개의 테이블에 있는 모든 셀의 수)가 된다.

셋째, 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 나눈 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6)(=3개의 테이블에 있는 모든 셀의 수)가 된다

넷째, 상기 둘째 또는 셋째의 기여도 가중치를 역으로 계산하는 방법이 있다. 즉, 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 곱한 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 6(=3개의 테이블에 있는 모든 셀의 수)이 된다. 이러한 기여도 가중치 부여 방법은 이종 기술의 융합도를 계산하 는데 더욱 유망할 것이다. 즉, 테이블에 존재하는 셀의 숫자가 적은 경우에는 그 기술은 기술 분류 체계 자체에서 연관성이 강한 기술로 묶어 놓은 것일 수 있기 때문에, 하나의 테이블에서 테이블의 크기가 클수록 그 기술은 기술 분류 체계 상 멀리 떨어져 있는 기술이기 때문이다.

상기와 같은 방법으로 특허 분류 기호 조합 (Ai, Bj)에 대하여 다음과 같은 정보를 획득할 수 있을 것이다.

첫째, (H04B 7/02, H04B 7/14) (Ai, Bj)에 대한 카운팅 정보이다. 상기 카운팅 시 본 발명에서 언급하거나, 본 발명 사상에 부합하는 가중치를 부여할 경우, 상기 특허 분류 기호 조합 (Ai, Bj)에 대하여 적어도 하나 이상의 가중치가 적용된 가중치별 카운팅 정보를 획득할 수 있을 것이다.

둘째, 모든 특허 분류 기호 조합은 그 조합이 생성될 때, 그 조합이 어느 문건에 의해서 생성되었는지에 대한 정보가 저장되어 있다. 즉, 상기 (H04B 7/02, H04B 7/14)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 문건에 의해서 생성된 것이며, (H04B 7/15, H04B 7/24)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2005-0111868호라는 문건에 의해서 생성된 것이다. 그러므로, 특허 분류 기호 조합 (Ai, Bj)에 대해 문건 고유 번호가 대응되며, 상기 문건 고유 번호에는 그 문건 고유 번호를 가지는 문건에 대한 모든 서지 사항을 포함한 그 문건에 대한 모든 정보가 대응될 수 있다. 상기 모든 테이블에는 관련된 2개의 특허 분류 기호 조합이 존재하며, 그 특허 분류 기호 조합들이 나온 특허 문건이 대응되며, 상기 특허 문건에는 그 특허 문건의 서지 사항이 대응될 수 있다. 즉, 상기 H04B 7/155와 H04Q 7/30의 관계성 테이블에 존재하는 모든 특허 분류 기호 조합 (Ai, Bj)에 대하여, 문건 고유 번호로 대한민국 특허출원 제10-2005-0111868호가 대응된다. 그리고, 상기 문건 고유 번호에 대응되는 문건의 서지 사항 등에서 상기 문건에 대하여 출원번호는 10-2006-0012606이며, 출원인은 삼성전자이며, 발명자는 최도인과 황성택이며, 출원일은 2006년02월09일인 것과 같이 서지 사항 및 상기 문건 고유 번호에 해당하는 문건에 관한 모든 정보를 대응시킬 수 있게 된다. 물론, 상기 문건 고유 번호는 출원 번호일 수 있으며, 본 특허 출원이 미국 등에 출원되었다면 그 미국 출원의 서지 사항에도 상기 수행된 결과값을 대응(매핑)해 놓을 수 있을 것이다.

상기와 같은 모든 특허 분류 기호 조합 (Ai, Bj)과 문건 번호의 대응은 상기 특허 분류 기호 조합 (Ai, Bj)의 생성 시에 상기 카운팅 값과 함께 DB에 저장되는 것이 바람직할 것이다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 입수되는 특허 문건에 대하여 특허 분류 기호가 2개 이상일 경우, 각 특허 분류 기호의 조합에 대하여 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 가 특허 분류 기호의 조합별로 기설정된 개수의 테이블을 만든다. 이때, 각 테이블에 들어가는 수치값은 기설정된 기준에 의한 가중치를 반영한 값일 수 있다. 이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 각 테이블에서 추출된 특허 분류 기호의 조합 (Ai, Bj)에 대하여 기설정된 기여도 가중치값을 적용하여 특허 분류 기호의 조합 (Ai, Bj)별 하기 표 22과 같은 특허 분류 기호의 조합 (Ai, Bj)별 관계성 결과 데이터를 생 성할 수 있다.

본 모델을 설명하기 위하여 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개만이 있다고 가정하자.(물론, 입수 되는 모든 문건에 대해서 반복적으로 처리하면 모든 문건 집합을 기준으로 한 모든 특허 분류 기호 조합 (Ai, Bj)에 대한 하기와 같은 데이터의 생성이 가능할 것이다.) 이때, 특허 분류 기호 조합 (Ai, Bj)에 다음과 같은 테이블의 생성이 가능할 것이다.

[표 22]

특허 분류 기호 조합 (Ai, Bj)	문건 번호	Frequency (단순빈도)	1/nC2 균등할당	(M,S), (S,S) 차등할당
(H04B 7/15 ,H04B 7/26)	10-2005-0111868	1	1	1
(H04B 7/15,H04B 7/24)	10-2005-0111868	1	1	1
(H04B 7/14,H04B 7/26)	10-2005-0111868	1	1	1
(H04B 7/14,H04B 7/24)	10-2005-0111868	1	1	1
(H04B 7/155,H04B 7/04)	10-2006-0012606	1	1/3	0.75/2
(H04B 7/155,H04B 7/02)	10-2006-0012606	1	1/3	0.75/2
(H04B 7/15,H04B 7/04)	10-2006-0012606	1	1/3	0.75/2
(H04B 7/15,H04B 7/02)	10-2006-0012606	1	1/3	0.75/2
(H04B 7/14,H04B 7/04)	10-2006-0012606	1	1/3	0.75/2
(H04B 7/14,H04B 7/02)	10-2006-0012606	2	1/3	0.75/2
(H04B 7/14,H04B 7/02)	10-2005-0042032	2	1	1
		1	1/3	..
		1	1/3	..
(H04Q 7/00, H04B 7/00)	10-2006-0012606	1	1/3	0.25/1
(H04Q 7/00, H04B)	10-2006-0012606	1	1/3	0.25/1
(H04Q,H04B)	10-2006-0012606	1	1/3	0.25/1

(n은 특허분류 기호 수), (M,S)는 (main IPC, Sub IPC)를 (S,S)는 (sub IPC, Sub IPC) 를 말하며, n>2 이상일 경우, (M,S), (S,S) 차등할당은 (M,S)에 대해서는 75%/(n-1)의 가중치를, (S,S)에 대해서는 25%/(n-1)C2의 가중치를 부여하였다. n=2 일 때는 그냥 1을 부여하였다.

이때, 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍에 주목하면, 문건 번호가 2개가 대응되어 있음을 알 수 있다. 즉, 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍은 2개의 문건에서 동시에 출현했음을 의미하며, Frequency(단순 빈도)의 값은 2가 된다. 1/nC2 균등할당과 (M,S), (S,S) 차등할당 등 기설정된 방식의 가중치 또는 기여도 가중치를 부여할 수 있을 것이다.

상기 표 22는 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개에 대해서 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성한 것이다. 상기 방식을 입수되는 모든 문건에 대하여 반복적 또는 재귀적으로 적용할 수 있음은 당업자에게 자명할 것이며, 상기 기설정된 가중치 또는 기여도 가중치 중 어느 하나 이상을 기준으로, 각 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성할 수 있음도 자명할 것이다.

이상과 같이 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 임의의 (Ai, Bj)에 대하여 1) 이 (Ai, Bj)값이 나온 문건 번호, 2) 특정한 상황i별 가중치 정책j에 따르는 가중치(Wij), 3) (M,S)인지 (S,S)인지의 여부, 4) 기타 (Ai, Bj)에 대한 속성 정보 중 어느 하나 이상을 DB에 저장할 수 있다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 복수 개의 특허 분류 기호를 처리하는 방법은 IPC에 한정되지 않음은 당연하다 할 것이다. 즉, 상기 IPC에서 수행된 것과 완전히 동일하게 미국 특허 문건에 대해서는 USPC를, 일본 특허 문건에 대해서는 FT와 FI, ECLA를 대상으로 하여 복수 개의 특허 분류 기호를 처리할 수 있을 것이다.

기술 융합 패턴 분석 모듈

이때, 상기 특허 분류 기호의 조합 (Ai, Bj)에 대하여 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 저장한 1) (Ai, Bj)값이 나온 문건 번호, 2) 특정한 상황i별 가중치 정책j에 따르는 가중치(Wij), 3) (M,S)인지 (S,S)인지의 여부, 4) 기타 (Ai, Bj)에 대한 속성 정보 중 어느 하나 이상을 처리하면 다음과 같은 다음과 같은 정보들을 계산, 입수 또는 추출할 수 있을 것이다. 하기와 같은 정보는 본 발명의 기술 융합 패턴 분석 모듈이 수행한다.

상기 기술 융합 패턴 분석 모듈이 처리할 수 있는 정보는 본질적으로 2가지이다.

첫째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 각 특허 분류 기호 쌍의 출현 회수를 입수할 수 있다. 예를 들면, (H04B 7/26, H04B 7/15)는 대한민국 특허출원 제10-2005-0111868호에 1회 출현한 반면, (H04B 7/14,H04B 7/02)는 10-2006-0012606와 10-2005-0042032양 특허 공보에 모두 출현하였다. (주 특허 분류 기호가 아닐 시 또는 모든 특허 분류 기호를 동등하게 취급할 경우에는 (Ai, Bj) = (Bj, Ai)로 취급될 수 있다. 어느 하나가 주특허 분류 기호이면 (Ai, Bj)와 (Bj, Ai)를 다르게 취급할 수도 있으며, 동일하게 취급할 수도 있을 것이다. ) 그러므로, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 모든 특허 분류의 쌍에 대하여 그 쌍이 나온 회수를 기록하여 놓을 수 있다. 또한, 상기 쌍이 나온 특허 문건들에 대한 특허 문건 번호를 저장해 놓을 수 있을 것이다.

둘째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특정 특허 분류 기호가 주어질 때, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 이는 상기 주어진 특정 특허 분류 기호가 들어가는 모든 쌍과, 그 쌍이 나온 회수를 카운팅함으로써 용이하게 획득할 수 있을 것이다. 이때, 기설정된 가중치 또는 기여도 가중치를 적용하여, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 아울러, 상기 특허 분류 기호 체계(트리 구조)를 참조하여, 기설정된 레벨 단위에서 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 즉, 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 상기 IPC sub class, IPC main group, 또는 IPC subgroup 수준에서 상기 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다.

셋째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특허 분류 기호 쌍과 상기 특허 문건 번호의 대응 관계를 통하여, 상기 특허 분류 기호 쌍과 상기 특허 문건 번호에 대응되는 서지 사항을 대응시켜 다양한 분석 결과를 생성할 수 있다. 상기 분석 결과에는 상기 특허 분류 기호 쌍과 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합과의 분석 결과를 획득할 수 있을 것이다. 예를 들면, 삼성전자의 대한민국 특허출원 2000년도부터의 2005년도까지에서 가장 많이 결합된 특허 분류 기호 쌍을 알 수 있을 것 이다. 나아가, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 아울러, 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 상기 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합으로 이루어지는 문건 집합에서도 찾을 수 있을 것이다. 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 H04B 7/26와 가장 다수가 결합하는 특허 분류 기호 체계 상에서의 각 단계별 특허 분류 기호를 찾을 수 있을 것이며, H04B 7/26에 대하여 삼성전자 주식회사의 미국 특허출원 2003년도부터의 2005년도까지에서도 찾을 수 있을 것이다. 이를 통해, 상기 특정 기간 동안의 특정 주체에 대한 특허 명세서에 나타난 기술 융합의 정도를 파악할 수 있을 것이다.

넷째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 임의의 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 특허 분류 기호의 조합 (Ai, Bj)에 관계된 특별한 특허 문건 집합을 대응시킬 수 있을 것이다. 이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 상기 대응되는 특허 문건 집합에 대한 각종 분석을 수행하면, 상기 수행된 분석 결과는 상기 특허 분류 기호의 조합 (Ai, Bj)에 대한 분석 결과가 된다. 상기 특별한 특허 문건 집합에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 11) 상기 1) 내지 9)에 등록 여부, 심사청구 여부 등과 특정 조건을 결부하는 것으로 생성되는 특허 문건 집합에 대하여 사전에 계산해 놓을 수 있을 것이다. 물론, 사용자가 특정하거나 생성한 문건 집합에 대해서도 상기와 같은 계산을 수행해 놓을 수 있을 것이다.

또한, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 1) 내지 상기 11)로 특정되는 어느 하나 이상의 문건 집합에 대하여, 상기 문건 집합을 구성하는 특허 문건 중에서, 특허 분류 기호가 2 이상이 부여되어 있는 문건들만을 추출해서, 그 추출된 문건 집합을 대상으로만, 상기 특허 분류 기호의 조합 (Ai, Bj)을 입수할 수 있다. 상기 입수된 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 표와 같은 관계성 데이터를 생성하고, 상기 생성된 관계성 데이터를 정렬 또는 분석(빈도, 최빈값, 최대값, 최소값, 연도별 개수, 출원인, 발명자 등의 주체별 개수 등의 분석이 그 예가 된다.)한다. 상기와 같은 분석을 마치면, 상기 1) 내지 11)로 특정되는 어느 하나 이상의 문건 집합 또는 상기 추출된 문건 집합 대상별로의 상기 특허 분류 기호의 조합 (Ai, Bj)의 관점에서 파악되는 기술 융합에 관한 정보를 획득할 수 있게 된다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행하는 상기와 같은 반복 수행 방법은 본 수행의 결과로 생성되는 값을 찾기 위한 일실시예에 불과할 것이며, 당업자라면 전산 기술을 이용하여 본 발명 사상에 대한 다양한 계산 방법을 시도할 수 있을 것이다. 상기 특허 분류 기호가 2 이상 부여된 모든 특허 문건의 모든 특허 분류 기호에 대하여 상기 수행된 결과(예를 들면 각 특허 분류 기호 쌍에 대한 값(가중치 부여 또는 미부여 등을 포괄한다)을 가지는 테이블 등)는 DB로 저장되거나, 실시간으로 생성되는 뷰(view) 내지는 물리적인 뷰(materialized view)로 제공될 수 있음은 당연할 것이다.

상기와 같은 과정을 실시하는 일 실시예적 과정을 도 103에서 보여주고 있다. 이하, 도 103을 기준으로 설명한다. 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나의 특허 문건을 포함하는 문건 집합을 입수하며(S5320), 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5330), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5340), 상기 조합별로 상기 조합에 포함된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노드에 관한 정보를 입수하며(S5350), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5360), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하며(S5370), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하며(S5380), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성한다(S5390)

이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈을 통해서 적어도 2 이상의 문건 집합에 대하여 복수개의 특허 분류 기호를 전처리하여 비교하는 방법에 대해서 도 104를 기준으로 설명한다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나의 특허 문건을 포함하는 문건 집합을 2 이상 입수하며(S5410), 상기 각 문건 집합별로 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5430), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5440), 상기 조합별로 상기 조합에 포함된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노드에 관한 정보를 입수하고(S5450), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5460), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하고(S5470), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하고(S5480), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성하고(S5490), 상기 통계값, 파라미터 또는 계산값을 상기 문건 집합별로 비교한다(S5495).

도 115내지 도 117에는 복수 특허 분류 기호 분석 방법에 대한 예시적인 실시예를 보여주고 있다.

도 115는 특허 분류 기호를 입수 받고, 상기 입수 받은 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들에 대한 분석 정보를 제시하는 실시예적 방법이다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 특허 분류 기호를 입수 받고(S6520), 입수된 특허 분류 기호에 대한 최빈 융합 특허 분류 기호 정보를 입수하여(S6530), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6540).

도 116는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 최빈 특허 분류 기호를 추출하고, 상기 추출된 특허 분류 기호를 기준으로 최빈 융합 특허 분 류 기호들에 대한 분석 정보를 제시하는 실시예적 방법이다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 문건 집합을 입수 받고(S6620), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하고(S6630), 개별 문건별로 입수된 특허 분류 기호를 문건 집합 수준에서 최빈값을 기준으로 랭킹을 부여하고(S6640), 랭킹이 부여된 개별 특허 분류 기호별로 최빈 융합 특허 분류 기호 정보를 입수하고(S6650), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6660).

도 117는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 개별 문건 단위에서 추출한 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들을 추출하고, 추출된 최빈 융합 특허 분류 기호들을 통합하는 방식으로 분석 정보를 제시하는 실시예적 방법이다.

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 문건 집합을 입수 받고(S670), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하며(S670), 개별 문건별로 입수된 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호 정보를 입수하고(S670), 개별 문건별로 입수된 최빈 융합 특허 분류 기호 정보를 통합하며(S670), 통합된 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 통합된 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S670).

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 본 발명 사상의 특징의 하위 특허 분류 기호 포함 사상을 적용하지 않고, 단순하게 각 문건에 포함되어 있는 특허 분류(patent classification, PC) 기호쌍(PC1, ..., PCi, PCj,..., PCn)에 대해서도 작동될 수 있다. 즉, 상기에서는 주어진 PCi에 대하여 주어진 특허 분류 기호 체계 상의 상위 특허 분류 기호를 고려하지 않고, 문건에 나타난 (PCi, PCj)만을 대상으로 특허 분류 기호 조합쌍을 구성할 수 있다. 이때, PC1이 주(main) 특허 분류 기호이므로, 상기에서 설명한 main vs. sub 간의 가중치 부여는 그대로 적용할 수 있다.

이종 복수 특허 분류 기호 관계성 전처리 모듈

상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 동종의 특허 분류 기호에 대한 처리를 설명하였다. 이어서, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈의 작동 방식과 완전히 유사하다. 미국에서 발행되는 특허 문건에는 하나의 특허 문건에 IPC와 USPC가 동시에 결합되어 있는 것이 거의 전부이며, 일본에서 발행되는 특허 문건에도 IPC와 FT가 동시에 부여되어 있다. 하나의 특허 문건에 IPC1,… IPCn이, USPC1,…,USPCm 부여되어 있다고 가정하자. 이 경우, 이종 복수 특허 분류 기호 관계성 처리의 관점에서는 상기 IPC1,… IPCn과 USPC1,…,USPCm사이에는 4가지 종류의 관계성의 조합이 생긴다. 먼저 IPC1과 USPC1의 관계로, 이들은 각각 main IPC와 main USPC의 쌍이 된다. 그리고, IPC1와 USPC2,…,USPCm의 쌍으로 이는 main IPC와 sub USPC와의 쌍이 된다. 그리고, IPC2,… IPCn와, USPC1의 쌍으로, 이는 sub IPC와 main USPC의 쌍이 된다. 그리고, , IPC2,… IPCn각각과 USPC2,…,USPCm각각에 대한 쌍으로, 이는 sub IPC와 sub USPC의 쌍이 된다.

상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 각 4가지 종류별로, 각 종류 하에 있는 이종 복수 특허 분류 기호들 간에서 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한 바와 동일한 처리를 할 수 있다. 이때, 이종 특허 분류 기호를 대상으로 하므로, 상기 최소 공통 특허 분류 기호는 없기 때문에 기설정된 값으로 한정할 수 있다. 즉, IPC의 경우에는 subclass에서, USPC에서는 class까지만을 대상으로 하여, 주어진 IPC와 주어진 USPC 쌍에 대하여 상위 특허 분류 기호를 한정 지을 수 있다. 즉, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 특허 분류 기호 조합(Ai, Bj)(단, Ai, Bj는 동일한 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성한 바와 같이, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성할 수 있다. 상기 생성된 관계성 테이블에 대하여 가중치 또는 기여도 가중치를 부여할 수 있을 것이다. 또한, 각 이종 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여, 특허 문건 번호를 대응시킬 수 있음과, 상기 특허 문건 번호로부터 입수되는 서지사항을 반영한 카운팅 및 계산을 수행할 수 있음도 자명할 것이다. 아울러, 특정한 문건 집합에 대하여, 이종 특허 분류 기호 조합(Ai, Bj)를 획득할 수 있을 것이며, 이들 조합에 대한 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈과 동등한 분석을 수행할 수 있을 것이다.

특허 분류 기호별 통계 전처리 모듈

특허 분류 기호의 다단계성

본 발명의 특허 분류 기호별 통계 전처리 모듈은 적어도 하나 이상의 특허 분류 기호 체계 상의 특허 분류 기호에 대하여, 적어도 하나 이상의 국가별 특허 DB를 대상으로 기설정된 통계값을 찾아내는 전처리를 수행한다.

도 61은 상기 특허 분류 기호별 통계 전처리 모듈의 구조에 대해서 설명하고 있다. 상기 특허 분류 기호별 통계 전처리 모듈은 특허 분류 기호별로 통계값을 전처리하는 특허 분류 기호별 통계 전처리 엔진(3210)과 상기 전처리된 특허 분류 기호별 통계값을 저장하고 있는 뷰(view), 테이블(table) 또는 정보 조직체로서의 전처리된 특허 분류 기호별 통계 DB(3230)를 포함하고 있다.

상기 특허 분류 기호별 통계 전처리 모듈에서 취급하는 특허 분류 기호는 IPC, USPC, FT, FI, ECLA 중 어느 하나 이상이다. 상기 특허 분류 기호별 통계 전처리 모듈에서 국가별 특허 DB는 대한민국, 미국, 일본, 유럽(EPO)가 발행하는 특허 DB를 포함하며, 그 이외의 국가의 특허청이 발행하는 특허 DB도 포함될 수 있음은 자명하다. 각 국가는 IPC를 공통으로 하고, 자국별로 특별한 분류 체계(미국 특허청의 경우 USPC 또는 UPC, 일본 특허청의 경우 FT, FI, 유럽 특허청의 경우 ECLA 등)를 가지고 있는 경우도 있다. 2이상의 특허 분류 체계를 가지고 있는 국가의 특 허 DB를 대상으로 한 기설정된 통계값을 찾아내는 것은 상기 2이상의 분류 체계별로 독립적으로 수행되는 것이 바람직하다. 즉, 미국의 경우라면, IPC 와 USPC에 대해서 각각 전처리를 할 필요가 있게 된다. 또한, 각 특허 분류 기호 체계에는 각 체계 마다의 레벨이 있다. IPC의 경우에는 section, subsection, class, subclass, group, subgroup이 있으며, subgroup이하의 세부 분류에는 그 특허 분류 기호에 대응되는 타이틀 정보에 도트(dot)의 수로써 계층 구조를 표현하고 있다. 상기 계층 구조에 대한 예시는 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)에 상세히 설명되어 있다. 그러므로, 본 발명에서의 특허 분류 기호의 레벨은 IPC section, class, subclass, main group, 1dot subgroup, 2 dot subgroup, ...n dot subgroup으로 레벨별로 구분될 수 있다. 상기 레벨은 상기 main group까지는 분류 기호 체계에서 상하위 계층 구조를 확인할 수 있으나, subgroup부터는 타이틀에 포함된 dot 정보를 활용해야만 상하위 계층 구조를 확인할 수 있다. 상기와 같은 dot의 수로써 계층 구조를 확인하는 것은 USPC의 경우 subclass부터이며, FT의 경우 전체 FT 기호에서 전7자리("테마 코드 + 영문자 2자"까지)이후부터이다.

상기 특허 분류 기호별 통계 전처리 모듈이 특허 분류 기호별로 통계값을 전처리하는 방법의 일례는 도 100에 나와있다. 상기 특허 분류 기호별 통계 전처리 모듈은 제1국에서의 특정 특허 분류 기호 체계에 대하여, 주어지는 특허 분류 기호의 하위 분류 기호가 자동으로 포함될 수 있도록 특허 분류 기호의 트리 구조를 이용하여 특허 분류 기호를 재조정하여 DB에 저장하며(S5020), 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 입수하며(S5030), 검색식 또는 검색 쿼리에 포함 된 주어진 특허 분류 기호에 대하여 재조정된 특허 분류 기호로 변환하며(S5040), 재조정된 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 대상으로 검색 엔진 또는 DBMS(201)로 검색을 수행하며(S5050), 상기 검색 결과로서 특허 문건 정보를 입수하여 계량화 하며(S5060), 상기 검색 결과에 대하여 기설정된 시간 단위 또는 통합된 시간 단위로, 출원인, 발명자, 또는 대리인 등 주체에 대하여 기설정된 통계값, 파라미터 또는 계산값을 기준으로 랭킹 정보를 계산하는 기능을 수행한다.

또한 상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 101에 나타나 있다.

상기 특허 분류 기호별 통계 전처리 모듈은 특허 분류 기호가 포함된 검색식을 입수하고(S5120), 상기 검색식에 포함된 특허 분류 기호에 대하여 하위 특허 분류 기호에 관한 특허 정보를 포함하여 관계되는 특허 문건 정보를 입수하며(S5130), 상기 특허 문건에 포함된 인용 정보 및 피인용 정보를 기설정된 통계값, 파라미터 내지 계산값를 처리한다(S5140).

아울러, 상기 특허 분류 기호별 통계 전처리 모듈은 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 102에 나타나 있다.

상기 특허 분류 기호별 통계 전처리 모듈은 적어도 하나의 문건 집합을 입수하고(S5220), 상기 문건 집합에 포함된 모든 문건에 대하여 출원인, 발명자, 대리 인, 적어도 하나 이상의 특허 기술 분류 기호를 추출하며(S5230), 상기 문건에 대하여 상기 추출된 기준 중 어느 하나 이상을 적용하여 문건 부분 집합을 생성하고(S5240), 상시 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건이 인용하는 선출원 문건 정보를 입수하거나(S5250), 상기 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건을 인용하는 후출원 문건 정보를 입수하며(S5260), 상기 입수된 선출원 문건 및/또는 상기 입수된 후출원 문건에 대하여 기설정된 인용, 피인용 관련 통계값, 파라미터 또는 계산값을 생성할 수 있다(S5270)

이하, 본 발명의 특허 분류 기호별 통계 전처리 모듈을 특허 분류 기호별 통계 전처리 엔진의 관점에서 더욱 상세하게 설명한다.

옵션 사항

상기 특허 분류 기호별 통계 전처리 모듈이 상기 기설정된 통계값을 처리할 때는 다음과 같은 옵션이 고려되며, 각 옵션별 교차 선택이 가능할 것이다.

첫째, 먼저 각 특허 분류 기호가 주어졌을 때, 그 특허 분류 기호의 하위 분류 기호에 관한 정보를 자동적으로 포함할 것인가의 문제이다. 이는 특히 타이틀 정보에 나온 dot수로부터 계층 구조를 확인해야 하는 레벨일 경우 더욱 그러하다. 예를 들면, H, H04, H04B, H04B 7/00레벨까지는 확장자를 사용하여 용이하게 주어진 레벨의 IPC하부에 있는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있으나, subgroup레벨로 가면 본 발명의 하위 분류 포함 검색 방법을 활용해야만 그 하위 분류에 속하는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있다. 예를 들면, H04B 7/15라는 IPC가 있을 때 하위 분류 기호를 포함하지 않고 통계값을 생성할 때는 각 국가별 특허 문건 중에서 H04B 7/15이 포함되어 있는 특허 문건을 입수하면 된다. 하지만, 하위 분류 기호 포함하여 통계값을 생성할 때는 H04B 7/15와, IPC 계층 구조상 그 하위에 있는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 포함된 특허 문건들도 입수해야 한다. 이는 USPC, FT 등에서도 마찬가지이며, 공통된 설명은 생략한다.

하위 분류 기호를 자동으로 포함하여 통계값을 처리할 때에는 본 발명의 범위 검색(검색 엔진 이용 또는 DBMS(201) 이용 시 모두 해당)의 방법을 활용할 수도 있을 것이다. 한편, 본 목적을 달성하기 위해서 범위 검색이 아니더라도, 주어진 특허 분류 기호를 처리할 때, 그 하위에 있는 모든 특허 분류 기호를 저장해 놓고, 그 특허 분류 기호에 대한 통계값을 처리할 때, 그 특허 분류 기호에 대해서만 통계처리를 하는 것이 아니라, 하위에 있는 모든 특허 분류 기호를 대상으로 통계값을 처리할 수도 있을 것이다. 위의 H04B 7/15를 통해서 예를 들면, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 특허 분류 기호 계층 구조 정보에서 입수한 다음, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 저장한 다음, H04B 7/15에 대한 기설정된 통계값을 구하라는 명령이 입수될 때, 자동적으로 하부에 존재하는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 포함하여 기설정된 통계값을 구하는 방식을 채용할 수도 있다는 것이다. 이는 USPC, FT 등의 다른 특허 분류 기호 체계에서도 마찬가지이다.

주어진 레벨의 특허 분류 기호가 있을 때, 단순히 그 특허 분류 기호를 포함하는 문건을 대상으로 상기 기설정된 통계값을 생성하는 것보다 상기 특허 분류 기호의 하위 특허 분류 기호들을 자동으로 포함하여 기설정된 통계값을 생성하는 것이 바람직하다.

둘째, 복수개의 특허 분류 기호가 존재할 경우, 이를 어떻게 처리할 것인가의 문제이다. 이 경우, 1) 주(main) 특허 분류 기호(통상 제일 첫번째 나오는 것이 주 특허 분류 기호이다.)만을 통계 처리의 대상으로 하는 방법, 2) 주 특허 분류 기호와 종(sub) 특허 분류 기호에 대해 균등한 가중치를 두면서 처리하는 방법, 3) 주 특허 분류 기호와 종 특허 분류 기호에 대해 다른 가중치를 주는 방식으로(예를 들면, 특허 분류 기호가 n+1개가 있을 때, 주 특허 분류 기호 50%, 나머지 종 특허 분류 기호는 50%*1/n으로 가중치를 주는 방법) 처리할 수 있을 것이다. 상기 1) 내지 3) 중에서 1)과 3)이 바람직하며, 그 중에서 3)이 더욱 바람직할 것이다.

셋째, 복수개의 출원인과 발명자가 있을 때의 처리 방법이다. 이 경우, 1) 매출원인 또는 발명자마다 100%의 가중치를 주는 방법과, 2) 출원인 또는 발명자수에 대해 균분하는 방법(n명의 발명자가 있을 때 각 발명자마다 100%*1/n로 처리함)이 있을 것이다. 출원인의 경우에는 실시 독립의 관점에서 출원인마다 100%의 가중치를 주는 것이, 발명자는 1/n으로 처리하는 것이 바람직할 것이다. 대리인의 경우에는 위의 출원인이나 발명자의 처리 방법을 채용할 수 있을 것이며, 대리인마다 100%로 하는 것이 바람직할 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특허 분류 기호에 대하여 상기 특허 분류 기호 체계 상에서 자신의 직하위 특허분류 기호의 개수를 카운트해 놓을 수 있으며, 자신의 모든 하위 특허 분류 기호의 개수를 카운트해 놓을 수 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 확정되기 때문이다. 상기 확정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.

예를 들면, 출원 기준으로는 연도별 또는 분기별 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도를 계산해 놓을 수 있을 것이다. 연도별 출원수는 특정 연도에 출원된 특허 문건의 전체 개수를 구하는 방식으로 계산될 수 있을 것이다. 증가율의 계산은 {(현기간 개수-과거기간개수)/과거기간 개수}*100%가 되며, 증가속도는 계산은 {(현기간 개수-과거기간개수)/시간간격}이 되며, 증가가속도는 증가속도의 시간간격에 대한 변화율로 계산가능할 것이다.

또한, 연도별 출원자 수를 구할 수 있을 것이며(이때, 공동 출원일 경우, 상기 옵션 사항을 적용할 수 있을 것이다.), 출원자 수가 계산되면 출원자수증가율을 계산해 놓을 수 있으며, 나아가 1개 출원당 평균출원자수 및 평균출원자수증가율도 계산할 수 있을 것이다. 그리고, 연도별 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율도 상기의 연도별 출원자 수에 준하여 계산할 수 있을 것이다.

그리고, 개별 출원마다 출원 청구항 수를 계산할 수 있으므로, 연도별 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 평균출원청구항수증가율을 계산할 수 있을 것이다. 이때, 출원 청구항을 독립항과 종속항으로 구분지을 경우, 독립항 수와 종속항 수를 계산할 수 있으므로, 이들에 대한 증가율 등을 계산할 수 있을 것이다.

또한, 개별 출원마다 특허 분류 기호의 개수를 계산할 수 있을 것이므로, 연도별 특허분류기호수, 특허분류기호수증가율을 계산할 수 있을 것이며, 1개 출원당 평균특허분류기호수, 평균특허분류기호수증가율도 계산할 수 있을 것이다. 또한, 미국이나 일본 등과 같이 2개 이상의 특허 분류 기호가 사용되는 특허 DB의 경우에는 각 특허 분류 기호마다 이를 계산해 놓을 수 있을 것이다. 개별 출원마다 그 출원에 관한 패밀리 정보가 있을 때, 상기 패밀리 정보를 기준으로 연도별 패밀리수, 매밀리수증가율 및 1개 출원당 평균패밀리국가수, 평균패밀리국가수증가율도 계산할 수 있을 것이다.

상기는 출원 기준으로 계산된 것이며, 이와 동일한 파라미터들을 등록 기준으로 계산할 수도 있을 것이다. 등록 기준으로 계산할 수 있는 파라미터들은 등록수, 등록수증가율, 등록수증가속도, 등록수증가가속도, 등록자수, 등록자수증가율, 평균등록자수, 평균등록자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 등록청구항수, 등록청구항수증가율, 평균등록청구항수, 평균등 록청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 평균패밀리국가수, 평균패밀리국가수증가율 등이 있을 수 있다.

상기와 같은 파라미터들은 예시적인 것이며, 그 이외에도 출원 또는 등록 특허 정보에 포함된 각종 수치 정보 및 본 발명의 사전 카운팅된 값들을 재료로 하여 다양한 파라미터 값도 계산될 수 있을 것이다. 상기 파라미터 값들은 본질적으로 카운트값, 카운트값의 변화율과 변화값, 상기 카운트값의 통계량(평균, 표준편차), 2 이상의 카운트값에 대한 함수값(예를 들면 등록율 등이 그 예가 된다.)

수량 기준 주체의 발견

상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.

예를 들면, 상기 특정된 특허 문건 집합에 대한 카운팅으로 연도별 또는 연도 통합 최다 출원인, 발명자, 대리인을 추출하여 각 출원인, 발명자, 또는 대리인별로 랭킹을 매겨 놓을 수 있을 것이다.

또한, 위에서 추출한 출원인들, 발명자들, 또는 대리인별로 집중도, 활동도(Activity Index)등을 계산해 놓을 수 있으며, 상기 계산의 결과로 집중도를 기 준으로 한 출원인, 발명자 또는 대리인의 랭킹을 구할 수 있을 것이며, 활동도를 기준으로 한 출원인, 발명자, 또는 대리인의 랭킹을 구할 수 있을 것이다. 참고로, 출원수 기준 집중도란 {(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)*100%}로 구할 수 있을 것이다. 또한, 활동도는 [{(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)}/{(특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 모든 출원)}*100%]으로 계산할 수 있다. 이때, 검색 엔진 또는 상기 DBMS(201)를 통하여 1) 특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원, 2) 특정 기간 동안의 특정 주체의 모든 출원, 3) 특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원 및 4) 특정 기간 동안의 모든 출원 각각의 개수를 입수할 수 있기 때문에, 위의 집중도나 활동도를 계산할 수 있게 된다. 한편, 상기 집중도나 활동도는 특허 지표의 일 예에 불과하며, 상기 검색 엔진 또는 상기 DBMS(201)로 직접 또는 사전 계산을 통하여 간접적으로 입수할 수 있는 수치값들을 입력값으로 하는 정의된 함수가 있는 경우, 그 함수의 값을 계산할 수 있을 것이며, 그 계산된 함수값을 통하여 출원인, 발명자, 또는 대리인의 그 함수값을 기준으로 한 랭킹을 계산할 수 있을 것이다. 본 발명의 상기 함수에는 특허 분석 지표로 활용되는 정의될 수 있는 종래의 모든 특허 분석 지표 중 특허 DB를 기준으로 검색 엔진 또는 상기 DBMS(201)가 입수할 수 있는 값으로 정의되는 모든 특허 분석 지표가 해당될 수 있다.

아울러, 상기에서는 출원수를 기준으로 해서 출원인, 발명자 또는 대리인별 랭킹을 계산했으나, 출원수 증가율, 출원수 증가속도 등과 같은 다른 파라미터들을 기준으로 상기 특허 지표 내지는 함수에 대해서 출원인, 발명자 또는 대리인별 랭킹을 계산해 놓을 수 있을 것이다. 상기 파라미터로는 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 1개 출원당 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 1개 출원당 평균특허분류기호수, 1개 출원당 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 1개 출원당 평균패밀리국가수, 1개 출원당 평균패밀리국가수증가율 등이 있을 수 있을 것이다.

상기 각종 특허 지표 내지는 함수는 출원 기준으로 설명하였으나, 등록을 기준으로도 정의될 수 있고, 계산될 수 있음은 자명할 것이다. 상기 출원 또는 등록의 한정은 특허 문건 집합의 특정 내지 확정의 문제이기 때문이다. 그러므로, 출원 중에서 출원 단계에서 심사청구가 있는 출원만을 대상으로 상기 특허 문건 집합을 특정 내지 확정할 수도 있을 것이다. 아울러, 실용신안제도를 도입하고 있는 경우, 실용신안등록출원 또는 실용신안등록을 각각 출원 또는 등록에 포함시킬 지의 여부 또한 상기 특허 문건 집합의 특정 내지 확정에 관한 문제로 이러한 특정 내지 확정의 방법과 기준은 당업자의 수준에서 다양하게 정할 수 있을 것이다.

인용 관련

상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 인용 정보를 포함하고 있는 국가별 특허 DB(예를 들면 미국 특허청 발행 특허 문건으로 구축한 특허 DB)를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 인용 관련 정보를 생성해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 예를 들면, USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)가 주어졌을 때, 자신의 특허 문건의 특허 분류 기호로 USPC=002/456를 포함하고 있는 특허 문건 집합을 특정할 수 있게 된다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.

미국 특허 문건의 서지 사항에는 자기 문건이 인용한 타인의 특허 등의 인용 정보가 존재한다. 즉, B 문건이 A 문건 및 a 문건을 인용하고 있을 때, A 문건 및 a 문건은 인용당한 것, 즉 피인용 특허이며, B 문건은 A 및 a 문건을 인용한 특허이다. 이때, B 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 인용 출원인, 인용 발명자, 인용 대리인, 인용 특허 분류 기호가 되며, A 문건 및 a 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 피인용 출원인, 피인용 발명자, 피인용 대리인, 피인용 특허 분류 기호가 된다.

B 문건이 A 문건 및 a 문건을 인용하고 있을 때, B 문건의 서지사항에는 A 문건 및 a 문건의 번호가 들어있다. B 문건이 A 문건 및 a 문건을 인용하는 관계가 있을 때, 전산적으로는 인용 관점에서의 A->B, a->B의 맵핑(mapping) 및 B->A, B->a로의 맵핑이 있게 되고, 상기 맵핑 관계를 통하여 A<->B, a<->B의 상호 관계를 성립시킬 수 있다. 그러므로, B가 인용하고 있는 문건은 B의 서지사항에 있어 용이 하게 데이터화 될 수 있게 되고, 상기 맵핑을 통하여, A가 인용되고 있는 문건들의 집합 및 a가 인용되고 있는 문건 집합도 용이하게 특정할 수 있다. 즉, 상기 A 문건이 인용되고 있는 문건 집합 및 a 문건이 인용되고 있는 문건 집합 모두에는 B 문건이 포함되어 있을 것이다.

상기 과정은 확정 또는 특정된 모든 문건에 대하여 수행될 수 있을 것이다. 즉, 특정된 모든 특허 문건에 대하여 하나씩(one by one)으로 처리될 때, 하거나, 기타 전산적인 방법으로 모든 특허 문건 간의 맵핑 관계를 설정할 수 있을 것이다. 하나씩 처리될 때는 각 처리의 대상이 되는 문건은 B 문건의 입장에 서게 됨은 자명할 것이다. 이때, A 문건 및 a 문건이 모두 미국 특허 DB라는 전체 집합에 포함될 경우에는 A 문건 및 a 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이며, 어느 하나가 다른 국가의 특허 DB에서 관리되는 문건일 경우에도 그 국가의 특허 DB의 그 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이다.

인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)이 특정되면, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특허 문건 집합의 각각의 특허 문건에 포함되어 있는 피인용 특허 문건 번호(문건 A의 번호, 문건 a의 번호)를 취합할 수 있게 되고, 상기 취합된 피인용 특허 문건 번호에는 대응하는 피인용 특허 문건이 있으며, 상기 피인용 특허 문건에는 서지 사항이 포함되어 있음은 자명하다. 따라서, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건이 인용한 피인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 피인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상이 될 수 있다. 이때, 중복 카운팅은 당연히 허용된다. 즉, 하나의 피인용 문건이 상기 인용 정보를 포함하고 있는 특허 문건 집합의 다수 문건에 의해 인용될 때, 상기 피인용 문건은 그 인용되는 회수만큼의 가중치 또는 카운팅 값을 가져야 한다. 즉, 각 피인용 문건 번호에는 상기 인용 회수만큼의 가중치가 곱해져 있다고 취급되면 타당할 것이다. 즉, 문건 A가 5번 인용되고, 문건 a가 3번 인용되었다고 할 때, 모든 인용출원수 등과 같은 하기 파라미터값을 계산할 때, A문건에는 5의 가중치를, a문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 인용 정보를 포함하고 있는 특허 문건 집합을 기준으로 할 때, 상기 피인용 특허 문건 집합을 대상으로 한 모든 계산값은 "인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅이 될 때, 가장 많은 회수로 인용된 피인용 문건 번호의 랭킹을 계산할 수 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 상기 피인용 특허 문건 집합(문건 A, 문건 a가 있는 문건 집합) 또는 임의의 특정된 특허 문건 집합을 대상으로 하여 다음과 같은 정보들을 계산할 수 있을 것이다 그리고, 먼저 양적인 기준으로 인용출원수, 인용출원수 증가율, 인용출원수 증가속도(이들은 피인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특 허분류기호수, 인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 피인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율이 된게 된다.

마찬가지로 상기 특허 분류 기호별 통계 전처리 모듈은 상기 피인용 특허 문 건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 피인용 출원인별 랭킹, 최다 피인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 피인용 특허 문건 집합에 포함된 피인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 피인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 상기 인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 인용 정보를 포함하고 있는 출원인별 특허 문건 집합(상기 모든 출원인 중의 어느 하나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 피인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 피인용 특허 문건 집합에 대하여 상기의 인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특허 분류 기호별 통계 전처리 모듈은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 피인용 문건 집합을 생성할 수 있게 되고, 상기 피인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.

상기 맵핑이 관점에서, 상기 특정된 특허 문건 집합에 포함된 각 특허 문건을 인용하고 있는 문건 집합, 즉 인용 문건 집합을 생성할 수 있을 것이다. 예를 들어 설명하면 B 문건을 C 문건 및 c 문건이 인용하고 있을 때, 상기 맵팽 관계를 통하여, B 문건은 C 문건 및, c 문건에 의해 인용당했다는 것을 알 수 있게 된다. 이러한 C 문건 및 c 문건을 찾기 위해서는 검색 엔진의 인용 문건 번호 필드에 B 문건의 번호를 입력하면, 검색 결과로서 B 문건이 인용 정보에 포함된 C 문건 등이 나오게 된다. 물론, DBMS(201)에 B 문건의 번호를 인용 번호 필드를 지정하여 select 등의 쿼리를 질의하여서도 C 문건 등을 검색 결과로 입수할 수 있게 된다. B->C, B->c의 맵핑 관계가 데이터로 정리되어 있다면, 상기 B 문건을 인용하고 있는 C 문건이 포함된 문건 집합을 용이하게 특정할 수 있을 것이다.

그러므로, 상기 특허 분류 기호별 통계 전처리 모듈은 특정된 특허 문건 집 합에 대하여, 상기 특정된 특허 문건 집합의 개별 특허 문건을 인용하고 있는 인용 문건 집합을 대상으로 하여 하기와 같은 피인용 정보(인용 당한 B의 입장에서는 인용한 C가 포함된 문건들은 피인용 정보가 된다)를 계산할 수 있다.

특허 문건 집합(B가 있는 문건 집합)이 특정되면, 상기 특허 분류 기호별 통계 전처리 모듈은 검색 엔진 또는 DBMS(201)에 질의함으로써, 상기 특허 문건 집합의 각각의 특허 문건을 인용하고 있는 인용 특허 문건 번호(문건 C의 번호, 문건 c의 번호)를 취합할 수 있게 된다. 상기 취합된 인용 특허 문건 번호에는 서지 사항이 대응되어 있음은 자명하므로, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건을 인용한 인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상이 될 수 있다.

이때, 중복 카운팅은 허용되는 것이 바람직하다. 상기 특정된 특허 문건 집합에, B 문건과 b문건이 속한다고 할 때, 상기 B 문건과 b 문건이 모두 C 문건에 의해 인용된다고 할 때, 문건 C의 가중치는 2가 되어야 한다. 즉, C문건은 B 문건으로 검색해도 검색 결과에 포함되며, b 문건으로 검색해도 검색 결과에 포함된다.

상기 특정된 특허 문건 집합을 기준으로 할 때, 상기 인용 특허 문건 집합을 대상으로 한 모든 계산값은 "피인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅이 될 때, 상기 특정된 특허 문건 집합에 속하는 특허 문건을 가장 많이 인용한 인용 문건 번호의 랭킹을 계산할 수 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 상기 인용 특허 문건 집합(문건 C, 문건 c가 있는 문건 집합)을 대상으로 하여 상기와 같은 정보들을 계산할 수 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 마찬가지로 상기 인용 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 인용 출원인별 랭킹, 최다 인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 피인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 인용 특허 문건 집합에 포함된 인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용과 관계되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.

이때, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특정된 특허 문건 집합(B와 b가 있는 문건 집합) 자체를 분석할 수 있다. 이 때도 중복 카운팅이 허용되어 중복된 회수만큼 가중치를 부여하여 취급하는 것이 바람직하다. 예를 들면, 문건 B가 5번 인용되고, 문건 b가 3번 인용되었다고 할 때, 모든 상기 특정된 특허 문건 집합을 대상으로 피인용출원수 등과 같은 하기 파라미터값을 계산할 때, B문 건에는 5의 가중치를, b문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 상기 특허 분류 기호별 통계 전처리 모듈은 상기 가중치를 반영하여 상기 특정된 특허 문건 집합을 대상으로 하여 가장 많이 인용된 특허 문건의 랭킹을 계산할 수 있을 것이다. 나아가, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특정된 특허 문건 집합(문건 B, 문건 b가 있는 문건 집합)을 대상으로 하여 먼저 양적인 기준으로 피인용출원수(B는 C에 의해서 인용되었으므로, B의 입장에서는 피인용이라는 말을 사용할 수 있다.) 등의 값을 카운팅하거나 계산할 수 있을 것이다.

상기 특허 분류 기호별 통계 전처리 모듈은 상기 특정된 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 출원인별 특허 문건 집합(상기 모든 최빈 출원인 중의 어느 하나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 인용 특허 문건 집합에 대하여 상기의 피인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특허 분류 기호별 통계 전처리 모듈은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 인용 문건 집합을 생성할 수 있게 되고, 상기 인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.

본 발명의 상기 특허 분류 기호별 통계 전처리 모듈이 상기 각종 파라미터들을 계산하는 방법은 확정 또는 특정된 특허 문건 집합별로 계산값을 생성하는 것을 특징으로 한다. 그러므로, 상기 특허 분류 기호별 통계 전처리 모듈의 입장에서는 사기 특허 분류 기호별 통계 전처리 모듈에 입력되는 특정된 특허 문건 집합의 존재가 중요하며, 그 특허 문건 집합의 속성과 크기는 문제되지 않는다.(다만, 인용과 관련된 계산을 하기 위해는 상기 특정된 특허 문건 집합에 인용 정보가 포함되어 있어야 한다.)

아울러, 본 발명의 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특허 분류 기호별 통계 전처리 모듈을 사용하는 사용자가 지정한 특허 문건 집합에 대해서도 상기 파라미터 중 적어도 어느 하나 이상을 계산할 수 있을 것이다.

특허 정보 처리 기본 모듈(40)

이어서, 본 발명의 특허 정보 처리 기본 모듈(40)에 대해서 설명한다. 상기 특허 정보 처리 기본 모듈(40)에는 1) 검색 엔진 모듈, 2) 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402), 3) 분석 모듈, 4) 감시 모듈(403), 5) 특허 문건 집합 입수 모듈, 6) 디렉토리 생성 모듈(405), 7) 리포팅 모듈(406), 8) 간이 분석 모듈(407) 등이 있다.

이종 복수 특허 분류 기호 관계성 전처리 모듈

상기 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 동종의 특허 분류 기호에 대한 처리를 설명하였다. 이어서, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈의 작동 방식과 완전히 유사하다. 미국에서 발행되는 특허 문건에는 하나의 특허 문건에 IPC와 USPC가 동시에 결합되어 있는 것이 거의 전부이며, 일본에서 발행되는 특허 문건에도 IPC와 FT가 동시에 부여되어 있다.된다. 하나의 특허 문건에 IPC1, IPCn이, USPC1, ...USPCm 부여되어 있다고 가정하자.

이 경우, 이종 복수 특허 분류 기호 관계성 처리의 관점에서는 상기 IPC1, IPCn과

USPC1, ... , USPCm사이에는 4가지 종류의 관계성의 조합이 생긴다. 먼저 IPC1과

USPC1의 관계로, 이들은 각각 main IPC와 main USPC의 쌍이 된다. 그리고, IPC1와

USPC2,...USPCm의 쌍으로 이는 main IPC와 sub USPC와의 쌍이 된다. 그리고, IPC2, IPCn와, USPC1의 쌍으로, 이는 sub IPC와 main USPC의 쌍이 된다. 그리고, IPC2, ..., IPCn각각과 USPC2, ... USPCm각각에 대한 쌍으로, 이는 sub IPC와 sub USPC의 쌍이 된다.

상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 각 4가지 종류별로, 각 종류 하에 있는 이종 복수 특허 분류 기호들 간에서 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한 바와 동일한 처리를 할 수 있다. 이때, 이종 특허 분류 기호를 대상으로 하므로, 상기 최소 공통 특허 분류 기호는 없기 때문에 기설정된 값으로 한정할 수 있다. 즉, IPC의 경우에는 subclass에서, USPC에서는 class까지만을 대상으로 하여, 주어진 IPC와 주어진 USPC 쌍에 대하여 상위 특허 분류 기호를 한정지을 수 있다. 즉, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 특허 분류 기호 조합(Ai, Bj)(단, Ai, Bj는 동일한 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성한 바와 같이, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성할 수 있다. 상기 생성된 관계성 테이블에 대하여 가중치 또는 기여도 가중치를 부여할 수 있을 것이다. 또한, 각 이종 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여, 특허 문건 번호를 대응시킬 수 있음과, 상기 특허 문건 번호로부터 입수되는 서지사항을 반영한 카운팅 및 계산을 수행할 수 있음도 자명할 것이다. 아울러, 특정한 문건 집합에 대하여, 이종 특허 분류 기호 조합(Ai, Bj)를 획득할 수 있을 것이며, 이들 조합에 대한 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈과 동등한 분석을 수행할 수 있을 것이 다.

특허 분류 기호 검색 모듈(401)

이어, 특허 분류 기호 검색 모듈(401)에 대해서 설명한다. 특허 분류 기호의 검색이란 검색어로서 기술 키워드를 입력했을 때, 상기 기술 키워드를 타이틀 정보로 포함하고 있는 특허 분류 기호를 검색 결과로 출력해 주는 것을 말한다.

이어서, 하기의 예로써 본 발명의 특징적인 특허 분류 기호 검색을 설명한다.

　　　　섹션　　　　　　　　　　　 : H　　　　　 전기

　　　　클래스　　　　　　　　　 : H01　　 기본적 전기소자

　　　　서브클래스　　　　　 : H01F　 자석

　　　　1-도트 서브그룹 : H01F 1/01 *무기재료로 된 것

　　　　2-도트 서브그룹 :　H01F 1/03 ** 보자력에 의해 특징되는 것

　　　　3-도트 서브그룹 :　H01F 1/032 *** 경질 자성재료의 것

　　　　4-도트 서브그룹 :　H01F 1/04 **** 금속 또는 합금

　　　　5-도트 서브그룹 :　H01F 1/047 ***** 조성물로 특징되는 합금

　　　　6-도트 서브그룹 :　H01F 1/053 ****** 희토류 금속을 포함하는 것

본 발명의 특허 분류 기호 검색의 첫번째 특징은 하위 특허 분류 기호가 검색되었을 때, 그 검색된 하위 특허 분류 기호의 상위 특허 분류 기호를 함께 그 결 과로 제공해 주는 것이다. 예를 들어, 검색어로 "경질 자성재료"가 입력되었을 때, "H01F 1/032 ·. 경질 자성재료의 것"을 검색결과로 제시함과 아울러, 상기 H01F 1/032를 특허 분류 기호 마스트 DB(203)에 조회하여, 상기 특허 분류 기호 체계 트리에서 상기 H01F 1/032의 기설정된 레벨까지의 상위 특허 분류 기호를 검색 결과로 제공해 주는 것이 바람직할 것이다. 즉, H01F 1/032를 검색어로 입력되었을 때, 하기와 같은 결과가 검색 결과로 나오는 것이 바람직할 것이다. 상기 기설정된 레벨은 IPC의 경우에는 서브클래스 USPC의 경우에는 클래스, FT의 경우에는 테마, ECLA나 FI의 경우에는 서브클래스인 것이 바람직할 것이나, 그 상위나 그 하위 레벨까지 검색 결과로 제시해 주어도 무방할 것이다.

　　　　서브클래스　　　　　 : H01F　 자석

　　　　1-도트 서브그룹 : H01F 1/01 * 무기재료로 된 것

　　　　2-도트 서브그룹 :　H01F 1/03 ** 보자력에 의해 특징되는 것

　　　　3-도트 서브그룹 :　H01F 1/032 *** 경질 자성재료의 것

상기와 같은 결과를 출력해 주기 위해서는 다음과 같은 단계를 거친다. 첫째, 검색어로 입력된 키워드를 특허 분류 기호를 타이틀 정보와 함께 인덱싱 해 놓은 특허 분류 기호 인덱스에 질의하여, 상기 검색어를 특허 분류 기호의 타이틀 정보에 포함되어 있는 하나 이상의 검색 결과로서의 특허 분류 기호를 찾아 낸다.("경질 자성 재료"를 입력했을 때, H01F 1/032을 찾아낸다.) 둘째, 찾아낸 특허 분류 기호를 특허 분류 기호 마스트 DB(203)에 질의하여, 상기 특허 분류 기호의 기설정된 단계까지의 상위 특허 분류 기호를 찾아낸다.( H01F 1/03, H01F 1/01, H01F 1/00, H01F를 찾아낸다.) 셋째, 상기 찾아낸 상위 특허 분류 기호를 상기 특허 분류 기호 마스트 DB(203)에 질의하여 상기 찾아낸 상위 특허 분류 기호의 타이틀 정보를 입수한다. 넷째, 상기 첫째부터 셋째 단계까지의 입수한 특허 분류 기호 및 상기 특허 분류 기호의 타이틀 정보를 도트 구조 등의 계층을 표시하는 정보와 함께 결합하여 표시해 준다.

한편, 상기 특허 분류 기호 검색에서 "경질 자성 재료" AND "희토류"로 검색 질의를 했을 경우, 상기 어느 행에서도 "자석"과 "희토류"가 동시에 들어간 행은 없기 때문에 검색 결과를 제공해 줄 수 없다. 하지만, 특허 분류 기호 체계를 고려할 때는 상기 "H01F 1/053 ******희토류 금속을 포함하는 것"가 검색 결과로 출력되어야만 한다. 그러므로, 상기와 같은 문제를 해결하기 위하여, 단순히 행 단위로만 인덱싱을 하면 특허 분류 기호의 체계성을 반영하는 검색 결과를 제공해 주지 못하게 된다. 이를 위해서는 다음과 같이 특허 분류 기호 및 그 타이틀 정보를 변형한다. 변형의 핵심은 각 타이틀 정보에 자신의 상위 특허 분류 기호의 타이틀 정보를 모두 병합시켜 포함시켜 놓는 것이다. 하기 표 23는 그 일 형태를 보여 주고 있다.

[표 23]

IPC 기호	병합된 타이틀 정보
H	전기
H01	전기; 기본적 전기소자;
H01F	전기; 기본적 전기소자; 자석
H01F 1/00	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체
H01F 1/01	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것
H01F 1/03	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것
H01F 1/032	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것
H01F 1/04	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금
H01F 1/047	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금
H01F 1/053	전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금; 희토류 금속을 포함하는 것

한편, 상기는 최상위 특허 분류 기호까지 그 타이틀 정보를 병합시켜 놓았으나, 기설정된 레벨까만 병합시켜 놓을 수 있다. 상기 병합시켜 놓는 기설정된 레벨은 IPC의 경우에는 서브클래스 USPC의 경우에는 클래스, FT의 경우에는 테마, ECLA나 FI의 경우에는 서브클래스인 것이 바람직하다.

상기 특허 분류 기호와 상기 병합된 타이틀 정보를 행 단위로 인덱싱을 해 놓은 경우, 검색어로 "경질 자성 재료" AND "희토류"를 입수 받으면, 검색 결과로 H01F 1/053을 검색 결과로 찾아내 줄 수 있다. 한편, 하나의 특허 분류 기호가 검색 결과로 나왔을 때(예를 들면 상기 H01F 1/053가 나왔을 때), 상기 검색 결과의 모든 또는 기설정된 상위 특허 분류 기호 및 그 특허 분류 기호의 타이틀 정보를 함께 검색 결과로 제공해 줄 수 있음은 전술한 바와 같다. 즉, "경질 자성 재료" AND "희토류"라는 검색어가 입력되었을 때, 하기와 같은 검색 데이터가 검색 결과에 포함되어야 한다.

　　　　6-도트 서브그룹 :　H01F 1/053 ****** 희토류 금속을 포함하는 것

만약, "금속 AND 보자력"이 검색어로 입력되었을 경우, 하기와 같은 검색 결과로 최종적으로 나오는 것이 바람직하다.

　　　　서브클래스　　　　　 : H01F　 자석

　　　　1-도트 서브그룹 : H01F 1/01 * 무기재료로 된 것

　　　　2-도트 서브그룹 :　H01F 1/03 ** 보자력에 의해 특징되는 것

이대, H01F 1/03 주위에 이 특허 분류의 하위 특허 분류를 확장하여 볼 수 있는 수단(예를 들면 (+) 기호/마크 등)이 있고, 사용자가 이 수단을 선택하였을 경우, 하위 특허 분류를 계층적으로 표시하여 주는 것이 바람직할 것이다.

도 16은 본 발명의 특허 분류 기호 검색 모듈(401)이 작동되는 일 구현예에 관한 일실시예적 도면이다. 검색은 특허 분류 기호를 선택받는 단계, 특허 분류 기호를 검색할 검색 언어를 선택받는 단계 및 적어도 하나 이상의 검색어를 입력받는 단계 및 입력 받은 검색식으로 검색을 수행하여, 검색 결과를 생성하는 단계로 이루어진다.

한편, 상기 특허 분류 기호 검색 모듈(401)은 각 특허 분류 기호간의 계층 구조(child-patent) 정보를 활용하여, 상기 병합된 타이틀 정보를 활용하지 않고도 본 발명의 목적을 달성할 수도 있다. 검색어/질의어 입력 결과로 나오는 2 이상의 특허 분류 기호가 있을 때, 이들이 특허 분류 기호 체계 상에서 child-parent 관계가 있는지를 조사함으로써 동일한 목적을 달성할 수 있다.

특허 문건 집합 입수 모듈(404)

이어 본 발명의 특허 문건 집합 입수 모듈(404)에 대해 설명한다. 상기 특허 문건 집합 입수 모듈(404)에는 자동 선정 문건 집합 입수 모듈(404-1)과 사용자 직접 생성 문건 집합 입수 모듈(404-2)이 있으며, 상기 사용자 직접 생성 문건 집합 입수 모듈(404-2)에는 검색식을 통한 문건 입수 모듈(404-2-1)과 IPC 디렉토리 등과 같이 문건 집합이 특정될 수 있는 디렉토리 상에서의 선택을 통해서 문건 집합을 입수할 수 있는 디렉토리 상에서의 선택을 통한 문건 입수 모듈(404-2-2)이 있다. 한편, 특허 문건 집합 입수 모듈(404)은 자신 또는 타인이 생성한 특허 문건 집합을 입수하거나 선택할 수도 있으며, 상기 특허 문건 집합 입수 모듈(404)은 임의의 2개 이상의 특허 문건 집합의 집합 연산(합집합, 차집합, NOT 연산 등 임의의 집합 연산)을 통하여 새로운 특허 문건 집합을 생성하도록 할 수 있다. 상기 검색식을 통한 문건 입수 모듈(404-2-1)에는 검색식의 질의 대상에 따라, 검색 엔진에 질의하는 검색 엔진을 통한 문건 집합 입수 모듈(404-2-1-1)과 DBMS(201)에 질의하는 DBMS(201)를 통한 문건 집합 입수 모듈(404-2-1-2)이 있다. 상기 자동 선정 문건 집합 입수 모듈(404-1)은 본 발명의 명세서 상에서 설명한 특허 문건 집합의 확정에서 소개한 각종 확정된 특허 문건 집합 중 사용자에 의해서 생성된 것을 제외 하고는 자동적으로 입수할 수 있다.

다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)

이어 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)에 대해서 설명한다. 특허 정보에 관한 데이터가 DB로 구축되어 있을 경우, 통상적으로 SQL 쿼리문을 사용하여 원하는 결과를 출력해 낸다. 이때, DB 구조가 잘 설계되어 있더라도, 하나의 결과를 도출해 내기 위해서 다수의 테이블을 조인(join)하여야 하고, 각 테이블의 크기가 클 경우, select문 등을 처리하는데 상당히 많은 시간이 걸린다.

예를 들어, 삼성전자주식회사의 대한민국에서 다출원 IPC 1 dot subgroup별로 연도별 점유율를 구할 경우, 이를 단순 select문으로 구성할 경우, 여러 종류의 테이블(DB 스키마의 설계에 따라 다를 수 있지만 통상적으로 수개 이상의 테이블(예를 들면, 국가별 출원인 테이블, IPC 테이블, 문건 테이블 등)이 join되어야 한다. 먼저 삼성전자의 IPC 1 dot subgroup 레벨에서의 다출원 IPC를 추출해야 하며, 이때, 하위 IPC가 자동적으로 포함되어야 하면 각 IPC별로 하위 IPC를 추출해 내야 한다. 이어, 추출한 1 dot subgroup IPC 에 대하여 삼성전자의 대한민국의 모든 특허 출원 데이터를 기준으로 연도별 출원의 개수를 찾아 낸 다음, 다출원 1 dot subgroup IPC 들을 찾아 낸다. 이어, 찾아낸 다출원 1 dot subgroup IPC 각각에 대한 삼성전자의 출원의 개수와 전체 출원의 개수의 비를 구해 다출원 1 dot subgroup IPC 각각에 대한 삼성전자의 점유율을 구한다. 이를 하나의 SQL 쿼리문으로 작성하면 SQL 쿼리문의 길이가 길 뿐만 아니라, 이를 처리하는데도 오랜 시간이 걸린다. 특히, 본 발명 사상에 도입된 하위 특허 분류 기호에 해당하는 문건을 자동적으로 포함시켜 상기 목적하는 바를 구하기 위해서는 상당히 많은 연산을 수행해야 하며, 이는 응답 속도의 심각한 저해를 가져 온다. 한편, 엘지전자에 대해서 동일한 내용을 처리하거나, IPC subgroup 레벨에서 엘지전자에 대한 점유율을 처리하는 것과 같이 다양하게 변형된 요구 사항이 반복적으로 발생할 가능성이 있게 된다.

이러한 경우, 상기 다양하게 변형된 요구 사항에 부합하도록 특허 정보를 사전에 처리하여 분석 목적에 부합하는 다차원 분석을 위한 연산을 수행하고, 그 결과를 저장한 테이블 데이터가 있는 경우, 그 테이블에 질의하면 응답 속도의 획기적 향상을 가져오게 된다. 다차원 연산에는 롤업 연산이나 큐브 연산 등을 포함하고 있으며, 특허 데이터를 대상으로 한 이러한 연산 수행의 결과는 DB의 테이블에 저장된다. 이때, 상기 테이블을 큐브, 물리적인 뷰(materialized view, 다차원 분석용 연산 수행 결과 테이블), 뷰(view) 등의 다양한 이름으로 불릴 수 있으나, 이름과는 독립적으로 이름이 지칭하는 내용은 동일하다. 상기와 같은 테이블에 대하여 SQL 쿼리를 사용하여 목적하는 데이터를 추출한다. 큐브 연산을 수행한 다차원 결과 테이블을 대상으로 목적하는 데이터를 추출하는 것은 통상 MDX (multidimensional expression) 쿼리를 사용하나, 본 명세서에는 설명의 편의상 모두 SQL로 통칭한다. 즉, 다차원 분석을 위한 롤업 연산을 수행한 결과 테이블에 접근하는 것은 SQL 쿼리로 질의하는 것이 일반적이며, 다차원 분석을 위한 큐브 연산을 수행한 결과 테이블에 접근하는 것은 MDX 쿼리로 질의하는 것이 일반적이나, 본 명세서에서는 양자 모두 다차원 분석을 위한 연산 수행 결과 테이블에 접근한다는 본질은 같고, 또한 SQL 과 MDX가 그 질의 형식 등에서 대동소이함으로, 기술(description)의 편의상 SQL로 질의한다고 한다. 즉, 다차원 분석용 연산 수행 결과 테이블에 SQL로 질의한다는 말의 의미는 1) 상기 테이블이 롤업 연산을 수행해 놓은 것일 경우, SQL 쿼리로 질의한다는 것이며, 2) 상기 테이블이 큐브 연산을 수행해 놓은 것이면 MDX 쿼리로 질의한다는 것으로 분설하여 이해하여야 한다. 한편, 상기에서 다차원(dimension)이란 1개 차원 이상의 차원으로 분석을 수행한다는 것을 의미한다.(1개 차원의 분석도 당연히 포함하는 개념이다.) 본 발명의 다차원 분석용 연산 수행 결과 테이블에는 사용자가 목적하는 분석 결과가 논리적으로 n 단계의 정보 처리를 거쳐 생성된다고 할 때, 1 내지 n-1 단계 또는 n 단계까지의 연산 수행 결과를 저장하고 있게 된다. 통상적인 SQL 질의식 또는 DBMS는 연산 기능이 있기 때문에, 상기 다차원 분석용 연산 수행 결과 테이블에는 중간 단계의 연산 수행 결과까지만 생성해 놓고, 최종적인 분석 결과는 DBMS 또는 SQL 질의식을 통하여 생성할 수 있을 것이다. 이하, 같다.

본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 목적하는 정보를 신속하게 출력해 주기 위해, 특허 정보를 롤업 연산 또는 큐브 연산 또는 기타 목적하는 연산 또는 데이터 처리를 수행하여 그 결과를 테이블로 생성해 놓는 엔진을 말한다. 특히, 상기 테이블을 사용하는 본 발명의 분석 모듈은 롤업(roll-up)이나 드릴다운(drill down) 또는 드릴스루(drill through) 등이 발생할 때, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성해 놓은 테 이블에 간략한 형태의 SQL 질의를 함으로써 신속하게 목적하는 데이터를 생성할 수 있게 된다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204)를 대상으로 하여, 1개 이상의 분석 주제 카테고리별로 롤업 연산 및/또는 큐브 연산을 수행하여 그 결과를 테이블로 생성해 놓는다. 전술한 바와 같이 상기 특허 문건 마스트 DB(202)에는 서지 사항 마스트 DB 등이 있으며, 특허 분류 기호 마스트 DB(203)에는 특허 분류 기호 체계의 종류별로 된 특허 분류 기호 DB 등이 있으며, 주체 마스트 DB(204)에는 출원인 명칭 DB, 발명자 명칭 DB 등이 있으며, 상기 출원인 명칭 DB는 각 국가별로 대표명화 되어 있는 것이 바람직하다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등에 포함된 데이터로 적어도 하나 이상의 분석 주제에 대응하여 상기 분석 주제에 적합한 분석 결과를 생성해 주기 위하여 다차원 분석용 연산을 수행하고 그 결과를 테이블로 생성해 둔다. 상기 테이블은 복수개가 있을 수 있으며, 상기 복수개의 테이블들은 분석 DW(data warehouse)를 구성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 재료로 사용하는 특허 정보 테이블의 DB 스키마는 스타스키마로 구축되는 것이 바람직하다.

스타스키마로 재구축된 테이블들의 E-R 다이어그램(Entity Relationship Diagram)은 중앙에 FACT 테이블이 있고, 상기 FACT 테이블을 참조하는 기준 정보 테이블로서의 차원 테이블(Dimension Table)이 있다. 상기 FACT 테이블에는 특허 문건에 대한 서지사항 데이터(차원 테이블에 있는 데이터는 제외됨, 다만 차원 테이블의 각 차원의 ID가 있음, 예를 들면 특허 문건에 포함된 특정 IPC(들)를 가리키는 IPC_ID, 특정 출원인(들)을 가리키는 출원인ID 등, 날짜에 대응되는 날짜ID들이 적어도 하나 이상씩 포함되어 있음)가 필드별로 포함되어 있는 것이 바람직하다. 상기 차원 테이블에는 특허 분류 기호(IPC는 필수, 국가별 FACT 테이블일 경우, 각 국가별 특허 분류 기호) 테이블, 연도 등의 날짜 테이블, 출원인/대리인/발명자 등의 주체 테이블, 국가/지역/소속 등과 같은 위치 테이블 등, 차원(dimension)에 속할 수 있는 기타 대상들의 테이블이 있다. 한편, 상기 차원 테이블에는 상기 FACT 테이블에 포함된 각종 ID에 상응하는 ID가 포함되어 있는 것은 당연할 것이다. 예를 들면, IPC 차원 테이블에는 IPC_ID가 있으며, 상기 IPC_ID에는 구체적인 IPC가 1개 대응되어 있다. 상기 스타스키마로 재구축된 테이블들은 기본적으로 국가별로 구축되거나, 국가를 통합하여 구축될 수 있을 것이다. 국가를 통합하여 구축할 경우나 기타의 경우에 패밀리 정보 데이터나 INPADOC/DocDB 데이터 등과 같이 여러 국가가 함께 관련되는 것은 별도의 테이블로 관리되는 것이 바람직하다.

본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 스타스키마로 재구축된 특허 정보 테이블의 데이터를 재료로 하여 본 발명의 각종 분석 목적을 위한 다차원 분석용 연산 수행 결과 테이블을 생성한다. 한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 다른 분석 주제 또는 복잡한 분석 주제에 대한 분석을 위하여 상기 생성해 놓은 다차원 분석용 연산 수행 결과 테이블을 재료로 하여 다른 다차원 분석용 연산 수행 결과 테이블을 생성할 수도 있다. 즉, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 재료로 하는 테이블은 1) 스타스키마로 재구축된 특허 정보 테이블, 2) 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204), 3) 다차원 분석용 연산 수행 결과 테이블 중 어느 하나 이상이다. 한편, 설명의 편의상 스타스키마로 상기 1) ~3)을 재구축된 특허 정보 테이블로 통칭하여 설명하나, 2)와 3)이 배제되는 것이 아님은 당연하다 할 것이다.

다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)과 분석 모듈 간의 관계

본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 DW를 생성하는 분석 DW 생성 모듈(402-1)과 분석 주제별 다차원 분석용 연산 수행 결과를 생성하는 각종 모듈 및 기타 본 명세서의 다차원 분석용 연산 수행 결과를 생성하는데 필요한 기능을 수행하는 모듈이 있다. 상기 분석 주제별 다차원 분석용 연산 수행 결과를 생성하는 각종 모듈에는 총량 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈 (402-2), 인용 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-3), 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈 (402-4), 발명자 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-5), 특허 기술 분류별 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-6), 융합 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402- 7), 대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-8) 등이 있다. 상기 각 모듈들은 각각 분석 DW(205 -1), 총량 분석용 다차원 분석용 연산 수행 결과 테이블(205 -2), 인용 분석용 다차원 분석용 연산 수행 결과 테이블(205 -3), 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블(205 -4), 발명자 분석용 다차원 분석용 연산 수행 결과 테이블(205 -5), 특허 기술 분류별 분석용 다차원 분석용 연산 수행 결과 테이블(205 -6), 융합 분석용 다차원 분석용 연산 수행 결과 테이블(205 -7), 대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블(205 -8) 들을 생성한다.

이어, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)과 본 발명의 분석 모듈의 관계에 대하여 설명한다. 상기 분석 모듈은 적어도 하나 이상의 분석 주제별에 대응되는 분석식(SQL 쿼리식)을 포함하고 있으며, 상기 SQL 쿼리식으로 상기 다차원 분석용 연산 수행 결과 테이블에 질의하여 분석 주제별로 목적하는 분석 결과를 입수해 내고, 이를 본 발명의 시스템(1)이 제공하는 인터페이스에 맞게 가공 처리하여 본 시스템의 사용자에게 제공해 준다.

한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 모듈의 성능(목적하는 데이터 추출/계산/입수에 걸리는 시간 감축 및 전산 자원 소모 절약 등)을 감안하여 기설정된 규모/단계 이상의 분석 목적별로 적어도 하나 이상의 테이블을 생성해 놓을 수도 있다. 즉, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 사용자의 화면에 제공되는 최종 분석 결과 화면 데이터까지 생성해 놓을 수도 있지만, 각 분석 주제별로 일정 단계까지만 생성해 놓고(중간 단계까지의 데이터만 생성해 놓고) SQL 쿼리 자체에서 제공하는 각종 명령어들을 사용하여 상기 최종 분석 결과 화면 데이터를 생성하도록 하는 것이 더욱 바람직하다. 이는 상기 최종 분석 결과 화면의 종류가 많을 경우에는 엄청난 비효율(전산 자원의 낭비)를 초래하기 때문에, 후자가 바람직하나, 전자의 방법도 전산 자원의 최적화를 포기한다면(응답 속도의 극대화를 위한다면) 허용될 수도 있을 것이다.

롤업과 드릴 다운

특허 정보 데이터를 상기 물리적인 뷰 데이터로 가공하기 전에 롤업(roll up)과 드릴다운(drill down)의 개념을 설명한다. 롤업과 드릴다운은 데이터 연산에서 기본적인 것이며, 이해의 편의를 위해 예를 들어 설명한다. 다음 표 24과 같은 2006년 출원 데이터가 있다고 가정하자.

[표 24]

2006년	1월	2월	3월	4월	5월	6월	7월	8월	9월	10월	11월	12월
월별출원수	1	2	3	4	5	6	7	8	9	10	1	2

상기와 같은 데이터를 아래와 같이 분기별 및 연도별로 합칠 수 있다. 하기 표 25는 개념적 설명을 위한 것이며, 이러한 롤업에 대한 데이터 구조는 실제의 개발예마다 다를 수 있다.

[표 25]

2006년	1월	2월	3월	4월	5월	6월	7월	8월	9월	10월	11월	12월
월별출원수	1	2	3	4	5	6	7	8	9	10	1	2
분기	1분기			2분기			3분기			4분기
분기별출원수	6			15			24			13
연도	2006
연도별출원수	58

이러한 방식으로 한번에 하나의 차원을 기준으로 한 방향으로만 작은 단위에서 더 큰 단위로 합치는 것을 롤업 연산이라 한다. 즉, 월 단위값을 분기 단위값으로, 분기 단위값을 연도별 단위값으로 합치는 것이 롤업 연산의 한 예가 되며, , 하나의 차원에서 상위 단위로 합쳐진 결과에 접근하는 것/입수하는 것/추출하는 것을 롤업이라 한다.

한편, 2006년의 58건의 데이터는 1분기 6건, 2분기 15건, 3분기 24건, 4분기 13건의 데이터의 합으로 구성된 것이라는 것을 알 수 있으며2006년의 58건을 1분기 6건, 2분기 15건, 3분기 24건, 4분기 13건으로 나눌 수 있고(왜냐하면 원래부터 나누어진 것을 합쳤으므로), 각 분기의 건수를 월별로 나눌 수 있게 된다. 이처럼 하나의 차원에서 더 큰 단위에서 작은 단위로 세분화하여 접근하는 것/입수하는 것/추출하는 것/을 드릴다운이라 한다. 그러므로, 롤업과 드릴다운은 동전의 양면과 같은 것이며, 가장 작은 단위에서 가장 큰 단위까지 데이터를 롤업 연산 등의 다차원 연산을 수행해 놓은 다차원 연산된 데이터가 있다면, 가장 큰 상위 단위에서 하위 단위로 드릴다운하여 데이터를 볼 수도 있게 된다.

통상적으로 큐브 연산된 다차원 분석용 연산 수행 결과 테이블에 접근하여 목적하는 데이터를 입수하는 것을 OLAP(online analytic process)이라 하며, 통상적인 OLAP 엔진은 드릴 다운과 드릴 스루 등의 기능을 지원한다.

롤업과 드릴다운

하기 표를 보면 IPC 등의 특허 분류 기호 체계상에서 주어진 특허 분류 기호에 대하여 직하위 특허 분류 기호에 관한 정보를 확보하는 것의 중요성을 알 수 있다. 특히, 특허 분류 기호의 표기만으로는 상위 및 하위를 구분할 수 있는 특허 분류 기호(예를 들면 IPC의 경우 1dot subgroup 이하의 특허 분류 기호)에 대하여 직하위 특허 분류 기호 정보 입수의 필요성을 역설하는 본 발명의 하위 특허 분류 기호 자동 포함이라는 정보 처리 방법의 중요성에 대해서 실감할 수 있게 된다.

롤업과 드릴 다운의 설명을 하기 표 26를 기준으로 예시적으로 설명한다. 하기 표33은 H04B 7/02를 중심으로 한 특정 기업 A의 특허 출원 수를 나타낸다. 괄호, () 안의 숫자는 A 기업의 출원 특허 문건 중에서 특정 IPC가 나온 문건의 수이다. 한편, 브라켓, {}안의 숫자는 다차원 연산된 숫자이다. 타이틀 정보는 참고를 위하여 부가되었으며, 롤업과는 무관하나, 드릴다운 시 사용자들이 특허 분류 기호만으로는 그 분류 기호가 의미하는 바를 알기 어려우므로, 타이틀 정보를 제공해 주는 것이 타당하며, 특허 분류 기호의 다단계성(하위 특허 분류 기호가 왜 포함되 어야 하는 지)의 이해의 편의를 위해서 부가하였다. 4 dot 서브그룹은 H04B 7/02 밑에 없지만, 특허 분류 기호의 다단계성을 보여 주는 차원에서 참고로 추가하였다. 하기 표를 제외하고는 4-도트 서브그룹과 타이틀 정보는 없앤 표로서 설명할 것이다.

[표 26]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹	4-도트서브그룹	타이틀/IIPC 설명/특허 분류기호 설명
H04B 7/00(2000){2605}					무선전송시스템
	H04B 7/005(64){64}				.전송의 제어 ; 등화
	H04B 7/01(4){4}				.위상편이의 저감
	H04B 7/015(3){3}				.반향효과의 저감
	H04B 7/02(88){207}				.다이버시티(diversity)시스템
		H04B 7/04(57){114}			.. 떨어져 배치된 복수의 독립공중선을 사용한 것
			H04B 7/06(36){36}		...송신국에 있어서의 것
			H04B 7/08(21){21}		...수신국에 있어서의 것
		H04B 7/10(3){3}			.. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
		H04B 7/12(2){2}			..주파수다이버시티 시스템

롤업을 이해하기 위하여 H04B 7/02를 보자. H04B 7/02의 다차원 연산된 숫자는 207(=88+114+3+2)인데, 이 중 88은 특허 문건 중에서 H04B 7/02를 포함하고 있는 문건의 수치이며, 114는 H04B 7/04 및 그 하위 특허 분류에서 기인한 것이며, 3과 2는 각각 H04B 7/06 및 H04B 7/08에서 기인한 것이다. 한편, H04B 7/04의 다차 원 연산된 숫자 114(=57+36+21)인데, 이 중 57은 특허 문건 중에서 H04B 7/04를 포함하고 있는 문건의 수치이며, 36과 21은 각각 H04B 7/06과 H04B 7/08에 기인한 것이다. 한편, H04B7/00에 다차원 연산된 문건은 2650인데, 이는 특허 문건 중에서 H04B7/00를 포함하고 있는 문건의 수치와 이 특허 분류 기호의 하부에 있는 다른 특허 분류 기호에서 다차원 연산된 수치이며, 표 26에 포함된 "..."은 H04B7/00의 하부 특허 분류 기호 중에서 상기 표33에서 표시된 것 이외의 다른 것들이 더 있음을 의미한다.

만약 H04B7/02에 대한 특허 문건 정보를 가져 올 때(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등에서) H04B7/02으로 표기된 정보만을 가져와서는 안됨을 알 수 있다. 왜냐하면, H04B7/02에 대한 특허 정보는 특허 분류 기호 체계의 계층 구조상 H04B7/02 이하에 있는 모든 특허 분류 기호에 대한 특허 정보를 포함해야 함이 더 타당할 것이다.(예를 들면, H04B7/02에 해당하는 기술 영역에 속해 있는 모든 문건을 요청할 경우, H04B7/02가 표기되어 있는 문건 뿐만 아니라, H04B7/02 하위에 있는 모든 특허 분류 기호에 해당되는 문건을 포함하여 출력해 주는 것이 타당하기 때문이다.) 그러므로, 본 발명의 하위 특허 분류 포함 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)가 필요한 이유이다. 상기 표33에서 알 수 있듯이, 만약 특허 문건의 IPC 정보에 H04B 7/08가 있는 경우, 이 문건은 H04B 7/04에도 해당되며, H04B 7/02에도 해당되게 된다. 그러므로, 출원수나 등록수 등의 카운팅의 관점에서 보면, H04B 7/04에 대한 카운팅값은 H04B 7/04 그 자신이 표기된 값과 H04B 7/06가 표기된 값, H04B 7/08이 표기된 값을 합 한 값이 된다.

상기와 같은 롤업 및 드릴다운 모든 IPC 및 모든 기타 특허 분류 기호의 모든 레벨에 대해서도 적용될 수 있을 것임은 자명하다 할 것이다. 각 IPC별 드릴 다운의 예를 다음과 같은 형식이 그 일례가 될 수 있을 것이다.

이어, 하기 표들은 연도별로 드릴 다운하는 경우의 일 실시예를 보여 준다. 바로 위의 표33에 나와 있는 정보를 연도를 기준 방향으로 하여 드릴다운 한다면, 아래 표 27와 같은 데이터가 보여질 수 있을 것이다. 표기의 편의상 다차원 연산된 숫자만 남기며, 데이터가 없는 4-도트 서브그룹도 표시하지 않는다.

[표 27]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹
H04B 7/00(200){2605}

상기에서 H04B 7/00을 하위 특허 분류를 기준 방향으로 하여 드릴다운 한다면, 아래 표 28와 같은 데이터가 보여질 수 있을 것이다.

[표 28]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹
H04B 7/00(200){2605}
	H04B 7/005(64){64}
	H04B 7/01(4){4}
	H04B 7/015(3){3}
	H04B 7/02(88){207}

이때, H04B 7/015에 대하여 드릴다운한다면 H04B 7/015에는 하위 특허 분류 기호 정보가 없으므로, 추가적으로 변하는 것은 아무것도 없을 것이다. 이때, H04B 7/02에 대하여 드릴다운한다면 아래와 같은 표 29와 같은 데이터가 보여질 수 있을 것이다.

[표 29]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹	4-도트서브그룹	타이틀
H04B 7/00(7){37}					무선전송시스템
	H04B 7/005(64){64}				.전송의 제어 ; 등화
	H04B 7/01(4){4}				.위상편이의 저감
	H04B 7/015(3){3}				.반향효과의 저감
	H04B 7/02(88){207}				.다이버시티(diversity)시스템
		H04B 7/04(2){9}			.. 떨어져 배치된 복수의 독립공중선을 사용한 것
		H04B 7/10(2){2}			.. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
		H04B 7/12(3){3}			..주파수다이버시티 시스템

이어, H04B 7/04를 드릴다운 한다면 아래의 표 30와 같은 데이터가 보여 질 수 있을 것이다.

[표 30]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹
H04B 7/00(200){2605}
	H04B 7/005(64){64}
	H04B 7/01(4){4}
	H04B 7/015(3){3}
	H04B 7/02(88){207}
		H04B 7/04(57){114}
			H04B 7/06(36){36}
			H04B 7/08(21){21}
		H04B 7/10(3){3}
		H04B 7/12(2){2}

상기 표 27~표37는 A 기업의 특정 특허 분류 기호에 대한 출원일/출원연도가 롤업되어 있는 결과이다. 즉, 각 다차원 연산된 결과는 과거부터 2000년까지, 2001년, 2002년, 2003년, 2004년, 2005년 및 현재일로부터 1년 6개월 이전이 속하는 연도부터 현재까지 연도까지(약칭으로 "최근"이라 한다.)로 구분 지어 드릴다운 될 수 있을 것이며, 이를 위해 사전에 A 기업의 특허 문건 집합에 대하여 각 연도 단위로 각 특허 분류 기호에 대응되는 문건의 수치값을 롤업해 놓아야 하며, 하기 표 31은 그 일예를 보여 준다.

설명의 편의상 H04B 7/02를 중심으로 연도별 롤업과 드릴다운을 설명한다.

[표 31]

메인그룹	1-도트서브그룹	2-도트서브그룹	3-도트서브그룹	2000이전	2001(+)	2002(+)	2003(+)	2004(+)	2005(+)	최근(2006-현재) (+)	합계(+)
	H04B 7/02(88){207}			25	15	7	30	60	64	6	207
		H04B 7/04(57){114}		10	6	3	10	42	39	4	114
			H04B 7/06(36){36}	3	0	0	3	17	12	1	36
			H04B 7/08(21){21}	5	3	1	5	4	3	0	21
		H04B 7/10(3){3}		3	0	0	0	0	0	0	3
		H04B 7/12(2){2}		0	0	1	0	0	1	0	2

예를 들어, 상기 2001 옆에 있는 (+) 표시(설명의 편의상 드릴 다운이 가능함을 의미하는 표시로 사용되는 기호를 의미함)에 사용자가 클릭 등의 행위를 하면, 본 시스템(1)은 그 행위를 받아들여, 2001년의 하위 차원(예를 들면 분기(quarter)) 별 데이터를 추출하여 사용자에게 제공해 줄 수 있으며, 이는 하기 표 32에 표현되어 있다.

[표 32]

인룹1-도트서브그룹	2-도트서브그룹	3-도트서브그룹	2000이전	2001(+)	01/1Q	01/2Q	01/3Q	01/4Q	2002(+)	합계(+)
H04B 7/02(88){207}			25	15	1	2	4	8	7	207
	H04B 7/04(57){114}		10	6	0	0	6	0	3	114
		H04B 7/06(36){36}	3	0	0	0	0	0	0	36
		H04B 7/08(21){21}	5	3	3	0	0	0	1	21
	H04B 7/10(3){3}		3	0	0	0	0	0	0	3
	H04B 7/12(2){2}		0	0	0	0	0	0	1	2

롤업의 기준 방향과 차원

이어, 본 발명에서 사용되는 차원(dimension)에 대해 더욱 상세하게 설명한다. 통상적으로 시간(time)은 일-주-월-분기-연도 등과 같은 다양한 단위로 롤업 또는 드릴다운의 방향축이 되는 차원이 될 수 있다. 한편, 특허 분류 기호 체계 상의 특허 분류 기호도 롤업 또는 드릴다운의 방향축이 되는 차원이 될 수 있다.

먼저 가장 기본적인 시간 차원으로, 일-주-월-분기-연도-복수 연도 단위 기간에서 선택되는 어느 하나 이상이 될 수 있으며, 출원인, 공개일, 등록일 등과 같은 특허 문건에 포함된 모든 종류의 시간 속성 필드에 상기와 같은 다단계 시간 차원을 적용할 수 있다.

다음으로 특허 분류 기호 차원이 있을 수 있는데, 각 국가별로 적어도 하나 이상의 특허 분류 기호 체계를 도입하고 있는 바, 상기 특허 분류 기호 차원은 특허 분류 기호 체계 자체의 다단계성을 그대로 반영하여 차원을 설정할 수 있다. 한편, 상기 적어도 하나 이상의 선택된 특허 분류 기호들의 묶음을 하나의 단위로 하여, 별도의 차원을 설정할 수도 있다. 예를 들면 RFID라는 큰 주제에 대하여 다단계로 상기 주제에 대응되는 다단계 소주제를 설정하고, 상기 소주제에 상기 특허 분류 기호들의 묶음을 대응시키는 방법으로 별도의 차원을 설정할 수도 있다. 이러한 별도의 차원은 개인화된 다차원 분석용 연산 수행 결과 테이블/개인화된 큐브(personalized cube)-사용자 개개인이 자신의 분석 목적을 달성하기 위하여 만드는 테이블/큐브에 특히 유용하다.

지역도 하나의 차원이 될 수 있다. 지역 단위 중에서 특허 문건으로부터 가장 용이하게 입수할 수 있는 단위는 국가이며, 주소 정보로부터 하나의 국가 내에서의 지역별로 분할하여 다단계 계층을 가지는 차원을 생성해 놓을 수 있다.

주체도 하나의 차원이 될 수 있다. 주체에는 출원인, 발명자, 대리인 등이 있으며, 출원인의 속성(기업, 연구소, 대학 등의 속성), 규모(대, 중, 소 등)와 같은 양적 속성, 그룹-계열사 등의 출원인 간의 속성 등도 차원이 될 수 있다. 한편, 기업 등의 주가, 매출, 이익율 등과 같은 기업 재무 정보나 기업 금융 정보 등도 차원이 될 수 있다. 한편, 글로벌 기업, 로컬 기업 등과 같이 임의로 각 기업마다 대응시킬 수 있는 메타 속성 또한 차원이 될 수 있다.

한편, 출원, 등록, 거절 등과 같은 문건의 현황에 속성도 차원이 될 수 있다. 한편, 각종 카운팅 값을 그룹화시킬 때, 각 카운팅 값이 속하는 그룹도 차원이 될 수 있다. 이러한 그룹의 예로, 청구항 1~5개, 6~10개, 10개~15개, 15개 이상 등과 같은 것이 그 한 예가 되며, 공동 출원인 수, 공동 발명자 수, 패밀리 수(국내 패밀리 수, 해외 패밀리 수 등) 등도 수 그 자체는 차원이 될 수 없지만, 그 수가 그룹화될 때, 그 수가 속하는 그룹은 차원이 될 수 있다.

본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택되는 적어도 하나 이상의 차원별로 다차원 연산을 수행하여 다차원 분석용 연산 수행 결과 테이블을 생성해 놓는다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 다차원 분석용 연산 수행 결과 테이블을 생성할 때, 특허 분류 기호가 차원에 포함되어 있을 경우, 주어진 상기 특허 분류 기호에 대한 다차원 연산 값이 생성될 때, 상기 특허 분류 기호 및 상기 특허 분류 기호의 상위 특허 분류 기호를 함께 고려하여 다차원 연산값을 생성하는 것이다. 이렇게 다차원 연산값이 생성되면, 임의의 특허 분류 기호에 대한 다차원 연산값을 입수할 때, 그 특허 분류 기호 및 그의 하위 특허 분류 기호들에 대한 모든 값들이 다차원 연산된 수치값들이 반영되어 생성된 값을 입수하게 된다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진 특허 문건에 포함된 특허 분류 기호가 있을 때, 상기 특허 분류 기호 뿐만 아니라, 상기 특허 분류 기호의 상위 특허 분류 기호에도 상기 특허 분류 기호에 대한 다차원 연산을 수행한 값을 반영한다. 예를 들면, 문건 번호 #1에 H04B 7/06이라는 IPC가 부여되어 있을 경우, 이 문건으로 다차원 연산 데이터를 생성할 때, H04B 7/06에도 카운팅 값 1을 부여하고, 상기 H04B 7/06은 직상위인 H04B 7/04, H04B 7/02에도 카운팅값을 부여해야 한다. 물론, H04B 7/00이상의 상위 레벨에도 카운팅값이 부여됨은 상식적일 것이다.

이와 같이 롤업과 드릴다운의 방향 축이 되는 것들이 주로 차원(dimension)이 되는데, 이러한 차원으로는 IPC 등의 특허 분류 기호, 시간 등이 대표적이며, 국가, 지역, 출원인, 발명자, 상태, 인용, 패밀리 정보 등도 차원축이 될 수 있다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택된 적어도 하나 이상의 각 차원을 롤업의 대상 축으로 하여 사전에 총량, 점유율, 집중율, 활동율 등과 같은 분석 지표값을 계산해 놓는다.

먼저 공간적으로 볼 때, 전체 국가-개별국가-개별국가 내 지역(특허 정보에는 출원인 및/또는 발명자의 국가 및/또는 주소 정보가 포함되어 있다) 예를 들면, 전체 국가-대한민국-서울특별시-강남구...등과 같이 단계별로 세분화할 수 있다. 이는 시간-도-기--...동일한 방법이 될 것이다.

출원인을 세분화 한다면, 출원인(국가 통합)-각 국가별 출원인으로 세분화할 수 있을 것이며, 모든 국가 통합과 각 국가별 사이에 중간 규모의 지역(북미, 아시아, 유럽, 중동, 남미, 아프리카 등)을 도입할 수 있을 것이다. 중간 규모를 도입하기 위해서는 반드시 북미에 해당하는 국가명(예를 들면, 미국, 캐나다, 멕시코 등)을 북미라는 중간 카테고리에 맵핑(mapping)해 놓아야 한다.

또한, 출원인에서 발명자까지를 롤업/드릴다운해 놓을 수 있는데, 방향은 크게 다음과 같은 것들이 예가 될 수 있다. 1) 출원인(국가 통합)-출원인-각 국가별 발명자로 롤업/드릴다운하거나 2) 출원인(국가통합)-발명자(국가통합)-국가별 발명자로 롤업/드릴다운할 수 있을 것이다. 한편, 하나의 국가 내에서도 출원인의 속성 별로 롤업/드릴다운할 수 있을 것이다. 예를 들면, 출원인을 기업, 대학교, 연구소 등의 조직 유형단위로 나누고, 각각 기업을 대기업, 중견기업, 중소기업으로 나누고, 대학교를 국공립대, 사립대, 전문 기술 대학 등으로 나누고, 연구소를 공공 연구소, 민간 연구소 등으로 세분화시킨 다음 이들에 대해서 롤업/드릴다운할 수 있을 것이다. 이때, 각 출원인에 대하여 맵핑 정보가 있어야 함은 당연할 것이다. 예를 들면, 출원인 A가 기업이고, 그 규모는 중소기업에 속한다는 정보가 맵핑되어 있어야 한다.

이때, 기업 등에 대한 재무제표 데이터가 있는 경우, 보다 다양한 롤업/드릴다운을 할 수 있다. 예를 들면 기업 재무제표로 매출, 이익, 주가 및 이들 각각의 증감율 등에 관한 정보가 있다고 했을 때, 각 기업-매출규모-매출규모 범위별, 기업-이익-이익증감율, 또는 기업-주가-주가증감율 범위 등 다양한 카테고리별로 롤업/드릴다운 할 수 있을 것이다. 즉, 롤업/드릴다운의 본질은 하나의 대상에 대한 복수의 카테고리 정보가 있을 때, 그 카테고리별로 정보 처리 결과를 배치하는 것이다. 하나의 특허 문건에 국가, 시간, 출원인, 발명자, 특허 분류 기호 정보가 있고, 출원인 정보에 그 출원인의 지역 정보가 있다. 그리고, 출원인이 기업일 경우 그 기업의 재무제표 정보 등이 있을 기업 정보 DB로 구축되어 있을 수 있다. 이때, 전체 또는 설정된 임의의 특허 문건 집합 단위로 1) 특허 분류 기호 정보와 같이 하나의 선택된 카테고리가 다단계 계층 구조를 지닐 경우, 그 카테고리 내에서 선택된 특허 분류 기호에 대응되는 각종 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)를 하고 그 결과를 출력해 줄 수 있게 되며, 2) 2종 이 상의 카테고리에 대한 다양한 교집합(카테고리의 종류를 n이라 할 때, 가능한 교집합의 수는 nCr,(n combination r, r은 r은 1 이상이나 n보다 작거나 같다.)이나, 이 모든 조합이 다 선택가능하지는 않을 수 있으며, 특별한 분석적 의미를 가지지 조합도 나올 수 있음은 당연할 것이다)을 기준으로 롤업/드릴다운할 수 있을 것이다.

교집합을 통해 롤업/드릴다운할 경우에는 다음과 같은 점을 주의해야 한다.

첫째는 2개의 카테고리를 사용할 때이다. 예를 들면 A 카테고리(예를 들면 시간), B카테고리(예를 들면 IPC)를 대상으로 롤업/드릴다운할 경우, 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)의 결과 표현의 편의상 1개 방향(예를 들면 세부 IPC로 시간축은 드릴다운하지 않고, IPC만 펼쳐지거나(이에 대해서는 위의 롤업/드릴다운 개념을 설명할 때 예시하였다)으로 드릴 다운하는 것이 바람직하다. 물론, IPC도 드릴다운하고, 시간축도 드릴다운 할 수 있지만, 이 경우에는 결과가 너무 복잡해 보일 수 있으므로, 특별한 경우가 아니면 지양하는 것이 바람직하다. 물론, 롤업은 양향방 모두에 대하여 수행해 놓아야 한다. 즉, 롤업은 카테고리 A의 기설정된 단위와 카테고리 B의 설정된 단위의 모든 조합으로 구성되는 셀에 대한 정보값을 기초로, 각 셀의 A 카테고리 방향으로도 롤업 정보 처리를 해 놓아야 하며, B 카테고리 방향으로도 롤업 정보 처리를 해 놓아야 한다. 상기 바로 위의 표는 그 일례를 보여 주고 있다. 셀 안의 각 수치는 상기 셀에 대한 정보값에 해당하고, {}안의 숫자는 각 특허 분류 기호 레벨에서의 2000년부터 2005년까지의 연도별 특허 건수를 롤업해 놓은 것에 해당하며, H04B 7/02{17}에서 의 17은 H04B 7/02 및 자신의 하위 특허 분류 기호까지의 특허 문건 수를 롤업해 놓은 값이 된다. 위 표에서는 연도를 기준으로 롤업(예를 들어, 2005년의 모든 특허 문건 수가 몇 개다, H04B 7/02에 2005년도에 몇 개다 등은 표시되어 있지 않지만, 이 또한, 롤업되어 표시 될 수 있다는 것은 당연할 것이며, 2005년을 구성하는 분기별, 월별로 다차원 연산된다는 것도 당연할 것이다.)

둘째는 3개 이상의 카테고리를 사용할 때이다. 이 경우에도 드릴다운은 선택되는 한 방향으로 펼쳐지는 것이 바람직하며, 2 방향으로 펼쳐지는 것도 허용될 수 있으나, 3 방향으로 펼쳐지는 것은 시각적으로 표현이 불가능하거나 극히 어려우므로 지양하는 것이 바람직하다. 이 경우에도 롤업은 모든 카테고리에 대해서 계산되어 있는 것이 바람직하나, 롤업 계산량과 사용 빈도에 따라서 사전에 롤업할 필요가 없는 차원축에 대해서는 롤업해 놓지 않고, 사용이 발생하는 시점에서 처리하는 것도 좋을 것이다. 롤업을 해 놓지 않아도 필요로 하는 정보를 그 발생 시점에서 롤업하여 처리할 수 있으나, 롤업 처리를 위하여 상대적으로 긴 시간이 소모될 수 있다. 예를 들어, 연도별로 롤업 처리를 해 놓지 않은 경우라면, 대상이 되는 모든 문건의 서지 사항에서 연도 정보를 입수하고, 연도별로 분리하여 계산하고, 연도별로 출력해 주면 연도별 드릴다운의 효과를 낼 수 있다. 다만, 이를 사전에 연도별로 분리하여 계산하고, 이를 롤업해 놓으면, 나중에 연도별로 드릴다운할 때, 롤업해 놓은 연도별 정보를 단지 읽어와서 디스플레이 해 주면 되어 응답 속도면에서 유리하다.

총량 분석용 다차원 분석용 연산 수행 결과 테이블데이터

이하, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블에 대해 더욱 상세하게 설명한다. 아울러, 상기 다차원 분석용 연산 수행 결과 테이블에 상기 분석 모듈이 어떻게 접근하여 어떠한 데이터를 생성하는지에 대해서도 아울러 설명한다.

통상적으로 특허 문건에 표기되는 출원일 표기가 연월일의 표기가 있으므로, 일단위로 각 특허 분류 기호별로 카운팅이 되어 있는 경우, 이를 월단위, 분기단위, 연단위로 다차원 연산을 수행할 수 있을 것이다.

하기 표 33은 다차원 연산이 수행된 결과 테이블의 일 실시예적 일부분을 보여 준다. 하기 표 33과 같은 데이터는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 스타스키마로 재구축된 특허 정보 테이블에서 출원인과 IPC 및 연도별 날짜 정보를 기준으로 사전에 출원인별, 연도별 다단계 IPC의 각 계층별로 특허 문건의 개수를 카운팅하는 방법으로 생성해 놓은 데이터이다. 표 33과 같은 데이터는 테이블/뷰/물리적인 뷰(materialized view) 등의 임의의 형식으로 저장되어 있을 수 있으며, 저장된 테이블에 포함된 데이터는 적절한 SQL 쿼리문을 사용하여 추출할 수 있다.(예를 들면, 출원인 A의 IPC 1 dot 서브그룹 기준(하기에서는 C5 레벨)에서의 다출원 IPC별 (다차원 연산된)연도별 출원수를 가져오는 것이 그 한 예가 된다. 아울러 출원인별 연도별 출원수를 생성하는 것도 당연할 것이 다.(이를 위해 연도별 총합계 데이터가 있으면 더욱 좋다(하기 표 33에서는 공간 제약상 표시하지 않았음, 없더라도 연도별로 합하면 된다.)) 특히, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 IPC 등의 특허 분류 기호 DB를 참조하여, 와일드카드(*, ? 등)등으로 접근할 수 없는 자신의 특허 분류 기호의 하위 특허 분류 기호에 해당하는 정보를 다차원 연산을 수행해 놓아야 한다.(이는 특히 IPC의 경우 subgroup이하, USPC의 경우에는 class 레벨 미만 FT의 경우에도 타이틀 정보에 dot가 있는 레벨에서 더욱 더 중요하다)

[표 33]

GC	C5	C6	C7	C..	01	02	03	04	05

	H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
	H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
	H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
	H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
	H04B 7/02	H04B 7/04			3	2	2	21	24
	H04B 7/02	H04B 7/04			3	2	2	21	24
	H04B 7/02	H04B 7/04			6	3	10	42	39
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02				9	3	20	18	24
	H04B 7/02				9	3	20	18	24
	H04B 7/02				9	3	20	18	24
	H04B 7/02				15	7	30	60	64

상기 테이블을 설명하면 다음과 같다. AppName은 출원인명을, C밑의 숫자는 IPC의 루트(root) 노드로부터의 노드 계층(C1은 섹션, C2는 클래스, C3는 서브클래스, C4는 메인그룹, C5는 1 도트 서브그룹, C6은 2 도트 서브그룹, C7은 3 도트 서브그룹을 말한다. 이하 C8부터 C20까지가 배정되어 있을 수 있다. 통상적으로 C15 까지면 충분하다.)을, 01, 02 등은 연도를 말한다. 연도는 00년 이전에도 있으며, 이에 대한 숫자는 생략하였다. 현재를 07년으로 볼 경우, 현재까지 공개된 문건을 기준으로 한 출원일 기준의 수치값이 각 셀의 데이터값이다.

한편, 상기 테이블에서 값을 생성할 때, 합계 필드의 각 셀에 들어가는 값은 각 연도별 값의 합산값을 취하면 되고, 회색 기간은 현재일을 기준으로 1년 6개월(통상적인 출원일 이후 강제 공개 기간임) 이전일이 속한 연도부터 현재일까지를 단위 기간으로 하여 그 기간에 속하는 각 연도별 값의 합산값을 취하면 된다.

GID는 어느 레벨까지 다차원 연산된 결과인지를 보여주는데 사용된다. GID 7의 H04B 7/02의 경우는 자기 자신(C5)까지 모두 다차원 연산된 결과(예를 들어 64 = 24+39+0+1)를, 이보다 한단계 낮은 GID 3의 H04B 7/02는 C6레벨까지(자기 자신 제외) 다차원 연산된 결과를 보여 준다. 24는 GID 1에서 나온 값이며, 이 24는 H04B 7/02라는 특허 분류 기호가 표기되어 있는 특허 문건의 숫자를 말한다. GID 값의 표기는 임의 방식일 수 있으나(임의의 약속임) 본 명세서에서는 "2의 n좌승-1"의 수열을 이루는 방식으로 표기했다.

GID는 롤업의 단계를 말하는 것으로 C8 레벨까지의 롤업된 것을 GID 0, C7 레벨까지의 롤업된 것을 GID 1, C6 레벨까지의 롤업된 것을 GID 3, C5 레벨까지의 롤업된 것을 GID 7, C4 레벨까지의 롤업된 것을 GID 15, C3 레벨까지의 롤업된 것을 GID31, C2 레벨까지의 롤업된 것을 GID 63라 표시한다. 이때, C8 레벨 이전 및 C1레벨에서도 GID를 할당할 수 있음은 자명하나, 크게 실효성이 없어 시스템(1)에 반영하지 않아도 무방할 것이다. H04B 7/06에 GID 0은 C8 레벨까지 롤업하였다는 것이며, GID 1은 C7레벨까지 롤업하였다는 것이다.(상기 예에서는 C8에 값이 없으므로 C7까지 롤업된 것과 C8까지 롤업된 값은 같다.)

본 명세서에서 사용하는 GID 및 특허 분류 기호의 레벨과의 대응 관계에 대한 일 실시예이며, 하기 표 34을 중심으로 이에 대해 설명한다.

[표 34]

GID	대상 범위	IPC 레벨	USPC 레벨	FT 레벨	ECLA 레벨
0	C8	4 dot	4 dot	4 dot	4 dot
1	C7	3dot	3dot	3dot	3dot
3	C6	2dot	2dot	2dot	2dot
7	C5	1dot	1dot	1dot	1dot
15	C4	main group	0dot	00 레벨	main group
31	C3	subclass	class	테마코드	subclass
63	C2	class	super category	super category	class
127	출원인	출원인	출원인	출원인	출원인
255	전체	전체	전체	전체	전체

상기 GID는 그 대응 레벨까지의 롤업한다는 것을 의미하는 코드이다. 예를 들면, GID 15는 C4레벨이며, 이는 IPC로 메인그룹, USPC는 0dot, FT로는 00레벨, ECLA로는 메인그룹까지 롤업(자기 자신 및 자신의 하위 모든 특허 분류까지 롤업)한 정보가 그 행에 기록되어 있음을 의미한다. 그러므로, 어느 레벨에서 정보를 보기를 원하는 경우, 그 레벨에 해당하는 GID를 지정하면, 그 레벨까지의 다차원 연산된 정보를 볼 수 있다. 본 명세서에서는 GID라는 약칭을 사용하나, 이는 의미상 "롤업 레벨 코드"라고 할 수 있다. 이상과 이하에서, 롤업 레벨 코드와 GID는 같은 의미로 사용된다. FT에서 00레벨은 통상 AA 등과 같이 뒤에 숫자가 없고 영문자 2자로 된 레벨을 의미한다. 수퍼카테고리란, USPC나 FT 같은 경우에는 각각 class, 테마코드 레벨의 항목이 너무 많아 이를 카테고리별로 그룹핑한 것을 말한다.

상기 표 33에서 알 수 있듯이, 상기 테이블에서 각 행의 각 특허 분류 기호 는 좌측에 자신의 직상위 특허 분류 기호를 갖고 있음을 알 수 있다. 본 발명의 다차원 분석용 연산 수행 결과 생성 모듈은 상기 표 33과 같은 데이터로서 상기 각 IPC 기호마다의 다차원 연산된 수치값을 생성해 낸다. 이러한 것은 특정 출원인 A의 국가별 모든 특허 문건 집합에 대하여 각 특허 문건 집합에 포함되어 있는 모든 특허 분류 기호별로 생성해 놓을 수 있다. 한편, 상기와 표 33과 같은 데이터를 모든 출원 문건을 기준으로 생성해 놓을 수도 있으며, 모든 등록된 문건만을 대상으로 하여 생성해 놓을 수도 있다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 표 33과 같은 다차원 분석용 연산 수행 결과 테이블은 특정한 기설정된 속성을 지니는 문건 집합별로 생성해 놓을 수 있다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 1) 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하는 단계, 2) 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하는 단계, 3) 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하는 단계를 거쳐서 이루어진다. 상기 1) ~2) 단계를 거치면, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 기설정된 처리의 대상이 되는 처리 대상 문건 집합이 생성된다. 상기 FACT 테이블은 모든 문건 전체 집합에 대한 FACT 정보가 포함되어 있다. 상기 FACT 정보에는 문건 고유 정보가 포함되어 있음은 당연하며, 각종 서지 사항 정보가 더 포함되어 있을 수 있다. 상기 문건 고유 정보는 출원번호 또는 문건 고유 코드 또는 문건 일련 코드인 것이 바람직하다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 기설정된 분석 주제별로 국가별 또는 국가 통합별 모든 문건에 대하여 적어도 하나 이상의 기설정된 분석 주제별로 적어도 하나 이상의 상기 다차원 분석용 연산 수행 결과 테이블을 생성하는 것이 바람직하다. 상기 임의의 문건 집합에는 사전에 규정 가능한 적어도 하나 이상의 속성을 공유하는 임의의 문건 집합일 수 있다. 이러한 임의의 문건 집합 종류에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정 하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합 등이 그 예가 될 것이다. 한편, 상기 임의의 문건 집합에는 제1국 이외의 해외 국가에 패밀리 정보가 있는 것에 대해서만 생성해 놓을 수도 있고, 미국의 경우 재발행 특허 문건(reissued document)으로만 이루어지는 문건 집합일 수 있다. 본 문단에서 언급하는 문건 집합은 예시적인 것이며, 이러한 예시적인 것들에 대해서, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 기설정된 분석 주제별로 상기 문건 집합에 대하여 적어도 하나 이상의 기설정된 분석 주제별로 적어도 하나 이상의 상기 다차원 분석용 연산 수행 결과 테이블을 생성하는 것이 바람직하다.

한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 사용자가 생성한 임의의 문건 집합에 대해서도 상기 표 33과 같은 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 1) 상기 사용자가 생성한 임의의 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하는 단계, 2) 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하는 단계, 3) 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하는 단계를 거쳐서 이루어진다.

총량 데이터의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 처리 방법

상기 표와 같은 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기설정된/입수된 문건 집합(예를 들면 특정 국가의 출원 또는 등록된 모든 문건들의 집합)에 대하여 다음과 같은 단계를 처리한다.

첫째, 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하고, 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하고, 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별 다차원 연산용 기초 테이블용 명령어 집합(상기 명령어 집합은 script일 수 있다.)을 입수한다.(이때, 상기 다차원 연산용 기초 테이블을 대상으로 한 분석 주제별 다차원 연산 실행 명령어 집합도 동시에 입수할 수 있을 수 있다.) 만약 특정 국가의 출원 또는 등록된 모든 문건들로 이루어진 특허 문건 전체 집합일 경우, 다른 과정 없이 상기 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하기 위한 분석 주제별 명령어 집합만을 입수한다. 즉, 본 단계에서는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 기설정된 처리를 하기 위한 처리 대상 문건 집합이 확정되고, 기설정된 처리를 하기 위한 분석 주제 별 명령어 집합이 확정되게 된다.

둘째, 상기 처리 대상 문건 집합의 개개의 문건을 대상으로 분석 주제별 명령어 집합을 실행하여 다차원 연산을 위한 기초 테이블을 생성한다. 상기 다차원 연산을 위한 기초 테이블에는 적어도 하나 이상의 차원에 관한 정보를 포함하며, 상기 각 레코드에는 다차원 연산을 수행하기 위한 각 차원별 기초 데이터가 입력되어 있어야 한다. 상기 기초 데이터는 존재 유무(1 또는 null)에 관한 정보(출원/등록이 발생했다, 없었다)에 관한 정보와 각종 카운팅 정보(청구항 수 등 본 명세서에서 카운팅 정보로 언급한 정보들 중 어느 하나 이상)가 포함될 수 있다. 상기 차원은 1) 특허 분류 기호의 종류별 특허 분류 기호 차원 2) 날짜 차원, 3) 위치 차원(국가, 지역 등), 4) 주체의 속성 차원(출원인, 발명자, 대리인 중 선택된 어느 하나 이상에 대한 규모, 속성 등에서 구분되는 차원(예를 들면, 출원인을 기업, 대학, 연구기관, 개인 및 기타로 나누고, 기업을 다국적 기업, 대기업, 중소기업, 등으로 나눌 수 있을 것이다. - 이는 주체 마스트 DB(204)에서 각 출원인의 속성을 참조하여 입수될 수 있다.) 중에서 선택되는 어느 하나 이상 또는 이들 중에서 조합되어 생기는 복합 차원 중 어느 하나 이상이 될 수 있다.

이때, 각 차원에 필요한 서지 사항을 입력하기 위하여 상기 다차원 연산을 위한 기초 테이블에는 필드가 설계되어 있어야 한다. 필드에는 특허 분류 기호 차원에는 IPC일 경우, 섹션부터 n dot 서브그룹, USPC일 경우 (수퍼카테고리부터)class부터 n dot 레벨까지 등과 같이 특허 분류 기호 체계 상의 모든 상위 및 하위 특허 분류 기호를 수용할 수 있도록 각 레벨별 필드가 있어야 한다. 한편, 시 간 차원을 위해서는 분석을 위한 가장 작은 단위의 필드가 있으면 좋다. 특허 분석의 경우, 일 또는 주 단위 분석까지 필요없는 경우라면 월 필드까지만 있으면 충분할 것이다. 한편, 출원인 속성 차원이 있다면, 기업(다국적 기업, 대기업, 중소기업), 대학, 연구원, 개인, 기타에 해당하는 필드가 있어야 할 것이다.

예시로 상기 다차원 연산을 위한 기초 테이블에, 출원인을 기준으로 특허 분류 기호 차원과 출원일 차원만이 포함되어도 충분할 경우, 출원인 A의 2005년 1월 3일에 출원하고, IPC가 IPC가 H04B 7/06인 문건에 대해 하기 표 35와 같은 데이터가 생성되면 된다.

[표 35]

국C1	C2	C3	C4	C5	C6	C7		05/01	05/02	05/03
H	H04	H04B	H04B 7/00	H04B 7/02	H04B 7/04	H04B 7/06		1

한편, 기간과 출원인 속성에 다음과 같이 입력되어도 무방할 것이다. 하기 표 36과 같은 데이터는 연도 및 출원인 속성에서 부분적으로 다차원 연산을 수행해 놓은 것으로 후술하는 다차원 연산 시에 처리될 수도 있지만, 사전에 생성해 놓아도 문제될 것은 없다.

[표 36]

C1	C2	C3	C4	C5	C6	C7	05	05/01	05/02	05/03
H	H04	H04B	H04B 7/00	H04B 7/02	H04B 7/04	H04B 7/06	1	1

한편, 출원인의 위치나 출원인의 재무 레벨 등의 기업 평가, 패밀리 수의 범위를 기준으로 한 패밀리 수 차원, 청구항 수 범위를 기준으로 한 청구항 수 차원 등이 더 포함되어 있을 수 있는데, 이는 하기 표 37와 같이 추가적인 데이터가 포함되어 있으면 된다.

[표 37]

국가	State	City		패밀리 수 범주 1	패밀리 수 범주 2		기업 평가 n-1	기업 평가 n-2		청구항수 범위 1	청구항 수범위 2
Kr	경기도	수원시			1			1			1

상기와 같은 데이터를 생성하는 방법은 다음과 같다. 1) 문건에 포함된 특허 분류 기호를 특허 분류 기호 마스트 DB(203)에 조회하여, 상기 특허 분류 기호의 모든 상위 특허 분류 기호를 입수하고, 상기 입수된 모든 상위 특허 분류 기호를 각각의 레벨에 맞게 입력한다. 예를 들면 IPC가 H04B 7/06일 때는 3 dot 서브그룹(C7) 레벨에는 H04B 7/06, 2 dot 서브그룹(C6) 레벨에는 H04B 7/04, 1 dot 서브그룹(C5)레벨에는 H04B 7/02, 메인그룹(C4)레벨에는 H04B 7/00, 서브클래스(C3)레벨에는 H04B을, 클래스(C2) 레벨에는 H04를, 섹션(C1) 레벨에는 H를 입력한다. 2) 출원일/등록인 등의 각종 날짜 정보 중에서 필요한 기준날짜(여기서는 출원일) 기준으로 시간 차원에 필요한 값을 넣는다. 만약 출원일이 기준 날짜이고, 2005. 1월 3일이고, 시간 차원이 월, 분기, 년의 차원으로 나뉘어 있다면, 2005년에 1월에 1을 입력한다. 3) 기타 서지 사항을 기타 차원에 입력한다. 그리고, 대기업에 1을 입력한다. 주소 정보를 이용하여 출원인의 위치와 같은 필드값을 채우고, 특허 문건 마스트 DB(202)를 조회하여 대상이 되는 특허 문건의 패밀리 수를 조회하고, 그 조회값이 어느 범주에 들어가는지를 판단하여 그 범주에 1을 기록한다. 청구항 수 범위도 패밀리 수와 마찬가지로 처리한다.

하나의 문건에 특허 분류 기호가 2가지 종류 이상이 있을 경우(예를 들면 IPC와 USPC), 각 종류별로 상기 다차원 연산을 위한 기초 테이블을 생성해 놓을 수도 있으며, 하나의 테이블 내에 2가지 종류 이상의 특허 분류 기호를 처리해 놓을 수도 있을 것이다. 한편, 동일한 종류의 특허 분류 기호가 복수개가 문건에 포함되어 있을 경우, 개개의 특허 분류 기호에 대하여 독립적인 레코드를 생성하는 것이 바람직할 것이다. 한편, 만약 출원인이 2 이상의 공동출원인 경우에는 각 출원인별로 동일한 정보를 가지는 레코드를 출원인의 수만큼 생성한다.(만약 주체가 발명자라면 발명자별로 레코드를 생성하고, 대리인 분석을 위한 경우, 주체가 대리인이라면 대리인별로 레코드를 생성한다.)

셋째, 상기 다차원 연산을 위한 기초 테이블을 대상으로 다차원 연산을 수행하고, 다차원 분석용 연산 수행 결과 테이블을 생성한다. 하기 표 38와 같은 테이블의 데이터는 IPC 차원을 기준으로 시간 차원은 연도 차원까지 롤업 연산을 수행한 결과를 보여 주고 있다.(표기의 편의 상 04년도에 대한 것만 분기-연도로 롤업 연산됨을 표시한다.)

[표 38]

C5	C6	C7	C..	01	02	03	04	04/1Q	04/2Q	04/3Q	04/4Q

H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	1	2	3	11
H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	1	2	3	11
H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	1	2	1	0
H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	1	2	1	0
H04B 7/02	H04B 7/04			3	2	2	21	4	4	4	9
H04B 7/02	H04B 7/04			3	2	2	21	4	4	4	9
H04B 7/02	H04B 7/04			6	3	10	42	6	8	8	20
H04B 7/02	H04B 7/10			0	0	0	0
H04B 7/02	H04B 7/10			0	0	0	0
H04B 7/02	H04B 7/10			0	0	0	0
H04B 7/02	H04B 7/12			0	1	0	0
H04B 7/02	H04B 7/12			0	1	0	0
H04B 7/02	H04B 7/12			0	1	0	0
H04B 7/02				9	3	20	18	6	6	6	0
H04B 7/02				9	3	20	18	6	6	6	0
H04B 7/02				9	3	20	18	6	6	6	0
H04B 7/02				15	7	30	60	12	14	14	20

상기 다차원 연산을 수행하는 방법은 롤업 연산을 수행하는 방법과 큐브 연산을 수행하는 방법으로 나뉜다. 차원인 IPC, 날짜, 출원인 기준으로 롤업 연산과 큐브 연산에 대해 각각 설명한다. IPC, 날짜, 출원인 차원이 있을 때, 롤업 연산은 상기 3가지 차원 중 선택된 한 방향으로만 진행되는 반면, 큐브 연산은 3P3(3가지 중 3가지를 선택했을 때 발생하는 순열의 수, 여기서는 6) 방향으로 진행된다. 즉, IPC 차원을 1, 날짜 차원을 2, 출원인 차원은 3이라 했을 때, 롤업 연산은 1->2->3과 같은 한 방향으로만 진행된 것이나, 큐브 연산은 1->2->3뿐만 아니라, 1->3->2, 2->1->3, 2->3->1, 3->1->2, 3->2->1 등 6가지 방향으로 모두 또는 선택된 1이상의 방향으로 진행될 수 있다. 그러므로, 롤업 연산을 할 경우, 1->2->3까지 연산한 결과가 필요없는 경우(최종적으로 출원인의 종류 단위로된 롤업 연산된 결과값이 생성됨), 즉 IPC만 롤업 연산된 결과가 필요하거나, 상기 표 38와 같이 IPC와 날짜 차원까지만 롤업된 연산 결과가 필요할 경우 선택되는 차원 중 어느 하나 이상에 대해서만 목적하는 롤업 방향을 지정하여 롤업 연산을 수행하면 된다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어지는 특허 문건 집합에서, 출원일 정보와 특허 분류 기호 정보를 입수한 다음, 특허 분류 기호 체계가 데이터화 되어 있는 특허 분류 기호 마스트 DB(203) 또는 스타스키마 구조로 재구축된 테이블을 참조하여 상기 입수한 특허 분류 기호의 상위 특허 분류 기호를 추출해 낸다. 상기 추출된 상위 특허 분류 기호 및 출원일의 연도 정보로 상기 표와 같은 정보가 포함되어 있는 다차원 분석용 연산 수행 결과 테이블의 데이터를 완성해 낸다. 이때, 하나의 특허 문건에 특허 분류 기호가 2종류 이상이 있는 경우(예를 들면 미국의 경우, IPC와 USPC가 있음) 각 특허 분류 기호의 종류별로 독립적으로 처리하면 된다. 그리고, 하나의 특허 문건에 단일 종류의 2개 이상의 특허 분류 기호가 들어 있는 경우, 1) 맨 앞의 메인 특허 분류 기호에 대해서만 처리하거나, 2) 모든 특허 분류 기호에 대해서 처리하거나, 3) 메인 특허 분류 기호와 서브 특허 분류 기호에 대한 가중치가 있는 경우, 그 가중치를 반영하여 처리할 수 있다. 이때, 3)의 경우, 수치에 소수점이 나올 수 있으며, 이 경우, 반올림을 하는 것이 타당한 표기 방법일 것이다. 이때, 상기 1), 2) 및 3) 중에서 어느 정책을 취할 지는 선택의 문제이다. 한편, 상기 1), 2) 및 3) 이외에도 다른 정책이 가능할 수도 있음은 물론이다 하겠다. 상기 2)의 방법을 취할 경우, 상기 다차원 분석용 연산 수행 결과 테이블의 라인 수가 늘어나게 되는데, 이는 각 특허 분류 기호마다 적어도 하나 이상의 새로운 데이터 값이 생성되기 때문이다(즉, 서브 IPC에 대해서도 롤업 연산을 해 놓아야 하므로). 한편, 상기 3)의 방법을 취할 경우 수치값이 소수점이 나올 수 있게 된다.

상기 테이블은 특허 지표 중 출원수 또는 등록수와 같은 수량 기준의 지표이다. 본 발명의 하위 특허 분류 기호 포함 롤업/드릴다운과 같은 데이터 처리는 점유율, 집중율, 활동율(AI, Activity Index) 등과 같은 각종 특허 정보 분석 지표에도 활용될 수 있을 것이다.

분석 주제별 다차원 연산용 기초 테이블 없이 다차원 분석용 연산 수행 결과 테이블 생성

상기에서는 분석 주제별 다차원 연산용 기초 테이블을 사용하여 다차원 분석용 연산 수행 결과 테이블을 생성하는 것에 대해 설명하였다. 이때, 상기 분석 주제별 다차원 연산용 기초 테이블은 필수적인 것이 아니며, 스타스키마 구조로 재구축된 테이블이 있는 경우, 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 다차원 분석용 연산 수행 결과 테이블을 생성할 수도 있다. 상기 분석 주제별 다차원 연산용 기초 테이블은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 계산량/정보 처리량을 줄이는 역할을 하기 때문이며, 하나의 상기 분석 주제별 다차원 연산용 기초 테이블이 다수의 테이블 생성에 사용될 수 있기 때문이다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 주제별 다차원 연산용 기초 테이블이 없는 경우에도 상기 스타스키마 구조로 재추축된 테이블로부터 필요한 정보를 입수하고, 이를 가공 처리하여 다차원 연산을 수행할 수 있게 된다.

스타스키마 구조로 재구축된 테이블 없이 다차원 분석용 연산 수행 결과 테이블을 생성

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 스타스키마 구조로 재구축된 테이블이 아닌 상기 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203) 및/또는 주체 마스트 DB(204)로부터 필요한 데이터를 읽어와 상기 분석 주제별 다차원 연산용 기초 테이블을 생성할 수도 있다. 이경우, 상기 분석 주제별 다차원 연산용 기초 테이블을 생성하는 프로그램(스크립트, script 등)이 상대적으로 조금 복잡할 수 있을 것이며, 그 프로그램 전체 또는 그 프로그램을 구성하는 각 모듈의 재활용성이 상대적으로 떨어질 수는 있을 것이다. 예를 들면, 상기 분석 주제별 다차원 연산용 기초 테이블에는 출원번호별로의 자신 및 자신의 상위 모든 IPC들에 대한 정보가 저장되어 있는데, 이러한 상기 정보들을 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 출원번호에 포함된 IPC를 찾고, 상기 찾은 IPC를 상기 특허 분류 기호 마스트 DB(203) 또는 기타 총상위 특허 분류 기호 테이블 등을 조회하여, 상기 찾은 IPC의 상위 모든 IPC들에 대한 정보를 입수해 온 다음, 이를 토대로 상기 분석 주제별 다차원 연산용 기초 테이블을 생성할 수 있을 것이다.

특허 문건 마스트 DB(202)로부터 분석 주제별 다차원 분석용 연산 수행 결과 테이블 생성

상기 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기설정된/입수된 문건 집합(예를 들면 특정 국가의 출원 또는 등록된 모든 문건들의 집합)에 대하여 다음과 같은 단계를 처리한다.

첫째, 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하고 이를 저장한다. 한편, 상기 표 38와 같은 상기 분석 주제별 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여, 재료가 되는 표 35 내지 표 37의 데이터 중 적어도 하나 이상의 데이터를 개별 특허 문건 마다를 대상으로 상기 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203) 및/또는 주체 마스트 DB(204)에서 입수하여 생성하고, 생성된 테이터를 통합하여 이를 메모리에 저장한다. 상기 메모리에 저장된 데이터들은 상기 다차원 연산을 위한 기초 테이블에 저장된 데이터와 동등한 데이터일 수 있다. 즉, 상기 메모리에 저장된 데이터들은 적어도 하나 이상의 차원에 관한 정보를 포함하며, 상기 각 레코드에는 다차원 연산을 수행하기 위한 각 차원별 기초 데이터가 입력되어 있어야 한다. 상기 기초 데이터는 존재 유무(1 또는 null)에 관한 정보(출원/등록이 발생했다, 없었다)에 관한 정보와 각종 카운팅 정보(청구항 수 등 본 명세서에서 카운팅 정보로 언급한 정보들 중 어느 하나 이상)가 포함될 수 있다. 상기 차원은 1) 특허 분류 기호의 종류별 특허 분류 기호 차원 2) 날짜 차원, 3) 위치 차원(국가, 지역 등), 4) 주체의 속성 차원(출원인, 발명자, 대리인 중 선택된 어느 하나 이상에 대한 규모, 속성 등에서 구분되는 차원(예를 들면, 출원인을 기업, 대학, 연구기관, 개인 및 기타로 나누고, 기업을 다국적 기업, 대기업, 중소기업, 등으로 나눌 수 있을 것이다. - 이는 주체 마스트 DB(204)에서 각 출원인의 속성을 참조하여 입수될 수 있다.) 중에서 선택되는 어느 하나 이상 또는 이들 중에서 조합되어 생기는 복합 차원 중 어느 하나 이상이 될 수 있다.

둘째, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 개별 특허 문건 마다의 표 35 내지 표44의 정보 중 적어도 하나 이상이 통합된 상기 메모리에 저장된 데이터를 대상으로 기설정된 분석 주제별로 다차원 연산을 수행하여 상기 표 38와 같은 분석 주제별 다차원 분석용 연산 수행 결과 테이블을 생성한다.

출원인별 IPC 레벨별 랭킹 정보

상기 표 38와 같은 다차원 분석용 연산 수행 결과 테이블이 주어질 때, 상기 분석 모듈은 하기와 같은 분석 결과를 생성할 수 있게 된다.

첫째, 출원인이 입수될 때, 상기 입수된 출원인에 대하여, 특허 분류 기호의 각 레벨별 출원수/등록수 기준 랭킹 정보를 생성할 수 있다. 상기 랭킹 정보는 입수된 출원인의 적어도 하나 이상의 특허 분류 기호의 각 레벨별로 상기 다차원 연산된 출원 또는 등록 문건의 카운트 값을 비교하는 방법으로 랭킹 정보를 생성할 수 있다. 예를 들면, 상기 다차원 분석용 연산 수행 결과 테이블데이터에서 출원인 A의 1dot 서브그룹 레벨(C5 레벨)에서 H04B 7/02의 다차원 연산된 문건의 개수 카운팅값과, 출원인 A의 동일한 1dot 서브그룹 레벨에서의 다른 특허 분류 기호에 대응되는 다차원 연산된 문건의 개수를 카운팅값 등을 비교함으로써, 출원인 A의 1 dot 서브그룹 레벨에서의 각 특허 분류 기호별의 다출원/다등록 랭킹을 구할 수 있 게 된다.

총량 분석 모듈

하기 표 39과 같은 각 출원인별, IPC 레벨별, 연도별 출원(또는 등록) 카운트해 놓은 다차원 분석용 연산 수행 결과 테이블이 있다고 하자.

[표 39]

GC	C4	C5	C6	C7	C..	01	02	03	04	05
	H04B 7/00	H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
		H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
		H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
		H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
		H04B 7/02	H04B 7/04			3	2	2	21	24
		H04B 7/02	H04B 7/04			3	2	2	21	24
		H04B 7/02	H04B 7/04			6	3	10	42	39
		H04B 7/02	H04B 7/10			0	0	0	0	0
		H04B 7/02	H04B 7/10			0	0	0	0	0
		H04B 7/02	H04B 7/10			0	0	0	0	0
		H04B 7/02	H04B 7/12			0	1	0	0	1
		H04B 7/02	H04B 7/12			0	1	0	0	1
		H04B 7/02	H04B 7/12			0	1	0	0	1
		H04B 7/02				9	3	20	18	24
		H04B 7/02				9	3	20	18	24
		H04B 7/02				9	3	20	18	24
		H04B 7/02				15	7	30	60	64

	B29C/100
							..
							..
	H04B						..

상기 다차원 분석용 연산 수행 결과 테이블에는 특정 국가 단위로 모든 출원 인에 대해서 출원인을 기준으로 상기와 같은 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다. 예를 들어 출원인 C의 특정 특허 문건에 포함된 특허 분류 기호 및 출원일(날짜)이 있는 가 있으면, 그 특허 문건의 특허 분류 기호 및 출원일 데이터로 특허 분류 기호 체계를 참조하여 상기 표에 대응되는 특정 셀의 카운트 값을 신설하거나(특허 분류 기호, 출원인(AppName) 등), 숫자의 경우 증가시킬 수 있을 것이다. 상기 표와 같이 특정 국가 단위로 모든 출원인에 대하여 다차원 분석용 연산 수행 결과 테이블을 생성하는 경우, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블로부터 하기와 같은 분석 결과들을 생성할 수 있을 것이다.

먼저 출원인 A의 IPC subclass level 그룹핑된 정보를 보여주기 위해서, 이 레벨에서의 연도별 카운트값을 생성할 수 있을 것이다. 최근 필드의 값은 기설정된 기준일(다차원 분석용 연산 수행 결과 테이블 조회일이 그 예가 될 수 있다.)이 속하는 날짜보다 1년 6개월(18개월)전이 속하는 날)의 해당 연도부터 다차원 분석용 연산 수행 결과 테이블 조회일까지 입수된 특허 문건에서 기인한 카운트 값인 것이 바람직하다. (...해당 카운팅 값을 말한다) 하기 표 40은 그 일례를 보여 준다.

[표 40]

랭킹	IPC subclass	01	02	03	04	05	최근
1	H04B(+)
2	B29C(+)

물론 상기 표 40의 H04B를 드릴다운하면, 출원인 A의 특허 문건 중 특허 분 류 기호가 H04B의 직하위에 있는 특허 분류 기호에 해당되는 문건들에 대한 카운트값이 하기 표 41과 같이 나올 것이다. 이는 상기 표와 같은 다차원 분석용 연산 수행 결과 테이블에서 "AppName = A and IPC level = C4"라는 조건으로 카운팅하면 될 것이며, 정열을 C4를 기준으로 하면 될 것이다.(order by IPC level = C4, C4는 IPC subclass를 의미한다.)

[표 41]

랭킹	IPC subclass	IPC main group	01	02	03	04	05	최근
1	H04B(+)
		H04B 1/00(+)
		H04B 3/00(+)

	B29C(+)

상기 표 41에서 다시 드릴다운하면 1dot subgroup기준에서의 다차원 연산된 카운팅 값이 나오는 것이 직전에서 설명한 바와 같을 것이다. (물론 상기 H04B를 드릴다운하면, 출원인 A의 특허 문건 중 특허 분류 기호가 H04B의 직하위에 있는 특허 분류 기호에 해당되는 문건들에 대한 카운트값이 하기와 같이 나올 것이다. 이는 상기 표와 같은 다차원 분석용 연산 수행 결과 테이블에서 "AppName = A and IPC level = C5"라는 조건으로 카운팅하면 될 것이며, 합산하여 정열하는 것은 C5를 기준으로 하면 될 것이다.(order by IPC level = C5, C5는 IPC main group 를 의미한다.) 상기 각 셀에 있는 카운팅값은 자신의 하위 특허 분류 기호에 해당되는 모든 값들이 다차원 연산된 값이다.

상기에서 H04B 1/00(+)를 드릴 다운하면, 그 하위에 있는 특허 분류 기호가 나올 것이며, 각 셀의 값은 "AppName = A and IPC level = C6"라는 조건으로 카운팅하면 될 것이며, 정열을 C6를 기준으로 하면 될 것이다.(order by IPC level = C6, C6는 IPC 1 dot group 를 의미한다.) 상기 각 셀에 있는 카운팅값은 자신의 하위 특허 분류 기호에 해당되는 모든 값들이 다차원 연산된 값이다. 이와 같이 계속하여 더 이상의 하위 특허 분류 기호가 없을 때까지 드릴 다운할 수 있으며, 추가적으로 드릴 다운할 수 없을 때까지 상기와 같은 조건의 입력으로 필요한 셀 값을 생성할 수 있을 것이다.

상기와 같은 방식은 IPC에 대해서 설명했으나, 이는 USPC, FT, FI, ECLA에 대해서도 마찬가지임은 자명하다 할 것이다.

마찬가지로 상기는 출원(또는 등록 총량)기준으로 다차원 연산된 다차원 분석용 연산 수행 결과 테이블의 생성 방법, 드릴 다운 시의 셀값의 계산 방법 및 계산 값의 표현 방식을 설명하였으나, 이는 점유율, 집중율, 및/또는 활동율에 대해서도 당업자에게는 자명하게 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다.

한편, 상기와 같은 방식으로 특허 분류 기호가 개입되어 있는 기설정된 정의식에 대응되는 다른 분석 지표에 대해서도 동일한 방식으로 다차원 연산된 계산값을 생성할 수 있을 것이며, 드릴 다운 시의 셀값을 계산할 수 있을 것이며, 계산된 값을 표현할 수 있을 것이다.

상기와 같은 다차원 분석용 연산 수행 결과 테이블이 있을 때, 적어도 하나 이상의 특정 특허 분류 기호가 주어졌을 때, 카운트 값이 많은 순위로 출원인들의 랭킹 및 그 출원인들의 연도별 카운트값을 생성할 수도 있을 것이다. 예를 들어 H04B가 주어졌다고 가정했을 때, "IPC level = C4 and C4 = H04B"라는 조건을 주고 출원인 별로 합산하여 정열하는 것은 출원인 별로 수행하면 될 것이다.(order by AppName)

점유율 및 기타 데이터 생성 예

예를 들어 점유율을 "특정 속성을 가지는 목적 문건 집합의 문건 수를 특정 속성을 가지는 전체 문건 집합의 문건 수로 나눈 값"으로 정의한다면 점유율에 대해서도 상기 표 39과 같은 테이블 형식의 데이터를 생성할 수 있을 것이다. 즉, 특정 기업 A의 특정 특허 분류 기호를 대상으로 한 점유율을 구할 경우, 목적 문건 집합은 A의 문건 집합 중 특정 특허 분류 기호를 포함하는 문건 집합이며, 전체 문건 집합은 특정 특허 분류 기호를 포함하는 전체 문건 집합이 될 것이다. 이때, 상기 특허 분류 기호를 포함하는 문건 집합을 구할 때, 그 특허 분류 기호의 하위 특허 분류 기호를 포함하는 문건들도 당연히 포함되어야 함이 마땅할 것이다.

한편, 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 점유율 뿐만 아니라 다른 수식으로 정의될 수 있는 특허 지표에 대해서도 총량 분석과 동일한 방법으로 연산 수행 결과를 저장해 놓을 수 있을 것이다.

이하, 분석 지표를 소개한다. 1.기술혁신 활동의 집중도 분석 지표에는 1)현시기술우위 지수(Revealed Technological Advantage), 2)현시특허우위 지수(Revealed Patent Advantage), 3) 집중률 지수(CRn, Concentration Ratio n), 4) 허핀달 지수(HHI, Herfindahl Index) 등이 있다.

2.기술수준 분석 지표 에는 1) 피인용 가중 특허 수(Patent Count Weighted by Citations), 2) 특허 당 피인용 수(CPP, Cites per Patent), 3) 특허영향 지수(PII, Patent Impact Index), 4) 현재영향 지수(CII, Current Impact Index),

5) 기술력 지수(TS, Technology Strength), 6) 기술순환주기 지수(TCT, Technology Cycle Time), 7) 과학연계 지수(SL, Science Linkage), 8) 특허 당 평균 청구항 수(Average Claims per Patent), 9) 패밀리 규모(Family Size) 등이 있다.

3.협력관계 및 지식흐름 분석 지표에는 1) 공동출원 · 발명 특허 수(Number of Patents with co-applicants, with co-inventors), 2) 샐턴 지수(Salton's Index), 3) 인력 유입률, 유출률(Brain Gain, Brain Drain) , 4) 인용관계를 이용한 지식흐름 분석 지수(Index for Knowledge Flow with Patent Citations)

상기의 특허 지표보다 좀더 응용성이 뛰어난 분석 지표를 추가적으로 더 도입할 수 있으며, 이들 모두는 수식화시킬 수 있을 것이며, 모든 수식은 질의식으로 대응시킬 수 있음은 당업자에게는 자명할 것이다.

기준 랭킹 생성 방법

상기 랭킹의 생성 방법에 관하여 더욱 상세하게 설명한다. 상기 출원인 A가 입수(확정)되면, 제1국 또는 제2국에서의 상기 출원인 A의 문건 집합이 입수(확정)될 수 있고, 그 문건 집합에서 IPC 등을 추출할 수 있으며, 상기 추출된 각 IPC에 서 각 단계별로(섹션에서 n dot 서브그룹까지 모두) 그 각 단계의 IPC별로 해당 문건 수를 카운팅할 수 있게 되고, 상기 카운팅된 값으로 각 IPC 레벨별로 다출원/다등록 총량, 집중, 활동 분야의 랭킹을 계산할 수 있다.(특허 지표 기준 출원인 A의 특허 분류 기호 레벨별의 랭킹 정보 생성에 대해서는 전술한 바가 있다.) 상기 계산된 랭킹으로 랭킹이 높은 분야를 추출할 수 있게 되며, 그 추출된 적어도 하나 이상의 IPC 등의 특허 분류 기호가 상위 랭킹 기술 분야가 될 수 있다. 상기에서 설명한 방법은 하나의 주체(또는 확장하면 속성)가 주어졌을 때, 그 주체에 대한 적어도 하나 이상의 해당 특허 분류 기호의 각 단계별 최빈 특허 분류 기호의 랭킹을 추출하는 방법이 된다.(예를 들면, 발명자, 대리인 등에 대해서도 자신의 명의가 포함된 문건 집합 기준으로 특허 분류 기호 레벨별 랭킹을 동일한 방법으로 생성할 수 있다.)

도 19에서는 출원 기준 또는 등록 기준으로 대한민국, 미국, 일본, 유럽 등의 국가 단위로, 출원/등록수, 점유율, 집중율 및/또는 활동율에 대하여 상기 출원인 단위로 IPC 등과 같은 특허 분류 기호 체계의 각 레벨별로 상기 기준 랭킹이 생성되었다는 것을 보여 주고 있다. 도 19에서 삼성전자의 경우, 대한민국 출원문건 기준으로 IPC 서브클래스 레벨에서는 H01L이 1위, H04N이 2위임을 알 수 있다.

이를 더욱 상세하게 상술하면 다음과 같다. 1) 속성을 공유하는 적어도 하나 이상의 문건 집합을 확정하는 단계(예를 들어 출원인이 A, 또는 출원인 A의 발명자 a 또는 대리인 B, 또는 특정 키워드가 공통적으로 포함됨, 특정 기간이 공통됨, 특정 속성을 가지는 문건 집합의 문건을 인용하거나 인용 당함 등과 같이 적어도 하 나 이상의 속성을 공유하는 경우, 전체 문건 집합에서 그 속성을 공유하는 부분 문건 집합을 SQL 쿼리문 또는 검색 엔진으로의 질의를 통해서 생성할 수 있게 된다.) , 2) 문건 집합을 구성하는 개별 문건에 대하여 적어도 하나 이상의 해당 특허 분류 기호를 추출하는 단계, 3) 추출된 특허 분류 기호를 상기 특허 분류 기호 체계를 참조하여 모든 상위 특허 분류 기호를 입수하는 단계, 4) 상기 모든 상위 특허 분류 기호를 특허 분류 기호의 레벨별(예를 들어, IPC의 경우라면 섹션에서 n dot 서브그룹까지) 저장하는 단계, 5) 저장된 특허 분류 기호를 포함하고 있는 개별 문건을 레벨별로 롤업 연산하여 카운팅하는 단계, 6) 카운팅 결과를 참조하여 기설정된 분석 지표별로 계산을 수행하는 단계(총량 계산, 집중율 계산, 활동율 계산 등 기설정된 분석 지표별로의 계산을 수행하는 단계), 7) 각 분석 지표별로의 특허 분류 기호의 각 레벨별로 롤업을 고려하여 랭킹을 계산하는 단계(SQL 명령문 중에서 rank 명령을 활용하면 된다.)를 거치면, 제1국 또는 제2국에서 적어도 하나 이상의 해당 특허 분류 기호의 각 단계별 최빈 특허 분류 기호의 랭킹을 추출할 수 있게 된다. 이때, 문건 집합이 특정 속성(예를 들어 출원인 A(복수의 출원인 일 수도 있다. 이하 같다)와 같은 출원인 속성 , 최근 5년 등과 같은 기간 한정, 발명자 C와 같은 발명자 한정 및/또는 이들 각 속성의 조합된 속성(출원인 A의 발명자 C 등) 공유하는 것일 수 있음은 당연할 것이다. 출원인별 문건 집합일 경우, 제1국에 속하는 모든 출원인별로, 상기 1)~7)을 계산해 놓을 수도 있을 것임도 자명하다 할 것이다.

본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 1) ~7) 단계 중 일련의 어느 한 단계 이상을 수행하여 다차원 분석용 연산 수행 결과 테이블 데이터로 생성해 놓을 수 있을 것이다.

도 19에서 왼쪽 칼럼에 IPC 서브클래스 레벨의 다출원 기준 IPC별 랭킹이 생성되어 있음에 주목하기 바란다. 본 구현된 실시예적 도면에 나와 있는 수치값들은 상기 분석 모듈에 입력된 값을 전산적인 방법으로 처리한 것이며, 데이터의 보충과 삭제, 변경 등에 따라 가변적이며, 따라서 이는 특정 시점을 기준으로의 실제값과 차이가 있을 수 있다. 그러므로, 본 발명의 발명 사상은 본 명세서에서 각종 표 등에 나온 수치값에 있는 것이 아니라, 그 수치값을 생성하는 구조, 구성, 도구, 방법, 정보 처리 절차, 시스템, 활용 방법 등에 있음을 분명히 한다. 이하, 동일하다.

도 19은 H01L에 계속하여 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다. 드릴 다운 한 경우, 드릴 다운한 것에 대해서만 분석 정보값을 생성한다. 이때, AJAX 기술을 사용하면, 전체 페이지의 리로딩(reloading) 없이 신속하게 변경(드릴 다운)이 일어난 부분에 대한 수치값만을 생성하여 사용자에게 제공해 줄 수 있다. 본 발명에서 사용자는 본 발명의 시스템과의 관계에서는 사용자 컴퓨터(300)로 해석되어야 된다. 즉, 시스템의 입장에서는 1) 사용자에게 제공한다는 것은 실제로는 사용자의 컴퓨터에게 전송한다는 것이며, 2) 사용자가 입력한다는 것은 실제로는 사용자의 컴퓨터로부터 사용자의 입력값을 전송 받는다는 것이며, 사용자의 지정, 특정, 선택 등도 모두 실제로는 사용자의 컴퓨터로부터 사용자가 지정, 선특정, 선택한 정보를 전송받는 것이 되므로, 본 명세서에서는 상기 사용자와 관계된 표현은 모두 이와 같이 해석되어야 함이 타당하다. 다만, 사용자를 중심으로 기술한 이유는 기재의 간편성 때문이다.

도 19는 H01L 21/00 및 기타의 하위 특허 분류 기호에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다. 드릴 다운하여 총량 기준의 분석 결과가 나옴을 알 수 있다. 드릴 다운은 IPC의 최하위까지 가능하며, 데이터가 있는 한 최하위 레벨까지 드릴 다운 된다. 이는 다른 특허 분류 기호에 대해서도 마찬가지일 것이다.

도 31은 본 발명의 특허 분류 기호를 활용한 기술 영역 분석의 일례로서,미국 출원 전체 문건 기준 IPC H04B 및 이들의 하위 분류에 대한 드릴다운을 포함한 출원 총량 분석에 대한 일실시예적 도면이다. 이때, 상기 각 셀의 분석 데이터들은 하위 특허 분류 기호에 대응하는 데이터가 모두 롤업되어 포함되어 있다.

경쟁 분석용 다차원 분석용 연산 수행 결과 테이블

경쟁 분석을 수행하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓는다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떤 과정을 거쳐서 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는지에 대해서 설명한다.

출원인 관점의 경쟁

출원인 관점의 경쟁이란, 그 출원인A가 속한 국가(제1국) 또는 적어도 하나 이상의 다른 국가(제2국)에서의 다른 출원인들B 간의 충돌로 정의될 수 있다. 한편, 출원인 간의 충돌이란 1) 다출원 기술 분야의 공통, 2) 고집중 분야의 공통, 3) 고활동 분야의 공통 등이 있을 수 있으며, 다출원/고집중/고활동 기술 분야에서 기술 분야는 각 레벨별 IPC 등과 같은 각 레벨별 적어도 하나 이상의 특허 기술 분류 기호로 정의되는 분야인 것이 바람직하다. 예를 들어 제 1국에서 출원인 A가 IPC subclass 기준으로 H01L에 다수 출원하고 있을 때, 제1국에서 IPC subclass 기준으로 H01L에 1) 다수 출원하고 있는 자(점유율이 높은 자), 2) 집중율이 높은 출원인, 3) 활동율이 높은 출원인은 경쟁자가 될 수 있다.(제 2국에서 상기 1), 2), 3) 출원인들은 직접적 또는 잠재적 경쟁자가 될 수 있다.) 한편, 출원인 A가 H01L에 집중율 또는 활동율이 높을 때, 제1국 또는 제2국의 상기 1), 2), 3) 출원인들은 경쟁자가 될 수 있을 것이다.

출원인 관점의 경쟁 정보 입수 방법

출원인 관점의 경쟁 정보 입수 방법을 설명한다. 상기에서 출원인 A의 각 국가의 각 분석 지표별(총량, 점유율, 집중율, 활동율 및 기타 등등)의 특허 분류 기호의 레벨별의 랭킹 정보의 생성 방법에 대해서 설명한 바 있다. 예를 들어, 삼성전자주식회사의 대한민국 특허 출원 문건 기준 IPC 1 dot 서브클래스(C5 레벨)에서 H04B 7/02이 다출원 서브클래스 IPC로 선택되었을 때 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 다음과 같은 정보를 생성한다.

입수 받은 IPC H04B 7/02에 대하여 제1국에서 출원 문건 기준/등록 문건 기준으로 1) 다출원/다등록 출원인, 2) 상기 H04B 7/02에 집중율이 높은 출원인, 3) 활동율이 높은 출원인, 또는 4) 기타 특허 분석 지표별 계산값이 높은 출원인을 추출할 수 있다. 상기 추출의 방법은 기본적으로 SQL 쿼리문으로 처리할 수 있다. 이때, 총량, 점유율, 집중율, 활동율 등의 분석 지표를 기준으로, 특허 분류 기호의 레벨별로 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓은 경우, 그 다차원 분석용 연산 수행 결과 테이블 데이터에 간략한 SQL 쿼리문으로 접근하여 목표하는 경쟁 관련성이 높은 적어도 하나 이상의 출원인 정보 및 상기 출원인의 기설정된 기간 단위의 출원/등록량 등의 정보를 입수할 수 있다. 만약, 상기 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓지 않고 있는 경우에는 다음과 같은 순서를 취하는 상대적으로 길고 복잡한 SQL 문을 사용하여 목표하는 정보를 입수한다.

상기 SQL 문의 로직은 1) 입수 받은 특정 레벨의 특허 분류 기호(예를 들면 IPC H04B 7/02) 및 상기 특허 분류 기호의 하위 특허 분류 기호들(상기 하위 특허 분류 기호들은 특허 분류 기호 마스트 DB(203)에 조회하여 입수한다. 이에 대해서는 전술한 바 있다.)을 포함하고 있는 모든 문건을 국가 단위/국가 통합 단위의 특허 문건 마스트 DB(202)로부터 추출하는 단계(이 경우, 동일 문건이 2회 이상 나올 경우 중복을 제거해야 한다.), 2) 상기 추출된 문건의 서지 사항 정보에서 출원인, 출원일/등록일 등의 날짜 정보를 획득하는 단계, 3) 다출원인/다등록출원인 기준으로 소팅하여 다출원인/다등록출원인에 대한 랭킹 정보를 획득하는 단계, 및/또는 4) 출원일/등록일 정보로부터 기설정된 기간 단위의 출원/등록량을 카운팅 하는 단계를 처리하는 명령으로 이루어진다. 물론, 상기 1) ~4) 단계 중 어느 둘 이상은 한꺼번에 처리될 수 있음은 물론이다. 상기 SQL 로직은 총량 기준으로 설명해 놓았지만, 점유율, 집중율 및 활동율 등의 기타 특허 분석 지표에 관해서도 대동소이한 방법으로 처리할 수 있다.

예를 들어, 집중율이 높은 출원인을 찾기 위해서는 상기 2) 단계 후에 출원인 목록을 작성한 다음도 각 출원인의 H04B 7/02에 관한 출원수/등록수를 각 출원인의 모든 출원수/등록수 정보(특허 문건 마스트 DB(202)에서 SQL로 입수할 수 있음)로 나누어 집중율을 계산한 다음, 상기 계산된 집중율로 상기 3) 단계의 소팅을 처리할 수 있을 것이다. 만약, 하기와 같이 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 특허 분류 기호의 레벨별로 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓은 경우에는 간단한 SQL로 처리할 수 있을 것이다.(이러한 간단한 SQL은 당업자에게 극히 용이한 일을 것이다.)

상기 1) 단계에서 주어진 특허 분류 기호의 하위 특허 분류 기호를 입수하는 것이 확장자(*, ? 등)으로서 용이하게 획득할 수 없는 경우에는 상기 1) 단계의 데이터 처리에서 많은 부하가 걸리는 문제가 있다. 그러므로, 이러한 경우 하기 표 55와 같은 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 하위 특허 분류 기호에 관련된 문건의 카운트 정보를 기초로 롤업 연산을 통해서 생성해 놓은 데이터가 더욱 유용하게 된다.

[표 56]

GC	C5	C6	C7	C..	01	02	03	04	05

	H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
	H04B 7/02	H04B 7/04	H04B 7/06		0	0	3	17	12
	H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
	H04B 7/02	H04B 7/04	H04B 7/08		3	1	5	4	3
	H04B 7/02	H04B 7/04			3	2	2	21	24
	H04B 7/02	H04B 7/04			3	2	2	21	24
	H04B 7/02	H04B 7/04			6	3	10	42	39
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/10			0	0	0	0	0
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02	H04B 7/12			0	1	0	0	1
	H04B 7/02				9	3	20	18	24
	H04B 7/02				9	3	20	18	24
	H04B 7/02				9	3	20	18	24
	H04B 7/02				15	7	30	60	64

	H04B 7/02				50	40	30	30	30

상기 표 56와 같은 다차원 분석용 연산 수행 결과 테이블과 같은 데이터가 있을 때는 상기 IPC 1 dot 레벨(C5 칼럼)에서의 H04B 7/02를 가지는 레코드를 추출한 다음, 그 레코드들의 개수를 출원인 필드인 AppName으로 group by하여, 랭킹을 매기면 된다. 이와 같이 하면 A의 H04B 7/02 기준으로 할 때 경쟁 출원인으로 B 등을 추출할 수 있게 되고, B의 연도별/기간별 출원/등록수는 상기 다차원 분석용 연산 수행 결과 테이블에서 생성한 상기 출원인 B의 문건 중에서 H04B 7/02 및 상기 H04B 7/02의 하위 특허 분류 기호를 포함하는 문건을 처리한 값을 읽어서 사용자들에게 제공할 수 있게 된다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 적어도 하나 이상의 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는 단계는 다음과 같다. 먼저 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402) 은 기설정된 경쟁의 종류별로 상기 표 56와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 표65와 같은 형태로 점유율, 집중율, 활동율 또는 기타의 분석 지표로 상기 표65와 같은 테이블/데이터를 생성할 때, 상기 AppName, 특허 분류 기호의 레벨 등은 동등하고, 상기 연도별/기간별 수치값의 내용이 각각 점유율, 집중율, 활동율 또는 기타 분석 지표의 값이 되면 된다.

상기에서는 입수 받은 IPC H04B 7/02에 대하여 제1국에서 출원 문건 기준/등록 문건 기준으로 1) 다출원/다등록 출원인, 2) 상기 H04B 7/02에 집중율이 높은 출원인, 3) 활동율이 높은 출원인, 또는 4) 기타 특허 분석 지표별 계산값이 높은 출원인을 추출하는 방법에 대하여 설명하였으나, 상기 입수 받은 IPC H04B 7/02에 대하여 제2국을 기준으로 동일한 방법으로 상기 1) ~4)를 추출할 수 있을 것이다.(제1국 특허 문건 데이터를 기준으로 제1국에서 처리했던 바와 동일한 방식으로 제2국 특허 문건 데이터를 기준으로 처리하면 된다. 물론, 각 국가마다의 고유의 특허 분류 기호가 있을 경우, 그 기호들도 IPC 처럼 다단계 계층 구조를 가지며, 그 계층 구조는 dot 등의 수에 의해서 구분될 수 있으므로, 그 기호들에 대해서 IPC와 동등하게 처리하면 된다.)

도 33는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준으로 한 대표적 경쟁사 분석에 관한 일실시예적 도면이다. 상기 출원인별 대표적 경쟁사에 대한 분석은 출원인의 다출원 특허 분류 기호 중 IPC 그룹 레벨의 특허 분류 기호를 대상으로 하여, 그 특허 분류 기호들의 랭킹 및 출원량을 구하고, 상기 특허 분류 기호에 다출원하고 있는 출원인의 출원량 정보를 기반으로 기설정된 계산식에 의하여 점수를 매기고, 점수가 높은 출원인을 랭킹과 함께 제공하는 것이다. 상기 대표적 경쟁사 분석은 대표적 경쟁사들의 연도별 출원수/등록수 정보가 함께 나오는 것이 바람직할 것이다. 물론, 상기 출원수/등록수에 클릭을 하게 되면, 상기 출원수/등록수에 내장되어 있는 쿼리식으로 상기 출원수/등록수에 대응되는 문건을 입수하여 간이 분석 모듈(407)로 전송하고, 상기 간이 분석 모듈(407)은 이들 문건에 대하여 간이 분석한 정보를 제공한다. 본 발명의 모든 셀에 나온 수치는 쿼리값에 기반하고 있고, 각 쿼리식으로부터 해당 수치가 나오게 되는 근거 문건을 입수할 수 있게 되어 있다. 이하 모든 셀에 대해 적용된다. 만약 비율값일 경우에는 그 비율을 만들어 내는 수식에 포함된 요소별 수치 각각에 대하여 쿼리가 대응되어 있으므로, 그 쿼리에 기반하여 근거 문건을 입수할 수 있게 된다.

도 33에서 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준 다출원 특허 기술 분류 기호별 경쟁 출원인에 관한 분석의 일실시예를 볼 수 있다. 특정 기술 분류 기호 레벨별, 기술분류 기호별 경쟁출원인을 입수하는 것은 1) 상기 특정 기술 분류 기호 레벨별로 기준 특허 분류 기호들의 랭킹 정보(상기 도 33에서는 1위 H01L, 2위 H04N 등)를 입수하고, 2) 상기 특정 기술 분류 기호 레벨별 기준 특허 분류 기호별(예를 들면 도 33에서 H01L)로 특정 국가(대한민국, 미국, 일본, 유럽 등에서 사용자가 선택하거나 시스템(1)이 자동으로 선택함)에서 출원량이 많거나(출원량 기준), 점유율이 높거나(점유율 기준), 집중율이 높거나(집중율 기준), 활동율이 높거나(활동율 기준) 기타 특허 지표가 높은 출원인을 랭킹과 함께 추출하고, 3) 상기 출원인의 출원수/등록수를 상기 추출한 출원인 정보와 함께 제공해 줄 수 있게 된다. 이때 드릴 다운을 하게 되면, 출원인의 문건이 1개라도 있는 드릴 다운된 특허 분류 기호의 하부 특허 분류 기호에 대하여 상기 1) ~3)을 실시하여 경쟁 출원인에 대한 정보를 제공해 준다. 상기 드릴다운은 최하위 특허 분류 기호까지 드릴다운될 수 있다. 한편, 상기 경쟁사에 대한 것은 IPC뿐만 아니라, USPC, FT 등에 대해서도 동일한 방법으로 수행할 수 있을 것이지만, 국가 선택에는 제한이 있을 것이다.(USPC는 미국 특허 분류 기호이므로, 대한민국과 일본의 특허 문건으로 경쟁 출원인을 입수할 수 없기 때문이다.) 상기 경쟁 출원인은 출원인의 출원 총량 기준으로도 생성할 수 있지만, 출원인의 등록 총량 기준으로도 생성할 수 있을 것이다.

한편, 기준 특허 분류 기호를 제1국에서의 특정 출원인의 특허 문건을 기준으로 생성해 놓고, 상기 기준 특허 분류 기호별로 다출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국이 아닌 제2국에서 추출할 수 있을 수 있다. 상기 제1국 및 제2국의 선택은 사용자에 의해서 선택될 수도 있지만, 시스템(1)에 의해서 default값으로 선택될 수도 있다.

한편, 진입 경쟁 출원인에 대한 분석도 가능하며, 상기 진입 경쟁사에 대한 분석 정보의 생성은 기설정된 최근 기간(예를 들어 최근 7년 이내)의 문건에 대해서만 처리할 수 있을 것이다. 즉, 1) 상기 최근 기간에 출원된/등록된 제1국에서의 출원인의 문건을 기준으로 상기 특허 분류 기호 레벨별 특허 분류 기호의 기준에 관한 정보를 생성하고, 이 특허 분류 기호의 기준별 i) 최근 기간 또는 ii)전체 기간 기준으로 한 다출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국 또는 제2국에서 추출할 수 있을 수 있을 것이다. 2) 전체 기간에 출원된/등록된 제1국에서의 출원인의 문건을 기준으로 상기 특허 분류 기호 레벨별 특허 분류 기호의 기준에 관한 정보를 생성하고, 이 특허 분류 기호의 기준별 i) 최근 기간 기준으로 한 다출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국 또는 제2국에서 추출할 수 있을 수 있을 것이다.

발명자 관점의 경쟁

상기에서는 출원인 관점의 경쟁 정보를 획득하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떻게 데이터를 생성하는가에 대해 설명하였다. 발명자 관점의 경쟁도 출원인 관점의 경쟁을 처리하는 방법(출원인 기준의 문건 집합 단위로, 특허 분류 기호 레벨별로 총량, 점유율, 집중율, 활동율 등과 같은 분석 지표별로 테이블/데이터를 생성해 놓고, 이 데이터에 대해서 출원인 기준으로 접근함)과 동등한 방법(발명자 단위로 문건 집합을 생성하고, 그 발명자별의 문건 집합 단위로 동등한 방법으로 테이블/데이터를 생성한 다음, 이 데이터에 대해 발명자를 기준으로 접근함)으로 생성할 수 있을 것이다. 하기 표 57은 이러한 데이터의 한 예를 보여준다.

발명자 분석용 다차원 분석용 연산 수행 결과 테이블

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 발명자를 기준으로 생성하는 데이터는 2가지 계열이 있을 수 있다. 첫째는 하나의 출원인의 하부 에 발명자를 배치시키고, 그 출원인의 발명자 단위의 문건 집합을 처리하는 방식으로 데이터를 생성하는 방법이며(즉, 출원인 등이 통상적으로 큰 기업이나 조직이며, 그 조직 내에 그 발명자가 있다고 가정하고, 그 발명자를 출원인의 하부에 연동시키는 방법이다. 출원인A AND 발명자1, 출원인A AND 발명자 2 ... 와 같이 상기 조건을 만족시키는 문건 집합별로 데이터를 생성할 수 있을 것이다.), 둘째는 발명자만을 독립적으로(출원인 자리에 발명자가 들어가는 형식)으로 발명자 단위의 문건 집합을 처리하는 방식으로 데이터를 생성한다. 전자에 대한 예시는 자명할 것이므로 후자에 대하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 데이터 형식의 일 실시예를 하기 표 57에서 보여 준다.

[표 57]

IAppName	Inventor	C3	C4	C5	C6	00	01	02	03	04	05
A	a	H04N	H04N 5/00	H04N 5/64	H04N 5/655	0	0	0	1	0	0
A	a	H04N	H04N 5/00	H04N 5/64	H04N 5/655	0	0	0	1	0	0
A	a	H04N	H04N 5/00	H04N 5/64	H04N 5/655	0	0	0	1	0	0
A	a	H04N	H04N 5/00	H04N 5/64		1	2	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/64		1	2	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/64		1	2	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/64		1	2	0	1	0	0
A	a	H04N	H04N 5/00	H04N 5/72		0	1	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/72		0	1	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/72		0	1	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/72		0	1	0	0	0	0
A	a	H04N	H04N 5/00	H04N 5/74		0	1	0	1	1	0
A	a	H04N	H04N 5/00	H04N 5/74		0	1	0	1	1	0
A	a	H04N	H04N 5/00	H04N 5/74		0	1	0	1	1	0
A	a	H04N	H04N 5/00	H04N 5/74		0	1	0	1	1	0
A	a	H04N	H04N 5/00			1	4	0	2	1	0
A	a	H04N				1	4	0	2	1	0

A	b
B	z

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기와 같은 총량 정보가 있을 때, 특정 출원인의 개별 발명자 단위별로 점유율, 집중율, 활동율 등과 같은 데이터를 생성하는 방법은 상기 출원인 단위에서 동등한 정보를 생성하는 방법을 설명하는 곳에서 설명한 바와 같다. 물론, 상기 표 57과 같은 데이터가 모든 출원인에 대한 모든 발명자 정보를 갖고 있을 경우, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 특정 출원인의 하위가 아닌 개별 발명자 단위에서 상기 총량 정보를 기준으로 하여, 점유율, 집중율, 활동율 등과 같은 특허 분석 지표의 값에 대한 데이터를 생성할 수 있을 것이다.

도 35는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 연도별 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다. 상기 특허 분류 기호 레벨별 영역별 발명자 분석은 1) 특정 출원인의 상기 특허 분류 기호 레벨별 특허 분류 기호 기준 랭킹을 생성하는 단계, 2) 상기 특허 분류 기호 기준 랭킹별로 i) 연도별로의 최다출원 발명자를 정보를 계산하는 단계, ii) 연도 통합별로 다출원 발명자의 랭킹(예를 들면, 1위부터 10위 등) 정보를 계산하는 단계 중에서 어느 하나를 실생하는 단계, 3) 상기 실행되어 추출한 발명자 분석 정보를 사용자에게 제공하는 단계로 우리어 진다. 한편, 상기 특허 분류 기호 레벨별 영역별 발명자 분석은 국가 단위로 출원인을 특정하지 않고, 출원 문건 또는 등록 문건을 기준으로 실행될 수도 있다. 이때는 1) 전체 대상 문건을 기준으로 특허 분류 기호 레벨별 특허 분류 기호 기준 랭킹을 생성하는 단계, 2) 상기 특허 분류 기호 기준 랭킹별로 i) 연도별로의 최다출원 발명자를 정보를 계산하는 단계, ii) 연도 통합별로 다출원 발명자의 랭킹(예를 들면, 1위부터 10위 등) 정보를 계산하는 단계 중에서 어느 하나를 실생하는 단계, 3) 상기 실행되어 추출한 발명자 분석 정보를 사용자에게 제공하는 단계로 우리어 진다.

도 36은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 다출원 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다. 발명자 개인별 분석은 국가 단위로 특정 출원인에 관련된 모든 발명자(출원인을 회사로 한 발명자 등)에 대하여 상기 발명자 개인별 분석 정보의 생성은 1) 특정 국가 단위로 상기 출원인에 관련된 모든 출원 문건 또는 등록 문건을 입수하고, 2) 상기 입수된 문건에서 발명자를 추출하고, 3) 발명자별로 문건의 개수를 기설정된 정책에 따라 카운팅하여, 4) 발명자별 랭킹을 생성하고, 5) 상기 랭킹에 따라 최다 발명자별, 연도별/특정 기간별 출원수/등록수 정보를 생성하여 사용자에게 제공한다. 한편, 특정 출원인에 관계하지 않는 경우에는 국가 단위의 모든 특허 문건을 입수하여 상기 2) ~5)를 실행한다. 상기 문건들은 최근 7년 등과 같이 기설정된 기간 동안의 문건만을 대상으로 할 수도 있을 것이다. 이는 본질적으로 문건 집합의 생성의 문제이며, 문건 집합의 생성은 본 명세서의 곳곳에서 언급한 문건 집합의 생성 방법 중에서 선택되는 어느 하나이어도 무방하다.

인용 분석용 다차원 분석용 연산 수행 결과 테이블

인용 분석을 수행하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 인용 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓는다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떤 과정을 거쳐서 인용 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는지에 대해서 미국 특허 출원 제 09/802,847 호(출원인 Samsung Electronics Co., LTD(KR)., 발명의 명칭 User request processing method and apparatus using upstream channel in interactive multimedia contents service, 출원일 2001.3.12)을 예시로 들면서 설명한다.

상기 미국 특허 출원 제 09/802,847호의 서지 사항은 표 42에 나타난 바와 같다.

[표 42]

출원번호	출원일	등록번호	등록일		인용정보(US특허)	IPC	USPC
09/802,847	March 12, 2001	7,302,464	November 27, 2007		5680322 5805804 6044397 6130898 6317131 6611262 6631403 6654761 6654931 6697869 2002/0026642	G06F 15/16 H04N 7/16	709/203 709/217 725/135

이때, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 인용과 관련하여 09/802,847의 서지 사항 정보로부터 다음과 같은 인용 parent-child 데이터를 입수한다. child는 자기 자신의 문건 번호이며, patent는 자기가 인용하고 있는 타 문건 번호를 말한다.(이때, 자신의 문건 번호는 출원번호일 수도 있으며, 등록번호 일 수도 있다. 즉, 자신을 특정화시킬 수 있는 번호이면 좋으나, parent에 공개번호(publication number)나 출원번호가 있을 수 있으므로, 모든 문건이 공통적으로 가지고 있는 번호인 출원번호로 통일하는 것이 바람직하다. 하지만, 등록번호로 통일하는 것도 무방하며, 정보처리의 복잡성이 문제되지 않는다면, 문건의 특정에 문제가 없다면 여러 번호를 혼용하는 것도 무방하다. 본 명세서에서는 설명의 편의상 출원번호로 통일한다.) 하기 표 43에 있는 데이터를 입수 데이터 기준 유닛 인용 parent-child 데이터라 한다.

[표 43]

child-국가	child(출원번호)	parent(입수데이터 그대로)	parent-국가
US	09/802,847	5680322	US
US	09/802,847	5805804	US
US	09/802,847	6044397	US
US	09/802,847	6130898	US
US	09/802,847	6317131	US
US	09/802,847	6611262	US
US	09/802,847	6631403	US
US	09/802,847	6654761	US
US	09/802,847	6654931	US
US	09/802,847	6697869	US
US	09/802,847	2002/0026642	US

상기 표 43와 같이 상기 입수된 인용 parent-child 데이터로부터 하기 표 44과 같이 출원번호로 통일된 인용 parent-child 데이터를 생성한다. parent의 등록번호 및 공개번호(출원번호라도 무방함, 모든 번호 정보에는 document type이 있음. A등록, A1공개 등)로부터 각각의 출원번호를 입수한다.(US에서는 출원번호 또는 출원일련번호라고 칭하나, 이는 명칭일 뿐 그 명칭이 가리키는 데이터의 속성은 동일하다. 이상과 이하에서 출원번호라고 통일해서 설명한다.) 하기 표에 있는 데이터를 통일화된 번호 기준 유닛 인용 parent-child 데이터라 한다. 한편, child와 parent칼럼에 있는 문건의 국가 칼럼들은 그 해당 문건이 관련된(출원되거나 등록된) 출처 국가를 말한다. 이러한 국가는 미국뿐만 아니라 여러 나라 국가가 모두 해당될 수 있다. 이하에서는 설명의 편의상 국가 칼럼은 생략하고 설명하나, 국가 칼럼이 있다고 이해하여야 한다. 한편, 상기 출원번호의 표기 형태는 "두자리수 + / + 6자릿수"나 "연도+6자리 수"등 임의의 표기일 수 있다.

[표 44]

child(출원번호)	parent(출원번호)
09/802,847	08/451,470
09/802,847	08/816,207
09/802,847	09/055,929
09/802,847	08/969,965
09/802,847	09/113,748
09/802,847	09/152,003
09/802,847	09/309,895
09/802,847	09/124,474
09/802,847	09/236,462
09/802,847	09/138,782
09/802,847	09/736393

상기 표 44과 같은 데이터 처리는 주어진 문건 1개를 기준으로 생성하였으나, 상기와 같은 데이터 처리는 주어진 적어도 하나 이상의 문건 집합 단위로 그 문건 집합에 속한 개별 문건 단위로 처리할 수 있을 것이며, 그러한 결과는 표 45에 정리되어 있다. 이때, 개별 분건 집합 단위에서 parent(출원번호)의 중복을 허용할 수 있다.(즉, 1개의 문건 집합에 속하는 문건 1, 문건 2가 모두 인용 정보에 문건 3을 포함하고 있으면, 문건 3의 2회 중복을 허용할 수 있다는 것이다.) 즉, 문건 집합에 속하는 모든 개별 문건에 대한 통일화된 번호 기준 유닛 인용 parent-child 데이터를 생성할 수 있다. 이때, 가장 대표적인 문건 집합이 US 공개 출원 문건 집합 및 US 등록 특허 문건 집합이 될 수 있다. 사용자가 생성한(특정 검색식을 입력한 다음 검색 결과로 출력되는) 문건 집합 및 본 발명을 실시하는 전산 시스템(1)이 자동적으로 그 대상이 될 수 있음은 자명하다 할 것이다.

[표 45]

아울러, 상기 통일화된 번호 기준 유닛 인용 parent-child 데이터에 포함된 모든 문건에 대해 특허 문건 마스트 DB(202)를 조회하면 하기 표 46와 같이 각 문건별로 서지사항을 추가한 데이터를 생성할 수 있을 것이다. 서지 사항의 추가는 서지 사항을 구성하는 모든 요소 중에서 선택된 어느 하나 이상일 수 있다. 하기 표 46는 각 출원번호에 1개씩만 대응되는 서지사항 중 출원일과 등록일이 추가된 데이터를 보여준다.

[표 46]

child 등록일	child출원일	child출원번호	parent 출원번호	parent출원일	parent 등록일
November 27, 2007	March 12, 2001	09/802,847	08/451,470	May 26, 1995	October 21, 1997
November 27, 2007	March 12, 2001	09/802,847	08/816,207	March 12, 1997	September 8, 1998
November 27, 2007	March 12, 2001	09/802,847	09/055,929	April 7, 1998	March 28, 2000
November 27, 2007	March 12, 2001	09/802,847	08/969,965	November 25, 1997	October 10, 2000
November 27, 2007	March 12, 2001	09/802,847	09/113,748	July 10, 1998	November 13, 2001
November 27, 2007	March 12, 2001	09/802,847	09/152,003	September 11, 1998	August 26, 2003
November 27, 2007	March 12, 2001	09/802,847	09/309,895	May 11, 1999	October 7, 2003
November 27, 2007	March 12, 2001	09/802,847	09/124,474	July 29, 1998	November 25, 2003
November 27, 2007	March 12, 2001	09/802,847	09/236,462	January 25, 1999	November 25, 2003
November 27, 2007	March 12, 2001	09/802,847	09/138,782	August 24, 1998	February 24, 2004
November 27, 2007	March 12, 2001	09/802,847	09/736393	December 15, 2000

상기 표 46와 같은 데이터에 각 출원번호별로의 카운트 정보(청구항 수, 도면수, 패밀리 수, 발명자 수, 출원인 수 등 각종 카운팅 정보가 추가적으로 각 카운트 필드별로 추가될 수도 있을 것이다.) 각 출원번호별로 1개씩만 대응되는 사항에 대해서는 1개의 테이블로 생성하는 것이 바람직할 것이다.

이어, 각 출원번호에 2개 이상의 데이터가 대응될 수 있는 필드값으로 상기와 같은 데이터를 생성할 수도 있다. 이들은 출원인, 발명자, 대리인, 특허 분류 기호 등이 될 수 있다. 특허 분류 기호에 대해서는 뒤에서 상술한다. 각 출원번호에 2개 이상의 데이터가 대응될 경우, 1개의 테이블에 모든 필요로 하는 필드값을 다 넣을 수도 있지만, 이렇게 되면 테이블의 크기가 크지는 문제점을 감수해야 한다. 예를 들어 하기 표 47에 있는 09/309,895호는 출원인이 AT'T Corp. (New York, NY)와 Sun Micro Systems (Palo Alto, CA)인데, 이 경우에는 이 출원번호와 관련되 는 아래 표 47과 같은 라인에 출원인 필드가 추가될 때, 하기 표 48과 같이 처리되어야 한다.

[표 47]

child 등록일	child출원일	child출원번호	parent 출원번호	parent출원일	parent 등록일
November 27, 2007	March 12, 2001	09/802,847	09/309,895	May 11, 1999	October 7, 2003

[표 48]

child 등록일	child출원일	child출원번호	parent 출원번호	parent출원일	parent 등록일	출원인
November 27, 2007	March 12, 2001	09/802,847	09/309,895	May 11, 1999	October 7, 2003	AT'T Corp
November 27, 2007	March 12, 2001	09/802,847	09/309,895	May 11, 1999	October 7, 2003	Sun Micro Systems

이처럼, 출원인이 2명이 있다면 행의 개수가 2배 늘어나게 된다. 한편, 상기 출원에 대하여 발명자가 6명이 있다면, 출원인과 발명자를 1개의 테이블에 보여줄 경우에는 12개의 행이 필요하게 된다.(2*6 = 12) 이때, (출원인, 발명자)쌍과 관련된 데이터를 제외한 모든 데이터에서 중복이 일어나게 되는 문제가 있다.(물론, 중복이 있을 경우, 분석 결과(예를 들면 연도별 출원인, 연도별 특정 출원인의 발명자 등)을 가져올 때는 테이블 조인이 없기 때문에 효율적이나, 테이블의 크기가 크지는 문제가 있다.)

참고로, 시간/날짜(date)를 기준으로 한 정보 처리는 롤업을 고려할 때는 다음가 같이 처리되는 것이 바람직하다. 예를 들어 March 12, 2001가 있는 경우, 2001년 3월 12일, 2001년 3월, 2001년 1분기, 2001년과 같이 세분화하여 처리하는 것이 롤업 연산 등에서 바람직하다. 하지만, 본 명세서에서는 표기(한정된 폭의 화 면에 수많은 각종 필드를 모두 표현하는) 문제로 이를 생략하나, 이러한 것은 당업자에게는 자명할 것이다.

한편, 특허 분류 기호와 관련하여, 하위 분류 기호 포함의 관점에서 상기 데이터의 처리를 설명한다. 먼저, 하기 표 49과 같이 child에 해당하는 09/802,847에 대한 데이터처리를 설명하며, 이는 parent에 속하는 문건에 대해서도 동일하게 적용된다. 09/802,847에는 IPC로 G06F 15/16과, H04N 7/16　이 있으며, USPC로 709/203 ; 709/217; 709/231; 725/135이 있다.

[표 49]

출원월2001년 3월	출원년2001	n dot subgroup(C(n+4))	1 dot subgroup(C5)	IPC group(C4)	IPC subclass(C3)	IPC Class(C2)	IPC Section(C1)	child출원번호
1	1		G06F 15/16	G06F 15/00	G06F	G06	G	09/802,847
1	1		H04N7/16	H04N 7/00	H04N	H04	H	09/802,847

상기 표 49에서 C3는 IPC subclass 레벨을 말하며, 다른 것들도 이와 같은 체계임은 상기에서 설명하였다. 2001년 필드의 1은 2001년에 1건이 있다는 말이며, 2001년 3월에도 1이 있는 것은 월단위에서도 그 월에 1건이 있다는 것이며, 상기와 같은 것은 롤업을 고려한 데이터 구조에서는 통상적인 표기 방법이다. 상기의 G06F 15/16 및 H04N 7/16 모두는 1dot subgroup에 속하는 것이었지만, 만약 09/802,847 문건에, H04N 7/169이 포함되어 있다면, 상기 표 49은 다음 표 50와 같이 되었을 것이다.(본 발명 사상의 설명을 위해서 임의로 도입한 내용임)

[표 50]

출원월2001년 3월	출원년2001	3 dot(C7)	2 dot(C6)	1 dot subgroup(C5)	IPC group(C4)	IPC subclass(C3)	IPC Class(C2)	IPC Section(C1)	child출원번호
1	1								09/802,847
1	1	H04N7/169	H04N7/167	H04N7/16	H04N 7/00	H04N	H04	H	09/802,847

USPC를 하위 분류 기호 포함의 관점에서 상기 데이터를 처리하면 하기 표 51과 같을 수 있다.

[표 51]

출원월2001년 3월	출원년2001	USPC n dot level (C(n+4))	USPC 1 dot level (C5)	USPC no dot level (C4)	USPC class(C3)	Meta class (C2)	Meta super class (C1)	child출원번호
1	1		709/203	709/201	709			09/802,847
1	1			709/217	709			09/802,847
1	1		709/231	709/230	709			09/802,847
1	1			725/135	725			09/802,847

USPC 709/203(타이틀 정보 : Client/server)는 직상위인 709/201(타이틀 정 보 : DISTRIBUTED DATA PROCESSING)에 있고, 이는 Class 709에 속한다. 다른 것들도 마찬가지이다. 상기의 USPC 등은 모두는 1dot 또는 no dot 레벨에 속하는 것이었지만, 만약 09/802,847 문건에, 725/45가 포함되어 있다면, 상기 표 51은 다음 표 52과 같이 되었을 것이다.(본 발명 사상의 설명을 위해서 임의로 도입한 내용임)

[표 52]

출원월2001년 3월	출원년2001	4 dot(C8)	3 dot(C7)	2 dot(C6)	USPC 1 dot level (C5)	USPC no dot level (C4)	USPC class(C3)	Meta class (C2)	Meta super class(C1)	child출원번호
1	1
1	1	725/45	725/44	725/39	725/38	725/37	725			09/802,847

IPC가 H04L 12/56, H04L 12/28, USPC가 370/395, 370/235가 할당되어 있다.(상기 IPC는 대한민국 특허청에서 부여한 것과 다를 수 있으나, 각 국가 단위로 데이터를 처리하므로, 미국 데이터의 처리는 미국 특허청에서 부여된 IPC로 처리하는 것이 바람직하다.)

이때, 특허 분류 기호마다 1개의 라인(row)가 만들어지므로, IPC와 USPC는 1개의 테이블에 생성할 수도 있으나, 그렇지 않는 것이 바람직하다. 이는 특히, 복수개의 출원인, 복수개의 발명자 등과 같이 복수개가 있는 경우에는 더욱 더 그러하지만, 본질적으로 1개의 child에 여러 개의 parent가 있기 때문이다. 즉, 1개의 child에 k개의 parent가 있고, 1개 child에 IPC가 m개, USPC가 n개가 있고, 각각의 k개의 parent 문건마다에 각각 IPC와 USPC가 있을 것이므로, 이를 1개의 테이블에 모두 모아 놓는다면, 엄청나게 많은 라인이 필요할 것이며, 이때, 다수의 데이터가 중복되게 될 것이다. 이는 특히 문건 집합의 크기가 클 경우(예를 들어 미국 등록 특허 전체 집합 등)일 경우, 더욱 더 그러하다. 그러므로, IPC와 USPC를 분리하는 것이 바람직하다. 특허 분류 기호와 관련해서, 테이블 유형은 1) 인용 child-parent 데이터에 child쪽 특허 분류 기호에 대해서만 처리해 놓은 유형, 2) 인용 child-parent 데이터에 parent쪽 특허 분류 기호에 대해서만 처리해 놓은 유형 및 3) 인용 child-parent 데이터에 child쪽과 parent쪽 모두에 대해 특허 분류 기호에 대해서만 처리해 놓은 유형이 있을 수 있다. 3)의 경우에는 라인(row)의 수가 증가하는 문제점이 있으나, 테이블 조인의 가능성은 줄어드는 장점이 있다.

즉, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진/기설정된 문건 집합에 속하는 개별 문건별로 유닛 인용 parent-child 데이터를 생성하고, 상기 개개의 유닛 인용 parent-child 데이터에 대하여, child 및/또는 parent에 속하는 개별 문건의 서지사항 중 적어도 하나 이상을 입수하여 그 입수된 서지사항을 필드 내용으로 하는 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓을 수 있다.

상기 주어진/기설정된 문건 집합의 예로 1) 특정 국가의 출원 문건 또는 등록 문건 전체 집합, 2) 특정 IPC/USPC 중 어느 하나 이상으로 된 문건 집합, 3) 특정 출원인별 문건 집합, 4) 특정한 검색식 등으로 생성될 수 있는 검색 기반 생성 문건 집합, 5) 국가 통합 모든 출원 문건 또는 모든 등록 문건 전체 집합 등을 들 수 있다.

이때 상기 1) 하나의 국가 단위에서의 문건 전체 집합에 대하여 하기 표62와 같은 데이터가 생성되어 있으면 다음과 같은 효용이 있을 수 있다. 상기 데이터를 이루는 각 출원번호/등록번호에는 서지 사항이 대등되며, 그 서지 사항 중 어느 하나 이상이 상기 설명과 같이 결합되어 생성될 수 있음은 물론이다 하겠다.

[표 53]

상기와 같은 데이터를 생성하는 방법은 모든 출원/등록 문건을 child 칼럼에 넣고, 각각의 문건마다 그 문건 인용하고 있는 parent문건 번호를 parent에 넣는 방법이다. parent값이 없는 경우에는 null값을 넣으며, 이 경우에는 child 칼럼에만 데이터가 있고, 그 child 문건에 대응되는 parent 문건이 없게 된다. 이 경우, child 칼럼에는 모든 문건 번호가 다 들어가 있게 된다.

설명의 편의를 위하여 가장 간단한 모델을 도입하자. 문건1, 문건 2, 문건 3, 문건 4가 모두 1개씩의 인용 정보를 포함하고 있고, 인용의 순서가 문건1 -> 문건2 -> 문건3 -> 문건 4라고 가정하고(문건 2는 문건 1을 인용하고, 문건 3은 문건 2를 인용하고 있고, 문건 4는 문건 3을 인용하고 있음을 의미함). 이때, 문건 2를 기준으로 하면(문건 2가 child 칼럼에 있음), 문건 1이 문건 2의 parent 칼럼에 존재하게 되며, 문건 3을 기준으로 하면(문건 3이 child 칼럼에 있음), 문건 2가 parent 칼럼에 존재하게 되며, 문건 4를 기준으로 하면 문건 3이 parent 칼럼에 있게 된다. 즉, 문건 1~4가 모두 child 칼럼에 있으며, parent 칼럼에는 적어도 문건 1~3이 있게 된다. 인용의 깊이(문건 4를 기준으로 할 때, 문건 1은 인용 깊이 3, 문건 2는 인용 깊이 2, 문건 3은 인용 깊이 1이 된다.)를 고려할 때, 문건 3과 관련된 전방 인용(backward citation, 문건 3에 포함된 인용 정보로 생성되는 문건 집합)에서 인용 깊이 2까지는 문건 2 및 문건 1이 되며, 후방 인용(forward citation) 깊이 1에는 문건 4가 있게 된다. 이 경우, 문건 1~4가 모두 child에 있기 때문에 어느 문건을 기준으로도 인용 깊이 1의 인용 문건을 parent 칼럼에서 파악할 수 있고, 파악된 인용 문건 번호를 다시 child에서 찾고, 그 찾은 child의 parent를 찾으면, 인용 깊이 2의 인용 문건을 찾을 수 있게 된다. 이러한 모델을 표 54로 설명하면 다음과 같다.

[표 54]

child(출원번호)	parent(출원번호)
2	1
3	2
4	3

상기에서는 문건 1개로 설명하였지만, 이러한 것은 문건 집합에 대해서도 마찬가지임은 자명하다 할 것이다. 이 역시 하기 표 55와 같이 모델로 설명한다. 문건집합3을 기준으로 설명한다.(하기 표 55에서 각 셀(라인 내의 내용)은 실제 다차 원 분석용 연산 수행 결과 테이블의 셀 데이터가 아니라 개념상의 여러 라인의 셀 데이터가 하나의 집합을 이룬다는 의미로 해석되어야 하며, 본 발명 사상의 설명의 편의를 위한 것이다.)

[표 55]

child(출원번호)	parent(출원번호)
문건집합2	문건집합 1(문건집합 2의 모든 parent로 생성되는 집합)
문건집합 3(특정 속성3을 공유함)	문건집합 2(문건집합 3의 모든 parent로 생성되는 집합)
문건집합 4(문건집합 3의 모든 child로 생성되는 집합)	문건집합 3(문건집합 4의 모든 parent로 생성되는 집합)

상기 표 55에서 문건집합 1~4는 모두 child 칼럼의 전체집합의 부분집합이 되게 되며, 문건집합 1~3은 모두 parent 칼럼의 전체집합의 부분집합이 된다. 부분집합이 된다는 말은 그 집합에 속하는 모든 문건이 전체집합에 소속되기 때문에, 전체집합에서 확인가능하며 추출 가능하다는 것이다. 문건 집합이 가지는 속성은 임의의 속성일 수 있으나, 1)출원인 명의, 2) 발명자 명의, 3) 각 단계별 IPC 또는 USPC, 4) 국가, 5) 대리인, 6) 기간 범위(출원일/등록일 범위), 7) 문건의 상태(출원중, 등록, 거절 등) 또는 8) 이들 중 적어도 어느 하나 이상의 조합이 일치하는 것 등이 될 수 있다.

예를 들면, 출원인 Samsung Electronics의 IPC H01L에 속하며, 미국에서 등록된 모든 등록 문건을 문건 집합을 문건 집합 3이라 가정하면, 상기 문건 집합3에 관련된 전방 인용 깊이 1의 모든 인용 문건들로 이루어진 문건 집합2를 추출할 수 있을 것이다. 한편, 상기 문건 집합3에 관련된 후방 인용 깊이 1의 모든 피인용 문 건들로 이루어진 문건집합 4 및, 상기 문건 집합3에 관련된 전방 인용 깊이 2의 문건집합1을 입수할 수 있게 된다. 이때, 상기 문건 집합 1, 문건 집합 2 및 문건 집합 4를 분석할 수 있게 된다. 상기 분석의 대상으로는 1)전방/후방 인용 총량, 2) 전방/후방 다인용 출원인, 3) 전방/후방 다인용 발명자, 4) 전방/후방 다인용 IPC/USPC(각 특허 분류 기호 체계 상의 각 단계별, 드릴 다운은 이미 설명한 바와 같다.), 5)전방/후방 다인용 개별 문건을 찾을 수 있을 것이다. 한편, 상기 1)의 경우, 총량을 연도별/기설정된 기간별로 나누어 표시할 수 있을 것이며, 각종 숫자를 기초로 하여 증감율, 증감속도를 알 수도 있을 것이다. 상기 2)의 경우 다인용 출원인별로 전방/후방 인용량을 총량 및/또는 연도별/기설정된 기간별로 나누어 표시할 수 있을 것이며, 이는 3)~5)에서도 마찬가지일 것이다. 상기 문건 집합 3을 기준으로 분석 대상으로 상리 2) 중 후방 인용 다출원인을 선택하면, 상기 Samsung Electronics의 IPC H01L에 속는 미국 등록 문건을 인용하고 있는 후출원 출원인에 관한 정보를 알 수 있을 것이다. 이러한 후출원 출원인 집합에는 Samsung Electronics가 포함되어 있을 수 있으며, 이는 자기 인용(self citation)이 되며, 상기 자기 인용의 수치값을 다른 수치값으로 나누거나 기설정된 처리하면 자기 인용에 대한 여러가지 분석도 가능할 것이다. 또한, 후출원 출원인을 랭킹별로 보게 되면, 어느 출원인이 상기 Samsung Electronics의 IPC H01L에 속하는 문건을 많이 인용하고 있는지를 알 수 있게 된다. 물론, 상기 분석 결과(후방 인용수)에는 관련된 문건을 입수할 수 있는 링크가 걸려 있으며, 사용자가 그 링크를 클릭하면 관련된 문건(후방 인용 문건)을 특허 문건 마스트 DB(202)에서 입수하여 사용자에게 제 공해 줄 수 있을 것이다.

한편, 하나의 문건 집합이 주어졌을 때(예를 들어 문건 집합3) 상기 문건 집합3의 parent인 문건 집합 2를 찾고, 상기 문건 집합 2에서 기설정된 조건(예를 들면, 최근 10년 내에 출원된 문건 등의 기간 조건 적용)을 만족하는 문건 집합 2'''를 생성하고, 상기 문건 집합2'''를 분석 대상 문건 집합으로 하여 기설정된 상기 적어도 하나 이상의 분석을 수행하고, 그 분석 결과를 생성할 수 있음은 당연하다 할 것이다.

인용 분석 대상 문건 집합의 4종류 구성

4가지 종류

한편, 인용 분석과 관련할 때, 4가지 종류의 분석 대상 문건 집합이 가능할 것이다. 하나의 기준 문건 집합이 주어질 때, 인용과 관련하여 다음 4가지 인용 분석 대상 문건 집합이 확정된다.

도 38는 기준 문건 집합에 대하여 인용 분석과 관련하여 4가지 종류의 분석의 대상이 되는 문건 집합이 생길 수 있음을 보여 주고 있다. 도 38에는 "자사가 인용한 타사 특허(자->타)", "자사를 인용한 타사 특허(타->자)", 타사가 인용한 자사특허(타->자)", "타사를 인용한 자사특허(자->타)"가 나와 있는데, 이들 각각은 하기 첫째 내지 넷째에 순차적으로 대응된다.

첫째, 상기 기준 문건 집합에 포함된 개별 기준 문건이 인용하고 있는 전체 전방(backward) 인용 문건 집합이다. 상기 전체 전방 인용 문건 집합은 기준 문건 각각에 포함되어 있는 인용 정보(reference cited)에 대응되는 모든 문건의 합집합 으로 확정될 수 있을 것이다.(이때, 상기 합집합은 중복을 제거한 합집합일 수도 있지만, 중복을 허용하고 있는 합집합일 수도 있다. 예를 들면, #1번 문건과 #2번 문건이 a문건을 인용 정보로 포함하고 있을 때, a는 카운팅의 입장에서는 2번 인용된 중요 문건일 수 있으므로, 중복을 허용하는 것이 바람직하다.(다차원 분석용 연산 수행 결과 테이블에서 parent에 동일 레코드가 중복되어 존재한다. 즉, parent a에 관계된 레코드가 #1, #2에 기인한 2개 존재함). 한편, 단순히 a의 존재(출원인, 날짜, 기타 서지 사항)의 입장에서는 중복을 제거하는(합집합 연산을 수행하여) 것이 바람직할 것이다. 본 발명의 분석에서는 카운팅이 중심이 되므로, 중복을 허용하는 것이 더 타당하다.)

둘째, 상기 기준 문건 집합에 포함된 개별 기준 문건을 인용하고 있는 전체 후방(forward) 인용 문건 집합이다. 상기 전체 후방 인용 문건 집합을 구하는 방법은 1) 개별 기준 문건을 인용하고 있는 문건 번호를 검색하고, 이를 합하는 방법 또는 2) 상기 전체 특허 문건에 대하여 생성한 child-parent 테이블에서 기준 문건 번호를 parent 칼럼에서 찾고, parent 칼럼에 있는 기준 문건 번호에 대응되는 child 문건 번호(2개 이상 있을 수 있음)를 child 칼럼에서 찾아서 이들을 합하는 방법이 있다. 2)의 방법이 더욱 바람직하다.

셋째, 전체 후방 인용 관련 기준 문건 집합이다. 이 문건 집합은 기준 문건 집합을 구성하는 모든 기준 문건 중에서 타 문건에 의해 인용을 당한 적이 있는 모든 기준 문건으로 구성되는 문건 집합이다. 이 문건 집합은 상기 둘째 문건 집합의 parent로 구성되는 문건 집합이다.

넷째, 전체 전방 인용 관련 기준 문건 집합이다. 이 문건 집합은 기준 문건 집합을 구성하는 모든 기준 문건 중에서 인용 정보를 포함하고 있는 기준 문건으로 구성되는 문건 집합이다. 이 문건 집합은 상기 첫째 문건 집합의 child로 구성되는 문건 집합이다.

상기 도 39의 최상단 탭에는 1) "특허 문건 전체 집합에 대한 인용분석", 2) "기술영역별 인용 정밀분석", 3) "발명자별 인용 분석" 및 4) "다인용 개별 문건별 인용 분석"이 있는데, 이들은 모두 기준 문건 집합의 확정과 관련있다. 상기 1)"특허 문건 전체 집합에 대한 인용분석"은 출원인 또는 본 발명의 문건 집합의 확정과 관계된 모든 문건 확정 방법 중에서 선택되는 어느 하나에 의해 확정된 기준 문건 집합으로서의 특허 문건 전체 집합을 의미한다. 상기 2) "기술영역별 인용 정밀분석"은 상기 특허 문건 전체 집합을 특허 분류 기호(IPC, USPC 등)의 레벨별 특허 분류 기호 기준 랭킹별로 정리된 특허 분류 기호별로 세분화된 문건 집합을 상기 기준 문건 집합으로 한다는 것을 의미한다. 상기, 3) "발명자별 인용 분석"은 상기 특허 문건 전체 집합에서 발명자를 추출한 다음, 랭킹을 계산하고, 랭킹이 높은 발명자별로 세분화된 문건 집합을 상기 기준 문건 집합으로 한다는 것을 의미한다. 상기 4) "다인용 개별 문건별 인용 분석"은 상기 특허 문건 전체 집합에 포함된 모든 문건에 대하여 인용/피인용 개수를 조사한 다음, 인용/피인용 랭킹이 높은 문건 을 추출하고, 개개의 문건을 기준 문건 집합으로 한다는 것을 의미한다.

다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기준 문건 집합이 확정되면, 상기 기준 문건 집합에 대응하여 상기 인용 분석 대상 문건 집합으로서의 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합, 3) 전체 전방 인용 관련 기준 문건 집합, 및/또는 4) 전체 후방 인용 관련 기준 문건 집합을 확정하고, 상기 1)~4) 중 어느 하나 이상의 문건 집합에 대하여 본 명세서에서 기술하고 있는 다차원 분석용 연산 수행 결과 테이블을 생성하고, 이를 저장한다.

인용 분석의 결과

본 발명의 상기 분석 모듈은 상기 확정된 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합, 3) 전체 전방 인용 관련 기준 문건 집합, 및/또는 4) 전체 후방 인용 관련 기준 문건 집합별을 대상으로 한 상기 분석 주제별로의 다차원 분석용 연산 수행 결과 테이블에 대하여 기설정된 분석식으로 분석 결과를 입수한다. 한편, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블이 아닌 상기 1)~4) 중 어느 하나 이상의 문건 집합에 대한 에서 본 발명의 명세서에서 기술하고 있는 각종 분석을 수행할 수도 있지만, 이 경우에는 다차원 연산 결과를 얻을 수 없거나, 이러한 다차원 연산 결과를 얻기 위해 전산 자원을 많이 소모해야 하는 문제점이 있어 크게 바람직하지는 않다.

상기 분석 모듈은 상기 1) ~4)의 문건 집합별로 생성되는 상기 다차원 분석 용 연산 수행 결과 테이블에 접근하여 기설정된 분석식으로 목적하는 인용 분석 결과를 추출해 낸다. 상기 목적하는 인용 분석 결과에는 다음과 같은 것들 있을 수 있다.

첫째, 출원인을 중심으로 한 것으로 i) 출원인 랭킹, ii) 출원인별의 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위의 랭킹, iii) 다발명자 랭킹, iv) 문건 출현 빈도 기준 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다. 즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있을 것이다.

둘째, 특허 분류 기호를 중심으로 한 것으로 i) 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위의 랭킹, ii) 레벨별 특허 분류 기호에 속하는 출원인, iii) 레벨별 특허 분류 기호에 속하는 발명자 들의 랭킹, iv) 레벨별 특허 분류 기호에 속하는 문의 문건 출현 빈도 기준 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다.

즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있을 것이다.

셋째, 출원인 속성(출원인의 종류(기업, 대학, 개인 등), 기업일 경우 재무 속성, 기업 평가 지표 등)을 기준으로 한 것으로, i) 출원인의 종류, ii) 매출액 등과 같은 기업 규모 평가 지표별, iii) 연평균 이익율 등과 같은 기업 재무 평가 요소별 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다. 즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있을 것이다.

넷째, 상기 첫째 내지 셋째에서 수치값 데이터가 있을 때 이들의 증감율, 증감 속도 등의 변화값에 대한 데이터들이다.

상기 인용 분석을 위하여 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 (출원인 인용 기준) 인용 분석용 다차원 분석용 연산 수행 결과 테이블은 주로 출원인이 자신의 문건에서 인용한 특허 문건을 대상으로 생성되었다. 한편, 상기 심사관 인용 문건에 대해서도 동일한 다차원 분석용 연산 수행 결과 테이블을 생성해 놓을 수 있음은 자명할 것이다. 즉, 심사관이 심사 과정에서 특정 출원 문건(child 문건이 된다)에 대하여 심사 과정에서 인용한 문건을 상기 출원 문건의 parent 문건으로 보게 되면, 상기 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 모든 작용과 그 결과물로서의 (심사관 인용 기준) 인용 분석용 다차원 분석용 연산 수행 결과 테이블 및 상기 결과물을 이용하는 방법은 상기에서 출원인 인용 문건 기준으로 한 것과 완전히 동등하게 된다. 한편, 통합적인 인용 분석을 위하여, 하나의 출원 문건을 기준으로 출원인 인용 문건(parent)과 심사관 인용 문건(parent 2)을 합집합 연산하여 통합 인용 문건집합(parent-combined)을 생성할 수 있게 되고, 상기 통합된 인용 문건 집합을 대상으로 상기에서 출원인 인용 문건을 기준으로 한 것과 동일한 처리를 수행하면, 동등한 결과물을 얻게 되고, 상기 동등한 결과물을 이용하는 방법도 동등하게 된다. 본 문단에서 설명한 것은 출원인 인용 문건 기준으로 설명한 바를 참고하면, 당업자에게 자명하므로, 별도로 장황하게 중복하여 설명하지는 않는다.

이어 도면을 참조하면서 더욱 상세하게 설명한다.

도 38은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 도 38에서는 총량탭이 선택되어 있음을 보여준다. 본 명세서에 첨부된 도면 중 분석 화면에 대한 구현예적 실시예에서 각종 탭들이 나오는데, 상기 탭의 글씨가 굻게 되어 있는 것은 선택된 탭이라는 것을 의미한다. 상기 탭의 종류는 기본적으로 1) 출원 문건 기준이냐 등록 문건 기준이냐와 같은 문건 집합의 확정 시의 문건 집합의 속성에 관한 기준, 2) 출원/등 록 총량 기준, 점유율 기준, 집중율 기준, 활동율 기준 또는 기타 분석 지표별 기준, 3) 대한민국, 미국, 일본, 유럽 등과 같은 국가 확정과 관계된 기준, 총량, 출원인, 발명자, 기술, 개별 문건 등과 같은 분석의 목적이나 주체에 관한 기준, 5) 각종 수치값, 수치값의 증감율, 수치값의 증감 속도에 대한 기준, 6) IPC, USPC, FT, FI, ECLA 등과 같은 특허 분류 기호의 선택과 각 선택된 특허 분류 기호의 레벨에 관한 기준 등이 있을 수 있다.

도 39는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 40은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 이때, 상기 IPC들은 드릴 다운될 수 있음은 물론이며, 이때에도 드릴 다운과 관계된 하위 특허 분류 기호에 대한 인용 분석 결과가 추출되어 사용자에게 제공된다. 도 41은 그러한 것을 보여 준다.

도 41은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 드릴 다운했을 때를 반영한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 42는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 43은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 44는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 45는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, IPC 메인 그룹 별 최다 인용 기술에 대한 분석 중에서 IPC에 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.

도 46은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, USPC 서브 클래스(no dot, 클래스 직하위) 최다 인용 기술에 대한 분석 중에서 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.

도 47은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 총량 기준 분석 결과 및 이 분석 결과에 대한 본 발명의 리포팅 모듈(406) 중 차트 생성 모듈(406-2)이 생성한 차트의 일 실시예적 도면이다. 본 발명의 리포팅 모듈(406)은 표를 생성하는 표 생성 모듈(406-1), 차트를 생성하는 차트 생성 모듈(406-2), 그래프를 생성하는 그래프 생성 모듈(406-3), 리포트를 생성하는 리포트 생성 모듈(406-4) 중 어느 하나 이상으로 구성된다.

도 48은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 인용을 많이 받은 발명자의 연도별 인용 총량에 관한 분석 결과 및, 분석 결과에 보이는 특정한 숫자를 클릭했을 때, 그 숫자에 해당하는 문건 집합에 대하여 간이한 분석 결과(문건 목록, 최다 출원인의 연도별 출원수/등록수, 최다 발명자의 연도별 출원수/등록수, 최대 기술 분야별(IPC, USPC, FT) 연도별 출원수/등록수(드릴다운 포함))를 제 공해 주는 간이 분석 모듈(407)이 생성한 문건 목록에 대한 일실시예적 도면이다.

도 49는 본 발명의 간이 분석 모듈(407)에서도 최대 기술 분야별(IPC, USPC, FT)로 드릴 다운 기능을 제공함으로 보여주는 일실시예적 도면이다.

도 50은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 출원 문건 중 다출원 IPC 서브클래스 단위의 문건을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

특허 기술 분류별 기술 분석용 다차원 분석용 연산 수행 결과 테이블

이어서, 특허 기술 분류 활용 기술 분석에 대해서 설명한다. 특허 기술 분류 활용 기술 분석이란, 본 발명의 문건 집합 중에서 특허 분류 기호를 통해서 확정되는 문건 집합에 대한 분석을 의미한다. 특허 분류 기호별로 생성되는 특허 기술 분류 활용 기술 분석용 문건 집합의 종류는 1) 특정 특허 분류 기호의 종류(IPC, USPC, FT, ECLA 등)에서 선택되는 적어도 하나 이상의 특허 분류 기호를 포함하는 문건으로 생성되는 문건 집합(2 이상의 특허 분류 기호가 개입되는 경우 이들간의 (OR 연산, AND 연산, NOT 연산 등 각종 연산을 포함한다.), 2) 2 종류 이상의 특허 분류 기호를 포함하여 생성되는 문건 집합(IPC AND USPC 등)이 있다. 이들 모두는 1) 개별 국가 단위, 2) 국가 통합 단위일 수 있으며, 국가 단위로 중복은 제거(합집합 연산의 결과)되어야 하며, 3) 메인 특허 분류 기호만을 대상으로 할 것인지, 모든 특허 분류 기호를 포함하여 처리할 것인지는 기설정된 정책 또는 사용자의 선택에 따라 다를 것이며, 이들은 모두 문건 집합의 확정과 관련되어 있다.

특허 기술 분류 활용 기술 분석(이하, 기술 분석이라 한다.)에서 인출할 수 있는 정보는 상기 특허 기술 분류 활용 기술 분석용 문건 집합(이하, 기술 분석용 문건 집합)을 대상으로, 상기 문건 집합에 대한 1) 점유율, 2) 집중율, 3) 활동율 및 4) 기타 특허 분석 지표에 대한 정보이다. 이때, 상기 1) ~4)를 위한 데이터 처리에서 주어진 특허 분류 기호의 하위 특허 분류 기호에 대응되는 문건들을 분석 대상 문건 집합에 포함함은 당연할 것이다.

특허 기술 분류 활용 기술 분석 중 먼저 총량 분석부터 설명한다. 총량 분석은 특허 기술 분류 기호의 레벨별 기간별/연도별 출원수/등록수 등과 같은 양적인 관점에서의 분석 결과를 제공하기 위한 것이며, 특정 특허 분류 기호의 하위 특허 분류 기호가 포함된 문건까지 롤업 연산되어 그 다차원 연산된 결과가 저장된다.(특정 특허 분류가 포함되어 있는 특허 문건의 수 및 그 하위 특허 분류가 포함된 특허 문건의 수가 총합되어(중복이 제거됨은 당연할 것이다.) 계산된 수치이다.) 하기 표 58는 USPC에 대한 출원 총량의 연도별 분포에 관한 다차원 분석용 연산 수행 결과 테이블의 일 실시예적 구현 형태이다. 상기 USPC 002048000은 2/48, 002049100은 2/49.1과 같다. 이는 USPC의 표기법의 문제이다.(앞의 세자리는 class number, 뒤의 6자리를 1000으로 나누었을 때 나온 숫자를 "/" 좌우에 배치하면 통상 공보에 표기되는 USPC가 된다.)

[표 58]

ano dot	1 dot	2dot	3 dot	4 dot	01	02	03	04	05	06

	002048000	002049100	002049200		4	1	6	3	1	8
	002048000	002049100	002049200		4	1	6	3	1	8
	002048000	002049100	002049200		4	1	6	3	1	8
	002048000	002049100	002049200		4	1	6	3	1	8
	002048000	002049100	002049300		0	1	1	0	1	0
	002048000	002049100	002049300		0	1	1	0	1	0
	002048000	002049100	002049300		0	1	1	0	1	0
	002048000	002049100	002049300		0	1	1	0	1	0
	002048000	002049100	002049400	002049500	0	1	3	1	1	2
	002048000	002049100	002049400	002049500	0	1	3	1	1	2
	002048000	002049100	002049400	002049500	0	1	3	1	1	2
	002048000	002049100	002049400		1	2	6	0	2	4
	002048000	002049100	002049400		1	2	6	0	2	4

상기에서 입수 받은 특정 USPC에서 출원수/등록수를 알고 싶다면, 그 특정 USPC 레벨(class to n dot) 칼럼에서 연도별/기간별로 다차원 연산된 숫자 또는 합계를 획득하면 된다.

한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 출원인별 다단계 특허 분류 기호별 분석을 수행하기 위하여 하기 표 59과 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓을 수 있다.

[표 59]

IAppName	C3	C4	C5	C6	C7	C8	05

A	C12N	C12N 15/09	C12N 15/00	C12N 15/10			2
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11	C12N 15/12		1
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11	C12N 15/31	C12N 15/33	1
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11			2
A	C12N	C12N 15/09	C12N 15/00	C12N 15/10			2
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11	C12N 15/12		1
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11	C12N 15/31		1
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11			2
A	C12N	C12N 15/09	C12N 15/00	C12N 15/10			2
A	C12N	C12N 15/09	C12N 15/00	C12N 15/11			4
A	C12N	C12N 15/09	C12N 15/00				6
A	C12N		C12N 15/00				6
A	C12N						6

B

상기 표 59과 같은 데이터가 있을 때, C12N 15/00를 기준으로 다출원인을 추출하는 경우, C12N 15/00(IPC 서브그룹은 C4 레벨이라 약칭한다.)은 IPC C4 레벨을 기준으로 자기 자신 및 그 하위 특허 분류 기호에 관한 문건 카운트 정보까지 롤업 연산해 놓은 것은 GID 15이므로, 상기 테이블에서, 조건식에 "GID = 15 and IPC = C12N 15/00 and IPC 레벨 = C4"라고 명령하면, 이 조건에 맞는 출원인별 문건 수(GID 15행에 나온 문건 수)가 나온다.

상기와 같은 총량 카운트 정보가 있을 경우, 점유율, 집중율, 활동율 등과 같은 분석 지표별로 상기 다차원 분석용 연산 수행 결과 테이블과 같은 데이터를 생성해 놓을 수 있음은 전술한 바와 같은나, 일 실시예로 하기와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 제시한다. 한편, 점유율 등 기타 특허 지표에 대해서도 동등한 연산을 수행할 수 있음은 당업자에게 자명할 것이다.

융합 분석용 다차원 분석용 연산 수행 결과 테이블

이하, 융합 분석을 위한 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블 데이터에 대해서 설명한다.

본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 본 발명의 융합 분석을 위하여 하기와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 입력되거나 설정되거나 확정되는 임의의 특허 문건 집합을 입수 받은 다음, 상기 문건 집합에 포함되어 있는 1종류의 특허 분류 기호가 복수개가 결합되어 있을 때(IPC만 있을 때는 IPC가 2개 이상, IPC와 USPC가 있을 때는 IPC가 2개 이상이면 처리하고, 하나만 처리하지 않으며, USPC도 2개 이상일때만 USPC 다차원 분석용 연산 수행 결과 테이블로 처리한다.), 상기 그 종류의 특허 분류 기호에 대하여 하기 표 72와 같은 데이터를 생성한다.

[표 72]

문건 번호

AppName

Main C1

Main Cn

Sub 1 C1

Sub 1 Cm

Sub i C1

Sub i Ck

date

기타

1

A

2

B

하나의 특허 문건에는 IPC, USPC, FI, FT, ECLA와 같은 특허 분류 기호의 종류 중 적어도 하나 이상이 포함되며, 상기 특허 분류 기호가 적어도 하나 이상 정보가 포함되어 있다. 상기 표 72와 같은 데이터는 문건 번호를 기준으로 필수적인 Main 특허 분류 기호와 선택적인 Sub 특허 분류 기호가 1개 이상 있을 수 있음을 보여 주고 있다.(상기에서 Main 특허 분류 기호의 종류와 Sub 특허 분류 기호의 종류는 같은 종류이다.) 이때, 상기 문건에 포함된 특허 분류 기호가 문건에 포함되어 있는 자기 자신 특허 분류 기호 및 자신의 모든 상위 특허 분류 기호를 나열하고 있음을 알 수 있다. 자기 자신의 주(main) 특허 분류 기호가 IPC 2 dot 서브클래스에 해당하는 것이라고 가정한다면, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 분류 기호 마스트 DB(203)를 참조하여 주 특허 분류 기호가 C6 레벨임을 확정하고, 상기 주 특허 분류 기호를 C6 레벨에 입력하고, 좌측의 C5 레벨에는 1 dot 레벨의 상기 주 특허 분류 기호의 직상위 특허 분류 기호를 입력하며, C4 레벨에는 메인그룹 레벨의 특허 분류 기호를 입력하고, 이러한 과정을 최상위 레벨까지 일련으로 입력한다. 상기 특허 문건에 포함된 적어도 하나 이상의 서브 IPC에 대해서도 상기 메인 IPC에서와 마찬가지로 처리한다. 이때, 출원인 등과 같은 다른 서지 사항 데이터들은 상기 문건 번호를 통해서 입수할 수 있는 정보이 므로, 이러한 것들은 선택적인 요소이다.

대한민국 특허출원 제10-2005-0111868호에는 2006년 01월 자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 표 60을 통하여 예시적으로 설명한다.(표기의 편의상 메인그룹 이하에서의 특허 분류 기호에서 서브클래스 부분은 생략한다.

[표 60]

문건 번호

AppName

Main C1

C2

C3

C4

C5

C6

Sub C1

C2

C3

C4

C5

C6

기타

10-2005-0111868

삼성전자

H

H04

H04B

7/00

7/24

7/26

H

H04

H04B

7/00

7/14

7/15

만약 Sub IPC가 2개 이상이면, 하기 표 61와 같이 상기 H04B 7/15관련된 정보의 우측에 병렬적으로 동일한 방식으로 처리한다. 대한민국 특허출원 제10-2006-0012606호에는 2006년 01월 자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호가 있는데, 이를 통해서 예시적으로 설명한다. (표기의 편의상 AppName 등은 생략하며, H04Q 7/30에 관한 것은 아래 줄에 표기한다.)

[표 61]

문건 번호

Main C1

C2

C3

C4

C5

C6

Sub 1 C1

C2

C3

C4

C5

C6

C7

10-2006-0012606

H

H04

H04B

7/00

7/02

7/04

H

H04

H04B

7/00

7/14

7/15

7/155

Sub2 C1

C2

C3

C4

C5

C6

C7

H

H04

H04Q

7/00

7/20

7/30

..

하기 표 62는 대한민국 특허 출원 제 10-2005-0042032호는 H04B 7/02 및 H04B 7/14를 특허 분류 기호 정보로 포함하고 있다.

[표 62]

문건 번호

AppName

Main C1

C2

C3

C4

C5

C6

Sub C1

C2

C3

C4

C5

C6

기타

10-2005-0042032

에스케이텔레콤

H

H04

H04B

7/00

7/02

H

H04

H04B

7/00

7/14

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)을 통하여 상기 다차원 분석용 연산 수행 결과 테이블 데이터와 같은 것을 USPC, FT 등에 대해서도 마찬가지로 생성할 수 있음은 당업자에게 자명할 것이다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 레벨별 복수 특허 분류 기호의 일련 정보로부터 하기 표 63에 포함된 것과 같은 복수 특허 분류 기호쌍 정보(pair information)을 생성한다. 상기 복수 특허 분류 기호쌍의 종류는 상기 동종 특허 분류 기호 관계성 전처리 모듈의 설명에서 상술한 바 있다. 하기 표 63에서 출원일 등과 같은 1개만이 나올 수 있는 서지 사항은 옆으로 얼마든지 신설하여 포함시켜 놓을 수 있다.(예를 들면 등록일 등) 하지만, 공동 출원인이나 공동 발명자 등과 같을 경우에는 별도의 행을 신설해야 하는 것은 전술한 바와 같다. 즉, 출원인이나 발명자만 다른 동일한 레코드가 생기며, 이와 같은 정보를 기반으로 출원인별 융합 분석 및 발명자별 융합 분석이 가능해 진다.

본 모델을 설명하기 위하여 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개만이 있다고 가정하자.(물론, 입수 되는 모든 문건에 대해서 반복적으로 처리하면 모든 문건 집합을 기준으로 한 모든 특허 분류 기호 조합 (Ai, Bj)에 대한 하기와 같은 데이터의 생성이 가능할 것이다.) 이때, 특허 분류 기호 조합 (Ai, Bj)에 다음과 같은 테이블의 생성이 가능할 것이다. 특허 분류 기호 조합은 대한민국 특허출원 제10-2005-0111868호에서 4개 쌍, 대한민국 특허출원 제10-2006-0012606호에서는 (메인 IPC , 서브 IPC) 쌍에서 22쌍(6+16), (서브 IPC, 서브 IPC) 쌍에서 20쌍 및 대한민국 특허 출원 제 10-2005-0042032호에서는 1쌍이 나오며, 3 특허 출원에서 47개의 쌍이 나온다. 이들 쌍을 모두 표현하는 것도 당연히 가능하나, 설명의 편의상 일정 부분을 생략한 하기 표 63과 같은 테이블로 전체 47개에 대한 설명에 갈음하는 방식으로 본 발명 사상을 설명한다.

[표76]

특허 분류 기호 조합 (Ai, Bj)	문건 번호	출원인	출원일	가중치 정책 1 적용	가중치 정책 2 적용

(H04B 7/15 ,H04B 7/26)	10-2005-0111868	삼성전자	2006.12.04	1	1
(H04B 7/15,H04B 7/24)	10-2005-0111868	삼성전자	2006.12.04	1	1
(H04B 7/14,H04B 7/26)	10-2005-0111868	삼성전자	2006.12.04	1	1
(H04B 7/14,H04B 7/24)	10-2005-0111868	삼성전자	2006.12.04	1	1
(H04B 7/155,H04B 7/04)	10-2006-0012606	삼성전자	2006.12.04	1/3	0.75/2
(H04B 7/155,H04B 7/02)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
(H04B 7/15,H04B 7/04)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
(H04B 7/15,H04B 7/02)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
(H04B 7/14,H04B 7/04)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
(H04B 7/14,H04B 7/02)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
(H04B 7/14,H04B 7/02)	10-2005-0042032	에스케이텔레콤	2006.12.04	1	1


(H04Q 7/00, H04B 7/00)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1
(H04Q 7/00, H04B)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1
(H04Q,H04B)	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1

상기 특허 분류 기호의 조합(Ai, Bj) 방식으로 데이터를 생성할 경우, 소팅이나 인덱스 처리 및/또는 롤업 연산에 장애가 있을 수 있다. 그러므로, 개념적으로 특허 분류 기호의 조합을 하기 표 64과 같이 처리하는 것이 더욱 바람직하며, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 복수 특허 분류 기호쌍 정보를 다음과 같이 생성할 수도 있을 것이다.

[표 64]

From Main IPC	From Sub IPC	문건 번호	출원인	출원일	가중치 정책 1 적용	가중치 정책 2 적용

H04B 7/15	H04B 7/26	10-2005-0111868	삼성전자	2006.12.04	1	1
H04B 7/15	H04B 7/24	10-2005-0111868	삼성전자	2006.12.04	1	1
H04B 7/14	H04B 7/26	10-2005-0111868	삼성전자	2006.12.04	1	1
H04B 7/14	H04B 7/24	10-2005-0111868	삼성전자	2006.12.04	1	1
H04B 7/155	H04B 7/04	10-2006-0012606	삼성전자	2006.12.04	1/3	0.75/2
H04B 7/155	H04B 7/02	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
H04B 7/15	H04B 7/04	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
H04B 7/15	H04B 7/02	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
H04B 7/14	H04B 7/04	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
H04B 7/14	H04B 7/02	10-2006-0012606	삼성전자	2006.02.09	1/3	0.75/2
H04B 7/14	H04B 7/02	10-2005-0042032	에스케이텔레콤	2006.12.04	1	1


H04Q 7/00	H04B 7/00	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1
H04Q 7/00	H04B	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1
H04Q	H04B	10-2006-0012606	삼성전자	2006.02.09	1/3	0.25/1

통계 처리와 분석의 목적 상 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 하기 표 65과 같이 상기 복수 특허 분류 기호쌍 정보를 생성하는 것이 더욱 바람직할 것이다.(기재의 편의상 개개의 문건 번호는 표시하지 않았으나, 위의 표 64에 있는 문건 번호의 순서와 완전 동일하다. 그리고, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 하기 표 65과 같은 다차원 분석용 연산 수행 결과 테이블 데이터에서 문건 번호의 서지 사항(출원인, 발명자, 출원일, 등록일 등의 기타 서지 사항에 관한 정보도 함께 포함되는 것이 바람직할 것이다.) (하기에서 M/S는 특허 분류 기호가 메인 IPC에서 기인한 것이면 M, 서브 IPC에서 기인한 것이면 S라고 표기한다는 것을 의미하는 필드이다. 이는 융합의 기준이 가급적 Main IPC를 축으로 파악하는 것이 바람직하기 때문이다.)

[표 65]

C3

C4

C5

C6

M/S

문건번호

M/S

C1

C2

C3

C4

H04B

7/00

7/14

7/15

S

H04B 7/15

H04B 7/26

M

H

H04

H04B

7/00

H04B

7/00

7/14

7/15

S

H04B 7/15

H04B 7/24

M

H

H04

H04B

7/00

H04B

7/00

7/14

S

H04B 7/14

H04B 7/26

M

H

H04

H04B

7/00

H04B

7/00

7/14

S

H04B 7/14

H04B 7/24

M

H

H04

H04B

7/00

H04B

7/00

7/14

7/15

7/155

S

H04B 7/155

H04B 7/04

M

H

H04

H04B

7/00

H04B

7/00

7/14

7/15

7/155

S

H04B 7/155

H04B 7/02

M

H

H04

H04B

7/00

H04B

7/00

7/14

7/15

S

H04B 7/15

H04B 7/04

M

H

H04

H04B

7/00

H04B

7/00

7/14

7/15

S

H04B 7/15

H04B 7/02

M

H

H04

H04B

7/00

H04B

7/00

7/14

S

H04B 7/14

H04B 7/04

M

H

H04

H04B

7/00

H04B

7/00

7/14

S

H04B 7/14

H04B 7/02

M

H

H04

H04B

7/00

H04B

7/00

7/14

S

H04B 7/14

H04B 7/02

M

H

H04

H04B

7/00

H04Q

7/00

S

H04Q 7/00

H04B 7/00

M

H

H04

H04B

7/00

H04Q

7/00

S

H04Q 7/00

H04B

M

H

H04

H04B

H04Q

S

H04Q

H04B

M

H

H04

H04B

2개 이상의 특허 분류 기호가 포함되어 있는 모든 특허 문건을 대상으로 한 상기와 같은 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터가 있는 경우, 하기와 같은 정보를 추출/계산해 낼 수 있다.

첫째, 특허 분류 기호가 입수되었을 때의 주체 정보 미활용 융합 분석이다. 하나의 특허 분류 기호가 입수되거나 주어졌을 때, 상기 특허 분류 기호와 잘 융합하는(쌍으로 만들어 지는 빈도가 높은) 특허 분류 기호의 랭킹을 찾을 수 있을 것이다. 상기 표에서 예를 들면, H04B 7/04와 잘 융합하는 특허 분류 기호로 C7(IPC 3 dot 레벨) 레벨에서는 H04B 7/155, C6 레벨에서는 H04B 7/15 등과 같이 각 IPC 레벨에서의 융합의 빈도가 높은 IPC들을 입수할 수 있고, 이들에 대해서 통계/분석 정보를 생성하면(group by, count, 및 rank 명령으로 처리하면 된다), 융합 빈도가 높은 IPC들의 순위 정보를 알 수 있게 된다.(예를 들면, "H04B 7/04와 가장 잘 융합하는 C6 레벨의 IPC는 H04B 7/15이며, 차순위로 잘 융합하는 C6 레벨의 IPC는 H04Q 7/30이다"와 같은 융합 관련 랭킹 정보를 생성할 수 있게 된다. 물론, 상기 융합이 발생한 구체적인 문건은 상기 문건 번호를 통해서 구체적으로 확인 가능할 수도 있지만, 융합이 발생한 IPC 쌍을 검색 엔진 또는 DBMS(201)에 질의함으로써, 해당되는 문건들을 입수할 수도 있게 된다. 상기 입수된 특허 분류 기호와 잘 융합하는 특허 분류 기호들을 IPC 각 레벨별(IPC 서브클래스, 메인그룹, 1 dot, 2 dot, ...로 연도별/기간별 통계/분석한 정보를 생성할 수 있을 것이다. 이는 상기 테이블에서 입수된 특허 분류 기호(예를 들면, H04B 7/04)를 한쪽(가급적 메인 IPC)에서 찾고, 상기 찾은 특허 분류 기호가 포함된 모든 레코드(행)에서 C1~Cn 중에서 레벨을 확정(칼럼이 결정됨)하고, 상기 확정된 레벨에 존재하는 모든 특허 분류 기호에 대하여 통계/분석(group by, count 및 rank 명령으로 가능하다) 아울러, 상기 다차원 분석용 연산 수행 결과 테이블 데이터에 기간/날짜 정보가 포함되어 있는 경우, 상기 입수된 특허 분류 기호와 잘 융합하는 특허 분류 기호들을 상기 기간별(예를 들면 연도별)로의 통계/분석 데이터를 생성할 수 있다.

상기 융합 분석은 하나의 특허 분류 기호에 대해서 설명하였으나, 2 이상의 복수개의 특허 분류 기호가 입수되었을 때의 융합 분석도 상기 입수된 2 이상의 복수개의 특허 분류 기호 개개에 대하여 융합의 빈도가 높은 특허 분류 기호를 획득하고, 이를 합하면 될 것이다. 한편, 정책에 따라서, 하나의 문건에 상기 입수된 복수개의 특허 문건에서 중복 해당하는 경우가 발생하는데, 이때 중복을 허용하면서 통계/분석 정보를 생성할 수도 있고, 중복을 제거하면서 통계/분석 정보를 생성할 수도 있다. 후자의 경우에는 상기 입수된 복수개의 특허 분류 기호를 질의한 다음, 질의 결과로 나오는 레코드 각각에 포함된 문건 번호에 distinct 명령 등과 같은 중복 제거 명령을 수행한 다음, 중복이 제거된 레코드만을 기준으로 각 IPC 레 벨별로 잘 융합되는 특허 분류 기호에 대한 통계/분석 정보를 생성할 수 있게 된다. 이러한 중복의 문제가 발생하게 되는 근본적인 이유는 융합 정보를 처리할 때, 하위 특허 분류 기호에서 융합이 발생했다면, 그 각각의 상위 특허 분류 기호간에서는 당연히 융합이 발생했다고 보기 때문이다. 한편, 복수개의 특허 분류 기호는 동일한 IPC 레벨일 필요는 없으며, 전체 IPC 분류 체계에서 선택되는 어느 2 이상의 특허 분류 기호에 대해서 상기 복수개의 특허 분류 기호가 입수되었을 때의 발명 사상을 그대로 적용할 수 있음은 당연하다 할 것이다.

둘째, 특허 분류 기호가 입수되었을 때의 주체 정보 활용 융합 분석이다. 상기 입수된 특허 분류 기호(1개 또는 복수개)에 가장 잘 융합하는 특허 분류 기호 집합과 관련된 융합 발생 문건 집합이 있을 때, 상기 융합 발생 문건 집합의 문건 번호에 관련된 서지 사항 정보를 활용하여, 각 서지 사항의 필드별 통계/분석 정보를 생성할 수 있다. 예를 들어, H04B 7/00과 융합이 일어난 특허 분류 기호를 포함하고 있는 대한민국 특허청에 출원된 삼성전자주식회사의 특허 문건 집합을 분석 대상 문건 집합으로 하여, 상기 문건 집합에 있는 IPC들을 단계별(IPC 서브클래스, 메인그룹, 1 dot, 2 dot...로 분할하고(이때, 하위 특허 분류 기호 포함의 사상은 당연히 적용된다.) 각 분할된 각 단계별로 어떤 IPC들이 연도별/기간별로 융합이 발생한 문건의 개수에 관한 정보를 제공해 줄 수 있게 된다. 이와 같은 정보는 삼성전자주식회사의 각 발명자별로도 제공해 줄 수 있게 된다.

셋째, 주어진 문건 집합 내부에서의 융합 분석이다. 상기 주어진 문건 집합은 1) 출원인, 2) 발명자, 3) 특허 분류 기호, 4) 국가, 5) 날짜 등 서지 사항을 구성하는 각종 필드 중 적어도 어느 하나 이상의 조합에 의해서 생성될 수 있다. 문건 집합이 입수되면, 상기 문건 집합을 상기 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블에 질의하면, 입수된 문건 집합 중에서 융합이 발생한 문건 집합을 특정할 수 있게 된다. (문건 번호 및 그 문건 번호가 포함된 레코드가 특정되게 된다.) 이때, 상기 융합이 발생한 문건 집합을 대상으로 생성할 수 있는 정보는 다음과 같다. 1) 융합이 발생한 문건 집합에서 최빈 각 IPC 레벨별 IPC를 추출하고, 상기 추출된 최빈 IPC별로, 융합이 발생한 각 레벨별 IPC에 대한 통계/분석 정보를 생성할 수 있을 것이다.(상기 통계/분석 정보는 카운팅 정보이며, 상기 카운팅 정보값이 있으면, 증감율, 증감속도 등도 구할 수 있게 된다.) 2) 상기 융합이 발생한 문건 집합을 분석 대상 문건 집합으로 한 본 발명 사상의 전반에 걸진 통계/분석 데이터를 생성할 수 있게 된다.(최다 발명자, 최다 출원인, 최다 융합 특허 분류 기호 등을 기준으로 한 이들의 랭킹 정보 등)

넷째, 융합 대상 발견을 위한 통계/분석이다. 이는 주어진 문건 집합 내부에서 기준을 발견하고, 상기 기준에 대하여, 제1국 또는 제2국의 모든 또는 기설정된 문건 집합(예를 들면 출원일 기준 최근 7년간 출원된 문건 집합)을 대상으로 생성된 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하여, 각 기준별로의 융합 통계/분석 정보를 입수하는 통계/분석을 말한다. 상기 기중의 예를 들면, 특정 출원인 또는 출원인별 총량/점유율/집중율/활동율 또는 기타 분석 지표별로의 특허 분류 기호 레벨별 최빈값이 될 수 있을 것이다. 더욱 구체적으로 예를 들면, 삼성전자주식회사의 한국에서의 메인그룹 기준 고집중율 IPC들을 추출 할 수 있으며, 이들 추출된 고집중율 기준 IPC들이 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하는 기준 IPC가 될 것이다. 이때, 상기 질의하는 대상이 되는 상기 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터는 제1국(상기 기준이 생성된 국가)이 될 수도 있지만, 제2국(상기 기준의 생성과는 무관한 국가)의 특허 문건 집합에서 생성된 것이다. 상기의 방법을 활용하면, 대한민국의 삼성전자의 특허 문건에서 고집중율 IPC 메인그룹별 IPC를 추출하고, 상기 추출된 IPC를 통해서 일본 또는 미국의 특허 문건 집합으로 생성된 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하여, 일본 또는 미국에서 상기 추출된 고집중율 메인그룹별 IPC들과 잘 융합하는(융합의 빈도가 높은) 각 단계별 특허 분류 기호 정보를 입수할 수 있게 된다.

그리고, 본 발명에서는 다단계 특허 분류 기호 체계 상 직하위 특허 분류 기호가 매개된 롤업 연산 처리를 통한 다차원 분석용 연산 수행 결과 테이블 데이터 생성에 대해서 설명하였다. 그리고, 롤업이 전제되거나, 설령 전제되지 않은 경우라도 실시간으로 주어진 특허 분류 기호의 직하위 특허 분류 기호를 대상으로 한 정보를 생성하여 특정 특허 분류 기호의 직하위 특허 분류 기호에 관한 정보를 드릴 다운 정보를 사용자에게 제공해 줄 수 있었다. 이러한 본 발명의 발명 사상은 융합 분석에도 그대로 적용된다. 하기는 융합 분석에서의 드릴 다운에 대해 더욱 상세한 설명을 제공하고 있다.

하기 표79에서의 기준 IPC는 입수되거나 주어진 IPC이며, 대상 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC이다. 이때, 기준 및 대상 IPC의 레벨 선택이 가능함은 물론이다 하겠다. (물론, 상기 기준 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC일 수 있음은 당연할 것이다.) 이때, 기준 IPC와 대상 IPC 각각에 대하여 사용자로부터 독립적인 IPC 레벨 선택이 있을 경우, 선택 정보를 입수하여 선택된 레벨별로 계산된 결과를 추출하여 사용자에게 제공한다.

[표 66]

드릴 다운된 융합 통계/분석 정보를 입수하기 위하여 상기 표 66에서 기준 IPC인 B60C 3/00을 누른 경우, 본 발명의 시스템(1)은 하기 표 67에서와 같은 방식으로 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있을 것이다. (드릴 다운은 IPC 체계 하에서 자신의 하위에서만을 입수하며, 각 입수된 IPC 모두가 나타나는 것이 아니라 융합이 발생한 IPC만 나타난다.)

[표 67]

순위	기준 IPC 대상 IPC		IPC 설명	00	01	최근	합계
1	B60C 3/00 (+) H01B 1/00(+)		횡단면에 특징이 있는 타이어 도전재료를 특징으로 하는 도체 또는 도전물체	11	52	4	67
		B60C 3/04(+)	단면의 상대촌법에 특징이 있는 것	5	30	3	40
		B60C 3/06(+)	비대칭의 것	4	10	1	12
		B60C 3/08(+)	보관 또는 불사용상태에서 접을 수 있는 것	1	2	0	2
2	H03M 3/00 (+) B29C 31/00 (+)			2	5	9	16

(비고) 52 = from 하위(30+10+2) + 자신(10)

상기 표 67과 같은 결과 데이터에서 본 시스템의 사용자가 어디서든 H01B 1/00를 누른 경우에는 본 시스템(1)은 다음 표 68과 같은 형식의 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있다.

[표 68]

순위	기준 IPC 대상 IPC		IPC 설명	00	01	최근	합계
1	B60C 3/00 (+) H01B 1/00(+)		횡단면에 특징이 있는 타이어	11	52	4
		H01B 1/02(+)	주로 금속 또는 합금으로 된 것	3	35	2
		H01B 1/04(+)	주로 카본 실리콘혼화물, 카본 또는 실리콘으로서 되는 것	2	10	0
		H01B 1/06(+)	주로 다른 비금속물질로 되는 것	2	0	0
2	H03M 3/00 (+) B29C 31/00 (+)			2	5	9

한편, 본 시스템(1)은 드릴 다운과 관계하여 다음과 같은 결과 데이터를 사 용자에게 제공해 줄 수 있을 것이다. 하기 표 69에서의 기준 IPC는 입수되거나 주어진 IPC이며, 1위에서 n위까지의 랭킹의 대상이 되는 대상 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC이다. 이때, 기준 및 대상 IPC의 레벨 선택이 가능함은 물론이다 하겠다.(물론, 상기 기준 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC일 수 있음은 당연할 것이다.)

[표 69]

순위	기준 IPC	IPC 설명	1위	2위	3위
1	B60C 3/00 (+)	횡단면에 특징이 있는 타이어	H01B 1/00(67) (*)	G03B 5/00(15) (*)	C07B 31/00(10) (*)
2	H03M 3/00 (+)

이때, 상기 표 69와 같은 결과 데이터에서 H01B 1/00 (*)를 눌렀을 때는 다음 표 70과 같은 기준 IPC와 대상 IPC의 융합 분석 결과가 나오는 것이 바람직할 것이다.

[표 70]

순위	기준 IPC 대상 IPC		IPC 설명	00	01	최근	합계
1	B60C 3/00 (+) H01B 1/00 (+)	횡단면에 특징이 있는 타이어	횡단면에 특징이 있는 타이어 (more) 도전재료를 특징으로 하는 도체 또는 도전물체	11	52	4	67
		H01B 1/02(+)	. 주로 금속 또는 합금으로 된 것	3	35	2	40
		H01B 1/04(+)	주로 카본 실리콘혼화물, 카본 또는 실리콘으로서 되는 것	2	10	0	12
		H01B 1/06(+)	. 주로 다른 비금속물질로 되는 것	2	0	0	2

사용자들에게 보이는 모든 IPC에는 IPC 설명이 포함되는 것이 바람직할 것이다. 사용자들 중에서 각 IPC를 모두 기억하기를 기대하기를 어렵기 때문에, 각 IPC의 타이틀 정보가 1차적으로 상기 IPC 설명 정보로 나오는 것이 바람직할 것이다. 이때, 각 IPC의 타이틀 정보는 간략하고, 특징만을 설명하는 것이 대부분이므로, 2차적으로 IPC에 대한 설명에 클릭했을 때 POP UP 등으로 그 IPC의 상위 IPC들을 모두 또는 일정 단계까지(예를 들면 클래스 레벨까지) 보여 주는 것이 바람직할 것이다.

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 IPC를 중심으로 융합 분석을 위한 다차원 분석용 연산 수행 결과 테이블 데이터를 어떻게 생성하는 지에 대해 설명하였으나, 본 방법은 USPC, FT, FI, ECLA 등의 다른 특허 분류 기호에 대해서도 동등한 방법으로 적용될 수 있음은 당업자에게 자명하다 할 것이다.

한편, 상기 융합 분석에서 융합 발생 특허 분류 기호 조합은 2개의 특허 분류 기호의 조합(Ai, Bj)을 중심으로 설명했으나, 본 발명 사상은 3개 이상의 융합 발생 특허 분류 기호의 조합 (Ai, Bj, Ck...)에 대해서도 본 발명 사상은 그대로 적용됨은 당업자에게 자명할 것이다. 예를 상기 2개의 특허 분류 기호의 조합을 중심으로 융합분석을 할 경우에는 동종 특허 분류 기호가 2개 이상 포함되어 있는 특허 문건을 융합 발생 특허 문건 집합으로 하였으나, 3개의 특허 분류 기호의 조합을 중심으로 융합 분석을 하는 경우에는 동종 특허 분류 기호가 3개 이상 포함되어 있는 특허 문건을 융합 발생 특허 문건 집합으로 하여야 한다. 그리고 2개의 특허 분류 기호의 조합일 경우, 하나의 문건에 n개의 특허 분류 기호가 있을 경우, nC2개의 (Ai, Bj) 조합이 나왔으나, 3개의 특허 분류 기호의 조합일 경우, nC3 개의 (Ai, Bj, Ck)가 나오며, (Ai, Bj, Ck)를 (Ai, Bj)처럼, 하나의 단위로 하여 처리할 수 있을 것이다. 이 경우에도 Ai, Bj, Ck 중에서 어느 하나는 메인 IPC에서 기인된 것이 포함될 수도 있으며, 모두 서브 IPC에서 기인한 것일 수도 있다.

대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블

본 발명의 대표 어구 추출 전처리 모듈을 통한 대표 어구 생성 방법은 전술한 바 있다. 상기 대표 어구 추출 전처리 모듈은 하기 표 71와 같은 데이터를 생성한다는 것은 전술한 바가 있다.

[표 71]

본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 대표 어구 분석을 위한 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하기 위하여, 상기 표84 와 같은 데이터를 입수하고, 상기 입수한 문건 번호의 서지 사항에 포함된 각종 정보(출원인, 특허 분류 기호, 발명자, 날짜 정보 등)를 특허 문건 마스트 DB(202)에서 추출하여(문건 번호를 키값으로 하여 조인 연산을 수행하여 처리할 수도 있다.) 하기 표 72와 같은 형태의 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 먼저 특허 분류 기호를 추출하여 하기와 같은 데이터를 생성할 수 있을 것이다. 편의상 문건 번호 #1에는 H04B 7/15라는 IPC가 1개 포함되어 있고, 문건 번호 #2에는 H04B 7/26 및 H04B 7/02라는 IPC가 포함되어 있다고 가정하자.

[표 72]

어구 ID	어구	필드	출현회수	문건 번호	C1	C2	C3	C4	C5	C6
1	abc	D	3	#1	H	H04	H04B	7/00	7/14	7/15
1	abc	C	2	#1	H	H04	H04B	7/00	7/14	7/15
1	abc	D	2	#2	H	H04	H04B	7/00	7/24	7/26
1	abc	C	1	#2	H	H04	H04B	7/00	7/24	7/26
1	abc	D	2	#2	H	H04	H04B	7/00	7/02
1	abc	C	1	#2	H	H04	H04B	7/00	7/02
2	bcd	D	1	#1	H	H04	H04B	7/00	7/14	7/15
2	bcd	C	1	#1	H	H04	H04B	7/00	7/14	7/15
3	ac	D	1	#1	H	H04	H04B	7/00	7/14	7/15

문건 번호 #2에는 H04B 7/26 및 H04B 7/02라는 IPC가 대응되어 있으므로, 각 레코드마다 2개의 IPC 정보를 처리하기 위한 레코드가 생겼다. 상기는 IPC에 대해서 설명해 놓았지만, 본 발명 사상이 USPC, FT 등에도 동일한 방식으로 적용됨은 전술한 바와 같고, 당업자에게 자명할 것이다.

먼저 특허 분류 기호를 추출하여 하기 표 73과 같은 데이터를 생성할 수 있을 것이다. 편의상 문건 번호 #1에는 출원인 A가 포함되어 있고, 문건 번호 #2에는 출원인 B와 C가 포함되어 있다고 가정하자. 또한, 상기 문건 번호 #1은 2005년 5월에 출원되었다고 하고, #2는 2006년 1월에 출원되었다고 하자. 이 경우 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 하기 표 73와 같은 형태의 다차원 분석용 연산 수행 결과 테이블 데이터를 생성할 수 있을 것이다. (하기 표에서 05/1Q는 2005년 1분기를 의미한다.)

[표 73]

어구 ID	어구	필드	출현회수	문건 번호	05	05/Q1	5/2Q	5/3Q	5/4Q	06	06/1Q	AppName
1	abc	D	3	#1	1		1					A
1	abc	C	2	#1	1		1					A
1	abc	D	2	#2						1	1	B
1	abc	C	1	#2						1	1	B
1	abc	D	2	#2						1	1	C
1	abc	C	1	#2						1	1	C
2	bcd	D	1	#1	1		1					A
2	bcd	C	1	#1	1		1					A
3	ac	D	1	#1	1		1					A

문건 번호 #2에는 출원인 B, C가 포함되어 있으므로, 각 레코드마다 2개의 출원인 정보를 처리하기 위한 레코드가 생겼다.

본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 대표어구와 관련한 상기 2개의 다차원 분석용 연산 수행 결과 테이블 데이터를 1개의 통합된 다차원 분석용 연산 수행 결과 테이블 데이터로 생성해 놓을 수도 있을 것이다. 한편, 번역을 적용한다면, 상기 어구들에 대해 언어 정보에 대응되는 각 언어별 번역어를 어구로 한 다차원 분석용 연산 수행 결과 테이블 데이터를 생성할 수 있을 것이다. 상기 AppName 필드는 출원인명을 의미하며, 상기 필드 옆에 발명자 필드를 생성할 수 있고, 개별 발명자마다 하나의 레코드를 생성할 수 있을 것이다. 만약 출원인이 2이고, 발명자가 3인이면, 출원인 정보와 발명자 정보가 없던 1개의 레코드가 출원인과 발명자를 1개씩 포함하는 6(2*3 = 6)개의 레코드로 확장된다.

상기 표 72 및 표 73과 같은 데이터가 있는 경우, 대표어구와 관련하여 하기와 같은 정보를 생성할 수 있다.

첫째, 1) 출원인별 또는 발명자별 또는 출원인의 발명자, 2) 특정 특허 분류 기호의 특정 레벨(예를 들면 IPC 메인그룹 등), 3) 특정 기간(년, 분기, 월 등), 4) 특정 국가별로 어구 집합을 제공할 수 있을 것이다. 예를 들면, 대한민국 특허 출원 문건 기준 IPC 메인그룹 H04B 1/00, 2005년 1분기, 삼성전자주식회사가 출원한 문건에(문건의 특허 청구 범위 또는 초록 또는 특정 필드에) 등장하는 어구들의 목록을 추출할 수 있을 것이다. 이는 상기 표 72 및/또는 표 73와 같은 다차원 분석용 연산 수행 결과 테이블 데이터가 있을 때 간단한 SQL 문으로 처리 가능함은 당업자에게 자명할 것이다.

둘째, 1) 출원인별 또는 발명자별 또는 출원인의 발명자, 2) 특정 특허 분류 기호의 특정 레벨(예를 들면 IPC 메인그룹 등), 3) 특정 기간(년, 분기, 월 등), 4) 특정 국가별로 대표 어구 집합을 추출하여 제공할 수 있을 것이다. 대표 어구 추출은 대표 어구 추출 정책에 따라 달라진다. 상기 대표 어구 추출 정책의 예로 다음과 같은 것들이 있을 수 있다.

1) 추출된 특정 어구에 대하여 "출현 빈도 확률 = 특정 문건 집합에서의 출현 빈도/자신의 상위 문건 집합에서 출현 빈도*100"를 처리한 값이 기설정된 제1 협범위값에 포함되어 있는 경우이다.

2) 특정 어구에 대하여 그 특정 어구의 상기 출현 빈도 확률을 처리한 값이 기설정된 제1 협범위값에 포함되어 있어 있지 않고, 기설정된 제2 광범위값에 포함되어 있으면서, 상기 출현 빈도 확률이 기설정된 랭킹 이내에 포함되는 경우이다. 이는 특정 문건 집합에서 상기 1)의 대표 어구 추출 정책을 사용한 결과 대표 어구의 수가 현격히 적을 경우에 잘 적용될 수 있을 것이다.

3) 상기 추출된 특정 어구에 대하여, 특정 문건 집합에서의 출현 빈도의 증감율 기설정된 제1 협범위값에 포함되어 있는 경우이다.

상기 출현 빈도 확률을 구할 때, 자신의 상위 문건 집합이 언급되는데, 상기 상위 문건 집합의 종류는 1) 자신의 문건 집합을 특정짓는 요소가 적어도 하나 이상의 차원(dimension)을 포함할 경우 그 차원의 직상위 또는 모든 상위의 문건 집합이 되는 유형의 상위 문건 집합(한꺼번에 2가지 이상의 차원의 직상위 또는 모든 상위가 가능함은 물론이다.), 2) 순수한 키워드만으로 문건 집합이 특정될 때는 그 문건 집합의 전체 집합(국가 단위의 문건 집합일 경우, 그 국가의 모든 문건 집합)이 되는 상위 문건 집합이 있다. 상기 1) 유형의 상위 문건 집합에 대해 상세히 설명한다. 예를 들어, IPC H01L 1/00으로 특징되는 문건 집합의 경우에는 i) H01L 또는 이들의 상위 특허 분류 기호(H01, H)로 특정되는 문건 집합이 상기 상위 문건 집합이 될 수 있다. 한편, 대한민국 삼성전자주식회사의 2000년도 1분기 IPC H01L 1/00로 특정되는 문건 집합의 상위 문건 집합에는 i) 상위 특허 분류 기호, ii) 2000년도 또는 연도 통합, iii) 삼성전자주식회사의 모든 국가(미국, 일본, EU 등, 물론, 이때, 상기 어구의 그 국가 해당 언어로의 번역이 전제될 수도 있을 것이다.), iv) 대한민국의 모든 출원 또는 v) 상기 i) 내지 iv) 중 어느 하나 이상의 조합으로 생성되는 문건 집합이 상기 상위 문건 집합이 될 수 있을 것이다. 문건 집합이 특정한 키워드와 상기 차원의 조합으로 생성되는 경우(예를 들면, "RFID tag"라는 키워드와 대한민국 삼성전자주식회사의 2000년도와 같은 국가, 출원인, 연도 차원이 결합됨)에도 상기 키워드는 유지한 채 상기 i) 내지 v)를 적용하면, 상위 문건 집합의 생성이 가능함은 물론이다 하겠다. 한편, 상기 i) ~v)의 상위 문건 집합별로 상기 제1 협범위값 및/또는 상기 제2 광범위값들이 정해져 있는 것이 바람직하다.

한편, 문건 집합을 특정짓는 요소에 적어도 하나 이상의 차원을 포함하여 생성된 문건 집합에서 생성되는 대표 어구 추출하는 경우, 그 차원을 축으로 드릴 다운이 가능할 것이다. 드릴 다운 될 때는 그 차원 요소별로 기설정된 조건을 만족하는 대표 어구를 추출하여 그 결과를 사용자들에게 제공해 줄 수 있다. 하기 표 74 및 표 75은 대표 어구 관련된 드릴 다운의 일 실시예를 보여주고 있다. 상기 예는 00연도에 대해 대표 어구를 표시해 주고 있다. 이때, 01연도를 클릭하면 표 74과 같이 01연도에 해당하는 대표 어구를 추출하여 보여 준다.

[표 74]

순위	기준 IPC 대상 IPC	IPC 설명	00	01	02	03	04	05	06	최근	합계
1	B60C 3/00 (+)	횡단면에 특징이 있는 타이어	미끄럼, 마찰력 향상, 타이어 공명음 주파수, 소음, 정전기 방출
2	H03M 3/00 (+)		변조, 시그마 델타, 펄스폭 변조, 적문기 리셋

상기 대표 어구는 출현 빈도 확률에 따라 칼라, 폰트 사이즈 등을 달리하는 것이 바람직하다. 한편, 상기 대표 어구에 클릭했을 때는 상기 대표 어구를 포함하고 있는 문건을 추출해 줄 수 있을 것이다. 문건 추출은 1) 상기 대표 어구 추출을 위한 상기 다차원 분석용 연산 수행 결과 테이블 데이터에 문건 번호가 있다면 그 문건 번호를 기초로 하여 특허 문건 마스트 DB(202)에 질의하여 해당 문건을 추출하여 제공해 주는 방법, 2) 상기에서 나온 모든 차원과 대표 어구를 조합하여 검색 엔진에 질의하는 방법이 있을 수 있다. 후자의 예를 들면, 만약 대표 어구 "소음"를 선택한 경우(이 대표 어구가 특허 청구 범위(Claim, C)에서 나온 것일 경우, 입력하는 검색식은 "IPC = B60C 3/00 AND Claim = "소음", Date = (20000101~20001231", 국가 = 대한민국"처럼 될 것이다. 만약, 이 대표 어구를 가지는 미국 문건을 보기를 원할 경우에는 "국가 = 미국"으로 치환하여 검색 엔진에 질의하면 될 것이며, 이때, 키워드에 해당하는 "소음"이 미국 문건의 기본 언어인 영어가 아닐 경우(즉, 언어의 종류를 판단하여) 본 시스템(1)에 포함된 번역 시스 템을 이용하여 "소음"를 영어로 번역하여 "noise"로 상기 "소음" 자리에 입력하여 검색함은 물론이다 하겠다.

드릴 다운된 대표 어구를 추출하기 위하여 표 74에서 기준 IPC인 B60C 3/00을 누른 경우((+)표시를 눌러도 됨, 이는 인터페이스의 문제임), 본 발명의 시스템(1)은 하기 표 75과 같은 방식으로 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있을 것이다. (드릴 다운은 IPC 체계 하에서 자신의 하위에서만을 입수하며, 각 입수된 IPC 모두가 나타나는 것이 아님은 물론일 것이다. 예를 들어 B60C 3/02에 문건이 없거나, 대표 어구가 없다면 이 IPC에 대한 대표 어구는 제시되지 않는다. 이때, 상기 B60C 3/00에 해당하는 대표 어구는 보여 줄 수도 있고, 감출수도 있을 것이다.

[표 75]

순위	기준 IPC 대상 IPC		IPC 설명	00	01	최근	합계
1	B60C 3/00 (+)		횡단면에 특징이 있는 타이어	미끄럼, 마찰력 향상, 타이어 공명음 주파수, 소음, 정전기 방출
		B60C 3/04(+)	단면의 상대촌법에 특징이 있는 것	조정 안정성, 래디얼 타이어, 압축 공기
		B60C 3/06(+)	비대칭의 것	내마모성, 코너링, 비대칭 자가 측벽, 비대칭 래디얼 타이어
		B60C 3/08(+)	보관 또는 불사용상태에서 접을 수 있는 것	림 이탈, 프페어 타이어 캐리어, 보관 장치
2	H03M 3/00 (+)		차동변조

상기와 같은 예시는 대표 어구를 제시하는 일 실시예일 뿐, 본 발명 사상이 적용되는 분석 결과 어느 곳에서나 상기 대표 어구를 추출하여 제공해 줄 수 있음은 물론이다 할 것이다. 이는 본 발명 사상이 적용되는 분석 결과에는 문건 집합이 대응되어 있고, 본 발명의 대표 어구 상기 문건 집합(상기 문건 집합을 구성하는 특허 문건들)을 입수함으로써 이를 재료로 하여 생성되기 때문이다.

본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택되는 적어도 하나 이상의 차원별로 다차원 연산된 계산을 수행하여 다차원(n-차원) 큐브를 생성해 놓는다. 본 발명의 다차원 큐브 생성의 특징 중의 하나는 특허 분류 기호가 차원에 포함되어 큐브가 생성될 때, 주어진 상기 특허 분류 기호에 대한 롤업 연산 값이 생성될 때, 상기 특허 분류 기호 및 상기 특허 분류 기호의 상위 특허 분류 기호을 함께 고려하여 롤업 연산값을 생성하는 것이다. 이렇게 롤업 연산값이 생성되면, 임의의 특허 분류 기호에 대한 롤업 연산값을 입수할 때, 그 특허 분류 기호의 하위 특허 분류 기호들에 대한 모든 값들이 다차원 연산된 수치값들이 반영되어 생성된 값을 입수하게 된다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진 특허 문건에 포함된 특허 분류 기호가 있을 때, 상기 특허 분류 기호 뿐만 아니라, 상기 특허 분류 기호의 상위 특허 분류 기호에도 상기 특허 분류 기호에 대한 처리값을 반영한다. 예를 들면, 문건 번호 #1에 H04B 7/06이라는 IPC가 부여되어 있을 경우, 이 문건으로 큐브 다차원 분석용 연산 수행 결과 테이블을 생성할 때, H04B 7/06에도 카운팅 값 1을 부여하고, 상기 H04B 7/06은 직상위인 H04B 7/04, H04B 7/02에도 카운팅값을 부여해야 한다. 물론, H04B 7/00이상의 상위 레벨에도 카운팅값이 부여됨은 상식적일 것이다. 이를 위해 상기 표들에서와 마찬가지로, 모든 주어진 특허 분류 기호(예를 들면 IPC)에 대하여 자 신의 상위 특허 분류 기호들을 자신이 속한 줄(row)에 일렬로 배치해 놓고, 그 각 상위 특허 분류 기호에 대응되는 셀에 주어진 특허 분류 기호에서 기인한 값을 반영하여 셀값을 계산한다. 이러한 본 발명만의 독특한 롤업 연산 방식은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402) 및 본 명세서의 곳곳에서 반복적으로 설명해 놓았다.

자기 집합 기준 자기 집합 분석과 자기 기준 타분석 유형

본 발명의 분석 모듈은 다양한 분석 주제별 분석 모듈의 집합으로 구성된다. 상기 분석 주제별 분석 모듈은 분석 주제와 관련된 분석 결과를 생성하기 위하여, 상기 분석 주제에 대응되는 분석 주제별 분석 쿼리식을 포함하고 있다. 상기 분석 주제별 분석 쿼리식으로 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 다차원 분석용 연산 수행 결과 테이블에 접근하여 목적하는 주제별 분석 결과를 입수해 낸다.

본 발명의 분석 모듈이 생성하는 분석 결과값과 최초 확정되는 분석 대상 문건 집합과는 다음 2가지 관계가 있다.

첫째는 "자기 집합 기준 자기 집합 분석 유형"으로 상기 분석 결과값이 상기 분석 대상 문건 집합에서 나오는 경우이다. 예를 들면 특정한 출원인의 최빈 기술 분야별(IPC) 각 단계별 연도별 출원수, 점유율, 집중율, 활동율 데이터나, 각 출원인의 개별 발명자별 기술 분야별(IPC) 각 단계별 연도별 출원수, 점유율, 집중율, 활동율 데이터나, 출원인별 또는 개별 발명자별 (기술 분야별) 피인용수 등에 대한 데이터가 이의 예가 된다. 이때, 상기 특정한 출원인의 최빈 기술 분야를 추출해 내는데, 상기 특정한 출원인 자기 자신과 관계된 문건 집합으로 최빈 기술 분야(IPC)를 추출해 내며, 상기 추출된 최빈 기술 분야(IPC)가 기준이 되어 그 기준에 따라 연도별 출원수나 점유율 등의 분석 결과가 만들어 진다는 것이다. 그러므로, 자기의 문건 집합을 대상으로 기준으로 생성해 내고, 그 기준별 최종 분석 결과도 자신의 연도별 출원수이므로, 자기 자신에 대한 분석이 되게 된다. 상기 "자기 집합 기준 자기 집합 분석" 유형은 출력되는 최종 분석 결과가 최초 입력된 문건 집합(자기 문건 집합)에서 생성될 수 있는 특징이 있다.(물론, 점유율 등의 비율값 등을 구할 때는 기준되는 전체값이 필요함은 당연하다.)

두번째는 "자기 집합 기준 타 집합 분석" 유형으로, 상기 분석 결과값이 상기 분석 대상 문건 집합에서 나오지 않는 경우이다. 예를 들면, 분석 결과로 출원인 A의 문건을 중 다출원 기술 분야별로 다수 인용하는 인용자에 대한 데이터를 얻으려는 경우, 최초로 입력하는 데이터는 출원인 A의 문건 집합에 관한 것이지만, 최종적으로 출력하는 데이터는 A가 아닌 타인들의 문건 집합에 관한 데이터이다. 또한, 자신의 최빈 메인그룹 단계의 IPC별로, 그 IPC에 다출원하고 있는 출원인이나, 그 IPC에 집중율이 높은 출원인을 랭킹을 매겨서 추출하는 경우도 "자기 집합 기준 타 집합 분석"기준은 자기 자신의 문건 집합에서 메인그룹별 최빈 IPC를 추출한다는 면에서는 자기 집합 기준이며, 최종 결과가 타인들의 문건 집합에 대한 것이라는 점에서 타 집합 분석이 된다.

이러한 두번째 경우에는 2단계 이상의 계산이 필요하게 된다. 상기 예에서는 우선적으로 출원인 A의 문건 집합을 다출원 기술 분야별로 출력하는 분석과, 상기 출력된 각 기술 분야별 문건 집합을 대상으로 이 문건 집합에 속하는 문건을 인용하는 타인들의 문건 집합을 구하며, 이 타문건 집합을 분석 대상 문건 집합으로 하여 다출원인들을 추출하여 최종적인 분석 결과로 제공한다.

상기 자기 집합 기준 자기 집합 분석에 대해서는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 다차원 분석용 연산 수행 결과 테이블에서 기설정된 최종 결과까지 동일한 다차원 분석용 연산 수행 결과 테이블에 생성해 놓을 수 있다. 예를 들어, 출원인별 최빈 IPC별 연도별 출원수나 점유율과 같은 분석 결과를 생성하기 위해서는 1개의 다차원 분석용 연산 수행 결과 테이블로도 충분한 경우가 많다.

한편, 상기 자기 집합 기준 타 집합 분석 유형의 경우에는 1) 최종 결과까지 미리 생성해 놓는 경우, 2) 최종 결과까지를 각 단계별로 나누고, 각 단계별에서 생성되는 단계별 결과를 다음 단계의 입력값으로 하는 방법이 있을 수 있다. 후자의 경우, 1) 최종 결과까지 단계별로 구분될 수 있을 것, 2) 최초 및 각 단계별 결과를 입력값으로 하여 다음 단계의 출력값을 생성할 수 있도록 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 입력값에 대한 출력값을 계산해 놓은 다차원 분석용 연산 수행 결과 테이블 데이터나 큐브 데이터가 있을 것, 3) 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 최초 및 각 단계별 결과를 입력값으로 받을 수 있을 것과 같은 조건이 성립해야 한다.

상기 출원인 A의 문건을 중 다출원 기술 분야별로 다수 인용하는 인용자(출원인, assignee)에 대한 데이터를 얻으려는 경우의 예를 들어서 설명하면 다음과 같다. 상기 결과는 다음과 같은 단계를 거쳐 입수될 수 있다. 1) 출원인 A가 확정되는 단계(출원인 A는 모든 출원인 전체 집합 중의 한 원소이므로, A는 확정된다), 2) 하나의 국가(예를 들면 미국)에서의 A의 문건 집합이 확정되는 단계(예를 들어 A의 전체 출원 문건 집합이라 하자), 3) A의 모든 문건 집합에는 IPC나 USPC 등이 적어도 하나 이상 부여되어 있으므로, 선택된 특허 분류 기호의 종류와 레벨(예를 들어 IPC, subclass레벨)이 주어진다면 그 주어진 값을 기준으로, 주어지지 않는다면 모든 특허 분류 기호의 종류 및 모든 레벨에서), 각 종류 및 레벨에 속하는 문건 부분 집합(예를 들면, IPC H04N, H01B 등등)이 확정되는 단계, 4) 기술 분야별로 문건 부분 집합을 카운팅하여 다출원 기술 분야의 랭킹을 추출하는 단계, 5) 각 문건 부분 집합별로(예를 들면, A의 모든 문건 중 IPC H04N에 대하여) 그 문건 집합에 속하는 개별 문건을 추출(예를 들면 문건 #1,...#n)하는 단계, 6) 각 개별 문건별로 이 문건 번호를 인용하고 있는 타문건 번호들을 추출하는 단계, 7) 추출된 타문건 번호의 출원인을 추출하는 단계, 8) 추출된 타문건 번호의 출원인을 상기 부분 문건 집합별로 합하는 단계(출원인의 빈도값은 함께 저장된다), 9) 상기 합해진 출원인을 빈도 순으로 상기 기술 분야별(특허 기술 분류의 종류 및 레벨)별로 저장하는 단계(이때, 각 출원인별 문건의 개수(및/또는 타문건 번호 정보)도 함께 저장된다)를 거치면 출원인 A의 문건 중 다출원 기술 분야(특허 기술 분류 및 레벨)에 따른 다수 인용하는 출원인을 확정해 놓은 수 있다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 모든 출원인 중에서 선택되는 어느 하나 이상의 출원인을 대상으로 하여 상기 1) ~9)까지의 단계를 수행한 다음 그 결과값을 데이터로 저장해 놓을 수 있다. 상기 1~2) 및/또는 3)는 최초 자기 입력에 대응되는 분석 대상 문건 집합의 확정과 관련되어 있고, 4)~5)는 최초 자기 입력 기준에 대한 자기 자신의 분석에 대응되며, 6)은 분석 결과를 얻기 위한 타문건 집합의 생성과 관련되며, 7) ~9)는 최종 타출력에 대응되는 최종 분석 결과의 생성과 관련된다. 이 경우, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성해 놓은 최종 분석 결과를 입수되는 조건에 맞게 불러와서 보여 주면 된다. 상기 조건은 상기 사용자 또는 기타로부터 입력되는 IPC 등의 특허 기술 분류의 종류 및 레벨, 국가 등이 될 것이다.

상기 1) ~9)의 단계가 상기 다단계형 분석을 거칠때는 다음과 같은 그룹화된 다단계가 가능할 것이다. 이 경우 상기 분석 모듈은 다음과 같은 방식으로 작동 될 수 있을 것이다.

첫째, 상기 분석 모듈이 출원인 A의 다출원 기술 분야별 문건 집합을 확정하는 단계이다. 이 때 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 모든 출원인에 대하여 1)~4)의 과정을 수행하여 다출원 기술 분야의 랭킹 및 그 기술 분야별로의 문건 부분 집합의 수를 확정해 놓은 데이터로부터 출원인 A에 관한 데이터를 입수할 수 있다.

둘째, 상기 분석 모듈의 문건 집합 입수 모듈이 상기 5)의 문건 번호를 입수하는 단계이다. 상기 문건 부분 집합의 수가 있을 때, 상기 모든 수는 SQL 쿼리에 대응될 수 있으므로, 상기 SQL 쿼리로 상기 5)의 문건 번호를 확정할 수 있다. 상기 문건 번호는 사전에 다차원 분석용 연산 수행 결과 테이블 또는 큐브 데이터에 저장되어 있을 수도 있지만, 저장하지 않는 것이 합리적일 것이다.(SQL로 언제든지 불러 낼 수 있기 때문이다). 상기 문건 집합 입수 모듈은 기설정된 조건에 따른 문건 집합을 입수하여 합집합 연산을 수행하는 모듈을 말한다. 이 경우 SQL이 문건 집합을 입수하기 위한 조건에 해당된다.

셋째, 상기 분석 모듈의 상기 문건 집합 입수 모듈이 상기 6)단계를 수행한다. 상기 문건 집합 입수 모듈이 상기 5) 단계의 문건 번호를 서지 사항 DB에 질의하거나, 검색 엔진에 질의함으로써 6) 단계의 타문건 집합이 입수된다. 물론, 상기 서지 사항 DB에는 각 문건은 자신이 인용하고 있는 타문건 번호에 관한 정보(reference 정보)를 포함하고 있거나, 상기 검색 인덱스(401-2)에 특정 문건 번호를 질의했을 때, 질의된 특정 문건 번호를 상기 인용/레퍼런스(reference) 정보로 포함하고 있는 문건 번호를 출력해 줄 수 있어야 한다.(즉, 인덱싱을 수행할 때 a문건에 인용 정보로 #1, #2 문건 번호가 있을 때, 검색 인덱서(401-3)가 인용 필드의 검색을 위해서 a <- #1, a <- #2와 같이 역파일 정보를 생성하여 검색 인덱스(401-2)로 처리해 놓은 경우, 검색 엔진의 인용 검색 필드에 #1이라는 문건 번호를 입력하면, 자신을 인용하고 있는 문건 a를 포함한 여러 문건을 출력해 주게 된다.)

넷째, 상기 6)단계를 통하여 분석의 대상이 되는 타문건 집합이 생성되고, 이렇게 생성된 타문건 집합에 대한 7) 이후의 각종 분석은 본 발명의 직접 분석 모듈이 수행한다. 상기 분석 모듈은 상기 분석 모듈에 포함되어 있는 직접 분석 모듈을 호출하여 상기 7)~9)를 수행한다. 상기 직접 분석 모듈은 주어진 임의의 문건 집합에 대하여 문건 집합이 주어질 때, 기설정된 분석 프로세서를 수행하는 분석 엔진을 말한다.(사전에 기설정될 수 없는 문건 집합, 기설정되기에는 문건 집합의 경우의 수가 너무 많은 경우에 그 문건 집합의 분석 결과를 사전에 생성해 놓는 것은 불가능하거나 불합리하다. 그러므로, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 4) 단계까지만 생성해 놓는 것이 합리적이다.) 직접 분석 모듈이 수행하는 역할은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 수행하는 역할과 대등하다. 즉, 상기 5)의 단계를 통하여

상기 직접 분석 모듈 및 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 분석 대상 문건 집합이 입력되는 최초 단계만이 다를 뿐이며, 일단 문건 집합이 입수된 후 진행되는 분석 결과 데이터 생성 과정은 동일하다.

자기 집합 기준 타 집합 분석의 유형

상기 자기 집합 기준 타 집합 분석에 대해 더욱 상세하게 설명한다. 상기 자기 집합 기준 타 집합 분석의 첫번째 단계는 자기 집합을 대상으로 기준 추출하는 것이다. 상기 기준에는 자기 문건 집합을 기준으로 하여 1) 출원이나 등록이 많은 레벨별 특허 분류 기호, 2) 집중율/점유율/활동율이 레벨별 특허 분류 기호, 3) 국내/해외 패밀리 사이즈가 큰 레벨별 특허 분류 기호, 4) 피인용이 많은 레벨별 특허 분류 기호, 5) 융합이 다수 발생하는 레벨별 특허 분류 기호, 6) 청구항의 평균 개수 등과 같은 각종 카운팅 값이 높은 레벨별 특허 분류 기호 등이 있을 수 있다. 상기 1) ~6)는 기설정된 기간(예를 들어 출원일 기준 최근 7개년 간 등)별로 추출할 수도 있을 것이며, 상기 1) ~6)는 상기 출원수/등록수, 점유율/집중율/활동율, 패밀리사이즈, 피인용, 융합의 계량화된 수치의 변동값(증감율, 변화속도 등)이 기설정된 기준을 넘는 경우를 조건으로 추출할 수도 있을 것이며, 상기 1) ~6)을 국가 단위로도 추출할 수 있을 것이다.

도 17 등에 포함된 랭킹 1위 H01L, 2위 H04N 등은 자기 집합을 대상으로 하여 추출된 기준의 일례를 보여 준다. 상기 자기 집합은 본 명세서에서 설명하는 문건 집합의 확정에 따라 확정된 문건 집합을 의미한다.

둘째 단계는, 상기 자기 집합을 대상으로 추출된 기준에 대하여, 분석 결과를 생성하는 단계이다. 상기 분석 결과를 생성하기 위하여 상기 분석 주제별 분석 모듈은 기설정된 분석 질의식으로 기설정된 다차원 분석용 연산 수행 결과 테이블에 질의한다. 이때, 상기 다차원 분석용 연산 수행 결과 테이블은 상기 자기 집합이 아닌 집합 또는 자기 집합이 포함될 수도 있는 타 전체 집합을 대상으로 생성된 것이다. 수 있다. 예를 들어, 자기 집합이 아닌 집합의 경우에는 1) 자기 집합이 제 1국 기준의 집합일 경우, 제1국이 아닌 제 2국의 문건 집합이 대표적이다. 한편, 상기 자기 집합이 포함될 수도 있는 타 전체 집합에는 인용 분석에서 활용되는 i) 전체 전방 인용 문건 집합, ii) 전체 후방 인용 문건 집합을 대상으로 한 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합이 대표적이다.

한편, 자기 집합 기준 타 집합 분석의 대표적인 예로 경쟁 분석이 있다. 출원인 단위 경쟁 분석을 예로 들면서 경쟁 분석을 설명한다. 제 1국의 특정 출원인의 전체 또는 일부의 문건 집합을 대상으로 하여, 상기 문건 집합을 자기 집합으로 하여 적어도 하나 이상의 특허 분류 기호 레벨 단위(예를 들면 IPC 서브클래스)에 서 상기 출원인의 다출원/다등록 기준 IPC, 고집중율, 고점유율, 고활동율 또는 기타 특허 지표별로 랭킹이 높은 IPC를 추출할 수 있을 것이다. 상기 추출한 IPC에 대하여 제1국 또는 제2국에서 상기 다출원/다등록 출원인, 집중율이 높은 출원인 점유율이 높은 출원인, 고활동율이 높은 출원인 또는 기타 특허 지표가 높은 출원인의 랭킹을 추출할 수 있을 것이다. 한편, 출원인 단위가 아니더라도 출원인의 발명자 단위, 발명자 단위, 대리인 단위 등의 각종 단위별로 본 문단에서 출원인 단위에서 수행한 정보 처리를 동일하게 하여, 그 단위별로의 경쟁 분석을 수행할 수 있다. 물론, 상기의 타 집합 분석 결과를 생성하기 위하여 본 발명의 분석 모듈은 IPC 각 레벨별로 출원/등록 총량, 점유율, 집중율, 활동율이 다차원 연산되어 포함되어 있는 다차원 분석용 연산 수행 결과 테이블에 기설정된 분석 질의식으로 접근하여 목적하는 분석 결과를 추출해 낸다.

상기 분석 모듈은 분석 주제별 분석 쿼리식으로 해당 다차원 분석용 연산 수행 결과 테이블에 질의하여 분석 결과를 입수하여 출력한다. 이때, 상기 분석 결과의 출력은 각 언어별로 출력되는 것이 바람직하다.

한편, 수치값이 주어졌을 때, 그 수치값의 변화값(증감율, 속도, 가속도) 및 통계값(평균과 표준편차 등)도 유용한 정보가 될 수 있다. 이때, 1) 그 변화값과 통계값까지 다차원 분석용 연산 수행 결과 테이블 에 생성해 놓는 방법도 적용될 수 있으며, 2) 상기 분석 모듈 단에서 입수된 수치값으로 즉석에서 계산하는 방법이 있을 수 있다. 이때, 그 수치값이 단순한 출원/등록량 등과 같은 카운팅값인 경우 2)의 방법이 용이할 수 있으며, 점유율, 집중율 및 활동율과 같은 비율값 인 경우 1)의 방법이 더 용이할 수 있을 것이다. 예를 들어, A 기업의 H04N 7/02 기술 영역에서 2000년도부터 2005년까지의 출원 총계나 출원수 증감율 등은 그 수치값이 카운팅 정보이므로, 연도별 출원 수만으로 용이하게 계산될 수 있다. 한편, 2000년도부터 2005년도까지의 A 기업의 H04N 7/02 영역에서의 연도별 점유율, 집중율, 및 활동율 수치값으로, 평균값(비율값의 총계는 의미가 없음)을 계산하는 경우, 비율값의 합산이 의미가 없으므로, 각 분석 지표에 대응되는 공식을 연도별이 아니라, 2000년부터 2005년까지의 연도 통합적으로 적용해야 한다. 그러므로, 비율값의 계산은 상기 2)의 방법과 같이 사전에 다차원 분석용 연산 수행 결과 테이블의 생성 시 함께 생성되는 것이 바람직할 것이다.

본 발명의 분석 모듈에는 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등과 같이 DB 자체를 대상으로 하는 마스트 DB 분석 모듈이 있다. 상기 마스트 DB 분석 모듈은 주제별로 마련되며, 상기 마스트 DB 분석 모듈이 수행하는 것은 분석 주제마다 어떤 마스트 DB의 어떤 테이블을 조인하여 나온 값을 어떻게 처리하는 지에 대한 정보를 담과 있는 SQL 쿼리문 또는 상기 SQL 쿼리문이 입수한 데이터를 재처리하는 애플리케인션을 포함하고 있다. 상기 마스트 DB 분석 모듈은 서브 쿼리(sub query)를 다수 사용하여야 하는데, 상기 서브 쿼리는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 것과 동등한 다차원 분석용 연산 수행 결과 테이블의 일부(1개의 레코드 또는 복수개의 레코드) 또는 전부의 내용을 생성하는 역할을 담당한다.

사용자가 검색어 등을 입력하여 생성되는 사용자 직접 생성 문건 집합을 분 석 대상 문건 집합으로 하는 경우를 예로 들면서 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402) 및 상기 서브 쿼리에 대해서 더욱 상세하게 설명한다. 사용자 직접 생성 문건 집합은 사용자가 생성하기 전에는 문건 집합이 사전에 확정되지 않으므로, 사전에 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)으로 다차원 분석용 연산 수행 결과 테이블을 사전에 생성해 놓을 수 없는 문제가 있다. 그러므로, 사용자 직접 생성 문건 집합을 대상으로 분석을 수행하는 경우에는, 분석 대상 문건 집합 확정 후 다음 2가지 방법 중 어느 한 가지 방법 이상으로 사용한다. 첫째, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 사용자 직접 생성 문건 집합을 대상으로 다차원 분석용 연산 수행 결과 테이블을 생성해 놓고, 상기 다차원 분석용 연산 수행 결과 테이블을 대상으로 각종 분석 주제별 분석 모듈이 해당 분석 질의식으로 상기 테이블에 접근하여, 분석 결과를 생성하는 방법이다. 둘째는 상기 마스트 DB 분석 모듈이 상기 사용자 직접 생성 문건 집합에 포함된 문건에 대하여 적어도 하나 이상의 서브 쿼리를 사용하여 다차원 분석용 연산 수행 결과 테이블에 포함된 데이터와 대등한 데이터(테이블 또는 뷰)를 생성해 놓고, 상기 데이터에 상기 분석 주제별 마스트 DB 분석 모듈이 해당 분석 질의식(메인 쿼리)으로 상기 생성해 놓은 데이터에 접근하여 분석 결과를 생성하는 방법이다. 상기 다차원 분석용 연산 수행 결과 테이블에 포함된 데이터와 대등한 데이터란 말은 롤업 연산 또는 큐브 연산과 같이 적어도 하나 이상의 차원으로 차 원 연산 처리한 결과와 대등한 데이터를 말한다.

분석의 방향 계열

상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블은 다음과 같은 계열이 있을 수 있다. 분석이란 본질적으로 특정한 데이터에서 목적하는 바를 입수하는 것이므로, 분석의 종류는 1)분석 대상 문건 집합의 속성과 2) 분석 주제에 의해서 결정나게 되며, 부가적으로 3) 분석 결과를 출력해 주는 형태에 따라 결정나게 된다. 그러므로, 상기 1), 2) 및/또는 3)에 따라 분석 종류별로 이름붙이기(naming)이 되게 된다.

이하, 각종 분석 종류를 예시적으로 설명하면서, 상기 1), 2), 3)과 관련 지어 본다.

첫째, 분석 대상 문건 집합의 속성은 본 명세서에서 다수 언급한 적이 있는 문건 집합이 확정되었을 때의 그 확정의 기준에 따라 결정된다. 출원인, 발명자, 특정 레벨의 특허 분류 기호, 전방 인용 문건 집합 등등은 모두 분석 대상 문건 집합의 속성에 따른 것이다. 이들 분석 대상 문건 집합은 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 입수하는 문건 집합의 단위의 한 예가 된다.

둘째, 분석 주제에 따른 분류로, 상기 분석 주제에 따라, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 어떠한 다차원 분석용 연산 수행 결과 테이블을 생성할 것인지와 상기 다차원 분석용 연산 수행 결과 테이블에 어떠한 분 석 질의식으로 질의할 것인지를 결정하게 된다.

셋째, 분석 결과를 출력해 주는 형태에 따른 분류로 이에는 다음과 같은 2가지가 있다. 1) 단일 분석과 2) 비교 분석이 있다. 단일 분석에는 한 종류의 분석 결과를 1개의 단일한 기준으로 제시해 주는 것이며, 비교 분석은 한 종류(동일한 종류)의 분석 결과를 2개 이상의 기준으로 제시해 주는 것이다. 예를 들어 2 이상의 출원인별/기업별(예를 들면 삼성전자와 LG전자)로 동일한 분석 결과(예를 들면 연도별 IPC 레벨별 특정 국가에서의 출원수)를 함께 제시해 주는 출원인별/기업별 비교 분석의 가장 단순한 예가 된다. 이때, 상기 예에서 연도별 IPC 레벨별 특정 국가에서의 출원수는 상기 2개 이상의 출원인별/기업별로 동일한 종류의 분석 결과가 됨을 알 수 있다. 비교 분석 결과는 비교 대상의 선택에 따라 사용자에게 최종적으로 출력해 주는 결과가 달라지므로, 사용자로부터 비교 대상의 선택을 입수 받고, 각 선택 대상별로 상기 다차원 분석용 연산 수행 결과 테이블에 기설정된 분석 주제별 분석 질의식으로 질의한 다음, 각 선택 대상별로의 분석 결과를 결합하면 된다. 상기 예에서는 삼성전자 및 LG전자에 대해서 각각 동등한 분석 결과를 생성하고, 이를 비교하는 방식으로 결합하면, 비교 분석 결과값이 생성되게 된다.

감시 모듈(403)

특허 정보의 감시란, 업데이트 되는 특허 정보를 대상으로한 감시(watching, monitoring, alerting) 활동을 말한다.

감시 서비스를 수행하기 위해서는 1) 감시를 위한 검색식을 등록받는 단계; 기설정된 시간 단위로 상기 검색식을 검색 엔진 또는 DBMS(201)에 질의하고(질의할 때는 신규 문건을 찾는 것이 목적이므로, 시간 범위(예를 들면 공개 일자 기준으로 검색 질의하는 일자 포함 기준으로 과거 6일을 시간 범위로 한정함)을 검색식에 한정하는 것이 일반적이다.), 신규 특허 문건이 있는 경우 이를 감시 서비스 받은 자에게 전송하는 단계를 거칠 수 있다. 감시 서비스의 특별한 형태는 도 ***에 있는 기술, 기업, 제품 등의 분류 체계를 트리 구조로 구성하고, 트리를 구성하는 각 노드(node)에 감식 검색식을 결합하는 방법을 제시할 수 있다.

본 발명의 감시 모듈(403)에 입력되는 감시 검색식은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템(1)에 사전에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 감시 검색식 또는 상기 발명자 명의 단위에서 필요한 감시 검색식이 자동으로 추출되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 감시 서비스에 세팅이 되게 된다. 상기 세팅되는 감시 검색식의 종류 및 상기 세팅되는 감시 검색식을 생성하는 방법은 다음과 같은 것이 있을 수 있다. 먼저 문건 집합 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 감시 검색식에 포함될 정보는 상기 본 발명의 분석 모듈에서 생성되는 분석 결과인 경우가 다수 있다. 상기와 같은 예로는 상기 수치값, 상기 비 율값 등의 최빈값, 최대값 등을 들 수가 있다. 구체적인 예는 하나씩 설명한다.

출원인 명의 단위 또는 발명자 명의 단위 감시

첫째, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 적어도 하나 이상의 최빈 특허 분류 기호를 빈도 순으로 랭킹을 매겨 추출하고, 상기 최빈 특허 분류 기호를 기설정된 국가 또는 특허 정보 마스트 DB가 입수하는 문건의 발생국(WIPO를 포함한다) 중에서 선택되는 적어도 어느 하나 이상의 국가별로 감시할 검색식으로 등록해 놓을 수 있다.

출원인 명의로 특정되는 특허 문건 집합에서 적어도 하나 이상의 최빈 특허 분류 기호에 대해서 1) 국내외에서 가장 많은 특허를 출원하거나 등록하는 자, 2) 국내외에서 일정 개수 이상을 출원하면서도 상기 최빈 특허 분류 기호에 집중율이 높은 자, 3) 국내외에서 기설정된 최근 기간 내에 특허 출원 속도나 특허 등록 속도가 기설정된 기준 이상이 되는 출원인을 추출하고, 상기 출원인을 감시 검색식으로 할 수 있다.

적어도 하나 이상의 최빈 특허 분류 기호에 대해서 상기 특허 분류 기호 및 상기 특허 분류 기호의 하위 특허 분류 기호에 대응되는 기설정된 최근 기간 내의 신규 문건 수의 증가 속도가 높은 특허 분류 기호를 감시 검색식으로 할 수 있다.

적어도 하나 이상의 최빈 특허 분류 기호에 가장 많은 특허를 출원하거나 등록하는 적어도 하나 이상의 국내외의 발명자를 추출해 내고, 상기 발명자를 감시 검색식으로 할 수 있다.

상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 인용 정보(인용(backward citation), 피인용(forward citation)를 추출해 내고, 국내외적으로 최빈 인용자 및/또는 최빈 피인용자를 추출해 내고, 상기 최빈 인용자 또는 피인용자를 출원인으로 하여 감시 검색식으로 할 수 있다.

상기 문건 집합의 어느 하나 이상의 개별 특허 문건을 인용하는 자를 감시하기 위하여(상기 특허 문건을 인용하는 자를 찾아 내기 위해서), 상기 문건 집합을 이루는 전체 특허 문건의 출원 번호 또는 등록 번호를 OR 연산자로 묶어 감시 검색식으로 할 수 있다.

상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 전체 문건 집합 단위의 감시 검색식은 각 감시 주제별로 폴더화 되어 감시 서비스 하위에 존재하면서 사용자에게 노출되는 것이 바람직하다. 예를 들어 설명하면, 상기 첫번째 방법의 감시 검색식의 감시 주제는 "최빈 특허 분류 기호를 통한 특허 감시"라는 이름의 폴더가 만들어 지는 것이 바람직하며, 상기 폴더 내에는 각 국가별로 하위 폴더 내지는 하위 계층 구조가 만들어 지는 것이 바람직할 것이다. 상기 전체 문건 집합 단위의 감시 검색식으로 감시한 결과는 상기 폴더 또는 계층 구조에서 확인되는 것이 바람직할 것이다. 물론, 상기 사전에 세팅되는 검색식을 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자 또는 발명자가 수정할 수 있음은 물론이다 하겠다.

특허 인텔리전스 모듈(60)

이하, 본 발명의 특허 인텔리전스 모듈(60)에 대하여 설명한다. 본 발명의 특허 인텔리전스 모듈(60)은 고차원적인 고급 특허 분석을 수행하고, 상기 고급 특허 분석 수행 결과를 저장해 놓거나, 사용자에게 제공하는 기능을 수행한다.

상기 특허 인텔리전스 모듈(60)에는 인용 분석 모듈(601-1)과 비교 분석 모듈(601-2)이 포함된 분석 모듈(601), 핵심 분야의 발견과 관련된 핵심 분야 발견 모듈(602), 관련성 있는 집단 정보를 생성해 내는 유관성 발견 모듈(603), red ocean의 정도 등과 같은 문건 집합 단위의 집합적 속성을 찾아내는 문건 집합 단위 집합적 속성 발견 모듈(604), 신규 주체의 발견이나 선발 주체의 발견 등을 수행하는 포트폴리오 분석 모듈(605), 융합 분석 모듈(606), 유망 분야를 찾아내는 유망 분야 분석 모듈(607), 공백 기술을 찾아내는 공북 기술 분석 모듈(608), 특허 전략을 분석하는 특허 전략 분석 모듈(609) 중 어느 하나 이상을 포함하고 있다.

상기 핵심 분야 발견 모듈(602)에는 핵심 출원인을 발견하는 핵심 출원인 발견 모듈(602-1), 핵심 발명자 발견 모듈(602-2), 핵심 대리인 발견 모듈(602-3), 핵심 특허 분류 기호 발견 모듈(602-4) 등이 있다.

상기 유관성 발견 모듈(603)에는 유관 출원인 발견 모듈(603-1), 유관 발명자 발견 모듈(603-2), 유관 대리인 발견 모듈(603-3), 유관 특허 분류 기호 발견 모듈이 있다.

상기 문건 집합 단위 집합적 속성 발견 모듈(604)에는 red ocean 속성 발견 모듈(604-1)이 있다.

상기 포트폴리오 분석 모듈(605)에는 신규 주체 발견 모듈(605-1) 및 선발 주체 발견 모듈(605-2)이 있으며, 상기 신규 주체 발견 모듈(605-1)에는 신규 진입 출원인 발견 모듈(605-1-1), 신규 진입 발명자 발견 모듈(605-1-2), 신규 진입 대리인 발견 모듈(605-1-3), 상기 선발 주체 발견 모듈(605-2)에는 선발 출원인 발견 모듈(605-2-1), 선발 발명자 발견 모듈(605-2-2), 선발 대리인 발견 모듈(605-2-3)이 있다.

상기 융합 분석 모듈(606)에는 주체별 기술 융합 패턴 분석 모듈(606-1), 기술 분야별 기술 융합 패턴 분석 모듈(606-2), 국가별 기술 융합 패턴 분석 모듈(606-3), 시기별 기술 융합 패턴 분석 모듈(606-4)이 있다. 본 발명의 상기 복수 특허 분류 기호 관계성 전처리 모듈(3900) 및 융합 분석용 다차원 분석용 연산 수행 결과 테이블(205 -7)의 생성 모듈과 이를 이용한 분석 모듈에서 상기 융합 분석 모듈(606)에 대하여 설명하였다. 상기에서 기술 또는 기술 분야를 IPC나 USPC, FT 등과 같은 특허 분류 기호로 한정하는 경우, 특허 분류 기호별, 출원인/발명자별 특허 분류 기호의 관점에서, 국가별 특허 분류 기호의 관점에서 이에 대해서는 상기에서 충분히 설명하였고, 상기 각각에 대하여 시기에 대한 한정을 할 수 있음을 설명하였다.

상기 유망 분야 분석 모듈(607)에는 활용 유망 분야 분석 모듈(607-1), 융합 유망 분야 분석 모듈(607-2)이 있다. 상기 특허 전략 분석 모듈(609)에는 특허 전략 평가 지표 분석 모듈(609-1), 특허 활용도 분석 모듈(609-2), 인수 특허 분석 모듈(609-3) 등이 있다.

출원인 명의 단위 특허 정보 서비스 시스템

이어, 본 발명의 특허 정보 시스템의 일 응용예로서 계층적으로 통합된 특허 정보 서비스 시스템 및 개별 단위 특허 정보 서비스 시스템 에 대하여 설명한다.

본 발명의 출원인 명의 단위 특허 정보 서비스 시스템이란, 개별적인 출원인 명의 단위로 된 특허 정보 시스템을 말하며, 상기 출원인 명의 단위 특허 정보 서비스 시스템이 포함하는 특허 문건 정보에는 상기 출원인 명의가 출원인 및/또는 특허권자 필드에 포함되어 있어, 출원인 명의가 특허 문건 집합을 특정하며, 이렇게 특정된 특허 문건 집합을 대상으로 상기에서 설명한 본 발명 사상의 각종 분석, 통계 처리, 정보 추출 등의 가공 데이터가 사전 또는 실시간으로 생성되어 사용자 컴퓨터에 제공되는 것을 특징으로 한다. 본 발명의 발명자 명의 단위 특허 정보 서비스 시스템이란, 개별적인 발명자 명의 단위로 된 특허 정보 시스템을 말하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템은 특정한 발명자와 관련된 특허 문건 집합을 대상으로 본 발명 사상의 각종 분석, 통계 처리, 청부 추출 등의 가공 데이터가 사전 또는 실시간으로 생성되어 사용자 컴퓨터에 제공되는 것을 특징으로 한다.

하나의 출원인 명의 단위 특허 정보 서비스 시스템에는 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 대응될 수 있음은 물론이다 하겠다. 출원인 명의 단위 특허 정보 서비스 시스템의 하부에는 상기 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 구성되어 있을 수 있으며 이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 특정한 발명자의 상기 발명자 명의 단위 특허 정보 서비스 시스템으로의 접근 권한을 관리할 수 있을 것이다.

본 발명의 개별 단위 출원인 명의 단위 특허 정보 서비스 시스템에 대해서는 도 52에 그 상세한 구성이 나와 있다. 상기 개별 단위의 출원인 명의 단위 특허 정보 서비스 시스템에는 상기 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진, 발명자 단위의 특허 정보 시스템을 생성하는 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 관리하는 관리 모듈, 출원인 명의 단위로 관리되는 출원인 명의 단위 특허 정보 데이터, 발명자 단위로 관리되는 발명자 명의 단위 특허 정보 데이터가 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진(1100)에는 출원 명의인이 결정될 때, 상기 출원 명의인을 출원인/특허권자로 하는 적어도 하나 이상의 국가에의 문건을 입수하는 출원 명의인 단위 문건 입수 모듈(1110), 입수된 출원 명의인 단위의 문건에 대한 정보를 데이터(테이블, DB or view에 들어있는 것을 포함한다)로 생성하는 출원 명의인 단위 문건 집합 DB 생성 모듈(1130) 및 출원 명의인 단위로 특허 정보의 통계, 분석 및 감시, 리포팅 등의 본 발명의 인텔리전스 정보를 생성하는 출원인 명의 단위 특허 정보 인텔리전스 생성 모듈(1150)이 포 함되어 있다.

본 발명의 상기 발명자 단위 특허 정보 서비스 시스템 생성 엔진(1300)은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성엔진과 마찬가지로 작동하며, 그 하부에 발명자 단위 문건 입수 모듈(1310), 발명자 단위 문건 집합 DB 생성 모듈(1330) 및 발명자 명의 단위 특허 정보 인텔리전스 생성 모듈(1350)을 포함할 수 있다.

본 발명의 관리 모듈(1500)에는 출원인 명의 단위 특허 정보 서비스 시스템을 관리하는 출원 명의인 단위 관리 모듈(1510)과 개별 발명자 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 관리하는 발명자 명의 단위 관리 모듈 및 관리 정보를 포함하고 있는 관리 정보 DB(1550)가 있다. 상기 출원인 명의 단위 관리 모듈에는 출원인 명의 단위의 문건 집합 목록을 관리하는 출원인 명의 단위 문건 집합 관리 모듈(1511), 출원인 명의 단위의 특허 정보 인텔리전스를 관리하는 출원인 명의 단위 특허 정보 인텔리전스 관리 모듈(1513) 및 출원인 명의 단위에 속한 개별 발명자의 권한을 관리하는 발명자 권한 관리 모듈(1515)가 있으며, 발명자 등을 적어도 하나 이상의 단계를 두어 다단계 계층으로 관리하는 다단 계층 생성 관리 모듈(1517)이 있다. 한편, 상기 발명자 단위 관리 모듈(1530)에는 발명자 명의 단위 문건 집합 관리 모듈(1531), 발명자 명의 단위 특허 정보 인텔리전스 관리 모듈(1533)

한편, 상기 출원인 명의 단위 특허 정보 데이터(1700)에는 출원인 명의 단위 특허 문건 집합 DB(1710) 및 출원인 명의 단위 특허 정보 인텔리전스 DB(1730)가 있으며, 상기 발명자 단위 특허 문건 마스트 DB(1900)에는 발명자 단위 특허 문건 집합 DB(1910) 및 발명자 단위 특허 정보 인텔리전스 DB(1930)가 있다.

한편, 개별적인 출원인 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가질 수 있으며, 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 방법은 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템으로의 링크 정보를 가지고 있거나, 다른 출원인 명의 단위 특허 정보 서비스 시스템이 자신의 관리 권한 하에 있는 방법이 있을 수 있다. 이처럼 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 것은 발명자 단위 특허 정보 서비스 시스템의 주체인 개별 발명자도 가능한 것이다.

본 발명의 개별 단위 특허 정보 서비스 시스템 생성 엔진은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진 중 적어도 어느 하나 이상을 포함한다. 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 출원인 명의 단위 문건 집합 입수 모듈, 출원인 명의 단위 문건 집합 관리 모듈을 포함하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 발명자 명의 추출 모듈, 발명자 명의 단위 문건 집합 입수 모듈 및 발명자 명의 단위 문건 집합 관리 모듈을 포함한다. 본 발명의 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진과 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의를 입수 받았을 때, 적어도 하나 이상의 국가별로, 상기 국가별 특허 DB에서 상기 출원인 명의로 출원되거나 등록된 모든 특허 문건을 입수하고, 상기 입수된 특허 문건에서 개별 발명자 명의를 자동적으로 추출하고, 상기 개별 발명자 명의마다의 특허 문건을 자동적으로 입수하여, 출원인 명의 단위의 특허 문건 집합과 상기 출원인 명의 하의 개별 발명자 단위의 특허 문건 집합을 생성하고, 상기 출원인 명의 단위 문건 집합과 상기 발명자 단위 문건 집합에 대한 관리를

본 발명의 출원인 명의 단위 특허 정보 서비스 시스템은 상기 출원인 명의와 관련된 특허 문건 집합을 포함하고 있다. 상기 특허 문건 집합은 상기 출원인 명의로 출원되거나 등록된 출원인 명의 단위 문건 집합과 상기 출원인 명의 단위의 문건 집합에 포함된 개별 발명자별의 발명자 명의 단위의 문건 집합을 포함한다. 상기 출원인 명의 단위 문건 집합과 상기 발명자 명의 단위 문건 집합은 적어도 하나 이상의 국가별 특허 DB를 포함하는 전체 특허 DB로부터 입수할 수도 있지만, 개별 국가별 특허 DB로부터 입수되는 것이 바람직할 것이다. 이를 위해서 각 국가별로 상기 출원인 식별 코드를 통일시켜 놓았을 경우(출원인 대표명화를 제1국 기준으로뿐만 아니라, 적어도 하나 이상의 제 2국 기준으로도 대표명화를 시키고, 상기 제 1국의 출원인과 제 2국의 출원인이 동일한 주체일 경우에는 동일한 출원인 식별 코드를 할당할 수 있다. 출원인은 제1국 기준 또는 제2국 기준 중 적어도 어느 하나 이상으로 대표명화가 되어 있는 것이 바람직하다.

상기와 같은 과정을 통하여, 특정한 출원인 명의 단위에 속하는 특허 문건 부분 집합을 추출할 수 있게 되고, 상기 특허 문건 부분 집합을 관리 대상 문건으 로 하는 출원인 명의 단위 특허 정보 서비스 시스템이 생성될 수 있게 된다.

도 76은 출원인 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.

상기 관리 모듈은 출원인 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2620), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2630), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2640), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2650), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2660), 입수된 변동 사항을 저장한다(S2670).

도 77은 발명자 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.

상기 관리 모듈은 발명자 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2720), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고 (S2730), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2740), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2750), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2760), 입수된 변동 사항을 저장한다(S2770).

발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 작동하는 방법은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진과 동등하며, 다만, 대상 특허 문건 집합이 발명자 단위로 특정되는 것만 다르다.

발명자별 문건 추출

발명자 명의 추출 모듈이 생성한 발명자 전체 목록이 있을 경우, 상기 발명자와 상기 발명자가 발명자로 등재되어 있는 특허 문건 부분 집합을 추출한다.

도 66은 전체 출원인 명의 특허 정보 데이터에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S1620), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진 또는 DB질의를 통하여 검색하며(S1630), 출원인 명의로 출원되거나 등록된 문건이 있는 가를 판단한(S1640) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한 다(S1650). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S1660), 상기 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S1670). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.

도 67은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 출원인 명의 단위 특허 정보 데이터에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고(S1720), 목록에 있는 개별 출원 명의인 정보를 입수하며(S1730), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S1740), 문건이 있는 가를 판단하고(S1750) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S1760), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S1770), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S1780), 상기와 같은 과정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인이 있는가를 판단 한(S1790), 다음 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.

도 68은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 출원인 명의 단위 특허 정보 데이터에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의 단위 특허 정보 서비스 시스템 생성을 위한 문건 집합을 입수하고(S1820), 상기 문건 집합에서 출원 명의인을 추출하고 출원 명의인 목록 정보를 생성한다(S1830)

이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고 목록에 있는 개별 출원 명의인 정보를 입수하며(S1840), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S1750), 문건이 있는 가를 판단한(S1860) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S1870), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S1880), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S1890), 상기와 같은 과 정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인 있는지를 판단하고(S1891) 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.

도 69은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 출원인 명의 단위 특허 정보 데이터에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 외부의 제3자로부터 입수하고(S1920), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진 또는 DB질의를 통하여 검색하며(S1930), 출원인 명의로 출원되거나 등록된 문건이 있는가를 판단하고(S1940) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한다(S1950). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S1960), 상기 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S1970). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.

상기 도 66 내지 도 69의 방법은 개별 국가를 특정하지 않거나, 개별 국가를 특정하는 경우나 모두 적용될 수 있을 것이다. 만약 개별 국가를 특정하지 않는 경우라면 출원인 대표명화가 전제되어야 할 것임은 분명하다 할 것이다.(특히 언어가 다른 국가일 경우에는 더욱 그러할 것이다.)

도 70은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 출원인 명의 단위 특허 정보 데이터를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 66 내지 도 69의 방법은 모두 적용될 수 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2020), 국가 목록을 입수하며(S2030), 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S2040), 문건이 있는 지 판단하고(S2050) 없는 경우에는 국가 단위에서 완료하며, 있는 경우에는 국가 단위에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2060), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 국가 단위에서 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2070), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S2080) 국가 목록에 처리하지 않은 국가가 있는가를 판단하여(S2090) 없는 경우 완료하고, 있는 경우에는 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는(S2040) 단계를 다시 수행한다.

도 71은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2120), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2130), 문건이 있는가를 판단한(S240) 다음, 없으면 제 1국에서 완료하고 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2150), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2160), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2170) 이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하며(S2180), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2190), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하 고, 발명자별로 특허 문건을 대응시키며(S2191), 제 2국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2193),

도 72는 우선권 주장 번호를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2220), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는 단계(S2230), 문건이 있는지를 판단하며(S2240) 없는 경우 제 1국에서 완료하며, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2250), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2260), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2270).

이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고(S2280), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2290), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2291), 제 2국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2293).

도 73은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2320), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2330), 문건이 있는가를 판단하고(S2340), 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2350), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2360), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2370),

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하고(S2380), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2390), 제2국에서 입수되는 특허 문건을 패밀리 특허 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하며(S2391), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2393).

도 74는 패밀리 정보 및 우선권 주장 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2420), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2403), 문건이 있는가를 판단한(S2440) 다음, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2450), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2460), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2470).

이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국 에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고(S2480), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2490), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건을 우선권 주장 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하고(S2491), 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2493).

도 75는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.

상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 입수하고(S2620), 신규 특허 문건에서 출원인 정보를 추출하며(S2630), 출원인 정보로 된 기존 출원인 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한다(S2640).

판단 결과 있는 경우에는 기존 출원인 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2650), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 발명자 정보를 추출하고(S2660), 기존 출원인 명의 단위 특허 정보 서비스 시스템 하부에 발명자 정보로 된 기존 발명자 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한(S2680) 다음, 있는 경우 기존 발명자 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2690), 없는 경우 발명자 정보를 기준으로 발명자 명의 단위 특허 정보 서비스 시스템을 생성하고, 신규 특허 문건 정보를 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2699).

한편, 출원인 정보로 된 기존 출원인 명의 특허 정보 서비스 시스템이 없는 경우에는 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2693), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2695), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2697).

출원인 명의 단위 또는 발명자 명의 단위 분석

본 발명의 분석 모듈에 세팅되는 적어도 하나 이상의 분석 알고리즘은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템에 사전에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 분석 알고리즘 또는 상기 발명자 명의 단위에서 필요한 분석 알고리즘이 자동으로 세팅되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명 자 명의 단위 특허 정보 서비스 시스템의 분석 서비스를 구성하게 된다. 상기 분석 알고리즘의 실행은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때에 실행되어 그 분석 결과를 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 사전에 갖고 있는 것이 바람직하다. 하지만, 상기 분석 알고리즘의 실행 속도가 빠르거나, 실시간 또는 사용자에게 기다림을 주지 않을 정도로 빠른 경우, 상기 분석 알고리즘은 상기 분석 주제에 대하여 외부로부터의 접근(관리자 또는 사용자의 클릭 등)이 있을 때 실행될 수도 있을 것이다. 그러므로, 적어도 2 이상의 분석 알고리즘으로 분석 모듈이 구성될 때, 상기 분석 주제 및 그에 따르는 분석 알고리즘은 사전에 세팅되며 그 실행 시점은 다를 수 있을 것이다.

관리 모듈

이하, 상기 관리 모듈에 포함된 다단 계층 관리 모듈에 대해서 설명한다. 먼저 다단 계층 관리의 문제가 발생하는 상황에 대해 설명한다. 하나의 출원인이 상당히 많은 수의 발명자가 소속되어 있을 경우, 상기 발명자가 적어도 하나 이상의 계층적 조직에 속할 수 있다. 예를 들어 설명하면, 한 사람의 발명자는 a1팀<a부서<A1계열<A회사<alpha그룹에 소속될 수 있을 것이다. 그러므로, 관리적인 측면에서는 a1팀은 상기 발명자 단위의 특허 정보 서비스 시스템 및 a1팀과 관련된 특허 문건을 그 관리 대상으로 하는 것이 당연할 것이며, a부서는 a1 내지 an까지의 각 부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 관리의 대상으로 하는 것이, A1계열은 a부서부터 z부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 까지를, A회사는 A1계열부터 AM계열까지의 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을, alpha그룹은 A회사부터 Z회사까지의 출원인 명의 단위 특허 정보 서비스 시스템, 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건 등을 관리하여 할 것이다. 하지만, 공개되는 문건에서 입수할 수 있는 정보는 발명자 명의와 회사 명의뿐인 경우가 대부분이므로(즉, 특허 문건에는 출원인 정보 이외에 그 발명자가 소속된 집단에 관한 정보는 없는 것이 통상이다), 각 단계의 관리자 및/또는 최고 단계의 관리자가 특정 특허 문건이 어디에 소속되어야 되는지에 대한 정리를 해 줄 필요가 있게 된다. 상기 특허 정보 서비스 시스템은 관리될 특허 문건을 통해서 생성되기 때문에, 상기 특허 문건이 어느 발명자, 어느 팀, 어느 부서, 어느 계열, 어느 회사에 대응되는지에 대한 소속 정보가 있을 경우, 상기 소속 정보를 통해서 특허 정보 서비스 시스템을 생성할 수 있게 된다. 상기 소속 정보를 정하기 위해서 특허 문건과 발명자, 회사에 관한 정보는 특허 문건 자체에서 입수할 수 있다. 그러므로, 상기 발명자가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 알거나, 상기 문건 자체가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 아는 등, 상기 소속 정보를 대응시키는 임의의 수단에 의해, 상기 특허 문건이 소속되는 집단이 결정될 수 있다.

개별 단위 특허 정보 시스템 관리 모듈

2 이상의 출원인 명의 단위 특허 정보 시스템이 생성되는 경우, 상기 특허 정보 서비스 시스템들이 관리될 필요가 있으며, 상기 관리는 개단 특허 정보 서비 스 시스템 관리 모듈이 수행한다. 상기 개단 특허 정보 서비스 시스템 관리 모듈은 상기 출원인 명의 단위 특허 정보 서비스 시스템에 대한 인증, 권한 관리, 권한 이양, 삭제, 위치나 소속의 변경 등의 관리를 수행한다.

상기와 같이 다수의 출원인 명의 단위 특허 정보 서비스 시스템들이 생성되었을 경우, 전체 시스템적 관점에서 통합하여 관리할 필요가 있으며, 상기 통합 관리를 수행하는 것은 본 발명의 통합 관리 모듈이 수행한다. 도 65는 통합 관리 모듈의 구성의 일 실시예를 보여 주고 있는데, 상기 통합 관리 모듈에는 개별 단위 특허 정보 시스템 다단 그룹화 모듈(6100)과 개별 단위 특허 정보 시스템 관리 모듈(6300)이 있어, 개별 단위 특허 정보 서비스 시스템을 다단 그룹화하며, 상기 다단 그룹화된 특허 정보 서비스 시스템을 관리할 수 있게 된다.

출원인 단위 특허 정보 서비스 시스템의 구현예

도 124은 나스닥 등록 기업 중의 하나인 3COM(6번)을 선택했을 때에 나타나는 3COM의 특허 정보 시스템의 내부 중 특허 포트폴리오 중 특허 리스트 중 국가 선택에서 미국 특허 탭을 선택했을 때 나오는 일실시예적 구현예이다. 상기 3COM에 대한 입력이 있을 경우, 본 발명의 특허 정보 서비스 시스템은 3COM에 대한 미국 문건을 검색하거나, 특허 문건 마스트 DB에 조회하여 3COM에 대한 문건 목록을 생성하여 사용자에게 제시할 수 있다.

도 125는 도 124에서 발명자 리스트를 선택한 다음 국가 탭에서 미국을 선택했을 때 3COM의 발명자 목록이 나오는 화면이다. 본 발명의 특허 정보 서비스 시스템은 상기 특허 문건 마스트 DB에 조회하거나, 상기 발명자 분석용 다차원 분석용 연산 수행 결과 테이블에 질의하여 3COM의 모든 발명자 목록을 추출할 수 있을 것이다. 한편, 3COM의 발명자를 ABC 순으로 나열할 수도 있지만, 다출원/다등록 또는 다인용 등의 다른 순서로 나열하는 것도 당업자에게는 자명할 것이다.

도 126는 도 125에서 발명자 리스트에서 Aldous Stepha..(9번)을 선택했을 때 이 발명자와 관계된 특허 문건 목록이 나오는 화면이다. 본 발명의 상기 특허 정보 서비스 시스템은 발명자에 대한 선택 정보를 입수받은 다음, 그 입수 받은 발명자 정보로 상기 특허 문건 마스트 DB에 조회함으로써, 그 발명자에 해당되는 문건 목록을 생성하여 사용자에게 제시할 수 있을 것이다.

도 127은 3COM에 대한 도 124에서 통계 분석탭을 누르고 기술영역 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 출원수에 대한 일실시예적 구현예이다. 이 화면에는 드릴 다운과 특정 셀값을 눌렀을 때 나오는 간이 분석 화면이 팝업으로 나와 있다.

도 128은 3COM에 대한 도 124에서 통계 분석탭을 누르고 경쟁사 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 USPC 서브클래스 레벨에서의 각 USPC별 연도별 출원수에 기준한 경쟁 출원인에 대한 정보가 나오는 일실시예적 구현예이다.

도 129는 3COM에 대한 도 124에서 통계 분석탭을 누르고 미국인용 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 3COM의 출원 문건 전체 집합을 인용 기준 문건 집합으로 했을 경우, 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 130은 3COM에 대한 도 124에서 통계 분석탭을 누르고 발명자 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 다출원 발명자에 대한 일실시예적 구현예이다.

도 131은 하위 특허 분류에 관한 정보를 자동으로 포함시켜 특허 문건 집합에 대한 가공 특허 정보를 생성하는 일실시예적 방법에 관한 도면이다.

도 132는 특허 문건 집합이 선택되었을 때, 다차원 분석을 포함하는 가공 특허 정보를 생성하는 일실시예적 방법에 관한 도면이다.

도 133은 특허 문건 집합이 선택되었을 때 융합 분석을 수행하는 일실시예적 방법에 관한 도면이다. 융합 분석 수행 결과의 일 예시는 도 142내지 143에 있다. 융합 분석의 수행 결과는 네트워크 다이어그램으로 표현될 수도 있다. 즉, 출원인, 발명자, 특허 분류 기호, 대표 어구나 기술 키워드, 인용 특허 문건 번호(하나의 특허 문건에 포함된 n개의 인용 특허(reference)들을 말함) 등이 네트워크 다이어그램 상에서 노드를 구성하고, 각 노드와 노드 사이에는 공통(co-occurrence)이 발생한 경우의 숫자값을 표시할 수도 있다. 노드의 크기는 해당 문건의 숫자 또는 기타 지표를 반영할 수 있을 것이다. 물론, 숫자에 클릭할 경우, 도 48에서와 같이 해당 문건 집합의 리스트를 보여 줄 수 있음은 물론이다 할 것이다. 네트워크 다이어그램을 생성하기 위해서는 특정되는 특허 문건 집합에서 추출한 노드 간에 association 결과 데이터가 생성되어 있어야 한다.

도 134는 수치에 대한 선택이 있는 경우, 그 수치에 대응되는 특허 문건 정보를 제공해 주는 일실시예적 방법에 관한 도면이다. 이에 대한 구체적인 예시는 도 48에서 확인할 수 있다. 도 48에서는 숫자를 눌렀을 때 팝업 창이 열려 특허 리스트를 제공해 주는 것을 보여주고 있다.

도 135는 출원인별, 특허 분류 기호별, 발명자별, 대리인별로 다차원 분석을 제공하는 일실시예적 방법에 관한 도면이다. 본 발명의 도 17 내지 도 50에는 각 분석 종류별로 다양한 메뉴가 존재함을 예시적으로 보여 주고 있다.

한편, 특허 독립의 원칙 상 제1국에 출원되거나 등록된 특허라도 제2국에 출원되거나 등록되지 않은 경우, 제2국에서는 보호 받지 못한다. 그러므로, 제1국 특허 검색 결과에서 나온 특허 리스트를 구성하는 개별 특허 문건에 대하여 적어도 하나 이상의 제2국에서의 상기 개별 특허 문건에 관련된 패밀리 정보가 있는지를 조사할 수 있을 것이다. 조사 결과 없는 경우라면, 상기 개별 특허 문건이 국제 출원 중인지를 조사할 수 있을 것이며, 국제 출원 중인 경우 최선일 또는 제1국에서의 기준일에서 기설정된 기간(30개월 내지 31개월 등의 국내 단계 진입 기간)이 경과했는지와 제1국 출원일로부터 1년이 경과했는지 등을 조회한다. 조회 결과 경과된 경우 제2국에 진입할 수 없으므로, 상기 제1국 특허의 검색 결과의 기설정된 주변에 제2국에서의 활용성에 대한 정보를 포함시킬 수 있다. 물론, 제2국에 진입했더라도 현 재 상태 정보가 취하, 무효, 거절 확정, 소멸 등이 된 경우에도 활용성에 대한 정보를 제공해 줄 수 있을 것이다. 한편, 제 2국에 진입되었거나, PCT가 출원 중이며, 기설정된 기간을 도과하지 않은 경우나, 제1국 출원일로부터 1년이 경과하지 않은 경우에는 위험/경고/주의 표시를 활용성 정보로 표시해 줄 수 있을 것이다. 이는 특히, 상기 사용자의 신상 정보에서 제2국에 속한 사용자인 경우를 상기 시스템(10)이 알고 있는 경우에 더욱 유용할 것이며, 나아가 상기 사용자가 자신이 관심을 가지는 제2국들을 지정할 때 더욱 더 유용할 것이다. 제2국은 당연힝 1개 국가 이상일 수 있다. 도 136은 패밀리 정보를 이용하여 제1국에서 검색된 특허의 제2국에서의 활용 가능성을 판단하는 일실시예적 방법에 관한 도면이다. 도 137은 도136에서의 방법을 JP를 제1국으로 하고, #1번 특허 문건에 대하여 KR, US, EU를 제1국으로 하여 제2국에서의 활용 가능성을 판단하는 일실시예적 방법에 대한 흐름도이다. 도 138은 도136 내지 도 137에서 제시되는 방법을 실시했을 경우의 검색 결과 리스트 화면의 일실시예적 도면이다. 검색 결과 리스트의 각 항목에 각 국가별로의 국내 단계에서의 활용성 정보가 포함되어 있음을 알 수 있다.

감시 서비스 내지는 사용자 생성 디렉토리 서비스의 일 구현예로 도 139 내지 도 141의 서비스를 들 수 있다. 사용자는 자신이 관심있는 기술 체계/제품 체계/경쟁사 등을 트리 구조로 구성하고, 트리를 구성하는 각 노드에 검색식이나 기타 수신자 e-mail 등의 관련 정보를 수록해 놓을 수 있을 것이다. 이때 상기 시스템(10)은 기설정된 주기 또는 신규 특허 문건이 입수되었을 때, 상기 검색식을 조회하고, 특허 문건이 발견된 경우에는 상기 특허 문건을 e-mail 등으로 발송해 줄 수 있을 것 이다. 이때, 기계 번역 시스템을 활용하여 수신자가 원하는 언어로 발송할 수 있을 것이다. 한편, 상기 사용자 생성 디렉토리에 검색식이나 문건 집합이 할당된다면, 상기 디렉토리를 구성하는 각 노드에는 특허 문건 집합이 특정될 수 있으며, 문건 집합을 대상으로 하는 본 발명의 각종 분석도 상기 노드 단위로 수행될 수 있을 것이다. 물론, 2개 이상의 노드를 선정하고, 상기 노드 간의 집합 연산을 수행하여 생성되는 새로운 특허 문건 집합에 대하여 상기 각종 분석을 수행할 수 있을 것이다.

도 139는 사용자별로 다단계 계층 구조로 기술 트리를 구성하고, 기술 트리에 검색식을 포함한 각종 정보가 포함되어 있는 본 발명의 감시 서비스/디렉토리 서비스 방법의 일 실시예적 구현예이다.

도 144 내지 도 145는 본 발명의 특허 정보 시스템을 구현하는데 활용되는 인터페이스의 일 예들이다. 상기 인터페이스에는 옵션의 선택과 관련된 인터페이스가 많다. 상기 인터페이스에는 1) 시간 종류 선택 인터페이스, 2) 시간 구간 선택 인터페이스, 3) 국가 선택 인터페이스 4) 특허 분류 기호 선택 인터페이스 5) 인용 특화 인터페이스, 6) 패밀리 정보 포함 선택 인터페이스, 7) 검색 후 선택 인터페이스 중 어느 하나 이상을 포함한다.

상기 시간 종류 인터페이스에는 출원일, 공개일 및 등록일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 시간 구간 선택 인터페이스는 시작 구간과 종료 구간 각각에 대한 년/월/주/일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 국가 선택 인터페이스는 적어도 2 이상의 국가 에 대한 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 특허 분류 기호 선택 인터페이스는 특허 분류 기호의 종류 선택 인터페이스, 특허 분류 기호 레벨 선택 인터페이스, 메인 특허 분류 기호 및 서브 특허 분류 기호 선택 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 인용 특화 인터페이스에는 전방 인용과 후방 인용 중 어느 하나 이상의 선택에 관한 인용 방향 인터페이스, 인용 깊이의 선택에 관한 인용 깊이 인터페이스, 직접 인용과 간접 인용 중 어느 하나 이상의 인용의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며, 상기 패밀리 정보 포함 선택 인터페이스에는 패밀리 정보 포함 여부 및 국가 범위의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함한다.

상기 검색 후 선택 인터페이스는 상기 처리 대상 문건 집합을 검색 대상으로 하여 기설정된 필드 검색을 제시하고, 상기 필드에 사용자 컴퓨터로부터 검색어를 입수받고, 상기 검색어에 대응되는 검색 결과를 제공하고, 상기 검색 결과 중에서 적어도 하나 이상의 선택 정보를 입수 받아, 상기 선택 정보와 관련되는 특허 문건 집합만을 처리 대상 문건 집합으로 하도록 처리하는 인터페이스를 포함한다. 예를 들면, 특정된 특허 문건 집합에서 특정한 출원인들만을 대상으로 할 경우라면, 출원인 검색 필드에 출원인을 입력하면, 상기 특정된 특허 문건 집합에 포함된 출원인 목록이 나오며, 사용자가 이들 중 어느 하나 이상을 선택했을 경우, 그 선택 정보를 입수 받아, 그 선택된 문건 집합만을 대상으로 하거나, 그 선택된 문건 집합을 제외하는 등과 같은 기능을 수행하여 특허 문건 집합의 재특정(respecification)이 완료되도록 한다.

본 발명은 특허 정보 산업 전반에 활용할 수 있다. 구체적으로는 검색, 분석, 컨설팅, 감시, 침해를 위한 조사, 경쟁사에 대한 분석, 기술 융합 패턴 조사 등의 각종 특허 정보 유관 산업에 포괄적으로 활용될 수 있다.

도 1은 본 발명의 특허 정보 시스템 구성도에 관한 일실시예적 도면이다.

도 2는 본 발명의 DB 부에 관한 일실시예적 도면이다.

도 3은 본 발명의 특허 문건 마스트 DB에 관한 일실시예적 도면이다.

도 4는 본 발명의 특허 분류 기호 마스트 DB에 관한 일실시예적 도면이다.

도 5는 본 발명의 주체 마스트 DB에 관한 일실시예적 도면이다.

도 6은 본 발명의 다차원 분석용 연산 수행 결과 테이블 DB에 관한 일실시예적 도면이다.

도 7은 본 발명의 지원 DB부 및 2차 가공 DB부에 관한 일실시예적 도면이다.

도 8은 본 발명의 전처리 모듈부에 관한 일실시예적 도면이다.

도 9는 본 발명의 마스트 DB 생성 모듈에 관한 일실시예적 도면이다.

도 10은 본 발명의 인용 정보 전처리 모듈에 관한 일실시예적 도면이다.

도 11은 본 발명의 특허 정보 처리 기본 모듈에 관한 일실시예적 도면이다.

도 12는 본 발명의 지원 모듈에 관한 일실시예적 도면이다.

도 13은 본 발명의 특허 인텔리전스 모듈에 관한 일실시예적 도면이다.

도 14는 본 발명의 delphion는 본 발명의 하위분류포함검색는 본 발명의 분석이 되지 않는 근거에 관한 일실시예적 도면이다.

도 15는 본 발명의 디렉토리 생성 모듈의 일 구현예에 관한 일실시예적 도면이다.

도 16은 본 발명의 특허 분류 기호 검색 모듈이 작동되는 일 구현예에 관한 일실시예적 도면이다.

도 17은 본 발명의 대한민국에 출원한 삼성전자주식회사의 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 18은 H01L에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다.

도 19는 H01L 21/00 및 기타의 하위 특허 분류 기호에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다.

도 20은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 메인그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 21은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 1 dot 서브 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 22는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 삼성전자주식회사의 출원 문건 기준 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 23은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 등록한 삼성전자주식회사의 등록 문건 기준 IPC 메인 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 24는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC no dot(sub class) 레벨의 다출원 USPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 25는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC 1 dot 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.

도 26은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다.

도 27은 본 발명의 미국 출원 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다.

도 28은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 다출원 기업별 총량 분석에 관한 일실시예적 도면이다.

도 29는 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 점유율 기준 다출원인에 대한 일실시예적 도면이다.

도 30은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 활동율 기준 다출원인에 대한 일실시예적 도면이다.

도 31은 본 발명의 미국 출원 문건 기준 IPC H04B 및 이들의 하위 분류에 대한 드릴다운을 포함한 출원 총량 분석에 대한 일실시예적 도면이다.

도 32는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준으로 한 대표적 경쟁사 분석에 관한 일실 시예적 도면이다.

도 33은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준 다출원 특허 기술 분류 기호별 경쟁 출원인에 관한 분석의 일실시예적 도면이다.

도 34는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국 특허 기준 삼성전자주식회사의 IPC 메인 그룹 기준 출원 총량 기준 경쟁 출원인에 분석의 일실시예적 도면이다.

도 35는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 연도별 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다.

도 36은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 다출원 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다.

도 37은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원 총량을 기준으로 할 때 USPC 서브클래스(no dot, 클래스 직하위) 기준 다출원 경쟁 출원인에 대한 랭킹 분석 결과에 대한 일실시예적 도면이다.

도 38은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연 도별 분석 결과에 대한 일실시예적 도면이다.

도 39는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 40은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 41은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 드릴 다운했을 때를 반영한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 42는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 43은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후 방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 44는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 45는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, IPC 메인 그룹 별 최다 인용 기술에 대한 분석 중에서 IPC에 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.

도 46은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, USPC 서브 클래스(no dot, 클래스 직하위) 최다 인용 기술에 대한 분석 중에서 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.

도 47은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 총량 기준 분석 결과 및 이 분석 결과에 대한 본 발명의 리포팅 모듈 중 차트 생성 모듈이 생성한 차트의 일 실시예적 도면이다.

도 48은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 인용을 많이 받은 발명자의 연도별 인용 총량에 관한 분석 결과 및, 분석 결과에 보이는 특정한 숫자를 클릭했을 때, 그 숫자에 해당하는 문건 집합에 대하여 간이한 분석 결과(문건 목록, 최다 출원인의 연도별 출원수/등록수, 최다 발명자의 연도별 출원수/등록수, 최대 기술 분야별(IPC, USPC, FT) 연도별 출원수/등록수(드릴다운 포함))를 제공해 주는 간이 분석 모듈이 생성한 문건 목록에 대한 일실시예적 도면이다.

도 49는 본 발명의 간이 분석 모듈에서도 최대 기술 분야별(IPC, USPC, FT)로 드릴 다운 기능을 제공함으로 보여주는 일실시예적 도면이다.

도 50은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 출원 문건 중 다출원 IPC 서브클래스 단위의 문건을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.

도 51은 본 발명의 특허 정보 시스템의 일 서브 시스템인 계층적 특허 정보 서비스 시스템에 관한 일실시예적 도면이다.

도 52는 본 발명의 개별 단위 특허 정보 시스템 생성 엔진에 관한 일실시예적 도면이다.

도 53은 본 발명의 특허 정보 전처리 모듈의 내부 구성에 관한 일실시예적 도면이다.

도 54는 본 발명의 가중치 전처리 모듈에 관한 일실시예적 도면이다.

도 55는 본 발명의 인용 정보 전처리 모듈에 관한 일실시예적 도면이다.

도 56은 본 발명의 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)에 관한 일실시예적 도면이다.

도 57은 본 발명의 출원인 대표명화 전처리 모듈에 관한 일실시예적 도면이다.

도 58은 본 발명의 대표 어구 추출 전처리 모듈에 관한 일실시예적 도면이다.

도 59는 본 발명의 패밀리 정보 전처리 모듈에 관한 일실시예적 도면이다.

도 60은 본 발명의 복수 특허 분류 기호 관계성 전처리 모듈에 관한 일실시예적 도면이다.

도 61은 본 발명의 특허 분류 기호별 통계 전처리 모듈에 관한 일실시예적 도면이다.

도 62는 본 발명의 특허 정보 인텔리전스 모듈에 관한 일실시예적 도면이다.

도 63은 본 발명의 분석 모듈에 관한 일실시예적 도면이다.

도 64는 본 발명의 특허 정보 시스템 배치 생성 엔진에 관한 일실시예적 도면이다.

도 65는 본 발명의 통합 관리 모듈의 구성에 관한 일실시예적 도면이다.

도 66은 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

도 67은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

도 68은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

도 69은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.

도 70은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 특허 정보 데이터베이스(2300)를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 66 내지 도 69의 방법은 모두 적용될 수 있다.

도 75는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정 을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.

도 76은 본 발명의 에 관한 일실시예적 도면이다.

도 78은 본 발명의 에 관한 일실시예적 도면이다.

도 79는 본 발명의 비용 지출 관점 가중치 전처리 모듈(3311)이 가중치를 처리하는 방법에 관한 일실시예적 도면이다.

도 80은 본 발명의 인용 관점 가중치 전처리 모듈(3313)이 인용 관점에서 가중치를 전처리하는 방식에 관한 일실시예적 도면이다.

도 81은 본 발명의 분쟁 관점 가중치 전처리 모듈(3315)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 82는 본 발명의 집중 관점 가중치 전처리 모듈(3317)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 83은 본 발명의 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 84는 본 발명의 출원인 단위 가중치 전처리 모듈(3331)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 85는 본 발명의 발명자 단위 가중치 전처리 모듈(3333)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 86은 본 발명의 대리인 단위 가중치 전처리 모듈(3335)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.

도 87은 본 발명의 패밀리 정보 전처리 엔진(3810)이 패밀리 정보를 처리하는 방법에 관한 일실시예적 도면이다.

도 88은 본 발명의 인용 번호를 대표화하는 인용 정보 전처리 방법에 관한 일실시예적 도면이다.

도 89는 본 발명의 특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함하는 방법에 관한 일실시예적 도면이다.

도 90은 본 발명의 인용 정보 전처리 방법에 관한 일실시예적 도면이다.

도 91은 본 발명의 변형 특허 분류 기호를 처리하는 특허 분류 기호 전처리 엔진의 처리 방법에 관한 일실시예적 도면이다.

도 92는 본 발명의 계층적 변형 특허 분류 기호 데이터베이스 생성 모듈이 상기 변형 특허 분류 기호 데이터베이스를 생성하는 방법에 관한 일실시예적 도면이다.

도 93은 USPC 특허 분류 기호로 트리 구조를 만드는 일 실시예적 방법에 관한 도면이다.

도 94는 도 93의 USPC 특허 분류 기호로 트리 구조에 대응되는 변형 특허 분류 기호를 할당하는 방법에 관한 일 실시예적 방법에 관한 도면이다.

도 95는 도 93의 USPC 특허 분류 기호로 만든 트리 구조와 동일한 구조를 가 지는 변형 특허 분류 기호로 구성되는 트리 구조에 관한 일 실시예적 도면이다.

도 96은 Index to U.S. Patent Classification (a.k.a., Classification Index File) 파일)로 도 93와 같은 특허 분류 기호의 트리 구조를 만들 수 있음을 보여 주는 실시예적 도면이다.

도 97은 본 발명의 특허 분류 기호 전처리 방법에 관한 일실시예적 도면이다.

도 98은 본 발명의 대표명화 전처리 모듈이 출원인 대표명화를 수행하는 방법에 관한 일실시예적 도면이다.

도 99는 본 발명의 우선권 주장 번호를 활용하는 대표명화 방법에 관한 일실시예적 도면이다.

도 100은 본 발명의 특허 분류 기호별로 통계값을 전처리하는 방법에 관한 일실시예적 도면이다.

도 101은 본 발명의 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.

도 102는 본 발명의 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.

도 103은 본 발명의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.

도 104는 본 발명의 비교 관점의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.

도 105는 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.

도 106은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.

도 107은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.

도 108은 본 발명의 분석 지표 계산 방법에 관한 일실시예적 도면이다.

도 109는 본 발명의 분석 대상 특허 문건 집합 입수 방법에 관한 일실시예적 도면이다.

도 110은 본 발명의 동향 분석 방법에 관한 일실시예적 도면이다.

도 111은 본 발명의 간이 분석 방법에 관한 일실시예적 도면이다.

도 112는 본 발명의 인용 분석 방법에 관한 일실시예적 도면이다.

도 113은 본 발명의 피인용 분석 방법에 관한 일실시예적 도면이다.

도 114는 본 발명의 심사 인용 분석 방법에 관한 일실시예적 도면이다.

도 115는 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.

도 116은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.

도 117은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.

도 118은 본 발명의 개별 단위 특허 정보 시스템 다단 그룹화 모듈 작동 방법에 관한 일실시예적 도면이다.

도 119는 본 발명의 특허 정보 시스템 배치 생성 방법에 관한 일실시예적 도면이다.

도 120은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 대한민국의 최다 출원인 Top 500에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 대한민국이 선택되고, 그 하부 탭의 Top 500, 거래소 등록 기업, 코스닥 등록기업, 다출원 기업, 전체 기업 등에서 Top 500탭이 선택된 화면이다.

도 121은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 미국의 나스닥 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 미국이 선택되고, 그 하부 탭의 Top 500, NYSE(뉴욕 증권 거래소), NASDAQ, AMEX, 전체 기업 등에서 NASDAQ 선택된 화면이다. NASDAQ 등록 기업들은 다수 있으므로, ABC 순의 탭과 전체 NASDAQ기업 탭이 있다.

도 122은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 일본의 JASDAQ 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 일본이 선택되고, 그 하부 탭의 Top 500, JP1(동경증권거래소 1부 등록 기업), JP2(동경증권거래소 2부 등록 기업), JPM(MOTHERS 등록기업), JASDAQ 등록기업, 전체 기업 등에서 JASDAQ 선택된 화면이다.

도 123은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 유럽의 런던증권거래소 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 유럽이 선택되고, 그 하부 탭의 Top 500, UK1(런던증시), AIM(런던증시), OVERSEAS LISTED(런던증시 상장 외국 기업), EURONEXT, 전체 기업 등에서 UK1이 선택된 화면이다. 프랑크푸르트 상장 기업 리스트는 미도시되어 있다.

도 124은 도 121에서 나스닥 등록 기업 중의 하나인 3COM(6번)을 선택했을 때에 나타나는 3COM의 특허 정보 시스템의 내부 중 특허 포트폴리오 중 특허 리스트 중 국가 선택에서 미국 특허 탭을 선택했을 때 나오는 일실시예적 구현예이다.

도 125는 도 124에서 발명자 리스트를 선택한 다음 국가 탭에서 미국을 선택했을 때 3COM의 발명자 목록이 나오는 화면이다.

도 126는 도 125에서 발명자 리스트에서 Aldous Stepha..(9번)을 선택했을 때 이 발명자와 관계된 특허 문건 목록이 나오는 화면이다.

도 127은 3COM에 대한 도 124에서 통계 분석탭을 누르고 기술영역 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 출원수에 대한 일실시예적 구현예이다. 이 화면에는 드릴 다운과 특정 셀값을 눌렀을 때 나오는 간이 분석 화면이 팝업으로 나와 있다. 이는 삼성전자주식회사에 대한 구현예가 있는 도 17과 구조적으로 동등하다.

도 128은 3COM에 대한 도 124에서 통계 분석탭을 누르고 경쟁사 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 USPC 서브클래스 레벨에서의 각 USPC별 연도별 출원수에 기준한 경쟁 출원인에 대한 정보가 나오는 일실시예적 구현예이다. 이 화면은 삼성전자주식회사에 대한 구현예가 있는 도 38과 구조적으로 동등하다.

도 129는 3COM에 대한 도 124에서 통계 분석탭을 누르고 미국인용 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 3COM의 출원 문건 전체 집합을 인용 기준 문건 집합으로 했을 경우, 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 이 화면은 삼성전자주식회사에 구현예가 있는 도 39와 구조적으로 동등하다.

도 130은 3COM에 대한 도 124에서 통계 분석탭을 누르고 발명자 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 다출원 발명자에 대한 일실시예적 구현예이다. 이는 삼성전자주식회사에 대한 구현예가 있는 도35와 구조적으로 동등하다.

도 133은 특허 문건 집합이 선택되었을 때 융합 분석을 수행하는 일실시예적 방법에 관한 도면이다.

도 134는 수치에 대한 선택이 있는 경우, 그 수치에 대응되는 특허 문건 정보를 제공해 주는 일실시예적 방법에 관한 도면이다.

도 135는 출원인별, 특허 분류 기호별, 발명자별, 대리인별로 다차원 분석을 제공하는 일실시예적 방법에 관한 도면이다.

도 136은 패밀리 정보를 이용하여 제1국에서 검색된 특허의 제2국에서의 활용 가능성을 판단하는 일실시예적 방법에 관한 도면이다.

도 137은 도136에서의 방법을 JP를 제1국으로 하고, #1번 특허 문건에 대하여 KR, US, EU를 제1국으로 하여 제2국에서의 활용 가능성을 판단하는 일실시예적 방법에 대한 흐름도이다.

도 138은 도136 내지 도 137에서 제시되는 방법을 실시했을 경우의 검색 결과 리스트 화면의 일실시예적 도면이다. 검색 결과 리스트의 각 항목에 각 국가별로의 국내 단계에서의 활용성 정보가 포함되어 있음을 알 수 있다.

도 140은 도 139의 방법이 제품에 적용된 일 실시예적 구현예이다.

도 141은 도 139의 방법이 경쟁사 등의 회사 체계에 적용된 일 실시예적 구현예이다.

도 142는 발명자에 대하여 융합 분석을 수행하고, 이를 네트워크 다이어그램으로 구현한 일 실시예적 구현예이다.

도 143은 기술 키워드 및 대표 어구에 대한 융합 분석을 수행하고 이를 네트워크 다이어그램으로 구현한 일 실시예적 구현예이다.

도 144 내지 도 145는 본 발명의 특허 정보 시스템을 구현하는데 활용되는 인터페이스의 일 예들이다.

H04B 7/155

사용자의 컴퓨터에 특허 정보를 제공하는 시스템이,

특허 문건 집합에 대한 선택 정보를 입수 받는 단계;

상기 선택 정보를 기초로 처리 대상 특허 문건 집합이 특정되는 단계;

상기 특정된 처리 대상 특허 문건 집합에 대하여 적어도 하나 이상의 기설정된 처리를 수행하여 가공 특허 정보가 생성되는 단계;를 더 포함하며,

상기 처리 대상 특허 문건 집합을 특정하는 단계 및 상기 기설정된 계산을 수행하여 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 적어도 하나 이상의 특허 분류 기호를 활용하며,

상기 특허 분류 기호의 활용은 상기 선택 정보를 입수 받는 단계 및 상기 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 제1 특허 분류 기호가 주어졌을 때, 상기 제1 특허 분류 기호가 속하는 특허 분류 기호 체계 상에서 상기 제1 특허 분류 기호가 기설정된 레벨에 해당하는 경우, 상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것이며,

상기 특허 분류 기호는 국제 특허 분류(IPC), 미국 특허 분류(USPC), 일본의 파일 인덱스(FI), 일본의 F-term(FT), 유럽 특허 분류(ECLA) 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 제공 방법.
제 1항에 있어서,

상기 기설정된 레벨은 도트 레벨(dot level)의 특허 분류 기호인 것이며,

상기 도트 레벨의 특허 분류 기호는 상기 특허 분류 기호 체계 상의 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 2항에 있어서,

상기 도트 레벨의 특허 분류 기호는 상기 특허 분류 기호가

국제 특허 분류(IPC)인 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며,

미국 특허 분류(USPC)의 경우에는 서브클래스 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며,

일본의 파일 인덱스(FI)의 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며,

일본의 F-term(FT)일 경우에는 테마 코드 미만의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것이며,

유럽 특허 분류(ECLA)의 경우에는 서브 그룹 이하의 특허 분류 기호 중에서 특허 분류 기호에 대응되는 설명인 타이틀(title) 정보에 도트(dot)가 포함되어 있는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제1항에 있어서,

상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것은, 상기 제1 특허 분류 기호가 도트 레벨의 특허 분류 기호일 경우, 상기 도트 레벨의 제1 특허 분류 기호의 모든 하위 특허 분류 기호 및 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합 중 어느 하나 이상을 정보 처리의 대상으로 하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 1항에 있어서,

상기 선택 정보를 입수 받는 방법은 1) 사용자 컴퓨터로부터 검색식으로 입력 받는 방법, 2) 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법, 3) 상기 사용자가 사전에 생성해 놓은 적어도 하나 이상의 특허 문건 집합 중에서 선택된 특정 특허 문건 집합에 대한 선택 정보를 입수 받는 방법 및 4) 상기 시스템으로부터 기설정된 적어도 하나 이상 의 조건을 제공받는 방법 중 어느 하나의 방법 이상이 사용되는 것인 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 5항에 있어서,

상기 처리 대상 특허 문건 집합이 특정되는 단계는 상기 1) 내지 4)의 방법 중 어느 하나가 실시되었을 때, 상기 1) 내지 4)의 방법의 실시되는 과정에서 적어도 하나 이상의 제1 특허 분류 기호가 포함되어 있고, 상기 제1 특허 분류 기호가 도트 레벨의 특허 분류 기호일 경우, 상기 도트 레벨의 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합이 처리 대상 특허 문건 집합으로 특정되게 되는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 6항에 있어서,

상기 도트 레벨의 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 특허 문건 집합이 처리 대상 특허 문건 집합으로 특정되게 되는 방법은,

상기 도트 레벨의 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호를 입수하고, 상기 제1 특허 분류 기호 및 상기 모든 하위 특허 분류 기호를 포함하는 검색식 또는 질의식으로 상기 처리 대상 특허 문건 집합이 특정되게 하는 방법인 것을 특징으로 하는 특허 정보 제공 방법.
제1항에 있어서,

상기 특허 문건 집합을 구성하는 개별 특허는 적어도 하나 이상의 기설정된 가중치 부여 정책에 따라 가중치가 부여된 특허를 하나 이상을 포함하며,

상기 가공 특허 정보는 상기 개별 특허에 부여된 가중치가 반영되어 생성되는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 8항에 있어서,

상기 가중치 부여 정책은 상기 개별 특허와 관련된 1) 기설정된 카운팅 정보 및 2) 기설정된 계산값 정보 중 어느 하나 이상을 포함하여 계산되는 것이며,

상기 기설정된 카운팅 정보의 대상이 되는 카운팅 값은 1) 제1국 및 제2국 중 어느 하나 이상의 국가에서의 패밀리수, 2) 청구항 수 및 3) 피인용수 중 어느 하나 이상을 포함하는 것이며,

상기 기설정된 계산값 정보에는 1) 상기 특허의 발명자에 대한 적어도 하나 이상의 평가 점수, 2) 상기 특허의 출원인에 대한 적어도 하나 이상의 평가 점수, 3) 상기 발명자의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 4) 상기 출원인의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 5) 상기 출원인의 재무 정보를 반영한 적어도 하나 이상의 기설정된 계산값 및 6) 상기 특허에 포함된 특허 분류 기호 자체에 대 한 적어도 하나 이상의 기설정된 계산값 중 어느 하나 이상을 포함하여 계산되는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제1항에 있어서,

상기 가공 특허 정보가 상기 사용자의 컴퓨터에 제공될 때, 상기 특허 분류 기호 정보에 대응되는 가공 특허 정보가 제공되며,

상기 사용자의 컴퓨터로부터 상기 특허 분류 기호의 적어도 하나 이상의 하위 특허 분류 기호에 대한 가공 특허 정보가 요청될 때, 상기 가공 특허 정보는 상기 특허 분류 기호가 포함된 특허 분류 기호 체계 상에서, 상기 특허 분류 기호의 적어도 하나 이상의 직하위 특허 분류 기호에 대응되는 가공 특허 정보를 제공하는 것을 특징으로 하는 특허 정보 제공 방법.
사용자의 컴퓨터에 특허 정보를 제공하는 시스템이,

특허 문건 집합에 대한 선택 정보를 입수 받는 단계;

상기 선택 정보를 기초로 처리 대상 특허 문건 집합이 특정되는 단계;

상기 특정된 처리 대상 특허 문건 집합에 대하여 적어도 하나 이상의 기설정된 처리를 수행하여 가공 특허 정보가 생성되는 단계;를 더 포함하며,

상기 선택 정보를 입수 받는 방법은 1) 사용자 컴퓨터로부터 검색식으로 입력 받는 방법, 2) 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이 상에 대한 선택 정보를 전송받 받는 방법, 3) 상기 사용자가 사전에 생성해 놓은 적어도 하나 이상의 특허 문건 집합 중에서 선택된 특정 특허 문건 집합에 대한 선택 정보를 입수 받는 방법 및 4) 상기 시스템으로부터 기설정된 적어도 하나 이상의 조건을 제공받는 방법 중 어느 하나의 방법 이상이 사용되는 것인 것인 것이며,

상기 가공 특허 정보는 상기 특정된 처리 대상 특허 문건 집합에 대한 적어도 하나 이상의 기설정된 분석 처리를 통하여 생성되는 적어도 하나 이상의 다차원 분석 정보인 것이며,

상기 다차원을 구성하는 개별적인 차원은 1)시간, 2)특허 분류 기호, 3) 출원인, 4) 발명자, 5) 대리인, 6) 국가, 7) 키워드 및 8) 융합 패턴 중에서 선택되는 어느 하나 이상인 것이며,

상기 다차원 분석 정보는 상기 처리 대상 특허 문건 집합을 대상으로 하여 상기 적어도 하나 이상의 개별적 차원에 대한 적어도 하나 이상의 기설정된 카운팅 값, 적어도 하나 이상의 기설정된 계산식에 의한 계산값, 적어도 하나 이상의 질의식에 의한 질의 결과값 및 적어도 하나 이상의 분석 처리 알고리즘에 대한 처리 결과값 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 분석 정보를 생성할 때, 상기 분석 정보는 상기 처리 대상 문건 집합에 포함된 특허 분류 기호에 대하여, 1) 모든 특허 분류를 포함하여 처리하는 방법 및 2) 주특허분류(main patent classification)만을 처리하는 방법 중에서 선택되는 어느 한 방법 이상을 사용하며, 상기 모든 특허 분류를 포함하여 처리하는 경우에는 a) 모든 특허 분류를 동등한 가중치로 처리하는 방법 및 b) 주특허분류(main patent classification)와 부특허분류(sub patent classification)에 대하여 다른 가중치로 처리하는 방법 중에서 선택되는 어느 하나 이상을 적용하여 분석 정보를 생성하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 분석 처리는 특허 분류 기호간의 융합 분석 처리이며,

상기 특허 분류 기호간의 융합 분석 처리는 상기 처리 대상 특허 문건 집합에 포함된 특허 문건 중 동일 특허 분류 체계 상의 2개 이상의 특허 분류 기호를 포함하는 특허 문건들을 대상으로 하여, 상기 특허 문건들에 포함된 상기 2개 이상의 특허 분류들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 13항에 있어서,

상기 특허 분류 기호 간의 융합 분석 처리에 있어서,

동일 특허 분류 체계 상에서 상기 2개 이상의 특허 분류 기호가 하나의 특허 문건에 포함되어 있을 경우, 상기 2개 이상의 특허 분류 기호가 상기 특허 분류 기호 체계 상의 최상위 특허 분류 기호가 아니거나 기설정된 레벨의 분류 기호가 아 닌 경우, 상기 융합 분석 처리는 상기 2개 이상의 특허 분류 기호 각각에 대하여, 상기 2개 이상의 특허 분류 기호의 기설정된 레벨까지의 상위 특허 분류 기호를 포함하여 처리하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 융합 분석 처리는 상기 처리 대상 특허 문건 집합을 구성하는 개별 특허 문건에 대하여 1) 하나의 특허 문건의 기설정된 적어도 하나 이상의 필드에서 추출한 텍스트 정보를 기초로 생성되는 적어도 2 이상의 기술 키워드 간의 융합 분석 처리, 2) 공동 발명자가 있는 특허 문건에 대한 공동 발명자 간의 융합 분석 처리, 3) 공동 출원인이 있는 특허 문건에 대한 공동 출원인 간의 융합 분석 처리 및 4) 하나의 특허 문건의 인용 정보에 함께 포함되어 있는 인용 특허 문건들 간의 융합 분석 처리 중 어느 하나 이상을 포함하며,

상기 융합 분석 처리는 상기 특허 문건들에 포함된 상기 2개 이상의 기술 키워드, 공동 발명자, 공동 출원인, 공동 인용 특허 문건들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 13항 내지 제15항 중 어느 한 항에 있어서,

상기 융합 분석 처리 결과를 적어도 2개 이상의 노드를 포함하는 네트워크 다이어그램으로 시각화 처리하는 단계;를 더 포함하며,

상기 시각화 처리에는 상기 노드에 대한 정보 및 상기 노드와 노드를 연결하는 선에 대한 정보 중 어느 하나 이상을 더 포함하고 있는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 16항에 있어서,

상기 노드와 노드를 연결하는 선에 대한 정보에는 수치 정보가 더 포함되어 있으며,

상기 사용자 컴퓨터로부터 상기 수치 또는 상기 선에 대한 선택 정보가 입수받는 단계;

상기 상기 수치 정보에 대응되는 근거 특허 문건 정보를 상기 처리 대상 특허 문건 집합이 포함되는 특허 정보 데이터베이스에서 추출하는 단계; 및

상기 추출된 근거 특허 문건 정보를 상기 사용자 컴퓨터에 전송하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 제공 방법.
제 1항에 있어서,

상기 처리 대상 문건 집합에 대하여,

상기 사용자 컴퓨터로부터 상기 처리 대상 문건 집합에 대한 변경 정보를 입수 받는 단계; 및

상기 입수 받은 변경 정보를 기준으로 처리 대상 문건 집합을 특정하는 단계;를 더 포함하며,

상기 변경 정보의 입수는 상기 사용자 컴퓨터에 변경 정보의 입수를 위한 인터페이스를 제공하고,

상기 인터페이서에 대한 상기 사용자의 선택 정보를 입수받는 방식으로 수행되는 것인 것이며,

상기 인터페이스에는 1) 시간 종류 선택 인터페이스, 2) 시간 구간 선택 인터페이스, 3) 국가 선택 인터페이스 4) 특허 분류 기호 선택 인터페이스 5) 인용 특화 인터페이스, 6) 패밀리 정보 포함 선택 인터페이스, 7) 검색 후 선택 인터페이스 중 어느 하나 이상을 포함하며,

상기 시간 종류 인터페이스에는 출원일, 공개일 및 등록일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 시간 구간 선택 인터페이스는 시작 구간과 종료 구간 각각에 대한 년/월/주/일 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 국가 선택 인터페이스는 적어도 2 이상의 국가에 대한 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 특허 분류 기호 선택 인터페이스는 특허 분류 기호의 종류 선택 인터페이스, 특허 분류 기호 레벨 선택 인터페이스, 메인 특허 분류 기호 및 서브 특허 분류 기호 선택 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 인용 특화 인터페이스에는 전방 인용과 후방 인용 중 어느 하나 이상의 선택에 관한 인용 방향 인터페이스, 인용 깊이의 선택에 관한 인용 깊이 인터페이스, 직접 인용과 간접 인용 중 어느 하나 이상의 인용의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 패밀리 정보 포함 선택 인터페이스에는 패밀리 정보 포함 여부 및 국가 범위의 선택에 관한 인터페이스 중 어느 하나 이상의 선택을 제공하는 인터페이스를 포함하며,

상기 검색 후 선택 인터페이스는 상기 처리 대상 문건 집합을 검색 대상으로 하여 기설정된 필드 검색을 제시하고, 상기 필드에 사용자 컴퓨터로부터 검색어를 입수받고, 상기 검색어에 대응되는 검색 결과를 제공하고, 상기 검색 결과 중에서 적어도 하나 이상의 선택 정보를 입수 받아, 상기 선택 정보와 관련되는 특허 문건 집합만을 처리 대상 문건 집합으로 하도록 처리하는 인터페이스를 포함하는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 분석 처리는 적어도 2 이상의 특허 문건을 1개의 분석 단위로 하는 집합 단위의 인용 분석 처리이며,

상기 집합 단위의 인용 분석 처리는 1)전방 인용 특허 문건 집합 대상 분석 처리, 2) 후방 인용 특허 문건 집합 대상 분석 처리 및 3) 인용 발생 자기 특허 문건 집합 대상 분석 처리 중 어느 하나 이상을 포함하며,

상기 1) 내지 3)의 분석 처리는 상기 1) 내지 3)의 분석 처리의 대상이 되는 특허 문건 집합에서 상기 적어도 하나 이상의 기설정된 다차원 분석 정보를 생성해 내는 것인 것이며,

상기 전방 인용 특허 문건 집합 대상 분석 처리를 위한 전방 인용 특허 문건 집합의 특정은 처리 대상 특허 문건 집합에 포함되어 있는 적어도 1 인용 깊이 이상의 인용 정보로 구성되는 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 후방 인용 특허 문건 집합 대상 분석 처리를 위한 후방 인용 특허 문건 집합의 특정은 처리 대상 특허 문건 집합을 인용하고 있는 적어도 1 인용 깊이 이상의 후출원 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 인용 발생 자기 특허 문건 집합 대상 분석 처리를 위한 인용 발생 자기 특허 문건 집합의 특정은 처리 대상 특허 문건 집합을 구성하는 특허 문건 중 적어도 1회 이상의 인용을 받은 특허 문건으로 구성되는 특허 문건 집합을 포함하는 방식으로 특정되는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 19항에 있어서,

상기 집합 단위의 인용 분석 처리는 전방 인용 특허 문건 집합의 특정 시에는 상기 특허 문건 집합에 대한 간접 전방 인용 문건 집합을 더 포함하는 방식, 상기 후방 인용 특허 문건 집합의 특정 시에는 간접 후방 인용 문건 집합 중 어느 하나 이상을 더 포함하여 집합 단위의 인용 분석 처리를 수행하는 것인 것이며,

상기 간접 전방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 앞서면 서, 상기 처리 대상 특허 문건이 인용하는 특허 문건을 동시에 인용하고 있는 특허 문건들로 구성되는 것이며,

상기 간접 후방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 늦으면서, 상기 처리 대상 특허 문건을 인용하는 특허 문건이 동시에 인용하고 있는 특허 문건들로 구성되는 것인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 다차원 분석 정보는 수치 정보가 포함되어 있는 표 형식으로 상기 사용자 컴퓨터에 전송되며,

상기 사용자 컴퓨터로부터 상기 수치에 대한 선택 정보가 입수받는 단계;

상기 상기 수치 정보에 대응되는 근거 특허 문건 정보를 상기 처리 대상 특허 문건 집합이 포함되는 특허 정보 데이터베이스에서 추출하는 단계; 및

상기 추출된 근거 특허 문건 정보를 상기 사용자 컴퓨터에 전송하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 제공 방법.
상기 처리 대상 특허 문건 집합을 특정하는 단계 및 상기 기설정된 계산을 수행하여 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 적어도 하나 이상의 특허 분류 기호를 활용할 수 있으며,

상기 특허 분류 기호를 활용할 때의 상기 특허 분류 기호의 활용은 상기 선 택 정보를 입수 받는 단계 및 상기 가공 특허 정보를 생성하는 단계 중 어느 한 단계 이상에서 제1 특허 분류 기호가 주어졌을 때, 상기 제1 특허 분류 기호가 속하는 특허 분류 기호 체계 상에서 상기 제1 특허 분류 기호가 기설정된 레벨에 해당하는 경우, 상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것이며, 상기 특허 분류 기호는 국제 특허 분류(IPC), 미국 특허 분류(USPC), 일본의 파일 인덱스(FI), 일본의 F-term(FT), 유럽 특허 분류(ECLA) 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 제공 방법.
제 11항에 있어서,

상기 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법은

상기 사용자 컴퓨터에 적어도 하나 이상의 출원인을 포함하는 출원인 정보, 적어도 하나 이상의 특허 분류 기호를 포함하는 특허 분류 기호 정보, 적어도 하나 이상의 발명자를 포함하는 발명자 정보, 적어도 하나 이상의 대리인을 포함하는 대리인 정보 중 어느 하나 이상을 상기 사용자 컴퓨터에 제공하는 단계;

상기 사용자 컴퓨터로부터 상기 출원인, 상기 특허 분류 기호, 상기 발명자 정보, 상기 대리인 정보 중 어느 하나 이상에 대한 선택 정보를 입수 받는 단계; 및

상기 선택 정보로 특정되는 특허 문건 집합을 처리 대상 특허 문건 집합으로 처리하여, 기설정된 다차원 분석 결과를 생성하여 상기 사용자 컴퓨터에 제공하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 제공 방법.
제 23항에 있어서,

상기 시스템은 상기 출원인별, 상기 특허 분류 기호별, 상기 발명자별 또는 상기 대리인별 다차원 분석 결과를 용이하고 신속하게 생성하기 위한 적어도 하나 이상의 중간 다차원 분석 결과 테이블을 생성하는 것이며,

상기 사용자 컴퓨터에게 기설정된 적어도 하나 이상의 출원인별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 특허 분류 기호별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 발명자별 다차원 분석 목록이나 메뉴 및 기설정된 적어도 하나 이상의 대리인별 다차원 분석 목록이나 메뉴 중 어느 하나 이상을 제공하는 단계;

상기 사용자 컴퓨터로부터 상기 다차원 분석 목록이나 메뉴에 대한 선택 정보를 입수하는 단계; 및

상기 선택 정보를 입수 받은 분석 목록이 상기 중간 다차원 분석 결과 테이블에서 입수할 수 있는 경우에는 상기 중간 다차원 분석 결과 테이블을 참조하여 상기 선택 정보를 입수 받은 분석 결과를 생성하여 상기 사용자 컴퓨터에 제공하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 제공 방법.
사용자의 컴퓨터에 특허 정보를 제공하는 시스템이,

제1국에서 공개된 적어도 하나 이상의 특허 문건 정보를 입수 받는 단계;

상기 제1국 출원일과 상기 선택 정보를 입수 받은 날짜가 1년이 넘은 경우, 상기 선택 정보를 입수 받은 특허 문건에 대하여 1) PCT 출원 정보와 2) 제2국에서의 상기 제1국의 특허 문건을 우선권으로 하는 제2국 패밀리 정보, 및 3) 상기 제2국 패밀리 정보에 해당하는 제2국 특허 문건의 현재 상태 정보 중 어느 하나 이상을 조회하는 단계;

상기 특허 문건에 대한 PCT 출원 정보가 없으며, 상기 제2국에서 상기 패밀리 정보가 없는 제1 경우, 상기 PCT 출원 정보가 있더라도 상기 제1국 출원일이 상기 선택 정보를 입수 받은 날짜로부터 기설정된 기관이 경과하고, 제2국 패밀리 정보가 없는 제2경우, 및 상기 제2국 패밀리 정보가 있더라도 상기 제2국 특허 문건의 현재 상태 정보가 취하, 소멸, 거절 결정 확정 및 무효 확정 중 어느 하나 이상이 된 제3의 경우 중 어느 하나에 해당하는지를 판단하는 단계; 및

상기 제1국의 특허 문건이 상기 제1 경우, 상기 제2 경우, 상기 제3 경우 중 어느 하나에 해당하는 경우에는 상기 제1국의 특허 문건 정보가 표시될 때, 상기 제1 경우, 상기 제2 경우, 상기 제3 경우 중 어느 하나에 해당함에 대응되는 기설정된 표시 정보를 상기 제1국의 특허 문건 정보의 기설정된 주변에 표시될 수 있도록 하여 상기 사용자의 컴퓨터에 상기 제1국의 특허 문건 정보와 상기 기설정된 표 시 정보를 전송하는 단계;를 더 포함하며,

상기 제2국은 적어도 하나 이상인 것인 것을 특징으로 하는 특허 정보 제공 방법.
특허 문건 마스트 DB;

특허 분류 기호 마스트 DB; 및

하위 특허 분류 기호 전처리 모듈부;를 포함하며,

상기 하위 특허 분류 기호 전처리 모듈부는 제1 특허 분류 기호가 주어졌을 때, 상기 제1 특허 분류 기호가 속하는 특허 분류 기호 체계 상에서 상기 제1 특허 분류 기호가 기설정된 레벨에 해당하는 경우, 상기 제1 특허 분류 기호의 하위 특허 분류 기호에 해당하는 특허 정보를 포함하도록 정보 처리하는 것인 것을 특징으로 하는 특허 정보 시스템.
제 26항에 있어서,

수정 검색식 생성 모듈 및 수정 질의식 생성 모듈 중 어느 하나 이상을 더 포함하며,

상기 수정 검색식 생성 모듈 및 수정 질의식 생성 모듈은 상기 도트 레벨의 상기 제1 특허 분류 기호의 모든 하위 특허 분류 기호를 입수하는 경우, 상기 제1 특허 분류 기호 및 상기 모든 하위 특허 분류 기호를 포함하는 검색식 또는 질의식을 생성하는 것인 것을 특징으로 하는 특허 정보 시스템.
제 26항에 있어서,

가중치 부여 모듈;을 더 포함하며,

상기 가중치 부여 모듈은 상기 특허 문건 집합을 구성하는 개별 특허는 적어도 하나 이상의 기설정된 가중치 부여 정책에 따라 특정된 특허 문건 집합을 구성하는 개별 특허 문건에 대해 적어도 하나 이상의 관점에서의 가중치를 부여하는 것인 것을 특징으로 하는 특허 정보 시스템.
제 28항에 있어서,

상기 가중치 부여 정책은 상기 개별 특허와 관련된 1) 기설정된 카운팅 정보 및 2) 기설정된 계산값 정보 중 어느 하나 이상을 포함하여 계산되는 것이며,

상기 기설정된 카운팅 정보의 대상이 되는 카운팅 값은 1) 제1국 및 제2국 중 어느 하나 이상의 국가에서의 패밀리수, 2) 청구항 수 및 3) 피인용수 중 어느 하나 이상을 포함하는 것이며,

상기 기설정된 계산값 정보에는 1) 상기 특허의 발명자에 대한 적어도 하나 이상의 평가 점수, 2) 상기 특허의 출원인에 대한 적어도 하나 이상의 평가 점수, 3) 상기 발명자의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 4) 상기 출원인의 상기 특허에 포함된 특허 분류 기호에 대한 적어도 하나 이상의 기설정된 계산값, 5) 상기 출원인의 재무 정보를 반영한 적어도 하나 이상의 기설정된 계산값 및 6) 상기 특허에 포함된 특허 분류 기호 자체에 대한 적어도 하나 이상의 기설정된 계산값 중 어느 하나 이상을 포함하여 계산되는 것인 것을 특징으로 하는 특허 정보 시스템.
제 26항에 있어서,

특정된 분석 대상 특허 문건 집합에 대하여 적어도 하나 이상의 특허 분석 처리를 수행하는 특허 분석 인텔리전스 모듈;을 더 포함하며,

상기 특허 분석 인텔리전스 모듈이 상기 분석 정보를 생성할 때, 상기 분석 정보는 상기 처리 대상 문건 집합에 포함된 특허 분류 기호에 대하여, 1) 모든 특허 분류를 포함하여 처리하는 방법 및 2) 주특허분류(main patent classification)만을 처리하는 방법 중에서 선택되는 어느 한 방법 이상을 사용하며, 상기 모든 특허 분류를 포함하여 처리하는 경우에는 a) 모든 특허 분류를 동등한 가중치로 처리하는 방법 및 b) 주특허분류(main patent classification)와 부특허분류(sub patent classification)에 대하여 다른 가중치로 처리하는 방법 중에서 선택되는 어느 하나 이상을 적용하여 분석 정보를 생성하는 것이며,

상기 분석 대상 특허 문건 집합을 특정 받는 방법은 1) 사용자 컴퓨터로부터 검색식으로 입력 받는 방법, 2) 사용자 컴퓨터로부터 상기 사용자 컴퓨터에 제시된 기설정된 상기 특허 문건에 포함된 서지 사항을 구성하는 정보 중에서 선택되는 어느 하나 이상에 대한 선택 정보를 전송받 받는 방법, 3) 상기 사용자가 사전에 생성해 놓은 적어도 하나 이상의 특허 문건 집합 중에서 선택된 특정 특허 문건 집합에 대한 선택 정보를 입수 받는 방법 및 4) 상기 시스템으로부터 기설정된 적어도 하나 이상의 조건을 제공받는 방법 중 어느 하나의 방법 이상이 사용되는 것인 것인 것이며,

상기 가공 특허 정보는 상기 특정된 처리 대상 특허 문건 집합에 대한 적어도 하나 이상의 기설정된 분석 처리를 통하여 생성되는 적어도 하나 이상의 다차원 분석 정보인 것이며,

상기 다차원을 구성하는 개별적인 차원은 1)시간, 2)특허 분류 기호, 3) 출원인, 4) 발명자, 5) 대리인, 6) 국가, 7) 키워드 및 8) 융합 패턴 중에서 선택되는 어느 하나 이상인 것이며,

상기 다차원 분석 정보는 상기 처리 대상 특허 문건 집합을 대상으로 하여 상기 적어도 하나 이상의 개별적 차원에 대한 적어도 하나 이상의 기설정된 카운팅 값, 적어도 하나 이상의 기설정된 계산식에 의한 계산값, 적어도 하나 이상의 질의식에 의한 질의 결과값 및 적어도 하나 이상의 분석 처리 알고리즘에 대한 처리 결과값 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템.
제 30항에 있어서,

상기 분석 처리는 특허 분류 기호간의 융합 분석 처리이며,

상기 특허 분류 기호간의 융합 분석 처리는 상기 처리 대상 특허 문건 집합에 포함된 특허 문건 중 동일 특허 분류 체계 상의 2개 이상의 특허 분류 기호를 포함하는 특허 문건들을 대상으로 하여, 상기 특허 문건들에 포함된 상기 2개 이상의 특허 분류들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것을 특징으로 하는 특허 정보 시스템.
제 31항에 있어서,

상기 특허 분류 기호 간의 융합 분석 처리에 있어서,

동일 특허 분류 체계 상에서 상기 2개 이상의 특허 분류 기호가 하나의 특허 문건에 포함되어 있을 경우, 상기 2개 이상의 특허 분류 기호가 상기 특허 분류 기호 체계 상의 최상위 특허 분류 기호가 아니거나 기설정된 레벨의 분류 기호가 아닌 경우, 상기 융합 분석 처리는 상기 2개 이상의 특허 분류 기호 각각에 대하여, 상기 2개 이상의 특허 분류 기호의 기설정된 레벨까지의 상위 특허 분류 기호를 포함하여 처리하는 것인 것을 특징으로 하는 특허 정보 시스템.
제 31항에 있어서,

상기 융합 분석 처리는 상기 처리 대상 특허 문건 집합을 구성하는 개별 특허 문건에 대하여 1) 하나의 특허 문건의 기설정된 적어도 하나 이상의 필드에서 추출한 텍스트 정보를 기초로 생성되는 적어도 2 이상의 기술 키워드 간의 융합 분석 처리, 2) 공동 발명자가 있는 특허 문건에 대한 공동 발명자 간의 융합 분석 처리, 3) 공동 출원인이 있는 특허 문건에 대한 공동 출원인 간의 융합 분석 처리 및 4) 하나의 특허 문건의 인용 정보에 함께 포함되어 있는 인용 특허 문건들 간의 융합 분석 처리 중 어느 하나 이상을 포함하며,

상기 융합 분석 처리는 상기 특허 문건들에 포함된 상기 2개 이상의 기술 키워드, 공동 발명자, 공동 출원인, 공동 인용 특허 문건들 간의 연관성(association) 분석, 빈발 패턴 분석, 상관성 분석 및 군집화 중 어느 하나 이상을 수행하는 것인 것을 특징으로 하는 특허 정보 시스템.
특허 문건 마스트 DB;

특허 분류 기호 마스트 DB; 및

특정된 분석 대상 특허 문건 집합에 대하여 적어도 하나 이상의 특허 분석 처리를 수행하는 특허 분석 인텔리전스 모듈;을 포함하며,

상기 분석 처리는 적어도 2 이상의 특허 문건을 1개의 분석 단위로 하는 집합 단위의 인용 분석 처리이며,

상기 집합 단위의 인용 분석 처리는 1)전방 인용 특허 문건 집합 대상 분석 처리, 2) 후방 인용 특허 문건 집합 대상 분석 처리 및 3) 인용 발생 자기 특허 문건 집합 대상 분석 처리 중 어느 하나 이상을 포함하며,

상기 1) 내지 3)의 분석 처리는 상기 1) 내지 3)의 분석 처리의 대상이 되는 특허 문건 집합에서 상기 적어도 하나 이상의 기설정된 다차원 분석 정보를 생성해 내는 것인 것이며,

상기 전방 인용 특허 문건 집합 대상 분석 처리를 위한 전방 인용 특허 문건 집합의 특정은 처리 대상 특허 문건 집합에 포함되어 있는 적어도 1 인용 깊이 이상의 인용 정보로 구성되는 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 후방 인용 특허 문건 집합 대상 분석 처리를 위한 후방 인용 특허 문건 집합 의 특정은 처리 대상 특허 문건 집합을 인용하고 있는 적어도 1 인용 깊이 이상의 후출원 문건 집합을 포함하는 방식으로 특정되는 것이며.

상기 인용 발생 자기 특허 문건 집합 대상 분석 처리를 위한 인용 발생 자기 특허 문건 집합의 특정은 처리 대상 특허 문건 집합을 구성하는 특허 문건 중 적어도 1회 이상의 인용을 받은 특허 문건으로 구성되는 특허 문건 집합을 포함하는 방식으로 특정되는 것인 것을 특징으로 하는 특허 정보 시스템.
제 34항에 있어서,

상기 집합 단위의 인용 분석 처리는 전방 인용 특허 문건 집합의 특정 시에는 상기 특허 문건 집합에 대한 간접 전방 인용 문건 집합을 더 포함하는 방식, 상기 후방 인용 특허 문건 집합의 특정 시에는 간접 후방 인용 문건 집합 중 어느 하나 이상을 더 포함하여 집합 단위의 인용 분석 처리를 수행하는 것인 것이며,

상기 간접 전방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 앞서면서, 상기 처리 대상 특허 문건이 인용하는 특허 문건을 동시에 인용하고 있는 특허 문건들로 구성되는 것이며,

상기 간접 후방 인용 문건 집합은, 상기 처리 대상 특허 문건 집합을 구성하는 처리 대상 특허 문건에 대하여, 상기 처리 대상 특허 문건보다 출원일이 늦으면서, 상기 처리 대상 특허 문건을 인용하는 특허 문건이 동시에 인용하고 있는 특허 문건들로 구성되는 것인 것을 특징으로 하는 특허 정보 시스템.
특허 문건 마스트 DB;

전처리 모듈부;

특허 정보 처리 기본 모듈;을 포함하며,

상기 특허 정보 처리 기본 모듈에는 다차원 분석용 연산 수행 결과 테이블 생성 모듈 및 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈이 생성한 적어도 하나 이상의 테이블;을 더 포함하고 있는 것이며,

상기 시스템은 상기 출원인별, 상기 특허 분류 기호별, 상기 발명자별 또는 상기 대리인별 다차원 분석 결과를 용이하고 신속하게 생성하기 위한 적어도 하나 이상의 중간 다차원 분석 결과 테이블을 생성하는 것이며,

상기 특허 정보 처리 기본 모듈은 상기 사용자 컴퓨터에게 기설정된 적어도 하나 이상의 출원인별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 특허 분류 기호별 다차원 분석 목록이나 메뉴, 기설정된 적어도 하나 이상의 발명자별 다차원 분석 목록이나 메뉴 및 기설정된 적어도 하나 이상의 대리인별 다차원 분석 목록이나 메뉴 중 어느 하나 이상을 제공하고,

상기 사용자 컴퓨터로부터 상기 다차원 분석 목록이나 메뉴에 대한 선택 정보를 입수하는 경우,

상기 선택 정보를 입수 받은 분석 목록이 상기 중간 다차원 분석 결과 테이블에서 입수할 수 있는 경우에는 상기 중간 다차원 분석 결과 테이블을 참조하여 상기 선택 정보를 입수 받은 분석 결과를 생성하여 상기 사용자 컴퓨터에 제공하는 것인 것을 특징으로 하는 특허 정보 시스템.