KR101476350B1 - 발명자 단위의 특허 정보 제공 방법 - Google Patents

발명자 단위의 특허 정보 제공 방법 Download PDF

Info

Publication number
KR101476350B1
KR101476350B1 KR1020070061279A KR20070061279A KR101476350B1 KR 101476350 B1 KR101476350 B1 KR 101476350B1 KR 1020070061279 A KR1020070061279 A KR 1020070061279A KR 20070061279 A KR20070061279 A KR 20070061279A KR 101476350 B1 KR101476350 B1 KR 101476350B1
Authority
KR
South Korea
Prior art keywords
information
patent classification
document
inventor
search
Prior art date
Application number
KR1020070061279A
Other languages
English (en)
Other versions
KR20080065521A (ko
Inventor
강민수
Original Assignee
(주)광개토연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)광개토연구소 filed Critical (주)광개토연구소
Publication of KR20080065521A publication Critical patent/KR20080065521A/ko
Application granted granted Critical
Publication of KR101476350B1 publication Critical patent/KR101476350B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/18Legal services
    • G06Q50/184Intellectual property management
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Technology Law (AREA)
  • Operations Research (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템이 계층적으로 통합된 특허 정보 서비스 방법 및 그 시스템에 관한 것이다.
본 발명을 이용할 경우, 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별 특허 정보 서비스 시스템을 구축하고, 나아가 특허 정보에 포함되어 있는 기업 소속의 발명자 정보를 추출하여, 자동적으로 발명자 단위의 특허 정보 서비스 시스템을 계층적으로 통합하여 생성하고, 각 발명자에게 발명자의 특허 출원 문건 정보에 포함된 특허 분류 기호를 매개로 하여 자신의 출원 특허 기술과 관련성이 있는 국내외의 특허 정보를 자동으로 추출하여 제공할 수 있게 된다.
나아가, 본 발명은 기업 및 그 기업 소속의 발명자의 특허 출원 문건에서 추출된 정보 및 발명자로부터 입수 받은 검색식을 활용하여, 그 특허와 관련된 국내외 특허 문건을 자동으로 업데이트 해 주는 모니터링 기능 및 통계, 분석, 경쟁 정보, 리포팅, 기능을 포함한다.
기업 및 기업 소속 발명자는 별도의 노력 없이도 자기 자신만을 위한 특허 정보 서비스 시스템이 자동으로 생성되기 때문에, 구축 및 별도 세팅의 노력 없이도 자신과 관련된 국내외의 특허 정보를 손쉽게 활용할 수 있다.
특허 정보, 특허 분석, 감시, 발명자, 출원인

Description

발명자 단위의 특허 정보 제공 방법{Method on patent information service by inventor unit}
도 1은 본 발명의 전체 시스템에 관한 일실시예적 도면이다.
도 2는 본 발명의 개별 단위 특허 정보 시스템 생성 엔진에 관한 일실시예적 도면이다.
도 3은 본 발명의 특허 정보 전처리 모듈의 내부 구성에 관한 일실시예적 도면이다.
도 4는 본 발명의 가중치 전처리 모듈에 관한 일실시예적 도면이다.
도 5는 본 발명의 인용 정보 전처리 모듈에 관한 일실시예적 도면이다.
도 6은 본 발명의 특허 분류 기호 전처리 모듈에 관한 일실시예적 도면이다.
도 7은 본 발명의 출원인 대표명화 전처리 모듈에 관한 일실시예적 도면이다.
도 8은 본 발명의 대표 어구 추출 전처리 모듈에 관한 일실시예적 도면이다.
도 9는 본 발명의 패밀리 정보 전처리 모듈에 관한 일실시예적 도면이다.
도 10은 본 발명의 복수 특허 분류 기호 관계성 전처리 모듈에 관한 일실시예적 도면이다.
도 11은 본 발명의 특허 분류 기호별 통계 전처리 모듈에 관한 일실시예적 도면이다.
도 12는 본 발명의 특허 정보 인텔리전스 모듈에 관한 일실시예적 도면이다.
도 13은 본 발명의 분석 모듈에 관한 일실시예적 도면이다.
도 14는 본 발명의 특허 정보 시스템 배치 생성 엔진에 관한 일실시예적 도면이다.
도 15는 본 발명의 통합 관리 모듈의 구성에 관한 일실시예적 도면이다.
도 16은 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 17은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 18은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명 자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 19은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 20은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 특허 정보 데이터베이스(2300)를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 16 내지 도 19의 방법은 모두 적용될 수 있다.
도 21은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 22는 우선권 주장 번호를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 23은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 24는 패밀리 정보 및 우선권 주장 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 25는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.
도 26은 본 발명의 에 관한 일실시예적 도면이다.
도 27은 발명자 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
도 28은 본 발명의 에 관한 일실시예적 도면이다.
도 29는 본 발명의 비용 지출 관점 가중치 전처리 모듈(3311)이 가중치를 처리하는 방법에 관한 일실시예적 도면이다.
도 30은 본 발명의 인용 관점 가중치 전처리 모듈(3313)이 인용 관점에서 가중치를 전처리하는 방식에 관한 일실시예적 도면이다.
도 31은 본 발명의 분쟁 관점 가중치 전처리 모듈(3315)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 32는 본 발명의 집중 관점 가중치 전처리 모듈(3317)이 가중치를 처리하 는 방식에 관한 일실시예적 도면이다.
도 33은 본 발명의 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 34는 본 발명의 출원인 단위 가중치 전처리 모듈(3331)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 35는 본 발명의 발명자 단위 가중치 전처리 모듈(3333)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 36은 본 발명의 대리인 단위 가중치 전처리 모듈(3335)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 37은 본 발명의 패밀리 정보 전처리 엔진(3810)이 패밀리 정보를 처리하는 방법에 관한 일실시예적 도면이다.
도 38은 본 발명의 인용 번호를 대표화하는 인용 정보 전처리 방법에 관한 일실시예적 도면이다.
도 39는 본 발명의 특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함하는 방법에 관한 일실시예적 도면이다.
도 40은 본 발명의 인용 정보 전처리 방법에 관한 일실시예적 도면이다.
도 41은 본 발명의 변형 특허 분류 기호를 처리하는 특허 분류 기호 전처리 엔진의 처리 방법에 관한 일실시예적 도면이다.
도 42는 본 발명의 계층적 변형 특허 분류 기호 데이터베이스 생성 모듈이 상기 변형 특허 분류 기호 데이터베이스를 생성하는 방법에 관한 일실시예적 도면이다.
도 43은 USPC 특허 분류 기호로 트리 구조를 만드는 일 실시예적 방법에 관한 도면이다.
도 44는 도 43의 USPC 특허 분류 기호로 트리 구조에 대응되는 변형 특허 분류 기호를 할당하는 방법에 관한 일 실시예적 방법에 관한 도면이다.
도 45는 도 43의 USPC 특허 분류 기호로 만든 트리 구조와 동일한 구조를 가지는 변형 특허 분류 기호로 구성되는 트리 구조에 관한 일 실시예적 도면이다.
도 46은 Index to U.S. Patent Classification (a.k.a., Classification Index File) 파일)로 도 43와 같은 특허 분류 기호의 트리 구조를 만들 수 있음을 보여 주는 실시예적 도면이다.
도 47은 본 발명의 특허 분류 기호 전처리 방법에 관한 일실시예적 도면이다.
도 48은 본 발명의 대표명화 전처리 모듈이 출원인 대표명화를 수행하는 방법에 관한 일실시예적 도면이다.
도 49는 본 발명의 우선권 주장 번호를 활용하는 대표명화 방법에 관한 일실시예적 도면이다.
도 50은 본 발명의 특허 분류 기호별로 통계값을 전처리하는 방법에 관한 일실시예적 도면이다.
도 51은 본 발명의 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.
도 52는 본 발명의 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.
도 53은 본 발명의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.
도 54는 본 발명의 비교 관점의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.
도 55는 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 56은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 57은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 58은 본 발명의 분석 지표 계산 방법에 관한 일실시예적 도면이다.
도 59는 본 발명의 분석 대상 특허 문건 집합 입수 방법에 관한 일실시예적 도면이다.
도 60은 본 발명의 동향 분석 방법에 관한 일실시예적 도면이다.
도 61은 본 발명의 간이 분석 방법에 관한 일실시예적 도면이다.
도 62는 본 발명의 인용 분석 방법에 관한 일실시예적 도면이다.
도 63은 본 발명의 피인용 분석 방법에 관한 일실시예적 도면이다.
도 64는 본 발명의 심사 인용 분석 방법에 관한 일실시예적 도면이다.
도 65는 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 66은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 67은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 68은 본 발명의 개별 단위 특허 정보 시스템 다단 그룹화 모듈 작동 방법에 관한 일실시예적 도면이다.
도 69는 본 발명의 특허 정보 시스템 배치 생성 방법에 관한 일실시예적 도면이다.
본 발명은 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템이 계층적으로 통합된 특허 정보 서비스 방법 및 그 시스템에 관한 것으로서, 더욱 자세하게는 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별 특허 정보 서비스 시스템을 구축하고, 나아가 특허 정보에 포함되어 있는 기업 소속의 발명자 정보를 추출하여, 자동적으로 발명자 단위의 특허 정보 서비스 시스템을 계층적으로 통합하여 생성하는 방식으로 서비스 되는 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템이 계층적으로 통합된 특허 정보 서비스 방법 및 그 시스템에 관한 것이다.
특허 정보는 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가 되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.
특허 정보를 입수할 수 있는 방법은 다양하나, 크게 1) 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것과 2) 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 및 3) 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 1)의 방법의 대표적인 예가 대한민국 특허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템이 있으며, 2)의 대표적인 예로 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr, www.wisdomain.com 등 있다.
www.delphion.com 의 운영회사인 톰슨사이언티픽과 같은 각 국가의 민간 기업들은 특허 정보 데이터베이스를 구축해 놓고, 특허 검색 엔진을 통하여 입력된 검색식에 대해 다양한 방식으로 검색 결과를 제공해 주고 있다. 또한, 이들 특허 정보를 기반으로 한 다양한 종류의 분석 소프트웨어가 개발되어 있으며, www.micropatent.com의 운영사(톰슨사이언티픽에 인수 합병되었음)가 개발한 상표명 AUREKA로 보급되는 소프트웨어가 유명하다. 그리고, 세계 각국의 기술 선진 대기업들은 내부에 특허 검색 및 특허 관리 시스템을 구축하여 운영하고 있는 것으로 알려져 있으나, 외부에서 그 기업들의 특허 검색 및 특허 관리 시스템에 대해 접근하기가 어렵다.
이러한 특허 검색 및 특허 관리 시스템을 구축하기 위해서는 수십억원 이상의 비용이 지출되는 것이 통상이어서, 국내외 대부분의 중견 및 중소 벤처 기업들은 자체 특허 검색 및 특허 관리 시스템을 구축하고 있지 못하고 있다. 이들 중견 및 중소 벤처 기업들은 특허 전담 조직을 두고 있는 경우도 다수 있으며, 이들이 자사의 특허에 대한 관리 및 자사를 위한 특허 정보를 수집하고 있다. 하지만, 기업 규모가 작거나, 특허에 대한 의식이 크지 않은 기업들은 이러한 특허 전담 조직을 갖추고 있지 못하는 경우가 많다. 이들 기업들은 특허법률사무소나 로펌 등에 의뢰하여 자신의 특허를 관리하고 있는 수준에 거치고 있다.
이들 특허 전담 조직은 www.delphion.com 등과 같은 외부에서 접근 가능한 유무료 온라인 특허 정보 서비스 업체들을 이용하여, 이들이 제공해 주는 플랫폼으로 특허 정보를 수집, 관리하고 있다. 그리고, 기업 명의로 된 특허 출원의 대부분은 그 기업 소속 발명자들에 의해서 이루어 지며, 그 발명자는 자신의 발명과 관련된 국내외의 특허 정보를 수집하는 것이 전세계적인 추세가 된다. 그 이유가 특허 공개 기간의 존재에도 불구하고 전세계의 신기술 정보는 70% 이상이 특허 정보의 형태로 공개되며, 특허 정보가 논문 정보 등에 비해서 상업적으로 이용가능한 아이 디어가 많기 때문으로 풀이된다. 하지만, 이들 발명자들의 상당 부분은 특허 검색에 익숙해 있지 않거나, 검색에 익숙한 자라 하더라도 www.deljphion.com 등과 같은 외부 특허 정보 서비스 제공업체에 접속하여 특허 정보를 입수 받고 있다.
통상적으로 발명자들은 특정 기술 분야에 대하여 수년 내지 십수년간 지속적으로 연구하는 것이 일반적이므로, 자신 발명한 기술 분야가 크게 변동되지 않는 것이 일반적이다. 그러므로, 자신이 발명한 기술 분야와 직접 또는 간접적으로 관련되는 분야에 관한 국내 또는 해외 각국의 특허 기술 정보는 발명자에게 유익한 정보가 될 것이다. 그러므로, 개별 기업 단위 뿐만 아니라, 그 기업 소속의 발명자 단위로 운영되며, 발명자 단위까지 최적화되어 특정 발명자 만을 위한 차별화된 특허 정보 서비스 시스템의 공급이 요청되어 왔으며, 이와 같은 특허 정보 서비스 시스템은 자체적으로 개발하고 유지할 수 없는 중견 및 중소벤처 기업들에게는 특허 정보에 대한 접근성을 크게 향상시킬 것이며, 자체적으로 개발 유지할 수 있는 기업들에게는 사내 특허 정보 유통의 새로운 플랫폼이 될 것이다.
또한, 기업 또는 발명자들이 자신이 관리하는 특허를 자동으로 분석하여, 이들과 관련된 경쟁 기업 및 경쟁 기술에 관한 분석 정보, 경쟁 기업 및 경쟁 기술에 대한 감시 정보 등이 자동으로 정리되어 기업 또는 발명자에게 직접 제공된다면, 기업 또는 발명자에게 편리할 것이다.
본 발명이 이루고자 하는 첫번째 기술적 과제는 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별 특허 정보 서비스 시스템을 구축하고, 나아가 특허 정보에 포함되어 있는 발명자 정보를 추출하여, 자동적으로 발명자 단위의 특허 정보 서비스 시스템을 구축하고, 이들 양 시스템을 계층적으로 통합한 특허 정보 시스템을 생성하는 방법 및 그 시스템을 제시하는 것이다.
본 발명이 이루고자 하는 두번째 기술적 과제는 생성된 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 자동으로 기업 및/또는 발명자와 관련된 국내외 특허 정보를 자동으로 수집하는 방법을 제시하는 것이다.
본 발명이 이루고자 하는 세번째 기술적 과제는 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 자동으로 기업 및/또는 발명자와 관련된 국내외 특허 정보에 대한 특허 분석을 자동으로 수행하는 방법을 제시하는 것이다.
본 발명이 이루고자 하는 네번째 기술적 과제는 생성된 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 자동으로 기업 및/또는 발명자 자신과 관련된 특허 정보를 자동으로 분석해 주는 방법을 제시하는 것이다.
본 발명이 이루고자 하는 다섯번째 기술적 과제는 특허 문건 정보에 대한 각종 전처리 방법과, 전처리된 특허 정보를 바탕으로 각종 특허 분석을 수행하는 방법을 제시하는 것이다.
본 발명이 이루고자하는 여섯번째 기술적 과제는 상기 첫번째 기술적 과제부 터 다섯번째 기술적 과제까지의 특허 정보 서비스 제공 방법을 온라인 상에서 다수의 출원 명의인 단위로 제공하는 방법과, 개별 출원 명의인의 내부 시스템에서 작동될 수 있는 방법을 제시하는 것이다.
이하, 도면을 참조하면서 상세히 설명한다.
공개되는 특허 정보
공개되는 특허 정보에는 크게 다음과 같은 2가지 정보가 기본적으로 포함되어 있다. 기본 정보는 서지 사항에 관한 정보 및 특허 본문에 관한 정보이다.
서지 사항에 관한 정보로서는 특허 문건 발행국에 관한 정보, 발명의 명칭, 출원인(assignee를 포함한다, 이하 같다)/특허권자(assignee를 포함한다, 이하 같다)에 관한 정보, 발명자에 관한 정보, 특허 분류 기호(IPC, USPC, FI, FT, ECLA 중에서 선택되는 어느 하나 이상, 이하 같다)에 관한 정보, 출원일 등의 각종 날짜에 관한 정보, 출원번호 등의 각종 번호에 관한 정보가 필수적으로 포함되어 있다. 또한, 초록 정보, 대표도가 있을 경우 대표도에 관한 정보, 인용(reference)에 관한 정보(출원인이 개시한 선행 기술에 관한 referrence 정보, 심사관이 심사하거나 조사한 문건 또는 특허 분류 기호에 관한 정보 등 중의 어느 하나 이상을 말한다.), 우선권에 관한 정보, 심사관에 관한 정보 등이 선택적으로 존재할 수 있다. WIPO(World Intellectual Property Organization)은 각 서지 사항에 관한 표시 에 관한 표준을 제시하고 있으며, 다수의 국가에서 이들 표준이 채택되고 있다.
둘째는 본문에 관한 정보이다. 본문에는 특허의 기술적 내용에 관한 정보들이 포함되어 있다. 통상적인 특허 문건의 본문에는 발명의 명칭에 관한 정보, 발명의 구성에 관한 정보, 특허 청구 범위에 관한 정보를 포함하고 있으며, 이들 이외에도 발명의 효과, 산업상 이용 가능성, 발명이 이루고자 하는 기술적 과제, 도면에 관한 설명, 종래의 기술 중 어느 하나 이상이 포함되어 있다. 또한, 발명자의 선택 또는 특허 기술의 종류에 따라 필수적 또는 선택적으로 도면에 관한 정보가 더 포함되어 있다. 필수적으로 존재하는 것은 발명의 명칭, 발명의 구성 및 특허 청구범위 셋째는 행정 사항에 관한 정보이다.
서지 사항에 관한 정보와 본문에 관한 정보 이외에도 입수할 수 있는 정보가 더 있는데, 이들 중 대표적인 것이 행정 처리 사항에 관한 정보이다. 물론, 각 국가 특허청마다 다른 특허청에서는 제공해 주지 않는 특별한 정보를 더 제공해 주기도 한다. 미국 특허청에서 제공해는 Field of Search와 같은 항목이 그러하다.
행정 처리 사항에 관한 정보에는 각 특허 문건에 대한 해당 특허청 또는 특허 담당 기관의 각종 행정 처리 사항에 관한 정보를 말한다. 이러한 행정 처리 정보에는 심사 착수와 같은 담당 기관 내부에서 발생하는 이벤트에 관한 정보 및/또는 출원인 명의 변경 신청 등과 같이 출원인 또는 담당 기관을 이용하는 자와의 상호 관계에서 발생하는 이벤트에 관한 정보가 대표적이다.
아울러, 상기 서지 사항에 관한 정보, 본문에 관한 정보 및/또는 행정 처리 사항에 관한 정보를 재료로 하여 1차 가공 정보를 생성해 놓을 수 있으며, 이러한 정보 또한 특허 정보 데이터베이스에 저장되어 있을 수 있다. 상기 1차 가공 정보에는 출원인 수, 발명자 수, 청구항 수, 도면 수, 명세서 페이지 수, 패밀리 수, 특허 분류 기호의 수, reference 수(인용수, 피인용 수) 등과 같은 각종 카운트(count) 정보를 들 수 있다.
특허 정보 전처리 모듈(3000)
적어도 하나 이상의 문건 집합이 결정 되었을 때, 상기 문건 집합을 대상으로 하여 상기 문건 집합에 있는 정보 및/또는 상기 특허 정보 데이터베이스(2300)에 있는 정보를 재료로 하여 다양한 것들을 계산, 추출 및 생성할 수 있다. 상기 계산, 추출, 및 생성은 본 발명의 특허 정보 전처리 모듈(3000)이 수행하며, 상기 특허 정보 전처리 모듈(3000)은 계산, 추출, 생성 또는 처리하는 특허 정보에 따라서 하위 전처리 모듈을 포함하고 있을 수 있다.
카운팅 전처리 모듈(3100)
카운팅 전처리 모듈(3100)에 대해서 설명한다. 상기 카운팅 전처리 모듈(3100)에는 개별 문건 단위에서 카운팅 처리를 수행하는 개별 문건 단위 카운팅 전처리 모듈(3110)과 2이상의 문건 단위에서 카운팅 처리를 수행하는 복수 문건 단위 카운팅 전처리 모듈(3130)이 있다.
개별 문건 단위 카운팅 전처리 모듈(3110)
상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 개별 특허 문건에 나와 있는 1)출원인 수 및/또는 특허권자 수, 2) 발명자 수, 3) 출원 또는 등록 단계 등과 같은 각 단계별 청구항 수, 4) 명세서 페이지 수, 5) 도면 수, 6) 특허 분류 기호 의 종류 수, 7) 각 종류의 특허 분류 기호의 수, 8) 레퍼런스(reference)수, 9) 심사 인용 수, 10) 심사관이 조사한 특허 분류 기호의 수, 11) 우선권 주장수, 12) 국가별 패밀리 특허 개수, 13) 전체 패밀리 개수, 14) 독립항 수, 15) 종속항 수, 16) 레퍼런스 중에서 국가 단위의 특허 수, 17) 레퍼런스 중에서 전체 특허 문건 수, 18) 레퍼런스 중에서 비특허 문건 수 중에서 적어도 어느 하나 이상의 수치적 정보를 계산할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 상기 개별 특허 문건 또는 상기 개별 특허 문건을 발행하는 특허청 등의 행정 처리 정보 등으로부터 1) 출원일로부터 등록일까지의 기간, 2) 우선일부터 출원일까지의 기간, 3) 출원일부터 심사청구일까지의 기간, 4) 의견제출통지일부터 의견서 제출일까지의 기간 정보 중 적어도 어느 하나 이상을 계산할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 상기 개별 특허 문건 또는 행정 정보에서 개별 국가별로의 특정한 제도의 활용 또는 적용 여부에 관한 정보를 입수할 수 있는데, 그 정보로서는 1) 심사청구 제도의 활용 여부, 2) 분할 출원의 활용 여부, 3) 일부 계속 출원의 활용 여부, 4) 재발행 특허 제도의 활용 여부, 5) 우선심사 신청 여부, 5) 결정계 심판 활용 여부, 6) 비당사자계 소송 발생 여부 중 어느 하나 이상을 알아 낼 수 있으며, 상기 제도의 활용 또는 적용이 있는 경우에는 카운팅 값을 1로 하고, 그렇지 않을 경우에는 0으로 할 수 있을 것이다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 상기 개별 특허 문 건과 관련해서 상기 특허 정보 데이터베이스(2300)를 조사함으로써(검색 엔진(7000) 또는 DBMS(2100)를 사용하여) 적어도 하나 이상의 제2국에서의 상기 개별 특허 문건과 관련된 정보를 입수하고 카운팅할 수 있다. 상기와 같은 정보로는 1) 출원 국가수, 2) 등록 국가수, 3) 국제출원 여부, 4) 각 국가별 패밀리 수, 5) 전체 패밀리수 중 적어도 어느 하나 이상에 관한 정보를 알아 내어 카운팅할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 상기 검색 엔진(7000) 또는 상기 DBMS(2100)를 통하여 1) forward citation(나를 인용하고 있는 국내외 다른 특허 문건들), 2) backward citation(내가 인용하는 이전 문건들), 3) collateral citation 중 어느 하나 이상을 알아내어 카운팅할 수 있다.
또한 상기 개별 문건 단위 카운팅 전처리 모듈(3110)은 상기 문건에 대한 1) 이의신청 여부, 2) 정보제공 여부, 3) 당사자계 심판 발생 여부 등에 대한 정보를 입수할 수 있다. 상기 1) 내지 3)에 관한 정보는 대한민국의 경우 대한민국 특허청 또는 특허심판원으로부터 직접 또는 조회 방식 등으로 입수할 수 있다.
상기 개별 문건 단위 카운팅 전처리 모듈(3110)이 카운팅한 값은 상기 특허 정보 데이터베이스(2300)에 저장되는 것이 바람직하다. 아울러, 상기 카운팅한 값은 특허 문건을 검색 엔진(7000)이 인덱싱할 때 생성되는 인덱스에 포함시키는 방식으로 저장되는 것이 더욱 바람직하다. 상기 카운팅 값이 상기 인덱스에 포함시키는 방법은 1) 상기 검색 엔진(7000)이 인덱싱을 할 때, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)을 가동하여 카운팅 값을 획득하거나, 2) 상기 특허 정보 데 이터베이스(2300)에 저장된 카운팅 값을 입수하는 방식 중 어느 하나 이상이 사용될 수 있다.
카운팅 전처리 모듈(3100)이 카운팅을 처리하는 방식은 도 28에 잘 나타나 있다. 먼저 카운팅 전처리 모듈(3100)이 적어도 하나 이상의 특허 문건 정보를 입수하며(S2820), 입수된 특허 문건 별로 적어도 하나 이상의 상기 개별 문건 단위 카운팅 전처리 모듈(3110)을 호출하며(S2830), 상기 개별 문건 단위 카운팅 전처리 모듈(3110)이 특허 문건 정보를 대상으로 카운팅 처리를 수행하며(S2840), 카운팅 처리 결과를 특허 문건 정보의 문건 고유 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2850)
복수 문건 단위 카운팅 전처리 모듈(3130)
이하, 상기 복수 문건 단위로 계산된 점수를 입수하는 모듈, 즉 복수 문건 단위 카운팅 전처리 모듈(3130)을 설명한다. 상기 복수 문건 단위 카운팅 전처리 모듈(3130)은 상기 대상 집합이 되는 복수 개의 문건에서 상기 개별 문건 단위 카운팅 전처리 모듈(3110)이 카운팅 해 놓은 정보를 취합하는 방식으로 점수를 입수한다. 즉, 상기 복수 문건 단위 카운팅 전처리 모듈(3130)은 적어도 2 이상의 문건 집합에 대하여 카운팅 데이터를 생성한다.
가중치 전처리 모듈(3300)
문건 단위 가중치 전처리 모듈(3310)
하나의 특허 문건에 포함된 발명 사상의 가치를 시스템적으로 정확하게 측정한다는 것은 불가능하다. 하지만, 정확한 가치 측정이 불가능하다고 해서 모든 특 허 문건의 가치를 동일하게 취급한다는 것도 비합리적일 수 있다. 그러므로, 본 발명에서는 시스템이 데이터로 파악할 수 있는 정보를 기반으로 하여 특허 문건의 가중치를 부여하는 방법을 개시한다. 상기 특허 문건의 가중치를 부여하는 기능은 본 발명의 문건 단위 가중치 전처리 모듈(3310)이 담당한다.
본 발명의 가중치 전처리 모듈(3300)은 문건 단위 가중치 전처리 모듈(3310)과 주체 단위 가중치 전처리 모듈(3330)이 있다. 상기 문건 단위 가중치 전처리 모듈(3310)에는 비용 지출 관점 가중치 전처리 모듈(3311), 인용 관점 가중치 전처리 모듈(3313), 분쟁 관점 가중치 전처리 모듈(3315), 및/또는 집중 관점 가중치 전처리 모듈(3317) 등을 포함하고 있을 수 있다. 그리고, 상기 주체 단위 가중치 전처리 모듈(3330)에는 출원인 단위 가중치 전처리 모듈(3331), 발명자 단위 가중치 전처리 모듈(3333), 및/또는 대리인 단위 가중치 전처리 모듈(3335) 등을 포함하고 있을 수 있다.
비용 지출 관점 가중치 전처리 모듈(3311)
확률적, 통계적 또는 사회적 관점에서, 더 많은 비용을 지불한 특허가 더 중요한 특허일 가능성이 높을 것이다. 동일 주체에서 비용의 합리적 배분의 관점에서 볼 때에도 이러한 가정이 성립할 가능성이 높으며, 경쟁 관계에 있는 다른 주체들 간에서도 이러한 가정이 성립할 가능성이 높다. 하나의 특허에 관하여 비용이 지불되는 구조를 보면 다음과 같은 가중치 부여 요소를 생각할 수 있다.
1) 양적인 관점으로 (1) 청구항의 수, 독립항의 수, 명세서의 양(페이지 수), 패밀리의 수 또는 특허 분류 기호의 개수 2) 상태적인 관점으로 출원 중인 특 허, 등록된 특허, 거절된 특허 또는 포기된 특허인 경우, 3) 과정적인 관점으로 심사청구 여부, 우선심사 활용 여부, 심판 청구 여부, 국내 우선권 주장 여부 또는 분할 출원 여부, 4) 주체적 관점에서 출원인의 수 또는 발명자의 수, 5) 해외적 관점에서 국제 출원 활용 여부, 해외 국내 단계 진입된 나라 수 등과 같은 요소들이 특허 문건의 가치에 영향을 줄 수 있을 것이다. 이러한 가중치 부여 요소들은 개별 문건의 서지 사항 정보, 명세서 내용 정보 또는 행정 처리 정보 등에서 입수할 수 있다.
통상적으로 청구항의 수가 많거나 명세서의 양이 많으면 발명의 내용이 넓고 다양할 가능성이 있어 발명에 시간과 비용이 많이 들었을 가능성이 높으며, 대리인들도 더 많은 비용을 청구할 가능성이 높다. 또한, 패밀리 수가 많거나, 특허 분류 기호의 개수가 많을수록 발명의 포괄적일 가능성이 높을 것이다. 그리고, 출원 중인 특허보다는 등록된 특허가 더 비중이 높을 가능성이 높으며, 심사 청구를 한 특허 출원 또는 우선 심사 청구를 한 출원이 그렇지 않은 특허 출원보다 중요할 가능성이 더 높을 것이다. 출원인이 2이 이상일 경우에는 공동 출원이므로 2 이상의 다른 주체간의 협동 작업의 결과이므로, 그렇지 않은 경우보다 통계적으로 중요할 가능성이 있으며, 발명자가 여러 명일 경우에도 여러 사람이 함께 머리를 맞대어 발명한 것이므로 통계적으로 중요할 가능성이 높을 것이다. 또한, 통상적으로 해외 출원은 국내 출원보다 비용 지출이 월등히 크기 때문에, 해외 출원이 있거나, 해외 출원이 많을 경우에는 그 출원인이 상당한 재정적 지출을 하게 되기 때문에, 적어도 그 출원인에게 그 특허는 상대적으로 중요성이 높다고 판단하는 것이 합리적이 다.
상기와 같은 관점에서 하나의 문건에 대해서 가중치 부여 요소의 존재 및 수치를 파악(존부만이 문제시 될 경우에는 존재하지 않을 경우 수치는 0, 존재하면 1이 될 것이며, 청구항 개수와 같은 요소들은 1이상의 수치값으로 나올 것이다.)할 수 있을 것이며, 그 존재 및/또는 수치에 따라 상기 가중치 부여 요소별로 가중치 점수를 부여할 수 있을 것이다. 하나의 문건에 대해 상기 1) 내지 5)의 각 관점을 이루는 세부적인 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 비용 지출 관점 가중치 전처리 모듈(3311)이 수행한다.
상기 비용 지출 관점 가중치 전처리 모듈(3311)이 가중치를 처리하는 방법은 도 29에 잘 나타나 있다. 상기 비용 지출 관점 가중치 전처리 모듈(3311)은 적어도 하나 이상의 특허 문건 정보를 입수하고(S2920), 카운팅 전처리 모듈(3100)을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 비용 지출과 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S2930), 상기 특허 정보 처리 정책 데이터베이스(2330)에서 상기 특허 정보 상기 카운팅 기준별 가중치를 입수 한다(S2940). 이때, 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 데이터베이스(2330)에 저장된 특허 정보 처리 정책을 참조한다. 예를 들면, 상기 비용 지출 관점의 상기 특허 정보 처리 정책 데이터베이스(2330)의 청구항의 관점에서는 (청구항 수*0.1 + 독립항수*0.3) 등과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다. 그리고, 상기 비용 지출 관점 가중치 전처리 모듈(3311)은 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 비용 관점 가중치값을 생성하며(S2940), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2950).
인용 관점 가중치 전처리 모듈(3313)
논문과 마찬가지로 다수에게 많이 인용되는 특허가 중요한 특허일 가능성이 높다. 이러한 인용 관점에서 개별 문건의 가중치를 처리하는 모듈을 인용 관점 가중치 전처리 모듈(3313)이라 한다. 인용의 관점을 세부적으로 나누면 1) 후방 인용(forward citation)의 관점에서 전체 후방 인용의 수, 후방 인용의 깊이 수, 1단계 후방 인용의 수, 후방 인용의 평균 기간, 후방 인용의 시간 대비 집중도, 2) 심사관 인용의 관점에서 심사관의 인용 여부 등과 같은 가중치 부여 요소가 있을 수 있다. 즉, 자신의 특허에 대한 인용이 직접 또는 간접적(자신을 인용한 그 특허를 타 특허가 인용함)으로 많을수록, 직접적으로 인용하는 1단계 인용이 많을수록, 후방 인용의 평균 기간이 적절한 범위 내에 들수록, 자신의 특허를 인용하는 자가 시기적으로 최근 기단에 집중될수록, 그 특허의 중요성이 클 가능성이 높을 것이다. 또한, 심사관이 심사 과정에서 인용된 특허가 그렇지 않은 특허보다 중요성이 높을 수 있다. 상기 인용 관점 가중치 전처리 모듈(3313)이 인용 관점에서 가중치를 전처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈(3311)이 처리하는 방법과 대동소이하며, 도 30에 잘 나와 있다.
상기 인용 관점 가중치 전처리 모듈(3313)은 적어도 하나 이상의 특허 문건 정보를 입수하여(S3020), 카운팅 전처리 모듈(3100)을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 전방 인용 및/또는 후방 인용, 또는 심사 인용에 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S3030), 상기 특허 정보 처리 정책 데이터베이스(2330)를 참조하여 카운팅 기준별 가중치를 입수하고(S3040), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 인용 관점 가중치값을 생성하며(S3050), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3060) 이때, 인용에 관한 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 데이터베이스(2330)에 저장된 특허 정보 처리 정책을 참조한다. 예를 들면, 상기 인용 관점의 상기 특허 정보 처리 정책 데이터베이스(2330)에는 "후방 인용 카운팅 수*0.3"과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다.
분쟁 관점 가중치 전처리 모듈(3315)
하나의 특허 문건과 관련해서 분쟁이 많을수록 그 특허의 중요성이 클 가능성이 높다. 특허 정보에서 파악할 수 있는 분쟁적 요소는 1) 무효 심판, 2) 이의신청, 3) 정보 제공, 4) 소극적 또는 적극적 권리범위 확인 심판 등이 있을 수 있다. 상기 분쟁적 관점에서의 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 분쟁 관점 가중치 전처리 모듈(3315)이 수행한다.
상기 분쟁 관점 가중치 전처리 모듈(3315)이 가중치를 처리하는 방식은 도 31에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈(3311) 및 상기 인용 관점 가중치 전처리 모듈(3313)이 가중치를 처리하는 방식과 대동소이하다.
상기 분쟁 관점 가중치 전처리 모듈(3315)은 적어도 하나 이상의 특허 문건 정보를 입수하며(S3120), 카운팅 전처리 모듈(3100)을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 분쟁 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하고(S3130), 상기 특허 정보 처리 정책 데이터베이스(2330)를 참조하여 카운팅 기준별 가중치를 입수하며(S3140), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 분쟁 관점 가중치값을 생성하고(S3150), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3160).
즉, 상기 분쟁 관점 가중치 전처리 모듈(3315)이 가중치를 처리하는 방식은 분쟁의 수에 대한 카운팅을 수행하고, 각 카운팅 수에 대한 가중치를 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하여 분쟁 관점 가중치값을 생성하는 것을 본질로 한다.
집중 관점 가중치 전처리 모듈(3317)
특정 시점을 기준으로 여러 주체가 집중하고 있는 기술 분야가 중요한 기술 분야일 가능성이 높을 것이다. 하나의 출원인이 여러 가지 기술 분야에 골고루 출원하는 경우는 거의 없으며, 자신이 중요하다고 생각하는 곳, 기술 투자가 집중되는 곳에 다수를 출원하고, 중요도가 떨어진다고 생각되는 곳에서는 방어적으로 소수를 출원하는 것이 대부분이다. 그러므로, 하나의 출원이 속하는 기술 분야가 여 러 출원인이 출원을 많이 하여 다른 기술 분야 대비 상대적으로 1) 출원수가 많거나, 출원의 증가율 또는 증가 속도 가 높거나, 3) 출원인의 수가 많거나, 4) 점유율의 변동이 기설정된 범위를 벗어나거나 하는 경우라면 그 기술 분야는 중요한 기술 분야일 가능성이 높을 것이다. 여러 출원인이 집중하는 분야는 상기 기술 매력도(technology attractiveness), 증가율, 증가 속도, 점유율의 변동 등과 같은 분석 요소로 측정 가능할 것이다. 이때 본 문단에서의 기술 분야는 IPC, USPC, FI, FT, ECLA 등과 같은 특허 문건에 포함되어 있는 계층화된 특허 분류 기호를 각 계층 단위에서 파악한 것이 바람직할 것이다. 물론, 하위 특허 분류 기호를 자동으로 포함하여 각 분석 요소별 수치값을 계산하는 것이 더욱 바람직할 것이다. 즉, IPC로 H04B 7/26가 있을 때, 이 IPC에 대한 각종 분석 요소별 수치값을 계산할 수도 있으며, H04B 7/00의 관점에서 각종 분석 요소별 수치값을 계산할 수도 있을 것이다. 이때, 상기 H04B 7/26의 계층적으로 하위 특허 분류 기호에 속하는 다른 특허 분류 기호들도 포함되어 계산되는 것이 더욱 바람직할 것이다. 집중의 관점에서 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 집중 관점 가중치 전처리 모듈(3317)이 수행한다.
상기 집중 관점 가중치 전처리 모듈(3317)이 가중치를 처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈(3311) 및 상기 인용 관점 가중치 전처리 모듈(3313)이 가중치를 처리하는 방식과 대동소이하다. 즉, 각 개별 문건에 대한 서지 정보로 출원인/특허권자의 그 기술분야에 대한 집중도/활동도/점유율 등과 같은 집중의 의미를 포함하는 특허 정보 분석 지표의 값을 측정하고, 각 값에 가중치를 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하여 집중 관점 가중치값을 생성한다.
상기 집중 관점 가중치 전처리 모듈(3317)이 가중치를 처리하는 방식은 도 32에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈(3311) 및 상기 인용 관점 가중치 전처리 모듈(3313)이 가중치를 처리하는 방식과 대동소이하다.
상기 집중 관점 가중치 전처리 모듈(3317)이 적어도 하나 이상의 특허 문건 정보를 입수하며(S3220), 특허 문건 데이터베이스(2310)에서 출원인 정보, 특허 기술 분류 정보를 입수하며(S3230), 입수된 출원인 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 출원인의 집중도/활동도/점유율 중 적어도 하나 이상의 기준으로 그 값을 계산하며(S3240), 각 기준별 집중도/활동도/점유율에 대한 가중치 정보를 상기 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하며(S3250), 상기 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하며(S3260), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3270).
상기 집중 관점 가중치 전처리 모듈(3317)은 출원인이 아닌 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식은 도 33에 나와 있다. 상기 집중 관점 가중치 전처리 모듈(3317)이 적어도 하나 이상의 특허 문건 정보를 입수하며(3320), 특허 문건 정보에서 발명자 정보, 특허 기술 분류 정보를 입수하며(S3330), 입수된 발명자 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 발명자의 집중도를 적어도 하나 이상의 기준으로 계산하고(S3340), 각 기준별 집중도에 대한 가중치 정보를 입수하며(S3350), 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하고(S3360), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3370).
주체 단위 가중치 전처리 모듈(3330)
하나의 특허 문건이 있을 때, 그 특허 문건에 개입되는 주체가 중요한 주체일 경우, 그 주체가 출원한 특허가 중요한 특허일 가능성이 높다. 이때 어떤 주체가 더 중요한 주체일 수 있을가를 판단하는 것이 관건이다. 하나의 특허 문건 포함되는 주체는 출원인, 발명자 및 대리인이 있을 수 있다. 하나의 특허 문건에 대하여 상기 주체 관점에서 그 문건의 가중치를 전처리하는 기능을 수행하는 것을 주체 단위 가중치 전처리 모듈(3330)이라 한다. 도 4에서 알 수 있듯이 상기 주체 단위 가중치 전처리 모듈(3330)은 주체의 종류에 따라 출원인 단위 가중치 전처리 모듈(3331), 발명자 단위 가중치 전처리 모듈(3333), 대리인 단위 가중치 전처리 모듈(3335)가 있다.
출원인 단위 가중치 전처리 모듈(3331)
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 출원인이 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 출원인이 집중하는 분야는 그 기술 분야로의 집중율, 점유율, AI 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 출원인 단위 가중치 전처리 모듈(3331)이 수행한다.
상기 출원인 단위 가중치 전처리 모듈(3331)이 가중치를 처리하는 방식은 도 34에 나와 있다. 상기 출원인 단위 가중치 전처리 모듈(3331)이 출원인 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3420), 기준에 부합하는 출원인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈(3310)이 계산한 결과값을 입수하며(S3430), 문건 단위 가중치 전처리 모듈(3310)별 가중치 정보를 상기 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하고(S3440), 각 문건 단위 가중치 전처리 모듈(3310)의 가중치와 각 결과값으로 입수한 기준별 출원인 단위 가중치값을 생성하며(S3450), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3460).
발명자 단위 가중치 전처리 모듈(3333)
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 발명자가 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 발명자가 집중하는 분야는 그 기술 분야로의 그 발명자 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 발명자로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발 명의 발명자 단위 가중치 전처리 모듈(3333)이 수행한다.
상기 발명자 단위 가중치 전처리 모듈(3333)이 가중치를 처리하는 방식은 도 35에 나와 있다. 상기 발명자 단위 가중치 전처리 모듈(3333)이 발명자 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3520), 기준에 부합하는 발명자 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈(3310)이 계산한 결과값을 입수하며(S3530), 문건 단위 가중치 전처리 모듈(3310)별 가중치 정보를 상기 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하며(S3540), 각 문건 단위 가중치 전처리 모듈(3310)의 가중치와 각 결과값으로 입수한 기준별 발명자 단위 가중치값을 생성하며(S3550), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3560). 상기 가중치 정보에는 "과거 전체 출원대비 등록율*0.1+해외 출원 패밀리 수*0.5"와 같은 정책이 포함되어 있을 수 있다.
대리인 단위 가중치 전처리 모듈(3335)
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 대리인이 집중하는 기술 분야인 경우라면 그 특허 명세서의 완성도는 그렇지 않은 대리인이 작성하는 경우보다 높을 것이다. 그러므로, 특정 문건의 대리인이 집중하는 분야는 그 기술 분야로의 그 대리인 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 대리인으로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 대리인 단위 가중치 전처리 모듈(3335)이 수행한다. 상기 대리인 단위의 가중치는 출원인 단위의 가중치나 상기 발명자 단위 가중치보다 중요도가 낮을 것이다.
상기 대리인 단위 가중치 전처리 모듈(3335)이 가중치를 처리하는 방식은 도 36에 나와 있다. 상기 대리인 단위 가중치 전처리 모듈(3335)이 대리인 단위로 가중치를 처리하기 위한 기준 정보를 입수하며(S3620), 기준에 부합하는 대리인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈(3310)이 계산한 결과값을 입수하며(S3630), 문건 단위 가중치 전처리 모듈(3310)별 가중치 정보를 상기 특허 정보 처리 정책 데이터베이스(2330)로부터 입수하며(S3640), 각 문건 단위 가중치 전처리 모듈(3310)의 가중치와 각 결과값으로 입수한 기준별 대리인 단위 가중치값을 생성하며(S3650), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3660). 상기 가중치 정보에는 "출원대비 등록율*0.3"과 같은 정책이 포함되어 있을 수 있다.
본 발명의 문건 단위 가중치 전처리 모듈(3310) 및 주체 단위 가중치 전처리 모듈(3330)은 상기와 같은 적어도 하나 이상의 각 가중치 전처리 모듈(3300)이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 문건 단위의 가중치를 계산해 낸다. 이때, 각 관점의 가중치 부여 모듈 각각 또는 각 주체별 가중치 부여 모듈 각각은 자신이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 자신의 관점에서의 문건 단위의 가중치를 계산해 낼 수 있다. 상기의 각 가중치들은 관리자 또는 사용자의 입력에 따라 다르게 부여될 수 있음은 물론이다 하 겠다.
패밀리 정보 전처리 모듈(3800)
특허 패밀리란 특정 특허 문건과 국내, 또는 해외적으로 직접적으로 관련있는 문건으로 구성된 문건 정보의 집합을 말한다. 통상적으로 하나의 국가 내에서, 1) 분할출원, 2) 변경 출원이나 이중출원, 3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국내 특허 패밀리를 이룬다. 통상적으로 하나의 출원을 기초로 한 1) 국제출원(PCT), 2) 조약 우선권 출원, 3) 상기 1) 또는 2)가 특정 국가의 특허청에 출원되었을 때의 각 국가별 출원 및 상기 3)의 출원에 관한 (1) 분할출원, (2) 변경 출원이나 이중출원, (3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국제 특허 패밀리를 이룬다. 본 발명의 특허 패밀리 정보를 전처리 하는 패밀리 정보 전처리 모듈(3800)에 대한 구성은 도 9에 잘 나타나 있다. 패밀리 정보를 처리하기 위해서는 그 정보를 처리하는 패밀리 정보 전처리 엔진(3810)이 필요하며, 패밀리 정보를 입수하기 위한 각종 DB가 필요한다. 필요한 DB의 예로는 조약 우선권 정보 DB(3671), PAJ DB(3673), KPA DB(3675), Inpadoc DB(3677), 기타 패밀리정보 DB(3830) 등이 있을 수 있다. 특히 Inpadoc DB(3677)가 중요한 역할을 한다.
상기 패밀리 정보 전처리 모듈(3800)은 특허 정보 데이터베이스(2300)의 가공과 업데이트와 밀접하게 관련이 있다. 그 이유는 특허 정보는 1) 신규한 문건이 지속적으로 발행되고, 2) 국가 단위로 입수되는 것이 대부분이며, 상기 각 국가별로 신규한 문건이 지속적을 발행되므로, 상기 패밀리 정보는 상기 1) 및/또는 2)에 따라 언제든지 변경될 가능성이 있기 때문이다. 즉, 상기 1) 또는 2)의 문건 입수 시 상기 패밀리 정보는 갱신되어야 할 필요가 있으며, 상기 1) 또는 2)의 문건 입수 시 패밀리 정보의 갱신은 본 발명의 패밀리 정보 전처리 모듈(3800)이 수행한다. 상기 패밀리 정보는 기존 문건 또는 신규 문건을 대상으로 원출원 정보 내지 우선권 정보에 특정 출원 번호가 존재하는 지를 통해서 발견할 수 있다.
상기 패밀리 정보 전처리 모듈(3800)의 상기 패밀리 정보 전처리 엔진(3810)이 패밀리 정보를 처리하는 방법은 도 37에 나와 있다. 상기 패밀리 정보 전처리 모듈(3800)은 적어도 하나 이상의 특허 문건 정보를 입수하고(S3720), 상기 특허 문건 정보에 우선권 주장 번호, 분할 출원, 변경 출원 또는 일부 계속 출원 등의 패밀리 정보가 있는 지를 파악하며(S3730), 패밀리 정보가 있는 경우, 상기 특허 문건의 정보를 패밀리 정보에 대응되는 패밀리 특허 문건의 고유 문건 번호와 관련지어 특허 DB 또는 검색 인덱스에 저장하며(S3740), 선택적으로 입수된 특허 문건에 국가별 패밀리 정보의 개수를 카운팅하여 저장하거나 패밀리 특허 문건의 고유 문건 번호에 패밀리 정보의 개수에 관한 정보가 있을 때 그 개수에 가산한다(S3750).
인용 정보 전처리 모듈(3400)
특허 인용 정보의 종류에는 1) 출원인이 선행 기술로서 타 특허를 인용하는 선행 기술 인용 정보와 2) 심사관이 특정 특허 문건을 심사할 때 인용하는 인용 참 증으로서의 특허를 인용하는 참증 인용 정보가 있을 수 있다. 물론, 상기 인용은 국내외적으로 일어남은 당연할 것이다. 통상적으로 상기 첫번째 선행 기술로 타특허를 인용하는 것은 대한민국이나 일본에서는 종래 기술 문헌 정보에 있고, 미국에서는 레퍼런스(reference) 정보에 있다. 이러한 선행 기술 인용 정보는 특허 문건의 서지 사항 또는 본문에서 획득 가능하다. 또한, 많은 국가들이 참증 인용 정보를 공개하는데, 이는 특허청에서 공개하는 행정 정보 등에서 확인할 수도 있다. 본 명세서에서는 상기 선행 기술 인용 정보를 중점적으로 설명하나, 획득된 참증 인용 정보도 선행 기술 인용 정보처럼 다루어 질 수 있는 경우에는 상기 설명이 동등하게 준용 될 수 있을 것이다.
상기 선행 기술 인용 정보 및 상기 참증 인용 정보를 전처리하는 것은 본 발명의 인용 정보 전처리 모듈(3400)이 수행하며, 도 5에서 알 수 있듯이 상기 인용 정보 전처리 모듈(3400)에는 선행 기술 인용 정보를 전처리하는 선행 기술 인용 정보 전처리 엔진(3410)과 참증 인용 정보를 전처리하는 참증 인용 정보 전처리 모듈(3430)이 포함되어 있다. 통상적으로 특정 문건의 서지 사항 또는 본문에 전방 인용(backward citation)은 포함되어 있기 때문에, 전방 인용에 관한 문건 정보는 상기 특정 문건의 검색 인덱스 또는 특정 문건 정보에 저장되어 있다. 하지만, 상기 특정 문건에 관한 후방 인용(forward citation)은 그 특정 문건 정보에 저장되지 않고, 상기 특정 문건을 인용하는 문건의 검색 인덱스 또는 상기 인용하는 문건 정보에 저장되어 있다. 그러므로, 상기 특정 문건에 관한 후방 인용을 찾아서 상기 특정 문건과 관련지어 저장할 필요가 있게 되고, 이러한 기능은 상기 선행 기술 인용 정보 전처리 엔진(3410)이 수행한다.
상기 선행 기술 인용 정보 전처리 엔진(3410)은 상기 특정 문건의 출원 번호 내지 상기 특정 문건의 고유 번호값을 상기 검색 인덱스 또는 DBMS(2100)에 질의함으로써, 상기 특정 문건을 인용하고 있는 상기 특정 문건의 후방 인용 정보를 획득할 수 있다. 상기 선행 기술 인용 정보 전처리 엔진(3410)은 상기 획득한 상기 특정 문건의 후방 인용 정보를 상기 특정 문건의 인덱싱 과정에서 상기 인덱스에 포함시켜 놓을 수도 있고, 상기 특허 정보 데이터베이스(2300)에 상기 특정 문건의 후방 인용 정보로서 저장할 수 있다. 전방 인용 정보는 거의 변화가 없는 반면(출원인이 출월할 때 기재하는 것이며, 간혹 추가 등이 있을 수 있으나 전방 인용의 추가는 거의 발생하지 않는 것이 통상이다.) 후방 인용 정보는 특허 정보의 갱신 시 항상 모니터링 해야 하는 정보이다. 그러므로, 신규한 특허 문건이 발생해서, 검색 인덱스가 갱신되거나, 특허 정보 데이터베이스(2300)가 갱신되는 경우, 상기 선행 기술 인용 정보 전처리 엔진(3410)은 상기 특정 문건을 인용하고 있는 갱신 특허 문건이 있는 지를 질의하여, 후방 인용 정보를 갱신해야 한다.
하지만, 상기와 같이 검색 인덱스 갱신, 또는 특허 정보 데이터베이스(2300) 갱신 시 질의하는 방식으로 후방 인용 정보를 갱신하는 경우, 매 갱신 시마다 엄청나게 많은 질의를 수행해야 한다.(어느 특정 문건에서 후방 인용 정보가 포함되었는지를 모르므로, 모든 상기 특정 문건의 출원 번호나 고유 번호를 질의해 봐야 한다.) 그러므로, 상기 선행 기술 인용 정보 전처리 엔진(3410)은 업데이트(갱신)되는 신규 특허 문건에서 상기 특정 문건에 관한 인용 정보(전방 인용)가 발견되는 경우, 상기 특정 문건에 관련된 정보에 상기 신규 특허 문건 정보를 후방 인용 정보로서 추가한다. 상기 특정 문건에 관련된 정보에는 상기 특정 문건에 관한 검색 인덱스 또는 상기 있는 특허 정보 데이터베이스(2300) 상의 특정 문건에 관한 레코드(record)인 것이 바람직하다. 즉, 상기 선행 기술 인용 정보 전처리 엔진(3410)은 신규 특허 문건 입수 시 상기 신규 특허 문건에 포함되어 있는 전방 인용 정보를 입수하여, 인용 당하고 있는 문건 번호를 기준으로 인용하고 있는 문건 번호를 관계지어 검색 인덱스 또는 특허 정보 데이터베이스(2300)의 상기 인용 당하고 있는 문건 번호에 관한 문건 정보에 저장한다. 본 문단에서 설명한 방법을 취하는 경우, 신규 특허 문건 정보에 포함되어 있는 전방 인용 정보를 활용하므로, 전산 자원의 소모량을 급격하게 줄일 수 있다.
이때, 상기 인용 정보는 상기 인용 정보를 표기하는 사람마다 출원 번호, 등록 번호, 또는 공개 번호 등으로 표기 하는 등 그 표기 방식이 다를 수 있다. 즉, 실체적으로 동일한 문건(문건 고유 번호 #1 )이라도 A 문건에는 출원 번호로, B 문건에는 공개 번호로, C 문건에는 등록 번호로 인용 정보가 표기 되어 있을 경우, 그 인용 정보의 처리에 오류가 발생할 가능성이 높아진다. 상기 문건 고유 번호 #1을 인용하고 있는 타 문건 정보를 찾기 위해서는 상기 문건 고유 번호 #1에 관련된 모든 속성의 다른 문건 번호를 한번씩 조회를 해 보아야 하는 문제가 발생한다.
그러므로, 본 발명의 선행 기술 인용 정보 전처리 엔진(3410)은 입수 되는 인용 정보의 속성과는 독립적으로 상기 입수 되는 인용 정보를 하나의 문건 고유 번호로 맵핑해 놓을 필요가 있을 것이며, 인용 정보로서의 문건 번호를 대표화 할 필요가 있다. 즉, 문건 고유 번호를 출원 번호로 하는 경우, 입수되는 인용 정보가 공개 번호이든 등록 번호이든 무관하게, 상기 공개 번호 또는 등록 번호를 가지는 출원 번호를 입수하는 인용 대표 정보로서 상기 출원 번호를 별도의 인용 정보로 관리할 수 있으며, 이에 따라 인용의 분석이나 카운팅 등에도 상기 인용 대표 번호를 기준으로 처리할 수 있다. 즉, 인용 정보의 대표명화를 관리할 수 있다. 이는 특히 미국이 특허 공개 공개를 도입하였기 때문에 그 중요성이 더욱 커지고 있다. 어떤 형태로의 인용 정보에 대하여 내부적으로 동일한 문서를 동일하게 처리한다. 이를 위해서 출원 번호가 가장 바람직하며
이때, 대표화 된 인용 정보는 공개 번호 또는 "국가명 + 공개 번호"로 대표화할 수도 있지만, 출원 번호 또는 "국가명 + 출원번호"로 대표화하거나, 바람직하다. 등록 번호의 경우, 등록되지 않은 문건이 발생할 가능성이 있으며, 공개 번호(문건 발행 번호)도 출원 공개 번호 또는 등록 공개 번호 또는 기타 공보가 발생할 때마다 공개 번호가 발생하는 문제가 있기 때문이다.
상기 선행 기술 인용 정보 전처리 엔진(3410)이 작동하는 방식과 상기 참증 인용 정보 전처리 모듈(3430)이 작동하는 방식은 거의 동일하다. 상기 참증 인용 정보 전처리 모듈(3430)도 특정 문건이 신규 특허 문건에서 참증 인용으로 후방 인용 되었을 때, 상기 특정 문건에 관련된 정보(검색 인덱스 또는 특허 정보 데이터베이스(2300)의 상기 특정 문건 정보용 레코드(record))에 상기 신규 특허 문건의 출원 번호나 고유 번호를 저장한다.
인용 번호를 대표화하는 인용 정보 전처리 방법에 대해서는 도 38에 상세히 나와 있다. 상기 인용 정보 전처리 모듈(3400)은 특정 문건에 존재하는 적어도 하나 이상의 인용 번호를 입수 받고(S3820), 상기 인용 번호의 속성이 기설정된 인용 번호 속성이 아닌 인용 번호를 입수하고(S3830), 상기 입수된 인용 번호를 검색 엔진(7000) 또는 DBMS(2100)에 질의하여 상기 기설정된 속성의 인용 번호를 입수 받고(S3840), 상기 입수된 기설정된 속성의 인용 번호로 상기 입수 받은 인용 번호를 대표화한다(S3850).
특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함시킬 필요가 있으며, 이러한 과정의 일 실시예적 방법을 도 39가 도시하고 있다.
상기 인용 정보 전처리 모듈(3400)은 특정 문건 데이터를 입수하고(S3920), 상기 특정 문건 데이터에 포함된 출원번호, 등록번호, 공개번호 중 적어도 어느 하나 이상을 입수하며 (S3940), 상기 입수한 번호를 검색 엔진(7000)의 인용 필드에 질의하거나, DBMS(2100)로 인용 필드를 한정하여 질의하고(S3950), 상기 질의 결과로서 후방 인용 정보를 입수 받으며(S3960), 상기 후방 인용 정보를 상기 문건 데이터의 서지 사항에 포함시킨다(S3970).
특허 분류 기호 전처리 모듈(3500)
특허 분류 기호 정보와 상기 전술한 특허 분류 정보의 타이틀 정보는 1:1로 대응되어 있으며, IPC의 경우 통상적으로 서브그룹이하에서는 도트의 개수로 특허 분류 기호로는 표현할 수 없는 상하위 계층 정보를 표현한다. IPC의 경우에는 서브그룹 이하에서는 특허 분류 기호 정보만으로는 상위와 하위 관계를 알기 어려우 므로, 특허 분류 기호 정보에 대응되는 타이틀 정보에 포함되어 있는 도트를 활용하여 상하위 계층 정보를 파악한다. 즉, 서브 그룹 이하에서는 타이틀에 포함되어 있는 도트 구조를 파악함으로써, 상기 서브그룹 이하의 특허 분류 기호들 간의 상하위 계층 구조를 파악한다. 특허 분류 기호들 간의 상하위 계층 구조는 트리(tree)구조의 형태를 가진다.
본 발명에서는 IPC 7판 기준 메인그룹 H04B 7/00(타이틀은 무선전송시스템이다.) 및 이의 하부에 해당하는 특허 분류 기호를 실시예로 들어 상기 특허 분류 기호들 간의 트리 구조를 설명하나, 이러한 방법 및 설명은 본 실시예에 한정되지 않고, 전 IPC 영역에 걸쳐 동일 또는 대등하게 적용됨은 물론이며, 타이틀에 도트 구조로서 계층의 상위와 하위를 표현하는 방식으로 포함하는 다른 특허 분류 기호 체계(예를 들면, USPC, FI, FT 또는 ECLA) 등에 대해서도 동일 또는 대등한 방식으로 적용된다.
메인그룹 H04B 7/00 및 이의 하부에 해당하는 특허 분류 기호 및 그 타이틀 은 IPC 7판 기준으로 2006년 5월 5일 현재 다음과 같은 구성을 가진다.
H04B 7/00 무선전송시스템, 즉, 방사전자계를 사용한 것
H04B 7/005 .전송의 제어 ; 등화
H04B 7/01 .위상편이의 저감
H04B 7/015 .반향효과의 저감
H04B 7/02 .다이버시티(diversity)시스템
H04B 7/04 .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/06 ...송신국에 있어서의 것
H04B 7/08 ...수신국에 있어서의 것
H04B 7/10 .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12 ..주파수다이버시티 시스템
H04B 7/14 .릴레이(relay)시스템
H04B 7/145 ..수동 릴레이 시스템
H04B 7/15 ..능동 릴레이 시스템
H04B 7/155 ...기지국(groundbased stations)
H04B 7/165 ....각도변조를 사용하는 것
H04B 7/17 ....펄스변조를 사용하는 것
H04B 7/185 ...우주국 또는 항공기탑재국(spacebased or airborne stations)
H04B 7/19 ....지구동기국(earthsynchrenons stations)
H04B 7/195 ....비동기국
H04B 7/204 ...다중악세스(multiple access )
H04B 7/208 ....주파수분할 다중악세스
H04B 7/212 ....시분할 다중악세스
H04B 7/216 ....코드분할 또는 스프레드-스펙트럼 다중 억세스
H04B 7/22 .산란파 전파시스템
H04B 7/24 .둘 또는 그 이상의 지점간의 통신을 위한 것
H04B 7/26 .. 적어도 하나의 지점이 이동될 수 있는 것
상기를 도트를 기준으로 트리 계층 구조를 더욱 쉽게 할 수 있도록 하면 다음 표와 같은 표현될 수 있다.
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 4-도트서브그룹 타이틀
H04B 7/00 무선전송시스템
H04B 7/005 .전송의 제어 ; 등화
H04B 7/01 .위상편이의 저감
H04B 7/015 .반향효과의 저감
H04B 7/02 .다이버시티(diversity)시스템
H04B 7/04 .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/06 ...송신국에 있어서의 것
H04B 7/08 ...수신국에 있어서의 것
H04B 7/10 .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12 ..주파수다이버시티 시스템
H04B 7/14 .릴레이(relay)시스템
H04B 7/145 ..수동 릴레이 시스템
H04B 7/15 ..능동 릴레이 시스템
H04B 7/155 ...기지국(groundbased stations)
H04B 7/165 ....각도변조를 사용하는 것
H04B 7/17 ....펄스변조를 사용하는 것
H04B 7/185 ...우주국 또는 항공기탑재국
H04B 7/19 ....지구동기국
H04B 7/195 ....비동기국
H04B 7/204 ...다중악세스
H04B 7/208 ....주파수분할 다중악세스
H04B 7/212 ....시분할 다중악세스
H04B 7/216 코드분할 또는 스프레드-스펙트럼 다중 억세스
H04B 7/22 .산란파 전파시스템
H04B 7/24 .둘 또는 그 이상의 지점간의 통신을 위한 것
H04B 7/26 .. 적어도 하나의 지점이 이동될 수 있는 것
본 발명의 특허 분류 기호 전처리 모듈(3500)은 특허 분류 기호 전처리 엔진(3510) 및 상기 특허 분류 기호 전처리 엔진(3510)이 처리한 전처리된 계층적 특허 분류 기호 데이터베이스(10000)를 포함한다. 물론, 본 발명의 특허 분류 기호 전처리 엔진(3510)은 본 발명의 특허 분류 기호 데이터베이스(10000)를 활용하여 적어도 한 종류 이상의 특허 분류 기호를 전처리 한다. 본 발명의 특허 분류 기호 전처리의 종류는 크게 다름과 같다. 첫째, 특허 분류 기호에 대응되는 타이틀 정보에 포함된 도트(dot)구조를 반영하여 특정 특허 분류 기호 체계에 속하는 모든 특허 분류 기호들에 대해서 계층적으로 통합된 구조를 가지는 계층적 특허 분류 기호 데이터베이스(10000)를 생성하는 것이다.(계층적으로 통합된 구조를 가진다는 말은 임의의 특허 분류 기호가 주어졌을 때, 상기 특허 분류 기호의 하위 특허 분류 기호들은 자동적으로 추출해 낼 수 있음을 의미한다) 둘째는 검색 엔진(7000)에 대한 검색식 또는 DB 쿼리(질의)에 특허 분류 기호가 포함되어 있을 경우, 상기 특허 분류 기호의 하위에 있는 모든 특허 분류 기호를 포함하는 수정 검색식 내지는 수정 쿼리(질의)를 생성하는 것이다. 셋째는 검색이나 질의의 응답 속도를 빠르게 하기 위하여 범위 검색(range search)를 지원하기 위하여 특허 분류 기호 체계를 변형하고, 변형된 특허 분류 기호 체계로 검색, 질의 응답, 분석 수행, 감시 등의 본 발명의 특허 분류 기호가 사용되는 모든 곳에 상기 변형 특허 분류 기호를 사용하기 위한 변형 특허 분류 기호 체계의 생성, 관리 및 활용 방법에 관한 것이다.
본 발명의 특허 분류 기호 전처리 엔진(3510)에는 계층적 특허 분류 기호 데이터베이스 생성 모듈로, 상기 모듈은 특허 분류 기호 정보와 상기 특허 분류 기호 정보에 대응되는 기술 내용을 담고 있는 타이틀 정보를 포함하고 있는 특허 분류 정보 데이터를 대상으로 하여, 특허 분류 기호들 간의 트리 구조를 포함하는 계층적 특허 분류 기호 데이터베이스를 생성한다. 상기 계층적 특허 분류 기호 데이터베이스는 특허 분류 기호 간의 계층 구조를 반영하여 생성되기 때문에 계층적 특허 분류 기호 데이터베이스의 한 예일 수 있다.
상기 계층적 특허 분류 기호 데이터베이스 생성 모듈은 최상위 특허 분류 기호(IPC의 경우에는 section 표시 특허 분류 기호, USPC의 경우에는 class 표시 특허 분류 기호 등이 그 예가 된다.)를 제외한 다른 하나의 특허 분류 기호에 대하여 상기 특허 분류 기호가 속하는 직상위 특허 분류 기호를 대응시키거나(1:1), 상기 하나의 특허 분류 기호에 대하여 그 분류 기호의 직하부에 해당되는 직하위 특허 분류 기호를 대응시켜(1:n) 놓은 기능을 수행한다. 전산적으로 양자모두 가능하나, 하나의 특허 분류 기호(child)에 대응되는 상위(parent) 1:1 관계를 생성시키는 전자 방식이 더 합리적이다. 상기와 같은 관계 대응으로 모든 특허 분류 기호들이 트리 구조 속에서 서로간의 관계를 정립하게 된다.
전자는 child에 parent를 대응시키는 방법이며, 후자는 parent에 그 parent에 속하는 child들를 대응시켜 저장시켜 놓는 방법이다. 양자 모두 parent에 속하는 child들을 찾아 내는 과정에 활용될 수 있는데, 전자는 그 parent가 주어졌을 때 그 parent를 가리키고 있는 child를 찾으면 되고, 후자는 그 parent에 속하는 child가 직접 저장되어 있으므로, 그 저장된 정보를 활용하면 된다. 그러므로, 전자는 child-parent의 관계성을 child를 중심으로 1:1로 저장해 놓는 방식이며, 후 자는 parent를 중심으로 그 parent에 속하는 직하위 child들을 직접 저장해 놓는 방식이다.
상기 계층적 특허 분류 기호 데이터베이스 생성 모듈이 상기 계층적 특허 분류 기호 데이터베이스를 생성하는 방법은 IPC 분류를 기준으로 설명하면 다음과 같다.
1) 섹션에서 메인그룹까지는 분류 기호 체계대로 계층적 특허 분류 기호 데이터베이스를 생성하며, 자신, 자신의 직상위, 직하위 특허 분류 코드에 대하여 자신의 parent정보를 저장하거나, 자신의 직하위 child 정보를 저장한다.
2) 메인그룹 특허 분류 기호에 대해서는 다음 메인 그룹 특허 분류 기호가 나오기 전까지의 모든 특허 분류 기호에 대해서 그 특허 분류 기호에 대응되는 타이틀이 도트 1개를 가지는 특허 분류 기호를 찾는다. 메인그룹 특허 분류 기호는 통상 슬래쉬(^/^)다음에 00이 결합되어 있으므로 찾기가 용이하다. child -> parent(child가 자신의 유일한 parent를 가리키는 방식)인 경우에는 도트 1개를 가지는 1-도트 서브 그룹의 각 특허 분류 기호마다 자신의 유일한 직상위 parent인 메인 그룹의 특허 분류 기호를 저장한다. 그리고, parent -> child(자기 밑에 있는 모든 child를 저장해 놓는 방식) 방식일 경우에는 메인 그룹에 속하는 도트를 1개 가지는 1-도트 서브 그룹의 특허 분류 기호를 메인 그룹의 표현하는 특허 분류 기호에 연관지어 저장한다.
이때, 메인 그룹 자신, 자신의 직하위 특허 분류 코드에 대하여 자신의 parent정보를 저장하거나, 자신의 직하위 child 정보를 저장한다.
3) 상기 도트 1개를 가진 특허 분류 기호에 대하여 동일한 메인 그룹에 속하면서 다음 도트 1개를 가진 특허 분류 기호 이전의 모든 특허 분류 기호를 대상으로 그 타이틀에 도트 2개인 특허 분류 코드를 찾는다. 만약 동일한 메인 그룹에 속하면서 그 타이틀에 도트 1개를 가지는 다른 특허 분류 기호가 없는 경우(메인 그룹에 서브 그룹이 1개 있거나, 서브 그룹들 중에서 맨 마지막 서브 그룹)에는 그 타이틀에 도트 1개를 가진 특허 분류 기호와 다음 메인 그룹을 표시하는 특허 분류 기호 이전의 모든 특허 분류 기호 중에서 그 타이틀에 도트 2개를 가진 특허 분류 코드를 찾는다. 자신의 parent와 child를 저장하는 방법은 위 2)에서와 동등하다.
4) 상기 타이틀에 도트 2개를 가지는 특허 분류 코드를 대상으로 위 3)과 동일한 논리로 그 타이틀에 도트 3개를 가지는 특허 분류 코드를 찾아, 위 3)과 동등한 방식으로 처리한다.
또다른 상기 계층적 특허 분류 기호 데이터베이스 생성 모듈이 상기 계층적 특허 분류 기호 데이터베이스를 생성하는 방법을 제시하면 다음과 같다.
IPC가 순서(레코드 번호)대로 있는 테이블의 맨 아래 IPC로부터 위쪽으로 올라오면서 자신의 직상위 parent를 찾는 방법으로 다음과 같은 순서를 취할 수 있다. 1) 맨 아래의 특허 분류 기호에 대응되는 타이틀 정보에서 도트의 개수를 확인하고, 자기 레코드 번호 -1인 레코드 번호(바로 위 IPC)에 있는 특허 분류 기호의 타이틀에 있는 도트수를 확인한다. 만약 도트 수가 하나 적으면 그것이 자신의 parent이며, 도트 수가 같으면 자신과 동등한 레벨이며, 도트수가 자기 보다 많으면, 자신의 직상부나 직하부가 아니라고 판정하고, 자신의 parent에 대해서만 저장 한다. 만약 서브 그룹 이상의 특허 분류 기호를 만나게 되면 그 서브 그룹 이상의 특허 분류 기호를 자신의 parent로 저장한다.
2) 자기 레코드 번호 -1인 레코드 번호에 있는 특허 분류 기호의 타이틀에 있는 도트 수가 자신과 동등하거나, 자기보다 많거나, 특허 분류 기호가 서브 그룹이상이면 parent관계를 무시하고, 자기 레코드 번호 -1인 레코드 번호인 특허 분류 기호에 대해서 위 2)을 수행한다.
이상의 2가지 실시예에서 계층적 특허 분류 기호 데이터베이스를 생성하는 방법을 제시했으나 이는 실시예에 불과하고, 상기 IPC 특허 분류 기호 및 이에 대응되는 타이틀 정보로부터 모든 IPC에 대하여 자신의 parent 정보 또는 자신의 child 정보를 생성하는 것은 전산 시스템을 개발하는 당업자에게는 용이한 일일 것이다.
상기 계층적 특허 분류 기호 데이터베이스 생성 모듈은 주어진 특허 분류 기호가 있을 경우, 계층적 특허 분류 기호 데이터베이스를 생성하는데, 그 일 구현예는 다음과 같다.
H04B7/00이하에 있는 특허 분류 기호를 대상으로 하여, 상기 양 방법의 구현된 결과의 구현예를 제시한다.
먼저, child 특허 분류 기호에 그 분류 기호가 속한 직상위 분류 기호인 parent(child -> parent)를 대응시키는 방법에 따른 결과이다.
Child(자신) Parent(자신의 parent)
H04B 7/005 7/00
H04B 7/01 7/00
H04B 7/015 7/00
H04B 7/02 7/00
H04B 7/04 H04B 7/02
H04B 7/06 H04B 7/04
H04B 7/08 H04B 7/04
H04B 7/10 H04B 7/02
H04B 7/12 H04B 7/02
H04B 7/14 7/00
H04B 7/145 H04B 7/14
H04B 7/15 H04B 7/14
H04B 7/155 H04B 7/15
H04B 7/165 H04B 7/155
H04B 7/17 H04B 7/155
H04B 7/185 H04B 7/15
H04B 7/19 H04B 7/185
H04B 7/195 H04B 7/185
H04B 7/204 H04B 7/15
H04B 7/208 H04B 7/204
H04B 7/212 H04B 7/204
H04B 7/216 H04B 7/204
H04B 7/22 7/00
H04B 7/24 7/00
H04B 7/26 H04B 7/24
이어서, 자기 자신의 직하부에 대한 모든 child 정보를 가지는 방법(parent -> child)에 대한 결과의 일실시예를 제시한다.
Parent(자신) Child(자신의 직하부 child)
H04B 7/00 H04B 7/005
H04B 7/01
H04B 7/015
H04B 7/02
H04B 7/14
H04B 7/22
H04B 7/24
H04B 7/005 null
H04B 7/01 null
H04B 7/015 null
H04B 7/02 H04B 7/04
H04B 7/10
H04B 7/12
H04B 7/04 H04B 7/06
H04B 7/08
H04B 7/06 null
H04B 7/08 null
H04B 7/10 null
H04B 7/12 null
H04B 7/14 H04B 7/145
H04B 7/15
H04B 7/145 null
H04B 7/15 H04B 7/155
H04B 7/185
H04B 7/204
H04B 7/155 H04B 7/165
H04B 7/17
H04B 7/165 null
H04B 7/17 null
H04B 7/185 H04B 7/19
H04B 7/195
H04B 7/19 null
H04B 7/195 null
H04B 7/204 H04B 7/208
H04B 7/212
H04B 7/216
H04B 7/208 null
H04B 7/212 null
H04B 7/216 null
H04B 7/22 null
H04B 7/24 H04B 7/26
H04B 7/26 null
둘째, 하위 계층 특허 분류 기호 처리 모듈로, 사용자가 입력하는 검색식 등에서 입수 받은 특허 분류 기호에 대하여, 상기 계층적 특허 분류 기호 데이터베이스를 통하여 상기 입수 받은 특허 분류 기호에 종속되는 하위 계층 특허 분류 기호를 찾아 내는 역할을 수행한다.
입수 받은 특허 분류 기호에 대해 하위 계층 특허 분류 기호에 해당하는 특허 문건이 검색 결과에 포함되게 하기 위해서는 다음과 같은 3가지 중 어느 하나 이상이 필요하며, 이러한 일을 상기 하위 계층 특허 분류 기호 처리 모듈이 수행한다.
첫째, 상기 계층적 특허 분류 기호 데이터베이스를 이용하여 입수 시점을 기준으로 하여 입수 받은 특허 분류 기호의 하위 계층 특허 분류 기호를 모두 찾아 낸다. 계층적 특허 분류 기호 데이터베이스 상의 특허 분류 기호들이 트리 구조를 가지고 있기 때문에 이를 찾아 낼 수 있게 된다. 입수 받은 검색식에 특정한 특허 분류 기호가 포함되어 있을 경우, 상기 트리 구조를 따라서 그 특허 분류 기호의 하위 계층의 모든 특허 분류 기호들을 찾아낼 수 있게 되고, 그 결과를 수정 검색식 생성 모듈에 전송하며, 수정 검색식 생성 모듈은 전송 받은 모든 특허 분류 기호들을 반영한 새로운 검색식을 생성하여 검색 엔진(7000)에 질의할 수 있다.
둘째, 사전에 모든 특허 분류 기호에 대하여 그 하위 계층 특허 분류 기호들을 찾아내어 매칭하여(매칭 테이블에) 저장해 놓고, 입수되는 검색식에서 특정 특 허 분류 기호가 있을 경우, 그 특정 특허 분류 기호에 매칭된 하위 계층 특허 분류 기호들을 즉시 상기 수정 검색식 생성 모듈에 전송할 수 있다.
상기 하위 계층 특허 분류 기호 추출 모듈이 추출하는 하위 계층 특허 분류 기호의 범위는 크게 2가지가 있을 수 있다. 하나는 입수 받은 특허 분류 기호의 직하위 특허 분류 기호만으로 추출하는 방법이며, 다른 하나는 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출하는 방법이다. 이때, 직하위 특허 분류 기호만을 추출하는 경우에도, 상기 추출된 직하위 특허 분류 기호들 각각에 대하여 다시 이들의 직하위 특허 분류 기호를 추출해 내며, 이와 같은 방식을 반복함으로써 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출해 낼 수 있다.
예를 들어 설명하면, 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우, 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이며, 하위의 모든 특허 분류 기호는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 된다.
상기와 같은 직하위 특허 분류 기호 및 모든 하위 특허 분류 기호를 추출하는 것은 상기 child -> parent 대응 관계에서나, parent -> child 대응 관계에서나 직접 또는 반복적으로(recursively) 용이하게 추출해 낼 수 있음은 당업자에게는 당연할 것이다.
상기 하위 계층 특허 분류 기호 추출 모듈은 추출된 하위 계층 특허 분류 기호를 주합하여 저장한다. 상기의 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호만을 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/185, 및 H04B 7/204^ 을 주합하여 저장하며, 하위의 모든 특허 분류 기호를 함께 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216^를 주합하여 저장한다.
셋째, 수정 검색식 생성 모듈로 상기 주합된 특허 분류 기호를 원래의 기존 검색식과 통합하여 수정 검색식을 생성한다. 상기 통합은 범위 검색인 경우와 그렇지 않은 경우에 따라 수정하는 방식이 조금 상이하다. 먼저 범위 검색이 아닌 경우를 설명한다.
상기 특허 분류 기호를 포함하고 있던 기존 검색식에서, 상기 특허 분류 기호가 있던 위치에, 상기 특허 분류 기호와 상기 추출되고 주합된 하위 계층 특허 분류 기호를 OR 관계로 묶은 다음, 상기 묶인 특허 분류 기호로 상기 원래의 기존 검색식의 특허 분류 기호 자리를 대체하는 방식으로 이루어 질 수 있다. 이때, 원래의 기존 검색식에 2이상의 특허 분류 기호가 포함되어 있으면, 각각의 특허 분류 기호에 대하여 상기와 같은 특허 분류 기호 통합을 수행할 수 있음은 당연하다 하겠다.
예를 들어 설명하면, 주어진 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15}일 경우에 상기 수정 검색식 생성 모듈은 주어진 검색식에서 IPC H04B 7/15를 찾아서, 직하위 또는 모든 하위 특허 분류 기호를 입수받고 주합하여, ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/185 OR H04B 7/204} 또는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/165 OR H04B 7/17 OR H04B 7/185 OR H04B 7/19 OR H04B 7/195 OR H04B 7/204 OR H04B 7/208 OR H04B 7/212 OR H04B 7/216}와 같은 분류 기호가 통합된 수정된 검색식을 생성해 낸다. 바람직하게는 후자의 검색식이 좋다.
상기 하위 계층 특허 분류 기호 처리 모듈이 수행하는 역할을 요약하면, 입수되는 검색식에서 특허 분류 기호가 포함될 때, 그 특허 분류 기호의 하위 계층 특허 분류 기호에 관련된 정보를 찾아 내어 수정 검색식 생성 모듈이 처리할 수 있도록 해 준다. 물론, 입수되는 검색식의 특허분류 기호가 IPC의 경우 메인그룹 이상일 경우 등과 같이 절단자로 처리할 수 있는 경우에는 본 하위 계층 특허 분류 기호 처리 모듈은 하위 특허 분류 기호를 찾을 필요가 없다.(예를 들면, H04B7/00 또는 H04B만이 입수되는 경우, H04B7/* 또는 H04B*로 처리 가능하기 때문이다.) 그러므로, 하위 계층 특허 분류 기호 처리 모듈은 IPC의 경우에는 서브그룹 이하, 즉 타이틀 정보에 dot가 있을 때에 더욱 유용하며, 다른 분류 기호 체계에서도 dot의 개수로 분류 체계 상의 위치를 정하는 경우에도 역시 유용하게 쓰일 수 있다.)
상기 검색 엔진(7000)은 사용자의 컴퓨터로부터 특허 분류 기호가 포함된 검색식을 입수 받는다 이때, 상기 입수된 검색식에 포함되어 있는 특허 분류 기호가 타이틀 정보에 도트를 포함하는 경우, 상기 특허 분류 기호 전처리 엔진(3510)을 통하여 특허 분류 기호 체계 상에서 하위 특허 분류 기호를 입수하고, 상기 입수한 특허 분류 기호를 OR로 묶고, 상기 OR로 묶은 하위 특허 분류 기호를 포함한 수정 검색식을 생성하고, 수정 검색식으로 검색을 수행한다. 상기 각 단계에 대해서는 상술한 바와 같다.
특허 분류 기호 체계에서 삽입, 삭제, 재배치 등이 있을 경우에는 삽입의 경우에는 사전의 특정 위치에 새로운 단어를 추가한다는 개념과 유사하게 처리할 수 있으며, 삭제는 그 단어를 제거하는 방식으로 처리할 수 있으며, 재배치의 경우에는 삽입과 삭제를 조합해서 수행하는 것으로 처리할 수 있다. 물론, 삽입, 삭제, 재배치가 있을 때마다 변경된 특허 분류 기호 체계 전체에 대해서 새롭게 전체 데이터베이스를 갱신하거나 재작성할 수도 있다.
상기에서는 하위 특허 분류 기호들을 OR로 묶어서 수정 검색식을 생성하는 것을 중심으로 설명하였다. 한편 통상적인 검색 엔진(7000)은 범위 검색을 지원한다. 이어서, 상기 하위 특허 분류 기호들을 일일이 찾아내어 OR로 묶는 방식이 아닌 범위 검색을 지원하기 위한 특허 분류 기호의 처리 방법을 제시한다. 본 방법은 입수 받은 특허 분류 기호의 하위 계층 특허 분류 기호들을 하나씩 개별적으로 찾아 내는 것이 아니라 그 하위 계층 특허 분류 기호들이 가지는 특허 분류 기호 체계 상에서의 범위(range)의 형태로 찾아 낸다. 특히, 그 범위 검색은 사전순(dictionary order)로 되어 있는 자료의 검색에는 더욱 더 큰 검색 속도를 보장한다.
하위 계층 특허 분류 기호들이 가지는 특허 분류 기호 체계 상에서의 범위를 찾아 내는 이유는, 통상적인 검색엔진은 범위 검색을 지원하며, 그 범위 검색이 그 범위에 들어가는 각각을 하나씩 찾아 내는 것보다 훨씬 빠르기 때문이다. 예를 들 어 설명하면, H04B 7/15의 경우라면, H04B 7/15 및 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 모두 or 관계로 묶어 검색 엔진(7000)어 질의하는 것 보다, From H04B 7/15 to H04B 7/216으로 질의하는 것이 훨씬 더 빨리 검색 결과를 응답받을 수 있다. 이는 특히, 하위 계층 특허 분류 기호들이 많으면 많을수록 그 검색 속도의 차이는 커진다.
다만, 범위 검색을 하기 위해서 필요한 선결 조건의 대표적인 요구 사항이 검색 엔진(7000)이 찾는 검색 인덱스에 있는 특허 분류 기호들이 사전 순으로 정리되어 있어야 한다. 그러므로, 특허 분류 기호들이 사전 순으로 정리되어 있으면 그 분류 기호들을 그대로 검색 인덱스에 투입하면 되고, 그렇지 않은 경우에는 사전 순으로 정리되어 검색 인덱스에 투입되는 별도의 분류 체계를 만들어야 한다. 전자를 직투입형이라 하고, 후자를 변형투입형이라 한다. 직투입형의 대표적인 특허 분류 기호 체계가 IPC이며, 변형투입해야 하는 대표적인 특허 분류 기호 체계가 USPC이다. 물론 IPC도 약간의 변형을 가해서 변형 투입형으로 만들 수 있음은 물론이다. 상기 별도의 분류 체계를 변형 특허 분류 기호 체계라 한다.
도 41은 변형 특허 분류 기호를 처리하는 특허 분류 기호 전처리 엔진(3510)으로 , IPC, USPC, FI, FT, ECLA 중에서 선택되는 적어도 어느 하나 이상의 특허 분류 기호 체계에 대하여 상기 특허 분류 기호 체계 상의 기호를 그대로 사용하지 않고, 범위 검색을 지원할 수 있도록 변형 특허 분류 기호를 활용하는 것을 특징으로 한다.
본 실시예의 변형 특허 분류 기호 전처리 엔진(3510)은 상기 변형 특허 분류 기호 체계를 생성하고, 상기 변형 특허 분류 기호 체계를 활용하여 하위 계츨 특허 분류 기호를 처리하며, 입수되는 검색식을 수정하여 수정 검색식을 생성하는 기능을 수행한다. 상기 변형 특허 분류 기호 전처리 엔진(3510)은 변형 특허 분류 기호 데이터베이스 생성 모듈, 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈, 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈을 포함한다.
범위 검색을 더욱 원활하게 지원하기 위해서 직투입형의 경우에도 매칭 테이블을 이용하여 변형투입형으로 변형할 수 있다. 예를 들면, 상기 H04B 7/005, H04B 7/01, H04B 7/185등의 IPC를 각각 H04B70000050, H04B70000100, H04B70000185등과 같이 변형할 수 있다. 변형의 규칙은 다양할 수 있으나, 본 실시예를 기준으로 설명하면, group에 4자리수를 할당하고, sub group에 4자리수를 할당하는 방식이다.(물론, 상기 group보다 상위 분류 기호 체계인 section 및 클래스와 관련된 분류 기호 체계는 그대로 수용하는 것이 바람직할 것이다.) 물론, FI와 같이 sub group이하에서도 확장 기호 등이 있을 때는 그에 상응하는 자리수를 할당하는 방식으로 변형 투입 특허 분류 기호를 생성할 수 있다. 그러므로, 직투입형 특허 분류 기호 체계를 가지는 경우, 상기 매칭 테이블은 아주 간단한 규칙으로도 변형 특허분류 기호 체계를 생성할 수 있다.
한편, USPC처럼 직투입형 특허 분류 기호 체계를 가지지 않는 경우에도, 매칭 테이블을 생성할 수 있다. 상기 USPC에 대하여 매칭 테이블을 생성하는 방법은 후술한다. 상기와 같은 변형 특허 분류 기호 체계를 생성하는 것은 상기 변형 특허 분류 기호 데이터베이스 생성 모듈 이 담당한다. 상기 변형 특허 분류 기호 데이터베이스 생성 모듈이 생성한 변형 특허 분류 기호 체계는 변형 특허 분류 기호 데이터베이스에 저장된다.
상기 변형 특허 분류 기호 전처리 엔진(3510)은 주어진 분류 체계 상의 분류 기호에 대해서 변형 특허 분류 기호 체계 상의 분류 기호를 하나씩 1:1로 대응 할당하고, 상기 인덱서(indexer)가 할당된 변형 특허 분류 기호 체계로 검색 인덱스를 구축하도록 돕는다. 상기 사용자의 상기 주어진 특허 분류 기호 체계로 검색식을 입력하면, 상기 수정 검색식 생성 모듈이 상기 입력된 특허 분류 기호에 대응되는 변형 특허 분류 기호를 찾아내고, 이를 통해서 검색을 수행하여 검색 결과를 도출해 낸다. 검색 결과에 상기 변형 특허 분류 기호가 나타나 있을 필요는 없을 것이다.
이하, 범위 검색이 수행되는 과정을 더욱 상세하게 설명한다. 본 범위 검색은 IPC뿐만 아니라, USPC 등의 다른 특허 분류 기호 체계에도 적용됨은 물론이다 하겠다. 주어진 특허 분류 기호에 종속되는 하위 특허 분류 기호를 자동으로 찾아내어 범위 검색을 수행하기 위해서는 주어진 특허 분류 기호의 트리 구조 상의 next silbing을 찾는 것이 중요하다. 즉, 검색되어야 되는 특허 분류 기호의 범위는 상기 주어진 특허 분류 기호보다는 크거나 같고, 상기 next silbiing가 된다. 이는 변형 특허 분류 기호에 대해서도 마찬가지이다.
IPC 분류 체계는 서브그룹 표기를 숫자가 아닌 문자열로 취급하면, 직투입형의 대표적인 특허 분류 체계로 볼 수 있다. 사전처럼 생각하면, H04B 7/005 다음에 H04B 7/01이 오게 되며, H04B 7/02 다음에 H04B 7/12가 오며, H04B 7/185 다음에 H04B 7/19가 오게 된다. 이 경우 입수되는 검색식에 H04B 7/02가 있는 경우, 트리 구조를 포함하는 계층적 특허 분류 기호 데이터베이스에서 그 하위에 있는 H04B 7/04, H04B 7/06, H04B 7/08, H04B 7/10, H04B 7/12를 찾아 내게 된다. 찾아 내는 방법은 재귀적으로 next sibling직전까지는 찾는 방법이 사용될 수 있다. 이 방법의 일례를 좀 더 구체적으로 설명하면, 특정한 특허 분류 기호가 있을 때, 트리 구조에서 자신의 부모를 찾고, 부모에는 자식들이 있으며, 그 자식들 중 자기 바로 다음번 자식을 찾아 내면 된다. 좀더 구체적으로는 H04B 7/02의 next sibling은 H04B 7/15가 된다. 이때, H04B 7/02의 하위 특허 분류 기호를 찾으려면 먼저 next sibling이 되는 H04B 7/15를 찾고, 범위를 H04B 7/02보다 크고, H04B 7/15보다 작은 모든 특허 분류 기호를 찾으라고 하면 된다.
이때, next silbing이 자신의 직 상위 부모 노드/계층이 아닌 다른 노드/계층에 있는 경우(예를 들면, H04B 7/15(dot 2개)의 next sibling은 직상위 부모 계층/노느인 H04B 7/14의 직하위에 있는 것이 아니라 직직상위 부모의 하위인 H04B 7/22(dot 1개)가 된다.)는 next sibling이 null값이 되는데, 이 경우에는 재귀적으로 부모 노드/계층이 null이 아닐 때까지 부모 계층/노드의 next sibling을 찾으면 된다.
이어서, USPC에 대해서 더욱 상세하게 설명한다. USPTO의 특허 기술 분류 체계인 USPC는 도트 구조없이 서브 클래스의 번호만으로 각 서브 클래스의 상하 관계나 상관 관계를 파악하기가 어렵게 되어 있다. 즉, USPC는 IPC와는 달리 사전순과 는 무관하게 배열되어 있어, 좀더 체계적인 변형을 필요로 한다. 미국 www.uspto.gov가 2006년 6월 시점에 공개하는 USPC 또는 USPC 특허분류 체계(http://www.uspto.gov/web/patents/classification/... 또는 분류 Index to U.S. Patent Classification (a.k.a., Classification Index File) 파일)는 변형투입형으로 볼 수 있다. 이 경우에는 시각적으로 파악되는 USPC 코드가 IPC처럼 사전 순으로 되어 있지 않으므로, 변형이 필요하다.
변형하는 방법은 크게 다음 2가지를 그 예로 들 수 있다.
첫째, USPC 전체를 대상으로 하여 dot구조를 포함하는 타이틀 정보를 기준으로 하여 트리 구조를 만든다. 상기 트리 구조는 USPC간의 부모 자식 관계를 반영하여 USPC가 트리 구조의 노드를 형성하도록 배열해야 한다. 상기 USPC 트리 구조를 깊이 우선 탐색을 수행하면서 각 노드에 대하여 사전순 배열을 포함하는 변형 특허 분류 기호를 붙인다. 물론, 각 노드의 USPC와 이 USPC에 대응되는 변형 특허 분류 기호를 매칭하여 변형 특허 분류 데이터베이스에 저장하는 것은 당연할 것이다.
둘째, 미국 특허청이 제공하는 Index to U.S. Patent Classification 파일(이 파일에는 각 타이틀에 대한 USPC, 설명, dot 의 수에 관한 정보(루트를 기준으로 한 깊이(depth)정보) 및 자신의 부모(parent)에 관한 정보가 들어 있다.)을 기준으로하여 전체 USPC를 트리 구조를 만든 다음, 깊이 우선 탐색 기법 등의 탐색 기법을 이용하여 각 노드 마다 사전순으로 변형 특허 분류 기호를 붙이며, 각 타이틀에 대한 변형 특허 분류 기호와 해당 USPC를 매칭하여 저장해 놓는다.
상기 2가지 예는 실시예일뿐, 상기 USPC의 도트구조를 포함하는 타이틀 정보 를 활용하여 개별 USPC 각각에 변형 특허 분류 기호를 대응시키되, 상기 변형 특허 분류 기호의 체계가 사전순으로 배열되게 하는 다른 방법은 변형 알고리즘에 따라 다수 있을 수 있다. 이러한 한 예는 상기에서 타이틀 정보를 반영하여 IPC를 표로 만들고, 상기 표를 통해서 사전순으로 배열되는 변형 특허 분류 기호를 만드는데서 제시하였다. 그러므로, 상기와 같은 변형 방법을 모두 기술하는 것은 불가능할 뿐만 아니라, 이러한 변형은 전산 전문가 등의 당업자에게 자명할 것이다. 상기 자명한 알고리즘으로 변형된 변형 특허 분류 기호 체계가 본 발명 사상에 포함되는 것은 당연할 것이다.
이하, 다음 실례를 통해서 더욱 상세하게 설명한다.
하기는 US class 002 apparel의 서브 클래스 중 맨 앞쪽 일부에 대한 것이다. 상기는 http://www.uspto.gov/web/patents/classification/uspc002/sched002.htm에서 copy한 부분이다. 아래의 숫자들 앞에는 class 번호인 002가 생략되어 있지만, 모든 숫자 앞에는 002가 붙어 있는 것으로 생각해야 한다.
1 MISCELLANEOUS
455 GUARD OR PROTECTOR
456 .Body cover
457 ..Hazardous material body cover
458 ..Thermal body cover
2.11 .. Astronaut's body cover
2.12 ... Having relatively rotatable coaxial coupling component
2.13 ...Having convoluted component
2.14 ..Aviator's body cover
2.15 ..Underwater diver's body cover
2.16 ...Having an insulation layer
2.17 ...Having a garment closure
459 .Shoulder protector
상기 dot 구조로부터 456 body cover의 직하부에는 457, 458, 2.11, 2.14, 2.15가 있음을 알 수 있고, 2.11의 직하부에는 2.12 및 2.13이 있음을 알 수 있다. 상기를 dot 구조를 반영하여, 표로 만들 수 있음은 당연한 것이며, 상기 IPC의 설명에서 제공하였으므로, 본 USPC의 설명에서는 생략한다.
상기 dot 구조를 반영하여 상기 USPC를 트리 구조로 만든 것이 도 43에 나타나 있다. 도 44은 상기 도 43에 있는 USPC 트리의 각 노드에 변형 특허 분류 기호가 대응될 수 있음을 보여 준다. 도 45 는 상기 변형 특허 분류 기호로 상기 USPC 트리 구조와 구조적으로 동등한 트리 구조가 만들어 질 수 있음을 보여주고 있다. 상기와 같이하여 상기 USPC 각각이 변형 특허 분류 기호와 대응되어 저장될 수 있게 된다. 상기 저장의 일예는 다음 표와 같을 수 있다. 하기 표는 본 발명의 상기 변형 특허 분류 데이터베이스의 일 실시예일 수 있다.
변형전 subclass 도트수 변형
특허 분류 기호(class번호 포함)
title
1 002001000 MISCELLANEOUS
455 002002000 GUARD OR PROTECTOR
456 1 002002100 Body cover
457 2 002002110 Hazardous material body cover
458 2 002002120 Thermal body cover
2.11 2 002002130 Astronaut's body cover
2.12 3 002002131 Having relatively rotatable coaxial coupling component
2.13 3 002002132 Having convoluted component
2.14 2 002002140 Aviator's body cover
2.15 2 002002150 Underwater diver's body cover
2.16 3 002002151 Having an insulation layer
2.17 3 002002152 Having a garment closure
459 1 002002200 Shoulder protector
그리고, 미국 특허청이 제공하는 Index to U.S. Patent Classification 파일에는 다음과 같이 표현되어 있다.
002000000 0 1 APPAREL
002001000 1 2 000000 MISCELLANEOUS
002455000 1 3 000000 GUARD OR PROTECTOR
002456000 2 4 455000 Body cover
002457000 3 5 456000 Hazardous material body cover
002458000 3 6 456000 Thermal body cover
002002110 3 7 456000 Astronaut's body cover
002002120 4 8 002110 Having relatively rotatable coaxial coupling component
002002130 4 9 002110 Having convoluted component
002002140 3 10 456000 Aviator's body cover
002002150 3 11 456000 Underwater diver's body cover
002002160 4 12 002150 Having an insulation layer
002002170 4 13 002150 Having a garment closure
002459000 2 14 455000 Shoulder protector
상기 미국 특허청이 제공하는 Index to U.S. Patent Classification을 설명한다. 맨 앞열의 9자리 중 첫번째 3자리는 class number이며, 뒤 6자리는 subclass number를 나타낸다. 인터넷 상에서는 2.11과 같이 소수점 내지는 점이 있지만, 002110으로 표현되어 있음을 알 수 있다. 그 다음 자리는 루트로부터의 상대적인 깊이를 나타낸다. 클래스 002인 apparel은 0 depth이며, 도트가 없는 MISCELLANEOUS는 1depth로 apparel의 직하부를 나타내며, 도트가 2개 있는 Thermal body cover는 3 depth를 나타낸다. depth 다음의 칼럼은 일련번호이며, 그 다음 칼럼은 자신의 parent를 나타내는 숫자이다. 즉, ^455000 body cover^와 같이 body cover 바로 앞에 붙은 455000은 자신의 parent가 455000을 가지는 것으로 GUARD OR PROTECTOR가 자신의 parent임을 나타내고 있다. 이는 dot 구조에 대응되는 표현으로 볼 수 있다. 예를 들어 더 설명하면, ^456000 Aviator's body cover^에서는 Aviator's body cover의 부모는 456000을 사용하는 body cover임을 알 수 있다.
상기와 같은 USPC 분류 기호는 사전순으로 배열되어 있지 않아 재처리하지 않을 경우, 범위 검색이 불가능하다.
상기 Index to U.S. Patent Classification 파일에 나와 있는 각 USPC에 있는 부모에 관한 정보와 상대적인 깊이 정보를 활용하여 도 46과 같은 트리 구조를 만드는 것은 쉬운 일일 것이다. 상기 도8과 같은 트리 구조에 대하여 도 44와 같이 변형 특허 분류 기호를 할당하는 것은 용이한 것이며, 상기 변형 특허 분류 기호를 이용하여 도45와 같은 형태의 변형 특허 분류 기호로 된 트리 구조를 만들 수 있음은 물론이다 하겠다. 상기와 같이하여 상기 USPC 각각이 변형 특허 분류 기호와 대응되어 저장될 수 있게 된다. 상기 저장의 일예는 다음 표와 같을 수 있다. 하기 표는 본 발명의 상기 변형 특허 분류 데이터베이스의 일 실시예일 수 있다.
변형전 Class+subclass depth 변형전기준 parent의 서브클래스 변형
특허 분류 기호
변형 특허 분류 기호 기준 parent의 서브클래스 Title
002000000 0 002000000 APPAREL
002001000 1 000000 002001000 000000 MISCELLANEOUS
002455000 1 000000 002002000 000000 GUARD OR PROTECTOR
002456000 2 455000 002002100 002002000 Body cover
002457000 3 456000 002002110 002002100 Hazardous material body cover
002458000 3 456000 002002120 002002100 Thermal body cover
002002110 3 456000 002002130 002002100 Astronaut's body cover
002002120 4 002110 002002131 002002130 Having relatively rotatable coaxial coupling component
002002130 4 002110 002002132 002002130 Having convoluted component
002002140 3 456000 002002140 002002100 Aviator's body cover
002002150 3 456000 002002150 002002100 Underwater diver's body cover
002002160 4 002150 002002151 002002150 Having an insulation layer
002002170 4 002150 002002152 002002150 Having a garment closure
002004590 2 455000 002002200 002002000 Shoulder protector
물론, 상기와는 다른 알고리즘을 통하여 주어진 타이틀 정보를 포함하는 USPC 체계에 사전순 배열을 가지는 변형 특허 분류 기호를 대응할 수 있을 것이며, 이는 상기와 같이 USPC와 대응되는 변형 특허 분류 기호의 매칭 테이블로 저장될 수 있음을 물론이다.
도 42는 상기 계층적 변형 특허 분류 기호 데이터베이스 생성 모듈이 상기 변형 특허 분류 기호 데이터베이스를 생성하는 일 실시예에 대한 흐름을 보여 주고 있다.
변형 특허 분류 기호 데이터베이스 생성 모듈은 특허 분류 기호 체계 상의 모든 특허 분류 기호를 입수하고(S4220), 상기 입수한 모든 특허 분류 기호를 타이틀의 도트 정보를 참조하여 트리 구조로 배열하고(S4230), 상기 트리 구조로 배열된 특허 분류 기호 체계에 깊이 우선 탐색 기법을 이용하여 탐색하면서 각 특허 분류 기호 노드 별로 변형 특허 분류 기호를 대응시키고(S4240), 상기 각 특허 분류 기호와 대응 변형 특허 분류 기호의 관계를 상기 변형 특허 분류 기호 데이터베이스에 저장한다(S4250).
이어서 범위 검색을 중심으로 하여 수정 검색식을 생성하기 위하여, 본 발명의 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 입수되는 특허 분류 기호를 어떻게 처리하여 수정 검색식을 생성하기 위한 정보를 입수하는 지를 설명한다.
상기와 같은 경우, 만약 입력 검색식에 USPC로 ^002/456^이 입수될 때, 하위 분류 포함 검색이 될려면, 002/456, 002/457, 002/458, 002/2.11, 002/2.12, 002/2.13, 002/2.14, 002/2.15, 002/2.16, 002/2.17이 검색되어야 한다. 이때, 도 43의 트리 구조에서 알 수 있듯이 002/456의 넥스트 시블링은 002/459이다. 그러므로, 상기 표에서 대응 변형 특허 분류 기호로 대응시키면, 002/456에 대응되는 002002100보다는 크거나 같고, 넥스트 시블링인 002/459에 대응되는 002002200보다 작은 모든 변형 특허 분류 기호에 대해서 검색하라고 지시하면 하위 분류를 포함하는 검색이 되게 된다.
좀 더 상세하게 설명하면 다음과 같은 2가지 방법이 있다. 첫번째 방법은 ^002/456^이 입수될 때, 이에 대응되는 변형 특허 분류 기호로 002002100를 찾은 다음, 002/456의 넥스트 시블링인 002/459을 찾고, 002/459에 대응되는 변형 특허 분류 기호인 002002200를 찾아서, 이 002002100과 002002200을 범위로 묶는 방법이 그것이다. 범위는 002002100보다는 크거나 같고 002002200보다는 작은 것이 될 수 있다. 본 방법의 특징은 변형되기 전의 트리 구조에서 입수되는 특허 분류 기호의 넥스트 시블링을 먼저 찾고, 상기 입수되는 특허 분류 기호 및 상기 넥스트 시블링 각각에 대응되는 변형 특허 분류 기호를 찾는 방법이다. 본 방법은 변형 특허 분류 기호 체계와 이에 대응되는 특허 분류 기호 체계가 구조상으로도 1:1로 대응되기 때문에, 사용자가 검색식에서 입력하는 특허 분류 기호의 next silbing을 먼저 찾고, 상기 특허 분류 기호 및 상기 특허 분류 기호의 next sibling에 대응되는 각각의 변형 특허 분류 기호를 찾아내는 방법이다.
상기 특허 검색 엔진(7000)은 특허 분류 기호가 포함된 검색식을 입수 받는 다. 이어, 상기 입수된 특허 분류 기호가 그 타이틀 정보에 도트를 포함하고 있을 경우에는 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈(또는 상기 하위 계층 특허 분류 기호 처리 모듈)이 계층적 특허 분류 기호 체계를 반영한 트리 구조에서 상기 입수된 특허 분류 기호의 넥스트 시블링 특허 분류 기호를 찾는다. 이어, 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 상기 변형 특허 분류 기호 데이터베이스 상에서 상기 입수된 특허 분류 기호 및 상기 넥스트 시블링 특허 분류 기호에 대응되는 변형 특허 분류 기호 및 넥스트 시블링 변형 특허 분류 기호를 입수한다. 이어, 상기 변형 특허 분류 기호 활용 수정 검색식 생성 모듈이 상기 변형 특허 분류 기호 및 상기 변형 특허 분류 기호의 넥스트 시블링 변형 특허 분류 기호로 범위를 포함한 수정 검색식을 생성하고, 상기 검색 엔진(7000)을 통하여 상기 수정 검색식으로 검색을 수행하는 단계
두번째 방법은 방법은 ^002/456^이 입수될 때, 이에 대응되는 변형 특허 분류 기호로 002002100를 찾은 다음, 변형 특허 분류 기호 체계에서 002002100에 대응되는 넥스트 시블링인 002002200을 찾아서 이 002002100과 002002200을 범위로 묶는 방법이 그것이다. 범위는 002002100보다는 크거나 같고 002002200보다는 작은 것이 될 수 있다. 본 방법의 특징은 입수되는 특허 분류 기호에 대응되는 변형 특허 분류 기호를 찾아내고, 상기 변형 특허 분류 기호에 대응되는 넥스트 시블링을 찾는 방법이다. 즉, 본 방법은 입력하는 특허 분류 기호에 대한 변형 특허 분류 기호를 먼저 찾고, 상기 변형 특허 분류 기호 체계 내에서 상기 찾아낸 변형 특허 분류 기호의 next sibling을 찾아내는 방법이다. 본 두번째 방법은 상기 첫번째 방법 보다 찾는 행위가 1개 줄어드는 장점이 있다.
이어 상기 두번째 방법을 채용하여 수정 검색식으로 검색을 수행하는 방법에 대한 일 실시예에 대한 흐름을 설명한다.
상기 검색 엔진(7000)은 특허 분류 기호가 포함된 검색식을 입수 받는다. 상기 입수된 특허 분류 기호가 그 타이틀 정보에 도트를 포함하고 있을 경우에는 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 상기 변형 특허 분류 기호 데이터베이스 상에서 상기 입수된 특허 분류 기호에 대응되는 변형 특허 분류 기호를 입수하고, 상기 변형 특허 분류 기호 체계를 반영한 트리 구조에서 상기 변형 특허 분류 기호의 넥스트 시블링 변형 특허 분류 기호를 찾은 다음, 상기 변형 특허 분류 기호 활용 수정 검색식 생성 모듈이 상기 변형 특허 분류 기호 및 상기 변형 특허 분류 기호의 넥스트 시블링 변형 특허 분류 기호로 범위를 포함하는 수정 검색식을 생성하고, 상기 검색 엔진(7000)을 통하여 상기
수정 검색식으로 검색을 수행하는 단계를 거친다.
상기 첫번째 또는 두번째 방법을 통하여 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈은 입수되는 특허 분류 기호에 대하여, 범위 검색을 수행하기 위한 범위의 양 끝에 해당하는 2개의 변형 특허 분류 기호를 알 수 있게 된다.
상기 검색 인덱스에는 상기 변형 특허 분류 기호에 대한 정보가 각 USPC에 대응되어 포함되어 있어야 함은 물론이다. 상기 변형 특허 분류 기호는 임의의 자리수로 된 숫자만으로 형성할 수도 있지만, 숫자와 문자를 포함하여 형성할 수도 있다. 이때, USPC에서 추가되는 것이 있을 때에는 dot 구조를 반영하여 중복이 발생하지 않으면서도 사전순으로 배열할 때 정당한 배열 위치를 갖도록 변형 특허 분류 기호를 생성할 수 있게 된다. 이러한 사전순 배열 위치를 생성하는 방법은 새로운 단어가 사전에 추가될 때, 알파벳 순으로 정당한 배열 위치를 갖도록 하는 것과 동일한 공지의 기술이며, 당업자라면 용이하게 실시할 수 있을 것이다. 또한, 사전순으로 배치할 때 더 많은 하위 분류가 새로 생성되는 경우, 뒷자리 수를 계속해서 확장해 갈 수 있다. 예를 들면 002/2.12에 하부에 여러 개의 특허 분류 기호가 다단계로 생길 때, 상기 002/2.12에 대응되는 변형 특허 분류 기호002002131보다 사전순으로 아래이며, 002002132보다 위인 0020021310a, 0020021310b 등과 같이 추가적으로 뒷자리를 확장해 가면서 계속해서 변형 특허 분류 기호를 생성할 수 있을 것이다.
이상과 같이 USPC처럼 자체적으로 사전순 배열 구조를 가지지 않는 특허 분류 기호 체계를 가지는 경우에도 변형 특허 분류 기호를 도입함으로써, 범위 검색이 가능할 수 있음을 설명하였다. 물론, IPC처럼 이미 사전순 배열 구조를 가지는 경우에도 새로운 변형 특허 분류 기호를 대응시킬 수 있음은 물론일 것이다. 따라서, IPC의 확장의 성격을 가지는 FI나 ECLA, 및 FT 특허 분류 기호에 대해서도 본 발명 사상을 적용할 수 있을 것이다. 즉, IPC, FI, FT, ECLA, USPC 등에서 범위 검색을 위해 각 분류 기호의 dot 구조를 반영하는 변형 특허 분류 기호를 생성할 수 있을 것이며, 상기 변형 특허 분류 기호는 사전순 배열이 되게 되어 있어, 범위 검색을 지원할 수 있게 된다.
상기 검색 엔진(7000)을 위한 검색 인덱스에는 원래의 특허 분류 기호가 가공된 정보와 상기 변형 특허 분류 기호가 가공된 정보가 함께 있는 것이 바람직하다. 만약 사용자가 하위 계층 특허 분류 기호에 대한 검색 결과를 원하지 않을 경우, 변형 특허 분류 기호가 가공된 인덱스를 사용할 필요가 없기 때문이다.
이어서, 본 발명의 수정 검색식 생성 모듈 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈에 대해 설명한다. 수정 검색식 생성 모듈 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈은 상기 입수되는 변형 특허 분류 기호들로 원래의 기존 검색식과 통합하여 수정 검색식을 생성한다.
범위 검색을 위해서는 검색 엔진(7000)이 범위에 대한 이형 범위 기호 처리를 지원하는가에 따라 생성되는 수정 검색식 구성 요소가 약간 상이하게 된다. 이형 범위 기호 처리란 ^A보다 크거나 같고, B 보다 작은 것^과 같이 범위의 양쪽에 쓰이는 기호가 다른 경우를 처리하는 것을 말한다. 이형 범위 기호 처리를 지원하는 경우에는, 입수된 특허 분류 기호에 대하여, ^(상기 입수된 특허 분류 기호보다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)^라는 수정된 검색식 구성 요소를 생성한다. 이형 범위 기호 처리를 지원하지 않는 경우에는 ^{(상기 입수된 분류 기호) or (상기 입수된 특허 분류 기호보다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)}을 생성하게 된다. 물론, 사전식으로 배열되는 변형 특허 분류 기호를 사용하는 경우에는 그 변형 특허 분류 기호에 대해서 위와 같이 처리함은 물론이라 하겠다.
상기 입수되는 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15}라면, 이형 범위 기호 처리가 되는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC >= H04B 7/15 and IPC <H04B 7/22}^이 된다. 반면, 이형 범위 기호 처리가 되지 않는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 or (IPC > H04B 7/15 and IPC <H04B 7/22)}가 되게 된다.
이상과 같은 본 발명의 특허 분류 기호 전처리 엔진(3510)의 핵심은 주어진 특허 분류 기호가 있을 때, 그 특허 분류 기호의 모든 하위 계층(child) 또는 직하위 계층에 있는 하위 특허 분류도 자동으로 처리하여 검색 결과에 반영될 수 있게 하는 기능에 있다.
이하, 상기와 같은 특허 분류 기호 전처리 엔진(3510)을 이용하는 본 발명의 특허 엔진 및 상기 검색 엔진(7000)을 활용하여 특허 정보를 검색하고, 검색된 특허 정보를 기반으로 하는 특허 정보 처리 방법을 제시한다.
먼저 본 발명의 검색 엔진(7000)을 통한 특허 정보 검색 방법을 제시한다. 본 발명의 특허 정보 검색 방법의 핵심은 특허 정보의 검색식에 특허 분류 기호가 있을 경우, 그 특허 분류 기호의 하부에 있는 특허 분류 기호를 포함하는 특허 정보까지도 함께 제공해 주는 것이다.
특허 정보 검색에 관한 제1 실시예로 검색식에 메인그룹 미만의 특허 분류 기호가 포함되어 있을 때의 정보 처리 방법을 제시한다.
메인 그룹 미만의 특허 분류 기호가 있는 경우(메인 그룹 미만의 특허 분류 기호에 대해서는 그 타이틀 정보에 적어도 하나 이상의 도트가 포함되어 있는 것이 통상이다. 그러므로, 본 실시예의 발명 사상은 마찬가지로 dot 구조를 포함하고 있는 USPC, FI, FT, ECLA 등에서도 적용 가능함은 물론이다 하겠다.) 상기 특허 분류 기호를 상기 특허 분류 기호 전처리 엔진(3510)이 입수하여, 상기 계층적 특허 분류 기호 데이터베이스를 조회하여, 상기 검색식에 주어진 특허 분류 기호의 하부에 있는 모든 특허 분류 기호에 대한 정보를 알아 내고, 이를 기반으로 하여 상기 입수된 특허 분류 기호와 통합하여 수정된 검색식을 형성하고, 상기 수정된 검색식으로 특허 검색을 수행한다. 이상과 같이 수정된 특허 분류 기호를 포함한 검색식으로 특허 검색을 수행하는 것을 본 명세서에서는 ^수정 특허 분류 기호 포함 검색^이라 칭한다.
물론, 검색식에 포함된 특허 분류 기호가 메인 그룹이면, 그 메인 그룹의 /00에서 /00을 절단하고 절단자를 사용하여 그 메인그룹 이하에 있는 모든 특허 분류에 대해서 검색을 수행한다.(예를 들면, IPC = H04B 7/00이 주어지면, => IPC = H04B 7/?로 변환하여 H04B 7로 시작하는 모든 특허 분류 기호에 대해서 검색을 수행함은 당연히 본 발명의 검색식 수정 형성 방법의 특징은 아니며, 중요한 요소로서 취급되지는 않는다. 본 발명 사상은 특허 분류 기호 자체에서 상위와 하위, 동등 레벨을 알 수 없는 특허 분류 기호 레벨(통상적으로 dot구조를 가지는 특허 분류 기호 레벨)에서 중요하게 활용된다.
수정된 검색식으로 검색 결과가 나오는 경우, 검색 결과의 디스플레이는 검색자의 선택에 따라 클러스터링(clustering)하여 제공될 수도 있다. 클러스터링이 란, 검색 결과를 묶어서 그룹단위로 표현하는 방식으로, 본 발명에 적용하는 경우 다음과 같다. 클러스트링 되는 구조를 표현하는 클러스터링 창이 있거나, 클러스터링 레벨을 선택할 수 있을 때, 검색 결과를 기설정되거나 기선택된 클러스터링 레벨에 상응하는 도트 서브 그룹 및 그 이하의 서브 그룹의 검색 결과만 표현하며, 검색자로부터 하위 또는 상위 클러스터링 레벨이 선택되는 경우(상기 클러스터링 레벨에는 도트 레벨이 대응되어 있다) 상기 선택된 클러스터링 레벨에 상응하는 검색 결과를 표현한다.
상기의 H04B 7/00이 관련된 검색 결과를 통해 예를 들면, 1-도트 서브 그룹 레벨의 클러스터링이 선택된 경우에는 상기 클러스터링 창에는 1-도트 서브 그룹에 해당하는 7/005, H04B 7/01, H04B 7/015, H04B 7/02, H04B 7/14, H04B 7/22, H04B 7/24이 H04B 7/00의 하위 디렉토리 폴더 형태로 나타나고, 검색 결과는 H04B 7/00에 해당하는 모든 결과가 나온다. 이때, 검색자가 H04B 7/14를 선택했을 때는 그 직하위인 H04B 7/145, H04B 7/15가 하위 디렉토리 폴더 형태로 나타나고, 이 경우 검색 결과는 H04B 7/14 및 그 하부 특허 분류 기호에 해당하는 검색 결과만 표시된다. 다시 검색자가 H04B 7/15를 선택했을 경우에는 그 하위인 H04B 7/155, H04B 7/185, H04B 7/204가 표시되며, 검색 결과는 H04B 7/15 및 그 하우 특허 분류 기호에 해당하는 검색 결과만이 표시된다.
이때, 검색자의 편의를 위해서 클러스터링 창의 각 클러서트링 항목(디렉토리의 폴더명) 옆에 자신의 직하부에 몇 개의 특허 분류 기호가 있는지와, 모든 하부 특허 분류 기호의 개수가 몇 개 있는지를 함께 또는 어느 하나만을 표시해 줄 수 있다. 그 특허 분류 기호 및 그 특허 분류 기호의 모든 하위 특허 분류 기호에 해당하는 특허 문헌의 개수를 표시해 줄 수도 있다. 이때, 출원 문헌수와 등록 문헌 수 2개 모두를 표시해 줄 수도 있으며, 출원 문헌수나 등록 문헌 수 1개만 표시해 줄 수도 있다. 예를 들면, 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이므로 ^3^을 표시해 주거나, 모든 하위의 특허 분류 기호가 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216이므로, ^10^을 표시해 줄 수 있다. 양자를 모두 표시하는 주는 것이 바람직한데, 그 이유는 직하위에는 분류가 적지만, 그 직하위의 하부에 엄청난 크기의 분류가 있을 수 있기 때문이다. 이는 특히 새롭게 떠오르는 신기술 분야 또는 기술 분화 속도 또는 세부 분류 증가 속도가 큰 첨단 기술 분야에서 더욱 그러할 것이다. 만약 직하위 분류의 개수만 표시해 주는 경우, 그 수치값이 적을 때 그 기술 분야의 중요성이 실제함에도 불구하고, 이를 파악할 수 없어 그 분류를 무시하고 넘어가는 사용자가 있을 수 있기 때문이다.
특허 분류 기호 정보를 디렉토리 방식으로 배치하고, 사용자의 브라우징을 통해서 특정 특허 분류 기호의 하위 특허 분류 기호로 계통적으로 접근할 수 있다. 현재, www.delphion.com에서는 이러한 서비스를 제공해 주고 있다. 다만, 상기 사이트는 자신의 직하위 특허 분류 기호의 개수에 대한 정보를 제공해 주고 있으나, 1) 자신의 하위 특허 분류 기호의 모든 개수를 제공해 주지 않으며, 2) 모든 특허 분류 기호에 대한 특허 문건의 개수도 제공해 주지 않고, 3) 그 제공되는 수치를 클릭했을 때 그 수치에 해당되는 모든 직하위 특허 분류 기호를 포함하고 있는 특허 문건도 제공해 주지 않는다. 본 발명은 계층적 특허 분류 기호 데이터베이스와 수정 특허 분류 기호 검색 방법을 통하여 이러한 문제를 해결해 줄 수 있다.
상기 특허 분류 기호 정보를 디렉토리 방식으로 배치할 때, 각 디렉토리에 색깔이나 아이콘 등의 기호 표시를 하여, 사용자의 접근성을 향상시킬 수 있다. 즉, 직하위 분류가 많은 경우, 모든 하위 분류가 많은 경우, 깊이가 깊은 경우, 해당 특허 문건이 많은 경우 등에 따라 다른 색깔을 부여하거나 기설정된 아이콘 등을 부여함으로써, 사용자가 그 디렉토리의 내부 속성(모든 하위 분류의 개수, 분류의 깊이, 특허 문건의 수 등)을 더 잘 알 수 있게 도울 수 있다. 특히, 특정 특허 분류 기호 디렉토리의 모든 하위 분류의 개수가 많거나 분류의 깊이가 많은 경우는 그 영역으로의 특허 출원이 많고, 기술이 다양하게 출원되고 있음을 방증하기 때문에, 그렇지 못한 디렉토리보다 중요성이 더 클 경우가 많기 때문이다.
다음으로, 본 발명의 수정 특허 분류 포함 검색 기법을 이용한 특허 분류 기호에 기반한 특허 분석 방법에 대해 기술하며, 상기 특허 분석 방법은 본 발명의 특허 정보 분석 엔진, 즉 분석 엔진이 수행한다.
먼저 속도 분석 방법에 대해 기술하며, 속도 분석을 수행하는 엔진을 "속도 분석 엔진"이라 한다.
특허 분류 기호에 기반한 속도 분석이란 특정한 1개국가 또는 수개 국가를 대상으로 하여, 각 국가별 특허 정보가 지원하는 특허 분류 기호 체계 상에서 특허 분류 기호에 기반한 1)수치 정보 및 2)주체 정보를 획득해 내는 것을 말한다.
상기 수치 정보에는 기설정된 기간 단위의 1)수량, 2)수량의 증가율, 3) 증가 속도, 4) 증가 가속도 등이 있을 수 있다. 기설정된 기간 단위의 수량 정보만 알면, 수량의 증가율은 {당기간의 수량 - 직전 기간의 수량}/{직전 기간의 수량}*100으로 계산되며, 속도는 {당기간의 수량 - 직전 기간의 수량}/{기간의 환산 길이}로 계산되며, 가속도는 상기 속도의 변화율로 계산될 수 있다. 그러므로, 설명의 편의상 본 명세서에서는 수량을 중심으로 속도 분석을 설명하나, 이 설명에는 위의 2), 3), 4)가 당연히 포함됨은 전제한다. 상기 수량에는 특허 정보로부터 유도할 수 있는 임의의 수량이 될 수 있으며, 간단한 예로, 1) 출원량, 등록량 등의 단순 카운팅 개수와 관련된 양, 2) 등록율, 점유율, 집중율 등의 비율량, 3) 특허활동지수 등과 같은 지수량, 4) 출원인 수, 발명자 수, 대리인 수 등과 같은 주체의 수에 관한 양, 5) 특정 특허 문건과 관련된 국가의 수나 한 국가에서의 특정 특허 문건과 관련되어 입수 가능한 기관(특허청, 특허 심판원 등의 1차 판단 기관, 특허 법원 등의 2차 상위 판단 기관, 대법원 등)의 수 등과 같은 행정 기관의 개수량, 6) 청구항의 수, 명세서의 페이지 수, 도면의 수, 인용(citation) 문건의 수, 피인용 문건의 수, 심사 인용 문건의 수 등과 같은 명세서 내부에 포함되어 있는 각종 수량, 7) 특정 행정 처리 이벤트 발생 수 등과 같은 특허 출원의 라이프 사이클 동안에 발생한 이벤트의 수 및 이들 각각의 조합 또는 이들 각각을 입력 변수로 한 중요도 평가 함수 등과 같은 함수값의 결과치에 관한 양 등이 그 예가 될 수 있다.
주체 정보란 상기 분석의 대상이 되는 1)수량, 2)수량의 증가율, 3) 증가 속 도, 4) 증가 가속도의 계산에 근거가 되는 특허 문건에 대한 1) 출원인 또는 권리자, 2) 발명자, 3) 대리인 등의 주체에 대한 정보를 말한다.
간단한 속도 분석의 예로 들면, 전체 특허 분류 또는 특정한 계층의 특허 분류(예를 들면 H04B 7/00 그룹)에 대해서 연도별로 해당 특허 분류에 대해서 출원수나 등록수 등을 계산할 수 있다. 여기서는 IPC를 예로 들어 설명하지만, dot 구조를 가지는 다른 특허 분류 체계에서도 대동소이한 방법으로 목적하는 바를 달성할 수 있다. 또한, 설명의 편이상 목적하는 분석 대상을 출원수를 예로 들어 설명하나 다른 목적하는 분석 대상에 대해서도 대동소이한 방법으로 목적하는 바를 달성할 수 있다.
먼저 특정한 계층의 특허 분류에 대해 설명한다. 전체 특허 분류는 특정한 계층의 특허 분류의 최상위 집합으로서 전체 기술 영역에 대응될 것이다.
먼저, 상기 특정한 계층에 대한 지정 정보를 입수 받은 다음 dot구조는 서브그룹에서부터 있으므로, 상기 입수된 특허 분류가 서브클래스 이상일 경우에는 그 서브 클래스 이상인 특허 분류를 메인 그룹 단위까지 분해한다. 분해된 메인 그룹 하나하나에 대해서 그 서브 그룹에 있는 1 도트 서브 그룹을 찾아 내고(메인 그룹 기준 직하위 계층 특허 분류 기호들임), 상기 1 도트 서브 그룹에서부터는 본 발명의 수정 특허 분류 기호 포함 검색이 수행되어야 한다.(물론, 메인 그룹 이상부터도 범위 검색이 가능하므로, 본 발명의 수정 특허 분류 기호 포함 검색 방법이 당연히 적용되나, 이러한 영역에서는 절단자 검색을 통해서도 가능하나, 1도트 서브 그룹 이하에서는 본 발명의 방법으로만 가능하다.)
예를 들어 상기 입수된 특허 분류가 서브클래스 수준인 H04B라면, 상기 H04B에 해당하는 하위 분류인 메인 그룹 H04B 1/00, H04B 3/00, H04B 5/00, H04B 7/00, H04B 10/00, H04B 11/00, H04B 13/00, H04B 14/00, H04B 15/00, H04B 17/00으로 1차적으로 나눈다. 그리고, 각 메인 그룹별로, 다시 그 메인 그룹에 속하는 1도트 서브 그룹을 찾는다. 그 1도트 서브 그룹에서부터는 본 발명 특유의 수정 특허 분류 기호 포함 검색 방법이 적용되어야만 상기 1도트 서브 그룹의 하위 계층 특허 분류 기호를 포함하는 검색을 수행할 수 있다.
메인 클래스가 H04B 7/00일 경우에는 그 메인 클래스에 속하는 25개의 전체 하위 계층 특허 분류 기호 들 중 상기 메인 클래스의 직하위 계층인 7개의 1도트 서브 그룹 각각에 대해서, 그 하위 계층에 속하는 모든 2도트 서브 그룹, 3도트 서브 그룹 및/또는 4도트 서브 그룹에 대해서 본 발명의 수정 특허 분류 기호 포함 검색을 수행한다.
상기와 같이 분석의 대상이 되는 특허 분류 기호 집단은 여러 개 일 수 있으며, 그 집단은 레벨(예를 들면 모든 서브 클래스 단위)일 수도 있으며, 2 이상의 다른 레벨(몇 개는 서브클래스, 다른 몇 개는 메인 그룹, 다른 몇 개는 클래스 단위)이 섞여 있을 수 있다.
상기와 같은 특허 분류 기호 집단을 확장하면 전체 특허 분류 기호 체계에 대해서도 분석 엔진이 처리할 수 있다. 즉, 서브그룹 이하의 모든 특허 분류 기호 하나하나에 대해서 본 발명의 수정 특허 분류 기호 포함 검색이 수행될 수 있다.
검색 결과 예를 표로 제시함(1도트는 1~4도트의 총합의 개념으로 표시됨)
H04B 7/00을 대상으로 하여 모든 서브그룹 단위의 IPC 하나하나를 입수하여, 그 하나하나에 대해서 연도별 출원수를 계산하는 것을 하나의 예시로 든다.
이때, 입수되는 검색식이 특허 분류 기호만을 포함하고 있는 것이 아니라, 키워드나 출원인 정보 등을 더 포함하고 있을 수 있다. 그러므로, 검색식은 상기 키워드나 출원인 정보와 상기 특허 분류 기호의 ^AND^연산을 통해서 그 검색 결과를 도출해 낼 수 있게 된다. 검색 엔진(7000)에는 상기 검색 엔진(7000)이 인덱스에 걸어 놓은 모든 필드를 대상으로 하여 조합된 검색식을 쿼리로 전송할 수 있고, 그 조합된 검색식에 특허 분류 기호가 있는 경우, 그 특허 분류 기호를 수정 특허 분류 기호 포함 검색의 방법을 적용하여 수정된 검색식을 쿼리로 전송하게 된다. 상기 검색 엔진(7000)은 상기 수정된 검색식을 기준으로 하여 검색 결과를 도출해 낸다. 통상적으로 검색 엔진(7000)은 검색식에 대응되는 검색 결과의 개수는 신속하게 출력해 주므로(이에 비해 그 검색 결과 리스트를 제공해 주는 것은 서버 또는 네트워크(300)에 상대적으로 큰 부하를 유발한다.), 통계나 분석을 위하여 개수를 파악할 때는 많은 시간의 소모 없이 목적하는 바를 달성할 수 있다.
출원인으로 삼성 전자가 입력되는 경우, 상기 H04B 7/00을 대상으로 하여 모든 서브그룹 단위의 IPC 하나하나를 입수하여, 그 하나하나에 대해서 연도별 출원수를 계산하는 것을 하나의 예시로 든다.
본 발명의 분석 엔진으로 연도별 출원수만을 계산할 수 있는 것이 아님은 자명하다 할 것이다. 분석 엔진이 1차적으로 수치 정보를 용이하게 찾아 낼 수 있다. 그러한 수치 정보에는 연도별 또는 기설정되는 기간별 출원수, 등록수, 등록율와 같은 기본적인 수치 정보 외에, 그 국가의 특허 문헌에서 직접 또는 간접적으로 계산하여 찾아 낼 수 있는 여러 수치 정보를 포함한다. 상기 여러 수치 정보는 1) 검색식의 조합에 의해서 검색 엔진(7000)이 특별한 사전 정보 처리 없이 직접 또는 간단한 처리를 통하여 응답해 줄 수 있는 것과, 2) 특별한 사전 정보 처리를 해 놓거나, 3) 다른 분석 엔진을 경유하여 응답해 줄 수 있는 것들이 있을 수 있다.
상기 1)의 예로는 대부분의 서지사항에 나와 있는 정보가 해당되며, 국가별 출원수나 등록수 등이 대표적이며, 출원수 대비 등록수를 계산하면 등록율도 계산해 줄 수 있다. 다만, 등록율의 계산을 연도별 등록수/출원수가 아닌, 개별 출원된 특허가 등록되었는지의 여부를 판단하는 경우에는 3)의 유형이 된다.
상기 3)의 대표적인 예로는 특정한 검색 조건에 걸리는 출원인별 랭킹 정보가 있을 수 있다. 출원인별 랭킹 정보를 출력해 주기 위해서는 검색 결과 리스트를 확보한 다음, 그 결과 리스트에 포함되는 출원인 리스트를 파악하고, 특정 출원인이 나오는 빈도를 계산하고, 빈도가 높을수록 랭킹을 높게 부여하는 방법으로 알 수 있다. 이 경우 랭킹을 계산하는 것은 랭킹 계산 엔진이 처리한다.
상기 2)의 대표적인 예로 중요 특허 수 등이 있을 수 있다. 중요 특허란 여러 기준이 있을 수 있겠지만, 한 예시적인 방법으로 (1) 해외 출원이 많이 된 특허, (2) 청구항이 많은 특허, (3) 명세서의 페이지 수가 많은 특허, (4) 많이 인용이 된 특허 등일수록 중요도가 높다고 가정하면, 이들 각각에 대해서 가중치를 주고, 특허 특허 문헌이 위 항목에 해당되는 지의 여부 및 부여된 가중치의 합산값을 계산하는 방식으로 중요도를 평가할 수 있을 것이다. 각 특허 문헌별로 사전에 각 기준별로, 이러한 점수들이 계산되어 있을 때, 전체 검색 결과 중 그 기준별에 해당하는 특허 문건의 개수도 파악될 수 있을 것이다.
상기와 같은 방식으로 검색 엔진(7000)은 전송받은 검색식에 대해서 검색을 수행하고 검색 결과의 수를 포함한 검색 결과를 리턴(return)한다.
이하, 속도 분석이라는 방법을 통하여 검색 결과의 수를 중심으로 특허 정보에서 유의미한 정보를 찾아 내는 방법을 개시한다. 속도 분석이란, 특허 분류 기호를 기준으로 포함하는 한 집단에서 그 집단을 구성하는 각 하나하나의 특허 분류 기호별로 검색 목적이 기설정된 시간 단위로 변하는 추이를 분석하는 것을 말한다. 검색 목적이 출원수, 등록수 등과 같은 검색의 목적이 되는 지표를 말하며, 변하는 추이는 개수, 개수의 변화(속도), 개수 변화의 속도(가속도) 등이 예가 될 수 있을 것이다.
검색의 목적이 기술 분야별(특허 분류 기호) 출원 추이일 경우, 다음과 같은 예시에 따라 그 추이에 대한 해석이 달라 질 수 있다.
1) 특정 기술 분야가 출원량이 적으나, 출원 증가 속도가 크고, 출원 증가 가속도가 양(+)인 영역에서는 개척되고 있는 신기술 영역일 가능성이 높으며, 그 영역에 출원하고 있는 출원인들 및 기술들은 모니터링 될 필요가 크다고 볼 수 있다. 특히, 해외에서도 동일한 패턴이 있는 경우나, 특정한 몇몇 국가에서 동일한 패턴이 있는 경우라면 전세계적으로 개척 경쟁이 불붙은 영역일 가능성이 높다.
2) 특정 기술 분야가 출원량이 적고, 출원 증가 속도는 비교적 큰 양인데, 가속도가 음(-)인 경우에는 소수의 선점자에 의한 선점 내지는 과점이 끝난 니치 영역일 가능성이 높다.
3) 특정 기술 분야가 출원량이 적고, 출원 증가 속도가 음인 경우에는 시장의 관심에서 멀어지고 있거나, 작은 시장이며, 이미 중요한 기술 개발이 끝나고 그 기술 영역을 수비하기 위한 방어적인 출원을 하고 있는 곳일 가능성이 높다.
4) 특정 기술 분야가 출원량이 크고, 출원 증가 속도가 크고, 출원 증가 가속도가 양인 경우에는 시장 규모가 크고, 미래의 수익성이 높아 대형 기업들이 앞다투어 진출하고 있는 영역일 가능성이 높다고 볼 수 있다.
5) 특정 기술 분야가 출원량이 크고, 출원 속도는 비교적 큰 양인데, 가속도가 음(-)인 경우에는 그 시장 종사자들이 핵심 기술의 권리화보다는 응용 기술 쪽으로 출원을 집중할 때의 패턴일 수 있다.
6) 특정 기술 분야가 출원량이 크나, 출원 증가 속도가 낮거나 음(-)이며, 출원 증가 가속도가 음(-)인 경우에는 공정 기술의 권리화 내지는 개량 기술을 권리화하는 방어적 출원을 하고 있는 영역일 가능성이 높다.
그러므로, 전 기술 영역에 해당되는 전체 특허 분류 기호를 대상으로 개수, 개수의 변화(속도), 개수 변화의 속도(가속도)를 측정하면 여러가지 유용한 정보를 알 수 있게 된다. 이를 통해 특정 기술 분야별 또는 전체 기술 분야별 출원 속도에 따르는 분포 곡선 내지 분포 맵을 만들 수 있다.
마찬가지로, 출원량 대신에 2차적인 가공처리를 통하여 출원인의 수 또는 상위 출원인의 수에 대해서도 위의 1)~6)과 같은 패턴별 분석이 가능하다.
출원인의 수가 위 1)과 같다면, 즉, 출원인의 수가 적으나, 출원인 증가 속 도가 크고, 출원인 증가 가속도가 양(+)인 경우에는 선도 기술 기업 몇 개가 선도적인 투자를 하고 있으며, 미래의 밝은 전망 때문에 참여자들의 관심 정도가 점차 증가하는 영역으로서 투자성이 밝고 수익성이 높을 가능성이 큰 기술 개발 영역일 수 있다.
출원인 수가 위 4)와 같으면 그 영역은 경쟁이 점점 치열해 지는 레드 오션적인 성격이 강한 영역일 가능성이 높다.
마찬가지로, 특정한 출원인을 기준으로 전체 기술 영역 또는 특정 기술 영역(특정 특허 분류 기호)를 대상으로 위와 같은 속도 분석을 한다면 다음과 같은 결과를 예상할 수 있을 것이다.
특정 출원인이 특정 기술 영역에서 출원량이 적으나, 출원 증가 속도가 크고, 그 증가 가속도가 양(+)인 경우에는 그 출원인은 그 영역을 미래의 신수종 사업으로 생각하고 집중 기술 개발을 하고 있는 영역일 가능성이 높다.
특정 출원인이 특정 기술 영역에서 출원량의 표준 편차가 큰 경우에는 그 영역에서의 기술 개발이 여의치 않음을 의미한다고 할 수 있다. 기술 개발이 정해진 목표치를 향해 순항하는 경우, 통상적으로 특허 출원도 꾸준한 증가 패턴을 보이며, 그 출원량의 표준 편차도 작은 경향이 크기 때문이다.
특정 출원인이 특정 기술 영역에서 출원량이 크고, 출원 증가 속도가 크나 출원 가속도가 적은 경우에는 그 출원인에게 그 기술 영역은 고도 개발기를 지나고 있을 가능성이 큰 영역일 수 있다.
이와 같이 각 출원량, 등록량, 출원인 수 등의 개별 지표나, 2가지 이상의 지표가 혼합되어 있는 경우에는 그 개별 지표 내지는 혼합 지표를 검색식에 반영할 수 있으며(예를 들면, (출원인 = 삼성전자) and (IPC = H04B 7/15), 그 검색 결과를 시간축으로 배치하거나, 표 등으로 출력하는 경우 유의미한 정보를 획득할 수 있다.
상기와 같은 속도 분석을 통해서 1) 전체 기술 분야별 출원 동향 정보, 2) 특정 기술 분야별 출원 동향 정보, 3) 특정 출원인의 전체 기술 분야별 출원 동향 정보, 4) 특정 출원인의 특정 기술 분야별 출원 동향 정보를 알 수 있으며, 이를 그래프나 표 등으로 시각화 할 수 있으며, 나아가 2 이상의 출원인에 대한 상기 3) 및 상기 4)를 수행하여 하나의 표나, 그래프에 비교한다면 비교표 내지는 비교 그래프, 나아가 비교 맵(2차원 또는 3차원, 비교 대상 출원인축과 기술 분야축 및 연도축 중 어느 하나 이상이며, 높이축은 수량을 표시함)을 제작할 수도 있다.
또한, 전체 또는 특정 기술 영역에 대응하는 속도 분석의 결과에 대하여 기설정된 기준 이상이 되는 항목이 있으면(기술 영역 또는 특정 출원인 단위의 기술 영역) 이를 외부에 보고할 수 있게 된다. 기설정된 기준의 한 예로는 1) 출원량 연 평균 50건 이상, 출원 증가율 연평균 30 이상, 출원 증가 가속도 10 이상 또는 2) 특정 출원인 및/또는 특정 기술 영역(특정 특허 분류 기호)을 대상으로 하는 출원량, 출원 증가율, 출원 증가 가속도 중 적어도 어느 하나 이상에 대한 입수되는 기준치가 될 수 있다. 보고는 리포팅의 형식을 취하며, 리포팅의 내용에는 기준을 만족하는 특정한 출원인 및/또는 특정한 기술 영역에 대한 1) 기준 만족 확인 자료, 2) 기준 만족 확인 자료의 대상이 되는 검색식, 3) 그 기준 만족에 대응되는 검색 결과 특허 리스트 중 어느 하나 이상이 포함될 수 있다.
상기와 같은 속도 분석은 2개국 이상의 특허 데이터베이스를 통해서도 수행할 수 있다. 2개국 이상의 특허 데이터베이스가 개입되는 경우에는 크게 다음과 같은 계열이 있다.
첫번째 계열은 특정 기술 영역의 속도를 나라별로 분석해 보는 계열이 있다. 이는 주로 국가별로 어떤 기술 영역에 집중하고 있는 지를 알아 볼 수 있다. 이는 특히, 각 상기 특정 기술 영역에 대한 각 국가별로 점유율이 높은 상위 출원인과 연관 지을 때, 그 기술 영역에서 어느 나라의 어떤 기업이 주도하고 있으며, 2개 이상의 나라에서 점유율이 공통적으로 높은 출원인이 있을 경우에는 그 출원인이 전세계적으로 그 특정 기술 영역을 주도하고 있을 가능성이 높을 수 있다.
이를 위해서 속도 분석 엔진은 국가별 특허 데이터베이스를 대상으로, 동일한 특허 분류 기호를 검색식에 포함시켜 국가별 검색식을 만든 다음 상기 국각별 검색식으로 검색 엔진(7000)에 질의하는 방식으로 검색을 수행한다. 만약 키워드 등이 있는 경우 그 키워드에 대한 각 국가별 대응 언어로의 번역을 포함시켜 국가별 검색식을 작성함은 당연하다 하겠다.
두번째 계열은 특정한 제 1국 출원인이 특정한 제 2국에 어느 영역에 얼마만큼의 출원을 하고 있는 가를 분석하는 계열이다. 이러한 분석을 위하여, 제1국을 대상으로 한 특정 출원인의 전체 기술 영역 또는 특정 기술 영역에 대한 검색식을 만들고(전체 기술 영역의 경우에는 특허 분류 기호를 지정하지 않으면 되고, 특정 기술 영역에 대해서는 검색식에 기술 영역에 해당하는 특허 분류 기호를 한정하면 된다.) 검색을 수행한 다음, 이에 대한 전체 또는 특정 기술 영역별 1차 리스트를 생성하며, 상기 제 2국을 대상으로 한 동일한 검색식(출원인명을 제 2국의 언어로 변경하는 것은 당연할 것이다.)을 만들고 검색을 수행한 다음 이에 대한 전체 또는 특정 기술 영역별 2차 리스트를 생성하며, 상기 2차 리스트와 상기 2차 리스트를 전체 또는 특정 기술 영역별로 비교하는 방식으로 상기 두번째 계열의 분석 목적을 달성할 수 있다.
상기 두번째 계열의 분석 목적을 달성하는 다른 방법으로 우선권 정보를 활용하는 방법을 들 수 있다. 상기 1차 리스트를 생성한 다음, 상기 1차 리스트에 존재하는 출원번호가 상기 제2국의 특허 정보에 있는지를 검토한다.(이는 통상적으로 외국 출원을 진행할 경우, 제1국에 먼저 출원하고 그 제1국 출원번호를 우선권 주장 가능 기간 내(통산 최선일로부터 1년)에 우선권을 주장하면서, 제2국에 출원하기 때문에 가능하다.) 검토 결과 제2국에 우선권 정보만 있는 특허 리스트에 대해서 전체 또는 특정 기술 영역별로 비교할 수 있다. 이 방법은 장점은 출원인의 대표명화가 충분하지 않거나, 출원인이 제2국에서는 다른 주체의 명의로 출원하는 경우가 있을 때 더욱 돋보인다.
세번째 계열은 특허 분류 기호를 달리하는 교차 검색 계열이다. 이를 위해서는 concordance table이 필수적이다. 미국 특허청이 운영하는 www.uspto.gov는 USPC와 IPC간의 상호 변환 서비스를 운영하고 있으며, concordance table을 공개하고 있다. 또한, 일본 특허 정보와 관련해서 FT의 테마(theme)와 IPC에 대한 concordance table을 판매하고 있다. concordance table이 있는 경우, 미국의 USPC 를 대상으로 하여 속도 분석을 수행한 다음, 기 설정된 기준을 만족하는 특정 출원인 및/또는 특정 기술 영역에 대하여, USPC를 상기 concordance table을 참조하여 대응되는 IPC 또는 다른 특허 분류 기호로 변경한 다음, 미국이 아닌 제 2국을 대상으로 하여 그 변경된 특허 분류 기호를 검색식에 포함시켜 속도 분석을 위한 검색 및 그 검색 결과의 분석을 수행한다.(물론, 출원인이나 키워드 등이 있을 때, 그 출원인 또는 키워드의 제2국 언어로의 번역을 포함한다.)
상기의 여러 예들은 출원량을 중심으로 설명했지만, 다른 분석 지표에 대해서도 대동소이한 방법을 적용할 수 있다. 다른 분석 지표로는 1) 집중도(concentration, 2) 특허활동지수(AI, activity index), 3) 점유율 등이 될 수도 있으며, 출원수에 대응되는 등록수, 등록율 등도 지표가 될 수 있으며, 출원인에 대응되는 발명자 또는 대리인도 한 지표가 될 수 있다. 상기에서 집중도란 특정 출원인이 어느 영역에 얼마나 집중하고 있는가에 대한 지표로, 특정한 국가별로 특정 연도 또는 기설정된 기간 단위 기준으로 ^특정 특허 분류 기호에 출원한 모든 출원수/그 출원인의 모든 출원수*100^한 값으로 나타난다. 특허 활동 지수란 특정한 국가별로 특정 연도 또는 기설정된 기간 단위 기준으로 ^{(그 출원인이 특정 특허 분류 기호에 출원한 모든 출원수/그 출원인의 모든 출원수)/(특정 특허 분류 기호에 대한 모든 출원수/모든 출원수)*100}이 된다.
한편 다음과 같은 사항이 속도 분석 등에 개수로 카운팅(couning) 될 때, 고려되어야 한다. 하나의 특허 출원에 2이상의 1) 특허 분류 기호, 2) 출원인, 3) 발명자, 4) 대리인이 대응되어 있는 경우일 때 이것을 어떻게 처리해야 하는가이다. 이는 정책적인 문제가 개별적으로 모두 counting 되게 하는 방법과, 대응되는 개수만큼 균분하는 경우와, 제3의 경우가 있다. 개별 카운팅은 출원인이 2이면 각 출원인에 1씩 가중치를 가자게 하는 방법이며, 균분은 그 출원에 대하여 0.5씩 가중치를 가지게끔 카운팅하는 방법이다. 균분의 경우에는 개수 정보에 소수점 이하의 수치를 가지는 값이 나올 수 있다.
한편, 본 발명의 핵심인 수정 특허 분류 기호 포함 검색의 관점에 2이상의 특허 분류 기호가 나올 때 위의 2 방법 외에 다음과 같은 방법이 고려될 수 있다. 특허 문건에 나와 있는 2 이상의 특허 분류 기호를 검색식에 포함되어 있는 특허 분류 기호를 기준으로 그룹핑 할 수 있다. 예를 들어 특정 특허 문건에 5개의 특허 분류 기호가 대응되어 있을 때, 상기 5개의 특허 분류 기호를 상기 검색식에 포함되어 있는 특허 분류 기호 자체이거나 하위 계층 특허 분류 기호에 속하는 제1 그룹과 상기 검색식에 포함되어 있는 특허 분류 기호의 상위 계층 특허 분류 기호이거나, 아니면 별개의 독립적인 노드/계층에 속하는 특허 분류 기호가 속하는 제2 그룹으로 나눌 수 있다. 이때, 상기 제1그룹과 상기 제2 그룹에 대하여 그 그룹에 속하는 구성 특허 분류 기호의 개수나 분포 비율에 따라서 가중치를 달리하는 방법이 있을 수 있다. 예를 들어 하나의 특허 문건에 H04B 7/005, H04B 7/01, H04B 7/145, H04B 7/204, H04B 5/00이 대응되어 있는 경우, 현재 검색식(분석 시 검색식이 있고, 그 검색식에 특허 분류 기호가 포함되어 있음)에 H04B 7/14가 있는 경우라면 H04B 7/14에 H04B 7/145, H04B 7/204가 하위 계층 정보에 있으므로, 수정 특허 분류 기호 포함 검색의 방법에서는 H04B 7/145, H04B 7/204를 포함하는 특허 문 건은 검색의 결과에 포함되게 되고, 상기 검색식 H04B 7/14 기준에 대하여 상기 특허 문건에 대한 가중치는 0이 아닌, 2/5가 부여 될 수 있다. 상기와 같은 경우에는 수정 특허 분류 기호 포함 검색의 방법이 아닌 통상적인 방법에는 검색식에 H04B 7/14가 있는 경우, 상기 특허 문건은 검색 결과에 포함되지 않는다.
상기 수정 특허 분류 기호 포함 검색 방법을 적용하는 경우, 상기 분석 뿐만 아니라, 감시(monitoring, watching) 서비스에도 유용하게 활용될 수 있다. 감시 서비스란 특정한 검색식을 등록시켜 놓고, 그 검색식에 해당되는 신규 특허 정보가 있는 경우 그 신규 특허 정보를 감시 서비스를 받는 자에게 전송하는 것을 말한다. 감시 서비스를 수행하기 위해서는 1) 감시를 위한 검색식을 등록받는 단계; 기설정된 시간 단위로 상기 검색식을 검색 엔진(7000)에 질의하고(질의할 때는 신규 문건을 찾는 것이 목적이므로, 시간 범위(예를 들면 공개 일자 기준으로 검색 질의하는 일자 포함 기준으로 과거 6일을 시간 범위로 한정함)을 검색식에 한정하는 것이 일반적이다.), 신규 특허 문건이 있는 경우 이를 감시 서비스 받은 자에게 전송하는 단계를 거칠 수 있다. 이때, 검색식에 특허 분류 기호가 포함되어 있을 경우에는 수정 특허 분류 기호 포함 검색 방법을 채용하여 상기 감시 서비스를 수행시킬 수가 있다. 본 발명의 수정 특허 분류 기호 포함 검색 방법을 사용하는 감시 서비스에서는, 논리적 및 계층적으로는 상기 검색식에 포함된 특허 분류 기호 체계 하부에 존재하지만, 특허 문건에 상기 검색식에 포함된 특허 분류 기호가 없는 경우, 감시 결과에서 제외되는 하자를 방지할 수 있다.
그리고, 모든 상기 특허 분류 기호 각각에 대하여 모든 부모 노드 특허 분류 기호를 입수하여 저장해 놓을 수 있으며, 상기 모든 부모 노드를 저장할 때 계층적으로 계층 정보를 포함하여 저장해 놓는 것이 바람직하다. 하기 표는 이와 같은 저장 방식의 일 실시예를 보여 준다.
레벨/번호 자신 섹션 클래스 서브클래스 그룹 1dot 2dot 3dot
1 A01B 13/02 A A01 A01B A01B 13/00 A01B 13/02
2 A01B 13/06 A A01 A01B A01B 13/00 A01B 13/04 A01B 13/06
3 A01B 13/04 A A01 A01B A01B 13/00 A01B 13/04
4 A01B 13/12 A A01 A01B A01B 13/00 A01B 13/08 A01B 13/10 A01B 13/12
5 A01B 13/10 A A01 A01B A01B 13/00 A01B 13/08 A01B 13/10
7 A01B 13/08 A A01 A01B A01B 13/00 A01B 13/08
도 47은 상기 표와 같은 데이터 구조가 어떠한 과정으로 생성될 수 있는지 단계별로 설명해 준다.
먼저 특허 분류 기호 전처리 모듈(3500)은 상기 적어도 하나 이상의 특허 분류 기호 정보를 입수하고(S4720), 입수된 특허 분류 기호 정보를 대상으로 특허 분류 기호 체계 상에서 자신의 모든 부모 노드 특허 분류 기호를 입수하고(S4730), 입수된 부모 노드 특허 분류 기호를 입수된 특허 분류 기호를 기준으로 노드 계층 정보를 포함하여 저장한다.(S4740)
상기 표와 같이 자기 자신에 대한 모든 부모 노드를 계층 레벨 수준별로 저 장해 놓은 경우, 하위 분류 포함 검색을 용이하게 할 수 있는 방법이 도출되게 된다. 간단하게 설명하면 다음과 같다. 만약 A01B 13/04에 대한 검색을 수행할 경우, 자기 자신이 A01B 13/04인 번호(여기서는 3번)을 찾는다. 3번 행에서 1 dot 레벨에서 자기 자신이 있음을 발견하고, 1 dot 레벨에 A01B 13/04이 있는 모든 행 번호를 찾고(여기서는 2, 3), 각 2, 3 행에 해당하는 자기 자신 IPC인 A01B 13/06과 A01B 13/04을 찾는다. 즉, 주어진 IPC가 A01B 13/04인 경우, A01B 13/04의 하위 분류 기호인 A01B 13/06를 찾을 수 있게 되며, 자기 자신과 함께 찾은 모든 하위 특허 분류 기호를 합하는 방식으로 하위 특허 분류 포함 검색 및 하위 특허 분류 포함 특허 정보 처리를 할 수 있게 된다.
첫째, 특허 분류 기호를 설명하는 타이틀 정보에 적어도 하나 이상의 dot를 가지는 특허 분류 기호 레벨에서는 동일한 형식의 특허 분류 기호 표기를 갖는 특허 분류 기호들 사이에서도 계층적 관계가 존재할 수 있다. 이 경우, 통상적인 검색 엔진(7000)은 입력된 특허 분류 기호에 매칭되는 특허 문건만을 찾아 주나, 본 발명 사상을 적용하면, 입력된 특허 분류 기호에 매칭되는 특허 문건만이 아니라, 특허 분류 기호 체계상으로 상기 특허 분류 기호에 종속되는 하위 특허 분류 기호가 존재할 경우, 상기 하위 특허 분류 기호에 매칭되는 특허 문건까지도 검색 결과로 찾아 줄 수 있다. 이를 통해서, 논리적으로 입력된 특허 분류 기호에 포함되는 특허 문건이지만, 특허 분류 기호가 달라서 제외되는 특허 문건의 발생을 최소화할 수 있게 된다.
둘째, 신규한 특허 문건 또는 갱신되는 특허 문건을 대상으로 기설정된 검색 식으로 검색을 수행하는 특허 감시 및 검색된 결과를 통계적으로 분석하는 특허 분석의 경우에서도 본 발명 사상은 적용될 수 있다. 이를 통해서, 논리적으로 입력된 특허 분류 기호에 포함되는 특허 문건이지만, 특허 분류 기호가 달라서 제외되는 특허 문건까지도 감시 및 분석 대상에 포함되게 된다. 아울러, 감시의 정확도 및 분석 대상 집합의 정확도가 높아지게 되어, 정밀한 감시 및 분석 대상 집합이 정확한 정밀 분석이 가능하게 된다.
셋째, 본 발명 사상을 적용함으로써, 특정 특허 분류 기호와 관계되는 특허 문건의 개수를 정확하게 셀수 있게 된다.
넷째, 본 발명의 하위 분류 포함 검색 기법 중에서도 범위 검색이 수행될 때, 검색 속도가 빨라지게 되는 장점이 있다.
출원인 대표명화 전처리 모듈(3600)
특허 문건에 포함되어 있는 출원인 명의(특허권자, assignee를 포함한다)는 그 주체가 같음에도 불구하고 2 이상의 다른 표기법으로 표기될 수 있다. 기업의 사명이 변경되는 경우, 변경된 이후에는 법인 등록 번호나 사업자 등록 번호 등은 그대로 유지되나, 출원인 명의가 달라지게 되고, 달라지기 전의 명의와 달라진 후의 명의로 된 특허 문건이 공존하게 된다. 또한, 제1국에서 제2국으로 해외 출원하는 경우, 제 1국에서의 출원인 표기와 제 2국에서의 출원인 표기가 달라지는 경우가 많으며, 제2국에서조차도 여러 개의 표기로 표기되는 경우도 많다. 상기와 같이 동일 주체를 다른 표기법으로 표기되는 문제를 해결하는 것이 본 발명의 출원인 대 표명화 전처리 모듈(3600)이 수행하는 기능이다.
상기와 같은 문제가 발생하는 이유는 크게 3가지가 있다. 첫번째 유형은 회사의 사명 변경, 합병 등으로 출원인의 표기가 실질적으로 변경되는 경우이다. 이 경우, 기업 정보 DB(2700)를 통해서 상기 출원인 명의의 변경에 관한 정보를 상기 특허 정보 데이터베이스(2300)에 반영해 놓을 필요가 있다. 두번째 유형은 대리인들마다 특정 회사의 표기를 달리하는 경우인데, 특히 해외 기업에 관한 표기는 통일화되어 있지 않는 경우가 많다. 이 경우에는 1) 자국 내에서의 표기는 비교적 일치하는 것이 많다는 점, 2) 해외에서 국내로 들어오는 사건의 대부분은 우선권 주장을 포함하고 있다는 점을 고려하여 자국내에서의 출원인 표기를 기준으로 통일화를 시켜 놓을 수 있다.
상기 출원인 대표명화 전처리 모듈(3600)의 구성은 도 7에 잘 나타나 있다. 출원인 대표명화를 처리하는 알고리즘을 포함하고 있는 핵심 엔진인 출원인 대표명화 전처리 엔진(3610)과 대표명화를 처리하기 위한 규칙을 포함하고 있는 대표명화 규칙 DB(3630), 출원인의 명의가 변경되는 정보를 포함하고 있는 출원인 명의 히스토리 DB(3650)가 있다. 특히, 상기 출원인 명의 히스토리 DB(3650)에는 특허권자 변동 정보(assignee change 정보)가 포함되어 있을 수 있으며, 기업의 사명 변경, 합병과 분할에 의한 사명 변동 정보가 포함되어 있을 수 있다. 그리고, 대표명화를 처리하기 위해서는 대표명화의 기준이 되는 대표명화 기준 DB(3670)가 필요한데, 이들에는 세부적으로 조약 우선권 정보 DB(3671), PAJ DB(3673), KPA DB(3675), Inpadoc DB(3677), 패밀리정보 DB(3830)가 있으며, 표기 등의 문제를 해결하기 위 해서 특히, PAJ DB(3673), KPA DB(3675)가 충분히 활용되는 것이 바람직하다. 대표명화 된 출원인 정보는 출원인 대표명 DB(3690)에 저장된다.
이하, 상기 출원인 대표명화 전처리 모듈(3600)이 출원인 대표명화를 수행하는 방법에 대해 상술한다.
상기 대표명화 전처리 모듈이 출원인 대표명화를 수행하는 일실시예적 방법에 대해서는 도 48에 잘 나타나 있다.
상기 대표명화 전처리 모듈은 출원인 명의정보에서 식별력 없는 요소를 제거하고(S4820), 사명 변경 정보를 입수하며(S4830), 특정 기간 동안 변경 전 사명과 변경 후 사명을 출원인 명의로 하는 출원된 모든 문건을 찾아내고(S4840), 상기 변경 전후의 사명에 대한 주소 정보를 입수하고 그 동일성을 비교 하고(S4850), 주소 정보가 동일한 경우, 동일한 출원인으로 대표명화하고, 주소 정보가 동일하지 않을 경우, 대표자 명의의 동일성을 검사하며(S4806), 대표자 명의가 동일한 경우, 동일한 출원인으로 대표명화하고, 동일하지 않을 경우, 변경 전 명의로 된 출원에서 IPC 메인 그룹을 추출하며(S4870), 변경 후 명의로 된 출원에서 IPC 메인 그룹을 추출하고(S4880), 상기 양 추출된 IPC 메인 그룹에서 공통되는 것이 있는 경우, 동일한 출원인으로 대표명화한다(S4890)
이하, 상기 대표명화 과정을 더욱 상세하게 설명한다. 본 발명의 기업 정보 DB(2700)에는 기업의 1) 사명, 주소, 대표 이사, 법인 등록 번호, 사업자 등록 번호 등과 같은 기업 인적 정보, 2) 재무 정보, 3) 생산품 또는 취급 품목에 관한 정보, 4) 사명 변경, 합병, 분사 등과 같은 변동 정보, 5) 공시 정보 중 어느 하나 이상이 포함되어 있다. 상기 출원인 대표명화 전처리 모듈(3600)은 적어도 하나 이상의 특정 시점을 기준(예를 들면 현재 시점)으로 동일성이 인정되는 기업명을 기준으로 다른 표기의 출원인 명의를 대표명화한다. 대표명화한 출원인 명의는 특허 공보에서 입수되는 정보로 구성되는 특허 정보 데이터베이스(2300)에 엎어 쓰기 보다는 별도의 필드에 저장되는 것이 바람직하다. 상기 첫번째 유형의 대표명화 과정은 다음과 같이 이루어 진다.
첫째, 주식회사, 카이시키 가뷰사, ltd, co 등과 같이 식별력이 없는 요소를 제거한다.
둘째, 기업 정보 DB(2700)에 기업 사명의 변동 정보를 입수한다. 특정 과거 시점 A에서 기업명이 a, 주소가 a1, 다른 시점 B에서의 기업명이 b, 주소가 b1이라고 가정하자. 특허 정보 데이터베이스(2300) 또는 검색 엔진(7000)에 기간 정보로 A시점에서 B시점까지에 출원 명의인으로 a로 된 모든 문건을 찾아 낸다. 이때, 주소 정보가 a1인 경우(또는 b1-주소는 그 이전에 옮겼을 가능성이 높음. 주소 변동이 사명 변동보다 다수 있음)라면 모두 같은 출원인으로 파악하고, 주소 정보가 c1~cn인 경우에는 태그를 붙여 저장한다. 특허 정보 데이터베이스(2300) 또는 검색 엔진(7000)에 기간 정보로 A시점에서 B시점까지에 출원 명의인으로 b로 된 모든 문건을 찾아 낸다. 이때, 주소 정보가 a1인 경우 또는 b1라면 모두 같은 출원인으로 파악하고, 주소 정보가 c1~cn인 경우에는 태그를 붙여 저장한다. 이때, 상기 주소 정보가 다를 경우(c1~cn)라도 대표이사 명의가 같거나(특정 기간에 출원된 특허 문건에는 대표이사 정보가 포함되어 있음), b명의로 된 특허 문건의 특허 분류 기호 가 a 명의로 된 특허 출원에서 파악되는 서브 클래스 및/또는 그룹 이하 수준에 동일한 문건이 있다면 동일 출원인으로 분류한다.
셋째, 각 시점별로 파악되는 (기업명, 주소) 집합을 상기 검색 엔진(7000) 또는 상기 특허 정보 데이터베이스(2300)에 질의하여 특허 문건 정보를 획득한다.
넷째, 상기 둘째 및 셋째에서 파악되는 문건 집합을 합집합 연산을 수행하고, 가장 최근 기업명을 기준으로 대표명화를 수행한다. 상기 대표명화된 기업명에는 1) 각 시점별 기업명 및/또는 2) 각 해당 특허 문건이 대응되어 있는 것이 바람직하다. 상기 대표명화된 기업명에 대한 해당 특허 문건에 대한 공개적인 정보를 획득하는 경우, 상기 출원인 대표명화를 업데이트할 수 있을 것이다.(기업 공시 정보에 특허 문건이 포함되어 있거나, 기업 정보 DB(2700)에 특허 정보가 포함되어 있는 경우가 그 한 예가 된다.)
이어서, 상기 두번째 유형의 대표명화 과정을 설명한다. 상기 두번째 유형의 대표명화는 우선권 주장 번호를 활용하는 것을 특징으로 하며, 이에 대해서는 도 49에 잘 나타나 있다. 상기 대표명화 전처리 모듈은 제 1국에서 입수된 특허 문건에서 조약 우선권 정보가 있는 경우, 조약 우선권 번호 및 상기 입수된 특허 문건의 출원인 명의 정보를 입수하고(S4920), 상기 조약 우선권 정보를 검색 엔진(7000) 또는 DBMS(2100)를 통하여 상기 조약 우선권의 기초가 되는 본국의 특허 문건 정보를 입수하며(S4930), 상기 본국의 특허 문건 정보에 포함된 출원인과 상기 제1국에서 입수된 특허 문건의 출원인 명의를 동일하게 취급하는 방식으로 국가 간에 출원인 명의를 대표명화한다(S4940) 이하, 더욱 상세하게 설명한다.
제1국에서 제2국으로 우선권을 주장하며 출원된 경우, 상기 제 2국 특허 정보 데이터베이스(2300) 및 상기 제1국 특허 정보 데이터베이스(2300)에서 상기 우선권 주장 번호 및 상기 우선권 주장의 기초가 되는 특허 출원 번호에 관한 정보를 입수할 수 있다. 상기 제1국에서의 회사 명칭이 e인 출원인이 출원한 제1국에서의 특허 출원 번호가 제2국의 우선권 주장 번호에 존재하는 경우, 상기 우선권 주장 번호를 포함하고 있는 제2국 특허 출원의 출원인은 실질적으로 동일한 출원인이라고 볼 수 있다.(물론, 제2국에서의 우선권을 양도한 경우도 발생할 수 있지만, 이는 통상적인 것이 아니다.) 물론, 제2국 특허 정보 데이터베이스(2300)에서 상기 제1국에서 기인한 우선권 주장 번호가 있는 경우, 이 우선권 주장 번호를 상기 제1국에서 검색해 봄으로써 상기 제1국과 제2국에서의 동일 주체를 찾을 수 있다. 동일 주체를 찾은 경우, 제 2국에서의 여러 명칭으로 된 표기는 그 중 어느 하나로 표기를 통일화시킬 수 있다. 즉, 제2국에서 상기 e 출원인의 표기를 f, g 또는 h라고 표기되었을 경우, 상기 f, g, 또는 h 중에서 f를 선택하여 표기할 수 있다.
예를 들면, 일본에 본사를 둔 SONY라는 회사가 한국에서 표기될 때, "쏘니 가이시키 가뷰사", "소니 가이씨키 가부샤"등과 같이 여러가지로 표기되는데 이를 "소니 가이씨키 가부샤"로?통일된 표기화를 시킬 수 있다. 이는 미국에서도 마찬가지일 것이며, 미국 출원인이 대한민국 또는 일본에 출원될 때도 마찬가지일 것이다. 즉, 국경을 넘는 특허 출원에 있어서, 우선권 주장 번호를 통해서 제1국의 주 체와 제2국의 여러 표기에 관한 주체를 동일화 및 대표명화시킬 수 있다.
대표 어구 추출 전처리 모듈(3700)
이어서, 본 발명의 대표 어구 추출 모듈에 대해서 설명한다. 먼저 대표 어구의 개념에 대해서 설명한다. 대표 어구(Representing Phrase)란 상기 대표 어구를 통해서, 특정한 문건 전체 또는 상기 특정한 문건의 일부분을 대표할 수 있는 단어 또는 2 이상의 단어로 구성되는 어구를 말한다. 본 발명의 대표 어구가 가지는 기본적인 속성은 주어지는 기설정된 대표 어구 추출 전체 문건 집합에서는 상당히 희박하게 나오면서, 주어지는 기설정된 대표 어구 추출 목표 문건 집합 또는 대표 어구 추출 목적 문건 또는 대표 어구 추출 목적 문건의 일부분 또는 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분에서는 상당히 빈번하게 나오는 어구이어야 한다.
상기 대표 어구는 1) 명사만으로 구성되는 어구, 2) 명사와 동사만으로 구성되는 어구, 3) 형용사나 부사까지 포함되어 형성되는 어구가 있을 수 있다. 상기 대표 어구의 길이는 단어수를 기준으로 할 때 1~5개가 바람직하며, 2~3개가 더욱 바람직하다. 통상적으로 기술적 개념이 1개의 단어로 생성되기도 하지만, 많은 경우 2~3개의 단어로 기술적 개념 또는 기술적 작용 또는 효과를 구성하는 것이 많기 때문이다.
상기 기설정된 대표 어구 추출 전체 문건 집합의 종류에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합 등이 그 예가 될 것이다.
그리고, 상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합과 상대적인 개념으로, 상기 대표 어구 추출 전체 문건 집합의 부분 집합이면 충분하나, 가급적 그 부분 집합의 크기는 작을수록 좋다. 상기 대표 어구 추출 목표 문건 집합의 예로는 1) 특정 출원 1개, 특정 기업의 모든 출원, 특정 발명자의 출원, 특정 발명자의 특정 IPC의 출원, 특정 기업의 특정 IPC의 모든 출원, 특정 IPC의 특정 연도의 모든 출원 등이 그 예가 될 것이다.
한편, 대표 어구 추출 목적 문건의 일부분의 예로는 특허 청구 범위, 특허 청구 범위 중의 독립항, 특허 청구 범위 중의 종속항, 발명의 효과나 산업상 이용 가능성, 요약 등이 그 예가 될 것이다. 한편, 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분은 상기 대표 어구 추출 목표 문건 집합을 구성하는 모든 문건의 전술한 특허 청구 범위 등이 될 것이다.
이어, 상기 대표 어구 추출 과정을 상세히 설명한다. 상기 대표 어구 추출은 본 발명의 대표 어구 추출 전처리 모듈(3700)이 수행한다. 상기 본 발명의 대표 어구 추출 전처리 모듈(3700)에는 1) 각 언어별 형태소 분석 엔진(analyser), 2) 어구 생성 엔진, 3) 어구별 카운팅 엔진, 4) 시소러스 사전을 비롯한 각종 사전 데이터베이스, 5) 대표 어구 추출 엔진을 포함한다. 상기 대표 어구 추출 전처리 모듈(3700)의 구성은 도 8에 잘 나타나 있다. 대표 어구를 추출해 내는 알고리즘을 포함하고 있는 대표 어구 추출 전처리 엔진(3710), 대표 어구를 추출하는 기준이 되는 정책에 관한 정보를 포함하고 있는 대표 어구 추출 정책 DB(3730), 대표 어구가 추출되었을 때 각 대표어구에 대한 빈도값 등의 각종 카운팅 또는 계산 정보 및 대표 어구가 어느 문건의 어느 위치(필드 등)에서 나왔는지에 관한 정보를 포함하고 있는 대표어구-빈도-출원번호 대응 DB(3750)가 포함되어 있다. 한편, 동의어나 유의어의 처리를 위한 시소러스 DB(3770) 및 2종 이상의 언어의 처리를 위한 번역 시스템을 활용하거나, 기번역된 사전을 이용하여 대표 어구에 대한 번역 정보를 포함하고 있는 대표 어구 번역 DB(3790)가 더 포함되어 있을 수 있다. 이하, 본 발명 의 대표 어구 추출 전처리 엔진(3710)에 대해 더욱 상세하게 설명한다.
형태소란 단어(어절)을 구성하고 있는 최소한의 언어 요소라고 할 수 있다. 가장 쉽게 생각할 수 있는 것이 '명사', '대명사', '수사' 등의 체언, '형용사', '동사' 등의 '용언', '부사', '관형사', '감탄사' 등의 독립언, '조사', '어미', '선어말어미', '접사' 등의 기능어가 있다. 형태소는 실질적인 의미를 가지고 있는 실질형태소와 기능적 요소를 담당하고 있는 기능형태소로 크게 양분되며, 색인어 추출을 위한 형태소 분석시 이 둘을 분리하는 과정이 우선시 된다. 한마디로 형태소는 더 이상 별개의 의미나 기능으로 분리할 수 없는 최소한의 언어 요소라고 보면 될 듯 하다. 형태소 분석 엔진이 가져야 할 기능은 크게 문자열 유형의 파악 및 이에 따른 분리 과정, 전자사전의 탐색 기능, 각종 규칙 연산(체언 판단, 용언 판단, 품사 전이 판단 등), 복합명사 처리 등이다. 각 언어별 형태소 분석 엔진은 공지의 기술이므로, 그 작동 방법에 대해서는 생략한다. 상기 형태소 분석 엔진은 주어지는 문장 또는 어구에 대하여 형태소별로 분석하여, 실질 형태소들을 출력한다.
상기 본 발명의 어구 생성 엔진은 상기 출력된 실질 형태소를 입수 받아, 상기 실질 형태소 단위로 1~5개(바람직하게는 2~3개)의 실질 형태소 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 실질 형태소들을 형태소 별로 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 abc, bcd, cde, def, efg 라는 실질 형태소별 어구를 생성한다. 상기 어구 생성 엔진은 주어지는 문건 또는 문건 부분에 대하여 문장 단위로 어구를 생성한다. 문건 부분 에 대하여 어구를 생성하는 것의 일예로는 특허 청구 범위에 나오는 문장들을 대상으로 하여 상기 어구를 생성할 수 있을 것이다. 상기 배열의 생성 방법은 1) 하나의 문장 단위로 처리하되, 하나의 문장에서 추출된 실질 형태소가 n개 있을 때, 상기 n개의 어구에 대한 nC2, nC3, nC4, nC5로 하여 어구를 생성하는 방법(예를 들면, nC2가 적용될 때, 상기 어두들은 ab, ac, ad, ae, af, ag, bc, fg가 생성된다.), 2) 문건 단위에서 m개의 실질 형태소가 있을 경우, 문건 단위에서 상기 1)의 방법을 적용하는 방법, 3) 순차적으로 2~5개의 실질 형태소로 배열하는 방법(예를 들면, 2개의 실질 형태소가 순차적으로 배열된다고 할 때는 ab, bc, cd, de, ef, fg가 되며, 3개의 실질 형태소가 배열된다고 할 때는 abc, bcd, cde, def, efg가 된다. 물론, 2개 및 3개의 실질 형태소의 배열 모두를 사용할 수도 있을 것이다.)
한편, 상기 형태소 분석기를 통과한 상기 실질 형태소는 텀(term)이라고도 명명하기도 한다. 상기 실질 형태도 또는 텀은 상기 형태소 분석기에서의 세팅값에 따라서 달라질 수 있다. 이때, 상기 세팅값의 예로는 1) 체언만 분리함, 2) 용언만 분리하되, 대표형만 추출함, 3) 형용사나 부사의 경우 대표형만 추출함 등이 그러한 예가 될 수 있다.
이어, 상기 어구별 카운팅 엔진은 상기 생성된 각 어구별로, (어구, 카운팅값) 정보를 필수적으로 생성하며, 바람직하게는 (어구, 카운팅값, 문건 번호) 정보를 생성하며, 더욱 바람직하게는 (어구, 카운팅값, 문건 번호, 문건 상의 위치필드명(예를 들면 특허 청구 범위)) 정보를 생성한다. 상기 어구별 카운팅 엔진은 대표 어구 DB에 상기 생성한 정보를 저장한다. 하기 표는 상기 대표 어구 DB에 포함되는 데이터의 일예를 나타낸다. 상기 예는 국가별로 특정 어구에 대해서 생성되는 데이터의 일예를 보여주고 있다.
어구
ID
어구 어구 단어수 문서내 누적 카운팅값(문건 번호 기준) 국가 코드 문건 번호 어구 위치 ... "문서 절대 ID"
1 abc 3 1 KR 10-2003-0012345 특허청구범위 1
1 abc 3 2 KR 10-2003-0012345 특허청구범위 2
1 abc 3 3 KR 10-2003-0012345 발명의 상세한 설명 3
1 abc 3 4 KR 10-2003-0012345 발명의 상세한 설명 4
1 abc 3 5 KR 10-2003-0012345 발명의 상세한 설명 5
1 abc 3 6 KR 10-2003-0012345 발명의 상세한 설명 6
1 abc 3 7 KR 10-2003-0012345 발명의 상세한 설명 7
2 bcd 3 1 KR 10-2003-0012345 특허청구범위 8
2 bcd 3 2 KR 10-2003-0012345 특허청구범위 9
2 bcd 3 3 KR 10-2003-0012345 특허청구범위 10
2 bcd 3 4 KR 10-2003-0012345 발명의 상세한 설명 11
2 bcd 3 5 KR 10-2003-0012345 발명의 상세한 설명 12
2 bcd 3 6 KR 10-2003-0012345 발명의 상세한 설명 13
2 bcd 3 7 KR 10-2003-0012345 발명의 상세한 설명 14
... ... ... ... ... ... ...
1 abc 3 1 KR 10-2003-0056789 특허청구범위 150
1 abc 3 2 KR 10-2003-0056789 발명의 상세한 설명 151
1 abc 3 3 KR 10-2003-0056789 발명의 상세한 설명 152
... ... ... ... ... ... ... ...
상기 표에 나와 있는 데이터는 특허 문건 10-2003-0012345 및 10-2003-0056789으로 생성된 것임을 알 수 있으며, 어구 생성 엔진은 3개의 실질 형태소 단위로 어구를 생성했음을 알 수 있다. 그리고, 상기 10-2003-0012345에서 상기 어구 abc는 특허 청구 범위에서 2회, 발명의 상세한 설명에서 5회가 나왔음을 알 수 있다. 또한, 어구 bcd는 특허 청구 범위에서 3회, 발명의 상세한 설명에서 4회가 나왔음을 알 수 있다. 또한, 어구 abc는 특허 문건 10-2003-0056789에서 특허청구범위에 1회, 발명의 상세한 설명에서 2회가 나왔음을 알 수 있다. 그러므로, 본 발명의 어구별 카운팅 엔진은 반복적으로 또는 재귀적으로 입수되는 모든 특허 문건에 대하여 상기 표와 같은 데이터를 생성할 수 있다. 아울러, 상기 어구 생성 엔진은 2개의 실질 형태소 단위로 어구를 생성할 수 있을 것이며, 상기 2개의 실질 형태소 단위로 생성되는 어구에 대하여, 본 발명의 어구별 카운팅 엔진은 상기 표와 같은 데이터를 생성할 수 있음은 자명하다 할 것이다. 나아가 1개 또는 4~5개의 실질 형태소 단위로도 상기 어구별 카운팅 엔진은 상기 표와 같은 데이터를 생성할 수 있을 것이다.
이때, 상기 어구별 ID를 생성하는 것이 문제시 될 수 있는데, 상기 어구별 ID를 생성하는 방법은 통상적인 DB 기술에서 자명한 것이나, 몇가지 예시적인 방법을 제시한다. 첫째 방법은, 최초로 생성되는 어구에 대하여 순차적으로 ID를 부여하고, 다음으로 생성되는 어구에 대하여 기존에 있던 어구를 검색하여 없으면 새로 운 ID를 부여하고, 있다면 기존의 ID를 부여한다. 이러한 과정을 모든 입수되는 어구마다 반복 또는 재귀적으로 수행한다. 둘째 방법은 어구에 대한 ID 부여 없이 입수되는 모든 어구에 대하여 순차적으로 임시 ID를 부여하여 상기 표와 같은 데이터를 생성한 다음, 각 어구마다 하나씩 읽으면서 동일 어구에 대해서 동일한 정식 ID를 부여하며, 이러한 과정을 모든 정식 ID가 부여되지 않은 어구들을 대상으로 반복적으로 또는 재귀적으로 수행한다.
그리고, 본 발명의 상기 어구별 카운팅 엔진은 매 어구가 생성되어 처리될 때마다 어구 절대 ID를 생성하여 모든 어구마다 부여할 수 있다.
또한, 본 발명의 어구별 카운팅 엔진은 목표 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있다. 상기 목표 문건 집합에는 상기 표와 같이 하나의 문건을 기준으로 누적 카운팅 값을 계산할 수도 있으며, 하나의 문건 내의 특정한 필드(예를 들명 특허 청구 범위)로도 누적 카운팅이 가능함은 자명할 것이다.
또한, 본 발명의 어구별 카운팅 엔진은 전체 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있다.(상기 예에서 전체 문건 집합을 특허 문건 10-2003-0012345 및 10-2003-0056789로 가정하고, 수치를 상기 표 기준으로 입력하였으며, 실제로는 훨씬 더 큰 전체 문건 집합을 대상으로 본 발명 사상이 적용된다.)
어구
ID
어구 누적 카운팅값(전체 문건 집합 기준) 관련 어구 절대 ID
1 abc 10 1, 2, 3, 4, 5, 6, 7, 150, 151, 152
2 bcd 7 8, 9, 10, 11, 12, 13, 14
또한, 본 발명의 어구별 카운팅 엔진은 문건 상의 특정 필드(예를 들명 특허 청구 범위 등)를 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있다.
어구
ID
어구 누적 카운팅값(특허청구범위기준) 관련 어구 절대 ID
1 abc 3 1, 2, 150
2 bcd 3 8, 9, 10
이어, 본 발명의 대표 어구 추출 엔진에 대해서 설명한다. 대표 어구 추출 전체 문건 집합에서 하기 표와 같은 (어구, 카운팅값, 문건 번호)데이터가 생성되었을 때, 본 발명의 대표 어구 추출 엔진은 1) 전체 어구들의 출현 개수(frequency) 기준으로, 어구 ID별로 확률값(=특정 어구의 출현 개수/전체 어구 수)을 대응시키고, 기설정된 확률값 범위에 해당하는 어구들을 후보 대표 어구로 선정하고, 기설정된 대표 어구 선발 규칙을 참조하여, 목표 문건 집합별로의 대표 어구를 선정한다. 상기 출현 개수는 상기 각 특정 필드별로 계산될 수 있음은 자명할 것이다. 하기 예에서는 문건 번호별로 각 어구별 출현 개수를 카운팅하여 대표 어구를 추출하였다.
어구 문건에서의 출현개수(F)(frequency) 문건 번호 전체에서의 출현개수(T) 출현개수/전체 출현개수() 전체에서의 출현개수/전체 어구 총수(10억)()
abc 40 #1 80000 0.05 0.008
abc 2 #2 80000 0.0025 0.008
abc 200 #3 80000 0.25 0.008
bcd 8 #1 200 4 0.00002
bcd 100 #2 200 50 0.00002
bcd 2 #4 200 0.1 0.00002
cde 15 #1 3000 0.5 0.0003
cde 100 #4 3000 3.3 0.0003
상기 표에서 알 수 있듯이, 모든 어구마다 어구 절대 ID가 있고, 각 어구 절대 ID마다 어구 ID가 대응되며, 각 어구 절대 ID마다 상기 어구가 나온 문건 번호가 대응되어 있으며, 각 문건 번호 마다 서지 사항이 대응되어 있다. 그러므로, 상기 표의 문건 번호 및 문건 번호별 상기 어구 ID별 출현 개수를 입수하는 것은 목표 문건 집합의 한 예를 문건 번호로 하는 것일 수 있다. 마찬가지로, 상기 문건 번호 자리에 기설정된 레벨의 IPC가 대응될 수도 있으며, 특정한 출원인 또는 특정한 발명자 등이 대응될 수 있으며, 각 경우마다 각 목표 문건 집합별 어구 ID별 출현 개수를 카운팅할 수 있을 것이다. 상기 목표 문건 집합별 어구 ID별 출현 개수를 카운팅하는 것은 DMMS에서는 테이블별 조인(join) 명령을 통해서 할 수 있을 것이다.
이때, 예를 들어, 상기 대표 어구 선발 규칙이 1) 전체 어구 개수 대비(예를 들면 10억 개) 전체에서의 출현개수(T)가 1/1000 미만이고, 2) 목적하는 문건 번호에서의 출현 개수가 1/1,000,000 이상이며, 3) 출현개수/전체 출현 개수()가 10에서 1이라고 할 때, 각 어구로 각 문건 번호의 대표 어구가 될 수 있는지를 검토한다. 어구 abc는 문건 번호 #1 내지 #4 어느 것에도 대표어구가 될 수 없고(조건 1) 위반), 어구 bcd는 문건 번호 #2에서만 상기 문건 번호를 대표하는 어구가 될 수 있으며,(문건 번호 1 및 문건 번호 4에서는 조건 2)위반), 어구 cde는 문건 번호 #4에서만 대표어구가 될 수 있다(문건 번호 1에서는 조건 3) 위반) 그러므로, 문건 번호 #1의 대표 어구에는 상기, abc, bcd, cde는 포함되지 않으며, 문건 번호 #2의 대표 어구에는 bcd가 포함될 수 있으며, 문건 번호 #3에 대해서는 상기 어구 abc는 포함되지 않으며, 문건 번호 #4에 대해서는 어구 cde가 포함될 수 있게 된다.
이때, 특정한 문건 번호에 대하여 너무 많은 대표 어구가 할당될 수 있게 된다. 즉, 특정한 문건에 대하여는 상기 예로 든 조건을 충족하는 대표 어구가 100개가 될 수도 있으며, 이 경우, 4) 각 대표 어구마다 계산되는 출현 빈도(frequency)가 높은 순으로 10개 내지 30개의 대표 어구를 추출하는 규칙을 적용하여, 대표 어구의 개수를 제한할 수 있다. 한편, 특정한 문건에 대해서는 대표 어구가 1개 내지 없을 경우가 발생할 수 있는데, 이 경우에는 상기 예로든 조건에서 조건 3)을 완화하여 적용하여, 대표 어구의 숫자를 10개 내지 30개로 유지할 수 있을 것이다.
상기와 같은 과정을 모든 문건 내지는 모든 문건 집합에 대하여 반복적으로 수행하면, 모든 문건에 대하여 기설정된 개수 범위(예로 들면 10개 내지 30개)의 대표 어구를 대응시켜 놓을 수 있을 것이다. 그러므로, 상기와 같은 과정을 통하여 상기 문건 번호에 대응되는 대표 어구를 획득할 수 있게 된다. 그리고, 상기 대표 어구 및 상기 대표 어구에 대한 계산값(예로 들면, 상기 문건 번호의 문건에서의 출현개수, 전체에서의 출현개수 등)은 상기 문건 번호에 대한 서지 사항의 한 예로 취급되어 각종 분석에 활용될 수 있다.
상기 실시예에서는 출현 빈도의 계산을 문건 단위로 하였는데, 상기 출현 빈도는 다음과 같은 1) 문건 집합 또는 2) 문건 내부의 필드 단위(특허 청구 범위 등) 또는 3) 문건 집합의 모든 문건 내부의 필드(예를 들면 2000년부터 2005년까지 출원된 대한민국의 IPC H04B 7/02에 모든 문건에 포함된 특허청구범위 중 제 1항)에 포함된 내용을 단위로 하여 계산할 수도 있을 것이다. 이때, 하나의 문건 내부인 경우에는 하나의 문건과 동일하게 취급(문건 번호의 대응 관점)할 수 있을 것이다. 하지만, 2개 이상의 문건 집합의 경우에는 문건 번호의 대응 관계가 없어지는 것처럼 보일 수 있으나 아래 3 가지 방법 중 어느 하나의 방법을 사용하면 이 문제를 용이하게 해결할 수 있을 것이다. 이는 1) 문건 집합에 속하는 개별 문건의 단위로 대표 어구를 추출한 다음, 상기 대표 어구들을 합집합 연산을 수행한 다음, 기설정된 범위(예로 들면 10개 내지 30개)로 대표 어구의 수를 한정하는 방법, 2) 만약 문건 번호별로 대표 어구가 이미 추출되어 있다면 상기 문건 집합에 속하는 문건 번호에 대응되는 대표 어구를 입수해서 합집합 연산을 수행한 다음, 기설정된 범위로 대표 어구의 수를 한정하는 방법, 3) 문건 집합에 속하는 모든 문건을 처리한 다음에 각 어구를 문건 번호가 아닌 문건 집합의 고유 ID에 대응하여 대표 어구를 추출하는 방법 중 어느 하나를 사용할 수 있을 것이다. 상기 3) 문건 집합의 모 든 문건 내부의 필드에 포함된 내용 단위일 경우에도 상기 1) 합산 처리 내지 2) 문건 집합 고유 ID 대응 처리 방법이 사용될 수 있을 것이며, 만약 필드 단위로 대표 어구가 마련되어 있다면, 상기 3) 입수 후 합산 처리 방법이 사용될 수 있을 것이다.
상기 대표 어구 추출의 대상이 되는 문건 집합에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 11) 상기 1) 내지 9)에 등록 여부, 심사청구 여부 등과 특정 조건을 결부하는 것으로 생성되는 특허 문건 집합 중 어느 하나 이상이 될 수 있을 것이다.
이하, 형태소 분석 엔진과 연결된 검색 엔진(7000)의 인덱서(indexer)을 활용하여 상기 대표 어구를 추출하는 방법을 설명한다. 검색 엔진(7000)을 사용하는 이유는 상기 검색 엔진(7000)은 통상적으로 검색어 값에 대한 개수를 카운팅하는데 뛰어난 성능을 가지고 있기 때문이며, 인덱서가 인덱싱해 놓은 데이터를 DB용 데이터로 용이하게 변환할 수 있기 때문이다. 인덱서는 입수되는 텀과 상기 텀이 나온 문건 번호 또는 경우에 따라서는 상기 텀이 나온 필드명을 저장한다. 예로 들면, (term 1, #1)은 상기 term 1이 문건 #1에서 입수되었다는 뜻이며, (CL:term 1, #1)은 상기 term 1이 상기 문건 #1의 특허 청구 범위(Claim, CL)라는 필드에서 입수되었다는 뜻이다. 검색 엔진(7000)의 인덱스에는 상기 (term 1, #1)이나 (CL:term 1, #1)과 같은 데이터들이 엄청나게 많이 저장되어 있으며, 검색어로 term 1을 넣거나, 검색 필드를 특허 청구 범위로 한정하여 term 1을 입력할 경우, 검색 결과로서 문건 번호 #1을 출력해 준다. 한편, 검색 엔진(7000)은 상기 term 1이 전체 문건에서 몇 개가 들어가 있는지, 또는 특허 청구 범위에서 몇 개가 들어가 있는지를 아주 빠른 시간에 처리해 준다.(통상적으로 검색 엔진(7000)은 검색 결과의 전체 개수를 먼저 리턴해 주고, 이어서, 전체 개수 중 앞쪽 일부만을 먼저 보여 주는 형태를 취한다.)
이때, 본 발명의 어구 생성 엔진은 상기 형태소 분석 엔진(analyser)를 통과한 n개의 실질 형태소/텀들을 입수 받고, 상기 입수 받은 n개의 텀들을 기설정된 방식으로 조합하여 조합된 텀들을 상기 문건 번호와 함께 검색 엔진(7000)의 상기 인덱서에 전송할 수 있다. (이때, 상기 문건 번호를 이미 상기 인덱스가 알고 있는 경우에는 굳이 문건 번호까지 전송할 필요가 없다. 이해의 편의상 전송되는 조합된 텀의 출처로서의 문건 번호를 포함하여 전송한다고 한다.) 이때, 상기 텀들을 조합하는 방법은 전술한 바과 같이, 1) 1개 문장 단위로 처리하여 1개 문장에서 입수되는 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법, 2) 전체 문건 단위에 포함된 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법(이 경우에는 텀의 조합이 굉장히 커서 처리 시간이 길어지는 문제가 있으나, 가장 정밀한 어구 집합을 생성할 수 있다.), 3) 하나의 문장에서 2~5개의 텀별로 순차적으로 조합하는 방법 중 어느 하나 이상을 사용할 수 있다. 물론, 상기 전체 문건 단위의 처리 방법에는 문단 단위, 특정 필드 단위(특허 청구 범위 등)의 처리 방식도 전술한 바와 같은 대응한 방식으로 취급될 수 있을 것이다.
예를 들어 설명하면 다음과 같다. 상기 본 발명의 어구 생성 엔진은 상기 출력된 실질 형태소를 입수 받아, 상기 실질 형태소 단위로 1~5개(바람직하게는 2~3개)의 실질 형태소 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 실질 형태소들을 형태소 별로 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 순차적으로 abc, bcd, cde, def, efg 라는 실질 형태소별 어구를 생성하거나 ab, ac, ad, ae, af, ag, bc, ... fg와 같은 2개의 실질 형태소 단위로 어구를 생성할 수 있다.(이에 대해서는 전술한 바와 같다). 이때, 상기 어구 생성 엔진은 상기 abc, bcd 나 ab, ac 등과 같은 어구(=복수 개의 텀들(multiple terms))를 상기 인덱서에 전송한다. 인덱서는 전송받은 어구(복수개의 텀들)들을 (abc, #1), (bcd, #1), (ab, #1), (ac, #1) 등과 같이 저장한다. 이때. 만약 필드들이 한정되는 경우라면, (CL : abc, #1), (CL : bcd, #1), (CL : ab, #1), (CL : ac, #1)과 같이 상기 어구(복수 개의 텀들)이 나온 구체적인 필드명까지 포함하여 인덱스(index)로 저장한다. 하기는 인덱스의 일 예를 보여 개념적인 테이블이다.
어구 문건 번호 필드
abc #1 D
abc #1 D
abc #1 D
abc #1 C
abc #1 C
bcd #1 D
bcd #1 C
ac #1 D
abc #2 D
abc #2 D
abc #2 C
D는 발명의 상세한 설명(description), C는 특허청구범위(claim)을 나타낸다.
상기 인덱스에서 어구 abc가 #1번 문건의 발명의 상세한 설명에서 3회가 나타났고, 특허 청구 범위에서 2회가 나타났으며, 상기 어구 bcd가 1번 문건의 발명의 상세한 설명에서 1회가 나타났고, 특허 청구 범위에서 1회가 나타났으며, 상기 어구 ac가 1번 문건의 발명의 상세한 설명에서 1회가 나타났음을 보여 주고 있다. 한편, 어구 abc가 #2번 문건의 발명의 상세한 설명에서 2회가 나타났고, 특허 청구 범위에서 1회가 나타났음을 보여 준다.
이때, 상기 본 발명의 어구별 카운팅 엔진은 상기 인덱스(index)의 데이터를 입수 받아, 상기 어구(복수개의 텀들)별의 개수 및 상기 어구가 나온 출처로서의 문건 번호에 관한 데이터를 생성한다. 상기 생성된 데이터는 전술한 방식으로 생성한 데이터와 동일하거나 대응한 것이며, 상기 인덱스를 대상으로 예를 들면 다음과 같을 수 있다.
어구 ID 어구 문건 번호 필드 출현회수
1 abc #1 D 3
2 abc #1 C 2
3 abc #2 D 2
4 abc #2 C 1
5 bcd #1 D 1
6 bcd #1 C 1
7 ac #1 D 1
상기와 같은 방법으로 본 발명의 대표 어구 추출 전처리 모듈(3700)은 검색 엔진(7000)의 인덱서 및 상기 인덱스를 활용하여 어구별 카운팅 데이터를 생성할 수 있으며, 상기 어구별 카운팅 데이터를 바탕으로 하여 전술한 바와 같은 방식으로 문건별, 기설정된 문건 집합별, 특정 필드별 내용, 또는 기설정된 문건 집합에서 추출된 모든 특정 필드별 내용에서 대표 어구를 추출할 수 있게 된다.
상기와 같은 대표 어구 정보 전처리 방법에 대해서는 도 55 내지 도 57에 잘 나타나 있다.
도 55를 기준으로 상기 대표 어구 추출 전처리 모듈(3700)을 통한 대표 어구 추출을 위한 실질 형태소를 조합을 생성하는 방법을 간략히 설명한다.
상기 대표 어구 추출 전처리 모듈(3700)은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5520), 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5530), 상기 추출된 실질 형태소에 대하여 기설정된 기준에 의한 2개 이상의 실질 형태소의 기설정된 방식으로의 가능한 모든 조합을 생성하며(S5540), 상기 생성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서에 전송하는(S5550) 방식으로 대표 어구 추출을 위한 실질 형태소를 조합을 생성한다.
도 56을 기준으로 상기 대표 어구 추출 전처리 모듈(3700)을 통한 필드별/부분 문건 집합별 대표 어구 추출을 위한 실질 형태소를 조합을 생성하고, 기설정된 조건을 충족하는 실질 형태소의 조합을 추출하는 방법을 간략히 설명한다.
상기 대표 어구 추출 전처리 모듈(3700)은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5620),
상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5630), 상기 추출된 실질 형태소에 대하여 기설정된 기준에 의한 2개 이상의 실질 형태소의 가능한 모든 조합을 생성하고(S5640), 상기 생성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서에 전송하며(S5650), 상기 문건 집합을 구성하는 각 문건의 서지 사항을 입수하여 적어도 하나 이상의 기준으로 문건 부분 집합을 생성하며(S5660), 상기 문건 부분 집합에 한정된 상기 실 질 형태소의 조합의 개수와 상기 문건 (전체) 집합에 속한 상기 실질 형태소의 조합의 개수를 입수하여, 문서 전체 또는 각종 필드별로 기설정된 조건을 충족하는 실질 형태소의 조합을 추출한다(S5670),
도 57을 기준으로 상기 대표 어구 추출 전처리 모듈(3700)을 통한 대표 어구 추출을 위한 실질 형태소를 조합을 생성하고, 각 문건 집합별로 비교하는 방법을 간략히 설명한다.
상기 대표 어구 추출 전처리 모듈(3700)은 적어도 2이상의 특허 문건을 포함하는 복수개의 문건 집합을 입수하고(S5720),
각 문건 집합별로 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5730), 상기 추출된 실질 형태소의 조합을 생성하고((S5740), 상기 생성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서에 전송하며(S5750), 상기 실질 형태소의 조합을 기설정된 기준으로 상기 복수개의 문건 집합별로 비교한다(S5760)
복수 특허 분류 기호 관계성 전처리 모듈(3900)
하나의 특허 문건에 2개 이상의 특허 분류 기호가 부여되어 있는 문건이 다수 있다. 이러한 경향은 1) 1특허 출원 범위의 확대, 2) 발명의 고도화, 3) 기술 융합화의 경향, 4) 특허 분류 기호 부여의 정밀화 등에 따라 하나의 특허 문건에 대하여 복수개의 특허 분류 기호가 부여되는 더욱 커지고 있다. 본 발명의 복수 특허 분류 기호 관계성 전처리 모듈(3900)은 복수개의 특허 분류 기호간에 숨어 있는 관계성을 발견하여 활용하는 것을 목적으로 한다. 상기 복수 특허 분류 기호 관계성 전처리 모듈(3900)은 IPC/UPC/FT 중의 어느 하나만을 기준으로 한(즉, 동일한 종류의 특허 분류 기호를 기준으로 한) 동종의 특허 분류 기호간의 숨어 있는 관계성을 발견하여, 기술의 융합에 대한 정보를 생성하는 것을 목적으로 하는 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)과, 하나의 문건에 IPC, UPC, FT 등 중에서 선택되는 2 이상의 특허 분류 기호가 포함되어 있을 때, 상기 2 이상의 특허 분류 기호간의 관계성을 파악하는 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)을 포함한다. 도 10은 상기 복수 특허 분류 기호 관계성 전처리 모듈(3900)의 구성, 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)의 구성 및 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)의 구성을 보여주고 있다.
동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)
이하, 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)에 대해서 설명한다. 어느 하나의 문건에 한 종류의 복수개의 특허 분류 기호가 부여되어 있거나, 2종 이상의 특허 분류 기호가 부여되어 있더라도, 선택된 하나의 특허 분류 기호 체계 상의 복수개의 특허 분류 기호들을 처리하는 것을 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)이 수행한다. 상기 복수개의 특허 분류 기호에 관한 처리를 담당하는 것은 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 엔진(3911)이 수행하며, 상기 수행의 결과는 본 발명의 동종 복수 특허 분류 기호 관계 DB(3913)에 저장된다.
이론적으로 먼저 설명하고, 이어 구체적인 실례를 들어서 설명한다. 먼저, 가장 단순한 모델로 하나의 문건에 2개의 특허 분류 기호가 포함된 경우에 대한 복수 개의 특허 분류 기호에 대한 관계성 처리 방법을 제시한다. 하나의 특허 문건에 특허 분류 기호 A1와 특허 분류 기호 B1이 부여되어 있다고 가정하자. 이때, 특허 분류 기호 체계 상에서 A1의 직상위 노드(부모 특허 분류 기호)가 A2, A2의 직상위 노드가 A3라고 하며, 이러한 규칙이 계속될 때, A1의 상위 노드는 A2, A3, A4,... An이 될 수 있다. 마찬가지로 B1에 대해서도, B2, B3, B4, ... Bn을 할당할 수 있게 된다. 이들 An, Bn들 중에서 가장 상위에 있는 것들은 섹션이 된다. 그리고, 섹션 위에는 그냥 IPC 등과 같은 특허 분류 기호 체계명이 있다고 하자. 이렇게 될 때, 상기 An들과 상기 Bn들은 적어도 섹션 또는 IPC라는 특허 분류 기호 체계명 하에서 적어도 하나 이상의 공통 노드를 가지게 된다.(섹션이 다른 등 가장 멀리 떨어져 있어도, IPC라는 동일 분류 기호 체계를 공유한다는 점에서는 일치한다.) 상기 공통 노드 중 상기 특허 분류 기호 체계 상에서 최하위 레벨에 있는 것을 최하위 공통 특허 분류 기호라 명명한다. 이때, A1과 B1의 최하위 공통 특허 분류 기호가 각각 Ai+1와 Bj+1라 하면, Ai+1 = Bj+1가 된다. 상기 주어진 하나의 특허 문건의 내용 상 A1과 B1이 함께 있는 경우, 상기 A1과 B1은 상기 특허 문건에 대하여 관계성을 가진다.(즉, 하나의 특허 문건에 나와 있는 발명 또는 발명들이 A1 및 B1의 속성을 독자적으로 또는 전체적으로 함께 갖고 있다는 뜻으로서의 관계성을 말한다.) 이때, 특허 분류 기호 체계의 본질 상 A1은 상기 B1의 모든 부모 노드인 B2, B3,... Bj+)와 관계성을 가진다. 마찬가지로, B1은 A1의 모든 부모 노드인 A2, A3, ... A(i+1)와 관계성을 가진다. 이때, A1과 Bj+1의 관계성은 Bj+1와 Ai+1가 동 일하므로, 어짜피 부모 노드이므로, 그 관계성을 논할 필요가 없으며, 모든 A들과 Bj+1(=Ai+1)들의 관계성도 어짜피 부모 노드에 존재하는 것들이므로 별도로 논할 필요가 없다. 즉, 최하위 공통 부모 노드는 관계성 계산 테이블에서 고려하지 않는 것이 바람직할 것이다.
이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 복수개의 특허 문건 기호를 처리할 때, 상기 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 하기와 같은 데이터를 만들 수 있다. 이때, Ai+1과 Bj+1은 실제 테이블에서는 필요치 않는 셀들(Ai까지와 Bj까지만이 관계성 테이블에 필요함)이나, 설명의 편의(그 셀들에는 값이 없음을 보여 주기 위함)를 위해서 테이블에 표시한다. 즉, 실제 표에서는 Ai, Bj까지만으로 테이블이 구성된다.
A1 A2 Ai Ai+1
B1 1 1 1 1
B2 1 1 1 1
1 1 1 1
Bj 1 1 1 1
Bj+1=Ai+1
즉, 상기 A1 ~ Ai와 B1 ~ Bj사이의 모든 교차되는 쌍(예를 들면 (A1, B1), ... (Ai, Bj) 등)은 상기 주어진 특허 문건을 매개로 하여 관련성 가진다고 할 수 있다.
대한민국 특허출원 제10-2005-0111868호에는 2006년 01월자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 예시적으로 설명한다. H04B 7/26의 부모는 차례로 H04B 7/24, H04B 7/00, H04B, H04, H가 된다. H04B 7/15의 부모는 차례로, H04B 7/14, H04B 7/00이 된다. 이 경우, 최하위 공통 특허 분류 기호는 H04B 7/00이 된다. 그러므로, 이를 표로 만들면 하기와 같다. H04B 7/00과 관련된 셀이 그 셀값이 아무 값도 없음은 위에서 설명한 바와 같다.
H04B 7/26 H04B 7/24 H04B 7/00
H04B 7/15 1 1
H04B 7/14 1 1
H04B 7/00
그러므로, 대한민국 특허출원 제10-2005-0111868호를 기준으로, 9개의 교차되는 특허 분류 기호의 관련성 쌍이 생성되게 된다. 이때, 하나의 문건에 대하여 2 이상의 특허 분류 기호가 존재할 때, 맨 앞에 나오는 것을 주 특허 분류 기호라 하므로, 본 문건에서는 H04B 726이 주 특허 분류 기호가 되고, 상기 주 특허 분류 기호의 부모 노드에 있는 다른 상위 특허 분류 기호도 주어진 특허 문건에서 역시 주 특허 분류 기호로 취급된다. 상기 주 특허 분류 기호가 문제가 되는 것은 하나의 문건에 특허 분류 기호가 3개 이상 있을 때의 취급과 관련하여 중요한 역할을 한다. 특허 분류 기호가 3개 이상 있을 때는 아래와 같이 특허 분류 기호를 처리할 수 있다.
먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되는 쌍에 관한 정보를 갖고 있다.
다음으로, 주 특허 분류 기호를 정하고, 상기 주 특허 분류 기호를 취하고, 다른 1개는 n-1개의 부 특허 분류 기호에서 취하여 n-1개의 조합을 취한 다음에 각 조합에 대하여 n-1개의 테이블을 얻고, 각 테이블에는 먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되는 쌍에 관한 정보를 갖고 있다. 이때, 주 특허 분류 기호와 관련되는 교차 쌍에 대해서는 주 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다. 그리고, n-1개의 부 특허 분류 기호에 대하여 n-1C2개의 조합을 얻고, 각 조합에 대하여 상기와 같은 처리를 하여 모든 교차되는 쌍에 관한 정보를 얻는다. 이때, 부 특허 분류 기호와 관련되는 교차 쌍에 대해서는 부 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다.
대한민국 특허출원 제10-2006-0012606호에는 2006년 01월자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호가 있다. 상기 H04B 7/04의 부모 노드는 각각 H04B 7/02, H04B 7/00, H04B, H04, H가 있으며, H04B 7/155의 부모 노드는 각각 H04B 7/15, H04B 7/14, H04B 7/00, H04B, H04, H가 있으며, H04Q 7/30의 부모 노드는 각각 H04Q 7/20, H04Q 7/00, H04Q, H04, H가 있다. 이때, 최하위 공통 특허 분류 기호는 H04B 7/04와 H04B 7/155의 조합에 대한 H04B 7/00이며, H04B 7/155와 H04Q 7/30의 조합에 대해서는 H04이며, H04B 7/04와 H04Q 7/30에 대해서는 H04가 된다.
이때, 모든 특허 분류 기호에 대해 동등하게 취급하면, 아래와 같은 3C2 개수의 테이블이 나온다. 먼저 H04B 7/04와 H04B 7/155의 관계성 테이블이다.
H04B 7/04 H04B 7/02 H04B 7/00
H04B 7/155 1 1
H04B 7/15 1 1
H04B 7/14 1 1
H04B 7/00
다음으로 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.
H04B 7/04 H04B 7/02 H04B 7/00 H04B H04
H04Q 7/30 1 1 1 1
H04Q 7/20 1 1 1 1
H04Q 7/00 1 1 1 1
H04Q 1 1 1 1
H04
다음으로, H04B 7/155와 H04Q 7/30의 관계성 테이블이다.
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 1 1 1 1 1
H04Q 7/20 1 1 1 1 1
H04Q 7/00 1 1 1 1 1
H04Q 1 1 1 1 1
H04
이때, 이어 가중치를 부여하는 방법에 대해서 설명한다. 가중치의 부여는 크게 2가지가 있다. 첫번째가 위에서 설명한 주 특허 분류 기호와의 관련성 테이블에 더 큰 가중치를 부여하고, 부 특허 분류 기호들 간의 관련성 테이블에 더 적은 가중치를 부여하는 방법이 있다. 예를 들면 주 특허 분류 기호와의 관련성 테이블에는 1을 부여하고, 부 특허 분류 기호와의 관련성 테이블에는 0.5를 부여하는 방법이 있을 것이다.
이렇게 되면 다음으로, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음과 같이 될 것이다.
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 0.5 0.5 0.5 0.5 0.5
H04Q 7/20 0.5 0.5 0.5 0.5 0.5
H04Q 7/00 0.5 0.5 0.5 0.5 0.5
H04Q 0.5 0.5 0.5 0.5 0.5
H04
두번째는, 복수개의 특허 분류 기호를 가지고 있는 특허 문건에 대한 가중치를 균등하게 부여하는 방법이 있을 것이다. 예를 들면 2개의 특허 분류 기호를 가지고 있을 때는 각 특허 분류 기호의 관련성 쌍의 값이 1이 된다고 할 때, n개의 특허 분류 기호를 가지고 있는 특허 분류 기호의 쌍에 대해서는 그 관련성의 쌍의 값을 가능한 조합의 개수인 nC2를 나눈 값을 균등하게 할당할 수도 있다. 즉, 가중치를 1/(nC2)로 할 수도 있을 것이다. 예를 들면, 이와 같이 할 때, 상기, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음과 같은 것이다.
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 1/3 1/3 1/3 1/3 1/3
H04Q 7/20 1/3 1/3 1/3 1/3 1/3
H04Q 7/00 1/3 1/3 1/3 1/3 1/3
H04Q 1/3 1/3 1/3 1/3 1/3
H04
세번째는 3개 이상의 특허 분류 기호를 가지는 문건에 대하여 주 특허 분류 기호와 관련된 쌍과, 부 특허 분류 기호와 관련된 쌍에 다른 가중치를 부여하는 방법이 있을 것이다. 예를 들어 n개의 특허 분류 기호가 있을 때, 주 분류와 관계되는 조합의 개수는 (n-1)이 되므로, 주 분류 기호와의 관련된 조합에 전체의 75를 할당하고, 이들과 관련된 관련 쌍에는 0.75*1/(n-1)의 가중치를 부여할 수 있다. 부 특허 분류 기호들와 관련되는 모든 조합에 25의 가중치를 부여할 때, 부 특허 분류 기호들과 관련되는 모든 쌍에는 0.25*1/((n-1)C2)의 가중치를 부여할 수 있을 것이다. 이때, 상기 의 배분은 기설정된 값으로 조절할 수 있을 것이다. 예를 들면 n> 5일 때, 주 특허 분류 기호와 관련된 것들에 50를, 부 특허 분류 기호와 관련된 것들에 50를 배당할 수 있을 것이며, n= 4일때는 60 대 40를, n=3일 때는 75 대 25를 할당할 수 있을 것이다. 즉, IPC 의 개수가 3보다 클 때에는 (sub IPC, Sub IPC) 특허 분류 기호 조합 쌍이 생기므로, (main IPC, Sub IPC) 특허 분류 기호 조합 쌍과 (Sub IPC, Sub IPC) 특허 분류 기호 조합 쌍에 대해 다른 가중치를 줄 수 있을 것이다.
n=3일 때는 75 대 25를 할당하면 다음과 같은 테이블이 생성될 수 있다. 먼저 H04B 7/04와 H04B 7/155의 관계성 테이블이다.
H04B 7/04 H04B 7/02 H04B 7/00
H04B 7/155 0.75/2 0.75/2
H04B 7/15 0.75/2 0.75/2
H04B 7/14 0.75/2 0.75/2
H04Q 7/00
다음으로 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.
H04B 7/04 H04B 7/02 H04B 7/00 H04B H04
H04Q 7/30 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 7/20 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 7/00 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 0.75/2 0.75/2 0.75/2 0.75/2
H04
다음으로, H04B 7/155와 H04Q 7/30의 관계성 테이블이다.
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 7/20 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 7/00 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04
한편, 복수개의 특허 분류 기호를 가지는 개별 문건의 기여도를 문건 단위로 동일(가령 1)이라고 했을 때, 다음과 같은 가중치 부여 방법을 생각할 수 있다. 극단적인 예로써, 대한민국 특허 출원 제 10-2005-0042032호 문건에 H04B 7/02 및 H04B 7/14와 같이 2개의 특허 분류 기호가 나와 있고, 이들이 next sibling 관계일 때(즉, H04B 7/02 및 H04B 7/14 부모 노드가 H04B 7/00으로 동일하며, 그 부모 노드가 직상위 특허 분류 기호이다) 상기 H04B 7/02 및 H04B 7/14의 관계성 테이블은 오직 1개가 나오며, 그 테이블의 셀(cell) 또한 1개이다. 상기 대한민국 특허 출원 제 10-2005-0042032호 문건에 대한 테이블은 하기와 같다.
H04B 7/02 H04B 7/00
H04B 7/14 1
H04B 7/00
이때, 상기 특정한 특허 문건에 대해서 H04B 7/02 및 H04B 7/14는 강력하게 관계되어 있다고 볼 수 있다. 한편, 상기 대한민국 특허출원 제10-2006-0012606호를 기준으로 했을 경우, 3개의 테이블에, 각 테이블마다 6개, 16개 및 20개의 셀을 가지게 된다. 이때, 상기 (H04B 7/02, H04B 7/14)라는 하나의 특허 분류 기호 조합을 기준으로 할 때, 대한민국 특허 출원 제 10-2005-0042032호 문건의 기여도와 상 기 대한민국 특허출원 제10-2006-0012606호의 기여도를 어떻게 평가할 것인가의 문제가 발생한다. 상기 기여도의 가중치 처리는 다음과 같은 방법이 있을 것이다.
첫째, 관계성의 존재 내지는 발생을 기준으로 테이블이나 상기 테이블에서 발생하는 셀의 개수에 무관하게 어느 문건에서나 특정 특허 분류 기호의 조합 (Ai, Bj)(예를 들면, 상기 (H04B 7/02, H04B 7/14))를 동일한 값의 기여도 가중치(예를 들면 1)로 처리할 수 있다.
둘째, 상기 테이블의 개수 및 셀의 개수를 고려하여, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 각 특허 문건의 기여도 가중치를 다르게 하여 부여할 수 있을 것이다. 이때, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 기여도 가중치를 각 특허 문건에서 발생하는 모든 테이블에 존재하는 모든 셀의 총수로 나눈 것으로 할 수 있다. 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6+16+20)(=3개의 테이블에 있는 모든 셀의 수)가 된다.
셋째, 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 나눈 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6)(=3개의 테이블에 있는 모든 셀의 수)가 된다
넷째, 상기 둘째 또는 셋째의 기여도 가중치를 역으로 계산하는 방법이 있다. 즉, 상기 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 곱한 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 6(=3개의 테이블에 있는 모든 셀의 수)이 된다. 이러한 기여도 가중치 부여 방법은 이종 기술의 융합도를 계산하는데 더욱 유망할 것이다. 즉, 테이블에 존재하는 셀의 숫자가 적은 경우에는 그 기술은 기술 분류 체계 자체에서 연관성이 강한 기술로 묶어 놓은 것일 수 있기 때문에, 하나의 테이블에서 테이블의 크기가 클수록 그 기술은 기술 분류 체계 상 멀리 떨어져 있는 기술이기 때문이다.
상기와 같은 방법으로 특허 분류 기호 조합 (Ai, Bj)에 대하여 다음과 같은 정보를 획득할 수 있을 것이다.
첫째, (H04B 7/02, H04B 7/14) (Ai, Bj)에 대한 카운팅 정보이다. 상기 카운팅 시 본 발명에서 언급하거나, 본 발명 사상에 부합하는 가중치를 부여할 경우, 상기 특허 분류 기호 조합 (Ai, Bj)에 대하여 적어도 하나 이상의 가중치가 적용된 가중치별 카운팅 정보를 획득할 수 있을 것이다.
둘째, 모든 특허 분류 기호 조합은 그 조합이 생성될 때, 그 조합이 어느 문건에 의해서 생성되었는지에 대한 정보가 저장되어 있다. 즉, 상기 (H04B 7/02, H04B 7/14)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 문건에 의해서 생성된 것이며, (H04B 7/15, H04B 7/24)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2005-0111868호라는 문건에 의해서 생성된 것이다. 그러므로, 특허 분류 기호 조합 (Ai, Bj)에 대해 문건 고유 번호가 대응되며, 상기 문건 고유 번호에는 그 문건 고유 번호를 가지는 문건에 대한 모든 서지 사항을 포함한 그 문건에 대한 모든 정보가 대응될 수 있다. 상기 모든 테이블에는 관련된 2개의 특허 분류 기호 조합이 존재하며, 그 특허 분류 기호 조합들이 나온 특허 문건이 대응되며, 상기 특허 문건에는 그 특허 문건의 서지 사항이 대응될 수 있다. 즉, 상기 H04B 7/155와 H04Q 7/30의 관계성 테이블에 존재하는 모든 특허 분류 기호 조합 (Ai, Bj)에 대하여, 문건 고유 번호로 대한민국 특허출원 제10-2005-0111868호가 대응된다. 그리고, 상기 문건 고유 번호에 대응되는 문건의 서지 사항 등에서 상기 문건에 대하여 출원번호는 10-2006-0012606이며, 출원인은 삼성전자이며, 발명자는 최도인과 황성택이며, 출원일은 2006년02월09일인 것과 같이 서지 사항 및 상기 문건 고유 번호에 해당하는 문건에 관한 모든 정보를 대응시킬 수 있게 된다. 물론, 상기 문건 고유 번호는 출원 번호일 수 있으며, 본 특허 출원이 미국 등에 출원되었다면 그 미국 출원의 서지 사항에도 상기 수행된 결과값을 대응(매핑)해 놓을 수 있을 것이다.
상기와 같은 특허 분류 기호 조합 (Ai, Bj)과 문건 번호의 대응은 상기 특허 분류 기호 조합 (Ai, Bj)의 생성 시에 상기 카운팅 값과 함께 DB에 저장되는 것이 바람직할 것이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 입수되는 특허 문건에 대하여 특허 분류 기호가 2개 이상일 경우, 각 특허 분류 기호의 조합에 대하여 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 가 특허 분류 기호의 조합별로 기설정된 개수의 테이블을 만든다. 이때, 각 테이블에 들어가는 수치값은 기설정된 기준에 의한 가중치를 반영한 값일 수 있다. 이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 각 테이블에서 추출된 특허 분류 기호의 조합 (Ai, Bj)에 대하여 기설정된 기여도 가중치값을 적용하여 특허 분류 기호의 조합 (Ai, Bj)별 하기 테이블 등과 같은 특허 분류 기호의 조합 (Ai, Bj)별 관계성 결과 데이터를 생성할 수 있다.
본 모델을 설명하기 위하여 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개만이 있다고 가정하자.(물론, 입수 되는 모든 문건에 대해서 반복적으로 처리하면 모든 문건 집합을 기준으로 한 모든 특허 분류 기호 조합 (Ai, Bj)에 대한 하기와 같은 데이터의 생성이 가능할 것이다.) 이때, 특허 분류 기호 조합 (Ai, Bj)에 다음과 같은 테이블의 생성이 가능할 것이다.
특허 분류 기호 조합 (Ai, Bj) 문건 번호 Frequency
(단순빈도)
1/nC2 균등할당 (M,S), (S,S) 차등할당
(H04B 7/15 ,H04B 7/26) 10-2005-0111868 1 1 1
(H04B 7/15,H04B 7/24) 10-2005-0111868 1 1 1
(H04B 7/14,H04B 7/26) 10-2005-0111868 1 1 1
(H04B 7/14,H04B 7/24) 10-2005-0111868 1 1 1
(H04B 7/155,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/155,H04B 7/02) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/15,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/15,H04B 7/02) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/14,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2006-0012606 2 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2005-0042032 2 1 1
1 1/3 ..
1 1/3 ..
(H04Q 7/00, H04B 7/00) 10-2006-0012606 1 1/3 0.25/1
(H04Q 7/00, H04B) 10-2006-0012606 1 1/3 0.25/1
(H04Q,H04B) 10-2006-0012606 1 1/3 0.25/1
(n은 특허분류 기호 수), (M,S)는 (main IPC, Sub IPC)를 (S,S)는 (sub IPC, Sub IPC) 를 말하며, n>2 이상일 경우, (M,S), (S,S) 차등할당은 (M,S)에 대해서는 75/(n-1)의 가중치를, (S,S)에 대해서는 25/(n-1)C2의 가중치를 부여하였다. n=2일때는 그냥 1을 부여하였다.
이때, 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍에 주목하면, 문건 번호가 2개가 대응되어 있음을 알 수 있다. 즉, 상기 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍은 2개의 문건에서 동시에 출현했음을 의미하며, Frequency(단순 빈도)의 값은 2가 된다. 1/nC2 균등할당과 (M,S), (S,S) 차등할당 등 기설정된 방식의 가중치 또는 기여도 가중치를 부여할 수 있을 것이다.
상기 표는 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개 에 대해서 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성한 것이다. 상기 방식을 입수되는 모든 문건에 대하여 반복적 또는 재귀적으로 적용할 수 있음은 당업자에게 자명할 것이며, 상기 기설정된 가중치 또는 기여도 가중치 중 어느 하나 이상을 기준으로, 각 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성할 수 있음도 자명할 것이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)이 복수 개의 특허 분류 기호를 처리하는 방법은 IPC에 한정되지 않음은 당연하다 할 것이다. 즉, 상기 IPC에서 수행된 것과 완전히 동일하게 미국 특허 문건에 대해서는 USPC를, 일본 특허 문건에 대해서는 FT와 FI, ECLA를 대상으로 하여 복수 개의 특허 분류 기호를 처리할 수 있을 것이다.
이때, 상기 특허 분류 기호의 조합 (Ai, Bj)에 대하여 다음과 같은 정보들을 계산, 입수 또는 추출할 수 있을 것이다.
첫째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 각 특허 분류 기호 쌍의 출현 회수를 입수할 수 있다. 예를 들면, (H04B 7/26, H04B 7/15)는 대한민국 특허출원 제10-2005-0111868호에 1회 출현한 반면, H04B 7/14,H04B 7/02)는 10-2006-0012606와 10-2005-0042032양 특허 공보에 모두 출현하였다. (주 특허 분류 기호가 아닐 시 또는 모든 특허 분류 기호를 동등하게 취급할 경우에는 (Ai, Bj) = (Bj, Ai)로 취급될 수 있다. 어느 하나가 주특허 분류 기호이면 (Ai, Bj)와 (Bj, Ai)를 다르게 취급할 수도 있으며, 동일하게 취급할 수도 있을 것이다. ) 그러므로, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 모든 특허 분류의 쌍에 대하여 그 쌍이 나온 회수를 기록하여 놓을 수 있다. 또한, 상기 쌍이 나온 특허 문건들에 대한 특허 문건 번호를 저장해 놓을 수 있을 것이다.
둘째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 특정 특허 분류 기호가 주어질 때, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 이는 상기 주어진 특정 특허 분류 기호가 들어가는 모든 쌍과, 그 쌍이 나온 회수를 카운팅함으로써 용이하게 획득할 수 있을 것이다. 이때, 기설정된 가중치 또는 기여도 가중치를 적용하여, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 아울러, 상기 특허 분류 기호 체계(트리 구조)를 참조하여, 기설정된 레벨 단위에서 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 즉, 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 상기 IPC sub class, IPC main group, 또는 IPC subgroup 수준에서 상기 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다.
셋째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 특허 분류 기호 쌍과 상기 특허 문건 번호의 대응 관계를 통하여, 상기 특허 분류 기호 쌍과 상기 특허 문건 번호에 대응되는 서지 사항을 대응시켜 다양한 분석 결과를 생성할 수 있다. 상기 분석 결과에는 상기 특허 분류 기호 쌍과 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합과의 분석 결과를 획득할 수 있을 것이다. 예를 들면, 삼성전자의 대한민국 특허출 원 2000년도부터의 2005년도까지에서 가장 많이 결합된 특허 분류 기호 쌍을 알 수 있을 것이다. 나아가, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 아울러, 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 상기 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합으로 이루어지는 문건 집합에서도 찾을 수 있을 것이다. 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 H04B 7/26와 가장 다수가 결합하는 특허 분류 기호 체계 상에서의 각 단계별 특허 분류 기호를 찾을 수 있을 것이며, H04B 7/26에 대하여 삼성전자 주식회사의 미국 특허출원 2003년도부터의 2005년도까지에서도 찾을 수 있을 것이다. 이를 통해, 상기 특정 기간 동안의 특정 주체에 대한 특허 명세서에 나타난 기술 융합의 정도를 파악할 수 있을 것이다.
넷째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 주어진 임의의 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 특허 분류 기호의 조합 (Ai, Bj)에 관계된 특별한 특허 문건 집합을 대응시킬 수 있을 것이다. 이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)이 상기 대응되는 특허 문건 집합에 대한 각종 분석을 수행하면, 상기 수행된 분석 결과는 상기 특허 분류 기호의 조합 (Ai, Bj)에 대한 분석 결과가 된다. 상기 특별한 특허 문건 집합에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 11) 상기 1) 내지 9)에 등록 여부, 심사청구 여부 등과 특정 조건을 결부하는 것으로 생성되는 특허 문건 집합에 대하여 사전에 계산해 놓을 수 있을 것이다. 물론, 사용자가 특정하거나 생성한 문건 집합에 대해서도 상기와 같은 계산을 수행해 놓을 수 있을 것이다.
또한, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 상기 1) 내지 상기 11)로 특정되는 어느 하나 이상의 문건 집합에 대하여, 상기 문건 집합을 구성하는 특허 문건 중에서, 특허 분류 기호가 2 이상이 부여되어 있는 문건들 만을 추출해서, 그 추출된 문건 집합을 대상으로만, 상기 특허 분류 기호의 조합 (Ai, Bj)을 입수할 수 있다. 상기 입수된 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 표와 같은 관계성 데이터를 생성하고, 상기 생성된 관계성 데이터를 정렬 또는 분석(빈도, 최빈값, 최대값, 최소값, 연도별 개수, 출원인, 발명자 등의 주체별 개수 등의 분석이 그 예가 된다.)한다. 상기와 같은 분석을 마치면, 상기 1) 내지 11)로 특정되는 어느 하나 이상의 문건 집합 또는 상기 추출된 문건 집합 대상별로의 상기 특허 분류 기호의 조합 (Ai, Bj)의 관점에서 파악되는 기술 융합에 관한 정보를 획득할 수 있게 된다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)이 수행하는 상기와 같은 반복 수행 방법은 본 수행의 결과로 생성되는 값을 찾기 위한 일실시예에 불과할 것이며, 당업자라면 전산 기술을 이용하여 본 발명 사상에 대한 다양한 계산 방법을 시도할 수 있을 것이다. 상기 특허 분류 기호가 2 이상 부여된 모든 특허 문건의 모든 특허 분류 기호에 대하여 상기 수행된 결과(예를 들면 각 특허 분류 기호 쌍에 대한 값(가중치 부여 또는 미부여 등을 포괄한다)을 가지는 테이블 등)는 DB로 저장되거나, 실시간으로 생성되는 뷰(view) 내지는 물리적인 뷰(materialized view)로 제공될 수 있음은 당연할 것이다.
상기와 같은 과정을 실시하는 일 실시예적 과정을 도 53에서 보여주고 있다. 이하, 도 53을 기준으로 설명한다. 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 적어도 하나의 특허 문건을 포함하는 문건 집합을 입수하며(S5320), 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5330), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5340), 상기 조합별로 상기 조합에 포함된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노드에 관한 정보를 입수하며(S5350), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5360), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하며(S5370), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하며(S5380), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성한다(S5390)
이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)을 통해서 적어도 2 이상의 문건 집합에 대하여 복수개의 특허 분류 기호를 전처리하여 비교하는 방법에 대해서 도 54를 기준으로 설명한다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 적어도 하나의 특허 문건을 포함하는 문건 집합을 2 이상 입수하며(S5410), 상기 각 문건 집합별로 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5430), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5440), 상기 조합별로 상기 조합에 포함된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노 드에 관한 정보를 입수하고(S5450), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5460), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하고(S5470), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하고(S5480), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성하고(S5490), 상기 통계값, 파라미터 또는 계산값을 상기 문건 집합별로 비교한다(S5495).
도 65내지 도 67에는 복수 특허 분류 기호 분석 방법에 대한 예시적인 실시예를 보여주고 있다.
도 65는 특허 분류 기호를 입수 받고, 상기 입수 받은 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들에 대한 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 적어도 하나 이상의 특허 분류 기호를 입수받고(S6520), 입수된 특허 분류 기호에 대한 최빈 융합 특허 분류 기호 정보를 입수하여(S6530), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6540).
도 66는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 최빈 특허 분류 기호를 추출하고, 상기 추출된 특허 분류 기호를 기준으로 최빈 융합 특허 분 류 기호들에 대한 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 적어도 하나 이상의 문건 집합을 입수받고(S6620), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하고(S6630), 개별 문건별로 입수된 특허 분류 기호를 문건 집합 수준에서 최빈값을 기준으로 랭킹을 부여하고(S6640), 랭킹이 부여된 개별 특허 분류 기호별로 최빈 융합 특허 분류 기호 정보를 입수하고(S6650), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6660).
도 67는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 개별 문건 단위에서 추출한 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들을 추출하고, 추출된 최빈 융합 특허 분류 기호들을 통합하는 방식으로 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 적어도 하나 이상의 문건 집합을 입수받고(S670), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하며(S670), 개별 문건별로 입수된 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호 정보를 입수하고(S670), 개별 문건별로 입수된 최빈 융합 특허 분류 기호 정보를 통합하며(S670), 통합된 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 통합된 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어 도 하나 이상의 분석을 수행한다(S670).
이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)
상기 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 동종의 특허 분류 기호에 대한 처리를 설명하였다. 이어서, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)에 대해서 설명한다. 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)은 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)의 작동 방식과 완전히 유사하다. 미국에서 발행되는 특허 문건에는 하나의 특허 문건에 IPC와 USPC가 동시에 결합되어 있는 것이 거의 전부이며, 일본에서 발행되는 특허 문건에도 IPC와 FT가 동시에 부여되어 있다. 하나의 특허 문건에 IPC1, IPCn이, USPC1,...USPCm 부여되어 있다고 가정하자.
이 경우, 이종 복수 특허 분류 기호 관계성 처리의 관점에서는 상기 IPC1,...IPCn과 USPC1,... USPCm사이에는 4가지 종류의 관계성의 조합이 생긴다. 먼저 IPC1과 USPC1의 관계로, 이들은 각각 main IPC와 main USPC의 쌍이 된다. 그리고, IPC1와 USPC2, ...USPCm의 쌍으로 이는 main IPC와 sub USPC와의 쌍이 된다. 그리고, IPC2,IPCn와, USPC1의 쌍으로, 이는 sub IPC와 main USPC의 쌍이 된다. 그리고, IPC1, IPC2,...IPCn각각과 USPC2,...USPCm각각에 대한 쌍으로, 이는 sub IPC와 sub USPC의 쌍이 된다.
상기 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)은 각 4가지 종류별로, 각 종류 하에 있는 이종 복수 특허 분류 기호들 간에서 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)이 수행한 바와 동일한 처리를 할 수 있다. 이 때, 이종 특허 분류 기호를 대상으로 하므로, 상기 최소 공통 특허 분류 기호는 없기 때문에 기설정된 값으로 한정할 수 있다. 즉, IPC의 경우에는 subclass에서, USPC에서는 class까지만을 대상으로 하여, 주어진 IPC와 주어진 USPC 쌍에 대하여 상위 특허 분류 기호를 한정지을 수 있다. 즉, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)은 주어진 특허 분류 기호 조합(Ai, Bj)(단, Ai, Bj는 동일한 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성한 바와 같이, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈(3930)은 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성할 수 있다. 상기 생성된 관계성 테이블에 대하여 가중치 또는 기여도 가중치를 부여할 수 있을 것이다. 또한, 각 이종 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여, 특허 문건 번호를 대응시킬 수 있음과, 상기 특허 문건 번호로부터 입수되는 서지사항을 반영한 카운팅 및 계산을 수행할 수 있음도 자명할 것이다. 아울러, 특정한 문건 집합에 대하여, 이종 특허 분류 기호 조합(Ai, Bj)를 획득할 수 있을 것이며, 이들 조합에 대한 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈(3910)과 동등한 분석을 수행할 수 있을 것이다.
특허 분류 기호별 통계 전처리 모듈(3200) = 특분통전
특허 분류 기호의 다단계성
본 발명의 특허 분류 기호별 통계 전처리 모듈(3200)은 적어도 하나 이상의 특허 분류 기호 체계 상의 특허 분류 기호에 대하여, 적어도 하나 이상의 국가별 특허 DB를 대상으로 기설정된 통계값을 찾아내는 전처리를 수행한다.
도 11은 상기 특분통전의 구조에 대해서 설명하고 있다. 상기 특분통전은 특허 분류 기호별로 통계값을 전처리하는 특허 분류 기호별 통계 전처리 엔진(3210)과 상기 전처리된 특허 분류 기호별 통계값을 저장하고 있는 뷰(view), 테이블(table) 또는 정보 조직체로서의 전처리된 특허 분류 기호별 통계 DB(3230)를 포함하고 있다.
상기 특분통전에서 취급하는 특허 분류 기호는 IPC, USPC, FT, FI, ECLA 중 어느 하나 이상이다. 상기 특분통전에서 국가별 특허 DB는 대한민국, 미국, 일본, 유럽(EPO)가 발행하는 특허 DB를 포함하며, 그 이외의 국가의 특허청이 발행하는 특허 DB도 포함될 수 있음은 자명하다. 각 국가는 IPC를 공통으로 하고, 자국별로 특별한 분류 체계(미국 특허청의 경우 USPC 또는 UPC, 일본 특허청의 경우 FT, FI, 유럽 특허청의 경우 ECLA 등)를 가지고 있는 경우도 있다. 2이상의 특허 분류 체계를 가지고 있는 국가의 특허 DB를 대상으로 한 기설정된 통계값을 찾아내는 것은 상기 2이상의 분류 체계별로 독립적으로 수행되는 것이 바람직하다. 즉, 미국의 경우라면, IPC 와 USPC에 대해서 각각 전처리를 할 필요가 있게 된다. 또한, 각 특허 분류 기호 체계에는 각 체계 마다의 레벨이 있다. IPC의 경우에는 section, subsection, class, subclass, group, subgroup이 있으며, subgroup이하의 세부 분류에는 그 특허 분류 기호에 대응되는 타이틀 정보에 도트(dot)의 수로써 계층 구조를 표현하고 있다. 상기 계층 구조에 대한 예시는 특허 분류 기호 전처리 모듈(3500)에 상세히 설명되어 있다. 그러므로, 본 발명에서의 특허 분류 기호의 레 벨은 IPC section, class, subclass, main group, 1dot subgroup, 2 dot subgroup, ...n dot subgroup으로 레벨별로 구분될 수 있다. 상기 레벨은 상기 main group까지는 분류 기호 체계에서 상하위 계층 구조를 확인할 수 있으나, subgroup부터는 타이틀에 포함된 dot 정보를 활용해야만 상하위 계층 구조를 확인할 수 있다. 상기와 같은 dot의 수로써 계층 구조를 확인하는 것은 USPC의 경우 subclass부터이며, FT의 경우 전체 FT 기호에서 전7자리("테마코드 + 영문자 2자")이후부터이다.
상기 특분통전이 특허 분류 기호별로 통계값을 전처리하는 방법의 일례는 도 50에 나와있다. 상기 특분통전은 제1국에서의 특정 특허 분류 기호 체계에 대하여, 주어지는 특허 분류 기호의 하위 분류 기호가 자동으로 포함될 수 있도록 특허 분류 기호의 트리 구조를 이용하여 특허 분류 기호를 재조정하여 DB에 저장하며(S5020), 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 입수하며(S5030), 검색식 또는 검색 쿼리에 포함된 주어진 특허 분류 기호에 대하여 재조정된 특허 분류 기호로 변환하며(S5040), 재조정된 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 대상으로 검색 엔진(7000) 또는 DBMS(2100)로 검색을 수행하며(S5050), 상기 검색 결과로서 특허 문건 정보를 입수하여 계량화 하며(S5060), 상기 검색 결과에 대하여 기설정된 시간 단위 또는 통합된 시간 단위로, 출원인, 발명자, 또는 대리인 등 주체에 대하여 기설정된 통계값, 파라미터 또는 계산값을 기준으로 랭킹 정보를 계산하는 기능을 수행한다.
또한 상기 특분통전은 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호 를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 51에 나타나 있다.
상기 특분통전은 특허 분류 기호가 포함된 검색식을 입수하고(S5120), 상기 검색식에 포함된 특허 분류 기호에 대하여 하위 특허 분류 기호에 관한 특허 정보를 포함하여 관계되는 특허 문건 정보를 입수하며(S5130), 상기 특허 문건에 포함된 인용 정보 및 피인용 정보를 기설정된 통계값, 파라미터 내지 계산값를 처리한다(S5140).
아울러, 상기 특분통전은 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 52에 나타나 있다.
상기 특분통전은 적어도 하나의 문건 집합을 입수하고(S5220), 상기 문건 집합에 포함된 모든 문건에 대하여 출원인, 발명자, 대리인, 적어도 하나 이상의 특허 기술 분류 기호를 추출하며(S5230), 상기 문건에 대하여 상기 추출된 기준 중 어느 하나 이상을 적용하여 문건 부분 집합을 생성하고(S5240), 상시 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건이 인용하는 선출원 문건 정보를 입수하거나(S5250), 상기 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건을 인용하는 후출원 문건 정보를 입수하며(S5260), 상기 입수된 선출원 문건 및/또는 상기 입수된 후출원 문건에 대하여 기설정된 인용, 피인용 관련 통계값, 파라미 터 또는 계산값을 생성할 수 있다(S5270)
이하, 본 발명의 특분통전을 특허 분류 기호별 통계 전처리 엔진(3210)의 관점에서 더욱 상세하게 설명한다.
옵션 사항
상기 특분통전이 상기 기설정된 통계값을 처리할 때는 다음과 같은 옵션이 고려되며, 각 옵션별 교차 선택이 가능할 것이다.
첫째, 먼저 각 특허 분류 기호가 주어졌을 때, 그 특허 분류 기호의 하위 분류 기호에 관한 정보를 자동적으로 포함할 것인가의 문제이다. 이는 특히 타이틀 정보에 나온 dot수로부터 계층 구조를 확인해야 하는 레벨일 경우 더욱 그러하다. 예를 들면, H, H04, H04B, H04B 7/00레벨까지는 확장자를 사용하여 용이하게 주어진 레벨의 IPC하부에 있는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있으나, subgroup레벨로 가면 본 발명의 하위 분류 포함 검색 방법을 활용해야만 그 하위 분류에 속하는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있다. 예를 들면, H04B 7/15라는 IPC가 있을 때 하위 분류 기호를 포함하지 않고 통계값을 생성할 때는 각 국가별 특허 문건 중에서 H04B 7/15이 포함되어 있는 특허 문건을 입수하면 된다. 하지만, 하위 분류 기호 포함하여 통계값을 생성할 때는 H04B 7/15와, IPC 계층 구조상 그 하위에 있는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 포함된 특허 문건들도 입수해야 한다. 이는 USPC, FT 등에서도 마찬가지이며, 공통된 설명은 생략한다.
하위 분류 기호를 자동으로 포함하여 통계값을 처리할 때에는 본 발명의 범위 검색(검색 엔진(7000) 이용 또는 DBMS(2100) 이용시 모두 해당)의 방법을 활용할 수도 있을 것이다. 한편, 본 목적을 달성하기 위해서 범위 검색이 아니더라도, 주어진 특허 분류 기호를 처리할 때, 그 하위에 있는 모든 특허 분류 기호를 저장해 놓고, 그 특허 분류 기호에 대한 통계값을 처리할 때, 그 특허 분류 기호에 대해서만 통계처리를 하는 것이 아니라, 하위에 있는 모든 특허 분류 기호를 대상으로 통계값을 처리할 수도 있을 것이다. 위의 H04B 7/15를 통해서 예를 들면, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 특허 분류 기호 계층 구조 정보에서 입수한 다음, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 저장한 다음, H04B 7/15에 대한 기설정된 통계값을 구하라는 명령이 입수될 때, 자동적으로 하부에 존재하는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 포함하여 기설정된 통계값을 구하는 방식을 채용할 수도 있다는 것이다. 이는 USPC, FT 등의 다른 특허 분류 기호 체계에서도 마찬가지이다.
주어진 레벨의 특허 분류 기호가 있을 때, 단순히 그 특허 분류 기호를 포함하는 문건을 대상으로 상기 기설정된 통계값을 생성하는 것보다 상기 특허 분류 기호의 하위 특허 분류 기호들을 자동으로 포함하여 기설정된 통계값을 생성하는 것 이 바람직하다.
둘째, 복수개의 특허 분류 기호가 존재할 경우, 이를 어떻게 처리할 것인가의 문제이다. 이 경우, 1) 주(main) 특허 분류 기호(통상 제일 첫번째 나오는 것이 주 특허 분류 기호이다.)만을 통계 처리의 대상으로 하는 방법, 2) 주 특허 분류 기호와 종(sub) 특허 분류 기호에 대해 균등한 가중치를 두면서 처리하는 방법, 3) 주 특허 분류 기호와 종 특허 분류 기호에 대해 다른 가중치를 주는 방식으로(예를 들면, 특허 분류 기호가 n+1개가 있을 때, 주 특허 분류 기호 50, 나머지 종 특허 분류 기호는 50*1/n으로 가중치를 주는 방법) 처리할 수 있을 것이다. 상기 1) 내지 3) 중에서 1)과 3)이 바람직하며, 그 중에서 3)이 더욱 바람직할 것이다.
셋째, 복수개의 출원인과 발명자가 있을 때의 처리 방법이다. 이 경우, 1) 매출원인 또는 발명자마다 100의 가중치를 주는 방법과, 2) 출원인 또는 발명자수에 대해 균분하는 방법(n명의 발명자가 있을 때 각 발명자마다 100*1/n로 처리함)이 있을 것이다. 출원인의 경우에는 실시 독립의 관점에서 출원인마다 100의 가중치를 주는 것이, 발명자는 1/n으로 처리하는 것이 바람직할 것이다. 대리인의 경우에는 위의 출원인이나 발명자의 처리 방법을 채용할 수 있을 것이며, 대리인마다 100로 하는 것이 바람직할 것이다.
사전 계산해 놓아야 할 정보
분류 자체의 구조에 관한 정보
상기 특분통전은 주어진 특허 분류 기호에 대하여 상기 특허 분류 기호 체계 상에서 자신의 직하위 특허분류 기호의 개수를 카운트해 놓을 수 있으며, 자신의 모든 하위 특허 분류 기호의 개수를 카운트해 놓을 수 있을 것이다. 예를 들면 H04B 7/15의 경우에는 직하위 특허 분류 기호의 개수는 H04B 7/155, H04B 7/185, H04B 7/204와 같이 3이고, 모든 특허 분류 기호의 개수는 상기 직하위 특허 분류 기호 3개에 H04B 7/165, H04B 7/17, H04B 7/19, H04B 7/195, H04B 7/208, H04B 7/212, H04B 7/216을 합하여 10이다. 상기 직하위 특허 분류 기호의 개수 및 모든 하위 특허 분류 기호의 개수가 많을수록 그 특허 분류 기호는 상대적으로 기술의 분화가 크다고 할 수 있어, 특허 분류 기호 체계 상의 동일한 (도트) 레벨에서 상대적으로 중요한 기술일 가능성이 높다.
양적 분포
상기 특분통전은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 확정되기 때문이다. 상기 확정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
예를 들면, 출원 기준으로는 연도별 또는 분기별 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도를 계산해 놓을 수 있을 것이다. 연도별 출원수는 특정 연도에 출원된 특허 문건의 전체 개수를 구하는 방식으로 계산될 수 있을 것이다. 증가율의 계산은 {(현기간 개수-과거기간개수)/과거기간 개수}*100가 되며, 증가속도는 계산은 {(현기간 개수-과거기간개수)/시간간격}이 되며, 증가가속도는 증가속도의 시간간격에 대한 변화율로 계산가능할 것이다.
또한, 연도별 출원자 수를 구할 수 있을 것이며(이때, 공동 출원일 경우, 상기 옵션 사항을 적용할 수 있을 것이다.), 출원자 수가 계산되면 출원자수증가율을 계산해 놓을 수 있으며, 나아가 1개 출원당 평균출원자수 및 평균출원자수증가율도 계산할 수 있을 것이다. 그리고, 연도별 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율도 상기의 연도별 출원자 수에 준하여 계산할 수 있을 것이다.
그리고, 개별 출원마다 출원 청구항 수를 계산할 수 있으므로, 연도별 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 평균출원청구항수증가율을 계산할 수 있을 것이다. 이때, 출원 청구항을 독립항과 종속항으로 구분지을 경우, 독립항 수와 종속항 수를 계산할 수 있으므로, 이들에 대한 증가율 등을 계산할 수 있을 것이다.
또한, 개별 출원마다 특허 분류 기호의 개수를 계산할 수 있을 것이므로, 연도별 특허분류기호수, 특허분류기호수증가율을 계산할 수 있을 것이며, 1개 출원당 평균특허분류기호수, 평균특허분류기호수증가율도 계산할 수 있을 것이다. 또한, 미국이나 일본 등과 같이 2개 이상의 특허 분류 기호가 사용되는 특허 DB의 경우에는 각 특허 분류 기호마다 이를 계산해 놓을 수 있을 것이다. 개별 출원마다 그 출원에 관한 패밀리 정보가 있을 때, 상기 패밀리 정보를 기준으로 연도별 패밀리수, 매밀리수증가율 및 1개 출원당 평균패밀리국가수, 평균패밀리국가수증가율도 계산할 수 있을 것이다.
상기는 출원 기준으로 계산된 것이며, 이와 동일한 파라미터들을 등록 기준 으로 계산할 수도 있을 것이다. 등록 기준으로 계산할 수 있는 파라미터들은 등록수, 등록수증가율, 등록수증가속도, 등록수증가가속도, 등록자수, 등록자수증가율, 평균등록자수, 평균등록자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 등록청구항수, 등록청구항수증가율, 평균등록청구항수, 평균등록청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 평균패밀리국가수, 평균패밀리국가수증가율 등이 있을 수 있다.
상기와 같은 파라미터들은 예시적인 것이며, 그 이외에도 출원 또는 등록 특허 정보에 포함된 각종 수치 정보 및 본 발명의 사전 카운팅된 값들을 재료로 하여 다양한 파라미터 값도 계산될 수 있을 것이다. 상기 파라미터 값들은 본질적으로 카운트값, 카운트값의 변화율과 변화값, 상기 카운트값의 통계량(평균, 표준편차), 2 이상의 카운트값에 대한 함수값(예를 들면 등록율 등이 그 예가 된다.)
수량 기준 주체의 발견
상기 특분통전은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
예를 들면, 상기 특정된 특허 문건 집합에 대한 카운팅으로 연도별 또는 연 도 통합 최다 출원인, 발명자, 대리인을 추출하여 각 출원인, 발명자, 또는 대리인별로 랭킹을 매겨 놓을 수 있을 것이다.
또한, 위에서 추출한 출원인들, 발명자들, 또는 대리인별로 집중도, 활동도(Activity Index)등을 계산해 놓을 수 있으며, 상기 계산의 결과로 집중도를 기준으로 한 출원인, 발명자 또는 대리인의 랭킹을 구할 수 있을 것이며, 활동도를 기준으로 한 출원인, 발명자, 또는 대리인의 랭킹을 구할 수 있을 것이다. 참고로, 출원수 기준 집중도란 {(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)*100}로 구할 수 있을 것이다. 또한, 활동도는 [{(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)}/{(특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 모든 출원)}*100]으로 계산할 수 있다. 이때, 검색 엔진(7000) 또는 상기 DBMS(2100)를 통하여 1) 특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원, 2) 특정 기간 동안의 특정 주체의 모든 출원, 3) 특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원 및 4) 특정 기간 동안의 모든 출원 각각의 개수를 입수할 수 있기 때문에, 위의 집중도나 활동도를 계산할 수 있게 된다. 한편, 상기 집중도나 활동도는 특허 지표의 일 예에 불과하며, 상기 검색 엔진(7000) 또는 상기 DBMS(2100)로 직접 또는 사전 계산을 통하여 간접적으로 입수할 수 있는 수치값들을 입력값으로 하는 정의된 함수가 있는 경우, 그 함수의 값을 계산할 수 있을 것이며, 그 계산된 함수값을 통하여 출원인, 발명자, 또는 대리인의 그 함수값을 기준으로 한 랭킹을 계산할 수 있을 것이다. 본 발명의 상기 함수에는 특허 분석 지표로 활용되는 정의될 수 있는 종래의 모든 특허 분석 지표 중 특허 DB를 기준으로 검색 엔진(7000) 또는 상기 DBMS(2100)가 입수할 수 있는 값으로 정의되는 모든 특허 분석 지표가 해당될 수 있다.
아울러, 상기에서는 출원수를 기준으로 해서 출원인, 발명자 또는 대리인별 랭킹을 계산했으나, 출원수 증가율, 출원수 증가속도 등과 같은 다른 파라미터들을 기준으로 상기 특허 지표 내지는 함수에 대해서 출원인, 발명자 또는 대리인별 랭킹을 계산해 놓을 수 있을 것이다. 상기 파라미터로는 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 1개 출원당 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 1개 출원당 평균특허분류기호수, 1개 출원당 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 1개 출원당 평균패밀리국가수, 1개 출원당 평균패밀리국가수증가율 등이 있을 수 있을 것이다.
상기 각종 특허 지표 내지는 함수는 출원 기준으로 설명하였으나, 등록을 기준으로도 정의될 수 있고, 계산될 수 있음은 자명할 것이다. 상기 출원 또는 등록의 한정은 특허 문건 집합의 특정 내지 확정의 문제이기 때문이다. 그러므로, 출원 중에서 출원 단계에서 심사청구가 있는 출원만을 대상으로 상기 특허 문건 집합을 특정 내지 확정할 수도 있을 것이다. 아울러, 실용신안제도를 도입하고 있는 경우, 실용신안등록출원 또는 실용신안등록을 각각 출원 또는 등록에 포함시킬 지의 여부 또한 상기 특허 문건 집합의 특정 내지 확정에 관한 문제로 이러한 특정 내지 확정 의 방법과 기준은 당업자의 수준에서 다양하게 정할 수 있을 것이다.
인용 관련
상기 특분통전은 주어진 특정 특허 분류 기호에 대하여 인용 정보를 포함하고 있는 국가별 특허 DB(예를 들면 미국 특허청 발행 특허 문건으로 구축한 특허 DB)를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 인용 관련 정보를 생성해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 예를 들면, USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)가 주어졌을 때, 자신의 특허 문건의 특허 분류 기호로 USPC=002/456를 포함하고 있는 특허 문건 집합을 특정할 수 있게 된다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
미국 특허 문건의 서지 사항에는 자기 문건이 인용한 타인의 특허 등의 인용 정보가 존재한다. 즉, B 문건이 A 문건 및 a 문건을 인용하고 있을 때, A 문건 및 a 문건은 인용당한 것, 즉 피인용 특허이며, B 문건은 A 및 a 문건을 인용한 특허이다. 이때, B 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 인용 출원인, 인용 발명자, 인용 대리인, 인용 특허 분류 기호가 되며, A 문건 및 a 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 피인용 출원인, 피인용 발명자, 피인용 대리인, 피인용 특 허 분류 기호가 된다.
B 문건이 A 문건 및 a 문건을 인용하고 있을 때, B 문건의 서지사항에는 A 문건 및 a 문건의 번호가 들어있다. B 문건이 A 문건 및 a 문건을 인용하는 관계가 있을 때, 전산적으로는 인용 관점에서의 A->B, a->B의 맵핑(mapping) 및 B->A, B->a로의 맵핑이 있게 되고, 상기 맵핑 관계를 통하여 A<->B, a<->B의 상호 관계를 성립시킬 수 있다. 그러므로, B가 인용하고 있는 문건은 B의 서지사항에 있어 용이하게 데이터화 될 수 있게 되고, 상기 맵핑을 통하여, A가 인용되고 있는 문건들의 집합 및 a가 인용되고 있는 문건 집합도 용이하게 특정할 수 있다. 즉, 상기 A 문건이 인용되고 있는 문건 집합 및 a 문건이 인용되고 있는 문건 집합 모두에는 B 문건이 포함되어 있을 것이다.
상기 과정은 확정 또는 특정된 모든 문건에 대하여 수행될 수 있을 것이다. 즉, 특정된 모든 특허 문건에 대하여 하나씩(one by one)으로 처리될 때, 하거나, 기타 전산적인 방법으로 모든 특허 문건 간의 맵핑 관계를 설정할 수 있을 것이다. 하나씩 처리될 때는 각 처리의 대상이 되는 문건은 B 문건의 입장에 서게 됨은 자명할 것이다. 이때, A 문건 및 a 문건이 모두 미국 특허 DB라는 전체 집합에 포함될 경우에는 A 문건 및 a 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이며, 어느 하나가 다른 국가의 특허 DB에서 관리되는 문건일 경우에도 그 국가의 특허 DB의 그 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이다.
인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)이 특정되 면, 상기 특분통전은 상기 특허 문건 집합의 각각의 특허 문건에 포함되어 있는 피인용 특허 문건 번호(문건 A의 번호, 문건 a의 번호)를 취합할 수 있게 되고, 상기 취합된 피인용 특허 문건 번호에는 대응하는 피인용 특허 문건이 있으며, 상기 피인용 특허 문건에는 서지 사항이 포함되어 있음은 자명하다. 따라서, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건이 인용한 피인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 피인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상이 될 수 있다. 이때, 중복 카운팅은 당연히 허용된다. 즉, 하나의 피인용 문건이 상기 인용 정보를 포함하고 있는 특허 문건 집합의 다수 문건에 의해 인용될 때, 상기 피인용 문건은 그 인용되는 회수만큼의 가중치 또는 카운팅 값을 가져야 한다. 즉, 각 피인용 문건 번호에는 상기 인용 회수만큼의 가중치가 곱해져 있다고 취급되면 타당할 것이다. 즉, 문건 A가 5번 인용되고, 문건 a가 3번 인용되었다고 할 때, 모든 인용출원수 등과 같은 하기 파라미터값을 계산할 때, A문건에는 5의 가중치를, a문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 인용 정보를 포함하고 있는 특허 문건 집합을 기준으로 할 때, 상기 피인용 특허 문건 집합을 대상으로 한 모든 계산값은 "인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅이 될 때, 가장 많은 회수로 인용된 피인용 문건 번호의 랭킹을 계산할 수 있을 것이다.
상기 특분통전은 상기 피인용 특허 문건 집합(문건 A, 문건 a가 있는 문건 집합)을 대상으로 하여 다음과 같은 정보들을 계산할 수 있을 것이다 그리고, 먼저 양적인 기준으로 인용출원수, 인용출원수 증가율, 인용출원수 증가속도(이들은 피 인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 피인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율이 된게 된다.
마찬가지로 상기 특분통전은 상기 피인용 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 피인용 출원인별 랭킹, 최다 피인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 피인용 특허 문건 집합에 포함된 피인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 피인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.
상기 특분통전은 상기 인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 상기 인용 정보를 포함하고 있는 출원인별 특허 문건 집합(상기 모든 출원인 중의 어느 하 나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 피인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 피인용 특허 문건 집합에 대하여 상기의 인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특분통전은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 피인용 문건 집합을 생성할 수 있게 되고, 상기 피인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.
상기 맵핑이 관점에서, 상기 특정된 특허 문건 집합에 포함된 각 특허 문건을 인용하고 있는 문건 집합, 즉 인용 문건 집합을 생성할 수 있을 것이다. 예를 들어 설명하면 B 문건을 C 문건 및 c 문건이 인용하고 있을 때, 상기 맵팽 관계를 통하여, B 문건은 C 문건 및, c 문건에 의해 인용당했다는 것을 알 수 있게 된다. 이러한 C 문건 및 c 문건을 찾기 위해서는 검색 엔진(7000)의 인용 문건 번호 필드에 B 문건의 번호를 입력하면, 검색 결과로서 B 문건이 인용 정보에 포함된 C 문건 등이 나오게 된다. 물론, DBMS(2100)에 B 문건의 번호를 인용 번호 필드를 지정하 여 select 등의 쿼리를 질의하여서도 C 문건 등을 검색 결과로 입수할 수 있게 된다. B->C, B->c의 맵핑 관계가 데이터로 정리되어 있다면, 상기 B 문건을 인용하고 있는 C 문건이 포함된 문건 집합을 용이하게 특정할 수 있을 것이다.
그러므로, 상기 특분통전은 특정된 특허 문건 집합에 대하여, 상기 특정된 특허 문건 집합의 개별 특허 문건을 인용하고 있는 인용 문건 집합을 대상으로 하여 하기와 같은 피인용 정보(인용 당한 B의 입장에서는 인용한 C가 포함된 문건들은 피인용 정보가 된다)를 계산할 수 있다.
특허 문건 집합(B가 있는 문건 집합)이 특정되면, 상기 특분통전은 검색 엔진(7000) 또는 DBMS(2100)에 질의함으로써, 상기 특허 문건 집합의 각각의 특허 문건을 인용하고 있는 인용 특허 문건 번호(문건 C의 번호, 문건 c의 번호)를 취합할 수 있게 된다. 상기 취합된 인용 특허 문건 번호에는 서지 사항이 대응되어 있음은 자명하므로, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건을 인용한 인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상이 될 수 있다.
이때, 중복 카운팅은 허용되는 것이 바람직하다. 상기 특정된 특허 문건 집합에, B 문건과 b문건이 속한다고 할 때, 상기 B 문건과 b 문건이 모두 C 문건에 의해 인용된다고 할 때, 문건 C의 가중치는 2가 되어야 한다. 즉, C문건은 B 문건으로 검색해도 검색 결과에 포함되며, b 문건으로 검색해도 검색 결과에 포함된다.
상기 특정된 특허 문건 집합을 기준으로 할 때, 상기 인용 특허 문건 집합을 대상으로 한 모든 계산값은 "피인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅 이 될 때, 상기 특정된 특허 문건 집합에 속하는 특허 문건을 가장 많이 인용한 인용 문건 번호의 랭킹을 계산할 수 있을 것이다.
상기 특분통전은 상기 인용 특허 문건 집합(문건 C, 문건 c가 있는 문건 집합)을 대상으로 하여 다음과 같은 정보들을 계산할 수 있을 것이다 그리고, 먼저 양적인 기준으로 피인용출원수, 피인용출원수 증가율, 피인용출원수 증가속도(이들은 인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자 수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율이 된게 된다.
상기 특분동전은 마찬가지로 상기 인용 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 인용 출원인별 랭킹, 최다 인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 피인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 인용 특허 문건 집합에 포함된 인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용과 관계되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.
이때, 상기 특분통전은 상기 특정된 특허 문건 집합(B와 b가 있는 문건 집합) 자체를 분석할 수 있다. 이 때도 중복 카운팅이 허용되어 중복된 회수만큼 가중치를 부여하여 취급하는 것이 바람직하다. 예를 들면, 문건 B가 5번 인용되고, 문건 b가 3번 인용되었다고 할 때, 모든 상기 특정된 특허 문건 집합을 대상으로 피인용출원수 등과 같은 하기 파라미터값을 계산할 때, B문건에는 5의 가중치를, b문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 상기 특분통전은 상기 가중치를 반영하여 상기 특정된 특허 문건 집합을 대상으로 하여 가장 많이 인용된 특허 문건의 랭킹을 계산할 수 있을 것이다. 나아가, 상기 특분통전은 상기 특정된 특허 문건 집합(문건 B, 문건 b가 있는 문건 집합)을 대상으로 하여 먼저 양적인 기준으로 피인용출원수(B는 C에 의해서 인용되었으므로, B의 입장에서는 피인용이라는 말을 사용할 수 있다.), 피인용출원수 증가율, 피인용출원수 증가속도(이들은 인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용 평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율이 된게 된다. 이때, 상기 특분통전은 상기 마찬가지로 상기 특정된 특허 문건 집합을 대상으 로 하여, 상기 각 파라미터별로 출원인, 발명자, 또는 대리인의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 피인용 출원인별 랭킹, 최다 피인용 발명자별 랭킹을 계산할 수 있을 것이다.
상기 특분통전은 상기 특정된 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 상기 출원인별 특허 문건 집합(상기 모든 최빈 출원인 중의 어느 하나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 인용 특허 문건 집합에 대하여 상기의 피인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특분통전은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 인용 문건 집합을 생성할 수 있게 되고, 상기 인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.
본 발명의 상기 특분통전이 상기 각종 파라미터들을 계산하는 방법은 확정 또는 특정된 특허 문건 집합별로 계산값을 생성하는 것을 특징으로 한다. 그러므로, 상기 특분통전의 입장에서는 사기 특분통전에 입력되는 특정된 특허 문건 집합의 존재가 중요하며, 그 특허 문건 집합의 속성과 크기는 문제되지 않는다.(다만, 인용과 관련된 계산을 하기 위해는 상기 특정된 특허 문건 집합에 인용 정보가 포함되어 있어야 한다.) 그러므로, 상기 특분통전은 아래와 같은 특정된 특허 문건 집합에 대하여 사전에 상기의 모든 파라미터 값 중 적어도 하나 이상을 계산해 놓을 수 있다. 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 상기 1) 내지 6)에 기설정된 기간 단 위로 특정되는 특허 문건 집합, 9) 상기 1) 내지 8)에 심사청구 여부 등과 같은 특정 국가의 특허 문건에 포함되어 있는 기설정된 선택 사항의 포함 여부별로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합 등 중의 어느 하나 이상이 본 발명의 상기 특분통전이 계산의 대상이 되는 특허 문건 집합이 될 것이다. 아울러, 본 발명의 상기 특분통전은 상기 특분통전을 사용하는 사용자가 지정한 특허 문건 집합에 대해서도 상기 파라미터 중 적어도 어느 하나 이상을 계산할 수 있을 것이다.
특허 정보 인텔리전스 모듈(4000)
이하, 본 발명의 특허 정보를 대상으로 하는 특허 정보 인텔리전스 모듈(4000)에 대해서 설명한다. 상기 특정인의 구성은 도 12에 잘 나타나 있다. 상기 특정인에는 1) 과거에 입수된 특허 정보를 대상으로 하는 분석 모듈(4100), 2)업데이트 되는 특허 정보를 주 대상으로 하는 감시 모듈(4300) 및 3) 결과물을 제시하는 리포팅 모듈(4500)이 있으며, 선택적으로 랭킹값을 계산하여 랭킹을 처리하는 랭킹 처리 모듈(4700)이 있다. 상기 분석 모듈(4100)의 구성에 대해서는 도 13에 상세히 나와 있다.
분석 모듈(4100)
분석 지표
특허 정보를 대상으로 하는 분석 지표 및 상기 분석 지표를 계산하는 분석 모듈(4100)에 대해서 설명한다. 특허 정보를 대상으로 하는 분석 지표의 종류는 크 게 수치값, 비율값, 등위값 및 상기 값들의 변화값 등이 있다.
수치값
먼저 상기 수치값과 관련된 분석 지표를 소개한다.
수치값과 관련된 분석 지표로서, 1) 출원수, 2) 등록수 등과 같은 문건의 개수와 관련 것들과, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)이 개별 문건 단위로 파악한 수치값의 합산값(예를 들면 출원 청구항 수 합산값이라면, 출원수가 10개일 때, 그 10개 출원의 총 청구항 수를 합친 것) 또는 그 평균값이 수치값이 될 수 있다. 상기 수치값에는 1) 기설정된 기간 단위, 2) 기설정된 국가 단위, 3) 기설정된 특허 기술 분류 단위, 4) 기설정된 출원인(assignee를 포함한다) 단위, 5) 기타 서지 정보를 구성하는 필드의 내용 또는 속성 단위 중에서 선택되는 어느 하나 이상과 같은 종적(시간 단위는 종적 분류가 된다) 및 횡적 세분화 기준을 형성할 수 있다. 이때, 단위로 시간 또는 기간 단위가 포함될 때에는 그 단위를 기준으로 한 1) 증감율, 2) 변동 속도, 3) 변동 가속도, 4) 평균 증감율, 5) 평균 변동 속도, 6) 평균 변동 가속도와 같은 변화에 관한 정보를 알 수 있게 된다. 또한, 각 기간 단위를 기준으로 할 때의 평균값 및 표준편차와 같은 통계량을 구할 수 있게 된다.
예를 들어 설명하면, 연도별 출원수, 분기별 미국 출원수, 연도별 미국의 클래스 단위의 특허 등록수, 특정 특허 기술 분류 분야의 분기별 국내 기업별 등록수 등이 그 예시가 된다.
비율값
상기 비율값과 관련된 분석 지표를 소개한다.
비율값과 관련된 분석 지표로서는 1) 점유율, 2) 집중율, 3) AI(Activity Index), 4) 기타 정의에 의해서 생성되는 값 등 여러 개가 있을 수 있다. 상기 비율값에는 1) 기설정된 기간 단위, 2) 기설정된 국가 단위, 3) 기설정된 특허 기술 분류 단위, 4) 기설정된 출원인(assignee를 포함한다) 단위, 5) 기타 서지 정보를 구성하는 필드의 내용 또는 속성 단위 중에서 선택되는 어느 하나 이상과 같은 종적(시간 단위는 종적 분류가 된다) 및 횡적 세분화 기준을 형성할 수 있다. 이때, 단위로 시간 또는 기간 단위가 포함될 때에는 그 단위를 기준으로 한 1) 증감율, 2) 변동 속도, 3) 변동 가속도, 4) 평균 증감율, 5) 평균 변동 속도, 6) 평균 변동 가속도와 같은 변화에 관한 정보를 알 수 있게 된다. 또한, 각 기간 단위를 기준으로 할 때의 평균값 및 표준편차와 같은 통계량을 구할 수 있게 된다.
첫째, 점유율이란 특정 영역에 대한 특정 당사자가 차지하는 비율값을 말한다. 예를 들면, 최근 5년간의 연도별 대한민국에서 IPC = A04N 영역에서의 갑이라는 출원인의 출원 점유율은 각 연도별로 다음과 같이 계산될 것이다.
분자 = 연도별 갑이 대한민국 특허청에 출원한 IPC = A04N으로의 모든 출원수
분모 = 갑을 포함한 모든 출원인이 대한민국 특허청에 출원한 IPC = A04N으 로의 모든 출원수
둘째, 집중율이란 특정 영역에 특정 주체가 얼마나 집중하느냐에 대한 비율값을 말한다. 점유율이란 특정 영역에 대한 특정 당사자가 차지하는 비율값을 말한다. 예를 들면, 최근 5년간의 연도별 대한민국에서 IPC = A04N 영역에서의 갑이라는 출원인의 출원 집중율은 각 연도별로 다음과 같이 계산될 것이다.
분자 = 연도별 갑이 대한민국 특허청에 출원한 IPC = A04N으로의 모든 출원수
분모 = 연도별 갑이 대한민국 특허청에 출원한 모든 출원수
셋째, AI란 특정 기술 분야에 대한 다른 전체 기업과 비교했을 때의 상대적인 활동도에 관한 지표로서 다음과 같이 계산될 수 있다.
예를 들면, 최근 5년간의 연도별 대한민국에서 IPC = A04N 영역에서의 갑이라는 출원인의 출원 AI는 각 연도별로 다음과 같이 계산될 것이다.
분자 = (연도별 갑이 대한민국 특허청에 출원한 IPC = A04N으로의 모든 출원수/연도별 갑이 대한민국 특허청에 출원한 모든 출원수)
분모 = (연도별 대한민국 특허청에 출원된 IPC = A04N으로의 모든 출원수/연도별 대한민국 특허청에 출원된 모든 출원수)
넷째, 기타 정의에 의해 생성되는 값은 정의의 종류에 따라 얼마든지 다양하게 정의하여 사용할 수 있다. 예를 든다면 특정 국가에서의 기술 매력도(Technology Attractiveness)를 다음과 같이 정의해서 사용할 수 있다.
분자 = 특정 국가에서의 특정 기술 분야로의 특정 기간 단위에서의 총 출원 수
분모 = 특정 국가에서의 특정 기간 단위에서의 총 출원수
이와 같이 다양한 정의를 통하여 다양한 분석 지표를 생성할 수 있게 되며, 상기 생성되는 분석 지표에 투입되는 값들은 상기 특허 정보 데이터베이스(2300)에서 직접적으로 또는 가공하여 입수가능한 값이어야 한다.
상기에서는 주로 출원수를 예로 들어 비율값을 예시적으로 설명했으나, 등록수 등과 같은 문건의 개수와 관련 것들과, 상기 개별 문건 단위 카운팅 전처리 모듈(3110)이 개별 문건 단위로 파악한 수치값의 합산값 또는 그 평균값 등과 같은 수치값도 비율값을 생성하는데 쓰일 수 있음은 자명하다 할 것이다. 상기 수치값에는 1) 기설정된 기간 단위, 2) 기설정된 국가 단위, 3) 기설정된 특허 기술 분류 단위, 4) 기설정된 출원인(assignee를 포함한다) 단위, 5) 기타 서지 정보를 구성하는 필드의 내용 또는 속성 단위 중에서 선택되는 어느 하나 이상과 같은 종적(시간 단위는 종적 분류가 된다) 및 횡적 세분화 기준을 형성할 수 있다. 예를 들면
예를 들면, 특정 국가에서의 특정 기술분야에서의 권리획득량 매력도를 다음과 같이 정의하여 사용될 수 있을 것이다. 통상적으로 특허 등록 청구항이 많을수록 유지 비용이 많이 들므로, 등록 청구항이 많을수록 권리획득의 매력도는 증가한다.
분자 = 특정 국가에서의 특정 기술 분야로의 특정 기간 단위에서의 총 등록 권리의 모든 등록청구항수의 합
분모 = 특정 국가에서의 특정 기간 단위에서의 총 등록 권리의 모든 등록청 구항수의 합
기타 분석 지표
이어 기타 분석 지표를 소개한다.
1.기술혁신 활동의 집중도 분석지표
1)현시기술우위 지수(Revealed Technological Advantage) 현시기술우위지수(RTA)는 기술 특화(specialization) 현황의 파악을 위해 가장 많이 사용되는 지수 중 하나로서, 우리가 관심의 대상으로 삼는 특정 주체가 다른 주체와 비교하여 상대적으로 어떠한 기술분야에 기술혁신 활동을 집중하고 있는가에 대한 정보를 제공한다. RTA 지수는 일반적으로는 특허활동지수(AI, Activity Index)로 알려져 있으며, 특화지수(Specialization Index), 기술비교우위 지수(TCA, Technological Comparative Advantage), 기술현시비교우위 지수(TRCA, Technological Revealed Comparative Advantage) 등 다양한 명칭으로 사용되고 있다.
RTA 지수는 다음과 같은 수식으로 산출된다. 아래의 수식에서 분자는 j의 특허에서
i 분야가 차지하는 비율을 의미하며, 분모는 전 분야의 특허에서 i 분야가 차지하는 비율을 의미한다.
Figure 112007045150545-pat00001
(Pij는 i 분야에 대한 j의 특허 수)
2)현시특허우위 지수(Revealed Patent Advantage)
현시특허우위 지수(RPA)는 RTA 지수와 마찬가지로 특정 기술분야에 대한 집중도 또는 특화(Specialization) 현황을 보여주는 지표이다. 분석적 의미는 RTA 지수와 동일하나, RTA 지수의 비대칭성(Skewness)을 극복하고 지수의 정규성(normality)을 확보하기 위해 고안되었다.
RPA와 RTA의 관계 및 RPA 값을 산출하는 수식은 다음과 같다.
Figure 112007045150545-pat00002
Figure 112007045150545-pat00003
3) 집중률 지수(CRn, Concentration Ratio n)
집중률 지수(CRn)는 원래 시장에서의 독과점 수준을 평가하기 위해 사용되는 지표
이다. 우리는 이 지표를 특허정보에 응용함으로써 특정 산업부문에서 기술 독과점에 대한 정보를 얻을 수 있으며, 이를 통해 해당 산업부문에서의 기술경쟁의 강도를 가늠해볼 수 있게 된다. CRn 지수는 Cn 지수로도 불린다.
원래 CRn 지수는 하나의 산업부문에서 시장점유율 상위 n개사의 시장점유율의 합을
의미한다. 시장측면에서 기술측면으로 관점을 돌려, 기술의 경쟁강도를 파악하기 위해 시장점유율 대신 특허점유율을 사용하면 다음과 같이 정의될 수 있다.
Figure 112007045150545-pat00004
(Si는 i社의 특허점유율, Ni는 i社의 특허건수, N은 전체 특허건수)
4) 허핀달 지수(HHI, Herfindahl Index)
허핀달 지수(HHI)도 CRn 지수와 마찬가지로 원래는 시장의 독과점 현황과 경쟁 강
도를 평가하기 위해 사용되는 지표이다. 앞서 CRn 지수를 특허정보를 이용하여 변형시킨 것과 같은 방식으로 HHI 분석에 특허데이터를 사용하게 되면 기술적 측면의 독과점상황과 기술경쟁의 강도에 대한 유용한 정보를 얻을 수 있게 된다. 허핀달 지수는 허핀달-허쉬만 지수(HHI, Herfindahl-Herschman Index)로도 불린다.
특허 데이터를 이용한 HHI를 계산하는 식은 다음과 같다.
Figure 112007045150545-pat00005
(Si는 i社의 특허점유율, m은 산업부문의 전체 기업 수, Ni는 i社의 특허건 수, N은 전체 특허건수)
2.기술수준 분석지표
1) 피인용 가중 특허 수(Patent Count Weighted by Citations)
피인용 가중 특허 수는 기술혁신 활동의 양적인 측면을 보여주는 특허건수에 혁신
성과의 중요성 또는 가치와 관련을 맺고 있는 인용정보를 조합함으로써, 혁신성과의 기술적 측면을 평가하기 위한 보다 의미있는 정보를 제공한다. 피인용 정보를 가중시키는 방법은 여러 가지가 제안될 수 있으나, 이하에서는 가장 간단한 가중방식을 사용한 M. Trajtenberg의 가중 특허 수(WPC, Weighted Patent Counts)를 중심으로 소개하기로 한다.
M. Trajtenberg가 사용한 가중 특허 수(WPC, Weighted Patent Counts)는 다음과 같
이 계산된다
Figure 112007045150545-pat00006
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 피인용 수)
2) 특허 당 피인용 수(CPP, Cites per Patent)
특허 당 피인용 수(CPP)는 분석 대상(국가, 기업 등)의 특허가 이후의 기술혁신 활동에 어느 정도의 영향을 미쳤는가를 보여주는 지표이다. 우리는 이 지표를 통해 개별특허의 기술적 중요성과 특정 국가 또는 기업의 기술혁신 활동의 수준 및 혁신성과의 가치를 살펴볼 수 있다. CPP라는 명칭은 미국의 CHI社43)에서 주로 사용하는 명칭이나, CHI社에서 자체적으로 개발한 지표라기보다는 오래 전부터 다양한 명칭으로 사용되어진 개념의 지수이다.
CPP는 다음과 같이 계산된다.
Figure 112007045150545-pat00007
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 피인용 수)
결국, CPP는 특정 연도(또는 기간)에 등록된 특허들이 이후의 특허들에 의해 평균적으로 인용된 회수를 의미한다.
3) 특허영향 지수(PII, Patent Impact Index)
특허영향 지수(PII)는 특정 국가 또는 기업의 기술혁신 성과의 질적 수준을 평가하기위해 사용될 수 있는 지표이다. 우리는 PII 분석을 통해 우리가 분석의 대상으로 삼은 특정 국가 또는 기업이 해당 분야의 평균적인 기술 수준에 비해 어느 정도로 중요한 기술적 성과를 이루어내고 있는가를 파악할 수 있게 된다.
PII는 분석대상 기술분야의 전체 특허들이 평균적으로 인용되는 회수에 대해 특정
국가 또는 기업의 특허가 인용되는 회수의 상대적인 비율로써 계산된다.
Figure 112007045150545-pat00008
(Ca는 a의 특허의 피인용 수, Na는 a의 특허 수, Ct는 전체 특허의 피인용 수, Nt는 전체 특허 수)
4) 현재영향 지수(CII, Current Impact Index)
현재영향 지수(CII)는 우리가 관심의 대상으로 삼고 있는 특정 주체의 과거 5년 동안의 기술혁신 성과가 현재 시점(연도)에 미치고 있는 기술적 영향력에 대한 정보를 제공한다. 우리는 이 지수를 통해 특정 주체의 근래 기술혁신 성과의 기술적 중요성과 기술적 역량을 엿볼 수 있다.
CII는 현재 시점을 기준으로 이전 5년 동안에 산출된 특정 주체(국가 또는 기업 등)의 특허가 현재 시점(연도)에 얼마나 인용되었는가를 전체적인 인용빈도에 대하여 상대적인 값으로 표현한 지수이다. CII는 다음과 같이 계산된다(아래의 수 식에서는 분석 대상으로 삼고자 하는 특정 국가 또는 기업을 A로 표현하기로 한다.
Figure 112007045150545-pat00009
t : 현재 연도를 기준으로 과거 5개 연도
rt : A의 t연도 특허가 현재 연도에 평균적으로 인용된 회수
Rt : t연도의 전체 특허가 현재 연도에 평균적으로 인용된 회수
ct : A의 t연도 특허가 현재 연도에 인용된 전체 회수
nt : A의 t연도 특허건수
Ct : t연도의 전체 특허가 현재 연도에 인용된 전체 회수
Nt : t연도의 전체 특허건수
5) 기술력 지수(TS, Technology Strength)
기술력 지수(TS)는 특정한 국가 또는 기관의 기술적 역량을 살펴보기 위해 사용되는지표이다. TS 지수를 통해 우리는 개별 기술성과들의 평균적 수준과 기술성과에 대한 양적인 측면이 모두 고려된 특정 국가 또는 기관의 기술역량에 대한 정보를 제공받을 수 있다.
특정 연도의 TS는 CII에 특허건수를 곱한 값으로 정의된다.
Figure 112007045150545-pat00010
(CIIi는 해당 연도의 i의 CII값, Ni는 해당 연도의 i의 특허건수)
6) 기술순환주기 지수(TCT, Technology Cycle Time)
기술순환주기(TCT) 지수는 기술발전의 속도, 즉 혁신활동의 속도에 대한 정보를 제
공한다. 특정 기술분야의 기술발전 속도나 특정 주체의 기술혁신 활동의 기반이 최근의 연구성과에 기초하는가 아니면 오래 전의 연구성과에 기초하는가를 살펴볼 수 있다. TCT 지수는 기술수명주기 지수 등 다양한 명칭으로 사용되고 있다.
기술의 순환주기는 다양한 방법으로 측정될 수 있다. 여기에서는 CHI社가 정의한
TCT 지수를 중심으로 기술순환주기를 측정하는 방법을 소개하기로 한다. CHI社의
TCT 지수는 다음과 같이 정의된다.
"인용된 특허들의 발행연도와 인용한 특허의 발행연도와의 차이값들의 중간
값(median age)"
7) 과학연계 지수(SL, Science Linkage)
과학연계 지수(SL)는 특허에 담겨진 기술이 과학의 연구성과들과 얼마나 밀 접한 관
련을 맺고 있는가를 보여준다. 우리는 SL 지수를 통해 어떠한 국가나 기업이 해당 산업부문에서 선도적인 위치에 있으며, 기초연구 또는 원천기술의 개발에 주력하고 있는가를 간접적으로 살펴볼 수 있다.
SL은 분석 대상 특허들이 인용한 과학기술논문 개수의 평균값으로 정의된다.
Figure 112007045150545-pat00011
(nt은 t 연도에 등록된 특허 건수, Si는 i특허가 인용한 과학기술 논문 수)
8) 특허 당 평균 청구항 수(Average Claims per Patent)
청구항 수는 해당 특허의 발명의 폭과 권리의 범위를 측정하기 위한 지표로 많은
관심을 끌어왔다. 그러나 현재까지 청구항 수만으로 기술수준을 측정하려는 시도는 많지 않으며, 주로 다른 지표들(피인용 지수, 패밀리 지수 등)과 함께 특허의 가치 또는 분쟁의 가능성을 측정하기 위한 도구로 사용하려는 시도가 주를 이루 고 있다.
특허 당 청구항 수는 분석대상 특허들의 평균적인 청구항 수로 계산된다.
Figure 112007045150545-pat00012
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 청구항 수)
9) 패밀리 규모(Family Size)
특허 패밀리의 규모는 직접적으로는 해당 특허의 지역적 보호범위를 나타내며, 간접적으로는 해당 특허가 가지는 기술적 중요성과 혁신성과로서의 가치에 대한 정보를 제공한다.
특허 패밀리의 규모를 측정하는 방법은 다양하게 정의될 수 있다. 그러나 여 기에서
는 특허 패밀리가 형성되어 있는 국가의 개수로 정의하여 사용하기로 한다.
Figure 112007045150545-pat00013
(N은 특허 건수, Fi는 i특허의 패밀리가 형성되어 있는 국가 수)
3.협력관계 및 지식흐름 분석지표
1) 공동출원 · 발명 특허 수(Number of Patents with
co-applicants, with co-inventors)
공동특허 수는 기술혁신 활동과 관련된 연구주체간 협력현황에 대한 양적 정보를
제공한다. 공동특허 수는 크게 두 가지로 나누어 볼 수 있다. 하나는 혁신성과의 소유에 관한 협력관계, 즉 소유권이 공유되어 있는 특허의 수와 실질적인 기 술혁신 활동의 협력관계, 즉 공동발명으로 이루어진 특허의 수가 그것이다.
공동특허 수는 2가지로 정의될 수 있다.
공동소유(출원) 특허 수
"2 이상의 주체가 공동으로 소유(출원)한 특허 수"
공동발명 특허 수
"2 이상의 발명자가 공동으로 발명한 특허 수"
2) 샐턴 지수(Salton's Index)
샐턴 지수(Salton's Index)는 국가 간 협력, 지역 간 협력, 기관 간 협력 등 다양한 유형의 협력관계의 강도를 보여준다. Salton's measure, Salton's cosine formula, Salton's cosine measure 등의 명칭으로 사용된다.
샐턴 지수는 다음과 같이 계산된다.
Figure 112007045150545-pat00014
(Pij는 i와 j의 공동특허 수, Pi는 i의 특허 수, Pj는 j의 특허 수)
3) 인력 유입률, 유출률(Brain Gain, Brain Drain)
인력 유입률 및 유출률 분석은 연구활동의 성과가 어디로 귀속되고 있는가에 대한
현황을 파악하기 위해 사용된다. 기술혁신 과정에서 인적(人的) 측면에 초점 을 맞추어 지식의 흐름방향을 파악하기 위한 분석이라 할 수 있다.
인력 유입률과 유출률은 일반적으로 다음과 같이 정의될 수 있다.
인력 유입률
"자국 거주자(또는 자국인)가 소유한 특허 중 외국 거주(또는 외국인)
발명자의 연구활동이 포함된 특허의 비율"
인력 유출률
"자국 거주(또는 자국인) 발명자의 연구활동이 포함된 특허 중 외국 거
주자(또는 외국인)가 소유한 특허의 비율"
4) 인용관계를 이용한 지식흐름 분석 지수(Index for Knowledge Flow with Patent Citations)
특허의 인용정보를 이용한 지식흐름 분석은 기술개발 활동의 성과인 "지식" 또는
무형의 "기술적 정보"가 확산되는 양태를 파악하기 위해 사용될 수 있다. 이 분석은 분석의 목적에 따라 다양한 방법으로 적용될 수 있다.
지식흐름의 동향을 파악하기 위한 인용관계 지수는 하나의 정형화된 지수로서 설명
하기는 곤란하다. 이하에서는 국가 간의 지식흐름을 파악하기 위한 분석 지 표와 방법을 중심으로 설명하기로 한다.
지식유입 현황의 파악을 위한 인용관계 지수
"특정 국가의 특허가 인용한 특허(Backward Citations)의 국가별 점유율"
지식전파 현황의 파악을 위한 인용관계 지수
"특정 국가의 특허를 인용한 특허(Forward Citations)의 국가별 점유율"
이어, 특허 포트폴리오의 관점에서 본 분석 지표를 소개한다.
1. Technology Attractiveness: 특정 기술 분야가 가지고 있는 매력도를 나타내는데 이 기술이 유망한 기술인지를 나타낸다.
1)RGR(Relative Growth Rate): 특정 기간 내에 한 기술 분야에서 출원 특허수의 성장속도와 전체 기술의 출원 특허수의 평균성장속도에 대한 상대 값이다.
Figure 112007045150545-pat00015
PAF ( t2 - t1 ) 는 특정 기술 분야 F에서 시간 t1부터 t2사이에 출원한 특허 수
d(PAF ( t2 - t1 ))은 이 기간 동안의 출원특허수의 성장률을 나타낸다
2)RDGR(Relative Development of Growth Rate): 성장속도의 계산에 시간의 변화를 고려한 지표이다. 특정 기술분야의 두 개의 부동한 시간간격 t3 t4 t1 t2 를 상호 비교하고 다시 이를 전체 기술 분야에 상대하여 측정한 것이다.
Figure 112007045150545-pat00016
3)RTCT(Relative Technology Cycle Time): 전체 기술 분야의 평균 TCT값에 대한 특정 기술분야의 상대적인 TCT값이다.
TCT(Technology Cycle Time):특허의 인용정보를 이용한 지표로서 특허의 인용시차의 중앙값으로서 TCT가 작을수록 기술발전의 속도가 빠르며 기술매력도 역시 크다고 할 수 있다.
Figure 112007045150545-pat00017
2. Technology Activity: RD활동의 산출측면을 보여주는데 기업의 RD성과를 나타낸다. 일반적으로 기업이 일정한 기간 내에 출원한 특허 수 혹은 일정한 기간 내에 등록한 특허 수에 의해 측정한다.
1)RPA(Relative Patent Activity): 기업이 특정 기술분야에서의 출원특허 수와 이 기술분야에서의 모든 기업들의 평균 출원특허 수의 상대 값이다.
Figure 112007045150545-pat00018
PAiF는 특정 기술 분야 F에서 i기업이 출원한 특허 수를 나타낸다.
2)RPP(Relative Patent Position): 기업이 특정 기술 분야에서의 출원특허 수와 이 기술 분야에서 제일 활발한 경쟁자와의 상대 값이다.
Figure 112007045150545-pat00019
3)RTA(Revealed Technology Advantage):기업이 한 특정 기술 분야에서 출원하는 특허 수가 이 기술 분야에서 차지하는 비중과 기업이 종사하는 전체 기술 분야의 출원특허 수가 전체 기술 분야들에서 차지하는 비중에 대한 상대 값이다.
Figure 112007045150545-pat00020
3. Technology Quality: 기업의 RD성과를 반영하지만 기업의 RD활동의 경제적 가치와 효과성에 대한 질적인 평가를 활 수 있다.
1)GR(Grant Rate): 출원된 특허 중 등록된 특허의 비중을 나타내는 것으로 비중이 높을수록 Patent Quality가 높다
Figure 112007045150545-pat00021
2)TS(Technological Scope): 출원특허의 특허 문서에서 Claim의 개수를 나타내는 것으로 역시 TS가 클수록 Patent Quality가 높다
Figure 112007045150545-pat00022
3)CR(Citation Ratio): 특허가치의 평가에서 가장 많이 사용되어온 지표의 하나로서 특허가 그 뒤에 출원된 특허에 의해서 인용되는 횟수로 특허가치를 평가 하는 지표이다.
Figure 112007045150545-pat00023
4. Technology Priority: 기업이 종사하고 있는 다양한 기술분야에서 특정 기술분야가 차지하는 비중을 보여주는데 이기술이 기업에 있어서 얼마나 중요한지 그 우선순위를 파악할 수 있다.
특허지표
1)ITF(Importance of Technological Field): 기업이 일정한 기간 내에 출원한 전체 특허 수에서 특정 기술분야에서의 출원특허 수가 차지하는 비중이다.
Figure 112007045150545-pat00024
5. Technology Collaboration: 기업의 협력 정도를 나타내는 것으로 기업의 협력을 타기업과의 협력, 기업 내 구성원간의 협력 두 부분으로 이루어져 있다.
특허지표
1)IC(Internal Collaboration): 기업 내 구성원간에 이루어지는 협력의 정도를 나타내는데 특정 기술분야에서 다른 곳에 있는 기업 내 구성원이 함께 출원한 특허수가 기업의 전체 특허수에서 차지하는 비중으로 표현된다.
Figure 112007045150545-pat00025
PAiiF는 특정 기술분야 F에서 기업i가 다른 장소에 있는 내부 구성원들과 함 께 출원한 특허수이다.
2)EC(External Collaboration):기업이 타기업과 공동 출원한 특허 수가 기업이 이 기술분야에서 출원한 전체 특허 수에서 차지하는 비중으로 계산된다.
Figure 112007045150545-pat00026
PAijF는 기업i와 기업j가 기술 분야R에서 공동 출원한 특허 수를 나타낸다.
분석 지표별 분석 모듈
상기 분석 지표별 분석을 수행하는 것은 분석 모듈(4100) 내의 분석 지표별 분석 모듈이 수행한다. 상기 분석 지표별 분석 모듈은 대상이 되는 특허 문건 집합에 대해서 개별 분석 지표별로 기설정된 계산식을 사용하여 상기 개별 분석 지표값을 계산하는 모듈을 말한다. 상기 분석 지표 모듈은 개별 분석 지표별로 1) 검색 엔진(7000) 또는 DBMS(2100)에 질의하는 검색식 내지 쿼리식을 가지고 있거나, 2) 수식화된 계산식을 가지고 있으면서, 상기 수식화된 계산식을 상기 검색식 또는 쿼리식으로 변환할 수 있는 변환 프로그램을 가지고 있을 수 있다. 상기 1) 또는 2) 중 어느 쪽을 취하든지 상기 분석 지표 계산 모듈(4110)이 생성해야 하는 계산값은 동등할 것이다.
도 58은 분석 지표별 분석 모듈의 작동 방법의 일실시예적 과정을 보여주고 있다.
상기 분석 모듈(4100)이 분석 지표에 대한 선택 정보를 입수받는 경우(S5820), 분석 모듈(4100)이 지표별 분석 모듈을 호출하고, 상기 지표별 분석 모 듈이 상기 분석 지표를 구성하는 분석 지표 구성 요소 정보를 입수 받고(S5830), 분석 지표 구성 요소 정보를 DB에서 추출하여(S5840), 분석 지표 구성 요소 정보로 분석 지표를 계산한다(S5850)
특허 문건 집합 획득 방법
상기 분석 지표 계산 모듈(4110)이 상기 특허 문건 집합을 획득하는 방법은 크게 3가지 방법이 있다. 첫째, 검색 엔진(7000)을 대상으로 검색식을 입력하여 검색 결과로서 특허 문건 집합을 획득하는 방법이며, 둘째, DBMS(2100)를 활용하여 SQL 쿼리를 사용하여 상기 쿼리의 결과로서 특허 문건 집합을 획득하는 방법이며, 셋째, 특허 문건 집합의 리스트(출원 번호 리스트 등과 같은 문건 고유 번호 리스트가 그 한 예가 될 수 있다.)가 존재하는 방법이다. 출원인 명의 단위의 특허 정보 서비스 시스템에서 관리 대상의 문건이 정해지거나, 발명자 명의 단위 특허 정보 서비스 시스템에서 관리 대상의 문건이 정해지는 것은 위 3가지 중 적어도 어느 하나 이상과 관련이 있음은 물론일 것이다.
첫번째와 두번째 방법을 단순하게 사용하는 경우 노이즈(noise)가 발생할 수
있으나, 이런 경우에도 상기 노이즈에 해당되는 부분을 검색식이나 쿼리에 반영해 놓을 수도 있을 것이다. 예를 들어 설명하면, 특허권의 이전이 발생했으나, 그 이전 정보가 특허 정보 데이터베이스(2300)등에 반영되지 않았을 경우, 노이즈가 발생하나, 이때 검색식이나 쿼리에 상기 노이즈를 차집합 연산 처리할 수 있을 것이다. 상기 물론 위 3가지 방법은 예시적인 것이며, 특허 문건 집합을 형성하기 위해서 활용될 수 있는 임의의 공개된 기술은 모두 채용될 수 있을 것이다. 이하, 문건 집합의 획득 방법은 반복해서 설명하지 않으나, 위 3가지 방법 중 어느 하나 이상의 방법이 될 것이다.
도 59는 분석 대상 특허 문건 집합 입수 방법의 일실시예적 과정을 보여주고 있다.
상기 분석 지표 계산 모듈(4110)이 기설정된 문건 집합, 키워드를 포함하는 검색을 통해 확정된 문건 집합, 비키워드 방식이며 적어도 하나 이상의 기준을 공유하는 문건 집합 중 어느 하나를 입수 받으며(S5920), 상기 입수 받은 문건 집합에 대해 출원번호 등의 문건 고유 번호 정보를 추출하여 분석 대상 문건 집합을 확정하고(S5930), 상기 추출된 문건 고유 번호와 전체 대상 특허 DB에 대한 조인(join)을 실시하여(S5940), 문건 고유 번호에 대응되는 문건 마다의 서지 사항 등 분석에 필요한 모든 정보를 특허 DB에서 입수하며, 조인된 특허 문건에 대해 입수된 분석 필요 정보를 재료로 하여 기설정된 분석을 기설정된 분석 알고리즘으로 분석을 수행한다(S5940).
랭킹 처리 모듈(4700)
대상 특허 문건 집합에서 획득한 계산값(상기 수치값, 상기 비율값 등을 포함한다.)으로부터 여러가지 종류의 순위(ranking)에 관한 정보를 생성할 수 있다. 상기 계산값을 토대로 순위를 생성하는 것을 랭킹 처리 모듈(4700)이라 한다.
필요가 있는 분석 지표 정보는 1) 적어도 하나 이상의 최빈값, 2) 적어도 하나 이상의 최대값, 3) 적어도 하나 이상의 기설정된 기준 이상값, 4) 적어도 하나 이상의 기설정된 기준에 가장 가까운 값 중 어느 하나 이상일 수 있다. 이하, 각각 에 대해서 설명한다.
상기 최빈값을 획득하는 모듈을 최빈값 획득 모듈이라 한다. 예를 들면, 특정 출원인의 2이상의 출원에 대하여 1) 최빈 IPC 등의 최빈 특허 분류 기호, 2) 최빈 발명자, 3) 최빈 출원 국가, 4) 최빈 인용 특허 등을 획득할 수 있으며, 특정 발명자의 출원에 대하여서도 1) 최빈 IPC 등의 최빈 특허 분류 기호, 2) 최빈 인용 특허 등을 획득할 수 있을 것이다. 예를 들어 최빈 IPC를 획득하는 방법은 대상 특허 문건 집합에 포함된 모든 IPC에 관한 정보를 획득한 다음 이들의 카운팅 정보를 입수하면 될 것이다. 이때, 하나의 특허 문서에 main IPC 등의 주 특허 분류 기호 이외에 sub IPC 등과 같은 부 특허 분류 기호에 관한 정보가 더 포함되어 있을 경우에는 상기 주 특허 분류 기호만으로 카운팅하거나, 모든 특허 분류 기호를 포함해서 카운팅하거나, 주 특허 분류 기호와 부 특허 분류 기호에 다른 가중치를 부여한 다음 카운팅할 수 있을 것이다. 상기 최빈값 획득 모듈은 적어도 하나 이상의 최빈값을 획득하며, 최빈 순위로 2개 이상의 최빈값을 획득할 수도 있음은 물론이다 하겠다. 즉, 상기의 예에서, IPC 값으로 H04B 7/26를 1위로, H04Q 7/20을 2위라는 값을 획득할 수 있을 것이다.
상기 최대값을 획득하는 모듈을 최대값 획득 모듈이라 한다. 예를 들면 특정 기술 분야(특허 분류 기호 상에서)에서의 최대/최다 출원인에 관한 정보를 획득하는 것, 최대 점유자에 관한 정보를 획득하는 것 등이 본 획득 모듈이 활용되는 일예라 하겠다. 상기 예에서, H04B 7/26에서의 최다 출원인은 삼성전자가 1위, LG 전자가 2위라는 값을 획득할 수 있을 것이다.
상기 기설정된 기준 이상값을 획득하는 모듈을 기준 이상값 획득 모듈이라 한다. 예를 들면, 전체 또는 부분 기술 분야(특허 분류 기호 상에서)에서 최근 5년간 출원 증가 속도가 연 평균 10 이상인 분야를 찾아 내는 것 등이 본 획득 모듈이 활용되는 일예라 하겠다. 본 실시예를 좀더 상세하게 설명하면 다음과 같다.
상기 기준 이상값 획득 모듈은 H04N이라는 서브 클래스 특허 분류 기호에 포함된 특허 분류 기호 체계상의 모든 하위 그룹(group, group은 IPC 체계상 "subclass 표시+ 숫자/00"으로 표시된다)에 대하여 연도별로의 출원 건수에 관한
정보를 획득한 다음 상기 모든 하위 그룹별 연도별 출원 건수에 대해서 최근5년간 연도 단위의 출원 증가율을 계산한 다음, 그 계산값이 평균 10 이상인 하위 그룹을 찾을 수 있을 것이다.
물론, 상기 그룹 하위에 있는 1 도트(dot) 서브 그룹 단위에 대해서도 상기와 같은 출원 증가율을 계산할 수 있을 것이다.
상기 기정된 기준에 가장 가까운 값을 획득하는 모듈을 근접값 획득 모듈이라 한다. 상기 근접값은 값 또는 값의 범위일 수 있을 것이다.
분석 모듈(4100) 상세 설명
분석 모듈(4100)이 제공하는 분석 서비스란, 분석의 대상이 되는 특허 문건 집합 및 적어도 하나 이상의 기설정된 분석 주제에 대하여, 상기 기설정된 분석 주제를 처리하기 위한 분석 알고리즘을 실행하여, 분석 결과를 생성해 주는 것을 말한다. 상기 분석 결과는 수치적인 정보인 것이 바람직하다. 상기 수치 정보는 본 발명의 리포팅 모듈(4500)을 통하여 적어도 하나 이상의 표 또는 그래프로 시각화 가능할 수 있다. 상기 리포통 모듈에는 표 생성 모듈(4510), 그래프 생성 모듈(4530), 리포트 생성 모듈(4550) 등이 있을 수 있다.
상기 분석 주제별의 상기 분석 알고리즘을 분석 지표별로 설명한다.
특허 문건 집합 입수 모듈
본 발명의 분석 모듈(4100)에는 분석의 대상이 되는 특허 문건 집합을 입수하는 문건 집합 입수 모듈이 있다. 특허 문건 집합 입수 모듈은 1) 상기 검색 엔진(7000)에 검색식을 입력하거나 또는 DBMS(2100)를 통해서 상기 특허 정보 데이터베이스(2300)에 질의하는 방식으로, 분석 대상 예비 문건 집합을 입수받는 단계, 2) 상기 분석 대상 예비 문건 집합에 대하여 노이즈(noise) 문건 정보를 입수받고, 상기 노이즈 문건을 제거하는 단계를 포함하는 것을 특징으로 한다. 이때, 상기 1)번 단계에서 상기 검색식 또는 상기 질의의 수는 복수개 일 수 있으며, 상기 복수개의 검색식 또는 질의마다 해당 문건 집합이 나오므로, 중복 제거를 위하여 합집합 연산을 해야 한다. 그리고, 상기 단계에 더하여 3) 특별한 문건을 추가로 입수 받는 단계나, 상기 각 문건에 중요도 정보를 더 추가받는 단계, 특허 문건이 속하는 기술 분류 정보를 입수 받는 단계 또는 출원인 명의의 대표명화 정보를 더 입수받는 단계 등을 더 거칠 수 있다.
또한, 상기 특허 문건 집합 입수 모듈은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합 전체 또는 특허 분류 기호, 국가, 연도 또는 발명자 등으로 클러스터링 내지 그룹핑한 부분 집합으로부터도 분석 대상이 되는 문건 집합으로 입수할 수 있음은 물론이다 하겠다. 또한, 상기 다단 출면단 특허 정보 서비스 시스템의 경우, 각 단계별 관리자가 관리하는 문건 집합 전체 또는 기설정된 기준으로 클러스털이 내지 그룹핑한 상기 문건 집합 전체의 부분 집합을 분석 대상 문건 집합으로 입수할 수도 있을 것이다.
동향 분석 모듈(4150)
동향 분석이란 분석 대상 문건 집합에 대하여 시기별로 각종 분석 지표별 분석을 수행하는 것을 말하며, 본 발명의 동향 분석 모듈(4150)이 본 기능을 수행한다. 동향 분석 모듈(4150)은 출원인이나 발명자 등과 같은 주체별, 국가별 또는 국가 통합별로 1) 기설정된 기간 단위의 출원량, 등록량 등 각종 수치값이나 비율값에 관한 동향 정보, 2) 상기 1)의 증감율, 속도 등과 같은 변동량에 관한 동향 정보, 3) 상기 1) 내지 2)의 평균이나 표준편차와 같은 통계량에 관한 동향을 분석한다. 상기 각 분석 지표에 관한 내용 및 상기 분석 지표의 분석 알고리즘은 전술한 바와 같다. 상기 동향 분석의 결과에는 랭킹 정보가 더 포함되어 있을 수 있다.
도 60은 상기 동향 분석 모듈(4150)의 작동 방법의 일실시예적 과정을 보여주고 있다.
상기 동향 분석 모듈(4150)은 기설정된 분석 주제에 대한 문건 정보를 입수하고(S6020), 문건 정보를 구성하는 필드 중 어느 하나 이상을 기준으로 문건 정보에 포함된 적어도 하나 이상의 날짜 정보를 기준으로 기설정된 시간대를 단위로 해당 문건의 개수를 카운팅하며(S6030), 기설정된 시간대를 단위로 카운팅한 정보를 표 또는 표에 대응될 수 있는 데이터 형식으로 변환하여(S6040) 임시 또는 영구적인 방법으로 저장하거나, 동향 정보를 요청한 자에게 전송해 줄 수 있게 된다.
기술 단위 분석 모듈(4170)
기술 단위 분석이란 분석 대상 문건 집합에 대하여 다단계 특허 분류 기호별 또는 상기 특허 문건이 입수받은 기술 분류 정보를 기준으로 각종 분석 지표별 분석을 수행하는 것을 말한다. 상기 기술 단위별 분석 모듈이 분석하는 분석 결과물로는 1) 다단계 특허 분류 기호별(예를 들면 IPC의 서브클래스 단위, 그룹 단위 등) 핵심 출원인(적어도 하나 이상의 최대 출원인, 적어도 하나 이상의 최대 집중 출원인, 적어도 하나 이상의 최다 점유 출원인 등과 같이 출원인 단위의 분석으로 랭킹이 포함될 수 있다), 핵심 발명자(적어도 하나 이상의 최대 발명자, 적어도 하나 이상의 최대 집중 발명자, 적어도 하나 이상의 최다 점유 발명자 등과 같이 출원인 단위의 분석으로 랭킹이 포함될 수 있다), 핵심 대리인 또는 핵심 국가를 분석할 수 있다. 또한, 2) 상기 핵심 출원인, 발명자, 대리인 또는 국가의 (1)수치값, 비율값 또는 등위값 및 (2) 상기 (1)값의 변동값에 관한 정보를 분석해 낸다. 상기 1) 내지 2)의 분석은 출원인 등에 대해서 국가별 또는 국가 통합 단위로 분석해 낼 수 있을 것이다.
주체 단위 분석 모듈(4190)
주체 단위 분석이란 분석 대상 문건 집합에 대하여 국가 단위 또는 국가 통합 단위에서 출원인, 발명자, 또는 대리인별로 각종 분석 지표별 분석을 수행하는 것을 말하며, 본 발명의 주체 단위 분석 모듈(4190)이 그 기능을 수행한다. 상기 기술 단위별 분석 모듈이 분석하는 분석 결과물로는 1) 주체별 상기 각종 분석 지표, 2) 상기 1)의 변동값에 관한 정보가 있다.
주체 단위 비교 분석 모듈(4110)
주체 단위 비교 분석이란 분석 대상 문건집합에 존재하는 적어도 2 이상의 출원인, 발명자 또는 대리인별로, 국가 단위 또는 국가 통합 단위에서 상기 각종 분석 지표별로 비교하면서 분석을 수행하는 것을 말하며, 본 발명의 주체 단위 비교 분석 모듈(4110)이 그 기능을 수행한다. 상기 주체 단위 비교 분석 모듈(4110)이 분석하는 분석 결과물로는 1) 2 이상의 주체별로의 상기 각종 분석 지표, 2) 상기 1)의 변동값에 관한 정보가 있다.
상기 비교 분석 결과의 예를 든다면, 삼성 전자와 LG 전자의 국가별 또는 국가 통합별 기설정된 기간별로의 1) 각 다단계 특허 분류 기호별로의 출원수나 등록수, 등록율, 집중율, 점유율 2) 상기 1)의 값들의 변화값 등에 대한 비교값을 들 수 있다. 또한, 삼성 전자와 LG 전자의 국가별 또는 국가 통합별 기설정된 기간별로의 1) 각 다단계 특허 분류 기호별로의 핵심 발명자 별로의 출원수나 등록수, 등록율, 집중율, 점유율 2) 상기 1)의 값들의 변화값 등에 대한 비교값을 예로 들 수 있다.
인용 분석 모듈(4130)
본 발명의 인용 분석 모듈(4130)은 개별 특허 또는 특허 문건 집합이 있을 때, 기설정된 인용 깊이별로 전방 인용과 후방 인용이 발생한 경우, 기설정된 인용 분석 기준에 따른 인용 분석 알고리즘을 실행하여 인용 분석 결과를 도출해 낸다.
인용 깊이
상기 인용 깊이란 직접 인용 관계(A가 B를 인용한 경우 A와 B는 직접 인용 관계에 있다,(A 문건의 인용 정보에 B문건에 관한 정보가 인용 정보로 포함되어 있을 때를 말한다. 참증 인용을 포함한다. 이하 같다))에 있는 경우, 인용 깊이는 전방 인용(A기준 B의 깊이) 및 후방 인용(B 기준 A의 깊이) 모두 1이다. 이때, B가 C를 인용하고 있다면, A는 C를 간접 인용하고 있다고 보고, 이때 인용의 깊이는 전방 인용(A 기준 C의 깊이) 및 후방 인용(C 기준 A의 깊이) 모두 2가 된다.
인용 분석 지표의 종류
이어서, 본 발명에서 개시하는 인용 분석 지표에 대해 설명한다.
인용 분석 지표의 유형으로는 크게 8가지 정도를 들 수 있으며, 이는 예시적인 것으로 해석되어야 한다. 첫번째는 출원인 기준 피인용 분석 지표로 특정 출원인의 특허를 인용하는 타인의 특허 문건에 대한 각종 통계 및 분석을 수행하기 위한 분석 지표이다. 둘째는 출원인 기준 인용 분석 지표로 특정 출원인의 특허 문건이 어떤 타인의 특허들을 인용하고 있는지에 대한 각종 통계 및 분석을 수행하기 위한 분석 지표이다. 셋째는 비교 인용 분석 지표로 적어도 2 이상의 출원인들 상호간의 인용 및 피인용에 관한 통계 및 분석을 수행하기 위한 분석 지표이다. 넷째는 기술 분야별 인용-피인용 랭킹 분석 지표로 기술 분야별로 최다 인용-피인용 출원인, 발명자를 찾아 내는 분석을 수행하기 위한 분석 지표이다. 다섯째는 기술 분야 기준 피인용 분석 지표로 최대로 인용되는 특허를 가지는 출원인, 발명자, 개별 특허 문건을 분석하는 분석 지표이다. 여섯째는 기술 분야 기준 인용 분석 지표로 상기 기술 분야의 선행 특허를 가장 많이 인용하고 있는 출원인, 발명자 또는 개별 특허 문건을 분석하는 분석 지표이다. 일곱째는 특허 문건 기준 전방 인용 분석 지표로 지정된 인용 깊이별로 얼마나 많은 전방 인용이 발생했는가를 분석하는 분석 지표이다. 여덟번째는 특정 특허 문건 기준 후방 인용 분석 지표로 지정된 인용 깊이별로 얼마나 많은 후방 인용이 발생했는가를 분석하는 분석 지표이다.
이하 각각에 대해 더욱 상세하게 설명한다.
인용 분석 알고리즘
이어서, 본 발명에서 개시하는 인용 분석 지표 및 상기 인용 분석 지표값을 알아 내기 위한 인용 분석 알고리즘에 대해 설명한다. 먼저 전방 인용에 관련된 내용부터 설명한다. 전방 인용 분석의 한 실시예적 방법에 대해서는 도 62에 나타나 있다.
상기 인용 분석 모듈(4130)은 적어도 하나 이상의 문건 집합을 입수하고(S6220), 문건 집합을 구성하는 개별 특허 문건 각각에 대한 전방 인용 정보를 입수하여(S6230), 입수된 전방 인용 정보에 관련된 전방 인용 문건 집합을 형성하고(S6240), 전방 인용 문건 집합을 분석 대상 문건 집합으로 하여 적어도 하나 이상의 기설정된 분석을 수행한다(S6250). 이어서 더욱 상세하게 설명한다.
전술한 바와 같이 적어도 하나 이상의 문건을 포함하고 있는 분석 대상 문건 집합을 기준으로 상기 분석 대상 문건 집합을 구성하는 특허 문건들이 직접 인용하고 있는 특허들은 상기 분석 대상 문건 집합의 문건들의 서지 사항 또는 본문에 나 와 있다. 그리고, 이 정보는 특허 정보 데이터베이스(2300)에 상기 분석 대상 문건 집합의 문건들과 관계되어 저장되어 있으며, 검색 인덱스(검색 인덱스에 상기 서지 사항에 관한 내용이 저장되어 있는 경우에 한한다.)에도 저장되어 있을 수 있다. 그러므로, 분석 대상 문건 집합이 확정되면, 상기 분석 대상 문건 집합의 문건들이 인용하고 있는 인용 특허 문건들도 확정되게 된다.
상기 확정의 일 실시예적 방법은 상기 특허 정보 데이터베이스(2300)에 상기 분석 대상 문건 집합의 개별 특허 문건들의 문건 번호(출원 번호 및/또는 등록 번호 등)를 질의하여, 상기 문건들이 인용하고 있는 타 특허 문건 번호를 입수하도록 명령하는 방식일 수 있다. 한편, 검색 엔진(7000)의 출원번호 또는 등록 번호 필드에 상기 분석 대상 문건 집합의 개별 특허 문건 번호를 입력한 다음 상기 검색 인덱스가 포함하고 있는 서지 사항 정보 중에서 상기 타 특허 문건 번호를 입수할 수도 있을 것이다. 이때, 상기 각 문건 번호별로 상기 타 특허 문건 번호의 개수를 카운팅하여, 각 카운팅 수를 각 문건 번호와 함께 저장할 수도 있으며, 상기 타 특허 문건 번호 정보도 함께 저장 될 수도 있다. 상기 저장된 카운팅 정보를 분석하면, 상기 분석 대상 문건 집합에 속하는 특허 문건이 인용한 타 특허 문건 중에서 최다 인용된 타 특허 문건을 찾을 수 있을 것이며, 인용 빈도를 기준으로 한 랭킹을 생성할 수도 있을 것이다.
상기 타 특허 문건 번호가 입수되면, 상기 타 특허 문건 번호로 이루어진 타 특허 문건 집합이 생성되고, 상기 타 특허 문건 집합을 대상으로 각종 분석을 수행할 수 있게 된다. 그리고, 본 과정은 상기 문건 집합의 원소가 하나일 때, 즉 하나 의 특허 문건에 대해서도 성립함은 자명하다 할 것이므로, 이에 대한 설명은 생략한다.
이때, 깊이별 간접 인용까지 포함하는 깊이별 타 특허 문건 집합도 입수할 수 있는데, 이는 상기와 같은 방법을 재귀적으로 수행함으로써 이루어 질 수 있다. 즉, 상기에서 생성된 타 특허 문건 집합의 타 특허 문건이 직접 인용하고 있는 다른 문건들을 입수하여, 상기 입수된 다른 문건들을 하나의 또다른 타 특허 문건 집합으로 취급하는 방법이다.
이어, 후방 인용 분석과 관련된 내용을 설명한다. 후방 인용 정보를 찾는 것이 상기 전방 인용 정보를 찾는 것은 방법적으로 조금씩 다르다. 상기 전방 인용 정보는 자신의 문건에 포함되어 있는 반면(자신의 문건 정보와 함께 관계되어 저장되어 있음), 후방 인용 정보는 타인의 문건 정보에 포함되어 있는(타인의 문건 정보에 함께 저장되어 있음) 특징이 있다. 그러므로, 후방 인용 정보를 찾기 위해서는 상기 검색 엔진(7000)의 여러 필드 중 인용 필드에 자신의 특허 번호(출원 번호 또는 등록 번호)를 입력해서 검색 결과로 찾거나, 상기 DBMS(2100)로 자신의 특허 번호를 입력해서 자신의 특허 번호를 인용하고 있는 타 특허 문건을 찾아내라는 질의를 함으로써 찾아 낼 수 있다. 즉, 전방 인용은 DB 또는 검색 인덱스에서 직접 가져 오므로 검색이라는 개념이 없는 반면, 후방 인용은 검색(검색을 위한 질의를 포함한다.)이라는 개념이 있다. 후방 인용 분석의 한 실시예적 방법에 대해서는 도 63에 잘 나타나 있다.
상기 인용 분석 모듈(4130)은 적어도 하나 이상의 문건 집합을 입수하 고(S6320), 문건 집합을 구성하는 개별 특허 문건 각각에 대한 후방 인용 정보를 입수하고(S6330), 입수된 후방 인용 정보에 관련된 인용 문건 집합을 형성하여(S6340), 후방 인용 문건 집합을 분석 대상 문건 집합으로 하여 적어도 하나 이상의 기설정된 분석을 수행한다(S6350) 이어서 더욱 상세하게 후방 인용 분석을 설명한다.
적어도 하나 이상의 문건을 포함하고 있는 분석 대상 문건 집합을 기준으로 상기 분석 대상 문건 집합의 특허 문건을 직접 인용하고 있는 타 특허들은 찾기 위해서는 다음과 같은 과정을 수행해야 한다. 우선적으로 상기 분석 대상 문건 집합을 구성하는 모든 특허 문건에서 특허 번호(출원 번호 또는 등록 번호)를 입수한다. 이어서, 상기 특허 번호를 검색 엔진(7000)의 경우에는 인용 필드(출원 번호 또는 등록 번호 필드가 절대 아님)에 입력하여(즉, 인용 필드에서 상기 특허 번호를 찾도록 하여) 그 검색 결과로서 타 특허 문건 번호를 입수할 수 있다. 한편, 상기 DBMS(2100)에 질의하여, 상기 특허 번호를 인용 정보로 포함하고 있는 타 특허 문건들을 찾아 낼 수도 있다. 검색 엔진(7000)은 역색인(inverted file)의 방식을 사용하므로, 후방 인용의 경우 검색 엔진(7000)으로 타 특허 문건 번호를 찾는 것이 상대적으로 빠를 수 있다. 상기 타 특허 문건 번호가 입수되면, 상기 타 특허 문건 번호로 이루어진 타 특허 문건 집합이 생성되고, 상기 타 특허 문건 집합을 대상으로 각종 분석을 수행할 수 있게 된다. 그리고, 본 과정은 상기 문건 집합의 원소가 하나일 때, 즉 하나의 특허 문건에 대해서도 성립함은 자명하다 할 것이므로, 이에 대한 설명은 생략한다. 또한, 간접 인용까지 포함하는 깊이별 타 특허 문 건 집합을 입수하는 것도 대동소이하므로 설명을 생략한다. 이때, 상기 각 문건 번호별로 상기 타 특허 문건 번호의 개수를 카운팅하여, 각 카운팅 수를 각 문건 번호와 함께 저장할 수도 있으며, 상기 타 특허 문건 번호 정보도 함께 저장 될 수도 있다. 상기 저장된 카운팅 정보를 분석하면, 상기 분석 대상 문건 집합에 속하는 특허 문건 중에서 최다 인용된 문건을 찾을 수 있을 것이며, 인용 빈도를 기준으로 한 랭킹을 생성할 수도 있을 것이다.
그런데, 상기 분석 대상 문건 집합을 구성하는 개별 특허 문건들의 후방 인용의 정도는 상기 각 개별 특허 문건마다 다를 것이며, 상기 개별 특허 문건마다 후방 인용의 가중치가 다를 것이다. 그러므로, 후방 인용이 많이 된 특허의 중요성이 통계적으로 높다고 할 때, 후방 인용과 관련해서 상기 분석 대상 문건 집합에 대한 인용 분석이 필요할 수 있다. 이하, 본 발명의 분석 대상 문건 집합에 대한 인용 분석에 대해 설명한다.
상기 분석 대상 문건 집합을 구성하는 개별 특허 문건들 각각에 대한 후방 인용의 개수를 카운팅할 수 있을 것이며, 상기 개별 특허 문건들을 인용하는 후방 인용 특허 문건의 특허 번호(출원번호, 등록 번호 등)을 입수할 수 있을 것이다. 검색 결과나 질의 결과의 개수 카운팅은 각각 검색 엔진(7000) 또는 DBMS(2100)에서 용이하게 출력해 주는 것이므로, 상세한 설명은 생략한다.(검색 엔진(7000)의 경우 검색식을 질의하면 우선적으로 검색 결과 자체에 앞서 검색 결과의 개수를 리턴하는 것이 일반적이며, DBMS(2100)의 경우도 count SQL 명령어 등과 같은 집계함수를 사용할 수 있다.) 또한 검색 결과나 질의 결과로서의 상기 후방 인용 특허 문 건의 문서 번호 내지 특허 번호를 입수하는 것도 당연한 기능이므로 상세한 설명은 생략한다. 본 문단의 처리 결과로 상기 분석 대상 문건 집합을 구성하는 개별 특허 문건 마다 상기 개별 특허 문건을 후방 인용하는 후방 인용 특허 문건 수 및 상기 후방 인용 특허 문건 번호를 알게 된다.
그리고, 상기 후방 인용 특허 문건 번호를 이용하여, 상기 후방 인용 특허
문건의 서지 사항 정보를 획득할 수 있는 것은 당연하다 하겠다. 그러므로, 상기 분석 대상 문건 집합을 구성하는 개별 특허 문건들 중에서 적어도 하나 이상의 최대 후방 인용값을 가지는 문건을 찾을 수 있을 것이며, 나아가 1) 출원인 명의 기준, 2) 각 특허 분류 기호 중에서 선택되는 각 단계별 기준(예를 들면, USPC 클래스 기준, IPC 서브 클래스 기준, USPC 1 dot 레벨 기준, IPC 그룹 기준 등), 3) 발명자 기준, 4) 국가 기준, 5) 시간대 기준(연도 기준이 바람직할 것이다) 중에서 선택되는 어느 하나 이상을 기준을 적용한 그룹별로의 상기 그룹에 속하는 부분 문건 집합을 이루는 개별 특허 문건들 중에서 최대 후방 인용값을 가지는 문건을 찾을 수 있을 것이다. 예를 들면 "발명자 A의 특허 문건 중 가장 후방 인용이 많이 된 특허 문건은 0001이며, 두번째로 많이 된 것은 0004이다"등과 같은 결과를 도출해 낼 수 있다.
더 나아가, 상기 분석 대상 문건 집합을 구성하는 개별 특허 문건들을 상기 1) 내지 5) 단위 중에서 선택되는 어느 하나 이상을 활용하여 그룹핑하고, 상기 그룹핑의 결과로 생기는 그룹 단위로 후방 인용 특허 문건의 개수를 집계할 수 있을 것이며, 어느 발명자가 가장 많은 후방 인용이 되었는지도 집계해 낼 수 있을 것이 다. 예를 들면 상기 분석 대상 문건 집합을 구성하는 개별 특허 문건들을 발명자 단위로 그룹핑하고, 상기 발명자 단위로 후방 인용 특허 문건의 개수를 집계할 수 있을 것이며, 어느 발명자가 가장 많은 후방 인용이 되었는지도 집계해 낼 수 있을 것이다. 좀 더 구체적으로 설명하면, 분석 대상 문건 집합을 구성하는 특허 문건의 발명자가 발명자 A, 발명자 B, 발명자C로 구성된다고 할 때, 상기 각 발명자의 특허 문건 별로 후방 인용을 카운팅한 다음에 발명자별로 합산하여 상기 발명자 A, 발명자 B, 발명자C별로 후방 인용 문건이 최대인 발명자 C를 찾아 낼 수 있을 것이다. 이때, 각 발명자별로 출원 개수 또는 등록 개수당 평균 후방 인용 문건 개수도 계산해 낼 수 있으며, 이들에 대한 순위도 부여할 수 있음은 물론이다 하겠다. 나아가 상기 평균 후방 인용 문건 개수의 계산 및 순위 부여는 발명자 뿐만 아니라 상기 1) 내지 5)에서 선택되는 어느 하나 이상의 기준을 적용한 그룹별로도 수행할 수 있음은 물론이다 하겠다. 그룹핑화 및 랭킹이 포함된 그룹핑화의 구체적인 방법은 후술한다.
상기 분석 대상 문건 집합은 1) 검색 엔진(7000)에서의 검색 결과 또는 DBMS(2100)로의 질의 결과로 획득될 수 있으며, 2) 기설정된 특허 문건 집합(예를 들면, 출원인 명의 단위 특허 정보 서비스 시스템이 관리하는 특허 문건 집합, 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 특허 문건 집합 등)으로 획득될 수도 있으며, 3) 사용자에 의한 적어도 하나 이상의 특허 번호의 입력으로도 생성할 수 있다. 또한, 상기 분석 대상 문건 집합은 1), 2) 또는 3)으로 획득되는 분 석 대상 문건 집합을 구성하는 문건들의 부분 집합으로 획득될 수도 있다.
이상과 같이, 분석 대상 문건 집합, 상기 분석 대상 문건 집합과 관련되는 전방 인용 타 특허 문건 집합, 상기 분석 대상 문건 집합과 관련되는 후방 인용 타 특허 문건 집합이 생성되었다. 상기 전방 인용 타 특허 문건 집합과 상기 후방 인용 타 특허 문건 집합은 각 깊이별로 생성될 수도 있으며, 합집합 연산을 통하여 깊이 통합형 타 특허 문건 집합을 생성할 수도 있다. 또한, 상기 전방 인용 타 특허 문건 집합과 상기 후방 인용 타 특허 문건 집합은 국가별로도 생성될 수도 있으며, 합집합 연산을 통하여 국가 통합형 타 특허 문건 집합을 생성할 수도 있다.
부분 집합 생성
이어, 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 때, 특정한 제한을 두어 특정한 속성을 공유하는 타 특허 문건 집합을 생성할 수도 있다. 상기 제한은 1) 특정 출원인 제한, 2) 특정 발명자 제한, 3) 특정 특허 분류 기호 제한, 4) 특정 키워드를 포함하는 문서로의 제한, 5) 적어도 하나 이상의 특정 연도 또는 적어도 하나 이상의 특정 기간의 제한, 6) 특정 국가로의 제한 7) 상기 1) 내지 6) 중에서 선택되는 어느 2 이상을 동시에 사용하는 제한 등이 있을 수 있다. 상기 제한은 일종의 필터(filter)의 기능을 수행한다고 할 수 있다.
상기 1) 내지 7)의 예를 들면 다음과 같다.
상기 1)의 예로는 출원인이 삼성전자주식회사인 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다. 또한, 2 이상의 출원인이 OR 관계로 묶어서 상기 제한을 완성시킬 수도 있을 것이다. 예를 들면, 삼성전자주식회사, 삼성전기주식회사, SDS 등과 같이 삼성 계열사 중에서 선택되는 다수의 계열사를 함께 입력하는 방식으로 삼성 계열사와 관계된 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수도 있을 것이다.
상기 2)의 예로는 특정한 발명자 개인 또는 2 이상의 발명자를 OR 관계로 묶어 상기 발명자 또는 발명자 그룹별로의 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다.
상기 3)의 예로는 계층 구조를 가지는 IPC, USPC, FI, FT, ECLA 특허 분류 기호 체계 중에서 선택되는 어느 하나 이상의 특허 분류 기호를 채용하여 상기 특허 분류 기호 체계 상 기설정된 단계의 특허 분류 기호를 가지는 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다. 예를 들면, IPC가 A04N 또는 IPC가 (H04M 13/00 OR FO4B11/00 OR B22F01/00, H05K03/00)에 한정된 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다.
상기 4)의 예로는 초록 필드에 "바이오 칩 OR biochip"을 만족하는 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다.
상기 5)의 예로는 연도 정보로서 출원일이 1995년부터 2006년까지를 만족하는 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다.
상기 6)의 예로는 상기 최초 출원 국가로서 US를 만족하는 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다. 상기 국가는 우선권 정보에 포함된 국가 정보 또는 출원인의 주소 정보를 통하여서도 획득할 수 있을 것이다.
상기 7)의 예로는 출원인이 삼성전자주식회사이며, US 특허만을 대상으로 하
며, 키워드로 초록 필드에 "CDMA OR Code Division Multiple Access"를 포함하며, 청구항 필드에 "하이브리드"를 포함하며, 1995년부터 2006년 사이에 발생한 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수도 있을 것이다.
이어서, 상기 제한을 적용하는 방법을 설명한다. 상기 제한의 적용은 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 때에 상기 제한을 적용한다. 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 을 DBMS(2100)를 통하여 획득할 때는 상기 제한 조건을 SQL ㅋ쿼리문에서 where 절 등을 등을 사용하여 제한하면 된다. 상기 상기 후방 인용 타 특허 문건 집합을 검색 엔진(7000)을 통해서 획득할 때는 상기 제한 조건을 상기 검색 엔진(7000)의 각 필드에 입력하는 방식(각 필드에 상기 제한 조건을 만족하는 것만 획득하게끔 하는 방식)을 취하면 된다.
상기와 같은 제한은 분석 대상 문건 집합을 획득할 때에 활용해도 됨은 물론이다 하겠다. 즉, 상기 인용 분석을 진행하기 전에 특정한 제한 조건을 만족하는 문건 집합만을 분석 대상 문건 집합으로 하여 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다. 또한, 상기 제한 조건을 만족하는 분석 대상 문건 집합을 대상으로 하여 제한 조건이 있는 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수도 있을 것이다. 이와 같은 예로는 삼성전자주식회사의 미국 출원 중 2000년 이후에 출원되어 공개된 특허 문건을 분석 대상 집합으로 하여, 퀄컴의 특허를 인용하고 있는(출원인이 퀄컴인) 전방 인용 타 특허 문건 집합을 생성할 수도 있을 것이다. 또한, 삼성전자주식회사의 미국 출원 중 2000년 이후에 출원되어 공개된 특허 문건을 분석 대상 집합으로 하여, 2000년 이후 퀄컴에 의해 인용된 후방 인용 타 특허 문건 집합을 획득할 수도 있을 것이다.
부분 집합 활용
이어, 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합의 그룹핑화 및 랭킹을 포함한 그룹핑화를 설명한다. 예를 들어 설명하면 다음과 같다. 퀄컴의 특정 기술 분야의 특허를 가장 많이 인용하는 한국 기업 목록을 제시하된 인용수가 많은 순서대로 정렬해서 보여 준다고 할 때, 상기 그룹핑은 한국 기업 목록을 제시하는 것이며, 인용수가 많은 순서대로 정렬해서 보여주는 것은 랭킹을 포함한 그룹핑화의 예가 될 것이다.
상기와 같은 그룹핑화는 그룹핑의 대상이 될 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합에 대하여 DBMS(2100)가 지원하는 "group by" 명령어를 사용하여 그룹핑할 수 있을 것이다. 상기 그룹핑의 대상이 되 는 각 문건 집합은 상기 제한이 반영된 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합일 수 있음은 당연하다 할 것이다.
즉, 상기 "group by" 명령어는 상기 명령어의 대상이 되는 문건 집합(엄격하게 말하면 상기 문건 집합의 구성 원소인 상기 특허 문건을 말함)에 대해 기준이 되는 요소(by 이하에 나옴, 예를 들면 출원인 필드)별로 그룹핑할 뿐이며, 상기 명령어의 대상이 되는 문건 집합이 가지는 속성(예를 들면 기간과 특허 분류 기호가 특정하게 제한된 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합이라는 등과 같이 문건 집합이 어떤 특정한 제한이 걸린 것이라는 것)에 무관하기 때문이다.
이와 같이 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 그룹핑화하는 경우, 상기 그룹별로의 순위(랭킹)이 중요하게 된다. 이때, 랭킹의 기준은 개수 또는 기설정된 점수가 되는 것이 합리적일 것이다. 즉, 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합이 출력될 때, 기설정된 기준으로 그룹핑 되고, 상기 각 그룹이 배열되는 순서가 랭킹이 높은 순으로 배열되는 것이 인용 정보의 전체적인 파악에 더 도움이 될 것이다. 상기 랭킹을 매기는 것은 본 발명의 랭킹 처리 모듈(4700)이 수행할 수도 있지만, DBMS(2100)가 지원하는 경우 SQL 쿼리로도 해결할 수 있다.
상기 그룹핑의 기준은 다양할 수 있으나, 1) 출원인 명의 기준, 2) 각 특허 분류 기호 중에서 선택되는 각 단계별 기준(예를 들면, USPC 클래스 기준, IPC 서브 클래스 기준, USPC 1 dot 레벨 기준, IPC 그룹 기준 등), 3) 발명자 기준, 4) 국가 기준, 5) 시간대 기준(연도 기준이 바람직할 것이다) 중에서 선택되는 어느 하나 이상을 기준으로 할 수 있을 것이다. 이때, 2 이상의 기준이 적용되면 그룹의 개수가 곱하기 연산이 되므로 그룹의 개수가 많아지는 문제가 발생할 수 있다.
상기 그룹핑 및 랭킹을 포함한 그룹핑화는 상기 분석 대상 문건 집합에도 적용할 수 있을 것이다. 예를 들면, 삼성전자주식회사의 2000년부터 2006년까지의 미국 출원을 대상으로 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 보여 준다고 할 때, 상기 삼성전자주식회사의 분석 대상 문건 집합을 연도별, 특허 분류 기호 별(IPC 서브클래스 또는 IPC 그룹 또는 서브 그룹 단위가 바람직할 것이다) 또는 기타 그룹별로 그룹핑하고, 상기 그룹핑된 그룹들 간에서 랭킹을 매겨 랭킹이 높은 그룹을 앞에 배치하는 방식을 취할 수 있을 것이다. 그리고, 상기 그룹핑된 분석 대상 문건 집합에서 특정 그룹별로 상기 특정 그룹에 속하는 문건 집합만을 분석 대상 문건 집합으로 하여 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득할 수 있을 것이다. 이때, 상기 획득된 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합에도 그룹핑화 및 랭킹을 포함한 그룹핑화가 적용될 수 있음은 물론이다 하겠다.
상기 그룹핑된 분석 대상 문건 집합을 통하여 상기 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 획득하는 경우에는 다양한 그룹별로의 인용 및 피인용 관계를 정밀하게 파악할 수 있어, 인용 및 피인용 정보의 활 용을 극대화할 수 있다.
비교 인용 분석
상기에서는 분석 대상 문건 집합 1개에 대해서 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 찾아 내고, 상기 문건 집합에 대하여 그룹핑, 랭킹을 포함한 그룹핑, 각종 제한 처리를 하여 인용 분석을 수행하는 방법을 설명하였다. 또한, 후방 인용을 중심으로 상기 분석 대상 문건 집합 자체에 대하여 그룹핑, 랭킹을 포함한 그룹핑, 각종 제한 처리를 하여 인용 분석을 수행하는 방법을 설명하였다.
이어서, 상기 인용 분석의 특별한 예로 2 이상의 출원인을 대상으로 하는 비교 인용 분석에 대해서 설명한다. 비교 인용 분석이란 출원인 등의 주체 정보를 공유하는 2 이상 복수개의 분석 대상 문건 집합을 대상으로 하여 각 문건 집합 상호간에서만 전방 인용과 후방 인용 정보를 처리하는 것을 말한다.
예를 들어 설명하면 다음과 같다.
미국 삼성전자주식회사의 특허 문건으로 분석 대상 문건 집합(본 예에서는 집합A로 표현한다)를 생성하고 와 미국 소니의 특허 문건으로 분석 대상 문건 집합(본 예에서는 집합B로 표현한다)를 생성한다. 이때, 집합 A를 분석 대상 문건 집합으로 하고, 상기 집합 A에 대하여 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 찾아 낼 때, 집합 B에 속하는 특허 문건만을 찾아 낸다. 찾아 내는 방법은 여러가지가 있을 수 있으나, 검색식 또는 쿼리로 해결할 수도 있고, 필터링 등을 방법을 사용해서도 할 수 있으며, DBMS(2100)가 지원하는 각종 SQL문을 활용해서도 목적하는 문건 집합을 찾아 낼 수 있다. 즉, 집합 A를 분석 대상 문건 집합으로 하고, 집합 B에 속하는 특허 문건 중에서 집합 A에 관련된 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 찾아 낸다. 상기 집합 B 소속 전방 인용 타 특허 문건 집합과 상기 집합 B 소속 후방 인용 타 특허 문건 집합에 대해 본 발명의 인용 분석 편에서 기술한 각종 제한, 그룹핑, 랭킹 등의 처리를 할 수 있음은 물론이다. 아울러, 상기 집합 A를 대상으로 한 상기 분석 대상 문건 집합에 대한 인용 분석을 수행할 수 있음은 물론이다 하겠다. 한편, 방향을 바꾸어서, 집합 B를 분석 대상 문건 집합으로 하고, 상기 집합 B에 대하여 전방 인용 타 특허 문건 집합 또는 상기 후방 인용 타 특허 문건 집합을 찾아 낼 때, 집합 A에 속하는 특허 문건만을 찾아 낼 수 있으며, 본 문단에서 집합 A를 대상으로 한 모든 인용 분석을 수행할 수 있을 것이다.
상기 비교 인용 분석에서 다음과 같은 확장 구성도 가능할 것이다.
첫째, 문건 집합이 A, B, C가 있다면, A vs B, B vs C, C vs A와 같이 여러 개의 비교 조합을 생성한 다음 양자간 비교 인용 분석을 수행할 수 있을 것이다. 만약 출원인이 n개가 있다면 그 비교 조합의 개수는 nC2가 될 것이다.
둘째, 만약 위의 예에서 B와 C가 계열사 관계 등과 같이 특수한 관계가 있어 B와 C를 묶어서 A와 비교 인용 분석을 수행하는 경우라면 A vs (B 합집합 C)로 비교 인용 분석을 수행할 수 있을 것이다. 즉, 다수의 출원인별 문건 집합을 그룹화를 시켰을 때(합집합 연산을 수행함으로써 그룹별 문건 집합은 용이하게 생성 할 수 있다), 상기 그룹화된 출원인들별로 비교 인용 분석을 수행할 수 있을 것이다.
셋째, 상기 비교 인용 분석 결과를 제시할 때 각 기준별로 비교하면서 제시할 수 있다. 상기 기준은 1) 적어도 하나 이상의 다단계 계층별로의 특허 분류 기호, 2) 발명자, 3) 연도나 기간, 4) 국가, 5) 상기 1) 내지 4) 중에서 선택되는 어느 2 이상의 조합이 될 수 있다. 예를 들면, 삼성전자주식회사와 소니의 IPC 서브 클래스 단위에서의 IPC 서브 클래스별로 삼성전자주식회사가 소니의 특허를 인용한 수와 소니가 삼성전자주식회사의 특허를 인용한 수를 비교해서 나열해 줄 수 있다. 또한, 연도별로 삼성전자주식회사가 소니의 특허를 얼마나 인용하고 있는지와 소니가 삼성전자주식회사의 특허를 얼마나 인용하고 있는지를 비교해서 그래프 등으로 제시할 수도 있을 것이다.
상기 인용 분석 및 기타의 다른 분석의 수행 결과값들은 연도별 또는 기설정된 기간별로 생성될 수도 있을 것이다. 이 경우, 각 분석 수행 결과값들을 대상으로 하는 증감율, 증감속도, 증감가속도, 평균, 표준편차 등의 값을 구할 수 있을 것이다.
심사 인용 분석
이어 심사 인용 분석에 대하여 설명한다. 심사 인용 분석은 전방 인용 분석과 구조적으로 동일하며, 분석 대상 문건 집합의 개별 특허 문건 정보에 포함된 심사관의 심사 인용 문건을 마치 전방 인용 문건 집합과 동일하게 취급하는 방식으로 분석하는 것을 말한다. 심사관이 특허 문건의 심사 과정에서 활용한 선행 문건이 있는 경우, 그 선행 문건은 마치 전방 인용 정보처럼 취급할 수 있기 때문에 상기 심사 인용 분석은 특허 서지 사항 정보에 인용 정보(citation information)가 없는 경우에도 인용 분석을 활용할 수 있어 유용하다. 마찬가지로, 특정 선행 문건이 특정 후행 문건의 심사에서 심사 인용되는 경우, 상기 후행 문건은 상기 선행 문건의 후방 인용 문건처럼 취급할 수 있게 되어, 후방 인용 분석도 가능할 수 있게 된다. 즉, 분석 대상 문건 집합을 구성하는 개별 특허 문건에 대하여, 각 특허 문건을 심사 인용한 후행 문건을 찾아 내고, 상기 후행 문건들로 분석 대상 문건 집합을 구성하여 적어도 하나 이상의 본 발명의 분석을 수행할 수 있게 된다. 그러므로, 심사 인용 정보를 활용하여 전방 인용 분석 및 후방 인용 분석을 모두 수행할 수 있게 된다.
도 64에는 심사 인용 분석 방법 중 전방 인용 분석에 대한 일 실시예적 방법을 기술하고 있다.
상기 심사 인용 분석을 수행하는 본 발명의 심사 인용 분석 모듈(4130)은 적어도 하나 이상의 문건 집합을 입수하여(S6420), 문건 집합을 구성하는 개별 특허 문건 각각에 대한 심사 인용 정보를 입수하고(S6430), 입수된 심사 인용 정보에 관련된 전방 인용 문건 집합을 형성하여(S6440), 전방 심사 문건 집합을 분석 대상 문건 집합으로 하여 적어도 하나 이상의 기설정된 분석을 수행한다(S6450).
이어 본 발명의 간이 분석 방법을 설명한다. 상기 간이 분석이란, 분석 결과로 나온 수치(예를 들면, 출원인 A의 미국 출원수가 1999년에 100, 2000년에 120개, 2001년에 140개 등과 같은 분석 결과가 있을 때)에 대응되는 문건 부분 집합(예를 들면, 수치 120에 대응되는 문건 집합(출원인 = A, 연도 2000년, 국가 = 미 국으로 특정되는 문건 부분 집합)을 대상으로 하여 본 발명의 모든 분석을 수행하는 것을 말한다. 즉, 분석 결과로 나온 수치에 대응되는 문건 부분 집합을 분석 대상 문건 집합으로 하여 각종 분석을 수행하는 것을 말한다. 한편, 증가율, 점유율 등과 같이 분석 결과를 만들어 낼 때 2 이상의 다른 수치가 사용될 경우, 상기 다른 수치를 먼저 제시하고, 상기 제시된 각 다른 수치에 대해서 상기 간이 분석 과정을 실시할 수 있다.
도 61에는 상기 간이 분석 방법에 대한 일 실시예적 과정이 나와 있다.
본 발명의 분석 모듈(4100)은 분석 결과로서 특정 속성을 공유하는 셀에 대한 수치에 대한 선택 정보를 입수하고(S6120), 수치값이 2 이상의 다른 수치값의 구성 요소의 조합인 경우 구성 요소별 수치값을 제시하고 그 수치값이 대한 선택 정보를 입수하며, 수치값이 단일 구성 요소일 경우 그 단일한 수치값에 대한 선택 정보를 입수하며(S6130), 선택된 수치값에 대응되는 문건 고유 번호를 입수하고(S6140), 문건 고유 번호로 구성되는 문건 집합을 형성하며(S6150), 형성된 문건 집합에 대해 기설정된 정보처리를 수행한다(S6160).
감시 모듈(4300)
감시 모듈(4300)이 제공하는 감시 서비스란 특정한 검색식을 등록시켜 놓고, 그 검색식에 해당되는 신규 특허 정보가 있는 경우 그 신규 특허 정보를 감시 서비스를 받는 자에게 제공하는 것을 말한다. 본 발명에서 감시를 수행하는 것은 감시 모듈(4300)이 수행한다. 상기 특허 정보 감시 모듈(4300)은 감시할 검색식을 등록받고, 기설정된 시간 단위(매일, 매주, 매월, 매분기 및/또는 매년)로 상기 검색식 을 상기 검색 엔진(7000) 또는 DBMS(2100)에 질의하여, 신규한 특허 문건이 발생했을 경우, 상기 신규한 특허 문건의 발생에 대한 정보를 감시 서비스 이용자에게 그 사실, 그 문건, 또는 상기 사실 또는 상기 문건에 관한 정보를 알려 주는 기능을 수행한다. 이때, 상기 알려 주는 방식은 감시 결과를 받을 사람에게 전자 우편 또는 기타 메시지 전송 방식으로 전송하거나, 상기 감시 서비스 이용자가 상기 감시 서비스에 접속했을 때 알려 주는 방식 중 어느 하나 이상을 채용할 수 있을 것이다. 상기 감시 모듈 감시 모듈(4300)에는 감시 검색을 입수 받는 감시 검색식 등록 모듈(4310), 감시 검색/질의를 주기적으로 수행하는 주기적 검색식 질의 모듈(4330) 및 감시 결과가 있을 경우, 상기 감시 결과를 리포팅 해 주는 감시 결과 리포팅 모듈(4350)이 있을 수 있다.
감시 서비스를 수행하기 위해서는 1) 감시를 위한 검색식을 등록받는 단계; 기설정된 시간 단위로 상기 검색식을 검색 엔진(7000) 또는 DBMS(2100)에 질의하고(질의할 때는 신규 문건을 찾는 것이 목적이므로, 시간 범위(예를 들면 공개 일자 기준으로 검색 질의하는 일자 포함 기준으로 과거 6일을 시간 범위로 한정함)을 검색식에 한정하는 것이 일반적이다.), 신규 특허 문건이 있는 경우 이를 감시 서비스받은 자에게 전송하는 단계를 거칠 수 있다.
특징
본 발명의 감시 모듈(4300)에 입력되는 감시 검색식은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템에 사전 에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 감시 검색식 또는 상기 발명자 명의 단위에서 필요한 감시 검색식이 자동으로 추출되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 감시 서비스에 세팅이 되게 된다. 상기 세팅되는 감시 검색식의 종류 및 상기 세팅되는 감시 검색식을 생성하는 방법은 다음과 같은 것이 있을 수 있다. 먼저 문건 집합 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 감시 검색식에 포함될 정보는 상기 본 발명의 분석 모듈(4100)에서 생성되는 분석 결과인 경우가 다수 있다. 상기와 같은 예로는 상기 수치값, 상기 비율값 등의 최빈값, 최대값 등을 들 수가 있다. 구체적인 예는 하나씩 설명한다.
출원인 명의 단위 또는 발명자 명의 단위 단위 감시
첫째, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 적어도 하나 이상의 최빈 특허 분류 기호를 빈도순으로 랭킹을 매겨 추출하고, 상기 최빈 특허 분류 기호를 기설정된 국가 또는 특허 정보 데이터베이스(2300)가 입수하는 문건의 발생국(WIPO를 포함한다) 중에서 선택되는 적어도 어느 하나 이상의 국가별로 감시할 검색식으로 등록해 놓을 수 있다. 상기 특허 분류 기호는 IPC, USPC, FI, FT, ECLA 중에서 선택되는 어느 하나 이상인 것이 바람직하며, 상기 특허 분류 기호의 깊 이(depth, IPC의 경우, 섹션(section), 서브섹션(subsection), 클래스(class), 서브클래스(subclass), 그룹(group), 서브그룹(subgroup)으로 구분되며, 서브 그룹 이하에서는 도트(dot)의 수로 깊이를 결정한다. 다른 특허 분류 기호도 독자적인 상하위 특허 분류 기호 체계를 가지고 있다)의 설정은 1) 그룹 또는 서브그룹 단위에서 결정하는 방법, 2) 2 도트 서브그룹 또는 3도트 서브그룹 등과 같이 상기 서브그룹 이하의 단위에서 수행하는 방법 등이 있을 수 있다. 다만, 상기 특허 분류 기호의 깊이는 서브 클래스 단위일 수도 있지만, 이 경우에는 너무 많은 특허 문건이 나올 수 있어 노이즈(noise)가 심하게 된다.
둘째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 대해서 1) 국내외에서 가장 많은 특허를 출원하거나 등록하는 자, 2) 국내외에서 일정 개수 이상을 출원하면서도 상기 최빈 특허 분류 기호에 집중율이 높은 자, 3) 국내외에서 기설정된 최근 기간 내에 특허 출원 속도나 특허 등록 속도가 기설정된 기준 이상이 되는 출원인을 추출하고, 상기 출원인을 감시 검색식으로 할 수 있다.
셋째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 대해서 상기 특허 분류 기호 및 상기 특허 분류 기호의 하위 특허 분류 기호에 대응되는 기설정된 최근 기간 내의 신규 문건 수의 증가 속도가 높은 특허 분류 기호를 감시 검색식으로 할 수 있다.
넷째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 가장 많은 특허를 출원하거나 등록하는 적어도 하나 이상의 국내외의 발명자 를 추출해 내고, 상기 발명자를 감시 검색식으로 할 수 있다.
다섯째, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 인용 정보(인용(backward citation), 피인용(forward citation)를 추출해 내고, 국내외적으로 최빈 인용자 및/또는 최빈 피인용자를 추출해 내고, 상기 최빈 인용자 또는 피인용자를 출원인으로 하여 감시 검색식으로 할 수 있다.
여섯째, 상기 문건 집합의 어느 하나 이상의 개별 특허 문건을 인용하는 자를 감시하기 위하여(상기 특허 문건을 인용하는 자를 찾아 내기 위해서), 상기 문건 집합을 이루는 전체 특허 문건의 출원 번호 또는 등록 번호를 OR 연산자로 묶어 감시 검색식으로 할 수 있다.
일곱째, 상기 첫번째부터 여섯번째의 방법 중에서 선택되는 2 이상의 방법을 결합(mix)하여 감시 검색식을 생성할 수 있을 것이다. 검색 엔진(7000)이 지원하는 각 필드별로 검색식을 입력할 수 있을 것이며, 같은 필드의 경우라면 각 방법에서 도출되는 검색식을 and, or와 같은 연산자를 사용하여 감시 검색식을 생성할 수 있음은 당업자에게는 당연하다 할 것이다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 전체 문건 집합 단위의 감시 검색식은 각 감시 주제별로 폴더화 되어 감시 서비스 하위에 존재하면서 사용자에게 노출되는 것이 바람직하다. 예를 들어 설명하면, 상기 첫번째 방법의 감시 검색식의 감시 주제는 "최빈 특허 분류 기호를 통한 특허 감시"라는 이름의 폴더가 만들어 지는 것 이 바람직하며, 상기 폴더 내에는 각 국가별로 하위 폴더 내지는 하위 계층 구조가 만들어 지는 것이 바람직할 것이다. 상기 전체 문건 집합 단위의 감시 검색식으로 감시한 결과는 상기 폴더 또는 계층 구조에서 확인되는 것이 바람직할 것이다. 물론, 상기 사전에 세팅되는 검색식을 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자 또는 발명자가 수정할 수 있음은 물론이다 하겠다.
개별 문건 단위 감시
이하, 개별 문건 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 개별 문건 단위에는 적어도 하나 이상의 특허 분류 기호가 포함되어 있으므로, 상기 특허 분류 기호를 중심으로 설명한다.
첫째, 상기 특허 분류 기호 자체를 감시 검색식으로 생성할 수 있을 것이다. 이때, 상기 특허 분류 기호의 하위 특허 분류 기호를 자동으로 포함시키는 것이 더욱 타당할 것이다. 또한, 2 이상의 특허 분류 기호가 있을 때, 상기 특허 분류 기호를 조합하여 and 연산하는 방식으로 생성되는 복수개의 검색식도 가능할 것이다. 이때, 주 특허 분류 기호를 포함시키는 것이 당연할 것이며, 상기 개별 특허 문건에서 입수되는 모든 특허 분류 기호에 대해 and 연산을 하는 감시 검색식이 포함되는 것이 바람직할 것이다.
둘째, 상기 특허 분류 기호에 대해 1) 국내외에서 가장 많은 특허를 출원하거나 등록하는 자, 2) 국내외에서 일정 개수 이상을 출원하면서도 상기 최빈 특허 분류 기호에 집중율이 높은 자, 3) 국내외에서 기설정된 최근 기간 내에 특허 출원 속도나 특허 등록 속도가 기설정된 기준 이상이 되는 출원인을 추출하고, 상기 출원인을 감시 검색식으로 할 수 있다.
셋째, 상기 특허 분류 기호에 대해서 상기 특허 분류 기호 및 상기 특허 분류 기호의 하위 특허 분류 기호에 대응되는 기설정된 최근 기간 내의 신규 문건 수의 증가 속도가 높은 특허 분류 기호를 감시 검색식으로 할 수 있다.
넷째, 상기 특허 분류 기호에 가장 많은 특허를 출원하거나 등록하는 적어도 하나 이상의 국내외의 발명자를 추출해 내고, 상기 발명자를 감시 검색식으로 할 수 있다.
다섯째, 상기 개별 특허 문건을 인용하는 자를 감시하기 위하여(상기 특허 문건을 인용하는 자를 찾아 내기 위해서), 상기 개별 특허 문건의 출원 번호 또는 등록 번호를 감시 검색식으로 할 수 있다.
여섯째, 상기 첫번째부터 다섯번째의 방법 중에서 선택되는 2 이상의 방법을 결합(mix)하여 감시 검색식을 생성할 수 있을 것이다. 검색 엔진(7000)이 지원하는 각 필드별로 검색식을 입력할 수 있을 것이며, 같은 필드의 경우라면 각 방법에서 도출되는 검색식을 and, or와 같은 연산자를 사용하여 감시 검색식을 생성할 수 있음은 당업자에게는 당연하다 할 것이다.
이하, 개별 문건 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 개별 문건 단위에는 적어도 하나 이상의 특허 분류 기호가 포함되어 있으므로, 상기 특허 분류 기호를 중심으로 설명한다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단 위 특허 정보 서비스 시스템이 관리하는 개별 문건 단위의 감시 검색식은 각 감시 주제별로 폴더화 되어, 상기 개별 문건의 서지 사항 또는 관리 화면에 위치되어 노출되는 것이 바람직하다. 예를 들어 설명하면, 상기 첫번째 방법의 감시 검색식의 감시 주제는 "최빈 특허 분류 기호를 통한 본 문건과 유사한 특허 감시"라는 이름의 폴더가 만들어 지는 것이 바람직하며, 상기 폴더 내에는 각 국가별로 하위 폴더 내지는 계층 구조가 만들어 지는 것이 바람직할 것이다. 상기 전체 문건 집합 단위의 감시 검색식으로 감시한 결과는 상기 폴더 내지는 계층 구조에서 확인되는 것이 바람직할 것이다.
출원인 명의 단위 특허 정보 서비스 시스템
본 발명의 출원인 명의 단위 특허 정보 서비스 시스템이란, 개별적인 출원인 명의 단위로 된 특허 정보 시스템을 말하며, 상기 출원인 명의 단위 특허 정보 서비스 시스템이 포함하는 특허 문건 정보에는 상기 출원인 명의가 출원인 및/또는 특허권자 필드에 포함되어 있는 것을 특징으로 한다. 본 발명의 발명자 명의 단위 특허 정보 서비스 시스템이란, 개별적인 발명자 명의 단위로 된 특허 정보 시스템을 말하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템이 포함하는 특허 문건 정보에는 상기 발명자 명의가 발명자 필드에 포함되어 있는 것을 특징으로 한다. 하나의 출원인 명의 단위 특허 정보 서비스 시스템에는 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 대응될 수 있음은 물론이다 하겠다. , 출원인 명의 단위 특허 정보 서비스 시스템의 하부에는 상기 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 구성되어 있을 수 있으며 이때, 상기 출 원인 명의 단위 특허 정보 서비스 시스템의 관리자가 특정한 발명자의 상기 발명자 명의 단위 특허 정보 서비스 시스템으로의 접근 권한을 관리할 수 있을 것이다.
본 발명의 개별 단위 출원인 명의 단위 특허 정보 서비스 시스템에 대해서는 도 2에 그 상세한 구성이 나와 있다. 상기 개별 단위의 출원인 명의 단위 특허 정보 서비스 시스템에는 상기 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진, 발명자 단위의 특허 정보 시스템을 생성하는 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 관리하는 관리 모듈, 출원인 명의 단위로 관리되는 출원인 명의 단위 특허 정보 데이터베이스(2300), 발명자 단위로 관리되는 발명자 명의 단위 특허 정보 데이터베이스(2300)가 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진(1100)에는 출원 명의인이 결정될 때, 상기 출원 명의인을 출원인/특허권자로 하는 적어도 하나 이상의 국가에의 문건을 입수하는 출원 명의인 단위 문건 입수 모듈(1110), 입수된 출원 명의인 단위의 문건에 대한 정보를 데이터(테이블, DB or view에 들어있는 것을 포함한다)로 생성하는 출원 명의인 단위 문건 집합 DB 생성 모듈(1130) 및 출원 명의인 단위로 특허 정보의 통계, 분석 및 감시, 리포팅 등의 본 발명의 인텔리전스 정보를 생성하는 출원인 명의 단위 특허 정보 인텔리전스 생성 모듈(1150)이 포함되어 있다. 이때, 상기 출원인 명의 단위 문건 집합은 엄격하게 말하면, 출원인 명의 단위 문건 정보 데이터로 그 데이터가 물리적인 DB, 물리적인 테이블로 저장 되어 있을 수 있으며, 뷰(물리적인 뷰(materialized view를 포함한다), 또는 기타 임의의 형태의 데이터 구조를 말하는 것으로, 기술의 편의상 출원인 명의 단위 문건 집합 DB라 칭한다. 이는 발명자 명의 단위 문건 집합 DB에서도 마찬가지로 적용된다.
본 발명의 상기 발명자 단위 특허 정보 서비스 시스템 생성 엔진(1300)은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성엔진과 마찬가지로 작동하며, 그 하부에 발명자 단위 문건 입수 모듈(1310), 발명자 단위 문건 집합 DB 생성 모듈(1330) 및 발명자 명의 단위 특허 정보 인텔리전스 생성 모듈(1350)을 포함할 수 있다.
본 발명의 관리 모듈(1500)에는 출원인 명의 단위 특허 정보 서비스 시스템을 관리하는 출원 명의인 단위 관리 모듈(1510)과 개별 발명자 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 관리하는 발명자 명의 단위 관리 모듈(1530)및 관리 정보를 포함하고 있는 관리 정보 DB(1550)가 있다. 상기 출원인 명의 단위 관리 모듈에는 출원인 명의 단위의 문건 집합 목록을 관리하는 출원인 명의 단위 문건 집합 관리 모듈(1511), 출원인 명의 단위의 특허 정보 인텔리전스를 관리하는 출원인 명의 단위 특허 정보 인텔리전스 관리 모듈(1513) 및 출원인 명의 단위에 속한 개별 발명자의 권한을 관리하는 발명자 권한 관리 모듈(1515)가 있으며, 발명자 등을 적어도 하나 이상의 단계를 두어 다단계 계층으로 관리하는 다단 계층 생성 관리 모듈(1517)이 있다. 한편, 상기 발명자 단위 관리 모듈(1530)에는 발명자 명의 단위 문건 집합 관리 모듈(1531), 발명자 명의 단위 특허 정보 인텔리전스 관리 모 듈(1533)
한편, 상기 출원인 명의 단위 특허 정보 데이터베이스(1700)에는 출원인 명의 단위 특허 문건 집합 DB(1710) 및 출원인 명의 단위 특허 정보 인텔리전스 DB(1730)가 있으며, 상기 발명자 단위 특허 정보 데이터베이스(1900)에는 발명자 단위 특허 문건 집합 DB(1910) 및 발명자 단위 특허 정보 인텔리전스 DB(1930)가 있다.
한편, 개별적인 출원인 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가질 수 있으며, 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 방법은 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템으로의 링크 정보를 가지고 있거나, 다른 출원인 명의 단위 특허 정보 서비스 시스템이 자신의 관리 권한 하에 있는 방법이 있을 수 있다. 이처럼 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 것은 발명자 단위 특허 정보 서비스 시스템의 주체인 개별 발명자도 가능한 것이다. 즉, 하나의 주체로서 개별 발명자 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템에 대한 링크 정보를 가지거나, 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템에 대한 관리 권한을 가질 수도 있다.
본 발명의 개별 단위 특허 정보 서비스 시스템 생성 엔진은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진 중 적어도 어느 하나 이상을 포함한다. 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 출원인 명의 단위 문건 집합 입수 모듈, 출원인 명의 단위 문건 집합 관리 모듈(1511)을 포함하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 발명자 명의 추출 모듈, 발명자 명의 단위 문건 집합 입수 모듈 및 발명자 명의 단위 문건 집합 관리 모듈(1531)을 포함한다. 본 발명의 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진과 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의를 입수 받았을 때, 적어도 하나 이상의 국가별로, 상기 국가별 특허 DB에서 상기 출원인 명의로 출원되거나 등록된 모든 특허 문건을 입수하고, 상기 입수된 특허 문건에서 개별 발명자 명의를 자동적으로 추출하고, 상기 개별 발명자 명의마다의 특허 문건을 자동적으로 입수하여, 출원인 명의 단위의 특허 문건 집합과 상기 출원인 명의 하의 개별 발명자 단위의 특허 문건 집합을 생성하고, 상기 출원인 명의 단위 문건 집합과 상기 발명자 단위 문건 집합에 대한 관리를
이어서, 상기 특허 정보 데이터베이스에서 출원인 명의 단위의 특허 정보 시스템을 생성하는 방법에 대해서 설명한다.
출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진
출원인 명의 단위 문건 집합 입수 모듈
본 발명의 출원인 명의 단위 특허 정보 서비스 시스템은 상기 상기 출원인 명의와 관련된 특허 문건 집합을 포함하고 있다. 상기 특허 문건 집합은 상기 출원인 명의로 출원되거나 등록된 출원인 명의 단위 문건 집합과 상기 출원인 명의 단위의 문건 집합에 포함된 개별 발명자별의 발명자 명의 단위의 문건 집합을 포함한 다. 상기 출원인 명의 단위 문건 집합과 상기 발명자 명의 단위 문건 집합은 적어도 하나 이상의 국가별 특허 DB를 포함하는 전체 특허 DB로부터 입수할 수도 있지만, 개별 국가별 특허 DB로부터 입수되는 것이 바람직할 것이다.
상기 출원인 명의 단위 문건 집합의 입수 방법은 검색 엔진(7000)을 통해서 입수하는 방법과 DBMS(2100)를 통해서 입수하는 방법이 있을 것이다.
먼저 검색 엔진(7000)을 통해서 입수하는 방법을 설명한다. 본 발명의 검색 엔진(7000)은 서처(searcher) 또는 검색창 등에 입력되는 검색어를 통해서 특허 문건을 검색가능하도록 하기 위하여, 인덱서(indexer)를 통하여 특허 문건을 인덱싱한다. 상기 인덱싱을 수행하면 검색 인덱스가 생성된다. 상기 검색 인덱스를 생성하는 인덱싱 과정에서, 상기 특허 문건에 포함된 각 필드(출원인, 발명자, 특허분류기호, 대리인, 발명의 명칭 등)별로 인덱스를 생성할 수 있다. 검색 엔진(7000)에 검색하기를 원하는 필드가 지정되고, 검색어를 입력하게 되면, 그 필드에 한정된 검색 결과가 제공되게 된다. 예를 들면, 출원인 필드에 출원인 명의(예를 들면 "삼성전자주식회사" 등)를 입력하게 되면, 그 출원인 명의로 된 특허 문건이 검색 결과로 나오게 된다. 이때, 국가를 한정하거나, 기간을 한정하게 되면, 그 국가 또는 그 기간에 한정된 검색 결과가 나오게 된다. 이와 같은 검색 엔진(7000)에의 질의를 통해, 상기 출원인 명의로 된 특허 문건 집합이 결정되게 된다. 그리고, 상기 검색 결과를 통해 상기 검색 결과와 관련된 특허 문건의 일부(예를 들면 서지 사항) 또는 전체(예를 들면 전문) 내용에 대해 접근할 수도 있을 것이다. 물론, 검색 엔진(7000)을 통해서 특정 출원인 명의의 문건 집합을 특정할 수 있는 문건 고유 번호(예를 들면 출원 번호 등)만을 입수하고, 상기 입수된 문건 고유 번호를 상기 DBMS(2100)를 통하여 상기 특허 DB에 질의함으로써, 상기 특허 문건의 일부 또는 전체 내용에 대한 정보를 입수할 수도 있을 것이다.
이어서, DBMS(2100)를 통해 특허 DB에 쿼리를 질의함으로써, 상기 출원인 명의로 출원되거나 등록된 출원인 명의 단위 문건 집합을 생성하는 방법을 설명한다. 특허 DB에는 각종 필드(출원인, 발명자, 특허분류기호, 대리인, 발명의 명칭 등)들이 있을 수 있으며, 상기 특허 DB를 구성하는 각 레코드의 값이 필드별로 입력되어 있다. 상기 특허 DB에 필드명을 지정하고 select 등의 SQL 등과 같은 쿼리를 질의함으로써, 원하는 질의 결과를 생성할 수 있다. 즉, 질의의 대상이 되는 DB 또는 테이블을 특정하고, 상기 DB 또는 테이블에 원하는 필드 및, 필드값(예를 들면 출원인 명의로서 "삼성전자주식회사" 등)를 지정하면, DBMS(2100)는 입력받은 쿼리에 대응되는 질의 결과를 출력하게 된다. 이와 같은 방법으로 출원인 명의 단위 문건 집합을 생성하게 된다.
모든 특허 문건에는 그 문건을 식별할 수 있는 문건 고유 번호(Document ID)가 할당될 수 있고, 출원 번호나 등록 번호 등이 그 고유 번호가 될 수도 있으며, "국가 표시 + 출원 번호", "국가 표시 + 등록 번호"가 고유 번호가 될 수도 있으며, 공개 번호 등과 같은 다른 번호 체계도 가능함은 물론이다 하겠다. 이들 번호 또는 이들 번호를 활용한 번호 또는 이들 번호와는 독립적이지만, 특정 특허 문건을 특정할 수 있는 임의의 식별 체계는 문건 고유 번호가 될 수 있다.
상기 출원인 명의 단위 문건 집합을 생성하는 것은 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진에 포함되어 있는 출원인 명의 단위 문건 집합 입수 모듈이 수행한다. 상기 출원인 명의 단위 문건 집합 입수 모듈은 검색 인덱스 또는 특허 DB에서 특정한 출원인 명의로 출원되거나 등록되어 있는 특허 문건을 상기 출원인 명의를 검색식 또는 쿼리로 하여 입수해 온다. 이때, 상기 출원인 명의 단위 문건 집합 입수 모듈이 입수한 문건은 출원인 명의 단위로 임시적인 뷰(view) 또는 물리적인 뷰(materialized view)를 생성할 수도 있으며, 상기 출원인 명의 단위의 하부에 출원인 명의 단위 문건 집합을 특정할 수 있는 출원번호나 등록 번호 등과 같은 상기 문건 고유 번호가 저장되어 있을 수 있다.
즉, 특허 문건의 자동 입수는 검색 엔진(7000)을 통해서도 가능하지만 DB 쿼리를 통해서도 가능하다. 검색 엔진(7000)으로 처리하는 방법은 검색식에 출원인 또는 출원인 식별 코드를 입력하는 방법으로 처리 될 수 있다. 물론, 이 경우에는 검색 인덱스에 출원인 또는 출원인 식별 코드가 인덱스에 포함되어 있어야 한다. DB 쿼리로 처리하는 방법은 표준 SQL문 또는 기타 이에 대응되는 쿼리문으로 출원인 또는 출원인 식별 코드를 DBMS(2100)에 질의하는 방식으로 수행될 수 있다. 물론, 이 때에도 상기 특허 정보 데이터에 출원인 또는 출원인 식별 코드가 포함되어 있어야 한다. 즉, 출원인 명의 단위 문건 집합 입수 모듈은 출원인 또는 출원인 식별 코드를 입수받고, 상기 입수받은 출원인 또는 출원인 식별 코드를 검색 엔진(7000) 또는 DBMS(2100)에 질의하는 방식으로 상기 출원인 또는 출원인 식별 코드에 대응되는 특허 문건에 대응되는 출원 번호 등의 문건 고유 번호를 입수한다. 문건 고유 번호가 확정되면, 상기 문건 고유 번호에 대응되는 특허 문건 을 입수할 수 있게 된다.
국가별 문건 입수
상기 출원인 명의 단위 문건 집합 입수 모듈이 상기 특허 문건을 입수하는 방법은 각 국가별로 진행되는 것이 바람직하다. 이를 위해서 각 국가별로 상기 출원인 식별 코드를 통일시켜 놓았을 경우(출원인 대표명화를 제1국 기준으로뿐만 아니라, 적어도 하나 이상의 제 2국 기준으로도 대표명화를 시키고, 상기 제 1국의 출원인과 제 2국의 출원인이 동일한 주체일 경우에는 동일한 출원인 식별 코드를 할당할 수 있다. 출원인은 제1국 기준 또는 제2국 기준 중 적어도 어느 하나 이상으로 대표명화가 되어 있는 것이 바람직하다.(본 명세서에는 출원인 대표명화를 하는 방법에 대해서도 기술할 것이다.) 대표명화가 되면, 출원인 식별 코드 vs. 제1국에서의 출원인 명의 표시 vs 제2국에서의 출원인 명의 표시 vs 제 n국에서의 출원인 명의 표시에 대한 대응 관계가 도출되게 된다. 물론, 제 i국에서의 출원인 명의 표시는 복수개가 될 수 있는데, 상기 복수개의 출원인 명의 표시는 출원인 대표명화의 과정에서 도출되게 되며, 상기 제 i국에서의 복수개의 출원인 명의 표시는 단일한 제 i국에서의 출원인 명의 표시로 각 국가 단위에서 대표명화를 시켜 놓을 수 있다.
그러므로, 상기 검색 엔진(7000) 또는 상기 DBMS(2100)에 출원인 명의 또는 출원인 식별 코드의 입력 만으로 각 국가별 검색 인덱스 또는 각 국가별 특허 정보 데이터 또는 전체 특허 정보 데이터에서 상기 출원인 식별 코드에 대응되는 특허 문건을 입수할 수 있을 것이다.
상기 제1국과 제2국에서 출원인 대표명화를 시켜 놓지 않은 경우라면, 상기 국가별로의 특허 문건 입수 방법은 1) 조약 우선권 주장 번호를 이용하는 방법 2) 각 국가별 표기 방식으로 표기되는 상기 출원인 명의를 이용하는 방법이 있을 수 있다. 특히 후자에서 오류의 개수를 줄이기 위해서 주식회사, 가이시키 가뷰사, co., ltd, 등과 같이 식별력 없는 구성 요소는 제외되면서 실시되는 것이 바람직하다. 이에 대해서는 출원인 대표명화 방법에서 상세히 설명한다.
상기와 같은 방법을 통하여 각 국가 단위로 또는 국가 통합 단위로 특정한 출원인 단위에서 관리되어야 되는 특허 문건 집합이 1차적으로 결정나게 된다. 상기 출원인 명의 단위 문건 집합 입수 모듈이 입수한 특허 문건 집합은 출원인 명의 단위 문건 집합 데이터의 형태로 관리 된다. 상기 출원인 명의 단위 문건 집합 데이터는 DBMS(2100)적 관점에서 임시적인 데이터 형태로 저장될 수도 있지만, 출원인 명의 밑에 상기 출원인 명의 단위 문건 집합 데이터를 구성하는 문건 고유 번호를 저장하는 방식으로도 저장될 수 있다. 이때, 임시적인 데이터 형태로 저장되는 방법으로는 통상적인 뷰(view)로 저장될 수 있다. 또한, 상기 출원인 명의 단위 문건 집합 데이터는 최신 DBMS(2100)가 지원하는 materialized view로 저장될 수 있으며, 영구적인 방식으로 테이블로 저장될 수도 있다. 상기 출원인 명의 단위 문건 집합 데이터가 어떤 형태로 저장되든지, DBMS(2100)가 지원하는 join 등의 명령에 의해, 상기 출원인 명의 단위 문건 집합 데이터는 사용자가 필요로 하는 정보를 포함하는 시각적인 view를 제공해 줄 수 있다. 상기 출원인 명의 단위 문건 집합 데 이터에는 상기 각 특허 문건에 접근할 수 있는 문건 고유 번호가 필수적으로 포함되어 있어야 하며, 상기 문건 고유 번호 이외에 상기 출원인 명의 단위 특허 문건에 대한 전체 데이터에서 선택되는 정보가 더 포함되어 있을 수 있다. 상기 생성된 출원인 명의 단위 문건 집합은 출원인 명의 단위 문건 집합 관리 모듈(1511)이 관리하게 된다.
문건 관리
상기 출원인 명의 단위 문건 집합 관리 모듈(1511)의 상기 특허 문건에 대한 관리는 CRUD(생성 create, 읽기 read, 업데이트 update, 삭제 delete)를 포함한다. 상기 생성, 읽기, 업데이트, 삭제 등의 관리는 상기 문건에 대한 접근 권한에 따라 상기 4가지 관리 기능 중 적어도 하나 이상이 기능이 수행되는 방식으로 관리된다. 상기 출원인 명의 단위 관리 모듈을 통하여 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 사실과 다른 잘못된 레코드(record) 또는 문건 고유 번호를 삭제할 수 있으며, 특정한 레코드 또는 문건 고유 번호를 추가할 수 있으며, 문건 고유 번호에 대응되는 내용 정보 중 변동되거나 수정된 것은 그 변동 또는 수정 사항을 반영할 수 있다. 상기와 같은 삭제, 추가, 또는 업데이트가 필요한 이유는 특허 문건의 입수 시점과 현재 시점 간에서 특정한 특허 문건에 대한 정보에 변경이 있을 수 있기 때문이다. 상기 변경의 예로는 1) 출원 중 또는 등록 후에서의 양도 양수를 통한 명의 변경, 2) 발명자나 출원인 명의 정보의 수정(합병, 회사 명칭의 변경, 주소 변경, 출원인 또는 발명자의 추가나 감축 등을 포함한다), 3) 특허 분류 기호의 수정, 4) 특허 명세서의 보정 등 특허 명세서 상의 내용에서 변경이 있 는 경우 이에 대한 반영, 5) 외국 출원, 분할 출원 등과 같은 패밀리의 증가나 감축 등을 들 수 있다.
상기와 같은 과정을 통하여, 특정한 출원인 명의 단위에 속하는 특허 문건 부분 집합을 추출할 수 있게 되고, 상기 특허 문건 부분 집합을 관리 대상 문건으로 하는 출원인 명의 단위 특허 정보 서비스 시스템이 생성될 수 있게 된다.
도 26은 출원인 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
상기 관리 모듈은 출원인 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2620), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2630), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2640), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2650), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2660), 입수된 변동 사항을 저장한다(S2670).
도 27은 발명자 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
상기 관리 모듈은 발명자 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2720), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고 (S2730), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2740), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2750), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2760), 입수된 변동 사항을 저장한다(S2770).
발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진
구성
출원인 명의 단위의 특허 문건 집합이 결정이 되면, 상기 특허 문건 집합에 포함되어 있는 적어도 하나 이상의 발명자를 추출할 수 있게 되고, 추출된 발명자는 발명자 목록 데이터로 관리 된다. 상기와 같은 발명자의 추출 및 상기 발명자 목록 데이터를 생성하고 관리하는 것은 발명자 명의 추출 모듈이 수행하게 된다.
상기 출원인 명의 정보와 상기 발명자 목록 데이터의 발명자 정보를 기반으로 하여 적어도 하나 이상의 개별 발명자 단위의 문건 집합을 입수할 수 있게 된다. 상기 발명자 단위 문건 집합을 입수하는 것은 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진에 포함된 발명자 명의 단위 문건 집합 입수 모듈이 수행하게 된다. 상기 발명자 명의 단위 문건 집합 입수 모듈은, 상기 출원인 명의 단위의 특허 문건 집합으로부터 그 특허 문건과 관련된 발명자 목록을 활용하여, 상기 발명자 단위로 상기 출원인 명의 단위 특허 문건 집합의 부분 집합인 발명자 명의 단위 특허 문건 집합을 생성하게 된다. 상기 생성된 발명자 명의 단위 문건 집합은 발명자 명의 단위 문건 집합 관리 모듈(1531)이 관리하게 된다.
발명자 목록 및 식별 코드
상기 출원인 명의 단위의 특허 문건 집합이 특정/결정 되게 되면, 상기 특허 문건 집합의 서지 사항을 모두 입수한 다음, 상기 서지 사항 중 발명자 필드의 모든 정보를 입수할 수 있게 된다. 상기 발명자 정보를 입수하는 과정에서 상기 특허 문건 집합과 관련된 발명자의 전체 목록을 알 수 있게 되고, 상기 발명자 전체 목록에 포함된 각 발명자에 발명자 식별 코드를 생성하여 부여할 수 있다.
발명자별 문건 추출
발명자 명의 추출 모듈이 생성한 발명자 전체 목록이 있을 경우, 상기 발명자와 상기 발명자가 발명자로 등재되어 있는 특허 문건 부분 집합을 추출하는 구체적인 방법으로 다음과 같은 3가지 방법이 예시적으로 채택될 수 있다. 첫째, 검색 엔진(7000)을 이용하는 것으로서, 검색식에 "출원인 또는 출원인 식별 코드"와 "개별 발명자 이름"을 and 조건으로 검색하는 방법이다. 둘째는, DBMS(2100)를 이용하는 것으로써, SQL쿼리문에 "출원인 또는 출원인 식별 코드"와 "개별 발명자 이름"을 and 조건으로 질의하는 방법이다. 셋째는 상기 출원인 명의 단위 문건 집합에서 발명자 목록을 생성할 때, 출원번호 등의 문건 고유 번호와 발명자의 대응 관계(개별 특허 문건 마다 1:n 관계)가 생성되므로, 상기 대응 관계의 누적을 통해서, 역 으로 "발명자 vs 발명자자 포함된 특허 문건 집합의 문건 고유 번호" 관계를 생성해 내는 것이다. 상기와 같은 대응 과정이 상기 특허 문건 집합 전체에 대해서 이루어 지면, 상기 발명자 식별 코드와 대응되는 적어도 하나 이상의 특허 문건 부분 집합이 추출할 수 있게 된다. 상기와 같은 3가지 방법 중 어느 하나 이상의 방법을 통해, 특정한 한 발명자가 발명자로 등재되어 있는 적어도 하나 이상의 특허 문건 부분 집합이 1차적으로 결정나게 되며, 상기 발명자 단위로 결정되는 특허 문건 부분 집합은 상기 발명자 단위 문건 DB 생성 모듈에 의해 발명자 단위 문건 DB에 저장된다.
도 16은 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S1620), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진(7000) 또는 DB질의를 통하여 검색하며(S1630), 출원인 명의로 출원되거나 등록된 문건이 있는 가를 판단한(S1640) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한다(S1650). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S1660), 상기 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S1670). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.
도 17은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고(S1720), 목록에 있는 개별 출원 명의인 정보를 입수하며(S1730), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S1740), 문건이 있는 가를 판단하고(S1750) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S1760), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S1770), 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S1780), 상기와 같은 과정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인이 있는가를 판단한(S1790), 다음 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.
도 18은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의 단위 특허 정보 서비스 시스템 생성을 위한 문건 집합을 입수하고(S1820), 상기 문건 집합에서 출원 명의인을 추출하고 출원 명의인 목록 정보를 생성한다(S1830)
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고 목록에 있는 개별 출원 명의인 정보를 입수하며(S1840), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S1750), 문건이 있는 가를 판단한(S1860) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S1870), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S1880), 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S1890), 상기와 같은 과정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인 있는지를 판단하고(S1891) 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.
도 19은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 외부의 제3자로부터 입수하고(S1920), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진(7000) 또는 DB질의를 통하여 검색하며(S1930), 출원인 명의로 출원되거나 등록된 문건이 있는가를 판단하고(S1940) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한다(S1950). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S1960), 상기 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S1970). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.
상기 도 16 내지 도 19의 방법은 개별 국가를 특정하지 않거나, 개별 국가를 특정하는 경우나 모두 적용될 수 있을 것이다. 만약 개별 국가를 특정하지 않는 경우라면 출원인 대표명화가 전제되어야 할 것임은 분명하다 할 것이다.(특히 언어가 다른 국가일 경우에는 더욱 그러할 것이다.)
도 20은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 특허 정보 데이터베이스(2300)를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 16 내지 도 19의 방법은 모두 적용될 수 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2020), 국가 목록을 입수하며(S2030), 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고(S2040), 문건이 있는 지 판단하고(S2050) 없는 경우에는 국가 단위에서 완료하며, 있는 경우에는 국가 단위에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2060), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 국가 단위에서 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2070), 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며(S2080) 국가 목록에 처리하지 않은 국가가 있는가를 판단하여(S2090) 없는 경우 완료하고, 있는 경우에는 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는(S2040) 단계를 다시 수행한다.
도 21은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2120), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2130), 문건이 있는가를 판단한(S240) 다음, 없으면 제 1국에서 완료하고 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2150), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2160), 제1국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2170) 이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하며(S2180), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2190), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2191), 제 2국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발 명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2193),
도 22는 우선권 주장 번호를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2220), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는 단계(S2230),
문건이 있는를 판단하며(S2240) 없는 경우 제 1국에서 완료하며, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2250), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2260), 제1국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2270).
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고(S2280), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2290), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하고, 발명자별 로 특허 문건을 대응시키고(S2291), 제 2국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2293).
도 23은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2320), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2330), 문건이 있는가를 판단하고(S2340), 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2350), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2360), 제1국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2370),
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하고(S2380), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2390), 제2국에서 입수되는 특허 문건을 패밀리 특허 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하며(S2391), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2393).
도 24는 패밀리 정보 및 우선권 주장 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고(S2420), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며(S2403), 문건이 있는가를 판단한(S2440) 다음, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2450), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고(S2460), 제1국에서 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2470).
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고(S2480), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며(S2490), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건을 우선권 주장 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하고(S2491), 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2493).
문제 해결
하나의 출원인이 대기업일 경우, 동일한 이름을 사용하는 다른 발명자(동명이인)이 있을 수 있는데, 이 경우에는 주소 정보를 활용하여 양자를 구분시킬 수 있다. 또한, 상기 출원인 명의 단위의 특허 문건 입수와 마찬가지로 상기와 같은 발명자 단위의 특허 문건의 입수 방법은 각 국가별로 진행되는 것이 바람직하다. 이때, 국가별로 발명자 단위의 특허 문건 입수는 1) 출원인 대표명화 또는 발명자 대표명화가 되어 있는 경우에는 각 국가별로 대표명화된 정보를 통해서 찾는 방법, 2) 대표명화가 되어 있지 않은 경우에는 조약 우선권 주장 번호를 통해서 이루어 지는 것이 바람직하다. 즉, 조약 우선권 주장 번호를 통해서 제 1국의 출원과 관련된 제 2국의 출원의 동일성 내지 대응성을 찾아내고, 동일성 내지 대등성이 인정되는 양 국가의 출원에서 발명자는 동일하게 취급하는 방법을 채택할 수 있다.
문건 관리
상기 발명자 명의 단위 문건 집합 관리 모듈(1531)의 상기 특허 문건에 대한 관리 내용은 크게, 삭제, 추가 또는 업데이트(변동 사항 반영 또는 수정을 포함한다) 중 어느 하나 이상일 수 있다. 상기 발명자 명의 단위 문건 집합 관리 모듈(1531)을 통하여 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자(상기 관리자는 발명자 자체일 수도 있지만, 다른 제3자일 수도 있다)는 사실과 다른 잘못된 레코드(record) 또는 문건 고유 번호를 삭제할 수 있으며, 특정한 레코드 또는 문건 고유 번호를 추가할 수 있으며, 문건 고유 번호에 대응되는 내용 정보 중 변동되거나 수정된 것은 그 변동 또는 수정 사항을 반영할 수 있다. 상기와 같은 삭제, 추가, 또는 업데이트가 필요한 이유는 특허 문건의 입수 시점과 현재 시점 간에서 특정한 특허 문건에 대한 정보에 변경이 있을 수 있기 때문이다. 상기 변경의 예로는 1) 출원 중 또는 등록 후에서의 양도 양수를 통한 명의 변경, 2) 발명자나 출원인 명의 정보의 수정(합병, 회사 명칭의 변경, 주소 변경, 출원인 또는 발명자의 추가나 감축 등을 포함한다.), 3) 특허 분류 기호의 수정, 4) 특허 명세서의 보정 등 특허 명세서 상의 내용에서 변경이 있는 경우 이에 대한 반영, 5) 외국 출원, 분할 출원 등과 같은 패밀리의 증가나 감축 등을 들 수 있다.
상기와 같은 과정을 통하여, 특정한 출원인 명의 단위에 속하는 특정한 발명자 단위로 상기 발명자가 발명자로 등재된 특허 문건 부분 집합을 추출할 수 있게 되고, 상기 특허 문건 부분 집합을 관리 대상 문건으로 하는 발명자 명의 단위 특허 정보 서비스 시스템이 생성될 수 있게 된다.
도 25는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정 을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 입수하고(S2620), 신규 특허 문건에서 출원인 정보를 추출하며(S2630), 출원인 정보로 된 기존 출원인 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한다(S2640).
판단 결과 있는 경우에는 기존 출원인 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2650), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 발명자 정보를 추출하고(S2660), 기존 출원인 명의 단위 특허 정보 서비스 시스템 하부에 발명자 정보로 된 기존 발명자 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한(S2680) 다음, 있는 경우 기존 발명자 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2690), 없는 경우 발명자 정보를 기준으로 발명자 명의 단위 특허 정보 서비스 시스템을 생성하고, 신규 특허 문건 정보를 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2699).
한편, 출원인 정보로 된 기존 출원인 명의 특허 정보 서비스 시스템이 없는 경우에는 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2693), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2695), 추출된 발명자별로 발명자별로 대응된 특허 문건을 관리 대상 문건 집 합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2697).
출원인 명의 단위 또는 발명자 명의 단위 분석
본 발명의 분석 모듈(4100)에 세팅되는 적어도 하나 이상의 분석 알고리즘은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템에 사전에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 분석 알고리즘 또는 상기 발명자 명의 단위에서 필요한 분석 알고리즘이 자동으로 세팅되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 분석 서비스를 구성하게 된다. 상기 분석 알고리즘의 실행은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때에 실행되어 그 분석 결과를 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 사전에 갖고 있는 것이 바람직하다. 하지만, 상기 분석 알고리즘의 실행 속도가 빠르거나, 실시간 또는 사용자에게 기다림을 주지 않을 정도로 빠른 경우, 상기 분석 알고리즘은 상기 분석 주제에 대하여 외부로부터의 접근(관리자 또는 사용자의 클릭 등)이 있을 때 실행될 수도 있을 것이다. 그러므로, 적어도 2 이상의 분석 알고리즘으로 분석 모듈(4100)이 구성될 때, 상기 분석 주제 및 그에 따르는 분석 알고리즘은 사전에 세팅되되 그 실행 시점은 다를 수 있을 것 이다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템에서 분석 서비스가 사전에 세팅되는 것에 대해 더욱 상세하게 설명한다. 상기 분석 서비스는 분석의 대상이 되는 문건 집합과 상기 문건 집합에 대해 어떤 분석을 수행할 것인가에 대한 분석 주제의 선택 및 상기 분석 주제에 대응되는 분석 알고리즘으로 구성된다. 이때, 상기 분석 주제의 선택과 상기 분석 알고리즘은 본 발명의 분석 시스템에 준비되어 있기 때문에, 상기 분석 알고리즘을 실행할 구체적인 분석 대상 문건 집합이 특정되어야 한다. 그런데, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 생성 단계에서 이미 상기 문건 집합이 특정되게 되므로, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합을 분석의 대상으로 하여, 기설정된 적어도 하나 이상의 분석 주제에 대해서 분석을 자동적으로 수행할 수 있게 된다.
이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건이 클러스터링 되어 있을 경우, 상기 클러스터링 된 부분 문건 집합에 대해서 기설정된 분석 주제에 대한 기설정된 분석 알고리즘을 수행할 수 있다.
또한, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합 전체 또는 클러스터링 된 부분 문건 집합을 대상으로하여 최빈 IPC(특허 분류 기호 등), 최대 집중 분야, AI 최대 분야 등과 같은 각종 통계 또는 분석 결과를 1차적 또는 2차적으로 생성해 낼 수 있고, 상기 각종 통계 또는 분석 결과를 대상으로 한 분석 주제별 분석 알고리즘이 세팅될 수 있다. 예를 들면, 특정 출원인 명의 단위 특허 정보 서비스 시스템의 관리 문건 집합을 대상으로 하여 1차적으로 IPC 서브 클래스 또는 그룹 단위에서 최빈 IPC를 추출해 내고, 2차적으로 상기 최빈 IPC를 대상으로, 상기 최빈 IPC에 대한 국내외별 최다 출원인을 추출해 내고, 3차적으로 상기 출원인별 연도별 출원수를 분석 결과로 출력해 내고, 4차적으로 상기 출원인별 상기 IPC에 대한 집중율과 점유율의 연도별 분석 결과를 생성해 줄 수 있을 것이다. 상기 예와 같이, 2개 이상이 분석이 결합하고, 직전 분석의 결과를 직후 분석의 재료로 사용할 수 있을 것이다.
상기 분석의 결과는 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합 단위로 또는 문건 집합의 부분 문건 집합 단위로 사용자의 입력 없이도 사전에 생성되어 있을 수 있게 된다. 상기 분석 대상이 되는 문건 집합의 크기 및 분석 알고리즘마다 분석 수행 시간이 차이가 있을 수 있으므로, 상기 본 발명의 적어도 하나 이상의 분석 알고리즘의 수행은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 생성 시점에 수행될 수도 있고(분석 대상 문건 집합이 작거나, 분석 알고리즘 수행 시간이 적게 걸리는 분석 주제인 경우), 상기 특허 정보 서비스 시스템의 생성 후에 수행 될 수도 있다. 이때, 특허 정보는 매일 또는 기설정된 기간 단위로 업데이트 되고, 신규 문건이 계속하여 발 생하기 때문에, 본 발명의 상기 분석의 수행은 기설정된 기간 단위로 자동으로 수행되는 것이 바람직하다.
상기 출원인 명의 단위가 관리하고 있는 특허 문건 집합은 크게 1) 자사 관련 특허 문건 집합, 2) 타사 관련 문건 집합(예를 들면, 하나의 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 그 하부에 자신이 아닌 타 기업(경쟁사 등)의 출원인 명의 단위 특허 정보 서비스 시스템을 가지고 있을 수 있다.), 3) 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 관리하는 특허 문건 집합 중의 적어도 어느 하나 이상의 부분 집합(상기 관리자의 기준에 의해 클러스터링 내지 그룹핑된 특허 문건 집합을 예로 들 수 있다)을 대상으로 상기에서 설명한 모든 분석 중에서 적어도 하나 이상의 분석을 수행할 수 있으며, 상기 분석 수행의 결과를 입력값으로 하여 다시 적어도 하나 이상의 분석을 수행할 수 있게 된다.
출원인 명의 단위 vs 발명자 명의 단위 특허 정보 서비스 시스템 관계
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템과 발명자 명의 단위 특허 정보 서비스 시스템의 관계에 대해서 더욱 상세하게 설명한다. 상기 출원인 명의 단위 특허 정보 서비스 시스템에는 그 하부에 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 생성되어 있을 수 있다. 발명자 명의 단위 특허 정보 서비스 시스템의 개수는 상기 출원인 명의로 출원되거나 등록된 특허 문건에 포함되어 있는 발명자의 전체 수보다 적거나 같은 것이 바람직하다.
관리적 측면
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템의 관리적인 측면에 대해서 상술한다.
첫째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 권한 설정이 가능할 것이다. 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자에 의한 권한 설정은 상기 출원인 명의 단위 특허 정보 서비스 시스템의 하부에 존재하는 특정한 발명자 단위의 특허 정보 서비스 시스템에 대한 접근 권한 관리를 포함한다. 일례로, 상기 특정한 발명자가 자신의 조직에 속해 있는 경우, 그 발명자 단위 특허 정보 서비스 시스템에 대한 접속 권한을 상기 발명자에게 부여할 수 있을 것이다. 출원인 명의 단위 특허 정보 서비스 시스템 관리자의 입장에서, 자신의 조직에 속해 있던 발명자가 퇴사를 하는 경우, 그 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 유지할 필요가 없게 된다. 이 경우 1) 상기 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 삭제해 버리는 방법, 2) 상기 재입사 등을 대비하여, 발명자의 접근 권한을 없애는 것(ID 삭제, PW의 변경 등으로) 등의 방법이 채용될 수 있다.
둘째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 삭제가 가능할 것이다. 삭제가 발생하는 경우에는 상기 발명자로 1차 결정된 사람이 자신의 소속이 아니거나, 관리의 필요성이 없을 경우에 발생한다. 특정한 특허 출원에 등재되는 발명자는 출원인 조직 소속인 경우가 다수 있지만, 그렇지 않은 경우도 자주 발생한다. 이때, 출원인 조직 소속이 아닌 발명자에 대한 발명자 명의 단위 특허 정보 서비스 시스템도 생성되게 되므로, 이를 삭제할 필요가 있게 된다. 물론, 출원인과의 공동 연구 수 행 등 특별한 이유로 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 이들 출원인 조직 소속이 아닌 발명자의 발명자 명의 단위 특허 정보 서비스 시스템에 대한 접속을 허용할 수도 있을 것이다.
셋째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 추가 및 업데이트가 가능할 것이다. 상기 추가란 상기 발명자 명의 단위 특허 정보 서비스 시스템의 추가적인 생성을 말한다. 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 생성된 이후, 신규 발생되는 문건에 최초로 등재되는 발명자가 생기는 경우로 상기 최초로 등재되는 발명자를 대상으로 하는 상기 신규 문건을 관리 대상 문건으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하면 될 것이다.
넷째, 특허 문건의 업데이트가 될 경우, 상기 신규로 업데이트 되는 특허 문건을 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리 대상에 상기 신규로 업데이트 되는 특허 문건이 추가될 수 있고, 상기 업데이트 되는 특허 문건에 포함된 발명자의 경우, 상기 발명자 단위의 특허 정보 서비스 시스템에 상기 신규 특허 문건이 관리 대상으로 추가 될 수 있다. 물론, 상기 업데이트 중에서는 소멸도 포함되며, 소멸되는 경우, 기존에 있는 특허 문건을 관리 대상에서 삭제하든지, 아니면 그 특허 문건에 소멸 표시를 할 수도 있을 것이다.
문제 해결
공개문건으로부터의 제작 시의 문제점(공개 정보 vs 자체 정보)
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 공개 특허 문건으로 제작할 경우에 따르는 문제점 및 그 해결 방안에 대해 설명한다. 통상적으로 특허 출원이 있는 경우, 출원일 이후 1년 6개월 이후 또는 등록 시에는 강제 공개되며, 그 전이라도 출원인의 의사 표시에 의해 공개될 수 있다. 공개되는 특허 문건은 외부에서도 입수 가능하다. 다만, 한 출원인 입장에서는 자신은 특정한 출원 번호의 특허 문건이 출원되었다는 사실을 알고 있지만, 아직 공개 전일 경우, 외부에서 입수되는 특허 정보를 기반으로 해서는 상기 미공개 특허 문건을 관리 대상으로 반영시키지 못하는 문제가 있을 수 있다. 이때는 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 상기 미공개 특허 문건에 관한 정보를 상기 출원인 명의 단위 특허 정보 서비스 시스템에 포함시키는 방법이 고려될 수 있다. 상기 미공개 특허 문건에 관한 정보는 보안 등의 이유로 공개 문건에 관한 정보보다 적은 것이 바람직하다. 상기 미공개 특허 문건에 관한 정보 중 상기 출원인 명의 단위 특허 정보 서비스 시스템에 포함시키는 정보의 일례로는 출원번호, 발명자, 출원일 등이 될 수 있으며, 발명의 명칭 및 기타 관리를 위한 정보 등이 포함될 수도 있다. 이때, 상기 미공개 특허 문건에 관한 정보 중 발명자 정보가 포함되어 있을 경우에는 상기 미공개 출원 번호를 상기 발명자의 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상 문건으로 포함시켜 놓을 수 있다. 그리고, 일정 시간이 지난 후 상기 미공개 특허 문건이 공개되는 경우, 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및/또는 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 출원 번호를 키(key) 값으로 하여 공개된 특허 정보로 상기 미공개 특허 문건에 대응되는 특허 문건 정보 를 업데이트 할 수 있다.
다단 계층 특허 정보 서비스 시스템 관리
관리 모듈
이하, 상기 관리 모듈에 포함된 다단 계층 관리 모듈에 대해서 설명한다. 먼저 다단 계층 관리의 문제가 발생하는 상황에 대해 설명한다. 하나의 출원인이 상당히 많은 수의 발명자가 소속되어 있을 경우, 상기 발명자가 적어도 하나 이상의 계층적 조직에 속할 수 있다. 예를 들어 설명하면, 한 사람의 발명자는 a1팀<a부서<A1계열<A회사<alpha그룹에 소속될 수 있을 것이다. 그러므로, 관리적인 측면에서는 a1팀은 상기 발명자 단위의 특허 정보 서비스 시스템 및 a1팀과 관련된 특허 문건을 그 관리 대상으로 하는 것이 당연할 것이며, a부서는 a1 내지 aN까지의 각 부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 관리의 대상으로 하는 것이, A1계열은 a부서부터 z부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 까지를, A회사는 A1계열부터 AM계열까지의 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을, alpha그룹은 A회사부터 Z회사까지의 출원인 명의 단위 특허 정보 서비스 시스템, 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건 등을 관리하여 할 것이다. 하지만, 공개되는 문건에서 입수할 수 있는 정보는 발명자 명의와 회사 명의뿐인 경우가 대부분이므로(즉, 특허 문건에는 출원인 정보 이외에 그 발명자가 소속된 집단에 관한 정보는 없는 것이 통상이다), 각 단계의 관리자 및/또는 최고 단계의 관리자가 특정 특허 문건이 어디에 소속되어야 되는지에 대한 정리를 해 줄 필요가 있게 된다. 상기 특허 정보 서비스 시스템은 관리될 특허 문건을 통해서 생성되기 때문에, 상기 특허 문건이 어느 발명자, 어느 팀, 어느 부서, 어느 계열, 어느 회사에 대응되는지에 대한 소속 정보가 있을 경우, 상기 소속 정보를 통해서 특허 정보 서비스 시스템을 생성할 수 있게 된다. 상기 소속 정보를 정하기 위해서 특허 문건과 발명자, 회사에 관한 정보는 특허 문건 자체에서 입수할 수 있다. 그러므로, 상기 발명자가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 알거나, 상기 문건 자체가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 아는 등, 상기 소속 정보를 대응시키는 임의의 수단에 의해, 상기 특허 문건이 소속되는 집단이 결정될 수 있다.
생성 방법
이 경우, 상기 다단 계층의 특허 정보 서비스 시스템이 생성되는 방법은 다음 2가지 중 어느 한가지 방법 이상을 취할 수 있다. 첫번째는 발명자 단위의 특허 정보 서비스 시스템을 생성한 다음, 상기 발명자 명의 단위 특허 정보 서비스 시스템을 발명자가 속하는 팀단위로 통합하고, 각 팀 단위의 특허 정보 서비스 시스템을 부서 단위로 통합하고, 각 부서 단위의 특허 정보 서비스 시스템을 각 계열 단위로 통합하고, 각 계열 단위의 특허 정보 서비스 시스템을 회사 단위로 통합하고, 각 회사 단위의 특허 정보 서비스 시스템을 그룹 단위에서 계층적으로 통합하고, 각 계층 단위에서 각 계층의 특허 정보 서비스 시스템을 관리하는 방법이다. 통합은 물리적 통합과 메타적 통합이 있을 수 있는데, 물리적 통합은 각 계층이 독립된 데이터를 가지는 것을 말하며, 메타적 통합은 상위 계층의 특허 정보 서비스 시스 템은 하위 계층의 특허 정보 서비스 시스템의 메타 정보만을 가지고 있는 것을 말한다. 물리적 통합을 예를 들어 설명하면, a1팀 소속도 그 소속 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 가지지만, a부서도 그 부서 소속의 발명자 명의 단위 특허 정보 서비스 시스템을 독자적으로 가지는 것을 말한다. 메타적 통합을 예로 들어 설명하면, a1팀 소속이 그 소속 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 가지며, a부서는 a1팀에 대한 관리 정보만 가지며, 자신에게만 속하는 발명자가 없는 한 발명자 명의 단위 특허 정보 서비스 시스템을 독자적으로 보유하지 않는 것을 말한다. 두번째는, 각 팀, 부서, 계열, 회사 및/또는 그룹이 자신이 관리해야 할 특허 문건을 아는 경우(특정할 수 있는 경우), 상기 특정할 수 있는 문건을 대상으로 특허 정보 서비스 시스템을 생성하는 방법이다. 이때, 상기 특정할 수 있는 문건을 대상으로 하는 특허 정보 서비스 시스템은 형식상 출원인 명의 단위의 특허 정보 서비스 시스템인 것이 바람직하다.(발명자 명의 단위 특허 정보 서비스 시스템일 수도 있지만, 각 팀, 부서, 계열, 회사 등은 발명자가 소속되어 있을 수 있으므로, 출원인 명의 단위의 특허 정보 서비스 시스템인 것이 형식상 더 좋다.) 이 경우에도 물리적 통합과 메타적 통합 중 어느 하나 이상이 채용될 수 있음은 물론이다. 또한, 상기 다단 계층의 특허 정보 서비스 시스템마다 그 관리자가 존재할 수 있으며, 상기 관리자의 관리 기능은 다단 계층 특허 정보 서비스 시스템 단위의 관리 모듈이 제공한다. 이때, 상기 다단 계층 특허 정보 서비스 시스템의 관리 시에 상위 계층 특허 정보 서비스 시스템의 관리자는 적어도 하나 이상의 하위 계층 특허 정보 서비스 시스템의 관리자에게 권한을 부여할 수 있으며, 이러한 권한 부여는 상기 상위 계층 특허 정보 서비스 시스템 단위의 관리 모듈에서 제공될 수 있다.
관리 대상 문건 정보의 입수
상기와 같은 과정을 통하여 다음과 같은 결과물이 생성될 수 있다.
첫번째, 상기 출원인 명의 단위 특허 정보 서비스 시스템은 출원인 명의 단위 수준에서 자신이 관리하는 관리 대상 문건 정보를 입수할 수 있게 된다. 상기 문건 정보는 국가 단위 및 국가 통합 단위일 수 있으며, 상기 출원인 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 다단 계층 출원인 명의 단위 특허 정보 서비스 시스템일 수 있다. 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 출원인 명의 단위 관리 모듈을 통해서 상기 출원인 명의 단위 특허 정보 서비스 시스템의 문건 정보 및 상기 발명자 명의 단위 특허 정보 서비스 시스템을 관리할 수 있으며, 자신의 하위 계층 특허 정보 서비스 시스템을 관리할 수도 있다.
둘째, 상기 발명자 명의 단위 특허 정보 서비스 시스템은 발명자 명의 단위 수준에서 자신이 관리하는 관리 대상 문건 정보를 입수할 수 있게 된다. 상기 문건 정보는 국가 단위 및 국가 통합 단위일 수 있다. 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자로부터 권한을 부여 받은 발명자인 것이 바람직하며, 상기 발명자는 상기 발명자 명의 단위 관리 모듈을 통해서 상기 자신의 발명자 명의 단위 특허 정보 서비스 시 스템의 문건 정보를 관리할 수 있게 된다.
특허 정보 시스템 배치 생성 엔진(5000)
상기는 1개의 출원인을 기준으로 한 출원인 명의 단위 특허 정보 서비스 시스템 및 상기 출원인 명의 단위 특허 정보 서비스 시스템에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템들의 생성, 운영 및 관리에 관하여 설명하였다. 이어서 복수개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 관리하는 방법에 관하여 설명한다. 2이상의 복수개의 출원인 명의 단위 특허 정보 서비스 시스템 및 이들 각각에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템들을 생성하는 것은 본 발명의 특허 정보 서비스 시스템 배치 생성 엔진이 담당한다. 상기 특허 정보 시스템 배치 생성 엔진(5000)의 구성은 도 14에 잘 나타나 있다.
출원인 명의 입수 모듈
상기 전단 특허 정보 서비스 시스템 생성 엔진이 여러 개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하기 위해서는 우선적으로 생성 대상이 되는 출원인 명의를 입수해야 할 것이다. 상기 특허 정보 서비스 시스템 생성의 대상이 되는 출원인 명의를 입수하는 기능은 본 발명의 출원인 명의 입수 모듈이 수행한다. 상기 출원인 명의 입수 모듈은 적어도 하나 이상의 출원인 명의를 목록의 형태로 입수하는 것이 바람직할 것이다. 상기 출원인 명의는 1개의 국가에 한정되지 않고, 여러 개의 국가에서 선택되는 출원인 명의일 수 있을 것이다.
개별 단위 특허 정보 시스템 생성 엔진(1000) 구동 모듈
상기 출원인 명의 목록이 입수되면, 상기 출원인 명의자 개개를 대상으로 출 원인 명의 단위 특허 정보 서비스 시스템 및 상기 출원인 명의 단위 특허 정보 서비스 시스템에 종속된 발명자 명의 단위 특허 정보 서비스 시스템들을 생성하면 될 것이다. 상기 출원인 명의 목록에 나와 있는 각 출원인 명의를 대상으로 하나씩 하나씩 생성하는 역할은 본 발명의 개별 단위 특허 정보 시스템 생성 엔진(1000) 구동 모듈이 수행한다. 즉, 개별 단위 특허 정보 시스템 생성 엔진(1000) 구동 모듈은 출원인 명의 1개씩을 입수하여, 상기 특허 정보 서비스 시스템 생성 엔진을 구동시켜 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하고, 그 생성이 완료되었다는 정보를 입수하면 다른 출원 명의인에 대하여 상기 특허 정보 서비스 시스템 생성 엔진을 구동시키는 방법을 취한다.
이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템의 생성에서 상기 감시 서비스 및 분석 서비스에 포함되는 구체적인 감시 검색식, 분석 검색식 등은 상기 개별 단위 특허 정보 시스템 생성 엔진(1000) 구동 모듈이 구동되는 동안에 생성될 수도 있지만, 추후에 상기 개별 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템에 추가될 수도 있다.
이때, 상기 개단 특허 정보 서비스 시스템 생성 엔진 구동 모듈은 경우에 따라 상기 출원인 명의 단위 특허 정보 서비스 시스템만을 생성하고, 상기 출원인 명의 단위 특허 정보 서비스 시스템에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하지 않도록 할 수 있다. 이 경우로는 1개의 회사가 자신의 경쟁사인 국내외의 여러 회사의 특허 정보를 조직적으로 입수하기 위하여 각 경쟁 회사마다 출원인 명의 단위 특허 정보 서비스 시스템을 생성하려고 하는 경우가 대표적일 것이다. 경쟁 회사의 발명자별 특허 활동 정보까지 알아야 할 필요가 있을 때에는 발명자 명의 단위 특허 정보 서비스 시스템까지 생성하겠지만, 그렇지 않을 경우라면 출원인 명의 단위 특허 정보 서비스 시스템만으로 충분할 것이다.
어떤 회사를 대상으로는 발명자 명의 단위 특허 정보 서비스 시스템까지 생성해야 하고, 어떤 회사를 대상으로는 출원인 명의 단위 특허 정보 서비스 시스템의 생성만으로 충분할 경우가 있다. 그러므로, 출원인 명의 목록 별로 생성의 범위에 관한 정보가 더 입수된 다음, 상기 개별 단위 특허 정보 시스템 생성 엔진(1000) 구동 모듈이 그 생성의 범위를 반영하여 작동되는 것이 바람직할 것이다.
그리고, 여러 개의 국가에서 선택되는 출원인 명의를 입수할 경우, 상기 특허 정보 데이터베이스(2300)가 국가 단위로 구축되어 있을 때, 국가 단위로 개단 특허 정보 서비스 시스템을 생성할 수도 있을 것이다. 상기와 같은 상황은 배치 처리의 순서에 관한 문제이므로, 당업자라면 용이하게 구현할 수 있을 것이다.
개별 단위 특허 정보 서비스 시스템 다단 그룹화 모듈
다수의 출원인 명의 단위 특허 정보 서비스 시스템들이 생성되었을 때, 상기 특허 정보 서비스 시스템들을 출원인의 속성 등에 따라서 적어도 하나 이상의 단계를 가지면서 그룹화시킬 수 있을 것이다. 반대로 하나의 그룹 밑에 여러 개의 출원인 명의 단위 특허 정보 서비스 시스템을 배치시킬 수 있을 것이다. 예를 들면, 제 조업-자동차-타이어라는 다단 계층 구조를 가지는 그룹 밑에 (주)한국 타이어, (주)금호타이어 등의 출원인 명의 단위 특허 정보 서비스 시스템을 배치할 수 있을 것이다. 상기와 같은 그룹화는 통상의 기술자의 영역에서 용이한 것이므로, 상세한 설명은 생략한다.
개별 단위 특허 정보 시스템 관리 모듈
2 이상의 출원인 명의 단위 특허 정보 시스템이 생성되는 경우, 상기 특허 정보 서비스 시스템들이 관리될 필요가 있으며, 상기 관리는 개단 특허 정보 서비스 시스템 관리 모듈이 수행한다. 상기 개단 특허 정보 서비스 시스템 관리 모듈은 상기 출원인 명의 단위 특허 정보 서비스 시스템에 대한 인증, 권한 관리, 권한 이양, 삭제, 위치나 소속의 변경 등의 관리를 수행한다.
상기와 같이 다수의 출원인 명의 단위 특허 정보 서비스 시스템들이 생성되었을 경우, 전체 시스템적 관점에서 통합하여 관리할 필요가 있으며, 상기 통합 관리를 수행하는 것은 본 발명의 통합 관리 모듈(6000)이 수행한다. 도 15는 통합 관리 모듈(6000)의 구성의 일 실시예를 보여 주고 있는데, 상기 통합 관리 모듈(6000)에는 개별 단위 특허 정보 시스템 다단 그룹화 모듈(6100)과 개별 단위 특허 정보 시스템 관리 모듈(6300)이 있어, 개별 단위 특허 정보 서비스 시스템을 다단 그룹화하며, 상기 다단 그룹화된 특허 정보 서비스 시스템을 관리할 수 있게 된다.
전체 시스템의 구성
도 1은 본 발명의 전체 시스템의 구성에 대한 일실시예적 도면이다. 본 발명 의 전체 시스템은 계층적으로 통합된 특허 정보 서비스 시스템(10)이며, 상기 시스템은 네트워크(300)를 통하여 사용자의 컴퓨터와 연결될 수 있다. 상기 사용자 컴퓨터(200)는 상기 계층적으로 통합된 특허 정보 서비스 시스템(10)에 네트워크(300)를 통하여 접속할 수 있는 임의의 컴퓨터로 PC, 서버, 노트북, 통신 가능한 휴대 단말기, 통신 가능한 게임 단말기를 당연히 포함하며, 기타 유무선 통신 가능하며 정보 처리 가능한 임의의 단말기를 포함한다.
상기 계층적으로 통합된 특허 정보 서비스 시스템(10)에는 상기 개별 단위 특허 정보 시스템 생성 엔진(1000)이 포함되어 있으며, 본 발명의 명세서에서 기재한 각종 정보를 저장하며, 적어도 하나 이상의 모듈에서 공통적으로 사용되는 데이터베이스로 공통 DB 단(2000)가 있으며, 상기 공통 DB(2000)에는 DBMS(2100), 특허 정보 데이터베이스(2300)가 있을 수 있으며, 상기 특허 정보 데이터베이스(2300)에는 특허 문건 데이터베이스(2310), 특허 정보 처리 정책 데이터베이스(2330), 및 특허 분류 기호 데이터베이스(10000)가 포함되어 있는 것이 바람직하다. 또한, 전제 시스템적 관점에서 개별 단위의 특허 정보 서비스 시스템을 관리하는 개별 단위 특허 정보 서비스 시스템 관리 DB(2500)를 포함할 수 있으며, 기업 명칭의 변화 등을 관리하고 재무 정보 등 기업에 관한 정보를 저장하고 있는 기업 정보 DB(2700)를 선택적으로 포함할 수 있다. 또한, 상기 계층적으로 통합된 특허 정보 서비스 시스템(10)에는 상기 특허 정보 전처리 모듈(3000), 상기 특허 정보 인텔리전스 모듈(4000), 상기 특허 정보 시스템 배치 생성 엔진(5000), 상기 통합 관리 모듈(6000) 및 상기 검색 엔진(7000)을 포함하고 있을 수 있다. 상기 검색엔진에는 상기 서처(searcher)(7100), 상기 인덱서(indexer)(7300) 및 상기 검색 인덱스(7500)를 포함한다.
본 발명의 효과는 다음과 같다.
첫째, 입수된 출원인 정보만으로 계층적으로 통합된 출원인 명의 단위 특허 정보 서비스 시스템을 생성할 수 있으며, 아울러 발명자 명의 단위 특허 정보 서비스 시스템을 효과적으로 생성할 수 있다.
둘째, 각종 전처리를 통하여 특허 정보 DB를 효과적으로 구축할 수 있다.
셋째, 특허 분류 기호 정보의 전처리를 통하여 특허 검색, 특허 분석, 특허 감시 등에서 하위 특허 분류 기호를 효과적으로 처리할 수 있어, 특허 검색, 특허 분석 및 특허 감시 서비스의 품질이 좋아진다.
넷째, 특허 분류 기호 정보에 대한 융합 정보를 처리함으로써, 특허 분류 기호간의 융합 경향을 파악할 수 있으며, 융합 속성을 본 발명의 특허 분석에 활용할 수 있다.
다섯째, 특허 문건 집합 단위로 인용 분석을 포함한 각종 분석으로 처리함으로써, 문건 집합의 크기, 종류 등에 독립적으로 특허 정보를 처리할 수 있게 된다.

Claims (15)

  1. 특허 정보 서비스 시스템의 정보 처리 방법에 있어서,
    상기 특허 정보 서비스 시스템이
    (a) 발명자 정보를 입수하는 단계;
    (b) 발명자 단위로 상기 발명자와 관련된 발명자 단위 특허 집합을 입수하는 단계;
    (c) 상기 발명자 단위 특허 집합 또는 상기 발명자 단위 특허 집합의 부분 특허 집합에 대하여 인용 특허 집합을 생성하는 단계;및
    (d) 상기 인용 특허 집합에 속하는 인용 특허를 적어도 하나 이상의 그룹 단위로 처리하여 그룹 단위의 인용 특허 집합을 분석 대상 문건 집합으로 하여 적어도 하나 이상의 분석 정보를 생성하는 단계;를 포함하며,
    상기 발명자 단위 특허 집합은 상기 발명자가 발명자로 등재되어 있는 특허로 구성되는 특허 집합인 것이거나, 상기 발명자가 발명자로 등재된 특허 집합에 대한 수정 및 변동 중 어느 하나 이상이 반영된 것이며,
    상기 발명자가 발명자로 등재된 특허 집합에 대한 수정 및 변동은 출원 중 또는 등록 후에서의 발명자 명의 정보의 수정이나 변동을 포함하는 것이며,
    상기 인용 특허 집합은 전방 인용 특허 집합 및 후방 인용 특허 집합 중에서 선택되는 어느 하나 이상인 것이며,
    상기 그룹 단위는 적어도 하나 이상의 출원인, 특허 분류, 시간 정보, 국가 정보, 및 발명자 중 어느 하나 이상을 사용하여 생성하는 것이며,
    상기 출원인이 그룹의 단위로 사용되는 경우, 상기 그룹 단위의 출원인에 대응되는 특허 집합은 출원인이 출원하거나 등록한 특허로 구성되는 특허 집합인 것이거나, 출원 명의인이 출원하거나 등록한 특허 집합에 대한 수정 및 변동 중 어느 하나 이상이 반영된 것이며,
    출원 명의인이 출원하거나 등록한 특허 집합에 대한 수정 및 변동은 출원 중 또는 등록 후에서의 양도와 양수 중 어느 하나 이상을 통한 수정이나 변동 및 출원인 명의 정보의 수정이나 변동 중 어느 하나 이상을 포함하는 것이며,
    상기 분석 정보는 정량 분석 정보인 것을 특징으로 하는 특허 정보 서비스 방법.
  2. 제 1항에 있어서,
    상기 출원인 명의 정보의 수정이나 변동은 합병, 출원인 명칭의 변경, 출원인의 감축이나 추가 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 서비스 방법.
  3. 제 1항에 있어서,
    상기 부분 특허 집합은 적어도 하나 이상의 특허 분류, 시간 정보, 국가 정보, 및 발명자 중 어느 하나 이상을 사용하여 생성하는 것인 것을 특징으로 하는 특허 정보 서비스 방법.
  4. 제 1항에 있어서,
    상기 (d) 단계에서 분석 정보의 생성은 상기 인용 특허 집합에 대한 적어도 하나 이상의 제한, 랭킹 및 그룹핑 중 어느 하나 이상이 적용된 특허 집합에 대하여 생성되는 것인 것을 특징으로 하는 특허 정보 서비스 방법.
  5. 제 4항에 있어서,
    상기 제한이나 그룹핑은 적어도 하나 이상의 특허 분류, 시간 정보, 국가 정보, 및 발명자 중 어느 하나 이상을 사용하여 제한되거나 그룹핑 되는 것인 것을 특징으로 하는 특허 정보 서비스 방법.
  6. 삭제
  7. 삭제
  8. 삭제
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 삭제
  15. 삭제
KR1020070061279A 2007-01-09 2007-06-21 발명자 단위의 특허 정보 제공 방법 KR101476350B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020070002548 2007-01-09
KR1020070002548 2007-01-09

Publications (2)

Publication Number Publication Date
KR20080065521A KR20080065521A (ko) 2008-07-14
KR101476350B1 true KR101476350B1 (ko) 2014-12-24

Family

ID=39816371

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020070061277A KR101421221B1 (ko) 2007-01-09 2007-06-21 출원인 명의 단위의 특허 정보 서비스 방법
KR1020070061279A KR101476350B1 (ko) 2007-01-09 2007-06-21 발명자 단위의 특허 정보 제공 방법

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020070061277A KR101421221B1 (ko) 2007-01-09 2007-06-21 출원인 명의 단위의 특허 정보 서비스 방법

Country Status (1)

Country Link
KR (2) KR101421221B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200114379A (ko) * 2019-03-28 2020-10-07 (주)테크디엔에이 특허 기반 사회관계망 제공 시스템 및 방법
KR20230166422A (ko) 2022-05-30 2023-12-07 한성대학교 산학협력단 특허 정보를 이용한 국제 연구 개발 활동성 지표 산출 시스템
WO2023239106A1 (ko) * 2022-06-08 2023-12-14 주식회사 아이피나우 특허 발명자 정보 제공 서비스 방법 및 장치
WO2024101473A1 (ko) * 2022-11-10 2024-05-16 사단법인 한국산업기술진흥협회 빅데이터 기반 특허 분석 서비스 제공 방법 및 장치

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101534155B1 (ko) * 2007-12-12 2015-07-07 (주)광개토연구소 특허 정보 제공 방법 및 그 시스템
KR101534159B1 (ko) * 2009-09-03 2015-07-08 (주)광개토연구소 소셜 네트워크 분석 결과의 생성을 위한 특허 정보 융합 분석 방법 및 그 시스템
KR101663886B1 (ko) * 2015-02-11 2016-10-10 주식회사 월콘 지식재산권 관리 방법 및 장치
KR101663885B1 (ko) * 2015-02-11 2016-10-10 주식회사 월콘 지식재산권 관리 방법 및 장치
KR101653096B1 (ko) * 2015-02-11 2016-09-02 주식회사 월콘 지식재산권 관리 방법 및 장치
KR101663887B1 (ko) * 2015-02-11 2016-10-17 주식회사 월콘 지식재산권 관리 방법 및 장치
KR101703422B1 (ko) * 2015-04-22 2017-02-06 서울시립대학교 산학협력단 지식재산권의 매칭 시스템, 서버 및 제어방법
CN107463565B (zh) * 2016-06-02 2020-05-15 索意互动(北京)信息技术有限公司 一种文献数据处理、检索、分析方法以及对应的装置
KR102051825B1 (ko) * 2018-02-13 2020-01-08 국민대학교산학협력단 의미 기반 유사특허 검색 장치 및 방법, 이를 기록한 기록매체
US11816135B2 (en) * 2019-02-26 2023-11-14 Greyb Research Private Limited Method, system, and computer program product for retrieving relevant documents

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288182A (ja) * 2001-03-23 2002-10-04 K Three Kk 特許管理プログラム
JP2003108721A (ja) * 2001-09-26 2003-04-11 Ricoh Co Ltd ワークフロー支援システム、ワークフロー支援方法、ワークフロー支援プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20040106619A (ko) * 2003-06-11 2004-12-18 엘지.필립스 엘시디 주식회사 기업내 특허관리시스템 및 그 관리방법
JP2006058977A (ja) * 2004-08-17 2006-03-02 Ko Owada 特許管理方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002288182A (ja) * 2001-03-23 2002-10-04 K Three Kk 特許管理プログラム
JP2003108721A (ja) * 2001-09-26 2003-04-11 Ricoh Co Ltd ワークフロー支援システム、ワークフロー支援方法、ワークフロー支援プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR20040106619A (ko) * 2003-06-11 2004-12-18 엘지.필립스 엘시디 주식회사 기업내 특허관리시스템 및 그 관리방법
JP2006058977A (ja) * 2004-08-17 2006-03-02 Ko Owada 特許管理方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200114379A (ko) * 2019-03-28 2020-10-07 (주)테크디엔에이 특허 기반 사회관계망 제공 시스템 및 방법
KR102189177B1 (ko) 2019-03-28 2020-12-09 (주)테크디엔에이 특허 기반 사회관계망 제공 시스템 및 방법
KR20230166422A (ko) 2022-05-30 2023-12-07 한성대학교 산학협력단 특허 정보를 이용한 국제 연구 개발 활동성 지표 산출 시스템
WO2023239106A1 (ko) * 2022-06-08 2023-12-14 주식회사 아이피나우 특허 발명자 정보 제공 서비스 방법 및 장치
WO2024101473A1 (ko) * 2022-11-10 2024-05-16 사단법인 한국산업기술진흥협회 빅데이터 기반 특허 분석 서비스 제공 방법 및 장치

Also Published As

Publication number Publication date
KR20080065520A (ko) 2008-07-14
KR20080065521A (ko) 2008-07-14
KR101421221B1 (ko) 2014-07-30

Similar Documents

Publication Publication Date Title
KR101476350B1 (ko) 발명자 단위의 특허 정보 제공 방법
KR101534155B1 (ko) 특허 정보 제공 방법 및 그 시스템
Balog et al. Formal models for expert finding in enterprise corpora
US8965886B2 (en) System and method for providing information navigation and filtration
JP5879260B2 (ja) マイクロブログメッセージの内容を分析する方法及び装置
US7624102B2 (en) System and method for grouping by attribute
Rinaldi An ontology-driven approach for semantic information retrieval on the web
AU2008285362B2 (en) Graphical user interfaces for jury verdict information
US20060253423A1 (en) Information retrieval system and method
US20120290571A1 (en) Evaluating Intellectual Property
US20110016118A1 (en) Method and apparatus for determining relevant search results using a matrix framework
US8103678B1 (en) System and method for establishing relevance of objects in an enterprise system
KR101534159B1 (ko) 소셜 네트워크 분석 결과의 생성을 위한 특허 정보 융합 분석 방법 및 그 시스템
US20090228476A1 (en) Systems, methods, and software for creating and implementing an intellectual property relationship warehouse and monitor
US7756891B2 (en) Process and system for matching products and markets
KR101067846B1 (ko) 특허 평가 시스템 및 그 방법, 이를 구현하기 위한 프로그램을 기록한 디지털 처리장치가 판독 가능한 기록매체
WO2008084979A1 (en) Patent searching method and patent search system
EP2438541A2 (en) Improved systems, methods, and interfaces for extending legal search results
KR20090062270A (ko) 출원인 명의 단위의 자동 분석 지원 특허 정보 시스템
KR20090062288A (ko) 융합 분석용 다차원 연산 수행 결과 테이블을 포함하고있는 특허 정보 시스템
KR20090062251A (ko) 특허 분류 기호 전처리 모듈 포함 특허 정보 시스템
Nogueras-Iso et al. Exploiting disambiguated thesauri for information retrieval in metadata catalogs
KR20090062158A (ko) 특허 정보 시스템
KR20090062234A (ko) 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템
Yanes et al. A theoretical and empirical evaluation of software component search engines, semantic search engines and Google search engine in the context of COTS-based development

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20171213

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181219

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20191212

Year of fee payment: 6