KR20090062234A - 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템 - Google Patents

문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템 Download PDF

Info

Publication number
KR20090062234A
KR20090062234A KR1020070129367A KR20070129367A KR20090062234A KR 20090062234 A KR20090062234 A KR 20090062234A KR 1020070129367 A KR1020070129367 A KR 1020070129367A KR 20070129367 A KR20070129367 A KR 20070129367A KR 20090062234 A KR20090062234 A KR 20090062234A
Authority
KR
South Korea
Prior art keywords
information
patent classification
classification code
document
name
Prior art date
Application number
KR1020070129367A
Other languages
English (en)
Inventor
강민수
Original Assignee
(주)광개토연구소
강민수
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)광개토연구소, 강민수 filed Critical (주)광개토연구소
Priority to KR1020070129367A priority Critical patent/KR20090062234A/ko
Publication of KR20090062234A publication Critical patent/KR20090062234A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템에 관한 것이다.
본 발명을 이용할 경우, 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별 특허 정보 서비스 시스템을 구축하고, 나아가 특허 정보에 포함되어 있는 기업 소속의 발명자 정보를 추출하여, 자동적으로 발명자 단위의 특허 정보 서비스 시스템을 계층적으로 통합하여 생성하고, 각 발명자에게 발명자의 특허 출원 문건 정보에 포함된 특허 분류 기호를 매개로 하여 자신의 출원 특허 기술과 관련성이 있는 국내외의 특허 정보를 자동으로 추출하여 제공할 수 있게 된다.
나아가, 본 발명은 기업 및 그 기업 소속의 발명자의 특허 출원 문건에서 추출된 정보 및 발명자로부터 입수 받은 검색식을 활용하여, 그 특허와 관련된 국내외 특허 문건을 자동으로 업데이트 해 주는 모니터링 기능 및 통계, 분석, 경쟁 정보, 리포팅, 기능을 포함한다.
기업 및 기업 소속 발명자는 별도의 노력 없이도 자기 자신만을 위한 특허 정보 서비스 시스템이 자동으로 생성되기 때문에, 구축 및 별도 세팅의 노력 없이도 자신과 관련된 국내외의 특허 정보를 손쉽게 활용할 수 있다.
특허 정보, 분석, 통계, 다차원

Description

문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템{Patent intelligence system with integrated set-based citation analysis module}
본 발명은 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템에 관한 것으로 분석 정보를 포함한 고급 특허 정보를 생성하여 제공하는 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템에 관한 것이다.
특허 정보는 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가 되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.
특허 정보를 입수할 수 있는 방법은 다양하나, 크게 1) 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것과 2) 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 및 3) 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 1)의 방법의 대표적인 예가 대한민국 특허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템이 있으며, 2)의 대표적인 예로 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr, www.wisdomain.com 등 있다.
www.delphion.com 의 운영회사인 톰슨사이언티픽과 같은 각 국가의 민간 기업들은 특허 정보 데이터베이스를 구축해 놓고, 특허 검색 엔진을 통하여 입력된 검색식에 대해 다양한 방식으로 검색 결과를 제공해 주고 있다. 또한, 이들 특허 정보를 기반으로 한 다양한 종류의 분석 소프트웨어가 개발되어 있으며, www.micropatent.com의 운영사(톰슨사이언티픽에 인수 합병되었음)가 개발한 상표명 AUREKA로 보급되는 소프트웨어가 유명하다. 그리고, 세계 각국의 기술 선진 대기업들은 내부에 특허 검색 및 특허 관리 시스템을 구축하여 운영하고 있는 것으로 알려져 있으나, 외부에서 그 기업들의 특허 검색 및 특허 관리 시스템에 대해 접근하기가 어렵다.
이러한 특허 검색 및 특허 관리 시스템을 구축하기 위해서는 수십억원 이상의 비용이 지출되는 것이 통상이어서, 국내외 대부분의 중견 및 중소 벤처 기업들은 자체 특허 검색 및 특허 관리 시스템을 구축하고 있지 못하고 있다. 이들 중견 및 중소 벤처 기업들은 특허 전담 조직을 두고 있는 경우도 다수 있으며, 이들이 자사의 특허에 대한 관리 및 자사를 위한 특허 정보를 수집하고 있다. 하지만, 기업 규모가 작거나, 특허에 대한 의식이 크지 않은 기업들은 이러한 특허 전담 조직을 갖추고 있지 못하는 경우가 많다. 이들 기업들은 특허법률사무소나 로펌 등에 의뢰하여 자신의 특허를 관리하고 있는 수준에 거치고 있다.
이들 특허 전담 조직은 www.delphion.com 등과 같은 외부에서 접근 가능한 유무료 온라인 특허 정보 서비스 업체들을 이용하여, 이들이 제공해 주는 플랫폼으로 특허 정보를 수집, 관리하고 있다. 그리고, 기업 명의로 된 특허 출원의 대부분은 그 기업 소속 발명자들에 의해서 이루어 지며, 그 발명자는 자신의 발명과 관련된 국내외의 특허 정보를 수집하는 것이 전세계적인 추세가 된다. 그 이유가 특허 공개 기간의 존재에도 불구하고 전세계의 신기술 정보는 70% 이상이 특허 정보의 형태로 공개되며, 특허 정보가 논문 정보 등에 비해서 상업적으로 이용가능한 아이디어가 많기 때문으로 풀이된다. 하지만, 이들 발명자들의 상당 부분은 특허 검색에 익숙해 있지 않거나, 검색에 익숙한 자라 하더라도 www.deljphion.com 등과 같은 외부 특허 정보 서비스 제공업체에 접속하여 특허 정보를 입수 받고 있다.
통상적으로 발명자들은 특정 기술 분야에 대하여 수년 내지 십수년간 지속적으로 연구하는 것이 일반적이므로, 자신 발명한 기술 분야가 크게 변동되지 않는 것이 일반적이다. 그러므로, 자신이 발명한 기술 분야와 직접 또는 간접적으로 관련되는 분야에 관한 국내 또는 해외 각국의 특허 기술 정보는 발명자에게 유익한 정보가 될 것이다. 그러므로, 개별 기업 단위 뿐만 아니라, 그 기업 소속의 발명자 단위로 운영되며, 발명자 단위까지 최적화되어 특정 발명자 만을 위한 차별화된 특허 정보 서비스 시스템의 공급이 요청되어 왔으며, 이와 같은 특허 정보 서비스 시스템은 자체적으로 개발하고 유지할 수 없는 중견 및 중소벤처 기업들에게는 특허 정보에 대한 접근성을 크게 향상시킬 것이며, 자체적으로 개발 유지할 수 있는 기업들에게는 사내 특허 정보 유통의 새로운 플랫폼이 될 것이다.
또한, 기업 또는 발명자들이 자신이 관리하는 특허를 자동으로 분석하여, 이 들과 관련된 경쟁 기업 및 경쟁 기술에 관한 분석 정보, 경쟁 기업 및 경쟁 기술에 대한 감시 정보 등이 자동으로 정리되어 기업 또는 발명자에게 직접 제공된다면, 기업 또는 발명자에게 편리할 것이다.
본 발명이 이루고자 하는 첫번째 기술적 과제는 특허 정보 데이터베이스를 기초로 하여, 자동적으로 각 기업별 특허 정보 시스템을 구축하고, 나아가 특허 정보에 포함되어 있는 발명자 정보를 추출하여, 자동적으로 발명자 단위의 특허 정보 시스템을 구축하고, 이들 양 시스템을 계층적으로 통합한 특허 정보 시스템을 제시하는 것이다.
본 발명이 이루고자 하는 두번째 기술적 과제는 생성된 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 자동으로 기업 및/또는 발명자와 관련된 국내외 특허 정보를 자동으로 수집하는 특허 정보 시스템을 제시하는 것이다.
본 발명이 이루고자 하는 세번째 기술적 과제는 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 다차원 분석용 연산 수행 결과 테이블을 통하여 자동으로 기업 및/또는 발명자와 관련된 국내외 특허 정보에 대한 각종 특허 분석 지표별로의 특허 분석을 자동으로 수행하는 특허 정보 시스템을 제시하는 것이다.
본 발명이 이루고자 하는 네번째 기술적 과제는 생성된 출원인 명의 단위의 특허 정보 시스템과 발명자 단위의 특허 정보 시스템 중 적어도 어느 하나 이상의 시스템에서 자동으로 기업 및/또는 발명자 자신과 관련된 특허 정보를 자동으로 분석해 주는 특허 정보 시스템을 제시하는 것이다.
본 발명이 이루고자 하는 다섯번째 기술적 과제는 특허 문건 정보에 대한 각종 전처리 방법과, 전처리된 특허 정보를 바탕으로 각종 특허 분석을 수행하는 특허 정보 시스템을 제시하는 것이다.
본 발명이 이루고자하는 여섯번째 기술적 과제는 상기 첫번째 기술적 과제부터 다섯번째 기술적 과제까지의 특허 정보를 온라인 상에서 다수의 출원 명의인 단위로 제공하거나 개별 출원 명의인의 내부 시스템에서 작동되는 특허 정보 시스템을 제시하는 것이다.
본 발명의 상기 과제는 달성하기 위하여, 특허 문건 마스트 DB, 전처리 모듈부, 특허 정보 처리 기본 모듈 및인용 분석 모듈을 포함하며, 상기 인용 분석 모듈은 복수개의 특허 문건으로 이루어진 문건 집합 단위의 통합 인용 분석 결과를 제공하는 것인 것을 특징으로 하는 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템을 개시한다.
본 발명의 효과는 다음과 같다.
첫째, 입수된 출원인 정보만으로 계층적으로 통합된 출원인 명의 단위 특허 정보 시스템을 생성할 수 있으며, 아울러 발명자 명의 단위 특허 정보 시스템을 효과적으로 생성할 수 있다.
둘째, 각종 전처리를 통하여 특허 정보 DB를 효과적으로 구축할 수 있다.
셋째, 특허 분류 기호 정보의 전처리를 통하여 특허 검색, 특허 분석, 특허 감시 등에서 하위 특허 분류 기호를 효과적으로 처리할 수 있어, 특허 검색, 특허 분석 및 특허 감시 서비스의 품질이 좋아진다.
넷째, 특허 분류 기호 정보에 대한 융합 정보를 처리함으로써, 특허 분류 기호간의 융합 경향을 파악할 수 있으며, 융합 속성을 본 발명의 특허 분석에 활용할 수 있다.
다섯째, 특허 문건 집합 단위로 인용 분석을 포함한 각종 분석으로 처리함으로써, 문건 집합의 크기, 종류 등에 독립적으로 특허 정보를 처리할 수 있게 된다.
전제 정보
공개되는 특허 문건의 형식 및 포함되어 있는 정보
각 국가의 특허청은 일정 조건을 갖춘 특허 출원 또는 특허 등록에 대하여 공개용 공보를 발행하고 있다. 이러한 공보는 텍스트, 이미지, pdf , SGML 또는 XML 파일 등의 여러 포맷으로 발행되고 있다. 현재 각 국가에서 발행되는 공보는 XML 파일 형식으로 되어 있으며, 과거 SGML 또는 기타 형식으로 된 문서도 적절한 처리를 거쳐 XML 파일로 변환할 수 있다. 한편, 각 국가마다의 다른 형식 또는 각 문서 발생 주체마다의 다른 형식의 XML 파일에 대해서도 공통된 하나의 XML 파일 형식으로 변환이 가능함은 물론이다. WIPO(World Intellectual Property Organization)은 각 서지 사항에 관한 표시에 관한 표준을 제시하고 있으며, 다수 의 국가에서 이들 표준이 채택되고 있다. 현재 WIPO ST. 36번이 권장되고 있으며, 이에 대한 내용은 www.wipo.int에서 확인할 수 있다.
공개되는 특허 정보에는 각 국가마다 차이가 있지만 크게 서지 사항에 관한 정보 및 특허 본문에 관한 정보를 포함하고 있다.
서지 사항에 관한 정보로서는 특허 문건 발행국에 관한 정보, 발명의 명칭, 출원인(assignee를 포함한다, 이하 같다)/특허권자(assignee를 포함한다, 이하 같다)에 관한 정보, 발명자에 관한 정보, 특허 분류 기호(IPC, USPC, FI, FT, ECLA 중에서 선택되는 어느 하나 이상, 이하 같다)에 관한 정보, 출원일 등의 각종 날짜에 관한 정보, 출원번호 등의 각종 번호에 관한 정보가 필수적으로 포함되어 있다. 또한, 초록 정보, 대표도가 있을 경우 대표도에 관한 정보, 인용(reference)에 관한 정보(출원인이 개시한 선행 기술에 관한 reference 정보, 심사관이 심사하거나 조사한 문건 또는 특허 분류 기호에 관한 정보 등 중의 어느 하나 이상을 말한다.), 우선권에 관한 정보, 심사관에 관한 정보 등이 선택적으로 존재할 수 있다. 상기 서지 사항의 내용으로 초록(abstract)에 관한 정보, 대표 청구항 또는 특허 청구 범위 중 제1항에 관한 정보가 더 포함되어 있을 수 있다.
본문에는 특허의 기술적 내용에 관한 정보들이 포함되어 있다. 통상적인 특허 문건의 본문에는 발명의 명칭에 관한 정보, 발명의 구성에 관한 정보, 특허 청구 범위에 관한 정보를 포함하고 있으며, 이들 이외에도 발명의 효과, 산업상 이용 가능성, 발명이 이루고자 하는 기술적 과제, 도면에 관한 설명, 종래의 기술 중 어느 하나 이상이 포함되어 있다. 또한, 발명자의 선택 또는 특허 기술의 종류에 따 라 필수적 또는 선택적으로 도면에 관한 정보가 더 포함되어 있다.
서지 사항에 관한 정보와 본문에 관한 정보 이외에도 입수할 수 있는 정보가 더 있는데, 이들 중 대표적인 것이 행정 처리 사항에 관한 정보이다. 물론, 각 국가 특허청마다 다른 특허청에서는 제공해 주지 않는 특별한 정보를 더 제공해 주기도 한다. 미국 특허청에서 제공해는 Field of Search와 같은 항목이 그러하다. 행정 처리 사항에 관한 정보에는 각 특허 문건에 대한 해당 특허청 또는 특허 담당 기관의 각종 행정 처리 사항에 관한 정보를 말한다. 이러한 행정 처리 정보에는 심사 착수와 같은 담당 기관 내부에서 발생하는 이벤트에 관한 정보 및/또는 출원인 명의 변경 신청 등과 같이 출원인 또는 담당 기관을 이용하는 자와의 상호 관계에서 발생하는 이벤트에 관한 정보가 대표적이다.
특허 분류 기호 정보 및 특허 분류 기호 체계의 존재
아울러, 각 특허 문건에는 적어도 하나 이상의 특허 분류 기호 체계 상의 적어도 하나 이상의 특허 분류 기호가 부여되어 있다. 대한민국, 미국, 일본, 유럽(EPO) 등의 각 국가가 발행하는 문건에는 IPC(International Patent Classification,국제 특허 분류) 기호가 부여되어 있으며, 각 국가별로 자국만의 특별한 분류 체계(미국 특허청의 경우 USPC 또는 UPC, 일본 특허청의 경우 F-
Term/FT, FI(File Index), 유럽 특허청의 경우 ECLA 등)를 가지고 있는 경우에는 그 특허 문건의 발행국 만의 특허 분류 기호가 부여되어 있다.
IPC는 국제특허분류에 관한 스트라스부르크(Strasbourq)협정에 따라 만들어진 것으로서, 모든 특허 문건에 대하여 적어도 하나 이상의 IPC 기호가 부여되어 있다. IPC 기호는 섹션(section), 클래스(class), 서브클래스(subclass), 그룹(group), 서브그룹(subgroup)으로 계층적으로 표현되는 분류 기호 체계를 가진다.
또한, 몇몇 나라의 특허청은 자국만의 독특한 특허 분류 체계를 가지고 있는데, 대표적인 것으로 미국 특허청이 사용하는 UPC가 있으며, 유럽 특허청이 사용하는 ECLA, 일본 특허청이 사용하는 FI, FT가 있다.
UPC는 클래스(class) 및 서브클래스(subclass) 기호 체계를 사용하며, 일본의 FI는 IPC를 종적으로 확장하는 구조를 가지고 있으며, FT는 테마라는 대주제분류와 그 테마의 하부 구조에 속하는 F-Term 기호 체계를 가지고 있다.
특허 분류 기호 체계들은 각 분류 기호에 "타이틀"이라는 해당 특허 분류 기호의 내용을 설명하는 부분이 1:1로 대응되어 있다. 한편, 각 특허 분류 기호 체계 상에서 일정 깊이(depth) 이하의 경우에는 각 특허 분류 기호들의 타이틀 정보에 도트(dot)가 부여되어 있는 경우가 있다. 하기의 예로부터 특허 분류 기호 체계의 계층성, 타이틀 정보의 존재, 타이틀 정보 앞에 분류 체계 상의 상대적인 위치에 관한 정보를 제공하는 도트의 존재를 보여 준다.
    섹션            : H      전기
    클래스          : H01   기본적 전기소자
    서브클래스      : H01F  자석
    메인그룹        : H01F 1/00  자성재료를 특징으로 하는 자석 또는 자성 체
    1-도트 서브그룹 :       1/01 *무기재료로 된 것
    2-도트 서브그룹 :        1/03 **보자력에 의해 특징되는 것
    3-도트 서브그룹 :        1/032 ***경질 자성재료의 것
    4-도트 서브그룹 :      ·  1/04 **** 금속 또는 합금
    5-도트 서브그룹 :        1/047 *****조성물로 특징되는 합금
    6-도트 서브그룹 :        1/053 ******희토류 금속을 포함하는 것
상기 IPC를 예로 들어 설명하면, 모든 서브그룹에 해당하는 특허 분류 기호는 "서브클래스" + "숫자/숫자" 구조로 되어 있는데, 이 특허 분류 기호에 대응되는 타이틀에는 도트(dot)가 결합되어 있는 것이 대부분이다.(숫자/00을 제외하고는 대부분 도트가 결합되어 있으며, 통상 숫자/00은 메인그룹에 대응되는 기호이다.) 타이틀에 결합되어 있는 도트의 개수가 적을수록 그 타이틀은 그 주변과 비교할 때 상대적으로 상위 개념의 기술 분류이며, 도트의 개수가 많을수록 그 타이틀은 그 주변과 비교할 때 상대적으로 하위/세부 개념의 기술 분류이다.
상기의 예와 같이 IPC는 다단계 계층 구조(트리(tree)구조)로 되어 있다. 한편, USPC, FT 및 ECLA 등도 다단계 계층 구조를 가진다. 상기 각 특허 분류 기호 의 다단계 계층 구조는 DB화 될 수 있을 것이다.
본 발명의 특허 정보 시스템(1)의 구성 소개
먼저 본 발명의 특허 정보 시스템(1)의 구조에 대해서 간략하게 설명한다.
도 1 및 도 13을 기준으로 설명한다.
본 발명의 특허 정보 시스템(1)은 유무선 네트워크(200)를 통하여 사용자 컴퓨터(300)와 연결되어 있다. 이때, 사용자 컴퓨터(300)는 PC, 노트북, 유무선 통신 단말기, 게임기 등의 사람을 전제로 한 컴퓨터와, 본 특허 정보 시스템(1)이 아닌 제3의 서버, 조직 또는 기관의 서버, 제3의 프로그램 모듈 등 상기 특허 정보 시스템(1)에 접속하는 임의의 컴퓨터를 말한다. 상기 특허 정보 시스템(1)이 웹서비스를 할 경우 상기 특허 정보 시스템(1)은 웹서비스 지원 모듈을 탑재하고 있어야 한다.
상기 특허 정보 시스템(1)은 DB와 관계있는 DB부(20), 각종 전처리를 수행하는 전처리 모듈부(30), 특허 정보를 처리 및 분석하는 특허 정보 처리 기본 모듈(40), 회원 관리, 정책 관리 등과 같은 각종 지원을 담당하는 지원 모듈(50)(회원 정보 처리 모듈(501), 다국어 처리 모듈(502), 번역 모듈(503) 등이 탑재되어 있다), 특허 정보의 고급 분석과 직접 관계되는 특허 인텔리전스 모듈(60)(상기 특허 인텔리전스 모듈은 주로 특허 분석을 통하여 고급 특허 정보를 생성하므로, 특허 분석 인텔리전스 모듈이라고 명명하기도 한다. 본 명세서에서는 이 양자 용어는 동등한 의미로 사용된다. 이하 같다.) 및 출원인 또는 발명자 또는 대리인 단위로 된 특허 정보 서비스 집합체를 생성하는 계층적으로 통합된 특허 정보 서비스 시스 템이 있다.
상기 특허 정보 시스템(1)은 크게 6가지 구성 요소를 포함하여 구성 되어 있다.
첫째 구성 요소는 각종 전처리 모듈로 이들은 입수된 특허 문건에 대하여 각 목적별로의 각종 전처리를 수행하는 모듈들이다.
둘째 구성 요소는 특허 정보 처리 기본 모듈(40)로 이들에는 1) 검색 기능, 2) 분석 기능, 3) 감시 기능, 4) 분석 기능, 5) 특허 문건 집합 입수 기능, 6) 각종 다단계 디렉토리 생성 기능, 리포팅 기능을 수행하는 모듈을 포함한다.
세번째 구성 요소는 특허 인텔리전스 모듈(60)로 이들에는 1) 인용 분석, 비교 분석 등을 포함한 각종 심화된 특허 분석 정보를 생성하는 모듈이다.
네번째 구성 요소는 특허 정보 서비스 시스템 생성 모듈로 출원인, 발명자, 대리인, 특허 분류 기호별 특허 정보 시스템(1)을 생성하는 모듈이다.
다섯번째 구성 요소는 지원 모듈(50)로 1) 회원 정보 처리, 2) 다국어 처리, 3) 번역 처리, 4) 웹서비스 처리 및 기타 본 발명 사상이 각종 네트워크(200) 환경 에서 서비스 될 수 있도록 하는 지원을 담당하는 구성 요소로 되어 있다.
여섯번째 구성 요소는 각종 DB로 이들 DB에는
1) 특허 문건 마스트 DB(202),
2) 특허 분류 기호 마스트 DB(203),
3) 주체 마스트 DB(204) 등의 각종 마스트 DB,
4) 분석과 관련된 각종 DB,
5) 각종 지원 DB(회원 DB(206-2), 메뉴 DB(206-3), 정책 DB(대표 어구 추출 정책 DB(206-1-1), 가중치 부여 정책 DB(206-1-2), 특허 지표 DB(206-1-3), 분석 질의식 DB(206-1-4)) 등),
6) 각종 2차 가공 DB(텍스트 마이닝 DB(207-1), 대표 어구 DB(207-2),
7) 복수 특허 분류 기호 관계 DB(207-3)) 등이 있을 수 있다.
상기 6가지 구성 요소는 대표적인 요소로 이외에도 본 발명의 명세서에 기재된 다른 구성은 본 발명의 시스템(1)에 포함됨은 당연할 것이며, 당업자에게 전산 시스템을 구성하기 위한 당연한 기능 및 모듈(방화벽, 회원 관리 등등)에 대해서는 별도로 언급하지 않는다.
상기 DB부(20)에는 DB를 관리하는 DBMS(201), 특허 문건을 통합하여 저장하고 있는 DB인 특허 문건 마스트 DB(202), 특허 분류 기호에 대한 정보를 저장하고 있는 특허 분류 기호 마스트 DB(203), 출원인, 발명자, 기업 등에 관한 정보를 저장하고 있는 주체 마스트 DB(204), 다차원 분석 결과를 저장하고 있는 다차원 분석용 연산 수행 결과 테이블 DB(205), 회원 및 각종 정책이나 옵션에 대한 정보를 저 장하고 있는 지원 DB부(206) 및/또는 각종 데이터를 가공한 결과물을 저장하고 있는 2차 가공 DB부(207) 등이 있다.
상기 메뉴 DB에는 각 국가 또는 각 언어별로 각 메뉴에 대한 표기법이 있으며, 본 발명의 특허 정보 시스(1)은 접속하는 사용자의 브라우저에 있는 로케일 정보를 읽어 그 로케일 정보에 대응되는 각 국가별/언어별 메뉴를 상기 메뉴 DB에서 추출하여 상기 추출된 언어로 된 메뉴로 화면을 생성하여 사용자에게 전송한다. 이를 위해서는 각 화면에 포함된 메뉴 등이 코드화 되어 있어야 하며, 화면을 구성하는 html 등은 언어로 된 메뉴가 아니라 메뉴 코드를 포함하고 있어야 한다. 예를 들어 "검색"이라는 메뉴가 있을 때, 그 코드가 1111이라고 하면, 1111 : 검색(한국어) : search(영어) : 檢索(일본어) 등과 같이 처리해 놓아야 한다. 상기 메뉴란 광의적으로 보면 화면을 구성하는 텍스트 및 이미지를 말한다. 상기 텍스트 및 이미지에 언어 표현이 들어 있는 경우, 각 텍스트 및 이미지에 대하여 상기 "검색"에서 해 놓은 것과 동일한 처리를 해 놓으면, 사용자 브라우저의 로케일 정보를 입수하고, 그 로케일 정보에 부합하는 언어의 메뉴(텍스트, 이미지)를 추출하여 이들의 조합하여 html로 구성하여 사용자에게 전송하면 된다. 이러한 과정을 통하여 다국어 처리가 된 특허 정보 시스템(1)을 구축할 수 있다. 한편, 사용자가 특정한 언어를 선택할 때, 그 언어가 상기 메뉴 DB에 있는 경우, 그 언어에 맞는 언어의 메뉴를 추출하면 되고, 상기 메뉴 DB에 없는 경우, 영어를 default로 하여 영어 메뉴를 추출하여 처리한다.
전처리 모듈부(30)
본 발명의 각종 전처리 모듈에 대해서 설명한다. 상기 전처리 모듈브(30)에는 1) 원천 특허 문건 처리 모듈(301-1), 2) 카운팅 전처리 모듈(3100), 3) 특허 분류 기호별 통계 전처리 모듈(3200), 4) 가중치 전처리 모듈(3300), 5) 인용 정보 전처리 모듈(3400), 6) 특허 분류 기호 전처리 모듈(301-3-1 또는 3500), 7) 출원인 대표명화 전처리 모듈(301-4-1-1 또는 3600), 8) 대표 어구 추출 전처리 모듈(3700), 9) 패밀리 정보 전처리 모듈(3800), 10) 복수 특허 분류 기호 관계성 전처리 모듈(3900), 11) 권리자 변동 정보 전처리 모듈(302), 12) 행정 처리 정보 입수 모듈(303) 중 어느 하나 이상이 더 포함되어 있을 수 있다.
원천 특허 문건 처리 모듈(301-1)
본 발명의 원천 특허 문건 처리 모듈(301-1)에 대해 설명한다. 상기 원천 특허 문건 처리 모듈(301-1)은 입수된 각 국가별(국제 출원된 특허 문건은 WIPO에서 공개한다. WIPO는 국가가 아니나, 기재의 편의상 국가별에 포함시켜서 설명한다.) 입수 특허 문건 데이터(XML, SGML 또는 기타 형식)을 처리한다.
상기 원천 특허 문건 처리 모듈(301-1)은 상기 입수 특허 문건 데이터를 입수하여 기설정된 처리를 수행한 다음, 상기 입수 특허 문건 데이터를 본 발명의 특허 정보 시스템(1)에서 처리 가능한 형식에 부합하는 특허 문건 데이터를 생성한다
상기 기설정된 처리에는 1) 오류 필터링, 2) 패턴화된 오류 수정, 3) 수동 오류 수정, 4) SGML 문건 데이터를 XML 문건 데이터로의 변환, 5) 표준 형식 변환 등이 있을 수 있다.
상기 원천 특허 문건 처리 모듈(301-1)은 입수되는 상기 입수 특허 문건 데이터를 기설정된 적어도 하나 이상의 오류 검증 필터(301-1-1)를 통과시켜 상기 입수 특허 문건 데이터가 본 발명의 특허 정보 시스템(1)에서 처리 가능한 형식에 부합하는지를 검증한다.
상기 오류 검증 필터(301-1-1)에서 검증하는 오류에는 1) 각종 XML, SGML의 태그 오류-각 특허 문건에 포함하는 XML의 DTD 정보와의 실제 문건 데이터 간의 일치성을 포함한다, 2) 태그 내의 값의 표기 상의 오류, 각종 서지 사항 필드의 각 내용의 표기 상의 오류(예를 들면 문건 번호 상의 연도 표시, 특허 분류 기호 표기 형식의 오류 등), 및 기타 각종 오류 등이 있다.
또한, 상기 원천 특허 문건 처리 모듈(301-1)에는 오류 패턴 교정 모듈(301-1-2)이 있으며, 상기 오류 패턴 교정 모듈(301-1-2)은 빈발하는 오류 패턴들 및 이러한 오류 패턴들에 대응되는 교정 패턴을 포함하고 있어, 상기 오류 검증 필터(301-1-1)에서 필터링 되는 각종 오류 중에서 교정 가능한 오류 패턴일 경우에는 상기 오류를 자동으로 교정한다. 상기 오류 패턴 및 교정 패턴들은 지속적으로 추가될 수 있을 것이다. 상기 오류 패턴 교정 모듈(301-1-2)이 교정하지 못하는 오류들은 수동으로 처리하여 교정된 특허 문건 데이터를 생성한다. 상기 오류 패턴 및 교정 패턴들은 오류/정정 패턴 DB에 저장된다. 상기 오류 패턴 및 정정 패턴의 예로서는 연도 표기에서 2자리 연도 표시, 연월일 구분자가 잘못된 경우, 출원번호의 자릿수 표기가 잘못된 것(특히 0의 개수 등), 특허 분류 기호 표기에서 형식이 잘못된 것들(/기호가 누락된 것들, 대소문자 표기 오류, / 기호 뒤에 불필요한 0이 포함된 것들 등)이 있다.
또한, 상기 원천 특허 문건 처리 모듈(301-1)은 SGML 형식으로 된 입수 특허 문건 데이터를 상응하는 XML 특허 문건 데이터로 변환하는 SGML-XML변환 모듈을 더 포함하고 있는 것이 바람직하다. SGML-XML변환 모듈은 상기 SGML 문건 데이터와 관련된 DTD 데이터를 참조하여 XML 문건 데이터의 DTD에 부합하게 변환하여 변환된 XML 문건 데이터를 생성한다. 상기 오류 검증은 상기 SGML-XML변환 모듈이 변환 처리한 XML 문건 데이터로 수행하는 것이 바람직하다. 본 발명의 특허 정보 시스템(1)은 XML로 변환된 특허 문건을 기초로 설명하고 있으나, 본 발명의 사상은 XML이 아닌 다른 형식의 구조화된 특허 문건 데이터에 대해서도 여전히 유효하게 성립됨은 자명하다 할 것이다.
또한, 상기 원천 특허 문건 처리 모듈(301-1)은 표준 형식 변환 모듈을 더 포함하고 있을 수 있는데, 상기 표준 형식 변환 모듈은 상기 오류가 검증된 특허 문건 데이터를 통일된 하나의 표준 형식으로 변환하는 기능을 수행하여 표준화된 특허 문건 데이터를 생성한다. 특허 문건은 시간에 따라(SGML, XML과 같은 형식의 변화, 같은 형식이라도 그 세부 DTD의 변화, 필드명의 추가, 표기 형식의 변경 등), 입수되는 국가 또는 기관에 따라 다른 데이터 형식을 가지고 있으므로(WIPO는 XML의 표준을 정하고 있으나, 그 표준을 준수하면서도 다른 DTD는 얼마든지 있을 수 있다. 대한민국 발행 XML 문건, 미국 특허청 발행 XML 문건, 일본 특허청 발행 XML 문건, EPO 발행 XML 문건 등은 그 형식에서 상당히 다른 점이 있다), 이를 하 나의 표준화된 DTD하의 하나의 XML 문건 형식으로 통일할 경우, XML에 스타일을 입힐 때나 pdf로 변환할 때 등과 같이 향후의 문건 처리가 간편해 질 수 있다.(통일성이 없으면, 각 문서 형식마다 새로운 스타일을 입히거나 pdf를 생성해야 하는 등 처리가 복잡하다.) 상기 표준 형식 변환에는 각 국가에서는 표준적으로 쓰이나 국제적으로 통용되지 않는 사항들의 변환도 포함된다. 그 대표적인 예로, 일본 특허 문건에서 발견되는 소화나 평성과 같은 연호 표기이다. 상기 연호에 대해서 4자리로 된 연도 표기로 변경하는 것이 일례가 된다.
이하, 본 발명의 특허 문건 데이터 또는 특허 문건은 상기 오류 필터를 통과하거나, 변환된 것이거나, 교정되거나, 표준화된 특허 문건 데이터 또는 특허 문건을 말한다.
상기 원천 특허 문건 처리 모듈(301-1)이 처리하고 저장한 특허 문건 데이터는 본 발명의 특허 정보 시스템(1)에의 각 목적에서 사용된다. 상기 각 목적에는 1) 검색 목적의 가공, 2) 특허 문건 마스트 DB 생성, 3) 번역 수행, 4) pdf화 등과 같은 문건 출력 형식 가공, 5) 스토리지 저장 및 백업 등과 같은 것들이 있을 수 있다.
특허 문건 마스트 DB 생성 모듈(301-2)
본 발명의 특허 문건 마스트 DB 생성 모듈(301-2)은 상기 원천 특허 문건 처리 모듈(301-1)이 생성한 특허 문건 데이터 및 본 발명의 각종 전처리 모듈이 처리한 정보를 기초로 하여 특허 문건 마스트 DB(202)를 생성한다. 본 발명의 특허 문건 마스트 DB 생성 모듈(301-2)이 포함하고 있는 세부 모듈을 나열하면 다음과 같다. 1) 원천 서지사항 DB(202-1-1), 가공 서지사항 DB(202-1-2), 번역 서지사항 DB(202-1-3), 대표 도면 DB(202-1-4)를 생성하는 서지 사항 DB 생성 모듈(301-2-1)이 있다. 2)특허 문건 DB(202-2-1), 번역 특허 문건 DB(202-2-2), 가공 특허 문건 DB(202-2-3)을 생성하는 문건 DB 생성 모듈(301-2-2)이 있다. 3) 미국 assignee 변동 DB(202-3-1), 권리 설정 변동 DB(202-3-2)를 생성하는 권리자 변동 DB 생성 모듈(301-2-3)이 있다. 4) 국가별 특허 상태 DB(202-4-1), 국가별 패밀리 DB(202-4-2)를 생성하는 패밀리 정보 DB 생성 모듈(301-2-4)이 있다. 5) 출원인 인용 정보 DB(202-5-1), 심사 인용 정보 DB(202-5-2)를 생성하는 인용 정보 DB 생성 모듈(301-2-5) 및 6) 행정 처리 정보 DB (202-6)를 생성하는 행정 처리 정보 DB 생성 모듈(301-2-6)이 있다.
상기 특허 문건 마스트 DB(202)에는 서지 사항 DB, 문건 DB, 권리 변동 정보 DB, 패밀리 정보 DB, 인용 정보 DB, 행정 처리 정보 DB 등이 있다.
상기 서지 사항 DB에는 특허 문건 데이터에서 직접 입수할 수 있는 원천 서지 사항 정보, 특허 문건 데이터 자체 또는 전체 특허 문건 데이터 집합을 대상으로 가공한 가공 서지 사항 정보, 각종 언어별로 상기 원천 서지 사항 및 가공 서지 사항 중 번역의 대상이 되어 번역된 언어별 번역 서지 사항 정보 및 기타 정보를 포함하고 있다. 상기 서지 사항 DB를 생성하는 것은 본 발명의 서지 사항 DB 생성 모듈이 담당한다.
상기 문건 DB에는 특허 문건 데이터 자체에 관한 특허 문건 데이터, 상기 특허 문건 데이터의 일부 또는 전부를 각종 언어로 번역한 언어별 번역 문건 데이터, 상기 특허 문건 데이터 또는 상기 언어별 번역 특허 문건 데이터를 pdf, doc, tiff, html 등과 같은 각종 파일 형식으로 변환한 가공 특허 문건 데이터를 포함하고 있다. 상기 각 특허 문건 데이터, 언어별 번역 특허 문건 데이터, 가공 특허 문건 데이터는 각각 특허 문건 DB, 번역 특허 문건 DB, 가공 특허 문건 DB의 형태로 존재할 수 있다. 상기 문건 DB를 생성하는 것은 본 발명의 문건 DB 생성 모듈이 담당한다.
상기 권리자 변동 정보 DB에는 미국 특허 문건을 대상으로 한 assignee 변동 정보 DB를 포함하고 있으며, 각국 특허청이 관리하는 각종 특허권자 및 특허출원인의 명의 정보의 변경 사항에 관한 정보 및 각종 실시권자의 설정 등록과 말소 등록에 관한 정보를 포함할 수 있다. 상기 권리자 변동 정보 DB를 생성하는 것은 본 발명의 권리자 변동 DB 생성 모듈이 담당한다.
상기 패밀리 정보 DB에는 개별 특허 문건과 관련된 각 국가별 패밀리 특허 문건에 관한 정보를 포함하고 있는 국가별 패밀리 데이터 및 각 패밀리 특허 문건의 각 국가에서의 상태(국가별 출원의 현 상태, 권리 취득 여부 등) 정보를 포함하고 있는 국가별 특허 상태 데이터를 포함할 수 있다. 상기 패밀리 정보 DB를 생성하는 것은 본 발명의 패밀리 정보 DB 생성 모듈이 담당한다.
상기 인용 정보 DB에는 특허 출원인이 인용한 인용 정보에 기초하여 생성되는 출원인 인용 정보 DB, 특정한 특허 출원에 대한 심사관의 심사 과정에서 인용된(주로 심사 대상 특허 출원의 신규성 및 진보성을 부정하기 위하여 인용되는 문건) 타 특허 문건심사 인용에 관한 정보에 기초하여 생성되는 심사 인용 정보 DB 가 있다. 상기 인용 정보 DB를 생성하는 것은 본 발명의 인용 정보 DB 생성 모듈이 담당한다.
상기 행정 처리 정보 DB에는 각 특허 문건에 대하여 각국 특허청이 발생시키는 행정 처리 정보에 기초하여 생성되는 데이터를 포함하고 있다. 상기 행정 처리 정보 DB를 생성하는 것은 본 발명의 행정 처리 정보 DB 생성 모듈이 담당한다.
상기 원천 서지 사항 정보에는 특허 문건 데이터에서 직접 입수할 수 있는 정보로 전술한 바와 같다. 상기 서지 사항 DB 생성 모듈은 서지 사항 DB의 테이블 구조, 각 테이블의 필드명 및 각 테이블의 필드명과 특허 문건 데이터에 포함된 대응되는 태그명과의 대응 관계에 대한 지정 정보를 참조하여 특허 문건 데이터에서 입수한 정보를 상기 각 테이블의 각 필드의 내용으로 입수한다.
예를 들어 설명하면 다음과 같다.
- <KR_ApplicationInformation>
  <KR_ApplicationNumber>10-2006-7012696</KR_ApplicationNumber>
  <KR_ApplicationDate>2006년06월23일</KR_ApplicationDate>
  </KR_ApplicationInformation>
- <KR_Applicant>
- <KR_ApplicantInformation>
  <KR_ORGName>콸콤 인코포레이티드</KR_ORGName>
  <KR_Country>미국</KR_Country>
  <KR_Postcode>000-000</KR_Postcode>
  <KR_Address>미국 캘리포니아 샌디에고 모어하우스 드라이브5775 (우 92121-1714)</KR_Address>
  </KR_ApplicantInformation>
  </KR_Applicant>
특허 문건 데이터에 상기와 같은 정보가 있을 때, 출원번호가 필요한 테이블의 출원번호 필드에 그 내용으로 10-2006-7012696을 입수하여 10-2006-7012696을 그대로 입력하거나 아니면 1020067012696 등과 같이 기설정된 필드별 입력 형식에 맞추어 변환한 다음 입력한다. 마찬가지로 출원일 필드에 그 내용으로 2006년06월23일을 그대로 입력하거나, 20060623으로 변환하여 입력할 수 있다. 한편, 출원 인 테이블이 있고, 그 테이블에 출원인 명의 필드, 출원인 국가 필드, 출원인 주소 필드, 출원인 우편번호 필드가 있는 경우, 그 필드에 각각 콸콤 인코포레이티드, 미국, 000-000, 미국 캘리포니아 샌디에고 모어하우스 드라이브5775 (우 92121-1714)를 입력한다.
이때 출원번호를 입력하는 필드명이 AppNum이라고 하면, AppNum에 KR_ApplicationNumber의 대응 관계에 관한 정보를 지정해 주어야 KR_ApplicationNumber 태그에 들어 있는 내용을 AppNum 필드에 입력할 수 있을 것이다. 상기 각 테이블의 필드명 및 각 테이블의 필드명과 특허 문건 데이터에 포함된 대응되는 태그명과의 대응 관계에 대한 지정 정보는 이와 같은 것이다.
한편, XML 문건이 주어져 있을 때, 이를 DB화 시키는 솔루션들은 오픈 소스 또는 상용 소프트웨어로 다수 나와 있으며, 이에 대한 프로그래밍은 XML 문서 파싱(parsing)에 대한 지식이 있는 당업자에게는 용이한 것이다.
상기와 같은 과정을 통하여 상기 서지 사항 DB 생성 모듈은 특허 문건 데이터에서 서지 사항을 입수하여 DB화 시킬 수 있게 되며, 이러한 원천 서지 사항 정보가 저장되어 있는 DB를 원천 서지 사항 DB라 한다.
이어, 상기 서지 사항 DB 생성 모듈은 상기 특허 문건 데이터 및/또는 전체 특허 문건 데이터를 대상으로 각종 전처리 모듈 등이 가공한 정보를 입수하여 가공 서지 사항 데이터를 생성할 수 있으며, 상기 가공 서지 사항 데이터를 포함하고 있는 DB를 가공 서지 사항 DB라 한다. 상기 가공 서지 사항에는 1) 각종 카운팅 정보, 2) 각종 계산 및 평가 정보 등이 있을 수 있다.
각종 카운팅 정보를 예를 든다면, 1)출원인 수 및/또는 특허권자 수, 2) 발명자 수, 3) 출원 또는 등록 단계 등과 같은 각 단계별 청구항 수, 4) 명세서 페이지 수, 5) 도면 수, 6) 특허 분류 기호의 종류 수, 7) 각 종류의 특허 분류 기호의 수, 8) 레퍼런스(reference)수(=인용수)/피인용 수, 9) 심사 인용 수/피인용 수, 10) 심사관이 조사한 특허 분류 기호의 수, 11) 우선권 주장수, 12) 자국 포함 각 국가별 패밀리 특허 개수, 13) 전체 패밀리 개수, 14) 독립항 수, 15) 종속항 수, 16) 레퍼런스 중에서 국가 단위의 특허 수, 17) 레퍼런스 중에서 전체 특허 문건 수, 18) 레퍼런스 중에서 비특허 문건 수 등이 있을 수 있다. 상기와 같은 카운팅 정보를 처리하는 것은 본 발명의 카운팅 전처리 모듈이 담당한다. 상세한 것은 본 발명의 카운팅 전처리 모듈에서 설명한다.
각종 계산 및 평가 정보를 예로 든다면, 1) 그 특허 문건에 포함된 출원인의 그 특허 문건에 포함된 특허 분류 기호(그 특허 분류 기호 자체, 그 특허 분류 기호의 하위 특허 분류 기호 전체, 또는 직상위/차상위 특허 분류 기호 또는 그 특허 분류 기호의 메인그룹까지의 모든 단계의 특허 분류 기호를 대상으로 할 수도 있다.)에 대한 총출원수, 총등록수, 점유율, 집중율, 활동율(AI)등과 같은 각종 특허 지표를 계산한 값, 2) 그 특허 문건에 포함된 발명자의 그 특허 문건에 포함된 특허 분류 기호에 대한 각종 특허 지표를 계산한 값, 3) 각종 분석 지표 등이 있을 수 있으며, 상세한 것은 본 발명의 각종 전처리 모듈 및 분석 모듈에서 설명한다.
특허 분류 기호 마스트 DB 생성 모듈(301-3)
본 발명의 상기 전처리 모듈에는 특허 분류 기호 마스트 DB 생성 모듈(301-3)을 포함하고 있는데 상기 특허 분류 기호 마스트 DB 생성 모듈(301-3)이 생성하는 DB는 다음과 같다.
1) 각국의 특허청 또는 특허 원천 데이터 소스들로부터 입수되는 각종 특허 분류 기호의 raw data를 저장하고 있는 원천 특허 분류 기호 DB(203-1)이다.
2) 각종 특허 분류 기호를 본 발명의 특허 정보 시스템(1)의 용도에 맞게 변형한 특허 분류 기호를 저장하고 있는 변형 특허 분류 기호 DB(203-2)가 있으며, 이는 변형 특허 분류 기호 생성 모듈(301-3-3)이 생성한다.
3) 임의의 특허 분류 기호에 대한 모든 상위 특허 분류 기호를 모아서 저장하고 있는 총상위 특허 분류 기호 집합 DB(203-3)가 있으며, 이는 총상위 특허 분류 기호 집합 생성 모듈(301-3-1-1)이 생성한다.
4) 임의의 특허 분류 기호에 대한 직하위 또는 모든 하위 특허 분류 기호에 대한 정보를 저장하고 있는 하위 특허 분류 기호 집합 DB(203-4)가 있으며, 이는 특허 분류 기호 집합 생성 모듈(301-3-1-2)이 생성한다. 상기 하위 특허 분류 기호 집합 생성 모듈(301-3-1-2)에는 직하위 특허 분류 기호 집합만을 생성하는 직하위 특허 분류 기호 집합 생성 모듈(301-3-1-2-1)와 모든 하위 특허 분류 기호 집합을 생성하는 총하위 특허 분류 기호 집합 생성 모듈(301-3-1-2-2)이 있다.
5) 특허 분류 기호 체계를 트리 구조로 저장하고 있는 특허 분류 기호 트리 테이블 DB(203-5) 있으며, 이는 특허 분류 기호 트리 테이블 생성 모듈(미도시)이 생성한다.
6) 임의의 특허 분류 기호에 대한 총상위 특허 분류 기호를 레벨별로 저장하고 있는 총상위 특허 분류 기호 테이블 DB(203-6)가 있으며, 이는 총상위 특허 분류 기호 집합 생성 모듈(301-3-1-1)이 생성한다. 한편, 특허 분류 기호에서 갱신이 있을 경우, 이는 본 발명의 특허 분류 갱신 모듈(301-3-5)이 처리하며, 갱신된 특허 분류 기호에 대하여 관련된 기설정된 모듈이 기설정된 처리를 수행한다.
이하, 특허 분류 기호에 대해서 통합적으로 설명한다.
특허 분류 기호의 다단계성
다단계 계층(트리, tree) 구조로 되어 있는 각 특허 분류 기호는 특허 분류 기호 vs. 그 특허 분류 기호의 타이틀 정보의 대응 관계를 갖고 있다. 본 특허 명세서의 곳곳에서 이러한 예를 다수 제시되어 있다. 계층 구조 상에서 주어진 특허 분류 기호의 하위 특허 분류 기호 모두에 대한 정보를 입수하기 위해서는 검색 엔진(검색 모듈(401)과 검색 엔진은 동의어로서 본 발명에서 사용된다.) 또는 DBMS(201)에 확장자/와일드카드 등을 사용할 수 있다. 예를 들어, H01F의 하위 특허 분류에 관한 모든 정보를 입수하려면, 검색어 또는 질의어에 H01F에 확장자/와일드카드(예를 들어?)를 결합하여 질의하면 H01F의 모든 하위 특허 분류 기호를 입수할 수 있다. 마찬가지로 H01F1/00의 하위 특허 분류에 관한 모든 정보를 입수하려면 "H01F1?"을 입력하면 된다. 하지만, 만약 H01F1/01의 하위 특허 분류에 관한 모든 정보를 입수하기 위해서는 "H01F1/01?"를 입력할 수 없다. 그 이유는 IPC 등 의 특허 분류 기호의 타이틀 정보에 도트(dot)가 포함되는 특허 분류 기호들은 동일한 표시 패턴(예를 들어 IPC의 경우 메인그룹 표시+ / + 숫자, USPC의 경우 클래스번호+숫자, FT의 경우에는 숫자1자+영문자1자+3자리숫자+영문자2자+숫자 등)을 가지면서 도트의 수로서 상대적인 부모 자식(parent child) 관계/상위 하위 관계를 표시하기 때문이다. 즉, 타이틀 정보에 도트가 포함되어 있지 않은 경우에는 특허 분류 기호의 표기 체계 만으로도 부모 자식 관계/상위 하위 관계를 구별할 수 있지만, 그렇지 않은 경우에는 특허 분류 기호의 표기 체계 만으로는 구별할 수 없기 때문이다.
한편, 특허 분류 기호가 계층 구조를 가진다는 속성 상, 하위 특허 분류 기호에 해당하는 특허 문건은 상위 특허 분류 기호에도 해당되는 것이 마땅하다. 즉, 특정 특허 문건에 H01F1/04라는 특허 분류 기호가 할당되었다면, 이 특허 문건은 H01F1/032에도 해당되고, H01F1/03에도 해당되며, H01F1/01에도 해당되며, 당연히 H01F1/00에도 해당되게 된다. 이를 역으로 해석하면 H01F1/03과 관련되는 특허 정보에는 H01F1/03뿐만 아니라, 특허 분류 기호의 계층 구조 체계 상 H01F1/03의 하위에 있는 모든 특허 분류 기호에 관련된 특허 정보가 포함되어 있어야 한다. 즉, H01F1/03과 관련되는 특허 정보에는 당연히 H01F1/032, H01F1/04뿐만 아니라 특허 분류 기호 체계 상 H01F1/03의 하위에 있는 모든 특허 분류 기호에 관련된 특허 정보가 포함되어야 한다.
도 64에서는 이와 같은 본 발명의 발명 사상이 적용되지 않은 경우의 한 예를 보여주고 있다. 도 64에서 알 수 있듯이 A61B 3/00에 대응되는 문건보다 그 하 위 분류인 A61B 3/02에 대응되는 문건이 많이 나오고 있다.
하위 특허 분류 기호의 처리 방법 3가지
상기와 같은 이유로, 타이틀 정보에 도트가 포함되어 있는 특허 분류 기호에 대해서는 그 특허 분류 기호의 모든 하위 특허 분류 기호에 관한 정보를 포함하도록 처리할 필요가 있으며, 이와 같은 처리를 담당하는 것은 본 발명의 특허 분류 기호 마스트 DB 생성 모듈(301-3)에 포함되어 있는 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)이다.
주어진 특허 분류 기호에 대한 정보 추출의 모든 과정에는 그 하위 특허 분류 기호에 관한 특허 정보를 포함시킬 필요가 있으며, 그러한 정보 추출 과정의 대표적인 경우로서 1) 검색, 2) 통계, 3) 분석, 4) 감시, 5) 디렉토리 표시 등을 들 수 있다. 확장자(와일드카드)를 사용하지 못하는 상황에서 주어진 특허 분류 기호에 대하여 모든 하위 특허 분류 기호에 관한 정보를 포함시키기 위해서는 본질적으로 다음과 같은 과정 중 어느 하나의 처리가 필요하게 된다.
첫째, 주어진 특허 분류 기호에 대하여 특허 분류 기호 체계(트리 구조)를 깊이 우선 탐색 등의 방식으로 탐색하여 모든 하위 특허 분류 기호에 관한 정보를 입수한다. 이러한 정보 입수 과정은 질의/검색마다 매번 일어날 수 있다. 한편, 주어진 특허 분류 기호 체계(트리 구조)에 대하여 모든 특허 분류 기호 또는 타이틀 정보에 도트를 포함하고 있는 특허 분류 기호에 대한 모든 하위 특허 분류 기호를 입수하여 저장해 놓고, 질의/검색 시 저장된 모든 하위 특허 분류 기호에 관한 정보를 입수하는 방식을 취할 수도 있다. 트리 구조로 된 데이터가 주어졌을 때, 이 트리 구조를 구성하는 각 노드(node)에 대하여 깊이 우선 탐색 등의 방식으로 각 노드의 직하위 노드 및/또는 모든 하위 노드를 찾아 내는 것은 전산학의 기초에 해당하는 것이므로, 이에 대한 설명은 생략한다. 또한, 입수한 직하위 노드 및/또는 모든 하위 노드의 정보를 특정 노드에 대응시켜 저장하는 것 또한 기초적인 것이므로, 이에 대한 설명도 생략한다.
둘째, 모든 특허 분류 기호에 대하여 자신의 상위에 해당하는 특허 분류 기호에 관한 정보를 특허 분류 기호 체계(트리 구조)를 참조하여 단계별로 저장해 놓은 다음 주어진 특허 분류 기호가 있을 때, 이 특허 분류 기호가 최초로 나타나는 특정 단계를 찾아 내고, 그 특정 단계에 그 특허 분류 기호가 표기되어 있는 모든 특허 분류 기호에 관한 정보를 입수하는 방식을 취할 수도 있다.
셋째, 주어진 특허 분류 기호 체계(트리 구조)를 그 체계를 유지하면서 특허 분류 기호의 표기만을 변형시켜, 변형 특허 분류 기호를 생성하고, 변형 특허 분류 기호에 대하여 위 첫째와 둘째 방법을 실시할 수 있다. 한편, 특허 분류 기호 체계를 참조하여 변형하는 방식을 적절히 선택하면 범위(range) 검색/범위(range) 질의에 응답할 수 있도록 특허 분류 기호 표기를 변형할 수 있게 된다.
H04B 7/00를 통한 예시적 설명
이하, 더욱 상세하게 설명한다.
특허 분류 기호 정보와 상기 전술한 특허 분류 정보의 타이틀 정보는 1:1로 대응되어 있으며, IPC의 경우 통상적으로 서브그룹 이하에서는 도트의 개수로 특허 분류 기호로는 표현할 수 없는 상하위 계층 정보를 표현한다. IPC의 경우에는 서 브그룹 이하에서는 특허 분류 기호 정보만으로는 상위와 하위 관계를 알기 어려우므로, 특허 분류 기호 정보에 대응되는 타이틀 정보에 포함되어 있는 도트를 활용하여 상하위 계층 정보를 파악한다. 즉, 서브그룹 이하에서는 타이틀에 포함되어 있는 도트 구조를 파악함으로써, 상기 서브그룹 이하의 특허 분류 기호들 간의 상하위 계층 구조를 파악한다. 특허 분류 기호들 간의 상하위 계층 구조는 트리(tree)구조의 형태를 가진다.
본 발명에서는 IPC 7판 기준 메인그룹 H04B 7/00(타이틀은 무선전송시스템이다.) 및 이의 하부에 해당하는 특허 분류 기호를 실시예로 들어 상기 특허 분류 기호들 간의 트리 구조를 설명하나, 이러한 방법 및 설명은 본 실시예에 한정되지 않고, 전 IPC 영역에 걸쳐 동일 또는 대등하게 적용됨은 물론이며, 타이틀에 도트 구조로서 계층의 상위와 하위를 표현하는 방식으로 포함하는 다른 특허 분류 기호 체계(예를 들면, USPC, FI, FT 또는 ECLA) 등에 대해서도 동일 또는 대등한 방식으로 적용된다.
메인그룹 H04B 7/00 및 이의 하부에 해당하는 특허 분류 기호 및 그 타이틀 은 IPC 7판 기준으로 2006년 5월 5일 현재 다음과 같은 구성을 가진다.
H04B 7/00 무선전송시스템, 즉, 방사전자계를 사용한 것
H04B 7/005 .전송의 제어 ; 등화
H04B 7/01 .위상편이의 저감
H04B 7/015 .반향효과의 저감
H04B 7/02 .다이버시티(diversity)시스템
H04B 7/04 .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/06 ...송신국에 있어서의 것
H04B 7/08 ...수신국에 있어서의 것
H04B 7/10 .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12 ..주파수다이버시티 시스템
H04B 7/14 .릴레이(relay)시스템
H04B 7/145 ..수동 릴레이 시스템
H04B 7/15 ..능동 릴레이 시스템
H04B 7/155 ...기지국(ground based stations)
H04B 7/165 ....각도변조를 사용하는 것
H04B 7/17 ....펄스변조를 사용하는 것
H04B 7/185 ...우주국 또는 항공기탑재국(space based or airborne stations)
H04B 7/19 ....지구동기국(earth synchronization stations)
H04B 7/195 ....비동기국
H04B 7/204 ...다중악세스(multiple access )
H04B 7/208 ....주파수분할 다중악세스
H04B 7/212 ....시분할 다중악세스
H04B 7/216 ....코드분할 또는 스프레드-스펙트럼 다중 억세스
H04B 7/22 .산란파 전파시스템
H04B 7/24 .둘 또는 그 이상의 지점간의 통신을 위한 것
H04B 7/26 .. 적어도 하나의 지점이 이동될 수 있는 것
상기를 도트를 기준으로 트리 계층 구조를 더욱 쉽게 할 수 있도록 하면 다음 표 1과 같은 표현될 수 있다.
[표 1]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 4-도트서브그룹 타이틀
H04B 7/00 무선전송시스템
H04B 7/005 .전송의 제어 ; 등화
H04B 7/01 .위상편이의 저감
H04B 7/015 .반향효과의 저감
H04B 7/02 .다이버시티(diversity)시스템
H04B 7/04 .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/06 ...송신국에 있어서의 것
H04B 7/08 ...수신국에 있어서의 것
H04B 7/10 .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12 ..주파수다이버시티 시스템
H04B 7/14 .릴레이(relay)시스템
H04B 7/145 ..수동 릴레이 시스템
H04B 7/15 ..능동 릴레이 시스템
H04B 7/155 ...기지국(ground based stations)
H04B 7/165 ....각도변조를 사용하는 것
H04B 7/17 ....펄스변조를 사용하는 것
H04B 7/185 ...우주국 또는 항공기탑재국
H04B 7/19 ....지구동기국
H04B 7/195 ....비동기국
H04B 7/204 ...다중악세스
H04B 7/208 ....주파수분할 다중악세스
H04B 7/212 ....시분할 다중악세스
H04B 7/216 코드분할 또는 스프레드-스펙트럼 다중 억세스
H04B 7/22 .산란파 전파시스템
H04B 7/24 .둘 또는 그 이상의 지점간의 통신을 위한 것
H04B 7/26 .. 적어도 하나의 지점이 이동될 수 있는 것
상기 표 1과 같은 정보를 기준으로 특허 분류 기호간의 부모 자식 관계/상위 하위 관계를 DB화 할 경우, 다음과 같은 것이 일 실시예가 될 수 있다.(물론, 이 경우 각 특허 분류 기호에 대응되는 타이틀 명칭은 별도의 테이블에 저장되어 있을 수 있다. 상기 타이틀 명칭은 각 언어로 번역하여 각 언어별로 저장되는 것이 바람직하다. 즉, 특허 분류 기호를 키(key)값으로 하여 각 언어별 (번역된)타이틀 정보 테이블이 존재하는 것이 바람직하다.) 주어진 IPC 특허 분류 기호가 있을 때, IPC에서 최초 영문자는 섹션을, 이어서 나오는 숫자까지는 클래스를, 이어서 나오는 영문자까지는 서브클래스를, 이어서 나오는 / 앞까지는 메인그룹을 나타내며, 그 이후는 대응되는 타이틀 정보를 참조하여 도트 레벨임을 알 수 있다. 이때, 특허 분류 기호 체계(트리 구조)를 참조하여 자신의 상위에 있는 모든 특허 분류 기호를 입수하면 아래 표 2와 같은 총상위 특허 분류 기호 테이블을 생성할 수 있다. 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 IPC 뿐만 아니라, USPC, FT, ECLA, FI 등에 대해서도 생성할 수 있음은 물론이다 하겠다. 한편, 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 상기 특허 분류 기호들이 갱신될 때, 갱신된 특허 분류 기호 정보를 입수하여 상기 테이블도 갱신되는 것이 바람직하다. 하기 표 2와 같은 총상위 특허 분류 기호 테이블은 본 발명의 총상위 특허 분류 기호 테이블 생성 모듈이 특허 분류 기호 마스트 DB로부터 특허 분류 기호를 입수 받아 생성한다. 상기 총상위 특허 분류 기호 테이블 생성 모듈은 특허 분류 기호에 관한 정보가 갱신될 때마다 상기 총상위 특허 분류 기호 테이블을 생성하는 것이 바람직하다. 상기 총상위 특허 분류 기호 테이블 생성 모듈은 본 발명의 변형 특허 분류 기호 DB에 대해서도 동일한 형태의 총상위 특허 분류 기호 테이블을 생성해 놓을 수 있을 것이다.
하기 표 2에서 각 필드인, IPC_ID는 특정 IPC의 ID를, S는 섹션 레벨, C는 클래스 레벨, SC는 서브클래스, MG는 메인그룹, 1dot는 타이틀 정보에 1개의 도트가 있는 레벨을, 2dot는 타이틀 정보에 2개의 도트가 있는 레벨을, 3dot는 타이틀 정보에 4개의 도트가 있는 레벨을, (그러므로, n dot는 타이틀 정보에 n개의 도트가 있는 레벨을 나타낸다), self는 IPC 자기 자신을 나타낸다.
[표 2]
IPC_ID S C SC MG 1dot 2dot 3dot 4dot Self
69964 H H04 H04B H04B7/00 H04B7/00
69965 H H04 H04B H04B7/00 H04B7/005 H04B7/005
69966 H H04 H04B H04B7/00 H04B7/01 H04B7/01
69967 H H04 H04B H04B7/00 H04B7/015 H04B7/015
69968 H H04 H04B H04B7/00 H04B7/02 H04B7/02
69969 H H04 H04B H04B7/00 H04B7/02 H04B7/04 H04B7/04
69970 H H04 H04B H04B7/00 H04B7/02 H04B7/04 H04B7/06 H04B7/06
69971 H H04 H04B H04B7/00 H04B7/02 H04B7/04 H04B7/08 H04B7/08
69972 H H04 H04B H04B7/00 H04B7/02 H04B7/10 H04B7/10
69973 H H04 H04B H04B7/00 H04B7/02 H04B7/12 H04B7/12
69974 H H04 H04B H04B7/00 H04B7/14 H04B7/14
69975 H H04 H04B H04B7/00 H04B7/14 H04B7/145 H04B7/145
69976 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/15
69977 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/155 H04B7/155
69978 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/155 H04B7/165 H04B7/165
69979 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/155 H04B7/17 H04B7/17
69980 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/185 H04B7/185
69981 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/185 H04B7/19 H04B7/19
69982 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/185 H04B7/195 H04B7/195
69983 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/204 H04B7/204
69984 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/204 H04B7/208 H04B7/208
69985 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/204 H04B7/212 H04B7/212
69986 H H04 H04B H04B7/00 H04B7/14 H04B7/15 H04B7/204 H04B7/216 H04B7/216
69987 H H04 H04B H04B7/00 H04B7/22 H04B7/22
69988 H H04 H04B H04B7/00 H04B7/24 H04B7/24
69989 H H04 H04B H04B7/00 H04B7/24 H04B7/26 H04B7/26
즉, H04B7/06이라는 IPC 특허 분류 기호가 주어졌을 때, IPC 특허 분류 기호 체계를 참조하여 자신의 모든 부모 노드(트리 구조 상의 분기점 등을 노드(node)라 한다)를 찾으면, H, H04, H04B, H04B7/00, H04B7/02, H04B7/04, H04B7/06, H04B7/06이 되고, 이를 상기 필드 구조에 맞추어 정리하면, IPC_ID69970에 나와 있는 것과 같은 데이터를 생성할 수 있다.
상기 표 2와 같은 총상위 특허 분류 기호 테이블이 주어졌을 때, 주어진 특허 분류 기호의 모든 상위 특허 분류 기호를 입수하는 것은 1) self 필드에서 주어진 특허 분류 기호를 찾고, 찾은 특허 분류 기호의 행을 따라 상위 단계로 올라가면서 각 단계별로 특허 분류 기호를 획득하면 될 것이다. 상기와 같은 주어진 특허 분류 기호의 총상위 특허 분류 기호를 모아서 DB화 시켜 놓은 것이 본 발명의 총상위 특허 분류 기호 집합 DB이며, 상기 총상위 특허 분류 기호 테이블을 활용하여 특정한 특허 분류 기호의 모든 하위 특허 분류 기호를 추출하여 DB화 시켜 놓은 것이 본 발명의 하위 특허 분류 기호 집합 DB이다. 이때, 상기 총상위 특허 분류 기호 테이블을 활용하여 특정한 특허 분류 기호의 직하위 특허 분류 기호만을 추출할 수 있는데, 이러한 정보를 DB와 시켜 놓은 것이 본 발명의 직하위 특허 분류 기호 집합 DB이다.
상기 표 2와 같은 총상위 특허 분류 기호 테이블이 있을 때, 특정한 특허 분류 기호가 주어졌을 때, 그 특허 분류 기호 및 그 하위 모든 특허 분류 기호를 입수하는 방법에 대해서 H04B7/15를 예로써 설명한다. 1 단계로 먼저 Self에서 H04B7/15를 찾으면, IPC_ID69976에 있음을 알게 된다. 2단계로, 어느 레벨의 필드 에서 자기 자신과 동일한 특허 분류 기호가 대응되어 있는지를 찾으면 2 dot 레벨 필드임을 알게 된다. 3단계로, 2 dot 레벨 필드에서 H04B7/15가 있는 특허 분류 기호를 찾으면, 각각 H04B7/15, H04B7/155, H04B7/165, H04B7/17, H04B7/185, H04B7/19, H04B7/195, H04B7/204, H04B7/208, H04B7/212, H04B7/216이 된다. 이들이 H04B7/15 자신과 H04B7/15의 모든 하위 특허 분류 기호가 된다. 찾은 결과에서 자기 자신을 제외하면 자신의 모든 하위 특허 분류 기호를 자기 자신과 대응시킬 수 있음은 물론이다 하겠다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호 및 모든 하위 특허 분류 기호에 관한 정보로 하위 특허 분류 기호 집합 DB를 생성할 수 있다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호의 모든 하위 특허 분류 기호를 저장하면 총하위 특허 분류 기호 집합 DB를 생성할 수 있다. 그리고, 자기 자신을 포함한 모든 하위 특허 분류의 개수(여기서는 11개, 자기 자신을 제외하면 10개)를 카운팅할 수도 있을 것이다. 이러한 카운팅은 본 발명의 카운팅 전처리 모듈이 수행하는 것이 바람직하다.
한편, 여기서 자신의 직하위 특허 분류 기호만을 추출하는 방법을 생각해 보면, 상기 3단계를 수행할 때 3 dot 레벨 필드값이 null이 아니며(직하위에 값이 있음), 4 dot 레벨 필드값이 null인(직하위의 하위값은 없음) 특허 분류 기호를 찾으면, 각각 H04B7/155, H04B7/185, H04B7/204를 얻게 된다. 이때, 특정한 특허 분류 기호에 대하여 그 특허 분류 기호의 직 하위 특허 분류 기호를 저장하면 직하위 특허 분류 기호 집합 DB를 생성할 수 있다.
이때, 자신의 직하위 특허 분류 기호의 개수(여기서는 3)을 카운팅해 놓을 수 있을 것이며, 이러한 카운팅은 본 발명의 카운팅 전처리 모듈이 수행하는 것이 바람직할 것이다. 이와 같은 직하위 특허 분류 기호가 필요한 경우에는 단계별 펼침의 필요성 때문이다. 단계별 펼침이란 IPC 디렉토리 구조를 표시할 때, 각 레벨(섹션, 클래스, 서브클래스, 메인그룹, 1 도트 서브그룹, 2 도트 서브그룹, 3 도트 서브그룹, 4 도트 서브그룹, ... n 도트 서브그룹 등으로 단계별로 펼치는 것을 말하며, 그 단계에 있는 특허 분류 기호만을 표시해 준다. 한편, 이 경우 표시는 단계별 펼침이 되더라도 그 각 단계에 대한 값(검색 결과, 통계값, 계산값, 분석값 등의 모든 값)은 그 특정한 특허 분류 기호 및 그 특정한 특허 분류 기호의 모든 하위 특허 분류 기호를 모두 고려한 값으로 하는 것이 바람직할 것이다. 예를 들면, H04B7/15의 직하위를 펼쳤을 때, H04B7/155, H04B7/185, H04B7/204이 그 다음 단계로 나오더라도, H04B7/155에 대한 값은 H04B7/155 및 H04B7/155의 하위인 H04B 7/165와 H04B 7/165을 모두 포함하여 고려한 값이 H04B 7/155의 값으로 표시되어야 한다는 것을 의미한다. 물론, 특수한 경우에는(사용자의 선택 등) 그 특정한 특허 분류 기호만에 대한 값을 표시해 줄 수 있을 것이다.
상기와 같은 테이블 구조(상기 3단계로 자신의 하위 특허 분류 기호를 찾는데 사용되는 테이블을 말한)는 후술하는 검색 및 분석에서 활용될 수 있으며, 특히 분석 등의 편의를 위해 사전에 각 특허 분류 기호에 대하여 기설정된 규칙에 따르는 값을 계산해 놓을 경우(뷰(View), 물리적인 뷰(Materialized View, 다차원 분석용 연산 수행 결과 테이블), 큐브(Cube) 등)에 활용될 수 있다. 이러한 계산값을 계산할 때 롤업 연산(roll up, 자신에 대한 값에 자신의 하부에 있는 대상에 대한 값들을 포함시켜 자신의 값으로 하는 것을 포함하는 개념이다.)이 활용되며, 이러한 롤업 연산의 경우 상기 테이블이 활용될 수 있다. 롤업 연산이란 예를 들면 연도값에는 각 분기별 값을 더하여 연도값을 생성할 수 있으며, 각 분기별 값은 각 분기를 이루는 월들의 값을 더하여 분기별 값을 생성할 수 있는 방식을 말한다. 특정 특허 분류 기호에 대한 값(예를 들면 연도별 출원수)을 계산할 때, 자기 자신에 대한 값과 자신의 하위 특허 분류 기호에 대한 값을 합하여 그 특허 분류 기호에 대한 값을 생성할 수 있다. 상세한 것은 본 발명의 분석에서 상술한다.
상기와 같은 방법으로 모든 IPC 코드/IPC 특허 분류 기호에 대해서 동일하게 처리하면, 모든 IPC 특허 분류 기호를 대상으로 하는 상기와 같은 형식의 테이블을 생성할 수 있고, 이러한 테이블 및 상기에서 언급한 각 언어별 타이틀 정보를 포함하여 원천 특허 분류 기호 DB 중 IPC에 해당하는 원천 IPC 특허 분류 기호 DB를 생성할 수 있다. 상기와 같은 방식으로 USPC, FT, FI, ECLA 등도 마찬가지의 테이블을 생성할 수 있게 된다.
US class 002 apparel를 통한 예시적 설명
이에 대해서는 USPC를 한 예로 들면서 재차 설명한다.
하기는 US class 002 apparel의 서브클래스 중 맨 앞쪽 일부에 대한 것이다. 상기는 http://www.uspto.gov/web/patents/classification/uspc002/sched002.htm에서 copy한 부분이다. 아래의 숫자들 앞에는 class 번호인 002가 생략되어 있지만, 모든 숫자 앞에는 002가 붙어 있는 것으로 생각해야 한다.
1 MISCELLANEOUS
455 GUARD OR PROTECTOR
456 .Body cover
457 ..Hazardous material body cover
458 ..Thermal body cover
2.11 .. Astronaut'''s body cover
2.12 ... Having relatively rotatable coaxial coupling component
2.13 ...Having convoluted component
2.14 ..Aviator'''s body cover
2.15 ..Underwater diver'''s body cover
2.16 ...Having an insulation layer
2.17 ...Having a garment closure
459 .Shoulder protector
위와 같은 이러한 정보는 USPTO에서 구입할 수 있으며, 기타 여타의 방법으로 입수할 수 있다. 참고로 USPTO에서 판매하고 있는 Index to U.S. Patent Classification 파일에는 다음과 같이 표현되어 있다.(첫번째 열은 자기 자신 USPC이며, 두번째 열은 깊이/레벨 표시(class는 0, no dot는 1, 1 dot는 2로 표시되어 있다.), 3번째 열은 일련번호, 4번째 열은 자신의 부모 노드 표시, 마지막 열은 타 이틀 명칭이다.)
002000000 0 1 APPAREL
002001000 1 2 002000000 MISCELLANEOUS
002455000 1 3 002000000 GUARD OR PROTECTOR
002456000 2 4 002455000 Body cover
002457000 3 5 002456000 Hazardous material body cover
002458000 3 6 002456000 Thermal body cover
002002110 3 7 002456000 Astronaut'''s body cover
002002120 4 8 002002110 Having relatively rotatable coaxial coupling component
002002130 4 9 002002110 Having convoluted component
002002140 3 10 002456000 Aviator'''s body cover
002002150 3 11 002456000 Underwater diver'''s body cover
002002160 4 12 002002150 Having an insulation layer
002002170 4 13 002002150 Having a garment closure
002459000 2 14 002455000 Shoulder protector
상기와 같은 USPC 정보가 있을 때, 하기 표 3과 같이 상기 USPC 특허 분류 기호의 타이틀 정보에 포함되어 있는 도트 정보 또는 parent 정보를 기준으로 USPC 특허 분류 기호 다단계 계층 구조 체계를 생성할 수 있게 됨은 당업자에게는 당연한 것이라 하겠다. 상기 USPC 정보를 바탕으로 하기와 같은 테이블을 생성할 수 있을 것이다. 생성의 방법은 IPC에서 수행한 것과 동일하다. 물론, 이 경우에도 USPC에 대하여 영어로 된 타이틀 정보가 포함되어 있는 테이블에서 나아가 각 언어별로 타이틀 정보를 번역한 테이블이 존재할 수 있음은 당연할 것이다. 하기에서 super category는 USPC의 클래스 레벨의 상위 카테고리를 생성할 수 있음을 보여준다. USPC에서 클래스는 공식적인 최상위 레벨이지만, 그 클래스의 수가 수백에 이르므로, 이들 수백 개의 클래스를 그룹화/카테고리화 한 수퍼 카테고리의 필요성이 있는 경우, 이를 생성할 수 있을 것이다. 하기 표 3에서는 002 클래스는 모두 그 상위에 M1 수퍼 카테고리에 속해 있음을 알 수 있다.
[표 3]
USPC_ID super category Class 0 dot 1 dot 2 dot 3 dot Self
2 M1 002000000 002000000
3 M1 002000000 002455000 002455000
4 M1 002000000 002455000 002456000 002002110 002002110
5 M1 002000000 002455000 002456000 002002110 002002120 002002120
6 M1 002000000 002455000 002456000 002002110 002002130 002002130
7 M1 002000000 002455000 002456000 002002140 002002140
8 M1 002000000 002455000 002456000 002002150 002002150
9 M1 002000000 002455000 002456000 002002150 002002160 002002160
10 M1 002000000 002455000 002456000 002002150 002002170 002002170
436 M1 002000000 002455000 002456000 002456000
437 M1 002000000 002455000 002456000 002457000 002457000
438 M1 002000000 002455000 002456000 002458000 002458000
439 M1 002000000 002455000 002459000 002459000
상기 표3과 같은 USPC에 관한 테이블로, 특정 USPC 특허 분류 기호에 대한 1) 직하위 특허 분류 기호, 2) 총하위 특허 분류 기호, 3) 직하위 특허 분류 기호의 개수, 4) 총하위 특허 분류 기호의 개수를 알 수 있음은 전술한 IPC의 경우와 같으며, 상기 테이블을 포함하여 원천 USPC 특허 분류 기호 DB를 생성하는 방식 및 그 테이블을 활용하는 방식도 전술한 IPC의 경우와 같다.
상기에서, IPC, USPC에 대하여 설명하였으며, 이러한 방식은 계층적 트리 구조를 가지는 다른 특허 분류 기호(FT, FI, ECLA)에 대해서도 동일하게 적용될 수 있음은 당업자에게 자명하다 할 것이다.
특허 분류 기호 간의 계층 표현(child-parent 관계 생성 방법)
상기 특허 분류 기호 마스트 데이터베이스 생성 모듈은 최상위 특허 분류 기호(IPC의 경우에는 section 표시 특허 분류 기호, USPC의 경우에는 class 표시 특허 분류 기호 등이 그 예가 된다.)를 제외한 다른 하나의 특허 분류 기호에 대하여 상기 특허 분류 기호가 속하는 직상위 특허 분류 기호를 대응시키거나(1:1), 상기 하나의 특허 분류 기호에 대하여 그 분류 기호의 직하위에 해당되는 직하위 특허 분류 기호를 대응시켜(1:n) 놓은 기능을 수행한다. 전산적으로 양자모두 가능하나, 하나의 특허 분류 기호(child)에 대응되는 상위(parent) 1:1 관계를 생성시키는 전자 방식이 더 합리적이다. 상기와 같은 관계 대응으로 모든 특허 분류 기호들이 트리 구조 속에서 서로간의 관계를 정립하게 된다.
전자는 child에 parent를 대응시키는 방법이며, 후자는 parent에 그 parent에 속하는 child들를 대응시켜 저장시켜 놓는 방법이다. 양자 모두 parent에 속하는 child들을 찾아 내는 과정에 활용될 수 있는데, 전자는 그 parent가 주어졌을 때 그 parent를 가리키고 있는 child를 찾으면 되고, 후자는 그 parent에 속하는 child가 직접 저장되어 있으므로, 그 저장된 정보를 활용하면 된다. 그러므로, 전자는 child-parent의 관계성을 child를 중심으로 1:1로 저장해 놓는 방식이며, 후자는 parent를 중심으로 그 parent에 속하는 직하위 child들을 직접 저장해 놓는 방식이다.
상기 계층적 특허 분류 기호 데이터베이스 생성 모듈이 상기 계층적 특허 분류 기 호 데이터베이스를 생성하는 방법은 IPC 분류를 기준으로 설명하면 다음과 같다.
1) 섹션에서 메인그룹까지는 분류 기호 체계대로 계층적 특허 분류 기호 데이터베이스를 생성하며, 자신, 자신의 직상위, 직하위 특허 분류 코드에 대하여 자신의 parent정보를 저장하거나, 자신의 직하위 child 정보를 저장한다.
2) 메인그룹 특허 분류 기호에 대해서는 다음 메인그룹 특허 분류 기호가 나오기 전까지의 모든 특허 분류 기호에 대해서 그 특허 분류 기호에 대응되는 타이틀이 도트 1개를 가지는 특허 분류 기호를 찾는다. 메인그룹 특허 분류 기호는 통상 슬래쉬(^/^)다음에 00이 결합되어 있으므로 찾기가 용이하다. child -> parent(child가 자신의 유일한 parent를 가리키는 방식)인 경우에는 도트 1개를 가지는 1-도트 서브그룹의 각 특허 분류 기호마다 자신의 유일한 직상위 parent인 메인그룹의 특허 분류 기호를 저장한다. 그리고, parent -> child(자기 밑에 있는 모든 child를 저장해 놓는 방식) 방식일 경우에는 메인그룹에 속하는 도트를 1개 가지는 1-도트 서브그룹의 특허 분류 기호를 메인그룹의 표현하는 특허 분류 기호에 연관지어 저장한다.
이때, 메인그룹 자신, 자신의 직하위 특허 분류 코드에 대하여 자신의 parent정보를 저장하거나, 자신의 직하위 child 정보를 저장한다.
3) 상기 도트 1개를 가진 특허 분류 기호에 대하여 동일한 메인그룹에 속하면서 다음 도트 1개를 가진 특허 분류 기호 이전의 모든 특허 분류 기호를 대상으로 그 타이틀에 도트 2개인 특허 분류 코드를 찾는다. 만약 동일한 메인그룹에 속하면서 그 타이틀에 도트 1개를 가지는 다른 특허 분류 기호가 없는 경우(메인그룹에 서브그 룹이 1개 있거나, 서브그룹들 중에서 맨 마지막 서브그룹)에는 그 타이틀에 도트 1개를 가진 특허 분류 기호와 다음 메인그룹을 표시하는 특허 분류 기호 이전의 모든 특허 분류 기호 중에서 그 타이틀에 도트 2개를 가진 특허 분류 코드를 찾는다. 자신의 parent와 child를 저장하는 방법은 위 2)에서와 동등하다.
4) 상기 타이틀에 도트 2개를 가지는 특허 분류 코드를 대상으로 위 3)과 동일한 논리로 그 타이틀에 도트 3개를 가지는 특허 분류 코드를 찾아, 위 3)과 동등한 방식으로 처리한다.
또 다른 상기 계층적 특허 분류 기호 데이터베이스 생성 모듈이 상기 계층적 특허 분류 기호 데이터베이스를 생성하는 방법을 제시하면 다음과 같다.
IPC가 순서(레코드 번호)대로 있는 테이블의 맨 아래 IPC로부터 위쪽으로 올라오면서 자신의 직상위 parent를 찾는 방법으로 다음과 같은 순서를 취할 수 있다. 1) 맨 아래의 특허 분류 기호에 대응되는 타이틀 정보에서 도트의 개수를 확인하고, 자기 레코드 번호 -1인 레코드 번호(바로 위 IPC)에 있는 특허 분류 기호의 타이틀에 있는 도트수를 확인한다. 만약 도트 수가 하나 적으면 그것이 자신의 parent이며, 도트 수가 같으면 자신과 동등한 레벨이며, 도트수가 자기 보다 많으면, 자신의 직상위나 직하위가 아니라고 판정하고, 자신의 parent에 대해서만 저장한다. 만약 서브그룹 이상의 특허 분류 기호를 만나게 되면 그 서브그룹 이상의 특허 분류 기호를 자신의 parent로 저장한다.
2) 자기 레코드 번호 -1인 레코드 번호에 있는 특허 분류 기호의 타이틀에 있는 도트 수가 자신과 동등하거나, 자기보다 많거나, 특허 분류 기호가 서브그룹이상이면 parent관계를 무시하고, 자기 레코드 번호 -1인 레코드 번호인 특허 분류 기호에 대해서 위 2)을 수행한다.
이상의 2가지 실시예에서 계층적 특허 분류 기호 데이터베이스를 생성하는 방법을 제시했으나 이는 실시예에 불과하고, 상기 IPC 특허 분류 기호 및 이에 대응되는 타이틀 정보로부터 모든 IPC에 대하여 자신의 parent 정보 또는 자신의 child 정보를 생성하는 것은 전산 시스템을 개발하는 당업자에게는 용이한 일일 것이다.
상기 계층적 특허 분류 기호 데이터베이스 생성 모듈은 주어진 특허 분류 기호가 있을 경우, 계층적 특허 분류 기호 데이터베이스를 생성하는데, 그 일 구현예는 다음과 같다.
H04B7/00를 통한 예시
H04B7/00이하에 있는 특허 분류 기호를 대상으로 하여, 상기 양 방법의 구현된 결과의 구현예를 제시한다.
먼저, child 특허 분류 기호에 그 분류 기호가 속한 직상위 분류 기호인 parent(child -> parent)를 대응시키는 방법에 따른 결과이다. 그 예가 하기 표 4에 있다.
[표 4]
Child(자신) Parent(자신의 parent)
H04B 7/005 7/00
H04B 7/01 7/00
H04B 7/015 7/00
H04B 7/02 7/00
H04B 7/04 H04B 7/02
H04B 7/06 H04B 7/04
H04B 7/08 H04B 7/04
H04B 7/10 H04B 7/02
H04B 7/12 H04B 7/02
H04B 7/14 7/00
H04B 7/145 H04B 7/14
H04B 7/15 H04B 7/14
H04B 7/155 H04B 7/15
H04B 7/165 H04B 7/155
H04B 7/17 H04B 7/155
H04B 7/185 H04B 7/15
H04B 7/19 H04B 7/185
H04B 7/195 H04B 7/185
H04B 7/204 H04B 7/15
H04B 7/208 H04B 7/204
H04B 7/212 H04B 7/204
H04B 7/216 H04B 7/204
H04B 7/22 7/00
H04B 7/24 7/00
H04B 7/26 H04B 7/24
이어서, 자기 자신의 직하위에 대한 모든 child 정보를 가지는 방법(parent -> child)에 대한 결과의 일실시예가 표 5에 있다.
[표 5]
Parent(자신) Child(자신의 직하위 child)
H04B 7/00 H04B 7/005 H04B 7/01 H04B 7/015 H04B 7/02 H04B 7/14 H04B 7/22 H04B 7/24
H04B 7/005 null
H04B 7/01 null
H04B 7/015 null
H04B 7/02 H04B 7/04 H04B 7/10 H04B 7/12
H04B 7/04 H04B 7/06 H04B 7/08
H04B 7/06 null
H04B 7/08 null
H04B 7/10 null
H04B 7/12 null
H04B 7/14 H04B 7/145 H04B 7/15
H04B 7/145 null
H04B 7/15 H04B 7/155 H04B 7/185 H04B 7/204
H04B 7/155 H04B 7/165 H04B 7/17
H04B 7/165 null
H04B 7/17 null
H04B 7/185 H04B 7/19 H04B 7/195
H04B 7/19 null
H04B 7/195 null
H04B 7/204 H04B 7/208 H04B 7/212 H04B 7/216
H04B 7/208 null
H04B 7/212 null
H04B 7/216 null
H04B 7/22 null
H04B 7/24 H04B 7/26
H04B 7/26 null
디렉토리 생성 모듈(405)
특허 분류 기호 정보를 디렉토리 방식으로 배치하고, 사용자의 브라우징을 통해서 특정 특허 분류 기호의 하위 특허 분류 기호로 계통적으로 접근할 수 있다. 현재, www.delphion.com에서는 이러한 서비스를 제공해 주고 있다. 다만, 상기 사이트는 자신의 직하위 특허 분류 기호의 개수에 대한 정보를 제공해 주고 있으나, 1) 자신의 하위 특허 분류 기호의 모든 개수를 제공해 주지 않으며, 2) 모든 특허 분류 기호에 대한 특허 문건의 개수도 제공해 주지 않고, 3) 그 제공되는 수치를 클릭했을 때 그 수치에 해당되는 모든 직하위 특허 분류 기호를 포함하고 있는 특허 문건도 제공해 주지 않는다. 본 발명은 계층적 특허 분류 기호 데이터베이스와 수정 특허 분류 기호 검색 방법을 통하여 이러한 문제를 해결해 줄 수 있다.
본 발명의 디렉토리 생성 모듈(405)은 특허 분류 기호별 직하위 특허 분류 기호를 제공하고, 상기 특허 분류 기호 및 상기 직하위 특허 분류 기호에 대한 카운팅 값을 상기 특허 분류 기호 및 상기 직하위 특허 분류 기호 옆에 표시해 줄 수 있다. 상기 카운팅 값에는 1) 모든 하위 분류의 개수, 2) 직하위 특허 분류의 개수, 3) 분류의 깊이, 4) 모든 하위 분류에 대응되는 특허 문건의 수, 5) 직하위 특허 분류 기호에 대응되는 특허 문건의 수 중에서 선택되는 어느 하나 이상이 될 수가 있는데, 가급적 1), 2), 5)가 함께 표시 있는 것이 바람직하다. 상기 디렉토리 생성 모듈(405)은 상기 1) ~5) 중 어느 하나 이상을 본 발명의 i) 카운팅 전처리 모듈이 수행해 놓은 카운팅 값에서 읽어 오거나, ii) 후술하는 총량 분석용 다차원 분석용 연산 수행 결과 테이블 iii) 특허 분류 기호 트리 테이블, 또는 iv) 총상위 특허 분류 기호 테이블 중 어느 하나 이상에서 읽어와서, 상기 1) ~5)를표시해 줄 수 있 다.
상기 특허 분류 기호 정보를 디렉토리 방식으로 배치할 때, 각 디렉토리에 색깔이나 아이콘 등의 기호 표시를 하여, 사용자의 접근성을 향상시킬 수 있다. 즉, 직하위 분류가 많은 경우, 모든 하위 분류가 많은 경우, 깊이가 깊은 경우, 해당 특허 문건이 많은 경우 등에 따라 다른 색깔을 부여하거나 기설정된 아이콘 등을 부여함으로써, 사용자가 그 디렉토리의 내부 속성(모든 하위 분류의 개수, 분류의 깊이, 특허 문건의 수 등)을 더 잘 알 수 있게 도울 수 있다. 특히, 특정 특허 분류 기호 디렉토리의 모든 하위 분류의 개수가 많거나 분류의 깊이가 많은 경우는 그 영역으로의 특허 출원이 많고, 기술이 다양하게 출원되고 있음을 방증하기 때문에, 그렇지 못한 디렉토리보다 중요성이 더 클 경우가 많기 때문이다.
도 65는 본 발명의 디렉토리 생성 모듈(405)의 일 구현예를 보여주고 있다. 상기 도 65에서 알 수 있듯이, 디렉토리의 기설정된 단계부터는 적어도 하나 이상의 특허 분류 기호에 체크 박스를 할 수 있고, 이 체크 박스로 선택된 특허 분류 기호에 대하여, 국가 단위로 검색을 하거나, 특허 분류 기호 기준으로 한 특허 분석을 수행할 수 있음을 알 수 있다.
본 발명의 디렉토리 생성 모듈(405)은 적어도 하나 이상의 특허 분류 기호의 종류별로 다단계 특허 분류 기호 체계에 대응되는 특허 분류 기호에 대한 디렉토리를 생성하는 특허 분류 기호 활용 디렉토리 생성 모듈(405-1)과 본 발명의 명세서에서 소개하는 각종 분석 주제별 또는 기타 확정가능한 주제별 다단계 디렉토리를 생성하는 주제별 디렉토리 생성 모듈(405-2)이 있다.
하위 계층 특허 분류 기호 처리 모듈
하위 계층 특허 분류 기호 처리 모듈은, 사용자가 입력하는 검색식 등에서 입수 받은 특허 분류 기호에 대하여, 상기 계층적 특허 분류 기호 데이터베이스를 통하여 상기 입수 받은 특허 분류 기호에 종속되는 하위 계층 특허 분류 기호를 찾아 내는 역할을 수행한다.
입수 받은 특허 분류 기호에 대해 하위 계층 특허 분류 기호에 해당하는 특허 문건이 검색 결과에 포함되게 하기 위해서는 다음과 같은 3가지 중 어느 하나 이상이 필요하며, 이러한 일을 상기 하위 계층 특허 분류 기호 처리 모듈이 수행한다.
첫째, 상기 계층적 특허 분류 기호 데이터베이스를 이용하여 입수 시점을 기준으로 하여 입수 받은 특허 분류 기호의 하위 계층 특허 분류 기호를 모두 찾아 낸다. 계층적 특허 분류 기호 데이터베이스 상의 특허 분류 기호들이 트리 구조를 가지고 있기 때문에 이를 찾아 낼 수 있게 된다. 입수 받은 검색식에 특정한 특허 분류 기호가 포함되어 있을 경우, 상기 트리 구조를 따라서 그 특허 분류 기호의 하위 계층의 모든 특허 분류 기호들을 찾아낼 수 있게 되고, 그 결과를 수정 검색식 생성 모듈에 전송하며, 수정 검색식 생성 모듈은 전송 받은 모든 특허 분류 기호들을 반영한 새로운 검색식을 생성하여 검색 엔진에 질의할 수 있다.
둘째, 사전에 모든 특허 분류 기호에 대하여 그 하위 계층 특허 분류 기호들을 찾아내어 매칭하여(매칭 테이블에) 저장해 놓고, 입수되는 검색식에서 특정 특허 분류 기호가 있을 경우, 그 특정 특허 분류 기호에 매칭된 하위 계층 특허 분류 기호 들을 즉시 상기 수정 검색식 생성 모듈에 전송할 수 있다.
상기 하위 계층 특허 분류 기호 추출 모듈이 추출하는 하위 계층 특허 분류 기호의 범위는 크게 2가지가 있을 수 있다. 하나는 입수 받은 특허 분류 기호의 직하위 특허 분류 기호만으로 추출하는 방법이며, 다른 하나는 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출하는 방법이다. 이때, 직하위 특허 분류 기호만을 추출하는 경우에도, 상기 추출된 직하위 특허 분류 기호들 각각에 대하여 다시 이들의 직하위 특허 분류 기호를 추출해 내며, 이와 같은 방식을 반복함으로써 입수 받은 특허 분류 기호에 종속되는 모든 하위 특허 분류 기호를 추출해 낼 수 있다.
예를 들어 설명하면, 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우, 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이며, 하위의 모든 특허 분류 기호는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 된다.
H04B7/15, H04B7/155, H04B7/165, H04B7/17, H04B7/185, H04B7/19, H04B7/195, H04B7/204, H04B7/208, H04B7/212, H04B7/216가 된다.
상기와 같은 직하위 특허 분류 기호 및 모든 하위 특허 분류 기호를 추출하는 것은 상기 child -> parent 대응 관계에서나, parent -> child 대응 관계에서나 직접 또는 반복적으로(recursively) 용이하게 추출해 낼 수 있음은 당업자에게는 당연할 것이다.
상기 하위 계층 특허 분류 기호 추출 모듈은 추출된 하위 계층 특허 분류 기호를 주합하여 저장한다. 상기의 검색식에서 포함되어 있는 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호만을 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/185, 및 H04B 7/204^ 을 주합하여 저장하며, 하위의 모든 특허 분류 기호를 함께 저장할 경우에는 ^H04B 7/15, H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216^를 주합하여 저장한다.
수정 검색식 생성 모듈
수정 검색식 생성 모듈은 상기 주합된 특허 분류 기호를 원래의 기존 검색식과 통합하여 수정 검색식을 생성한다. 상기 통합은 범위 검색인 경우와 그렇지 않은 경우에 따라 수정하는 방식이 조금 상이하다. 먼저 범위 검색이 아닌 경우를 설명한다.
상기 특허 분류 기호를 포함하고 있던 기존 검색식에서, 상기 특허 분류 기호가 있던 위치에, 상기 특허 분류 기호와 상기 추출되고 주합된 하위 계층 특허 분류 기호를 OR 관계로 묶은 다음, 상기 묶인 특허 분류 기호로 상기 원래의 기존 검색식의 특허 분류 기호 자리를 대체하는 방식으로 이루어 질 수 있다. 이때, 원래의 기존 검색식에 2이상의 특허 분류 기호가 포함되어 있으면, 각각의 특허 분류 기호에 대하여 상기와 같은 특허 분류 기호 통합을 수행할 수 있음은 당연하다 하겠다.
예를 들어 설명하면, 주어진 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼 성전자} and {IPC = H04B 7/15}일 경우에 상기 수정 검색식 생성 모듈은 주어진 검색식에서 IPC H04B 7/15를 찾아서, 직하위 또는 모든 하위 특허 분류 기호를 입수 받고 주합하여, ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/185 OR H04B 7/204} 또는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 OR H04B 7/155 OR H04B 7/165 OR H04B 7/17 OR H04B 7/185 OR H04B 7/19 OR H04B 7/195 OR H04B 7/204 OR H04B 7/208 OR H04B 7/212 OR H04B 7/216}와 같은 분류 기호가 통합된 수정된 검색식을 생성해 낸다. 바람직하게는 후자의 검색식이 좋다.
상기 하위 계층 특허 분류 기호 처리 모듈이 수행하는 역할을 요약하면, 입수되는 검색식에서 특허 분류 기호가 포함될 때, 그 특허 분류 기호의 하위 계층 특허 분류 기호에 관련된 정보를 찾아 내어 수정 검색식 생성 모듈이 처리할 수 있도록 해 준다. 물론, 입수되는 검색식의 특허분류 기호가 IPC의 경우 메인그룹 이상일 경우 등과 같이 절단자로 처리할 수 있는 경우에는 본 하위 계층 특허 분류 기호 처리 모듈은 하위 특허 분류 기호를 찾을 필요가 없다.(예를 들면, H04B7/00 또는 H04B만이 입수되는 경우, H04B7/* 또는 H04B*로 처리 가능하기 때문이다.) 그러므로, 하위 계층 특허 분류 기호 처리 모듈은 IPC의 경우에는 서브그룹 이하, 즉 타이틀 정보에 dot가 있을 때에 더욱 유용하며, 다른 분류 기호 체계에서도 dot의 개수로 분류 체계 상의 위치를 정하는 경우에도 역시 유용하게 쓰일 수 있다.)
상기 검색 엔진은 사용자의 컴퓨터로부터 특허 분류 기호가 포함된 검색식을 입수 받는다 이때, 상기 입수된 검색식에 포함되어 있는 특허 분류 기호가 타이틀 정보 에 도트를 포함하는 경우, 상기 특허 분류 기호 전처리 엔진을 통하여 특허 분류 기호 체계 상에서 하위 특허 분류 기호를 입수하고, 상기 입수한 특허 분류 기호를 OR로 묶고, 상기 OR로 묶은 하위 특허 분류 기호를 포함한 수정 검색식을 생성하고, 수정 검색식으로 검색을 수행한다. 상기 각 단계에 대해서는 상술한 바와 같다.
특허 분류 기호 체계에서 삽입, 삭제, 재배치 등이 있을 경우에는 삽입의 경우에는 사전의 특정 위치에 새로운 단어를 추가한다는 개념과 유사하게 처리할 수 있으며, 삭제는 그 단어를 제거하는 방식으로 처리할 수 있으며, 재배치의 경우에는 삽입과 삭제를 조합해서 수행하는 것으로 처리할 수 있다. 물론, 삽입, 삭제, 재배치가 있을 때마다 변경된 특허 분류 기호 체계 전체에 대해서 새롭게 전체 데이터베이스를 갱신하거나 재작성할 수도 있다.
범위 검색
범위 검색 개념의 도입
상기에서는 하위 특허 분류 기호들을 OR로 묶어서 수정 검색식을 생성하는 것을 중심으로 설명하였다. 한편 통상적인 검색 엔진은 범위 검색을 지원한다. 이어서, 상기 하위 특허 분류 기호들을 일일이 찾아내어 OR로 묶는 방식이 아닌 범위 검색을 지원하기 위한 특허 분류 기호의 처리 방법을 제시한다. 본 방법은 입수 받은 특허 분류 기호의 하위 계층 특허 분류 기호들을 하나씩 개별적으로 찾아 내는 것이 아니라 그 하위 계층 특허 분류 기호들이 가지는 특허 분류 기호 체계 상에서의 범위(range)의 형태로 찾아 낸다. 특히, 그 범위 검색은 사전순(dictionary order)로 되어 있는 자료의 검색에는 더욱 더 큰 검색 속도를 보장한다.
하위 계층 특허 분류 기호들이 가지는 특허 분류 기호 체계 상에서의 범위를 찾아 내는 이유는, 통상적인 검색엔진은 범위 검색을 지원하며, 그 범위 검색이 그 범위에 들어가는 각각을 하나씩 찾아 내는 것보다 훨씬 빠르기 때문이다. 예를 들어 설명하면, H04B 7/15의 경우라면, H04B 7/15 및 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 모두 or 관계로 묶어 검색 엔진에 질의하는 것 보다, From H04B 7/15 to H04B 7/216으로 질의하는 것이 훨씬 더 빨리 검색 결과를 응답 받을 수 있다. 이는 특히, 하위 계층 특허 분류 기호들이 많으면 많을수록 그 검색 속도의 차이는 커진다.
선결 조건으로서의 변형 특허 분류 기호의 도입의 필요성
다만, 범위 검색을 하기 위해서 필요한 선결 조건의 대표적인 요구 사항이 검색 엔진이 찾는 검색 인덱스에 있는 특허 분류 기호들이 사전 순으로 정리되어 있어야 한다. 그러므로, 특허 분류 기호들이 사전 순으로 정리되어 있으면 그 분류 기호들을 그대로 검색 인덱스에 투입하면 되고, 그렇지 않은 경우에는 사전 순으로 정리되어 검색 인덱스에 투입되는 별도의 분류 체계를 만들어야 한다. 전자를 직투입형이라 하고, 후자를 변형투입형이라 한다. 직투입형의 대표적인 특허 분류 기호 체계가 IPC이며, 변형 투입해야 하는 대표적인 특허 분류 기호 체계가 USPC이다. 물론 IPC도 약간의 변형을 가해서 변형 투입형으로 만들 수 있음은 물론이다. 상기 별도의 분류 체계를 변형 특허 분류 기호 체계라 한다.
도 91은 변형 특허 분류 기호를 처리하는 특허 분류 기호 전처리 엔진으로 , IPC, USPC, FI, FT, ECLA 중에서 선택되는 적어도 어느 하나 이상의 특허 분류 기호 체계에 대하여 상기 특허 분류 기호 체계 상의 기호를 그대로 사용하지 않고, 범위 검색을 지원할 수 있도록 변형 특허 분류 기호를 활용하는 것을 특징으로 한다.
본 실시예의 변형 특허 분류 기호 전처리 엔진은 상기 변형 특허 분류 기호 체계를 생성하고, 상기 변형 특허 분류 기호 체계를 활용하여 하위 계층 특허 분류 기호를 처리하며, 입수되는 검색식을 수정하여 수정 검색식을 생성하는 기능을 수행한다. 상기 변형 특허 분류 기호 전처리 엔진은 변형 특허 분류 기호 데이터베이스 생성 모듈, 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈, 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈을 포함한다.
IPC의 경우
범위 검색을 더욱 원활하게 지원하기 위해서 직투입형의 경우에도 매칭 테이블을 이용하여 변형투입형으로 변형할 수 있다. 예를 들면, 상기 H04B 7/005, H04B 7/01, H04B 7/185등의 IPC를 각각 H04B70000050, H04B70000100, H04B70000185등과 같이 변형할 수 있다. 변형의 규칙은 다양할 수 있으나, 본 실시예를 기준으로 설명하면, group에 4자리수를 할당하고, sub group에 4자리수를 할당하는 방식이다.(물론, 상기 group보다 상위 분류 기호 체계인 section 및 클래스와 관련된 분류 기호 체계는 그대로 수용하는 것이 바람직할 것이다.) 물론, FI와 같이 sub group이하에서도 확장 기호 등이 있을 때는 그에 상응하는 자리수를 할당하는 방식 으로 변형 투입 특허 분류 기호를 생성할 수 있다. 그러므로, 직투입형 특허 분류 기호 체계를 가지는 경우, 상기 매칭 테이블은 아주 간단한 규칙으로도 변형 특허분류 기호 체계를 생성할 수 있다.
USPC의 경우
한편, USPC처럼 직투입형 특허 분류 기호 체계를 가지지 않는 경우에도, 매칭 테이블을 생성할 수 있다. 상기 USPC에 대하여 매칭 테이블을 생성하는 방법은 후술한다. 상기와 같은 변형 특허 분류 기호 체계를 생성하는 것은 상기 변형 특허 분류 기호 데이터베이스 생성 모듈 이 담당한다. 상기 변형 특허 분류 기호 데이터베이스 생성 모듈이 생성한 변형 특허 분류 기호 체계는 변형 특허 분류 기호 데이터베이스에 저장된다.
상기 변형 특허 분류 기호 전처리 엔진은 주어진 분류 체계 상의 분류 기호에 대해서 변형 특허 분류 기호 체계 상의 분류 기호를 하나씩 1:1로 대응 할당하고, 상기 인덱서(indexer)가 할당된 변형 특허 분류 기호 체계로 검색 인덱스를 구축하도록 돕는다. 상기 사용자의 상기 주어진 특허 분류 기호 체계로 검색식을 입력하면, 상기 수정 검색식 생성 모듈이 상기 입력된 특허 분류 기호에 대응되는 변형 특허 분류 기호를 찾아내고, 이를 통해서 검색을 수행하여 검색 결과를 도출해 낸다. 검색 결과에 상기 변형 특허 분류 기호가 나타나 있을 필요는 없을 것이다.
IPC의 경우 범위 검색이 수행되는 과정
이하, 범위 검색이 수행되는 과정을 더욱 상세하게 설명한다. 본 범위 검색은 IPC뿐만 아니라, USPC 등의 다른 특허 분류 기호 체계에도 적용됨은 물론이다 하겠다. 주어진 특허 분류 기호에 종속되는 하위 특허 분류 기호를 자동으로 찾아내어 범위 검색을 수행하기 위해서는 주어진 특허 분류 기호의 트리 구조 상의 next sibling을 찾는 것이 중요하다. 즉, 검색되어야 되는 특허 분류 기호의 범위는 상기 주어진 특허 분류 기호보다는 크거나 같고, 상기 next sibling가 된다. 이는 변형 특허 분류 기호에 대해서도 마찬가지이다.
IPC 분류 체계는 서브그룹 표기를 숫자가 아닌 문자열로 취급하면, 직투입형의 대표적인 특허 분류 체계로 볼 수 있다. 사전처럼 생각하면, H04B 7/005 다음에 H04B 7/01이 오게 되며, H04B 7/02 다음에 H04B 7/12가 오며, H04B 7/185 다음에 H04B 7/19가 오게 된다. 이 경우 입수되는 검색식에 H04B 7/02가 있는 경우, 트리 구조를 포함하는 계층적 특허 분류 기호 데이터베이스에서 그 하위에 있는 H04B 7/04, H04B 7/06, H04B 7/08, H04B 7/10, H04B 7/12를 찾아 내게 된다. 찾아 내는 방법은 재귀적으로 next sibling직전까지는 찾는 방법이 사용될 수 있다. 이 방법의 일례를 좀 더 구체적으로 설명하면, 특정한 특허 분류 기호가 있을 때, 트리 구조에서 자신의 부모를 찾고, 부모에는 자식들이 있으며, 그 자식들 중 자기 바로 다음 번 자식을 찾아 내면 된다. 좀더 구체적으로는 H04B 7/02의 next sibling은 H04B 7/15가 된다. 이때, H04B 7/02의 하위 특허 분류 기호를 찾으려면 먼저 next sibling이 되는 H04B 7/15를 찾고, 범위를 H04B 7/02보다 크고, H04B 7/15보다 작은 모든 특허 분류 기호를 찾으라고 하면 된다.
이때, next sibling이 자신의 직 상위 부모 노드/계층이 아닌 다른 노드/계층에 있는 경우(예를 들면, H04B 7/15(dot 2개)의 next sibling은 직상위 부모 계층/노느 인 H04B 7/14의 직하위에 있는 것이 아니라 직직상위 부모의 하위인 H04B 7/22(dot 1개)가 된다.)는 next sibling이 null값이 되는데, 이 경우에는 재귀적으로 부모 노드/계층이 null이 아닐 때까지 부모 계층/노드의 next sibling을 찾으면 된다.
USPC에 대한 변형 특허 분류 기호 생성 방법
이어서, USPC에 대해서 더욱 상세하게 설명한다. USPTO의 특허 기술 분류 체계인 USPC는 도트 구조 없이 서브클래스의 번호만으로 각 서브클래스의 상하 관계나 상관 관계를 파악하기가 어렵게 되어 있다. 즉, USPC는 IPC와는 달리 사전 순과는 무관하게 배열되어 있어, 좀더 체계적인 변형을 필요로 한다. 미국 www.uspto.gov가 2006년 6월 시점에 공개하는 USPC 또는 USPC 특허분류 체계(http://www.uspto.gov/web/patents/classification/... 또는 분류 Index to U.S. Patent Classification (a.k.a., Classification Index File ) 파일)는 변형투입형으로 볼 수 있다. 이 경우에는 시각적으로 파악되는 USPC 코드가 IPC처럼 사전 순으로 되어 있지 않으므로, 변형이 필요하다.
변형하는 방법은 크게 다음 2가지를 그 예로 들 수 있다.
첫째, USPC 전체를 대상으로 하여 dot구조를 포함하는 타이틀 정보를 기준으로 하여 트리 구조를 만든다. 상기 트리 구조는 USPC간의 부모 자식 관계를 반영하여 USPC가 트리 구조의 노드를 형성하도록 배열해야 한다. 상기 USPC 트리 구조를 깊이 우선 탐색을 수행하면서 각 노드에 대하여 사전순 배열을 포함하는 변형 특허 분류 기호를 붙인다. 물론, 각 노드의 USPC와 이 USPC에 대응되는 변형 특허 분류 기호 를 매칭하여 변형 특허 분류 데이터베이스에 저장하는 것은 당연할 것이다.
둘째, 미국 특허청이 제공하는 Index to U.S. Patent Classification 파일(이 파일에는 각 타이틀에 대한 USPC, 설명, dot 의 수에 관한 정보(루트를 기준으로 한 깊이(depth)정보) 및 자신의 부모(parent)에 관한 정보가 들어 있다.)을 기준으로 하여 전체 USPC를 트리 구조를 만든 다음, 깊이 우선 탐색 기법 등의 탐색 기법을 이용하여 각 노드 마다 사전 순으로 변형 특허 분류 기호 를 붙이며, 각 타이틀에 대한 변형 특허 분류 기호 와 해당 USPC를 매칭하여 저장해 놓는다.
상기 2가지 예는 실시예일뿐, 상기 USPC의 도트구조를 포함하는 타이틀 정보를 활용하여 개별 USPC 각각에 변형 특허 분류 기호를 대응시키되, 상기 변형 특허 분류 기호의 체계가 사전 순으로 배열되게 하는 다른 방법은 변형 알고리즘에 따라 다수 있을 수 있다. 이러한 한 예는 상기에서 타이틀 정보를 반영하여 IPC를 표로 만들고, 상기 표를 통해서 사전 순으로 배열되는 변형 특허 분류 기호를 만드는 데서 제시하였다. 그러므로, 상기와 같은 변형 방법을 모두 기술하는 것은 불가능할 뿐만 아니라, 이러한 변형은 전산 전문가 등의 당업자에게 자명할 것이다. 상기 자명한 알고리즘으로 변형된 변형 특허 분류 기호 체계가 본 발명 사상에 포함되는 것은 당연할 것이다.
이하, 다음 실례를 통해서 더욱 상세하게 설명한다.
하기는 US class 002 apparel의 서브클래스 중 맨 앞쪽 일부에 대한 것이다. 상기는 http://www.uspto.gov/web/patents/classification/uspc002/sched002.htm에서 copy한 부분이다. 아래의 숫자들 앞에는 class 번호인 002가 생략되어 있지만, 모 든 숫자 앞에는 002가 붙어 있는 것으로 생각해야 한다.
1 MISCELLANEOUS
455 GUARD OR PROTECTOR
456 .Body cover
457 ..Hazardous material body cover
458 ..Thermal body cover
2.11 .. Astronaut'''s body cover
2.12 ... Having relatively rotatable coaxial coupling component
2.13 ...Having convoluted component
2.14 ..Aviator'''s body cover
2.15 ..Underwater diver'''s body cover
2.16 ...Having an insulation layer
2.17 ...Having a garment closure
459 .Shoulder protector
상기 dot 구조로부터 456 body cover의 직하위에는 457, 458, 2.11, 2.14, 2.15가 있음을 알 수 있고, 2.11의 직하위에는 2.12 및 2.13이 있음을 알 수 있다. 상기를 dot 구조를 반영하여, 표로 만들 수 있음은 당연한 것이며, 상기 IPC의 설명에서 제공하였으므로, 본 USPC의 설명에서는 생략한다.
상기 dot 구조를 반영하여 상기 USPC를 트리 구조로 만든 것이 도 93에 나타나 있다. 도 94은 상기 도 93에 있는 USPC 트리의 각 노드에 변형 특허 분류 기호가 대 응될 수 있음을 보여 준다. 도 95 는 상기 변형 특허 분류 기호로 상기 USPC 트리 구조와 구조적으로 동등한 트리 구조가 만들어 질 수 있음을 보여주고 있다. 상기와 같이하여 상기 USPC 각각이 변형 특허 분류 기호와 대응되어 저장될 수 있게 된다. 상기 저장의 일예는 다음 표 6과 같을 수 있다. 하기 표 6은 본 발명의 상기 변형 특허 분류 데이터베이스의 일 실시예일 수 있다.
[표 6]
변형 전 subclass 도트수 변형 특허 분류 기호(class번호 포함) title
1 002001000 MISCELLANEOUS
455 002002000 GUARD OR PROTECTOR
456 1 002002100 Body cover
457 2 002002110 Hazardous material body cover
458 2 002002120 Thermal body cover
2.11 2 002002130 Astronaut'''s body cover
2.12 3 002002131 Having relatively rotatable coaxial coupling component
2.13 3 002002132 Having convoluted component
2.14 2 002002140 Aviator'''s body cover
2.15 2 002002150 Underwater diver'''s body cover
2.16 3 002002151 Having an insulation layer
2.17 3 002002152 Having a garment closure
459 1 002002200 Shoulder protector
그리고, 미국 특허청이 제공하는 Index to U.S. Patent Classification 파일에는 다음과 같이 표현되어 있다.
002000000 0 1 APPAREL
002001000 1 2 000000 MISCELLANEOUS
002455000 1 3 000000 GUARD OR PROTECTOR
002456000 2 4 455000 Body cover
002457000 3 5 456000 Hazardous material body cover
002458000 3 6 456000 Thermal body cover
002002110 3 7 456000 Astronaut'''s body cover
002002120 4 8 002110 Having relatively rotatable coaxial coupling component
002002130 4 9 002110 Having convoluted component
002002140 3 10 456000 Aviator'''s body cover
002002150 3 11 456000 Underwater diver'''s body cover
002002160 4 12 002150 Having an insulation layer
002002170 4 13 002150 Having a garment closure
002459000 2 14 455000 Shoulder protector
상기 미국 특허청이 제공하는 Index to U.S. Patent Classification을 설명한다. 맨 앞 열의 9자리 중 첫번째 3자리는 class number이며, 뒤 6자리는 subclass number를 나타낸다. 인터넷 상에서는 2.11과 같이 소수점 내지는 점이 있지만, 002110으로 표현되어 있음을 알 수 있다. 그 다음 자리는 루트로부터의 상대적인 깊이를 나타낸다. 클래스 002인 apparel은 0 depth이며, 도트가 없는 MISCELLANEOUS는 1depth로 apparel의 직하위를 나타내며, 도트가 2개 있는 Thermal body cover는 3 depth를 나타낸다. depth 다음의 칼럼은 일련번호이며, 그 다음 칼럼은 자신의 parent를 나타내는 숫자이다. 즉, ^455000 body cover^와 같이 body cover 바로 앞에 붙은 455000은 자신의 parent가 455000을 가지는 것으로 GUARD OR PROTECTOR가 자신의 parent임을 나타내고 있다. 이는 dot 구조에 대응되는 표현으로 볼 수 있다. 예를 들어 더 설명하면, ^456000 Aviator'''s body cover^에서는 Aviator'''s body cover의 부모는 456000을 사용하는 body cover임을 알 수 있다.
상기와 같은 USPC 분류 기호는 사전 순으로 배열되어 있지 않아 재처리하지 않을 경우, 범위 검색이 불가능하다.
상기 Index to U.S. Patent Classification 파일에 나와 있는 각 USPC에 있는 부모에 관한 정보와 상대적인 깊이 정보를 활용하여 도 96과 같은 트리 구조를 만드는 것은 쉬운 일일 것이다. 상기 도8과 같은 트리 구조에 대하여 도 94와 같이 변형 특허 분류 기호를 할당하는 것은 용이한 것이며, 상기 변형 특허 분류 기호를 이용하여 도45와 같은 형태의 변형 특허 분류 기호로 된 트리 구조를 만들 수 있음은 물론이다 하겠다. 상기와 같이하여 상기 USPC 각각이 변형 특허 분류 기호와 대응되어 저장될 수 있게 된다. 상기 저장의 일예는 다음 표 7과 같을 수 있다. 하기 표 7은 본 발명의 상기 변형 특허 분류 데이터베이스의 일 실시예일 수 있다.
[표 7]
변형 전 Class+subclass depth 변형 전 기준 parent의 서브클래스 변형 특허 분류 기호 변형 특허 분류 기호 기준 parent의 서브클래스 Title
002000000 0 002000000 APPAREL
002001000 1 000000 002001000 000000 MISCELLANEOUS
002455000 1 000000 002002000 000000 GUARD OR PROTECTOR
002456000 2 455000 002002100 002002000 Body cover
002457000 3 456000 002002110 002002100 Hazardous material body cover
002458000 3 456000 002002120 002002100 Thermal body cover
002002110 3 456000 002002130 002002100 Astronaut'''s body cover
002002120 4 002110 002002131 002002130 Having relatively rotatable coaxial coupling component
002002130 4 002110 002002132 002002130 Having convoluted component
002002140 3 456000 002002140 002002100 Aviator'''s body cover
002002150 3 456000 002002150 002002100 Underwater diver'''s body cover
002002160 4 002150 002002151 002002150 Having an insulation layer
002002170 4 002150 002002152 002002150 Having a garment closure
002004590 2 455000 002002200 002002000 Shoulder protector
물론, 상기 표 7에서와는 다른 알고리즘을 통하여 주어진 타이틀 정보를 포함하는 USPC 체계에 사전순 배열을 가지는 변형 특허 분류 기호를 대응할 수 있을 것이며, 이는 상기와 같이 USPC와 대응되는 변형 특허 분류 기호의 매칭 테이블로 저장될 수 있음을 물론이다.
도 92는 상기 계층적 변형 특허 분류 기호 데이터베이스 생성 모듈이 상기 변형 특허 분류 기호 데이터베이스를 생성하는 일 실시예에 대한 흐름을 보여 주고 있다.
변형 특허 분류 기호 데이터베이스 생성 모듈은 특허 분류 기호 체계 상의 모든 특 허 분류 기호를 입수하고(S4220), 상기 입수한 모든 특허 분류 기호를 타이틀의 도트 정보를 참조하여 트리 구조로 배열하고(S4230), 상기 트리 구조로 배열된 특허 분류 기호 체계에 깊이 우선 탐색 기법을 이용하여 탐색하면서 각 특허 분류 기호 노드 별로 변형 특허 분류 기호를 대응시키고(S4240), 상기 각 특허 분류 기호와 대응 변형 특허 분류 기호의 관계를 상기 변형 특허 분류 기호 데이터베이스에 저장한다(S4250).
이어서 범위 검색을 중심으로 하여 수정 검색식을 생성하기 위하여, 본 발명의 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 입수되는 특허 분류 기호를 어떻게 처리하여 수정 검색식을 생성하기 위한 정보를 입수하는 지를 설명한다.
상기와 같은 경우, 만약 입력 검색식에 USPC로 ^002/456^이 입수될 때, 하위 분류 포함 검색이 되려면, 002/456, 002/457, 002/458, 002/2.11, 002/2.12, 002/2.13, 002/2.14, 002/2.15, 002/2.16, 002/2.17이 검색되어야 한다. 이때, 도 93의 트리 구조에서 알 수 있듯이 002/456의 넥스트 시블링은 002/459이다. 그러므로, 상기 표에서 대응 변형 특허 분류 기호로 대응시키면, 002/456에 대응되는 002002100보다는 크거나 같고, 넥스트 시블링인 002/459에 대응되는 002002200보다 작은 모든 변형 특허 분류 기호에 대해서 검색하라고 지시하면 하위 분류를 포함하는 검색이 되게 된다.
좀 더 상세하게 설명하면 다음과 같은 2가지 방법이 있다. 첫번째 방법은 ^002/456^이 입수될 때, 이에 대응되는 변형 특허 분류 기호로 002002100를 찾은 다음, 002/456의 넥스트 시블링인 002/459을 찾고, 002/459에 대응되는 변형 특허 분류 기호인 002002200를 찾아서, 이 002002100과 002002200을 범위로 묶는 방법이 그것이다. 범위는 002002100보다는 크거나 같고 002002200보다는 작은 것이 될 수 있다. 본 방법의 특징은 변형되기 전의 트리 구조에서 입수되는 특허 분류 기호의 넥스트 시블링을 먼저 찾고, 상기 입수되는 특허 분류 기호 및 상기 넥스트 시블링 각각에 대응되는 변형 특허 분류 기호를 찾는 방법이다. 본 방법은 변형 특허 분류 기호 체계와 이에 대응되는 특허 분류 기호 체계가 구조상으로도 1:1로 대응되기 때문에, 사용자가 검색식에서 입력하는 특허 분류 기호의 next sibling을 먼저 찾고, 상기 특허 분류 기호 및 상기 특허 분류 기호의 next sibling에 대응되는 각각의 변형 특허 분류 기호를 찾아내는 방법이다.
상기 특허 검색 엔진은 특허 분류 기호가 포함된 검색식을 입수 받는다. 이어, 상기 입수된 특허 분류 기호가 그 타이틀 정보에 도트를 포함하고 있을 경우에는 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈(또는 상기 하위 계층 특허 분류 기호 처리 모듈)이 계층적 특허 분류 기호 체계를 반영한 트리 구조에서 상기 입수된 특허 분류 기호의 넥스트 시블링 특허 분류 기호를 찾는다. 이어, 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 상기 변형 특허 분류 기호 데이터베이스 상에서 상기 입수된 특허 분류 기호 및 상기 넥스트 시블링 특허 분류 기호에 대응되는 변형 특허 분류 기호 및 넥스트 시블링 변형 특허 분류 기호를 입수한다. 이어, 상기 변형 특허 분류 기호 활용 수정 검색식 생성 모듈이 상기 변형 특허 분류 기호 및 상기 변형 특허 분류 기호의 넥스트 시 블링 변형 특허 분류 기호로 범위를 포함한 수정 검색식을 생성하고, 상기 검색 엔진을 통하여 상기 수정 검색식으로 검색을 수행하는 단계를 거친다
두번째 방법은 ^002/456^이 입수될 때, 이에 대응되는 변형 특허 분류 기호로 002002100를 찾은 다음, 변형 특허 분류 기호 체계에서 002002100에 대응되는 넥스트 시블링인 002002200을 찾아서 이 002002100과 002002200을 범위로 묶는 방법이 그것이다. 범위는 002002100보다는 크거나 같고 002002200보다는 작은 것이 될 수 있다. 본 방법의 특징은 입수되는 특허 분류 기호에 대응되는 변형 특허 분류 기호를 찾아내고, 상기 변형 특허 분류 기호에 대응되는 넥스트 시블링을 찾는 방법이다. 즉, 본 방법은 입력하는 특허 분류 기호에 대한 변형 특허 분류 기호를 먼저 찾고, 상기 변형 특허 분류 기호 체계 내에서 상기 찾아낸 변형 특허 분류 기호의 next sibling을 찾아내는 방법이다. 본 두번째 방법은 상기 첫번째 방법보다 찾는 행위가 1개 줄어드는 장점이 있다.
이어 상기 두번째 방법을 채용하여 수정 검색식으로 검색을 수행하는 방법에 대한 일 실시예에 대한 흐름을 설명한다.
상기 검색 엔진은 특허 분류 기호가 포함된 검색식을 입수 받는다. 상기 입수된 특허 분류 기호가 그 타이틀 정보에 도트를 포함하고 있을 경우에는 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈이 상기 변형 특허 분류 기호 데이터베이스 상에서 상기 입수된 특허 분류 기호에 대응되는 변형 특허 분류 기호를 입수하고, 상기 변형 특허 분류 기호 체계를 반영한 트리 구조에서 상기 변형 특허 분류 기호의 넥스트 시블링 변형 특허 분류 기호를 찾은 다음, 상기 변형 특 허 분류 기호 활용 수정 검색식 생성 모듈이 상기 변형 특허 분류 기호 및 상기 변형 특허 분류 기호의 넥스트 시블링 변형 특허 분류 기호로 범위를 포함하는 수정 검색식을 생성하고, 상기 검색 엔진을 통하여 상기 수정 검색식으로 검색을 수행하는 단계를 거친다.
상기 첫번째 또는 두번째 방법을 통하여 상기 변형 특허 분류 기호 활용 하위 계층 특허 분류 기호 처리 모듈은 입수되는 특허 분류 기호에 대하여, 범위 검색을 수행하기 위한 범위의 양 끝에 해당하는 2개의 변형 특허 분류 기호를 알 수 있게 된다.
상기 검색 인덱스에는 상기 변형 특허 분류 기호에 대한 정보가 각 USPC에 대응되어 포함되어 있어야 함은 물론이다. 상기 변형 특허 분류 기호는 임의의 자리수로 된 숫자만으로 형성할 수도 있지만, 숫자와 문자를 포함하여 형성할 수도 있다. 이때, USPC에서 추가되는 것이 있을 때에는 dot 구조를 반영하여 중복이 발생하지 않으면서도 사전 순으로 배열할 때 정당한 배열 위치를 갖도록 변형 특허 분류 기호를 생성할 수 있게 된다. 이러한 사전순 배열 위치를 생성하는 방법은 새로운 단어가 사전에 추가될 때, 알파벳 순으로 정당한 배열 위치를 갖도록 하는 것과 동일한 공지의 기술이며, 당업자라면 용이하게 실시할 수 있을 것이다. 또한, 사전 순으로 배치할 때 더 많은 하위 분류가 새로 생성되는 경우, 뒷자리 수를 계속해서 확장해 갈 수 있다. 예를 들면 002/2.12에 하부에 여러 개의 특허 분류 기호가 다단계로 생길 때, 상기 002/2.12에 대응되는 변형 특허 분류 기호002002131보다 사전 순으로 아래이며, 002002132보다 위인 0020021310a, 0020021310b 등과 같이 추가적으로 뒷자리를 확장해 가면서 계속해서 변형 특허 분류 기호를 생성할 수 있을 것이다.
이상과 같이 USPC처럼 자체적으로 사전순 배열 구조를 가지지 않는 특허 분류 기호 체계를 가지는 경우에도 변형 특허 분류 기호를 도입함으로써, 범위 검색이 가능할 수 있음을 설명하였다. 물론, IPC처럼 이미 사전순 배열 구조를 가지는 경우에도 새로운 변형 특허 분류 기호를 대응시킬 수 있음은 물론일 것이다. 따라서, IPC의 확장의 성격을 가지는 FI나 ECLA, 및 FT 특허 분류 기호에 대해서도 본 발명 사상을 적용할 수 있을 것이다. 즉, IPC, FI, FT, ECLA, USPC 등에서 범위 검색을 위해 각 분류 기호의 dot 구조를 반영하는 변형 특허 분류 기호를 생성할 수 있을 것이며, 상기 변형 특허 분류 기호는 사전순 배열이 되게 되어 있어, 범위 검색을 지원할 수 있게 된다.
상기 검색 엔진을 위한 검색 인덱스에는 원래의 특허 분류 기호가 가공된 정보와 상기 변형 특허 분류 기호가 가공된 정보가 함께 있는 것이 바람직하다. 만약 사용자가 하위 계층 특허 분류 기호에 대한 검색 결과를 원하지 않을 경우, 변형 특허 분류 기호가 가공된 인덱스를 사용할 필요가 없기 때문이다.
이상에서, 본 발명의 수정 검색식 생성 모듈 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈에 대하여 설명하였다. 수정 검색식 생성 모듈 및 변형 특허 분류 기호 활용 수정 검색식 생성 모듈은 상기 입수되는 변형 특허 분류 기호들로 원래의 기존 검색식과 통합하여 수정 검색식을 생성한다. 범위 검색을 위해서는 검색 엔진이 범위에 대한 이형 범위 기호 처리를 지원하는가에 따라 생성되는 수정 검색식 구성 요소가 약간 상이하게 된다. 이형 범위 기호 처리란 ^A보다 크거나 같고, B 보다 작은 것^과 같이 범위의 양쪽에 쓰이는 기호가 다른 경우를 처리하는 것을 말한다. 이형 범위 기호 처리를 지원하는 경우에는, 입수된 특허 분류 기호에 대하여, ^(상기 입수된 특허 분류 기호보다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)^라는 수정된 검색식 구성 요소를 생성한다. 이형 범위 기호 처리를 지원하지 않는 경우에는 ^{(상기 입수된 분류 기호) or (상기 입수된 특허 분류 기호보다 크거나 같고, 상기 입수된 특허 분류 기호의 next sibling보다는 작은 범위의 특허 분류 기호들)}을 생성하게 된다. 물론, 사전식으로 배열되는 변형 특허 분류 기호를 사용하는 경우에는 그 변형 특허 분류 기호에 대해서 위와 같이 처리함은 물론이라 하겠다.
상기 입수되는 검색식이 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15}라면, 이형 범위 기호 처리가 되는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC >= H04B 7/15 and IPC <H04B 7/22}^이 된다. 반면, 이형 범위 기호 처리가 되지 않는 경우에는 ^{키워드=무선 and 능동} and {출원인 = 삼성전자} and {IPC = H04B 7/15 or (IPC > H04B 7/15 and IPC <H04B 7/22)}가 되게 된다.
이상과 같은 본 발명의 특허 분류 기호 전처리 엔진의 핵심은 주어진 특허 분류 기호가 있을 때, 그 특허 분류 기호의 모든 하위 계층(child) 또는 직하위 계층에 있는 하위 특허 분류도 자동으로 처리하여 검색, 분석, 감시 등의 모든 검색식 및 질의식에 반영될 수 있게 하는 기능에 있다.
수정된 검색식으로 검색 결과가 나오는 경우, 검색 결과의 디스플레이는 검색자의 선택에 따라 클러스터링(clustering)하여 제공될 수도 있다. 클러스터링이란, 검색 결과를 묶어서 그룹단위로 표현하는 방식으로, 본 발명에 적용하는 경우 다음과 같다. 클러스트링 되는 구조를 표현하는 클러스터링 창이 있거나, 클러스터링 레벨을 선택할 수 있을 때, 검색 결과를 기설정되거나 기선택된 클러스터링 레벨에 상응하는 도트 서브그룹 및 그 이하의 서브그룹의 검색 결과만 표현하며, 검색자로부터 하위 또는 상위 클러스터링 레벨이 선택되는 경우(상기 클러스터링 레벨에는 도트 레벨이 대응되어 있다) 상기 선택된 클러스터링 레벨에 상응하는 검색 결과를 표현한다.
상기의 H04B 7/00이 관련된 검색 결과를 통해 예를 들면, 1-도트 서브그룹 레벨의 클러스터링이 선택된 경우에는 상기 클러스터링 창에는 1-도트 서브그룹에 해당하는 7/005, H04B 7/01, H04B 7/015, H04B 7/02, H04B 7/14, H04B 7/22, H04B 7/24이 H04B 7/00의 하위 디렉토리 폴더 형태로 나타나고, 검색 결과는 H04B 7/00에 해당하는 모든 결과가 나온다. 이때, 검색자가 H04B 7/14를 선택했을 때는 그 직하위인 H04B 7/145, H04B 7/15가 하위 디렉토리 폴더 형태로 나타나고, 이 경우 검색 결과는 H04B 7/14 및 그 하부 특허 분류 기호에 해당하는 검색 결과만 표시된다. 다시 검색자가 H04B 7/15를 선택했을 경우에는 그 하위인 H04B 7/155, H04B 7/185, H04B 7/204가 표시되며, 검색 결과는 H04B 7/15 및 그 하위 특허 분류 기호에 해당하는 검색 결과만이 표시된다.
이때, 검색자의 편의를 위해서 클러스터링 창의 각 클러스트링 항목(디렉토리의 폴더명) 옆에 자신의 직하위에 몇 개의 특허 분류 기호가 있는 지와, 모든 하부 특허 분류 기호의 개수가 몇 개 있는지를 함께 또는 어느 하나만을 표시해 줄 수 있다. 그 특허 분류 기호 및 그 특허 분류 기호의 모든 하위 특허 분류 기호에 해당하는 특허 문헌의 개수를 표시해 줄 수도 있다. 이때, 출원 문헌수와 등록 문헌 수 2개 모두를 표시해 줄 수도 있으며, 출원 문헌수나 등록 문헌 수 1개만 표시해 줄 수도 있다. 예를 들면, 특허 분류 기호가 H04B 7/15인 경우에는 직하위 특허 분류 기호는 H04B 7/155, H04B 7/185, 및 H04B 7/204 이므로 ^3^을 표시해 주거나, 모든 하위의 특허 분류 기호가 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216이므로, ^10^을 표시해 줄 수 있다. 양자를 모두 표시하는 주는 것이 바람직한데, 그 이유는 직하위에는 분류가 적지만, 그 직하위의 하부에 엄청난 크기의 분류가 있을 수 있기 때문이다. 이는 특히 새롭게 떠오르는 신기술 분야 또는 기술 분화 속도 또는 세부 분류 증가 속도가 큰 첨단 기술 분야에서 더욱 그러할 것이다. 만약 직하위 분류의 개수만 표시해 주는 경우, 그 수치값이 적을 때 그 기술 분야의 중요성이 실제함에도 불구하고, 이를 파악할 수 없어 그 분류를 무시하고 넘어가는 사용자가 있을 수 있기 때문이다.
패밀리 정보 전처리 모듈
특허 패밀리란 특정 특허 문건과 국내, 또는 해외적으로 직접적으로 관련 있는 문건으로 구성된 문건 정보의 집합을 말한다. 통상적으로 하나의 국가 내에서, 1) 분할출원, 2) 변경 출원이나 이중출원, 3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국내 특허 패밀리를 이룬다. 통상적으로 하나의 출원을 기초로 한 1) 국제출원(PCT), 2) 조약 우선권 출원, 3) 상기 1) 또는 2)가 특정 국가의 특허청에 출원되었을 때의 각 국가별 출원 및 상기 3)의 출원에 관한 (1) 분할출원, (2) 변경 출원이나 이중출원, (3) 국내 우선권 주장 출원(미국에서의 일부 계속 출원, 재발행 특허 등과 같이 각 국가마다 패밀리의 범위를 규정하는 조건이 조금씩 다를 수 있다) 등이 국제 특허 패밀리를 이룬다. 본 발명의 특허 패밀리 정보를 전처리 하는 패밀리 정보 전처리 모듈에 대한 구성은 도 9에 잘 나타나 있다. 패밀리 정보를 처리하기 위해서는 그 정보를 처리하는 패밀리 정보 전처리 엔진(3810)이 필요하며, 패밀리 정보를 입수하기 위한 각종 DB가 필요하다. 필요한 DB의 예로는 조약 우선권 정보 DB(3671), PAJ DB(3673), KPA DB(3675), Inpadoc DB(3677), 기타 패밀리정보 DB(3830) 등이 있을 수 있다. 특히 Inpadoc DB(3677)가 중요한 역할을 한다.
상기 패밀리 정보 전처리 모듈은 특허 문건 마스트 DB의 가공과 업데이트와 밀접하게 관련이 있다. 그 이유는 특허 정보는 1) 신규한 문건이 지속적으로 발행되고, 2) 국가 단위로 입수되는 것이 대부분이며, 상기 각 국가별로 신규한 문건이 지속적을 발행되므로, 상기 패밀리 정보는 상기 1) 및/또는 2)에 따라 언제든지 변경될 가능성이 있기 때문이다. 즉, 상기 1) 또는 2)의 문건 입수 시 상기 패밀리 정보는 갱신되어야 할 필요가 있으며, 상기 1) 또는 2)의 문건 입수 시 패밀리 정보의 갱신은 본 발명의 패밀리 정보 전처리 모듈이 수행한다. 상기 패밀리 정보는 기존 문건 또는 신규 문건을 대상으로 원출원 정보 내지 우선권 정보에 특정 출원 번호가 존재하는 지를 통해서 발견할 수 있다.
상기 패밀리 정보 전처리 모듈의 상기 패밀리 정보 전처리 엔진이 패밀리 정보를 처리하는 방법은 도 87에 나와 있다. 상기 패밀리 정보 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하고(S3720), 상기 특허 문건 정보에 우선권 주장 번호, 분할 출원, 변경 출원 또는 일부 계속 출원 등의 패밀리 정보가 있는 지를 파악하며(S3730), 패밀리 정보가 있는 경우, 상기 특허 문건의 정보를 패밀리 정보에 대응되는 패밀리 특허 문건의 고유 문건 번호와 관련 지어 특허 DB 또는 검색 인덱스에 저장하며(S3740), 선택적으로 입수된 특허 문건에 국가별 패밀리 정보의 개수를 카운팅하여 저장하거나 패밀리 특허 문건의 고유 문건 번호에 패밀리 정보의 개수에 관한 정보가 있을 때 그 개수에 가산한다(S3750).
상기 패밀리 정보 전처리 모듈이 처리한 패밀리 정보는 본 발명의 패밀리 정보 DB에 저장된다.
인용 정보 전처리 모듈
본 발명의 인용 정보 전처리 모듈에는 인용과 관련된 정보를 획득하는 인용 정보 획득 모듈(3400-1)과 인용 정보 기반하여 피인용 정보를 갱신하는 피인용 정보 갱신 모듈(3400-2) 중 어느 하나 이상을 포함하고 있다. 상기 인용 정보 획득 모듈은 출원인의 특허 문건에서 출원인이 인용한 정보에서 인용 관련 정보를 획득하는 출원인 인용 정보 획득 모듈(3400-1-1)과 심사관이 심사 과정에서 인용한 정보를 획득하는 심사 인용 정보 획득 모듈(3400-1-2)이 있다. 한편, 상기 출원인 인용 정보 획득 모듈(3400-1-1)에는 다시, 출원인 인용 특허 문건 정보 획득 모듈(3400-1-1- 1)과 출원인 인용 비특허 문건 정보 획득 모듈(3400-1-1-2)이 있다. 상기 출원인 인용 특허 문건 정보 획득 모듈(3400-1-1)은 인용 정보가 특허 정보일 경우에 작동한다. 그리고, 심사 인용 정보 획득 모듈(3400-1-2)에는 심사관 인용 특허 문건 정보 획득 모듈(3400-1-1-1)과 심사관 인용 비특허 문건 정보 획득 모듈(3400-1-2)이 있다. 상기 인용 정보 전처리 모듈은 상기 인용 정보 획득 모듈이 획득한 인용 정보를 기설정된 방식으로 처리한다.
특허 인용 정보의 종류에는 1) 출원인이 선행 기술로서 타 특허를 인용하는 선행 기술 인용 정보와 2) 심사관이 특정 특허 문건을 심사할 때 인용하는 인용 참증으로서의 특허를 인용하는 참증 인용 정보가 있을 수 있다. 물론, 상기 인용은 국내외적으로 일어남은 당연할 것이다. 통상적으로 상기 첫번째 선행 기술로 타특허를 인용하는 것은 대한민국이나 일본에서는 종래 기술 문헌 정보에 있고, 미국에서는 레퍼런스(reference) 정보에 있다. 이러한 선행 기술 인용 정보는 특허 문건의 서지 사항 또는 본문에서 획득 가능하다. 또한, 많은 국가들이 참증 인용 정보를 공개하는데, 이는 특허청에서 공개하는 행정 정보 등에서 확인할 수도 있다. 본 명세서에서는 상기 선행 기술 인용 정보를 중점적으로 설명하나, 획득된 참증 인용 정보도 선행 기술 인용 정보처럼 다루어 질 수 있는 경우에는 상기 설명이 동등하게 준용 될 수 있을 것이다.
상기 선행 기술 인용 정보 및 상기 참증 인용 정보를 전처리하는 것은 본 발명의 인용 정보 전처리 모듈이 수행하며, 도 5에서 알 수 있듯이 상기 인용 정보 전처리 모듈에는 선행 기술 인용 정보를 전처리하는 선행 기술 인용 정보 전처리 모듈과 참증 인용 정보를 전처리하는 참증 인용 정보 전처리 모듈이 포함되어 있다. 통상적으로 특정 문건의 서지 사항 또는 본문에 전방 인용(backward citation)은 포함되어 있기 때문에, 전방 인용에 관한 문건 정보는 상기 특정 문건의 검색 인덱스 또는 특정 문건 정보에 저장되어 있다. 하지만, 상기 특정 문건에 관한 후방 인용(forward citation)은 그 특정 문건 정보에 저장되지 않고, 상기 특정 문건을 인용하는 문건의 검색 인덱스 또는 상기 인용하는 문건 정보에 저장되어 있다. 그러므로, 상기 특정 문건에 관한 후방 인용을 찾아서 상기 특정 문건과 관련 지어 저장할 필요가 있게 되고, 이러한 기능은 상기 선행 기술 인용 정보 전처리 모듈이 수행한다.
선행 기술 인용 정보 전처리 모듈
상기 선행 기술 인용 정보 전처리 모듈은 상기 특정 문건의 출원 번호 내지 상기 특정 문건의 고유 번호값을 상기 검색 인덱스 또는 DBMS에 질의함으로써, 상기 특정 문건을 인용하고 있는 상기 특정 문건의 후방 인용 정보를 획득할 수 있다. 상기 선행 기술 인용 정보 전처리 모듈은 상기 획득한 상기 특정 문건의 후방 인용 정보를 상기 특정 문건의 인덱싱 과정에서 상기 인덱스에 포함시켜 놓을 수도 있고, 상기 특허 문건 마스트 DB에 상기 특정 문건의 후방 인용 정보로서 저장할 수 있다. 전방 인용 정보는 거의 변화가 없는 반면(출원인이 출월할 때 기재하는 것이며, 간혹 추가 등이 있을 수 있으나 전방 인용의 추가는 거의 발생하지 않는 것이 통상이다.) 후방 인용 정보는 특허 정보의 갱신 시 항상 모니터링 해야 하는 정보이다. 그러므로, 신규한 특허 문건이 발생해서, 검색 인덱스가 갱신되거나, 특허 문건 마스트 DB가 갱신되는 경우, 상기 선행 기술 인용 정보 전처리 모듈은 상기 특정 문건을 인용하고 있는 갱신 특허 문건이 있는 지를 질의하여, 후방 인용 정보를 갱신해야 한다.
하지만, 상기와 같이 검색 인덱스 갱신, 또는 특허 문건 마스트 DB 갱신 시 질의하는 방식으로 후방 인용 정보를 갱신하는 경우, 매 갱신 시마다 엄청나게 많은 질의를 수행해야 한다.(어느 특정 문건에서 후방 인용 정보가 포함되었는지를 모르므로, 모든 상기 특정 문건의 출원 번호나 고유 번호를 질의해 봐야 한다.) 그러므로, 상기 선행 기술 인용 정보 전처리 모듈은 업데이트(갱신)되는 신규 특허 문건에서 상기 특정 문건에 관한 인용 정보(전방 인용)가 발견되는 경우, 상기 특정 문건에 관련된 정보에 상기 신규 특허 문건 정보를 후방 인용 정보로서 추가한다. 상기 특정 문건에 관련된 정보에는 상기 특정 문건에 관한 검색 인덱스 또는 상기 있는 특허 문건 마스트 DB 상의 특정 문건에 관한 레코드(record)인 것이 바람직하다. 즉, 상기 선행 기술 인용 정보 전처리 모듈은 신규 특허 문건 입수 시 상기 신규 특허 문건에 포함되어 있는 전방 인용 정보를 입수하여, 인용 당하고 있는 문건 번호를 기준으로 인용하고 있는 문건 번호를 관계 지어 검색 인덱스 또는 특허 문건 마스트 DB의 상기 인용 당하고 있는 문건 번호에 관한 문건 정보에 저장한다. 본 문단에서 설명한 방법을 취하는 경우, 신규 특허 문건 정보에 포함되어 있는 전방 인용 정보를 활용하므로, 전산 자원의 소모량을 급격하게 줄일 수 있다.
이때, 상기 인용 정보는 상기 인용 정보를 표기하는 사람마다 출원 번호, 등록 번호, 또는 공개 번호 등으로 표기 하는 등 그 표기 방식이 다를 수 있다. 즉, 실체 적으로 동일한 문건(문건 고유 번호 #1 )이라도 A 문건에는 출원 번호로, B 문건에는 공개 번호로, C 문건에는 등록 번호로 인용 정보가 표기 되어 있을 경우, 그 인용 정보의 처리에 오류가 발생할 가능성이 높아진다. 상기 문건 고유 번호 #1을 인용하고 있는 타 문건 정보를 찾기 위해서는 상기 문건 고유 번호 #1에 관련된 모든 속성의 다른 문건 번호를 한번씩 조회를 해 보아야 하는 문제가 발생한다.
그러므로, 본 발명의 선행 기술 인용 정보 전처리 모듈은 입수 되는 인용 정보의 속성과는 독립적으로 상기 입수 되는 인용 정보를 하나의 문건 고유 번호로 맵핑해 놓을 필요가 있을 것이며, 인용 정보로서의 문건 번호를 대표화 할 필요가 있다. 즉, 문건 고유 번호를 출원 번호로 하는 경우, 입수되는 인용 정보가 공개 번호이든 등록 번호이든 무관하게, 상기 공개 번호 또는 등록 번호를 가지는 출원 번호를 입수하는 인용 대표 정보로서 상기 출원 번호를 별도의 인용 정보로 관리할 수 있으며, 이에 따라 인용의 분석이나 카운팅 등에도 상기 인용 대표 번호를 기준으로 처리할 수 있다. 즉, 인용 정보의 대표명화를 관리할 수 있다. 이는 특히 미국이 특허 공개 공개를 도입하였기 때문에 그 중요성이 더욱 커지고 있다. 어떤 형태로의 인용 정보에 대하여 내부적으로 동일한 문서를 동일하게 처리한다. 이를 위해서 출원 번호가 가장 바람직하며
이때, 대표화 된 인용 정보는 공개 번호 또는 "국가명 + 공개 번호"로 대표화할 수도 있지만, 출원 번호 또는 "국가명+출원번호"로 대표화하거나, 바람직하다. 등록 번호의 경우, 등록되지 않은 문건이 발생할 가능성이 있으며, 공개 번호(문건 발행 번호)도 출원 공개 번호 또는 등록 공개 번호 또는 기타 공보가 발생할 때마다 공 개 번호가 발생하는 문제가 있기 때문이다.
상기 선행 기술 인용 정보 전처리 모듈이 작동하는 방식과 상기 참증 인용 정보 전처리 모듈이 작동하는 방식은 거의 동일하다. 상기 참증 인용 정보 전처리 모듈도 특정 문건이 신규 특허 문건에서 참증 인용으로 후방 인용 되었을 때, 상기 특정 문건에 관련된 정보(검색 인덱스 또는 특허 문건 마스트 DB의 상기 특정 문건 정보용 레코드(record))에 상기 신규 특허 문건의 출원 번호나 고유 번호를 저장한다.
인용 번호를 대표화하는 인용 정보 전처리 방법에 대해서는 도 88에 상세히 나와 있다. 상기 인용 정보 전처리 모듈은 특정 문건에 존재하는 적어도 하나 이상의 인용 번호를 입수 받고(S3820), 상기 인용 번호의 속성이 기설정된 인용 번호 속성이 아닌 인용 번호를 입수하고(S3830), 상기 입수된 인용 번호를 검색 엔진 또는 DBMS에 질의하여 상기 기설정된 속성의 인용 번호를 입수 받고(S3840), 상기 입수된 기설정된 속성의 인용 번호로 상기 입수 받은 인용 번호를 대표화한다(S3850).
특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함시킬 필요가 있으며, 이러한 과정의 일 실시예적 방법을 도 89가 도시하고 있다.
상기 인용 정보 전처리 모듈은 특정 문건 데이터를 입수하고(S3920), 상기 특정 문건 데이터에 포함된 출원번호, 등록번호, 공개번호 중 적어도 어느 하나 이상을 입수하며 (S3940), 상기 입수한 번호를 검색 엔진의 인용 필드에 질의하거나, DBMS로 인용 필드를 한정하여 질의하고(S3950), 상기 질의 결과로서 후방 인용 정보를 입수 받으며(S3960), 상기 후방 인용 정보를 상기 문건 데이터의 서지 사항에 포함 시킨다(S3970).
참증 인용 정보 전처리 모듈
참증 인용 정보 전처리 모듈은 상기 선행 기술 인용 정보 전처리 모듈이 선행 기술 인용 정보를 대상으로 수행하는 역할을 참증 인용 정보를 대상으로 완전히 동일하게 수행한다.
카운팅 전처리 모듈
카운팅 전처리 모듈에 대해서 설명한다. 상기 카운팅 전처리 모듈에는 개별 문건 단위에서 카운팅 처리를 수행하는 개별 문건 단위 카운팅 전처리 모듈과 2이상의 문건 단위에서 카운팅 처리를 수행하는 복수 문건 단위 카운팅 전처리 모듈이 있다.
개별 문건 단위 카운팅 전처리 모듈
상기 개별 문건 단위 카운팅 전처리 모듈은 개별 특허 문건에 나와 있는 1)출원인 수 및/또는 특허권자 수, 2) 발명자 수, 3) 출원 또는 등록 단계 등과 같은 각 단계별 청구항 수, 4) 명세서 페이지 수, 5) 도면 수, 6) 특허 분류 기호의 종류 수, 7) 각 종류의 특허 분류 기호의 수, 8) 레퍼런스(reference)수, 9) 심사 인용 수, 10) 심사관이 조사한 특허 분류 기호의 수, 11) 우선권 주장수, 12) 국가별 패밀리 특허 개수, 13) 전체 패밀리 개수, 14) 독립항 수, 15) 종속항 수, 16) 레퍼런스 중에서 국가 단위의 특허 수, 17) 레퍼런스 중에서 전체 특허 문건 수, 18) 레퍼런스 중에서 비특허 문건 수 중에서 적어도 어느 하나 이상의 수치적 정보를 계산할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건 또는 상기 개별 특허 문건을 발행하는 특허청 등의 행정 처리 정보 등으로부터 1) 출원일로부터 등록일까지의 기간, 2) 우선일부터 출원일까지의 기간, 3) 출원일부터 심사청구일까지의 기간, 4) 의견제출통지일부터 의견서 제출일까지의 기간 정보 중 적어도 어느 하나 이상을 계산할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건 또는 행정 정보에서 개별 국가별로의 특정한 제도의 활용 또는 적용 여부에 관한 정보를 입수할 수 있는데, 그 정보로서는 1) 심사청구 제도의 활용 여부, 2) 분할 출원의 활용 여부, 3) 일부 계속 출원의 활용 여부, 4) 재발행 특허 제도의 활용 여부, 5) 우선심사 신청 여부, 5) 결정계 심판 활용 여부, 6) 비당사자계 소송 발생 여부 중 어느 하나 이상을 알아 낼 수 있으며, 상기 제도의 활용 또는 적용이 있는 경우에는 카운팅 값을 1로 하고, 그렇지 않을 경우에는 0으로 할 수 있을 것이다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 개별 특허 문건과 관련해서 상기 특허 문건 마스트 DB를 조사함으로써(검색 엔진 또는 DBMS를 사용하여) 적어도 하나 이상의 제2국에서의 상기 개별 특허 문건과 관련된 정보를 입수하고 카운팅할 수 있다. 상기와 같은 정보로는 1) 출원 국가수, 2) 등록 국가수, 3) 국제출원 여부, 4) 각 국가별 패밀리 수, 5) 전체 패밀리수 중 적어도 어느 하나 이상에 관한 정보를 알아 내어 카운팅할 수 있다.
또한, 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 검색 엔진 또는 상기 DBMS 를 통하여 1) forward citation(나를 인용하고 있는 국내외 다른 특허 문건들), 2) backward citation(내가 인용하는 이전 문건들), 3) collateral citation 중 어느 하나 이상을 알아내어 카운팅할 수 있다.
또한 상기 개별 문건 단위 카운팅 전처리 모듈은 상기 문건에 대한 1) 이의신청 여부, 2) 정보제공 여부, 3) 당사자계 심판 발생 여부 등에 대한 정보를 입수할 수 있다. 상기 1) 내지 3)에 관한 정보는 대한민국의 경우 대한민국 특허청 또는 특허심판원으로부터 직접 또는 조회 방식 등으로 입수할 수 있다.
상기 개별 문건 단위 카운팅 전처리 모듈이 카운팅한 값은 상기 특허 정보 마스트 DB 중 가공 서지 사항 DB에 저장되는 것이 바람직하다. 아울러, 상기 카운팅한 값은 특허 문건을 검색 엔진이 인덱싱할 때 생성되는 인덱스에 포함시키는 방식으로 저장되는 것이 더욱 바람직하다. 상기 카운팅 값이 상기 인덱스에 포함시키는 방법은 1) 상기 검색 엔진이 인덱싱을 할 때, 상기 개별 문건 단위 카운팅 전처리 모듈을 가동하여 카운팅 값을 획득하거나, 2) 상기 특허 정보 마스트 DB에 저장된 카운팅 값을 입수하는 방식 중 어느 하나 이상이 사용될 수 있다.
상기 카운팅 전처리 모듈은 상기 특허 분류 기호 마스트 DB를 참조하여 각 특허 분류 기호에 대하여, 1) 총 하위 특허 분류 기호의 개수, 2) 직하위 특허 분류 기호의 개수 카운팅하여 그 카운팅 값을 상기 특허 분류 기호 마스트 DB에 저장해 놓을 수 있다.
카운팅 전처리 모듈이 카운팅을 처리하는 방식은 도 78에 잘 나타나 있다. 먼저 카운팅 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(S2820), 입수 된 특허 문건 별로 적어도 하나 이상의 상기 개별 문건 단위 카운팅 전처리 모듈을 호출하며(S2830), 상기 개별 문건 단위 카운팅 전처리 모듈이 특허 문건 정보를 대상으로 카운팅 처리를 수행하며(S2840), 카운팅 처리 결과를 특허 문건 정보의 문건 고유 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2850)
복수 문건 단위 카운팅 전처리 모듈
이하, 상기 복수 문건 단위로 계산된 점수를 입수하는 모듈, 즉 복수 문건 단위 카운팅 전처리 모듈을 설명한다. 상기 복수 문건 단위 카운팅 전처리 모듈은 상기 대상 집합이 되는 복수 개의 문건에서 상기 개별 문건 단위 카운팅 전처리 모듈이 카운팅 해 놓은 정보를 취합하는 방식으로 점수를 입수한다. 즉, 상기 복수 문건 단위 카운팅 전처리 모듈은 적어도 2 이상의 문건 집합에 대하여 카운팅 데이터를 생성한다.
가중치 전처리 모듈
문건 단위 가중치 전처리 모듈
하나의 특허 문건에 포함된 발명 사상의 가치를 시스템적으로 정확하게 측정한다는 것은 불가능하다. 하지만, 정확한 가치 측정이 불가능하다고 해서 모든 특허 문건의 가치를 동일하게 취급한다는 것도 비합리적일 수 있다. 그러므로, 본 발명에서는 시스템이 데이터로 파악할 수 있는 정보를 기반으로 하여 특허 문건의 가중치를 부여하는 방법을 개시한다. 상기 특허 문건의 가중치를 부여하는 기능은 본 발명의 문건 단위 가중치 전처리 모듈이 담당한다.
본 발명의 가중치 전처리 모듈은 문건 단위 가중치 전처리 모듈(3310)과 주체 단위 가중치 전처리 모듈(3330)이 있다. 상기 문건 단위 가중치 전처리 모듈(3310)에는 비용 지출 관점 가중치 전처리 모듈(3311), 인용 관점 가중치 전처리 모듈(3313), 분쟁 관점 가중치 전처리 모듈(3315), 및/또는 집중 관점 가중치 전처리 모듈(3317) 등을 포함하고 있을 수 있다. 그리고, 상기 주체 단위 가중치 전처리 모듈(3330)에는 출원인 단위 가중치 전처리 모듈(3331), 발명자 단위 가중치 전처리 모듈(3333), 및/또는 대리인 단위 가중치 전처리 모듈(3335) 등을 포함하고 있을 수 있다.
비용 지출 관점 가중치 전처리 모듈
확률적, 통계적 또는 사회적 관점에서, 더 많은 비용을 지불한 특허가 더 중요한 특허일 가능성이 높을 것이다. 동일 주체에서 비용의 합리적 배분의 관점에서 볼 때에도 이러한 가정이 성립할 가능성이 높으며, 경쟁 관계에 있는 다른 주체들 간에서도 이러한 가정이 성립할 가능성이 높다. 하나의 특허에 관하여 비용이 지불되는 구조를 보면 다음과 같은 가중치 부여 요소를 생각할 수 있다.
1) 양적인 관점으로 (1) 청구항의 수, 독립항의 수, 명세서의 양(페이지 수), 패밀리의 수 또는 특허 분류 기호의 개수 2) 상태적인 관점으로 출원 중인 특허, 등록된 특허, 거절된 특허 또는 포기된 특허인 경우, 3) 과정적인 관점으로 심사청구 여부, 우선심사 활용 여부, 심판 청구 여부, 국내 우선권 주장 여부 또는 분할 출원 여부, 4) 주체적 관점에서 출원인의 수 또는 발명자의 수, 5) 해외적 관점에서 국제 출원 활용 여부, 해외 국내 단계 진입된 나라 수 등과 같은 요소들이 특허 문건의 가치에 영향을 줄 수 있을 것이다. 이러한 가중치 부여 요소들은 개별 문건의 서지 사항 정보, 명세서 내용 정보 또는 행정 처리 정보 등에서 입수할 수 있다.
통상적으로 청구항의 수가 많거나 명세서의 양이 많으면 발명의 내용이 넓고 다양할 가능성이 있어 발명에 시간과 비용이 많이 들었을 가능성이 높으며, 대리인들도 더 많은 비용을 청구할 가능성이 높다. 또한, 패밀리 수가 많거나, 특허 분류 기호의 개수가 많을수록 발명의 포괄적일 가능성이 높을 것이다. 그리고, 출원 중인 특허보다는 등록된 특허가 더 비중이 높을 가능성이 높으며, 심사 청구를 한 특허 출원 또는 우선 심사 청구를 한 출원이 그렇지 않은 특허 출원보다 중요할 가능성이 더 높을 것이다. 출원인이 2이 이상일 경우에는 공동 출원이므로 2 이상의 다른 주체간의 협동 작업의 결과이므로, 그렇지 않은 경우보다 통계적으로 중요할 가능성이 있으며, 발명자가 여러 명일 경우에도 여러 사람이 함께 머리를 맞대어 발명한 것이므로 통계적으로 중요할 가능성이 높을 것이다. 또한, 통상적으로 해외 출원은 국내 출원보다 비용 지출이 월등히 크기 때문에, 해외 출원이 있거나, 해외 출원이 많을 경우에는 그 출원인이 상당한 재정적 지출을 하게 되기 때문에, 적어도 그 출원인에게 그 특허는 상대적으로 중요성이 높다고 판단하는 것이 합리적이다.
상기와 같은 관점에서 하나의 문건에 대해서 가중치 부여 요소의 존재 및 수치를 파악(존부만이 문제시 될 경우에는 존재하지 않을 경우 수치는 0, 존재하면 1이 될 것이며, 청구항 개수와 같은 요소들은 1이상의 수치값으로 나올 것이다.)할 수 있을 것이며, 그 존재 및/또는 수치에 따라 상기 가중치 부여 요소별로 가중치 점수를 부여할 수 있을 것이다. 하나의 문건에 대해 상기 1) 내지 5)의 각 관점을 이루는 세부적인 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별 로 가중치 점수를 부여하는 것은 본 발명의 비용 지출 관점 가중치 전처리 모듈이 수행한다.
상기 비용 지출 관점 가중치 전처리 모듈이 가중치를 처리하는 방법은 도 79에 잘 나타나 있다. 상기 비용 지출 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하고(S2920), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 비용 지출과 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S2930), 상기 특허 정보 처리 정책 DB에서 상기 특허 정보 상기 카운팅 기준별 가중치를 입수 한다(S2940). 이때, 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 DB에 저장된 특허 정보 처리 정책을 참조한다. 예를 들면, 상기 비용 지출 관점의 상기 특허 정보 처리 정책 DB의 청구항의 관점에서는 (청구항 수*0.1 + 독립항수*0.3) 등과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다. 그리고, 상기 비용 지출 관점 가중치 전처리 모듈은 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 비용 관점 가중치값을 생성하며(S2940), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S2950).
인용 관점 가중치 전처리 모듈
논문과 마찬가지로 다수에게 많이 인용되는 특허가 중요한 특허일 가능성이 높다. 이러한 인용 관점에서 개별 문건의 가중치를 처리하는 모듈을 인용 관점 가중치 전처리 모듈이라 한다. 인용의 관점을 세부적으로 나누면 1) 후방 인용(forward citation)의 관점에서 전체 후방 인용의 수, 후방 인용의 깊이 수, 1단계 후방 인용의 수, 후방 인용의 평균 기간, 후방 인용의 시간 대비 집중도, 2) 심사관 인용의 관점에서 심사관의 인용 여부 등과 같은 가중치 부여 요소가 있을 수 있다. 즉, 자신의 특허에 대한 인용이 직접 또는 간접적(자신을 인용한 그 특허를 타 특허가 인용함)으로 많을수록, 직접적으로 인용하는 1단계 인용이 많을수록, 후방 인용의 평균 기간이 적절한 범위 내에 들수록, 자신의 특허를 인용하는 자가 시기적으로 최근 기단에 집중될수록, 그 특허의 중요성이 클 가능성이 높을 것이다. 또한, 심사관이 심사 과정에서 인용된 특허가 그렇지 않은 특허보다 중요성이 높을 수 있다. 상기 인용 관점 가중치 전처리 모듈이 인용 관점에서 가중치를 전처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈이 처리하는 방법과 대동소이하며, 도 80에 잘 나와 있다.
상기 인용 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하여(S3020), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 전방 인용 및/또는 후방 인용, 또는 심사 인용에 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하며(S3030), 상기 특허 정보 처리 정책 DB를 참조하여 카운팅 기준별 가중치를 입수하고(S3040), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 인용 관점 가중치값을 생성하며(S3050), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3060) 이때, 인용에 관한 상기 기설정된 카운팅 기준별에 대한 정보가 특허 정보 처리 정책 DB에 저장된 특 허 정보 처리 정책을 참조한다. 예를 들면, 상기 인용 관점의 상기 특허 정보 처리 정책 DB에는 "후방 인용 카운팅 수*0.3"등과 같은 각 관점별에서 각 대상별로 가중치를 처리하는 정책을 저장하고 있다.
분쟁 관점 가중치 전처리 모듈
하나의 특허 문건과 관련해서 분쟁이 많을수록 그 특허의 중요성이 클 가능성이 높다. 특허 정보에서 파악할 수 있는 분쟁적 요소는 1) 무효 심판, 2) 이의신청, 3) 정보 제공, 4) 소극적 또는 적극적 권리범위 확인 심판 등이 있을 수 있다. 상기 분쟁적 관점에서의 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 분쟁 관점 가중치 전처리 모듈이 수행한다.
상기 분쟁 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 81에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다.
상기 분쟁 관점 가중치 전처리 모듈은 적어도 하나 이상의 특허 문건 정보를 입수하며(S3120), 카운팅 전처리 모듈을 이용하거나 특허 DB 또는 검색 인덱스를 통하여 입수된 특허 문건 정보에서 분쟁 관련성이 있는 적어도 하나 이상의 기설정된 카운팅 기준별로의 카운팅 결과값을 입수하고(S3130), 상기 특허 정보 처리 정책 DB를 참조하여 카운팅 기준별 가중치를 입수하며(S3140), 카운팅 기준별 가중치와 카운팅 기준별로의 카운팅 결과값으로 분쟁 관점 가중치값을 생성하고(S3150), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스 에 저장한다(S3160).
즉, 상기 분쟁 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 분쟁의 수에 대한 카운팅을 수행하고, 각 카운팅 수에 대한 가중치를 특허 정보 처리 정책 DB로부터 입수하여 분쟁 관점 가중치값을 생성하는 것을 본질로 한다.
집중 관점 가중치 전처리 모듈
특정 시점을 기준으로 여러 주체가 집중하고 있는 기술 분야가 중요한 기술 분야일 가능성이 높을 것이다. 하나의 출원인이 여러 가지 기술 분야에 골고루 출원하는 경우는 거의 없으며, 자신이 중요하다고 생각하는 곳, 기술 투자가 집중되는 곳에 다수를 출원하고, 중요도가 떨어진다고 생각되는 곳에서는 방어적으로 소수를 출원하는 것이 대부분이다. 그러므로, 하나의 출원이 속하는 기술 분야가 여러 출원인이 출원을 많이 하여 다른 기술 분야 대비 상대적으로 1) 출원수가 많거나, 출원의 증가율 또는 증가 속도 가 높거나, 3) 출원인의 수가 많거나, 4) 점유율의 변동이 기설정된 범위를 벗어나거나 하는 경우라면 그 기술 분야는 중요한 기술 분야일 가능성이 높을 것이다. 여러 출원인이 집중하는 분야는 상기 기술 매력도(technology attractiveness), 증가율, 증가 속도, 점유율의 변동 등과 같은 분석 요소로 측정 가능할 것이다. 이때 본 문단에서의 기술 분야는 IPC, USPC, FI, FT, ECLA 등과 같은 특허 문건에 포함되어 있는 계층화된 특허 분류 기호를 각 계층 단위에서 파악한 것이 바람직할 것이다. 물론, 하위 특허 분류 기호를 자동으로 포함하여 각 분석 요소별 수치값을 계산하는 것이 더욱 바람직할 것이다. 즉, IPC로 H04B 7/26가 있을 때, 이 IPC에 대한 각종 분석 요소별 수치값을 계산할 수도 있으며, H04B 7/00의 관점에서 각종 분석 요소별 수치값을 계산할 수도 있을 것이다. 이때, 상기 H04B 7/26의 계층적으로 하위 특허 분류 기호에 속하는 다른 특허 분류 기호들도 포함되어 계산되는 것이 더욱 바람직할 것이다. 집중의 관점에서 가중치 부여 요소의 존재 및 수치를 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 집중 관점 가중치 전처리 모듈이 수행한다.
상기 집중 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다. 즉, 각 개별 문건에 대한 서지 정보로 출원인/특허권자의 그 기술분야에 대한 집중도/활동도/점유율 등과 같은 집중의 의미를 포함하는 특허 정보 분석 지표의 값을 측정하고, 각 값에 가중치를 특허 정보 처리 정책 DB로부터 입수하여 집중 관점 가중치값을 생성한다.
상기 집중 관점 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 82에 나와 있으며, 상기 비용 지출 관점 가중치 전처리 모듈 및 상기 인용 관점 가중치 전처리 모듈이 가중치를 처리하는 방식과 대동소이하다.
상기 집중 관점 가중치 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(S3220), 특허 문건 DB에서 출원인 정보, 특허 기술 분류 정보를 입수하며(S3230), 입수된 출원인 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 출원인의 집중도/활동도/점유율 중 적어도 하나 이상의 기준으로 그 값을 계산하며(S3240), 각 기준별 집중도/활동도/점유율에 대한 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3250), 상기 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하며(S3260), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3270).
상기 집중 관점 가중치 전처리 모듈은 출원인이 아닌 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식은 도 83에 나와 있다. 상기 집중 관점 가중치 전처리 모듈이 적어도 하나 이상의 특허 문건 정보를 입수하며(3320), 특허 문건 정보에서 발명자 정보, 특허 기술 분류 정보를 입수하며(S3330), 입수된 발명자 정보와 특허 기술 분류 정보를 값으로 하여 특허 기술 분류 기호 DB를 참조하여 특허 기술 분류 기호 체계상에서 입수된 특허 기술 분류 또는 적어도 하나 이상의 상위 특허 기술 분류 기호에 대한 발명자의 집중도를 적어도 하나 이상의 기준으로 계산하고(S3340), 각 기준별 집중도에 대한 가중치 정보를 입수하며(S3350), 기준별 가중치와 집중도 결과값으로 집중 관점 가중치값을 생성하고(S3360), 생성된 가중치 값을 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3370).
주체 단위 가중치 전처리 모듈
하나의 특허 문건이 있을 때, 그 특허 문건에 개입되는 주체가 중요한 주체일 경우, 그 주체가 출원한 특허가 중요한 특허일 가능성이 높다. 이때 어떤 주체가 더 중요한 주체일 수 있을 가를 판단하는 것이 관건이다. 하나의 특허 문건 포함되는 주체는 출원인, 발명자 및 대리인이 있을 수 있다. 하나의 특허 문건에 대하여 상 기 주체 관점에서 그 문건의 가중치를 전처리하는 기능을 수행하는 것을 주체 단위 가중치 전처리 모듈이라 한다. 도 4에서 알 수 있듯이 상기 주체 단위 가중치 전처리 모듈은 주체의 종류에 따라 출원인 단위 가중치 전처리 모듈, 발명자 단위 가중치 전처리 모듈, 대리인 단위 가중치 전처리 모듈이 있다.
출원인 단위 가중치 전처리 모듈
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 출원인이 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 출원인이 집중하는 분야는 그 기술 분야로의 집중율, 점유율, AI 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 출원인 단위 가중치 전처리 모듈이 수행한다.
상기 출원인 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 84에 나와 있다. 상기 출원인 단위 가중치 전처리 모듈이 출원인 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3420), 기준에 부합하는 출원인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3430), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하고(S3440), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 출원인 단위 가중치값을 생성하며(S3450), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특 허 DB나 검색 인덱스에 저장한다(S3460).
발명자 단위 가중치 전처리 모듈
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 발명자가 집중하는 기술 분야인 경우라면 그 출원의 중요성이 클 가능성이 높을 것이다. 특정 문건의 발명자가 집중하는 분야는 그 기술 분야로의 그 발명자 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 발명자로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 발명자 단위 가중치 전처리 모듈이 수행한다.
상기 발명자 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 85에 나와 있다. 상기 발명자 단위 가중치 전처리 모듈이 발명자 단위로 가중치를 처리하기 위한 기준 정보를 입수하고(S3520), 기준에 부합하는 발명자 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3530), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3540), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 발명자 단위 가중치값을 생성하며(S3550), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3560). 상기 가중치 정보에는 "과거 전체 출원 대비 등록율*0.1+해외 출원 패밀리 수*0.5"과 같은 정책이 포함되어 있을 수 있다.
대리인 단위 가중치 전처리 모듈
특정 문건에 포함되어 있는 기술 분야가 상기 문건의 대리인이 집중하는 기술 분야인 경우라면 그 특허 명세서의 완성도는 그렇지 않은 대리인이 작성하는 경우보다 높을 것이다. 그러므로, 특정 문건의 대리인이 집중하는 분야는 그 기술 분야로의 그 대리인 기준에서의 집중율, 점유율, AI(공식은 출원인 기준 공식에서 대리인으로 대체했을 때와 동일하다) 등의 분석 요소로 측정 가능할 것이다. 상기와 같은 분석 요소의 관점에서 가중치 부여 요소의 수치값을 파악하고, 각 가중치 부여 요소별로 가중치 점수를 부여하는 것은 본 발명의 대리인 단위 가중치 전처리 모듈이 수행한다. 상기 대리인 단위의 가중치는 출원인 단위의 가중치나 상기 발명자 단위 가중치보다 중요도가 낮을 것이다.
상기 대리인 단위 가중치 전처리 모듈이 가중치를 처리하는 방식은 도 86에 나와 있다. 상기 대리인 단위 가중치 전처리 모듈이 대리인 단위로 가중치를 처리하기 위한 기준 정보를 입수하며(S3620), 기준에 부합하는 대리인 명의의 문건을 대상으로 적어도 하나 이상의 문건 단위 가중치 전처리 모듈이 계산한 결과값을 입수하며(S3630), 문건 단위 가중치 전처리 모듈별 가중치 정보를 상기 특허 정보 처리 정책 DB로부터 입수하며(S3640), 각 문건 단위 가중치 전처리 모듈의 가중치와 각 결과값으로 입수한 기준별 대리인 단위 가중치값을 생성하며(S3650), 생성된 가중치 값을 기준과 함께 또는 독립적으로 특허 문건 정보의 고유 문건 번호와 함께 특허 DB나 검색 인덱스에 저장한다(S3660). 상기 가중치 정보에는 "출원대비 등록율 *0.3"과 같은 정책이 포함되어 있을 수 있다.
본 발명의 문건 단위 가중치 전처리 모듈 및 주체 단위 가중치 전처리 모듈은 상기와 같은 적어도 하나 이상의 각 가중치 전처리 모듈이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 문건 단위의 가중치를 계산해 낸다. 이때, 각 관점의 가중치 부여 모듈 각각 또는 각 주체별 가중치 부여 모듈 각각은 자신이 획득한 가중치 부여 요소에 대하여 기설정된 가중치를 부여하여 자신의 관점에서의 문건 단위의 가중치를 계산해 낼 수 있다. 상기의 각 가중치들은 관리자 또는 사용자의 입력에 따라 다르게 부여될 수 있음은 물론이다 하겠다.
주체 마스트 DB 생성 모듈(301-4)
주체의 종류
특허 문건에 대하여 주체는 크게 1) 출원인, 2) 발명자, 3) 대리인이 있을 수 있다. 출원인에는 기업 등과 같은 조직과 개인이 있을 수 있다. 본 발명에서 상기 주체를 저장하고 관리하는 DB를 주체 마스트 DB(204)라고 하며, 상기와 같은 주체 마스트 DB(204)를 생성하는 모듈을 주체 마스트 DB 생성 모듈(301-4)이라 한다.
상기 주체 마스트 DB(204)에는 대표명화 된 출원인 명칭 DB, 대표명화 된 발명자 명칭 DB, 대표명화 된 대리인 명칭 DB를 더 포함할 수 있으며, 이와는 독립적으로 기업 정보 DB를 더 포함하고 있을 수 있다. 이들에 대해서 각각 설명한다.
주체 마스트 DB 생성 모듈(301-4)의 구성
본 발명의 주체 마스트 DB 생성 모듈(301-4)에는 대표명화 전처리 모듈(301-4-1) 포함되어 있다. 상기 대표명화 전처리 모듈은 출원인 대표명화를 처 리하는 출원인 대표명화 전처리 모듈(301-4-1-1), 발명자를 대표명화 처리하는 발명자 대표명화 전처리 모듈(301-4-1-2), 대리인을 대표명화 처리하는 대리인 대표명화 전처리 모듈(301-4-1-3)중 어느 하나 이상을 포함하고 있다. 한편, 본 발명의 주체 마스트 DB 생성 모듈(301-4)에는 기업 정보 DB 생성 모듈이 더 포함되어 있을 수 있다. 기업 정보 DB에는 기업의 재무 정보, 회사 현황 정보, 회계 정보, 주생산품, 대표자, 법인등록번호, 사업자 번호, 웹사이트, 전화번호, 팩스 번호 중 어느 하나 이상이 더 포함되어 있을 수 있다. 상기 주체 마스트 DB(204)에는 세부적으로 기업 정보 DB(204-1), 대표명화된 출원인 명칭 DB(204-2), 대표명화된 발명자 명칭 DB(204-3), 대표명화된 대리인 명칭 DB(204-4), 및/또는 조직 정보 DB(204-5)을 더 포함하고 있을 수 있다.
대표명화의 개념
먼저 대표명화의 개념부터 설명한다. 대표명화란 주체의 이름(name)에 대한 1개 이상의 국가 또는 1개 이상의 언어권 별로의 적어도 하나 이상의 표기법을 통합한다는 것을 의미한다. 예를 들면 대한민국에서 삼성전자주식회사라는 회사가 있을 때, 이 회사의 공식 영문 표기는 Samsung Electronic Co, ltd이라고 할 때, 이 회사와 관련된 모든 특허 문건에서 동일성이 인정되는 이 회사의 표기가 모두 일치하는 것은 아니다. 표기의 불일치는 언어권이 다를 경우에는 당연한 것이며, 1개 언어권 내에서도 다수의 불일치 사례가 존재한다. 대표적인 불일치 사례로는 1) 조직 유형의 표기에 관한 것과 2) 미스스펠링(오타), 3) 띄어쓰기, 4) 구두점 등의 특수 문자(special character)사용 등이 있다. 예를 들면, Co, ltd, company, corporation, corp., Corpm co limited 등등과 같은 것들이 혼용되어 표기되는 경우가 많다. 또한, Samsung Electronic와 같이 s를 붙이지 않는 등의 오타 등이 자주 발생하며, SamsungElectronics와 같이 띄어쓰기를 하지 않거나, 불필요한 띄어쓰기가 들어가거나, 약어 등에서 점(dot) 또는 콤마(comma)등이 혼동되어 쓰이기도 한다.
기업의 사명이 변경되는 경우, 변경된 이후에는 법인 등록 번호나 사업자 등록 번호 등은 그대로 유지되나, 출원인 명의가 달라지게 되고, 달라지기 전의 명의와 달라진 후의 명의로 된 특허 문건이 공존하게 된다. 또한, 제1국에서 제2국으로 해외 출원하는 경우, 제 1국에서의 출원인 표기와 제 2국에서의 출원인 표기가 달라지는 경우가 많으며, 제2국에서조차도 여러 개의 표기로 표기되는 경우도 많다. 상기와 같이 동일 주체를 다른 표기법으로 표기되는 문제를 해결하는 것이 본 발명의 출원인 대표명화 전처리 모듈(301-4-1-1)이 수행하는 기능이다.
대표명화가 문제되는 경우
상기와 같은 문제가 발생하는 이유는 크게 3가지가 있다. 첫번째 유형은 회사의 사명 변경, 합병 등으로 출원인의 표기가 실질적으로 변경되는 경우이다. 이 경우, 기업 정보 DB를 통해서 상기 출원인 명의의 변경에 관한 정보를 상기 주체 마스트 DB(204)에 반영해 놓을 필요가 있다. 두번째 유형은 대리인들마다 특정 회사의 표기를 달리하는 경우인데, 특히 해외 기업에 관한 표기는 통일화되어 있지 않는 경우가 많다. 이 경우에는 1) 자국 내에서의 표기는 비교적 일치하는 것이 많다는 점, 2) 해외에서 국내로 들어오는 사건의 대부분은 우선권 주장을 포함하고 있다는 점을 고려하여 자국 내에서의 출원인 표기를 기준으로 통일화를 시켜 놓을 수 있다.
대표명화 방법
본 발명에서 출원인, 발명자 및/또는 대리인의 대표명화를 처리하는 것을 주체 대표명화 전처리 모듈(301-4-1)이 수행하는데, 주체 대표명화 전처리 모듈(301-4-1)에는 각각 출원인 대표명화 전처리 모듈(301-4-1-1), 발명자 대표명화 전처리 모듈(301-4-1-2), 대리인 대표명화 전처리 모듈(301-4-1-3) 중 어느 하나 이상이 포함되어 있다.
하나의 국가 내에서 상기 출원인 대표명화 전처리 모듈(301-4-1-1)이 출원인 대표명화를 수행하는 방법은 다음과 같을 수 있다. 하나의 국가 내에서는 자국 기업과 타국 기업이 있을 수 있으며, 먼저 자국 기업부터 대표명화를 수행하는 것이 바람직하다. 먼저 용어를 정의한다. "삼성전자주식회사"라는 표기가 있을 때, 이 표기 전체를 출원인명이라 하고, "삼성전자"를 조직 명칭 스템(stem)(Organization Name)이라고 하고, "주식회사"를 조직 유형(Organization Type) 표기 표기라 한다.
조직 유형 표기 집합의 생성
첫째, 조직 유형 표기 집합을 생성해 낸다. 조직 유형 표기 집합의 예로는 ^주식회사^, ^㈜^, ^학교법인^, ^가이시키 가부샤^, ^가이시끼 갸뷰샤^, ^Co,^, ^ltd^, ^Co., ltd.^, ^GMBH^등 여러 가지가 있다. 조직 유형 표기 집합을 생성하는 방법은 다음과 같다. 하나의 국가를 기준으로 그 국가의 특허 문건의 서지 사항 DB에서 출원인 필드의 출원인명 값을 모두 입수한다.(삼성전자 주식회사, hitachi co., ltd 등의 출원인명을 입수한다.) 상기 출원인 필드의 값에서 빈칸 또는 기타 구두점 또는 이미 알고 있는 조직 유형 표기(예를 들면 ㈜, 주식회사, co. ltd, limited 등)를 기준으로 출원인명을 절단한다.(예를 들면 주식회사, "공백+Co", 또는 "공백" 등을 기준으로 입수된 모든 출원인명을 절단한다.) 상기 절단된 모든 대상을 빈도 순으로 소팅(sorting)한다. 소팅된 것들 중에서 빈도가 높은 곳을 중심으로 하여 조직 유형 표기를 선정하며, 선정된 조직 유형 표기를 기준으로 조직 유형 표기 집합을 생성한다. 이렇게 빈도 순으로 소팅하는 이유는 출원인의 종류보다 조직 유형의 수가 상대적으로 훨씬 적고, 따라서 하나의 조직 유형이 다수의 출원인명에 반복적으로 사용되는 경우가 많으며, 따라서 조직 명칭보다 조직 유형의 사용 빈도가 훨씬 많으며, 따라서 절단 후 빈도수가 조직 유형이 훨씬 많기 때문이다.
***예시***,
조직 유형 표기 집합을 생성하는 방법으로는 다음과 같은 것들도 이 있을 수 있다. 첫째, 이미 알고 있는 대표적인 조직 유형 표기를 등록하는 방법이다. 주식회사 또는 ㈜ 등 이미 알고 있는 조직 유형 표기를 등록할 수 있다. 둘째, 이미 알고 있는 적어도 하나 이상의 출원인에 대하여 그 출원인에 대한 다양한 표기 각각에 대하여, 조직 명칭 스템을 떼어내고 남은 조직 유형 표기들을 모은다. 이러한 조직 유형 표기들을 사용하여 다른 출원인 표기에서 조직 유형 표기를 떼어내면, 그 출원인 표기에서 조직 명칭 스템을 추출할 수 있다. 이어, 추출된 조직 명칭 스 템으로 다시 그 조직 명칭 스템이 사용된 출원인 표기를 찾아내고, 그 찾아낸 출원인 표기에서 조직 명칭 스템을 제거하면 다시 새로운 조직 유형 표기를 입수할 수 있다. 이러한 과정을 반복하며, 앞의 첫째 또는 하기의 셋째 방법에서 추출한 조직 유형 표기 집합을 출원인 표기에서 조직 명칭 스템과 조직 유형 표기를 분리하는데 사용할 수 있다. 셋째는 출원인 표기를 적어도 1자 이상씩으로 절단한 다음 그 절단한 대상의 빈도를 계산하고, 기설정된 빈도를 초과하는 최장어구를 추출하는 방법으로 조직 유형 표기를 찾아 낸다. 즉, "주식회사"와 같은 조직 유형 표기는 조직 명칭 스템보다 훨씬 더 많이 사용되며, "주식회사", "주식회", "식회사", "주식", "회사" 등의 빈도를 계산한 다음 최장인 "주식회사"를 조직 유형 표기로 선택해 낸다.
만약 출원인이 자연인 경우에는 개인의 표기에는 조직 유형 표기 집합에 속하는 조직 유형 표기가 나타나지 않을 것이다. 그러므로, 본 발명에서는 그 출원인 표기와 동일한 표기가 발명자 표기에 나타나는 경우에는 출원인을 자연인으로 처리하며, 출원인 표기를 구성하는 요소 중에서 조직 유형 표기 집합에 나타나지 않은 표기만으로 구성되는 경우에도 자연인 출원인으로 처리한다. 그러므로, 조직 유형 표기 집합의 구성 원소의 증감에 따라 자연인 출원인에 속하는 출원인의 표기의 수도 감소하기도 하고 증가하기도 한다.
상기와 같은 방법으로 조직 유형 표기 집합을 생성한 다음, 상기 조직 유형 표기 집합을 주기적으로 갱신한다. 갱신의 일 실시예적 방법은 다음과 같다. 1) 신규로 입수되는 특허 문건 집합 또는 임의의 선정된 특허 문건 집합에서 출원인명 집합을 추출한다. 2) 추출된 출원인명 집합을 대상으로 상기 조직 유형 표기 집합에 있는 조직 유형 표기 집합으로 출원인명에서 조직 유형을 분리해 낸다. 이를 통해서 입수된 출원인 명 집합은 조직 유형의 분리가 일어난 출원인명 집합과 조직 유형의 분리가 일어나지 않은 출원인명 집합으로 양분된다. 3) 조직 유형이 분리된 조직 명칭이 상기 조직 유형의 분리가 일어나지 않은 출원인명 집합의 출원인명에 있는지를 조사한다. 4) 조사 결과 존재하는 경우, 그 출원인명에서 조직 명칭을 제거하고 남은 문자열을 입수한다. 5) 상기 남은 문자열들을 모으고, 이를 빈도 순으로 소팅하여 빈도가 높은 남은 문자열에서 조직 유형이 되는 문자열을 추출하거나, 상기 남은 문자열 하나하나씩을 조사하여 상기 남은 문자열이 조직 유형 표기 집합에 포함될 수 있는 새로운 조직 유형 표기인지를 확정한다.
예를 들어 설명하면 다음과 같다. 1) 단계에서 Samsung Electronics Co. Ltd. 및 Samsung Electronics Co,라는 출원인명이 있고, Co. Ltd는 조직 유형 표기 집합의 원소이나, Co,는 원소가 아니라고 가정하자. 상기 2) 단계에서 통하면 전자는 분리가 일어났고, 후자는 분리가 일어나지 않았음을 알 수 있으며, Samsung Electronics라는 조직 명칭이 입수된다. 3) 단계에서 상기 Samsung Electronics라는 조직 명칭으로 후자를 조사한다. 4) 조사 결과 Samsung Electronics라는 조직 명칭이 존재하므로, Samsung Electronics Co,에서 Samsung Electronics를 제거하면, Co,가 남는다. 5) 단계에서 이 Co,가 조직 유형에 속하는 것인지를 판단 하고, 조직 유형에 속하는 것일 경우, 종래의 조직 유형 표기 집합에 추가한다.
상기와 같은 방법으로 제 1국에서의 출원인 대표명화를 수행한다. 상기와 같은 제1국에서의 출원인 대표명화의 정확성을 높이기 위해서는 다음과 같은 2가지 처리가 추가적으로 더 수행되면 효과적이다.
첫째, 제1국 기준으로 제n국에서 제1국으로 출원되는 특허 문건에 포함된 출원인 명이 있을 경우, 제 1국의 표기법과 제n국의 표기법에서 현격한 차이가 날 수 있다. 즉, 대한민국에 출원된 대한민국 출원인의 이름은 대한민국 기준으로 크게 차이가 많지 않는 반면, 미국이나, 일본, 독일 등에서 대한민국에 출원한 출원인의 명칭의 표기는 그 차이가 상대적으로 크게 된다. 이러한 문제를 해결하는 것이, 영문 초록 데이터를 활용하는 것과, 우선권 주장 번호를 활용하는 방법이 있다. 하나씩 설명한다.
***방법 추가***
하나의 출원이 여러 나라에서 출원될 수 있으며, 이 경우 그 나라들에서 언어가 다를 경우에는 우선권 주장 정보 또는 패밀리 데이터로 적어도 2개 이상의 국가에서 2개 이상의 언어로 표기 되는 출원인 표기를 관련 시킨다. 이때, KPA(Korea Patent Abstract)나 PAJ(Patent Abstract of Japan)과 같은 각 국가가 발행하는 영문 초록 정보를 활용할 수 있다. 이때 출원번호를 키(key)값으로 하여 각 국가별 언어에서의 출원인의 표기와 영어로 된 출원인의 표기를 맵핑시킬 수가 있으며, 상기 영어로 된 출원인의 표기와 미국이나, 유럽 등에서 영어로 된 출원인의 표기를 맵핑시킬 수 있게 된다. 상기 맵핑 과정에서 출원인 표기에서 조직 명칭 스템과 조직 유형 표기를 분리하여 처리하는 것은 당연하다 할 것이다. 영문 초록을 활용하는 것은 본직으로 영어권의 국가에서 대표명화 하는 상기에서 설명한 로직과 동일하다. 예를 들어 설명하면, 출원번호 #1의 "콸콤인코프레이티드"와 출원번호 #2의 "퀄컴인코프레이티드"를 재료로 대표명화를 시도하는 대신, KPA data에 있는 출원번호 #1과 출원번호 #2의 영문 표기를 기준으로 대표명화(양자는 동일한 조직으로 판단하는 절차를 거친다는 뜻)를 하고, 대응되는 출원번호를 키값으로 하여 출원번호 #1의 "콸콤인코프레이티드"와 출원번호 #2의 "퀄컴인코프레이티드"는 같은 조직으로 판단하는 대표명화를 수행한다.
우선권 주장 번호 등을 활용하여 대표명화 하는 것은 도 99에 잘 나타나 있다. 상기 대표명화 전처리 모듈은 제 1국에서 입수된 특허 문건에서 조약 우선권 정보가 있는 경우, 조약 우선권 번호 및 상기 입수된 특허 문건의 출원인 명의 정보를 입수하고(S4920), 상기 조약 우선권 정보를 검색 엔진 또는 DBMS(201)를 통하여 상기 조약 우선권의 기초가 되는 본국의 특허 문건 정보를 입수하며(S4930), 상기 본국의 특허 문건 정보에 포함된 출원인과 상기 제1국에서 입수된 특허 문건의 출원인 명의를 동일하게 취급하는 방식으로 국가간에 출원인 명의를 대표명화 한다(S4940). 제1국에서 제2국으로 우선권을 주장하며 출원된 경우, 상기 제 2국 특허 문건 마스트 DB(202) 및 상기 제1국 특허 문건 마스트 DB(202)에서 상기 우선권 주장 번호 및 상기 우선권 주장의 기초가 되는 특허 출원 번호에 관한 정보를 입수할 수 있다. 상기 제1국에서의 회사 명칭이 e인 출원인이 출원한 제1국에서의 특허 출원 번호가 제2국의 우선권 주장 번호에 존재하는 경우, 상기 우선권 주장 번호를 포함하고 있는 제2국 특허 출원의 출원인은 실질적으로 동일한 출원인이라고 볼 수 있다.(물론, 제2국에서의 우선권을 양도한 경우도 발생할 수 있지만, 이는 통상적인 것이 아니다.) 물론, 제2국 특허 문건 마스트 DB(202)에서 상기 제1국에서 기인한 우선권 주장 번호가 있는 경우, 이 우선권 주장 번호를 상기 제1국에서 검색해 봄으로써 상기 제1국과 제2국에서의 동일 주체를 찾을 수 있다. 동일 주체를 찾은 경우, 제 2국에서의 여러 명칭으로 된 표기는 그 중 어느 하나로 표기를 통일화시킬 수 있다. 즉, 제2국에서 상기 e 출원인의 표기를 f, g 또는 h라고 표기되었을 경우, 상기 f, g, 또는 h 중에서 f를 선택하여 표기할 수 있다. 예를 들어 설명하면, 출원번호 #1의 "콸콤인코프레이티드"와 출원번호 #2의 "퀄컴인코프레이티드"의 우선권 번호가 각각 US출원번호 #1, US출원번호 #2일 경우, 그 US 문건에 나와 있는 출원인이 동일한 조직(예를 들어 양자 모두 Qualcomm Incorporated라고 하는 등)으로 판단되는 경우, 출원번호 #1의 "콸콤인코프레이티드"와 출원번호 #2의 "퀄컴인코프레이티드"의 양 출원인명을 같은 조직으로 판단하여 대표명화를 한다.
이어, 사명 변경 등 기타의 이유로 발생하는 출원인에 대한 대표명화를 기술한다.
출원인 대표명화를 처리하는 알고리즘을 포함하고 있는 핵심 엔진인 출원인 대표명화 전처리 엔진(3610)과 대표명화를 처리하기 위한 규칙을 포함하고 있는 대표명화 규칙 DB(3630), 출원인의 명의가 변경되는 정보를 포함하고 있는 출원인 명의 히스토리 DB(3650)가 있다. 특히, 상기 출원인 명의 히스토리 DB(3650)에는 특 허권자 변동 정보(assignee change 정보)가 포함되어 있을 수 있으며, 기업의 사명 변경, 합병과 분할에 의한 사명 변동 정보가 포함되어 있을 수 있다. 그리고, 대표명화를 처리하기 위해서는 대표명화의 기준이 되는 대표명화 기준 DB(3670)가 필요한데, 이들에는 세부적으로 조약 우선권 정보 DB(3671), PAJ DB(3673), KPA DB(3675), Inpadoc DB(3677), 패밀리정보 DB(3830)가 있으며, 표기 등의 문제를 해결하기 위해서 특히, PAJ DB(3673), KPA DB(3675)가 충분히 활용되는 것이 바람직하다. 대표명화 된 출원인 정보는 출원인 대표명 DB(3690)에 저장된다.이하, 상기 출원인 대표명화 전처리 모듈(301-4-1-1)이 출원인 대표명화를 수행하는 방법에 대해 상술한다.
상기 대표명화 전처리 모듈이 출원인 대표명화를 수행하는 일실시예적 방법에 대해서는 도 98에 잘 나타나 있다.
상기 대표명화 전처리 모듈은 출원인 명의정보에서 식별력 없는 요소를 제거하고(S4820), 사명 변경 정보를 입수하며(S4830), 특정 기간 동안 변경 전 사명과 변경 후 사명을 출원인 명의로 하는 출원된 모든 문건을 찾아내고(S4840), 상기 변경 전후의 사명에 대한 주소 정보를 입수하고 그 동일성을 비교 하고(S4850), 주소 정보가 동일한 경우, 동일한 출원인으로 대표명화하고, 주소 정보가 동일하지 않을 경우, 대표자 명의의 동일성을 검사하며(S4806), 대표자 명의가 동일한 경우, 동일한 출원인으로 대표명화하고, 동일하지 않을 경우, 변경 전 명의로 된 출원에서 IPC 메인그룹을 추출하며(S4870), 변경 후 명의로 된 출원에서 IPC 메인그룹을 추출하고(S4880), 상기 양 추출된 IPC 메인그룹에서 공통되는 것이 있는 경우, 동일 한 출원인으로 대표명화 한다(S4890)
이하, 상기 대표명화 과정을 더욱 상세하게 설명한다. 본 발명의 기업 정보 DB에는 기업의 1) 사명, 주소, 대표 이사, 법인 등록 번호, 사업자 등록 번호 등과 같은 기업 인적 정보, 2) 재무 정보, 3) 생산품 또는 취급 품목에 관한 정보, 4) 사명 변경, 합병, 분사 등과 같은 변동 정보, 5) 공시 정보 중 어느 하나 이상이 포함되어 있다. 상기 출원인 대표명화 전처리 모듈(301-4-1-1)은 적어도 하나 이상의 특정 시점을 기준(예를 들면 현재 시점)으로 동일성이 인정되는 기업명을 기준으로 다른 표기의 출원인 명의를 대표명화 한다. 대표명화한 출원인 명의는 특허 공보에서 입수되는 정보로 구성되는 특허 문건 마스트 DB(202)에 엎어 쓰기 보다는 별도의 필드에 저장되는 것이 바람직하다. 상기 첫번째 유형의 대표명화 과정은 다음과 같이 이루어 진다.
첫째, 출원인 표기에서 주식회사, 카이시키 가뷰사, ltd, co 등과 같이 식별력이 없는 요소인 조직 유형을 제거한다. 이와 같은 식별력 없는 요소인 조직 유형은 관리될 필요가 있으며, 조직 유형 테이블에 별도로 저장한다. 이때, 각 조직 유형이 발견되는 회수/빈도를 함께 저장할 필요가 있을 것이다.
둘째, 기업 정보 DB에 기업 사명의 변동 정보를 입수한다. 특정 과거 시점 A에서 기업명이 a, 주소가 a1, 다른 시점 B에서의 기업명이 b, 주소가 b1이라고 가정하자. 특허 문건 마스트 DB(202) 또는 검색 엔진에 기간 정보로 A시점에서 B시점까지에 출원 명의인으로 a로 된 모든 문건을 찾아 낸다. 이때, 주소 정보가 a1인 경우(또는 b1-주소는 그 이전에 옮겼을 가능성이 높음. 주소 변동이 사명 변동보다 다수 있음)라면 모두 같은 출원인으로 파악하고, 주소 정보가 c1~cn인 경우에는 태그를 붙여 저장한다. 특허 문건 마스트 DB(202) 또는 검색 엔진에 기간 정보로 A시점에서 B시점까지에 출원 명의인으로 b로 된 모든 문건을 찾아 낸다. 이때, 주소 정보가 a1인 경우 또는 b1라면 모두 같은 출원인으로 파악하고, 주소 정보가 c1~cn인 경우에는 태그를 붙여 저장한다. 이때, 상기 주소 정보가 다를 경우(c1~cn)라도 대표이사 명의가 같거나(특정 기간에 출원된 특허 문건에는 대표이사 정보가 포함되어 있음), b명의로 된 특허 문건의 특허 분류 기호가 a 명의로 된 특허 출원에서 파악되는 서브클래스 및/또는 그룹 이하 수준에 동일한 문건이 있다면 동일 출원인으로 분류한다.
셋째, 각 시점별로 파악되는 (기업명, 주소) 집합을 상기 검색 엔진 또는 상기 특허 문건 마스트 DB(202)에 질의하여 특허 문건 정보를 획득한다.
넷째, 상기 둘째 및 셋째에서 파악되는 문건 집합을 합집합 연산을 수행하고, 가장 최근 기업명을 기준으로 대표명화를 수행한다. 상기 대표명화 된 기업명에는 1) 각 시점별 기업명 및/또는 2) 각 해당 특허 문건이 대응되어 있는 것이 바람직하다. 상기 대표명화 된 기업명에 대한 해당 특허 문건에 대한 공개적인 정보를 획득하는 경우, 상기 출원인 대표명화를 업데이트할 수 있을 것이다.(기업 공시 정보에 특허 문건이 포함되어 있거나, 기업 정보 DB에 특허 정보가 포함되어 있는 경우가 그 한 예가 된다.)
예를 들면, 일본에 본사를 둔 SONY라는 회사가 한국에서 표기될 때, "쏘니 가이시키 가뷰사", "소니 가이씨키 가부샤" 등과 같이 여러가지로 표기되는데, 이 를 "소니 가이씨키 가부샤"로 통일된 표기화를 시킬 수 있다. 이는 미국에서도 마찬가지일 것이며, 미국 출원인이 대한민국 또는 일본에 출원될 때도 마찬가지일 것이다. 즉, 국경을 넘는 특허 출원에 있어서, 우선권 주장 번호를 통해서 제1국의 주체와 제2국의 여러 표기에 관한 주체를 동일화 및 대표명화 시킬 수 있다.
한편, 상기와 같은 대표명화는 국가별 관점 및 출원인명에서 조직 유형 표기의 제거 관점에서의 대표명화였다. 하지만, 대표명화가 더 진전되기 위해서는 조직 명칭에서의 대표명화가 더 필요하다. 예를 들어, 미국에서 Samsung Electronics로 인정되는 것이 논란의 여지가 있을 수 있는 각종 조직 명칭 표기가 수십 개가 넘게 발견되는데, 이러한 현상은 다른 출원인명의 조직 명칭에도 마찬가지이다. Samsung Electronics로 예를 들면 다음가 같은 것들이 있다. SAM-SUNG ELECTRONICS, SAM SUNG ELECTRONIC, SAM SUNG ELECTRONICS, SAMASUNG ELECTRONICS, SAMAUNG ELECTRONICS, SAMGSUNG ELECTRONICS, SAMSUG ELECTRONICS, SAMSUGN ELECTRONICS, SAMSUMG ELECTRONICS, SAMSUN ELECTRONIC, SAMSUN ELECTRONICS, SAMSUNE ELECTRONICS, SAMSUNG-ELECTRONICS, SAMSUNG ELECTRONICS, SAMSUNG EECTRONICS, SAMSUNG EELCTRONICS, SAMSUNG ELCTRONICS, SAMSUNG ELECETRONICS, SAMSUNG ELECRONICS, SAMSUNG ELECRTONICS, SAMSUNG ELECTONICS, SAMSUNG ELECTORNICS 이들을 유형별로 보면, 오자, 탈자, 추가, 빈칸, "-" 등과 같은 특수 문자(special character) 등등이 있다. 이들을 Samsung Electronics로 맵핑하여 이들의 조직 명칭의 대표명을 Samsung Electronics로 처리할 것인가는 정책적인 문제이며, 가급적 엄격한 기준을 적용하여 그 기준을 통과한 것들에 한해서 Samsung Electronics로 대표명화 하는 것이 타당하다. 상기와 같은 대표명화 문제는 우선권 정보 등과 같은 상기에서 설명한 것들을 통해서도 어느 정도 보충할 수 있으나 하기에 설명하는 편집 거리(Edit distance) 알고리즘을 수행하는 등과 같은 처리를 수행하는 것이 더 타당할 것이다. 먼저 편집 거리에 대한 로직을 설명한다. 편집 거리란, 제1문자열과 제2문자열이 있을 때, 상기 제1문자열에서 몇 번의 단위 처리를 수행하면 제2문자열로 바꿀 수 있는가를 수치적으로 평가하는 것이다. 단위 처리는 스펠링의 추가, 삭제, 변경, 빈칸이나 특수문자의 추가, 삭제, 변경 등을 포함한다. 제1문자열을 Samsung Electronics라고 할 때, 상기 예에서 나온 몇 개의 문자열로 편집 거리를 계산하는 것을 하기 표 8에 제시하였다.
[표 8]
제1문자열 제2문자열 편집 거리 비고
Samsung Electronics SAMSUNG ELECTRONICs 0 일치
Samsung Electronics SAMSUNG ELECTRONIC 1 s빠짐
Samsung Electronics SAM SUNG ELECTRONIC 2 띄어쓰기, s빠짐
Samsung Electronics SAMSUN ELECTRONIC 2 g 빠짐, s빠짐
Samsung Electronics Jamsung Electronics 1 첫글자 다름
Samsung Electronics LG Electronics 7 첫글자 다름
Samsung Electronics Sony 17 길이 대비 편집거리 큼
Samsung Electronics SAMSUNG EECTRONICS 1 e추가됨
주어진 조직 명칭 집합이 있을 경우, 그 조직 명칭 집합의 문자열 중에서 선택된 어느 하나(가급적 빈도수가 높은 것이 좋음)를 제1문자열로 선택하고, 그 조직 명칭 집합에 대하여 다른 이름을 제2문자열로 하여 편집 거리를 계산한다. 이때, 첫문자의 일치 여부 및 문자열의 길이 대비 편집 거리를 추가적으로 더 계산할 수 있다. 한편, 편집 거리 알고리즘을 사용할 때의 편집 정책(동일 조직 명칭으로 볼 것인지 다른 조직 명칭으로 볼 것인지에 대한 판단)을 기준으로 동일 조직 명칭으로 볼 것인지의 여부를 판단한다. 예를 들어 상기 편집 정책에는 편집 거리가 0인 경우에는 동일 명칭, 편집 거리가 1인 경우에는 첫번째 시작 문자가 다르지 않는 한 전체 문자열 길이 대비 편집거리가 설정된 기준(예를 들면 30% 이내)일 경우에는 동일 명칭, 그 이상일 경우에는 다른 조직 명칭으로 보며, 편집 거리가 2인 경우에는 전체 문자열 길이 대비 편집거리가 설정된 기준(예를 들면 10% 이내, 빈칸이나 특수 문자가 삽입된 경우에는 20%)일 경우에는 동일 명칭, 그 이상일 경우에는 다른 명칭으로 보며, 편집 거리가 3 이상일 경우에는 특별한 다른 조건이 없는 한 다른 명칭으로 본다.(상기 특별한 조건으로는 Chemical = Chem으로 본다 등과 같은 것이다. 예를 들어 이와 같은 예외 처리를 하면 LG Chemical과 LG Chem은 편집 거리 3이 편집 거리 0으로 바뀐다. 이러한 특별 조건은 주로 약어(예를 들면, University = Univ), 머리글자의 완전 일치(IBM = International Business Machines) 등이 있을 수 있다.)
상기와 예시와 같은 정책을 적용했을 때, 상기 표 8에 나와 있는 각 문자열은 하기 표 9와 같이 처리될 수 있다.
[표 9]
제1문자열 제2문자열 제1문자열로의 대표명화 여부 비고
Samsung Electronics SAMSUNG ELECTRONICS O
Samsung Electronics SAMSUNG ELECTRONIC O 길이 비율6%(1/18)
Samsung Electronics SAM SUNG ELECTRONIC O 길이 비율11%(2/18), 빈칸 예외 규정 적용
Samsung Electronics SAMSUN ELECTRONIC X 길이 비율11%
Samsung Electronics Jamsung Electronics X 첫글자 다름
Samsung Electronics LG Electronics X 첫글자 다름
Samsung Electronics Sony X 94%
Samsung Electronics SAMSUNG EECTRONICS O
조직 명칭의 대표명화 여부는 상기 편집 정책에 따라서 크게 달라질 수 있게 된다. 상기 편집 정책에 따른 대표명화의 결과를 보고 상기 편집 정책을 주기적으로 튜닝할 수도 있게 된다.
한편, 한국어와 같은 경우 상기 편집 거리를 계산할 때 조직 명칭을 풀어쓰기 등을 할 수 있다. 예를 들면, "퀄컴"과 "콸콤"이 있을 때, 이를 풀어쓰면 각각 "ㅋ ㅜ ㅓ ㄹ ㅋ ㅗ ㅁ" 및 "ㅋ ㅗ ㅏ ㄹ ㅋ ㅗ ㅁ"이 되거나, 풀어쓰기 정책을 복자음 및 또는 복모음을 하나로 본다면 "ㅋ ㅝ ㄹ ㅋ ㅓ ㅁ" 및 "ㅋ ㅘ ㄹ ㅋ ㅗ ㅁ"이 된다. 이때, 상기 풀어쓴 명칭을 대상으로 상기 편집 정책을 기준으로 대표명화를 할 수 있게 되면 양자는 다른 조직 명칭이 되게 된다. 한편, "콸컴"이라는 조직 명칭은 동일 조직 명칭이 되게 된다.
이때, 상기 편집 거리로 대표명화 된 것과 우선권 주장 등으로 처리하여 대표명화 된 것들 사이에서의 우선 순위가 문제시 될 수 있는데, 편집 거리로 대표명화 된 것들은 보충적으로(즉, 후순위)로 되는 것이 더 바람직하다. 즉, 편집 거리로 대표명화 하는 것은 기타의 방법으로 대표명화 되지 않은 것들에 한해서 수행하는 것이 더 바람직할 것이다.
상기와 같이 대표명화 된 출원인은 본 발명의 대표명화 된 출원인 명칭 DB에 저장되며, 상기 대표명화 된 출원인 명칭 DB에는 출원인에 대한 식별 코드, 각 국가별 대표명 표기, 각 국가별 출원인에 대한 모든 표기를 모은 국가 단위 출원인 표기 전체 집합이 포함된다. 이때, 글로벌 대표명을 지정할 수도 있는데, 상기 글로벌 대표명은 어느 언어라도 무방하나, 영문인 것이 통용성 면에서 바람직할 것이다. 한편, 특허 데이터가 국가 단위로 입수되기 때문에 국가를 기준으로 대표명화를 수 행했지만, 언어권을 대상으로 또는 EU와 같이 같은 권역이더라도 복수개의 표준어가 인정되는 경우, 언어별 대표명화를 수행할 수도 있다. 이 경우 EU와 같이 언어 표기를 별도로 병기하는 경우, 그 언어별로 대표명화를 수행하면 되고, 언어 표기가 없는 경우 그 국가와 대응되는 표준어를 기준으로 언어별 대표명화를 수행하면 된다.(이때, American English와 British English에 따라 다른 경우도 발생한다. 예를 들면, Center/Centre가 한 예가 된다.)
상기와 같이 출원인 대표명화의 처리하면, 하기 표 10과 같은 대표명화 데이터가 생성되된다.
[표 10]
글로벌ID 글로벌 대표명 제1국 대표명 제1국 명칭집합 제n국 대표명 제n국 명칭집합
1111 Samsung Electronics 삼성전자 삼성전자삼성 전자 Samsung Electronics Samsung Electronics Samsung Electronic Samsuung Electronics
2222 Qualcomm 퀄컴 퀄컴 콸콤 콸컴 Qualcomm Qualcomm Qualcom
3333 LG Electronics 엘지전자 엘지 전자 금성사 LG Electronics LG Electronics LG Electronic L G Electronics
상기 제 n국 명칭 집합에는 띄어 쓰기, 오타 등의 잘못된 명칭들도 더 포함되어 있는 것이 특징이다. 상기 대표명화 데이터에는 제 n국 대표명에 대표적인 조직 유형 을 결합한 명칭이 저장되어 있을 수 있다.(예를 들면 삼성전자주식회사), 한편, 제1국 명칭 집합에 다양한 조직 유형이 들어가 있는 명칭 집합을 더 포함하고 있을 수 있다.(예를 들면 ^Samsung Electronics Co^, ^Samsung Electronics Co. ltd,^, ^Samsung Electronics Co., ltd^ 등등-이렇게 할 경우 명칭 집합을 구성하는 원소가 아주 많게 되나, 임의의 출원인명이 입수되었을 때, 제n국 대표명을 할당하거나, 글로벌 대표명을 할당하는 속도 및 정확성이 상승하게 되는 장점이 있다.)
이어 발명자 명칭을 대표명화 하는 것에 대해 설명한다. 발명자의 명칭의 대표명화는 1) 하나의 조직 내에서의 대표명화, 2) 조직을 초월한 대표명화, 3) 국가 단위에서 2 이상의 언어로 표기되는 발명자 명칭의 대표명화가 있다. 이하 하나씩 설명한다. 본 발명의 발명자 대표명화 전처리 모듈(301-4-1-2)은 하나의 조직 명칭 스템을 기준으로 그 조직 명칭 스템 내에서는 하나의 국가 내에서는 동명이인이 없는 한 하나의 발명자 명의가 대응된다. 이때, 미국 등에서는 발명자 명의에 구두점이 들어가는 경우가 있는데 구두점은 무시하는 방식으로 발명자 명의를 대표명화 한다. 한편, 하나의 출원인이 대기업일 경우, 동일한 이름을 사용하는 다른 발명자(동명이인)이 있을 수 있는데, 이 경우에는 주소 정보를 활용하여 동명이인을 구분시킬 수 있다.
하나의 국가 내에서 조직을 초월한 대표명화는 발명자 명칭과 주소 정보를 활용하여 대표명화를 수행한다. 이때, 발명자 등이 이사 등을 하여 주소가 변동될 수도 있지만, 그 발명자가 동일한 조직 명칭 스템 내에 존재하는 자라는 동일한 발명자로 취급한다. 즉, 하나의 발명자에는 하나 이상의 코드(조직 명칭 스템 기준 코드, 국가 단위 코드, 국가를 초월한 코드 등)가 대응되어 있는데, 하나의 국가 내에서라도 그 코드에 대응되는 발명자의 식별 정보는 2개 이상("발명자 명의(조직 명의 스템 a)+주소 A", "발명자 명의(조직 명의 스템 a) + 주소 B" 등)이 있을 수 있다.
한국어로 된 발명자가 발명한 특허 출원이 미국에도 출원되는 경우, 2 이상의 언어로 표기되는 발명자 명칭의 대표명화가 필요하게 된다. 이때, 우선권 주장 번호 등을 키값으로 하여, 2개 이상의 국가에서 문건의 동일성을 유지시키며, 동일성이 인정되는 문건을 기준으로 한글 명칭과 영어 명칭을 매칭시킨다. 맵핑의 방법은 제 1국(한국)에서 발명자의 영어 표기를 알 수 있는 경우에는 그 정보를 이용하여 맵핑시킨다. 제 1국에서 영어 표기를 알 수 없는 경우에는 1) 그 특허 문건에서 발명자가 1인이면 그냥 맵핑시키고, 2인 이상일 경우에는 한글-로마자 변환 등과 같은 언어 변환 규칙을 활용하여 가장 최적 매칭되는 발명자부터 먼저 매칭시킨다. 이러한 매칭은 특정 발명자가 포함된 동일한 조직 명칭 스템 가지는 모든 출원에 대하여 적용할 수 있다.(즉, 제1국과 제2국에 동시에 출원된 #1, #2 문건이 있을 때, #1 문건에는 3명의 발명자(A, B, C)가 있고, #2 문건에는 1명의 발명자(A)가 있다면, 발명자 A에 대해서는 #2 문건으로 먼저 처리하는 할 수 있으며, 발명자 B, C에 대해서도 다른 문건에서 구별할 수 있는 단서가 있다면 그 단서를 먼저 활용하여 하나를 제거하면 다른 하나는 자동적으로 #1에서 한글 표기와 영어 표기를 맵핑시킬 수 있게 된다.)
상기와 같이 대표명화 된 발명자는 본 발명의 대표명화 된 발명자 명칭 DB에 저장되며, 상기 대표명화 된 발명자 명칭 DB에는 식별 코드, 각 국가별 표기가 포함된다.
이어, 대리인 대표명화 전처리 모듈(301-4-1-3)에 대해서 설명한다. 통상적으로 대리인은 1개의 국가 내에서 대표명화를 하면 충분하며, 복수개의 국가에서 활동하는 경우 출원인에 준하여 처리하면 된다. 만약 대리인이 법무법인 등과 같은 조직인 경우에는 상기에서 설명한 자연인이 아닌 조직 출원인(출원인 명의를 조직 명칭 스템과 조직 유형 표기로 구분할 수 있는 경우)과 완전히 동일하게 취급할 수 있다. 한편, 조직이 아닌 경우에는 다수의 자연인인 대리인 명의가 표시되는데, 이 경우 그 대리인들이 하나의 사무소 조직(예를 들면 대한민국의 경우 민법상 조합이 되며, 조합의 경우 조합의 명칭이 아니라 조합의 구성원의 명의로 표기된다.)에 속하느냐가 중요하게 된다. 이때, 사무소 조직은 익명의 추상적 출처(하나의 코드를 대응시킬 수 있으면 충분하고, 굳이 사무소의 명칭까지 확정될 필요가 없어도 되는 도)를 표시할 수 있으면 된다. 하나의 사무소 조직을 구성하는 다수의 대리인이 어떤 출원의 경우에는 모두 다 기재되어 있으며, 어떤 출원에는 여러 방식으로 선택되는 몇 명만 기재되어 있을 수 있으며, 어떤 경우에는 1인만이 기재되어 있을 수 있다. 이러한 경우, 하나의 추상적 출처로서의 사무소 조직 코드에 누구누구를 할당할 것인지가 문제가 되는데, 이 문제를 해결하는데는 데이터마이닝의 통상적 기술인 association 알고리즘, apriori 등과 같은 빈발패턴, 연관성, 상관성 처리 알고리즘을 적용하거나, 다양한 공개된 군집화 알고리즘을 적용할 수 있다. 즉, 상기 와 같은 알고리즘은 다수 공개되어 있으며, 이러한 알고리즘이 동작하는 원리를 간단히 설명하면 다음과 같다. 각 문건에 나오는 각 대리인들의 실제 발생한 조합을 분석하여, 특정 대리인을 기준으로 이 대리인과 함께 빈발하는 확률이 높은 대리인을 찾으며, (특정 대리인, 빈발 대리인)쌍이 존재하는 빈도와 확률을 계산하는 방식으로 처리한다. 한편, 군집화(clustering)은 각 대리인들 사이의 거리(distance)를 계산하는 방식으로 평균 거리가 기설정된 거리 내에 들어오는 대리인들의 집합을 하나의 군집으로 처리한다. 즉, 하나의 문건에 동시에 존재하는 대리인들 사이에는 경우에는 그 문건에 대하여 기설정된 최소 거리를 부여하고, 이러한 거리를 특정 문건 집합에 속하는 모든 문건을 대상으로 모든 대리인에 대하여 거리를 계산하는 방식으로 특정 대리인에 대하여 평균 거리가 기설정된 기준 내로 들어가는 대리인 군집을 찾아낼 수 있으며, 그 군집에 속하는 대리인에 하나의 추상적 출처로서의 코드를 부여할 수 있다.
상기와 같이 처리하여 대표명화 된 대리인에 대한 처리는 본 발명의 대리인 대표명화 전처리 모듈(301-4-1-3)에서 수행하며, 처리된 정보는 대표명화 된 대리인 명칭 DB에 저장된다.
대표 어구 추출 전처리 모듈
대표 어구의 개념
이어서, 본 발명의 대표 어구 추출 모듈에 대해서 설명한다. 먼저 대표 어구의 개념에 대해서 설명한다. 대표 어구(Representing Phrase)란 상기 대표 어구를 통해서, 특정한 문건 전체 또는 상기 특정한 문건의 일부분을 대표할 수 있는 단어 또 는 2 이상의 단어로 구성되는 어구를 말한다. 본 발명의 대표 어구가 가지는 기본적인 속성은 주어지는 기설정된 대표 어구 추출 전체 문건 집합에서는 상당히 희박하게 나오면서, 주어지는 기설정된 대표 어구 추출 목표 문건 집합(1개의 대표 어구 추출 목적 문건을 포함한다) 또는 대표 어구 추출 목적 문건의 일부분 또는 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분에서는 기설정된 기준 이상으로 빈번하게 나오는 것이다.
상기 기설정된 대표 어구 추출 전체 문건 집합의 종류에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합 등이 그 예가 될 것이다.
한편, 상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합의 임의의 부분 집합(문건 1개에서부터 적어도 하나 이상의 특정한 속성(예를 들면 IPC 등의 특정한 특허 분류 기호, 출원인, 기간, 국가, 대리인 또는 발명자 또는 이들의 하나 이상의 조합 등)이 공통되는 문건들로 이루어진 부분 집합)이 될 수 있다.
다.
상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합과 상대적인 개념으로, 상기 대표 어구 추출 전체 문건 집합의 부분 집합이면 충분하나, 가급적 그 부분 집합의 크기는 작을수록 좋다. 상기 대표 어구 추출 목표 문건 집합의 예로는 1) 특정 출원 1개, 특정 기업의 모든 출원, 특정 발명자의 출원, 특정 발명자의 특정 IPC의 출원, 특정 기업의 특정 IPC의 모든 출원, 특정 IPC의 특정 연도의 모든 출원 등이 그 예가 될 것이다.
한편, 대표 어구 추출 목적 문건의 일부분의 예로는 특허 청구 범위, 특허 청구 범위 중의 독립항, 특허 청구 범위 중의 종속항, 발명의 효과나 산업상 이용 가능성, 요약 등이 그 예가 될 것이다. 한편, 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분은 상기 대표 어구 추출 목표 문건 집합을 구성하는 모든 문건의 전술한 특허 청구 범위 등이 될 것이다.
상기 대표 어구는 1) 명사만으로 구성되는 어구, 2) 명사와 동사만으로 구성되는 어구, 3) 형용사나 부사까지 포함되어 형성되는 어구가 있을 수 있다. 상기 대표 어구의 길이는 단어수를 기준으로 할 때 1~5개가 바람직하며, 2~3개가 더욱 바람직하다. 통상적으로 기술적 개념이 1개의 단어로 생성되기도 하지만, 많은 경우 2~3개의 단어로 기술적 개념 또는 기술적 작용 또는 효과를 구성하는 것이 많기 때문이다.
그리고, 상기 대표 어구 추출 목표 문건 집합은 상기 대표 어구 추출 전체 문건 집합과 상대적인 개념으로, 상기 대표 어구 추출 전체 문건 집합의 부분 집합이면 충분하나, 가급적 그 부분 집합의 크기는 작을수록 좋다. 상기 대표 어구 추출 목표 문건 집합의 예로는 1) 특정 출원 1개, 특정 기업의 모든 출원, 특정 발명자의 출원, 특정 발명자의 특정 IPC의 출원, 특정 기업의 특정 IPC의 모든 출원, 특정 IPC의 특정 연도의 모든 출원 등이 그 예가 될 것이다.
한편, 대표 어구 추출 목적 문건의 일부분의 예로는 특허 청구 범위, 특허 청구 범위 중의 독립항, 특허 청구 범위 중의 종속항, 발명의 효과나 산업상 이용 가능성, 요약 등이 그 예가 될 것이다. 한편, 기설정된 대표 어구 추출 목표 문건 집합의 각 문건의 공통된 일부분은 상기 대표 어구 추출 목표 문건 집합을 구성하는 모든 문건의 전술한 특허 청구 범위 등이 될 것이다.
이어, 상기 대표 어구 추출 과정을 상세히 설명한다. 상기 대표 어구 추출은 본 발명의 대표 어구 추출 전처리 모듈이 수행한다. 상기 본 발명의 대표 어구 추출 전 처리 모듈에는 1) 각 언어별 형태소 분석 엔진(analyzer), 2) 어구 생성 엔진, 3) 어구별 카운팅 엔진, 4) 시소러스 사전을 비롯한 각종 사전 데이터베이스, 5) 대표 어구 추출 엔진을 포함한다. 상기 대표 어구 추출 전처리 모듈의 구성은 도 8에 잘 나타나 있다. 대표 어구를 추출해 내는 알고리즘을 포함하고 있는 대표 어구 추출 전처리 엔진(3710), 대표 어구를 추출하는 기준이 되는 정책에 관한 정보를 포함하고 있는 대표 어구 추출 정책 DB(3730), 대표 어구가 추출되었을 때 각 대표어구에 대한 빈도값 등의 각종 카운팅 또는 계산 정보 및 대표 어구가 어느 문건의 어느 위치(필드 등)에서 나왔는지에 관한 정보를 포함하고 있는 대표어구-빈도-출원번호 대응 DB(3750)가 포함되어 있다. 한편, 동의어나 유의어의 처리를 위한 시소러스 DB(3770) 및 2종 이상의 언어의 처리를 위한 번역 시스템을 활용하거나, 기번역된 사전을 이용하여 대표 어구에 대한 번역 정보를 포함하고 있는 대표 어구 번역 DB(3790)가 더 포함되어 있을 수 있다. 이하, 본 발명의 대표 어구 추출 전처리 엔진에 대해 더욱 상세하게 설명한다.
형태소란 단어(어절)을 구성하고 있는 최소한의 언어 요소라고 할 수 있다. 가장 쉽게 생각할 수 있는 것이 '''명사''', '''대명사''', '''수사''' 등의 체언, '''형용사''', '''동사''' 등의 '''용언''', '''부사''', '''관형사''', '''감탄사''' 등의 독립언, '''조사''', '''어미''', '''선어말어미''', '''접사''' 등의 기능어가 있다. 형태소는 실질적인 의미를 가지고 있는 실질형태소와 기능적 요소를 담당하고 있는 기능형태소로 크게 양분되며, 색인어 추출을 위한 형태소 분석 시 이 둘을 분리하는 과정이 우선시 된다. 한마디로 형태소는 더 이상 별개의 의미나 기능 으로 분리할 수 없는 최소한의 언어 요소라고 보면 될 듯 하다. 형태소 분석 엔진이 가져야 할 기능은 크게 문자열 유형의 파악 및 이에 따른 분리 과정, 전자사전의 탐색 기능, 각종 규칙 연산(체언 판단, 용언 판단, 품사 전이 판단 등), 복합명사 처리 등이다. 각 언어별 형태소 분석 엔진은 공지의 기술이므로, 그 작동 방법에 대해서는 생략한다. 상기 형태소 분석 엔진은 주어지는 문장 또는 어구에 대하여 형태소 별로 분석하여, 실질 형태소들을 출력한다.
상기 본 발명의 어구 생성 엔진은 상기 출력된 실질 형태소를 입수 받아, 상기 실질 형태소 단위로 1~5개(바람직하게는 2~3개)의 실질 형태소 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 실질 형태소들을 형태소 별로 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 abc, bcd, cde, def, efg 라는 실질 형태소별 어구를 생성한다. 상기 어구 생성 엔진은 주어지는 문건 또는 문건 부분에 대하여 문장 단위로 어구를 생성한다. 문건 부분에 대하여 어구를 생성하는 것의 일례로는 특허 청구 범위에 나오는 문장들을 대상으로 하여 상기 어구를 생성할 수 있을 것이다. 상기 배열의 생성 방법은 1) 하나의 문장 단위로 처리하되, 하나의 문장에서 추출된 실질 형태소가 n개 있을 때, 상기 n개의 어구에 대한 nC2, nC3, nC4, nC5로 하여 어구를 생성하는 방법(예를 들면, nC2가 적용될 때, 상기 어두들은 ab, ac, ad, ae, af, ag, bc, ...fg가 생성된다.), 2) 문건 단위에서 m개의 실질 형태소가 있을 경우, 문건 단위에서 상기 1)의 방법을 적용하는 방법, 3) 순차적으로 2~5개의 실질 형태소로 배열하는 방법(예를 들면, 2개의 실질 형태소가 순차적으로 배열된다고 할 때는 ab, bc, cd, de, ef, fg가 되며, 3개의 실질 형태소가 배열된다고 할 때는 abc, bcd, cde, def, efg가 된다. 물론, 2개 및 3개의 실질 형태소의 배열 모두를 사용할 수도 있을 것이다.)
한편, 상기 형태소 분석기를 통과한 상기 실질 형태소는 텀(term)이라고도 명명하기도 한다. 상기 실질 형태도 또는 텀은 상기 형태소 분석기에서의 세팅값에 따라서 달라질 수 있다. 이때, 상기 세팅값의 예로는 1) 체언만 분리함, 2) 용언만 분리하되, 대표형만 추출함, 3) 형용사나 부사의 경우 대표형만 추출함 등이 그러한 예가 될 수 있다.
이어, 상기 어구별 카운팅 엔진은 상기 생성된 각 어구별로, (어구, 문건번호) 또는 (어구, 카운팅값) 정보를 필수적으로 생성하며, 바람직하게는 (어구, 카운팅값, 문건 번호) 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명(예를 들면 특허 청구 범위)) 정보를 생성하며, 더욱 바람직하게는 (어구, 카운팅값, 문건 번호, 문건 상의 위치필드명(예를 들면 특허 청구 범위)) 정보를 생성한다. 상기 어구별 카운팅 엔진은 대표 어구 DB(207-2)에 상기 생성한 정보를 저장한다. 하기 표 11은 상기 대표 어구 DB(207-2)에 포함되는 데이터의 일예를 나타낸다. 하기 표 11에 나타난 예는 국가별로 특정 어구에 대해서 생성되는 데이터의 일예를 보여주고 있다.
[표 11]
어구 ID 어구 어구 단어수 문서내 누적 카운팅값(문건 번호 기준) 국가 코드 문건 번호 어구 위치 ... "어구 절대 ID"
1 abc 3 1 KR 10-2003-0012345 특허청구범위 1
1 abc 3 2 KR 10-2003-0012345 특허청구범위 2
1 abc 3 3 KR 10-2003-0012345 발명의 상세한 설명 3
1 abc 3 4 KR 10-2003-0012345 발명의 상세한 설명 4
1 abc 3 5 KR 10-2003-0012345 발명의 상세한 설명 5
1 abc 3 6 KR 10-2003-0012345 발명의 상세한 설명 6
1 abc 3 7 KR 10-2003-0012345 발명의 상세한 설명 7
2 bcd 3 1 KR 10-2003-0012345 특허청구범위 8
2 bcd 3 2 KR 10-2003-0012345 특허청구범위 9
2 bcd 3 3 KR 10-2003-0012345 특허청구범위 10
2 bcd 3 4 KR 10-2003-0012345 발명의 상세한 설명 11
2 bcd 3 5 KR 10-2003-0012345 발명의 상세한 설명 12
2 bcd 3 6 KR 10-2003-0012345 발명의 상세한 설명 13
2 bcd 3 7 KR 10-2003-0012345 발명의 상세한 설명 14
... ... ... ... ... ... ... ...
1 abc 3 1 KR 10-2003-0056789 특허청구범위 150
1 abc 3 2 KR 10-2003-0056789 발명의 상세한 설명 151
1 abc 3 3 KR 10-2003-0056789 발명의 상세한 설명 152
... ... ... ... ... ... ... ...
상기 표 11에 나와 있는 데이터는 특허 문건 10-2003-0012345 및 10-2003-0056789으로 생성된 것임을 알 수 있으며, 어구 생성 엔진은 3개의 실질 형태소 단위로 어구를 생성했음을 알 수 있다. 그리고, 상기 10-2003-0012345에서 상기 어구 abc는 특허 청구 범위에서 2회, 발명의 상세한 설명에서 5회가 나왔음을 알 수 있다. 또한, 어구 bcd는 특허 청구 범위에서 3회, 발명의 상세한 설명에서 4회가 나왔음을 알 수 있다. 또한, 어구 abc는 특허 문건 10-2003-0056789에서 특허청구범위에 1회, 발명의 상세한 설명에서 2회가 나왔음을 알 수 있다. 그러므로, 본 발명의 어구별 카운팅 엔진은 반복적으로 또는 재귀적으로 입수되는 모든 특허 문건에 대하여 상기 표 11과 같은 데이터를 생성할 수 있다. 아울러, 상기 어구 생성 엔진은 2개의 실질 형태소 단위로 어구를 생성할 수 있을 것이며, 상기 2개의 실질 형태소 단위로 생성되는 어구에 대하여, 본 발명의 어구별 카운팅 엔진은 상기 표11과 같은 데이터를 생성할 수 있음은 자명하다 할 것이다. 나아가 1개 또는 4~5개의 실질 형태소 단위로도 상기 어구별 카운팅 엔진은 상기 표 11과 같은 데이터를 생성할 수 있을 것이다.
이때, 상기 어구별 ID를 생성하는 것이 문제시 될 수 있는데, 상기 어구별 ID를 생성하는 방법은 통상적인 DB 기술에서 자명한 것이나, 몇 가지 예시적인 방법을 제시한다. 첫째 방법은, 최초로 생성되는 어구에 대하여 순차적으로 ID를 부여하고, 다음으로 생성되는 어구에 대하여 기존에 있던 어구를 검색하여 없으면 새로운 ID 를 부여하고, 있다면 기존의 ID를 부여한다. 이러한 과정을 모든 입수되는 어구마다 반복 또는 재귀적으로 수행한다. 둘째 방법은 어구에 대한 ID 부여 없이 입수되는 모든 어구에 대하여 순차적으로 임시 ID를 부여하여 상기 표11과 같은 데이터를 생성한 다음, 각 어구마다 하나씩 읽으면서 동일 어구에 대해서 동일한 정식 ID를 부여하며, 이러한 과정을 모든 정식 ID가 부여되지 않은 어구들을 대상으로 반복적으로 또는 재귀적으로 수행한다.
그리고, 본 발명의 상기 어구별 카운팅 엔진은 매 어구가 생성되어 처리될 때마다 어구 절대 ID를 생성하여 모든 어구마다 부여할 수 있다.
또한, 본 발명의 어구별 카운팅 엔진은 목표 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있다. 상기 목표 문건 집합에는 상기 표와 같이 하나의 문건을 기준으로 누적 카운팅 값을 계산할 수도 있으며, 하나의 문건 내의 특정한 필드(예를 들면 특허 청구 범위)로도 누적 카운팅이 가능함은 자명할 것이다.
또한, 본 발명의 어구별 카운팅 엔진은 전체 문건 집합을 기준으로 한 각 어구별 누적 카운팅 값을 생성할 수 있으며 상기 표 12와 같은 방식으로 저장할 수도 있을 것이다.(상기 예에서 전체 문건 집합을 특허 문건 10-2003-0012345 및 10-2003-0056789로 가정하고, 수치를 상기 표 기준으로 입력하였으며, 실제로는 훨씬 더 큰 전체 문건 집합을 대상으로 본 발명 사상이 적용된다.)
[표 12]
어구 ID 어구 누적 카운팅값(전체 문건 집합 기준) 관련 어구 절대 ID
... ... ... ... ... ... ... ...
1 abc 10 1, 2, 3, 4, 5, 6, 7, 150, 151, 152
2 bcd 7 8, 9, 10, 11, 12, 13, 14
... ... ... ... ... ... ... ...
또한, 본 발명의 어구별 카운팅 엔진은 문건 상의 특정 필드(예를 들면 특허 청구 범위 등)를 기준으로 하기 표 13과 같이 한 각 어구별 누적 카운팅 값을 생성할 수 있다.
[표 13]
어구 ID 어구 누적 카운팅값(특허청구범위기준) 관련 어구 절대 ID
... ... ... ... ... ... ... ...
1 abc 3 1, 2, 150
2 bcd 3 8, 9, 10
... ... ... ... ... ... ...
.........어, 본 발명의 대표 어구 추출 엔진에 대해서 설명한다. 대표 어구 추출 전체 문건 집합에서 추출한서 (어구, 문건 번호) 데이터가 있는 경우, 상기 데이터로 하기 표 14와 같은 (어구, 카운팅값, 문건 번호) 데이터가 생성하는 것은 용이 할 것이다. 상기 (어구, 카운팅값, 문건 번호) 데이터는 동일한 어구가 있을 경우, 카운팅 값을 1씩 증가시켜 주는 방법으로 생성될 수 있을 것이다. 되었을 때, 본 발명의 대표 어구 추출 엔진은 (어구, 문건 번호) 데이터를 기초로 하여, (어구, 카운팅값, 문건 번호)을 생성할 수 있으며, (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터로, (어구, 카운팅값, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다. 상기와 같은 과정은 적어도 하나 이상의 대표 어구 추출 목표 문건 집합에 속하는 모든 문건에 대하여 수행할 수 있을 뿐만 아니라, 상기 대표 어구 추출 목표 문건 집합의 모집합이 되는 적어도 하나 이상의 대표 어구 추출 전체 문건 집합에 대해서도 수행할 수 있을 것이다.
대표 어구 추출 엔진은 대표 어구 추출 전체 문건 집합의 예로서 1) 1개 국가 DB에 속하는 모든 문건, 2) 주어진 적어도 하나 이상의 특허 분류 기호에 대응되는 모든 문건, 3) 특정한 출원인에 대한 모든 문건, 4) 특정한 발명자에 대한 모든 문건 또는 5) 이들 각각에 기간을 한정하여 생성되는 모든 문건, 또는 6) 이들 각각을 조합(합집합, 차집합, 교집합 등의 임의의 집합 연산을 포함한다)하여 생성되는 모든 문건에 대해서도 (어구, 문건 번호) 데이터 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다. 한편, 상기 대표 어구 추출 전체 문건 집합의 임의의 부분 집합에 대응되는 모든 문건에 대해서도 (어구, 문건 번호) 데이터 또는 (어구, 문건 번호, 문건 번호상의 위치 필드명) 데이터를 생성할 수 있을 것이다.
이때, 상기 대표 어구 추출 엔진은 적어도 하나 이상의 대표 어구 추출 전체 문건 집합 각각에 대하여 기설정된 적어도 하나 이상의 대표 어구 추출 목표 문건 집합에 대하여 각 어구 별로 1) 대표 어구 추출 목표 문건 집합에서의 빈도(frequency F) 및 2) 상기 대표 어구 추출 목표 문건 집합의 모집합이 되는 대표 어구 추출 전체 문건 집합에서의 빈도(total frequency, T)를 계산할 수 있을 것이다. 한편, 상기 대표 어구 추출 전체 문건 집합에서 어구 총수(All frequency, A)를 계산할 수 있음은 물론이며, 상기 대표 어구 추출 목표 문건 집합에서의 어구 총수(All frequency of target set, AT)를 계산할 수 있음도 물론이다 하겠다.
이때, 상기 대표 어구 추출 엔진은 대표 어구 추출 정책 DB를 참조하여 주어진 대표 어구 추출 전체 문건 집합에서 주어진 대표 어구 추출 목표 문건 집합의 대표 어구를 추출한다. 이때, 상기 대표 어구 추출 정책은 기설정된 조건 하에서 (어구, 어구의 확률값)에서 상기 어구의 확률값이 기설정된 기준 범위에 포함되는 지의 여부가 될 수 있다. 상기 확률값의 예로는 특정 어구별로의 F/T, F/A, F/AT값이 될 수 있을 것이다. 한편, 상기 대표 어구 추출 정책은 1) F, T, A, AT 값의 변동값(증감율, 증감속도), 2) F/T, F/A, F/AT의 변동(증감율, 증감속도)값이 기설정된 기준 범위를 만족하는 지도 될 수 있을 것이다. 이때, 상기 어구 추출 정책의 기설정된 조건은 기간별, 국가별, 출원인별, 발명자별, 또는 적어도 하나 이상의 특허 분류 기호 별 또는 기설정된 속성을 공유하는 문건 집합별로 상기 (어구, 어구의 확률값)에서 상기 어구의 확률값에 다른 기준 범위의 값을 대응시킬 수 있을 것이다. 상기 예를 들면, 특허 출원이 많은 IPC H 섹션에서 추출된 어구에 대한 확률값과 특허 출원인 적은 IPC D 섹션에서 추출된 어구의 확률값은 다르게 적용될 수도 있다는 것이다. 물론, 1) F, T, A, AT 값의 변동값(증감율, 증감속도), 2) F/T, F/A, F/AT의 변동(증감율, 증감속도)값에도 상기 어구가 추출된 문건 집합(대표 어구 추출 전체 문건 집합, 대표 어구 추출 목표 문건 집합)의 속성에 따라 유동적으로 다른 기준이 적용될 수 있을 것이다.
이하, 간략한 표로써 본 발명의 대표 어구 추출의 개념을 설명한다. 본 발명의 대표 어구 추출 엔진은 1) 전체 어구들의 출현 개수(frequency) 기준으로, 어구 ID별로 확률값(=특정 어구의 출현 개수/전체 어구 수)을 대응시키고, 기설정된 확률값 범위에 해당하는 어구들을 후보 대표 어구로 선정하고, 기설정된 대표 어구 선발 규칙을 참조하여, 목표 문건 집합별로의 대표 어구를 선정한다. 상기 출현 개수는 상기 각 특정 필드별로 계산될 수 있음은 자명할 것이다. 하기 표 14와 같은 예에서는 문건 번호별로 각 어구별 출현 개수를 카운팅하여 기설정된 대표 어구 추출 정책에 부합하는 상기 문건 번호별로 대표 어구를 추출할 수 있을 것이다.
[포 14]
구I어구 대표 어구 추출 목표 문건 집합문건에서의 출현개수(F)(frequency) 문건 번호 대표어구추출 전체 문건 집합에서의 출현개수(T) F/T(%)출현개수/전체 출현개수(%) T/A전체에서의 출현개수/전체 어구 총수(10억)(%) 어구 총수(A)
abc 40 #1 80000 0.05 0.008 1,000,000,000
abc 2 #2 80000 0.0025 0.008
abc 200 #3 80000 0.25 0.008
bcd 8 #1 200 4 0.00002
bcd 100 #2 200 50 0.00002
bcd 2 #4 200 0.1 0.00002
cde 15 #1 3000 0.5 0.0003
cde 100 #4 3000 3.3 0.0003
상기 표 14에서 알 수 있듯이, 모든 어구마다 이와 1:1로 대응되는 어구 절대 ID가 있을 것이다. 그러므로고, (어구, 문건 번호) 데이터는 (어구 절대 ID, 어구, 문건 번호) 데이터와 본질적으로 대등하다. 각 어구 절대 ID마다 어구 ID가 대응되며, 각 어구 절대 ID마다 상기 어구가 나온 문건 번호가 대응되어 있으며, 각 문건 번호 마다 서지 사항이 대응되어 있다. 그러므로, 상기 표 14의 문건 번호 및 문건 번호별 상기 어구 ID별 출현 개수를 입수하는 것은 목표 문건 집합의 한 예를 문건 번호로 하는 것일 수 있다. 마찬가지로, 상기 문건 번호 자리에 기설정된 레벨의 IPC가 대응될 수도 있으며, 특정한 출원인 또는 특정한 발명자 등이 대응될 수 있으며, 각 경우마다 각 목표 문건 집합별 어구 ID별 출현 개수를 카운팅할 수 있을 것이다. 상기 목표 문건 집합별 어구 ID별 출현 개수를 카운팅하는 것은 DBMMS에서는 테이블별 조인(join) 명령을 통해서 할 수 있을 것이다.
이때, 예를 들어, 상기 대표 어구 추출 정책 DB에 있는 상기 대표 어구 추출 정책을 이루는 한선발 규칙이 1) 전체 어구 개수 대비(예를 들면 10억 개) 전체에서의 출현개수(T)가 1/1000% 미만이고, 2) 목적하는 문건 번호에서의 출현 개수가 1/1,000,000% 이상이며, 3) 출현개수/전체 출현 개수(%)가 10%에서 1%이라고 할 때, 각 어구로 각 문건 번호의 대표 어구가 될 수 있는지를 검토한다. 어구 abc는 문건 번호 #1 내지 #4 어느 것에도 대표어구가 될 수 없고(조건 1) 위반), 어구 bcd는 문건 번호 #2에서만 상기 문건 번호를 대표하는 어구가 될 수 있으며,(문건 번호 1 및 문건 번호 4에서는 조건 2)위반), 어구 cde는 문건 번호 #4에서만 대표어구가 될 수 있다(문건 번호 1에서는 조건 3) 위반) 그러므로, 문건 번호 #1의 대 표 어구에는 상기, abc, bcd, cde는 포함되지 않으며, 문건 번호 #2의 대표 어구에는 bcd가 포함될 수 있으며, 문건 번호 #3에 대해서는 상기 어구 abc는 포함되지 않으며, 문건 번호 #4에 대해서는 어구 cde가 포함될 수 있게 된다.
상기와 같은 방법으로 본 발명의 대표 어구 추출 전처리 모듈은 검색 엔진의 인덱서(401-3) 및 상기 인덱스를 활용하여 어구별 카운팅 데이터를 생성할 수 있으며, 상기 어구별 카운팅 데이터를 바탕으로 하여 전술한 바와 같은 방식으로 문건별, 기설정된 문건 집합별, 특정 필드별 내용, 또는 기설정된 문건 집합에서 추출된 모든 특정 필드별 내용에서 대표 어구를 추출할 수 있게 된다. 예를 들면, 윗 문단에서 상기 문건 번호 #2에 대표 어구에는 bcd를 대응시킬 수 있게 된다. 이어, 대표 어구 추출 목표 문건 집합별로 대표 어구가 추출되었다면, 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건 단위로 저장될 수 있다. 즉, 하나의 대표 어구 추출 목표 문건 집합 단위 또는 상기 개별 문건에는 적어도 하나 이상의 대표 어구가 대응될 수 있다. 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합의 개별 필드 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건의 개별 필드 단위로 적어도 하나 이상이 대응될 수 있을 것이다. 예를 들면, 상기 문건 번호 #2에 어구 bcd를 대응시켜 저장할 수 있게 된다. 이때, 상기 #2를 호출하였을 때, 상기 어구 bcd를 표시하여 줄 수 있게 된다.
이때, 특정한 문건 번호에 대하여 너무 많은 대표 어구가 할당될 수 있게 된다. 즉, 특정한 문건에 대하여는 상기 예로 든 조건을 충족하는 대표 어구가 100개가 될 수도 있으며, 이 경우, 4) 각 대표 어구마다 계산되는 출현 빈도(frequency)가 높은 순으로 10개 내지 30개의 대표 어구를 추출하는 규칙을 적용하여, 대표 어구의 개수를 제한할 수 있다. 한편, 특정한 문건에 대해서는 대표 어구가 1개 내지 없을 경우가 발생할 수 있는데, 이 경우에는 상기 예로든 조건에서 조건 3)을 완화하여 적용하여, 대표 어구의 숫자를 10개 내지 30개로 유지할 수 있을 것이다.
상기와 같은 과정을 모든 문건 내지는 모든 문건 집합에 대하여 반복적으로 수행하면, 모든 문건에 대하여 기설정된 개수 범위(예로 들면 10개 내지 30개)의 대표 어구를 대응시켜 놓을 수 있을 것이다. 그러므로, 상기와 같은 과정을 통하여 상기 문건 번호에 대응되는 대표 어구를 획득할 수 있게 된다. 그리고, 상기 대표 어구 및 상기 대표 어구에 대한 계산값(예로 들면, 상기 문건 번호의 문건에서의 출현개수, 전체에서의 출현개수 등)은 상기 문건 번호에 대한 서지 사항의 한 예로 취급되어 각종 분석에 활용될 수 있다.
상기 실시예에서는 출현 빈도의 계산을 문건 단위로 하였는데, 상기 출현 빈도는 다음과 같은 1) 문건 집합 또는 2) 문건 내부의 필드 단위(특허 청구 범위 등) 또는 3) 문건 집합의 모든 문건 내부의 필드(예를 들면 2000년부터 2005년까지 출원된 대한민국의 IPC H04B 7/02에 모든 문건에 포함된 특허청구범위 중 제 1항)에 포함된 내용을 단위로 하여 계산할 수도 있을 것이다. 이때, 하나의 문건 내부인 경우에는 하나의 문건과 동일하게 취급(문건 번호의 대응 관점)할 수 있을 것이다. 하지만, 2개 이상의 문건 집합의 경우에는 문건 번호의 대응 관계가 없어지는 것처럼 보일 수 있으나 아래 3 가지 방법 중 어느 하나의 방법을 사용하면 이 문제를 용이하게 해결할 수 있을 것이다. 이는 1) 문건 집합에 속하는 개별 문건의 단위로 대표 어구를 추출한 다음, 상기 대표 어구들을 합집합 연산을 수행한 다음, 기설정된 범위(예로 들면 10개 내지 30개)로 대표 어구의 수를 한정하는 방법, 2) 만약 문건 번호별로 대표 어구가 이미 추출되어 있다면 상기 문건 집합에 속하는 문건 번호에 대응되는 대표 어구를 입수해서 합집합 연산을 수행한 다음, 기설정된 범위로 대표 어구의 수를 한정하는 방법, 3) 문건 집합에 속하는 모든 문건을 처리한 다음에 각 어구를 문건 번호가 아닌 문건 집합의 고유 ID에 대응하여 대표 어구를 추출하는 방법 중 어느 하나를 사용할 수 있을 것이다. 상기 3) 문건 집합의 모든 문건 내부의 필드에 포함된 내용 단위일 경우에도 상기 1) 합산 처리 내지 2) 문건 집합 고유 ID 대응 처리 방법이 사용될 수 있을 것이며, 만약 필드 단위로 대표 어구가 마련되어 있다면, 상기 3) 입수 후 합산 처리 방법이 사용될 수 있을 것이다.
상기 대표 어구 추출의 대상이 되는 문건 집합에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 11) 상기 1) 내지 10)으로 특정되는 문건 집합과 직접 또는 간접적으로 인용 또는 피인용 관계에 있는 문건들로 구성되는 문건 집합, 또는 121) 상기 1) 내지 9)에 등록 여부, 심사청구 여부 등과 특정 조건을 결부하는 것으로 생성되는 특허 문건 집합 중 어느 하나 이상이 될 수 있을 것이다.
이하, 형태소 분석 엔진과 연결된 검색 엔진의 인덱서(401-3)(indexer)을 활용하여 상기 대표 어구를 추출하는 방법을 설명한다. 검색 엔진을 사용하는 이유는 상기 검색 엔진은 통상적으로 검색어 값에 대한 개수를 카운팅하는데 뛰어난 성능을 가지고 있기 때문이며, 인덱서(401-3)가 인덱싱해 놓은 데이터를 DB용 데이터로 용이하게 변환할 수 있기 때문이다. 인덱서(401-3)는 입수되는 텀과 상기 텀이 나온 문건 번호 또는 경우에 따라서는 상기 텀이 나온 필드명을 저장한다. 예로 들면, (term 1, #1)은 상기 term 1이 문건 #1에서 입수되었다는 뜻이며, (CL:term 1, #1)은 상기 term 1이 상기 문건 #1의 특허 청구 범위(Claim, CL)라는 필드에서 입수되었다는 뜻이다. 검색 엔진의 인덱스에는 상기 (term 1, #1)이나 (CL:term 1, #1)과 같은 데이터들이 엄청나게 많이 저장되어 있으며, 검색어로 term 1을 넣거나, 검색 필드를 특허 청구 범위로 한정하여 term 1을 입력할 경우, 검색 결과로서 문건 번호 #1을 출력해 준다. 한편, 검색 엔진은 상기 term 1이 전체 문건에서 몇 개가 들어가 있는지, 또는 특허 청구 범위에서 몇 개가 들어가 있는지를 아주 빠른 시간에 처리해 준다.(통상적으로 검색 엔진은 검색 결과의 전체 개수를 먼저 리턴해 주고, 이어서, 전체 개수 중 앞쪽 일부만을 먼저 보여 주는 형태를 취한다.)
이때, 본 발명의 어구 생성 엔진은 상기 형태소 분석 엔진(analyzer)를 통과한 n개의 실질 형태소/텀들을 입수 받고, 상기 입수 받은 n개의 텀들을 기설정된 방식으로 조합하여 조합된 텀들을 상기 문건 번호와 함께 검색 엔진의 상기 인덱서(401-3)에 전송할 수 있다. (이때, 상기 문건 번호를 이미 상기 인덱스가 알고 있는 경우에는 굳이 문건 번호까지 전송할 필요가 없다. 이해의 편의상 전송되는 조합된 텀의 출처로서의 문건 번호를 포함하여 전송한다고 한다.) 이때, 상기 텀들을 조합하는 방법은 전술한 바과 같이, 1) 1개 문장 단위로 처리하여 1개 문장에서 입수되는 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법, 2) 전체 문건 단위에 포함된 모든 텀을 대상으로 2~5개의 텀별로 모든 가능한 방법으로 조합하여 처리하는 방법(이 경우에는 텀의 조합이 굉장히 커서 처리 시간이 길어지는 문제가 있으나, 가장 정밀한 어구 집합을 생성할 수 있다.), 3) 하나의 문장에서 2~5개의 텀별로 순차적으로 조합하는 방법 중 어느 하나 이상을 사용할 수 있다. 물론, 상기 전체 문건 단위의 처리 방법에는 문단 단위, 특정 필드 단위(특허 청구 범위 등)의 처리 방식도 전술한 바와 같은 대응한 방식으로 취 급될 수 있을 것이다.
예를 들어 설명하면 다음과 같다. 상기 본 발명의 어구 생성 엔진은 상기 출력된 실질 형태소를 입수 받아, 상기 실질 형태소 단위로 1~5개(바람직하게는 2~3개)의 실질 형태소 배열을 생성한다. 예를 들어, 하나의 특허 문건에 포함된 하나의 문장이 입력되었을 때, 상기 출력되는 실질 형태소들을 형태소 별로 순서대로 a b c d e f, g라고 하자. 이때, 상기 어구 생성 엔진의 어구 생성 단위가 3단어일 경우, 상기 어구 생성 엔진은 순차적으로 abc, bcd, cde, def, efg 라는 실질 형태소별 어구를 생성하거나 ab, ac, ad, ae, af, ag, bc,...fg와 같은 2개의 실질 형태소 단위로 어구를 생성할 수 있다.(이에 대해서는 전술한 바와 같다). 이때, 상기 어구 생성 엔진은 상기 abc, bcd 나 ab, ac 등과 같은 어구(=복수 개의 텀들(multiple terms))를 상기 인덱서(401-3)에 전송한다. 인덱서(401-3)는 전송받은 어구(복수개의 텀들)들을 (abc, #1), (bcd, #1), (ab, #1), (ac, #1) 등과 같이 저장한다. 이때. 만약 필드들이 한정되는 경우라면, (CL : abc, #1), (CL : bcd, #1), (CL : ab, #1), (CL : ac, #1)과 같이 상기 어구(복수 개의 텀들)이 나온 구체적인 필드명까지 포함하여 인덱스(index)로 저장한다. 하기 표 15는 인덱스의 일 예를 보여 개념적인 테이블이다.
[표 15]
어구 문건 번호 필드
abc #1 D
abc #1 D
abc #1 D
abc #1 C
abc #1 C
bcd #1 D
bcd #1 C
ac #1 D
abc #2 D
abc #2 D
abc #2 C
D는 발명의 상세한 설명(description), C는 특허청구범위(claim)을 나타낸다.
상기 표 15에서 어구 abc가 #1번 문건의 발명의 상세한 설명에서 3회가 나타났고, 특허 청구 범위에서 2회가 나타났으며, 상기 어구 bcd가 1번 문건의 발명의 상세한 설명에서 1회가 나타났고, 특허 청구 범위에서 1회가 나타났으며, 상기 어구 ac가 1번 문건의 발명의 상세한 설명에서 1회가 나타났음을 보여 주고 있다. 한편, 어구 abc가 #2번 문건의 발명의 상세한 설명에서 2회가 나타났고, 특허 청구 범위에서 1회가 나타났음을 보여 준다.
이때, 상기 본 발명의 어구별 카운팅 엔진은 상기 인덱스(index)의 데이터를 입수 받아, 상기 어구(복수개의 텀들)별의 개수 및 상기 어구가 나온 출처로서의 문건 번호에 관한 데이터를 생성한다. 상기 생성된 데이터는 전술한 방식으로 생성한 데이터와 동일하거나 대응한 것이며, 상기 인덱스를 대상으로 예를 들면 다음 표 16과 같을 수 있다.
[표 16]
어구 ID 어구 문건 번호 필드 출현회수
1 abc #1 D 3
1 abc #1 C 2
1 abc #2 D 2
1 abc #2 C 1
2 bcd #1 D 1
2 bcd #1 C 1
3 ac #1 D 1
상기와 같은 방법으로 본 발명의 대표 어구 추출 전처리 모듈은 검색 엔진의 인덱서(401-3) 및 상기 인덱스를 활용하여 어구별 카운팅 데이터를 생성할 수 있으며, 상기 어구별 카운팅 데이터를 바탕으로 하여 전술한 바와 같은 방식으로 문건별, 기설정된 문건 집합별, 특정 필드별 내용, 또는 기설정된 문건 집합에서 추출된 모든 특정 필드별 내용에서 대표 어구를 추출할 수 있게 된다.
이어, 대표 어구 추출 목표 문건 집합별로 대표 어구가 추출되었다면, 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건 단위로 저장될 수 있다. 즉, 하나의 대표 어구 추출 목표 문건 집합 단위 또는 상기 개별 문건에는 적어도 하나 이상의 대표 어구가 대응될 수 있다. 상기 대표 어구는 상기 대표 어구 추출 목표 문건 집합의 개별 필드 단위 또는 상기 대표 어구 추출 목표 문건 집합을 이루는 개별 문건의 개별 필드 단위로 적어도 하나 이상이 대응될 수 있을 것이다.
상기 본 발명의 대표 어구 추출 엔진은 어구에 대해서 문건 번호 정보를 함께 생성하는 것으로 설명하였다. 이는 문건 번호가 대응되어 있는 경우, 상기 어구를 대표 어구로 하는 문건 집합을 추출하기 용이하게 하기 위한 목적이 있다. 상기 어구를 대표 어구로 하는 문건 집합을 용이하게 추출할 수 있으면, 상기 문건 집합을 분석 대상 문건 집합으로 하여 다양한 분석을 수행할 수 있다. 예를 들어, "radio frequency identification tag"라는 어구를 대표 어구로 하는 문건 집합에 대하여, 1) 국가별/연도별/출원인별로 출원수/등록수/등록율/점유율/집중율/활동율 등과 같은 다양한 분석 지표 2) 국가별/연도별/출원인별 IPC 또는 기타 특허 분류 기호의 다단계별(depth)별 분포 분석, 3) 이 문건 집합의 세부 문건 집합별(출원인별, 특허 분류 기호별) 인용, 피인용 분석 등과 같이 하나의 문건 집합이 주어졌을 때 본 발명의 분석 모듈 및 특허 인텔리전스 모듈(60)이 지원하는 각종 분석을 수행할 수 있다. 그리고, 어구에 대하여 문건 번호를 대응시켜 놓지 않고, 검색 엔진을 통해서는 특정 어구를 포함하는 문건은 추출하는 경우, 그 특정 어구가 그 문건의 대표 어구인지를 판별할 수 없는 문제가 있다.
상기와 같은 대표 어구 정보 전처리 방법에 대해서는 도 105 내지 도 107에 잘 나타나 있다.
도 105를 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 대표 어구 추출을 위한 실질 형태소를 조합을 생성하는 방법을 간략히 설명한다.
상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5520), 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5530), 상기 추출된 실질 형태소에 대하여 기설정된 기준에 의한 2개 이상의 실질 형태소의 기설정된 방식으로의 가능한 모든 조합을 생성하며(S5540), 상기 생 성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하는(S5550) 방식으로 대표 어구 추출을 위한 실질 형태소를 조합을 생성한다.
도 106을 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 필드별/부분 문건 집합별 대표 어구 추출을 위한 실질 형태소를 조합을 생성하고, 기설정된 조건을 충족하는 실질 형태소의 조합을 추출하는 방법을 간략히 설명한다.
상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 문건 집합을 입수하고(S5620),
상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5630), 상기 추출된 실질 형태소에 대하여 기설정된 기준에 의한 2개 이상의 실질 형태소의 가능한 모든 조합을 생성하고(S5640), 상기 생성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하며(S5650), 상기 문건 집합을 구성하는 각 문건의 서지 사항을 입수하여 적어도 하나 이상의 기준으로 문건 부분 집합을 생성하며(S5660), 상기 문건 부분 집합에 한정된 상기 실질 형태소의 조합의 개수와 상기 문건 (전체) 집합에 속한 상기 실질 형태소의 조합의 개수를 입수하여, 문서 전체 또는 각종 필드별로 기설정된 조건을 충족하는 실질 형태소의 조합을 추출한다(S5670),
도 107을 기준으로 상기 대표 어구 추출 전처리 모듈을 통한 대표 어구 추출을 위한 실질 형태소를 조합을 생성하고, 각 문건 집합별로 비교하는 방법을 간략히 설 명한다.
상기 대표 어구 추출 전처리 모듈은 적어도 2이상의 특허 문건을 포함하는 복수개의 문건 집합을 입수하고(S5720),
각 문건 집합별로 상기 문건 집합에서 추출한 개별 특허 문건 전체 또는 각종 필드별 내용에 대하여 형태소 분석기로 처리하여 2 이상의 실질 형태소(텀)을 추출하며(S5730), 상기 추출된 실질 형태소의 조합을 생성하고((S5740), 상기 생성된 실질 형태소의 조합을 상기 특허 문건 정보를 포함하여 DB에 저장하거나, 검색 인덱서(401-3)에 전송하며(S5750), 상기 실질 형태소의 조합을 기설정된 기준으로 상기 복수개의 문건 집합별로 비교한다(S5760)
복수 특허 분류 기호 관계성 전처리 모듈
하나의 특허 문건에 하나의 특허 분류 기호 체계에 속하는 2개 이상의 특허 분류 기호가 부여되어 있는 문건이 다수 있다. 다. 이러한 경향그리고, 은 1) 1특허 출원 범위의 확대, 2) 발명의 고도화, 3) 기술 융합화의 경향, 4) 특허 분류 기호 부여의 정밀화 등에 따라 하나의 특허 문건에 대하여 복수개의 특허 분류 기호가 부여되는 경향은 더욱 커지고 있다. 하나의 특허 문건에 2개 이상의 특허 분류 기호가 부여 되었다는 것은 그 특허 문건에는 2개 이상의 각 특허 분류 기호에 대응되는 2개 이상의 기술적 관점, 기술적 구성, 기술적 내용, 기술적 측면, 기술적 속성, 기술적 특징 요소와 같은 것들이 포함되어 있다는 것을 의미할 수 있다. 그러므로, 2개 이상의 특허 분류 기호가 부여 되어 있는 문건은 1개의 특허 분류 기호 가 부여된 문건과 달리 취급할 필요가 있게 된다.
본 발명의 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 2개 이상의 특허 분류 기호가 부여된 문건만을 재료로 하여, 복수개의 특허 분류 기호간에 숨어 있는 관계성을 발견하여 활용하는 것을 목적의 하나로으로 한다. 상기 복수 특허 분류 기호 관계성 전처리 모듈은 IPC/UPC/FT 중의 어느 하나만을 기준으로 한(즉, 동일한 종류의 특허 분류 기호를 기준으로 한) 동종의 특허 분류 기호간의 숨어 있는 관계성을 발견하여, 기술의 융합에 대한 정보를 생성하는 것을 목적으로 하는 동종 복수 특허 분류 기호 관계성 전처리 모듈과, 하나의 문건에 IPC, UPC, FT 등 중에서 선택되는 2 이상의 특허 분류 기호가 포함되어 있을 때, 상기 2 이상의 특허 분류 기호간의 관계성을 파악하는 이종 복수 특허 분류 기호 관계성 전처리 모듈을 포함한다. 도 60은 상기 복수 특허 분류 기호 관계성 전처리 모듈의 구성, 동종 복수 특허 분류 기호 관계성 전처리 모듈의 구성 및 이종 복수 특허 분류 기호 관계성 전처리 모듈의 구성을 보여주고 있다.
동종 복수 특허 분류 기호 관계성 전처리 모듈
이하, 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 어느 하나의 문건에 한 종류의 복수개의 특허 분류 기호가 부여되어 있거나, 2종 이상의 특허 분류 기호가 부여되어 있더라도, 선택된 하나의 특허 분류 기호 체계 상의 복수개의 특허 분류 기호들을 처리하는 것을 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한다. 상기 복수개의 특허 분류 기호에 관한 처리를 담당하는 것은 본 발명의 동종 복수 특허 분류 기호 관계성 전처리 엔진이 수행하 며, 상기 수행의 결과는 본 발명의 동종 대표 어구 복수 특허 분류 기호 관계 DB(207-3)에 저장된다.
이론적으로 먼저 설명하고, 이어 구체적인 실례를 들어서 설명한다. 먼저, 가장 단순한 모델로 하나의 문건에 2개의 특허 분류 기호가 포함된 경우에 대한 복수 개의 특허 분류 기호에 대한 관계성 처리 방법을 제시한다. 하나의 특허 문건에 특허 분류 기호 A1와 특허 분류 기호 B1이 부여되어 있다고 가정하자. 이때, 특허 분류 기호 체계 상에서 A1의 직상위 노드(부모 특허 분류 기호)가 A2, A2의 직상위 노드가 A3라고 하며, 이러한 규칙이 계속될 때, A1의 상위 노드는 A2, A3, A4, ... An이 될 수 있다. 마찬가지로 B1에 대해서도, B2, B3, B4, ,Bn을 할당할 수 있게 된다. 이들 An, Bn들 중에서 가장 상위에 있는 것들은 섹션이 된다. 그리고, 섹션 위에는 그냥 IPC 등과 같은 특허 분류 기호 체계명이 있다고 하자. 이렇게 될 때, 상기 An들과 상기 Bn들은 적어도 섹션 또는 IPC라는 특허 분류 기호 체계명 하에서 적어도 하나 이상의 공통 노드를 가지게 된다.(섹션이 다른 등 가장 멀리 떨어져 있어도, IPC라는 동일 분류 기호 체계를 공유한다는 점에서는 일치한다.) 상기 공통 노드 중 상기 특허 분류 기호 체계 상에서 최하위 레벨에 있는 것을 최하위 공통 특허 분류 기호라 명명한다. 이때, A1과 B1의 최하위 공통 특허 분류 기호가 각각 Ai+1와 Bj+1라 하면, Ai+1 = Bj+1가 된다. 상기 주어진 하나의 특허 문건의 내용 상 A1과 B1이 함께 있는 경우, 상기 A1과 B1은 상기 특허 문건에 대하여 관계성을 가진다.(즉, 하나의 특허 문건에 나와 있는 발명 또는 발명들이 A1 및 B1의 속 성을 독자적으로 또는 전체적으로 함께 갖고 있다는 뜻으로서의 관계성을 말한다.) 이때, 특허 분류 기호 체계의 본질 상 A1은 상기 B1의 모든 부모 노드인 B2, B3, ... Bj+)와 관계성을 가진다. 마찬가지로, B1은 A1의 모든 부모 노드인 A2, A3, ...A(i+1)와 관계성을 가진다. 이때, A1과 Bj+1의 관계성은 Bj+1와 Ai+1가 동일하므로, 어짜피 부모 노드이므로, 그 관계성을 논할 필요가 없으며, 모든 A들과 Bj+1(=Ai+1)들의 관계성도 어짜피 부모 노드에 존재하는 것들이므로 별도로 논할 필요가 없다. 즉, 최하위 공통 부모 노드는 관계성 계산 테이블에서 고려하지 않는 것이 바람직할 것이다.
이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 복수개의 특허 문건 기호를 처리할 때, 상기 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 하기 표 17과 같은 데이터를 만들 수 있다. 이때, Ai+1과 Bj+1은 실제 테이블에서는 필요치 않는 셀들(Ai까지와 Bj까지만이 관계성 테이블에 필요함)이나, 설명의 편의(그 셀들에는 값이 없음을 보여 주기 위함)를 위해서 테이블에 표시한다. 즉, 실제 표에서는 Ai, Bj까지만으로 테이블이 구성된다.
[표 17]
A1 A2 Ai Ai+1
B1 1 1 1 1
B2 1 1 1 1
1 1 1 1
Bj 1 1 1 1
Bj+1=Ai+1
즉, 상기 A1 ~ Ai와 B1 ~ Bj사이의 모든 교차되는 쌍(예를 들면 (A1, B1), ... (Ai, Bj) 등)은 상기 주어진 특허 문건을 매개로 하여 관련성 가진다고 할 수 있 다.
대한민국 특허출원 제10-2005-0111868호에는 2006년 01월 자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 예시적으로 설명한다. H04B 7/26의 부모는 차례로 H04B 7/24, H04B 7/00, H04B, H04, H가 된다. H04B 7/15의 부모는 차례로, H04B 7/14, H04B 7/00이 된다. 이 경우, 최하위 공통 특허 분류 기호는 H04B 7/00이 된다. 그러므로, 이를 표로 만들면 하기 표 18과 같다. H04B 7/00과 관련된 셀이 그 셀값이 아무 값도 없음은 위에서 설명한 바와 같다.
[표 18]
H04B 7/26 H04B 7/24 H04B 7/00
H04B 7/15 1 1
H04B 7/14 1 1
H04B 7/00
그러므로, 대한민국 특허출원 제10-2005-0111868호를 기준으로, 9개의 교차되는 특허 분류 기호의 관련성 쌍이 생성되게 된다. 이때, 하나의 문건에 대하여 2 이상의 특허 분류 기호가 존재할 때, 맨 앞에 나오는 것을 주 특허 분류 기호라 하므로, 본 문건에서는 H04B 726이 주 특허 분류 기호가 되고, 상기 주 특허 분류 기호의 부모 노드에 있는 다른 상위 특허 분류 기호도 주어진 특허 문건에서 역시 주 특허 분류 기호로 취급된다. 상기 주 특허 분류 기호가 문제가 되는 것은 하나의 문건에 특허 분류 기호가 3개 이상 있을 때의 취급과 관련하여 중요한 역할을 한다. 특허 분류 기호가 3개 이상 있을 때는 아래와 같이 특허 분류 기호를 처리할 수 있다.
먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합 을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되는 쌍에 관한 정보를 갖고 있다.
다음으로, 주 특허 분류 기호를 정하고, 상기 주 특허 분류 기호를 취하고, 다른 1개는 n-1개의 부 특허 분류 기호에서 취하여 n-1개의 조합을 취한 다음에 각 조합에 대하여 n-1개의 테이블을 얻고, 각 테이블에는 먼저, 모든 특허 분류 기호를 동등하게 취급하는 방법이다. 특허 분류 기호가 n개가 있을 경우, 상기 n개의 특허 분류 기호들 중에서 2개의 특허 분류 기호의 조합을 취하는 방법은 수학적으로 조합 이론에 따라 nC2개가 된다. 이들 nC2개의 각 특허 분류 기호의 조합에 대하여, 상기 특허 분류 기호가 2개일 때의 처리를 수행하고, 그 결과로서 nC2개의 테이블(table)을 얻으며, 각 테이블에는 모든 교차되는 쌍에 관한 정보를 갖고 있다. 이때, 주 특허 분류 기호와 관련되는 교차 쌍에 대해서는 주 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다. 그리고, n-1개의 부 특허 분류 기호에 대하여 n-1C2개의 조합을 얻고, 각 조합에 대하여 상기와 같은 처리를 하여 모든 교차되는 쌍에 관한 정보를 얻는다. 이때, 부 특허 분류 기호와 관련되는 교차 쌍에 대해서는 부 특허 분류 기호와 관련된 가중치를 부여할 수 있을 것이다.
대한민국 특허출원 제10-2006-0012606호에는 2006년 01월 자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호가 있다. 상기 H04B 7/04의 부모 노드는 각각 H04B 7/02, H04B 7/00, H04B, H04, H가 있으며, H04B 7/155의 부모 노드는 각각 H04B 7/15, H04B 7/14, H04B 7/00, H04B, H04, H가 있으며, H04Q 7/30의 부모 노드는 각각 H04Q 7/20, H04Q 7/00, H04Q, H04, H가 있다. 이때, 최하위 공통 특허 분류 기호는 H04B 7/04와 H04B 7/155의 조합에 대한 H04B 7/00이며, H04B 7/155와 H04Q 7/30의 조합에 대해서는 H04이며, H04B 7/04와 H04Q 7/30에 대해서는 H04가 된다.
이때, 모든 특허 분류 기호에 대해 동등하게 취급하면, 아래와 같은 3C2 개수의 테이블이 나온다. 먼저 표 19는 H04B 7/04와 H04B 7/155의 관계성 테이블이다.
[표 19]
H04B 7/04 H04B 7/02 H04B 7/00
H04B 7/155 1 1
H04B 7/15 1 1
H04B 7/14 1 1
H04B 7/00
다음으로 표 20은 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.
[표 20]
H04B 7/04 H04B 7/02 H04B 7/00 H04B H04
H04Q 7/30 1 1 1 1
H04Q 7/20 1 1 1 1
H04Q 7/00 1 1 1 1
H04Q 1 1 1 1
H04
다음으로, 표 21은 H04B 7/155와 H04Q 7/30의 관계성 테이블이다.
[표 21]
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 1 1 1 1 1
H04Q 7/20 1 1 1 1 1
H04Q 7/00 1 1 1 1 1
H04Q 1 1 1 1 1
H04
이때, 이어 가중치를 부여하는 방법에 대해서 설명한다. 가중치의 부여는 크게 2가지가 있다. 첫번째가 위에서 설명한 주 특허 분류 기호와의 관련성 테이블에 더 큰 가중치를 부여하고, 부 특허 분류 기호들 간의 관련성 테이블에 더 적은 가중치를 부여하는 방법이 있다. 예를 들면 주 특허 분류 기호와의 관련성 테이블에는 1을 부여하고, 부 특허 분류 기호와의 관련성 테이블에는 0.5를 부여하는 방법이 있을 것이다.
이렇게 되면 다음으로, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음 표 22와 같이 될 것이다.
[표 22]
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 0.5 0.5 0.5 0.5 0.5
H04Q 7/20 0.5 0.5 0.5 0.5 0.5
H04Q 7/00 0.5 0.5 0.5 0.5 0.5
H04Q 0.5 0.5 0.5 0.5 0.5
H04
두번째는, 복수개의 특허 분류 기호를 가지고 있는 특허 문건에 대한 가중치를 균등하게 부여하는 방법이 있을 것이다. 예를 들면 2개의 특허 분류 기호를 가지고 있을 때는 각 특허 분류 기호의 관련성 쌍의 값이 1이 된다고 할 때, n개의 특허 분류 기호를 가지고 있는 특허 분류 기호의 쌍에 대해서는 그 관련성의 쌍의 값을 가능한 조합의 개수인 nC2를 나눈 값을 균등하게 할당할 수도 있다. 즉, 가중치를 1/(nC2)로 할 수도 있을 것이다. 예를 들면, 이와 같이 할 때, 상기, H04B 7/155와 H04Q 7/30의 관계성 테이블은 다음 표 23과 같은 것이다.
[표 23]
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 1/3 1/3 1/3 1/3 1/3
H04Q 7/20 1/3 1/3 1/3 1/3 1/3
H04Q 7/00 1/3 1/3 1/3 1/3 1/3
H04Q 1/3 1/3 1/3 1/3 1/3
H04
세번째는 3개 이상의 특허 분류 기호를 가지는 문건에 대하여 주 특허 분류 기호와 관련된 쌍과, 부 특허 분류 기호와 관련된 쌍에 다른 가중치를 부여하는 방법이 있을 것이다. 예를 들어 n개의 특허 분류 기호가 있을 때, 주 분류와 관계되는 조합의 개수는 (n-1)이 되므로, 주 분류 기호와의 관련된 조합에 전체의 75%를 할당하고, 이들과 관련된 관련 쌍에는 0.75*1/(n-1)의 가중치를 부여할 수 있다. 부 특허 분류 기호들과 관련되는 모든 조합에 25%의 가중치를 부여할 때, 부 특허 분류 기호들과 관련되는 모든 쌍에는 0.25*1/((n-1)C2)의 가중치를 부여할 수 있을 것이다. 이때, 상기 %의 배분은 기설정된 값으로 조절할 수 있을 것이다. 예를 들면 n> 5일 때, 주 특허 분류 기호와 관련된 것들에 50%를, 부 특허 분류 기호와 관련된 것들에 50%를 배당할 수 있을 것이며, n= 4일 때는 60% 대 40%를, n=3일 때는 75% 대 25%를 할당할 수 있을 것이다. 즉, IPC 의 개수가 3보다 클 때에는 (sub IPC, Sub IPC) 특허 분류 기호 조합 쌍이 생기므로, (main IPC, Sub IPC) 특허 분류 기 호 조합 쌍과 (Sub IPC, Sub IPC) 특허 분류 기호 조합 쌍에 대해 다른 가중치를 줄 수 있을 것이다.
n=3일 때는 75% 대 25%를 할당하면 다음과 같은 테이블이 생성될 수 있다. 먼저 하기 표 24는 H04B 7/04와 H04B 7/155의 관계성 테이블이다.
[표 24]
H04B 7/04 H04B 7/02 H04B 7/00
H04B 7/155 0.75/2 0.75/2
H04B 7/15 0.75/2 0.75/2
H04B 7/14 0.75/2 0.75/2
H04Q 7/00
다음으로 하기 표 25는 H04B 7/04와 H04Q 7/30의 관계성 테이블이다.
[표 25]
H04B 7/04 H04B 7/02 H04B 7/00 H04B H04
H04Q 7/30 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 7/20 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 7/00 0.75/2 0.75/2 0.75/2 0.75/2
H04Q 0.75/2 0.75/2 0.75/2 0.75/2
H04
다음으로, 하기 표 26은 H04B 7/155와 H04Q 7/30의 관계성 테이블이다.
[표 26]
H04B 7/155 H04B 7/15 H04B 7/14 H04B 7/00 H04B H04
H04Q 7/30 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 7/20 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 7/00 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04Q 0.25/1 0.25/1 0.25/1 0.25/1 0.25/1
H04
한편, 복수개의 특허 분류 기호를 가지는 개별 문건의 기여도를 문건 단위로 동일 (가령 1)이라고 했을 때, 다음과 같은 가중치 부여 방법을 생각할 수 있다. 극단적인 예로써, 대한민국 특허 출원 제 10-2005-0042032호 문건에 H04B 7/02 및 H04B 7/14와 같이 2개의 특허 분류 기호가 나와 있고, 이들이 next sibling 관계일 때(즉, H04B 7/02 및 H04B 7/14 부모 노드가 H04B 7/00으로 동일하며, 그 부모 노드가 직상위 특허 분류 기호이다) 상기 H04B 7/02 및 H04B 7/14의 관계성 테이블은 오직 1개가 나오며, 그 테이블의 셀(cell) 또한 1개이다. 상기 대한민국 특허 출원 제 10-2005-0042032호 문건에 대한 테이블은 하기 표 27과 같다.
[표 27]
H04B 7/02 H04B 7/00
H04B 7/14 1
H04B 7/00
이때, 상기 특정한 특허 문건에 대해서 H04B 7/02 및 H04B 7/14는 강력하게 관계되어 있다고 볼 수 있다. 한편, 상기 대한민국 특허출원 제10-2006-0012606호를 기준으로 했을 경우, 3개의 테이블에, 각 테이블마다 6개, 16개 및 20개의 셀을 가지게 된다. 이때, 상기 (H04B 7/02, H04B 7/14)라는 하나의 특허 분류 기호 조합을 기준으로 할 때, 대한민국 특허 출원 제 10-2005-0042032호 문건의 기여도와 상기 대한민국 특허출원 제10-2006-0012606호의 기여도를 어떻게 평가할 것인가의 문제가 발생한다. 상기 기여도의 가중치 처리는 다음과 같은 방법이 있을 것이다.
첫째, 관계성의 존재 내지는 발생을 기준으로 테이블이나 상기 테이블에서 발생하는 셀의 개수에 무관하게 어느 문건에서나 특정 특허 분류 기호의 조합 (Ai, Bj)(예를 들면, 상기 (H04B 7/02, H04B 7/14))를 동일한 값의 기여도 가중치(예를 들면 1)로 처리할 수 있다.
둘째, 상기 테이블의 개수 및 셀의 개수를 고려하여, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 각 특허 문건의 기여도 가중치를 다르게 하여 부여할 수 있을 것이다. 이때, 특정 특허 분류 기호의 조합 (Ai, Bj)에 대한 기여도 가중치를 각 특허 문건에서 발생하는 모든 테이블에 존재하는 모든 셀의 총수로 나눈 것으로 할 수 있다. 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6+16+20)(=3개의 테이블에 있는 모든 셀의 수)가 된다.
셋째, 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 나눈 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 1/(6)(=3개의 테이블에 있는 모든 셀의 수)가 된다
넷째, 상기 둘째 또는 셋째의 기여도 가중치를 역으로 계산하는 방법이 있다. 즉, 상기 기여도의 가중치를 상기 특정 특허 분류 기호의 조합 (Ai, Bj)가 나온 테이블에서의 셀의 총수로 곱한 값으로 할 수 있을 것이다. 예를 들면, 예를 들면 (H04B 7/02, H04B 7/14)에 대하여, 대한민국 특허 출원 제 10-2005-0042032호 문건에 의 한 기여도 가중치는 역시 1(=테이블 1개, 셀의 총수도 1개)이며, 대한민국 특허출원 제10-2006-0012606호의 기여도 가중치는 6(=3개의 테이블에 있는 모든 셀의 수)이 된다. 이러한 기여도 가중치 부여 방법은 이종 기술의 융합도를 계산하는데 더욱 유망할 것이다. 즉, 테이블에 존재하는 셀의 숫자가 적은 경우에는 그 기술은 기술 분류 체계 자체에서 연관성이 강한 기술로 묶어 놓은 것일 수 있기 때문에, 하나의 테이블에서 테이블의 크기가 클수록 그 기술은 기술 분류 체계 상 멀리 떨어져 있는 기술이기 때문이다.
상기와 같은 방법으로 특허 분류 기호 조합 (Ai, Bj)에 대하여 다음과 같은 정보를 획득할 수 있을 것이다.
첫째, (H04B 7/02, H04B 7/14) (Ai, Bj)에 대한 카운팅 정보이다. 상기 카운팅 시 본 발명에서 언급하거나, 본 발명 사상에 부합하는 가중치를 부여할 경우, 상기 특허 분류 기호 조합 (Ai, Bj)에 대하여 적어도 하나 이상의 가중치가 적용된 가중치별 카운팅 정보를 획득할 수 있을 것이다.
둘째, 모든 특허 분류 기호 조합은 그 조합이 생성될 때, 그 조합이 어느 문건에 의해서 생성되었는지에 대한 정보가 저장되어 있다. 즉, 상기 (H04B 7/02, H04B 7/14)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 문건에 의해서 생성된 것이며, (H04B 7/15, H04B 7/24)라는 특허 분류 기호 조합은 대한민국 특허출원 제10-2005-0111868호라는 문건에 의해서 생성된 것이다. 그러므로, 특허 분류 기호 조합 (Ai, Bj)에 대해 문건 고유 번호가 대응되며, 상기 문건 고유 번호에는 그 문건 고유 번 호를 가지는 문건에 대한 모든 서지 사항을 포함한 그 문건에 대한 모든 정보가 대응될 수 있다. 상기 모든 테이블에는 관련된 2개의 특허 분류 기호 조합이 존재하며, 그 특허 분류 기호 조합들이 나온 특허 문건이 대응되며, 상기 특허 문건에는 그 특허 문건의 서지 사항이 대응될 수 있다. 즉, 상기 H04B 7/155와 H04Q 7/30의 관계성 테이블에 존재하는 모든 특허 분류 기호 조합 (Ai, Bj)에 대하여, 문건 고유 번호로 대한민국 특허출원 제10-2005-0111868호가 대응된다. 그리고, 상기 문건 고유 번호에 대응되는 문건의 서지 사항 등에서 상기 문건에 대하여 출원번호는 10-2006-0012606이며, 출원인은 삼성전자이며, 발명자는 최도인과 황성택이며, 출원일은 2006년02월09일인 것과 같이 서지 사항 및 상기 문건 고유 번호에 해당하는 문건에 관한 모든 정보를 대응시킬 수 있게 된다. 물론, 상기 문건 고유 번호는 출원 번호일 수 있으며, 본 특허 출원이 미국 등에 출원되었다면 그 미국 출원의 서지 사항에도 상기 수행된 결과값을 대응(매핑)해 놓을 수 있을 것이다.
상기와 같은 모든 특허 분류 기호 조합 (Ai, Bj)과 문건 번호의 대응은 상기 특허 분류 기호 조합 (Ai, Bj)의 생성 시에 상기 카운팅 값과 함께 DB에 저장되는 것이 바람직할 것이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 입수되는 특허 문건에 대하여 특허 분류 기호가 2개 이상일 경우, 각 특허 분류 기호의 조합에 대하여 특허 분류 기호 체계(트리 구조) 데이터를 참조하여, 가 특허 분류 기호의 조합별로 기설정된 개수의 테이블을 만든다. 이때, 각 테이블에 들어가는 수치값은 기설정된 기준에 의한 가중치를 반영한 값일 수 있다. 이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 각 테이블에서 추출된 특허 분류 기호의 조합 (Ai, Bj)에 대하여 기설정된 기여도 가중치값을 적용하여 특허 분류 기호의 조합 (Ai, Bj)별 하기 표 28과 같은 특허 분류 기호의 조합 (Ai, Bj)별 관계성 결과 데이터를 생성할 수 있다.
본 모델을 설명하기 위하여 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개만이 있다고 가정하자.(물론, 입수 되는 모든 문건에 대해서 반복적으로 처리하면 모든 문건 집합을 기준으로 한 모든 특허 분류 기호 조합 (Ai, Bj)에 대한 하기와 같은 데이터의 생성이 가능할 것이다.) 이때, 특허 분류 기호 조합 (Ai, Bj)에 다음과 같은 테이블의 생성이 가능할 것이다.
[표 28]
특허 분류 기호 조합 (Ai, Bj) 문건 번호 Frequency (단순빈도) 1/nC2 균등할당 (M,S), (S,S) 차등할당
(H04B 7/15 ,H04B 7/26) 10-2005-0111868 1 1 1
(H04B 7/15,H04B 7/24) 10-2005-0111868 1 1 1
(H04B 7/14,H04B 7/26) 10-2005-0111868 1 1 1
(H04B 7/14,H04B 7/24) 10-2005-0111868 1 1 1
(H04B 7/155,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/155,H04B 7/02) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/15,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/15,H04B 7/02) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/14,H04B 7/04) 10-2006-0012606 1 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2006-0012606 2 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2005-0042032 2 1 1
1 1/3 ..
1 1/3 ..
(H04Q 7/00, H04B 7/00) 10-2006-0012606 1 1/3 0.25/1
(H04Q 7/00, H04B) 10-2006-0012606 1 1/3 0.25/1
(H04Q,H04B) 10-2006-0012606 1 1/3 0.25/1
(n은 특허분류 기호 수), (M,S)는 (main IPC, Sub IPC)를 (S,S)는 (sub IPC, Sub IPC) 를 말하며, n>2 이상일 경우, (M,S), (S,S) 차등할당은 (M,S)에 대해서는 75%/(n-1)의 가중치를, (S,S)에 대해서는 25%/(n-1)C2의 가중치를 부여하였다. n=2일 때는 그냥 1을 부여하였다.
이때, 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍에 주목하면, 문건 번호가 2개가 대응되어 있음을 알 수 있다. 즉, 상기 (H04B 7/14,H04B 7/02) 특허 분류 기호 조합 쌍은 2개의 문건에서 동시에 출현했음을 의미하며, Frequency(단순 빈도)의 값은 2가 된다. 1/nC2 균등할당과 (M,S), (S,S) 차등할당 등 기설정된 방식의 가중치 또는 기여도 가중치를 부여할 수 있을 것이다.
상기 표 28는 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개에 대해서 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성한 것이다. 상기 방식을 입수되는 모든 문건에 대하여 반복적 또는 재귀적으로 적용할 수 있음은 당업자에게 자명할 것이며, 상기 기설정된 가중치 또는 기여도 가중치 중 어느 하나 이상을 기준으로, 각 특허 분류 기호의 조합 (Ai, Bj)에 대하여 관계성 데이터를 생성할 수 있음도 자명할 것이다.
이상과 같이 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 임의의 (Ai, Bj)에 대하여 1) 이 (Ai, Bj)값이 나온 문건 번호, 2) 특정한 상황i별 가중치 정책j에 따르는 가중치(Wij), 3) (M,S)인지 (S,S)인지의 여부, 4) 기타 (Ai, Bj)에 대한 속성 정보 중 어느 하나 이상을 DB에 저장할 수 있다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 복수 개의 특허 분류 기호를 처리하는 방법은 IPC에 한정되지 않음은 당연하다 할 것이다. 즉, 상기 IPC에서 수행된 것과 완전히 동일하게 미국 특허 문건에 대해서는 USPC를, 일본 특허 문건에 대해서는 FT와 FI, ECLA를 대상으로 하여 복수 개의 특허 분류 기호를 처리할 수 있을 것이다.
기술 융합 패턴 분석 모듈
이때, 상기 특허 분류 기호의 조합 (Ai, Bj)에 대하여 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 저장한 1) (Ai, Bj)값이 나온 문건 번호, 2) 특정한 상황i별 가중치 정책j에 따르는 가중치(Wij), 3) (M,S)인지 (S,S)인지의 여부, 4) 기타 (Ai, Bj)에 대한 속성 정보 중 어느 하나 이상을 처리하면 다음과 같은 다음과 같은 정보들을 계산, 입수 또는 추출할 수 있을 것이다. 하기와 같은 정보는 본 발명의 기술 융합 패턴 분석 모듈이 수행한다.
상기 기술 융합 패턴 분석 모듈이 처리할 수 있는 정보는 본질적으로 2가지이다.
첫째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 각 특허 분류 기호 쌍의 출현 회수를 입수할 수 있다. 예를 들면, (H04B 7/26, H04B 7/15)는 대한민국 특허출원 제10-2005-0111868호에 1회 출현한 반면, (H04B 7/14,H04B 7/02)는 10-2006-0012606와 10-2005-0042032양 특허 공보에 모두 출현하였다. (주 특허 분류 기호가 아닐 시 또는 모든 특허 분류 기호를 동등하게 취급할 경우에는 (Ai, Bj) = (Bj, Ai)로 취급될 수 있다. 어느 하나가 주특허 분류 기호이면 (Ai, Bj)와 (Bj, Ai)를 다르게 취급할 수도 있으며, 동일하게 취급할 수도 있을 것이다. ) 그러므 로, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 모든 특허 분류의 쌍에 대하여 그 쌍이 나온 회수를 기록하여 놓을 수 있다. 또한, 상기 쌍이 나온 특허 문건들에 대한 특허 문건 번호를 저장해 놓을 수 있을 것이다.
둘째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특정 특허 분류 기호가 주어질 때, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 이는 상기 주어진 특정 특허 분류 기호가 들어가는 모든 쌍과, 그 쌍이 나온 회수를 카운팅함으로써 용이하게 획득할 수 있을 것이다. 이때, 기설정된 가중치 또는 기여도 가중치를 적용하여, 상기 특정 특허 분류 기호와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 아울러, 상기 특허 분류 기호 체계(트리 구조)를 참조하여, 기설정된 레벨 단위에서 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 즉, 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이며, 상기 IPC sub class, IPC main group, 또는 IPC subgroup 수준에서 상기 H04B 7/26와 가장 빈번하게 결합하는 특허 분류 기호를 찾을 수 있을 것이다.
셋째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특허 분류 기호 쌍과 상기 특허 문건 번호의 대응 관계를 통하여, 상기 특허 분류 기호 쌍과 상기 특허 문건 번호에 대응되는 서지 사항을 대응시켜 다양한 분석 결과를 생성할 수 있다. 상기 분석 결과에는 상기 특허 분류 기호 쌍과 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합과의 분석 결과를 획득할 수 있을 것이다. 예를 들면, 삼성전자의 대한민국 특허출원 2000년도부터의 2005년도까지에서 가장 많이 결합된 특허 분류 기호 쌍을 알 수 있을 것이다. 나아가, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 찾을 수 있을 것이다. 아울러, 상기 특허 분류 기호가 주어질 때, 상기 특허 분류 기호와 가장 잘 결합하는 특허 분류 기호를 상기 1) 국가, 2) 기간, 3) 출원인, 4) 발명자 및 5) 대리인 중에서 선택되는 적어도 하나 이상의 조합으로 이루어지는 문건 집합에서도 찾을 수 있을 것이다. 예를 들면, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 H04B 7/26와 가장 다수가 결합하는 특허 분류 기호 체계 상에서의 각 단계별 특허 분류 기호를 찾을 수 있을 것이며, H04B 7/26에 대하여 삼성전자 주식회사의 미국 특허출원 2003년도부터의 2005년도까지에서도 찾을 수 있을 것이다. 이를 통해, 상기 특정 기간 동안의 특정 주체에 대한 특허 명세서에 나타난 기술 융합의 정도를 파악할 수 있을 것이다.
넷째, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 임의의 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 특허 분류 기호의 조합 (Ai, Bj)에 관계된 특별한 특허 문건 집합을 대응시킬 수 있을 것이다. 이때, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 상기 대응되는 특허 문건 집합에 대한 각종 분석을 수행하면, 상기 수행된 분석 결과는 상기 특허 분류 기호의 조합 (Ai, Bj)에 대한 분석 결과가 된다. 상기 특별한 특허 문건 집합에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특 정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 11) 상기 1) 내지 9)에 등록 여부, 심사청구 여부 등과 특정 조건을 결부하는 것으로 생성되는 특허 문건 집합에 대하여 사전에 계산해 놓을 수 있을 것이다. 물론, 사용자가 특정하거나 생성한 문건 집합에 대해서도 상기와 같은 계산을 수행해 놓을 수 있을 것이다.
또한, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 1) 내지 상기 11)로 특정되는 어느 하나 이상의 문건 집합에 대하여, 상기 문건 집합을 구성하는 특허 문건 중에서, 특허 분류 기호가 2 이상이 부여되어 있는 문건들만을 추출해서, 그 추출된 문건 집합을 대상으로만, 상기 특허 분류 기호의 조합 (Ai, Bj)을 입수할 수 있다. 상기 입수된 특허 분류 기호의 조합 (Ai, Bj)에 대하여, 상기 표와 같은 관계성 데이터를 생성하고, 상기 생성된 관계성 데이터를 정렬 또는 분석(빈도, 최빈값, 최대값, 최소값, 연도별 개수, 출원인, 발명자 등의 주체별 개수 등의 분석이 그 예가 된다.)한다. 상기와 같은 분석을 마치면, 상기 1) 내지 11)로 특정되는 어느 하나 이상의 문건 집합 또는 상기 추출된 문건 집합 대상별로의 상기 특허 분류 기호의 조합 (Ai, Bj)의 관점에서 파악되는 기술 융합에 관한 정보를 획득할 수 있게 된다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행하는 상기와 같은 반복 수행 방법은 본 수행의 결과로 생성되는 값을 찾기 위한 일실시예에 불과할 것이며, 당업자라면 전산 기술을 이용하여 본 발명 사상에 대한 다양한 계산 방법을 시도할 수 있을 것이다. 상기 특허 분류 기호가 2 이상 부여된 모든 특허 문건의 모든 특허 분류 기호에 대하여 상기 수행된 결과(예를 들면 각 특허 분류 기호 쌍에 대한 값(가중치 부여 또는 미부여 등을 포괄한다)을 가지는 테이블 등)는 DB로 저장되거나, 실시간으로 생성되는 뷰(view) 내지는 물리적인 뷰(materialized view)로 제공될 수 있음은 당연할 것이다.
상기와 같은 과정을 실시하는 일 실시예적 과정을 도 103에서 보여주고 있다. 이하, 도 103을 기준으로 설명한다. 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나의 특허 문건을 포함하는 문건 집합을 입수하며(S5320), 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5330), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5340), 상기 조합별로 상기 조합에 포함된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노드에 관한 정보를 입수하며(S5350), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5360), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하며(S5370), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하며(S5380), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성한다(S5390)
이어, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈을 통해서 적어도 2 이상의 문건 집합에 대하여 복수개의 특허 분류 기호를 전처리하여 비교하는 방법에 대해서 도 104를 기준으로 설명한다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나의 특허 문건을 포함하는 문건 집합을 2 이상 입수하며(S5410), 상기 각 문건 집합별로 상기 문건 집합에 포함되는 특허 문건 중에서 특허 분류 기호가 2개 이상인 복수 특허 분류 기호 포함 문건을 추출하며(S5430), 주 특허 분류 기호 및 부 특허 분류 기호의 구분 처리에 관한 기설정된 기준에 따라 복수 특허 문건 기호 문건에 포함되는 복수개의 특허 분류 기호의 조합을 생성하며(S5440), 상기 조합별로 상기 조합에 포함 된 각각의 특허 분류 기호에 대하여 특허 분류 기호 체계 상의 부모 노드에 관한 정보를 입수하고(S5450), 상기 부모 노드에 대하여 최하위 공통 특허 분류 기호를 입수하며(S5460), 상기 최하위 공통 특허 분류 기호 직전까지의 자신을 포함한 각 부모 노드 특허 분류 기호의 쌍을 생성하고(S5470), 상기 각 쌍을 균등 또는 기설정된 기준을 적용한 가중치를 부여하여 저장하고(S5480), 상기 저장된 각 쌍을 대상으로 하여 기설정된 기준에 따른 통계값, 파라미터 또는 계산값을 생성하고(S5490), 상기 통계값, 파라미터 또는 계산값을 상기 문건 집합별로 비교한다(S5495).
도 115내지 도 117에는 복수 특허 분류 기호 분석 방법에 대한 예시적인 실시예를 보여주고 있다.
도 115는 특허 분류 기호를 입수 받고, 상기 입수 받은 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들에 대한 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 특허 분류 기호를 입수 받고(S6520), 입수된 특허 분류 기호에 대한 최빈 융합 특허 분류 기호 정보를 입수하여(S6530), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6540).
도 116는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 최빈 특허 분류 기호를 추출하고, 상기 추출된 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기 호들에 대한 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 문건 집합을 입수 받고(S6620), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하고(S6630), 개별 문건별로 입수된 특허 분류 기호를 문건 집합 수준에서 최빈값을 기준으로 랭킹을 부여하고(S6640), 랭킹이 부여된 개별 특허 분류 기호별로 최빈 융합 특허 분류 기호 정보를 입수하고(S6650), 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S6660).
도 117는 문건 집합을 입수 받고, 상기 입수 받은 문건 집합에서 개별 문건 단위에서 추출한 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호들을 추출하고, 추출된 최빈 융합 특허 분류 기호들을 통합하는 방식으로 분석 정보를 제시하는 실시예적 방법이다.
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 적어도 하나 이상의 문건 집합을 입수 받고(S670), 문건 집합을 구성하는 개별 문건별로 특허 분류 기호를 입수하며(S670), 개별 문건별로 입수된 특허 분류 기호를 기준으로 최빈 융합 특허 분류 기호 정보를 입수하고(S670), 개별 문건별로 입수된 최빈 융합 특허 분류 기호 정보를 통합하며(S670), 통합된 최빈 융합 특허 분류 기호에 대하여 특허 분류 기호 체계를 반영하여 적어도 하나 이상의 단계로 디스플레이하거나, 통합된 최빈 융합 특허 분류 기호에 대응되는 특허 문건 집합에 대하여 기설정된 적어도 하나 이상의 분석을 수행한다(S670).
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 본 발명 사상의 특징의 하위 특허 분류 기호 포함 사상을 적용하지 않고, 단순하게 각 문건에 포함되어 있는 특허 분류(patent classification, PC) 기호쌍(PC1, ..., PCi, PCj,..., PCn)에 대해서도 작동될 수 있다. 즉, 상기에서는 주어진 PCi에 대하여 주어진 특허 분류 기호 체계 상의 상위 특허 분류 기호를 고려하지 않고, 문건에 나타난 (PCi, PCj)만을 대상으로 특허 분류 기호 조합쌍을 구성할 수 있다. 이때, PC1이 주(main) 특허 분류 기호이므로, 상기에서 설명한 main vs. sub 간의 가중치 부여는 그대로 적용할 수 있다.
이종 복수 특허 분류 기호 관계성 전처리 모듈
상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 동종의 특허 분류 기호에 대한 처리를 설명하였다. 이어서, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈의 작동 방식과 완전히 유사하다. 미국에서 발행되는 특허 문건에는 하나의 특허 문건에 IPC와 USPC가 동시에 결합되어 있는 것이 거의 전부이며, 일본에서 발행되는 특허 문건에도 IPC와 FT가 동시에 부여되어 있다. 하나의 특허 문건에 IPC1,… IPCn이, USPC1,…,USPCm 부여되어 있다고 가정하자. 이 경우, 이종 복수 특허 분류 기호 관계성 처리의 관점에서는 상기 IPC1,… IPCn과 USPC1,…,USPCm사이에는 4가지 종류의 관계성의 조합이 생긴다. 먼저 IPC1과 USPC1의 관계로, 이들은 각각 main IPC와 main USPC의 쌍이 된다. 그리 고, IPC1와 USPC2,…,USPCm의 쌍으로 이는 main IPC와 sub USPC와의 쌍이 된다. 그리고, IPC2,… IPCn와, USPC1의 쌍으로, 이는 sub IPC와 main USPC의 쌍이 된다. 그리고, , IPC2,… IPCn각각과 USPC2,…,USPCm각각에 대한 쌍으로, 이는 sub IPC와 sub USPC의 쌍이 된다.
상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 각 4가지 종류별로, 각 종류 하에 있는 이종 복수 특허 분류 기호들 간에서 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한 바와 동일한 처리를 할 수 있다. 이때, 이종 특허 분류 기호를 대상으로 하므로, 상기 최소 공통 특허 분류 기호는 없기 때문에 기설정된 값으로 한정할 수 있다. 즉, IPC의 경우에는 subclass에서, USPC에서는 class까지만을 대상으로 하여, 주어진 IPC와 주어진 USPC 쌍에 대하여 상위 특허 분류 기호를 한정 지을 수 있다. 즉, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 특허 분류 기호 조합(Ai, Bj)(단, Ai, Bj는 동일한 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성한 바와 같이, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성할 수 있다. 상기 생성된 관계성 테이블에 대하여 가중치 또는 기여도 가중치를 부여할 수 있을 것이다. 또한, 각 이종 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여, 특허 문건 번호를 대응시킬 수 있음과, 상기 특허 문건 번호로부터 입수되는 서지사항을 반영한 카운팅 및 계산을 수행할 수 있음도 자명할 것이다. 아울러, 특정한 문건 집합에 대하여, 이종 특허 분류 기 호 조합(Ai, Bj)를 획득할 수 있을 것이며, 이들 조합에 대한 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈과 동등한 분석을 수행할 수 있을 것이다.
특허 분류 기호별 통계 전처리 모듈
특허 분류 기호의 다단계성
본 발명의 특허 분류 기호별 통계 전처리 모듈은 적어도 하나 이상의 특허 분류 기호 체계 상의 특허 분류 기호에 대하여, 적어도 하나 이상의 국가별 특허 DB를 대상으로 기설정된 통계값을 찾아내는 전처리를 수행한다.
도 61은 상기 특허 분류 기호별 통계 전처리 모듈의 구조에 대해서 설명하고 있다. 상기 특허 분류 기호별 통계 전처리 모듈은 특허 분류 기호별로 통계값을 전처리하는 특허 분류 기호별 통계 전처리 엔진(3210)과 상기 전처리된 특허 분류 기호별 통계값을 저장하고 있는 뷰(view), 테이블(table) 또는 정보 조직체로서의 전처리된 특허 분류 기호별 통계 DB(3230)를 포함하고 있다.
상기 특허 분류 기호별 통계 전처리 모듈에서 취급하는 특허 분류 기호는 IPC, USPC, FT, FI, ECLA 중 어느 하나 이상이다. 상기 특허 분류 기호별 통계 전처리 모듈에서 국가별 특허 DB는 대한민국, 미국, 일본, 유럽(EPO)가 발행하는 특허 DB를 포함하며, 그 이외의 국가의 특허청이 발행하는 특허 DB도 포함될 수 있음은 자명하다. 각 국가는 IPC를 공통으로 하고, 자국별로 특별한 분류 체계(미국 특허청의 경우 USPC 또는 UPC, 일본 특허청의 경우 FT, FI, 유럽 특허청의 경우 ECLA 등)를 가지고 있는 경우도 있다. 2이상의 특허 분류 체계를 가지고 있는 국가의 특허 DB를 대상으로 한 기설정된 통계값을 찾아내는 것은 상기 2이상의 분류 체계별로 독립적으로 수행되는 것이 바람직하다. 즉, 미국의 경우라면, IPC 와 USPC에 대해서 각각 전처리를 할 필요가 있게 된다. 또한, 각 특허 분류 기호 체계에는 각 체계 마다의 레벨이 있다. IPC의 경우에는 section, subsection, class, subclass, group, subgroup이 있으며, subgroup이하의 세부 분류에는 그 특허 분류 기호에 대응되는 타이틀 정보에 도트(dot)의 수로써 계층 구조를 표현하고 있다. 상기 계층 구조에 대한 예시는 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)에 상세히 설명되어 있다. 그러므로, 본 발명에서의 특허 분류 기호의 레벨은 IPC section, class, subclass, main group, 1dot subgroup, 2 dot subgroup, ...n dot subgroup으로 레벨별로 구분될 수 있다. 상기 레벨은 상기 main group까지는 분류 기호 체계에서 상하위 계층 구조를 확인할 수 있으나, subgroup부터는 타이틀에 포함된 dot 정보를 활용해야만 상하위 계층 구조를 확인할 수 있다. 상기와 같은 dot의 수로써 계층 구조를 확인하는 것은 USPC의 경우 subclass부터이며, FT의 경우 전체 FT 기호에서 전7자리("테마 코드 + 영문자 2자"까지)이후부터이다.
상기 특허 분류 기호별 통계 전처리 모듈이 특허 분류 기호별로 통계값을 전처리하는 방법의 일례는 도 100에 나와있다. 상기 특허 분류 기호별 통계 전처리 모듈은 제1국에서의 특정 특허 분류 기호 체계에 대하여, 주어지는 특허 분류 기호의 하위 분류 기호가 자동으로 포함될 수 있도록 특허 분류 기호의 트리 구조를 이용하여 특허 분류 기호를 재조정하여 DB에 저장하며(S5020), 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 입수하며(S5030), 검색식 또는 검색 쿼리에 포함된 주어진 특허 분류 기호에 대하여 재조정된 특허 분류 기호로 변환하며(S5040), 재조정 된 특허 분류 기호를 포함하는 검색식 또는 검색 쿼리를 대상으로 검색 엔진 또는 DBMS(201)로 검색을 수행하며(S5050), 상기 검색 결과로서 특허 문건 정보를 입수하여 계량화 하며(S5060), 상기 검색 결과에 대하여 기설정된 시간 단위 또는 통합된 시간 단위로, 출원인, 발명자, 또는 대리인 등 주체에 대하여 기설정된 통계값, 파라미터 또는 계산값을 기준으로 랭킹 정보를 계산하는 기능을 수행한다.
또한 상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 101에 나타나 있다.
상기 특허 분류 기호별 통계 전처리 모듈은 특허 분류 기호가 포함된 검색식을 입수하고(S5120), 상기 검색식에 포함된 특허 분류 기호에 대하여 하위 특허 분류 기호에 관한 특허 정보를 포함하여 관계되는 특허 문건 정보를 입수하며(S5130), 상기 특허 문건에 포함된 인용 정보 및 피인용 정보를 기설정된 통계값, 파라미터 내지 계산값를 처리한다(S5140).
아울러, 상기 특허 분류 기호별 통계 전처리 모듈은 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성할 수도 있으며, 이에 대한 일실시예적 방법이 도 102에 나타나 있다.
상기 특허 분류 기호별 통계 전처리 모듈은 적어도 하나의 문건 집합을 입수하고(S5220), 상기 문건 집합에 포함된 모든 문건에 대하여 출원인, 발명자, 대리인, 적어도 하나 이상의 특허 기술 분류 기호를 추출하며(S5230), 상기 문건에 대하여 상기 추출된 기준 중 어느 하나 이상을 적용하여 문건 부분 집합을 생성하고(S5240), 상시 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건이 인용하는 선출원 문건 정보를 입수하거나(S5250), 상기 문건 부분 집합을 구성하는 모든 문건에 대하여, 상기 문건을 인용하는 후출원 문건 정보를 입수하며(S5260), 상기 입수된 선출원 문건 및/또는 상기 입수된 후출원 문건에 대하여 기설정된 인용, 피인용 관련 통계값, 파라미터 또는 계산값을 생성할 수 있다(S5270)
이하, 본 발명의 특허 분류 기호별 통계 전처리 모듈을 특허 분류 기호별 통계 전처리 엔진의 관점에서 더욱 상세하게 설명한다.
옵션 사항
상기 특허 분류 기호별 통계 전처리 모듈이 상기 기설정된 통계값을 처리할 때는 다음과 같은 옵션이 고려되며, 각 옵션별 교차 선택이 가능할 것이다.
첫째, 먼저 각 특허 분류 기호가 주어졌을 때, 그 특허 분류 기호의 하위 분류 기호에 관한 정보를 자동적으로 포함할 것인가의 문제이다. 이는 특히 타이틀 정보에 나온 dot수로부터 계층 구조를 확인해야 하는 레벨일 경우 더욱 그러하다. 예를 들면, H, H04, H04B, H04B 7/00레벨까지는 확장자를 사용하여 용이하게 주어진 레벨의 IPC하부에 있는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있으나, subgroup레벨로 가면 본 발명의 하위 분류 포함 검색 방법을 활용해야만 그 하위 분류에 속하는 특허 분류 기호를 포함하는 특허 문건을 찾아 낼 수 있다. 예를 들면, H04B 7/15라는 IPC가 있을 때 하위 분류 기호를 포함하지 않고 통계값을 생성할 때는 각 국가별 특허 문건 중에서 H04B 7/15이 포함되어 있는 특허 문건을 입수 하면 된다. 하지만, 하위 분류 기호 포함하여 통계값을 생성할 때는 H04B 7/15와, IPC 계층 구조상 그 하위에 있는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 포함된 특허 문건들도 입수해야 한다. 이는 USPC, FT 등에서도 마찬가지이며, 공통된 설명은 생략한다.
하위 분류 기호를 자동으로 포함하여 통계값을 처리할 때에는 본 발명의 범위 검색(검색 엔진 이용 또는 DBMS(201) 이용 시 모두 해당)의 방법을 활용할 수도 있을 것이다. 한편, 본 목적을 달성하기 위해서 범위 검색이 아니더라도, 주어진 특허 분류 기호를 처리할 때, 그 하위에 있는 모든 특허 분류 기호를 저장해 놓고, 그 특허 분류 기호에 대한 통계값을 처리할 때, 그 특허 분류 기호에 대해서만 통계처리를 하는 것이 아니라, 하위에 있는 모든 특허 분류 기호를 대상으로 통계값을 처리할 수도 있을 것이다. 위의 H04B 7/15를 통해서 예를 들면, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 특허 분류 기호 계층 구조 정보에서 입수한 다음, H04B 7/15의 하부에 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216가 있음을 저장한 다음, H04B 7/15에 대한 기설정된 통계값을 구하라는 명령이 입수될 때, 자동적으로 하부에 존재하는 H04B 7/155, H04B 7/165, H04B 7/17, H04B 7/185, H04B 7/19, H04B 7/195, H04B 7/204, H04B 7/208, H04B 7/212, H04B 7/216를 포함하여 기설정된 통계값을 구하는 방식을 채용할 수도 있다는 것이다. 이는 USPC, FT 등의 다른 특허 분류 기호 체계에서도 마찬가지이다.
주어진 레벨의 특허 분류 기호가 있을 때, 단순히 그 특허 분류 기호를 포함하는 문건을 대상으로 상기 기설정된 통계값을 생성하는 것보다 상기 특허 분류 기호의 하위 특허 분류 기호들을 자동으로 포함하여 기설정된 통계값을 생성하는 것이 바람직하다.
둘째, 복수개의 특허 분류 기호가 존재할 경우, 이를 어떻게 처리할 것인가의 문제이다. 이 경우, 1) 주(main) 특허 분류 기호(통상 제일 첫번째 나오는 것이 주 특허 분류 기호이다.)만을 통계 처리의 대상으로 하는 방법, 2) 주 특허 분류 기호와 종(sub) 특허 분류 기호에 대해 균등한 가중치를 두면서 처리하는 방법, 3) 주 특허 분류 기호와 종 특허 분류 기호에 대해 다른 가중치를 주는 방식으로(예를 들면, 특허 분류 기호가 n+1개가 있을 때, 주 특허 분류 기호 50%, 나머지 종 특허 분류 기호는 50%*1/n으로 가중치를 주는 방법) 처리할 수 있을 것이다. 상기 1) 내지 3) 중에서 1)과 3)이 바람직하며, 그 중에서 3)이 더욱 바람직할 것이다.
셋째, 복수개의 출원인과 발명자가 있을 때의 처리 방법이다. 이 경우, 1) 매출원인 또는 발명자마다 100%의 가중치를 주는 방법과, 2) 출원인 또는 발명자수에 대해 균분하는 방법(n명의 발명자가 있을 때 각 발명자마다 100%*1/n로 처리함)이 있을 것이다. 출원인의 경우에는 실시 독립의 관점에서 출원인마다 100%의 가중치를 주는 것이, 발명자는 1/n으로 처리하는 것이 바람직할 것이다. 대리인의 경우에는 위의 출원인이나 발명자의 처리 방법을 채용할 수 있을 것이며, 대리인마다 100%로 하는 것이 바람직할 것이다.
사전 계산해 놓아야 할 정보
분류 자체의 구조에 관한 정보
상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특허 분류 기호에 대하여 상기 특허 분류 기호 체계 상에서 자신의 직하위 특허분류 기호의 개수를 카운트해 놓을 수 있으며, 자신의 모든 하위 특허 분류 기호의 개수를 카운트해 놓을 수 있을 것이다. 예를 들면 H04B 7/15의 경우에는 직하위 특허 분류 기호의 개수는 H04B 7/155, H04B 7/185, H04B 7/204와 같이 3이고, 모든 특허 분류 기호의 개수는 상기 직하위 특허 분류 기호 3개에 H04B 7/165, H04B 7/17, H04B 7/19, H04B 7/195, H04B 7/208, H04B 7/212, H04B 7/216을 합하여 10이다. 상기 직하위 특허 분류 기호의 개수 및 모든 하위 특허 분류 기호의 개수가 많을수록 그 특허 분류 기호는 상대적으로 기술의 분화가 크다고 할 수 있어, 특허 분류 기호 체계 상의 동일한 (도트) 레벨에서 상대적으로 중요한 기술일 가능성이 높다.
양적 분포
상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 확정되기 때문이다. 상기 확정된 특허 문건 집합 에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
예를 들면, 출원 기준으로는 연도별 또는 분기별 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도를 계산해 놓을 수 있을 것이다. 연도별 출원수는 특정 연도에 출원된 특허 문건의 전체 개수를 구하는 방식으로 계산될 수 있을 것이다. 증가율의 계산은 {(현기간 개수-과거기간개수)/과거기간 개수}*100%가 되며, 증가속도는 계산은 {(현기간 개수-과거기간개수)/시간간격}이 되며, 증가가속도는 증가속도의 시간간격에 대한 변화율로 계산가능할 것이다.
또한, 연도별 출원자 수를 구할 수 있을 것이며(이때, 공동 출원일 경우, 상기 옵션 사항을 적용할 수 있을 것이다.), 출원자 수가 계산되면 출원자수증가율을 계산해 놓을 수 있으며, 나아가 1개 출원당 평균출원자수 및 평균출원자수증가율도 계산할 수 있을 것이다. 그리고, 연도별 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율도 상기의 연도별 출원자 수에 준하여 계산할 수 있을 것이다.
그리고, 개별 출원마다 출원 청구항 수를 계산할 수 있으므로, 연도별 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 평균출원청구항수증가율을 계산할 수 있을 것이다. 이때, 출원 청구항을 독립항과 종속항으로 구분지을 경우, 독립항 수와 종속항 수를 계산할 수 있으므로, 이들에 대한 증가율 등을 계산할 수 있을 것이다.
또한, 개별 출원마다 특허 분류 기호의 개수를 계산할 수 있을 것이므로, 연도별 특허분류기호수, 특허분류기호수증가율을 계산할 수 있을 것이며, 1개 출원당 평균특허분류기호수, 평균특허분류기호수증가율도 계산할 수 있을 것이다. 또한, 미국 이나 일본 등과 같이 2개 이상의 특허 분류 기호가 사용되는 특허 DB의 경우에는 각 특허 분류 기호마다 이를 계산해 놓을 수 있을 것이다. 개별 출원마다 그 출원에 관한 패밀리 정보가 있을 때, 상기 패밀리 정보를 기준으로 연도별 패밀리수, 매밀리수증가율 및 1개 출원당 평균패밀리국가수, 평균패밀리국가수증가율도 계산할 수 있을 것이다.
상기는 출원 기준으로 계산된 것이며, 이와 동일한 파라미터들을 등록 기준으로 계산할 수도 있을 것이다. 등록 기준으로 계산할 수 있는 파라미터들은 등록수, 등록수증가율, 등록수증가속도, 등록수증가가속도, 등록자수, 등록자수증가율, 평균등록자수, 평균등록자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 등록청구항수, 등록청구항수증가율, 평균등록청구항수, 평균등록청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 평균패밀리국가수, 평균패밀리국가수증가율 등이 있을 수 있다.
상기와 같은 파라미터들은 예시적인 것이며, 그 이외에도 출원 또는 등록 특허 정보에 포함된 각종 수치 정보 및 본 발명의 사전 카운팅된 값들을 재료로 하여 다양한 파라미터 값도 계산될 수 있을 것이다. 상기 파라미터 값들은 본질적으로 카운트값, 카운트값의 변화율과 변화값, 상기 카운트값의 통계량(평균, 표준편차), 2 이상의 카운트값에 대한 함수값(예를 들면 등록율 등이 그 예가 된다.)
수량 기준 주체의 발견
상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 지정된 국가별 특허 DB를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 정보를 계산해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
예를 들면, 상기 특정된 특허 문건 집합에 대한 카운팅으로 연도별 또는 연도 통합 최다 출원인, 발명자, 대리인을 추출하여 각 출원인, 발명자, 또는 대리인별로 랭킹을 매겨 놓을 수 있을 것이다.
또한, 위에서 추출한 출원인들, 발명자들, 또는 대리인별로 집중도, 활동도(Activity Index)등을 계산해 놓을 수 있으며, 상기 계산의 결과로 집중도를 기준으로 한 출원인, 발명자 또는 대리인의 랭킹을 구할 수 있을 것이며, 활동도를 기준으로 한 출원인, 발명자, 또는 대리인의 랭킹을 구할 수 있을 것이다. 참고로, 출원수 기준 집중도란 {(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)*100%}로 구할 수 있을 것이다. 또한, 활동도는 [{(특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 특정 주체의 모든 출원)}/{(특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원/ 특정 기간 동안의 모든 출원)}*100%]으로 계산할 수 있다. 이때, 검색 엔진 또는 상기 DBMS(201)를 통하여 1) 특정 기간 동안의 특정 주체의 특정 특허 분류 기호에 대한 모든 출원, 2) 특정 기간 동안의 특정 주체의 모든 출원, 3) 특정 기간 동안의 특정 특허 분류 기호에 대한 모든 출원 및 4) 특정 기간 동안의 모든 출원 각각의 개수를 입수할 수 있기 때문에, 위의 집중도나 활동도를 계산할 수 있게 된다. 한편, 상기 집중도나 활동도는 특허 지표의 일 예에 불과하며, 상기 검색 엔진 또는 상기 DBMS(201)로 직접 또는 사전 계산을 통하여 간접적으로 입수할 수 있는 수치값들을 입력값으로 하는 정의된 함수가 있는 경우, 그 함수의 값을 계산할 수 있을 것이며, 그 계산된 함수값을 통하여 출원인, 발명자, 또는 대리인의 그 함수값을 기준으로 한 랭킹을 계산할 수 있을 것이다. 본 발명의 상기 함수에는 특허 분석 지표로 활용되는 정의될 수 있는 종래의 모든 특허 분석 지표 중 특허 DB를 기준으로 검색 엔진 또는 상기 DBMS(201)가 입수할 수 있는 값으로 정의되는 모든 특허 분석 지표가 해당될 수 있다.
아울러, 상기에서는 출원수를 기준으로 해서 출원인, 발명자 또는 대리인별 랭킹을 계산했으나, 출원수 증가율, 출원수 증가속도 등과 같은 다른 파라미터들을 기준으로 상기 특허 지표 내지는 함수에 대해서 출원인, 발명자 또는 대리인별 랭킹을 계산해 놓을 수 있을 것이다. 상기 파라미터로는 출원청구항수, 출원청구항수증가율, 1개 출원당 평균출원청구항수, 1개 출원당 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 1개 출원당 평균특허분류기호수, 1개 출원당 평균특허분류기호수증가율, 패밀리수, 매밀리수증가율, 1개 출원당 평균패밀리국가수, 1개 출원당 평균패밀리국가수증가율 등이 있을 수 있을 것이다.
상기 각종 특허 지표 내지는 함수는 출원 기준으로 설명하였으나, 등록을 기준으로도 정의될 수 있고, 계산될 수 있음은 자명할 것이다. 상기 출원 또는 등록의 한정은 특허 문건 집합의 특정 내지 확정의 문제이기 때문이다. 그러므로, 출원 중에서 출원 단계에서 심사청구가 있는 출원만을 대상으로 상기 특허 문건 집합을 특정 내지 확정할 수도 있을 것이다. 아울러, 실용신안제도를 도입하고 있는 경우, 실용신안등록출원 또는 실용신안등록을 각각 출원 또는 등록에 포함시킬 지의 여부 또한 상기 특허 문건 집합의 특정 내지 확정에 관한 문제로 이러한 특정 내지 확정의 방법과 기준은 당업자의 수준에서 다양하게 정할 수 있을 것이다.
인용 관련
상기 특허 분류 기호별 통계 전처리 모듈은 주어진 특정 특허 분류 기호에 대하여 인용 정보를 포함하고 있는 국가별 특허 DB(예를 들면 미국 특허청 발행 특허 문건으로 구축한 특허 DB)를 대상으로 하여, 기설정된 기간별로, 출원 기준 및/또는 등록 기준으로 하기와 같은 인용 관련 정보를 생성해 놓을 수 있다. 상기와 같은 계산이 되는 이유는 상기 특허 분류 기호, 지정 국가, 설정 시간, 출원 또는 등록 여부 등의 조건을 만족하는 특허 문건 집합이 특정되기 때문이다. 예를 들면, USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)가 주어졌을 때, 자신의 특허 문건의 특허 분류 기호로 USPC=002/456를 포함하고 있는 특허 문건 집합을 특정할 수 있게 된다. 상기 특정된 특허 문건 집합에 관한 카운팅으로 하기와 같은 각종 파라미터를 계산할 수 있게 된다.
미국 특허 문건의 서지 사항에는 자기 문건이 인용한 타인의 특허 등의 인용 정보가 존재한다. 즉, B 문건이 A 문건 및 a 문건을 인용하고 있을 때, A 문건 및 a 문건은 인용당한 것, 즉 피인용 특허이며, B 문건은 A 및 a 문건을 인용한 특허이다. 이때, B 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 인용 출원인, 인용 발명자, 인용 대리인, 인용 특허 분류 기호가 되며, A 문건 및 a 문건과 관계된 출원인(asignee를 포함한다), 발명자, 대리인, 특허 분류 기호는 각각 피인용 출원인, 피인용 발명자, 피인용 대리인, 피인용 특허 분류 기호가 된다.
B 문건이 A 문건 및 a 문건을 인용하고 있을 때, B 문건의 서지사항에는 A 문건 및 a 문건의 번호가 들어있다. B 문건이 A 문건 및 a 문건을 인용하는 관계가 있을 때, 전산적으로는 인용 관점에서의 A->B, a->B의 맵핑(mapping) 및 B->A, B->a로의 맵핑이 있게 되고, 상기 맵핑 관계를 통하여 A<->B, a<->B의 상호 관계를 성립시킬 수 있다. 그러므로, B가 인용하고 있는 문건은 B의 서지사항에 있어 용이하게 데이터화 될 수 있게 되고, 상기 맵핑을 통하여, A가 인용되고 있는 문건들의 집합 및 a가 인용되고 있는 문건 집합도 용이하게 특정할 수 있다. 즉, 상기 A 문건이 인용되고 있는 문건 집합 및 a 문건이 인용되고 있는 문건 집합 모두에는 B 문건이 포함되어 있을 것이다.
상기 과정은 확정 또는 특정된 모든 문건에 대하여 수행될 수 있을 것이다. 즉, 특정된 모든 특허 문건에 대하여 하나씩(one by one)으로 처리될 때, 하거나, 기타 전산적인 방법으로 모든 특허 문건 간의 맵핑 관계를 설정할 수 있을 것이다. 하나씩 처리될 때는 각 처리의 대상이 되는 문건은 B 문건의 입장에 서게 됨은 자명할 것이다. 이때, A 문건 및 a 문건이 모두 미국 특허 DB라는 전체 집합에 포함될 경우에는 A 문건 및 a 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이며, 어느 하나가 다른 국가의 특허 DB에서 관리되는 문건일 경우에도 그 국가의 특허 DB의 그 문건과 관련된 정보에 B 문건과의 매핍 정보가 기록될 수 있을 것이다.
인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)이 특정되면, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특허 문건 집합의 각각의 특허 문건에 포함되어 있는 피인용 특허 문건 번호(문건 A의 번호, 문건 a의 번호)를 취합할 수 있게 되고, 상기 취합된 피인용 특허 문건 번호에는 대응하는 피인용 특허 문건이 있으며, 상기 피인용 특허 문건에는 서지 사항이 포함되어 있음은 자명하다. 따라서, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건이 인용한 피인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 피인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상이 될 수 있다. 이때, 중복 카운팅은 당연히 허용된다. 즉, 하나의 피인용 문건이 상기 인용 정보를 포함하고 있는 특허 문건 집합의 다수 문건에 의해 인용될 때, 상기 피인용 문건은 그 인용되는 회수만큼의 가중치 또는 카운팅 값을 가져야 한다. 즉, 각 피인용 문건 번호에는 상기 인용 회수만큼의 가중치가 곱해져 있다고 취급되면 타당할 것이다. 즉, 문건 A가 5번 인용되고, 문건 a가 3번 인용되었다고 할 때, 모든 인용출원수 등과 같은 하기 파라미터값을 계산할 때, A문건에는 5의 가중치를, a문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 인용 정보를 포함하고 있는 특허 문건 집합을 기준으로 할 때, 상기 피인용 특허 문건 집합을 대상으로 한 모든 계산값은 "인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅이 될 때, 가장 많은 회 수로 인용된 피인용 문건 번호의 랭킹을 계산할 수 있을 것이다.
상기 특허 분류 기호별 통계 전처리 모듈은 상기 피인용 특허 문건 집합(문건 A, 문건 a가 있는 문건 집합)을 대상으로 하여 다음과 같은 정보들을 계산할 수 있을 것이다 그리고, 먼저 양적인 기준으로 인용출원수, 인용출원수 증가율, 인용출원수 증가속도(이들은 피인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 피인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 인용출원수, 인용출원수증가율, 인용출원수증가속도, 인용출원수증가가속도, 인용출원자수, 인용출원자수증가율, 인용평균출원자수, 인용평균출원자수증가율, 인용발명자수, 인용발명자수증가율, 인용평균발명자수, 인용평균발명자수증가율, 인용출원청구항수, 인용출원청구항수증가율, 인용평균출원청구항수, 인용평균출원청구항수증가율, 인용특허분류기호수, 인용특허분류기호수증가율, 인용평균특허분류기호수, 인용평균특허분류기호수증가율이 된게 된다.
마찬가지로 상기 특허 분류 기호별 통계 전처리 모듈은 상기 피인용 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 피인용 출원인별 랭킹, 최다 피인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 피인용 특허 문건 집합에 포함된 피인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 피인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.
상기 특허 분류 기호별 통계 전처리 모듈은 상기 인용 정보를 포함하고 있는 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 인용 정보를 포함하고 있는 출원인별 특허 문건 집합(상기 모든 출원인 중의 어느 하나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 피인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 피인용 특허 문건 집합에 대하여 상기의 인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특허 분류 기호별 통계 전처리 모듈은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 피인용 문건 집합을 생성할 수 있게 되고, 상기 피인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.
상기 맵핑이 관점에서, 상기 특정된 특허 문건 집합에 포함된 각 특허 문건을 인용하고 있는 문건 집합, 즉 인용 문건 집합을 생성할 수 있을 것이다. 예를 들어 설명하면 B 문건을 C 문건 및 c 문건이 인용하고 있을 때, 상기 맵팽 관계를 통하여, B 문건은 C 문건 및, c 문건에 의해 인용당했다는 것을 알 수 있게 된다. 이러한 C 문건 및 c 문건을 찾기 위해서는 검색 엔진의 인용 문건 번호 필드에 B 문건의 번호를 입력하면, 검색 결과로서 B 문건이 인용 정보에 포함된 C 문건 등이 나오게 된다. 물론, DBMS(201)에 B 문건의 번호를 인용 번호 필드를 지정하여 select 등의 쿼리를 질의하여서도 C 문건 등을 검색 결과로 입수할 수 있게 된다. B->C, B->c의 맵핑 관계가 데이터로 정리되어 있다면, 상기 B 문건을 인용하고 있는 C 문건이 포함된 문건 집합을 용이하게 특정할 수 있을 것이다.
그러므로, 상기 특허 분류 기호별 통계 전처리 모듈은 특정된 특허 문건 집합에 대하여, 상기 특정된 특허 문건 집합의 개별 특허 문건을 인용하고 있는 인용 문건 집합을 대상으로 하여 하기와 같은 피인용 정보(인용 당한 B의 입장에서는 인용한 C가 포함된 문건들은 피인용 정보가 된다)를 계산할 수 있다.
특허 문건 집합(B가 있는 문건 집합)이 특정되면, 상기 특허 분류 기호별 통계 전처리 모듈은 검색 엔진 또는 DBMS(201)에 질의함으로써, 상기 특허 문건 집합의 각각의 특허 문건을 인용하고 있는 인용 특허 문건 번호(문건 C의 번호, 문건 c의 번호)를 취합할 수 있게 된다. 상기 취합된 인용 특허 문건 번호에는 서지 사항이 대응되어 있음은 자명하므로, 상기 특정된 특허 문건 집합을 구성하는 모든 특허 문건을 인용한 인용 특허 문건 집합 또한 특정한 계산 시점 기준으로 특정되게 된다. 그러므로, 상기 특정된 인용 특허 문건 집합이 분석, 카운팅 또는 계산 대상 이 될 수 있다.
이때, 중복 카운팅은 허용되는 것이 바람직하다. 상기 특정된 특허 문건 집합에, B 문건과 b문건이 속한다고 할 때, 상기 B 문건과 b 문건이 모두 C 문건에 의해 인용된다고 할 때, 문건 C의 가중치는 2가 되어야 한다. 즉, C문건은 B 문건으로 검색해도 검색 결과에 포함되며, b 문건으로 검색해도 검색 결과에 포함된다.
상기 특정된 특허 문건 집합을 기준으로 할 때, 상기 인용 특허 문건 집합을 대상으로 한 모든 계산값은 "피인용"이라는 말이 붙을 수 있다. 상기 중복 카운팅이 될 때, 상기 특정된 특허 문건 집합에 속하는 특허 문건을 가장 많이 인용한 인용 문건 번호의 랭킹을 계산할 수 있을 것이다.
상기 특허 분류 기호별 통계 전처리 모듈은 상기 인용 특허 문건 집합(문건 C, 문건 c가 있는 문건 집합)을 대상으로 하여 다음과 같은 정보들을 계산할 수 있을 것이다 그리고, 먼저 양적인 기준으로 피인용출원수, 피인용출원수 증가율, 피인용출원수 증가속도(이들은 인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피 인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율이 된게 된다.
상기 특분동전은 마찬가지로 상기 인용 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 대리인 또는 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 인용 출원인별 랭킹, 최다 인용 발명자별 랭킹을 계산할 수 있을 것이다. 이때, 상기 특허 분류 기호별 랭킹을 계산할 때, 본 발명의 하위 특허 분류 기호 체계를 활용하여 각 특허 분류 기호 체계 상의 각 단계별로 최다 피인용 특허 분류 기호의 랭킹을 계산할 수 있을 것이다. 이때, 상기 인용 특허 문건 집합에 포함된 인용 특허 문건에 포함된 적어도 하나 이상의 특허 분류 기호가 포함되어 있을 것이며, 상기 포함된 특허 분류 기호의 (특허 분류 기호 체계 상의) 모든 상위 특허 분류 기호 각각도 인용과 관계되었다고 보는 것이 타당할 것이다. 그러므로, 이러한 관점이 상기 각 단계별 최다 인용 특허 분류 기호의 랭캥의 계산에 포함되는 것이 바람직할 것이다. 상기 인용 특허 문건 집합에 포함된 미국 특허 문건을 대상으로 할 때에는 상기 특허 분류 기호는 USPC와 IPC 둘 다가 될 수도 있을 것이다.
이때, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특정된 특허 문건 집합(B와 b가 있는 문건 집합) 자체를 분석할 수 있다. 이 때도 중복 카운팅이 허용되어 중복된 회수만큼 가중치를 부여하여 취급하는 것이 바람직하다. 예를 들면, 문건 B가 5번 인용되고, 문건 b가 3번 인용되었다고 할 때, 모든 상기 특정된 특허 문건 집합을 대상으로 피인용출원수 등과 같은 하기 파라미터값을 계산할 때, B문건에는 5의 가중치를, b문건에는 3의 가중치를 두는 방식으로 계산하는 것이 바람직하다. 상기 특허 분류 기호별 통계 전처리 모듈은 상기 가중치를 반영하여 상기 특정된 특허 문건 집합을 대상으로 하여 가장 많이 인용된 특허 문건의 랭킹을 계산할 수 있을 것이다. 나아가, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특 정된 특허 문건 집합(문건 B, 문건 b가 있는 문건 집합)을 대상으로 하여 먼저 양적인 기준으로 피인용출원수(B는 C에 의해서 인용되었으므로, B의 입장에서는 피인용이라는 말을 사용할 수 있다.), 피인용출원수 증가율, 피인용출원수 증가속도(이들은 인용 특허 문건 집합을 구성하는 문건의 개수로 알 수 있다.)를 알 수 있으며, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율도 계산될 수 있을 것이다. 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율 등의 카운팅 방법은 상기 파라미터 계산 방법에서 설명한 바와 동일하다. 즉, 인용 특허 문건 집합을 대상으로 하여, 출원수, 출원수증가율, 출원수증가속도, 출원수증가가속도, 출원자수, 출원자수증가율, 평균출원자수, 평균출원자수증가율, 발명자수, 발명자수증가율, 평균발명자수, 평균발명자수증가율, 출원청구항수, 출원청구항수증가율, 평균출원청구 항수, 평균출원청구항수증가율, 특허분류기호수, 특허분류기호수증가율, 평균특허분류기호수, 평균특허분류기호수증가율을 계산하면, 그 값이 각각 상기 피인용출원수, 피인용출원수증가율, 피인용출원수증가속도, 피인용출원수증가가속도, 피인용출원자수, 피인용출원자수증가율, 피인용평균출원자수, 피인용평균출원자수증가율, 피인용발명자수, 피인용발명자수증가율, 피인용평균발명자수, 피인용평균발명자수증가율, 피인용출원청구항수, 피인용출원청구항수증가율, 피인용평균출원청구항수, 피인용평균출원청구항수증가율, 피인용특허분류기호수, 피인용특허분류기호수증가율, 피인용평균특허분류기호수, 피인용평균특허분류기호수증가율이 된게 된다. 이때, 상기 특허 분류 기호별 통계 전처리 모듈은 상기 마찬가지로 상기 특정된 특허 문건 집합을 대상으로 하여, 상기 각 파라미터별로 출원인, 발명자, 또는 대리인의 랭킹을 계산할 수 있을 것이다. 즉, 출원수를 기준으로 한 최다 피인용 출원인별 랭킹, 최다 피인용 발명자별 랭킹을 계산할 수 있을 것이다.
상기 특허 분류 기호별 통계 전처리 모듈은 상기 특정된 특허 문건 집합(B가 있는 문건 집합)을 대상으로 하여, 출원인 정보를 획득할 수 있을 것이며, 상기 출원인별 특허 문건 집합(상기 모든 최빈 출원인 중의 어느 하나의 출원인별 특허 문건 집합에는 상기 B 문건이 포함되어 있을 것이다.)을 대상으로 하여, 상기 출원인별 특허 문건 집합을 대상으로도 상기 인용 특허 문건 집합을 특정할 수 있을 것이며, 특정된 상기 인용 특허 문건 집합에 대하여 상기의 피인용출원수 등과 같은 각종 파라미터를 계산할 수 있을 것이다. 이때, 상기 파라미터별로, 상기 출원인별 랭킹을 계산할 수 있을 것이다. 예를 들면, 연도별로 USPC=002/456(Apparrel 중에 서도 MISCELLANEOUS 중에서도 GUARD OR PROTECTOR 중에서도 Body cover)로 특정된 특허 문건 집합에서 출원인들을 추출할 수 있으며, 상기 추출된 출원인별로의 문건 집합을 생성할 수 있게 된다.(예를 들면 미국 등록 번호 06401262호, assignee Benetton Group S.p.A., US Cl. 2/456; 2/411인 문건이 있을 때, 상기 Benetton Group S.p.A.,별로 USPC=002/456에 대응되는 상기 문건 집합을 생성할 수 있다.) 상기 특허 분류 기호별 통계 전처리 모듈은 상기 출원인별로 생성된 문건 집합을 대상으로 하여 동일한 방법으로 상기 인용 문건 집합을 생성할 수 있게 되고, 상기 인용 문건 집합에 대하여 상기의 각종 파라미터들을 계산할 수 있다.
본 발명의 상기 특허 분류 기호별 통계 전처리 모듈이 상기 각종 파라미터들을 계산하는 방법은 확정 또는 특정된 특허 문건 집합별로 계산값을 생성하는 것을 특징으로 한다. 그러므로, 상기 특허 분류 기호별 통계 전처리 모듈의 입장에서는 사기 특허 분류 기호별 통계 전처리 모듈에 입력되는 특정된 특허 문건 집합의 존재가 중요하며, 그 특허 문건 집합의 속성과 크기는 문제되지 않는다.(다만, 인용과 관련된 계산을 하기 위해는 상기 특정된 특허 문건 집합에 인용 정보가 포함되어 있어야 한다.) 그러므로, 상기 특허 분류 기호별 통계 전처리 모듈은 아래와 같은 특정된 특허 문건 집합에 대하여 사전에 상기의 모든 파라미터 값 중 적어도 하나 이상을 계산해 놓을 수 있다. 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에 서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 8) 상기 1) 내지 6)에 기설정된 기간 단위로 특정되는 특허 문건 집합, 9) 상기 1) 내지 8)에 심사청구 여부 등과 같은 특정 국가의 특허 문건에 포함되어 있는 기설정된 선택 사항의 포함 여부별로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합 등 중의 어느 하나 이상이 본 발명의 상기 특허 분류 기호별 통계 전처리 모듈이 계산의 대상이 되는 특허 문건 집합이 될 것이다. 아울러, 본 발명의 상기 특허 분류 기호별 통계 전처리 모듈은 상기 특허 분류 기호별 통계 전처리 모듈을 사용하는 사용자가 지정한 특허 문건 집합에 대해서도 상기 파라미터 중 적어도 어느 하나 이상을 계산할 수 있을 것이다.
특허 정보 처리 기본 모듈(40)
이어서, 본 발명의 특허 정보 처리 기본 모듈(40)에 대해서 설명한다. 상기 특허 정보 처리 기본 모듈(40)에는 1) 검색 엔진 모듈, 2) 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402), 3) 분석 모듈, 4) 감시 모듈(403), 5) 특허 문건 집합 입수 모듈, 6) 디렉토리 생성 모듈(405), 7) 리포팅 모듈(406), 8) 간이 분석 모듈(407) 등이 있다.
이종 복수 특허 분류 기호 관계성 전처리 모듈
상기 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 동종의 특허 분류 기호에 대한 처리를 설명하였다. 이어서, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈에 대해서 설명한다. 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈의 작동 방식과 완전히 유사하다. 미국에서 발행되는 특허 문건에는 하나의 특허 문건에 IPC와 USPC가 동시에 결합되어 있는 것이 거의 전부이며, 일본에서 발행되는 특허 문건에도 IPC와 FT가 동시에 부여되어 있다.된다. 하나의 특허 문건에 IPC1, IPCn이, USPC1, ...USPCm 부여되어 있다고 가정하자.
이 경우, 이종 복수 특허 분류 기호 관계성 처리의 관점에서는 상기 IPC1, IPCn과
USPC1, ... , USPCm사이에는 4가지 종류의 관계성의 조합이 생긴다. 먼저 IPC1과
USPC1의 관계로, 이들은 각각 main IPC와 main USPC의 쌍이 된다. 그리고, IPC1와
USPC2,...USPCm의 쌍으로 이는 main IPC와 sub USPC와의 쌍이 된다. 그리고, IPC2, IPCn와, USPC1의 쌍으로, 이는 sub IPC와 main USPC의 쌍이 된다. 그리고, IPC2, ..., IPCn각각과 USPC2, ... USPCm각각에 대한 쌍으로, 이는 sub IPC와 sub USPC의 쌍
이 된다.
상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 각 4가지 종류별로, 각 종류 하에 있는 이종 복수 특허 분류 기호들 간에서 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈이 수행한 바와 동일한 처리를 할 수 있다. 이때, 이종 특허 분류 기호를 대상으로 하므로, 상기 최소 공통 특허 분류 기호는 없기 때문에 기설정된 값으로 한정할 수 있다. 즉, IPC의 경우에는 subclass에서, USPC에서는 class까지만을 대상으로 하여, 주어진 IPC와 주어진 USPC 쌍에 대하여 상위 특허 분류 기호를 한정지을 수 있다. 즉, 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈은 주어진 특허 분류 기호 조합(Ai, Bj)(단, Ai, Bj는 동일한 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성한 바와 같이, 상기 이종 복수 특허 분류 기호 관계성 전처리 모듈은 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여 상기와 같은 관계성 테이블을 생성할 수 있다. 상기 생성된 관계성 테이블에 대하여 가중치 또는 기여도 가중치를 부여할 수 있을 것이다. 또한, 각 이종 특허 분류 기호 조합(Ai, Bj) (단, Ai, Bj는 다른 체계의 특허 분류 기호이다.)에 대하여, 특허 문건 번호를 대응시킬 수 있음과, 상기 특허 문건 번호로부터 입수되는 서지사항을 반영한 카운팅 및 계산을 수행할 수 있음도 자명할 것이다. 아울러, 특정한 문건 집합에 대하여, 이종 특허 분류 기호 조합(Ai, Bj)를 획득할 수 있을 것이며, 이들 조합에 대한 상기 동종 복수 특허 분류 기호 관계성 전처리 모듈과 동등한 분석을 수행할 수 있을 것이다.
검색 엔진 모듈
검색 엔진 모듈의 구조
먼저 검색 엔진 모듈에 대해서 설명한다. 검색 엔진은 검색의 대상이 되는 데이터를 검색 가능하게 처리하는 인덱서(401-3)(indexer), 상기 인덱서(401-3)로 데이터를 처리한 결과인 검색 인덱스(401-2)(index) 및 상기 인덱스를 대상으로 질의어에 대한 검색을 수행하는 서처(searcher)(401-1)를 포함한다. 통상적으로 넓은 범위의 검색 엔진이라 할 경우 이 3가지를 포함하며, 좁게는 실제로 검색을 수행하는 서처(searcher)(401-1)만을 검색 엔진이라 칭하기도 한다. 다만, 사용자 입장에서 검색 결과를 제공해 주기 위해서는 검색하려는 데이터, 인덱서(401-3), 검색 인덱스(401-2), 및 서처가 필요하게 된다.
부가적인 검색 엔진 모듈의 구성 요소
본 발명의 검색 엔진 모듈에는 상기 인덱서(401-3), 검색 인덱스(401-2) 및 서처 이외에 1) 상기 형태소 분석 모듈(analyzer), 2) 상기 수정 검색식 생성 모듈이 더 포함되어 있을 수 있다. 상기 수정 검색식 생성 모듈은 입수되는 검색식에 특허 분류 기호가 포함되어 있을 경우, 검색 결과로 상기 특허 분류 기호 및 상기 특허 분류 기호의 모든 하위 특허 분류 기호에 관한 정보가 포함되어 검색되도록 하는 역할을 수행한다. 수정 검색식을 생성하는 방법은 전술한 바와 같다.
대표명화 된 출원인 명칭 DB의 활용
본 발명의 상기 인덱서(401-3)가 특허 데이터를 인덱싱 할 때, 출원인 명의를 대표 명화 된 출원인으로 하여 인덱싱할 수 있다.
본 발명의 검색 엔진 모듈의 상기 수정 검색식 생성 모듈은 대표명화 된 출원인 명칭 DB 활용하여, 출원인 필드에 입력된 입력값을 대표명화 된 출원인 명칭 DB에 조회하고, 입력된 대표명화 된 모듈을 더 포함하고 있을 수 있다.
특허 분류 기호 검색 모듈(401)
이어, 특허 분류 기호 검색 모듈(401)에 대해서 설명한다. 특허 분류 기호의 검색이란 검색어로서 기술 키워드를 입력했을 때, 상기 기술 키워드를 타이틀 정보로 포함하고 있는 특허 분류 기호를 검색 결과로 출력해 주는 것을 말한다. 특허 분류 기호를 활용하면, 검색의 정확성과 검색 결과의 노이즈를 구조적으로 제거하는데 도움이 되지만, 특허 분류 기호로 그 의미를 직관적으로 알 수 없는 기호 또는 숫자로 되어 있으며, 그 기호의 숫자가 수만에서 수십만에 이르기 때문에, 각각의 특허 분류 기호의 설명에 해당하는 타이틀 정보 또한 방대하여, 자신이 원하는 특허 분류 기호를 알아 내기가 용이하지 않다. 한편, 자신이 원하는 기술 키워드가 다단계 특허 분류 기호 체계를 브라우징 해 가면서 찾아 내는 것도 1) 특허 분류 기호 체계의 복잡성, 2) 특허 분류 기호를 상위 특허 분류 기호부터 탐색해 들어갈 때 자신이 목적하는 기술 키워드를 만나지 못할 확률 등의 문제로 상당히 어려운 것이 사실이다.
그러므로, 기술 키워드의 입력이 있을 때, 자신이 목적하는 특허 분류 기호를 검색해 주는 것이 필요하게 된다. 이는 특허 분류 기호와 이에 대응되는 타이틀 정보를 인덱싱한 인덱스를 생성해 놓은 다음, 서처를 통해서 타이틀 정보에 포함된 검색어 를 질의하면, 그 검색어가 포함된 타이틀 정보 및 이에 대응하는 특허 분류 기호를 검색 결과로 제공해 줄 수 있게 된다. 이는 통상의 기술로 당업자라면 누구나 손쉽게 특허 분류 기호 검색을 구현할 수 있을 것이다.
이어서, 하기의 예로써 본 발명의 특징적인 특허 분류 기호 검색을 설명한다.
    섹션            : H      전기
    클래스          : H01   기본적 전기소자
    서브클래스      : H01F  자석
    메인그룹        : H01F 1/00  자성재료를 특징으로 하는 자석 또는 자성체
    1-도트 서브그룹 : H01F 1/01 *무기재료로 된 것
    2-도트 서브그룹 : H01F 1/03 ** 보자력에 의해 특징되는 것
    3-도트 서브그룹 : H01F 1/032 *** 경질 자성재료의 것
    4-도트 서브그룹 : H01F 1/04 **** 금속 또는 합금
    5-도트 서브그룹 : H01F 1/047 ***** 조성물로 특징되는 합금
    6-도트 서브그룹 : H01F 1/053 ****** 희토류 금속을 포함하는 것
본 발명의 특허 분류 기호 검색의 첫번째 특징은 하위 특허 분류 기호가 검색되었을 때, 그 검색된 하위 특허 분류 기호의 상위 특허 분류 기호를 함께 그 결과로 제공해 주는 것이다. 예를 들어, 검색어로 "경질 자성재료"가 입력되었을 때, "H01F 1/032 ·. 경질 자성재료의 것"을 검색결과로 제시함과 아울러, 상기 H01F 1/032를 특허 분류 기호 마스트 DB(203)에 조회하여, 상기 특허 분류 기호 체계 트 리에서 상기 H01F 1/032의 기설정된 레벨까지의 상위 특허 분류 기호를 검색 결과로 제공해 주는 것이 바람직할 것이다. 즉, H01F 1/032를 검색어로 입력되었을 때, 하기와 같은 결과가 검색 결과로 나오는 것이 바람직할 것이다. 상기 기설정된 레벨은 IPC의 경우에는 서브클래스 USPC의 경우에는 클래스, FT의 경우에는 테마, ECLA나 FI의 경우에는 서브클래스인 것이 바람직할 것이나, 그 상위나 그 하위 레벨까지 검색 결과로 제시해 주어도 무방할 것이다.
    서브클래스      : H01F  자석
    메인그룹        : H01F 1/00  자성재료를 특징으로 하는 자석 또는 자성체
    1-도트 서브그룹 : H01F 1/01 * 무기재료로 된 것
    2-도트 서브그룹 : H01F 1/03 ** 보자력에 의해 특징되는 것
    3-도트 서브그룹 : H01F 1/032 *** 경질 자성재료의 것
상기와 같은 결과를 출력해 주기 위해서는 다음과 같은 단계를 거친다. 첫째, 검색어로 입력된 키워드를 특허 분류 기호를 타이틀 정보와 함께 인덱싱 해 놓은 특허 분류 기호 인덱스에 질의하여, 상기 검색어를 특허 분류 기호의 타이틀 정보에 포함되어 있는 하나 이상의 검색 결과로서의 특허 분류 기호를 찾아 낸다.("경질 자성 재료"를 입력했을 때, H01F 1/032을 찾아낸다.) 둘째, 찾아낸 특허 분류 기호를 특허 분류 기호 마스트 DB(203)에 질의하여, 상기 특허 분류 기호의 기설정된 단계까지의 상위 특허 분류 기호를 찾아낸다.( H01F 1/03, H01F 1/01, H01F 1/00, H01F를 찾아낸다.) 셋째, 상기 찾아낸 상위 특허 분류 기호를 상기 특허 분류 기호 마 스트 DB(203)에 질의하여 상기 찾아낸 상위 특허 분류 기호의 타이틀 정보를 입수한다. 넷째, 상기 첫째부터 셋째 단계까지의 입수한 특허 분류 기호 및 상기 특허 분류 기호의 타이틀 정보를 도트 구조 등의 계층을 표시하는 정보와 함께 결합하여 표시해 준다.
한편, 상기 특허 분류 기호 검색에서 "경질 자성 재료" AND "희토류"로 검색 질의를 했을 경우, 상기 어느 행에서도 "자석"과 "희토류"가 동시에 들어간 행은 없기 때문에 검색 결과를 제공해 줄 수 없다. 하지만, 특허 분류 기호 체계를 고려할 때는 상기 "H01F 1/053 ******희토류 금속을 포함하는 것"가 검색 결과로 출력되어야만 한다. 그러므로, 상기와 같은 문제를 해결하기 위하여, 단순히 행 단위로만 인덱싱을 하면 특허 분류 기호의 체계성을 반영하는 검색 결과를 제공해 주지 못하게 된다. 이를 위해서는 다음과 같이 특허 분류 기호 및 그 타이틀 정보를 변형한다. 변형의 핵심은 각 타이틀 정보에 자신의 상위 특허 분류 기호의 타이틀 정보를 모두 병합시켜 포함시켜 놓는 것이다. 하기 표 29는 그 일 형태를 보여 주고 있다.
[표 29]
IPC 기호 병합된 타이틀 정보
H  전기
H01 전기; 기본적 전기소자;
H01F 전기; 기본적 전기소자; 자석
H01F 1/00  전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체
H01F 1/01 전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것
H01F 1/03 전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것
H01F 1/032 전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것
H01F 1/04  전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금
H01F 1/047 전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금
H01F 1/053 전기; 기본적 전기소자; 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금; 희토류 금속을 포함하는 것
한편, 상기는 최상위 특허 분류 기호까지 그 타이틀 정보를 병합시켜 놓았으나, 기설정된 레벨까만 병합시켜 놓을 수 있다. 상기 병합시켜 놓는 기설정된 레벨은 IPC의 경우에는 서브클래스 USPC의 경우에는 클래스, FT의 경우에는 테마, ECLA나 FI의 경우에는 서브클래스인 것이 바람직하다. 하기 표 30은 그 일 실시예를 보여주고 있다.
[표 30]
IPC 기호 병합된 타이틀 정보
H  전기
H01 전기; 기본적 전기소자;
H01F 자석
H01F 1/00  자석; 자성재료를 특징으로 하는 자석 또는 자성체
H01F 1/01 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것
H01F 1/03 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것
H01F 1/032 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것
H01F 1/04  자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금
H01F 1/047 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금
H01F 1/053 자석; 자성재료를 특징으로 하는 자석 또는 자성체; 무기재료로 된 것; 보자력에 의해 특징되는 것; 경질 자성재료의 것; 금속 또는 합금; 조성물로 특징되는 합금; 희토류 금속을 포함하는 것
상기 특허 분류 기호와 상기 병합된 타이틀 정보를 행 단위로 인덱싱을 해 놓은 경우, 검색어로 "경질 자성 재료" AND "희토류"를 입수 받으면, 검색 결과로 H01F 1/053을 검색 결과로 찾아내 줄 수 있다. 한편, 하나의 특허 분류 기호가 검색 결과로 나왔을 때(예를 들면 상기 H01F 1/053가 나왔을 때), 상기 검색 결과의 모든 또는 기설정된 상위 특허 분류 기호 및 그 특허 분류 기호의 타이틀 정보를 함께 검색 결과로 제공해 줄 수 있음은 전술한 바와 같다. 즉, "경질 자성 재료" AND "희토류"라는 검색어가 입력되었을 때, 하기와 같은 검색 데이터가 검색 결과에 포함되어야 한다.
    서브클래스      : H01F  자석
    메인그룹        : H01F 1/00  자성재료를 특징으로 하는 자석 또는 자성체
    1-도트 서브그룹 : H01F 1/01 *무기재료로 된 것
    2-도트 서브그룹 : H01F 1/03 ** 보자력에 의해 특징되는 것
    3-도트 서브그룹 : H01F 1/032 *** 경질 자성재료의 것
    4-도트 서브그룹 : H01F 1/04 **** 금속 또는 합금
    5-도트 서브그룹 : H01F 1/047 ***** 조성물로 특징되는 합금
    6-도트 서브그룹 : H01F 1/053 ****** 희토류 금속을 포함하는 것
만약, "금속 AND 보자력"이 검색어로 입력되었을 경우, 하기와 같은 검색 결과로 최종적으로 나오는 것이 바람직하다.
    서브클래스      : H01F  자석
    메인그룹        : H01F 1/00  자성재료를 특징으로 하는 자석 또는 자성체
    1-도트 서브그룹 : H01F 1/01 * 무기재료로 된 것
    2-도트 서브그룹 : H01F 1/03 ** 보자력에 의해 특징되는 것
    3-도트 서브그룹 : H01F 1/032 *** 경질 자성재료의 것
    4-도트 서브그룹 : H01F 1/04 ****합금
도 16은 본 발명의 특허 분류 기호 검색 모듈(401)이 작동되는 일 구현예에 관한 일실시예적 도면이다. 검색은 특허 분류 기호를 선택받는 단계, 특허 분류 기호를 검색할 검색 언어를 선택받는 단계 및 적어도 하나 이상의 검색어를 입력받는 단계 및 입력 받은 검색식으로 검색을 수행하여, 검색 결과를 생성하는 단계로 이루어진다.
특허 문건 집합 입수 모듈(404)
이어 본 발명의 특허 문건 집합 입수 모듈(404)에 대해 설명한다. 상기 특허 문건 집합 입수 모듈(404)에는 자동 선정 문건 집합 입수 모듈(404-1)과 사용자 직접 생성 문건 집합 입수 모듈(404-2)이 있으며, 상기 사용자 직접 생성 문건 집합 입수 모듈(404-2)에는 검색식을 통한 문건 입수 모듈(404-2-1)과 IPC 디렉토리 등과 같이 문건 집합이 특정될 수 있는 디렉토리 상에서의 선택을 통해서 문건 집합을 입수할 수 있는 디렉토리 상에서의 선택을 통한 문건 입수 모듈(404-2-2)이 있다. 상기 검색식을 통한 문건 입수 모듈(404-2-1)에는 검색식의 질의 대상에 따라, 검색 엔진에 질의하는 검색 엔진을 통한 문건 집합 입수 모듈(404-2-1-1)과 DBMS(201)에 질의하는 DBMS (201)를 통한 문건 집합 입수 모듈(404-2-1-2)이 있다. 상기 자동 선정 문건 집합 입수 모듈(404-1)은 본 발명의 명세서 상에서 설명한 특허 문건 집합의 확정에서 소개한 각종 확정된 특허 문건 집합 중 사용자에 의해서 생성된 것을 제외하고는 자동적으로 입수할 수 있다.
다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)
도입 배경
이어 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)에 대해서 설명한다. 특허 정보에 관한 데이터가 DB로 구축되어 있을 경우, 통상적으로 SQL 쿼리문을 사용하여 원하는 결과를 출력해 낸다. 이때, DB 구조가 잘 설계되어 있더라도, 하나의 결과를 도출해 내기 위해서 다수의 테이블을 조인(join)하여야 하고, 각 테이블의 크기가 클 경우, select문 등을 처리하는데 상당히 많은 시간이 걸린 다.
예를 들어, 삼성전자주식회사의 대한민국에서 다출원 IPC 1 dot subgroup별로 연도별 점유율를 구할 경우, 이를 단순 select문으로 구성할 경우, 여러 종류의 테이블(DB 스키마의 설계에 따라 다를 수 있지만 통상적으로 수개 이상의 테이블(예를 들면, 국가별 출원인 테이블, IPC 테이블, 문건 테이블 등)이 join되어야 한다. 먼저 삼성전자의 IPC 1 dot subgroup 레벨에서의 다출원 IPC를 추출해야 하며, 이때, 하위 IPC가 자동적으로 포함되어야 하면 각 IPC별로 하위 IPC를 추출해 내야 한다. 이어, 추출한 1 dot subgroup IPC 에 대하여 삼성전자의 대한민국의 모든 특허 출원 데이터를 기준으로 연도별 출원의 개수를 찾아 낸 다음, 다출원 1 dot subgroup IPC 들을 찾아 낸다. 이어, 찾아낸 다출원 1 dot subgroup IPC 각각에 대한 삼성전자의 출원의 개수와 전체 출원의 개수의 비를 구해 다출원 1 dot subgroup IPC 각각에 대한 삼성전자의 점유율을 구한다. 이를 하나의 SQL 쿼리문으로 작성하면 SQL 쿼리문의 길이가 길 뿐만 아니라, 이를 처리하는데도 오랜 시간이 걸린다. 특히, 본 발명 사상에 도입된 하위 특허 분류 기호에 해당하는 문건을 자동적으로 포함시켜 상기 목적하는 바를 구하기 위해서는 상당히 많은 연산을 수행해야 하며, 이는 응답 속도의 심각한 저해를 가져 온다. 한편, 엘지전자에 대해서 동일한 내용을 처리하거나, IPC subgroup 레벨에서 엘지전자에 대한 점유율을 처리하는 것과 같이 다양하게 변형된 요구 사항이 반복적으로 발생할 가능성이 있게 된다.
이러한 경우, 상기 다양하게 변형된 요구 사항에 부합하도록 특허 정보를 사전에 처리하여 다차원 분석을 위한 연산을 수행하고, 그 결과를 저장한 테이블 데이터가 있는 경우, 그 테이블에 질의하면 응답 속도의 획기적 향상을 가져오게 된다. 다차원 연산에는 롤업 연산이나 큐브 연산 등이 있으며, 특허 데이터를 대상으로 한 이러한 연산 수행의 결과는 DB의 테이블에 저장된다. 이때, 상기 테이블을 큐브, 물리적인 뷰(materialized view, 다차원 분석용 연산 수행 결과 테이블), 뷰(view) 등의 다양한 이름으로 불릴 수 있으나, 이름과는 독립적으로 이름이 지칭하는 내용은 동일하다. 상기와 같은 테이블에 대하여 SQL 쿼리를 사용하여 목적하는 데이터를 추출한다. 큐브 연산을 수행한 다차원 결과 테이블을 대상으로 목적하는 데이터를 추출하는 것은 통상 MDX (multidimensional expression) 쿼리를 사용하나, 본 명세서에는 설명의 편의상 모두 SQL로 통칭한다. 즉, 다차원 분석을 위한 롤업 연산을 수행한 결과 테이블에 접근하는 것은 SQL 쿼리로 질의하는 것이 일반적이며, 다차원 분석을 위한 큐브 연산을 수행한 결과 테이블에 접근하는 것은 MDX 쿼리로 질의하는 것이 일반적이나, 본 명세서에서는 양자 모두 다차원 분석을 위한 연산 수행 결과 테이블에 접근한다는 본질은 같고, 또한 SQL 과 MDX가 그 질의 형식 등에서 대동소이함으로, 기술(description)의 편의상 SQL로 질의한다고 한다. 즉, 다차원 분석용 연산 수행 결과 테이블에 SQL로 질의한다는 말의 의미는 1) 상기 테이블이 롤업 연산을 수행해 놓은 것일 경우, SQL 쿼리로 질의한다는 것이며, 2) 상기 테이블이 큐브 연산을 수행해 놓은 것이면 MDX 쿼리로 질의한다는 것으로 분설하여 이해하여야 한다. 한편, 상기에서 다차원(dimension)이란 1개 차원 이상의 차원으로 분석을 수행한다는 것을 의미한다.(1개 차원의 분석도 당연히 포함하는 개념이 다.)
통상적인 데이터웨어하우스(Data Warehouse, DW) 모델링은 일반적인 OLTP(Online Transaction Processing) 데이터베이스 모델링과는 비정규화 및 스타스키마의 관점에서 구축 방법론에서 차이가 있다. 비정규화는 정규화와 반대되는 개념으로 보통 정규화된 데이터베이스 스키마(본 발명의 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등은 정규화된 스키마를 사용하는 것이 바람직하다.)와는 달리 DB 조인(join) 프로세스를 줄일 수 있다. 비정규화의 개념이 잘 적용되는 예가 롤업 옵션이나 큐브 옵션 등에 잘 나타나 있으며, 이들은 하기에서 설명한다. 비정규화는 빈번하게 참조되는 테이블의 칼럼을 역시 빈번하게 참조되는 테이블에 중복되게 선언함으로써 하나의 테이블로 통합하는 것을 핵심으로 한다. 이렇게 설계하면 단지 중복 선언된 컬러만 참조하면 되므로 조인 프로세스를 획기적으로 줄일 수 있다.
본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 목적하는 정보를 신속하게 출력해 주기 위해, 특허 정보를 롤업 연산 또는 큐브 연산하여 그 결과를 테이블로 생성해 놓는 엔진을 말한다. 특히, 상기 테이블을 사용하는 본 발명의 분석 모듈은 롤업(roll-up)이나 드릴다운(drill down) 또는 드릴스루(drill through) 등이 발생할 때, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성해 놓은 테이블에 간략한 형태의 SQL 질의를 함으로써 신속하게 목적하는 데이터를 생성할 수 있게 된다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204)를 대상으로 하여, 1개 이상의 분석 주제 카테고리별로 롤업 연산 및/또는 큐브 연산을 수행하여 그 결과를 테이블로 생성해 놓는다. 전술한 바와 같이 상기 특허 문건 마스트 DB(202)에는 서지 사항 마스트 DB 등이 있으며, 특허 분류 기호 마스트 DB(203)에는 특허 분류 기호 체계의 종류별로 된 특허 분류 기호 DB 등이 있으며, 주체 마스트 DB(204)에는 출원인 명칭 DB, 발명자 명칭 DB 등이 있으며, 상기 출원인 명칭 DB는 각 국가별로 대표명화 되어 있는 것이 바람직하다.
분석 DW의 구축
분석 DW 의 구성
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등에 포함된 데이터로 적어도 하나 이상의 분석 주제에 대응하여 상기 분석 주제에 적합한 분석 결과를 생성해 주기 위하여 다차원 분석용 연산을 수행하고 그 결과를 테이블로 생성해 둔다. 상기 테이블은 복수개가 있을 수 있으며, 상기 복수개의 테이블들은 분석 DW(data warehouse)를 구성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 재료로 사용하는 특허 정보 테이블의 DB 스키마는 스타스키마로 구축되는 것이 바람직하다.
상기 스타스키마는 상기 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등을 재료로 하여 재구축되는 것이 바람직할 것이다. 상기 마스트 DB들은 정규화되어 있어, 롤업 연산 또는 큐브 연산용으로 최적화 되어 있지 않은 것일 경우가 많다. 그러므로, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 마스트 DB를 대상으로 스타스키마 구조로 재구축된 DB 또는 테이블들을 사용하는 것이 바람직하나, 본질적으로는 상기 마스트 DB들을 그대로 사용해도 이론적으로는 가능하다.
스타스키마로 재구축된 테이블들의 E-R 다이어그램(Entity Relationship Diagram)은 중앙에 FACT 테이블이 있고, 상기 FACT 테이블을 참조하는 기준 정보 테이블로서의 차원 테이블(Dimension Table)이 있다. 상기 FACT 테이블에는 특허 문건에 대한 서지사항 데이터(차원 테이블에 있는 데이터는 제외됨, 다만 차원 테이블의 각 차원의 ID가 있음, 예를 들면 특허 문건에 포함된 특정 IPC(들)를 가리키는 IPC_ID, 특정 출원인(들)을 가리키는 출원인ID 등, 날짜에 대응되는 날짜ID들이 적어도 하나 이상씩 포함되어 있음)가 필드별로 포함되어 있는 것이 바람직하다. 상기 차원 테이블에는 특허 분류 기호(IPC는 필수, 국가별 FACT 테이블일 경우, 각 국가별 특허 분류 기호) 테이블, 연도 등의 날짜 테이블, 출원인/대리인/발명자 등의 주체 테이블, 국가/지역/소속 등과 같은 위치 테이블 등, 차원(dimension)에 속할 수 있는 기타 대상들의 테이블이 있다. 한편, 상기 차원 테이블에는 상기 FACT 테이블에 포함된 각종 ID에 상응하는 ID가 포함되어 있는 것은 당연할 것이다. 예를 들면, IPC 차원 테이블에는 IPC_ID가 있으며, 상기 IPC_ID에는 구체적인 IPC가 1개 대응되어 있다. 상기 스타스키마로 재구축된 테이블들은 기본적으로 국가별로 구축되거나, 국가를 통합하여 구축될 수 있을 것이다. 국가를 통합하여 구축할 경우나 기타의 경우에 패밀리 정보 데이터나 INPADOC 데이터 등과 같이 여러 국가가 함께 관련되는 것은 별도의 테이블로 관리되는 것이 바람직하다.
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 스타스키마로 재구축된 특허 정보 테이블의 데이터를 재료로 하여 본 발명의 각종 분석 목적을 위한 다차원 분석용 연산 수행 결과 테이블을 생성한다. 한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 다른 분석 주제 또는 복잡한 분석 주제에 대한 분석을 위하여 상기 생성해 놓은 다차원 분석용 연산 수행 결과 테이블을 재료로 하여 다른 다차원 분석용 연산 수행 결과 테이블을 생성할 수도 있다. 즉, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 재료로 하는 테이블은 1) 스타스키마로 재구축된 특허 정보 테이블, 2) 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204), 3) 다차원 분석용 연산 수행 결과 테이블 중 어느 하나 이상이다. 한편, 설명의 편의상 스타스키마로 상기 1) ~3)을 재구축된 특허 정보 테이블로 통칭하여 설명하나, 2)와 3)이 배제되는 것이 아님은 당연하다 할 것이다.
다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)과 분석 모듈 간의 관계
본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 DW를 생성하는 분석 DW 생성 모듈(402-1)과 분석 주제별 다차원 분석용 연산 수행 결과를 생성하는 각종 모듈 및 기타 본 명세서의 다차원 분석용 연산 수행 결과를 생성하는데 필요한 기능을 수행하는 모듈이 있다. 상기 분석 주제별 다차원 분석용 연산 수행 결과를 생성하는 각종 모듈에는 총량 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈 (402-2), 인용 분석용 다차원 분석용 연산 수행 결과 테이 블 생성 모듈(402-3), 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈 (402-4), 발명자 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-5), 특허 기술 분류별 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-6), 융합 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-7), 대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402-8) 등이 있다. 상기 각 모듈들은 각각 분석 DW(205 -1), 총량 분석용 다차원 분석용 연산 수행 결과 테이블(205 -2), 인용 분석용 다차원 분석용 연산 수행 결과 테이블(205 -3), 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블(205 -4), 발명자 분석용 다차원 분석용 연산 수행 결과 테이블(205 -5), 특허 기술 분류별 분석용 다차원 분석용 연산 수행 결과 테이블(205 -6), 융합 분석용 다차원 분석용 연산 수행 결과 테이블(205 -7), 대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블(205 -8) 들을 생성한다.
이어, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)과 본 발명의 분석 모듈의 관계에 대하여 설명한다. 상기 분석 모듈은 적어도 하나 이상의 분석 주제별에 대응되는 분석식(SQL 쿼리식)을 포함하고 있으며, 상기 SQL 쿼리식으로 상기 다차원 분석용 연산 수행 결과 테이블에 질의하여 분석 주제별로 목적하는 분석 결과를 입수해 내고, 이를 본 발명의 시스템(1)이 제공하는 인터페이스에 맞게 가공 처리하여 본 시스템의 사용자에게 제공해 준다.
한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 모듈의 성능(목적하는 데이터 추출/계산/입수에 걸리는 시간 감축 및 전산 자원 소모 절약 등)을 감안하여 기설정된 규모/단계 이상의 분석 목적별로 적어도 하나 이상의 테이블을 생성해 놓을 수도 있다. 즉, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 사용자의 화면에 제공되는 최종 분석 결과 화면 데이터까지 생성해 놓을 수도 있지만, 각 분석 주제별로 일정 단계까지만 생성해 놓고(중간 단계까지의 데이터만 생성해 놓고) SQL 쿼리 자체에서 제공하는 각종 명령어들을 사용하여 상기 최종 분석 결과 화면 데이터를 생성하도록 하는 것이 더욱 바람직하다. 이는 상기 최종 분석 결과 화면의 종류가 많을 경우에는 엄청난 비효율(전산 자원의 낭비)를 초래하기 때문에, 후자가 바람직하나, 전자의 방법도 전산 자원의 최적화를 포기한다면(응답 속도의 극대화를 위한다면) 허용될 수도 있을 것이다.
롤업과 드릴 다운
특허 정보 데이터를 상기 물리적인 뷰 데이터로 가공하기 전에 롤업(roll up)과 드릴다운(drill down)의 개념을 설명한다. 롤업과 드릴다운은 데이터 연산에서 기본적인 것이며, 이해의 편의를 위해 예를 들어 설명한다. 다음 표 31과 같은 2006년 출원 데이터가 있다고 가정하자.
[표 31]
2006년 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월
월별출원수 1 2 3 4 5 6 7 8 9 10 1 2
상기와 같은 데이터를 아래와 같이 분기별 및 연도별로 합칠 수 있다. 하기 표 32 는 개념적 설명을 위한 것이며, 이러한 롤업에 대한 데이터 구조는 실제의 개발예마다 다를 수 있다.
[표 32]
2006년 1월 2월 3월 4월 5월 6월 7월 8월 9월 10월 11월 12월
월별출원수 1 2 3 4 5 6 7 8 9 10 1 2
분기 1분기 2분기 3분기 4분기
분기별출원수 6 15 24 13
연도 2006
연도별출원수 58
이러한 방식으로 한번에 하나의 차원을 기준으로 한 방향으로만 작은 단위에서 더 큰 단위로 합치는 것을 롤업 연산이라 한다. 즉, 월 단위값을 분기 단위값으로, 분기 단위값을 연도별 단위값으로 합치는 것이 롤업 연산의 한 예가 되며, , 하나의 차원에서 상위 단위로 합쳐진 결과에 접근하는 것/입수하는 것/추출하는 것을 롤업이라 한다.
한편, 2006년의 58건의 데이터는 1분기 6건, 2분기 15건, 3분기 24건, 4분기 13건의 데이터의 합으로 구성된 것이라는 것을 알 수 있으며2006년의 58건을 1분기 6건, 2분기 15건, 3분기 24건, 4분기 13건으로 나눌 수 있고(왜냐하면 원래부터 나 누어진 것을 합쳤으므로), 각 분기의 건수를 월별로 나눌 수 있게 된다. 이처럼 하나의 차원에서 더 큰 단위에서 작은 단위로 세분화하여 접근하는 것/입수하는 것/추출하는 것/을 드릴다운이라 한다. 그러므로, 롤업과 드릴다운은 동전의 양면과 같은 것이며, 가장 작은 단위에서 가장 큰 단위까지 데이터를 롤업 연산 등의 다차원 연산을 수행해 놓은 다차원 연산된 데이터가 있다면, 가장 큰 상위 단위에서 하위 단위로 드릴다운하여 데이터를 볼 수도 있게 된다.
통상적으로 큐브 연산된 다차원 분석용 연산 수행 결과 테이블에 접근하여 목적하는 데이터를 입수하는 것을 OLAP(online analytic process)이라 하며, 통상적인 OLAP 엔진은 드릴 다운과 드릴 스루 등의 기능을 지원한다.
롤업과 드릴다운
하기 표와 같은 데이터로 특허 분류 기호라는 차원을 기준한 롤업과 드릴 다운을 더욱 상세하게 설명한다. 하기 표를 보면 IPC 등의 특허 분류 기호 체계상에서 주어진 특허 분류 기호에 대하여 직하위 특허 분류 기호에 관한 정보를 확보하는 것의 중요성을 알 수 있다. 특히, 특허 분류 기호의 표기만으로는 상위 및 하위를 구분할 수 있는 특허 분류 기호(예를 들면 IPC의 경우 1dot subgroup 이하의 특허 분류 기호)에 대하여 직하위 특허 분류 기호 정보 입수의 필요성을 역설하는 본 발명의 하위 특허 분류 기호 자동 포함이라는 정보 처리 방법의 중요성에 대해서 실감할 수 있게 된다.
롤업과 드릴 다운의 설명을 하기 표 33를 기준으로 예시적으로 설명한다. 하기 표33은 H04B 7/02를 중심으로 한 특정 기업 A의 특허 출원 수를 나타낸다. 괄호, () 안의 숫자는 A 기업의 출원 특허 문건 중에서 특정 IPC가 나온 문건의 수이다. 한편, 브라켓, {}안의 숫자는 다차원 연산된 숫자이다. 타이틀 정보는 참고를 위하여 부가되었으며, 롤업과는 무관하나, 드릴다운 시 사용자들이 특허 분류 기호만으로는 그 분류 기호가 의미하는 바를 알기 어려우므로, 타이틀 정보를 제공해 주는 것이 타당하며, 특허 분류 기호의 다단계성(하위 특허 분류 기호가 왜 포함되어야 하는 지)의 이해의 편의를 위해서 부가하였다. 4 dot 서브그룹은 H04B 7/02 밑에 없지만, 특허 분류 기호의 다단계성을 보여 주는 차원에서 참고로 추가하였다. 하기 표를 제외하고는 4-도트 서브그룹과 타이틀 정보는 없앤 표로서 설명할 것이다.
[표 33]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 4-도트서브그룹 타이틀/IIPC 설명/특허 분류기호 설명
H04B 7/00(2000){2605} 무선전송시스템
H04B 7/005(64){64} .전송의 제어 ; 등화
H04B 7/01(4){4} .위상편이의 저감
H04B 7/015(3){3} .반향효과의 저감
H04B 7/02(88){207} .다이버시티(diversity)시스템
H04B 7/04(57){114} .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/06(36){36} ...송신국에 있어서의 것
H04B 7/08(21){21} ...수신국에 있어서의 것
H04B 7/10(3){3} .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12(2){2} ..주파수다이버시티 시스템
롤업을 이해하기 위하여 H04B 7/02를 보자. H04B 7/02의 다차원 연산된 숫자는 207(=88+114+3+2)인데, 이 중 88은 특허 문건 중에서 H04B 7/02를 포함하고 있는 문건의 수치이며, 114는 H04B 7/04 및 그 하위 특허 분류에서 기인한 것이며, 3과 2는 각각 H04B 7/06 및 H04B 7/08에서 기인한 것이다. 한편, H04B 7/04의 다차원 연산된 숫자 114(=57+36+21)인데, 이 중 57은 특허 문건 중에서 H04B 7/04를 포함하고 있는 문건의 수치이며, 36과 21은 각각 H04B 7/06과 H04B 7/08에 기인한 것이다. 한편, H04B7/00에 다차원 연산된 문건은 2650인데, 이는 특허 문건 중에서 H04B7/00를 포함하고 있는 문건의 수치와 이 특허 분류 기호의 하부에 있는 다른 특허 분류 기호에서 다차원 연산된 수치이며, 표 33에 포함된 "..."은 H04B7/00의 하부 특허 분류 기호 중에서 상기 표33에서 표시된 것 이외의 다른 것들이 더 있음을 의미한다.
만약 H04B7/02에 대한 특허 문건 정보를 가져 올 때(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등에서) H04B7/02으로 표기된 정보만을 가져와서는 안됨을 알 수 있다. 왜냐하면, H04B7/02에 대한 특허 정보는 특허 분류 기호 체계의 계층 구조상 H04B7/02 이하에 있는 모든 특허 분류 기호에 대한 특허 정보를 포함해야 함이 더 타당할 것이다.(예를 들면, H04B7/02에 해당하는 기술 영역에 속해 있는 모든 문건을 요청할 경우, H04B7/02가 표기되어 있는 문건 뿐만 아니라, H04B7/02 하위에 있는 모든 특허 분류 기호에 해당되는 문건을 포함하여 출력해 주는 것이 타당하기 때문이다.) 그러므로, 본 발명의 하위 특허 분류 포함 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)가 필요한 이유이다. 상기 표33에서 알 수 있듯이, 만약 특허 문건의 IPC 정보에 H04B 7/08가 있는 경우, 이 문건은 H04B 7/04에도 해당되며, H04B 7/02에도 해당되게 된다. 그러므로, 출원수나 등록수 등의 카운팅의 관점에서 보면, H04B 7/04에 대한 카운팅값은 H04B 7/04 그 자신이 표기된 값과 H04B 7/06가 표기된 값, H04B 7/08이 표기된 값을 합 한 값이 된다.
상기와 같은 롤업 및 드릴다운 모든 IPC 및 모든 기타 특허 분류 기호의 모든 레벨에 대해서도 적용될 수 있을 것임은 자명하다 할 것이다. 각 IPC별 드릴 다운의 예를 다음과 같은 형식이 그 일례가 될 수 있을 것이다.
이어, 하기 표들은 연도별로 드릴 다운하는 경우의 일 실시예를 보여 준다. 바로 위의 표33에 나와 있는 정보를 연도를 기준 방향으로 하여 드릴다운 한다면, 아래 표 34와 같은 데이터가 보여질 수 있을 것이다. 표기의 편의상 다차원 연산된 숫자만 남기며, 데이터가 없는 4-도트 서브그룹도 표시하지 않는다.
[표 34]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹
H04B 7/00(200){2605}
상기에서 H04B 7/00을 하위 특허 분류를 기준 방향으로 하여 드릴다운 한다면, 아래 표 35와 같은 데이터가 보여질 수 있을 것이다.
[표 35]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹
H04B 7/00(200){2605}
H04B 7/005(64){64}
H04B 7/01(4){4}
H04B 7/015(3){3}
H04B 7/02(88){207}
이때, H04B 7/015에 대하여 드릴다운한다면 H04B 7/015에는 하위 특허 분류 기호 정보가 없으므로, 추가적으로 변하는 것은 아무것도 없을 것이다. 이때, H04B 7/02에 대하여 드릴다운한다면 아래와 같은 표 36와 같은 데이터가 보여질 수 있을 것이다.
[표 36]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 4-도트서브그룹 타이틀
H04B 7/00(7){37} 무선전송시스템
H04B 7/005(64){64} .전송의 제어 ; 등화
H04B 7/01(4){4} .위상편이의 저감
H04B 7/015(3){3} .반향효과의 저감
H04B 7/02(88){207} .다이버시티(diversity)시스템
H04B 7/04(2){9} .. 떨어져 배치된 복수의 독립공중선을 사용한 것
H04B 7/10(2){2} .. 편파 또는 방향특성에 의해서 특징지어지는 단일공중선시스템을 사용한 것
H04B 7/12(3){3} ..주파수다이버시티 시스템
이어, H04B 7/04를 드릴다운 한다면 아래의 표 37와 같은 데이터가 보여 질 수 있을 것이다.
[표 37]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹
H04B 7/00(200){2605}
H04B 7/005(64){64}
H04B 7/01(4){4}
H04B 7/015(3){3}
H04B 7/02(88){207}
H04B 7/04(57){114}
H04B 7/06(36){36}
H04B 7/08(21){21}
H04B 7/10(3){3}
H04B 7/12(2){2}
상기 표 34~표37는 A 기업의 특정 특허 분류 기호에 대한 출원일/출원연도가 롤업되어 있는 결과이다. 즉, 각 다차원 연산된 결과는 과거부터 2000년까지, 2001년, 2002년, 2003년, 2004년, 2005년 및 현재일로부터 1년 6개월 이전이 속하는 연도부터 현재까지 연도까지(약칭으로 "최근"이라 한다.)로 구분 지어 드릴다운 될 수 있을 것이며, 이를 위해 사전에 A 기업의 특허 문건 집합에 대하여 각 연도 단위로 각 특허 분류 기호에 대응되는 문건의 수치값을 롤업해 놓아야 하며, 하기 표 38은 그 일예를 보여 준다.
설명의 편의상 H04B 7/02를 중심으로 연도별 롤업과 드릴다운을 설명한다.
[표 38]
메인그룹 1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 2000이전 2001(+) 2002(+) 2003(+) 2004(+) 2005(+) 최근(2006-현재) (+) 합계(+)
H04B 7/02(88){207} 25 15 7 30 60 64 6 207
H04B 7/04(57){114} 10 6 3 10 42 39 4 114
H04B 7/06(36){36} 3 0 0 3 17 12 1 36
H04B 7/08(21){21} 5 3 1 5 4 3 0 21
H04B 7/10(3){3} 3 0 0 0 0 0 0 3
H04B 7/12(2){2} 0 0 1 0 0 1 0 2
예를 들어, 상기 2001 옆에 있는 (+) 표시(설명의 편의상 드릴 다운이 가능함을 의미하는 표시로 사용되는 기호를 의미함)에 사용자가 클릭 등의 행위를 하면, 본 시스템(1)은 그 행위를 받아들여, 2001년의 하위 차원(예를 들면 분기(quarter)) 별 데이터를 추출하여 사용자에게 제공해 줄 수 있으며, 이는 하기 표 39에 표현되어 있다.
[표 39]
인룹1-도트서브그룹 2-도트서브그룹 3-도트서브그룹 2000이전 2001(+) 01/1Q 01/2Q 01/3Q 01/4Q 2002(+) 합계(+)
H04B 7/02(88){207} 25 15 1 2 4 8 7 207
H04B 7/04(57){114} 10 6 0 0 6 0 3 114
H04B 7/06(36){36} 3 0 0 0 0 0 0 36
H04B 7/08(21){21} 5 3 3 0 0 0 1 21
H04B 7/10(3){3} 3 0 0 0 0 0 0 3
H04B 7/12(2){2} 0 0 0 0 0 0 1 2
롤업의 기준 방향과 차원
이어, 본 발명에서 사용되는 차원(dimension)에 대해 더욱 상세하게 설명한다. 통상적으로 시간(time)은 일-주-월-분기-연도 등과 같은 다양한 단위로 롤업 또는 드릴다운의 방향축이 되는 차원이 될 수 있다. 한편, 특허 분류 기호 체계 상의 특허 분류 기호도 롤업 또는 드릴다운의 방향축이 되는 차원이 될 수 있다.
먼저 가장 기본적인 시간 차원으로, 일-주-월-분기-연도-복수 연도 단위 기간에서 선택되는 어느 하나 이상이 될 수 있으며, 출원인, 공개일, 등록일 등과 같은 특허 문건에 포함된 모든 종류의 시간 속성 필드에 상기와 같은 다단계 시간 차원을 적용할 수 있다.
다음으로 특허 분류 기호 차원이 있을 수 있는데, 각 국가별로 적어도 하나 이상의 특허 분류 기호 체계를 도입하고 있는 바, 상기 특허 분류 기호 차원은 특허 분류 기호 체계 자체의 다단계성을 그대로 반영하여 차원을 설정할 수 있다. 한편, 상기 적어도 하나 이상의 선택된 특허 분류 기호들의 묶음을 하나의 단위로 하여, 별도의 차원을 설정할 수도 있다. 예를 들면 RFID라는 큰 주제에 대하여 다단계로 상기 주제에 대응되는 다단계 소주제를 설정하고, 상기 소주제에 상기 특허 분류 기호들의 묶음을 대응시키는 방법으로 별도의 차원을 설정할 수도 있다. 이러한 별도의 차원은 개인화된 다차원 분석용 연산 수행 결과 테이블/개인화된 큐브(personalized cube)-사용자 개개인이 자신의 분석 목적을 달성하기 위하여 만드는 테이블/큐브에 특히 유용하다.
지역도 하나의 차원이 될 수 있다. 지역 단위 중에서 특허 문건으로부터 가장 용이하게 입수할 수 있는 단위는 국가이며, 주소 정보로부터 하나의 국가 내에서의 지역별로 분할하여 다단계 계층을 가지는 차원을 생성해 놓을 수 있다.
주체도 하나의 차원이 될 수 있다. 주체에는 출원인, 발명자, 대리인 등이 있으며, 출원인의 속성(기업, 연구소, 대학 등의 속성), 규모(대, 중, 소 등)와 같은 양적 속성, 그룹-계열사 등의 출원인 간의 속성 등도 차원이 될 수 있다. 한편, 기업 등의 주가, 매출, 이익율 등과 같은 기업 재무 정보나 기업 금융 정보 등도 차원이 될 수 있다. 한편, 글로벌 기업, 로컬 기업 등과 같이 임의로 각 기업마다 대응시킬 수 있는 메타 속성 또한 차원이 될 수 있다.
한편, 출원, 등록, 거절 등과 같은 문건의 현황에 속성도 차원이 될 수 있다. 한편, 각종 카운팅 값을 그룹화시킬 때, 각 카운팅 값이 속하는 그룹도 차원이 될 수 있다. 이러한 그룹의 예로, 청구항 1~5개, 6~10개, 10개~15개, 15개 이상 등과 같은 것이 그 한 예가 되며, 공동 출원인 수, 공동 발명자 수, 패밀리 수(국내 패밀리 수, 해외 패밀리 수 등) 등도 수 그 자체는 차원이 될 수 없지만, 그 수가 그룹화될 때, 그 수가 속하는 그룹은 차원이 될 수 있다.
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택되는 적어도 하나 이상의 차원별로 다차원 연산을 수행하여 다차원 분석용 연산 수행 결과 테이블을 생성해 놓는다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 다차원 분석용 연산 수행 결과 테이블을 생성할 때, 특허 분류 기호가 차원에 포함되어 있을 경우, 주어진 상기 특허 분류 기호에 대한 다차원 연산 값이 생성될 때, 상기 특허 분류 기호 및 상기 특허 분류 기호의 상위 특허 분류 기호를 함께 고려하여 다차원 연산값을 생성하는 것이다. 이렇게 다차원 연산값이 생성되면, 임의의 특허 분류 기호에 대한 다차원 연산값을 입수할 때, 그 특허 분류 기호 및 그의 하위 특허 분류 기호들에 대한 모든 값들이 다차원 연산된 수치값들이 반영되어 생성된 값을 입수하게 된다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진 특허 문건에 포함된 특허 분류 기호가 있을 때, 상기 특허 분류 기호 뿐만 아니라, 상기 특허 분류 기호의 상위 특허 분류 기호에도 상기 특허 분류 기호에 대한 다차원 연산을 수행한 값을 반영한다. 예를 들면, 문건 번호 #1에 H04B 7/06이라는 IPC가 부여되어 있을 경우, 이 문건으로 다차원 연산 데이터를 생성할 때, H04B 7/06에도 카운팅 값 1을 부여하고, 상기 H04B 7/06은 직상위인 H04B 7/04, H04B 7/02에도 카운팅값을 부여해야 한다. 물론, H04B 7/00이상의 상위 레벨에도 카운팅값이 부여됨은 상식적일 것이다.
이와 같이 롤업과 드릴다운의 방향 축이 되는 것들이 주로 차원(dimension)이 되는데, 이러한 차원으로는 IPC 등의 특허 분류 기호, 시간 등이 대표적이며, 국가, 지역, 출원인, 발명자, 상태, 인용, 패밀리 정보 등도 차원축이 될 수 있다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택된 적어도 하나 이상의 각 차원을 롤업의 대상 축으로 하여 사전에 총량, 점유율, 집중율, 활동율 등과 같은 분석 지표값을 계산해 놓는다.
먼저 공간적으로 볼 때, 전체 국가-개별국가-개별국가 내 지역(특허 정보에는 출원인 및/또는 발명자의 국가 및/또는 주소 정보가 포함되어 있다) 예를 들면, 전체 국가-대한민국-서울특별시-강남구...등과 같이 단계별로 세분화할 수 있다. 이는 시간-도-기--...동일한 방법이 될 것이다.
출원인을 세분화 한다면, 출원인(국가 통합)-각 국가별 출원인으로 세분화할 수 있을 것이며, 모든 국가 통합과 각 국가별 사이에 중간 규모의 지역(북미, 아시아, 유럽, 중동, 남미, 아프리카 등)을 도입할 수 있을 것이다. 중간 규모를 도입하기 위해서는 반드시 북미에 해당하는 국가명(예를 들면, 미국, 캐나다, 멕시코 등)을 북미라는 중간 카테고리에 맵핑(mapping)해 놓아야 한다.
또한, 출원인에서 발명자까지를 롤업/드릴다운해 놓을 수 있는데, 방향은 크게 다음과 같은 것들이 예가 될 수 있다. 1) 출원인(국가 통합)-출원인-각 국가별 발명자로 롤업/드릴다운하거나 2) 출원인(국가통합)-발명자(국가통합)-국가별 발명자로 롤업/드릴다운할 수 있을 것이다. 한편, 하나의 국가 내에서도 출원인의 속성별로 롤업/드릴다운할 수 있을 것이다. 예를 들면, 출원인을 기업, 대학교, 연구소 등의 조직 유형단위로 나누고, 각각 기업을 대기업, 중견기업, 중소기업으로 나누고, 대학교를 국공립대, 사립대, 전문 기술 대학 등으로 나누고, 연구소를 공공 연구소, 민간 연구소 등으로 세분화시킨 다음 이들에 대해서 롤업/드릴다운할 수 있을 것이다. 이때, 각 출원인에 대하여 맵핑 정보가 있어야 함은 당연할 것이다. 예를 들면, 출원인 A가 기업이고, 그 규모는 중소기업에 속한다는 정보가 맵핑되어 있어야 한다.
이때, 기업 등에 대한 재무제표 데이터가 있는 경우, 보다 다양한 롤업/드릴다운을 할 수 있다. 예를 들면 기업 재무제표로 매출, 이익, 주가 및 이들 각각의 증감율 등에 관한 정보가 있다고 했을 때, 각 기업-매출규모-매출규모 범위별, 기업-이익-이익증감율, 또는 기업-주가-주가증감율 범위 등 다양한 카테고리별로 롤업/드릴다운 할 수 있을 것이다. 즉, 롤업/드릴다운의 본질은 하나의 대상에 대한 복수의 카테고리 정보가 있을 때, 그 카테고리별로 정보 처리 결과를 배치하는 것이다. 하나의 특허 문건에 국가, 시간, 출원인, 발명자, 특허 분류 기호 정보가 있고, 출원인 정보에 그 출원인의 지역 정보가 있다. 그리고, 출원인이 기업일 경우 그 기업의 재무제표 정보 등이 있을 기업 정보 DB로 구축되어 있을 수 있다. 이때, 전체 또는 설정된 임의의 특허 문건 집합 단위로 1) 특허 분류 기호 정보와 같이 하나의 선택된 카테고리가 다단계 계층 구조를 지닐 경우, 그 카테고리 내에서 선택된 특허 분류 기호에 대응되는 각종 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)를 하고 그 결과를 출력해 줄 수 있게 되며, 2) 2종 이상의 카테고리 에 대한 다양한 교집합(카테고리의 종류를 n이라 할 때, 가능한 교집합의 수는 nCr,(n combination r, r은 r은 1 이상이나 n보다 작거나 같다.)이나, 이 모든 조합이 다 선택가능하지는 않을 수 있으며, 특별한 분석적 의미를 가지지 조합도 나올 수 있음은 당연할 것이다)을 기준으로 롤업/드릴다운할 수 있을 것이다.
교집합을 통해 롤업/드릴다운할 경우에는 다음과 같은 점을 주의해야 한다.
첫째는 2개의 카테고리를 사용할 때이다. 예를 들면 A 카테고리(예를 들면 시간), B카테고리(예를 들면 IPC)를 대상으로 롤업/드릴다운할 경우, 정보 처리(검색, 또는 카운팅 또는 기타 여타의 통계, 분석, 계산 등)의 결과 표현의 편의상 1개 방향(예를 들면 세부 IPC로 시간축은 드릴다운하지 않고, IPC만 펼쳐지거나(이에 대해서는 위의 롤업/드릴다운 개념을 설명할 때 예시하였다)으로 드릴 다운하는 것이 바람직하다. 물론, IPC도 드릴다운하고, 시간축도 드릴다운 할 수 있지만, 이 경우에는 결과가 너무 복잡해 보일 수 있으므로, 특별한 경우가 아니면 지양하는 것이 바람직하다. 물론, 롤업은 양향방 모두에 대하여 수행해 놓아야 한다. 즉, 롤업은 카테고리 A의 기설정된 단위와 카테고리 B의 설정된 단위의 모든 조합으로 구성되는 셀에 대한 정보값을 기초로, 각 셀의 A 카테고리 방향으로도 롤업 정보 처리를 해 놓아야 하며, B 카테고리 방향으로도 롤업 정보 처리를 해 놓아야 한다. 상기 바로 위의 표는 그 일례를 보여 주고 있다. 셀 안의 각 수치는 상기 셀에 대한 정보값에 해당하고, {}안의 숫자는 각 특허 분류 기호 레벨에서의 2000년부터 2005년까지의 연도별 특허 건수를 롤업해 놓은 것에 해당하며, H04B 7/02{17}에서의 17은 H04B 7/02 및 자신의 하위 특허 분류 기호까지의 특허 문건 수를 롤업해 놓은 값이 된다. 위 표에서는 연도를 기준으로 롤업(예를 들어, 2005년의 모든 특허 문건 수가 몇 개다, H04B 7/02에 2005년도에 몇 개다 등은 표시되어 있지 않지만, 이 또한, 롤업되어 표시 될 수 있다는 것은 당연할 것이며, 2005년을 구성하는 분기별, 월별로 다차원 연산된다는 것도 당연할 것이다.)
둘째는 3개 이상의 카테고리를 사용할 때이다. 이 경우에도 드릴다운은 선택되는 한 방향으로 펼쳐지는 것이 바람직하며, 2 방향으로 펼쳐지는 것도 허용될 수 있으나, 3 방향으로 펼쳐지는 것은 시각적으로 표현이 불가능하거나 극히 어려우므로 지양하는 것이 바람직하다. 이 경우에도 롤업은 모든 카테고리에 대해서 계산되어 있는 것이 바람직하나, 롤업 계산량과 사용 빈도에 따라서 사전에 롤업할 필요가 없는 차원축에 대해서는 롤업해 놓지 않고, 사용이 발생하는 시점에서 처리하는 것도 좋을 것이다. 롤업을 해 놓지 않아도 필요로 하는 정보를 그 발생 시점에서 롤업하여 처리할 수 있으나, 롤업 처리를 위하여 상대적으로 긴 시간이 소모될 수 있다. 예를 들어, 연도별로 롤업 처리를 해 놓지 않은 경우라면, 대상이 되는 모든 문건의 서지 사항에서 연도 정보를 입수하고, 연도별로 분리하여 계산하고, 연도별로 출력해 주면 연도별 드릴다운의 효과를 낼 수 있다. 다만, 이를 사전에 연도별로 분리하여 계산하고, 이를 롤업해 놓으면, 나중에 연도별로 드릴다운할 때, 롤업해 놓은 연도별 정보를 단지 읽어와서 디스플레이 해 주면 되어 응답 속도면에서 유리하다.
총량 분석용 다차원 분석용 연산 수행 결과 테이블데이터
총량 분석용 다차원 분석용 연산 수행 결과 테이블데이터
이하, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블에 대해 더욱 상세하게 설명한다. 아울러, 상기 다차원 분석용 연산 수행 결과 테이블에 상기 분석 모듈이 어떻게 접근하여 어떠한 데이터를 생성하는지에 대해서도 아울러 설명한다.
통상적으로 특허 문건에 표기되는 출원일 표기가 연월일의 표기가 있으므로, 일단위로 각 특허 분류 기호별로 카운팅이 되어 있는 경우, 이를 월단위, 분기단위, 연단위로 다차원 연산을 수행할 수 있을 것이다.
하기 표 40은 다차원 연산이 수행된 결과 테이블의 일 실시예적 일부분을 보여 준다. 하기 표 40과 같은 데이터는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 스타스키마로 재구축된 특허 정보 테이블에서 출원인과 IPC 및 연도별 날짜 정보를 기준으로 사전에 출원인별, 연도별 다단계 IPC의 각 계층별로 특허 문건의 개수를 카운팅하는 방법으로 생성해 놓은 데이터이다. 표 40과 같은 데이터는 테이블/뷰/물리적인 뷰(materialized view) 등의 임의의 형식으로 저장되어 있을 수 있으며, 저장된 테이블에 포함된 데이터는 적절한 SQL 쿼리문을 사용하여 추출할 수 있다.(예를 들면, 출원인 A의 IPC 1 dot 서브그룹 기준(하기에서는 C5 레벨)에서의 다출원 IPC별 (다차원 연산된)연도별 출원수를 가져오는 것이 그 한 예가 된다. 아울러 출원인별 연도별 출원수를 생성하는 것도 당연할 것이 다.(이를 위해 연도별 총합계 데이터가 있으면 더욱 좋다(하기 표 40에서는 공간 제약상 표시하지 않았음, 없더라도 연도별로 합하면 된다.)) 특히, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 IPC 등의 특허 분류 기호 DB를 참조하여, 와일드카드(*, ? 등)등으로 접근할 수 없는 자신의 특허 분류 기호의 하위 특허 분류 기호에 해당하는 정보를 다차원 연산을 수행해 놓아야 한다.(이는 특히 IPC의 경우 subgroup이하, USPC의 경우에는 class 레벨 미만 FT의 경우에도 타이틀 정보에 dot가 있는 레벨에서 더욱 더 중요하다)
[표 40]
GC C5 C6 C7 C.. 01 02 03 04 05
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 6 3 10 42 39
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 15 7 30 60 64
상기 테이블을 설명하면 다음과 같다. AppName은 출원인명을, C밑의 숫자는 IPC의 루트(root) 노드로부터의 노드 계층(C1은 섹션, C2는 클래스, C3는 서브클래스, C4는 메인그룹, C5는 1 도트 서브그룹, C6은 2 도트 서브그룹, C7은 3 도트 서브그룹을 말한다. 이하 C8부터 C20까지가 배정되어 있을 수 있다. 통상적으로 C15까지면 충분하다.)을, 01, 02 등은 연도를 말한다. 연도는 00년 이전에도 있으며, 이에 대한 숫자는 생략하였다. 현재를 07년으로 볼 경우, 현재까지 공개된 문건을 기준으로 한 출원일 기준의 수치값이 각 셀의 데이터값이다.
한편, 상기 테이블에서 값을 생성할 때, 합계 필드의 각 셀에 들어가는 값은 각 연도별 값의 합산값을 취하면 되고, 회색 기간은 현재일을 기준으로 1년 6개월(통상적인 출원일 이후 강제 공개 기간임) 이전일이 속한 연도부터 현재일까지를 단위 기간으로 하여 그 기간에 속하는 각 연도별 값의 합산값을 취하면 된다.
GID는 어느 레벨까지 다차원 연산된 결과인지를 보여주는데 사용된다. GID 7의 H04B 7/02의 경우는 자기 자신(C5)까지 모두 다차원 연산된 결과(예를 들어 64 = 24+39+0+1)를, 이보다 한단계 낮은 GID 3의 H04B 7/02는 C6레벨까지(자기 자신 제외) 다차원 연산된 결과를 보여 준다. 24는 GID 1에서 나온 값이며, 이 24는 H04B 7/02라는 특허 분류 기호가 표기되어 있는 특허 문건의 숫자를 말한다. GID 값의 표기는 임의 방식일 수 있으나(임의의 약속임) 본 명세서에서는 "2의 n좌승-1"의 수열을 이루는 방식으로 표기했다.
GID는 롤업의 단계를 말하는 것으로 C8 레벨까지의 롤업된 것을 GID 0, C7 레벨까지의 롤업된 것을 GID 1, C6 레벨까지의 롤업된 것을 GID 3, C5 레벨까지의 롤업된 것을 GID 7, C4 레벨까지의 롤업된 것을 GID 15, C3 레벨까지의 롤업된 것을 GID31, C2 레벨까지의 롤업된 것을 GID 63라 표시한다. 이때, C8 레벨 이전 및 C1레벨에서도 GID를 할당할 수 있음은 자명하나, 크게 실효성이 없어 시스템(1)에 반영하지 않아도 무방할 것이다. H04B 7/06에 GID 0은 C8 레벨까지 롤업하였다는 것 이며, GID 1은 C7레벨까지 롤업하였다는 것이다.(상기 예에서는 C8에 값이 없으므로 C7까지 롤업된 것과 C8까지 롤업된 값은 같다.)
본 명세서에서 사용하는 GID 및 특허 분류 기호의 레벨과의 대응 관계에 대한 일 실시예이며, 하기 표 41을 중심으로 이에 대해 설명한다.
[표 41]
GID 대상 범위 IPC 레벨 USPC 레벨 FT 레벨 ECLA 레벨
0 C8 4 dot 4 dot 4 dot 4 dot
1 C7 3dot 3dot 3dot 3dot
3 C6 2dot 2dot 2dot 2dot
7 C5 1dot 1dot 1dot 1dot
15 C4 main group 0dot 00 레벨 main group
31 C3 subclass class 테마코드 subclass
63 C2 class super category super category class
127 출원인 출원인 출원인 출원인 출원인
255 전체 전체 전체 전체 전체
상기 GID는 그 대응 레벨까지의 롤업한다는 것을 의미하는 코드이다. 예를 들면, GID 15는 C4레벨이며, 이는 IPC로 메인그룹, USPC는 0dot, FT로는 00레벨, ECLA로는 메인그룹까지 롤업(자기 자신 및 자신의 하위 모든 특허 분류까지 롤업)한 정보가 그 행에 기록되어 있음을 의미한다. 그러므로, 어느 레벨에서 정보를 보기를 원하는 경우, 그 레벨에 해당하는 GID를 지정하면, 그 레벨까지의 다차원 연산된 정보를 볼 수 있다. 본 명세서에서는 GID라는 약칭을 사용하나, 이는 의미상 "롤업 레벨 코드"라고 할 수 있다. 이상과 이하에서, 롤업 레벨 코드와 GID는 같은 의미로 사용된다. FT에서 00레벨은 통상 AA 등과 같이 뒤에 숫자가 없고 영문자 2자로 된 레벨을 의미한다. 수퍼카테고리란, USPC나 FT 같은 경우에는 각각 class, 테마코드 레벨의 항목이 너무 많아 이를 카테고리별로 그룹핑한 것을 말한다.
상기 표 40에서 알 수 있듯이, 상기 테이블에서 각 행의 각 특허 분류 기호는 좌측 에 자신의 직상위 특허 분류 기호를 갖고 있음을 알 수 있다. 본 발명의 다차원 분석용 연산 수행 결과 생성 모듈은 상기 표 40과 같은 데이터로서 상기 각 IPC 기호마다의 다차원 연산된 수치값을 생성해 낸다. 이러한 것은 특정 출원인 A의 국가별 모든 특허 문건 집합에 대하여 각 특허 문건 집합에 포함되어 있는 모든 특허 분류 기호별로 생성해 놓을 수 있다. 한편, 상기와 표 40과 같은 데이터를 모든 출원 문건을 기준으로 생성해 놓을 수도 있으며, 모든 등록된 문건만을 대상으로 하여 생성해 놓을 수도 있다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 표 40과 같은 다차원 분석용 연산 수행 결과 테이블은 특정한 기설정된 속성을 지니는 문건 집합별로 생성해 놓을 수 있다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 1) 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하는 단계, 2) 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하는 단계, 3) 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하는 단계를 거쳐서 이루어진다. 상기 1) ~2) 단계를 거치면, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 기설정된 처리의 대상이 되는 처리 대상 문건 집합이 생성된다. 상기 FACT 테이블은 모든 문건 전체 집합에 대한 FACT 정보가 포함되어 있다. 상기 FACT 정보에는 문건 고유 정보가 포함되어 있음은 당연하며, 각종 서지 사항 정보 가 더 포함되어 있을 수 있다. 상기 문건 고유 정보는 출원번호 또는 문건 고유 코드 또는 문건 일련 코드인 것이 바람직하다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 기설정된 분석 주제별로 국가별 또는 국가 통합별 모든 문건에 대하여 적어도 하나 이상의 기설정된 분석 주제별로 적어도 하나 이상의 상기 다차원 분석용 연산 수행 결과 테이블을 생성하는 것이 바람직하다. 상기 임의의 문건 집합에는 사전에 규정 가능한 적어도 하나 이상의 속성을 공유하는 임의의 문건 집합일 수 있다. 이러한 임의의 문건 집합 종류에는 예시적으로 1) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호로 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 2) 특정 국가 DB에서 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 3) 특정 국가 DB에서 특정 출원인의 특허 문건에 발명자로 포함된 특정 발명자 명의(즉, 출원인 명의 and 발명자 명의)에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 4) 특정 국가 DB에서 특정 대리인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 5) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호 및 특정 출원인 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 6) 특정 국가 DB에서 특정 특허 분류 기호 체계상의 특정 특허 분류 기호, 특정 출원인 명의 및 특정 발명자 명의에 의해 특허 문건 집합을 특정하는 방법에 의해서 생성되는 특허 문건 집합, 7) 상기 특정 국가 DB에서 특정 출원인 명의 및 특정 대리인 명의에 의해 특허 문건 집합을 특정 하는 방법에 의해서 생성되는 특허 문건 집합, 8) 특정 국가의 모든 특허 문건 집합, 9) 적어도 2 이상의 국가의 모든 특허 문건 집합, 10) 상기 1) 내지 9)에 기설정된 기간 단위로 특정되는 특허 문건 집합 등이 그 예가 될 것이다. 한편, 상기 임의의 문건 집합에는 제1국 이외의 해외 국가에 패밀리 정보가 있는 것에 대해서만 생성해 놓을 수도 있고, 미국의 경우 재발행 특허 문건(reissued document)으로만 이루어지는 문건 집합일 수 있다. 본 문단에서 언급하는 문건 집합은 예시적인 것이며, 이러한 예시적인 것들에 대해서, 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 기설정된 분석 주제별로 상기 문건 집합에 대하여 적어도 하나 이상의 기설정된 분석 주제별로 적어도 하나 이상의 상기 다차원 분석용 연산 수행 결과 테이블을 생성하는 것이 바람직하다.
한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 사용자가 생성한 임의의 문건 집합에 대해서도 상기 표 40과 같은 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 1) 상기 사용자가 생성한 임의의 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하는 단계, 2) 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하는 단계, 3) 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하는 단계를 거쳐서 이루어진다.
총량 데이터의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 처리 방법
상기 표와 같은 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기설정된/입수된 문건 집합(예를 들면 특정 국가의 출원 또는 등록된 모든 문건들의 집합)에 대하여 다음과 같은 단계를 처리한다.
첫째, 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하고, 상기 스타스키마 구조로 재구축된 테이블의 FACT 테이블에서 특허 문건을 특정 지을 수 있는 키값이 있는 키값들만을 추출하고, 상기 추출된 키값들에 해당하는 특허 문건만을 대상으로 적어도 하나 이상의 기설정된 분석 주제별 다차원 연산용 기초 테이블용 명령어 집합(상기 명령어 집합은 script일 수 있다.)을 입수한다.(이때, 상기 다차원 연산용 기초 테이블을 대상으로 한 분석 주제별 다차원 연산 실행 명령어 집합도 동시에 입수할 수 있을 수 있다.) 만약 특정 국가의 출원 또는 등록된 모든 문건들로 이루어진 특허 문건 전체 집합일 경우, 다른 과정 없이 상기 적어도 하나 이상의 기설정된 분석 주제별로 다차원 분석용 연산 수행 결과 테이블을 생성하기 위한 분석 주제별 명령어 집합만을 입수한다. 즉, 본 단계에서는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 기설정된 처리를 하기 위한 처리 대상 문건 집합이 확정되고, 기설정된 처리를 하기 위한 분석 주제별 명령어 집합이 확정되게 된다.
둘째, 상기 처리 대상 문건 집합의 개개의 문건을 대상으로 분석 주제별 명령어 집 합을 실행하여 다차원 연산을 위한 기초 테이블을 생성한다. 상기 다차원 연산을 위한 기초 테이블에는 적어도 하나 이상의 차원에 관한 정보를 포함하며, 상기 각 레코드에는 다차원 연산을 수행하기 위한 각 차원별 기초 데이터가 입력되어 있어야 한다. 상기 기초 데이터는 존재 유무(1 또는 null)에 관한 정보(출원/등록이 발생했다, 없었다)에 관한 정보와 각종 카운팅 정보(청구항 수 등 본 명세서에서 카운팅 정보로 언급한 정보들 중 어느 하나 이상)가 포함될 수 있다. 상기 차원은 1) 특허 분류 기호의 종류별 특허 분류 기호 차원 2) 날짜 차원, 3) 위치 차원(국가, 지역 등), 4) 주체의 속성 차원(출원인, 발명자, 대리인 중 선택된 어느 하나 이상에 대한 규모, 속성 등에서 구분되는 차원(예를 들면, 출원인을 기업, 대학, 연구기관, 개인 및 기타로 나누고, 기업을 다국적 기업, 대기업, 중소기업, 등으로 나눌 수 있을 것이다. - 이는 주체 마스트 DB(204)에서 각 출원인의 속성을 참조하여 입수될 수 있다.) 중에서 선택되는 어느 하나 이상 또는 이들 중에서 조합되어 생기는 복합 차원 중 어느 하나 이상이 될 수 있다.
이때, 각 차원에 필요한 서지 사항을 입력하기 위하여 상기 다차원 연산을 위한 기초 테이블에는 필드가 설계되어 있어야 한다. 필드에는 특허 분류 기호 차원에는 IPC일 경우, 섹션부터 n dot 서브그룹, USPC일 경우 (수퍼카테고리부터)class부터 n dot 레벨까지 등과 같이 특허 분류 기호 체계 상의 모든 상위 및 하위 특허 분류 기호를 수용할 수 있도록 각 레벨별 필드가 있어야 한다. 한편, 시간 차원을 위해서는 분석을 위한 가장 작은 단위의 필드가 있으면 좋다. 특허 분석의 경우, 일 또는 주 단위 분석까지 필요없는 경우라면 월 필드까지만 있으면 충분할 것이다. 한 편, 출원인 속성 차원이 있다면, 기업(다국적 기업, 대기업, 중소기업), 대학, 연구원, 개인, 기타에 해당하는 필드가 있어야 할 것이다.
예시로 상기 다차원 연산을 위한 기초 테이블에, 출원인을 기준으로 특허 분류 기호 차원과 출원일 차원만이 포함되어도 충분할 경우, 출원인 A의 2005년 1월 3일에 출원하고, IPC가 IPC가 H04B 7/06인 문건에 대해 하기 표 42와 같은 데이터가 생성되면 된다.
[표 42]
국C1 C2 C3 C4 C5 C6 C7 05/01 05/02 05/03
H H04 H04B H04B 7/00 H04B 7/02 H04B 7/04 H04B 7/06 1
한편, 기간과 출원인 속성에 다음과 같이 입력되어도 무방할 것이다. 하기 표 43과 같은 데이터는 연도 및 출원인 속성에서 부분적으로 다차원 연산을 수행해 놓은 것으로 후술하는 다차원 연산 시에 처리될 수도 있지만, 사전에 생성해 놓아도 문제될 것은 없다.
[표 43]
C1 C2 C3 C4 C5 C6 C7 05 05/01 05/02 05/03
H H04 H04B H04B 7/00 H04B 7/02 H04B 7/04 H04B 7/06 1 1
한편, 출원인의 위치나 출원인의 재무 레벨 등의 기업 평가, 패밀리 수의 범위를 기준으로 한 패밀리 수 차원, 청구항 수 범위를 기준으로 한 청구항 수 차원 등이 더 포함되어 있을 수 있는데, 이는 하기 표 44와 같이 추가적인 데이터가 포함되어 있으면 된다.
[표 44]
국가 State City 패밀리 수 범주 1 패밀리 수 범주 2 기업 평가 n-1 기업 평가 n-2 청구항수 범위 1 청구항 수범위 2
Kr 경기도 수원시 1 1 1
상기와 같은 데이터를 생성하는 방법은 다음과 같다. 1) 문건에 포함된 특허 분류 기호를 특허 분류 기호 마스트 DB(203)에 조회하여, 상기 특허 분류 기호의 모든 상위 특허 분류 기호를 입수하고, 상기 입수된 모든 상위 특허 분류 기호를 각각의 레벨에 맞게 입력한다. 예를 들면 IPC가 H04B 7/06일 때는 3 dot 서브그룹(C7) 레벨에는 H04B 7/06, 2 dot 서브그룹(C6) 레벨에는 H04B 7/04, 1 dot 서브그룹(C5)레벨에는 H04B 7/02, 메인그룹(C4)레벨에는 H04B 7/00, 서브클래스(C3)레벨에는 H04B을, 클래스(C2) 레벨에는 H04를, 섹션(C1) 레벨에는 H를 입력한다. 2) 출원일/등록인 등의 각종 날짜 정보 중에서 필요한 기준날짜(여기서는 출원일) 기준으로 시간 차원에 필요한 값을 넣는다. 만약 출원일이 기준 날짜이고, 2005. 1월 3일이고, 시간 차원이 월, 분기, 년의 차원으로 나뉘어 있다면, 2005년에 1월에 1을 입력한다. 3) 기타 서지 사항을 기타 차원에 입력한다. 그리고, 대기업에 1을 입력한다. 주소 정보를 이용하여 출원인의 위치와 같은 필드값을 채우고, 특허 문건 마스트 DB(202)를 조회하여 대상이 되는 특허 문건의 패밀리 수를 조회하고, 그 조회값이 어느 범주에 들어가는지를 판단하여 그 범주에 1을 기록한다. 청구항 수 범위도 패밀리 수와 마찬가지로 처리한다.
하나의 문건에 특허 분류 기호가 2가지 종류 이상이 있을 경우(예를 들면 IPC와 USPC), 각 종류별로 상기 다차원 연산을 위한 기초 테이블을 생성해 놓을 수도 있으며, 하나의 테이블 내에 2가지 종류 이상의 특허 분류 기호를 처리해 놓을 수도 있을 것이다. 한편, 동일한 종류의 특허 분류 기호가 복수개가 문건에 포함되어 있을 경우, 개개의 특허 분류 기호에 대하여 독립적인 레코드를 생성하는 것이 바람직할 것이다. 한편, 만약 출원인이 2 이상의 공동출원인 경우에는 각 출원인별로 동일한 정보를 가지는 레코드를 출원인의 수만큼 생성한다.(만약 주체가 발명자라면 발명자별로 레코드를 생성하고, 대리인 분석을 위한 경우, 주체가 대리인이라면 대리인별로 레코드를 생성한다.)
셋째, 상기 다차원 연산을 위한 기초 테이블을 대상으로 다차원 연산을 수행하고, 다차원 분석용 연산 수행 결과 테이블을 생성한다. 하기 표 45와 같은 테이블의 데이터는 IPC 차원을 기준으로 시간 차원은 연도 차원까지 롤업 연산을 수행한 결과를 보여 주고 있다.(표기의 편의 상 04년도에 대한 것만 분기-연도로 롤업 연산됨을 표시한다.)
[표 45]
C5 C6 C7 C.. 01 02 03 04 04/1Q 04/2Q 04/3Q 04/4Q
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 1 2 3 11
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 1 2 3 11
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 1 2 1 0
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 1 2 1 0
H04B 7/02 H04B 7/04 3 2 2 21 4 4 4 9
H04B 7/02 H04B 7/04 3 2 2 21 4 4 4 9
H04B 7/02 H04B 7/04 6 3 10 42 6 8 8 20
H04B 7/02 H04B 7/10 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0
H04B 7/02 H04B 7/12 0 1 0 0
H04B 7/02 H04B 7/12 0 1 0 0
H04B 7/02 H04B 7/12 0 1 0 0
H04B 7/02 9 3 20 18 6 6 6 0
H04B 7/02 9 3 20 18 6 6 6 0
H04B 7/02 9 3 20 18 6 6 6 0
H04B 7/02 15 7 30 60 12 14 14 20
상기 다차원 연산을 수행하는 방법은 롤업 연산을 수행하는 방법과 큐브 연산을 수행하는 방법으로 나뉜다. 차원인 IPC, 날짜, 출원인 기준으로 롤업 연산과 큐브 연산에 대해 각각 설명한다. IPC, 날짜, 출원인 차원이 있을 때, 롤업 연산은 상기 3가지 차원 중 선택된 한 방향으로만 진행되는 반면, 큐브 연산은 3P3(3가지 중 3가지를 선택했을 때 발생하는 순열의 수, 여기서는 6) 방향으로 진행된다. 즉, IPC 차원을 1, 날짜 차원을 2, 출원인 차원은 3이라 했을 때, 롤업 연산은 1->2->3과 같은 한 방향으로만 진행된 것이나, 큐브 연산은 1->2->3뿐만 아니라, 1->3->2, 2->1->3, 2->3->1, 3->1->2, 3->2->1 등 6가지 방향으로 모두 또는 선택된 1이상의 방향으로 진행될 수 있다. 그러므로, 롤업 연산을 할 경우, 1->2->3까지 연산한 결과가 필요없는 경우(최종적으로 출원인의 종류 단위로된 롤업 연산된 결과값이 생성됨), 즉 IPC만 롤업 연산된 결과가 필요하거나, 상기 표 45와 같이 IPC와 날짜 차원까지만 롤업된 연산 결과가 필요할 경우 선택되는 차원 중 어느 하나 이상에 대해서만 목적하는 롤업 방향을 지정하여 롤업 연산을 수행하면 된다.
그러므로, 목적하는 바가 다양할 경우(다양한 관점에서 다차원 분석용 연산 수행 결과 테이블이 필요할 경우) 상기 롤업 연산을 수행해야 하는 경우에는 가급적 1개 또는 2개 차원 정도의 작은 개수의 차원을 선택하여 여러 개의 다차원 분석용 연산 수행 결과 테이블을 생성해 놓을 필요가 있게 된다. 즉, 가급적 목적하는 바에 따라 분석 주제별 다수의 다차원 분석용 연산 수행 결과 테이블을 생성해 놓고, 상기 분석 주제별 다차원 분석용 연산 수행 결과 테이블 각각에 상기 분석 모듈이 질의하는 방식으로 목적하는 분석 결과 데이터를 생성해 낸다. 한편, 큐브 연산은 한꺼번에 여러 차원에 대하여 다양한 방향으로 다양한 조합별로 다차원 연산을 수행할 수 있으므로, 상대적으로 다차원 분석용 연산 수행 결과 테이블의 개수는 작아지나, 다차원 분석용 연산 수행 결과 테이블의 크기가 크지는 문제점도 아울러 상존한다. 그러므로, 분석 주제별로 다양한 관점에서 분석을 수행해 보려고 하는 경우(원하는 차원을 선별하고, 선별된 차원을 어떤 순서대로 조합해도 가능하므로)나 드릴 스루 등과 같이 다이나믹한 관점에서의 분석을 수행해 보려는 경우에는 큐브 연산을, 관점의 개수가 적거나, 하나의 차원을 중심으로 롤업과 드릴 다운한 결과를 보려고 하거나, 여러 개의 차원이라도 하나의 방향으로 롤업된 결과를 보려고 하는 경우에는 롤업 연산을 수행하여 다차원 분석용 연산 수행 결과 테이블을 생성해 놓는 것이 더욱 바람직할 것이다.
롤업 연산을 수행하여 생성된 다차원 분석용 연산 수행 결과 테이블은 큐브 연산을 수행하여 생성된 다차원 분석용 연산 수행 결과 테이블의 부분 집합(차원의 개수가 같으면 큐브 연산은 가능한 모든 차원의 순열로 연산하므로, 일방향으로 연산한 결과는 모든 차원의 순열로 연산한 결과의 부분 집합이 된다.)이거나 슬라이스(slice)된 결과가 될 수 있다. 통상적으로 큐브 연산은 롤업 연산보다 더 많은 수의 차원으로 연산하고, 가능한 모든 차원의 순열로 연산하므로(물론, 일부를 배제함은 당연하지만) 롤업 연산 결과는 큐브 연산 결과의 하나의 슬라이스에 해당될 수 있다. 예를 들어 IPC, 날짜, 출원인 차원을 축으로 큐브 연산을 수행한 결과에서 IPC만으로 롤업한 연산 결과 및 IPC 차원->날짜 차원으로 연산한 결과를 추출해 낼 수 있고, 그것은 개념적으로 큐브 연산을 수행한 결과 집합의 한 슬라이스가 된다.
한편, 모든 큐브 연산 결과 데이터는 다수 개의 롤업 연산 결과의 합집합으로 동일한 결과 데이터를 생성할 수 있을 것이다. 상기 IPC 차원, 날짜 차원, 출원인 차원의 예를 들면, 큐브 연산 결과로 생성된 다차원 분석용 연산 수행 결과 테이블은 상기 차원 중에서 1개, 2개 및 3개의 차원을 선택하고, 1개 이상의 차원이 선택되는 경우 각 차원의 순열의 개수 만큼(1개의 순열은 1개의 롤업 연산 방향에 대응된다.) 롤업 연산을 수행한 다차원 분석용 연산 수행 결과 테이블을 생성한 것과 동등하게 된다. 즉, n개의 롤업 연산은 1개의 큐브 연산과 대등해 지며(등가가 된다), 롤업 연산을 기준으로 설명하는 것이 설명의 복잡도를 줄일 수 있으므로, 이하에서는 롤업 연산 결과를 중심으로 설명한다. 이는 당연히 당업자 수준에서 롤업 연산에 대하 본 발명 사상이 롤업 연산에만 국한되지 않음은 당연한 것이며, 용이 하게 큐브 연산으로 치환/변형 가능하기 때문이다. 다차원일 경우 다차원을 각 차원마다 필드가 할당되며, 모든 차원은 적어도 1개 이상의 하위 레벨 필드가 있다.( IPC가 대표적이다) 이들 모든 필드를 물리적인 폭에 제한이 있는 한 화면에 다 넣기는 어려우며, 다 넣지 않는다고 하더라도 본 발명 사상을 이해하고 적용하는 데는 어려움이 없을 것이다. 그러므로, 이하에서는 설명/표기의 복잡도를 줄이기 위해 가급적 롤업 연산을 중심으로 설명하며, 롤업 연산도 가급적 1개 차원을 중심으로 설명할 것이나, 이는 설명의 편의일 뿐, 다른 종류의 차원에 대해서도 본 발명 사상이 그대로 적용됨은 당연할 것이다. IPC나 USPC 등, 특허 데이터만의 고유한 차원이며, 이를 통해 롤업 연산과 큐브 연산을 이해하기는 것이 본 발명 사상을 이해하고 적용하는데 가장 좋다. 그리고, 날짜 차원은 통상적인 다른 데이터에서도 다수 사용되기 때문에 크게 설명하지 않으며, 가급적 연도 단위로 표기하나, 이 또한 롤업 연산, 큐브 연산의 대상이 됨은 자명할 것이다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어지는 특허 문건 집합에서, 출원일 정보와 특허 분류 기호 정보를 입수한 다음, 특허 분류 기호 체계가 데이터화 되어 있는 특허 분류 기호 마스트 DB(203) 또는 스타스키마 구조로 재구축된 테이블을 참조하여 상기 입수한 특허 분류 기호의 상위 특허 분류 기호를 추출해 낸다. 상기 추출된 상위 특허 분류 기호 및 출원일의 연도 정보로 상기 표와 같은 정보가 포함되어 있는 다차원 분석용 연산 수행 결과 테이블의 데이터를 완성해 낸다. 이때, 하나의 특허 문건에 특허 분류 기호가 2종류 이상이 있는 경우(예를 들면 미국의 경우, IPC와 USPC가 있음) 각 특허 분류 기호의 종류별로 독 립적으로 처리하면 된다. 그리고, 하나의 특허 문건에 단일 종류의 2개 이상의 특허 분류 기호가 들어 있는 경우, 1) 맨 앞의 메인 특허 분류 기호에 대해서만 처리하거나, 2) 모든 특허 분류 기호에 대해서 처리하거나, 3) 메인 특허 분류 기호와 서브 특허 분류 기호에 대한 가중치가 있는 경우, 그 가중치를 반영하여 처리할 수 있다. 이때, 3)의 경우, 수치에 소수점이 나올 수 있으며, 이 경우, 반올림을 하는 것이 타당한 표기 방법일 것이다. 이때, 상기 1), 2) 및 3) 중에서 어느 정책을 취할 지는 선택의 문제이다. 한편, 상기 1), 2) 및 3) 이외에도 다른 정책이 가능할 수도 있음은 물론이다 하겠다. 상기 2)의 방법을 취할 경우, 상기 다차원 분석용 연산 수행 결과 테이블의 라인 수가 늘어나게 되는데, 이는 각 특허 분류 기호마다 적어도 하나 이상의 새로운 데이터 값이 생성되기 때문이다(즉, 서브 IPC에 대해서도 롤업 연산을 해 놓아야 하므로). 한편, 상기 3)의 방법을 취할 경우 수치값이 소수점이 나올 수 있게 된다.
상기 테이블은 특허 지표 중 출원수 또는 등록수와 같은 수량 기준의 지표이다. 본 발명의 하위 특허 분류 기호 포함 롤업/드릴다운과 같은 데이터 처리는 점유율, 집중율, 활동율(AI, Activity Index) 등과 같은 각종 특허 정보 분석 지표에도 활용될 수 있을 것이다.
분석 주제별 다차원 연산용 기초 테이블 없이 다차원 분석용 연산 수행 결과 테이블 생성
상기에서는 분석 주제별 다차원 연산용 기초 테이블을 사용하여 다차원 분석용 연산 수행 결과 테이블을 생성하는 것에 대해 설명하였다. 이때, 상기 분석 주제별 다차원 연산용 기초 테이블은 필수적인 것이 아니며, 스타스키마 구조로 재구축된 테이블이 있는 경우, 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 다차원 분석용 연산 수행 결과 테이블을 생성할 수도 있다. 상기 분석 주제별 다차원 연산용 기초 테이블은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 계산량/정보 처리량을 줄이는 역할을 하기 때문이며, 하나의 상기 분석 주제별 다차원 연산용 기초 테이블이 다수의 테이블 생성에 사용될 수 있기 때문이다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 분석 주제별 다차원 연산용 기초 테이블이 없는 경우에도 상기 스타스키마 구조로 재추축된 테이블로부터 필요한 정보를 입수하고, 이를 가공 처리하여 다차원 연산을 수행할 수 있게 된다. 예를 들면, 상기 분석 주제별 다차원 연산용 기초 테이블에는 출원번호별로의 자신 및 자신의 상위 모든 IPC들에 대한 정보가 저장되어 있는데, 이러한 상기 분석 주제별 다차원 연산용 기초 테이블에 저장된 정보가 없더라도 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 출원번호에 포함된 IPC를 찾고, 상기 찾은 IPC를 상기 특허 분류 기호 마스트 DB(203) 또는 기타 총상위 특허 분류 기호 테이블 등을 조회하여, 상기 찾은 IPC의 상위 모든 IPC들에 대한 정보를 입수해 올 수 있기 때문이다. 그러므로, 상기 분석 주제별 다차원 연산용 기초 테이블이 없는 경우에는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 내부 명령어들이 상대적으로 복잡해 지는 것은 당연할 것이다. 한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 다차원 분석용 연산 수행 결과 테이블을 생성해 놓은 이후에는 모든 것이 동등 하게 진행된다.
스타스키마 구조로 재구축된 테이블 없이 다차원 분석용 연산 수행 결과 테이블을 생성
상기에서는 스타스키마 구조로 재구축된 테이블 및 분석 주제별 다차원 연산용 기초 테이블을 사용하여 다차원 분석용 연산 수행 결과 테이블을 생성하는 것에 대해 설명하였다. 이때, 스타스키마 구조로 재구축된 테이블은 상기 분석 주제별 다차원 연산용 기초 테이블의 생성을 효율적으로 수행하기 위한 것이며, 반드시 필수적인 것은 아니다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 스타스키마 구조로 재구축된 테이블이 아닌 상기 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203) 및/또는 주체 마스트 DB(204)로부터 필요한 데이터를 읽어와 상기 분석 주제별 다차원 연산용 기초 테이블을 생성할 수도 있다. 이경우, 상기 분석 주제별 다차원 연산용 기초 테이블을 생성하는 프로그램(스크립트, script 등)이 상대적으로 조금 복잡할 수 있을 것이며, 그 프로그램 전체 또는 그 프로그램을 구성하는 각 모듈의 재활용성이 상대적으로 떨어질 수는 있을 것이다. 예를 들면, 상기 분석 주제별 다차원 연산용 기초 테이블에는 출원번호별로의 자신 및 자신의 상위 모든 IPC들에 대한 정보가 저장되어 있는데, 이러한 상기 정보들을 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 출원번호에 포함된 IPC를 찾고, 상기 찾은 IPC를 상기 특허 분류 기호 마스트 DB(203) 또는 기타 총상위 특허 분류 기호 테이블 등을 조회하여, 상기 찾은 IPC의 상위 모든 IPC들에 대한 정보를 입수해 온 다음, 이를 토대로 상기 분석 주제별 다차원 연 산용 기초 테이블을 생성할 수 있을 것이다.
특허 문건 마스트 DB (202)로부터 분석 주제별 다차원 분석용 연산 수행 결과 테이블 생성
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기에서 설명한 바에 따라 스타스키마 구조로 재구축된 테이블 및 분석 주제별 다차원 연산용 기초 테이블이 없더라도, 상기 분석 주제별 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다. 상기 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기설정된/입수된 문건 집합(예를 들면 특정 국가의 출원 또는 등록된 모든 문건들의 집합)에 대하여 다음과 같은 단계를 처리한다.
첫째, 상기 기설정된 속성을 지니는 문건 집합에 포함되어 있는 특허 문건의 출원번호 등과 같은 특허 문건을 특정 지을 수 있는 키(key, 문건 고유 정보)값을 입수하고 이를 저장한다. 한편, 상기 표 45와 같은 상기 분석 주제별 다차원 분석용 연산 수행 결과 테이블을 생성하기 위하여, 재료가 되는 표 42 내지 표 44의 데이터 중 적어도 하나 이상의 데이터를 개별 특허 문건 마다를 대상으로 상기 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203) 및/또는 주체 마스트 DB(204)에서 입수하여 생성하고, 생성된 테이터를 통합하여 이를 메모리에 저장한다. 상기 메모리에 저장된 데이터들은 상기 다차원 연산을 위한 기초 테이블에 저장된 데이터와 동등한 데이터일 수 있다. 즉, 상기 메모리에 저장된 데이터들은 적어도 하나 이상의 차원에 관한 정보를 포함하며, 상기 각 레코드에는 다차원 연산을 수행하기 위한 각 차원별 기초 데이터가 입력되어 있어야 한다. 상기 기초 데이터는 존재 유무(1 또는 null)에 관한 정보(출원/등록이 발생했다, 없었다)에 관한 정보와 각종 카운팅 정보(청구항 수 등 본 명세서에서 카운팅 정보로 언급한 정보들 중 어느 하나 이상)가 포함될 수 있다. 상기 차원은 1) 특허 분류 기호의 종류별 특허 분류 기호 차원 2) 날짜 차원, 3) 위치 차원(국가, 지역 등), 4) 주체의 속성 차원(출원인, 발명자, 대리인 중 선택된 어느 하나 이상에 대한 규모, 속성 등에서 구분되는 차원(예를 들면, 출원인을 기업, 대학, 연구기관, 개인 및 기타로 나누고, 기업을 다국적 기업, 대기업, 중소기업, 등으로 나눌 수 있을 것이다. - 이는 주체 마스트 DB(204)에서 각 출원인의 속성을 참조하여 입수될 수 있다.) 중에서 선택되는 어느 하나 이상 또는 이들 중에서 조합되어 생기는 복합 차원 중 어느 하나 이상이 될 수 있다.
둘째, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 개별 특허 문건 마다의 표 42 내지 표44의 정보 중 적어도 하나 이상이 통합된 상기 메모리에 저장된 데이터를 대상으로 기설정된 분석 주제별로 다차원 연산을 수행하여 상기 표 45와 같은 분석 주제별 다차원 분석용 연산 수행 결과 테이블을 생성한다.
출원인별 IPC 레벨별 랭킹 정보
상기 표 45와 같은 다차원 분석용 연산 수행 결과 테이블이 주어질 때, 상기 분석 모듈은 하기와 같은 분석 결과를 생성할 수 있게 된다.
첫째, 출원인이 입수될 때, 상기 입수된 출원인에 대하여, 특허 분류 기호의 각 레벨별 출원수/등록수 기준 랭킹 정보를 생성할 수 있다. 상기 랭킹 정보는 입수된 출원인의 적어도 하나 이상의 특허 분류 기호의 각 레벨별로 상기 다차원 연산된 출원 또는 등록 문건의 카운트 값을 비교하는 방법으로 랭킹 정보를 생성할 수 있다. 예를 들면, 상기 다차원 분석용 연산 수행 결과 테이블데이터에서 출원인 A의 1dot 서브그룹 레벨(C5 레벨)에서 H04B 7/02의 다차원 연산된 문건의 개수 카운팅값과, 출원인 A의 동일한 1dot 서브그룹 레벨에서의 다른 특허 분류 기호에 대응되는 다차원 연산된 문건의 개수를 카운팅값 등을 비교함으로써, 출원인 A의 1 dot 서브그룹 레벨에서의 각 특허 분류 기호별의 다출원/다등록 랭킹을 구할 수 있게 된다.
총량 분석 모듈
하기 표 46과 같은 각 출원인별, IPC 레벨별, 연도별 출원(또는 등록) 카운트해 놓은 다차원 분석용 연산 수행 결과 테이블이 있다고 하자.
[표 46]
GC C4 C5 C6 C7 C.. 01 02 03 04 05
H04B 7/00 H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 6 3 10 42 39
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 15 7 30 60 64
B29C/100
..
..
H04B ..
상기 다차원 분석용 연산 수행 결과 테이블에는 특정 국가 단위로 모든 출원인에 대해서 출원인을 기준으로 상기와 같은 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다. 예를 들어 출원인 C의 특정 특허 문건에 포함된 특허 분류 기호 및 출원일(날짜)이 있는 가 있으면, 그 특허 문건의 특허 분류 기호 및 출원일 데이터로 특허 분류 기호 체계를 참조하여 상기 표에 대응되는 특정 셀의 카운트 값을 신설하거나(특허 분류 기호, 출원인(AppName) 등), 숫자의 경우 증가시킬 수 있을 것이다. 상기 표와 같이 특정 국가 단위로 모든 출원인에 대하여 다차원 분석용 연산 수행 결과 테이블을 생성하는 경우, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블로부터 하기와 같은 분석 결과들을 생성할 수 있을 것이다.
먼저 출원인 A의 IPC subclass level 그룹핑된 정보를 보여주기 위해서, 이 레벨에서의 연도별 카운트값을 생성할 수 있을 것이다. 최근 필드의 값은 기설정된 기준일(다차원 분석용 연산 수행 결과 테이블 조회일이 그 예가 될 수 있다.)이 속하는 날짜보다 1년 6개월(18개월)전이 속하는 날)의 해당 연도부터 다차원 분석용 연산 수행 결과 테이블 조회일까지 입수된 특허 문건에서 기인한 카운트 값인 것이 바람직하다. (...해당 카운팅 값을 말한다) 하기 표 47은 그 일례를 보여 준다.
[표 47]
랭킹 IPC subclass 01 02 03 04 05 최근
1 H04B(+)
2 B29C(+)
물론 상기 표 47의 H04B를 드릴다운하면, 출원인 A의 특허 문건 중 특허 분류 기호가 H04B의 직하위에 있는 특허 분류 기호에 해당되는 문건들에 대한 카운트값이 하기 표 48과 같이 나올 것이다. 이는 상기 표와 같은 다차원 분석용 연산 수행 결과 테이블에서 "AppName = A and IPC level = C4"라는 조건으로 카운팅하면 될 것이며, 정열을 C4를 기준으로 하면 될 것이다.(order by IPC level = C4, C4는 IPC subclass를 의미한다.)
[표 48]
랭킹 IPC subclass IPC main group 01 02 03 04 05 최근
1 H04B(+)
H04B 1/00(+)
H04B 3/00(+)
B29C(+)
상기 표 48에서 다시 드릴다운하면 1dot subgroup기준에서의 다차원 연산된 카운팅 값이 나오는 것이 직전에서 설명한 바와 같을 것이다. (물론 상기 H04B를 드릴다운하면, 출원인 A의 특허 문건 중 특허 분류 기호가 H04B의 직하위에 있는 특허 분류 기호에 해당되는 문건들에 대한 카운트값이 하기와 같이 나올 것이다. 이는 상기 표와 같은 다차원 분석용 연산 수행 결과 테이블에서 "AppName = A and IPC level = C5"라는 조건으로 카운팅하면 될 것이며, 합산하여 정열하는 것은 C5를 기준으로 하면 될 것이다.(order by IPC level = C5, C5는 IPC main group 를 의미한다.) 상기 각 셀에 있는 카운팅값은 자신의 하위 특허 분류 기호에 해당되는 모든 값들이 다차원 연산된 값이다.
상기에서 H04B 1/00(+)를 드릴 다운하면, 그 하위에 있는 특허 분류 기호가 나올 것이며, 각 셀의 값은 "AppName = A and IPC level = C6"라는 조건으로 카운팅하면 될 것이며, 정열을 C6를 기준으로 하면 될 것이다.(order by IPC level = C6, C6는 IPC 1 dot group 를 의미한다.) 상기 각 셀에 있는 카운팅값은 자신의 하위 특허 분류 기호에 해당되는 모든 값들이 다차원 연산된 값이다. 이와 같이 계속하여 더 이상의 하위 특허 분류 기호가 없을 때까지 드릴 다운할 수 있으며, 추가적으로 드 릴 다운할 수 없을 때까지 상기와 같은 조건의 입력으로 필요한 셀 값을 생성할 수 있을 것이다.
상기와 같은 방식은 IPC에 대해서 설명했으나, 이는 USPC, FT, FI, ECLA에 대해서도 마찬가지임은 자명하다 할 것이다.
마찬가지로 상기는 출원(또는 등록 총량)기준으로 다차원 연산된 다차원 분석용 연산 수행 결과 테이블의 생성 방법, 드릴 다운 시의 셀값의 계산 방법 및 계산 값의 표현 방식을 설명하였으나, 이는 점유율, 집중율, 및/또는 활동율에 대해서도 당업자에게는 자명하게 다차원 분석용 연산 수행 결과 테이블을 생성할 수 있을 것이다.
한편, 상기와 같은 방식으로 특허 분류 기호가 개입되어 있는 기설정된 정의식에 대응되는 다른 분석 지표에 대해서도 동일한 방식으로 다차원 연산된 계산값을 생성할 수 있을 것이며, 드릴 다운 시의 셀값을 계산할 수 있을 것이며, 계산된 값을 표현할 수 있을 것이다.
상기와 같은 다차원 분석용 연산 수행 결과 테이블이 있을 때, 적어도 하나 이상의 특정 특허 분류 기호가 주어졌을 때, 카운트 값이 많은 순위로 출원인들의 랭킹 및 그 출원인들의 연도별 카운트값을 생성할 수도 있을 것이다. 예를 들어 H04B가 주어졌다고 가정했을 때, "IPC level = C4 and C4 = H04B"라는 조건을 주고 출원인 별로 합산하여 정열하는 것은 출원인 별로 수행하면 될 것이다.(order by AppName)
점유율 및 기타 데이터 생성 예
예를 들어 점유율을 "특정 속성을 가지는 목적 문건 집합의 문건 수를 특정 속성을 가지는 전체 문건 집합의 문건 수로 나눈 값"으로 정의한다면 점유율에 대해서도 상기 표 46과 같은 테이블 형식의 데이터를 생성할 수 있을 것이다. 즉, 특정 기업 A의 특정 특허 분류 기호를 대상으로 한 점유율을 구할 경우, 목적 문건 집합은 A의 문건 집합 중 특정 특허 분류 기호를 포함하는 문건 집합이며, 전체 문건 집합은 특정 특허 분류 기호를 포함하는 전체 문건 집합이 될 것이다. 이때, 상기 특허 분류 기호를 포함하는 문건 집합을 구할 때, 그 특허 분류 기호의 하위 특허 분류 기호를 포함하는 문건들도 당연히 포함되어야 함이 마땅할 것이다.
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 표 46의 테이블과 같은 형식으로, 하기 표 49와 같은 출원인이 없는(모든 출원인의 문건 수치가 통합된, 이는 출원인->국가 차원으로 롤업 연산이 수행되거나 합계 연산을 수행하면 된다.) 테이블을 생성할 수 있을 것이다.
[표 49]
IC C5 C6 C7 C.. 01 02 03 04 05
H04B 7/02 H04B 7/04 H04B 7/06 10 15 17 42 42
H04B 7/02 H04B 7/04 H04B 7/06 10 15 17 42 42
H04B 7/02 H04B 7/04 H04B 7/08 7 11 20 32 38
H04B 7/02 H04B 7/04 H04B 7/08 7 11 20 32 38
H04B 7/02 H04B 7/04 11 12 19 79 86
H04B 7/02 H04B 7/04 11 12 19 79 86
H04B 7/02 H04B 7/04 28 38 56 153 166
H04B 7/02 H04B 7/10 6 3 3 4 8
H04B 7/02 H04B 7/10 6 3 3 4 8
H04B 7/02 H04B 7/10 6 3 3 4 8
H04B 7/02 H04B 7/12 0 2 2 1 3
H04B 7/02 H04B 7/12 0 2 2 1 3
H04B 7/02 H04B 7/12 0 2 2 1 3
H04B 7/02 44 40 67 83 85
H04B 7/02 44 40 67 83 85
H04B 7/02 44 40 67 83 85
H04B 7/02 78 83 128 241 262
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 A 출원인의 연도별 특허 분류 기호의 각 단계별 점유율을 구하기 위하여 상기 표 46과 표 49의 양 테이블에 나와 있는 수치값을 연산(나누기)하여 점유율을 구할 수 있을 것이다. 상기 구한 점유율 데이터도 상기 테이블과 같은 데이터 구조로 생성할 수 있을 것이며, 하기 표 50은 그 일 실시예가 될 것이다. 하기 표50에 나와 있는 점유율은 100을 곱하지 않은 수치이며, 출력할 때 100을 곱하여 %로 출력해 줄 수 있을 것이다. 하기 표와 같이 각 특허 분류 기호의 레벨별로도 점유율을 계산하여 테이블로 생성해 놓을 수 있을 것이다. 이러한 다차원 연산된 테이블 데이터로 드릴다운한 결과물을 출력해 수도 있을 것이다. 한편, 당연하지만, 비율값을 계산할 경우 비율값을 단순한 더하기 연산을 하여 롤업 연산할 수 없음은 당연할 것이다.(예를 들면, 각 분기별 점유율 수치를 단순히 합한 값이 그 연도의 점유율이 될 수 없으며, 각 하위 분류 기호의 점유율 수치를 단순히 합한 값이 특정 특허 분류 기호를 기준으로 한 점유율이 될 수 없음은 당연하다 할 것이다. 그러므로, 각 롤업 연산의 각 단위마다 점유율의 공식/정의를 적용하여 계산하여야 한다. 이는 이후의 집중율, 활동율 등의 비율값을 롤업 연산할 때 당연히 적용되는 것이며, 이하 반복되는 설명은 생략한다.)
[표 50]
(단위 %)
GC C5 C6 C7 C.. 01 02 03 04 05
H04B 7/02 H04B 7/04 H04B 7/06 0.0 0.0 17.6 40.5 28.6
H04B 7/02 H04B 7/04 H04B 7/06 0.0 0.0 17.6 40.5 28.6
H04B 7/02 H04B 7/04 H04B 7/08 42.9 9.1 25.0 12.5 7.9
H04B 7/02 H04B 7/04 H04B 7/08 42.9 9.1 25.0 12.5 7.9
H04B 7/02 H04B 7/04 27.3 16.7 10.5 26.6 27.9
H04B 7/02 H04B 7/04 27.3 16.7 10.5 26.6 27.9
H04B 7/02 H04B 7/04 21.4 7.9 17.9 27.5 23.5
H04B 7/02 H04B 7/10 0.0 0.0 0.0 0.0 0.0
H04B 7/02 H04B 7/10 0.0 0.0 0.0 0.0 0.0
H04B 7/02 H04B 7/10 0.0 0.0 0.0 0.0 0.0
H04B 7/02 H04B 7/12 50.0 0.0 0.0 33.3
H04B 7/02 H04B 7/12 50.0 0.0 0.0 33.3
H04B 7/02 H04B 7/12 50.0 0.0 0.0 33.3
H04B 7/02 20.5 7.5 29.9 21.7 28.2
H04B 7/02 20.5 7.5 29.9 21.7 28.2
H04B 7/02 20.5 7.5 29.9 21.7 28.2
H04B 7/02 19.2 8.4 23.4 24.9 24.4
상기 표 50과 같은 다차원 분석용 연산 수행 결과 테이블과 같은 데이터가 주어질 때, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 출원인이 입수될 때, 상기 입수된 출원인에 대하여, 특허 분류 기호의 각 레벨별 점유율 기준 랭킹 정보를 생성할 수 있다. 상기 랭킹 정보는 입수된 출원인의 적어도 하나 이상의 특허 분류 기호의 각 레벨별로 상기 다차원 연산된 출원 또는 등록 문건 기준의 점유율 값을 비교하는 방법으로 랭킹 정보를 생성할 수 있다. 예를 들면, 상기 다차원 분석용 연산 수행 결과 테이블데이터에서 출원인 A의 1dot 서브그룹 레벨(C5 레벨) 에서 H04B 7/02의 다차원 연산된 문건의 개수를 기준으로 한 점유율 값과, 출원인 A의 동일한 1dot 서브그룹 레벨에서의 다른 특허 분류 기호에 대응되는 다차원 연산된 문건의 개수를 기준으로 한 점유율 값 등을 비교함으로써, 출원인 A의 1 dot 서브그룹 레벨에서의 각 특허 분류 기호별의 점유율 랭킹을 구할 수 있게 된다.
마찬가지로 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 집중율에 대한 테이블을 생성할 수 있을 것이다. 특정 주체 기준의 집중율을 "그 주체의 특정 영역의 문건 집합의 문건 수를 그 주체의 상기 특정 영역의 상위(예를 들면 전체) 영역의 문건 집합의 문건 수로 나눈 값"을 정의할 수 있을 것이다. 출원 문건 수를 기준으로 대한민국에서 H04B7/00 기술 영역에 대한 A 기업의 집중율을 계산한다고 할 때, 분자를 대한민국에서 출원된 A 기업의 특허 문건 중에서 H04B 7/00을 포함하는 문건 수로 하고, 분모를 대한민국에서 출원된 A 기업의 특허 문건 수로 할 수 있을 것이다. 이때, 각 연도별로 집중율을 계산할 수 있을 것이며, 각 분기별로도 집중율을 계산할 수 있을 것이다. 예를 들면, A 기업의 IPC 기준 기술 영역별(예를 들어 IPC subclass 레벨에서) 미국에서의 연도별 출원 집중율을 구하기 위해서는 A 기업의 미국에서의 전체 기술 영역 또는 IPC class 레벨에서의 연도별 출원수 데이터가 포함하는 테이블이 있는 경우, 이 테이블의 값과 상기 IPC 기준 기술 영역별 연도별 출원수 데이터가 있는 테이블의 값을 처리하여, 목적하는 값을 구할 수 있을 것이다.
마찬가지로 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 활동율(AI)에 대해서도 테이블을 생성할 수 있을 것이다. 활동율을 "{특정 주체의 특 정 영역에 대한 문건 집합의 총 문건 수/특정 주체의 문건 집합의 총 문건 수}/{특정 영역에 대한 문건 집합의 총 문건 수/문건 집합의 총 문건 수}"로 정의한다면 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 각 분자 및 분모별로 생성된 테이블 정보(극단적인 경우 단위 수치 정보)를 참조하여 상기 활동율에 대한 테이블을 생성할 수 있을 것이다. 이때, 활동율도 연도 단위 또는 연도 통합 단위로 생성할 수 있음은 물론이며, 특정 영역을 특정 특허 분류 기호 체계에 속하는 모든 특허 분류 기호를 대상으로 하위 특허 분류 기호를 고려하여 모든 레벨 단위로 활동율 데이터를 생성할 수 있을 것이다.
본 발명 사상은 이미 언급한 분석 지표 이외의 본 명세서에서 언급하는 다른 분석 지표 및 그 외의 분석 지표에 대해서도 국가별로, 출원문건 기준/등록문건 기준별로, 특허 분류 기호의 종류별로, 입수된 출원인의 특허 분류 기호의 레벨별 랭킹을 생성할 수 있을 것이다.
상기와 같은 프로세스는 각종 다른 특허 분석 지표에 대해서도 동일한 방법으로 적용할 수 있을 것이다. 특허 분석 지표를 정의하는데 사용되는 데이터의 종류가 n개가 있을 경우(총량은 1개, 점유율과 집중율은 2개, 활동율은 4개), 상기 n개의 데이터가 각각 포함되어 있는 n개 또는 그 이하의 다차원 분석용 연산 수행 결과 테이블에서(이하가 되는 경우에는 하나의 다차원 분석용 연산 수행 결과 테이블에 2 종류 이상의 데이터가 함께 들어가 있는 경우이다.) 필요한 값을 찾아서 특허 분석 지표의 정의에 따라 계산하면 목적하는 값을 얻을 수 있게 된다. 이때, 상기 각 테이블의 값 중에서 특허 기술 분류 기호 등과 같은 차원 값과 연관된 경우, 상기 값 들은 차원을 축으로 롤업되어 있게 된다. 이때, 특히 차원의 속성이 특허 기술 분류 기호인 경우에는 그 특허 분류 기호의 타이틀 정보에 포함되어 있는 도트 구조를 반영하여 특정 단계의 특허 분류 기호에 대응되는 값은 그 특허 분류 기호의 모든 하위 특허 분류 기호에 대응되는 값을 포함한 값으로 롤업 연산해 놓은 다차원 분석용 연산 수행 결과 테이블이 사용된다.
기타 특허 분석 지표
기타 하기와 같은 분석 지표를 사용할 수 있으며, 각 분석 지표별로, 상기 총량 분석용 다차원 분석용 연산 수행 결과 테이블(205 -2), 인용 분석용 다차원 분석용 연산 수행 결과 테이블(205 -3), 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블(205 -4), 발명자 분석용 다차원 분석용 연산 수행 결과 테이블(205 -5), 특허 기술 분류별 분석용 다차원 분석용 연산 수행 결과 테이블(205 -6), 융합 분석용 다차원 분석용 연산 수행 결과 테이블(205 -7), 대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블(205 -8)과 같이 각 분석 지표별로 다차원 분석용 연산 수행 결과 테이블을 상기 각 다차원 분석용 연산 수행 결과 테이블을 생성하는 것과 동일한 방법으로 생성해 놓아야 한다. 물론, 상기 다차원 분석용 연산 수행 결과 테이블에는 세부적으로 출원/등록 총량 기준, 점유율, 집중율, 활동율을 기준으로 한 각 세부적인 다차원 분석용 연산 수행 결과 테이블이 생성되어 있는 것이 바람직하다. 하기 분석 지표들과 상기 총량이나, 점유율이나, 집중율, 활동율과 같은 분석 지표와는 수식만 차이가 있을 뿐, 수식이 주어질 때, 각 수식에 따라 수식을 구성하는 각 요소에 대한 값을 입수하고, 그 입수한 값을 수식에 따라 계산하여 상기 다차원 분석용 연산 수행 결과 테이블을 생성하는 메카니즘은 완전히 동일하거나 적어도 대등하며, 당업자에게는 각 분석 지표의 수식이 정확하게 주어지는 경우 이는 극히 용이하게 구현할 수 있을 것이다. 그러므로, 이하에서는 분석 지표를 제시하며, 이들 각각의 분석 지표에 대한 다차원 분석용 연산 수행 결과 테이블 생성 모듈의 존재, 작동원리, 작동 순서, 생성되는 테이블의 구체적인 형태 및 상기 테이블을 접근하는 방법(SQL이나 로직)등에 대해서는 당업자에게 자명하므로 별도로 언급하지 않는다. 이하, 분석 지표를 소개한다.
1.기술혁신 활동의 집중도 분석 지표
1)현시기술우위 지수(Revealed Technological Advantage) 현시기술우위지수(RTA)는 기술 특화(specialization) 현황의 파악을 위해 가장 많이 사용되는 지수 중 하나로서, 우리가 관심의 대상으로 삼는 특정 주체가 다른 주체와 비교하여 상대적으로 어떠한 기술분야에 기술혁신 활동을 집중하고 있는가에 대한 정보를 제공한다. RTA 지수는 일반적으로는 특허활동지수(AI, Activity Index)로 알려져 있으며, 특화지수(Specialization Index), 기술비교우위 지수(TCA, Technological Comparative Advantage), 기술현시비교우위 지수(TRCA, Technological Revealed Comparative Advantage) 등 다양한 명칭으로 사용되고 있다.
RTA 지수는 다음과 같은 수식으로 산출된다. 아래의 수식에서 분자는 j의 특허에서
i 분야가 차지하는 비율을 의미하며, 분모는 전 분야의 특허에서 i 분야가 차지하는 비율을 의미한다.
Figure 112007089469478-PAT00001
(Pij는 i 분야에 대한 j의 특허 수)
2)현시특허우위 지수(Revealed Patent Advantage)
현시특허우위 지수(RPA)는 RTA 지수와 마찬가지로 특정 기술분야에 대한 집중도 또는 특화(Specialization) 현황을 보여주는 지표이다. 분석적 의미는 RTA 지수와 동일하나, RTA 지수의 비대칭성(Skewness)을 극복하고 지수의 정규성(normality)을 확보하기 위해 고안되었다.
RPA와 RTA의 관계 및 RPA 값을 산출하는 수식은 다음과 같다.
Figure 112007089469478-PAT00002
Figure 112007089469478-PAT00003
3) 집중률 지수(CRn, Concentration Ratio n)
집중률 지수(CRn)는 원래 시장에서의 독과점 수준을 평가하기 위해 사용되는 지표
이다. 우리는 이 지표를 특허정보에 응용함으로써 특정 산업부문에서 기술 독과점에 대한 정보를 얻을 수 있으며, 이를 통해 해당 산업부문에서의 기술경쟁의 강도를 가늠해볼 수 있게 된다. CRn 지수는 Cn 지수로도 불린다.
원래 CRn 지수는 하나의 산업부문에서 시장점유율 상위 n개사의 시장점유율의 합을
의미한다. 시장측면에서 기술측면으로 관점을 돌려, 기술의 경쟁강도를 파악하기 위해 시장점유율 대신 특허점유율을 사용하면 다음과 같이 정의될 수 있다.
Figure 112007089469478-PAT00004
(Si는 i社의 특허점유율, Ni는 i社의 특허건수, N은 전체 특허건수)
4) 허핀달 지수(HHI, Herfindahl Index)
허핀달 지수(HHI)도 CRn 지수와 마찬가지로 원래는 시장의 독과점 현황과 경쟁 강
도를 평가하기 위해 사용되는 지표이다. 앞서 CRn 지수를 특허정보를 이용하여 변형시킨 것과 같은 방식으로 HHI 분석에 특허데이터를 사용하게 되면 기술적 측면의 독과점상황과 기술경쟁의 강도에 대한 유용한 정보를 얻을 수 있게 된다. 허핀달 지수는 허핀달-허쉬만 지수(HHI, Herfindahl-Herschman Index)로도 불린다.
특허 데이터를 이용한 HHI를 계산하는 식은 다음과 같다.
Figure 112007089469478-PAT00005
(Si는 i社의 특허점유율, m은 산업부문의 전체 기업 수, Ni는 i社의 특허건수, N은 전체 특허건수)
2.기술수준 분석 지표
1) 피인용 가중 특허 수(Patent Count Weighted by Citations)
피인용 가중 특허 수는 기술혁신 활동의 양적인 측면을 보여주는 특허건수에 혁신
성과의 중요성 또는 가치와 관련을 맺고 있는 인용정보를 조합함으로써, 혁신성과의 기술적 측면을 평가하기 위한 보다 의미있는 정보를 제공한다. 피인용 정보를 가중시키는 방법은 여러 가지가 제안될 수 있으나, 이하에서는 가장 간단한 가중방식을 사용한 M. Trajtenberg의 가중 특허 수(WPC, Weighted Patent Counts)를 중심으로 소개하기로 한다.
M. Trajtenberg가 사용한 가중 특허 수(WPC, Weighted Patent Counts)는 다음과 같
이 계산된다
Figure 112007089469478-PAT00006
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 피인용 수)
2) 특허 당 피인용 수(CPP, Cites per Patent)
특허 당 피인용 수(CPP)는 분석 대상(국가, 기업 등)의 특허가 이후의 기술혁신 활동에 어느 정도의 영향을 미쳤는가를 보여주는 지표이다. 우리는 이 지표를 통해 개별특허의 기술적 중요성과 특정 국가 또는 기업의 기술혁신 활동의 수준 및 혁신성과의 가치를 살펴볼 수 있다. CPP라는 명칭은 미국의 CHI社43)에서 주로 사용하는 명칭이나, CHI社에서 자체적으로 개발한 지표라기보다는 오래 전부터 다양한 명칭으로 사용되어진 개념의 지수이다.
CPP는 다음과 같이 계산된다.
Figure 112007089469478-PAT00007
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 피인용 수)
결국, CPP는 특정 연도(또는 기간)에 등록된 특허들이 이후의 특허들에 의해 평균적으로 인용된 회수를 의미한다.
3) 특허영향 지수(PII, Patent Impact Index)
특허영향 지수(PII)는 특정 국가 또는 기업의 기술혁신 성과의 질적 수준을 평가하기위해 사용될 수 있는 지표이다. 우리는 PII 분석을 통해 우리가 분석의 대상으로 삼은 특정 국가 또는 기업이 해당 분야의 평균적인 기술 수준에 비해 어느 정도로 중요한 기술적 성과를 이루어내고 있는가를 파악할 수 있게 된다.
PII는 분석대상 기술분야의 전체 특허들이 평균적으로 인용되는 회수에 대해 특정
국가 또는 기업의 특허가 인용되는 회수의 상대적인 비율로써 계산된다.
Figure 112007089469478-PAT00008
(Ca는 a의 특허의 피인용 수, Na는 a의 특허 수, Ct는 전체 특허의 피인용 수, Nt는 전체 특허 수)
4) 현재영향 지수(CII, Current Impact Index)
현재영향 지수(CII)는 우리가 관심의 대상으로 삼고 있는 특정 주체의 과거 5년 동안의 기술혁신 성과가 현재 시점(연도)에 미치고 있는 기술적 영향력에 대한 정보를 제공한다. 우리는 이 지수를 통해 특정 주체의 근래 기술혁신 성과의 기술적 중요성과 기술적 역량을 엿볼 수 있다.
CII는 현재 시점을 기준으로 이전 5년 동안에 산출된 특정 주체(국가 또는 기업 등)의 특허가 현재 시점(연도)에 얼마나 인용되었는가를 전체적인 인용빈도에 대하여 상대적인 값으로 표현한 지수이다. CII는 다음과 같이 계산된다(아래의 수식에서는 분석 대상으로 삼고자 하는 특정 국가 또는 기업을 A로 표현하기로 한다.
Figure 112007089469478-PAT00009
t : 현재 연도를 기준으로 과거 5개 연도
rt : A의 t연도 특허가 현재 연도에 평균적으로 인용된 회수
Rt : t연도의 전체 특허가 현재 연도에 평균적으로 인용된 회수
ct : A의 t연도 특허가 현재 연도에 인용된 전체 회수
nt : A의 t연도 특허건수
Ct : t연도의 전체 특허가 현재 연도에 인용된 전체 회수
Nt : t연도의 전체 특허건수
5) 기술력 지수(TS, Technology Strength)
기술력 지수(TS)는 특정한 국가 또는 기관의 기술적 역량을 살펴보기 위해 사용되는지표이다. TS 지수를 통해 우리는 개별 기술성과들의 평균적 수준과 기술성과에 대한 양적인 측면이 모두 고려된 특정 국가 또는 기관의 기술역량에 대한 정보를 제공받을 수 있다.
특정 연도의 TS는 CII에 특허건수를 곱한 값으로 정의된다.
Figure 112007089469478-PAT00010
(CIIi는 해당 연도의 i의 CII값, Ni는 해당 연도의 i의 특허건수)
6) 기술순환주기 지수(TCT, Technology Cycle Time)
기술순환주기(TCT) 지수는 기술발전의 속도, 즉 혁신활동의 속도에 대한 정보를 제
공한다. 특정 기술분야의 기술발전 속도나 특정 주체의 기술혁신 활동의 기반이 최근의 연구성과에 기초하는가 아니면 오래 전의 연구성과에 기초하는가를 살펴볼 수 있다. TCT 지수는 기술수명주기 지수 등 다양한 명칭으로 사용되고 있다.
기술의 순환주기는 다양한 방법으로 측정될 수 있다. 여기에서는 CHI社가 정의한
TCT 지수를 중심으로 기술순환주기를 측정하는 방법을 소개하기로 한다. CHI社의
TCT 지수는 다음과 같이 정의된다.
"인용된 특허들의 발행연도와 인용한 특허의 발행연도와의 차이값들의 중간
값(median age)"
7) 과학연계 지수(SL, Science Linkage)
과학연계 지수(SL)는 특허에 담겨진 기술이 과학의 연구성과들과 얼마나 밀접한 관
련을 맺고 있는가를 보여준다. 우리는 SL 지수를 통해 어떠한 국가나 기업이 해당 산업부문에서 선도적인 위치에 있으며, 기초연구 또는 원천기술의 개발에 주력하고 있는가를 간접적으로 살펴볼 수 있다.
SL은 분석 대상 특허들이 인용한 과학기술논문 개수의 평균값으로 정의된다.
Figure 112007089469478-PAT00011
(nt은 t 연도에 등록된 특허 건수, Si는 i특허가 인용한 과학기술 논문 수)
8) 특허 당 평균 청구항 수(Average Claims per Patent)
청구항 수는 해당 특허의 발명의 폭과 권리의 범위를 측정하기 위한 지표로 많은
관심을 끌어왔다. 그러나 현재까지 청구항 수만으로 기술수준을 측정하려는 시도는 많지 않으며, 주로 다른 지표들(피인용 지수, 패밀리 지수 등)과 함께 특허의 가치 또는 분쟁의 가능성을 측정하기 위한 도구로 사용하려는 시도가 주를 이루고 있다.
특허 당 청구항 수는 분석대상 특허들의 평균적인 청구항 수로 계산된다.
Figure 112007089469478-PAT00012
(nt은 t 연도에 등록된 특허 건수, Ci는 i특허의 청구항 수)
9) 패밀리 규모(Family Size)
특허 패밀리의 규모는 직접적으로는 해당 특허의 지역적 보호범위를 나타내며, 간접적으로는 해당 특허가 가지는 기술적 중요성과 혁신성과로서의 가치에 대한 정보를 제공한다.
특허 패밀리의 규모를 측정하는 방법은 다양하게 정의될 수 있다. 그러나 여기에서
는 특허 패밀리가 형성되어 있는 국가의 개수로 정의하여 사용하기로 한다.
Figure 112007089469478-PAT00013
(N은 특허 건수, Fi는 i특허의 패밀리가 형성되어 있는 국가 수)
3.협력관계 및 지식흐름 분석 지표
1) 공동출원 · 발명 특허 수(Number of Patents with
co-applicants, with co-inventors)
공동특허 수는 기술혁신 활동과 관련된 연구주체간 협력현황에 대한 양적 정보를
제공한다. 공동특허 수는 크게 두 가지로 나누어 볼 수 있다. 하나는 혁신성과의 소유에 관한 협력관계, 즉 소유권이 공유되어 있는 특허의 수와 실질적인 기술혁신 활동의 협력관계, 즉 공동발명으로 이루어진 특허의 수가 그것이다.
공동특허 수는 2가지로 정의될 수 있다.
공동소유(출원) 특허 수
"2 이상의 주체가 공동으로 소유(출원)한 특허 수"
공동발명 특허 수
"2 이상의 발명자가 공동으로 발명한 특허 수"
2) 샐턴 지수(Salton's Index)
샐턴 지수(Salton's Index)는 국가 간 협력, 지역 간 협력, 기관 간 협력 등 다양한 유형의 협력관계의 강도를 보여준다. Salton's measure, Salton's cosine formula, Salton's cosine measure 등의 명칭으로 사용된다.
샐턴 지수는 다음과 같이 계산된다.
Figure 112007089469478-PAT00014
(Pij는 i와 j의 공동특허 수, Pi는 i의 특허 수, Pj는 j의 특허 수)
3) 인력 유입률, 유출률(Brain Gain, Brain Drain)
인력 유입률 및 유출률 분석은 연구활동의 성과가 어디로 귀속되고 있는가에 대한
현황을 파악하기 위해 사용된다. 기술혁신 과정에서 인적(人的) 측면에 초점을 맞추어 지식의 흐름방향을 파악하기 위한 분석이라 할 수 있다.
인력 유입률과 유출률은 일반적으로 다음과 같이 정의될 수 있다.
인력 유입률
"자국 거주자(또는 자국인)가 소유한 특허 중 외국 거주(또는 외국인)
발명자의 연구활동이 포함된 특허의 비율"
인력 유출률
"자국 거주(또는 자국인) 발명자의 연구활동이 포함된 특허 중 외국 거
주자(또는 외국인)가 소유한 특허의 비율"
4) 인용관계를 이용한 지식흐름 분석 지수(Index for Knowledge Flow with Patent Citations)
특허의 인용정보를 이용한 지식흐름 분석은 기술개발 활동의 성과인 "지식" 또는
무형의 "기술적 정보"가 확산되는 양태를 파악하기 위해 사용될 수 있다. 이 분석은 분석의 목적에 따라 다양한 방법으로 적용될 수 있다.
지식흐름의 동향을 파악하기 위한 인용관계 지수는 하나의 정형화된 지수로서 설명
하기는 곤란하다. 이하에서는 국가 간의 지식흐름을 파악하기 위한 분석 지표와 방법을 중심으로 설명하기로 한다.
지식유입 현황의 파악을 위한 인용관계 지수
"특정 국가의 특허가 인용한 특허(Backward Citations)의 국가별 점유율"
지식전파 현황의 파악을 위한 인용관계 지수
"특정 국가의 특허를 인용한 특허(Forward Citations)의 국가별 점유율
이하, 좀더 응용성이 뛰어난 분석 지표를 추가적으로 더 도입하며, 이들에 대해서는 상기 분석 지표와 완전하게 동등하게 처리됨은 당업자에게 당연하다 할 것이다.
1. 기술매력도(Technology Attractiveness): 특정 기술 분야가 가지고 있는 매력도를 나타내는데 이 기술이 유망한 기술인지를 나타낸다.
분석 지표
1)RGR(Relative Growth Rate): 특정 기간 내에 한 기술 분야에서 출원 특허수의 성장속도와 전체 기술의 출원 특허수의 평균성장속도에 대한 상대 값이다.
Figure 112007089469478-PAT00015
PAF ( t2 - t1 ) 는 특정 기술 분야 F에서 시간 t1부터 t2사이에 출원한 특허 수
d(PAF ( t2 - t1 ))은 이 기간 동안의 출원특허수의 성장률을 나타낸다
2)RDGR(Relative Development of Growth Rate): 성장속도의 계산에 시간의 변화를 고려한 지표이다. 특정 기술분야의 두 개의 부동한 시간간격 t3 t4 t1 t2를 상호 비교하고 다시 이를 전체 기술 분야에 상대하여 측정한 것이다.
Figure 112007089469478-PAT00016
3)RTCT(Relative Technology Cycle Time): 전체 기술 분야의 평균 TCT값에 대한 특정 기술분야의 상대적인 TCT값이다.
TCT(Technology Cycle Time):특허의 인용정보를 이용한 지표로서 특허의 인용시차의 중앙값으로서 TCT가 작을수록 기술발전의 속도가 빠르며 기술매력도 역시 크다고 할 수 있다.
Figure 112007089469478-PAT00017
2. 기술활동도(Technology Activity): R'D활동의 산출측면을 보여주는데 기업의 R'D성과를 나타낸다. 일반적으로 기업이 일정한 기간 내에 출원한 특허 수 혹은 일정한 기간 내에 등록한 특허 수에 의해 측정한다.
분석 지표
1)RPA(Relative Patent Activity): 기업이 특정 기술분야에서의 출원특허 수와 이 기술분야에서의 모든 기업들의 평균 출원특허 수의 상대 값이다.
Figure 112007089469478-PAT00018
PAiF는 특정 기술 분야 F에서 i기업이 출원한 특허 수를 나타낸다.
2)RPP(Relative Patent Position): 기업이 특정 기술 분야에서의 출원특허 수와 이 기술 분야에서 제일 활발한 경쟁자와의 상대 값이다.
Figure 112007089469478-PAT00019
3)RTA(Revealed Technology Advantage):기업이 한 특정 기술 분야에서 출원하는 특허 수가 이 기술 분야에서 차지하는 비중과 기업이 종사하는 전체 기술 분야의 출원특허 수가 전체 기술 분야들에서 차지하는 비중에 대한 상대 값이다.
Figure 112007089469478-PAT00020
3. 기술 품질(Technology Quality): 기업의 R'D성과를 반영하지만 기업의 R'D활동의 경제적 가치와 효과성에 대한 질적인 평가를 활 수 있다.
분석 지표
1)GR(Grant Rate): 출원된 특허 중 등록된 특허의 비중을 나타내는 것으로 비중이 높을수록 Patent Quality가 높다
Figure 112007089469478-PAT00021
2)TS(Technological Scope): 출원특허의 특허 문서에서 Claim의 개수를 나타내는 것으로 역시 TS가 클수록 Patent Quality가 높다
Figure 112007089469478-PAT00022
3)CR(Citation Ratio): 특허가치의 평가에서 가장 많이 사용되어온 지표의 하나로서 특허가 그 뒤에 출원된 특허에 의해서 인용되는 횟수로 특허가치를 평가하는 지표이다.
Figure 112007089469478-PAT00023
4. 기술 우선 순위(Technology Priority): 기업이 종사하고 있는 다양한 기술분야에서 특정 기술분야가 차지하는 비중을 보여주는데 이기술이 기업에 있어서 얼마나 중요한지 그 우선순위를 파악할 수 있다.
분석 지표
1)ITF(Importance of Technological Field): 기업이 일정한 기간 내에 출원한 전체 특허 수에서 특정 기술분야에서의 출원특허 수가 차지하는 비중이다.
Figure 112007089469478-PAT00024
5. 기술 협업도(Technology Collaboration): 기업의 협력 정도를 나타내는 것으로 기업의 협력을 타기업과의 협력, 기업 내 구성원간의 협력 두 부분으로 이루어져 있다.
분석 지표
1)IC(Internal Collaboration): 기업 내 구성원간에 이루어지는 협력의 정도를 나타내는데 특정 기술분야에서 다른 곳에 있는 기업 내 구성원이 함께 출원한 특허수가 기업의 전체 특허수에서 차지하는 비중으로 표현된다.
Figure 112007089469478-PAT00025
PAiiF는 특정 기술분야 F에서 기업i가 다른 장소에 있는 내부 구성원들과 함께 출원한 특허수이다.
2)EC(External Collaboration):기업이 타기업과 공동 출원한 특허 수가 기업이 이 기술분야에서 출원한 전체 특허 수에서 차지하는 비중으로 계산된다.
Figure 112007089469478-PAT00026
PAijF는 기업i와 기업j가 기술 분야R에서 공동 출원한 특허 수를 나타낸다.
기준 랭킹 생성 방법
상기 랭킹의 생성 방법에 관하여 더욱 상세하게 설명한다. 상기 출원인 A가 입수(확정)되면, 제1국 또는 제2국에서의 상기 출원인 A의 문건 집합이 입수(확정)될 수 있고, 그 문건 집합에서 IPC 등을 추출할 수 있으며, 상기 추출된 각 IPC에서 각 단계별로(섹션에서 n dot 서브그룹까지 모두) 그 각 단계의 IPC별로 해당 문건 수를 카운팅할 수 있게 되고, 상기 카운팅된 값으로 각 IPC 레벨별로 다출원/다등록 총량, 집중, 활동 분야의 랭킹을 계산할 수 있다.(특허 지표 기준 출원인 A의 특허 분류 기호 레벨별의 랭킹 정보 생성에 대해서는 전술한 바가 있다.) 상기 계산된 랭킹으로 랭킹이 높은 분야를 추출할 수 있게 되며, 그 추출된 적어도 하나 이상의 IPC 등의 특허 분류 기호가 상위 랭킹 기술 분야가 될 수 있다. 상기에서 설명한 방법은 하나의 주체(또는 확장하면 속성)가 주어졌을 때, 그 주체에 대한 적어도 하나 이상의 해당 특허 분류 기호의 각 단계별 최빈 특허 분류 기호의 랭킹을 추출하는 방법이 된다.(예를 들면, 발명자, 대리인 등에 대해서도 자신의 명의가 포함된 문건 집합 기준으로 특허 분류 기호 레벨별 랭킹을 동일한 방법으로 생성할 수 있다.)
도 17에서 도 25에는 출원 기준 또는 등록 기준으로 대한민국, 미국, 일본, 유럽 등의 국가 단위로, 출원/등록수, 점유율, 집중율 및/또는 활동율에 대하여 상기 출원인 단위로 IPC 등과 같은 특허 분류 기호 체계의 각 레벨별로 상기 기준 랭킹이 생성되었다는 것을 보여 주고 있다. 도 17에서 삼성전자의 경우, 대한민국 출원문 건 기준으로 IPC 서브클래스 레벨에서는 H01L이 1위, H04N이 2위임을 알 수 있다.
이를 더욱 상세하게 상술하면 다음과 같다. 1) 속성을 공유하는 적어도 하나 이상의 문건 집합을 확정하는 단계(예를 들어 출원인이 A, 또는 출원인 A의 발명자 a 또는 대리인 B, 또는 특정 키워드가 공통적으로 포함됨, 특정 기간이 공통됨, 특정 속성을 가지는 문건 집합의 문건을 인용하거나 인용 당함 등과 같이 적어도 하나 이상의 속성을 공유하는 경우, 전체 문건 집합에서 그 속성을 공유하는 부분 문건 집합을 SQL 쿼리문 또는 검색 엔진으로의 질의를 통해서 생성할 수 있게 된다.) , 2) 문건 집합을 구성하는 개별 문건에 대하여 적어도 하나 이상의 해당 특허 분류 기호를 추출하는 단계, 3) 추출된 특허 분류 기호를 상기 특허 분류 기호 체계를 참조하여 모든 상위 특허 분류 기호를 입수하는 단계, 4) 상기 모든 상위 특허 분류 기호를 특허 분류 기호의 레벨별(예를 들어, IPC의 경우라면 섹션에서 n dot 서브그룹까지) 저장하는 단계, 5) 저장된 특허 분류 기호를 포함하고 있는 개별 문건을 레벨별로 롤업 연산하여 카운팅하는 단계, 6) 카운팅 결과를 참조하여 기설정된 분석 지표별로 계산을 수행하는 단계(총량 계산, 집중율 계산, 활동율 계산 등 기설정된 분석 지표별로의 계산을 수행하는 단계), 7) 각 분석 지표별로의 특허 분류 기호의 각 레벨별로 롤업을 고려하여 랭킹을 계산하는 단계(SQL 명령문 중에서 rank 명령을 활용하면 된다.)를 거치면, 제1국 또는 제2국에서 적어도 하나 이상의 해당 특허 분류 기호의 각 단계별 최빈 특허 분류 기호의 랭킹을 추출할 수 있게 된다. 이때, 문건 집합이 특정 속성(예를 들어 출원인 A(복수의 출원인 일 수도 있다. 이하 같다)와 같은 출원인 속성 , 최근 5년 등과 같은 기간 한정, 발명자 C와 같은 발명자 한정 및/또는 이들 각 속성의 조합된 속성(출원인 A의 발명자 C 등) 공유하는 것일 수 있음은 당연할 것이다. 출원인별 문건 집합일 경우, 제1국에 속하는 모든 출원인별로, 상기 1)~7)을 계산해 놓을 수도 있을 것임도 자명하다 할 것이다.
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 1) ~7) 단계 중 일련의 어느 한 단계 이상을 수행하여 다차원 분석용 연산 수행 결과 테이블 데이터로 생성해 놓을 수 있을 것이다. 즉, 상기 1)에서 출원인, 대리인, 발명자 등과 같이 문건 집합이 자동으로 확정되는 대상에 대해서는 상기 1) ~7)을 일련으로 수행할 수도 있으며, 사용자 등에 의해서 1) 단계의 문건 집합이 주어지면, 상기 주어진 문건 집합에 대하여 상기 2) ~7)의 단계를 수행할 수 있을 것이다. 한편, 하나의 국가 단위의 모든 출원 문건/등록 문건별로 각 분석 지표별로 상기 2)~7)의 단계를 수행하여 그 결과를 데이터로 저장해 놓을 수 있을 것이다. 이때, 상기 특허 분석 지표(상기 분석 지표에는 분석 지표별 계산식이 대응되며, 상기 계산식에는 데이터베이스에서 계산식을 구성하는 정보를 입수하여 필요한 계산을 수행하는 SQL 쿼리(또는 복잡한 경우에는 계산 수행을 위한 애플리케이션)가 대응되어 있음은 당연하다 할 것이다. 이하 반복되는 설명은 생략한다.)는 본 발명 사상이 구현되는 시스템(1)에서 주어질 수도 있으며, 사용자에 의해서 선택될 수도 있을 것이다. 본 시스템의 사용자가 특정한 주체, 특정한 국가, 특정한 지표, 특정한 특허 분류 기호의 종류, 특허 분류 기호의 레벨을 중 어느 하나 이상을 선택하면, 그 선택된 조합에 부합되는 결과를 SQL 쿼리로 추출하여 제공해 줄 수 있을 것이 다. 통상적으로 상기 특정한 주체, 특정한 국가, 특정한 특허 분류 기호의 종류, 특허 분류 기호의 레벨 등은 SQL 문의 where절의 조건에 해당될 경우가 많을 것이다. 한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 특정한 지표별로 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓은 경우, 상기 SQL 문에서 가리키는 대상 테이블 지정값은 상기 특정한 지표별로 생성되어 있는 다차원 분석용 연산 수행 결과 테이블 데이터가 되는 것이 바람직할 것이다.
이하, 도 17 내지 도 31은 상기와 같은 모든 설명이 구현된 실시예적 도면이다.
도 17은 본 발명의 대한민국에 출원한 삼성전자주식회사의 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다. 왼쪽 칼럼에 IPC 서브클래스 레벨의 다출원 기준 IPC별 랭킹이 생성되어 있음에 주목하기 바란다. 본 구현된 실시예적 도면에 나와 있는 수치값들은 상기 분석 모듈에 입력된 값을 전산적인 방법으로 처리한 것이며, 데이터의 보충과 삭제, 변경 등에 따라 가변적이며, 따라서 이는 특정 시점을 기준으로의 실제값과 차이가 있을 수 있다. 그러므로, 본 발명의 발명 사상은 본 명세서에서 각종 표 등에 나온 수치값에 있는 것이 아니라, 그 수치값을 생성하는 구조, 구성, 도구, 방법, 정보 처리 절차, 시스템, 활용 방법 등에 있음을 분명히 한다. 이하, 동일하다.
도 18은 H01L에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다. 드릴 다운 한 경우, 드릴 다운한 것에 대해서만 분석 정보값을 생성한다. 이때, AJAX 기술을 사용하면, 전체 페이지의 리로딩(reloading) 없이 신속하게 변경(드릴 다운)이 일어난 부분에 대한 수치값만을 생성하여 사용자에게 제공해 줄 수 있다. 본 발명에서 사용자는 본 발명의 시스템과의 관계에서는 사용자 컴퓨터(300)로 해석되어야 된다. 즉, 시스템의 입장에서는 1) 사용자에게 제공한다는 것은 실제로는 사용자의 컴퓨터에게 전송한다는 것이며, 2) 사용자가 입력한다는 것은 실제로는 사용자의 컴퓨터로부터 사용자의 입력값을 전송 받는다는 것이며, 사용자의 지정, 특정, 선택 등도 모두 실제로는 사용자의 컴퓨터로부터 사용자가 지정, 선특정, 선택한 정보를 전송받는 것이 되므로, 본 명세서에서는 상기 사용자와 관계된 표현은 모두 이와 같이 해석되어야 함이 타당하다. 다만, 사용자를 중심으로 기술한 이유는 기재의 간편성 때문이다.
도 19는 H01L 21/00 및 기타의 하위 특허 분류 기호에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다. 드릴 다운하여 총량 기준의 분석 결과가 나옴을 알 수 있다. 드릴 다운은 IPC의 최하위까지 가능하며, 데이터가 있는 한 최하위 레벨까지 드릴 다운 된다. 이는 다른 특허 분류 기호에 대해서도 마찬가지일 것이다.
도 20은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 메인그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다. 상기 기준 IPC를 메인 그룹으로 선택한 경우, 메인 그룹 단위에서 최빈 IPC를 추출하고, 상기 추출된 IPC에 대한 분석 결과를 생성하여 사용자에게 제공한다. 이때, 기준 IPC는 n dot 서브그룹까지 확장할 수 있으며, 다른 특허 분류 기호에 대해서도 마찬가지임을 알 수 있다.
도 21은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 1 dot 서브 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다. 상기 기준 IPC를 1 dot 서브 그룹으로 선택한 경우, 1 dot 서브 그룹 단위에서 최빈 IPC를 추출하고, 상기 추출된 IPC에 대한 분석 결과를 생성하여 사용자에게 제공한다.
도 22는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 미국에 출원한 삼성전자주식회사의 출원 문건 기준 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 23은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 미국에 등록한 삼성전자주식회사의 등록 문건 기준 IPC 메인 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 24는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC no dot(sub class) 레벨의 다출원 USPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 25는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC 1 dot 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 26은 본 발명의 대한민국 출원 전체 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다. 본 분석 결과는 출원인과는 무관 하다.
도 27은 본 발명의 미국 출원 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다.
도 28은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 다출원 기업별 총량 분석에 관한 일실시예적 도면이다. 본 분석 결과는 하나의 국가 단위에서 기술 분류 기호가 주어졌을 때, 그 기술 분류 기호에 대한 분석 지표값을 생성하여 사용자에게 제공해 주는 것이다.
도 29는 본 발명의 특허 분류 기호를 활용한 기술 영역 분석의 일례로서, 대한민국 출원 전체 문건 기준 IPC H04B에 대한 점유율 기준 다출원인에 대한 일실시예적 도면이다.
도 30은 본 발명의 특허 분류 기호를 활용한 기술 영역 분석의 일례로서,대한민국 출원 문건 기준 IPC H04B에 대한 활동율 기준 다출원인에 대한 일실시예적 도면이다.
도 31은 본 발명의 특허 분류 기호를 활용한 기술 영역 분석의 일례로서,미국 출원 전체 문건 기준 IPC H04B 및 이들의 하위 분류에 대한 드릴다운을 포함한 출원 총량 분석에 대한 일실시예적 도면이다.
경쟁 분석용 다차원 분석용 연산 수행 결과 테이블
경쟁 분석을 수행하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓 는다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떤 과정을 거쳐서 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는지에 대해서 설명한다.
경쟁의 종류(주체 관점, 기술 관점)
본 발명 사상에서 경쟁은 다음과 같은 2가지가 있다. 첫째, 하나의 주체 관점의 경쟁으로, 출원인, 발명자, 대리인 등이 주체가 되고, 상기 각 주체의 관점에서 경쟁을 정의할 수 있다. 둘째, 하나의 기술 분야 관점에서의 경쟁이 있을 수 있으며, 기술 분야 관점이란 IPC 등과 같은 적어도 하나 이상의 특허 분류 기호로 확정되는 분야 및 기술 관련된 키워드로 생성되는 문건 집합으로 생성되는 분야가 그 예가 된다. 이하, 하나씩 분설한다.
출원인 관점의 경쟁
출원인 관점의 경쟁이란, 그 출원인A가 속한 국가(제1국) 또는 적어도 하나 이상의 다른 국가(제2국)에서의 다른 출원인들B 간의 충돌로 정의될 수 있다. 한편, 출원인 간의 충돌이란 1) 다출원 기술 분야의 공통, 2) 고집중 분야의 공통, 3) 고활동 분야의 공통 등이 있을 수 있으며, 다출원/고집중/고활동 기술 분야에서 기술 분야는 각 레벨별 IPC 등과 같은 각 레벨별 적어도 하나 이상의 특허 기술 분류 기호로 정의되는 분야인 것이 바람직하다. 예를 들어 제 1국에서 출원인 A가 IPC subclass 기준으로 H01L에 다수 출원하고 있을 때, 제1국에서 IPC subclass 기준으로 H01L에 1) 다수 출원하고 있는 자(점유율이 높은 자), 2) 집중율이 높은 출원인, 3) 활동율이 높은 출원인은 경쟁자가 될 수 있다.(제 2국에서 상기 1), 2), 3) 출원인들은 직접적 또는 잠재적 경쟁자가 될 수 있다.) 한편, 출원인 A가 H01L에 집중율 또는 활동율이 높을 때, 제1국 또는 제2국의 상기 1), 2), 3) 출원인들은 경쟁자가 될 수 있을 것이다.
출원인 관점의 경쟁 정보 입수 방법
출원인 관점의 경쟁 정보 입수 방법을 설명한다. 상기에서 출원인 A의 각 국가의 각 분석 지표별(총량, 점유율, 집중율, 활동율 및 기타 등등)의 특허 분류 기호의 레벨별의 랭킹 정보의 생성 방법에 대해서 설명한 바 있다. 예를 들어, 삼성전자주식회사의 대한민국 특허 출원 문건 기준 IPC 1 dot 서브클래스(C5 레벨)에서 H04B 7/02이 다출원 서브클래스 IPC로 선택되었을 때 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 다음과 같은 정보를 생성한다.
입수 받은 IPC H04B 7/02에 대하여 제1국에서 출원 문건 기준/등록 문건 기준으로 1) 다출원/다등록 출원인, 2) 상기 H04B 7/02에 집중율이 높은 출원인, 3) 활동율이 높은 출원인, 또는 4) 기타 특허 분석 지표별 계산값이 높은 출원인을 추출할 수 있다. 상기 추출의 방법은 기본적으로 SQL 쿼리문으로 처리할 수 있다. 이때, 총량, 점유율, 집중율, 활동율 등의 분석 지표를 기준으로, 특허 분류 기호의 레벨별로 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓은 경우, 그 다차원 분석용 연산 수행 결과 테이블 데이터에 간략한 SQL 쿼리문으로 접근하여 목표하는 경쟁 관련성이 높은 적어도 하나 이상의 출원인 정보 및 상기 출원인의 기설정된 기간 단위의 출원/등록량 등의 정보를 입수할 수 있다. 만약, 상기 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓지 않고 있는 경우에는 다음과 같은 순 서를 취하는 상대적으로 길고 복잡한 SQL 문을 사용하여 목표하는 정보를 입수한다.
상기 SQL 문의 로직은 1) 입수 받은 특정 레벨의 특허 분류 기호(예를 들면 IPC H04B 7/02) 및 상기 특허 분류 기호의 하위 특허 분류 기호들(상기 하위 특허 분류 기호들은 특허 분류 기호 마스트 DB(203)에 조회하여 입수한다. 이에 대해서는 전술한 바 있다.)을 포함하고 있는 모든 문건을 국가 단위/국가 통합 단위의 특허 문건 마스트 DB(202)로부터 추출하는 단계(이 경우, 동일 문건이 2회 이상 나올 경우 중복을 제거해야 한다.), 2) 상기 추출된 문건의 서지 사항 정보에서 출원인, 출원일/등록일 등의 날짜 정보를 획득하는 단계, 3) 다출원인/다등록출원인 기준으로 소팅하여 다출원인/다등록출원인에 대한 랭킹 정보를 획득하는 단계, 및/또는 4) 출원일/등록일 정보로부터 기설정된 기간 단위의 출원/등록량을 카운팅 하는 단계를 처리하는 명령으로 이루어진다. 물론, 상기 1) ~4) 단계 중 어느 둘 이상은 한꺼번에 처리될 수 있음은 물론이다. 상기 SQL 로직은 총량 기준으로 설명해 놓았지만, 점유율, 집중율 및 활동율 등의 기타 특허 분석 지표에 관해서도 대동소이한 방법으로 처리할 수 있다.
예를 들어, 집중율이 높은 출원인을 찾기 위해서는 상기 2) 단계 후에 출원인 목록을 작성한 다음도 각 출원인의 H04B 7/02에 관한 출원수/등록수를 각 출원인의 모든 출원수/등록수 정보(특허 문건 마스트 DB(202)에서 SQL로 입수할 수 있음)로 나누어 집중율을 계산한 다음, 상기 계산된 집중율로 상기 3) 단계의 소팅을 처리할 수 있을 것이다. 만약, 하기와 같이 상기 다차원 분석용 연산 수행 결과 테이블 생 성 모듈(402)이 상기 특허 분류 기호의 레벨별로 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓은 경우에는 간단한 SQL로 처리할 수 있을 것이다.(이러한 간단한 SQL은 당업자에게 극히 용이한 일을 것이다.)
상기 1) 단계에서 주어진 특허 분류 기호의 하위 특허 분류 기호를 입수하는 것이 확장자(*, ? 등)으로서 용이하게 획득할 수 없는 경우에는 상기 1) 단계의 데이터 처리에서 많은 부하가 걸리는 문제가 있다. 그러므로, 이러한 경우 하기 표 64와 같은 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 하위 특허 분류 기호에 관련된 문건의 카운트 정보를 기초로 롤업 연산을 통해서 생성해 놓은 데이터가 더욱 유용하게 된다.
[표 65]
GC C5 C6 C7 C.. 01 02 03 04 05
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/06 0 0 3 17 12
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 H04B 7/08 3 1 5 4 3
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 3 2 2 21 24
H04B 7/02 H04B 7/04 6 3 10 42 39
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/10 0 0 0 0 0
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 H04B 7/12 0 1 0 0 1
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 9 3 20 18 24
H04B 7/02 15 7 30 60 64
H04B 7/02 50 40 30 30 30
상기 표 65와 같은 다차원 분석용 연산 수행 결과 테이블과 같은 데이터가 있을 때 는 상기 IPC 1 dot 레벨(C5 칼럼)에서의 H04B 7/02를 가지는 레코드를 추출한 다음, 그 레코드들의 개수를 출원인 필드인 AppName으로 group by하여, 랭킹을 매기면 된다. 이와 같이 하면 A의 H04B 7/02 기준으로 할 때 경쟁 출원인으로 B 등을 추출할 수 있게 되고, B의 연도별/기간별 출원/등록수는 상기 다차원 분석용 연산 수행 결과 테이블에서 생성한 상기 출원인 B의 문건 중에서 H04B 7/02 및 상기 H04B 7/02의 하위 특허 분류 기호를 포함하는 문건을 처리한 값을 읽어서 사용자들에게 제공할 수 있게 된다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 점유율, 집중율, 활동율 등과 관련된 다차원 분석용 연산 수행 결과 테이블 데이터(점유율에 대해서는 상기에서 다차원 분석용 연산 수행 결과 테이블의 내용에 대해서 언급한 바 있으며, 집중율과 활동율도 마찬가지 임은 상기에서 설명한 바와 같다.)가 있는 경우, 이에 대해서는 간단한 SQL로 처리할 수 있음은 직전에서 전술한 바와 같다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 적어도 하나 이상의 경쟁 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는 단계는 다음과 같다. 먼저 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 기설정된 경쟁의 종류별로 상기 표 65와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 표65와 같은 형태로 점유율, 집중율, 활동율 또는 기타의 분석 지표로 상기 표65와 같은 테이블/데이터를 생성할 때, 상기 AppName, 특허 분류 기호의 레벨 등은 동등하고, 상기 연도별/기간별 수치값의 내용이 각각 점유율, 집중율, 활동율 또는 기타 분석 지표의 값이 되면 된다.
상기에서는 입수 받은 IPC H04B 7/02에 대하여 제1국에서 출원 문건 기준/등록 문건 기준으로 1) 다출원/다등록 출원인, 2) 상기 H04B 7/02에 집중율이 높은 출원인, 3) 활동율이 높은 출원인, 또는 4) 기타 특허 분석 지표별 계산값이 높은 출원인을 추출하는 방법에 대하여 설명하였으나, 상기 입수 받은 IPC H04B 7/02에 대하여 제2국을 기준으로 동일한 방법으로 상기 1) ~4)를 추출할 수 있을 것이다.(제1국 특허 문건 데이터를 기준으로 제1국에서 처리했던 바와 동일한 방식으로 제2국 특허 문건 데이터를 기준으로 처리하면 된다. 물론, 각 국가마다의 고유의 특허 분류 기호가 있을 경우, 그 기호들도 IPC 처럼 다단계 계층 구조를 가지며, 그 계층 구조는 dot 등의 수에 의해서 구분될 수 있으므로, 그 기호들에 대해서 IPC와 동등하게 처리하면 된다.)
도 32는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준으로 한 대표적 경쟁사 분석에 관한 일실시예적 도면이다. 상기 출원인별 대표적 경쟁사에 대한 분석은 출원인의 다출원 특허 분류 기호 중 IPC 그룹 레벨의 특허 분류 기호를 대상으로 하여, 그 특허 분류 기호들의 랭킹 및 출원량을 구하고, 상기 특허 분류 기호에 다출원하고 있는 출원인의 출원량 정보를 기반으로 기설정된 계산식에 의하여 점수를 매기고, 점수가 높은 출원인을 랭킹과 함께 제공하는 것이다. 상기 대표적 경쟁사 분석은 대표적 경쟁사들의 연도별 출원수/등록수 정보가 함께 나오는 것이 바람직할 것이다. 물론, 상기 출원수/등록수에 클릭을 하게 되면, 상기 출원수/등록수에 내장되어 있는 쿼리식으 로 상기 출원수/등록수에 대응되는 문건을 입수하여 간이 분석 모듈(407)로 전송하고, 상기 간이 분석 모듈(407)은 이들 문건에 대하여 간이 분석한 정보를 제공한다. 본 발명의 모든 셀에 나온 수치는 쿼리값에 기반하고 있고, 각 쿼리식으로부터 해당 수치가 나오게 되는 근거 문건을 입수할 수 있게 되어 있다. 이하 모든 셀에 대해 적용된다. 만약 비율값일 경우에는 그 비율을 만들어 내는 수식에 포함된 요소별 수치 각각에 대하여 쿼리가 대응되어 있으므로, 그 쿼리에 기반하여 근거 문건을 입수할 수 있게 된다.
도 33은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준 다출원 특허 기술 분류 기호별 경쟁 출원인에 관한 분석의 일실시예적 도면이다. 특정 기술 분류 기호 레벨별, 기술분류 기호별 경쟁출원인을 입수하는 것은 1) 상기 특정 기술 분류 기호 레벨별로 기준 특허 분류 기호들의 랭킹 정보(상기 도 33에서는 1위 H01L, 2위 H04N 등)를 입수하고, 2) 상기 특정 기술 분류 기호 레벨별 기준 특허 분류 기호별(예를 들면 도 33에서 H01L)로 특정 국가(대한민국, 미국, 일본, 유럽 등에서 사용자가 선택하거나 시스템(1)이 자동으로 선택함)에서 출원량이 많거나(출원량 기준), 점유율이 높거나(점유율 기준), 집중율이 높거나(집중율 기준), 활동율이 높거나(활동율 기준) 기타 특허 지표가 높은 출원인을 랭킹과 함께 추출하고, 3) 상기 출원인의 출원수/등록수를 상기 추출한 출원인 정보와 함께 제공해 줄 수 있게 된다. 이때 드릴 다운을 하게 되면, 출원인의 문건이 1개라도 있는 드릴 다운된 특허 분류 기호의 하부 특허 분류 기호에 대하여 상기 1) ~3)을 실시하여 경쟁 출원인에 대한 정보를 제공해 준다. 상기 드릴다운은 최하위 특허 분류 기호까지 드릴다운될 수 있다. 한편, 상기 경쟁사에 대한 것은 IPC뿐만 아니라, USPC, FT 등에 대해서도 동일한 방법으로 수행할 수 있을 것이지만, 국가 선택에는 제한이 있을 것이다.(USPC는 미국 특허 분류 기호이므로, 대한민국과 일본의 특허 문건으로 경쟁 출원인을 입수할 수 없기 때문이다.) 상기 경쟁 출원인은 출원인의 출원 총량 기준으로도 생성할 수 있지만, 출원인의 등록 총량 기준으로도 생성할 수 있을 것이다.
한편, 기준 특허 분류 기호를 제1국에서의 특정 출원인의 특허 문건을 기준으로 생성해 놓고, 상기 기준 특허 분류 기호별로 다출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국이 아닌 제2국에서 추출할 수 있을 수 있다. 상기 제1국 및 제2국의 선택은 사용자에 의해서 선택될 수도 있지만, 시스템(1)에 의해서 default값으로 선택될 수도 있다.
한편, 진입 경쟁 출원인에 대한 분석도 가능하며, 상기 진입 경쟁사에 대한 분석 정보의 생성은 기설정된 최근 기간(예를 들어 최근 7년 이내)의 문건에 대해서만 처리할 수 있을 것이다. 즉, 1) 상기 최근 기간에 출원된/등록된 제1국에서의 출원인의 문건을 기준으로 상기 특허 분류 기호 레벨별 특허 분류 기호의 기준에 관한 정보를 생성하고, 이 특허 분류 기호의 기준별 i) 최근 기간 또는 ii)전체 기간 기준으로 한 다출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국 또는 제2국에서 추출할 수 있을 수 있을 것이다. 2) 전체 기간에 출원된/등록된 제1국에서의 출원인의 문건을 기준으로 상기 특허 분류 기호 레벨별 특허 분류 기호의 기준에 관한 정보를 생성하고, 이 특허 분류 기호의 기준별 i) 최근 기간 기준으로 한 다 출원, 고집중, 고점유, 고활동 경쟁 출원인을 상기 제1국 또는 제2국에서 추출할 수 있을 수 있을 것이다.
도 34는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 미국 특허 기준 삼성전자주식회사의 IPC 메인 그룹 기준 출원 총량 기준 경쟁 출원인에 분석의 일실시예적 도면이다.
도 37은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원 총량을 기준으로 할 때 USPC 서브클래스(no dot, 클래스 직하위) 기준 다출원 경쟁 출원인에 대한 랭킹 분석 결과에 대한 일실시예적 도면이다.
발명자 관점의 경쟁
상기에서는 출원인 관점의 경쟁 정보를 획득하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떻게 데이터를 생성하는가에 대해 설명하였다. 발명자 관점의 경쟁도 출원인 관점의 경쟁을 처리하는 방법(출원인 기준의 문건 집합 단위로, 특허 분류 기호 레벨별로 총량, 점유율, 집중율, 활동율 등과 같은 분석 지표별로 테이블/데이터를 생성해 놓고, 이 데이터에 대해서 출원인 기준으로 접근함)과 동등한 방법(발명자 단위로 문건 집합을 생성하고, 그 발명자별의 문건 집합 단위로 동등한 방법으로 테이블/데이터를 생성한 다음, 이 데이터에 대해 발명자를 기준으로 접근함)으로 생성할 수 있을 것이다. 하기 표 66은 이러한 데이터의 한 예를 보여준다.
발명자 분석용 다차원 분석용 연산 수행 결과 테이블
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 입수된 문건 집합에 대하여 출원인을 포함하는 각종 특허 분석 지표별 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는 것에 대하여 설명하였다. 상기와 같은 발명 사상은 출원인 대신에 발명자를 기준으로 각종 특허 분석 지표별 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는데 적용될 수 있음은 자명할 것이다. 하기는 발명자 기준으로 생성한 다차원 분석용 연산 수행 결과 테이블의 일 예시를 보여준다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 발명자를 기준으로 생성하는 데이터는 2가지 계열이 있을 수 있다. 첫째는 하나의 출원인의 하부에 발명자를 배치시키고, 그 출원인의 발명자 단위의 문건 집합을 처리하는 방식으로 데이터를 생성하는 방법이며(즉, 출원인 등이 통상적으로 큰 기업이나 조직이며, 그 조직 내에 그 발명자가 있다고 가정하고, 그 발명자를 출원인의 하부에 연동시키는 방법이다. 출원인A AND 발명자1, 출원인A AND 발명자 2 ... 와 같이 상기 조건을 만족시키는 문건 집합별로 데이터를 생성할 수 있을 것이다.), 둘째는 발명자만을 독립적으로(출원인 자리에 발명자가 들어가는 형식)으로 발명자 단위의 문건 집합을 처리하는 방식으로 데이터를 생성한다. 전자에 대한 예시는 자명할 것이므로 후자에 대하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 데이터 형식의 일 실시예를 하기 표 66에서 보여 준다.
[표 66]
IAppName Inventor C3 C4 C5 C6 00 01 02 03 04 05
A a H04N H04N 5/00 H04N 5/64 H04N 5/655 0 0 0 1 0 0
A a H04N H04N 5/00 H04N 5/64 H04N 5/655 0 0 0 1 0 0
A a H04N H04N 5/00 H04N 5/64 H04N 5/655 0 0 0 1 0 0
A a H04N H04N 5/00 H04N 5/64 1 2 0 0 0 0
A a H04N H04N 5/00 H04N 5/64 1 2 0 0 0 0
A a H04N H04N 5/00 H04N 5/64 1 2 0 0 0 0
A a H04N H04N 5/00 H04N 5/64 1 2 0 1 0 0
A a H04N H04N 5/00 H04N 5/72 0 1 0 0 0 0
A a H04N H04N 5/00 H04N 5/72 0 1 0 0 0 0
A a H04N H04N 5/00 H04N 5/72 0 1 0 0 0 0
A a H04N H04N 5/00 H04N 5/72 0 1 0 0 0 0
A a H04N H04N 5/00 H04N 5/74 0 1 0 1 1 0
A a H04N H04N 5/00 H04N 5/74 0 1 0 1 1 0
A a H04N H04N 5/00 H04N 5/74 0 1 0 1 1 0
A a H04N H04N 5/00 H04N 5/74 0 1 0 1 1 0
A a H04N H04N 5/00 1 4 0 2 1 0
A a H04N 1 4 0 2 1 0
A b
B z
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기와 같은 총량 정보가 있을 때, 특정 출원인의 개별 발명자 단위별로 점유율, 집중율, 활동율 등과 같은 데이터를 생성하는 방법은 상기 출원인 단위에서 동등한 정보를 생성하는 방법을 설명하는 곳에서 설명한 바와 같다. 물론, 상기 표 66과 같은 데이터가 모든 출원인에 대한 모든 발명자 정보를 갖고 있을 경우, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 특정 출원인의 하위가 아닌 개별 발명자 단위에서 상기 총량 정보를 기준으로 하여, 점유율, 집중율, 활동율 등과 같은 특허 분석 지표의 값에 대한 데이터를 생성할 수 있을 것이다.
도 35는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 연도별 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다. 상기 특허 분류 기호 레벨별 영역별 발명자 분석은 1) 특정 출원인의 상기 특허 분류 기호 레벨별 특허 분류 기호 기준 랭킹을 생성하는 단계, 2) 상기 특허 분류 기호 기준 랭킹별로 i) 연도별로의 최다출원 발명자를 정보를 계산하는 단계(도 35에 적용된 것), ii) 연도 통합별로 다출원 발명자의 랭킹(예를 들면, 1위부터 10위 등) 정보를 계산하는 단계 중에서 어느 하나를 실생하는 단계, 3) 상기 실행되어 추출한 발명자 분석 정보를 사용자에게 제공하는 단계로 우리어 진다. 한편, 상기 특허 분류 기호 레벨별 영역별 발명자 분석은 국가 단위로 출원인을 특정하지 않고, 출원 문건 또는 등록 문건을 기준으로 실행될 수도 있다. 이때는 1) 전체 대상 문건을 기준으로 특허 분류 기호 레벨별 특허 분류 기호 기준 랭킹을 생성하는 단계, 2) 상기 특허 분류 기호 기준 랭킹별로 i) 연도별로의 최다출원 발명자를 정보를 계산하는 단계(도 35에 적용된 것), ii) 연도 통합별로 다출원 발명자의 랭킹(예를 들면, 1위부터 10위 등) 정보를 계산하는 단계 중에서 어느 하나를 실생하는 단계, 3) 상기 실행되어 추출한 발명자 분석 정보를 사용자에게 제공하는 단계로 우리어 진다.
도 36은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 다출원 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다. 도 36과 같은 발명자 개인별 분석은 국가 단위로 특정 출원인에 관련된 모든 발명자(출원인을 회사로 한 발명자 등)에 대하여 상기 발명자 개인별 분석 정보의 생성은 1) 특정 국가 단위로 상기 출원인에 관련된 모든 출원 문건 또는 등록 문건을 입수하고, 2) 상기 입수된 문건에서 발명자를 추출하고, 3) 발명자별로 문건의 개수를 기설정된 정책에 따라 카운팅하여, 4) 발명자별 랭킹을 생성하고, 5) 상기 랭킹에 따라 최다 발명자별, 연도별/특정 기간별 출원수/등록수 정보를 생성하여 사용자에게 제공한다. 한편, 특정 출원인에 관계하지 않는 경우에는 국가 단위의 모든 특허 문건을 입수하여 상기 2) ~5)를 실행한다. 상기 문건들은 최근 7년 등과 같이 기설정된 기간 동안의 문건만을 대상으로 할 수도 있을 것이다. 이는 본질적으로 문건 집합의 생성의 문제이며, 문건 집합의 생성은 본 명세서의 곳곳에서 언급한 문건 집합의 생성 방법 중에서 선택되는 어느 하나이어도 무방하다.
인용 분석용 다차원 분석용 연산 수행 결과 테이블
인용 분석을 수행하기 위하여 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 인용 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓는다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 어떤 과정을 거쳐서 인용 분석용 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하는지에 대해서 미국 특허 출원 제 09/802,847 호(출원인 Samsung Electronics Co., LTD(KR)., 발명의 명칭 User request processing method and apparatus using upstream channel in interactive multimedia contents service, 출원일 2001.3.12)을 예시로 들면서 설명한다.
상기 미국 특허 출원 제 09/802,847호의 서지 사항은 표 51에 나타난 바와 같다.
[표 51]
출원번호 출원일 등록번호 등록일 인용정보(US특허) IPC USPC
09/802,847 March 12, 2001 7,302,464 November 27, 2007 5680322 5805804 6044397 6130898 6317131 6611262 6631403 6654761 6654931 6697869 2002/0026642 G06F 15/16 H04N 7/16 709/203 709/217 725/135
이때, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 인용과 관련하여 09/802,847의 서지 사항 정보로부터 다음과 같은 인용 parent-child 데이터를 입수한다. child는 자기 자신의 문건 번호이며, patent는 자기가 인용하고 있는 타 문건 번호를 말한다.(이때, 자신의 문건 번호는 출원번호일 수도 있으며, 등록번호 일 수도 있다. 즉, 자신을 특정화시킬 수 있는 번호이면 좋으나, parent에 공개번호(publication number)나 출원번호가 있을 수 있으므로, 모든 문건이 공통적으로 가지고 있는 번호인 출원번호로 통일하는 것이 바람직하다. 하지만, 등록번호로 통일하는 것도 무방하며, 정보처리의 복잡성이 문제되지 않는다면, 문건의 특정에 문제가 없다면 여러 번호를 혼용하는 것도 무방하다. 본 명세서에서는 설명의 편의상 출원번호로 통일한다.) 하기 표 52에 있는 데이터를 입수 데이터 기준 유닛 인용 parent-child 데이터라 한다.
[표 52]
child-국가 child(출원번호) parent(입수데이터 그대로) parent-국가
US 09/802,847 5680322 US
US 09/802,847 5805804 US
US 09/802,847 6044397 US
US 09/802,847 6130898 US
US 09/802,847 6317131 US
US 09/802,847 6611262 US
US 09/802,847 6631403 US
US 09/802,847 6654761 US
US 09/802,847 6654931 US
US 09/802,847 6697869 US
US 09/802,847 2002/0026642 US
상기 표 52와 같이 상기 입수된 인용 parent-child 데이터로부터 하기 표 53과 같이 출원번호로 통일된 인용 parent-child 데이터를 생성한다. parent의 등록번호 및 공개번호(출원번호라도 무방함, 모든 번호 정보에는 document type이 있음. A등록, A1공개 등)로부터 각각의 출원번호를 입수한다.(US에서는 출원번호 또는 출원일련번호라고 칭하나, 이는 명칭일 뿐 그 명칭이 가리키는 데이터의 속성은 동일하다. 이상과 이하에서 출원번호라고 통일해서 설명한다.) 하기 표에 있는 데이터를 통일화된 번호 기준 유닛 인용 parent-child 데이터라 한다. 한편, child와 parent칼럼에 있는 문건의 국가 칼럼들은 그 해당 문건이 관련된(출원되거나 등록된) 출처 국가를 말한다. 이러한 국가는 미국뿐만 아니라 여러 나라 국가가 모두 해당될 수 있다. 이하에서는 설명의 편의상 국가 칼럼은 생략하고 설명하나, 국가 칼럼이 있다고 이해하여야 한다. 한편, 상기 출원번호의 표기 형태는 "두자리수 + / + 6자릿수"나 "연도+6자리 수"등 임의의 표기일 수 있다.
[표 53]
child(출원번호) parent(출원번호)
09/802,847 08/451,470
09/802,847 08/816,207
09/802,847 09/055,929
09/802,847 08/969,965
09/802,847 09/113,748
09/802,847 09/152,003
09/802,847 09/309,895
09/802,847 09/124,474
09/802,847 09/236,462
09/802,847 09/138,782
09/802,847 09/736393
상기 표 53과 같은 데이터 처리는 주어진 문건 1개를 기준으로 생성하였으나, 상기와 같은 데이터 처리는 주어진 적어도 하나 이상의 문건 집합 단위로 그 문건 집합에 속한 개별 문건 단위로 처리할 수 있을 것이며, 그러한 결과는 표 54에 정리되어 있다. 이때, 개별 분건 집합 단위에서 parent(출원번호)의 중복을 허용할 수 있다.(즉, 1개의 문건 집합에 속하는 문건 1, 문건 2가 모두 인용 정보에 문건 3을 포함하고 있으면, 문건 3의 2회 중복을 허용할 수 있다는 것이다.) 즉, 문건 집합에 속하는 모든 개별 문건에 대한 통일화된 번호 기준 유닛 인용 parent-child 데이터를 생성할 수 있다. 이때, 가장 대표적인 문건 집합이 US 공개 출원 문건 집합 및 US 등록 특허 문건 집합이 될 수 있다. 사용자가 생성한(특정 검색식을 입력한 다음 검색 결과로 출력되는) 문건 집합 및 본 발명을 실시하는 전산 시스템(1)이 자동적으로 그 대상이 될 수 있음은 자명하다 할 것이다.
[표 54]
child(출원번호) parent(출원번호)
09/802,847 08/451,470
09/802,847 08/816,207
09/802,847 09/055,929
09/802,847 08/969,965
09/802,847 09/113,748
09/802,847 09/152,003
09/802,847 09/309,895
09/802,847 09/124,474
09/802,847 09/236,462
09/802,847 09/138,782
09/802,847 09/736393
아울러, 상기 통일화된 번호 기준 유닛 인용 parent-child 데이터에 포함된 모든 문건에 대해 특허 문건 마스트 DB(202)를 조회하면 하기 표 55와 같이 각 문건별로 서지사항을 추가한 데이터를 생성할 수 있을 것이다. 서지 사항의 추가는 서지 사항을 구성하는 모든 요소 중에서 선택된 어느 하나 이상일 수 있다. 하기 표 55는 각 출원번호에 1개씩만 대응되는 서지사항 중 출원일과 등록일이 추가된 데이터를 보여준다.
[표 55]
child 등록일 child출원일 child출원번호 parent 출원번호 parent출원일 parent 등록일
November 27, 2007 March 12, 2001 09/802,847 08/451,470 May 26, 1995 October 21, 1997
November 27, 2007 March 12, 2001 09/802,847 08/816,207 March 12, 1997 September 8, 1998
November 27, 2007 March 12, 2001 09/802,847 09/055,929 April 7, 1998 March 28, 2000
November 27, 2007 March 12, 2001 09/802,847 08/969,965 November 25, 1997 October 10, 2000
November 27, 2007 March 12, 2001 09/802,847 09/113,748 July 10, 1998 November 13, 2001
November 27, 2007 March 12, 2001 09/802,847 09/152,003 September 11, 1998 August 26, 2003
November 27, 2007 March 12, 2001 09/802,847 09/309,895 May 11, 1999 October 7, 2003
November 27, 2007 March 12, 2001 09/802,847 09/124,474 July 29, 1998 November 25, 2003
November 27, 2007 March 12, 2001 09/802,847 09/236,462 January 25, 1999 November 25, 2003
November 27, 2007 March 12, 2001 09/802,847 09/138,782 August 24, 1998 February 24, 2004
November 27, 2007 March 12, 2001 09/802,847 09/736393 December 15, 2000
상기 표 55와 같은 데이터에 각 출원번호별로의 카운트 정보(청구항 수, 도면수, 패밀리 수, 발명자 수, 출원인 수 등 각종 카운팅 정보가 추가적으로 각 카운트 필드별로 추가될 수도 있을 것이다.) 각 출원번호별로 1개씩만 대응되는 사항에 대해서는 1개의 테이블로 생성하는 것이 바람직할 것이다.
이어, 각 출원번호에 2개 이상의 데이터가 대응될 수 있는 필드값으로 상기와 같은 데이터를 생성할 수도 있다. 이들은 출원인, 발명자, 대리인, 특허 분류 기호 등이 될 수 있다. 특허 분류 기호에 대해서는 뒤에서 상술한다. 각 출원번호에 2개 이상의 데이터가 대응될 경우, 1개의 테이블에 모든 필요로 하는 필드값을 다 넣을 수도 있지만, 이렇게 되면 테이블의 크기가 크지는 문제점을 감수해야 한다. 예를 들어 하기 표 56에 있는 09/309,895호는 출원인이 AT'T Corp. (New York, NY)와 Sun Micro Systems (Palo Alto, CA)인데, 이 경우에는 이 출원번호와 관련되는 아래 표 56과 같은 라인에 출원인 필드가 추가될 때, 하기 표 57과 같이 처리되어야 한다.
[표 56]
child 등록일 child출원일 child출원번호 parent 출원번호 parent출원일 parent 등록일
November 27, 2007 March 12, 2001 09/802,847 09/309,895 May 11, 1999 October 7, 2003
[표 57]
child 등록일 child출원일 child출원번호 parent 출원번호 parent출원일 parent 등록일 출원인
November 27, 2007 March 12, 2001 09/802,847 09/309,895 May 11, 1999 October 7, 2003 AT'T Corp
November 27, 2007 March 12, 2001 09/802,847 09/309,895 May 11, 1999 October 7, 2003 Sun Micro Systems
이처럼, 출원인이 2명이 있다면 행의 개수가 2배 늘어나게 된다. 한편, 상기 출원에 대하여 발명자가 6명이 있다면, 출원인과 발명자를 1개의 테이블에 보여줄 경우에는 12개의 행이 필요하게 된다.(2*6 = 12) 이때, (출원인, 발명자)쌍과 관련된 데이터를 제외한 모든 데이터에서 중복이 일어나게 되는 문제가 있다.(물론, 중복이 있을 경우, 분석 결과(예를 들면 연도별 출원인, 연도별 특정 출원인의 발명자 등)을 가져올 때는 테이블 조인이 없기 때문에 효율적이나, 테이블의 크기가 크지는 문제가 있다.)
참고로, 시간/날짜(date)를 기준으로 한 정보 처리는 롤업을 고려할 때는 다음가 같이 처리되는 것이 바람직하다. 예를 들어 March 12, 2001가 있는 경우, 2001년 3월 12일, 2001년 3월, 2001년 1분기, 2001년과 같이 세분화하여 처리하는 것이 롤업 연산 등에서 바람직하다. 하지만, 본 명세서에서는 표기(한정된 폭의 화면에 수많은 각종 필드를 모두 표현하는) 문제로 이를 생략하나, 이러한 것은 당업자에게 는 자명할 것이다.
한편, 특허 분류 기호와 관련하여, 하위 분류 기호 포함의 관점에서 상기 데이터의 처리를 설명한다. 먼저, 하기 표 58과 같이 child에 해당하는 09/802,847에 대한 데이터처리를 설명하며, 이는 parent에 속하는 문건에 대해서도 동일하게 적용된다. 09/802,847에는 IPC로 G06F 15/16과, H04N 7/16 이 있으며, USPC로 709/203 ; 709/217; 709/231; 725/135이 있다.
[표 58]
출원월2001년 3월 출원년2001 n dot subgroup(C(n+4)) 1 dot subgroup(C5) IPC group(C4) IPC subclass(C3) IPC Class(C2) IPC Section(C1) child출원번호
1 1 G06F 15/16 G06F 15/00 G06F G06 G 09/802,847
1 1 H04N7/16 H04N 7/00 H04N H04 H 09/802,847
상기 표 58에서 C3는 IPC subclass 레벨을 말하며, 다른 것들도 이와 같은 체계임은 상기에서 설명하였다. 2001년 필드의 1은 2001년에 1건이 있다는 말이며, 2001년 3월에도 1이 있는 것은 월단위에서도 그 월에 1건이 있다는 것이며, 상기와 같은 것은 롤업을 고려한 데이터 구조에서는 통상적인 표기 방법이다. 상기의 G06F 15/16 및 H04N 7/16 모두는 1dot subgroup에 속하는 것이었지만, 만약 09/802,847 문건에, H04N 7/169이 포함되어 있다면, 상기 표 58은 다음 표 59와 같이 되었을 것이다.(본 발명 사상의 설명을 위해서 임의로 도입한 내용임)
[표 59]
출원월2001년 3월 출원년2001 3 dot(C7) 2 dot(C6) 1 dot subgroup(C5) IPC group(C4) IPC subclass(C3) IPC Class(C2) IPC Section(C1) child출원번호
1 1 09/802,847
1 1 H04N7/169 H04N7/167 H04N7/16 H04N 7/00 H04N H04 H 09/802,847
USPC를 하위 분류 기호 포함의 관점에서 상기 데이터를 처리하면 하기 표 60과 같을 수 있다.
[표 60]
출원월2001년 3월 출원년2001 USPC n dot level (C(n+4)) USPC 1 dot level (C5) USPC no dot level (C4) USPC class(C3) Meta class (C2) Meta super class (C1) child출원번호
1 1 709/203 709/201 709 09/802,847
1 1 709/217 709 09/802,847
1 1 709/231 709/230 709 09/802,847
1 1 725/135 725 09/802,847
USPC 709/203(타이틀 정보 : Client / server )는 직상위인 709/201(타이틀 정보 : DISTRIBUTED DATA PROCESSING)에 있고, 이는 Class 709에 속한다. 다른 것들도 마 찬가지이다. 상기의 USPC 등은 모두는 1dot 또는 no dot 레벨에 속하는 것이었지만, 만약 09/802,847 문건에, 725/45가 포함되어 있다면, 상기 표 60은 다음 표 61과 같이 되었을 것이다.(본 발명 사상의 설명을 위해서 임의로 도입한 내용임)
[표 61]
출원월2001년 3월 출원년2001 4 dot(C8) 3 dot(C7) 2 dot(C6) USPC 1 dot level (C5) USPC no dot level (C4) USPC class(C3) Meta class (C2) Meta super class(C1) child출원번호
1 1
1 1 725/45 725/44 725/39 725/38 725/37 725 09/802,847
IPC가 H04L 12/56, H04L 12/28, USPC가 370/395, 370/235가 할당되어 있다.(상기 IPC는 대한민국 특허청에서 부여한 것과 다를 수 있으나, 각 국가 단위로 데이터를 처리하므로, 미국 데이터의 처리는 미국 특허청에서 부여된 IPC로 처리하는 것이 바람직하다.)
이때, 특허 분류 기호마다 1개의 라인(row)가 만들어지므로, IPC와 USPC는 1개의 테이블에 생성할 수도 있으나, 그렇지 않는 것이 바람직하다. 이는 특히, 복수개의 출원인, 복수개의 발명자 등과 같이 복수개가 있는 경우에는 더욱 더 그러하지만, 본질적으로 1개의 child에 여러 개의 parent가 있기 때문이다. 즉, 1개의 child에 k개의 parent가 있고, 1개 child에 IPC가 m개, USPC가 n개가 있고, 각각의 k개의 parent 문건마다에 각각 IPC와 USPC가 있을 것이므로, 이를 1개의 테이블에 모두 모아 놓는다면, 엄청나게 많은 라인이 필요할 것이며, 이때, 다수의 데이터가 중복 되게 될 것이다. 이는 특히 문건 집합의 크기가 클 경우(예를 들어 미국 등록 특허 전체 집합 등)일 경우, 더욱 더 그러하다. 그러므로, IPC와 USPC를 분리하는 것이 바람직하다. 특허 분류 기호와 관련해서, 테이블 유형은 1) 인용 child-parent 데이터에 child쪽 특허 분류 기호에 대해서만 처리해 놓은 유형, 2) 인용 child-parent 데이터에 parent쪽 특허 분류 기호에 대해서만 처리해 놓은 유형 및 3) 인용 child-parent 데이터에 child쪽과 parent쪽 모두에 대해 특허 분류 기호에 대해서만 처리해 놓은 유형이 있을 수 있다. 3)의 경우에는 라인(row)의 수가 증가하는 문제점이 있으나, 테이블 조인의 가능성은 줄어드는 장점이 있다.
즉, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진/기설정된 문건 집합에 속하는 개별 문건별로 유닛 인용 parent-child 데이터를 생성하고, 상기 개개의 유닛 인용 parent-child 데이터에 대하여, child 및/또는 parent에 속하는 개별 문건의 서지사항 중 적어도 하나 이상을 입수하여 그 입수된 서지사항을 필드 내용으로 하는 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓을 수 있다.
상기 주어진/기설정된 문건 집합의 예로 1) 특정 국가의 출원 문건 또는 등록 문건 전체 집합, 2) 특정 IPC/USPC 중 어느 하나 이상으로 된 문건 집합, 3) 특정 출원인별 문건 집합, 4) 특정한 검색식 등으로 생성될 수 있는 검색 기반 생성 문건 집합, 5) 국가 통합 모든 출원 문건 또는 모든 등록 문건 전체 집합 등을 들 수 있다.
이때 상기 1) 하나의 국가 단위에서의 문건 전체 집합에 대하여 하기 표62와 같은 데이터가 생성되어 있으면 다음과 같은 효용이 있을 수 있다. 상기 데이터를 이루는 각 출원번호/등록번호에는 서지 사항이 대등되며, 그 서지 사항 중 어느 하나 이상이 상기 설명과 같이 결합되어 생성될 수 있음은 물론이다 하겠다.
[표 62]
child(출원번호) parent(출원번호)
09/802,847 08/451,470
09/802,847 08/816,207
09/802,847 09/055,929
09/802,847 08/969,965
09/802,847 09/113,748
09/802,847 09/152,003
09/802,847 09/309,895
09/802,847 09/124,474
09/802,847 09/236,462
09/802,847 09/138,782
09/802,847 09/736393
상기와 같은 데이터를 생성하는 방법은 모든 출원/등록 문건을 child 칼럼에 넣고, 각각의 문건마다 그 문건 인용하고 있는 parent문건 번호를 parent에 넣는 방법이다. parent값이 없는 경우에는 null값을 넣으며, 이 경우에는 child 칼럼에만 데이터가 있고, 그 child 문건에 대응되는 parent 문건이 없게 된다. 이 경우, child 칼럼에는 모든 문건 번호가 다 들어가 있게 된다.
설명의 편의를 위하여 가장 간단한 모델을 도입하자. 문건1, 문건 2, 문건 3, 문건 4가 모두 1개씩의 인용 정보를 포함하고 있고, 인용의 순서가 문건1 -> 문건2 -> 문건3 -> 문건 4라고 가정하고(문건 2는 문건 1을 인용하고, 문건 3은 문건 2를 인용하고 있고, 문건 4는 문건 3을 인용하고 있음을 의미함). 이때, 문건 2를 기준으로 하면(문건 2가 child 칼럼에 있음), 문건 1이 문건 2의 parent 칼럼에 존재하게 되며, 문건 3을 기준으로 하면(문건 3이 child 칼럼에 있음), 문건 2가 parent 칼 럼에 존재하게 되며, 문건 4를 기준으로 하면 문건 3이 parent 칼럼에 있게 된다. 즉, 문건 1~4가 모두 child 칼럼에 있으며, parent 칼럼에는 적어도 문건 1~3이 있게 된다. 인용의 깊이(문건 4를 기준으로 할 때, 문건 1은 인용 깊이 3, 문건 2는 인용 깊이 2, 문건 3은 인용 깊이 1이 된다.)를 고려할 때, 문건 3과 관련된 전방 인용(backward citation, 문건 3에 포함된 인용 정보로 생성되는 문건 집합)에서 인용 깊이 2까지는 문건 2 및 문건 1이 되며, 후방 인용(forward citation) 깊이 1에는 문건 4가 있게 된다. 이 경우, 문건 1~4가 모두 child에 있기 때문에 어느 문건을 기준으로도 인용 깊이 1의 인용 문건을 parent 칼럼에서 파악할 수 있고, 파악된 인용 문건 번호를 다시 child에서 찾고, 그 찾은 child의 parent를 찾으면, 인용 깊이 2의 인용 문건을 찾을 수 있게 된다. 이러한 모델을 표 63로 설명하면 다음과 같다.
[표 63]
child(출원번호) parent(출원번호)
2 1
3 2
4 3
상기에서는 문건 1개로 설명하였지만, 이러한 것은 문건 집합에 대해서도 마찬가지임은 자명하다 할 것이다. 이 역시 하기 표 64와 같이 모델로 설명한다. 문건집합3을 기준으로 설명한다.(하기 표 64에서 각 셀(라인 내의 내용)은 실제 다차원 분석용 연산 수행 결과 테이블의 셀 데이터가 아니라 개념상의 여러 라인의 셀 데이터가 하나의 집합을 이룬다는 의미로 해석되어야 하며, 본 발명 사상의 설명의 편의 를 위한 것이다.)
[표 64]
child(출원번호) parent(출원번호)
문건집합2 문건집합 1(문건집합 2의 모든 parent로 생성되는 집합)
문건집합 3(특정 속성3을 공유함) 문건집합 2(문건집합 3의 모든 parent로 생성되는 집합)
문건집합 4(문건집합 3의 모든 child로 생성되는 집합) 문건집합 3(문건집합 4의 모든 parent로 생성되는 집합)
상기 표 64에서 문건집합 1~4는 모두 child 칼럼의 전체집합의 부분집합이 되게 되며, 문건집합 1~3은 모두 parent 칼럼의 전체집합의 부분집합이 된다. 부분집합이 된다는 말은 그 집합에 속하는 모든 문건이 전체집합에 소속되기 때문에, 전체집합에서 확인가능하며 추출 가능하다는 것이다. 문건 집합이 가지는 속성은 임의의 속성일 수 있으나, 1)출원인 명의, 2) 발명자 명의, 3) 각 단계별 IPC 또는 USPC, 4) 국가, 5) 대리인, 6) 기간 범위(출원일/등록일 범위), 7) 문건의 상태(출원중, 등록, 거절 등) 또는 8) 이들 중 적어도 어느 하나 이상의 조합이 일치하는 것 등이 될 수 있다.
예를 들면, 출원인 Samsung Electronics의 IPC H01L에 속하며, 미국에서 등록된 모든 등록 문건을 문건 집합을 문건 집합 3이라 가정하면, 상기 문건 집합3에 관련된 전방 인용 깊이 1의 모든 인용 문건들로 이루어진 문건 집합2를 추출할 수 있을 것이다. 한편, 상기 문건 집합3에 관련된 후방 인용 깊이 1의 모든 피인용 문건들로 이루어진 문건집합 4 및, 상기 문건 집합3에 관련된 전방 인용 깊이 2의 문건집합1을 입수할 수 있게 된다. 이때, 상기 문건 집합 1, 문건 집합 2 및 문건 집합 4를 분석할 수 있게 된다. 상기 분석의 대상으로는 1)전방/후방 인용 총량, 2) 전방/후방 다인용 출원인, 3) 전방/후방 다인용 발명자, 4) 전방/후방 다인용 IPC/USPC(각 특허 분류 기호 체계 상의 각 단계별, 드릴 다운은 이미 설명한 바와 같다.), 5)전방/후방 다인용 개별 문건을 찾을 수 있을 것이다. 한편, 상기 1)의 경우, 총량을 연도별/기설정된 기간별로 나누어 표시할 수 있을 것이며, 각종 숫자를 기초로 하여 증감율, 증감속도를 알 수도 있을 것이다. 상기 2)의 경우 다인용 출원인별로 전방/후방 인용량을 총량 및/또는 연도별/기설정된 기간별로 나누어 표시할 수 있을 것이며, 이는 3)~5)에서도 마찬가지일 것이다. 상기 문건 집합 3을 기준으로 분석 대상으로 상리 2) 중 후방 인용 다출원인을 선택하면, 상기 Samsung Electronics의 IPC H01L에 속는 미국 등록 문건을 인용하고 있는 후출원 출원인에 관한 정보를 알 수 있을 것이다. 이러한 후출원 출원인 집합에는 Samsung Electronics가 포함되어 있을 수 있으며, 이는 자기 인용(self citation)이 되며, 상기 자기 인용의 수치값을 다른 수치값으로 나누거나 기설정된 처리하면 자기 인용에 대한 여러가지 분석도 가능할 것이다. 또한, 후출원 출원인을 랭킹별로 보게 되면, 어느 출원인이 상기 Samsung Electronics의 IPC H01L에 속하는 문건을 많이 인용하고 있는지를 알 수 있게 된다. 물론, 상기 분석 결과(후방 인용수)에는 관련된 문건을 입수할 수 있는 링크가 걸려 있으며, 사용자가 그 링크를 클릭하면 관련된 문건(후방 인용 문건)을 특허 문건 마스트 DB(202)에서 입수하여 사용자에게 제공해 줄 수 있을 것이다.
한편, 하나의 문건 집합이 주어졌을 때(예를 들어 문건 집합3) 상기 문건 집합3의 parent인 문건 집합 2를 찾고, 상기 문건 집합 2에서 기설정된 조건(예를 들면, 최근 10년 내에 출원된 문건 등의 기간 조건 적용)을 만족하는 문건 집합 2'''를 생성하고, 상기 문건 집합2'''를 분석 대상 문건 집합으로 하여 기설정된 상기 적어도 하나 이상의 분석을 수행하고, 그 분석 결과를 생성할 수 있음은 당연하다 할 것이다.
인용 분석 대상 문건 집합의 4종류 구성
4가지 종류
한편, 인용 분석과 관련할 때, 4가지 종류의 분석 대상 문건 집합이 가능할 것이다. 하나의 기준 문건 집합이 주어질 때, 인용과 관련하여 다음 4가지 인용 분석 대상 문건 집합이 확정된다.
도 38는 기준 문건 집합에 대하여 인용 분석과 관련하여 4가지 종류의 분석의 대상이 되는 문건 집합이 생길 수 있음을 보여 주고 있다. 도 38에는 "자사가 인용한 타사 특허(자->타)", "자사를 인용한 타사 특허(타->자)", 타사가 인용한 자사특허(타->자)", "타사를 인용한 자사특허(자->타)"가 나와 있는데, 이들 각각은 하기 첫째 내지 넷째에 순차적으로 대응된다.
첫째, 상기 기준 문건 집합에 포함된 개별 기준 문건이 인용하고 있는 전체 전방(backward) 인용 문건 집합이다. 상기 전체 전방 인용 문건 집합은 기준 문건 각각에 포함되어 있는 인용 정보(reference cited)에 대응되는 모든 문건의 합집합으로 확정될 수 있을 것이다.(이때, 상기 합집합은 중복을 제거한 합집합일 수도 있지만, 중복을 허용하고 있는 합집합일 수도 있다. 예를 들면, #1번 문건과 #2번 문 건이 a문건을 인용 정보로 포함하고 있을 때, a는 카운팅의 입장에서는 2번 인용된 중요 문건일 수 있으므로, 중복을 허용하는 것이 바람직하다.(다차원 분석용 연산 수행 결과 테이블에서 parent에 동일 레코드가 중복되어 존재한다. 즉, parent a에 관계된 레코드가 #1, #2에 기인한 2개 존재함). 한편, 단순히 a의 존재(출원인, 날짜, 기타 서지 사항)의 입장에서는 중복을 제거하는(합집합 연산을 수행하여) 것이 바람직할 것이다. 본 발명의 분석에서는 카운팅이 중심이 되므로, 중복을 허용하는 것이 더 타당하다.)
둘째, 상기 기준 문건 집합에 포함된 개별 기준 문건을 인용하고 있는 전체 후방(forward) 인용 문건 집합이다. 상기 전체 후방 인용 문건 집합을 구하는 방법은 1) 개별 기준 문건을 인용하고 있는 문건 번호를 검색하고, 이를 합하는 방법 또는 2) 상기 전체 특허 문건에 대하여 생성한 child-parent 테이블에서 기준 문건 번호를 parent 칼럼에서 찾고, parent 칼럼에 있는 기준 문건 번호에 대응되는 child 문건 번호(2개 이상 있을 수 있음)를 child 칼럼에서 찾아서 이들을 합하는 방법이 있다. 2)의 방법이 더욱 바람직하다.
셋째, 전체 후방 인용 관련 기준 문건 집합이다. 이 문건 집합은 기준 문건 집합을 구성하는 모든 기준 문건 중에서 타 문건에 의해 인용을 당한 적이 있는 모든 기준 문건으로 구성되는 문건 집합이다. 이 문건 집합은 상기 둘째 문건 집합의 parent로 구성되는 문건 집합이다.
넷째, 전체 전방 인용 관련 기준 문건 집합이다. 이 문건 집합은 기준 문건 집합을 구성하는 모든 기준 문건 중에서 인용 정보를 포함하고 있는 기준 문건으로 구성되 는 문건 집합이다. 이 문건 집합은 상기 첫째 문건 집합의 child로 구성되는 문건 집합이다.
기준 문건 집합의 확정
상기 기준 문건 집합은 임의의 조건으로 확정되는 기준 문건 집합일 수 있으나, 대표적으로 확정될 수 있는 기준 문건 집합은 다음과 같은 것들이 있다. 1) 출원인 단위, 2) 출원인의 개별 발명자 단위, 3) 출원인의 문건에 포함되어 있는 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위, 4) 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위, 5) 국가별 출원인 단위, 6) 국가별 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위, 6) 국가별 발명자 단위, 7) 개별 발명자 단위, 8) 특정 기간 단위, 9) 특정 키워드를 공통적으로 포함하고 있는 문건 집합 단위, 10) 사용자의 조건을 입수 받아 생성되는 문건 집합 단위, 11) 상기 1)~7) 중에서 특정 조건(예를 들면 최근 5년간 출원 문건, 등록된 문건 등)이 부가적으로 더 결합되어 생성되는 문건 집합 단위 등이 될 수 있다. 이때, 개별 1건의 문건 단위는 기존에도 있었으므로, 본 발명 사상의 독자적인 내용은 될 수 없음은 분명하다.
상기 도 39의 최상단 탭에는 1) "특허 문건 전체 집합에 대한 인용분석", 2) "기술영역별 인용 정밀분석", 3) "발명자별 인용 분석" 및 4) "다인용 개별 문건별 인용 분석"이 있는데, 이들은 모두 기준 문건 집합의 확정과 관련있다. 상기 1)"특허 문 건 전체 집합에 대한 인용분석"은 출원인 또는 본 발명의 문건 집합의 확정과 관계된 모든 문건 확정 방법 중에서 선택되는 어느 하나에 의해 확정된 기준 문건 집합으로서의 특허 문건 전체 집합을 의미한다. 상기 2) "기술영역별 인용 정밀분석"은 상기 특허 문건 전체 집합을 특허 분류 기호(IPC, USPC 등)의 레벨별 특허 분류 기호 기준 랭킹별로 정리된 특허 분류 기호별로 세분화된 문건 집합을 상기 기준 문건 집합으로 한다는 것을 의미한다. 상기, 3) "발명자별 인용 분석"은 상기 특허 문건 전체 집합에서 발명자를 추출한 다음, 랭킹을 계산하고, 랭킹이 높은 발명자별로 세분화된 문건 집합을 상기 기준 문건 집합으로 한다는 것을 의미한다. 상기 4) "다인용 개별 문건별 인용 분석"은 상기 특허 문건 전체 집합에 포함된 모든 문건에 대하여 인용/피인용 개수를 조사한 다음, 인용/피인용 랭킹이 높은 문건을 추출하고, 개개의 문건을 기준 문건 집합으로 한다는 것을 의미한다.
다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 기준 문건 집합이 확정되면, 상기 기준 문건 집합에 대응하여 상기 인용 분석 대상 문건 집합으로서의 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합, 3) 전체 전방 인용 관련 기준 문건 집합, 및/또는 4) 전체 후방 인용 관련 기준 문건 집합을 확정하고, 상기 1)~4) 중 어느 하나 이상의 문건 집합에 대하여 본 명세서에서 기술하고 있는 다차원 분석용 연산 수행 결과 테이블을 생성하고, 이를 저장한다.
인용 분석의 결과
본 발명의 상기 분석 모듈은 상기 확정된 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합, 3) 전체 전방 인용 관련 기준 문건 집합, 및/또는 4) 전체 후방 인용 관련 기준 문건 집합별을 대상으로 한 상기 분석 주제별로의 다차원 분석용 연산 수행 결과 테이블에 대하여 기설정된 분석식으로 분석 결과를 입수한다. 한편, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블이 아닌 상기 1)~4) 중 어느 하나 이상의 문건 집합에 대한 에서 본 발명의 명세서에서 기술하고 있는 각종 분석을 수행할 수도 있지만, 이 경우에는 다차원 연산 결과를 얻을 수 없거나, 이러한 다차원 연산 결과를 얻기 위해 전산 자원을 많이 소모해야 하는 문제점이 있어 크게 바람직하지는 않다.
상기 분석 모듈은 상기 1) ~4)의 문건 집합별로 생성되는 상기 다차원 분석용 연산 수행 결과 테이블에 접근하여 기설정된 분석식으로 목적하는 인용 분석 결과를 추출해 낸다. 상기 목적하는 인용 분석 결과에는 다음과 같은 것들 있을 수 있다.
첫째, 출원인을 중심으로 한 것으로 i) 출원인 랭킹, ii) 출원인별의 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위의 랭킹, iii) 다발명자 랭킹, iv) 문건 출현 빈도 기준 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다. 즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있 을 것이다.
둘째, 특허 분류 기호를 중심으로 한 것으로 i) 적어도 하나 이상의 특허 분류 기호 체계에서의 적어도 하나 이상의 레벨별 특허 분류 기호 단위의 랭킹, ii) 레벨별 특허 분류 기호에 속하는 출원인, iii) 레벨별 특허 분류 기호에 속하는 발명자 들의 랭킹, iv) 레벨별 특허 분류 기호에 속하는 문의 문건 출현 빈도 기준 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다.
즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있을 것이다.
셋째, 출원인 속성(출원인의 종류(기업, 대학, 개인 등), 기업일 경우 재무 속성, 기업 평가 지표 등)을 기준으로 한 것으로, i) 출원인의 종류, ii) 매출액 등과 같은 기업 규모 평가 지표별, iii) 연평균 이익율 등과 같은 기업 재무 평가 요소별 랭킹 및/또는 이들 각각에 대하여 시간 차원 또는 다른 차원으로 롤업 연산한 수치값 데이터 및/또는 이들 각각에 대응되는 문건 번호에 관한 정보를 추출할 수 있다. 즉, 상기 1) ~4)의 인용 분석 대상 문건 집합에 대하여 서지 사항에 포함된 각종 필드별로의 랭킹값 및/또는 이들의 시간 또는 다른 차원으로 롤업 연산한 값 및/또는 각종 값에 해당하는 구체적인 개별 문건 자체를 입수하기 위한 문건 번호에 대한 정보를 생성할 수 있을 것이다.
넷째, 상기 첫째 내지 셋째에서 수치값 데이터가 있을 때 이들의 증감율, 증감 속도 등의 변화값에 대한 데이터들이다.
상기 인용 분석을 위하여 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 (출원인 인용 기준) 인용 분석용 다차원 분석용 연산 수행 결과 테이블은 주로 출원인이 자신의 문건에서 인용한 특허 문건을 대상으로 생성되었다. 한편, 상기 심사관 인용 문건에 대해서도 동일한 다차원 분석용 연산 수행 결과 테이블을 생성해 놓을 수 있음은 자명할 것이다. 즉, 심사관이 심사 과정에서 특정 출원 문건(child 문건이 된다)에 대하여 심사 과정에서 인용한 문건을 상기 출원 문건의 parent 문건으로 보게 되면, 상기 본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)의 모든 작용과 그 결과물로서의 (심사관 인용 기준) 인용 분석용 다차원 분석용 연산 수행 결과 테이블 및 상기 결과물을 이용하는 방법은 상기에서 출원인 인용 문건 기준으로 한 것과 완전히 동등하게 된다. 한편, 통합적인 인용 분석을 위하여, 하나의 출원 문건을 기준으로 출원인 인용 문건(parent)과 심사관 인용 문건(parent 2)을 합집합 연산하여 통합 인용 문건집합(parent-combined)을 생성할 수 있게 되고, 상기 통합된 인용 문건 집합을 대상으로 상기에서 출원인 인용 문건을 기준으로 한 것과 동일한 처리를 수행하면, 동등한 결과물을 얻게 되고, 상기 동등한 결과물을 이용하는 방법도 동등하게 된다. 본 문단에서 설명한 것은 출원인 인용 문건 기준으로 설명한 바를 참고하면, 당업자에게 자명하므로, 별도로 장황하게 중복하여 설명하지는 않는다.
이어 도면을 참조하면서 더욱 상세하게 설명한다.
도 38은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 도 38에서는 총량탭이 선택되어 있음을 보여준다. 본 명세서에 첨부된 도면 중 분석 화면에 대한 구현예적 실시예에서 각종 탭들이 나오는데, 상기 탭의 글씨가 굻게 되어 있는 것은 선택된 탭이라는 것을 의미한다. 상기 탭의 종류는 기본적으로 1) 출원 문건 기준이냐 등록 문건 기준이냐와 같은 문건 집합의 확정 시의 문건 집합의 속성에 관한 기준, 2) 출원/등록 총량 기준, 점유율 기준, 집중율 기준, 활동율 기준 또는 기타 분석 지표별 기준, 3) 대한민국, 미국, 일본, 유럽 등과 같은 국가 확정과 관계된 기준, 총량, 출원인, 발명자, 기술, 개별 문건 등과 같은 분석의 목적이나 주체에 관한 기준, 5) 각종 수치값, 수치값의 증감율, 수치값의 증감 속도에 대한 기준, 6) IPC, USPC, FT, FI, ECLA 등과 같은 특허 분류 기호의 선택과 각 선택된 특허 분류 기호의 레벨에 관한 기준 등이 있을 수 있다.
도 39는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 40은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 이때, 상기 IPC들은 드릴 다운될 수 있음은 물론이며, 이때에도 드릴 다운과 관계된 하위 특허 분류 기호에 대한 인용 분석 결과가 추출되어 사용자에게 제공된다. 도 41은 그러한 것을 보여 준다.
도 41은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 드릴 다운했을 때를 반영한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 42는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 43은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 44는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 45는 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, IPC 메인 그룹 별 최다 인용 기술에 대한 분석 중에서 IPC에 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.
도 46은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, USPC 서브 클래스(no dot, 클래스 직하위) 최다 인용 기술에 대한 분석 중에서 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.
도 47은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 총량 기준 분석 결과 및 이 분석 결과에 대한 본 발명의 리포팅 모듈(406) 중 차트 생성 모듈(406-2)이 생성한 차트의 일 실시예적 도면이다. 본 발명의 리포팅 모듈(406)은 표를 생성 하는 표 생성 모듈(406-1), 차트를 생성하는 차트 생성 모듈(406-2), 그래프를 생성하는 그래프 생성 모듈(406-3), 리포트를 생성하는 리포트 생성 모듈(406-4) 중 어느 하나 이상으로 구성된다.
도 48은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 인용을 많이 받은 발명자의 연도별 인용 총량에 관한 분석 결과 및, 분석 결과에 보이는 특정한 숫자를 클릭했을 때, 그 숫자에 해당하는 문건 집합에 대하여 간이한 분석 결과(문건 목록, 최다 출원인의 연도별 출원수/등록수, 최다 발명자의 연도별 출원수/등록수, 최대 기술 분야별(IPC, USPC, FT) 연도별 출원수/등록수(드릴다운 포함))를 제공해 주는 간이 분석 모듈(407)이 생성한 문건 목록에 대한 일실시예적 도면이다.
도 49는 본 발명의 간이 분석 모듈(407)에서도 최대 기술 분야별(IPC, USPC, FT)로 드릴 다운 기능을 제공함으로 보여주는 일실시예적 도면이다.
도 50은 본 발명의 특허 정보 시스템(1)이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 출원 문건 중 다출원 IPC 서브클래스 단위의 문건을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
특허 기술 분류별 기술 분석용 다차원 분석용 연산 수행 결과 테이블
이어서, 특허 기술 분류 활용 기술 분석에 대해서 설명한다. 특허 기술 분류 활용 기술 분석이란, 본 발명의 문건 집합 중에서 특허 분류 기호를 통해서 확정되는 문건 집합에 대한 분석을 의미한다. 특허 분류 기호별로 생성되는 특허 기술 분류 활용 기술 분석용 문건 집합의 종류는 1) 특정 특허 분류 기호의 종류(IPC, USPC, FT, ECLA 등)에서 선택되는 적어도 하나 이상의 특허 분류 기호를 포함하는 문건으로 생성되는 문건 집합(2 이상의 특허 분류 기호가 개입되는 경우 이들간의 (OR 연산, AND 연산, NOT 연산 등 각종 연산을 포함한다.), 2) 2 종류 이상의 특허 분류 기호를 포함하여 생성되는 문건 집합(IPC AND USPC 등)이 있다. 이들 모두는 1) 개별 국가 단위, 2) 국가 통합 단위일 수 있으며, 국가 단위로 중복은 제거(합집합 연산의 결과)되어야 하며, 3) 메인 특허 분류 기호만을 대상으로 할 것인지, 모든 특허 분류 기호를 포함하여 처리할 것인지는 기설정된 정책 또는 사용자의 선택에 따라 다를 것이며, 이들은 모두 문건 집합의 확정과 관련되어 있다.
특허 기술 분류 활용 기술 분석(이하, 기술 분석이라 한다.)에서 인출할 수 있는 정보는 상기 특허 기술 분류 활용 기술 분석용 문건 집합(이하, 기술 분석용 문건 집합)을 대상으로, 상기 문건 집합에 대한 1) 점유율, 2) 집중율, 3) 활동율 및 4) 기타 특허 분석 지표에 대한 정보이다. 이때, 상기 1) ~4)를 위한 데이터 처리에서 주어진 특허 분류 기호의 하위 특허 분류 기호에 대응되는 문건들을 분석 대상 문건 집합에 포함함은 당연할 것이다.
특허 기술 분류 활용 기술 분석 중 먼저 총량 분석부터 설명한다. 총량 분석은 특허 기술 분류 기호의 레벨별 기간별/연도별 출원수/등록수 등과 같은 양적인 관점에서의 분석 결과를 제공하기 위한 것이며, 특정 특허 분류 기호의 하위 특허 분류 기호가 포함된 문건까지 롤업 연산되어 그 다차원 연산된 결과가 저장된다.(특정 특허 분류가 포함되어 있는 특허 문건의 수 및 그 하위 특허 분류가 포함된 특허 문건의 수가 총합되어(중복이 제거됨은 당연할 것이다.) 계산된 수치이다.) 하기 표 67는 USPC에 대한 출원 총량의 연도별 분포에 관한 다차원 분석용 연산 수행 결과 테이블의 일 실시예적 구현 형태이다. 상기 USPC 002048000은 2/48, 002049100은 2/49.1과 같다. 이는 USPC의 표기법의 문제이다.(앞의 세자리는 class number, 뒤의 6자리를 1000으로 나누었을 때 나온 숫자를 "/" 좌우에 배치하면 통상 공보에 표기되는 USPC가 된다.)
[표 67]
ano dot 1 dot 2dot 3 dot 4 dot 01 02 03 04 05 06
002048000 002049100 002049200 4 1 6 3 1 8
002048000 002049100 002049200 4 1 6 3 1 8
002048000 002049100 002049200 4 1 6 3 1 8
002048000 002049100 002049200 4 1 6 3 1 8
002048000 002049100 002049300 0 1 1 0 1 0
002048000 002049100 002049300 0 1 1 0 1 0
002048000 002049100 002049300 0 1 1 0 1 0
002048000 002049100 002049300 0 1 1 0 1 0
002048000 002049100 002049400 002049500 0 1 3 1 1 2
002048000 002049100 002049400 002049500 0 1 3 1 1 2
002048000 002049100 002049400 002049500 0 1 3 1 1 2
002048000 002049100 002049400 1 2 6 0 2 4
002048000 002049100 002049400 1 2 6 0 2 4
상기에서 입수 받은 특정 USPC에서 출원수/등록수를 알고 싶다면, 그 특정 USPC 레벨(class to n dot) 칼럼에서 연도별/기간별로 다차원 연산된 숫자 또는 합계를 획득하면 된다.
한편, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 출원인별 다단계 특허 분류 기호별 분석을 수행하기 위하여 하기 표 68과 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성해 놓을 수 있다.
[표 68]
IAppName C3 C4 C5 C6 C7 C8 05
A C12N C12N 15/09 C12N 15/00 C12N 15/10     2
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   1
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31 C12N 15/33 1
A C12N C12N 15/09 C12N 15/00 C12N 15/11     2
A C12N C12N 15/09 C12N 15/00 C12N 15/10     2
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   1
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31   1
A C12N C12N 15/09 C12N 15/00 C12N 15/11     2
A C12N C12N 15/09 C12N 15/00 C12N 15/10     2
A C12N C12N 15/09 C12N 15/00 C12N 15/11     4
A C12N C12N 15/09 C12N 15/00       6
A C12N   C12N 15/00       6
A C12N           6
B
상기 표 68과 같은 데이터가 있을 때, C12N 15/00를 기준으로 다출원인을 추출하는 경우, C12N 15/00(IPC 서브그룹은 C4 레벨이라 약칭한다.)은 IPC C4 레벨을 기준으로 자기 자신 및 그 하위 특허 분류 기호에 관한 문건 카운트 정보까지 롤업 연산 해 놓은 것은 GID 15이므로, 상기 테이블에서, 조건식에 "GID = 15 and IPC = C12N 15/00 and IPC 레벨 = C4"라고 명령하면, 이 조건에 맞는 출원인별 문건 수(GID 15행에 나온 문건 수)가 나온다.
상기와 같은 총량 카운트 정보가 있을 경우, 점유율, 집중율, 활동율 등과 같은 분석 지표별로 상기 다차원 분석용 연산 수행 결과 테이블과 같은 데이터를 생성해 놓을 수 있음은 전술한 바와 같은나, 일 실시예로 하기와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 제시한다.
하기 표 69는 점유율에 관계된 다차원 분석용 연산 수행 결과 테이블 데이터이다.
[표 69]
IAppName C3 C4 C5 C6 C7 C8 05
A C12N C12N 15/09 C12N 15/00 C12N 15/10     5.88%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   2.41%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31 C12N 15/33 1.32%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     5.56%
A C12N C12N 15/09 C12N 15/00 C12N 15/10     5.88%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   2.41%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31   1.03%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     1.85%
A C12N C12N 15/09 C12N 15/00 C12N 15/10     5.88%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     1.15%
A C12N C12N 15/09 C12N 15/00       0.96%
A C12N   C12N 15/00       0.92%
A C12N           0.47%
B
하기 표 70은 집중율에 관계된 다차원 분석용 연산 수행 결과 테이블 데이터이다.
[표 70]
IAppName C3 C4 C5 C6 C7 C8 05
A C12N C12N 15/09 C12N 15/00 C12N 15/10     18.18%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   9.09%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31 C12N 15/33 9.09%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     18.18%
A C12N C12N 15/09 C12N 15/00 C12N 15/10     18.18%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   9.09%
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31   9.09%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     18.18%
A C12N C12N 15/09 C12N 15/00 C12N 15/10     18.18%
A C12N C12N 15/09 C12N 15/00 C12N 15/11     36.36%
A C12N C12N 15/09 C12N 15/00       54.55%
A C12N   C12N 15/00       54.55%
A C12N           54.55%
B
하기 표 71은 는 활동율 기준 다차원 분석용 연산 수행 결과 테이블 데이터이다.
[표 71]
IAppName C3 C4 C5 C6 C7 C8 05
A C12N C12N 15/09 C12N 15/00 C12N 15/10     909
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   454.5
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31 C12N 15/33 227.25
A C12N C12N 15/09 C12N 15/00 C12N 15/11     909
A C12N C12N 15/09 C12N 15/00 C12N 15/10     909
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/12   454.5
A C12N C12N 15/09 C12N 15/00 C12N 15/11 C12N 15/31   181.8
A C12N C12N 15/09 C12N 15/00 C12N 15/11     303
A C12N C12N 15/09 C12N 15/00 C12N 15/10     909
A C12N C12N 15/09 C12N 15/00 C12N 15/11     213.8824
A C12N C12N 15/09 C12N 15/00       175.9677
A C12N   C12N 15/00       170.4688
A C12N           86.5873
B
상기에서는 출원인을 중심으로 한 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블 데이터 및 이 정보로부터 필요한 정보를 추출하는 방법에 대해서 설명하였다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 출원인에서 상기 데이터를 생성하는 것과 동등한 방식으로 발명자에 대해서도 각 특허 기술 분류 기호 레벨별 총량, 점유율, 집중율, 활동율 등의 정보를 생성해 놓을 수 있다.
융합 분석용 다차원 분석용 연산 수행 결과 테이블
이하, 융합 분석을 위한 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블 데이터에 대해서 설명한다.
본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 본 발명의 융합 분석을 위하여 하기와 같은 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 입력되거나 설정되거나 확정되는 임의의 특허 문건 집합을 입수 받은 다음, 상기 문건 집합에 포함되어 있는 1종류의 특허 분류 기호가 복수개가 결합되어 있을 때(IPC만 있을 때는 IPC가 2개 이상, IPC와 USPC가 있을 때는 IPC가 2개 이상이면 처리하고, 하나만 처리하지 않으며, USPC도 2개 이상일때만 USPC 다차원 분석용 연산 수행 결과 테이블로 처리한다.), 상기 그 종류의 특허 분류 기호에 대하여 하기 표 72와 같은 데이터를 생성한다.
[표 72]
문건 번호 AppName Main C1 Main Cn Sub 1 C1 Sub 1 Cm Sub i C1 Sub i Ck date 기타
1 A
2 B
하나의 특허 문건에는 IPC, USPC, FI, FT, ECLA와 같은 특허 분류 기호의 종류 중 적어도 하나 이상이 포함되며, 상기 특허 분류 기호가 적어도 하나 이상 정보가 포함되어 있다. 상기 표 72와 같은 데이터는 문건 번호를 기준으로 필수적인 Main 특허 분류 기호와 선택적인 Sub 특허 분류 기호가 1개 이상 있을 수 있음을 보여 주고 있다.(상기에서 Main 특허 분류 기호의 종류와 Sub 특허 분류 기호의 종류는 같은 종류이다.) 이때, 상기 문건에 포함된 특허 분류 기호가 문건에 포함되어 있는 자기 자신 특허 분류 기호 및 자신의 모든 상위 특허 분류 기호를 나열하고 있음을 알 수 있다. 자기 자신의 주(main) 특허 분류 기호가 IPC 2 dot 서브클래스에 해당하는 것이라고 가정한다면, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 특허 분류 기호 마스트 DB(203)를 참조하여 주 특허 분류 기호가 C6 레벨임을 확정하고, 상기 주 특허 분류 기호를 C6 레벨에 입력하고, 좌측의 C5 레벨에는 1 dot 레벨의 상기 주 특허 분류 기호의 직상위 특허 분류 기호를 입력하며, C4 레벨에는 메인그룹 레벨의 특허 분류 기호를 입력하고, 이러한 과정을 최상위 레벨까지 일련으로 입력한다. 상기 특허 문건에 포함된 적어도 하나 이상의 서브 IPC에 대해서도 상기 메인 IPC에서와 마찬가지로 처리한다. 이때, 출원인 등과 같은 다른 서지 사항 데이터들은 상기 문건 번호를 통해서 입수할 수 있는 정보이므로, 이러한 것들은 선택적인 요소이다.
대한민국 특허출원 제10-2005-0111868호에는 2006년 01월 자로 H04B 7/26 및 H04B 7/15가 부여되어 있다. 이를 통해서 표 73을 통하여 예시적으로 설명한다.(표기의 편의상 메인그룹 이하에서의 특허 분류 기호에서 서브클래스 부분은 생략한다.
[표 73]
문건 번호 AppName Main C1 C2 C3 C4 C5 C6 Sub C1 C2 C3 C4 C5 C6 기타
10-2005-0111868 삼성전자 H H04 H04B 7/00 7/24 7/26 H H04 H04B 7/00 7/14 7/15
만약 Sub IPC가 2개 이상이면, 하기 표 74와 같이 상기 H04B 7/15관련된 정보의 우측에 병렬적으로 동일한 방식으로 처리한다. 대한민국 특허출원 제10-2006-0012606호에는 2006년 01월 자로 부여된 H04B 7/04, H04B 7/155, H04Q 7/30 특허 분류 기호가 있는데, 이를 통해서 예시적으로 설명한다. (표기의 편의상 AppName 등은 생략하며, H04Q 7/30에 관한 것은 아래 줄에 표기한다.)
[표 74]
문건 번호 Main C1 C2 C3 C4 C5 C6 Sub 1 C1 C2 C3 C4 C5 C6 C7
10-2006-0012606 H H04 H04B 7/00 7/02 7/04 H H04 H04B 7/00 7/14 7/15 7/155
Sub2 C1 C2 C3 C4 C5 C6 C7
H H04 H04Q 7/00 7/20 7/30 ..
하기 표 75는 대한민국 특허 출원 제 10-2005-0042032호는 H04B 7/02 및 H04B 7/14를 특허 분류 기호 정보로 포함하고 있다.
[표 75]
문건 번호 AppName Main C1 C2 C3 C4 C5 C6 Sub C1 C2 C3 C4 C5 C6 기타
10-2005-0042032 에스케이텔레콤 H H04 H04B 7/00 7/02 H H04 H04B 7/00 7/14
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)을 통하여 상기 다차원 분석용 연산 수행 결과 테이블 데이터와 같은 것을 USPC, FT 등에 대해서도 마찬가지로 생성할 수 있음은 당업자에게 자명할 것이다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 레벨별 복수 특허 분류 기호의 일련 정보로부터 하기 표 76에 포함된 것과 같은 복수 특허 분류 기호쌍 정보(pair information)을 생성한다. 상기 복수 특허 분류 기호쌍의 종류는 상기 동종 특허 분류 기호 관계성 전처리 모듈의 설명에서 상술한 바 있다. 하기 표 76에서 출원일 등과 같은 1개만이 나올 수 있는 서지 사항은 옆으로 얼마든지 신설하여 포함시켜 놓을 수 있다.(예를 들면 등록일 등) 하지만, 공동 출원인이나 공동 발명자 등과 같을 경우에는 별도의 행을 신설해야 하는 것은 전술한 바와 같다. 즉, 출원인이나 발명자만 다른 동일한 레코드가 생기며, 이와 같은 정보를 기반으로 출원인별 융합 분석 및 발명자별 융합 분석이 가능해 진다.
본 모델을 설명하기 위하여 특허 문건이 대한민국 특허출원 제10-2005-0111868호, 대한민국 특허출원 제10-2006-0012606호, 및 대한민국 특허 출원 제 10-2005-0042032호 3개만이 있다고 가정하자.(물론, 입수 되는 모든 문건에 대해서 반복적으로 처리하면 모든 문건 집합을 기준으로 한 모든 특허 분류 기호 조합 (Ai, Bj)에 대한 하기와 같은 데이터의 생성이 가능할 것이다.) 이때, 특허 분류 기호 조합 (Ai, Bj)에 다음과 같은 테이블의 생성이 가능할 것이다. 특허 분류 기호 조합은 대한민국 특허출원 제10-2005-0111868호에서 4개 쌍, 대한민국 특허출원 제10- 2006-0012606호에서는 (메인 IPC , 서브 IPC) 쌍에서 22쌍(6+16), (서브 IPC, 서브 IPC) 쌍에서 20쌍 및 대한민국 특허 출원 제 10-2005-0042032호에서는 1쌍이 나오며, 3 특허 출원에서 47개의 쌍이 나온다. 이들 쌍을 모두 표현하는 것도 당연히 가능하나, 설명의 편의상 일정 부분을 생략한 하기 표 76과 같은 테이블로 전체 47개에 대한 설명에 갈음하는 방식으로 본 발명 사상을 설명한다.
[표76]
특허 분류 기호 조합 (Ai, Bj) 문건 번호 출원인 출원일 가중치 정책 1 적용 가중치 정책 2 적용
(H04B 7/15 ,H04B 7/26) 10-2005-0111868 삼성전자 2006.12.04 1 1
(H04B 7/15,H04B 7/24) 10-2005-0111868 삼성전자 2006.12.04 1 1
(H04B 7/14,H04B 7/26) 10-2005-0111868 삼성전자 2006.12.04 1 1
(H04B 7/14,H04B 7/24) 10-2005-0111868 삼성전자 2006.12.04 1 1
(H04B 7/155,H04B 7/04) 10-2006-0012606 삼성전자 2006.12.04 1/3 0.75/2
(H04B 7/155,H04B 7/02) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
(H04B 7/15,H04B 7/04) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
(H04B 7/15,H04B 7/02) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
(H04B 7/14,H04B 7/04) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
(H04B 7/14,H04B 7/02) 10-2005-0042032 에스케이텔레콤 2006.12.04 1 1
(H04Q 7/00, H04B 7/00) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
(H04Q 7/00, H04B) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
(H04Q,H04B) 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
상기 특허 분류 기호의 조합(Ai, Bj) 방식으로 데이터를 생성할 경우, 소팅이나 인덱스 처리 및/또는 롤업 연산에 장애가 있을 수 있다. 그러므로, 개념적으로 특허 분류 기호의 조합을 하기 표 77과 같이 처리하는 것이 더욱 바람직하며, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 복수 특허 분류 기호쌍 정보를 다음과 같이 생성할 수도 있을 것이다.
[표 77]
From Main IPC From Sub IPC 문건 번호 출원인 출원일 가중치 정책 1 적용 가중치 정책 2 적용
H04B 7/15 H04B 7/26 10-2005-0111868 삼성전자 2006.12.04 1 1
H04B 7/15 H04B 7/24 10-2005-0111868 삼성전자 2006.12.04 1 1
H04B 7/14 H04B 7/26 10-2005-0111868 삼성전자 2006.12.04 1 1
H04B 7/14 H04B 7/24 10-2005-0111868 삼성전자 2006.12.04 1 1
H04B 7/155 H04B 7/04 10-2006-0012606 삼성전자 2006.12.04 1/3 0.75/2
H04B 7/155 H04B 7/02 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
H04B 7/15 H04B 7/04 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
H04B 7/15 H04B 7/02 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
H04B 7/14 H04B 7/04 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
H04B 7/14 H04B 7/02 10-2006-0012606 삼성전자 2006.02.09 1/3 0.75/2
H04B 7/14 H04B 7/02 10-2005-0042032 에스케이텔레콤 2006.12.04 1 1
H04Q 7/00 H04B 7/00 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
H04Q 7/00 H04B 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
H04Q H04B 10-2006-0012606 삼성전자 2006.02.09 1/3 0.25/1
통계 처리와 분석의 목적 상 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 하기 표 78과 같이 상기 복수 특허 분류 기호쌍 정보를 생성하는 것이 더욱 바람직할 것이다.(기재의 편의상 개개의 문건 번호는 표시하지 않았으나, 위의 표 77에 있는 문건 번호의 순서와 완전 동일하다. 그리고, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 하기 표 78과 같은 다차원 분석용 연산 수행 결과 테이블 데이터에서 문건 번호의 서지 사항(출원인, 발명자, 출원일, 등록일 등의 기타 서지 사항에 관한 정보도 함께 포함되는 것이 바람직할 것이다.) (하기에서 M/S는 특허 분류 기호가 메인 IPC에서 기인한 것이면 M, 서브 IPC에서 기인한 것이면 S라고 표기한다는 것을 의미하는 필드이다. 이는 융합의 기준이 가급적 Main IPC를 축으로 파악하는 것이 바람직하기 때문이다.)
[표 78]
C3 C4 C5 C6 M/S 문건번호 M/S C1 C2 C3 C4
H04B 7/00 7/14 7/15 S H04B 7/15 H04B 7/26 M H H04 H04B 7/00
H04B 7/00 7/14 7/15 S H04B 7/15 H04B 7/24 M H H04 H04B 7/00
H04B 7/00 7/14 S H04B 7/14 H04B 7/26 M H H04 H04B 7/00
H04B 7/00 7/14 S H04B 7/14 H04B 7/24 M H H04 H04B 7/00
H04B 7/00 7/14 7/15 7/155 S H04B 7/155 H04B 7/04 M H H04 H04B 7/00
H04B 7/00 7/14 7/15 7/155 S H04B 7/155 H04B 7/02 M H H04 H04B 7/00
H04B 7/00 7/14 7/15 S H04B 7/15 H04B 7/04 M H H04 H04B 7/00
H04B 7/00 7/14 7/15 S H04B 7/15 H04B 7/02 M H H04 H04B 7/00
H04B 7/00 7/14 S H04B 7/14 H04B 7/04 M H H04 H04B 7/00
H04B 7/00 7/14 S H04B 7/14 H04B 7/02 M H H04 H04B 7/00
H04B 7/00 7/14 S H04B 7/14 H04B 7/02 M H H04 H04B 7/00
H04Q 7/00 S H04Q 7/00 H04B 7/00 M H H04 H04B 7/00
H04Q 7/00 S H04Q 7/00 H04B M H H04 H04B
H04Q S H04Q H04B M H H04 H04B
2개 이상의 특허 분류 기호가 포함되어 있는 모든 특허 문건을 대상으로 한 상기와 같은 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터가 있는 경우, 하기와 같은 정보를 추출/계산해 낼 수 있다.
첫째, 특허 분류 기호가 입수되었을 때의 주체 정보 미활용 융합 분석이다. 하나의 특허 분류 기호가 입수되거나 주어졌을 때, 상기 특허 분류 기호와 잘 융합하는(쌍으로 만들어 지는 빈도가 높은) 특허 분류 기호의 랭킹을 찾을 수 있을 것이다. 상기 표에서 예를 들면, H04B 7/04와 잘 융합하는 특허 분류 기호로 C7(IPC 3 dot 레벨) 레벨에서는 H04B 7/155, C6 레벨에서는 H04B 7/15 등과 같이 각 IPC 레벨에서의 융합의 빈도가 높은 IPC들을 입수할 수 있고, 이들에 대해서 통계/분석 정보를 생성하면(group by, count, 및 rank 명령으로 처리하면 된다), 융합 빈도가 높은 IPC들의 순위 정보를 알 수 있게 된다.(예를 들면, "H04B 7/04와 가장 잘 융합하는 C6 레벨의 IPC는 H04B 7/15이며, 차순위로 잘 융합하는 C6 레벨의 IPC는 H04Q 7/30이다"와 같은 융합 관련 랭킹 정보를 생성할 수 있게 된다. 물론, 상기 융합이 발생한 구체적인 문건은 상기 문건 번호를 통해서 구체적으로 확인 가능할 수도 있지 만, 융합이 발생한 IPC 쌍을 검색 엔진 또는 DBMS(201)에 질의함으로써, 해당되는 문건들을 입수할 수도 있게 된다. 상기 입수된 특허 분류 기호와 잘 융합하는 특허 분류 기호들을 IPC 각 레벨별(IPC 서브클래스, 메인그룹, 1 dot, 2 dot, ...로 연도별/기간별 통계/분석한 정보를 생성할 수 있을 것이다. 이는 상기 테이블에서 입수된 특허 분류 기호(예를 들면, H04B 7/04)를 한쪽(가급적 메인 IPC)에서 찾고, 상기 찾은 특허 분류 기호가 포함된 모든 레코드(행)에서 C1~Cn 중에서 레벨을 확정(칼럼이 결정됨)하고, 상기 확정된 레벨에 존재하는 모든 특허 분류 기호에 대하여 통계/분석(group by, count 및 rank 명령으로 가능하다) 아울러, 상기 다차원 분석용 연산 수행 결과 테이블 데이터에 기간/날짜 정보가 포함되어 있는 경우, 상기 입수된 특허 분류 기호와 잘 융합하는 특허 분류 기호들을 상기 기간별(예를 들면 연도별)로의 통계/분석 데이터를 생성할 수 있다.
상기 융합 분석은 하나의 특허 분류 기호에 대해서 설명하였으나, 2 이상의 복수개의 특허 분류 기호가 입수되었을 때의 융합 분석도 상기 입수된 2 이상의 복수개의 특허 분류 기호 개개에 대하여 융합의 빈도가 높은 특허 분류 기호를 획득하고, 이를 합하면 될 것이다. 한편, 정책에 따라서, 하나의 문건에 상기 입수된 복수개의 특허 문건에서 중복 해당하는 경우가 발생하는데, 이때 중복을 허용하면서 통계/분석 정보를 생성할 수도 있고, 중복을 제거하면서 통계/분석 정보를 생성할 수도 있다. 후자의 경우에는 상기 입수된 복수개의 특허 분류 기호를 질의한 다음, 질의 결과로 나오는 레코드 각각에 포함된 문건 번호에 distinct 명령 등과 같은 중복 제거 명령을 수행한 다음, 중복이 제거된 레코드만을 기준으로 각 IPC 레벨별로 잘 융합되는 특허 분류 기호에 대한 통계/분석 정보를 생성할 수 있게 된다. 이러한 중복의 문제가 발생하게 되는 근본적인 이유는 융합 정보를 처리할 때, 하위 특허 분류 기호에서 융합이 발생했다면, 그 각각의 상위 특허 분류 기호간에서는 당연히 융합이 발생했다고 보기 때문이다. 한편, 복수개의 특허 분류 기호는 동일한 IPC 레벨일 필요는 없으며, 전체 IPC 분류 체계에서 선택되는 어느 2 이상의 특허 분류 기호에 대해서 상기 복수개의 특허 분류 기호가 입수되었을 때의 발명 사상을 그대로 적용할 수 있음은 당연하다 할 것이다.
둘째, 특허 분류 기호가 입수되었을 때의 주체 정보 활용 융합 분석이다. 상기 입수된 특허 분류 기호(1개 또는 복수개)에 가장 잘 융합하는 특허 분류 기호 집합과 관련된 융합 발생 문건 집합이 있을 때, 상기 융합 발생 문건 집합의 문건 번호에 관련된 서지 사항 정보를 활용하여, 각 서지 사항의 필드별 통계/분석 정보를 생성할 수 있다. 예를 들어, H04B 7/00과 융합이 일어난 특허 분류 기호를 포함하고 있는 대한민국 특허청에 출원된 삼성전자주식회사의 특허 문건 집합을 분석 대상 문건 집합으로 하여, 상기 문건 집합에 있는 IPC들을 단계별(IPC 서브클래스, 메인그룹, 1 dot, 2 dot...로 분할하고(이때, 하위 특허 분류 기호 포함의 사상은 당연히 적용된다.) 각 분할된 각 단계별로 어떤 IPC들이 연도별/기간별로 융합이 발생한 문건의 개수에 관한 정보를 제공해 줄 수 있게 된다. 이와 같은 정보는 삼성전자주식회사의 각 발명자별로도 제공해 줄 수 있게 된다.
셋째, 주어진 문건 집합 내부에서의 융합 분석이다. 상기 주어진 문건 집합은 1) 출원인, 2) 발명자, 3) 특허 분류 기호, 4) 국가, 5) 날짜 등 서지 사항을 구성하 는 각종 필드 중 적어도 어느 하나 이상의 조합에 의해서 생성될 수 있다. 문건 집합이 입수되면, 상기 문건 집합을 상기 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블에 질의하면, 입수된 문건 집합 중에서 융합이 발생한 문건 집합을 특정할 수 있게 된다. (문건 번호 및 그 문건 번호가 포함된 레코드가 특정되게 된다.) 이때, 상기 융합이 발생한 문건 집합을 대상으로 생성할 수 있는 정보는 다음과 같다. 1) 융합이 발생한 문건 집합에서 최빈 각 IPC 레벨별 IPC를 추출하고, 상기 추출된 최빈 IPC별로, 융합이 발생한 각 레벨별 IPC에 대한 통계/분석 정보를 생성할 수 있을 것이다.(상기 통계/분석 정보는 카운팅 정보이며, 상기 카운팅 정보값이 있으면, 증감율, 증감속도 등도 구할 수 있게 된다.) 2) 상기 융합이 발생한 문건 집합을 분석 대상 문건 집합으로 한 본 발명 사상의 전반에 걸진 통계/분석 데이터를 생성할 수 있게 된다.(최다 발명자, 최다 출원인, 최다 융합 특허 분류 기호 등을 기준으로 한 이들의 랭킹 정보 등)
넷째, 융합 대상 발견을 위한 통계/분석이다. 이는 주어진 문건 집합 내부에서 기준을 발견하고, 상기 기준에 대하여, 제1국 또는 제2국의 모든 또는 기설정된 문건 집합(예를 들면 출원일 기준 최근 7년간 출원된 문건 집합)을 대상으로 생성된 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하여, 각 기준별로의 융합 통계/분석 정보를 입수하는 통계/분석을 말한다. 상기 기중의 예를 들면, 특정 출원인 또는 출원인별 총량/점유율/집중율/활동율 또는 기타 분석 지표별로의 특허 분류 기호 레벨별 최빈값이 될 수 있을 것이다. 더욱 구체적으로 예를 들면, 삼성전자주식회사의 한국에서의 메인그룹 기준 고집중율 IPC들을 추출할 수 있으며, 이들 추출된 고집중율 기준 IPC들이 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하는 기준 IPC가 될 것이다. 이때, 상기 질의하는 대상이 되는 상기 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터는 제1국(상기 기준이 생성된 국가)이 될 수도 있지만, 제2국(상기 기준의 생성과는 무관한 국가)의 특허 문건 집합에서 생성된 것이다. 상기의 방법을 활용하면, 대한민국의 삼성전자의 특허 문건에서 고집중율 IPC 메인그룹별 IPC를 추출하고, 상기 추출된 IPC를 통해서 일본 또는 미국의 특허 문건 집합으로 생성된 융합 정보 포함 다차원 분석용 연산 수행 결과 테이블 데이터에 질의하여, 일본 또는 미국에서 상기 추출된 고집중율 메인그룹별 IPC들과 잘 융합하는(융합의 빈도가 높은) 각 단계별 특허 분류 기호 정보를 입수할 수 있게 된다.
그리고, 본 발명에서는 다단계 특허 분류 기호 체계 상 직하위 특허 분류 기호가 매개된 롤업 연산 처리를 통한 다차원 분석용 연산 수행 결과 테이블 데이터 생성에 대해서 설명하였다. 그리고, 롤업이 전제되거나, 설령 전제되지 않은 경우라도 실시간으로 주어진 특허 분류 기호의 직하위 특허 분류 기호를 대상으로 한 정보를 생성하여 특정 특허 분류 기호의 직하위 특허 분류 기호에 관한 정보를 드릴 다운 정보를 사용자에게 제공해 줄 수 있었다. 이러한 본 발명의 발명 사상은 융합 분석에도 그대로 적용된다. 하기는 융합 분석에서의 드릴 다운에 대해 더욱 상세한 설명을 제공하고 있다.
하기 표79에서의 기준 IPC는 입수되거나 주어진 IPC이며, 대상 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출 된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC이다. 이때, 기준 및 대상 IPC의 레벨 선택이 가능함은 물론이다 하겠다. (물론, 상기 기준 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC일 수 있음은 당연할 것이다.) 이때, 기준 IPC와 대상 IPC 각각에 대하여 사용자로부터 독립적인 IPC 레벨 선택이 있을 경우, 선택 정보를 입수하여 선택된 레벨별로 계산된 결과를 추출하여 사용자에게 제공한다.
[표 79]
순위 기준 IPC 대상 IPC IPC 설명 00 01 최근 합계
1 B60C 3/00 (+) H01B 1/00 (+) 11 52 4
2 H03M 3/00 (+) B29C 31/00 (+) 2 5 9
드릴 다운된 융합 통계/분석 정보를 입수하기 위하여 상기 표 79에서 기준 IPC인 B60C 3/00을 누른 경우, 본 발명의 시스템(1)은 하기 표 80에서와 같은 방식으로 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있을 것이다. (드릴 다운은 IPC 체계 하에서 자신의 하위에서만을 입수하며, 각 입수된 IPC 모두가 나타나는 것이 아니라 융합이 발생한 IPC만 나타난다.)
[표 80]
순위 기준 IPC 대상 IPC IPC 설명 00 01 최근 합계
1 B60C 3/00 (+) H01B 1/00(+) 횡단면에 특징이 있는 타이어 도전재료를 특징으로 하는 도체 또는 도전물체 11 52 4 67
B60C 3/04(+) 단면의 상대촌법에 특징이 있는 것 5 30 3 40
B60C 3/06(+) 비대칭의 것 4 10 1 12
B60C 3/08(+) 보관 또는 불사용상태에서 접을 수 있는 것 1 2 0 2
2 H03M 3/00 (+) B29C 31/00 (+) 2 5 9 16
(비고) 52 = from 하위(30+10+2) + 자신(10)
상기 표 80과 같은 결과 데이터에서 본 시스템의 사용자가 어디서든 H01B 1/00를 누른 경우에는 본 시스템(1)은 다음 표 81과 같은 형식의 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있다.
[표 81]
순위 기준 IPC 대상 IPC IPC 설명 00 01 최근 합계
1 B60C 3/00 (+) H01B 1/00(+) 횡단면에 특징이 있는 타이어 11 52 4
H01B 1/02(+) 주로 금속 또는 합금으로 된 것 3 35 2
H01B 1/04(+) 주로 카본 실리콘혼화물 , 카본 또는 실리콘으로서 되는 것 2 10 0
H01B 1/06(+) 주로 다른 비금속물질로 되는 것 2 0 0
2 H03M 3/00 (+) B29C 31/00 (+) 2 5 9
한편, 본 시스템(1)은 드릴 다운과 관계하여 다음과 같은 결과 데이터를 사용자에 게 제공해 줄 수 있을 것이다. 하기 표 82에서의 기준 IPC는 입수되거나 주어진 IPC이며, 1위에서 n위까지의 랭킹의 대상이 되는 대상 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC이다. 이때, 기준 및 대상 IPC의 레벨 선택이 가능함은 물론이다 하겠다.(물론, 상기 기준 IPC는 제1국 또는 제2국 전체 융합 발생 문건 집합 또는 기설정되거나 입수된 문건 집합 중에서 추출된 융합 발생 문건 집합 또는 기설정되거나 입수된 융합 발생 문건 집합에서 입수하는 최빈/빈도 높은 IPC일 수 있음은 당연할 것이다.)
[표 82]
순위 기준 IPC IPC 설명 1위 2위 3위
1 B60C 3/00 (+) 횡단면에 특징이 있는 타이어 H01B 1/00(67) (*) G03B 5/00(15) (*) C07B 31/00(10) (*)
2 H03M 3/00 (+)
이때, 상기 표 82와 같은 결과 데이터에서 H01B 1/00 (*)를 눌렀을 때는 다음 표 83과 같은 기준 IPC와 대상 IPC의 융합 분석 결과가 나오는 것이 바람직할 것이다.
[표 83]
순위 기준 IPC 대상 IPC IPC 설명 00 01 최근 합계
1 B60C 3/00 (+) H01B 1/00 (+) 횡단면에 특징이 있는 타이어 횡단면에 특징이 있는 타이어 ( more ) 도전재료를 특징으로 하는 도체 또는 도전물체 11 52 4 67
H01B 1/02(+) . 주로 금속 또는 합금으로 된 것 3 35 2 40
H01B 1/04(+) 주로 카본 실리콘혼화물 , 카본 또는 실리콘으로서 되는 것 2 10 0 12
H01B 1/06(+) . 주로 다른 비금속물질로 되는 것 2 0 0 2
사용자들에게 보이는 모든 IPC에는 IPC 설명이 포함되는 것이 바람직할 것이다. 사용자들 중에서 각 IPC를 모두 기억하기를 기대하기를 어렵기 때문에, 각 IPC의 타이틀 정보가 1차적으로 상기 IPC 설명 정보로 나오는 것이 바람직할 것이다. 이때, 각 IPC의 타이틀 정보는 간략하고, 특징만을 설명하는 것이 대부분이므로, 2차적으로 IPC에 대한 설명에 클릭했을 때 POP UP 등으로 그 IPC의 상위 IPC들을 모두 또는 일정 단계까지(예를 들면 클래스 레벨까지) 보여 주는 것이 바람직할 것이다.
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 IPC를 중심으로 융합 분석을 위한 다차원 분석용 연산 수행 결과 테이블 데이터를 어떻게 생성하는 지에 대해 설명하였으나, 본 방법은 USPC, FT, FI, ECLA 등의 다른 특허 분류 기호에 대해서도 동등한 방법으로 적용될 수 있음은 당업자에게 자명하다 할 것이다.
한편, 상기 융합 분석에서 융합 발생 특허 분류 기호 조합은 2개의 특허 분류 기호의 조합(Ai, Bj)을 중심으로 설명했으나, 본 발명 사상은 3개 이상의 융합 발생 특 허 분류 기호의 조합 (Ai, Bj, Ck...)에 대해서도 본 발명 사상은 그대로 적용됨은 당업자에게 자명할 것이다. 예를 상기 2개의 특허 분류 기호의 조합을 중심으로 융합분석을 할 경우에는 동종 특허 분류 기호가 2개 이상 포함되어 있는 특허 문건을 융합 발생 특허 문건 집합으로 하였으나, 3개의 특허 분류 기호의 조합을 중심으로 융합 분석을 하는 경우에는 동종 특허 분류 기호가 3개 이상 포함되어 있는 특허 문건을 융합 발생 특허 문건 집합으로 하여야 한다. 그리고 2개의 특허 분류 기호의 조합일 경우, 하나의 문건에 n개의 특허 분류 기호가 있을 경우, nC2개의 (Ai, Bj) 조합이 나왔으나, 3개의 특허 분류 기호의 조합일 경우, nC3 개의 (Ai, Bj, Ck)가 나오며, (Ai, Bj, Ck)를 (Ai, Bj)처럼, 하나의 단위로 하여 처리할 수 있을 것이다. 이 경우에도 Ai, Bj, Ck 중에서 어느 하나는 메인 IPC에서 기인된 것이 포함될 수도 있으며, 모두 서브 IPC에서 기인한 것일 수도 있다.
대표 어구 분석용 다차원 분석용 연산 수행 결과 테이블
본 발명의 대표 어구 추출 전처리 모듈을 통한 대표 어구 생성 방법은 전술한 바 있다. 상기 대표 어구 추출 전처리 모듈은 하기 표 84와 같은 데이터를 생성한다는 것은 전술한 바가 있다.
[표 84]
어구 ID 어구 문건 번호 필드 출현회수
1 abc #1 D 3
1 abc #1 C 2
1 abc #2 D 2
1 abc #2 C 1
2 bcd #1 D 1
2 bcd #1 C 1
3 ac #1 D 1
본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 대표 어구 분석을 위한 다차원 분석용 연산 수행 결과 테이블 데이터를 생성하기 위하여, 상기 표84 와 같은 데이터를 입수하고, 상기 입수한 문건 번호의 서지 사항에 포함된 각종 정보(출원인, 특허 분류 기호, 발명자, 날짜 정보 등)를 특허 문건 마스트 DB(202)에서 추출하여(문건 번호를 키값으로 하여 조인 연산을 수행하여 처리할 수도 있다.) 하기 표 85와 같은 형태의 다차원 분석용 연산 수행 결과 테이블 데이터를 생성한다. 먼저 특허 분류 기호를 추출하여 하기와 같은 데이터를 생성할 수 있을 것이다. 편의상 문건 번호 #1에는 H04B 7/15라는 IPC가 1개 포함되어 있고, 문건 번호 #2에는 H04B 7/26 및 H04B 7/02라는 IPC가 포함되어 있다고 가정하자.
[표 85]
어구 ID 어구 필드 출현회수 문건 번호 C1 C2 C3 C4 C5 C6
1 abc D 3 #1 H H04 H04B 7/00 7/14 7/15
1 abc C 2 #1 H H04 H04B 7/00 7/14 7/15
1 abc D 2 #2 H H04 H04B 7/00 7/24 7/26
1 abc C 1 #2 H H04 H04B 7/00 7/24 7/26
1 abc D 2 #2 H H04 H04B 7/00 7/02
1 abc C 1 #2 H H04 H04B 7/00 7/02
2 bcd D 1 #1 H H04 H04B 7/00 7/14 7/15
2 bcd C 1 #1 H H04 H04B 7/00 7/14 7/15
3 ac D 1 #1 H H04 H04B 7/00 7/14 7/15
문건 번호 #2에는 H04B 7/26 및 H04B 7/02라는 IPC가 대응되어 있으므로, 각 레코드마다 2개의 IPC 정보를 처리하기 위한 레코드가 생겼다. 상기는 IPC에 대해서 설명해 놓았지만, 본 발명 사상이 USPC, FT 등에도 동일한 방식으로 적용됨은 전술한 바와 같고, 당업자에게 자명할 것이다.
먼저 특허 분류 기호를 추출하여 하기 표 86과 같은 데이터를 생성할 수 있을 것이다. 편의상 문건 번호 #1에는 출원인 A가 포함되어 있고, 문건 번호 #2에는 출원인 B와 C가 포함되어 있다고 가정하자. 또한, 상기 문건 번호 #1은 2005년 5월에 출원되었다고 하고, #2는 2006년 1월에 출원되었다고 하자. 이 경우 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 하기 표 86와 같은 형태의 다차원 분석용 연산 수행 결과 테이블 데이터를 생성할 수 있을 것이다. (하기 표에서 05/1Q는 2005년 1분기를 의미한다.)
[표 86]
어구 ID 어구 필드 출현회수 문건 번호 05 05/Q1 5/2Q 5/3Q 5/4Q 06 06/1Q AppName
1 abc D 3 #1 1 1 A
1 abc C 2 #1 1 1 A
1 abc D 2 #2 1 1 B
1 abc C 1 #2 1 1 B
1 abc D 2 #2 1 1 C
1 abc C 1 #2 1 1 C
2 bcd D 1 #1 1 1 A
2 bcd C 1 #1 1 1 A
3 ac D 1 #1 1 1 A
문건 번호 #2에는 출원인 B, C가 포함되어 있으므로, 각 레코드마다 2개의 출원인 정보를 처리하기 위한 레코드가 생겼다.
본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 상기 대표어구와 관련한 상기 2개의 다차원 분석용 연산 수행 결과 테이블 데이터를 1개의 통합된 다차원 분석용 연산 수행 결과 테이블 데이터로 생성해 놓을 수도 있을 것이다. 한편, 번역을 적용한다면, 상기 어구들에 대해 언어 정보에 대응되는 각 언 어별 번역어를 어구로 한 다차원 분석용 연산 수행 결과 테이블 데이터를 생성할 수 있을 것이다. 상기 AppName 필드는 출원인명을 의미하며, 상기 필드 옆에 발명자 필드를 생성할 수 있고, 개별 발명자마다 하나의 레코드를 생성할 수 있을 것이다. 만약 출원인이 2이고, 발명자가 3인이면, 출원인 정보와 발명자 정보가 없던 1개의 레코드가 출원인과 발명자를 1개씩 포함하는 6(2*3 = 6)개의 레코드로 확장된다.
상기 표 85 및 표 86과 같은 데이터가 있는 경우, 대표어구와 관련하여 하기와 같은 정보를 생성할 수 있다.
첫째, 1) 출원인별 또는 발명자별 또는 출원인의 발명자, 2) 특정 특허 분류 기호의 특정 레벨(예를 들면 IPC 메인그룹 등), 3) 특정 기간(년, 분기, 월 등), 4) 특정 국가별로 어구 집합을 제공할 수 있을 것이다. 예를 들면, 대한민국 특허 출원 문건 기준 IPC 메인그룹 H04B 1/00, 2005년 1분기, 삼성전자주식회사가 출원한 문건에(문건의 특허 청구 범위 또는 초록 또는 특정 필드에) 등장하는 어구들의 목록을 추출할 수 있을 것이다. 이는 상기 표 85 및/또는 표 86와 같은 다차원 분석용 연산 수행 결과 테이블 데이터가 있을 때 간단한 SQL 문으로 처리 가능함은 당업자에게 자명할 것이다.
둘째, 1) 출원인별 또는 발명자별 또는 출원인의 발명자, 2) 특정 특허 분류 기호의 특정 레벨(예를 들면 IPC 메인그룹 등), 3) 특정 기간(년, 분기, 월 등), 4) 특정 국가별로 대표 어구 집합을 추출하여 제공할 수 있을 것이다. 대표 어구 추출은 대표 어구 추출 정책에 따라 달라진다. 상기 대표 어구 추출 정책의 예로 다음과 같은 것들이 있을 수 있다.
1) 추출된 특정 어구에 대하여 "출현 빈도 확률 = 특정 문건 집합에서의 출현 빈도/자신의 상위 문건 집합에서 출현 빈도*100"를 처리한 값이 기설정된 제1 협범위값에 포함되어 있는 경우이다.
2) 특정 어구에 대하여 그 특정 어구의 상기 출현 빈도 확률을 처리한 값이 기설정된 제1 협범위값에 포함되어 있어 있지 않고, 기설정된 제2 광범위값에 포함되어 있으면서, 상기 출현 빈도 확률이 기설정된 랭킹 이내에 포함되는 경우이다. 이는 특정 문건 집합에서 상기 1)의 대표 어구 추출 정책을 사용한 결과 대표 어구의 수가 현격히 적을 경우에 잘 적용될 수 있을 것이다.
3) 상기 추출된 특정 어구에 대하여, 특정 문건 집합에서의 출현 빈도의 증감율 기설정된 제1 협범위값에 포함되어 있는 경우이다.
상기 출현 빈도 확률을 구할 때, 자신의 상위 문건 집합이 언급되는데, 상기 상위 문건 집합의 종류는 1) 자신의 문건 집합을 특정짓는 요소가 적어도 하나 이상의 차원(dimension)을 포함할 경우 그 차원의 직상위 또는 모든 상위의 문건 집합이 되는 유형의 상위 문건 집합(한꺼번에 2가지 이상의 차원의 직상위 또는 모든 상위가 가능함은 물론이다.), 2) 순수한 키워드만으로 문건 집합이 특정될 때는 그 문건 집합의 전체 집합(국가 단위의 문건 집합일 경우, 그 국가의 모든 문건 집합)이 되는 상위 문건 집합이 있다. 상기 1) 유형의 상위 문건 집합에 대해 상세히 설명한다. 예를 들어, IPC H01L 1/00으로 특징되는 문건 집합의 경우에는 i) H01L 또는 이들의 상위 특허 분류 기호(H01, H)로 특정되는 문건 집합이 상기 상위 문건 집합 이 될 수 있다. 한편, 대한민국 삼성전자주식회사의 2000년도 1분기 IPC H01L 1/00로 특정되는 문건 집합의 상위 문건 집합에는 i) 상위 특허 분류 기호, ii) 2000년도 또는 연도 통합, iii) 삼성전자주식회사의 모든 국가(미국, 일본, EU 등, 물론, 이때, 상기 어구의 그 국가 해당 언어로의 번역이 전제될 수도 있을 것이다.), iv) 대한민국의 모든 출원 또는 v) 상기 i) 내지 iv) 중 어느 하나 이상의 조합으로 생성되는 문건 집합이 상기 상위 문건 집합이 될 수 있을 것이다. 문건 집합이 특정한 키워드와 상기 차원의 조합으로 생성되는 경우(예를 들면, "RFID tag"라는 키워드와 대한민국 삼성전자주식회사의 2000년도와 같은 국가, 출원인, 연도 차원이 결합됨)에도 상기 키워드는 유지한 채 상기 i) 내지 v)를 적용하면, 상위 문건 집합의 생성이 가능함은 물론이다 하겠다. 한편, 상기 i) ~v)의 상위 문건 집합별로 상기 제1 협범위값 및/또는 상기 제2 광범위값들이 정해져 있는 것이 바람직하다.
한편, 문건 집합을 특정짓는 요소에 적어도 하나 이상의 차원을 포함하여 생성된 문건 집합에서 생성되는 대표 어구 추출하는 경우, 그 차원을 축으로 드릴 다운이 가능할 것이다. 드릴 다운 될 때는 그 차원 요소별로 기설정된 조건을 만족하는 대표 어구를 추출하여 그 결과를 사용자들에게 제공해 줄 수 있다. 하기 표 87 및 표 88은 대표 어구 관련된 드릴 다운의 일 실시예를 보여주고 있다. 상기 예는 00연도에 대해 대표 어구를 표시해 주고 있다. 이때, 01연도를 클릭하면 표 87과 같이 01연도에 해당하는 대표 어구를 추출하여 보여 준다.
[표 87]
순위 기준 IPC 대상 IPC IPC 설명 00 01 02 03 04 05 06 최근 합계
1 B60C 3/00 (+) 횡단면에 특징이 있는 타이어 미끄럼, 마찰력 향상, 타이어 공명음 주파수, 소음, 정전기 방출
2 H03M 3/00 (+) 변조, 시그마 델타, 펄스폭 변조, 적문기 리셋
상기 대표 어구는 출현 빈도 확률에 따라 칼라, 폰트 사이즈 등을 달리하는 것이 바람직하다. 한편, 상기 대표 어구에 클릭했을 때는 상기 대표 어구를 포함하고 있는 문건을 추출해 줄 수 있을 것이다. 문건 추출은 1) 상기 대표 어구 추출을 위한 상기 다차원 분석용 연산 수행 결과 테이블 데이터에 문건 번호가 있다면 그 문건 번호를 기초로 하여 특허 문건 마스트 DB(202)에 질의하여 해당 문건을 추출하여 제공해 주는 방법, 2) 상기에서 나온 모든 차원과 대표 어구를 조합하여 검색 엔진에 질의하는 방법이 있을 수 있다. 후자의 예를 들면, 만약 대표 어구 "소음"를 선택한 경우(이 대표 어구가 특허 청구 범위(Claim, C)에서 나온 것일 경우, 입력하는 검색식은 "IPC = B60C 3/00 AND Claim = "소음", Date = (20000101~20001231", 국가 = 대한민국"처럼 될 것이다. 만약, 이 대표 어구를 가지는 미국 문건을 보기를 원할 경우에는 "국가 = 미국"으로 치환하여 검색 엔진에 질의하면 될 것이며, 이때, 키워드에 해당하는 "소음"이 미국 문건의 기본 언어인 영어가 아닐 경우(즉, 언어의 종류를 판단하여) 본 시스템(1)에 포함된 번역 시스템을 이용하여 "소음"를 영어로 번역하여 "noise"로 상기 "소음" 자리에 입력하여 검색함은 물론이다 하겠다.
드릴 다운된 대표 어구를 추출하기 위하여 표 87에서 기준 IPC인 B60C 3/00을 누른 경우((+)표시를 눌러도 됨, 이는 인터페이스의 문제임), 본 발명의 시스템(1)은 하 기 표 88과 같은 방식으로 드릴 다운된 데이터를 생성하여 사용자에게 제공해 줄 수 있을 것이다. (드릴 다운은 IPC 체계 하에서 자신의 하위에서만을 입수하며, 각 입수된 IPC 모두가 나타나는 것이 아님은 물론일 것이다. 예를 들어 B60C 3/02에 문건이 없거나, 대표 어구가 없다면 이 IPC에 대한 대표 어구는 제시되지 않는다. 이때, 상기 B60C 3/00에 해당하는 대표 어구는 보여 줄 수도 있고, 감출수도 있을 것이다.
[표 88]
순위 기준 IPC 대상 IPC IPC 설명 00 01 최근 합계
1 B60C 3/00 (+) 횡단면에 특징이 있는 타이어 미끄럼, 마찰력 향상, 타이어 공명음 주파수, 소음, 정전기 방출
B60C 3/04(+) 단면의 상대촌법에 특징이 있는 것 조정 안정성, 래디얼 타이어, 압축 공기
B60C 3/06(+) 비대칭의 것 내마모성, 코너링, 비대칭 자가 측벽, 비대칭 래디얼 타이어
B60C 3/08(+) 보관 또는 불사용상태에서 접을 수 있는 것 림 이탈, 프페어 타이어 캐리어, 보관 장치
2 H03M 3/00 (+) 차동변조
상기와 같은 예시는 대표 어구를 제시하는 일 실시예일 뿐, 본 발명 사상이 적용되는 분석 결과 어느 곳에서나 상기 대표 어구를 추출하여 제공해 줄 수 있음은 물론이다 할 것이다. 이는 본 발명 사상이 적용되는 분석 결과에는 문건 집합이 대응되어 있고, 본 발명의 대표 어구 상기 문건 집합(상기 문건 집합을 구성하는 특허 문건들)을 입수함으로써 이를 재료로 하여 생성되기 때문이다.
본 발명의 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 선택되는 적어 도 하나 이상의 차원별로 다차원 연산된 계산을 수행하여 다차원(n-차원) 큐브를 생성해 놓는다. 본 발명의 다차원 큐브 생성의 특징 중의 하나는 특허 분류 기호가 차원에 포함되어 큐브가 생성될 때, 주어진 상기 특허 분류 기호에 대한 롤업 연산 값이 생성될 때, 상기 특허 분류 기호 및 상기 특허 분류 기호의 상위 특허 분류 기호을 함께 고려하여 롤업 연산값을 생성하는 것이다. 이렇게 롤업 연산값이 생성되면, 임의의 특허 분류 기호에 대한 롤업 연산값을 입수할 때, 그 특허 분류 기호의 하위 특허 분류 기호들에 대한 모든 값들이 다차원 연산된 수치값들이 반영되어 생성된 값을 입수하게 된다. 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 주어진 특허 문건에 포함된 특허 분류 기호가 있을 때, 상기 특허 분류 기호 뿐만 아니라, 상기 특허 분류 기호의 상위 특허 분류 기호에도 상기 특허 분류 기호에 대한 처리값을 반영한다. 예를 들면, 문건 번호 #1에 H04B 7/06이라는 IPC가 부여되어 있을 경우, 이 문건으로 큐브 다차원 분석용 연산 수행 결과 테이블을 생성할 때, H04B 7/06에도 카운팅 값 1을 부여하고, 상기 H04B 7/06은 직상위인 H04B 7/04, H04B 7/02에도 카운팅값을 부여해야 한다. 물론, H04B 7/00이상의 상위 레벨에도 카운팅값이 부여됨은 상식적일 것이다. 이를 위해 상기 표들에서와 마찬가지로, 모든 주어진 특허 분류 기호(예를 들면 IPC)에 대하여 자신의 상위 특허 분류 기호들을 자신이 속한 줄(row)에 일렬로 배치해 놓고, 그 각 상위 특허 분류 기호에 대응되는 셀에 주어진 특허 분류 기호에서 기인한 값을 반영하여 셀값을 계산한다. 이러한 본 발명만의 독특한 롤업 연산 방식은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402) 및 본 명세서의 곳곳에서 반복적으로 설 명해 놓았다.
자기 집합 기준 자기 집합 분석과 자기 기준 타분석 유형
본 발명의 분석 모듈은 다양한 분석 주제별 분석 모듈의 집합으로 구성된다. 상기 분석 주제별 분석 모듈은 분석 주제와 관련된 분석 결과를 생성하기 위하여, 상기 분석 주제에 대응되는 분석 주제별 분석 쿼리식을 포함하고 있다. 상기 분석 주제별 분석 쿼리식으로 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 다차원 분석용 연산 수행 결과 테이블에 접근하여 목적하는 주제별 분석 결과를 입수해 낸다.
본 발명의 분석 모듈이 생성하는 분석 결과값과 최초 확정되는 분석 대상 문건 집합과는 다음 2가지 관계가 있다.
첫째는 "자기 집합 기준 자기 집합 분석 유형"으로 상기 분석 결과값이 상기 분석 대상 문건 집합에서 나오는 경우이다. 예를 들면 특정한 출원인의 최빈 기술 분야별(IPC) 각 단계별 연도별 출원수, 점유율, 집중율, 활동율 데이터나, 각 출원인의 개별 발명자별 기술 분야별(IPC) 각 단계별 연도별 출원수, 점유율, 집중율, 활동율 데이터나, 출원인별 또는 개별 발명자별 (기술 분야별) 피인용수 등에 대한 데이터가 이의 예가 된다. 이때, 상기 특정한 출원인의 최빈 기술 분야를 추출해 내는데, 상기 특정한 출원인 자기 자신과 관계된 문건 집합으로 최빈 기술 분야(IPC)를 추출해 내며, 상기 추출된 최빈 기술 분야(IPC)가 기준이 되어 그 기준에 따라 연도별 출원수나 점유율 등의 분석 결과가 만들어 진다는 것이다. 그러므로, 자기의 문건 집합을 대상으로 기준으로 생성해 내고, 그 기준별 최종 분석 결과도 자신 의 연도별 출원수이므로, 자기 자신에 대한 분석이 되게 된다. 상기 "자기 집합 기준 자기 집합 분석" 유형은 출력되는 최종 분석 결과가 최초 입력된 문건 집합(자기 문건 집합)에서 생성될 수 있는 특징이 있다.(물론, 점유율 등의 비율값 등을 구할 때는 기준되는 전체값이 필요함은 당연하다.)
두번째는 "자기 집합 기준 타 집합 분석" 유형으로, 상기 분석 결과값이 상기 분석 대상 문건 집합에서 나오지 않는 경우이다. 예를 들면, 분석 결과로 출원인 A의 문건을 중 다출원 기술 분야별로 다수 인용하는 인용자에 대한 데이터를 얻으려는 경우, 최초로 입력하는 데이터는 출원인 A의 문건 집합에 관한 것이지만, 최종적으로 출력하는 데이터는 A가 아닌 타인들의 문건 집합에 관한 데이터이다. 또한, 자신의 최빈 메인그룹 단계의 IPC별로, 그 IPC에 다출원하고 있는 출원인이나, 그 IPC에 집중율이 높은 출원인을 랭킹을 매겨서 추출하는 경우도 "자기 집합 기준 타 집합 분석"기준은 자기 자신의 문건 집합에서 메인그룹별 최빈 IPC를 추출한다는 면에서는 자기 집합 기준이며, 최종 결과가 타인들의 문건 집합에 대한 것이라는 점에서 타 집합 분석이 된다.
이러한 두번째 경우에는 2단계 이상의 계산이 필요하게 된다. 상기 예에서는 우선적으로 출원인 A의 문건 집합을 다출원 기술 분야별로 출력하는 분석과, 상기 출력된 각 기술 분야별 문건 집합을 대상으로 이 문건 집합에 속하는 문건을 인용하는 타인들의 문건 집합을 구하며, 이 타문건 집합을 분석 대상 문건 집합으로 하여 다출원인들을 추출하여 최종적인 분석 결과로 제공한다.
상기 자기 집합 기준 자기 집합 분석에 대해서는 상기 다차원 분석용 연산 수행 결 과 테이블 생성 모듈(402)은 다차원 분석용 연산 수행 결과 테이블에서 기설정된 최종 결과까지 동일한 다차원 분석용 연산 수행 결과 테이블에 생성해 놓을 수 있다. 예를 들어, 출원인별 최빈 IPC별 연도별 출원수나 점유율과 같은 분석 결과를 생성하기 위해서는 1개의 다차원 분석용 연산 수행 결과 테이블로도 충분한 경우가 많다.
한편, 상기 자기 집합 기준 타 집합 분석 유형의 경우에는 1) 최종 결과까지 미리 생성해 놓는 경우, 2) 최종 결과까지를 각 단계별로 나누고, 각 단계별에서 생성되는 단계별 결과를 다음 단계의 입력값으로 하는 방법이 있을 수 있다. 후자의 경우, 1) 최종 결과까지 단계별로 구분될 수 있을 것, 2) 최초 및 각 단계별 결과를 입력값으로 하여 다음 단계의 출력값을 생성할 수 있도록 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 입력값에 대한 출력값을 계산해 놓은 다차원 분석용 연산 수행 결과 테이블 데이터나 큐브 데이터가 있을 것, 3) 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 최초 및 각 단계별 결과를 입력값으로 받을 수 있을 것과 같은 조건이 성립해야 한다.
상기 출원인 A의 문건을 중 다출원 기술 분야별로 다수 인용하는 인용자(출원인, assignee)에 대한 데이터를 얻으려는 경우의 예를 들어서 설명하면 다음과 같다. 상기 결과는 다음과 같은 단계를 거쳐 입수될 수 있다. 1) 출원인 A가 확정되는 단계(출원인 A는 모든 출원인 전체 집합 중의 한 원소이므로, A는 확정된다), 2) 하나의 국가(예를 들면 미국)에서의 A의 문건 집합이 확정되는 단계(예를 들어 A의 전체 출원 문건 집합이라 하자), 3) A의 모든 문건 집합에는 IPC나 USPC 등이 적어 도 하나 이상 부여되어 있으므로, 선택된 특허 분류 기호의 종류와 레벨(예를 들어 IPC, subclass레벨)이 주어진다면 그 주어진 값을 기준으로, 주어지지 않는다면 모든 특허 분류 기호의 종류 및 모든 레벨에서), 각 종류 및 레벨에 속하는 문건 부분 집합(예를 들면, IPC H04N, H01B 등등)이 확정되는 단계, 4) 기술 분야별로 문건 부분 집합을 카운팅하여 다출원 기술 분야의 랭킹을 추출하는 단계, 5) 각 문건 부분 집합별로(예를 들면, A의 모든 문건 중 IPC H04N에 대하여) 그 문건 집합에 속하는 개별 문건을 추출(예를 들면 문건 #1,...#n)하는 단계, 6) 각 개별 문건별로 이 문건 번호를 인용하고 있는 타문건 번호들을 추출하는 단계, 7) 추출된 타문건 번호의 출원인을 추출하는 단계, 8) 추출된 타문건 번호의 출원인을 상기 부분 문건 집합별로 합하는 단계(출원인의 빈도값은 함께 저장된다), 9) 상기 합해진 출원인을 빈도 순으로 상기 기술 분야별(특허 기술 분류의 종류 및 레벨)별로 저장하는 단계(이때, 각 출원인별 문건의 개수(및/또는 타문건 번호 정보)도 함께 저장된다)를 거치면 출원인 A의 문건 중 다출원 기술 분야(특허 기술 분류 및 레벨)에 따른 다수 인용하는 출원인을 확정해 놓은 수 있다. 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 모든 출원인 중에서 선택되는 어느 하나 이상의 출원인을 대상으로 하여 상기 1) ~9)까지의 단계를 수행한 다음 그 결과값을 데이터로 저장해 놓을 수 있다. 상기 1~2) 및/또는 3)는 최초 자기 입력에 대응되는 분석 대상 문건 집합의 확정과 관련되어 있고, 4)~5)는 최초 자기 입력 기준에 대한 자기 자신의 분석에 대응되며, 6)은 분석 결과를 얻기 위한 타문건 집합의 생성과 관련되며, 7) ~9)는 최종 타출력에 대응되는 최종 분석 결과의 생성과 관련된다. 이 경우, 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성해 놓은 최종 분석 결과를 입수되는 조건에 맞게 불러와서 보여 주면 된다. 상기 조건은 상기 사용자 또는 기타로부터 입력되는 IPC 등의 특허 기술 분류의 종류 및 레벨, 국가 등이 될 것이다.
상기 1) ~9)의 단계가 상기 다단계형 분석을 거칠때는 다음과 같은 그룹화된 다단계가 가능할 것이다. 이 경우 상기 분석 모듈은 다음과 같은 방식으로 작동 될 수 있을 것이다.
첫째, 상기 분석 모듈이 출원인 A의 다출원 기술 분야별 문건 집합을 확정하는 단계이다. 이 때 상기 분석 모듈은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 모든 출원인에 대하여 1)~4)의 과정을 수행하여 다출원 기술 분야의 랭킹 및 그 기술 분야별로의 문건 부분 집합의 수를 확정해 놓은 데이터로부터 출원인 A에 관한 데이터를 입수할 수 있다.
둘째, 상기 분석 모듈의 문건 집합 입수 모듈이 상기 5)의 문건 번호를 입수하는 단계이다. 상기 문건 부분 집합의 수가 있을 때, 상기 모든 수는 SQL 쿼리에 대응될 수 있으므로, 상기 SQL 쿼리로 상기 5)의 문건 번호를 확정할 수 있다. 상기 문건 번호는 사전에 다차원 분석용 연산 수행 결과 테이블 또는 큐브 데이터에 저장되어 있을 수도 있지만, 저장하지 않는 것이 합리적일 것이다.(SQL로 언제든지 불러 낼 수 있기 때문이다). 상기 문건 집합 입수 모듈은 기설정된 조건에 따른 문건 집합을 입수하여 합집합 연산을 수행하는 모듈을 말한다. 이 경우 SQL이 문건 집합 을 입수하기 위한 조건에 해당된다.
셋째, 상기 분석 모듈의 상기 문건 집합 입수 모듈이 상기 6)단계를 수행한다. 상기 문건 집합 입수 모듈이 상기 5) 단계의 문건 번호를 서지 사항 DB에 질의하거나, 검색 엔진에 질의함으로써 6) 단계의 타문건 집합이 입수된다. 물론, 상기 서지 사항 DB에는 각 문건은 자신이 인용하고 있는 타문건 번호에 관한 정보(reference 정보)를 포함하고 있거나, 상기 검색 인덱스(401-2)에 특정 문건 번호를 질의했을 때, 질의된 특정 문건 번호를 상기 인용/레퍼런스(reference) 정보로 포함하고 있는 문건 번호를 출력해 줄 수 있어야 한다.(즉, 인덱싱을 수행할 때 a문건에 인용 정보로 #1, #2 문건 번호가 있을 때, 검색 인덱서(401-3)가 인용 필드의 검색을 위해서 a <- #1, a <- #2와 같이 역파일 정보를 생성하여 검색 인덱스(401-2)로 처리해 놓은 경우, 검색 엔진의 인용 검색 필드에 #1이라는 문건 번호를 입력하면, 자신을 인용하고 있는 문건 a를 포함한 여러 문건을 출력해 주게 된다.)
넷째, 상기 6)단계를 통하여 분석의 대상이 되는 타문건 집합이 생성되고, 이렇게 생성된 타문건 집합에 대한 7) 이후의 각종 분석은 본 발명의 직접 분석 모듈이 수행한다. 상기 분석 모듈은 상기 분석 모듈에 포함되어 있는 직접 분석 모듈을 호출하여 상기 7)~9)를 수행한다. 상기 직접 분석 모듈은 주어진 임의의 문건 집합에 대하여 문건 집합이 주어질 때, 기설정된 분석 프로세서를 수행하는 분석 엔진을 말한다.(사전에 기설정될 수 없는 문건 집합, 기설정되기에는 문건 집합의 경우의 수가 너무 많은 경우에 그 문건 집합의 분석 결과를 사전에 생성해 놓는 것은 불가 능하거나 불합리하다. 그러므로, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 4) 단계까지만 생성해 놓는 것이 합리적이다.) 직접 분석 모듈이 수행하는 역할은 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 수행하는 역할과 대등하다. 즉, 상기 5)의 단계를 통하여
상기 직접 분석 모듈 및 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 분석 대상 문건 집합이 입력되는 최초 단계만이 다를 뿐이며, 일단 문건 집합이 입수된 후 진행되는 분석 결과 데이터 생성 과정은 동일하다.
자기 집합 기준 타 집합 분석의 유형
상기 자기 집합 기준 타 집합 분석에 대해 더욱 상세하게 설명한다. 상기 자기 집합 기준 타 집합 분석의 첫번째 단계는 자기 집합을 대상으로 기준 추출하는 것이다. 상기 기준에는 자기 문건 집합을 기준으로 하여 1) 출원이나 등록이 많은 레벨별 특허 분류 기호, 2) 집중율/점유율/활동율이 레벨별 특허 분류 기호, 3) 국내/해외 패밀리 사이즈가 큰 레벨별 특허 분류 기호, 4) 피인용이 많은 레벨별 특허 분류 기호, 5) 융합이 다수 발생하는 레벨별 특허 분류 기호, 6) 청구항의 평균 개수 등과 같은 각종 카운팅 값이 높은 레벨별 특허 분류 기호 등이 있을 수 있다. 상기 1) ~6)는 기설정된 기간(예를 들어 출원일 기준 최근 7개년 간 등)별로 추출할 수도 있을 것이며, 상기 1) ~6)는 상기 출원수/등록수, 점유율/집중율/활동율, 패밀리사이즈, 피인용, 융합의 계량화된 수치의 변동값(증감율, 변화속도 등)이 기설정된 기준을 넘는 경우를 조건으로 추출할 수도 있을 것이며, 상기 1) ~6)을 국 가 단위로도 추출할 수 있을 것이다.
도 17 등에 포함된 랭킹 1위 H01L, 2위 H04N 등은 자기 집합을 대상으로 하여 추출된 기준의 일례를 보여 준다. 상기 자기 집합은 본 명세서에서 설명하는 문건 집합의 확정에 따라 확정된 문건 집합을 의미한다.
둘째 단계는, 상기 자기 집합을 대상으로 추출된 기준에 대하여, 분석 결과를 생성하는 단계이다. 상기 분석 결과를 생성하기 위하여 상기 분석 주제별 분석 모듈은 기설정된 분석 질의식으로 기설정된 다차원 분석용 연산 수행 결과 테이블에 질의한다. 이때, 상기 다차원 분석용 연산 수행 결과 테이블은 상기 자기 집합이 아닌 집합 또는 자기 집합이 포함될 수도 있는 타 전체 집합을 대상으로 생성된 것이다. 수 있다. 예를 들어, 자기 집합이 아닌 집합의 경우에는 1) 자기 집합이 제 1국 기준의 집합일 경우, 제1국이 아닌 제 2국의 문건 집합이 대표적이다. 한편, 상기 자기 집합이 포함될 수도 있는 타 전체 집합에는 인용 분석에서 활용되는 i) 전체 전방 인용 문건 집합, ii) 전체 후방 인용 문건 집합을 대상으로 한 1) 전체 전방 인용 문건 집합, 2) 전체 후방 인용 문건 집합이 대표적이다.
한편, 자기 집합 기준 타 집합 분석의 대표적인 예로 경쟁 분석이 있다. 출원인 단위 경쟁 분석을 예로 들면서 경쟁 분석을 설명한다. 제 1국의 특정 출원인의 전체 또는 일부의 문건 집합을 대상으로 하여, 상기 문건 집합을 자기 집합으로 하여 적어도 하나 이상의 특허 분류 기호 레벨 단위(예를 들면 IPC 서브클래스)에서 상기 출원인의 다출원/다등록 기준 IPC, 고집중율, 고점유율, 고활동율 또는 기타 특허 지표별로 랭킹이 높은 IPC를 추출할 수 있을 것이다. 상기 추출한 IPC에 대하여 제 1국 또는 제2국에서 상기 다출원/다등록 출원인, 집중율이 높은 출원인 점유율이 높은 출원인, 고활동율이 높은 출원인 또는 기타 특허 지표가 높은 출원인의 랭킹을 추출할 수 있을 것이다. 한편, 출원인 단위가 아니더라도 출원인의 발명자 단위, 발명자 단위, 대리인 단위 등의 각종 단위별로 본 문단에서 출원인 단위에서 수행한 정보 처리를 동일하게 하여, 그 단위별로의 경쟁 분석을 수행할 수 있다. 물론, 상기의 타 집합 분석 결과를 생성하기 위하여 본 발명의 분석 모듈은 IPC 각 레벨별로 출원/등록 총량, 점유율, 집중율, 활동율이 다차원 연산되어 포함되어 있는 다차원 분석용 연산 수행 결과 테이블에 기설정된 분석 질의식으로 접근하여 목적하는 분석 결과를 추출해 낸다.
상기 분석 모듈은 분석 주제별 분석 쿼리식으로 해당 다차원 분석용 연산 수행 결과 테이블에 질의하여 분석 결과를 입수하여 출력한다. 이때, 상기 분석 결과의 출력은 각 언어별로 출력되는 것이 바람직하다.
한편, 수치값이 주어졌을 때, 그 수치값의 변화값(증감율, 속도, 가속도) 및 통계값(평균과 표준편차 등)도 유용한 정보가 될 수 있다. 이때, 1) 그 변화값과 통계값까지 다차원 분석용 연산 수행 결과 테이블 에 생성해 놓는 방법도 적용될 수 있으며, 2) 상기 분석 모듈 단에서 입수된 수치값으로 즉석에서 계산하는 방법이 있을 수 있다. 이때, 그 수치값이 단순한 출원/등록량 등과 같은 카운팅값인 경우 2)의 방법이 용이할 수 있으며, 점유율, 집중율 및 활동율과 같은 비율값인 경우 1)의 방법이 더 용이할 수 있을 것이다. 예를 들어, A 기업의 H04N 7/02 기술 영역에서 2000년도부터 2005년까지의 출원 총계나 출원수 증감율 등은 그 수치값이 카운팅 정보이므로, 연도별 출원 수만으로 용이하게 계산될 수 있다. 한편, 2000년도부터 2005년도까지의 A 기업의 H04N 7/02 영역에서의 연도별 점유율, 집중율, 및 활동율 수치값으로, 평균값(비율값의 총계는 의미가 없음)을 계산하는 경우, 비율값의 합산이 의미가 없으므로, 각 분석 지표에 대응되는 공식을 연도별이 아니라, 2000년부터 2005년까지의 연도 통합적으로 적용해야 한다. 그러므로, 비율값의 계산은 상기 2)의 방법과 같이 사전에 다차원 분석용 연산 수행 결과 테이블의 생성 시 함께 생성되는 것이 바람직할 것이다.
본 발명의 분석 모듈에는 특허 문건 마스트 DB(202), 특허 분류 기호 마스트 DB(203), 주체 마스트 DB(204) 등과 같이 DB 자체를 대상으로 하는 마스트 DB 분석 모듈이 있다. 상기 마스트 DB 분석 모듈은 주제별로 마련되며, 상기 마스트 DB 분석 모듈이 수행하는 것은 분석 주제마다 어떤 마스트 DB의 어떤 테이블을 조인하여 나온 값을 어떻게 처리하는 지에 대한 정보를 담과 있는 SQL 쿼리문 또는 상기 SQL 쿼리문이 입수한 데이터를 재처리하는 애플리케인션을 포함하고 있다. 상기 마스트 DB 분석 모듈은 서브 쿼리(sub query)를 다수 사용하여야 하는데, 상기 서브 쿼리는 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성한 것과 동등한 다차원 분석용 연산 수행 결과 테이블의 일부(1개의 레코드 또는 복수개의 레코드) 또는 전부의 내용을 생성하는 역할을 담당한다.
사용자가 검색어 등을 입력하여 생성되는 사용자 직접 생성 문건 집합을 분석 대상 문건 집합으로 하는 경우를 예로 들면서 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402) 및 상기 서브 쿼리에 대해서 더욱 상세하게 설명한다. 사용자 직접 생성 문건 집합은 사용자가 생성하기 전에는 문건 집합이 사전에 확정되지 않으므로, 사전에 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)으로 다차원 분석용 연산 수행 결과 테이블을 사전에 생성해 놓을 수 없는 문제가 있다. 그러므로, 사용자 직접 생성 문건 집합을 대상으로 분석을 수행하는 경우에는, 분석 대상 문건 집합 확정 후 다음 2가지 방법 중 어느 한 가지 방법 이상으로 사용한다. 첫째, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 상기 사용자 직접 생성 문건 집합을 대상으로 다차원 분석용 연산 수행 결과 테이블을 생성해 놓고, 상기 다차원 분석용 연산 수행 결과 테이블을 대상으로 각종 분석 주제별 분석 모듈이 해당 분석 질의식으로 상기 테이블에 접근하여, 분석 결과를 생성하는 방법이다. 둘째는 상기 마스트 DB 분석 모듈이 상기 사용자 직접 생성 문건 집합에 포함된 문건에 대하여 적어도 하나 이상의 서브 쿼리를 사용하여 다차원 분석용 연산 수행 결과 테이블에 포함된 데이터와 대등한 데이터(테이블 또는 뷰)를 생성해 놓고, 상기 데이터에 상기 분석 주제별 마스트 DB 분석 모듈이 해당 분석 질의식(메인 쿼리)으로 상기 생성해 놓은 데이터에 접근하여 분석 결과를 생성하는 방법이다. 상기 다차원 분석용 연산 수행 결과 테이블에 포함된 데이터와 대등한 데이터란 말은 롤업 연산 또는 큐브 연산과 같이 적어도 하나 이상의 차원으로 차원 연산 처리한 결과와 대등한 데이터를 말한다.
분석의 방향 계열
상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 생성하는 다차원 분석용 연산 수행 결과 테이블은 다음과 같은 계열이 있을 수 있다. 분석이란 본질적 으로 특정한 데이터에서 목적하는 바를 입수하는 것이므로, 분석의 종류는 1)분석 대상 문건 집합의 속성과 2) 분석 주제에 의해서 결정나게 되며, 부가적으로 3) 분석 결과를 출력해 주는 형태에 따라 결정나게 된다. 그러므로, 상기 1), 2) 및/또는 3)에 따라 분석 종류별로 이름붙이기(naming)이 되게 된다.
이하, 각종 분석 종류를 예시적으로 설명하면서, 상기 1), 2), 3)과 관련 지어 본다.
첫째, 분석 대상 문건 집합의 속성은 본 명세서에서 다수 언급한 적이 있는 문건 집합이 확정되었을 때의 그 확정의 기준에 따라 결정된다. 출원인, 발명자, 특정 레벨의 특허 분류 기호, 전방 인용 문건 집합 등등은 모두 분석 대상 문건 집합의 속성에 따른 것이다. 이들 분석 대상 문건 집합은 본 발명의 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)이 입수하는 문건 집합의 단위의 한 예가 된다.
둘째, 분석 주제에 따른 분류로, 상기 분석 주제에 따라, 상기 다차원 분석용 연산 수행 결과 테이블 생성 모듈(402)은 어떠한 다차원 분석용 연산 수행 결과 테이블을 생성할 것인지와 상기 다차원 분석용 연산 수행 결과 테이블에 어떠한 분석 질의식으로 질의할 것인지를 결정하게 된다.
셋째, 분석 결과를 출력해 주는 형태에 따른 분류로 이에는 다음과 같은 2가지가 있다. 1) 단일 분석과 2) 비교 분석이 있다. 단일 분석에는 한 종류의 분석 결과를 1개의 단일한 기준으로 제시해 주는 것이며, 비교 분석은 한 종류(동일한 종류)의 분석 결과를 2개 이상의 기준으로 제시해 주는 것이다. 예를 들어 2 이상의 출원인 별/기업별(예를 들면 삼성전자와 LG전자)로 동일한 분석 결과(예를 들면 연도별 IPC 레벨별 특정 국가에서의 출원수)를 함께 제시해 주는 출원인별/기업별 비교 분석의 가장 단순한 예가 된다. 이때, 상기 예에서 연도별 IPC 레벨별 특정 국가에서의 출원수는 상기 2개 이상의 출원인별/기업별로 동일한 종류의 분석 결과가 됨을 알 수 있다. 비교 분석 결과는 비교 대상의 선택에 따라 사용자에게 최종적으로 출력해 주는 결과가 달라지므로, 사용자로부터 비교 대상의 선택을 입수 받고, 각 선택 대상별로 상기 다차원 분석용 연산 수행 결과 테이블에 기설정된 분석 주제별 분석 질의식으로 질의한 다음, 각 선택 대상별로의 분석 결과를 결합하면 된다. 상기 예에서는 삼성전자 및 LG전자에 대해서 각각 동등한 분석 결과를 생성하고, 이를 비교하는 방식으로 결합하면, 비교 분석 결과값이 생성되게 된다.
감시 모듈(403)
특허 정보의 감시란, 업데이트 되는 특허 정보를 대상으로한 감시(watching, monitoring, alerting) 활동을 말한다. 감시 방법은 1) 검색 엔진을 활용하는 방법, 2) DBMS(201)를 활용하는 방법이 있다. 검색 엔진을 활용하는 감시 방법은, 자신이 원하는 정보를 입수하기 위한 검색식(주로 기술 키워드가 포함되는 경우가 많다)과 감시 주기(가급적 특허 데이터가 업데이트 되는 주기 또는 그 주기의 정수 배수의 기간이 바람직하다)를 설정해 놓으면, 스케줄러가 상기 검색식을 상기 주기마다 상기 검색식에 기간 한정 조건을 자동적으로 부여하여(예를 들면, 감시 주기를 1주일로 설정한 경우, 질의 시점 기준으로 과거 1주일까지의 대상 특허 문건으 로 검색의 대상으로 한정함) 검색 인덱스(401-2)에 질의하고, 검색 결과가 있을 경우, 그 결과를 입수 받는 것을 핵심으로 한다. 한편, 2) DBMS(201)를 활용하는 감시 방법은 상기 마스트 DB, 상기 다차원 분석용 연산 수행 결과 테이블데이터, 또는 상기 큐브 데이터를 대상으로 각각 쿼리식으로 질의하는 방식을 제외하고는 상기 1)의 방법과 동등하다. 한편, 기술 키워드가 있는 경우에는 DBMS(201)의 경우 검색 엔진에 비하여 응답 속도가 늦으므로(DBMS(201)는 full text search를 지원하나, 이에 특화되어 있는 검색 엔진에 비하여 퍼포먼스가 낮다) 상기 1)의 방법이 바람직하다. 한편, 상기 다차원 분석용 연산 수행 결과 테이블데이터 및 상기 큐브 데이터에 대하여 감시를 수행하기 위해서는 상기 다차원 분석용 연산 수행 결과 테이블데이터 및 상기 큐브 데이터가 상기 감시 주기보다 짧거나 적어도 같은 기간 단위로 롤업 연산되어 있어야 한다. 즉, 상기 다차원 분석용 연산 수행 결과 테이블데이터 및 상기 큐브 데이터가 월단위로 롤업 연산되어 있는 경우라면, 이러한 롤업 연산에는 주 단위의 세부적인 결과들은 통합되어 구분될 수 없으므로, 주 단위의 감시의 대상으로는 적합하지 못하게 된다. 그러므로, 2)의 DBMS(201)를 통한 감시의 경우는 마스트 DB를 통한 감시가 다차원 분석용 연산 수행 결과 테이블데이터나 큐브 데이터의 감시보다 더 바람직하다.
상기 마스트 DB를 활용하여 감시를 수행하는 것을 마스트 DB 활용 감시 모듈(403)이라 하며, 다차원 분석용 연산 수행 결과 테이블데이터를 대상으로 감시를 수행하는 것을 다차원 분석용 연산 수행 결과 테이블DB 활용 감시 모듈(403)이라 하며, 큐브 데이터를 대상으로 감시를 수행하는 것을 큐브 DB 활용 감시 모듈(403)이라 하며, 검색 엔진을 활용하여 감시를 수행하는 것을 검색 엔진 활용 감시 모듈(403)이라 한다.
한편, 상기 마스트 DB 활용 감시 모듈(403), 다차원 분석용 연산 수행 결과 테이블DB 활용 감시 모듈(403), 큐브 DB 활용 감시 모듈(403), 검색 엔진 활용 감시 모듈(403)이 감시 활동을 수행할 때, 상기 감시 검색식 또는 쿼리식에 특허 분류 기호가 포함되어 있을 경우, 하위 분류 기호 포함 검색에서 설명한 본 발명의 발명 사상이 그대로 적용된다. 즉, 상기 포함된 특허 분류 기호와 그 하위 특허 분류 기호에 대응되는 문건에 관한 정보를 모두 감시 결과를 출력하기 위하여, 상기 검색식 또는 쿼리식(질의식)을 수정하여 검색 또는 질의한다. 이에 대해서는 상술하였다.
감시 모듈(403)이 제공하는 감시 서비스란 특정한 검색식을 등록시켜 놓고, 그 검색식에 해당되는 신규 특허 정보가 있는 경우 그 신규 특허 정보를 감시 서비스를 받는 자에게 제공하는 것을 말한다. 본 발명에서 감시를 수행하는 것은 감시 모듈(403)이 수행한다. 상기 특허 정보 감시 모듈(403)은 감시할 검색식을 등록받고, 기설정된 시간 단위(매일, 매주, 매월, 매분기 및/또는 매년)로 상기 검색식을 상기 검색 엔진 또는 DBMS(201)에 질의하여, 신규한 특허 문건이 발생했을 경우, 상기 신규한 특허 문건의 발생에 대한 정보를 감시 서비스 이용자에게 그 사실, 그 문건, 또는 상기 사실 또는 상기 문건에 관한 정보를 알려 주는 기능을 수행한다. 이때, 상기 알려 주는 방식은 감시 결과를 받을 사람에게 전자 우편 또는 기타 메시지 전송 방식으로 전송하거나, 상기 감시 서비스 이용자가 상기 감시 서비스에 접속했을 때 알려 주는 방식 중 어느 하나 이상을 채용할 수 있을 것이다.
감시 서비스를 수행하기 위해서는 1) 감시를 위한 검색식을 등록받는 단계; 기설정된 시간 단위로 상기 검색식을 검색 엔진 또는 DBMS(201)에 질의하고(질의할 때는 신규 문건을 찾는 것이 목적이므로, 시간 범위(예를 들면 공개 일자 기준으로 검색 질의하는 일자 포함 기준으로 과거 6일을 시간 범위로 한정함)을 검색식에 한정하는 것이 일반적이다.), 신규 특허 문건이 있는 경우 이를 감시 서비스 받은 자에게 전송하는 단계를 거칠 수 있다.
특징
본 발명의 감시 모듈(403)에 입력되는 감시 검색식은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템(1)에 사전에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 감시 검색식 또는 상기 발명자 명의 단위에서 필요한 감시 검색식이 자동으로 추출되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 감시 서비스에 세팅이 되게 된다. 상기 세팅되는 감시 검색식의 종류 및 상기 세팅되는 감시 검색식을 생성하는 방법은 다음과 같은 것이 있을 수 있다. 먼저 문건 집합 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 감시 검색식에 포함될 정보는 상기 본 발명의 분석 모듈에서 생성되는 분석 결과인 경우가 다수 있다. 상기와 같은 예로는 상기 수치값, 상기 비율 값 등의 최빈값, 최대값 등을 들 수가 있다. 구체적인 예는 하나씩 설명한다.
출원인 명의 단위 또는 발명자 명의 단위 감시
첫째, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 적어도 하나 이상의 최빈 특허 분류 기호를 빈도 순으로 랭킹을 매겨 추출하고, 상기 최빈 특허 분류 기호를 기설정된 국가 또는 특허 정보 마스트 D가 입수하는 문건의 발생국(WIPO를 포함한다) 중에서 선택되는 적어도 어느 하나 이상의 국가별로 감시할 검색식으로 등록해 놓을 수 있다. 상기 특허 분류 기호는 IPC, USPC, FI, FT, ECLA 중에서 선택되는 어느 하나 이상인 것이 바람직하며, 상기 특허 분류 기호의 깊이(depth, IPC의 경우, 섹션(section), 서브섹션(subsection), 클래스(class), 서브클래스(subclass), 그룹(group), 서브그룹(subgroup)으로 구분되며, 서브그룹 이하에서는 도트(dot)의 수로 깊이를 결정한다. 다른 특허 분류 기호도 독자적인 상하위 특허 분류 기호 체계를 가지고 있다)의 설정은 1) 그룹 또는 서브그룹 단위에서 결정하는 방법, 2) 2 도트 서브그룹 또는 3도트 서브그룹 등과 같이 상기 서브그룹 이하의 단위에서 수행하는 방법 등이 있을 수 있다. 다만, 상기 특허 분류 기호의 깊이는 서브클래스 단위일 수도 있지만, 이 경우에는 너무 많은 특허 문건이 나올 수 있어 노이즈(noise)가 심하게 된다.
둘째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 대해서 1) 국내외에서 가장 많은 특허를 출원하거나 등록하는 자, 2) 국내외에서 일정 개수 이상을 출원하면서도 상기 최빈 특허 분류 기호에 집중율이 높은 자, 3) 국내외에서 기설정된 최근 기간 내에 특허 출원 속도나 특허 등록 속도가 기설정된 기준 이상이 되는 출원인을 추출하고, 상기 출원인을 감시 검색식으로 할 수 있다.
셋째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 대해서 상기 특허 분류 기호 및 상기 특허 분류 기호의 하위 특허 분류 기호에 대응되는 기설정된 최근 기간 내의 신규 문건 수의 증가 속도가 높은 특허 분류 기호를 감시 검색식으로 할 수 있다.
넷째, 상기 첫째 방법에서 도출되는 적어도 하나 이상의 최빈 특허 분류 기호에 가장 많은 특허를 출원하거나 등록하는 적어도 하나 이상의 국내외의 발명자를 추출해 내고, 상기 발명자를 감시 검색식으로 할 수 있다.
다섯째, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상이 되는 문건 집합에서 인용 정보(인용(backward citation), 피인용(forward citation)를 추출해 내고, 국내외적으로 최빈 인용자 및/또는 최빈 피인용자를 추출해 내고, 상기 최빈 인용자 또는 피인용자를 출원인으로 하여 감시 검색식으로 할 수 있다.
여섯째, 상기 문건 집합의 어느 하나 이상의 개별 특허 문건을 인용하는 자를 감시하기 위하여(상기 특허 문건을 인용하는 자를 찾아 내기 위해서), 상기 문건 집합을 이루는 전체 특허 문건의 출원 번호 또는 등록 번호를 OR 연산자로 묶어 감시 검색식으로 할 수 있다.
일곱째, 상기 첫번째부터 여섯번째의 방법 중에서 선택되는 2 이상의 방법을 결합(mix)하여 감시 검색식을 생성할 수 있을 것이다. 검색 엔진이 지원하는 각 필드 별로 검색식을 입력할 수 있을 것이며, 같은 필드의 경우라면 각 방법에서 도출되는 검색식을 and, or와 같은 연산자를 사용하여 감시 검색식을 생성할 수 있음은 당업자에게는 당연하다 할 것이다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 전체 문건 집합 단위의 감시 검색식은 각 감시 주제별로 폴더화 되어 감시 서비스 하위에 존재하면서 사용자에게 노출되는 것이 바람직하다. 예를 들어 설명하면, 상기 첫번째 방법의 감시 검색식의 감시 주제는 "최빈 특허 분류 기호를 통한 특허 감시"라는 이름의 폴더가 만들어 지는 것이 바람직하며, 상기 폴더 내에는 각 국가별로 하위 폴더 내지는 하위 계층 구조가 만들어 지는 것이 바람직할 것이다. 상기 전체 문건 집합 단위의 감시 검색식으로 감시한 결과는 상기 폴더 또는 계층 구조에서 확인되는 것이 바람직할 것이다. 물론, 상기 사전에 세팅되는 검색식을 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자 또는 발명자가 수정할 수 있음은 물론이다 하겠다.
개별 문건 단위 감시
이하, 개별 문건 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 개별 문건 단위에는 적어도 하나 이상의 특허 분류 기호가 포함되어 있으므로, 상기 특허 분류 기호를 중심으로 설명한다.
첫째, 상기 특허 분류 기호 자체를 감시 검색식으로 생성할 수 있을 것이다. 이때, 상기 특허 분류 기호의 하위 특허 분류 기호를 자동으로 포함시키는 것이 더욱 타 당할 것이다. 또한, 2 이상의 특허 분류 기호가 있을 때, 상기 특허 분류 기호를 조합하여 and 연산하는 방식으로 생성되는 복수개의 검색식도 가능할 것이다. 이때, 주 특허 분류 기호를 포함시키는 것이 당연할 것이며, 상기 개별 특허 문건에서 입수되는 모든 특허 분류 기호에 대해 and 연산을 하는 감시 검색식이 포함되는 것이 바람직할 것이다.
둘째, 상기 특허 분류 기호에 대해 1) 국내외에서 가장 많은 특허를 출원하거나 등록하는 자, 2) 국내외에서 일정 개수 이상을 출원하면서도 상기 최빈 특허 분류 기호에 집중율이 높은 자, 3) 국내외에서 기설정된 최근 기간 내에 특허 출원 속도나 특허 등록 속도가 기설정된 기준 이상이 되는 출원인을 추출하고, 상기 출원인을 감시 검색식으로 할 수 있다.
셋째, 상기 특허 분류 기호에 대해서 상기 특허 분류 기호 및 상기 특허 분류 기호의 하위 특허 분류 기호에 대응되는 기설정된 최근 기간 내의 신규 문건 수의 증가 속도가 높은 특허 분류 기호를 감시 검색식으로 할 수 있다.
넷째, 상기 특허 분류 기호에 가장 많은 특허를 출원하거나 등록하는 적어도 하나 이상의 국내외의 발명자를 추출해 내고, 상기 발명자를 감시 검색식으로 할 수 있다.
다섯째, 상기 개별 특허 문건을 인용하는 자를 감시하기 위하여(상기 특허 문건을 인용하는 자를 찾아 내기 위해서), 상기 개별 특허 문건의 출원 번호 또는 등록 번호를 감시 검색식으로 할 수 있다.
여섯째, 상기 첫번째부터 다섯번째의 방법 중에서 선택되는 2 이상의 방법을 결 합(mix)하여 감시 검색식을 생성할 수 있을 것이다. 검색 엔진이 지원하는 각 필드별로 검색식을 입력할 수 있을 것이며, 같은 필드의 경우라면 각 방법에서 도출되는 검색식을 and, or와 같은 연산자를 사용하여 감시 검색식을 생성할 수 있음은 당업자에게는 당연하다 할 것이다.
이하, 개별 문건 단위에서 사전에 세팅되는 감시 검색식의 종류 및 생성 방법을 설명한다. 상기 개별 문건 단위에는 적어도 하나 이상의 특허 분류 기호가 포함되어 있으므로, 상기 특허 분류 기호를 중심으로 설명한다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 개별 문건 단위의 감시 검색식은 각 감시 주제별로 폴더화 되어, 상기 개별 문건의 서지 사항 또는 관리 화면에 위치되어 노출되는 것이 바람직하다. 예를 들어 설명하면, 상기 첫번째 방법의 감시 검색식의 감시 주제는 "특허 분류 기호를 통한 본 문건과 유사한 특허 감시"라는 이름의 폴더가 만들어 지는 것이 바람직하며, 상기 폴더 내에는 각 국가별로 하위 폴더 내지는 계층 구조가 만들어 지는 것이 바람직할 것이다. 상기 전체 문건 집합 단위의 감시 검색식으로 감시한 결과는 상기 폴더 내지는 계층 구조에서 확인되는 것이 바람직할 것이다.
특허 인텔리전스 모듈(60)
이하, 본 발명의 특허 인텔리전스 모듈(60)에 대하여 설명한다. 본 발명의 특허 인텔리전스 모듈(60)은 고차원적인 고급 특허 분석을 수행하고, 상기 고급 특허 분석 수행 결과를 저장해 놓거나, 사용자에게 제공하는 기능을 수행한다.
상기 특허 인텔리전스 모듈(60)에는 인용 분석 모듈(601-1)과 비교 분석 모듈(601-2)이 포함된 분석 모듈(601), 핵심 분야의 발견과 관련된 핵심 분야 발견 모듈(602), 관련성 있는 집단 정보를 생성해 내는 유관성 발견 모듈(603), red ocean의 정도 등과 같은 문건 집합 단위의 집합적 속성을 찾아내는 문건 집합 단위 집합적 속성 발견 모듈(604), 신규 주체의 발견이나 선발 주체의 발견 등을 수행하는 포트폴리오 분석 모듈(605), 융합 분석 모듈(606), 유망 분야를 찾아내는 유망 분야 분석 모듈(607), 공백 기술을 찾아내는 공북 기술 분석 모듈(608), 특허 전략을 분석하는 특허 전략 분석 모듈(609) 중 어느 하나 이상을 포함하고 있다.
상기 핵심 분야 발견 모듈(602)에는 핵심 출원인을 발견하는 핵심 출원인 발견 모듈(602-1), 핵심 발명자 발견 모듈(602-2), 핵심 대리인 발견 모듈(602-3), 핵심 특허 분류 기호 발견 모듈(602-4) 등이 있다.
상기 유관성 발견 모듈(603)에는 유관 출원인 발견 모듈(603-1), 유관 발명자 발견 모듈(603-2), 유관 대리인 발견 모듈(603-3), 유관 특허 분류 기호 발견 모듈이 있다.
상기 문건 집합 단위 집합적 속성 발견 모듈(604)에는 red ocean 속성 발견 모듈(604-1)이 있다.
상기 포트폴리오 분석 모듈(605)에는 신규 주체 발견 모듈(605-1) 및 선발 주체 발견 모듈(605-2)이 있으며, 상기 신규 주체 발견 모듈(605-1)에는 신규 진입 출원인 발견 모듈(605-1-1), 신규 진입 발명자 발견 모듈(605-1-2), 신규 진입 대리인 발 견 모듈(605-1-3), 상기 선발 주체 발견 모듈(605-2)에는 선발 출원인 발견 모듈(605-2-1), 선발 발명자 발견 모듈(605-2-2), 선발 대리인 발견 모듈(605-2-3)이 있다.
상기 융합 분석 모듈(606)에는 주체별 기술 융합 패턴 분석 모듈(606-1), 기술 분야별 기술 융합 패턴 분석 모듈(606-2), 국가별 기술 융합 패턴 분석 모듈(606-3), 시기별 기술 융합 패턴 분석 모듈(606-4)이 있다. 본 발명의 상기 복수 특허 분류 기호 관계성 전처리 모듈(3900) 및 융합 분석용 다차원 분석용 연산 수행 결과 테이블(205 -7)의 생성 모듈과 이를 이용한 분석 모듈에서 상기 융합 분석 모듈(606)에 대하여 설명하였다. 상기에서 기술 또는 기술 분야를 IPC USPC , FT 등과 같은 특허 분류 기호로 한정하는 경우, 특허 분류 기호별, 출원인/발명자별 특허 분류 기호의 관점에서, 국가별 특허 분류 기호의 관점에서 이에 대해서는 상기에서 충분히 설명하였고, 상기 각각에 대하여 시기에 대한 한정을 할 수 있음을 설명하였다.
상기 유망 분야 분석 모듈(607)에는 활용 유망 분야 분석 모듈(607-1), 융합 유망 분야 분석 모듈(607-2)이 있다. 상기 특허 전략 분석 모듈(609)에는 특허 전략 평가 지표 분석 모듈(609-1), 특허 활용도 분석 모듈(609-2), 인수 특허 분석 모듈(609-3) 등이 있다.
출원인 명의 단위 특허 정보 서비스 시스템
개념
이어, 본 발명의 특허 정보 시스템의 일 응용예로서 계층적으로 통합된 특허 정보 서비스 시스템 및 개별 단위 특허 정보 서비스 시스템 에 대하여 설명한다.
본 발명의 출원인 명의 단위 특허 정보 서비스 시스템이란, 개별적인 출원인 명의 단위로 된 특허 정보 시스템을 말하며, 상기 출원인 명의 단위 특허 정보 서비스 시스템이 포함하는 특허 문건 정보에는 상기 출원인 명의가 출원인 및/또는 특허권자 필드에 포함되어 있는 것을 특징으로 한다. 본 발명의 발명자 명의 단위 특허 정보 서비스 시스템이란, 개별적인 발명자 명의 단위로 된 특허 정보 시스템을 말하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템이 포함하는 특허 문건 정보에는 상기 발명자 명의가 발명자 필드에 포함되어 있는 것을 특징으로 한다. 하나의 출원인 명의 단위 특허 정보 서비스 시스템에는 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 대응될 수 있음은 물론이다 하겠다. , 출원인 명의 단위 특허 정보 서비스 시스템의 하부에는 상기 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 구성되어 있을 수 있으며 이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 특정한 발명자의 상기 발명자 명의 단위 특허 정보 서비스 시스템으로의 접근 권한을 관리할 수 있을 것이다.
본 발명의 개별 단위 출원인 명의 단위 특허 정보 서비스 시스템에 대해서는 도 2에 그 상세한 구성이 나와 있다. 상기 개별 단위의 출원인 명의 단위 특허 정보 서비스 시스템에는 상기 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진, 발명자 단위의 특허 정보 시스템을 생성하는 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 상기 발명자 명의 단위 특허 정보 서 비스 시스템을 관리하는 관리 모듈, 출원인 명의 단위로 관리되는 출원인 명의 단위 특허 정보 데이터, 발명자 단위로 관리되는 발명자 명의 단위 특허 정보 데이터가 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진(1100)에는 출원 명의인이 결정될 때, 상기 출원 명의인을 출원인/특허권자로 하는 적어도 하나 이상의 국가에의 문건을 입수하는 출원 명의인 단위 문건 입수 모듈(1110), 입수된 출원 명의인 단위의 문건에 대한 정보를 데이터(테이블, DB or view에 들어있는 것을 포함한다)로 생성하는 출원 명의인 단위 문건 집합 DB 생성 모듈(1130) 및 출원 명의인 단위로 특허 정보의 통계, 분석 및 감시, 리포팅 등의 본 발명의 인텔리전스 정보를 생성하는 출원인 명의 단위 특허 정보 인텔리전스 생성 모듈(1150)이 포함되어 있다. 이때, 상기 출원인 명의 단위 문건 집합은 엄격하게 말하면, 출원인 명의 단위 문건 정보 데이터로 그 데이터가 물리적인 DB, 물리적인 테이블로 저장되어 있을 수 있으며, 뷰(물리적인 뷰(materialized view를 포함한다), 또는 기타 임의의 형태의 데이터 구조를 말하는 것으로, 기술의 편의상 출원인 명의 단위 문건 집합 DB라 칭한다. 이는 발명자 명의 단위 문건 집합 DB에서도 마찬가지로 적용된다.
본 발명의 상기 발명자 단위 특허 정보 서비스 시스템 생성 엔진(1300)은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성엔진과 마찬가지로 작동하며, 그 하부에 발명자 단위 문건 입수 모듈(1310), 발명자 단위 문건 집합 DB 생성 모듈(1330) 및 발명자 명의 단위 특허 정보 인텔리전스 생성 모듈(1350)을 포함할 수 있다.
본 발명의 관리 모듈(1500)에는 출원인 명의 단위 특허 정보 서비스 시스템을 관리하는 출원 명의인 단위 관리 모듈(1510)과 개별 발명자 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 관리하는 발명자 명의 단위 관리 모듈 및 관리 정보를 포함하고 있는 관리 정보 DB(1550)가 있다. 상기 출원인 명의 단위 관리 모듈에는 출원인 명의 단위의 문건 집합 목록을 관리하는 출원인 명의 단위 문건 집합 관리 모듈(1511), 출원인 명의 단위의 특허 정보 인텔리전스를 관리하는 출원인 명의 단위 특허 정보 인텔리전스 관리 모듈(1513) 및 출원인 명의 단위에 속한 개별 발명자의 권한을 관리하는 발명자 권한 관리 모듈(1515)가 있으며, 발명자 등을 적어도 하나 이상의 단계를 두어 다단계 계층으로 관리하는 다단 계층 생성 관리 모듈(1517)이 있다. 한편, 상기 발명자 단위 관리 모듈(1530)에는 발명자 명의 단위 문건 집합 관리 모듈(1531), 발명자 명의 단위 특허 정보 인텔리전스 관리 모듈(1533)
한편, 상기 출원인 명의 단위 특허 정보 데이터(1700)에는 출원인 명의 단위 특허 문건 집합 DB(1710) 및 출원인 명의 단위 특허 정보 인텔리전스 DB(1730)가 있으며, 상기 발명자 단위 특허 문건 마스트 DB(1900)에는 발명자 단위 특허 문건 집합 DB(1910) 및 발명자 단위 특허 정보 인텔리전스 DB(1930)가 있다.
한편, 개별적인 출원인 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가질 수 있으며, 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 방법은 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템으로의 링크 정보를 가지고 있거나, 다른 출원인 명의 단위 특허 정보 서비스 시스템이 자신의 관리 권한 하에 있는 방법이 있을 수 있다. 이처럼 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템을 가지는 것은 발명자 단위 특허 정보 서비스 시스템의 주체인 개별 발명자도 가능한 것이다. 즉, 하나의 주체로서 개별 발명자 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템에 대한 링크 정보를 가지거나, 상기 다른 출원인 명의 단위 특허 정보 서비스 시스템에 대한 관리 권한을 가질 수도 있다.
본 발명의 개별 단위 특허 정보 서비스 시스템 생성 엔진은 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진 중 적어도 어느 하나 이상을 포함한다. 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 출원인 명의 단위 문건 집합 입수 모듈, 출원인 명의 단위 문건 집합 관리 모듈을 포함하며, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진에는 발명자 명의 추출 모듈, 발명자 명의 단위 문건 집합 입수 모듈 및 발명자 명의 단위 문건 집합 관리 모듈을 포함한다. 본 발명의 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진과 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의를 입수 받았을 때, 적어도 하나 이상의 국가별로, 상기 국가별 특허 DB에서 상기 출원인 명의로 출원되거나 등록된 모든 특허 문건을 입수하고, 상기 입수된 특허 문건에서 개별 발명자 명의를 자동적으로 추출하고, 상기 개별 발명자 명의마다의 특허 문건을 자동적으로 입수하여, 출원인 명의 단위의 특허 문건 집합과 상기 출원인 명의 하의 개별 발명자 단위의 특허 문건 집합을 생성하고, 상기 출원인 명의 단위 문건 집합과 상기 발명자 단위 문건 집합에 대한 관리를
이어서, 상기 특허 정보 데이터베이스에서 출원인 명의 단위의 특허 정보 시스템을 생성하는 방법에 대해서 설명한다.
출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진
출원인 명의 단위 문건 집합 입수 모듈
본 발명의 출원인 명의 단위 특허 정보 서비스 시스템은 상기 출원인 명의와 관련된 특허 문건 집합을 포함하고 있다. 상기 특허 문건 집합은 상기 출원인 명의로 출원되거나 등록된 출원인 명의 단위 문건 집합과 상기 출원인 명의 단위의 문건 집합에 포함된 개별 발명자별의 발명자 명의 단위의 문건 집합을 포함한다. 상기 출원인 명의 단위 문건 집합과 상기 발명자 명의 단위 문건 집합은 적어도 하나 이상의 국가별 특허 DB를 포함하는 전체 특허 DB로부터 입수할 수도 있지만, 개별 국가별 특허 DB로부터 입수되는 것이 바람직할 것이다.
상기 출원인 명의 단위 문건 집합의 입수 방법은 검색 엔진을 통해서 입수하는 방법과 DBMS를 통해서 입수하는 방법이 있을 것이다.
먼저 검색 엔진을 통해서 입수하는 방법을 설명한다. 본 발명의 검색 엔진은 서처(searcher) 또는 검색창 등에 입력되는 검색어를 통해서 특허 문건을 검색가능하도록 하기 위하여, 인덱서(indexer)를 통하여 특허 문건을 인덱싱한다. 상기 인덱싱을 수행하면 검색 인덱스가 생성된다. 상기 검색 인덱스를 생성하는 인덱싱 과정 에서, 상기 특허 문건에 포함된 각 필드(출원인, 발명자, 특허분류기호, 대리인, 발명의 명칭 등)별로 인덱스를 생성할 수 있다. 검색 엔진에 검색하기를 원하는 필드가 지정되고, 검색어를 입력하게 되면, 그 필드에 한정된 검색 결과가 제공되게 된다. 예를 들면, 출원인 필드에 출원인 명의(예를 들면 "삼성전자주식회사" 등)를 입력하게 되면, 그 출원인 명의로 된 특허 문건이 검색 결과로 나오게 된다. 이때, 국가를 한정하거나, 기간을 한정하게 되면, 그 국가 또는 그 기간에 한정된 검색 결과가 나오게 된다. 이와 같은 검색 엔진에의 질의를 통해, 상기 출원인 명의로 된 특허 문건 집합이 결정되게 된다. 그리고, 상기 검색 결과를 통해 상기 검색 결과와 관련된 특허 문건의 일부(예를 들면 서지 사항) 또는 전체(예를 들면 전문) 내용에 대해 접근할 수도 있을 것이다. 물론, 검색 엔진을 통해서 특정 출원인 명의의 문건 집합을 특정할 수 있는 문건 고유 번호(예를 들면 출원 번호 등)만을 입수하고, 상기 입수된 문건 고유 번호를 상기 DBMS를 통하여 상기 특허 DB에 질의함으로써, 상기 특허 문건의 일부 또는 전체 내용에 대한 정보를 입수할 수도 있을 것이다.
이어서, DBMS를 통해 특허 DB에 쿼리를 질의함으로써, 상기 출원인 명의로 출원되거나 등록된 출원인 명의 단위 문건 집합을 생성하는 방법을 설명한다. 특허 DB에는 각종 필드(출원인, 발명자, 특허분류기호, 대리인, 발명의 명칭 등)들이 있을 수 있으며, 상기 특허 DB를 구성하는 각 레코드의 값이 필드별로 입력되어 있다. 상기 특허 DB에 필드명을 지정하고 select 등의 SQL 등과 같은 쿼리를 질의함으로써, 원하는 질의 결과를 생성할 수 있다. 즉, 질의의 대상이 되는 DB 또는 테이블 을 특정하고, 상기 DB 또는 테이블에 원하는 필드 및, 필드값(예를 들면 출원인 명의로서 "삼성전자주식회사" 등)를 지정하면, DBMS는 입력받은 쿼리에 대응되는 질의 결과를 출력하게 된다. 이와 같은 방법으로 출원인 명의 단위 문건 집합을 생성하게 된다.
모든 특허 문건에는 그 문건을 식별할 수 있는 문건 고유 번호(Document ID)가 할당될 수 있고, 출원 번호나 등록 번호 등이 그 고유 번호가 될 수도 있으며, "국가 표시 + 출원 번호", "국가 표시 + 등록 번호"가 고유 번호가 될 수도 있으며, 공개 번호 등과 같은 다른 번호 체계도 가능함은 물론이다 하겠다. 이들 번호 또는 이들 번호를 활용한 번호 또는 이들 번호와는 독립적이지만, 특정 특허 문건을 특정할 수 있는 임의의 식별 체계는 문건 고유 번호가 될 수 있다.
상기 출원인 명의 단위 문건 집합을 생성하는 것은 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진에 포함되어 있는 출원인 명의 단위 문건 집합 입수 모듈이 수행한다. 상기 출원인 명의 단위 문건 집합 입수 모듈은 검색 인덱스 또는 특허 DB에서 특정한 출원인 명의로 출원되거나 등록되어 있는 특허 문건을 상기 출원인 명의를 검색식 또는 쿼리로 하여 입수해 온다. 이때, 상기 출원인 명의 단위 문건 집합 입수 모듈이 입수한 문건은 출원인 명의 단위로 임시적인 뷰(view) 또는 물리적인 뷰(materialized view)를 생성할 수도 있으며, 상기 출원인 명의 단위의 하부에 출원인 명의 단위 문건 집합을 특정할 수 있는 출원번호나 등록 번호 등과 같은 상기 문건 고유 번호가 저장되어 있을 수 있다.
즉, 특허 문건의 자동 입수는 검색 엔진을 통해서도 가능하지만 DB 쿼리를 통해서도 가능하다. 검색 엔진으로 처리하는 방법은 검색식에 출원인 또는 출원인 식별 코드를 입력하는 방법으로 처리 될 수 있다. 물론, 이 경우에는 검색 인덱스에 출원인 또는 출원인 식별 코드가 인덱스에 포함되어 있어야 한다. DB 쿼리로 처리하는 방법은 표준 SQL문 또는 기타 이에 대응되는 쿼리문으로 출원인 또는 출원인 식별 코드를 DBMS에 질의하는 방식으로 수행될 수 있다. 물론, 이 때에도 상기 특허 정보 데이터에 출원인 또는 출원인 식별 코드가 포함되어 있어야 한다. 즉, 출원인 명의 단위 문건 집합 입수 모듈은 출원인 또는 출원인 식별 코드를 입수받고, 상기 입수받은 출원인 또는 출원인 식별 코드를 검색 엔진 또는 DBMS에 질의하는 방식으로 상기 출원인 또는 출원인 식별 코드에 대응되는 특허 문건에 대응되는 출원 번호 등의 문건 고유 번호를 입수한다. 문건 고유 번호가 확정되면, 상기 문건 고유 번호에 대응되는 특허 문건을 입수할 수 있게 된다.
국가별 문건 입수
상기 출원인 명의 단위 문건 집합 입수 모듈이 상기 특허 문건을 입수하는 방법은 각 국가별로 진행되는 것이 바람직하다. 이를 위해서 각 국가별로 상기 출원인 식별 코드를 통일시켜 놓았을 경우(출원인 대표명화를 제1국 기준으로뿐만 아니라, 적어도 하나 이상의 제 2국 기준으로도 대표명화를 시키고, 상기 제 1국의 출원인과 제 2국의 출원인이 동일한 주체일 경우에는 동일한 출원인 식별 코드를 할당할 수 있다. 출원인은 제1국 기준 또는 제2국 기준 중 적어도 어느 하나 이상으로 대표명화가 되어 있는 것이 바람직하다.(본 명세서에는 출원인 대표명화를 하는 방법에 대해서도 기술할 것이다.) 대표명화가 되면, 출원인 식별 코드 vs. 제1 국에서의 출원인 명의 표시 vs 제2국에서의 출원인 명의 표시 vs 제 n국에서의 출원인 명의 표시에 대한 대응 관계가 도출되게 된다. 물론, 제 i국에서의 출원인 명의 표시는 복수개가 될 수 있는데, 상기 복수개의 출원인 명의 표시는 출원인 대표명화의 과정에서 도출되게 되며, 상기 제 i국에서의 복수개의 출원인 명의 표시는 단일한 제 i국에서의 출원인 명의 표시로 각 국가 단위에서 대표명화를 시켜 놓을 수 있다.
그러므로, 상기 검색 엔진 또는 상기 DBMS에 출원인 명의 또는 출원인 식별 코드의 입력 만으로 각 국가별 검색 인덱스 또는 각 국가별 특허 정보 데이터 또는 전체 특허 정보 데이터에서 상기 출원인 식별 코드에 대응되는 특허 문건을 입수할 수 있을 것이다.
상기 제1국과 제2국에서 출원인 대표명화를 시켜 놓지 않은 경우라면, 상기 국가별로의 특허 문건 입수 방법은 1) 조약 우선권 주장 번호를 이용하는 방법 2) 각 국가별 표기 방식으로 표기되는 상기 출원인 명의를 이용하는 방법이 있을 수 있다. 특히 후자에서 오류의 개수를 줄이기 위해서 주식회사, 가이시키 가뷰사, co., ltd, 등과 같이 식별력 없는 구성 요소는 제외되면서 실시되는 것이 바람직하다. 이에 대해서는 출원인 대표명화 방법에서 상세히 설명한다.
상기와 같은 방법을 통하여 각 국가 단위로 또는 국가 통합 단위로 특정한 출원인 단위에서 관리되어야 되는 특허 문건 집합이 1차적으로 결정나게 된다. 상기 출원인 명의 단위 문건 집합 입수 모듈이 입수한 특허 문건 집합은 출원인 명의 단위 문건 집합 데이터의 형태로 관리 된다. 상기 출원인 명의 단위 문건 집합 데 이터는 DBMS적 관점에서 임시적인 데이터 형태로 저장될 수도 있지만, 출원인 명의 밑에 상기 출원인 명의 단위 문건 집합 데이터를 구성하는 문건 고유 번호를 저장하는 방식으로도 저장될 수 있다. 이때, 임시적인 데이터 형태로 저장되는 방법으로는 통상적인 뷰(view)로 저장될 수 있다. 또한, 상기 출원인 명의 단위 문건 집합 데이터는 최신 DBMS가 지원하는 materialized view로 저장될 수 있으며, 영구적인 방식으로 테이블로 저장될 수도 있다. 상기 출원인 명의 단위 문건 집합 데이터가 어떤 형태로 저장되든지, DBMS가 지원하는 join 등의 명령에 의해, 상기 출원인 명의 단위 문건 집합 데이터는 사용자가 필요로 하는 정보를 포함하는 시각적인 view를 제공해 줄 수 있다. 상기 출원인 명의 단위 문건 집합 데이터에는 상기 각 특허 문건에 접근할 수 있는 문건 고유 번호가 필수적으로 포함되어 있어야 하며, 상기 문건 고유 번호 이외에 상기 출원인 명의 단위 특허 문건에 대한 전체 데이터에서 선택되는 정보가 더 포함되어 있을 수 있다. 상기 생성된 출원인 명의 단위 문건 집합은 출원인 명의 단위 문건 집합 관리 모듈이 관리하게 된다.
문건 관리
상기 출원인 명의 단위 문건 집합 관리 모듈의 상기 특허 문건에 대한 관리는 CRUD(생성 create, 읽기 read, 업데이트 update, 삭제 delete)를 포함한다. 상기 생성, 읽기, 업데이트, 삭제 등의 관리는 상기 문건에 대한 접근 권한에 따라 상기 4가지 관리 기능 중 적어도 하나 이상이 기능이 수행되는 방식으로 관리된다. 상기 출원인 명의 단위 관리 모듈을 통하여 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 사실과 다른 잘못된 레코드(record) 또는 문건 고유 번호를 삭제할 수 있으며, 특정한 레코드 또는 문건 고유 번호를 추가할 수 있으며, 문건 고유 번호에 대응되는 내용 정보 중 변동되거나 수정된 것은 그 변동 또는 수정 사항을 반영할 수 있다. 상기와 같은 삭제, 추가, 또는 업데이트가 필요한 이유는 특허 문건의 입수 시점과 현재 시점 간에서 특정한 특허 문건에 대한 정보에 변경이 있을 수 있기 때문이다. 상기 변경의 예로는 1) 출원 중 또는 등록 후에서의 양도 양수를 통한 명의 변경, 2) 발명자나 출원인 명의 정보의 수정(합병, 회사 명칭의 변경, 주소 변경, 출원인 또는 발명자의 추가나 감축 등을 포함한다), 3) 특허 분류 기호의 수정, 4) 특허 명세서의 보정 등 특허 명세서 상의 내용에서 변경이 있는 경우 이에 대한 반영, 5) 외국 출원, 분할 출원 등과 같은 패밀리의 증가나 감축 등을 들 수 있다.
상기와 같은 과정을 통하여, 특정한 출원인 명의 단위에 속하는 특허 문건 부분 집합을 추출할 수 있게 되고, 상기 특허 문건 부분 집합을 관리 대상 문건으로 하는 출원인 명의 단위 특허 정보 서비스 시스템이 생성될 수 있게 된다.
도 76은 출원인 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
상기 관리 모듈은 출원인 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2620), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2630), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2640), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2650), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2660), 입수된 변동 사항을 저장한다(S2670).
도 77은 발명자 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
상기 관리 모듈은 발명자 명의 단위 특허 정보 서비스 시스템에 관한 관리 권한을 가진 관리자의 접속을 허용하고(S2720), 관리자에 의한 관리 대상 특허 문건 집합에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고 (S2730), 관리자에 의한 발명자 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2740), 관리자에 의한 제2의 출원인 명의 단위 특허 정보 서비스 시스템에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하고(S2750), 관리자에 의한 출원인 명의 단위 특허 정보 서비스 시스템에서 제공하는 서비스에 대한 변동 사항이 있을 경우 그 변동 사항을 입수하며(S2760), 입수된 변동 사항을 저장한다(S2770).
발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진
구성
출원인 명의 단위의 특허 문건 집합이 결정이 되면, 상기 특허 문건 집합에 포함되 어 있는 적어도 하나 이상의 발명자를 추출할 수 있게 되고, 추출된 발명자는 발명자 목록 데이터로 관리 된다. 상기와 같은 발명자의 추출 및 상기 발명자 목록 데이터를 생성하고 관리하는 것은 발명자 명의 추출 모듈이 수행하게 된다.
상기 출원인 명의 정보와 상기 발명자 목록 데이터의 발명자 정보를 기반으로 하여 적어도 하나 이상의 개별 발명자 단위의 문건 집합을 입수할 수 있게 된다. 상기 발명자 단위 문건 집합을 입수하는 것은 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진에 포함된 발명자 명의 단위 문건 집합 입수 모듈이 수행하게 된다. 상기 발명자 명의 단위 문건 집합 입수 모듈은, 상기 출원인 명의 단위의 특허 문건 집합으로부터 그 특허 문건과 관련된 발명자 목록을 활용하여, 상기 발명자 단위로 상기 출원인 명의 단위 특허 문건 집합의 부분 집합인 발명자 명의 단위 특허 문건 집합을 생성하게 된다. 상기 생성된 발명자 명의 단위 문건 집합은 발명자 명의 단위 문건 집합 관리 모듈이 관리하게 된다.
발명자 목록 및 식별 코드
상기 출원인 명의 단위의 특허 문건 집합이 특정/결정 되게 되면, 상기 특허 문건 집합의 서지 사항을 모두 입수한 다음, 상기 서지 사항 중 발명자 필드의 모든 정보를 입수할 수 있게 된다. 상기 발명자 정보를 입수하는 과정에서 상기 특허 문건 집합과 관련된 발명자의 전체 목록을 알 수 있게 되고, 상기 발명자 전체 목록에 포함된 각 발명자에 발명자 식별 코드를 생성하여 부여할 수 있다.
발명자별 문건 추출
발명자 명의 추출 모듈이 생성한 발명자 전체 목록이 있을 경우, 상기 발명 자와 상기 발명자가 발명자로 등재되어 있는 특허 문건 부분 집합을 추출하는 구체적인 방법으로 다음과 같은 3가지 방법이 예시적으로 채택될 수 있다. 첫째, 검색 엔진을 이용하는 것으로서, 검색식에 "출원인 또는 출원인 식별 코드"과 "개별 발명자 이름"을 and 조건으로 검색하는 방법이다. 둘째는, DBMS를 이용하는 것으로써, SQL쿼리문에 "출원인 또는 출원인 식별 코드"과 "개별 발명자 이름"을 and 조건으로 질의하는 방법이다. 셋째는 상기 출원인 명의 단위 문건 집합에서 발명자 목록을 생성할 때, 출원번호 등의 문건 고유 번호와 발명자의 대응 관계(개별 특허 문건 마다 1:n 관계)가 생성되므로, 상기 대응 관계의 누적을 통해서, 역으로 "발명자 vs 발명자자 포함된 특허 문건 집합의 문건 고유 번호" 관계를 생성해 내는 것이다. 상기와 같은 대응 과정이 상기 특허 문건 집합 전체에 대해서 이루어 지면, 상기 발명자 식별 코드와 대응되는 적어도 하나 이상의 특허 문건 부분 집합이 추출할 수 있게 된다. 상기와 같은 3가지 방법 중 어느 하나 이상의 방법을 통해, 특정한 한 발명자가 발명자로 등재되어 있는 적어도 하나 이상의 특허 문건 부분 집합이 1차적으로 결정나게 되며, 상기 발명자 단위로 결정되는 특허 문건 부분 집합은 상기 발명자 단위 문건 DB 생성 모듈에 의해 발명자 단위 문건 DB에 저장된다.
도 66은 전체 출원인 명의 특허 정보 데이터에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서 비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S1620 ), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진 또는 DB 질의를 통하여 검색하며( S1630 ), 출원인 명의로 출원되거나 등록된 문건이 있는 가를 판단한( S1640 ) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한다( S1650 ). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며( S1660 ), 상기 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S1670 ). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.
도 67은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 출원인 명의 단위 특허 정보 데이터에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고( S1720 ), 목록에 있는 개별 출원 명의인 정보를 입수하며( S1730 ), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고( S1740 ), 문건이 있는 가를 판단하고( S1750 ) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S1760 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고( S1770 ), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며( S1780 ), 상기와 같은 과정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인이 있는가를 판단한( S1790 ), 다음 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.
도 68은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 출원인 명의 단위 특허 정보 데이터에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원인 명의 단위 특허 정보 서비스 시스템 생성을 위한 문건 집합을 입수하고( S1820 ), 상기 문건 집합에서 출원 명의인을 추출하고 출원 명의인 목록 정보를 생성한다( S1830 )
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 목록 정보를 입수하고 목록에 있는 개별 출원 명의인 정보를 입수하며( S1840 ), 입수된 개별 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검 색하고( S1750 ), 문건이 있는 가를 판단한( S1860 ) 다음 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 개별 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S1870 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고( S1880 ), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며( S1890 ), 상기와 같은 과정을 상기 입수받은 출원 명의인 목록에 처리하지 않은 출원 명의인 있는지를 판단하고( S1891 ) 없을 때까지 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성과 발명자 명의 단위 특허 정보 서비스 시스템 생성을 반복한다.
도 69은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 출원인 명의 단위 특허 정보 데이터에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 외부의 제3자로부터 입수하고( S1920 ), 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색 엔진 또는 DB질의를 통하여 검색하며( S1930 ), 출원인 명의로 출원되거나 등록된 문건이 있는가를 판단하고( S1940 ) 있는 경우, 검색된 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성한다( S1950 ). 이어, 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며( S1960 ), 상기 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S1970 ). 만약 문건이 없다면 출원인 명의 단위 특허 정보 서비스 시스템을 생성하지 않는다.
상기 도 66 내지 도 69의 방법은 개별 국가를 특정하지 않거나, 개별 국가를 특정하는 경우나 모두 적용될 수 있을 것이다. 만약 개별 국가를 특정하지 않는 경우라면 출원인 대표명화가 전제되어야 할 것임은 분명하다 할 것이다.(특히 언어가 다른 국가일 경우에는 더욱 그러할 것이다.)
도 70은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 출원인 명의 단위 특허 정보 데이터를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 66 내지 도 69의 방법은 모두 적용될 수 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S2020 ), 국가 목록을 입수하며( S2030 ), 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하고( S2040 ), 문건이 있는 지 판단하고( S2050 ) 없는 경우에는 국가 단위에서 완료하며, 있는 경우에는 국가 단위에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2060 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 국가 단위에서 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며( S2070 ), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 국가 단위의 발명자 명의 단위 특허 정보 서비스 시스템을 생성하며( S2080 ) 국가 목록에 처리하지 않은 국가가 있는가를 판단하여( S2090 ) 없는 경우 완료하고, 있는 경우에는 입수된 국가 목록에서 개별 국가 단위로 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는( S2040 ) 단계를 다시 수행한다.
도 71은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S2120 ), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며( S2130 ), 문건이 있는가를 판단한( S240 ) 다음, 없으면 제 1국에서 완료하고 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고( S2150 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며( S2160 ), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한 다( S2170 ) 이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하며( S2180 ), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고( S2190 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며( S2191 ), 제 2국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2193 ),
도 72는 우선권 주장 번호를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S2220 ), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하는 단계( S2230 ), 문건이 있는지를 판단하며( S2240 ) 없는 경우 제 1국에서 완료하며, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2250 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고( S2260 ), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문 건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2270 ).
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고( S2280 ), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2290 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고( S2291 ), 제 2국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2293 ).
도 73은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S2320 ), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며( S2330 ), 문건이 있는가를 판단하고( S2340 ), 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고( S2350 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명 자를 추출하고, 발명자별로 특허 문건을 대응시키고( S2360 ), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2370 ),
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호를 기준으로 하는 제2국에서의 패밀리 특허 번호를 입수하고( S2380 ), 제2국에서의 패밀리 특허 번호로 입수될 수 있는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2390 ), 제2국에서 입수되는 특허 문건을 패밀리 특허 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하며( S2391 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2393 ).
도 74는 패밀리 정보 및 우선권 주장 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 출원 명의인 정보를 입수하고( S2420 ), 제1국에서 입수된 출원 명의인의 명의로 출원되거나 등록된 특허 문건을 검색하며( S2403 ), 문건이 있는가를 판단한( S2440 ) 다음, 있는 경우 제1국에서 검색된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2450 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제1국에서 검색된 특허 문건 집합에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키고( S2460 ), 제1국에서 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2470 ).
이어, 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 제 1국에서 검색된 특허 문건의 특허 출원 번호 목록을 대상으로 하여 그 번호들을 제2국에서의 우선권 주장 번호에서 검색하고( S2480 ), 제2국에서의 검색되는 특허 문건을 관리 대상 문건 집합으로 하는 제 2국에서의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하며( S2490 ), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 제2국에서 입수되는 특허 문건을 우선권 주장 번호를 매개로 하여 제 1국에서 검색된 특허 출원 번호를 기준으로 하는 제1국 기준 발명자 명의 단위 특허 정보 서비스 시스템에 통합하고( S2491 ), 통합된 제2국에서 입수되는 특허 문건을 관리 대상 문건 집합으로 하는 제2국 기준 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다( S2493 ).
문제 해결 - 동명 이인
하나의 출원인이 대기업일 경우, 동일한 이름을 사용하는 다른 발명자(동명이인)이 있을 수 있는데, 이 경우에는 주소 정보를 활용하여 양자를 구분시킬 수 있다. 또한, 상기 출원인 명의 단위의 특허 문건 입수와 마찬가지로 상기와 같은 발명자 단위의 특허 문건의 입수 방법은 각 국가별로 진행되는 것이 바람직하다. 이때, 국가별로 발명자 단위의 특허 문건 입수는 1) 출원인 대표명화 또는 발명자 대표명화가 되어 있는 경우에는 각 국가별로 대표명화 된 정보를 통해서 찾는 방법, 2) 대표명화가 되어 있지 않은 경우에는 조약 우선권 주장 번호를 통해서 이루어 지는 것이 바람직하다. 즉, 조약 우선권 주장 번호를 통해서 제 1국의 출원과 관련된 제 2국의 출원의 동일성 내지 대응성을 찾아내고, 동일성 내지 대등성이 인정되는 양 국가의 출원에서 발명자는 동일하게 취급하는 방법을 채택할 수 있다.
문건 관리
상기 발명자 명의 단위 문건 집합 관리 모듈의 상기 특허 문건에 대한 관리 내용은 크게, 삭제, 추가 또는 업데이트(변동 사항 반영 또는 수정을 포함한다) 중 어느 하나 이상일 수 있다. 상기 발명자 명의 단위 문건 집합 관리 모듈을 통하여 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자(상기 관리자는 발명자 자체일 수도 있지만, 다른 제3자일 수도 있다)는 사실과 다른 잘못된 레코드(record) 또는 문건 고유 번호를 삭제할 수 있으며, 특정한 레코드 또는 문건 고유 번호를 추가할 수 있으며, 문건 고유 번호에 대응되는 내용 정보 중 변동되거나 수정된 것은 그 변동 또는 수정 사항을 반영할 수 있다. 상기와 같은 삭제, 추가, 또는 업데이트가 필요한 이유는 특허 문건의 입수 시점과 현재 시점 간에서 특정한 특허 문건에 대한 정보에 변경이 있을 수 있기 때문이다. 상기 변경의 예로는 1) 출원 중 또는 등록 후에서의 양도 양수를 통한 명의 변경, 2) 발명자나 출원인 명의 정보의 수정(합병, 회사 명칭의 변경, 주소 변경, 출원인 또는 발명자의 추가나 감축 등을 포함한다.), 3) 특허 분류 기호의 수정, 4) 특허 명세서의 보정 등 특허 명세서 상의 내용에서 변경이 있는 경우 이에 대한 반영, 5) 외국 출원, 분할 출원 등과 같은 패밀리의 증가나 감축 등을 들 수 있다.
상기와 같은 과정을 통하여, 특정한 출원인 명의 단위에 속하는 특정한 발명자 단위로 상기 발명자가 발명자로 등재된 특허 문건 부분 집합을 추출할 수 있게 되고, 상기 특허 문건 부분 집합을 관리 대상 문건으로 하는 발명자 명의 단위 특허 정보 서비스 시스템이 생성될 수 있게 된다.
도 75는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.
상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 입수하고(S2620), 신규 특허 문건에서 출원인 정보를 추출하며(S2630), 출원인 정보로 된 기존 출원인 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한다(S2640).
판단 결과 있는 경우에는 기존 출원인 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2650), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 발명자 정보를 추출하고(S2660), 기존 출원인 명의 단위 특허 정보 서비스 시스템 하부에 발명자 정보로 된 기존 발명자 명의 단위 특허 정보 서비스 시스템이 있는가를 판단한(S2680) 다음, 있는 경우 기존 발명자 명의 단위 특허 정보 서비스 시스템에 신규 특허 문건 정보를 추가하며(S2690), 없는 경우 발명자 정보를 기준으로 발명자 명의 단위 특허 정보 서비스 시스템을 생성하 고, 신규 특허 문건 정보를 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2699).
한편, 출원인 정보로 된 기존 출원인 명의 특허 정보 서비스 시스템이 없는 경우에는 상기 출원 명의인 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건을 관리 대상 문건 집합으로 하는 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고(S2693), 이어 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 신규 특허 문건에서 발명자를 추출하고, 발명자별로 특허 문건을 대응시키며(S2695), 추출된 발명자별로 대응된 특허 문건을 관리 대상 문건 집합으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성한다(S2697).
출원인 명의 단위 또는 발명자 명의 단위 분석
본 발명의 분석 모듈에 세팅되는 적어도 하나 이상의 분석 알고리즘은 출원인 명의 단위 특허 정보 서비스 시스템 및/또는 발명자 명의 단위 특허 정보 서비스 시스템에 사전에 세팅이 되어 있는 것이 특징이다. 즉, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때, 또는 생성 이후라도 사용자의 개입 없이, 상기 출원인 명의 단위에서 필요한 분석 알고리즘 또는 상기 발명자 명의 단위에서 필요한 분석 알고리즘이 자동으로 세팅되어 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 분석 서비스를 구성하게 된다. 상기 분석 알고리즘의 실행은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템을 생성할 때에 실행되어 그 분석 결과를 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 사전에 갖고 있는 것이 바람직하다. 하지만, 상기 분석 알고리즘의 실행 속도가 빠르거나, 실시간 또는 사용자에게 기다림을 주지 않을 정도로 빠른 경우, 상기 분석 알고리즘은 상기 분석 주제에 대하여 외부로부터의 접근(관리자 또는 사용자의 클릭 등)이 있을 때 실행될 수도 있을 것이다. 그러므로, 적어도 2 이상의 분석 알고리즘으로 분석 모듈이 구성될 때, 상기 분석 주제 및 그에 따르는 분석 알고리즘은 사전에 세팅되며 그 실행 시점은 다를 수 있을 것이다.
상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 발명자 명의 단위 특허 정보 서비스 시스템에서 분석 서비스가 사전에 세팅되는 것에 대해 더욱 상세하게 설명한다. 상기 분석 서비스는 분석의 대상이 되는 문건 집합과 상기 문건 집합에 대해 어떤 분석을 수행할 것인가에 대한 분석 주제의 선택 및 상기 분석 주제에 대응되는 분석 알고리즘으로 구성된다. 이때, 상기 분석 주제의 선택과 상기 분석 알고리즘은 본 발명의 분석 시스템에 준비되어 있기 때문에, 상기 분석 알고리즘을 실행할 구체적인 분석 대상 문건 집합이 특정되어야 한다. 그런데, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 생성 단계에서 이미 상기 문건 집합이 특정되게 되므로, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합을 분석의 대상으로 하여, 기설정된 적어도 하나 이상의 분석 주제에 대해서 분석을 자동적으로 수행할 수 있게 된다.
이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단 위 특허 정보 서비스 시스템이 관리하는 문건이 클러스터링 되어 있을 경우, 상기 클러스터링 된 부분 문건 집합에 대해서 기설정된 분석 주제에 대한 기설정된 분석 알고리즘을 수행할 수 있다.
또한, 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합 전체 또는 클러스터링 된 부분 문건 집합을 대상으로 하여 최빈 IPC(특허 분류 기호 등), 최대 집중 분야, AI 최대 분야 등과 같은 각종 통계 또는 분석 결과를 1차적 또는 2차적으로 생성해 낼 수 있고, 상기 각종 통계 또는 분석 결과를 대상으로 한 분석 주제별 분석 알고리즘이 세팅될 수 있다. 예를 들면, 특정 출원인 명의 단위 특허 정보 서비스 시스템의 관리 문건 집합을 대상으로 하여 1차적으로 IPC 서브클래스 또는 그룹 단위에서 최빈 IPC를 추출해 내고, 2차적으로 상기 최빈 IPC를 대상으로, 상기 최빈 IPC에 대한 국내외별 최다 출원인을 추출해 내고, 3차적으로 상기 출원인별 연도별 출원수를 분석 결과로 출력해 내고, 4차적으로 상기 출원인별 상기 IPC에 대한 집중율과 점유율의 연도별 분석 결과를 생성해 줄 수 있을 것이다. 상기 예와 같이, 2개 이상이 분석이 결합하고, 직전 분석의 결과를 직후 분석의 재료로 사용할 수 있을 것이다.
상기 분석의 결과는 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템이 관리하는 문건 집합 단위로 또는 문건 집합의 부분 문건 집합 단위로 사용자의 입력 없이도 사전에 생성되어 있을 수 있게 된다. 상기 분석 대상이 되는 문건 집합의 크기 및 분석 알고리즘마다 분석 수 행 시간이 차이가 있을 수 있으므로, 상기 본 발명의 적어도 하나 이상의 분석 알고리즘의 수행은 상기 출원인 명의 단위 특허 정보 서비스 시스템 또는 상기 발명자 명의 단위 특허 정보 서비스 시스템의 생성 시점에 수행될 수도 있고(분석 대상 문건 집합이 작거나, 분석 알고리즘 수행 시간이 적게 걸리는 분석 주제인 경우), 상기 특허 정보 서비스 시스템의 생성 후에 수행 될 수도 있다. 이때, 특허 정보는 매일 또는 기설정된 기간 단위로 업데이트 되고, 신규 문건이 계속하여 발생하기 때문에, 본 발명의 상기 분석의 수행은 기설정된 기간 단위로 자동으로 수행되는 것이 바람직하다.
상기 출원인 명의 단위가 관리하고 있는 특허 문건 집합은 크게 1) 자사 관련 특허 문건 집합, 2) 타사 관련 문건 집합(예를 들면, 하나의 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 그 하부에 자신이 아닌 타 기업(경쟁사 등)의 출원인 명의 단위 특허 정보 서비스 시스템을 가지고 있을 수 있다.), 3) 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 관리하는 특허 문건 집합 중의 적어도 어느 하나 이상의 부분 집합(상기 관리자의 기준에 의해 클러스터링 내지 그룹핑된 특허 문건 집합을 예로 들 수 있다)을 대상으로 상기에서 설명한 모든 분석 중에서 적어도 하나 이상의 분석을 수행할 수 있으며, 상기 분석 수행의 결과를 입력값으로 하여 다시 적어도 하나 이상의 분석을 수행할 수 있게 된다.
출원인 명의 단위 vs 발명자 명의 단위 특허 정보 서비스 시스템 관계
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템과 발명자 명의 단위 특허 정보 서비스 시스템의 관계에 대해서 더욱 상세하게 설명한다. 상기 출원인 명의 단위 특허 정보 서비스 시스템에는 그 하부에 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 생성되어 있을 수 있다. 발명자 명의 단위 특허 정보 서비스 시스템의 개수는 상기 출원인 명의로 출원되거나 등록된 특허 문건에 포함되어 있는 발명자의 전체 수보다 적거나 같은 것이 바람직하다.
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템의 관리적인 측면에 대해서 상술한다.
첫째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 권한 설정이 가능할 것이다. 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자에 의한 권한 설정은 상기 출원인 명의 단위 특허 정보 서비스 시스템의 하부에 존재하는 특정한 발명자 단위의 특허 정보 서비스 시스템에 대한 접근 권한 관리를 포함한다. 일례로, 상기 특정한 발명자가 자신의 조직에 속해 있는 경우, 그 발명자 단위 특허 정보 서비스 시스템에 대한 접속 권한을 상기 발명자에게 부여할 수 있을 것이다. 출원인 명의 단위 특허 정보 서비스 시스템 관리자의 입장에서, 자신의 조직에 속해 있던 발명자가 퇴사를 하는 경우, 그 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 유지할 필요가 없게 된다. 이 경우 1) 상기 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 삭제해 버리는 방법, 2) 상기 재입사 등을 대비하여, 발명자의 접근 권한을 없애는 것(ID 삭제, PW의 변경 등으로) 등의 방법이 채용될 수 있다.
둘째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 삭제가 가능할 것이다. 삭제가 발 생하는 경우에는 상기 발명자로 1차 결정된 사람이 자신의 소속이 아니거나, 관리의 필요성이 없을 경우에 발생한다. 특정한 특허 출원에 등재되는 발명자는 출원인 조직 소속인 경우가 다수 있지만, 그렇지 않은 경우도 자주 발생한다. 이때, 출원인 조직 소속이 아닌 발명자에 대한 발명자 명의 단위 특허 정보 서비스 시스템도 생성되게 되므로, 이를 삭제할 필요가 있게 된다. 물론, 출원인과의 공동 연구 수행 등 특별한 이유로 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 이들 출원인 조직 소속이 아닌 발명자의 발명자 명의 단위 특허 정보 서비스 시스템에 대한 접속을 허용할 수도 있을 것이다.
셋째, 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 발명자 명의 단위 특허 정보 서비스 시스템 자체에 대한 추가 및 업데이트가 가능할 것이다. 상기 추가란 상기 발명자 명의 단위 특허 정보 서비스 시스템의 추가적인 생성을 말한다. 적어도 하나 이상의 발명자 명의 단위 특허 정보 서비스 시스템이 생성된 이후, 신규 발생되는 문건에 최초로 등재되는 발명자가 생기는 경우로 상기 최초로 등재되는 발명자를 대상으로 하는 상기 신규 문건을 관리 대상 문건으로 하는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하면 될 것이다.
넷째, 특허 문건의 업데이트가 될 경우, 상기 신규로 업데이트 되는 특허 문건을 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리 대상에 상기 신규로 업데이트 되는 특허 문건이 추가될 수 있고, 상기 업데이트 되는 특허 문건에 포함된 발명자의 경우, 상기 발명자 단위의 특허 정보 서비스 시스템에 상기 신규 특허 문건이 관리 대상으로 추가 될 수 있다. 물론, 상기 업데이트 중에서는 소멸도 포 함되며, 소멸되는 경우, 기존에 있는 특허 문건을 관리 대상에서 삭제하든지, 아니면 그 특허 문건에 소멸 표시를 할 수도 있을 것이다.
공개문건으로부터의 제작 시의 문제점(공개 정보 vs 자체 정보)
이하, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 공개 특허 문건으로 제작할 경우에 따르는 문제점 및 그 해결 방안에 대해 설명한다. 통상적으로 특허 출원이 있는 경우, 출원일 이후 1년 6개월 이후 또는 등록 시에는 강제 공개되며, 그 전이라도 출원인의 의사 표시에 의해 공개될 수 있다. 공개되는 특허 문건은 외부에서도 입수 가능하다. 다만, 한 출원인 입장에서는 자신은 특정한 출원 번호의 특허 문건이 출원되었다는 사실을 알고 있지만, 아직 공개 전일 경우, 외부에서 입수되는 특허 정보를 기반으로 해서는 상기 미공개 특허 문건을 관리 대상으로 반영시키지 못하는 문제가 있을 수 있다. 이때는 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자가 상기 미공개 특허 문건에 관한 정보를 상기 출원인 명의 단위 특허 정보 서비스 시스템에 포함시키는 방법이 고려될 수 있다. 상기 미공개 특허 문건에 관한 정보는 보안 등의 이유로 공개 문건에 관한 정보보다 적은 것이 바람직하다. 상기 미공개 특허 문건에 관한 정보 중 상기 출원인 명의 단위 특허 정보 서비스 시스템에 포함시키는 정보의 일례로는 출원번호, 발명자, 출원일 등이 될 수 있으며, 발명의 명칭 및 기타 관리를 위한 정보 등이 포함될 수도 있다. 이때, 상기 미공개 특허 문건에 관한 정보 중 발명자 정보가 포함되어 있을 경우에는 상기 미공개 출원 번호를 상기 발명자의 발명자 명의 단위 특허 정보 서비스 시스템의 관리 대상 문건으로 포함시켜 놓을 수 있다. 그리고, 일정 시간이 지난 후 상기 미공개 특허 문건이 공개되는 경우, 상기 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및/또는 상기 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진은 상기 출원 번호를 키(key) 값으로 하여 공개된 특허 정보로 상기 미공개 특허 문건에 대응되는 특허 문건 정보를 업데이트 할 수 있다.
다단 계층 특허 정보 서비스 시스템 관리
관리 모듈
이하, 상기 관리 모듈에 포함된 다단 계층 관리 모듈에 대해서 설명한다. 먼저 다단 계층 관리의 문제가 발생하는 상황에 대해 설명한다. 하나의 출원인이 상당히 많은 수의 발명자가 소속되어 있을 경우, 상기 발명자가 적어도 하나 이상의 계층적 조직에 속할 수 있다. 예를 들어 설명하면, 한 사람의 발명자는 a1팀<a부서<A1계열<A회사<alpha그룹에 소속될 수 있을 것이다. 그러므로, 관리적인 측면에서는 a1팀은 상기 발명자 단위의 특허 정보 서비스 시스템 및 a1팀과 관련된 특허 문건을 그 관리 대상으로 하는 것이 당연할 것이며, a부서는 a1 내지 an까지의 각 부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 관리의 대상으로 하는 것이, A1계열은 a부서부터 z부서에 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을 까지를, A회사는 A1계열부터 AM계열까지의 관련된 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건을, alpha그룹은 A회사부터 Z회사까지의 출원인 명의 단위 특허 정보 서비스 시스템, 발명자 명의 단위 특허 정보 서비스 시스템 및/또는 특허 문건 등을 관리하여 할 것이다. 하지만, 공개되는 문건에서 입수할 수 있는 정보는 발명자 명의와 회사 명의뿐인 경우가 대부분이므로(즉, 특허 문건에는 출원인 정보 이외에 그 발명자가 소속된 집단에 관한 정보는 없는 것이 통상이다), 각 단계의 관리자 및/또는 최고 단계의 관리자가 특정 특허 문건이 어디에 소속되어야 되는지에 대한 정리를 해 줄 필요가 있게 된다. 상기 특허 정보 서비스 시스템은 관리될 특허 문건을 통해서 생성되기 때문에, 상기 특허 문건이 어느 발명자, 어느 팀, 어느 부서, 어느 계열, 어느 회사에 대응되는지에 대한 소속 정보가 있을 경우, 상기 소속 정보를 통해서 특허 정보 서비스 시스템을 생성할 수 있게 된다. 상기 소속 정보를 정하기 위해서 특허 문건과 발명자, 회사에 관한 정보는 특허 문건 자체에서 입수할 수 있다. 그러므로, 상기 발명자가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 알거나, 상기 문건 자체가 어느 팀, 어느 부서, 어느 계열, 어느 회사에 속하는지를 아는 등, 상기 소속 정보를 대응시키는 임의의 수단에 의해, 상기 특허 문건이 소속되는 집단이 결정될 수 있다.
생성 방법
이 경우, 상기 다단 계층의 특허 정보 서비스 시스템이 생성되는 방법은 다음 2가지 중 어느 한가지 방법 이상을 취할 수 있다. 첫번째는 발명자 단위의 특허 정보 서비스 시스템을 생성한 다음, 상기 발명자 명의 단위 특허 정보 서비스 시스템을 발명자가 속하는 팀단위로 통합하고, 각 팀 단위의 특허 정보 서비스 시스템을 부서 단위로 통합하고, 각 부서 단위의 특허 정보 서비스 시스템을 각 계열 단위로 통합하고, 각 계열 단위의 특허 정보 서비스 시스템을 회사 단위로 통합하고, 각 회사 단위의 특허 정보 서비스 시스템을 그룹 단위에서 계층적으로 통합하고, 각 계층 단위에서 각 계층의 특허 정보 서비스 시스템을 관리하는 방법이다. 통합은 물리적 통합과 메타적 통합이 있을 수 있는데, 물리적 통합은 각 계층이 독립된 데이터를 가지는 것을 말하며, 메타적 통합은 상위 계층의 특허 정보 서비스 시스템은 하위 계층의 특허 정보 서비스 시스템의 메타 정보만을 가지고 있는 것을 말한다. 물리적 통합을 예를 들어 설명하면, a1팀 소속도 그 소속 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 가지지만, a부서도 그 부서 소속의 발명자 명의 단위 특허 정보 서비스 시스템을 독자적으로 가지는 것을 말한다. 메타적 통합을 예로 들어 설명하면, a1팀 소속이 그 소속 발명자의 발명자 명의 단위 특허 정보 서비스 시스템을 가지며, a부서는 a1팀에 대한 관리 정보만 가지며, 자신에게만 속하는 발명자가 없는 한 발명자 명의 단위 특허 정보 서비스 시스템을 독자적으로 보유하지 않는 것을 말한다. 두번째는, 각 팀, 부서, 계열, 회사 및/또는 그룹이 자신이 관리해야 할 특허 문건을 아는 경우(특정할 수 있는 경우), 상기 특정할 수 있는 문건을 대상으로 특허 정보 서비스 시스템을 생성하는 방법이다. 이때, 상기 특정할 수 있는 문건을 대상으로 하는 특허 정보 서비스 시스템은 형식상 출원인 명의 단위의 특허 정보 서비스 시스템인 것이 바람직하다.(발명자 명의 단위 특허 정보 서비스 시스템일 수도 있지만, 각 팀, 부서, 계열, 회사 등은 발명자가 소속되어 있을 수 있으므로, 출원인 명의 단위의 특허 정보 서비스 시스템인 것이 형식상 더 좋다.) 이 경우에도 물리적 통합과 메타적 통합 중 어느 하나 이상이 채용될 수 있음은 물론이다. 또한, 상기 다단 계층의 특허 정보 서비스 시스템마다 그 관리자가 존재할 수 있으며, 상기 관리자의 관리 기능은 다단 계층 특허 정보 서비스 시스템 단위의 관리 모듈이 제공한다. 이때, 상기 다단 계층 특허 정보 서비스 시스템의 관리 시에 상위 계층 특허 정보 서비스 시스템의 관리자는 적어도 하나 이상의 하위 계층 특허 정보 서비스 시스템의 관리자에게 권한을 부여할 수 있으며, 이러한 권한 부여는 상기 상위 계층 특허 정보 서비스 시스템 단위의 관리 모듈에서 제공될 수 있다.
상기와 같은 과정을 통하여 다음과 같은 결과물이 생성될 수 있다.
첫번째, 상기 출원인 명의 단위 특허 정보 서비스 시스템은 출원인 명의 단위 수준에서 자신이 관리하는 관리 대상 문건 정보를 입수할 수 있게 된다. 상기 문건 정보는 국가 단위 및 국가 통합 단위일 수 있으며, 상기 출원인 명의 단위 특허 정보 서비스 시스템은 적어도 하나 이상의 다단 계층 출원인 명의 단위 특허 정보 서비스 시스템일 수 있다. 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 출원인 명의 단위 관리 모듈을 통해서 상기 출원인 명의 단위 특허 정보 서비스 시스템의 문건 정보 및 상기 발명자 명의 단위 특허 정보 서비스 시스템을 관리할 수 있으며, 자신의 하위 계층 특허 정보 서비스 시스템을 관리할 수도 있다.
둘째, 상기 발명자 명의 단위 특허 정보 서비스 시스템은 발명자 명의 단위 수준에서 자신이 관리하는 관리 대상 문건 정보를 입수할 수 있게 된다. 상기 문건 정보는 국가 단위 및 국가 통합 단위일 수 있다. 상기 발명자 명의 단위 특허 정보 서비스 시스템의 관리자는 상기 출원인 명의 단위 특허 정보 서비스 시스템의 관리 자로부터 권한을 부여 받은 발명자인 것이 바람직하며, 상기 발명자는 상기 발명자 명의 단위 관리 모듈을 통해서 상기 자신의 발명자 명의 단위 특허 정보 서비스 시스템의 문건 정보를 관리할 수 있게 된다.
특허 정보 시스템 배치 생성 엔진
상기는 1개의 출원인을 기준으로 한 출원인 명의 단위 특허 정보 서비스 시스템 및 상기 출원인 명의 단위 특허 정보 서비스 시스템에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템들의 생성, 운영 및 관리에 관하여 설명하였다. 이어서 복수개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 관리하는 방법에 관하여 설명한다. 2이상의 복수개의 출원인 명의 단위 특허 정보 서비스 시스템 및 이들 각각에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템들을 생성하는 것은 본 발명의 특허 정보 서비스 시스템 배치 생성 엔진이 담당한다. 상기 특허 정보 시스템 배치 생성 엔진의 구성은 도 64에 잘 나타나 있다.
출원인 명의 입수 모듈
상기 전단 특허 정보 서비스 시스템 생성 엔진이 여러 개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하기 위해서는 우선적으로 생성 대상이 되는 출원인 명의를 입수해야 할 것이다. 상기 특허 정보 서비스 시스템 생성의 대상이 되는 출원인 명의를 입수하는 기능은 본 발명의 출원인 명의 입수 모듈이 수행한다. 상기 출원인 명의 입수 모듈은 적어도 하나 이상의 출원인 명의를 목록의 형태로 입수하는 것이 바람직할 것이다. 상기 출원인 명의는 1개의 국가에 한정되지 않고, 여러 개의 국가에서 선택되는 출원인 명의일 수 있을 것이다.
개별 단위 특허 정보 시스템 생성 엔진 구동 모듈
상기 출원인 명의 목록이 입수되면, 상기 출원인 명의자 개개를 대상으로 출원인 명의 단위 특허 정보 서비스 시스템 및 상기 출원인 명의 단위 특허 정보 서비스 시스템에 종속된 발명자 명의 단위 특허 정보 서비스 시스템들을 생성하면 될 것이다. 상기 출원인 명의 목록에 나와 있는 각 출원인 명의를 대상으로 하나씩 하나씩 생성하는 역할은 본 발명의 개별 단위 특허 정보 시스템 생성 엔진 구동 모듈이 수행한다. 즉, 개별 단위 특허 정보 시스템 생성 엔진 구동 모듈은 출원인 명의 1개씩을 입수하여, 상기 특허 정보 서비스 시스템 생성 엔진을 구동시켜 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하고, 그 생성이 완료되었다는 정보를 입수하면 다른 출원 명의인에 대하여 상기 특허 정보 서비스 시스템 생성 엔진을 구동시키는 방법을 취한다.
이때, 상기 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템의 생성에서 상기 감시 서비스 및 분석 서비스에 포함되는 구체적인 감시 검색식, 분석 검색식 등은 상기 개별 단위 특허 정보 시스템 생성 엔진 구동 모듈이 구동되는 동안에 생성될 수도 있지만, 추후에 상기 개별 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템에 추가될 수도 있다.
이때, 상기 개단 특허 정보 서비스 시스템 생성 엔진 구동 모듈은 경우에 따라 상기 출원인 명의 단위 특허 정보 서비스 시스템만을 생성하고, 상기 출원인 명 의 단위 특허 정보 서비스 시스템에 종속되는 발명자 명의 단위 특허 정보 서비스 시스템을 생성하지 않도록 할 수 있다. 이 경우로는 1개의 회사가 자신의 경쟁사인 국내외의 여러 회사의 특허 정보를 조직적으로 입수하기 위하여 각 경쟁 회사마다 출원인 명의 단위 특허 정보 서비스 시스템을 생성하려고 하는 경우가 대표적일 것이다. 경쟁 회사의 발명자별 특허 활동 정보까지 알아야 할 필요가 있을 때에는 발명자 명의 단위 특허 정보 서비스 시스템까지 생성하겠지만, 그렇지 않을 경우라면 출원인 명의 단위 특허 정보 서비스 시스템만으로 충분할 것이다.
어떤 회사를 대상으로는 발명자 명의 단위 특허 정보 서비스 시스템까지 생성해야 하고, 어떤 회사를 대상으로는 출원인 명의 단위 특허 정보 서비스 시스템의 생성만으로 충분할 경우가 있다. 그러므로, 출원인 명의 목록 별로 생성의 범위에 관한 정보가 더 입수된 다음, 상기 개별 단위 특허 정보 시스템 생성 엔진 구동 모듈이 그 생성의 범위를 반영하여 작동되는 것이 바람직할 것이다.
그리고, 여러 개의 국가에서 선택되는 출원인 명의를 입수할 경우, 상기 출원인 명의 단위 특허 정보 데이터가 국가 단위로 구축되어 있을 때, 국가 단위로 개단 특허 정보 서비스 시스템을 생성할 수도 있을 것이다. 상기와 같은 상황은 배치 처리의 순서에 관한 문제이므로, 당업자라면 용이하게 구현할 수 있을 것이다.
개별 단위 특허 정보 서비스 시스템 다단 그룹화 모듈
다수의 출원인 명의 단위 특허 정보 서비스 시스템들이 생성되었을 때, 상기 특허 정보 서비스 시스템들을 출원인의 속성 등에 따라서 적어도 하나 이상의 단계를 가지면서 그룹화시킬 수 있을 것이다. 반대로 하나의 그룹 밑에 여러 개의 출원인 명 의 단위 특허 정보 서비스 시스템을 배치시킬 수 있을 것이다. 예를 들면, 제조업-자동차-타이어라는 다단 계층 구조를 가지는 그룹 밑에 (주)한국 타이어, (주)금호타이어 등의 출원인 명의 단위 특허 정보 서비스 시스템을 배치할 수 있을 것이다. 상기와 같은 그룹화는 통상의 기술자의 영역에서 용이한 것이므로, 상세한 설명은 생략한다.
개별 단위 특허 정보 시스템 관리 모듈
2 이상의 출원인 명의 단위 특허 정보 시스템이 생성되는 경우, 상기 특허 정보 서비스 시스템들이 관리될 필요가 있으며, 상기 관리는 개단 특허 정보 서비스 시스템 관리 모듈이 수행한다. 상기 개단 특허 정보 서비스 시스템 관리 모듈은 상기 출원인 명의 단위 특허 정보 서비스 시스템에 대한 인증, 권한 관리, 권한 이양, 삭제, 위치나 소속의 변경 등의 관리를 수행한다.
상기와 같이 다수의 출원인 명의 단위 특허 정보 서비스 시스템들이 생성되었을 경우, 전체 시스템적 관점에서 통합하여 관리할 필요가 있으며, 상기 통합 관리를 수행하는 것은 본 발명의 통합 관리 모듈이 수행한다. 도 65는 통합 관리 모듈의 구성의 일 실시예를 보여 주고 있는데, 상기 통합 관리 모듈에는 개별 단위 특허 정보 시스템 다단 그룹화 모듈(6100)과 개별 단위 특허 정보 시스템 관리 모듈(6300)이 있어, 개별 단위 특허 정보 서비스 시스템을 다단 그룹화하며, 상기 다단 그룹화된 특허 정보 서비스 시스템을 관리할 수 있게 된다.
출원인 단위 특허 정보 서비스 시스템의 구현예
이하, 본 발명의 출원인 단위 특허 정보 서비스 시스템의 구현예를 예로 들면서 더 욱 상세하게 설명한다.
도 120은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 대한민국의 최다 출원인 Top 500에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 대한민국이 선택되고, 그 하부 탭의 Top 500, 거래소 등록 기업, 코스닥 등록기업, 다출원 기업, 전체 기업 등에서 Top 500탭이 선택된 화면이다. 한편, 상기 국가 하위의 탭에서 대학, 공공기관, 연구소, 다출원 개인 등의 탭을 신설할 수 있음은 자명하다 할 것이다. 상기 각 출원인이 어떤 카테고리에 들어가는지에 대해서는 본 발명의 출원인 대표명화 전처리 모듈, 총량 분석용 다차원 분석용 연산 수행 결과 테이블 및 기업 정보 DB를 참조하여 결정된다. 국가별 Top 500은 상기 총량 분석용 다차원 분석용 연산 수행 결과 테이블에서 다출원/다등록 등의 분석 지표를 기준으로 하여 추출할 수 있을 것이다. 한편, 특정 출원인이 어떤 증권 거래소에 상장되었는지는 기업 정보 DB에 있는 기업 정보를 통해서 입수할 수 있다. 한편, 출원인이 기업인지 또는 대학인지 등은 출원인 대표명화 과정에서 조직 유형 정보 및/또는 기업 정보 DB에서 판정할 수 있을 것이다. 이는 다른 국가에 대해서도 동등하게 적용된다. 한편, 각 출원인 목록에는 링크가 걸려 있으며, 이 링크를 클릭하면 그 출원인의 특허 정보 서비스 시스템으로 이동한다. 이에 대해서는 도 124에 잘 설명되어 있다.
도 121은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 미국의 나스닥 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예 이다. 국가 탭에서는 미국이 선택되고, 그 하부 탭의 Top 500, NYSE(뉴욕 증권 거래소), NASDAQ, AMEX, 전체 기업 등에서 NASDAQ 선택된 화면이다. NASDAQ 등록 기업들은 다수 있으므로, ABC 순의 탭과 전체 NASDAQ기업 탭이 있다. 상기 NASDAQ 등록 기업 중에서 짙은 글씨로 되어 있는 기업은 그 기업 명의로 출원 또는 등록된 특허가 있어 그 출원인 단위로 특허 정보 서비스 시스템이 생성되어 있음을 나타낸다. 한편, 옅은 글씨로 되어 있는 것은 본 발명의 특허 문건 마스트 DB에 그 기업명으로 파악되는 출원 또는 등록된 특허가 없거나 파악되지 않아 그 출원인 단위로 특허 정보 서비스 시스템이 생성되어 있지 않음을 나타낸다. 이는 1) 그 기업 명의로 된 출원/등록이 없는 경우, 2) 기업 명칭의 표기와 출원인 명칭의 표기가 일치성이 부족하거나, 대표명화 되지 않아, 전산 시스템이 양자를 맵핑시키지 못하는 경우에 주로 발생한다. 그러므로, 옅은 글씨로 된 기업들의 개수는 출원인 대표명화의 완성도가 높아질수록 옅은 글씨로 나타나는 출원인은 줄어들게 됨은 자명할 것이다. 이하 다른 국가에 대해서도 마찬가지이다.
도 122은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 일본의 JASDAQ 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 일본이 선택되고, 그 하부 탭의 Top 500, JP1(동경증권거래소 1부 등록 기업), JP2(동경증권거래소 2부 등록 기업), JPM(MOTHERS 등록기업), JASDAQ 등록기업, 전체 기업 등에서 JASDAQ 선택된 화면이다.
도 123은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 유럽의 런던증권거래소 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 유럽이 선택되고, 그 하부 탭의 Top 500, UK1(런던증시), AIM(런던증시), OVERSEAS LISTED(런던증시 상장 외국 기업), EURONEXT, 전체 기업 등에서 UK1이 선택된 화면이다. 프랑크푸르트 상장 기업 리스트는 미도시되어 있다. 한편, 다른 증권 거래소에 등록된 기업 등이 더 추가될 수 있음은 당연하다 할 것이다.
도 124은 도 121에서 나스닥 등록 기업 중의 하나인 3COM(6번)을 선택했을 때에 나타나는 3COM의 특허 정보 시스템의 내부 중 특허 포트폴리오 중 특허 리스트 중 국가 선택에서 미국 특허 탭을 선택했을 때 나오는 일실시예적 구현예이다. 상기 3COM에 대한 입력이 있을 경우, 본 발명의 특허 정보 서비스 시스템은 3COM에 대한 미국 문건을 검색하거나, 특허 문건 마스트 DB에 조회하여 3COM에 대한 문건 목록을 생성하여 사용자에게 제시할 수 있다.
도 125는 도 124에서 발명자 리스트를 선택한 다음 국가 탭에서 미국을 선택했을 때 3COM의 발명자 목록이 나오는 화면이다. 본 발명의 특허 정보 서비스 시스템은 상기 특허 문건 마스트 DB에 조회하거나, 상기 발명자 분석용 다차원 분석용 연산 수행 결과 테이블에 질의하여 3COM의 모든 발명자 목록을 추출할 수 있을 것이다. 한편, 3COM의 발명자를 ABC 순으로 나열할 수도 있지만, 다출원/다등록 또는 다인용 등의 다른 순서로 나열하는 것도 당업자에게는 자명할 것이다.
도 126는 도 125에서 발명자 리스트에서 Aldous Stepha..(9번)을 선택했을 때 이 발명자와 관계된 특허 문건 목록이 나오는 화면이다. 본 발명의 상기 특허 정보 서비스 시스템은 발명자에 대한 선택 정보를 입수받은 다음, 그 입수 받은 발명자 정보로 상기 특허 문건 마스트 DB에 조회함으로써, 그 발명자에 해당되는 문건 목록을 생성하여 사용자에게 제시할 수 있을 것이다.
도 127은 3COM에 대한 도 124에서 통계 분석탭을 누르고 기술영역 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 출원수에 대한 일실시예적 구현예이다. 이 화면에는 드릴 다운과 특정 셀값을 눌렀을 때 나오는 간이 분석 화면이 팝업으로 나와 있다. 이는 삼성전자주식회사에 대한 구현예가 있는 도 17과 구조적으로 동등하다.
도 128은 3COM에 대한 도 124에서 통계 분석탭을 누르고 경쟁사 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 USPC 서브클래스 레벨에서의 각 USPC별 연도별 출원수에 기준한 경쟁 출원인에 대한 정보가 나오는 일실시예적 구현예이다. 이 화면은 삼성전자주식회사에 대한 구현예가 있는 도 38과 구조적으로 동등하다.
도 129는 3COM에 대한 도 124에서 통계 분석탭을 누르고 미국인용 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 3COM의 출원 문건 전체 집합을 인용 기준 문건 집합으로 했을 경우, 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 이 화면은 삼성전자주식회사에 구현예가 있는 도 39와 구조적으로 동등하다.
도 130은 3COM에 대한 도 124에서 통계 분석탭을 누르고 발명자 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 다출원 발명자에 대한 일실시예적 구현예이다. 이는 삼성전자주식회사에 대한 구현예가 있는 도35와 구조적으로 동등하다.
상기 도 124 내지 도 130에 대한 구현예 및 삼성전자주식회사나 General Motors에 대한 각 구현에는 도 120내지 도 123에 나와 있는 모든 기업/출원인 중 본 발명의 특허 정보 마스트 DB에 일치하는 이름이 있거나, 출원인 대표명화 과정을 통하여 일치성이 인정되는 기업/출원인에 대하여 동등하게 적용됨은 당업자에게 자명할 것이다. 본 발명의 명세서에서 DB는 데이터베이스를 의미하며, 이는 당업자에게 통상 적인 용어일 것이다.
본 발명은 특허 정보 산업 전반에 활용할 수 있다. 구체적으로는 검색, 분석, 컨설팅, 감시, 침해를 위한 조사, 경쟁사에 대한 분석, 기술 융합 패턴 조사 등의 각종 특허 정보 유관 산업에 포괄적으로 활용될 수 있다.
도 1은 본 발명의 특허 정보 시스템 구성도에 관한 일실시예적 도면이다.
도 2는 본 발명의 DB 부에 관한 일실시예적 도면이다.
도 3은 본 발명의 특허 문건 마스트 DB에 관한 일실시예적 도면이다.
도 4는 본 발명의 특허 분류 기호 마스트 DB에 관한 일실시예적 도면이다.
도 5는 본 발명의 주체 마스트 DB에 관한 일실시예적 도면이다.
도 6은 본 발명의 다차원 분석용 연산 수행 결과 테이블 DB에 관한 일실시예적 도면이다.
도 7은 본 발명의 지원 DB부 및 2차 가공 DB부에 관한 일실시예적 도면이다.
도 8은 본 발명의 전처리 모듈부에 관한 일실시예적 도면이다.
도 9는 본 발명의 마스트 DB 생성 모듈에 관한 일실시예적 도면이다.
도 10은 본 발명의 인용 정보 전처리 모듈에 관한 일실시예적 도면이다.
도 11은 본 발명의 특허 정보 처리 기본 모듈에 관한 일실시예적 도면이다.
도 12는 본 발명의 지원 모듈에 관한 일실시예적 도면이다.
도 13은 본 발명의 특허 인텔리전스 모듈에 관한 일실시예적 도면이다.
도 14는 본 발명의 delphion는 본 발명의 하위분류포함검색는 본 발명의 분석이 되지 않는 근거에 관한 일실시예적 도면이다.
도 15는 본 발명의 디렉토리 생성 모듈의 일 구현예에 관한 일실시예적 도면이다.
도 16은 본 발명의 특허 분류 기호 검색 모듈이 작동되는 일 구현예에 관한 일실시예적 도면이다.
도 17은 본 발명의 대한민국에 출원한 삼성전자주식회사의 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 18은 H01L에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다.
도 19는 H01L 21/00 및 기타의 하위 특허 분류 기호에 드릴다운했을 때 생성되는 분석 결과에 대한 일실시예적 도면이다.
도 20은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 메인그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 21은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 IPC 1 dot 서브 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 22는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 삼성전자주식회사의 출원 문건 기준 IPC 서브클래스 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 23은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 등록한 삼성전자주식회사의 등록 문건 기준 IPC 메인 그룹 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 24는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC no dot(sub class) 레벨의 다출원 USPC별 연도별 출원 수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 25는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국에 출원한 General Motors의 USPC 1 dot 레벨의 다출원 IPC별 연도별 출원수 데이터에 대한 일실시예적 분석 결과에 대한 도면이다.
도 26은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다.
도 27은 본 발명의 미국 출원 문건 기준 IPC H04B에 대한 출원 총량 분석 및 드릴 다운의 예에 대한 일실시예적 도면이다.
도 28은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 다출원 기업별 총량 분석에 관한 일실시예적 도면이다.
도 29는 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 점유율 기준 다출원인에 대한 일실시예적 도면이다.
도 30은 본 발명의 대한민국 출원 문건 기준 IPC H04B에 대한 활동율 기준 다출원인에 대한 일실시예적 도면이다.
도 31은 본 발명의 미국 출원 문건 기준 IPC H04B 및 이들의 하위 분류에 대한 드릴다운을 포함한 출원 총량 분석에 대한 일실시예적 도면이다.
도 32는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준으로 한 대표적 경쟁사 분석에 관한 일실시예적 도면이다.
도 33은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 기준 삼성전자주식회사의 총량 기준 다출원 특허 기술 분류 기호별 경쟁 출원인에 관한 분석의 일실시예적 도면이다.
도 34는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 미국 특허 기준 삼성전자주식회사의 IPC 메인 그룹 기준 출원 총량 기준 경쟁 출원인에 분석의 일실시예적 도면이다.
도 35는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 연도별 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다.
도 36은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 대한민국 특허 출원 총량 기준 삼성전자주식회사의 다출원 다출원 발명자별 분석 결과에 관한 일실시예적 도면이다.
도 37은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원 총량을 기준으로 할 때 USPC 서브클래스(no dot, 클래스 직하위) 기준 다출원 경쟁 출원인에 대한 랭킹 분석 결과에 대한 일실시예적 도면이다.
도 38은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 39는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주 식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 40은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 41은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 특허 분류 기호(IPC 메인 그룹 레벨)에 드릴 다운했을 때를 반영한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 42는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 출원을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 43은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 44는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 최다 인용 발명자에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 45는 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, IPC 메인 그룹 별 최다 인용 기술에 대한 분석 중에서 IPC에 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.
도 46은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 후방(forward) 인용 문건 집합을 분석 대상 문건 집합으로 한, USPC 서브 클래스(no dot, 클래스 직하위) 최다 인용 기술에 대한 분석 중에서 드릴 다운 했을 시의 연도별 분석 결과에 대한 일실시예적 도면이다.
도 47은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 총량 기준 분석 결과 및 이 분석 결과에 대한 본 발명의 리포팅 모듈 중 차트 생성 모듈이 생성한 차트의 일 실시예적 도면이다.
도 48은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주 식회사의 모든 미국 특허 등록을 기준 문건 집합으로 할 때의 본 발명의 전체 후방 인용 관련 기준 문건 집합을 분석 대상 문건 집합으로 한, 인용을 많이 받은 발명자의 연도별 인용 총량에 관한 분석 결과 및, 분석 결과에 보이는 특정한 숫자를 클릭했을 때, 그 숫자에 해당하는 문건 집합에 대하여 간이한 분석 결과(문건 목록, 최다 출원인의 연도별 출원수/등록수, 최다 발명자의 연도별 출원수/등록수, 최대 기술 분야별(IPC, USPC, FT) 연도별 출원수/등록수(드릴다운 포함))를 제공해 주는 간이 분석 모듈이 생성한 문건 목록에 대한 일실시예적 도면이다.
도 49는 본 발명의 간이 분석 모듈에서도 최대 기술 분야별(IPC, USPC, FT)로 드릴 다운 기능을 제공함으로 보여주는 일실시예적 도면이다.
도 50은 본 발명의 특허 정보 시스템이 보유한 DB 내의 모든 출원인 중 삼성전자주식회사의 모든 미국 출원 문건 중 다출원 IPC 서브클래스 단위의 문건을 기준 문건 집합으로 할 때의 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 인용 총량에 대한 연도별 분석 결과에 대한 일실시예적 도면이다.
도 51은 본 발명의 특허 정보 시스템의 일 서브 시스템인 계층적 특허 정보 서비스 시스템에 관한 일실시예적 도면이다.
도 52는 본 발명의 개별 단위 특허 정보 시스템 생성 엔진에 관한 일실시예적 도면이다.
도 53은 본 발명의 특허 정보 전처리 모듈의 내부 구성에 관한 일실시예적 도면이다.
도 54는 본 발명의 가중치 전처리 모듈에 관한 일실시예적 도면이다.
도 55는 본 발명의 인용 정보 전처리 모듈에 관한 일실시예적 도면이다.
도 56은 본 발명의 특허 분류 기호 전처리 모듈(301-3-1 또는 3500)에 관한 일실시예적 도면이다.
도 57은 본 발명의 출원인 대표명화 전처리 모듈에 관한 일실시예적 도면이다.
도 58은 본 발명의 대표 어구 추출 전처리 모듈에 관한 일실시예적 도면이다.
도 59는 본 발명의 패밀리 정보 전처리 모듈에 관한 일실시예적 도면이다.
도 60은 본 발명의 복수 특허 분류 기호 관계성 전처리 모듈에 관한 일실시예적 도면이다.
도 61은 본 발명의 특허 분류 기호별 통계 전처리 모듈에 관한 일실시예적 도면이다.
도 62는 본 발명의 특허 정보 인텔리전스 모듈에 관한 일실시예적 도면이다.
도 63은 본 발명의 분석 모듈에 관한 일실시예적 도면이다.
도 64는 본 발명의 특허 정보 시스템 배치 생성 엔진에 관한 일실시예적 도면이다.
도 65는 본 발명의 통합 관리 모듈의 구성에 관한 일실시예적 도면이다.
도 66은 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 67은 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 68은 입수된 문건 집합에서 출원인 명의 목록을 입수하고, 각 목록에 대하여 전체 특허 정보 데이터베이스(2300)에서 목록에 있는 출원인 개수만큼 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고, 상기 각 생성된 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 69은 출원인 명의 단위 특허 정보 서비스 시스템의 생성을 주문 받은 경우, 전체 특허 정보 데이터베이스(2300)에서 1개의 출원인 명의 단위 특허 정보 서비스 시스템을 생성하고 상기 출원인 명의 단위 특허 정보 서비스 시스템을 구성하는 특허 문건 집합에 포함된 발명자별 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 방법의 일 실시예를 보여 주고 있다.
도 70은 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 방법에 관한 것이다. 본 국가 단위로 출원인 명의 단위 특허 정보 서비스 시스템을 생성하는 것은 국가 단위의 특허 정보 데이터베이스(2300)를 대상으로 국가 단위의 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 생성하는 것을 본질로 한다. 따라서, 상기 도 66 내지 도 69의 방법은 모두 적용될 수 있다.
도 71은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발 명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 72는 우선권 주장 번호를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 73은 패밀리 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 74는 패밀리 정보 및 우선권 주장 정보를 활용하여 출원인 명의 단위 특허 정보 서비스 시스템 및 발명자 명의 단위 특허 정보 서비스 시스템을 국가 단위로 생성하는 과정의 일 실시예를 보여주고 있다.
도 75는 신규 문건이 추가 될 때 출원인 명의 단위 특허 정보 서비스 시스템 생성 엔진 및 발명자 명의 단위 특허 정보 서비스 시스템 생성 엔진이 어떠한 과정을 수행하는 가에 대한 일 실시예적 과정을 보여주고 있다.
도 76은 본 발명의 에 관한 일실시예적 도면이다.
도 77은 발명자 명의 단위 특허 정보 서비스 시스템 관리자가 자신이 관리하고 있는 문건 집합에 대해 상기 CRUD를 수행하는 과정에 대한 일실시예적 과정을 도시하고 있다.
도 78은 본 발명의 에 관한 일실시예적 도면이다.
도 79는 본 발명의 비용 지출 관점 가중치 전처리 모듈(3311)이 가중치를 처리하는 방법에 관한 일실시예적 도면이다.
도 80은 본 발명의 인용 관점 가중치 전처리 모듈(3313)이 인용 관점에서 가중치를 전처리하는 방식에 관한 일실시예적 도면이다.
도 81은 본 발명의 분쟁 관점 가중치 전처리 모듈(3315)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 82는 본 발명의 집중 관점 가중치 전처리 모듈(3317)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 83은 본 발명의 발명자 단위에서 가중치를 처리할 수도 있으며, 본 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 84는 본 발명의 출원인 단위 가중치 전처리 모듈(3331)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 85는 본 발명의 발명자 단위 가중치 전처리 모듈(3333)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 86은 본 발명의 대리인 단위 가중치 전처리 모듈(3335)이 가중치를 처리하는 방식에 관한 일실시예적 도면이다.
도 87은 본 발명의 패밀리 정보 전처리 엔진(3810)이 패밀리 정보를 처리하는 방법에 관한 일실시예적 도면이다.
도 88은 본 발명의 인용 번호를 대표화하는 인용 정보 전처리 방법에 관한 일실시예적 도면이다.
도 89는 본 발명의 특정 문건을 인용하고 있는 후출원 문건에 대한 정보인 후방 인 용 문건 정보의 획득한 후 상기 후방 인용 문건 정보를 상기 특정 문건의 문건 정보에 포함하는 방법에 관한 일실시예적 도면이다.
도 90은 본 발명의 인용 정보 전처리 방법에 관한 일실시예적 도면이다.
도 91은 본 발명의 변형 특허 분류 기호를 처리하는 특허 분류 기호 전처리 엔진의 처리 방법에 관한 일실시예적 도면이다.
도 92는 본 발명의 계층적 변형 특허 분류 기호 데이터베이스 생성 모듈이 상기 변형 특허 분류 기호 데이터베이스를 생성하는 방법에 관한 일실시예적 도면이다.
도 93은 USPC 특허 분류 기호로 트리 구조를 만드는 일 실시예적 방법에 관한 도면이다.
도 94는 도 93의 USPC 특허 분류 기호로 트리 구조에 대응되는 변형 특허 분류 기호를 할당하는 방법에 관한 일 실시예적 방법에 관한 도면이다.
도 95는 도 93의 USPC 특허 분류 기호로 만든 트리 구조와 동일한 구조를 가지는 변형 특허 분류 기호로 구성되는 트리 구조에 관한 일 실시예적 도면이다.
도 96은 Index to U.S. Patent Classification (a.k.a., Classification Index File ) 파일)로 도 93와 같은 특허 분류 기호의 트리 구조를 만들 수 있음을 보여 주는 실시예적 도면이다.
도 97은 본 발명의 특허 분류 기호 전처리 방법에 관한 일실시예적 도면이다.
도 98은 본 발명의 대표명화 전처리 모듈이 출원인 대표명화를 수행하는 방법에 관한 일실시예적 도면이다.
도 99는 본 발명의 우선권 주장 번호를 활용하는 대표명화 방법에 관한 일실시예적 도면이다.
도 100은 본 발명의 특허 분류 기호별로 통계값을 전처리하는 방법에 관한 일실시예적 도면이다.
도 101은 본 발명의 주어진 특허 분류 기호에 대하여 하위 특허 분류 기호를 자동으로 포함시켜 통계값, 파라미터 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.
도 102는 본 발명의 특정한 문건 집합의 문건 부분 집합에 대하여 인용 또는 피인용 정보를 하위 특허 분류 기호를 포함하는 관점에서 특허 분류 기호별 통계값, 파라미터값, 또는 계산값을 생성하는 방법에 관한 일실시예적 도면이다.
도 103은 본 발명의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.
도 104는 본 발명의 비교 관점의 복수 특허 분류 기호 관계성 전처리 방법에 관한 일실시예적 도면이다.
도 105는 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 106은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 107은 본 발명의 대표 어구 정보 전처리 방법 에 관한 일실시예적 도면이다.
도 108은 본 발명의 분석 지표 계산 방법에 관한 일실시예적 도면이다.
도 109는 본 발명의 분석 대상 특허 문건 집합 입수 방법에 관한 일실시예적 도면이다.
도 110은 본 발명의 동향 분석 방법에 관한 일실시예적 도면이다.
도 111은 본 발명의 간이 분석 방법에 관한 일실시예적 도면이다.
도 112는 본 발명의 인용 분석 방법에 관한 일실시예적 도면이다.
도 113은 본 발명의 피인용 분석 방법에 관한 일실시예적 도면이다.
도 114는 본 발명의 심사 인용 분석 방법에 관한 일실시예적 도면이다.
도 115는 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 116은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 117은 본 발명의 복수 특허 분류 기호 분석 방법 에 관한 일실시예적 도면이다.
도 118은 본 발명의 개별 단위 특허 정보 시스템 다단 그룹화 모듈 작동 방법에 관한 일실시예적 도면이다.
도 119는 본 발명의 특허 정보 시스템 배치 생성 방법에 관한 일실시예적 도면이다.
도 120은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 대한민국의 최다 출원인 Top 500에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 대한민국이 선택되고, 그 하부 탭의 Top 500, 거래소 등록 기업, 코스닥 등록기업, 다출원 기업, 전체 기업 등에서 Top 500탭이 선택된 화면이다.
도 121은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 미국의 나스닥 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 미국이 선택되고, 그 하부 탭의 Top 500, NYSE(뉴욕 증권 거 래소), NASDAQ, AMEX, 전체 기업 등에서 NASDAQ 선택된 화면이다. NASDAQ 등록 기업들은 다수 있으므로, ABC 순의 탭과 전체 NASDAQ기업 탭이 있다.
도 122은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 일본의 JASDAQ 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 일본이 선택되고, 그 하부 탭의 Top 500, JP1(동경증권거래소 1부 등록 기업), JP2(동경증권거래소 2부 등록 기업), JPM(MOTHERS 등록기업), JASDAQ 등록기업, 전체 기업 등에서 JASDAQ 선택된 화면이다.
도 123은 본 발명의 출원인 단위 특허 정보 시스템이 구현된 화면의 일 실시예로 유럽의 런던증권거래소 등록 기업에 대한 출원인 목록 화면이 나와 있는 일구현예적 실시예이다. 국가 탭에서는 유럽이 선택되고, 그 하부 탭의 Top 500, UK1(런던증시), AIM(런던증시), OVERSEAS LISTED(런던증시 상장 외국 기업), EURONEXT, 전체 기업 등에서 UK1이 선택된 화면이다. 프랑크푸르트 상장 기업 리스트는 미도시되어 있다.
도 124은 도 121에서 나스닥 등록 기업 중의 하나인 3COM(6번)을 선택했을 때에 나타나는 3COM의 특허 정보 시스템의 내부 중 특허 포트폴리오 중 특허 리스트 중 국가 선택에서 미국 특허 탭을 선택했을 때 나오는 일실시예적 구현예이다.
도 125는 도 124에서 발명자 리스트를 선택한 다음 국가 탭에서 미국을 선택했을 때 3COM의 발명자 목록이 나오는 화면이다.
도 126는 도 125에서 발명자 리스트에서 Aldous Stepha..(9번)을 선택했을 때 이 발명자와 관계된 특허 문건 목록이 나오는 화면이다.
도 127은 3COM에 대한 도 124에서 통계 분석탭을 누르고 기술영역 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 출원수에 대한 일실시예적 구현예이다. 이 화면에는 드릴 다운과 특정 셀값을 눌렀을 때 나오는 간이 분석 화면이 팝업으로 나와 있다. 이는 삼성전자주식회사에 대한 구현예가 있는 도 17과 구조적으로 동등하다.
도 128은 3COM에 대한 도 124에서 통계 분석탭을 누르고 경쟁사 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 USPC 서브클래스 레벨에서의 각 USPC별 연도별 출원수에 기준한 경쟁 출원인에 대한 정보가 나오는 일실시예적 구현예이다. 이 화면은 삼성전자주식회사에 대한 구현예가 있는 도 38과 구조적으로 동등하다.
도 129는 3COM에 대한 도 124에서 통계 분석탭을 누르고 미국인용 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 3COM의 출원 문건 전체 집 합을 인용 기준 문건 집합으로 했을 경우, 본 발명의 전방(backward) 인용 문건 집합을 분석 대상 문건 집합으로 한, 다인용 출원인에 대한 연도별 분석 결과에 대한 일실시예적 도면이다. 이 화면은 삼성전자주식회사에 구현예가 있는 도 39와 구조적으로 동등하다.
도 130은 3COM에 대한 도 124에서 통계 분석탭을 누르고 발명자 SA(systematic analysis) 메뉴, 국가 탭에서 미국을 눌렀을 때 나오는 출원총량 기준 IPC 서브클래스 레벨에서의 각 IPC별 연도별 다출원 발명자에 대한 일실시예적 구현예이다. 이는 삼성전자주식회사에 대한 구현예가 있는 도35와 구조적으로 동등하다.

Claims (1)

  1. 특허 문건 마스트 DB;
    전처리 모듈부;
    특허 정보 처리 기본 모듈; 및
    인용 분석 모듈을 포함하며,
    상기 인용 분석 모듈은 복수개의 특허 문건으로 이루어진 문건 집합 단위의 통합 인용 분석 결과를 제공하는 것인 것을 특징으로 하는 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템.
KR1020070129367A 2007-12-12 2007-12-12 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템 KR20090062234A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070129367A KR20090062234A (ko) 2007-12-12 2007-12-12 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070129367A KR20090062234A (ko) 2007-12-12 2007-12-12 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템

Publications (1)

Publication Number Publication Date
KR20090062234A true KR20090062234A (ko) 2009-06-17

Family

ID=40991494

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070129367A KR20090062234A (ko) 2007-12-12 2007-12-12 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템

Country Status (1)

Country Link
KR (1) KR20090062234A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611392A (zh) * 2020-06-23 2020-09-01 中国人民解放军国防科技大学 综合多特征和投票策略的教育资源引用分析方法、系统及介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111611392A (zh) * 2020-06-23 2020-09-01 中国人民解放军国防科技大学 综合多特征和投票策略的教育资源引用分析方法、系统及介质

Similar Documents

Publication Publication Date Title
KR101534155B1 (ko) 특허 정보 제공 방법 및 그 시스템
KR101476350B1 (ko) 발명자 단위의 특허 정보 제공 방법
JP5879260B2 (ja) マイクロブログメッセージの内容を分析する方法及び装置
Zhang et al. Evaluation and evolution of a browse and search interface: Relation Browser++
US10878475B2 (en) Systems and methods for storing and retrieving goods and services information using parameter/value databases
US8768970B2 (en) Providing alternatives within a family tree systems and methods
KR101534159B1 (ko) 소셜 네트워크 분석 결과의 생성을 위한 특허 정보 융합 분석 방법 및 그 시스템
US20090228476A1 (en) Systems, methods, and software for creating and implementing an intellectual property relationship warehouse and monitor
US20080033933A1 (en) Correlating Genealogy Records Systems And Methods
US20080147578A1 (en) System for prioritizing search results retrieved in response to a computerized search query
US8713020B2 (en) System and method for organizing, processing and presenting information
WO2003052625A1 (en) A system and method for searching data sources
Chen et al. HelpfulMed: intelligent searching for medical information over the internet
US20080147641A1 (en) Method for prioritizing search results retrieved in response to a computerized search query
KR20090062288A (ko) 융합 분석용 다차원 연산 수행 결과 테이블을 포함하고있는 특허 정보 시스템
KR20090062270A (ko) 출원인 명의 단위의 자동 분석 지원 특허 정보 시스템
KR20090062251A (ko) 특허 분류 기호 전처리 모듈 포함 특허 정보 시스템
KR100855238B1 (ko) 범위 검색을 통하여 계층적으로 종속된 하위 특허 분류 기호에 관한 검색 결과를 자동으로 포함하도록 하는 검색 서비스 제공 방법 및 그 시스템
KR20090062234A (ko) 문건 집합 통합 인용 분석 기능을 가진 특허 정보 시스템
KR20090062158A (ko) 특허 정보 시스템
CA2514165A1 (en) Metadata content management and searching system and method
Fu et al. Evaluating the effectiveness of a collaborative querying environment
Scime Taxonomic information retrieval (TAXIR) from the World Wide Web: knowledge-based query and results refinement with user profiles and decision models
Ferreira et al. Discovering Co-Relations on Research Topics and Authors from the PubMed Database
Lu Automatic search interface clustering and search result processing in metasearch engine

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
WITB Written withdrawal of application