WO2013103174A1

WO2013103174A1 - 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템

Info

Publication number: WO2013103174A1
Application number: PCT/KR2012/001184
Authority: WO
Inventors: 강민수; 구자철; 김철영
Original assignee: ㈜광개토연구소
Priority date: 2012-01-06
Filing date: 2012-02-16
Publication date: 2013-07-11
Also published as: KR101527198B1; KR20130081010A

Abstract

본 발명은 특허 청구 범위의 종속항을 처리하는 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 방법 및 그 시스템에 관한 것이다. 본 발명의 특허 청구 범위의 종속항을 처리하는 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 방법은 (A) 적어도 하나 이상의 종속항 문자열을 입수하고, 입수된 종속항 문자열을 파싱(parsing)하는 단계; (B) 상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 단계; 및 (C) 상기 과제부와 상기 솔루션부를 맵핑하여 저장하는 단계; 포함하는 것을 특징으로 한다. 본 발명을 실시하면 특허의 과제부와 그 솔루션을 효과적으로 매칭 및 맵핑할 수 있으며, 중요한 핵심 키워드를 효과적으로 추출할 수 있으며, 기술적 해결 과제에 관련된 중요한 핵심 키워드와 기술적 솔루션에 관련된 중요한 핵심 키워드를 효과적으로 발견할 수 있고 기술적 해결 과제와 기술적 솔루션을 분리하여 파악 및 맵핑 할 수 있어, 동일 또는 유사한 기술적 해결 과제와 관련된 다른 특허에서의 기술적 솔루션을 용이하게 찾을 수 있게 된다.

Description

기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법 및 그 정보를 처리하는 특허 정보 시스템

본 발명은 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 방법 및 그 시스템에 관한 것으로 더욱 더 상세하게는 특허 청구 범위의 종속항을 처리하는 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 방법 및 그 시스템에 관한 것이다.

특허 정보는 글로벌 특허 정보는 기술 집단 지성(technology collective intelligence)의 결정체로 기술 정보, 권리 정보 및 경영 정보의 성격을 가지며, 글로벌한 국제 경쟁에서 그 중요성이 증가 되고 있다. 기술 정보로서 기술 개발 동향, 개별 특허에 적용된 기술적 아이디어를 알 수 있고, 권리 정보로서 개별 특허의 권리 범위, 국내외 권리화 정도를 파악할 수 있으며, 경영 정보로서 경쟁 기업의 기술 개발 동향 등을 파악할 수 있다.

특허 정보를 입수할 수 있는 방법은 다양하나, 크게 1) 각국 특허청이 제공해 주는 특허 정보 시스템을 이용하는 것과 2) 민간 기업이 개발한 특허 정보 시스템을 이용하는 것, 및 3) 개별 기업이 자사의 목적에 맞게 구축된 특허 정보 시스템을 이용하는 것 등으로 대별할 수 있다. 1)의 방법의 대표적인 예가 대한민국 특허청(www.kipo.go.kr) 및 대한민국 특허정보원(www.kipris.or.kr)이 제공하는 특허 정보 시스템이 있으며, 2)의 대표적인 예로 미국의 www.delphion.com, 일본의 www.patolis.co.jp, 대한민국의 www.wips.co.kr, www.wisdomain.com 등 있다.

www.delphion.com 의 운영회사인 톰슨사이언티픽과 같은 각 국가의 민간 기업들은 특허 정보 데이터베이스를 구축해 놓고, 특허 검색 엔진을 통하여 입력된 검색식에 대해 다양한 방식으로 검색 결과를 제공해 주고 있다. 또한, 이들 특허 정보를 기반으로 한 다양한 종류의 분석 소프트웨어가 개발되어 있으며, www.micropatent.com의 운영사(톰슨사이언티픽에 인수 합병되었음)가 개발한 상표명 AUREKA로 보급되는 소프트웨어가 유명하다. 그리고, 세계 각국의 기술 선진 대기업들은 내부에 특허 검색 및 특허 관리 시스템을 구축하여 운영하고 있는 것으로 알려져 있으나, 외부에서 그 기업들의 특허 검색 및 특허 관리 시스템에 대해 접근하기가 어렵다.

이러한 특허 검색 및 특허 관리 시스템을 구축하기 위해서는 수십억원 이상의 비용이 지출되는 것이 통상이어서, 국내외 대부분의 중견 및 중소 벤처 기업들은 자체 특허 검색 및 특허 관리 시스템을 구축하고 있지 못하고 있다. 이들 중견 및 중소 벤처 기업들은 특허 전담 조직을 두고 있는 경우도 다수 있으며, 이들이 자사의 특허에 대한 관리 및 자사를 위한 특허 정보를 수집하고 있다. 하지만, 기업 규모가 작거나, 특허에 대한 의식이 크지 않은 기업들은 이러한 특허 전담 조직을 갖추고 있지 못하는 경우가 많다. 이들 기업들은 특허법률사무소나 로펌 등에 의뢰하여 자신의 특허를 관리하고 있는 수준에 거치고 있다.

이들 특허 전담 조직은 www.delphion.com 등과 같은 외부에서 접근 가능한 유무료 온라인 특허 정보 서비스 업체들을 이용하여, 이들이 제공해 주는 플랫폼으로 특허 정보를 수집, 관리하고 있다. 그리고, 기업 명의로 된 특허 출원의 대부분은 그 기업 소속 발명자들에 의해서 이루어 지며, 그 발명자는 자신의 발명과 관련된 국내외의 특허 정보를 수집하는 것이 전세계적인 추세가 된다. 그 이유가 특허 공개 기간의 존재에도 불구하고 전세계의 신기술 정보는 70% 이상이 특허 정보의 형태로 공개되며, 특허 정보가 논문 정보 등에 비해서 상업적으로 이용 가능한 아이디어가 많기 때문으로 풀이된다. 하지만, 이들 발명자들의 상당 부분은 특허 검색에 익숙해 있지 않거나, 검색에 익숙한 자라 하더라도 www.delphion.com 등과 같은 외부 특허 정보 서비스 제공업체에 접속하여 특허 정보를 입수 받고 있다.

이러한 기술 집단 지성의 결집체에 대한 각종 분석이 수행되고 있지만, 기술적 과제와 기술적 솔루션을 체계적으로 맵핑해 주는 차별화된 서비스는 아직 시도되고 있지 않고 있다. TRIZ를 시스템화한 goldfire 등이 출시된 지 오래되었고, 시맨틱(semantic) 기술이나 온톨로지(ontology) 기술 등이 특허에 대한 접목을 시도해 왔지만, 아직 제대로 된 성과물을 보여 주지는 못하고 있다. 이에, 기술 집단 지성의 결집체를 제대로 활용하는 특허 정보 시스템의 개발이 절실히 요구되어 왔다.

본 발명이 해결하고자 하는 첫번째 기술적 과제는 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 방법을 제시하는 것이다.

본 발명이 해결하고자 하는 두번째 기술적 과제는 기술적 과제와 기술적 솔루션의 맵핑 정보 처리 시스템을 제시하는 것이다.

본 발명이 이루고자 하는 과제를 달성하기 위하여, (A) 적어도 하나 이상의 종속항 문자열을 입수하고, 입수된 종속항 문자열을 파싱(parsing)하는 단계; (B) 상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 단계; 및 (C) 상기 과제부와 상기 솔루션부를 맵핑하여 저장하는 단계; 포함하는 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법을 제시한다.

상기 (A) 단계에서의 종속항 문자열을 파싱하는 것은 기 설정된 적어도 하나 이상의 종속항 분할 패턴을 참조하여 수행되는 것인 것이며, 상기 종속항 분할 패턴은 부모항 특정 패턴 및 종속항 구성 패턴 중 어느 하나 이상을 포함하는 것인 것이 바람직하다.

상기 (A) 단계 이후에, (A1) 상기 종속항의 부모항 정보를 생성하는 단계;를 더 포함하며, 상기 (A1) 단계는 (A11) 상기 종속항 문자열이 파싱된 다음, 기 설정된 적어도 하나 이상의 부모항 특정 패턴을 참조하여 상기 종속항의 부모항을 특정하는 단계; 및 (A12) 상기 특정된 상기 부모항을 상기 종속항과 관계 지어 저장하는 단계;를 포함하는 것인 것이 바람직하다.

상기 (B) 단계에서, 상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 것은 상기 기 설정된 종속항 분할 패턴 정보를 참조하여 상기 종속항의 과제부와 솔루션부를 분할하는 것인 것이 바람직하다.

상기 종속항 분할 패턴은 적어도 하나 이상의 품사 배열 패턴 및 적어도 하나 이상의 구분 배열 패턴 중 어느 하나 이상인 것이며, 상기 품사 배열 패턴 및 상기 구분 배열 패턴 중 어느 하나 이상에는 적용 우선 순위가 있는 것인 것이 바람직하다.

(D) 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 키워드를 포함하는 적어도 하나 이상의 키워드 집합을 추출하는 단계;를 더 포함하는 것이며, 상기 키워드는 단순 키워드, 복합 키워드, 공기쌍, 트리플 중 어느 하나 이상인 것이 바람직하다.

(D1) 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 핵심 키워드 집합을 선정하고 저장하는 단계;를 더 포함하는 것인 것이며, 상기 핵심 키워드는 단순 핵심 키워드, 복합 핵심 키워드, 핵심 공기쌍, 핵심 트리플 중 어느 하나 이상인 것이 바람직하다.

상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 키워드 중에서 특허 청구 범위 전체, 상기 종속항이 포함된 특허 문서 전체 또는 상기 특허 문서가 포함된 기 설정된 문서 범위에서의 상기 키워드의 상대적 빈도 및 상기 키워드가 나타난 특허 문서 상의 필드 위치 중 어느 하나 이상이 반영되어 선별되는 제1 방법 및 상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 키워드 중에서 특허 청구 범위 전체, 상기 종속항이 포함된 특허 문서 전체 또는 상기 특허 문서가 포함된 기 설정된 문서 범위에서의 상기 키워드의 상대적 빈도만이 반영되어 선별되는 제2 방법 중 어느 하나인 것이 바람직하다.

상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 과제부에서 추출되는 키워드로 핵심 키워드를 선정하는 것이며, 상기 과제부에서 선정되는 핵심 키워드는 상기 핵심 키워드가 포함된 종속항의 적어도 하나 이상의 부모 청구항의 상기 솔루션부에서 적어도 1회 이상 나타난 것인 것이 바람직하다.

(E) 입수된 특허 집합 단위로 상기 과제부와 상기 솔루션부에 대한 연관 정보를 생성하는 단계;를 더 포함하며, 상기 (E) 단계는 (E1) 적어도 하나 이상의 개별 특허를 포함하는 상기 특허 집합을 입수하는 단계; (E2) 입수된 상기 특허 집합을 구성하는 상기 개별 특허 대하여 맵핑되어 저장된 상기 과제부와 상기 솔루션부를 입수하는 단계; (E3) 입수된 과제부 중에서 공통되는 적어도 하나 이상의 공통 과제부를 추출하는 단계; (E4) 상기 공통 과제부별로 상기 공통 과제부가 맵핑되는 적어도 2 이상의 상기 솔루션부를 추출하는 단계;및 (E5) 상기 공통 과제부와 상기 공통 과제부에 맵핑되는 상기 솔루션부를 연관 지어 시각적으로 표현하는 단계;를 더 포함하는 것이 바람직하다.

상기 공통 과제부와 상기 솔루션부 중 어느 하나 이상은 핵심 키워드인 것인 것이 바람직하다.

본 발명이 이루고자 하는 과제를 달성하기 위하여, 상기 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 정보 시스템을 제시한다.

본 발명을 활용하면 다음과 같은 효과가 있다.

첫째, 특허의 과제부와 그 솔루션을 효과적으로 매칭 및 맵핑할 수 있다.

둘째, 중요한 핵심 키워드를 효과적으로 추출할 수 있으며, 기술적 해결 과제에 관련된 중요한 핵심 키워드와 기술적 솔루션에 관련된 중요한 핵심 키워드를 효과적으로 발견할 수 있다.

셋째, 기술적 해결 과제와 기술적 솔루션을 분리하여 파악 및 맵핑 할 수 있어, 동일 또는 유사한 기술적 해결 과제와 관련된 다른 특허에서의 기술적 솔루션을 용이하게 찾을 수 있게 된다.

도 1은 본 발명의 특허 정보 시스템이 서비스가 되는 전체 네트워크적인 환경에 대한 일 실시예적 도면이다.

도 2는 본 발명의 특허 정보 시스템의 구성에 관한 일 실시예적 도면이다.

도 3은 본 발명의 특허 정보 시스템의 종속항 처리부의 구성에 관한 일 실시예적 도면이다.

도 4는 본 발명의 특허 정보 시스템의 정보 처리 방법에 대한 일 실시예적 도면이다.

도 5는 본 발명의 특허 정보 시스템이 종속항의 부모항 정보를 생성하는 방법에 대한 일 실시예적 도면이다.

도 6은 본 발명의 특허 정보 시스템의 핵심 키워드 생성 방법에 대한 일 실시예적 도면이다.

도 7은 본 발명의 특허 정보 시스템의 공통 과제부와 공통 과제부에 맵핑되는 솔루션부를 연관 지어 시각적으로 표현하는 정보 처리 방법에 대한 일 실시예적 도면이다.

도 8은 파싱된 청구항의 계층 구조를 보여 주는 일례이다.

이하, 도면을 참조하면서 더욱 더 상세하게 설명한다.

도 1은 본 발명의 특허 정보 시스템(1000)이 서비스가 되는 전체 네트워크적인 환경에 대한 일 실시예적 도면이다. 본 발명의 특허 정보 시스템(1000)은 유무선 네트워크(6000)를 통하여 사용자 컴퓨터(2000)와 정보를 주고 받으며, 적어도 하나 이상의 연계 시스템(3000)에 연결되어 있을 수 있다. 상기 연계 시스템(3000)의 예는 특허 raw data를 제공하는 각국 특허청 또는 raw data 공급자의 시스템, 기업 정보 제공자의 시스템 등이 그 예가 될 수 있으며, 본 발명의 특허 정보 시스템(1000)의 서비스를 연계하여 제공하는 적어도 하나 이상의 시스템이 그 예가 될 수 있으며, 본 설명에 한정하지 않는다.

도 2는 본 발명의 특허 정보 시스템(1000)의 구성에 관한 일 실시예적 도면이다. 본 발명의 특허 정보 시스템(1000)은 특허 데이터부(1100)를 필수적으로 포함하고, 데이터 가공부(1200), 특허 정보 서비스 지원부(1300)와 특허 분석 정보 생성부(1400) 등을 포함할 수 있다. 특허 데이터부(1100)에는 특허 원문을 파싱한 데이터가 저장되어 있는 특허 DB(1110), IPC, USPC, FT, FI, ECLA 등과 같은 특허 분류에 관한 정보를 포함하고 있는 특허 분류 DB(1120), 현재 특허 분류에 관한 정보, 현재 양수인(current assignee)에 관한 정보, 연차 등록(maintenance fee)에 관한 정보, 선행 기술 조사 정보, 인용/피인용 정보, DocDB 정보, 출원인 대표명화 정보 등과 같은 정보가 포함되어 있는 기타 특허 DB(1130)가 있을 수 있다.

상기 데이터 가공부(1200)에는 입수된 특허 문건에서 특허 청구 범위를 식별하고, 특허 청구 범위에 포함된 청구항들을 처리하는 종속항 처리부를 포함하고 있으며, 선택적으로 청구항 또는 특허 문건 전체에서 핵심 키워드를 생성하는 핵심 키워드 생성부(5000)가 더 포함되어 있다. 상기 핵심 키워드 생성부(5000)에는 청구항이나 특허 문건에서 키워드를 추출하여 키워드 집합을 생성하는 키워드 추출부(5100), 추출된 키워드 집합 중에서 핵심 키워드를 선정하는 핵심 키워드 선정부(5200) 및 핵심 키워드를 선정하는 규칙 또는 정책이 포함되어 있는 핵심 키워드 선정 정책 DB(5300)가 있다. 한편, 특허 정보 서비스 지원부(1300)에는 사용자의 검색어 입력에 대하여 검색 결과를 생성하여 제공하는 검색 처리부(1310)와 사용자의 쿼리 또는 쿼리 대응 액션(특정한 버튼/링크 등에는 쿼리 또는 쿼리를 조합할 수 있는 매개 변수(parameter) 등이 내장되거나 또는 대응되어 있을 때, 그 버튼/링크 등을 누르거나 터치하는 행위)을 처리하는 DB 쿼리 처리부(1320) 및 2종 이상의 언어 간에 단어, 구절, 문장이나 문서 등의 번역 정보를 처리하는 번역 처리부를 더 포함하고 있을 수 있다. 그리고, 특허 분석 정보 생성부(1400)에는 분석 대상이 되는 특허 문건 또는 특허 문건 집합 또는 키워드/핵심 키워드를 입수하는 분석 대상 입수부(1410)와 기 설정된 정량 분석, 기 설정된 네트워크 분석 등과 같은 기 설정된 특허 분석 결과를 처리하는 특허 분석 처리부(1420)를 포함하고 있으며, 분석 결과를 사용자에게 텍스트, 표, 차트, 다이어그램(네트워크 다이어그램을 포함한다.)로 시각적으로 인지할 수 있도록 제공하는 분석 결과 리포팅부(1430)를 포함하고 있다.

도 3은 본 발명의 특허 정보 시스템(1000)의 종속항 처리부의 구성에 관한 일 실시예적 도면이다. 상기 종속항 처리부에는 적어도 하나 이상의 처리 대상 특허 문서를 입수하는 특허 문서 입수부(4100)과 입수 된 특허 문서의 특허 청구 범위에 나와 있는 청구항 문자열을 처리하는 특허 청구 범위 처리부(4200) 및 처리된 청구항 문자열의 결과 데이터를 저장하는 종속항 처리 결과 DB(4300)를 포함하고 있다. 상기 특허 청구 범위 처리부(4200)에는 종속항을 분할하는 종속항 분할부(4210)와 종속항을 분할하는 패턴에 대한 데이터 또는 정책을 저장하는 종속항 분할 패턴 DB(4220)를 포함하고 있을 수 있다. 상기 종속항 분할부(4210)는 청구항의 계층 구조를 생성하는 청구항 계층 구조 생성부(4211), 종속항에서 과제에 관련된 문자열 부분을 추출하는 과제부 추출부(4212)와 종속항에서 솔루션에 관련된 문자열을 추출하는 솔루션부 추출부(4213)를 포함하고 있다. 한편, 상기 종속항 분할 패턴 DB(4220)에는 종속항과 독립항을 구분하는 패턴 또는 종속항의 부모항에 대한 표현 패턴 데이터를 포함하고 있는 부모항 특정 패턴 DB(4221), 종속항을 구성하는 패턴에 대한 정보를 포함하고 있는 종속항 구성 패턴 DB(4222)를 필수적으로 포함하고 있다. 한편, 상기 종속항 분할 패턴 DB(4220)에는 품사 배열에 관한 정보를 포함하는 품사 배열 패턴 DB(4223) 또는 구문 배열에 관한 정보를 포함하는 구문 배열 패턴 DB(4224)를 포함하고 있을 수 있다. 본 발명의 종속항 처리 결과 DB(4300)에는 청구항 계층 구조에 관한 정보를 포함하는 청구항 계층 구조 DB(4310)와 특정한 종속항에 대하여 과제부와 솔루션부로 구분한 정보를 저장하는 종속항 분할 DB(4320)를 포함하고 있으며, 과제부에서 추출하는 키워드 또는 핵심 키워드, 솔루션부에서 추출하는 키워드 또는 핵심 키워드를 저장하는 종속항 키워드 DB를 더 포함하고 있을 수 있다.

도 4는 본 발명의 특허 정보 시스템(1000)의 정보 처리 방법에 대한 일 실시예적 도면이다. 본 발명의 특허 정보 시스템(1000)은 (A) 적어도 하나 이상의 종속항 문자열을 입수하고, 입수된 종속항 문자열을 파싱하는 단계(S11); (B) 상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 단계(S12); 및 (C) 상기 과제부와 상기 솔루션부를 맵핑하여 저장하는 단계(S13);포함하는 방식으로 정보 처리하는 것을 특징으로 한다. 이하, 더욱 더 상세하게 설명한다.

본 발명의 특허 문서 입수부(4100)는 적어도 하나 이상의 특허 문서를 입수 받는다. 예를 들어, 미국 특허 등록 번호 6,714,859를 입수한다. 상기 특허 청구 범위 처리부(4200)는 입수된 6,714,859 특허에서 특허 청구 범위만을 추출해 낸다. 6,714,859 특허는 총 40개의 등록 청구항이 있으므로, 하기와 같이 40개의 청구항이 추출된다. 상기 종속항 분할부(4210)는 추출된 청구항들을 파싱한다.

상기 파싱은 청구항들을 독립항과 종속항을 구분하는 것, 청구항 계층 구조의 생성을 위하여 종속항의 부모항을 결정하는 것을 포함한다. 독립항이 되는 경우는 다음 3가지가 있다. 첫째는 최초 청구항, 인용하는 항이 없는 항은 독립항이다. 종속항이 되는 경우에는 인용하는 항이 있는 경우가 된다. 인용하는 항이 있더라도 청구항의 종결부(한국 또는 일본 특허 청구항)가 다른 청구항 또는 전제부(preamble)가 다른 청구항은 정책에 따라 종속항으로 취급할 수 도 있고, 독립항으로 취급할 수도 있을 것이다.

종속항의 대표적인 패턴은 "claim + 숫자"라는 문자열을 포함한다는 것이다. "claim + 숫자"와 관련된 문자열 표기 패턴을 포함하는 것을 부모항 특정 패턴이라 한다. 부모항 특정 패턴의 한 예는 "문자열 + claim + 숫자"가 될 수 있다. 한국 또는 일본 특허 문서에서는 "제 숫자+항+문자열", "제 숫자1+구분자+숫자2+구분자+숫자n+항+문자열", "제 숫자1항+범위 구분자+숫자n항+문자열" 등과 같은 다양한 부모항 특정 패턴이 있다. 상기에서 구분자는 콤마(comma), 범위 구분자는 "내지" 등이 될 수 있다. 상기 부모항 특정 패턴 부모항 특정 패턴 DB(4221)에 추가될 수 있음은 물론일 것이다.

6,714,859 특허의 제 10항은 ". The system of claim 9, wherein said travel data associated with said one vehicle indicates a location of said one vehicle and said data manager is configured to transmit said notification message based on said location of said one vehicle relative to a predefined reference point."인데, 이 때, "The system of claim 9,"에서 제10항의 부모항은 제9항임을 알 수 있다. 제 9항의 "9. The system of claim 1, wherein said data manager is further configured to receive preference data transmitted by said user and to compare said preference data to travel data associated with said one vehicle, said data manager configured to automatically transmit a notification message to said second communications device based upon a comparison of said preference data to said travel data associated with said one vehicle."에 포함된 부모항 특정 패턴인 "The system of claim 1,"에서 제 9항의 부모항은 제1항임을 알 수 있다. 따라서, 제 10항의 조부모항은 제 1항이 된다.

이와 같이 6,714,859 특허의 모든 청구항에 대하여 부모항을 결정할 수 있게 된다. 예시적으로 제1 독립항과 관련된 제1항 내지 제18항에 대하여 부모항이 결정되는 것은 표 1에 나타나 있다. 표 1과 같은 데이터의 생성은 본 발명의 청구항 계층 구조 생성부(4211)가 수행한다.

표 1

청구항 번호	부모 청구항
1
2	1
3	1
4	1
5	1
6	1
7	1
8	1
9	1
10	9
11	1
12	11
13	1
14	13
15	14
16	14
17	14
18	17

상기 표 1과 같은 정보가 있을 때, 이러한 정보로 도 8과 같은 계층 트리(tree)를 생성하여 시각적으로 제공하는 것은 당업자에게 용이한 것이므로, 상세한 설명은 생략한다.

도 5는 본 발명의 특허 정보 시스템(1000)이 종속항의 부모항 정보를 생성하는 방법에 대한 일 실시예적 도면이다. 본 발명의 특허 정보 시스템(1000)은 종속항 문자열이 파싱된 다음, 기 설정된 적어도 하나 이상의 부모항 특정 패턴을 참조하여 종속항의 부모항을 특정(S21)하고, 특정된 부모항을 종속항과 관계 지어 저장(S22)하는 방식으로 부모항 정보를 생성한다.

이어, 본 발명에서 종속항을 처리하여 과제부와 솔루션부를 분할하는 방법에 대해서 설명한다.

본 발명에서는 종속항을 "부모항 특정부 + 과제부 + 솔루션부"로 파악한다. 부모항 특정부는 종속항에서 부모항을 결정하는데 사용되는 문자열을 말한다. 상기 "과제부 + 솔루션부"가 구성되는 방식은 크게 2가지가 있다. 하나는 "과제부 + 동사부 " 솔루션부"로 구성되는 방식이고, 다른 하나는 "솔루션부"만으로 구성되는 방식이다.

"과제부 + 동사부 " 솔루션부"로 구성되는 예를 6,714,859 특허의 제 9항과 제10항에서 설명한다. 제 9항에서는 상기 과제는 최초 동사인 is 앞까지에서 불용어 또는 불필요 어구인 wherein과 said을 제외한 "data manager"가 되고, 제 10항에서는 최초의 동사인 indicates 앞까지인 "travel data associated with said one vehicle"이 된다.

후자의 경우에는 미국 특허에서는 "further comprising + 솔루션부" 또는 "further + 동사ing + 솔루션부"로 구성되는 것이 일반적이며, 한국 특허나 일본 특허에서는 "솔루션부 + 더 포함하는" 등과 같은 전형적인 패턴이 사용되고 있다. 6,714,859 특허 제 17항은 "The system of claim 14, further comprising a mapping system configured to produce mapping data based on said travel data retrieved by said data manager, said mapping data defining a graphical map, said graphical map indicating said proximity of said one vehicle."인데, further comprising 다음에 나오는 문자열이 솔루션부가 된다.

"과제부 + 동사부 + 솔루션부"와 "further + 동사ing + 솔루션부"를 구별하는 것은 종속항 구성 패턴에 의한다. 본 발명의 종속항 분할부(4210)는 종속항에 대하여, 종속항의 문자열을 품사 분석을 수행하여, 품사열을 생성한다. 이때, 생성된 품사열을 기 설정된 종속항 구성 패턴과 대조하여, "과제부 + 동사부 + 솔루션부"와 "further + 동사ing + 솔루션부" 등과 같은 종속항을 분할한다.

상기 종속항 분할부(4210)는 종속항에 대하여 부모항 특정부를 먼저 분리해 내고, 이어지는 문자열에서 wherein, 관사, 등과 같은 불용어를 무시하고 최초로 나오는 어구가 "further + 동사 ing"이거나, 명사로 시작하지 않는 경우 등과 같이 기 설정된 솔루션부 구성 패턴에 해당하는 경우, 그 부분을 솔루션부로 분할한다. 상기 종속항 분할부(4210)는 최초로 나오는 어구가 "said 또는 정관사 + 명사구"로 시작하고, (현재분사형/과거분사형이 아닌)동사가 나오는 경우 등과 같이 기 설정된 과제부 구성 패턴이 나오는 경우, 상기 동사 앞까지를 과제부로 분할한다.

이어, 본 발명에서 핵심 키워드를 생성하는 방법에 대해서 설명한다. 도 6은 본 발명의 특허 정보 시스템(1000)의 핵심 키워드 생성 방법에 대한 일 실시예적 도면이다.

본 발명의 핵심 키워드 생성부(5000)의 키워드 추출부(5100)는 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 키워드를 포함하는 적어도 하나 이상의 키워드 집합을 추출한다. 즉, 본 발명의 키워드는 과제부에서 추출한 키워드와 솔루션부에서 추출한 키워드부가 있으며, 이들은 분리하여 추출되고, 분리하여 관리된다. 상기 키워드는 단순 키워드, 복합 키워드, 공기쌍(concurrent pair), 트리플(triple) 중 어느 하나 이상인 것이다. 문자열이 주어졌을 때, 키워드를 추출하는 것은 당업자에게는 용이한 것이므로, 이에 대한 상세한 설명은 생략한다.

이어, 상기 핵심 키워드 선정부(5200)가 추출된 키워드에 대해서 핵심 키워드를 선정하는 방법에 대해서 설명한다. 상기 핵심 키워드를 선정하는 방법은 크게 3가지이다. 하나씩 설명한다.

상기 핵심 키워드 선정부(5200)가 상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 키워드 중에서 특허 청구 범위 전체, 상기 종속항이 포함된 특허 문서 전체 또는 상기 특허 문서가 포함된 기 설정된 문서 범위에서의 상기 키워드의 상대적 빈도 및 상기 키워드가 나타난 특허 문서 상의 필드 위치 중 어느 하나 이상이 반영되어 선별되는 방법이다. 이는 통상적인 TF(term frequency)와 DF(document frequency)를 이용하는 방법이다. TF는 특정한 키워드가 대상 범위(전체 종속항, 전체 청구항, 전체 과제부, 전체 솔루션부, 전체 특허 문서 등)에서 나타난 회수를 말한다. DF는 특정한 키워드가 대상 모집단 범위에서 나타난 회수를 말하며, 이러한 대상 모집단 범위는 상기 대상 범위보다 넓어야 한다. 예를 들어, 대상 범위가 전체 과제부라면, 대상 모집단 범위는 전체 청구항, 전체 과제부와 전체 솔루션부 또는 전체 특허 문서 또는 기 설정된 특허 모집단(예를 들면, 입수된 특허 문서의 main IPC 기준으로 subclass 또는 main USPC를 기준으로 한 class 전체 등)이 될 수 있다. 이때, TF가 높고 DF가 상대적으로 낮은 것이 핵심 키워드가 될 가능성이 더 높다. 한편, 상기 키워드가 추출되는 특허 문서 상의 위치가 고려될 수도 있을 것이다. 예를 들면, 발명의 명칭이나 요약에서 나온 키워드는 핵심 키워드가 될 가능성이 높으나, 발명의 설명에만 나오는 키워드는 핵심 키워드가 될 가능성이 상대적으로 낮을 수 있을 것이다.

상기 키워드 중에서 핵심 키워드를 선정하는 다른 방법은 상기 과제부에서 추출되는 키워드로 핵심 키워드를 선정하는 것이며, 상기 과제부에서 선정되는 핵심 키워드는 상기 핵심 키워드가 포함된 종속항의 적어도 하나 이상의 부모 청구항의 상기 솔루션부에서 적어도 1회 이상 나타난 것인 것을 추출하는 방법이다.

예를 들어, 6,714,859 특허의 제 10항의 과제부는 "travel data associated with said one vehicle" 인데, said와 같은 불용어를 제거하는 것과 같이 문자열을 가공하면, "travel data associated with one vehicle"이 되고, "travel data associated with said one vehicle" 또는 "travel data associated with one vehicle"은 제 10항의 부모항인 제 9항의 솔루션부에도 나타나며, 제 9항의 부모항인 독립항(독립항은 본질적으로 하나의 큰 솔루션부가 된다.)에도 이러한 문자열이 나타난다. 따라서, "travel data associated with said one vehicle" 또는 "travel data associated with one vehicle" 문자열은 핵심 키워드가 된다. 즉, 종속항의 종속항의 과제부에 나와 있는 키워드 중에서 종속항의 솔루션부에 나오는 키워드는 중요한 키워드가 되며, 종속항의 종속항의 솔루션부는 종속항의 솔루션부의 솔루션보다 더 깊이 있고, 세밀하며, 구체적인 솔루션이 된다. 즉, 종속항의 깊이(depth)가 깊은 곳에 있는 과제부의 핵심 키워드나 솔루선부의 핵심 키워드는 중요한 키워드가 될 가능성이 높다. 이는 통상적으로 독립항이나 깊이가 낮은 종속항에는 상대적으로 추상성이 높은 발명 사상이 배치되나, 깊이가 깊은 종속항에는 구체성이 높은 발명 사상이 배치되는 경향이 강하기 때문이다..

상기 키워드 중에서 핵심 키워드를 선정하는 세번째 방법은 상기 과제부에서 추출되는 키워드의 빈도로 핵심 키워드를 선정하는 것이다. 6,714,859 특허의 제 3항, 제4항에는 과제부에서 proximity가 2회가 중복되어 나오며, 이들 각각은 defined in time"과 "defined in distance"과 같은 솔루션부를 가진다. 따라서, 본 발명에서는 단일한 개념에 2개의 솔루션을 가지는 proximity는 중요한 핵심 키워드가 된다.

도 6에서 예시되는 바와 같이 상기 핵심 키워드 생성부(5000)는 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 키워드를 포함하는 적어도 하나 이상의 키워드 집합을 추출(S31)하고, 과제부 및 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 핵심 키워드 집합을 선정하고 선정된 핵심 키워드 집합을 종속항 키워드 DB에 저장(S33)한다.

본 발명에서 핵심 키워드를 선정하는 방법을 역으로 활용하면, 독립항에서의 중요 키워드가 무엇인지를 결정할 수 있게 된다. 즉, 독립항에 나온 키워드 중에서 종속항의 과제부에 1회 이상 나오거나, 중복해서 나오는 것은 중요 키워드로 추출될 수 있을 것이다. 이는 통상적으로 독립항에서 중요한 구성 요소를 종속항에서 구체화하는 방식으로 청구항들을 구성하기 때문에 더욱 더 그러하다.

도 7은 본 발명의 특허 정보 시스템(1000)의 공통 과제부와 공통 과제부에 맵핑되는 솔루션부를 연관 지어 시각적으로 표현하는 정보 처리 방법에 대한 일 실시예적 도면이다.

상기 특허 정보 시스템(1000)의 분석 대상 입수부(1410)는 (E1) 적어도 하나 이상의 개별 특허를 포함하는 상기 특허 집합을 입수(S41)한다. 상기 특허 정보 시스템(1000)의 분석 처리부(1420)는 (E2) 입수된 상기 특허 집합을 구성하는 상기 개별 특허 대하여 맵핑되어 저장된 상기 과제부와 상기 솔루션부를 입수(S21)하고, (E3) 입수된 과제부 중에서 공통되는 적어도 하나 이상의 공통 과제부를 추출(S31)하고, (E4) 상기 공통 과제부별로 상기 공통 과제부가 맵핑되는 적어도 2 이상의 상기 솔루션부를 추출(S44)한다.

이어, 본 발명의 분석 결과 리포팅부(1430)는 (E5) 상기 공통 과제부와 상기 공통 과제부에 맵핑되는 상기 솔루션부를 연관 지어 시각적으로 표현(S45)한다.

예를 들어 설명하면, 6,714,859 특허에서는 proximity가 공통 과제로 2회 나온다. 이렇게 되면 6,714,859 특허에 대하여 (proximity, defined in time), (proximity, defined in distance)라는 공통 과제부와 관련된 쌍(pair)이 2개 생성되게 된다. 적어도 하나 이상의 다른 특허에서 proximity와 관련된 쌍이 1개 이상이 있는 경우((proximity, AAA) 등과 같은), proximity는 적어도 3개 이상의 솔루션부("defined in time", "defined in distance", "AAA" 등)와 연관 관계를 맺게 되어, proximity는 이들 솔루션부들과 연결 관계가 기 설정된 형태의 선(점선, 실선 등)으로 연결될 수 있게 된다. (proximity, defined in time), (proximity, defined in distance), ((proximity, ABC) 등과 같은 데이터가 있을 때, 이러한 데이터를 분석하는 전형적인 기법이 연관성 분석(association analysis)이며, 연관성 분석 결과를 시각적으로 나타내는 것 중의 하나가 네트워크로 보여 주는 것이다. 이러한 것은 당업자에게는 용이한 것이므로, 상세한 설명은 생략한다.

한편, 상기 과제부 또는 상기 과제부에서 추출되는 핵심 키워드만을 대상으로 한 검색 서비스가 가능할 것이다. 이는 검색 엔진인 인덱싱할 때, 과제부 또는 과제부에서 추출되는 핵심 키워드를 DB 필드로 하여, 그 필드를 인덱싱하고, 그 필드를 검색 대상 필드화하는 처리를 수행하는 방식으로 검색 서비스가 가능하게 된다. 다른 한편으로는 상기 과제부 또는 상기 과제부에서 추출되는 핵심 키워드를 DB 필드로 처리하고, 그 필드를 대상으로 쿼리를 입수 받고, 쿼리에 대응되는 결과를 출력해 줄 수 있다. 이때, 검색 결과 또는 DB 쿼리 결과는 입력된 검색 키워드 또는 쿼리 키워드와 매칭되는 특허 문서 리스트가 될 수도 있지만, 하기 표 2와 같은 솔루션부가 될 수도 있을 것이다. 예를 들면, proximity라는 키워드를 과제부 필드에 입력한 경우, 검색/쿼리 결과는 다음과 같을 수 있다.

표 2

특허 번호	청구항 번호	솔루션부	청구항 구성	부모항
6,714,859	3	defined in time	said proximity is defined in time.	1
6,714,859	4	defined in distance	said proximity is defined in distance.	1
...	...	...	...	...

상기와 같은 과제부 또는 솔루션부의 핵심 키워드는 그대(일본 특허인 경우 또는 영어 특허라도 F-Term은 영어 타이틀 정보도 있으므로)로 또는 (한국어나 영어인 경우)번역을 통하여 F-term과 맵핑이 될 수 있을 것이다. F-term 체계를 구성하는 각 관점 중에는 목적이나 효과에 해당하는 다양한 F-term이 있으며, 이러한 F-term에 포함된 타이틀 정보에 포함된 키워드와 본 핵심 키워드(특히, 과제부의 핵심 키워드)가 맵핑될 수 있을 것이다. 한편, F-term 체계를 구성하는 각 관점 중에는 목적이나 효과가 아닌 다른 다양한 F-term이 있으며, 이러한 F-term에 포함된 타이틀 정보에 포함된 키워드와 본 핵심 키워드(특히, 솔루션부의 핵심 키워드)가 맵핑될 수 있을 것이다. 한편, 미국 특허를 예시로 들어 본 발명 사상을 설명하였지만, 본 발명 사상은 미국 특허뿐만 아니라, 한국, 일본, 유럽 특허 등에도 당연히 적용됨은 당업자에게 자명할 것이며, 본 발명의 명세서의 곳곳에도 이러한 취지를 기술해 놓았음을 분명히 한다.

본 발명은 특허 정보 산업에 활용될 수 있다.

Claims

(A) 적어도 하나 이상의 종속항 문자열을 입수하고, 입수된 종속항 문자열을 파싱하는 단계;

(B) 상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 단계; 및

(C) 상기 과제부와 상기 솔루션부를 맵핑하여 저장하는 단계; 포함하는 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

상기 (A) 단계에서의 종속항 문자열을 파싱하는 것은 기 설정된 적어도 하나 이상의 종속항 분할 패턴을 참조하여 수행되는 것인 것이며,

상기 종속항 분할 패턴은 부모항 특정 패턴 및 종속항 구성 패턴 중 어느 하나 이상을 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

상기 (A) 단계 이후에,

(A1) 상기 종속항의 부모항 정보를 생성하는 단계;를 더 포함하며,

상기 (A1) 단계는

(A11) 상기 종속항 문자열이 파싱된 다음, 기 설정된 적어도 하나 이상의 부모항 특정 패턴을 참조하여 상기 종속항의 부모항을 특정하는 단계; 및

(A12) 상기 특정된 상기 부모항을 상기 종속항과 관계 지어 저장하는 단계;를 포함하는 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

상기 (B) 단계에서,

상기 파싱된 문자열로 과제부와 솔루션부를 추출하는 것은 상기 기 설정된 종속항 분할 패턴 정보를 참조하여 상기 종속항의 과제부와 솔루션부를 분할하는 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 4항에 있어서,

상기 종속항 분할 패턴은 적어도 하나 이상의 품사 배열 패턴 및 적어도 하나 이상의 구분 배열 패턴 중 어느 하나 이상인 것이며,

상기 품사 배열 패턴 및 상기 구분 배열 패턴 중 어느 하나 이상에는 적용 우선 순위가 있는 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

(D) 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 키워드를 포함하는 적어도 하나 이상의 키워드 집합을 추출하는 단계;를 더 포함하는 것이며,

상기 키워드는 단순 키워드, 복합 키워드, 공기쌍, 트리플 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

(D1) 상기 과제부 및 상기 솔루션부 중 어느 하나 이상에서 적어도 하나 이상의 핵심 키워드 집합을 선정하고 저장하는 단계;를 더 포함하는 것인 것이며,

상기 핵심 키워드는 단순 핵심 키워드, 복합 핵심 키워드, 핵심 공기쌍, 핵심 트리플 중 어느 하나 이상인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 7항에 있어서,

상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 키워드 중에서 특허 청구 범위 전체, 상기 종속항이 포함된 특허 문서 전체 또는 상기 특허 문서가 포함된 기 설정된 문서 범위에서의 상기 키워드의 상대적 빈도 및 상기 키워드가 나타난 특허 문서 상의 필드 위치 중 어느 하나 이상이 반영되어 선별되는 제1 방법 및

상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 키워드 중에서 특허 청구 범위 전체, 상기 종속항이 포함된 특허 문서 전체 또는 상기 특허 문서가 포함된 기 설정된 문서 범위에서의 상기 키워드의 상대적 빈도만이 반영되어 선별되는 제2 방법 중 어느 하나인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 7항에 있어서,

상기 키워드 중에서 핵심 키워드를 선정하는 방법은 상기 과제부에서 추출되는 키워드로 핵심 키워드를 선정하는 것이며,

상기 과제부에서 선정되는 핵심 키워드는 상기 핵심 키워드가 포함된 종속항의 적어도 하나 이상의 부모 청구항의 상기 솔루션부에서 적어도 1회 이상 나타난 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항에 있어서,

(E) 입수된 특허 집합 단위로 상기 과제부와 상기 솔루션부에 대한 연관 정보를 생성하는 단계;를 더 포함하며,

상기 (E) 단계는

(E1) 적어도 하나 이상의 개별 특허를 포함하는 상기 특허 집합을 입수하는 단계;

(E2) 입수된 상기 특허 집합을 구성하는 상기 개별 특허 대하여 맵핑되어 저장된 상기 과제부와 상기 솔루션부를 입수하는 단계;

(E3) 입수된 과제부 중에서 공통되는 적어도 하나 이상의 공통 과제부를 추출하는 단계;

(E4) 상기 공통 과제부별로 상기 공통 과제부가 맵핑되는 적어도 2 이상의 상기 솔루션부를 추출하는 단계;및

(E5) 상기 공통 과제부와 상기 공통 과제부에 맵핑되는 상기 솔루션부를 연관 지어 시각적으로 표현하는 단계;를 더 포함하는 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 10항에 있어서,

상기 공통 과제부와 상기 솔루션부 중 어느 하나 이상은 핵심 키워드인 것인 것을 특징으로 하는 특허 정보 시스템의 기술적 과제와 기술적 솔루션 간의 맵핑 정보 처리 방법.
제 1항 내지 제11항 중 어느 한 항의 방법을 실시하는 것을 특징으로 하는 특허 정보 시스템.