KR20130013510A

KR20130013510A - 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법

Info

Publication number: KR20130013510A
Application number: KR1020110075208A
Authority: KR
Inventors: 윤장혁; 최성철; 임주형; 김광수
Original assignee: 포항공과대학교 산학협력단
Priority date: 2011-07-28
Filing date: 2011-07-28
Publication date: 2013-02-06
Also published as: KR101327514B1

Abstract

의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템이 개시된다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스, 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트, 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들로부터 특허문서들 간의 유사성을 추출하여 유사성 행렬을 생성하고, 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성 서버 및 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허 네트워크 정보를 저장하는 데이터베이스를 포함한다.

Description

의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법 {System for patent network analysis using semantic patent similarity and method using the same}

본 발명은 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법으로서, 더욱 상세하게는 특허문서의 자연어처리 분석을 바탕으로 핵심 특허 발견, 특허 군집의 특성파악, 그리고 경쟁사의 기술적 역량 파악을 통해 기술관련 전문가들의 의사결정을 지원하는 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법에 관한 것이다.

특허는 기술의 진보를 반영하는 신뢰성 있는 최신정보이며, 따라서 특허분석은 기술동향 파악과 기술개발 전략의 수립에 필수적인 요소로 인식되어 왔다. 특허분석을 위한 다양한 도구들 중 특허 네트워크 분석은 특허문서로부터 정보를 추출하고 가공하여 특허들 간의 관계를 시각화함으로써 기술관련 종사자들이 지적 재산권에 대한 추세를 한눈에 파악할 수 있도록 한다는 점에서 매우 유용한 도구이다.

일반적으로 특허 네트워크는 도 1과 같이 특허 데이터베이스로부터 수집된 특허문서가 포함하고 있는 서지적 정보 (예: 출원인, 등록연도, 기술분류 등), 기술적 정보 (예: 초록, 발명의 내용 등), 권리적 정보 (예: 청구항)로부터 분석을 위한 자료를 추출하여, 수집된 특허집합에 대한 전체적인 동향을 시각화함으로써 분석자의 이해를 돕는데 유용하게 사용되는 도구로 정의될 수 있다.

일반적으로 특허 네트워크는 특허 간의 인용을 바탕으로 구성된다. 하나의 특허가 이후에 나온 특허들에 많이 인용되었을 경우, 해당 특허는 중요한 특허로 받아들여질 가능성 매우 높으며, 반대로 하나의 특허가 많은 특허를 인용하였다면 해당 특허는 진보된 기술일 가능성이 높다. 이러한 특허간의 인용정도는 특허네트워크를 구성함에 있어 매우 유용한 정보로 사용되며 서지정보 등과 통합하여 다양한 분석이 가능하다. 예를 들면, 출원자의 정보를 바탕으로 특허 간의 인용정도를 분석하면 지식의 흐름이 어떻게 이동하는지 파악하기 용이하다. 또 다른 분석으로 통계적인 접근을 사용하거나 네트워크 분석 방법인 중심성 분석 등을 사용하여 특허정보의 숨겨진 패턴을 파악하기도 한다.

특허의 인용, 피인용 관계를 바탕으로 구성한 특허 네트워크는 유용한 특허분석 정보를 제공하지만, 새롭게 출현하는 특허에 대하여는 인용 및 피인용 관계가 나타나지 않아 이에 대한 분석을 지원하기 어렵다. 또한 한국과 일본 등과 같은 나라의 특허 문서에서는 인용 및 피인용의 파악이 어렵다. 따라서 특허 문서내용의 분석을 통한 네트워크 작성방법이 요구된다. 특허 내용의 분석을 위해서 기존에는 전문가의 정성적 판단과 능력에 의존하는 형태인데, 최근 기술의 발전을 통해 전 세계적으로 이루어지는 새로운 발명들이 기하급수적으로 늘어나 전문가의 능력에만 의존하는 것은 시간적 비용적 문제가 수반될 수밖에 없다.

본 발명의 일 실시예는 특허문서로부터 기술정보와 권리정보의 내용에 대해 자연어처리를 통하여 특허의 발명적 특징과 관련되며 문서 내에 포함된 기술적 요소들 간의 연관관계를 명시적으로 표현하는 주체-작용-대상 (SAO: Subject-Action-Object)구조들을 문장으로부터 추출하고, 특허 별로 추출된 SAO 구조들 간의 의미론적 문장 유사성을 계산함으로써 특허들 간의 기술적 유사성을 추출한 후, 특허들의 관계를 네트워크화하는 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법을 제공하고자 한다.

본 발명의 일 측면에 따르면, 분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스; 상기 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트; 상기 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 상기 특허문서들로부터 SAO 구조를 추출하고, 추출된 상기 SAO 구조들로부터 상기 특허문서들 간의 유사성을 추출하여 유사성 행렬을 생성하고, 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성 서버; 및 상기 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허 네트워크 정보를 저장하는 데이터베이스를 포함하고, 상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 이용하여 생성되는 것을 특징으로 하는 특허 네트워크 분석 시스템이 제공될 수 있다.

이때, 상기 특허 네트워크 생성 서버는, 상기 분석대상에 대한 상기 키워드를 상기 클라이언트로부터 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스에서 상기 특허문서를 검색하여 수집한 후 상기 데이터베이스에 저장하는 특허문서 수집부; 상기 데이터베이스에 저장된 상기 특허문서로부터 상기 SAO 구조들을 추출하는 자연어 처리부; 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 상기 유사성 행렬을 생성하는 유사성 분석부; 및 상기 유사성 행렬을 사용하여 상기 특허 네트워크 및 특허정보를 생성하는 특허 네트워크 생성부를 포함할 수 있다.

한편, 상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출할 수 있다.

한편, 상기 특허문서 수집부는, 상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드 하는 특허문서 검색부; 및 다운로드 된 상기 특허문서를 표준언어로 변환하고 표준언어로 변환된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변환부를 포함할 수 있다.

한편, 상기 자연어 처리부는, 상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및 미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함할 수 있다.

이때, 상기 자연어 처리부는, 상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함할 수 있다.

한편, 상기 유사성 분석부는, 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및 상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 유사성 행렬 생성부를 포함할 수 있다.

한편, 상기 유사성 분석부는, 상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 더 포함할 수 있다.

한편, 상기 특허 네트워크 생성부는, 상기 유사성 행렬을 이용하여 상기 특허 네트워크의 타입에 따라서 상기 특허 네트워크 정보 및 특허 네트워크를 생성하고 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 특허 네트워크 정보 생성부를 포함하고, 상기 특허 네트워크의 타입에 따라 상기 특허 네트워크 및 특허 네트워크 정보가 달라질 수 있다.

이때, 상기 특허 네트워크 생성부는,상기 데이터베이스에 저장된 상기 유사성 행렬을 로딩하는 유사성 행렬 로딩부를 더 포함할 수 있다.

본 발명의 다른 측면에 따르면, (a) 특허 네트워크 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계; (b) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계; (c) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하고 상기 특허문서들 간의 유사성을 분석하여 유사성 행렬을 생성하는 단계; 및 (d) 상기 특허 네트워크 생성 서버가 특허 네트워크 및 특허 네트워크 정보를 생성하는 단계를 포함하고, 상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 기반으로 생성되는 것을 특징으로 하는 특허 네트워크 분석 방법이 제공될 수 있다.

이때, 상기 (a) 단계는, (a-1) 상기 특허 네트워크 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계; (a-2) 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계; (a-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및 (a-4) 상기 특허 네트워크 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.

한편, 상기 (a) 단계는, 상기 (a-2) 단계와 (a-3) 단계 사이에 상기 특허문서들을 표준언어로 변환하는 단계를 더 포함할 수 있다.

한편, 상기 (a) 단계는, 상기 (a-1) 단계 이전에, 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함할 수 있다.

이때, 상기 (a) 단계는, 상기 (a-2)와 (a-3) 단계 사이에, 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함할 수 있다.

한편, 상기 (b) 단계는, (b-1) 상기 특허 네트워크 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계; (b-2) 상기 특허 네트워크 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계; (b-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및 (b-4) 상기 특허 네트워크 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.

이때, 상기 (b) 단계는, 상기 특허 네트워크 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함할 수 있다.

한편, 상기 (c) 단계는, (c-1) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계; (c-2) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계; (c-3) 상기 특허 네트워크 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계; (c-4) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 기술적 유사성을 추출하는 단계; 및 (c-5) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 사용하여 상기 유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.

이때, 상기 (c) 단계는, 상기 특허 네트워크 생성 서버가 상기 클라이언트에게 상기 유사성 행열을 전달하는 단계를 더 포함할 수 있다.

한편, 상기 (d) 단계는, (d-1) 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 선택된 상기 유사성 행렬을 전달받아 상기 유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계; (d-2) 상기 특허 네트워크 생성 서버가 컷오프 값을 사용하여 특허 네트워크를 생성하는 단계; 및 (d-3) 상기 특허 네트워크 생성 서버가 상기 유사성 행렬 및 특허의 서지정보를 이용하여 특허 네트워크의 타입에 따른 상기 특허 네트워크 정보를 생성하고, 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 단계를 포함할 수 있다.

한편, 상기 (d) 단계는, 상기 특허 네트워크 생성 서버가 상기 특허 네트워크 및 특허 네트워크 정보를 상기 클라이언트에게 전달하는 단계를 더 포함할 수 있다.

이때, 상기 컷오프 값은 민감도 분석을 통해서 결정되어 미리 저장된 값을 사용할 수 있다.

한편, 상기 특허 네트워크 정보는, DSI, GCI, TII 및 TCI 중 어느 하나 이상의 분석지표를 포함할 수 있다.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법은 특허문서의 내용분석을 통해 기술을 구성하는 요소들간의 관계를 명시적으로 표현하는 SAO 구조들간의 의미론적 유사성 분석을 통해 특허들 간의 기술적 유사성을 추출하여 특허 네트워크를 작성함으로써, 핵심 특허 발견, 군집 특허의 특성파악, 그리고 경쟁사의 기술적 역량 파악 등의 정보를 제공할 수 있다.

또한, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템이 생성한 특허 네트워크는 빠르게 변화하는 산업의 기술트렌드와 기술수명주기 등을 분석하는 데 용이하고, R&D 업무의 통찰을 제공하는 정보로서 사용될 수 있다. 이를 통한 특허 네트워크 분석은 기술기획을 위한 연구자 또는 R&D 정책 결정자의 의사결정을 지원하는 데 유용하다.

도 1은 특허 네트워크의 일반적 정의에 대하여 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템의 전체 구성도이다.
도 3은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템의 특허 네트워크 생성 서버의 상세 구성도이다.
도 4는 특허 네트워크 생성 서버의 특허문서 수집부에 대한 상세 구성도이다.
도 5는 특허 네트워크 생성 서버의 자연어 처리부에 대한 상세 구성도이다.
도 6은 특허 네트워크 생성 서버의 유사성 분석부에 대한 상세 구성도이다.
도 7은 특허 네트워크 생성 서버의 특허 네트워크 생성부에 대한 상세 구성도이다.
도 8은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법을 사용하여 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정의 순서도이다.
도 9는 특허 네트워크 생성 서버가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다.
도 10은 특허 네트워크 생성 서버가 특허 유사성 행렬을 생성하는 과정에 대한 순서도이다.
도 11은 특허 유사성 행렬(patent similarity matrix)을 생성하는 과정을 도시한 도면이다.
도 12는 특허 네트워크 생성 서버가 특허 네트워크를 생성하는 과정에 대한 순서도이다.
도 13은 136개의 특허를 대상으로 t가 0.8일 때 생성되는 특허 네트워크의 예제이다.
도 14는 특허 네트워크의 중심성 분석을 통해서 예제인 탄소나노튜브 분야에서 높은 DSI, GCI 값을 가지는 특허들을 추출한 것을 도시하고 있다.
도 15는 탄소나노튜브 분야의 특허 네트워크를 분석하여 8개의 군집특허로 분류된 것을 도시하고 있다.
도 16은 도 15에 표시된 각 군집 특허의 구성 특허와 크기, 밀도를 나타낸 것이다.
도 17은 탄소나노튜브 분야에 대하여 경쟁사의 기술적 역량 파악을 위하여 TII, TCI지표를 분석한 결과이다.

이하에서는 첨부한 도면을 참조하면서 본 발명의 실시예에 대한 구성 및 작용을 상세하게 설명하기로 한다.

도 2는 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템의 전체 구성도이다. 도 3은 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템의 특허 네트워크 생성 서버의 상세 구성도이다.

도 2를 참조하면, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)은 특허 네트워크 생성 서버(100), 데이터베이스(200), 외부 특허 데이터베이스(300) 및 클라이언트(400)를 포함할 수 있다.

특허 네트워크 생성 서버(100)는 클라이언트(400)로부터 키워드를 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)에서 특허문서를 검색하여 수집한 후 특허문서들로부터 SAO 구조를 추출하고, 추출된 SAO 구조들을 이용하여 특허문서들간의 유사성을 추출하고, 유사성 행렬을 생성한 후 유사성 행렬을 이용하여 특허 네트워크를 생성한다.

데이터베이스(200)는 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허정보를 저장한다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)은 데이터베이스(200)가 특허 네트워크 생성 서버(100)와 분리되어 있으나, 데이터베이스가 특허 네트워크 생성 서버(100)에 포함될 수 있다. 또한, 데이터베이스가 다수 개 존재하여 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템에서 필요한 정보 즉, 특허문서, SAO구조, 유사성 행렬, 특허네트워크 및 특허정보를 분리하여 저장할 수 있다.

외부 특허 데이터베이스(300)는 분석대상이 되는 특허문서들을 저장하고 있는 외부의 데이터베이스이다.

클라이언트(400)는 분석대상에 대한 키워드를 특허 네트워크 생성 서버(100)에 전달한다. 또한, 특허 네트워크 생성 서버(100)로부터 특허네트워크 및 특허정보를 전달받아 사용자 인터페이스에 도시할 수 있다.

다음으로 특허 네트워크 생성 서버(100)에 대하여 상세하게 설명한다. 도 3을 참조하면, 특허 네트워크 생성 서버(100)는 특허문서 수집부(110), 자연어 처리부(120), 유사성 분석부(130) 및 특허 네트워크 생성부(140)를 포함할 수 있다.

특허문서 수집부(110)는 사용자 인터페이스를 통해 입력받은 키워드를 클라이언트(400)로부터 전달받아 키워드를 사용하여 외부 특허 데이터베이스(300)에서 특허문서를 검색하여 수집한 후 데이터베이스(200)에 저장한다.

또한, 특허문서 수집부(110)는 특허문서 검색, 특허문서 포맷 변환과 같은 시스템 기능을 포함할 수 있다. 특허문서 수집부(110)는 사용자의 시스템 기능 실행을 위해 특허문서 검색, 특허문서 내용 보기 및 편집, 수집된 특허문서의 저장과 같은 사용자 인터페이스를 제공할 수 있다.

도 4는 특허 네트워크 생성 서버의 특허문서 수집부에 대한 상세 구성도이다.

도 4를 참조하면, 특허문서 수집부(110)는 특허문서 검색부(111) 및 특허문서 포맷 변환부(112)를 포함할 수 있다.

특허문서 검색부(111)는 특허문서 수집 모듈로서, 도 4에 도시된 바와 같이, 특허문서를 검색하고 특허문서를 다운로드한다.

특허문서 포맷 변환부(112)는 다운로드 된 특허문서를 포맷 변환하여 데이터베이스에 저장한다. 포맷을 변환할 때, 특허문서들의 기술적 정보 또는 권리적 정보를 추출하여 텍스트 파일 형식으로 변환할 수 있다.

한편, 자연어 처리부(120)는 데이터베이스(200)에 저장된 특허문서의 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출한다. 기술적 정보 또는 권리적 정보로부터 SAO 구조들을 추출할 때, 기술적 정보 또는 권리적 정보를 특허문서로부터 추출하여 텍스트 등의 파일형태로 변환하여 저장할 수 있다. 즉 자연어 처리부(120)는 특허문서 로딩, SAO 구조 추출, 불용어 처리에 대한 시스템 기능을 제공할 수 있다.

도 5는 특허 네트워크 생성 서버의 자연어 처리부에 대한 상세 구성도이다.

도 5를 참조하면, 자연어 처리부(120)는 사용자의 시스템 기능 실행을 위해 특허문서 로딩, 불용어 설정, SAO 구조 확인 및 편집하고 SAO 구조를 데이터베이스에 저장하는 기능을 제공할 수 있다.

자연어 처리부(120)는, 도 5를 참조하면, 특허문서 로딩부(121), SAO 구조 추출부(122) 및 불용어 처리부(123)를 포함할 수 있다.

특허문서 로딩부(121)는 데이터베이스(200)에 저장된 특허문서를 로딩한다.

SAO 구조 추출부(122)는 로딩된 특허문서로부터 SAO 구조를 추출한다. SAO 구조는 스탠포드 파서(Stanford Parser)나 미니파(MiniPar)와 같은 자연어처리 오픈 소스를 활용하거나 날리지스트 2.5 (Knowledgest 2.5)와 같은 상용소프트웨어를 활용하여 추출할 수 있다.

불용어 처리부(123)는 미리 저장되어 있는 불용어를 포함하고 있는 SAO 구조들을 제거하고, 추출된 SAO 구조를 데이터베이스(200)에 저장한다.

한편, 도 6은 특허 네트워크 생성 서버의 유사성 분석부에 대한 상세 구성도이다.

유사성 분석부(130)는 SAO 구조들 간의 의미론적 문장 유사성을 추출함으로써 특허들 간의 기술적 유사성을 도출한 후 모든 특허들 간의 기술적 유사성을 담고 있는 유사성 행렬을 생성한다. 즉 유사성 분석부(130)는 SAO 구조 로딩, 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성 추출을 통한 특허간 기술적 유사성 추출, 특허 유사성 행렬 생성, 생성된 유사성 행렬을 데이터베이스에 저장하는 것과 같은 시스템 기능을 제공할 수 있다.

도 6을 참조하면, 유사성 분석부(130)는 사용자의 시스템 기능 실행을 위해 분석대상 특허 선택, 개념 관계 설정, 특허 유사성 행렬 확인, 관련자료의 저장과 같은 사용자 인터페이스를 제공할 수 있다.

또한, 유사성 분석부(130)는 단순히 단어 간의 일치 여부를 활용하여 SAO 구조들 간의 유사성을 계산하는 것이 아니라, 개념 계층구조 내에 존재하는 단어들 간의 의미적 유사성을 계량화하여 측정한 후 SAO 구조들 간의 의미적 유사성을 측정한 후 특허들 간의 기술적 유사성을 자동으로 측정할 수 있다.

유사성 분석부(130)는, 도 6을 참조하면, SAO 구조 로딩부(131), 유사성 추출부(132) 및 유사성 행렬 생성부(133)를 포함할 수 있다.

SAO 구조 로딩부(131)는, 도 6에 도시된 바와 같이, 데이터베이스(200)에서 SAO 구조를 로딩한다. 이 때, SAO 구조를 데이터베이스로부터 로딩하지 않고, SAO 구조를 메모리에 상주시킬 수도 있다. 이렇게 함으로써, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)의 실행속도를 보다 향상시킬 수 있다.

유사성 추출부(132)는, 특허간 기술적 유사성 분석 모듈로서, 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성 계산을 통한 특허간 기술적 유사성을 추출한다. 단순히 단어 간의 일치여부를 활용하여 SAO 구조들 간의 유사성을 계산하는 것이 아니라, 개념 계층구조 내에 존재하는 단어들 간의 의미적 유사성을 계량화하여 측정한 후 SAO 구조들 간의 의미적 유사성을 측정하여 특허들 간의 기술적 유사성을 자동으로 측정할 수 있다. 특허들 간의 기술적 유사성을 측정하는 과정은 이하에서 설명될 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)을 이용한 특허네트워크 분석 방법에서 설명한다.

한편, 도 7은 특허 네트워크 생성 서버의 특허 네트워크 생성부에 대한 상세 구성도이다.

특허 네트워크 생성부(140)는 특허 유사성 행렬을 로딩하여 컷어프 값에 따라서 특허 정보를 추출하여 특허 네트워크를 생성한다. 즉 특허 네트워크 생성부(140)는 특허 유사성 행렬을 로딩하고 특허정보 및 시각화된 특허 네트워크를 생성한다.

도 7을 참조하면, 특허 네트워크 생성부(140)는 사용자의 시스템 기능 실행을 위해 특허 네트워크 타입 선택, 생성된 특허 네트워크 확인, 생성된 특허 네트워크의 정보 확인, 특허 네트워크 정보 및 특허 네트워크를 데이터베이스에 저장하는 사용자 인터페이스를 제공할 수 있다.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서 생성되는 특허 네트워크로 핵심 특허 발견, 군집 특허의 특성파악 및 경쟁사의 기술적 역량 파악 등의 정보가 제공될 수 있다.

특허 네트워크 작성을 위해, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서는 컷오프 값(Cutoff Value)을 활용하여 특정 특허 간의 관계가 있음을 정의할 수 있다. 특허 간의 유사성 행렬을 산정 후 두 특허 간의 유사성이 특정 값을 상회한다면 해당 특허는 강한 연관관계가 있음을 나타낸다고 가정하여 해당 특허들이 관계 있음을 나타낼 수 있다. 특허 네트워크 상에서는 두 특허의 유사성이 컷오프(Cutoff Value)인 P값을 상회 하였다면 관계가 있음으로 나타나고, 링크가 생성될 수 있다.

특허 네트워크 생성부(140)는, 도 7을 참조하면, 유사성 행렬 로딩부(141) 및 특허 네트워크 정보 생성부(142)를 포함할 수 있다.

유사성 행렬 로딩부(141)는 데이터베이스(200)에 저장된 유사성 행렬을 로딩한다. 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템(10)에서는 유사성 행렬을 데이터베이스로부터 로딩하였지만, 유사성 행렬을 데이터베이스(200)로부터 로딩하지 않고 메모리에 유사성 행렬을 상주시킬 수도 있다.

특허 네트워크 정보 생성부(142)는 유사성 행렬 및 컷오프 값을 이용하여 특허 네트워크의 공간상에 특허문서들을 사상하고 특허 네트워크 타입에 따라서 특허 네트워크 및 특허 네트워크 정보를 생성하며, 생성된 특허 네트워크 및 특허 네트워크 정보를 데이터베이스에 저장한다.

이후에 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법에서 상세하게 설명하겠지만, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 특허 네트워크의 타입에 따라 사용자에게 다양한 특허 네트워크 및 특허정보를 제공할 수 있다.

다음으로, 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법에 대하여 설명한다.

먼저, 특허 네트워크 생성 서버(100)가 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정을 설명한다.

도 8은 본 발명의 일 실시예에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법을 사용하여 외부 특허 데이터베이스로부터 특허문서를 수집하여 저장하는 과정의 순서도이다.

도 8을 참조하면, 먼저, 클라이언트(400)가 사용자가 분석하고자 하는 기술과 관련된 주제어, 출원인, 연도 등의 검색조건을 입력받아 특허 네트워크 생성 서버(100)에 전달한다(S110). 이후에, 특허 네트워크 생성 서버(100)가 인트라넷 및 인터넷과 같은 통신망을 통해서 외부의 접속 가능한 외부 특허 데이터베이스(300)로부터 특허문서들을 검색한다(S120).

다음으로, 특허 네트워크 생성 서버(100)가 검색된 특허문서를 다운로드 한다(S130). 이 때, 사용자가 검색된 특허문서들을 확인한 부 분석목적과 관련성이 없는 특허들을 제거한 후 특허문서 다운로드를 실행할 수 있다.

이후에, 다운로드된 특허문서 중 표준언어로 작성되지 않은 문서의 경우, SAO분석을 위해 표준언어로 변환한다(S150). 여기에서 표준언어는 영어일 수 있고,다운로드된 특허문서 중 영어로 작성되지 않은 문서의 경우, K2E-PAT과 같은 소프트웨어로 한글과 일본어로 작성된 특허문서를 영어로 변환할 수 있다.

이후에, 특허 네트워크 생성 서버(100)가 다운로드된 특허문서들의 집합을 미리 정의된 식별자 이름으로 지정한다(S140).

다음으로, 특허 네트워크 생성 서버(100)가 식별자가 지정된 특허문서들의 집합의 서지적 정보, 기술적 정보 및 권리적 정보를 텍스트 파일 등의 형태로 변환한다(S160).

마지막으로, 특허 네트워크 생성 서버(100)가 특허문서를 데이터베이스(200)에 저장한다(S170).

다음으로, 특허 네트워크 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정을 설명한다.

도 9는 특허 네트워크 생성 서버(100)가 특허문서로부터 SAO 구조를 추출하여 저장하는 과정의 순서도이다.

도 9를 참조하면, 먼저, 특허 네트워크 생성 서버(100)가 데이터베이스(200)에 저장되어 있는 특허문서들을 로딩한다(S210).

다음으로, 특허 네트워크 생성 서버(100)가 특허문서에서 분석하고자 하는 영역을 입력받는다(S220).

이후에, 특허 네트워크 생성 서버(100)가, SAO 구조를 추출하기 위하여, 특허문서의 기술적 내용 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할 (POS: part-of-speech)을 파악한다(S230).

다음으로, 특허 네트워크 생성 서버(100)가 단어들의 POS를 활용하여 명사구와 동사구를 각각 추출한 다음, 주어-동사-목적어의 문법적 패턴을 지니는 관계(SAO 구조)들을 추출하여 각 특허별로 정리한다(S240).

다음으로, 특허 네트워크 생성 서버(100)가 특허별로 SAO 구조들이 모두 수집된 다음 미리 정의한 불용어를 포함하고 있는 SAO 구조들을 제거한다(S250). 다른 방법으로, 사용자에게 해당 SAO 구조들을 제시하고 이들을 제거할 것인지에 대해서 질의하는 형태로 기능이 구현될 수 있다.

이후에, 특허 네트워크 생성 서버(100)가 클라이언트(400)에게 특허별 추출된 SAO 구조를 전달한다(S260). 클라이언트(400)에게 전달된 SAO구조를 사용자 인터페이스를 통하여 사용자가 확인할 수 있다.

마지막으로, 특허 네트워크 생성 서버(100)가 SAO 구조를 데이터베이스(200)에 저장한다(S270).

다음으로 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 생성하는 과정에 대하여 설명한다.

도 10은 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 생성하는 과정에 대한 순서도이다.

도 10을 참조하면, 먼저, 특허 네트워크 생성 서버(100)가 특허들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 특허문서집합의 SAO 구조를 데이터베이스(200)로부터 로딩한다(S310).

다음으로, 특허 네트워크 생성 서버(100)가 SAO 구조 간의 일치여부에 대한 자동화된 판단을 위한 임계치(threshold)를 입력받는다(S320). 임계치 값은 SAO 구조 간의 일치여부를 엄격하게 적용할 것인지 완화시킬 것인지에 대한 기준이 된다.

이후에, 특허 네트워크 생성 서버(100)가 개념들 간의 상하위 관계에 대한 계층구조를 정의하고 있는 워드넷 (WordNet) 또는 기술 도메인 온톨로지와 같은 개념관계 정보를 참조하여 각 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성을 추출한다(S330).

다음으로, 특허 네트워크 생성 서버(100)가 추출된 각 특허들에 포함된 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 SAO 구조들 간의 일치여부를 판단한 후 특허들 간의 의미론적 유사성을 추출한다(S340).

다음으로, 특허 네트워크 생성 서버(100)가 특허들 간의 의미론적 유사성을 사용하여 의미론적 유사성 행열을 생성한다(S350).

이후에, 특허 네트워크 생성 서버(100)가 클라이언트(400)에게 유사성 행열을 전달한다(S360).

마지막으로, 특허 네트워크 생성 서버(100)가 특허 유사성 행렬을 데이터베이스에 저장한다(S370).

다음으로, 도 11을 참조하여, 특허 유사성 행렬(patent similarity matrix)을 생성하는 과정을 보다 자세하게 설명한다.

특허간의 유사성은 각 특허들이 포함하고 있는 SAO 구조들의 유사성을 측정함으로써 얻어질 수 있다. SAO 구조는 하나의 문장이며, 두 문장 간의 의미론적 문장 유사성 측정은 일반적으로 (1) 문장을 구성하는 단어 단위로 분리하는 토큰화 (tokenizing), (2) 단어의 원형화 (stemming), (3) 단어의 문법적 역할 파악 (POS tagging), (4) 문장에 있는 각 단어들의 적합한 의미(sense) 결정, (5) 품사정보를 고려한 단어들 간의 의미 유사성을 활용하여 계산될 수 있다.

문장에 있는 하나의 단어인 토큰(token) ti와 tj가 있을 때, 이들의 유사성은 0에서 1 사이의 값을 가지며 Resnik의 개념 분류체계 하에서의 두 토큰의 의미론적 유사도 (semantic similarity in a taxonomy)는 수학식 1과 같이 정의된다.

여기서 lcs는 두 토큰들이 의미를 공유하는 최하 포섭개념(lowest common subsumer)이며, depth는 개념 계층구조(concept hierarchy)에서 토큰의 루트 노드 (root node)로부터의 깊이를 의미한다. 하나의 문장에 포함된 모든 단어들을 토큰으로 분리하게 되면, 두 문장 간의 의미적 유사성 계산은 이분 그래프(bipartite graph)의 최대 매칭의 문제로 해석될 수 있으며, 따라서 SAO 구조들 간의 유사성은 0에서 1 사이의 값을 가질 수 있으며 수학식 2와 같이 정의될 수 있다.

여기서 N_token은 문장 S_i에 속해 있는 토큰의 개수를 의미하며, match는 두 문장 속에 존재하는 품사가 동일한 토큰들이 가지는 의미적 유사성의 합을 의미한다. 의미론적인 문장 유사도 측정은 의미는 유사하지만 다른 형태로 표기될 수 있는 문장들 간의 유사도를 측정하는데 유용하다. 이를 이용하여 두 SAO 구조들 간의 유사도가 계산되며, 두 SAO 구조가 동일한지 아닌지를 판별하기 위해 수학식 3과 같이 임계치(p)를 활용한다.

즉, 두 SAO 구조의 유사도 값이 p보다 크면, 두 SAO 구조는 동일한 것으로 간주하고, 그렇지 않으면 두 SAO 구조는 다른 것으로 간주할 수 있다. p값의 설정은 분석자의 판단에 따라 결정될 수 있으며, 임계치를 1에 깝게 설정하면 보다 엄격한 유사성 분석이 가능하며, 0에 가까울수록 느슨한 유사도 분석을 수행하게 된다. 다음으로 두 특허들 간의 유사성은 이들이 얼마나 많은 SAO 구조들을 공유하는 지를 활용하여 수학식 4와 같이 정의될 수 있다.

여기서 N_SAO(X)는 특허 X에 포함된 SAO 구조의 수, N_SAO(X,Y)는 특허 X와 Y에 포함된 SAO 구조들 간의 유사도 판별값이 1인 SAO 구조 쌍의 개수이다. SIM(A,B)는 두 특허 사이의 유사도 값으로, 판별 값이 1이면 두 특허는 동일하다고 할 수 있다. 모든 특허들 간의 유사도 분석을 수행하면, 특허들 간의 유사도를 나타내는 행렬을 얻을 수 있다.

다음으로, 특허 네트워크 생성 서버(100)가 특허 네트워크를 생성하는 과정에 대하여 설명한다.

도 12는 특허 네트워크 생성 서버(100)가 특허 네트워크를 시각화하는 과정에 대한 순서도이다.

도 12를 참조하면, 먼저 특허 네트워크 생성 서버(100)가 클라이언트(400)로부터 선택된 의미론적 특허 유사성 행렬을 전달받아 유사성 행렬을 데이터베이스로부터 로딩한다(S410).

다음으로, 특허 네트워크 생성 서버(100)가 컷오프 값(Cutoff Value)에 기반한 특허 네트워크를 생성한다(S420). 의미론적 특허 유사성 행렬이 선택되면, 컷오프 값(Cutoff Value)을 바탕으로 특허 네트워크를 생성하게 된다. t 값을 컷오프 값(Cutoff Value)으로 할 경우, SIM(A,B) >= t 이면 특허 네트워크 상에서 두 특허가 연결된다고 볼 수 있다. 이때 t값은 t값의 변화에 따른 특허 네트워크의 변화를 반영하여 최적의 t값을 찾아내는 민감도 분석을 활용하여 전문가의 의해 결정되어 데이터베이스에 저장될 수 있다. 도 13은 136개의 특허를 대상으로 t가 0.8일 때 생성되는 특허 네트워크의 예제이다.

이후에, 클라이언트가 선택된 특허 네트워크의 타입 (예: 핵심특허, 군집특허, 경쟁사의 기술적 역량 파악)을 입력받아 특허 네트워크 생성 서버(100)에 전달한다(S430).

다음으로, 특허 네트워크 생성 서버(100)가 특허의 서지정보 (예: 출원번호, 출원인, 특허 출원 및 등록 연도 등)를 활용하여 특허 네트워크의 타입에 따른 특허 네트워크 정보를 생성한다(S440).

이후에, 특허 네트워크 생성 서버(100)가 특허 네트워크 및 특허 네트워크 정보를 클라이언트(400)에게 전달한다. 클라이언트(400)는 특허 네트워크 및 특허 네트워크 정보를 사용자 인터페이스를 이용하여 사용자에게 전달한다(S450). 이로써 사용자가 시각적으로 특허 네트워크 및 특허 네트워크 정보를 확인할 수 있다.

마지막으로, 특허 네트워크 생성 서버(100)는 특허 네트워크 및 특허 네트워크 정보를 데이터베이스(200)에 저장한다(S460).

한편, 도 13은 특허 네트워크 중 핵심특허를 선택했을 경우의 특허 네트워크의 예를 도시하고 있다. 기술 중심성 분석을 통해서 핵심 특허일 가능성이 높은 특허 또는 상대적으로 중요성을 가진 특허를 발견할 수 있다. 사회 연결망 분석(Social Network Analysis)에서 중심성 (centrality)이란 네트워크상의 어떤 노드가 얼마만큼 중심 가까이 자리 잡고 있는지를 나타내는 정도를 의미하는지 표현하는 지표로 특정한 노드가 많은 다른 노드들과 연결을 갖게 될 경우 그 노드는 점차 네트워크의 가운데 쪽으로 위치하게 됨을 의미한다.

이러한 중심성 지표가 높은 노드는 네트워크 내 영향력이 크고 다른 노드들에게 많은 영향을 미칠 수 있다. 본 발명에서는 주로 중심성 분석을 적용하여 특허들 간의 내용 전 연관관계를 기반으로 한 수학식 5에 따른 Degree Sum Index(DSI), 수학식 6에 따른 Global Centrality Index(GCI) 지표를 제시한다.

DSI 지표 값이 높은 특허는 다른 특허들과 직접적인 관계가 크기 때문에, 기술 분야에서 핵심적인 특허일 가능성이 높음을 의미한다. GCI 지표 값이 높은 특허는 다양한 특허와 많은 관계가 있기 때문에, 널리 사용되는 기술의 특허일 가능성이 높음을 의미한다.

도 14는 특허 네트워크의 중심성 분석을 통해서 예제인 탄소나노튜브 분야에서 높은 DSI, GCI 값을 가지는 특허들을 추출한 것을 도시하고 있다. 전체적으로 1999년부터 2004년 사이에 출원되었거나, 등록된 특허들이 중요한 것으로 나타났음을 알 수 있다.

실제로 이 기간 동안 많은 연구자와 기업들이 '아이크 방전'과 '레이저 증기요법'을 발명하였다. 높은 DSI, GCI 값을 가진 특허들 중 많은 수는 탄소나노튜브의 합성과 관련된 넥(NEC), 소니(SONY), 삼성 SDI등과 같은 기업의 특허들이었다. 예를 들어 도 14의 P2 특허 같은 경우 높은 DSI, GCI값을 가지고 있는데, 이는 탄소나노튜브의 '아이크 방전' 기술과 관련된 NEC기업의 원천 특허였다.

2005년부터 2008년 사이에 출원된 높은 DSI, GCI 값을 가진 새로운 특허들도 출현하였다. 높은 GCI 값을 가진 P110, P135 특허와 같은 새로운 특허는 탄소나노튜브의 합성과 관련된 방법으로서 화학증착법(CVD) 기술이 기존의 '아이크 방전'과 '레이저 증기요법' 기술을 대체하고 있음을 의미한다.

또한 삼성 SDI기업의 P110 특허는 지속적인 전극의 대체로 인해 발생하는 문제를 제거하기 위해서 새로운 발명을 제안하였고, 이는 대량생산을 위한 중요 특허로 판명되었다. 따라서 본 발명에서 사용되는 지표들은 사용자들이 특허들 간의 유사성 비교를 통해서 핵심특허일 가능성이 높은 특허를 발견하기 위해 도움을 줄 수 있다. 이는 빠르게 변화하는 산업에서 기술의 가치를 측정하고 새로운 특허들의 가능성을 평가하는 방법이 될 수 있다.

도 15는 특허 네트워크 중 군집특허를 선택했을 경우의 특허 네트워크의 예를 도시하고 있다. 특허 네트워크의 군집 특허 분석에서는 밀도(density)와 크기(size)가 특성파악의 주요 요인이 된다. 특허 네트워크 내에서 군집의 크기가 크고, 밀도가 높은 군집 특허는 기술적으로 증명되었거나, 중요한 세부 기술 분야로 이미 많은 발명이 이루어졌고, 유사한 특허들이 많음을 의미한다.

또한 군집의 크기가 크고, 밀도가 낮은 군집 특허는 유망한 세부 기술 분야로서, 관련 특허들이 충분히 나타나지 않았거나 성숙되지 않음을 의미한다.

마지막으로 군집의 크기가 작고, 밀도가 높은 군집 특허는 독립적인 특성을 지니는 특허집단으로서, 기존의 방법과는 다른 새로운 기술을 의미할 수 있다.

도 15는 탄소나노튜브 분야의 특허 네트워크를 분석하여 8개의 군집특허로 분류된 것이다. 도 16은 도 15에 표시된 각 군집 특허의 구성 특허와 크기, 밀도를 나타낸 것이다.

도 16의 군집 특허 G1, G2 로부터 기술적 영향이 결정될 수 있다. 군집 특허 G1 은 특허 P135, P121, P116, P115 등과 같이 가장 많은 특허 수를 보유하여 크기는 크고, 밀도는 작다. 따라서 군집 특허 G1 내 탄소나노튜브 합성과 관련된 기술('아이크 방전', '레이저 증기요법', '화학 증착법')이 지속적으로 발명될 가능성이 높다. 실제로 탄소나노튜브 관련 연구에서 50.7% 의 특허가 위와 같은 기술 분야에서 출현하고 있었다.

군집 특허 G2는 특허 P131, P130, P129, P127, P48, P42, P41로 크기는 작고 밀도는 매우 높게 나타났다. 따라서 각 특허들은 특허들 간의 관계성이 매우 높은 새로운 기술의 발명일 수 있다. 군집 특허 G2에 대해서 서지사항 정보를 분석한 결과 탄소나노튜브의 합성을 위한 '아이크 방전'과 관련된 유사한 발명에 대해서 한 명의 개인이 4개의 특허를 보유하였고, 하나의 기업이 2개의 특허를 보유하고 있었다. 따라서 개인의 특허들을 통해서 관련 기술이 새로운 발명이 될 수 있다고 분석된다.

G2 내의 특허 들은 펄스를 사용하거나 자기장을 사용함과 같이 발명에 차이가 존재하나, 순도 높은 탄소나노튜브의 수집을 위해 연속적으로 탄소막대를 주입하는 공통적인 특성을 가진다. 주입부는 사용한 탄소막대를 저장하고, 손실 없이 반응부에 연속적으로 탄소막대를 주입할 수 있다. 게다가 탄소나노튜브 수집부는 순도를 높이기 위해서 반응부와 저장부의 벽에 응고된 탄소나노튜브를 긁어낼 수 있다. 따라서 군집 특허 G2 내의 발명은 탄소나노튜브의 수집을 효과적으로 하고 합성과정의 생산성을 높이기 위한 새로운 발명이라고 할 수 있다. 실제로 '아이크 방전' 기술의 최근 주요 연구는 대량 생산과 비용절감에 목적을 두고 있다.

한편, 특허 네트워크 분석에서 수학식 7로 표현된 Technological Impact Index (TII), 수학식 8로 표현된 Technological Capability Index(TCI) 등의 지표를 활용하여 경쟁사의 관련 분야의 기술적 역량을 파악할 수 있다.

전체 특허의 GCI의 평균값과 각 기업별 특허의 GCI의 평균값으로 계산되는 TII는 기업의 관련 특허의 질적 역량을 나타낸다. TII의 값에 기업의 특허 수를 추가한 TCI는 기업의 관련 특허의 질적, 양적 역량을 나타낸다. 도 17은 탄소나노튜브 분야에 대하여 경쟁사의 기술적 역량 파악을 위하여 TII, TCI지표를 분석한 결과이다. 전체적으로 삼성(SAMSUNG), 엘지(LG), 소니(SONY), 넥(NEC) 등의 기업이 탄소나노튜브 분야에서 강한 기술적 역량을 가지고 있는 것으로 나타났다.

특히, ULVAC사는 TII의 값은 낮게 나타났지만, TCI의 값은 두 번째로 높게 나타났다. 실제로 ULVAC사는 디스플레이와 반도체 분야와 관련된 진공 기술 영역의 선두기업 중 하나이다. 지난 10년 동안, '아이크 방전' 관련 기술을 발명하였고, 최근에는 진공막과 박막증착과 같은 진공기술과 관련된 플라즈마 화학증착법 특허를 출원하였다. 따라서 ULVAC 사는 새로운 경쟁자가 될 가능성이 높음을 파악할 수 있다. TII, TCI 등의 지표를 활용하여 R&D 정책 결정자들은 현재상황의 경쟁자들의 역량을 파악할 수 있다. 본 발명을 통해서 사용자들은 현재 경쟁사와 잠재적 경쟁사의 기술적 역량을 분석하는 데 지원할 수 있다.

한편, 사용자가 상기 제시된 특허 네트워크들에 대해 개별적으로 분석한 정보들은 데이터베이스에 저장될 수 있다.

한편, 상술한 바와 같은 본 발명은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체 (씨디롬, 램, 롬, 플로피디스크, 하드 디스크, 광자기 디스크 등)에서 실행될 수 있으며, 본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템은 로컬 컴퓨터에서 단독으로 실행되거나 분산 컴퓨팅 환경에서 인터넷 또는 인트라넷을 통한 정보전송을 통해 구현될 수 있다.

본 발명의 일 실시예에 따른 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법은 연구자 또는 R&D 정책 결정자 등의 기술 분야 전문가들이 기술 기획 및 전략을 수립하는 데 유용하게 활용될 수 있다.

이상으로 첨부된 도면을 참조하여 본 발명의 실시예를 설명하였으나, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자는 본 발명의 그 기술적 사상이나 필수적인 특징을 변경하지 않고 다른 구체적인 형태로 실시할 수 있다는 것을 이해할 수 있을 것이다. 따라서 이상에서 기술한 실시예는 모든 면에서 예시적인 것이며 한정적이 아닌 것이다.

10 : 특허 네트워크 분석 시스템 100 : 특허 네트워크 생성 서버
110 : 특허문서 수집부 111 : 특허문서 검색부
112 : 특허문서 포맷 변환부 120 : 자연어 처리부
121 : 특허문서 로딩부 122 : SAO 구조 추출부
123 : 불용어 처리부 130 : 유사성 분석부
131 : SAO 구조 로딩부 132 : 유사성 추출부
133 : 유사성 행렬 생성부 140 : 특허 네트워트 생성부
141 : 유사성 행렬 로딩부 142 : 특허 네트워크 정보 생성부
200 : 데이터베이스 300 : 외부 특허 데이터베이스
400 : 클라이언트

Claims

분석대상이 되는 특허문서들을 저장하는 적어도 하나 이상의 외부 특허 데이터베이스;
상기 분석대상에 대한 키워드를 입력받는 적어도 하나 이상의 클라이언트;
상기 클라이언트로부터 키워드를 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스로부터 분석대상이 되는 상기 특허문서들을 검색하여 수집한 후 상기 특허문서들로부터 SAO 구조를 추출하고, 추출된 상기 SAO 구조들로부터 상기 특허문서들 간의 유사성을 추출하여 유사성 행렬을 생성하고, 특허 네트워크 및 특허 네트워크 정보를 생성하는 특허 네트워크 생성 서버; 및
상기 특허문서, SAO 구조, 유사성 행렬, 특허 네트워크 및 특허 네트워크 정보를 저장하는 데이터베이스를 포함하고,
상기 특허 네트워크는 상기 유사성 행렬 및 컷어프 값을 이용하여 생성되는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 1항에 있어서,
상기 특허 네트워크 생성 서버는,
상기 분석대상에 대한 상기 키워드를 상기 클라이언트로부터 전달받아 상기 키워드를 사용하여 상기 외부 특허 데이터베이스에서 상기 특허문서를 검색하여 수집한 후 상기 데이터베이스에 저장하는 특허문서 수집부;
상기 데이터베이스에 저장된 상기 특허문서로부터 상기 SAO 구조들을 추출하는 자연어 처리부;
상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간의 기술적 유사성을 추출한 후 상기 특허문서들 간의 상기 유사성 행렬을 생성하는 유사성 분석부; 및
상기 유사성 행렬을 사용하여 상기 특허 네트워크 및 특허정보를 생성하는 특허 네트워크 생성부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 2항에 있어서,
상기 자연어 처리부는 상기 특허문서의 기술적 정보 또는 권리적 정보로부터 상기 SAO 구조들을 추출하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 2항에 있어서,
상기 특허문서 수집부는,
상기 키워드를 이용하여 상기 외부 특허 데이터베이스에서 상기 특허문서들을 검색하고 상기 특허문서들을 다운로드 하는 특허문서 검색부; 및
다운로드 된 상기 특허문서를 표준언어로 변환하고 표준언어로 변환된 상기 특허문서를 포맷 변환하여 상기 데이터베이스에 저장하는 특허문서 포맷 변환부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 2항에 있어서,
상기 자연어 처리부는,
상기 특허문서들로부터 SAO 구조를 추출하는 SAO 구조 추출부; 및
미리 저장되어 있는 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고, 추출된 상기 SAO 구조를 상기 데이터베이스에 저장하는 불용어 처리부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 5항에 있어서,
상기 자연어 처리부는,
상기 데이터베이스에 저장된 상기 특허문서를 로딩하는 특허문서 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 2항에 있어서,
상기 유사성 분석부는,
상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하여 상기 특허문서들 간 기술적 유사성을 추출하는 유사성 추출부; 및
상기 특허문서들 간의 상기 기술적 유사성을 이용하여 모든 상기 특허문서 쌍의 상기 유사성 행렬을 생성하고, 이를 상기 데이터베이스에 저장하는 유사성 행렬 생성부를 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 7항에 있어서,
상기 유사성 분석부는,
상기 데이터베이스에서 상기 SAO 구조들을 로딩하는 SAO 구조 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 2항에 있어서,
상기 특허 네트워크 생성부는,
상기 유사성 행렬을 이용하여 상기 특허 네트워크의 타입에 따라서 상기 특허 네트워크 정보 및 특허 네트워크를 생성하고 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 특허 네트워크 정보 생성부를 포함하고,
상기 특허 네트워크의 타입에 따라 상기 특허 네트워크 및 특허 네트워크 정보가 달라지는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 9항에 있어서,
상기 특허 네트워크 생성부는,
상기 데이터베이스에 저장된 상기 유사성 행렬을 로딩하는 유사성 행렬 로딩부를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 시스템.
제 1항 내지 제 10항 중 어느 한 항에 따른 특허 네트워크 분석 시스템을 이용한 특허 네트워크 분석 방법으로서,
(a) 특허 네트워크 생성 서버가 적어도 하나 이상의 외부 특허 데이터베이스로부터 특허문서들을 수집하여 저장하는 단계;
(b) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 기술적 정보 또는 권리적 정보로부터 자연어처리를 통해 SAO 구조들을 추출하여 데이터베이스에 저장하는 단계;
(c) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하고 상기 특허문서들 간의 유사성을 분석하여 유사성 행렬을 생성하는 단계; 및
(d) 상기 특허 네트워크 생성 서버가 특허 네트워크 및 특허 네트워크 정보를 생성하는 단계를 포함하고,
상기 특허 네트워크는 상기 유사성 행렬 및 컷오프 값을 기반으로 생성되는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 (a) 단계는,
(a-1) 상기 특허 네트워크 생성 서버가 통신망을 통해서 분석대상이 되는 키워드를 이용하여 외부의 접속 가능한 상기 외부 특허 데이터베이스로부터 상기 특허문서들을 검색하는 단계;
(a-2) 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들을 다운로드하는 단계;
(a-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보를 텍스트 파일의 형태로 변환하는 단계; 및
(a-4) 상기 특허 네트워크 생성 서버가 상기 특허문서들을 상기 데이터베이스에 저장하는 단계를 포함하는 특징으로 하는 특허 네트워크 분석 방법.
제 12항에 있어서,
상기 (a) 단계는,
상기 (a-2) 단계와 (a-3) 단계 사이에 상기 특허문서들을 표준언어로 변환하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 12항에 있어서,
상기 (a) 단계는,
상기 (a-1) 단계 이전에, 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 분석대상이 되는 상기 키워드를 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 12항에 있어서,
상기 (a) 단계는,
상기 (a-2)와 (a-3) 단계 사이에, 상기 특허 네트워크 생성 서버가 검색된 상기 특허문서들 중에서 분석목적과 관련성이 없는 상기 특허문서들을 상기 클라이언트로부터 입력받는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 (b) 단계는,
(b-1) 상기 특허 네트워크 생성 서버가 상기 데이터베이스에 저장되어 있는 상기 특허문서들을 로딩하는 단계;
(b-2) 상기 특허 네트워크 생성 서버가 상기 특허문서들에서 분석하고자 하는 영역을 입력받는 단계;
(b-3) 상기 특허 네트워크 생성 서버가 상기 특허문서들의 상기 기술적 정보 또는 권리적 정보의 텍스트에 대해 자연어처리 분석을 통해 문장 내에 포함된 각 단어들의 문법적 역할을 파악하여 상기 SAO 구조들을 추출하는 단계; 및
(b-4) 상기 특허 네트워크 생성 서버가 미리 정의한 불용어를 포함하고 있는 상기 SAO 구조들을 제거하고 이를 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 16항에 있어서,
상기 (b) 단계는,
상기 특허 네트워크 생성 서버가 상기 클라이언트에게 추출된 상기 SAO 구조를 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 (c) 단계는,
(c-1) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 기술적 유사성을 분석하기 위한 선택된 특허문서집합을 입력받아 상기 특허문서들의 상기 SAO 구조들을 상기 데이터베이스로부터 로딩하는 단계;
(c-2) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 일치여부를 자동으로 판단하기 위한 임계치를 입력받는 단계;
(c-3) 상기 특허 네트워크 생성 서버가 개념들 간의 상하위 관계에 대한 계층구조를 정의하는 개념관계정보를 참조하여 상기 특허문서들에 포함된 상기 SAO 구조들 간의 의미론적 문장 유사성을 추출하는 단계;
(c-4) 상기 특허 네트워크 생성 서버가 상기 SAO 구조들 간의 의미론적 문장 유사성을 사용하여 상기 SAO 구조들 간의 일치여부를 판단한 후 상기 특허문서들 간의 의미론적 유사성을 추출하는 단계; 및
(c-5) 상기 특허 네트워크 생성 서버가 상기 특허문서들 간의 의미론적 유사성을 사용하여 상기 유사성 행열을 생성하고 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 18항에 있어서,
상기 (c) 단계는,
상기 특허 네트워크 생성 서버가 상기 클라이언트에게 상기 유사성 행열을 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 (d) 단계는,
(d-1) 상기 특허 네트워크 생성 서버가 상기 클라이언트로부터 선택된 상기 유사성 행렬을 전달받아 상기 유사성 행렬을 상기 데이터베이스로부터 로딩하는 단계;
(d-2) 상기 특허 네트워크 생성 서버가 컷오프 값을 사용하여 특허 네트워크를 생성하는 단계; 및
(d-3) 상기 특허 네트워크 생성 서버가 상기 유사성 행렬 및 특허의 서지정보를 이용하여 특허 네트워크의 타입에 따른 상기 특허 네트워크 정보를 생성하고, 상기 특허 네트워크 및 특허 네트워크 정보를 상기 데이터베이스에 저장하는 단계를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 20항에 있어서,
상기 (d) 단계는,
상기 특허 네트워크 생성 서버가 상기 특허 네트워크 및 특허 네트워크 정보를 상기 클라이언트에게 전달하는 단계를 더 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 컷오프 값은 민감도 분석을 통해서 결정되어 미리 저장된 값을 사용하는 것을 특징으로 하는 특허 네트워크 분석 방법.
제 11항에 있어서,
상기 특허 네트워크 정보는,
DSI, GCI, TII 및 TCI 중 어느 하나 이상의 분석지표를 포함하는 것을 특징으로 하는 특허 네트워크 분석 방법.