KR20230139110A

KR20230139110A - 지식재산권 데이터 플랫폼

Info

Publication number: KR20230139110A
Application number: KR1020220037347A
Authority: KR
Inventors: 이정섭; 윤재원
Original assignee: 주식회사 지식피플
Priority date: 2022-03-25
Filing date: 2022-03-25
Publication date: 2023-10-05

Abstract

본 발명의 지식재산권 데이터 플랫폼은, 공개된 지식재산 정보를 통해 공개데이터를 수집하는 데이터 수집부와, 데이터 수집부로부터 지식재산 데이터를 분석하고, 기술분야 또는 지식재산 카테고리별로 가공하는 데이터 가공부와, 데이터 가공부를 통해 가공된 지식재산 정보를 이용한 지식재산 검색과, 고객의 지식재산권을 관리할 수 있는 고객관리를 포함하고, 고객관리는 지식재산 관리자 화면, 기한관리, 고객 지식재산 DB, 비대면상담, 비용관리를 포함하고, 지식재산 관리자 화면은 고객들의 지식재산권 리스트 및 지식재산권 각각의 세부정보(기한, 담당변리사, 진행상태)등이 제공될 수 있다.

Description

지식재산권 데이터 플랫폼{INTELLECTUAL PROPERTY DATA PLATFORM}

본 발명은 지식재산권 데이터 플랫폼에 관한 것으로서, 보다 상세하게는 지식재산권에 관련하여 기출원된 지식재산권 정보를 활용하고, 기업고객의 관리를 간편하게 할 수 있는 지식재산권 데이터 플랫폼에 관한 것이다.

일반적으로, 지식재산권은 특허권, 상표권 및 디자인권 등을 포함한다.

상기한 지식재산권에 대한 데이터(이하, "지식재산권 데이터"라 함)는 다양한 경로를 통하여 제공될 수 있으며, 스케쥴 검색, 선행기술 검색 및 리포트를 위하여 이용될 수 있다.

현재 지식재산권 데이터의 스케쥴 검색 및 선행기술 검색은 정형화된 로(Raw) 데이터를 활용하는 키워드 검색 수준으로 이루어지고 있으며, 검색 결과의 리포트는 검색 결과를 재가공하여 생성하는 수준으로 이루어지고 있다.

지식재산권 데이터는 광범위한 지식재산권 데이터 소스를 대상으로 수집 및 적재될 필요성이 있다.

그리고, 지식재산권 데이터를 이용한 다양한 서비스를 개발할 필요성이 있다. 예시적으로, 다양한 방식으로 수집된 지식재산권 데이터를 자연어 검색 기반으로 가공할 필요가 있으며, 가공된 지식재산권 데이터를 이용할 수 있는 다양한 서비스의 개발이 필요하다.

KR 공개 10-2007-0118352(출원인 : 주식회사 두빈, 명칭 : 지식재산권 정보 수집 및 분류 방법과 그 시스템) KR 등록 10-1839932(출원인 : 주식회사 고스디자인, 명칭 : 특허 상용화 서비스 제공 방법)

본 발명의 목적은 지식재산권 관리 자동화 서비스를 제공할 수 있는 지식재산권 데이터 플랫폼을 제공함에 있다.

본 발명의 다른 목적은 다양한 방식으로 수집된 지식재산권 데이터를 자연어 검색 기반으로 가공하고, 가공된 지식재산권 데이터를 이용하여 사용자에게 지식재산권 선행기술 동향 및 법률대리인(변리사)의 상세한 정보를 제공할 수 있는 서비스를 구현할 수 있는 지식재산권 데이터 플랫폼을 제공함에 있다.

본 발병의 또 다른 목적은 사용자의 기술분야와 대응되는 지식재산권 동향 및 변리사의 상세정보를 실시간 업데이터 되는 지식재산권 플랫폼을 제공함에 있다.

본 발명의 지식재산권 데이터 플랫폼은, 공개된 지식재산 정보를 통해 공개데이터를 수집하는 데이터 수집부; 상기 데이터 수집부로부터 지식재산 데이터를 분석하고, 기술분야 또는 지식재산 카테고리별로 가공하는 데이터 가공부; 상기 데이터 가공부를 통해 가공된 지식재산 정보를 이용한 지식재산 검색; 고객의 지식재산권을 관리할 수 있는 고객관리를 포함하고, 상기 고객관리는 지식재산 관리자 화면, 기한관리, 고객 지식재산 DB, 비대면상담, 비용관리를 포함하고, 상기 지식재산 관리자 화면는 고객들의 지식재산권 리스트 및 지식재산권 각각의 세부정보(기한, 담당변리사, 진행상태)등이 제공될 수 있다.

상기 기한관리는 지식재산권의 절차에 따른 법정기한일을 포함하고, 상기 버정기한일을 알람해주는 푸시기능을 포함하고, 상기 지식재산 관리자 화면에 표기될 수 있다.

상기 고객 지식재산 DB는 출원서, 지식재산 위임장, 출원명세서, 변리사 상담내용, 기술자료를 포함하고, 지식재산권 데이터 플랫폼의 데이터 베이스에 저장되고, 상기 지식재산권 데이터 플랫폼을 통해서 담당 고객에게 자료 송부가 가능하도록 자료 송부 기능을 포함할 수 있다.

상기 비대면 상담은 고객과 지식재산궈 데이터 플랫폼을 통해서 영상상담 및 상담내용을 보관 관리되고, 고객의 지식재산권 자료들과 분리 저장될 수 있고, 가공 또는 삭제가 불가할 수 있다.

상기 비용관리는 지식재산권 데이터 플랫폼 내에서 유료 광고 또는 유료 서비스에 대한 사용자 결제환경을 포함하고, 지식재산권 데이터 플랫폼의 이용 구독료, 기업의 유료광고 수수료를 포함하고, 고객과의 거래내역에 대한 자료(지식재산권 관납료 및 대리인 수수료 자료)를 포함하고, 미수금 관리기능을 포함할 수 있다.

본 발명은 지식재산권 데이터를 수집하고, 수집된 지식 재산권 데이터의 자연어 처리 및 유사도 추정을 통하여 라벨링된 텍스트 데이터를 데이터 스토리지에 저장할 수 있다.

지식재산 법률 대리인(변리사)은 모바일, 컴퓨터, 테블릿 등의 전자기기 화면을 통해서 상기 맞춤형 고객관리 및 지식재산 검색기능을 제공받을 수 있다.

지식재산 법률 대리인(변리사)은 지식재산 공개데이터를 통해서 맞춤형 지식재산 통합 서비스를 제공받을 수 있다.

지식재산 법률 대리인(변리사)은 지식재산 공개데이터를 통해 지식재산권 출원서, 논문, 지식재산 각종 전자문서, 판례 등을 통해서 신뢰성 있는 지식재산 정보를 제공받을 수 있다.

또한, 본 발명의 다른 실시예는 웹, 앱 또는 MS 환경 등 다양한 OS 환경에 대해 제공될 수 있으며, 언제 어디서나 지식재산권의 다양한 정보를 쉽게 제공할 수 있는 이점이 있다.

즉, 본 발명은 고가의 고객관리 시스템 및 지식재산 검색 시스템을 사용하지 않고도 저렴한 구독료로 간편하게 고객관리 및 지식재산 검색을 제공받을 수 있다.

도 1은 본 발명의 지식재산권 데이터 플랫폼의 바람직한 실시예를 나타내는 블록도.
도 2는 도 1의 지식재산권 데이터 플랫폼의 다른 실시예를 나타내는 블록도.
도 3은 본 발명의 실시예를 설명하는 도면.
도 4는 본 발명의 다른 실시예에 따른 빅데이터 기반 지식재산권 데이터 플래폼의 요소들을 나타낸 도면.

본 발명의 지식재산권 데이터 플랫폼은 자연어 처리 및 유사도 추정을 통한 데이터 분류 알고리즘을 적용하여 데이터를 처리하는 방법을 적용하여 실시될 수 있다.

본 발명의 지식재산권 데이터 플랫폼은 광범위하게 분포된 지식재산권 데이터 소스로부터 지식재산권 데이터를 수집하고, 수집된 지식 재산권 데이터의 자연어 처리 및 유사도 추정을 통하여 라벨링된 텍스트 데이터를 데이터 스토리지(DS)에 저장할 수 있으며, 저장된 텍스트 데이터를 이용하여 지식재산권 스캐쥴 관리, 선행기술 검색 및 리포트와 같은 서비스를 구현하기 위한 것이다.

이를 위하여 본 발명의 지식재산권 데이터 플랫폼은 데이터를 수집, 적재 및 분석할 수 있는 클라우드 형태의 빅 데이터 클럭스터를 구축할 수 있으며, 지식재산권 데이터를 핸들링하기 위한 가공 모듈과 학습 모듈을 구비할 수 있다.

도 1을 참조하면, 본 발명의 실시예는 지식재산권 데이터 소스(10)와 지식재산권 데이터 플랫폼(20)을 포함하는 것으로 예시할 수 있다.

지식재산권 데이터 소스(10)는 특허 정보의 크롤링이 가능한 사이트와 특정한 문서 형태로 특허 정보를 제공하는 저장소를 포함할 수 있다.

특허 정보는 출원인, 발명자, 발명의 명칭, 출원일, 출원번호, 공개일, 공개번호, 등록일, 등록번호, 요약서, 기술분야, 대표청구항, 청구범위, 발명의 내용, 발명의 효과, 특허분류 등의 요소 별 텍스트를 포함하는 것으로 정의될 수 있다.

그리고, 크롤링이 가능한 사이트는 KIPRIS와 같이 인터넷 주소를 가지며 크롤링에 의해 특허 정보의 수집이 가능한 사이트를 의미한다.

또한, 저장소는 상기한 특허 정보를 갖는 문서를 지정된 물리적 주소에 저장하는 저장 장치로 이해될 수 있다. 이때, 특허 정보를 갖는 문서는 *.HWP, *.DOC, *.PNG, *.PDF 등 다양한 포맷의 워드 프로세서 파일이나 이미지와 같은 전자 파일로 이해될 수 있고, 출원서, 명세서, 의견제출통지서, 의견서, 보정서, 등록결정서, 특허증 등과 같은 문서들이 해당될 수 있다. 그리고, 저장 장치는 서버와 같이 전자 파일을 저장할 수 있는 매체로 이해될 수 있다.

지식재산권 데이터 플랫폼(20)은 지식재산권 데이터를 수집하고, 수집된 지식 재산권 데이터의 자연어 처리 및 유사도 추정을 통하여 텍스트 데이터의 라벨링을 수행할 수 있다. 상기한 지식재산권 데이터 플랫폼(20)은 라벨링된 텍스트 데이터를 저장하는 데이터 스토리지(DS)를 포함할 수 있다.

지식재산권 데이터 플랫폼(20)이 지식재산권 데이터를 수집하고, 수집된 지식 재산권 데이터의 자연어 처리 및 유사도 추정을 통하여 라벨링된 텍스트 데이터를 데이터 스토리지(DS)에 저장하기 위한 구성은 도 2를 참조하여 후술한다.

먼저, 도 1에서 지식재산권 데이터 플랫폼(20)은 상기한 데이터 스토리지(DS), 지식재산권 데이터 서비스부(30), 사용자 인터페이스 제어부(40), 스케쥴 관리 인터페이스(50), 선행기술 검색 인터페이스(60) 및 리포트 인터페이스(70)를 포함하는 것으로 예시된다.

사용자 인터페이스 제어부(40)는 사용자에 의해 선택된 특정 분류 항목에 대한 스케쥴 관리, 상기 사용자에 의해 선택된 기술에 대한 선행기술 검색 및 상기 사용자에 의해 요청된 정보에 대한 리포트를 위한 인터페이스를 구성하도록 제어하는 인터페이스 제어 정보를 가질 수 있다.

사용자 인터페이스 제어부(40)는 상기한 인터페이스 제어 정보를 각각 스케쥴 관리 인터페이스(50), 선행기술 검색 인터페이스(60) 및 리포트 인터페이스(70)에 제공할 수 있으며, 스케쥴 관리 인터페이스(50), 선행기술 검색 인터페이스(60) 및 리포트 인터페이스(70)는 해당하는 인터페이스 정부에 의해 사용자에게 제공할 인터페이스를 구성할 수 있다.

사용자 인터페이스 제어부(40)는 웹(Web), 앱(App) 및 MS 환경 등에서 인터페이스를 구성할 수 있으며 사용자의 단말 환경에 맞게 인터페이스를 구성하도록 인터페이스 제어 정보를 제공할 수 있다. 이때, 사용자의 단말은 스케쥴 관리, 선행기술 검색 및 리포트를 위하여 유선 또는 무선 인터넷을 통하여 접속할 수 있는 컴퓨터나 모바일 단말 등으로 이해될 수 있다.

지식재산권 데이터 서비스부(30)는 스케쥴 검색 기능, 선행기술 검색 기능 및 리포트 기능을 제공할 수 있다. 여기에서, 스케쥴 검색 기능은 사용자에 의해 선택된 분류 항목에 대한 스케쥴 정보를 데이터 스토리지(DS)에서 검색하고 그 결과로서 스케쥴 검색 결과를 제공하는 것으로 이해될 수 있다. 그리고, 선행기술 검색 기능은 사용자에 의해 지정된 범위의 선행기술 검색 정보를 데이터 스토리지(DS)에서 검색하고 그 결과로서 선행기술 검색 결과를 제공하는 것으로 이해될 수 있다. 그리고, 리포트 기능은 사용자에 의해 요청된 리포트를 위한 정보를 데이터 스토리지(DS)에서 검색하고 그 결과로서 리포트 검색 결과를 제공하는 것으로 이해될 수 있다.

스케쥴 관리 인터페이스(50)는 사용자 인터페이스 제어부(40)에 의해 스케쥴 관리를 위한 제1 인터페이스를 사용자의 단말로 제공하고, 제1 인터페이스를 통하여 사용자의 분류 항목의 선택 및 키워드 입력을 수신하며 스케쥴 검색 결과를 제공하도록 구성될 수 있다. 제1 인터페이스는 사용자 인터페이스 제어부(40)에서 제공되는 인터페이스 제어 정보에 의해 구성될 수 있다.

스케쥴 관리 인터페이스(50)는 제1 인터페이스를 통하여 사용자가 선택한 분류 항목과 사용자가 입력한 키워드를 지식재산권 데이터 서비스부(30)로 제공할 수 있으며, 사용자가 선택한 분류 항목과 사용자가 입력한 키워드에 대응하여 수행한 스케쥴 검색 기능 결과를 수신하고, 결과를 제1 인터페이스를 통하여 사용자에게 제공할 수 있다.

선행기술 검색 인터페이스(60)는 사용자 인터페이스 제어부(40)에 의해 선행기술 검색을 위한 제2 인터페이스를 사용자의 단말로 제공하고, 제2 인터페이스를 통하여 사용자의 선행 기술 검색을 위한 범위를 수신하며 선행기술 검색 결과를 제공하도록 구성될 수 있다. 제2 인터페이스는 사용자 인터페이스 제어부(40)에서 제공되는 인터페이스 제어 정보에 의해 구성될 수 있다.

선행기술 검색 인터페이스(60)는 제2 인터페이스를 통하여 사용자가 입력한 선행기술 검색을 위한 범위를 지식재산권 데이터 서비스부(30)로 제공할 수 있으며, 선행기술 검색을 위한 범위에 대응하여 수행한 선행기술 검색 결과를 수신하고, 결과를 제2 인터페이스를 통하여 사용자에게 제공할 수 있다.

리포트 인터페이스(70)는 사용자 인터페이스 제어부(40)에 의해 리포트를 위한 제3 인터페이스를 사용자의 단말로 제공하고, 제3 인터페이스를 통하여 사용자의 리포트 요청을 위한 정보를 수신하며 리포트 검색 결과를 사용자가 설정함 폼으로 제공하도록 구성될 수 있다. 제3 인터페이스는 사용자 인터페이스 제어부(40)에서 제공되는 인터페이스 제어 정보에 의해 구성될 수 있다.

리포트 인터페이스(70)는 제3 인터페이스를 통하여 사용자가 입력한 리포트를 위한 요청 정보를 지식재산권 데이터 서비스부(30)로 제공할 수 있으며, 요청 정보에 대응한 리포트 검색 결과를 수신하고, 결과를 제3 인터페이스를 통하여 사용자에게 제공할 수 있다. 이때, 제3 인터페이스는 사용자가 리포트를 위하여 출력되는 폼을 선택하도록 구성될 수 있으며, 리포트 검색 결과를 사용자가 선택한 폼으로 제공할 수 있다.

상술한 바와 같은 스케쥴 관리, 선행기술 검색 및 리포트 제공과 같은 서비스를 제공하기 위하여 본 발명의 지식재산권 데이터 플랫폼(20)은 도 2와 같이 데이터 수집, 텍스트 데이터 가공, 전처리 유사도 측정 및 유사도 검증을 위한 부품들을 포함할 수 있다.

도 2를 참조하면, 지식 재산권 데이터 플랫폼(20)은 전처리 모듈로서 데이터 수집부(100), 텍스트 데이터 가공부(110), 전처리부(120), 텍스트 마이닝부(130) 및 형태소 분석부(140)를 포함할 수 있다.

전처리 모듈은 미리 설정된 지식재산권 데이터 소스(10)로부터 특허 정보를 수집하며, 수집된 특허 정보를 미리 설정된 요소 별 텍스트 데이터로 가공하는 전처리를 수행하도록 구성될 수 있다. 이때, 전처리는 텍스트 데이터의 자연어 처리를 위한 토큰화를 수행하는 형태소 분석과 의미 추출을 위한 텍스트 마이닝을 포함할 수 있다.

보다 구체적으로, 데이터 수집부(100)는 특허 정보의 크롤링이 가능한 사이트와 특정한 문서 형태로 특허 정보를 제공하는 지식재산권 데이터 소스(10)로부터 특허 정보를 수집하고, 수집된 특허 정보를 텍스트 데이터 가공부(110)로 제공하도록 구성될 수 있다. 여기에서, 데이터 수집부(100)는 클롤링을 위한 크롤링 기능을 갖도록 구성될 수 있으며, 미리 설정된 저장소의 특허 정보를 읽어오기 위한 수집 기능을 갖도록 구성될 수 있다.

텍스트 데이터 가공부(110)는 데이터 수집부(100)를 통해 수집된 특허 정보의 이미지와 텍스트를 분리하고, 텍스트를 파싱(Parsing)하기 위한 텍스트 데이터를 가공하며, 가공된 텍스트 데이터를 전처리부(120)에 제공하도록 구성될 수 있다.

텍스트 데이터 가공부(110)는 데이터 수집부(100)에서 *.HWP, *.DOC, *.PNG, *.PDF 등 다양한 포맷의 워드 프로세서 파일이나 이미지와 같은 전자 파일을 수신할 수 있다. 전자 파일은 출원서, 명세서, 의견제출통지서, 의견서, 보정서, 등록결정서, 특허증 등과 같은 문서들에 해당될 수 있다.

텍스트 데이터 가공부(110)는 특허 정보에서 이미지와 텍스트를 분리하며, 특허 요소들로 변환한 텍스트 데이터를 가공할 수 있고, 예시적으로 텍스트를 인식할 수 있는 이미지 형태의 텍스트 데이터를 데이터 전처리부(120)에 파싱하도록 구성될 수 있다. 이때, 특허 요소들은 요약, 청구범위, 발명의 내용 등으로 구분될 수 있다.

전처리부(120)는 형태소 분석부(140)를 이용한 텍스트 데이터의 형태소 분석과 텍스트 마이닝부(130)를 이용한 텍스트 데이터의 텍스트 마이닝을 수행함으로써 전처리된 텍스트 데이터를 유사도 측정 모듈의 유사도 측정부(160)로 제공하도록 구성될 수 있다.

상기한 형태소 분석부(140)는 텍스트 데이터에 포함된 형태소들을 분석하며, 분석된 형태소 별로 구분을 위한 태그를 붙일 수 있도록 구성될 수 있다. 그 결과, 형태소 분석부(140)는 텍스트 데이터의 형태소 분석에 의한 토큰화(Tokenization)를 수행할 수 있다.

형태소는 문장에서 역할을 식별하여 분류하는 것으로 예시적으로 명사, 동사, 형용사 등의 품사로 이해될 수 있다. 예시적으로, 명사는 보통명사, 고유명사, 수사 및 대명사 등으로 상세하게 구분될 수 있고, 동사는 일반 동사, 보조 동사 등으로 상세하게 구분될 수 있다. 형태소를 구분하기 위한 태그는 상세 구분이 가능하기 위한 값을 갖도록 구성될 수 있다.

예시적으로, 문장인 "태그를 붙이는 과정"은 "태그/를/붙/이는/과정"으로 형태소가 구분될 수 있으며, 각 형태소 별로 상세 구분에 해당하는 태그(Tag)가 부여될 수 있다.

텍스트 데이터의 형태소들을 분석하고 형태소 별로 구분을 위하여 태그를 붙이는 것이 텍스트 데이터의 형태소 토큰화로 이해될 수 있다. 즉, 토큰화된 텍스트 데이터는 형태소 별로 구분된 텍스트들과 형태소를 구분하는 태그들의 조합으로 이해될 수 있다.

한편, 텍스트 마이닝부(130)는 토큰화된 텍스트 데이터에 포함된 텍스트의 분석을 통하여 텍스트 데이터의 의미 추출을 위한 텍스트 마이닝을 수행하도록 구성된다.

텍스트 마이닝부(130)는 의미 추출을 위하여 토큰화된 텍스트 데이터를 이용하며, 형태소 구분을 통하여 자연어가 분류된 텍스트 데이터의 의미를 구분한다.

텍스트 마이닝부(130)는 의미를 구분하기 위하여 예시적으로, 형태소로 구분된 텍스트의 빈도 수로 중요도를 판단할 수 있다. 올바른 형태소의 구분을 위하여, 중요한 단어들을 묶어서 전체 문장을 대상으로 빈도 수가 계산될 수 있다. 이는 단어 청킹(Chunking)에 해당하는 것으로 이해될 수 있다. 빈도 수 기반의 단어 중요도 알고리즘은 FastText, GloVe, Word2Vec 등이 예시될 수 있다.

이와 같이 추출된 단어들의 특징은 키워드로 저장될 수 있으며, 이들의 패턴을 이용하여 텍스트를 클러스트링할 수 있다. 그리고, 각 클러스터에 대해 키워드의 빈도 수를 이용하여 해당 텍스트 클러스트를 정의하는 주요 개념을 정립할 수 있다. 그리고, 클러스트링된 텍스트 간의 관계를 분석하여 키워드 간의 상관 관계를 추출할 수 있다.

텍스트 데이터의 의미는 상기한 키워드의 빈도 수와 키워드 간의 상관 관계로써 구분될 수 있다.

상기와 같이 덱스트 데이터의 의미를 구분하는 것은 제작자의 의도에 따라 다양하게 구현될 수 있으므로 보다 구체적인 방법의 예시는 생략한다.

그리고, 지식 재산권 데이터 플랫폼(20)은 유사도 측정 모듈로서 유사도 측정부(160) 및 데이터 트레이닝 모델(170)을 포함할 수 있다.

유사도 측정 모듈은 텍스트 데이터를 이용한 사전 학습(Pre-traning)에 의한 데이터 트레이닝 모델(170)을 갖는다. 데이터 트레이닝 모델(170)은 라벨링되지 않은(Unlabeled) 대용량 데이터로 미리 학습한 모델을 의미한다.

유사도 측정부(160)는 데이터 트레이닝 모델(170)을 이용한 전이 학습(Transfer Learnig)을 통해 의미 기반 유사도를 측정한 결과에 해당하는 텍스트 데이터의 라벨링을 수행하여 미리 설정된 분류 항목들에 대한 유사도를 측정하도록 구성될 수 있다. 여기에서, 분류 항목들은 기술 구분을 위한 복수의 특허 분류 섹션들(예시적으로, IPC 분류, CPC 분류), 출원서의 분류 항목들(예시적으로, 출원인, 발명자 등) 및 명세서의 분류 항목들(예시적으로, 발명의 명칭, 목적, 효과, 요약, 발명의 내용, 청구항 등) 중 선택된 것을 이용할 수 있다.

그리고, 지식 재산권 데이터 플랫폼(20)은 유사도 검증 모듈로서 유사도 검증부(180)를 포함할 수 있다.

유사도 검증부(180)는 텍스트 데이터의 라벨링에 대한 정확도에 대한 검증을 수행할 수 있다.

유사도 검증부(180)는 통계적 분석을 통한 다양성, 라벨링 데이터의 구문 정확도 측정에 따른 구문 정확성, 원천 데이터와 라벨링 데이터 간의 의미 정확도 측정에 따른 의미 정확성 및 학습과 성능 테스트에 따른 유효성 대상으로 텍스트 데이터의 라벨링에 대한 검증을 수행하도록 구성될 수 있다.

그리고, 유사도 검증부(180)는 검증 결과를 데이터 트레이닝 모델(170)의 미세 튜닝(Fine Tuning)을 위하여 피드백하도록 구성될 수 있다.

예시적으로, 유사도 검증부(180)는 특허 요소들 별 기준으로 미세 튜닝을 위한 피드백을 수행하도록 구성할 수 있다.

데이터 트레이닝 모델(170)은 미세 튜닝에 의해 전이 학습의 정확도를 향상시킬 수 있으며, 유사도 측정부(160)는 미세 튜닝에 의해 개선된 전이 학습 능력을 갖는 데이터 트레이닝 모델(170)을 이용함으로써 보다 정확한 텍스트 데이터의 라벨링을 수행할 수 있다.

한편, 전처리 모듈의 전처리부(120)는 데이터 트레이닝 모델(170)의 트레이닝을 위한 트레이닝 데이터 세트를 생성할 수 있으며, 사전 학습을 위하여 트레이닝 데이터 세트를 유사도 측정 모듈에 해당하는 데이터 트레이닝 모델(170)에 제공할 수 있다.

상술한 지식재산권 데이터 플랫폼(20)은 본 발명의 데이터 처리 방법의 실시예가 적용된 것으로 이해될 수 있다.

본 발명의 데이터 처리 방법의 실시예는, 미리 설정된 지식재산권 데이터 소스로부터 특허 정보를 수집하는 단계; 수집된 상기 특허 정보의 이미지와 텍스트를 분리하고, 상기 텍스트를 파싱(Parsing)하기 위한 텍스트 데이터를 가공하는 단계; 상기 텍스트 데이터에 포함된 형태소들을 분석하며, 분석된 형태소 별로 구분을 위한 태그를 붙여서 상기 텍스트 데이터의 상기 형태소 분석에 의한 토큰화를 수행하는 단계; 토큰화된 상기 텍스트 데이터에 포함된 텍스트의 분석을 통하여 상기 텍스트 데이터의 의미 추출을 위한 상기 텍스트 마이닝을 수행하는 단계; 상기 텍스트 데이터의 상기 형태소 분석과 상기 텍스트 마이닝을 수행함으로써 전처리된 상기 텍스트 데이터를 유사도 측정을 위하여 제공하는 단계; 상기 텍스트 데이터를 이용한 사전 학습(Pre-traning)에 의한 데이터 트레이닝 모델을 이용하는 전이 학습(Transfer Learnig)을 통해 의미 기반 유사도를 측정한 결과에 해당하는 상기 텍스트 데이터의 라벨링을 수행하여 미리 설정된 분류 항목들에 대한 유사도를 측정하는 단계; 상기 텍스트 데이터의 라벨링에 대한 정확도에 대한 검증을 수행하고, 검증 결과를 상기 데이터 트레이닝 모델의 미세 튜닝(Fine Tuning)을 위하여 피드백하는 단계; 및 상기 유사도의 측정에 의해 라벨링된 상기 텍스트 데이터를 저장하는 단계;를 포함하는 것으로 이해될 수 있다.

예시적으로, 본 발명의 지식재산권 데이터 플랫폼(20)은 도 3과 같이 지식재산권 데이터 소스로부터 특정한 전자 문서 형태의 출원서 또는 지재권통지서(예시적으로, 출원번호통지서, 의견제출통지서, 등록결정통지서 등)를 수신하여 이미지파일 형태로 저장하거나 특정한 사이트의 로(Raw) 데이터 형태의 지식재산권 출원서 정보와 같은 데이터를 분석하여 저장하는 수집을 수행할 수 있다. 도 3의 지식재산 관리 플랫폼이 본 발명의 지식재산권 데이터 플랫폼(20)에 해당한다.

본 발명의 지식재산권 데이터 플랫폼(20)은 수집된 특허 정보의 이미지와 텍스트를 분리하고, 텍스트를 파싱(Parsing)하기 위한 텍스트 데이터를 가공하며, 가공된 텍스트 데이터에 포함된 형태소들을 분석한다. 그리고, 본 발명의 지식재산권 데이터 플랫폼(20)은 텍스트 데이터의 상기 형태소 분석에 의한 토큰화를 수행한 후 텍스트의 분석을 통하여 텍스트 마이닝을 수행하며, 상기한 형태소 분석과 텍스트 마이닝을 수행함으로써 전처리된 텍스트 데이터의 라벨링을 수행하고, 라벨링된 텍스트 데이터를 저장할 수 있다.

그러므로, 지식재산권 데이터 플랫폼(20)은 빅데이터 기반 관리정보를 제공할 수 있다.

상기한 빅데이터 기반 관리 정보는 다양한 형태로 제공될 수 있으며, 예시적으로, 지식재산권 데이터 플랫폼(20)은 스케쥴 관리 인터페이스(50) 또는 리포트 인터페이스(70)를 통하여 도 3과 같이 지식재산권 정보를 제공할 수 있다.

도 3의 지식재산권 정보는 특정 특허 출원에 대한 납기일 정보, 유사특허정보 및 기본정보를 포함하는 것을 예시하기 위한 것이다.

상술한 본 발명의 실시예는 지식재산 데이터의 수집, 적재 및 분석을 포함하는 핸들링을 위한 빅 데이터 클러스터를 클라우드 형태로 구축할 수 있다.

그리고, 본 발명의 실시예는 지식재산 데이터를 다양하게 수집할 수 있는 모듈을 구비할 수 있다.

그리고, 본 발명의 실시예는 지식재산 데이터를 가공 및 학습할 수 있는 모듈을 구비할 수 있다. 즉, 본 발명의 실시예는 지식재산 데이터를 가공하여 빅 데이터 클럭스터에 적재할 수 있으며, 적재된 지식재산 데이터는 형태소 분석과 텍스트 마이닝 후 학습에 의해 유사도를 측정할 수 있다. 그리고, 본 발명의 실시예는 측정된 유사도를 피드백할 수 있다.

본 발명의 실시예는 분석된 지식재산 데이터를 바탕으로 사용자 서비스에 필요한, 출원 정보, 스케쥴 정보, 유사도 측정, 선행기술 검색 등 다양한 기능들을 제공할 수 있으며, 각 기능들은 예시적으로 기능들을 위한 API의 적용으로 구현될 수 있다.

본 발명의 실시예는 상기와 같이 분석 결과로서 라벨링된 지식재산 데이터가 데이터 스토리지에 저장될 수 있으며, 데이터 스토리지에 저장된 지식재산 데이터를 이용하여 스케쥴 관리 기능, 선행기술검색 기능 및 리포트 기능을 제공할 수 있다.

리포트 기능은 예시적으로, 유사 기술 분포 현황, 기간 별 특허 동향, 국가 별 특허 동향 등의 다양한 데이터를 활용하여 인터페이스에서 선택할 수 있는 다양한 차트, 맵 또는 분포드 등의 폼으로 리포트를 제공하도록 구현될 수 있다.

본 발명의 실시예는 웹, 앱 또는 MS 환경 등 다양한 OS 환경에 대해 제공될 수 있으며, 자동화된 지식재산권 스케쥴기능, 리포트 기능, 분석 기능 등일 제공할 수 있는 이점이 있다.

즉, 본 발명은 저장된 텍스트 데이터를 이용하여 지식재산권 스캐쥴 관리, 선행기술 검색 및 리포트와 같은 다양한 서비스를 구현할 수 있으며, 지식재산권 관리 자동화 서비스를 제공할 수 있는 효과가 있다.

또한, 본 발명은 다양한 방식으로 수집된 지식재산권 데이터를 자연어 검색 기반으로 가공하고, 가공된 지식재산권 데이터를 이용하여 지식재산권 스케쥴 관리, 선행기술 검색 및 리포트 등 다양한 기능을 제공할 수 있는 서비스를 구현할 수 있는 효과가 있다.

도 4를 참조하면, 다른 실시예에 따른 지식재산 플랫폼(200)은 지식재산 법률 대리인(변리사)에게 맞춤형 지식재산 정보를 제공할 수 있다. 또한, 다른 실시예에 따른 지식재산 플랫폼은 사용자에게 빅데이터 기반의 신뢰성 있는 지식재산 데이터를 제공할 수 있다.

또한, 다른 실시예에 따른 지식재산 플랫폼(200)은 지식재산 법률 대리인(변리사) 맞춤형 지식재산 고객관리 및 사내관리 시스템으로 지식재산 법률 대리인(변리사)의 고객 지식재산권을 관리할 수 있는 고객관리 기능을 포함할 수 있다. 구체적으로 지식재산 플랫폼(200)은 고객 지식재산권의 기한관리, 기술동향, 지식재산 검색 등지식재산 법률 대리인(변리사) 맞춤형 기능을 포함할 수 있다.

본 발명의 지식재산 플랫폼(200)은 지식재산 데이터를 제공하는 공개데이터를 수집 및 가공할 수 있다. 여기서, 공개데이터는 지식재산 출원서, 논문, 대통령령 전자 회선을 통해 공개되는 기술문서일 수 있다. 본 발명의 지식재산 공계데이터는 특허, 상표, 디자인 및 실용신안 출원서 정보(310), 심사 판례정보(320), 전자문서 텍스트(330)를 포함할 수 있다.

상기 출원서 정보(310)는 기술의 선행기술, 발명의 상세한 설명, 출원인 정보, 출원일, 대리인 정보 등을 포함할 수 있다.

상기 판례정보(320)는 선행문헌들의 심사중에 발행된 거절이유, 보정, 의견서, 결과통지 등을 포함할 수 있다.

상기 전자문서 텍스트(330)는 심사관 거절이유, 출원인의 의견서, 심사관 인터뷰를 위한 자료, 유사선행문헌 등의 지식재산권 전자 문서의 텍스트 정보들을 포함할 수 있다.

상기 지식재산 플랫폼(200)은 데이터 수집부(210), 데이터 가공부(220) 및 변리사 데이터 분류 및 가공부(230)를 포함할 수 있다.

상기 데이터 수집부(210)는 상기 출원서 정보(310), 판례정보(320) 및 지식재산 전자문서 텍스트(330)를 수집할 수 잇다.

상기 데이터 가공부(220)는 상기 데이터 수집부(210)로부터 수집된 상기 출원서 정보(310), 판례정보(320) 및 지식재산 전자문서 텍스트(330)를 분류하여 필요한 정보를 분리 저장할 수 있다.

상기 지식재산 데이터 분류 및 가공(230)은 상기 데이터 가공(220)으로부터 수집된 상기 출원서 정보(310), 판례정보(320) 및 지식재산 전자문서 텍스트(330)의 분류된 정보를 이용하여 해당 지식재산권 자료들을 기술변로 분류하고 저장할 수 있다.

지식재산 법률 대리인(변리사)은 지식재산 검색(410) 및 기술동향 정보(420) 및 고객관리 기능을 제공받을 수 있다.

상기 지식재산 검색(410)은 지식재산 법률 대리인(변리사)에게 제공되는 지식재산 공개데이터 기능을 포함한다. 구체적으로 상기 지식재산 검색(410)은 검색기능을 포함하고, 출원 명세서내의 키워드 검색, 출원인 정보 검색, 출원기간 설정 등을 포함할 수 있다. 상기 지식재산 검색(410)은 상기 지식재산 플랫폼(200)의 데이터 수집부(210)에 수집되는 지식재산 공개데이터의 자료를 검색할 수 있다. 예컨대,상기 지식재산 검색(460)은 상기 데이터 수집부(210)의 지식재산 출원명세서를 검색 및 제공받을 수 있다. 따라서 지식재산 법률 대리인(변리사)은 별도의 지식재산 검색 채널을 사용하지 않고도 지식재산 플랫폼을 통해 지식재산 검색을 진행할 수 있다.

상기 기술동향 정보(420)는 사용자의 관심 분야 또는 관심 기술에 따른 지식재산 출원서 기준 기술동향으로써, 상기 지식재산 플랫폼(200) 내에서 관련 기술의 지식재산권 출원서 정보를 포함할 수 있다.

상기 기술동향 정보(420)는 지식재산 법률 대리인(변리사)가 상기 지식재산 플랫폼(200)내에서 기록하는 고객의 기술분야, 지식재산권 또는 검색정보를 통해서 해당 분야가 선택될 수 있다.

상기 고객관리 기능은 지식재산 관리자 화면(430), 기한관리(440), 고객 지식재산 DB(450), 비대면상담(460), 비용관리(470)를 포함할 수 있다.

상기 지식재산 관리자 화면(430)는 고객들의 지식재산 현황을 한눈에 확인할 수 있는 요소들을 포함한다. 구체적으로 지식재산 관리자 화면(430)은 모바일, 테블릿, 컴퓨터 등 전자기기에 제공될 수 있다. 예를 들면, 지식재산 관리자 화면(430)은 고객들의 지식재산권 리스트 및 지식재산권 각각의 세부정보(기한, 담당변리사, 진행상태)등을 제공할 수 있다.

상기 기한관리(440)는 고객들이 보유하고 있는 지식재산권 각각에 적용될 수 있다. 예컨대, 상기 기한관리(440)는 지식재산권의 절차에 따른 법정기한들을 포함할 수 있다. 상기 기한관리(440)는 기한일을 알람해주는 푸시기능을 포함할 수 있고, 상기 지식재산 관리자 화면(430)에 표기될 수 있다.

상기 고객 지식재산 DB(460)는 고객이 보유하고 있는 지식재산권 각각에 법률문서 및 증빙자료들을 포함하는 데이터 베이스일 수 있다. 예컨대, 지상기 고객 지식재산 DB(460)는 출원서, 지식재산 위임장, 출원명세서, 변리사 상담내용, 기술자료를 포함할 수 있다. 상기 고객 지식재산 DB(460)는 지식재산 플랫폼(200)의 데이터 베이스에 저장되고, 상기 고객 지식재산 DB(460)의 필요에 의해 수정 및 삭제 될 수 있고, 지식재산 플랫폼(200)을 통해서 담당 고객에게 자료 송부가 가능할 수 있다.

상기 비대면 상담(460)은 고객과 지식재산 플랫폼(200)을 통해서 영상상담 및 상담내용을 보관 관리할 수 있다. 비대면 상담(460)은 고객의 지식재산권 자료들과 분리 저장될 수 있고, 가공 또는 삭제가 불가하다.

상기 비용관리(470)는 상기 지식재산 플랫폼(200) 내에서 유료 광고 또는 유료 서비스에 대한 사용자 결제환경일 수 있다. 예컨대, 상기 비용관리(470)는 지식재산 플랫폼(200)의 이용 구독료, 기업의 유료광고 수수료를 포함할 수 있다.

또한, 상기 비용관리(470)는 고객과의 거래내역에 대한 자료들을 포함할 수있다. 예컨대, 상기 비용관리(470)는 고객의 지식재산권 관납료 및 대리인 수수료 자료를 포함하고, 미수금 관리기능을 포함할 수 있다.

Claims

공개된 지식재산 정보를 통해 공개데이터를 수집하는 데이터 수집부;
상기 데이터 수집부로부터 지식재산 데이터를 분석하고, 기술분야 또는 지식재산 카테고리별로 가공하는 데이터 가공부;
상기 데이터 가공부를 통해 가공된 지식재산 정보를 이용한 지식재산 검색;
고객의 지식재산권을 관리할 수 있는 고객관리를 포함하고,
상기 고객관리는 지식재산 관리자 화면, 기한관리, 고객 지식재산 DB, 비대면상담, 비용관리를 포함하고,
상기 지식재산 관리자 화면는 고객들의 지식재산권 리스트 및 지식재산권 각각의 세부정보(기한, 담당변리사, 진행상태)등이 제공되는 지식재산권 데이터 플랫폼.
제1 항에 있어서,
상기 기한관리는 지식재산권의 절차에 따른 법정기한일을 포함하고, 상기 버정기한일을 알람해주는 푸시기능을 포함하고, 상기 지식재산 관리자 화면에 표기되는 지식재산권 데이터 플랫폼.
제1 항에 있어서,
상기 고객 지식재산 DB는 출원서, 지식재산 위임장, 출원명세서, 변리사 상담내용, 기술자료를 포함하고, 지식재산권 데이터 플랫폼의 데이터 베이스에 저장되고, 상기 지식재산권 데이터 플랫폼을 통해서 담당 고객에게 자료 송부가 가능하도록 자료 송부 기능을 포함하는 지식재산권 데이터 플랫폼.
제1 항에 있어서,
상기 비대면 상담은 고객과 지식재산궈 데이터 플랫폼을 통해서 영상상담 및 상담내용을 보관 관리되고, 고객의 지식재산권 자료들과 분리 저장될 수 있고, 가공 또는 삭제가 불가한 지식재산권 데이터 플랫폼.
제1 항에 있어서,
상기 비용관리는 지식재산권 데이터 플랫폼 내에서 유료 광고 또는 유료 서비스에 대한 사용자 결제환경을 포함하고, 지식재산권 데이터 플랫폼의 이용 구독료, 기업의 유료광고 수수료를 포함하고, 고객과의 거래내역에 대한 자료(지식재산권 관납료 및 대리인 수수료 자료)를 포함하고, 미수금 관리기능을 포함하는 지식재산권 데이터 플랫폼.