KR100849690B1 - 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법 - Google Patents

특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법 Download PDF

Info

Publication number
KR100849690B1
KR100849690B1 KR1020060068998A KR20060068998A KR100849690B1 KR 100849690 B1 KR100849690 B1 KR 100849690B1 KR 1020060068998 A KR1020060068998 A KR 1020060068998A KR 20060068998 A KR20060068998 A KR 20060068998A KR 100849690 B1 KR100849690 B1 KR 100849690B1
Authority
KR
South Korea
Prior art keywords
data
information
ipc
classification
technical
Prior art date
Application number
KR1020060068998A
Other languages
English (en)
Other versions
KR20080009432A (ko
Inventor
정의섭
권오진
서진이
노경란
김완종
김태중
Original Assignee
한국과학기술정보연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술정보연구원 filed Critical 한국과학기술정보연구원
Priority to KR1020060068998A priority Critical patent/KR100849690B1/ko
Publication of KR20080009432A publication Critical patent/KR20080009432A/ko
Application granted granted Critical
Publication of KR100849690B1 publication Critical patent/KR100849690B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 과학 기술 분야의 논문이나 자료 등을 검색하기 위한 검색시스템에 관한 것으로 특히, 방대한 량과 신규 출간이 빈번한 과학 기술 분야의 논문이나 자료 등을 전 세계적으로 통용되고 있는 국제특허분류 코드를 이용하여 분류하고 이를 특허관련 정보와 연계하여 신규 기술 확보를 위한 선행 문헌의 검색시 원하는 정보에 대한 접근성을 높일 수 있도록 하기 위한 특허분류체계를 활용한 정보 검색 시스템에 관한 것이다.
키워드, IPC, 과학기술, 논문, 특허, 선행기술

Description

특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른 검색 방법{search system of information using formula for International Patent Classification and method for the same}
도 1은 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템의 구성 예시도
도 2는 본 발명에 따른 특허분류체계를 활용한 정보 검색 방법을 설명하기 위한 예시도
도 3은 본 특정 기술문헌의 초록으로부터 주제어를 추출하는 순서를 나타내는 순서도
도 4는 도 3에 따른 주제어별 빈도수를 나타내는 도면
도 5는 도 4에 따른 주제어별 순위를 나타내는 도면
도 6은 본 발명에 따른 특허분류체계를 활용한 정보 검색 결과의 예시도
<도면의 주요 부분에 대한 부호의 설명>
111 : 특허정보인식모듈 112 : IPC데이터베이스
113 : 특허기술용어검출모듈
114 : 특허기술용어 데이터베이스 생성모듈
115 : 특허용어DB 116 : 신조어 학습모듈
117 : 과학기술정보 연계검색모듈 118 : 문서통합인식모듈
119 : 과학기술용어검출모듈 120 : 용어비교모듈
121 : 과학기술자료 IPC분류모듈 122 : 과학기술자료 IPC분류DB
200 : 선행기술정보 검색모듈
본 발명은 과학 기술 분야의 논문이나 자료 등을 검색하기 위한 검색시스템에 관한 것이다. 과학기술 분야에 대한 새로운 정보는 매년 방대한 양의 문헌들이 쏟아져 나오고 있다. 본 발명은 방대한 양의 과학기술 분야의 논문이나 자료 등을 전 세계적으로 통용되고 있는 국제특허분류(IPC; International Patent Classification) 코드를 이용하여 분류하고 이를 특허관련 정보와 연계하여 신규 기술 확보를 위한 선행 문헌의 검색시 원하는 정보에 대한 접근성을 높일 수 있도록 하기 위한 특허분류체계를 활용한 정보 검색 시스템에 관한 것이다.
오늘날 극심한 지재권에 의한 각종 특허분쟁 속에서 기업이 생존하기 위해서는 유망 제품에 대한 종합적인 특허 전략의 수립이 필요하다. 기업의 이익 극대화를 위해서는 우수한 제품을 생산하여 판매하는 것 이외에 기술개발 단계에서 부터특허분쟁을 사전에 예방하는 철저한 전략을 수립하고, 관련 핵심 기술의 독자 개발 추진 및 특허 회피설계를 통한 로열티 절감 등의 대책 마련이 절실히 요구된다.
이러한 요구에 부응하기 위한 노력으로서, 관련 기술에 관한 산업 재산권의 철저한 분석과 이에 기초한 기술 개발 방향의 결정이 중요한 이슈가 되고 있다. 이러한 노력으로서는 선행 원천 특허권의 존재 여부, 원천 특허권의 회피 가능성 및 경쟁사의 기술 개발 동향 등에 관한 정보 분석 등이 그 내용이 될 수 있다.
상기한 바와 같이, 선행 산업 재산권 즉, 선행특허의 존재여부를 확인하기 위하여 선행특허에 대한 검색을 수행해야 한다.
종래 기술에 따른 선행특허검색은 일정의 사용자가 특허검색 서비스를 제공하는 인터넷 사이트에 접속한 후 선행특허검색을 위한 검색 키워드를 입력하면, 특허공보 중 검색 키워드에 관련된 선행특허가 검색되어 사용자에게 제공된다.
여기서, 검색 키워드에 관련되어 검색된 선행특허는 특허공보에 포함되어 있는 출원번호, 출원인, 발명자 등의 서지 사항과 요약서, 상세한 설명, 청구범위 및 도면을 포함한다.
이러한 특허문헌에 대한 선행기술의 검색이외에도 실질적으로는 과학 기술 분야의 논문이나 기술자료 역시 검색의 대상이 된다. 이러한 검색의 이유는 특정 특허의 유효성을 부정하기 위해서는 그 특허 출원전의 비특허 기술문헌에 그 기술이 이미 공지된 것인지를 확인하는 것이 필요하다.
그러나 논문 등의 과학기술 자료는 방대한 양이고, 매년 엄청난 자료들이 쏟아지고 있어서 검색이 용이하지 않고, 상당량의 금전적 부담을 지불하고 시간적으로 노력하였음에도 불구하고 정확한 기술조사에 어려움이 많다는 문제점이 발생되 었다. 그리고 통상 주제어 검색의 경우 해당 기술분야에서 사용되는 다양한 용어에 대해서 친숙하지 않는 경우 수많은 정보 중에서 관련된 일부 문헌만을 찾을 수 있는 위험성이 내포되어 있다.
위와 같은 기존 검색의 문제점을 해소하기 위한 본 발명의 목적은 방대한 양의 과학 기술 분야의 논문이나 자료 등을 전 세계적으로 통용되고 있는 국제특허분류 코드를 이용하여 분류하고 이를 특허관련 정보와 연계하여 기술 문헌의 검색시 원하는 정보에 대한 접근성을 높일 수 있도록 하기 위한 특허분류체계를 활용한 정보 검색 시스템을 제공하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템의 특징은, 어떤 국제특허분류(IPC)에 따른 해당 특허 자료를 로딩하여 특허기술용어를 추출하고 이를 데이터베이스화하는 특허기술용어 데이터베이스 구축모듈과; 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료에서 과학기술용어를 추출하고 이를 상기 특허기술용어 데이터베이스 구축모듈에서 구축되어진 데이터베이스를 기준으로 현재 검색되어진 과학 기술자료에 해당 국제특허분류(IPC) 코드를 부여하여 분류한 후 이를 데이터베이스화하는 과학 기술자료 IPC분류 구축 모듈; 및 일반적인 IPC분류 코드를 이용한 특허정보 검색엔 진을 가지며 선행특허정보의 검색을 요청하는 사용자에게 상기 과학 기술자료 IPC분류 구축 모듈을 통해 구축되어진 데이터베이스를 기준으로 사용자가 요청하는 IPC 분류코드 방식의 검색요청에 대해 해당 특허검색 자료 및 검색특허 자료에 대응하는 IPC분류코드에 해당하는 과학기술자료를 연계하여 제공하는 선행기술정보 검색모듈을 포함하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템의 상기 특허기술용어 데이터베이스 구축모듈은 특허 자료를 저장하고 있는 특허데이터베이스로부터 특허정보를 억세스하여 인식하기 위한 특허정보인식모듈과; 국제적으로 통용되고 있는 국제특허분류(IPC)에 따른 분류기준을 저장하고 있는 IPC데이터베이스와; 상기 IPC데이터베이스에 저장되어진 데이터를 기준으로 상기 특허정보인식모듈을 통해 특허데이터베이스로부터 데이터를 억세스하여 이중 기술용어를 검출하는 특허기술용어검출모듈; 및 상기 특허기술용어검출모듈을 통해 기술용어들과 해당 특허정보에 대응하는 국제특허분류를 기준으로 특허기술용어 데이터베이스를 생성하여 특허용어DB에 저장하는 특허기술용어 데이터베이스 생성모듈을 포함하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템은 상기 특허기술용어검출모듈을 통해 기술용어로 검출되지 않은 용어를 상기 특허용어DB에 저장되어 있는 용어들과 비교하여 신조어 여부를 판단하고 이를 학습하여 추후 특허정보검색 및 용어추출과정에서 상기 특허기술용어검출모듈 측에 신조어 기준으로 제공하는 신조어 학습모듈을 더 포함하는 데 있다.
상기와 같은 목적을 달성하기 위한 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템의 부가적인 또 다른 특징은, 상기 과학 기술자료 IPC분류 구축 모듈은 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료를 인식하고 이를 링크시키는 과학기술정보 연계검색모듈과; 상기 과학기술정보 연계검색모듈을 통해 링크되어진 과학기술자료의 문서형태를 텍스트로 인식하기 위한 문서 변환 및 전환과정을 통해 통합적인 문서인식을 수행하는 문서통합인식모듈과; 상기 문서통합인식모듈을 통해 텍스트로 인식되어진 과학기술 자료를 억세스하여 이중 기술용어를 검출하는 과학기술용어검출모듈과; 상기 과학기술용어검출모듈을 통해 검출되어진 기술용어와 상기 특허용어DB에 저장하는 특허기술용어를 비교하여 그 매칭도 등을 판별하는 용어비교모듈과; 상기 과학기술용어검출모듈을 통해 기술용어들과 해당 과학기술 정보에 대응하여 상기 용어비교모듈을 통해 출력되는 그 매칭도를 기 설정된 기준치에 의해 최적의 국제특허분류를 기준에 대응시켜 해당 과학기술 정보를 분류하는 과학기술자료 IPC분류모듈; 및 상기 과학기술자료 IPC분류모듈을 통해 분류되는 자료들에 대한 링크정보와 해당 자료의 IPC분류정보등을 저장하는 과학기술자료 IPC분류DB을 포함하는 데 있다.
본 발명의 상술한 목적과 여러 가지 장점은 이 기술 분야에 숙련된 사람들에 의해, 첨부된 도면을 참조하여 후술되는 본 발명의 바람직한 실시 예로부터 더욱 명확하게 될 것이다.
이하, 본 발명의 바람직한 실시 예를 첨부한 도면을 참조하여 상세히 설명한 다.
첨부한 도 1은 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템의 구성 예시도로서, 특허 자료를 저장하고 있는 특허데이터베이스(미도시)로부터 특허정보를 억세스하여 인식하기 위한 특허정보인식모듈(111)과, 국제적으로 통용되고 있는 국제특허분류(IPC)에 따른 분류기준을 저장하고 있는 IPC데이터베이스(112)와, 상기 IPC데이터베이스(112)에 저장되어진 데이터를 기준으로 상기 특허정보인식모듈(111)을 통해 특허데이터베이스로부터 데이터를 억세스하여 이중 기술용어를 검출하는 특허기술용어검출모듈(113)과, 상기 특허기술용어검출모듈(113)을 통해 기술용어들과 해당 특허정보에 대응하는 국제특허분류를 기준으로 특허기술용어 데이터베이스를 생성하여 특허용어DB(115)에 저장하는 특허기술용어 데이터베이스 생성모듈(114)과, 상기 특허기술용어검출모듈(113)을 통해 기술용어로 검출되지 않은 용어를 상기 특허용어DB(115)에 저장되어 있는 용어들과 비교하여 신조어 여부를 판단하고 이를 학습하여 추후 특허정보검색 및 용어추출과정에서 상기 특허기술용어검출모듈(113)측에 신조어 기준으로 제공하는 신조어 학습모듈(116)과, 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료를 인식하고 이를 링크시키는 과학기술정보 연계검색모듈(117)과, 상기 과학기술정보 연계검색모듈(117)을 통해 링크되어진 과학기술자료의 문서형태를 텍스트로 인식하기 위한 문서 변환 및 전환과정을 통해 통합적인 문서인식을 수행하는 문서통합인식모듈(118)과, 상기 문서통합인식모듈(118)을 통해 텍스트로 인식되어진 과학기술 자료를 억세스하여 이중 기술용어를 검출하는 과학기술용어검출모듈(119)과, 상기 과학기술용어검출모듈(119)을 통해 검출되어진 기술용어와 상기 특허용어DB(115)에 저장하는 특허기술용어를 비교하여 그 매칭도 등을 판별하는 용어비교모듈(120)과, 상기 과학기술용어검출모듈(119)을 통해 기술용어들과 해당 과학기술 정보에 대응하여 상기 용어비교모듈(120)을 통해 출력되는 그 매칭도를 기 설정된 기준치에 의해 최적의 국제특허분류를 기준에 대응시켜 해당 과학기술 정보를 분류하는 과학기술자료 IPC분류모듈(121)과, 상기 과학기술자료 IPC분류모듈(121)을 통해 분류되는 자료들에 대한 링크정보와 해당 자료의 IPC분류정보등을 저장하는 과학기술자료 IPC분류DB(122), 및 일반적인 IPC분류 코드를 이용한 특허정보 검색엔진을 가지며 선행특허정보의 검색을 요청하는 사용자에게 상기 과학기술자료 IPC분류DB(122)를 참조하여 사용자가 요청하는 자료에 대응하는 IPC분류코드에 해당하는 과학기술자료를 연계하여 제공하는 선행기술정보 검색모듈(200)로 구성된다.
상술한 바와 같은 구성을 갖는 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템에서의 각 주요 구성요소들의 특징을 부연하여 살펴보면, 특허정보인식모듈(111)은 기존의 특허검색 엔진을 의미하는 것으로, 인터넷 정보제공 웹 사이트 혹은 개별적인 저장매체 혹은 각국 특허청 자료실에 저장되어 있는 특허 문헌 데이터베이스로부터 특허정보를 검색하여 억세스 하는 기능을 수행한다.
또한, 과학기술정보 연계검색모듈(117) 역시 기존의 검색 엔진을 의미하는 것으로, 인터넷상에 존재하거나 연계되어진 각종 대학 자료실 혹은 과학논문지 등의 과학 기술 자료를 검색하여 해당 자료를 인식하고 이를 링크시키는 기능을 수행 한다.
이때 특허자료는 통상적으로 국제표준화 기구(ISO)의 표준안에 따른 SGML, 혹은 XGML 등의 표준 언어로 통용화되어 있으므로 큰 문제는 없으나, 과학 기술 자료는 전자문서라 하더라도 그 작성 툴(tool)이 현저하게 차이가 나는 경우가 상당히 존재한다. 예를 들어 대한민국내에서 사용되는 과학기술문헌 작성용 툴의 종류만 하여도 "한글", "훈민정음", "MS-Word", "Power Point" 외에 다수의 툴을 사용하기 때문에 과학기술정보인식을 위해서는 상기 과학기술정보 연계검색모듈(117)을 통해 연계 및 링크되어진 자료에 대해 문서인식을 위한 문서통합인식모듈(118)이 구비되어야 한다.
상기 문서통합인식모듈(118)은 문서의 작성용 툴을 다수개 구비하고 이를 기준으로 링크되는 과학기술 문서를 리딩할 수 있도록 하는 것으로, 하나의 예로써는 특허자료와 같이 SGML 혹은 XGML의 약식으로 변환하는 것도 하나의 예일 수 있다.
또한, 상기 구성중 특허기술용어검출모듈(113)과 과학기술용어검출모듈(119)은 동일기능을 갖는 구성으로써, 전자문서상의 텍스트를 인식하고 인식된 텍스트를 기준으로 해당 전자문서의 키워드를 추출하기 위한 것이다.
이와 같은 기술은 이미 상당부분 구현되어진 기술로써, 대표적으로는 대한민국 공개특허 2002-0003701호(명칭: 디지털 문서의 키워드를 자동으로 추출하는 방법)에 기재되어 있는 기술을 적용할 수도 있으며, 이외 다른 여러 선행기술을 사용할 수도 있다.
이와 같이, 구현되는 각 구성요소들을 기준으로 본 발명에 따른 검색 시스템 은 IPC데이터베이스(112)에 저장되어 있는 국제특허분류(IPC)를 기준으로 이중 어떤 IPC코드에 따른 해당 특허 자료를 특허정보인식모듈(111)을 통해 검색한 후 특허기술용어검출모듈(113)을 통해 해당 특허 문헌의 기술용어 혹은 키워드를 추출하게 된다.
이하 특허 문헌 및 기타 과학기술 문헌의 기술용어 혹은 주제어를 추출하는 하나의 실시예를 설명하면 다음과 같다.
도 3은 본 특정 기술문헌의 초록으로부터 주제어를 추출하는 순서를 나타내는 순서도이고, 도 4는 도 3에 따른 주제어별 빈도수를 나타내는 것이다. 도 5는 도 4에 따른 주제어별 순위를 나타내는 도면이다.
도 3은 소위 텍스트마이닝을 이용하여 주제어를 추출하는 순서를 나타내는 순서도로서 도시된 바와 같이 기술용어 즉 이 문헌의 주제어를 추출하는 과정은 선택된 특허문헌의 간략정보 중 초록 및 대표청구항의 텍스트를 이용하여 부수적 단어를 제거하는 과정, 접사를 배제하고 어근을 분리해내는 과정, 분리된 어근의 출현 빈도 계산 과정, 어근별 순위를 정하는 과정으로 이루어진다. 각 과정을 상세히 살펴보면 부수적 단어 제거 과정은 정관사나 대명사를 주제어 선정 과정에서 제외시키는 과정이며, 접사를 배제하고 어근을 분리해내는 과정은 문장의 특성을 결정지을 때 중심적인 역할을 하지 않는 접두사, 접미사 등을 제거하여 어근을 구분해 내는 과정이고, 분리된 어근의 출현 빈도 계산 과정은 각 지적재산권의 텍스트에서 상기 주제어 정보 저장부에 저장된 주제어별 출현 빈도를 계산함으로써 각 주제어별로 일정 횟수 이상 출현한 주제어에 대해서만 빈도를 저장하여 제공하는 과정이 다.
도 4는 도 3에 따른 기술문헌 정보의 초록에 존재하는 주제어별 출현 빈도수를 나타내는 도면이다. 여기서 A, B, C, D, E는 텍스트마이닝을 통해 선별된 주제어를 상징적으로 나타내는 것이다. 도5는 각 주제어별 순위를 나타내는 것으로서, 주제어 중 일정한 순위까지 만을 선택함으로써 결정된다. 통상 순위 중 5위까지만을 선택하는 것이 바람직하지만, 필요에 따라서는 사용자기 다른 숫자로 지정할 수도 있다.
이러한 방식으로 특정 IPC 분류에 해당하는 모든 문헌에 대해서 특허기술용어검출모듈(113)을 통해 추출되는 기술용어 혹은 키워드들을 검출빈도 순서로 소팅하여 검출빈도가 높은 순서로 특정 순서(예를 들어 20개)까지를 특정 IPC 분류에 해당하는 특허용어로 선택하여 특허기술용어 데이터베이스 생성모듈(114)을 통해 IPC분류코드와 함께 특허용어DB(115)에 저장되어 진다.
상술한 과정이 수행되어 전체 IPC분류 코드에 대한 기술용어 및 키워드 등이 데이터베이스화되어지면 IPC 분류에 해당하는 특허용어DB(115)가 완성되는 것이다.
한편 비특허문헌인 논문을 포함하는 과학기술문헌은 과학기술정보 연계검색모듈(117)과 문서통합인식모듈(118)을 통해 인터넷상에 존재하거나 연계되어진 과학기술 자료를 검색하여 각 문헌마다의 주제어 즉 기술용어를 특허문헌과 같은 방법으로 과학기술용어검출모듈(119)을 통해 과학기술용어를 추출하게 된다.
이때 상기 과학기술용어검출모듈(119)을 통해 검출되어진 기술용어와 상기 특허용어DB(115)에 저장하는 특허기술용어는 용어비교모듈(120)에서 비교되어지며, 상기 용어비교모듈(120)에서 그 매칭 정도에 대한 데이터 및 각 매칭정도에 대응하는 IPC분류코드의 정보를 과학기술자료 IPC분류모듈(121)측에 제공한다.
이 때 매칭 정도를 판단하는 하나의 예로서 각 과학기술문헌의 기술용어 즉 주제어(예를 들어 5개)들과 각 IPC별 특허용어DB 내의 기술용어를 비교하여 과학기술문헌의 기술용어 가장 많이 포함되어 있는 IPC를 찾는 방법이 있을 수 있다.
상기 과학기술자료 IPC분류모듈(121)은 상기 과학기술용어검출모듈(119)을 통해 기술용어들과 해당 과학기술 정보에 대응하여 상기 용어비교모듈(120)을 통해 출력되는 그 매칭도를 기 설정된 기준치에 의해 최적의 IPC분류코드를 선택하거나 복수 개를 선택할 수 있으며, 이렇게 선택되어진 IPC분류코드를 현재 과학기술용어검출모듈(119)을 통해 과학기술용어를 추출한 과학기술 문헌에 부여하게 된다.
따라서 과학기술자료 IPC분류DB(122)에는 검색되어졌던 임의의 과학기술자료의 링크정보와 해당 자료에 대한 IPC분류코드정보가 저장되어지게 된다.
이러한 방법으로 모든 비특허문헌인 과학기술문헌에 대해서 각각 해당되는 IPC 분류를 찾게되면 정보의 검색을 요청하는 사용자가 키워드 검색을 수행하지 아니하고, IPC분류 코드를 이용한 정보 검색을 요청하는 경우 상기 과학기술자료 IPC분류DB(122)를 참조하여 사용자가 요청하는 자료에 대응하는 IPC분류코드에 해당하는 과학기술자료를 해당 IPC분류코드에 따른 특허정보와 함께 제공할 수 있게 된다. IPC 분류가 H01M 8/00인 경우 본 발명에서 제시하는 특허분류 체계를 활용한 정보 검색 시스템을 이용한 하나의 예가 도 6에 나타나 있다.
물론, 키워드 검색을 수행하는 경우 일반적인 검색방식에 따라 과학기술자료 가 제공될 수 있음은 물론이다.
첨부한 도 2를 참조하여 상술한 동작 설명을 정리하여 보면 다음과 같다. 이때 첨부한 도 2는 본 발명에 따른 특허분류체계를 활용한 정보 검색 방법을 설명하기 위한 예시도이다.
스텝 S101에서 특허정보인식모듈(111)은 도시하지 않은 제어수단을 통해 검색 요청이 발생되는 경우 국제적으로 통용되고 있는 국제특허분류(IPC)에 따른 분류기준을 저장하고 있는 IPC데이터베이스(112)를 기준으로 특허 자료를 저장하고 있는 특허데이터베이스(미도시)로부터 특허정보를 검색하여 로딩(S102)하게 된다.
이후, 스텝 S103에서 특허기술용어검출모듈(113)은 상기 IPC데이터베이스(112)에 저장되어진 데이터를 기준으로 상기 특허정보인식모듈(111)을 통해 로딩되어진 특허정보에서 특허 기술설명을 위한 기술(전문)용어를 검출하게 된다.
상기 스텝 S103의 과정을 통해 기술(전문)용어를 검출이 이루어지면 스텝 S104의 과정을 통해 현재 로딩되어진 정보들에 대하여 더 이상의 정보가 존재하지 않는 가를 확인한다.
이때 임의의 IPC분류코드를 이용하여 검색되어 로딩되어진 특허정보 중 잔존하는 특허정보가 존재한다고 판단되는 경우 스텝 S105로 진행하여 현재까지 추출되어진 기술용어들을 카운팅하고 그 카운팅된 값을 스텝 S106의 과정을 통해 특허용어 DB(115)에 저장하게 된다.
상기 스텝 S105와 스텝 S106의 과정은 특허기술용어 데이터베이스 생성모듈(114)을 통해 수행되어진다.
상기 스텝 S104의 과정을 통해 현재 로딩되어진 정보들에 대하여 더 이상의 정보가 존재하지 않는 다고 판단되면 스텝 S107로 진행하여 특허정보를 검색하지 않은 다른 IPC코드가 존재하는 가를 판단하고, 만약 다른 IPC코드가 존재한다고 판단되면 스텝 S108로 진행하여 다른 IPC코드를 로딩한 후 스텝 S102로 진행하여 상술한 과정을 반복적으로 수행하게 된다.
모든 IPC코드에 대응하는 특허 정보들로부터 상기 과정을 통해 특허기술용어를 추출하고 이에 따른 각 추출용어들의 빈도수에 따른 데이터베이스를 최종적으로 스텝 S108의 과정에서 확정하게 된다.
이후 스텝 S110에서 과학기술정보 연계검색모듈(117)은 도시하지 않은 제어수단을 통해 검색 요청이 발생되는 경우 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료를 인식하고 이를 링크시키고, 스텝 S111에서는 문서통합인식모듈(118)과 과학기술용어검출모듈(119)을 통해 상기 과학기술정보 연계검색모듈(117)을 통해 링크되어진 과학기술자료의 문서형태를 텍스트로 인식한 후 텍스트로 변환되어진 과학기술 자료에서 기술용어를 검출하게 된다.
상기 스텝 S111의 과정을 통해 기술(전문)용어를 검출이 이루어지는 가운데 스텝 S112의 과정을 통해 현재 로딩되어진 과학기술자료에 대하여 더 이상 기술(전문)용어 추출을 위한 문헌 정보가 존재하지 않는 가를 확인한다.
문헌 정보가 존재한다고 판단되는 경우 스텝 S113으로 진행하여 현재까지 추출되어진 기술용어들을 카운팅하고 그 카운팅된 값을 스텝 S114의 과정을 통해 기술용어 DB(도시하지 않았음)에 임시 저장하게 된다.
상술한 과정을 통해 문헌 정보가 종료되어지면 스텝 S115의 과정으로 진행하여 용어비교모듈(120)은 상기 과학기술용어검출모듈(119)을 통해 검출되어진 기술용어와 상기 특허용어DB(115)에 저장하는 특허기술용어를 비교하여 그 매칭도 등을 판별하게 된다.
이후 상기 과학기술용어검출모듈(119)을 통해 기술용어들과 해당 과학기술 정보에 대응하여 상기 용어비교모듈(120)을 통해 출력되는 그 매칭도에 따라 과학기술자료 IPC분류모듈(121)은 스텝 S116의 과정에서 최적의 국제특허분류 코드정보를 해당 과학기술 정보를 분류기준으로 부여하고, 기술문헌에 대한 검색정보가 더 존재하는 가를 스텝 S117의 과정을 통해 확인하고 더 이상의 검색정보가 존재하지 않는다고 판단되는 경우 스텝 S118의 과정을 통해 상기 과학기술자료 IPC분류모듈(121)을 통해 분류되는 자료들에 대한 링크정보와 해당 자료의 IPC분류정보등을 저장하는 과학기술자료 IPC분류DB(122)를 확정하게 된다.
상기 상술한 각 과정은 시스템의 운영자에 의해 정기적으로 혹은 비정기적으로 수행되어 질 수 있다.
상술한 과정을 통해 과학기술자료 IPC분류DB(122)가 확정된 이후 임의의 사용자로부터 특허 검색요청이 존재하는 가를 판단(S118)하고, 특허 검색요청이 존재한다고 판단된 경우에는 IPC분류코드를 이용한 검색요청인가를 스텝 S119의 과정을 통해 확인 한다.
상기 스텝 S119의 판단 과정을 통해 사용자의 검색요청이 IPC코드 검색이 아닌 경우 스텝 S120로 진행하여 키워드 검색 모드를 수행하며, 상기 스텝 S119의 판 단 과정을 통해 사용자의 검색요청이 IPC분류코드를 이용한 검색이라 판단되면, 스텝 S121로 진행하여 본 발명에 따른 IPC 검색 모드를 수행하게 된다.
즉, 선행기술정보 검색모듈(200)을 통해 스텝 S123 내지 스텝 S125의 과정에 따라 일반적인 IPC분류 코드를 이용한 특허정보 검색엔진을 가동하고, 정보의 검색을 요청하는 사용자에게 상기 과학기술자료 IPC분류DB(122)를 참조하여 사용자가 요청하는 자료에 대응하는 IPC분류코드에 해당하는 특허자료에 그에 관련한 과학기술자료를 연계하여 제공하게 된다.
이상의 설명에서 본 발명은 특정의 실시 예와 관련하여 도시 및 설명하였지만 특허청구범위에 의해 나타난 발명의 사상 및 영역으로부터 벗어나지 않는 한도 내에서 다양한 개조 및 변화가 가능하다는 것을 당 업계에서 통상의 지식을 가진 자라면 누구나 쉽게 알 수 있을 것이다.
이상에서 설명한 바와 같은 본 발명에 따른 특허분류체계를 활용한 정보 검색 시스템을 제공하면, 방대한 양의 과학기술 논문이나 기술자료 문헌 등에 대한 정보를 전 세계적으로 통용되고 있는 국제특허분류 코드를 이용하여 분류하고 이를 특허관련 정보와 연계하여 기술문헌의 검색시 원하는 과학기술 문헌정보에 대해서 해당기술의 주제어를 잘 모르는 경우에도 접근성을 높일 수 있도록 한다.

Claims (10)

  1. 어떤 국제특허분류(IPC)에 따른 해당 특허 자료를 로딩하여 특허기술용어를 추출하고 이를 데이터베이스화하는 특허기술용어 데이터베이스 구축모듈과;
    인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료에서 과학기술용어를 추출하고 이를 상기 특허기술용어 데이터베이스 구축모듈에서 구축되어진 데이터베이스를 기준으로 현재 검색되어진 과학 기술자료에 해당 국제특허분류(IPC) 코드를 부여하여 분류한 후 이를 데이터베이스화하는 과학 기술자료 IPC분류 구축 모듈; 및
    일반적인 IPC분류 코드를 이용한 특허정보 검색엔진을 가지며 선행특허정보의 검색을 요청하는 사용자에게 상기 과학 기술자료 IPC분류 구축 모듈을 통해 구축되어진 데이터베이스를 기준으로 사용자가 요청하는 IPC 분류코드 방식의 검색요청에 대해 해당 특허검색 자료 및 검색특허 자료에 대응하는 IPC분류코드에 해당하는 과학기술자료를 연계하여 제공하는 선행기술정보 검색모듈을 포함하며,
    상기 특허기술용어 데이터베이스 구축모듈은 특허 자료를 저장하고 있는 특허데이터베이스로부터 특허정보를 억세스하여 인식하기 위한 특허정보인식모듈과;국제적으로 통용되고 있는 국제특허분류(IPC)에 따른 분류기준을 저장하고 있는 IPC데이터베이스와; 상기 IPC데이터베이스에 저장되어진 데이터를 기준으로 상기 특허정보인식모듈을 통해 특허데이터베이스로부터 데이터를 억세스하여 이중 기술용어를 검출하는 특허기술용어검출모듈; 및 상기 특허기술용어검출모듈을 통해 기술용어들과 해당 특허정보에 대응하는 국제특허분류를 기준으로 특허기술용어 데이터베이스를 생성하여 특허용어DB에 저장하는 특허기술용어 데이터베이스 생성모듈을 포함하며,
    상기 특허기술용어검출모듈을 통해 기술용어로 검출되지 않은 용어를 상기 특허용어DB에 저장되어 있는 용어들과 비교하여 신조어 여부를 판단하고 이를 학습하여 추후 특허정보검색 및 용어추출과정에서 상기 특허기술용어검출모듈측에 신조어 인식 기준을 제공하는 신조어 학습모듈을 더 포함하는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 시스템.
  2. 삭제
  3. 삭제
  4. 제 1항에 있어서,
    상기 과학 기술자료 IPC분류 구축 모듈은 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료를 인식하고 이를 링크시키는 과학기술정보 연계검색모듈과;
    상기 과학기술정보 연계검색모듈을 통해 링크되어진 과학기술자료의 문서형태를 텍스트로 인식하기 위한 문서 변환 및 전환과정을 통해 통합적인 문서인식을 수행하는 문서통합인식모듈과;
    상기 문서통합인식모듈을 통해 텍스트로 인식되어진 과학기술 자료를 억세스하여 이중 기술용어를 검출하는 과학기술용어검출모듈과;
    상기 과학기술용어검출모듈을 통해 검출되어진 기술용어와 상기 특허용어DB에 저장하는 특허기술용어를 비교하여 그 매칭도를 판별하는 용어비교모듈과;
    상기 과학기술용어검출모듈을 통해 기술용어들과 해당 과학기술 정보에 대응하여 상기 용어비교모듈을 통해 출력되는 그 매칭도를 기 설정된 기준치에 의해 최적의 국제특허분류를 기준에 대응시켜 해당 과학기술 정보를 분류하는 과학기술자료 IPC분류모듈; 및
    상기 과학기술자료 IPC분류모듈을 통해 분류되는 자료들에 대한 링크정보와 해당 자료의 IPC분류정보등을 저장하는 과학기술자료 IPC분류DB을 포함하는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 시스템.
  5. 국제특허분류(IPC)를 기준으로 특허검색엔진을 통해 어떤 국제특허분류(IPC)에 따른 해당 특허 자료들을 로딩하여 특허기술용어를 추출하고 이를 데이터베이스로 생성하는 제 1과정과;
    인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색엔진을 통해 검색하고 해당 자료에서 과학기술용어를 추출한 후 이를 상기 제 1과정을 통해 생성되어진 데이터베이스를 비교하여 동일 혹은 유사도가 높은 특허기술용어에 해당하는 국제특허분류(IPC) 코드를 현재 검색되어진 과학 기술자료에 부여하여 분류한 후 이를 데이터베이스화하는 제 2과정; 및
    IPC분류 코드를 이용한 선행특허정보의 검색을 요청하는 사용자에게 특허검색엔진을 통해 해당 국제특허분류(IPC)에 따른 해당 특허 자료들을 로딩하여 제공함과 동시에 상기 제 2과정을 통해 생성되어진 데이터베이스를 기준으로 사용자가 요청하는 IPC 분류코드에 해당하는 과학기술자료를 연계하여 제공하는 제 3과정을 포함하며,
    상기 제 1과정은 국제적으로 통용되고 있는 국제특허분류(IPC)에 따른 분류기준에 따라 특허 자료를 저장하고 있는 특허데이터베이스로부터 임의의 국제특허분류 코드에 대응하는 특허정보를 억세스하는 제 1단계와; 상기 제 1단계를 통해 억세스되어진 특허정보에서 기술용어를 추출하는 제 2단계; 전체 국제특허분류코드에 대해 상기 제 1단계와 제 2단계를 반복적으로 수행하여 기술용어들과 해당 특허정보에 대응하는 국제특허분류를 기준으로 하는 특허기술용어 데이터베이스를 생성하는 제 3단계를 포함하며,
    상기 제 2단계를 통해 기술용어로 검출되지 않은 용어를 상기 제 3단계를 통해 생성되어진 데이터베이스의 정보와 비교하여 신조어 여부를 판단하고 이를 학습하여 상기 제 2단계를 통한 기술용어 추출에 정확도를 신장시키는 제 4단계가 상기 제 1과정에 더 포함하는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 방법.
  6. 삭제
  7. 제 5항에 있어서,
    상기 제 2단계를 통해 추출되어진 기술용어를 사용빈도를 기준으로 특징 기술용어로 선정하는 특징 기술용어 선정단계를 더 포함하는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 방법.
  8. 삭제
  9. 제 5항에 있어서,
    상기 제 2과정은 인터넷상에 존재하거나 연계되어진 과학 기술자료를 검색하여 해당 자료를 인식하고 이를 링크시키는 제 1단계와;
    상기 제 1단계를 통해 링크되어진 과학기술자료의 문서형태를 텍스트로 인식하기 위한 문서 변환 및 전환과정을 통해 통합적인 문서인식을 수행하는 제 2단계와;
    상기 제 2단계를 통해 텍스트로 인식되어진 과학기술 자료에서 기술용어를 검출하는 제 3단계와;
    상기 제 3단계를 통해 검출되어진 기술용어를 상기 제 1과정에서 생성된 데이터베이스와 비교하여 그 매칭정도를 판별하는 제 4단계와;
    상기 제 4단계를 통해 판별되어진 매칭정도를 기 설정된 기준치에 의해 해당 과학기술 정보를 최적의 국제특허분류로 분류하는 제 5단계; 및
    상기 제 5단계를 통해 분류되어진 자료들에 대한 링크정보와 해당 자료의 IPC분류정보등을 데이터베이스화하는 제 6단계를 포함하는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 방법.
  10. 제 9항에 있어서,
    인터넷상에 존재하거나 연계되어진 과학 기술자료에 대해 상기 제 1단계 내지 제 6단계의 과정이 반복적으로 수행되는 것을 특징으로 하는 특허분류체계를 활용한 정보 검색 방법.
KR1020060068998A 2006-07-24 2006-07-24 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법 KR100849690B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020060068998A KR100849690B1 (ko) 2006-07-24 2006-07-24 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020060068998A KR100849690B1 (ko) 2006-07-24 2006-07-24 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법

Publications (2)

Publication Number Publication Date
KR20080009432A KR20080009432A (ko) 2008-01-29
KR100849690B1 true KR100849690B1 (ko) 2008-07-31

Family

ID=39221822

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020060068998A KR100849690B1 (ko) 2006-07-24 2006-07-24 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법

Country Status (1)

Country Link
KR (1) KR100849690B1 (ko)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101067846B1 (ko) * 2009-07-27 2011-09-27 (주)더비엔아이 특허 평가 시스템 및 그 방법, 이를 구현하기 위한 프로그램을 기록한 디지털 처리장치가 판독 가능한 기록매체
KR101385452B1 (ko) * 2012-11-28 2014-04-24 한국과학기술정보연구원 네트워크 분석 방법을 이용한 연구개발 우선순위 결정 장치 및 방법
KR102032258B1 (ko) * 2017-07-04 2019-10-15 울산과학기술원 링크 분석을 통한 융합기술 예측 방법
KR102139128B1 (ko) * 2018-04-24 2020-08-11 황도일 플랫폼 시스템

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991751A (en) 1997-06-02 1999-11-23 Smartpatents, Inc. System, method, and computer program product for patent-centric and group-oriented data processing
JP2000099530A (ja) 1998-09-22 2000-04-07 Nri & Ncc Co Ltd 情報検索出力装置、情報検索出力方法および記録媒体
KR20010086860A (ko) * 2000-03-03 2001-09-15 최식, 김일수 데이터 검색 및 분석 시스템과 방법
KR20030012516A (ko) * 2001-08-01 2003-02-12 (주) 위즈도메인 특허 데이터베이스로부터 특허간의 상호관계를 분석하여제공하는 방법
KR20030075501A (ko) * 2002-03-19 2003-09-26 (주) 위즈도메인 특허 데이터베이스로 부터 대상 특허의 가계 경로를 빠른시간내에 분석하여 제공하는 방법
KR20050034458A (ko) * 2003-10-09 2005-04-14 엘지전자 주식회사 정보 검색 시스템과 그에 따른 검색 정보 디스플레이 방법
KR20060016933A (ko) * 2004-08-19 2006-02-23 함정우 문서분류장치 및 문서분류방법

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5991751A (en) 1997-06-02 1999-11-23 Smartpatents, Inc. System, method, and computer program product for patent-centric and group-oriented data processing
JP2000099530A (ja) 1998-09-22 2000-04-07 Nri & Ncc Co Ltd 情報検索出力装置、情報検索出力方法および記録媒体
KR20010086860A (ko) * 2000-03-03 2001-09-15 최식, 김일수 데이터 검색 및 분석 시스템과 방법
KR20030012516A (ko) * 2001-08-01 2003-02-12 (주) 위즈도메인 특허 데이터베이스로부터 특허간의 상호관계를 분석하여제공하는 방법
KR20030075501A (ko) * 2002-03-19 2003-09-26 (주) 위즈도메인 특허 데이터베이스로 부터 대상 특허의 가계 경로를 빠른시간내에 분석하여 제공하는 방법
KR20050034458A (ko) * 2003-10-09 2005-04-14 엘지전자 주식회사 정보 검색 시스템과 그에 따른 검색 정보 디스플레이 방법
KR20060016933A (ko) * 2004-08-19 2006-02-23 함정우 문서분류장치 및 문서분류방법

Also Published As

Publication number Publication date
KR20080009432A (ko) 2008-01-29

Similar Documents

Publication Publication Date Title
KR102123974B1 (ko) 유사 특허 검색 서비스 시스템 및 방법
AU2022201654A1 (en) System and engine for seeded clustering of news events
US7814102B2 (en) Method and system for linking documents with multiple topics to related documents
US9069842B2 (en) Accessing documents using predictive word sequences
CN106446071B (zh) 信息处理装置及方法
US20080235220A1 (en) Methodologies and analytics tools for identifying white space opportunities in a given industry
CN107102993B (zh) 一种用户诉求分析方法和装置
CN111767716A (zh) 企业多级行业信息的确定方法、装置及计算机设备
CN101097570A (zh) 一种自动识别分类广告类型的广告分类方法
KR20180072167A (ko) 유사특허 추출 시스템 및 그 방법
EP1288792A1 (en) A method for automatically indexing documents
AU2002331728A1 (en) A method for automatically indexing documents
KR100849690B1 (ko) 특허분류 체계를 활용한 정보 검색 시스템 및 그에 따른검색 방법
US20170154294A1 (en) Performance evaluation device, control method for performance evaluation device, and control program for performance evaluation device
CN114117038A (zh) 一种文档分类方法、装置、系统及电子设备
KR20140026796A (ko) 맞춤형 특허분석 서비스 시스템 및 그 방법
CN112487181B (zh) 关键词确定方法和相关设备
JP2001184358A (ja) カテゴリ因子による情報検索装置,情報検索方法およびそのプログラム記録媒体
Hirsch et al. Evolving rules for document classification
KR101458857B1 (ko) 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
CN115668176A (zh) 信息检索系统
WO2015125088A1 (en) Document characterization method
KR101078966B1 (ko) 문서 분석 시스템
Mahajani et al. Ranking-based sentence retrieval for text summarization
JP2008090396A (ja) 電子文書検索方法、電子文書検索装置及びプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120712

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20130531

Year of fee payment: 6

LAPS Lapse due to unpaid annual fee