KR20070047544A - 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템 - Google Patents

유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템 Download PDF

Info

Publication number
KR20070047544A
KR20070047544A KR1020050104402A KR20050104402A KR20070047544A KR 20070047544 A KR20070047544 A KR 20070047544A KR 1020050104402 A KR1020050104402 A KR 1020050104402A KR 20050104402 A KR20050104402 A KR 20050104402A KR 20070047544 A KR20070047544 A KR 20070047544A
Authority
KR
South Korea
Prior art keywords
similarity
search
keyword
weight
applying
Prior art date
Application number
KR1020050104402A
Other languages
English (en)
Inventor
김정진
Original Assignee
김정진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김정진 filed Critical 김정진
Priority to KR1020050104402A priority Critical patent/KR20070047544A/ko
Priority to US12/090,480 priority patent/US20080288489A1/en
Priority to PCT/KR2006/003125 priority patent/WO2007052883A1/en
Priority to JP2008538794A priority patent/JP2009515249A/ja
Publication of KR20070047544A publication Critical patent/KR20070047544A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/11Patent retrieval

Abstract

유사도를 적용하여 특허 문서를 검색하는 방법 및 그 시스템이 개시된다. 유사도를 적용하여 특허 문서를 검색하는 방법은 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계; 검색 키워드로 데이터 베이스에 기 저장된 문서를 검색하는 단계; 및 검색 키워드를 입력받아 검색된 문서에 대하여, 검색 키워드의 문서에서의 출현 빈도, 검색 키워드 간의 근접도 및 어순도 중 어느 하나 이상을 측정함으로써 검색 키워드와의 유사도를 평가하는 단계로 구성된다.
따라서, 특허 문서를 검색 키워드 포함 여부에 따른 단순 나열이 아닌 검색 키워드와의 유사 정도에 따라서 정렬함으로써 검색 서비스 사용자가 보다 빠르고 간편하게 원하는 특허 문서를 손쉽게 검색할 수 있다.
특허 문서 검색, 키워드, 정렬, 유사도 평가, 출현 빈도, 근접도, 어순도

Description

유사도를 적용하여 특허 문서를 검색하는 방법 및 그 시스템{Method for Searching Patent Document by Applying Degree of Similarity and System thereof}
도 1은 종래의 특허 검색 서비스를 제공하는 인터넷 사이트 중 하나인 www.kipris.or.kr에서 특허 검색을 실시하는 화면을 나타내는 도면이다.
도 2는 종래의 특허 검색 서비스를 제공하는 인터넷 사이트 중 하나인 www.wips.co.kr에서 특허 검색을 실시하는 화면을 나타내는 도면이다.
도 3은 본 발명의 실시예에 따른 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 절차를 나타내는 흐름도이다.
도 4는 본 발명의 실시예에 따른 출현 빈도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
도 5는 본 발명의 실시예에 따른 근접도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
도 6은 본 발명의 실시예에 따른 어순도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
도 7은 본 발명의 실시예에 따른 유사도 측정에 적용되는 항목 상호간의 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
도 8은 본 발명의 실시예에 따른 유사도를 평가한 결과로서 키워드의 출현수를 기준으로 정렬하여 사용자에게 제공되는 화면을 나타내는 도면이다.
도 9는 본 발명의 실시예에 따른 유사도를 평가한 결과로서 키워드의 순서를 기준으로 정렬하여 사용자에게 제공되는 화면을 나타내는 도면이다.
도 10은 본 발명의 실시예에 따른 유사도가 평가된 후에 문서의 상세 정보가 사용자에게 제공되는 화면을 나타내는 도면이다.
도 11은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 검색 키워드를 조합하여 입력하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
도 12는 본 발명의 실시예에 따른 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템의 구성을 나타내는 블록도이다.
본 발명은 유사도를 적용하여 특허 문서를 검색하는 방법 및 그 시스템에 관한 것으로, 더욱 상세하게는 특허 문서 검색 서비스에 있어서 검색 키워드의 출현 빈도수, 근접도 및 어순도 등의 가중치를 두어 유사도를 측정함으로써 측정된 유사도 순서에 따라 특허 문서를 검색하는 방법 및 그 시스템에 관한 것이다.
오늘날, 산업재산권의 확보는 기업의 경쟁력과 밀접한 관련을 가진다. 선행 특허권의 존재를 모른 채 예산을 들여 신제품 개발을 하였다가 특허 분쟁에 휘말리 거나 과다한 로열티 지급으로 인해 경영에 타격을 입고, 나아가 어렵게 개발한 그 신기술을 포기해야 하는 지경에 이르는 경우가 종종 발생한다.
유효한 산업 재산권의 확보 여부가 사업의 성패를 좌우하게 되는 이른바 '특허 전쟁의 시대'에 살고 있는 것이다. 특허 전쟁의 환경 속에서 기업이 생존하기 위해서는 유망 제품에 대한 종합적인 특허 전략의 수립이 필요하다. 특허 분쟁을 사전에 예방하고, 관련 핵심 기술의 독자 개발 추진 및 특허 회피 설계를 통한 로열티 절감 등의 대책 마련이 절실히 요구된다.
이러한 요구에 부응하기 위한 노력으로서, 관련 기술에 관한 산업 재산권의 철저한 분석과 이에 기초한 기술 개발 방향의 결정이 우선적으로 요구된다. 선행 원천 특허권의 존재 여부, 원천 특허권의 회피 가능성 및 경쟁사의 기술 개발 동향 등에 관한 정보 분석 등이 그 내용이 될 수 있다.
상기한 바와 같이, 선행 산업 재산권 즉, 선행 특허의 존재 여부를 확인하기 위해서는 선행 특허에 대한 검색을 수행해야 한다.
그런데, 일반적인 문서 검색 엔진에서는 선행 특허에 대한 자세한 정보를 얻기가 어렵다. 즉, 선행 특허의 내용을 담고 있는 특허 문서는 일반적인 문서와는 다른 고유의 특성상, 출원일, 출원인, 등록 여부 등을 비롯한 서지 사항과 청구항, 발명의 상세한 설명, 도면 등의 특허 공보의 내용을 자세히 검색하기 위해서 특허 문서 검색을 전문으로 하는 인터넷 사이트에서 검색하는 방법이 이용되고 있는 것이다.
종래 기술에 따른 선행 특허 검색은 검색자가 특허 검색 서비스를 제공하는 인터넷 사이트(예를 들면, http://www.kipris.or.kr 또는 http://www.wips.co.kr)에 접속한 후 선행 특허 검색을 위한 검색 키워드를 입력하면, 특허 공보 중 검색 키워드에 관련된 선행 특허가 검색되어 검색자가 원하는 특허의 기본 서지 내용과 대표도면 등을 화면에서 스크롤하면서 볼 수 있도록 제공된다.
도 1은 종래의 특허 검색 서비스를 제공하는 인터넷 사이트 중 하나인 www.kipris.or.kr에서 특허 검색을 실시하는 화면을 나타내는 도면이다.
상기 사이트에서 검색하고자 하는 특허 문서와 관련된 키워드를 입력하면 도 1에서와 같이, 검색 키워드와 관련되어 검색된 특허 문서들에 대한 목록이 사용자 화면에 나열된다. 여기서, 검색된 특허 문서들에 대한 목록은 출원 번호 순서 또는 등록이나 취하, 거절 등의 상태 또는 출원 일자 또는 발명의 명칭 등의 순서대로 나열되도록 사용자가 선택할 수 있다.
그러나, 이와 같이 검색된 특허 문서 목록은 단지 사용자가 출원일 또는 출원 번호나 발명의 명칭 등을 빠른 순서 또는 가나다 순으로 보기 편하게 정열해 놓은 것에 불과한 것으로서, 사용자가 찾고자하는 특허 문서가 검색 키워드와 얼마나 유사한 지, 즉 내용이 유사한 정도에 따라 순서대로 특허 문서를 정열 해주는 데에는 한계가 있다. 따라서, 사용자는 검색된 수많은 특허 문서들 중에서 자기가 찾고자 하는 문서와 가장 유사하여 참고가 될만한 특허 문서를 선택하기 위해서 일일이 문서 목록 하나하나를 클릭하여 상세 내용을 검색해야만 하는 불편이 있다.
즉, 특허 문서를 검색 키워드와 내용적 측면에서 유사한 정도에 따라 정렬해 주는 것이 아닌 단지 형식적인 기준에 의해서 정렬함으로써, 특허 문서를 검색하는 데 있어서 많은 불편이 따르고 시간상으로도 많은 시간이 소요되는 비효율적인 검색 방법인 것이다. 이는 키워드와 관련되어 검색된 특허 문서가 많으면 많을수록 그 수고와 불편이 더욱 가중되는 것으로서, 초를 다투는 특허 전쟁에 있어서 비용적 부담과 더불어 기술적 경쟁에 있어서도 뒤처지게 되는 문제점이라 할 것이다.
도 2는 종래의 특허 검색 서비스를 제공하는 인터넷 사이트 중 하나인 www.wips.co.kr에서 특허 검색을 실시하는 화면을 나타내는 도면이다.
www.kipris.or.kr에서처럼 www.wips.co.kr에서도 키워드를 입력하면 도 2와 같이 관련된 특허 문서들의 목록이 나타난다. 그러나 이 역시 국가나 특허 번호 또는 발명의 명칭 등의 형식적 사항에 따라 특허 문서를 정렬시켜줄 뿐 키워드와의 유사한 정도에 따라서 목록을 보여주지는 못한다.
이처럼, 종래의 특허 검색 서비스는 형식적 사항에 따라 특허 문서를 정렬시켜줄 뿐 내용적으로 유사한 정도에 따라 목록을 정렬해 주지 못하기 때문에, 사용자가 가장 유사한 특허 문서를 찾기 위해서 목록 전체를 일일이 건별로 확인해야만 하는 불편함과 시간적, 비용적 낭비가 큰 문제점이 있다.
또한, 특허 검색에 있어서 초보자들은 검색된 선행 특허 목록만 가지고서 어떤 특허 문서가 찾고자 하는 정보인지를 쉽게 판단하기가 어렵고, 검색된 선행 특허가 많을수록 검색시간이 오래 걸리는 문제점이 있다.
물론, 특허 문서가 아닌 일반적인 문서를 검색하는 서비스를 제공하는 인터넷 사이트(예를 들어, http://www.naver.com 등) 중에도 일반 문서를 유사도 순으로 정렬해주는 기능이 있긴 하지만, 유사도를 평가하는 기준이 세분화되어 있지 않 으며 사용자가 직접 유사도 평가 기준을 취향에 맞게 설정할 수 없는 문제점이 있다.
상기와 같은 문제점을 해결하기 위한 본 발명의 목적은 특허 문서 검색에 있어서 검색 키워드의 포함 여부에 따른 단순 나열이 아닌 검색 키워드와의 유사한 정도에 따라서 특허 문서를 정렬함으로써 특허 문서 검색 서비스 사용자가 보다 빠르고 간편하게 원하는 특허 문서를 손쉽게 검색할 수 있게 하는 특허 문서 검색 방법 및 그 시스템을 제공하는 것이다.
또한, 본 발명의 다른 목적은 특허 문서가 아닌 일반 문서의 검색에 있어서도, 문서의 유사도를 평가하는 기준을 세분화하고 사용자가 취향에 맞게 유사도 평가 기준을 설정할 수 있게 함으로써 보다 정교하고 신뢰성이 있으며 사용자 중심적인 검색이 가능하도록 하는 문서 검색 방법 및 그 시스템을 제공하는 것이다.
상기 목적을 달성하기 위한 본 발명의 일 특징에 의하면, 특허 공보의 내용을 포함하는 특허 문서를 검색하는 서비스 제공 방법에 있어서, (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계; (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 특허 문서를 검색하는 단계; 및 (c) 상기 검색 키워드를 입력받아 검색된 상기 특허 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 단계를 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법이 제공된다.
상기 목적을 달성하기 위한 본 발명의 또 다른 특징에 의하면, 일반 문서를 검색하는 서비스 제공 방법에 있어서, (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계; (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 일반 문서를 검색하는 단계; 및 (c) 상기 검색 키워드를 입력받아 검색된 상기 일반 문서에 대하여, 상기 검색 키워드의 상기 일반 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 단계; 및 (d) 상기 출현 빈도, 상기 근접도, 상기 어순도 및 상기 유사도 중 어느 하나의 항목에 대한 순서에 따라 상기 특허 문서를 정렬하는 단계를 포함하는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법이 제공된다.
상기 목적을 달성하기 위한 본 발명의 또 다른 특징에 의하면, 문서를 검색하는 서비스 제공 시스템에 있어서, 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 키워드 입력부; 상기 문서의 문서 데이터를 저장하는 데이터 베이스부; 상기 검색 키워드로 상기 데이터 베이스부에 기 저장된 상기 문서를 검색하는 문서 검색부; 및 상기 문서 검색부에 의해 검색된 상기 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 유사도 평가부를 포함하는 것을 특징으로 하는 유사도를 적용하 여 문서 검색 서비스를 제공하는 시스템이 제공된다.
또한, 본 발명의 프로세서는 기계적 독출이 가능한 기록매체와 기록매체에 저장되고, 기계적 독출이 가능한 프로그램 코드를 구비한다. 프로그램 코드는 다음 단계들을 포함한다. (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계; (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 문서를 검색하는 단계; 및 (c) 상기 검색 키워드를 입력받아 검색된 상기 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 단계.
이하, 본 발명의 바람직한 실시예를 첨부된 도면들을 참조하여 상세히 설명한다. 우선 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.
도 3은 본 발명의 실시예에 따른 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 절차를 나타내는 흐름도이다.
특허 문서 검색 서비스의 사용자가 찾고자 하는 선행 특허와 관련이 있는 검색 키워드를 입력하면(S300), 입력받은 검색 키워드를 이용하여 데이터 베이스에 미리 저장되어 있는 특허 문서들을 검색한다(S302).
이 때 사용자는 검색 키워드를 하나 이상 입력할 수 있으며, 여러 가지의 검색 키워드들을 조합하여 한꺼번에 입력함으로써 검색 키워드의 조합을 구성하여 입력할 수도 있다.
한편, 데이터 베이스에는 미리 특허 문서에 대한 정보 데이터 풀이 저장되어 있어야 하는데 이는 일반적으로 제공되는 검색 엔진에서와 마찬가지이다. 본 발명의 실시예로서, 사용자가 특허 문서 파일을 MDB 형식의 파일로 작성하여 저장한 데이터를 이용할 수 있다. 예를 들어, 앞서 설명한 wwww.wips.co.kr에서 사용자가 검색 키워드로 일차적으로 특허 문서를 검색하면 검색된 특허 문서를 사용자가 MDB 파일 형태로 저장할 수가 있는데, 이렇게 저장된 MDB 파일을 특허 문서에 대한 데이터 베이스의 기초로 하여 검색을 하게 되는 것이다. 즉, wwww.wips.co.kr를 통해 일차적으로 검색 및 MDB 파일 형태로 저장한 수많은 특허 문서 데이터도 이를 본 발명에 따른 특허 문서의 데이터 베이스로 하여 본 발명에 따라 유사도를 적용하여 특허 검색을 할 수 있는 것이다.
입력된 검색 키워드로 검색 키워드 또는 검색 키워드의 동의어를 포함하는 특허 문서가 있는지 특허 문서의 데이터 베이스를 조사하여(S304), 검색 키워드와 관련된 특허 문서가 발견되면 발견된 특허 문서에 대해서 유사도를 평가하게 된다(S306).
즉, 검색 키워드로 검색된 특허 문서들에 대해서 그 특허 문서가 검색 키워드와 얼마나 유사한 상관관계를 가지는지 즉, 유사도를 측정하는 것이다. 여기서 유사도를 측정하는 기준은 다양한 형태가 될 수 있는데, 보다 상세한 내용은 후술 하도록 한다.
검색된 특허 문서들에 대해서 유사도가 평가되면 검색된 특허 문서들을 정렬하여 사용자에게 디스플레이하게 된다(S308).
여기서, 검색된 특허 문서를 평가된 유사도가 높은 문서부터 낮은 문서 순서대로 정렬하면, 사용자가 곧바로 검색 키워드와 가장 유사한 특허 문서부터 차례대로 간편하게 파악할 수 있게 된다.
한편, 본 발명의 바람직한 실시예에 따른 검색된 특허 문서의 유사도를 평가하는 단계(S306)는 크게 세 가지 형태 즉, "출현 빈도", "근접도", "어순도"의 측정으로 진행될 수가 있다.
먼저, "출현 빈도"에 대해 설명하면 다음과 같다. 사용자에 의해 입력된 검색 키워드가 검색된 특허 문서에서 발견된 정도 즉, 출현 빈도를 측정함으로써 검색 키워드와 특허 문서와의 유사도를 평가할 수가 있다. 따라서 검색된 특허 문서들 중에서 검색 키워드가 많이 출현하면 할수록 그 특허 문서는 유사도가 더 높게 평가되는 것이다. 이는 검색 키워드가 많이 출현된 만큼 그 문서의 핵심 키워드로서 관련 내용이 더 많고 유사하다는 것을 통계적으로 나타내주는 지표가 될 수 있기 때문이다.
또한, 본 발명의 실시예에 의하면, 출현 빈도는 단순히 검색 키워드의 출현 횟수만이 아닌 또 다른 조건을 부가함으로써 더욱 세밀하고 신뢰성 있는 유사도 측정을 할 수가 있다.
즉, 본 발명의 바람직한 실시예에 의하면, 검색 키워드의 출현 빈도에 대해 서 "키워드 가중치", "파트별 가중치" 및 "문장수 대비 가중치" 등을 적용할 수가 있는데, 각각에 대한 상세한 설명은 다음과 같다.
"키워드 가중치"는 사용자가 입력한 검색 키워드 자체의 가중치로서 다른 검색 키워드와의 상대적인 중요도를 반영하는 값이다. 즉, 사용자가 검색 키워드를 둘 이상 입력한 경우, 입력된 검색 키워드 간에는 문서 검색에 있어서 키워드로서의 중요도가 다를 수 있기 때문에 각 키워드별로 키워드 가중치를 적용하게 되는 것이다. 따라서 똑같이 키워드가 10번씩 출현되더라도 상위 개념인가 하위 개념인가, 일반 명사인가 등에 따라서 그 키워드의 중요도가 상대적으로 차이가 나기 때문에 키워드 가중치가 상대적으로 높은 키워드가 많이 출현될수록 그 특허 문서의 출현 빈도를 높게 평가할 수가 있는 것이다.
"파트별 가중치"는 검색 키워드가 문서의 어떤 파트에서 발견되었는가에 따라서 그 중요도를 달리 적용하는 것을 나타내는 값이다. 본 발명의 실시예에 따르면, 특허 문서의 검색은 특허 문서 중 3개의 파트 예를 들어, 발명의 명칭, 요약, 대표 청구항에서 이루어지는데, 검색 키워드가 같은 특허 문서 내에서 발견되더라도 문서의 어떤 파트에서 발견되었는가에 따라서 그 중요도가 달라질 수 있기 때문이다. 즉, 똑같이 검색 키워드가 출현하더라도 발명의 명칭 부분에서 발견되는 것이 요약 부분에서 발견되는 것보다 좀 더 유사도가 높다고 볼 수 있는 것이다. 따라서 파트별 가중치 값이 높은 파트에서 키워드가 많이 발견될수록 그 특허 문서의 출현 빈도가 높게 평가될 것이다.
"문장수 대비 가중치"는 검색된 문서의 문장수에 비하여 키워드가 얼마나 많 은 문장에서 발견되는가를 나타내는 값이다. 검색된 문서는 분야나 내용에 따라서 그 내용이 많을 수도 있고 작을 수도 있는데, 같은 수의 키워드가 출현하더라도 그 문서의 길이가 작을수록 그만큼 그 키워드가 차지하는 비중이 상대적으로 크다고 볼 수가 있는 것이다. 본 발명의 실시예에 따르면, 문서에 기술된 내용의 양을 전체 문장의 수로 판단하는데, 검색 키워드가 몇 문장에 한 번 꼴로 나오는지를 측정함으로써 문장수 대비 가중치를 측정할 수가 있다. 예를 들어 키워드가 3문장에 한번 나오는 문서와 5문장에 한번 나오는 문서가 발견되었다면, 각각의 문서에서 같은 수의 키워드가 출현되었어도 3문장에 한번 나오는 문서가 더 문장수 대비 가중치가 높고 출현 빈도도 높다고 판단할 수 있는 것이다.
이처럼, 검색 키워드의 출현 빈도에 대해서 별도의 가중치 조건 즉, "키워드 가중치", "파트별 가중치" 및 "문장수 대비 가중치" 등을 적용하여 측정하게 되면, 키워드의 출현 빈도를 보다 더 정교하고 신뢰성 있게 측정할 수가 있다.
한편, 이상과 같은 출현 빈도를 측정하기 위해 사용되는 별도의 가중치들은 사용자가 직접 편의에 따라 그 가중치 설정값들을 임의로 설정, 해제 및 변경이 가능하다. 즉, "키워드 가중치"는 각 키워드마다, "파트별 가중치"는 원하는 파트마다, "문장수 대비 가중치"는 발견되는 기준 문장수에 따라 사용자가 상대적인 값들을 정할 수가 있는 것이다.
도 4는 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 출현 빈도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
사용자가 검색 키워드로서 "검색", "질의", "엔진" 이라는 키워드 또는 동의어를 입력한 경우에, 각각의 키워드들에 대해서 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치에 대한 값들을 설정 또는 변경, 해제할 수 있다.
또한, 출현 빈도 측정에 사용된 키워드 또는 가중치 설정값 등의 데이터들을 사용자가 저장 및 불러오기, 또는 편집도 가능하도록 할 수 있다.
한편, 본 발명의 실시예에 따른 검색된 특허 문서의 유사도를 평가하는 단계(S306)는 앞서 설명한 "출현 빈도"의 측정 외에도 검색 키워드 간의 "근접도"를 측정함으로써 검색 키워드와 특허 문서와의 유사도를 평가할 수 있다.
근접도는 입력된 검색 키워드의 수가 둘 이상인 경우에 적용되는 것으로서, 각 키워드가 얼마나 인접하여 문서에 존재하는가를 나타내는 값이다. 즉, 검색된 문서에 검색 키워드들이 서로 가까이 존재하면 할수록 그 문서와 검색 키워드 간의 상관 관계가 더 높다고 평가할 수 있는 것이다.
근접도는 근접도 측정에 있어 세부 조건을 부가함으로써 더욱 세밀하고 신뢰성 있는 유사도 측정을 할 수가 있는데, 본 발명의 바람직한 실시예에 의하면, 검색 키워드의 근접도에 대해서 "키워드 쌍 가중치" 및 "근접 정도별 가중치" 등을 적용할 수가 있다.
"키워드 쌍 가중치"는 사용자가 입력한 검색 키워드들 중에서 둘 이상의 검색 키워드들로 구성된 키워드 쌍 자체의 가중치이다. 즉, 사용자는 입력한 검색 키워드를 조합하여 여러 가지의 키워드 쌍을 구성할 수가 있는데, 그러한 키워드 쌍의 다른 키워드 쌍에 대한 상대적인 중요도를 반영하는 값인 것이다. 따라서 같은 수의 키워드 쌍이 발견되더라도 키워드 쌍 가중치가 더 높은 키워드 쌍이 많이 발견될수록 그 문서의 근접도 및 유사도가 높게 평가되는 것이다.
"근접 정도별 가중치"는 키워드 쌍에 존재하는 키워드들이 문서 안에서 얼마나 가까운 거리로 존재하고 있는지를 나타내는 값이다.
본 발명의 실시예에 의하면, 근접 정도별 가중치는 문서의 문장 수를 단위로 하여 측정할 수가 있다. 즉, 키워드 쌍이 같은 문장 내에서 존재하면 중요도가 매우 높고, 키워드 쌍이 발견되는 거리(문장수)가 멀먼 멀수록 그 중요도가 점점 낮아진다고 할 수 있는 것이다. 즉, 키워드 간의 근접 거리(예를 들어 동일 문장 ~ 10문장)에 따라 중요도 값을 단계적으로 설정할 수 있는데, 본 발명의 바람직한 실시예에 의하면, 키워드 쌍의 키워드가 근접하는 정도를 다음과 같이 6단계로 구분하여 적용할 수가 있다. 즉, 키워드 쌍을 이루는 키워드들이 동일 문장 내에 있는 경우 근접 정도별 가중치는 1.2가 되고, 1 ~ 2 문장 이내에 있는 경우 근접 정도별 가중치는 1.0이 되며, 3 ~ 4 문장 이내에 있는 경우는 0.8, 5 ~ 6 문장 이내에 있는 경우는 0.6, 7 ~ 8 문장 이내에 있는 경우는 0.4, 9 ~ 10 문장 이내에 있는 경우는 0.2와 같이 가중치를 설정할 수가 있다.
도 5는 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 근접도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
사용자가 입력한 키워드들에 대해서 키워드 쌍이 구성되면, 도 5에서와 같이 각각의 키워드 쌍에 대해서 키워드 쌍 가중치 및 근접 정도별 가중치를 설정할 수 가 있다. 즉, 사용자가 입력한 키워드 중 "검색"과 "질의"를 키워드 쌍으로 구성하여(키워드 쌍 이름을 "근접도1"이라고 사용자가 정한 경우임) 그 키워드 쌍 가중치를 1로 설정하고, 근접 정도별 가중치를 앞서 설명한 바와 같이 6단계로 나누어 각각에 대한 가중치 값들을 설정한 것을 나타낸다. 또한, "검색"과 "질의"와 "엔진"을 키워드 쌍으로 구성하여(키워드 쌍 이름을 "근접도2"라고 사용자가 정한 경우임) 마찬가지로 키워드 쌍 가중치 및 근접 정도별 가중치를 설정한 것을 나타낸다.
이 때도 앞서 출현 빈도 측정에서 설명한 각각의 키워드들에 대한 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치에 대한 값들은 물론, 구성된 각각의 키워드 쌍들에 대해서 키워드 쌍 가중치, 근접 정도별 가중치에 대한 값들을 사용자가 설정 또는 변경, 해제할 수 있다.
또한, 근접도 측정에 사용된 키워드 쌍 또는 키워드 쌍 가중치, 근접 정도별 가중치 설정값 등의 데이터들을 사용자가 저장 및 불러오기, 또는 편집도 가능하도록 할 수 있다.
한편, 본 발명의 실시예에 따른 검색된 특허 문서의 유사도를 평가하는 단계(S306)는 앞서 설명한 "출현 빈도" 및 "근접도"의 측정 외에도 검색 키워드 간의 "어순도"를 측정함으로써 검색 키워드와 특허 문서와의 유사도를 평가할 수 있다.
어순도는 근접도와 마찬가지로 입력된 검색 키워드의 수가 둘 이상인 경우에 적용되는 것으로서, 각 키워드들이 얼마나 문서의 문장 내에서 주어진 순서에 따라 존재하는가를 나타내는 값이다. 예를 들어, 검색된 문서에 검색 키워드들이 한 문장 속에 나타난 경우에 주어진 조건 순서대로 출현하면 할수록 그 문서와 검색 키 워드 간의 상관 관계가 더 높다고 평가할 수 있는 것이다.
어순도는 어순도 측정에 있어 세부 조건을 부가함으로써 더욱 세밀하고 신뢰성 있는 유사도 측정을 할 수가 있는데, 본 발명의 바람직한 실시예에 의하면, 검색 키워드의 어순도에 대해서 "어순 키워드 쌍 가중치" 및 "어순 정도별 가중치" 등을 적용할 수가 있다.
"어순 키워드 쌍 가중치"는 앞서 근접도 측정에서 설명한 "키워드 쌍 가중치"와 같은 것으로서, 입력된 검색 키워드들 중에서 어순도를 측정하기 위해 필요한 둘 이상의 검색 키워드들로 구성된 키워드 쌍 자체의 가중치이다. 즉, 사용자는 어순도 측정을 위해서, 입력한 검색 키워드를 조합하여 여러 가지의 키워드 쌍을 구성할 수가 있는데, 그러한 키워드 쌍의 다른 키워드 쌍에 대한 상대적인 중요도를 반영하는 값인 것이다.
"어순 정도별 가중치"는 키워드 쌍에 존재하는 키워드들이 문장 안에서 얼마나 주어진 순서에 따라 존재하고 있는지를 나타내는 값이다.
본 발명의 실시예에 의하면 어순 정도별 가중치는, 어순 키워드 쌍에 존재하는 키워드들이 문서 중 어떤 한 문장 내에 존재하는 경우, 키워드들이 존재하는 순서 즉, 어순 형태에 따라서 가중치를 두어 측정될 수 있다. 즉, 키워드들이 키워드 쌍에 주어진 순서대로 존재하면 그 중요도가 매우 높고, 순서가 달라지면 그 중요도가 떨어진다고 할 수 있는데, 이는 같은 수의 키워드들이 발견되더라도 문서에 존재하는 키워드들의 조합 순서에 따라서 그 중요도가 다를 수 있기 때문이다.
본 발명의 바람직한 실시예에 의하면, 키워드 쌍의 어순도를 키워드 쌍에 존 재하는 키워드의 수에 따라서 다음과 같이 2단계 또는 6단계로 구분하여 적용할 수가 있다. 즉, 키워드 쌍을 이루는 키워드가 두 개인 경우에, (a,b) 순서로 존재하는 경우와 거꾸로 (b,a) 순서로 존재하는 경우에 대해 각각 가중치를 달리 적용할 수 있다. 또한, 키워드 쌍을 이루는 키워드가 세 개인 경우에는, (a,b,c) (a,c,b), (b,c,a), (b,a,c), (c,a,b), (c,b,a)의 어순 형태로 존재하는 경우에 대해 각 어순 형태에 대한 상대적인 가중치를 달리 적용할 수 있는 것이다.
도 6은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 어순도 측정에 적용되는 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
사용자가 입력한 키워드들에 대해서 키워드 쌍이 구성되면, 도 6에서와 같이 각각의 키워드 쌍에 대해서 어순 키워드 쌍 가중치 및 근접 정도별 가중치를 설정할 수가 있다. 즉, 사용자가 입력한 키워드 중 "검색"과 "질의"를 키워드 쌍으로 구성하여(키워드 쌍 이름을 "어순1"이라고 사용자가 정한 경우임) 그 어순 키워드 쌍 가중치를 1로 설정하고, 어순 정도별 가중치를 앞서 설명한 바와 같이 2단계로 나누어 각각에 대한 가중치 값들을 설정한 것을 나타낸다. 또한, "검색"과 "질의"와 "엔진"을 키워드 쌍으로 구성하여(어순 키워드 쌍 이름을 "어순2"라고 사용자가 정한 경우임) 마찬가지로 어순 키워드 쌍 가중치 및 어순 정도별 가중치를 설정한 것을 나타낸다.
이때도 앞서 출현 빈도 및 근접도 측정에서 설명한 각각의 키워드들에 대한 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치에 대한 값들은 물론, 구성된 각각의 키워드 쌍들에 대해서 어순 키워드 쌍 가중치, 어순 정도별 가중치에 대한 값들을 사용자가 설정 또는 변경, 해제할 수 있다.
또한, 어순도 측정에 사용된 어순 키워드 쌍 또는 어순 키워드 쌍 가중치, 어순 정도별 가중치 설정값 등의 데이터들을 사용자가 저장 및 불러오기, 또는 편집도 가능하도록 할 수 있다.
이처럼, 검색된 특허 문서의 유사도를 평가하는 단계(S306)는 "출현 빈도", "근접도" 및 "어순도"를 측정함으로써 검색 키워드와 특허 문서와의 유사도를 보다 세밀하고 정확하게 평가할 수 있다.
또한, 이와 같은 "출현 빈도", "근접도" 및 "어순도"의 측정은 사용자의 선택에 의해서 측정을 설정 또는 해제할 수가 있다. 즉, 사용자가 유사도 측정을 위해 적용하고자 하는 항목을 임의로 선택하여 측정할 수 있도록 한다. 예를 들어, "출현 빈도"와 "근접도"만 측정하여 유사도를 평가하고 싶은 경우 "출현 빈도"와 "근접도" 측정을 설정하고 "어순도"의 측정을 해제하면 된다. 또한, "어순도"만 적용하고 싶은 경우는 "어순도" 측정만 설정하고 "출현 빈도"와 "근접도" 측정을 해제하면 되는 것이다.
도 7은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 유사도 측정에 적용되는 항목 상호간의 가중치를 설정하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
앞서 본 바와 갈이, 검색된 문서의 유사도를 평가하는데 사용될 수 있는 항목들로서 "출현 빈도", "근접도" 및 "어순도"의 측정을 예로 들 수가 있는데, 본 발명의 바람직한 실시예에 의하면, 이와같은 유사도 측정에 적용되는 각각의 항목들에 대해서도 각 항목들 간의 상대적인 중요도를 나타내는 "유사도 평가 가중치"를 적용할 수가 있다.
즉, 유사도 평가 가중치는 유사도 측정 시 적용되는 항목이 둘 이상인 경우에 적용되는 것으로서, 도 7에서와 같이 유사도 측정 시 적용되는 항목들 상호간의 중요도를 설정함으로써 최종적인 유사도 측정 시에 각 항목의 평가 값이 반영되는 비율을 결정할 수 있다. 유사도 평가 가중치 또한 사용자의 선택에 따라 임의로 설정될 수 있음은 물론이다. 예를 들어, 유사도 평가 시에 근접도가 다른 항목들보다 더 중요하다고 판단되면 근접도 항목에 대해서 가중치를 더 높게 설정하면 되는 것이다. 또한, 유사도 평가 가중치의 설정값도 사용자가 저장 및 불러오기, 또는 편집도 가능하도록 할 수 있다.
도 8은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 검색된 문서에 유사도를 평가한 결과로서 키워드의 출현수를 기준으로 정렬하여 사용자에게 제공되는 화면을 나타내는 도면이다.
검색된 문서들은 평가된 유사도 값 또는 유사도 평가 시 적용된 가중치 즉, 출현 빈도와 근접도 및 어순도와 함께 표시가 된다. 도 8에서는 키워드의 출현 개수를 기준으로 유사도가 높은 순서대로 정렬된 것을 나타내지만, 각각의 항목별로 즉, 유사도 또는 출현 빈도 또는 근접도 또는 어순도 별로 사용자가 선택하여 어느 하나의 항목 순서대로 정렬되도록 할 수 있다.
또한, 도 8에서와 같이 유사도 측정의 최종 결과 뿐만 아니라, 유사도 측정 시 적용되는 중간 측정 작업(출현 빈도, 근접도, 어순도 측정 등)들에 대한 중간 결과들도 각각의 측정 작업이 완료되면 사용자가 그 결과를 조회할 수 있도록 할 수 있다. 또한, 이와 같은 최종 유사도 평가 결과들도 사용자가 저장 및 불러오기 등의 편집도 가능하도록 할 수 있다.
이처럼 검색된 문서들을 유사도 순서대로 정렬함으로써 사용자가 검색하고자하는 문서를 손쉽게 빨리 찾을 수가 있는 것이다.
도 9는 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 유사도를 평가한 결과로서 키워드의 순서를 기준으로 정렬하여 사용자에게 제공되는 화면을 나타내는 도면이다.
도 9에서와 같이 키워드가 K1, K2, K3라고 등록된 경우 각 키워드가 출현하는 순서를 기준으로 하여 유사도가 높은 순서대로 정렬할 수 있다. 즉, K1, K2의 순서로 키워드가 출현한 문서들에 대해서 유사도 순서대로 정렬하고, K1, K3의 순서로 키워드가 출현한 문서들에 대해서 또는 K2, K3순서 등으로 키워드가 출현한 문서들에 대해서 유사도 순으로 정렬할 수 있는 것이다.
이처럼, 검색된 문서를 유사도를 평가하여 정렬하는 단계는 다양하게 구현될 수가 있다.
한편, 도 8 및 도 9에서와 같이, 유사도 평가 결과를 보여주는 화면에는 사용자가 검색된 특허 문서를 식별할 수 있도록 각 문서마다 식별 정보가 함께 표시된다. 즉, 평가된 출현 빈도, 근접도, 어순도, 유사도 측정값과 함께 발명의 명칭 또는 출원 번호, 출원일, 등록 여부, 출원인, 문서 번호 등의 문서 식별 정보가 표 시됨으로서 사용자가 한 눈에 기본적 사항을 파악할 수가 있다.
도 10은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 유사도가 평가된 후에 문서의 상세 정보가 사용자에게 제공되는 화면을 나타내는 도면이다.
본 발명의 실시예에 따라 문서를 검색하여 도 8 또는 도 9와 같은 유사도 평가 결과가 나오면, 사용자는 원하는 문서의 보다 상세한 정보를 조회하기 위해 특정 문서를 선택할 수가 있다. 예를 들어 결과 목록에서 조회하고자 하는 문서를 선택하여 더블 클릭을 하는 방식으로 조회할 수가 있다. 그렇게 문서를 선택하게 되면 도 10에서와 같이 선택된 문서의 상세 내용이 표시되게 된다. 도 10에서는 문서 번호, 특허 구분, 출원 국가, 출원인, 출원일, 출원 번호, 공개일, 공개 번호, 공고 정보, 등록 일자, 등록 번호, 발명의 명칭, 요약, 대표 청구항 등이 표시되어 있는데, 이밖에도 종래 기술, 발명의 상세한 설명, 효과, 청구 범위, 도면 등의 정보도 사용자가 확인할 수 있도록 할 수 있을 것이다.
또한, 도 10에서처럼 출현 빈도수 검색 단어나 근접도 단어 쌍, 어순도 단어 쌍 등의 키워드에 대한 정보를 색깔별로 표시하거나 키워드 목록도 함께 표시하여 사용자의 편의를 더할 수도 있다.
도 11은 본 발명의 실시예에 따른 유사도를 적용한 특허 문서 검색 서비스에 있어서 검색 키워드를 조합하여 입력하는 과정에서 사용자에게 제공되는 화면을 나타내는 도면이다.
일반적인 검색 서비스에서와는 달리, 본 발명의 실시예에 따른 유사도를 적 용한 특허 문서 검색 서비스에서는 사용자가 입력하고자하는 키워드를 미리 저장해 두었던 키워드 목록에서 선택할 수 있으며, 여러 키워드들을 조합하여 입력할 경우에 조합 조건식을 일일이 키보드로 입력하지 않고 조합 조건식에 해당하는 아이콘을 클릭함으로써 보다 간편하고 빠르게 검색식 조합을 구성할 수가 있다.
이상 본 발명의 실시예를 특허 문서에 대해 적용되는 것으로 설명하였으나, 이는 특허 문서에 한정되지 않고 일반적인 문서에 대해서도 충분히 적용할 수가 있을 것이다. 즉, 앞서 설명한 바와 같이 이는 특허 문서가 일반 문서와는 다른 독특한 성격을 가지고 있기 때문에 일반 문서와 구별하여 특허 문서에 대한 검색을 다룬 것이고, 보다 포괄적인 개념인 일반 문서의 검색에 있어서도 유사도 및 출현 빈도, 근접도, 어순도 등을 측정함으로써 검색을 효율적으로 할 수 있도록 본 발명을 적용할 수 있을 것이다.
도 12는 본 발명의 실시예에 따른 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템의 구성을 나타내는 블록도이다.
유사도를 적용하여 문서 검색 서비스를 제공하는 시스템(1200)은 키워드 입력부(1202), 데이터 베이스부(1204), 문서 검색부(1206) 및 유사도 평가부(1208)를 포함한다.
키워드 입력부(1202)는 검색 서비스의 사용자로부터 하나 이상의 키워드를 입력받는 기능을 수행한다. 키워드 입력부(1202)는 사용자가 입력하고자하는 키워드를 미리 저장해 두었던 키워드 목록에서 선택함으로써 입력 받을 수 있으며, 여러 키워드들이 조합되는 경우에 조합 조건식에 해당하는 아이콘이 클릭됨으로써 검 색식 조합이 구성되어 키워드 조합이 입력될 수가 있다.
데이터 베이스부(1204)는 문서에 대한 데이터를 저장하는 기능을 수행한다. 데이터 베이스부(1204)에는 미리 문서에 대한 정보 데이터 풀이 저장되어 있어야 한다. 한편, 본 발명의 실시예로서, 앞서 설명한 바와 같이 데이터 베이스부(1204)에는 MDB 형식의 파일로 작성된 문서 데이터가 저장될 수 있다.
문서 검색부(1206)는 키워드 입력부(1202)에 입력된 검색 키워드를 이용하여 데이터 베이스부(1204)에 저장되어 있는 문서들을 검색하는 기능을 수행한다. 즉, 입력된 검색 키워드로 검색 키워드 또는 검색 키워드의 동의어를 포함하는 문서가 데이터 베이스부(1204)에 있는지 조사한다.
유사도 평가부(1208)는 문서 검색부(1206)에 의해 검색된 문서에 대하여 유사도를 평가하는 기능을 수행한다. 유사도는 앞서 설명한 바와 같은 출현 빈도, 근접도 및 어순도의 측정을 통해 평가되는데, 출현 빈도, 근접도 및 어순도 각각에 대해서 세부 가중치가 적용되어 측정될 수가 있다. 즉, 앞서 설명한 바와 같이, 출현 빈도에 대해서는 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치 중 어느 하나 이상이 적용되고, 근접도에 대해서는 키워드 쌍 가중치 및 근접 정도별 가중치 중 어느 하나 이상이 적용되며, 어순도에 대해서는 어순 키워드 쌍 가중치 및 어순 정도별 가중치 중 어느 하나 이상이 적용될 수가 있다. 또한, 출현 빈도, 근접도 및 어순도 상호간의 가중치를 나타내는 유사도 평가 가중치를 적용할 수도 있으며, 사용자의 편의에 따라 세부 가중치 또는 유사도 평가 가중치의 설정값이 임의로 설정될 수도 있다.
이밖에도, 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템(1200)에는 도 3 내지 도 11에서 설명한 문서 검색 서비스의 특징들이 포함될 수 있음을 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 충분히 이해할 수 있을 것이다.
한편, 문서 정렬부(1210)는 유사도 평가부(1208)에 의해 유사도가 평가된 문서들을 평가된 유사도의 순서에 따라 정렬하는 기능을 수행한다. 또한, 앞서 설명한 바와 같이, 각각의 항목별로 즉, 출현 빈도 또는 근접도 또는 어순도 별로 사용자의 선택에 의해 어느 하나의 항목 순서대로 정렬할 수도 있다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
상기와 같은 유사도를 적용하여 특허 문서를 검색하는 방법 및 그 시스템에 따르면, 특허 문서를 검색 키워드 포함 여부에 따른 단순 나열이 아닌 검색 키워드와의 유사 정도에 따라서 정렬함으로써 검색 서비스 사용자가 보다 빠르고 간편하 게 원하는 특허 문서를 손쉽게 검색할 수 있게 하는 효과가 있다.
또한, 상기 유사도를 측정함에 있어서 검색 키워드의 출현 빈도, 근접도 및 어순도 등의 여러 가지 세부적인 가중치를 적용함으로써 보다 정교하고 신뢰성 있는 유사도 판단이 가능하며, 이러한 가중치들을 사용자가 직접 설정/편집하여 측정할 수 있게 함으로써 사용자의 편의를 도우며 사용자의 취향에 따른 사용자 중심적인 검색 서비스를 제공할 수 있게 하는 효과가 있다.
또한, 검색을 위한 키워드의 입력에 있어서도 이전에 저장된 키워드 목록을 이용하게 하거나 아이콘을 사용하여 검색 조합식을 구성할 수 있도록 함으로써, 보다 편하고 빠르게 검색을 할 수 있는 효과가 있다.

Claims (37)

  1. 특허 공보의 내용을 포함하는 특허 문서를 검색하는 서비스 제공 방법에 있어서,
    (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계;
    (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 특허 문서를 검색하는 단계; 및
    (c) 상기 검색 키워드를 입력받아 검색된 상기 특허 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 단계
    를 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  2. 제 1 항에 있어서,
    상기 출현 빈도는 상기 출현 빈도에 대한 별도의 가중치가 적용됨으로써 측정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  3. 제 2 항에 있어서,
    상기 출현 빈도에 대한 상기 별도의 가중치는, 입력된 상기 검색 키워드 자체의 키워드 가중치, 상기 특허 문서의 파트별 가중치 및 상기 검색 키워드가 발견된 상기 특허 문서의 문장수에 대한 문장수 대비 가중치 중 어느 하나 이상을 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  4. 제 3 항에 있어서,
    상기 파트별 가중치는, 상기 특허 문서 중 발명의 명칭, 요약 및 대표 청구항 중 둘 이상의 파트에 대한 가중치인 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  5. 제 2 항에 있어서,
    상기 출현 빈도에 대한 상기 별도의 가중치는, 상기 사용자의 선택에 의해 상기 별도의 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  6. 제 1 항에 있어서,
    상기 근접도는, 상기 검색 키워드로 구성된 키워드 쌍 상호간의 가중치를 나타내는 키워드 쌍 가중치 및 상기 키워드 쌍의 각 키워드 상호간의 근접 정도를 나타내는 근접 정도별 가중치 중 어느 하나 이상을 적용하여 측정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  7. 제 6 항에 있어서,
    상기 근접 정도별 가중치는, 상기 근접 정도를 상기 특허 문서의 문장 단위로 측정하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  8. 제 6 항에 있어서,
    상기 키워드 쌍 가중치 및 상기 근접 정도별 가중치는, 상기 사용자의 선택에 의해 상기 키워드 쌍 가중치 및 상기 근접 정도별 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  9. 제 1 항에 있어서,
    상기 어순도는, 상기 검색 키워드로 구성된 키워드 쌍 상호간의 가중치를 나타내는 어순 키워드 쌍 가중치 및 상기 키워드 쌍의 각 키워드 상호간의 어순 형태에 따른 어순 정도별 가중치 중 어느 하나 이상을 적용하여 측정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  10. 제 9 항에 있어서,
    상기 어순 키워드 쌍 가중치 및 상기 어순 정도별 가중치는, 상기 사용자의 선택에 의해 상기 어순 키워드 쌍 가중치 및 상기 어순 정도별 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  11. 제 1 항에 있어서,
    상기 출현 빈도, 상기 근접도 및 상기 어순도는 상기 사용자의 선택에 의해 측정이 설정 또는 해제되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  12. 제 1 항에 있어서,
    상기 유사도는 상기 출현 빈도, 상기 근접도 및 상기 어순도 상호간의 가중치를 나타내는 유사도 평가 가중치를 적용함으로써 평가되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  13. 제 12 항에 있어서,
    상기 유사도 평가 가중치는 상기 사용자의 선택에 의해 상기 유사도 평가 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  14. 제 1 항에 있어서,
    상기 검색 키워드는 상기 검색 키워드의 동의어를 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  15. 제 1 항에 있어서, 상기 단계 (a)에서,
    상기 검색 키워드는, 상기 검색 키워드를 조합하기 위한 조합식이 아이콘에 의해 상기 사용자에게 표시되며, 상기 사용자의 선택에 의해 상기 아이콘이 설정됨으로써 상기 검색 키워드의 조합이 구성되어 입력되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  16. 제 1 항에 있어서, 상기 단계 (b)에서,
    상기 데이터 베이스에 기 저장된 상기 특허 문서는, MDB 파일 형태로 저장되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  17. 제 1 항에 있어서, 상기 단계 (c)에서,
    상기 유사도의 평가 결과 또는 상기 유사도를 평가하기 위해 사용되는 데이터는 상기 사용자의 선택에 의해 저장/불러오기 또는 편집되는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  18. 제 17 항에 있어서,
    상기 유사도를 평가하기 위해 사용되는 데이터는, 상기 검색 키워드, 상기 검색 키워드로 구성되는 키워드 쌍, 상기 유사도 평가에 적용되는 가중치에 대한 정보를 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  19. 제 1 항에 있어서,
    (d) 상기 출현 빈도, 상기 근접도, 상기 어순도 및 상기 유사도 중 어느 하나의 항목에 대한 순서에 따라 상기 특허 문서를 정렬하는 단계
    를 추가로 포함하는 상기 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  20. 제 19 항에 있어서, 상기 단계 (d)에서,
    상기 특허 문서를, 상기 사용자가 상기 특허 문서를 식별하도록 하기 위한 식별 정보 또는, 측정된 상기 출현 빈도, 상기 근접도, 상기 어순도 및 상기 유사도 중 어느 하나 이상의 측정값과 함께 정렬하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  21. 제 20 항에 있어서,
    상기 식별 정보는 발명의 명칭, 출원 번호, 출원일, 등록여부, 출원인 중 어느 하나 이상을 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  22. 제 19 항에 있어서,
    (e) 상기 사용자의 선택에 따라서, 정렬된 상기 특허 문서의 상세 정보를 제공하는 단계
    를 추가로 포함하는 상기 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  23. 제 22 항에 있어서,
    상기 상세 정보는 발명의 명칭, 요약, 발명의 상세한 설명, 대표 청구항, 도면 중 어느 하나 이상을 포함하는 것을 특징으로 하는 유사도를 적용하여 특허 문서 검색 서비스를 제공하는 방법.
  24. 일반 문서를 검색하는 서비스 제공 방법에 있어서,
    (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계;
    (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 일반 문서를 검색하는 단계; 및
    (c) 상기 검색 키워드를 입력받아 검색된 상기 일반 문서에 대하여, 상기 검색 키워드의 상기 일반 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워 드와의 유사도를 평가하는 단계; 및
    (d) 상기 출현 빈도, 상기 근접도, 상기 어순도 및 상기 유사도 중 어느 하나의 항목에 대한 순서에 따라 상기 특허 문서를 정렬하는 단계
    를 포함하는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  25. 제 24 항에 있어서, 상기 단계 (c)에서,
    상기 유사도는 상기 출현 빈도, 상기 근접도 및 상기 어순도 중 어느 하나 이상의 항목에 대해 세부 가중치를 적용함으로써 평가되는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  26. 제 25 항에 있어서, 상기 세부 가중치는,
    상기 출현 빈도에 대해서는 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치 중 어느 하나 이상이며, 상기 근접도에 대해서는 키워드 쌍 가중치 및 근접 정도별 가중치 중 어느 하나 이상이며, 상기 어순도에 대해서는 어순 키워드 쌍 가중치 및 어순 정도별 가중치 중 어느 하나 이상인 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  27. 제 25 항에 있어서,
    상기 세부 가중치는 상기 사용자의 선택에 의해 상기 세부 가중치의 설정값 이 설정되는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  28. 제 24 항에 있어서, 상기 단계 (c)에서,
    상기 유사도는 상기 출현 빈도, 상기 근접도 및 상기 어순도 상호간의 가중치를 나타내는 유사도 평가 가중치를 적용함으로써 평가되는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  29. 제 28 항에 있어서,
    상기 유사도 평가 가중치는 상기 사용자의 선택에 의해 상기 유사도 평가 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 일반 문서 검색 서비스를 제공하는 방법.
  30. 문서를 검색하는 서비스 제공 시스템에 있어서,
    상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 키워드 입력부;
    상기 문서의 문서 데이터를 저장하는 데이터 베이스부;
    상기 검색 키워드로 상기 데이터 베이스부에 기 저장된 상기 문서를 검색하는 문서 검색부; 및
    상기 문서 검색부에 의해 검색된 상기 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 유사도 평가부
    를 포함하는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  31. 제 30 항에 있어서, 상기 키워드 입력부는,
    상기 검색 키워드를 조합하기 위한 조합식이 아이콘에 의해 상기 사용자에게 표시되며 상기 사용자의 선택에 의해 상기 아이콘이 설정되어 상기 검색 키워드의 조합이 구성됨으로써, 상기 검색 키워드를 입력받는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  32. 제 30 항에 있어서, 상기 유사도 평가부는,
    상기 출현 빈도, 상기 근접도 및 상기 어순도 중 어느 하나 이상의 항목에 대한 세부 가중치를 적용함으로써 상기 유사도를 평가하는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  33. 제 32 항에 있어서, 상기 세부 가중치는,
    상기 출현 빈도에 대해서는 키워드 가중치, 파트별 가중치 및 문장수 대비 가중치 중 어느 하나 이상이며, 상기 근접도에 대해서는 키워드 쌍 가중치 및 근접 정도별 가중치 중 어느 하나 이상이며, 상기 어순도에 대해서는 어순 키워드 쌍 가중치 및 어순 정도별 가중치 중 어느 하나 이상인 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  34. 제 32 항에 있어서, 상기 세부 가중치는,
    상기 사용자의 선택에 의해 상기 세부 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  35. 제 30 항에 있어서, 상기 유사도 평가부는,
    상기 출현 빈도, 상기 근접도 및 상기 어순도 상호간의 가중치를 나타내는 유사도 평가 가중치를 적용함으로써 상기 유사도를 평가하는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  36. 제 35 항에 있어서,
    상기 유사도 평가 가중치는 상기 사용자의 선택에 의해 상기 유사도 평가 가중치의 설정값이 설정되는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 시스템.
  37. 문서 검색 서비스를 제공하는 프로세서에 있어서,
    기계적 독출이 가능한 기록매체; 및
    상기 기록매체에 저장되며, 기계적 독출이 가능한 프로그램 코드를 구비하고,
    상기 프로그램 코드는
    (a) 상기 서비스의 사용자로부터 하나 이상의 검색 키워드를 입력받는 단계;
    (b) 상기 검색 키워드로 데이터 베이스에 기 저장된 문서를 검색하는 단계; 및
    (c) 상기 검색 키워드를 입력받아 검색된 상기 문서에 대하여, 상기 검색 키워드의 상기 문서에서의 출현 빈도, 상기 검색 키워드 간의 근접도 및 상기 검색 키워드 간의 어순도 중 어느 하나 이상을 측정함으로써 상기 검색 키워드와의 유사도를 평가하는 단계를 포함하는 것을 특징으로 하는 유사도를 적용하여 문서 검색 서비스를 제공하는 프로세서.
KR1020050104402A 2005-11-02 2005-11-02 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템 KR20070047544A (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020050104402A KR20070047544A (ko) 2005-11-02 2005-11-02 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템
US12/090,480 US20080288489A1 (en) 2005-11-02 2006-08-09 Method for Searching Patent Document by Applying Degree of Similarity and System Thereof
PCT/KR2006/003125 WO2007052883A1 (en) 2005-11-02 2006-08-09 Method for searching patent document by applying degree of similarity and system thereof
JP2008538794A JP2009515249A (ja) 2005-11-02 2006-08-09 類似度を適用した特許文書検索方法及びそのシステム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020050104402A KR20070047544A (ko) 2005-11-02 2005-11-02 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템

Publications (1)

Publication Number Publication Date
KR20070047544A true KR20070047544A (ko) 2007-05-07

Family

ID=38006013

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020050104402A KR20070047544A (ko) 2005-11-02 2005-11-02 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템

Country Status (4)

Country Link
US (1) US20080288489A1 (ko)
JP (1) JP2009515249A (ko)
KR (1) KR20070047544A (ko)
WO (1) WO2007052883A1 (ko)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100862565B1 (ko) * 2008-02-28 2008-10-09 (주) 시온텍 사용자 맞춤형 특허정보 데이터베이스 구축시스템
KR100953043B1 (ko) * 2008-07-09 2010-04-14 엔에이치엔(주) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
KR101113761B1 (ko) * 2009-08-21 2012-02-27 (주)윕스 특허 문서 분류 방법 및 시스템
KR101140264B1 (ko) * 2010-07-14 2012-04-26 엔에이치엔(주) 텍스트 패턴 추출을 이용하여 정보를 추출하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
KR101458857B1 (ko) * 2014-03-04 2014-11-07 엠앤에스시스템 주식회사 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
KR102029916B1 (ko) * 2018-03-30 2019-10-08 주식회사 디 파트너스 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법
KR20200014979A (ko) 2018-08-02 2020-02-12 주식회사 누리랩 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4331257B2 (ja) * 2006-11-06 2009-09-16 パナソニック株式会社 情報検索装置
US8065307B2 (en) * 2006-12-20 2011-11-22 Microsoft Corporation Parsing, analysis and scoring of document content
US8019742B1 (en) 2007-05-31 2011-09-13 Google Inc. Identifying related queries
US7917840B2 (en) 2007-06-05 2011-03-29 Aol Inc. Dynamic aggregation and display of contextually relevant content
US9183323B1 (en) 2008-06-27 2015-11-10 Google Inc. Suggesting alternative query phrases in query results
JP4921500B2 (ja) * 2009-02-13 2012-04-25 日本電信電話株式会社 テキスト検索結果ランキング装置、テキスト検索結果ランキング方法、テキスト検索結果ランキングプログラムおよびそのプログラムを記録した記録媒体
US20100287177A1 (en) * 2009-05-06 2010-11-11 Foundationip, Llc Method, System, and Apparatus for Searching an Electronic Document Collection
US20100287148A1 (en) * 2009-05-08 2010-11-11 Cpa Global Patent Research Limited Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection
US8364679B2 (en) * 2009-09-17 2013-01-29 Cpa Global Patent Research Limited Method, system, and apparatus for delivering query results from an electronic document collection
US20110082839A1 (en) * 2009-10-02 2011-04-07 Foundationip, Llc Generating intellectual property intelligence using a patent search engine
US20110119250A1 (en) * 2009-11-16 2011-05-19 Cpa Global Patent Research Limited Forward Progress Search Platform
US8849785B1 (en) * 2010-01-15 2014-09-30 Google Inc. Search query reformulation using result term occurrence count
US8725771B2 (en) * 2010-04-30 2014-05-13 Orbis Technologies, Inc. Systems and methods for semantic search, content correlation and visualization
US20110295861A1 (en) * 2010-05-26 2011-12-01 Cpa Global Patent Research Limited Searching using taxonomy
JP5048852B2 (ja) * 2011-02-25 2012-10-17 楽天株式会社 検索装置、検索方法、検索プログラム、及びそのプログラムを記憶するコンピュータ読取可能な記録媒体
JP5113936B1 (ja) * 2011-11-24 2013-01-09 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
WO2015014189A1 (zh) 2013-08-02 2015-02-05 优视科技有限公司 一种访问网站的方法及装置
US10095388B2 (en) * 2014-05-19 2018-10-09 Innography, Inc. Configurable patent strength calculator
US20160125360A1 (en) * 2014-11-04 2016-05-05 Oracle International Corporation Candidate pipeline builder
US10019442B2 (en) * 2015-05-31 2018-07-10 Thomson Reuters Global Resources Unlimited Company Method and system for peer detection
TWI584217B (zh) * 2015-08-24 2017-05-21 雲拓科技有限公司 專利檢索的分析結果之驗證方法
JP6198866B2 (ja) * 2016-02-05 2017-09-20 雲拓科技有限公司 特許検索方法
EP3621021A1 (en) * 2018-09-07 2020-03-11 Delta Electronics, Inc. Data search method and data search system thereof
JP7384614B2 (ja) 2019-10-08 2023-11-21 パナソニックホールディングス株式会社 文書検索装置、文書検索方法、及び、コンピュータプログラム
CN111026850A (zh) * 2019-12-23 2020-04-17 园宝科技(武汉)有限公司 一种自注意力机制的双向编码表征的知识产权匹配技术
US11132412B1 (en) * 2020-03-31 2021-09-28 Black Hills Ip Holdings, Llc User interface for providing docketing data

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7251637B1 (en) * 1993-09-20 2007-07-31 Fair Isaac Corporation Context vector generation and retrieval
US6029195A (en) * 1994-11-29 2000-02-22 Herz; Frederick S. M. System for customized electronic identification of desirable objects
US5642502A (en) * 1994-12-06 1997-06-24 University Of Central Florida Method and system for searching for relevant documents from a text database collection, using statistical ranking, relevancy feedback and small pieces of text
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
JP3562243B2 (ja) * 1997-07-24 2004-09-08 松下電器産業株式会社 文書検索装置
KR20010092922A (ko) * 2000-03-27 2001-10-27 이현구 유사 웹사이트의 검색 방법
KR20030082109A (ko) * 2002-04-16 2003-10-22 (주)메타웨이브 앤드 연산자를 이용한 색인어 검색 및 정보 제공 시스템및 방법
US6847966B1 (en) * 2002-04-24 2005-01-25 Engenium Corporation Method and system for optimally searching a document database using a representative semantic space
KR100501244B1 (ko) * 2002-05-30 2005-07-18 재단법인서울대학교산학협력재단 특허 지도 작성 방법 및 그 시스템
JP2004139553A (ja) * 2002-08-19 2004-05-13 Matsushita Electric Ind Co Ltd 文書検索システムおよび質問応答システム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100862565B1 (ko) * 2008-02-28 2008-10-09 (주) 시온텍 사용자 맞춤형 특허정보 데이터베이스 구축시스템
KR100953043B1 (ko) * 2008-07-09 2010-04-14 엔에이치엔(주) 동의어를 이용한 검색 서비스 제공 방법 및 시스템
KR101113761B1 (ko) * 2009-08-21 2012-02-27 (주)윕스 특허 문서 분류 방법 및 시스템
KR101140264B1 (ko) * 2010-07-14 2012-04-26 엔에이치엔(주) 텍스트 패턴 추출을 이용하여 정보를 추출하기 위한 방법, 시스템 및 컴퓨터 판독 가능한 기록 매체
KR101458857B1 (ko) * 2014-03-04 2014-11-07 엠앤에스시스템 주식회사 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
WO2015133774A1 (ko) * 2014-03-04 2015-09-11 엠앤에스시스템 주식회사 특허 분석 시스템 및 방법과 이를 실행하기 위한 프로그램이 기록된 기록매체
KR102029916B1 (ko) * 2018-03-30 2019-10-08 주식회사 디 파트너스 디자인 소재 검색을 위한 지식재산권 문서 기반의 빅데이터 분석 방법
KR20200014979A (ko) 2018-08-02 2020-02-12 주식회사 누리랩 역 색인 구성 방법, 역 색인을 이용한 유사 데이터 검색 방법 및 장치

Also Published As

Publication number Publication date
US20080288489A1 (en) 2008-11-20
JP2009515249A (ja) 2009-04-09
WO2007052883A1 (en) 2007-05-10

Similar Documents

Publication Publication Date Title
KR20070047544A (ko) 유사도를 적용하여 특허 문서를 검색하는 방법 및 그시스템
US8661031B2 (en) Method and apparatus for determining the significance and relevance of a web page, or a portion thereof
US20040049499A1 (en) Document retrieval system and question answering system
US8229927B2 (en) Apparatus, system, and method for information search
US20130110839A1 (en) Constructing an analysis of a document
US8301631B2 (en) Methods and systems for annotation of digital information
US20090063460A1 (en) Presenting result items based upon user behavior
US20070214154A1 (en) Data Storage And Retrieval
US20100228714A1 (en) Analysing search results in a data retrieval system
JP2006344010A (ja) 文書検索装置
US20080071738A1 (en) Method and apparatus of visual representations of search results
CN111506727B (zh) 文本内容类别获取方法、装置、计算机设备和存储介质
US8577865B2 (en) Document searching system
Goodrum et al. A state transition analysis of image search patterns on the web
WO2021003187A1 (en) Analysis of intellectual-property data in relation to products and services
Kazai et al. The INEX evaluation initiative
US20010051942A1 (en) Information retrieval user interface method
JP2001084256A (ja) データベース処理装置、データベース処理方法、及びデータベース処理プログラムを記録したコンピュータ読み取り可能な記憶媒体
US20140095465A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
CN111914154B (zh) 一种智能搜索导向系统及方法
Martoglia Facilitate IT-Providing SMEs in Software Development: a Semantic Helper for Filtering and Searching Knowledge.
US20140149378A1 (en) Method and apparatus for determining rank of web pages based upon past content portion selections
US20080162433A1 (en) Browsable search system
JP2009098932A (ja) 連想検索システム
KR102546690B1 (ko) 맞춤형 문서 파일 검색 및 검색 키워드 중심 선별정보 시스템 및 그 구동방법

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid