KR100705413B1 - 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법 - Google Patents

웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법 Download PDF

Info

Publication number
KR100705413B1
KR100705413B1 KR20050076175A KR20050076175A KR100705413B1 KR 100705413 B1 KR100705413 B1 KR 100705413B1 KR 20050076175 A KR20050076175 A KR 20050076175A KR 20050076175 A KR20050076175 A KR 20050076175A KR 100705413 B1 KR100705413 B1 KR 100705413B1
Authority
KR
South Korea
Prior art keywords
web page
search
page address
user
desktop
Prior art date
Application number
KR20050076175A
Other languages
English (en)
Other versions
KR20070021660A (ko
Inventor
곽용재
천세진
박태헌
김성원
서장원
서범석
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR20050076175A priority Critical patent/KR100705413B1/ko
Publication of KR20070021660A publication Critical patent/KR20070021660A/ko
Application granted granted Critical
Publication of KR100705413B1 publication Critical patent/KR100705413B1/ko

Links

Images

Abstract

본 발명은 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱 검색 시스템 및 방법에 관한 것으로서, 상기 데스크톱 검색 시스템에서는, 미니 웹 서버를 기반으로 사용자 인터페이스부 및 검색 서비스 매니저 사이에서 검색 요청에 대한 결과 리턴이 이루어진다. 상기 검색 서비스 매니저는 사용자가 등록한 웹 페이지에 대해서 자동 지정 크롤링을 수행하여, 상기 검색 요청 시에 상기 자동 크롤링된 페이지의 최신 업데이트된 내용에 대한 검색 결과를 출력할 수 있다.
데스크톱 검색, 지정 크롤링, 파일 정보, 웹 페이지 정보

Description

웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱 검색 시스템 및 방법{Desktop Search System and Method for Automatically Crawling Registered Web Page and Providing Search Result}
도 1은 종래의 데스크톱 검색 방법을 설명하기 위한 도면이다.
도 2는 종래의 데스크톱 검색 결과를 예시하는 도면이다.
도 3은 본 발명의 일실시예에 따른 데스크톱 검색 시스템의 블록도이다.
도 4는 데스크톱 검색 서비스 시스템의 구체적인 블록도이다.
도 5는 도 4의 검색 서비스 매니저의 동작 개념을 설명하기 위한 도면이다.
도 6은 도 4의 검색 서비스 매니저의 구체적인 블록도이다.
도 7은 본 발명의 일실시예에 따른 데스크톱 검색 시스템에서 사용자 PC의 파일들에 대한 관리 동작을 설명하기 위한 도면이다.
도 8은 본 발명의 일실시예에 따른 데스크톱 검색 시스템에서 사용자가 방문한 웹 페이지에 대한 관리 동작을 설명하기 위한 도면이다.
도 9는 본 발명의 일실시예에 따른 데스크톱 검색 시스템에서 웹 페이지 지정 크롤링 동작을 설명하기 위한 흐름도이다.
도 10은 본 발명의 일실시예에 따른 데스크톱 검색 시스템에서 검색 동작을 설명하기 위한 흐름도이다.
도 11은 본 발명의 일실시예에 따른 데스크톱 검색 결과를 예시하는 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
300: 데스크톱 검색 시스템      
310: 인터넷
320: 사용자 PC                 
321: 사용자 인터페이스부
322: 검색 서비스 매니저
323: 미니 웹 서버 
324: 크롤링 처리부
328: 인덱스 DB                 
329: 검색부
350~370: 등록 웹 사이트 
380: 방문 웹 사이트       
본 발명은 데스크톱 PC(Personal Computer)의 파일 정보를 검색하는 시스템에 관한 것으로, 더욱 상세하게는 사용자가 방문하지 않은 웹 사이트라 하더라도 사용자가 지정한 웹 사이트인 경우에는 상기 웹 사이트의 최신 내용을 반영한 키워 드 검색이 가능한 데스크톱 검색 시스템 및 방법에 관한 것이다.
일반적으로 사용자는 본인 PC에 이미 저장되어 있는 파일들 중 키워드를 포함하는 파일들을 찾기 위하여, 간단한 탐색 프로그램을 이용한다. 사용자는 키워드를 가지는 탐색된 파일 리스트 중에서, 원하는 파일을 선택하여 실행함으로써 파일 읽기, 수정, 삭제, 편집 등을 용이하게 할 수 있다.
최근에는, 키워드에 의한 검색 대상을 파일 이름이나 폴더 이름에 한정하지 않고 파일의 내용 및 사용자가 방문한 웹 사이트들에까지 확장한다. 구글(Google)의 한 응용 프로그램은 데스크톱 PC (이하 "데스크톱“이라 약칭함) 검색 기능을 제공한다. 예를 들어, 도 1과 같이, 사용자가 키워드로 검색을 요청하면, 사용자 PC에 미리 설치된 데스크톱 검색기가 동작하고, 이에 따라 사용자 PC의 파일 정보, 즉, 상기 키워드에 대응하는 파일들의 리스트를 검색 결과로서 보여준다.
도 2는 종래의 데스크톱 검색 결과를 예시하는 도면이다. 도 2를 참조하면, 데스크톱 검색기의 검색 결과는 사용자 PC에 저장되어 있는 해당 문서, 이메일, 이미지, 음악, 동영상 등을 보여 줄 수 있다. 데스크톱 검색기는 문서, 이메일, 이미지, 음악, 동영상 등의 파일 이름이나 폴더 이름뿐만 아니라, 그 내용에도 해당 키워드가 포함되어 있는지를 검색하고, 키워드를 가지는 파일 정보를 보여 준다. 검색된 파일 정보의 리스트 각각에는 제목(파일 이름이나 폴더 이름), 요약, 저장 시간 등이 포함될 수 있다. 문서나 이메일의 요약 부분은 해당 키워드들을 포함하는 문장의 전후 일부분일 수 있고, 음악이나 동영상의 요약 부분은 재생시간이나 전송률 등을 포함할 수 있다.
구글의 데스크톱 검색기에 의하여 사용자가 방문했던 웹 사이트 내용을 관리하고자 하는 시도가 이루어지고 있다. 또한, RSS(Really Simple Syndication) 리더(reader)의 설치에 의하여, RSS 지원 사이트(예를 들어, 미니 홈피, 신문 사이트 등)에서 업데이트된 내용을 사용자가 직접 방문하지 않고도 간단히 확인할 수 있도록 하려는 시도가 이루어지고 있다.
그러나, 데스크톱 검색기에 의하여 사용자가 방문했던 웹 사이트 내용을 관리하고자 하는 경우에, 그 내용이 변경되었다면 업데이트된 내용을 자동으로 반영하지 못하고 업데이트되기 전의 내용만이 검색되어 표시되는 문제점이 있다. 이때, 사용자는 다시 방문하여야만 해당 사이트의 업데이트된 내용을 확인할 수 있으므로, 종래의 데스크톱 검색기에 의하여 충분한 파일 정보를 얻지 못하게 된다.
또한, RSS를 지원하지 않는 사이트가 아직까지 대부분이다. 따라서, RSS 지원 사이트에 대해서는, 사용자가 RSS 리더의 설치에 의해 어느 정도 해당 사이트에 대한 업데이트 정보까지 얻을 수 있다 할 지라도, RSS를 지원하지 않는 사용자의 희망 웹 사이트에 대해서는 사용자가 직접 방문하지 않는 한 해당 사이트에 대한 업데이트된 정보를 전혀 얻지 못하는 문제점이 있다.
따라서, 본 발명은 상술한 본 발명의 문제점을 해결하기 위한 것으로서, 본 발명의 목적은, RSS를 지원하지 않는 사이트에 대해서도 사용자가 지정한 웹 사이트에 대해서 자동 크롤링(crawling)이 이루어지도록 하고, 키워드 검색에 의하여 자동 크롤링된 웹 사이트의 최신 업데이트된 정보를 보여줄 수 있는 웹 서버 기반 의 데스크톱 검색 시스템을 제공하는 데 있다.
본 발명의 다른 목적은, 웹 사이트를 자동 크롤링하여 자동 크롤링된 사이트의 최신 업데이트된 정보가 키워드로 검색될 수 있도록 하는 웹 서버 기반의 데스크톱 검색 방법을 제공하는 데 있다.
상기와 같은 본 발명의 목적을 달성하기 위한 본 발명에 따른 데스크톱 검색 서비스 시스템은, 사용자로부터의 검색 요청에 대응되는 정보를 생성하고, 검색 결과에 대응되는 정보를 생성하는 미니 웹 서버; 및 등록된 적어도 하나의 웹 페이지 주소에 자동적으로 크롤링하고, 상기 검색 요청에 대응되는 정보에 따라 상기 자동 크롤링된 웹 페이지 주소의 업데이트된 내용을 반영한 상기 검색 결과를 출력하는 검색 서비스 매니저를 포함한다. 데스크톱 검색 서비스 시스템은, 상기 검색 요청을 수신하여 상기 미니 웹 서버로 전송하고 상기 검색 결과에 대응되는 정보를 표시하는 사용자 인터페이스부를 더 포함할 수 있다.
상기 검색 서비스 매니저는, 상기 검색 요청에 대응되는 정보에 응답하여 사용자 컴퓨터에 저장된 사용자 파일들의 내용들을 반영한 검색 결과를 더 출력할 수 있다. 또한, 상기 검색 서비스 매니저는, 상기 검색 요청에 대응되는 정보에 응답하여 상기 자동 크롤링된 페이지와 별도로 사용자가 방문했던 웹 페이지 주소의 내용을 반영한 검색 결과를 더 출력할 수 있다.
상기 검색 서비스 매니저는, 상기 등록된 적어도 하나의 웹 페이지 주소에 자동 접속하여 상기 접속된 웹 페이지 주소의 내용으로부터 색인 데이터를 생성하 는 크롤링 처리부; 상기 색인 데이터를 저장하는 인덱스 데이터베이스; 및 상기 검색 요청에 대응되는 정보에 따라 상기 인덱스 데이터베이스를 탐색하여, 해당 키워드를 포함하는 검색 결과를 출력하는 검색부를 포함한다.
상기와 같은 본 발명의 다른 목적을 달성하기 위한 본 발명에 따른 데스크톱 검색 서비스 방법은, 등록된 적어도 하나의 웹 페이지 주소에 자동적으로 크롤링하는 단계; 검색 요청에 대응되는 정보를 생성하는 단계; 상기 검색 요청에 대응되는 정보에 따라 상기 자동 크롤링된 웹 페이지 주소의 업데이트된 내용을 반영한 검색 결과를 출력하는 단계; 상기 검색 결과에 대응되는 정보를 생성하는 단계; 및 상기 검색 결과에 대응되는 정보를 표시하는 단계를 포함한다.
이하 첨부 도면들 및 첨부 도면들에 기재된 내용들을 참조하여 본 발명의 바람직한 실시예를 상세하게 설명하지만, 본 발명이 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조부호는 동일한 부재를 나타낸다.
도 3은 본 발명의 일실시예에 따른 데스크톱 검색 시스템(300)의 블록도이다. 사용자 PC(320)에는 사용자에게 데스크톱 검색 서비스를 제공하는 데스크톱 검색 서비스 프로그램이 설치되어 사용자에게 데스크톱 검색 서비스를 제공할 수 있는 컴퓨터이다. 즉, 상기 사용자 PC(320)는 사용자로부터의 키워드에 의한 검색 요청에 대하여 상기 사용자 PC(320)에 저장된 사용자 파일이나 폴더 이름 및 사용자 파일들의 내용까지 탐색하여 해당 키워드를 가지는 검색 결과를 보여줄 수 있다. 또한, 상기 사용자 PC(320)는 사용자가 방문하는 웹 사이트(380)의 내용을 반 영한 검색 결과도 출력할 수 있다.
본 발명에서는 특히, RSS를 지원하지 않지만 상기 사용자 PC(320)가 상기 인터넷(310)을 통하여 사용자가 등록한 웹사이트들(350~370)을 주기적으로 자동 크롤링(crawling)한다. 이에 따라, 사용자로부터의 검색 요청에 대하여 자동 크롤링된 웹 사이트의 최신 업데이트된 정보까지도 탐색하여 해당 키워드를 가지는 검색 결과를 보여주도록 제안되었다.
이를 위한 도 3의 사용자 PC(320)에 설치된 데스크톱 검색 서비스 시스템의 구체적인 블록도가 도 4에 도시되어 있다. 도 4를 참조하면, 상기 데스크톱 검색 서비스 시스템은 사용자 인터페이스부(321), 검색 서비스 매니저(322) 및 미니 웹 서버(323)를 포함한다.
상기 사용자 인터페이스부(321)로서 웹 브라우저 또는 인터넷 익스플로러 형식이 이용될 수 있다. 상기 사용자 인터페이스부(321)는 사용자로부터의 검색 요청을 수신하여 상기 미니 웹 서버(323)로 전송한다.
상기 미니 웹 서버(323)는 HTTP(Hypertext Transfer Protocol) 규약에 의하여 구현된 변형된 형태의 서버일 수 있고, 상기 사용자 PC(320)에 설치되어 상기 사용자 인터페이스부(321)와 상기 검색 서비스 매니저(322) 사이에서 검색 요청과 검색 결과의 리턴을 중계하기 위하여, 송수신 되는 소정 언어로된 데이터의 생성과 해석을 담당한다. 즉, 상기 미니 웹 서버(323)는 상기 사용자 인터페이스부(321)로부터의 검색 요청에 대응되는 정보를 생성하여 상기 검색 서비스 매니저(322)로 출력할 수 있고, 상기 검색 서비스 매니저(322)로부터 출력되는 검색 결과에 따라 HTML(Hypertext Markup Language) 코드 등의 형태로 해당 정보를 생성하여 상기 사용자 인터페이스부(321)로 전송할 수 있다. 이에 따라 상기 사용자 인터페이스부(321)는 상기 미니 웹 서버(323)로부터의 상기 검색 결과에 대응되는 정보를 수신하여 표시할 수 있다. 종래의 데스크톱 검색 서비스 시스템은 운영체제의 시스템 파일을 수정하여 데스크톱 검색 서비스 시스템을 구현하였다. 그러나, 이러한 종래기술에서는 운영체제의 시스템 파일이 운영체제 제작자에 의하여 변경될 때마다 다시 데스크톱 검색 서비스 시스템용 시스템 파일을 다시 제작하여야 하는 어려움이 있었다. 그러나 본 발명에서는 미니 웹 서버(323)를 이용하여 데스크톱 검색 서비스 시스템을 구현함으로써 이러한 문제점을 해결하였다.
상기 검색 서비스 매니저(322)는 사용자에 의하여 등록된 URL(Uniform Resource Locator:웹 사이트/웹 페이지 주소)들에 주기적으로 자동 크롤링할 수 있다. 사용자는 소정 사용자 인터페이스(미도시)를 통하여 상기 검색 서비스 매니저(322)에 접근할 수 있고, 자동 크롤링되기 원하는 희망 URL들을 등록할 수 있다. 이에 따라, 상기 검색 서비스 매니저(322)는 상기 미니 웹 서버(323)로부터의 상기 검색 요청에 대응되는 정보에 따라 상기 사용자 PC(320)에 저장된 사용자 파일들의 내용들을 반영한 검색 결과 및 사용자가 방문했던 URL의 내용을 반영한 검색 결과뿐만 아니라, 상기 자동 크롤링된 URL의 업데이트된 내용을 반영한 검색 결과를 출력할 수 있다.
즉, 종래와 달리 상기 검색 서비스 매니저(322)는, 도 5와 같이, 사용자가 등록한 URL들을 주기적으로 자동 크롤링하여 상기 등록된 URL들의 웹 페이지 정보 들을 읽고, 이를 색인하여 관리한다. 따라서, 사용자의 검색 요청에 대하여 상기 자동 크롤링된 URL의 업데이트된 내용까지 탐색하여 해당 검색 결과를 리턴 할 수 있다.
도 6은 도 4의 검색 서비스 매니저(322)의 구체적인 블록도이다. 도 6을 참조하면, 상기 검색 서비스 매니저(322)는 크롤링 처리부(324), 인덱스 DB(Database:데이터베이스)(328) 및 검색부(329)를 포함한다.
도 6에서, 상기 크롤링 처리부(324)는 크롤링부(325), 해석부(326) 및 색인부(327)을 포함한다. 상기 크롤링 처리부(324)의 동작 설명을 위하여 도 9의 흐름도가 참조된다.
상기 크롤링부(325)는 사용자로부터 등록된 URL들에 주기적으로 자동 접속하여 해당 URL의 내용을 읽어온다(S910). 사용자는 상기 검색 서비스 매니저(322) 내의 소정 사용자 인터페이스(미도시)를 통하여 자동 크롤링 되기 원하는 희망 URL들과 함께 크롤링 주기를 등록할 수 있고, 등록된 URL들 및 크롤링 주기는 소정 DB에 저장되어 관리될 수 있다.
이외에도, 상기 크롤링부(325)는 상기 크롤링에 의하여 접속된 URL에 링크된 웹 페이지가 있는 경우에, 상기 링크된 웹 페이지도 자동 접속하여 해당 페이지의 내용을 읽어올 수 있다. 이 경우, 등록된 URL의 웹 페이지에 링크된 웹 페이지들의 정보들도 자동적으로 색인되어 검색될 수 있게 된다.
상기 해석부(326)는 상기 크롤링부(325)가 XML(Extensible Markup Language) 또는 HTML(Hypertext Markup Language) 형태로 읽어온 내용을 파싱(parsing)한다. 상기 파싱에서는 읽어온 내용에 포함된 기호나 텍스트 등을 구분하여 색인에 필요한 정보만 추출한다. 이에 따라, 상기 색인부(327)는 상기 파싱된 내용에 따라 색인 데이터를 생성한다(S920). 상기 색인 데이터는 도 11과 같이, 상기 자동 크롤링된 페이지에 대한 제목, 요약, URL, 접속 시간을 포함할 수 있다. 상기 요약에는 일정 키워드, 예를 들어, 상기 URL과 관련된 키워드를 포함하고, 이외에도 키워드를 포함하는 문장이나 키워드 전후의 일정 길이의 데이터를 포함할 수 있다. 키워드는 상기 크롤링부(325)가 읽어온 내용의 제목 등으로부터 상기 해석부(326)에서 적어도 하나 이상 판단될 수 있고, 이를 기준으로 상기 해석부(326)는 상기 키워드에 따른 일정 길이의 데이터를 상기 요약으로서 색인될 정보로서 생성할 수 있다.
이와 같이, 상기 크롤링 처리부(324)가 상기 등록된 URL들에 접속하여 상기 접속된 URL의 내용으로부터 일정 색인 데이터를 생성하면, 상기 인덱스 DB(328)에는 상기 색인 데이터가 업데이트되어 저장된다(S930).
한편, 도 6에서 상기 검색부(329)는 상기 미니 웹 서버(323)부터의 상기 검색 요청에 대응되는 정보에 따라 상기 인덱스 DB(328)를 탐색하여, 상기 자동 크롤링된 URL의 업데이트된 내용까지 반영하여 해당 키워드를 포함하는 검색 결과를 출력할 수 있다.
상기 검색부(329)가 사용자 PC(320)에 저장된 사용자 파일들의 내용들, 즉 도 11과 같이, 문서, 이메일, 음악, 또는 동영상 등의 내용들을 반영한 검색 결과나, 사용자가 방문했던 URL의 내용을 반영한 검색 결과도 출력할 수 있도록 하기 위하여, 상기 인덱스 DB(328) 에는 해당 내용들에 대한 색인 데이터도 저장 관리될 수 있다. 예를 들어, 도 7과 같이, 사용자가 새로 만든 파일, 변경된 파일, 또는 복사한 파일들에 대하여, 그 파일 이름뿐만 아니라 그 내용에 대하여 까지 업데이트된 정보가 색인되어 상기 인덱스 DB(328) 에 저장될 수 있다. 또한, 도 8과 같이, 사용자가 특정 URL을 방문할 때마다 그 페이지 내용의 제목, 요약, URL, 접속 시간 등이 색인되어 상기 인덱스 DB(328) 에 저장될 수 있다. 이에 따라, 상기 검색부(329)는 사용자로부터의 검색 요청에 따라 상기 인덱스 DB(328)를 탐색함으로써, 상기 사용자 PC(320)에 저장된 사용자 파일들의 내용들이나 사용자가 방문했던 URL의 내용을 반영하여 해당 키워드를 가지는 검색 결과를 출력할 수 있다.
이하, 도 10의 흐름도를 참조하여 본 발명의 일실시예에 따른 상기 데스크톱 검색 시스템(300)의 검색 동작을 좀더 자세히 설명한다.
먼저, 도 3의 상기 사용자 PC(320)를 이용하는 사용자는 데스크톱 검색을 위하여, 사용자 인터페이스부(321)를 통하여, 웹 브라우저 형식으로 탐색하고자 하는 키워드를 입력한다(S1010). 이에 따라, 미니 웹 서버(323)는 상기 검색 요청에 대응되는 정보를 생성함으로써 검색 서비스 매니저(322)에 접근한다(S1020).
상기 검색 서비스 매니저(322)는 상기 검색 요청에 대응되는 정보에 따라 인덱스 DB(328)로부터 사용자가 입력한 키워드를 포함하는 색인 데이터를 검색한다(S1030). 키워드를 포함하는 색인 데이터가 존재하면, 상기 검색 서비스 매니저(322)는 해당 탐색된 색인 데이터를 검색 결과로서 상기 미니 웹 서버(323)로 전송한다(S1040).
이에 따라 상기 미니 웹 서버(323)는 상기 검색 결과에 대응되는 정보를 생성하여 상기 사용자 인터페이스부(321)로 전송하면, 해당 검색 결과가 상기 사용자 인터페이스부(321)에서 웹 브라우저 형식 등으로 표시될 수 있다(S1050). 상기 사용자 인터페이스부(321)에는, 도 11과 같이, 사용자 PC(320)에 저장된 사용자 파일들(예를 들어, 문서, 이메일, 음악, 동영상 등)의 내용들 및 사용자가 방문했던 URL의 내용을 반영한 검색 결과뿐만 아니라 상기 크롤링 처리부(324)에서 자동 크롤링된 페이지의 최신 업데이트 내용에 대한 검색 결과가 반영되어 표시된다.
위에서 기술한 바와 같이, 본 발명에 따른 데스크톱 검색 시스템(300)에서는, 미니 웹 서버(323)를 기반으로 사용자 인터페이스부(321) 및 검색 서비스 매니저(322) 사이에서 검색 요청에 대한 결과 리턴이 이루어진다. 상기 검색 서비스 매니저(322)는 사용자가 등록한 웹 페이지에 대해서 자동 지정 크롤링을 수행하여, 상기 검색 요청 시에 상기 자동 크롤링된 페이지의 최신 업데이트 내용에 대한 검색 결과를 출력할 수 있다.
본 발명에 따른 로컬 컴퓨터 검색 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
상술한 바와 같이 본 발명에 따른 데스크톱 검색 시스템에서는, RSS를 지원하지 않는 일반 사이트에 대해서도 사용자가 지정한 웹 사이트에 대해서 자동 크롤링이 이루어지므로, 사용자 PC의 파일 정보나 사용자가 방문한 웹 사이트의 정보뿐만 아니라, 자동 크롤링된 웹 사이트의 최신 업데이트된 정보가 키워드 검색에 의 하여 탐색될 수 있는 효과가 있다.

Claims (19)

  1. 사용자로부터의 검색 요청에 대응되는 제1 정보를 생성하고, 검색 결과에 대응되는 제2 정보를 생성하는 미니 웹 서버; 및
    사용자로부터 자동 크롤링을 수행할 적어도 하나의 웹 페이지 주소를 수신하여 상기 웹 페이지 주소를 등록하고, 상기 등록된 적어도 하나의 웹 페이지 주소에 자동적으로 크롤링 하고, 상기 검색 요청에 대응되는 상기 미니 웹 서버로부터의 상기 제1 정보에 따라 상기 자동 크롤링된 웹 페이지 주소의 업데이트된 내용을 반영한 상기 검색 결과를 상기 미니 웹 서버에 출력하는 검색 서비스 매니저
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  2. 제 1항에 있어서,
    상기 검색 요청을 수신하여 상기 미니 웹 서버로 전송하고 상기 검색 결과에 대응되는 제2 정보를 표시하는 사용자 인터페이스부
    를 더 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  3. 제 1항에 있어서, 상기 검색 서비스 매니저는,
    상기 등록된 적어도 하나의 웹 페이지 주소에 자동 접속하여 상기 접속된 웹 페이지 주소의 내용으로부터 색인 데이터를 생성하는 크롤링 처리부;
    상기 색인 데이터를 저장하는 인덱스 데이터베이스; 및
    상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 인덱스 데이터베이스를 탐색하여, 해당 키워드를 포함하는 검색 결과를 출력하는 검색부
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  4. 제3항에 있어서,
    상기 인덱스 데이터베이스는 사용자 컴퓨터에 저장된 사용자 파일들의 내용들을 색인한 데이터를 더 저장하고,
    상기 검색부는 상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 인덱스 데이터베이스를 탐색하여, 해당 키워드를 포함하는 검색 결과를 출력하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  5. 제3항에 있어서,
    상기 인덱스 데이터베이스는 사용자가 방문했던 웹 페이지 주소의 내용을 색인한 데이터를 더 저장하고,
    상기 검색부는 상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 인덱스 데이터베이스를 탐색하여, 해당 키워드를 포함하는 검색 결과를 출력하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  6. 제3항에 있어서, 상기 크롤링 처리부는,
    상기 등록된 적어도 하나의 웹 페이지 주소에 자동 접속하여 상기 접속된 웹 페이지 주소의 내용을 읽어오는 크롤링부;
    상기 읽어온 내용을 파싱하는 해석부; 및
    상기 파싱된 내용에 따라 상기 색인 데이터를 업데이트하는 색인부
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  7. 제6항에 있어서, 상기 색인 데이터는,
    웹 페이지 주소 또는 키워드를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  8. 제6항에 있어서, 상기 크롤링부는,
    사용자가 설정한 주기로 상기 등록된 적어도 하나의 웹 페이지 주소에 주기적으로 자동 접속하는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  9. 제6항에 있어서, 상기 크롤링부는,
    상기 접속된 웹 페이지 주소에 링크된 웹 페이지가 있는 경우에, 상기 링크된 웹 페이지에 자동 접속하여 해당 페이지의 내용을 읽어오는 것을 특징으로 하는 데스크톱 검색 서비스 시스템.
  10. 사용자로부터 자동 크롤링을 수행할 적어도 하나의 웹 페이지 주소를 수신하여 상기 웹 페이지 주소를 등록하는 단계;
    상기 등록된 적어도 하나의 웹 페이지 주소에 자동적으로 크롤링하는 단계;
    검색 요청에 대응되는 제1 정보를 생성하는 단계;
    상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 자동 크롤링된 웹 페이지 주소의 업데이트된 내용을 반영한 검색 결과를 출력하는 단계;
    상기 검색 결과에 대응되는 제2 정보를 생성하는 단계; 및
    상기 검색 결과에 대응되는 상기 제2 정보를 표시하는 단계
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  11. 제10항에 있어서, 상기 검색 요청의 전송과 상기 검색 결과에 대응되는 상기 제2 정보의 표시를 웹 브라우저 형식으로 수행하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  12. 제10항에 있어서, 상기 자동 크롤링된 웹 페이지 주소의 업데이트된 내용을 반영한 검색 결과를 출력하는 단계는,
    상기 등록된 적어도 하나의 웹 페이지 주소에 자동 접속하여 상기 접속된 웹 페이지 주소의 내용으로부터 색인 데이터를 생성하는 단계;
    상기 색인 데이터를 저장하는 단계; 및
    상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 저장된 색인 데이터를 탐색하여, 해당 키워드를 포함하는 검색 결과를 출력하는 단계
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  13. 제10항에 있어서,
    상기 검색 요청에 대응되는 상기 제1 정보에 따라 사용자 컴퓨터에 저장된 사용자 파일들의 내용들을 반영한 검색 결과를 출력하는 단계
    를 더 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  14. 제10항에 있어서,
    상기 검색 요청에 대응되는 상기 제1 정보에 따라 상기 자동 크롤링된 웹 페이지 주소와 별도로 사용자가 방문했던 웹 페이지 주소의 내용을 반영한 검색 결과를 출력하는 단계
    를 더 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  15. 제12항에 있어서, 상기 색인 데이터 생성 단계는,
    상기 등록된 적어도 하나의 웹 페이지 주소에 자동 접속하여 상기 접속된 웹 페이지 주소의 내용을 읽어오는 단계;
    상기 읽어온 내용을 파싱하는 단계; 및
    상기 파싱된 내용에 따라 상기 색인 데이터를 업데이트하는 단계
    를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  16. 제15항에 있어서, 상기 색인 데이터는,
    웹 페이지 주소 또는 키워드를 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  17. 제15항에 있어서, 사용자가 설정한 주기로 상기 등록된 적어도 하나의 웹 페이지 주소에 주기적으로 자동 접속하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  18. 제15항에 있어서,
    상기 접속된 웹 페이지 주소에 링크된 웹 페이지가 있는 경우에, 상기 링크된 웹 페이지에 자동 접속하여 해당 페이지의 내용을 읽어오는 단계
    를 더 포함하는 것을 특징으로 하는 데스크톱 검색 서비스 방법.
  19. 제10항 내지 제18항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록매체.
KR20050076175A 2005-08-19 2005-08-19 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법 KR100705413B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20050076175A KR100705413B1 (ko) 2005-08-19 2005-08-19 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20050076175A KR100705413B1 (ko) 2005-08-19 2005-08-19 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20070021660A KR20070021660A (ko) 2007-02-23
KR100705413B1 true KR100705413B1 (ko) 2007-04-10

Family

ID=41624744

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20050076175A KR100705413B1 (ko) 2005-08-19 2005-08-19 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR100705413B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200019286A (ko) 2018-08-08 2020-02-24 동명대학교산학협력단 웹 크롤링을 이용한 크레페 검색 시스템
KR20220081267A (ko) 2020-12-08 2022-06-15 주식회사 앰진시큐러스 동적 컨텐츠와 링크를 포함하는 웹사이트의 채증 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101715054B1 (ko) * 2015-06-15 2017-03-10 주식회사 인프라웨어 문서를 자동으로 생성하는 클라우드 서버 및 컴퓨터-판독가능 매체에 저장된 컴퓨터 프로그램

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050030542A (ko) * 2003-09-25 2005-03-30 마이크로소프트 코포레이션 클라이언트 기반 웹 크롤링 시스템 및 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050030542A (ko) * 2003-09-25 2005-03-30 마이크로소프트 코포레이션 클라이언트 기반 웹 크롤링 시스템 및 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200019286A (ko) 2018-08-08 2020-02-24 동명대학교산학협력단 웹 크롤링을 이용한 크레페 검색 시스템
KR20220081267A (ko) 2020-12-08 2022-06-15 주식회사 앰진시큐러스 동적 컨텐츠와 링크를 포함하는 웹사이트의 채증 방법

Also Published As

Publication number Publication date
KR20070021660A (ko) 2007-02-23

Similar Documents

Publication Publication Date Title
US7853592B2 (en) System and method of searching for previously visited website information
JP5474038B2 (ja) モバイルサイトマップ
US7299298B2 (en) Web address converter for dynamic web pages
KR101389969B1 (ko) 원격 모듈용 메시지 목록
KR100705411B1 (ko) 로컬 컴퓨터 검색 시스템 및 이를 이용한 로컬 컴퓨터 검색방법
US20060059133A1 (en) Hyperlink generation device, hyperlink generation method, and hyperlink generation program
WO2012041602A1 (en) Search engine indexing
US8135731B2 (en) Administration of search results
KR100896614B1 (ko) 검색 시스템 및 방법
US20080065677A1 (en) Analyzing web site traffic
US7895337B2 (en) Systems and methods of generating a content aware interface
US8332377B2 (en) Method for controlling search controller and system thereof
CN1960371B (zh) 一种访问Web应用程序文件的方法及系统
KR100705413B1 (ko) 웹 페이지 지정 크롤링 가능한 웹 서버 기반의 데스크톱검색 시스템 및 방법
KR100705412B1 (ko) Rss url 검색을 지원하는 웹 서버 기반의 데스크톱검색 시스템 및 방법
KR20060115488A (ko) 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버
KR20070043616A (ko) 방문 웹사이트 검색 시스템 및 이를 이용한 방문 웹사이트검색 방법
JP2002082936A (ja) コンテンツデータ表示装置とコンテンツデータ表示システム
US20030145112A1 (en) Assisted entering of addresses
KR100965343B1 (ko) 사용자의 검색 결과 활용 패턴의 공유를 이용한 검색 엔진운영 방법 및 시스템
Mehta et al. Medical Search Engine
JP2002049643A (ja) ウェブページ概念管理装置およびウェブページ概念管理方法

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20100331

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20120329

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160329

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20170328

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20190401

Year of fee payment: 13