KR20020001300A - 웹 사이트 검색 엔진 - Google Patents

웹 사이트 검색 엔진 Download PDF

Info

Publication number
KR20020001300A
KR20020001300A KR1020000035794A KR20000035794A KR20020001300A KR 20020001300 A KR20020001300 A KR 20020001300A KR 1020000035794 A KR1020000035794 A KR 1020000035794A KR 20000035794 A KR20000035794 A KR 20000035794A KR 20020001300 A KR20020001300 A KR 20020001300A
Authority
KR
South Korea
Prior art keywords
category
database
web
search engine
client
Prior art date
Application number
KR1020000035794A
Other languages
English (en)
Inventor
전병국
Original Assignee
전병국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전병국 filed Critical 전병국
Priority to KR1020000035794A priority Critical patent/KR20020001300A/ko
Publication of KR20020001300A publication Critical patent/KR20020001300A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 인터넷 망에서 웹 사이트의 주소를 검색하는 검색 엔진에 관한 것으로서, 본 발명에서는 카타고리 데이터 베이스내에 사용자가 지정한 웹 사이트의 웹 페이지 주소를 카타고리 별로 저장하며, 로봇 검색 엔진은 카타고리 데이터 베이스의 웹 사이트와 링크되어 있는 웹 페이지들의 주소를 검색하고 웹 사이트의 카타고리 번호에 대응시켜 색인 데이터 베이스에 저장한다. 본 발명의 탐색기는 클라이언트가 지정한 카타고리 번호의 웹 페이지 주소 정보를 색인 데이터 베이스로부터 검색하여 클라이언트에게 제공하므로, 클라이언트는 원하는 카타고리에 소속되어 있는 웹 페이지 정보들을 용이하게 검출할 수 있다.

Description

웹 사이트 검색 엔진{APPARATUS FOR DETECTING WEB SITE ADDRESS}
본 발명은 인터넷의 웹 페이지를 검색하는 검색 엔진에 관한 것으로서, 더욱 상세하게는 웹 페이지를 카타고리별로 검색할 수 있게 한 웹 사이트 검색 엔진에 관한 것이다.
인터넷 망에는 다양한 웹 사이트들이 구성되어 있으며 그 개수는 증가하고 있는 추세이다. 이러한 상황에서 인터넷 사용자가 원하는 웹 사이트의 주소를 용이하게 검출할 수 있게 하는 수단으로서 로봇 검색 엔진이 개발되어 사용되고 있다. 로봇 검색 엔진은 웹 사이트 및 웹 사이트 내에 구성되는 웹 페이지들이 상호 링크되어 있다는 것을 이용하는 것으로서, 사용자가 소정 웹 사이트를 지정하면, 로봇 검색 엔진은 지정된 웹 사이트를 방문한 후에 링크되어 있는 웹 사이트 및 웹 사이트의 웹 페이지들을 순차적으로 방문하고, 방문한 웹 페이지들의 주소와 그 내용 일부(HTML 문서 일부)를 색인 정보로 데이터 베이스에 저장한다. 여기서, 로봇 검색 엔진이 링크되어 있는 웹 사이트 및 웹 페이지를 더 이상 검색하지 못하게 되면, 사용자는 다른 웹 사이트의 주소를 로봇 검색 엔진에 입력함으로써 로봇 검색 엔진은 입력된 웹 사이트로부터 연속하여 링크되어 있는 웹 사이트들 및 웹 페이지들을 검색하여 데이터 베이스에 저장하는 과정을 되풀이 한다.
상술한 과정에 의하여 데이터 베이스에는 웹 사이트 및 웹 페이지들의 주소와 그 내용(색인)들이 저장되며, 클라이언트 즉, 인터넷 망에 접속되어 데이터 베이스의 정보를 이용하고자 하는 사용자는 서버 내의 탐색기(seacher)에 의하여 원하는 웹 사이트(웹 페이지) 주소를 용이하게 검색할 수 있다. 즉, 탐색기는 클라이언트에 의하여 제공되는 검색어를 갖는 웹 페이지들을 데이터 베이스로부터 탐색하고 탐색된 웹 페이지 및 웹 페이지들에 링크되어 있는 다른 웹 사이트(웹 페이지)들의 웹 페이지 주소 및 색인 정보를 클라이언트에게 제공함으로써 클라이언트는 이 정보들을 이용하여 원하는 웹 사이트의 웹 페이지에 접속할 수 있다.
그러나, 상술한 종래의 로봇 검색 엔진 구동 방법에서는 클라이언트가 제공한 검색어를 갖는 웹 페이지 주소만을 제공함으로, 클라이언트가 원하지 않는 웹페이지의 주소 정보들이 제공될 수 있다는 문제가 있다.
한편, 일반적으로 클라이언트들은 검색하고자 하는 웹 사이트가 어떠한 카타고리에 속하는지 알고 있다. 따라서, 웹 사이트의 주소 정보를 카타고리 별로 분류하여 별도의 데이터 베이스에 저장하고, 클라이언트가 요청한 카타고리에 해당하는 웹 사이트와 링크되어 있는 웹 페이지 주소 정보만을 클라이언트에게 제공하면 클라이언트가 원하는 웹 사이트의 주소를 더욱 정확하게 제공할 수 있을 것이다.
본 발명은 이러한 점에 착안한 것으로서, 본 발명의 목적은 로봇 검색 엔진이 웹 페이지들을 카타고리 별로 분류하여 데이터 베이스에 저장함으로써 클라이언트가 원하는 카타고리 내의 정보만을 용이하게 검색할 수 있게 한 웹 사이트 검색 엔진을 제공하는데 있다.
이러한 목적을 달성하기 위하여 본 발명은, 인터넷 망 내의 웹 페이지 주소를 검색하여 클라이언트에게 제공하는 검색 엔진으로서, 사용자가 지정한 웹 사이트의 주소를 카타고리 번호 별로 저장하는 카타고리 데이터 베이스와; 카타고리 번호에 대응하는 웹 사이트의 웹 페이지 주소를 저장할 수 있는 색인 데이터 베이스와; 카타고리 데이터 베이스에 저장된 웹 사이트의 주소에 대응하는 사이트에 접속 후에 링크되어 있는 웹 페이지들을 순차적으로 접속하며, 접속된 웹 페이지들의 주소를 카타고리 데이터 베이스 내의 카타고리 번호와 대응시켜 저장하는 로봇 검색 엔진과; 클라이언트에 의하여 지정된 카타고리 번호를 갖는 웹 페이지 주소들을 검색하여 상기 클라이언트에게 제공하는 탐색기를 구비한다.
도 1은 본 발명에 따른 웹 사이트 검색 엔진의 블록도,
도 2는 본 발명에 따른 웹 사이트 검색 엔진에 구성되는 카타고리 데이터 베이스의 상태를 도시한 도면,
도 3은 본 발명에 따른 웹 사이트 검색 엔진에 구성되는 색인 데이터 베이스의 상태를 도시한 도면.
<도면의 주요부분에 대한 부호의 설명>
1 : 로봇 검색 엔진 2 : 카타고리 데이터 베이스
3 : 색인 데이터 베이스 4 : 탐색기
이하, 본 발명의 일 실시예를 상세히 설명한다.
도 1은 본 발명에 따른 웹 사이트 검색 엔진의 블록도가 도시되어 있다. 도시된 바와 같이 본 발명에서는 로봇 검색 엔진(1)을 구비하며, 로봇 검색 엔진(1)에는 두 개의 데이터 베이스 즉, 카타고리 데이터 베이스(2)와 색인 데이터 베이스(3)가 연결되어 있다.
카타고리 데이터 베이스(2)에는 도 2에 도시된 바와 같이 로봇 검색 엔진(1)이 방문하여야 하는 웹 사이트들의 주소들이 카타고리 번호(C1-Cn) 별로 저장되어 있으며, 이외에 카타고리 명칭 그리고 상위 카타고리 번호 정보가 저장되어 있다. 여기서, 카타고리 번호(C1-Cn)는 명칭이 의미하는 바와 같이 해당 웹 사이트들의 카타고리를 번호로 명명한 것으로서, 사용자는 동일한 카타고리를 갖는 웹 사이트들에 대하여 동일한 카타고리 번호(C1-Cn)를 선택하여 카타고리 데이터 베이스(2)내에 저장한다. 상위 카타고리 번호는 도시된 바와 같이 해당 카타고리에 대하여 상위 카타고리가 존재하는 경우에 그 상위 카타고리의 번호를 의미하는 것으로 예컨데 도면에서 하드 디스크(카타고리 번호(C2))의 상위 카타고리로 컴퓨터를 설정할 수 있으며, 컴퓨터의 카타고리 번호는 C1이므로 하드디스크의 상위 카타고리 번호는 C1로 설정된다.
이러한 상위 카타고리 번호 역시 사용자에 의하여 카타고리 데이터 베이스(2) 내에 저장되어야 함은 후술하는 설명으로부터 본 발명의 기술 분야에서 통상의 지식을 가진 자는 용이하게 알 수 있을 것이다.
로봇 검색 엔진(1)은 구동이 개시되면 카타고리 데이터 베이스(2)내에 저장된 주소의 웹 사이트와 인터넷 망을 통하여 접속한다. 여기서 웹 사이트내의 웹 페이지들은 상호 링크되어 있으므로, 로봇 검색 엔진(1)은 방문한 웹 사이트로부터 링크되어 있는 웹 페이지들과 연속하여 접속한다. 이와 같이 로봇 검색 엔진(1)은 카타고리 데이터 베이스(2)에 저장된 웹 사이트내의 웹 페이지들과 순차적으로 접속할 수 있으며, 이들은 상호 동일한 카타고리에 속한다고 볼 수 있다.
로봇 검색 엔진(1)은 카타고리 데이터 베이스(2)의 소정 웹 사이트(예컨데 컴퓨터의 웹 사이트)내에 링크되어 있는 모든 웹 페이지들과 순차적으로 접속하고 접속된 웹 페이지의 주소를 색인 데이터 베이스(3)에 저장하며, 이들은 도 3에 도시된 바와 같이 동일한 카타고리 번호(C1)를 갖도록 설정한다. 즉, 퍼스널 컴퓨터의 웹 사이트내에서 링크된 모든 웹 페이지들은 도시된 바와 같이 카타고리 번호 "C1"을 갖는 것이다. 도면에서 p1,p2,.. 으로 표시한 것은 해당 웹 사이트(예컨데 www.samsung.co,)내의 구성되는 웹 페이지의 주소를 의미하며, 색인 데이터 베이스(3)내의 색인 내용이라 함은 로봇 검색 엔진(1)이 방문한 페이지들의 정보 내용을 색인화하여 저장한 내용을 의미한다.
여기서, 사용자는 카타고리 데이터 베이스(2)의 카타고리 번호에는 하나 이상의 웹 사이트 주소를 저장할 수 있으며(예컨데 카타고리 번호(C2)의 하드 디스크의 경우), 이 경우 로봇 검색 엔진(1)은 카타고리 번호 내에 있는 다수의 웹 사이트의 주소들 중 하나의 주소(www.hard.com)를 독출하여 독출된 주소의 웹 사이트와 접속하고, 접속된 웹 사이트내의 웹 페이지들과 접속한 후에는 동일 카타고리 번호내의 다른 웹 사이트의 주소(www.disk.com)를 독출하여 독출된 주소의 웹 사이트내의 웹 페이지들과 접속하는 과정을 행하며, 접속된 모든 웹 페이지들의 주소들은 색인 데이터 베이스(3)에서 동일 카타고리 번호(C2)를 가져야 함을 알아야 한다.
상술한 설명에서 알 수 있는 바와 같이 색인 데이터 베이스(3)에 저장되는 웹 페이지의 주소들은 카타고리 데이터 베이스(2)에서의 카타고리 번호에 따라 분류되어 있는 상태이므로, 본 발명의 검색 엔진에 접속한 클라이언트는 원하는 정보를 갖는 웹 사이트(웹 페이지)를 용이하게 검색할 수 있다. 즉, 클라이언트가 소정 검색어를 제공하는 경우에 탐색기(4)는 검색어에 대응하는 내용을 갖는 웹 페이지들을 색인 데이터 베이스(3)에서 검색하여 클라이어트에게 제공할 수 있다. 또한 본 발명에서는 색인 데이터 베이스(3)내의 웹 페이지 주소들이 카타고리별로 분류되어 있으므로, 클라이언트가 소정 카타고리 번호(C1-Cn)를 선택하면, 탐색기(4)는 해당 색인 데이터베이스(3)의 카타고리 번호(C1-Cn)를 갖는 웹 페이지의 주소를 클라이언트에게 제공함으로써 클라이언트는 선택한 카타고리의 웹 페이지 주소를 용이하게 습득할 수 있다.
또한, 상술한 바와 같이 카타고리 데이터 베이스(2)내에는 상위 카타고리 번호 정보가 저장되어 있다. 따라서, 탐색기(4)는 사용자가 소정 카타고리 번호(예컨데, C1)를 선택하는 경우에 카타고리 번호(C1)에 해당하는 웹 페이지의 주소들을 클라이언트에게 제공하는 한편 카타고리 데이터 베이스(2)의 상위 카타고리 정보를 참조하여 카타고리 번호(C1)를 상위 카타고리 번호로 하는 카타고리 번호(C2 및 C3)를 검색하고, 이 카타고리 번호(C2,C3)를 갖는 웹 페이지 주소 정보들을 색인데이터 베이스(3)로부터 검출하여 클라이언트에게 제공할 수도 있다.
또한, 본 발명의 탐색기(4)는 사용자가 카타고리 번호 및 검색어를 입력하는 경우에는 해당 카타고리 번호에 해당하는 웹 페이지들 중에서 해당 검색어를 갖는 웹 페이지만을 색인 데이터 베이스(3)로부터 검출하여 클라이언트에게 제공할 수 있음은 본 발명의 기술 분야에서 통상의 지식을 가진 자는 용이하게 알 수 있을 것이다.
이와 같이 본 발명에서는 카타고리 데이터 베이스 내에 로봇 검색 엔진이 접속할 웹 사이트의 주소 및 그 카타고리 번호를 설정하고, 로봇 검색 엔진은 카타고리 데이터 베이스의 웹 사이트 주소와 접속하여 접속된 웹 사이트 내에 링크되어 있는 웹 페이지들의 주소를 카타고리 번호와 함께 색인 데이터 베이스에 저장함으로써 본 발명의 검색 엔진은 클라이언트가 지정한 카타고리 내의 웹 페이지 주소를 용이하게 검색하여 제공할 수 있다는 효과가 있다.

Claims (3)

  1. 인터넷 망 내의 웹 페이지 주소를 검색하여 클라이언트에게 제공하는 검색 엔진으로서,
    사용자가 지정한 웹 사이트들의 주소를 카타고리 번호 별로 저장하는 카타고리 데이터 베이스와;
    카타고리 번호에 대응하는 웹 사이트내 웹 페이지의 주소를 저장할 수 있는 색인 데이터 베이스와;
    상기 카타고리 데이터 베이스에 저장된 웹 사이트의 주소에 대응하는 웹 사이트와 접속 후 접속된 웹 사이티트내에 링크되어 있는 웹 페이지들을 순차적으로 접속하며, 상기 접속된 웹 페이지들의 주소를 상기 카타고리 데이터 베이스 내의 카타고리 번호와 대응시켜 저장하는 로봇 검색 엔진과;
    클라이언트에 의하여 지정된 카타고리 번호를 갖는 상기 웹 페이지 주소들을 검색하여 상기 클라이언트에게 제공하는 탐색기를 구비하는 웹 사이트 검색 엔진.
  2. 제 1 항에 있어서,
    상기 카타고리 데이터 베이스내에는 상기 카타고리 번호에 대응한 카타고리의 상위 카타고리를 알리는 카타고리 번호가 더 저장되며,
    상기 탐색기는 상기 지정된 카타고리 번호를 갖는 상기 웹 페이지 주소들 및 상기 지정된 카타고리 번호의 상위 카타고리 번호를 갖는 상기 웹 페이지 주소들을상기 클라이언트에게 더 제공하도록 구성되는 것을 특징으로 하는 웹 사이트 검색 엔진.
  3. 제 2 항에 있어서,
    상기 검색 데이터 베이스는 웹 페이지의 내용을 알리는 색인 정보를 더 저장하며,
    상기 로봇 검색 엔진은 상기 접속된 상기 웹 페이지의 색인 정보를 상기 카타고리 번호에 대응하여 상기 검색 데이터 베이스에 저장하고,
    상기 탐색기는 상기 클라이언트가 입력한 검색어를 갖는 웹 페이지의 주소를 상기 검색 데이터 베이스의 색인 정보로부터 검색하여 상기 클라이언트에게 제공하도록 구성된 웹 사이트 검색 엔진.
KR1020000035794A 2000-06-27 2000-06-27 웹 사이트 검색 엔진 KR20020001300A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000035794A KR20020001300A (ko) 2000-06-27 2000-06-27 웹 사이트 검색 엔진

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000035794A KR20020001300A (ko) 2000-06-27 2000-06-27 웹 사이트 검색 엔진

Publications (1)

Publication Number Publication Date
KR20020001300A true KR20020001300A (ko) 2002-01-09

Family

ID=19674306

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000035794A KR20020001300A (ko) 2000-06-27 2000-06-27 웹 사이트 검색 엔진

Country Status (1)

Country Link
KR (1) KR20020001300A (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100781122B1 (ko) * 2007-02-06 2007-11-30 삼성전자주식회사 휴대 단말기의 웹 페이지 표시 방법 및 장치

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10340275A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 情報抽出装置
US5895470A (en) * 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
KR20000075203A (ko) * 1999-05-31 2000-12-15 홍오성 범용 로봇에이전트 및 실시간 검색방법
KR20010063407A (ko) * 1999-12-22 2001-07-09 박태웅 인터넷 가상 공간에 설치된 홈 페이지들을 분류하는 방법및 그 장치
KR20010104871A (ko) * 2000-05-16 2001-11-28 임갑철 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템
KR20010105842A (ko) * 2000-05-18 2001-11-29 구자홍 인터넷을 이용한 정보검색 결과 제공방법

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5895470A (en) * 1997-04-09 1999-04-20 Xerox Corporation System for categorizing documents in a linked collection of documents
JPH10340275A (ja) * 1997-06-09 1998-12-22 Fuji Xerox Co Ltd 情報抽出装置
KR20000075203A (ko) * 1999-05-31 2000-12-15 홍오성 범용 로봇에이전트 및 실시간 검색방법
KR20010063407A (ko) * 1999-12-22 2001-07-09 박태웅 인터넷 가상 공간에 설치된 홈 페이지들을 분류하는 방법및 그 장치
KR20010104871A (ko) * 2000-05-16 2001-11-28 임갑철 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템
KR20010105842A (ko) * 2000-05-18 2001-11-29 구자홍 인터넷을 이용한 정보검색 결과 제공방법

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100781122B1 (ko) * 2007-02-06 2007-11-30 삼성전자주식회사 휴대 단말기의 웹 페이지 표시 방법 및 장치

Similar Documents

Publication Publication Date Title
US7941428B2 (en) Method for enhancing search results
US7020679B2 (en) Two-level internet search service system
US8676830B2 (en) Keyword recommendation for internet search engines
US7461155B2 (en) Method and apparatus for utilizing the social usage learned from multi-user feedback to improve resource identity signifier mapping
US8849818B1 (en) Searching via user-specified ratings
US6321227B1 (en) Web search function to search information from a specific location
US8577868B1 (en) Bookmarks
JP5268073B2 (ja) ブックマークおよびランク付け
US9529861B2 (en) Method, system, and graphical user interface for improved search result displays via user-specified annotations
US7840547B1 (en) Methods and systems for efficient query rewriting
US8589391B1 (en) Method and system for generating web site ratings for a user
US20090234834A1 (en) System, method, and/or apparatus for reordering search results
US20110225137A1 (en) Enhancing and optimizing enterprise search
CA2409642A1 (en) Method and apparatus for identifying related searches in a database search system
JP2008547119A (ja) サーチ結果を提供するためのシステムおよび方法
KR100896614B1 (ko) 검색 시스템 및 방법
US6950861B1 (en) System and method for searching websites associated with bookmarks
US7630959B2 (en) System and method for processing database queries
US7836108B1 (en) Clustering by previous representative
JP2007520788A (ja) ウェブページに対する地理的位置識別子の割当て
KR20000007034A (ko) 웹검색사이트의 검색결과 표시방법
Ansari et al. Architecture for checking trustworthiness of websites
KR20000071937A (ko) 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법
US20090234838A1 (en) System, method, and/or apparatus for subset discovery
US20060059126A1 (en) System and method for network searching

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application