KR20020001300A - 웹 사이트 검색 엔진 - Google Patents
웹 사이트 검색 엔진 Download PDFInfo
- Publication number
- KR20020001300A KR20020001300A KR1020000035794A KR20000035794A KR20020001300A KR 20020001300 A KR20020001300 A KR 20020001300A KR 1020000035794 A KR1020000035794 A KR 1020000035794A KR 20000035794 A KR20000035794 A KR 20000035794A KR 20020001300 A KR20020001300 A KR 20020001300A
- Authority
- KR
- South Korea
- Prior art keywords
- category
- database
- web
- search engine
- client
- Prior art date
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/951—Indexing; Web crawling techniques
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명은 인터넷 망에서 웹 사이트의 주소를 검색하는 검색 엔진에 관한 것으로서, 본 발명에서는 카타고리 데이터 베이스내에 사용자가 지정한 웹 사이트의 웹 페이지 주소를 카타고리 별로 저장하며, 로봇 검색 엔진은 카타고리 데이터 베이스의 웹 사이트와 링크되어 있는 웹 페이지들의 주소를 검색하고 웹 사이트의 카타고리 번호에 대응시켜 색인 데이터 베이스에 저장한다. 본 발명의 탐색기는 클라이언트가 지정한 카타고리 번호의 웹 페이지 주소 정보를 색인 데이터 베이스로부터 검색하여 클라이언트에게 제공하므로, 클라이언트는 원하는 카타고리에 소속되어 있는 웹 페이지 정보들을 용이하게 검출할 수 있다.
Description
본 발명은 인터넷의 웹 페이지를 검색하는 검색 엔진에 관한 것으로서, 더욱 상세하게는 웹 페이지를 카타고리별로 검색할 수 있게 한 웹 사이트 검색 엔진에 관한 것이다.
인터넷 망에는 다양한 웹 사이트들이 구성되어 있으며 그 개수는 증가하고 있는 추세이다. 이러한 상황에서 인터넷 사용자가 원하는 웹 사이트의 주소를 용이하게 검출할 수 있게 하는 수단으로서 로봇 검색 엔진이 개발되어 사용되고 있다. 로봇 검색 엔진은 웹 사이트 및 웹 사이트 내에 구성되는 웹 페이지들이 상호 링크되어 있다는 것을 이용하는 것으로서, 사용자가 소정 웹 사이트를 지정하면, 로봇 검색 엔진은 지정된 웹 사이트를 방문한 후에 링크되어 있는 웹 사이트 및 웹 사이트의 웹 페이지들을 순차적으로 방문하고, 방문한 웹 페이지들의 주소와 그 내용 일부(HTML 문서 일부)를 색인 정보로 데이터 베이스에 저장한다. 여기서, 로봇 검색 엔진이 링크되어 있는 웹 사이트 및 웹 페이지를 더 이상 검색하지 못하게 되면, 사용자는 다른 웹 사이트의 주소를 로봇 검색 엔진에 입력함으로써 로봇 검색 엔진은 입력된 웹 사이트로부터 연속하여 링크되어 있는 웹 사이트들 및 웹 페이지들을 검색하여 데이터 베이스에 저장하는 과정을 되풀이 한다.
상술한 과정에 의하여 데이터 베이스에는 웹 사이트 및 웹 페이지들의 주소와 그 내용(색인)들이 저장되며, 클라이언트 즉, 인터넷 망에 접속되어 데이터 베이스의 정보를 이용하고자 하는 사용자는 서버 내의 탐색기(seacher)에 의하여 원하는 웹 사이트(웹 페이지) 주소를 용이하게 검색할 수 있다. 즉, 탐색기는 클라이언트에 의하여 제공되는 검색어를 갖는 웹 페이지들을 데이터 베이스로부터 탐색하고 탐색된 웹 페이지 및 웹 페이지들에 링크되어 있는 다른 웹 사이트(웹 페이지)들의 웹 페이지 주소 및 색인 정보를 클라이언트에게 제공함으로써 클라이언트는 이 정보들을 이용하여 원하는 웹 사이트의 웹 페이지에 접속할 수 있다.
그러나, 상술한 종래의 로봇 검색 엔진 구동 방법에서는 클라이언트가 제공한 검색어를 갖는 웹 페이지 주소만을 제공함으로, 클라이언트가 원하지 않는 웹페이지의 주소 정보들이 제공될 수 있다는 문제가 있다.
한편, 일반적으로 클라이언트들은 검색하고자 하는 웹 사이트가 어떠한 카타고리에 속하는지 알고 있다. 따라서, 웹 사이트의 주소 정보를 카타고리 별로 분류하여 별도의 데이터 베이스에 저장하고, 클라이언트가 요청한 카타고리에 해당하는 웹 사이트와 링크되어 있는 웹 페이지 주소 정보만을 클라이언트에게 제공하면 클라이언트가 원하는 웹 사이트의 주소를 더욱 정확하게 제공할 수 있을 것이다.
본 발명은 이러한 점에 착안한 것으로서, 본 발명의 목적은 로봇 검색 엔진이 웹 페이지들을 카타고리 별로 분류하여 데이터 베이스에 저장함으로써 클라이언트가 원하는 카타고리 내의 정보만을 용이하게 검색할 수 있게 한 웹 사이트 검색 엔진을 제공하는데 있다.
이러한 목적을 달성하기 위하여 본 발명은, 인터넷 망 내의 웹 페이지 주소를 검색하여 클라이언트에게 제공하는 검색 엔진으로서, 사용자가 지정한 웹 사이트의 주소를 카타고리 번호 별로 저장하는 카타고리 데이터 베이스와; 카타고리 번호에 대응하는 웹 사이트의 웹 페이지 주소를 저장할 수 있는 색인 데이터 베이스와; 카타고리 데이터 베이스에 저장된 웹 사이트의 주소에 대응하는 사이트에 접속 후에 링크되어 있는 웹 페이지들을 순차적으로 접속하며, 접속된 웹 페이지들의 주소를 카타고리 데이터 베이스 내의 카타고리 번호와 대응시켜 저장하는 로봇 검색 엔진과; 클라이언트에 의하여 지정된 카타고리 번호를 갖는 웹 페이지 주소들을 검색하여 상기 클라이언트에게 제공하는 탐색기를 구비한다.
도 1은 본 발명에 따른 웹 사이트 검색 엔진의 블록도,
도 2는 본 발명에 따른 웹 사이트 검색 엔진에 구성되는 카타고리 데이터 베이스의 상태를 도시한 도면,
도 3은 본 발명에 따른 웹 사이트 검색 엔진에 구성되는 색인 데이터 베이스의 상태를 도시한 도면.
<도면의 주요부분에 대한 부호의 설명>
1 : 로봇 검색 엔진 2 : 카타고리 데이터 베이스
3 : 색인 데이터 베이스 4 : 탐색기
이하, 본 발명의 일 실시예를 상세히 설명한다.
도 1은 본 발명에 따른 웹 사이트 검색 엔진의 블록도가 도시되어 있다. 도시된 바와 같이 본 발명에서는 로봇 검색 엔진(1)을 구비하며, 로봇 검색 엔진(1)에는 두 개의 데이터 베이스 즉, 카타고리 데이터 베이스(2)와 색인 데이터 베이스(3)가 연결되어 있다.
카타고리 데이터 베이스(2)에는 도 2에 도시된 바와 같이 로봇 검색 엔진(1)이 방문하여야 하는 웹 사이트들의 주소들이 카타고리 번호(C1-Cn) 별로 저장되어 있으며, 이외에 카타고리 명칭 그리고 상위 카타고리 번호 정보가 저장되어 있다. 여기서, 카타고리 번호(C1-Cn)는 명칭이 의미하는 바와 같이 해당 웹 사이트들의 카타고리를 번호로 명명한 것으로서, 사용자는 동일한 카타고리를 갖는 웹 사이트들에 대하여 동일한 카타고리 번호(C1-Cn)를 선택하여 카타고리 데이터 베이스(2)내에 저장한다. 상위 카타고리 번호는 도시된 바와 같이 해당 카타고리에 대하여 상위 카타고리가 존재하는 경우에 그 상위 카타고리의 번호를 의미하는 것으로 예컨데 도면에서 하드 디스크(카타고리 번호(C2))의 상위 카타고리로 컴퓨터를 설정할 수 있으며, 컴퓨터의 카타고리 번호는 C1이므로 하드디스크의 상위 카타고리 번호는 C1로 설정된다.
이러한 상위 카타고리 번호 역시 사용자에 의하여 카타고리 데이터 베이스(2) 내에 저장되어야 함은 후술하는 설명으로부터 본 발명의 기술 분야에서 통상의 지식을 가진 자는 용이하게 알 수 있을 것이다.
로봇 검색 엔진(1)은 구동이 개시되면 카타고리 데이터 베이스(2)내에 저장된 주소의 웹 사이트와 인터넷 망을 통하여 접속한다. 여기서 웹 사이트내의 웹 페이지들은 상호 링크되어 있으므로, 로봇 검색 엔진(1)은 방문한 웹 사이트로부터 링크되어 있는 웹 페이지들과 연속하여 접속한다. 이와 같이 로봇 검색 엔진(1)은 카타고리 데이터 베이스(2)에 저장된 웹 사이트내의 웹 페이지들과 순차적으로 접속할 수 있으며, 이들은 상호 동일한 카타고리에 속한다고 볼 수 있다.
로봇 검색 엔진(1)은 카타고리 데이터 베이스(2)의 소정 웹 사이트(예컨데 컴퓨터의 웹 사이트)내에 링크되어 있는 모든 웹 페이지들과 순차적으로 접속하고 접속된 웹 페이지의 주소를 색인 데이터 베이스(3)에 저장하며, 이들은 도 3에 도시된 바와 같이 동일한 카타고리 번호(C1)를 갖도록 설정한다. 즉, 퍼스널 컴퓨터의 웹 사이트내에서 링크된 모든 웹 페이지들은 도시된 바와 같이 카타고리 번호 "C1"을 갖는 것이다. 도면에서 p1,p2,.. 으로 표시한 것은 해당 웹 사이트(예컨데 www.samsung.co,)내의 구성되는 웹 페이지의 주소를 의미하며, 색인 데이터 베이스(3)내의 색인 내용이라 함은 로봇 검색 엔진(1)이 방문한 페이지들의 정보 내용을 색인화하여 저장한 내용을 의미한다.
여기서, 사용자는 카타고리 데이터 베이스(2)의 카타고리 번호에는 하나 이상의 웹 사이트 주소를 저장할 수 있으며(예컨데 카타고리 번호(C2)의 하드 디스크의 경우), 이 경우 로봇 검색 엔진(1)은 카타고리 번호 내에 있는 다수의 웹 사이트의 주소들 중 하나의 주소(www.hard.com)를 독출하여 독출된 주소의 웹 사이트와 접속하고, 접속된 웹 사이트내의 웹 페이지들과 접속한 후에는 동일 카타고리 번호내의 다른 웹 사이트의 주소(www.disk.com)를 독출하여 독출된 주소의 웹 사이트내의 웹 페이지들과 접속하는 과정을 행하며, 접속된 모든 웹 페이지들의 주소들은 색인 데이터 베이스(3)에서 동일 카타고리 번호(C2)를 가져야 함을 알아야 한다.
상술한 설명에서 알 수 있는 바와 같이 색인 데이터 베이스(3)에 저장되는 웹 페이지의 주소들은 카타고리 데이터 베이스(2)에서의 카타고리 번호에 따라 분류되어 있는 상태이므로, 본 발명의 검색 엔진에 접속한 클라이언트는 원하는 정보를 갖는 웹 사이트(웹 페이지)를 용이하게 검색할 수 있다. 즉, 클라이언트가 소정 검색어를 제공하는 경우에 탐색기(4)는 검색어에 대응하는 내용을 갖는 웹 페이지들을 색인 데이터 베이스(3)에서 검색하여 클라이어트에게 제공할 수 있다. 또한 본 발명에서는 색인 데이터 베이스(3)내의 웹 페이지 주소들이 카타고리별로 분류되어 있으므로, 클라이언트가 소정 카타고리 번호(C1-Cn)를 선택하면, 탐색기(4)는 해당 색인 데이터베이스(3)의 카타고리 번호(C1-Cn)를 갖는 웹 페이지의 주소를 클라이언트에게 제공함으로써 클라이언트는 선택한 카타고리의 웹 페이지 주소를 용이하게 습득할 수 있다.
또한, 상술한 바와 같이 카타고리 데이터 베이스(2)내에는 상위 카타고리 번호 정보가 저장되어 있다. 따라서, 탐색기(4)는 사용자가 소정 카타고리 번호(예컨데, C1)를 선택하는 경우에 카타고리 번호(C1)에 해당하는 웹 페이지의 주소들을 클라이언트에게 제공하는 한편 카타고리 데이터 베이스(2)의 상위 카타고리 정보를 참조하여 카타고리 번호(C1)를 상위 카타고리 번호로 하는 카타고리 번호(C2 및 C3)를 검색하고, 이 카타고리 번호(C2,C3)를 갖는 웹 페이지 주소 정보들을 색인데이터 베이스(3)로부터 검출하여 클라이언트에게 제공할 수도 있다.
또한, 본 발명의 탐색기(4)는 사용자가 카타고리 번호 및 검색어를 입력하는 경우에는 해당 카타고리 번호에 해당하는 웹 페이지들 중에서 해당 검색어를 갖는 웹 페이지만을 색인 데이터 베이스(3)로부터 검출하여 클라이언트에게 제공할 수 있음은 본 발명의 기술 분야에서 통상의 지식을 가진 자는 용이하게 알 수 있을 것이다.
이와 같이 본 발명에서는 카타고리 데이터 베이스 내에 로봇 검색 엔진이 접속할 웹 사이트의 주소 및 그 카타고리 번호를 설정하고, 로봇 검색 엔진은 카타고리 데이터 베이스의 웹 사이트 주소와 접속하여 접속된 웹 사이트 내에 링크되어 있는 웹 페이지들의 주소를 카타고리 번호와 함께 색인 데이터 베이스에 저장함으로써 본 발명의 검색 엔진은 클라이언트가 지정한 카타고리 내의 웹 페이지 주소를 용이하게 검색하여 제공할 수 있다는 효과가 있다.
Claims (3)
- 인터넷 망 내의 웹 페이지 주소를 검색하여 클라이언트에게 제공하는 검색 엔진으로서,사용자가 지정한 웹 사이트들의 주소를 카타고리 번호 별로 저장하는 카타고리 데이터 베이스와;카타고리 번호에 대응하는 웹 사이트내 웹 페이지의 주소를 저장할 수 있는 색인 데이터 베이스와;상기 카타고리 데이터 베이스에 저장된 웹 사이트의 주소에 대응하는 웹 사이트와 접속 후 접속된 웹 사이티트내에 링크되어 있는 웹 페이지들을 순차적으로 접속하며, 상기 접속된 웹 페이지들의 주소를 상기 카타고리 데이터 베이스 내의 카타고리 번호와 대응시켜 저장하는 로봇 검색 엔진과;클라이언트에 의하여 지정된 카타고리 번호를 갖는 상기 웹 페이지 주소들을 검색하여 상기 클라이언트에게 제공하는 탐색기를 구비하는 웹 사이트 검색 엔진.
- 제 1 항에 있어서,상기 카타고리 데이터 베이스내에는 상기 카타고리 번호에 대응한 카타고리의 상위 카타고리를 알리는 카타고리 번호가 더 저장되며,상기 탐색기는 상기 지정된 카타고리 번호를 갖는 상기 웹 페이지 주소들 및 상기 지정된 카타고리 번호의 상위 카타고리 번호를 갖는 상기 웹 페이지 주소들을상기 클라이언트에게 더 제공하도록 구성되는 것을 특징으로 하는 웹 사이트 검색 엔진.
- 제 2 항에 있어서,상기 검색 데이터 베이스는 웹 페이지의 내용을 알리는 색인 정보를 더 저장하며,상기 로봇 검색 엔진은 상기 접속된 상기 웹 페이지의 색인 정보를 상기 카타고리 번호에 대응하여 상기 검색 데이터 베이스에 저장하고,상기 탐색기는 상기 클라이언트가 입력한 검색어를 갖는 웹 페이지의 주소를 상기 검색 데이터 베이스의 색인 정보로부터 검색하여 상기 클라이언트에게 제공하도록 구성된 웹 사이트 검색 엔진.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000035794A KR20020001300A (ko) | 2000-06-27 | 2000-06-27 | 웹 사이트 검색 엔진 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020000035794A KR20020001300A (ko) | 2000-06-27 | 2000-06-27 | 웹 사이트 검색 엔진 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20020001300A true KR20020001300A (ko) | 2002-01-09 |
Family
ID=19674306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020000035794A KR20020001300A (ko) | 2000-06-27 | 2000-06-27 | 웹 사이트 검색 엔진 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20020001300A (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100781122B1 (ko) * | 2007-02-06 | 2007-11-30 | 삼성전자주식회사 | 휴대 단말기의 웹 페이지 표시 방법 및 장치 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH10340275A (ja) * | 1997-06-09 | 1998-12-22 | Fuji Xerox Co Ltd | 情報抽出装置 |
US5895470A (en) * | 1997-04-09 | 1999-04-20 | Xerox Corporation | System for categorizing documents in a linked collection of documents |
KR20000075203A (ko) * | 1999-05-31 | 2000-12-15 | 홍오성 | 범용 로봇에이전트 및 실시간 검색방법 |
KR20010063407A (ko) * | 1999-12-22 | 2001-07-09 | 박태웅 | 인터넷 가상 공간에 설치된 홈 페이지들을 분류하는 방법및 그 장치 |
KR20010104871A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템 |
KR20010105842A (ko) * | 2000-05-18 | 2001-11-29 | 구자홍 | 인터넷을 이용한 정보검색 결과 제공방법 |
-
2000
- 2000-06-27 KR KR1020000035794A patent/KR20020001300A/ko not_active Application Discontinuation
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5895470A (en) * | 1997-04-09 | 1999-04-20 | Xerox Corporation | System for categorizing documents in a linked collection of documents |
JPH10340275A (ja) * | 1997-06-09 | 1998-12-22 | Fuji Xerox Co Ltd | 情報抽出装置 |
KR20000075203A (ko) * | 1999-05-31 | 2000-12-15 | 홍오성 | 범용 로봇에이전트 및 실시간 검색방법 |
KR20010063407A (ko) * | 1999-12-22 | 2001-07-09 | 박태웅 | 인터넷 가상 공간에 설치된 홈 페이지들을 분류하는 방법및 그 장치 |
KR20010104871A (ko) * | 2000-05-16 | 2001-11-28 | 임갑철 | 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템 |
KR20010105842A (ko) * | 2000-05-18 | 2001-11-29 | 구자홍 | 인터넷을 이용한 정보검색 결과 제공방법 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100781122B1 (ko) * | 2007-02-06 | 2007-11-30 | 삼성전자주식회사 | 휴대 단말기의 웹 페이지 표시 방법 및 장치 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7941428B2 (en) | Method for enhancing search results | |
US7020679B2 (en) | Two-level internet search service system | |
US8676830B2 (en) | Keyword recommendation for internet search engines | |
US7461155B2 (en) | Method and apparatus for utilizing the social usage learned from multi-user feedback to improve resource identity signifier mapping | |
US8849818B1 (en) | Searching via user-specified ratings | |
US6321227B1 (en) | Web search function to search information from a specific location | |
US8577868B1 (en) | Bookmarks | |
JP5268073B2 (ja) | ブックマークおよびランク付け | |
US9529861B2 (en) | Method, system, and graphical user interface for improved search result displays via user-specified annotations | |
US7840547B1 (en) | Methods and systems for efficient query rewriting | |
US8589391B1 (en) | Method and system for generating web site ratings for a user | |
US20090234834A1 (en) | System, method, and/or apparatus for reordering search results | |
US20110225137A1 (en) | Enhancing and optimizing enterprise search | |
CA2409642A1 (en) | Method and apparatus for identifying related searches in a database search system | |
JP2008547119A (ja) | サーチ結果を提供するためのシステムおよび方法 | |
KR100896614B1 (ko) | 검색 시스템 및 방법 | |
US6950861B1 (en) | System and method for searching websites associated with bookmarks | |
US7630959B2 (en) | System and method for processing database queries | |
US7836108B1 (en) | Clustering by previous representative | |
JP2007520788A (ja) | ウェブページに対する地理的位置識別子の割当て | |
KR20000007034A (ko) | 웹검색사이트의 검색결과 표시방법 | |
Ansari et al. | Architecture for checking trustworthiness of websites | |
KR20000071937A (ko) | 사이트 정보 데이터베이스 구축을 통한 인터넷 상에서의정보 검색 방법 | |
US20090234838A1 (en) | System, method, and/or apparatus for subset discovery | |
US20060059126A1 (en) | System and method for network searching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |