KR20020083701A - 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램 - Google Patents

분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램 Download PDF

Info

Publication number
KR20020083701A
KR20020083701A KR1020010023276A KR20010023276A KR20020083701A KR 20020083701 A KR20020083701 A KR 20020083701A KR 1020010023276 A KR1020010023276 A KR 1020010023276A KR 20010023276 A KR20010023276 A KR 20010023276A KR 20020083701 A KR20020083701 A KR 20020083701A
Authority
KR
South Korea
Prior art keywords
image
server
website
search
client computer
Prior art date
Application number
KR1020010023276A
Other languages
English (en)
Inventor
이정곤
Original Assignee
이정곤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 이정곤 filed Critical 이정곤
Priority to KR1020010023276A priority Critical patent/KR20020083701A/ko
Publication of KR20020083701A publication Critical patent/KR20020083701A/ko

Links

Classifications

    • AHUMAN NECESSITIES
    • A46BRUSHWARE
    • A46DMANUFACTURE OF BRUSHES
    • A46D3/00Preparing, i.e. Manufacturing brush bodies
    • A46D3/005Preparing, i.e. Manufacturing brush bodies by moulding or casting a body around bristles or tufts of bristles
    • AHUMAN NECESSITIES
    • A46BRUSHWARE
    • A46BBRUSHES
    • A46B9/00Arrangements of the bristles in the brush body
    • A46B9/02Position or arrangement of bristles in relation to surface of the brush body, e.g. inclined, in rows, in groups
    • A46B9/04Arranged like in or for toothbrushes
    • AHUMAN NECESSITIES
    • A46BRUSHWARE
    • A46DMANUFACTURE OF BRUSHES
    • A46D1/00Bristles; Selection of materials for bristles
    • A46D1/02Bristles details
    • A46D1/0207Bristles characterised by the choice of material, e.g. metal
    • AHUMAN NECESSITIES
    • A46BRUSHWARE
    • A46BBRUSHES
    • A46B2200/00Brushes characterized by their functions, uses or applications
    • A46B2200/10For human or animal care
    • A46B2200/1066Toothbrush for cleaning the teeth or dentures

Landscapes

  • Engineering & Computer Science (AREA)
  • Manufacturing & Machinery (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

저렴한 비용으로 구축할 수 있으며 사전에 축적된 웹페이지 정보를 제공함에 있어 해당 웹페이지 구성을 이미지 형태로 제공함으로써 해당 웹사이트를 굳이 방문하지 않고서도 웹페이지의 구성을 알 수 있도록 해서 이용자의 인터넷 검색 효율을 높일 수 있게 해주는 검색 시스템. 검색 시스템은 적어도 하나의 서버와 상기 서버에 연동되어 동작하는 복수의 정보수집 클라이언트 컴퓨터를 포함한다. 각 정보수집 클라이언트 컴퓨터에는 캡쳐 로봇 프로그램이 적재되어 실행된다. 정보수집 클라이언트 컴퓨터는 서버로부터 URL 데이터를 받아들이고, 해당 웹사이트에 접근하여 인덱스 페이지와 해당 사이트가 제공하는 제품/서비스/콘텐츠 안내 페이지를 확보하고 이들 페이지들을 이미지 형태로 캡쳐한다. 정보수집 클라이언트는 캡쳐된 이미지 파일들을 일정한 포맷으로 압축하여 서버에 제공한다. 서버는 이미지 파일들을 데이터베이스에 저장하고 이용자의 검색 클라이언트 컴퓨터의 요구에 따라 해당 웹사이트 정보를 제공할 때 이미지 파일들을 함께 제공하여, 검색 클라이언트 컴퓨터 상에서 복수의 이미지들이 일정한 시간 주기로 번갈아 디스플레이되도록 하게 된다.

Description

분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스 제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램{Distributed Internet Search System, Methods of Collecting Information and Providing the Information, and Capture Robot Program for Implementing the Same}
본 발명은 인터넷에서 정보 서비스를 제공하기 위한 시스템 및 방법에 관한 것으로서, 보다 상세하게는 인터넷 검색 서비스를 제공하기 위한 검색 시스템, 정보 수집 방법 및 검색 서비스 제공 방법에 관한 것이다. 아울러, 본 발명은 이와 같은 시스템에 사용하기 위한 캡쳐 로봇 프로그램에 관한 것이다.
인터넷 이용자가 월드와이드웹(WWW) 상에서 정보 검색 및 획득을 용이하게 해주는 검색사이트가 널리 이용되고 있다. 이와 같은 검색사이트에서는 다수의 웹사이트 또는 웹문서에 대한 정보를 사전에 데이터베이스에 저장해두고, 사용자가 입력한 질의어와 관련이 있는 웹사이트들 또는 웹문서들을 데이터베이스로부터 호출하여 그 리스트를 제공한다. 일반적으로 검색사이트들이 운용하는 검색엔진들은 디렉토리 검색엔진 및 로봇 검색엔진으로 대별된다.
디렉토리 검색엔진이란 웹문서의 수집 작업을 사람이 직접 수행하고 수집된 웹문서에 대한 설명 및 검색어도 사람이 직접 부여하여 데이터베이스를 구축하고, 이 데이터베이스를 토대로 사용자의 질의를 처리하는 검색엔진이다. 디렉토리 검색엔진에 의해 검색 서비스를 제공하는 대표적인 사이트로서 "kr.yahoo.com"을 들 수 있다. 디렉토리 검색엔진을 운용하는 웹사이트는 검색 인력 즉 웹 서퍼들이 문서를 수집하여 데이터베이스를 구축하기 때문에 정보의 질을 높게 유지할 수 있다는 장점이 있는 반면에 축적되는 정보의 양이 적거나 축적 속도가 느리다는 문제점이 있다. 빠른 속도로 대량의 정보를 축적하고자 하는 경우에는 많은 웹 서퍼를확보하고 유지해야 하며 인건비 부담이 높아진다는 문제점이 발생한다.
로봇 검색엔진이란 사람이 아닌 정보수집 로봇 프로그램이 웹문서의 수집 작업을 수행하고 각 웹문서의 메타 태그(meta tag)를 분석하여 이를 토대로 데이터베이스를 구축한 후 사용자의 질의를 처리하는 검색엔진이다. 정보수집 로봇 프로그램은 광범위한 웹사이트로부터 대량의 문서를 빠른 속도로 수집할 수 있기 때문에, 현재 거의 대부분의 검색 사이트들이 로봇 검색엔진을 운영하고 있다. 그렇지만, 로봇 프로그램의 알고리즘이 완벽하지 않고 이용자의 질의어에 대한 검색 대상물에 대해 별도로 필터링을 하지 않기 때문에, 검색 결과에 클라이언트의 의도한 바와 관련없는 불필요한 문서들이 많이 포함되어 검색결과 정보가 질적으로 떨어진다는 단점을 가진다.
특히, 종래의 검색사이트가 제공하는 검색결과 리스트에는 다수의 웹사이트들에 대한 명칭과 간단한 설명이 포함되는데, 각 웹사이트의 간단한 설명이 통상 한두 행으로 간략하게 되어 있기 때문에, 이용자가 자기가 찾고자 하는 정보를 구비한 웹사이트를 발견하게 되기까지 적지 않은 시간이 소요되고 있다. 즉, 이용자는 웹사이트 설명을 토대로 자신이 찾고자 하는 정보가 있을법한 사이트 또는 웹문서의 명칭을 클릭하여 해당 사이트에 콘텐츠 제공을 요구한 후, 만약 해당 사이트에 원하는 정보가 없는 경우에는 다시 검색결과 리스트 표시화면으로 복귀하여 다른 사이트를 방문하는 방식으로 시행착오를 반복해야만 한다. 따라서, 각 웹사이트가 제공하는 정보를 해당 사이트에 접속하지 않더라도 보다 정확하게 예측할 수 있게 해주는 표시 방법이 요구되고 있다.
아울러, 종래의 검색엔진이 제공하는 검색결과 표시화면에 표시되는 웹사이트 또는 웹문서의 설명은 각 웹사이트의 홈페이지(인덱스 페이지) 또는 특정 웹페이지에 대한 URL에 하이퍼링크되어 있기 때문에, 이용자가 각 사이트에 대해 그 개요 및 운영자 정보를 함께 파악하고자 하는 경우에는, 해당 사이트로 직접 이동한 후 수차례 하이퍼텍스트를 클릭해야 하는 불편함이 발생한다. 예를 들어 이용자가 다수의 회사에 대해 회사 정보 및 생산품목에 대한 콘텐츠를 함께 파악하고자 하는 경우 이용자는 각 웹문서에 대해 별도로 http요구를 전송하여 관련된 콘텐츠를 모두 받아보아야만 한다. 이러한 점은 검색결과 리스트에 표시되는 각 웹사이트들의 홍보 측면에서도 그 효율이 매우 낮다.
다른 한편으로, 검색사이트들은 이용자의 질의를 처리함에 있어서 막대한 트래픽 부하를 안게 되기 때문에 정보수집 로봇 프로그램을 별도의 서버에 적재하여 실행시키는 것이 일반적이다. 서버용으로 사용되는 컴퓨터는 일반적인 클라이언트용 PC에 비해 가격이 높기 때문에, 검색사이트를 구축하여 운영함에 있어서는 적지않은 비용이 발생하게 된다.
본 발명은 상술한 문제점을 해결하기 위한 것으로서, 저렴한 비용으로 구축할 수 있으며 사전에 축적된 웹페이지 정보를 제공함에 있어 해당 웹페이지 구성을 이미지 형태로 제공함으로써 해당 웹사이트를 굳이 방문하지 않고서도 웹페이지의 구성을 알 수 있도록 해서 이용자의 인터넷 검색 효율을 높일 수 있게 해주는 검색 시스템을 제공하는 것을 그 기술적 과제로 한다.
또한, 본 발명은 이와 같은 검색 시스템이 다수의 웹사이트로부터 웹문서 정보를 수집하는 정보 수집 방법을 제공하는 것을 다른 기술적 과제로 한다.
아울러, 본 발명은 이와 같은 검색 시스템에 있어서 이용자의 질의에 대한 검색 결과로서 복수의 웹문서 정보를 이미지 형태로 제공하는 검색 서비스 제공 방법을 제공하는 것을 또 다른 기술적 과제로 한다.
아울러, 본 발명은 이와 같은 검색 시스템에 있어서 서버에 연동된 정보수집 클라이언트 컴퓨터에 적재되어 실행되며 다수의 웹사이트로부터 웹문서 정보를 수집하는 캡쳐 로봇 프로그램을 제공하는 것을 또 다른 기술적 과제로 한다.
도 1은 본 발명의 검색 시스템의 네트웍 환경을 보여주는 도면.
도 2는 검색 클라이언트 컴퓨터의 디스플레이 장치에 표시되는 검색 결과 화면의 일 예를 보여주는 도면.
도 3은 검색 시스템의 소프트웨어 구성을 보다 구체적으로 보여주는 도면.
도 4a 내지 도 4c는 캡쳐 로봇 프로그램이 동작하는 동안 정보수집 클라이언트 컴퓨터의 디스플레이 장치에 표시되는 화면들의 예를 보여주는 도면.
도 5는 도 1 내지 도 3에 도시된 검색 시스템의 전체적인 동작 과정을 보여주는 흐름도.
도 6은 캡쳐 로봇 프로그램이 실행하는 이미지 캡쳐 및 압축 과정을 보여주는 흐름도.
도 7은 일반 검색 클라이언트의 요구에 따라 검색 서비스를 제공하는 과정을 보여주는 흐름도.
상기 기술적 과제를 달성하기 위한 본 발명의 검색 시스템은 적어도 하나의 서버와 상기 서버에 연동되어 동작하는 복수의 정보수집 클라이언트 컴퓨터를 포함한다. 정보수집 클라이언트 컴퓨터는 캡쳐 로봇 프로그램을 적재하고 실행한다. 정보수집 클라이언트 컴퓨터는 서버로부터 URL 데이터를 받아들이고, 해당 웹사이트에 접근하여 해당 웹사이트의 인덱스 페이지와 주 콘텐츠 페이지를 확보하고 이들 페이지들을 이미지 형태로 캡쳐한다. 상기 주 콘텐츠 페이지는 예컨대 해당 웹사이트 운영자의 제품정보 페이지가 될 수 있다. 정보수집 클라이언트는 캡쳐된 이미지 파일들을 그대로 또는 일정한 포맷으로 압축하여 서버에 제공한다. 서버는 이미지 파일들을 데이터베이스에 저장하고 이용자의 검색 클라이언트 컴퓨터에 해당 웹사이트 정보를 제공할 때 이미지 파일들을 함께 제공하여, 검색 클라이언트 컴퓨터 상에서 복수의 이미지들이 일정한 시간 주기로 번갈아 디스플레이 되도록하게 된다.
서버는 각 웹사이트로부터 대표자 인사말이나 여타의 홍보 데이터를 업로드할 수도 있다. 이러한 경우, 서버는 업로드된 웹문서를 이미지 형태로 캡쳐하여 데이터베이스에 저장하고, 이용자의 검색 클라이언트 컴퓨터에 해당 웹사이트 정보를 제공할 때 홍보 이미지 파일을 함께 제공하여, 검색 클라이언트 컴퓨터 상에서 홍보 이미지를 포함한 복수의 이미지들이 일정한 시간 주기로 번갈아 디스플레이 되도록 하게 된다.
상기 다른 기술적 과제를 달성하기 위한 본 발명의 정보 수집 방법은 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고, 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템에서 정보를 축적하기 위해 사용된다. 먼저, (a) 서버와, 상기 서버에 적어도 선택적으로 접속될 수 있는 정보검색 클라이언트 컴퓨터를 마련한다. (b) 그다음, 다수의 웹사이트 명칭들 및 이에 상응한 URL 데이터들을 확보하여 서버에 저장한다. 이와 같은 상태에서, (c) 서버가 정보검색 클라이언트 컴퓨터에 URL 데이터들 중 적어도 하나를 제공하도록 한다. (d) 정보검색 클라이언트 컴퓨터는 인터넷을 통해서 상기 URL 데이터에 관한 웹사이트에 소정의 웹페이지를 요구하여 수신하고, 수신된 웹페이지를 이미지 형태로 캡쳐하여 캡쳐된 제1 이미지를 소정 형식의 제1 이미지 파일로 압축변환한다. 압축변환된 제1 이미지 파일은 상기 서버에 전송되어 저장된다. 이때, 상기 (d)단계에서, 제1 이미지를 축소하여 제2 이미지를 생성하고 제2 이미지를 상기 소정 형식의 제2 이미지 파일로 압축변환하여 제1 이미지 파일과 함께 상기 서버에 저장할 수도 있다.
상기 또 다른 기술적 과제를 달성하기 위한 본 발명의 검색 서비스 제공 방법에 있어서는 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고, 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템에 의해 제공된다. 먼저, (a) 다수의 웹사이트 레코드를 소정의 저장 수단에 저장한다. 이때 각 레코드는, 웹사이트 명칭과, URL 데이터와, 상기 웹사이트가 제공하는 인덱스 페이지가 이미지 파일화된 것으로서 제1 크기를 갖는 제1 인덱스 이미지와, 상기 제1 인덱스 이미지가 축소된 제2 인덱스 이미지와, 상기 웹사이트가 제공하는 제품/서비스/콘텐츠 안내 페이지가 이미지 파일화된 것으로서 제1 크기를 갖는 제1 제품 이미지와, 제2 인덱스 이미지가 축소된 제2 제품 이미지를 포함한다. 이와 같은 상태에서, (b) 상기 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고, (c) 저장 수단으로부터 상기 질의어에 해당하는 레코드들을 검색하여, 검색된 레코드들의 웹사이트 명칭과, URL 데이터와, 제1 및 제2 인덱스 이미지와, 제1 및 제2 제품 이미지를 읽어들인다.
그 다음, (d) 상기 (c)단계에서 읽어들인 상기 검색된 레코드들의 웹사이트 명칭과, URL 데이터와, 제1 및 제2 인덱스 이미지와, 제1 및 제2 제품 이미지를 편집하여 상기 웹사이트 목록을 가공해서 상기 검색 클라이언트 컴퓨터에 제공하게 된다. 이때, 제1 인덱스 이미지 및 제1 제품 이미지를 포함한 복수의 이미지들이 동일 화면에서 일정 시간 간격으로 번갈아 표시되도록 하고, 상기 검색 클라이언트 컴퓨터의 이용자가 위치 지정 포인터를 상기 이미지들이 표시되는 위치에 가져다되는 경우 상기 제2 인덱스 이미지 및 상기 제2 제품 이미지를 포함한 복수의 이미지들이 상기 일정 시간 간격으로 번갈아 표시되도록 하며, 제2 인덱스 이미지 또는 제2 제품 이미지를 선택 실행하는 경우 선택된 이미지에 관한 웹페이지가 요구되어 호출되도록 상기 웹사이트 목록을 가공하게 된다.
상기 또 다른 기술적 과제를 달성하기 위한 본 발명의 캡쳐 로봇 프로그램은 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템 서버에 접속될 수 있는 정보수집용 클라이언트 컴퓨터에 적재되어 실행된다. 프로그램은 상기 서버로부터 적어도 하나의 URL 데이터를 받아들이는 기능; 인터넷을 통해서 상기 URL 데이터에 관한 웹사이트에 소정의 웹페이지를 요구하여 수신하는 기능; 수신된 웹페이지를 이미지 형태로 캡쳐하고 캡쳐된 이미지를 소정의 형식으로 압축변환하는 기능; 및 상기 압축변환된 이미지 데이터를 상기 서버에 제공하여, 상기 서버가 저장하도록 하게 하는 기능;을 구비한다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 보다 구체적으로 설명한다.
도 1은 본 발명의 검색 시스템의 네트웍 환경을 보여준다. 검색 시스템(10)은 인터넷 서버(12)와 상기 서버(12)에 랜(LAN)에 의해 접속되어 있는 복수의 정보수집 클라이언트 컴퓨터(14a - 14m)를 포함한다. 인터넷 서버(12)는 전용회선에 의해 인터넷에 접속되며, 이에 따라 인터넷을 통해서 다수의 외부 서버(90a - 90n) 및 검색 클라이언트 컴퓨터(100)에 접속될 수 있다.
서버(12)는 데이터베이스(도 1에는 미도시됨) 내에 다수의 웹사이트에 대한URL 데이터를 보유한다. 바람직한 실시예에 있어서, 상기 URL 데이터는 검색 시스템(10) 운영자가 영위하는 다른 사업 예컨대 온라인 박람회 사업을 통해 확보된다. 그렇지만 다른 실시예에 있어서는, URL 데이터가 도메인 등록기관으로부터 확보될 수도 있고 사전식으로 임의의 URL을 발생시켜 발생된 각 URL에 대해 순차적으로 http요구를 인터넷에 전송한 후 응답이 수신되는지 여부를 판단하여 축적해갈 수도 있다. URL 데이터의 확보는 그밖에도 다양한 방법으로 행해질 수도 있는데, 본 발명이 이러한 URL 데이터의 확보 방법에 대해 보호를 청구하는 것이 아니기 때문에 이에 대한 전면적인 설명은 생략한다.
본 발명에 있어서 검색 서비스를 제공하기 위한 정보는 서버(12)가 아닌 복수의 정보수집 클라이언트 컴퓨터(14a - 14m)에 의해 실질적으로 확보된다. 이를 위해, 각 정보수집 클라이언트 컴퓨터(14a - 14m)는 캡쳐 로봇 프로그램을 적재하고 실행한다. 정보수집 클라이언트 컴퓨터(14a - 14m)는 서버(12)로부터 URL 데이터를 받아들이고, 해당 URL을 가진 웹사이트의 서버(90a - 90n, 이하 "콘텐츠 제공 서버"라 칭함)에 접근하여 해당 웹사이트의 인덱스 페이지와 제품안내 페이지를 확보하고 이들 페이지들을 비트맵(BMP) 이미지 형태로 캡쳐한다. 정보수집 클라이언트 컴퓨터(14a - 14m)는 캡쳐된 이미지 파일들을 JPEG 포맷으로 압축해서 서버에 제공하여, 서버(12)가 JPEG 이미지 파일들을 데이터베이스에 저장하도록 하게 된다. 바람직한 실시예에 있어서, 서버(12)는 JPEG 이미지 파일을 저장함에 있어서 화면 전체 크기의 완전한 이미지 파일과 함께, 50% 및 25%로 축소된 이미지 파일을 저장한다. 이미지의 축소 작업은 서버(12)에 의해 이루어질 수도 있고 정보수집클라이언트 컴퓨터(14a - 14m)에 의해 이루어질 수도 있다.
수집된 정보가 데이터베이스에 저장된 상태에서, 서버(12)는 인터넷 정보 검색을 원하는 이용자의 검색 클라이언트 컴퓨터(100)로부터 검색 질의어를 받아들이고, 질의어에 상응한 웹사이트 정보를 데이터베이스에서 검색하고 검색된 결과를 검색 클라이언트 컴퓨터(100)에 제공한다. 검색 클라이언트 컴퓨터(100)에 제공되는 검색 결과 데이터는 질의어에 상응한 웹사이트의 목록과 각 웹사이트에 대한 간단한 설명과 축소된 이미지 파일들을 포함한다.
도 2는 검색 클라이언트 컴퓨터(100)의 디스플레이 장치에 표시되는 검색 결과 화면의 일 예를 보여준다. 도시된 바와 같이, 검색 결과 화면의 상단에는 검색 시스템의 로고가 표시되고 그 아랫쪽에는 검색 결과 개수에 대한 안내 데이터가 표시되며, 일정 개수의 검색 결과 데이터가 표시된다. 검색 결과 데이터는 검색된 각 웹사이트의 명칭과, 축소된 이미지와, 웹사이트에 대한 간단한 설명과, 도메인 네임을 포함한다. 이미지 표시부분에는 축소된 이미지 표시부분에는 해당 웹사이트의 인덱스 페이지와 제품/서비스 안내 페이지 그리고 홍보 페이지에 대한 25% 축소 이미지가 번갈아가며 표시된다. 상기 홍보 페이지는 해당 웹사이트의 대표자 인사말이나 여타의 홍보 데이터를 표시해주는 페이지로서, 후술하는 바와 같이 해당 웹사이트 운영자에 의해 업로드될 수 있다.
이용자가 이미지 표시부분에 마우스를 가져다 대면, 25%로 축소된 이미지들 대신에 50%로 축소된 이미지들이 번갈아가며 표시된다. 따라서, 이용자는 해당 웹사이트를 방문하지 않고서도 웹사이트의 대략적인 내용을 짐작할 수 있게 되어, 자신이 획득하고자 하는 콘텐츠와 관련이 없는 사이트에 굳이 접속할 필요가 없게 된다. 각 이미지와 도메인 네임에는 해당 웹페이지에 대한 URL이 하이퍼링크되어 있기 때문에, 이용자가 이들 중 어느 하나를 클릭하면 해당 URL에 대한 http요구가 전송되어 해당 웹페이지를 수신할 수 있게 된다. 이미지들이 번갈아가며 표시되는 기능은 검색 결과 표시 페이지에 포함된 자바스크립트에 의해 구현되며, 본 발명이 속하는 분야의 당업자가 용이하게 구현할 수 있기 때문에 이에 대한 구체적인 설명은 생략한다.
도 3은 검색 시스템(10)의 소프트웨어 구성을 보다 구체적으로 보여준다. 검색 시스템(10)에 있어서, 인터넷 서버(10) 및 정보수집 클라이언트 컴퓨터(14a - 14m)의 하드웨어 및 소프트웨어 플랫폼은 일반적인 인터넷 서버용 컴퓨터 및 PC와 각각 유사하므로 이에 대한 구체적인 설명은 생략하고 본 발명의 특징을 이루는 프로그램 중심으로 설명한다.
일 실시예에 있어서, 정보수집 클라이언트 컴퓨터(14a - 14m)에 적재되어 실행되는 캡쳐 로봇(30)은 한 개의 폼(Auto_capture.frm, 32)과, 4 개의 모듈 즉 BMPImage.bas(34), jkModule.bas(36), mIntelJPEGLibrary(38) 및 modWinlnet(40)과, 3 개의 클래스 모듈 즉 aDIBSection.cls(42), MyBitmap.cls(44) 및 Sjpg.cls(46)를 구비한다. 이와 같은 캡쳐 로봇 프로그램(30)은 전체적으로 볼 때, 웹 브라우저와, 이미지 캡쳐 프로그램과, 이미지 편집기와, 파일전송프로그램(FTP)의 기능을 조합하여 특유의 기능을 수행하는 것이라 할 수 있다.
폼 파일(Auto_capture.frm, 32)은 로봇 프로그램이 구동된 직후에 또는 부여된 태스크가 완료될 때마다 이미지를 캡쳐할 웹사이트에 대한 URL 데이터를 서버(10)에 요구하고 URL 데이터를 수신한다. 아울러, 폼 파일(Auto_capture.frm, 32)은 인터넷에 해당 URL에 대한 http요구를 전송하여 웹페이지를 수신한다. 이때, 서버(12)로부터 정보수집 클라이언트 컴퓨터(14a - 14m)에 제공되는 URL 데이터는 홈페이지에 대한 URL 데이터뿐이다. 폼 파일(Auto_capture.frm, 32)은 홈페이지 내에서 하이퍼링크 정보를 나타내는 참조 태그(<A ref=...>, </A>)를 분석하고, 사전에 지정되고 우선순위가 부여된 특징어들(예컨대, 제품, 제품 소개, 상품, 상품 소개, 서비스, 서비스 소개 등)을 추출하고 이들을 분석하여 해당 웹사이트가 취급하는 제품/상품/콘텐츠 소개 페이지에 대한 URL을 추출한다. 폼 파일(Auto_capture.frm, 32)은 추출된 URL에 대한 http요구를 전송하여 제품/상품/콘텐츠 소개 페이지를 수신한다. 참조 태그 분석에서 제품/상품/콘텐츠 소개 페이지에 대한 URL을 검출하지 못한 경우, 폼 파일(Auto_capture.frm, 32)은 해당 웹사이트 내에 있는 모든 웹문서들에 대해 메타 태그(<meta ...>) 또는 타이틀 태그(<TITLE> ,,, </TITLE>) 태그 내에서 상기 특징어들을 검출하여 제품/상품/콘텐츠 소개 페이지를 결정한다. 또한, 폼 파일(Auto_capture.frm, 32)은 압축된 JEPG 이미지 파일들을 이미지 파일을 서버(12)에 전송한다.
4 개의 모듈들 중 BMPImage.bas 모듈(34)은 화면 전체 크기의 완전한 이미지로부터 50% 및 25%로 축소된 이미지를 생성한다. jkModule.bas 모듈(36)은 캡쳐 로봇 프로그램을 초기화한다. mIntelJPEGLibrary 모듈(38)은 BMP 파일을 JPEG 파일로 압축하기 위한 라이브러리를 제공한다. modWinlnet 모듈(40)은 서버(12)로의 이미지 파일 전송을 파일전송 프로토콜(FTP)을 설정한다.
클래스 모듈들 중 aDIBSection.cls 클래스 모듈(42)은 캡쳐된 완전한 크기의 이미지 및 축소된 이미지들을 BMP 형식으로부터 JPEG 형식으로 변환한다. 여기서, JPEG 이미지, 특히 완전한 크기의 이미지는 후술하는 바와 같이 다른 사업자에게 이미지만을 사업용으로 제공할 수 있도록 일정한 규칙에 의해 그 파일명칭이 정해진다. 바람직한 실시예에 있어서는, 변환되는 웹페이지의 URL 중 점(.)을 느낌표(!)로 변환한 후 뒤에 'jpg' 확장자를 붙이게 된다. 예컨대, 변환되는 웹페이지의 URL이 "www.dounet.com"이라면, 변환된 JPEG 파일의 파일명은 "www!dounet!com.jpg)가 된다. 한편, MyBitmap.cls 클래스 모듈(44)은 수신된 웹페이지를 BMP 이미지 형태로 캡쳐한다. Sjpg.cls 클래스 모듈(46)은 각 웹사이트에 대한 이미지 캡쳐 작업을 수행하기 직전에 JPEG 이미지를 초기화한다.
도 4a 내지 도 4c는 캡쳐 로봇 프로그램(30)이 동작하는 동안 정보수집 클라이언트 컴퓨터(14a - 14m)의 디스플레이 장치에 표시되는 화면들의 예를 보여준다. 도시된 바와 같이, 화면의 우측 상단에는 '이미지없는 데이터 수' 즉 서버(12)의 데이터베이스(86)에 등록된 URL 중 이미지가 아직 확보되지 않은 웹사이트 수가 표시되고, 그 아랫쪽에는 로봇의 작업 진척도가 표시된다. 작업 진척도 표시에 있어서는, 현재 진행중인 작업의 종류(예컨대, '감지중' 즉 서버로부터 URL 데이터를 받는 단계, 'URL 서치' 즉 http요구를 전송하고 응답을 수신하는 단계, '캡쳐중', '전송중' 등)와 함께 해당 작업의 진행 완료율이 표시된다. 화면 좌측 상단에는검출된 웹페이지가 표시되고, 작업 시작 전과 캡쳐 및 압축이 완료된 후에는 사업자의 로고가 표시된다. 한편, 화면 하단에는 전체 URL 데이터 중 이미지가 이미 확보된 웹사이트의 숫자와 비율이 표시된다.
한편, 다시 도 3을 참조하면, 인터넷 서버(50)는 캡쳐 작업 관리 프로그램(50)과, 검색 서비스 프로그램(70)과, 이미지 서비스 프로그램(80)과, 데이터베이스(86)와, 하드디스크(88)에 저장되는 이미지 파일들을 구비한다.
캡쳐 작업 관리 프로그램(50)은 복수의 프로그램 유닛들, 예컨대 action_image_check.asp(52), image_put_04.asp(54), inputNum_outputUrl.asp(56), no_action_image_check_04.asp(58), no_action_image_check_test_04.asp(60)를 구비한다. 바람직한 실시예에 있어서, 이들 프로그램 유닛들은 확장자에서 알 수 있듯이 웹페이지 내에 서버 스크립트가 삽입되어 있는 액티브 서버 페이지(ASP) 형태로 구현된다. action_image_check.asp(52)는 이미지가 없는 데이터를 캡쳐 로봇(30)에 제공하여 이 데이터가 도 4a의 화면 우측 상단에 있는 '이미지없는 데이터 수' 부분에 표시되도록 한다. image_put_04.asp(54)는 현재 진행중인 작업의 진척도를 캡쳐 로봇(30)에 제공하여 이 데이터가 작업 진척도 표시부분에 표시되도록 한다. inputNum_outputUrl.asp(56)는 캡쳐 로봇(30)의 요구에 따라 이미지가 아직 확보되지 않은 웹사이트의 URL 데이터를 제공한다. no_action_image_check_04.asp(58)는 캡쳐 로봇(30)으로부터 수신된 이미지 파일들을 하드디스크(88)에 저장함과 아울러, 해당 이미지 파일의 명칭 등의 정보를 데이터베이스(86)의 해당 레코드에 저장한다. no_action_image_check_test_04.asp(60)는 전체 URL 데이터 중 이미지가 이미 확보된 웹사이트의 숫자와 비율을 캡쳐 로봇(30)에 제공하여 이들 정보가 화면 하단에 표시되도록 한다.
한편, 검색 서비스 프로그램(70)은 검색 질의 모듈(72) 및 응답 모듈(74)을 포함하며, 검색 클라이언트 컴퓨터(100)의 요구에 응답하여 검색 서비스를 정보를 제공한다. 검색 질의 모듈(72)은 검색 클라이언트 컴퓨터(100)로부터 질의어를 받아들이고 상기 질의어에 해당하는 레코드들의 제목, 설명 및 도메인 네임 데이터를 데이터베이스에서 읽어들이고 하드디스크(88)로부터 이미지 파일들을 독출한다. 응답 모듈(74)은 제목, 설명 및 도메인 네임 데이터와 이미지 파일들을 포함하는 웹페이지를 동적으로 생성하여 생성된 페이지를 검색 클라이언트 컴퓨터(100)에 제공한다. 바람직한 실시예에 있어서는, 상기 검색 질의 모듈(72) 및 응답 모듈(74) 역시 웹페이지 내에 서버 스크립트가 삽입되어 있는 액티브 서버 페이지(ASP) 형태로 구현된다.
이미지 서비스 프로그램(80)은 요구 접수 모듈(82) 및 제공 모듈(84)을 포함한다. 바람직한 실시예에 있어서, 요구 접수 모듈(82)은 검색 시스템(10) 운영자에 대한 비용지불을 전제로 하여 다른 사업자가 다수의 이미지 파일들의 다운로드 신청을 할 수 있게 해준다. 제공 모듈(84)은 신청된 이미지 파일들을 하드디스크(88)로부터 독출하여 신청자에게 다운로드한다.
한편, 데이터베이스(86)는 URL 데이터를 축적하고, 각 URL에 대한 제목 및 설명과, 이미지 파일 저장 디렉토리명 및 파일명 등의 데이터를 저장한다. 각 URL에 대한 제목 및 설명 데이터는 수작업으로 입력될 수도 있고, 해당 웹페이지의 메타 테그 분석을 통해 이루어질 수도 있다. 다른 한편으로, 이러한 데이터를 다른 검색 사이트로부터 제공받을 수도 있다. 위에서 기술한 바와 같이 이미지 파일들 JPEG 형식으로 되어 있으며, 서버(12)의 하드 디스크(88)에 저장된다. 그렇지만, 이미지 파일의 개수 및 볼륨이 큰 경우에는 별도의 이미지 서버에 저장될 수도 있다.
다른 한편으로, 도 3에는 도시되지 않았지만, 서버(12)는 업로드 모듈을 더 포함할 수 있다. 업로드 모듈은 데이터베이스(86)에 등록된 각 URL 소유자측이 자신의 홍보 자료를 등록 또는 업로드할 수 있게 해준다. 즉, 각 URL 소유자측은 시스템에 회원가입을 하고 비용을 지불한 후, 업로드 모듈이 제공하는 화면에 예컨대 대표자 인사말이나 투자 정보 또는 그밖의 홍보 데이터를 입력할 수 있다. 이러한 경우, 입력된 데이터를 포함하는 웹페이지가 생성된 후 이미지로 변환되어 저장되어서, 추후에 해당 웹사이트 정보가 검색 결과 화면에 표시될 때, 홈페이지 이미지 및 제품/서비스 안내 이미지와 함께 홍보 이미지가 번갈아가면서 표시될 수 있다. 이러한 데이터 등록 대신에 각 URL 소유자측은 자신이 제작한 웹페이지를 업로드하거나 등록할 수도 있다.
도 5는 도 1 내지 도 3에 도시된 검색 시스템의 전체적인 동작 과정을 보여준다. 먼저 다수의 웹사이트에 대한 URL을 확보하여 데이터베이스(86)에 저장한다(제100단계). 위에서 기술한 바와 같이 URL은 다양한 방법으로 확보할 수 있다. URL이 확보된 상태에서, 정보수집 클라이언트 컴퓨터들(14a - 14m) 전체 또는 일부에서 캡쳐 로봇 프로그램(30)을 실행시킨다(제102단계). 바람직한 구현예에서, 프로그램 실행은 해당 컴퓨터 사용자가 컴퓨터를 사용한 작업을 수행하지 않는 야간시간이나 주말 등 휴일에 이루어진다. 그렇지만, 평일 주말 시간에도 정보수집이 이루어질 수도 있음은 물론이다. 실행이 시작되면 캡쳐 로봇 프로그램(30)은 서버에서 지정하는 URL을 가진 웹사이트에 접근하여 인덱스 페이지 등의 웹페이지를 이미지 형태로 캡쳐하고 축소하며 압축한다(제104단계). 그리고 프로그램(30)은 압축된 이미지 파일들을 FTP로 서버(12)에 전송한다(제106단계). 서버(12)에 전송된 이미지 파일은 서버(12)의 하드디스크(88)에 저장되는데, 이때 파일명칭 및 저장 디렉도리 명칭이 데이터베이스(86)의 해당 레코드에 저장된다.
제102단계 내지 제106단계는 캡쳐 로봇 프로그램(30)이 실행되는 동안 지속적으로 반복된다. 한편, 제100단계의 URL 확보 작업 역시 일회적으로 끝나는 것이 아니며 URL은 지속적으로 보충될 수 있다. 다른 한편으로, 서버(12)는 이미지가 확보되고 회원가입이 되어 있는 웹사이트 운영자로부터 홍보페이지를 업로드하거나 홍보데이터를 입력할 수 있게 해준다. 업로드된 홍보페이지 또는 입력된 데이터를 토로로 작성된 웹페이지는 다시 이미지로 캡쳐되고 압축되어 데이터베이스에 함께 저장된다. 웹페이지에 대한 이미지 파일이 충분히 확보된 상태에서 검색 시스템(10)은 일반 검색 클라이언트 컴퓨터(100)에 대해 검색 서비스를 제공하게 된다(제108단계).
도 6은 캡쳐 로봇 프로그램(30)이 실행하는 이미지 캡쳐 및 압축 과정 즉, 도 5의 제104단계를 구체적으로 보여준다. 캡쳐 로봇 프로그램(30)의 실행이 시작되면, 캡쳐 로봇 프로그램(30)은 이미지를 확보할 URL을 감지한다(제110단계 내지제118단계). 이를 보다 구체적으로 설명하면 다음과 같다. 캡쳐 로봇 프로그램(30)가 서버(12)에 이미지가 확보되지 않은 레코드 수를 요구하면(제110단계), 서버(12)는 이에 응답하여 정보수집 클라이언트 컴퓨터(14a - 14m)에게 이미지가 확보되지 않은 레코드 수를 전송한다(제112단계). 레코드 수를 수신한 캡쳐 로봇 프로그램(30)은 레코드 수가 사전에 정해진 기준치를 초과하는지를 판단한다(제114단계). 만약 레코드 수가 기준치보다 작다면, 캡쳐 로봇 프로그램(30)의 실행이 종료된다. 그렇지만 레코드 수가 기준치보다 크다면, 캡쳐 로봇 프로그램(30)은 이미지가 확보되지 않은 레코드의 URL을 제공할 것을 서버(12)에 요구하게 되고(제116단계), 서버(12)는 이에 응답하여 해당 클라이언트(14a - 14m)에게 이미지가 확보되지 않은 URL을 제공한다(제118단계). 이때 URL은 한 개만 제공될 수도 있고 여러 개, 예컨대 10개 이상이 한꺼번에 제공될 수도 있다.
URL이 감지된 상태에서, 캡쳐 로봇 프로그램(30)은 각 URL에 대해서 해당 웹사이트에 인덱스 페이지 즉 홈페이지 전송을 요구하고 이를 수신한다(제120단계). 아울러, 인덱스 페이지에 있는 태그를 분석하여 해당 웹사이트 운영자가 취급하는 제품/서비스/콘텐츠 안내 페이지의 URL을 추출하고 해당 웹페이지를 수신한다. 각 웹페이지를 수신할 때마다, 캡쳐 로봇 프로그램(30)은 웹페이지를 BMP 이미지 형태로 캡쳐하고 이를 50% 및/또는 25% 크기로 축소한다(제122단계 및 제124단계). 원래 크기의 이미지와 축소된 이미지들은 JPEG 형식으로 압축변환되고 URL에 상응한 이름이 부여된다(제126단계). 변환된 이미지 파일들은 한 개씩 또는 여러개가 한꺼번에 서버(12)의 데이터베이스(86)에 전송되어 저장된다.
도 7은 일반 검색 클라이언트의 요구에 따라 검색 서비스를 제공하는 즉, 도 5의 제108단계를 구체적으로 보여준다. 캡쳐 로봇에 의해 데이터베이스에 등록된 웹사이트들의 전체 또는 일부의 이미지가 확보된 상태에서, 서버(12)는 임의의 검색 클라이언트 컴퓨터(100)로부터 질의어를 받아들인다(제130단계). 질의어를 받아들인 서버(12)는 데이터베이스(86)로부터 질의어에 해당하는 레코드의 웹사이트 데이터들을 검색하여 읽어들이고 하드디스크(88)로부터 이미지 파일들을 읽어들인다(제132단계). 그 다음에는 데이터베이스(86) 및 하드디스크에서 읽혀진 데이터들 및 파일들을 사용하여 검색결과 페이지를 동적으로 생성한다(제134단계). 여기서, 검색결과 페이지에는 다수의 웹사이트 명칭이 목록 형태로 표시되는데, 각 웹사이트 명칭 아랫쪽에는 축소된 인덱스 페이지 이미지, 제품/서비스/콘텐츠 안내 페이지 이미지 및 홍보 이미지가 한자리에서 번갈아가면서 표시되도록 배치되고, 그 옆에는 웹사이트 설명과 URL이 표시되도록 배치된다.
제132단계 및 제134단계는 시스템이 제공하는 검색화면에서 질의어 입력창 옆에 배치된 "검색실행" 버튼에 하이퍼링크된 검색실행 ASP 파일 내에 있는 서버 스크립트 프로그램(즉, 도 3의 응답 프로그램(74))에 의해 동적으로 이루어진다. 한편, 축소된 이미지 파일들이 번갈아 표시되는 기능은 검색결과 페이지 내에 삽입되는 클라이언트 스크립트 예컨대 javascript에 의해 구현된다. 아울러, 검색결과 페이지에서 각 축소된 이미지파일에는 이미지 표시 위치에 마우스를 가져다되는 경우 확대된 이미지들이 번갈아가며 표시되도록 하는 스크립트와 확대된 이미지들이 삽입되며, 확대된 이미지들에는 해당 웹사이트의 실제 페이지로 이동하기 위한 하이퍼링크 텍스트가 삽입된다. 생성된 검색결과 페이지는 검색 클라이언트(100)에 전송된다(제136단계).
본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 예컨대 이상의 설명에서는 캡쳐 로봇이 인덱스 페이지와 제품/서비스 정보를 캡쳐하는 것을 중심으로 기술하였지만, 제품이나 서비스를 제공하는 기업의 웹사이트 이외에 일반적인 홈페이지에 대해서도 본 발명이 적용될 수 있고 적용되어야 하는 것은 자명한 것이다. 아울러 캡쳐 로봇이 기본적(default)으로 캡쳐하는 웹페이지에는 뉴스와 같은 여타의 카테고리가 포함될 수도 있다. 아울러, 바람직한 실시예에 관한 도 1에는 하나의 서버(12)만이 도시되어 있지만, 실제로 이러한 서버는 물리적으로 여러 대의 컴퓨터를 사용하여 구현될 수 있으며, 특히 검색 서비스를 제공하기 위한 웹서버와 웹페이지 이미지 파일을 확보하기 위한 이미지 서버를 별도로 마련할 수도 있다.
그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
상술한 바와 같이, 본 발명은 사전에 축적된 웹페이지 정보를 제공함에 있어해당 웹페이지 구성을 이미지 형태로 제공하기 때문에, 이용자가 해당 웹사이트를 굳이 방문하지 않고서도 웹페이지의 구성을 알 수 있게 된다. 따라서 인터넷 검색을 위한 시간을 절감하고 인터넷 검색 효율을 증대시킬 수 있게 해준다. 특히, 각 웹사이트에 대해 인덱스 페이지와 제품/서비스 안내 페이지 그리고 여타의 홍보 페이지를 번갈아가면서 표시해주기 때문에, 이용자는 해당 웹사이트의 전체적인 구성을 쉽게 짐작할 수 있어서 각 사이트의 방문 여부를 정확하고 쉽게 결정할 수 있다.
아울러, 본 발명에 따르면 캡쳐 로봇이 서버가 아닌 PC급 클라이언트에서 이루어지기 때문에 서버의 부하에 영향을 크게 주지 않으면서 안정적으로 이미지를 캡쳐한다. 따라서, 시스템 구축을 위한 비용이 저렴하다는 장점이 있다.

Claims (11)

  1. 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템에 있어서,
    각각이 웹사이트 명칭 및 URL 데이터를 포함하는 다수의 웹사이트 레코드를 보유하는 서버; 및
    상기 서버에 적어도 선택적으로 접속될 수 있으며, 상기 서버로부터 상기 URL 데이터들 중 적어도 하나를 받아들이고 받아들인 URL 데이터를 사용하여 상기 URL 데이터에 관한 웹사이트로부터 소정의 웹페이지를 수신하고, 수신된 웹페이지를 이미지 형태로 캡쳐하여 캡쳐된 이미지 데이터를 상기 서버에 제공하는 정보검색 클라이언트 컴퓨터;
    를 구비하며, 상기 서버는 상기 검색 클라이언트 컴퓨터로부터 상기 질의어를 수신하여 상기 웹사이트 목록을 제공할 때, 상기 목록상의 각 웹사이트 정보에 상기 이미지 데이터를 추가적으로 함께 제공하는 검색 시스템.
  2. 제1항에 있어서, 상기 소정의 웹페이지가 상기 웹사이트의 인덱스 페이지를 포함하는 검색 시스템.
  3. 제2항에 있어서, 상기 소정의 웹페이지가 상기 웹사이트 운영자가 취급하는 제품/서비스/콘텐츠 안내 페이지를 더 포함하는 검색 시스템.
  4. 제2항 또는 제3항에 있어서, 상기 서버가 상기 웹사이트의 홍보 페이지에 관한 이미지를 추가적으로 저장하고 있으며 유지하며, 상기 검색 클라이언트 컴퓨터로부터 상기 질의어를 수신하여 상기 웹사이트 목록을 제공할 때, 상기 홍보 페이지 이미지를 추가적으로 제공하는 검색 시스템.
  5. 제2항 또는 제3항에 있어서, 상기 정보검색 클라이언트 컴퓨터가 소정의 웹페이지를 비트맵 이미지로 캡쳐한 후 소정의 형식으로 압축변환하여, 압축변환된 이미지 파일을 상기 서버에 제공하는 검색 시스템.
  6. 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템에 있어서,
    (a) 서버와, 상기 서버에 적어도 선택적으로 접속될 수 있는 정보검색 클라이언트 컴퓨터를 제공하는 단계;
    (b) 상기 서버에 다수의 웹사이트 명칭들 및 이에 상응한 URL 데이터들을 저장하는 단계;
    (c) 상기 서버가 상기 정보검색 클라이언트 컴퓨터에 상기 URL 데이터들 중 적어도 하나를 제공하도록 하는 단계;
    (d) 상기 정보검색 클라이언트 컴퓨터가 인터넷을 통해서 상기 URL 데이터에 관한 웹사이트에 소정의 웹페이지를 요구하여 수신하고, 수신된 웹페이지를 이미지형태로 캡쳐하여, 캡쳐된 제1 이미지를 소정 형식의 제1 이미지 파일로 압축변환하는 단계; 및
    (e) 압축변환된 상기 제1 이미지 파일을 상기 서버에 저장하는 단계;
    를 포함하는 검색 시스템에 있어서의 정보 수집 방법.
  7. 제6항에 있어서, 상기 (d)단계가
    상기 제1 이미지를 축소하여 제2 이미지를 생성하고 상기 제2 이미지를 상기 소정 형식의 제2 이미지 파일로 압축변환하는 단계;
    를 더 포함하며, 상기 (e)단계에서는 상기 제2 이미지 파일을 상기 제1 이미지 파일과 함께 상기 서버에 저장하는 정보 수집 방법.
  8. 제6항 또는 제7항에 있어서, 상기 소정의 웹페이지가 상기 웹사이트의 인덱스 페이지 및 제품/서비스/콘텐츠 안내 페이지를 포함하는 정보 수집 방법.
  9. 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고 상기 질의어와 관련된 웹사이트 목록을 제공하는 검색 시스템에 있어서,
    (a) 각각이 웹사이트 명칭과, URL 데이터와, 상기 웹사이트가 제공하는 인덱스 페이지가 이미지 파일화된 것으로서 제1 크기를 갖는 제1 인덱스 이미지와, 상기 제1 인덱스 이미지가 축소된 제2 인덱스 이미지와, 상기 웹사이트가 제공하는 제품/서비스/콘텐츠 안내 페이지가 이미지 파일화된 것으로서 제1 크기를 갖는 제1제품 이미지와, 제2 인덱스 이미지가 축소된 제2 제품 이미지를 포함하는 다수의 웹사이트 레코드를 소정의 저장 수단에 저장하는 단계;
    (b) 상기 검색 클라이언트 컴퓨터로부터 질의어를 받아들이는 단계;
    (c) 상기 저장 수단으로부터 상기 질의어에 해당하는 레코드들을 검색하여, 검색된 레코드들의 웹사이트 명칭과, URL 데이터와, 제1 및 제2 인덱스 이미지와, 제1 및 제2 제품 이미지를 읽어들이는 단계; 및
    (d) 상기 (c)단계에서 읽어들인 상기 검색된 레코드들의 웹사이트 명칭과, URL 데이터와, 제1 및 제2 인덱스 이미지와, 제1 및 제2 제품 이미지를 편집하여 상기 웹사이트 목록을 가공해서 상기 검색 클라이언트 컴퓨터에 제공하되, 상기 제1 인덱스 이미지 및 상기 제1 제품 이미지를 포함한 복수의 이미지들이 동일 화면에서 일정 시간 간격으로 번갈아 표시되도록 하고 상기 검색 클라이언트 컴퓨터의 이용자가 위치 지정 포인터를 상기 이미지들이 표시되는 위치에 가져다되는 경우 상기 제2 인덱스 이미지 및 상기 제2 제품 이미지를 포함한 복수의 이미지들이 상기 일정 시간 간격으로 번갈아 표시되도록 하며, 상기 제2 인덱스 이미지 또는 상기 제2 제품 이미지를 선택 실행하는 경우 선택된 이미지에 관한 웹페이지가 요구되어 호출되도록 상기 웹사이트 목록을 가공하여 제공하는 단계;
    를 포함하는 검색 서비스 제공 방법.
  10. 제9항에 있어서, 상기 (a)단계가
    상기 웹사이트의 홍보 페이지에 관한 것으로서 상기 제1 크기를 갖는 제1 홍보 이미지와 상기 제1 홍보 이미지가 축소된 제2 홍보 이미지를 추가적으로 상기 저장 수단에 저장하는 단계;
    를 더 포함하는 검색 서비스 제공 방법.
  11. 외부의 검색 클라이언트 컴퓨터로부터 질의어를 받아들이고 상기 질의어와 관련된 웹사이트 목록을 제공하며 서버와 클라이언트 컴퓨터를 구비하는 검색 시스템에 있어서, 상기 클라이언트 컴퓨터 상에서 실행되며,
    상기 서버로부터 적어도 하나의 URL 데이터를 받아들이는 기능;
    인터넷을 통해서 상기 URL 데이터에 관한 웹사이트에 소정의 웹페이지를 요구하여 수신하는 기능;
    수신된 웹페이지를 이미지 형태로 캡쳐하고 캡쳐된 이미지를 소정의 형식으로 압축변환하는 기능; 및
    상기 압축변환된 이미지 데이터를 상기 서버에 제공하여 상기 서버가 저장하도록 하게 하는 기능;
    을 구비하는 캡쳐 로봇 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.
KR1020010023276A 2001-04-30 2001-04-30 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램 KR20020083701A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020010023276A KR20020083701A (ko) 2001-04-30 2001-04-30 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020010023276A KR20020083701A (ko) 2001-04-30 2001-04-30 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램

Publications (1)

Publication Number Publication Date
KR20020083701A true KR20020083701A (ko) 2002-11-04

Family

ID=27703034

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020010023276A KR20020083701A (ko) 2001-04-30 2001-04-30 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램

Country Status (1)

Country Link
KR (1) KR20020083701A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101244357B1 (ko) * 2011-08-11 2013-03-18 한국과학기술정보연구원 웹 자원 아카이빙을 위한 장치 및 방법
KR101452765B1 (ko) * 2008-05-16 2014-10-21 엘지전자 주식회사 근접 터치를 이용한 이동통신 단말기 및 그 정보 입력방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101452765B1 (ko) * 2008-05-16 2014-10-21 엘지전자 주식회사 근접 터치를 이용한 이동통신 단말기 및 그 정보 입력방법
KR101244357B1 (ko) * 2011-08-11 2013-03-18 한국과학기술정보연구원 웹 자원 아카이빙을 위한 장치 및 방법

Similar Documents

Publication Publication Date Title
CN1317661C (zh) 通过提供万维网文件布局图像简化因特网搜索的系统和方法
Spiliopoulou et al. Improving the effectiveness of a web site with web usage mining
CA2365705C (en) A system for collecting specific information from several sources of unstructured digitized data
US6247029B1 (en) Web browser form enhancements
KR100427502B1 (ko) 인터넷 기술을 이용한 네트워크상의 정보수집 시스템,정보수집 방법 및 정보수집 방법을 기록한 기록매체
US20020002569A1 (en) Systems, methods and computer program products for associating dynamically generated web page content with web site visitors
US20090094327A1 (en) Method and apparatus for mapping a site on a wide area network
CN1494680A (zh) 收集高速缓存web内容的多样化web服务器活动数据
CN101233510A (zh) 处理并基于无线网络将搜索结果发送到移动设备
EP0978186A1 (en) Destination website acces and information gathering system
JP4283466B2 (ja) リンク関係に基づく文書整理方法
US20050188057A1 (en) Contents service system and method using image, and computer readable storage medium stored therein computer executable instructions to implement contents service method
US7069292B2 (en) Automatic display method and apparatus for update information, and medium storing program for the method
JP2011034399A (ja) Webページの関連性抽出方法、装置、及びプログラム
CN111858255A (zh) 基于屏幕截图的用户行为采集方法及相关设备
JP5000801B2 (ja) インターネット補助システム
US20090313558A1 (en) Semantic Image Collection Visualization
KR100845355B1 (ko) 이미지 선호도 측정 어플리케이션, 시스템 및 그 동작 방법
KR20020083701A (ko) 분산형 인터넷 검색 시스템, 정보 수집 방법, 검색 서비스제공 방법 및 이를 구현하기 위한 캡쳐 로봇 프로그램
JP2009295104A (ja) ウェブサイト検索装置、画像情報収集サーバ、及びウェブサイト検索方法
JP3664923B2 (ja) 情報源観測装置および情報源観測方法、ならびに情報源観測プログラムを記録したコンピュータ読み取り可能な記録媒体
Haruechaiyasak et al. A data mining framework for building a web-page recommender system
JP3725088B2 (ja) 知識情報収集システムおよび知識情報収集方法
KR100188690B1 (ko) 인터네트에서의 데이타 베이스 운용 방법
JP4715031B2 (ja) 構造化文書変換システム及び構造化文書変換プログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application