KR100391391B1

KR100391391B1 - 저작권 침해 방지를 위한 정보추출 에이전트 시스템 및그의 정보제공 방법

Info

Publication number: KR100391391B1
Application number: KR10-2000-0032789A
Authority: KR
Inventors: 정석태; 이창학; 최중민; 양재영
Original assignee: (주) 제이.에스.씨.앤.아이
Priority date: 2000-06-14
Filing date: 2000-06-14
Publication date: 2003-07-12
Also published as: KR20000058562A; US20010054090A1

Abstract

본 발명은 정보검색을 요청하는 사용자에게 정보를 제공하는 정보추출 에이전트 시스템 및 그의 정보제공 방법에 관한 것이다.

본 발명에 따르면, 사용자가 래퍼 서버에 접속하여 정보검색 요청을 하면, 래퍼 서버에서는 래퍼가 저장된 데이터베이스로부터 요청을 한 사용자에 대한 래퍼를 추출한다. 다음으로, 요청을 한 사용자에 대한 래퍼, 웹로봇 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 사용자 웹 브라우저에 전송한다. 그러면 사용자 웹브라우저상에서, 사용자가 원하는 정보를 웹로봇을 이용하여 정보제공 웹사이트들로부터 수집하게된다. 그런 다음 사용자 웹브라우저상에서, 래퍼와 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 이용하여, 수집된 정보를 가공된 형태의 결과물로 만들어 사용자에게 제공한다.

따라서, 본 발명의 정보추출 에이전트 시스템에서는 래퍼 서버가 직접적인 정보를 제공하는 것이 아니라 단지 정보 추출 규칙만을 제공하고 실제 정보 제공자의 정보를 사용자가 다루도록 함으로써, 타사의 웹사이트의 디지털 콘텐츠를 상업적 목적을 가진 래퍼 서버가 무단으로 도용함으로써 생기는 저작권 침해의 문제를 극복하는 효과가 있다.

Description

저작권 침해 방지를 위한 정보추출 에이전트 시스템 및 그의 정보제공 방법{INFORMATION EXTRACTION AGENT SYSTEM FOR PREVENTING COPYRIGHT INFRINGEMENT AND METHOD FOR PROVIDING INFORMATION THEREOF}

본 발명은 정보검색을 요청하는 사용자에게 정보를 제공하는 정보추출 에이전트 시스템 및 그의 정보제공 방법에 관한 것이고, 더욱 상세하게는 정보검색을 요청하는 사용자에게 저작권의 침해 없이 타사의 수많은 웹사이트에 있는 디지털 콘텐츠를 제공하는 정보추출 에이전트 시스템 및 그의 정보제공 방법에 관한 것이다.

인터넷 상에서 사용자(client)가 원하는 정보가 존재하는 사이트를 찾기 위해서는, 예를 들어 www.yahoo.com 이나 www.lycos.com 과 같은 검색 엔진을 이용하게된다. 그러나, 이러한 검색사이트들은 사용자가 검색 전에 입력한 키워드를 담고 있는 사이트의 리스트와 그와의 연결 링크만을 제공하는 것이지, 사용자가 원하는 구체적인 정보에 대한 자료를 제공하는 것은 아니다.

이러한 일반적인 검색 엔진들과는 달리 사용자가 원하는 구체적인 정보를 담은 콘텐츠(contents)를 수집하고 이를 가공된 형태의 검색결과로서 사용자에게 제공하는 검색 엔진이 있는데 이를 소위 정보추출 에이전트 시스템이라고 한다.

정보추출 에이전트 시스템에서는 사용자가 원하는 정보를 보다 효율적이고 정확하게 사용자에게 제공하기 위하여 래퍼 (wrapper) 라는 것을 사용한다. 래퍼는 정보추출을 원하는 정보 소스로부터 정보들을 인식하기 위한 일종의 규칙으로 정의될 수 있다. 래퍼는 래퍼 데이터베이스에 저장되며, 또한 이 규칙 (즉, 래퍼) 을 기반으로 정보를 각 정보 소스로부터 추출하는 래퍼 해석 소프트웨어에 의해 해석된다. 래퍼는 자동 또는 수동으로 만들어지며, 래퍼를 만드는 사람에 의해 그 성능의 차이가 나타나게된다. 즉, 관리자나 래퍼 설계자는 정보 추출을 해야할 정보 소스에 직접 방문하여 어떤 정보를 어디서부터 얼마만큼을 가져와야 하는지를 래퍼 해석 소프트웨어가 이해할 수 있는 수준의 규칙 (즉, 래퍼) 으로 작성해야한다.

이러한 래퍼에 대한 보다 구체적인 설명은 Nicholas Kushmerick 이 1997년에 발표하고 "Ph.D.Dissertation, Department of Computer Science Engineering, Univ. of Washington" 에 게재된 "Wrapper Introduction for information Extraction" 에 기재되어있고, 이하 종래의 정보추출 에이전트 시스템을 설명하면서 보다 상세히 그 기능과 작용을 설명할 것이다.

도 1 은 이러한 종래의 정보추출 에이전트 시스템의 구성을 개념적으로 나타낸 블록도이다.

종래의 정보추출 에이전트 시스템은 사용자 웹브라우저 (10), 정보제공자 (information provider) (20) 및 사용자가 원하는 정보를 정보제공자 (20) 로부터 사용자에게 제공하는 것을 제어하는 자사 서버인 래퍼 (wrapper) 서버 (30) 로 구성된다. 여기서, 정보제공자 (20) 란 사용자가 원하는 정보를 담고 있을 수 있는 수많은 타사의 웹사이트들을 의미하는 것이다. 또한 래퍼 서버 (30) 는 래퍼 생성 수단 (40), 래퍼 데이터베이스 (50), 래퍼 해석 수단 (60), 결과물 생성 수단 (70) 및 웹로봇 (80) 을 포함한다.

이하 종래의 정보추출 에이전트 시스템의 정보 검색 및 제공 과정을 살펴보겠다. 우선, 사용자가 사용자 웹브라우저 (10) 를 사용하여 래퍼 서버 (30) 의 사이트 (자사 사이트) 에 접속하여 원하는 정보를 얻기 위하여 검색 조건 등을 입력하고, 이는 래퍼 서버 (30) 로 전송된다. 래퍼 서버 (30) 내의 래퍼 해석 수단 (60) 은 사용자가 입력한 검색 조건을 바탕으로 관련 정보를 제공하는 정보제공자 (20) 의 리스트를 알아내고, 해당되는 정보제공자 (20) 에 대한 래퍼는 래퍼 데이터베이스 (50) 으로부터 추출된다. 래퍼 데이터베이스 (50) 내에서 래퍼는 하나의 정보 제공자에 하나씩 생성된 형태로 존재한다.

그 후, 웹로봇 (80) 을 이용하여 정보제공자 (20) 로부터 원하는 디지털 콘텐츠를 수집하고, 래퍼 해석 수단 (60) 을 통하여 이 규칙 (즉, 래퍼) 을 기반으로결과파일을 생성하고, 이 결과파일은 가공된 형태로 결과물 생성 수단 (70) 에 의해 사용자 웹브라우저 (10) 상에 나타나게 된다. 래퍼 생성 수단 (40) 은 래퍼 서버 관리자가 새로운 정보제공자 (20) 에 대한 래퍼를 갱신할때 사용된다.

이러한 구성요소와 연결관계로 된 종래의 정보추출 에이전트 시스템에서는, 모든 계산(computation)은 래퍼 서버 (즉, 자사 서버) 내에서 이루어지고, 수많은 다른 정보제공자 (즉, 타사의 웹사이트) 에 있는 자료 (digital contents) 를 래퍼 서버가 직접 가져와서 사용자에 제공하는 것이 된다. 또한 사용자는 래퍼 서버내에서 가공된 자료를 보게 되므로, 그 정보가 타사의 웹사이트에서 제공된 것이라는 것을 깨닫지 못하며, 래퍼 서버를 해당 정보의 정보제공자로 착각할 수도 있다.

인터넷상의 웹사이트에서 제공되는 자료에는 저작권(copyright)이 명시되어 있는 것이 많다. 이러한 인터넷상의 자료에 대한 저작권은, 예를 들어 DOI (digital object identifier) 와 같은 고유 식별번호로서 알 수 있다. DOI에는 디지털 콘텐츠의 소유, 제공자를 비롯한 데이터에 관한 각종 정보가 입력되어 있어, 저작자 보호와 콘텐츠의 유통경로를 자동 추적, 불법복제를 막을 수 있게 해준다.

그런데, 종래의 정보추출 에이전트 시스템에서는 이러한 디지털 콘텐츠를 타사의 정보제공자가 제공한다는 명시 없이, 정보를 가공하여 사용자에게 제공함으로써 타사의 디지털 콘텐츠에 대한 저작권을 침해하게 된다. 사용자가 직접 타사의 정보제공자의 웹사이트의 자료를 검색하여 내용을 열어보는 것은 저작권의 침해가 아니나, 위의 경우는 상업적인 목적을 가진 래퍼 서버가 저작권이 있는 타사의 정보제공자의 디지털 콘텐츠를 무단으로 사용자에게 제공함으로써 저작권의 침해가 되는 것이다. 이와 같이 웹로봇을 이용하여 무단으로 타사의 자료를 가져와 사용자에게 제공하는 것은 현재에도 저작권과 관련하여 그 문제성이 대두되어 소송등 분쟁이 발생하고 있고, 향후 인터넷의 발전과 디지털 콘텐츠에 대한 저작권에 대한 인식의 향상에 따라 심각한 문제를 불러일으킬 것이다.

상기한 바와 같은 저작권 침해의 문제점을 해결하기 위하여, 본 발명은 래퍼 서버가 각각의 정보 제공처에서 실제 정보를 추출하는 것이 아니라, 사용자에게 정보추출 규칙인 래퍼, 래퍼 해석 수단, 결과물 생성 수단 및 웹로봇을 제공하여 사용자가 직접 각각의 정보 제공자의 자료를 다루도록 하는 정보추출 에이전트 시스템 및 그의 정보제공 방법을 제공한다. 즉, 종래 기술과 같이 계산의 중심이 래퍼 서버가 되는 것이 아니라 사용자 개인이 됨으로써 인터넷상의 디지털 콘텐츠에 대한 저작권의 침해 문제를 극복한다.

또한, 본 발명에서는 비록 사용자가 능동적인 개체가 되어 계산이 사용자 웹브라우저 상에서 이루어지나, 사용자는 이러한 사실을 인식할 필요가 없으며 부수적인 작업이 필요 없고, 자동으로 정보의 검색과 가공된 결과파일로서의 사용자가 원하는 자료가 사용자 웹브라우저상에 나타나게 해준다.

도 1 은 종래의 정보추출 에이전트 시스템의 구성을 개념적으로 나타낸 블록도이다.

도 2 는 본 발명에 따르는 래퍼 서버의 하드웨어적인 구성을 나타낸 블록도이다.

도 3 은 본 발명에 따르는 정보추출 에이전트 시스템의 구성을 개념적으로 나타낸 블록도이다.

도 4 는 본 발명의 제 1 실시예로서의 정보추출 에이전트 시스템의 정보제공 과정을 나타낸 흐름도이다.

도 5 내지 도 9 는 본 발명의 제 1 실시예에 따르는 정보추출 에이전트 시스템의 정보제공 과정의 일 예로서 사용자의 웹브라우저상에 나타나는 출력화면을 도시한 도이다.

도 10 은 본 발명의 제 2 실시예로서의 정보추출 에이전트 시스템의 정보제공 과정을 나타낸 흐름도이다.

*도면의 주요 부분에 대한 부호의 설명*

200 : 사용자 웹브라우저

210 : 정보 제공자

220 : 래퍼 서버

222 : 래퍼 관리 수단

224 : 래퍼 생성 수단

226 : 래퍼 데이터베이스

230 : 래퍼

232 : 래퍼 해석 수단

236 : 웹로봇

238 : 결과물 생성 수단

상기한 목적을 달성하기 위하여 본 발명은, 사용자 웹 브라우저, 하나 이상의 정보제공 웹사이트들 및 사용자가 원하는 정보를 상기 정보제공 웹사이트들로부터 사용자에게 제공하는 것을 제어하는 래퍼 (wrapper) 서버가 구비된 인터넷 환경에서, 인터넷상의 정보를 사용자에게 제공하는 방법에 있어서,

(a) 사용자의 정보검색 요청을 받아 래퍼가 저장된 데이터베이스로부터 상기 요청을 한 사용자에 대한 래퍼를 추출하는 단계;

(b) 상기 요청을 한 사용자에 대한 래퍼, 웹로봇 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 상기 사용자 웹 브라우저에 전송하는 단계;

(c) 상기 사용자 웹브라우저상에서, 상기 사용자가 원하는 정보를 상기 웹로봇을 이용하여 상기 정보제공 웹사이트들로부터 수집하는 단계; 및

(d) 상기 사용자 웹브라우저상에서, 상기 래퍼와 상기 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 이용하여, 수집된 정보를 가공된 형태의 결과물로 만들어 상기 사용자에게 제공하는 단계를 포함하는 인터넷 정보 제공 방법을 제공한다.

또한 본 발명은, 상기 (a) 단계에서 사용자가 검색을 원하는 정보제공 웹사이트를 입력하였고 상기 사용자에 대한 래퍼에 상기 원하는 정보제공 웹사이트에 대한 정보가 존재하지 않는 경우에,

상기 정보가 존재하지 않는 정보제공 웹사이트에 대하여 래퍼를 갱신하는 단계; 및

상기 갱신된 래퍼를 상기 래퍼 데이터 베이스에 저장하는 단계를 더 포함하는 인터넷 정보 제공 방법을 제공한다.

이하 첨부된 도면을 참조로 하여 본 발명의 바람직한 실시예에 대하여 상세하게 설명한다.

본 발명에 따르는 래퍼 서버는 CPU (100), CPU (100) 와 다른 구성 요소들 사이의 통신을 가능케 하는 버스 (106) 를 포함한다. 버스 (106) 는 주기억장치 (RAM) (102) 및 저장장치 (104) 를 CPU (100) 에 연결시킨다. 또한 래퍼 서버는 키보드 (110), 마우스 (112), 카드 판독 장치 (114) 및 기타의 인터페이스 장치 (116) 과 같은 하나 이상의 인터페이스 장치들을 버스 (106) 를 통하여 CPU (100) 와 연결시키는 사용자 인터페이스 어댑터 (108) 를 포함한다. 또한 래퍼 서버는 모니터 (120) 및 프린터 (122) 와 같은 하나 이상의 디스플레이 장치들을 버스 (106) 를 통하여 CPU (100) 와 연결시키는 디스플레이 어댑터 (118) 를 포함한다.

이하에서 설명되는 본 발명에 따르는 정보추출 에이전트 시스템의 기능을 제공하는 프로그램들은 상기 저장장치 (104) 에 저장되고 상기 CPU (100) 에 의해 수행된다. 본 발명에 따르는 프로그램들이 저장된 상기 저장장치 (104) 는 디스켓, 하드디스크 또는 CD롬등 여러 가지 형태일 수 있다.

본 발명에 따르는 정보추출 에이전트 시스템은 사용자 웹브라우저 (200), 정보제공자 (210) 및 사용자가 원하는 정보를 정보제공자 (210) 로부터 사용자에게제공하는 것을 제어하는 자사 서버인 래퍼 서버 (220) 로 구성된다. 종래기술과 마찬가지로 여기서의 정보제공자 (210) 또한 사용자가 원하는 정보를 담고있을 수 있는 수많은 타사의 웹사이트들이다.

본 발명의 래퍼 서버 (220) 는 또한 래퍼 데이터베이스 (226), 검색과정 및 정보제공과정을 제어하는 래퍼 관리 수단 (222) 및 새로운 래퍼의 생성이나 래퍼의 갱신이 이루어지는 래퍼 생성 수단 (224) 을 포함한다. 종래기술과의 차이점은 래퍼 해석 수단 (232), 웹로봇 (236) 및 결과물 생성 수단 (234) 이 사용자의 정보 요청 후에 사용자의 웹브라우저상에 제공된다는 점이다. 이에 대해서는 이하의 흐름도에서 더욱 상세하게 설명될 것이다.

도 3 에 도시된 래퍼 관리 수단 (222), 래퍼 생성 수단 (224), 래퍼 (230), 래퍼 해석 수단 (232), 결과물 생성 수단 (234), 및 웹로봇 (236) 등은 도 2 의 저장장치 (104) 내에 저장되는 프로그램이고, 도 3 에 도시한 것과 같은 연결관계는 이해를 돕기 위한 것이며, 상기 프로그램들은 어떠한 형태로도 서로 결합될 수 있다는 것이 이해되어야만 할 것이다.

도 4 는 본 발명의 제 1 의 실시예로서의 정보추출 에이전트 시스템의 정보제공 과정을 나타낸 흐름도이다.

먼저 사용자는 사용자 웹브라우저 (100) 을 통하여 정보추출 에이전트 시스템의 래퍼 서버 (220) 에 접속하여 원하는 정보에 대하여 검색 조건 등을 입력하는 방식으로 정보 검색 요청을 한다. (S300)

다음 래퍼 관리 수단 (222) 에 의해, 정보 검색 요청을 한 사용자에 대한 래퍼가 래퍼 데이터 베이스 (226) 에서 추출된다. (S310) 종래의 기술에서는 상술한 바와 같이 래퍼가 정보제공자 하나에 대하여 하나씩 생성되었다. 그러나, 본 발명에서는 래퍼가 사용자 하나에 대하여 하나씩 생성된다. 즉, 자사 사이트에 사용자가 등록을 하면, 일단 검색 카테고리 (예를 들어 부동산, 전자제품 및 화장품 등등) 마다 래퍼 서버에서 기본적으로 설정된 초기값의 래퍼를 등록한 사용자를 위해 만든다. 그 후, 사용자가 여러번 검색을 거듭함에 따라, 사용자의 성향이나 기호, 수준에 대한 차별화된 정보를 담은 발전된 형태의 래퍼가 계속 갱신되는 것이다. 그러면 이렇게 갱신된 특정 사용자에 대한 래퍼(즉, 규칙)는 정보검색 요청시 사용자가 입력한 검색조건과 더불어 보다 효율적인 정보의 추출 및 제공과정을 이루게 하는 것이다.

이렇게 그 특정 사용자에 대한 래퍼가 추출되면, 사용자의 정보 검색 요청에 대한 결과로서 XML 기반의 그 특정 사용자의 래퍼 (230), 자바 애플릿 형태의 래퍼 해석 수단 (232), 결과물 생성 수단 (234) 및 웹로봇 (236) 이 래퍼 서버 (220) 로부터 사용자 웹브라우저 (200) 로 전송된다. (S320) 여기서 래퍼 해석 수단 (234), 결과물 생성 수단 (234) 및 웹로봇 (236) 은 자바 언어를 사용하여 작성된 프로그램이다. 자바 언어는 웹에서 이동 코드를 지원하는데 이것을 애플릿 (Applet) 이라 한다. 따라서, 이 애플릿을 사용하면 상기 프로그램들이 래퍼 서버 (220) 으로부터 사용자 웹브라우저 (200) 로 전송될 수 있는 이동성을 갖게 되는 것이다.

상기 전송이 이루어진 후 사용자 웹브라우저 (200) 에서, 사용자가 원하는종류의 정보를 웹로봇 (236) 을 이용하여 정보제공자 (210) 로부터 실시간으로 수집하게 된다. (S330) 여기에서 웹로봇 (236) 에 의하여 수집되는 정보는 웹 문서의 전체 페이지의 형태이다. 그 후 사용자 웹브라우저 (200) 에서, 래퍼 (230), 래퍼 해석 수단 (232) 및 결과물 생성 수단 (234) 에 의해 수집된 정보를 규칙에 맞게 해석하고 가공된 형태의 결과물로서 사용자의 웹브라우저 (200) 상에 출력한다. (S340) 여기에서 래퍼 (230) 및 래퍼 해석 수단 (232) 은 웹로봇 (236) 에 의하여 수집된 웹 문서의 전체 페이지 형태의 정보를 사용자에 필요한 일부분의 정보만을 추출하는 기능을 한다. 이상과 같은 과정으로 본 발명에 따르는 정보추출 에이전트 시스템에 의한 정보제공 과정은 종료하게 된다.

상기의 과정에서 주목할 점은, 정보제공자 (210) 들로부터 디지털 콘텐츠들을 수집하여 제공하는 과정이 래퍼 서버 (220) 가 아닌 사용자 웹브라우저 (200) 상에서 이루어진다는 것이다. 본 발명의 정보추출 에이전트 시스템에서는 래퍼 서버 (220) 가 직접적인 정보를 제공하는 것이 아니라 단지 정보 추출 규칙 (래퍼) 만을 제공하기 때문에 실제 정보 제공자 (타사의 웹사이트) 의 정보를 래퍼 서버 (220) 가 직접 다루지 않는다. 따라서, 타사의 웹사이트의 디지털 콘텐츠를 상업적 목적을 가진 정보추출 에이전트 시스템 서버 (즉, 래퍼 서버) 가 무단으로 도용함으로써 생기는 저작권 침해의 문제가 생기지 않는 것이다.

이하, 본 발명의 제 1 실시예에 따르는 정보추출 에이전트 시스템의 정보제공 과정이 실제로 사용자의 웹브라우저상에서 어떻게 나타나는지를 부동산 매물 정보에 대한 검색을 예로 들어 설명하겠다.

도 5 는, 사용자가 래퍼 서버 (즉, 자사 사이트) 에 접속하여 여러 검색 카테고리 중 부동산 검색을 위하여 "Find a Home" 을 선택하였을 때 사용자의 웹브라우저 상에 나타나는 화면이다. 이 화면에서 사용자는 지도, 도시 및 주, Zip 코드 및 MLS 번호 등의 검색할 수 있는 조건 등을 입력하게 된다.

도 4 의 화면에서 하나의 State 를 선택하게되면, 예를 들어 CA (캘리포니아주) 를 선택했다고 하면 도 6 과 같이 캘리포니아주의 지도가 사용자의 웹브라우저 상에 나타나게 된다. 도 6 의 화면에서 만약 샌디에고라는 도시를 선택하면 도면의 하단과 같이 이 도시의 여러 지역들이 나타나고 이중에서 사용자가 윈하는 지역들을 선택한 후에 검색 (search) 을 요청한다.

그러면, 도 7 과 같이 가격, 집의 형태 및 침실의 수등과 같은 일반적인 선택 가능한 조건과 수영장 또는 해안등과 같은 부수적인 선택 가능한 조건들을 선택 입력할 수있는 화면이 사용자의 웹브라우저 상에 나타나고 사용자는 조건을 입력하게 된다.

상기 도 5 내지 도 7 까지가 사용자가 정보검색 요청에서 검색 조건을 입력하는 단계이다. 이러한 입력 후에 상술한 바와 같은 래퍼의 추출, 래퍼, 래퍼 해석 수단, 결과물 생성 수단 및 웹로봇의 전송, 웹로봇의 정보 수집 등등이 이루어지는 것이다.

이러한 과정을 거친 후, 상기 도 5 내지 도 7 에서 선택 입력한 조건에 맞는 집들의 리스트가 도 8 과 같이 제공된다. 도 8 에서의 리스트 형태는 수많은 타사 사이트들의 정보를 가공된 형태의 결과물로서 나타내는 것이 된다. 이 하나 하나의 정보가 디지털 콘텐츠이고, 각각의 디지털 콘텐츠마다 저작권 (copyright) 이 있으므로, 만약 이러한 디지털 콘텐츠를 정보추출 에이전트 업체가 자사의 래퍼 서버를 경유하여 직접 타사 사이트로부터 가져와 사용자에게 제공한다면 저작권을 침해하는 것이 되는 것이다. 그러나, 본 발명에서는 타사 사이트의 디지털 콘텐츠를 정보추출 에이전트 업체가 자사의 래퍼 서버를 경유함이 없이 사용자가 직접 가져오게 함으로써 저작권의 침해가 발생되지 않는 것이다.

상기 도 8 의 화면에서 상세정보 (More) 를 선택하면 도 9 와 같이 선택한 집에 대한 상세한 정보가 나타나게 되고, 이 화면은 타사의 웹사이트의 화면과 동일한 형태의 화면이 된다.

상기와 같은 본 발명의 제 1 실시예의 정보제공 과정과 달리, 사용자가 정보검색 요청을 할 때에 검색 조건 이외에 검색을 원하는 웹사이트를 선택하게 하는 기능을 제공하는 정보추출 에이전트 시스템이 있다. 이에 대해서 본 발명의 제 2 실시예로서 이하에 설명하겠다.

사용자는 래퍼 서버 (220) 에 접속하여, 상술한 검색 조건 이외에 자신이 검색하기를 원하는 웹사이트를 선택하여 입력한다. (S400)

본 발명의 제 1 실시예에서는 사용자가 검색을 원하는 웹사이트에 대해 입력을 하지 않았기 때문에, 래퍼 서버 관리자가 정해 놓은 웹사이트에 대해서만 사용자에 대한 래퍼가 존재하였다. 그러나, 본 발명의 제 2 실시예에서는 사용자가 웹사이트를 입력하기 때문에, 해당 사용자의 래퍼에 입력한 웹사이트에 대한 정보가 존재하지 않을 수도 있다. 따라서, 사용자가 입력한 웹사이트에 대한 정보가 해당 사용자의 래퍼에 존재하는지를 판단하는 단계 (S410) 가 필요하다.

상기 단계 (S410) 에서, 만약 사용자가 입력한 웹사이트에 대한 정보가 해당 사용자의 래퍼에 존재한다면, 별도의 래퍼의 갱신은 필요 없어지고, 본 발명의 제 1 실시예와 동일한 단계들 (S420, S430, S440 및 S450) 을 지나 검색 및 정보제공 과정이 종료된다.

그러나, 만약 단계 (S410) 에서 사용자가 입력한 웹사이트에 대한 정보가 해당 사용자의 래퍼에 존재하지 않는다면, 그 정보가 존재하지 않는 새로운 웹사이트에 대해 해당 사용자의 래퍼를 갱신해야 한다. (S412) 다음 갱신된 래퍼를 래퍼 데이터베이스에 저장하고 (S414), 단계들 (S420, S430, S440 및 S450) 을 지나 검색 및 정보제공 과정이 종료된다.

본 발명은 상기의 실시예를 참조하여 특별히 도시되고 기술되었지만, 이는 예시를 위하여 사용된 것이며 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 첨부된 청구범위에서 정의된 것처럼 발명의 정신 및 범위를 벗어남이 없이 다양한 수정을 할 수 있다.

Claims

사용자 웹 브라우저, 하나 이상의 정보제공 웹사이트들, 및 사용자가 원하는 정보를 상기 정보제공 웹사이트들로부터 사용자에게 제공하는 것을 제어하는 래퍼 (wrapper) 서버가 구비된 정보추출 에이전트 시스템에서, 인터넷상의 정보를 사용자에게 제공하는 방법에 있어서,

(a) 사용자의 정보검색 요청을 받아 래퍼가 저장된 데이터베이스로부터 상기 요청을 한 사용자에 대한 래퍼를 추출하는 단계;

(b) 상기 요청을 한 사용자에 대한 래퍼, 웹로봇, 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 상기 사용자 웹 브라우저에 전송하는 단계;

(c) 상기 사용자 웹브라우저 상에서, 상기 사용자가 원하는 정보를 상기 웹로봇을 이용하여 상기 정보제공 웹사이트들로부터 수집하는 단계; 및

(d) 상기 사용자 웹브라우저 상에서, 상기 래퍼와 상기 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 이용하여, 수집된 정보를 가공된 형태의 결과물로 만들어 상기 사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 인터넷 정보 제공 방법.
제 1 항에 있어서,

상기 (a) 단계에서 사용자가 검색을 원하는 정보제공 웹사이트를 입력하였고 상기 사용자에 대한 래퍼에 상기 원하는 정보제공 웹사이트에 대한 정보가 존재하지 않는 경우에,

상기 (a) 단계는,

상기 정보가 존재하지 않는 정보제공 웹사이트에 대하여 래퍼를 갱신하는 단계; 및

상기 갱신된 래퍼를 상기 래퍼 데이터 베이스에 저장하는 단계를 더 포함하는 것을 특징으로 하는 인터넷 정보 제공 방법.
제 1 항 또는 제 2 항에 있어서,

상기 사용자에게 제공되는 정보는 디지털 콘텐츠의 형태인 것을 특징으로 하는 인터넷 정보 제공 방법.
제 1 항 또는 제 2 항에 있어서,

상기 웹로봇 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단은 자바 애플릿의 형태의 프로그램인 것을 특징으로 하는 인터넷 정보 제공 방법.
저장장치, 및

상기 저장장치에 연결된 프로세서를 구비하는 래퍼 서버를 포함하여, 인터넷 상에서 사용자가 원하는 정보를 검색하여 제공해주는 정보추출 에이전트 시스템에 있어서,

상기 저장장치는,

(a) 사용자의 정보검색 요청을 받아 래퍼가 저장된 데이터베이스로부터 상기 요청을 한 사용자에 대한 래퍼를 추출하게 하는 수단;

(b) 상기 요청을 한 사용자에 대한 래퍼, 웹로봇 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 상기 사용자 웹 브라우저에 전송하게 하는 수단;

(c) 상기 사용자 웹브라우저 상에서, 상기 사용자가 원하는 정보를 상기 웹로봇을 이용하여 상기 정보제공 웹사이트들로부터 수집하게 하는 수단; 및

(d) 상기 사용자 웹브라우저 상에서, 상기 래퍼와 상기 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단을 이용하여, 수집된 정보를 가공된 형태의 결과물로 만들어 상기 사용자에게 제공하게 하는 수단을 저장하는 것을 특징으로 하는 정보추출 에이전트 시스템.
제 5 항에 있어서,

사용자가 정보검색 요청을 할 때 검색을 원하는 정보제공 웹사이트를 입력하였고, 상기 사용자에 대한 래퍼에 상기 원하는 정보제공 웹사이트에 대한 정보가 존재하지 않는 경우에는,

상기 저장장치는,

상기 정보가 존재하지 않는 정보제공 웹사이트에 대하여 래퍼를 갱신하게 하는 수단; 및

상기 갱신된 래퍼를 상기 래퍼 데이터 베이스에 저장하게 하는 수단을 더 저장하는 것을 특징으로 하는 정보추출 에이전트 시스템.
제 5 항 또는 제 6 항에 있어서,

상기 사용자에게 제공되는 정보는 디지털 콘텐츠의 형태인 것을 특징으로 하는 정보추출 에이전트 시스템.
제 5 항 또는 제 6 항에 있어서,

상기 웹로봇 및 래퍼를 해석할 수 있고 결과물을 출력할 수 있는 수단은 자바 애플릿의 형태의 프로그램인 것을 특징으로 하는 정보추출 에이전트 시스템.