KR20020084435A - 인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 - Google Patents
인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 Download PDFInfo
- Publication number
- KR20020084435A KR20020084435A KR1020010023693A KR20010023693A KR20020084435A KR 20020084435 A KR20020084435 A KR 20020084435A KR 1020010023693 A KR1020010023693 A KR 1020010023693A KR 20010023693 A KR20010023693 A KR 20010023693A KR 20020084435 A KR20020084435 A KR 20020084435A
- Authority
- KR
- South Korea
- Prior art keywords
- information
- selection
- procedure
- user
- internet
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 98
- 238000004590 computer program Methods 0.000 title description 6
- 230000008569 process Effects 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 8
- 230000008859 change Effects 0.000 claims description 6
- 239000000284 extract Substances 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Transfer Between Computers (AREA)
Abstract
본 발명은 인터넷 정보 자동 수집 방법과 이 방법을 수행할 수 있는 프로그램을 기록한 기록매체에 관한 것이다.
본 발명은 각 사용자의 컴퓨터에서 독자적으로 수행되는 것이며, 웹 브라우저상에 나타난 웹 페이지의 특정 부분이 선택되면 선택부분에 관한 정보를 선택정보 파일에 기록하는 제1 절차; 선택정보 파일의 각 선택정보가 지시하는 인터넷 사이트에 주기적으로 자동 접근하여 해당 부분의 내용을 수집하는 제2 절차; 제2 절차에서 수집된 내용 중 이전의 내용과 다른 변경된 내용을 추출하여 분류하고 가공하는 제3 절차; 및 가공된 정보를 사용자가 알 수 있도록 처리하는 제4 절차를 포함하도록 구성하여 바람직하게 실시할 수 있다.
본 발명을 사용하면, 타 사업자의 도움없이 독립적으로 다양한 정보를 신속하게 수집할 수 있다. 이에 따라 정보의 활용이 원활해지며, 보다 신속하고 정확한 의사결정이 가능해질 수 있다. 특히 사용자 인증의 자동처리 및 자바로 처리된 컨텐츠를 수집할 수 있어, 수집정보에 대한 사용자의 신뢰성을 높일 수 있으며, 고급정보의 제공이 가능하여 정보이용의 효율성을 획기적으로 개선할 수 있다.
Description
본 발명은 인터넷 정보 자동 수집 방법 및 그 방법을 수행하기 위한 프로그램을 기록한 기록매체에 관한 것으로서, 특히 각 컴퓨터 시스템에서 독립적으로 수행하되, 사용자들이 관심있는 정보분야를 인터넷 사이트의 이용 도중 직접 지정할 수 있도록 하고, 사용자가 지정한 정보를 해당 인터넷 사이트에 자동으로 접속해서 검색하여 새로운 내용으로 갱신된 내용을 사용자에게 제공하는 방법 및 이 방법을 수행하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것이다.
현재 인터넷은 일상생활의 일부분으로서 사용되고 있으며, 각 인터넷 사이트를 통해 제공되는 정보의 양은 인터넷이 정보의 바다라고 불리울만큼 다양하고 광범위하다. 또한 인터넷은 시간과 공간의 제약없이 접근할 수 있는 장점으로 인하여 새로운 정보의 배포가 매우 신속하게 일어나므로, 많은 사람들이 인터넷을 통해 원하는 정보를 얻고 있다. 그러나, 정보의 양이 많은만큼 가치없는 정보나 중복되는정보가 적지않아 원하는 정보만을 얻는 것이 용이하지 않은 것도 사실이다.
이러한 문제점을 해결하기 위하여 맞춤정보를 제공하는 서비스가 제공되고 있다. 종래의 맞춤정보 서비스에서는 각 사용자들이 해당 서비스를 제공하는 인터넷 사이트에 접속하여 자신이 원하는 정보의 유형(예: 증권,부동산 등)을 설정해야 하며, 서비스 사업자는 관련 정보를 수집한 후 이메일(e-mail) 등의 수단을 통해 해당 사용자에게 전해주고 있다.
그러나, 종래의 맞춤정보 서비스는 유료인 경우도 적지않아 사용자들에게 경제적인 부담을 안겨줄 수 있고, 사용자는 자신이 원하는 정보의 종류를 한정지을 수 있을 뿐이며, 정보의 검색은 서비스 사업자측에서 임의적으로 수행한다. 그러므로, 사용자가 꼭 알고자하는 정보가 서비스 정보에 포함되지 않을 확율이 적지 않다. 예로서, 특정 사용자가 A라는 증권정보사이트에 B라는 기고자가 올리는 정보를 신뢰한다고 할 때, 서비스 사업자의 수집 대상에는 B가 올린 정보가 포함되지 않을 수 있다.
또한, 인터넷을 항해하는 도중 마음에 드는 정보를 제공하는 사이트 혹은 이 사이트의 특정 부분을 발견하였다고 해도 이를 종래의 맞춤정보 서비스에 부합시키기는 용이하지 않다. 만일 개인이 이 사이트를 찾기 쉽도록 처리했다고 하여도(예: 인터넷 익스플로러의 즐겨찾기 기능), 이 정보를 얻기 위해서는 항상 해당 사이트에 접속해야 하며, 해당 정보가 신규정보로 변했는지도 신속히 파악하기가 매우 어렵다.
한편, 사용자 인증을 요구하는 사이트의 경우에는 여러가지 인증방식이 사용되고 있고 개발자에 따라 다양하게 처리되어 있다. 특히, 일부 특수 목적으로 제작된 로봇의 접근을 막기 위해 더욱 다양한 방법과 기술로 인증 처리를 복잡하게 만들므로, 사용자 대신 자동으로 로그인하여 정보를 수집하는 것이 용이하지 않다.
이러한 경우 일반적으로 로봇이 접근하기 위해서는 각종 인증방식에 대한 분석과 해당사이트의 인증부분을 분석하여 개발자가 직접 코딩하는 방법 외에는 없다. 그러나 전 세계의 무수한 인증 사이트를 일일이 처리한다는 것은 불가능한 일이고 설사 수많은 사이트를 분석하여 처리하더라도 해당 사이트의 인증방식에 조금만 변경이 생겨도 다시 코딩작업을 해야 하였다. 이에 따라 각 인터넷 사이트에서 사용자들이 원하는 정보를 신속하고 정확하게 검색하는 것이 어려웠다.
특히, 현대사회에서 정보의 종류는 매우 다양하고 각 개인의 개성은 더욱 강해지고 있어 포괄적인 정보보다는 개인이나 집단에 특성화된 정보를 필요로 하고 있으며, 신속한 정보의 수집이 필요한 분야가 늘어나고 있는데, 기존의 인터넷 사용법이나 맞춤정보 서비스는 위에서 설명한 바와 같은 여러 문제점들로 인하여 이러한 필요성을 만족시키지 못하는 문제점이 있었다.
이에 본 발명은 상기와 같은 문제점을 해결하기 위하여 고안된 것으로서, 각 컴퓨터 시스템에서 독립적으로 수행하되, 사용자들이 관심있는 정보분야를 인터넷사이트의 이용 도중 직접 지정할 수 있도록 하고, 사용자가 지정한 정보를 해당 인터넷 사이트에 자동으로 접속해서 검색한 후, 새로운 내용으로 갱신된 내용을 사용자에게 제공하는 방법을 제공하는데 그 목적이 있다.
상기와 같은 목적을 달성하기 위하여, 본 발명에 따른 인터넷 정보 자동 수집 방법은, 웹 브라우저상에 나타난 웹 페이지의 특정 부분이 선택되면 상기 선택된 부분에 관한 정보(선택정보)를 선택정보 파일에 기록하는 제1 절차; 상기 선택정보 파일의 각 선택정보가 지시하는 인터넷 사이트에 주기적으로 자동 접근하여 해당 부분의 내용을 수집하는 제2 절차; 상기 제2 절차에서 수집된 내용 중 이전의 내용과 다른 변경된 내용을 추출하여 분류하고 가공하는 제3 절차; 및 상기 가공된 정보를 사용자가 알 수 있도록 처리하는 제4 절차를 포함하여 구성되는 것을 특징으로 한다.
상기 제1 절차 내지 제4 절차 중 하나 이상의 절차는 웹 브라우저와 일체로 동작하도록 구성된 프로그램에서 수행하도록 구성하여 더욱 바람직하게 실시할 수 있다.
상기 제 1 절차는 상기 웹 브라우저 화면의 일정 부분에 선택용 버튼을 디스플레이하는 단계를 구비하여, 상기 제1 절차에서의 선택은 상기 선택용 버튼이 클릭되었을 때 현재의 웹 페이지 자체를 선택한 것으로 처리하되, 상기 선택용 버튼이 클릭되었을 때 상기 웹 페이지의 특정 부분이 마우스에 의해 드래그되어 있으면, 해당 웹 페이지 중 드래그되어 있는 부분만을 선택한 것으로 처리하도록 구성하는 것이 바람직하다.
여기서, 상기 웹 페이지 자체를 선택한 것으로 처리한 경우에는 상기 선택된 웹 페이지를 분석하여 주 정보가 되는 리스트 및 본문을 추출한 후 이를 상기 선택정보로서 저장하도록 구성하여 바람직하게 실시할 수 있다.
상기 선택정보 파일에 기록될 선택정보는 상기 선택부분에 관한 위치정보 (URL: Uniform Resource Location), 및 상기 선택부분에 관한 인터넷 사이트에 로그인할 때 사용하였던 사용자 인증정보(ID, 비밀번호) 등이 있다.
만일 자동 검색의 대상이 되는 인터넷 사이트가 사용자 인증을 요하는 사이트인 경우에는 이후의 반복적인 자동 접속을 위하여 자동적으로 로그인이 되는지를 제1 절차에서 확인하는 것이 바람직하다.
이 절차는, 상기 선택이 이루어지면, 해당 인터넷 사이트에 접속할 때 사용된 사용자 인증정보를 이용하여 상기 인터넷 사이트에 자동으로 로그인을 시도하는 단계; 상기 자동 로그인이 실패한 경우에는 로그인에 필요한 것이라고 판단된 데이터를 디스플레이하여 사용자가 로그인에 필요한 정보를 확인할 수 있도록 처리한 후 상기 확인된 정보를 통해 상기 인터넷 사이트에 다시 자동 로그인하는 재로그인을 일정 회수 반복하는 단계; 및 상기 자동 로그인이 성공한 경우에만 상기 선택부분에 관한 정보와 로그인에 필요한 상기 사용자 인증정보를 선택정보로서 상기 선택정보 파일에 기록하는 단계를 포함하도록 구성하여 바람직하게 실시할 수 있다.
한편, 상기 제2 절차는 해당 인터넷 사이트에 대한 자동 접근시에는 웹 브라우저의 형태로서 동작하여 접근하도록 구성하는 것이 바람직하며,
상기 제2 절차는 검색 주기를 설정하는 단계; 상기 검색주기가 되었는지를 판단하는 단계; 상기 검색주기가 된 경우에는 상기 선택정보 파일에 저장되어 있는 선택정보를 이용하여 해당 인터넷 사이트에 자동 접속하는 자동접속 단계; 및 상기 접속한 인터넷 사이트에서 상기 선택정보와 관련한 부분의 정보를 수집하는 자동수집 단계를 포함하도록 구성하여 바람직하게 실시할 수 있다.
이 때, 상기 자동접속 단계는 상기 선택정보 파일에서 로그인에 필요한 정보를 검색하는 단계; 웹 브라우저 콘트롤을 이용하여 해당 사이트에 접근하는 단계; 및 상기 로그인 정보를 이용하여 상기 인터넷 사이트에 자동으로 로그인하는 단계를 포함하도록 구성하여 바람직하게 실시할 수 있다.
또한, 상기 자동수집 단계는 상기 자동수집할 정보가 자바 스크립트로 처리된 정보인지를 판단하는 단계; 자바 스크립트로 처리된 정보인 경우에는 웹 브라우저 콘트롤을 이용하여 자동클릭하는 단계; 및 웹 브라우저가 자바 스크립트를 처리한 후 해당 데이터를 중간에서 가로채는 단계를 포함하도록 구성하여 바람직하게 실시할 수 있다.
한편, 상기 제3 절차는 상기 제2 절차에서 수집된 정보에 변경사항이 있는지를 조사하는 단계; 상기 조사 결과, 변경사항이 있는 경우에는 수집된 데이터의 형태소를 분석하여 의미있는 용어를 추출하는 단계; 상기 추출된 용어를 분류용 용어사전 파일과 비교하는 단계; 및 상기 비교 결과가 서로 동일한 경우에는 이 데이터들을 분류별로 나누고, 해당 사용자에게 제공할 데이터의 형태로 가공하여 갱신정보 파일에 기록하되, 서로 동일하지 않은 경우에는 해당 데이터를 무시하는 단계를 포함하도록 구성하여 바람직하게 실시할 수 있다.
상기 제4 절차는 상기 갱신정보 파일의 내용을 메시지 창에 디스플레이하는 단계를 포함하도록 구성하여 바람직하게 실시할 수 있으며, 상기 갱신정보 파일이 업데이트(update)된 경우에는 이를 알려주는 경보절차를 추가로 포함하도록 구성하여 더욱 바람직하게 실시할 수 있다.
상기 경보절차는 특정 사운드를 출력하는 단계, 특정 이미지나 동영상을 출력하는 단계, 및 축소 형태의 메시지 창을 자동 확대하는 단계 중 하나 이상의 단계를 포함하도록 구성할 수 있으며, 상기 각 단계의 활성화 여부는 사용자가 설정할 수 있도록 구성하는 것이 바람직하다.
위에서 언급한 바와 같이 이상과 같은 각 절차들은 개별적인 컴퓨터 시스템에 설치되는 컴퓨터 프로그램에 의하여 독자적으로 수행되는 절차들이며, 본 발명은 이러한 컴퓨터 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체 또한 그 대상으로 한다.
도 1은 본 발명의 개요도,
도 2는 본 발명의 바람직한 일 실시예에 관한 흐름도,
도 3은 제1 절차의 바람직한 일 실시예에 관한 흐름도,
도 4는 본 발명이 적용되는 웹 브라우저 화면의 예,
도 5는 자동로그인 과정에 관한 바람직한 실시예의 흐름도,
도 6은 제2 절차의 바람직한 일 실시예에 관한 흐름도,
도 7은 자동접속 단계에 관한 바람직한 실시예의 흐름도,
도 8은 자동수집 단계에 관한 바람직한 실시예의 흐름도,
도 9는 제3 절차의 바람직한 일 실시예에 관한 흐름도,
도 10은 선택정보 관리절차의 바람직한 일 실시예에 관한 흐름도,
도 11은 선택정보 관리절차에 관한 화면 구성의 예를 도시한 것이다.
* 도면의 주요 부분에 대한 부호의 설명
10: 사용자 단말기20: 인터넷
11: 인터넷 정보 자동수집용 컴퓨터 프로그램
11-1: 웹 브라우저 화면11-2: 선택용 버튼
11-3: 드래그된 부분12-1: 선택정보 파일
12-2: 갱신정보 파일12-3: 시소러스 용어사전 파일
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 상세히 설명하기로 한다.
도 1을 참조하자면, 본 발명에 따른 따른 인터넷 정보 자동 수집 방법은 각 사용자의 단말기(10)에 설치되는 컴퓨터 프로그램(11)에 의하여 수행되는 것으로서, 이 프로그램(11)은 인터넷을 통해 온라인으로 배포되거나, 콤팩트 디스크(CD) 등의 디지털 데이터 기록매체에 수록되어 배포될 수 있다. 이하에서는 본 발명에 따라 인터넷에서 정보를 자동 수집하는 컴퓨터 프로그램을 "프로그램"이라 칭하기로 한다.
프로그램(11)은 사용자가 설정한 주기에 따라 해당 인터넷 사이트에 자동 접근하여 사용자가 지정한 정보를 수집/가공한 후 사용자가 알 수 있도록 처리한다. 그러므로, 사용자의 입장에서는 인터넷을 이용하는 도중 관심있는 부분을 선택해놓는 것만으로 신규 정보를 신속히 받아볼 수 있게 되어, 매우 효율적인 정보 이용이 가능해지는 것이다.
사용자 단말기(10)는 개인용 컴퓨터(PC)일 경우가 대부분일 것이지만 그에 한정하는 것은 아니며, 핸드폰이나 PDA(Personal Digital Assistant) 등의 휴대용 무선 단말기일 수도 있다. 물론, 유선 인터넷을 사용하는 경우와 무선 인터넷을 대상으로 하는 경우에 프로그램(11)은 해당 시스템에 맞추어 작성되어야 할 것이지만, 이러한 프로그램 작성법은 이미 널리 알려져 있는 공지기술이므로 상세한 설명은 생략하기로 한다.
프로그램(11)의 기능은 사용자 단말기(10)에 탑재되는 웹 브라우저와 밀접한 관계가 있으므로, 해당 사용자 단말기(10)에 설치될 때 사용자 단말기(10)에 탑재되어 있는 웹 브라우저와 일체로 설치되어 동작하도록 구성하는 것이 바람직하다.
이것은 사용자가 웹서핑 중 수집 대상이 되는 정보를 간편하고 편리하게 등록할 수 있도록 하기 위해서는 웹 브라우저상의 기능바 부분에 프로그램을 탑재하는 것이 가장 효율적이기 때문이다. 이를 위하여, 프로그램(11)은 도 4에 도시한 바와 같이 웹 브라우저의 구동시 웹 브라우저 화면(11-1)의 기능바 부분에 선택용 버튼(11-2)을 디스플레이한다.
도 1에 도시한 바와 같이 프로그램(11)은 그 기능을 수행하기 위하여 여러 데이터 파일을 사용하는데, 선택정보 파일(12-1), 갱신정보 파일(12-2), 및 시소러스 용어사전 파일(12-3) 등이 있다. 도 1에 도시한 파일 구성은 바람직한 실시예일 뿐이며, 프로그램(11)의 효율성을 위하여 임의적으로 작성될 수 있는 것으로서, 각 파일의 역할은 이하의 설명에서 상세히 설명하기로 한다.
이제 도 2를 참조하여 본 발명을 실시하는 바람직한 예를 구체적으로 설명하기로 한다.
먼저, 프로그램(11)은 웹 브라우저상에 나타난 웹 페이지의 특정 부분이 선택되면, 선택된 부분에 관한 정보(선택정보)를 선택정보 파일에 기록한다(S100:제1 절차).
사용자의 입장에서 제1 절차(S100)를 설명하자면, 사용자는 프로그램(11)이 설치된 단말기(10)를 이용하여 종래의 사용법과 같이 여러 인터넷 사이트를 이용하면서 자신이 원하는 정보(예: 한겨레신문의 사설)가 있으면 화면상에서 이를 선택하는 것이다. 그러면, 이 선택정보는 프로그램(11)에 의하여 사용자 단말기(10)의 선택정보 파일(12-1)에 기록된다.
도 3을 참조하여 제1 절차(S100)의 바람직한 일 실시예를 구체적으로 설명하기로 한다.
제1 절차(S100)는 웹 브라우저와 함께 구동을 시작하며(S110), 웹 브라우저의 종료와 함께 종료한다(S170).
그리고, 구동 도중에는 도 4에 도시한 실시예에서와 같이 선택용 버튼(11-2)이 클릭되면(S120), 현재의 웹 페이지 중 마우스로 드래그된 부분이 있는지를 조사한다(S130). 단계 S130에서의 조사 결과, 드래그된 부분이 없는 경우에는 현재 웹 브라우저 화면상의 웹 페이지 자체가 선택된 것으로 간주하며(S150), 드래그된 부분(11-3)이 있는 경우에는 현재 웹 페이지 중 드래그된 부분만을 선택한다(S140). 그리고, 선택부분에 관한 선택정보를 선택정보 파일(12-1)에 저장한다(S160).
즉, 사용자는 현재의 웹 페이지에서도 특히 관심있는 부분만을 마우스로 드래그(11-3)하여 그 부분에 관한 정보만을 수집할 수 있다. 이 때, 선택은 텍스트뿐 아니라 이미지, 동영상, 사운드 등 화면의 모든 구성요소에 대하여 이루어질 수 있는 것이다.
이 때, 프로그램(11)은 웹 페이지 자체를 선택한 것으로 처리한 경우에는 선택된 웹 페이지를 분석하여 주 정보가 되는 리스트 및 본문을 추출한 후 이를 선택정보로서 저장하도록 구성하면 더욱 바람직하게 실시할 수 있다.
단계 S160에서 선택정보 파일(12-1)에 기록할 선택정보는 선택부분에 관한 위치정보(URL:Uniform Resource Location), 사용자가 해당 인터넷 사이트에 접속할 때 사용한 아이디(ID), 비밀번호, 인증 URL, 인증방식, 인증관련 특수정보 등을 포함할 수 있다. 여기서 사용자 인증정보(로그인 정보)는 검색대상 인터넷 사이트가 사용자 인증을 요하는 경우에 사용자 대신 인증하기 위하여 사용될 수 있다.
한편, 선택정보에서 지시하는 인터넷 사이트가 사용자 인증(로그인)이 필요한 사이트라면, 프로그램(11)은 해당 사이트를 주기적으로 검색할 때 해당 사용자의 로그인 정보를 사용하게 된다. 그러나, 위에서 설명한 바와 같이 로그인 정보가 인터넷 사이트에 적용되는 절차는 매우 다양하여 자동 로그인 자체가 불가능할 수도 있다. 그러므로 선택시에 미리 자동 로그인을 수행해보고 그에 맞는 조치를 취할 수 있도록 하면 이후에 발생하는 문제를 미연에 방지할 수 있게 되므로 더욱 바람직하게 실시할 수 있다.
즉, 사용자 인증 사이트의 경우 각 인증방식과 개발자가 임의로 코딩한 다양한 특성들에 대해 자동으로 가이드하여 사용자가 선택할 수 있도록 보편화한 기능을 제공함으로서, 어떤 인터넷 사이트이든지 자동 인증처리를 할 수 있도록 한다.
도 5를 참조하자면, 프로그램(11)은 사용자가 인터넷 사이트를 서핑하다가 선택한 사이트가 로그인이 필요한 사이트인 경우에는(S113-1,S113-2), 사용자가 입력한 사용자 인증정보를 이용하여 자동으로 로그인을 시도한다(S113-3).
단계 S113-3에서 자동 로그인 시도가 성공한 경우에는(S113-4), 이 인터넷 사이트의 위치정보(URL), 아이디(ID), 및 비밀번호를 포함한 사용자 인증정보를 선택정보 파일(12-1)에 저장한다(S113-5).
그러나, 단계 S113-3에서 자동 로그인 시도가 실패한 경우에는(S113-4), 로그인에 필요한 것이라고 판단된 데이터(예: 아이디/비밀번호 텍스트 박스, 로그인 버튼명 등)를 분석하여 사용자에게 추천하고(S113-6), 사용자가 로그인에 필요한 정보를 확인할 수 있도록 처리한 후 확인된 정보를 통해 인터넷 사이트에 다시 자동 로그인을 시도한다(S113-7). 이 시도는 중간에 자동 로그인이 성공하지 못하면 일정 회수만 반복하도록 한다. 그리고, 자동 로그인을 재시도하여 성공한 경우에는(S113-8), 이 인터넷 사이트의 위치정보(URL), 아이디(ID), 및 비밀번호를 포함한 사용자 인증정보를 선택정보 파일(12-1)에 저장한다(S113-5).
또한, 프로그램(11)은 사용자가 특히 원하는 하나 이상의 단어를 입력할 수 있도록 해주고, 입력된 단어를 선택정보와 함께 선택정보 파일(12-1)에 저장하는 기능을 구비하도록 하여 보다 만족도가 높은 정보를 제공할 수 있다. 이 경우, 프로그램(11)은 제3 절차(S300)의 수행 도중 사용자가 지정해 놓은 단어가 포함되어 있는 데이터만을 추출하도록 한다.
이제, 프로그램(11)은 사용자가 설정한 선택정보 파일(12-1)의 내용을 참조하여 주기적으로 해당 인터넷 사이트에 자동 접근하여 사용자가 원하는 정보를 수집한다(S200:제2 절차).
도 6을 참조하여 제2 절차(S200)를 보다 구체적으로 설명하자면, 데이터 수집 주기는 프로그램(11)에서 디폴트로 설정할 수도 있으며, 사용자가 설정하도록 하도록 할 수도 있다. 이러한 검색 주기가 설정되면(S210), 프로그램(11)은 검색 주기가 되었는지를 조사하고(S220), 검색할 시기가 된 경우에는 선택정보 파일(12-1)의 내용을 참조하여 선택정보가 지시하는 인터넷 사이트에 자동으로 접속한 후(S230), 해당 부분의 정보를 수집한다(S240).
이 때, 단계 S240은 인터넷 사이트 자체의 구조에 변경이 있어서 해당 부분을 자동으로 검색할 수 없는 경우가 발생하면 이를 해당 사용자에게 알려주도록 하여, 사용자가 이 부분을 다시 설정할 수 있도록 하는 것이 바람직하다.
프로그램(11)은 사용자 인증시 웹 브라우저의 형태로 인터넷 사이트에 접근하도록 구성하는 것이 바람직하다. 이것은 어떠한 인터넷 사이트이든지 가입자가 직접 인증하거나 자료를 조회하는 것을 거부하는 사이트는 없기 때문이다. 이러한 개념에 착안하여 마치 가입자가 직접 인증하고 자료를 조회하는 것처럼 접근하여 정보를 수집하기 위하여 웹 브라우저의 형태로 구성하는 것이다.
도 7을 참조하여 자동접속 단계(S230)를 보다 구체적으로 설명하기로 한다.
프로그램(11)은 선택정보 파일(12-1)에서 로그인 정보를 검색하고(S231), 웹브라우저 콘트롤을 이용하여 로그인이 필요한 사이트에 접근한 후(S232), 단계 S231에서 검색한 로그인 정보와 웹 브라우저 콘트롤을 이용하여 인터넷 사이트에 자동으로 로그인한다(S233).
한편, 단계 S240에서 수집하는 수집대상 정보는 자바 스크립트 형태로 구성되어 있을 수도 있는데, 이 경우의 자동수집 단계(S240)를 도 8을 참조하여 설명하기로 한다.
먼저, 프로그램(11)은 수집할 정보가 자바 스크립트로 처리된 정보인지를 판단하고(S241), 자바 스크립트로 처리된 정보인 경우에는 웹 브라우저 콘트롤을 이용하여 자동클릭한다(S242). 그리고, 웹 브라우저가 자바 스크립트를 처리한 후 위치정보(URL) 등의 필요 데이터를 중간에서 가로채는 방법을 사용하여 데이터를 수집한다(S243).
프로그램(11)은 제2 절차(S200)에서 정보를 수집하면, 수집된 정보들 중에서 변경된 내용이 있는지를 판단하여 자동으로 분류하고 가공하는 제3 절차(S300)를 진행한다.
도 9를 참조하여, 제3 절차(S300)를 구체적으로 설명하기로한다.
먼저, 프로그램(11)은 제2 절차(S200)에서 수집된 데이터의 형태소를 분석하여 의미있는 용어를 추출한다(S310). 그리고, 추출된 용어를 기 준비되어 있는 분류용 용어사전 파일(12-3:시소러스 용어사전 파일)과 비교한다(S320).
그리고, 단계 S320에서의 비교결과가 서로 동일한 경우에는(S330), 이 데이터들을 분류별로 나누고 해당 사용자에게 제공할 데이터의 형태로 가공한 후 갱신정보 파일(12-2)에 저장한다(S340). 그러나, 단계 S320에서의 비교 결과가 서로 동일하지 않은 경우에는(S330), 해당 데이터를 무시한다(S350). 이러한 분류 및 가공 절차는 모든 수집 데이터에 대하여 수행된다(S360).
제3 절차(S300)를 통해 분류되고 가공된 정보는 사용자가 알 수 있도록 처리된다(S400:제 4절차). 여기서, 갱신된 정보를 사용자에게 제공하는 방법은 여러가지가 있을 수 있지만 메시지 창을 통하여 보여주는 것이 가장 바람직하다.
하나의 예로서, 사용자의 화면에는 항상 축소 혹은 확대 형태의 메시지 창이 나타나 있도록 하고, 갱신정보 파일(12-1)이 업데이트되면 이를 자동으로 해당 창에 디스플레이하도록 구성하면 바람직하게 실시할 수 있다.
이 때, 프로그램(11)은 갱신정보 파일(12-1)이 업데이트되면 사용자에게 이를 알리는 경보절차를 추가로 포함하도록 구성하면, 사용자가 신속하게 신규 갱신정보를 접할 수 있도록 할 수있다.
이 경우, 경보절차는 특정 사운드를 출력하는 단계, 특정 이미지나 동영상을 출력하는 단계, 혹은 메시지 창을 확대 디스플레이하는 단계 등으로 구성할 수 있으며, 해당 단계의 활성화 여부는 사용자가 직접 설정할 수 있도록 구성하는 것이 바람직하다.
한편, 사용자의 보다 편리한 사용을 위하여, 프로그램(11)은 위에서 설명한 기능들 이외에도 사용자가 자신이 어떤 것들을 선택해 놓았는지를 체계적으로 관리할 수 있도록 해주면 더욱 바람직할 것이다. 그러면, 사용자는 신문사와 관련하여 선택한 내용은 신문사 그룹으로서 보관하고, 증권과 관련하여 선택한 내용은 증권그룹으로서 보관할 수 있게 된다.
도 10을 참조하여 보다 구체적으로 설명하자면, 프로그램(11)은 도 11에 도시한 예에서와 같이 디스플레이 창(71)을 열어 현재 설정되어 있는 정보를 디스플레이한다(S610). 이 때, 디스플레이 창(71)에 표시되는 정보는 도 11-1에 도시한 바와 같이 트리구조로 표시하는 것이 바람직하다.
이제 프로그램(11)은 그룹 추가의 요청이 입력되면(S621), 도 11-2에 도시한 예와 같이 문자입력창(73)을 이용하여 추가할 구룹의 이름을 입력받는다(S622). 그리고, 신규 그룹으로서 등록한 후 디스플레이 창(71)에 반영한다(S623).
프로그램(11)은 사이트 추가의 요청이 입력되면(S631), 도 11-4에 도시한 예와 같이 문자입력창(74)을 이용하여 추가할 사이트의 이름을 입력받는다(S632). 그리고, 현재 선택되어 있는 그룹에 신규 사이트로서 등록한 후 디스플레이 창(71)에 반영한다(S633).
그러나, 프로그램은 그룹 혹은 사이트 삭제 요청이 입력되면(S641), 현재 선택되어 있는 그룹 혹은 사이트를 삭제하고, 이를 디스플레이 창(71)에 반영한다 (S642).
이 때. 단계 S621, S631, 및 S641에서의 요청 입력은 도 11-1이나 도 11-3에도시한 예와 같이 화면상에 출력되는 임의의 기능버튼을 클릭하거나, 디스플레이 창(71) 내에서 마우스의 우측키를 클릭할 때 출력되는 보조창(72)을 통해 이루어지도록 하여 바람직하게 구현할 수 있다.
본 발명을 사용하면, 타 사업자의 도움없이 독립적으로 다양한 정보를 신속하게 수집할 수 있다. 이에 따라 정보의 활용이 원활해지며, 보다 신속하고 정확한 의사결정이 가능해질 수 있다. 또한, 중복업무의 방지, 기회 손실비용의 최소화, 및 간접비용의 절감을 통해 업무 효율성을 증대시킬 수 있다.
특히, 사용자 인증의 자동처리 및 자바로 처리된 컨텐츠를 수집할 수 있어, 수집정보에 대한 사용자의 신뢰성을 높일 수 있으며, 고급정보의 제공이 가능하여 정보이용의 효율성을 획기적으로 개선할 수 있다.
Claims (11)
- 웹 브라우저상에 나타난 웹 페이지의 특정 부분이 선택되면 상기 선택된 부분에 관한 정보(선택정보)를 선택정보 파일에 기록하는 제1 절차;상기 선택정보 파일의 각 선택정보가 지시하는 인터넷 사이트에 주기적으로 자동 접근하여 해당 부분의 내용을 수집하는 제2 절차;상기 제2 절차에서 수집된 내용 중 이전의 내용과 다른 변경된 내용을 추출하여 분류하고 가공하는 제3 절차; 및상기 가공된 정보를 사용자가 알 수 있도록 처리하는 제4 절차를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 1 항에 있어서,상기 제1 절차 내지 제4 절차 중 하나 이상의 절차는 웹 브라우저와 일체로 동작하도록 구성된 프로그램에서 수행하도록 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 2 항에 있어서,상기 제 1 절차는 상기 웹 브라우저 화면의 일정 부분에 선택용 버튼을 디스플레이하는 단계를 구비하여, 상기 제1 절차에서의 선택은 상기 선택용 버튼이 클릭되었을 때 현재의 웹 페이지 자체를 선택한 것으로 처리하되,상기 선택용 버튼이 클릭되었을 때 상기 웹 페이지의 특정 부분이 마우스에 의해 드래그되어 있으면, 해당 웹 페이지 중 드래그되어 있는 부분만을 선택한 것으로 처리하도록 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 3 항에 있어서,상기 웹 페이지 자체를 선택한 것으로 처리한 경우에는 상기 선택된 웹 페이지를 분석하여 주 정보가 되는 리스트 및 본문을 추출한 후 이를 상기 선택정보로서 저장하도록 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 1 항에 있어서,상기 선택정보 파일에 기록될 선택정보는 상기 선택부분에 관한 위치정보 (URL: Uniform Resource Location), 및 상기 선택부분에 관한 인터넷 사이트에 로그인할 때 사용하였던 사용자 인증정보(ID, 비밀번호)를 포함하도록 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 5 항에 있어서, 상기 제1 절차는상기 선택이 이루어지면, 해당 인터넷 사이트에 접속할 때 사용된 사용자 인증정보를 이용하여 상기 인터넷 사이트에 자동으로 로그인을 시도하는 단계;상기 자동 로그인이 실패한 경우에는 로그인에 필요한 것이라고 판단된 데이터를 디스플레이하여 사용자가 로그인에 필요한 정보를 확인할 수 있도록 처리한후 상기 확인된 정보를 통해 상기 인터넷 사이트에 다시 자동 로그인하는 재로그인을 일정 회수 반복하는 단계; 및상기 자동 로그인이 성공한 경우에만 상기 선택부분에 관한 정보와 로그인에 필요한 상기 사용자 인증정보를 선택정보로서 상기 선택정보 파일에 기록하는 단계를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 1 항에 있어서 상기 제2 절차는,검색 주기를 설정하는 단계;상기 검색주기가 되었는지를 판단하는 단계;상기 검색주기가 된 경우에는 상기 선택정보 파일에 저장되어 있는 선택정보를 이용하여 해당 인터넷 사이트에 자동 접속하는 자동접속 단계; 및상기 접속한 인터넷 사이트에서 상기 선택정보와 관련한 부분의 정보를 수집하는 자동수집 단계를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 7 항에 있어서, 상기 자동수집 단계는상기 자동수집할 정보가 자바 스크립트로 처리된 정보인지를 판단하는 단계;자바 스크립트로 처리된 정보인 경우에는 웹 브라우저 콘트롤을 이용하여 자동클릭하는 단계; 및웹 브라우저가 자바 스크립트를 처리한 후 해당 데이터를 중간에서 가로채는단계를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 1 항에 있어서, 상기 제3 절차는상기 제2 절차에서 수집된 정보에 변경사항이 있는지를 조사하는 단계;상기 조사 결과, 변경사항이 있는 경우에는 수집된 데이터의 형태소를 분석하여 의미있는 용어를 추출하는 단계;상기 추출된 용어를 분류용 용어사전 파일과 비교하는 단계; 및상기 비교 결과가 서로 동일한 경우에는 이 데이터들을 분류별로 나누고, 해당 사용자에게 제공할 데이터의 형태로 가공하여 갱신정보 파일에 기록하되, 서로 동일하지 않은 경우에는 해당 데이터를 무시하는 단계를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 9 항에 있어서,상기 제4 절차는 상기 갱신정보 파일의 내용을 메시지 창에 디스플레이하는 단계를 포함하여 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
- 제 1 항에 있어서,상기 제1 절차는 사용자가 특히 원하는 하나 이상의 단어를 입력할 수 있도록 해주고, 상기 입력된 단어를 상기 선택정보와 함께 저장하는 기능을 추가로 포함하되,상기 제3 절차는 상기 단어가 포함되어 있는 정보만을 추출하여 가공하도록 구성되는 것을 특징으로 하는 인터넷 정보 자동 수집 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010023693A KR20020084435A (ko) | 2001-05-02 | 2001-05-02 | 인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020010023693A KR20020084435A (ko) | 2001-05-02 | 2001-05-02 | 인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20020084435A true KR20020084435A (ko) | 2002-11-09 |
Family
ID=27703291
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020010023693A KR20020084435A (ko) | 2001-05-02 | 2001-05-02 | 인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20020084435A (ko) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100555017B1 (ko) * | 2004-07-27 | 2006-03-03 | 주식회사 미니게이트 | 인터넷상에서 회원들간의 정보 활성화를 위한정보교류시스템 및 정보교류방법 |
US7765228B2 (en) | 2003-06-13 | 2010-07-27 | Yahoo! Inc. | Method and system for data collection for alert delivery |
KR20150106532A (ko) * | 2014-03-12 | 2015-09-22 | 주식회사 아이엠컴퍼니 | 복수 개의 교육 단체의 홈페이지 내 데이터를 선별적으로 취합하는 시스템 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09311869A (ja) * | 1996-05-24 | 1997-12-02 | Toshiba Corp | インターネット検索サーバ |
JPH10187753A (ja) * | 1996-12-25 | 1998-07-21 | Nec Corp | Www情報抽出システム |
JPH10254910A (ja) * | 1997-03-14 | 1998-09-25 | Net Biretsuji Kk | ビジュアルブックマークシステム |
JP2000003301A (ja) * | 1998-06-16 | 2000-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供システムおよび情報提供方法 |
WO2000002141A1 (en) * | 1998-07-03 | 2000-01-13 | Fujun Bi | A system for crawling the web and extracting designated data and the method therefor i.e. webharvester |
JP2000082066A (ja) * | 1998-09-04 | 2000-03-21 | Recruit Co Ltd | ユーザ毎にスクラップ機能を備えたネットワーク上のデータベース検索システム |
KR20000030249A (ko) * | 2000-02-15 | 2000-06-05 | 안창현 | 사용자주문형 정보게시판 서비스시스템 |
KR20000049581A (ko) * | 2000-04-12 | 2000-08-05 | 장성동 | 인터넷상의 실시간 맞춤 정보 서비스 장치 및 방법 |
KR20000054312A (ko) * | 2000-06-01 | 2000-09-05 | 최우석 | 맞춤 웹정보 구축 제공 방법 |
KR20000058779A (ko) * | 2000-06-28 | 2000-10-05 | 유인오 | 웹브라우저의 북마크 파일 데이터를 이용하여시작페이지(홈 기능)에 개인화된 홈페이지를 생성시키는방법과 이를 이용한 웹 서핑 가이드 방법 |
JP2001052023A (ja) * | 1999-08-13 | 2001-02-23 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディア情報収集提示方法,マルチメディア情報収集提示システムおよびマルチメディア情報収集提示プログラムを記録した媒体 |
KR20010094470A (ko) * | 2000-03-31 | 2001-11-01 | 김양현 | 지능형 정보/문서 생성기 |
-
2001
- 2001-05-02 KR KR1020010023693A patent/KR20020084435A/ko not_active Application Discontinuation
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH09311869A (ja) * | 1996-05-24 | 1997-12-02 | Toshiba Corp | インターネット検索サーバ |
JPH10187753A (ja) * | 1996-12-25 | 1998-07-21 | Nec Corp | Www情報抽出システム |
JPH10254910A (ja) * | 1997-03-14 | 1998-09-25 | Net Biretsuji Kk | ビジュアルブックマークシステム |
JP2000003301A (ja) * | 1998-06-16 | 2000-01-07 | Nippon Telegr & Teleph Corp <Ntt> | 情報提供システムおよび情報提供方法 |
WO2000002141A1 (en) * | 1998-07-03 | 2000-01-13 | Fujun Bi | A system for crawling the web and extracting designated data and the method therefor i.e. webharvester |
JP2000082066A (ja) * | 1998-09-04 | 2000-03-21 | Recruit Co Ltd | ユーザ毎にスクラップ機能を備えたネットワーク上のデータベース検索システム |
JP2001052023A (ja) * | 1999-08-13 | 2001-02-23 | Nippon Telegr & Teleph Corp <Ntt> | マルチメディア情報収集提示方法,マルチメディア情報収集提示システムおよびマルチメディア情報収集提示プログラムを記録した媒体 |
KR20000030249A (ko) * | 2000-02-15 | 2000-06-05 | 안창현 | 사용자주문형 정보게시판 서비스시스템 |
KR20010094470A (ko) * | 2000-03-31 | 2001-11-01 | 김양현 | 지능형 정보/문서 생성기 |
KR20000049581A (ko) * | 2000-04-12 | 2000-08-05 | 장성동 | 인터넷상의 실시간 맞춤 정보 서비스 장치 및 방법 |
KR20000054312A (ko) * | 2000-06-01 | 2000-09-05 | 최우석 | 맞춤 웹정보 구축 제공 방법 |
KR20000058779A (ko) * | 2000-06-28 | 2000-10-05 | 유인오 | 웹브라우저의 북마크 파일 데이터를 이용하여시작페이지(홈 기능)에 개인화된 홈페이지를 생성시키는방법과 이를 이용한 웹 서핑 가이드 방법 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7765228B2 (en) | 2003-06-13 | 2010-07-27 | Yahoo! Inc. | Method and system for data collection for alert delivery |
KR100555017B1 (ko) * | 2004-07-27 | 2006-03-03 | 주식회사 미니게이트 | 인터넷상에서 회원들간의 정보 활성화를 위한정보교류시스템 및 정보교류방법 |
KR20150106532A (ko) * | 2014-03-12 | 2015-09-22 | 주식회사 아이엠컴퍼니 | 복수 개의 교육 단체의 홈페이지 내 데이터를 선별적으로 취합하는 시스템 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6751777B2 (en) | Multi-target links for navigating between hypertext documents and the like | |
US9047386B2 (en) | Creating a link relationship between document objects and storing in a link directory | |
US7814083B2 (en) | Method and system for supporting information access and record media therefor | |
US6832350B1 (en) | Organizing and categorizing hypertext document bookmarks by mutual affinity based on predetermined affinity criteria | |
US9043352B1 (en) | Method for searching document objects on a network | |
US6697838B1 (en) | Method and system for annotating information resources in connection with browsing, in both connected and disconnected states | |
US6564254B1 (en) | System and a process for specifying a location on a network | |
US20050149496A1 (en) | System and method for dynamic context-sensitive federated search of multiple information repositories | |
JP4118580B2 (ja) | 配置情報推薦装置、その方法、プログラム | |
WO2000068833A2 (en) | Categorising data | |
JPH11345201A (ja) | 情報提供システム及び情報提供ネットワークシステム | |
JP4430598B2 (ja) | 情報共有システムおよび情報共有方法 | |
US20020035643A1 (en) | Search support device and method, and recording medium storing program for computer to carry out operation with said search support device | |
JP4603140B2 (ja) | 個人用ブックマーク自動作成機能を有したwwwサーバー、wwwサーバーにより個人用ブックマークを作成して利用者のコンピュータに送出する方法 | |
JP2009026249A (ja) | 閲覧履歴編集端末及びプログラムおよびその方法 | |
JP4682549B2 (ja) | 分類案内装置 | |
US20060085181A1 (en) | Keyword extraction apparatus and keyword extraction program | |
JP2005025617A (ja) | 履歴情報管理方法及び履歴情報管理装置 | |
KR100672278B1 (ko) | 웹 브라우저의 즐겨찾기 리스트를 이용한 개인화 검색 방법및 검색 서버 | |
US20050114523A1 (en) | Computer-implemented method, system and program product for providing real-time access to information on a computer system over a network | |
KR20020014026A (ko) | 웹 개인화에 바탕한 뉴스 추적 및 분석 서비스 | |
KR20020084435A (ko) | 인터넷 정보 자동 수집 방법 및 인터넷 정보 자동 수집용프로그램을 기록한 기록매체 | |
KR20000031480A (ko) | 정보 서비스 장치 및 그 방법 | |
KR20070031152A (ko) | 검색어 입력에 대한 검색 결과를 제공하는 방법 및 그방법을 채용한 검색 엔진 | |
KR20030051577A (ko) | 검색사이트의 검색결과 표시방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E601 | Decision to refuse application |