KR100359232B1 - 검색 엔진용 데이터베이스 구축 방법 - Google Patents

검색 엔진용 데이터베이스 구축 방법 Download PDF

Info

Publication number
KR100359232B1
KR100359232B1 KR1019990028635A KR19990028635A KR100359232B1 KR 100359232 B1 KR100359232 B1 KR 100359232B1 KR 1019990028635 A KR1019990028635 A KR 1019990028635A KR 19990028635 A KR19990028635 A KR 19990028635A KR 100359232 B1 KR100359232 B1 KR 100359232B1
Authority
KR
South Korea
Prior art keywords
bookmark
item
information
bookmark information
classification
Prior art date
Application number
KR1019990028635A
Other languages
English (en)
Other versions
KR20010009980A (ko
Inventor
전병국
Original Assignee
주식회사 모음과나눔
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 모음과나눔 filed Critical 주식회사 모음과나눔
Priority to KR1019990028635A priority Critical patent/KR100359232B1/ko
Publication of KR20010009980A publication Critical patent/KR20010009980A/ko
Application granted granted Critical
Publication of KR100359232B1 publication Critical patent/KR100359232B1/ko

Links

Abstract

본 발명은 인터넷 사이트를 검색해주는 검색 엔진용 데이터베이스를 구축하는 방법에 관한 것으로서, 다수의 사용자 각각에 의해서 작성된 개별 북마크 목록들을 제공받는 단계; 상기 개별 북마크 목록의 분류 항목을 기설정된 표준 분류 항목으로 변환하는 단계; 상기 표준 분류 항목에 의거하여 상기 개별 북마크 목록을 통합하는 단계; 기설정된 시간마다 상기 단계를 반복해서 통합된 북마크 목록을 갱신하는 단계를 포함하여 이루어진다. 그 결과, 사용자로부터 특정 정보에 대한 검색이 요구될 때, 사용자로부터 유용하다고 직접 검증된 정보를 신속하게 제공할 수 있다.

Description

검색 엔진용 데이터베이스 구축 방법{METHOD FOR CONSTRUCTING DATABASE FOR SEARCH ENGINE}
본 발명은 검색 엔진용 데이터베이스 구축 방법에 관한 것으로서, 더욱 상세하게는, 개별 사용자가 작성한 북마크를 이용한 검색 엔진용 데이터베이스 구축 방법에 관한 것이다.
주지하디시피, 근래들어 컴퓨터 보급의 확산이 가속화되고, 정보의 중요성이 새롭게 인식됨에 따라서, 기관, 학교, 기업 및 각 개인 간에도 통신망(network)을 통해서 정보 교환이 활발히 이루어지고 있는 추세이다. 더욱이, 그 정보 교환의 범위를 전세계로 확장한 인터넷(internet)의 경우, 그 이용자의 수는 이미 1억명 이상을 넘어서 폭발적으로 증가하고 있는 바, 인터넷망을 통해서 제공되는 정보량은 가히 무한대라고 해도 과언이 아니다.
이와 같이 인터넷 망에서 제공되는 정보량이 방대해짐에 따라서, 그와 같은 방대한 정보로부터 필요한 정보를 검색하는 검색 엔진(search engine)의 중요성이 대두되고 있다.
검색 엔진이란 인터넷 사이트의 내용을 데이터베이스로 구축해 놓고, 그 데이터베이스로부터 사용자가 요구되는 인터넷 사이트를 검색해주는 일종의 데이터베이스 서버(server)를 말하며, 그와 같은 검색 엔진에는, 전문가(sufer)들이 여러개의 사이트를 분야별로 분류해놓은 디렉토리형 검색 엔진과, 일정한 단어, 즉, 검색어만 입력하면 그 검색어가 포함된 정보를 제공하고 있는 웹 사이트(web site)를 찾아주는 검색어 입력형 검색 엔진을 들 수 있다.
이중에서 디렉토리형(directory type) 검색 엔진은, 전문가들이 인터넷 사이트를 분야별로 분류해서 데이터베이스를 구축해놓고, 상위 분류 범위부터 하위 분류 범위로 순차적으로 접근해나가는 방식을 사용하는데, 야후(http://www.jahoo.com), 네이버(http://www.naver.com),심마니(http://simmany.chollian.net) 등을 그 예로 들 수 있다. 이와 같은 디렉토리형 검색 엔진은, 인터넷 사이트의 분류를 사람에 의존하기 때문에, 원하는 정보를 검색하기 용이하고, 정보의 신뢰성이 우수한 반면, 인터넷 사이트를 분류하는 인원이 한정되어 있으므로, 검색되는 사이트 수가 한정되어 있고, 특정 사이트는 검색되지 않을 수도 있다.
예를 들어, 야후를 구동하면, 야후에서는 전문가에 의해서 사전에 분류된 다수개의 분류 목록(예를 들어, 예술, 뉴스와 미디어, 비지니스와 경제, 컴퓨터와 인터넷…등)을 보여준다. 그중 사용자가 해당 항목(예를 들어, 예술)을 선택하면, 예술 목록에 포함된 다수의 소분류를 보여준다. 그와 같이, 상위 분류 목록에서부터 하위 분류 목록으로 범위를 좁혀가면서, 검색하고자 하는 해당 정보를 검색하게 된다.
이와 같은 디렉토리형 검색엔진에서는, 상위 분류 목록부터 하위 분류 목록으로 순차적으로 접근해 나가기 때문에, 사용자의 입장에서는 원하는 정보를 제공하는 웹 사이트의 검색이 용이하지만, 그 검색된 사이트들은 인터넷 전체의 사이트중에서 검색되는 것이 아니라 해당 업체(예를 들어, 야후)에서 작성한 데이터 베이스(data base) 범위 내에서 검색되기 때문에, 실제로 검색되지 않는 사이트들도 많다.
또한, 디렉토리형 검색엔진에서 사용되는 데이터 베이스에 포함되는 각 사이트들은 사용자 중심으로 선정되는 것이 아니라 검색 제공자(즉, 분류자) 중심으로 선정되기 때문에, 검색 엔진에서 검색되는 사이트와 사용자가 원하는 사이트 사이에 차이가 발생될 수도 있다.
한편, 검색어 입력형(keyword input type) 검색 엔진은, 로봇 에이전시(robot agency)라고 불리는 컴퓨터 등이 자동으로 웹 사이트(web site)를 돌면서 자료를 수집해서 데이터베이스로 구축하고, 그 구축된 데이터베이스로부터 입력된 검색어를 포함하는 사이트들을 검색한후, 그 검색된 사이트 정보를 사용자에게 제공하는 방식이 사용되는데, 알타비스타 (http://www. altavista.co.kr), 넷 서치(http://netsearch. onnet.co.kr), iBot (http://www.ibot.net) 등을 그 예로 들 수 있다.
이와 같은 검색어 입력형 검색 엔진은, 인터넷 전반에 걸친 사이트를 포함하는 데이터베이스로부터 입력된 검색어를 포함하는 특정 사이트를 검색하기 때문에, 그 검색된 사이트 정보의 정보량이 풍부한 장점을 갖는다.
그러나, 이와 같은 검색어 입력형 검색 엔진에서는, 각 사이트에 대한 분류가 이루어지지 않기 때문에, 정보에 대한 신뢰성이 낮고, 실제 원하는 정보를 찾는데 소요되는 시간 또한 크다.
예를 들어, 알타비스타를 구동하면, 알타비스타에서는 검색어 입력창을 표시하고, 사용자가 그 검색어 입력창에 특정 검색어를 입력하면, 그 검색어를 포함하는 모든 사이트(즉, 검색 엔진에 링크된 모든 사이트)를 보여준다. 예를 들어, '컴퓨터'라는 검색어를 검색어 입력창에 입력하면, 컴퓨터라는 용어를 포함하는 정보가 제공되는 모든 사이트 목록이 표시되고, 사용자는 그와 같이 표시된 모든 사이트 목록에 포함된 각 사이트를 하나하나 접속해 보면서 원하는 정보를 찾는다.
상술한 바와 같이, 검색어 입력형 검색 엔진을 사용하게 되면, 검색 엔진에 링크되어 있는 전체 사이트 중에서 해당 검색어를 사용하고 있는 사이트 전체가 목록으로 표시되기 때문에, 그 정보량이 방대하고, 특정 사이트까지도 검색할 수 있는 장점이 있는 반면, 그 검색된 사이트 수가 많아서(예를 들어, 100개 이상), 특정 정보를 얻기 위해서는 그 검색된 사이트를 일일이 접속해보아야 하므로, 노력 및 시간 등의 소요가 너무 큰 문제점이 있다.
그와 같은 각 검색 엔진에서의 문제점은, 검색 엔진 제공 업체에 의해서 빠른 속도로 개선되어지고 있는데, 대체적으로 다음과 같은 방식으로 개선되고 있다.
예를 들어, 디렉토리형 검색 엔진의 경우, 검색어 입력 방식을 도입해서 디렉토리형과 검색어 입력 방식을 병행해서 상위 분류 목록에서 하위 목록까지의 순차적 단계를 생략하고, 직접 하위 분류 목록을 선택할 수 있도록 하고 있으며, 검색어 입력 방식에서는 검색식(boolean operator)이나 자연어 검색을 통해서 분류의 개념을 부분적으로 도입하고 있다.
그러나, 그와 같이 상호 보완해서 검색 엔진을 개선하더라도, 각 사용 방식에 따라서, 상술한 문제점은 여전히 남아 있다.
즉, 디렉토리형의 경우, 한정된 수(몇십 혹은 몇백명)의 전문가가 분류할 수 있는 정보량에는 한계가 있으므로, 정보 검색의 범위가 제한적일 수밖에 없으며, 검색어 입력형 검색엔진의 경우, 검색어의 선택, 검색식의 활용 등에 따라서 검색된 정보에는 큰 차이를 보이므로, 검색어의 선택 및 검색식의 활용에 익숙하지 않은 사용자에게는 원하는 정보를 검색하는데 많은 어려움이 따른다.
한편, 인터넷에 접속하기 위한 프로그램, 예를 들어, 넷스케이프(netscape)나 익스플로러(explorer)와 같은 웹 브라우저(web browser)에서는, 자주가는 사이트의 주소를 기록해놓고 나중에 그곳을 클릭하면, 해당 사이트로 직접 접속할 수 있도록하는 북마크(bookmark) 기능이 제공되는 바, 그와 같은 북마크는 사용자별로 개별 작성된다.
즉, 유용한 사이트라고 판단되거나, 필요에 의해서 자주 접속하는 사이트에 대해서, 사용자는 각 사이트 별로 해당 북마크 아이템(bookmark item)을 작성하고, 그 북마크 아이템을 사용자 자신에 대응하는 특정 북마크 폴더(bookmark folder)에 저장한다.
이와 같이, 사용자별로 작성된 북마크 정보는, 사용자 자신이 유용한 사이트라고 판단하거나, 실제로 자주 접속하는 사이트에 대한 정보를 기록해 놓은 것이기 때문에, 그와 같은 개별적인 북마크 정보를 통합한다면, 검색 제공자(분류자)의 주관에 의해서 선택 및 분류된 데이터 베이스보다 사용자에게 보다 유용하고 실용적인 데이터 베이스가 될 것이다. 즉, 종래의 검색 제공자 중심이 아니라 사용자 중심의 데이터베이스를 구축할 수 있을 것이다.
또한, 검색어 입력형 검색 엔진에서 사용되는 데이터베이스보다 그 정보량은 적지만, 실제 사용자가 유용하다고 판단되는 정보들이 충분히 포함되어 있으므로, 불필요한 사이트 정보를 보다 감소시키면서도, 실제 사용자들에게 요구되는 사이트 정보는 충분히 제공할 수 있을 것이다.
본 발명은 상술한 점에 착안해서 안출한 것으로서, 검색 엔진에서 사용할 수 있도록 사용자에 의해서 작성된 북마크 정보를 통합하고, 분류하는 검색 엔진용 데이터베이스 구축 방법을 제공하는데 그 목적이 있다.
상술한 목적을 달성하기 위해서, 본 발명에서는, 인터넷 사이트를 검색해주는 검색 엔진용 데이터베이스를 구축하는 방법에 있어서, 다수의 사용자 각각에 의해서 작성된 개별 북마크 목록들을 제공받는 단계; 상기 개별 북마크 목록의 분류 항목을 기설정된 표준 분류 항목으로 변환하는 단계; 상기 표준 분류 항목에 의거하여 상기 개별 북마크 목록을 통합하는 단계; 기설정된 시간마다 상기 단계를 반복해서 통합된 북마크 목록을 갱신하는 단계를 포함하는 것을 특징으로 하는 검색 엔진용 데이터베이스 구축 방법을 제공한다.
도 1은 본 발명에 따른 검색 엔진용 데이터베이스 구축 방법이 구현되는 네트워크 시스템의 일 예를 도시한 예시도,
도 2는 본 발명의 바람직한 실시 예에 따른 검색 엔진용 데이터베이스 구축 방법을 도시한 상세 흐름도,
도 3은 본 발명의 바람직한 실시 예에 따른 개별 북마크 목록의 예시도,
도 4는 본 발명의 바람직한 실시 예에 따라서 표준 분류어로 변환된 개별 북마크 목록의 예시도,
도 5는 본 발명의 바람직한 실시 예에 따른 통합 북마크 목록의 예시도.
<도면의 주요 부분에 대한 부호의 설명>
100/1∼3 : PC1∼PC3 200 : 데이터베이스 서버
이하, 본 발명에 따른 검색 엔진용 데이터베이스 구축 방법에 대해서, 도 1 내지 도 5를 참조한 실시예를 들어 상세히 설명한다.
먼저, 본 발명의 핵심 기술 사상은, 종래에 제공자 중심으로 운용되던 검색 엔진에서의 문제점, 즉, 데이터량의 부족, 검색된 정보의 신뢰성 저하 등을 해소하기 위해서, 개별 사용자들이 자신의 인터넷 항해 경험을 바탕으로 작성해 놓은 북마크 정보를 기반으로 검색 엔진용 데이터베이스를 구축하여 검색 엔진을 사용자 중심으로 운용할 수 있도록 하는데 있다.
한편, 본 실시예는 상술한 본 발명의 핵심 기술 사상에 대한 이해를 돕기 위한 것이므로, 본 발명은 본 실시예는 에서 제시하는 클라이언트 수, 네트워크 환경, 서버의 종류 등에 관계없이 상술한 핵심 기술 사상에 의거하여 이해해야할 것이다.
또한, 본 발명의 대한 이해를 돕기 위해서 인터넷 사용자들에게 주지되어 있는 '북마크(bookmarks)'란 용어를 사용하지만, 이는 사용자가 편집해놓은 인터넷 주소외에도 사용자에 의해서 지정된 소정 정보의 저장 위치라는 의미를 포함하여 해석되어져야 할 것이다.
이하, 상술한 핵심 기술 사상을 중심으로 본 실시예에 대해서 설명하면 다음과 같다. 이때, 참조하는 도 1은 본 발명에 따른 검색 엔진용 데이터베이스 구축 방법이 구현되는 네트워크 시스템의 일예를 도시한 예시도이고, 도 2는 본 발명의 바람직한 실시예에 따른 검색 엔진용 데이터베이스 구축 방법을 도시한 상세 흐름도이며, 도 3은 본 발명의 바람직한 실시예에 따른 개별 북마크 목록의 예시도이다. 또한, 도 4는 본 발명의 바람직한 실시예에 따라서 표준 분류어로 변환된 개별 북마크 목록의 예시도이고, 도 5는 본 발명의 바람직한 실시 예에 따른 통합 북마크 목록의 예시도이다.
먼저, 도 1을 참조하면, 본 실시예에 따른 검색 엔진용 데이터베이스 구축 방법은, 개별 북마크 목록을 작성하고, 그 작성된 개별 북마크 목록에 대한 정보를 데이터베이스 서버(이하, '서버'로 약칭함)(200)에 제공하는 3개의 클라이언트 PC1∼PC3(100/1∼3)로 구성된 네트워크 환경에서 이루어진다.
이하, 그와 같은 네트워크 환경에서 검색 엔진용 데이터베이스 구축 방법이 구현되는 과정에 대해서 도 2를 참조하여 설명한다.
먼저, 서버(200)에서는, 그 서버(200)에 가입된 각 가입자들로부터 개별 북마크 목록을 제공받는다. 이때, 서버(200)는, 개별 클라이언트 각각(PC1∼PC3(100/1∼3))의 개별 저장 영역을 할당해서, 각 클라이언트로부터 비정기적으로 제공되는 개별 북마크 목록을 해당 개별 저장 영역에 저장하는 방법등으로 개별 북마크 목록을 제공받을 수 있을 것이다. 이에 대한 상세한 설명은, 본 출원인에 의해서 1999년 6월 9일에 대한민국 특허청에 '온라인 북마크 목록 작성 방법'이란 제목으로 출원한 특허출원 제99-21307에 상세히 개시되어 있는 바, 본 실시예에서는 이를 참조 문헌으로 인용하기로 하며, 이에 대한 설명은 생략한다(S 10).
그와 같이, 개별 클라이언트 각각(PC1∼PC3(100/1∼3))으로부터 제공받은, 개별 북마크 목록의 일예가 도시된 도 3을 참조하면, 개별 사용자에 따라서, 도 3a 또는 도 3b에 도시된 바와 같이, 각 항목별로 세분화시켜 작성할 수도 있을 수도 있고, 도 3c에 도시된 바와 같이 각 북마크 정보(인터넷 주소)를 분류하지 않고 통합해서 작성할 수 도 있을 것이다. 이때, 도 3에 도시된 각 개별 북마크 목록의 최하위 항목은 편의상 '컴a' 등과 같이 표시되어 있으나, 인터넷 주소를 나타내고 있으며, 각 항목의 뒤에 첨부된 a, b, c…/1, 2, 3… 등은 각 인터넷 주소가 서로 다름을 의미한다.
S 10 단계에서, 각 클라이언트(PC1∼PC3(100/1∼3))로부터 개별 북마크 목록을 제공받은 서버(200)는, 그 개별 북마크 목록의 분류 항목(이하, '개별 분류 항목'이라 칭함)을 기설정된 표준 분류 항목에 의거해서 변환한다. 즉, 개별 북마크목록은 사용자 각각에 의해서 작성된 것이므로, 사용자의 선택에 따라서 개별 분류 항목이 '컴퓨터', '컴', 'PC', 'computer', …등과 같이 다양하게 작성될 수 있으므로 이에 대한 표준 분류 항목으로의 변환이 필요하다. 이때, 본 발명의 바람직한 실시예에서는, 약어, 유의어, 동의어 검색 과정이 수반되는 것이 바람직할 것이다. 예를 들어, '컴→컴퓨터'와 같은 약어 검색, 'PC→컴퓨터'와 같은 유의어 검색, 'computer→컴퓨터'와 같은 동의어 검색 등이 수반되는 것이 바람직할 것이다. 그 결과, 도 4에 도시된 바와 같이, 도3에 도시된 바와 같이 개별 분류 항목에 의해서 분류된 개별 북마크 목록의 북마크 정보(즉, 인터넷 주소) 각각을 표준 분류 항목에 의해서 분류된 상태로 변환할 수 있을 것이다. 한편, 다른 실시예에서는, 표준 분류 항목을 계위적으로 구성해서, 각 북마크 정보를 계위적 디렉토리로 구분할 수도 있을 것이다. 예를 들어, '컴a'라는 북마크 정보는 '컴퓨터>하드웨어>컴a'와 같이 분류할 수도 있을 것이다(S 20).
S 20 단계에서의 변환 과정이 완료되면, 서버(200)는 변환된 개별 북마크 목록을 하나의 목록으로 통합해서 통합 북마크 목록(즉, 본발명에 따른 검색 엔진용 데이터 베이스)을 작성한다.
즉, 서버(200)는 S 20 단계에서 각 북마크 정보(즉, 인터넷 주소)에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환되었는 지를 판단한다(S 30)
S 30 단계의 판단 결과, 각 북마크 정보의 개별 분류 항목 전체가 표준 분류 항목으로 변환되었으면, 해당 항목이 통합 북마크 목록에 존재하는 지를 판단한다. 예를 들어, 도 3a에 도시된 바와 같이 PC1(100/1)으로부터 제공받은 개별 북마크목록중 '컴a'의 경우, 그에 대응하는 개별 분류 항목인 'computer>hardware' 전체가 도 4a에 도시된 바와 같이 표준 분류 항목인 '컴퓨터>하드웨어'로 변환되었는 바, 컴퓨터 항목 및 하드웨어 항목이 통합 북마크 목록에 작성되어 있는지를 판단한다(S 40).
S 40 단계의 판단 결과, 해당 분류 항목이 작성되어 있지 않으면, 서버(200)는 해당 분류 항목을 작성하고, 그 작성된 항목에 북마크 정보, 즉, 해당 인터넷 주소를 기록한다. 예를 들어, 컴퓨터>하드웨어 항목을 통합 북마크 목록의 분류 항목으로 작성하고, 하드웨어 항목에 컴a를 기록한다(S 50).
한편, S 50 단계의 판단 결과, 해당 분류 항목이 작성되어 있으면, 서버(200)는 해당 분류 항목에 동일한 북마크 정보가 있는 지를 판단한다. 예를 들어, 컴b의 경우 '컴퓨터>하드웨어' 항목이 작성되어 있으므로, 하드웨어 항목에 동일 주소가 있는지를 판단한다(S 60).
S 60 단계의 판단 결과, 해당 분류 항목에 동일한 북마크 정보가 있으면, 서버(200)는 그 북마크 정보의 빈도수를 1만큼 증가 시키고(S 70), 해당 분류 항목에 동일한 북마크 정보가 없으면 그 북마크 정보를 해당 분류 항목에 기록한다. 상술한 예의 경우, 컴b는 하드웨어 목록에 없을 것이므로 '하드웨어'라는 분류 항목에 '컴b'라는 북마크 정보를 기록하지만, 만일 '컴a'와 같이 기존에 기록된 북마크 정보가 있으면, '컴a'의 발생 빈도수를 1만큼 증가 시킨다(S 80).
각 북마크 정보에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환된 경우에는 상술한 S 40 내지 S 80 단계에 의거하여 통합 북마크 목록으로 작성되지만, 어느 하나의 항목이라도 표준 분류 항목으로 변환되지 않은 경우에는 다음 단계에 의거하여 통합 북마크 목록으로 작성된다.
즉, 상술한 S 30 단계의 판단 결과, 각 북마크 정보의 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않았으면, 서버(200)는 그 개별 분류 항목의 일부라도 표준 분류 항목으로 변환되었는 지를 판단한다(S 90).
S 90 단계의 판단 결과, 개별 분류 항목의 일부라도 표준 분류 항목으로 변환되었으면, 표준 분류 항목으로 변환된 항목중 최 하위 항목과 일치하는 분류 항목을 검색해서 S 40 단계 이하를 수행한다. 예를 들어, 도 3b와 같이 PC2(100/2)로부터 제공받은 개별 북마크 목록에 포함되어 있는 '컴a'의 경우는, 도 4b에 도시된 바와 같이 '컴'이라는 항목은 '컴퓨터'로 'H/W'라는 항목은 '하드웨어'로 변환되었지만, 'My'라는 항목은 변환되지 않았다. 이때, 표준 분류 항목으로 변환된 최 하위 항목은 '하드웨어'라는 항목이므로, 서버(200)는 하드웨어라는 항목을 검색해서 S 40 단계 이하를 수행한다. 즉, 상술한 S 40 단계와 같이, 최 하위 항목에 일치되는 분류 항목의 기작성 여부를 판단하고, 그 판단 결과에 의거하여 상술한 S 40 단계 이하의 과정을 수행하게 된다(S 100).
각 북마크 정보에 대응하는 개별 분류 항목중 일부만이 표준 분류 항목으로 변환된 경우, 즉, 개별 분류 항목중 어느 하나의 항목이라도 표준 분류 항목으로 변환되지 않은 경우에는 상술한 S 90 단계 및 S 100 단계에 의해서 통합 북마크로 작성되지만, 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않은 경우, 또는 도 3c에 도시된 바와 같이 개별 북마크 목록 자체에 개별 분류 항목이 없는 경우에는 이하의 과정에 의거하여 통합 북마크 목록으로 작성된다.
먼저, S 90 단계의 판단 결과, 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않았으면, 서버(200)는 S 30 내지 S 100의 과정을 통해서 기 작성된 통합 북마크 목록에서 동일 북마크 정보(즉, 인터넷 주소)가 있는 지를 검색한다(S 110).
S 110 단계의 검색 결과, 통합 북마크 목록에서 동일 북마크 정보(즉, 인터넷 주소)가 있으면, 서버(200)는 동일 북마크 정보가 기록된 항목이 다수 개 인지를 판단한다. 즉, 하나의 인터넷 주소는 다수 개의 분류 항목에 중복될 수 있는 바, 예를 들어, 'game1'이란 인터넷 주소는 '컴퓨터>소프트웨어'의 항목에 포함될 수도 있지만, '게임>시뮬레이션 게임'이라는 항목에 포함될 수도 있을 것이다(S 120).
S 120 단계의 판단 결과, 동일 북마크 정보가 포함된 분류 항목이 하나라면, 그 분류 항목에 포함된 북마크 정보의 빈도수를 1만큼 증가시키고(S 130), 동일 북마크 정보가 하나 이상의 분류 항목에 포함되어 있으면, 서버(200)는 동일 계위 분류 항목에 포함되어 있는 지를 판단한다. 상술한 예의 경우, 컴퓨터와 게임은 제 1 계위로서 동일 계위가 될 것이고, 소프트 웨어와 시뮬레이션 게임은 제 2 계위로서 동일 계위가 될 것이다(S 140).
S 140 단계의 판단 결과, 동일 북마크 정보를 포함하고 있는 다수의 분류 항목이 모두 동일 계위라면, 서버(200)는 각 분류 항목에 포함된 북마크 정보의 빈도수를 판단하여, 동일 북마크 정보에 대해서 최고 빈도수를 갖는 분류 항목에 포함된 북마크 정보의 빈도수를 1만큼 증가 시킨다. 상술한 예의 경우, 소프트 웨어에 포함된 game1의 빈도수가 3이고, 시뮬레이션 게임에 포함된 game1의 빈도수가 5라면, 소프트 웨어와 시뮬레이션 게임은 동일 계위이므로, 시뮬레이션 게임에 포함된 game1의 빈도수를 1만큼 증가 시킨다. 물론 다른 예에서는, 모든 분류 항목에 포함된 game1의 빈도수를 1씩 증가시킬 수도 있지만, 보다 정확한 통계를 위해서 최고 빈도수를 갖는 game1의 빈도수만을 증가시키는 것이 바람직할 것이다(S 150).
한편, S 140 단계의 판단 결과, 동일 북마크 정보를 포함하고 있는 다수의 분류 항목이 서로 다른 계위라면, 최 하위 계위를 갖는 분류 항목에 포함된 북마크 정보의 빈도수를 1만큼 증가시킨다. 예를 들어, 게임이라는 항목에 game1이라는 북마크 정보가 포함되어 있고, 소프트 웨어 항목에도 game1이라는 북마크 정보가 포함되어 있다면, 게임은 제 1 계위고 소프트 웨어는 제 2 계위이므로, 보다 낮은 계위를 갖는 소프트 웨어 항목에 포함된 game1의 빈도수를 증가 시킴으로써, 보다 세분화된 통합 북마크 목록(즉, 데이터 베이스)를 얻을 수 있을 것이다(S 160).
한편, S 110 단계의 검색 결과, 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않은 북마크 정보와 동일한 북마크 정보가, S 30 내지 S 100의 과정을 통해서 기 작성된 통합 북마크 목록에서 검색되지 않으면, 서버(200)는 기타 항목을 작성하고, 그 작성된 기타 항목에 해당 북마크 정보를 기록한다(S 170).
상술한 S 30 내지 S 170 단계를 통해서 도 5에 도시된 바와 같은, 통합 북마크 목록, 즉, 데이터 베이스를 구축할 수 있을 것이다. 그와 같은 데이터 베이스 구축 과정중에서, 통합 북마크 목록 작성 과정은, 각 북마크 정보의 분류 효율을증진시키기 위해서, 통합 북마크 목록의 분류 항목(이하, 통합 분류 항목이라 칭함)을 표준 분류 항목에 의거하여 기작성해서 사용하거나, 접속 횟수 등에 의해서 서퍼(sufer)를 자체 분류한 정보에 의거하여, 전문가로부터 제공받은 개별 북마크 목록으로부터 비전문가로부터 제공받은 개별 북마크 목록 순으로 통합 북마크 목록으로 정렬하는 것이 보다 바람직할 것이다.
상술한 과정에 의해서 통합 북마크 목록의 작성이 완료되면(S 180), 서버(200)는 현재 시간이 기설정된 시간에 도달하는 지를 체크한다. 이때, 기설정된 시간은, 표준 시간(예를 들어, 00:00)으로 설정될 수도 있고, 이전 통합 북마크 목록이 작성된 시간으로부터의 경과 시간(예를 들어, 24시간 단위)으로 설정될 수도 있을 것이다(S 190).
S 190 단계의 체크 결과, 기설정된 시간에 도달하면, 서버(200)는 상술한 S 10 내지 S 170 단계를 반복 수행하여, 신규 통합 북마크 목록을 작성함으로써, 기존 통합 북마크 목록을 갱신한다. 예를 들어, 기설정된 시간에 도달하면, 서버(200)는 개별 저장 영역에 저장되어 있는 각 개별 북마크 목록을 취합하여 상술한 S 10 내지 S 170 단계를 반복하여 신규 통합 북마크 목록을 작성할 수 있을 것이다. 이때, 각 개별 저장 영역에 저장되어 있는 개별 북마크 목록은 기설정된 시간(예를 들어, 24시간 동안) 각 사용자에 의해서 갱신된 북마크 정보를 담고 있을 것이다. 한편, 그 기설정된 시간 동안 모든 사용자가 북마크 정보를 갱신할 확율은 매우 적을 것이므로, 다른 실시예에서는, 개별 북마크 정보가 갱신됨과 그 갱신된 개별 북마크 정보를 체크한 후, 기설정된 시간에 도달하면, 갱신된 것으로 체크되는 개별 북마크 정보의 갱신된 부분을 분석하고, 그 분석 정보에 의거하여 통합 북마크 목록을 갱신할 수도 있을 것이다(S 200).
상술한 S 200 단계가 완료되면, 서버(200)는 기존 통합 북마크 목록과 신규 통합 북마크 목록을 비교하고, 그 비교 결과를 새로운 항목으로 작성하여, 갱신 정보를 사용자에게 제공할 수도 있을 것이다. 예를 들어, 기설정된 시간동안 최고 빈도수 변화율을 보인 북마크 정보 순으로 정렬하거나, 새로 포함된 신규 북마크 정보를 별도의 항목에 포함시켜, 사용자에게 제공할 수도 있을 것이다(S 210).
상술한 본 발명에 따르면, 사용자에 의해서 선택된 북마크 정보들을 분류, 통합한 통합 북마크 정보를 데이터 베이스로 작성함으로써, 종래의 검색 엔진에서의 검색 서비스와 비교할 때, 사용자로하여금 필요한 정보를 보다 손쉽고 빠르게 검색할 수 있도록 할 수 있도록 하면서도 종래보다 유용한 정보를 제공할 수 있는 장점이 있다.

Claims (6)

  1. 인터넷 사이트를 검색해주는 검색 엔진용 데이터베이스를 구축하는 방법에 있어서,
    다수의 사용자 각각에 의해서 작성된 개별 북마크 목록들을 제공받는 단계;
    상기 개별 북마크 목록의 분류 항목을 기설정된 표준 분류 항목으로 변환하는 단계;
    상기 표준 분류 항목에 의거하여 상기 개별 북마크 목록을 통합하는 단계;
    기설정된 시간마다 상기 단계를 반복해서 통합된 북마크 목록을 갱신하는 단계를 포함하는 것을 특징으로 하는 검색 엔진용 데이터베이스 구축 방법.
  2. 제 1 항에 있어서, 상기 개별 북마크 목록을 통합하는 단계는,
    상기 북마크 정보 각각에 대응하는 개별 분류 항목이 표준 분류 항목으로 변환된 정보를 판단하는 과정;
    상기 북마크 정보 각각에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환된 북마크 정보들을 통합 북마크 목록으로 작성하는 과정;
    상기 북마크 정보 각각에 대응하는 개별 분류 항목의 일부가 표준 분류 항목으로 변환된 북마크 정보들을 통합 북마크 목록으로 작성하는 과정;
    상기 북마크 정보 각각에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않은 북마크 정보들을 통합 북마크 목록으로 작성하는 과정이 순차적으로 이루어지는 것을 특징으로 하는 검색 엔진용 데이터 베이스 구축 방법.
  3. 제 2 항에 있어서, 상기 북마크 정보 각각에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환된 북마크 정보들을 통합 북마크 목록으로 작성하는 과정은,
    표준 분류 항목으로 변환된 해당 분류 항목이 통합 북마크 목록 내에 작성되어 있는 지를 판단하는 과정;
    상기 분류 항목이 작성되어 있지 않으면 상기 분류 항목을 통합 북마크 목록의 분류 항목으로 작성하고, 상기 작성된 분류 항목에 해당 북마크 정보를 기록하는 과정;
    상기 분류 항목이 작성되어 있으면, 상기 분류 항목내에 해당 북마크 정보와 동일한 북마크 정보가 있는 지를 판단하는 과정;
    상기 분류 항목내에 해당 북마크 정보와 동일한 북마크 정보가 있으면, 상기 북마크 정보의 빈도수를 1만큼 증가시키고, 동일 북마크 정보가 없으면 새로 기록하는 과정으로 이루어지는 것을 특징으로 하는 검색 엔진용 데이터 베이스 구축 방법.
  4. 제 2 항에 있어서, 상기 북마크 정보 각각에 대응하는 개별 분류 항목의 일부가 표준 분류 항목으로 변환된 북마크 정보들을 통합 북마크 목록으로 작성하는 과정은,
    상기 표준 분류 항목으로 변환된 분류 항목중 최 하위 항목에서부터 역 계위 순으로 통합 북마크 목록의 분류 항목에 일치되는 분류 항목이 포함되어 있는 지를 판단하는 과정;
    상기 과정의 판단결과 최 상위 항목까지 일치하는 분류 항목이 상기 통합 북마크 목록 내에 포함되어 있지 않으면, 상기 분류 항목을 통합 북마크 목록의 분류 항목으로 작성하고, 상기 작성된 분류 항목에 해당 북마크 정보를 기록하는 과정;
    상기 과정의 판단결과 일치하는 분류 항목이 상기 통합 북마크 목록 내에 포함되어 있으면, 상기 분류 항목내에 해당 북마크 정보와 동일한 북마크 정보가 있는 지를 판단하는 과정;
    상기 분류 항목내에 해당 북마크 정보와 동일한 북마크 정보가 있으면, 상기 북마크 정보의 빈도수를 1만큼 증가시키고, 동일 북마크 정보가 없으면 새로 기록하는 과정으로 이루어지는 것을 특징으로 하는 검색 엔진용 데이터 베이스 구축 방법.
  5. 제 2 항에 있어서, 상기 북마크 정보 각각에 대응하는 개별 분류 항목 전체가 표준 분류 항목으로 변환되지 않은 북마크 정보들을 통합 북마크 목록으로 작성하는 과정은,
    상기 북마크 정보와 동일한 북마크 정보가 상기 과정에 의해서 기 작성된 통합 북마크 목록에 포함되어 있는지를 판단하는 과정;
    상기 통합 북마크 목록에 동일 북마크 정보가 포함되어 있으면, 상기 동일북마크 정보의 빈도수를 1만큼 증가시키고, 동일 북마크 정보가 포함되어 있지 않으면, 기타 항목에 상기 북마크 정보를 기록하는 것을 특징으로 하는 검색 엔진용 데이터 베이스 구축 방법.
  6. 제 5 항에 있어서, 상기 통합 북마크 목록내에 동일한 북마크 정보를 포함하는 분류 항목이 다수 개 있을 경우,
    상기 다수 개의 분류 항목이 서로 다른 계위면, 상호 분류 항목중 최하위 분류 항목의 북마크 정보에 대응하는 빈도수를 증가시키고,
    상기 다수 개의 분류 항목이 상호 동일 계위면, 빈도수가 높은 분류 항목내의 북마크 정보에 대응하는 빈도수를 증가시키는 것을 특징으로 하는 검색 엔진용 데이터 베이스 구축 방법.
KR1019990028635A 1999-07-15 1999-07-15 검색 엔진용 데이터베이스 구축 방법 KR100359232B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1019990028635A KR100359232B1 (ko) 1999-07-15 1999-07-15 검색 엔진용 데이터베이스 구축 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019990028635A KR100359232B1 (ko) 1999-07-15 1999-07-15 검색 엔진용 데이터베이스 구축 방법

Publications (2)

Publication Number Publication Date
KR20010009980A KR20010009980A (ko) 2001-02-05
KR100359232B1 true KR100359232B1 (ko) 2002-11-01

Family

ID=19601973

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990028635A KR100359232B1 (ko) 1999-07-15 1999-07-15 검색 엔진용 데이터베이스 구축 방법

Country Status (1)

Country Link
KR (1) KR100359232B1 (ko)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100625423B1 (ko) * 1999-12-13 2006-09-18 주식회사 케이티 디렉토리별 갱신주기 변경 방법
KR20020003959A (ko) * 2000-06-28 2002-01-16 전병국 분류 구조 및 분류명 일치용 데이터 베이스 운용장치
KR20030085622A (ko) * 2002-04-29 2003-11-07 이세룡 사용자의 입력이나 조작이 필요 없는 인터넷 웹페이지즐겨찾기 공유와 이를 이용한 검색 데이타베이스화 방법

Also Published As

Publication number Publication date
KR20010009980A (ko) 2001-02-05

Similar Documents

Publication Publication Date Title
Berendt et al. Analysis of navigation behaviour in web sites integrating multiple information systems
US7523095B2 (en) System and method for generating refinement categories for a set of search results
US6334131B2 (en) Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures
CA2288745C (en) Method and apparatus for searching a database of records
Godin et al. Experimental comparison of navigation in a Galois lattice with conventional information retrieval methods
US7428533B2 (en) Automatic generation of taxonomies for categorizing queries and search query processing using taxonomies
EP1342177A1 (en) Method for structuring and searching information
WO2003098477A1 (en) Search and presentation engine
JP3849318B2 (ja) 情報検索装置、情報検索方法及び情報検索プログラムを記録したコンピュータ読み取り可能な記録媒体
Agosti et al. Information retrieval on the web
KR100359232B1 (ko) 검색 엔진용 데이터베이스 구축 방법
KR20020089677A (ko) 문서 자동 분류 방법 및 이를 수행하기 위한 시스템
KR100359231B1 (ko) 웹 사이트 정보 제공 방법
KR20020032060A (ko) 근접 검색식을 이용한 정보 검색 시스템 및 방법
Turetken Visualization support for managing information overload in the web environment
JPH10162011A (ja) 情報検索方法、情報検索システム、情報検索端末装置および情報検索装置
Meyyappan et al. Design and development of a user-centred digital library system: some basic guidelines
LaBrie et al. Dynamic hierarchies for business intelligence information retrieval
Hopkins et al. Beyond keywords and hierarchies
Al-Chalabi et al. A Theme-based Search Technique
Cragg et al. Developing a domain specific Web portal: Web mining to create e-business
EP1208470A1 (en) Method and system for creating a topical data structure
Maroun Experimenting with HITS based Algorithms with new Heuristics for assigning the link weights
Pardakhe et al. Enhancement of the Web Search Engine Results using Page Ranking Algorithm
Jiang Dynamically updating UIDB to implement personalized service

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
LAPS Lapse due to unpaid annual fee