KR100318015B1 - 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법 - Google Patents

웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법 Download PDF

Info

Publication number
KR100318015B1
KR100318015B1 KR1019980044274A KR19980044274A KR100318015B1 KR 100318015 B1 KR100318015 B1 KR 100318015B1 KR 1019980044274 A KR1019980044274 A KR 1019980044274A KR 19980044274 A KR19980044274 A KR 19980044274A KR 100318015 B1 KR100318015 B1 KR 100318015B1
Authority
KR
South Korea
Prior art keywords
search
key words
web document
word
key
Prior art date
Application number
KR1019980044274A
Other languages
English (en)
Other versions
KR20000026646A (ko
Inventor
김기태
배환국
Original Assignee
박화자
소프트캠프(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박화자, 소프트캠프(주) filed Critical 박화자
Priority to KR1019980044274A priority Critical patent/KR100318015B1/ko
Priority to US09/422,800 priority patent/US6226645B1/en
Publication of KR20000026646A publication Critical patent/KR20000026646A/ko
Application granted granted Critical
Publication of KR100318015B1 publication Critical patent/KR100318015B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F15/00Digital computers in general; Data processing equipment in general
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99941Database schema or data structure
    • Y10S707/99944Object-oriented database structure
    • Y10S707/99945Object-oriented database structure processing

Abstract

본 발명은 인터넷 검색방법에 관한 것으로서,
링크된 웹 문서들을 방문하여 그 웹 문서에 포함되어 있는 핵심어와 그 핵심어에 관한 내용을 검출하여 저장하는 하이퍼링크 정보 검출과정과;
검출된 하이퍼링크의 핵심어와 그 핵심어들에 관한 내용들을 데이타 베이스화 하여 인덱스를 구축하는 인덱스 구축과정과;
검색어가 입력되면, 입력된 검색어와 하이퍼링크로 연결된 핵심어들을 검출하고, 검출된 핵심어들 상호간의 연결강도에 따라 소정의 개념도를 구성하여 화면의 일부분에 출력하고, 그 나머지 부분에는 개념도를 구성하는 핵심어들의 자세한 내용을 볼 수 있도록 하기 위해 핵심어에 대한 주소와 내용을 표기한 자료화면을 출력하는 검색어 처리과정;
으로 진행되는 것을 특징으로 하여 웹 문서에 기재된 핵심어를 검출하고, 검출된 핵심어들 간의 하이퍼링크 연결관계를 고려하여 사용자가 입력한 검색어와 연관된 핵심어들로 이루어진 개념도를 구성하여 제공하므로서, 사용자가 찾고자 하는 정보를 보다 신속하고 정확하게 검색할 수 있도록 한 웹 문서의 하이퍼링크 정보를 이용한 인터넷 검색방법에 관한 것이다.

Description

웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통한 인터넷 검색방법
본 발명은 인터넷 검색방법에 관한 것으로서, 특히 웹 문서에 기재된 핵심어를 검출하고, 검출된 핵심어들 간의 하이퍼링크 연결관계를 고려하여 사용자가 입력한 검색어와 연관된 핵심어들로 이루어진 개념도를 구성하여 제공하므로서, 사용자가 찾고자 하는 정보를 보다 신속하고 정확하게 검색할 수 있도록 한 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통한 인터넷 검색방법에 관한 것이다.
인터넷은 정보의 바다라고 할 수 있을 정도로 방대한 양의 정보가 산재되어 있으며, 많은 사람들이 인터넷을 통해 다양한 정보를 얻고 있다.
현재의 인터넷은 각 개인이나 단체에서 만들어 놓은 웹 문서(홈페이지)들이 상호 연결되어 이루어지며, 사용자들은 상호 연결되어 있는 웹 문서를 통해 정보를 얻고 있는 것이다.
상기 웹 문서는 하이퍼 텍스트(Hyper Text)로 구성되어 있는데, 하이퍼 텍스트란 현재 검색하여 화면상에서 보고 있는 문서의 내용 중 좀더 자세히 알기를 원하는 곳(핵심어: 밝게 표시된 문자 혹은 이미지)을 마우스로 클릭하면 그와 관련된 다른 자료를 검색할 수 있게 해주는 특징을 갖고 있으며, 상기 설명과 같이 다른 문서로의 연결을 하이퍼 링크(Hyper Link)라고 한다.
즉, 서로 연관성이 있는 핵심어를 갖는 웹 문서들은 상호간에 하이퍼 링크되어 있는 것이다.
이러한 인터넷을 통해 사용자가 정보를 검색하기 위해서는 사용자가 입력한검색어와 연관된 정보를 찾아주는 별도의 검색시스템을 이용해야 하며, 현재 사용되고 있는 검색 시스템의 정보 검색방법으로는 핵심어(Keyword) 검색방법, 계층적 디렉토리(Hierarchical Directory) 검색방법, 메타(Meta) 검색방법 등이 사용되고 있다.
상기 핵심어 검색방법은 해당 시스템이 인터넷 상에 산재해 있는 웹 문서(홈 페이지)들을 모아오면, 검색 시스템이 웹 문서들을 핵심어를 중심으로 인덱싱 (Indexing)하여 분류한다.
이때, 사용자가 찾고자 하는 검색어를 입력하면, 검색시스템은 검색어가 들어 있는 웹 문서들을 찾아 사용자에게 보여주는 것으로, 이와같은 핵심어 검색방법은 특정 사실(검색어)을 포함한 문서를 찾는데는 매우 유용하나, 해당 검색어가 포함된 웹 문서가 많은 경우에는 원하는 정보를 찾는데 많은 시간이 소요되는 문제점이 있으며, 또한, 검색어에 대한 중의어와 동의어의 경우는 검색하지 못하고, 데이타 베이스에 저장해야 하는 정보의 양이 너무 많아지는 문제점을 갖고 있다.
상기 계층적 디렉토리 검색방법은 단순한 핵심어의 인덱싱이 아닌 사람이 직접 웹 문서의 주제에 따라 분류하는 방법으로, 사용자가 찾고자 하는 정보를 큰 주제에서 소 주제로 범위를 줄여가며 쉽게 찾을 수 있는 장점을 갖고 있으나, 이와같은 히라치 검색방법은 링크되는 웹 문서들을 주제별로 취합, 분류, 설명하는데 막대한 인력이 요구되는 문제점이 있다.
상기 메타 검색방법은 하나의 검색 시스템이 갖고 있는 정보의 양은 한정되 있으므로 사용자가 필요로 하는 정보를 찾기 위해서 여러개의 검색 시스템을 사용하여 정보를 질의하고, 그 검색결과를 종합하여 하나로 보여주는 방법이다.
이러한 메타 검색방법은 여러개의 검색 시스템을 방문하는 번거로움을 없앴으나 실제 검색된 결과를 모두 보여주지 못하는 문제점을 갖고 있다.
따라서, 상기 문제점을 해결하기 위한 본 발명은 웹 문서에 기재된 핵심어를 검출하고, 검출된 핵심어들 간의 하이퍼링크 연결관계를 고려하여 사용자가 입력한 검색어와 연관된 핵심어들로 이루어진 개념도를 구성하여 제공하므로서, 사용자가 찾고자 하는 정보를 보다 신속하고 정확하게 검색할 수 있도록 한 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구성과 이를 통한 인터넷 검색방법을 제공함을 목적으로 한다.
상기 목적달성을 위한 본 발명의 특징은,
인터넷 상에서 사용자가 원하는 정보를 얻기 위해 입력한 검색어와 연관된 키워드를 갖는 웹사이트를 검색하여 사용자에게 표시해주는 검색방법에 있어서,
인텃넷에 링크된 웹문서들을 검색하여 임의의 제 1 웹문서에 포함된 핵심어가 임의의 제 2 웹문서에 하이퍼링크로 연결되어있을때 상기 핵심어를 제 2 웹문서의 키워드추출에 이용하기 위해 검출하는 일련의 검색과정을 전체 웹문서들에 대해 실행하여 웹문서 검색을 위한 핵심어들을 검출하여 제 1 메모리(2)에 저장하는 하이퍼링크 정보 검출과정과;
상기 제 1 메모리(2)에 저장된 핵심어들이 포함되어있는 웹문서들과 다른 웹문서들과의 하이퍼링크 연결관계를 이용하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하여 제 2 메모리(4)에 저장하되, 검출된 각각의 웹문서들은 자신이 가지고 있는 핵심어들을 가리키도록 하고, 또한 자신에게서 하이퍼링크로 연결되어 있는 다른 웹문서를 가리키도록하며, 상기 검출된 각각의 핵심어들은 자신이 존재하는 웹문서들을 가리키도록 하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하는 인덱스 구축과정과;
사용자가 검색어를 입력하면, 제 2 메모리(4)에 저장되어있는 자료를 검색하여 사용자가 입력한 검색어와 동일한 핵심어를 검출하고, 검출된 핵심어가 하이퍼링크로 여녈된 다른 웹문서의 핵심어를 검출하여 사용자가 입력한 핵심어에 대한 검색영역을 점차 넓혀나가며, 상기 과정에서 검출된 핵심어들간의 연결강도에 따라 검색어를 중심으로 이 검색어와 연결관계를 갖는 핵심어들을 나열하고 선으로 연결한 개념도를 구성하여 화면에 일부분에 표시하고, 그 나머지 부분에는 개념도를 구성하는 핵심어들의 자세한 내용을 볼 수 있도록 하기위해 핵심어에 대한 주소와 내용을 표기한 자료화면을 표시하는 검색어 처리과정; 으로 진행되는 것을 특징으로 한다.
그리고, 복수개의 웹문서에 포함되어 있는 각각의 핵심어가 제 3 의 웹문서에 하이퍼링크로 연결될때, 그 몬든 핵심어들을 제 3 의 웹문서 검색에 필요한 핵심어로서 검출하여 제 1 메모리(2)에 저장시키는 것을 특징으로 하고,
검색어와 검출된 핵심어들간의 연결강도 표시는 출력되는 핵심어들의 내부원의 크기로 나타내는 것을 특징으로 하며,
제 2 메모리에 검색되어 저장된 웹문서 전체에서 각각의 핵심어들이 출현한빈도수를 제 2 메모리에 저장하고, 이를 이용하여 검색어와 검출된 핵심어들간의 연결관계를 표시할 때 출력되는 핵심어의 외부원의 크기로 나타내는 것을 특징으로한다.
도 1 은 본 발명의 인터넷 검색방법을 구현하기 위한 하드웨어 구성을 보인 블럭도.
도 2 는 본 발명의 인터넷 검색방법의 작동과정을 보인 플로우챠트.
도 3 은 핵심어들 간의 연결강도를 설명하기 위한 도면.
도 4 는 핵심어들 간의 상관관계를 보인 도면.
도 5 는 본 발명에 의해 화면 표시된 개념도를 보인 도면.
도 6 은 본 발명의 다른 실시예를 보인 도면.
※ 도면의 주요부분에 대한 부호의 설명
1: 핵심어 검출부 2: 제 1 메모리
3: 인덱서 4: 제 2 메모리
5: 검색어 처리부 6: 웹 서버
7: 유저 시스템 S: 외부원
C: 내부원
이하, 첨부된 도면 도 1 내지 도 6 을 참조하여 본 발명의 바람직한 실시예를 설명하면 다음과 같다.
도 1 은 본 발명의 인터넷 검색방법을 구현하기 위한 하드웨어적 구성을 보인 블럭도로서, 인터넷에 산재해 있는 웹 문서들로부터 그 웹 문서에 포함되어 있는 핵심어와 이 핵심어의 내용을 검출하는 핵심어 검출부(1)와, 상기 핵심어 검출부(1)에서 검출된 정보를 저장하는 제 1 메모리(2)와, 상기 제 1 메모리(2)에 저장된 핵심어와 그 핵심어들에 관한 내용들을 데이타베이스화 하여 인덱스를 구축하는 인덱서(3)와, 인덱싱된 정보를 저장하는 제 2 메모리(4)와, 검색어 입력시 제 2 메모리(4)에 저장되어 있는 정보중 검색어와 하이퍼링크로 연결된 핵심어들을 검출하고, 검출된 핵심어들 상호간의 하이퍼링크 연결강도에 따라 소정의 개념도를 구성하는 검색어 처리부(5)와, 유저 시스템(7)과 교신하여 상기 검색어 처리부(5)에서 처리된 개념도를 유저 시스템(7)에 제공하는 웹 서버(6)로 구성된다.
이와같이 구성된 검색 시스템에 의해 구현되는 본 발명의 인터넷 검색방법을 설명하면 다음과 같다.
◆ 하이퍼링크 정보 검출과정◆
하이퍼링크 정보 검출과정은 인터넷에 산재해 있는 웹 문서들로부터 각각의웹 문서에 포함되어 있는 핵심어들을 검출하여 저장하는 과정으로서,
핵심어 검출부(1)가 웹 문서들을 방문하여 그 웹 문서에 포함되어 있는 핵심어를 검출하고, 이 핵심어의 내용을 제 1 메모리(2)에 저장한다.
즉, 핵심어 검출부(1)는 인터넷에 링크된 웹문서들을 검색하여 임의의 제 1웹문서에 포함된 핵심어가 임의의 제 2 웹문서에 하이퍼링크로 연결되어 있을때 상기 핵심어를 제 2 웹문서의 키워드추출에 이용하기 위해 검출하는 것이며, 이러한 일련의 검색과정을 전체 웹문서들에 대해 실행하여 웹문서 검색을 위한 핵심어들을 검색하여 제 1 메모리(2)에 저장하는 것이다.
또한, 상기 검색과정에서 복수개의 웹문서에 포함되어 있는 각각의 핵심어가 제 3 의 웹문서에 하이퍼링크로 연결될때, 그 모든 핵심어들을 제 3 의 웹문서 검색에 필요한 핵심어로서 검출하여 이역시 제 1 메모리(2)에 저장한다.
◆인덱스 구축과정◆
인덱스 구축과정은 상기 검출된 핵심어와 웹문서들간의 연결관계를 구축하는것으로서, 그 동작은 인덱서(3)에 의해 구현된다.
즉, 상기 인덱서(3)가 제 1 메모리(2)에 저장된 핵심어들이 포함되어 있는 웹문서들과 다른 웹문서들과의 하이퍼링크 연결관계를 이용하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하여 제 2 메모리(4)에 저장하는 것이다.
이때, 상기 검출된 각각의 웹문서들은 자신이 가지고 있는 핵심어들을 가리키도록 하고, 또한 자신에게서 하이퍼링크로 연결되어 있는 다른 웹문서를 가리키도록 하며, 상기 검출된 각각의 핵심어들은 자신이 존재하는 웹문서들을 가리키도록 하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하는 것이다.
◆검색어 처리과정◆
검색어 처리과정은 사용자가 입력한 검색어와 연관된 핵심어들을 검출하고, 검출된 핵심어들의 하이퍼링크 연결강도에 따라 소정의 개념도를 구성하여 사용자에게 제공하는 과정이다.
즉, 사용자가 유저 시스템(7)을 이용하여 인터넷 상에서 정보를 얻기 위해 소정의 검색어를 입력하면, 웹 서버(6)는 입력된 검색어를 검색어 처리부(5)로 전송하여 입력된 검색어에 관계된 개념도를 요구한다.
상기 웹 서버(6)로부터 검색어를 입력받은 검색어 처리부(5)는 제 2 메모리 (4)에 저장되어 있는 핵심어들 중 검색어와 동일하거나 검색어를 포함하는 핵심어를 검출하고, 검출된 핵심어로부터 하이퍼링크로 연결된 다른 핵심어들을 검출하며, 이와같은 핵심어 검출동작을 반복하여 검색어에 대한 검색영역을 넓혀 나간다.
즉, 사용자가 검색어를 입력하면, 제 2 메모리(4)에 저장되어 있는 자료를 검색하여 사용자가 입력한 검색어와 동일한 핵심어를 검출하고, 검출된 핵심어가 하이퍼링크로 연결된 다른 웹문서의 핵심어를 검출하여 사용자가 입력한 핵심어에 대한 검색영역을 점차 넓혀나가는 것이다.
상기 검색동작에 의해 검출된 핵심어들간의 연결강도에 따라 검색어를 중심으로 이 검색어와 연결관계를 갖는 핵심어들을 나열하여 선으로 연결하되, 상기 검출된 핵심어들의 연결강도를 고려하여 도 5 와 같은 개념도를 구성하여 웹서버(6)를 통해 유저 시스템(7)으로 공급하는데,
이때, 유저시스템(7)의 화면 상단에는 도 5 와 같은 개념도가 출력되고, 그 화면 하단에는 개념도를 구성하는 핵심어들의 인터넷주소와 내용이 표기된 자료화면이 출력므로서, 사용자는 자신이 입력한 검색어에 연관된 정보를 개념도 형태로 얻을 수 있을 뿐만 아니라 개념도에 나타난 핵심어의 자세한 내용을 화면 아래에 표기된 자료화면을 통해 신속히 제공받을 수 있게되는 것이다.
개념도를 구성할 때, 검색어 처리부(5)는 검색어에 대해 검출된 핵심어들 상호간의 연결강도에 따라 개념도를 구성하는데, 이때, 소정의 임계값을 설정하여 연결강도가 임계값을 넘는 핵심어들로 개념도를 구성한다.
연결강도는 핵심어들 간의 하이퍼링크로 연결된 횟수를 나타내는 것인데, 예를들어 도 3 에 도시된 바와같이 핵심어A를 포함하는 웹 문서A와 핵심어B를 포함하는 웹 문서B 사이에서 핵심어A와 핵심어B 간에 3개의 하이퍼링크 연결이 존재한다면 이 핵심어A와 핵심어B 상호간의 연결강도는 '3'이 되는 것이다.
따라서, 핵심어들간에 연결강도가 높다(하이퍼링크 연결횟수가 많다)는 것은 핵심어들간의 연관도가 높다는 것을 의미한다.
한편, 개념도 상에서의 개념관계는 gen-spec 관계와 대등관계로 나눌 수 있는데, gen-spec 관계는 도 4a 와 같이 핵심어A에서 핵심어B로의 하이퍼링크가 연결된 상태를 말하며, 이와같은 상태는 도 4b 와 같이 핵심어A가 핵심어B를 포함하는 상태 즉, 핵심어A가 핵심어B의 상위개념이거나 일반적인 개념임을 나타낸다.
또한, 대등관계는 도 4c 와 같이 핵심어A와 핵심어B 상호간에 서로 엇갈리도록 하이퍼링크가 연결된 상태를 말하며, 이와같은 상태는 핵심어A와 핵심어B가 서로 동의어, 중의어, 또는 반대어인 경우를 나타낸다.
도 5 는 사용자가 '의료정보'라는 검색어를 입력하였을 때, 본 발명의 인터넷 검색방법에 의해 구성된 개념도를 도시한 것으로서,
'의료정보'와 하이퍼링크로 연결된 서울대학병원, 중앙대학병원, 연세대의료원, 서울중앙병원, 가정의학, 에이즈 등의 핵심어가 화살표에 의해 연결 도시되고, 상기 '가정의학'과 하이퍼링크 연결된 당뇨병, 유방암 등의 핵심어가 '가정의학'으로부터 화살표로 연결 도시되어 있다.
그리고, 상기 '의료정보'와 대등관계에 있는 '종합의료정보'가 양방향 화살표로 연결 도시되어 있고, 상기 '종합의료정보'와 gen-spec 관계에 있는 대한의학회, 응급실, 전화번호, 클리닉, AI, MEDIA 등의 핵심어가 화살표에 의해 연결도시되며, 상기 핵심어 '클리닉'과 또다른 gen-spec 관계에 있는 직장인, 건강, 안관, 피부과, 치과 등의 핵심어가 '클리닉'으로부터 화살표에 의해 연결 도시되어 있다.
이에따라, 여러가지 질병이나 병원들에 관한 정보를 얻고자 하여 '의료정보'라는 검색어를 입력한 사용자는 '의료정보'라는 핵심어와 하이퍼링크 연결되어 있는, 특히 어느 정도의 연결강도를 갖고있는 정보들을 도 5 와 같은 개념도를 통해 일목요연하게 제공받을 수 있게되고, 개념도에 나타난 핵심어들 중 자신이 필요로 하는 정보 예를들면, 당뇨병을 마우스로 클릭하게 되면, 당뇨병과 하이퍼링크로 연결된 또다른 개념도가 화면상에 나타나게 된다.
상기와 같이 개념도가 화면상에 나타날 때에는 앞서 설명한 바와같이 개념도에 나타난 핵심어들의 주소와 자세한 내용이 그 아래의 자료화면에 출력되므로 사용자는 원하는 정보를 보다 빠르게 얻을 수 있는 것이다.
한편, 도 6 은 본 발명의 다른 실시예를 도시한 것으로, 개념도를 구성할 때 검색어와 하이퍼링크로 연결된 다른 핵심어를 표현함에 있어 전체 빈도수(연결관계)를 나타내는 외부원(S)과 하이퍼링크 연결강도를 나타내는 내부원(C)으로 표현된 하나의 셀(Cell)로서 표현하되, 외부원(S)과 내부원(C)의 크기로서 검색어와의 하이퍼링크 연결강도를 나타낸 것이다.
검색어와 검출된 핵심어들간의 연결관계를 외부원(S)으로 표시할때에는 제 2 메모리(4)에 검색되어 저장된 웹문서 전체에서 각각의 핵심어들이 출현한 빈도수를 제 2 메모리에 저장하고, 이를 이용하여 검색어와 상기 검출된 핵심어들간의 연결관계(빈도수)를 표시한다.
이상에서 설명한 바와같이 본 발명은 웹 문서에 기재된 핵심어를 검출하고, 검출된 핵심어들 간의 하이퍼링크 연결관계를 고려하여 사용자가 입력한 검색어와 연관된 핵심어들로 이루어진 개념도를 구성하여 제공하므로서, 사용자가 찾고자 하는 정보를 보다 신속하고 정확하게 검색할 수 있도록 한 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통한 인터넷 검색방법이다.

Claims (4)

  1. 인터넷 상에서 사용자가 원하는 정보를 얻기 위해 입력한 검색어와 연관된 키워드를 갖는 웹사이트를 검색하여 사용자에게 표시해주는 검색방법에 있어서,
    인터넷에 링크된 웹문서들을 검색하여 임의의 제 1 웹문서에 포함된 핵심어가 임의의 제 2 웹문서에 하이퍼링크로 연결되어있을때 상기 핵심어를 제 2 웹문서의 키워드추출에 이용하기 위해 검출하는 일련의 검색과정을 전체 웹문서들에 대해 실행하여 웹문서 검색을 위한 핵심어들을 검출하여 제 1 메모리(2)에 저장하는 하이퍼링크 정보 검출과정과;
    상기 제 1 메모리(2)에 저장된 핵심어들이 포함되어있는 웹문서들과 다른 웹문서들과의 하이퍼링크 연결관계를 이용하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하여 제 2 메모리(4)에 저장하되, 검출된 각각의 웹문서들은 자신이 가지고 있는 핵심어들을 가리키도록 하고, 또한 자신에게서 하이퍼링크로 연결되어 있는 다른 웹문서를 가리키도록 하며, 상기 검출된 각각의 핵심어들은 자신이 존재하는 웹문서들을 가리키도록 하여 검출된 핵심어와 웹문서들간의 연결관계를 구축하는 인덱스 구축과정과;
    사용자가 검색어를 입력하면, 제 2 메모리(4)에 저장되어있는 자료를 검색하여 사용자가 입력한 검색어와 동일한 핵심어를 검출하고, 검출된 핵심어가 하이퍼링크로 연결된 다른 웹문서의 핵심어를 검출하여 사용자가 입력한 핵심어에 대한 검색영역을 점차 넓혀나가며, 상기 과정에서 검출된 핵심어들간의 연결강도에 따라검색어를 중심으로 이 검색어와 연결관계를 갖는 핵심어들을 나열하여 선으로 연결한 개념도를 구성하여 화면의 일부분에 표시하고, 그 나머지 부분에는 개념도를 구성하는 핵심어들의 자세한 내용을 볼 수 있도록 하기위해 핵심어에 대한 주소와 내용을 표기한 자료화면을 표시하는 검색어 처리과정; 으로 진행되는 것을 특징으로 하는 웹문서의 하이퍼링크 정보를 이용한 개념도 구축과 이를 통한 인터넷 검색방법.
  2. 제 1 항에 있어서,
    복수개의 웹문서에 포함되어 있는 각각의 핵심어가 제 3 의 웹문서에 하이퍼 링크로 연결될때, 그 모든 핵심어들을 제 3 의 웹문서 검색에 필요한 핵심어로서 검출하여 제 1 메모리(2)에 저장시키는 것을 특징으로 하는 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통한 인터넷 검색방법.
  3. 제 1 항에 있어서,
    검색어와 검출된 핵심어들간의 연결강도 표시는 출력되는 핵심어들의 내부원의 크기로 나타내는 것을 특징으로 하는 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통해 인터넷 검색방법.
  4. 제 1 항에 있어서,
    제 2 메모리에 검색되어 저장된 웹문서 전체에서 각각의 핵심어들이 출현한빈도수를 제 2 메모리에 저장하고, 이를 이용하여 검색어와 검출된 핵심어들간의 연결관계를 표시할 때 출력되는 핵심어의 외부원의 크기로 나타내는 것을 특징으로 하는 웹 문서의 하이퍼링크 정보를 이용한 개념도의 구축과 이를 통한 인터텟 검색방법.
KR1019980044274A 1998-10-22 1998-10-22 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법 KR100318015B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1019980044274A KR100318015B1 (ko) 1998-10-22 1998-10-22 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법
US09/422,800 US6226645B1 (en) 1998-10-22 1999-10-22 Construction of conceptional drawings utilizing hyper link information of web document and internet searching method through it

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1019980044274A KR100318015B1 (ko) 1998-10-22 1998-10-22 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법

Publications (2)

Publication Number Publication Date
KR20000026646A KR20000026646A (ko) 2000-05-15
KR100318015B1 true KR100318015B1 (ko) 2002-04-22

Family

ID=19554949

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019980044274A KR100318015B1 (ko) 1998-10-22 1998-10-22 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법

Country Status (2)

Country Link
US (1) US6226645B1 (ko)
KR (1) KR100318015B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100717948B1 (ko) 2005-02-28 2007-05-11 에스케이 텔레콤주식회사 문서 링크를 통한 문서 관리 방법

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020059223A1 (en) * 1999-11-30 2002-05-16 Nash Paul R. Locator based assisted information browsing
AU2001247789A1 (en) 2000-03-22 2001-10-03 Sidestep, Inc. Method and apparatus for dynamic information connection engine
US6876997B1 (en) 2000-05-22 2005-04-05 Overture Services, Inc. Method and apparatus for indentifying related searches in a database search system
US7464086B2 (en) * 2000-08-01 2008-12-09 Yahoo! Inc. Metatag-based datamining
WO2002010945A1 (en) * 2000-08-02 2002-02-07 Biospace.Com, Inc. Apparatus and method for producing contextually marked-up electronic content
US20020154159A1 (en) * 2001-04-19 2002-10-24 International Business Machines Corporation Method, apparatus, and program for associating successive repointing of a browser's load function with navigational links in web pages
JP4399127B2 (ja) * 2001-05-14 2010-01-13 株式会社日立製作所 文書管理方法及び装置並びにその処理プログラム及びそれを格納した記憶媒体
US7089233B2 (en) * 2001-09-06 2006-08-08 International Business Machines Corporation Method and system for searching for web content
US7249034B2 (en) * 2002-01-14 2007-07-24 International Business Machines Corporation System and method for publishing a person's affinities
KR100918153B1 (ko) * 2003-03-12 2009-09-17 주식회사 케이티 실시간 인덱싱을 이용한 웹 페이지 고속 검색 방법
US20070067270A1 (en) * 2005-09-21 2007-03-22 Searete Llc, A Limited Liability Corporation Of The State Of Delaware Searching for possible restricted content related to electronic communications
US20070124295A1 (en) * 2005-11-29 2007-05-31 Forman Ira R Systems, methods, and media for searching documents based on text characteristics
KR100775852B1 (ko) * 2006-01-18 2007-11-13 포스데이타 주식회사 응용 프로그램의 자원 검색 시스템 및 방법
KR100797888B1 (ko) * 2006-04-28 2008-01-28 김정희 사용자 정의 정보 검색 방법 및 그 시스템
US9129024B2 (en) 2012-10-25 2015-09-08 International Business Machines Corporation Graphical user interface in keyword search
US9507491B2 (en) 2012-12-14 2016-11-29 International Business Machines Corporation Search engine optimization utilizing scrolling fixation
US8990192B2 (en) * 2012-12-14 2015-03-24 International Business Machines Corporation Search engine optimization using a find operation
US9521189B2 (en) * 2013-08-21 2016-12-13 Google Inc. Providing contextual data for selected link units

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0155308B1 (ko) * 1995-06-23 1998-11-16 정선종 동적 정보검색을 위한 자료의 색인장치 및 그 방법
KR100229395B1 (ko) * 1996-05-22 1999-11-01 모리시타 요이찌 서로 관련한 하이퍼텍스트 문서 검색용 하이퍼텍스트 문서 검색 장치

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5206951A (en) * 1987-08-21 1993-04-27 Wang Laboratories, Inc. Integration of data between typed objects by mutual, direct invocation between object managers corresponding to object types
US5838458A (en) * 1992-02-25 1998-11-17 Tsai; Irving Method and apparatus for linking designated portions of a received document image with an electronic address
US5737619A (en) * 1995-10-19 1998-04-07 Judson; David Hugh World wide web browsing with content delivery over an idle connection and interstitial content display
US5572643A (en) * 1995-10-19 1996-11-05 Judson; David H. Web browser with dynamic display of information objects during linking
JP2985756B2 (ja) * 1996-02-16 1999-12-06 日本電気株式会社 情報サービス端末
US5826267A (en) * 1996-03-20 1998-10-20 Mcmillan; James Michael Web information kiosk
US5802530A (en) * 1996-07-01 1998-09-01 Sun Microsystems, Inc. Web document based graphical user interface
US5892908A (en) * 1996-09-10 1999-04-06 Marketscape Method of extracting network information
US5835905A (en) * 1997-04-09 1998-11-10 Xerox Corporation System for predicting documents relevant to focus documents by spreading activation through network representations of a linked collection of documents
US5893091A (en) * 1997-04-11 1999-04-06 Immediata Corporation Multicasting with key words
US5987454A (en) * 1997-06-09 1999-11-16 Hobbs; Allen Method and apparatus for selectively augmenting retrieved text, numbers, maps, charts, still pictures and/or graphics, moving pictures and/or graphics and audio information from a network resource
US5877766A (en) * 1997-08-15 1999-03-02 International Business Machines Corporation Multi-node user interface component and method thereof for use in accessing a plurality of linked records
US5848410A (en) * 1997-10-08 1998-12-08 Hewlett Packard Company System and method for selective and continuous index generation
US5999664A (en) * 1997-11-14 1999-12-07 Xerox Corporation System for searching a corpus of document images by user specified document layout components
US6016494A (en) * 1997-11-21 2000-01-18 International Business Machines Corporation Expanding web documents by merging with linked documents

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR0155308B1 (ko) * 1995-06-23 1998-11-16 정선종 동적 정보검색을 위한 자료의 색인장치 및 그 방법
KR100229395B1 (ko) * 1996-05-22 1999-11-01 모리시타 요이찌 서로 관련한 하이퍼텍스트 문서 검색용 하이퍼텍스트 문서 검색 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100717948B1 (ko) 2005-02-28 2007-05-11 에스케이 텔레콤주식회사 문서 링크를 통한 문서 관리 방법

Also Published As

Publication number Publication date
KR20000026646A (ko) 2000-05-15
US6226645B1 (en) 2001-05-01

Similar Documents

Publication Publication Date Title
KR100318015B1 (ko) 웹문서의하이퍼링크정보를이용한개념도의구축과이를통한인터넷검색방법
US5848407A (en) Hypertext document retrieving apparatus for retrieving hypertext documents relating to each other
US8504568B2 (en) Collaborative workbench for managing data from heterogeneous sources
US8239216B2 (en) Searching an electronic medical record
US8055674B2 (en) Annotation framework
US9031926B2 (en) Extracting and displaying compact and sorted results from queries over unstructured or semi-structured text
US7555471B2 (en) Data object visualization
US6457028B1 (en) Method and apparatus for finding related collections of linked documents using co-citation analysis
Siadaty et al. Relemed: sentence-level search engine with relevance score for the MEDLINE database of biomedical articles
US20080147642A1 (en) System for discovering data artifacts in an on-line data object
US20080147578A1 (en) System for prioritizing search results retrieved in response to a computerized search query
US7925676B2 (en) Data object visualization using maps
WO2005083597A1 (en) Intelligent search and retrieval system and method
US20080147588A1 (en) Method for discovering data artifacts in an on-line data object
WO2008039542A2 (en) System and method of ad-hoc analysis of data
US20080147641A1 (en) Method for prioritizing search results retrieved in response to a computerized search query
WO1998020432A1 (en) Automatic transmission of legacy system data
US20070214137A1 (en) Process for analyzing actors and their discussion topics through semantic social network analysis
US20080147631A1 (en) Method and system for collecting and retrieving information from web sites
CN111797296A (zh) 基于网络爬取的毒物-靶标文献知识挖掘方法及系统
Gladun et al. Semantics-driven modelling of user preferences for information retrieval in the biomedical domain
Bhowmick et al. Information coupling in web databases
KR20060135173A (ko) 파일관리 시스템
US9524345B1 (en) Enhancing content using linked context
Zhang et al. A semantics-based method for clustering of Chinese web search results

Legal Events

Date Code Title Description
A201 Request for examination
N231 Notification of change of applicant
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121123

Year of fee payment: 12

FPAY Annual fee payment

Payment date: 20131206

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20141117

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20160201

Year of fee payment: 15

FPAY Annual fee payment

Payment date: 20170105

Year of fee payment: 16

FPAY Annual fee payment

Payment date: 20171206

Year of fee payment: 17

EXPY Expiration of term