KR20020011671A - 인터넷을 이용한 정보검색방법 및 그 시스템 - Google Patents

인터넷을 이용한 정보검색방법 및 그 시스템 Download PDF

Info

Publication number
KR20020011671A
KR20020011671A KR1020000045088A KR20000045088A KR20020011671A KR 20020011671 A KR20020011671 A KR 20020011671A KR 1020000045088 A KR1020000045088 A KR 1020000045088A KR 20000045088 A KR20000045088 A KR 20000045088A KR 20020011671 A KR20020011671 A KR 20020011671A
Authority
KR
South Korea
Prior art keywords
information
internet
user
search
database
Prior art date
Application number
KR1020000045088A
Other languages
English (en)
Inventor
오경묵
황상규
Original Assignee
김후길, 이명성, 오경묵
주식회사 웹캣
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김후길, 이명성, 오경묵, 주식회사 웹캣 filed Critical 김후길, 이명성, 오경묵
Priority to KR1020000045088A priority Critical patent/KR20020011671A/ko
Publication of KR20020011671A publication Critical patent/KR20020011671A/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 인터넷을 이용한 정보검색방법 및 그 시스템에 관한 것이다. 본 발명에서는 하나의 정보에 다수개의 정보항목값을 부여하고, 이들 정보항목값을 정규화하여 정보항목의 개수에 대응되는 차원공간에 위치시키고, 그 위치에서부터 일정한 거리(r) 떨어져 있는 정보들을 관련정보로 제공하도록 하는 것이다. 본 발명에서는 1차검색으로 각각의 정보항목중 단일의 정보항목을 이용하여 검색을 하고, 그 검색결과중에서 사용자가 원하는 정보를 선택하여, 상기 선택적 정보로부터 소정 거리(r) 떨어져 있는 정보들을 2차검색하여 제공하도록 하고 있다. 본 발명에서는 상기 정보들의 각각의 정보항목을 정규화한 다음, 이를 이용하여 상기 정보들을 각각 n차원 벡터공간상의 한점에 대응시키고, n차원벡터공간상에서의 인접도를 기준으로 관련 정보를 검색하도록 하고 있다. 따라서 본 발명에서는 각각의 정보를 비교함에 있어서 어느 한 정보항목만이 아니라 의미 있는 전체 정보항목을 사용하므로 보다 정확한 검색결과를 얻을 수 있게 된다.

Description

인터넷을 이용한 정보검색방법 및 그 시스템{A n-dimension information search method and system thereof}
본 발명은 인터넷을 이용한 정보검색방식에 관한 것으로, 더욱 상세하게는 각각의 정보의 가치를 나타내는 정보항목을 총체적으로 비교하여 근접도가 가까운 정보를 제공할 수 있도록 하는 인터넷을 이용한 정보검색방식에 관한 것이다.
인터넷이 대중화되면서 인터넷에는 많은 종류의 정보들이 존재하게 되었고, 상기 정보들을 검색하여 제공하는 웹사이트들이 많이 생기게 되었다. 이와 같은 웹사이트 들에서는 사용자가 원하는 검색식, 예를 들면 키워드를 입력하면 이와 유사한 정보들을 뽑아서 사용자가 볼 수 있도록 하였다.
이와 같은 웹사이트에서는 상기 정보들을 다음과 같은 방식으로 데이터베이스에 저장하여 두고 사용자가 원하면 제공하게 된다. 예를 들어 설명하면, 하나의 정보에 각각 그 제목, 해당분야 및 연도라는 정보항목(여기서 정보항목이란 각 정보의 특징을 나타낼 수 있는 것으로, 예를 들어 분야, 주제, 연도, 정보수준 등을 들 수 있다)을 두고 상기 각각의 정보항목별로 별도의 테이블을 만들어 보관하게 된다.
즉, 도 1에 도시된 바와 같이 제목이 생명의 신비이고 해당분야가 생명공학이며 그 연도가 1998년 2월인 정보(I)가 있으면, 여기서 상기 정보(I)의 각각의 정보항목을 각각의 정보항목별 테이블에 보관하게 된다.
'생명의 신비'라는 제목은 제목테이블에 2번문서로 색인하여 보관하고, '생명공학'이란 해당분야는 해당분야테이블에 2번문서로 색인하여 보관한다. 그리고 상기 정보(I)의 연도인 '1998년 2월'은 연도테이블에 2번문서로 보관된다.
이와 같이 정보(I)가 각각의 테이블에 보관된 상태에서 사용자가 원하는 정보(I)의 정보항목을 제공하면 상기 각각의 테이블에서 해당되는 문서를 찾아 사용자에게 보여준다. 이때 해당분야테이블에서와 같이 여러개의 항목정보가 동일한 문서번호를 가질 수 있다.
상기와 같은 구성에서 제목이 생명의 신비이고, 해당분야가 환경공학이며, 연도가 1998년 2월인 상기 정보(I)는 사용자가 상기 정보항목중 어느 하나나 그 모두를 검색식으로 하여 요청하면 제공된다. 물론 정보항목으로 제공되는 것이 적을 수록 보다 광범위한 정보가 얻어진다.
한편, 도 1에서와 같이 제목, 해당분야 및 년도를 검색식으로 제공하면 각각의 테이블에서 해당되는 문서번호를 골라 이들중 일치하는 것을 제공하게 된다. 도 1 에서는 2번문서가 바로 이에 해당된다.
그러나 상기한 바와 같은 종래의 정보검색방법에서는 다음과 같은 문제점이 있다. 종래의 정보검색방법에서는 각각의 정보를 비교함에 있어서, 그 정보항목끼리의 비교는 가능하나 다른 정보항목과의 비교가 불가능하여 특정 정보를 찾음에 있어서 실질적으로 근접한 정보를 얻을 수 없는 문제점이 있었다.
다시 말해 종래의 방법에서는 각각의 정보를 비교하여 유사한 정보를 찾음에 있어서, 동일한 정보항목 내에서 특정한 정보와 근접한 것을 찾을 수는 있으나, 다른 테이블에 저장되어 있는 정보항목과의 비교가 불가능한 문제점이 있다. 이는 상기 정보의 정보항목이 각각 독립적인 1차원 인덱스구조로 되어 있기 때문이다.
하지만 실제의 정보검색에 있어서는 각각의 정보가 서로 밀접하게 연관되는 경우가 많다. 예를 들어 컴퓨터분야에서 무선인터넷이라는 주제를 검색하는 경우에 얼마나 찾고자 하는 주제분야에 해당되는가와 동시에 얼마나 최신정보인가를 고려해야 한다. 즉 '무선인터넷'이라는 주제분야에 있는 것으로 1년전의 정보가 1주일 전의 보다 포괄적인 주제분야인 '인터넷'에 포함되는 정보보다 연관성이 없는 경우가 생기게 된다. 다시 말해 종래의 기술에서는 정보항목중 주제라는 것과 연도를 서로 동시에 비교할 수 없기 때문에 상기와 같은 문제점이 발생하게 된다.
따라서 본 발명의 목적은 상기한 바와 같은 종래 기술의 문제점을 해결하기 위한 것으로, 각각의 정보의 특성을 나타내는 정보항목을 전체적으로 비교하여 원하는 정보들을 검색할 수 있도록 하는 것이다.
도 1은 종래 기술에 의한 정보검색방식을 설명하기 위한 설명도.
도 2는 본 발명에 의한 인터넷을 이용한 정보검색시스템의 바람직한 실시예를 보인 시스템 구성도.
도 3a,3b,3c는 본 발명 실시예에서 각각의 정보항목에 정보항목값을 부여하는 것을 보인 설명도.
도 4는 본 발명 실시예에서 하나의 정보를 3차원 벡터공간의 한점에 대응시키는 것을 보인 설명도.
도 5는 본 발명 실시예에서 정보항목값을 정규화하여 3차원 벡터공간의 한점에 대응시키는 것을 보인 설명도.
도 6은 본 발명 실시예에서 1차검색을 위한 웹브라우저 화면을 보인 화면구성도.
도 7은 본 발명 실시예에서 1차검색 결과와 2차검색을 위한 웹브라우저 화면을 보인 화면구성도.
도 8은 본 발명 실시예에서 2차검색결과를 보인 화면구성도.
* 도면의 주요 부분에 대한 부호의 설명 *
10: 사용자 20: 인터넷
30: 정보검색사이트 40: 서버
42: 인터페이스모듈 44: 어플리케이션모듈
46: 트랜잭션모듈 50: 제1데이터베이스부
52: 제1검색서버 54: 제1데이터베이스
60: 제2데이터베이스부 62: 제2검색서버
64: 제2데이터베이스
상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따르면, 본 발명은 인터넷을 통해 접속한 사용자로부터 검색명령을 입력받고, 입력받은 검색명령을 분석, 처리하여 사용자에게 제공하는 서버와, 인터넷 상에서 수집된 정보를 각각의 분류항목 별로 1차원적으로 분류, 저장하여 상기 서버에서 전달되는 검색명령에 따라 1차검색을 수행하는 제1데이터베이스부와, 인터넷 상에서 수집된 정보를 n개 정보항목의 n차원 벡터값으로 환산, 저장하여 제1데이터베이스부에서 검색된 결과에 기초하여 상기 서버에 전달되는 검색명령에 따라 상기 벡터값의 근접도를 근거로 2차검색을 수행하는 제2데이터베이스부를 포함하여 구성된다.
상기 서버에는 상기 사용자가 서버에 접속하여 검색을 하고 검색결과를 볼 수 있도록 하는 인터페이스모듈과, 상기 사용자가 입력한 검색명령을 분석하는 어플리케이션모듈과, 상기 어플리케이션모듈에서 분석된 검색명령을 기초가 상기 제1데이터베이스부와 제2데이터베이스부에 선택적으로 접속하게 하는 트랜잭션모듈을 포함하여 구성된다.
상기 제1 및 제2 데이터베이스부에는 각각의 데이터베이스를 검색하기 위한 검색서버가 별도로 구비된다.
본 발명의 다른 특징에 따르면, 본 발명은 인터넷과 연결된 서버와 인터넷 상에서 검색된 정보를 저장하여 상기 서버의 요청에 의해 제공하는 데이터베이스를 사용하여 인터넷 상에서 검색된 정보를 사용자에게 제공하는 정보검색방법에 있어서, 인터넷 상에서 검색된 정보에 각각 n개의 정보항목에 대응되는 각각의 정보항목값을 부여하고, 상기 n개의 정보항목값을 정규화하는 제1단계와, 상기 정규화된n개의 정보항목값을 이용하여 상기 검색된 정보를 n차원벡터공간상의 일점에 대응시켜 상기 데이터베이스에 저장하는 제2단계와, 상기 데이터베이스에 저장된 정보중 인터넷을 통해 입력된 사용자의 검색명령에 해당되는 정보의 n차원벡터공간상의 해당 지점으로부터 소정의 거리(r)의 범위내에 있는 것을 선택하는 제3단계와, 상기 선택된 정보들을 서버를 통해 사용자에게 제공하는 제4단계를 포함하여 구성된다.
상기 거리(r)는에 의해 구해지고, 상기 a1,a2,b1,b2....z1,z2는 정규화된 정보항목값이고, α,β,....ω는 가중상수값이다.
상기 제3단계에서는 사용자가 제공한 정보항목을 이용하여 먼저 상기 단일의 정보항목과 인접한 정보를 사용자에게 제공하고, 상기 제공된 정보들중 사용자가 선택한 정보의 n차원벡터공간상의 해당 지점으로부터 소정의 거리(r)의 범위내에 있는 것을 선택한다.
이와 같은 구성을 가지는 본 발명에 의하면 인터넷 상에서 검색된 정보에 각각의 정보의 특성을 나타내는 정보항목값을 부여하고 상기 정보항목값을 서로 등가의 값으로 정규화하여 이들을 동시에 이용하여 서로 비교하기 때문에 실질적으로 서로 연관성을 가지는 정보를 검색할 수 있게 된다.
이하 상기한 바와 같은 본 발명에 의한 인터넷을 이용한 정보검색방법 및 그 시스템의 바람직한 실시예를 첨부된 도면을 참고하여 상세하게 설명한다.
먼저 도 2에는 본 발명에 의한 시스템의 구성이 도시되어 있다. 이에 도시된 바에 따르면, 본 발명에 의해 정보검색을 수행할 수 있는 정보검색사이트(30)는 인터넷(20) 상에서 사용자들(10)이 접속할 수 있다.
상기 정보검색사이트(30)는 서버(40)와, 제1데이터베이스부(50) 및 제2데이터베이스부(60)로 구성된다.
상기 서버(40)는 상기 이용자(10)들로부터 입력되는 각종 명령을 처리하는 부분으로 인터페이스모듈(42), 어플리케이션모듈(44) 및 트랜잭션모듈(46)로 구성된다.
상기 인터페이스모듈(42)은 각각의 사용자(10)의 웹브라우저의 화면처리를 담당하는 부분이다. 상기 어플리케이션모듈(44)은 사용자가 입력한 검색식에 대한 내용을 분석하는 역할을 하게 된다. 그리고 상기 트랜잭션모듈(46)은 사용자가 입력한 검색식에 대한 검색하기 위해 상기 제1데이터베이스부(50)와 제2데이터베이스부(60)에 접속할 수 있도록 하는 것이다.
상기 트랜잭션모듈(46)은 상기 제1데이터베이스부(50)와 제2데이터베이스부(60)가 서로 별개로 존재하기 때문에 필요하고, 또한 여러명의 사용자(10)가 동시에 접속하여 검색을 수행하는 경우, 각기 다른 사용자의 작업을 별개로 관리하기 위해 필요하다.
다음으로 제1데이터베이스부(50)는 제1검색서버(52)와 제1데이터베이스(54)로 구성된다. 상기 제1검색서버(52)는 상기 제1데이터베이스(54)에 저장되어 있는 데이터를 검색하게 된다. 한편, 상기 제1데이터베이스(54)에는 종래와 동일하게 1차원구조로 데이터가 저장된다. 즉 각각의 정보항목에 따른 각각의 테이블로 분리되어 정보가 저장되어 있다.
그리고 상기 제2데이터베이스부(60)는 제2검색서버(62)와 제2데이터베이스(64)로 구성된다. 상기 제2검색서버(62)는 상기 제2데이터베이스(64)에 저장되어 있는 데이터를 검색하게 된다. 한편, 상기 제2데이터베이스(64)는 n개의 정보항목을 기초로 하여 n차원 형태의 정보저장방식으로 정보가 저장되어 있다.
여기서 상기 제2데이터베이스(64)에 정보가 저장되는 것을 도 3 및 도 4를 참고하여 설명하기로 한다. 여기서는 정보항목으로서 이용자수준(d1), 해당분야(d2), 연도(d3)를 사용한다.
인터넷(20) 상에서 검색된 정보는 각각 그 정보항목값이 주어진다. 예를 들어 도 3a에 도시된 바와 같이 이용자수준(d1)의 경우 초등학생수준, 중학생수준, 고등학생수준, 대학생수준, 대학원생수준, 교수수준의 6단계로 나누고, 각각의 수준에 1에서 6사이의 값을 부여한다.
한편, 초등교양수준, 중등교양수준, 고등교양수준, 전문가수준 등으로 분류하여 예를 들어 고등교양수준에는 3.8-5.1사이의 값을 부여할 수도 있다. 이와 같은 정보수준의 정보항목값에 부여되는 값은 보다 많은 단계로 분류될 수도 있다.
다음으로 정보의 해당분야(d2)에 따라 각각 그 정보항목값을 부여한다. 이때, 해당분야(d2)의 경우는 그 분야의 접근도에 따라 정보항목값을 부여한다. 예를 들어, 사회복지학, 사회학, 신문방송학과 같이 서로 연관있는 분야를 정보항목값300에서 400사이에 배치한다.
그리고 보다 세부적으로는 사회복지학이 340이면, 이어서 아동복지, 여성복지, 노인복지, 지역사회복지 등에 각각 340대의 정보항목값이 부여된다. 그리고 사회복지학과 인접한 사회학에는 350의 정보항목값을 부여한다. 그리고 상기 사회학과 인접한 신문방송학에는 360이라는 정보항목값을 부여한다. 여기서 해당분야(d2)에는 영역크기에 따라 계층화된 값이 부여된다.
다음으로 각각의 정보의 연도(d3)에 정보항목값을 부여한다. 예를 들어 1998년 2월의 경우에 19980200의 8자리 숫자로 표현되고 입력되지 않은 날짜는 초기값인 00으로 된다.
한편, 상기와 같이 각각의 정보항목에 정보항목값을 부여하여 3차원벡터공간상에 위치시키는 것을 도 4를 참고하여 설명하기로 한다.
예를 들어 김현준의 사회복지연구라는 웹사이트에는 이용자수준(d1)이 4.7, 해당분야(d2)는 348, 연도(d3)는 19980500이 부여되었다. 이와 같은 정보항목값을 기초로 도 4에 표시되는 3차원 벡터공간상의 A점에 김현준의 사회복지연구사이트(여기서는 하나의 정보라고 말할 수 있다)가 위치하게 된다. 이와 같은 3차원벡터공간에서 A점은 원점(o)으로부터 k만큼 떨어진 위치이다.
상기와 같은 방식으로 각각의 정보를 3차원벡터공간 상의 한점에 위치시키고 각각의 정보를 고유한 값으로 저장할 수 있다. 본 발명에서는 상기와 같은 방식으로 인터넷 상에서 검색된 정보를 분류하여 제2데이터베이스(64)에 저장하게 된다.
이때 상기 각각의 정보항목값들은 서로 그 가치가 다른 값이어서 이들을 가지고 그대로 다른 정보와 비교할 수는 없다. 따라서 상기 정보항목값들을 등가의 값으로 만드는 작업이 필요하게 된다. 이와 같은 과정을 정규화과정이라고 할 수 있는데, 각각의 정보항목값을 0과 1사이의 실수값으로 균일하게 바꾸는 작업이다.
여기서 상기와 같이 하여 얻어진 각각의 정보항목값을 a,b,c라고 할 때, 상기 김현준의 사회복지연구사이트라는 정보는 도 5에 도시된 바와 같이 3차원 벡터공간상에서 K점에 위치하게 된다. 그리고 그외의 많은 검색된 정보들을 상기와 같은 방식으로 도 5에 도시된 바와 같은 3차원벡터공간에 위치시킬 수 있다.
이와 같은 방식으로 각각의 정보를 3차원벡터공간 상에 위치시키게 되면, 각각의 정보를 서로 비교함에 있어서 다수개의 정보항목을 복합적으로 동시에 고려할 수 있게 된다. 즉 상기 3차원벡터공간 상에서 거리(r)가 얼마나 인접해 있는 가를 기초로 정보 사이의 근접도를 판단하게 된다.
이때, 상기 거리(r)는에 의해 구해지고, 상기 a1,a2,b1,b2....z1,z2는 각각의 정보에서 정규화된 정보항목값이고, α,β,....ω는 가중상수값이다.
한편, 본 발명 실시예에서는 정보항목을 3개만 사용한 경우를 예로 들어 설명하였으나, 실제로는 더 많은 수의 정보항목을 이용하여 각각의 정보를 저장할 수 있다.
이하 상기한 바와 같은 방식으로 인터넷상에서 검색되어 저장된 정보를 사용자가 실제로 검색하여 얻게 되는 과정을 설명하기로 한다.
먼저, 정보검색사이트(30)의 제2데이터베이스(64)에는 인터넷(20) 상에서 검색된 정보를 다수개의 정보항목값을 이용하여 저장하게 된다. 그리고 상기 제1데이터베이스(54)는 각각의 정보항목의 테이블을 만들어 정보를 저장한다.
그리고 사용자(10)가 인터넷(20)을 통하여 정보검색사이트(30)에 접속하면, 상기 인터페이스모듈(42)은 사용자(10)의 웹브라우저에 도 6에 도시된 바와 같은 화면을 표시하게 된다.
여기서 사용자(10)가 예를 들어 '사회복지'라고 하는 검색식을 입력하고 검색버튼을 누르면 검색이 진행된다. 즉 상기 인터페이스모듈(42)에서 전달된 검색식은 어플리케이션모듈(44)에서 분석된다. 즉 사용자(10)가 입력한 검색식에서 and나 or같은 연산식을 분석하고 제1데이터베이스부(50)나 제2데이터베이스부(60)중 어느 하나로 전달할 것을 판단한다. 그리고 상기 판단이 끝나면 그 결과를 검색식과 함께 상기 트랜잭션모듈(46)로 전달한다.
한편, 여기서는 사용자(10)가 검색버튼을 눌렀으므로 1차검색, 즉 제1데이터베이스부(50)에서 검색이 이루어지게 된다. 따라서 제1데이터베이스부(50)에서는 제1검색서버(52)가 제1데이터베이스(54)에 저장되어 있는 각각의 정보항목테이블에서 '사회복지'에 관련된 정보를 검색하게 된다.
상기와 같이 제1데이터베이스부(50)에서 검색된 정보는 트랜잭션모듈(46)을 통해 어플리케이션모듈(44)로 넘겨진다. 어플리케이션모듈(44)은 트랜잭션모듈(46)로부터 넘겨받은 검색결과 가운데 시스템제어에 필요한 헤더부분을 제외한 나머지부분을 인터페이스모듈(42)로 넘긴다.
이와 같이 하여 인터페이스모듈(42)로 넘겨진 검색결과는 도 7에 도시된 바와 같이 인터페이스모듈(42)에 의해 사용자(10)의 웹브라우저에 표시된다.
한편, 사용자는 웹브라우저에 표시된 검색결과중에서 어느 하나를 선택하여, 선택된 정보와 인접한 정보를 얻을 수 있게 된다.
즉, 도 7에 도시된 바와 같이, 예를 들어 김현준의 사회복지연구라는 정보의 체크박스에 체크를 하고 예제검색이라는 버튼을 누르게 되면 2차검색이 시작된다. 상기와 같이 예제검색버튼이 눌러지면, 상기 인터페이스모듈(42)은 사용자의 명령을 어플리케이션모듈(44)로 넘기게 되고, 상기 어플리케이션모듈(44)은 예제검색버튼이 눌러졌으므로 제2데이터베이스부(60)에서 검색이 이루어져야 할 것이라는 판단결과와 사용자의 검색명령을 전달하게 트랜잭션모듈(46)로 전달한다. 그리고 트랜잭션모듈(46)은 제2데이터베이스부(60)의 제2검색서버(62)에 접속하여 제2데이터베이스(64)에 대한 검색을 수행할 것을 지시한다.
상기 제2검색서버(62)는 도 5에 도시된 바와 같이, 1차검색에서 찾아진 김현준의 사회복지연구라는 정보의 k값을 기초로 이로부터 소정의 거리(r)내에 있는 각종 정보들을 검색하게 된다.
이와 같은 방식으로 검색을 하게 되면, 예를 들어 SOS정서장애아동복지센터라는 정보와 내일의 지도자를 기르는 청소년운동이라는 정보가 김현준의 사회복지연구라는 정보와 관련성이 있는 정보로 검색된다.
상기와 같이 2차정보검색이 완료되면 그 결과는 상기 제2검색서버(62)에서트랜잭션모듈(46)로 넘겨지고, 트랜잭션모듈(46)에서 어플리케이션모듈(44)을 지나 인터페이스모듈(42)로 전달된다. 이때 전달되는 검색결과는 물론 제어에 필요한 헤더부분을 제외한 것이다. 마지막으로 상기 검색결과는 인터페이스모듈(42)에 의해 사용자(10)의 웹브라우저에 도 8에 도시된 바와 같이 표시된다.
위에서 상세히 설명한 바와 같은 본 발명에 의한 인터넷을 이용한 정보검색방법 및 그 시스템은 검색된 정보를 각각의 정보항목값을 정규화하여 n차원 벡터공간상의 한점에 대응시켜 저장하고, 상기 한점에서부터 소정 거리 떨어져 있는 정보들을 검색하여 선택하게 되므로 각각의 정보를 비교함에 있어서 어느 한 정보항목값만을 가지고 비교하는 것이 아니라 각각의 정보의 특성을 나타내는 많은 정보항목을 동시에 사용하여 비교할 수 있으므로 보다 원하는 정보와 근접된 정보들을 얻을 수 있게 되는 이점이 있다.

Claims (6)

  1. 인터넷을 통해 접속한 사용자로부터 검색명령을 입력받고, 입력받은 검색명령을 분석, 처리하여 사용자에게 제공하는 서버와,
    인터넷 상에서 수집된 정보를 각각의 분류항목 별로 1차원적으로 분류, 저장하여 상기 서버에서 전달되는 검색명령에 따라 1차검색을 수행하는 제1데이터베이스부와,
    인터넷 상에서 수집된 정보를 n개 정보항목의 n차원 벡터값으로 환산, 저장하여 제1데이터베이스부에서 검색된 결과에 기초하여 상기 서버에 전달되는 검색명령에 따라 상기 벡터값의 근접도를 근거로 2차검색을 수행하는 제2데이터베이스부를 포함하여 구성됨을 특징으로 하는 인터넷을 이용한 정보검색 시스템.
  2. 제 1 항에 있어서, 상기 서버에는 상기 사용자가 서버에 접속하여 검색을 하고 검색결과를 볼 수 있도록 하는 인터페이스모듈과,
    상기 사용자가 입력한 검색명령을 분석하는 어플리케이션모듈과,
    상기 어플리케이션모듈에서 분석된 검색명령을 기초가 상기 제1데이터베이스부와 제2데이터베이스부에 선택적으로 접속하게 하는 트랜잭션모듈을 포함하여 구성됨을 특징으로 하는 인터넷을 이용한 정보검색 시스템.
  3. 제 1 항 또는 제 2 항에 있어서, 상기 제1 및 제2 데이터베이스부에는 각각의 데이터베이스를 검색하기 위한 검색서버가 별도로 구비됨을 특징으로 하는 인터넷을 이용한 정보검색 시스템.
  4. 인터넷과 연결된 서버와 인터넷 상에서 검색된 정보를 저장하여 상기 서버의 요청에 의해 제공하는 데이터베이스를 사용하여 인터넷 상에서 검색된 정보를 사용자에게 제공하는 정보검색방법에 있어서,
    인터넷 상에서 검색된 정보에 각각 n개의 정보항목에 대응되는 각각의 정보항목값을 부여하고, 상기 n개의 정보항목값을 정규화하는 제1단계와,
    상기 정규화된 n개의 정보항목값을 이용하여 상기 검색된 정보를 n차원벡터공간상의 일점에 대응시켜 상기 데이터베이스에 저장하는 제2단계와,
    상기 데이터베이스에 저장된 정보중 인터넷을 통해 입력된 사용자의 검색명령에 해당되는 정보의 n차원벡터공간상의 해당 지점으로부터 소정의 거리(r)의 범위내에 있는 것을 선택하는 제3단계와,
    상기 선택된 정보들을 서버를 통해 사용자에게 제공하는 제4단계를 포함하여 구성됨을 특징으로 하는 인터넷을 이용한 정보검색방법.
  5. 제 4 항에 있어서, 상기 거리(r)는에 의해 구해지고, 상기 a1,a2,b1,b2....z1,z2는 정규화된 정보항목값이고, α,β,....ω는 가중상수값임을 특징으로 하는 인터넷을 이용한 정보검색방법.
  6. 제 4 항 또는 제 5 항에 있어서, 상기 제3단계에서는 사용자가 제공한 정보항목을 이용하여 먼저 상기 단일의 정보항목과 인접한 정보를 사용자에게 제공하고, 상기 제공된 정보들중 사용자가 선택한 정보의 n차원벡터공간상의 해당 지점으로부터 소정의 거리(r)의 범위내에 있는 것을 선택함을 특징으로 하는 인터넷을 이용한 정보검색방법.
KR1020000045088A 2000-08-03 2000-08-03 인터넷을 이용한 정보검색방법 및 그 시스템 KR20020011671A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020000045088A KR20020011671A (ko) 2000-08-03 2000-08-03 인터넷을 이용한 정보검색방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020000045088A KR20020011671A (ko) 2000-08-03 2000-08-03 인터넷을 이용한 정보검색방법 및 그 시스템

Publications (1)

Publication Number Publication Date
KR20020011671A true KR20020011671A (ko) 2002-02-09

Family

ID=19681624

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020000045088A KR20020011671A (ko) 2000-08-03 2000-08-03 인터넷을 이용한 정보검색방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR20020011671A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009023582A1 (en) * 2007-08-10 2009-02-19 Microsoft Corporation Domain name geometrical classification using character-based n-grams
US8005782B2 (en) 2007-08-10 2011-08-23 Microsoft Corporation Domain name statistical classification using character-based N-grams
US9026579B2 (en) 2007-08-22 2015-05-05 Samsung Electronics Co., Ltd. Method and apparatus for providing/receiving service of plurality of service providers

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009023582A1 (en) * 2007-08-10 2009-02-19 Microsoft Corporation Domain name geometrical classification using character-based n-grams
US8005782B2 (en) 2007-08-10 2011-08-23 Microsoft Corporation Domain name statistical classification using character-based N-grams
US8041662B2 (en) 2007-08-10 2011-10-18 Microsoft Corporation Domain name geometrical classification using character-based n-grams
US9026579B2 (en) 2007-08-22 2015-05-05 Samsung Electronics Co., Ltd. Method and apparatus for providing/receiving service of plurality of service providers
US9271047B2 (en) 2007-08-22 2016-02-23 Samsung Electronics Co., Ltd. Method and apparatus for providing/receiving service of plurality of service providers

Similar Documents

Publication Publication Date Title
US11036814B2 (en) Search engine that applies feedback from users to improve search results
WO2022022002A1 (zh) 一种信息展示方法、信息搜索方法及装置
JP3781696B2 (ja) イメージ検索方法及び検索装置
CN1702654B (zh) 计算显示页面中块的重要度的方法和系统
Saracevic Relevance: A review of the literature and a framework for thinking on the notion in information science. Part III: Behavior and effects of relevance
CN101223525B (zh) 关系网络
US8406573B2 (en) Interactively ranking image search results using color layout relevance
US8250061B2 (en) Learning retrieval functions incorporating query differentiation for information retrieval
US20110191327A1 (en) Method for Human Ranking of Search Results
KR100797041B1 (ko) 분류된 웹 사이트 검색 시스템 및 방법
US20070022125A1 (en) Systems, methods, and computer program products for accumulating, strong, sharing, annotating, manipulating, and combining search results
US20080172380A1 (en) Information retrieval based on information location in the information space.
US20040158567A1 (en) Constraint driven schema association
WO1995000896A2 (en) Method and apparatus for indexing searching and displaying data
CN110633407B (zh) 信息检索方法、装置、设备及计算机可读介质
US20060179036A1 (en) Methods and systems for displaying matching business objects
US20080256067A1 (en) File Search Engine and Computerized Method of Tagging Files with Vectors
CN107016020A (zh) 利用垂直建议辅助搜索请求的系统和方法
KR20100113423A (ko) 역 벡터 공간 모델을 이용한 키워드 추천방법 및 그 장치
US20160162583A1 (en) Apparatus and method for searching information using graphical user interface
KR20000023961A (ko) 정보 모델링방법 및 데이터베이스 검색시스템
Chen An analysis of image retrieval tasks in the field of art history
US11409814B2 (en) Systems and methods for crawling web pages and parsing relevant information stored in web pages
Hoque et al. Combining conceptual query expansion and visual search results exploration for web image retrieval
KR20010104871A (ko) 검색결과의 자동분류 기능을 갖는 인터넷 사이트 검색서비스 시스템

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E601 Decision to refuse application