KR101212457B1 - 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템 - Google Patents

웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템 Download PDF

Info

Publication number
KR101212457B1
KR101212457B1 KR1020117010127A KR20117010127A KR101212457B1 KR 101212457 B1 KR101212457 B1 KR 101212457B1 KR 1020117010127 A KR1020117010127 A KR 1020117010127A KR 20117010127 A KR20117010127 A KR 20117010127A KR 101212457 B1 KR101212457 B1 KR 101212457B1
Authority
KR
South Korea
Prior art keywords
web page
time
user terminal
web
access time
Prior art date
Application number
KR1020117010127A
Other languages
English (en)
Other versions
KR20110084414A (ko
Inventor
김장중
Original Assignee
(주)이스트소프트
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)이스트소프트 filed Critical (주)이스트소프트
Publication of KR20110084414A publication Critical patent/KR20110084414A/ko
Application granted granted Critical
Publication of KR101212457B1 publication Critical patent/KR101212457B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Abstract

본 발명은 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법에 관한 것이다. 본 발명의 일실시 예에 따른 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법은, 사용자의 웹페이지 접속시간을 추출하는 단계, 추출된 접속시간으로 웹페이지의 누적접속시간을 계산하는 단계, 사용자가 검색한 웹페이지 리스트를 누적접속시간 비율로 정렬하여 제공하는 단계를 포함한다.

Description

웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템{WEB PAGE SEARCHING SYSTEM AND METHOD USING ACCESS TIME AND FREQUENCY}
본 발명은 인터넷상의 웹페이지 검색분야에 관한 것으로, 보다 상세하게는 사용자 단말기에 설치된 클라이언트프로그램으로 추출한 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법에 관한 것이다.
일반적으로 웹페이지 검색분야는 웹페이지별 유사도나 링크수, 방문자수를 반영하여 검색결과를 제공하였다.
이러한 웹페이지 검색분야는 사용자가 입력한 검색어를 포함하는 웹페이지들을 방문자수, 링크수 또는 유사도로 정렬하여 사용자에게 제공함으로써 보다 관련성이 높은 검색결과를 제공할 수 있게 하였다.
그러나 방문자수나 링크수 또는 유사도에 의한 검색방법 및 장치는 검색결과로 제공되는 제목이나 요약정보 등의 정보로 접속하게 되는 경우 사용자가 페이지에 접속하여 유용한 정보를 얻지 못한 경우에도 검색 결과에 반영됨으로써 페이지에서의 실제 정보 이용 정도를 정확하게 파악하여 검색결과를 제공하지 못하는 단점이 있었다.
발명의 상세한 설명
기술적 과제
본 발명은 상기한 문제점을 개선하기 위해 고안된 것으로, 본 발명이 이루고자 하는 기술적 과제는 사용자의 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법으로서 사용자로 하여금 검색결과 페이지의 정보 이용 정도를 파악하여 검색 결과를 제공하는 데 있다.
본 발명의 또 다른 목적은 상기 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는 것이다.
유리한 효과
이와 같은 본 발명의 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법에 따르면 클라이언트프로그램이 설치된 사용자 단말기로부터 사용자가 방문한 웹페이지의 웹주소를 수집하여 그 정보로부터 웹페이지별 접속시간, 방문도, 링크인기도, 유사도에 따라 저장하고, 사용자가 입력한 검색어를 포함하는 웹페이지들을 접속시간, 방문도, 링크인기도, 유사도별로 추출하여 사용자에게 제공함으로써 정보 이용 정도가 높은 순서대로 검색결과를 제공할 수 있다.
도 1은 본 발명에 따른 사용자 웹페이지 접속정보를 이용하여 추출한 웹페이지별 접속시간에 기반한 웹페이지 검색장치에 대한 시스템 구성도이다.
도 2는 본 발명에 따른 웹페이지 접속정보를 이용하여 추출한 웹페이지별 접속시간에 기반한 정보를 웹페이지사용결과데이터베이스에 저장하는 방법에 대한 흐름도이다.
도 3은 사용자의 웹페이지 접속시간을 산출하는 방식을 나타낸 그래프이다.
도 4는 웹페이지사용결과데이터베이스에 저장된 레코드의 구조이다.
도 5는 본 발명에 따른 사용자 웹페이지 접속정보를 이용하여 추출한 웹페이지별 접속시간에 기반한 웹페이지 검색결과 제공방법에 대한 도면이다.
발명의 실시를 위한 최선의 형태
전술한 과제를 해결하기 위한 본 발명은 특정 사용자 단말기에 특정 웹페이지가 실질적으로 표시되었던 시간인 접속시간에 대한 정보를 웹검색 시스템에 저장하는 (a) 단계와; 상기 웹검색 시스템은 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 저장하는 (b) 단계와; 상기 웹검색 시스템은 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 누적접속시간 순으로 정렬하여 상기 사용자 단말기에 제공하는 (c)단계;를 포함하며, 상기 (a) 단계는 상기 웹페이지가 활성화되었을 때부터 웹주소 전환 시까지 또는 웹페이지 창이 닫힐 때까지의 웹페이지 활성화 시간을 측정하는 (a-1) 단계와; 상기 활성화 시간 중에서 기준시간을 경과할 때까지 사용자 단말기의 입력장치를 통한 신호의 입력이 없는 경우, 상기 기준시간이 경과하는 시점부터 다음 입력신호가 들어올 때까지의 결손시간을 측정하는 (a-2) 단계와; 상기 웹페이지 활성화 시간에서 상기 결손시간을 제외한 접속시간을 계산하는 (a-3) 단계;를 포함한다.
다른 실시예에 따른 본 발명은 특정 사용자 단말기에 특정 웹페이지가 실질적으로 표시되었던 시간인 접속시간에 대한 정보를 웹검색 시스템에 저장하는 (a) 단계와; 상기 웹검색 시스템은 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 저장하는 (b) 단계와; 상기 웹검색 시스템은 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 누적접속시간 순으로 정렬하여 상기 사용자 단말기에 제공하는 (c)단계;를 포함하며, 상기 (a) 단계는 상기 사용자 단말기가 활성화된 웹페이지에 접속하여 있는 동안 입력장치를 통한 유효한 입력 시간의 누적값으로써 접속시간을 계산하는 (a-1) 단계;를 포함한다.
상기 접속시간에 대한 상기 사용자 단말기의 방문횟수의 비율인 방문도를 계산하는 (d) 단계와; 상기 사용자 단말기에서 검색한 웹페이지 리스트를 상기 방문도 순으로 정렬하여 제공하는 (e) 단계;를 추가로 포함한다.
상기 기준시간은 1분 내지 3분인 것을 특징으로 한다.
상기 웹페이지에 대한 링크를 포함하고 있는 다른 웹페이지의 수로 링크인기도를 계산하는 (f) 단계와; 상기 웹페이지에 포함된 상기 검색어의 빈도수로 유사도를 계산하는 (g) 단계와; 상기 사용자 단말기에서 검색한 웹페이지 리스트를 상기 링크 인기도 및/또는 상기 유사도의 비율 순으로 정렬하여 제공하는 (h) 단계;를 추가로 포함한다.
모든 웹페이지의 누적접속시간에 대한 상기 웹페이지의 누적접속시간의 비율을 계산하는 (i) 단계와; 상기 사용자 단말기에서 검색한 웹페이지 리스트를 상기 누적접속시간의 비율 순으로 정렬하여 제공하는 (j) 단계;를 추가로 포함한다.
또 다른 실시예에 따른 본 발명은 특정 사용자 단말기에 특정 웹페이지가 실질적으로 표시되었던 시간인 접속시간에 대한 정보를 전송받아 저장하는 웹페이지사용결과 데이터베이스와; 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 사용자 단말기에 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 누적접속시간 순으로 정렬하여 상기 사용자 단말기에 제공하는 중앙처리수단;을 포함하며, 상기 클라이언트 프로그램은 상기 웹페이지가 활성화되었을 때부터 웹주소 전환 시까지 또는 웹페이지창이 닫힐 때까지의 웹페이지 활성화 시간을 측정하고, 상기 활성화 시간 중에서 기준시간을 경과할 때까지 사용자 단말기의 입력장치를 통한 신호의 입력이 없는 경우, 상기 기준시간이 경과하는 시점부터 다음 입력신호가 들어올 때까지의 결손시간을 측정하고, 상기 웹페이지 활성화 시간에서 상기 결손시간을 제외한 접속시간을 계산하는 것을 특징으로 한다.
또 다른 실시예에 따른 본 발명은 특정 사용자 단말기에 특정 웹페이지가 실질적으로 표시되었던 시간인 접속시간에 대한 정보를 전송받아 저장하는 웹페이지사용결과 데이터베이스와; 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 사용자 단말기에 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 누적접속시간 순으로 정렬하여 상기 사용자 단말기에 제공하는 중앙처리수단;을 포함하며, 상기 클라이언트 프로그램은 상기 사용자 단말기가 활성화된 웹페이지에 접속하여 있는 동안 입력장치를 통한 유효한 입력 시간의 누적값으로써 접속시간을 계산하는 것을 특징으로 한다.
상기 웹페이지사용결과 데이터베이스는 상기 웹페이지에 대한 방문도를 더 저장하고, 상기 중앙처리장치는 상기 사용자 단말기에서 검색한 웹페이지 리스트를 상기 방문도 순으로 정렬하여 제공한다.
상기 웹페이지사용결과 데이터베이스는 상기 웹페이지에 대한 링크인기도 및/또는 유사도를 더 저장하고, 상기 중앙처리장치는 상기 사용자 단말기에서 검색한 웹페이지 리스트를 상기 링크인기도 및/또는 상기 유사도 순으로 정렬하여 제공하는 것을 특징으로 한다.
또 다른 실시예에 따른 본 발명은 상기의 웹검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체이다.
발명의 실시를 위한 형태
이하에서 도면을 참고하여 본 발명의 실시예에 따른 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및 그 방법(이하, '웹검색 시스템' 및 '웹검색 방법'이라 함)을 설명한다.
도 1은 본 발명에 따른 사용자 웹페이지 접속정보를 이용하여 추출한 웹페이지별 접속시간에 기반한 웹페이지 검색장치에 대한 시스템 구성도이다.
본 발명의 웹검색 시스템(100)은 중앙처리장치(110), 웹페이지사용결과 데이터베이스(120), 색인데이터베이스(103)를 포함한다. 이외에도 인터넷(300)을 통하여 접속한 사용자 단말기(200)에 웹검색 결과 데이터를 전송하기 위한 여러 가지 구성요소가 더 포함되어 있으나, 이러한 구성요소는 이미 공지된 구성이므로 상세한 설명은 생략한다.
본 발명의 검색방법을 이용하기 위해서는 사용자 단말기(200)에 클라이언트 프로그램이 설치되어 있어야 한다. 클라이언트 프로그램은 사용자 단말기(200)에서 이루어지는 검색 과정을 모니터링하여 사용자가 즐겨찾는 검색어에 관한 데이터를 추출한다. 추출된 데이터는 본 발명의 웹검색 시스템(100)으로 전송되어 정확한 검색결과를 제공하기 위한 기초자료로 활용된다.
사용자는 클라이언트 프로그램을 온라인 상에서 다운로드 받아 설치하거나 오프라인 상에서 입수되는 기록매체를 통해 자신의 단말기에 설치한다. 클라이언트 프로그램은 사용자 단말기(200)에서 이루어지는 검색결과를 웹검색 시스템(100)으로 전송하여야 하므로, 클라이언트 프로그램의 설치시에 사용자의 동의를 얻도록 하는 것이 바람직하다.
웹페이지사용결과 데이터베이스(120)는 클라이언트프로그램이 설치된 사용자 단말기(200)로부터 전송되는 사용자의 웹페이지 이용정보를 저장한다.
상기 웹페이지 이용정보는 사용자 단말기(200)가 접속한 웹주소, 방문도, 누적접속시간 비율 등 클라이언트프로그램을 통해 사용자 단말기(200)로부터 얻을 수 있는 모든 정보를 포함하며, 링크인기도나 유사도를 더 포함할 수 있다.
색인데이터베이스(130)는 사용자가 입력한 검색어 또는 문장 등을 해당 검색어 또는 문장 등이 포함된 웹페이지의 URL과 링크하여 저장한다. 사용자가 검색어를 입력하면 그 검색어를 포함하는 웹페이지 URL을 색인데이터베이스(130)로부터 추출하여 중앙처리장치(110)에 제공한다.
중앙처리장치(110)는 색인데이터베이스(130)로부터 제공받은 웹페이지 링크를 웹페이지사용결과 데이터베이스(120)에서 링크인기도, 유사도, 방문도 및 누적접속시간 비율에 따라 정렬하여 사용자가 검색한 웹페이지 리스트를 제공하게 된다.
상기와 같이 구성되는 본 발명에 따른 웹페이지사용결과 데이터베이스(120)의 작용을 설명하면 다음과 같다.
도 2는 도 1의 웹페이지사용결과 데이터베이스(120)에 저장되어 있는 웹페이지 이용정보를 이용하여 추출한 웹페이지별 접속시간에 기반한 정보를 저장하는 방법을 설명하기 위한 흐름도이다.
사용자가 웹페이지를 방문하게 되면 사용자 단말기(200)의 클라이언트 프로그램은 현재 사용자 단말기(200)가 접속한 웹페이지의 웹주소 정보를 추출한다.
그리고 클라이언트 프로그램은 사용자가 방문한 웹페이지의 활성화 여부를 확인한다.(S210) 웹페이지가 활성화되어 있다는 것은 해당 웹페이지가 사용자 단말기(200) 화면의 가장 상위에서 출력되고 있다는 것을 의미한다. 웹페이지가 표시되고는 있지만 최상단 화면에 있지 않고 아래 화면에 있다는 것은 사용자가 현재 그 화면을 보지 않고 있다는 것을 의미한다. 따라서, 웹페이지의 활성화 여부는 사용자가 웹페이지를 보고 있는지를 판단하는 중요한 요소가 된다.
그리고 클라이언트 프로그램은 사용자 단말기(200)의 입력장치를 통해 신호의 입력이 있는지를 일정한 시간마다 확인한다.(S220) 입력장치에는 마우스, 키보드, 타블렛 등 사용자의 입력을 받아들일 수 있는 모든 장치가 포함된다.
다음으로 클라이언트 프로그램은 활성화되었던 웹페이지의 웹주소가 전환되거나 웹페이지의 창이 닫힐 때, 사용자가 방문한 웹페이지의 접속시간을 추출한다.(S230)
그리고, 특정 웹페이지에 대한 누적접속시간 또는 모든 웹페이지의 누적접속시간에 대한 당해 웹페이지 누적접속시간의 비율을 웹검색 시스템(100)으로 전송하여 웹페이지사용결과 데이터베이스(180)에 저장한다.(S240)
다른 방법으로는 클라이언트 프로그램이 접속시간에 대한 정보를 추출하여 웹검색 시스템(100)으로 전송하면, 웹검색 시스템(100)이 특정 웹페이지에 대한 접속시간, 누적접속시간 그리고 누적접속시간의 비율을 계산하여 저장할 수도 있다.
상기 웹페이지의 접속시간을 추출하는 방법은 아래와 같다.
사용자 단말기(200)에 설치된 클라이언트 프로그램은 웹페이지 활성화 여부, 주소창의 웹주소 전환과 창 닫힘, 입력장치 작동 여부를 감시한다. 클라이언트 프로그램은 웹페이지가 활성화되었을 때부터 웹주소 전환 시까지 또는 웹페이지 창이 닫힐 때까지의 웹페이지 활성화 시간을 측정한다. 이 때 일정시간 동안 사용자 단말기(200)의 입력장치를 통한 입력이 없었을 경우, 그 시간(결손시간)을 제외한 값으로써 해당 페이지의 접속시간을 계산한다.
도 3은 사용자의 웹페이지 접속시간을 산출하는 방식을 나타낸 그래프로서, 도 3을 참조하여 접속시간 산출방법을 설명한다.
먼저 특정 웹페이지가 활성화된 순간부터 웹페이지의 웹주소가 전환되거나 웹페이지의 창이 닫힐 때까지의 시간(T1+T2+T3+T4)을 측정하여 웹페이지의 활성화 시간을 구한다.
그리고 웹페이지가 활성화되어 있는 동안에 입력장치를 통해 마지막 입력(n번째 입력)이 들어온 때로부터 기준시간(T2)이 경과할 때까지 다음 입력(n+1번째 입력)이 들어오는지를 판단한다.
기준시간이 경과할 때까지 입력장치를 통한 신호의 입력이 없다면, 사용자가 웹페이지를 보고 있지 않는 것으로 간주하여 기준시간 경과시부터 다음 입력(n+1번째 입력)이 들어올 때까지 소요된 결손시간(T3)을 총 접속시간에서 제외한다. 이와 같은 계산을 통해 사용자가 특정 웹페이지에 실질적으로 접속했던 시간을 구할 수 있게 된다.
이를 수식으로 표현하면 다음과 같다.
웹페이지 활성화 시간(T1+T2+T3+T4) - 해당 웹페이지에 일정시간 이상 입력장치를 통한 입력이 없었던 결손시간(T3) = 접속시간(T1+T2+T4)
이와 같은 방식을 사용할 경우 신호의 입력 여부를 결정하는 기준시간(T2)은 웹페이지의 성격이나 특성, 주된 사용자층 등에 따라 달라질 수 있는데, 통상적인 포탈사이트의 웹페이지인 경우에는 1-3분 정도로 설정할 수 있을 것이다.
상기 웹페이지의 접속시간을 추출하는 또 다른 방법은 사용자가 상기 웹페이지가 활성화되어 있는 동안 입력장치를 통해 유효한 신호를 입력한 시간의 누적값으로써 접속시간을 추출하는 것이다.
입력장치를 통한 유효한 입력 시간이란, 마지막 입력시간으로부터 기준시간 이내에 입력장치를 통한 입력이 있는 시간이다. 웹페이지가 활성화된 상황에서 페이지가 전환 또는 창이 닫힐 때까지 입력장치를 통한 유효입력 시간을 누적하여 접속시간을 구한다.
도 4는 웹페이지사용결과 데이터베이스(180)에 저장된 레코드의 구조를 나타낸 구조도로서, 각각의 레코드는 웹주소, 접속시간, 누적접속시간 비율, 링크인기도, 유사도, 방문횟수 등이 저장될 수 있다.
링크인기도는 클라이언트 프로그램이 설치된 사용자 단말기(200)의 사용자가 방문하는 모든 웹페이지로부터 연결되는 링크를 걸고 있는 페이지 수에 대한 해당 페이지를 향하여 링크되어 있는 웹페이지 수이다.
유사도는 웹페이지 내 포함되어 있는 사용자가 검색어로 입력한 단어의 빈도수이다.
방문도는 클라이언트 프로그램이 설치된 사용자 단말기(220) 사용자가 방문하는 웹페이지의 사용 빈도이다. 클라이언트 프로그램이 사용자 단말기(220)의 웹주소 변환을 모니터링 하면서 방문한 페이지의 횟수를 증가시킨다. 긴 접속시간 동안 방문횟수가 적은 경우보다, 짧은 접속시간 동안 방문횟수가 많은 경우 문서가중치가 높게 반영되어 문서 이용 정도를 높게 측정하게 된다.
상기 방문도를 수학식으로 표현하면 아래와 같다.
방문도 = (방문횟수/접속시간)*k
다르게는 (방문횟수*k) 값을 방문도로 사용할 수도 있다.
이때 k 는 방문도를 0~1의 실수 값으로 표현하기 위한 임의의 실수이다.
상기 웹페이지사용결과 데이터베이스에 저장된 레코드의 구조는 달라질 수 있다.
도 5는 도 1의 중앙처리장치(110)에서 본 발명에 따른 사용자 웹페이지 접속정보를 이용하여 추출한 웹페이지별 누적접속시간에 기반한 웹페이지 검색 및 결과제공방법에 대한 일실시 예를 나타내는 흐름도이다.
사용자가 검색어를 입력(S310)하면 중앙처리장치(110)는 입력받은 검색어를 포함하는 웹페이지를 색인데이터베이스(130)에서 검색하여 웹페이지들을 추출(S320)하게 된다.
그리고 추출한 웹페이지들을 웹페이지사용결과 데이터베이스(120)에 저장된 누적접속시간의 비율, 링크인기도, 유사도, 방문도를 문서가중치에 따라서 재배열(S330) 하여 제공(S340)한다.
상기 문서가중치를 수학식으로 표현하면 아래와 같다.
문서가중치=a*누적 접속시간 비율 + b*링크인기도 + c*유사도 + d*방문도
여기서 a+b+c+d 는 1이 되도록 설정한다.
검색결과 웹페이지의 누적 접속시간 비율, 링크인기도, 유사도, 방문도를 오름차순으로 정렬하여 0~1 사이의 실수 값으로 표현한다. 정렬결과의 비중을 나타내는 a, b, c, d 값을 설정하여 검색결과에 따라 중앙처리장치(110)에서 웹페이지 리스트를 재배열한다.
상기 문서가중치는 지난 특정기간 동안의 문서가중치와 최근 특정기간 동안의 문서가중치를 측정하여 최근 특정기간 동안의 문서가중치에 가중치를 높게 할 수도 있다.
즉, 최근에 방문자들이 접속한 기록과 예전에 방문자들이 접속한 기록에 차이를 두어 방문도를 계산함으로써 현재의 웹페이지 인기를 충실하게 반영할 수 있다.
예를들어 특정기간을 한 달로 설정하고, 지난 특정기간과 최근 특정기간의 가중치를 0.3과 0.7로 각각 설정한다면 문서가중치를 아래의 식으로 구할 수 있다.
문서가중치 = 0.3*지난 한달 간 문서가중치 + 0.7* 최근 한달 간 문서가중치
여기서 '지난 한달 간'이란 현재로부터 '최근 한달' 이전에 있었던 한달을 의미한다. 즉 오늘이 2008년 11월 20일이라면 '10월 20일부터 11월 19일까지'가 '최근 한달'이 되고, '9월 20일부터 10월 19일까지'가 '지난 한달'이 되는 것이다.
특정기간의 길이를 다르게 설정할 수도 있을 것이다.
예를 들어 '최근 세달 간'의 문서가중치와, 최근 세달 이전의 '모든 기간'에 대한 문서가중치에 차이를 두는 것이다.
위의 예와 같이 오늘이 2008년 11월 20일이라면 '8월 20일부터 11월 19일까지'의 문서가중치에 0.7을 곱하고, '8월 19일 이전의 모든 기간'의 문서가중치에 0.3을 곱하여 계산하는 것이다.
이와 같은 방법을 사용함으로써 최신 데이터가 보다 더 많이 반영될 수 있게 된다.
전술한 예에서 특정기간이나 문서가중치에 곱하는 상수는 하나의 예시일 뿐, 웹페이지의 성격이나 방문자층, 트렌드의 순환 사이클 등을 고려하여 다양한 상수의 적용이 가능할 것이다.
누적 접속시간 비율, 링크인기도, 유사도, 방문도 각각에 대해 가중치 적용 여부와 가중치를 설정할 수 있을 것이다.
웹페이지들을 접속시간, 링크인기도, 유사도, 방문도 등에 따라서 검색하는 방법을 예를 들어 설명하면 다음과 같다.
사용자가 검색어를 입력하여 검색어에 대한 결과로 m개의 웹페이지를 검색하였다면, 검색결과 웹페이지를 누적 접속시간 비율, 링크인기도, 유사도, 방문도를 N0, N1,...., N(m-1), Nm 과 같이 오름차순으로 정렬하고, 각각의 웹페이지에 0~1사이의 실수 값을 설정한다.
a=0.4, b=0.1, c=0.4, d= 0.1 과 같이 접속시간 비율과 유사도에 비중을 두어 문서가중치를 설정하였다면, 상기 문서가중치 결과에 따라 웹페이지 리스트를 재배열하여 제공하는 것이다.
웹페이지의 검색결과를 제공할 때에는 접속시간이나 링크인기도, 유사도, 방문도 중 어느 하나를 기준으로 정렬된 자료를 제공할 수도 있고, 두 개 이상의 요소를 기준으로 정렬된 자료를 제공할 수도 있다.
본 발명이 속하는 기술분야의 통상의 지식을 가진 자는 본 발명이 그 기술적 사상이나 필수적인 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시 예들은 모든 면에서 예시적인 것이며 한정적이 아닌 것으로 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구의 범위에 의하여 나타내어지며, 특허청구의 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (11)

  1. 사용자 단말기가 상기 사용자 단말기에 특정 웹페이지가 표시되었던 시간인 접속시간에 대한 정보를 전송하면, 웹검색 시스템이 상기 접속시간에 대한 정보를 웹페이지사용결과 데이터베이스(120)에 저장하는 (a) 단계와;
    상기 웹검색 시스템은 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 저장하는 (b) 단계와;
    상기 접속시간에 대한 상기 사용자 단말기의 방문횟수의 비율인 방문도를 계산하는 (c)단계와;
    상기 웹페이지에 대한 링크를 포함하고 있는 다른 웹페이지의 수로 링크인기도를 계산하는 (d) 단계와;
    상기 웹페이지에 포함된 검색어의 빈도수로 유사도를 계산하는 (e) 단계와;
    모든 웹페이지의 누적접속시간에 대한 상기 웹페이지의 누적접속시간의 비율을 계산하는 (f) 단계와;
    상기 웹검색 시스템은
    Figure 112012070022110-pct00006

    의 식으로 문서가중치를 계산하는 (g) 단계와;
    상기 웹검색 시스템은 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 문서가중치의 순으로 정렬하여 상기 사용자 단말기에 제공하는 (h) 단계;를 포함하며,
    상기 문서가중치를 계산하는 식에서 a, b, c, d는 각각 0 부터 1 사이의 실수로서 a+b+c+d=1 이며,
    상기 (a) 단계는
    상기 웹페이지가 활성화되었을 때부터 웹주소 전환 시까지 또는 웹페이지 창이 닫힐 때까지의 웹페이지 활성화 시간을 측정하는 (a-1) 단계와;
    상기 웹페이지 활성화 시간 중에서 1분 내지 3분의 기준시간을 경과할 때까지 사용자 단말기의 입력장치를 통한 신호의 입력이 없는 경우, 상기 기준시간이 경과하는 시점부터 다음 입력신호가 들어올 때까지의 결손시간을 측정하는 (a-2) 단계와;
    상기 웹페이지 활성화 시간에서 상기 결손시간을 제외한 접속시간을 계산하는 (a-3) 단계;를 포함하는, 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법.
  2. 사용자 단말기가 상기 사용자 단말기에 특정 웹페이지가 표시되었던 시간인 접속시간에 대한 정보를 전송하면, 웹검색 시스템이 상기 접속시간에 대한 정보를 웹페이지사용결과 데이터베이스(120)에 저장하는 (a) 단계와;
    상기 웹검색 시스템은 상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 저장하는 (b) 단계와;
    상기 접속시간에 대한 상기 사용자 단말기의 방문횟수의 비율인 방문도를 계산하는 (c)단계와;
    상기 웹페이지에 대한 링크를 포함하고 있는 다른 웹페이지의 수로 링크인기도를 계산하는 (d) 단계와;
    상기 웹페이지에 포함된 검색어의 빈도수로 유사도를 계산하는 (e) 단계와;
    모든 웹페이지의 누적접속시간에 대한 상기 웹페이지의 누적접속시간의 비율을 계산하는 (f) 단계와;
    상기 웹검색 시스템은
    Figure 112012070022110-pct00007

    의 식으로 문서가중치를 계산하는 (g) 단계와;
    상기 웹검색 시스템은 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 문서가중치의 순으로 정렬하여 상기 사용자 단말기에 제공하는 (h) 단계;를 포함하며,
    상기 문서가중치를 계산하는 식에서 a, b, c, d는 각각 0 부터 1 사이의 실수로서 a+b+c+d=1 이며,
    상기 (a) 단계는
    상기 사용자 단말기가 활성화된 웹페이지에 접속하여 있는 동안 입력장치를 통한 유효한 입력 시간의 누적값으로써 접속시간을 계산하는 (a-1) 단계;를 포함하며,
    상기 유효한 입력시간이란 상기 웹페이지가 활성화된 상황에서 상기 입력장치를 통한 입력이 있는 시간을 누적한 값으로 정의하는 것을 특징으로 하는, 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법.
  3. 삭제
  4. 삭제
  5. 삭제
  6. 삭제
  7. 클라이언트 프로그램이 설치된 특정 사용자 단말기에 특정 웹페이지가 표시되었던 시간인 접속시간에 대한 정보를 전송받아 저장하는 웹페이지사용결과 데이터베이스와;
    상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 사용자 단말기에 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 상기 웹페이지에 대한 방문도와 링크인기도, 유사도를 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 모든 웹페이지의 누적접속시간에 대한 상기 웹페이지의 누적접속시간의 비율을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고,
    Figure 112012070022110-pct00008
    의 식으로 문서가중치를 계산한 후, 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 문서가중치의 순으로 정렬하여 상기 사용자 단말기에 제공하는 중앙처리장치;를 포함하며,
    상기 문서가중치를 계산하는 식에서 a, b, c, d는 각각 0 부터 1 사이의 실수로서 a+b+c+d=1 이며,
    상기 클라이언트 프로그램은
    상기 웹페이지가 활성화되었을 때부터 웹주소 전환 시까지 또는 웹페이지창이 닫힐 때까지의 웹페이지 활성화 시간을 측정하고, 상기 웹페이지 활성화 시간 중에서 1분 내지 3분의 기준시간을 경과할 때까지 사용자 단말기의 입력장치를 통한 신호의 입력이 없는 경우, 상기 기준시간이 경과하는 시점부터 다음 입력신호가 들어올 때까지의 결손시간을 측정하고, 상기 웹페이지 활성화 시간에서 상기 결손시간을 제외한 접속시간을 계산하는 것을 특징으로 하는, 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템.
  8. 클라이언트 프로그램이 설치된 특정 사용자 단말기에 특정 웹페이지가 표시되었던 시간인 접속시간에 대한 정보를 전송받아 저장하는 웹페이지사용결과 데이터베이스와;
    상기 웹페이지에 대한 상기 사용자 단말기의 접속시간을 모두 합산하여 상기 사용자 단말기에 상기 웹페이지가 표시되었던 전체 시간인 누적접속시간을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 상기 웹페이지에 대한 방문도와 링크인기도, 유사도를 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고, 모든 웹페이지의 누적접속시간에 대한 상기 웹페이지의 누적접속시간의 비율을 계산하여 상기 웹페이지사용결과 데이터베이스에 저장하고,
    Figure 112012070022110-pct00009
    의 식으로 문서가중치를 계산한 후, 상기 사용자 단말기가 접속했던 웹페이지 리스트를 상기 문서가중치의 순으로 정렬하여 상기 사용자 단말기에 제공하는 중앙처리장치;를 포함하며,
    상기 문서가중치를 계산하는 식에서 a, b, c, d는 각각 0 부터 1 사이의 실수로서 a+b+c+d=1 이며,
    상기 클라이언트 프로그램은
    상기 사용자 단말기가 활성화된 웹페이지에 접속하여 있는 동안 입력장치를 통한 유효한 입력 시간의 누적값으로써 접속시간을 계산하는 것을 특징으로 하는, 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템.
  9. 삭제
  10. 삭제
  11. 제1항 또는 제2항에 기재된 웹검색 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록 매체.
KR1020117010127A 2008-11-28 2008-11-28 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템 KR101212457B1 (ko)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/KR2008/007019 WO2010061990A1 (en) 2008-11-28 2008-11-28 Web page searching system and method using access time and frequency

Publications (2)

Publication Number Publication Date
KR20110084414A KR20110084414A (ko) 2011-07-22
KR101212457B1 true KR101212457B1 (ko) 2012-12-13

Family

ID=42225845

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020117010127A KR101212457B1 (ko) 2008-11-28 2008-11-28 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템

Country Status (5)

Country Link
US (1) US20110231415A1 (ko)
JP (1) JP5367088B2 (ko)
KR (1) KR101212457B1 (ko)
CN (1) CN102227737A (ko)
WO (1) WO2010061990A1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102394673A (zh) * 2011-11-17 2012-03-28 深圳市中兴移动通信有限公司 一种蓝牙设备排序的方法和系统
US9292793B1 (en) * 2012-03-31 2016-03-22 Emc Corporation Analyzing device similarity
US8788487B2 (en) * 2012-11-30 2014-07-22 Facebook, Inc. Querying features based on user actions in online systems
JP6194732B2 (ja) * 2013-10-03 2017-09-13 富士ゼロックス株式会社 情報管理装置、プログラム及び情報処理システム
CN103559203A (zh) * 2013-10-08 2014-02-05 北京奇虎科技有限公司 网页排序方法、装置和系统
CN103605689B (zh) * 2013-11-01 2017-12-29 北京奇虎科技有限公司 一种获取访问停留时间的方法及装置
CN103778254B (zh) * 2014-02-24 2017-08-01 北京国双科技有限公司 页面访问数据的处理方法、装置及系统

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2842415B2 (ja) * 1996-11-06 1999-01-06 日本電気株式会社 Url順序付け方法およびその装置
JPH11312177A (ja) * 1998-04-28 1999-11-09 Victor Co Of Japan Ltd ホームページ嗜好評価装置
JP3607093B2 (ja) * 1998-09-10 2005-01-05 シャープ株式会社 情報管理装置、および、そのプログラムが記録された記録媒体
JP2002358216A (ja) * 2000-08-08 2002-12-13 System Support:Kk コンピュータ監視システム
KR20030079095A (ko) * 2002-04-01 2003-10-10 (주)메타웨이브 개인 및 그룹별 웹페이지 방문이력정보를 이용한검색시스템 및 그 방법
US20040024756A1 (en) * 2002-08-05 2004-02-05 John Terrell Rickard Search engine for non-textual data
US7082573B2 (en) * 2003-07-30 2006-07-25 America Online, Inc. Method and system for managing digital assets
JP4396262B2 (ja) * 2003-12-22 2010-01-13 富士ゼロックス株式会社 情報処理装置、および情報処理方法、並びにコンピュータ・プログラム
KR100645608B1 (ko) * 2004-03-25 2006-11-13 (주)첫눈 사용자 방문 유알엘 로그를 이용한 정보 검색 서비스 제공 서버 및 그 방법
JP4528203B2 (ja) * 2005-05-30 2010-08-18 日本電信電話株式会社 ファイル検索方法、ファイル検索装置、及びファイル検索プログラム
US20070011020A1 (en) * 2005-07-05 2007-01-11 Martin Anthony G Categorization of locations and documents in a computer network
JP2007328423A (ja) * 2006-06-06 2007-12-20 Bank Of Tokyo-Mitsubishi Ufj Ltd コンテンツの閲覧時間算出システム、閲覧時間算出方法、及びプログラム
KR100822108B1 (ko) * 2006-06-19 2008-04-15 김정훈 검색 결과 문서에 대한 유저의 선호도 예측 시스템 및 그예측방법
KR20090025678A (ko) * 2007-09-07 2009-03-11 (주)이스트소프트 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및그 방법
US20090132579A1 (en) * 2007-11-21 2009-05-21 Kwang Edward M Session audit manager and method

Also Published As

Publication number Publication date
WO2010061990A1 (en) 2010-06-03
CN102227737A (zh) 2011-10-26
KR20110084414A (ko) 2011-07-22
JP2012510662A (ja) 2012-05-10
JP5367088B2 (ja) 2013-12-11
US20110231415A1 (en) 2011-09-22

Similar Documents

Publication Publication Date Title
KR101212457B1 (ko) 웹페이지 접속시간 및 방문도에 기반한 웹검색 방법 및 웹검색 시스템
KR100509276B1 (ko) 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치
CN107346326A (zh) 用于生成神经网络模型的方法和系统
US20180150466A1 (en) System and method for ranking search results
GB2499395A (en) Search method
TW201327233A (zh) 個性化的資訊推送方法及裝置
EP4083857A1 (en) Information prediction model training method and apparatus, information prediction method and apparatus, storage medium, and device
US8639560B2 (en) Brand analysis using interactions with search result items
CN103823907B (zh) 一种整合在线视频资源地址的方法、装置及引擎
CN101583951A (zh) 关键字管理程序、关键字管理系统和关键字管理方法
JP4894580B2 (ja) 旬度解析システム、旬度解析方法、及び旬度解析プログラム
CN105260469B (zh) 一种处理网站地图的方法、装置及设备
KR100987330B1 (ko) 사용자 웹 사용 정보에 기반한 멀티 컨셉 네트워크 생성시스템 및 방법
US20100306224A1 (en) Online Measurement of User Satisfaction Using Long Duration Clicks
CN114579858A (zh) 内容推荐方法和装置、电子设备、存储介质
CN104252459B (zh) 推荐常用站点的方法和装置
CN110851708B (zh) 负样本的抽取方法、装置、计算机设备和存储介质
US20160307223A1 (en) Method for determining a user profile in relation to certain web content
CN116016365B (zh) 一种加密流量下基于数据包长度信息的网页识别方法
CN112269906A (zh) 网页正文的自动抽取方法及装置
CN107944589A (zh) 广告点击率的预测方法和预测装置
TWI524281B (zh) 地名排序方法及地名排序系統與電腦可讀取記錄媒體
KR20130082882A (ko) 사용자의 전환 패턴 분석을 이용한 아이템 추천 방법 및 장치
KR20090025678A (ko) 웹페이지 접속시간 및 방문도에 기반한 웹검색 시스템 및그 방법
JP5890413B2 (ja) 多数のデータレコードをサーチする方法及びサーチエンジン

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151210

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20181210

Year of fee payment: 9