KR100785754B1

KR100785754B1 - 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간키워드 순위 결정 시스템

Info

Publication number: KR100785754B1
Application number: KR1020060025987A
Authority: KR
Inventors: 최재걸; 임규민; 김동욱
Original assignee: 엔에이치엔(주)
Priority date: 2006-03-22
Filing date: 2006-03-22
Publication date: 2007-12-18
Also published as: KR20070095609A

Abstract

본 발명은 특정 지역에 대해 키워드 입력성향을 실시간으로 반영하여 지역 인기키워드를 추출함으로써 특정 지역과 관련된 인터넷 사용자에게 실질적으로 가치있는 인기키워드 정보를 제공할 수 있는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템에 관한 것이다. 본 발명에 따르면, 검색서버에 접속하는 검색자의 지역적 위치와 관련된 특정 지역에서 현재 인기가 있는 키워드를 실시간으로 검출 함으로써, 지역별 인기키워드에 대한 정보를 신속하고 정확하게 식별할 수 있는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공할 수 있다.

인기키워드, 급상승 키워드, 키워드 입력성향, 키워드 순위

Description

지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템{REALTIME RUSH KEYWORD WITH LOCALITY}

도 1은 본 발명의 일실시예에 따른 실시간 급상승 키워드 검출 시스템의 네트워크 연결을 나타내는 도면이다.

도 2는 본 발명의 일실시예에 따른 지역별 실시간 키워드 순위 결정 시스템을 나타내는 구성도이다.

도 3은 본 발명에 따른 지역 인기키워드 추출의 개략적인 알고리즘을 설명하기 위한 도면이다.

도 4는 본 발명의 인기키워드 산출시 가중치의 크기를 자동 조절하는 일례를 설명하기 위한 도면이다.

도 5는 본 발명에 따른 지역 인기키워드를 추출하는 일례를 설명하기 위한 도면이다.

도 6은 본 발명의 일실시예에 따른 지역별 실시간 키워드 순위 결정 방법을 구체적으로 도시한 작업 흐름도이다.

도 7은 본 발명에 따른 인기키워드 지수를 산출하는 일례를 설명하기 위한 작업 흐름도이다.

<도면의 주요 부분에 대한 부호의 설명>

200 : 지역별 실시간 키워드 순위 결정 시스템

210 : 저장공간 220 : 대상 식별 수단

230 : 로그 분석 수단 240 : 지수 산출 수단

250 : 키워드 추출 수단

본 발명은 특정 지역에 대해 키워드 입력성향을 실시간으로 반영하여 지역 인기키워드를 추출함으로써 특정 지역과 관련된 인터넷 사용자에게 실질적으로 가치있는 인기키워드 정보를 제공할 수 있는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템에 관한 것이다.

일반적으로 검색 서비스를 제공하는 검색서버는 검색자로부터 검색용 키워드를 입력 받으면, 입력된 키워드에 대응하여 검색 결과(예컨대, 상기 키워드를 직접 포함하는 웹사이트, 상기 키워드를 직접 포함하는 기사, 상기 키워드를 직접 포함하는 파일명을 갖는 이미지 등)를 검색자에게 제공하고 있다.

이러한 검색 서비스에 있어서 입력되는 키워드는 다양하게 존재할 수 있으나, 실제 키워드의 입력횟수에 기준하여 소수의 키워드가 전체 입력횟수에서 차지하는 비율이 높게 되고, 나머지 키워드는 전체 입력횟수에서 차지하는 비율이 매우 낮게 된다.

이러한 입력횟수가 상위인 키워드를 분석해 보면, 1) 항상 입력횟수가 높은 키워드(예를 들면, "게임", "고스톱", "연예인" 등)가 있는 반면, 2) 일정한 기간에 입력횟수가 급격하게 상승하여 상위 키워드에 속하게 되는 경우가 있다.

인기키워드의 추출에 있어서, 상기 1)의 경우만 고려하는 경우, 많이 검색되는 키워드가 항상 인기키워드로 추출되기 때문에 검색자에게는 그다지 유용하거나 실용적인 정보로 인식되지 못할 소지가 있다.

또한 상기 2) 만을 고려하여 인기키워드를 추출하는 경우에도 입력횟수와 무관하게 입력횟수가 크게 변화하는 키워드 만이 인기키워드로 추출되기 때문에 이것 역시 유용한 정보라 할 수 없을 것이다.

따라서, 소정 키워드에 대해 상기 1) 및 2)를 수치로서 환산하고, 환산된 수치를 최적한 비율로 조합함으로써 다양한 키워드 입력성향에 맞도록 인기키워드를 추출하는 것이 중요하게 인식되고 있다.

더욱이, 종래의 인기키워드 추출 방식은 지역을 배제하여 추출한 방식으로, 특정 지역에 관심을 갖는 검색자에게는 정보로서 가치없는 것일 수도 있다.

따라서, 현시점에서의 키워드 입력성향을 실시간으로 반영하여 인기키워드를 신속하게 추출하되 검색자의 지역과 관련한 지역 인기키워드를 최적하게 추출하여 검색자에게 제공함으로써 검색횟수의 증가 및 검색자의 접속 시간 증가를 자연스럽게 도모할 수 있는 새로운 인기키워드 추출 모델이 절실하게 요청되고 있다.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 검색서버에 접속하는 검색자의 지역적 위치와 관련된 특정 지역에서 현재 인기가 있는 키 워드를 실시간으로 검출 함으로써, 지역별 인기키워드에 대한 정보를 신속하고 정확하게 식별할 수 있는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공하는 것을 목적으로 한다.

또한, 본 발명은 지역 인기키워드를 검출하는 데에 근거가 되는 팩터의 가중치 크기를, 키워드 중복 현황에 따라 자동적으로 조절되도록 함으로써 의미있는 지역 인기키워드의 검출이 이루어지도록 하는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공하는 것을 목적으로 한다.

또한, 본 발명은 특정 지역과 관련한 검색자의 입력 성향에 따라 지역별 인기키워드를 신속하게 검출함으로써, 검색횟수의 증가 및 검색자의 접속 시간을 증가시켜 인터넷 검색 서비스 제공 업체로 하여금 영업 이익을 증대할 수 있도록 하는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공하는 것을 목적으로 한다.

상기의 목적을 이루기 위한 본 발명에 따른 지역별 실시간 키워드 순위 결정 방법은, 검색서버로부터 수집한 로그정보를 수집시간에 대응하여 저장공간에 기록하는 단계와, 시간 t에 상기 검색서버로의 검색자 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간을 식별하는 단계와, 식별된 저장공간 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성하는 단계와, 상기 생성된 결과 데이터를 참조하여 상기 로그정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출하는 단계, 및 산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로서 추출하는 단계를 포함하는 것을 특징으로 한다.

또한, 상기 목적을 달성하기 위한 본 발명의 기술적 구성으로서 지역별 실시간 키워드 순위 결정 시스템은, 검색서버로부터 수집한 로그정보를 수집시간에 대응하여 기록하는 저장공간과, 시간 t에 상기 검색서버로의 검색자 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간을 식별하는 대상 식별 수단과, 식별된 저장공간 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성하는 로그 분석 수단과, 상기 생성된 결과 데이터를 참조하여 상기 로그정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출하는 지수 산출 수단, 및 산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로서 추출하는 키워드 추출 수단을 포함하는 것을 특징으로 한다.

이하, 첨부된 도면을 참조하여 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템에 대하여 설명한다.

본 명세서에서 지속적으로 사용되는 인기키워드는 검색 작업을 지원하는 검색서버에 입력되는 검색용 키워드 중에서 평소에 입력되던 검색 횟수에 비해 현시점에서 급격하게 검색 횟수가 증가한 키워드, 또는 다른 키워드 보다 상대적으로 많은 검색 횟수로 입력되는 키워드 등을 지칭할 수 있다.

특히 본 명세서에서 지칭하는 인기키워드는, 검색서버에 접속하는 검색자의 지역적 위치를 식별하고, 식별된 지역적 위치에 상응하여 지역별로 결정되는 지역 인기키워드를 의미할 수 있다.

이러한 지역 인기키워드로는 특정 지역에 한정되며 전체 검색 횟수를 근거로 인기키워드를 추출해야 하는 지역성이 강한 키워드, 또는 단순히 검색 횟수를 근거로는 인기키워드로서 의미가 없어 급상승 검색 횟수를 근거로 인기키워드를 추출해야 하는 보편성이 강한 키워드가 있을 수 있다. 상기 보편성이 강한 키워드는 일반적으로 지역과 무관하게 높은 검색 횟수로 입력되는 키워드일 수 있다.

지역 인기키워드의 추출을 위해 본 명세서에서는 분석 대상이 되는 로그정보의 키워드 중복 현황에 따라 지역 인기키워드로 추출하는 기준을 상이하게 할 수 있다.

예컨대 본 발명의 지역별 실시간 키워드 순위 결정 시스템은 분석 대상의 키워드 중에서 중복되는 키워드의 수가 소수라서 분석 대상이 되는 키워드가 많을 경우, a) 검색 횟수가 높은 키워드를 지역 인기키워드로 결정할 수 있다.

반면, 본 발명의 지역별 실시간 키워드 순위 결정 시스템은 분석 대상의 키워드 중에서 중복되는 키워드의 수가 다수라서 분석 대상이 되는 키워드가 적을 경우, b) 검색 횟수가 급상승하고 있는 키워드를 지역 인기키워드를 결정할 수 있다.

예를 들어, 특정 지역에 대해 선별된 분석 대상이 되는 키워드 15개 중에서 11개의 키워드가 2회 이상 중복되는 경우, 지역별 실시간 키워드 순위 결정 시스템은 소정 기간 동안 급격하게 검색 횟수가 증가한 순서대로 키워드를 지역 인기키워드로서 추출할 수 있다.

반면, 특정 지역에 대해 선별된 분석 대상이 되는 키워드 15개 중에서 2회 이상 중복되는 키워드가 없는 경우, 지역별 실시간 키워드 순위 결정 시스템은 상기 15개의 키워드에 대해 검색 횟수가 높은 순서대로 키워드를 지역 인기키워드로서 추출할 수 있다.

본 명세서에서는 분석 대상이 되는 키워드의 중복 현황에 따라 지역 인기키워드를 추출하는 기준이 자동으로 조정되도록 함으로써 단순히 검색 횟수에만 의존하지 않고 검색자에게 실질적으로 가치가 있는 정보로서의 지역 인기키워드 추출이 이루어지도록 한다.

이러한 지역 인기키워드는 특정 지역에 관련된 검색자에게, 상기 지역과 관련되는 다른 검색자들의 키워드 입력성향을 인지시켜 인기키워드가 무엇인가에 대한 정보를 제공하는 역할을 한다. 더불어, 검색 서비스를 지원하는 검색서버의 운영자에게는, 인기키워드(키워드의 검색 순위)에 관한 정보를 제공받은 검색자로 하여금, 인기키워드를 한번쯤 입력하도록 유도할 수 있어 검색 횟수 및 검색시간을 증가시킬 수 있고 이에 따라 보다 많은 영업이익을 창출할 수 있도록 한다.

지역별 실시간 키워드 순위 결정 시스템(100)은 특정 지역과 관련하는 인기키워드를 추출하는 장치로서, 과거에 비하여 검색 횟수가 급격하게 증가된 키워드 또는 전체 검색 횟수가 높은 키워드를, 검색자(120)가 위치한 지역을 고려하여 검출하는 역할을 한다. 또한, 지역별 실시간 키워드 순위 결정 시스템(100)은 검출된 인기키워드를 급상승 정도 또는 검색 횟수를 이용한 인기키워드 지수에 따라 배 열한 지역 인기키워드 목록을 검색서버(110)에 제공할 수 있다. 이에 따라, 지역별 실시간 키워드 순위 결정 시스템(100)은 특정 지역에 관련되는 검색자들의 키워드 입력성향에 관한 정보를, 동일한 지역에 관련되며 현재 검색서버(110)에 접속하는 검색자(120)에게 실시간으로 제공할 수 있다.

우선, 검색서버(110)는 검색자(120)가 검색하고자 하거나 또는 구현하고자 하는 텍스트/오디오/비디오 등의 콘텐츠를 보유하는 콘텐츠공급자(CP)를 서치하고, 서치된 콘텐츠공급자(CP)의 웹사이트로 검색자(120)를 접속 유도시켜 검색 작업을 지원하는 프로그램 또는 검색 엔진 서버를 의미할 수 있다. 이러한 검색서버(110)에 의한 검색 작업은 검색자(120)로부터의 검색 요청에 응답하여 생성된 검색 결과를 검색자(120)에게 제공하거나, 상기 검색 결과에 대한 검색자(120)의 클릭 선택에 따라 검색자(120)를 콘텐츠공급자(CP)의 웹사이트로 접속 유도시키는 과정 등으로 정의할 수 있다.

또한, 검색서버(110)는 접속하는 검색자(120)에게 검색창을 제공하고, 상기 검색창을 통해 검색자(120)로부터 검색용 키워드를 획득할 수 있다. 이후, 검색서버(110)는 획득한 검색용 키워드를 포함하는 로그정보를 생성하고, 생성된 로그정보를 소정의 메모리 수단(도시하지 않음)에 누적 기록한다.

상술한 바와 같이, 로그정보에는 검색용 키워드, 검색서버(110) 접속시 활용되는 IP 주소, 키워드의 입력 시간 등에 관한 정보가 포함될 수 있다.

검색서버(110)는 소정의 시간 내에 생성된 로그정보를 상기 메모리 수단에 누적해두었다가, 본 발명의 지역별 실시간 키워드 순위 결정 시스템(100)에서 상기 메모리 수단에 누적된 로그정보를 리드(read)함에 따라 삭제하고 차후 생성될 로그정보의 누적, 기록에 대비한다.

또한, 검색서버(110)는 접속하는 검색자(120)의 식별된 지역에 따라 본 발명의 지역별 키워드 순위 결정 시스템(100)에서 제공되는 지역 인기키워드에 관한 정보(지역 인기키워드 리스트)를 검색자(120)에게 노출시키는 역할을 한다.

검색자(120)는 검색서버(110)와의 접속을 위한 사용자단말기(130)를 보유하며, 검색하고자 하는 콘텐츠 자료를 보유하는 콘텐츠공급자(CP)의 웹사이트에 대한 검색 요청을, 검색서버(110)에서 제공하는 검색창에 키워드를 입력하여 생성하는 인터넷 이용자를 의미할 수 있다. 또한, 검색자(120)는 본 발명의 지역별 실시간 키워드 순위 결정 시스템(100)에서 제공하는 지역 인기키워드에 관한 정보를 검색서버(110)를 경유하여 제공 받을 수 있어, 자신이 위치하는 지역에 대해 인기가 있는 키워드에 대한 정보를 습득할 수 있다.

사용자단말기(130)는 인터넷 등의 통신망(140)을 통해 지역별 실시간 키워드 순위 결정 시스템(100)과의 접속 상태를 유지하며, 지역별 실시간 키워드 순위 결정 시스템(100)에 의해 인기키워드로 검출된 키워드를 시각화하여 검색자(120)에게 표시하는 장치이다.

지역별 실시간 키워드 순위 결정 시스템(100)은 하나 이상의 검색서버(110)로부터 소정 시간 간격으로 로그정보를 지속적으로 수집하고, 수집된 로그정보를 가공, 분석하여 검색서버(110)에 접속한 검색자(120)의 지역에서 현재 인기가 있는 키워드를 식별하여 인기키워드로서 검출하는 역할을 한다.

이하, 도 2를 참조하여 본 발명의 지역별 실시간 키워드 순위 결정 시스템(200)의 구체적인 구성을 설명한다.

본 발명의 지역별 실시간 키워드 순위 결정 시스템(200)은 저장공간(210), 대상 식별 수단(220), 로그 분석 수단(230), 지수 산출 수단(240) 및 키워드 추출 수단(250)을 포함할 수 있다.

저장공간(210)은 검색서버(110)로부터 수집한 로그정보를 수집시간에 대응하여 기록한다. 지역별 실시간 키워드 순위 결정 시스템(200)은 소정 시간 간격으로 검색서버(110)로부터 로그정보를 리드하고, 상기 시간(수집시간)에 대응하는 저장공간에 로그정보를 기록, 유지한다. 예컨대, 수집시간 t에 리드된 로그정보는 상기 수집시간 t에 대응하는 논리적, 물리적 기록 수단인 저장공간(210)에 기록될 수 있다. 여기서, 수집시간 t는 지역별 실시간 키워드 순위 결정 시스템(200)의 운영자에 의해 유연하게 설정되는 시간 또는 시간 간격을 의미할 수 있으며, 예컨대 인기키워드를 보다 정확하게 검출 가능하도록 허용되는 최초 시간 간격으로 설정될 수 있다.

특히, 로그정보의 저장공간(210) 기록에 있어서, 지역별 실시간 키워드 순위 결정 시스템(200)은 리드된 로그정보를 지역별로 파싱하여 상기 수집시간 t에 대응하는 저장공간(210)에 기록할 수 있다. 상기 지역에 따른 파싱 처리는 검색자(120)가 키워드를 입력하는 경우, 사용자단말기(130)가 활용한 IP 또는 PROXY 정보 를 이용하여 수행될 수 있다. 이러한 파싱에 의한 지역을 구분한 로그정보의 기록에 의해 지역별 실시간 키워드 순위 결정 시스템(200)은 특정 지역에 상응하는 로그정보를 식별하여 추출할 수 있는 환경을 마련할 수 있다.

예컨대, 지역별 실시간 키워드 순위 결정 시스템(200)은 검색서버(110)로의 검색자(120) 접속시 사용자단말기(130)가 활용한 IP 주소를 HTTP 프로토콜에 의하여 확인할 수 있으며, 소정의 IP-위치 매핑 테이블을 이용하여 상기 확인된 IP 주소에 해당하는 사용자단말기(130), 즉 검색자(120)의 지역적 위치를 식별할 수 있게 된다. 이는 IP 주소가 특정 지역에 따라 고유하게 할당되는 것에 기인한 것으로, 키워드를 입력한 사용자단말기(130)의 IP 주소가 확인되는 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 해당 IP 주소가 고유하게 할당되는 실제의 위치에 관한 정보를 식별할 수 있다. 여기서 IP-위치 매핑 테이블은 확인된 IP 주소를 갖는 사용자단말기(130)의 지역적 위치 정보를, 해당 IP 주소 정보와 대응하여 저장하는 목록을 지칭할 수 있다. 예컨대, 시간 t 시점에 지역 r에 할당된 IP 주소를 활용하여 검색서버(110)에 접속하는 사용자단말기(130)에 대해, 지역별 실시간 키워드 순위 결정 시스템(200)은 상기 시간 t 및 지역 r과 관련하여 작성된 로그정보를 상기 시간 t 및 지역 r에 대응하는 저장공간(210)에 기록할 수 있다.

대상 식별 수단(220)은 시간 t에 검색서버로의 검색자(120) 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간(210)을 식별한다. 즉, 대상 식별 수단(220)은 인기키워드를 추출하는 데에 자료가 될 수 있는 로그정보를 선별하기 위해, 슬라이딩 윈도우(Sliding Window)를 이용하여 분석대상 으로서의 저장공간을 선별하는 역할을 한다. 슬라이딩 윈도우는 시간 흐름에 따라 분석 대상이 변경되도록 하는 것으로, 본 시스템의 운영자에 의해 설계된 시간 폭을 유지하며, 상기 시간폭 이내에 포함되는 수집시간에 대응하는 저장공간(210)을 구분한다.

예컨대, 시간 1분에서부터 시간 2분까지 5sec 단위의 수집시간에 대응하는 저장공간(210)에 대해, 시간폭 30sec를 갖는 슬라이딩 윈도우를 이용하여 분석 대상을 선별하는 경우, 대상 식별 수단(220)은 현재 시점을 기준으로 지난 30sec 이전에 발생한 로그정보를 저장하는 저장공간들(시간 1분, 1분 5초 ∼ 1분 30초에 각각 대응하는 저장공간(210)을 식별할 수 있다.

또한, 대상 식별 수단(220)은 검색서버(110)에 접속하는 검색자(120)의 지역적 위치를 IP 또는 PROXY 정보를 통해 확인하고, 확인된 지역적 위치를 고려하여 특정 지역에 대응하는 저장공간(210)을 선별할 수 있다. 즉, 대상 식별 수단(220)은 슬라이딩 윈도우에 의해 선별된 저장공간들 중에서 검색자(120)의 식별된 지역에 대응하는 저장공간(210)만을 선택적으로 식별할 수도 있다.

로그 분석 수단(230)은 식별된 저장공간(210) 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성한다. 즉, 로그 분석 수단(230)은 식별된 저장공간(210)에 기록된 로그정보를 구성하는 키워드를 확인하고, 분석 대상이 되는 상기 확인된 키워드에 대한 중복 여부를 인지하여 결과 데이터를 생성한다. 이에 따라, 로그 분석 수단(230)에 의해 생성된 결과 데이터에는 예컨대 분석 대상이 되는 키워드의 중복 개수, 중복된 키워드의 비율 등에 관한 정보가 포함될 수 있다.

지수 산출 수단(240)은 생성된 결과 데이터를 참조하여 상기 로그정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출한다. 즉, 지수 산출 수단()은 키워드에 대해 인기 성향과 관련한 점수를 연산하여 부여하고, 부여된 점수에 따라 후술하는 키워드 추출 수단(250)에서 지역 인기키워드를 추출할 수 있는 환경을 마련한다.

인기키워드 지수의 산출에 있어서, 지수 산출 수단(240)은 로그정보의 키워드와 관련한 팩터를 연산하고, 키워드 중복 현황을 고려하여 상기 연산된 팩터 각각에 적용할 가중치의 크기를 결정한다. 지수 산출 수단(240)에 의해 연산되는 팩터로는 본 실시예에서, 급상승 관련 팩터인 팩터 DPA 및 팩터 SQD, 전체 검색 횟수 관련 팩터인 팩터 MPR 및 CPM을 예시하고 있다.

즉, 지수 산출 수단(240)은 연산된 상기 팩터에 대해 가중치를 적용하여 인기키워드 지수(JAVL),

를 유도할 수 있다.

특히, 지수 산출 수단(240)은 상기 키워드 중복 현황에 따라 팩터에 적용되는 가중치의 크기에 대해 자동적인 조정이 발생하도록 하여, 정보로서 가치있는 지역 키워드의 추출이 도모되도록 할 수 있다.

예컨대, 결과 데이터가 키워드 중복 현황이 선정된 개수 이하의 키워드 중복을 나타내고 있을 경우, 지수 산출 수단(240)은 분석 대상이 되는 키워드의 수가 많고 또한 이들 키워드들이 지역성을 강하게 띈다는 것을 판단할 수 있다. 이에 따라, 지수 산출 수단(240))은 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기가, 급상승 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하는 제어할 수 있다. 즉, 지수 산출 수단(240)은 팩터 MPR 또는 팩터 CPM이 보다 강조되도록 가중치의 크기를 결정할 수 있다.

상기 팩터 MPR은

을 만족하며 연산될 수 있으며, 지수 산출 수단(240)은 로그정보를 구성하는 키워드 각각에 대한 쿼리 순위(Rank(query))를 결정하고, 결정된 쿼리 순위(Rank(query))를 역수 형태로 전환하여 팩터 MPR을 연산한다. 팩터 MPR은 실시간으로 집계된 쿼리의 순위의 역수형태이고, 팩터 MPR의 값이 클수록 순위가 높다는 것을 나타낸다. 이러한 팩터 MPR은 연산된 값을 직접 이용하지 않고, 값을 적절하게 변형하여 순위의 현재 상태를 반영하는 척도로서 사용할 수 있다.

상기 팩터 CPM은

을 만족하며 연산될 수 있으며, 지수 산출 수단(240)은 로그정보를 구성하는 키워드 각각에 대한 실시간 추정 검색 횟수(R(query))를 카운트하고, 카운트된 추정 검색 횟수(R(query))를, 급상승이 되기 위해 설정된 최소 검색 횟수(MinimumCnt)로 나누어 팩터 CPM을 연산한다. 팩터 CPM은 실제 검색 횟수를 반영하는 인자일 수 있다. 즉, 팩터 CPM은 실제 검색된 횟수를 일정 크기(급상승이라고 판단할 수 있는 최소 검색 횟수)로 나누어준 값이 다. 상기 값은 실제 검색 횟수가 반영되는 인자로서, 특정 키워드의 실제 순위가 반영되는 인자와 쌍을 이룰 수 있으며, 상기 값이 큰 키워드일수록 현 상태의 반영(즉, 지역성의 반영)이 두드러질 수 있다.

반면, 결과 데이터가 키워드 중복 현황이 선정된 개수 이상의 키워드 중복을 나타내고 있을 경우, 지수 산출 수단(240)은 분석 대상이 되는 키워드의 수가 적고 또한 이들 키워드들이 보편성을 강하게 띈다는 것을 판단할 수 있다. 이에 따라, 지수 산출 수단(240))은 급상승 관련 팩터에 적용하는 가중치의 크기가, 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하는 제어할 수 있다. 즉, 지수 산출 수단(240)은 팩터 DPA 또는 팩터 SQD가 보다 강조되도록 가중치의 크기를 결정할 수 있다.

상기 팩터 DPA는

을 만족하며 연산될 수 있으며, 지수 산출 수단(240)은 로그정보를 구성하는 키워드에 대한 추정 검색 횟수(R(query)) 및 평균 검색 횟수(Avg(query))를 카운트하고, 카운트된 추정 검색 횟수(R(query))와 평균 검색 횟수(Avg(query))와의 차이값을, 상기 평균 검색 횟수(Avg(query))로 나누어 팩터 DPA을 연산한다. 팩터 DPA는 특정 쿼리의 실시간 검색 횟수와 기준 검색 횟수의 차이를 기준 검색 횟수로 나누어 준 값이다. 즉, 팩터 DPA는 평균적으로 검색되는 횟수와 현재 검색되는 횟수와의 차이를 정규화한 값이다. 상기 값이 클수록 평균적 검색 횟수를 상회하여 많이 검색되고 있음을, 즉 급상승되는 키워드 임을 나타내고 있다.

상기 팩터 SQD는

을 만족하며 연산될 수 있으며, 지수 산출 수단(240)은 로그정보를 구성하는 키워드에 대한 변량을 계산하고 계산된 변량을 특정 쿼리의 표준편차(Dev(query)로 나누어 팩터 SQD를 연산한다. 여기서 변량이란 실시간 검색 횟수와 기준 검색 횟수의 차이값을 지칭하는 값이다. 팩터 SQD는 변량을 표준편차로 나누어준 값으로서, 표준 정규 분포상에서 위치를 나타낼 수 있다. 상기 팩터 SQD의 크기가 클수록 급상승 정도가 크다는 것을 의미할 수 있다.

즉, 지수 산출 수단(240)은 결과 데이터에 의해 분석 대상의 키워드들이 보편성을 나타내는 것으로 판단되면 팩터 DPA 또는 팩터 SQD가 강조되도록 가중치의 크기를 결정하고, 분석 대상의 키워드들이 지역성을 나타내는 것으로 판단되면, 팩터 MPR 또는 팩터 CPM이 강조되도록 가중치의 크기를 결정한다.

이러한 인기키워드 지수에서의 가중치 자동 조절을 통해 본 발명은 키워드 현황에 따라 정보로서 실질적인 가치가 있는 지역 인기키워드의 추출을 자연스럽게 유도할 수 있는 환경을 마련한다.

상기 인기키워드 지수 중에서, 가중치를 구성하는 점유율 x는

를 만족하여 연산되며, 지수 산출 수단(240)은 m일간 검색 횟수 Top n에서 발견된 동일 키워드의 개수를 N으로, 총 키워드의 개수를 T로 하여 점유율 x를 연산한다.

또한, 지수 산출 수단(240)은 키워드 중복 현황에 따라 팩터에 적용되는 가 중치의 크기를 조정하는 데에 있어서, 급상승 관련 팩터측 또는 전체 검색 횟수 관련 팩터측으로 가중치의 크기가 편중되는 막기 위해 최소 가중치 k를 설정할 수 있다. 이때, k는 0에서 1사이의 값으로 정의함으로써 팩터에 적용되는 가중치의 크기가 가변적인 범위 이내에서 변동되도록 유도한다.

키워드 추출 수단(250)은 산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로 추출한다. 즉, 키워드 추출 수단(250)은 부여된 인기키워드 지수를 고려하여 키워드 각각에 대한 순위를 결정하고, 설정된 순위에 따라 선정된 순위 이내의 키워드를 선별하여 지역 인기키워드로서 추출하는 역할을 한다. 이후, 키워드 추출 수단(250)은 추출된 지역 인기키워드들을 리스트화하고, 상기 지역 인기키워드 리스트가 검색자(120)가 접속한 검색서버(110)를 통해 상기 검색자(120)에게 제공되도록 할 수 있다.

따라서, 본 발명에 따른 지역 인기키워드의 추출시 분석 대상의 키워드의 중복 현황에 따라 팩터에 적용되는 가중치의 크기를 자동 조절하여 정보로서 가치 있는 지역 인기키워드의 추출을 유도되도록 할 수 있다.

우선, ① 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 일정 간격 마다 소정의 분석 장치(예, i50198, i50199 장비)에서 검색서버(110)에 누적된 로그정보를 수집한다. 즉, 지역별 실시간 키워드 순위 결정 시스템(200)은 각 검색서버(110)에 쌓이는 로그정보를 실시간으로 수집하여 분석장비에 제공한다. 예 컨대, 지역별 실시간 키워드 순위 결정 시스템(200)은 5초 간격으로 검색서버(110)로부터 로그정보를 가져올 수 있다.

② 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 분석장비에 수집된 로그정보를 파싱하여 필요한 데이터를 수집시간 t의 데이터로 저장한다. 이때, 지역별 실시간 키워드 순위 결정 시스템(200)은 IP와 proxy를 이용하여 각 지역별로 데이터를 따로 저장할 수 있다.

③ 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 수집된 실시간 데이터만으로는 실시간 급상승이라고 판단할 만한 기준이 없다는 판단하에서, 이전에 데이터를 일정 기간 수합하여 각 쿼리별로 급상승이라고 판단할 만한 기준을 작성해 둘 수 있다. 지역별 실시간 키워드 순위 결정 시스템(200)은 작성된 기준 데이터와 상기 실시간 데이터를 비교하여 실시간 키워드의 급상승을 판단할 수 있다.

④ 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 각 t 시점에서 데이터들을 time-window의 크기만큼 합산하여 사용할 수 있다. 예컨대, 300초의 time-window를 설정했다면 지역별 실시간 키워드 순위 결정 시스템(200)은 현시점으로부터 300초 이전에 생성된 데이터들을 합산하여 사용할 수 있다. 상기 time-window는 정해진 시간마다 슬라이딩을 하며, 분석 대상이 되는 데이터를 지속적으로 변화시킨다. 예컨대, time-window가 5초 간격으로 슬라이딩하는 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 5초마다 새로운 데이터를 이용하여 알고리즘을 재수행 할 수 있다.

⑤ 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 time-window에 속한 데이터를 합산한 결과와 기 생성된 기준 데이터를 비교 분석하여 인기키워드를 추출한다. 이때, 지역별 실시간 키워드 순위 결정 시스템(200)은 각 상황에 맞도록 인기키워드를 정의하여 추출할 수 있다. 예컨대, 지역별 실시간 키워드 순위 결정 시스템(200)은 분석대상이 되는 키워드의 중복 현황에 따라 인기키워드로서, 소정 기간 동안에 급상승한 키워드 또는, 전체 검색 횟수가 높은 키워드를 인기키워드로 추출할 수 있다.

⑥ 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 시간 t 시점의 데이터들의 기본적인 정보(쿼리별 검색속도, 검색 가속도 등)를 저장해 둔다. 이러한 처리는 인기키워드라고 판단된 키워드를 검색자(120) 등에게 노출시킬 때, 함께 디스플레이 해야 할 정보를 유지하는 것이다.

⑦ 단계에서 지역별 실시간 키워드 순위 결정 시스템(200)은 상기 time-window가 한번 슬라이딩 할 때 마다 급상승 쿼리들을 추출한다. 이후, 지역별 실시간 키워드 순위 결정 시스템(200)은 추출된 상기 급상승 쿼리와 쿼리 정보를 조합하여 최종 결과물을 산출하여 검색자(120)에게 제공할 수도 있다.

키워드의 속성에 따라 가중치를 자동으로 조절하기 위해, 지역별 실시간 키워드 순위 결정 시스템(200)은 검색 횟수가 높은 Top n개의 키워드를 m일 동안 조사하여 각 키워드의 점유율 k를 계산하고, 계산된 점유율 k에 따라 조정되는 가중치의 크기를 결정할 수 있다.

예를 들어, 특정한 키워드들이 연속(중복)하여 Top n개의 키워드 안에 존재한다면 지역별 실시간 키워드 순위 결정 시스템(200)은 해당 키워드들에게 보편성이 강하게 나타나는 것으로 판단하고, 급상승 관련 팩터인 팩터 DPA 또는 팩터 SQD에 적용될 가중치의 크기를 크게 결정한다.

반면, 분석대상이 되는 키워드 내에 중복되지 않는 키워드가 없다면, 지역별 실시간 키워드 순위 결정 시스템(200)은 해당 키워드들에게 지역성이 강하게 나타나는 것으로 판단하고, 전체 검색 횟수 관련 팩터인 팩터 CPM 또는 팩터 MPR에 적용될 가중치의 크기를 크게 결정한다.

도 4에서는 이전 3일 동안의 키워드 입력 현황에 대해 검색 횟수가 Top 5위 내의 키워드를 예시하고 있다.

도 4를 살펴보면, 키워드 '농협', 'G마켓', '국민은행'이 Top 5위 안에 3일 연속 나타나는 것을 알 수 있다. 또한, 키워드 '로또'는 Top 5위 안에 2일 연속 나타나는 것을 알 수 있다. 이러한 도 4의 조건에서, 지역별 실시간 키워드 순위 결정 시스템(200)은 중복되어 존재하는 키워드를 15개 중 11개로 식별하고, 중복된 키워드의 비율을 73%(11/15)로 계산한다. 계산된 비율 73%는 지역별 실시간 키워드 순위 결정 시스템(200)에 의해 보편성을 나타낸다고 정의할 수 있고, 상기 73%이라는 수치에 상응하는 값을 이용하여 팩터 DPA 또는 팩터 SQD에 적용할 가중치의 크기를 결정할 수 있다.

예를 들어, 지역별 실시간 키워드 순위 결정 시스템(200)은 급상승 관련 팩터인 팩터 DPA 또는 팩터 SQD에 적용될 가중치의 크기를 전체 가중치의 크기에 대 해 73%로 결정하고, 나머지 27%가 전체 검색 횟수 관련 팩터인 팩터 CPM 또는 팩터 MPR에 할당되도록 가중치 크기를 조정하여 결정할 수 있다. 이때, 각 팩터에 결정되는 가중치의 크기가 하나의 팩터에만 치우쳐 크게 결정되는 것을 방지하기 위해, 지역별 실시간 키워드 순위 결정 시스템(200)은 최소 가중치 k를 정해놓고 가변적 범위에서 팩터의 가중치가 결정되도록 하고 있다. 최소 가중치 k는 상수 0에서부터 1 사이의 값을 가질 수 있다. 최소 가중치 k의 값이 클수록 결정되는 가중치의 크기가 변동되는 값은 그 폭이 줄어들게 된다.

상술한 바와 같이, 점유율 x는 N/T로 연산하며, 이때 N은 m일간 top n에서 발견된 동일 키워드의 개수이고, T는 총 키워드의 개수를 의미한다. 즉, 점유율 x는 동일 키워드가 나타난 점유 비율을 계산한 값으로, 점유율 x의 값이 클수록 보편성이 강하다고 평가할 수 있다.

지역별 실시간 키워드 순위 결정 시스템(200)은 점유율 x와 최소 가중치 k로 구성되는 가중치를 각 팩터에 적용한 인기키워드 지수의 산출 공식을

로 유도할 수 있다.

상기 인기키워드 지수에 의해서, 지역별 실시간 키워드 순위 결정 시스템(200)은 도 4에서 중복되는 키워드의 개수가 11개의 다수임을 확인하고 해당 키워드들에 대해 보편성이 강하게 나타난다고 판단하고, 이에 따라 급상승 관련 팩터인 팩터 DPA 또는 팩터 SQD의 가중치 크기가 높게 결정되도록 할 수 있다.

만약, 도 4와는 반대로 중복되는 키워드가 적다고 가정하는 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 해당 키워드들에 대해 지역성이 강하게 나타난다고 판단하고, 이에 따라 전체 검색 횟수와 관련한 팩터인 팩터 CPM 또는 팩터 MPR의 가중치 크기가 높게 결정되도록 할 것이다.

도 5에서는 급상승 관련 팩터인 DPA 또는 SQD를 강조했을 때의 순위 결정 모델과, 전체 검색 횟수 관련 팩터인 CMP 또는 MPR을 강조했을 때의 순위 결정 모델과의 차이를 예시하고 있다.

즉, 지역별 실시간 키워드 순위 결정 시스템(200)은 중복된 키워드가 많아 키워드당 검색 횟수가 모두 높게 나타날 것을 감안하여, 식별력이 상대적으로 높아진 급상승 관련 팩터에 가중치 크기를 크게 적용하여 지역 인기키워드의 추출을 시도한다.

반면, 지역별 실시간 키워드 순위 결정 시스템(200)은 중복된 키워드가 없어 개별 키워드당 검색 횟수에 의해서도 의미있는 인기키워드의 추출이 가능할 경우, 전체 검색 횟수 관련 팩터에 가중치 크기를 크게 적용하여 지역 인기키워드의 검출을 시도한다.

도 5에서는 분석 대상이 동일한 키워드에 대해 가중치 크기를 상이하게 함에 따라 상이하게 추출된 지역 인기키워드에 대해 예시하고 있다. 예컨대, 검색 횟수가 항시 많은 키워드 '농협'에 대해, 팩터 MPR 또는 팩터 CMP가 강조되는 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 지역 인기키워드 1순위로 상기 키워드 '농협'을 추출할 수 있으나, 만약 팩터 DPA 또는 팩터 SQD를 강조하는 경우에는 지역 인기키워드로서 추출되지 않을 수도 있다.

이를 통해 본 발명에 의하면, 단순히 검색 횟수가 많아 항상 인기키워드를 추출되는 것을 억제하고, 더 나아가 검색자(120)에게 정보로서 가치있는 키워드 만이 인기키워드로 추출되도록 유도할 수 있다.

따라서, 본 발명에 따르면, 검색서버(110)에 접속하는 검색자(120)의 지역적 위치와 관련된 특정 지역에서 현재 인기가 있는 키워드를 실시간으로 검출 함으로써, 지역별 인기키워드에 대한 정보를 신속하고 정확하게 식별할 수 있다.

또한, 지역별 실시간 키워드 순위 결정 시스템(200)은 지역 인기키워드를 검출하는 데에 근거가 되는 팩터의 가중치 크기를, 키워드 중복 현황에 따라 자동적으로 조절되도록 함으로써 의미있는 지역 인기키워드의 검출이 이루어지도록 할 수 있다.

이하, 본 발명의 실시예에 따른 지역별 실시간 키워드 순위 결정 시스템의 작업 흐름을 상세히 설명한다.

본 발명의 지역별 실시간 키워드 순위 결정 방법은 상술한 지역별 실시간 키워드 순위 결정 시스템(200)에 의해 수행된다.

우선, 지역별 실시간 키워드 순위 결정 시스템(200)은 검색서버(110)로부터 수집한 로그정보를 수집시간에 대응하여 저장공간(210)에 기록한다(S610). 본 단 계(S610)는 검색서버(110)의 메모리 수단에 누적, 기록되는 로그정보를 주어진 시간 간격을 가져오고, 수집시간 t에 대응하는 저장공간(210)에 기록하는 과정이다.

특히, 본 단계(S610)에서의 지역별 실시간 키워드 순위 결정 시스템(200)은 수집시간 t에서 검색서버(110)에 누적된 로그정보를 리드하고, 상기 리드된 로그정보를 지역별로 파싱하여 수집시간 t에 대응하는 저장공간(210)에 기록한다. 즉, 지역별 실시간 키워드 순위 결정 시스템(200)은 키워드 입력시 활용된 IP 또는 PROXY를 이용하여 로그정보의 지역을 식별하고 식별된 지역에 특정하는 저장공간(210)으로 로그정보가 기록되도록 한다.

또한, 지역별 실시간 키워드 순위 결정 시스템(200)은 시간 t에 검색서버(110)로의 검색자(120) 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간(210)을 식별한다(S620). 본 단계(S620)는 소정의 시간폭은 갖는 슬라이딩 윈도우에 의해 분석 대상이 되는 저장공간(210)을 식별하는 과정으로, 검색자(120)의 지리적 위치 또는 검색자(120)가 접속한 시간을 고려하여 저장공간(210)을 선별한다.

다음으로, 지역별 실시간 키워드 순위 결정 시스템(200)은 식별된 저장공간(210) 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성한다(S630). 본 단계(S630)는 분석 대상으로서 로그 정보의 키워드 중에서 중복되는 키워드의 개수가 선정된 수치를 만족하는가를 확인하고, 확인 결과를 결과 데이터로 생성하는 과정이다. 예컨대, 결과 데이터에는 분석 대상의 키워드 중에서 중복하는 키워드가 '다수 있음' 또는 '없음'과 같은 메시지 정보를 포함할 수 있다.

또한, 지역별 실시간 키워드 순위 결정 시스템(200)은 생성된 결과 데이터를 참조하여 로그 정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출한다(S640). 본 단계(S640)는 키워드의 인기 정도를 판단하는 근거로서 인기키워드 지수를 각 키워드에 부여하는 과정이다. 즉, 지역별 실시간 키워드 순위 결정 시스템(200)은

를 만족하여 키워드 각각에 대한 인기키워드 지수를 부여한다.

특히, 본 단계(S640)에서의 지역별 실시간 키워드 순위 결정 시스템(200)은 키워드 중복 현황에 따라 상기 인기키워드 지수를 구성하는 팩터에 적용할 가중치의 크기를 자동으로 조정할 수 있다.

우선, 지역별 실시간 키워드 순위 결정 시스템(200)은 로그정보의 키워드와 관련한 팩터를 연산한다(S710). 본 단계(S710)는 급상승 관련 팩터인 팩터 DPA 또는 팩터 SQD를 연산하고, 또한 전체 검색 횟수 관련 팩터인 팩터 MPR 또는 팩터 CPM을 연산하는 과정이다. 상기 팩터 각각에 대한 연산 과정은 상술한 지수 산출 수단(240)의 설명으로 갈음하고 여기서는 생략한다.

또한, 지역별 실시간 키워드 순위 결정 시스템(200)은 키워드 중복 현황을 고려하여, 연산된 팩터 각각에 적용할 가중치의 크기를 결정한다(S720). 본 단계 (S720)는 분석 대상의 키워드가 중복되는 개수가 선정된 기준을 만족함에 따라 팩터에 적용할 가중치의 크기를 조정하는 과정이다.

만약, 상기 키워드 중복 현황이 선정된 개수 이상의 키워드 중복을 나타내고 있을 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 급상승 관련 팩터에 적용하는 가중치의 크기가, 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 한다. 즉, 지역별 실시간 키워드 순위 결정 시스템(200)은 급상승 관련 팩터인 팩터 DPA 또는 팩터 SQD를 강조하여 인기키워드 지수를 산출한다.

반면, 상기 키워드 중복 현황이 선정된 개수 이하의 키워드 중복을 나타내고 있을 경우, 지역별 실시간 키워드 순위 결정 시스템(200)은 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기가, 급상승 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 한다. 즉, 지역별 실시간 키워드 순위 결정 시스템(200)은 전체 검색 횟수 관련 팩터인 팩터 MPR 또는 팩터 CPM를 강조하여 인기키워드 지수를 산출한다.

다시 도 6을 보면, 지역별 실시간 키워드 순위 결정 시스템(200)은 산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로서 추출한다(S650). 본 단계(S650)는 검색서버(110)에 접속한 검색자(120)의 지역 위치에서 인기가 많은 키워드를 상기 인기키워드 지수 순으로 검출하여 리스트에 배열하는 과정이다.

이후, 지역별 실시간 키워드 순위 결정 시스템(200)은 추출된 지역 인기키 워드(지역 인기키워드 리스트)를 검색서버(110)를 통해 검색자(120)에게 노출되도록 제어할 수 있다.

본 발명의 실시예들은 다양한 컴퓨터로 구현되는 동작을 수행하기 위한 프로그램 명령을 포함하는 컴퓨터 판독 가능 매체를 포함한다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 로컬 데이터 파일, 로컬 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체는 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체, CD-ROM, DVD와 같은 광기록 매체, 플롭티컬 디스크와 같은 자기-광 매체, 및 롬, 램, 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 로컬 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.

지금까지 본 발명에 따른 구체적인 실시예에 관하여 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서는 여러 가지 변형이 가능함은 물론이다. 그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 안되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.

이상의 설명에서 알 수 있는 바와 같이, 본 발명에 따르면, 검색서버에 접속하는 검색자의 지역적 위치와 관련된 특정 지역에서 현재 인기가 있는 키워드를 실시간으로 검출 함으로써, 지역별 인기키워드에 대한 정보를 신속하고 정확하게 식별할 수 있는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공할 수 있다.

또한, 본 발명에 따르면, 지역 인기키워드를 검출하는 데에 근거가 되는 팩터의 가중치 크기를, 키워드 중복 현황에 따라 자동적으로 조절되도록 함으로써 의미있는 지역 인기키워드의 검출이 이루어지도록 하는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공할 수 있다.

또한, 본 발명에 따르면, 특정 지역과 관련한 검색자의 입력 성향에 따라 지역별 인기키워드를 신속하게 검출함으로써, 검색횟수의 증가 및 검색자의 접속 시간을 증가시켜 인터넷 검색 서비스 제공 업체로 하여금 영업 이익을 증대할 수 있도록 하는 지역별 실시간 키워드 순위 결정 방법 및 지역별 실시간 키워드 순위 결정 시스템을 제공할 수 있다.

Claims

검색서버로부터 수집한 로그정보를 지역별로 파싱하고, 상기 파싱된 로그정보를 수집시간에 대응하여 저장공간에 기록하는 단계;

시간 t에 상기 검색서버로의 검색자 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간을 식별하는 단계;

식별된 저장공간 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성하는 단계;

상기 생성된 결과 데이터를 참조하여 상기 로그정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출하는 단계; 및

산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로서 추출하는 단계

를 포함하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제1항에 있어서,

인기키워드 지수를 산출하는 상기 단계는,

상기 로그정보의 키워드와 관련한 팩터를 연산하는 단계; 및

상기 키워드 중복 현황을 고려하여, 상기 연산된 팩터 각각에 적용할 가중치의 크기를 결정하는 단계

를 포함하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제2항에 있어서,

상기 결과 데이터가 상기 키워드 중복 현황이 선정된 개수 이상의 키워드 중복을 나타내고 있을 경우,

가중치의 크기를 결정하는 상기 단계는,

급상승 관련 팩터에 적용하는 가중치의 크기가, 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제2항에 있어서,

상기 결과 데이터가 상기 키워드 중복 현황이 선정된 개수 이하의 키워드 중복을 나타내고 있을 경우,

가중치의 크기를 결정하는 상기 단계는,

전체검색 횟수 관련 팩터에 적용하는 가중치의 크기가, 급상승 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제1항에 있어서,

인기키워드 지수를 산출하는 상기 단계는,

를 만족하여 상기 인기키워드 지수를 산출하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

급상승 관련 팩터인 상기 팩터 DPA는,

를 만족하여 연산하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

급상승 관련 팩터인 상기 팩터 SQD는,

를 만족하여 연산하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

전체검색 횟수 관련 팩터인 상기 팩터 MPR은,

를 만족하여 연산하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

전체검색 횟수 관련 팩터인 상기 팩터 CPM은,

를 만족하여 연산하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

가중치를 구성하는 점유율 x는,

를 만족하여 연산하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제5항에 있어서,

가중치를 구성하는 최소 가중치 k는,

0 에서 1 사이의 값으로 정의하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
삭제
제1항에 있어서,

저장공간을 식별하는 상기 단계는,

상기 검색자의 접속과 연관하는 IP 또는 PROXY 정보를 이용하여 식별된 지역과 관련한 저장공간을 식별하는 단계

를 포함하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 방법.
제1항 내지 제11항, 제13항 중 어느 한 항의 방법을 실행시키기 위한 프로그램을 기록한 컴퓨터 판독 가능한 기록 매체.
검색서버로부터 수집한 로그정보를 지역별로 파싱하고, 상기 파싱된 로그 정보를 수집시간에 대응하여 기록하는 저장공간;

시간 t에 상기 검색서버로의 검색자 접속에 따라, 수집시간 t에서부터 상기 t 이전의 수집시간 T까지 대응하는 저장공간을 식별하는 대상 식별 수단;

식별된 저장공간 각각에 기록된 로그정보를 분석하여 키워드 중복 현황에 관한 결과 데이터를 생성하는 로그 분석 수단;

상기 생성된 결과 데이터를 참조하여 상기 로그정보를 구성하는 키워드 각각에 대한 인기키워드 지수를 산출하는 지수 산출 수단; 및

산출된 인기키워드 지수를 이용하여 키워드의 순위를 결정하고, 선정된 순위 이내의 키워드를 인기키워드로서 추출하는 키워드 추출 수단

을 포함하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 시스템.
제15항에 있어서,

상기 지수 산출 수단은 상기 로그정보의 키워드와 관련한 팩터를 연산하고, 상기 키워드 중복 현황을 고려하여 상기 연산된 팩터 각각에 적용할 가중치의 크기를 결정하며,

(1) 상기 결과 데이터가 상기 키워드 중복 현황이 선정된 개수 이상의 키워드 중복을 나타내고 있을 경우, 급상승 관련 팩터에 적용하는 가중치의 크기가, 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하고,

(2) 상기 결과 데이터가 상기 키워드 중복 현황이 선정된 개수 이하의 키워드 중복을 나타내고 있을 경우, 전체검색 횟수 관련 팩터에 적용하는 가중치의 크기가, 급상승 관련 팩터에 적용하는 가중치의 크기보다 상대적으로 높게 되도록 하는 것을 특징으로 하는 지역별 실시간 키워드 순위 결정 시스템.