KR20090029368A - 연관 급상승어 검색 방법 및 그 시스템 - Google Patents

연관 급상승어 검색 방법 및 그 시스템 Download PDF

Info

Publication number
KR20090029368A
KR20090029368A KR1020070094545A KR20070094545A KR20090029368A KR 20090029368 A KR20090029368 A KR 20090029368A KR 1020070094545 A KR1020070094545 A KR 1020070094545A KR 20070094545 A KR20070094545 A KR 20070094545A KR 20090029368 A KR20090029368 A KR 20090029368A
Authority
KR
South Korea
Prior art keywords
search
word
candidate
terms
analyzing
Prior art date
Application number
KR1020070094545A
Other languages
English (en)
Other versions
KR100913051B1 (ko
Inventor
김동욱
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020070094545A priority Critical patent/KR100913051B1/ko
Priority to JP2010521767A priority patent/JP5112517B2/ja
Priority to PCT/KR2008/004634 priority patent/WO2009038285A1/en
Priority to US12/677,454 priority patent/US8725723B2/en
Publication of KR20090029368A publication Critical patent/KR20090029368A/ko
Application granted granted Critical
Publication of KR100913051B1 publication Critical patent/KR100913051B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

연관 급상승어 검색 방법 및 그 시스템을 제공한다. 연관 급상승어 검색 방법은 검색어별 일별 검색 횟수를 포함하는 검색 로그를 데이터베이스에 기록하고 유지하는 단계와, 상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출하는 단계와, 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 단계 및 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링하는 단계를 포함한다.
피크, 추출, 연관, 급상승, 필터링

Description

연관 급상승어 검색 방법 및 그 시스템{method for searching relation sudden rising word and system thereof}
본 발명은 연관 급상승어를 검색하는 방법 및 그 시스템에 관한 것으로, 더욱 상세하게는 검색 횟수의 시간에 따른 변화 추이를 이용하여 같은 피크를 형성하는 연관 급상승어를 검색하는 방법 및 그 시스템에 관한 것이다.
일반적으로 검색 서비스를 제공하는 검색 서비스 시스템은 사용자로부터 검색쿼리가 입력되면 상기 검색 쿼리에 대응하는 검색 결과(예를 들면, 상기 검색 쿼리를 포함하는 웹 사이트, 상기 검색 쿼리를 포함하는 기사, 상기 검색 쿼리를 포함하는 파일명을 갖는 이미지 등)를 사용자에게 제공한다.
한편, 최근의 검색 서비스 시스템은 사용자가 원하는 정보를 보다 빠르고 정확하게 찾을 수 있도록 하기 위해 사용자로부터 입력 받은 검색 쿼리와 연관 관계가 있는 검색 쿼리를 추출하여 사용자에게 제공하는 연관 검색 쿼리 제공 서비스를 제공하고 있다. 즉, 검색 서비스 시스템은 입력된 검색 쿼리에 따라 매우 다른 검색 결과를 사용자에게 제공하는 것이 보통이다. 예를 들어, 검색자가 "자동차"를 입력하여 얻은 검색 결과와 "승용차"를 입력하여 얻게 되는 검색 결과는 서로 상이하다. 따라서, 검색자는 자신이 원하는 정보를 얻기 위하여 자신이 원하는 정보와 좀 더 관련성이 높은 검색 쿼리를 입력하려고 하지만, 검색자 스스로 이러한 검색 쿼리를 떠 올리기가 어려운 경우들이 있다. 따라서, 최근의 검색 서비스 시스템은 사용자가 입력한 검색 쿼리 및 통계 정보를 이용하여 상기 입력된 검색 쿼리와 관련성이 있는 검색 쿼리들을 사용자에게 제공함으로써, 사용자가 다른 검색 쿼리를 이용하여 검색할 수 있도록 하는 서비스를 제공하고 있다.
여기서, 상기 연관 관계가 있는 검색 쿼리라 함은, 예를 들어 사용자로부터 입력 받은 검색 쿼리의 상위 개념 또는 하위 개념에 해당하는 검색 쿼리("일본어"를 입력 받은 경우 "외국어", 또는 역으로 "외국어"를 입력 받은 경우 "일본어"), 사용자로부터 입력 받은 검색 쿼리와 동의어 관계에 있는 검색 쿼리("책방"을 입력 받은 경우 "서점"), 사용자로부터 입력 받은 검색 쿼리와 유의어 관계에 있는 검색 쿼리("꼬리"를 입력 받은 경우 "꽁지"), 사용자로부터 입력 받은 검색 쿼리와 관계어 관계에 있는 검색 쿼리("see"를 입력 받은 경우 "saw, seen, seeing") 등 의미적으로 관련이 있는 검색 쿼리를 의미할 수 있다. 그러나, 상기 연관 관계가 있는 검색 쿼리는 단순히 의미적 관련이 있는 검색 쿼리만을 의미하는 것은 아니며, 예를 들어 사용자로부터 "박찬호"를 입력 받은 경우 그의 직업인 "야구", 그가 속한 리그인 "메이저 리그", 그의 출신 대학인 "한양대", 그가 속해 있는 소속팀인 "텍사스 레인저스", 같은 메이저 리그에 속한 한국인 야구 선수인 "김병현" 등 다양한 관점에서의 관련이 있는 검색 쿼리를 의미할 수 있다.
하지만 종래 연관 검색어 서비스 방법은 단순하게 검색 쿼리와 상위 개념 또는 하위 개념에 해당하는 검색어나 검색 쿼리와 유의어 관계가 있는 검색어, 검색 쿼리와 관련된 검색어만을 제공하는 것에 불과하다. 즉, 종래 관련어 검색 방법에 의하더라도, 사용자로부터 입력 받은 검색 쿼리와 연관 관계가 없는 검색 쿼리가 추출될 가능성이 여전히 높고, 이로 인해 질 높은 서비스를 제공 받아 원하는 정보를 보다 빠르고 정확하게 찾기를 원하는 사용자의 욕구를 충족시킬 수 없는 단점이 있다.
이에, 사용자로부터 입력 받은 검색 쿼리에 관한 데이터를 효과적으로 수집하고, 상기 수집된 데이터를 체계적으로 분석하여 검색 횟수의 시간에 따른 변화 추이를 이용하여 연관 급상승어를 정확하게 판단함으로써 사용자에게 보다 질 높은 연관 검색어 서비스를 제공할 수 있는 새로운 기술의 출현이 요청되어 왔다.
본 발명은 검색 횟수의 시간에 따른 변화 추이를 이용하여 같은 피크를 형성하는 연관 급상승어를 검색하는 방법 및 그 시스템을 제공한다.
또한 본 발명은 검색어의 시간 분포에서 피크를 찾아내고 피크를 비교하여 후보 검색어들을 찾아낸 후 후보 검색어들 중에서 의미없는 후보 검색어를 제거함으로써 연관 급상승어를 제공하는 방법 및 그 시스템을 제공한다.
본 발명의 일실시예에 따른 연관 급상승어 검색 방법은, 검색어별 일별 검색 횟수를 포함하는 검색 로그를 데이터베이스에 기록하고 유지하는 단계와, 상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출하는 단계와, 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 단계 및 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링하는 단계를 포함한다.
본 발명의 일실시예에 따른 연관 급상승어 검색 시스템은, 검색어별 일별 검색 횟수를 포함하는 검색 로그를 기록하고 유지하는 데이터베이스와, 상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출하는 추출부와, 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 비교부 및 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 검색어들간의 연관성을 분석하여 연관성이 없는 검색어를 필터링하는 필터링부를 포함한다.
본 발명에 따르면, 검색 횟수의 시간에 따른 변화 추이를 이용하여 같은 피크를 형성하는 연관 급상승어를 검색하는 방법 및 그 시스템을 제공할 수 있다.
또한 본 발명에 따르면, 검색어의 시간 분포에서 피크를 찾아내고 피크를 비교하여 후보 검색어들을 찾아낸 후 후보 검색어들 중에서 의미없는 후보 검색어를 제거함으로써 연관 급상승어를 제공하는 방법 및 그 시스템을 제공할 수 있다.
이하 첨부된 도면들을 참조하여 연관 급상승어 검색 방법 및 그 시스템을 상세하게 설명하기로 한다.
도 1은 본 발명에 따른 연관 급상승어 검색 시스템 및 사용자 단말기간의 연동 관계를 나타내는 도면이다.
도 1을 참조하면, 연관 급상승어 검색 시스템(110)은 통신망(120)을 통해 사용자 단말기(130-1~130-n)로부터 사용자에 의해 입력된 검색어를 제공 받는다. 통신망(120)은 연관 급상승어 검색 시스템(110)과 사용자 단말기(130-1~130-n)간의 데이터 통신을 위한 각종 유무선 통신망 또는 인터넷을 포함할 수 있다. 사용자 단말기(130-1~130-n)는 상기 사용자로부터 검색하고자 하는 대상과 관련된 검색어를 입력 받고, 상기 검색어를 통신망(120)을 통해 연관 급상승어 검색 시스템(110)으로 전송한다.
연관 급상승어 검색 시스템(110)은 상기 사용자에 의해 입력된 검색어별로 일별 검색 횟수를 포함하는 검색 로그를 데이터베이스에 기록하고 유지한다.
도 2는 본 발명에 따른 검색어별 일별 검색 횟수의 일례를 나타내는 도면이다.
도 2를 참조하면, 검색어별 일별 검색 횟수는 날마다 다르게 나타나며, 이는 그 당시의 사회적 관심도에 따라 사용자들에 의해 입력되는 검색어의 검색 횟수가 달라지기 때문이다. 즉, 상기 검색어별 일별 검색 횟수를 시간의 변화에 따라 발생되는 피크(peak)는 해당 검색어가 사회적인 이슈(issue)가 되었거나 해당 검색어가 시간적으로 의미가 있었던 시점을 나타낸다. 이와 같이, 동일한 시점에 같은 피크를 형성하는 검색어들이 존재하는데 상기 검색어들은 연관 관계가 있을 개연성이 있다.
연관 급상승어 검색 시스템(110)은 도 2에 도시된 것과 같이 검색어별 일별 검색 횟수의 시간에 따른 추이 변화를 이용하여 같은 피크를 형성한 검색어들을 검색한다.
일례로 연관 급상승어 검색 시스템(110)은 사용자 단말기(130-1~130-n)로부터 '법무부'라는 검색어가 입력된 경우, 같은 시점에 같은 피크를 형성한 다른 검색어들로 '노동부, 행정자치부, 청와대, 보건복지부, 사시로, 법률저널, 사법고시, 사법시험, 815특별사면내용, 경찰청 홈페이지, 음주운전사면, 음주면허시험관리단' 등이 검색할 수 있다.
연관 급상승어 검색 시스템(110)은 도 2에 도시된 것과 같은 검색어의 시간 분포에서 피크들을 찾아내고, 상기 피크들을 비교하여 후보 검색어들을 찾아낸 후 상기 후보 검색어들 중에서 의미가 없는 후보 검색어들을 제거함으로써 연관성이 있고 검색 횟수가 급상승한 연관 급상승어를 검색할 수 있다.
연관 급상승어 검색 시스템(110)은 상기 검색된 연관 급상승어를 통신망(120)을 사용자 단말기(130-1~130-n)로 제공한다.
도 3은 본 발명의 일실시예에 따른 연관 급상승어 검색 시스템의 구성을 나타내는 도면이다.
도 3을 참조하면, 연관 급상승어 검색 시스템(110)은 검색어 입력부(310), 데이터베이스(320), 추출부(330), 비교부(340) 및 필터링부(350)를 포함한다.
검색어 입력부(310)는 사용자로부터 검색어를 입력 받는다. 즉, 검색어 입력부(310)는 상기 사용자로부터 검색하고자 하는 대상과 연관된 검색어를 입력 받는다.
데이터베이스(320)는 검색어별 일별 검색 횟수를 포함하는 검색 로그를 기록하고 유지한다. 즉, 데이터베이스(320)는 검색어 입력부(310)를 통해 상기 사용자로부터 입력되는 검색어에 대한 검색 시간 정보, 일별 검색 횟수 등을 포함하는 검색 로그를 기록하고 유지할 수 있다.
추출부(330)는 데이터베이스(320)를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출한다. 즉, 추출부(330)는 데이터베이스(320)로부터 일정 기간 내에 상기 검색어별로 일별 검색 횟수를 추출한다.
그리고, 추출부(330)는 상기 검색어별로 일별 검색 횟수를 분석하여 짧은 기 간 내의 급상승과 급하강이 발생한 피크를 추출한다. 즉, 추출부(330)는 상기 검색어별로 일별 검색 횟수를 분석하여 정해진 상승 기준치 이상으로 급상승한 후 정해진 하강 기준치 이상으로 급하강하는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출한다. 일례로 추출부(330)는 상기 검색어별로 일별 검색 횟수를 분석한 결과로 하루만에 상기 검색 횟수가 10배이상 된 급상승과 하루만에 상기 검색 횟수가 10배로 떨어진 급하강이 7일 이내에 나타나는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출할 수 있다. 예를 들어, 추출부(330)는 상기 검색어별로 일별 검색 횟수를 분석한 결과로 상기 피크가 발생한 검색어 및 상기 피크가 발생한 날짜 정보를 (이효리, 7월 2일), (법무부, 6월 24일) 등과 같은 쌍(pair)의 집합으로 추출할 수 있다.
비교부(340)는 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교한다. 즉, 비교부(330)는 상기 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교하고, 상기 피크 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 검색한다. 또한 비교부(340)는 비교 대상이 되는 피크들의 급상승 시간 정보 및 급하강 시간 정보를 분석하여 급하강 시간차가 급상승 시간차보다 커지도록 상기 정해진 기간을 설정할 수 있다. 예를 들어 특정 피크의 상승 날짜를 peak.up이라고 하고, 특정 피크의 하강 날짜를 peak.down이라고 하고, 제1 피크(peak1) 제2 피크(peak2)가 있다고 하면, |peak1.up - peak2.up|<delta1이고, |peak1.down - peak2.down|<delta2일 때 제1 피크(peak1)와 제2 피크(peak2)가 동일한 피크를 형성한다고 할 수 있다. 여 기서, delta1은 제1 피크와 제2 피크의 상승에 대한 시간차이고, delta2는 제1 피크와 제2 피크의 하강에 대한 시간차를 의미한다. 일반적으로 하강은 상승보다 다르게 움직일 수 있기 때문에 비교부(340)는 delta2가 delta1보다 크게 되도록 설정된 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교할 수 있다.
필터링부(350)는 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링한다. 즉, 필터링부(350)는 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 분석하여 연관성이 있는지 여부를 판단하고, 상기 연관성 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링한다. 일례로 필터링부(350)는 상기 후보 검색어들을 분석하여 상호 연관 검색어인 경우, 연관성이 있는 것으로 판단하여 연관 급상승어로 선택되도록 필터링할 수 있다. 일례로 필터링부(350)는 상기 검색어들이 입력된 검색 세션(session)의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 검색 세션의 수를 측정하여 상호 연관성 여부를 판단하고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링할 수 있다. 일례로 필터링부(350)는 상기 검색어들이 입력된 사용자 식별자의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 사용자 식별자의 수를 측정하여 상호 연관성 여부를 판단하고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링할 수 있다. 일례로 필터링부(340)는 상기 검색어들이 입력된 IP 주소의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 IP 주소의 수를 측정하여 상호 연관성 여부를 판단하고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링할 수 있다. 일례로 필터링부(350)는 상기 검색어들을 분석하여 하나의 검색어가 다른 검색어의 일부분에 포함되는 경우, 연관성이 있는 것으로 판단하여 연관 급상승어로 선택되도록 필터링할 수 있다.
이와 같이, 본 발명에 따른 연관 급상승어 검색 시스템(110)은 검색어의 시간 분포에서 피크를 찾아내고 피크를 비교하여 후보 검색어들을 찾아낸 후 후보 검색어들 중에서 의미없는 후보 검색어를 제거함으로써 연관 급상승어를 제공할 수 있다.
도 4는 본 발명의 일실시예에 따른 연관 급상승어 검색 방법의 흐름을 나타내는 도면이다.
도 4를 참조하면, 단계(S410)에서 연관 급상승어 검색 시스템은 검색어별로 일별 검색 횟수를 포함하는 검색 로그를 데이터베이스에 기록하고 유지한다. 즉, 단계(S410)에서 상기 연관 급상승어 검색 시스템은 사용자들에 의해 입력되는 검색어에 대한 시간 정보 및 검색 횟수를 포함하는 검색 로그를 상기 데이터베이스에 기록하고 유지할 수 있다.
단계(S420)에서 상기 연관 급상승어 검색 시스템은 상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출한다.
도 5는 본 발명에 따른 검색어별로 일별 검색 횟수를 추출하는 단계를 구체 화한 일례를 나타내는 도면이다.
도 5를 참조하면, 단계(S510)에서 상기 연관 급상승어 검색 시스템은 일정 기간 내에 상기 검색어별로 일별 검색 횟수를 추출한다. 즉, 단계(S510)에서 상기 연관 급상승어 검색 시스템은 도 2에 도시된 것과 같이 일정 기간 내의 검색 시간 동안에 상기 검색어별로 일별 검색 횟수를 추출할 수 있다.
단계(S520)에서 상기 연관 급상승어 검색 시스템은 상기 검색어별로 일별 검색 횟수를 분석하여 정해진 상승 기준치 이상으로 급상승한 후 정해진 하강 기준치 이상으로 급하강하는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출한다. 일례로 단계(S520)에서 상기 연관 급상승어 검색 시스템은 상기 검색어별로 일별 검색 횟수를 분석한 결과로 하루만에 상기 검색 횟수가 10배이상 된 급상승과 하루만에 상기 검색 횟수가 10배로 떨어진 급하강이 7일 이내에 나타나는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출할 수 있다. 예를 들어, 단계(S520)에서 상기 연관 급상승어 검색 시스템은 상기 검색어별로 일별 검색 횟수를 분석한 결과로 상기 피크가 발생한 검색어 및 상기 피크가 발생한 날짜 정보를 (이효리, 7월 2일), (법무부, 6월 24일) 등과 같은 쌍(pair)의 집합으로 추출할 수 있다.
단계(S430)에서 상기 연관 급상승어 검색 시스템은 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교한다. 또한 단계(S430)에서 상기 연관 급상승어 검색 시스템은 비교 대상이 되는 피크들의 급상승 시간 정보 및 급하강 시간 정보를 분석하여 급하강 시간차가 급상승 시간차보다 커지도록 상기 정해진 기간을 설정할 수 있다.
도 6은 본 발명에 따른 일별 검색 횟수에 대한 피크를 비교하는 단계를 구체화한 일례를 나타내는 도면이다.
도 6을 참조하면, 단계(S610)에서 상기 연관 급상승어 검색 시스템은 상기 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교한다.
단계(S620)에서 상기 연관 급상승어 검색 시스템은 상기 피크 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 검색한다.
단계(S440)에서 상기 연관 급상승어 검색 시스템은 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링한다.
도 7은 본 발명에 따른 연관성이 없는 검색어를 필터링하는 단계를 구체화한 일례를 나타내는 도면이다.
도 7을 참조하면, 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 분석하여 연관성이 있는지 여부를 판단한다. 일례로 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 검색어들을 분석하여 상호 연관 검색어인 경우, 연관성이 있는 것으로 판단할 수 있다. 일례로 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 검색어들이 입력된 검색 세션(session)의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 검색 세션의 수를 측정하여 상호 연관성 여부를 판단할 수 있다. 일례로 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 검색어들이 입력된 사용자 식별자의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 사용자 식별자의 수를 측정하여 상호 연관성 여부를 판단할 수 있다. 일례로 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 검색어들이 입력된 IP 주소의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 IP 주소의 수를 측정하여 상호 연관성 여부를 판단할 수 있다. 일례로 단계(S710)에서 상기 연관 급상승어 검색 시스템은 상기 검색어들을 분석하여 하나의 검색어가 다른 검색어의 일부분으로 포함되는 경우, 연관성이 있는 것으로 판단할 수 있다.
단계(S720)에서 상기 연관 급상승어 검색 시스템은 상기 연관성 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링한다. 즉, 단계(S720)에서 상기 연관 급상승어 검색 시스템은 상기 연관성 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어를 제거하고, 상기 후보 검색어들 중에서 연관성이 있는 후보 검색어를 연관 급상승어로 제공할 수 있다.
이와 같이, 본 발명에 따른 연관 급상승어 검색 방법은 검색어의 시간 분포에서 피크를 찾아내고 피크를 비교하여 후보 검색어들을 찾아낸 후 후보 검색어들 중에서 의미없는 후보 검색어를 제거함으로써 연관 급상승어를 제공할 수 있다.
한편 본 발명에 따른 연관 급상승어 검색 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능한 기록 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능한 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
도 1은 본 발명에 따른 연관 급상승어 검색 시스템 및 사용자 단말기간의 연동 관계를 나타내는 도면이다.
도 2는 본 발명에 따른 검색어별 일별 검색 횟수의 일례를 나타내는 도면이다.
도 3은 본 발명의 일실시예에 따른 연관 급상승어 검색 시스템의 구성을 나타내는 도면이다.
도 4는 본 발명의 일실시예에 따른 연관 급상승어 검색 방법의 흐름을 나타내는 도면이다.
도 5는 본 발명에 따른 검색어별로 일별 검색 횟수를 추출하는 단계를 구체화한 일례를 나타내는 도면이다.
도 6은 본 발명에 따른 일별 검색 횟수에 대한 피크를 비교하는 단계를 구체화한 일례를 나타내는 도면이다.
도 7은 본 발명에 따른 연관성이 없는 검색어를 필터링하는 단계를 구체화한 일례를 나타내는 도면이다.
<도면의 주요 부분에 대한 부호의 설명>
110: 연관 급상승어 검색 시스템
310: 검색어 입력부 320: 데이터베이스
330: 추출부 340: 비교부
350: 필터링부

Claims (21)

  1. 검색어별 일별 검색 횟수를 포함하는 검색 로그를 데이터베이스에 기록하고 유지하는 단계;
    상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출하는 단계;
    정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 단계; 및
    상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링하는 단계
    를 포함하는 연관 급상승어 검색 방법.
  2. 제1항에 있어서,
    검색어별로 일별 검색 횟수를 추출하는 상기 단계는,
    일정 기간 내에 상기 검색어별로 일별 검색 횟수를 추출하는 단계; 및
    상기 검색어별로 일별 검색 횟수를 분석하여 정해진 상승 기준치 이상으로 급상승한 후 정해진 하강 기준치 이상으로 급하강하는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출하는 단계
    를 포함하는 연관 급상승어 검색 방법.
  3. 제1항에 있어서,
    정해진 기간 내에 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 상기 단계는,
    상기 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교하는 단계; 및
    상기 피크 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 검색하는 단계
    를 포함하는 연관 급상승어 검색 방법.
  4. 제1항에 있어서,
    비교 대상이 되는 피크들의 급상승 시간 정보 및 급하강 시간 정보를 분석하여 급하강 시간차가 급상승 시간차보다 커지도록 상기 정해진 기간을 설정하는 단계를 더 포함하는 연관 급상승어 검색 방법.
  5. 제1항에 있어서,
    비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들간의 연관성을 분석하여 연관성이 없는 후보 검색어를 필터링하는 상기 단계는,
    상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 분석하여 연관성이 있는지 여부를 판단하는 단계; 및
    상기 연관성 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후 보 검색어가 제거되도록 필터링하는 단계
    를 포함하는 연관 급상승어 검색 방법.
  6. 제5항에 있어서,
    검색어들을 분석하여 연관성이 있는지 여부를 판단하는 상기 단계는,
    상기 검색어들을 분석하여 상호 연관 검색어인 경우, 연관성이 있는 것으로 판단하는 연관 급상승어 검색 방법.
  7. 제5항에 있어서,
    검색어들을 분석하여 연관성이 있는지 여부를 판단하는 상기 단계는,
    상기 검색어들이 입력된 검색 세션(session)의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 검색 세션의 수를 측정하여 상호 연관성 여부를 판단하는 연관 급상승어 검색 방법.
  8. 제5항에 있어서,
    검색어들을 분석하여 연관성이 있는지 여부를 판단하는 상기 단계는,
    상기 검색어들이 입력된 사용자 식별자의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 사용자 식별자의 수를 측정하여 상호 연관성 여부를 판단하는 연관 급상승어 검색 방법.
  9. 제5항에 있어서,
    검색어들을 분석하여 연관성이 있는지 여부를 판단하는 상기 단계는,
    상기 검색어들이 입력된 IP 주소의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 IP 주소의 수를 측정하여 상호 연관성 여부를 판단하는 연관 급상승어 검색 방법.
  10. 제5항에 있어서,
    검색어들을 분석하여 연관성이 있는지 여부를 판단하는 상기 단계는,
    상기 검색어들을 분석하여 하나의 검색어가 다른 검색어의 일부분으로 포함되는 경우, 연관성이 있는 것으로 판단하는 연관 급상승어 검색 방법.
  11. 제1항 내지 제10항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록되어 있는 것을 특징으로 하는 컴퓨터에서 판독 가능한 기록 매체.
  12. 검색어별 일별 검색 횟수를 포함하는 검색 로그를 기록하고 유지하는 데이터베이스;
    상기 데이터베이스를 참조하여 상기 검색 로그를 분석하여 상기 검색어별로 일별 검색 횟수를 추출하는 추출부;
    정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크(peak)를 비교하는 비교부; 및
    상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 검색어들간의 연관성을 분석하여 연관성이 없는 검색어를 필터링하는 필터링부
    를 포함하는 연관 급상승어 검색 시스템.
  13. 제12항에 있어서,
    상기 추출부는,
    일정 기간 내에 상기 검색어별로 일별 검색 횟수를 추출하고, 상기 검색어별로 일별 검색 횟수를 분석하여 정해진 상승 기준치 이상으로 급상승한 후 정해진 하강 기준치 이상으로 급하강하는 피크가 발생한 검색어 및 상기 피크가 발생한 시간 정보를 추출하는 연관 급상승어 검색 시스템.
  14. 제12항에 있어서,
    상기 비교부는,
    상기 정해진 기간 내에 상기 검색어별로 추출된 일별 검색 횟수에 대한 피크를 비교하고, 상기 피크 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 검색하는 연관 급상승어 검색 시스템.
  15. 제12항에 있어서,
    상기 비교부는,
    비교 대상이 되는 피크들의 급상승 시간 정보 및 급하강 시간 정보를 분석하 여 급하강 시간차가 급상승 시간차보다 커지도록 상기 정해진 기간을 설정하는 연관 급상승어 검색 시스템.
  16. 제12항에 있어서,
    상기 필터링부는,
    상기 비교 결과에 따라 상기 정해진 기간 내에 피크가 동반 발생한 후보 검색어들을 분석하여 연관성이 있는지 여부를 판단하고, 상기 연관성 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링하는 연관 급상승어 검색 시스템.
  17. 제12항에 있어서,
    상기 필터링부는,
    상기 후보 검색어들을 분석하여 상호 연관 검색어인 경우, 연관성이 있는 것으로 판단하여 연관 급상승어로 선택되도록 필터링하는 연관 급상승어 검색 시스템.
  18. 제12항에 있어서,
    상기 필터링부는,
    상기 검색어들이 입력된 검색 세션(session)의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 검색 세션의 수를 측정하여 상호 연관성 여부를 판단하 고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링하는 연관 급상승어 검색 시스템.
  19. 제12항에 있어서,
    상기 필터링부는,
    상기 검색어들이 입력된 사용자 식별자의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 사용자 식별자의 수를 측정하여 상호 연관성 여부를 판단하고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링하는 연관 급상승어 검색 시스템.
  20. 제12항에 있어서,
    상기 필터링부는,
    상기 검색어들이 입력된 IP 주소의 수와 상기 검색어들이 포함하는 검색어의 쌍이 입력된 IP 주소의 수를 측정하여 상호 연관성 여부를 판단하고, 상기 상호 연관성 여부 판단 결과에 따라 상기 후보 검색어들 중에서 연관성이 없는 후보 검색어가 제거되도록 필터링하는 연관 급상승어 검색 시스템.
  21. 제12항에 있어서,
    상기 필터링부는,
    상기 검색어들을 분석하여 하나의 검색어가 다른 검색어의 일부분에 포함되 는 경우, 연관성이 있는 것으로 판단하여 연관 급상승어로 선택되도록 필터링하는 연관 급상승어 검색 시스템.
KR1020070094545A 2007-09-18 2007-09-18 연관 급상승어 검색 방법 및 그 시스템 KR100913051B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020070094545A KR100913051B1 (ko) 2007-09-18 2007-09-18 연관 급상승어 검색 방법 및 그 시스템
JP2010521767A JP5112517B2 (ja) 2007-09-18 2008-08-08 関連急上昇語の検索方法およびそのシステム
PCT/KR2008/004634 WO2009038285A1 (en) 2007-09-18 2008-08-08 Method for searching relation sudden rising word and system thereof
US12/677,454 US8725723B2 (en) 2007-09-18 2008-08-08 Method for searching relation sudden rising word and system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070094545A KR100913051B1 (ko) 2007-09-18 2007-09-18 연관 급상승어 검색 방법 및 그 시스템

Publications (2)

Publication Number Publication Date
KR20090029368A true KR20090029368A (ko) 2009-03-23
KR100913051B1 KR100913051B1 (ko) 2009-08-20

Family

ID=40468070

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070094545A KR100913051B1 (ko) 2007-09-18 2007-09-18 연관 급상승어 검색 방법 및 그 시스템

Country Status (4)

Country Link
US (1) US8725723B2 (ko)
JP (1) JP5112517B2 (ko)
KR (1) KR100913051B1 (ko)
WO (1) WO2009038285A1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022182020A1 (ko) * 2021-02-26 2022-09-01 삼성전자 주식회사 검색 서비스를 제공하기 위한 전자 장치 및 그 작동 방법

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8412699B1 (en) * 2009-06-12 2013-04-02 Google Inc. Fresh related search suggestions
JP5121888B2 (ja) * 2010-06-30 2013-01-16 ヤフー株式会社 スパムipアドレスを判別する装置及び方法並びにスパムクエリを判別する装置及び方法
JP5208232B2 (ja) * 2011-02-23 2013-06-12 ヤフー株式会社 クエリ抽出装置及び方法
KR20130038723A (ko) * 2011-10-10 2013-04-18 삼성전자주식회사 키워드를 이용한 검색 방법 및 시스템
JP5144838B1 (ja) * 2011-11-29 2013-02-13 パナソニック株式会社 情報処理装置、情報処理方法、及び、プログラム
CN103365844B (zh) * 2012-03-26 2016-05-11 阿里巴巴集团控股有限公司 一种提供搜索路径的方法及装置
US9569502B1 (en) 2013-11-08 2017-02-14 Google Inc. Search lift remarketing
US9990433B2 (en) 2014-05-23 2018-06-05 Samsung Electronics Co., Ltd. Method for searching and device thereof
US11314826B2 (en) 2014-05-23 2022-04-26 Samsung Electronics Co., Ltd. Method for searching and device thereof
US9892166B2 (en) * 2014-10-09 2018-02-13 Ca, Inc. Partitioning log records based on term frequency and type for selective skipping during full-text searching
US10679227B2 (en) * 2015-11-06 2020-06-09 Mastercard International Incorporated Systems and methods for mapping online data to data of interest

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3547069B2 (ja) 1997-05-22 2004-07-28 日本電信電話株式会社 情報関連づけ装置およびその方法
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
JP2002351897A (ja) * 2001-05-22 2002-12-06 Fujitsu Ltd 情報利用頻度予測プログラム、情報利用頻度予測装置および情報利用頻度予測方法
US7051023B2 (en) * 2003-04-04 2006-05-23 Yahoo! Inc. Systems and methods for generating concept units from search queries
KR101093989B1 (ko) * 2004-04-23 2011-12-15 엔에이치엔(주) 급상승 검색어 검출 방법 및 시스템
KR100574200B1 (ko) * 2004-05-19 2006-04-27 엔에이치엔(주) 인터넷 검색 서비스를 효율적으로 제공하기 위한 검색어관리 방법 및 시스템
US7577646B2 (en) * 2005-05-02 2009-08-18 Microsoft Corporation Method for finding semantically related search engine queries
JP4781741B2 (ja) 2005-07-25 2011-09-28 ヤフー株式会社 情報検索システム、情報検索プログラム
KR100522029B1 (ko) 2005-07-27 2005-10-18 엔에이치엔(주) 실시간 급상승 검색어 검출 방법 및 실시간 급상승 검색어검출 시스템
JP4662861B2 (ja) * 2006-02-07 2011-03-30 日本電気株式会社 モニタリング装置、評価データ選別装置、応対者評価装置、応対者評価システムおよびプログラム
KR20070095552A (ko) * 2006-03-21 2007-10-01 엔에이치엔(주) 실시간 급상승 키워드 추출 방법 및 실시간 급상승 키워드추출 시스템
JP4234740B2 (ja) * 2006-08-03 2009-03-04 株式会社東芝 キーワード提示装置、プログラムおよびキーワード提示方法
US7672935B2 (en) * 2006-11-29 2010-03-02 Red Hat, Inc. Automatic index creation based on unindexed search evaluation
US7941436B2 (en) * 2006-11-30 2011-05-10 Yahoo, Inc. Keyword bidding strategy for novel concepts
US8285745B2 (en) * 2007-03-01 2012-10-09 Microsoft Corporation User query mining for advertising matching
US7672937B2 (en) * 2007-04-11 2010-03-02 Yahoo, Inc. Temporal targeting of advertisements

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022182020A1 (ko) * 2021-02-26 2022-09-01 삼성전자 주식회사 검색 서비스를 제공하기 위한 전자 장치 및 그 작동 방법

Also Published As

Publication number Publication date
KR100913051B1 (ko) 2009-08-20
WO2009038285A1 (en) 2009-03-26
JP5112517B2 (ja) 2013-01-09
JP2010537305A (ja) 2010-12-02
US8725723B2 (en) 2014-05-13
US20110010362A1 (en) 2011-01-13

Similar Documents

Publication Publication Date Title
KR100913051B1 (ko) 연관 급상승어 검색 방법 및 그 시스템
KR100544514B1 (ko) 검색 쿼리 연관성 판단 방법 및 시스템
KR101252670B1 (ko) 연관 콘텐츠 제공 장치, 방법 및 컴퓨터 판독 가능한 기록 매체
KR20150036117A (ko) 쿼리 확장
CN109582551A (zh) 日志数据解析方法、装置、计算机设备和存储介质
JP2005251203A (ja) 情報ノベルティ(novelty)と情報ダイナミックス(dynamics)の分析によってニュースフィード(newsfeeds)をパーソナライズ(personalizing)するための原理および方法
US9245035B2 (en) Information processing system, information processing method, program, and non-transitory information storage medium
KR20100006752A (ko) 컨텐츠 유통 시스템 및 방법
KR20180075234A (ko) 컨텐츠에 대한 유입검색어 및 연관검색어 기반의 컨텐츠 추천방법 및 추천장치
KR101341816B1 (ko) 유사검색어 추출 시스템 및 방법
JP5341847B2 (ja) 検索クエリ推薦方法、検索クエリ推薦装置、検索クエリ推薦プログラム
CN110543584A (zh) 一种建立人脸索引的方法、装置、处理服务器及存储介质
CN105512300A (zh) 信息过滤方法及系统
JP2006331292A (ja) Weblogコミュニティ検索支援方法、検索支援装置および検索支援方法のプログラムを記録した記録媒体
JP2011085994A (ja) 広告配信装置、広告配信方法および広告配信プログラム
JP5271863B2 (ja) 情報分析装置、情報分析方法および情報分析プログラム
KR101568800B1 (ko) 실시간 이슈 검색어 선별 방법 및 시스템
JP6830917B2 (ja) 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム
US11037180B2 (en) Method and system of identifying a concept of a good or service for an unmet market potential
KR101393604B1 (ko) 형태소 기반 컨텐츠분류 방법 및 장치
JP2011170699A (ja) 検索システムユーザの分野ごとにおける知識量推定装置、知識量推定方法および知識量推定プログラム
Erdoğan et al. From social media analysis to ubiquitous event monitoring: the case of Turkish tweets
KR101096285B1 (ko) 연관 검색 쿼리 추출 방법 및 시스템
CN110633430A (zh) 事件发现方法、装置、设备和计算机可读存储介质
CN107871008A (zh) 一种生成用于用户代理信息的数据库的方法

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120705

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130626

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150722

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20160725

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20170704

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20190701

Year of fee payment: 11