KR101196935B1 - 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 - Google Patents
실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 Download PDFInfo
- Publication number
- KR101196935B1 KR101196935B1 KR1020100064432A KR20100064432A KR101196935B1 KR 101196935 B1 KR101196935 B1 KR 101196935B1 KR 1020100064432 A KR1020100064432 A KR 1020100064432A KR 20100064432 A KR20100064432 A KR 20100064432A KR 101196935 B1 KR101196935 B1 KR 101196935B1
- Authority
- KR
- South Korea
- Prior art keywords
- representative
- reference word
- cluster
- representative phrase
- word
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/284—Lexical analysis, e.g. tokenisation or collocates
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템이 개시된다. 클러스터에 속하는 문서들의 형태소를 분석하여 결정된 대표 기준 단어를 확장하고, 확장된 대표 기준 단어를 이용하여 생성된 대표 문구를 인기 키워드와 결합하여 제공할 수 있다.
Description
본 발명은 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템에 관한 것으로, 보다 구체적으로 웹 페이지에 실시간 검색어로 노출하고자 하는 키워드에 관한 것이다.
일반적으로, 키워드 검색을 제공하는 대부분의 웹 페이지는 현재 실시간으로 급상승되는 검색어인 인기 키워드가 노출된다. 이때, 웹 페이지 상에 선택된 인기 키워드와 인기 키워드와 순위가 노출된다. 특히, 인기 키워드는 웹 페이지 상에 단순히 연예인 이름이거나, 국제 또는 국내 단체명으로 노출된다.
이에 따라, 인기 키워드가 어떤 내용을 포함하고 있는지 알고자 하는 경우, 사용자는 마우스 클릭 등을 이용하여 특정 인기 키워드를 선택할 수 있다. 그러면, 웹 페이지에는 선택된 인기 키워드와 관련된 기사, 문서 등이 노출될 수 있다.
이처럼, 인기 키워드에 대한 구체적인 내용을 알고 싶은 경우뿐만 아니라, 인기 키워드가 된 원인 등과 같이 개략적인 내용을 알고자 하는 경우에도 사용자는 인기 키워드를 선택하고, 선택된 인기 키워드에 대한 다수의 기사들을 모두 읽어야 하는 번거로움이 존재한다.
따라서, 사용자가 인기 키워드 및 인기 키워드와 관련된 기사들을 단계적으로 선택하지 않더라도 실시간으로 인기 키워드가 된 원인을 제공할 수 있는 방안이 필요하다.
본 발명은 실시간으로 인기 키워드가 노출된 원인을 알려주는 대표 문구를 생성하는 방법 및 시스템을 제공하고자 한다.
본 발명은 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출하는 방법 및 시스템을 제공하고자 한다.
본 발명의 일실시예에 따른 대표 문구 제공 방법은, 인기 키워드에 대한 대표 문구를 생성하는 단계, 및 상기 인기 키워드와 상기 생성된 대표 문구를 결합하여 제공하는 단계를 포함할 수 있다.
또한, 상기 대표 문구를 생성하는 단계는, 상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 기준 단어를 결정하는 단계, 상기 결정된 기준 단어의 빈도수에 따라 대표 기준 단어를 결정하는 단계, 상기 결정된 대표 기준 단어의 이전 또는 이후에 연속하는 단어와 상기 대표 기준 단어를 조합하여 상기 대표 기준 단어를 확장하는 단계, 및 상기 확장된 대표 기준 단어를 이용하여 상기 대표 문구를 생성하는 단계를 포함할 수 있다.
또한, 상기 대표 기준 단어를 확장하는 단계는, 상기 인기 키워드를 포함하는 문서들에서 상기 대표 기준 단어의 이전 또는 이후에 연속하는 단어가 포함되는 조건부 확률을 계산하는 단계, 및 상기 계산된 조건부 확률에 기초하여 상기 대표 기준 단어를 확장하는 단계를 포함할 수 있다.
또한, 상기 대표 기준 단어를 확장하는 단계는, 상기 문서의 개수에 기초하여 상기 기준 확률을 계산하는 단계, 상기 계산된 조건부 확률이 상기 기준 확률 이상이면, 상기 확장된 기준 단어를 계속하여 확장하는 단계, 및 상기 계산된 조건부 확률이 상기 기준 확률 미만이면, 상기 확장된 기준 단어의 확장을 종료하는 단계를 더 포함할 수 있다.
또한, 상기 대표 기준 단어를 결정하는 단계는, 상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 상기 기준 단어의 빈도수를 카운트하는 단계, 및 상기 카운트된 빈도수가 높은 순서로 상기 대표 기준 단어를 결정하는 단계를 포함할 수 있다.
또한, 상기 인기 키워드를 포함하는 문서들을 수집하는 단계, 및 상기 수집된 문서들에 대해 클러스터(Cluster)를 수행하는 단계를 더 포함할 수 있다. 이때, 상기 대표 문구를 생성하는 단계는, 상기 클러스터에 속하는 문서들을 기초로 대표 기준 단어를 확장하여 상기 대표 문구를 생성할 수 있다.
또한, 상기 수집된 문서들 중 최근에 수집된 문서 순으로 가중치를 부가하는 단계를 더 포함할 수 있다. 여기서, 상기 문서는, 상기 인기 키워드를 포함하는 텍스트 및 상기 인기 키워드를 포함하는 정지 영상 중 적어도 하나를 포함할 수 있다.
또한, 상기 부가된 가중치를 이용하여 상기 클러스터의 노출 우선 순위를 결정하는 단계를 더 포함할 수 있다. 그러면, 상기 생성된 대표 문구를 결합하여 제공하는 단계는, 상기 결정된 노출 우선 순위에 따라 선택된 클러스터의 대표 문구와 상기 인기 키워드를 결합하여 제공할 수 있다.
또한, 본 발명의 일실시예에 따른 대표 문구 제공 시스템은, 인기 키워드에 대한 대표 문구를 생성하는 대표 문구 생성부, 및 상기 인기 키워드와 상기 생성된 대표 문구를 결합하여 제공하는 대표 문구 제공부를 포함할 수 있다.
또한, 상기 대표 문구 생성부는, 상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 기준 단어를 결정하고, 상기 결정된 기준 단어의 빈도수에 따라 대표 기준 단어를 결정하는 기준 단어 결정부, 및 상기 결정된 대표 기준 단어의 이전 또는 이후에 연속하는 단어와 상기 대표 기준 단어를 조합하여 상기 대표 기준 단어를 확장하고, 상기 확장된 대표 기준 단어를 이용하여 상기 대표 문구를 생성하는 기준 단어 확장부를 포함할 수 있다.
또한, 상기 인기 키워드를 포함하는 문서들을 수집하는 문서 수집부, 및 상기 수집된 문서들에 대해 클러스터(Cluster)를 수행하는 클러스터 수행부를 더 포함할 수 있다. 그러면, 상기 대표 문구 생성부는, 상기 클러스터에 속하는 문서들을 기초로 대표 기준 단어를 확장하여 상기 대표 문구를 생성할 수 있다.
또한, 상기 대표 문구 생성부는, 상기 수집된 문서들 중 최근에 수집된 문서 순으로 가중치를 부가할 수 있다.
본 발명의 일실시예에 따르면, 실시간으로 인기 키워드가 노출된 원인을 알려주는 대표 문구를 생성할 수 있다.
본 발명의 일실시예에 따르면, 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
도 1은 본 발명의 일실시예에 따른 대표 문구를 생성하는 과정을 설명하기 위해 제공되는 도면이다.
도 2는 본 발명의 일실시예에 따른 대표 문구 제공 시스템의 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 대표 문구 생성부의 세부 구성을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따라 생성된 대표 문구와 인기 키워드를 웹 페이지에 노출하는 화면을 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법을 설명하기 위해 제공되는 흐름도이다.
도 2는 본 발명의 일실시예에 따른 대표 문구 제공 시스템의 구성을 도시한 블록도이다.
도 3은 본 발명의 일실시예에 따른 대표 문구 생성부의 세부 구성을 도시한 도면이다.
도 4는 본 발명의 일실시예에 따라 생성된 대표 문구와 인기 키워드를 웹 페이지에 노출하는 화면을 도시한 도면이다.
도 5는 본 발명의 일실시예에 따른 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법을 설명하기 위해 제공되는 흐름도이다.
이하, 본 발명의 실시예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 일실시예에 따른 대표 문구를 생성하는 과정을 설명하기 위해 제공되는 도면이다.
도 1을 따르면, 대표 문구 제공 시스템(20)은 실시간 인기 키워드(30)와 관련된 문서들(10)을 수집할 수 있다. 여기서, 수집된 문서들은 인기 키워드를 포함하는 텍스트 문서(document), 인기 키워드와 관련된 기사(article), 및 상기 인기 키워드의 정지 영상 중 적어도 하나를 포함할 수 있다.
그리고, 대표 문구 제공 시스템(20)은 수집된 문서들의 형태소를 분석하여 인기 키워드의 대표 문구를 생성할 수 있다. 여기서, 인기 키워드의 대표 문구는 웹 페이지에 노출하고자 하는 인기 키워드가 실시간 인기 키워드가 된 원인을 나타내는 문구를 의미한다.
이하에서는 도 2를 참조하여 인기 키워드의 대표 문구를 생성하는 과정에 대해 보다 상세히 설명하기로 한다.
도 2는 본 발명의 일실시예에 따른 대표 문구 제공 시스템의 구성을 도시한 블록도이다.
도 2를 참조하면, 대표 문구 제공 시스템(200)은 문서 수집부(210), 클러스터 수행부(220), 대표 문구 생성부(230), 및 대표 문구 제공부(240)를 포함할 수 있다.
문서 수집부(210)는 웹 페이지 상에 실시간 급상승 검색어로 노출하고자 하는 인기 키워드와 관련된 문서들을 각종 포털 등을 통해 수집할 수 있다.
일례로, 문서 수집부(210)는 인기 키워드 AAA에 대한 문서들을 아래의 표 1과 같이 수집할 수 있다.
문서 | |
NNN_news#0 | AAA, 홍콩, 최고 여배우, 'BBB'와 中서 비밀 데이트? |
NNN _news#1 | AAA, 홍콩 여배우 BBB와 몰래 데이트? |
MMM _news#3 | AAA-BBB, 연인? 콘서트 항상 인기 폭발 |
MMM _news#1 | AAA, 홍콩 여배우 BBB와 비밀 데이트? |
LLL#0 | AAA, BBB 콘서트 영상 인기 |
클러스터 수행부(220)는 대해 N-그램 형태소 분석을 이용하여 수집된 문서들에 대해 클러스터를 수행할 수 있다. 여기서, N-그램은 단어를 N개까지 연이어 붙여서 사용하는 것으로, 1-그램은 단어 하나를 의미하고, 2-그램은 두 개의 단어가 연이어 결합된 형태를 의미한다. 이처럼, N-그램 형태소 분석을 통해 클러스터를 수행함에 따라, 클러스터의 품질이 향상될 수 있다.
이때, 1-그램 형태소 분석의 경우, 잘못된 클러스터가 생성될 수 있으나, 5-그램까지 이용하여 형태소 분석을 하는 경우, AAA 키워드와 연관성이 높은 문서들끼리 묶일 확률이 증가한다. 일례로, 클러스터 수행부(220)는 표 1의 NNN_news#0에 대해 5-그램 형태소 분석을 이용하여 클러스터 인풋 데이터(Cluster Input Data)를 생성할 수 있다. 이때, 생성된 클러스터 인풋 데이터는 아래의 표 2와 같을 수 있다.
문서 | 클러스터 인풋 데이터 |
NNN_news#0 | AAA AAA홍콩 AAA홍콩최고 AAA홍콩최고여배우 AAA홍콩최고여배우BBB AAA홍콩최고여배우BBB와 AAA홍콩최고여배우BBB와中 홍콩 홍콩최고 홍콩최고여배우 홍콩최고여배우BBB 홍콩최고여배우BBB와 홍콩최고여배우BBB와中 홍콩최고여배우BBB와中서 홍콩최고여배우BBB와中서비밀 최고 최고여배우 최고여배우BBB와 최고여배우BBB와中 최고여배우BBB와中서 최고여배우BBB와中서비밀 여배우 여배우BBB 여배우BBB와 여배우BBB와中 여배우BBB와中서 여배우BBB와中서비밀 여배우BBB와中서비밀데이트 BBB BBB와 BBB와中 BBB와中서 BBB와中서비밀 BBB와中서비밀데이트 中 中서 中서비밀 中서비밀데이트 서 서비밀 서비밀데이트 비밀 비밀데이트 데이트 |
표 2에서는 문서 NNN_news#0에 대해 생성된 클러스터 인풋 데이터를 설명하고 있으나, 클러스터 수행부(220)는 수집된 모든 문서들에 대해 N-그램 형태소 분석을 이용하여 클러스터 인풋 데이터를 생성할 수 있다.
그러면, 클러스터 수행부(220)는 생성된 클러스터 인풋 데이터와 카테고리컬(Categorical) 클러스터링 기법을 이용하여 수집된 모든 문서들에 대해 클러스터를 수행할 수 있다. 이때, 클러스터 수행부(220)는 자카드(Jaccard) 계수를 기반으로 하는 계층적 클러스터링 기법을 이용하여 클러스터를 수행할 수 있다. 일례로, 클러스터 수행부(220)는 표 1에서 수집된 문서들에 대해 상기 계층적 클러스터링 기법을 이용하여 클러스터를 수행함으로써 아래의 표 3 및 표 4와 같은 2개의 클러스터를 생성할 수 있다.
# 클러스터 A | |
MMM _news#1 | AAA, 홍콩 여배우 BBB와 비밀 데이트? |
NNN_news#0 | AAA, 홍콩, 최고 여배우, 'BBB'와 中서 비밀 데이트? |
NNN _news#1 | AAA, 홍콩 여배우 BBB와 몰래 데이트? |
# 클러스터 B | |
LLL#0 | AAA, BBB 콘서트 영상 인기 |
MMM _news#3 | AAA-BBB, 연인? 콘서트 항상 인기 폭발 |
표 3에 따르면, 클러스터 A는 인기 키워드 AAA와 BBB 간의 데이트와 관련된 문서들을 포함하는 클러스터이다. 그리고, 표 4에 따르면, 클러스터 B는 인기 키워드 AAA와 BBB간의 콘서트와 관련된 문서들을 포함하는 클러스터이다.
대표 문구 생성부(230)는 생성된 복수의 클러스터에서 각 클러스터를 대표하는 문장 하나를 조합하여 인기 키워드에 대한 대표 문구를 생성할 수 있다.
이하에서는 도 3을 참조하여 대표 문구를 생성하는 과정에 대해 상세히 설명하기로 한다. 도 3에 따르면, 대표 문구 생성부(230)는 기준 단어 결정부(231) 및 기준 단어 확장부(232)를 포함할 수 있다.
기준 단어 결정부(231)는 하나의 클러스터에 포함된 모든 문서들의 형태소를 분석하여 하나 이상의 기준 단어를 결정할 수 있다. 일례로, 클러스터 A에 포함된 문서들의 형태소를 분석하는 경우, 기준 단어 결정부(231)는 문서 MMM _news#1, NNN_news#0, 및 NNN _news#1의 형태소를 분석하여 "홍콩", "데이트", "BBB", "여배우", "비밀", "몰래"를 기준 단어로 결정할 수 있다.
이때, 기준 단어 결정부(231)는 결정된 기준 단어가 상기 문서들 MMM _news#1, NNN_news#0, 및 NNN _news#1에 포함되는 빈도수를 카운트할 수 있다. 일례로, 클러스터 A에 대해 결정된 기준 단어와 카운트된 기준 단어의 빈도수는 아래의 표 5와 같을 수 있다.
기준 단어 | 빈도수 |
홍콩 | 232 |
데이트 | 224 |
BBB | 215 |
여배우 | 152 |
비밀 | 142 |
몰래 | 70 |
기준 단어 결정부(231)는 카운트된 기준 단어의 빈도수가 가장 높은 순으로 2개의 기준 단어를 대표 기준 단어로 결정할 수 있다. 일례로, 표 5에 따르면, 기준 단어 결정부(231)는 빈도수가 높은 상위 2개의 "홍콩"과 "데이트"를 대표 기준 단어로 결정할 수 있다.
기준 단어 확장부(232)는 결정된 대표 기준 단어와 연속하는 단어가 클러스터에 속하는 문서들에 포함되는 조건부 확률을 계산할 수 있다. 이때, 기준 단어 확장부(232)는 바이그램(bi-gram) 조건부 확률을 이용하여 대표 기준 단어와 이전 또는 이후에 연속하는 단어가 포함될 조건부 확률을 계산할 수 있다.
일례로, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에서 대표 기준 단어 "홍콩"과 연속하는 단어 "여배우" 및 "최고"가 포함되는 조건부 확률을 계산할 수 있다. 이때, 기준 단어 확장부(232)는 아래의 수학식 1을 이용하여 "홍콩" 이후에 연속하는 단어 "여배우"가 클러스터 A에 속하는 문서들에 포함되는 조건부 확률을 2/3로 계산할 수 있다. 보다 상세하게는, 클러스터 A에 속하는 문서 MMM _news#1, NNN_news#0, 및 NNN _news#1 중에서 "홍콩 여배우"가 포함된 문서는 MMM _news#1 및 NNN _news#1이다. 이에 따라, 기준 단어 확장부(232)는 "홍콩 여배우"의 조건부 확률을 2/3로 계산할 수 있다.
동일한 방법으로, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에 "홍콩" 이후에 연속하는 단어 "최고"가 포함되는 조건부 확률을 1/3로 계산할 수 있다. 보다 상세하게는, 클러스터 A에 속하는 문서들 중에 "홍콩 최고"를 포함하는 문서는 NNN_news#0 하나이므로, 기준 단어 확장부(232)는 아래의 수학식 1을 이용하여 "홍콩 최고"의 조건부 확률을 1/3로 계산할 수 있다.
그리고, 기준 단어 확장부(232)는 계산된 조건부 확률 중 확률 값이 큰 확률이 기설정된 기준 확률 이상이면, 확률 값이 큰 확률에 해당하는 단어로 대표 기준 단어를 확장할 수 있다.
일례로, 기준 확률이 1/2로 기설정된 경우, 기준 단어 확장부(232)는 계산된 조건부 확률을 비교하여 확률 값이 조건부 확률을 선택할 수 있다. 그러면, 기준 단어 확장부(232)는 조건부 확률 2/3와 1/3을 비교하여 2/3를 선택할 수 있다. 그리고, 기준 단어 확장부(232)는 선택한 조건부 확률 2/3이 기준 확률 1/2 이상인지를 판단할 수 있다. 이때, 조건부 확률 2/3이 기준 확률 1/2 이상이므로, 기준 단어 확장부(232)는 조건부 확률 2/3에 해당하는 단어 "홍콩 여배우"로 대표 기준 단어를 확장할 수 있다. 즉, 대표 기준 단어가 "홍콩"에서 "홍콩 여배우"로 확장될 수 있다.
이때, 기준 단어 확장부(232)는 확장하고자 하는 단어의 조건부 확률이 기준 확률 미만이 될 때까지 대표 기준 단어를 계속하여 확장할 수 있다.
일례로, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에 확장된 단어 "여배우" 이후에 연속하는 단어가 포함될 조건부 확률을 계산할 수 있다. 이때, 기준 단어 확장부(232)는 위의 수학식 1과 동일한 방법으로 P(BBB와|여배우)의 조건부 확률을 1로 계산할 수 있다. 보다 상세하게는, 클러스터 A에 속하는 모든 문서에 여배우 이후에 연속하여 단어 "BBB와"가 포함되므로, 기준 단어 확장부(232)는 P(BBB와|여배우)의 조건부 확률을 3/3=1로 계산할 수 있다. 그리고, 기준 단어 확장부(232)는 계산된 P(BBB와|여배우)의 조건부 확률 1이 기설정된 기준 확률 1/2 이상이므로, 대표 기준 단어를 "홍콩 여배우"에서 "홍콩 여배우 BBB와"로 확장할 수 있다.
이때, 기준 단어 확장부(232)는 확장된 단어의 조건부 확률이 기준 확률 미만이면, 대표 기준 단어의 확장을 종료할 수 있다. 일례로, 바이그램 조건부 확률을 이용하는 경우, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에서 확장된 단어 "BBB와" 이후에 연속하는 단어를 포함하는 조건부 확률이 1/3, 1/3, 1/3로 기준 확률 1/2 미만이므로 대표 기준 단어의 확장을 종료할 수 있다.
보다 상세하게는, 문서 MMM _news#1은 "BBB와" 연속하는 단어로 "비밀"을 포함하고, NNN_news#0는 "BBB와" 연속하는 단어로 "中서"를 포함하고, 및 NNN _news#1는 "BBB와" 연속하는 단어로 "몰래"를 포함한다. 이에 따라, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에서 "BBB와" 이후에 연속하는 단어를 포함하는 조건부 확률을 1/3, 1/3, 1/3로 계산할 수 있다. 이때, 계산된 조건부 확률이 모두 동일하므로, 기준 확장부(232)는 이중 하나인 1/3을 선택하고, 선택된 조건부 확률 1/3과 기준 확률 1/2을 비교할 수 있다. 그리고, 기준 확장부(232)는 선택된 조건부 확률 1/2이 기준 확률 1/2 미만이므로 대표 기준 단어의 확장을 종료할 수 있다. 이에 따라, 기준 단어 확장부(232)는 바이그램 조건부 확률을 이용하여 대표 기준 단어 "홍콩"을 "홍콩 여배우 BBB와"까지 확장할 수 있다.
이어, 기준 단어 확장부(232)는 첫 번째로 빈도수가 높은 대표 기준 단어 "홍콩"의 확장이 종료되면, 두 번째로 빈도수가 높은 대표 기준 단어 "데이트"를 확장할 수 있다. 이때, 기준 단어 확장부(232)는 "홍콩"과 마찬가지로 바이그램 조건부 확률을 이용하여 "데이트"를 확장할 수 있다.
일례로, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서들에서 "데이트" 이전에 연속하는 단어 "비밀 데이트" 및 "몰래 데이트"의 조건부 확률을 2/3, 1/3로 각각 계산할 수 있다. 그리고, 기준 단어 확장부(232)는 계산된 조건부 확률 중 확률 값이 큰 2/3를 선택할 수 있다. 이어, 기준 단어 확장부(232)는 선택된 조건부 확률 2/3이 기준 확률 1/2 이상이므로, 2/3에 해당하는 단어 "비밀 데이트"로 대표 기준 단어를 확장할 수 있다.
이때, 기준 단어 확장부(232)는 "홍콩"과 마찬가지로, 확장된 단어의 바이그램 조건부 확률이 기준 확률 미만이 될 때까지 대표 기준 단어를 계속 확장할 수 있다. 그러면, 기준 단어 확장부(232)는 대표 기준 단어 "데이트"를 최종적으로 "비밀 데이트"까지 확장할 수 있다.
그리고, 기준 단어 확장부(232)는 확장된 대표 기준 단어들을 조합하여 대표 문구를 생성할 수 있다. 일례로, 기준 단어 확장부(232)는 "홍콩 여배우 BBB와"와 "비밀 데이트"를 조합하여 "홍콩 여배우 BBB와 비밀 데이트"를 대표 문구로 생성할 수 있다.
그러면, 대표 문구 제공부(240)는 생성된 대표 문구와 인기 키워드를 결합하여 제공할 수 있다. 일례로, 대표 문구 제공부(240)는 생성된 대표 문구 "홍콩 여배우 BBB와 비밀 데이트"와 인기 키워드 "AAA"를 결합하여 웹 페이지에 노출할 수 있다.
동일한 방법으로, 대표 문구 생성부(230)는 클러스터 B에 포함된 모든 문서들의 형태소를 분석하여 하나 이상의 기준 단어를 결정할 수도 있다. 일례로, 기준 단어 결정부(231)는 문서 LLL#0 및 MMM_news#3의 형태소를 분석하여 "BBB", "콘서트", "영상", "인기", "폭발", "연인"을 기준 단어로 결정할 수 있다. 이때, 기준 단어 결정부(231)는 결정된 기준 단어가 상기 문서들 LLL#0, MMM_news#3에 포함되는 빈도수를 카운트하고, 카운트된 기준 단어의 빈도수가 가장 높은 순으로 2개 이상의 기준 단어를 대표 기준 단어로 결정할 수 있다. 그러면, 기준 단어 확장부(232)는 결정된 대표 기준 단어와 연속하는 단어가 클러스터 B에 속하는 문서들에 포함되는 조건부 확률을 계산할 수 있다.
그리고, 기준 단어 확장부(232)는 계산된 조건부 확률 중 확률 값이 큰 확률이 기설정된 기준 확률 이상이면, 확률 값이 큰 확률에 해당하는 단어로 대표 기준 단어를 확장할 수 있다. 이때, 기준 단어 확장부(232)는 확장하고자 하는 단어의 조건부 확률이 기준 확률 미만이 될 때까지 대표 기준 단어를 계속하여 확장할 수 있다. 마지막으로, 기준 단어 확장부(232)는 확장된 대표 기준 단어들을 조합하여 클러스터 B에 포함된 문서들에 대한 대표 문구를 생성할 수 있다.
그러면, 대표 문구 제공부(240)는 생성된 대표 문구와 인기 키워드를 결합하여 제공할 수 있다.
일례로, 대표 문구 제공부(240)는 생성된 클러스터 A 및 클러스터 B에 대한 대표 문구를 인기 키워드 "AAA"와 각각 결합하여 웹 페이지에 노출할 수 있다. 이때, 대표 문구 제공부(240)는 클러스터 A 및 클러스터 B에 노출 우선 순위를 부여하고, 노출 우선 순위가 높은 클러스터의 대표 문구의 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
보다 상세하게는, 클러스터 A의 노출 우선 순위가 80이고, 클러스터 B의 노출 우선 순위가 60인 경우, 인기 키워드 "AAA" 검색이 요청되면, 대표 문구 제공부(240)는 클러스터 A의 대표 문구와 인기 키워드 "AAA"를 결합하여 웹 페이지에 노출할 수 있다. 이때, 대표 문구 제공부(240)는 복수의 클러스터들에 포함된 문서들의 가중치를 이용하여 노출 우선 순위를 결정할 수 있다. 일례로, 대표 문구 제공부(240)는 클러스터에 포함된 문서들의 가중치의 합이 높은 순으로 노출 우선 순위를 높게 부여할 수 있다. 그러면, 대표 문구 제공부(240)는 복수의 클러스터들 중 노출 우선 순위가 가장 높은 클러스터를 선택하고, 선택한 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
다른 예로, 대표 문구 제공부(240)는 클러스터의 크기(size)를 이용하여 복수의 클러스터 중 어느 하나의 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다. 여기서, 클러스터의 크기는 클러스터에 속하는 문서의 개수이다. 즉, 대표 문구 제공부(240)는 클러스터 A 및 클러스터 B 중 문서를 많이 포함하고 있는 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
이때, 대표 문구 제공부(240)는 대표 문구 제공부(240)는 클러스터에 속하는 문서의 작성 시간에 따라 가중치를 부가하여 문서의 크기를 계산할 수 도 있다. 그러면, 대표 문구 제공부(240)는 최근에 작성된 문서 일수록 높은 가중치를 부가하여, 클러스터 A에 포함된 문서의 개수가 클러스터 B에 포함된 문서의 개수보다 작더라도 최근에 작성된 문서의 개수가 클러스터 B보다 많은 경우, 클러스터 A의 크기가 클러스터 B의 크기보다 클 수도 있다. 이 경우, 대표 문구 제공부(240)는 클러스터 A의 대표 문구와 인기 키워드를 결합하여 노출할 수 있다.
마찬가지로, 클러스터 B에 포함된 문서의 개수가 클러스터 A에 포함된 문서의 개수보다 작더라도, 클러스터 B에 클러스터 A 포함된 문서들보다 최근에 작성된 문서가 많은 경우, 클러스터 B의 크기가 클러스터 A의 크기보다 클 수도 있다. 그러면, 대표 문구 제공부(240)는 클러스터 B의 대표 문구와 인기 키워드를 결합하여 노출할 수도 있다.
이때, 대표 문구 제공부(240)는 인기 키워드들에 해당하는 대표 문구를 모두 웹 페이지 상에 노출할 수 있을 뿐만 아니라, 웹 페이지에 노출된 인기 키워드들 중 마우스, 터치, 포인터 등에 의해 활성화된 인기 키워드의 대표 문구를 웹 페이지에 노출할 수도 있다.
일례로, 도 4와 같이, 실시간 인기 키워드들을 포함하는 목록(400)에서 마우스가 AAA 키워드(410)를 가리키는 경우, 대표 문구 제공부(240)는 인기 키워드 AAA(410)와 AAA에 대한 대표 문구(421)를 함께 웹 페이지에 노출할 수 있다.
이때, 대표 문구 제공부(240)는 인기 키워드에 대한 대표 문구(421)와 함께 인기 키워드에 대한 정지 영상 등의 사진(420)을 함께 노출할 수도 있다. 이를 위해, 대표 문구 제공부(240)는 수집된 문서들의 작성 시간에 따라 문서들에 가중치를 부가할 수 있다. 일례로, 대표 문구 제공부(240)는 작성 시간이 최근에 해당할수록 가중치를 높게 부여할 수 있다. 그러면, 대표 문구 제공부(240)는 클러스터에 포함된 문서들 중에서 인기 키워드에 대한 사진을 포함하고 있는 문서를 추출할 수 있다. 그리고, 대표 문구 제공부(240)는 추출된 문서들 중 가중치가 가장 높은 문서에 포함된 사진을 인기 키워드에 대한 대표 문구 및 인기 키워드와 결합하여 제공할 수 있다.
이상에서는, 기설정된 기준 확률을 이용하여 대표 기준 단어를 확장함에 따라 대표 문구를 생성하는 과정에 대해 설명하였으나, 기준 단어 확장부(232)는 아래의 수학식 2를 이용하여 기준 확률을 계산할 수도 있다. 그러면, 기준 단어 확장부(232)는 계산된 기준 확률과 조건부 확률을 비교하여 대표 기준 단어를 확장할 수도 있다.
수학식 2에서, N(K_Cluster)는 K 클러스터에 포함된 문서의 개수이고, α는 임의의 변수이다. 일례로, α로는 0.3, 0.4, 0.5, 0.7 등의 실수가 이용될 수 있다.
수학식 2에 따르면, 기준 단어 확장부(232)는 클러스터에 속하는 문서의 개수에 기초하여 기준 확률을 계산할 수 있다. 일례로, α=0.5가 이용되는 경우, 기준 단어 확장부(232)는 클러스터 A에 속하는 문서의 개수가 3개이므로, 클러스터 A에 대한 기준 확률을으로 계산할 수 있다.
도 5는 본 발명의 일 실시예에 따른 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법을 설명하기 위해 제공되는 흐름도이다.
먼저, 문서 수집부(210)는 웹 페이지에 노출하고자 하는 실시간 인기 키워드와 관련된 문서들을 포털 등을 통해 수집할 수 있다(S510).
이어, 클러스터 수행부(220)는 수집된 문서들의 형태소를 분석하여 클러스터를 수행할 수 있다(S520).
그리고, 기준 단어 결정부(231)는 클러스터에 포함된 문서들의 형태소를 분석하여, 문서 별로 기준 단어를 결정할 수 있다(S530). 이때, 기준 단어 결정부(231)는 형태소 분석을 통해 결정된 기준 단어가 문서들에 포함되는 빈도수를 카운트할 수 있다. 일례로, 클러스터 A에 포함된 문서들을 대상으로 결정된 기준 단어 및 기준 단어의 빈도수는 위의 표 5와 같을 수 있다.
이어, 기준 단어 결정부(231)는 기준 단어의 빈도수에 기초하여 대표 기준 단어를 결정할 수 있다(S540). 일례로, 기준 단어 결정부(231)는 표 5에 따라 결정된 기준 단어들 중 빈도수가 높은 2개의 기준 단어 "홍콩" 및 "데이트"를 대표 기준 단어로 결정할 수 있다.
그러면, 기준 단어 확장부(232)는 바이그램(bi-gram) 조건부 확률을 이용하여 결정된 대표 기준 단어의 조건부 확률을 계산할 수 있다(S550). 여기서, 조건부 확률은 클러스터에 포함되는 문서들에서 대표 기준 단어와 이전 또는 이후에 연속하는 단어가 포함되는 확률을 의미한다.
일례로, 기준 단어 확장부(232)는 클러스터 A 포함된 문서들에서 대표 기준 단어 "홍콩" 이후에 단어 "여배우"가 연속하는 조건부 확률을 2/3 및 1/3로 계산할 수 있다. 이때, 기준 단어 확장부(232)는 계산된 조건부 확률 중 큰 조건부 확률 2/3을 선택할 수 있다.
이어, 기준 단어 확장부(232)는 선택된 조건부 확률이 기설정된 기준 확률 이상인지 여부를 판단할 수 있다(S560). 일례로, 기준 확률이 1/2로 기설정된 경우, 기준 단어 확장부(232)는 계산된 "홍콩 여배우"의 조건부 확률 2/3이 기준 확률 1/2 이상인지를 판단할 수 있다.
이때, 계산된 조건부 확률이 기준 확률 이상이면(S560:YES), 기준 단어 확장부(232)는 대표 기준 단어를 선택된 조건부 확률에 해당하는 단어로 확장할 수 있다. 그리고, 기준 단어 확장부(232)는 확장된 대표 기준 단어를 S550 내지 S560과 동일한 방법을 이용하여 계속 확장할 수 있다(S565). 일례로, 기준 단어 확장부(232)는 "여배우" 이후에 "BBB와"가 연속하는 조건부 확률을 계산하고, 계산된 조건부 확률과 기준 확률을 비교함으로써 대표 기준 단어를 "BBB와"로 확장할 수 있다.
이때, 기준 단어 확장부(232)는 계산된 조건부 확률이 기준 확률 미만이면(S560:NO), 대표 기준 단어의 확장을 종료할 수 있다(S570).
일례로, 기준 단어 확장부(232)는 클러스터 A에 포함된 문서들에서 대표 기준 단어 "BBB와" 이후에 연속하는 단어가 포함될 조건부 확률을 계산할 수 있다. 이때, 계산된 조건부 확률이 1/3로 모두 기준 확률 1/2 미만이므로, 기준 단어 확장부(232)는 대표 기준 단어의 확장을 종료할 수 있다. 그러면, 확장된 대표 기준 단어는 "홍콩 여배우 BBB와"가 될 수 있다.
마찬가지로, 기준 단어 확장부(232)는 "홍콩"과 동일한 방법으로 S540 단계에서 결정된 대표 기준 단어 "데이트"에 대해 확장을 수행할 수 있다. 그러면, 기준 단어 확장부(232)는 대표 기준 단어를 "비밀 데이트"로 확장할 수 있다.
이어, 기준 단어 확장부(232)는 확장된 대표 기준 단어들을 조합하여 대표 문구를 생성할 수 있다(S580). 일례로, 기준 단어 확장부(232)는 대표 기준 단어 "홍콩"을 기초로 확장된 "홍콩 여배우 BBB와"와 대표 기준 단어 "데이트'를 기초로 확장된 "비밀 데이트"를 조합하여 "홍콩 여배우 BBB와 비밀 데이트"를 대표 문구로 생성할 수 있다.
그러면, 대표 문구 제공부(240)는 생성된 대표 문구와 인기 키워드를 결합하여 제공할 수 있다(S590). 일례로, 대표 문구 제공부(240)는 도 4와 같이, 인기 키워드 "AAA"와 대표 문구 "홍콩 여배우 BBB와 비밀 데이트"를 결합하여 웹 페이지에 노출할 수 있다.
이때, 대표 문구 제공부(240)는 인기 키워드 목록(400)에 포함된 모든 인기 키워드들에 대한 대표 문구들을 웹 페이지에 노출할 수 있다. 이외에, 대표 문구 제공부(240)는 인기 키워드 목록(400)에 포함된 인기 키워드들 중 마우스 등에 의해 활성화된 인기 키워드에 대한 대표 문구만을 웹 페이지에 노출할 수도 있다.
또한, 대표 문구 제공부(240)는 도 4와 같이, 인기 키워드에 대한 대표 문구(421)와 함께 인기 키워드에 대한 정지 영상 등의 사진(420)을 함께 노출할 수도 있다. 일례로, 대표 문구 제공부(240)는 수집된 문서들의 작성 시간에 따라 문서들에 가중치를 부가하고, 부가된 가중치가 가장 높은 문서에 포함된 사진을 인기 키워드에 대한 대표 문구와 함께 웹 페이지에 노출할 수 있다. 이때, 대표 문구 제공부(240)는 가중치가 가장 높은 문서에 사진이 포함되지 않은 경우, 가중치가 차순위인 문서에 포함된 사진을 이용할 수도 있다. 여기서, 대표 문구 제공부(240)는 문서의 작성 시간이 최근에 해당할수록 가중치를 높게 부여할 수 있다.
한편, 이상의 도 5에서는 하나의 클러스터 A에 대한 대표 문구를 생성하고, 생성한 클러스터 A의 대표 문구와 인기 키워드를 결합하여 제공하는 것에 대해 설명하였으나, 본 대표 문구 제공 방법은, 복수의 클러스터에 대한 대표 문구를 생성하고, 생성한 복수의 대표 문구 중 적어도 하나와 인기 키워드를 결합하여 웹 페이지에 노출할 수도 있다.
일례로, 대표 문구 제공부(240)는 생성된 클러스터 A 및 클러스터 B에 대한 대표 문구를 인기 키워드 "AAA"와 각각 결합하여 웹 페이지에 노출할 수 있다. 이때, 대표 문구 제공부(240)는 클러스터 A 및 클러스터 B에 노출 우선 순위를 부여하고, 노출 우선 순위가 높은 클러스터의 대표 문구의 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
보다 상세하게는, 클러스터 A의 노출 우선 순위가 80이고, 클러스터 B의 노출 우선 순위가 60인 경우, 인기 키워드 "AAA" 검색이 요청되면, 대표 문구 제공부(240)는 클러스터 A의 대표 문구와 인기 키워드 "AAA"를 결합하여 웹 페이지에 노출할 수 있다. 이때, 대표 문구 제공부(240)는 복수의 클러스터들에 포함된 문서들의 가중치를 이용하여 노출 우선 순위를 결정할 수 있다. 일례로, 대표 문구 제공부(240)는 클러스터에 포함된 문서들의 가중치의 합이 높은 순으로 노출 우선 순위를 높게 부여할 수 있다. 그러면, 대표 문구 제공부(240)는 복수의 클러스터들 중 노출 우선 순위가 가장 높은 클러스터를 선택하고, 선택한 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
다른 예로, 대표 문구 제공부(240)는 클러스터의 크기(size)를 이용하여 복수의 클러스터 중 어느 하나의 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다. 여기서, 클러스터의 크기는 클러스터에 속하는 문서의 개수이다. 즉, 대표 문구 제공부(240)는 클러스터 A 및 클러스터 B 중 문서를 많이 포함하고 있는 클러스터의 대표 문구와 인기 키워드를 결합하여 웹 페이지에 노출할 수 있다.
이때, 대표 문구 제공부(240)는 대표 문구 제공부(240)는 클러스터에 속하는 문서의 작성 시간에 따라 가중치를 부가하여 문서의 크기를 계산할 수 도 있다. 그러면, 대표 문구 제공부(240)는 최근에 작성된 문서 일수록 높은 가중치를 부가하여, 클러스터 A에 포함된 문서의 개수가 클러스터 B에 포함된 문서의 개수보다 작더라도 최근에 작성된 문서의 개수가 클러스터 B보다 많은 경우, 클러스터 A의 크기가 클러스터 B의 크기보다 클 수도 있다. 이 경우, 대표 문구 제공부(240)는 클러스터 A의 대표 문구와 인기 키워드를 결합하여 노출할 수 있다.
마찬가지로, 클러스터 B에 포함된 문서의 개수가 클러스터 A에 포함된 문서의 개수보다 작더라도, 클러스터 B에 클러스터 A 포함된 문서들보다 최근에 작성된 문서가 많은 경우, 클러스터 B의 크기가 클러스터 A의 크기보다 클 수도 있다. 그러면, 대표 문구 제공부(240)는 클러스터 B의 대표 문구와 인기 키워드를 결합하여 노출할 수도 있다.
한편, 이상에서는 복수의 기준 단어들 중 빈도수가 높은 순으로 2개의 대표 기준 단어를 결정하고, 조건부 확률에 기초하여 대표 기준 단어를 확장 및 대표 문구를 생성하는 것으로 설명하였으나, 이는 실시예에 해당되며, 기준 단어 결정부(231)는 복수의 기준 단어들 중 빈도수가 가장 높은 하나의 대표 기준 단어를 결정하고, 기준 단어 확장부(232)는 결정된 대표 기준 단어를 확장하여 대표 문구를 생성할 수도 있다.
본 발명의 실시 예에 따른 방법들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니 되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.
200: 대표 문구 제공 시스템
210: 문서 수집부
220: 클러스터 수행부
230: 대표 문구 생성부
240: 대표 문구 제공부
231: 기준 단어 결정부
232: 기준 단어 확장부
210: 문서 수집부
220: 클러스터 수행부
230: 대표 문구 생성부
240: 대표 문구 제공부
231: 기준 단어 결정부
232: 기준 단어 확장부
Claims (20)
- 대표 문구 생성부 및 대표 문구 제공부를 포함하는 대표 문구 제공 시스템이 수행하는 대표 문구 제공 방법에 있어서,
상기 대표 문구 생성부가 인기 키워드에 대한 대표 문구를 생성하는 단계; 및
상기 대표 문구 제공부가 상기 인기 키워드와 상기 생성된 대표 문구를 결합하여 웹페이지에 제공하는 단계
를 포함하고,
상기 대표 문구는,
인기 키워드가 실시간 급상승 검색어로 노출된 원인과 관련되고,
상기 대표 문구를 생성하는 단계는,
상기 대표 문구 생성부의 기준 단어 결정부가 상기 인기 키워드를 포함하는 문서들의 기준 단어를 결정하는 단계;
상기 대표 문구 생성부의 기준 단어 결정부가 상기 결정된 기준 단어 중에서 대표 기준 단어를 결정하는 단계;
상기 대표 문구 생성부의 기준 단어 확장부가 상기 결정된 대표 기준 단어의 이전 또는 이후에 연속하는 단어와 상기 대표 기준 단어를 조합하여 상기 대표 기준 단어를 확장하는 단계; 및
상기 대표 문구 생성부의 기준 단어 확장부가 상기 확장된 대표 기준 단어를 이용하여 상기 대표 문구를 생성하는 단계
를 포함하고,
상기 대표 기준 단어를 확장하는 단계는,
상기 대표 문구 생성부의 기준 단어 확장부가 상기 인기 키워드를 포함하는 문서들에서 상기 대표 기준 단어의 이전 또는 이후에 연속하는 단어가 포함되는 조건부 확률을 계산하는 단계; 및
상기 대표 문구 생성부의 기준 단어 확장부가 상기 계산된 조건부 확률에 기초하여 상기 대표 기준 단어를 확장하는 단계
를 포함하는 것을 특징으로 하는 대표 문구 제공 방법. - 삭제
- 삭제
- 제1항에 있어서,
상기 대표 기준 단어를 확장하는 단계는,
상기 대표 문구 생성부의 기준 단어 확장부가 상기 문서의 개수에 기초하여 상기 기준 확률을 계산하는 단계;
상기 대표 문구 생성부의 기준 단어 확장부가 상기 계산된 조건부 확률이 상기 기준 확률 이상이면, 상기 확장된 기준 단어를 계속하여 확장하는 단계; 및
상기 대표 문구 생성부의 기준 단어 확장부가 상기 계산된 조건부 확률이 상기 기준 확률 미만이면, 상기 확장된 기준 단어의 확장을 종료하는 단계
를 더 포함하는 대표 문구 제공 방법. - 제1항에 있어서,
상기 대표 기준 단어를 결정하는 단계는,
상기 대표 문구 생성부의 기준 단어 결정부가 상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 상기 기준 단어의 빈도수를 카운트하는 단계; 및
상기 대표 문구 생성부의 기준 단어 결정부가 상기 카운트된 빈도수가 높은 순서로 상기 대표 기준 단어를 결정하는 단계
를 포함하는 대표 문구 제공 방법. - 제1항에 있어서,
상기 대표 문구 제공 시스템은 문서 수집부 및 클러스터 수행부를 더 포함하고,
상기 문서 수집부가 상기 인기 키워드를 포함하는 문서들을 수집하는 단계; 및
상기 클러스터 수행부가 상기 수집된 문서들에 대해 클러스터(Cluster)를 수행하는 단계
를 더 포함하는 대표 문구 제공 방법. - 제6항에 있어서,
상기 대표 문구를 생성하는 단계는,
상기 클러스터에 속하는 문서들을 기초로 대표 기준 단어를 확장하여 상기 대표 문구를 생성하는 것을 특징으로 하는 대표 문구 제공 방법. - 제6항에 있어서,
상기 대표 문구 생성부가 상기 수집된 문서들 중 최근에 수집된 문서 순으로 가중치를 부가하는 단계
더 포함하는 대표 문구 제공 방법. - 제8항에 있어서,
상기 대표 문구 생성부가 상기 부가된 가중치를 이용하여 상기 클러스터의 노출 우선 순위를 결정하는 단계
를 더 포함하고,
상기 생성된 대표 문구를 결합하여 제공하는 단계는,
상기 결정된 노출 우선 순위에 따라 선택된 클러스터의 대표 문구와 상기 인기 키워드를 결합하여 제공하는 것을 특징으로 하는 대표 문구 제공 방법. - 제6항에 있어서,
상기 문서는,
상기 인기 키워드를 포함하는 텍스트 및 상기 인기 키워드를 포함하는 정지 영상 중 적어도 하나를 포함하는 문서인 것을 특징으로 하는 대표 문구 제공 방법. - 제1항 및 제4항 내지 제10항 중 어느 한 항의 방법을 실행하기 위한 프로그램이 기록된 컴퓨터에서 판독 가능한 기록 매체.
- 인기 키워드에 대한 대표 문구를 생성하는 대표 문구 생성부; 및
상기 인기 키워드와 상기 생성된 대표 문구를 결합하여 웹페이지에 제공하는 대표 문구 제공부
를 포함하고,
상기 대표 문구는,
인기 키워드가 실시간 급상승 검색어로 노출된 원인과 관련되고,
상기 대표 문구 생성부는,
상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 기준 단어를 결정하고, 상기 결정된 기준 단어의 빈도수에 따라 대표 기준 단어를 결정하는 기준 단어 결정부; 및
상기 결정된 대표 기준 단어의 이전 또는 이후에 연속하는 단어와 상기 대표 기준 단어를 조합하여 상기 대표 기준 단어를 확장하고, 상기 확장된 대표 기준 단어를 이용하여 상기 대표 문구를 생성하는 기준 단어 확장부
를 포함하고,
상기 기준 단어 확장부는,
상기 인기 키워드를 포함하는 문서들에서 상기 대표 기준 단어의 이전 또는 이후에 연속하는 단어가 포함되는 조건부 확률을 계산하고, 상기 계산된 조건부 확률에 기초하여 상기 대표 기준 단어를 확장하는 것을 특징으로 하는 대표 문구 제공 시스템. - 삭제
- 삭제
- 제12항에 있어서,
상기 기준 단어 확장부는,
상기 문서의 개수에 기초하여 상기 기준 확률을 계산하고, 상기 계산된 조건부 확률이 상기 기준 확률 이상이면, 상기 확장된 기준 단어를 계속하여 확장하는 것을 특징으로 하는 대표 문구 제공 시스템. - 제12항에 있어서,
상기 기준 단어 확장부는,
상기 계산된 조건부 확률이 상기 기준 확률 미만이면, 상기 확장된 기준 단어의 확장을 종료하는 것을 특징으로 하는 대표 문구 제공 시스템. - 제12항에 있어서,
상기 기준 단어 결정부는,
상기 인기 키워드를 포함하는 문서들의 형태소를 분석하여 상기 기준 단어의 빈도수를 카운트하고, 상기 카운트된 빈도수가 높은 순서로 상기 대표 기준 단어를 결정하는 것을 특징으로 하는 대표 문구 제공 시스템. - 제12항에 있어서,
상기 인기 키워드를 포함하는 문서들을 수집하는 문서 수집부; 및
상기 수집된 문서들에 대해 클러스터(Cluster)를 수행하는 클러스터 수행부
를 더 포함하는 대표 문구 제공 시스템 - 제18항에 있어서,
상기 대표 문구 생성부는,
상기 클러스터에 속하는 문서들을 기초로 대표 기준 단어를 확장하여 상기 대표 문구를 생성하는 것을 특징으로 하는 대표 문구 제공 시스템. - 제18항에 있어서,
상기 대표 문구 생성부는,
상기 수집된 문서들 중 최근에 수집된 문서 순으로 가중치를 부가하는 것을 특징으로 하는 대표 문구 제공 시스템.
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100064432A KR101196935B1 (ko) | 2010-07-05 | 2010-07-05 | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
JP2011143991A JP5798814B2 (ja) | 2010-07-05 | 2011-06-29 | リアルタイム人気キーワードに対する代表フレーズを提供する方法およびシステム |
US13/176,375 US9262401B2 (en) | 2010-07-05 | 2011-07-05 | Method and system for providing representative phrase |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100064432A KR101196935B1 (ko) | 2010-07-05 | 2010-07-05 | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120003689A KR20120003689A (ko) | 2012-01-11 |
KR101196935B1 true KR101196935B1 (ko) | 2012-11-05 |
Family
ID=45400339
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100064432A KR101196935B1 (ko) | 2010-07-05 | 2010-07-05 | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
Country Status (3)
Country | Link |
---|---|
US (1) | US9262401B2 (ko) |
JP (1) | JP5798814B2 (ko) |
KR (1) | KR101196935B1 (ko) |
Families Citing this family (104)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102193936B (zh) * | 2010-03-09 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种数据分类的方法及装置 |
CN102411583B (zh) * | 2010-09-20 | 2013-09-18 | 阿里巴巴集团控股有限公司 | 一种文本匹配方法及装置 |
US9547693B1 (en) | 2011-06-23 | 2017-01-17 | Palantir Technologies Inc. | Periodic database search manager for multiple data sources |
US9558165B1 (en) * | 2011-08-19 | 2017-01-31 | Emicen Corp. | Method and system for data mining of short message streams |
US8937619B2 (en) | 2013-03-15 | 2015-01-20 | Palantir Technologies Inc. | Generating an object time series from data objects |
US8924388B2 (en) | 2013-03-15 | 2014-12-30 | Palantir Technologies Inc. | Computer-implemented systems and methods for comparing and associating objects |
US8917274B2 (en) | 2013-03-15 | 2014-12-23 | Palantir Technologies Inc. | Event matrix based on integrated data |
US9965937B2 (en) | 2013-03-15 | 2018-05-08 | Palantir Technologies Inc. | External malware data item clustering and analysis |
US8788405B1 (en) | 2013-03-15 | 2014-07-22 | Palantir Technologies, Inc. | Generating data clusters with customizable analysis strategies |
US10275778B1 (en) | 2013-03-15 | 2019-04-30 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive investigation based on automatic malfeasance clustering of related data in various data structures |
US8938686B1 (en) | 2013-10-03 | 2015-01-20 | Palantir Technologies Inc. | Systems and methods for analyzing performance of an entity |
US9116975B2 (en) | 2013-10-18 | 2015-08-25 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores |
US10579647B1 (en) | 2013-12-16 | 2020-03-03 | Palantir Technologies Inc. | Methods and systems for analyzing entity performance |
US9734217B2 (en) | 2013-12-16 | 2017-08-15 | Palantir Technologies Inc. | Methods and systems for analyzing entity performance |
US10356032B2 (en) | 2013-12-26 | 2019-07-16 | Palantir Technologies Inc. | System and method for detecting confidential information emails |
US8832832B1 (en) | 2014-01-03 | 2014-09-09 | Palantir Technologies Inc. | IP reputation |
US9483162B2 (en) | 2014-02-20 | 2016-11-01 | Palantir Technologies Inc. | Relationship visualizations |
US9857958B2 (en) | 2014-04-28 | 2018-01-02 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases |
US9009171B1 (en) | 2014-05-02 | 2015-04-14 | Palantir Technologies Inc. | Systems and methods for active column filtering |
US9535974B1 (en) * | 2014-06-30 | 2017-01-03 | Palantir Technologies Inc. | Systems and methods for identifying key phrase clusters within documents |
US9619557B2 (en) * | 2014-06-30 | 2017-04-11 | Palantir Technologies, Inc. | Systems and methods for key phrase characterization of documents |
US9256664B2 (en) | 2014-07-03 | 2016-02-09 | Palantir Technologies Inc. | System and method for news events detection and visualization |
US9202249B1 (en) | 2014-07-03 | 2015-12-01 | Palantir Technologies Inc. | Data item clustering and analysis |
US9390086B2 (en) | 2014-09-11 | 2016-07-12 | Palantir Technologies Inc. | Classification system with methodology for efficient verification |
US9767172B2 (en) | 2014-10-03 | 2017-09-19 | Palantir Technologies Inc. | Data aggregation and analysis system |
US9501851B2 (en) | 2014-10-03 | 2016-11-22 | Palantir Technologies Inc. | Time-series analysis system |
US9785328B2 (en) | 2014-10-06 | 2017-10-10 | Palantir Technologies Inc. | Presentation of multivariate data on a graphical user interface of a computing system |
US9984133B2 (en) | 2014-10-16 | 2018-05-29 | Palantir Technologies Inc. | Schematic and database linking system |
US9229952B1 (en) | 2014-11-05 | 2016-01-05 | Palantir Technologies, Inc. | History preserving data pipeline system and method |
US9043894B1 (en) | 2014-11-06 | 2015-05-26 | Palantir Technologies Inc. | Malicious software detection in a computing system |
CN104408102B (zh) * | 2014-11-19 | 2017-11-21 | 北京国双科技有限公司 | 用于网络热词与对象的关联度的数据处理方法和装置 |
CN104408103B (zh) * | 2014-11-19 | 2018-05-18 | 北京国双科技有限公司 | 文本内容的筛选方法及装置 |
US9483546B2 (en) | 2014-12-15 | 2016-11-01 | Palantir Technologies Inc. | System and method for associating related records to common entities across multiple lists |
US10362133B1 (en) | 2014-12-22 | 2019-07-23 | Palantir Technologies Inc. | Communication data processing architecture |
US10552994B2 (en) | 2014-12-22 | 2020-02-04 | Palantir Technologies Inc. | Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items |
US9367872B1 (en) | 2014-12-22 | 2016-06-14 | Palantir Technologies Inc. | Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures |
US9348920B1 (en) | 2014-12-22 | 2016-05-24 | Palantir Technologies Inc. | Concept indexing among database of documents using machine learning techniques |
US9817563B1 (en) | 2014-12-29 | 2017-11-14 | Palantir Technologies Inc. | System and method of generating data points from one or more data stores of data items for chart creation and manipulation |
US9335911B1 (en) | 2014-12-29 | 2016-05-10 | Palantir Technologies Inc. | Interactive user interface for dynamic data analysis exploration and query processing |
US9727560B2 (en) | 2015-02-25 | 2017-08-08 | Palantir Technologies Inc. | Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags |
US10103953B1 (en) | 2015-05-12 | 2018-10-16 | Palantir Technologies Inc. | Methods and systems for analyzing entity performance |
US9392008B1 (en) | 2015-07-23 | 2016-07-12 | Palantir Technologies Inc. | Systems and methods for identifying information related to payment card breaches |
US9454785B1 (en) | 2015-07-30 | 2016-09-27 | Palantir Technologies Inc. | Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data |
US9996595B2 (en) | 2015-08-03 | 2018-06-12 | Palantir Technologies, Inc. | Providing full data provenance visualization for versioned datasets |
US9456000B1 (en) | 2015-08-06 | 2016-09-27 | Palantir Technologies Inc. | Systems, methods, user interfaces, and computer-readable media for investigating potential malicious communications |
US10489391B1 (en) | 2015-08-17 | 2019-11-26 | Palantir Technologies Inc. | Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface |
US9671776B1 (en) | 2015-08-20 | 2017-06-06 | Palantir Technologies Inc. | Quantifying, tracking, and anticipating risk at a manufacturing facility, taking deviation type and staffing conditions into account |
US9984428B2 (en) | 2015-09-04 | 2018-05-29 | Palantir Technologies Inc. | Systems and methods for structuring data from unstructured electronic data files |
US9639580B1 (en) | 2015-09-04 | 2017-05-02 | Palantir Technologies, Inc. | Computer-implemented systems and methods for data management and visualization |
US9576015B1 (en) | 2015-09-09 | 2017-02-21 | Palantir Technologies, Inc. | Domain-specific language for dataset transformations |
JP6243885B2 (ja) * | 2015-10-16 | 2017-12-06 | Necパーソナルコンピュータ株式会社 | 情報処理装置、およびプログラム |
US9424669B1 (en) | 2015-10-21 | 2016-08-23 | Palantir Technologies Inc. | Generating graphical representations of event participation flow |
US10613722B1 (en) | 2015-10-27 | 2020-04-07 | Palantir Technologies Inc. | Distorting a graph on a computer display to improve the computer's ability to display the graph to, and interact with, a user |
US10706056B1 (en) | 2015-12-02 | 2020-07-07 | Palantir Technologies Inc. | Audit log report generator |
US9760556B1 (en) | 2015-12-11 | 2017-09-12 | Palantir Technologies Inc. | Systems and methods for annotating and linking electronic documents |
US9514414B1 (en) | 2015-12-11 | 2016-12-06 | Palantir Technologies Inc. | Systems and methods for identifying and categorizing electronic documents through machine learning |
US9823818B1 (en) | 2015-12-29 | 2017-11-21 | Palantir Technologies Inc. | Systems and interactive user interfaces for automatic generation of temporal representation of data objects |
US10268735B1 (en) | 2015-12-29 | 2019-04-23 | Palantir Technologies Inc. | Graph based resolution of matching items in data sources |
US10871878B1 (en) | 2015-12-29 | 2020-12-22 | Palantir Technologies Inc. | System log analysis and object user interaction correlation system |
US9792020B1 (en) | 2015-12-30 | 2017-10-17 | Palantir Technologies Inc. | Systems for collecting, aggregating, and storing data, generating interactive user interfaces for analyzing data, and generating alerts based upon collected data |
US10698938B2 (en) | 2016-03-18 | 2020-06-30 | Palantir Technologies Inc. | Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags |
US10650558B2 (en) | 2016-04-04 | 2020-05-12 | Palantir Technologies Inc. | Techniques for displaying stack graphs |
US10068199B1 (en) | 2016-05-13 | 2018-09-04 | Palantir Technologies Inc. | System to catalogue tracking data |
US10007674B2 (en) | 2016-06-13 | 2018-06-26 | Palantir Technologies Inc. | Data revision control in large-scale data analytic systems |
US10545975B1 (en) | 2016-06-22 | 2020-01-28 | Palantir Technologies Inc. | Visual analysis of data using sequenced dataset reduction |
US9881066B1 (en) | 2016-08-31 | 2018-01-30 | Palantir Technologies, Inc. | Systems, methods, user interfaces and algorithms for performing database analysis and search of information involving structured and/or semi-structured data |
US10552002B1 (en) | 2016-09-27 | 2020-02-04 | Palantir Technologies Inc. | User interface based variable machine modeling |
US10726507B1 (en) | 2016-11-11 | 2020-07-28 | Palantir Technologies Inc. | Graphical representation of a complex task |
US10318630B1 (en) | 2016-11-21 | 2019-06-11 | Palantir Technologies Inc. | Analysis of large bodies of textual data |
GB201621434D0 (en) | 2016-12-16 | 2017-02-01 | Palantir Technologies Inc | Processing sensor logs |
US10620618B2 (en) | 2016-12-20 | 2020-04-14 | Palantir Technologies Inc. | Systems and methods for determining relationships between defects |
US10249033B1 (en) | 2016-12-20 | 2019-04-02 | Palantir Technologies Inc. | User interface for managing defects |
US11373752B2 (en) | 2016-12-22 | 2022-06-28 | Palantir Technologies Inc. | Detection of misuse of a benefit system |
US10360238B1 (en) | 2016-12-22 | 2019-07-23 | Palantir Technologies Inc. | Database systems and user interfaces for interactive data association, analysis, and presentation |
US10552436B2 (en) | 2016-12-28 | 2020-02-04 | Palantir Technologies Inc. | Systems and methods for retrieving and processing data for display |
US10762471B1 (en) | 2017-01-09 | 2020-09-01 | Palantir Technologies Inc. | Automating management of integrated workflows based on disparate subsidiary data sources |
US10133621B1 (en) | 2017-01-18 | 2018-11-20 | Palantir Technologies Inc. | Data analysis system to facilitate investigative process |
US10509844B1 (en) | 2017-01-19 | 2019-12-17 | Palantir Technologies Inc. | Network graph parser |
US10515109B2 (en) | 2017-02-15 | 2019-12-24 | Palantir Technologies Inc. | Real-time auditing of industrial equipment condition |
JP7078244B2 (ja) * | 2017-03-08 | 2022-05-31 | 株式会社Spectee | データ処理装置、データ処理方法、データ処理システム及びプログラム |
US10325224B1 (en) | 2017-03-23 | 2019-06-18 | Palantir Technologies Inc. | Systems and methods for selecting machine learning training data |
US10581954B2 (en) | 2017-03-29 | 2020-03-03 | Palantir Technologies Inc. | Metric collection and aggregation for distributed software services |
US10866936B1 (en) | 2017-03-29 | 2020-12-15 | Palantir Technologies Inc. | Model object management and storage system |
US10606866B1 (en) | 2017-03-30 | 2020-03-31 | Palantir Technologies Inc. | Framework for exposing network activities |
US10475219B1 (en) | 2017-03-30 | 2019-11-12 | Palantir Technologies Inc. | Multidimensional arc chart for visual comparison |
US10133783B2 (en) | 2017-04-11 | 2018-11-20 | Palantir Technologies Inc. | Systems and methods for constraint driven database searching |
US10235461B2 (en) | 2017-05-02 | 2019-03-19 | Palantir Technologies Inc. | Automated assistance for generating relevant and valuable search results for an entity of interest |
US10563990B1 (en) | 2017-05-09 | 2020-02-18 | Palantir Technologies Inc. | Event-based route planning |
US10482382B2 (en) | 2017-05-09 | 2019-11-19 | Palantir Technologies Inc. | Systems and methods for reducing manufacturing failure rates |
US10795749B1 (en) | 2017-05-31 | 2020-10-06 | Palantir Technologies Inc. | Systems and methods for providing fault analysis user interface |
US10956406B2 (en) | 2017-06-12 | 2021-03-23 | Palantir Technologies Inc. | Propagated deletion of database records and derived data |
US10430444B1 (en) | 2017-07-24 | 2019-10-01 | Palantir Technologies Inc. | Interactive geospatial map and geospatial visualization systems |
US11314721B1 (en) | 2017-12-07 | 2022-04-26 | Palantir Technologies Inc. | User-interactive defect analysis for root cause |
US10769171B1 (en) | 2017-12-07 | 2020-09-08 | Palantir Technologies Inc. | Relationship analysis and mapping for interrelated multi-layered datasets |
US10877984B1 (en) | 2017-12-07 | 2020-12-29 | Palantir Technologies Inc. | Systems and methods for filtering and visualizing large scale datasets |
US10929476B2 (en) | 2017-12-14 | 2021-02-23 | Palantir Technologies Inc. | Systems and methods for visualizing and analyzing multi-dimensional data |
US11263382B1 (en) | 2017-12-22 | 2022-03-01 | Palantir Technologies Inc. | Data normalization and irregularity detection system |
KR102595790B1 (ko) * | 2018-01-26 | 2023-10-30 | 삼성전자주식회사 | 전자 장치 및 그의 제어방법 |
US10754822B1 (en) | 2018-04-18 | 2020-08-25 | Palantir Technologies Inc. | Systems and methods for ontology migration |
US10885021B1 (en) | 2018-05-02 | 2021-01-05 | Palantir Technologies Inc. | Interactive interpreter and graphical user interface |
US11126638B1 (en) | 2018-09-13 | 2021-09-21 | Palantir Technologies Inc. | Data visualization and parsing system |
US11294928B1 (en) | 2018-10-12 | 2022-04-05 | Palantir Technologies Inc. | System architecture for relating and linking data objects |
CN110751867B (zh) * | 2019-11-27 | 2021-06-01 | 上海松鼠课堂人工智能科技有限公司 | 英文教学系统 |
KR102373595B1 (ko) * | 2020-08-21 | 2022-03-11 | 네이버 주식회사 | 급상승 검색어에 대한 연관 콘텐츠를 제공하는 방법 및 시스템 |
Family Cites Families (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6470307B1 (en) * | 1997-06-23 | 2002-10-22 | National Research Council Of Canada | Method and apparatus for automatically identifying keywords within a document |
US6418431B1 (en) * | 1998-03-30 | 2002-07-09 | Microsoft Corporation | Information retrieval and speech recognition based on language models |
US7031908B1 (en) * | 2000-06-01 | 2006-04-18 | Microsoft Corporation | Creating a language model for a language processing system |
US6675159B1 (en) * | 2000-07-27 | 2004-01-06 | Science Applic Int Corp | Concept-based search and retrieval system |
JP3672023B2 (ja) | 2001-04-23 | 2005-07-13 | 日本電気株式会社 | 番組推薦システムおよび番組推薦方法 |
KR100505848B1 (ko) | 2002-10-02 | 2005-08-04 | 씨씨알 주식회사 | 검색 시스템 |
US7451395B2 (en) * | 2002-12-16 | 2008-11-11 | Palo Alto Research Center Incorporated | Systems and methods for interactive topic-based text summarization |
US7117437B2 (en) * | 2002-12-16 | 2006-10-03 | Palo Alto Research Center Incorporated | Systems and methods for displaying interactive topic-based text summaries |
JP3768205B2 (ja) | 2003-05-30 | 2006-04-19 | 沖電気工業株式会社 | 形態素解析装置、形態素解析方法及び形態素解析プログラム |
US8949899B2 (en) | 2005-03-04 | 2015-02-03 | Sharp Laboratories Of America, Inc. | Collaborative recommendation system |
JP4366249B2 (ja) | 2004-06-02 | 2009-11-18 | パイオニア株式会社 | 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報取得装置 |
JP4462014B2 (ja) | 2004-11-15 | 2010-05-12 | 日本電信電話株式会社 | 話題語結合方法及び装置及びプログラム |
US20110218864A1 (en) | 2005-07-28 | 2011-09-08 | Mary Ellen Pentz | System and methods for searching based on a response to a plurality of both stimuli source types, and initiating stimuli types, without the need for a keyboard |
KR20070051227A (ko) | 2005-11-14 | 2007-05-17 | 주식회사 비즈모델라인 | 정보제공 방법 및 시스템과 이를 위한 정보제공 장치와,기록매체 |
JP4606349B2 (ja) | 2006-03-07 | 2011-01-05 | 日本電信電話株式会社 | 話題画像抽出方法及び装置及びプログラム |
JP4234740B2 (ja) * | 2006-08-03 | 2009-03-04 | 株式会社東芝 | キーワード提示装置、プログラムおよびキーワード提示方法 |
KR20070067058A (ko) | 2007-06-13 | 2007-06-27 | (주)첫눈 | 웹 문서 제목 추출 방법 및 그 장치 |
JP4342575B2 (ja) * | 2007-06-25 | 2009-10-14 | 株式会社東芝 | キーワード提示のための装置、方法、及びプログラム |
KR100889986B1 (ko) | 2007-11-30 | 2009-03-25 | 엔에이치엔(주) | 양방향 방송 단말기를 위한 추천 키워드 제공 시스템 및방법 |
JP4388137B2 (ja) | 2008-03-10 | 2009-12-24 | パナソニック株式会社 | コンテンツ検索装置及びコンテンツ検索方法 |
JP5355949B2 (ja) * | 2008-07-16 | 2013-11-27 | 株式会社東芝 | 次検索キーワード提示装置、次検索キーワード提示方法、及び次検索キーワード提示プログラム |
US8335754B2 (en) * | 2009-03-06 | 2012-12-18 | Tagged, Inc. | Representing a document using a semantic structure |
US9892730B2 (en) * | 2009-07-01 | 2018-02-13 | Comcast Interactive Media, Llc | Generating topic-specific language models |
KR101196989B1 (ko) * | 2010-07-06 | 2012-11-02 | 엔에이치엔(주) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 |
JP5085708B2 (ja) * | 2010-09-28 | 2012-11-28 | 株式会社東芝 | キーワード提示装置、方法及びプログラム |
-
2010
- 2010-07-05 KR KR1020100064432A patent/KR101196935B1/ko active IP Right Grant
-
2011
- 2011-06-29 JP JP2011143991A patent/JP5798814B2/ja not_active Expired - Fee Related
- 2011-07-05 US US13/176,375 patent/US9262401B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US20120004904A1 (en) | 2012-01-05 |
JP2012014696A (ja) | 2012-01-19 |
KR20120003689A (ko) | 2012-01-11 |
JP5798814B2 (ja) | 2015-10-21 |
US9262401B2 (en) | 2016-02-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101196935B1 (ko) | 실시간 인기 키워드에 대한 대표 문구를 제공하는 방법 및 시스템 | |
KR100930455B1 (ko) | 쿼리별 검색 컬렉션 생성 방법 및 시스템 | |
JP5161658B2 (ja) | キーワード入力支援装置、キーワード入力支援方法及びプログラム | |
JP2009043156A (ja) | 番組検索装置および番組検索方法 | |
JP6429382B2 (ja) | コンテンツ推薦装置、及びプログラム | |
JP5156047B2 (ja) | キーワード提示装置、方法及びプログラム | |
KR102373884B1 (ko) | 텍스트 기반 이미지 검색을 위한 이미지 데이터 처리 방법 | |
JP2009129323A (ja) | 同義語抽出装置 | |
CN106033417B (zh) | 视频搜索系列剧的排序方法和装置 | |
JP2006072744A (ja) | 文書処理装置、その制御方法、プログラム、及び記憶媒体 | |
JP5418138B2 (ja) | 文書検索システム、情報処理装置およびプログラム | |
JP5179564B2 (ja) | クエリセグメント位置決定装置 | |
JP2007011973A (ja) | 情報検索装置及び情報検索プログラム | |
JP2004240488A (ja) | 文書管理装置 | |
JP4606349B2 (ja) | 話題画像抽出方法及び装置及びプログラム | |
JP5384315B2 (ja) | 検索装置及び方法及びプログラム | |
KR101220080B1 (ko) | 실시간 인기 키워드에 대한 대표 문구 제공 방법 및 시스템 | |
JP2004362121A (ja) | 情報検索装置、携帯情報端末装置、情報検索方法、情報検索プログラム及び記録媒体 | |
JP6488399B2 (ja) | 情報提示システム、及び情報提示方法 | |
CN114385777A (zh) | 文本数据处理方法、装置、计算机设备和存储介质 | |
CN111931026A (zh) | 一种基于词性扩展的搜索优化方法及系统 | |
JP6625087B2 (ja) | 違法コンテンツ探索装置及び違法コンテンツ探索方法 | |
JP2008090396A (ja) | 電子文書検索方法、電子文書検索装置及びプログラム | |
US11275799B2 (en) | Information processing device and non-transitory computer readable medium | |
JP5601123B2 (ja) | Nグラム検索のための転置インデックスの生成方法および生成装置、当該転置インデックスを用いた検索方法および検索装置、ならびに、コンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20151008 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161024 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20171011 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20181008 Year of fee payment: 7 |