상기의 목적을 달성하고, 상술한 종래기술의 문제점을 해결하기 위하여, 본 발명의 일실시예에 따른 광고 제공 방법은 광고 및 상기 광고와 연관된 제1 키워드를 포함하는 제1 데이터베이스를 생성, 유지하는 단계, 상기 제1 키워드 별로 상기 제1 키워드와 연관된 단어 정보를 포함하는 제2 데이터베이스를 생성, 유지하는 단계, 사용자에 의해 브라우징(browsing)되는 웹페이지로부터 복수의 주제어를 포함하는 주제어 리스트를 추출하는 단계, 상기 추출된 주제어 리스트 및 상기 단어 정보에 기초하여 상기 제2 데이터베이스로부터 상기 웹페이지와 연관된 제2 키워드를 선택하는 단계 및 상기 제1 데이터베이스로부터 상기 제2 키워드와 연관된 광고를 추출하여 상기 웹페이지상에 제공하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 또 다른 실시예에 따른 광고 제공 방법은 광고 및 상기 광고와 연관된 제1 웹사이트를 포함하는 제1 데이터베이스를 생성, 유지하는 단계, 상기 제1 웹사이트 별로 상기 제1 웹사이트와 연관된 단어 정보를 포함하는 제2 데이터베이스를 생성, 유지하는 단계, 사용자에 의해 브라우징(browsing)되는 웹페이지로부터 복수의 주제어를 포함하는 주제어 리스트를 추출하는 단계, 상기 추출된 주제어 리스트 및 상기 단어 정보에 기초하여 상기 제2 데이터베이스로부터 상기 웹페이지와 연관된 제2 웹사이트를 선택하는 단계 및 상기 제1 데이터베이스로부터 상기 제2 웹사이트와 연관된 광고를 추출하여 상기 웹페이지상에 제공하는 단계를 포함하는 것을 특징으로 한다.
본 발명의 일측에 따르면, 상기 주제어 리스트를 추출하는 상기 단계는 상기 웹페이지에 대한 필터링을 통해 상기 웹페이지의 내용 정보를 추출하는 단계, 상기 내용 정보에 대한 형태소 분석을 통해 상기 내용 정보로부터 단어 벡터를 생성하는 단계 및 상기 단어 벡터를 이용하여 상기 주제어 리스트를 추출하는 단계를 포함하는 것을 특징으로 하는 웹페이지상의 광고 제공 방법이 제공된다.
본 발명의 또 다른 측면에 따르면, 상기 사용자로부터 검색어를 입력받는 단계, 상기 입력된 검색어로부터 제2 주제어 리스트를 추출하는 단계, 상기 추출된 제2 주제어 리스트 및 상기 단어 정보에 기초하여 상기 제2 데이터베이스로부터 상기 웹페이지와 연관된 제2 키워드 또는 제2 웹사이트를 선택하는 단계 및 상기 제1 데이터베이스로부터 상기 제2 키워드 또는 상기 제2 웹사이트와 연관된 광고를 추출하여 상기 웹페이지상에 제공하는 단계를 더 포함하는 것을 특징으로 하는 웹페이지상의 광고 제공 방법이 제공된다.
또한, 본 발명의 또 다른 실시예에 따른 광고 제공 시스템은 광고 및 상기 광고와 연관된 제1 키워드를 제1 데이터베이스에 포함하여 유지하기 위한 제1 데이터베이스 관리 모듈, 상기 제1 키워드 별로 상기 제1 키워드와 연관된 단어 정보를 제2 데이터베이스에 포함하여 유지하기 위한 제2 데이터베이스 관리 모듈, 사용자에 의해 브라우징(browsing)되는 웹페이지로부터 복수의 주제어를 포함하는 주제어 리스트를 추출하기 위한 주제어 추출 모듈, 상기 추출된 주제어 리스트 및 상기 단어 정보에 기초하여 상기 제2 데이터베이스로부터 상기 웹페이지와 연관된 제2 키워드를 선택하기 위한 키워드 선택 모듈 및 상기 제1 데이터베이스로부터 상기 제2 키워드와 연관된 광고를 추출하여 상기 웹페이지상에 제공하는 광고 제공 모듈을 포함하는 것을 특징으로 한다.
이하, 첨부된 도면을 참조하여 본 발명에 따른 광고 제공 방법 및 그 시스템을 상세히 설명하기로 한다.
도 1은 본 발명의 일실시예에 따른 내용 기반 분류를 이용한 광고 제공 방법 의 전반적인 프로세스를 도시한 흐름도이다.
본 실시예에 따른 광고 제공 방법은 소정의 광고 제공 시스템에서 수행될 수 있는데, 본 실시예에 따른 광고 제공 시스템은 광고주로부터 등록된 광고 및 상기 광고와 연관된 키워드를 포함하는 데이터베이스를 생성, 유지하고, 또한 상기 키워드 별로 상기 키워드와 연관된 단어 정보를 포함하는 데이터베이스(110)를 생성, 유지할 수 있다. 한편, 본 발명의 다른 실시예에 따르면, 상기 광고 제공 시스템은 광고주로부터 등록된 광고 및 상기 광고와 연관된 웹사이트를 포함하는 데이터베이스를 생성, 유지하고, 또한 상기 웹사이트 별로 상기 웹사이트와 연관된 단어 정보를 포함하는 데이터베이스(120)를 생성, 유지할 수 있다. 데이터베이스(110 또는 120)의 생성, 유지 및 관리 과정에 대하여는 후술한다.
단계(S101)에서 사용자가 파트너 웹사이트의 홈페이지에 접속하여, 단계(S102)에서 상기 홈페이지상의 소정의 검색창을 통해 검색어를 입력하거나, 이러한 검색어 입력 과정을 생략하고 상기 홈페이지상에 제시된 메뉴, 링크 등을 클릭하거나 주소창에 URL을 입력하면, 그에 따른 출력으로서 소정의 웹페이지가 사용자에게 제공되어, 단계(S103)에서 상기 사용자는 이렇게 제공된 웹페이지를 브라우징할 수 있다.
단계(S104)에서 상기 광고 제공 시스템은 상기 사용자에 의해 브라우징(browsing)되는 웹페이지로부터 복수의 주제어를 포함하는 주제어 리스트를 추출한다.
도 2는 상기와 같이 웹페이지로부터 주제어 리스트를 추출하기 위한 과정을 도시한 흐름도이다. 상기 광고 제공 시스템은 단계(S201)에서 웹페이지(210)에 대한 필터링을 수행하여, 단계(S202)에서 웹페이지(210)의 내용 정보를 추출한다.
도 3은 웹페이지(210)에 대한 필터링을 예시한 도면이다. 일반적으로 웹페이지(210)는 실제 내용과 광고 등 그 실제 내용과 큰 관계가 없는 부분으로 분류할 수 있다. 도 3에 도시한 것과 같이 상기 광고 제공 시스템은 사용자가 브라우징하고 있는 웹페이지(210)의 소스를 분석하여 광고를 비롯한 웹페이지(210)의 실제 내용과 큰 관계가 없는 부분을 식별하며, 상기 식별된 부분을 제외한 웹페이지(210)의 실제 내용만을 내용 정보로서 추출한다. 웹페이지(210)의 실제 내용과 큰 관계가 없는 부분에는 웹페이지(210)에 포함된 광고, 하이퍼 링크 리스트, 플래시 무비, 주석, 반복되는 문자열 등이 해당할 수 있다.
또한, 상기 광고 제공 시스템은 이렇게 추출된 내용 정보를 실제 내용 문서 di로 변환할 수 있다.
상기 광고 제공 시스템은 단계(S203)에서 실제 내용 문서 di에 대하여 형태소 분석을 수행하고, 이를 통해 단계(S204)에서 단어 벡터를 생성할 수 있으며, 도 4는 형태소 분석을 통한 단어 벡터 생성을 예시한 도면이다. 도 4에서와 같이, 상기 광고 제공 시스템은 실제 내용 문서 di에 각 단어가 나타난 횟수를 기록하여 단어 벡터의 생성에 활용할 수 있다.
일례로, 단어 벡터는 t, tf, df로 구성될 수 있다.
D = {d 1 , d 2 , ..., d
N }
d i = {(t i1 , tf i1 , df
i1 ), (t i2 , tf i2 , df i2 ), ...., (t iM' , tf iM' , df
iM' )}
t ij 란 실제 내용 문서 d i 의 j번째 단어를 의미하고,
tf ij 는 term frequency 즉 t ij 가 d i 에 나타난 횟수를 의미하며, df ij
는 document frequency 즉 t ij 가 전체 N개의 웹페이지 중 몇 개의 실제 내용 문서에 나타났는지를 의미한다.
이 때, 실제 내용 문서 d
i 에 나타난 모든 단어를 검색에 사용할 수는 없으므로, 상기 광고 제공 시스템은 단계(S205)에서 M'개의 단어에 대하여 단어별 가중치를 계산함으로써, 그 중 가중치가 높은 단어 M개를 선택하는데 이것이 주제어 리스트 추출이다. 상기 광고 제공 시스템은 단어별 가중치를 tf와 df값을 이용하여 계산할 수 있으며, df값을 알아내기 위해 키워드 또는 웹사이트 별로 단어 정보를 포함하는 데이터베이스(110 또는 120)를 참조할 수 있다.
단어는 실제 내용 문서 d
i 에 여러 번 나타날수록 그 선택될 확률이 높아지나, 실제 내용 문서 d
i 를 포함한 다른 실제 내용 문서들에도 동일하게 여러 번 나타나는 경우라면 그 선택될 확률이 낮아질 수 있다.
일례로, 각 단어의 가중치를 계산하는 식은 다음과 같을 수 있다.
idf ij = log((N+1)/df ij ), N= 총 실제 내용 문서의 개수
가중치 w ij = tf ij *idf ij i
이와 같이 각 단어의 가중치를 계산해서 상위 M개의 단어를 주제어로서 추출할 수 있으며, 이렇게 추출된 복수의 주제어를 주제어 리스트로 표시하면 다음과 같다.
d i = {(t i1 , tf i1 , df
i1 ), (t i2 , tf i2 , df i2 ), ...., (t iM , tf iM , df iM )}
도 5는 키워드 선택 과정을 개략적으로 도시한 도면이다. 도 5에 도시한 것과 같이, 상기 광고 제공 시스템은 단계(S105)에서 상기 추출된 주제어 리스트 및 데이터베이스(110)에 포함된 키워드별 단어 정보에 기초하여 데이터베이스(110)로부터 사용자가 브라우징하고 있는 웹페이지와 연관된 키워드를 선택한다.
데이터베이스(110)는 광고주들이 등록한 키워드 집합 K = {k
1 , k
2 ... , k
K }을 포함하고 있으며, 각 키워드는 자신과 연관하여 단어 정보를 포함하고 있는데, 일례로 상기 단어 정보는 다음과 같은 주제어의 집합으로 구성될 수 있다.
k k = {(t k1 , tf k1 , df
k1 ), (t k2 , tf k2 , df k2 ), ...., (t kM , tf kM , df kM )}
여기서, 실제 내용 문서 d
i 를 어떤 키워드 k
k' 로 분류할 것인가가 문제되는데, 일례로 k
k' 를 선택하는 식은 다음과 같다.
k' = max(k=1, ..., K)score(d i , k k
)
score(d
i , k
k ) = sum(j=1,...,M)
w
ij * w'
kj (w
ij : 실제 내용 문서 d
i 의 j번째 단어 t
j 의 가중치, w'
lj : 키워드 k
k
의 j번째 단어 t
j 의 가중치)
즉, 단어 정보는 소정의 단어 별로 가중치를 포함할 수 있고, 상기 광고 제공 시스템은 단계(S105)를 수행함에 있어서, 상기 주제어 리스트의 주제어와 매칭되는 상기 단어에 대하여 양자의 가중치를 곱셈 연산하고, 상기 연산된 곱셈값 중 최대 값에 해당하는 단어를 키워드로 선택할 수 있다.
한편, 상기 광고 제공 시스템은 단계(S106)에서 상기 추출된 주제어 리스트 및 데이터베이스(120)에 포함된 웹사이트 별 단어 정보에 기초하여 데이터베이스(120)로부터 사용자가 브라우징하고 있는 웹페이지와 연관된 웹사이트를 선택할 수 있다.
데이터베이스(120)는 광고주들이 등록한 웹사이트 집합 S = {s
1 , s
2 ... , s
S }를 포함하고 있으며, 각 웹사이트는 자신과 연관하여 단어 정보를 포함하고 있는데, 일례로 상기 단어 정보는 다음과 같은 주제어의 집합으로 구성될 수 있다.
s s = {(t s1 , tf s1 , df
s1 ), (t s2 , tf s2 , df s2 ), ...., (t sM , tf sM , df sM )}
여기서, 실제 내용 문서 d
i 를 어떤 웹사이트 s
s' 로 분류할 것인가가 문제되는데, 일례로 s
s' 를 선택하는 식은 다음과 같다.
s' = max(s=1, ..., S)score(d i , s s
)
score(d
i , s
s ) = sum(j=1,...,M)
w
ij * w'
sj (w
ij : 실제 내용 문서 d
i 의 j번째 단어 t
j 의 가중치, w'
sj : 웹사이트 s
s
의 j번째 단어 t
j 의 가중치)
즉, 단어 정보는 소정의 단어 별로 가중치를 포함할 수 있고, 상기 광고 제공 시스템은 단계(S106)를 수행함에 있어서, 상기 주제어 리스트의 주제어와 매칭되는 상기 단어에 대하여 양자의 가중치를 곱셈 연산하고, 상기 연산된 곱셈값 중 최대 값에 해당하는 단어를 키워드로 선택할 수 있다.
상기 광고 제공 시스템은 단계(S107)에서 광고주의 광고를 키워드와 연관하여 포함하고 있는 소정의 데이터베이스로부터 상기 선택된 키워드와 연관된 광고를 추출하여 사용자에 의해 브라우징되고 있는 웹페이지상에 제공할 수 있다. 또한, 상기 광고 제공 시스템은 단계(S107)에서 광고주의 광고를 웹사이트와 연관하여 포함하고 있는 데이터베이스로부터 상기 선택된 웹사이트와 연관된 광고를 추출하여 사용자에 의해 브라우징되고 있는 웹페이지상에 제공할 수 있다.
이하에서는 키워드 별 또는 웹사이트 별로 그와 연관된 단어 정보를 포함하는 데이터베이스(110 또는 120)의 생성, 유지 및 관리 과정에 대하여 설명한다.
도 6은 본 발명의 일실시예에 있어서, 내용 기반 분류를 위한 데이터베이스(110)의 구성을 도시한 도면이다.
앞서 설명한 단어 정보 k
k = {(t
k1 , tf
k1
, df
k1 ), (t
k2 , tf
k2 , df
k2 ), ...., (t
kM , tf
kM , df
kM )}를 어떻게 만드는가에 관한 것이다. 예를 들어, "인터넷 포탈"이라는 키워드와 연관된 단어는 다음과 같이 생성될 수 있는데,
검색포털, naver, empas, daum, 엠파스, COO, e메일, hankyung, ID, Identity, InFocus, Intel, IT기업, Korea, kr, KT, KT의, LG전자, 효과, Ltd, MS, MSN, MS도, .com, Oracle, pyt, SK커뮤니케이션즈, SK텔레콤, TV, voice, yahoo |
이러한 단어를 결정하는 방법과 상기 단어별 가중치를 결정하는 방법에 대한 설명이다.
(1) 해당 키워드를 등록한 웹사이트의 웹사이트 설명
도 7은 본 발명의 일실시예에 있어서, 광고에 포함된 웹사이트에 대한 설명에 기초하여 단어 정보를 생성하는 모습의 일례를 도시한 도면이다.
도 7에 도시한 것과 같이 "중고 컴퓨터"에 대해 등록한 웹사이트가 5개가 있다고 할 때 각 사이트의 설명에 나온 단어들이 다음 표와 같이 이 키워드에 대한 단어 집합의 일부가 될 수 있다.
중고 컴퓨터 |
중고 컴퓨터, Dell, 컴퓨터, 데스크톱, 노트북, 판매, 제품사양, 조립견적, 할인구매, 중고 모니터, LCD, 허브, .... |
여기에 속한 단어의 경우 해당 키워드를 표현하기에 적합한 것으로 광고주에 의해 결정된 단어들이므로 가중치를 높여서 M개의 단어 안에 포함될 확률을 높일 수 있다.
(2) 해당 키워드로 메타 검색한 결과 중 광고 검색 결과
도 8은 본 발명의 일실시예에 있어서, 검색 엔진을 통한 검색 결과 중 광고인 검색 결과에 기초하여 단어 정보를 생성하는 모습의 일례를 도시한 도면이다.
도 8에 도시한 것과 같이, 대부분의 검색 포탈 웹사이트(예를 들어, 엠파스, 네이버, 다음, 네이트 등)는 검색 결과로서 스폰서 링크(광고 검색 결과)를 게재한다.
도 8과 같은 메타검색의 광고 검색 결과로 게재되는 웹사이트 설명에 나온 단어들에 대해 가중치를 계산하여 다음 표와 같이 키워드에 대한 단어 정보의 일부를 결정할 수 있다.
중고 컴퓨터 |
중고 컴퓨터, 중고 모니터, 전문 쇼핑몰, 고가 매입, 중고 노트북, 플래시메모리, 노트북, LCD, 중고부품, 고품질... |
여기에 속한 단어들 역시 해당 키워드를 표현하기에 적합한 것으로 사람에 의해 결정된 단어들이므로 가중치를 부여하여(상기 (1)의 단어 가중치보다는 낮게) M개의 단어 안에 포함될 확률을 높일 수 있다.
(3) 해당 키워드를 등록한 사이트의 컨텐츠 분석결과
도 9는 본 발명의 일실시예에 있어서, 광고 웹사이트의 컨텐츠 분석 결과에 기초하여 단어 정보를 생성하는 모습의 일례를 도시한 도면이다.
해당 키워드를 등록한 웹사이트의 첫 페이지는 그 키워드와 관련성이 높은 단어들로 구성되어 있을 확률이 높다. 예를 들어, "중고 컴퓨터"라는 키워드를 엠파스에 등록한 사이트 중 하나인 http://www.junggodanawa.com의 경우, 그 첫 페이지가 도 9에 도시된 것과 같다.
이와 같이 키워드를 등록한 웹사이트의 컨텐츠를 분석하고, 가중치를 계산하여 다음 표와 같이 키워드에 대한 단어 정보의 일부를 결정할 수 있다.
중고 컴퓨터 |
펜티엄, LCD, 판매가격, 인텔, 삼성, 삼보, LG, 일반모니터, XP, Dimension, Windows, Home, 포함, 프로세서, 모니터, 한글Microsoft, 한정판매, TG, CD, LBM, 4GHz, 업그레이드, 80GHz, 무료, 1Ghz, Intel, 할인, HT, 다량, 시스템, 0GHz, 추가, 추가할인, 기술기반, 인텔Pentium... |
키워드를 등록된 웹사이트의 첫 페이지는 웹사이트 관리자에 의해 웹사이트의 특징을 가장 잘 표현하는 단어들로 구성되기 때문에 해당 키워드와도 관련성이 높은 단어들이 많다고 볼 수 있다. 그러므로, 여기에 속한 단어들에도 역시 가중치를 부여하여 (상기 (2)의 단어 가중치보다는 낮게) M개의 단어 안에 포함될 확률을 높일 수 있다.
(4) 해당 키워드로 메타 검색한 결과 중 상위 문서
상기 (1) 내지 (3)에서 생성된 웹사이트 광고에서 생성한 단어 정보 외에 일반적인 웹페이지에서 해당 키워드와 연관된 단어도 추출하여 상기 단어 정보에 추 가할 수 있다. 일례로, 메타검색 또는 웹로봇으로 수집한 일반 웹페이지에 대한 검색 결과를 사용할 수 있다.
도 10은 본 발명의 일실시예에 있어서, 검색 엔진을 통한 검색 결과 중 상위 문서에 기초하여 단어 정보를 생성하는 모습의 일례를 도시한 도면이다.
일례로, 메타검색을 사용할 경우, 예를 들어 5개의 검색 포탈 웹사이트에 "중고 컴퓨터"라는 키워드로 검색한 결과 중 상위 웹페이지 리스트는 도 10에 도시된 것과 같다.
중고 컴퓨터 |
중고컴퓨터, 컴퓨터, 중고, 중고모니터, 모니터, 중고PC, 노트북, 부품, 보안, 중고노트북, okpcmart, CPU, PC, HDD, RAM, 허브, 전문, oldcomputer, 중고부품, PC방매매관련, VGA, 프린터, 소프트웨어, 수거, 전문쇼핑몰, 중고컴퓨터쇼핑몰, 복사기, 컴부품판매, 프레임, 조립컴퓨터, 삼성, 메인보드, 중고컴퓨터세상, 도소매, 중고컴퓨터점, LCD, board, CDROM계열, 본체, 하드웨어, 필립스, 피씨마트, 중고컴퓨터튜닝... |
이 리스트에 나온 단어를 분석하고, 가중치를 계산하여 위 표와 같이 키워드에 대한 단어 정보의 일부를 결정할 수 있다.
웹로봇을 통해 수집한 문서에 대한 검색 방법도 위와 마찬가지로, 웹로봇을 통해 현재까지 수집된 문서에 대해 해당 키워드로 검색을 수행하고, 상위에 리스트 되는 웹페이지를 분석하여 단어 리스트를 추출하며, 각 단어별 가중치를 계산하여 위 표와 같이 키워드에 대한 단어 정보의 일부를 결정할 수 있다.
(5) 관리자 입력
상기 (1) 내지 (4)의 방법으로 생성된 단어 정보 외에도, 필요한 경우 관리자의 입력에 의해 키워드에 단어를 수동으로 할당할 수 있다. 관리자에 의해 할당된 단어는 상기 (1) 내지 (4)에서 생성된 단어보다 가중치를 크게 부여하여 M개의 단어 안에 포함될 확률을 가장 높일 수 있다.
이하에서는 상기와 같이 구축된 데이터베이스(110)를 자동으로 유지, 관리하는 실시예에 대하여 설명한다.
도 11은 본 발명의 일실시예에 있어서, 내용 기반 분류를 위한 데이터베이스의 자동 유지 관리를 설명하기 위한 도면이다.
데이터베이스(110)에서 키워드에 할당된 단어 정보는 해당 키워드와 연관성이 높은 단어의 리스트이다. 이러한 단어의 리스트는 시간이 지남에 따라 변동될 필요가 있다. 가령, 키워드 "중고 모니터"에 대한 단어 리스트에 과거에는 "CRT 모니터"라는 단어가 포함되어 있을 수 있지만, 현재는 "CRT 모니터"보다는 "LCD모니터"가 더 적합할 수 있기 때문이다.
본 발명의 일실시예에 따르면, 데이터베이스(110)의 유지 및 관리도 데이터베이스(110) 생성 단계에서 사용한 방법에 따라 자동으로 이루어질 수 있다.
(1) 해당 키워드를 등록한 웹사이트의 웹사이트 설명이 수정되어 새로 등록된 경우, 새로이 등록된 내용을 분석한 단어 리스트로 기존의 단어 리스트를 교체할 수 있다.
(2) 주기적인 메타검색을 통해 각 검색 포탈의 스폰서 링크의 설명을 분석하여 데이터베이스(110)에 새로운 주제어를 추가하거나 그 가중치값을 변경할 수 있다.
(3) 웹사이트 광고에 등록된 웹사이트의 첫 페이지의 변동 사항을 주기적으로 체크하고 그 내용을 분석하여, 데이터베이스(110)에 새로운 단어를 추가하거나 그 가중치값을 변경할 수 있다.
(4) 웹사이트 광고를 사용자가 클릭하였을 때, 해당 광고가 게재된 웹페이지의 내용을 분석하여 데이터베이스(110)에 새로운 단어를 추가하거나 그 가중치값을 변경할 수 있다.
(5) 주기적인 메타검색을 통해 메타검색의 상위 리스트를 분석하여, 데이터베이스(110)에 새로운 단어를 추가하거나 그 가중치값을 변경할 수 있다.
(6) 웹로봇을 사용하여 지속적으로 웹페이지를 수집하되, 주기적으로 수집된 문서를 최근의 문서로 교체하고, 현재 수집된 문서에 대해 해당 키워드로 검색을 수행하고 검색 결과의 상위 리스트를 분석하여, 데이터베이스(110)에 새로운 단어를 추가하거나 그 가중치값을 변경할 수 있다.
(7) 상기 (1) 내지 (6)의 방법으로 새롭게 생성되거나 변경된 단어 정보 외에 필요한 경우 관리자에 의해 키워드에 단어 정보를 수동으로 변경할 수 있다.
이하에서는 웹사이트 별로 그와 연관된 단어 정보를 포함하는 데이터베이스(120)의 생성, 유지 및 관리 과정에 대하여 설명한다.
앞서 설명한 단어 정보 s
s = {(t
s1 , tf
s1
, df
s1 ), (t
s2 , tf
s2 , df
s2 ), ...., (t
sM , tf
sM , df
sM )}를 어떻게 만드는가에 관한 것이다. 예를 들어, 중고 컴퓨터 관련 사이트인 http://www.junggodanawa.com이 웹사이트 광고에 등록되어 있다고 할 때 이 웹사이트에 대한 단어 정보는 다음과 같이 생성될 수 있는데,
펜티엄, LCD, 판매가격, 인텔, 삼성, 삼보, LG, 일반모니터, XP, Dimension, Windows, 프로세서, 모니터, 한글Microsoft, 한정판매, TG, CD, 업그레이드 |
이러한 단어 및 각 단어의 가중치값을 결정하는 방법에 대한 설명이다.
(1) 해당 웹사이트의 웹사이트 설명
http://www.junggodanawa.com의 광고주가 "중고 컴퓨터"라는 키워드를 등록하고, 그 웹사이트 광고를 위한 웹사이트 설명이 다음과 같다면,
중고컴퓨터다나와 - 중고 컴퓨터, 중고 모니터, LCD, 허브, 부품, 보상판매 www.junggodanawa.com |
이 웹사이트에 대한 단어 정보에는 다음 단어들이 포함될 수 있다.
www.junggodanawa.com |
중고 컴퓨터, 중고 모니터, LCD, 허브, 부품, 보상판매 |
여기에 속한 단어의 경우 해당 웹사이트를 표현하기에 적합한 것으로 광고주에 의해 결정된 단어들이므로 가중치를 높여서 M개의 단어 안에 포함될 확률을 높일 수 있다.
(2) 등록한 웹사이트의 웹사이트 컨텐츠 분석 결과
해당 웹사이트의 첫 페이지는 그 키워드와 관련성이 높은 단어들로 구성되어 있을 확률이 높다. 예를 들어, "중고 컴퓨터"라는 키워드를 엠파스에 등록한 웹사이트 중 하나인 http://www.junggodanawa.com의 경우 첫 페이지가 도 9와 같다.
이 페이지의 단어를 분석하고 가중치를 부여하여 다음과 같이 웹사이트에 대한 단어 정보의 일부를 결정할 수 있다.
http://www.junggodanawa.com/ |
펜티엄, LCD, 판매가격, 인텔, 삼성, 삼보, LG, 일반모니터, XP, Dimension, Windows, 프로세서, 모니터, 한글Microsoft, 한정판매, TG, CD, 업그레이드 |
등록된 웹사이트의 첫 페이지는 웹사이트 관리자에 의해 웹사이트의 특징을 가장 잘 표현하는 단어들로 구성되어 있을 것이기 때문에, 여기에 속한 단어들 역시 가중치를 높여서 (상기 (1)의 단어 가중치보다는 낮게) M개의 단어 안에 포함될 확률을 높일 수 있다.
(3) 관리자 입력
상기 (1) 및 (2)의 방법으로 생성된 웹사이트 별 단어 정보 외에, 필요한 경우 관리자의 입력에 의해 웹사이트에 단어를 수동으로 할당할 수 있다. 관리자에 의해 할당된 단어에는 상기 (1) 및 (2)에서 생성된 단어보다 가중치를 가장 크게 부여하여 M개의 단어 안에 포함될 확률을 가장 높일 수 있다.
이하에서는 상기와 같이 구축된 데이터베이스(120)를 자동으로 유지, 관리하는 실시예에 대하여 설명한다.
데이터베이스(120)에서 웹사이트에 할당된 단어 정보는 해당 웹사이트와 연관성이 높은 단어의 리스트이다. 이러한 단어의 리스트는 앞서 설명한 바와 같이 시간이 지남에 따라 변동될 필요가 있다.
본 발명의 일실시예에 따르면, 데이터베이스(120)의 유지 및 관리도 데이터베이스(120) 생성 단계에서 사용한 방법에 따라 자동으로 이루어질 수 있다.
(1) 등록된 웹사이트의 웹사이트 설명이 수정되어 새로 등록된 경우, 새로이 등록된 내용을 분석한 단어 리스트로 기존의 단어 리스트를 교체할 수 있다.
(2) 등록된 웹사이트의 첫 페이지의 변동 사항을 주기적으로 체크하고, 그 내용을 분석하여 데이터베이스(120)에 새로운 단어를 추가하거나 그 가중치값을 변경할 수 있다.
(3) 상기 (1) 및 (2)의 방법으로 새롭게 생성되거나 변경된 단어 정보 외에, 필요한 경우 관리자에 의해 웹사이트에 단어를 수동으로 변경할 수 있다.
한편, 본 발명의 일실시예에 따르면 사용자로부터 입력된 검색어의 내용에 기반하여 확장 검색을 수행함으로써, 검색어와 내용적으로 연관된 광고를 웹페이지상에 제공할 수 있는 방법 및 그 시스템이 제공된다.
사용자는 광고주가 아직 등록하지 않은 다양하게 변형된 형태의 키워드를 입력하여 검색을 요청할 수 있기 때문에, 검색에 대한 광고주의 광고 노출 범위는 매우 제한될 수 밖에 없다. 이러한 문제점을 해결하기 위해 일반적으로 확장 검색 등의 방법(사용자가 입력한 검색어가 광고주가 등록한 키워드를 포함하는 문장이라던지, 단어 나열 순서가 바뀐 경우에도 해당 웹사이트 광고를 게재하는 방법)이 사용되고 있지만, 이러한 방법에 의하더라도 내용의 유사성에 의한 광고 게재는 할 수가 없다. 예를 들어 사용자가 "결혼 예물" 이라는 검색어를 입력했을 때, "혼수" 또는 "예물 시계" 등의 키워드를 등록한 광고주의 광고는 게재할 수가 없다.
그러나, 본 실시예에 따르면 사용자가 입력한 검색어가 키워드에 일치되지 않는 경우라 하여도, 내용 기반 검색어 확장을 통해 상기 검색어와 내용적으로 연관된 웹사이트 광고를 게재할 수 있다.
도 1의 단계(S102)에서 사용자로부터 검색어를 입력받으면, 본 실시예에 따른 광고 제공 시스템은 단계(S104)에서 상기 입력된 검색어로부터 주제어 리스트를 추출할 수 있다.
또한, 상기 광고 제공 시스템은 단계(S105 또는 S106)에서 상기 추출된 주제어 리스트 및 데이터베이스(110 또는 120)에 포함된 단어 정보에 기초하여 데이터베이스(110 또는 120)로부터 사용자에 의해 브라우징되는 웹페이지와 연관된 키워 드 또는 웹사이트를 선택할 수 있다.
상기 광고 제공 시스템은 단계(S107)에서 광고주의 광고를 키워드와 연관하여 포함하고 있는 소정의 데이터베이스로부터 상기 선택된 키워드와 연관된 광고를 추출하여 사용자에 의해 브라우징되고 있는 웹페이지상에 제공할 수 있다. 또한, 상기 광고 제공 시스템은 단계(S107)에서 광고주의 광고를 웹사이트와 연관하여 포함하고 있는 소정의 데이터베이스로부터 상기 선택된 웹사이트와 연관된 광고를 추출하여 사용자에 의해 브라우징되고 있는 웹페이지상에 제공할 수 있다.
한편, 본 발명에 따른 광고 제공 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 상기 매체는 프로그램 명령, 데이터 구조 등을 지정하는 신호를 전송하는 반송파를 포함하는 광 또는 금속선, 도파관 등의 전송 매체일 수도 있다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같 은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이하에서는 본 발명의 또 다른 실시예에 따른 광고 제공 시스템에 대하여 설명한다.
도 12는 본 실시예에 따른 광고 제공 시스템의 구성을 도시한 블록도이다.
본 실시예에 따른 광고 제공 시스템(1200)은 제1 데이터베이스 관리 모듈(1201), 제2 데이터베이스 관리 모듈(1202), 주제어 추출 모듈(1203), 키워드/웹사이트 선택 모듈(1204) 및 광고 제공 모듈(1205)를 포함하여 구성될 수 있다.
제1 데이터베이스 관리 모듈(1201)은 광고주로부터 등록된 광고 및 상기 광고와 연관된 제1 키워드/제1 웹사이트를 제1 데이터베이스(1206)에 포함하여 유지한다.
제2 데이터베이스 관리 모듈(1202)은 상기 제1 키워드/제1 웹사이트 별로 상기 제1 키워드/제1 웹사이트와 연관된 단어 정보를 제2 데이터베이스(110/120)에 포함하여 유지한다. 제2 데이터베이스(110/120)의 생성, 유지 및 관리 과정에 대하여는 본 명세서에서 도 6 내지 11을 통해 설명한 바 있으므로 그 자세한 설명을 생략한다.
주제어 추출 모듈(1203)은 사용자(1210)에 의해 브라우징(browsing)되는 웹페이지로부터 복수의 주제어를 포함하는 주제어 리스트를 추출한다. 도 2 내지 4 는 상기와 같이 웹페이지로부터 주제어 리스트를 추출하기 위한 과정을 도시한 도면이며, 도 2 내지 4에 대하여는 본 명세서에서 이미 설명한 바 있으므로 자세한 설명을 생략한다.
키워드/웹사이트 선택 모듈(1204)은 상기 추출된 주제어 리스트 및 상기 단어 정보에 기초하여 제2 데이터베이스(110/120)로부터 상기 웹페이지와 연관된 제2 키워드/제2 웹사이트를 선택한다. 도 5는 키워드 선택 과정을 개략적으로 도시한 도면이며, 도 5에 대하여는 본 명세서에서 이미 설명한 바 있으므로 자세한 설명을 생략한다.
광고 제공 모듈(1205)은 제1 데이터베이스(1206)로부터 상기 제2 키워드/제2 웹사이트와 연관된 광고를 추출하여 상기 웹페이지상에 제공하여, 사용자(1210)의 광고 선택을 유도한다.
한편, 본 발명의 일실시예에 따르면 사용자로부터 입력된 검색어의 내용에 기반하여 확장 검색을 수행함으로써, 검색어와 내용적으로 연관된 광고를 웹페이지상에 제공할 수 있는 시스템이 제공된다. 본 실시예에 따르면 사용자가 입력한 검색어가 키워드에 일치되지 않는 경우라 하여도, 내용 기반 검색어 확장을 통해 상기 검색어와 내용적으로 연관된 웹사이트 광고를 게재할 수 있다.
본 실시예에 있어서, 사용자로부터 검색어가 입력되는 경우, 주제어 추출 모듈(1203)은 상기 검색어로부터 주제어 리스트를 추출하고, 키워드/웹사이트 선택 모듈(1204)은 상기 추출된 주제어 리스트 및 제2 데이터베이스(110/120)에 포함된 단어 정보에 기초하여 제2 데이터베이스(110/120)로부터 상기 사용자에 의해 브라 우징되고 있는 웹페이지와 연관된 제2 키워드/제2 웹사이트를 선택하고, 광고 제공 모듈(1205)은 제1 데이터베이스(1206)로부터 상기 제2 키워드/제2 웹사이트와 연관된 광고를 추출하여 상기 웹페이지상에 제공할 수 있다.
이상과 같이 본 발명은 비록 한정된 실시예와 도면에 의해 설명되었으나, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상의 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.
그러므로, 본 발명의 범위는 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등한 것들에 의해 정해져야 한다.