KR20110043365A - Method for generating personalized contextual advertisement - Google Patents

Method for generating personalized contextual advertisement Download PDF

Info

Publication number
KR20110043365A
KR20110043365A KR1020090100450A KR20090100450A KR20110043365A KR 20110043365 A KR20110043365 A KR 20110043365A KR 1020090100450 A KR1020090100450 A KR 1020090100450A KR 20090100450 A KR20090100450 A KR 20090100450A KR 20110043365 A KR20110043365 A KR 20110043365A
Authority
KR
South Korea
Prior art keywords
keyword
keywords
user
advertisement
interest
Prior art date
Application number
KR1020090100450A
Other languages
Korean (ko)
Other versions
KR101172574B1 (en
Inventor
이수원
강영길
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020090100450A priority Critical patent/KR101172574B1/en
Publication of KR20110043365A publication Critical patent/KR20110043365A/en
Application granted granted Critical
Publication of KR101172574B1 publication Critical patent/KR101172574B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

PURPOSE: A method for generating a personalized contextual advertisement is provided to enhance the advertising effect by constructing a contextual advertisement after considering the contextual importance of keywords and determining an advertisement keyword. CONSTITUTION: Metadata are generated by calculating the importance of emerging keywords within contents, and the number of emerging times of documents and the number of consecutive emerging times for the keywords emerging the content selected by the user is calculated. The interests of a user in the keywords are learned and are stored in a user model. The keyword importance and interest are combined in order to calculate advertisement keyword suitability. The advertisement for the advertisement keyword through the advertisement keyword suitability is displayed.

Description

개인 맞춤형 문맥광고 생성 방법{Method for generating personalized contextual advertisement}Method for generating personalized contextual advertisement

본 발명은 문맥광고의 효과를 향상시키기 위한 개인 맞춤형 문맥광고 생성 방법에 관한 것으로, 더욱 상세하게는 사용자가 웹 뉴스와 같은 웹 콘텐츠를 선택할 때 마다 키워드별로 사용자의 현재 관심도를 동적으로 학습하고, 학습 결과인 키워드 관심도와 정규화된 키워드 중요도를 결합하여 문맥광고에 활용하기 위한 광고 키워드를 결정하고, 이를 이용하여 문맥광고를 생성하는 방법에 관한 것이다. The present invention relates to a method for generating a personalized contextual advertisement for improving the effect of the contextual advertisement, more specifically, to dynamically learn the user's current interest by keyword whenever the user selects web content such as web news, The present invention relates to a method for generating an advertisement keyword for use in contextual advertisement by combining keyword interest and normalized keyword importance as a result, and generating a contextual advertisement using the same.

인터넷 광고의 형태는 팝업(Pop-up), 배너(Banner), 동영상, 키워드 등 여러 가지 형태로 나타난다. 이 중에서도 큰 비중을 차지하는 것은 키워드 광고로서 전체 규모의 약 40%를 차지하고 있다. 키워드 광고에는 사용자가 검색한 키워드에 대해 광고를 하는 키워드 검색광고와 사용자가 선택한 콘텐츠의 내용을 분석하여 연관성이 높은 광고를 제공하는 문맥광고(Contextual Advertisement) 등이 있다.Internet advertisements come in many forms, including pop-ups, banners, videos, and keywords. Among them, keyword ads account for about 40% of the total size. Keyword advertisements include keyword search advertisements that provide advertisements for keywords searched by the user and contextual advertisements that provide highly relevant advertisements by analyzing contents of the user's selected content.

문맥광고는 인터넷 사용자들이 검색엔진이 아닌 뉴스나 커뮤니티 사이트에서 콘텐츠를 조회할 때 해당 콘텐츠와 일치하거나 관련성이 높은 제품 또는 서비스 정보를 제공하는 새로운 방식의 광고 기법이다. 문맥광고는 현재 네이버, 다음, 동아 닷컴, 야후코리아, 하나포스닷컴, 조인스닷컴, 한경닷컴, 일간스포츠, 디시인사이드, 한겨레, 조선일보 등과 같은 미디어 포털사이트에 웹 뉴스, 제품 소개 및 기타 정보와 함께 등록 내용을 표시해 클릭 당 지불(CPC : Cost Per Click)하는 방식으로 제공되고 있다. Contextual advertising is a new way of advertising that provides information about products or services that match or relate to the content when Internet users view content on news or community sites, not on search engines. Contextual advertising is currently available on media portal sites such as Naver, Daum, Dong-A.com, Yahoo! Korea, HanaForce. It is provided by displaying the contents of registration and paying per click (CPC).

현재 서비스되고 있는 문맥광고는 광고주가 키워드를 구매하는 1단계; 신규 콘텐츠의 내용에 광고 키워드가 있는지를 검색하는 2단계; 검색된 광고 키워드에 해당하는 광고들을 콘텐츠와 함께 제공하는 3단계로 나누어진다. 이 과정에서 콘텐츠에 출현하는 광고 키워드들의 중요도가 고려되지는 않기 때문에 콘텐츠의 내용과 관련이 없는 광고가 노출되는 문제가 자주 발생된다. 또한, 사용자의 실제적인 관심이 반영되지 않아 광고의 효과가 떨어지게 되는 문제점도 가지고 있다.Currently serving contextual advertising is a step 1 in which the advertiser buys a keyword; Step 2 of searching for whether there is an advertisement keyword in the content of the new content; It is divided into three stages that provide advertisements corresponding to the searched advertisement keywords together with contents. In this process, since the importance of the ad keywords appearing in the content is not considered, a problem often occurs in which an advertisement irrelevant to the content of the content is exposed. In addition, since the user's actual interest is not reflected, there is a problem that the effectiveness of the advertisement is reduced.

본 발명은 기존의 문맥 광고가 문맥에 상관없이 광고주가 구매한 키워드들로 광고 내용을 구성하기 때문에 발행하는 문제, 즉 웹 콘텐츠와 이에 포함된 광고의 내용간의 연관성이 떨어지는 점과 사용자가 관심이 없는 내용의 광고를 제공함으로써 광고 효과가 떨어지는 문제점 등을 해결하기 위하여, 사용자의 키워드별 단기 선호도를 학습한 결과와 키워드들의 문맥내의 중요도를 결합하여 광고 키워드를 결정하고, 이를 활용하여 문맥 광고를 구성함으로써 광고의 효과를 높이는데 그 목적이 있다. The present invention is a problem that is issued because the existing contextual advertising is composed of the keywords purchased by the advertiser regardless of the context, that is, the relationship between the web content and the content of the ads contained therein and the user is not interested In order to solve the problem of lowering the effectiveness of the advertisement by providing the advertisement of the content, the keyword of the advertisement is determined by combining the results of the user's short-term preferences and the importance of the keywords in the context, and then constructing the contextual advertisement The purpose is to increase the effectiveness of advertising.

본 발명은 콘텐츠내의 출현 키워드들의 중요도를 계산하여 메타데이터를 생성하는 단계; 사용자가 선택한 콘텐츠들에서 출현한 키워드들의 출현문서빈도 및 연속출현빈도를 계산하는 단계; 사용자의 키워드들에 대한 관심도를 학습하여 사용자 모델에 저장하는 단계; 키워드 중요도와 키워드 관심도를 결합하여 광고 키워드 적합도를 계산하는 단계; 상기 단계 후 광고 키워드 적합도가 높은 키워드에 대한 광고를 노출시키는 단계로 이루어진 것에 특징이 있다. The present invention includes the steps of generating metadata by calculating importance of appearance keywords in content; Calculating the appearance document frequency and the continuous appearance frequency of the keywords appearing in the contents selected by the user; Learning and storing interest in the user's keywords in a user model; Calculating keyword suitability by combining keyword importance and keyword interest; After the step is characterized in that the step consisting of exposing the advertisement for the keyword having a high keyword suitability.

본 발명은 문맥광고에 활용하는 광고 키워드의 결정 과정에 콘텐츠 내에서 키워드가 가지는 중요도와 키워드에 대한 사용자 관심도를 반영함으로써, 사용자가 선택한 콘텐츠와 연관성이 높으면서 사용자의 관심이 높은 내용의 광고를 사용자에 게 제공하여 문맥광고의 효과를 향상시킨다. The present invention reflects the importance of keywords in the content and the user's interest in the keywords in the process of determining the keyword of the advertisement used in the contextual advertisement, thereby providing the user with advertisements of high interest to the user while being relevant to the selected content. Improve the effectiveness of contextual advertising.

본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.The terms or words used in this specification and claims are not to be construed as being limited to their ordinary or dictionary meanings, and the inventors may appropriately define the concept of terms in order to best describe their invention. It should be interpreted as meaning and concept corresponding to the technical idea of the present invention based on the principle that the present invention.

본 명세서에 기재된 예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형 예들이 있을 수 있음을 이해하여야 한다. Configurations shown in the examples and drawings described herein are only one of the most preferred embodiments of the present invention and do not represent all of the technical idea of the present invention, and various equivalents that may be substituted for them at the time of the present application and It should be understood that there may be variations.

이하 첨부된 도면을 참조하여 본 발명을 상세히 설명하면 다음과 같다.Hereinafter, the present invention will be described in detail with reference to the accompanying drawings.

도 1은 개인 맞춤형 문맥광고 시스템의 구조도로서 포털 사이트로부터 콘텐츠를 수집하여 콘텐츠 메타데이터를 생성하는 Metadata Manager와 사용자 모델을 생성하여 학습하는 User Model Manager, 키워드에 대한 사용자 관심도와 문서 내 중요도를 반영하여 문맥광고를 구성하는 Advertisement Manager로 구성된다.1 is a structure diagram of a personalized contextual advertisement system reflecting user interest and importance in a document by collecting a content from a portal site, a metadata manager for generating content metadata, a user model manager for creating and learning a user model, and keywords It is composed of Advertisement Manager that composes the contextual advertisement.

광고 키워드 결정과정은 메타데이터 생성, 사용자 모델의 학습, 광고 구성의 세 단계로 구별된다. 첫 번째 단계인 메타데이터 생성은 사용자 모델의 학습 및 키워드의 광고적합도 계산에 활용하기 위한 콘텐츠 메타데이터를 생성하는 과정이다. 이 과정은 다시 Web Contents Crawler에 의한 콘텐츠 수집, Text Mining Module에 의한 키워드 분석, Metadata Creator에 의한 메타데이터 생성으로 구분되며, 이 과정들은 Metadata Manager에 의해 관리된다.The advertising keyword decision process is divided into three stages: metadata generation, user model learning, and advertisement construction. Metadata generation, the first step, is the process of generating content metadata for use in learning the user model and calculating the advertising suitability of keywords. This process is divided into content collection by Web Contents Crawler, keyword analysis by Text Mining Module, and metadata generation by Metadata Creator. These processes are managed by Metadata Manager.

[표 1]은 본 발명에서 생성하여 활용하는 메타데이터의 예로서, 뉴스 도메인을 대상으로 하여 제목, 섹션, 출처, URL, 키워드벡터 등으로 구성된 메타데이터를 보여준다.[Table 1] is an example of metadata generated and utilized in the present invention, and shows the metadata composed of a title, a section, a source, a URL, a keyword vector, and the like for a news domain.

뉴스 메타데이터News metadata 제목title 섹션section URLURL 출처source 키워드벡터<키워드,키워드 가중치>Keyword Vector <keyword, keyword weight> 10월 가요계 '별들의 전쟁?'…October 'Star Wars?' 방송/연예Broadcast / Entertainment http://news.media.daum.net/...http: //news.media.daum.net / ... 조선일보Chosun Ilbo <전쟁,0.3,0.3>,<발라드, 0.4,0.2>, <신승훈, 0.4,0.17>,...<War, 0.3, 0.3>, <Ballard, 0.4,0.2>, <Shin Seung-hoon, 0.4,0.17>, ...

키워드 벡터에서 키워드 가중치로는 TFIDF를 사용한다. TFIDF는 문서에 출현한 키워드의 중요도를 계산하는 방법으로 한 문서에서 많이 나오면서 다른 문서에서는 적게 나오는 키워드를 중요 키워드로 간주하는 것이다. 즉, 한 문서에서 특정 키워드의 중요도는 그 문서에서 출현한 빈도(Term Frequency)에 비례하고 그 키워드가 다른 문서에서 출현하는 빈도(Document Frequency)에 반비례한다.TFIDF is used as a keyword weight in the keyword vector. TFIDF is a method of calculating the importance of keywords appearing in a document, and considers keywords that appear more in one document but less in another document as important keywords. That is, the importance of a specific keyword in one document is proportional to the frequency of appearance in the document (Term Frequency) and inversely proportional to the frequency in which the keyword appears in another document (Document Frequency).

그러나 키워드의 빈도는 문서의 길이에 비례하는 경향을 나타내므로 문서의 길이가 긴 경우에 키워드의 중요도가 높아지는 단점이 있다. 따라서 이러한 단점을 극복하기 위해 일반적으로 같은 문서의 키워드 빈도의 최대값에 의한 정규화와 코사인 정규화 등이 사용된다. However, since the frequency of the keyword tends to be proportional to the length of the document, the importance of the keyword increases when the document length is long. Therefore, in order to overcome these disadvantages, normalization and cosine normalization by the maximum value of keyword frequency of the same document are generally used.

[수학식 1]은 본 발명에서 사용된 정규화된 TFIDF식이다. tf(di)/tfmax는 같은 문서에서 많이 출현한 키워드의 중요도를 높여주며, log N/df(di)는 여러 문서에서 출현한 키워드의 중요도를 낮게 한다.Equation 1 is a normalized TFIDF equation used in the present invention. tf (d i ) / tf max increases the importance of many keywords in the same document, and log N / df (d i ) decreases the importance of keywords in several documents.

Figure 112009064594494-PAT00001
Figure 112009064594494-PAT00001

두 번째 단계인 사용자 모델의 학습은 User Model Manager에 의해 두 단계에 걸쳐 이루어진다. 우선, 사용자가 콘텐츠를 선택하면 Frequency Counter에 의해서 현재 선택된 콘텐츠에서 출현한 키워드에 대해 사용자 모델에서의 출현문서빈도 및 연속출현문서빈도가 증가된다. 이러한 과정이 끝나면, Preference Calculator에서는 키워드들에 대한 새로운 관심도를 계산하여 사용자 모델에 저장한다.The second step, learning the user model, is done in two steps by the User Model Manager. First, when the user selects the content, the appearance document frequency and the continuous appearance document frequency in the user model are increased for the keyword appearing in the content currently selected by the Frequency Counter. After this process, the Preference Calculator calculates the new interest for the keywords and stores it in the user model.

[표 2]는 사용자 모델의 예이다. 사용자 모델은 사용자가 선택한 웹 뉴스로부터 학습한 '키워드 관심도 벡터'와 사용자가 선택한 뉴스 문서들에서 각각의 키워드가 출현한 문서빈도인 '키워드 출현문서빈도 벡터', 사용자가 선택한 뉴스 문서들에서 각각의 키워드가 연속으로 출현한 문서빈도인 '키워드 연속출현문서빈도 벡터'로 구성된다.Table 2 shows examples of user models. The user model consists of a keyword interest vector learned from web news selected by the user, a keyword occurrence document vector, the frequency of occurrence of each keyword in the news documents selected by the user, and a news frequency selected from the user selected news documents. It consists of 'keyword consecutive appearance document frequency vector', which is a document frequency in which keywords appear consecutively.

키워드 관심도 벡터Keyword interest vector <키워드1, 관심도>, <키워드2, 관심도>,...<Keyword 1, interest>, <keyword 2, interest>, ... 키워드 출현문서빈도 벡터Keyword appearance document frequency vector <키워드1, 출현문서빈도>,
<키워드2, 출현문서빈도>,...
<Keyword 1, appearance document frequency>,
<Keyword 2, frequency of appearance document>, ...
키워드 연속출현문서빈도 벡터Keyword continuous appearance frequency vector <키워드1, 연속출현문서빈도>,
<키워드2, 연속출현문서빈도>,...
<Keyword 1, Document Frequency>
<Keyword 2, Document Frequency>, ...

본 발명에서 사용자 모델에는 사용자가 포털 사이트에 접속해서 웹 콘텐츠를 이용하는 동안에 학습된 관심도가 저장된다. 현실적으로 웹 콘텐츠를 이용하는 대다수의 사용자가 로그인을 하지 않기 때문에 관심도를 계속적으로 학습하고 활용하는 것은 용이하지 않다. 따라서 사용자 모델의 생성 및 학습은 사용자의 접속에 의해 세션이 생성되어 유지되는 동안 이루어지며, 세션이 종료되면 사용자 모델은 시스템에서 삭제된다.In the present invention, the user model stores interests learned while the user accesses the portal site and uses the web content. In reality, it is not easy to continuously learn and use interest because the majority of users who use web content do not log in. Therefore, the creation and learning of the user model is performed while the session is created and maintained by the user's connection, and when the session is terminated, the user model is deleted from the system.

사용자 모델의 학습은 사용자가 새로운 웹 콘텐츠를 선택할 때마다 두 단계로 나누어 이루어진다. 첫 번째 단계는 사용자가 현재 선택한 콘텐츠에서 출현한 키워드에 대해 사용자 모델의 ‘키워드 출현문서빈도 벡터’와 ‘키워드 연속출현문서빈도 벡터’를 업데이트하는 과정이다. 우선, 콘텐츠에서 출현한 키워드가 ‘키워드 출현문서빈도 벡터’에 존재할 경우 출현문서빈도를 증가시키고, 없을 경우 출현문서빈도의 값을 1로 하여 ‘키워드 출현문서빈도 벡터’에 그 키워드를 추가한다. 마찬가지로 ‘키워드 연속출현문서빈도 벡터’의 업데이트를 진행한다. 단, ‘키워드 연속출현문서빈도 벡터’에 포함되어 있는 키워드들 중에서 현재 선택한 콘텐츠에 출현하지 않는 키워드의 연속출현문서빈도는 0으로 초기화된다.Learning the user model is done in two stages whenever the user selects new web content. The first step is to update the keyword appearance document frequency vector and the keyword successive document frequency vector for the keywords that appear in the content currently selected by the user. First, if a keyword appearing in the content exists in the keyword appearance document frequency vector, the appearance document frequency is increased, and if not, the keyword is added to the keyword appearance document frequency vector with the value of appearance document frequency as 1. Similarly, we will update the `` keyword sequence appearance document vector ''. However, among the keywords included in the keyword continuous appearance document frequency vector, the continuous appearance document frequency of a keyword that does not appear in the currently selected content is initialized to zero.

두 번째 단계는 사용자 모델에 포함된 각각의 키워드에 대한 관심도를 계산하여 ‘키워드 관심도 벡터’를 갱신하는 과정이다.The second step is to update the 'keyword interest vector' by calculating the interest for each keyword included in the user model.

[수학식 2]는 사용자 모델 u에서 키워드 k가 가지는 출현문서빈도 가중치 dfw(u,k)를 계산하는 식이다.Equation 2 calculates the appearance document frequency weight dfw (u, k) of the keyword k in the user model u.

Figure 112009064594494-PAT00002
Figure 112009064594494-PAT00002

[수학식 3]은 사용자 모델 u에서 키워드 k가 가지는 연속출현문서빈도 가중치 cdfw(u,k)를 계산하는 식이다.[Equation 3] is a formula for calculating the continuous appearance document frequency weight cdfw (u, k) of the keyword k in the user model u.

Figure 112009064594494-PAT00003
Figure 112009064594494-PAT00003

[수학식 4]는 사용자 모델 u에서 키워드 k에 대한 키워드 관심도 interest(u,k)를 계산하는 식이다.[Equation 4] is an expression for calculating the keyword interest degree interest (u, k) for the keyword k in the user model u.

Figure 112009064594494-PAT00004
Figure 112009064594494-PAT00004

키워드 k가 사용자가 선택한 문서에서 얼마나 출현했는지를 나타내는 dfw(u,k)와 키워드 k가 사용자가 선택한 문서에서 얼마나 연속적으로 출현했는지를 나타내는 cdfw(u,k)를 Certainty Factor 결합수식에 적용하여 interest(u,k)를 계산한다. 계산된 키워드 관심도는 사용자 모델의 ‘키워드 관심도 벡터’에 저장되어 광고 키워드 적합도 계산에 활용된다.Dfw (u, k), which indicates how many times k appears in the user's selected document, and cdfw (u, k), which indicates how consecutively the keyword k appeared in the user's selected document, is applied to the Certainty Factor combination equation. Calculate (u, k) The calculated keyword interest is stored in the keyword interest vector of the user model and used to calculate the ad keyword fitness.

상기의 수학식을 활용하여 사용자 관심도를 학습하는 과정은 다음과 같다.A process of learning user interest using the above equation is as follows.

[표 3]은 사용자가 뉴스를 선택한 순서에 따른 뉴스 내용의 예이다.Table 3 shows an example of news content in the order in which the user selects the news.

뉴스 순서News order 내용Contents 뉴스 1News 1 ...복부 비만 문제를 해결할 것으로 기대되는 다이어트 음료 `엔비가(Enviga)` 출시...... Launched Enviga, a Diet Drink Expected to Solve Abdominal Obesity 뉴스 2News 2 ...복부 비만, 변비, 흡연이 탈장 부른다...... abdominal obesity, constipation, smoking calls hernia ... 뉴스 3News 3 ...초콜릿은 비만,변비,기미,주름,거친 피부,암,동맥경화,위궤양,스트레스,알레르기 등에 효과가 있다고 한다....Chocolate is said to be effective in obesity, constipation, blemishes, wrinkles, rough skin, cancer, arteriosclerosis, gastric ulcers, stress, and allergies ....

도 2는 [표 3]의 뉴스 내용으로부터 사용자 관심도를 학습하는 과정의 예로서, 사용자는 ‘뉴스 1’을 최초로 선택하여 학습한다. 학습의 결과로 출현문서빈도, 연속출현문서빈도, 키워드 관심도가 업데이트된다. 초기의 학습에서는 모든 키워드의 출현문서빈도, 연속출현문서빈도가 1이기 때문에 각각의 최대값은 1이 된다. 따라서 출현문서빈도 가중치와 연속출현문서빈도 가중치가 1이 되고, 키워드 관심도도 1이 되어 초기 값이 설정된다. 2 is an example of a process of learning the user interest from the news content of [Table 3], the user first selects the 'news 1' to learn. As a result of learning, the appearance document frequency, continuous appearance document frequency, and keyword interest are updated. In the initial learning, the maximum document value is 1 since the appearance document frequency and the continuous appearance document frequency of all keywords are 1. Therefore, the initial document frequency weight and the continuous appearance document weight are 1, and the keyword interest is 1, and an initial value is set.

두 번째로 선택한 ‘뉴스 2’에서 ‘비만’과 ‘복부’가 출현했기 때문에 이 키워드들의 출현문서빈도, 연속출현문서빈도가 1씩 증가하였다. 반면에, ‘뉴스 1’에서 출현한 ‘다이어트’는 ‘뉴스 2’에서 출현하지 않았기 때문에 연속출현문서빈도가 0으로 초기화된다. 이러한 출현문서빈도, 연속출현문서빈도의 변화에 의해 출현문서빈도 가중치와 연속출현문서빈도 가중치가 새롭게 계산되고, 이는 키워드 관심도에 반영된다. 그 결과, ‘뉴스 1’, ‘뉴스 2’에서 연속으로 출현한 ‘비만’, ‘복부’의 키워드 관심도가 1이 되고, ‘뉴스 1’에서만 출현한 ‘다이어트’와 ‘뉴스 2’에서만 출현한 ‘변비’의 키워드 관심도는 0.5가 된다.In the second edition of News 2, obesity and abdomen appeared, so the frequency of appearance and sequential appearance of these keywords increased by one. On the other hand, since the 'diet' that appeared in 'news 1' did not appear in 'news 2', the continuous appearance document frequency is initialized to zero. Due to the change of the appearance document frequency and the continuous appearance document frequency, the appearance document frequency weight and the continuous appearance document frequency weight are newly calculated, which is reflected in the keyword interest. As a result, the keyword interests of 'obesity' and 'abdomen' that appeared continuously in 'News 1' and 'News 2' became 1, and they appeared only in 'Diet' and 'News 2' which appeared only in 'News 1'. 'Constipation' keyword interest is 0.5.

세 번째로 선택한 ‘뉴스 3’에서는 기존 사용자 모델에 있는 키워드들 중에서 ‘비만’과 ‘변비’가 출현했기 때문에 이 키워드들의 출현문서빈도, 연속출현문서빈도가 1씩 증가하였다. 반면에, ‘뉴스 1’, ‘뉴스 2’에서 출현한 ‘복부’는 ‘뉴스 3’에서 출현하지 않았기 때문에 연속출현문서빈도가 0으로 초기화된다. 따라서 출현문서빈도, 연속출현문서빈도 최대인 키워드는 ‘비만’이 된다. 이러한 출현문서빈도, 연속출현문서빈도의 변화가 키워드 관심도에 반영된 결과로 ‘비만’은 키워드 관심도를 1로 유지하였고, ‘복부’는 0.7로 키워드 관심도가 감소하였다. 또한, ‘변비’의 경우 출현문서빈도가 2로서 ‘복부’와 동일하나, 연속출현문서빈도의 영향으로 키워드 관심도가 0.9로 증가하게 된다.In the third selection, News 3, obesity and constipation appeared among the keywords in the existing user model, so that the appearance and frequency of continuous appearance of these keywords increased by one. On the other hand, since the abdomen that appeared in News 1 and News 2 did not appear in News 3, the continuous appearance document frequency is reset to zero. Therefore, the keyword with the highest appearance document frequency and continuous appearance document frequency becomes 'obesity'. As a result of the changes in appearance frequency and continuous appearance frequency reflected in keyword interest, 'obesity' kept keyword interest at 1 and 'abdomen' decreased keyword interest to 0.7. In addition, in the case of 'constipation', the appearance document frequency is 2, which is the same as 'abdomen', but the keyword interest increases to 0.9 due to the influence of the continuous appearance document frequency.

마지막 단계인 문맥광고 구성은 사용자 모델과 메타데이터를 활용하여 키워드의 광고적합도를 계산하여 그 값이 가장 큰 키워드에 대해 광고목록을 구성하여 사용자에게 제공하는 단계이다. 이러한 광고 적합도 계산과 광고 구성은 Advertisement Manager의 AdSuitability Calculator와 Ad List Creator에서 이루어진다. The final step, the contextual advertisement composition, is to calculate the advertisement suitability of the keyword by using the user model and metadata, and construct an advertisement list for the keyword having the largest value and provide it to the user. The advertisement suitability calculation and advertisement composition are performed in the AdSuitability Calculator and Ad List Creator of the Advertisement Manager.

[수학식 5]는 콘텐츠에 출현하는 키워드에 대한 사용자 모델의 관심도와 키워드 가중치에 각각 가중치를 적용하여 더하는 과정을 통해 광고 키워드 적합도를 계산하는 수식이다. 가중치 α, β는 0과 1사이의 값으로서 서로 더하면 1이 된다. [Equation 5] is a formula for calculating the ad keyword suitability through the process of applying the weight to the user model interest and keyword weight for the keywords appearing in the content. The weights α and β are values between 0 and 1, which add up to one.

Figure 112009064594494-PAT00005
Figure 112009064594494-PAT00005

도 3는 상기의 [수학식 5]를 활용한 광고 키워드 적합도 계산의 예로서, 뉴스로부터 추출된 키워드 가중치는 각각 ‘영화’(1), ‘미녀’(0.5), ‘성형수술’(0.75), ‘체중’(0.5)로서 ‘영화’의 가중치가 가장 높다. 반면에 사용자 모델에 학습되어 있는 키워드 관심도는 ‘영화’(0.2), ‘미녀’(0.3), ‘성형수술’(0.2), ‘체중’(0.8)로서 ‘체중’의 키워드 관심도가 가장 높다. 가중치 α, β를 각각 0.5로 설정하여 광고 키워드 적합도를 계산하면, 키워드 가중치가 1로 가장 높지만, 키워드 관심도가 0.2로 가장 낮은 ‘영화’의 광고 키워드 적합도는 0.6이 된다. ‘영화’와는 반대로 키워드 가중치는 0.5로 낮지만, 키워드 관심도가 0.8로 가장 높은 ‘체중’의 광고 키워드 적합도는 0.65가 되어 ‘영화’의 광고 키워드 적합도보다 크다. 그 결과, ‘체중’이 광고 키워드로 선택되게 된다.3 is an example of calculating the keyword keyword suitability using the above [Equation 5], the keyword weight extracted from the news is 'movie' (1), 'beauty' (0.5), 'plastic surgery' (0.75), respectively , 'Weight' (0.5) has the highest weight. On the other hand, the keyword interests learned in the user model are 'movie' (0.2), 'beauty' (0.3), 'plastic surgery' (0.2), and 'weight' (0.8). When the keyword α and β are set to 0.5 and the keyword keyword fitness is calculated, the keyword keyword '1' has the highest keyword weight of 1, but the keyword's keyword interest level is 0.2, which is 0.6. Contrary to 'Movie', keyword weight is low as 0.5, but 'Weight', which has the highest keyword interest, is 0.65, which is higher than 'Movie'. As a result, "weight" is selected as the ad keyword.

모든 키워드에 대한 키워드 적합도 계산이 끝난 후에는 키워드 적합도가 가장 높은 키워드를 광고 키워드로 결정한다. 광고 키워드가 선택되면, 선택된 키워 드에 대한 광고 정보를 DB(Ad Sites Data)에서 검색하여 광고정보를 구성한다. After the keyword fitness calculation for all keywords is completed, the keyword having the highest keyword suitability is determined as the advertisement keyword. When the advertisement keyword is selected, the advertisement information for the selected keyword is searched in the DB (Ad Sites Data) to configure the advertisement information.

[표 4]는 ‘체중’을 구매한 광고주들의 광고 정보의 예이다. [Table 4] is an example of advertisement information of advertisers who purchased 'weight'.

키워드keyword 광고 idAd id 제목title urlurl 체중weight a1234a1234 인터파크 체중 - 체중, 몸짱, 헬스, 다이어트, 건강한 생활, 믿을 수 있는 인터파크.Interpark Weight-Weight, fitness, fitness, diet, healthy living, reliable interpark. http://www.interpark.com/gate/ippgw.jsp?biz_cd=P01449...http: //www.interpark.com/gate/ippgw.jsp? biz_cd = P01449 ... 체중weight a1235a1235 허벌라이프 비만클리닉 쉐이프몰 - 비만클리닉, 허벌라이프 다이어트, 무료 맛보기, 단기간 살빼기, 산후비만.Herbalife Obesity Clinic Shape Mall-Obesity Clinic, Herbalife Diet, Free Trial, Short-Term Loss, Postpartum Obesity. http://www.shapemall.co.krhttp://www.shapemall.co.kr 체중weight a1236a1236 한의원 려 엉덩이살빼기 - 강남역 위치, 몸과 마음을 디자인 하는 한방다이어트, 개별 맞춤다이어트, 요요방지.Oriental medicine to lose buttocks-Gangnam Station location, herbal diet to design the body and mind, personalized diet, yo-yo prevention. http://www.ryeoclinic.comhttp://www.ryeoclinic.com 체중weight a1237a1237 다이어트전문 허벌코리아 - 단백질다이어트, 체질개선, 빠른감량, 요요극복, 고단백 저칼로리.Herbal Korea specializing in diet-protein diet, constitution improvement, fast weight loss, yo-yo overcome, high protein low calorie. http://www.kingdiet.co.krhttp://www.kingdiet.co.kr

이하는 본 발명에 따른 개인 맞춤형 문맥광고 생성 방법의 성능 평가를 위하여 비교실험을 수행한 일실시 예이다. 실험은 문맥광고 서비스를 제공하고 있는 포털사이트 하나를 선정하고, 포털사이트에서 제공하는 웹 뉴스들 중에서 15명의 사용자가 선택한 20개의 뉴스에 포함된 광고와 실험 시스템에서 보여주는 광고들을 대상으로 지정된 평가 항목들에 대해 평가하는 것으로 진행되었다.The following is an embodiment of performing a comparative experiment to evaluate the performance of the method for generating a personalized contextual advertising according to the present invention. The experiment selects one portal site that provides the contextual advertisement service, and evaluates items targeted to advertisements included in 20 news selected by 15 users and advertisements displayed in the experiment system among web news provided by the portal site. The evaluation proceeded.

[표 5]는 비교 평가를 위한 평가 항목들이다. 클릭 여부는 ‘클릭’, ‘클릭안함’의 2가지로 각각 1, 0의 정수 값을 부여하였다.Table 5 shows the evaluation items for the comparative evaluation. There were two kinds of clicks, 'click' and 'no click', and integer values of 1 and 0 were assigned.

평가 항목 번호Evaluation item number 평가 항목Evaluation items 1One 포털사이트에서 제공하는 광고의 클릭여부Click on the advertisement provided by the portal site 22 TF에 의해 결정된 광고키워드에 의한 광고의 클릭여부Whether the ad is clicked by the ad keyword determined by TF 33 TFIDF에 의해 결정된 광고키워드에 의한 광고의 클릭여부Whether the ad is clicked by the ad keyword determined by TFIDF 44 사용자 관심도에 의해 결정된 광고 키워드에 의한 광고의 클릭여부Whether the ad is clicked on by an ad keyword determined by user interest 55 TFIDF와 사용자 관심도를 결합한 광고 키워드 적합도에 의해 결정된 광고 키워드 (α : 0.5, β : 0.5)Ad keywords determined by ad keyword suitability combining TFIDF and user interest (α: 0.5, β: 0.5)

도 4는 본 발명의 성능 평가를 위해 사용자 15명이 20개의 뉴스를 선택하는 동안 평가항목별로 제공되는 문맥광고에 대한 사용자별 클릭 빈도를 비교한 결과이다. 4 is a result of comparing the click frequency for each user for the contextual advertisement provided for each evaluation item while the 15 users select 20 news for the performance evaluation of the present invention.

평균적으로 본 발명에서 활용하는 광고 키워드 적합도에 의해 결정된 광고 키워드에 의한 광고의 평균클릭빈도가 6.9로 다른 방법들 TF(5.1), TFIDF(6.0), 키워드 관심도(4.5)에 비해 가장 높은 것을 보여준다. 또한 광고 키워드 적합도에 의한 광고를 가장 많이 클릭한 사람은 6명으로서 기존 문맥광고(4명), TFIDF(3명) 등의 방법보다 많았다. 광고주 정보가 다르기 때문에 공정한 비교가 이루어지기 힘든 기존 문맥광고를 제외하더라도, 광고 키워드 적합도를 사용한 문맥광고가 TF나 TFIDF와 같은 기존의 키워드 가중치를 활용한 문맥광고보다 높은 클릭 빈도를 보여준다.On average, the average click frequency of advertisements by the advertisement keywords determined by the advertisement keyword suitability utilized in the present invention is 6.9, which is the highest compared to other methods TF (5.1), TFIDF (6.0), and keyword interest (4.5). In addition, 6 people clicked the most advertisements according to the keyword's suitability, more than the existing methods of contextual advertisement (4) and TFIDF (3). Except for the existing contextual advertising, which is difficult to make a fair comparison because the advertiser information is different, the contextual advertising using the keyword keyword fit shows higher click frequency than the contextual advertising using the existing keyword weight such as TF or TFIDF.

이상과 같이, 본 발명은 비록 한정된 일실시예와 도면에 의해 설명되었으나 본 발명은 이것에 의해 한정되지 않으며 본 발명이 속하는 추천 기술 분야에서 통상의 지식을 가진 자에 의해 본 발명의 기술사상과 아래에 기재될 특허 청구범위의 균등 범위내에서 다양한 수정 및 변형이 가능함은 물론이다.As described above, although the present invention has been described by way of limited embodiments and drawings, the present invention is not limited thereto, and the technical spirit of the present invention and the following will be understood by those skilled in the art. Of course, various modifications and variations are possible within the scope of the equivalent claims.

본 명세서에 첨부되는 다음의 도면들은 본 발명의 바람직한 실시예를 예시하는 것이며, 후술하는 발명의 상세한 설명과 함께 본 발명의 기술사상을 더욱 이해시키는 역할을 하는 것이므로, 본 발명은 그러한 도면에 기재된 사항에만 한정되어 해석되어서는 아니된다.   The following drawings attached to this specification are illustrative of preferred embodiments of the present invention, and together with the detailed description of the invention to serve to further understand the technical spirit of the present invention, the present invention is a matter described in such drawings It should not be construed as limited to.

도 1은 본 발명에 따른 개인 맞춤형 문맥 광고 생성 시스템의 구조를 나타낸 도면  1 is a diagram showing the structure of a personalized contextual advertising system according to the present invention

도 2는 사용자 모델의 학습의 예를 나타낸 도면  2 illustrates an example of training a user model.

도 3은 광고 키워드 적합도 계산의 예를 나타낸 도면  3 is a diagram illustrating an example of calculating an ad keyword suitability.

도 4는 평가 항목별로 사용자별 클릭 빈도 비교 결과를 그래프로 나타낸 도면.  4 is a graph illustrating a comparison result of click frequencies for each user for each evaluation item.

Claims (5)

콘텐츠내의 출현 키워드들의 중요도를 계산하여 메타데이터를 생성하는 1단계;Generating metadata by calculating importance of appearing keywords in the content; 사용자가 선택한 콘텐츠들에서 출현한 키워드들의 출현문서빈도 및 연속출현빈도를 계산하는 2단계;Calculating the appearance document frequency and the continuous appearance frequency of the keywords appearing in the contents selected by the user; 사용자의 키워드들에 대한 관심도를 학습하여 사용자 모델에 저장하는 3단계;Learning and storing interest in the user's keywords in a user model; 키워드 중요도와 키워드 관심도를 결합하여 광고 키워드 적합도를 계산하는 4단계;Calculating a keyword suitability by combining keyword importance and keyword interest; 광고키워드적합도가 광고키워드에 대한 광고를 노출시키는 5단계를 포함하는 개인 맞춤형 문맥광고 생성 방법A method for creating a personalized contextual advertisement, comprising five steps of ad keyword suitability to expose an advertisement for the ad keyword 제 1항에 있어서, The method of claim 1, 콘텐츠에 출현하는 키워드들과 키워드들의 정규화된 중요도를 계산하여 생성된 키워드 벡터를 포함하는 메타데이터를 생성하는 것을 특징으로 하는 단계를 포함하는 개인 맞춤형 문맥광고 생성 방법Generating metadata including keyword keywords generated by calculating keywords appearing in the content and normalized importance of the keywords. 제 1항에 있어서, 상기의 제 1 단계 수행 후,The method of claim 1, wherein after performing the first step: 사용자가 선택한 콘텐츠들에서 출현한 키워드들의 출현문서빈도 및 연속출현빈도를 계산하고, 각각 최대값을 이용한 정규화를 통해 1과 0 사이의 값을 가지는 가중치 값을 계산하는 것을 특징으로 하는 단계를 포함하는 개인 맞춤형 문맥광고 생성 방법 Comprising a step of calculating the appearance document frequency and continuous appearance frequency of the keywords appearing in the user-selected content, and calculates the weight value having a value between 1 and 0 through normalization using the maximum value, respectively; How to create a personalized contextual ad 제 1항에 있어서, 상기의 제 2 단계 수행 후,The method of claim 1, wherein after performing the second step, 사용자가 선택한 콘텐츠들에서 출현한 키워드들의 출현문서빈도 가중치 및 연속출현빈도 가중치와 기존 키워드 관심도를 결합하여 새로운 키워드 관심도를 계산하여 사용자 모델을 갱신하는 것을 특징으로 하는 단계를 포함하는 개인 맞춤형 문맥광고 생성 방법Creating a personalized contextual advertisement comprising the step of updating the user model by calculating a new keyword interest by combining the appearance document frequency weight, the continuous appearance frequency weight of the keywords appearing in the contents selected by the user, and the existing keyword interest. Way 제 1항에 있어서, 상기의 제 3 단계 수행 후,The method of claim 1, wherein after performing the third step, 키워드의 정규화된 중요도와 키워드에 대한 사용자의 관심도에 가중치를 적 용하여 결합함으로써 광고 키워드 적합도를 계산하는 것을 특징으로 하는 단계를 포함하는 개인 맞춤형 문맥광고 생성 방법 A method for generating a personalized contextual advertisement comprising the step of calculating the suitability of an advertisement keyword by combining the normalized importance of the keyword and the user's interest in the keyword.
KR1020090100450A 2009-10-21 2009-10-21 Method for generating personalized contextual advertisement KR101172574B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090100450A KR101172574B1 (en) 2009-10-21 2009-10-21 Method for generating personalized contextual advertisement

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090100450A KR101172574B1 (en) 2009-10-21 2009-10-21 Method for generating personalized contextual advertisement

Publications (2)

Publication Number Publication Date
KR20110043365A true KR20110043365A (en) 2011-04-27
KR101172574B1 KR101172574B1 (en) 2012-08-09

Family

ID=44048650

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090100450A KR101172574B1 (en) 2009-10-21 2009-10-21 Method for generating personalized contextual advertisement

Country Status (1)

Country Link
KR (1) KR101172574B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101288181B1 (en) * 2011-06-09 2013-07-19 주식회사 와이더플래닛 System and method for providing interactive advertising for target consumer
KR20160036437A (en) * 2014-09-25 2016-04-04 비씨카드(주) Method for recommending card goods and card company server

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101288181B1 (en) * 2011-06-09 2013-07-19 주식회사 와이더플래닛 System and method for providing interactive advertising for target consumer
KR20160036437A (en) * 2014-09-25 2016-04-04 비씨카드(주) Method for recommending card goods and card company server

Also Published As

Publication number Publication date
KR101172574B1 (en) 2012-08-09

Similar Documents

Publication Publication Date Title
US8650265B2 (en) Methods of dynamically creating personalized Internet advertisements based on advertiser input
Pieters et al. Attention capture and transfer in advertising: Brand, pictorial, and text-size effects
AU2004262302B2 (en) Methods and systems for understanding a meaning of a knowledge item using information associated with the knowledge item
TWI541744B (en) Ebook advertising, including cost-sharing techniques
US8521818B2 (en) Methods and apparatus for recognizing and acting upon user intentions expressed in on-line conversations and similar environments
US20050144073A1 (en) Method and system for serving advertisements
US8306962B1 (en) Generating targeted paid search campaigns
US9430782B2 (en) Bidding on search results for targeting users in an online system
US20130066716A1 (en) Sentiment-targeting for online advertisement
AU2004262303B2 (en) Methods and systems for determining a meaning of a document to match the document to content
US20040225647A1 (en) Display system and method
US20080249853A1 (en) Advertising campaign template
US20140108143A1 (en) Social content distribution network
US20080215416A1 (en) Searchable interactive internet advertisements
US20090006937A1 (en) Object tracking and content monetization
EP2743874A1 (en) Targeting objects to users based on search results in an online system
US20110022465A1 (en) System and Method for Managing Online Experiences Based on User Sentiment Characteristics and Publisher Targeting Goals
US20110173102A1 (en) Content sensitive point-of-sale system for interactive media
WO2008033780A2 (en) Recommending advertising key phrases
Le et al. Consumer attitude towards website advertising formats: a comparative study of banner, pop-up and in-line display advertisements
US20090024470A1 (en) Vertical clustering and anti-clustering of categories in ad link units
US20130006760A1 (en) Systems and methods for presenting comparative advertising
US20140025496A1 (en) Social content distribution network
Shatnawi et al. Statistical techniques for online personalized advertising: A survey
JP4859893B2 (en) Advertisement distribution apparatus, advertisement distribution method, and advertisement distribution control program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
S901 Examination by remand of revocation
GRNO Decision to grant (after opposition)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20150528

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20160722

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20170802

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20180711

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190802

Year of fee payment: 8