KR101110022B1 - System and method for advertising based on context - Google Patents

System and method for advertising based on context Download PDF

Info

Publication number
KR101110022B1
KR101110022B1 KR1020090076742A KR20090076742A KR101110022B1 KR 101110022 B1 KR101110022 B1 KR 101110022B1 KR 1020090076742 A KR1020090076742 A KR 1020090076742A KR 20090076742 A KR20090076742 A KR 20090076742A KR 101110022 B1 KR101110022 B1 KR 101110022B1
Authority
KR
South Korea
Prior art keywords
interest
behavior
relationship information
usage relationship
category
Prior art date
Application number
KR1020090076742A
Other languages
Korean (ko)
Other versions
KR20110019146A (en
Inventor
맹성현
오흥선
김경민
류지희
최윤정
박호건
정유철
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR1020090076742A priority Critical patent/KR101110022B1/en
Publication of KR20110019146A publication Critical patent/KR20110019146A/en
Application granted granted Critical
Publication of KR101110022B1 publication Critical patent/KR101110022B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0255Targeted advertisements based on user history
    • G06Q30/0256User search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Abstract

본 발명은 문맥 기반 광고 시스템 및 방법에 관한 것으로서, 본 발명의 문맥기반 광고 시스템은 웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 상기 관심도에 따른 관심 객체를 탐지하는 관심 객체 탐지 모듈, 상기 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행하는 의미적 추상화 모듈, 상기 관심 객체에 대한 대중적 행동을 탐지하는 대중적 행동 탐지 모듈, 상기 의미적 추상화 모듈에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출하는 사용관계 정보 추출 모듈 및 상기 관심 객체에 대한 대중적 행동과 상기 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천하는 광고 검색 모듈을 포함한다.The present invention relates to a context-based advertising system and method, wherein the context-based advertising system of the present invention analyzes a web document to measure an interest indicating a degree of interest of a user, and detects an object of interest according to the interest. A semantic abstraction module for performing a semantic abstraction process for determining the semantic level of the object of interest; a popular behavior detection module for detecting popular behavior for the object of interest; A usage information extraction module for extracting usage relationship information using object-action pairs and a predefined usage relationship pattern, and mapping the public relations and the usage relationship information of the object of interest; , An ad search module that uses the results to search for ads and recommends them. .

광고, 인터넷, 웹, 욕구, 문맥, 관심 객체, 행동 베이스, 사용 관계. Advertising, Internet, Web, Needs, Context, Objects of Interest, Behavioral Bases, Usage Relationships.

Description

문맥 기반 광고 시스템 및 방법 {System and method for advertising based on context}Context-based advertising system and method {System and method for advertising based on context}

본 발명은 문맥 기반 광고 시스템 및 방법에 관한 것으로서, 더욱 상세하게는 사람의 상식 및 욕구를 반영하여 광고를 추천하는 문맥 기반 광고 시스템 및 방법에 관한 것이다. The present invention relates to a context-based advertising system and method, and more particularly, to a context-based advertising system and method for recommending advertisements reflecting common sense and desires of a person.

인터넷 사용자의 수와 이용 시간이 증가하면서 웹 광고 (web advertising)는 상품 또는 서비스 구매자(customer)와 시장(market)를 이어주는 매개체로써 그 역할이 시간이 지날수록 중요해지고 있다. e-마케터(eMarketer)에 따르면 2008년 한해 전체 인터넷 광고비용이 250억 달러에 이를 것이라고 추정하였다. As the number of Internet users and the usage time increase, web advertising becomes a medium that connects product or service buyers to the market and its role becomes more important over time. According to eMarketer, the total Internet advertising costs in 2008 will reach $ 25 billion.

이처럼, 웹 광고의 역할이 중요해지면서 많은 학교, 기업, 연구소에서 이를 하나의 연구 분야로 인정하여, 인터넷 사용자에게 양질의 광고를 제공하고 광고주(advertiser)에게는 이익을 극대화할 수 있는 광고 방법 및 모델 연구에 매진하고 있는 상황이다. As the role of web advertising becomes more important, many schools, companies, and research institutes recognize it as a research field, and research on advertising methods and models that can provide high-quality advertising to Internet users and maximize profits for advertisers. The situation is sold out.

웹 광고는 그 형태에 따라서 키워드 광고(sponsored search)와 문맥 광고(contextual advertising)으로 나누어 진다. 현재의 문맥 광고는 주어진 문서와 광고풀(ads pool)에 있는 광고 사이의 주제 유사도(topical relevance)를 계산하여 그 순위에 따라서 광고를 추천해준다. 이는 낮은 수준의 문맥 광고라고 할 수 있는데, 예를 들어 챔피언스리그 결승전에 관련된 뉴스가 있다고 하면, 종래 주제 유사도를 이용한 문맥 광고에서는 축구 용품이나 스포츠 용품과 관련된 광고를 추천하기 마련이다. Web advertising is divided into keyword advertising and contextual advertising according to its form. Current contextual advertising calculates topical relevance between a given document and ads in the ads pool and recommends ads according to their rank. This is a low-level contextual advertising, for example, if there is news related to the Champions League finals, conventional contextual advertising using thematic similarity is to recommend ads related to soccer or sporting goods.

이와 같은 종래 문맥 광고에 대비하여, 고차원적인 문맥 광고라 함은 사람의 입장에서 필요한 광고를 추천하는 방식이라 할 수 있다. 예를 들어, 사람들이 뉴스에서 관심있는 분야가 축구 클럽이라고 하면, 사람들은 관심 대상에 다양한 욕구(desire)를 가질 수 있고 이는 티켓 구매, 교통 정보 검색, 근처 호텔 예약 등과 같은 다양한 행동(action)을 통하여 충족될 수 있다. 더 나아가, 만약 “어떤 객체의 관심 대상이 특정 행동을 하게 하는데 사용된다”는 상식을 이해할 수 있다면, 인간의 입장을 이해한 관련도 높은 고차원적인 광고를 추천할 수 있다. 위의 예에서 사람들이 "축구 경기(객체)를 본다(행동)"라는 객체-행동 쌍이 있고, 텔레비젼을 통해서 객체-행동 쌍이 이루어진다고 했을 경우 텔레비젼은 높은 관련도를 갖게 된다. In contrast to the conventional contextual advertising, high-level contextual advertising may be referred to as a method of recommending advertisements necessary from a human standpoint. For example, if a field of interest in the news is a football club, people may have a variety of desires for their interests, which can lead to various actions such as buying tickets, searching for traffic information, and booking nearby hotels. Can be met through. Furthermore, if one can understand the common sense that "the object of interest is used to make a particular action," we can recommend relevant, high-level advertisements that understand human positions. In the example above, if people have an object-behavior pair called "watch a football (object)" and an object-behavior pair is made via television, then television is highly relevant.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 사용자의 입장을 고려한 고차원의 문맥 기반 광고 시스템 및 방법을 제공하는데 그 목적이 있다.The present invention has been made to solve the above problems, and an object thereof is to provide a high-level context-based advertising system and method considering the user's position.

이와 같은 목적을 달성하기 위한 본 발명은 웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 상기 관심도에 따른 관심 객체를 탐지하는 관심 객체 탐지 모듈, 상기 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행하는 의미적 추상화 모듈, 상기 관심 객체에 대한 대중적 행동을 탐지하는 대중적 행동 탐지 모듈, 상기 의미적 추상화 모듈에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출하는 사용관계 정보 추출 모듈 및 상기 관심 객체에 대한 대중적 행동과 상기 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천하는 광고 검색 모듈을 포함한다. In order to achieve the above object, the present invention analyzes a web document to measure an interest indicating a degree of interest of a user, and detects an object of interest according to the interest, and determines a semantic level of the object of interest. A semantic abstraction module that performs a semantic abstraction process, a public behavior detection module that detects popular behavior for the object of interest, and object-action pairs abstracted from the semantic abstraction module; A usage relationship information extraction module for extracting usage relationship information using a predefined usage relationship pattern, mapping public behavior and the usage relationship information on the object of interest, and searching for an advertisement using the results; And an advertisement search module for recommending the searched advertisement.

상기 관심 객체 탐지 모듈은 상기 웹 문서에서 불필요한 요소들을 제거하는 스테밍(stemming)을 수행하는 전처리부, 상기 전처리부에서 스테밍이 수행된 문서로부터 핵심구(keyphrase)를 추출하는 핵심구 추출부, 상기 핵심구 추출부에서 추출된 핵심구를 언스테밍(unstemming)하는 후처리부, 상기 후처리부에서 언스테밍된 핵심구 중에서 관심 객체 후보군을 추출하는 관심 객체 후보군 추출부, 상기 관심 객체 후보군 추출부의 관심 객체에 대하여 순위를 결정하는 순위결정부를 포함할 수 있다. The object-of-interest detection module may include a preprocessing unit that performs stemming to remove unnecessary elements from the web document, a key phrase extracting unit that extracts a keyphrase from a document on which the preprocessing unit is stemming; A post-processing unit for unstemming the key phrase extracted by the key phrase extracting unit, an object-of-interest candidate group extracting unit for extracting a target object candidate group from the key phrases un stemmed by the post-processing unit, the interested object candidate group extracting unit It may include a ranking unit for determining a ranking for the object of interest.

상기 의미적 추상화 모듈은 ODP(Open Directory Project) 텍소노미(Taxonomy)를 이용할 수 있다. 이때, 의미적 추상화 모듈은 상기 관심 객체를 검색 쿼리로 이용하여 ODP 카테고리를 검색하여 후보 카테고리를 선정하고, 상기 후보 카테고리를 일정한 수준을 갖도록 일반화하는 일반화 과정을 수행하고, 일반화된 후보 카테고리를 상기 관심 객체의 관련도에 기반하여 순위를 결정할 수 있다. The semantic abstraction module may use an Open Directory Project (TDPonomy). In this case, the semantic abstraction module searches for an ODP category using the object of interest as a search query, selects a candidate category, performs a generalization process to generalize the candidate category to have a predetermined level, and generalizes the generalized candidate category. The ranking can be determined based on the relevance of the object.

상기 대중적 행동 탐지 모듈은, 상기 관심 객체에 관련된 행동을 탐지하는 행동 탐지부 및 상기 행동 탐지부에서 탐지된 행동들의 집합에 대하여 확률에 따라 필터링 동작을 수행할 수 있다. The popular behavior detection module may perform a filtering operation according to a probability with respect to a behavior detector for detecting a behavior related to the object of interest and a set of behaviors detected by the behavior detector.

상기 행동 탐지부는 사용자의 욕구를 나타내는 질문 구문들이 저장된 구문 프레임(syntactic frame) 데이터베이스(Database, 이하 'DB'라 함)를 이용하여, 상기 관심 객체에 관련된 구문이 상기 구문 프레임 DB에 존재하는지 확인하는 방식으로 상기 관심 객체에 관련된 행동을 탐지할 수 있다. The behavior detector detects whether a phrase related to the object of interest exists in the syntax frame DB by using a syntax frame database (hereinafter referred to as 'DB') in which question phrases indicating a user's desire are stored. Can be detected in a manner related to the object of interest.

상기 광고 검색 모듈은, 상기 관심 객체를 관련된 카테고리 정보에 매핑하고, 상기 관심 객체와 관련된 대중적 행동 정보를 가져오는 객체 행동 바인딩부, 상기 객체 행동 바인딩부에서 매칭된 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭하는 매칭부 및 상기 관심 객체, 상기 관련된 카테고리 정보, 상기 관심 객체의 대중적 행동 정보, 및 상기 카테고리-행동 쌍에 관련된 사용관계 정보를 이용하 여 광고 추천에 사용되는 검색 질의문을 생성하는 검색 질의 생성부를 포함할 수 있다. The advertisement retrieval module may include: an object behavior binding unit for mapping the object of interest to related category information and obtaining public behavior information related to the object of interest; usage relationship information related to a category-action pair matched by the object behavior binding unit; A search query that generates a search query used for an advertisement recommendation using a matching unit matching the and the interest object, the related category information, the public behavior information of the object of interest, and usage relationship information related to the category-action pair. It may include a generation unit.

상기 대중적 행동 탐지 모듈에서 탐지된 대중적 행동 요소들을 저장하기 위한 행동 베이스 DB를 더 포함하고, 상기 객체 행동 바인딩부는 상기 행동 베이스 DB로부터 상기 관심 객체와 관련된 대중적 행동 정보를 가져올 수 있다. And a behavior base DB for storing the public behavior elements detected by the popular behavior detection module, wherein the object behavior binding unit may obtain public behavior information related to the object of interest from the behavior base DB.

상기 사용관계 정보 추출모듈에서 추출된 사용관계 정보가 저장된 사용 상식 DB를 더 포함하고, 상기 매칭부는 상기 사용 상식 DB를 이용하여 상기 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭할 수 있다. The method may further include a usage common sense DB in which the usage relation information extracted by the usage relation information extraction module is stored, and the matching unit may match the usage relation information related to the category-behavior pair using the usage common sense DB.

본 발명의 일 실시예에 따른 문맥 기반 광고 방법은 관심 객체 탐지 모듈에서 웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 상기 관심도에 따른 관심 객체를 탐지하는 단계, 의미적 추상화 모듈에서 상기 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행하는 단계, 대중적 행동 탐지 모듈에서 상기 관심 객체에 대한 대중적 행동을 탐지하는 단계, 사용관계 정보 추출 모듈에서 상기 의미적 추상화 과정에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출하는 단계 및 광고 검색 모듈에서 상기 관심 객체에 대한 대중적 행동과 상기 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천하는 단계를 포함한다. In the context-based advertising method according to an embodiment of the present invention, the interest object detection module analyzes a web document to measure an interest indicating a degree of interest of the user, and detects the object of interest according to the interest, in the semantic abstraction module. Performing a semantic abstraction process for determining a semantic level of the object of interest; detecting a public behavior for the object of interest in a popular behavior detection module; and using the semantic abstraction in a usage information extraction module Extracting usage relationship information by using abstracted object-action pairs and a predefined usage relationship pattern, and mapping the public behavior and the usage information of the object of interest in the advertisement search module; mapping, searching for ads using the results, and recommending the searched ads. It is.

상기 의미적 추상화 과정을 수행하는 단계는, 상기 관심 객체를 검색쿼리로 이용하여 ODP 카테고리를 검색하여 후보 ODP 카테고리를 선정하는 단계, 상기 후보 카테고리를 일정한 수준을 갖도록 일반화하는 단계 및 일반화된 후보 카테고리에 대해 상기 관심 객체의 관련도에 기반하여 순위를 결정하는 단계를 포함하여 이루어질 수 있다. The performing of the semantic abstraction process may include selecting a candidate ODP category by searching for an ODP category using the object of interest as a search query, generalizing the candidate category to have a predetermined level, and generalizing the candidate category. And determining the ranking based on the relevance of the object of interest.

상기 사용관계 정보를 추출하는 단계는, 상기 의미적 추상화 과정에서 추상화된 객체-행동 쌍과 미리 정의된 사용관계 패턴을 이용하여 검색 질의를 생성하는 단계, 상기 검색 질의를 검색 엔진에 입력하여 관련 문서를 수집하는 단계, 상기 사용관계 패턴을 이용하여 수집된 관련 문서로부터 사용관계 정보를 추출하는 단계 및 추출된 사용관계 정보를 필터링하는 단계를 포함할 수 있다. The extracting of the usage relationship information may include generating a search query using an object-behavior pair abstracted in the semantic abstraction process and a predefined usage relationship pattern, inputting the search query to a search engine, and related documents. Collecting the usage relationship information from the related document collected by using the usage relationship pattern; and filtering the extracted usage relationship information.

상기 사용관계 정보를 추출하는 단계는 자연어 처리 과정 및 패턴을 이용하여 상기 사용관계 정보를 추출할 수 있다. 이때, 상기 추출된 사용관계 정보를 필터링하는 단계는 상업성(commerciality)과 연관성(association)에 기반하여 필터링할 수 있다. 보다 상세하게는 상기 추출된 사용관계 정보의 상업성 수치와 연관성 수치를 측정하고, 측정된 상업성 수치와 연관성 수치가 임계값보다 작으면 필터링할 수 있다. The extracting of the usage relationship information may extract the usage relationship information using a natural language processing process and a pattern. In this case, the filtering of the extracted usage relationship information may be filtered based on commerciality and association. In more detail, the commercial value and the correlation value of the extracted usage relationship information may be measured and filtered when the measured commercial value and the correlation value are smaller than a threshold value.

본 발명에 의하면 웹 사이트의 문맥 기반 광고 시스템에 있어서 인간의 입장과 욕구를 반영한 새로운 광고 추천 방법을 제안함으로써, 광고효과를 증대시킬 수 있는 장점이 있다. According to the present invention, by suggesting a new advertisement recommendation method reflecting a human position and desire in a context-based advertisement system of a web site, there is an advantage that the advertisement effect can be increased.

이하, 첨부된 도면을 참조해서 본 발명의 실시예를 상세히 설명하면 다음과 같다. 우선 각 도면의 구성 요소들에 참조 부호를 부가함에 있어서, 동일한 구성 요소들에 한해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. In the drawings, the same reference numerals are used for the same reference numerals even though they are shown in different drawings. In the following description of the present invention, a detailed description of known functions and configurations incorporated herein will be omitted when it may make the subject matter of the present invention rather unclear.

도 1은 본 발명의 일 실시예에 따른 문맥 기반 광고 시스템의 블록도이다. 문맥 기반 광고 시스템은 관심 객체 탐지 모듈(100), 의미적 추상화 모듈(200), 대중적 행동 탐지 모듈(300), 사용관계 정보 추출 모듈(400), 광고 검색 모듈(500)을 포함한다. 1 is a block diagram of a context-based advertising system according to an embodiment of the present invention. The context-based advertising system includes the object-of-interest detection module 100, the semantic abstraction module 200, the popular behavior detection module 300, the usage relationship information extraction module 400, and the advertisement search module 500.

관심 객체 탐지 모듈(100)은 웹 페이지를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 관심도가 높은 관심 객체(interesting object)를 탐지한다. 참고로, 관심도의 사전적인 의미는 일상적이지 않거나, 흥분되거나, 또는 재미있음을 나타낸다. 정보이론에서의 관심도란 관찰값이 얼마나 예측에서 벗어나는지를 의미한다. 본 발명에서는 관심 객체 탐지 모듈(100)을 이용하여 사이트에서 제공하는 컨텐츠 중에서 어떤 객체가 관심을 유발했는지를 탐지하고자 한다. 관심 객체 탐지 모듈(100)에 대한 상세한 설명은 후술하기로 한다.The object-of-interest detection module 100 analyzes a web page to measure an interest indicating a degree of interest of a user and detects an interested object having a high interest. For reference, the dictionary meaning of interest indicates that it is not routine, excited, or interesting. Interest in information theory means how far the observations deviate from predictions. In the present invention, the object of interest detection module 100 is used to detect which object caused an interest among contents provided by a site. Detailed description of the object-of-interest detection module 100 will be described later.

의미적 추상화 모듈(200)은 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행한다. 본 발명의 일 실시예에서 의미적 추상화 모듈(200)은 ODP(Open Directory Project) 텍소노미(Taxonomy)를 이용할 수 있다. ODP 구조를 이용하여 의미적 추상화 과정을 수행하는 과정에 대한 상세한 설명은 후술하기로 한다. The semantic abstraction module 200 performs a semantic abstraction process that determines the semantic level of the object of interest. In an embodiment of the present invention, the semantic abstraction module 200 may use an Open Directory Project (TDPonomy) taxonomy. A detailed description of the process of performing the semantic abstraction process using the ODP structure will be described later.

대중적 행동 탐지 모듈(300)은 관심 객체에 대한 대중적 행동을 탐지한다. The popular behavior detection module 300 detects popular behavior for the object of interest.

사용관계 정보 추출 모듈(400)은 의미적 추상화 모듈(200)에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출한다. The usage relationship information extraction module 400 extracts usage relationship information using object-action pairs abstracted by the semantic abstraction module 200 and a predefined usage relationship pattern.

광고 검색 모듈(500)은 관심 객체에 대한 대중적 행동과 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천한다. The advertisement search module 500 maps public behavior and usage relationship information about the object of interest, searches for an advertisement using the result, and recommends the searched advertisement.

도 2는 본 발명의 일 실시예에 따른 관심 객체 탐지 모듈의 구조를 보여주는 블록도이다. 관심 객체 탐지 모듈(100)은 전처리부(110), 핵심구 추출부(120), 후처리부(130), 관심객체 후보 추출부(140), 순위결정부(150)를 포함한다. 2 is a block diagram illustrating a structure of an object-of-interest detection module according to an embodiment of the present invention. The object-of-interest detection module 100 includes a preprocessor 110, a key phrase extractor 120, a post processor 130, an object of interest candidate extractor 140, and a ranker 150.

전처리부(110)는 웹 문서에서 불필요한 요소들을 제거하는 스테밍(stemming) 동작을 수행한다. 핵심구 추출부(120)는 전처리부(110)에서 스테밍이 수행된 문서로부터 핵심구(keyphrase)를 추출한다. 후처리부(130)는 핵심구 추출부(120)에서 추출된 핵심구를 언스테밍(unstemming)하는 역할을 한다. The preprocessor 110 performs a stemming operation of removing unnecessary elements from the web document. The key phrase extractor 120 extracts key phrases from the document on which the stemming is performed in the preprocessor 110. The post-processing unit 130 serves to unstemming the core sphere extracted from the core sphere extraction unit 120.

관심 객체 후보 추출부(140)는 후처리부(130)에서 언스테밍된 핵심구 중에서 관심 객체 후보를 추출하는 역할을 한다. 순위결정부(150)는 관심 객체 후보에 대하여 순위를 결정하는 역할을 한다. The object-of-interest candidate extractor 140 extracts the object-of-interest candidate from among the key phrases unstamed by the post processor 130. The ranking unit 150 determines the ranking of the object candidate of interest.

본 발명에서 관심 객체 후보에 대하여 순위를 결정하는 방법은 서프라이징네 스(surprisingness)와 버스티네스(burstiness)를 이용하여 구현할 수 있으며, 버스티네스는 [최근 1달 중 가장 검색어 빈도가 높은 구의 빈도]/[1년간의 평균 검색 검색어 빈도]로 정의된다. In the present invention, the method for determining the rank of the object of interest candidate may be implemented using surprisingness and burstiness. Frequency] / [average year search query frequency].

관심 객체 후보의 관심도 수치는 다음과 같은 [수학식 1]에 의해 결정된다. The numerical value of interest of the interested object candidate is determined by Equation 1 below.

[수학식 1][Equation 1]

Figure 112009050693275-pat00001
Figure 112009050693275-pat00001

이때, P(t)=문서(d)에서 구(t)의 핵심구 점수,Where P (t) = key phrase score of phrase (t) in document (d),

V(t)=최근 1년동안 구(t)의 평균 웹 검색량(web-search volume),V (t) = average web-search volume in the past t,

B(t)=최근 한 달 동안 구(t)의 최대 웹 검색량/최근 1년 동안 구(t)의 평균 웹 검색량,B (t) = Maximum web search volume in old (t) over last month / average web search volume in old (t) over last year,

P(t), V(t), 및 B(t)는 각각 문서 및 대수함수에서 최대값이 정규화된 값을 갖는다. P (t), V (t), and B (t) have normalized maximum values in document and logarithmic functions, respectively.

도 3은 본 발명의 일 실시예에 따른 광고 검색 모듈의 구조를 보여주는 블록도이다. 광고 검색 모듈(500)은 객체 행동 바인딩부(510), 매칭부(520), 검색 질의 생성부(530)를 포함한다. 3 is a block diagram illustrating a structure of an advertisement search module according to an embodiment of the present invention. The advertisement search module 500 includes an object behavior binding unit 510, a matching unit 520, and a search query generator 530.

객체 행동 바인딩부(510)는 관심 객체를 관련된 카테고리 정보에 매핑하고, 관심 객체와 관련된 대중적 행동 정보를 가져오는 역할을 한다. The object behavior binding unit 510 maps the object of interest to related category information and serves to bring public behavior information related to the object of interest.

매칭부(520)는 객체 행동 바인딩부(510)에서 매칭된 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭하는 역할을 한다. The matching unit 520 serves to match usage relationship information related to the category-action pair matched by the object action binding unit 510.

검색 질의 생성부(530)는 관심 객체, 관련된 카테고리 정보, 관심 객체의 대중적 행동 정보, 및 카테고리-행동 쌍에 관련된 사용관계 정보를 이용하여 광고 추천에 사용되는 검색 질의문을 생성한다. The search query generator 530 generates a search query used for the advertisement recommendation using the object of interest, related category information, popular behavior information of the object of interest, and usage relation information related to the category-action pair.

본 발명에서 의미적 추상화 모듈(200)은 관심 객체를 검색 쿼리로 이용하여 ODP 카테고리를 검색하여 후보 카테고리를 선정하고, 후보 카테고리를 일정한 수준을 갖도록 일반화하는 일반화 과정을 수행하고, 일반화된 후보 카테고리를 관심 객체의 관련도에 기반하여 순위를 결정한다. 이에 대하여 도면을 참조하여 상세히 설명하면 다음과 같다. In the present invention, the semantic abstraction module 200 searches for an ODP category by using an object of interest as a search query, selects a candidate category, performs a generalization process to generalize the candidate category to have a certain level, and selects a generalized candidate category. The ranking is based on the relevance of the object of interest. This will be described in detail with reference to the accompanying drawings.

도 4는 본 발명의 일 실시예에 따른 ODP 구조를 도시한 도면이다. 4 is a diagram illustrating an ODP structure according to an embodiment of the present invention.

도 4를 참조하면, ODP 구조의 각 노드는 하나의 카테고리를 나타내며 다수의 스니펫(snippet)을 갖는다. 각 스니펫은 타이틀(title), 주소(url), 내용(description)으로 구성되어 있다. Referring to FIG. 4, each node of the ODP structure represents one category and has a plurality of snippets. Each snippet consists of a title, a url, and a description.

본 발명에서는 관심 객체를 검색 쿼리로 이용하여 코사인 유사도(cosine similarity)에 기반하여 후보 카테고리를 검색한다. 코사인 유사도에 기반하여 후보 카테고리를 검색한 예가 도 5에 도시되어 있다. In the present invention, a candidate category is searched based on cosine similarity using the object of interest as a search query. An example of searching for candidate categories based on cosine similarity is shown in FIG. 5.

도 5는 본 발명의 일 실시예에 따른 ODP 구조에서 후보 카테고리를 선정한 도면이다. 도 5를 참조하면, 쿼리는 1이고, 4개의 후보 카테고리(k)를 선정한 실시 예이고, 23노드, 35노드, 41노드, 42노드가 후보 카테고리로 선정된 것이 도시되어 있다. 5 is a diagram illustrating candidate categories in an ODP structure according to an embodiment of the present invention. Referring to FIG. 5, the query is 1, an embodiment in which four candidate categories k are selected, and 23 nodes, 35 nodes, 41 nodes, and 42 nodes are selected as candidate categories.

이러한 후보 카테고리들이 너무 자세한 의미를 갖는 것을 방지하기 위하여 카테고리 일반화 과정을 수행한다. 카테고리 일반화 과정은 다음과 같다. In order to prevent these candidate categories from having too much meaning, a category generalization process is performed. The category generalization process is as follows.

먼저, 일반화할 최대 깊이(M)를 선정한다. 그리고, 각 후보 카테고리 중에서 M 레벨 아래에 있는 카테고리를 M레벨이 있는 카테고리로 연결한다. 마지막으로 후보 카테고리의 스니펫들을 일반화된 카테고리의 학습데이터로 병합한다. First, the maximum depth M to be generalized is selected. Then, the categories below the M level among the candidate categories are connected to the category having the M level. Finally, merge the snippets of the candidate category into the training data of the generalized category.

도 6은 본 발명의 일 실시예에 따른 ODP 구조에서 카테고리 일반화를 설명하기 위한 도면이다. 도 6을 참조하면, M레벨이 2이고, 41노드를 22노드에 병합하고, 35노드 및 42노드를 25노드에 병합한 실시예이다. 6 is a diagram for describing category generalization in an ODP structure according to an embodiment of the present invention. Referring to FIG. 6, the M level is 2, 41 nodes are merged into 22 nodes, and 35 and 42 nodes are merged into 25 nodes.

이렇게 일반화된 카테고리를 주어진 관심객체의 관련도에 기반해 순위를 결정한다. 순위 결정은 지역 모델(local model)과 전역 모델(global model)을 조합하여 수행된다. 본 발명의 일 실시예에서 지역 모델과 전역 모델은 모델은 한 음절 언어 모델(unigram language model)을 이용하여 생성될 수 있다. This generalized category is ranked based on the relevance of the given object of interest. Ranking is performed by combining a local model and a global model. In an embodiment of the present invention, the local model and the global model may be generated using a unigram language model.

도 7은 본 발명의 일 실시예에 따른 지역 모델 생성 과정을 설명하기 위한 도면이다. 도 7을 참조하면, M=2이고, 지역 모델은 일반화된 카테고리가 갖고 있는 스니펫들로부터 생성된다. 이때, 일반화된 카테고리가 갖고 있는 데이터의 양이 매우 작기 때문에 데이터 희소성 문제가 발생할 수 있다. 이를 극복하기 위하여 도 8에서 보는 바와 같이, 제1레벨에 속해 있는 카테고리인 11, 12, 13 카테고리들에 대한 전역 모델을 생성한다. 7 is a view for explaining a process of generating a regional model according to an embodiment of the present invention. Referring to FIG. 7, M = 2, and a local model is generated from snippets of the generalized category. In this case, since the amount of data included in the generalized category is very small, data scarcity may occur. To overcome this, as shown in FIG. 8, a global model is generated for 11, 12, and 13 categories, which are categories belonging to the first level.

이와 같은 지역모델과 전역모델을 이용한 순위 결정 모델은 다음 [수학식2]와 같이 나타낼 수 있다. The ranking model using the regional model and the global model can be expressed as Equation 2 below.

[수학식2]&Quot; (2) "

Figure 112009050693275-pat00002
Figure 112009050693275-pat00002

도 9는 본 발명의 일 실시예에 따른 대중적 행동 탐지 모듈의 구조를 보여주는 블록도이다. 대중적 행동 탐지 모듈(300)은 행동 탐지부(310), 행동 필터링부(320)를 포함한다. 9 is a block diagram illustrating a structure of a popular behavior detection module according to an embodiment of the present invention. The popular behavior detection module 300 includes a behavior detector 310 and a behavior filter 320.

행동 탐지부(310)는 관심 객체에 관련된 행동을 탐지하는 역할을 한다. The behavior detector 310 detects a behavior related to the object of interest.

행동 필터링부(320)는 행동 탐지부(310)에서 탐지된 행동들의 집합에 대하여 확률이 높은 행동들만 남기고 나머지 행동들을 제외시키는 필터링 동작을 수행한다.The behavior filtering unit 320 performs a filtering operation to exclude only the remaining behaviors with high probability for the set of behaviors detected by the behavior detection unit 310.

본 발명에서 행동 탐지부(300)는 사용자의 욕구를 나타내는 질문 구문들이 저장된 구문 프레임(syntactic frame) DB(700)를 이용하여, 관심 객체에 관련된 구문이 구문 프레임 DB(700)에 존재하는지 확인하는 방식으로 관심 객체에 관련된 행 동을 탐지한다. In the present invention, the behavior detector 300 checks whether a phrase related to the object of interest exists in the syntax frame DB 700 by using a syntax frame DB 700 in which question phrases indicating a user's desire are stored. Detect behaviors related to the object of interest.

도 10은 본 발명의 일 실시예에 따른 대중적 행동 정보의 추출 과정을 보여주는 블록도이다. 10 is a block diagram illustrating a process of extracting popular behavior information according to an embodiment of the present invention.

도 10을 참조하면, 본 발명의 문맥 기반 광고 시스템은 대중적 행동 탐지 모듈(300)에서 탐지된 대중적 행동 요소들을 저장하기 위한 행동 베이스 DB(600)를 더 포함한다. Referring to FIG. 10, the context-based advertising system of the present invention further includes a behavior base DB 600 for storing the public behavior elements detected in the public behavior detection module 300.

대중적 행동 탐지 모듈(300)은 객체1, 객체2와 관련된 사람의 욕구를 나타내는 질문 구들이 존재하는지 확인하고, 질문 구에 사용된 행동들을 탐지한다. 예를 들어, 객체1과 관련된 행동1, 행동2, 행동3 및 객체2와 관련된 행동1, 행동2, 행동3을 행동 베이스 DB(600)에 저장한다. The popular behavior detection module 300 checks whether there are questions representing the needs of the person related to the objects 1 and 2, and detects the behaviors used in the questions. For example, actions 1, 2, and 3 associated with object 1 are stored in action base DB 600.

도 11은 본 발명의 일 실시예에 따른 행동-객체 쌍을 보여주는 도면이다. 도 11에서 행동-객체 쌍은 행동 베이스 DB(600)에 저장되어 있다.11 illustrates a behavior-object pair according to an embodiment of the present invention. In FIG. 11, the behavior-object pair is stored in the behavior base DB 600.

도 11을 참조하면, 행동-객체 쌍은 travel-Sweden, watch-baseball, watch-Olympics, buy-soccer, join-Olympics 등으로 저장되어 있다. Referring to FIG. 11, an action-object pair is stored as travel-Sweden, watch-baseball, watch-Olympics, buy-soccer, join-Olympics, and the like.

대중적 행동 탐지 모듈(300)은 객체와 관련된 질문 구에 사용된 행동들의 집합을 필터링하여 최종 결과물을 출력한다. 이때, 다음 [수학식 3]에 따른 확률모델로 필터링을 수행하게 된다. The popular behavior detection module 300 filters the set of behaviors used in the query related to the object and outputs the final result. In this case, filtering is performed by using a probability model according to Equation 3 below.

[수학식3]&Quot; (3) "

Figure 112009050693275-pat00003
Figure 112009050693275-pat00003

여기서, ACT는 행동, OBJ는 객체, Hits(query)는 검색엔진을 통해 반환된 쿼리를 검색한 결과이다. Here, ACT is the action, OBJ is the object, and Hits (query) is the result of searching the query returned by the search engine.

전술한 바와 같이, 본 발명에서 광고 검색 모듈(500)은 객체-행동 바인딩 과정과 사용관계 정보 매칭 과정을 포함한다. 이제, 이에 대하여 도면을 참조하여 상세히 설명하기로 한다. As described above, the advertisement search module 500 includes an object-action binding process and a usage relationship matching process. This will now be described in detail with reference to the drawings.

도 12는 본 발명의 일 실시예에 따른 객체-행동 바인딩 과정을 보여주는 도면이다. 12 is a view illustrating an object-behavior binding process according to an embodiment of the present invention.

도 12를 참조하면, 광고 검색 모듈(500)의 객체 행동 바인딩부(510)는 추출된 관심 객체를 ODP 텍사노미에 매핑하고, 관련된 카테고리 정보를 행동 베이스 DB(600)로부터 가져온다. 도 12의 예에서 추출된 관심 객체인 Manchester United를 ODP 텍사노미인 soccer에 매핑하고, 행동 베이스 DB(600)로부터 대중적인 행동정보인 watch를 가져오게 된다. Referring to FIG. 12, the object behavior binding unit 510 of the advertisement search module 500 maps the extracted object of interest to the ODP taxonomy and brings related category information from the behavior base DB 600. In the example of FIG. 12, Manchester United, which is the object of interest extracted, is mapped to soccer, which is an ODP taxanomi, and a watch, which is popular behavior information, is obtained from the behavior base DB 600.

도 13은 본 발명의 일 실시예에 따른 사용관계 정보 매칭 과정을 보여주는 도면이다. 13 is a diagram illustrating a usage relationship information matching process according to an embodiment of the present invention.

도 13을 참조하면, 문맥 기반 광고 시스템은 사용관계 정보 추출모듈(400)에서 추출된 사용관계 정보가 저장된 사용 상식 DB(620)를 더 포함한다. Referring to FIG. 13, the context-based advertisement system further includes a usage common sense DB 620 in which usage relationship information extracted by the usage relationship information extraction module 400 is stored.

본 발명에서 광고 검색 모듈(500)의 매칭부(520)는 객체 행동 바인딩부(510)에서 매칭된 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭하는 역할을 하고, 검색 질의 생성부(530)는 관심 객체, 관련된 카테고리 정보, 관심 객체의 대중적 행동 정보, 및 카테고리-행동 쌍에 관련된 사용관계 정보를 이용하여 광고 추천에 사용되는 검색 질의문을 생성한다. In the present invention, the matching unit 520 of the advertisement search module 500 serves to match usage relationship information related to the category-action pair matched by the object action binding unit 510, and the search query generator 530 may A search query used for recommending an advertisement is generated using the object of interest, related category information, public behavior information of the object of interest, and usage relationship information related to the category-action pair.

도 13의 실시예에서, 매칭부(520)는 사용 상식 DB(620)를 이용하여 카테고리-행동 쌍과 사용관계 정보를 매칭한다. 즉, 매칭부(520)는 추출된 관심 객체인 Manchester United에 객체 행동 바인딩부(510)에서 매칭된 카테고리-행동 쌍인 soccer-watch을 TV, watching soccer라는 사용관계 정보와 매칭시키게 된다. In the embodiment of FIG. 13, the matching unit 520 matches the category-action pair and the usage relationship information by using the common sense DB 620. That is, the matching unit 520 matches the soccer-watch, which is the category-action pair matched by the object action binding unit 510, with the usage information such as TV and watching soccer to Manchester United, which is the extracted object of interest.

검색 질의 생성부(530)는 매칭된 사용관계 정보를 이용하여 광고 추천에 사용되는 검색 질의를 생성한다. 본 발명의 일 실시예에서 검색 질의 생성부(530)는 다음과 같은 세가지 형태의 검색 질의를 생성할 수 있다.The search query generator 530 generates a search query used for the advertisement recommendation using the matched usage relationship information. In an embodiment of the present invention, the search query generator 530 may generate three types of search queries as follows.

첫번째 형태는 관심객체+카테고리의 형태이다. 예를 들어, Manchester United+soccer의 형태이다.The first form is the type of object of interest + category. For example, in the form of Manchester United + soccer.

두번째 형태는 관심객체+카테고리+대중적인 행동의 형태이다. 예를 들어, Manchester United+soccer+watch의 형태이다. The second form is the object of interest + category + mass action. For example, Manchester United + soccer + watch.

세번째 형태는 관심객체+카테고리+대중적인 행동+사용관계 정보의 형태이다. 예를 들어, Manchester United+soccer+watch+TV의 형태이다. The third form is the object of interest + category + popular behavior + use relationship information. For example, Manchester United + soccer + watch + TV.

이제 전술한 구성을 갖는 문맥 기반 시스템에서 문맥 기반 광고를 하는 방법에 대하여 도면을 참조하여 설명하기로 한다. A method of context-based advertising in a context-based system having the above-described configuration will now be described with reference to the drawings.

도 14는 본 발명의 일 실시예에 따른 문맥 기반 광고 방법을 보여주는 흐름도이다. 14 is a flowchart illustrating a context-based advertising method according to an embodiment of the present invention.

웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 관심도가 높은 관심 객체를 탐지한다(S100).The web document is analyzed to measure an interest indicating a degree of interest of the user, and an object of interest having high interest is detected (S100).

관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행한다(S200).A semantic abstraction process of determining the semantic level of the object of interest is performed (S200).

관심 객체에 대한 대중적 행동을 탐지한다(S300).Detect popular behavior for the object of interest (S300).

S200 단계의 의미적 추상화 과정에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출한다(S400).In the semantic abstraction process of step S200, usage relationship information is extracted using abstracted object-action pairs and a predefined usage relationship pattern (S400).

관심 객체에 대한 대중적 행동과 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색한다(S500). 그리고, 검색된 광고를 추천한다(S600). Mapping of the public behavior and usage relationship information on the object of interest and searching for an advertisement using the result (S500). Then, the searched advertisement is recommended (S600).

도 15는 본 발명의 일 실시예에 따른 의미적 추상화 단계의 상세 흐름도이다. 15 is a detailed flowchart of the semantic abstraction step according to an embodiment of the present invention.

도 15를 참조하면, S200 단계 즉, 의미적 추상화 과정을 수행하는 단계는 다음과 같은 세부 과정을 통하여 이루어진다. Referring to FIG. 15, operation S200, that is, performing a semantic abstraction process may be performed through the following detailed process.

관심 객체를 검색쿼리로 이용하여 ODP 카테고리를 검색하여 후보 ODP 카테고리를 선정한다(S210, S220).Using the object of interest as a search query, the ODP category is searched to select candidate ODP categories (S210 and S220).

후보 카테고리를 일정한 수준을 갖도록 일반화한다(S230).The candidate category is generalized to have a certain level (S230).

일반화된 후보 카테고리에 대해 관심 객체의 관련도에 기반하여 순위를 결정한다(S240). The ranking of the generalized candidate category is determined based on the relevance of the object of interest (S240).

도 16은 본 발명의 일 실시예에 따른 사용관계 정보 추출 단계의 상세 흐름도이다. 16 is a detailed flowchart of a usage relationship information extraction step according to an embodiment of the present invention.

도 16을 참조하면, S400 단계 즉, 사용관계 정보를 추출하는 단계는 다음과 같은 세부 과정을 통하여 이루어진다. Referring to FIG. 16, step S400, that is, extracting usage relationship information, is performed through the following detailed process.

의미적 추상화 과정에서 추상화된 객체-행동 쌍과 미리 정의된 사용관계 패턴을 이용하여 검색 질의를 생성한다(S410). In the semantic abstraction process, a search query is generated using an abstracted object-action pair and a predefined usage relationship pattern (S410).

검색 질의를 검색 엔진에 입력하여 관련 문서를 수집한다(S420).The search query is input to a search engine to collect related documents (S420).

사용관계 패턴을 이용하여 수집된 관련 문서로부터 사용관계 정보를 추출한다(S430). 본 발명의 일 실시예에서 S430 단계는 자연어 처리 과정 및 패턴을 이용하여 사용관계 정보를 추출할 수 있다. Usage relationship information is extracted from the related documents collected using the usage relationship pattern (S430). In an embodiment of the present invention, step S430 may extract usage relationship information using a natural language processing process and a pattern.

그리고, 추출된 사용관계 정보를 필터링한다(S440). 본 발명의 일 실시예에서 S440 단계는 상업성(commerciality)과 연관성(association)에 기반하여 필터링하는 것일 수 있다. 즉, 추출된 사용관계 정보의 상업성 수치와 연관성 수치를 측 정하고, 측정된 상업성 수치와 연관성 수치가 임계값보다 작으면 필터링하도록 구현할 수 있다. Then, the extracted usage relationship information is filtered (S440). In an embodiment of the present invention, step S440 may be filtering based on commerciality and association. That is, the commercial value and the correlation value of the extracted usage relationship information may be measured, and may be implemented to filter when the measured commercial value and the correlation value are smaller than the threshold value.

이상 본 발명을 몇 가지 바람직한 실시예를 사용하여 설명하였으나, 이들 실시예는 예시적인 것이며 한정적인 것이 아니다. 본 발명이 속하는 기술분야에서 통상의 지식을 지닌 자라면 본 발명의 사상과 첨부된 특허청구범위에 제시된 권리범위에서 벗어나지 않으면서 다양한 변화와 수정을 가할 수 있음을 이해할 것이다.While the invention has been described using some preferred embodiments, these embodiments are illustrative and not restrictive. Those skilled in the art will appreciate that various changes and modifications can be made without departing from the spirit of the invention and the scope of the rights set forth in the appended claims.

도 1은 본 발명의 일 실시예에 따른 문맥 기반 광고 시스템의 블록도이다.1 is a block diagram of a context-based advertising system according to an embodiment of the present invention.

도 2는 본 발명의 일 실시예에 따른 관심 객체 탐지 모듈의 구조를 보여주는 블록도이다. 2 is a block diagram illustrating a structure of an object-of-interest detection module according to an embodiment of the present invention.

도 3은 본 발명의 일 실시예에 따른 광고 검색 모듈의 구조를 보여주는 블록도이다. 3 is a block diagram illustrating a structure of an advertisement search module according to an embodiment of the present invention.

도 4는 본 발명의 일 실시예에 따른 ODP 구조를 도시한 도면이다. 4 is a diagram illustrating an ODP structure according to an embodiment of the present invention.

도 5는 본 발명의 일 실시예에 따른 ODP 구조에서 후보 카테고리를 선정한 도면이다.5 is a diagram illustrating candidate categories in an ODP structure according to an embodiment of the present invention.

도 6은 본 발명의 일 실시예에 따른 ODP 구조에서 카테고리 일반화를 설명하기 위한 도면이다. 6 is a diagram for describing category generalization in an ODP structure according to an embodiment of the present invention.

도 7은 본 발명의 일 실시예에 따른 지역 모델 생성 과정을 설명하기 위한 도면이다. 7 is a view for explaining a process of generating a regional model according to an embodiment of the present invention.

도 8은 본 발명의 일 실시예에 따른 전역 모델 생성 과정을 설명하기 위한 도면이다. 8 is a diagram illustrating a global model generation process according to an embodiment of the present invention.

도 9는 본 발명의 일 실시예에 따른 대중적 행동 탐지 모듈의 구조를 보여주는 블록도이다. 9 is a block diagram illustrating a structure of a popular behavior detection module according to an embodiment of the present invention.

도 10은 본 발명의 일 실시예에 따른 대중적 행동 정보의 추출 과정을 보여주는 블록도이다. 10 is a block diagram illustrating a process of extracting popular behavior information according to an embodiment of the present invention.

도 11은 본 발명의 일 실시예에 따른 행동-객체 쌍을 보여주는 도면이다. 11 illustrates a behavior-object pair according to an embodiment of the present invention.

도 12는 본 발명의 일 실시예에 따른 객체-행동 바인딩 과정을 보여주는 도면이다. 12 is a view illustrating an object-behavior binding process according to an embodiment of the present invention.

도 13은 본 발명의 일 실시예에 따른 사용관계 정보 매칭 과정을 보여주는 도면이다. 13 is a diagram illustrating a usage relationship information matching process according to an embodiment of the present invention.

도 14는 본 발명의 일 실시예에 따른 문맥 기반 광고 방법을 보여주는 흐름도이다. 14 is a flowchart illustrating a context-based advertising method according to an embodiment of the present invention.

도 15는 본 발명의 일 실시예에 따른 의미적 추상화 단계의 상세 흐름도이다. 15 is a detailed flowchart of the semantic abstraction step according to an embodiment of the present invention.

도 16은 본 발명의 일 실시예에 따른 사용관계 정보 추출 단계의 상세 흐름도이다. 16 is a detailed flowchart of a usage relationship information extraction step according to an embodiment of the present invention.

*도면의 주요 부분에 대한 부호의 설명** Description of the symbols for the main parts of the drawings *

100 관심 객체 탐지 모듈 200 의미적 추상화 모듈100 Object Detection Module 200 Semantic Abstraction Module

300 대중적 행동 탐지 모듈 400 사용관계 정보 추출 모듈300 Popular Behavior Detection Module 400 Use Relationship Information Extraction Module

500 광고 검색 모듈 110 전처리부500 Ad Search Module 110 Preprocessor

120 핵심구 추출부 130 후처리부120 Core ball extraction unit 130 Post-processing unit

140 관심 객체 후보 추출부 150 순위결정부140 Object of Interest Candidate Extractor 150 Ranker

510 객체 행동 바인딩부 520 매칭부510 object behavior binding unit 520 matching unit

530 검색 질의 생성부 600 행동 베이스 DB530 Search Query Generator 600 Behavior Base DB

620 사용 지식 DB 310 행동 탐지부620 Use Knowledge DB 310 Behavior Detector

320 행동 필터링부 700 구문 프레임 DB320 Behavior Filtering Section 700 Syntax Frame DB

Claims (15)

웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 상기 관심도에 따른 관심 객체를 탐지하는 관심 객체 탐지 모듈;An interest object detection module configured to analyze a web document, measure an interest indicating a degree of interest of a user, and detect an object of interest according to the interest; 상기 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행하는 의미적 추상화 모듈;A semantic abstraction module for performing a semantic abstraction process for determining the semantic level of the object of interest; 상기 관심 객체에 대한 대중적 행동을 탐지하는 대중적 행동 탐지 모듈;A popular behavior detection module for detecting popular behavior for the object of interest; 상기 의미적 추상화 모듈에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출하는 사용관계 정보 추출 모듈; 및A usage relationship information extraction module for extracting usage relationship information by using object-action pairs abstracted by the semantic abstraction module and a predefined usage relationship pattern; And 상기 관심 객체에 대한 대중적 행동과 상기 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천하는 광고 검색 모듈을 포함하는 문맥 기반 광고 시스템.And an advertisement retrieval module for mapping the public behavior and the usage relation information for the object of interest, searching for an advertisement using the result, and recommending the retrieved advertisement. 제1항에 있어서,The method of claim 1, 상기 관심 객체 탐지 모듈은,The object of interest detection module, 상기 웹 문서에서 불필요한 요소들을 제거하는 스테밍(stemming)을 수행하는 전처리부;A preprocessing unit which performs stemming to remove unnecessary elements from the web document; 상기 전처리부에서 스테밍이 수행된 문서로부터 핵심구(keyphrase)를 추출하 는 핵심구 추출부;A key phrase extracting unit for extracting a key phrase from the document on which the stemming is performed in the preprocessor; 상기 핵심구 추출부에서 추출된 핵심구를 언스테밍(unstemming)하는 후처리부;A post-processing unit for unstemming the core sphere extracted from the core sphere extracting unit; 상기 후처리부에서 언스테밍된 핵심구 중에서 관심 객체 후보군을 추출하는 관심 객체 후보 추출부;An object-of-interest candidate extracting unit for extracting an object-of-interest candidate group from the core phrases unstagged by the post-processing unit; 상기 관심 객체 후보 추출부의 관심 객체에 대하여 순위를 결정하는 순위결정부를 포함하는 것을 특징으로 하는 문맥 기반 광고 시스템.And a ranking determiner configured to determine a rank of the interested object of the interested object candidate extracting unit. 제1항에 있어서,The method of claim 1, 상기 의미적 추상화 모듈은 ODP(Open Directory Project) 텍소노미(Taxonomy)를 이용하는 것을 특징으로 하는 문맥 기반 광고 시스템.The semantic abstraction module is a context-based advertising system, characterized in that using the Open Directory Project (TDPonomy). 제3항에 있어서,The method of claim 3, 상기 의미적 추상화 모듈은, The semantic abstraction module, 상기 관심 객체를 검색 쿼리로 이용하여 ODP 카테고리를 검색하여 후보 카테고리를 선정하고, 상기 후보 카테고리를 일정한 수준을 갖도록 일반화하는 일반화 과정을 수행하고, 일반화된 후보 카테고리를 상기 관심 객체의 관련도에 기반하여 순위를 결정하는 것을 특징으로 하는 문맥 기반 광고 시스템. Using the object of interest as a search query, an ODP category is searched to select a candidate category, a generalization process is performed to generalize the candidate category to have a predetermined level, and the generalized candidate category is based on the relevance of the object of interest. Context-based advertising system characterized by determining the ranking. 제1항에 있어서,The method of claim 1, 상기 대중적 행동 탐지 모듈은, The popular behavior detection module, 상기 관심 객체에 관련된 행동을 탐지하는 행동 탐지부; 및A behavior detector for detecting a behavior related to the object of interest; And 상기 행동 탐지부에서 탐지된 행동들의 집합에 대하여 확률에 따라 필터링 동작을 수행하는 행동 필터링부A behavior filtering unit for performing a filtering operation on the set of behaviors detected by the behavior detection unit according to a probability; 를 포함하는 것을 특징으로 하는 문맥 기반 광고 시스템.Context-based advertising system comprising a. 제5항에 있어서,The method of claim 5, 상기 행동 탐지부는 사용자의 욕구를 나타내는 질문 구문들이 저장된 구문 프레임(syntactic frame) 데이터베이스(Database, 이하 'DB'라 함)를 이용하여, 상기 관심 객체에 관련된 구문이 상기 구문 프레임 DB에 존재하는지 확인하는 방식으로 상기 관심 객체에 관련된 행동을 탐지하는 것을 특징으로 하는 문맥 기반 광고 시스템.The behavior detector detects whether a phrase related to the object of interest exists in the syntax frame DB by using a syntax frame database (hereinafter referred to as 'DB') in which question phrases indicating a user's desire are stored. Context-based advertising system for detecting a behavior related to the object of interest in a manner. 제1항에 있어서,The method of claim 1, 상기 광고 검색 모듈은, The ad search module, 상기 관심 객체를 관련된 카테고리 정보에 매핑하고, 상기 관심 객체와 관련된 대중적 행동 정보를 가져오는 객체 행동 바인딩부;An object behavior binding unit that maps the object of interest to related category information and obtains public behavior information related to the object of interest; 상기 객체 행동 바인딩부에서 매칭된 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭하는 매칭부; 및A matching unit which matches usage relationship information related to the category-action pair matched by the object behavior binding unit; And 상기 관심 객체, 상기 관련된 카테고리 정보, 상기 관심 객체의 대중적 행동 정보, 및 상기 카테고리-행동 쌍에 관련된 사용관계 정보를 이용하여 광고 추천에 사용되는 검색 질의문을 생성하는 검색 질의 생성부A search query generator configured to generate a search query used for recommending advertisements using the interest object, the related category information, popular behavior information of the interest object, and usage relationship information related to the category-action pair; 를 포함하는 것을 특징으로 하는 문맥 기반 광고 시스템.Context-based advertising system comprising a. 제7항에 있어서,The method of claim 7, wherein 상기 대중적 행동 탐지 모듈에서 탐지된 대중적 행동 요소들을 저장하기 위한 행동 베이스 DB를 더 포함하고, A behavior base DB for storing the public behavior elements detected in the popular behavior detection module; 상기 객체 행동 바인딩부는 상기 행동 베이스 DB로부터 상기 관심 객체와 관련된 대중적 행동 정보를 가져오는 것을 특징으로 하는 문맥 기반 광고 시스템.And the object behavior binding unit obtains public behavior information related to the object of interest from the behavior base DB. 제7항에 있어서,The method of claim 7, wherein 상기 사용관계 정보 추출모듈에서 추출된 사용관계 정보가 저장된 사용 상식 DB를 더 포함하고, Further comprising a usage common sense DB is stored the usage relationship information extracted from the usage relationship information extraction module, 상기 매칭부는 상기 사용 상식 DB를 이용하여 상기 카테고리-행동 쌍에 관련된 사용관계 정보를 매칭하는 것을 특징으로 하는 문맥 기반 광고 시스템.The matching unit is a context-based advertising system, characterized in that for matching the use relationship information associated with the category-action pair using the use common sense DB. 관심 객체 탐지 모듈에서 웹 문서를 분석하여 사용자의 관심 정도를 나타내는 관심도를 측정하고, 상기 관심도에 따른 관심 객체를 탐지하는 단계;Analyzing the web document in the object-of-interest detection module to measure an interest indicating a degree of interest of the user and detecting the object of interest according to the interest; 의미적 추상화 모듈에서 상기 관심 객체의 의미적 수준을 결정하는 의미적 추상화(semantic abstraction) 과정을 수행하는 단계;Performing a semantic abstraction process of determining a semantic level of the object of interest in a semantic abstraction module; 대중적 행동 탐지 모듈에서 상기 관심 객체에 대한 대중적 행동을 탐지하는 단계;Detecting popular behavior for the object of interest in a popular behavior detection module; 사용관계 정보 추출 모듈에서 상기 의미적 추상화 과정에서 추상화된 객체-행동 쌍(Object-Action pairs)과 미리 정의된 사용관계 패턴을 이용하여 사용관계 정보를 추출하는 단계; 및Extracting usage relationship information from the usage relationship information extracting module by using object-action pairs abstracted in the semantic abstraction process and a predefined usage relationship pattern; And 광고 검색 모듈에서 상기 관심 객체에 대한 대중적 행동과 상기 사용관계 정보를 매핑(mapping)하고, 그 결과를 이용하여 광고를 검색하고, 검색된 광고를 추천하는 단계Mapping the public behavior of the object of interest and the usage relationship information in an advertisement search module, searching for an advertisement using the result, and recommending the found advertisement; 를 포함하는 문맥 기반 광고 방법.Context-based advertising method comprising a. 제10항에 있어서,The method of claim 10, 상기 의미적 추상화 과정을 수행하는 단계는, The step of performing the semantic abstraction process, 상기 관심 객체를 검색쿼리로 이용하여 ODP 카테고리를 검색하여 후보 ODP 카테고리를 선정하는 단계;Selecting a candidate ODP category by searching an ODP category using the object of interest as a search query; 상기 후보 카테고리를 일정한 수준을 갖도록 일반화하는 단계; 및Generalizing the candidate categories to have a certain level; And 일반화된 후보 카테고리에 대해 상기 관심 객체의 관련도에 기반하여 순위를 결정하는 단계를 포함하여 이루어지는 것을 특징으로 하는 문맥 기반 광고 방법.Determining a ranking based on the relevance of the object of interest to a generalized candidate category. 제10항에 있어서,The method of claim 10, 상기 사용관계 정보를 추출하는 단계는, Extracting the usage relationship information, 상기 의미적 추상화 과정에서 추상화된 객체-행동 쌍과 미리 정의된 사용관계 패턴을 이용하여 검색 질의를 생성하는 단계;Generating a search query using the abstracted object-behavior pair and a predefined usage relationship pattern in the semantic abstraction process; 상기 검색 질의를 검색 엔진에 입력하여 관련 문서를 수집하는 단계;Inputting the search query into a search engine to collect related documents; 상기 사용관계 패턴을 이용하여 수집된 관련 문서로부터 사용관계 정보를 추출하는 단계; 및Extracting usage relationship information from related documents collected using the usage relationship pattern; And 추출된 사용관계 정보를 필터링하는 단계Filtering the extracted usage information 를 포함하는 것을 특징으로 하는 문맥 기반 광고 방법.Context-based advertising method comprising a. 제12항에 있어서,The method of claim 12, 상기 사용관계 정보를 추출하는 단계는 자연어 처리 과정 및 패턴을 이용하여 상기 사용관계 정보를 추출하는 것을 특징으로 하는 문맥 기반 광고 방법.The extracting of the usage relationship information may include extracting the usage relationship information using a natural language processing process and a pattern. 제12항에 있어서,The method of claim 12, 상기 추출된 사용관계 정보를 필터링하는 단계는 상업성(commerciality)과 연관성(association)에 기반하여 필터링하는 것을 특징으로 하는 문맥 기반 광고 방법.The filtering of the extracted usage relationship information may include filtering based on commerciality and association. 제14항에 있어서,The method of claim 14, 상기 추출된 사용관계 정보의 상업성 수치와 연관성 수치를 측정하고, 측정된 상업성 수치와 연관성 수치가 임계값보다 작으면 필터링하는 것을 특징으로 하는 문맥 기반 광고 방법. And measuring the commercial value and the correlation value of the extracted usage relationship information, and filtering if the measured commercial value and the correlation value are smaller than a threshold value.
KR1020090076742A 2009-08-19 2009-08-19 System and method for advertising based on context KR101110022B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090076742A KR101110022B1 (en) 2009-08-19 2009-08-19 System and method for advertising based on context

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090076742A KR101110022B1 (en) 2009-08-19 2009-08-19 System and method for advertising based on context

Publications (2)

Publication Number Publication Date
KR20110019146A KR20110019146A (en) 2011-02-25
KR101110022B1 true KR101110022B1 (en) 2012-02-29

Family

ID=43776558

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090076742A KR101110022B1 (en) 2009-08-19 2009-08-19 System and method for advertising based on context

Country Status (1)

Country Link
KR (1) KR101110022B1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070113858A (en) * 2006-05-26 2007-11-29 주식회사 다음커뮤니케이션 Contextual based of advertising system and method thereof
KR20080113168A (en) * 2008-10-13 2008-12-29 정진욱 Systems, methods, and software (computer program product) for information searching, data exchanges, ubiquitous system, advertising by using object-based keyword box and the dynamically patternized classification connection structure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20070113858A (en) * 2006-05-26 2007-11-29 주식회사 다음커뮤니케이션 Contextual based of advertising system and method thereof
KR20080113168A (en) * 2008-10-13 2008-12-29 정진욱 Systems, methods, and software (computer program product) for information searching, data exchanges, ubiquitous system, advertising by using object-based keyword box and the dynamically patternized classification connection structure

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
카달로그:한국정보과학회

Also Published As

Publication number Publication date
KR20110019146A (en) 2011-02-25

Similar Documents

Publication Publication Date Title
US8321278B2 (en) Targeted advertisements based on user profiles and page profile
US6816857B1 (en) Meaning-based advertising and document relevance determination
US8738426B2 (en) Taxonomy based targeted search advertising
US8700599B2 (en) Context dependent keyword suggestion for advertising
KR100881832B1 (en) Method and system for displaying keyword advertisement using searching optimum randing page
US20050222989A1 (en) Results based personalization of advertisements in a search engine
CN106339502A (en) Modeling recommendation method based on user behavior data fragmentation cluster
US20070214133A1 (en) Methods for filtering data and filling in missing data using nonlinear inference
US20140278985A1 (en) Systems and methods for the enhancement of semantic models utilizing unstructured data
US20140258002A1 (en) Semantic model based targeted search advertising
CA2833359A1 (en) Analyzing content to determine context and serving relevant content based on the context
KR101355945B1 (en) On line context aware advertising apparatus and method
KR20090000691A (en) Advertisement method and system for displaying context advertisement
WO2008033780A2 (en) Recommending advertising key phrases
TWI393018B (en) Method and system for instantly expanding keyterm and computer readable and writable recording medium for storing program for instantly expanding keyterm
JP4569380B2 (en) Vector generation method and apparatus, category classification method and apparatus, program, and computer-readable recording medium storing program
KR102593996B1 (en) Apparatus and Method For Providing Recommendation Service Through Social Media Activity Analysis
KR102028356B1 (en) Advertisement recommendation apparatus and method based on comments
KR101110022B1 (en) System and method for advertising based on context
KR101404644B1 (en) Apparatus and method for expanding knowledge base
KR101831701B1 (en) Apparatus and method for decideing target advertisingusing interest information of user
KR20160032599A (en) The method and apparatus for detecting concealment of social issue
KR100773066B1 (en) Internet information searching method
AU2012202738B2 (en) Results based personalization of advertisements in a search engine
JP2012083935A (en) Patent retrieval device, patent retrieval method, and program

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151229

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190107

Year of fee payment: 8