KR101545454B1 - Advertisement matching method for online contents based on keyword and advertisement matching system thereof - Google Patents

Advertisement matching method for online contents based on keyword and advertisement matching system thereof Download PDF

Info

Publication number
KR101545454B1
KR101545454B1 KR1020140139018A KR20140139018A KR101545454B1 KR 101545454 B1 KR101545454 B1 KR 101545454B1 KR 1020140139018 A KR1020140139018 A KR 1020140139018A KR 20140139018 A KR20140139018 A KR 20140139018A KR 101545454 B1 KR101545454 B1 KR 101545454B1
Authority
KR
South Korea
Prior art keywords
content
keyword
word
advertisement
keywords
Prior art date
Application number
KR1020140139018A
Other languages
Korean (ko)
Other versions
KR20140137327A (en
Inventor
이원섭
Original Assignee
주식회사 애드오피
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 애드오피 filed Critical 주식회사 애드오피
Priority to KR1020140139018A priority Critical patent/KR101545454B1/en
Publication of KR20140137327A publication Critical patent/KR20140137327A/en
Application granted granted Critical
Publication of KR101545454B1 publication Critical patent/KR101545454B1/en

Links

Images

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Finance (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Entrepreneurship & Innovation (AREA)

Abstract

본 발명은 온라인 콘텐츠의 키워드 기반 광고 매칭 방법 및 그를 이용한 광고 매칭 시스템에 관한 것으로, 그 방법은 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 단계; 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하는 단계; 추출된 주요 키워드들 중 부정적 이미지의 단어를 필터링하는 단계; 부정적 이미지의 단어가 필터링된 주요 키워드들과 관련된 하나 이상의 상업 키워드를 결정하는 단계; 및 결정된 상업 키워드에 대응되는 광고가 콘텐츠에 포함될 수 있도록 처리하는 단계를 포함한다.The present invention relates to a keyword-based advertisement matching method for online contents and an advertisement matching system using the keyword matching method. The method includes: indexing online content to generate content indexing data; Extracting one or more primary keywords from the indexing data; Filtering the words of the negative image among the extracted main keywords; Determining one or more commercial keywords associated with the main keywords with negative image words filtered; And processing the advertisement corresponding to the determined commercial keyword to be included in the content.

Description

온라인 콘텐츠의 키워드 기반 광고 매칭 방법 및 그를 이용한 광고 매칭 시스템{Advertisement matching method for online contents based on keyword and advertisement matching system thereof}[0001] The present invention relates to a keyword-based advertisement matching method for online contents, and an advertisement matching system using the same. [0002]

본 발명은 웹사이트에서 제공하는 온라인 콘텐츠로부터 추출된 키워드에 기반하여 해당 콘텐츠에 포함되는 광고를 매칭시키는 방법에 관한 것이다.The present invention relates to a method of matching an advertisement included in a corresponding content based on keywords extracted from online contents provided on a web site.

정보통신 기술의 발달에 따라서 온라인을 기반으로 하는 콘텐츠 제작이 활발해지고 있다. 다양한 웹 사이트 운영자들은 뉴스기사, 칼럼, 블로깅, 동영상 등의 다양한 온라인 콘텐츠를 제작하여 해당 콘텐츠에 광고를 게재시키고, 사이트 방문자들이 콘텐츠에 포함된 광고를 클릭함으로써 광고수익을 발생시키고 있다. With the development of information and communication technology, the production of content based on online is becoming active. Various web site operators have created a variety of online content such as news articles, columns, blogs, videos, and so on, and are generating ad revenue by allowing site visitors to click on the ads included in the content.

따라서, 콘텐츠 생산자 입장에서는 광고효율을 높이기 위해 콘텐츠를 많은 대중에게 노출시켜야 하고, 이를 위해서는 검색엔진 최적화와 같은 콘텐츠 유통이 중요해지고 있다. Therefore, contents producers are required to expose their contents to a large number of public in order to increase the efficiency of advertisement, and for this purpose, content distribution such as search engine optimization is becoming important.

구글과 같은 일반 검색 사이트의 경우에는 검색 엔진들이 크롤링을 통해서 온라인 콘텐츠들을 사전에 수입하고, 검색어가 입력되면 수집된 콘텐츠 중에서 대응되는 자료를 출력하는 방식을 취하는데, 이 경우, 자신의 콘텐츠가 실제로 검색 엔진에 의해서 검색되지 않는 경우가 많고, 검색이 되는 경우에도 실제로 시간이 지남에 따라서 검색 순위에서 밀려 검색을 수행한 일반인들의 주목을 받을 수 없는 경우가 많다. In the case of a general search site such as Google, a search engine takes a method of pre-importing online contents through a crawl, and when the search word is input, corresponding data is output from the collected contents. In this case, It is often the case that the search engine does not retrieve it, and even when the search is performed, it is often impossible to receive the attention of the ordinary people who have been searched for by the search ranking over time.

이 뿐만 아니라, 콘텐츠 생산자들은 자신들의 콘텐츠가 검색엔진에 의해서 검색된다 하더라도, 실제로 검색된 결과에 의해서 자신의 웹 사이트에 트래픽이 증가했는지, 자신의 콘텐츠가 얼마나 소비되고 있으며, 웹사이트 또는 콘텐츠에 포함된 광고들이 얼마나 클릭되고 있는지에 대한 정보를 얻을 수 없는 한계가 있었다.In addition, content producers have found that even if their content is searched by a search engine, the actual results of the search indicate increased traffic to their website, how much their content is being consumed, There was a limit to how much information ads could be getting.

따라서, 생산된 콘텐츠를 더 많은 사람들에게 노출시키고, 이에 포함된 광고가 함께 소비자들에게 노출되어 콘텐츠로 인해서 수익이 창출되도록 함으로써, 콘텐츠의 가치를 향상시키고, 이러한 콘텐츠 가치 향상을 평가할 수 있는 방법 및 시스템이 절실히 요구되고 있다. Thus, by exposing the produced content to more people, and the advertisements included in it, being exposed to consumers to generate revenue from the content, it is possible to improve the value of the content, A system is urgently required.

본 발명이 해결하고자 하는 과제는 온라인 콘텐츠에 적합한 광고가 해당 콘텐츠에 포함되도록 하는 키워드 기반 고아고 매칭 방법 및 시스템을 제공하는 것이다.A problem to be solved by the present invention is to provide a keyword-based search method and system for allowing an advertisement suitable for an online content to be included in the content.

상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠의 키워드 기반 광고 매칭 방법은, 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 단계; 상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하는 단계; 상기 추출된 주요 키워드들 중 부정적 이미지의 단어를 필터링하는 단계; 상기 부정적 이미지의 단어가 필터링된 주요 키워드들과 관련된 하나 이상의 상업 키워드를 결정하는 단계; 및 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함될 수 있도록 처리하는 단계를 포함한다.According to another aspect of the present invention, there is provided a keyword-based advertisement matching method for online content, comprising: indexing online content to generate content indexing data; Extracting one or more primary keywords from the indexing data; Filtering out words of a negative image among the extracted main keywords; Determining one or more commercial keywords associated with the filtered main keywords of the negative image; And processing the advertisement corresponding to the determined commercial keyword to be included in the content.

한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠의 키워드 기반 광고 매칭 시스템은, 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 인덱싱부; 및 상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하고, 상기 추출된 주요 키워드들 중 부정적 이미지의 단어를 필터링하며, 상기 부정적 이미지의 단어가 필터링된 주요 키워드들과 관련된 하나 이상의 상업 키워드를 결정하는 키워드 추출부를 포함하고, 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함될 수 있도록 처리한다.According to another aspect of the present invention, there is provided a keyword-based advertisement matching system for online contents, comprising: an indexing unit for indexing online contents to generate content indexing data; And extracting one or more keywords from the indexed data, filtering negative words of the extracted major keywords, and extracting keywords that determine one or more commercial keywords related to the filtered main keywords of the negative image And processes the advertisement corresponding to the determined commercial keyword to be included in the content.

한편, 상기 온라인 콘텐츠의 키워드 기반 광고 매칭 방법은 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.Meanwhile, the keyword-based advertisement matching method of the on-line contents can be implemented as a computer-readable recording medium on which a program for executing on a computer is recorded.

본 발명은 콘텐츠를 인덱싱하여 인덱싱 데이터를 생성하고, 인덱싱 데이터로부터 주요 키워드를 추출하고 구문을 요약한 후, 인덱싱 데이터와 키워드를 포함하는 사이트맵을 생성하여 검색 엔진들로 제공함으로써, 사용자의 콘텐츠를 보다 효율적으로 검색 엔진을 통해서 일반인들에게 노출시킬 수 있는 효과가 있다.The present invention includes indexing data to generate indexing data, extracting a main keyword from the indexing data, summarizing the syntax, generating a site map including indexing data and keywords, and providing the site map to search engines, It has the effect of exposing to the public more efficiently through the search engine.

또한, 본 발명은 콘텐츠 사이트맵을 검색엔진에 제공한 후, 콘텐츠로부터 추출된 키워드를 이용하여 주기적으로 해당 검색 엔진에 검색을 수행하여 검색 순위를 확인하고, 검색 순위와 해당 콘텐츠를 생성한 웹 사이트의 접속 로그를 분석하여, 콘텐츠별로 유발된 트래픽의 양과 각 콘텐츠별 광고 효과 및 수익성을 분석할 수 있을 뿐만 아니라, 콘텐츠 생산자별로 유발된 트래픽의 양과 광고 효과 및 수익성을 분석할 수 있다.In addition, the present invention provides a content sitemap to a search engine, periodically searches the search engine for the search ranking by using keywords extracted from the content, The amount of traffic induced by each content, the advertising effect and profitability of each content can be analyzed, as well as the amount of traffic caused by content producers, advertisement effect and profitability can be analyzed.

본 발명의 또 다른 실시예에 따르면, 상기 인덱싱 데이터로부터 추출되는 주요 키워드들 중에서 부정적 이미지의 단어를 필터링한 후 광고 매칭을 위한 상업 키워드를 결정함으로써, 콘텐츠 내의 부정적 이미지의 단어와 연관된 광고가 콘텐츠에 포함되지 않도록 하여, 콘텐츠에 적합한 광고가 노출되도록 할 수 있다.According to another embodiment of the present invention, a keyword of a negative image is filtered out of the main keywords extracted from the indexing data, and a commercial keyword for advertisement matching is determined, So that the advertisement suitable for the content can be exposed.

도 1은 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 시스템의 구성을 도시하는 도면이다.
도 2는 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 방법을 설명하는 흐름도이다.
도 3은 본 발명의 바람직한 실시예에 따라서 인덱싱부가 생성한 인덱싱 데이터의 일 예를 도시하는 도면이다.
도 4a 및 도 4b는 본 발명의 바람직한 실시예에 따른 사이트 맵의 일 예를 도시한 도면이다.
1 is a diagram illustrating a configuration of an online content value enhancement system using search engine optimization according to a preferred embodiment of the present invention.
2 is a flowchart illustrating an online content value enhancement method using search engine optimization according to a preferred embodiment of the present invention.
3 is a diagram showing an example of indexing data generated by an indexing section according to a preferred embodiment of the present invention.
4A and 4B are views showing an example of a site map according to a preferred embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 설명한다.Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.

도 1은 본 발명의 바람직한 실시예에 따른, 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 시스템(이하, “온라인 콘텐츠 가치 향상 시스템”으로 약칭함)의 구성을 도시하는 도면이고, 도 2는 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 방법(이하, “온라인 콘텐츠 가치 향상 방법”으로 약칭함)을 설명하는 흐름도이다.FIG. 1 is a diagram showing a configuration of an online content value enhancement system (hereinafter abbreviated as "online content value enhancement system") using search engine optimization according to a preferred embodiment of the present invention. (Hereinafter abbreviated as " method for enhancing an online content value ") using search engine optimization according to a preferred embodiment of the present invention.

도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠 가치 향상 시스템은, 인덱싱부(110), 키워드 추출부(120), 사이트맵 생성부(130), 인덱싱 모니터링부(140) 및 분석부(150)를 포함한다.Referring to FIG. 1, an online content value enhancement system according to a preferred embodiment of the present invention includes an indexing unit 110, a keyword extracting unit 120, a site map generating unit 130, an indexing monitoring unit 140, (150).

도 2를 더 참조하여, 각 구성 요소의 기능을 설명하면, 먼저, 인덱싱부(110)는 복수의 웹사이트로부터 콘텐츠를 수신한다(S210). Referring to FIG. 2, the function of each component will be described. First, the indexing unit 110 receives contents from a plurality of websites (S210).

복수의 웹 사이트는 일반 온라인 쇼핑몰, 뉴스 기사를 제공하는 언론사 웹사이트, 인터넷 포털 사이트, 개인의 블로그 사이트, 개인들의 커뮤니티 웹사이트 등 인터넷을 통해서 콘텐츠를 제공할 수 있는 사이트라면 그 제한이 없다. There are no restrictions on multiple websites, as long as they are capable of providing content through the Internet, such as a general online shopping mall, a news web site providing news articles, an internet portal site, a personal blog site, or a community web site for individuals.

또한, 콘텐츠도 단순힌 텍스트, 이미지, 동영상 중 어느 하나만으로 구성된 콘텐츠일 수도 있고, 그 내부에 텍스트와 이미지, 텍스트와 동영상, 또는 이들 모두를 포함하는 것일 수도 있다.In addition, the content may be a content composed of only simple text, an image, or a moving image, or may include text and an image, text and a moving image, or both.

인덱싱부(110)는 수신된 콘텐츠에 대해서 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하여 키워드 추출부(120)로 출력한다(S220). The indexing unit 110 performs indexing on the received content, generates content indexing data, and outputs the content indexing data to the keyword extracting unit 120 (S220).

도 3은 본 발명의 바람직한 실시예에 따라서 인덱싱부(110)가 생성한 인덱싱 데이터의 일 예를 도시하는 도면이다. 도 3에 도시된 바와 같이, 본 발명의 인덱싱 데이터는 콘텐츠 제목, 콘텐츠 생성 날짜, 콘텐츠 저자, 콘텐츠 내용, 콘텐츠 게시 URL, 콘텐츠 게시 웹사이트명 또는 기관, 콘텐츠에 포함된 이미지 및 동영상 메타 데이터 등 다양한 정보들 중 하나 이상을 포함한다. 3 is a diagram illustrating an example of indexing data generated by the indexing unit 110 according to a preferred embodiment of the present invention. As shown in FIG. 3, the indexing data of the present invention can be used for various purposes such as a content title, a content creation date, a content author, a content content, a content publishing URL, a content publishing web site name or institution, Lt; / RTI > information.

도 3에 도시된 인덱싱 데이터에는 콘텐츠 제목(아빠 어디가’엄마들, 아이들 예쁜 이유는 엄마 유전자 덕분), 날짜(2013-02-25), 저자(국민일보 쿠키뉴스팀), 콘텐츠 내용(MBC 예능 프로그램~), URL(http://news.kukinews.com/article/view~), 기관(국민일보), 카테고리(연예), 키워드(아빠 어디가) 등의 인덱싱 데이터를 포함하는 것을 알 수 있다.The indexing data shown in FIG. 3 includes the content title (where the father is the mother, the reason why the children are pretty because of the mother gene), the date (2013-02-25), author (Kookmin Ilbo cookie news team) ), A URL (http://news.kukinews.com/article/view-), an agency (Kookmin Daily), a category (entertainment), and a keyword (where is Daddy).

키워드 추출부(120)는 인덱싱부(110)로부터 입력된 인덱싱 데이터로부터 주요 키워드를 추출하고, 주요 키워드를 이용하여 상업 키워드로 추가로 추출하며, 본문 내용을 요약하여, 주요 키워드, 상업 키워드 및 본문 내용 요약을 사이트맵 생성부(130)로 출력한다(S230).The keyword extracting unit 120 extracts a main keyword from the indexing data input from the indexing unit 110, further extracts the keyword as a commercial keyword using the main keyword, summarizes the main text, And outputs the content summary to the site map generating unit 130 (S230).

키워드 추출부(120)는 형태소 분석 알고리즘에 따라서 인덱싱 데이터에서 추출된 각 단어들에 대하여 아래의 5가지 조건에 따라서 점수를 차등적으로 부여하여 누적함으로써, 주요 키워드를 추출한다. The keyword extracting unit 120 extracts the main keywords by assigning the scores differentially according to the following five conditions to the respective words extracted from the indexing data according to the morphological analysis algorithm.

제 1 조건은 단어들이 제목에서 추출되었는지 또는 본문에서 추출되었는지에 따라서 차등으로 점수를 부여한다. 일반적으로 제목에 포함된 단어일수록 주요 키워드일 가능성이 높으므로, 제목에서 추출된 단어에 본문 내용에서 추출된 단어보다 높은 점수를 부여한다.The first condition grades the words differently depending on whether the words were extracted from the title or from the text. Generally speaking, the words in the title are more likely to be the main keywords, so the words extracted from the title are given higher scores than the words extracted from the text.

제 2 조건은 본문내에서 제목에서 추출된 단어가 발견된 경우, 또는 본문내에서 제목에서 추출된 단어가 발견된 경우에 해당 단어에 인접한 위치의 단어에 점수를 부여한다. 이 경우, 전자의 경우 더 높은 점수를 부여할 수 있다.The second condition is to score a word at a position adjacent to the word when a word extracted from the title is found in the text or when a word extracted from the title is found in the text. In this case, the former can be given a higher score.

도 3의 경우를 예를 들면, 기사 제목인 [‘아빠 어디가’ 엄마들, 아이들 예쁜 이유는 엄마 유전자 덕분]에서, 주요 키워드로서 아빠, 어디가, 엄마, 아이, 유전자 등이 높은 점수를 부여받는 단어로서 추출된다. 아울러, 기사 내용 중에서 제목에서 추출된 주요 키워드에 인접한 단어를 순차적으로 검색하여 점수를 부여한다. 도 3의 예에서, “엄마”라는 키워드의 인접한 단어를 찾는 과정을 설명하면, 본문 중 [~ 최근 한 온라인 커뮤니티 게시판에는 ‘아빠 어디가 엄마들 미모’라는 제목아래 여러 장의 사진이 올라왔다~]에서, 검색 대상 키워드인 “엄마” 가 발견되고, “엄마”에 대해 앞/뒤 소정수의 인접한 단어(예컨대, 2 단어)를 탐색한다. 이 경우, “아빠 어디가 엄마들 미모라는 제목아래”라는 구문이 추출되고, 여기서 “엄마” 앞의 2단어에 포함되는 “아빠”, “어디가”, “엄마” 뒤의 2단어에 포함되는 “미모”, “제목”이 추출되어 점수를 부여받게 된다.In the case of FIG. 3, for example, in the title of the article ['Where are my dad' and 'Why are my children pretty thanks to my mother's genes'], words such as dad, where, mama, . In addition, words adjacent to the main keywords extracted from the titles in the article content are sequentially searched and scores are given. In the example of Fig. 3, the process of finding the adjacent word of the keyword " mom " will be described. In the text of the present invention, several recent photographs have been uploaded under the heading ' , A search target keyword " mother " is found, and a predetermined number of adjacent words (e.g., two words) are searched for " mom " In this case, the phrase "Daddy is under the title of moms mimo" is extracted, and the words "dad", "somewhere" and "mom" in the two words preceding "mom" "And" title "are extracted and given a score.

제 3 조건은 단어가 존재하는 본문내의 위치에 따라서 차등적으로 점수를 부여한다. 단어가 본문내에서 서론(문서 크기의 상위 25% 미만), 본론 (문서 크기의 상위 25% 이상 75% 미만), 결론(문서 크기의 상위 75% 이상) 중 어디에 위치하느냐에 따라서 차등적으로 점수를 부여한다. 본 발명의 바람직한 실시예에서는 결론에 위치한 키워드에 대해서 보다 높은 점수를 부여하였으나, 이는 콘텐츠의 전개 방식에 따라서 조절될 수 있다. 예컨대, 두괄식 문장의 경우에는 서론 부분에 위치하는 단어에 대해서 더 높은 점수를 부여할 수 있다.The third condition grades according to the position in the text where the word exists. Depending on where the word is located within the text (less than the top 25% of the document size), mainte- nance (greater than 25% of the document size and less than 75%), and conclusion (over 75% of the document size) . In the preferred embodiment of the present invention, a higher score is given to the keyword located at the conclusion, but this can be adjusted according to the manner of development of the content. For example, in the case of a bold sentence, a higher score can be assigned to a word located in the introductory part.

제 4 조건은 단어 빈도에 따라서 가중치를 부여한다. 자주 반복되는 단어일수록 중요 단어일 수 있으므로 높은 점수를 부여하되, 전체 단어 수 대비 일정 수준 이상의 빈도가 되면, 해당 콘텐츠는 오히려 스팸 문서의 가능성이 있으므로 오히려 역의 가중치를 준다.The fourth condition is weighted according to the word frequency. The more frequent repetition of a word, the more important it is because it can be a high score, but if the frequency of a certain number of words more than a certain number of words, the content is rather a spam document is likely to give a reverse weight.

제 5 조건은 해당 콘텐츠가 속하는 카테고리의 주요 키워드로 사전에 분류된 주요 키워드 셋이 존재하고, 이에 해당하는 단어인 경우 또는 동일 카테고리의 동일한 날짜의 이전에 분석된 다른 문서의 주요 키워드와 동일한 단어에 대해서는 점수를 부여한다.The fifth condition is that there exist a set of main keywords pre-classified as the main keywords of the category to which the content belongs, and in the case of the corresponding words or in the same word as the main keywords of other documents analyzed before the same date of the same category Score is given.

본문 내용으로부터 주요 키워드가 추출되면, 키워드 추출부(120)는 추출된 주요 키워드를 이용하여 상업 키워드를 추가로 추출한다. 상업 키워드는 추출된 주요 키워드의 상위 개념 또는 밀접하게 연관성 있다고 사전에 설정된 단어로서 결정될 수 있는데, 해당 콘텐츠가 주요 키워드 뿐만 아니라 상업 키워드의 검색 과정에서도 검색될 수 있도록 하며, 해당 상업 키워드와 관련된 광고가 해당 콘텐츠에 포함될 수 있도록 한다.When the main keyword is extracted from the main content, the keyword extracting unit 120 further extracts the commercial keyword using the extracted main keyword. The commercial keyword may be determined as a parent concept of the extracted key keyword or a word that is closely related to the extracted keyword so that the content can be searched not only in the main keyword but also in the search process of the commercial keyword, To be included in the content.

예컨대, 주요 키워드로 “이효리”, “섹시”, “댄스”라는 주요 키워드가 추출되면, 키워드 추출부(120)는 주요 키워드로부터 상업 키워드로서 “다이어트”를 추출될 수 있다. 이 경우, 해당 콘텐츠는 다이어트 상품 광고를 포함할 수 있고, 이효리, 섹시, 댄스를 검색하는 사용자뿐만 아니라, 다이어트를 검색하는 사용자들에게도 노출될 수 있다.For example, when the main keywords such as "Lee Hyori", "sexy", and "dance" are extracted as the main keywords, the keyword extracting unit 120 can extract "diet" as commercial keywords from the main keywords. In this case, the content may include diet product advertisements, and may be exposed not only to users who search Lee Hyori, sexy, and dance, but also to users who search for diets.

아울러, 주요 키워드로 “태국”, “저가항공”이 추출되는 경우에는, 이와 연관하여 “여행”, “태국 호텔” 등의 상업 키워드가 추출될 수 있으나, 주요 키워드로 “태국”, “저가 항공”, “추락”이 함께 추출되는 경우, “추락”이라는 부정적 이미지의 단어를 필터링하여 해당 콘텐츠에 상업 키워드에 대응되는 광고가 포함되지 않도록 할 수 있다. In addition, when the keywords "Thailand" and "low cost airline" are extracted as the main keywords, commercial keywords such as "travel" and "Thailand hotel" can be extracted. However, &Quot; and " fall " are extracted together, words having a negative image of " falling " may be filtered so that the corresponding content is not included in the advertisement corresponding to the commercial keyword.

한편, 사이트맵 생성부(130)는 인덱싱부(110)로부터 입력된 인덱싱 데이터 및 키워드 추출부(120)로부터 입력된 주요 키워드, 및 상업 키워드를 이용하여 사이트맵을 생성하고(S240), 생성된 사이트맵을 복수의 검색 엔진으로 제공한다(S250).The site map generating unit 130 generates a site map using the indexing data input from the indexing unit 110, the main keyword input from the keyword extracting unit 120, and the commercial keyword (S240) The site map is provided to a plurality of search engines (S250).

도 4a 및 도 4b는 본 발명의 바람직한 실시예에 따른 사이트 맵의 일 예를 도시한 도면이다. 도 4a에는 일반 사이트에서 제공하는 콘텐츠에 대한 사이트 맵이 도시되어 있고, 도 4b에는 뉴스 콘텐츠에 대한 사이트맵이 도시되어 있다.4A and 4B are views showing an example of a site map according to a preferred embodiment of the present invention. FIG. 4A shows a site map for contents provided by a general site, and FIG. 4B shows a site map for news contents.

도 4a 및 도 4b에 도시된 바와 같이, 사이트 맵은 검색 엔진에서 활용할 수 있도록 원본 이미지 데이터 및 동영상 데이터의 링크 정보, 뉴스 발행 기관, 뉴스 발행 날짜, 주요 키워드, 상업 키워드 등의 정보를 포함할 수 있다. 사이트 맵 자체는 국제적으로 표준화된 양식에 따라서 생성될 수도 있다.4A and 4B, the site map may include information such as link information of original image data and moving image data, a news issuing organization, a news publication date, a main keyword, and a commercial keyword so as to be utilized in a search engine have. The site map itself may be generated according to internationally standardized forms.

인덱싱 모니터링부(140)는 특정 콘텐츠의 사이트맵이 검색 엔진들로 제공된 사실을 사이트맵 생성부(130)로부터 통지받고, 사이트맵 생성부(130) 또는 키워드 추출부(120)로부터 제공받은 주요 키워드 및 상업 키워드를 이용하여, 일정한 시간 주기로 사이트맵을 제공받은 복수의 검색 엔진에서 검색을 수행하여 콘텐츠의 검색 순위를 조사하고, 조사 결과를 분석부(150)로 출력한다(S260).The indexing monitoring unit 140 notifies the site map generating unit 130 of the fact that the site map of the specific content is provided to the search engines and transmits the main keyword received from the site map generating unit 130 or the keyword extracting unit 120 And searches the plurality of search engines provided with the site map at a predetermined time period using the commercial keywords to search the search order of the contents and outputs the search result to the analyzer 150 at step S260.

분석부(150)는 상기 검색 순위 및 상기 웹사이트에 유발된 트래픽의 접속 로그를 분석하여 트래픽별 광고 효과 및 이로 인한 수익성을 분석한다(S270).The analysis unit 150 analyzes the access ranking of the traffic caused in the search ranking and the web site, and analyzes the advertisement effect and the profitability according to the traffic (S270).

예를 들면, 분석부(150)는 사이트맵에 포함된 해당 주요 키워드 또는 상업 키워드의 검색 순위에 대비한 트래픽 유발 정도를 분석하여 트래픽 유발 효율을 분석할 수 있다. 또한, 분석부(150)는 각 트래픽 접속 로그를 분석하여 각 트래픽이 어떤 검색 엔진을 통해서 해당 웹사이트에 접속하였는지 여부를 조사할 수 있으며, 접속한 후, 해당 콘텐츠에 포함된 다수의 광고들 중 어떤 광고를 선택하였는지 여부를 조사하여 분석할 수 있다. For example, the analysis unit 150 may analyze the traffic inducing efficiency by analyzing the traffic inducement level against the search ranking of the corresponding main keyword or commercial keyword included in the site map. In addition, the analyzer 150 may analyze each traffic connection log to determine which search engine has accessed the corresponding website through each traffic. After the connection, It is possible to investigate and analyze which advertisement is selected.

특히, 광고 분석 과정에서, 분석부(150)는 사용자가 선택한 광고의 위치(상단 광고, 하단 광고, 측면 광고 등), 광고의 형태(배터 광고, 팝업 광고 등) 등에 대한 분석을 수행할 수 있고, 이를 이용하여 광고의 수익성을 분석할 수 있다.Particularly, in the process of analyzing the advertisement, the analyzer 150 can analyze the position (top advertisement, bottom advertisement, side advertisement, etc.) of the advertisement selected by the user, the form of the advertisement (batting advertisement, , Which can be used to analyze the profitability of advertising.

아울러, 분석부(150)는 특정 콘텐츠에 대한 분석을 수행할 뿐만 아니라, 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서도 종합적으로 분석을 수행할 수 있다. In addition, the analyzer 150 may analyze not only a specific content but also a plurality of contents generated from the corresponding web site.

특히, 분석부(150)는 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서 각 콘텐츠별로 유발된 트래픽 양과, 각 콘텐츠별 광고 효과를 분석하여, 어떠한 종류의 콘텐츠가 대중의 관심을 받았는지 여부를 분석할 수 있고, 유통된 콘텐츠별 수익 분석을 통해 콘텐츠당 수익을 확인하고 콘텐츠 생산에 소요되는 예산에 반영할 수 있다(S280).In particular, the analysis unit 150 analyzes the amount of traffic generated for each of the plurality of contents generated on the corresponding web site, and the advertisement effect for each content, and analyzes whether the kind of the content is attracted to the public And the profit per content can be confirmed through the revenue analysis of the circulated contents and reflected in the budget for the content production (S280).

또한, 분석부(150)는 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서, 복수의 콘텐츠를 생산한 생산자(저자)별로 유발된 트래픽 양과 각 콘텐츠별 광고 효과를 분석함으로써, 콘텐츠 생산자별 수익 현황을 비교분석하고 사이트의 콘텐츠 생산 원가 대비 수익을 분석할 수 있다(S290).In addition, the analysis unit 150 analyzes the amount of traffic caused by the producers (authors) that produce a plurality of contents, and the advertisement effect of each content, with respect to a plurality of contents generated on the web site, And analyze the profit of the content production cost of the site (S290).

상기 도 2를 참조하여 설명한 온라인 콘텐츠 가치 향상 방법에서는, 설명의 편의를 위하여, 제 S280 단계 및 제 S290 단계가 순차적으로 수행되는 것으로 설명하였으나, 제 S280 단계 및 제 S290 단계는 동시에 수행되거나 역의 순서로 수행될 수 있음은 물론이다. In the online content value enhancement method described with reference to FIG. 2, steps S280 and S290 are sequentially performed for convenience of description. However, steps S280 and S290 may be performed simultaneously or in reverse order Of course.

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can also be embodied as computer-readable codes on a computer-readable recording medium. A computer-readable recording medium includes all kinds of recording apparatuses in which data that can be read by a computer system is stored. Examples of the computer-readable recording medium include a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical data storage device, and the like, and also implemented in the form of a carrier wave (for example, transmission over the Internet) . The computer readable recording medium may also be distributed over a networked computer system so that computer readable code can be stored and executed in a distributed manner.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.The present invention has been described with reference to the preferred embodiments. It will be understood by those skilled in the art that various changes in form and details may be made therein without departing from the spirit and scope of the invention as defined by the appended claims. Therefore, the disclosed embodiments should be considered in an illustrative rather than a restrictive sense. The scope of the present invention is defined by the appended claims rather than by the foregoing description, and all differences within the scope of equivalents thereof should be construed as being included in the present invention.

110 인덱싱부
120 키워드 추출부
130 사이트맵 생성부
140 인덱싱 모니터링부
150 분석부
110 indexing unit
120 Keyword Extraction Unit
130 Site Map Generator
140 Indexing Monitoring Section
150 analysis section

Claims (14)

온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 단계;
상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하는 단계;
광고 매칭을 위해 사전 설정된 복수의 단어들 중에서 상기 추출된 주요 키워드들과 연관된 적어도 하나의 단어를 상업 키워드로 결정하는 단계;
상기 추출된 주요 키워드들 및 상기 결정된 상업 키워드를 포함하는 사이트맵을 생성하여 하나 이상의 검색엔진들로 제공하는 단계; 및
상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함된 경우 상기 결정된 상업 키워드에 대응되는 광고를 상기 콘텐츠에 매칭시키기 아니하며, 상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함되지 않은 경우 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함되도록 처리하는 단계를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
Performing indexing on the online content to generate content indexing data;
Extracting one or more primary keywords from the indexing data;
Determining at least one word associated with the extracted main keywords as a commercial keyword among a plurality of words preset for advertisement matching;
Generating a site map including the extracted main keywords and the determined commercial keyword, and providing the generated site map to one or more search engines; And
Wherein if the extracted main keywords include a word of a negative image, the advertisement corresponding to the determined commercial keyword is not matched to the content, and if the extracted main keywords do not include a word of negative image, And processing the advertisement corresponding to the keyword to be included in the content.
제1항에 있어서, 상기 인덱싱 데이터는
콘텐츠 제목, 콘텐츠 생성 날짜, 콘텐츠 저자, 콘텐츠 내용, 콘텐츠 게시 URL, 콘텐츠 게시 웹사이트명, 콘텐츠에 포함된 이미지 및 동영상 메타 데이터 중 적어도 하나를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
2. The method of claim 1, wherein the indexing data
A method of keyword-based advertisement matching of online content comprising at least one of a content title, a content creation date, a content author, a content content, a content publishing URL, a content publishing website name, an image included in the content, and video metadata.
제1항에 있어서, 상기 주요 키워드 추출 단계는
상기 인덱싱 데이터로부터 복수의 단어들을 추출하는 단계; 및
상기 추출된 복수의 단어들 각각에 대하여, 상기 단어가 콘텐츠의 제목 및 본문 중 어느 부분에 포함되어 있는지 여부에 따라 차등적으로 점수를 부여하는 단계를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
2. The method according to claim 1,
Extracting a plurality of words from the indexing data; And
And assigning a score to each of the plurality of extracted words differentially according to whether the word is included in a title of a content or a body part of the content.
제3항에 있어서, 상기 주요 키워드 추출 단계는
상기 콘텐츠의 본문에 포함된 단어들 각각에 대하여, 상기 단어가 본문 중 서론, 본론 및 결론 중 어느 부분에 포함되어 있는지 여부에 따라 차등적으로 점수를 부여하는 단계를 더 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
4. The method according to claim 3,
The method according to claim 1, further comprising, for each of the words included in the body of the content, assigning a score differentially according to whether the word is included in an intro, Ad matching method.
제1항에 있어서, 상기 상업 키워드 결정 단계는
상기 광고 매칭을 위해 사전 설정된 복수의 단어들 중 상기 주요 키워드의 상위 개념에 해당하는 단어를 상기 상업 키워드로 결정하는 단계를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
The method of claim 1, wherein the commercial keyword determination step
And determining a word corresponding to an upper concept of the main keyword among the plurality of words preset for the advertisement matching as the commercial keyword.
삭제delete 삭제delete 제1항 내지 제5항 중 어느 한 항의 방법을 컴퓨터에서 실행시키기 위한 프로그램을 기록한 기록 매체.A recording medium on which a program for causing a computer to execute the method according to any one of claims 1 to 5 is recorded. 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 인덱싱부;
상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하고, 광고 매칭을 위해 사전 설정된 복수의 단어들 중에서 상기 추출된 주요 키워드들과 연관된 적어도 하나의 단어를 상업 키워드로 결정하는 키워드 추출부; 및
상기 추출된 주요 키워드들 및 상기 결정된 상업 키워드를 포함하는 사이트맵을 생성하여 하나 이상의 검색엔진들로 제공하는 사이트맵 생성부를 포함하고,
상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함된 경우 상기 결정된 상업 키워드에 대응되는 광고를 상기 콘텐츠에 매칭시키기 아니하며, 상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함되지 않은 경우 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함되도록 처리하는 온라인 콘텐츠의 키워드 기반 광고 매칭 시스템.
An indexing unit for indexing the online contents to generate content indexing data;
A keyword extracting unit for extracting at least one main keyword from the indexing data and determining at least one word associated with the extracted main keywords as a commercial keyword among a plurality of words preset for advertisement matching; And
A site map generating unit for generating a site map including the extracted main keywords and the determined commercial keywords and providing the generated site map to one or more search engines,
Wherein if the extracted main keywords include a word of a negative image, the advertisement corresponding to the determined commercial keyword is not matched to the content, and if the extracted main keywords do not include a word of negative image, Wherein the advertisement processing unit processes an advertisement corresponding to a keyword to be included in the content.
제9항에 있어서, 상기 인덱싱 데이터는
콘텐츠 제목, 콘텐츠 생성 날짜, 콘텐츠 저자, 콘텐츠 내용, 콘텐츠 게시 URL, 콘텐츠 게시 웹사이트명, 콘텐츠에 포함된 이미지 및 동영상 메타 데이터 중 적어도 하나를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 시스템.
10. The method of claim 9, wherein the indexing data
A system for keyword-based advertisement matching of online content comprising at least one of a content title, a content creation date, a content author, a content content, a content publishing URL, a content publishing website name, an image included in the content, and video metadata.
제9항에 있어서, 상기 키워드 추출부는
상기 인덱싱 데이터로부터 복수의 단어들을 추출하고, 상기 추출된 복수의 단어들 각각에 대하여 상기 단어가 콘텐츠의 제목 및 본문 중 어느 부분에 포함되어 있는지 여부에 따라 차등적으로 점수를 부여하여 상기 주요 키워드를 추출하는 온라인 콘텐츠의 키워드 기반 광고 매칭 시스템.
The method of claim 9, wherein the keyword extracting unit
Extracting a plurality of words from the indexing data and assigning a score to each of the plurality of extracted words in accordance with whether the word is contained in a title and a body part of the content, Keyword - based ad matching system of extracted online contents.
제9항에 있어서, 상기 키워드 추출부는
상기 광고 매칭을 위해 사전 설정된 복수의 단어들 중 상기 주요 키워드의 상위 개념에 해당하는 단어를 상기 상업 키워드로 결정하는 온라인 콘텐츠의 키워드 기반 광고 매칭 시스템.
The method of claim 9, wherein the keyword extracting unit
And a word corresponding to an upper concept of the main keyword among a plurality of words preset for the advertisement matching is determined as the commercial keyword.
삭제delete 삭제delete
KR1020140139018A 2014-10-15 2014-10-15 Advertisement matching method for online contents based on keyword and advertisement matching system thereof KR101545454B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140139018A KR101545454B1 (en) 2014-10-15 2014-10-15 Advertisement matching method for online contents based on keyword and advertisement matching system thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140139018A KR101545454B1 (en) 2014-10-15 2014-10-15 Advertisement matching method for online contents based on keyword and advertisement matching system thereof

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
KR1020130056733A Division KR101518488B1 (en) 2013-05-20 2013-05-20 Value enhancing method and system of online contents

Publications (2)

Publication Number Publication Date
KR20140137327A KR20140137327A (en) 2014-12-02
KR101545454B1 true KR101545454B1 (en) 2015-08-19

Family

ID=52457212

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140139018A KR101545454B1 (en) 2014-10-15 2014-10-15 Advertisement matching method for online contents based on keyword and advertisement matching system thereof

Country Status (1)

Country Link
KR (1) KR101545454B1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102488914B1 (en) * 2020-03-30 2023-01-16 주식회사 메디치소프트 Method, Device and Program for extract keywords from contents and recommend contents using extracted kewords

Also Published As

Publication number Publication date
KR20140137327A (en) 2014-12-02

Similar Documents

Publication Publication Date Title
Kang et al. Modeling user interest in social media using news media and wikipedia
US9436768B2 (en) System and method for pushing and distributing promotion content
CN103914478A (en) Webpage training method and system and webpage prediction method and system
Marine-Roig Online travel reviews: A massive paratextual analysis
JP5442401B2 (en) Behavior information extraction system and extraction method
US20200004792A1 (en) Automated website data collection method
US20130132209A1 (en) Generating an advertising campaign
JP2008097351A (en) Advertisement distribution device and program
KR101518488B1 (en) Value enhancing method and system of online contents
WO2011062598A1 (en) System and method for automated filtering of reviews for marketability
US20150100877A1 (en) Method or system for automated extraction of hyper-local events from one or more web pages
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
US20140012803A1 (en) Event analysis apparatus, event analysis method, and computer-readable recording medium
Zhu et al. Real-time personalized twitter search based on semantic expansion and quality model
CN112989824A (en) Information pushing method and device, electronic equipment and storage medium
JP4743766B2 (en) Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program
Kim et al. A user opinion and metadata mining scheme for predicting box office performance of movies in the social network environment
Itani Sentiment analysis and resources for informal Arabic text on social media
KR20230046041A (en) Keyword based online advertisement matching system and online advertisement method
KR101545454B1 (en) Advertisement matching method for online contents based on keyword and advertisement matching system thereof
KR101614843B1 (en) The method and judgement apparatus for detecting concealment of social issue
Zhang et al. Product-oriented review summarization and scoring
Santoso et al. An Ontological Crawling Approach for Improving Information Aggregation over eGovernment Websites.
KR101628511B1 (en) Search Engine Optimization and Server thereof
Piotrkowicz Modelling social media popularity of news articles using headline text

Legal Events

Date Code Title Description
A107 Divisional application of patent
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20190626

Year of fee payment: 5