KR20230046041A - Keyword based online advertisement matching system and online advertisement method - Google Patents

Keyword based online advertisement matching system and online advertisement method Download PDF

Info

Publication number
KR20230046041A
KR20230046041A KR1020210129032A KR20210129032A KR20230046041A KR 20230046041 A KR20230046041 A KR 20230046041A KR 1020210129032 A KR1020210129032 A KR 1020210129032A KR 20210129032 A KR20210129032 A KR 20210129032A KR 20230046041 A KR20230046041 A KR 20230046041A
Authority
KR
South Korea
Prior art keywords
content
keywords
keyword
indexing
advertisement
Prior art date
Application number
KR1020210129032A
Other languages
Korean (ko)
Inventor
김영태
Original Assignee
김영태
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 김영태 filed Critical 김영태
Priority to KR1020210129032A priority Critical patent/KR20230046041A/en
Publication of KR20230046041A publication Critical patent/KR20230046041A/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0277Online advertisement

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Game Theory and Decision Science (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Data Mining & Analysis (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

The present invention relates to a keyword-based advertisement matching method of online content and an advertisement matching system using the same. The method includes the steps of: indexing online content to generate content indexing data; extracting one or more primary keywords from the indexing data; filtering words of negative images among the extracted main keywords; determining one or more commercial keywords related to the primary keywords obtained by filtering the words of negative images; and processing an advertisement corresponding to the determined commercial keyword to be included in the content.

Description

키워드 기반 온라인 광고 매칭 시스템 및 온라인 광고 방법{KEYWORD BASED ONLINE ADVERTISEMENT MATCHING SYSTEM AND ONLINE ADVERTISEMENT METHOD}Keyword-based online advertisement matching system and online advertisement method {KEYWORD BASED ONLINE ADVERTISEMENT MATCHING SYSTEM AND ONLINE ADVERTISEMENT METHOD}

본 발명은 키워드 기반 온라인 광고 매칭 시스템 및 온라인 광고 방법에 관한 것이다.The present invention relates to a keyword-based online advertisement matching system and an online advertisement method.

정보통신 기술의 발달에 따라서 온라인을 기반으로 하는 콘텐츠 제작이 활발해지고 있다. 다양한 웹 사이트 운영자들은 뉴스기사, 칼럼, 블로깅, 동영상 등의 다양한 온라인 콘텐츠를 제작하여 해당 콘텐츠에 광고를 게재시키고, 사이트 방문자들이 콘텐츠에 포함된 광고를 클릭함으로써 광고수익을 발생시키고 있다. BACKGROUND OF THE INVENTION [0002] With the development of information and communication technology, online-based content creation is becoming more active. Various website operators produce various online contents such as news articles, columns, blogging, and videos, post advertisements in the contents, and generate advertisement revenue when site visitors click advertisements included in the contents.

따라서, 콘텐츠 생산자 입장에서는 광고효율을 높이기 위해 콘텐츠를 많은 대중에게 노출시켜야 하고, 이를 위해서는 검색엔진 최적화와 같은 콘텐츠 유통이 중요해지고 있다.Therefore, content producers need to expose content to a large public in order to increase advertising efficiency, and to this end, content distribution such as search engine optimization is becoming important.

구글과 같은 일반 검색 사이트의 경우에는 검색 엔진들이 크롤링을 통해서 온라인 콘텐츠들을 사전에 수입하고, 검색어가 입력되면 수집된 콘텐츠 중에서 대응되는 자료를 출력하는 방식을 취하는데, 이 경우, 자신의 콘텐츠가 실제로 검색 엔진에 의해서 검색되지 않는 경우가 많고, 검색이 되는 경우에도 실제로 시간이 지남에 따라서 검색 순위에서 밀려 검색을 수행한 일반인들의 주목을 받을 수 없는 경우가 많다.In the case of a general search site such as Google, search engines import online contents in advance through crawling, and when a search word is entered, the corresponding data is output from the collected contents. In this case, their contents are actually In many cases, it is not searched by search engines, and even if it is searched, it is often pushed out of the search ranking over time and cannot attract the attention of the general public who performed the search.

이 뿐만 아니라, 콘텐츠 생산자들은 자신들의 콘텐츠가 검색엔진에 의해서 검색된다 하더라도, 실제로 검색된 결과에 의해서 자신의 웹 사이트에 트래픽이 증가했는지, 자신의 콘텐츠가 얼마나 소비되고 있으며, 웹사이트 또는 콘텐츠에 포함된 광고들이 얼마나 클릭되고 있는지에 대한 정보를 얻을 수 없는 한계가 있었다.In addition to this, even if their content is searched by search engines, content producers can find out whether the traffic to their website has increased as a result of the actual search, how much their content is being consumed, and what content is included in the website or content. There was a limit to getting information about how many ads were clicked.

따라서, 생산된 콘텐츠를 더 많은 사람들에게 노출시키고, 이에 포함된 광고가 함께 소비자들에게 노출되어 콘텐츠로 인해서 수익이 창출되도록 함으로써, 콘텐츠의 가치를 향상시키고, 이러한 콘텐츠 가치 향상을 평가할 수 있는 방법 및 시스템이 절실히 요구되고 있다.Therefore, a method for improving the value of the content and evaluating this improvement in the value of the content by exposing the produced content to more people, and exposing the advertisement included in it to consumers together to generate revenue from the content, and The system is desperately needed.

본 발명이 해결하고자 하는 과제는 온라인 콘텐츠에 적합한 광고가 해당 콘텐츠에 포함되도록 하는 키워드 기반 광고 매칭 방법 및 시스템을 제공하는 것이다.An object to be solved by the present invention is to provide a method and system for matching advertisements based on keywords so that advertisements suitable for online contents are included in the corresponding contents.

상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠의 키워드 기반 광고 매칭 방법은, 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 단계; 상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하는 단계; 상기 추출된 주요 키워드들 중 부정적 이미지의 단어를 필터링하는 단계; 상기 부정적 이미지의 단어가 필터링된 주요 키워드들과 관련된 하나 이상의 상업 키워드를 결정하는 단계; 및 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함될 수 있도록 처리하는 단계를 포함한다.A keyword-based advertisement matching method for online content according to a preferred embodiment of the present invention for solving the above problems includes generating content indexing data by performing indexing on online content; extracting one or more primary keywords from the indexing data; filtering negative image words from among the extracted main keywords; determining one or more commercial keywords related to key keywords from which words of the negative image are filtered out; and processing an advertisement corresponding to the determined commercial keyword to be included in the content.

한편, 상술한 과제를 해결하기 위한 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠의 키워드 기반 광고 매칭시스템은, 온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 인덱싱부; 및 상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하고, 상기 추출된 주요 키워드들 중 부정적 이미지의 단어를 필터링하며, 상기 부정적 이미지의 단어가 필터링된 주요 키워드들과 관련된 하나 이상의 상업 키워드를 결정하는 키워드 추출부를 포함하고, 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함될 수 있도록 처리한다.Meanwhile, a keyword-based advertisement matching system for online content according to a preferred embodiment of the present invention for solving the above problems includes an indexing unit generating content indexing data by performing indexing on online content; And keyword extraction for extracting one or more main keywords from the indexing data, filtering words of a negative image among the extracted main keywords, and determining one or more commercial keywords related to the main keywords from which the words of the negative image are filtered. and processing so that an advertisement corresponding to the determined commercial keyword can be included in the content.

한편, 상기 온라인 콘텐츠의 키워드 기반 광고 매칭 방법은 컴퓨터에서 실행시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체로 구현될 수 있다.Meanwhile, the keyword-based advertisement matching method of online content may be implemented in a computer-readable recording medium on which a program to be executed by a computer is recorded.

본 발명은 콘텐츠를 인덱싱하여 인덱싱 데이터를 생성하고, 인덱싱 데이터로부터 주요 키워드를 추출하고 구문을 요약한 후, 인덱싱 데이터와 키워드를 포함하는 사이트맵을 생성하여 검색 엔진들로 제공함으로써, 사용자의콘텐츠를 보다 효율적으로 검색 엔진을 통해서 일반인들에게 노출시킬 수 있는 효과가 있다.The present invention indexes content to generate indexing data, extracts main keywords from the indexing data, summarizes syntax, and then creates a sitemap including the indexing data and keywords and provides them to search engines, so that users' content is searched for. There is an effect that can be exposed to the general public through search engines more efficiently.

또한, 본 발명은 콘텐츠 사이트맵을 검색엔진에 제공한 후, 콘텐츠로부터 추출된 키워드를 이용하여 주기적으로 해당 검색 엔진에 검색을 수행하여 검색 순위를 확인하고, 검색 순위와 해당 콘텐츠를 생성한 웹 사이트의 접속 로그를 분석하여, 콘텐츠별로 유발된 트래픽의 양과 각 콘텐츠별 광고 효과 및 수익성을 분석할 수 있을 뿐만 아니라, 콘텐츠 생산자별로 유발된 트래픽의 양과 광고 효과 및 수익성을 분석할 수 있다.In addition, the present invention provides a content sitemap to a search engine, and then periodically searches the search engine using keywords extracted from the content to check the search ranking, and the search ranking and the website that generated the corresponding content. By analyzing the access log of , it is possible to analyze the amount of traffic generated by each content and the advertising effect and profitability of each content, as well as the amount of traffic generated by each content producer, and the advertising effect and profitability.

본 발명의 또 다른 실시예에 따르면, 상기 인덱싱 데이터로부터 추출되는 주요 키워드들 중에서 부정적 이미지의 단어를 필터링한 후 광고 매칭을 위한 상업 키워드를 결정함으로써, 콘텐츠 내의 부정적 이미지의 단어와 연관된 광고가 콘텐츠에 포함되지 않도록 하여, 콘텐츠에 적합한 광고가 노출되도록 할 수 있다.According to another embodiment of the present invention, commercial keywords for advertisement matching are determined after filtering negative image words from among the main keywords extracted from the indexing data, so that advertisements associated with negative image words in the content are added to the content. By not including it, an advertisement suitable for the content can be exposed.

도 1은 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 시스템의 구성을 도시하는 도면이다.
도 2는 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 방법을 설명하는 흐름도이다.
도 3은 본 발명의 바람직한 실시예에 따라서 인덱싱부가 생성한 인덱싱 데이터의 일 예를 도시하는 도면이다.
도 4a 및 도 4b는 본 발명의 바람직한 실시예에 따른 사이트 맵의 일 예를 도시한 도면이다.
1 is a diagram showing the configuration of an online content value enhancement system using search engine optimization according to a preferred embodiment of the present invention.
2 is a flowchart illustrating a method for enhancing the value of online content using search engine optimization according to a preferred embodiment of the present invention.
3 is a diagram showing an example of indexing data generated by an indexing unit according to a preferred embodiment of the present invention.
4A and 4B are diagrams showing an example of a site map according to a preferred embodiment of the present invention.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예들을 설명한다.Hereinafter, preferred embodiments of the present invention will be described with reference to the accompanying drawings.

[0016] 도 1은 본 발명의 바람직한 실시예에 따른, 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 시스템(이하,“온라인 콘텐츠 가치 향상 시스템”으로 약칭함)의 구성을 도시하는 도면이고, 도 2는 본 발명의 바람직한 실시예에 따른 검색 엔진 최적화를 이용한 온라인 콘텐츠 가치 향상 방법(이하, “온라인 콘텐츠 가치 향상 방법”으로 약칭함)을 설명하는 흐름도이다.1 is a diagram showing the configuration of an online content value enhancement system using search engine optimization (hereinafter, abbreviated as “online content value enhancement system”) according to a preferred embodiment of the present invention, and FIG. 2 is A flowchart illustrating a method for enhancing the value of online contents using search engine optimization (hereinafter, abbreviated as “method for enhancing the value of online contents”) according to a preferred embodiment of the present invention.

도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 온라인 콘텐츠 가치 향상 시스템은, 인덱싱부(110), 키워드 추출부(120), 사이트맵 생성부(130), 인덱싱 모니터링부(140) 및 분석부(150)를 포함한다.Referring to FIG. 1, the online content value enhancement system according to a preferred embodiment of the present invention includes an indexing unit 110, a keyword extraction unit 120, a site map generation unit 130, an indexing monitoring unit 140, and an analysis unit. Includes section 150.

도 2를 더 참조하여, 각 구성 요소의 기능을 설명하면, 먼저, 인덱싱부(110)는 복수의 웹사이트로부터 콘텐츠를 수신한다(S210).Referring further to FIG. 2, the function of each component is described. First, the indexing unit 110 receives content from a plurality of websites (S210).

복수의 웹 사이트는 일반 온라인 쇼핑몰, 뉴스 기사를 제공하는 언론사 웹사이트, 인터넷 포털 사이트, 개인의 블로그 사이트, 개인들의 커뮤니티 웹사이트 등 인터넷을 통해서 콘텐츠를 제공할 수 있는 사이트라면 그 제한이 없다.The plurality of websites are not limited as long as they can provide content through the Internet, such as general online shopping malls, media websites providing news articles, Internet portal sites, individual blog sites, and individual community websites.

또한, 콘텐츠도 단순힌 텍스트, 이미지, 동영상 중 어느 하나만으로 구성된 콘텐츠일 수도 있고, 그 내부에 텍스트와 이미지, 텍스트와 동영상, 또는 이들 모두를 포함하는 것일 수도 있다.In addition, the content may be content composed of only one of simple text, image, and video, or may include text and image, text and video, or both.

인덱싱부(110)는 수신된 콘텐츠에 대해서 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하여 키워드 추출부(120)로 출력한다(S220).The indexing unit 110 performs indexing on the received content, generates content indexing data, and outputs it to the keyword extractor 120 (S220).

도 3은 본 발명의 바람직한 실시예에 따라서 인덱싱부(110)가 생성한 인덱싱 데이터의 일 예를 도시하는 도면이다. 도 3에 도시된 바와 같이, 본 발명의 인덱싱 데이터는 콘텐츠 제목, 콘텐츠 생성 날짜, 콘텐츠 저자, 콘텐츠 내용, 콘텐츠 게시 URL, 콘텐츠 게시 웹사이트명 또는 기관, 콘텐츠에 포함된 이미지 및 동영상 메타 데이터 등 다양한 정보들 중 하나 이상을 포함한다.3 is a diagram showing an example of indexing data generated by the indexing unit 110 according to a preferred embodiment of the present invention. As shown in FIG. 3, the indexing data of the present invention includes various contents such as content title, content creation date, content author, content content, content posting URL, content posting website name or agency, and image and video metadata included in the content. contains one or more of the information.

도 3에 도시된 인덱싱 데이터에는 콘텐츠 제목(아빠 어디가’엄마들, 아이들 예쁜 이유는 엄마 유전자 덕분), 날짜(2013-02-25), 저자(국민일보 쿠키뉴스팀), 콘텐츠 내용(MBC 예능 프로그램~), URL(http://news.kukinews.com/article/view~), 기관(국민일보), 카테고리(연예), 키워드(아빠 어디가) 등의 인덱싱 데이터를 포함하는 것을 알 수 있다.The indexing data shown in Figure 3 includes the title of the content (Where are you going 'Dad' mothers, the reason why children are beautiful is because of their mother's genes), date (2013-02-25), author (Kookmin Ilbo Cookie News Team), content content (MBC entertainment program ~), URL (http://news.kukinews.com/article/view~), agency (Kookmin Ilbo), category (Entertainment), and keyword (Where are you going, Dad)?

키워드 추출부(120)는 인덱싱부(110)로부터 입력된 인덱싱 데이터로부터 주요 키워드를 추출하고, 주요 키워드를 이용하여 상업 키워드로 추가로 추출하며, 본문 내용을 요약하여, 주요 키워드, 상업 키워드 및 본문 내용 요약을 사이트맵 생성부(130)로 출력한다(S230).The keyword extraction unit 120 extracts the main keywords from the indexing data input from the indexing unit 110, additionally extracts them as commercial keywords using the main keywords, and summarizes the contents of the main text, the main keywords, the commercial keywords and the body. The content summary is output to the site map generator 130 (S230).

키워드 추출부(120)는 형태소 분석 알고리즘에 따라서 인덱싱 데이터에서 추출된 각 단어들에 대하여 아래의 5가지 조건에 따라서 점수를 차등적으로 부여하여 누적함으로써, 주요 키워드를 추출한다.The keyword extraction unit 120 extracts main keywords by accumulating scores by differentially assigning scores according to the following five conditions to each word extracted from the indexing data according to a morpheme analysis algorithm.

제 1 조건은 단어들이 제목에서 추출되었는지 또는 본문에서 추출되었는지에 따라서 차등으로 점수를 부여한다. 일반적으로 제목에 포함된 단어일수록 주요 키워드일 가능성이 높으므로, 제목에서 추출된 단어에 본문 내용에서 추출된 단어보다 높은 점수를 부여한다.In the first condition, scores are given differently depending on whether the words are extracted from the title or the text. In general, words included in the title are more likely to be key keywords, so words extracted from the title are given a higher score than words extracted from the text.

제 2 조건은 본문내에서 제목에서 추출된 단어가 발견된 경우, 또는 본문내에서 제목에서 추출된 단어가 발견된경우에 해당 단어에 인접한 위치의 단어에 점수를 부여한다. 이 경우, 전자의 경우 더 높은 점수를 부여할 수 있다.In the second condition, when a word extracted from the title is found in the text or when a word extracted from the title is found in the text, a score is given to a word adjacent to the corresponding word. In this case, a higher score can be given in the case of the former.

[0028] 도 3의 경우를 예를 들면, 기사 제목인 [‘아빠 어디가’ 엄마들, 아이들 예쁜 이유는 엄마 유전자 덕분]에서, 주요 키워드로서 아빠, 어디가, 엄마, 아이, 유전자 등이 높은 점수를 부여받는 단어로서 추출된다. 아울러, 기사 내용 중에서 제목에서 추출된 주요 키워드에 인접한 단어를 순차적으로 검색하여 점수를 부여한다. 도 3의 예에서, “엄마”라는 키워드의 인접한 단어를 찾는 과정을 설명하면, 본문 중 [~ 최근 한 온라인 커뮤니티 게시판에는 ‘아빠 어디가 엄마들 미모’라는 제목아래 여러 장의 사진이 올라왔다~]에서, 검색 대상 키워드인 “엄마” 가 발견되고, “엄마”에 대해 앞/뒤 소정수의 인접한 단어(예컨대, 2 단어)를 탐색한다. 이 경우, “아빠 어디가 엄마들 미모라는 제목아래”라는 구문이 추출되고, 여기서 “엄마” 앞의 2단어에 포함되는 “아빠”, “어디가”, “엄마” 뒤의 2단어에 포함되는 “미모”, “제목”이 추출되어 점수를 부여받게 된다.[0028] For example, in the case of FIG. 3, in the article title ['Where are you going, Dad' mothers, the reason why children are beautiful is because of mother genes], the main keywords such as dad, where are you going, mom, child, gene, etc. have high scores. It is extracted as a given word. In addition, words adjacent to the main keywords extracted from the title are sequentially searched for in the article contents and scores are given. In the example of FIG. 3, explaining the process of finding words adjacent to the keyword “mom”, in the text [~ Recently, several photos were uploaded on an online community bulletin board under the title ‘Dad, where are the mothers’ beauty’~] , “mom”, which is a search target keyword, is found, and a predetermined number of adjacent words (eg, 2 words) before and after “mom” are searched for. In this case, the phrase "Dad, where are the mothers' beauty" is extracted, and here, "Dad" included in the two words before "Mom", "Where are you going", and "Mimo" included in the two words after "Mom" ”, “title” is extracted and given points.

제 3 조건은 단어가 존재하는 본문내의 위치에 따라서 차등적으로 점수를 부여한다. 단어가 본문내에서 서론(문서 크기의 상위 25% 미만), 본론 (문서 크기의 상위 25% 이상 75% 미만), 결론(문서 크기의 상위 75% 이상) 중 어디에 위치하느냐에 따라서 차등적으로 점수를 부여한다. 본 발명의 바람직한 실시예에서는 결론에 위치한 키워드에 대해서 보다 높은 점수를 부여하였으나, 이는 콘텐츠의 전개 방식에 따라서 조절될 수 있다. 예컨대, 두괄식 문장의 경우에는 서론 부분에 위치하는 단어에 대해서 더 높은 점수를 부여할 수 있다.The third condition gives a score differentially according to the position in the text where the word exists. Scores are differentially assigned depending on where the words are located in the body: introduction (less than the top 25% of the document size), body (more than 25% of the document size and less than 75% of the document size), and conclusion (more than the top 75% of the document size). grant In a preferred embodiment of the present invention, a higher score is given to a keyword located in the conclusion, but this can be adjusted according to the development method of the content. For example, in the case of a two-headed sentence, a higher score may be given to a word located in the introductory part.

제 4 조건은 단어 빈도에 따라서 가중치를 부여한다. 자주 반복되는 단어일수록 중요 단어일 수 있으므로 높은 점수를 부여하되, 전체 단어 수 대비 일정 수준 이상의 빈도가 되면, 해당 콘텐츠는 오히려 스팸 문서의 가능성이 있으므로 오히려 역의 가중치를 준다.The fourth condition assigns weights according to word frequency. Since frequently repeated words may be important words, a high score is given, but if the frequency exceeds a certain level relative to the total number of words, the corresponding content is rather likely to be a spam document, so a reverse weight is given.

제 5 조건은 해당 콘텐츠가 속하는 카테고리의 주요 키워드로 사전에 분류된 주요 키워드 셋이 존재하고, 이에 해당하는 단어인 경우 또는 동일 카테고리의 동일한 날짜의 이전에 분석된 다른 문서의 주요 키워드와 동일한 단어에 대해서는 점수를 부여한다.The fifth condition is when there are three main keywords classified in advance as the main keywords of the category to which the corresponding content belongs, and the corresponding words exist, or in the same word as the main keywords of other previously analyzed documents of the same category on the same date. points are awarded for

본문 내용으로부터 주요 키워드가 추출되면, 키워드 추출부(120)는 추출된 주요 키워드를 이용하여 상업 키워드를 추가로 추출한다. 상업 키워드는 추출된 주요 키워드의 상위 개념 또는 밀접하게 연관성 있다고 사전에 설정된 단어로서 결정될 수 있는데, 해당 콘텐츠가 주요 키워드 뿐만 아니라 상업 키워드의 검색 과정에서도 검색될 수 있도록 하며, 해당 상업 키워드와 관련된 광고가 해당 콘텐츠에 포함될 수 있도록 한다.When the main keyword is extracted from the text, the keyword extraction unit 120 additionally extracts commercial keywords using the extracted main keyword. The commercial keyword may be determined as a superordinate concept of the extracted main keyword or a word set in advance to be closely related, so that the content can be searched in the search process of the commercial keyword as well as the main keyword, and advertisements related to the commercial keyword to be included in the content.

예컨대, 주요 키워드로 “이효리”, “섹시”, “댄스”라는 주요 키워드가 추출되면, 키워드 추출부(120)는 주요 키워드로부터 상업 키워드로서 “다이어트”를 추출될 수 있다. 이 경우, 해당 콘텐츠는 다이어트 상품 광고를 포함할 수 있고, 이효리, 섹시, 댄스를 검색하는 사용자뿐만 아니라, 다이어트를 검색하는 사용자들에게도 노출될 수 있다.For example, when main keywords such as “Lee Hyo-ri”, “sexy”, and “dance” are extracted as main keywords, the keyword extractor 120 may extract “diet” as a commercial keyword from the main keywords. In this case, the corresponding content may include advertisements for diet products, and may be exposed to users who search for diet as well as users who search for Hyori Lee, Sexy, and Dance.

아울러, 주요 키워드로 “태국”, “저가항공”이 추출되는 경우에는, 이와 연관하여 “여행”, “태국 호텔”등의 상업 키워드가 추출될 수 있으나, 주요 키워드로 “태국”, “저가 항공”, “추락”이 함께 추출되는 경우, “추락”이라는 부정적 이미지의 단어를 필터링하여 해당 콘텐츠에 상업 키워드에 대응되는 광고가 포함되지 않도록 할 수 있다. 한편, 사이트맵 생성부(130)는 인덱싱부(110)로부터 입력된 인덱싱 데이터 및 키워드 추출부(120)로부터 입력된 주요 키워드, 및 상업 키워드를 이용하여 사이트맵을 생성하고(S240), 생성된 사이트맵을 복수의 검색 엔진으로 제공한다(S250). 도 4a 및 도 4b는 본 발명의 바람직한 실시예에 따른 사이트 맵의 일 예를 도시한 도면이다. 도 4a에는 일반 사이트에서 제공하는 콘텐츠에 대한 사이트 맵이 도시되어 있고, 도 4b에는 뉴스 콘텐츠에 대한 사이트맵이 도시되어 있다.In addition, when “Thailand” and “low-cost airline” are extracted as the main keywords, commercial keywords such as “travel” and “Thailand hotel” can be extracted in relation to this, but “Thailand” and “low-cost airline” as the main keywords. ” and “fall” are extracted together, it is possible to filter out the word “fall” of a negative image so that the corresponding content does not include an advertisement corresponding to a commercial keyword. Meanwhile, the sitemap generation unit 130 generates a sitemap using the indexing data input from the indexing unit 110, the main keyword input from the keyword extraction unit 120, and commercial keywords (S240), The sitemap is provided to a plurality of search engines (S250). 4A and 4B are diagrams showing an example of a site map according to a preferred embodiment of the present invention. FIG. 4A shows a site map for content provided by a general site, and FIG. 4B shows a site map for news content.

도 4a 및 도 4b에 도시된 바와 같이, 사이트 맵은 검색 엔진에서 활용할 수 있도록 원본 이미지 데이터 및 동영상 데이터의 링크 정보, 뉴스 발행 기관, 뉴스 발행 날짜, 주요 키워드, 상업 키워드 등의 정보를 포함할 수 있다. 사이트 맵 자체는 국제적으로 표준화된 양식에 따라서 생성될 수도 있다.As shown in FIGS. 4A and 4B , the site map may include information such as link information of original image data and video data, news publishing organization, news publication date, major keywords, commercial keywords, etc. for use in search engines. there is. The site map itself may be created according to an internationally standardized format.

인덱싱 모니터링부(140)는 특정 콘텐츠의 사이트맵이 검색 엔진들로 제공된 사실을 사이트맵 생성부(130)로부터 통지받고, 사이트맵 생성부(130) 또는 키워드 추출부(120)로부터 제공받은 주요 키워드 및 상업 키워드를 이용하여, 일정한 시간 주기로 사이트맵을 제공받은 복수의 검색 엔진에서 검색을 수행하여 콘텐츠의 검색 순위를 조사하고, 조사 결과를 분석부(150)로 출력한다(S260).The indexing monitoring unit 140 receives notification from the sitemap generator 130 that a sitemap of specific content is provided to search engines, and the main keywords provided from the sitemap generator 130 or the keyword extractor 120. And, using commercial keywords, a search is performed in a plurality of search engines provided with a site map at regular time intervals to investigate the search ranking of content, and the search result is output to the analyzer 150 (S260).

분석부(150)는 상기 검색 순위 및 상기 웹사이트에 유발된 트래픽의 접속 로그를 분석하여 트래픽별 광고 효과 및 이로 인한 수익성을 분석한다(S270).The analysis unit 150 analyzes the search rank and the access log of the traffic induced on the website to analyze the advertisement effect for each traffic and the resulting profitability (S270).

예를 들면, 분석부(150)는 사이트맵에 포함된 해당 주요 키워드 또는 상업 키워드의 검색 순위에 대비한 트래픽 유발 정도를 분석하여 트래픽 유발 효율을 분석할 수 있다. 또한, 분석부(150)는 각 트래픽 접속 로그를 분석하여 각 트래픽이 어떤 검색 엔진을 통해서 해당 웹사이트에 접속하였는지 여부를 조사할 수 있으며, 접속한 후, 해당 콘텐츠에 포함된 다수의 광고들 중 어떤 광고를 선택하였는지 여부를 조사하여 분석할 수 있다.For example, the analysis unit 150 may analyze traffic generation efficiency by analyzing the degree of traffic generation in comparison to the search ranking of the corresponding main keyword or commercial keyword included in the sitemap. In addition, the analyzer 150 analyzes each traffic access log to investigate whether or not each traffic accessed the corresponding website through which search engine, and after accessing, among a plurality of advertisements included in the corresponding content. It can be analyzed by examining whether or not which advertisement was selected.

특히, 광고 분석 과정에서, 분석부(150)는 사용자가 선택한 광고의 위치(상단 광고, 하단 광고, 측면 광고 등), 광고의 형태(배터 광고, 팝업 광고 등) 등에 대한 분석을 수행할 수 있고, 이를 이용하여 광고의 수익성을 분석 할 수 있다.In particular, in the advertisement analysis process, the analyzer 150 may analyze the location of the advertisement selected by the user (top advertisement, bottom advertisement, side advertisement, etc.), type of advertisement (batter advertisement, pop-up advertisement, etc.), etc. , it can be used to analyze the profitability of advertisements.

아울러, 분석부(150)는 특정 콘텐츠에 대한 분석을 수행할 뿐만 아니라, 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서도 종합적으로 분석을 수행할 수 있다.In addition, the analyzer 150 may not only analyze specific content, but also comprehensively analyze a plurality of content generated in the corresponding website.

특히, 분석부(150)는 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서 각 콘텐츠별로 유발된 트래픽 양과, 각 콘텐츠별 광고 효과를 분석하여, 어떠한 종류의 콘텐츠가 대중의 관심을 받았는지 여부를 분석할 수 있고, 유통된 콘텐츠별 수익 분석을 통해 콘텐츠당 수익을 확인하고 콘텐츠 생산에 소요되는 예산에 반영할 수 있다(S280).In particular, the analyzer 150 analyzes the amount of traffic generated for each content and the advertising effect for each content for a plurality of content generated on the website, and analyzes what type of content has received public attention. It is possible to check the profit per content through the analysis of the profit per distributed content and reflect it in the budget required for producing the content (S280).

또한, 분석부(150)는 해당 웹 사이트에서 생성된 복수의 콘텐츠에 대해서, 복수의 콘텐츠를 생산한 생산자(저자)별로 유발된 트래픽 양과 각 콘텐츠별 광고 효과를 분석함으로써, 콘텐츠 생산자별 수익 현황을 비교분석하고 사이트의 콘텐츠 생산 원가 대비 수익을 분석할 수 있다(S290).In addition, the analyzer 150 analyzes the amount of traffic generated by each producer (author) who produced the plurality of contents and the advertising effect for each content for the plurality of contents generated on the corresponding website, thereby determining the current status of revenue for each content producer. It is possible to compare and analyze the site's content production cost versus profit (S290).

상기 도 2를 참조하여 설명한 온라인 콘텐츠 가치 향상 방법에서는, 설명의 편의를 위하여, 제 S280 단계 및 제S290 단계가 순차적으로 수행되는 것으로 설명하였으나, 제 S280 단계 및 제 S290 단계는 동시에 수행되거나 역의 순서로 수행될 수 있음은 물론이다.In the online content value enhancement method described above with reference to FIG. 2, for convenience of description, steps S280 and S290 have been described as sequentially performed, but steps S280 and S290 are performed simultaneously or in reverse order. Of course, it can be performed as

본 발명은 또한 컴퓨터로 읽을 수 있는 기록매체에 컴퓨터가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 컴퓨터가 읽을 수 있는 기록매체는 컴퓨터 시스템에 의하여 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 컴퓨터가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플라피디스크, 광데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다. 또한 컴퓨터가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다.The present invention can also be implemented as computer readable codes on a computer readable recording medium. A computer-readable recording medium includes all types of recording devices in which data that can be read by a computer system is stored. Examples of computer-readable recording media include ROM, RAM, CD-ROM, magnetic tape, floppy disk, optical data storage device, etc. also includes In addition, the computer-readable recording medium is distributed in computer systems connected through a network, so that computer-readable codes can be stored and executed in a distributed manner.

이제까지 본 발명에 대하여 그 바람직한 실시예들을 중심으로 살펴보았다. 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자는 본 발명이 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 변형된 형태로 구현될 수 있음을 이해할 수 있을 것이다. 그러므로 개시된 실시예들은 한정적인 관점이 아니라 설명적인 관점에서 고려되어야 한다. 본 발명의 범위는 전술한 설명이 아니라 특허청구범위에 나타나 있으며, 그와 동등한 범위 내에 있는 모든 차이점은 본 발명에 포함된 것으로 해석되어야 할 것이다.So far, the present invention has been looked at with respect to its preferred embodiments. Those skilled in the art to which the present invention pertains will be able to understand that the present invention can be implemented in a modified form without departing from the essential characteristics of the present invention. Therefore, the disclosed embodiments should be considered from an illustrative rather than a limiting point of view. The scope of the present invention is shown in the claims rather than the foregoing description, and all differences within the equivalent scope will be construed as being included in the present invention.

110 인덱싱부
120 키워드 추출부
130 사이트맵 생성부
140 인덱싱 모니터링부
150 분석부
110 indexing unit
120 keyword extraction unit
130 site map generator
140 indexing monitoring unit
150 analysis unit

Claims (1)

온라인 콘텐츠에 대해 인덱싱을 수행하여 콘텐츠 인덱싱 데이터를 생성하는 단계;
상기 인덱싱 데이터로부터 하나 이상의 주요 키워드들을 추출하는 단계;
광고 매칭을 위해 사전 설정된 복수의 단어들 중에서 상기 추출된 주요 키워드들과 연관된 적어도 하나의 단어를 상업 키워드로 결정하는 단계;
상기 추출된 주요 키워드들 및 상기 결정된 상업 키워드를 포함하는 사이트맵을 생성하여 하나 이상의 검색엔진들로 제공하는 단계; 및
상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함된 경우 상기 결정된 상업 키워드에 대응되는 광고를상기 콘텐츠에 매칭시키기 아니하며, 상기 추출된 주요 키워드들에 부정적 이미지의 단어가 포함되지 않은 경우 상기 결정된 상업 키워드에 대응되는 광고가 상기 콘텐츠에 포함되도록 처리하는 단계를 포함하는 온라인 콘텐츠의 키워드 기반 광고 매칭 방법.
indexing online content to generate content indexing data;
extracting one or more primary keywords from the indexing data;
determining at least one word associated with the extracted main keywords as a commercial keyword among a plurality of words preset for advertisement matching;
generating a sitemap including the extracted main keywords and the determined commercial keyword and providing the sitemap to one or more search engines; and
When the extracted main keywords include words of a negative image, advertisements corresponding to the determined commercial keywords are not matched to the content, and when the extracted main keywords do not include words of a negative image, the determined commercial keywords are not matched. A keyword-based advertisement matching method for online content, comprising processing an advertisement corresponding to a keyword to be included in the content.
KR1020210129032A 2021-09-29 2021-09-29 Keyword based online advertisement matching system and online advertisement method KR20230046041A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210129032A KR20230046041A (en) 2021-09-29 2021-09-29 Keyword based online advertisement matching system and online advertisement method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210129032A KR20230046041A (en) 2021-09-29 2021-09-29 Keyword based online advertisement matching system and online advertisement method

Publications (1)

Publication Number Publication Date
KR20230046041A true KR20230046041A (en) 2023-04-05

Family

ID=85884475

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210129032A KR20230046041A (en) 2021-09-29 2021-09-29 Keyword based online advertisement matching system and online advertisement method

Country Status (1)

Country Link
KR (1) KR20230046041A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102570419B1 (en) * 2023-05-08 2023-08-28 주식회사 참벗 Method and apparatus for assisting posting of advertising contens for easy posting system

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102570419B1 (en) * 2023-05-08 2023-08-28 주식회사 참벗 Method and apparatus for assisting posting of advertising contens for easy posting system
KR102674650B1 (en) * 2023-05-08 2024-06-12 주식회사 참벗 Easy posting system for automatically generating advertisement content
KR102674651B1 (en) * 2023-05-08 2024-06-12 주식회사 참벗 Method and apparatus for determining suitable tag for advertisement content in easy posting system

Similar Documents

Publication Publication Date Title
Kang et al. Modeling user interest in social media using news media and wikipedia
JP4940399B2 (en) Advertisement distribution apparatus and program
Marine-Roig Online travel reviews: A massive paratextual analysis
JP5442401B2 (en) Behavior information extraction system and extraction method
Geçkil et al. A clickbait detection method on news sites
US20150100877A1 (en) Method or system for automated extraction of hyper-local events from one or more web pages
KR101518488B1 (en) Value enhancing method and system of online contents
JP2011108053A (en) System for evaluating news article
KR100954842B1 (en) Method and System of classifying web page using category tag information and Recording medium using by the same
Serna et al. Towards a better understanding of the cognitive destination image of Euskadi-Basque Country based on the analysis of UGC
US20180315092A1 (en) Server For Providing Internet Content and Computer-Readable Recording Medium Including Implemented Internet Content Providing Method
Agarwal et al. Topical analysis of migration coverage during lockdown in India by mainstream print media
Kongthon et al. HotelOpinion: An opinion mining system on hotel reviews in Thailand
KR20230046041A (en) Keyword based online advertisement matching system and online advertisement method
Itani Sentiment analysis and resources for informal Arabic text on social media
CN104462241A (en) Population property classification method and device based on anchor texts and peripheral texts in URLs
Wu et al. Understanding customers using Facebook Pages: Data mining users feedback using text analysis
KR101105798B1 (en) Apparatus and method refining keyword and contents searching system and method
KR101545454B1 (en) Advertisement matching method for online contents based on keyword and advertisement matching system thereof
Dokoohaki et al. Mining divergent opinion trust networks through latent dirichlet allocation
Storey et al. Ontology creation: Extraction of domain knowledge from web documents
KR20220085219A (en) The method of filtering ads using youtube video metadata
KR101124213B1 (en) system of customized news-later service using ontology
KR101628511B1 (en) Search Engine Optimization and Server thereof
Al-Abdullatif et al. Using online hotel customer reviews to improve the booking process

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application