KR101791418B1 - 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 - Google Patents
키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 Download PDFInfo
- Publication number
- KR101791418B1 KR101791418B1 KR1020160016921A KR20160016921A KR101791418B1 KR 101791418 B1 KR101791418 B1 KR 101791418B1 KR 1020160016921 A KR1020160016921 A KR 1020160016921A KR 20160016921 A KR20160016921 A KR 20160016921A KR 101791418 B1 KR101791418 B1 KR 101791418B1
- Authority
- KR
- South Korea
- Prior art keywords
- keyword
- keywords
- quot
- frequency
- document
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 18
- 230000002860 competitive effect Effects 0.000 claims abstract description 35
- 238000004364 calculation method Methods 0.000 claims abstract description 24
- 230000000877 morphologic effect Effects 0.000 claims description 7
- 238000000605 extraction Methods 0.000 claims description 5
- 238000010187 selection method Methods 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 230000007774 longterm Effects 0.000 description 3
- 238000010845 search algorithm Methods 0.000 description 3
- 241000086550 Dinosauria Species 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 206010044565 Tremor Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G06F17/2755—
-
- G06F17/30864—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G06Q50/30—
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Marketing (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Operations Research (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
연관 키워드(ωi)의 경쟁력 산출방법은, 연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고, 연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고, 연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 단계;를 포함한다.
Description
본 발명은 키워드 기반 블로그 마케팅을 위한 키워드 선정에 관한 것으로서, 더 상세하게는 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템에 관한 것이다.
최근 스마트폰 보급과 함께 SNS(Social Network Service)와 온라인 매체의 영향력이 상승되고 있다.
특히 키워드 검색 포털 기반의 블로그는 소셜 네트워크의 기능은 물론, 단순한 개인 정보의 기록을 넘어서 정보의 원천이자 기업의 마케팅 수단으로 활용되고 있다.
블로그 마케팅의 영향에 대해 분석한 연구들에 다르면 블로그가 비교적 저렴한 비용에 비하여 파급효과가 크고 소비자에게 신회를 준다고 분석하고 있다. 디지털 마케팅의 가장 유효한 서비스를 조사한 결과에도 블로그가 1위(34%)를 차지했다.
블로그의 높은 영향력의 원인 중 주요한 하나는 포털 사이트들의 검색 결과에서 블로그 정보를 상위에 노출하기 때문이다. 이는 블로그의 정보성을 입증하는 결과라고 할 수 있다. 국내 최대 규모의 포털 사이트인 네이버와 다음은 키워드 기반의 검색 서비스를 제공하는데, 이 때 연관성이 높은 블로그를 검색 결과로 노출하기 위한 블로그 검색 시스템을 사용한다.
블로그 마케팅의 활용도가 증가함에 따라 대형 포털 사이트의 블로그 검색 시스템을 분석하여 키워드 검색 키워드 검색 시 상단에 노출되려는 노력이 빈번해지고 있다. 최근 대형 기업들은 포털 검색 결과에 영향력 있는 블로그 정보를 대량 활용하여 제품을 홍보하기 위한 전략을 수립하고 있다.
경쟁력이 높은 키워드의 포털 사이트 검색결과 중 상위 노출하기 위해서는 마케팅의 비용이 더욱 상승한다. 높은 비용을 지불하여 경쟁력 있는 키워드에 일시적으로 상위 노출된다 하더라도, 인기 키워드의 검색 결과는 최신 정보를 선호하여 수시로 변동되기 때문에 장기적인 마케팅 효과를 기대하기 힘들다.
참고적으로, 한국특허 등록번호 제10-0751560 호의 "키워드 광고 분석 시스템"에서는 비용측면에서 최적화된 키워드를 제시하는 시스템을 제안하고 있다.
한편, 중소기업이나 영세상인 등 일부 기업의 경우 직접 블로그를 운영하며 마케팅 비용을 줄이고 제품의 정보를 제공하려는 시도가 늘고 있다. 그러나 현재 운영되고 있는 블로그가 약 1천만 개에 달하기 때문에, 포털 사이트의 키워드 검색 결과에 관련 정보를 노출하기가 어렵다.
상위 노출을 위해서는 키워드와의 연관성 뿐만 아니라 블로그 자체의 가치가 키워드 검색 결과에 영향을 비친다. 이를 블로그 지수라고 하는데, 높은 블로그 지수를 얻기 위해서는 일반적으로 최소 몇 달 이상의 장기적이고 규칙적인 노력이 필요하다. 높은 블로그 지수를 가지고 있다 하더라도 경쟁력이 높은 키워드의 경우, 하루에도 수시로 변동되는 검색 결과에 능동적으로 대처하기 힘들다.
한편, 키워드의 검색량과 해당 키워드의 검색 결과에 포함된 블로그의 개수는 항상 비례한다고 볼 수 없는데, 블로그의 기본 목적 중 하나가 개인 기록에 있으며 키워드 검색 목적과 블로그 운영 목적이 항상 부합하다고 할 수 없기 때문이다.
Web(웹) + Log(일지)의 합성어인 Blog(블로그)는 개인이 웹에 기록하는 일지를 뜻하며, 1997년 미국에서 시작한 1인 미디어라고 할 수 있다. 국내의 운영 블로그는 대략 1000만개로 추정되는데, 과거 개인적 기록이나 소셜 네트워크 구축의 목적으로 주로 사용되던 것이 최근 정보획득 및 공유의 목적으로 많이 사용하고 있다.
대형 포털 사이트도 블로그의 정보성을 인정하고 검색 결과에 상위 노출 하고 있다. 이로 인해 기업의 제품이나 서비스에 대한 소개, 사용 후기 형태의 마케팅 전략으로 블로그가 각광받고 있다. 즐로그의 정보는 타 디지털 마케팅에 비해 신뢰도와 전달력이 높게 나타났다.
웹 검색 알고리즘들은 웹 문서의 중요도를 평가하고 랭킹을 결정하는 다양한 방법들을 사용하여 제안되었다. 이 중 구글 검색 엔진에 적용된 PageRank 알고리즘은 문서간의 하이퍼링크를 통해 가중치를 계산하는 방법을 제안하며, 현재 대부분의 검색 엔진의 기초 이론으로 사용되었다.
그러나 블로그의 특성상 일반 웹페이지에 비하여 하이퍼링크의 사용빈도가 현저히 떨어져, 웹 검색 알고리즘은 블로그 검색에 적용시키기 적절하지 않다. 그리하여 블로그의 특징을 고려한 블로그 랭킹 알고리즘이 제안되었다. PageRank 알고리즘을 바탕으로 한 블로그 랭킹 알고리즘은 하이퍼링크 대신 블로그 간의 유사성과 접속 용이성을 분석하였다.
또한, B2Rank 알고리즘은 블로깅 빈도수와 댓글 수를 고려하였고 EigenRumor 알고리즘은 블로그 매력과 사용자의 평가를 수치화하여 적용하였다. 이외에도 스크랩 수, 트랙백 등을 수치화하여 블로그 랭킹을 정하는 방법이 제안되었고, 현재 대부분의 블로그 검색 알고리즘은 블로그 자체의 가치와 검색 키워드와의 연관성을 분석하도록 구성되었다.
따라서 블로그 검색시 상위 노출을 위해서는 키워드와의 연관성 뿐 아니라 블로그 자체의 가치를 위하여 장기적으로 적극적인 노력이 요구된다.
본 발명은 상기와 같은 기술적 과제를 해결하기 위해 제안된 것으로, 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정방법 및 선정 시스템을 제공한다.
또한, 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템을 제공한다.
본 발명의 일 실시예에 따르면, 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정방법에 있어서, 타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출하는 단계; 추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여함에 있어서, 문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고, 전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 연산하여 연관 키워드 가중치(IF-IDF)를 산출하는 산출단계;를 포함하는 연관 키워드 선정방법이 제공된다.
또한, 상기 연관 키워드 가중치(IF-IDF)는, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 곱셈 연산하여 산출되는 것을 특징으로 한다.
또한 상기 정규화 키워드 빈도(TF)는, 하기 수학식 1과 같이 정의되는 것을 특징으로 한다.
<수학식 1>
freq(ωi,D) : 문서(D) 내에서 특정 단어(ωi)의 사용 빈도 수
상기 문서 빈도의 역수(IDF)는, 하기 수학식 2와 같이 정의되는 것을 특징으로 한다.
<수학식 2>
상기 연관 키워드 가중치(IF-IDF)는, 하기 수학식 3과 같이 정의되는 것을 특징으로 한다.
<수학식 3>
또한, 본 발명의 다른 실시예에 따르면, 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정 시스템에 있어서, 타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출하는 단어 추출부; 및 추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여하는 가중치 부여부;를 포함하고, 상기 가중치 부여부는, 문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고, 전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 연산하여 연관 키워드 가중치(IF-IDF)를 산출하는 것을 특징으로 하는 연관 키워드 선정 시스템이 제공된다.
또한, 본 발명의 또 다른 실시예에 따르면, 연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고, 연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고, 연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 단계;를 포함하는 연관 키워드의 경쟁력 산출방법이 제공된다.
또한, 상기 연관 키워드의 경쟁력 값(CV(ωi))은, 하기 수학식 4와 같이 정의되는 것을 특징으로 한다.
<수학식 4>
또한, 본 발명의 또 다른 실시예에 따르면, 연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고, 연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고, 연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 경쟁력 산출부;를 포함하는 연관 키워드의 경쟁력 산출 시스템이 제공된다.
본 발명의 실시예에 따른 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정방법 및 선정 시스템과, 그 연관 키워드의 경쟁력 산출방법 및 산출 시스템에 따르면, 검색량과 상위 노출 가능성을 고려한 효율적인 연관 키워드를 선정할 수 있다.
또한, 필요한 타겟 키워드와 관련성이 높은 연관 키워드를 추출하여 각 키워드의 검색량과 경쟁력을 분석하고 가장 효율적인 연관 키워드를 추천할 수 있다.
또한, 마케팅을 위한 블로깅을 수행할 때 타겟 키워드와 유사한 키워드를 선별하여 경쟁력 및 상위 노출에 유리한 키워드를 추천할 수 있다.
도 1은 본 발명의 실시예에 따른 연관 키워드 선정방법을 나타낸 도면
도 2는 본 발명의 실시예에 따른 연관 키워드 선정 시스템의 구성도
도 3은 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출방법을 나타낸 도면
도 4는 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출 시스템의 구성도
도 2는 본 발명의 실시예에 따른 연관 키워드 선정 시스템의 구성도
도 3은 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출방법을 나타낸 도면
도 4는 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출 시스템의 구성도
이하, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 정도로 상세히 설명하기 위하여, 본 발명의 실시예를 첨부한 도면을 참조하여 설명하기로 한다.
도 1은 본 발명의 실시예에 따른 연관 키워드 선정방법을 나타낸 도면이다.
본 실시예에 따른 연관 키워드 선정방법(1)은 제안하고자 하는 기술적인 사상을 명확하게 설명하기 위한 간략한 구성만을 포함하고 있다.
도 1을 참조하면, 연관 키워드 선정방법(1)은 단어 추출 단계(S10)와, 가중치 산출단계(S20)을 포함하여 구성된다.
즉, 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정방법(1)에서,
우선, 타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출하는 단계가 수행된다. - S10 -
다음으로, 추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여함에 있어서,
문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고,
전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고,
정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 연산하여 연관 키워드 가중치(IF-IDF)를 산출하는 산출단계가 수행된다. - S20 -
이때, 연관 키워드 가중치(IF-IDF)는, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 곱셈 연산하여 산출될 수 있다.
정규화 키워드 빈도(TF)는, 하기 수학식 1과 같이 정의될 수 있다.
<수학식 1>
또한, 문서 빈도의 역수(IDF)는, 하기 수학식 2와 같이 정의될 수 있다.
<수학식 2>
즉, 연관 키워드 추출을 위하여 포털 사이트 키워드 검색결과의 문서 내용을 수집하고, 한글의 형태소 분석을 통하여 사용된 명사를 추출한다. 추출된 명사 단어는 빈도를 계산하여 중요도를 파악한다.
중요도를 판단하기 위한 가중치 계산 방법으로 연관 키워드 가중치(IF-IDF)를 이용한다.
우선, 정규화 키워드 빈도(TF, Term Frequency)는 문서(D) 내 특정 단어(ωi)의 가중치를 빈도(freq(ωi,D))를 통해 계산한다. 그러나 문서의 내용이 클수록 빈도의 값도 커지므로 빈도수를 전체 단어의 수로 나눈 정규화 키워드 빈도(TF)를 사용할 수 있다.
<수학식 1>
다음으로, 문서 빈도의 역수(IDF, Inversed Document Frequency)는 문서 빈도 역수를 이용하여 단어의 희소성과 정보성을 계산한다. 키워드 검색 결과 블로그의 전체 문서의 수를 N개라고 하고 특정 단어(ωi)를 포함하는 문서의 수를 n개라고 했을 때 문서 빈도의 역수(IDF)는 하기와 같이 구할 수 있다.
<수학식 2>
다음으로, 연관 키워드 가중치(IF-IDF)는 정규화 키워드 빈도(TF) 및 문서 빈도의 역수(IDF)의 연산을 통해 하기와 같이 구할 수 있다.
<수학식 3>
도 2는 본 발명의 실시예에 따른 연관 키워드 선정 시스템(2)의 구성도이다. 도 2는 도 1의 연관 키워드 선정방법(1)을 수행하는 시스템으로 정의된다.
도 2를 참조하면, 연관 키워드 선정 시스템(2)은 단어 추출부(10)와, 가중치 부여부(20)를 포함하여 구성된다.
즉, 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정 시스템(2)에서,
단어 추출부(10)는 타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출한다.
또한, 가중치 부여부(20)는 추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여한다.
특히 가중치 부여부(20)는
문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고,
전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고,
정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 연산하여 연관 키워드 가중치(IF-IDF)를 산출한다.
상술한 바와 같이, 연관 키워드 가중치(IF-IDF)는, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 곱셈 연산하여 산출될 수 있다.
또한, 정규화 키워드 빈도(TF)는, 하기 수학식 1과 같이 정의될 수 있다.
<수학식 1>
또한, 문서 빈도의 역수(IDF)는, 하기 수학식 2와 같이 정의될 수 있다.
<수학식 2>
연관 키워드 추출을 위하여 포털 사이트 키워드 검색결과의 문서 내용을 수집하고, 한글의 형태소 분석을 통하여 사용된 명사를 추출한다. 추출된 명사 단어는 빈도를 계산하여 중요도를 파악한다.
중요도를 판단하기 위한 가중치 계산 방법으로 연관 키워드 가중치(IF-IDF)를 이용한다.
우선, 정규화 키워드 빈도(TF, Term Frequency)는 문서(D) 내 특정 단어(ωi)의 가중치를 빈도(freq(ωi,D))를 통해 계산한다. 그러나 문서의 내용이 클수록 빈도의 값도 커지므로 빈도수를 전체 단어의 수로 나눈 정규화 키워드 빈도(TF)를 사용할 수 있다.
<수학식 1>
다음으로, 문서 빈도의 역수(IDF, Inversed Document Frequency)는 문서 빈도 역수를 이용하여 단어의 희소성과 정보성을 계산한다. 키워드 검색 결과 블로그의 전체 문서의 수를 N개라고 하고 특정 단어(ωi)를 포함하는 문서의 수를 n개라고 했을 때 문서 빈도의 역수(IDF)는 하기와 같이 구할 수 있다.
<수학식 2>
다음으로, 연관 키워드 가중치(IF-IDF)는 정규화 키워드 빈도(TF) 및 문서 빈도의 역수(IDF)의 연산을 통해 하기와 같이 구할 수 있다.
<수학식 3>
한편, 상술한 바와 같은 방법을 통해 연관 키워드(ωi)를 선정한 후에, 연관 키워드(ωi)의 경쟁력을 산출할 수 있다.
도 3은 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출방법을 나타낸 도면이다.
도 3을 참조하면, 연관 키워드의 경쟁력 산출방법(3)은 연관 키워드(ωi)를 선정하는 단계(S30)와, 경쟁력 값을 산출하는 단계(S40)를 포함하여 구성된다.
즉, 선정된 연관 키워드(ωi)의 경쟁력 산출방법(3)에서,
우선, 연관 키워드(ωi)를 선정하는 단계(S30)는 상술한 도 1 및 도 2의 방법 및 시스템을 통해 연관 키워드(ωi)를 선정할 수 있다. - S30 -
다음으로, 연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고,
연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고,
연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 단계가 진행된다. - S40 -
연관 키워드의 경쟁력 값(CV(ωi))은, 하기 수학식 4와 같이 정의될 수 있다.
<수학식 4>
도 4는 본 발명의 실시예에 따른 연관 키워드의 경쟁력 산출 시스템(4)의 구성도이다. 도 4는 도 3의 연관 키워드의 경쟁력 산출방법(3)을 수행하는 시스템(4)으로 정의된다.
도 4를 참조하면, 연관 키워드의 경쟁력 산출 시스템(4)은 연관 키워드 선정부(30)와, 경쟁력 산출부(40)를 포함하여 구성된다.
우선, 연관 키워드 선정부(30)는 상술한 도 1 및 도 2의 방법 및 시스템을 통해 연관 키워드(ωi)를 선정할 수 있다.
다음으로, 경쟁력 산출부(40)는 연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고,
연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고,
연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출한다.
연관 키워드의 경쟁력 값(CV(ωi))은, 하기 수학식 4와 같이 정의될 수 있다.
<수학식 4>
특정 연관 키워드(ωi)의 경쟁력(CV(ωi)) 측정을 위하여, 월간 검색량(AS(ωi))과, 블로그 개수(NB(ωi))와, 상위 노출 블로그 10건의 평균 작성일과 현재 날짜와의 차이값(ADB(ωi))을 고려하여 수학식 4와 같이 계산할 수 있다.
연관 키워드(ωi)는 계산된 경쟁력의 값 역순으로 추천된다.
월간 검색량(AS(ωi))은, 높을수록 마케팅 블로그의 노출이 빈번해지므로 경쟁력 값(CV(ωi))에 유리하고, 블로그 개수(NB(ωi))는 적을수록 키워드 검색시 마케팅 블로그의 상위 노출에 유리하기 때문에 높은 경쟁력을 갖는다고 할 수 있다.
월간 검색량은 총 노출 횟수와 연관되고, 이는 작은 검색량을 가진 키워드를 여러개 사용함으로써 보완될 수 있다. 그러나 검색된 키워드에 포함된 블로그의 개수는 많을수록 상위노출에 급격히 불리해지고, 이는 해당 블로그 내 여러 개 키워드 사용으로도 해결되지 않으므로, 월간 검색량에 비하여 중요한 요인으로 처리될 필요성이 있다.
해당 키워드의 상위 노출 블러그 10건의 평균 작성 일과 현재 날짜와의 차이값(ADB(ωi))은 높을수록 경쟁력 값(CV(ωi))에 유리하다. 빈번하게 작성되는 블로그의 키워드 일수록 상위 노출이 되더라도 빈번히 교체되므로 경쟁력에 불리하다. 과거에 작성된 블러그가 상위 노출이 되고 있다는 점은 해당 키워드를 사용한 블로깅의 횟수 또는 낮다고 할 수 있으므로 경쟁력에 유리하게 작용하도록 하였다.
표 1 내지 표 5는 상술한 방법 및 시스템을 통해 대출, 결혼, 이사, 장난감, 여행에 대한 연관 키워드 그룹 및 그 경쟁력을 표시하고 있다.
타켓 키워드 | 추천순서 | 연관 키워드 | 월간 검색량 | 블로그 개수 | 경쟁력 |
대출 | - | 대출 | 120,086 | 1,763,633 | 3.9E-06 |
대출 | 1 | 급전 | 8,927 | 48,330 | 1.1E-03 |
대출 | 2 | 대환 | 2,576 | 55,160 | 8.5E-05 |
대출 | 3 | 보증인 | 3,174 | 67,620 | 6.9E-05 |
대출 | 4 | 고금리 | 586 | 68,101 | 1.3E-05 |
대출 | 5 | 상환 | 11,763 | 408,830 | 7.0E-06 |
대출 | 6 | 금리 | 47,281 | 926,519 | 5.5E-06 |
표 1을 참조하면, 타겟 키워드인 "대출"에 대한 연관 키워드(ωi)가 급전, 대환, 보증인, 고금리, 상환, 금리 순으로 경쟁력이 높다는 것을 확인할 수 있다.
타켓 키워드 | 추천순서 | 연관 키워드 | 월간 검색량 | 블로그 개수 | 경쟁력 |
결혼 | - | 결혼 | 54,769 | 7,383,699 | 1.0E-07 |
결혼 | 1 | 청첩장 | 99,419 | 208,543 | 2.3E-04 |
결혼 | 2 | 커플링 | 209,977 | 419,554 | 1.2E-04 |
결혼 | 3 | 예복 | 10,716 | 124,767 | 6.9E-05 |
결혼 | 4 | 예물 | 20,140 | 424,577 | 1.1E-05 |
결혼 | 5 | 궁합 | 39,182 | 1,082,286 | 3.3E-06 |
결혼 | 6 | 식장 | 338 | 206,227 | 7.9E-07 |
결혼 | 7 | 드레스 | 31,782 | 2,204,505 | 6.5E-07 |
결혼 | 8 | 신부 | 7,107 | 2,478,733 | 1.2E-07 |
표 2를 참조하면, 타겟 키워드인 "결혼"에 대한 연관 키워드(ωi)가 청첩장, 커플링, 예복, 예물, 궁합, 식장, 드레스, 신부 순으로 경쟁력이 높다는 것을 확인할 수 있다.
타켓 키워드 | 추천순서 | 연관 키워드 | 월간 검색량 | 블로그 개수 | 경쟁력 |
이사 | - | 이사 | 34,413 | 4,529,977 | 1.7E-07 |
이사 | 1 | 용달 | 25,411 | 234,335 | 4.6E-05 |
이사 | 2 | 원룸 | 34,287 | 2,014,943 | 8.4E-07 |
이사 | 3 | 견적 | 5,879 | 1,466,440 | 2.7E-07 |
표 3을 참조하면, 타겟 키워드인 "이사"에 대한 연관 키워드(ωi)가 용달, 원룸, 견적 순으로 경쟁력이 높다는 것을 확인할 수 있다.
타켓 키워드 | 추천순서 | 연관 키워드 | 월간 검색량 | 블로그 개수 | 경쟁력 |
장난감 | - | 장난감 | 30,533 | 2,028,374 | 7.4E-07 |
장난감 | 1 | 터닝 | 4,270 | 132,024 | 2.4E-05 |
장난감 | 2 | 토이 | 39,500 | 442,055 | 2.0E-05 |
장난감 | 3 | 공룡 | 74,168 | 733,334 | 1.4E-05 |
장난감 | 4 | 유아 | 83,456 | 1,690,731 | 2.9E-06 |
장난감 | 5 | 로봇 | 26,931 | 988,760 | 2.8E-06 |
표 4를 참조하면, 타겟 키워드인 "장난감"에 대한 연관 키워드(ωi)가 터닝, 토이, 공룡, 유아, 로봇 순으로 경쟁력이 높다는 것을 확인할 수 있다.
타켓 키워드 | 추천순서 | 연관 키워드 | 월간 검색량 | 블로그 개수 | 경쟁력 |
여행 | - | 여행 | 98,658 | 17,294,788 | 3.3E-08 |
여행 | 1 | 제주도 | 223,909 | 2,831,506 | 2.8E-06 |
여행 | 2 | 가을 | 296,846 | 9,069,883 | 3.6E-07 |
여행 | 3 | 패키지 | 11,086 | 1,933,936 | 3.0E-07 |
여행 | 4 | 바다 | 102,153 | 8,007,881 | 1.6E-07 |
여행 | 5 | 호텔 | 50,963 | 5,686,388 | 1.6E-07 |
여행 | 6 | 공항 | 15,454 | 3,558,133 | 1.2E-07 |
여행 | 7 | 신호 | 3,229 | 1,885,132 | 9.1E-08 |
표 5를 참조하면, 타겟 키워드인 "여행"에 대한 연관 키워드(ωi)가 제주도, 가을, 패키지, 바다, 호텔, 공항, 신혼 순으로 경쟁력이 높다는 것을 확인할 수 있다.
본 발명의 실시예에서는 연관 키워드를 추출하기 위하여 블로그 검색 결과 상위 블로그 100건의 문서 내용에 대해 형태소 분석을 수행하고, 명사 또는 복합 명사의 키워드에 대해 빈번도를 바탕으로 연관도를 연산하였다.
본 발명의 실시예에 따른 키워드 기반 블로그 마케팅을 위한 연관 키워드 선정방법 및 선정 시스템과, 그 연관 키워드의 경쟁력 산출방법 및 산출 시스템에 따르면, 검색량과 상위 노출 가능성을 고려한 효율적인 연관 키워드를 선정할 수 있다.
또한, 필요한 타겟 키워드와 관련성이 높은 연관 키워드를 추출하여 각 키워드의 검색량과 경쟁력을 분석하고 가장 효율적인 연관 키워드를 추천할 수 있다.
또한, 마케팅을 위한 블로깅을 수행할 때 타겟 키워드와 유사한 키워드를 선별하여 경쟁력 및 상위 노출에 유리한 키워드를 추천할 수 있다.
이와 같이, 본 발명이 속하는 기술분야의 당업자는 본 발명이 그 기술적 사상이나 필수적 특징을 변경하지 않고서 다른 구체적인 형태로 실시될 수 있다는 것을 이해할 수 있을 것이다. 그러므로 이상에서 기술한 실시예들은 모든 면에서 예시적인 것이며 한정적인 것이 아닌 것으로서 이해해야만 한다. 본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허청구범위에 의하여 나타내어지며, 특허청구범위의 의미 및 범위 그리고 그 등가개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.
10 : 단어 추출부
20 : 가중치 부여부
30 : 연관 키워드 선정부
40 : 경쟁력 산출부
20 : 가중치 부여부
30 : 연관 키워드 선정부
40 : 경쟁력 산출부
Claims (14)
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 연관 키워드(ωi)의 경쟁력 산출 시스템에 의해 수행되는 연관 키워드(ωi)의 경쟁력 산출방법에 있어서,
키워드 기반 블로그 마케팅을 위한 연관 키워드(ωi) 선정단계; 및
연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고,
연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고,
연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 단계;를 포함하고,
상기 연관 키워드(ωi) 선정단계는,
타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출하는 단계; 및
추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여함에 있어서, 문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고, 전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 곱셈 연산하여 연관 키워드 가중치(IF-IDF)를 산출하는 산출단계;를 포함하는 것을 특징으로 하는
연관 키워드의 경쟁력 산출방법.
- 연관 키워드(ωi)의 경쟁력 산출 시스템에 있어서,
키워드 기반 블로그 마케팅을 위한 연관 키워드(ωi)를 선정하는 연관 키워드 선정부; 및
연관 키워드(ωi)의 월간 검색량(AS(ωi))에 비례하고,
연관 키워드(ωi)가 포함된 블로그 개수(NB(ωi))에 반비례하고,
연관 키워드(ωi)가 포함된 블로그의 평균 작성날짜와 현재날짜의 차이값(ADB(ωi))에 비례하는 연관 키워드의 경쟁력 값(CV(ωi))을 산출하는 경쟁력 산출부;를 포함하고,
상기 연관 키워드 선정부는,
타겟 키워드에 대한 포털 사이트의 검색결과를 수집하고, 한글 형태소 분석을 통해, 수집된 문서(D)에 표시된 복수의 단어를 추출하는 단어 추출부; 및
추출된 복수의 단어 중 선택된 연관 키워드(ωi)의 키워드 가중치를 부여하는 가중치 부여부;를 포함하는 것을 특징으로 하고,
상기 가중치 부여부는, 문서(D) 내의 전체 키워드(ωj)의 사용횟수 대비 선택된 연관 키워드(ωi)의 사용횟수에 대한 정규화 키워드 빈도(TF)를 산출하고,
전체 문서(D)의 수(N)와 선택된 연관 키워드(ωi)를 포함하는 문서(D)의 수(n)의 차이값을 토대로 연관 키워드(ωi)의 희소성을 나타내는 문서 빈도의 역수(IDF)를 산출하고, 정규화 키워드 빈도(TF)와 문서 빈도의 역수(IDF)를 곱셈 연산하여 연관 키워드 가중치(IF-IDF)를 산출함으로써 연관 키워드(ωi)를 선정하는 것을 특징으로 하는
연관 키워드의 경쟁력 산출 시스템.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160016921A KR101791418B1 (ko) | 2016-02-15 | 2016-02-15 | 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020160016921A KR101791418B1 (ko) | 2016-02-15 | 2016-02-15 | 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20170095492A KR20170095492A (ko) | 2017-08-23 |
KR101791418B1 true KR101791418B1 (ko) | 2017-10-31 |
Family
ID=59759520
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020160016921A KR101791418B1 (ko) | 2016-02-15 | 2016-02-15 | 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101791418B1 (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102018906B1 (ko) * | 2018-01-10 | 2019-09-05 | 주식회사 메디씨앤씨 | 키워드에 대한 타겟 사용자 그룹 선정 방법 및 이를 수행하는 컴퓨팅 시스템 |
KR102651407B1 (ko) * | 2021-02-17 | 2024-03-29 | 주식회사 허브보리 | 빅데이터를 활용한 시장성 분석 및 사업화방법론 분석 시스템 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100863990B1 (ko) * | 2006-11-28 | 2008-10-16 | 주식회사 오피엠에스 | 카테고리 광고 시스템 및 방법 |
KR100892848B1 (ko) * | 2007-05-31 | 2009-04-10 | 엔에이치엔(주) | 상품 자동 설정 방법 및 그 시스템 |
-
2016
- 2016-02-15 KR KR1020160016921A patent/KR101791418B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100863990B1 (ko) * | 2006-11-28 | 2008-10-16 | 주식회사 오피엠에스 | 카테고리 광고 시스템 및 방법 |
KR100892848B1 (ko) * | 2007-05-31 | 2009-04-10 | 엔에이치엔(주) | 상품 자동 설정 방법 및 그 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR20170095492A (ko) | 2017-08-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Cheng et al. | Personalized click prediction in sponsored search | |
CN109190043A (zh) | 推荐方法及装置,存储介质,电子设备及推荐系统 | |
US8909652B2 (en) | Determining entity popularity using search queries | |
Yu | The dynamic competitive recommendation algorithm in social network services | |
CN102629257A (zh) | 一种基于关键字的电子商务网站商品推荐方法 | |
CN104866554B (zh) | 一种基于社会化标注的个性化搜索方法及系统 | |
CN102841946A (zh) | 商品数据检索排序及商品推荐方法和系统 | |
Hasan et al. | Query suggestion for e-commerce sites | |
CN103455613A (zh) | 基于MapReduce模型的兴趣感知服务推荐方法 | |
CN105023178B (zh) | 一种基于本体的电子商务推荐方法 | |
US20140046756A1 (en) | Generative model for related searches and advertising keywords | |
KR100744063B1 (ko) | 인터넷 검색 광고 서비스 시스템 및 방법 | |
CN104268230A (zh) | 一种基于异质图随机游走的中文微博客观点探测方法 | |
TW201426357A (zh) | 搜索資料排序的方法和裝置,資料搜索的方法和裝置 | |
WO2016137690A1 (en) | Efficient retrieval of fresh internet content | |
US8498979B1 (en) | System and method for semantic analysis of social network user activities | |
KR101791418B1 (ko) | 키워드 기반 블로그 마케팅을 위한 연관 키워드의 경쟁력 산출방법 및 산출 시스템 | |
CN104036008A (zh) | 关键词竞争分析方法及装置 | |
KR102051311B1 (ko) | 개인화 알고리즘을 이용하여 고객 로그 맞춤형 사이트를 추천하는 방법 및 개인화 알고리즘 서버 | |
Tsai | A fuzzy-based personalized recommender system for local businesses | |
WO2020057237A1 (zh) | 适用于关注对象的影响力检测方法、电子终端及存储介质 | |
CN107085573B (zh) | 热点信息的获取方法及装置 | |
Hasegawa et al. | Trip tweets search by considering spatio-temporal continuity of user behavior | |
Wei et al. | A study of customer behaviour through web mining | |
Trappey et al. | Using Web Mining and Perceptual Mapping to Support Customer-Oriented Product Positions Designs |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |