KR102407057B1 - Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법 - Google Patents

Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법 Download PDF

Info

Publication number
KR102407057B1
KR102407057B1 KR1020200065603A KR20200065603A KR102407057B1 KR 102407057 B1 KR102407057 B1 KR 102407057B1 KR 1020200065603 A KR1020200065603 A KR 1020200065603A KR 20200065603 A KR20200065603 A KR 20200065603A KR 102407057 B1 KR102407057 B1 KR 102407057B1
Authority
KR
South Korea
Prior art keywords
influence
analysis
public data
sns
user
Prior art date
Application number
KR1020200065603A
Other languages
English (en)
Other versions
KR20210148574A (ko
Inventor
장지훈
최화섭
Original Assignee
주식회사 피처링
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 피처링 filed Critical 주식회사 피처링
Priority to KR1020200065603A priority Critical patent/KR102407057B1/ko
Publication of KR20210148574A publication Critical patent/KR20210148574A/ko
Application granted granted Critical
Publication of KR102407057B1 publication Critical patent/KR102407057B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/103Formatting, i.e. changing of presentation of documents
    • G06F40/117Tagging; Marking up; Designating a block; Setting of attributes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • Marketing (AREA)
  • Computing Systems (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Computational Linguistics (AREA)
  • Finance (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Primary Health Care (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Tourism & Hospitality (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Human Resources & Organizations (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 SNS 사용자 채널을 정량적으로 평가하고, 평가된 수치들을 기반으로 영향력 리포트를 제공하는 기술적 사상에 관한 것으로서, 일실시예에 따른 영향력 측정 시스템은, SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집하는 수집 처리부, 상기 수집된 공개 데이터를 분석하여 상기 SNS 사용자 채널에 대한 영향력 스코어를 분석하는 분석부, 및 상기 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성하는 리포트 생성부를 포함할 수 있다.

Description

SNS 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법{Systems and methods for analyzing the public data of SNS user channel and providing influence report}
본 발명은 SNS 사용자 채널을 정량적으로 평가하고, 평가된 수치들을 기반으로 영향력 리포트를 제공하는 기술적 사상에 관한 것이다.
인플루언서(Influencer)는 '영향을 주다'는 뜻의 단어 'influence'에 '사람'을 뜻하는 접미사 '-er'을 붙인 것으로 '영향력을 행사하는 사람'을 뜻하며, 포털사이트에서 영향력이 큰 블로그(blog)를 운영하는 '파워블로거'나 수십만 명의 팔로워 수를 가진 소셜네트워크서비스(SNS) 사용자, 혹은 1인 방송 진행자들을 통칭하는 의미로 해석된다. SNS 사용자 채널들에 기반한 SNS 사용자 채널을 활용해 제품이나 서비스를 홍보하는 마케팅 수단이다.
인플루언서 마케팅은 고액을 지불해 유명 배우를 모델로 쓰는 것보다 상대적으로 저렴한 데다가, SNS 사용자 급증 등으로 인해 2010년 후반부터 효율적인 마케팅 방안으로 주목받고 있다.
그럼에도 불구하고, 인플루언서 마케팅에는 인플루언서에 대한 객관적 검증이 어렵다는 문제가 존재한다.
이러한 이유에서 홍보효과의 객관적 검증이 어렵고, 그로 인해 기업이 예상했던 기대효과에 턱없이 못 미치는 광고효과를 보는 경우가 종종 발생하고 있다.
인플루언서가 정하는 가치 기준은 인플루언서의 주관에 따라 결정되기 때문에 자신의 영향력에 지나치게 큰 가치를 부여할 수 밖에 없다.
한국등록특허 제10-2013186호 "인플루언서 활용 전자상거래 시스템" 한국등록특허 제10-2068123호 "인플루언서를 활용한 마케팅 서비스 제공 장치 및 그 방법"
본 발명은 SNS 사용자 채널에 대한 객관적인 평가 기준을 제공하는 것을 목적으로 한다.
본 발명은 SNS 사용자 채널에 대한 영향력을 수치화 함으로써, SNS 사용자 채널과 기업의 매출 증가에 따른 연관관계를 평가하는 것을 목적으로 한다.
본 발명은 영향력 솔루션을 활용하여 최종적으로 사용자에게 제공하는 영향력 스코어 및 SNS 사용자 채널의 데이터를 리포트 형태로 제공하는 것을 목적으로 한다.
일실시예에 따른 영향력 측정 시스템은, SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집하는 수집 처리부, 수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석하는 분석부, 및 상기 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성하는 리포트 생성부를 포함할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 상기 자연어 처리된 공개 데이터를 태깅화 하여 분류할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터, 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석 중에서 적어도 하나 이상의 분석을 처리하고, 상기 처리된 분석 결과를 이용하여, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값 중에서 적어도 하나를 반영하여 영향력을 수치화하고, 상기 수치화된 영향력을 영향력 스코어에 반영할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터 상기 댓글 분석을 처리하되, 댓글 문장에 대한 자연어 처리 후, 진짜 유저인지 또는 가짜 유저인지를 판단하여 분석할 수 있다.
일실시예에 따른 상기 분석부는, 상기 댓글 분석 결과, 상기 자연어 처리된 댓글 문장이 구매 관련 문의 또는 포스팅 이미지와 관련된 댓글 문장인 경우 진짜 유저로 판단할 수 있다.
일실시예에 따른 상기 분석부는, 상기 댓글 분석 결과, 상기 자연어 처리된 댓글 문장이 봇 메크로 댓글 또는 다른 SNS 사용자 채널의 댓글인 경우 가짜 유저로 판단할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터 상기 팔로워 유저 분석을 처리하되, 팔로워에 대해 활동하는 실제 유저, 활동하지 않는 가짜 유저, 비즈니스 계정 중에서 적어도 하나를 판단할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터 상기 좋아요 유저 분석을 처리하되, 입력된 좋아요에 대해 실제 유저로부터의 입력인지 가짜 유저로부터의 입력인지를 판단할 수 있다.
일실시예에 따른 상기 분석부는, 상기 수집된 공개 데이터로부터 상기 포스팅 분석을 처리하되, 등록된 포스팅에 판매 관련 플러스 요인 또는 판매 관련 마이너스 요인을 분석할 수 있다.
일실시예에 따른 상기 분석부는, 3차수 이상 판매 진행한 포스팅이 있을 경우, 상기 판매 관련 플러스 요인에 대한 가중치를 부여할 수 있다.
일실시예에 따른 상기 분석부는, 판매 관련 포스팅의 좋아요, 댓글 가짜 유저 비율이 기준 이상인 경우 상기 판매 관련 마이너스 요인에 대한 가중치를 부여할 수 있다.
일실시예에 따른 상기 분석부는, 진짜 반응할 수 있는 유저, 자동 가중치, 타임 가중치를 고려하여 최종 산출 점수를 산출하고, 상기 산출된 최종 산출 점수에 기초하여 상기 영향력 스코어를 결정할 수 있다.
일실시예에 따른 상기 리포트 생성부는, 상기 영향력 코어를 기반으로, SNS 계정 기본 정보, SNS 계정 분석 관련 정보, 실제 활동중인 연관 계정 비율, 진짜 응답율, 도달율 중에서 적어도 하나가 반영된 영향력 리포트를 생성할 수 있다.
일실시예에 따른 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법은 SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집하는 단계, 수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석하는 단계, 및 상기 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성하는 단계를 포함할 수 있다.
일실시예에 따른 상기 영향력 스코어를 분석하는 단계는, 상기 수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석하는 단계를 포함할 수 있다.
일실시예에 따른 상기 영향력 스코어를 분석하는 단계는, 상기 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별하는 단계를 포함할 수 있다.
일실시예에 따른 상기 영향력 스코어를 분석하는 단계는, 상기 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 상기 자연어 처리된 공개 데이터를 태깅화 하여 분류하는 단계를 포함할 수 있다.
일실시예에 따른 상기 영향력 스코어를 분석하는 단계는, 상기 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리하는 단계를 포함할 수 있다.
일실시예에 따른 상기 영향력 스코어를 분석하는 단계는, 상기 수집된 공개 데이터로부터, 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석 중에서 적어도 하나 이상의 분석을 처리하는 단계, 상기 처리된 분석 결과를 이용하여, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값 중에서 적어도 하나를 반영하여 영향력을 수치화하는 단계, 및 상기 수치화된 영향력을 영향력 스코어에 반영하는 단계를 포함할 수 있다.
일실시예에 따르면, SNS 사용자 채널에 대한 객관적인 평가 기준을 제공할 수 있다.
일실시예에 따르면, SNS 사용자 채널에 대한 영향력을 수치화 함으로써, SNS 사용자 채널과 기업의 매출 증가에 따른 연관관계를 평가할 수 있다.
일실시예에 따르면, 영향력 솔루션을 활용하여 최종적으로 사용자에게 제공하는 영향력 스코어 및 SNS 사용자 채널의 데이터를 리포트 형태로 제공하는 것을 목적으로 한다.
도 1은 영향력 측정 시스템이 적용된 전체 시스템을 설명하는 도면이다.
도 2는 일실시예에 따른 영향력 측정 시스템을 설명하는 도면이다.
도 3은 일실시예에 따른 분석부를 설명하는 도면이다.
도 4는 가짜 징후를 찾는 방식을 설명하기 위한 개념도 이다.
도 5는 일실시예에 따른 영향력 측정 시스템의 동작 방법을 설명하는 도면이다.
본 명세서에 개시되어 있는 본 발명의 개념에 따른 실시예들에 대해서 특정한 구조적 또는 기능적 설명들은 단지 본 발명의 개념에 따른 실시예들을 설명하기 위한 목적으로 예시된 것으로서, 본 발명의 개념에 따른 실시예들은 다양한 형태로 실시될 수 있으며 본 명세서에 설명된 실시예들에 한정되지 않는다.
본 발명의 개념에 따른 실시예들은 다양한 변경들을 가할 수 있고 여러 가지 형태들을 가질 수 있으므로 실시예들을 도면에 예시하고 본 명세서에 상세하게 설명하고자 한다. 그러나, 이는 본 발명의 개념에 따른 실시예들을 특정한 개시형태들에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 변경, 균등물, 또는 대체물을 포함한다.
제1 또는 제2 등의 용어를 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로만, 예를 들어 본 발명의 개념에 따른 권리 범위로부터 이탈되지 않은 채, 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소는 제1 구성요소로도 명명될 수 있다.
어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 표현들, 예를 들어 "~사이에"와 "바로~사이에" 또는 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.
본 명세서에서 사용한 용어는 단지 특정한 실시예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 명세서에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함으로 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미를 갖는 것으로 해석되어야 하며, 본 명세서에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이하, 실시예들을 첨부된 도면을 참조하여 상세하게 설명한다. 그러나, 특허출원의 범위가 이러한 실시예들에 의해 제한되거나 한정되는 것은 아니다. 각 도면에 제시된 동일한 참조 부호는 동일한 부재를 나타낸다.
도 1은 영향력 측정 시스템(120)이 적용된 전체 시스템(100)을 설명하는 도면이다.
도면부호 110은 SNS 사용자 채널에 대한 영향력을 검토하려는 사용자의 단말기로서, 사용자 단말기로 정의하고 스마트폰, 컴퓨터 단말기, 태블릿 등의 통신 가능한 기기로 해석될 수 있다.
사용자는 SNS 사용자 채널에 대한 영향력을 검토하기 위해 SNS 사용자 채널에 대한 영향력 리포트를 열람할 수 있다.
이를 위해, 사용자는 사용자 단말기(110)에 SNS 사용자 채널을 고유 식별할 수 있는 정보, 예를 들어 SNS 사용자 채널에 대한 계정 정보를 입력할 수 있다.
이에, 사용자 단말기(110)는 입력된 정보를 이용해서 영향력 측정 시스템으로 SNS 사용자 채널에 대한 영향력 리포트를 요청할 수 있다.
일실시예에 따른 영향력 측정 시스템(120)은 영향력 리포트에 대한 요청을 접수하여 동작할 수 있다.
이를 위해, 영향력 측정 시스템(120)은 SNS(Social Network Service) 서버(130)로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집할 수 있다.
공개 데이터는, 각 SNS 서버로부터 직간접적으로 제공되는 데이터나 SNS 상에 공개되어 수집이 가능한 사용자 데이터(프로필, 활동, 미디어 데이터) 등을 모두 포함하는 의미로 해석될 수 있다.
다음으로, 영향력 측정 시스템(120)은 수집된 공개 데이터를 분석하여 SNS 사용자 채널에 대한 영향력 스코어를 분석할 수 있다.
일례로, 영향력 스코어는 엔진을 통해 생성된 계정의 팔로워수 등에 따라 산출되는 종합 영향력 스코어에 기초하며, 영향력 측정 시스템(120)은 영향력 스코어로 SNS 사용자 채널들에 대한 순위를 매겨 상위 백분율에 따라 등급화 하여 표시할 수 있다.
공개 데이터를 활용하여 영향력 스코어를 산출 및 분석하는 구체적인 구성에 대해서는 이하 도 2를 통해 보다 구체적으로 설명한다.
또한, 영향력 측정 시스템(120)은 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성할 수 있다.
도 2는 일실시예에 따른 영향력 측정 시스템(200)을 설명하는 도면이다.
일실시예에 따른 영향력 측정 시스템(200)은 SNS 데이터를 수집부터 리포트 산출까지 일련된 과정을 매니징 하고 관리할 수 있는 솔루션으로서, 수집, 분석, 생성 과정을 거쳐 최종 리포트 및 산출된 데이터를 API(프로토콜) 형태로 결 과물을 생성할 수 있다.
일실시예에 따른 수집 처리부(210)는 SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집할 수 있다.
예를 들어, 수집 처리부(210)는 SNS(Social Network Service) 서버에 등록된 프로필 정보, 및 포스팅 정보, 채널 정보, 영상 정보, 이미지 정보 중에서 적어도 하나를 포함하는 공개 데이터를, SNS(Social Network Service) 서버에 쿼리하여 수집할 수 있다.
한편, 수집 처리부(210)는 SNS(Social Network Service) 서버에 의해 온라인 상에 공개되는 SNS 사용자 채널과 관련된 공개 데이터를 크롤링을 통해 수집할 수도 있다.
특히, 수집 처리부(210)는 가상 모바일 시뮬레이터, 가상 호스팅-멀티 브라우저, API 요청 중에서 적어도 하나를 이용해서 상기 공개 데이터를 크롤링 방식으로 수집할 수 있다.
보다 구체적인 예로, 수집 처리부(210)가 SNS 서버로부터 수집하는 공개 데이터는 SNS의 각 서비스에 따라 다른 형태를 나타낼 수 있다.
예를 들어, 인스타그램의 경우, 수집 처리부(210)는 프로필 정보, 포스팅 정보를 수집할 수 있다.
프로필 정보는 유저고유값, 유저아이디(텍스트), 바이오그래피(텍스트), 프로필이미지(이미지), 유저이름 등을 포함할 수 있다.
또한, 포스팅 정보는 업로드 포스팅(최근 2주), 업로드된 이미지(이미지), 글(텍스트), 댓글 수, 좋아요 수, 댓글 리스트, 좋아요 리스트 등을 포함할 수 있고, 댓글 리스트에는 댓글 쓴 유저 프로필 정보, 댓글 내용, 댓글의 댓글 정보를 포함할 수 있다.
또한, 좋아요 리스는 '좋아요'를 선택한 유저의 프로필 정보를 포함할 수 있다.
유투브나 틱톡의 경우, 채널 정보와 영상 정보를 수집할 수 있다.
채널 정보는 채널고유값, 채널아이디(텍스트), 설명(텍스트), 프로필이미지(이미지), 채널제목을 나타낼 수 있고, 영상 정보는 업로드 영상 정보, 영상 제목, 영상 설명, 댓글 수, 좋아요 수, 댓글 리스트, 조회수, 키워드를 나타낼 수 있다.
수집 처리부(210)가 크롤링 봇 등을 활용하여 공개 데이터를 크롤링할 수 있다.
특히, 수집 처리부(210)는 SNS의 공개되어있는 사용자 데이터(프로필, 활동, 미디어 데이터)를 키워드나 트랜드에 기반하여 자동으로 데이터를 수집하고 저장 및 컨트롤 하는 Bot 기반의 자동화 기술을 활용할 수 있다.
수집 처리부(210)가 데이터를 수집 하는 방식은 다음의 같이 3가지를 포함할 수 있다.
먼저, 수집 처리부(210)는 가상 모바일 시뮬레이터를 활용하여 공개 데이터를 수집할 수 있다. 예를 들어, 수집 처리부(210)는 시간당 약 100대 이상의 가상 디바이스를 생성하고 실제 사용자의 요청과 동일한 방식으로 SNS의 공개된 데이터에 접근하여 데이터를 수집할 수 있다.
또한, 수집 처리부(210)는 가상 호스팅-멀티 브라우저를 활용하여 공개 데이터를 수집할 수 있다. 예를 들어, 수집 처리부(210)는 PC 브라우저와 동일한 환경의 가상 호스팅으로 키워드 및 연관 프 로필들의 데이터를 검색하여 데이터를 수집할 수 있다.
수집 처리부(210)는 API 요청을 통해 공개 데이터를 수집할 수 있다. 예를 들어, 수집 처리부(210)는 허가된 데이터를 접근 권한 토큰을 활용하여 데이터를 수집할 수 있다.
한편, 수집 처리부(210)는 위의 방식을 중앙 클라우드 컴퓨팅을 활용하여 상황별, 시간별, 에러발생 유무 등을 판단, 종합적으로 로드밸런싱을 통해 효율적으로 관리할 수 있다.
수집 처리부(210)는 수집된 공개 데이터를 메타데이터, 캡션, 이미지, 영상 등으로 분류하고 각 데이터들을 시계열 데이터로 저장 하여 분석부(220)로 전달 할 수 있다.
이를 통해 수집 처리부(210)는 시간당 SNS 계정 및 연관 계정, 관련 게시물 등 약 3만건 이상의 데이터 수집이 가능하다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터를 분석하여 SNS 사용자 채널에 대한 영향력 스코어를 분석할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터를 분류하고, 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별하 할 수 있다.
보다 구체적인 예로, 일실시예에 따른 분석부(220)는 수집된 공개 데이터를 기반으로 오디언스 분석을 처리할 수 있다.
오디언스는 구독하고 있는 팔로워들과 포스팅에 댓글을 남긴 사람, '좋아요'를 입력한 사람들로 해석될 수 있다. 분석부(220)는 수집된 공개 데이터를 기반으로 오디언스들의 가짜/진짜 패턴을 분석하여 오디언스 퀄리티를 산출할 수 있다.
예를 들어, 일실시예에 따른 분석부(220)는 가짜 징후를 찾는 방식으로 오디언스를 분석할 수 있다.
보다 구체적으로, 일실시예에 따른 분석부(220)는 공개 데이터를 기반으로 팔로워들의 사용하는 언어, 팔로워들의 비정상적인 아이디, 팔로워들의 최근 활동 등을 분석할 수 있다.
일실시예에 따른 분석부(220)는 팔로워들의 사용하는 언어로서 해당 SNS 사용자 채널 국가외의 언어를 사용하는 계정들을 추출할 수 있다.
SNS 사용자 채널이 특정 언어만 태깅하는 반면 전혀 다른 언어를 사용하는 계정은 가짜 계정일 가능성이 높다.
한편, 일실시예에 따른 분석부(220)는 팔로워들의 비정상적인 아이디를 분석할 수 있고, 특히, 식별 코드나 컴퓨터가 생성한 아이디 형태의 패턴을 검사할 수 있다.
예를 들면, 분석부(220)는 'ewiafji.5ijiena' 와 같이 알 수 없는 아이디 형태에 대해 가짜 계정일 가능성이 높다고 판단할 수 있다.
또한, 분석부(220)는 팔로워들의 최근 활동으로, '좋아요'나 '팔로잉' 활동은 많지만 포스팅이 전혀 없거나 팔로워가 증가하지 않는 경우에 대해 가짜 패턴으로 구분할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 자연어 처리된 공개 데이터를 태깅화 하여 분류할 수 있다.
분석부(220)는 캡션, 태그, 댓글 등 텍스트 기반 데이터들을 머신러닝을 활용한 자연어 처리로 허위 문장, 광고 키워드, 감정 및 연관도, 형태소 분석 등 텍스트의 연관된 문장과 단어들을 모두 태깅화 하여 분류할 수 있다.
또한, 분석부(220)는 프로필 이미지, 포스팅 이미지 등 이미지 기반 데이터들을 자체 학습시킨 머신러닝, 트레이닝 셋을 활용 하여 이미지의 인물 분류, 장소 연관도, 브랜드 적합도, 카테고리 등을 판단하여 분류할 수 있다.
분석부(220)는 언어 분류 각 단어 및 문장에 대해, 150개국 이상의 언어로 분류하고 문장의 가장 많이 쓴 언어를 기반으로 해당 프로필의 사용 언어를 추측할 수 있고, 약 50개국의 언어로 번역 처리하여 연관 단어 별로 맵핑하고 있다.
프로필에서 사용되는 언어와 전혀 다른 언어만 사용하는 사람들이 많다면 점수에 안좋은 영향을 미칠 수 있다.
분석부(220)는 단어 분류 문장이나, 해시태그등을 단어로 잘게 쪼갠 뒤 NER(Named Entity Recognition)를 활용 하여 해당 단어의 연관 의미를 찾을 수 있다.
이를 위해, 분석부(220)는 EMNLP에서 Google 게시한 데이터 셋트를 사용할 수 있고, 자체 기록 중인 Word 셋트를 통해 단어 자체의 의미를 부여하고 태깅할 수 있다.
분석부(220)는 각 단어 및 문장들이 판매나 광고에 연관 되어 있는지를 검사하며, 브랜드나 회사를 언급 하는지, 사람을 언급하는지 등과 같은 대상이 누구인지를 예측할 수 있다.
분석부(220)는 텍스트 해석 각 문장의 단어의 긍정적인 의미와 부정적인 의미를 분석하고, 단어의 연관된 사람들을 연결할 수 있다.
또한 주로 봇들이 사용하고 있는 단어나 문장들의 유사도로 진정성 있는 문구를 탐지할 수 있다.
분석부(220)는 이미지 분석과 연동 하여 포스팅 이미지와 연관성 있는 문장을 말하고 있다면 좋은 점수를 부여할 수 있다.
분류 분석된 텍스트들은 분석부(220)에서 모두 통계적인 수치로 관리되고 있으며, 최신 트랜드의 유행어와 같이 자주 언급되거나 사용되는 명사 또는 문구들을 분류하고 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리할 수 있다.
일례로, 분석부(220)는 영상의 썸네일과 I-Frame을 추출하거나 이미지가 업로드 된 포스팅, 프로필 이미지등 이미지화 하거나 추출할 수 있는 이미지는 모두 분석할 수 있다.
특히, 분석부(220)는 얼굴 탐지 프로필 이미지나 포스팅의 이미지에 사람이 포함되어 있는지 체크하거나, 몇명이 나오고 그들의 연령대는 얼마이며, 성별 또한 트레이닝된 데이터셋트로 예측할 수 있다.
또한, 분석부(220)는 음식 탐지가 가능하며, OCR 포스팅 이미지가 광고 포스터나 문구로 이루어진 이미지를 탐지 하여 텍스트를 추출할 수 있고, 추출된 텍스트는 텍스트 분석과 연계하여 분류될 수 있다.
분석부(220)는 태그 및 분류를 위한 예측으로서, 이미지의 장소나 어떠한 사물들이 이미지에 포함 되어 있는지 예측할 수 있다. 예를 들어, 자동차, 길 거리, 해변, 화장 품, 음식 등을 예측하여 어떠한 포스팅 이미지들을 올리고 있는지 확인이 가능하다.
딥러닝의 모델은 CNN의 ResNet 모델이 활용될 수 있고, 기 학습된 데이터와 새롭게 학습된 데이터를 합쳐 10000개 이상의 사물을 분류 하고 카테고리화 할 수 있다.
또한, 분석부(220)는 포스팅 Fit 해당 프로필의 포스팅증 가장 인기 있는 게시물의 이미지들을 분석할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터, 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석 중에서 적어도 하나 이상의 분석을 처리하고, 처리된 분석 결과를 이용하여, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값 중에서 적어도 하나를 반영하여 영향력을 수치화할 수 있다. 또한, 일실시예에 따른 분석부(220)는 수치화된 영향력을 영향력 스코어에 반영할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터 상기 댓글 분석을 처리하되, 댓글 문장에 대한 자연어 처리 후, 진짜 유저인지 또는 가짜 유저인지를 판단하여 분석할 수 있다.
일실시예에 따른 분석부(220)는 댓글 분석 결과, 상기 자연어 처리된 댓글 문장이 구매 관련 문의 또는 포스팅 이미지와 관련된 댓글 문장인 경우 진짜 유저로 판단할 수 있다.
일실시예에 따른 분석부(220)는 댓글 분석 결과, 자연어 처리된 댓글 문장이 봇 메크로 댓글 또는 다른 SNS 사용자 채널의 댓글인 경우 가짜 유저로 판단할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터 팔로워 유저 분석을 처리하되, 팔로워에 대해 활동하는 실제 유저, 활동하지 않는 가짜 유저, 비즈니스 계정 중에서 적어도 하나를 판단할 수 있다.
일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터 상기 좋아요 유저 분석을 처리하되, 입력된 좋아요에 대해 실제 유저로부터의 입력인지 가짜 유저로부터의 입력인지를 판단할 수 있다.
한편, 일실시예에 따른 분석부(220)는 수집된 공개 데이터로부터 포스팅 분석을 처리하되, 등록된 포스팅에 판매 관련 플러스 요인 또는 판매 관련 마이너스 요인을 분석할 수 있다.
일실시예에 따른 분석부(220)는 3차수 이상 판매 진행한 포스팅이 있을 경우, 판매 관련 플러스 요인에 대한 가중치를 부여할 수 있다.
일실시예에 따른 분석부(220)는 판매 관련 포스팅의 좋아요, 댓글 가짜 유저 비율이 기준 이상인 경우 상기 판매 관련 마이너스 요인에 대한 가중치를 부여할 수 있다.
또한, 일실시예에 따른 분석부(220)는 진짜 반응할 수 있는 유저, 자동 가중치, 타임 가중치를 고려하여 최종 산출 점수를 산출하고, 산출된 최종 산출 점수에 기초하여 상기 영향력 스코어를 결정할 수 있다.
분석부(220)는 수집된 공개 데이터에 대해, 수집 즉시 분석을 수행하며 프로필 기준으로 3단계의 분석 과정을 거칠 수 있다.
먼저, 프로필 연관 데이터들의 연관성 및 유사도 분석, 관련 데이터 통계 산출하고, 연관 텍스트들의 빅데이터(Hadoop) 기반 자연어 처리가 가능하며, 연관 이미지의 머신러닝을 활용한 분류 및 예측을 처리할 수 있다.
일실시예에 따른 분석부(220)는 최종 산출 점수를 위해, 댓글 분석의 결과를 활용할 수 있다. 댓글 분석은 댓글 문장의 자연어 처리로서, 댓글 진짜 유저 여부를 위해 구매 관련 문의, 포스팅 이미지에 대한 댓글을 분석할 수 있다.
또한, 댓글 가짜 유저를 분석하기 위해, 봇 메크로 댓글, 다른 SNS 사용자 채널의 글을 분석할 수 있고, 팔로워 유저 분석을 위해, 일반 유저 조건을 분석할 수 있고, 이는 활동 유저인지를 확인할 수 있다.
분석부(220)가 분석할 수 있는 가짜 유저 조건은 포스팅이 없고, 팔로워가 없거나 기준 이하로 유지되는 형태일 수 있다.
한편, 가짜 유저의 조건으로 의미없는 아이디 및 유저네임이 아랍, 그리스등 사용언어의 제3국어이거나, 비지니스 계정으로서 인스타그램 비지니스 계정, 유저 네임에 샵, 광고 관련 내용 포함(자연어 처리)될 수 있다.
한편, 분석부(220)는 '좋아요'를 입력한 유저인 경우 진짜 유저로 구분할 수 있다.
활동유저는, 좋아요와 팔로워 등의 활동이 실제로 나타나는 유저로 해석될 수 있다.
'좋아요'를 가짜로 입력한 유저의 경우, 가짜 유저(분석 결과) 포스팅 분석을 통해 분석이 가능하다. 한편, 분석부(220)는 판매 관련 플러스 요인으로, 3차수 이상 판매 진행한 포스팅이 있을 경우 가중치를 부여할 수 있다. 또한, 판매 관련 마이너스 요인으로, 판매 관련 포스팅의 좋아요, 댓글 가짜 유저 비율이 높을 경우에 마이너스 가중치를 부여할 수도 있다.
분석부(220)는 진짜 반응할 수 있는 유저로서, '댓글 진짜 유저 * (가짜 비율식) + 좋아요 진짜 유저 * (가짜 비율식) + 팔로워 진짜 유저 비율'을 산출할 수 있다.
또한, 분석부(220)는 진짜 반응할 수 있는 유저로서 '댓글 진짜 유저 * (가짜 비율식) + 좋아요 진짜 유저 * (가짜 비율식) + 팔로워 진짜 유저 비율 * 임의가중치'를 산출할 수 있다.
한편, 분석부(220)는 자동가중치로서, '진짜 / 가짜 * 임의의 값'을 산출할 수 있다. 또한, 분석부(220)는 타임가중치로서, '최근 포스팅 기준수 - 3일이내(5), 1주일(3), 한달이내(2), 3개월이내(1)'를 산출할 수 있다.
이러한 정보들을 활용하고, 분석부(220)는 최종 산출 점수를 위해, '자동가중치 * 진짜 반응 할 수 있는 유저 수 * 타임가중치 * 구매전환율 중간값 + (포스팅 분석 요인 비율 점수)'을 산출할 수 있다.
일실시예에 따른 리포트 생성부(230)는 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성할 수 있다.
영향력 리포트는 영향력 스코어를 포함하여 다양한 분석 정보들을 제공할 수 있다.
구체적으로, 영향력 리포트는 영향력 솔루션을 활용하여 최종적으로 사용자에게 제공하는 영향력 스코어 및 SNS 사용자 채널의 데이터를 리포트 형태로 제공될 수 있다.
특히, 영향력 리포트는 SNS 계정 기본 정보로서, SNS 사용자 채널이나 SNS 일반 계정의 닉네임, 아이디를 나타낼 수 있다. 또한, 영향력 리포트는 바이오그래피, 프로필이미지, 카테고리 등 텍스트나 이미지로 표시할 수 있다. 영향력 리포트는 팔로워(구독자)수, 팔로잉 수, 포스팅(미디어)수 등 숫자로 표시나. SNS 계정 분석 관련 정보 - 분석 시간, 분석 정확도, 분석 요청시간 등 리포트 생성 관련 시간을 나타낼 수 있다. 또한, 영향력 리포트는 SNS 사용자 채널에 대해 수치화한 영향력인 영향력 스코어를 나타내는 보고서로서, 엔진을 통해 생성된 계정의 종합적인 영향력을 나타낼 수 있다.
이 중에서, 영향력 스코어는 분석부(220)를 통해 생성된 계정의 팔로워수 등에 따라 산출되는 각각의 영향력 지수들에 기초하며, 영향력 측정 시스템(120)은 영향력 스코어로 SNS 사용자 채널들에 대한 순위를 매겨 상위 백분율에 따라 등급화 하여 표시할 수 있다.
영향력 리포트는 분석부(220)를 통해 생성된 진짜 응답율을 포함할 수 있다.
진짜 응답율은 연관 계정 포스팅 활동에 평균 반응한 수치를 포함한다.
진짜 응답율을 이용하면, 엔진의 자연어처리를 통해 분석된 댓글이 단순 메크로 작업으로 생성된 댓글인지 아닌지 판별하여 진짜 댓글을 추려내는 기준으로 활용할 수 있다.
또한, 진짜 응답율을 통해 '좋아요'가 실제 활동중인 계정의 비율을 통해 입력된 진짜 '좋아요'인지 판단할 수 있고, 진짜 좋아요와 진짜 댓글을 통해 진짜 응답율 산출할 수 있다.
뿐만 아니라, 영향력 리포트는 진짜 응답율을 기반으로 포스팅의 연속해서 '좋아요'를 입력 하거나 댓글을 남긴 사람들의 분포도를 표시할 수 있다.
영향력 리포트는 도달율을 표시할 수 있다.
도달율은 연관 계정의 진짜 비율을 통해 포스팅을 통한 도달율을 예측하여 도달수치로 표시될 수 있고, 관심계정 (SNS 사용자 채널이 멘션한/SNS 사용자 채널이 팔로잉 하는 브랜드 / 오디언스들이 팔로잉 하는 브랜드)을 나타낼 수 있다.
또한, 영향력 리포트는 영향력 지수를 표시할 수 있다.
영향력 지수는 SNS 사용자 채널에 대한 영향력을 수치화 하는데 필요한 각 항목으로서, 영향력 지수들을 조합하여 최종적으로 영향력 스코어를 산출할 수 있다,
일례로, 영향력 지수를 위해 대상자의 팔로워, 구독자수, 한달 간 최근 포스팅를 기준으로 분석 완료된 모든 연관 오디언스 유저들과 관련된 항목들이 추출될 수 있다. 또한, 대상자의 판매 포스팅 또는 마케팅 포스팅에 도달 할 수 있는 진짜 유저의 비율(도달율)을 계산하고 반응률 및 포스팅 빈도수 등을 계산하여 종합적인 영향력을 수치화할 수 있다.
리스트 정보에는 영향력에서 분석된 모든 SNS 사용자 채널은 카테고리별, 분야별로 검색하여 영향력 스코어와 SNS 계정을 리스팅할 수 있다. 또한, 카테고리엔 포스팅한 이미지나 캡션, 동영상의 연관 상품, 연관 장소를 필터링 할 수 있고, 해당 계정 오디언스의 성별 및 나이대, 팔로워수로 필터링 할 수 있다.
도 3는 일실시예에 따른 분석부(300)를 설명하는 도면이다.
고도화 중인 분석부(300)는 수집된 대용량의 SNS 데이터를 기반 중 이미지 데이터를 이미지 분석 파트와 이미지 이해 파트로 나뉘며 이를 바탕으로 얼굴 특징 추출, 의미 객체 분할, 나이/성별 분류, 안면 인식 등 과 같은 기능을 수행할 수 있다.
이를 위해, 분석부(300)는 오브젝트를 분석하기 위한 인코더(encoder), 엔티티를 분석하기 위한 룩업(Look up) 프로세스, 이미지를 분석하기 위한 CNN, 텍스트를 분석하기 위한 LSTM, 숫자 등을 분석하기 위한 FeedFwd 등의 모듈을 포함할 수 있다.
또한, 이렇게 분석된 데이터들은 도면부호 410에서 수치화될 수 있다.
예를 들어, 분석부(300)는 현재 영향력의 이미지 분석 기술을 위해 "ResNET 딥러닝 모델"을 기반으로 하고 있다.
ResNET 모델의 경우 Residual block 과 Forget gate를 도입해 그래디언트가 효과적으로 연계될 수 있도록 Layer 상의 skip connection이 설치될 수 있다. 즉, 분석부(300)는 타 모델과 대비하여 학습 속도와 정확성이 뛰어난 결과물을 산출할 수 있다.
분석부(300)는 영향력 분석을 위해 기계학습과 심층학습(인공신경망) 기 술을 활용할 수 있다. 특히, 최신 기계학습 모델 Word2Vec에 기 반한 형태소 분석 및 개체명 인식, Lexicon에 기반한 긍/부정 감성분석 및 구문분석은 기존 알고리즘 보다 빠르고 높은 성능을 제공하고, Word Embedding의 활용으로 자연어 처리에 대 한 심층학습 적용을 가능하게 한다.
분석부(300)는 대상자의 판매 포스팅이나 마케팅 포스팅에 반응 할 수 있는 진짜 유저의 비율을 계산하고 반응률 및 포스팅 빈도수 등을 계산하여 종합적인 영향력을 수치화하여 동일한 집단대비 백분율에 따라 등급을 산정할 수 있다.
진짜 영향력의 핵심은 진짜 유저를 찾는 분석부(300)의 오디언스 퀄리티를 검출 해내는데 기능에 있다. 가짜 오디언스들의 패턴과 반응, 포스팅에 대한 분석 모델링을 통해 지속적으로 발전하고 있다.
도 4는 가짜 징후를 찾는 방식을 설명하기 위한 개념도(400) 이다.
분석부(300)는 가짜 징후를 찾아 진짜 오디언스들을 판단할 수 있다.
이를 위해, 분석부(300)는 팔로워들의 사용하는 언어, 팔로워들의 비정상적인 아이디, SNS 사용자 채널의 활동 데이터 변화량, 팔로워들의 최근 활동 등을 분석할 수 있다.
먼저, 분석부(300)는 해당 SNS 사용자 채널 국가외의 언어를 사용하는 계정들을 추출할 수 있다. 예를 들어, SNS 사용자 채널이 특정 언어만 태깅하는 반면 전혀 다른 언어를 사용하는 계정에 대해 가짜 계정일 가능성이 높다.
또한, 분석부(300)는 식별 코드나 컴퓨터가 생성한 아이디 형태의 패턴을 검사할 수 있다.
일례로, ewiafji.5ijiena 와 같이 알 수 없는 아이디 형태로 되어 있으면 가짜 계정일 가능성이 높아 가짜로 식별될 수 있다. 또한, 분석부(300)는 코드나 컴퓨터가 생성한 아이디 형태의 패턴을 검사할 수 있다.
한편, 분석부(300)는 특정 날짜나 특정 시간대에 팔로워나 좋아요가 늘 경우 작업한 계정으로 판단할 수 있다. 예를 들어, 좋아요나 팔로잉 활동은 많지만 포스팅이 전혀 없거나 팔로워가 증가하지 않는 경우에 대해 분석할 수 있다.
도 5는 일실시예에 따른 영향력 측정 시스템의 동작 방법을 설명하는 도면이다.
일실시예에 따른 영향력 측정 시스템의 동작 방법은 SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집할 수 있다(단계 501).
예를 들어, 공개 데이터를 수집하기 위해, 영향력 측정 시스템의 동작 방법은 SNS(Social Network Service) 서버에 등록된 프로필 정보, 및 포스팅 정보, 채널 정보, 영상 정보, 이미지 정보 중에서 적어도 하나를 포함하는 공개 데이터를, 상기 SNS(Social Network Service) 서버에 쿼리하여 수집할 수 있다.
한편, 영향력 측정 시스템의 동작 방법은 공개 데이터를 수집하기 위해, SNS(Social Network Service) 서버에 의해 온라인 상에 공개되는 SNS 사용자 채널과 관련된 공개 데이터를 크롤링을 통해 수집할 수 있다.
다음으로, 영향력 측정 시스템의 동작 방법은 수집된 공개 데이터를 분석하여 SNS 사용자 채널에 대한 영향력 스코어를 분석할 수 있다(단계 502).
또한, 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성할 수 있다(단계 503).
영향력 측정 시스템의 동작 방법은 영향력 스코어를 분석하기 위해, 수집된 공개 데이터를 분류하고, 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석할 수 있다.
또한, 영향력 측정 시스템의 동작 방법은 영향력 스코어를 분석하기 위해, 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별할 수 있다.
영향력 측정 시스템의 동작 방법은 영향력 스코어를 분석하기 위해, 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 자연어 처리된 공개 데이터를 태깅화 하여 분류할 수 있다.
영향력 측정 시스템의 동작 방법은 영향력 스코어를 분석하기 위해, 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리할 수 있다.
영향력 측정 시스템의 동작 방법은 영향력 스코어를 분석하기 위해, 수집된 공개 데이터로부터, 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석 중에서 적어도 하나 이상의 분석을 처리하고, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값 중에서 적어도 하나를 반영하여 영향력을 수치화할 수 있다.
또한, 영향력 측정 시스템의 동작 방법은 수치화된 영향력을 영향력 스코어에 반영할 수 있다.
결국, 본 발명을 이용하면 SNS 사용자 채널에 대한 객관적인 평가 기준을 제공할 수 있다. 또한, SNS 사용자 채널에 대한 영향력을 수치화 함으로써, SNS 사용자 채널과 기업의 매출 증가에 따른 연관관계를 평가할 수 있고, 영향력 솔루션을 활용하여 최종적으로 사용자에게 제공하는 영향력 스코어 및 SNS 사용자 채널의 데이터를 리포트 형태로 제공할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다. 또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다. 이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다. 예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다. 또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다. 소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다. 소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다. 예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (20)

  1. SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 각 SNS 상에 공개되어 수집이 가능한 프로필 데이터, 활동 데이터 및 미디어 데이터를 포함하는 공개 데이터를 수집하는 수집 처리부;
    수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 영향력 스코어를 분석하는 분석부; 및
    상기 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성하는 리포트 생성부를 포함하고,
    상기 분석부는,
    상기 수집된 공개 데이터에 포함된 캡션, 태그, 댓글을 포함하는 텍스트 기반 데이터들을 머신러닝을 활용한 자연어 처리로 허위 문장, 광고 키워드, 감정 및 연관도, 형태소 분석을 통해 텍스트와 연관된 문장과 단어들을 모두 태깅화 하여 분류하고,
    프로필 이미지 및 포스팅 이미지를 포함하는 이미지 기반 데이터들을 학습시킨 머신러닝, 트레이닝 셋을 활용하여 이미지의 인물 분류, 장소 연관도, 브랜드 적합도, 카테고리를 판단하여 분류하고,
    상기 수집된 공개 데이터로부터 상기 텍스트 기반의 분류 및 상기 이미지 기반의 분류와 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석을 처리하고,
    상기 처리된 분석 결과를 이용하여, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값을 고려하여 최종 산출 점수를 산출하고, 상기 산출된 최종 산출 점수에 기초하여 상기 영향력 스코어를 결정하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  2. 제1항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  3. 제1항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 상기 자연어 처리된 공개 데이터를 태깅화 하여 분류하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  4. 제1항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  5. 제1항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터, 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석 중에서 적어도 하나 이상의 분석을 처리하고,
    상기 처리된 분석 결과를 이용하여,
    자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값 중에서 적어도 하나를 반영하여 영향력을 수치화하고,
    상기 수치화된 영향력을 영향력 스코어에 반영하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  6. 제5항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터 상기 댓글 분석을 처리하되,
    댓글 문장에 대한 자연어 처리 후, 진짜 유저인지 또는 가짜 유저인지를 판단하여 분석하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  7. 제6항에 있어서,
    상기 분석부는,
    상기 댓글 분석 결과, 상기 자연어 처리된 댓글 문장이 구매 관련 문의 또는 포스팅 이미지와 관련된 댓글 문장인 경우 진짜 유저로 판단하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  8. 제6항에 있어서,
    상기 분석부는,
    상기 댓글 분석 결과, 상기 자연어 처리된 댓글 문장이 봇 메크로 댓글 또는 다른 SNS 사용자 채널의 댓글인 경우 가짜 유저로 판단하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  9. 제5항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터 상기 팔로워 유저 분석을 처리하되, 팔로워에 대해 활동하는 실제 유저, 활동하지 않는 가짜 유저, 비즈니스 계정 중에서 적어도 하나를 판단하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  10. 제5항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터 상기 좋아요 유저 분석을 처리하되,
    입력된 좋아요에 대해 실제 유저로부터의 입력인지 가짜 유저로부터의 입력인지를 판단하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  11. 제5항에 있어서,
    상기 분석부는,
    상기 수집된 공개 데이터로부터 상기 포스팅 분석을 처리하되,
    등록된 포스팅에 판매 관련 플러스 요인 또는 판매 관련 마이너스 요인을 분석하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  12. 제11항에 있어서,
    상기 분석부는,
    3차수 이상 판매 진행한 포스팅이 있을 경우, 상기 판매 관련 플러스 요인에 대한 가중치를 부여하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  13. 제11항에 있어서,
    상기 분석부는,
    판매 관련 포스팅의 좋아요, 댓글 가짜 유저 비율이 기준 이상인 경우 상기 판매 관련 마이너스 요인에 대한 가중치를 부여하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  14. 제5항에 있어서,
    상기 분석부는,
    진짜 반응할 수 있는 유저, 자동 가중치, 타임 가중치를 고려하여 최종 산출 점수를 산출하고, 상기 산출된 최종 산출 점수에 기초하여 상기 영향력 스코어를 결정하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  15. 제1항에 있어서,
    상기 리포트 생성부는,
    상기 영향력 코어를 기반으로, SNS 계정 기본 정보, SNS 계정 분석 관련 정보, 실제 활동중인 연관 계정 비율, 진짜 응답율, 도달율 중에서 적어도 하나가 반영된 영향력 리포트를 생성하는 SNS 사용자 채널에 대한 영향력 측정 시스템.
  16. SNS(Social Network Service) 서버로부터 기등록된 계정으로 구분되는 SNS 사용자 채널에 대한 공개 데이터를 수집하는 단계;
    수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 영향력 스코어를 분석하는 단계; 및
    상기 분석된 영향력 스코어를 기반으로 영향력 리포트를 생성하는 단계를 포함하고,
    상기 영향력 스코어를 분석하는 단계는,
    상기 수집된 공개 데이터에 포함된 캡션, 태그, 댓글을 포함하는 텍스트 기반 데이터들을 머신러닝을 활용한 자연어 처리로 허위 문장, 광고 키워드, 감정 및 연관도, 형태소 분석을 통해 텍스트와 연관된 문장과 단어들을 모두 태깅화 하여 분류하고,
    프로필 이미지 및 포스팅 이미지를 포함하는 이미지 기반 데이터들을 학습시킨 머신러닝, 트레이닝 셋을 활용하여 이미지의 인물 분류, 장소 연관도, 브랜드 적합도, 카테고리를 판단하여 분류하고,
    상기 수집된 공개 데이터로부터 상기 텍스트 기반의 분류 및 상기 이미지 기반의 분류와 댓글분석, 팔로워 유저 분석, 좋아요 유저 분석, 포스팅 분석을 처리하고,
    상기 처리된 분석 결과를 이용하여, 자동 가중치, 타임 가중치, 진짜 반응할 수 있는 유저의 수, 구매전환율 중간값을 고려하여 최종 산출 점수를 산출하고, 상기 산출된 최종 산출 점수에 기초하여 상기 영향력 스코어를 결정하는 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법.
  17. 제16항에 있어서,
    상기 영향력 스코어를 분석하는 단계는,
    상기 수집된 공개 데이터를 분류하고, 상기 분류된 공개 데이터를 시계열적으로 저장하여 상기 영향력 스코어를 분석하는 단계
    를 포함하는 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법.
  18. 제16항에 있어서,
    상기 영향력 스코어를 분석하는 단계는,
    상기 수집된 공개 데이터로부터 오디언스에 대한 언어, 아이디, 최근 활동 중에서 적어도 하나를 분석하여 진짜한 오디언스를 선별하는 단계
    를 포함하는 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법.
  19. 제16항에 있어서,
    상기 영향력 스코어를 분석하는 단계는,
    상기 수집된 공개 데이터에 포함된 텍스트 기반의 데이터들에 대해 머신러닝을 활용한 자연어 처리를 수행하고, 상기 자연어 처리된 공개 데이터를 태깅화 하여 분류하는 단계
    를 포함하는 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법.
  20. 제16항에 있어서,
    상기 영향력 스코어를 분석하는 단계는,
    상기 수집된 공개 데이터에 포함된 이미지 기반의 데이터들에 대해 얼굴탐지, 음식탐지, 텍스트추출, 예측 중에서 적어도 하나를 처리하는 단계
    를 포함하는 SNS 사용자 채널에 대한 영향력 측정 시스템의 동작 방법.
KR1020200065603A 2020-06-01 2020-06-01 Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법 KR102407057B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200065603A KR102407057B1 (ko) 2020-06-01 2020-06-01 Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200065603A KR102407057B1 (ko) 2020-06-01 2020-06-01 Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20210148574A KR20210148574A (ko) 2021-12-08
KR102407057B1 true KR102407057B1 (ko) 2022-06-10

Family

ID=78867681

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200065603A KR102407057B1 (ko) 2020-06-01 2020-06-01 Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102407057B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240016816A (ko) 2022-07-29 2024-02-06 주식회사 마블러스 메타버스 내 사용자의 상태를 분석하는 시스템 및 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102584879B1 (ko) * 2022-12-06 2023-10-05 주식회사 비케이플랜 광고 효율성을 향상시킨 sns 광고 관리 서버
KR102586819B1 (ko) * 2022-12-16 2023-10-10 서민호 의류 상품 관련 정보 제공 방법
KR102546328B1 (ko) * 2023-03-06 2023-06-22 시너지마인 주식회사 온라인 마케팅을 위한 콘텐츠 정보 모니터링 및 콘텐츠 기획 자동화 솔루션 제공 방법, 장치 및 시스템

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101888919B1 (ko) * 2017-12-18 2018-08-16 주식회사 디너의여왕 사용자 영향력 기반의 광고 마케팅 방법 및 그를 위한 장치
KR102052344B1 (ko) * 2018-06-11 2019-12-04 옴니어스 주식회사 소셜 네트워크를 이용한 영향력 측정 방법 및 장치

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101937458B1 (ko) * 2017-05-22 2019-01-10 충북대학교 산학협력단 사용자 영향력 계산 방법
KR102075788B1 (ko) * 2017-12-22 2020-02-10 주식회사 하들소프트 빅 데이터를 활용한 건강정보 콘텐츠 추천 서비스 시스템
KR102013186B1 (ko) 2018-02-20 2019-08-22 오라클엔터 주식회사 인플루언서 활용 전자상거래 시스템
KR102068123B1 (ko) 2018-04-11 2020-01-20 (주)헤렌 인플루언서를 활용한 마케팅 서비스 제공 장치 및 그 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101888919B1 (ko) * 2017-12-18 2018-08-16 주식회사 디너의여왕 사용자 영향력 기반의 광고 마케팅 방법 및 그를 위한 장치
KR102052344B1 (ko) * 2018-06-11 2019-12-04 옴니어스 주식회사 소셜 네트워크를 이용한 영향력 측정 방법 및 장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240016816A (ko) 2022-07-29 2024-02-06 주식회사 마블러스 메타버스 내 사용자의 상태를 분석하는 시스템 및 방법

Also Published As

Publication number Publication date
KR20210148574A (ko) 2021-12-08

Similar Documents

Publication Publication Date Title
Yang et al. Botometer 101: Social bot practicum for computational social scientists
KR102407057B1 (ko) Sns 사용자 채널에 대한 공개 데이터를 분석하여 영향력 리포트를 제공하는 시스템 및 방법
KR101888919B1 (ko) 사용자 영향력 기반의 광고 마케팅 방법 및 그를 위한 장치
Mostafa Clustering halal food consumers: A Twitter sentiment analysis
Mazloom et al. Multimodal popularity prediction of brand-related social media posts
Keneshloo et al. Predicting the popularity of news articles
CN110163647B (zh) 一种数据处理方法及装置
Giasemidis et al. Determining the veracity of rumours on Twitter
KR102407056B1 (ko) Sns 사용자 채널에 대한 공개 데이터를 수집하고, 수집된 공개 데이터를 기반으로 영향력을 측정하는 시스템 및 방법
WO2017190610A1 (zh) 目标用户定向方法、装置和计算机存储介质
Siddiquie et al. Exploiting multimodal affect and semantics to identify politically persuasive web videos
Siering et al. Information processing on online review platforms
El Ballouli et al. Cat: Credibility analysis of arabic content on twitter
Rodrigues et al. Real-time Twitter trend analysis using big data analytics and machine learning techniques
CN114648392B (zh) 基于用户画像的产品推荐方法、装置、电子设备及介质
KR20210092979A (ko) 가짜 뉴스 인공지능 판별 시스템 및 그 방법
Ranjan Fake news detection using machine learning
Al-Otaibi et al. Finding influential users in social networking using sentiment analysis
CN110674288A (zh) 一种应用于网络安全领域的用户画像方法
Ahmed et al. Classification, detection and sentiment analysis using machine learning over next generation communication platforms
Li et al. Semantic‐enhanced multimodal fusion network for fake news detection
KR102404247B1 (ko) 고객 관리 시스템
Schmitz et al. Detecting anti-vaccine users on Twitter
Guo et al. Systematic comprehension for developer reply in mobile system forum
Kostakos et al. Inferring demographic data of marginalized users in twitter with computer vision APIs

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right