KR20160079830A - 소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법 - Google Patents

소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법 Download PDF

Info

Publication number
KR20160079830A
KR20160079830A KR1020167013934A KR20167013934A KR20160079830A KR 20160079830 A KR20160079830 A KR 20160079830A KR 1020167013934 A KR1020167013934 A KR 1020167013934A KR 20167013934 A KR20167013934 A KR 20167013934A KR 20160079830 A KR20160079830 A KR 20160079830A
Authority
KR
South Korea
Prior art keywords
community
topic
user
nodes
posts
Prior art date
Application number
KR1020167013934A
Other languages
English (en)
Inventor
에드워드 동진 김
브라이언 지아 리 켕
칸차나 파드마나반
Original Assignee
시소모스 엘.피.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 시소모스 엘.피. filed Critical 시소모스 엘.피.
Publication of KR20160079830A publication Critical patent/KR20160079830A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/248Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures
    • G06F16/9024Graphs; Linked lists
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • G06F17/3053
    • G06F17/30554
    • G06F17/30867
    • G06F17/30958
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters
    • H04W4/026Services making use of location information using location based information parameters using orientation information, e.g. compass
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/20Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel
    • H04W4/21Services signaling; Auxiliary data signalling, i.e. transmitting data via a non-traffic channel for social networking applications
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data

Abstract

소셜 네트워크에 있어서 가중된 영향력을 결정하기 위해 서버에 의해 실행되는 시스템 및 방법으로서:
상기 토픽과 관련된 포스트들을 결정하는 스텝;
댓글 포스트, 멘션 포스트, 및 리포스팅 중 하나 이상으로서 각각의 포스트를 특성화하는 스텝;
댓글이 달린 포스팅이 작성되고, 상기 멘션 포스트에 멘션되고, 리포스팅되어 있는 콘텐츠가 포스팅되고, 및/또는 상기 토픽과 관련된 하나 이상의 포스트들이 작성된 임의의 사용자 계정을 포함하는 사용자 계정 그룹을 생성하는 스텝;
상기 그룹 내 각각의 상기 사용자 계정들을 연결 그래프에 노드로서 나타내고 팔로워-팔로위 관계가 상기 노드들 간에 존재하는 경우에 하나 이상의 노드 쌍 간에 에지를 설정하는 스텝; 및 노드들 간의 각각의 에지에 대해 다수의 멘션 포스트, 다수의 댓글 포스트, 및 다수의 리포스트 중 하나 이상의 함수인 가중치를 결정하는 스텝을 포함하는 시스템 및 방법.

Description

소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법{SYSTEMS AND METHODS FOR DYNAMICALLY DETERMINING INFLUENCERS IN A SOCIAL DATA NETWORK USING WEIGHTED ANALYSIS}
(관련출원의 상호참조)
본 출원은 "소셜 데이터 네트워크의 인플루어선들을 결정하는 시스템 및 방법"이란 명칭으로 2013년 10월 25일에 제출된 미국 가특허출원 제61/895,539호, 및 "소셜 데이터 네트워크의 인플루언서들 및 그들의 커뮤니티들을 식별하는 시스템 및 방법"이란 명칭으로 2013년 11월 22일에 제출된 미국 가특허출원 제61/907,878호, 및 "소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법"이란 명칭으로 2014년 7월 3일자로 제출된 미국 가특허출원 제62/020,833호에 대해 우선권을 주장하고, 그 전체 내용은 본 명세서에 참조에 의해 원용된다.
이하는 통상 소셜 네트워크 데이터의 분석에 관한 것이다.
최근에 소셜 미디어는 개인과 소비자가 온라인으로(예를 들면, 인터넷 상) 상호작용하기 위한 대중적인 방식이 되었다. 또한, 소셜 미디어는 기업이 그들의 고객들, 팬들, 및 잠재적인 고객들과 온라인으로 상호하도록 하는 방법에 영향을 미친다.
광범위한 팔로잉을 갖는 특정 토픽에 대한 몇몇 블로거들이 식별되어 특정 제품을 홍보하거나 후원하는데 이용된다. 예를 들면, 인기있는 블로거의 웹사이트 상의 광고 스페이스는 관련 제품들 및 서비스들을 광고하는데 사용된다.
소셜 네트워크 플랫폼들은 사람들의 인플루언스 그룹에 사용된다. 소셜 네트워크 플랫폼들의 예는 페이스북, 트위터, 링크드인, 텀블러 및 핀터레스트라는 상표명으로 알려져 있는 것을 포함한다. 소셜 네트워크 플랫폼 내의 인기 있거나 전문성 있는 개인이 다른 사람들에게 마케팅하는데 사용될 수 있다. 소셜 네트워크 내의 사용자의 수가 증가하면 인기 있거나 영향력 있는(influential) 개인을 빠르게 식별하는 것이 보다 어려워진다. 또한, 특정 토픽 내의 영향력 있는 개인을 정확히 식별하는 것이 어렵다. 소셜 네트워크에서 인기있는 그들 사용자들 또는 전문가들을 본 명세서에 있어서 "인플루언서들"이라고도 한다.
지금부터 실시형태는 첨부 도면을 참조하여 단지 예로서 설명한다.
도 1은 소셜 데이터 네트워크에서 상호 관련된 사용자들을 나타내는 선도이다.
도 2는 컴퓨팅 장치와 커뮤니케이션하는 서버의 개략도이다.
도 3은 특정 토픽에 대한 사용자들 간의 가중된 관계들 및 그 가중된 관계들에 기초하여 인플루언서들의 커뮤니티들을 결정하기 위한 컴퓨터 실행가능 명령들의 예시 실시형태의 흐름도이다.
도 4는 상기 가중된 관계들에 기초하여 인플루언서들의 커뮤니티들을 결정하기 위한 컴퓨터 실행가능 명령들의 다른 예시 실시형태의 흐름도이다.
도 5는 상기 가중된 관계들에 의거하여 인플루언서들의 커뮤니티들을 결정하기 위한 컴퓨터 실행가능 명령들의 또 다른 예시 실시형태의 흐름도이다.
도 6은 소셜 네트워킹 데이터를 취득 및 저장하기 위한 컴퓨터 실행가능 명령들의 예시 실시형태의 흐름도이다.
도 7은 인덱스 스토어 내의 예시적인 데이터 구성요소들의 블록도이다.
도 8은 프로파일 스토어 내의 예시적인 데이터 구성요소들의 블록도이다.
도 9는 토픽 "맥카페"에 대한 예시적인 토픽 네트워크 그래프의 도면이다.
도 10은 도 9에 있어서의 상기 토픽 네트워크 그래프이 도면이며, 메인 클러스터 및 아웃라이어 클러스터의 분리를 보여준다.
도 11은 커뮤니티들의 분리에 기초하여 토픽 네트워크 내의 아웃라이어들을 식별하여 필터링하기 위한 컴퓨터 실행가능 명령들의 예시 실시형태의 흐름도이다.
도 12는 각 토픽 네트워크로부터 커뮤니티 클러스터들을 식별하고 제공하기 위한 컴퓨터 실행가능 명령들의 예시 실시형태의 흐름도이다.
도 13a 및 13b는 토픽 네트워크 내 인플루언서 커뮤니티들을 표시하는 GUI와 상호작용하기 위한 예시적인 스크린 샷들을 도시하고, 도 13a는 가중된 분석을 사용하지 않은 결과들을 나타내고, 도 13b는 가중된 분석을 사용한 결과들을 나타낸다.
도 14는 토픽 네트워크 내의 인플루언서 커뮤니티들을 가중된 분석을 사용하여 표시한 GUI와 상호작용하기 위한 예시적인 스크린 샷을 도시한다.
도 15a 및 도 15b는 토픽 네트워크 내에 인플루언서 커뮤니티들을 표시한 GUI와 상호작용하기 위한 예시적인 스크린 샷들을 도시하고, 도 15a는 가중된 분석을 사용하지 않은 결과를 나타내고, 도 15b는 가중된 분석을 사용한 결과는 나타낸다.
설명의 단순화 및 명료화를 위해 적절하다고 여겨지는 경우, 참조부호는 상응하거나 유사한 요소를 나타내기 위해 도면 중에 반복될 수 있다고 이해될 수 있다. 또한, 본 명세서에 설명된 예시 실시형태의 완전한 이해를 제공하기 위해 많은 구체적 사항들이 기재되어 있다. 그러나, 본 명세서에 기재된 예시 실시형태가 이들 구체적 사항들 없이 실시될 수 있음이 당업자에 의해 이해될 수 있다. 다른 경우, 본 명세서에 기재된 예시 실시형태가 불분명해지지 않게 하기 위해 공지의 방법들, 처리 과정들 및 구성요소들을 상세히 설명하지는 않는다. 또한, 상기 설명은 본 명세서에 기재된 예시 실시형태의 범위를 한정하는 것으로 간주해서는 안 된다.
소셜 네트워킹 플랫폼들은 다른 사람들이 보고, 듣는 콘텐츠(예를 들면, 소셜 네트워킹 플랫폼과 관련된 웹사이트들을 통해 커뮤니케이션하는 컴퓨팅 장치들의 네트워크를 통해) 등을 생성하고 포스팅하는 사용자들을 포함한다. 소셜 네트워킹 플랫폼들의 예로서는 페이스북, 트위터, 링크드인, 핀터레스트, 텀블러, 블로고스피어, 웹사이트, 공동작업(collaborative) 위키, 온라인 뉴스 그룹, 온라인 포럼, 이메일, 및 인스턴트 메시징 서비스가 있지만, 이들에 한정되는 것은 아니다. 현재 공지 및 향후 공지의 소셜 네트워킹 플랫폼들은 본 명세서에 기재된 원리에 따라 사용될 수 있다. 소셜 네트워킹 플랫폼들 그 플랫폼들의 사용자들에게 마케팅하고, 광고하는데 사용될 수 있다. 특정 토픽에 관련된 사용자들을 식별하는 것은 어렵다고 이해된다. 이것은 특정 토픽에 대해 영향력 있는 사용자들을 식별하는 것을 포함한다.
또한, 소셜 네트워크들은 브랜드 및 회사가 그 브랜드의 인플루언서들에게 그들의 메세지를 전하기 위해 다대한 잠재력을 제공한다는 것은 이해했다. 인플루언서들은 그 브랜드에 관심이 있는 사람들이며 그들의 의견들은 소셜 네트워크의 다수의 사람들에게 중요하다. 적절한 인플루언서들이 발견되면, 그들은 그 브랜드 메세지를 널리 알리고, 지지하고, 또는 옹호할 수 있다.
소셜 네트워크들은 인플루언서가 그들의 모든 팔로워들(예를 들면, 리트윗 또는 트위터를 사용한 @댓글) 또는 친구들(예를 들면, 페이스북을 통한 공유)에게 정보를 쉽게 전달할 수 있게 한다. 그러나, 적절한 인플루언서들을 식별할 때 분명한 주의점이 있다. 몇몇 그래프 분석 방법론은 키워드 쿼리를 사용하여 브랜드와 관련 있는 콘텐츠(예를 들면, 트윗 또는 포스트)를 생성하는 인플루언서들을 식별한다. 상기 방법은 개인 간의 팔로워-팔로잉(또는 친구) 관계를 고려하고 또한 이들 개인 간의 그룹화를 식별한다. 상기 그룹화는 브랜드가 다른 오디언스들에게 커스터마이즈 메세지를 전하도록 한다. 그러나, 모든 팔로워들(또는 친구들)이 브랜드에 대한 개인의 의견을 평가하고 퍼뜨리는 것은 아니다. 일반적인 데이터 측정에 기초하여 컴퓨터가 팔로워와 팔로위 관계의 중요도 및 특성화를 이해하는 것은 어렵다.
또한, 네트워크 내의 모든 링크가 동등하게 다뤄지는 경우, 이러한 접근은 인간 정신의 중요한 측면을 획득할 수 없음은 본 명세서에 있어서 이해했다. 사람들의 "신뢰"는 시간 경과에 따라 변화하는 경향이 있다. 예를 들면, 에이미가 앤과 조를 팔로우하는 동안(도 1 참조), 에이미는 특정 기간 내에 앤으로부터의 포스트들을 리포스팅하기로 했고 머지않아 조로부터의 포스트들을 리포스팅할 수 있었다. 따라서, 네트워크 내의 모든 링크는 동일한 관계를 나타내고 있어도 동등하게 중요하지는 않다.
용어 "포스트" 또는 "포스팅"은 소셜 데이터 네트워킹을 통해 다른 사람들과 공유된 콘텐츠를 말한다. 다른 사람이 액세스하는 서버 또는 웹사이트 또는 네트워크로 콘텐츠를 서브밋함으로써 포스트 또는 포스팅이 송신될 수 있다. 또한, 포스트 또는 포스팅은 두 장치 간의 메세지로서 송신될 수 있다. 포스트 또는 포스팅은 메세지, 이메일을 전송하는 것, 웹사이트에 코멘트를 다는 것, 블로그에 콘텐츠를 배치하는 것, 영상 공유 네트워크에 콘텐츠를 포스팅하는 것, 및 네트워킹 애플리케이션에 콘텐츠를 배치하는 것을 포함한다. 포스트의 형태는 텍스트, 이미지, 영상, 오디오 및 그 조합을 포함한다.
본 명세서에 사용된 바와 같이, 용어 "인플루언서"는 토픽과 관련된 콘텐츠를 주로 만들고 공유하여 소셜 데이터 네트워크에 있어서 다른 사용자들에게 영향력이 있다고 여겨지는 사용자 계정을 말한다. 보다 구체적으로, 인플루언서는 토픽에 관심이 있거나 토픽에 대해 콘텐츠를 생성한다고 여겨되고; 다수의 팔로워들(예를 들면, 또는 독자, 친구, 가입자)을 갖고, 그 중 상당수의 비율이 토픽에 관심이 있고; 토픽에 대한 인플루언서의 의견을 평가하는 토픽에 관심있는 상당수의 팔로워들을 갖는 소셜 데이터 네트워크에 나타내어지는 개인 또는 엔티티이다. 토픽의 예로서는 브랜드, 회사, 제품, 이벤트, 장소, 및 인물이 있지만, 이들에 한정되는 것은 아니다.
본 명세서에 사용된 바와 같이, 용어 "팔로워"는 제 2 사용자 계정에 의해 포스팅된 콘텐츠가 읽히고, 소비되기 위해 제 1 사용자 계정에 공개되도록 제 2 사용자 계정(예를 들면, 제 1 사용자 계정의 소셜 네트워킹 플랫폼들 중 적어도 하나와 관련되고 컴퓨팅 장치를 통해 액세스된 제 2 사용자 계정)을 팔로우하는 제 1 사용자 계정(예를 들면, 컴퓨팅 장치를 통해 액세스된 하나 이상의 소셜 네트워킹 플랫폼들과 관련된 제 1 사용자 계정)을 말한다. 예를 들면, 제 1 사용자가 제 2 사용자를 팔로우하면, 제 1 사용자(즉, 팔로워)는 제 2 사용자에 의해 포스팅된 콘텐츠를 수신할 수 있다. 여기서 특정 토픽에 대해 "관심"을 갖는 사용자는 그 특정 토픽에 대한 다수의 전문가들(예를 들면, 소셜 네트워킹 플랫폼과 관련된)을 팔로우하는 사용자 계정을 가리킨다. 어떤 경우는, 팔로워는 다른 사용자에 의해 포스팅된 콘텐츠와 결합한다(예를 들면, 콘텐츠를 공유하거나 리포스팅함으로써).
회사가 예를 들면, 브랜드의 메세지를 잠재적으로 널리 알리고 홍보할 수 있는 개인을 타깃으로 하기 위해 키 인플루언서(key influencer)들을 식별하는 것이 바람직하다. 이들 개인들을 결합하는 것은 브랜드의 온라인 메세지를 제어할 수 있어 발생할 수 있는 잠재적인 네거티브 감성을 감소시킬 수 있다. 이 프로세스의 신중한 관리는 예를 들면, 바이럴 마케팅 캠페인의 경우 온라인 마인드쉐어의 기하급수적인 성장으로 이어질 수 있다.
인플루언서들을 결정하는 다수의 과거 접근 방식은 팔로워나 친구의 수, 또는 포스트의 수와 같은 쉽게 계산할 수 있는 메트릭들에 중점을 두고 있다. 집계된 팔로워들이나 친구들의 총수는 그 전체 소셜 네트워크와 비슷하지만, 그것은 회사 또는 브랜드에 대한 사용자나 개인의 영향력을 나타내는 컴퓨팅 메트릭들을 통해 약간의 데이터를 제공한다. 이것은 노이지(noisy)한 인플루언서 결과로 이어지고 대규모의 잠재적인 사용자들을 조사하는데 시간이 소비된다.
몇몇 소셜 미디어 애널리틱스 회사들은 소셜 네트워크들에 인플루언서 스코어를 제공한다. 그러나, 많은 회사들은 신뢰할 수 있는(true) 인플루언서 메트릭이 아니라 팔로워 수 및 맨션 수(예를 들면, 트위터의 "트윗", 포스트, 메세지 등)의 대수식인 메트릭을 사용하는 것이 본 명세서에 알려져 있다. 예를 들면, 일부의 공지된 접근법은 가중치의 대략 80%를 팔로워 총수에 대해 할당하고, 나머지를 멘션의 수에 할당하는 이들 수의 로그 정규화를 이용한다.
대수식을 사용하는 이유는 팔로워 및 맨션의 카운팅 또는 탤링(tallying)이 소셜 네트워크의 사용자 프로파일에 즉시 업데이트되기 때문이다. 따라서, 계산은 리포트하기 위해 매우 빠르고 쉽다. 이것은 신뢰할 수 있는 인플루언서의 분석과 구별하기 위해 어소리티(Authority) 메트릭 또는 어소리티 스코어라고 불리는 경우가 있다.
예시 실시형태에 있어서, 예를 들면 어소리티 스코어는 사용자로부터의 포스트 수 및 동일한 사용자를 팔로우하는 팔로워의 수를 포함하는 몇몇 파라미터들의 선형 결합을 사용하여 컴퓨팅된다. 예시 실시형태에 있어서, 또한, 선형 결합은 동일한 사용자를 팔로우하는 앤실러리(ancillary) 사용자의 수에 기초해도 좋다.
그러나, 어소리티 스코어 접근에 몇몇 상당한 문제점이 있다. 이러한 어소리티 스코어가 컨텍스트 인센서티브(context insensitive)인 것이 본 명세서에서 이해된다. 이것은 토픽이나 쿼리에 관계없는 정적 메트릭이다. 예를 들면, 토픽에 상관없이 뉴욕 타임즈 또는 CNN과 같은 매스 미디어 아웃렛들은 수백만의 팔로워들을 갖고 있기 때문에 가장 높은 랭킹을 가질 수 있다. 따라서, 컨텍스트-인센서티브가 아니다.
또한, 이러한 어소리티 메트릭은 높은 팔로워 카운트 바이어스를 갖는 것이 본 명세서에서 이해된다. 팔로워의 수가 제한된 특정 분야에 있어서 명확히 규정된 스페셜리스트이지만 그들 모두가 전문가이기도 하다면, 그들은 낮은 팔로워 카운트로 인해 상위 20~100의 결과를 나타내지 못한다. 실질적으로, 모든 팔로워들은 동등한 가중치를 갖는 것으로 취급되고, 이것은 네트워크 애널리틱스 리서치에 있어서 잘못된 가정임이 나타내어져 있다.
본 명세서에 기재된 바와 같이, 상기 제안된 시스템 및 방법은 쿼리 토픽에 대해 인플루언서들을 동적 평가해도 좋고, 그들 팔로워들의 영향력을 설명해도 좋다.
또한, 인플루언서 관계의 회귀성은 인플루언서 식별을 대규모 스케일로 구현하는데 있어서 과제라고 인식된다. 일례로서, B와 C를 팔로잉하는 A; C와 A를 팔로잉하는 B; A만을 팔로잉하는 C의 개인 A, B 및 C가 있는 상황을 생각해보자. A의 영향력은 C에 의존적이고, 결과적으로 A와 B에 의존적이고, 계속 그러하다. 이렇게 하여, 인플루언서 관계는 회귀성을 갖는다.
보다 일반적으로, 상기 제안된 시스템 및 방법은 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하는 방법을 제공한다. 상기 제안된 예시적인 시스템 및 방법에 있어서, 가중된 에지 또는 커넥션은 네트워크 그래프를 개선하는데 사용되고 소셜 데이터 네트워크에 있어서의 상이한 사용자 노드들(예를 들면, 사용자 계정들) 간 몇몇 상이한 유형의 에지 또는 커넥션이 고려된다. 이들 유형의 에지 또는 커넥션은 (a) 한 사용자가 다른 사용자를 팔로우하는 팔로워 관계; (b) 한 사용자가 다른 사용자로부터의 동일한 콘텐츠를 재전송하거나 리포스팅하는 리포스트 관계; (c) 한 사용자가 다른 사용자에 의해 포스팅되거나 전송된 콘텐츠에 댓글을 다는 댓글 관계; 및 (d) 한 사용자가 다른 사용자를 포스팅에 맨션하는 맨션 관계를 포함한다.
소셜 네트워크의 예로서 상표명 트위터를 포함하지만 이들에 한정되는 것은 아니고, 상기 관계들은 이하와 같다.
리트윗(RT): 한 사용자가 다른 사용자의 트윗을 공유할 때 발생한다. "RT" 표시 후 간격을 띄우고 기호 @가 따른 후 트위터 사용자 핸들이 따르고, 예를 들면 "RT @ABC는 ABC로부터의 트윗이 따른다.
@댓글: 한 사용자가 다른 사용자의 트윗에 명시적으로 댓글을 달 때 발생한다. '@'기호를 표시한 후 트위터 사용자 핸들이 따르고, 예를 들면 @사용자명 후에 임의의 메세지가 다른다.
@멘션: 한 사용자가 명시적으로 댓글을 달려 하지 않고 트윗에 다른 사용자의 핸들을 포함시킬 때 발생한다. 사용자는 예를 들면 Hi @XYZ let's party @DEF @TUV처럼 그/그녀의 트윗 어딘가에 어떤 트위터 사용자 핸들이 따르는 @를 포함한다.
이러한 관계들은 타깃 사용자 핸들을 향해 소스 사용자 핸들로부터의 관심을 명시적으로 보여준다. 소스는 리트윗 또는 @댓글 또는 @멘션하는 사용자 핸들이고, 타깃은 메세지에 포함된 사용자 핸들이다.
가중된 에지를 사용하여 톱 인플루언서 및 그들의 커뮤니티를 식별하는 실시예에 있어서, 네트워크 링크는 가중되어 링크 중요도의 개념을 생성하고, 또한 외부 소스는 식별되어 소셜 데이터 네트워크에 통합된다. 외부 소스의 예는 예전 메세지 또는 콘텐츠 포스팅을 리포스팅하는 사용자들 및 그들의 활동, 또는 예전 메세지 또는 콘텐츠 포스팅을 참조하거나 멘션하는 사용자들 및 그 활동을 포함한다. 외부 소스의 다른 예는 소셜 데이터 네트워크에 있어서의 토픽을 멘션하는 사용자 및 그들의 활동이지만 그 토픽은 다른 사람이나 앤실러리 소셜 데이터 네트워크로부터 유래한다.
일례로서, 도 1에서 특정 토픽에 대한 단순화된 팔로워 네트워크를 고려한다. 도 1은 여러 링크: 팔로워-팔로잉 관계; 리포스트 관계를 갖는 소셜 네트워크를 묘사하고, 다른 하나는 댓글 관계이다. 도 1의 특정예에 나타내지 않아도 멘션 관계는 적용가능하다. 레이는 네트워크의 팔로워 수가 가장 많기 때문에 상당히 영향력이 있다는 것이 나타내어진다. 그러나, 릭과 브리도 레이가 그 둘을 팔로우하는 것과 같이 상당한 영향력을 갖는다. 릭과 브리 사이에서 릭은 레이가 릭의 포스트(예를 들면, 트윗 또는 메세지)에 댓글을 달고 리포스팅하기도 하기 때문에 강력한 인플루언서일 수 있다. 특정 네트워크에 있어서, 상기 인플루언서들은 릭과 레이일 것이다.
도 1에 나타내어진 바와 같이, 팔로워(또는 친구) 정보가 따르는 리포스트 및 댓글 관계(또는 공유)는 신뢰할 수 있는 인플루언서들의 보다 정밀한 그림을 제공하고 또한 식별된 그룹을 개선하는 것을 고려한다.
그래프에 있어서의 노드들은 레이의 사용자 계정 및 그 외 릭의 사용자 계정과 같은 상이한 사용자 계정들을 나타내는 것이 이해될 수 있다. 또한, 화살표의 방향은 제 1 사용자(예를 들면, 작성자, 출처, 다른 사람들에 의해 멘션된 개인 또는 계정, 팔로위 등)가 누구이며 제 2 사용자(예를 들면, 리포스터, 팔로워, 댓글을 다는 사람(replier), 멘션하는 사람 등)가 누구인지를 나타내는데 사용된다. 예를 들면, 화살표 머리부분은 제 1 사용자를 나타내고, 화살표 꼬리부분은 제 2 사용자들 나타낸다.
도 1에 있어서 각각의 사용자 계정 이외에, 페이지랭크 스코어가 제공된다. 페이지랭크 알고리즘은 네트워크에 있어서 웹사이트 페이지의 중요도를 측정하기 위해 구글이 사용하는 공지된 알고리즘이며, 소셜 데이터 네트워크에 있어서 사용자의 중요도를 측정하기 위해 적용될 수도 있다.
수명의 전문가들이 누군가를 전문가라고 간주하면, 그/그녀도 전문가인 것으로 직관한다. 그러나, 페이지랭크 알고리즘은 팔로워 수를 카운팅만하는 것보다 더욱 우수한 영향력의 크기를 제공한다. 후술하는 바와 같이, 페이지랭크 알고리즘 및 그 외 유사한 랭킹 알고리즘은 본 명세서에 기재된 제안된 시스템 및 방법을 이용하여 사용될 수 있다.
제안된 시스템 및 방법은 인플루언서들이 외부 소스들로부터 유래한다고 인식되기도 한다. "외부" 소스의 개념은 두 가지 형태를 취할 수 있다. 먼저, 인플루언서가 최근에 특정 토픽에 트윗되지 않아도 이 토픽에 대한 그녀의 영향력을 고려하여 Twitter-sphere가 계속해서 그녀를 멘션하거나 그녀의 예전 포스트들 중 하나를 리트윗할 수 있다. 예를 들면, 스포츠 전문가는 슈퍼 볼에 대한 그/그녀의 의견을 공유하고 그 의견은 실제 게임 후 수개월간 이야기하게 된다.
둘째, 개인은 네트워크의 외부 소스로부터 유래하는 토픽에 대해 종종 대화한다. 예를 들면, 유튜브에 호스팅된 영상이 트윗될 수 있다. 두 가지 경우에 있어서 제안된 시스템 및 방법은 인플루언서들로서 영상/의견 소스를 캡쳐하는 것을 목표로 한다.
일반적인 예시 실시형태에 있어서, 가중된 네트워크 분석 방법론은 (1) 네트워크 링크를 가중시켜 "링크 중요도"의 개념을 생성하고 (2) 어떤 주요 "외부" 소스를 네트워크에 포함시키거나 식별함으로써 커뮤니티 및 그들의 상위 인플루언서들을 식별하기 위해 제공된다. 또한, 모든 커뮤니티에 걸친 상위 인플루언서들의 집계 리스트가 제공되고, 이것은 모든 인플루언서들의 상대적 순위를 결정하는 것을 돕기 위해 사용된다. 커뮤니티들 및 인플루언서들의 시각화는 최종 사용자들이 그들 커뮤니티들에 있어서의 그들의 상호연계성 및 각각의 인플루언서들의 상대적인 중요도 및 스케일을 이해할 수 있게 한다.
도 2를 참조하여, 제안된 시스템의 개략도가 나타내어진다. 서버(100)는 네트워크(102)를 통해 컴퓨팅 장치(101)와 커뮤니케이션한다. 서버(100)는 소셜 네트워크 데이터를 취득하여 분석하고 네트워크를 통해 컴퓨팅 장치(101)에 결과를 제공한다. 컴퓨팅 장치(101)는 GUI를 통해 사용자 입력을 수신하여 분석을 위해 파라미터들을 제어할 수 있다.
소셜 네트워크 데이터는 사용자들에 의해 생성된 또는 조직화된 콘텐츠뿐만 아니라 소셜 네트워크 플랫폼의 사용자들에 대한 데이터를 포함하는 것이 이해될 수 있다. 소셜 네트워크 데이터의 예는 사용자 계정 ID 또는 사용자명, 사용자 또는 사용자 계정의 설명, 메세지 또는 사용자에 의해 포스팅된 다른 데이터, 사용자와 다른 사용자들 간의 커넥션, 위치 정보 등을 포함하지만 이들에 한정되는 것은 아니다. 커넥션의 예는 본 명세서에서 "리스트"라고도 불리는 "사용자 리스트"이고, 이것은 리스트명, 리스트의 설명 및 특정 사용자가 팔로우하는 한명 이상의 다른 사용자들을 포함한다. 사용자 리스트는 예를 들면, 특정 사용자에 의해 작성된다.
도 2에 계속하여, 서버(100)는 프로세서(103) 및 메모리 장치(104)를 포함한다. 예시 실시형태에 있어서, 서버는 하나 이상의 프로세서 및 대용량의 메모리 용량을 포함한다. 다른 예시 실시형태에 있어서, 메모리 장치(104) 또는 메모리 장치들은 읽기/쓰기 성능을 향상시키기 위한 솔리트 스테이트 드라이브이다. 다른 예시 실시형태에 있어서, 다수의 서버들은 본 명세서에 기재된 방법을 실행하기 위해 사용된다. 즉, 예시 실시형태에 있어서 서버(100)는 서버 시스템을 말한다. 다른 예시 실시형태에 있어서, 그 외 현재 공지의 컴퓨팅 하드웨어 또는 향후 공지의 컴퓨팅 하드웨어, 또는 둘 모두가 사용된다.
또한, 서버(100)는 커뮤니케이션 장치(105)를 포함하여 네트워크(102)를 통해 커뮤니케이션한다. 네트워크(102)는 유선 또는 무선 네트워크이어도 좋고, 둘 모두이어도 좋다. 또한, 서버(100)는 컴퓨팅 장치(101)를 통해 데이터를 표시 및 수신하기 위한 GUI 모듈(106)을 포함한다. 또한, 서버는 소셜 네트워킹 데이터 모듈(107); 인덱서 모듈(108); 사용자 계정 관계 모듈(109); 커뮤니티 식별 모듈(112) 및 특성 식별 모듈(113)을 포함한다. 설명하는 바와 같이, 커뮤니티 식별 모듈(112)은 네트워크 그래프에 기초하여 데이터의 클러스터 또는 커뮤니티들을 규정하도록 설정된다.
또한, 서버(100)는 데이터 스토어(116), 인덱스 스토어(117), 소셜 그래프의 데이터베이스(118), 프로파일 스토어(117), 커뮤니티 그래프 정보를 저장하기 위한 데이터베이스(128), 및 각각의 커뮤니티(129)에 대해 인기있는 특성들을 저장하고 각각의 커뮤니티들 내에서 검색되는 사전 규정된 특성들을 저장하기 위한 데이터베이스를 포함하는 다수의 데이터베이스를 포함하고, 그 커뮤니티는 커뮤니티 식별 모듈(112)에 의해 규정된다.
소셜 네트워킹 데이터 모듈(107)을 사용하여 소셜 네트워킹 데이터의 스트림을 수신한다. 예시 실시형태에 있어서, 수백만개의 신규 메세지가 매일 실시간으로 소셜 네트워킹 데이터 모듈(107)에 보내진다. 소셜 네트워킹 데이터 모듈(107)에 의해 수신된 소셜 네트워킹 데이터는 데이터 스토어(116)에 저장된다.
인덱서 모듈(108)은 데이터 스토어(116) 내의 데이터 상에 인덱서 프로세스를 실행하고 그 인덱스된 데이터를 인덱스 스토어(117)에 저장한다. 예시 실시형태에 있어서, 인덱스 스토어(117) 내의 인덱스된 데이터는 보다 쉽게 검색될 수 있고, 인덱스 스토어의 식별자는 실제 데이터(예를 들면, 완전한 메세지)를 검색하는데 사용될 수 있다.
또한, 소셜 그래프는 도시되지 않은 소셜 네트워킹 플랫폼 서버로부터 취득되고, 소셜 그래프 데이터베이스(118)에 저장된다. 쿼리에의 입력으로서 사용자가 특정되면 소셜 그래프는 쿼리된 사용자를 팔로잉하는 모든 사용자들을 되돌리는데 사용될 수 있다.
프로파일 스토어(119)는 사용자 프로파일에 관련된 메타데이터를 저장한다. 프로파일 관련 메타데이터의 예는 특정 사용자의 팔로워의 총수, 특정 사용자의 자기 공개 개인정보, 특정 사용자의 위치 정보 등을 포함한다. 프로파일 스토어(119) 내의 데이터가 쿼리될 수 있다.
예시 실시형태에 있어서, 사용자 계정 관계 모듈(109)은 소셜 그래프(118)와 프로파일 스토어(119)를 사용하여 어떤 사용자들이 특정 사용자를 팔로잉하는지를 결정한다. 또한, 모듈(109)은 댓글 관계, 멘션 관계, 및 리포스트 관계를 포함한, 사용자 계정들 간의 관계가 결정되도록 설정된다.
도 2를 다시 참조하여, 서버(100)는 토픽 네트워크 및 관련 인플루언서 내에서 커뮤니티(예를 들면, 토픽 A 등의 쿼리된 토픽 내의 정보의 클러스터)를 식별하도록 설정된 커뮤니티 식별 모듈(112)을 더 포함한다. 도 3을 참조하여 설명되는 바와 같이, 토픽 네트워크는 영향력 있는 사용자들 및 그들 관계의 그래프(예를 들면, 소셜 그래프(118)에 의해 규정된)를 도시한다. 커뮤니티 식별 모듈(112)로부터의 출력은 공통의 특성을 함유하고 및/또는 다른 커뮤니티보다는 동일 커뮤니티 내의 다른 엔티티(예를 들면, 인플루언서)에 의해 더 큰 영향을 받고 있는(예를 들면, 팔로워-팔로위 관계 등에 영향을 미치는) 토픽 네트워크의 커뮤니티로서 규정된 클러스터의 시각적 식별(예를 들면, 컬러 코드화)을 포함한다. 서버(100)는 특성 식별 모듈(113)을 더 포함한다.
특성 식별 모듈(113)은 커뮤니티 식별 모듈(112)로부터 상기 식별된 커뮤니티를 수신하고 커뮤니티 구성원들 중의 인기있는 특성들(예를 들면, 대화의 토픽)의 식별을 제공하도록 구성된다. 특성 식별 모듈(113)의 결과는 커뮤니티 식별 모듈 (112)에 제공된 커뮤니티의 상응하는 시각화와 시각적으로 연결될 수 있다. 설명되는 바와 같이, 일측면에 있어서, 커뮤니티 식별 모듈(112)(예를 들면, 복수의 커뮤니티) 및/또는 특성 식별 모듈(113)(예를 들면, 각각의 커뮤니티 내에서 인기있는 복수의 특성)의 결과가 컴퓨팅 장치(101)에의 출력으로서 디스플레이 스크린(125)에 표시된다. 또 다른 측면에 있어서, GUI 모듈(106)은 커뮤니티 식별 모듈(112)에 의해 식별된 특정 커뮤니티의 선택을 위해 컴퓨팅 장치(101)로부터의 입력을 수신하도록 설정된다. 그 후 GUI 모듈(106)은 특성 식별 모듈(113)과 커뮤니케이션하고, 상기 선택된 커뮤니티(예를 들면, 선택된 커뮤니티 내에서 영향력 있는 모든 사용자)와 관련된 특정 특성(예를 들면, 인기있는 대화를 규정)에 대한 결과의 출력을 제공하도록 설정된다. 특성 식별 모듈(112)의 결과(예를 들면, 선택된 커뮤니티의 사용자들 사이에서 인기있는 대화를 시각적으로 규정하는 워드 클라우드)는 선택된 특정 커뮤니티 및/또는 선택된 특정 커뮤니티 내의 사용자들의 리스팅과 함께 디스플레이 스크린(125)에 표시될 수 있다.
도 2에 계속하여, 컴퓨팅 장치(101)는 네트워크(102), 프로세서(123), 메모리 장치(124), 디스플레이 스크린(125), 및 인터넷 브라우저(126)를 통해 서버(100)와 커뮤니케이션하기 위한 커뮤니케이션 장치(122)를 포함한다. 예시 실시형태에 있어서, 인터넷 브라우저를 통해 상기 서버(100)에 의해 제공된 GUI가 컴퓨팅 장치에 의해 표시된다. 다른 예시 실시형태에 있어서, 애널리틱스 애플리케이션(127)을 컴퓨팅 장치(101)에 사용할 수 있는 경우, 상기 애널리틱스 애플리케이션(127)을 통해 GUI가 컴퓨팅 장치에 의해 표시된다. 디스플레이 장치(125)는 컴퓨팅 장치의 일부(예를 들면, 모바일 장치, 태블릿, 랩탑 등)이어도 좋고 또는 컴퓨팅 장치로부터 분리(예를 들면, 데스크탑 컴퓨터 등)되어도 좋다.
도시되어 있지 않지만, 다양한 사용자 입력 장치(예를 들면, 터치 스크린, 롤러 볼, 광 마우스, 버튼, 키보드, 마이크로폰 등)는 사용자와 컴퓨팅 장치(101) 간의 상호작용을 용이하게 하기 위해 사용될 수 있다.
다른 예시 실시형태에 있어서, 상기 시스템은 다수의 서버를 포함하는 것이 이해될 수 있다. 다른 예시 실시형태에 있어서, 하나 이상의 서버와 커뮤니케이션하는 다수의 컴퓨팅 장치가 있다.
명령들을 실행하는 본 명세서에 예시된 임의의 모듈 또는 구성요소가 포함되거나, 그렇지 않으면 저장 매체, 컴퓨터 저장 매체, 또는 예를 들면 자기 디스크, 광 디스크, 또는 테이프와 같은 데이터 저장 장치(착탈식 및/또는 비착탈식) 등의 컴퓨터 판독가능 매체에 액세스되는 것이 이해될 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령들, 데이터 구조들, 프로그램 모듈들, 또는 다른 데이터와 같은 정보 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 착탈식 및 비착탈식 매체를 포함해도 좋다. 컴퓨터 저장 매체의 예는 RAM, ROM, EEPROM, 플래쉬 메모리 또는 다른 메모리 기술, CD-ROM, 디지털 다목적 디스크(DVD) 또는 다른 광학 저장장치, 자기 카세트, 자기 테이프, 자기 디스크 저장장치 또는 다른 자기 저장장치, 또는 원하는 정보를 저장하기 위해 사용될 수 있고 애플리케이션, 모듈, 또는 둘 모두에 의해 액세스될 수 있는 임의의 다른 매체를 포함한다. 이러한 임의의 컴퓨터 저장 매체는 서버(100) 또는 컴퓨팅 장치(101)의 일부이어도 좋고 또는 그것에 액세스가능하거나 접속가능해도 좋다. 이러한 컴퓨터 판독가능 매체에 의해 저장되거나 유지될 수 있는 컴퓨터 판독가능/실행가능 명령들을 사용하여 본 명세에 설명된 임의의 애플리케이션 또는 모듈을 실행해도 좋다.
도 3를 참조하여, 컴퓨터 실행가능 명령들의 예시 실시형태는 특정 토픽에 대한 하나 이상의 인플루언서들을 결정하는 것을 보여준다. 도 3에 나타내어진 프로세스는 소셜 네트워크 데이터가 서버(100)에 이용가능하고, 상기 소셜 네트워크 데이터가 다수의 사용자를 포함하는 것을 전제로 한다. 블록(301)에 있어서, 서버(100)는 T로 나타내어진 토픽을 취득한다. 예를 들면, 사용자는 컴퓨팅 장치(101)에 표시된 GUI를 통해 토픽에 관여할 수 있고, 컴퓨팅 장치(101)는 토픽을 서버(100)에 전송한다. 블록(302)에 있어서, 서버는 토픽을 사용하여 그 토픽에 관련된 모든 포스트들을 식별한다. 이들 포스트들의 세트를 통틀어 PT로 표기한다. 예시 실시형태에 있어서, 지정된 기간과 같은 하나 이상의 추가 검색 조건이 사용된다. 즉, 서버는 토픽과 관련된 특정 기간 내의 포스트만을 확인할 수 있다. 특정 토픽과 관련된 포스트들을 찾는 것은 다양한 방법으로 실행될 수 있고 이하에 보다 상세히 설명된다.
도 3에 계속하여, 서버는 포스트(PT)의 작성자를 취득하고 순위에 기초하여 상위 N명의 작성자들을 식별한다(블록(303)). 상위에 순위화된 작성자의 세트는 AT로 표시된다. 예시 실시형태에 있어서, 어소리티 스코어를 사용하여 상위 N명의 작성자들이 식별된다. 다른 방법 및 프로세스가 작성자들을 순위화하는데 사용될 수 있다. 예를 들면, 서버는 페이지랭크를 사용하여 토픽 네트워크 내의 사용자의 중요도를 측정하고 그 측정값에 기초하여 사용자를 순위화한다. 사용될 수 있는 랭킹 알고리즘의 다른 예는 아이겐벡터 중심성(Eigenvector Centrality), 가중 정도, 중개성, 허브 및 어소리티 메트릭들을 포함하지만 이들에 한정되는 것은 아니다.
포스트들을 작성한 작성자들이 소셜 네트워크에 있어서 사용되는 것이 이해된다. 또한, N이 카운팅 수라는 것이 이해된다. N값의 예는 3,000~ 5,000 범위 내의 값을 포함하지만 이들에 한정되는 것은 아니다. 다른 N값이 사용될 수 있다.
블록(304)에 있어서, 서버는 각각의 포스트(PT)를 "댓글", "멘션", 또는 "리포스트"로 특성화하고, 댓글이 달린 사용자, 멘션된 사용자, 및 리포스팅된 콘텐츠를 생성하는 사용자(예를 들면, 댓글이 달린 사용자들을 UR, 멘션된 사용자들을 UM, 사용자들(URP)로부터의 리포스팅된 콘텐츠를 그룹화함)를 각각 식별한다. 사용자들 간의 상호작용이 최근인지의 여부를 결정하기 위해, 또는 "최근"의 등급을 결정하기 위해 댓글, 멘션, 리포스트 등 각각의 타임 스탬프 등이 기록될 수도 있다.
블록(305)에 있어서, 서버는 상위 N명의 작성자(AT) 및 사용자들(UR, UM, 및 URP)을 결합하는 '관심 사용자들'라고 불리는 리스트를 생성한다. '관심 사용자들' 리스트 또는 그룹에 있어서의 사용자 수의 예는 3,000~10,000 범위 내이지만 이들에 한정되는 것은 아니다. '관심 사용자들' 그룹 또는 리스트에 있어서의 사용자의 수는 다른 값이어도 좋은 것이 이해될 수 있다.
'관심 사용자들' 리스트에 있어서의 각각의 사용자 각각에 대하여, 서버는 각각의 사용자의 팔로워들을 식별한다(블록(306)). 블록(307)에 있어서, 서버는 '관심 사용자들'의 일부인 사용자들 간의 팔로워 관계를 계속 식별하면서 '관심 사용자들' 리스트에 리스팅되지 않은 팔로워들을 삭제한다.
블록(306)의 비한정적인 예시 실행에 있어서, '관심 사용자들'과 관련된 모든 팔로워들을 고려했을 때 수백만의 팔로워 커넥션 또는 에지가 있다는 것을 찾아냈다. 이들 모든 팔로워 에지들이 계산적으로 소비될 수 있는 것을 고려하면 영향력 있는 상호작용이 보여질 수 없다. 팔로워 에지의 수를 감소시키기 위해서 '관심 사용자들'의 일부가 아닌 팔로워들은 블록(307)에 따라 폐기된다.
블록(306) 및 블록(307)의 다른 실시형태에 있어서, 서버는 '관심 사용자들' 그룹에 리스팅된 사용자들만에 한정된 팔로워 관계를 식별한다.
블록(308)에 있어서, 서버는 '관심 사용자들'에 있어서의 각각의 사용자와 그 팔로워들 간의 링크를 생성한다. 이것은 모든 링크가 동일한 가중치(예를 들면, 가중치 1.0)를 갖는 팔로워-팔로잉 네트워크를 생성한다.
블록(309)에 있어서, '관심 사용자들' 리스트의 각각의 사용자 쌍(예를 들면, A. B) 사이에서 서버는 A가 B를 멘션하는 인스턴스의 수, A가 B에 댓글을 다는 인스턴스의 수, 및 A가 B로부터 콘텐츠를 리포스팅하는 인스턴스의 수를 식별한다. 사용자 쌍이 팔로워-팔로위 관계를 가질 필요는 없다는 것이 이해할 수 있다. 예를 들면, 사용자 A가 사용자 B를 팔로우하지 않을 수 있지만, 사용자 A는 사용자 B를 멘션할 수 있거나 사용자 B로부터 콘텐츠를 리포스팅할 수 있거나 사용자 B로부터의 포스팅에 댓글을 달 수 있다. 이렇게 해서, 한 사람이 다른 사람의 팔로워가 아닌 경우이어도 사용자 쌍(A, B) 간의 에지 또는 링크가 존재할 수 있다.
또한, 블록(310)에 있어서 각각의 사용자 쌍(예를 들면, A, B) 사이에서 서버는 쌍 A, B 간의 링크 또는 에지와 관련된 가중치를 컴퓨팅하고, 그 가중치는 적어도 A가 B를 멘션하는 인스턴스 수, A가 B에 댓글을 다는 인스턴스 수, 및 A가 B로부터의 콘텐츠를 리포스팅하는 인스턴스 수의 함수이다. 예를 들면, 인스턴스 수가 많을수록 가중치가 높다.
예시 실시형태에 있어서, 블록(308)에 있어서 팔로워-팔로위 링크가 존재하는 경우 에지의 가중치가 제 1 값(예를 들면, 1.0)으로 초기화되고, 팔로워-팔로위 링크가 존재하지 않는 경우 상기 에지는 제 2 값(예를 들면, 0)으로 초기화되고, 여기서 상기 제 2 값은 상기 제 1 값보다 작다. 2명의 사용자들 간의 각각의 추가 활동(예를 들면, 댓글, 리포스트, 멘션)은 에지 가중치를 최대 가중치 4.0으로 증가시킨다. 다른 수 또는 범위가 가중치를 나타내는데 사용될 수 있다.
예시 실시형태에 있어서, 활동 또는 인스턴스 수의 증가 및 가중치의 증가 사이의 관계는 기하급수적으로 감소하는 스케일에 의해 특성화된다. 예를 들면, A가 B를 팔로우하는 사용자 쌍 A, B를 고려한다. 2개의 리포스트가 존재하면 가중치는 2.0이다. 20개의 리포스트가 존재하면 가중치는 3.9이다. 400개의 리포스트가 존재하면, 가중치는 4.0이다. 이들 숫자는 단지 예시이고 다른 숫자 및 범위가 사용될 수 있다는 것이 이해된다.
예시 실시형태에 있어서, 또한 상기 가중치는 얼마나 최근에 상호작용(예를 들면, 리포스트, 멘션, 댓글 등)이 일어났는지에 기초한다. '최근'의 등급은 쿼리가 실행된 날짜와 상호작용이 일어난 날짜 간의 시간차를 결정함으로써 컴퓨팅된다. 예를 들면, 상호작용이 더 최근에 일어났다면 가중치가 더 높다.
도 3에 계속하여, 블록(311)에 있어서, 서버는 '관심 사용자들' 리스트의 사용자들과 그들의 관계에 각각 상응하는 노드 및 에지의 네트워크 그래프를 컴퓨팅하고, 여기서 상기 관계 또는 에지가 가중된다(예를 들면, 토픽 네트워크라고도 불린다).
블록(312)에 있어서, 서버는 토픽 네트워크 내에서 사용자들 간의 커뮤니티들(예를 들면, C1, C2,..., Cn)을 식별한다. 커뮤니티들의 식별은 다른 커뮤니티 내의 노드에 비해 한 커뮤니티 내 노드 간의 연결도에 의존할 수 있다. 즉, 커뮤니티는 규정된 커뮤니티의 외부에 있는 엔티티보다 내부적으로 연결도가 높은(예를 들면, 동일 커뮤니티 내 다른 노드들에 대해) 엔티티들 또는 노드들에 의해 규정된다. 규정되는 바와 같이, 한 커뮤니티를 다른 커뮤니티로부터 분리하는데 사용된 연결도의 값 또는 임계값은 사전 규정될 수 있다(예를 들면, 커뮤니티 그래프 데이터베이스(128) 및/또는 컴퓨팅 장치(101)로부터의 사용자 정의에 의해 제공된 바와 같이). 이렇게 해서 해상도(resolution)는 커뮤니티 내의 노드들 간의 상호연결성의 정도를 규정한다. 이렇게 해서 각각의 식별된 커뮤니티 그래프는 각각의 커뮤니티의 노드들 및 에지들(토픽 네트워크)의 네트워크 그래프의 서브세트이다. 일측면에 있어서, 커뮤니티 그래프는 커뮤니티 그래프를 이용한 커뮤니티 내 사용자들의 시각적 표시(예를 들면, 노드로서)와 커뮤니티 내 사용자들의 텍스츄얼 리스트(예를 들면, 도 2의 디스플레이 스크린(125)에 제공된 바와 같이)를 더 표시한다. 또 다른 측면에 있어서, 커뮤니티 내 사용자들의 리스팅의 표시는 커뮤니티 내 및/또는 토픽 T에 대한 모든 커뮤니티들 내에서의 영향력의 정도에 따라 순위화된다(예를 들면, 도 2의 디스플레이 스크린(125)에 제공되는 바와 같이). 블록(312)에 따라, 사용자들(UT)은 UC1, UC2,...UCn 등의 커뮤니티 그래프 분류로 나뉜다.
블록(313)에 있어서, 각각의 특정 커뮤니티(예를 들면, C1)에 대하여, 서버는 그들의 소셜 네트워크 데이터를 기반으로 한 특정 커뮤니티 내의 사용자들(예를 들면, UC1) 과 관련된 사전 정의된 특성(공통의 단어 및 어구, 대화의 토픽, 공통의 위치, 공통의 사진, 공통의 메타데이터)에 인기있는 특성값을 결정한다. 선택된 특성(예를 들면, 토픽 또는 위치)는 사용자 정의(예를 들면, 컴퓨팅 장치(101)로부터의 입력을 통해)될 수 있고, 및/또는 자동 생성(예를 들면, 동일한 토픽 네트워크 내의 다른 커뮤니티들에 대한 특성을 기반으로 하거나, 또는 동일한 토픽 T에 대한 이전에 사용된 특성에 기반으로 하여)될 수 있다. 블록(314)에 있어서, 서버는 식별된 커뮤니티들(예를 들면, C1 ; C2,..., Cn) 및 각 특정 커뮤니티와 관련된 인기있는 특성을 출력한다. 상기 식별된 커뮤니티들은 각 커뮤니티에 대한 사전 정의된 특성의 특성값과 시각적 관련이 있는 커뮤니티 그래프로서 출력될 수 있다(예를 들면, 디스플레이 스크린(125) 상에 표시하기 위해 서버를 통해서).
도 4를 참조하여, 컴퓨터 실행가능 또는 프로세서 실행 명령의 다른 예시 실시형태가 제공된다. 블록(301)~블록(311)이 실행된다. 블록(311)에 이어서, 블록(401)에서 서버는 토픽 네트워크 내의 사용자들을 순위화한다. 예를 들면, 서버는 페이지랭크를 사용하여 토픽 네트워크 내의 사용자의 중요도를 평가하고 그 평가에 의거하여 사용자를 순위화한다. 사용될 수 있는 랭킹 알고리즘들의 예는 아이겐벡터 중심성, 가중 정도, 중개성, 허브 및 어소리티 메트릭들을 포함하지만 이들에 한정되는 것은 아니다.
서버는 토픽 네트워크 내의 아웃라이어 노드들을 식별하고 필터링한다(블록(402)). 아웃라이어 노드들은 토픽 네트워크의 사용자들의 더 큰 집단 또는 클러스터들로부터 분리되는 것으로 여겨지는 아웃라이어 사용자들이다. 토픽 네트워크 내의 아웃라이어 사용자들 또는 노드들의 세트는 UO으로 나타내어지고, 여기서 UO은 '관심 사용자들'의 서브세트이다. 상기 아웃라이어 노드들의 식별 및 필터링에 대한 상세는 이하에 설명된다.
프로세스는 블록(312)~블록(314)을 계속하고, 그것에 의해 아웃라이어 사용자들(UO)이 제거된 후 커뮤니티들이 형성된다.
도 5를 참조하여, 컴퓨터 실행가능 또는 프로세서 실행 명령들의 다른 예시 실시형태가 제공된다. 블록(301)~블록(311)이 실행된다. 블록(311)에 이어서, 서버는 제 1 랭킹 프로세서를 사용하여 토픽 네트워크 내의 사용자들을 순위화한다(블록(501)). 제 1 랭킹 프로세서는 블록(401)에서 사용된 랭킹 프로세스와 동일해도 좋고 아니여도 좋다. 특정 토픽에 대해 특정 토픽 네트워크에서 가장 영향력 있는 사용자를 식별하기 위해 순위가 결정된다.
블록(502)에 있어서, 서버는 토픽 네트워크 내의 아웃라이어 노드들(사용자들(UO))을 식별하여 필터링하고, 여기서 UO은 '관심 사용자들'의 서브세트이다. 블록(503)에 있어서, 서버는 일정 기간 내에 사용자로부터의 포스트의 수에 기초한 제 2 랭킹 프로세스를 사용하여 사용자들(UO)이 제거된 사용자들의 순위를 조정한다. 예를 들면, 동일 기간 내 제 2 사용자의 포스트의 수에 비해 최근 2달 내 제 1 사용자의 포스트의 수가 더 많다면, 제 1 사용자의 원래의 순위(블록(501)로부터)는 상승할 수 있지만, 제 2 사용자의 순위는 동일하게 유지되거나 하락한다는 것을 서버가 결정한다.
모든 사용자들에 기초한 네트워크 그래프는 매우 광범위한 것이 이해된다. 예를 들면, 사용자는 수억만명이다. 사용자들의 전체 데이터 세트를 분석하는 것은 계산적으로 비용이 들고 시간이 소요된다. 따라서, 상기 프로세스를 사용하여 토픽 T에 관련된 사용자들의 더 작은 세트를 찾아냄으로써 분석할 데이터의 양을 감소시킨다. 이것은 처리 시간도 감소시킨다. 예시 실시형태에 있어서, 트위터의 전체 소셜 네트워크 플랫폼을 분석할 때 인플루언서들의 근실시간 결과가 얻어진다. 사용자들의 더 작은 세트 및 관련 데이터를 사용함으로써 새로운 토픽 네트워크가 컴퓨팅된다. 토픽 네트워크는 모든 사용자들을 포함한 소셜 네트워크 그래프보다 작다(즉, 더 적은 노드 및 더 적은 에지). 토픽 네트워크를 기반으로 하여 사용자들을 순위화하는 것은 모든 사용자들을 포함한 소셜 네트워크 그래프를 기반으로 사용자를 순위화하는 것보다 훨씬 빠르다.
또한, 토픽 네트워크의 아웃라이어 노드들을 식별 및 필터링하는 것은 결과의 퀄리티를 보다 개선하는데 도움이 된다.
블록(504)에 이어서, 블록(312)~블록(314)이 실행된다.
도 2~도 5에 기재된 방법의 상세는 이하에서 더 설명된다.
소셜 네트워크 데이터를 취득하는 스텝:
소셜 네트워크 데이터 취득에 대해, 도 3~도 5에 도시되어 있지 않지만 예시 실시형태에 있어서, 서버(100)는 소셜 네트워크 데이터를 취득한다. 소셜 네트워크 데이터는 다양한 방법으로 취득되어도 좋다. 소셜 네트워크 데이터를 취득하는 비한정적인 예시 실시형태가 후술된다.
도 5를 참조하여, 소셜 네트워크 데이터 취득을 위한 컴퓨터 실행가능 명령들의 예시 실시형태가 나타내어진다. 데이터는 서버에 의해 메세지 및 메타데이터를 포함한 데이터의 스트림으로서 실시간으로 수신된다(블록(600)). 이 데이터는 예를 들면, 압축형 로우 포맷을 사용하여 데이터 스토어(116)에 저장된다(블록(601)), 예시 실시형태에 있어서, MySQL 데이터베이스가 사용되지만 이것에 한정되는 것은 아니다. 블록(600) 및 블록(601)은 예를 들면, 소셜 네트워킹 데이터 모듈(107)에 의해 실행된다.
예시 실시형태에 있어서, 소셜 네트워킹 모듈(107)에 의해 수신된 소셜 네트워크 데이터가 복사되고, 소셜 네트워크 데이터의 복사본은 다수의 서버에 저장된다. 이것은 소셜 네트워크 데이터를 분석할 때에 병렬 처리를 가능하게 한다. 즉, 한 서버가 소셜 네트워크 데이터의 한 애스펙트를 분석함과 동시에 다른 서버가 소셜 네트워크 데이터의 다른 애스펙트를 분석하는 것을 가능하게 한다.
서버(100)는 인덱서 프로세스를 사용하여 메세지들을 인덱싱한다(블록(602)). 예를 들면, 인덱서 프로세스는 데이터 스토어(116)에서 구체화되는 메세지를 스캐닝하는 것을 포함한 저장 프로세스로부터의 개별 프로세스이다. 예시 실시형태에 있어서, 인덱서 프로세스는 개별 서버 단독으로 작동된다. 이것은 병렬 처리를 가능하게 한다. 인덱서 프로세스는 예를 들면, 인덱싱된 데이터의 테이블을 매일, 또는 어떤 특정 기간동안 구체화하는 멀티스레드 프로세스이다. 인덱싱된 데이터는 출력되어 인덱스 스토어(117)에 저장된다(블록(604)).
도 7을 참조하여 간단히 말하면, 이것은 인덱스 스토어(117)의 예를 나타내고, 테이블의 각 열은 고유한 사용자 계정 식별자 및 그 날, 또는 그 특정 기간에 생성된 모든 메세지 식별자의 해당 리스트이다. 다른 시간, 다른 요일이 사용된다. 예시 실시형태에 있어서, 수백만개의 데이터 열이 인덱스 스토어(117)에 매일 읽히고 쓰여질 수 있고, 이 프로세스는 새로운 데이터가 데이터 스토어(116)에 추가되거나 구체화될 때 발생할 수 있다. 예시 실시형태에 있어서, 압축형 로우 포맷은 인덱스 스토어(117)에 사용된다. 다른 예시 실시형태에 있어서, 테이블을 읽고 작성할 때 다중 스레드에 걸쳐 스루풋을 증가시키기 때문에 릴랙싱된 트랜잭셔널 시멘틱스를 실행시킴으로써 데드록을 방지한다. 백그라운드로서, 둘 이상의 태스크가 다른 작업을 잠그려고 하는 리소스를 잠그는 각 태스크에 의해 서로를 영구적으로 차단할 때 데드록이 발생한다.
다시 도 6을 참조하여, 서버(100)는 사용자 계정이 다른 사용자 계정을 팔로우하는 정보를 더 취득한다(블록(603)). 이 프로세스는 프로파일 관련 메타데이터를 식별하고 그것을 프로파일 스토어에 저장하는 것을 포함한다(블록(605)).
도 8에 있어서, 프로파일 스토어(119)의 예는 각 사용자 계정에 프로파일 관련 메타데이터가 관련되어 있다는 것을 보여준다. 프로파일 관련 메타데이터는 예를 들면, 사용자의 총 팔로워 수, 자기 공개 개인 정보, 위치 정보, 및 사용자 리스트를 포함한다.
데이터가 취득되어 저장된 후, 그것을 분석하여 예를 들면, 전문가 및 관심을 식별할 수 있다.
토픽과 관련된 포스트를 결정하는 스텝:
토픽과 관련된 포스트 결정에 관해 블록(302)에 따라 이러한 동작이 다양한 방법으로 발생할 수 있다고 이해될 수 있다. 토픽과 관련된 포스트를 결정하기 위해 사용될 수 있는 예시 실시형태가 이하에 나타내어지지만 이들에 한정되는 것은 아니다.
예시 실시형태에 있어서, 토픽과 관련된 포스트를 결정하는 동작(블록(302))은 시소모스 검색 엔진을 기반으로 하고 "정보 발견 및 텍스트 분석을 위한 방법 및 시스템"이란 명칭으로 2009년 7월 10일에 제출된 미국 특허출원공개 제2009/0319518호에 기재되어 있고, 이것의 전제 내용은 참조에 의해 본 명세서에 포함된다. 미국 특허출원 공개 제2009/0319518호에 기재된 프로세스를 따라, 토픽은 특정 시간 간격 내 인기있는 문서들을 식별하기 위해 사용된다. 구체적으로, 토픽(예를 들면, 키워드)이 미국 특허출원공개 제2009/0319518호의 시스템에 제공될 때, 시스템은 토픽과 관련된 인기있는 문서(예를 들면, 포스트, 트윗, 메세지, 기사 등)들을 복귀(return)시킨다. 본 명세서에 기재된 상기 제안된 시스템 및 방법을 사용함으로써, 상기 실행가능한 명령들은 인기있는 문서의 작성자 또는 작성자들을 결정하는 서버(100)를 포함한다. 이렇게 해서, 특정 토픽과 관련된 상위 사용자들로서 작성자 또는 작성자들이 식별된다.
블록(303)에 대해, 상한 N은 특정 토픽과 관련된 상위 N명의 사용자들을 식별하기 위해 제공되고, 여기서 N은 카운팅 수이다. 예시 실시형태에 있어서, N은 5000이지만, 다른 수들이 사용될 수 있다. 상위 N명의 사용자들은 공지 또는 향후 공지의 랭킹 알고리즘에 따라서, 또는 소셜 미디어 애널리틱스의 공지 또는 향후 공지의 오소리티 스코어링 알고리즘을 사용하여 결정되어도 좋다.
토픽과 관련된 포스트를 식별하기 위한 그 외 공지 및 향후 공지가 다른 예시 실시형태에 사용되어도 좋다.
토픽 네트워크에서 아웃라이어 사용자들을 식별하고 필터링하는 스텝:
토픽 네트워크 내에서 아웃라이어 노드(예를 들면, 사용자)를 식별하고 필터링하는 스텝에 있어서, 그것과 관련하여 블록(402, 502)에 따라서 상이한 계산법이 사용될 수 있다는 것은 이해될 것이다. 블록(402, 502)을 구현하는 예시 실시형태를 이하에 나타내지만, 이들에 한정되는 것은 아니다.
토픽 네트워크로부터의 데이터는 문제가 있는 아웃라이어를 제거함으로서 개선될 수 있다는 것을 알 수 있다. 예를 들면, 맥도날드 커피 브랜드를 지칭하는 "맥카페"라는 토픽을 이용한 쿼리는 동일한 이름의 가라오케바/카페의 팬인 필리핀의 일부 사용자들을 되돌리는 일을 발생시켰다. 그들은 유대가 긴밀한 커뮤니티이기 때문에, 그들의 인플루언서 스코어는 중요한 상위 10위권 리스트에 랭크되기에 충분히 높은 경우가 많다.
도 9를 참조하면, 필터링되지 않은 결과를 나타내는 토픽 네트워크(901)의 예시 실시형태의 예가 나타내어져 있다. 노드는 토픽인 맥카페와 관련된 사용자들(UT)의 세트를 나타낸다. 노드(902) 또는 사용자들의 일부는 맥카페와 동일한 이름의 가라오케바/카페의 팬인 필리핀으로부터 유래한다.
이러한 현상은 토픽인 맥카페의 테스트 케이스에서 종종 발생하고, 이것에 한정되는 것은 아니다. 여기서, 맥카페를 찾는 사용자는 맥도날드 커피와 필리핀의 가라오케바 둘 다를 찾는 것이 아니므로, 이러한 서브 네트워크(1302)는 노이즈로 간주되는 것을 알 수 있다.
노이즈 저감을 달성하기 위해서, 예시 실시형태에 있어서, 서버는 토픽 쿼리에서 이러한 종류의 아웃라이어 클러스터를 식별하고 필터링하기 위해 모듈성(modularity) 알고리즘의 변형인 네트워크 커뮤니티 검색 알고리즘을 이용한다. 모듈성 알고리즘은 미국 국립과학원회보(Proceedings-National Academy of Sciences USA), 103(23): 8577-8696의 뉴만 M.E.J.저(2006)의 "네트워크의 모듈성 및 커뮤니티 구조"로서 인용된 기사에 기재되어 있고, 여기에 그 전체 내용을 참조하여 원용한다. 구체적으로, 상기 변형은 각 에지 또는 링크의 가중치를 고려한 모듈성 알고리즘의 가중된 버전이다. 이것은 커뮤니티 내에서 사람들을 팔로우하거나 사람들에 의해 팔로우될 뿐만 아니라 댓글, 리포스트, 및 멘션 등의 다른 상호작용이 있기 때문에 사람들을 커뮤니티로 분류함으로써 감지된 커뮤니티의 퀄리티를 향상시킨다.
토픽 네트워크에서 아웃라이어를 결정하기 위해서는 다른 종류의 클러스터링 및 커뮤니티 검색 알고리즘이 사용될 수 있다는 것이 이해될 수 있다. 상기 필터링은 토픽과 연관된 인플루언서를 찾는 사용자가 의도하지 않은 또는 요구하는 결과를 제거하는데 도움을 준다.
도 10에 나타낸 바와 같이, 아웃라이어 클러스터(1001)는 토픽 네트워크(901)에서 주요 클러스터(1002)를 기준으로 식별된다. 사용자들(UO)의 아웃라이어 클러스터(1001)는 토픽 네트워크로부터 제거되고, 주요 클러스터(1002)의 남아있는 사용자들은 출력된 인플루언서들의 순위화된 리스팅을 형성하는데 사용된다.
예시 실시형태에서, 서버(100)는 아웃라이어를 필터링하기 위해 다음의 명령을 컴퓨팅한다:
1. 토픽 네트워크에 대해 모듈성 알고리즘을 실행한다.
2. 모듈성 기능은 토픽 네트워크를 모듈 커뮤니티 또는 서브 네트워크로 분해하고, 각각의 노드를 X 클러스터/커뮤니티로 라벨링한다. 예시 실시형태에 있어서, 커뮤니티가 2명 이상의 구성원을 가지므로 X<N/2이고, N은 예를 들면 '관심 사용자들' 리스트의 사용자의 수이다.
3. 커뮤니티 내의 사용자의 수로 커뮤니티를 분류하고, 최대 파퓰레이션을 갖는 커뮤니티를 채택한다.
4. 노드 파퓰레이션의 누적 합계가 전체의 80%를 초과하는 경우, 토픽 네트워크로부터 남아있는 최소의 커뮤니티를 제거한다.
토픽 네트워크를 식별하고 필터링하기 위한 컴퓨터 실행가능한 명령들의 일반적인 예시 실시형태는 도 11과 관련하여 설명된다. 이들 명령은 블록(402) 및 블록(502)을 실행하기 위해 사용될 수 있다는 것이 이해될 수 있다.
블록(1101)에 있어서, 서버(100)는 네트워크를 커뮤니티로 분해하기 위해 토픽 네트워크에 커뮤니티 찾기 알고리즘을 적용한다. 커뮤니티를 찾기 위한 알고리즘의 예로는 최소 커트 방법, 계층형 클러스터링, 거반-뉴먼 알고리즘, 상기 참조된 모듈성 알고리즘 및 클리크계 방법을 들 수 있지만, 이들에 한정되지 않는다.
블록(1102)에 있어서, 서버는 각각의 노드(즉, 사용자)를 X 커뮤니티 중 하나에 라벨링하고, 여기서 X<N/2이고, N은 토픽 네트워크에서의 노드의 수이다.
블록(1103)에 있어서, 서버는 각각의 커뮤니티 내의 노드의 수를 식별한다.
그 다음, 상기 커뮤니티가 필터링된 토픽 네트워크에 이미 추가되어 있지 않을 경우에는, 서버는 필터링된 토픽 네트워크에 최대 수의 노드를 갖는 커뮤니티를 추가한다(블록(1104)). 초기에는 필터링된 토픽 네트워크는 제로 커뮤니티를 포함하고, 필터링된 토픽 네트워크에 추가된 제 1 커뮤니티는 최대 커뮤니티라는 것이 이해될 수 있다. 필터링되지 않은 토픽 네트워크로부터의 동일한 커뮤니티는 필터링된 토픽 네트워크에 1회를 초과하여 추가될 수 없다.
블록(1105)에 있어서, 서버는 필터링된 토픽 네트워크의 노드의 수가 본래의 노드의 수 또는 필터링되지 않은 토픽 네트워크의 노드의 수의 Y%를 초과하거나 더 큰지를 결정한다. 예시 실시형태에 있어서, Y%는 80%이다. Y의 다른 백분율 값도 적용가능하다. 그렇지 않으면, 그 다음의 프로세스는 블록(1104)으로 되돌아간다. 블록(1105)의 조건이 참일 경우에, 프로세스는 블록(1106)으로 진행한다.
일반적으로, 필터링된 토픽 네트워크에서의 노드의 수가 필터링되지 않은 토픽 네트워크에서의 노드의 총수의 대부분의 비율에 도달하거나 초과하는 경우, 주요 클러스터가 식별되고, 또한 아웃라이어 노드(예를 들면, UO)인 남아있는 노드도 식별된다.
블록(1106)에 있어서, 아웃라이어 사용자(UO)는 포함하지 않는 필터링된 토픽 네트워크가 출력된다.
커뮤니티를 식별하는 스텝
도 12를 참조하면, 컴퓨터 실행가능한 명령들의 예시 실시형태를 소셜 네트워크 데이터로부터 커뮤니티를 식별하는 것에 대해 나타낸다.
소셜 네트워크 플랫폼들의 특색은 사용자들이 다른 사용자를 팔로잉(또는 친구로서 규정)하는 것이다. 앞서 기재한 바와 같이, 토픽 네트워크 내의 복수의 노드 및 에지에 의해 나타내는 바와 같이, 다른 종류의 관계 또는 상호연계성이 사용자들 사이에 존재할 수 있다. 토픽 네트워크 내에서, 인플루언서들은 다양한 정도로 상이한 클러스터의 사용자들에게 영향을 미칠 수 있다. 즉, 도 12와 관련하여 기재한 바와 같이, 커뮤니티를 식별하기 위한 프로세스에 기초하여 서버는 커뮤니티라고 지칭되는 단일 토픽 네트워크 내에서 복수의 클러스터를 식별하도록 설정된다. 소셜 네트워크 플랫폼에 대한 영향력은 일정하지 않으므로, 도 12와 관련하여 규정된 커뮤니티 식별 프로세스는 토픽 네트워크에 걸쳐서 각각의 인플루언서의 영향력의 정도 또는 심도를 식별(예를 들면, 하나의 커뮤니티를 다른 커뮤니티에 대해 연관지음으로써)하기 때문에 바람직하다.
도 12에서 규정되는 바와 같이, 서버는 일련의 별개의 커뮤니티(예를 들면, C1,…, Cn) 및 각각의 커뮤니티에서의 상위 인플루언서(들)을 제공하도록 설정된다. 더욱 바람직한 측면에 있어서, 서버는 모든 인플루언서들의 상대적 순위를 제공하기 위해 모든 커뮤니티에 걸쳐 상위 인플루언서의 집계 리스트를 제공하도록 설정된다.
스텝(1201)에 있어서, 서버는 앞서 기재(예를 들면, 도 3~도 5)한 바와 같이, 소셜 네트워킹 데이터로부터의 토픽 네트워크 그래프 정보를 취득하도록 설정된다. 토픽 네트워크는 토픽 네트워크 그래프 내에서 2명의 사용자들 간의 관계(예를 들면, 팔로워 관계, 댓글 관계, 멘션 관계, 리포스트 관계 등)를 나타내기 위해서 토픽 네트워크 그래프에서 노드로서 각각 표시되고 에지에 의해 연결되는 일련의 '관심 사용자들' 리스트로부터의 일련의 사용자인 노드 사이의 관계를 시각적으로 도시한다. 블록(1202)에 있어서, 서버는 커뮤니티 간의 경계를 규정하는데 사용되는 내부적 및/또는 외부적 상호연계성(예를 들면, 해상도)의 사전 규정된 정도 또는 크기를 얻는다.
블록(1203)에 있어서, 서버는 사전 규정된 상호연계성(예를 들면, 해상도)의 정도에 따라서 각각의 노드(예를 들면, 인플루언서들)와 에지에 대한 스코어링을 계산하도록 설정된다. 즉, 일례에 있어서, 각각의 사용자 핸들은 모듈성 클래스 식별자(Mod ID)와 페이지랭크 스코어(영향력의 정도를 규정)가 할당된다. 일측면에 있어서, 해상도 파라미터는 식별된 커뮤니티의 밀도 및 수를 제어하도록 구성된다. 바람직한 측면에 있어서, 2~10개의 커뮤니티를 제공하는 2의 디폴트 해상도 값은 서버에 의해 이용된다. 또 다른 측면에 있어서, 해상도 값은 커뮤니티 정보의 시각화에 바람직하도록 커뮤니티의 더 높거나 더 낮은 입도를 생성하기 위해 사용자 정의(예를 들면, 도 2의 컴퓨팅 장치(101)를 통해)된다.
블록(1204)에 있어서, 서버는 별개의 커뮤니티 클러스터(예를 들면, C1, C2, … Cn)를 규정하고 출력하도록 설정되어 사용자들을 UC1, … UCn으로 나누어 네트워크의 노드에 의해 규정된 각각의 사용자는 각각의 커뮤니티에 매핑된다. 일 예시적인 측면에 있어서, 모듈성 분석은 커뮤니티를 규정하는 데 사용되어 각각의 커뮤니티가 커뮤니티 내 노드의 클러스터 간에 있어서의 밀도가 높은 연결(고 연관성)을 갖지만 다른 커뮤니티 내 노드와 밀도가 낮은 연결(저 연관성)을 갖도록 사용된다. 일 예시적 측면에 있어서, 커뮤니티 감지 프로세스 단계(1603-1606)는 모듈성 알고리즘 및/또는 밀도 알고리즘(내부 연관성을 측정하는)을 사용하여 실시될 수 있다. 또한, 결과의 시각화는 제피, 오픈 소스 그래프 분석 패키지 및/또는 일 측면에 있어서의 자바스크립트 라이브러리를 사용하여 실시된다.
블록(1205)에 있어서, 서버는 모든 커뮤니티에 걸친 상위 인플루언서들 및/또는 각 커뮤니티 내의 상위 인플루언서들을 규정 및 출력하고 모든 인플루언서들의 상대적 순위를 제공하도록 설정된다. 일 예시적 측면에 있어서, 상위 인플루언서들은 특정 커뮤니티가 선택될 때 그들의 커뮤니티와 함께 시각적으로 표시된다. 또 다른 예시적 측면에 있어서, 블록(1205)에서 서버는 모든 커뮤니티에 걸친 모든 상위 인플루언서들의 집계 리스트를 제공하고 모든 인플루언서들의 상대적 순위를 제공하도록 설정된다.
블록(1206)에 있어서, 서버는 각각의 커뮤니티 클러스터를 시각적으로 묘사하고 구분(예를 들면, 하나의 커뮤니티를 다른 커뮤니티와 구분하기 위해 컬러 코드화, 상대적인 위치, 또는 다른 시각적 식별에 의해)하도록 설정된다. 다른 측면에 있어서, 블록(1206)에서 서버는 각각의 커뮤니티에 시각적으로 연결된 각각의 커뮤니티에 상위 인플루언서의 세트를 제공하도록 설정된다. 또 다른 측면에 있어서, 블록(1206)에서의 서버는 각각의 인플루언서의 스코어(예를 들면, 영향력 스코어)에 상응되도록 커뮤니티 그래프의 각각의 노드의 크기를 변화시키도록 구성된다. 블록(1206)으로부터 출력으로서, 노드로부터의 에지는 그들의 커뮤니티 내와 다른 커뮤니티에 걸쳐서 각각의 사용자들 간의 연결을 보여준다.
따라서, 도 13~도 15에 나타내는 바와 같이, 커뮤니티와 인플루언서의 시각화(예를 들면, 각각의 커뮤니티 내에서 순위화된 상위 인플루언서 및/또는 모든 커뮤니티에 걸친 상위 인플루언서의 리스팅)는 최종 사용자(예를 들면, 도 2의 컴퓨팅 장치(101)의 사용자)가 그들의 연관된 커뮤니티에 있어서의 인플루언서 각각의 스케일과 상대적인 중요도를 시각화할 수 있게 한다.
특정 커뮤니티 내에서 인기있는 특성들을 식별하는 스텝
도 3~도 5와 관련하여 기재된 바와 같이, 또 다른 측면에 있어서 서버는 블록(1204)에 의해 제공된 각각의 특정 커뮤니티(예를 들면, C1)에 대해 그들의 소셜 네트워크 데이터에 기초한, 특정 커뮤니티(예를 들면, C1) 내의 사용자들(예를 들면, UC1)과 관련된 사전 규정된 특성들(예를 들면, 공통의 키워드 및 어구, 대화 토픽, 공통의 위치, 공통의 이미지, 공통의 메타데이터)의 인기있는 특성값을 결정하도록 설정된다. 따라서, 각각의 커뮤니티(C1) 내의 사용자들(UC1)의 특성들(예를 들면, 대화 토픽)의 사전 규정된 세트를 검사함으로써 트렌드 또는 공통성이 규정될 수 있다. 예시적 측면에 있어서, 특성값(예를 들면, 각각의 커뮤니티 내 모든 사용자 사이에서의 상위 대화 토픽)의 상위 리스팅은 블록(1205)에서 묘사되고 각각의 커뮤니티와 관련하여 표시하기 위해 컴퓨팅 장치(101)(도 2에 나타내어짐)에 출력된다.
커뮤니티들 및 인기있는 특성들을 표시하는 스텝
도 13~도 15를 참조하여 토픽 네트워크로부터의 커뮤니티 클러스터의 시각화 및 각각의 커뮤니티의 인기있는 특성들의 시각화를 위해 서버의 GUI 모듈(106)로부터 제공되고 컴퓨팅 장치(도 2)의 디스플레이 스크린(125)에 출력된 스크린 샷이 나타내어진다. 서버는 각각의 노드에 대한 상세(예를 들면, 사용자, 커뮤니티 정보 및 영향력의 정도)가 시각적으로 노출되도록 토픽 네트워크/특정 커뮤니티 내의 커뮤니티 및/또는 노드를 선택하기 위한 쌍방향(interactive) 인터페이스를 제공한다. 따라서, 도 13~도 15는 인플루언서 커뮤니티들과 그들의 특성들(예를 들면, 워드클라우드 시각화 기술에서 각각의 커뮤니티를 위한 대화)의 쌍방향 시각화를 도시한다. 도 13~도 15에도 나타낸 바와 같이, 각각의 커뮤니티(예를 들면, 에지와 노드로 구성된)는 다른 커뮤니티와 시각적으로 구분되며(예를 들면, 컬러 코드화에 의해) 각각의 노드는 전체 토픽 네트워크 내의 영향력의 정도에 따라 크기 설정된다. 사용자의 영향력의 정도는 예를 들면, 커뮤니티 또는 토픽 네트워크 내 사용자 계정의 순위에 상응한다. 또한, 특정 커뮤니티를 선택함으로써(예를 들면, 토픽 네트워크로부터 커뮤니티의 마우스 또는 포인터를 사용하는 시각적 선택), 커뮤니티 값이 묘사된다(예를 들면, 토픽 네트워크 그래프 내 커뮤니티를 강조하기, 커뮤니티 내 상위 인플루언서들을 노출시키기 및 선택된 커뮤니티에 대해 대화의 상위 토픽의 인기있는 특성값들을 노출시키기). 도 13~도 15에 있어서, 인기있는 특성값의 디스플레이 스크린(예를 들면, 도 2의 컴퓨팅 장치(101)의 스크린) 상으로의 시각화는 특정 커뮤니티의 모든 사용자 내의 각 토픽의 사용 빈도의 표시뿐만 아니라 선택된 커뮤니티 내의 상위 대화 토픽을 묘사하는 워드 클라우드로서 나타내어진다.
예를 들면, 노드는 그들을 그들 각각의 커뮤니티와 시각적으로 연관시키기 위해 컬러 코드화되고 각각의 노드의 크기는 전체 토픽 네트워크에 대한 커뮤니티(컬러 코드화)의 인플루언서 스코어에 비례한다. 노드를 선택함으로써(예를 들면, 노드에 대하여 마우스 포인터를 호버링함), 트위터 핸들이 팝업되고 그 핸들에 대한 정보가 스크린 상에 표시된다.
다른 예에 있어서, 그 선택된 커뮤니티의 상위 인플루언서들을 시각적으로 강조한 서브-그래프를 선택하면, 스크린 상에 시각적 표시가 제공된다(예를 들면, 그 커뮤니티에 있어서 대화의 워드 클라우드). 커뮤니티 행위에 대한 인사이트; 포지티브/네가티브 감성이 나타내어진다.
예시 시나리오: 퍼스널 케어 제품 브랜드
예시 실시형태에 있어서, 퍼스널 케어 제품 브랜드명을 도 3에 나타낸 프로세스에 입력했다. 인플루언서들을 표시하고 가중된 분석을 사용한 커뮤니티 네트워크의 그래픽 출력은 도 13b에 나타내어진다. 퍼스널 케어 제품 회사는 그들 캠페인의 일부로서 유튜브 영상을 공개했다. 캠페인의 성공은 수백명의 사람들이 트위터를 통해 유튜브 영상을 공유했다는 것이었다. 도 13a는 가중되지 않은 인플루언서 그래프에서 얻어진 결과의 비교 분석을 나타내는 반면 도 13b는 가중된 분석을 사용한 인플루언서 그래프를 나타낸다. 비가중된 분석이 YouTibe를 인식하지 못하는 동안에 가중된 분석은 "YouTube"를 중요한 인플루언서로서 식별할 수 있다. 유튜브를 인플루언서로 보는 퍼스널 케어 제품 회사에 영상 캠페인이 히트했다는 것을 즉시 보여준다.
예시 시나리오: 제약 회사
예시 실시형태에 있어서, 제약 회사명을 도 3에 나타낸 프로세스에 입력했다. 인플루언서들을 표시하고 가중된 분석을 사용한 커뮤니티 네트워크의 그래픽 출력은 도 14에 나타내어진다. 제약 회사에 대해 중요한 대중 홍보 실수가 발생하는 경우(예를 들면, 그 약물 중 하나에 대한 잘못된 정보가 퍼짐), 회사는 가능한 한 빨리 상황을 처리하는데 도움이 될 수 있는 인플루언서들을 식별해야 한다. 예를 들면, 제약 회사는 회사가 더 이상 회사의 제품을 판촉하기 위해 의사 또는 다른 의료 전문가에게의 비용 지불이 없을 것이라고 발표했다. 회사의 결정에 대한 기사는 다수의 웹사이트: Dr. 머콜라, 뉴욕타임즈 베스트 셀링 작가의 웹사이트에 공개되었고, TIME 매거진, LA 타임즈, CNN, Fox 뉴스, ABC 뉴스, 및 투데이 쇼에도 실렸다.
도 14에 있어서, 가중된 인플루언서 프로세스는 이 토픽에 대해 이야기하는 커뮤니티에 있어서 상위 인플루언서들 중 한 명으로서 @mercola(웹사이트의 트위터 핸들)를 풀 아웃(pulled out)했다. 따라서, 필요하다면 제약 회사는 임의의 중요한 정보를 퍼뜨리는데 중요한 인플루언서로서 "mercola"의 웹사이트 또는 웹 플랫폼을 고려할 수 있다.
예시 시나리오: 슈퍼 볼(Super Bowl)
예시 실시형태에 있어서, 토픽 "슈퍼 볼"을 도 3에 나타낸 프로세스에 입력했다. 인플루언서들을 표시하고 가중된 분석을 사용한 커뮤니티 네트워크의 그래픽 출력은 도 15b에 나타내어진다. 백그라운드로서, 슈퍼 볼은 미국에서 인기있는 스포츠 경기이다. 다수의 대규모 브랜드들 및 텔레비젼 채널들은 그것과 관련한 대중 홍보 이벤트를 편성함으로써 슈퍼 볼을 이용하기를 원한다. 슈퍼 볼에 앞서 예를 들면, 토크 쇼인 "엘렌 쇼"나 "엘런 디제너러스 쇼"는 어떤 대회의 수상자에게 슈퍼 볼 경기의 무료 티켓을 배부했다. 그 쇼의 공식 트위터 핸들인 "@theellenshow"가 상위 인플루언서로 여겨지고 대중 홍보 계획에 대해 이야기하는 전체 커뮤니티가 존재할 때 그 대회의 성공이 보여질 수 있다. 도 15는 비가중된 분석(도 15a) 및 가중된 분석(도 15b)에 의해 얻어진 결과의 비교 분석을 나타낸다. 가중된 버젼 및 비가중된 버젼 둘 모드는 슈버 볼의 결승전 무료 티켓에 대해 이야기하는 커뮤니티를 식별하지만, 가중된 분석은 도 15b에 나타내어진 바와 같이 소스 또는 인플루언서인 "@theellenshow"을 식별할 수 있다.
슈퍼 볼의 사례 연구. (A) 주로 슈퍼 볼, 브롱코스, 또는 씨호크 또는 무료 티켓에 대해 이야기하는 인플루언서들을 풀 업(pull up)하는 이전의 방법론을 묘사. (B) "theellenshow"을 풀 아웃하는 것 이외에 새로운 방법론의 결과를 묘사.
이렇게 해서, 특정 쿼리 토픽에 대한 그들의 소셜 커뮤니티(얻어진 소셜 네트워킹 데이터에 기초한) 내 인플루언서들을 식별하기 위한 시스템 및 방법이 제안된다. 또한, 인플루언서들은 균일한 특성들을 갖고 있지 않고, 심지어 특정 토픽 네트워크 내 인플루언서들의 실제 커뮤니티에 속해 있는 것을 알 수 있다. 본 명세서의 시스템 및 방법을 이용하여 엔티티 또는 개인 및 그들의 각 커뮤니티의 상대적인 인플루언서를 표시하기 위해 네트워크 그래프에 있어서 시각화된 컴퓨팅 장치(예를 들면, 컴퓨팅 장치(101)) 상의 시각화를 출력한다. 또한, 인기있는 특성값(예를 들면, 대화의 토픽과 같은 사전 정의된 특성에 기초한)은 상위 토픽 또는 관련 토픽을 보여주는 각각의 커뮤니티의 컴퓨팅 장치의 디스플레이 스크린 상에 시각적으로 묘사된다. 각각의 커뮤니티의 행동 특성들을 시각적으로 노출시키기 위해 각각의 커뮤니티 대화의 워드 클라우드로서 토픽을 묘사할 수 있다.
상기 제안된 컴퓨팅 시스템 및 방법의 일반적인 예시 실시형태가 이하에 제공된다.
예시 실시형태에 있어서, 토픽에 대한 적어도 하나의 사용자 계정의 가중된 영향력을 결정하기 위해 서버에 의해 실행되는 방법이 제공된다. 다른 예시 실시형태에 있어서, 서버 시스템 또는 서버는 토픽에 대한 적어도 하나의 사용자 계정의 가중된 영향력을 결정하기 위해 제공되고, 그 서버 시스템은 프로세서, 메모리 및 그 메모리에 저장된 실행가능한 명령들을 포함한다. 상기 방법 또는 상기 명령들, 또는 둘 모두는 상기 서버가 상기 토픽을 취득하는 스텝; 하나 이상의 소셜 데이터 네트워크 내에서 상기 토픽과 관련된 포스트를 결정하는 스텝―상기 서버는 하나 이상의 소셜 데이터 네트워크로부터 데이터에 액세스됨―; 다른 포스팅에 대한 댓글 포스트, 다른 사용자 계정의 멘션 포스트, 및 최초 포스팅의 리포스팅 중 하나 이상으로서 각각의 포스트를 특성화하는 스텝; 상기 포스팅이 작성되고, 상기 멘션 포스트에 멘션되고, 상기 최초 포스팅이 포스팅되고, 상기 토픽과 관련된 하나 이상의 포스트들이 작성되고, 또는 그 임의의 조합인 임의의 사용자 계정을 포함하는 사용자 계정 그룹을 생성하는 스텝; 상기 그룹 내 각각의 상기 사용자 계정들을 노드로서 나타내고 하나 이상의 노드 쌍 간의 에지를 설정하는 스텝; 팔로워-팔로위 관계의 존재 여부, 특정 노드 쌍을 포함하는 다수의 멘션 포스트, 다수의 댓글 포스트, 및 다수의 리포스트 중 하나 이상의 함수인 가중치를 결정하는 스텝; 및 각각의 상기 노드들 및 에지들을 사용하여 토픽 네트워크 그래프를 컴퓨팅하는 스텝―각각의 에지는 가중치와 관련됨-을 포함한다.
예시적 측면에 있어서, 팔로워-팔로위 관계가 특정 노드 쌍 간에 존재하는 경우, 에지의 가중치를 디폴트 값으로 초기화하고, 특정 노드 쌍을 포함하는 멘션 포스트의 수, 댓글 포스트의 수, 및 리포스트의 수에 기초하여 상기 가중치를 더 조정한다.
예시적 측면에 있어서, 상기 방법 또는 명령들, 또는 둘 모두는 상기 토픽 네트워크 그래프 내에서 상기 사용자 계정들을 순위화하여 상기 토픽 네트워크 그래프 내의 아웃라이어 노드들을 필터링하는 스텝; 상기 필터링된 토픽 네트워크 그래프 내에서 사용자 계정들 중 적어도 2개의 개별 커뮤니티들을 식별하는 스텝―각각의 커뮤니티는 사용자 계정들의 서브세트와 관련됨-; 각각의 커뮤니티와 관련된 어트리뷰트들을 식별하는 스텝; 및 상기 상응하는 어트리뷰트들과 관련된 각 커뮤니티를 출력하는 스텝을 더 포함한다.
예시적 측면에 있어서, 상기 방법 또는 명령들, 또는 둘 모두는 각각의 커뮤니티 내에서 상기 사용자 계정들을 순위화하는 스텝 및 상기 상응하는 커뮤니티에 매핑된 상기 사용자 계정들의 순위화된 리스팅을 각각의 커뮤니티에 제공하는 스텝을 더 포함한다.
예시적 측면에 있어서, 상기 사용자 계정들을 순위화하는 스텝은 각각의 순위화된 사용자 계정을 각각의 커뮤니티에 매핑하는 스텝 및 적어도 2개의 커뮤니티들에 대해 사용자 계정들의 순위화된 리스팅을 출력하는 스텝을 더 포함한다.
예시적 측면에 있어서, 상기 어트리뷰트들은 각각의 사용자 계정의 상기 소셜 데이터 네트워크와의 상호작용과 연관된다.
예시적 측면에 있어서, 상기 어트리뷰트들은 상기 사용자 계정에 대한 상기 어트리뷰트의 조합 빈도와 관련하여 표시된다.
예시적 측면에 있어서, 상기 어트리뷰트들은 특정 커뮤니티 내의 사용자들의 대화 토픽의 빈도이다.
다른 예시 실시형태에 있어서, 방법은 토픽에 대해 영향력 있는 적어도 하나의 사용자 계정을 결정하기 위해 서버에 의해 실행된다. 상기 방법은: 상기 토픽을 취득하는 스텝; 상기 토픽과 관련된 소셜 데이터 네트워크 내에서 복수의 사용자 계정을 결정하는 스텝; 각각의 상기 사용자들을 노드로서 연결 그래프에 나타내고 각각의 상기 사용자 계정들 간의 관계의 존재를 결정하는 스텝; 각각의 상기 사용자 계정들을 노드들로서 사용하고 그 상응하는 관계들을 각각의 상기 노드들 간의 에지들로서 사용하는 토픽 네트워크 그래프를 컴퓨팅하는 스텝; 상기 토픽 네트워크 그래프 내에서 상기 사용자 계정들을 순위화하고 상기 토픽 네트워크 그래프 내에서 아웃라이어 노드들을 필터링하는 스텝; 상기 필터링된 토픽 네트워크 그래프 내에서 사용자 계정들 중 적어도 2개의 개별 커뮤니티들을 식별하는 스텝―각각의 커뮤니티는 상기 사용자 계정들의 서브세트와 관련됨―; 각각의 커뮤니티와 관련된 어트리뷰트들을 식별하는 스텝; 및 상기 상응하는 어트리뷰트들과 관련된 각각의 커뮤니티를 출력하는 스텝을 포함한다.
예시적 측면에 있어서, 상기 방법은 각각의 커뮤니티 내에서 상기 사용자 계정들을 순위화하는 스텝 및 상기 상응하는 커뮤니티에 매핑된 상기 사용자 계정들의 순위화된 리스팅을 각각의 커뮤니티에 제공하는 스텝을 더 포함한다.
예시적 측면에 있어서, 상기 사용자 계정들을 순위화하는 스텝은 각각의 순위화된 사용자 계정을 상기 각각의 커뮤니티에 매핑하는 스텝 및 상기 사용자 계정들의 순위화된 리스팅을 적어도 2개의 커뮤니티들에 출력하는 스텝을 더 포함한다.
예시적 측면에 있어서, 상기 어트리뷰트들은 각각의 사용자 계정의 상기 소셜 데이터 네트워크와의 상호작용과 관련된다.
예시적 측면에 있어서, 상기 어트리뷰트들은 상기 사용자 계정들에 대한 상기 어트리뷰트의 조합 빈도에 관련하여 표시된다.
예시적 측면에 있어서, 상기 어트리뷰트들은 특정 커뮤니티 내의 상기 사용자들의 대화 토픽의 빈도이다.
예시적 측면에 있어서, 상기 방법은 컬러 코드화된 노드들 및 에지들을 포함하는 적어도 2개의 개별 커뮤니티들을 그래픽 사용자 인터페이스에 표시하는 스텝을 더 포함하고, 여기서 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 1 부분은 제 1 커뮤니티와 관련된 제 1 컬러이고, 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 2 부분은 제 2 커뮤니티와 관련된 제 2 컬러이다.
예시적 측면에 있어서, 특정 컬러 코드화된 노드의 사이즈는 상기 특정 컬러의 코드화된 노드에 의해 나타내어진 특정 사용자 계정의 영향력의 정도와 연관된다.
예시적 측면에 있어서, 상기 방법은 특정 커뮤니티와 관련된 단어들을 표시하는 스텝―상기 단어들은 상기 특정 커뮤니티의 어트리뷰트들에 상응함―을 더 포함한다.
예시적 측면에 있어서, 상기 방법은 그래픽 사용자 인터페이스에 있어서 특정 커뮤니티와 상호작용하는 사용자-제어 포인터를 감지하는 스텝, 및 상기 특정 커뮤니티에 있어서 상위에 순위화된 사용자 계정들 중 하나 이상을 표시하는 스텝; 상기 특정 커뮤니티를 시각적으로 강조하는 스텝; 및 특정 커뮤니티와 관련된 단어들을 표시하는 스텝―상기 단어는 상기 특정 커뮤니티의 상기 어트리뷰트들에 상응함―중 적어도 하나를 더 포함한다.
다른 예시 실시형태에 있어서, 컴퓨팅 시스템은 토픽에 영향력 있는 적어도 하나의 사용자 계정을 결정하기 위해 제공된다. 컴퓨팅 시스템은 커뮤니케이션 장치; 메모리; 및 프로세서를 포함하는 컴퓨팅 시스템으로서: 상기 프로세서는 적어도, 상기 토픽을 취득하는 스텝; 상기 토픽과 관련된 소셜 데이터 네트워크 내에서 복수의 사용자 계정을 결정하는 스텝; 각각의 상기 사용자 계정을 노드로서 연결 그래프에 나타내고 각각의 상기 사용자 계정들 간의 관계의 존재를 결정하는 스텝; 각각의 상기 사용자 계정들을 노드로서 사용하고 상기 상응하는 관계들을 각각의 상기 노드들 간의 에지들로서 사용한 토픽 네트워트 그래프를 컴퓨팅하는 스텝; 상기 토픽 네트워크 그래프 내에서 상기 사용자 계정들을 순위화하고 상기 토픽 네트워크 그래프 내에서 아웃라이어 노드들을 필터링하는 스텝; 상기 필터링된 토픽 네트워크 그래프 내에서 상기 사용자 계정들 중 적어도 2개의 커뮤니티들을 식별하는 스텝―각각의 커뮤니티는 상기 사용자 계정들의 서브세트와 관련됨―; 및 상기 상응하는 어트리뷰트들과 관련된 각 커뮤니티를 출력하는 스텝으로 설정된다.
다른 예시 실시형태에 있어서, 토픽에 대해 영향력 있는 한 명 이상의 사용자들을 결정하기 위해 서버에 의해 실행되는 방법이 제공된다. 상기 방법은: 토픽을 취득하는 스텝; 상기 토픽과 관련된 소셜 데이터 네트워크 내에서 사용자들을 결정하는 스텝; 각각의 상기 사용자들을 노드로서 모델링하고 각각의 상기 사용자들 간의 관계를 결정하는 스텝; 상기 사용자들을 노드들로서 사용하고 상기 관계들을 에지들로서 사용하여 토픽 네트워크 그래프를 컴퓨팅하는 스텝; 상기 토픽 네트워크 그래프 내에서 아웃라이어 노드들을 식별하고 필터링하는 스텝; 및 그들의 관련 순위에 따라 상기 토픽 네트워크 그래프 내에 남아 있는 사용자들을 출력하는 스텝을 포함한다.
예시적 측면에 있어서, 상기 토픽을 포함하는 적어도 하나의 콘텐츠를 소비하고 생성하는 사용자들은 상기 토픽과 관련된 사용자들로 간주된다.
다른 예시적 측면에 있어서, 토픽 네트워크 그래프에서 적어도 2명의 사용자들 사이에 규정된 에지는 적어도 2명의 사용자들 간의 친구 관계를 나타낸다.
다른 예시적 측면에 있어서, 토픽 네트워크 그래프에서 적어도 2명의 사용자들 사이에 규정된 에지는 적어도 2명의 사용자들 간의 팔로워-팔로위 관계를 나타내고, 여기서 적어도 2명의 사용자들 중 한 명은 팔로워이고 적어도 2명의 사용자들 중 다른 한 명은 팔로위이다.
다른 예시적 측면에 있어서, 토픽 네트워크 그래프에서 적어도 2명의 사용자들 사이에 규정된 에지는 적어도 2명의 사용자들 간의 댓글 관계를 나타내고, 여기서 적어도 2명의 사용자들 중 한 명은 적어도 2명의 사용자들 중 다른 한 명에 의해 작성된 포스팅에 댓글을 단다.
다른 예시적 측면에 있어서, 토픽 네트워크 그래프에서 적어도 2명의 사용자들 사이에 규정된 에지는 적어도 2명의 사용자들 간의 리포스트 관계를 나타내고, 여기서 적어도 2명의 사용자들 중 한 명은 적어도 2명의 사용자들 중 다른 한 명에 의해 작성된 포스팅을 리포스팅한다.
다른 예시적 측면에 있어서, 상기 순위화하는 스텝은 페이지랭크 알고리즘을 사용하여 상기 토픽 네트워크 그래프 내 특정 사용자의 중요도를 측정하는 스텝을 포함한다.
다른 예시적 측면에 있어서, 상기 순위화하는 스텝은 아이겐벡터 중심성, 가중 정도, 중개성, 허브 및 어소리티 메트릭들 중 적어도 하나를 사용하는 스텝을 포함한다.
다른 예시적 측면에 있어서, 상기 토픽 네트워크 그래프 내에서 상기 아웃라이어 노드들을 식별하고 필터링하는 스텝은: 클러스터링 알고리즘, 모듈성 알고리즘 및 커뮤니티 감지 알고리즘을 상기 토픽 네트워크 그래프에 적용하여 다수의 커뮤니티를 출력하는 스텝; 각각의 상기 다수의 커뮤니티 내에서 다수의 사용자들에 의해 다수의 커뮤니티를 소팅하는 스텝; 최다수의 사용자들을 가진 n개의 커뮤니티를 선택하는 스텝―상기 n개의 커뮤니티에 있어서의 사용자들의 누적 합계는 적어도 상기 토픽 네트워크 그래프에 있어서의 사용자들의 총수의 백분율의 임계값을 충족함―; 및 선택되지 않은 커뮤니티에 있어서의 사용자들을 상기 아웃라이어 노드들로서 설정하는 스텝을 포함한다.
다른 예시 실시형태에 있어서, 토픽에 대해 영향력 있는 한 명 이상의 사용자들을 결정하기 위한 컴퓨팅 시스템이 제공된다. 컴퓨팅 시스템은 커뮤니케이션 장치; 메모리; 및 프로세서를 포함한다. 상기 프로세서는 토픽을 취득하는 스텝; 상기 토픽과 관련된 소셜 데이터 네트워크 내에서 사용자들을 결정하는 스텝; 각각의 상기 사용자들을 노드로서 모델링하고 각각의 상기 사용자들 간의 관계들을 결정하는 스텝; 상기 사용자들을 노드들로서 사용하고 상기 관계들을 에지들로서 사용하여 토픽 네트워크 그래프를 컴퓨팅하는 스텝; 상기 토픽 네트워크 그래프 내에서 아웃라이어 노드들을 식별하고 필터링하는 스텝; 및 그들의 관련 순위에 따라 상기 토픽 네트워크 그래프 내에 남아 있는 사용자들을 출력하는 스텝을 포함한다.
본 명세서에 기재된 바와 같이, 상기 시스템 및 방법의 예시 실시형태의 상이한 특징은 다른 방법으로 서로 조합될 수 있다는 것이 이해될 것이다. 즉, 구체적으로 언급되어 있지 않지만, 상이한 모듈들, 동작들 및 구성요소들은 다른 예시 실시형태에 따라 함께 사용되어도 좋다.
본 명세서에 기재된 흐름도에 있어서의 스텝들 또는 동작들은 단지 예시이다. 본 발명 또는 본 발명들의 정신을 벗어나는 일 없이 이들 스텝들 또는 동작들에 많은 변화가 있을 수 있다. 예를 들면, 상기 스텝들은 다른 순서로 실행되어도 좋고, 스텝들은 추가, 삭제 또는 수정되어도 좋다.
본 명세서에 기재된 GUI들 및 스크린 샷들은 단지 예시이다. 본 발명 또는 본 발명들의 정신으로부터 벗어나는 일 없이 그래픽 및 상호작용 요소들에 변화가 있을 수 있다. 예를 들면, 이러한 요소들은 다른 위치에 있을 수 있고, 또는 추가, 삭제, 또는 변경될 수 있다.
특정 구체적인 실시형태를 참조하여 상기를 설명해 왔지만 여기에 첨부된 특허청구범위에서 벗어나는 일 없이 다양한 수정이 이루어질 수 있는 것은 당업자에 있어서 명백하다.

Claims (20)

  1. 적어도 하나의 사용자 계정의 토픽에 대한 가중된 영향력을 결정하기 위해 서버에 의해 실행되는 방법으로서:
    상기 서버가 상기 토픽을 취득하는 스텝;
    하나 이상의 소셜 데이터 네트워크들 내에서 상기 토픽과 관련된 포스트들을 결정하는 스텝―상기 서버는 상기 하나 이상의 소셜 데이터 네트워크들로부터 데이터에 액세스됨―;
    다른 포스팅에의 댓글 포스트, 다른 사용자 계정의 멘션 포스트, 및 최초 포스팅의 리포스팅 중 하나 이상으로서 각각의 포스트를 특성화하는 스텝;
    상기 포스팅이 작성되고, 상기 멘션 포스트에 멘션되고, 상기 최초 포스팅이 포스팅되고, 상기 토픽과 관련된 하나 이상의 포스트들이 작성되고, 또는 그 임의의 조합인 임의의 사용자 계정을 포함하는 사용자 계정 그룹을 생성하는 스텝;
    상기 그룹 내 각각의 상기 사용자 계정들을 연결 그래프에 노드로서 나타내고 하나 이상의 노드 쌍 간에 에지를 설정하는 스텝;
    특정 노드 쌍 간의 각각의 에지에 대해서 팔로워-팔로위 관계의 존재 여부, 상기 특정 노드 쌍을 포함하는 다수의 멘션 포스트들, 다수의 댓글 포스트들, 및 다수의 리포스트들 중 하나 이상의 함수인 가중치를 결정하는 스텝; 및
    각각의 상기 노드들 및 상기 에지들을 이용하여 토픽 네트워크 그래프를 컴퓨팅하는 스텝―각각의 에지는 가중치와 관련됨―을 포함하는 방법.
  2. 제 1 항에 있어서,
    상기 팔로워-팔로위 관계가 상기 특정 노드 쌍 간에 존재하는 경우, 상기 에지의 가중치를 디폴트 값으로 초기화하는 스텝 및 상기 특정 노드 쌍을 포함한 멘션 포스트의 수, 댓글 포스트의 수, 및 리포스트의 수 중 임의의 하나 이상에 기초하여 상기 가중치를 더 조정하는 스텝을 포함하는 방법.
  3. 제 1 항에 있어서,
    상기 토픽 네트워크 그래프 내에서 상기 사용자 계정들을 순위화하여 상기 토픽 네트워크 그래프 내 아웃라이어 노드들을 필터링하는 스텝;
    상기 필터링된 토픽 네트워크 그래프 내에서 상기 사용자 계정들 중 적어도 2개의 개별 커뮤니티들을 식별하는 스텝―각각의 커뮤니티는 상기 사용자 계정들의 서브세트와 관련됨―;
    각각의 커뮤니티와 관련된 어트리뷰트들을 식별하는 스텝; 및
    상기 상응하는 어트리뷰트들과 관련된 각각의 커뮤니티를 출력하는 스텝을 더 포함하는 방법.
  4. 제 3 항에 있어서,
    각각의 커뮤니티 내에서 상기 사용자 계정들을 순위화하는 스텝 및 상기 상응하는 커뮤니티에 매핑된 상기 사용자 계정들의 순위화된 리스팅을 각각의 커뮤니티에 제공하는 스텝을 더 포함하는 방법.
  5. 제 4 항에 있어서,
    상기 사용자 계정들을 순위화하는 스텝은 각각의 순위화된 사용자 계정을 각각의 커뮤니티에 매핑하는 스텝 및 상기 적어도 2개의 커뮤니티들에 대해 상기 사용자 계정들의 순위화된 리스팅을 출력하는 스텝을 더 포함하는 방법.
  6. 제 3 항에 있어서,
    상기 어트리뷰트들은 각각의 사용자 계정의 상기 소셜 데이터 네트워크들과의 상호작용과 연관되는 방법.
  7. 제 3 항에 있어서,
    상기 어트리뷰트들은 상기 사용자 계정들에 대한 상기 어트리뷰트의 조합 빈도와 관련하여 표시되는 방법.
  8. 제 3 항에 있어서,
    상기 어트리뷰트들은 인기있는 커뮤니티 내의 상기 사용자들의 대화 토픽의 빈도인 방법.
  9. 제 3 항에 있어서,
    컬러 코드화된 노드들 및 에지들을 포함하는 상기 적어도 2개의 개별 커뮤니티들을 그래픽 사용자 인터페이스에 표시하는 스텝을 더 포함하고, 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 1 부분은 제 1 커뮤니티와 관련된 제 1 컬러이고, 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 2 부분은 제 2 커뮤니티와 관련된 제 2 컬러인 방법.
  10. 제 9 항에 있어서,
    특정 컬러 코드화된 노드의 사이즈는 상기 특정 컬러 코드화된 노드에 의해 나타내어진 특정 사용자 계정의 영향력의 정도와 연관되는 방법.
  11. 커뮤니케이션 장치;
    메모리; 및
    프로세서를 포함하는, 적어도 하나의 사용자 계정의 토픽에 대한 가중된 영향력을 결정하기 위한 컴퓨팅 시스템으로서:
    상기 프로세서는 적어도,
    상기 토픽을 취득하는 스텝;
    하나 이상의 소셜 데이터 네트워크들 내에서 상기 토픽과 관련된 포스트들을 결정하는 스텝―상기 컴퓨팅 시스템은 상기 하나 이상의 소셜 데이터 네트워크들로부터 데이터에 액세스됨―;
    다른 포스팅에의 댓글 포스트, 다른 사용자 계정의 멘션 포스트, 및 최초 포스팅의 리포스팅 중 하나 이상으로서 각각의 포스트를 특성화하는 스텝;
    상기 포스팅이 작성되고, 상기 멘션 포스트에 멘션되고, 상기 최초 포스팅이 포스팅되고, 상기 토픽과 관련된 하나 이상의 포스트들이 작성되고, 또는 그들의 임의의 조합인 임의의 사용자 계정을 포함하는 사용자 계정 그룹을 생성하는 스텝;
    상기 그룹 내 각각의 상기 사용자 계정들을 연결 그래프에 노드로서 나타내고 하나 이상의 노드 쌍 간에 에지를 설정하는 스텝;
    특정 노드 쌍 간의 각각의 에지에 대해 팔로워-팔로위 관계의 존재 여부, 상기 특정 노드 쌍을 포함한 다수의 멘션 포스트, 다수의 댓글 포스트, 및 다수의 리포스트 중 하나 이상의 함수인 가중치를 결정하는 스텝; 및
    상기 각각의 노드들 및 상기 에지들을 이용하여 토픽 네트워크 그래프를 컴퓨팅하는 스텝―각각의 에지는 가중치와 관련됨―으로 설정되는 컴퓨팅 시스템.
  12. 제 11 항에 있어서,
    상기 팔로워-팔로위 관계가 상기 특정 노드 쌍 간에 존재하는 경우, 상기 에지의 가중치를 디폴트 값으로 초기화하고, 상기 특정 노드 쌍을 포함하는 멘션 포스트의 수, 댓글 포스트의 수, 및 리포스트의 수 중 어느 하나 이상에 기초하여 상기 가중치를 더 조정하는 컴퓨팅 시스템.
  13. 제 11 항에 있어서,
    상기 프로세서는 상기 토픽 네트워크 그래프 내에서 상기 사용자 계정들을 순위화하여 상기 토픽 네트워크 그래프 내 아웃라이어 노드들을 필터링하는 스텝;
    상기 필터링된 토픽 네트워크 그래프 내에서 상기 사용자 계정들 중 적어도 2개의 개별 커뮤니티들을 식별하는 스텝―각각의 커뮤니티는 상기 사용자 계정들의 서브세트와 관련됨―;
    각각의 커뮤니티와 관련된 어트리뷰트들을 식별하는 스텝; 및
    상기 상응하는 어트리뷰티들과 관련된 각각의 커뮤니티를 출력하는 스텝으로 더 설정되는 컴퓨팅 시스템.
  14. 제 13 항에 있어서,
    상기 프로세서는 각각의 커뮤니티 내에서 상기 사용자 계정들을 순위화하는 스텝 및 상기 상응하는 커뮤니티에 매핑된 상기 사용자 계정들의 순위화된 리스팅을 각각의 커뮤니티에 제공하는 스텝으로 더 설정되는 컴퓨팅 시스템.
  15. 제 14 항에 있어서,
    상기 사용자 계정들을 순위화하는 스텝은 각각의 순위화된 사용자 계정을 상기 각각의 커뮤니티에 매핑하는 스텝 및 적어도 2개의 커뮤니티들에 대한 사용자 계정들의 순위화된 리스팅을 출력하는 스텝을 더 포함하는 컴퓨팅 시스템.
  16. 제 13 항에 있어서,
    상기 어트리뷰트들은 각각의 사용자 계정의 상기 소셜 데이터 네트워크들과의 상호작용과 관련된 컴퓨팅 시스템.
  17. 제 13 항에 있어서,
    상기 어트리뷰트들은 상기 사용자 계정들에 대한 상기 어트리뷰트의 조합 빈도와 관련하여 표시되는 컴퓨팅 시스템.
  18. 제 13 항에 있어서,
    상기 어트리뷰트들은 특정 커뮤니티 내 상기 사용자들의 대화 토픽의 빈도인 컴퓨팅 시스템.
  19. 제 13 항에 있어서,
    디스플레이 장치를 더 포함하고, 상기 프로세서는 컬러 코드화된 노드들 및 에지들을 포함하는 상기 적어도 2개의 개별 커뮤니티들을 그래픽 사용자 인터페이스에 표시하도록 더 설정되고, 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 1 부분은 제 1 커뮤니티와 관련된 제 1 컬러이고, 상기 컬러 코드화된 노드들 및 에지들의 적어도 제 2 부분은 제 2 커뮤니티와 관련된 제 2 컬러인 컴퓨팅 시스템.
  20. 제 19 항에 있어서,
    특정 컬러 코드화된 노드의 사이즈는 상기 특정 컬러 코드화된 노드에 의해 나타내어진 특정 사용자 계정의 영향력의 정도와 관련되는 컴퓨팅 시스템.
KR1020167013934A 2013-10-25 2014-10-23 소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법 KR20160079830A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201361895539P 2013-10-25 2013-10-25
US61/895,539 2013-10-25
US201361907878P 2013-11-22 2013-11-22
US61/907,878 2013-11-22
US201462020833P 2014-07-03 2014-07-03
US62/020,833 2014-07-03
PCT/CA2014/051029 WO2015058307A1 (en) 2013-10-25 2014-10-23 Systems and methods for dynamically determining influencers in a social data network using weighted analysis

Publications (1)

Publication Number Publication Date
KR20160079830A true KR20160079830A (ko) 2016-07-06

Family

ID=52992095

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020167013942A KR20160083017A (ko) 2013-10-25 2014-10-23 소셜 데이터 네트워크에서 인플루언서들 및 그들의 커뮤니티를 식별하기 위한 시스템 및 방법
KR1020167013953A KR20160075739A (ko) 2013-10-25 2014-10-23 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법
KR1020167013934A KR20160079830A (ko) 2013-10-25 2014-10-23 소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020167013942A KR20160083017A (ko) 2013-10-25 2014-10-23 소셜 데이터 네트워크에서 인플루언서들 및 그들의 커뮤니티를 식별하기 위한 시스템 및 방법
KR1020167013953A KR20160075739A (ko) 2013-10-25 2014-10-23 소셜 데이터 네트워크에 있어서의 인플루언서들을 결정하기 위한 시스템 및 방법

Country Status (6)

Country Link
US (4) US20150120782A1 (ko)
EP (3) EP3061019A4 (ko)
KR (3) KR20160083017A (ko)
CN (3) CN105723402A (ko)
CA (3) CA2964997A1 (ko)
WO (3) WO2015058309A1 (ko)

Families Citing this family (123)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9529629B2 (en) 2012-12-20 2016-12-27 Bank Of America Corporation Computing resource inventory system
US9189644B2 (en) 2012-12-20 2015-11-17 Bank Of America Corporation Access requests at IAM system implementing IAM data model
US9477838B2 (en) * 2012-12-20 2016-10-25 Bank Of America Corporation Reconciliation of access rights in a computing system
US9537892B2 (en) 2012-12-20 2017-01-03 Bank Of America Corporation Facilitating separation-of-duties when provisioning access rights in a computing system
US9972028B2 (en) * 2013-03-15 2018-05-15 Mavenir Ltd. Identifying a social leader
US10430894B2 (en) 2013-03-21 2019-10-01 Khoros, Llc Gamification for online social communities
IN2013CH05876A (ko) * 2013-12-17 2015-06-19 Infosys Ltd
US9449096B2 (en) * 2014-01-07 2016-09-20 International Business Machines Corporation Identifying influencers for topics in social media
US20160203523A1 (en) * 2014-02-21 2016-07-14 Lithium Technologies, Inc. Domain generic large scale topic expertise and interest mining across multiple online social networks
US10762514B1 (en) 2014-04-03 2020-09-01 Stad.Io, Llc Filtering and stratification for identification of high value participants at live events in real-time
US10567253B1 (en) * 2014-04-03 2020-02-18 Stad.Io Llc Method and system for collection, data-mining and display of information regarding and relating to attendees of live events for management decisions
EP2947610A1 (en) * 2014-05-19 2015-11-25 Mu Sigma Business Solutions Pvt. Ltd. Business problem networking system and tool
US9959364B2 (en) * 2014-05-22 2018-05-01 Oath Inc. Content recommendations
US10592539B1 (en) 2014-07-11 2020-03-17 Twitter, Inc. Trends in a messaging platform
US10601749B1 (en) 2014-07-11 2020-03-24 Twitter, Inc. Trends in a messaging platform
US20160147810A1 (en) * 2014-11-25 2016-05-26 Facebook, Inc. Recommending Users to a Social Networking System User Based on Relevance and Similarity Between Users
US20180315083A1 (en) * 2015-01-09 2018-11-01 Research Foundation Of The City University Of New York Method to maximize message spreading in social networks and find the most influential people in social media
US20160232161A1 (en) * 2015-01-09 2016-08-11 Research Foundation Of The City University Of New York Method to maximize message spreading in social networks and find the most influential people in social media
US11250369B2 (en) 2015-01-23 2022-02-15 Sponsorhouse, Inc. Computerized system for detecting the exposure and impact of an entity within virtual networking platforms
US9882785B2 (en) * 2015-02-13 2018-01-30 Microsoft Technology Licensing, Llc Social network content spread visualization
US10102290B2 (en) 2015-03-12 2018-10-16 Oracle International Corporation Methods for identifying, ranking, and displaying subject matter experts on social networks
US10277468B2 (en) * 2015-04-10 2019-04-30 Conduent Business Service, Llc Method and system for determining reachability between one or more nodes in a graph
US20160314122A1 (en) * 2015-04-24 2016-10-27 Microsoft Technology Licensing, Llc. Identifying experts and areas of expertise in an organization
US10127230B2 (en) 2015-05-01 2018-11-13 Microsoft Technology Licensing, Llc Dynamic content suggestion in sparse traffic environment
JP6511971B2 (ja) * 2015-06-05 2019-05-15 富士ゼロックス株式会社 情報処理装置及びプログラム
US20160364115A1 (en) * 2015-06-12 2016-12-15 Scapeflow, Inc. Method, system, and media for collaborative learning
US9917870B2 (en) 2015-06-23 2018-03-13 Facebook, Inc. Streaming media presentation system
US10462524B2 (en) * 2015-06-23 2019-10-29 Facebook, Inc. Streaming media presentation system
US10147107B2 (en) * 2015-06-26 2018-12-04 Microsoft Technology Licensing, Llc Social sketches
US10268773B2 (en) * 2015-06-30 2019-04-23 International Business Machines Corporation Navigating a website using visual analytics and a dynamic data source
US10055498B2 (en) * 2015-07-07 2018-08-21 Oracle International Corporation Methods for assessing and scoring user proficiency in topics determined by data from social networks and other sources
CN106529985B (zh) * 2015-09-15 2021-06-08 腾讯科技(深圳)有限公司 一种推广信息的投放方法、装置和系统
US20170140397A1 (en) * 2015-11-18 2017-05-18 Estia, Inc. Measuring influence propagation within networks
US20170186041A1 (en) * 2015-12-28 2017-06-29 International Business Machines Corporation Retargeting system for decision making units
CN105677881B (zh) * 2016-01-12 2020-07-03 腾讯科技(深圳)有限公司 一种信息推荐方法、装置及服务器
US20170249388A1 (en) * 2016-02-26 2017-08-31 Microsoft Technology Licensing, Llc Expert Detection in Social Networks
US10242094B2 (en) * 2016-03-18 2019-03-26 International Business Machines Corporation Generating word clouds
US11036800B1 (en) * 2016-04-29 2021-06-15 Veritas Technologies Llc Systems and methods for clustering data to improve data analytics
US10176609B2 (en) * 2016-05-11 2019-01-08 Runtime Collective Limited Analysis and visualization of interaction and influence in a network
US9558265B1 (en) * 2016-05-12 2017-01-31 Quid, Inc. Facilitating targeted analysis via graph generation based on an influencing parameter
CN106909594B (zh) * 2016-06-06 2020-05-05 阿里巴巴集团控股有限公司 信息推送方法及装置
US11132716B2 (en) * 2016-06-28 2021-09-28 Gavin Washington Brown System and method for promoting a talent of a user via a wireless network of mobile client devices
CN106126740A (zh) * 2016-06-30 2016-11-16 杭州师范大学 一种事件传播过程中的用户挖掘方法和装置
US11490232B2 (en) * 2016-08-01 2022-11-01 Microsoft Technology Licensing, Llc Location-based conversation identifier
US20180039893A1 (en) * 2016-08-08 2018-02-08 International Business Machines Corporation Topic-based team analytics enhancement
CN107767278B (zh) * 2016-08-15 2021-08-24 腾讯科技(深圳)有限公司 社群层次结构构建方法和装置
CN106408424A (zh) * 2016-08-31 2017-02-15 北京奇艺世纪科技有限公司 一种生成用户组合的方法和装置
CN107832572A (zh) * 2016-09-14 2018-03-23 腾讯科技(深圳)有限公司 用户影响力值生成方法和装置
CN106570082B (zh) * 2016-10-19 2019-11-05 浙江工业大学 一种结合网络拓扑特征和用户行为特征的朋友关系挖掘方法
US20180137667A1 (en) * 2016-11-14 2018-05-17 Oracle International Corporation Graph Visualization Tools With Summary Visualization For Very Large Labeled Graphs
US10839300B1 (en) * 2016-12-08 2020-11-17 Veritas Technologies Llc Systems and methods for identifying subject-matter experts
CN106777157B (zh) * 2016-12-20 2023-04-07 西南石油大学 一种基于主题的类引力模型微博预测方法与系统
KR101866866B1 (ko) 2017-01-12 2018-06-14 서울대학교산학협력단 부호화된 네트워크에서의 개인화된 랭킹 방법, 이를 수행하기 위한 기록 매체 및 장치
US11270185B1 (en) 2017-01-27 2022-03-08 Intuit Inc. Methods, systems, and computer program product for generating a personalized flow for a software delivery model
US10592995B1 (en) 2017-01-27 2020-03-17 Intuit Inc. Methods, systems, and computer program product for providing expense information for an electronic tax return preparation and filing software delivery model
CN107045536A (zh) * 2017-02-04 2017-08-15 武汉快舟科技有限公司 一种社交网络排名方法
US10614136B2 (en) * 2017-03-02 2020-04-07 Innoplexus Ag Method and system for managing primary field-specific entity records required by user
CN107545019A (zh) * 2017-03-02 2018-01-05 微云数聚(北京)科技有限公司 一种图数据库数据驱动的可视化方法及系统
US10902462B2 (en) 2017-04-28 2021-01-26 Khoros, Llc System and method of providing a platform for managing data content campaign on social networks
US20180341987A1 (en) * 2017-05-24 2018-11-29 Viacom International Inc. Device, System, and Method for a Social Fit Assessment
US10585575B2 (en) 2017-05-31 2020-03-10 Oracle International Corporation Visualizing UI tool for graph construction and exploration with alternative action timelines
US10581980B2 (en) 2017-06-01 2020-03-03 Xandr Inc. Device identification techniques using shared device graph
CN109144984A (zh) * 2017-06-27 2019-01-04 中兴通讯股份有限公司 犯罪群体识别方法、设备及存储介质
US10826781B2 (en) * 2017-08-01 2020-11-03 Elsevier, Inc. Systems and methods for extracting structure from large, dense, and noisy networks
US10769732B2 (en) * 2017-09-19 2020-09-08 International Business Machines Corporation Expertise determination based on shared social media content
US10853429B2 (en) * 2017-09-20 2020-12-01 Fujitsu Limited Identifying domain-specific accounts
US11570128B2 (en) 2017-10-12 2023-01-31 Spredfast, Inc. Optimizing effectiveness of content in electronic messages among a system of networked computing device
US10785222B2 (en) 2018-10-11 2020-09-22 Spredfast, Inc. Credential and authentication management in scalable data networks
US11470161B2 (en) 2018-10-11 2022-10-11 Spredfast, Inc. Native activity tracking using credential and authentication management in scalable data networks
US11050704B2 (en) 2017-10-12 2021-06-29 Spredfast, Inc. Computerized tools to enhance speed and propagation of content in electronic messages among a system of networked computing devices
US10346449B2 (en) 2017-10-12 2019-07-09 Spredfast, Inc. Predicting performance of content and electronic messages among a system of networked computing devices
US10999278B2 (en) 2018-10-11 2021-05-04 Spredfast, Inc. Proxied multi-factor authentication using credential and authentication management in scalable data networks
US10601937B2 (en) 2017-11-22 2020-03-24 Spredfast, Inc. Responsive action prediction based on electronic messages among a system of networked computing devices
KR102028494B1 (ko) 2017-12-12 2019-10-04 태그바이컴퍼니(주) 샵 분배 기능 및 인플루언서 마케팅 효율 분석 기능을 가지는 인플루언서 소셜 미디어 마케팅 서비스 제공 시스템 및 그 방법과 이를 구현하기 위한 프로그램이 저장된 기록매체
CN110020375B (zh) * 2017-12-28 2023-06-27 沈阳新松机器人自动化股份有限公司 一种社交网络用户影响力的评估方法
GB2569951A (en) * 2017-12-30 2019-07-10 Innoplexus Ag Method and system for managing network of field-specific entity records
US10848927B2 (en) * 2018-01-04 2020-11-24 International Business Machines Corporation Connected interest group formation
CN108182265B (zh) * 2018-01-09 2021-06-29 清华大学 针对关系网络的多层迭代筛选方法及装置
CN108416645B (zh) * 2018-01-19 2021-08-20 北京三快在线科技有限公司 一种针对用户的推荐方法、装置、存储介质和设备
US11061900B2 (en) 2018-01-22 2021-07-13 Spredfast, Inc. Temporal optimization of data operations using distributed search and server management
US10594773B2 (en) 2018-01-22 2020-03-17 Spredfast, Inc. Temporal optimization of data operations using distributed search and server management
WO2019199989A1 (en) 2018-04-10 2019-10-17 Sponsorhouse, Inc. DBA Hookit Deep neural networks modeling
US11120082B2 (en) 2018-04-18 2021-09-14 Oracle International Corporation Efficient, in-memory, relational representation for heterogeneous graphs
CN110210883B (zh) * 2018-05-09 2023-08-22 腾讯科技(深圳)有限公司 群控账号识别方法、装置、服务器及存储介质
US20190355015A1 (en) * 2018-05-17 2019-11-21 T-Mobile Usa, Inc. Most influential customer scoring
CN109408702B (zh) * 2018-08-29 2021-07-16 昆明理工大学 一种基于稀疏边缘降噪自动编码的混合推荐方法
CN109344326B (zh) * 2018-09-11 2021-09-24 创新先进技术有限公司 一种社交圈的挖掘方法和装置
US10824749B2 (en) * 2018-09-28 2020-11-03 Code 42 Software, Inc. Automatic graph-based detection of unlikely file possession
CN109460490B (zh) * 2018-09-28 2021-05-04 上海达家迎信息科技有限公司 社交网络中中心顶点的确定方法、装置、设备及存储介质
US10855657B2 (en) 2018-10-11 2020-12-01 Spredfast, Inc. Multiplexed data exchange portal interface in scalable data networks
WO2020142172A1 (en) * 2019-01-03 2020-07-09 Sponsorhouse, Inc. DBA Hookit Data prioritization through relationship analysis mapping
CN109857871B (zh) * 2019-01-28 2021-04-20 重庆邮电大学 一种基于社交网络海量情景数据的用户关系发现方法
WO2020214187A1 (en) * 2019-04-19 2020-10-22 Texas State University Identifying and quantifying sentiment and promotion bias in social and content networks
US10931540B2 (en) 2019-05-15 2021-02-23 Khoros, Llc Continuous data sensing of functional states of networked computing devices to determine efficiency metrics for servicing electronic messages asynchronously
CN110162716B (zh) * 2019-05-21 2020-12-25 湖南大学 一种基于社区检索的影响力社区搜索方法和系统
CN110162648B (zh) * 2019-05-21 2024-02-23 智者四海(北京)技术有限公司 图片处理方法、装置及记录介质
KR102411778B1 (ko) * 2019-05-28 2022-06-22 주식회사 케이티 다중 지식의 비교 우위를 추론하는 서버, 방법 및 컴퓨터 프로그램
CN110209962B (zh) * 2019-06-12 2021-02-26 合肥工业大学 主题层次高影响力用户的获取方法和系统
CN110414824B (zh) * 2019-07-23 2023-04-07 复旦大学 一种基于社群系统的服务管理系统
CN110569415B (zh) * 2019-08-28 2021-06-18 浙江工业大学 一种基于网络表征学习和邻居合力的微博用户社区发现方法
CN111223533B (zh) * 2019-12-24 2024-02-13 深圳市联影医疗数据服务有限公司 一种医疗数据检索方法及系统
CN111368552B (zh) * 2020-02-26 2023-09-26 北京市公安局 一种面向特定领域的网络用户群组划分方法及装置
CN111405562B (zh) * 2020-03-11 2021-05-28 中国科学院信息工程研究所 一种基于通信行为规律的移动恶意用户识别方法及系统
CN111667200B (zh) * 2020-07-09 2023-09-19 腾讯科技(深圳)有限公司 一种权威度确定方法、装置、设备及存储介质
CN111831923A (zh) * 2020-07-14 2020-10-27 北京芯盾时代科技有限公司 识别关联的特定账户的方法、装置及存储介质
US11232156B1 (en) * 2020-07-28 2022-01-25 Fujitsu Limited Seed expansion in social network using graph neural network
CN112241874A (zh) * 2020-09-07 2021-01-19 罗科仕管理顾问有限公司 基于人才发掘者的整体招聘系统
US11128589B1 (en) 2020-09-18 2021-09-21 Khoros, Llc Gesture-based community moderation
US11438289B2 (en) 2020-09-18 2022-09-06 Khoros, Llc Gesture-based community moderation
US11620205B2 (en) 2020-10-19 2023-04-04 International Business Machines Corporation Determining influence of applications on system performance
US11438282B2 (en) 2020-11-06 2022-09-06 Khoros, Llc Synchronicity of electronic messages via a transferred secure messaging channel among a system of various networked computing devices
US11924375B2 (en) 2021-10-27 2024-03-05 Khoros, Llc Automated response engine and flow configured to exchange responsive communication data via an omnichannel electronic communication channel independent of data source
US11627100B1 (en) 2021-10-27 2023-04-11 Khoros, Llc Automated response engine implementing a universal data space based on communication interactions via an omnichannel electronic data channel
US11714629B2 (en) 2020-11-19 2023-08-01 Khoros, Llc Software dependency management
KR20220081137A (ko) 2020-12-08 2022-06-15 이천 빅데이터 기반 인플루언서의 온라인 가상 상권 분석 장치 및 방법
CN112711659B (zh) * 2020-12-31 2024-03-15 南京冰鉴信息科技有限公司 基于海量图数据的模型计算方法及装置
CN112926990B (zh) * 2021-03-25 2022-08-30 支付宝(杭州)信息技术有限公司 欺诈识别的方法和装置
WO2023278887A2 (en) * 2021-07-02 2023-01-05 Twitter, Inc. Selective engagement of users and user content for a social messaging platform
US20230029011A1 (en) * 2021-07-20 2023-01-26 AIble Inc. Collaborative Analytics Platform
US20230024951A1 (en) * 2021-07-20 2023-01-26 Pearpop, Inc. Automatic management of digital media
US11776026B1 (en) * 2021-09-10 2023-10-03 Lalit K Jha Virtual newsroom system and method thereof
US20230206142A1 (en) * 2021-11-17 2023-06-29 Nicholas David Evans System and method for thought leader and influencer rating and ranking
US20230350962A1 (en) * 2022-05-02 2023-11-02 At&T Intellectual Property I, L.P. Confidentiality preserving intraorganizational expert search

Family Cites Families (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1989639A4 (en) * 2006-02-28 2012-05-02 Buzzlogic Inc SOCIAL ANALYSIS SYSTEM AND METHOD FOR ANALYZING CONVERSATIONS ON SOCIAL MULTIMEDIA CONTENT
US20090119173A1 (en) * 2006-02-28 2009-05-07 Buzzlogic, Inc. System and Method For Advertisement Targeting of Conversations in Social Media
US7865551B2 (en) * 2006-05-05 2011-01-04 Sony Online Entertainment Llc Determining influential/popular participants in a communication network
US8438062B2 (en) * 2006-12-29 2013-05-07 Google Inc. Network node ad targeting
CA2675216A1 (en) 2007-01-10 2008-07-17 Nick Koudas Method and system for information discovery and text analysis
US8438189B2 (en) * 2007-07-23 2013-05-07 Microsoft Corporation Local computation of rank contributions
US20110010384A1 (en) * 2007-08-17 2011-01-13 Google Inc. Multi-community content sharing in online social networks
US8572094B2 (en) * 2007-08-17 2013-10-29 Google Inc. Ranking social network objects
US8620996B2 (en) 2007-11-19 2013-12-31 Motorola Mobility Llc Method and apparatus for determining a group preference in a social network
US20090271289A1 (en) * 2007-11-20 2009-10-29 Theresa Klinger System and method for propagating endorsements
US20100332312A1 (en) * 2009-06-30 2010-12-30 Theresa Klinger System and method for analyzing endorsement networks
CN101251850A (zh) * 2008-01-04 2008-08-27 杨虡 基于用户威望的互联网主题排名系统和方法
US8972329B2 (en) * 2008-05-02 2015-03-03 The Board Of Trustees Of The Leland Stanford Junior University Systems and methods for ranking nodes of a graph using random parameters
US20090307057A1 (en) 2008-06-06 2009-12-10 Albert Azout Associative memory operators, methods and computer program products for using a social network for predictive marketing analysis
US20100057536A1 (en) * 2008-08-28 2010-03-04 Palo Alto Research Center Incorporated System And Method For Providing Community-Based Advertising Term Disambiguation
US20100119053A1 (en) * 2008-11-13 2010-05-13 Buzzient, Inc. Analytic measurement of online social media content
WO2010065109A1 (en) * 2008-12-01 2010-06-10 Topsy Labs, Inc. Advertising based on influence
US8244848B1 (en) * 2010-04-19 2012-08-14 Facebook, Inc. Integrated social network environment
US9324112B2 (en) * 2010-11-09 2016-04-26 Microsoft Technology Licensing, Llc Ranking authors in social media systems
US8775429B2 (en) * 2011-04-04 2014-07-08 Northwestern University Methods and systems for analyzing data of an online social network
US20120324004A1 (en) * 2011-05-13 2012-12-20 Hieu Khac Le Systems and methods for analyzing social network user data
CN102214212A (zh) * 2011-05-20 2011-10-12 西北工业大学 基于多重链接的微博网络节点权重排序方法
US8312056B1 (en) * 2011-09-13 2012-11-13 Xerox Corporation Method and system for identifying a key influencer in social media utilizing topic modeling and social diffusion analysis
US20130085844A1 (en) * 2011-10-04 2013-04-04 Microsoft Corporation Social ranking for online commerce sellers
US9466071B2 (en) 2011-11-16 2016-10-11 Yahoo! Inc. Social media user recommendation system and method
US20130218640A1 (en) * 2012-01-06 2013-08-22 David S. Kidder System and method for managing advertising intelligence and customer relations management data
US8745738B2 (en) * 2012-01-15 2014-06-03 Microsoft Corporation Vouching for user account using social networking relationship
US8812958B2 (en) * 2012-02-12 2014-08-19 Saba Software, Inc. Methods and apparatus for analyzing a social network
CN102662956A (zh) * 2012-03-05 2012-09-12 西北工业大学 一种基于用户话题链接行为的社交网络意见领袖识别方法
US20130268595A1 (en) 2012-04-06 2013-10-10 Telefonaktiebolaget L M Ericsson (Publ) Detecting communities in telecommunication networks
CN102663101B (zh) * 2012-04-13 2015-10-28 北京交通大学 一种基于新浪微博的用户等级排序算法
CN103064917B (zh) * 2012-12-20 2016-08-17 中国科学院深圳先进技术研究院 一种面向微博的特定倾向的高影响力用户群发现方法
CN103116605B (zh) * 2013-01-17 2016-02-10 上海交通大学 一种基于监测子网的微博热点事件实时检测方法及系统
CN103136331A (zh) * 2013-01-18 2013-06-05 西北工业大学 微博网络意见领袖识别方法
US9275422B2 (en) * 2013-05-29 2016-03-01 International Business Machines Corporation Distributed k-core view materialization and maintenance for graphs

Also Published As

Publication number Publication date
WO2015058308A1 (en) 2015-04-30
WO2015058307A1 (en) 2015-04-30
WO2015058309A1 (en) 2015-04-30
EP3061018A4 (en) 2017-05-10
CA2927150A1 (en) 2015-04-30
CN105849763A (zh) 2016-08-10
CN105849764A (zh) 2016-08-10
US20150120713A1 (en) 2015-04-30
KR20160083017A (ko) 2016-07-11
CN105723402A (zh) 2016-06-29
CA2964997A1 (en) 2015-04-30
US20150120721A1 (en) 2015-04-30
EP3061017A1 (en) 2016-08-31
US20150120782A1 (en) 2015-04-30
US20170140058A1 (en) 2017-05-18
CA2964995A1 (en) 2015-04-30
EP3061019A1 (en) 2016-08-31
US9262537B2 (en) 2016-02-16
KR20160075739A (ko) 2016-06-29
EP3061018A1 (en) 2016-08-31
EP3061019A4 (en) 2017-04-12

Similar Documents

Publication Publication Date Title
KR20160079830A (ko) 소셜 데이터 네트워크의 인플루언서들을 가중된 분석을 이용하여 동적 결정하는 시스템 및 방법
US10860619B2 (en) Concept-level user intent profile extraction and applications
Lou et al. Investigating consumer engagement with influencer-vs. brand-promoted ads: The roles of source and disclosure
Hagen et al. Rise of the machines? Examining the influence of social bots on a political discussion network
US10176609B2 (en) Analysis and visualization of interaction and influence in a network
US20230252094A1 (en) Computer-implemented system and method for updating user interest profiles
O’Callaghan et al. Down the (white) rabbit hole: The extreme right and online recommender systems
Tinati et al. Identifying communicator roles in twitter
US20150120717A1 (en) Systems and methods for determining influencers in a social data network and ranking data objects based on influencers
US20130198204A1 (en) System and method determining online significance of content items and topics using social media
Han et al. Collecting, organizing, and sharing pins in pinterest: interest-driven or social-driven?
KR20160057475A (ko) 소셜 데이터를 능동적으로 획득하기 위한 시스템 및 방법
Yu et al. Trend dynamics and attention in Chinese social media
Metaxas et al. Investigating the infamous# Pizzagate conspiracy theory
Dutta et al. Blackmarket-driven collusion on online media: a survey
US20220360604A1 (en) System and method for social network analysis
Joglekar et al. Like at first sight: Understanding user engagement with the world of microvideos
Fuxman et al. Enabling direct interest-aware audience selection
Tokarchuk et al. Piecing together the puzzle: Improving event content coverage for real-time sub-event detection using adaptive microblog crawling
Alhayan Social media information credibility in the context of dementia
De Cristofaro Leveraging Wikidata to highlight differences in topics and countries on Instagram Social Network
Macnamara Emergent media and what they mean for society, politics and organisations
Santosh Anomalous Behavior Analysis in Social Networks and Consumer Review Websites
Khazaei On the Promotion of the Social Web Intelligence
Lobzhanidze Engaging maintream media for efficient content distribution and creation

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E601 Decision to refuse application