KR102397009B1 - 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템 - Google Patents

소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템 Download PDF

Info

Publication number
KR102397009B1
KR102397009B1 KR1020200085714A KR20200085714A KR102397009B1 KR 102397009 B1 KR102397009 B1 KR 102397009B1 KR 1020200085714 A KR1020200085714 A KR 1020200085714A KR 20200085714 A KR20200085714 A KR 20200085714A KR 102397009 B1 KR102397009 B1 KR 102397009B1
Authority
KR
South Korea
Prior art keywords
interest
user
social media
field
content
Prior art date
Application number
KR1020200085714A
Other languages
English (en)
Other versions
KR20220007459A (ko
Inventor
박종진
Original Assignee
박종진
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 박종진 filed Critical 박종진
Priority to KR1020200085714A priority Critical patent/KR102397009B1/ko
Publication of KR20220007459A publication Critical patent/KR20220007459A/ko
Application granted granted Critical
Publication of KR102397009B1 publication Critical patent/KR102397009B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/442Monitoring of processes or resources, e.g. detecting the failure of a recording device, monitoring the downstream bandwidth, the number of times a movie has been viewed, the storage space available from the internal hard disk
    • H04N21/44213Monitoring of end-user related data
    • H04N21/44222Analytics of user selections, e.g. selection of programs or purchase activity
    • H04N21/44224Monitoring of user activity on external systems, e.g. Internet browsing
    • H04N21/44226Monitoring of user activity on external systems, e.g. Internet browsing on social networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/216Parsing using statistical methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/268Morphological analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4667Processing of monitored end-user data, e.g. trend analysis based on the log file of viewer selections

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computing Systems (AREA)
  • Business, Economics & Management (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Social Psychology (AREA)
  • General Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Probability & Statistics with Applications (AREA)
  • Strategic Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Economics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법에 있어서, 사용자의 소셜미디어 계정정보를 입력받아 등록하는 단계; 상기 사용자의 소셜미디어 계정정보에 기초하여 상기 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계; 크롤링 된 데이터를 분석하여 상기 사용자의 관심성향을 분석하고 관심분야 별로 상기 사용자에 관한 적어도 하나의 제1 관심 키워드를 추출하는 단계; 상기 제1 관심 키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 크롤링하는 단계; (e) 크롤링된 상기 소셜 미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 유사 관심사용자의 계정정보를 추출하는 단계; 추출된 상기 유사 관심사용자의 계정정보에 기초하여 상기 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계; 크롤링 된 데이터를 분석하여 상기 유사 관심사용자의 관심성향을 분석하고 관심분야별로 상기 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드 및 소셜 미디어 활동정보를 추출하는 단계; 및 상기 유사 관심사용자의 계정정보, 관심성향, 관심분야별 상기 제2 관심 키워드, 및 상기 소셜 미디어 활동정보를 상기 사용자에게 제공하는 단계를 포함한다.
이에 의해 사용자와 유사한 관심성향을 보이는 유사 관심사용자의 정보를 제공하고 이를 통해 인맥을 늘릴 수 있는 정보를 제공할 수 있다.

Description

소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템{Method And System For Providing Relationship Service Through Social Media Activity Analysis}
본 발명은 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템에 관한 것으로, 보다 구체적으로는 개인의 소셜미디어 활동분석을 통해 유사 관심성향을 가진 사용자 정보를 제공하는 관계형성 서비스 제공방법 및 그 시스템에에 관한 것이다.
최근 인공지능 및 데이터 분석 기술의 발달로 인해, 온라인 판매 시장과 소셜 미디어 시장에도 큰 영향을 미치고 있다. 예를 들어, 특정 상품이나 뉴스를 소비하는 개인의 선호도를 고려한 개인 맞춤형 추천 서비스가 빠르게 확산되고 있다.
이러한 서비스들은 개인의 소비 방식, 성별, 연령대 등을 기반으로 협력을 형성하고 특정 그룹 내의 이용자가 소비한 상품이나 뉴스와 비슷한 상품이나 뉴스를 추천하는 방식이다.
하지만, 이러한 개인 추천 서비스는 유사한 그룹의 매칭이 성별이나 연령대 등의 인구 통계학적 분석을 기초로 하기 때문에 개인의 성향이나 관심 패턴에 특하된 서비스를 제공하기에는 한계가 있다.
전술한 바와 같은 문제점을 해결하기 위하여, 본 발명에서는 사용자의 소셜미디어 활동 콘텐츠 분석을 통해 유사한 관심성향을 보이는 유사 관심사용자를 추출하여 해당 유사 관심사용자 및 관심분야에 관한 정보를 제공하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템을 제공하는데 목적이 있다.
상기 목적은 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법에 있어서, (a) 사용자의 소셜미디어 계정정보를 입력받아 등록하는 단계; (b) 상기 사용자의 소셜미디어 계정정보에 기초하여 상기 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계; (c) 크롤링 된 데이터를 분석하여 상기 사용자의 관심성향을 분석하고 관심분야 별로 상기 사용자에 관한 적어도 하나의 제1 관심 키워드를 추출하는 단계; (d) 상기 제1 관심 키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 크롤링하는 단계; (e) 크롤링된 상기 소셜 미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 유사 관심사용자의 계정정보를 추출하는 단계; (f) 추출된 상기 유사 관심사용자의 계정정보에 기초하여 상기 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계; (g) 크롤링 된 데이터를 분석하여 상기 유사 관심사용자의 관심성향을 분석하고 관심분야별로 상기 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드 및 소셜 미디어 활동정보를 추출하는 단계; 및 (h) 상기 유사 관심사용자의 계정정보, 관심성향, 관심분야별 상기 제2 관심 키워드, 및 상기 소셜 미디어 활동정보를 상기 사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법에 의해 달성될 수 있다.
또한, 상기 (c) 단계는, (c-1) 크롤링 된 데이터를 형태소 분석을 통해 정형화된 텍스트로 추출하는 단계; (c-2) 추출한 텍스트를 기계학습을 통해 관심분야별로 분류하는 단계; (c-3) 분류 결과에 기초하여 상기 사용자의 관심분야에 관한 집중도 및 상기 관심분야 별로 빈도수가 높은 적어도 하나의 제1 관심키워드를 추출하는 단계를 포함할 수 있다.
더 나아가, (e) 단계는, (e-1) 크롤링 된 콘텐츠를 형태소 분석을 통해 정형화된 텍스트로 추출하는 단계; (e-2) 추출한 텍스트를 기계학습을 통해 관심분야별로 분류하는 단계; (e-3) 광고, 스팸, 및 불법을 나타내는 텍스트를 별도의 그룹으로 분류하고, 상기 별도의 그룹으로 분류된 텍스트의 빈도 수에 기초하여 유효 콘텐츠 여부를 판단하는 단계; (e-4) 상기 유효 콘텐츠 중에서 상기 사용자와 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율의 유사성이 가장 높은 콘텐츠들을 소정 개수 추출하는 단계; (e-5) 상기 소정 개수 추출된 콘텐츠의 사용자를 유사 관심사용자로 선택하고, 상기 유사 관심사용자의 계정정보를 추출하는 단계를 포함할 수 있다.
그리고, 상기 (c) 단계는, (c-4) 상기 사용자의 관심성향을 상기 관심분야의 집중도와 상기 관심분야별 제1 관심키워드의 빈도수에 따라 정량화하는 단계를 포함하고; 상기 (e-4) 단계는, 추출된 텍스트에 기초하여 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율에 따라 상기 유효 콘텐츠별로 관심성향을 정량화하는 단계, 및 정량화된 값을 상기 (c-4)에서 상기 사용자의 관심성향의 정량화된 값과 비교하여 유사도를 산출하는 단계를 포함할 수 있다.
또한, 상기 (h) 단계는, 상기 유사 관심사용자와의 친구맺기 기능, 상기 사용자와 관심성향의 유사도가 높은 콘텐츠의 링크정보, 추천 태그 정보, 활동 소셜 플랫폼, 활동 소셜 블로그, 활동 소셜 까페 정보를 상기 사용자에게 제공하는 단계를 더 포함할 수 있다.
여기서, 상기 (b) 내지 (h) 단계는 주기적으로 반복하여 수행될 수 있다.
또한, 상기 관심분야는 지역, 음식, 및 취미를 포함할 수 있다.
한편, 상기 목적은 소셜 미디어 활동 분석을 통한 관계형성 서비스 시스템에 있어서, 적어도 하나의 메모리; 및 적어도 하나의 프로세서를 포함하고; 상기 적어도 하나의 프로세서는, 사용자 단말기로부터 입력된 사용자의 소셜미디어 계정정보를 상기 적어도 하나의 메모리에 저장하고 등록하는 과정; 상기 사용자의 소셜미디어 계정정보에 기초하여 소셜 미디어 플랫폼에 접속하여 상기 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 과정; 크롤링 된 데이터를 분석하여 사용자의 관심성향을 분석하고 관심분야 별로 상기 사용자에 관한 적어도 하나의 제1 관심 키워드를 추출하는 과정; 상기 제1 관심 키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 크롤링하는 과정; 크롤링된 상기 소셜 미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정; 상기 추출한 소셜 미디어 콘텐츠에 대응하는 유사 관심사용자의 계정정보를 추출하는 과정; 추출된 상기 유사 관심사용자의 계정정보에 기초하여 상기 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 과정; 크롤링 된 데이터를 분석하여 상기 유사 관심사용자의 관심성향을 분석하고 관심분야별로 상기 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드 및 소셜 미디어 활동정보를 추출하는 과정; 및 상기 유사 관심사용자의 계정정보, 관심성향, 관심분야별 상기 제2 관심 키워드, 및 상기 소셜 미디어 활동정보를 상기 사용자 단말기에 제공하는 과정을 처리하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 시스템에 의해서도 달성될 수 있다.
그리고, 상기 프로세서는, 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정에서, 광고, 스팸, 및 불법을 나타내는 텍스트를 별도의 그룹으로 분류하고, 상기 별도의 그룹으로 분류된 텍스트의 빈도 수에 기초하여 유효 콘텐츠 여부를 판단하여 유효 콘텐츠 중에서 유사성이 높은 콘텐츠를 추출하는 과정을 처리할 수 있다.
또한, 상기 프로세서는, 상기 관심성향 분석 시, 상기 사용자의 상기 관심분야의 집중도와 상기 관심분야별 제1 관심키워드의 빈도수에 따라 정량화 처리하는 과정을 포함하여 처리하고, 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정은, 상기 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율에 따라 상기 소셜 미디어 콘텐츠별로 관심성향을 정량화하는 과정, 및 정량화된 값을 상기 사용자의 관심성향의 정량화된 값과 비교하여 유사도를 산출하는 과정을 포함하여 처리할 수 있다.
상기한 바와 같이, 본 발명에 의한 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템은 사용자와 유사한 관심성향을 보이는 유사 관심사용자의 정보를 제공하고 이를 통해 인맥을 늘릴 수 있는 정보를 제공할 수 있다. 또한, 사용자의 관심분야에 따라서 가중치를 부여함으로써 유사 관심사용자의 추출에 있어서 사용자가 원하는 관심사를 반영할 수 있다.
도 1은 본 발명의 일 실시예에 따른 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 환경을 설명하기 위한 개략도이다.
도 2는 도 1의 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 과정의 일 예를 도시한 흐름도이다.
도 3은 본 발명의 일 실시예에 따른 사용자의 관심성향 및 제1 관심키워드 등의 분석 리포트의 일 예를 도시한 것이다.
도 4 및 도 5는 본 발명의 일 실시예에 따른 유사 관심사용자의 관심성향 및 제2 관심키워드 등의 분석 리포트의 일 예를 도시한 것이다.
도 6은 본 발명의 일 실시예에 따른 서비스 서버의 구체적인 동작을 설명하기 위해 데이터 분석부 및 사전DB의 세부구성을 도시한 것이다.
도 7은 본 발명의 일 실시예에 따른 서비스 서버에서 데이터 분석을 하는 과정에서, 추론모듈에 의해 분류되기 전과 후의 데이터를 예시한 것이다.
도 8은 본 발명의 일 실시예에 따른 서비스 서버에서 데이터 분석을 하는 과정에서, 사용자 필터부에 의해 광고성 텍스트를 분류하기 전과 후의 데이터를 예시한 것이다.
도 9는 본 발명의 일 실시예에 따른 서비스 서버에서 사용자의 관심성향 분석과정을 설명하는 흐름도이다.
도 10은 본 발명의 일 실시예에 따른 서비스 서버에서 서비스 사용자와 유사한 관심성향을 가진 유사 관심사용자를 추출하는 과정을 설명하는 흐름도이다.
도 11은 본 발명의 일 실시예에 따른 서비스 서버에서 유사 관심사용자의 관심성향을 분석하는 과정을 설명하는 흐름도이다.
이하, 도면을 참조하여 본 발명의 구체적인 실시예들에 대해 설명하기로 한다.
도 1은 본 발명의 일 실시예에 따른 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 환경을 설명하기 위한 개략도이다. 사용자 단말기(10), SNS 장치(20) 및 서비스 서버(100)는 네트워크망(30)에 의해 연결된다.
사용자 단말기(10)는 스마트폰이나 태블릿 PC와 같은 모바일 단말기와, PC 등의 사용자 단말기(10)를 포함할 수 있으며, 네트워크망(30)을 통해 서비스 서버(100)에 접속하여 본 발명에 따른 서비스를 제공받을 수 있다. 사용자 단말기(10)는 인터넷 등의 네트워크를 통해 데이터를 송수신하기 위한 통신모듈을 포함한다.
SNS 장치(20)는 소셜미디어 플랫폼 서비스를 제공하는 서버를 의미하며, 예컨대, 인스타그램, 페이스북, 네이버나 다음의 블로그, 까페 등의 다양한 SNS 플랫폼 서비스를 제공하는 장치를 포함할 수 있다. 소셜미디어는 의견·생각·경험·관점 등을 서로 공유하기 위해 사용하는 온라인 툴과 플랫폼을 의미하며, 소셜 미디어를 통해 공유되는 콘텐츠는 텍스트·이미지·오디오·비디오 등의 다양한 형태를 가지며 블로그, 소셜 네트워크, 인스턴트 메시지 보드, 팟 캐스트, 위키, 사용자 제작 콘텐츠(UCC) 등을 포함한다. 본 명세서에서는 SNS(Social Network Service)와 소셜미디어를 동일한 의미로 사용하기로 한다.
서비스 서버(100)는 발명의 일 실시예에 따른 소셜 미디어 활동 분석을 통한 관계형성 서비스를 제공하기 위한 장치로서, 데이터 및 컴퓨터 프로그램 코드를 저장하는 메모리(110), 컴퓨터 프로그램 코드를 실행하는 프로세서(120), 및 외부와의 네트워크 연결을 위한 네트워크 인터페이스(130)를 포함한다. 메모리(110)는 회원인 사용자의 정보 및 SNS 활동 분석 정보가 저장된 사용자활동DB(111)와 SNS 활동을 분석하기 위해 사용되는 사전DB(113)를 저장한다. 여기서, 사용자활동DB(111)와 사전DB(113)는 각각 별도의 메모리(110) 또는 별도의 DB 서버장치에 마련될 수도 있다. 네트워크 인터페이스(130)는 인터넷 통신 모듈 등을 포함한다.
서비스 서버(100)는 사용자 단말기(10)로부터 수신된 서비스 요청에 대응하여 적어도 하나의 SNS 장치(20)에 접속하여 관련 소셜미디어 콘텐츠를 수집 및 분석하고, 사용자와 유사 관심사를 가진 유사 관심 사용자에 관한 정보를 추출하여 사용자 단말기(10)로 제공한다. 사용자는 유사 관심 사용자에 관한 정보에 기초하여 관련 콘텐츠를 확인하여 관련 까페를 가입하거나 친구맺기 등의 관계형성을 할 수 있다.
서비스 서버(100)는 사용자로부터 서비스 신청 접수 및 분석 정보 제공 서비스를 위한 웹사이트의 컴포넌트 파일들을 저장하는 웹서버를 포함할 수 있다.
도 1에서 데이터 수집부(121), 데이터 분석부(123), 및 리포트 생성부(125)는 각각의 기능을 수행하는 일련의 컴퓨터 프로그램 코드로 구현되며, 메모리(110)에 저장되고 프로세서(120)를 통해 실행된다. 도 1에서는 설명의 편의를 위해서 프로세서(120)에 포함되는 구성으로 표현하였다.
데이터 수집부(121)는 SNS 장치(20)에 접속하여 관련 소셜미디어 콘텐츠를 수집하기 위한 것으로, 데이터를 크롤링하는 크롤러를 포함한다.
데이터 분석부(123)는 수집된 데이터를 분석하여 사용자의 관심성향 및 사용자 매칭을 통해 유사 관심 사용자를 추출하기 위한 것으로, 데이터 추출, 분류 및 예측을 위한 기계학습 또는 딥러닝 추론엔진을 포함할 수 있다.
리포트 생성부(125)는 유사 관심 사용자에 관한 리포트를 생성하기 위한 것으로, 유사 관심 사용자에 관한 정보를 통계 및 그림, 다양한 기법 등을 통해 보여주기 위한 GUI 생성 프로그램을 포함할 수 있다.
도 2는 도 1의 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 과정의 일 예를 도시한 흐름도이다. 사용자가 사용자 단말기(10)를 통해 서비스 서버(100)가 서비스하는 웹사이트에 접속하여 자신의 소셜미디어(SNS) 계정정보를 입력하고 본 발명에 따른 관계형성 서비스를 신청할 수 있다(S10). 여기서, 사용자는 적어도 하나의 소셜미디어 플랫폼의 계정정보를 입력할 수 있다.
서비스 서버(100)는 수신한 사용자의 소셜미디어 계정정보를 메모리(110)의 사용자활동DB(111)에 등록하고, 데이터 수집부(121)는 해당 소셜 미디어 계정정보에 기초하여 대응하는 소셜미디어 장치(SNS 장치(20))에 접속하여 사용자의 소셜미디어 활동 콘텐츠를 수집한다(S11). 사용자의 소셜미디어 활동 콘텐츠는 본인의 블로그나 SNS에서 작성한 글, 스크랩한 글, 클릭한 글, 가입한 까페 등의 글을 포함할 수 있다.
데이터 분석부(123)는 수집된 데이터를 가공 및 분류하여 사용자의 관심성향을 분석하고 사용자의 관심사에 관한 적어도 하나의 제1 관심 키워드를 추출한다(S12). 여기서, 제1 관심키워드는 관심분야별로 각각 추출할 수 있다. 관심분야는 미리 정의되는 것으로서, 서비스 내용에 따라서 다양하게 정의 및 설정될 수 있다. 예를 들어, 관심분야를 지역, 음식, 취미, 가족 등으로 정의할 수 있으며, 각 관심분야별로 사용자가 가장 관심을 두고 있는 적어도 하나의 제1 관심키워드를 추출한다.
서비스 서버(100)의 리포트 생성부(125)는 사용자의 관심성향 및 제1 관심키워드 등의 분석 내용을 리포트로 생성하여 사용자에게 제공할 수 있으며, 사용자는 리포트를 통해 자신의 관심성향에 관한 분석 리프트를 확인하거나 수정할 수 있다.
도 3은 본 발명의 일 실시예에 따른 사용자의 관심성향 및 제1 관심키워드 등의 분석 리포트의 일 예를 도시한 것이다. 도 3을 참조하면, 사용자의 관심성향에 대해서 그래프 형태의 리포트를 제공할 수 있으며, 음식(50%) > 지역(30%) >취미(20%)의 비중을 갖고 있음을 직관적으로 알 수 있다. 음식 분야, 지역 분야, 취미 분야 각각에 대해서 사용자의 관심키워드를 적어도 1개 이상 추출해서 보여줄 수 있다. 예컨대, 각 관심분야에서 제1 관심키워드를 관심키워드 1, 2, 3 형태로 관심순서대로 보여줄 수 있다.
이때, 사용자는 자신의 관심성향이 분석된 리포트와 유사한지 여부를 확인하고, 만약 자신의 관심사가 제대로 반영되지 않았으면 이를 수정할 수 있다. 예를 들어, 각 관심분야별로의 비율(%)을 수정하거나 제1 관심키워드들을 수정할 수 있다. 서비스 서버(100)는 사용자 단말기(10)를 통해 입력된 수정내용을 사용자의 관심성향으로 저장한다. 더 나아가, 서비스 서버(100)는 사용자의 관심성향 이외에, 사용자와 동일한 성별, 지역, 연령대를 가진 사용자들의 관심성향(관심키워드)과 사용자의 관심성향(관심키워드)을 비교하여 이를 사용자에게 제공할 수 있다. 이때, 사용자는 다른 사용자의 관심성향이나 관심키워드를 본인의 관심키워드로 추가할 수 있다. 다른 예로는, 서비스 서버(100)가 관심성향분석을 보충하기 위한 설문을 사용자에게 제공하고, 사용자의 설문 답변에 기초하여 관심성향을 보다 심층적으로 분석하여 분석 리포트를 제공할 수도 있다. 또한, 서비스 서버(100)는 사용자의 관심성향 중에서 타 사용자들과 차이가 많이 나는 분야나 관심키워드에 대해서 가중치를 부여하여 이후 분석에 활용할 수도 있다.
한편, 서비스 서버(100)의 데이터 수집부(121)는 추출한 사용자의 제1 관심키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 수집한다(S13). 전술한 과정에서, 제1 관심키워드는 각 분야별로 추출되므로 각 분야별로 추출된 다수의 제1 관심키워드를 기초로 하여 관련 소셜 콘텐츠를 수집하게 된다.
서비스 서버(100)의 데이터 분석부(123)는 수집된 제1 관심키워드에 관련된 소셜미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 유사 관심사용자의 계정정보를 추출한다(S14).
서비스 서버(100)의 데이터 수집부(121)는 추출된 유사 관심사용자의 계정정보에 기초하여 대응하는 소셜미디어 플랫폼에서 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 수집한다(S15).
서비스 서버(100)의 데이터 분석부(123)는 수집된 데이터를 분석하여 유사 관심사용자의 관심성향을 분석하고 관심분야별로 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드를 추출한다(S16).
리포트 생성부(125)는 데이터 분석부(123)를 통해 분석된 유사 관심사용자에 관한 활동정보를 리포트로 생성하여 사용자 단말기(10)로 제공한다(S17). 이때, 리포트 생성부(125)는 유사 관심사용자의 계정정보, 친구맺기 기능, 관심성향정보, 관심분야별 상기 제2 관심 키워드, 사용자와 관심성향의 유사도가 높은 콘텐츠의 링크정보, 추천 태그 정보, 활동 소셜 플랫폼, 활동 소셜 블로그, 활동 소셜 까페 정보 등을 리포트로 생성하여 사용자 단말기(10)로 제공할 수 있다.
도 4 및 도 5는 본 발명의 일 실시예에 따른 유사 관심사용자의 관심성향 및 제2 관심키워드 등의 분석 리포트의 일 예를 도시한 것이다. 도 4를 참조하면, 유사 관심사용자에 관한 정보를 사용자의 관심성향분석 그래프에 매칭하여 표시할 수 있다. 사용자의 제1 관심분야인 음식 분야에 대해서, 유사 관심사용자 정보를 '추천사용자' 항목에서 표시하고, 유사 관심사용자들의 제2 관심키워드를 '추천키워드' 항목으로 나타낼 수 있다. 서비스 서버(100)는 사용자가 '추천사용자'나 '추천키워드' 항목을 클릭하면 관련 상세정보를 볼 수 있도록 서브페이지를 구성할 수 있다. 이러한 유사 관심사용자의 정보를 각 관심분야별로 표시하여 제공할 수 있다.
도 5는 사용자의 제1 관심키워드를 중심으로 관련 유사 관심사용자와 제2 관심키워드를 확장하는 방식으로 유사 관심사용자의 정보를 표시한 예를 도시한 것이다. K는 사용자의 제1 관심키워드를 의미하고, U1~U3는 유사 관심사용자, K1~K4는 유사 관심사용자의 제2 관심키워드를 의미한다. 서비스 서버(100)는 사용자가 해당 도형을 클릭하면 관련 상세 정보를 나타내는 서브페이지를 표시할 수 있다. 도 5에서는 유사 관심사용자를 클릭했을 때, 성향빈도, 추천태그, 활동채널들에 관한 정보를 제공하는 것으로 일 예로 도시하였다. 사용자는 이러한 정보를 통해 유사 관심사용자의 관심사나 게시글 등을 확인하고 친구 맺기 등을 통해 교류할 수 있다.
본 발명의 일 실시예에 따른 전술한 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 과정은 사용자의 서비스 신청 후에 S11~S17 단계 또는 S13~S17 단계를 주기적으로 반복해서 수행하고, 그 분석결과를 리포트할 수 있다. S11~S17 단계를 주기적으로 수행하는 경우는 사용자의 관심성향이 변화할 수 있으므로 이를 반영하기 위함이고, S13~S17 단계를 주기적으로 수행하는 경우는 사용자의 관심성향은 분석한 내용을 그대로 저장하고 유사 관심사용자를 주기적으로 추출하는 경우이다. 다른 실시예에서는 사용자가 자신의 관심성향 또는 유사 관심사용자를 추출하는데 기초자료가 되는 콘텐츠에 대해 기간을 설정할 수 있게 할 수도 있다. 예를 들어, 최근 6개월 간의 활동이나 최근 3개월 간의 활동만을 기초로 관심성향을 분석하고 대응하는 유사 관심사용자를 찾도록 할 수도 있다.
도 6은 본 발명의 일 실시예에 따른 서비스 서버(100)의 구체적인 동작을 설명하기 위해 데이터 분석부(123) 및 사전DB(113)의 세부구성을 도시한 것이다.
사전DB(113)는 형태소사전DB(113a), 유사어사전DB(113b), 및 추론사전DB(113c)을 포함한다. 형태소사전DB(113a)는 텍스트의 형태소 데이터를 DB로 구축한 것으로서, 형태소 분석모듈(123a)에서 이를 활용하여 형태소 분석을 수행하게 된다. 유사어사전DB(113b)는 동일한 의미를 가진 유사어들에 관한 사전 DB를 의미한다. 추론사전DB(113c)는 가공된 형태소를 관심분야별로 분류를 위한 것으로, 각 형태소가 속하는 (관심)분야가 매칭되어 있다. 여기서, 관심분야는 서비스 내용에 따라 달리 정의될 수 있으며, 그 개수도 서비스에 따라 다양하게 설정될 수 있다. 예를 들어, 본 발명에 따른 추론사전DB(113c)에서 정의되는 관심분야는 지역, 가족, 이슈, 감정, 음식, 취미 등을 포함할 수 있다.
데이터 분석부(123)는 형태소 분석모듈(123a), 유사어 매칭모듈(123b), 추론모듈(123c), 관심성향 분석부(123d), 사용자 필터부(123e), 및 사용자 매칭부(123f)를 포함한다. 데이터 분석부(123)에 포함되는 모듈은 데이터 분석을 위한 소프트웨어를 기능별로 구분한 것으로, 각각 별도의 프로그램으로 마련되거나 통합되어 마련될 수 있다.
형태소 분석모듈(123a)은 크롤링 된 콘텐츠를 형태소 분석을 통해 정형화된 텍스트로 추출하기 위한 것으로, 텍스트를 형태소 단위로 토큰화하는 전처리 모듈로 구현 가능하다. 형태소 분석모듈(123a)은 형태소사전DB(113a)에 기초하여 문장을 구성하는 텍스트 데이터를 형태소 단위로 분리한다. 형태소 분석모듈(123a)은 형태소사전DB(113a)에 없는 단어의 경우 형태소사전DB(113a)에 업데이트 할 수 있다.
유사어 매칭모듈(123b)은 동일한 의미를 가진 상이한 단어들을 동일한 단어로 가공하기 위한 것으로, 유사어사전DB(113b)에 기초하여 유사한 의미를 가진 형태소를 가공한다. 예를 들어, '하나C.C, 하나CC, 하나골프장'은 '하나컨트리클럽'으로 매칭한다. 한편, 유사어 매칭모듈(123b)은 기계학습모델을 포함할 수 있으며, 유사어사전DB(113b)에 없는 형태소에 대해서는 기계학습모델을 통해 유사어를 분류하고 유사어사전DB(113b)에 등록한다.
추론모듈(123c)은 콘텐츠에서 추출된 각 단어의 형태소를 관심분야별로 분류하기 위한 것으로, 추론사전DB(113c)에 기초하여 형태소를 대응하는 관심분야로 매칭하여 분류한다. 추론모듈(123c)은 기계학습을 통한 추론모델을 포함할 수 있으며, 추론사전DB(113c)에 없는 형태소에 대해서는 기계학습을 통해 관심분야별로 분류한다. 여기서, 관심분야는 각 형태소 단어가 갖는 속성을 대표화하는 그룹명을 의미하는 것으로, 관심분야 즉, 단어가 갖는 속성은 사용자의 정의에 따라서 사전에 다양하게 설정될 수 있으며, 그 개수 또한 다양하게 설정될 수 있다. 예를 들어, 형태소 단어의 속성을 지역, 가족, 이슈, 감정, 음식, 취미 등으로 정의하는 경우, 관심분야는 지역, 가족, 이슈, 감정, 음식, 취미 등을 포함할 수 있다.
도 7은 본 발명의 일 실시예에 따른 서비스 서버(100)에서 데이터 분석을 하는 과정에서, 추론모듈(123c)에 의해 분류되기 전과 후의 데이터를 예시한 것으로서, (a)는 형태소 분석모듈(123a) 및 유사어 매칭모듈(123b)을 통해 추출된 데이터들이고, (b)는 추론모듈(123c)에 의해 매칭된 관심분야를 예시한 것이다.
크롤링된 콘텐츠에서 추출한 형태소들이 '양재, 와이프, 코로나, ..., 신라호텔, 독서, 여유' 이고, 추론모듈(123c)은 각각의 형태소들을 '지역, 가족, 이슈 ,...., 취미, 감정'으로 관심분야를 매칭하여 분류한 것을 확인할 수 있다.
관심성향 분석부(123d)는 추출된 형태소 데이터 및 분류 매칭된 관심분야 데이터를 분석하여 관심분야의 집중도 및 관심분야별로 관심도가 높은 키워드 등을 추출한다. 관심분야의 집중도는 분류된 관심분야에 속하는 형태소들의 개수에 기초하여 산출하고, 관심키워드는 관심분야별로 빈도수가 가장 높은 순서로 주요 관심키워드들을 추출할 수 있다. 다른 예로는, 단순히 관심분야별로 형태소의 개수나 빈도수를 비교하는 것이 아니라, 다른 사용자들의 관심분야의 집중도나 관심키워드의 평균값 등을 고려해서 평균값에서 가까울수록 가중치를 작게 부여하고, 평균값에서 멀수록 가중치를 크게 부여하여 개개인의 사용자의 독특한 특성들을 도출할 수 있도록 구현할 수도 있다.
관심성향 분석부(123d)는 추론모듈(123c)의 콘텐츠 분류결과에 기초하여 대응하는 사용자 또는 콘텐츠의 각 관심분야별 관심성향 또는 하나의 관심분야 내에서의 관심성향을 정량화하기 위한 관심성향 산출 알고리즘을 포함한다. 예를 들어, 추론모듈(123c)에서 분류하는 (관심)분야를 A, B, C로서 총 3개로 정의하고, 각 분야에 관한 관심성향 값을 a, b, c라 하면, 각 성향 값의 합(a+b+c)은 1이 된다. 관심분야 분석부는 각 사용자의 5개의 관심분야에 관한 성향 값 a, b, c을 산출할 수 있다. 여기서, a, b, c 값은 전술한 바와 같이, 관심분야의 집중도나 관련 키워드의 빈도수에 의해 값이 산출될 수 있다. 다른 예로는 A 분야에 대한 관심성향을 a1, a2, a3, a4, ...,an 로서 총 n개로 정의하고, 각 관심성향 a1, a2, a3, a4, ...,an 값을 정량적으로 산출할 수 있다.
관심성향분석부의 분석결과는 리포트 생성부(125)에 의해 리포트로 생성되어 전술한 도 3 내지 도 5와 같이 사용자 단말기(10)에 제공되어 표시될 수 있다.
사용자 필터부(123e)는 유효 사용자를 필터링하기 위한 것으로, 추출된 형태소들 중에서 광고, 스팸, 및 불법을 나타내는 형태소 텍스트를 별도의 그룹으로 분류하고, 별도의 그룹으로 분류된 텍스트의 빈도 수에 기초하여 유효 사용자에 의한 유효 콘텐츠인지 여부를 판단하여 광고성 콘텐츠를 유효 콘텐츠에서 제외하여 분석에서 배제한다. 도 8은 본 발명의 일 실시예에 따른 서비스 서버(100)에서 데이터 분석을 하는 과정에서, 사용자 필터부(123e)에 의해 광고성 텍스트를 분류하기 전과 후의 데이터를 예시한 것이다. 도 8을 참조하면, 판매, 드라이브, 시승, 견적, 중고차, 딜러 등이 각각 광고, 스팸, 및 불법을 나타내는 텍스트로 분류된 것을 확인할 수 있다.
사전DB(113)는 필터사전DB(113d)를 별도로 구비하며, 필터사전DB(113d)는 광고성 형태소들을 DB로 구축한다. 사용자 필터부(123e)는 필터사전DB(113d)에 기초하여 광고성 형태소들을 별도의 그룹으로 분류한다. 사용자 필터부(123e)는 광고성 콘텐츠로 판단된 콘텐츠에서 사용자 정보를 추출하고, 이를 필터사전DB(113d)에 등록하여 이후 콘텐츠 분석에서 해당 사용자의 콘텐츠를 유효 콘텐츠에서 배제할 수 있다.
사용자 필터부(123e) 및 필터사전DB(113d)는 광고성 콘텐츠 등의 상업적인 목적의 콘텐츠를 유효 콘텐츠에서 배제함으로써 분석에서 제외하고, 상업적 목적의 콘텐츠의 사용자를 유효사용자에서 배제하여 유사 관심사용자로 추천하지 않고 제외하기 위함이다.
사용자 매칭부(123f)는 유효 콘텐츠 중에서 사용자와 관심성향이 가장 유사한 유사 관심사용자를 추출하기 위한 것으로, 관심분야에 관한 집중도 및 관심분야 별 제1 관심키워드의 빈도 수 또는 비율의 유사성이 가장 높은 콘텐츠들을 순서대로 소정 개수 추출한다. 그리고, 소정 개수 추출된 콘텐츠의 사용자를 유사 관심사용자로 선택하고, 유사 관심사용자의 계정정보를 추출한다.
구체적으로, 사용자 매칭부(123f)는 관심성향 분석부(123d)에 의해 분석된 사용자의 관심성향 값과 사용자의 제1 관심키워드에 기초하여 추출 및 분석한 콘텐츠의 관심성향 분석결과를 비교하여 가장 유사한 콘텐츠를 순서대로 추출한다.
전술한 바와 같이, 관심성향 분석부(123d)에 의해 분석된 관심성향은 정량화된 값으로 산출된다. 예를 들어, 분야가 A, B, C로 3개이고, 서비스 사용자(P0)의 관심분야별 관심성향 값이 각각 0.5, 0.3, 0.2로 산출된 경우, 사용자 매칭부(123f)는 분석된 콘텐츠들 중에서 A, B, C 분야별 관심성향 값이 0.5, 0.3, 0.2에 가장 가까운 콘텐츠를 유사관심콘텐츠로 추출할 수 있다.
이때, 사용자 매칭부(123f)는 관심성향 분석부(123d)에 의해 분석된 관심성향에 대해서 가중치를 부여하여 사용자의 관심성향을 좀 더 두드러지게 표현할 수 있다. 예를 들어, 여러 관심성향 중에서 사용자가 찾기 원하는 분야 또는 성향에 큰 가중치를 부여하고 그렇지 않은 분야 또는 성향에 작은 가중치를 부여할 수 있다.
예를 들어, 분야가 A, B, C로 3개이고, 각 분야의 관심성향 값을 a, b, c 라고 할 때, a+b+c=1이고, 각 분야별로 가중치 값(w)을 0 ~ 10으로 설정할 수 있다.
각 관심분야별 관심성향은 아래의 수식으로 표현할 수 있다.
<수학식 1>
a * w1 = a'
b * w2 = b'
c * w3 = c'
(여기서, w1, w2, w3는 가중치를 의미하며, 0~10 사이의 값임)
이때, 새로운 총점 (r) = a' + b' + c'이며, 가중치가 부여된 새 성향은 다음과 같이 정의한다.
<수학식 2>
an = a' / r
bn = b' / r
cn = c' / r
(여기서, an, bn, cn은 가중치에 따른 최종 성향을 의미하고, r은 각 성향에 가중치가 반영된 값의 총합을 의미함)
따라서, 다른 사용자들과 비교하게 될 서비스 사용자(P0)의 최종 관심성향 값은 an, bn, cn 이 된다. 이렇게 최종 산출된 사용자의 최종 관심성향 값과, 기계산된 타 사용자의 관심성향과의 유사성을 산출한다.
다른 사용자를 P라고 하고, P의 각 관심분야별 관심성향 값 Pa, Pb, Pc에 대해 유사성을 나타내는 유사도 점수(S)는 다음과 같이 산출될 수 있다.
<수학식 3>
Sa = (10 - (an - Pa + 1)² )* an
Sb = (10 - (bn - Pb + 1)² )* bn
Sc = (10 - (cn - Pc + 1)² )* cn
(여기서, Sa, Sb, Sc 는 각 관심분야별 관심성향인 A, B, C의 유사도 점수, Pa, Pb, Pc는 각 관심분야별 관심성향의 값을 의미하며, S = Sa + Sb + Sc 이다.)
위 식에서, 10은 각 관심분야별 유사도 산출에 있어서, 각 분야별 유사성에 대한 편차를 크게 하기 위한 값으로서 이 값을 조절하여 사용자의 분야별 관심분야의 관심성향을 두드러지게 나타낼 수 있다.
예를들어, 서비스 사용자(P0)의 각 관심분야별 관심성향 값이 an = 0.3, bn = 0.6, cn = 0.1 일 때, 다른 사용자의 관심분야별 관심성향 값이 아래와 같다고 가정하다.
P1 사용자 : a = 0.2, b = 0.7, c = 0.1
P2 사용자 : a = 0.8, b = 0.1, c = 0.1
P3 사용자 : a = 0.1, b = 0.4, c = 0.5
P4 사용자 : a = 0.3, b = 0.5, c = 0.2
P5 사용자 : a = 0.2, b = 0.1, c = 0.7
서비스 사용자(P0)와 타 사용자와의 유사도 점수는 위 수학식 3에 의해서 아래와 같이 산출될 수 있다.
Sa(P1) = 2.637, Sb(P1) = 5.514, Sc(P1) = 0.900 따라서 S = 9.051
Sa(P2) = 2.925, Sb(P2) = 4.650, Sc(P2) = 0.900 따라서 S = 8.475
Sa(P3) = 2.568, Sb(P3) = 5.136, Sc(P3) = 0.964 따라서 S = 8.668
Sa(P4) = 2.700, Sb(P4) = 5.274, Sc(P4) = 0.919 따라서 S = 8.893
Sa(P5) = 2.637, Sb(P5) = 4.650, Sc(P5) = 0.984 따라서 S = 8.271
위와 같이 산출된 유사도 점수에 따른 서비스 사용자(P0)와 유사한 성향을 순서대로 나타내면 P1, P4, P3, P2, P5 된다.
사용자 매칭부(123f)는 기설정된 개수, 예컨대 유사 관심사용자가 2로 설정된 경우, 이에 대응하여 유사도 점수가 가장 높은 순서대로 P1, P4를 유사 관심사용자로 결정할 수 있다. 사용자 매칭부(123f)는 관심성향 분석부(123d)에서 산출한 사용자의 관심성향 값에 가중치를 부여하고, 다른 사용자의 콘텐츠 분석결과에 따라 산출된 관심성향 값과의 비교를 통해서 가장 유사성이 높은 콘텐츠의 사용자들을 유사 관심사용자로 추출하게 된다.
이하에서는 도 9 내지 11을 참조하여 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공과정을 설명하기로 한다. 전술한 실시예와 중복되는 설명은 필요에 따라 생략하기로 한다.
도 9는 본 발명의 일 실시예에 따른 서비스 서버(100)에서 사용자의 관심성향 분석과정을 설명하는 흐름도이다. 도 9를 참조하면, 서비스 서버(100)는 사용자의 소셜미디어 계정정보에 기초하여 사용자의 소셜미디어 활동 콘텐츠 크롤링한다(S20). 데이터 수집부(121)에서 사용자의 계정정보에 기초하여 관련 소셜 미디어 플랫폼에 접속하여 사용자의 소셜 미디어 활동 콘텐츠, 예를 들어, 해당 사용자 계정으로 작성 또는 공개된 콘텐츠들을 크롤링한다.
서비스 서버(100)는 형태소 분석 모듈을 통해 크롤링된 콘텐츠들을 형태소 분석을 수행하고 정형화된 텍스트로 추출한다(S21). 서비스 서버(100)는 유사어 매칭 모듈을 통해 추출된 정형화된 텍스트에 관한 유사어 매칭을 수행한다(S22). 서비스 서버(100)는 추론모듈(123c)을 통해서 유사어 매칭된 텍스트들을 미리 정의된 관심분야별로 분류한다(S23). 여기서, 유사어 매칭과 관심분야별 분류는 기계학습모델을 통해 수행할 수 있다.
서비스 서버(100)는 관심성향 분석부(123d)를 통해 추론모듈(123c)의 분류 결과에 기초하여 사용자의 관심성향 예컨대, 각 관심분야에 관한 집중도를 분석하고 관심분야 별로 빈도수가 높은 적어도 하나의 제1 관심키워드를 추출한다(S24). 이때, 사용자의 관심성향은 각 관심분야별로 정량화된 값으로 산출될 수 있다.
서비스 서버(100)는 리포트 생성부(125)를 통해 분석된 사용자의 관심성향에 관한 리포트를 생성하고 이를 사용자에게 제공한다(S25).
도 10은 본 발명의 일 실시예에 따른 서비스 서버(100)에서 서비스 사용자와 유사한 관심성향을 가진 유사 관심사용자를 추출하는 과정을 설명하는 흐름도이다. 도 10을 참조하면, 서비스 서버(100)는 데이터 수집부(121)를 통해 사용자의 제1 관심키워드와 관련한 소셜 미디어 콘텐츠를 크롤링한다(S30).
서비스 서버(100)는 형태소 분석 모듈을 통해 크롤링된 콘텐츠들을 형태소 분석을 수행하고 정형화된 텍스트로 추출한다(S31). 서비스 서버(100)는 유사어 매칭 모듈을 통해 추출된 정형화된 텍스트에 관한 유사어 매칭을 수행한다(S32).
서비스 서버(100)는 추론모듈(123c)을 통해서 유사어 매칭된 텍스트들을 미리 정의된 관심분야별로 분류한다. 이때, 서비스 서버(100)는 사용자 필터부(123e)를 통해서 정형화된 텍스트 중에서 광고, 스팸, 및 불법을 나타내는 텍스트를 별도의 그룹으로 분류한다(S33). 서비스 서버(100)는 별도의 그룹으로 분류된 광고성 텍스트의 빈도 수에 기초하여 유효 콘텐츠 여부 또는 유효 사용자 여부를 판단한다(S34). 예컨대, 전체 테스트에서 차지하는 광고성 텍스트의 비율이나 빈도수에 따라 유효 콘텐츠 또는 유효 사용자 여부를 판단할 수 있다. 경우에 따라서는 광고성 콘텐츠를 올리는 사용자들에 관한 DB를 마련하고 이들 사용자들의 콘텐츠는 처음부터 배제하도록 할 수도 있다. 만약, 판단결과 유효 콘텐츠가 아닌 광고성 콘텐츠인 것으로 판단된 경우, 해당 콘텐츠를 유효 콘텐츠에서 제외한다(S35).
서비스 서버(100)는 관심성향 분석부(123d)를 통해 유효 콘텐츠들의 관심분야별 분류결과에 따라 관심성향을 분석한다(S36). 이때, 유효 콘텐츠들의 관심성향은 각 관심분야별로 정량화된 값으로 산출될 수 있다.
서비스 서버(100)는 사용자 매칭부(123f)를 통해서, 기분석한 사용자의 관심성향 값과 타 사용자들의 유효 콘텐츠들의 관심성향 값을 비교하여 유사도를 산출한다(S37). 서비스 서버(100)는 사용자와 관심분야에 관한 집중도 및 관심분야 별 제1 관심키워드의 빈도 수 또는 비율의 유사성이 가장 높은 콘텐츠들을 소정 개수 추출하여 유사 관심사용자로 결정하고, 콘텐츠에서 유사 관심사용자의 계정정보를 추출한다(S38). 유사 관심사용자의 수는 미리 설정할 수 있으며, 예컨대, 1~3 으로 설정될 수 있다.
도 11은 본 발명의 일 실시예에 따른 서비스 서버(100)에서 유사 관심사용자의 관심성향을 분석하는 과정을 설명하는 흐름도이다. 도 11을 참조하면, 서비스 서버(100)는 유사 관심사용자의 소셜미디어 계정정보에 기초하여 대응하는 소셜 미디어 플랫폼에 접속하여 유사 관심사용자의 소셜미디어 활동 콘텐츠 크롤링한다(S40). 예를 들어, 서비스 서버(100)는 유사 관심사용자의 계정으로 작성 또는 공개된 콘텐츠들을 크롤링한다.
서비스 서버(100)는 형태소 분석 모듈을 통해 크롤링된 콘텐츠들을 형태소 분석을 수행하고 정형화된 텍스트로 추출한다(S41). 서비스 서버(100)는 유사어 매칭 모듈을 통해 추출된 정형화된 텍스트에 관한 유사어 매칭을 수행한다(S42). 서비스 서버(100)는 추론모듈(123c)을 통해서 유사어 매칭된 텍스트들을 미리 정의된 관심분야별로 분류한다(S43). 서비스 서버(100)는 관심성향 분석부(123d)를 통해 추론모듈(123c)의 분류 결과에 기초하여 유사 관심사용자의 관심성향 예컨대, 각 관심분야에 관한 집중도를 분석하고 관심분야 별로 빈도수가 높은 적어도 하나의 제2 관심키워드를 추출한다(S44). 여기서, 제2 관심키워드는 사용자에게 유사 관심사용자들의 관심키워드로서 추천하기 위한 일종의 추천키워드를 의미한다. 이때, 유사 관심사용자의 관심성향은 각 관심분야별로 정량화된 값으로 산출될 수 있다.
서비스 서버(100)는 리포트 생성부(125)를 통해 분석된 유사 관심사용자의 관심성향에 관한 리포트를 생성하고 이를 사용자에게 제공한다(S45).
이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합하거나 결합하여 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다. 또한, 그 모든 구성 요소들이 각각 하나의 독립적인 하드웨어로 구현될 수 있지만, 각 구성 요소들의 그 일부 또는 전부가 선택적으로 조합되어 하나 또는 복수 개의 하드웨어에서 조합된 일부 또는 전부의 기능을 수행하는 프로그램 모듈을 갖는 컴퓨터 프로그램으로서 구현될 수도 있다. 그 컴퓨터 프로그램을 구성하는 코드들 및 코드 세그먼트들은 본 발명의 기술 분야의 당업자에 의해 용이하게 추론될 수 있을 것이다. 이러한 컴퓨터 프로그램은 컴퓨터가 읽을 수 있는 저장매체(Computer Readable Media)에 저장되어 컴퓨터에 의하여 읽혀지고 실행됨으로써, 본 발명의 실시예를 구현할 수 있다. 컴퓨터 프로그램의 저장매체로서는 자기 기록매체, 광 기록매체 등이 포함될 수 있다.
또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재할 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미가 있다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.
10: 사용자 단말기 20: SNS 장치
30: 네트워크 망 100: 서비스 서버
110: 메모리 111: 사용자활동DB
113: 사전DB 113a: 형태소사전DB
113b: 유사어사전DB 113c: 추론사전DB
113d: 필터사전DB 120: 프로세서
121: 데이터 수집부 123: 데이터 분석부
123a: 형태소 분석모듈 123b: 유사어 매칭모듈
123c: 추론모듈 123d: 관심성향 분석부
123e: 사용자 필터부 123f: 사용자 매칭부
125: 리포트 생성부 130: 네트워크 인터페이스

Claims (10)

  1. 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법에 있어서,
    (a) 사용자의 소셜미디어 계정정보를 입력받아 등록하는 단계;
    (b) 상기 사용자의 소셜미디어 계정정보에 기초하여 상기 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계;
    (c) 크롤링 된 데이터를 분석하여 상기 사용자의 관심성향을 분석하고 관심분야 별로 상기 사용자에 관한 적어도 하나의 제1 관심 키워드를 추출하는 단계;
    (d) 상기 제1 관심 키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 크롤링하는 단계;
    (e) 크롤링된 상기 소셜 미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 유사 관심사용자의 계정정보를 추출하는 단계;
    (f) 추출된 상기 유사 관심사용자의 계정정보에 기초하여 상기 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 단계;
    (g) 크롤링 된 데이터를 분석하여 상기 유사 관심사용자의 관심성향을 분석하고 관심분야별로 상기 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드 및 소셜 미디어 활동정보를 추출하는 단계; 및
    (h) 상기 유사 관심사용자의 계정정보, 관심성향, 관심분야별 상기 제2 관심 키워드, 및 상기 소셜 미디어 활동정보를 상기 사용자에게 제공하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  2. 제1항에 있어서,
    상기 (c) 단계는
    (c-1) 크롤링 된 데이터를 형태소 분석을 통해 정형화된 텍스트로 추출하는 단계;
    (c-2) 추출한 텍스트를 기계학습을 통해 관심분야별로 분류하는 단계;
    (c-3) 분류 결과에 기초하여 상기 사용자의 관심분야에 관한 집중도 및 상기 관심분야 별로 빈도수가 높은 적어도 하나의 제1 관심키워드를 추출하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  3. 제2항에 있어서,
    상기 (e) 단계는,
    (e-1) 크롤링 된 콘텐츠를 형태소 분석을 통해 정형화된 텍스트로 추출하는 단계;
    (e-2) 추출한 텍스트를 기계학습을 통해 관심분야별로 분류하는 단계;
    (e-3) 광고, 스팸, 및 불법을 나타내는 텍스트를 별도의 그룹으로 분류하고, 상기 별도의 그룹으로 분류된 텍스트의 빈도 수에 기초하여 유효 콘텐츠 여부를 판단하는 단계;
    (e-4) 상기 유효 콘텐츠 중에서 상기 사용자와 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율의 유사성이 가장 높은 콘텐츠들을 소정 개수 추출하는 단계; 및
    (e-5) 상기 소정 개수 추출된 콘텐츠의 사용자를 유사 관심사용자로 선택하고, 상기 유사 관심사용자의 계정정보를 추출하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  4. 제3항에 있어서,
    상기 (c) 단계는, (c-4) 상기 사용자의 관심성향을 상기 관심분야의 집중도와 상기 관심분야별 제1 관심키워드의 빈도수에 따라 정량화하는 단계를 포함하고;
    상기 (e-4) 단계는, 추출된 텍스트에 기초하여 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율에 따라 상기 유효 콘텐츠별로 관심성향을 정량화하는 단계, 및 정량화된 값을 상기 (c-4)에서 상기 사용자의 관심성향의 정량화된 값과 비교하여 유사도를 산출하는 단계를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  5. 제1항에 있어서,
    상기 (h) 단계는, 상기 유사 관심사용자와의 친구맺기 기능, 상기 사용자와 관심성향의 유사도가 높은 콘텐츠의 링크정보, 추천 태그 정보, 활동 소셜 플랫폼, 활동 소셜 블로그, 활동 소셜 까페 정보를 상기 사용자에게 제공하는 단계를 더 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  6. 제1항 또는 제2항에 있어서,
    상기 (b) 내지 (h) 단계는 주기적으로 반복하여 수행되는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  7. 제1항에 있어서,
    상기 관심분야는 지역, 음식, 및 취미를 포함하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법.
  8. 소셜 미디어 활동 분석을 통한 관계형성 서비스 시스템에 있어서,
    적어도 하나의 메모리; 및
    적어도 하나의 프로세서를 포함하고;
    상기 적어도 하나의 프로세서는,
    사용자 단말기로부터 입력된 사용자의 소셜미디어 계정정보를 상기 적어도 하나의 메모리에 저장하고 등록하는 과정;
    상기 사용자의 소셜미디어 계정정보에 기초하여 소셜 미디어 플랫폼에 접속하여 상기 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 과정;
    크롤링 된 데이터를 분석하여 사용자의 관심성향을 분석하고 관심분야 별로 상기 사용자에 관한 적어도 하나의 제1 관심 키워드를 추출하는 과정;
    상기 제1 관심 키워드를 이용하여 복수의 소셜 미디어 플랫폼에서 관련 소셜 미디어 콘텐츠를 크롤링하는 과정;
    크롤링된 상기 소셜 미디어 콘텐츠를 분석하여 상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정;
    상기 추출한 소셜 미디어 콘텐츠에 대응하는 유사 관심사용자의 계정정보를 추출하는 과정;
    추출된 상기 유사 관심사용자의 계정정보에 기초하여 상기 유사 관심 사용자의 소셜미디어 활동 콘텐츠를 크롤링하는 과정;
    크롤링 된 데이터를 분석하여 상기 유사 관심사용자의 관심성향을 분석하고 관심분야별로 상기 유사 관심사용자에 관한 적어도 하나의 제2 관심 키워드 및 소셜 미디어 활동정보를 추출하는 과정; 및
    상기 유사 관심사용자의 계정정보, 관심성향, 관심분야별 상기 제2 관심 키워드, 및 상기 소셜 미디어 활동정보를 상기 사용자 단말기에 제공하는 과정을 처리하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 시스템.
  9. 제8항에 있어서,
    상기 프로세서는,
    상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정에서, 광고, 스팸, 및 불법을 나타내는 텍스트를 별도의 그룹으로 분류하고, 상기 별도의 그룹으로 분류된 텍스트의 빈도 수에 기초하여 유효 콘텐츠 여부를 판단하여 유효 콘텐츠 중에서 유사성이 높은 콘텐츠를 추출하는 과정을 처리하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 시스템.
  10. 제8항 또는 제9항에 있어서,
    상기 프로세서는,
    상기 관심성향 분석 시, 상기 사용자의 상기 관심분야의 집중도와 상기 관심분야별 제1 관심키워드의 빈도수에 따라 정량화 처리하는 과정을 포함하여 처리하고,
    상기 사용자의 상기 관심성향과 유사성이 높은 적어도 하나의 소셜미디어 콘텐츠를 추출하는 과정은, 상기 관심분야에 관한 집중도 및 상기 관심분야 별 상기 제1 관심키워드의 빈도 수 또는 비율에 따라 상기 소셜 미디어 콘텐츠별로 관심성향을 정량화하는 과정, 및 정량화된 값을 상기 사용자의 관심성향의 정량화된 값과 비교하여 유사도를 산출하는 과정을 포함하여 처리하는 것을 특징으로 하는 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공 시스템.
KR1020200085714A 2020-07-10 2020-07-10 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템 KR102397009B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200085714A KR102397009B1 (ko) 2020-07-10 2020-07-10 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200085714A KR102397009B1 (ko) 2020-07-10 2020-07-10 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템

Publications (2)

Publication Number Publication Date
KR20220007459A KR20220007459A (ko) 2022-01-18
KR102397009B1 true KR102397009B1 (ko) 2022-05-12

Family

ID=80052190

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200085714A KR102397009B1 (ko) 2020-07-10 2020-07-10 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템

Country Status (1)

Country Link
KR (1) KR102397009B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102618824B1 (ko) 2022-10-04 2023-12-27 박인택 지역 정보를 이용한 모임 플랫폼 서비스 제공 방법, 장치 및 시스템
KR102676277B1 (ko) * 2022-06-24 2024-06-19 주식회사 토기 네트워킹 관리를 지원하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102602936B1 (ko) * 2023-07-14 2023-11-16 (주)엔아이지씨 인공 지능을 통해 수집한 데이터를 기반으로 숏폼을 자동으로 생성하는 전자 장치 및 이를 이용한 방법

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101074820B1 (ko) * 2009-11-12 2011-10-19 주식회사 버즈니 인터넷을 활용한 추천 검색 시스템 및 그 방법
KR20140027011A (ko) * 2012-08-24 2014-03-06 삼성전자주식회사 친구 추천 방법 및 이를 위한 서버 및 단말
KR20160020358A (ko) * 2014-08-11 2016-02-23 주식회사 열정팩토리 컨텐츠에 대한 텍스트 정보의 유사도를 이용하는 컨텐츠 제공 장치 및 그 동작 방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102676277B1 (ko) * 2022-06-24 2024-06-19 주식회사 토기 네트워킹 관리를 지원하기 위한 방법, 시스템 및 비일시성의 컴퓨터 판독 가능한 기록 매체
KR102618824B1 (ko) 2022-10-04 2023-12-27 박인택 지역 정보를 이용한 모임 플랫폼 서비스 제공 방법, 장치 및 시스템

Also Published As

Publication number Publication date
KR20220007459A (ko) 2022-01-18

Similar Documents

Publication Publication Date Title
Zhang et al. Predicting the helpfulness of online product reviews: A multilingual approach
Zhang et al. Product innovation based on online review data mining: a case study of Huawei phones
Rosado-Pinto et al. How brand authenticity and consumer brand engagement can be expressed in reviews: a text mining approach
US20090319436A1 (en) Method and system of opinion analysis and recommendations in social platform applications
Aivazoglou et al. A fine-grained social network recommender system
Confente Twenty‐five years of word‐of‐mouth studies: A critical review of tourism research
KR101419504B1 (ko) 사용자 성향 분석을 통한 맞춤형 쇼핑 정보 제공 시스템 및 방법
Liu et al. Analyzing changes in hotel customers’ expectations by trip mode
Lee et al. Automated marketing research using online customer reviews
KR102397009B1 (ko) 소셜 미디어 활동 분석을 통한 관계형성 서비스 제공방법 및 그 시스템
US8156138B2 (en) System and method for providing targeted content
US9639846B2 (en) System and method for providing targeted content
Jang et al. Deep sentiment analysis: Mining the causality between personality-value-attitude for analyzing business ads in social media
US20090222551A1 (en) Method and system for qualifying user engagement with a website
Bashari et al. Influential post identification on Instagram through caption and hashtag analysis
Ghazal Fischer linear discrimination and quadratic discrimination analysis–based data mining technique for internet of things framework for healthcare
Fox et al. Olympians on Twitter: a linguistic perspective of the role of authenticity, clout, and expertise in social media advertising
Chen et al. Social opinion mining for supporting buyers’ complex decision making: exploratory user study and algorithm comparison
Xue et al. Content-aware trust propagation toward online review spam detection
Xi et al. A cross-cultural analysis of tourists’ perceptions of Airbnb attributes
Vidal et al. Application of social media for consumer research
US20130262355A1 (en) Tools and methods for determining semantic relationship indexes
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법
US20150293988A1 (en) System and Method for Opinion Sharing and Recommending Social Connections
KR102593996B1 (ko) 소셜 미디어 활동 분석을 통한 추천 서비스 제공 장치 및 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant