KR20200087357A - 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법 - Google Patents

빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법 Download PDF

Info

Publication number
KR20200087357A
KR20200087357A KR1020190000313A KR20190000313A KR20200087357A KR 20200087357 A KR20200087357 A KR 20200087357A KR 1020190000313 A KR1020190000313 A KR 1020190000313A KR 20190000313 A KR20190000313 A KR 20190000313A KR 20200087357 A KR20200087357 A KR 20200087357A
Authority
KR
South Korea
Prior art keywords
social media
analysis
media user
big data
information
Prior art date
Application number
KR1020190000313A
Other languages
English (en)
Inventor
정세종
정종우
Original Assignee
주식회사 위팝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 위팝 filed Critical 주식회사 위팝
Priority to KR1020190000313A priority Critical patent/KR20200087357A/ko
Publication of KR20200087357A publication Critical patent/KR20200087357A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법에 관하여 개시한다. 본 발명은, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템에 있어서, 소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 모듈부; 상기 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 모듈부; 및 상기 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 모듈부;를 포함할 수 있다.

Description

빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법{System and method of social media user emotion analysis through big data analysis}
본 발명은 소셜 미디어 상에 공개된 정보를 이용하여 소셜 미디어 사용자의 감정을 분석하는 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법에 관한 것이다.
인터넷 네트워크 기술 발달에 따라 쇼핑, 문화, 오락, 게임, 엔터테인먼트, 마케팅 등 다양한 분야에서 온라인 서비스가 제공되고 있다. 온라인 마케팅은 홈페이지를 통해 기업 또는 제품 정보를 사용자가 직접 페이지를 찾아 이를 전달받는 형식으로 시작되었는데 최근에는 소셜 네트워크 서비스(SNS; Social Network Service)의 이용이 급증함에 따라 SNS를 활용하는 다양한 마케팅이 시도되고 있다. 예를 들면, 현재 다양한 소셜 미디어(Social Media) 정보를 추출하여 소셜 미디어 사용자 영향력을 분석/측정하고 이를 마케팅에 연계시키고자 하는 연구가 증가되고 있다. 이같은 경향은 5G 통신망을 활용하는 소셜 네트워킹 서비스에서 더 급증할 것으로 전망되고 있다. 현재 소셜 미디어 사용자 분석/측정을 통해 취득되는 정보는 마케팅 및 광고 등 다양한 분야에서 중요한 역할을 차지하고 있다. 예를 들어, 소셜 미디어 사용자 영향력은 마케팅 분야에서 제품을 홍보하고 평판을 유도하는 역할을 하거나, 광고 분야에서 정보의 빠른 전파 및 전달로 저비용 고효율의 정보 전달 수단으로 활용될 수 있는 것으로 평가되고 있다.
한편, 소셜 미디어 사용자의 감정 분석과 관련되는 제안은 예를 들면, 국내등록특허공보 제10-1811638호의 소셜 네트워크 서비스 사용자의 감정 분석에 의한 영향력 측정 방법, 국내등록특허공보 제10-1838573호의 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법 등으로 개시되어 있다. 그러나, 소셜 미디어 사용자의 주관적 의사나 기호도/선호도 등 주관적 판단으로 분류되는 감정적 특이점 정보를 정확하게 분석하지 못하고 있다.
특허문헌 1. 국내등록특허공보 10-1811638(공고일 2017년12월27일)
특허문헌 2. 국내등록특허공보 10-1838573(공고일 2018년03월14일)
본 발명에서 해결하고자 하는 기술적 과제 중 하나는, 소셜 미디어 상에 공개된 정보를 이용하여 소셜 미디어 사용자의 감정을 정확하게 분석하는데 있다.
상기 목적들은, 본 발명에 따르면, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템에 있어서, 소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 모듈부; 상기 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 모듈부; 및 상기 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 모듈부;를 포함하는 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템으로부터 달성될 수 있다.
본 발명의 실시예에 따르면, 상기 크롤링 모듈부는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL 모듈(extraction, trasformation, toading);을 포함하여 구성될 수 있다.
본 발명의 실시예에 따르면, 상기 동의어 생성 모듈부는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하도록 구성될 수 있다.
본 발명의 실시예에 따르면, 상기 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 기호, 숫자, 문자 중 적어도 어느 하나를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 긍정/부정 또는 YES/NO를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 감정 분석 모듈부는, 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리부;를 포함하여 구성될 수 있다.
상기 목적들은, 본 발명에 따르면, 빅 데이터 분석을 통한 소셜 미디어 사용자의 감정 분석 방법에 있어서, 소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 단계; 상기 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 단계; 및 상기 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 단계;를 포함하는 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법으로부터 달성될 수 있다.
본 발명의 실시예에 따르면, 상기 크롤링 단계는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL(extraction, transformation, 1oading) 연산 단계;를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 동의어 생성 단계는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하는 단계;를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 기호, 숫자, 문자 중 적어도 어느 하나를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 긍정/부정 또는 YES/NO를 포함할 수 있다.
본 발명의 실시예에 따르면, 상기 감정 분석 단계는, 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리 단계;를 포함할 수 있다.
본 발명은, 소셜 미디어 사용자의 의사나 기호도/선호도 등 주관적 판단으로 평가되는 감정적 특이점 정보를 정확하게 판단하여 신뢰성이 높은 소셜 미디어 사용자 감정 분석 데이터를 제공할 수 있는 효과가 있다.
도 1은 본 발명의 일실시예에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 구성도의 예시이다.
도 2는 도 1의 관리 서버 구성도의 예시이다.
도 3은 도 1 및 도 2의 관리 서버를 이용한 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법을 설명하는 흐름도이다.
도 4는 도 1 및 도 2의 관리 서버를 이용한 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석의 예를 설명하는 플로우 챠트의 예시이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 '빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법'을 구체적으로 설명하면 다음과 같다.
SNS는 온라인 상에서 불특정 타인과 관계를 유지하는 가운데 소통할 수 있도록 지원하는 서비스로서, 스마트 폰 등과 같은 고성능 단말 장치 및 Wi-Fi 망과 같이 저렴하게 이용 가능한 이동통신 네트워크의 구축에 따라 그 이용이 증가하고 있으며 이같은 경향은 5G 통신망에서 더 급증할 것으로 전망되고 있다. SNS는 소셜 미디어 사용자 각각이 1:1로 직접 관계를 맺고 관계를 맺은 소셜 미디어 사용자 간에 정보가 교류될 수 있기 때문에 관심 분야가 유사한 소셜 미디어 사용자들의 상호 관계하에서 커뮤니티를 형성할 가능성이 크다.
이들 소셜 미디어 사용자 간에 공유되는 정보는 신뢰도가 높은 경향이 있고 소셜 미디어 사용자가 공유하는 주관적인 의사나 기호도/호감도 등의 감정 평가 정보들을 활용하는데 있어서 소셜 미디어 사용자 또는 다수의 소셜 미디어 사용자들이 그룹별로 관심 있고 확산 가능성이 큰 마케팅 및 문화, 교육, 오락, 쇼핑 등의 정보를 매칭하여 제공하는 경우 신뢰도가 높은 정보로 활용될 수 있다.
SNS는 광범위하고 동시에 특정 성향의 집단으로 분류될 수 있는 SNS 서비스 사용자들을 데이터베이스에 의해 분류하고 이들 사용자들의 주관적 특이점 성향을 정보로 파악하고 관리할 수 있다는 점에서 유용하게 활용될 수 있다.
본 발명은 소셜 미디어 사용자와 유무선 통신 네트워크망으로 접속되는 관리 서버를 이용하여 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법을 제공한다.
본 발명의 실시예의 설명에서 서로 구별되는 구성요소들은 각각의 특징을 설명하기 위한 것으로 복수의 구성요소가 통합되어 하나의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다. 하나의 구성요소가 분산되어 복수의 하드웨어 또는 소프트웨어 단위로 이루어질 수도 있다.
이하의 본 실시예에서는 소셜 네트워크 서비스(SNS) 중에서 소셜 네트워크들, 예를 들어, 트위터(Twitter), 페이스북(Facebook), 인스타그램(Instagram), 링크드인(Linkedin), 텀블러(Tumblr) 및 핀터레스트(Pinterest) 등의 다양한 소셜 네트워크에서 생산되거나 수집될 수 있는 소셜 미디어(Social Media) 정보를 크롤링하고 추출하여 분석하는 것으로 설명한다.
도 1은 본 발명의 일실시예에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 구성도의 예시이다.
본 발명은 도 1에 도시된 바와 같이, 소셜 미디어 사용자(A)와 유무선 통신 네트워크(100) 망으로 접속되는 관리 서버(200)를 통해 상호 연관되는 소셜 미디어 사용자(A)들의 소셜 미디어 정보 데이터를 크롤링하고, 소셜 미디어 사용자(A)가 소셜 미디어상에서 주관적 의사를 표시하는 경우 이들 키워드를 동의어 사전으로 구분 처리한 뒤 주관적 특이점 정보로 추출하하여 평가/분석하도록 구성될 수 있다.
여기서, 소셜 미디어 사용자(A)는, 도 1에 도시된 바와 같이 제1 소셜 미디어 사용자 단말기(300) 및 제1 소셜 미디어 사용자 단말기(300)와 소셜 미디어 정보를 공유하여 정보공개로 연관 관계(예를 들면 친구관계 등)를 형성하는 제2,3....N의 소셜 미디어 사용자 단말기(310)(320)들을 모두 포함할 수 있다. 소셜 미디어 사용자(A)들은 의료, 금융, 교육, 과학, 교통, 통신, 제조 등 여러 분야에서 다양한 기능을 하는 센서들과 관련 행위 기록을 통해 다양한 유형의 데이터를 생성시키는 동시에 인터넷상에서 일어나는 소셜 네트워크 서비스, 사용자 생성 콘텐츠(UCC:User Created Contents), 온라인 쇼핑, 검색 등과 연관된 다양한 행위를 통해 많은 양의 데이터를 생성시키게 되며 이는 빅 데이터베이스로 관리될 수 있다.
본 발명에 따르면 제1 소셜 미디어 사용자 단말기(300)와 정보공개로 관계를 맺은 연관되는 제2,3...N의 소셜 미디어 사용자 단말기(310)(320)...(N)들이 생성시키는 다양한 유형의 소셜 미디어 연관 데이터들은 관리 서버(200)로 수집될 수 있다.
본 발명에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템을 구성하는 관리 서버(200)의 구성은 도 2에 도시된 바와 같이 구성될 수 있다.
도 2는 본 발명의 일실시예에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템을 구성하는 관리 서버의 예시이다.
관리 서버(200)는 도 2에 도시된 바와 같이 소셜 미디어 사용자의 소셜 미디어 정보를 수집하여 빅 데이터베이스를 생성하는 크롤링 모듈부(213)를 포함하여 구성될 수 있다.
크롤링 모듈부(213)는 소셜 미디어(웹페이지 등)에서 다양한 정보를 수집해오는 크롤러(crawler) 프로그램 및 크롤러가 수집한 정보를 검색하기 쉬운 형태로 가공한 후 색인을 만들어 서버에 보존하는 인덱서, 그리고 사용자가 특정 검색어를 입력하면 쿼리(query)를 통해 인덱서 서버 안에 축적되어 있는 정보를 꺼내 검색결과를 제공하는 시스템을 포함할 수 있다.
크롤링 모듈부(213)의 검색엔진으로서 이용되는 크롤러 프로그램은 소셜 미디어 사용자(A)의 소셜 미디어(웹페이지 등)를 돌아다니며 소셜 미디어의 웹문서 위치(URL)와 링크정보, 문서내용 등 각종 정보들을 수집하고 크롤링(crawling) 또는 스파이더링(spidering) 작업을 수행할 수 있다.
크롤링 모듈부(213)의 크롤러는 소셜 미디어의 각 링크를 일일이 따라가 정보를 얻는 작업을 대신하여 자동적으로 소셜 미디어의 웹서버를 순회하며 쇼설 미디어의 웹페이지의 내용을 분석하고, 그 안에 포함되어 있는 URL들을 추출한 후 그 URL들로 하나씩 이동하면서 텍스트, 그림, 멀티미디어 정보 등을 수집하여 빅 데이터베이스를 생성할 수 있다.
크롤링 모듈부(213)는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL모듈(extraction, transformation, 1oading)을 포함하여 구성될 수 있다.
크롤링 모듈부(213)는, 소셜 미디어 사용자들 중에서 소셜 미디어의 정보를 공유하도록 설정된 소셜 미디어 사용자로부터 감정적 특이점 정보를 크롤링하는 ETL 엔진을 포함하여 구성될 수 있다.
외부 데이터 즉 소셜 미디어 사용자의 소셜 미디어 데이트 수집 방법으로는 크롤러 프로그램을 갖춘 크롤링 엔진(Crawling Engine)을 통한 수집일 수 있다. 이 방법에서는 로봇이 거미줄처럼 얽혀 있는 링크를 따라다니며 소셜 미디어 사용자가 방문한 사이트의 모든 페이지의 복사본을 생성 문서를 수집할 수 있다.
크롤링 엔진에서는 대개 시드라고 불리는 URL 리스트에서 시작하는데, 페이지의 모든 하이퍼링크를 인식하여 URL 리스트를 갱신하고, 갱신된 URL 리스트는 재귀적으로 다시 방문하면서 소셜 미디어 사용자들이 행위 흔적으로 남긴 외부 데이터들 수집할 수 있다.
여기서, 관리 서버(200)의 크롤링 모듈부(213)를 통해 크롤링되어 수집되는 소셜 미디어 연관 데이터 중 개인정보에 해당하는 이메일 주소, 실명, ID, 전화번호, 집 주소 등의 개인정보 데이터는 필터링을 통해 걸러내거나 자동 삭제를 통해 해당 데이터를 버릴 수 있도록 관리 서버(200)를 설정하여 무분별한 개인정보 수집이 자체 제어될 수 있도록 하는 것이 바람직할 수 있다.
또한, 관리 서버(200)는 도 2에 도시된 바와 같이 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 모듈부(214)를 포함하여 구성될 수 있다.
여기서, 동의어 생성 모듈부(214)는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하도록 제어될 수 있다.
또한, 동의어 생성 모듈부(214)는 긍정, 부정을 판단하기 위하여 동의어사전을 생성할 수 있으며, 동의어사전은 나이, 지역, 성별, 종사하는 직종에 따라서 별도로 생성될 수 있다.
또한, 관리 서버(200)는 도 2에 도시된 바와 같이 동의어 생성 모듈부(214)를 통해 생성되는 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 모듈부(215)를 포함하여 구성될 수 있다.
여기서, 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 기호, 숫자, 문자 중 적어도 어느 하나를 포함할 수 있다. 또한, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 긍정/부정 또는 YES/NO로 표현된 텍스트 형식을 포함할 수 있다.
또한, 감정적 특이점 정보는, 소셜 미디어의 본문에 표시되는 내용에 응답하여 달리는 댓글/답글의 성향을 분석하여 추출되는 정보를 포함할 수 있다. 예를 들어, '미세먼지가 많아요'가 본문의 내용으로 기록될 때, 본문에 달리는 댓글/답글의 성향 중 '맞아요', '미세 먼지가 많아요', '공기가 나빠요' 등은 긍정적 의사 표시로, '아니오', '미세 먼지가 없어요', '공기가 좋아요' 등은 부정적 의사 표시로 분류되어 분석 처리될 수 있다.
또한, 감정적 특이점 정보를 평가 분석하는 감정 분석 모듈부(215)는 키워드 검색을 세분화해서 검색하고 계층적으로 분석결과를 도출할 수 있다. 예를 들어, 출신학교, 직장 등을 명시하는 경우, 지역 태그(tag)가 정보에 붙어 있는 경우에 지역 정보 수집이 가능하므로 지역, 시간, 상황을 포함하는 계층적 분석 결과를 도출하도록 구성하는 것이 바람직할 수 있다.
또한, 개인정보 필터링 시스템 포함할 수 있다. 개인정보 필터링 시스템을 포함하는 경우 민감한 개인정보를 블라인드로 처리할 수 있다. 또한, 크롤링된 원시데이터의 문장에서 형태소 사전을 통해 단어를 분리하고 한국어 특유 단어의 앞,뒤 어미 등을 판단, 문장에 대한 예측도를 높일 수 있도록 하는 것이 바람직할 수 있다. 예를 들면 딥 러닝 기술 중 텍스트마이닝 부분에서 영어에 비해 부족한 확률의 예측도를 높이도록 하는 것이 바람직할 수 있다. 또한, SNS 데이터를 통한 자연어 학습과정에서 줄임말, 은어, 신조어 등의 학습을 통한 키워드의 추출이 가능하도록 할 수 있다.
또한, 감정 분석 모듈부(215)는 소셜 미디어 사용자(A) 간 수집 데이터 연산에서 소셜 미디어 데이터 정보의 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리부(217)를 포함하여 구성될 수 있다.
예를 들어, 소셜 미디어 사용자(A)가 소셜 미디어의 웹페이지에 표시하는 주관적 의사/의견/평가/추천 등에서 긍정 키워드를 사용하는 경우를 키워드로 구분하면, '좋아요', '굿', 'YES', 'good', 'thank', 'thanks' 등으로 표현될 수 있고, 부정 키워드를 사용하는 경우를 키워드로 구분하면, '나빠요', '싫어요', '노', 'NO' 'NOT', 'BAD' 등으로 표현될 수 있는데, 이것들을 모두 동일한 것으로 인식하여 한결같이 긍정 키워드의 경우 'Y'로, 부정 키워드의 경우 'N'으로 표현하는 것이 일관성 확보를 위한 키워드 데이터 정제 처리의 예가 될 수 있다.
따라서 키워드 정제처리부(217)는 크롤링으로 생성되는 소셜 미디어 사용자(A)들의 소셜 미디어 빅 데이터들 중 '긍정'은 'Y'로, '부정'은 'N'으로 구분되는 식별 데이터(<긍정-Y>*<부정-N>)로 정제하여 소셜 미디어 사용자 ID 별 감정적 특이점 정보로 가공하고 그 가공된 식별 데이터를 관리 서버(200)의 데이터베이스(216)에 저장되도록 할 수 있다.
키워드 정제처리부(217)를 통해 소셜 미디어 사용자 ID 별로 감정적 특이점 정보가 긍정인지 부정인지가 가공된 식별 데이터(<긍정-Y>*<부정-N>) 정보는 관리 서버(200)를 통해 해당 소셜 미디어 사용자 ID를 추적하여 해당 소셜 미디어 사용자가 긍정 또는 부정으로 의사를 표시한 매체의 종류를 판단할 수도 있다.
본 발명에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법을 설명하면 다음과 같다.
본 발명에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법은, 소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 단계; 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 단계; 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 단계로 이루어질 수 있다.
빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석을 수행하는 크롤링 단계는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL(extraction, transformation, loading) 연산 단계를 포함할 수 있다.
빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석을 수행하는 동의어 생성 단계는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하는 단계를 포함할 수 있다.
빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석을 수행하는 동의어 생성 단계는, 긍정, 부정을 판단하기 위하여 동의어사전을 생성할 수 있으며, 동의어사전은 나이, 지역, 성별, 종사하는 직종에 따라서 별도로 생성될 수 있다.
빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석을 수행하는 감정 분석 단계는, 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리 단계를 포함할 수 있다.
빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석을 수행하는 감정적 특이점 정보는, 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 기호, 숫자, 문자 중 적어도 어느 하나를 포함할 수 있다. 또한 감정적 특이점 정보로는 소셜 미디어 사용자가 소셜 미디어에 표시하는 주관적 의사로서, 긍정/부정 또는 YES/NO를 포함할 수 있다.
본 발명에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법을 도 3 및 도 4를 참조하여 설명하면 다음과 같다.
도 3은 본 발명의 일실시예에 따른 관리 서버를 이용한 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법을 설명하는 흐름도이다.
도 3에 도시된 바와 같이, 가상의 제1 소셜 미디어 사용자가 소셜 네트워크 서비스에 접속하면 해당 소셜 미디어의 접속 정보는 관리 서버(200)에 네트워크(100) 망을 통해 제1 소셜 미디어 사용자의 접속 정보가 입력된다(S110).
연속적으로 제1 소셜 미디어 사용자와 연관되어 관계를 맺고 있는 다른 소셜 미디어 사용자 연관자(제2,3...N의 소셜 미디어 사용자 단말기)들이 검색되고 추출된다(S120).
이어서 제2,3...N의 소셜 미디어 사용자가 단말기를 통해 접속한 해당 소셜 미디어 정보 및 데이터는 관리 서버(200)의 검색 엔진인 사용자 추출부(212)를 통해 수집된다(S130).
S130 단계에서 수집되는 소셜 미디어 정보 및 데이터는 크롤링 모듈부(213)의 엔진을 통해 크롤링되고, 이를 통해 관리 서버(200)에 빅 데이터베이스가 생성된다(S140~S150).
연속적으로 관리 서버(200)의 감정 분석 모듈부(215)를 통해 빅 데이터 분석에 의한 대응 키워드로 감정적 특이점 정보가 추출되고(S160), 감정적 특이점에 대한 평가/분석이 수행되고 종료된다(S170). 예를 들어, 소셜 미디어 사용자 ID 별로 감정적 특이점 정보가 긍정인지 부정인지가 가공된 식별 데이터(<긍정-Y>*<부정-N>) 정보로 추출되고 저장될 수 있다.
본 발명의 실시예에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법을 도 4를 참조하여 설명하면 다음과 같다.
도 4는 본 발명의 실시예에 따른 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석의 예를 설명하는 플로우 챠트의 예시이다.
특정의 소셜 미디어 사용자 단말기가 접속되면(S210), 소셜 미디어 사용자 단말기 상에서 이루어진 소셜 미디어 접속 정보 및 데이터에 대한 크롤링이 실행된다(S220). 이어서 소셜 미디어 사용자의 키워드 분석을 통한 동의어 사전이 생성되고 감정적 특이점 정보 분석이 실행된다(S230).
S230 단계에서 분석되는 감정적 특이점 정보에 대한 평가를 수행하고 그 결과 긍정/부정 키워드 사용인지가 판단된다(S240).
S240 단계에서의 판단결과, 긍정 키워드 사용인 것으로 판단되면, 긍정 키워드 소셜 미디어 사용자에게 감정적 의사를 표시한 소셜 미디어에 해당하는 마케팅 광고를 정보로 제공하거나 전송하는 것으로 종료된다(S260).
S240 단계에서의 판단결과, 긍정 키워드 사용이 아닌 경우로 판단되면, 다시 부정 키워드 사용인지가 판단된다(S250).
다시 S250 단계에서의 판단결과, 부정 키워드 사용이 아닌 것으로 판단되면 상기 S260 단계로 실행되어 종료되고, 부정 키워드 사용인 것으로 판단되면 상기 S220 단계의 크롤링으로 재귀된다.
본 발명의 다양한 실시예는 하드웨어, 펌웨어(firmware), 소프트웨어 또는 이들의 결합 등에 의해 구현될 수 있다. 하드웨어에 의한 구현의 경우 하나 또는 그 이상의 ASICs(Application Specific Integrated Circuits), DSPs(Digital Signal Processors), DSPDs(Digital Signal Processing Devices), PLDs(Programmable Logic Devices), FPGAs(Field Programmable Gate Arrays), 범용 프로세서(general processor), 컨트롤러, 마이크로 컨트롤러, 마이크로 프로세서 등에 의해 구현될 수 있다.
본 발명의 다양한 실시예의 따른 동작이 장치 또는 컴퓨터 상에서 실행되도록 하는 소프트웨어 또는 머신-실행가능한 명령들(예를 들어, 운영체제, 어플리케이션, 펌웨어(firmware), 프로그램 등) 및 소프트웨어 또는 명령 등이 저장되는 장치 또는 컴퓨터 상에서 실행 가능한 비-일시적 컴퓨터-판독가능 매체(non-transitory computer-readable medium)를 포함할 수 있다.
본 발명은, 소셜 미디어 사용자의 의사나 기호도/선호도 등 주관적 판단으로 평가되는 감정적 특이점 정보를 정확하게 분석할 수 있는 이점이 있다.
본 발명은 도면에 도시된 실시예를 참고로 설명되었으나 실시예로 한정되지 않으며 본 발명의 요지를 벗어나지 않은 범위 내에서 수정 및 변형하여 실시할 수 있으며 수정과 변형이 이루어진 것은 본 발명의 기술 사상에 포함된다.
100: 네트워크 200: 관리 서버
211: 사용자 인터페이스부 212: 사용자 추출부
213: 크롤링 모듈부 214: 동의어 생성 모듈부
215: 감정 분석 모듈부 216: 데이터베이스부
217: 키워드 정제 처리부
300: 제1 소셜 미디어 사용자 단말기
310: 제2 소셜 미디어 사용자 단말기
320: 제3 소셜 미디어 사용자 단말기
N: N(의)...소셜 미디어 사용자 단말기

Claims (8)

  1. 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템에 있어서,
    소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 모듈부;
    상기 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 모듈부; 및
    상기 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 모듈부;를 포함하는 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템.
  2. 제 1 항에 있어서,
    상기 크롤링 모듈부는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL 모듈(extraction, transformation, loading);을 포함하는, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템.
  3. 제 1 항에 있어서,
    상기 동의어 생성 모듈부는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하는, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템.
  4. 제 1 항에 있어서,
    상기 감정 분석 모듈부는, 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리부;를 포함하는, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템.
  5. 빅 데이터 분석을 통한 소셜 미디어 사용자의 감정 분석 방법에 있어서,
    소셜 미디어 상에서 공개된 정보를 이용하여 빅 데이터베이스를 생성하는 크롤링 단계;
    상기 빅 데이터베이스 상에서 긍정 및 부정 반응에 대한 다양한 표현들의 동의어 사전을 생성하는 동의어 생성 단계; 및
    상기 동의어 사전에 의하여 감정적 특이점 정보를 분석하는 감정 분석 단계;를 포함하는 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법.
  6. 제 5 항에 있어서,
    상기 크롤링 단계는, 빅 데이터베이스로부터 필요한 데이터를 추출/변환하여 분석을 담당하는 시스템으로 전송하거나 적재하는 ETL(extraction, transformation, loading) 연산 단계;를 포함하는, 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 방법.
  7. 제 5 항에 있어서,
    상기 동의어 생성 단계는, 동의어 사전을 생성하되, 동의어 사전은 소셜 미디어 사용자의 성별, 나이대 및 지역을 나누어 생성하는 단계;를 포함하는, 빅 데이터 분석을 통한 감정 분석 방법.
  8. 제 5 항에 있어서,
    상기 감정 분석 단계는, 감정적 특이점 정보에 포함되는 추출 데이터의 중복을 제거하고 추출 키워드의 일관성을 확보하기 위한 키워드 정제처리 단계;를 포함하는, 빅 데이터 분석을 통한 소셜 미디어 사용자의 감정 분석 방법.


KR1020190000313A 2019-01-02 2019-01-02 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법 KR20200087357A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190000313A KR20200087357A (ko) 2019-01-02 2019-01-02 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190000313A KR20200087357A (ko) 2019-01-02 2019-01-02 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법

Publications (1)

Publication Number Publication Date
KR20200087357A true KR20200087357A (ko) 2020-07-21

Family

ID=71832616

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190000313A KR20200087357A (ko) 2019-01-02 2019-01-02 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR20200087357A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102344804B1 (ko) * 2021-10-19 2021-12-29 주식회사 큐로드 인공지능 기반 모니터링 기술을 이용한 유저 피드백 정보 관리방법
KR20220051574A (ko) 2020-10-19 2022-04-26 삼성에스디에스 주식회사 리퀘스트 핸들링 방법 및 그 장치

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811638B1 (ko) 2016-02-02 2017-12-27 전남대학교 산학협력단 소셜 네트워크 서비스 사용자의 감정 분석에 의한 영향력 측정 방법
KR101838573B1 (ko) 2017-02-08 2018-03-14 서울대학교산학협력단 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101811638B1 (ko) 2016-02-02 2017-12-27 전남대학교 산학협력단 소셜 네트워크 서비스 사용자의 감정 분석에 의한 영향력 측정 방법
KR101838573B1 (ko) 2017-02-08 2018-03-14 서울대학교산학협력단 공간 감성어 사전을 이용한 감성분석 기반의 장소 선호도 분석방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220051574A (ko) 2020-10-19 2022-04-26 삼성에스디에스 주식회사 리퀘스트 핸들링 방법 및 그 장치
KR102344804B1 (ko) * 2021-10-19 2021-12-29 주식회사 큐로드 인공지능 기반 모니터링 기술을 이용한 유저 피드백 정보 관리방법

Similar Documents

Publication Publication Date Title
Asghar et al. T‐SAF: Twitter sentiment analysis framework using a hybrid classification scheme
Bouadjenek et al. Social networks and information retrieval, how are they converging? A survey, a taxonomy and an analysis of social information retrieval approaches and platforms
US10546006B2 (en) Method and system for hybrid information query
Zhao et al. Connecting social media to e-commerce: Cold-start product recommendation using microblogging information
Cesare et al. Detection of user demographics on social media: A review of methods and recommendations for best practices
US9135255B2 (en) System and method for making gift recommendations using social media data
Zhao et al. Social sentiment sensor: a visualization system for topic detection and topic sentiment analysis on microblog
Armentano et al. Followee recommendation based on text analysis of micro-blogging activity
US20140257795A1 (en) Linguistic Expression of Preferences in Social Media for Prediction and Recommendation
US20150089409A1 (en) System and method for managing opinion networks with interactive opinion flows
US9171326B2 (en) System and method for making gift recommendations using social media data
JP5615857B2 (ja) 分析装置、分析方法及び分析プログラム
US20170277790A1 (en) Awareness engine
US10529031B2 (en) Method and systems of implementing a ranked health-content article feed
Okazaki et al. How to mine brand Tweets: Procedural guidelines and pretest
CN112084333B (zh) 一种基于情感倾向分析的社交用户生成方法
Reyero Lobo et al. Semantic Web technologies and bias in artificial intelligence: A systematic literature review
KR20200087357A (ko) 빅 데이터 분석을 통한 소셜 미디어 사용자 감정 분석 시스템 및 방법
Wang et al. Content-based classification of sensitive tweets
KR101811638B1 (ko) 소셜 네트워크 서비스 사용자의 감정 분석에 의한 영향력 측정 방법
KR20200084190A (ko) Sns 사용자의 소셜 미디어 특이점 정보 분석을 통한 맞춤형 마케팅 정보제공 시스템 및 방법
US20140089131A1 (en) System and method for making gift recommendations using social media data
Ashraf et al. Personalized news recommendation based on multi-agent framework using social media preferences
Hu et al. Embracing information explosion without choking: Clustering and labeling in microblogging
JP2015210700A (ja) 商品に対するユーザの感情分析装置及びプログラム