KR20150055152A - 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법 - Google Patents

사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법 Download PDF

Info

Publication number
KR20150055152A
KR20150055152A KR1020130136219A KR20130136219A KR20150055152A KR 20150055152 A KR20150055152 A KR 20150055152A KR 1020130136219 A KR1020130136219 A KR 1020130136219A KR 20130136219 A KR20130136219 A KR 20130136219A KR 20150055152 A KR20150055152 A KR 20150055152A
Authority
KR
South Korea
Prior art keywords
data
analysis
users
analyzing
user
Prior art date
Application number
KR1020130136219A
Other languages
English (en)
Other versions
KR102204992B1 (ko
Inventor
윤여찬
김현기
오효정
이충희
임수종
장명길
조요한
최미란
최윤재
허정
류법모
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020130136219A priority Critical patent/KR102204992B1/ko
Publication of KR20150055152A publication Critical patent/KR20150055152A/ko
Application granted granted Critical
Publication of KR102204992B1 publication Critical patent/KR102204992B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification

Abstract

본 발명은 데이터 작성자의 프로필에 기반하여 빅 데이터를 분석하고 요약하여 제시하는 시스템 및 그 방법에 관한 것이다. 본 발명은 데이터를 작성한 작성자의 나이, 성별, 거주 지역, 관심분야 등의 프로필 정보를 자동으로 수집하고 이를 이용해 데이터를 분석함으로써 다양한 측면에서 사용자들이 원하는 대상에 대한 분석 및 결과 제공이 가능하도록 한다.

Description

사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법 {Big Data Analyzing System and the Method based on the User Profile Analysis}
본 발명은 인터넷 텍스트 혹은 이미지에서 원하는 정보를 추출/검색하는 기술에 관한 것으로서, 구체적으로는, 인터넷에 작성된 텍스트 및 프로필 정보를 토대로 시스템 사용자가 원하는 정보를 추출하는 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법에 관한 것이다.
인터넷 및 각종 소셜미디어에는 빅 데이터라 불리는 거대하고 다양한 정보가 내재되어 있다. 이러한 데이터에서 의미 있는 정보를 추출하고 분석하는 다양한 연구가 진행되고 있는데 그 중 하나로 빅 데이터에 기술된 다양한 의견정보에 대하여 이를 수집/분석하여 활용하는 연구가 있다. 이러한 연구의 예로는 특정 상품의 장/단점을 분석하고 상품에 대한 긍/부정 반응을 분석, 해당 상품에 대하여 어떤 긍/부정 의견이 인터넷에 나타나고 있는지를 요약하여 제시하는 연구가 있다. 해당 연구에서는 일반적으로 결과물로 아래와 같이 특정 상품에 대한 긍/부정 의견을 요약하여 제시한다.
● XX 카메라
■ 선예도
◆ 긍정의견: 142
- XX카메라는 선예도는 으뜸이라고 할 수 있습니다. 다른 어떤 카메라보다 좋습니다.
- XX카메라의 여러 기능 중에서 선예도는 다른 카메라를 압도합니다.
◆ 부정의견: 12
- 흐릿하게 나오는 사진, XX카메라 산 거 후회됩니다.
■ 배터리
◆ 긍정의견: 52
- XX카메라는 배터리가 정말 오래간다. 한 달은 충전 없이 버틸 정도.
- 배터리는 한번 충전하면 정말 오래간다.
◆ 부정의견: 12
- 배터리 충전하기 정말 힘들다.
- 배터리가 너무 비싸 추가로 구매하기가 부담이 많이 된다.
이와 같은 정보를 제시하기 위하여 다양한 방법이 사용되는데 일반적으로 아래와 같은 절차를 거쳐 사용자에게 정보를 제시한다.
1. 특정 상품에 대하여 의견이 기술된 리뷰 사이트에서 문서를 수집
2. 해당 문서에 대하여 감성분석 기술을 적용, 긍/부정 의견을 추출
3. 추출된 긍/부정 의견을 속성(Aspect, 위의 예에서는 선예도, 배터리)별로 분류, 사용자에게 결과로 제시
이러한 절차를 통해 시스템 사용자는 조사하고자 하는 대상에 대하여 어떠한 의견이 웹에서 교환되고 있는지를 파악하여 대응이 가능하다. 하지만 종래의 기술의 경우 의견을 작성한 데이터 작성자의 정보가 누락되어있다.
이는 실제 마케팅에서 의견을 제시한 인물의 정보, 가령 사용자의 나이, 지역, 성별 등이 중요한 요소로 작용하는 점에 비추어 분명한 한계점이라 할 수 있다. 가령 젊은 층을 타깃으로 하는 상품을 판매할 경우, 다른 대상보다는 타깃으로 하는 10~20대의 사용자들이 어떠한 점을 장점으로 생각하고 어떠한 점을 단점으로 생각하는지를 파악하여야 거기에 맞게 상품을 홍보/개선할 수 있다.
따라서 데이터 작성자의 나이, 성별, 거주지역, 관심분야 등의 기본정보를 자동으로 분석하고 이에 기반하여 분석하고자 하는 대상에 대한 의견 및 여론을 분석하는 방법과 이를 효과적으로 제시하기 위한 방법이 요구된다고 할 것이다.
본 발명은 전술한 문제점을 해결하기 위하여, 인터넷상의 데이터들을 분석하여 데이터를 생성한 사용자들의 프로필을 분석하고 분석한 사용자 프로필 정보에 기초하여 데이터에 대한 분석 결과 및 사용자의 프로필 정보를 제공하는 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법을 제공하는 것을 목적으로 한다.
본 발명은 사용자들이 생성한 데이터들을 수집하고 상기 수집한 데이터들에 기초하여 상기 사용자들의 프로필을 분석하는 사용자프로필분석부; 상기 사용자들의 프로필 정보를 이용하여 상기 사용자들이 생성한 데이터들 및 상기 데이터들을 생성한 사용자들을 분석하는 데이터분석부; 및 상기 데이터분석부가 분석한 결과를 제공하는 결과제공부를 포함하되, 상기 결과제공부는 상기 데이터분석부에 의한 데이터 분석 결과와 상기 데이터를 생성한 사용자들의 프로필 정보를 함께 제공하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 일면에 따르면, 상기 결과제공부는 상기 데이터 분석 결과를 클릭하거나 상기 데이터 분석 결과에 커서가 위치하면 상기 데이터를 생성한 사용자의 프로필 정보를 제공하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 결과제공부는 상기 데이터 분석 결과가 선택되면 상기 데이터를 생성한 사용자들의 프로필을 분석한 결과를 제공하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 결과제공부는 시간의 흐름에 따라 분석된 결과에서 특정 시점이 선택되면 상기 특정 시점에 데이터를 생성한 사용자들의 프로필을 분석한 결과를 제공하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 사용자프로필분석부는 데이터에 포함된 사용자 정보, 데이터를 통해 추론한 사용자 정보 및 서비스 프로바이더가 제공하는 사용자 정보 중 적어도 하나를 이용하여 상기 사용자들의 프로필을 분석하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 사용자프로필분석부는 데이터를 수집하면 상기 데이터를 생성한 사용자가 생성한 다른 데이터들을 수집하여 상기 사용자의 프로필을 분석하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 사용자프로필분석부는 데이터를 수집하면 상기 데이터가 개시된 사이트에서 제공하는 사용자 정보를 이용하여 상기 사용자의 프로필을 분석하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
본 발명의 다른 일면에 따르면, 상기 데이터분석부는 상기 사용자들의 범위를 제한하고 상기 사용자들의 프로필에 기초하여 상기 범위에 포함된 사용자들이 생성한 데이터들을 분석하는 것인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템을 제공한다.
한편 본 발명은 사용자들이 생성한 데이터들을 수집하는 단계; 상기 데이터들을 이용하여 상기 사용자들의 프로필을 분석하는 단계; 상기 사용자들의 프로필에 기초하여 상기 사용자들이 생성한 데이터들을 분석하는 단계; 및 상기 데이터들에 대한 분석 결과 및 상기 사용자들의 프로필 정보를 제공하는 단계를 포함하는 사용자 프로필 분석에 기반한 빅 데이터 분석 방법으로 이용될 수 있다.
본 발명은 데이터 작성자 프로필에 기반한 빅 데이터 분석 방법을 제공함으로써, 특정 인물/기업/상품/기업/조직 등의 대상에 대하여 사용자의 연령별, 성별,지역별, 관심분야별로 여론의 추이가 어떻게 변하는지 확인할 수 있게 하고, 상품 마케팅의 경우 상품의 주요 타깃이 되는 대상에 대하여 어떤 의견이 있는지 확인하여 주요 홍보요소 혹은 개선 대상으로 선택할 수 있도록 하며, 특정 인물에 대하여 연령대별로 어떤 점이 긍정적인 요소로 부각되고 어떤 점이 부정적인 요소로 부각되는지 파악하여 대처할 수 있도록 한다.
또한 본 발명은 빅 데이터에 기반하여 트렌드를 분석할 때 연령별, 성별, 지역별, 관심분야별로 트렌드에 대한 분석이 가능하도록 함으로써, 특정 이슈 및 의견별로 데이터 작성자 집단의 특성 파악, 특정 긍/부정/중립 의견을 가지는 사용자 모니터링, 특정 긍/부정/중립 의견을 가지는 사용자 집단의 특성 파악, 특정 트렌드/이슈에 대한 사용자 모니터링 및 특정 트렌드/이슈에 대한 사용자 집단의 특성 파악이 가능하도록 한다.
도 1은 본 발명의 일실시예에 따른 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템의 구조를 나타낸 블록도.
도 2는 본 발명의 일실시예에 따른 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템이 사용자 프로필 정보를 생성하는 과정을 나타낸 흐름도.
도 3 내지 도 6은 본 발명의 일실시예에 따른 사용자 프로필 분석에 기반한 빅 데이터 시스템이 분석결과를 제공하는 예시를 나타낸 도면.
본 발명의 이점 및 특징, 그리고 그것들을 달성하는 방법은 첨부되는 도면과 함께 상세하게 후술 되어 있는 실시예들을 참조하면 명확해질 것이다. 그러나 본 발명은 이하에서 개시되는 실시예들에 한정되는 것이 아니라 서로 다른 다양한 형태로 구현될 것이며, 단지 본 실시예들은 본 발명의 개시가 완전하도록 하며, 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 발명의 범주를 완전하게 알려주기 위해 제공되는 것이며, 본 발명은 청구항의 범주에 의해 정의된다.
한편, 본 명세서에서 사용된 용어는 실시예들을 설명하기 위한 것이며 본 발명을 제한하고자 하는 것은 아니다. 본 명세서에서, 단수형은 문구에서 특별히 언급하지 않는 한 복수형도 포함한다. 명세서에서 사용되는 "포함한다(comprises)" 및/또는 "포함하는(comprising)"은 언급된 구성소자, 단계, 동작 및/또는 소자에 하나 이상의 다른 구성소자, 단계, 동작 및/또는 소자의 존재 또는 추가함을 배제하지 않는다. 이하, 첨부된 도면을 참조하여 본 발명의 실시예를 상세히 설명하기로 한다.
본 발명에서는 빅 데이터에 의견, 정보 등 각종 데이터를 기술한 이용자를 데이터 작성자로, 시스템을 사용하여 분석 결과를 이용하는 사용자를 시스템 사용자로 지칭한다.
본 발명의 목적은 크게 2가지로 나뉜다. 1) 첫 번째 목적은 데이터 작성자의 기본정보(사용자 프로필)를 자동으로 분석하는 것이며, 2) 두 번째는 분석된 작성자의 프로필에 기반하여 효과적으로 빅 데이터를 분석/요약/제시하는 것이다.
데이터 작성자의 기본정보는 API등을 통하여 서비스 프로바이더로부터 직접적으로 얻는 방법과 정보추출, 추론 등의 방법을 통하여 얻는 방법이 있다. 서비스 프로바이더로부터 정보를 얻는 방법은 데이터 작성자가 데이터를 작성한 웹사이트에 제시된 데이터 작성자의 기본 정보를 그대로 가져가 사용하는 방법이다. 이 경우, 쉽고 정확하게 데이터 작성자의 기본 정보를 얻을 수 있지만 상당수의 웹 사이트에서 해당 정보를 제공하지 않는다는 문제점이 있다. 따라서 본 발명에서는 데이터 작성자의 프로필 사진, 작성한 글, 소개 글, 소셜네트워크를 분석하여 사용자의 나이, 성별, 거주지역, 관심 대상 등의 정보를 정보추출기술을 이용하여 추출하거나 작성한 글을 통해 추론하여 해당 정보를 획득, 빅 데이터 분석에 활용하려 한다.
본 발명은 또한 빅 데이터를 분석/요약/제시할 때 데이터 작성자의 프로필 정보를 활용하는 방법을 제안한다. 가령 데이터 작성자의 나이, 성별, 거주 지역 등의 기본정보와 관심 대상, 자주 언급되는 키워드 등의 정보를 이용하여 분석하고자 하는 데이터 작성자를 제한하여 특정 계층의 정보만을 분석/추출/요약하거나, 분석된 내용 중 특정 부분에 대하여 기술한 데이터 작성자들의 특성을 파악할 수도 있다. 예컨대 특정 인물에 대한 의견을 분석할 때 부정의견으로 "권위적이다"가 뽑혔다면 해당하는 의견을 기술한 사람들의 성향이 어떤지, 연령대가 어떤지를 파악하는 것이 가능하며, 또 다른 예로 20대의 스마트폰에 관심 있는 데이터 작성자들이 그 밖의 관심 대상이 무엇인지도 파악 가능하다. 이러한 분석 방법을 통하여 보다 심도있고 다양한 분석이 가능하다.
도 1은 본 발명의 일실시예에 따른 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템(이하, 빅 데이터 분석 시스템)의 구조를 나타낸 블록도이다.
빅 데이터 분석 시스템은 사용자프로필분석부(100), 데이터분석부(110) 및 결과제공부(120)를 포함한다.
사용자프로필분석부(100)는 텍스트를 분석하거나 웹 프로바이더가 제공하는 정보를 기반으로 사용자의 프로파일을 분석한다.
데이터 작성자 프로필은 수집한 데이터의 출처를 분석하여 데이터 작성자가 작성한 다른 데이터를 분석하거나 데이터가 게시된 사이트에서 제공하는 프로필 정보를 해당 출처에서 추출함으로써 파악 가능하다.
도 2는 사용자프로필분석부(100)가 데이터 작성자의 프로필 정보를 추출하는 과정을 나타낸 흐름도이다.
사용자의 프로필을 추출하기 위하여 일단 데이터 작성자가 작성한 글을 수집/추출한다(S200). 이는 사용자가 데이터를 게시한 사이트의 특성을 이용하여 가능한데, 가령 데이터 작성자가 자신의 블로그에 글을 게시하였고 해당 블로그의 주소가 http://blog.XXX.com/XXX0025라면 http://blog.XXX.com/XXX0025 사이트의 하위 웹페이지를 수집함으로써 데이터 작성자가 작성한 글들을 수집 가능하다. 만약 데이터 작성자가 게시한 데이터의 출처가 트위터, 페이스북 등의 소셜네트워크라면 해당 웹사이트에서 의견을 게시한 데이터 작성자의 다른 글을 해당 사이트에서 제공하는 API나 웹크롤링(Web crawling) 기술 등을 이용하여 수집한다.
데이터 작성자가 작성한 글들을 수집/추출하면 수집한 웹페이지에서 정보추출 기법을 이용하여 필요한 정보를 수집한다(S210). 정보추출 기법은 명시적으로 기술된 데이터의 정보를 추출하는 명시적 정보 기반 사용자 정보 추출 방법과 추론을 통해 정보를 추출하는 추론기반 사용자 정보추출 방법, 메타정보 등의 서비스 프로바이더가 제공하는 정보를 이용하여 사용자 정보를 추출하는 프로필 데이터 분석 방법이 있다.
명시적 정보 기반 사용자 정보 추출 방법은 데이터 작성자가 자신의 프로필 정보를 직접적으로 기술한 텍스트에서 정보를 추출하는 기술이다. 예를 들어 데이터 작성자가 작성한 데이터 중에 아래와 같은 데이터가 있다면 해당 기술을 통해 글을 게시한 사용자의 이름, 나이, 지역, 성별, 관심 주제 등의 정보를 추출할 수 있다. 이를 위하여 구문분석, 관계추출 등의 자연어처리기술 등이 사용될 수 있다.
제 정보를 공개하지요.
이름: XXX
나이: 24 (꽃다운 처녀입니다.)
사는 곳: 여의도
저는 스윙댄스를 즐겨 하는 편이고 자전거 타기와 여행도 좋아합니다. ㅎㅎ 취미가 다양하고 관심가지고 있는 것도 많아요.
그런데 결정적으로 저랑 취미를 공유할 사람이 없네요
추론기반 사용자 정보 추출 기법은 데이터 작성자가 작성한 데이터를 분석, 자주 사용하는 키워드, 관심 토픽, 문체, 소셜네트워크 등을 고려하여 데이터 작성자의 프로필을 추론하는 기법이다. 가령 데이터 작성자가 자주 사용하는 키워드가 "꽃, 화장품, 가방, 옷, 뷰티, 패션, 여성시대" 등이라면 해당 키워드를 통해 의견작성자가 여성임을 추론할 수 있다. 또 의견작성자가 "헐, 솔까말, 버카충, 금사빠" 등의 어휘를 자주 사용하면 의견작성자가 10대임을 추론할 수 있다.
만약 의견이 게시된 출처가 소셜네트워크라면 네트워크 분석을 통해 사용자의 연령을 추론할 수 있다. 가령 사용자의 소셜네트워크 상의 다수가 20대로 구성되어있다면 사용자의 연령대 또한 20대임을 추론할 수 있다. 또한 의견작성자의 프로필 사진을 이미지 분석하여 성별/나이 등의 정보를 추출할 수도 있다. 사용자 관심분야 역시 데이터를 분석하여 추론 가능하다. 데이터 작성자가 작성한 글들에 "리니지, 플레이스테이션, 게임, 파이날판타지, 애니팡" 등의 게임과 관련된 어휘가 많이 출현한다면 게임이 데이터 작성자의 관심분야임을 추론할 수 있다. 이와 같은 추론을 위해 Maximum Entropy, 베이지안 러닝, Support Vector Machine, KNN algorithm 등의 다양한 기계학습을 이용한 분류 기술이 활용 가능하다.
추론기반 사용자 정보 추출 기법에 의하면 사용자들의 연령, 성별, 주거지역 등과 같은 객관적인 정보뿐만 아니라 관심분야, 성향 등과 같은 사용자의 특성을 나타내는 정보를 추출할 수도 있다.
특정 서비스의 경우 프로필 정보 등을 따로 제공하거나 서비스 프로바이더가 API 형태로 제공하거나 추출하기 쉽게 표 형태로 정보를 제공한다. 예를 들어 SNS 서비스인 트위터의 경우 글을 작성한 곳의 위치를 제공하고 이를 이용하여 사용자의 거주지역을 추론할 수 있다. 프로필 데이터 분석 방법은 이렇게 서비스 프로바이더에서 제공하는 사용자의 정보를 이용하여 의견작성자의 프로필 데이터를 분석하는 방법이다.
사용자프로필분석부(100)는 전술한 방법들을 통해 데이터 작성자의 게시글 등으로부터 사용자 프로필을 추출하고 사용자 프로필 정보를 생성한다(S220).
데이터분석부(110)은 사용자프로필분석부(100)가 제공한 사용자 프로필을 활용하여 웹 트렌드 분석, 오피니언 분석 등의 분석작업을 수행한다.
도 3은 사용자 프로필 정보를 이용하여 빅 데이터 분석을 하는 방법 중 특정 대상에 대한 긍정/부정/중립 요약 정보를 사용자 프로필 정보를 기반으로 제약하여 검색하는 방법에 대한 예를 나타낸 것이다.
사용자는 인터넷에 의견을 게시한 게시자의 개인 정보를 제약하여 원하는 대상 집단을 선택하고 해당 집단의 의견 정보만을 분석할 수 있다. 대상을 제약하기 위하여 성별, 나이, 지역, 관심분야, 이름, 사진 등과 같은 다양한 개인 정보 등이 사용될 수 있다.
이러한 제약정보는 다양한 형태로 입력받을 수 있다. 나이의 경우 대상으로 하는 연령대 중 가장 낮은 연령과 높은 연령을 검색 조건으로 주어 (20~45) 검색할 수도 있고, 특정 연령대(10대, 20대)를 선택하여 검색할 수도 있다. 성별의 경우 "남/여/모두" 중 하나를 선택할 수 있다. 지역의 경우 지도를 UI에 표시하고 지도 UI에서 특정 지역을 클릭하여 선택할 수도 있고, 검색창에 지역 이름을 넣어 원하는 지역을 검색, 선택하여 선택할 수 있다. 관심분야의 경우 특정 관심분야를 브라우징 방식으로 선택할 수도 있고 검색창을 이용하여 선택할 수도 있다. 예를 들면 "스마트폰" 이라는 관심분야를 사용자가 직접 검색창에 입력하여 제약조건을 줄 수도 있고, UI에서 보여주는 선택 가능한 관심분야 리스트를 브라우징 방식으로 선택하여 고르는 방법이 있을 수 있다.
결과제공부(120)는 데이터분석부(110)가 분석한 내용을 기반으로 사용자에게 분석 결과를 제시한다.
도 4는 빅 데이터 분석 시스템이 특정 데이터를 작성한 데이터 작성자의 정보를 제시하는 UI의 예를 나타낸 것이다.
트렌드 분석, 감성 분석 등의 다양한 빅 데이터에서 특정 데이터를 클릭하거나 데이터 위에 커서를 위치하였을 때, 데이터 작성자의 나이, 거주 지역, ID, 이름, 관심분야, 관심 키워드, 데이터 작성자가 작성한 다른 글, 데이터 작성자가 특정 대상에 대하여 작성한 다른 글 등의 정보를 확인할 수 있다.
도 5는 빅 데이터 분석 시스템이 빅 데이터를 분석한 요약 정보에 대하여 데이터 작성자들의 프로필에 대한 분석 정보를 보여주는 UI의 예를 나타낸 것이다.
특정 대상에 대한 긍정/부정/중립 요약 정보를 제공할 때 특정 분류(도 4에서는 이어폰)에 해당하는 글을 작성한 사용자들의 평균 나이, 성별, 지역, 관심분야, 관심키워드 등의 집단 사용자 프로파일 정보를 제공한다. 도 5에 도시된 예에서는 XX폰5의 이어폰에 대하여 의견을 게시한 데이터 작성자들의 대략적인 정보(평균 나이 등)를 확인할 수 있다.
도 6은 빅 데이터 분석 시스템이 빅 데이터를 이용하여 시계열 기반으로 이슈 혹은 트렌드를 분석할 때, 특정 날짜의 이슈(트렌드)에 대한 데이터를 기술한 데이터 작성자들의 평균 나이, 성별, 지역, 관심분야, 관심키워드 등의 집단 사용자 프로파일 정보를 제공하는 UI의 예를 나타낸 것이다.
도 6에 도시된 예에서는 출시라는 이슈에 관하여 데이터를 기술한 작성자들의 평균 나이, 성별 분포 등의 정보를 확인할 수 있다.
이상의 설명은 본 발명의 기술적 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면, 본 발명의 본질적 특성을 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능하다. 따라서, 본 발명에 표현된 실시예들은 본 발명의 기술적 사상을 한정하는 것이 아니라, 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 권리범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 특허청구범위에 의하여 해석되어야 하고, 그와 동등하거나, 균등한 범위 내에 있는 모든 기술적 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.

Claims (17)

  1. 사용자들이 생성한 데이터들을 수집하고 상기 수집한 데이터들에 기초하여 상기 사용자들의 프로필을 분석하는 사용자프로필분석부;
    상기 사용자들의 프로필 정보를 이용하여 상기 사용자들이 생성한 데이터들 및 상기 데이터들을 생성한 사용자들을 분석하는 데이터분석부; 및
    상기 데이터분석부가 분석한 결과를 제공하는 결과제공부
    를 포함하는 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  2. 제1항에 있어서, 상기 결과제공부는
    상기 데이터분석부에 의한 데이터 분석 결과와 상기 데이터를 생성한 사용자들의 프로필 정보를 함께 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  3. 제2항에 있어서, 상기 결과제공부는
    상기 데이터 분석 결과를 클릭하거나 상기 데이터 분석 결과에 커서가 위치하면 상기 데이터를 생성한 사용자의 프로필 정보를 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  4. 제2항에 있어서, 상기 결과제공부는
    상기 데이터 분석 결과가 선택되면 상기 데이터를 생성한 사용자들의 프로필을 분석한 결과를 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  5. 제2항에 있어서, 상기 결과제공부는
    시간의 흐름에 따라 분석된 결과에서 특정 시점이 선택되면 상기 특정 시점에 데이터를 생성한 사용자들의 프로필을 분석한 결과를 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  6. 제1항에 있어서, 상기 사용자프로필분석부는
    데이터에 포함된 사용자 정보, 데이터를 통해 추론한 사용자 정보 및 서비스 프로바이더가 제공하는 사용자 정보 중 적어도 하나를 이용하여 상기 사용자들의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  7. 제1항에 있어서, 상기 사용자프로필분석부는
    데이터를 수집하면 상기 데이터를 생성한 사용자가 생성한 다른 데이터들을 수집하여 상기 사용자의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  8. 제1항에 있어서, 상기 사용자프로필분석부는
    데이터를 수집하면 상기 데이터가 개시된 사이트에서 제공하는 사용자 정보를 이용하여 상기 사용자의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  9. 제1항에 있어서, 상기 데이터분석부는
    상기 사용자들의 범위를 제한하고 상기 사용자들의 프로필에 기초하여 상기 범위에 포함된 사용자들이 생성한 데이터들을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템.
  10. 사용자들이 생성한 데이터들을 수집하는 단계;
    상기 데이터들을 이용하여 상기 사용자들의 프로필을 분석하는 단계;
    상기 사용자들의 프로필에 기초하여 상기 사용자들이 생성한 데이터들을 분석하는 단계; 및
    상기 데이터들에 대한 분석 결과 및 상기 사용자들의 프로필 정보를 제공하는 단계
    를 포함하는 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  11. 제10항에 있어서, 상기 데이터들에 대한 분석 결과 및 상기 사용자들의 프로필 정보를 제공하는 단계는
    상기 데이터들에 대한 분석 결과를 선택하면 상기 데이터를 생성한 사용자의 프로필 정보를 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  12. 제10항에 있어서, 상기 데이터들에 대한 분석 결과 및 상기 사용자들의 프로필 정보를 제공하는 단계는
    상기 데이터들에 대한 분석 결과를 선택하면 상기 데이터를 생성한 사용자들의 프로필을 분석한 결과를 제공하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  13. 제10항에 있어서, 상기 사용자들의 프로필에 기초하여 상기 사용자들이 생성한 데이터들을 분석하는 단계는
    상기 사용자들의 프로필에 기초하여 상기 사용자들의 범위를 한정하는 단계; 및
    상기 범위에 포함된 사용자들이 생성한 데이터들을 분석하는 단계를 포함하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  14. 제10항에 있어서, 상기 사용자들이 생성한 데이터들을 수집하는 단계는
    데이터를 수집하면 상기 데이터를 생성한 사용자가 생성한 다른 데이터들을 수집하는 단계를 포함하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  15. 제10항에 있어서, 상기 사용자들의 프로필을 분석하는 단계는
    상기 데이터들에 포함된 프로필에 관한 정보를 분석하여 상기 사용자들의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  16. 제10항에 있어서, 상기 사용자들의 프로필을 분석하는 단계는
    동일 사용자가 생성한 것으로 인식되는 데이터들을 확인하고 상기 데이터들에 포함된 내용에 기초하여 상기 사용자들의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
  17. 제10항에 있어서, 상기 사용자들의 프로필을 분석하는 단계는
    상기 데이터를 관리하는 서비스 프로바이더가 제공하는 사용자 정보를 이용하여 상기 사용자들의 프로필을 분석하는 것
    인 사용자 프로필 분석에 기반한 빅 데이터 분석 방법.
KR1020130136219A 2013-11-11 2013-11-11 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법 KR102204992B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020130136219A KR102204992B1 (ko) 2013-11-11 2013-11-11 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130136219A KR102204992B1 (ko) 2013-11-11 2013-11-11 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법

Publications (2)

Publication Number Publication Date
KR20150055152A true KR20150055152A (ko) 2015-05-21
KR102204992B1 KR102204992B1 (ko) 2021-01-20

Family

ID=53390809

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130136219A KR102204992B1 (ko) 2013-11-11 2013-11-11 사용자 프로필 분석에 기반한 빅 데이터 분석 시스템 및 그 방법

Country Status (1)

Country Link
KR (1) KR102204992B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101981634B1 (ko) 2018-07-31 2019-05-23 주식회사 스토리안트 연령대별 얼굴사진 학습을 통한 지능형 얼굴사진 위치 검색장치

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008068716A2 (en) * 2006-12-08 2008-06-12 The Procter & Gamble Company Systems and methods for the identification, recruitment, and enrollment of influential members of social groups
KR20090001804A (ko) * 2007-05-23 2009-01-09 주식회사 다음커뮤니케이션 컨텐츠 방문자 트랙킹 방법
KR20130062436A (ko) * 2011-11-21 2013-06-13 한국전자통신연구원 소셜 활동을 이용한 소셜 네트워크 서비스 제공 방법, 장치 및 시스템
US20130198178A1 (en) * 2007-04-03 2013-08-01 Faith McGary System and method for customized search engine and search result optimization
WO2015042140A1 (en) * 2013-09-19 2015-03-26 Apparel Media Group, Inc. System and method for collaborative marketing with online brand engagement advertising

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008068716A2 (en) * 2006-12-08 2008-06-12 The Procter & Gamble Company Systems and methods for the identification, recruitment, and enrollment of influential members of social groups
US20130198178A1 (en) * 2007-04-03 2013-08-01 Faith McGary System and method for customized search engine and search result optimization
KR20090001804A (ko) * 2007-05-23 2009-01-09 주식회사 다음커뮤니케이션 컨텐츠 방문자 트랙킹 방법
KR20130062436A (ko) * 2011-11-21 2013-06-13 한국전자통신연구원 소셜 활동을 이용한 소셜 네트워크 서비스 제공 방법, 장치 및 시스템
WO2015042140A1 (en) * 2013-09-19 2015-03-26 Apparel Media Group, Inc. System and method for collaborative marketing with online brand engagement advertising

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101981634B1 (ko) 2018-07-31 2019-05-23 주식회사 스토리안트 연령대별 얼굴사진 학습을 통한 지능형 얼굴사진 위치 검색장치

Also Published As

Publication number Publication date
KR102204992B1 (ko) 2021-01-20

Similar Documents

Publication Publication Date Title
Yamaguchi et al. Chic or social: Visual popularity analysis in online fashion networks
US9135255B2 (en) System and method for making gift recommendations using social media data
Lu et al. Content-based collaborative filtering for news topic recommendation
JP6543986B2 (ja) 情報処理装置、情報処理方法およびプログラム
CN104239331B (zh) 一种用于实现评论搜索引擎排序的方法和装置
US9171326B2 (en) System and method for making gift recommendations using social media data
US20150088593A1 (en) System and method for categorization of social media conversation for response management
JP6097126B2 (ja) レコメンド情報生成装置及びレコメンド情報生成方法
CN104866554B (zh) 一种基于社会化标注的个性化搜索方法及系统
TW201118620A (en) Systems and methods for providing advanced search result page content
US20150161517A1 (en) Device and method for predicting popularity of social data
US20130238989A1 (en) System and method for providing news articles
Dave et al. Computational advertising: Techniques for targeting relevant ads
KR102064292B1 (ko) 개인화된 소셜네트워크서비스 컨텐츠 추천 방법 및 장치
JP2013171500A (ja) 分析装置、分析方法及び分析プログラム
Velásquez et al. Advanced techniques in web intelligence.
CN116561415A (zh) 基于大数据旅游推荐系统及方法
JP2013196070A (ja) 投稿者のプロフィール情報を分析する投稿者分析装置、プログラム及び方法
JP2019028793A (ja) 情報処理装置、方法及びプログラム
US20140089130A1 (en) System and method for making gift recommendations using social media data
Han et al. Photos don't have me, but how do you know me? Analyzing and predicting users on Instagram
Albalawi et al. Toward a real-time social recommendation system
KR20160130369A (ko) 온라인 상에 게재된 웹 문서 기반 상권 분석 서비스 시스템 및 방법
Rahman et al. A systematic literature review of fashion, sustainability, and consumption using a mixed methods approach
KR101652433B1 (ko) Sns 문서에서 추출된 토픽을 기반으로 파악된 감정에 따른 개인화 광고 제공 방법

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant