KR101482849B1 - 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치 - Google Patents

소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치 Download PDF

Info

Publication number
KR101482849B1
KR101482849B1 KR20130044120A KR20130044120A KR101482849B1 KR 101482849 B1 KR101482849 B1 KR 101482849B1 KR 20130044120 A KR20130044120 A KR 20130044120A KR 20130044120 A KR20130044120 A KR 20130044120A KR 101482849 B1 KR101482849 B1 KR 101482849B1
Authority
KR
South Korea
Prior art keywords
potential
event
sns
words
local event
Prior art date
Application number
KR20130044120A
Other languages
English (en)
Other versions
KR20140126067A (ko
Inventor
이동만
신병헌
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Priority to KR20130044120A priority Critical patent/KR101482849B1/ko
Publication of KR20140126067A publication Critical patent/KR20140126067A/ko
Application granted granted Critical
Publication of KR101482849B1 publication Critical patent/KR101482849B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Primary Health Care (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

특정 위치에서 최근에 발생한 SNS 텍스트 메세지들을 수집해서 공통 키워드 중심으로 모으고, 주변에 공연, 스포츠경기 또는 갑작스런 상황과 같은 이벤트가 있는지 검출하는 SNS 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치가 제시된다. 일 실시예에 따르면, SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하고, 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출한다. 이후, 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 필터링하고, 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶음으로써 로컬 이벤트를 검출한다.

Description

소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치{Method and Apparatus for real-time detection of local event based on Social Network Service Stream}
본 발명은 특정 위치에서 최근에 발생한 SNS(Social Network Service) 텍스트 메시지, 예를 들어, 트위터 텍스트 메세지들을 수집해서 공통 키워드 중심으로 모으고, 주변에 공연, 스포츠경기 또는 갑작스런 상황과 같은 이벤트가 있는지 검출하는 SNS(Social Network Service) 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치에 관한 것이다.
소셜 네트워크 서비스(Social Network Service, SNS)는 온라인상에서 불특정 타인과 관계를 맺을 수 있는 서비스로서, 소셜 네트워크 서비스의 사용자들은 인맥을 새롭게 쌓거나, 기존 인맥과의 관계를 강화시킬 수 있어서 정보화 사회에서 각광받고 있는 서비스이다. 대표적인 소셜 네트워크 서비스로 현재 5억 5천만 명의 사용자를 보유한 페이스북(Facebook), 트위터(twitter) 등이 있다.
한국공개특허 10-20120011763호는 클라우드 분산형 스토리지 체계에 기반한 개인화 소셜 네트워킹 엔터프라이즈 포털 시스템을 이용하여 웹 브라우저나 PC 및 모바일 단말기와 IPTV 운영체제하에서 기존의 중앙집중형 단방향 클라이언트-서버 시스템 방식인 포털사이트 서비스 방식을 지양하고 개인간 직접 커뮤니케이션 및 개인간 직접 개인화 서비스가 가능하도록 된, 클라우드 환경 기반 개인화 소셜 네트워킹 서비스 시스템 및 그 방법에 관한 것으로, 사용공급자, 공급사용자 즉 프로슈머 상호간에 지식정보교환 및 커뮤니케이션(SNS) 내지 전자상거래를 위한 도구로 존재해왔던 각각의 별개 시스템을 하나의 통합형 개인화 플랫폼 형태로 제공하는 것에 관한 기술을 기재하고 있다.
어반 에리어(Urban Area)에서는 미리 계획되어 온-오프라인으로 홍보가 잘 되어 있는 이벤트뿐 만 아니라 거리 즉흥 공연이나 판촉 행사 등 즉시적으로 일어나는 재미있는 이벤트도 많이 있다. SNS, 페이스북 등의 소셜 네트워킹 서비스를 통해 많은 사용자들이 이러한 이벤트에 대한 정보나 소감 등을 업로드 하고 있지만, 이러한 실시간 포스팅을 일일이 검색해서 재미있는 이벤트를 찾아내기란 쉽지 않다. 최근 다양한 소셜 네트워킹 서비스 분석 기술들이 소개 되면서 서비스로부터 제공되는 각종 데이터로부터 실시간 트렌드나 세계 주요 이벤트 등을 검출해낼 수 있게 되었다. 하지만 기존의 기술들을 통해 세계 속 ‘전역 이벤트’가 아닌 사용자의 주변에서 일어나는 흥미로운 ‘로컬 이벤트’를 검출해내는 데에 있어서는 예를 들어, NFL(National Football League) 등의 한정된 지역에서 이루어지는 특수한 이벤트에 대해서만 검출을 하거나 약 25% 수준의 낮은 정확도를 보여준다는 한계를 가지고 있다. 따라서, 특정한 이벤트가 일어나는 제한 된 지역뿐 아니라 어디서나 로컬 이벤트를 검출해 낼 수 있고, 정확도 또한 높일 수 있는 기술을 필요로 한다.
본 발명이 이루고자 하는 기술적 과제는 특정한 이벤트가 일어나는 제한 된 지역뿐 아니라 어디서나 로컬 이벤트를 검출해 낼 수 있도록 기존 기술의 한계를 극복하고 그 정확성 또한 향상시켜주는 SNS(Social Network Service) 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치를 제공하는데 있다.
일 측면에 있어서, 본 발명에서 제안하는 SNS(Social Network Service) 스트림 기반 로컬 이벤트 실시간 검출 방법은 SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계와, 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계와, 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 걸러내는 단계 및 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 단계를 포함한다.
SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계는 SNS 텍스트 메시지 중 불용어, 기 설정된 글자수 미만의 단어 및 특수문자를 제외한 후 단어들의 집합으로 변환한다.
단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계는 같은 단어의 집합을 부분집합으로 가지고 있는 SNS 텍스트 메시지는 같은 로컬이벤트와 관련이 있다고 가정하고, SNS 텍스트 메시지가 특정 지역에서 클러스터를 이룰 경우, 로컬 이벤트와 관련된 키워드 집합에 대한 잠재적 이벤트로 판단한다.
잠재적 이벤트를 검출하기 위해 SNS 텍스트 메시지의 단어들의 집합을 이용하여 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 만든다.
지리적으로 클러스터링 되는 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 찾고, 해당 키워드 집합과 함께 잠재적 이벤트를 검출한다.
로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 걸러내는 단계는 기 설정된 기간 동안의 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 활용하여 필터링한다.
로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 단계는 중복되는 클러스터를 병합 시켜줌으로써 중복을 피한다.
일 측면에 있어서, 본 발명에서 제안하는 SNS 스트림 기반 로컬 이벤트 실시간 검출 장치는 SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 전처리부와, 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 잠재적 이벤트 검출기와, 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 필터링하는 잠재적 이벤트 필터링부와, 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 후처리부 및 검출된 상기 로컬 이벤트를 저장 및 제공하는 저장부를 포함한다.
전처리부는 SNS 텍스트 메시지 중 불용어, 기 설정된 글자수 미만의 단어 및 특수문자를 제외한 후 단어들의 집합으로 변환한다.
잠재적 이벤트 검출기는 잠재적 이벤트를 검출하기 위해 SNS 텍스트 메시지의 단어들의 집합을 이용하여 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 만들고, 지리적으로 클러스터링 되는 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 찾고, 해당 키워드 집합과 함께 잠재적 이벤트를 검출한다.
잠재적 이벤트 필터링부는 기 설정된 기간 동안의 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 활용하여 잠재적 이벤트를 필터링한다.
잠재적 이벤트 필터링부는 슈퍼바이즈 클래시파이어(supervised classifier)를 사용하여 학습하고, 이진 로지스틱 회귀분석(Binary Logistic Regression) 및 이진 로지스틱 회귀분석 클래시파이어(Binary Logistic Regression classifier)를 이용하여 필터링한다.
본 발명의 실시예들에 따르면 SNS 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치는 종래기술에 비하여 높은 정확도로 지역에 제한을 두지 않고 로컬 이벤트를 검출해 냄으로써 기존의 로컬 이벤트 검출 기술들이 가진 한계를 극복할 수 있다. 또한, 온라인 스트리밍 데이터를 통해 오프라인 상의 여행객들에게 주변의 다양한 볼거리를 추천해주는 등의 용도로 활용될 수 있다.
도 1은 SNS 스트림 기반 로컬 이벤트 실시간 검출 방법의 순서도이다.
도 2는 SNS 스트림 기반 로컬 이벤트 실시간 검출 장치의 구성을 나타내는 도면이다.
도 3은 본 발명의 일 실시예에 따른 동일한 키워드 집합을 포함하는 SNS 텍스트 메시지들의 위치 및 클러스터링을 나타내는 도면이다.
도 4는 본 발명의 일 실시예에 따른 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 나타내는 도면이다.
도 5는 본 발명의 일 실시예에 따른 로컬 이벤트 실시간 검출 장치의 수행결과를 나타낸 예시도이다.
이하, 본 발명의 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.
도 1은 SNS 스트림 기반 로컬 이벤트 실시간 검출 방법의 순서도이다.
도 1을 참고하면, SNS 스트림 기반 로컬 이벤트 실시간 검출 방법은 SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계(110), 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계(120), 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 걸러내는 단계(130) 및 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 단계(140)를 포함한다.
SNS(Social Network Service, SNS)는 온라인상에서 불특정 타인과 관계를 맺을 수 있는 서비스로서, 예를 들어, 대표적인 소셜 네트워크 서비스로는 트위터(twitter) 페이스북(Facebook) 등이 있다.
먼저, SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환한다(110). SNS 스트림을 통해 SNS 텍스트 메시지를 받으면, 해당 SNS 텍스트 메시지에서 특정 단어를 제외한 단어의 집합으로 만들 수 있다. 예를 들어, 불용어, 기 설정된 글자수 미만의 단어, 특수문자 등을 제외한 단어의 집합으로 만들어낸다. 이러한 SNS 텍스트 메시지를 단어들의 집합으로 변화하는 과정의 입력 및 결과의 예제를 후술한다.
예를 들어, SNS 텍스트 메시지(m) "I finished the homework! Now enjoying the release party." 가 입력되었을 경우 단어들의 집합으로 변환한 결과(W)는 {“finished”, ”homework”, ”now”, ”enjoying”, ”release”, ”party”} 와 같을 수 있다.
이때, 불용어, 기 설정된 글자수 미만의 단어, 특수문자 등을 제외한 단어의 집합으로 결과(W)를 만드는 것을 확인할 수 있다.
만들어진 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출한다(120). 동일한 단어의 집합을 부분집합으로 가지고 있는 SNS 텍스트 메시지는 특정 로컬 이벤트와 관련이 있다고 가정할 수 있다. 이러한 SNS 텍스트 메시지들이 특정 지역에서 클러스터를 이룰 경우 이를 관련된 키워드 집합에 대한 잠재적 이벤트(Potential Event)로 명명할 수 있다.
도 3을 참조하여 관련된 키워드 집합에 대한 잠재적 이벤트(Potential Event)에 대하여 상세히 설명한다.
도 3은 본 발명의 일 실시예에 따른 동일한 키워드 집합을 포함하는 SNS 텍스트 메시지들의 위치 및 클러스터링을 나타내는 도면이다.
도 3a는 특정 로컬 이벤트(310a)의 위치와 "release" 와 "party" 라는 키워드를 가지는 SNS 텍스트 메시지들의 위치(320a) 및 특정 로컬 이벤트(310a)로부터 지리적으로 가까운 SNS 텍스트 메시지들이 클러스터(330a)를 이루고 있음을 나타내는 도면이다. 도 3b는 특정 로컬 이벤트(310b) 와 "now" 와 "homework" 라는 키워드를 가지는 SNS 텍스트 메시지들의 위치(320b)가 지리적으로 아무런 클러스터를 이루고 있지 않음을 나타내는 도면이다. 이때 도 3a에서 발견 된 클러스터(330a)는 잠재적 이벤트로써 P=(K, T) 형태로 전달될 수 있다. 이때 K는 해당 키워드들의 집합, T는 해당 SNS 텍스트 메시지들의 집합을 의미한다.
예를 들어, 잠재적 이벤트 검출을 하기 위해, SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계(110)에서 전달 된 결과 (W)에서 원소의 개수가 1, 2, 3개인 부분집합들로 이루어진 집합 S를 만들 수 있다.
S = {{"finished"}, {"homework" ...,
{"release", "party"}, ...,
{"finished", "homework", "now", ...,}
이러한 집합 S의 각 원소에 대해 원소가 포함하는 키워드를 가지는 SNS 텍스트 메시지 중 기 설정된 시간 이내에 만들어진 SNS 텍스트 메시지들의 단어들의 집합인 T를 만들 수 있다. 이 때, 밀도 기반의 클러스터링 알고리즘인 DBSCAN 알고리즘을 활용할 수 있다. 이러한 클러스터링 알고리즘을 활용하여 지리적으로 클러스터링 되는 T를 찾아내고, 해당 키워드 집합인 S와 함께 잠재적 이벤트인 P=(S, T)를 검출할 수 있다.
다음으로, 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 필터링한다(130). 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계(120)에서 검출 된 잠재적 이벤트 중 긍정 오류(False positive)를 필터링하는 작업을 한다. 긍정 오류(False positive)는 잠재적 이벤트가 아닌데 잠재적 이벤트로 검출된 항목들을 말할 수 있다. 긍정 오류(False positive)는 하기 네 가지 요소와 관련해서 발생할 수 있다.
1) 장소의 이름 (place name)
2) 전역 이벤트 (Global Event)
3) 예를 들어, "like" 와 같이 어쩔 수 없이 많이 사용되는 단어들 (Common words)
4) 예를 들어, 스팸 또는 날씨 레포팅과 같은 자동 생성 단어들
이러한 긍정 오류(False positive)를 필터링하기 위해 로컬 이벤트 실시간 검출은 이전 일주일 간의 히스토릭 트위트 데이터(historic tweet data)를 활용할 수 있다. 검출 된 잠재적 이벤트는 해당 이벤트의 키워드를 언급하고 있는지, 해당 잠재적 이벤트의 근처에서 포스팅 되었는지의 여부를 통해 네 가지로 분류할 수 있다. 이러한 네 가지 분류에 따른 SNS 텍스트 메시지의 시간별 포스팅 결과를 히스토릭 트위트 데이터(historic tweet data)로부터 파악함으로써 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계(120)에서 인식 된 잠재적 이벤트를 분류할 수 있다.
도 4를 참조하여 잠재적 이벤트를 분류 방법에 대해 상세히 설명한다.
도 4는 본 발명의 일 실시예에 따른 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 나타내는 도면이다.
예를 들어, 분류 기준은 잠재적 이벤트의 근처에서 포스팅 되었는지의 여부(410a) 및 잠재적 이벤트의 키워드를 언급하고 있는지의 여부(420a)에 따라 하기 네 가지로 분류될 수 있다.
1) 잠재적 이벤트의 근처에서 포스팅 되었고, 잠재적 이벤트의 키워드를 언급하고 있는 경우(430a)
2) 잠재적 이벤트의 근처에서 포스팅 되었고, 잠재적 이벤트의 키워드를 언급하지 않는 경우(440a)
3) 잠재적 이벤트의 근처에서 포스팅 되지 않고, 잠재적 이벤트의 키워드를 언급하고 있는 경우(450a)
4) 잠재적 이벤트의 근처에서 포스팅 되지 않고, 잠재적 이벤트의 키워드를 언급하지 않는 경우(460a)
도 4a는 로컬 이벤트로 분류되는 잠재적 이벤트의 특징을 나타내는 히스토릭 트위트 데이터(historic tweet data)로, 해당 잠재적 이벤트와 같은 키워드 집합을 가지는 SNS 메시지(470a, 480a)가 현저하게 적음을 볼 수 있다.
도 4b는 잠재적 이벤트의 키워드 중 특정 장소에 대한 키워드가 다른 SNS 텍스트 메시지에 의해 다수 언급되는 경우의 히스토릭 트위트 데이터(historic tweet data)로, 도 4a의 로컬 이벤트와 비교해 봤을 때 잠재적 이벤트의 키워드(470b)가 더 많이 언급되었음을 확인할 수 있다.
도 4c는 많이 사용되는 단어들(common words)와 관련된 잠재적 이벤트의 히스토릭 트위트 데이터(historic tweet data)로, 도 4a와 비교해 보았을 때 위치는 서로 다르더라도 공통된 키워드를 언급하는 SNS 텍스트 메시지(480c)가 많음을 확인할 수 있다.
도 4d는 전역 이벤트와 관련된 잠재적 이벤트의 히스토릭 트위트 데이터(historic tweet data)로, 도 4a와 비교했을 때 이벤트 전 12시간 이내에 관련 키워드(480d)가 잠재적 이벤트의 근처가 아닌 다른 위치로부터 다수 언급되었음을 확인할 수 있다.
이러한 히스토릭 트위트 데이터(historic tweet data)를 활용하면 특정 룰을 정의하여 로컬 이벤트와 관련이 없는 이벤트를 분류하여 필터링할 수 있다. 하지만 이러한 룰을 일일이 정의하지 않고 슈퍼바이즈 클래시파이어(supervised classifier)를 사용하여 학습할 수 있다. 또한, 이를 위해 이진 로지스틱 회귀분석(binary logistic regression) 기법을 적용하고, 구현에는 WEKA(Waikato Environment for Knowledge Analysis)의 이진 로지스틱 회귀분석 클래시파이어(binomial logistic regression classifier)를 활용할 수 있다.
이후, 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는다(140).
발견된 클러스터 중에는 동일한 로컬 이벤트에 대해 중복되는 클러스터가 존재할 수 있다. 따라서, 이러한 중복되는 클러스터를 병합시켜줌으로써 중복을 피할 수 있다. 이는 중복되는 SNS 텍스트 메시지를 가지고 있는 잠재적 이벤트를 병합시킴으로써 수행할 수 있다. 예를 들어 후술한다.
예를 들어, 제1 잠재적 이벤트를 P1, 제2 잠재적 이벤트를 P2, 병합된 잠재적 이벤트를 P, 병합된 단어들의 집합을 Km 이라고 하면, 결과는 아래와 같다.
P1 = (T1 = {t, t1, t2, t3}, K1={"released", "event"})
P2 = (T2={t,t4,t5},K2={"enent", "Microsoft", "phone"})
P = (Tm={t,t1,t2,t3,t4,t5},
Km = {"released", "event", "event", "Microsoft", "phone")
이러한 방법으로 만들어진 결과는 로컬 이벤트 데이터베이스에 저장되고, 사용자에게 제공될 수 있다. 예를 들어 로컬 이벤트 데이터베이스에 저장된 결과는 레스트풀 웹 서비스(RESTful web service)에 의해 사용자에게 전송될 수 있다.
도 2는 SNS 스트림 기반 로컬 이벤트 실시간 검출 장치의 구성을 나타내는 도면이다.
SNS 스트림 기반 로컬 이벤트 실시간 검출 장치는 수신부(210), 전처리부(220), 잠재적 이벤트 검출기(230), 잠재적 이벤트 필터링부(240), 후처리부(250), 저장부(260)로 구성된다.
수신부(210)는 SNS 스트림을 수신하여 전처리부(220)로 전송한다.
전처리부(220)는 SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환한다. 전처리부(220)는 SNS 텍스트 메시지 중 불용어, 기 설정된 글자수 미만의 단어 및 특수문자를 제외한 후 단어들의 집합으로 변환할 수 있다.
잠재적 이벤트 검출기(230)는 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출한다. 잠재적 이벤트 검출기(230)는 잠재적 이벤트를 검출하기 위해 SNS 텍스트 메시지의 단어들의 집합을 이용하여 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 만든다. 이후, 지리적으로 클러스터링 되는 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 찾고, 해당 키워드 집합과 함께 잠재적 이벤트를 검출할 수 있다.
잠재적 이벤트 필터링부(240)는 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 필터링한다. 잠재적 이벤트 필터링부(240)는 기 설정된 기간 동안의 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 활용하여 잠재적 이벤트를 필터링한다. 또한, 잠재적 이벤트 필터링부(240)는 슈퍼바이즈 클래시파이어(supervised classifier)를 사용하여 학습하고, 이진 로지스틱 회귀분석(Binary Logistic Regression) 및 이진 로지스틱 회귀분석 클래시파이어(Binary Logistic Regression classifier)를 이용하여 필터링할 수 있다.
후처리부(250)는 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는다. 필터링을 거친 잠재적 이벤트의 클러스터 중에는 동일한 로컬 이벤트에 대해 중복되는 클러스터가 존재할 수 있다. 따라서, 이러한 중복되는 클러스터를 병합시켜줌으로써 중복을 피할 수 있다. 이는 중복되는 SNS 텍스트 메시지를 가지고 있는 잠재적 이벤트를 병합시킴으로써 수행할 수 있다.
저장부(260)는 검출된 상기 로컬 이벤트를 저장 및 제공한다. 저장부(260)는 후처리부(250)에서 만들어진 로컬 이벤트와 관련된 잠재적 이벤트들의 결과를 저장하고, 사용자에게 제공할 수 있다. 예를 들어, 레스트풀 웹 서비스(RESTful web service) 또는 안드로이드 앱을 통해 로컬 이벤트 및 해당 SNS 텍스트 메시지를 제공하는 클라이언트의 사용자에게 전송할 수 있다.
도 5는 본 발명의 일 실시예에 따른 로컬 이벤트 실시간 검출 장치의 수행결과를 나타낸 예시도이다. 로컬 이벤트 실시간 검출 장치를 구현한 뒤 안드로이드 앱을 통해 로컬 이벤트 및 해당 SNS 텍스트 메시지를 제공하는 클라이언트의 사용자 뷰를 보여주고 있다. 이때, 키워드, GPS 로캐이션, SNS 텍스트 메시지의 정보등을 확인할 수 있다.
이상에서 설명된 장치는 하드웨어 구성요소, 소프트웨어 구성요소, 및/또는 하드웨어 구성요소 및 소프트웨어 구성요소의 조합으로 구현될 수 있다. 예를 들어, 실시예들에서 설명된 장치 및 구성요소는, 예를 들어, 프로세서, 콘트롤러, ALU(arithmetic logic unit), 디지털 신호 프로세서(digital signal processor), 마이크로컴퓨터, FPA(field programmable array), PLU(programmable logic unit), 마이크로프로세서, 또는 명령(instruction)을 실행하고 응답할 수 있는 다른 어떠한 장치와 같이, 하나 이상의 범용 컴퓨터 또는 특수 목적 컴퓨터를 이용하여 구현될 수 있다. 처리 장치는 운영 체제(OS) 및 상기 운영 체제 상에서 수행되는 하나 이상의 소프트웨어 애플리케이션을 수행할 수 있다.  또한, 처리 장치는 소프트웨어의 실행에 응답하여, 데이터를 접근, 저장, 조작, 처리 및 생성할 수도 있다.  이해의 편의를 위하여, 처리 장치는 하나가 사용되는 것으로 설명된 경우도 있지만, 해당 기술분야에서 통상의 지식을 가진 자는, 처리 장치가 복수 개의 처리 요소(processing element) 및/또는 복수 유형의 처리 요소를 포함할 수 있음을 알 수 있다.  예를 들어, 처리 장치는 복수 개의 프로세서 또는 하나의 프로세서 및 하나의 콘트롤러를 포함할 수 있다.  또한, 병렬 프로세서(parallel processor)와 같은, 다른 처리 구성(processing configuration)도 가능하다.
소프트웨어는 컴퓨터 프로그램(computer program), 코드(code), 명령(instruction), 또는 이들 중 하나 이상의 조합을 포함할 수 있으며, 원하는 대로 동작하도록 처리 장치를 구성하거나 독립적으로 또는 결합적으로(collectively) 처리 장치를 명령할 수 있다.  소프트웨어 및/또는 데이터는, 처리 장치에 의하여 해석되거나 처리 장치에 명령 또는 데이터를 제공하기 위하여, 어떤 유형의 기계, 구성요소(component), 물리적 장치, 가상 장치(virtual equipment), 컴퓨터 저장 매체 또는 장치, 또는 전송되는 신호 파(signal wave)에 영구적으로, 또는 일시적으로 구체화(embody)될 수 있다.  소프트웨어는 네트워크로 연결된 컴퓨터 시스템 상에 분산되어서, 분산된 방법으로 저장되거나 실행될 수도 있다. 소프트웨어 및 데이터는 하나 이상의 컴퓨터 판독 가능 기록 매체에 저장될 수 있다.
실시예에 따른 방법은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다.  상기 컴퓨터 판독 가능 매체는 프로그램 명령, 데이터 파일, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다.  상기 매체에 기록되는 프로그램 명령은 실시예를 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가능한 것일 수도 있다.  컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다.  프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다.  상기된 하드웨어 장치는 실시예의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.
이상과 같이 실시예들이 비록 한정된 실시예와 도면에 의해 설명되었으나, 해당 기술분야에서 통상의 지식을 가진 자라면 상기의 기재로부터 다양한 수정 및 변형이 가능하다.  예를 들어, 설명된 기술들이 설명된 방법과 다른 순서로 수행되거나, 및/또는 설명된 시스템, 구조, 장치, 회로 등의 구성요소들이 설명된 방법과 다른 형태로 결합 또는 조합되거나, 다른 구성요소 또는 균등물에 의하여 대치되거나 치환되더라도 적절한 결과가 달성될 수 있다.
그러므로, 다른 구현들, 다른 실시예들 및 특허청구범위와 균등한 것들도 후술하는 특허청구범위의 범위에 속한다.

Claims (12)

  1. 수신부에서 SNS(Social Network Service) 스트림을 수신 받아 전처리부에서 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계;
    잠재적 이벤트 검출기에서 상기 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계;
    잠재적 이벤트 필터링부에서 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 걸러내는 단계; 및
    후처리부에서 상기 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 단계
    를 포함하고,
    상기 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 단계는
    같은 단어의 집합을 부분집합으로 가지고 있는 SNS 텍스트 메시지는 같은 로컬이벤트와 관련이 있다고 가정하고, 상기 SNS 텍스트 메시지가 특정 지역에서 클러스터를 이룰 경우, 로컬 이벤트와 관련된 키워드 집합에 대한 잠재적 이벤트로 판단하는
    로컬 이벤트 실시간 검출 방법.
  2. 제1항에 있어서,
    상기 SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 단계는
    상기 SNS 텍스트 메시지 중 불용어, 기 설정된 글자수 미만의 단어 및 특수문자를 제외한 후 단어들의 집합으로 변환하는
    로컬 이벤트 실시간 검출 방법.
  3. 삭제
  4. 제1항에 있어서,
    상기 잠재적 이벤트를 검출하기 위해 SNS 텍스트 메시지의 단어들의 집합을 이용하여 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 만드는
    로컬 이벤트 실시간 검출 방법.
  5. 제1항에 있어서,
    지리적으로 클러스터링 되는 상기 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 찾고, 해당 키워드 집합과 함께 잠재적 이벤트를 검출하는
    로컬 이벤트 실시간 검출 방법.
  6. 제1항에 있어서,
    상기 로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 걸러내는 단계는
    기 설정된 기간 동안의 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 활용하여 필터링하는
    로컬 이벤트 실시간 검출 방법.
  7. 제1항에 있어서,
    상기 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 단계는
    중복되는 클러스터를 병합 시켜줌으로써 중복을 피하는
    로컬 이벤트 실시간 검출 방법.
  8. SNS 스트림을 수신하는 수신부;
    SNS 스트림을 수신 받아 각 SNS 텍스트 메시지를 단어들의 집합으로 변환하는 전처리부;
    상기 단어들의 집합을 이용하여 기 설정된 시간 이내의 잠재적 이벤트를 검출하는 잠재적 이벤트 검출기;
    로컬 이벤트와 관련된 잠재적 이벤트들을 제외한 나머지 잠재적 이벤트들을 필터링하는 잠재적 이벤트 필터링부;
    상기 로컬 이벤트와 관련된 잠재적 이벤트들 중 동일한 로컬 이벤트와 관련된 잠재적 이벤트들을 묶는 후처리부; 및
    검출된 상기 로컬 이벤트를 저장 및 제공하는 저장부
    를 포함하고,
    상기 잠재적 이벤트 검출기는 잠재적 이벤트를 검출하기 위해 SNS 텍스트 메시지의 단어들의 집합을 이용하여 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 만들고, 지리적으로 클러스터링 되는 상기 기 설정된 시간 이내의 SNS 텍스트 메시지의 단어들의 집합을 찾고, 해당 키워드 집합과 함께 잠재적 이벤트를 검출하는
    로컬 이벤트 실시간 검출 장치.
  9. 제8항에 있어서,
    상기 전처리부는 SNS 텍스트 메시지 중 불용어, 기 설정된 글자수 미만의 단어 및 특수문자를 제외한 후 단어들의 집합으로 변환하는
    로컬 이벤트 실시간 검출 장치.
  10. 삭제
  11. 제8항에 있어서,
    상기 잠재적 이벤트 필터링부는 기 설정된 기간 동안의 히스토릭 트위트 데이터(historic tweet data) 및 분류 기준을 활용하여 잠재적 이벤트를 필터링하는
    로컬 이벤트 실시간 검출 장치.
  12. 제11항에 있어서,
    상기 잠재적 이벤트 필터링부는 슈퍼바이즈 클래시파이어(supervised classifier)를 사용하여 학습하고, 이진 로지스틱 회귀분석(Binary Logistic Regression) 및 이진 로지스틱 회귀분석 클래시파이어(Binary Logistic Regression classifier)를 이용하여 필터링하는
    로컬 이벤트 실시간 검출 장치.
KR20130044120A 2013-04-22 2013-04-22 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치 KR101482849B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20130044120A KR101482849B1 (ko) 2013-04-22 2013-04-22 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20130044120A KR101482849B1 (ko) 2013-04-22 2013-04-22 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치

Publications (2)

Publication Number Publication Date
KR20140126067A KR20140126067A (ko) 2014-10-30
KR101482849B1 true KR101482849B1 (ko) 2015-01-16

Family

ID=51995553

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20130044120A KR101482849B1 (ko) 2013-04-22 2013-04-22 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치

Country Status (1)

Country Link
KR (1) KR101482849B1 (ko)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090013928A (ko) * 2007-08-03 2009-02-06 김남호 토픽 추출 장치, 상기 토픽 추출 장치를 이용한 소셜네트워크 생성 시스템 및 그 방법
KR20120031669A (ko) * 2010-09-27 2012-04-04 한국과학기술연구원 핫 토픽 이벤트 추출에 기반한 실시간 이벤트의 하이라이트 제공 시스템 및 이를 이용한 하이라이트 서비스 제공방법
KR20120047632A (ko) * 2010-11-04 2012-05-14 한국전자통신연구원 상황 인지 장치 및 방법
KR20120137541A (ko) * 2011-04-11 2012-12-24 에스케이씨앤씨 주식회사 소셜 네트워크 분석 서비스 방법 및 장치

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20090013928A (ko) * 2007-08-03 2009-02-06 김남호 토픽 추출 장치, 상기 토픽 추출 장치를 이용한 소셜네트워크 생성 시스템 및 그 방법
KR20120031669A (ko) * 2010-09-27 2012-04-04 한국과학기술연구원 핫 토픽 이벤트 추출에 기반한 실시간 이벤트의 하이라이트 제공 시스템 및 이를 이용한 하이라이트 서비스 제공방법
KR20120047632A (ko) * 2010-11-04 2012-05-14 한국전자통신연구원 상황 인지 장치 및 방법
KR20120137541A (ko) * 2011-04-11 2012-12-24 에스케이씨앤씨 주식회사 소셜 네트워크 분석 서비스 방법 및 장치

Also Published As

Publication number Publication date
KR20140126067A (ko) 2014-10-30

Similar Documents

Publication Publication Date Title
US11721093B2 (en) Content summarization for assistant systems
CN110149806B (zh) 堆栈数据结构的数字助理处理
US8868223B1 (en) Positioning using audio recognition
EP2753024B1 (en) System and method for continuously monitoring and searching social networking media
US11048712B2 (en) Real-time and adaptive data mining
Kumar et al. Multimedia social big data: Mining
CN110651288A (zh) 事件提取系统和方法
US20170206557A1 (en) Real-time, stream data information integration and analytics system
Mata et al. A Mobile Information System Based on Crowd‐Sensed and Official Crime Data for Finding Safe Routes: A Case Study of Mexico City
CN110753927A (zh) 在计算设备之间同步访问控制
US20150112962A1 (en) System and method for launching applications on a user device based on the user intent
Wu et al. Detecting spamming activities in twitter based on deep‐learning technique
JP2012094142A (ja) 地域基盤の検索語を推薦するシステム及びその方法
KR20160145633A (ko) 서비스의 클라이언트-측 통합 프레임워크
CN112334871A (zh) 用于基于数字助理的应用的动作验证
Cacho et al. Social smart destination: a platform to analyze user generated content in smart tourism destinations
US20180039618A1 (en) Computerized group task digital assistance
KR20150101341A (ko) 분산 퍼지 연관 규칙 마이닝에 기반한 영화 추천 장치 및 방법
Lamsal et al. Socially enhanced situation awareness from microblogs using artificial intelligence: A survey
KR101929649B1 (ko) 채팅로그 키워드 추출을 통한 관심사 관련 오픈 채팅방 추천 시스템 및 방법
Morstatter et al. Discovering Location Information in Social Media.
US10055414B2 (en) Access points for maps
CN112534771B (zh) 在基于声学的数字助理应用中验证触发关键字的系统和方法
Mahmood et al. Public bus commuter assistance through the named entity recognition of twitter feeds and intelligent route finding
KR101482849B1 (ko) 소셜 네트워크 서비스 스트림 기반 로컬 이벤트 실시간 검출 방법 및 장치

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180102

Year of fee payment: 4

LAPS Lapse due to unpaid annual fee