KR101409863B1 - 대용량 소셜 데이터 처리 장치 - Google Patents
대용량 소셜 데이터 처리 장치 Download PDFInfo
- Publication number
- KR101409863B1 KR101409863B1 KR1020120091476A KR20120091476A KR101409863B1 KR 101409863 B1 KR101409863 B1 KR 101409863B1 KR 1020120091476 A KR1020120091476 A KR 1020120091476A KR 20120091476 A KR20120091476 A KR 20120091476A KR 101409863 B1 KR101409863 B1 KR 101409863B1
- Authority
- KR
- South Korea
- Prior art keywords
- social media
- unit
- analysis
- social
- filtering
- Prior art date
Links
- 238000012545 processing Methods 0.000 title claims abstract description 47
- 238000001914 filtration Methods 0.000 claims abstract description 78
- 238000005070 sampling Methods 0.000 claims description 9
- 238000000034 method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 description 16
- 239000000284 extract Substances 0.000 description 12
- 238000011160 research Methods 0.000 description 6
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/01—Social networking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2219—Large Object storage; Management thereof
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
소셜 스트림 데이터를 분석하기 위한 대용량 소셜 데이터를 효과적으로 수집할 수 있는 대용량 소셜 데이터 처리 장치를 제공한다. 본 발명에 따른 대용량 소셜 데이터 처리 장치는, 사용자가 요청하는 분석정보를 입력받아 분석대상을 생성하는 분석대상 처리부, 네트워크를 통하여 소셜 네트워크 상의 소셜 미디어를 수집하는 소셜 미디어 수집부 및 수집된 소셜 미디어를 분석대상을 기반으로 필터링하는 소셜 미디어 여과부를 포함한다.
Description
본 발명은 대용량 소셜 데이터 처리 장치에 관한 것으로, 구체적으로 소셜 데이터들이 이루는 스트림인 소셜 스트림 데이터를 분석하기 위하여 대용량 소셜 데이터를 효과적으로 수집할 수 있는 대용량 소셜 데이터 처리 장치에 관한 것이다.
본 발명은 중소기업청 중소기업융복합기술개발사업의 일환으로 (주)솔트룩스에서 주관하고 (주)리서치앤리서치에서 공동연구하여 수행된 연구로부터 도출된 것이다.
[연구기간 : 2011.06.01 ~ 2012.05.31, 연구과제명 : 스트림 리즈닝을 통한 비매체 판촉활동(BTL) 기회 탐색 및 사후 평가 서비스 플랫폼 개발, 과제번호 : SD122789]
온라인상에 존재하는 소셜 서비스들이 다수 등장하고, 다양한 소셜 서비스들이 활성화됨에 따라 하루에도 수천만에서 수억건 이상의 소셜 미디어들이 생성되고 있다. 따라서 이러한 소셜 미디어들로 이루어지는 소셜 데이터는 그 양이 기하급수적으로 늘어 매우 방대해지고 있다. 이러한 소셜 미디어들로 이루어지는 소셜 데이터는 계속해서 생성하고 전달되고 복제되어 그자체로 스트림(stream)이 형성하여 소셜 스트림 데이터라고도 불리운다. 이러한 소셜 스트림 데이터를 분석하기 위해서는 우선 소셜 데이터들을 저장해놓는 과정이 필수적이나, 방대한 소셜 데이터를 분석하고 저장하기 위해서 하드웨어, 소프트웨어 등 물리적, 논리적 노력과 시간 비용, 하드웨어 구매 비용 등의 부담이 과도하게 증가하고 있다.
본 발명의 기술적 과제는 상기 문제점을 해결하기 위하여, 소셜 스트림 데이터를 분석하기 위한 대용량 소셜 데이터를 효과적으로 수집할 수 있는 대용량 소셜 데이터 처리 장치를 제공하는 데에 있다.
본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치는, 사용자가 요청하는 분석정보를 입력받아 분석대상을 생성하는 분석대상 처리부, 네트워크를 통하여 소셜 네트워크 상의 소셜 미디어를 수집하는 소셜 미디어 수집부 및 수집된 상기 소셜 미디어를 상기 분석대상을 기반으로 필터링하는 소셜 미디어 여과부를 포함한다.
상기 분석대상 처리부는, 상기 사용자가 요청하는 분석정보를 입력받는 분석정보 입력부, 입력받은 상기 분석정보를 분석하여 정형화된 상기 분석대상을 생성하는 분석대상 관리부 및 상기 분석대상 관리부에서 생성된 정형화된 상기 분석대상을 저장하는 분석대상 저장부를 포함할 수 있다.
상기 분석대상 관리부는, 상기 분석정보로부터 키워드를 분석하는 키워드 분석부, 상기 분석정보로부터 날짜정보를 분석하는 날짜정보 분석부 및 상기 키워드 분석부와 상기 날짜정보 분석부에서 분석한 키워드와 날짜정보를 가지도록 정형화된 상기 분석대상을 생성하는 분석대상 생성부를 포함할 수 있다.
상기 분석대상 관리부는, 상기 분석정보로부터 검색어를 생성하는 검색어 생성부를 더 포함하며, 상기 소셜 미디어 수집부는, 상기 검색어 생성부에서 생성된 검색어를 기반으로 소셜 미디어를 수집할 수 있다.
상기 소셜 미디어 여과부는, 상기 분석대상 관리부에서 생성된 정형화된 상기 분석대상을 불러오는 분석대상 호출부, 상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어와 정형화된 상기 분석대상이 가지는 키워드를 비교하여 상기 소셜 미디어의 키워드 적합성을 판단하는 키워드 적합성 확인부, 상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어와 정형화된 상기 분석대상이 가지는 날짜정보를 비교하여 상기 소셜 미디어의 날짜정보 적합성을 판단하는 키워드 적합성 확인부 및 상기 소셜 미디어의 키워드 적합성 및 날짜정보 적합성을 기반으로 상기 소셜 미디어를 필터링하는 필터링 결정부를 포함할 수 있다.
상기 소셜 미디어 여과부는, 정형화된 상기 분석대상이 가지는 키워드와 날짜정보를 함께 이용하여 수집된 상기 소셜 미디어를 분석하여, 상기 날짜정보를 날짜범위로 확장하는 날짜 범위 확장부를 더 포함하며, 상기 필터링 결정부는 확장된 상기 날짜 범위를 반영하여 상기 소셜 미디어를 필터링할 수 있다.
상기 소셜 미디어 여과부는 복수개이며, 상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어를, 복수개의 상기 소셜 미디어 여과부에서 분산하여 필터링할 수 있다.
상기 소셜 미디오 수집부는, 소셜 네트워크 상의 상기 소셜 미디어를 검색하는 소셜 미디어 수집 엔진부, 상기 소셜 미디어 수집 엔진부에서 검색된 상기 소셜 미디어를 저장하는 소셜 미디어 임시 저장부 및 상기 소셜 미디어 임시 저장부의 저장 용량과 상기 소셜 미디어 여과부의 필터링 속도를 비교하여, 상기 소셜 미디어 수집 엔진부에서 수집되는 상기 소셜 미디어의 양을 조절하는 샘플링 처리부를 포함할 수 있다.
본 발명에 따른 대용량 소셜 데이터 처리 장치는, 많은 소셜 미디어를 포함하는 대용량 소셜 데이터를 효과적으로 수집할 수 있다. 구체적으로 본 발명에 따른 대용량 소셜 데이터 처리 장치는, 사용자가 직/간접적으로 요청한 분석정보를 이용하여 수집된 소셜 미디어들을 필터링하여 필요한 소셜 미디어들만 저장하므로, 소셜 미디어들로 이루어지는 소셜 데이터들로부터, 소셜 스트림 데이터를 분석하기 위한 비용 및 시간을 줄일 수 있다.
이때, 키워드를 통한 필터링, 날짜정보를 통한 필터링, 키워드 및 날짜정보를 함께 이용하는 필터링들을 수행하여, 소셜 스트림 데이터를 분석하기 위하여 모든 소셜 미디어들을 이용할 필요가 없으며, 따라서 수집한 소셜 미디어들을 저장하기 위한 하드웨어 비용 및 시간 비용을 절감할 수 있으며, 분석을 위한 하드웨어 비용 및 시간 비용을 절감할 수 있다.
또한 사용자가 직/간접적으로 요청한 날짜정보를 수집한 소셜 미디어들을 분석하여 날짜범위로 확장할 수 있어, 정확한 소셜 스트림 데이터의 분석이 가능할 수 있다.
도 1은 본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치의 구성을 나타내는 개략도이다.
도 2는 본 발명의 일 실시 예에 따른 분석대상 처리부의 구성을 나타내는 개략도이다.
도 3은 본 발명의 일 실시 예에 따른 분석대상 관리부의 구성을 나타내는 개략도이다.
도 4는 본 발명의 일 실시 예에 따른 분석대상 관리부의 다른 구성을 나타내는 개략도이다.
도 5는 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 구성을 나타내는 개략도이다.
도 6은 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 다른 구성을 나타내는 개략도이다.
도 7은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 구성을 나타내는 개략도이다.
도 8은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 다른 구성을 나타내는 개략도이다.
도 9는 본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치의 다른 구성을 나타내는 개략도이다.
도 2는 본 발명의 일 실시 예에 따른 분석대상 처리부의 구성을 나타내는 개략도이다.
도 3은 본 발명의 일 실시 예에 따른 분석대상 관리부의 구성을 나타내는 개략도이다.
도 4는 본 발명의 일 실시 예에 따른 분석대상 관리부의 다른 구성을 나타내는 개략도이다.
도 5는 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 구성을 나타내는 개략도이다.
도 6은 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 다른 구성을 나타내는 개략도이다.
도 7은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 구성을 나타내는 개략도이다.
도 8은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 다른 구성을 나타내는 개략도이다.
도 9는 본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치의 다른 구성을 나타내는 개략도이다.
이하, 본 발명의 실시 예들에 따른 대용량 소셜 데이터 처리 장치를 첨부된 도면을 참조하여 상세하게 설명하지만, 본 발명이 하기의 실시 예들에 한정되는 것은 아니며, 해당 분야에서 통상의 지식을 가진 자라면 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 본 발명을 다양한 다른 형태로 구현할 수 있을 것이다. 즉, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시 예들을 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시 예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시 예들에 한정되는 것으로 해석되어서는 아니된다. 본문에 설명된 실시 예들에 의해 한정되는 것이 아니므로 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.
본 출원에서 사용한 용어는 단지 특정한 실시 예들을 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "구비하다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성 요소 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성 요소, 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해될 것이다.
다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥 상 가지는 의미와 일치하는 의미를 가지는 것으로 해석되며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.
도 1은 본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치의 구성을 나타내는 개략도이다.
도 1을 참조하면, 대용량 소셜 데이터 처리 장치(1000)는 분석대상 처리부(100), 소셜 미디어 수집부(200) 및 소셜 미디어 여과부(300)를 포함한다.
분석대상 처리부(100)는 사용자(20)가 요청하는 분석정보를 입력받아 정형화된 분석대상을 생성할 수 있다. 소셜 미디어 수집부(200)는 네트워크(10)를 통하여 소셜 네트워크(30) 상의 다양한 소셜 서비스 상에서 유통되고 있는 소셜 미디어들로 이루어지는 대용량의 소셜 데이터를 수집할 수 있다. 소셜 미디어 여과부(300)는 소셜 미디어 수집부(200)에서 수집된 소셜 미디어들을 정형화된 분석대상를 기반으로 필터링할 수 있다. 네트워크(10)는 예를 들면, 유선 인터넷 서비스, 근거리 통신망(LAN), 광대역 통신망(WAN), 인트라넷, 무선 인터넷 서비스, 이동 컴퓨팅 서비스, 무선 데이터 통신 서비스, 무선 인터넷 접속 서비스, 위성 통신 서비스, 3G, LTE(long term evolution) 등의 무선 데이터 통신 서비스, 와이파이(Wi-Fi) 등의 무선 랜, 블루투스 등일 수 있다.
대용량 소셜 데이터 처리 장치(1000)는 트위터, 미투데이, 페이스북 등 다양한 소셜 서비스 상에서 유통되고 있는 대량의 소셜 미디어들로 이루어진 소셜 스트림 데이터를 소셜 미디어 수집부(200)를 통하여 수집할 수 있다. 소셜 미디어 수집부(200)는 RESTful API, Streaming API 등 소셜 서비스가 제공하는 API를 사용하거나 소셜 서비스 웹 페이지를 분석하는 등의 방법을 사용하여 소셜 미디어들을 수집할 수 있다. 소셜 미디어는 소셜 네트워크(30) 상에 상에 작성/발행/출판된 미디어 또는 작성/발행/출판된 미디어를 복사하거나 옮긴 미디어를 모두 포함할 수 있다. 소셜 미디어는 예를 들면, 페이스북의 포스트, 트위터의 트윗와 같은 소셜 서비스 상의 게시물이나 소셜서비스 상에 등록된 멀티미디어 데이터 또는 링크 정보와 같이, 소셜 네트워크 상에 등록된 모든 미디어 자료일 수 있다.
분석대상 처리부(100)는 사용자(10)가 요청한 분석정보를 미리 정의된 형태인 정형화된 분석대상으로 생성할 수 있다. 정형화된 분석대상은 키워드, 날짜정보 등이 정의되어 있을 수 있다. 정형화된 분석대상은 소셜 미디어 여과부(300)로부터의 호출에 따라 소셜 미디어 여과부(300)로 전달될 수 있다.
소셜 미디어 여과부(300)는 정형화된 분석대상을 기초로 소셜 미디어 수집부(200)에서 수집된 소셜 미디어들을 분석하여 필터링할 수 있다. 즉, 소셜 미디어 여과부(300)는 정형화된 분석대상이 가지는 키워드와 날짜정보와 수집된 소셜 미디어를 비교 분석하여, 정형화된 분석대상이 가지는 키워드와 날짜정보에 부합하는 소셜 미디어만을 필터링할 수 있다.
대용량 소셜 데이터 처리 장치(100)는 소셜 미디어 여과부(300)에서 필터링된 소셜 미디어를 다른 장치에 전달하여 이를 활용하게 할 수도 있다. 또는 대용량 소셜 데이터 처리 장치(1000)는 소셜 미디어 저장부(400)를 더 포함할 수 있다. 소셜 미디어 저장부(400)는 소셜 미디어 여과부(300)에서 필터링된 소셜 미디어를 저장할 수 있으며, 대용량 소셜 데이터 처리 장치(100) 내의 다른 부분 또는 다른 장치에서 필터링된 소셜 미디어를 활용할 수 있도록 제공할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 분석대상 처리부의 구성을 나타내는 개략도이다.
도 2를 참조하면, 분석대상 처리부(100)는 분석정보 입력부(120), 분석대상 관리부(140) 및 분석대상저장부(160)를 포함한다.
분석정보 입력부(120)는 유/무선 네트워크(10)를 통하여 사용자(20)가 요청하는 분석 정보를 입력받을 수 있다. 사용자(20)는 분석정보 입력부(120)에 분석정보를 직접 입력할 수도 있고, 또는 분석정보 입력부(120)가 사용자(20)의 소셜 네트워크(30) 사용 정보, 과거 검색 이력 등을 종합적으로 수집/분석하여 사용자(20)가 요청하고자 하는 분석정보를 간접적으로 입력받을 수 있다. 또는 사용자(20)는 네트워크(10)를 통하지 않고, 직접 대용량 소셜 데이터 처리 장치(1000)에 분석정보를 입력할 수 있다.
분석대상 관리부(140)는 사용자(20)가 직접 또는 간접적으로 요청한 분석정보를 분석하여 정형화된 분석대상을 생성할 수 있다. 즉 사용자(20)가 자연어 형태로 입력한 분석정보 또는 사용자(20)가 소셜 네트워크(30)에 남긴 각종 소셜 미디어, 또는 사용자(20)의 과거 검색 이력 등의 분석정보를 소셜 미디어 여과부(300)에서 사용할 수 있도록 정형화된 분석대상을 생성할 수 있다. 분석대상은 키워드, 날짜정보 등을 담고 있는 단어 벡터일 수 있다.
분석대상 저장부(160)는 분석대상 관리부(140)에서 생성한 정형화된 분석대상을 소셜 미디어 여과부(300)에서 요청할 때 제공할 수 있도록 저장할 수 있다.
분석정보란, 사용자(20)가 직접 분석을 요청하기 위하여 입력한 내용 또는 사용자(20)의 소셜 네트워크(30) 사용 정보, 과거 검색 이력 등 분석 요청을 판단할 수 있는 각종 정보들을 의미한다. 분석대상은 분석 요청을 소셜 미디어 여과부(300)에서 사용할 수 있도록, 분석정보를 분석하여 정형화한 것을 의미한다. 즉, 사용자(20)의 직/간접적인 분석 요청을 담고 있는 것이 분석정보이며, 이러한 분석정보로부터 소셜 미디어 여과부(300)에서 사용할 수 있도록 정형화된 분석 요청이 분석대상이다. 즉, 분석정보에는 사용자(20)의 직/간접적인 분석 요청이 담겨 있으나, 분석정보는 자연어 또는 다양한 형태의 미디어일 수 있기 때문에, 이를 소셜 미디어 여과부(300)에서 이용할 수 있도록, 분석대상 관리부(140)에서 정형화한 것이 분석대상이다.
분석대상 관리부(140)는 사용자(20)가 직접 입력하거나, 사용자(20)의 소셜 네트워크 상의 활동으로부터 간접적으로 얻어진 분석정보로부터, 단순한 검색어를 추출하여 소셜 미디어 수집부(200)에 추가로 제공할 수 있다. 즉, 분석대상 관리부(140)는 분석정보로부터 단순 검색어를 추출하여, 소셜 미디어 수집부(200)에서 수집하는 소셜 미디어의 범위를 줄여줄 수 있다.
도 3은 본 발명의 일 실시 예에 따른 분석대상 관리부의 구성을 나타내는 개략도이다.
도 3을 참조하면, 분석대상 관리부(140)는 키워드 분석부(142), 날짜정보 분석부(144) 및 분석대상 생성부(146)를 포함한다.
키워드 분석부(142)는 분석정보 입력부(120)에서 직/간접적으로 입력받은 분석정보를 분석하여, 검색 및 분석에 사용 가능한 키워드들을 추출할 수 있다. 키워드 분석부(142)에서 추출가능한 키워드는 단어, 인물, 물건, 장소, 사건/사고, 행위/행사 등 소셜 미디어에 담길 수 있는 소셜 네트워크(30)의 이용자들의 관심사가 모두 포함될 수 있다. 키워드 분석부(142)는 단순히 개별 키워드를 추출하는 것뿐만 아니라, 각 키워드들의 관계, 각 키워드들의 사용 빈도 등을 종합적으로 분석하여 추출할 수 있다.
날짜정보 분석부(144)는 분석정보 입력부(120)에서 직/간접적으로 입력받은 분석정보를 분석하여, 날짜(년/월/일/시 등을 모두 포함)와 관련된 정보인 날짜 정보를 추출할 수 있다. 날짜정보 분석부(144)에서 추출가능한 날짜 정보는, 시대, 년도, 시간, 계절, 날짜범위 등, 날짜, 시간과 관련된 모든 것들이 포함될 수 있다. 날짜정보 분석부(144)는 분석정보에 포함된 직접적인 날짜정보만을 추출하는 것이 아니라, 분석정보에 포함된 키워드로부터 간접적인 날짜정보를 추출할 수도 있다.
예를 들어, 분석정보에 "세종"이라는 단어가 포함된 경우, 키워드 분석부(142)는 "세종대왕", "세종시", "세종대학교" 등을 유추할 수 있다.
예를 들어, 분석정보에 "세종"이라는 단어가 포함된 경우, 날짜정보 분석부(144)는 조선시대, 세종대왕 재임기간, 세종시 출범시점 등을 유추할 수 있다.
분석대상 생성부(146)는 키워드 분석부(142)와 날짜정보 분석부(144)에서 분석한 키워드와 날짜정보를 가지도록 정형화된 분석대상을 생성할 수 있다. 분석대상 생성부(146)는 키워드 분석부(142)에서 분석한 키워드와 날짜정보 분석부(144)에서 분석한 날짜정보를 종합하여, 키워드와 날짜정보의 우선 순위를 선정할 수 있다.
예를 들어, 분석정보에 "세종"이라는 단어와 "15세기"라는 시대가 포함되는 경우, 분석대상 생성부(146)는 "세종대왕"이라는 키워드에 더 우선 순위를 줄 수 있다.
즉, 분석대상 관리부(140)는 단순히 입력된 분석정보를 분석하여 키워드와 날짜정보를 추출하는 것뿐만 아니라, 자체적으로 가지고 있는 데이터와 기존의 분석 결과를 종합적으로 이용하여, 키워드와 날짜정보를 유추/추출 및 우선 순위를 결정할 수 있다.
분석대상 생성부(146)는 생성한 정형화된 분석대상을 분석대상 저장부(160)에 저장할 수 있다. 분석대상 저장부(160)는 NoSQL, 관계형 데이터베이스, 파일시스템 등 어떠한 형태로든 데이터를 저장할 수 있는 공간일 수 있다. 분석대상 저장부(160)는 물리적으로 구분되는 저장공간이거나, 논리적으로 구분되는 저장공간일 수 있다.
분석대상 관리부(140)는 분석대상 회신부(148)를 더 포함할 수 있다. 분석대상 회신부(148)는 소셜 미디어 여과부(300)의 호출이 있는 경우 분석대상 저장부(160)에 저장된 정형화된 분석대상을 소셜 미디어 여과부(300)로 전달할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 분석대상 관리부의 다른 구성을 나타내는 개략도이다. 도 4의 구성 요소 중 도 3과 중복되는 내용은 생략될 수 있다.
도 4를 참조하면, 분석대상 관리부(140)는 검색어 생성부(141)를 더 포함할 수 있다. 검색어 생성부(141)는 분석정보 입력부(120)가 직/간적접으로 입력받은 분석정보로부터 검색어로 사용 가능한 단어 등의 정보를 단순 추출할 수 있다. 검색어 생성부(141)에서 추출된 검색어는 소셜 미디어 수집부(200)로 전송되어, 소셜 미디어 수집부(200)에서 소셜 미디어를 수집할 때, 검색어에 해당하는 소셜 미디어를 우선적으로 수집하거나, 검색어가 포함되는 소셜 미디어에 우선 순위를 주도록 할 수 있다.
도 5는 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 구성을 나타내는 개략도이다.
도 5를 참조하면, 소셜 미디어 수집부(200)는 소셜 미디어 수집 엔진부(220)와 소셜 미디어 임시 저장부(240)를 포함할 수 있다. 소셜 미디어 수집 엔진부(220)는 트위터, 미투데이, 페이스북과 같은 소셜 서비스로부터 RESTful API를 사용하여 소셜 데이터를 얻는 방법, Streaming API를 사용하여 소셜 데이터를 얻는 방법, 웹 페이지를 분석하여 소셜 데이터를 얻는 방법 등 소셜 네트워크(30)로부터 소셜 미디어를 얻을 수 있는 모든 수단을 이용하여 소셜 미디어를 수집할 수 있다.
소셜 미디어 수집 엔진부(220)는 분석 대상 처리부(100)로부터 검색어를 제공받아, 소셜 미디어를 수집할 수 있다. 소셜 미디어 수집 엔진부(220)는 부선 대상 처리부(100)로부터 제공 받은 검색어에 해당하는 소셜 미디어를 우선적으로 수집하거나, 검색어가 포함되는 소셜 미디어에 우선 순위를 주도록 할 수 있다.
소셜 미디어 임시 저장부(240)는 소셜 미디어 수집 엔진부(220)에서 수집된 소셜 미디어를 임시 저장할 수 있다. 소셜 미디어 임시 저장부(240)는 NoSQL, 관계형 데이터베이스, 파일시스템 등 어떠한 형태로든 데이터를 저장할 수 있는 공간일 수 있다. 소셜 미디어 임시 저장부(240)는 물리적으로 구분되는 저장공간이거나, 논리적으로 구분되는 저장공간일 수 있다.
소셜 미디어 임시 저장부(240)는 저장된 소셜 미디어를 소셜 미디어 여과부(300)에 FIFO(First In First Out) 방식에 의하여 제공하거나, 소셜 미디어 수집 엔진부(220)에서 소셜 미디어에 부여한 우선 순위에 따라서 저장된 소셜 미디어를 소셜 미디어 여과부(300)에 제공할 수 있다.
소셜 미디어 임시 저장부(240)에 저장된 소셜 미디어는 소셜 미디어 여과부(300)에 제공됨과 동시에 또는 소셜 미디어 여과부(300)에 제공된 후 소정 시간이 지난 후에 자동적으로 삭제될 수 있다.
도 6은 본 발명의 일 실시 예에 따른 소셜 미디어 수집부의 다른 구성을 나타내는 개략도이다. 도 6의 구성 요소 중 도 5와 중복되는 내용은 생략될 수 있다.
도 6을 참조하면, 소셜 미디어 수집부(200)는 샘플링 처리부(260)를 더 포함될 수 있다. 샘플링 처리부(260)는 소셜 미디어 임시 저장부(240)의 저장 용량과 소셜 미디어 여과부(300)의 필터링 속도를 비교하여, 소셜 미디어 수집 엔진부(220)에서 수집되는 소셜 미디어의 양을 조절할 수 있다.
소셜 미디어 여과부(300)에서 소셜 미디어를 필터링하는 속도보다, 소셜 미디어 임시 저장부(240)에서 수집된 소셜 미디어가 저장되는 속도가 더 빠른 경우, 샘플링 처리부(260)는 소셜 미디어 수집 엔진부(220)에서 수집하는 소셜 미디어에 대하여 샘플링을 하도록 요청할 수 있다. 예를 들어, 소셜 미디어 여과부(300)에서 초당 100개의 소셜 미디어를 필터링할 때, 소셜 미디어 임시 저장부(240)에 초당 1000개의 소셜 미디어가 저장되는 경우, 샘플링 처리부(260)는 소셜 미디어 수집 엔진부(220)에서 수집하는 소셜 미디어의 양이 10분의 1이 되도록, 10개 중 1개의 소셜 미디어만을 샘플링하여 수집하도록 할 수 있다.
소셜 네트워크(30)에 존재하는 소셜 미디어의 양은 매우 많기 때문에, 어느 정도의 샘플링을 진행하여 분석하여도, 소셜 미디어로 이루어진 소셜 데이터들이 이루는 소셜 스트림 데이터 전체를 파악하는데에는 큰 영향이 없을 수 있다.
또한 샘플링 처리부(260)는 소셜 네트워크(30) 상의 전체 소셜 미디어 중에서 관심대상과 관련되는 소셜 미디어에 대한 비중을 분석하고자 할 때는, 분석 속도를 높이기 위하여 소셜 미디어 수집 엔진부(220)에서 수집되는 소셜 미디어를 샘플링하여 수집하도록 할 수 있다.
도 7은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 구성을 나타내는 개략도이다.
도 7을 참조하면, 소셜 미디어 여과부(300)는 분석대상 호출부(320), 키워드 적합성 확인부(342), 날짜정보 적합성 확인부(344) 및 필터링 결정부(360)를 포함할 수 있다. 분석대상 호출부(320)는 분석대상 관리부(140)에 분석대상을 요청하여 분석대상을 제공받을 수 있다.
키워드 적합성 확인부(342)는 소셜 미디어 수집부(200)에서 수집된 소셜 미디어 각각에 대하여 분석대상에 포함된 키워드와의 적합성을 확인할 수 있다. 키워드 적합성 확인부(342)는 소셜 미디어에 키워드의 포함 여부, 키워드의 포함 횟수, 복수의 키워드가 있는 경우 복수의 키워드 중 소셜 미디어에 포함되는 키워드의 비율, 유사한 키워드의 포함 여부 등을 종합적으로 비교 분석할 수 있다. 키워드 적합성 확인부(342)는 단순히 소셜 미디어와 분석대상이 키워드 적합성을 가지는지 여부를 판단하는 것 뿐만 아니라, 적합성의 정도를 함께 판단할 수 있다.
또한 키워드 적합성 확인부(342)는 분석대상에 포함된 키워드뿐만 아니라, 수집된 소셜 미디어 각각이 가지는 키워드들에 대한 추출 및 분석도 함께 수행할 수 있다. 이를 통하여 분석대상에 포함된 키워드를 유사 키워드까지 확장할 수 있다.
날짜정보 적합성 확인부(344)는 소셜 미디어 수집부(200)에서 수집된 소셜 미디어 각각에 대하여 분석대상에 포함된 날짜정보와의 적합성을 확인할 수 있다. 날짜정보 적합성 확인부(344)는 소셜 미디어에 날짜정보의 포함 여부, 날짜정보의 포함 횟수, 복수의 날짜정보가 있는 경우 복수의 날짜정보 중 소셜 미디어에 포함되는 날짜정보의 비율, 유사한 날짜정보의 포함 여부 등을 종합적으로 비교 분석할 수 있다. 날짜정보 적합성 확인부(344)는 단순히 소셜 미디어와 분석대상이 날짜정보 적합성을 가지는지 여부를 판단하는 것 뿐만 아니라, 적합성의 정도를 함께 판단할 수 있다.
또한 날짜정보 적합성 확인부(344)는 분석대상에 포함된 날짜정보뿐만 아니라, 수집된 소셜 미디어 각각이 가지는 날짜정보들에 대한 추출 및 분석도 함께 수행할 수 있다. 이를 통하여 분석대상에 포함된 날짜정보를 관련 날짜정보까지 확장할 수 있다.
필터링 결정부(360)는 키워드 적합성 확인부(342)와 날짜정보 적합성 확인부(344)에서 분석한 키워드 적합성과 날짜정보 적합성을 종합하여, 분석대상에 해당하는 소셜 미디어만을 여과할 수 있다. 필터링 결정부(360)는 키워드 적합성이 있는지 여부, 날짜정보 적합성이 있는지 여부, 키워드 적합성과 날짜정보 적합성이 모두 있는지 여부 등을 종합적으로 고려하여, 분석대상에 해당하는 소셜 미디어를 필터링할 수 있다. 필터링 결정부(360)는 소셜 미디어를 단순히 여과하여 특정 소셜 미디어를 필터링해서 선택하는데에 그치지 않고, 필터링하여 선택하는 소셜 미디어에 우선 순위를 부여할 수 있다. 예를 들어, 소셜 미디어가 키워드 적합성과 날짜정보 적합성이 모두 있는 경우에도, 적합성을 가지는 키워드와 적합성을 가지는 날짜정보 사이의 연관성이 적은 경우에는, 필터링하여 선택하지 않거나, 낮은 우선 순위를 부여할 수도 있다.
필터링 결정부(360)에서 필터링하여 선택된 소셜 미디어는 소셜 미디어 저장부(400)에 저장될 수 있다. 소셜 미디어 저장부(400)는 NoSQL, 관계형 데이터베이스, 파일시스템 등 어떠한 형태로든 데이터를 저장할 수 있는 공간일 수 있다. 소셜 미디어 저장부(400)는 물리적으로 구분되는 저장공간이거나, 논리적으로 구분되는 저장공간일 수 있다.
도 3 및 도 4에 보인 분석대상 저장부(160), 도 5에 보인 소셜 미디어 임시 저장부(240) 및 소셜 미디어 저장부(400)는 각각 물리적으로 구분되는 별도의 저장공간이거나, 하나 또는 그 이상의 물리적으로 구분되는 저장 공간에 있는 각각 논리적으로 구분되는 저장공간일 수도 있다.
또한 필터링 결정부(360)는 중복되는 소셜 미디어는 필터링하여 소셜 미디어 저장부(400)에 저장하지 않거나, 링크 정보만을 소셜 미디어 저장부(400)에 저장할 수 있다. 소셜 네트워크 상에서는 리트윗, 포워딩, 복사하기 등으로 중복되는 소셜 미디어가 다시 존재할 수 있다. 필터링 결정부(360)는 이러한 중복되는 소셜 미디어들은 필터링하여 별도로 저장하지 않거나 링크 정보만을 소셜 미디어 저장부(400)에 저장할 수 있다. 필터링 결정부(360)는 이미 소셜 미디어 저장부(400)에 저장된 해당 소셜 미디어에, 중복되어 저장하지 않거나 링크 정보만이 저장되는 소셜 미디어들의 갯수에 대한 정보를 추가하여 저장할 수 있다.
도 8은 본 발명의 일 실시 예에 따른 소셜 미디어 여과부의 다른 구성을 나타내는 개략도이다. 도 8의 구성 요소 중 도 7과 중복되는 내용은 생략될 수 있다.
도 8을 참조하면, 소셜 미디어 여과부(300)는 날짜범위 확장부(350)를 더 포함할 수 있다. 날짜범위 확장부(350)는, 반복적으로 진행되는 각 소셜 미디어에 대한 키워드 적합성 및 날짜정보 적합성을 종합하여, 분석대상에 포함되는 날짜정보로부터 확장된 날짜범위를 얻을 수 있다. 분석대상에 포함되는 날짜정보가 특정시점(예를 들면, 특정 일자) 또는 특정범위(예를 들면, 한정된 기간)인 경우, 날짜범위 확장부(350)는, 해당 날짜정보와 적합성을 가지는 소셜 미디어들이 가지는 키워드 적합성 및 관련 키워드들을 비교하여, 해당 키워드 적합성과 유사한 적합성을 가지는 소셜 미디어들이 이루는 날짜정보들을 종합하여 확장된 날짜범위를 얻을 수 있다.
예를 들면, 분석대상이 A라는 키워드와 2012년 7월이라는 날짜정보를 가지고 있는 경우, 키워드 적합성 확인부(342)에서 소셜 미디어들이 가지는 A라는 키워드와 관련된 유사 키워드들(a1, a2, a3, a4, a5)를 함께 얻을 수 있다. 이 중, 2012년 7월에 대응되는 소셜 미디어들이 A라는 키워드와 관련된 유사 키워드 중 일부(a1, a2, a4)를 주로 가지고 있다면, 소셜 미디어 수집부(200)에서 수집된 소셜 미디어들 중, 해당하는 유사 키워드 중 일부(a1, a2, a4)를 가지고 있는 소셜 미디어들에 대한 날짜정보를 역으로 분석할 수 있다. 그 결과, 해당하는 유사 키워드 중 일부(a1, a2, a4)를 가지는 소셜 미디어들이 가지는 날짜정보가 2012년 5월에서 8월로 주로 분포한다면, 분석대상의 날짜정보를 2012년 7월에서 2012년 5월 내지 8월의 날짜범위로 확장할 수 있다. 이후, 필터링 결정부(360)에서는 2012년 7월이라는 날짜정보뿐만 아니라, 2012년 5월 내지 8월이라는 확장된 날짜 범위를 반영하여 소셜 미디어에 대한 필터링을 수행할 수 있다.
이 경우, 사용자가 키워드와 관련된 날짜정보를 정확히 알지 못하는 경우에도, 확장된 날짜 범위를 통하여 정확한 소셜 미디어에 대한 필터링이 가능할 수 있다.
도 9는 본 발명의 일 실시 예에 따른 대용량 소셜 데이터 처리 장치의 다른 구성을 나타내는 개략도이다. 도 9의 구성 요소 중 도 1과 중복되는 내용은 생략될 수 있다.
도 9를 참조하면, 대용량 소셜 데이터 처리 장치(1000a)는 소셜 미디어 여과부군(302)를 포함한다. 소셜 미디어 여과부군(302) 복수의 소셜 미디어 여과부(300a, 300b, 300c, …)를 포함할 수 있다. 복수의 소셜 미디어 여과부(300a, 300b, 300c, …)는 각각 도 7 또는 도 8에서 설명한 소셜 미디어 여과부(300)에 대응될 수 있다. 즉, 대용량 소셜 데이터 처리 장치(1000a)는 복수의 소셜 미디어 여과부(300a, 300b, 300c, …)를 포함할 수 있으며, 소셜 미디어 수집부(200)에서 수집된 소셜 미디어를 복수개의 소셜 미디어 여과부(300a, 300b, 300c, …)에서 분산하여 필터링할 수 있다.
소셜 미디어 여과부(300a, 300b, 300c, …) 각각의 필터링 속도에 비하여 소셜 미디어 수집부(200)의 소셜 미디어 수집 속도가 빠른 경우, 이와 같이 복수개의 소셜 미디어 여과부(300a, 300b, 300c, …)에서 분석하여 필터링하여, 대용량 소셜 데이터 처리 장치(1000a) 자체의 수집 및 분석 속도를 향상시킬 수 있다.
10 : 네트워크, 20 : 사용자, 30 : 소셜 네트워크, 1000: 분석대상 처리부, 200 : 소셜 미디어 수집부, 300 : 소셜 미디어 여과부, 400 : 소셜 미디어 저장부, 1000, : 대용량 소셜 데이터 처리 장치
Claims (8)
- 사용자가 요청하는 분석정보를 입력받아 분석대상을 생성하는 분석대상 처리부;
네트워크를 통하여 소셜 네트워크 상의 소셜 미디어를 수집하는 소셜 미디어 수집부; 및
수집된 상기 소셜 미디어를 상기 분석대상을 기반으로 필터링하는 소셜 미디어 여과부;를 포함하되,
상기 분석대상 처리부는,
상기 사용자가 요청하는 분석정보를 입력받는 분석정보 입력부;
입력받은 상기 분석정보를 분석하여 정형화된 상기 분석대상을 생성하는 분석대상 관리부; 및
상기 분석대상 관리부에서 생성된 정형화된 상기 분석대상을 저장하는 분석대상 저장부;를 포함하고,
상기 분석대상 관리부는,
상기 분석정보로부터 키워드를 분석하는 키워드 분석부;
상기 분석정보로부터 날짜정보를 분석하는 날짜정보 분석부; 및
상기 키워드 분석부와 상기 날짜정보 분석부에서 분석한 키워드와 날짜정보를 가지도록 정형화된 상기 분석대상을 생성하는 분석대상 생성부;를 포함하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치. - 삭제
- 삭제
- 제1 항에 있어서,
상기 분석대상 관리부는,
상기 분석정보로부터 검색어를 생성하는 검색어 생성부;를 더 포함하며,
상기 소셜 미디어 수집부는, 상기 검색어 생성부에서 생성된 검색어를 기반으로 소셜 미디어를 수집하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치. - 제1 항에 있어서,
상기 소셜 미디어 여과부는,
상기 분석대상 관리부에서 생성된 정형화된 상기 분석대상을 불러오는 분석대상 호출부;
상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어와 정형화된 상기 분석대상이 가지는 키워드를 비교하여 상기 소셜 미디어의 키워드 적합성을 판단하는 키워드 적합성 확인부;
상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어와 정형화된 상기 분석대상이 가지는 날짜정보를 비교하여 상기 소셜 미디어의 날짜정보 적합성을 판단하는 키워드 적합성 확인부; 및
상기 소셜 미디어의 키워드 적합성 및 날짜정보 적합성을 기반으로 상기 소셜 미디어를 필터링하는 필터링 결정부;를 포함하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치. - 제5 항에 있어서,
상기 소셜 미디어 여과부는,
정형화된 상기 분석대상이 가지는 키워드와 날짜정보를 함께 이용하여 수집된 상기 소셜 미디어를 분석하여, 상기 날짜정보를 날짜범위로 확장하는 날짜 범위 확장부를 더 포함하며,
상기 필터링 결정부는 확장된 상기 날짜 범위를 반영하여 상기 소셜 미디어를 필터링하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치. - 제1 항에 있어서,
상기 소셜 미디어 여과부는 복수개이며,
상기 소셜 미디어 수집부에서 수집된 상기 소셜 미디어를, 복수개의 상기 소셜 미디어 여과부에서 분산하여 필터링하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치. - 제1 항에 있어서,
상기 소셜 미디어 수집부는,
소셜 네트워크 상의 상기 소셜 미디어를 검색하는 소셜 미디어 수집 엔진부;
상기 소셜 미디어 수집 엔진부에서 검색된 상기 소셜 미디어를 저장하는 소셜 미디어 임시 저장부; 및
상기 소셜 미디어 임시 저장부의 저장 용량과 상기 소셜 미디어 여과부의 필터링 속도를 비교하여, 상기 소셜 미디어 수집 엔진부에서 수집되는 상기 소셜 미디어의 양을 조절하는 샘플링 처리부;를 포함하는 것을 특징으로 하는 대용량 소셜 데이터 처리 장치.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120091476A KR101409863B1 (ko) | 2012-08-21 | 2012-08-21 | 대용량 소셜 데이터 처리 장치 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020120091476A KR101409863B1 (ko) | 2012-08-21 | 2012-08-21 | 대용량 소셜 데이터 처리 장치 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140025162A KR20140025162A (ko) | 2014-03-04 |
KR101409863B1 true KR101409863B1 (ko) | 2014-06-20 |
Family
ID=50640469
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020120091476A KR101409863B1 (ko) | 2012-08-21 | 2012-08-21 | 대용량 소셜 데이터 처리 장치 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101409863B1 (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102186918B1 (ko) * | 2016-05-18 | 2020-12-04 | 한국전자기술연구원 | 분산 환경 기반 실시간 고속 스트림 데이터 처리 방법 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030042135A (ko) * | 2001-11-21 | 2003-05-28 | 낙스넷 주식회사 | 온라인 게시물 수집 시스템 및 그 방법 |
KR20040017008A (ko) * | 2002-08-20 | 2004-02-26 | 주식회사 케이랩 | 검색엔진을 활용한 정보 제공 시스템 및 그 방법 |
KR20110070057A (ko) * | 2009-12-18 | 2011-06-24 | 한국전자통신연구원 | 자연어 기반 여행 추천 장치 및 방법 |
JP2012108916A (ja) * | 2010-11-16 | 2012-06-07 | Disney Enterprises Inc | ブロードキャストメッセージに対するオンラインユーザの反応を特定するためのデータマイニング |
-
2012
- 2012-08-21 KR KR1020120091476A patent/KR101409863B1/ko active IP Right Grant
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20030042135A (ko) * | 2001-11-21 | 2003-05-28 | 낙스넷 주식회사 | 온라인 게시물 수집 시스템 및 그 방법 |
KR20040017008A (ko) * | 2002-08-20 | 2004-02-26 | 주식회사 케이랩 | 검색엔진을 활용한 정보 제공 시스템 및 그 방법 |
KR20110070057A (ko) * | 2009-12-18 | 2011-06-24 | 한국전자통신연구원 | 자연어 기반 여행 추천 장치 및 방법 |
JP2012108916A (ja) * | 2010-11-16 | 2012-06-07 | Disney Enterprises Inc | ブロードキャストメッセージに対するオンラインユーザの反応を特定するためのデータマイニング |
Also Published As
Publication number | Publication date |
---|---|
KR20140025162A (ko) | 2014-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106354434B (zh) | 日志数据的存储方法及系统 | |
Inel et al. | Crowdtruth: Machine-human computation framework for harnessing disagreement in gathering annotated data | |
Poorthuis et al. | Making big data small: strategies to expand urban and geographical research using social media | |
US9251157B2 (en) | Enterprise node rank engine | |
Nguyen et al. | TrafficWatch: Real-time traffic incident detection and monitoring using social media | |
CN103186600B (zh) | 互联网舆情的专题分析方法和装置 | |
US20110208715A1 (en) | Automatically mining intents of a group of queries | |
KR20030016037A (ko) | 웹페이지별 방문인기도에 기반한 웹페이지 검색방법 및 그장치 | |
KR20190047939A (ko) | 텍스트 데이터 크롤링을 위한 텍스트 데이터 수집 및 분석 방법 및 장치 | |
Nevile | Communication in context: A conversation analysis tool for examining recorded voice data in investigations of aviation occurrences | |
CN106055546A (zh) | 基于Lucene的光盘库全文检索系统 | |
Anderson et al. | Incorporating context and location into social media analysis: A scalable, cloud-based approach for more powerful data science | |
Moise et al. | Tracking language mobility in the Twitter landscape | |
Stapenhurst | Legislative oversight and curbing corruption: Presidentialism and parliamentarianism revisited | |
CN109145109A (zh) | 基于社交网络的用户群体消息传播异常分析方法及装置 | |
EP2680210A1 (en) | Method and system for cross-platform content recommendation | |
CN107734534B (zh) | 一种网络负荷评估方法及装置 | |
KR101409863B1 (ko) | 대용량 소셜 데이터 처리 장치 | |
CN103248513A (zh) | 基于Office办公套件的网络信息数据采集方法及系统 | |
JP5639549B2 (ja) | 情報検索装置及び方法及びプログラム | |
KR101105798B1 (ko) | 키워드 정련 장치 및 방법과 그를 위한 컨텐츠 검색 시스템 및 그 방법 | |
CN108520012B (zh) | 基于机器学习的移动互联网用户评论挖掘方法 | |
Heravi et al. | Tweet location detection | |
CN115239060A (zh) | 基于大数据分析的适航审定风险评定系统及其方法 | |
KR20190047941A (ko) | 텍스트 데이터 수집 및 분석의 통합을 위한 방법 및 장치 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
FPAY | Annual fee payment |
Payment date: 20170613 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190611 Year of fee payment: 6 |