KR101469009B1

KR101469009B1 - 스팸 그룹 추출 장치 및 그 방법

Info

Publication number: KR101469009B1
Application number: KR1020130125417A
Authority: KR
Inventors: 김민식; 김기헌; 조민경; 박인성; 문종철; 박상우
Original assignee: 한국전자통신연구원
Priority date: 2013-10-21
Filing date: 2013-10-21
Publication date: 2014-12-05
Also published as: EP2863592A1; US9563770B2; US20150113651A1

Abstract

본 발명은 소셜 네트워크 서비스 상에서 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법에 관한 것이다. 스팸 그룹 추출 장치는 소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부, 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 데이터를 전처리하는 자연어 처리부, 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부 및 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부를 포함한다.

Description

스팸 그룹 추출 장치 및 그 방법{APPARATUS AND METHOD FOR EXTRACTING SPAMMER GROUP}

본 발명은 스팸 그룹 추출 장치 및 그 방법에 관한 것으로, 특히 소셜 네트워크 서비스 상에서 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법에 관한 것이다.

스마트 기기의 발달과 확산으로 인하여, 온라인 소셜 네트워크 서비스(Social Network Service, SNS)를 사용하는 사용자들 또한 기하급수적으로 증가함에 따라, 소셜 네트워크 서비스가 정보 공유의 새로운 장으로 중요성이 높아지고 있다.

이와 같은, 소셜 네트워크 서비스를 사용하는 사용자들이 증감함에 따라 다양한 형태의 악성행위 예를 들어, 금전적 목적의 악성코드 유포, 바이러스 유포, 개인정보 탈취, 의도적인 허위 정보 유포 등의 수도 급증하고 있다.

최근에는 소셜 네트워크 서비스를 통한 악성행위에 대응하기 위하여 다양한 탐지, 예방, 차단 알고리즘이 적용 및 운영되거나, 이를 위한 연구가 진행되고 있다.

그러나, 대부분의 악성행위 탐지 및 차단 알고리즘은 송신자와 수신자 간의 관계 거리 및 연결도를 통한 메시지 단위별 스팸 여부 탐지, 단순 메시지 해시태그(hashtag), 유알엘(url) 분석을 통한 악성 스팸 여부 탐지, 사용자 아이디의 팔로어(follower) 수와 친구(friend) 수의 비율, 사용자 아이디의 최근 유통 메시지에서의 유알엘(url)포함 메시지 비율, 해시태그(hashtag) 포함 비율, 컨텐츠 유사도, 스팸 관련 키워드 포함 비율 등 사용자 아이디 및 메시지 기반 단순 특성을 고려한 스팸 탐지 방식을 사용한다.

예를 들어, 한국공개특허 제10-2004-007209호 "링크 유알엘 접속을 통한 스팸메일 자동 차단 방법"은 수신된 전자메일에 링크되어 있는 URL정보를 추출하여 해당 웹페이지에 접속한 후 미리 규정된 소정의 스팸 키워드가 있는 경우 이를 스팸메일로 걸러내어 자동으로 차단할 수 있도록 하는 기술에 관한 것이다. 즉, 한국공개특허 제10-2004-007209호는 유알엘(url) 분석을 통한 악성 스팸 여부 탐지 방식을 이용하는 악성행위 탐지 및 차단 알고리즘을 적용하고 있다.

이와 같이, 악성행위 탐지 및 차단 알고리즘은 광고성 스팸이나 악성코드 유포 등에 집중되어 있어, 허위 정보 유포 행위 및 아이디 그룹의 의도적 집단적 악성행위를 탐지하는데 한계점이 존재한다.

본 발명의 목적은 소셜 네트워크 서비스 상에서 악성 스팸 그룹 탐지 솔루션으로 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법을 제공하는 것이다.

상기한 목적을 달성하기 위한 본 발명에 따른 스팸 그룹 추출 방법은

소셜 네트워크 서비스에 해당하는 데이터를 수집하는 단계; 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 단계; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 단계; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 단계를 포함한다.

이 때, 상기 비정상 행위를 탐지하는 단계는 상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 한다.

이 때, 상기 데이터를 전처리하는 단계는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 한다.

이 때, 상기 스팸 그룹을 추출하는 단계는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하는 단계; 및 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 단계를 포함하는 것을 특징으로 한다.

이 때, 상기 데이터를 수집하는 단계는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 한다.

또한, 본 발명의 일실시예에 따른 스팸 그룹 추출 장치는

소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부; 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 자연어 처리부; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부를 포함한다.

이 때, 상기 비정상 행위 탐지부는 상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 한다.

이 때, 상기 자연어 처리부는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 한다.

이 때, 상기 스팸 추출부는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 것을 특징으로 한다.

이 때, 상기 데이터 수집부는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 한다.

본 발명에 따르면, 스팸 그룹 추출 장치 및 그 방법은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거 제공 및 사전 예방을 유도하므로 올바른 공정거래와 의사 결정을 가능하게 한다

도 1은 본 발명의 실시예에 따른 스팸 그룹 추출 장치가 적용되는 환경을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 스팸 그룹 추출 장치를 개략적으로 나타내는 구성도이다.
도 3은 본 발명의 실시예에 따른 스팸 그룹을 추출하는 방법을 나타내는 흐름도이다.

본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.

이하, 본 발명에 따른 바람직한 실시예 따른 스팸 그룹 추출 장치 및 그 방법에 대하여 첨부한 도면을 참조하여 상세하게 설명한다.

도 1은 본 발명의 실시예에 따른 스팸 그룹 추출 장치가 적용되는 환경을 나타내는 도면이다. 또한, 도 2는 본 발명의 실시예에 따른 스팸 그룹 추출 장치를 개략적으로 나타내는 구성도이다.

도 1을 참고하면, 본 발명의 실시예에 따른 스팸 그룹 추출 장치(200)는 복수개의 소셜 네트워크 서비스(100_1~100_n) 상에서 메시지 자연어 처리 및 이상행위 탐지 및 추출 알고리즘을 이용하여 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거를 제공하거나 사전 예방을 유도하여 올바른 공정거래와 의사 결정을 할 수 있게 한다.

도 2를 참고하면, 스팸 그룹 추출 장치(200)는 데이터 수집부(210), 자연어 처리부(220), 비정상 행위 탐지부(230) 및 스팸 추출부(240)를 포함한다.

데이터 수집부(210)는 소셜 네트워크 서비스(100_1~100_n)에 해당하는 SNS 데이터를 수집한다.

데이터 수집부(210)는 SNS 데이터 수집 시에 스팸 그룹 추출의 정확도를 높이기 위하여 적어도 2개의 SNS 데이터, 포탈 서비스 정보 등을 수집한다. 또한, 데이터 수집부(210)에서 수집한 SNS 데이터는 빅데이터(big data) 분석이 가능하도록 특정 저장장치 예를 들어 NoSQL DB 또는 하둡(Hadoop) 플랫폼 등에 저장한다.

자연어 처리부(220)는 빅데이터를 기반으로 하는 자연어 처리 알고리즘(natural language algorithm)을 이용하여 데이터 수집부(210)에서 수집한 수집 데이터 즉, SNS 데이터를 전처리한다.

구체적으로, 자연어 처리부(220)는 SNS 데이터의 키워드를 추출하는 처리과정, 추출한 키워드를 이용하여 SNS 데이터를 분류하는 처리과정, SNS 데이터 별 연관 키워드를 추출하는 과정, SNS 데이터에 대응하는 메시지의 특성(예를 들어, 긍정 또는 부정)을 식별하는 과정 등과 같은 전처리 과정을 수행한다.

비정상 행위 탐지부(230)는 전처리가 완료된 SNS 데이터에 대하여 사용자 아이디를 기반으로 비정상 행위를 탐지한다.

구체적으로, 비정상 행위 탐지부(230)는 하나의 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, RT(리트윗) 위주의 활동 여부, 특정 시간대 활동, 개별 아이디 및 아이디간 명명에 패턴 존재 여부, 아이디 생성 시기 및 수명의 유사성 존재 여부 등과 같은 비정상 행위를 빅데이터 분석을 통해 탐지한다.

스팸 추출부(240)는 비정상 행위를 탐지한 결과 즉, 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 스팸 아이디에 해당하는 스팸 그룹을 최종적으로 추출한다.

구체적으로, 스팸 추출부(240)는 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 시각화한다. 또한, 스팸 추출부(240)는 비정상 행위를 유발하는 사용자 아이디 별 비정상 행위 특징, 작성 메시지수, 비정상 행위를 유발하는 사용자 아이디 간의 연결 네트워크 등의 정보 또한 시각화 한다.

또한, 스팸 추출부(240)는 최종적으로 추출한 스팸 아이디와 스팸 아이디에 해당하는 스팸 그룹을 블랙리스트로 설정하고, 실시간 대응을 위하여 별도로 블랙리스트를 상시 모니터링한다.

이와 같이, 본 발명은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거 제공 및 사전 예방을 유도하므로 올바른 공정거래와 의사 결정을 가능하게 한다.

다음, 스팸 그룹을 추출하는 방법을 도 3을 참조하여 상세하게 설명한다.

도 3은 본 발명의 실시예에 따른 스팸 그룹을 추출하는 방법을 나타내는 흐름도이다.

먼저, 본 발명의 실시예에 따른 스팸 그룹 추출 장치(200)는 복수개의 소셜 네트워크 서비스(100_1~100_n) 상에서 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출한다.

도 3을 참고하면, 스팸 그룹 추출 장치(200)는 소셜 네트워크 서비스(100_1~100_n)에 해당하는 SNS 데이터를 수집한다(S100).

이때, 스팸 그룹 추출 장치(200)는 SNS 데이터 수집 시에 스팸 그룹 추출의 정확도를 높이기 위하여 적어도 2개의 SNS 데이터, 포탈 서비스 정보 등을 수집한다. 또한, 수집한 SNS 데이터는 빅데이터(big data) 분석이 가능하도록 특정 저장장치 예를 들어 NoSQL DB 또는 Hadoop 플랫폼 등에 저장한다.

스팸 그룹 추출 장치(200)는 빅데이터를 기반으로 하는 자연어 처리 알고리즘(natural language algorithm)을 이용하여 S100 단계에서 수집한 데이터 즉, SNS 데이터를 전처리한다(S200).

S200 단계에서 스팸 그룹 추출 장치(200)는 SNS 데이터의 키워드를 추출하는 처리과정, 추출한 키워드를 이용하여 SNS 데이터를 분류하는 처리과정, SNS 데이터 별 연관 키워드를 추출하는 과정, SNS 데이터에 대응하는 메시지의 특성(예를 들어, 긍정 또는 부정)을 식별하는 과정 등과 같은 전처리 과정을 수행한다.

스팸 그룹 추출 장치(200)는 S200 단계와 같이 전처리가 완료된 SNS 데이터에 대하여 사용자 아이디를 기반으로 비정상 행위를 탐지한다(S300).

구체적으로, 스팸 그룹 추출 장치(200)는 하나의 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, RT(리트윗) 위주의 활동 여부, 특정 시간대 활동, 개별 아이디 및 아이디간 명명에 패턴 존재 여부, 아이디 생성 시기 및 수명의 유사성 존재 여부 등과 같은 비정상 행위를 빅데이터 분석을 통해 탐지한다.

스팸 그룹 추출 장치(200)는 S300 단계에서 비정상 행위를 탐지한 결과 즉, 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 스팸 아이디에 해당하는 스팸 그룹을 최종적으로 추출한다(S400).

또한, 스팸 그룹 추출 장치(200)는 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 시각화한다. 또한, 스팸 그룹 추출 장치(200)는 비정상 행위를 유발하는 사용자 아이디 별 비정상 행위 특징, 작성 메시지수, 비정상 행위를 유발하는 사용자 아이디 간의 연결 네트워크 등의 정보 또한 시각화 한다.

이와 같이, 본 발명의 실시예에 따른 스팸 그룹 추출 방법은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출할 수 있다.

이상에서와 같이 도면과 명세서에서 최적의 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로, 본 기술 분야의 통상의 지식을 가진자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.

100_1~100_n: 소셜 네트워크 서비스
200; 스팸 그룹 추출 장치
210; 데이터 수집부
220; 자연어 처리부
230; 비정상 행위 탐지부
240; 스팸 추출부

Claims

소셜 네트워크 서비스에 해당하는 데이터를 수집하는 단계;
빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 단계;
전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 단계; 및
상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 단계
를 포함하는 스팸 그룹 추출 방법.
청구항 1에 있어서,
상기 비정상 행위를 탐지하는 단계는
상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 방법.
청구항 1에 있어서,
상기 데이터를 전처리하는 단계는
상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 방법.
청구항 1에 있어서,
상기 스팸 그룹을 추출하는 단계는
상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하는 단계; 및
상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 단계
를 포함하는 것을 특징으로 하는 스팸 그룹 추출 방법.
청구항 1에 있어서,
상기 데이터를 수집하는 단계는
상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 방법.
소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부;
빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 자연어 처리부;
전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부; 및
상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부
를 포함하는 스팸 그룹 추출 장치.
청구항 6에 있어서,
상기 비정상 행위 탐지부는
상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 장치.
청구항 6에 있어서,
상기 자연어 처리부는
상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 장치.
청구항 6에 있어서,
상기 스팸 추출부는
상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 것을 특징으로 하는 스팸 그룹 추출 장치.
청구항 6에 있어서,
상기 데이터 수집부는
상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 장치.