KR101469009B1 - 스팸 그룹 추출 장치 및 그 방법 - Google Patents

스팸 그룹 추출 장치 및 그 방법 Download PDF

Info

Publication number
KR101469009B1
KR101469009B1 KR1020130125417A KR20130125417A KR101469009B1 KR 101469009 B1 KR101469009 B1 KR 101469009B1 KR 1020130125417 A KR1020130125417 A KR 1020130125417A KR 20130125417 A KR20130125417 A KR 20130125417A KR 101469009 B1 KR101469009 B1 KR 101469009B1
Authority
KR
South Korea
Prior art keywords
data
spam
extracting
user
group
Prior art date
Application number
KR1020130125417A
Other languages
English (en)
Inventor
김민식
김기헌
조민경
박인성
문종철
박상우
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020130125417A priority Critical patent/KR101469009B1/ko
Priority to US14/324,374 priority patent/US9563770B2/en
Priority to EP20140175955 priority patent/EP2863592A1/en
Application granted granted Critical
Publication of KR101469009B1 publication Critical patent/KR101469009B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • G06F21/55Detecting local intrusion or implementing counter-measures
    • G06F21/554Detecting local intrusion or implementing counter-measures involving event detection and direct action
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/50Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/52User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail for supporting social networking services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Quality & Reliability (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 소셜 네트워크 서비스 상에서 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법에 관한 것이다. 스팸 그룹 추출 장치는 소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부, 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 데이터를 전처리하는 자연어 처리부, 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부 및 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부를 포함한다.

Description

스팸 그룹 추출 장치 및 그 방법{APPARATUS AND METHOD FOR EXTRACTING SPAMMER GROUP}
본 발명은 스팸 그룹 추출 장치 및 그 방법에 관한 것으로, 특히 소셜 네트워크 서비스 상에서 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법에 관한 것이다.
스마트 기기의 발달과 확산으로 인하여, 온라인 소셜 네트워크 서비스(Social Network Service, SNS)를 사용하는 사용자들 또한 기하급수적으로 증가함에 따라, 소셜 네트워크 서비스가 정보 공유의 새로운 장으로 중요성이 높아지고 있다.
이와 같은, 소셜 네트워크 서비스를 사용하는 사용자들이 증감함에 따라 다양한 형태의 악성행위 예를 들어, 금전적 목적의 악성코드 유포, 바이러스 유포, 개인정보 탈취, 의도적인 허위 정보 유포 등의 수도 급증하고 있다.
최근에는 소셜 네트워크 서비스를 통한 악성행위에 대응하기 위하여 다양한 탐지, 예방, 차단 알고리즘이 적용 및 운영되거나, 이를 위한 연구가 진행되고 있다.
그러나, 대부분의 악성행위 탐지 및 차단 알고리즘은 송신자와 수신자 간의 관계 거리 및 연결도를 통한 메시지 단위별 스팸 여부 탐지, 단순 메시지 해시태그(hashtag), 유알엘(url) 분석을 통한 악성 스팸 여부 탐지, 사용자 아이디의 팔로어(follower) 수와 친구(friend) 수의 비율, 사용자 아이디의 최근 유통 메시지에서의 유알엘(url)포함 메시지 비율, 해시태그(hashtag) 포함 비율, 컨텐츠 유사도, 스팸 관련 키워드 포함 비율 등 사용자 아이디 및 메시지 기반 단순 특성을 고려한 스팸 탐지 방식을 사용한다.
예를 들어, 한국공개특허 제10-2004-007209호 "링크 유알엘 접속을 통한 스팸메일 자동 차단 방법"은 수신된 전자메일에 링크되어 있는 URL정보를 추출하여 해당 웹페이지에 접속한 후 미리 규정된 소정의 스팸 키워드가 있는 경우 이를 스팸메일로 걸러내어 자동으로 차단할 수 있도록 하는 기술에 관한 것이다. 즉, 한국공개특허 제10-2004-007209호는 유알엘(url) 분석을 통한 악성 스팸 여부 탐지 방식을 이용하는 악성행위 탐지 및 차단 알고리즘을 적용하고 있다.
이와 같이, 악성행위 탐지 및 차단 알고리즘은 광고성 스팸이나 악성코드 유포 등에 집중되어 있어, 허위 정보 유포 행위 및 아이디 그룹의 의도적 집단적 악성행위를 탐지하는데 한계점이 존재한다.
본 발명의 목적은 소셜 네트워크 서비스 상에서 악성 스팸 그룹 탐지 솔루션으로 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출하는 장치 및 그 방법을 제공하는 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 스팸 그룹 추출 방법은
소셜 네트워크 서비스에 해당하는 데이터를 수집하는 단계; 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 단계; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 단계; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 단계를 포함한다.
이 때, 상기 비정상 행위를 탐지하는 단계는 상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 한다.
이 때, 상기 데이터를 전처리하는 단계는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 한다.
이 때, 상기 스팸 그룹을 추출하는 단계는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하는 단계; 및 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 단계를 포함하는 것을 특징으로 한다.
이 때, 상기 데이터를 수집하는 단계는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 한다.
또한, 본 발명의 일실시예에 따른 스팸 그룹 추출 장치는
소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부; 빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 자연어 처리부; 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부; 및 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부를 포함한다.
이 때, 상기 비정상 행위 탐지부는 상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 한다.
이 때, 상기 자연어 처리부는 상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 한다.
이 때, 상기 스팸 추출부는 상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 것을 특징으로 한다.
이 때, 상기 데이터 수집부는 상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 한다.
본 발명에 따르면, 스팸 그룹 추출 장치 및 그 방법은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거 제공 및 사전 예방을 유도하므로 올바른 공정거래와 의사 결정을 가능하게 한다
도 1은 본 발명의 실시예에 따른 스팸 그룹 추출 장치가 적용되는 환경을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 스팸 그룹 추출 장치를 개략적으로 나타내는 구성도이다.
도 3은 본 발명의 실시예에 따른 스팸 그룹을 추출하는 방법을 나타내는 흐름도이다.
본 발명을 첨부된 도면을 참조하여 상세히 설명하면 다음과 같다. 여기서, 반복되는 설명, 본 발명의 요지를 불필요하게 흐릴 수 있는 공지 기능, 및 구성에 대한 상세한 설명은 생략한다. 본 발명의 실시형태는 당 업계에서 평균적인 지식을 가진 자에게 본 발명을 보다 완전하게 설명하기 위해서 제공되는 것이다. 따라서, 도면에서의 요소들의 형상 및 크기 등은 보다 명확한 설명을 위해 과장될 수 있다.
이하, 본 발명에 따른 바람직한 실시예 따른 스팸 그룹 추출 장치 및 그 방법에 대하여 첨부한 도면을 참조하여 상세하게 설명한다.
도 1은 본 발명의 실시예에 따른 스팸 그룹 추출 장치가 적용되는 환경을 나타내는 도면이다. 또한, 도 2는 본 발명의 실시예에 따른 스팸 그룹 추출 장치를 개략적으로 나타내는 구성도이다.
도 1을 참고하면, 본 발명의 실시예에 따른 스팸 그룹 추출 장치(200)는 복수개의 소셜 네트워크 서비스(100_1~100_n) 상에서 메시지 자연어 처리 및 이상행위 탐지 및 추출 알고리즘을 이용하여 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거를 제공하거나 사전 예방을 유도하여 올바른 공정거래와 의사 결정을 할 수 있게 한다.
도 2를 참고하면, 스팸 그룹 추출 장치(200)는 데이터 수집부(210), 자연어 처리부(220), 비정상 행위 탐지부(230) 및 스팸 추출부(240)를 포함한다.
데이터 수집부(210)는 소셜 네트워크 서비스(100_1~100_n)에 해당하는 SNS 데이터를 수집한다.
데이터 수집부(210)는 SNS 데이터 수집 시에 스팸 그룹 추출의 정확도를 높이기 위하여 적어도 2개의 SNS 데이터, 포탈 서비스 정보 등을 수집한다. 또한, 데이터 수집부(210)에서 수집한 SNS 데이터는 빅데이터(big data) 분석이 가능하도록 특정 저장장치 예를 들어 NoSQL DB 또는 하둡(Hadoop) 플랫폼 등에 저장한다.
자연어 처리부(220)는 빅데이터를 기반으로 하는 자연어 처리 알고리즘(natural language algorithm)을 이용하여 데이터 수집부(210)에서 수집한 수집 데이터 즉, SNS 데이터를 전처리한다.
구체적으로, 자연어 처리부(220)는 SNS 데이터의 키워드를 추출하는 처리과정, 추출한 키워드를 이용하여 SNS 데이터를 분류하는 처리과정, SNS 데이터 별 연관 키워드를 추출하는 과정, SNS 데이터에 대응하는 메시지의 특성(예를 들어, 긍정 또는 부정)을 식별하는 과정 등과 같은 전처리 과정을 수행한다.
비정상 행위 탐지부(230)는 전처리가 완료된 SNS 데이터에 대하여 사용자 아이디를 기반으로 비정상 행위를 탐지한다.
구체적으로, 비정상 행위 탐지부(230)는 하나의 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, RT(리트윗) 위주의 활동 여부, 특정 시간대 활동, 개별 아이디 및 아이디간 명명에 패턴 존재 여부, 아이디 생성 시기 및 수명의 유사성 존재 여부 등과 같은 비정상 행위를 빅데이터 분석을 통해 탐지한다.
스팸 추출부(240)는 비정상 행위를 탐지한 결과 즉, 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 스팸 아이디에 해당하는 스팸 그룹을 최종적으로 추출한다.
구체적으로, 스팸 추출부(240)는 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 시각화한다. 또한, 스팸 추출부(240)는 비정상 행위를 유발하는 사용자 아이디 별 비정상 행위 특징, 작성 메시지수, 비정상 행위를 유발하는 사용자 아이디 간의 연결 네트워크 등의 정보 또한 시각화 한다.
또한, 스팸 추출부(240)는 최종적으로 추출한 스팸 아이디와 스팸 아이디에 해당하는 스팸 그룹을 블랙리스트로 설정하고, 실시간 대응을 위하여 별도로 블랙리스트를 상시 모니터링한다.
이와 같이, 본 발명은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출함으로써, 사후 법적 대응 증거 제공 및 사전 예방을 유도하므로 올바른 공정거래와 의사 결정을 가능하게 한다.
다음, 스팸 그룹을 추출하는 방법을 도 3을 참조하여 상세하게 설명한다.
도 3은 본 발명의 실시예에 따른 스팸 그룹을 추출하는 방법을 나타내는 흐름도이다.
먼저, 본 발명의 실시예에 따른 스팸 그룹 추출 장치(200)는 복수개의 소셜 네트워크 서비스(100_1~100_n) 상에서 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출한다.
도 3을 참고하면, 스팸 그룹 추출 장치(200)는 소셜 네트워크 서비스(100_1~100_n)에 해당하는 SNS 데이터를 수집한다(S100).
이때, 스팸 그룹 추출 장치(200)는 SNS 데이터 수집 시에 스팸 그룹 추출의 정확도를 높이기 위하여 적어도 2개의 SNS 데이터, 포탈 서비스 정보 등을 수집한다. 또한, 수집한 SNS 데이터는 빅데이터(big data) 분석이 가능하도록 특정 저장장치 예를 들어 NoSQL DB 또는 Hadoop 플랫폼 등에 저장한다.
스팸 그룹 추출 장치(200)는 빅데이터를 기반으로 하는 자연어 처리 알고리즘(natural language algorithm)을 이용하여 S100 단계에서 수집한 데이터 즉, SNS 데이터를 전처리한다(S200).
S200 단계에서 스팸 그룹 추출 장치(200)는 SNS 데이터의 키워드를 추출하는 처리과정, 추출한 키워드를 이용하여 SNS 데이터를 분류하는 처리과정, SNS 데이터 별 연관 키워드를 추출하는 과정, SNS 데이터에 대응하는 메시지의 특성(예를 들어, 긍정 또는 부정)을 식별하는 과정 등과 같은 전처리 과정을 수행한다.
스팸 그룹 추출 장치(200)는 S200 단계와 같이 전처리가 완료된 SNS 데이터에 대하여 사용자 아이디를 기반으로 비정상 행위를 탐지한다(S300).
구체적으로, 스팸 그룹 추출 장치(200)는 하나의 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, RT(리트윗) 위주의 활동 여부, 특정 시간대 활동, 개별 아이디 및 아이디간 명명에 패턴 존재 여부, 아이디 생성 시기 및 수명의 유사성 존재 여부 등과 같은 비정상 행위를 빅데이터 분석을 통해 탐지한다.
스팸 그룹 추출 장치(200)는 S300 단계에서 비정상 행위를 탐지한 결과 즉, 비정상 행위를 유발하는 사용자 아이디와 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 스팸 아이디에 해당하는 스팸 그룹을 최종적으로 추출한다(S400).
또한, 스팸 그룹 추출 장치(200)는 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 시각화한다. 또한, 스팸 그룹 추출 장치(200)는 비정상 행위를 유발하는 사용자 아이디 별 비정상 행위 특징, 작성 메시지수, 비정상 행위를 유발하는 사용자 아이디 간의 연결 네트워크 등의 정보 또한 시각화 한다.
이와 같이, 본 발명의 실시예에 따른 스팸 그룹 추출 방법은 소셜 네트워크 서비스 상에서 빅데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하는 전처리 과정, 사용자 아이디를 기반으로 비정상 행위를 탐지하는 과정을 통해 타사(타인, 타자 제품 등)에 대한 의도적 비방 목적의 메시지 전파를 통해 공정거래 및 의사 결정을 방해하는 스팸 그룹을 추출할 수 있다.
이상에서와 같이 도면과 명세서에서 최적의 실시예가 개시되었다. 여기서 특정한 용어들이 사용되었으나, 이는 단지 본 발명을 설명하기 위한 목적에서 사용된 것이지 의미 한정이나 특허청구범위에 기재된 본 발명의 범위를 제한하기 위하여 사용된 것은 아니다. 그러므로, 본 기술 분야의 통상의 지식을 가진자라면 이로부터 다양한 변형 및 균등한 타 실시예가 가능하다는 점을 이해할 것이다. 따라서, 본 발명의 진정한 기술적 보호범위는 첨부된 특허청구범위의 기술적 사상에 의해 정해져야 할 것이다.
100_1~100_n: 소셜 네트워크 서비스
200; 스팸 그룹 추출 장치
210; 데이터 수집부
220; 자연어 처리부
230; 비정상 행위 탐지부
240; 스팸 추출부

Claims (10)

  1. 소셜 네트워크 서비스에 해당하는 데이터를 수집하는 단계;
    빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 단계;
    전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 단계; 및
    상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 단계
    를 포함하는 스팸 그룹 추출 방법.
  2. 청구항 1에 있어서,
    상기 비정상 행위를 탐지하는 단계는
    상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 방법.
  3. 청구항 1에 있어서,
    상기 데이터를 전처리하는 단계는
    상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 방법.
  4. 청구항 1에 있어서,
    상기 스팸 그룹을 추출하는 단계는
    상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하는 단계; 및
    상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 단계
    를 포함하는 것을 특징으로 하는 스팸 그룹 추출 방법.
  5. 청구항 1에 있어서,
    상기 데이터를 수집하는 단계는
    상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 방법.
  6. 소셜 네트워크 서비스에 해당하는 데이터를 수집하는 데이터 수집부;
    빅 데이터를 기반으로 하는 자연어 처리 알고리즘을 이용하여 상기 데이터를 전처리하는 자연어 처리부;
    전처리가 완료된 데이터 각각에 대응하는 사용자 아이디를 기반으로 비정상 행위를 탐지하는 비정상 행위 탐지부; 및
    상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 이용하여 스팸 그룹을 추출하는 스팸 추출부
    를 포함하는 스팸 그룹 추출 장치.
  7. 청구항 6에 있어서,
    상기 비정상 행위 탐지부는
    상기 전처리가 완료된 데이터 각각에 대응하는 사용자 아이디에 대하여 동일 문구를 배포하는지 여부, 동일 키워드 및 연관 키워드를 배포하는지 여부, 리트윗 위주의 활동 여부, 특정 시간대 활동 중 적어도 하나에 해당하는 비정상 행위를 빅데이터 분석을 통해 탐지하는 것을 특징으로 하는 스팸 그룹 추출 장치.
  8. 청구항 6에 있어서,
    상기 자연어 처리부는
    상기 데이터에 대하여 상기 데이터의 키워드를 추출하는 과정, 추출한 키워드를 이용하여 데이터를 분류하는 과정, 데이터 별 연관 키워드를 추출하는 과정, 상기 데이터에 대응하는 메시지의 특성을 식별하는 과정 중 하나에 해당하는 전처리 과정을 수행하는 것을 특징으로 하는 스팸 그룹 추출 장치.
  9. 청구항 6에 있어서,
    상기 스팸 추출부는
    상기 비정상 행위를 유발하는 사용자 아이디와 상기 사용자 아이디를 포함하는 사용자 그룹의 아이디를 기반으로 개별 아이디 및 아이디 간의 연결 특성을 분석한 결과를 토대로 스팸 아이디를 추출하고, 상기 스팸 아이디에 해당하는 상기 스팸 그룹을 최종적으로 추출하는 것을 특징으로 하는 스팸 그룹 추출 장치.
  10. 청구항 6에 있어서,
    상기 데이터 수집부는
    상기 소셜 네트워크 서비스에 해당하는 데이터를 NoSQL DB 또는 하둡 플랫폼에 저장하는 것을 특징으로 하는 스팸 그룹 추출 장치.
KR1020130125417A 2013-10-21 2013-10-21 스팸 그룹 추출 장치 및 그 방법 KR101469009B1 (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020130125417A KR101469009B1 (ko) 2013-10-21 2013-10-21 스팸 그룹 추출 장치 및 그 방법
US14/324,374 US9563770B2 (en) 2013-10-21 2014-07-07 Spammer group extraction apparatus and method
EP20140175955 EP2863592A1 (en) 2013-10-21 2014-07-07 Spammer group extraction apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020130125417A KR101469009B1 (ko) 2013-10-21 2013-10-21 스팸 그룹 추출 장치 및 그 방법

Publications (1)

Publication Number Publication Date
KR101469009B1 true KR101469009B1 (ko) 2014-12-05

Family

ID=51224691

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020130125417A KR101469009B1 (ko) 2013-10-21 2013-10-21 스팸 그룹 추출 장치 및 그 방법

Country Status (3)

Country Link
US (1) US9563770B2 (ko)
EP (1) EP2863592A1 (ko)
KR (1) KR101469009B1 (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101594452B1 (ko) * 2015-09-08 2016-02-17 국방과학연구소 온라인 게시물의 유언비어 식별장치
KR101853461B1 (ko) * 2017-03-30 2018-05-02 서울대학교산학협력단 Sns 계정 간의 링크 현황에 기초한 스팸계정 탐지 방법 및 이를 수행하는 sns 제공 장치
KR101875803B1 (ko) * 2017-03-30 2018-07-09 서울대학교산학협력단 Sns 계정 간의 링크 현황에 기초한 스팸계정 탐지 방법 및 이를 수행하는 sns 제공 장치

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10417345B1 (en) * 2014-12-22 2019-09-17 Amazon Technologies, Inc. Providing customer service agents with customer-personalized result of spoken language intent
JP6566755B2 (ja) * 2015-07-15 2019-08-28 Kddi株式会社 解析対象発言抽出装置、解析対象発言抽出方法及びコンピュータプログラム
US10015181B2 (en) * 2016-05-19 2018-07-03 International Business Machines Corporation Using natural language processing for detection of intended or unexpected application behavior
US9961100B2 (en) * 2016-07-29 2018-05-01 Accenture Global Solutions Limited Network security analysis system
US10757053B2 (en) * 2017-03-02 2020-08-25 Microsoft Technology Licensing, Llc High confidence digital content treatment
CN109951373A (zh) * 2019-01-10 2019-06-28 维沃移动通信有限公司 一种文件发送方法及终端设备
CN110956210B (zh) * 2019-11-29 2023-03-28 重庆邮电大学 一种基于ap聚类的半监督网络水军识别方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120108095A (ko) * 2011-03-23 2012-10-05 김병훈 소셜 데이터 분석 시스템
KR20130065322A (ko) * 2011-12-09 2013-06-19 한국인터넷진흥원 에스엔에스 트랩 수집 시스템 및 그에 의한 유알엘 수집 방법
KR20130108855A (ko) * 2012-03-26 2013-10-07 연세대학교 원주산학협력단 어플리케이션의 유해성 판단 방법 및 시스템

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100486821B1 (ko) 2003-02-08 2005-04-29 디프소프트 주식회사 링크 유알엘 접속을 통한 스팸메일 자동 차단 방법
US7856411B2 (en) * 2006-03-21 2010-12-21 21St Century Technologies, Inc. Social network aware pattern detection
WO2008141254A1 (en) * 2007-05-10 2008-11-20 Mary Kay Hoal Youth based social networking
US8291054B2 (en) * 2008-05-27 2012-10-16 International Business Machines Corporation Information processing system, method and program for classifying network nodes
US8271635B2 (en) * 2009-06-17 2012-09-18 Microsoft Corporation Multi-tier, multi-state lookup
US8966620B2 (en) * 2010-05-27 2015-02-24 Microsoft Technology Licensing, Llc Campaign detection
US8725672B2 (en) * 2010-06-11 2014-05-13 Avira B.V. Method for detecting suspicious individuals in a friend list
US10395031B2 (en) * 2010-12-30 2019-08-27 Verisign, Inc. Systems and methods for malware detection and scanning
WO2013009621A1 (en) * 2011-07-08 2013-01-17 Venafi, Inc. System for managing cryptographic keys and trust relationships in a secure shell (ssh) environment
KR20130026099A (ko) 2011-09-05 2013-03-13 포항공과대학교 산학협력단 발신자와 수신자의 관계를 이용한 소셜 네트워크 사이트에서의 스팸 메시지 분류자 생성 방법 및 장치 그리고 스팸 메시지 필터링 방법
JP2013214133A (ja) * 2012-03-30 2013-10-17 Sony Corp 情報処理装置、情報処理方法及びプログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20120108095A (ko) * 2011-03-23 2012-10-05 김병훈 소셜 데이터 분석 시스템
KR20130065322A (ko) * 2011-12-09 2013-06-19 한국인터넷진흥원 에스엔에스 트랩 수집 시스템 및 그에 의한 유알엘 수집 방법
KR20130108855A (ko) * 2012-03-26 2013-10-07 연세대학교 원주산학협력단 어플리케이션의 유해성 판단 방법 및 시스템

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101594452B1 (ko) * 2015-09-08 2016-02-17 국방과학연구소 온라인 게시물의 유언비어 식별장치
KR101853461B1 (ko) * 2017-03-30 2018-05-02 서울대학교산학협력단 Sns 계정 간의 링크 현황에 기초한 스팸계정 탐지 방법 및 이를 수행하는 sns 제공 장치
KR101875803B1 (ko) * 2017-03-30 2018-07-09 서울대학교산학협력단 Sns 계정 간의 링크 현황에 기초한 스팸계정 탐지 방법 및 이를 수행하는 sns 제공 장치

Also Published As

Publication number Publication date
EP2863592A1 (en) 2015-04-22
US9563770B2 (en) 2017-02-07
US20150113651A1 (en) 2015-04-23

Similar Documents

Publication Publication Date Title
KR101469009B1 (ko) 스팸 그룹 추출 장치 및 그 방법
Almaatouq et al. If it looks like a spammer and behaves like a spammer, it must be a spammer: analysis and detection of microblogging spam accounts
Adewole et al. SMSAD: a framework for spam message and spam account detection
Chen et al. Statistical features-based real-time detection of drifted twitter spam
Gharge et al. An integrated approach for malicious tweets detection using NLP
Lin et al. A study of effective features for detecting long-surviving Twitter spam accounts
Raturi Machine learning implementation for identifying fake accounts in social network
JP5990284B2 (ja) キャラクター・ヒストグラムを用いるスパム検出のシステムおよび方法
Romanov et al. Detection of fake profiles in social media-Literature review
Sahoo et al. Real-time detection of fake account in twitter using machine-learning approach
Almaatouq et al. Twitter: who gets caught? observed trends in social micro-blogging spam
Lin et al. Analysis and identification of spamming behaviors in sina weibo microblog
Sahoo et al. Fake profile detection in multimedia big data on online social networks
Liu et al. Detecting spam in chinese microblogs-a study on sina weibo
Chakraborty et al. SPAM: a framework for social profile abuse monitoring
Liu et al. SDHM: A hybrid model for spammer detection in Weibo
Xia et al. Characterizing and detecting malicious accounts in privacy-centric mobile social networks: A case study
Erkal et al. A new cyber security alert system for twitter
Quelal et al. Identifying the political tendency of social bots in twitter using sentiment analysis: A use case of the 2021 ecuadorian general elections
Ellaky et al. A survey of spam bots detection in online social networks
Agarwal et al. Using trust model for detecting malicious activities in Twitter
Saka et al. Context-based clustering to mitigate phishing attacks
Yousukkee et al. Analysis of spammers’ behavior on a live streaming chat
Yang et al. Characteristics and prevalence of fake social media profiles with AI-generated faces
Gupta et al. Invitation or bait? Detecting malicious URLs in Facebook events

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20170918

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181002

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20190925

Year of fee payment: 6