KR20120029662A - 스팸 관리 장치 및 스팸 관리 방법 - Google Patents

스팸 관리 장치 및 스팸 관리 방법 Download PDF

Info

Publication number
KR20120029662A
KR20120029662A KR1020100091597A KR20100091597A KR20120029662A KR 20120029662 A KR20120029662 A KR 20120029662A KR 1020100091597 A KR1020100091597 A KR 1020100091597A KR 20100091597 A KR20100091597 A KR 20100091597A KR 20120029662 A KR20120029662 A KR 20120029662A
Authority
KR
South Korea
Prior art keywords
content
user
spam
created
unit
Prior art date
Application number
KR1020100091597A
Other languages
English (en)
Other versions
KR101221096B1 (ko
Inventor
김용우
Original Assignee
주식회사 다음커뮤니케이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 다음커뮤니케이션 filed Critical 주식회사 다음커뮤니케이션
Priority to KR1020100091597A priority Critical patent/KR101221096B1/ko
Publication of KR20120029662A publication Critical patent/KR20120029662A/ko
Application granted granted Critical
Publication of KR101221096B1 publication Critical patent/KR101221096B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Human Resources & Organizations (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Marketing (AREA)
  • General Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠의 특징을 분석하는 단계, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.

Description

스팸 관리 장치 및 스팸 관리 방법{DEVICE AND METHOD FOR MANAGING SPAM}
본 발명은 스팸 관리 장치 및 스팸 관리 방법에 관한 것이다.
스팸(spam)이란 사용자의 의도 또는 목적과 상관없이 인터넷 상에서 제공되는 문서, 사진 및 동영상 등의 콘텐츠(contents)로서, 주로 광고성 사이트를 사용자에게 홍보하고 유입시키려는 목적을 갖고 있다. 인터넷 사용자는 포털 사이트(portal site) 등에서 관심 있는 업체 등을 검색하고, 검색된 업체에 대한 정보를 제공받을 수 있는데, 이때 검색 결과 목록에 스팸이 포함되거나, 인터넷 사용자의 이메일에 스팸이 포함될 수 있다. 따라서 포털 사이트 사업자는 사용자에게 제공하는 서비스에 스팸이 포함되지 않도록 걸러내어 관리할 필요가 있다.
종래에는 스팸 판단의 근거가 되는 불용 검색어, 일정한 검색어의 조합으로 이루어진 불용 패턴, 불용 문장 및 아웃 링크의 도메인 주소 등을 설정하고 이들을 포함하고 있는 콘텐츠를 스팸으로 분류함으로써 스팸을 관리하였다.
이와 같이 콘텐츠를 기준으로 스팸을 관리하는 경우에 설정한 불용 검색어, 불용 패턴, 불용 문장 및 아웃 링크 등을 의도적으로 회피하고 있는 콘텐츠에 대해서는 스팸 관리가 제대로 이루어지기 힘들다. 특히 의도적으로 스팸을 생성하는 특정 사용자는 이러한 불용 검색어, 불용 패턴 및 불용 문장 등에 대한 정보를 지속적으로 모니터링하여 그 결과에 따라 스팸을 생성하므로 스팸 관리에 더욱 큰 어려움이 있다.
본 발명이 이루고자 하는 기술적 과제는 사용자 자체에 대한 특징 및 사용자가 작성한 콘텐츠의 특징을 기초로 사용자 유형을 설정하고 이를 미리 저장한 불량 사용자 유형과 비교하여 그 결과에에 따라 스팸을 관리함으로써, 효율적으로 스팸을 처리하는 것이다.
본 발명의 실시예에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠의 특징을 분석하는 단계, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.
상기 사용자의 특징을 분석하는 단계를 더 포함하고, 상기 사용자 유형을 분류하는 단계는, 상기 분석된 사용자의 특징을 더 고려할 수 있다.
상기 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계를 더 포함할 수 있다.
상기 콘텐츠의 특징은, 일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함할 수 있다.
상기 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는, 제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 바탕색과 유사한 색을 사용하여 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠, 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 및 그 구조가 일률적인 콘텐츠 중 적어도 하나를 포함할 수 있다.
상기 콘텐츠의 특징은, 상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠를 작성한 사용자의 특징을 분석하는 단계, 상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.
상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계를 더 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 장치는 콘텐츠를 수신하는 수신부, 상기 콘텐츠의 특징을 분석하는 콘텐츠 분석부, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부, 처리 대상 사용자의 상기 사용자 유형과 상기 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고 상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부를 포함한다.
상기 사용자의 특징을 분석하는 사용자 분석부를 더 포함하고, 상기 사용자 유형 도출부는, 상기 분석된 사용자의 특징을 더 고려할 수 있다.
상기 처리부는, 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하지 않고, 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 상기 사용자 단말에 제공할 수 있다.
상기 콘텐츠의 특징은, 일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함할 수 있다.
상기 콘텐츠의 특징은, 상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
상기 불량 사용자 유형을 저장하는 저장부를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 장치는 콘텐츠를 수신하는 수신부, 상기 콘텐츠를 작성한 사용자의 특징을 분석하는 사용자 분석부, 상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부, 처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고 상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부를 포함한다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명에 따르면 사용자의 특징 및 사용자가 작성한 콘텐츠의 특징을 기초로 사용자 유형을 설정하고 이를 미리 저장한 불량 사용자 유형과 비교하여 사용자 단위로 스팸을 관리함으로써, 효율적으로 스팸을 처리할 수 있다.
도 1은 본 발명의 한 실시예에 따른 스팸 관리 장치를 도시하는 블록도이다.
도 2는 본 발명의 다른 실시예에 따른 스팸 관리 방법을 도시하는 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 스팸 관리 장치의 개략적인 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
도면을 참고하여 본 발명의 한 실시예에 따른 스팸 관리 장치 및 스팸 관리방법에 대하여 상세하게 설명한다.
도 1은 본 발명의 한 실시예에 따른 스팸 관리 장치를 도시하는 블록도이다.
본 발명의 한 실시예에 따른 스팸 관리 장치(100)는 유입된 콘텐츠 자체의 특징 및 콘텐츠를 제작한 사용자 자체의 특징을 기초로 사용자의 유형을 도출하고, 미리 저장된 불량 사용자 유형과 상기 도출된 사용자 유형을 비교하고, 그에 따라 스팸을 관리하는 서버이다. 여기서 콘텐츠(contents)란 인터넷 상에 업로드된 문서, 사진 및 동영상 등을 의미한다.
스팸 관리 장치(100)는 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)를 포함한다.
수신부(110)는 사용자 단말(도시하지 않음)로부터 사용자가 인터넷 상에 등록한 콘텐츠, 콘텐츠가 등록되는 위치 정보 및 사용자 정보 등을 수신한다.
콘텐츠 분석부(120)는 수신부(110)가 수신한 콘텐츠를 전달받아 일정 기간 동안 특정 사용자가 입력한 콘텐츠의 특징을 분석한다.
콘텐츠의 특징은 해당 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율일 수 있다. 여기서 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는 예를 들어, 제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 배경화면과 유사한 색을 사용해서 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠, 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 및 그 구조가 일률적인 콘텐츠중 적어도 하나일 수 있다.
여기서 아웃 링크란 다른 사이트로 연결되는 도메인 주소를 의미하며, 2바이트 특수 문자는 예를 들어
Figure pat00001
등의 형태일 수 있다.
또한 콘텐츠 분석부(120)는 콘텐츠 길이의 평균 또는 편차를 분석할 수 있으며, HTML(hyper text markup language) 태그가 제거된 콘텐츠 길이의 평균 또는 편차를 분석할 수 있다. 스팸은 기계적으로 작성되는 경우가 많기 때문에 일률적인 길이를 가질 수 있으므로, 이러한 경우를 고려하는 것이다.
사용자 분석부(130)는 수신부(110)가 수신한 콘텐츠의 작성자인 사용자의 특징을 분석한다.
사용자 분석부(130)가 분석하는 사용자 특징은 단위 시간당 작성 콘텐츠의 수, 사용자의 가입 시기, 인터넷 상에서 콘텐츠를 등록하는 위치, 별도로 부여된 사용자의 평가 관련 순위 등일 수 있다. 예를 들어, 사용자 분석부(130)는 해당 사용자가 단위 시간당 100건 이상의 콘텐츠를 작성하였는지 여부, 사용자가 최근에 가입한 사람인지 여부 및 다음, 네이버 등의 포탈 사이트 또는 티스토리 등의 블로그에 콘텐츠를 등록하였는지 여부 등에 대하여 분석한다.
사용자 유형 도출부(140)는 콘텐츠 분석부(120) 및 사용자 분석부(130)가 분석한 내용 중 적어도 하나를 기초로 사용자 유형을 도출한다.
저장부(150)는 미리 선정한 불량 사용자 유형을 저장한다. 이때 불량 사용자 유형은 관리 목적에 따라 다양한 형태로 구분될 수 있으며, 예를 들어 성인 관련 불량 사용자 및 도박 관련 불량 사용자 등일 수 있다. 예를 들어, 단위 시간당 30건 이상의 콘텐츠 작성, 제목에 성인 검색어를 포함하는 콘텐츠 비율이 60%이상, 본문에 이미지 태그를 포함하는 문서의 비율이 90%이상 및 HTML 태그를 제거한 문서 길이의 평균이 30이상 100이하인 경우를 만족하는 해당 사용자를 성인 관련 불량 사용자로 분류할 수 있다. 또한 단위 시간당 10건 이상의 콘텐츠 작성, 제목 및 본문에 도박 검색어를 포함하는 콘텐츠의 비율이 50% 이상, 본문에 이미지 태그를 포함하는 문서의 비율이 50% 이상 및 제목과 본문에 2바이트 특수 문자를 포함하는 콘텐츠의 비율이 50% 이상인 경우를 만족하는 해당 사용자를 도박 관련 불량 사용자로 분류할 수 있다.
비교부(160)는 사용자 유형 도출부(140)로부터 도출된 판단 대상 사용자의 사용자 유형과 저장부(150)에 저장된 불량 사용자 유형의 유사 여부를 판단한다.
처리부(170)는 비교부(160)의 판단 결과 판단 대상 사용자의 사용자 유형이 저장부(150)에 저장된 불량 사용자 유형과 유사하다고 판단되면, 판단 대상 사용자가 작성한 콘텐츠를 스팸으로 처리한다. 즉 처리부(170)는 검색 서비스에서 제공되는 검색 결과 목록에서 판단 대상 사용자가 작성한 콘텐츠를 제거하거나, 메일 서비스에서 제공되는 메일 목록에서 판단 대상 사용자가 작성한 콘텐츠를 제거한다.
처리부(170)는 비교부(160)의 판단 결과 판단 대상 사용자의 사용자 유형이 저장부(150)에 저장된 불량 사용자 유형과 유사하지 않다고 판단되면, 검색 서비스 또는 메일 서비스등에서 판단 대상 사용자가 작성한 콘텐츠를 사용자 단말에게 제공한다.
종래 기술과 같이 사용자가 작성한 콘텐츠에 포함된 불용 키워드, 불용 패턴 및 불용 문장 등을 기준으로 스팸을 처리하는 경우에는 이러한 스팸 처리의 기준을 의도적으로 피하여 작성된 콘텐츠에 대하여 스팸 처리하는 것이 어려울 수 있다. 그러나 본 발명과 같이 불량 사용자를 미리 선정하고, 판단 대상이 되는 사용자 유형을 도출하여 그 유사 여부에 따라 판단 대상 사용자가 작성한 콘텐츠를 스팸으로 처리하면, 스팸 생성 사용자에 대하여 능동적으로 대응할 수 있으며, 콘텐츠에 대한 별도의 분석 없이 빠르고 정확한 스팸 처리를 수행할 수 있다.
이제 도 2를 참고하여 본 발명의 다른 실시예에 따른 스팸 관리 방법에 대하여 상세하게 설명한다.
도 2는 본 발명의 다른 실시예에 따른 스팸 관리 방법을 도시하는 흐름도이다.
도 2를 참고하면, 스팸 관리 장치(100)는 콘텐츠를 수신하고(S210), 수신한 콘텐츠를 작성한 사용자의 특징을 추출한다(S220). 여기서 사용자의 특징은 앞서 설명한 사용자 분석부(130)가 분석하는 내용에 대응된다.
그리고 스팸 관리 장치(100)는 수신한 콘텐츠의 특징을 추출한다(S230). 여기서 콘텐츠의 특징은 앞서 설명한 콘텐츠 분석부(120)가 분석하는 내용에 대응된다. 단계(S220) 및 단계(S230)의 순서를 서로 바뀔 수 있다.
그런 후 스팸 관리 장치(100)는 추출한 사용자 특징 및 콘텐츠 특징에 따라 사용자 유형을 도출한다(S240).
이어서 스팸 관리 장치(100)는 스팸 관리 대상의 콘텐츠를 작성한 처리 대상 사용자의 사용자 유형과 기 저장된 불량 사용자 유형을 비교하여 유사 여부를 판단한다(S250).
스팸 관리 장치(100)는 비교 결과에 따라 스팸 관리 대상의 콘텐츠를 처리한다(S260). 즉, 처리 대상 사용자의 사용자 유형과 불량 사용자 유형이 유사하다고 판단되면, 처리 대상 사용자가 작성한 스팸 관리 대상의 콘텐츠를 스팸으로 분류하여 처리한다. 처리 대상 사용자의 사용자 유형과 불량 사용자 유형이 유사하지 않다고 판단되면, 처리 대상 사용자자가 작성한 스팸 관리 대상의 콘텐츠를 스팸이 아닌 것으로 분류하여 검색 서비스 및 메일 서비스에 제공할 수 있다.
이상에서 설명한 본 발명의 실시예에 따른 스팸 관리 장치 및 스팸 관리 방법 중 적어도 일부 기능은 하드웨어로 구현되거나 하드웨어에 결합된 소프트웨어로 구현될 수 있다. 아래에서는 검색 서비스 제공 장치가 컴퓨터 시스템에 결합된 실시예에 대해서 도 3을 참고로 하여 상세하게 설명한다.
도 3은 본 발명의 다른 실시예에 따른 스팸 관리 장치(1000)의 개략적인 도면으로, 앞서 설명한 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능 중 적어도 일부를 수행하는 데 사용할 수 있는 시스템을 나타낸다
도 3을 참고하면, 스팸 관리 장치(1000)는 프로세서(1110), 메모리(1120), 적어도 하나의 저장 장치(1130), 입출력(input/output, I/O) 인터페이스(1140) 및 네트워크 인터페이스(1150)를 포함한다.
프로세서(1110)는 중앙 처리 유닛(central processing unit, CPU)이나 기타 칩셋, 마이크로프로세서 등으로 구현될 수 있다. 메모리(1120)는 동적 랜덤 액세스 메모리(dynamic random access memory, DRAM), 램버스 DRAM(rambus DRAM, RDRAM), 동기식 DRAM(synchronous DRAM, SDRAM), 정적 RAM(static RAM, SRAM) 등의 RAM과 같은 매체로 구현될 수 있다. 저장 장치(1130)는 하드 디스크 (hard disk), CD-ROM(compact disk read only memory), CD-RW(CD rewritable), DVD-ROM(digital video disk ROM), DVD-RAM, DVD-RW 디스크, 블루레이(blu-ray) 디스크 등의 광학 디스크, 플래시 메모리, 다양한 형태의 RAM과 같은 영구 또는 휘발성 저장 장치로 구현될 수 있다. 또한 I/O 인터페이스(1140)는 프로세서(1110) 및/또는 메모리(1120)가 저장 장치(1130)에 접근할 수 있도록 한다. 네트워크 인터페이스(1150)는 프로세서(1110) 및/또는 메모리(1120)가 네트워크에 접근할 수 있도록 한다.
이 경우, 프로세서(1110)는 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능의 적어도 일부 기능을 구현하기 위한 프로그램 명령을 메모리(1120)에 로드하고, 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능을 저장 장치(1130)에 위치시켜서, 도 1 및 도 2를 참고로 하여 설명한 동작이 수행되도록 제어할 수 있다.
도 3에 도시한 프로세서(1110), 메모리(1120), 저장 장치(1130), I/O 인터페이스(1140) 및 네트워크 인터페이스(1150)는 하나의 컴퓨터에 구현될 수도 있으며 또는 복수의 컴퓨터에 분산되어 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.

Claims (19)

  1. 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서,
    상기 콘텐츠를 수신하는 단계,
    상기 콘텐츠의 특징을 분석하는 단계,상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계,
    처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고
    상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계
    를 포함하는 스팸 관리 방법.
  2. 제1항에서,
    상기 사용자의 특징을 분석하는 단계
    를 더 포함하고,
    상기 사용자 유형을 분류하는 단계는, 상기 분석된 사용자의 특징을 더 고려하는 스팸 관리 방법.
  3. 제2항에서,
    상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계
    를 더 포함하는 스팸 관리 방법.
  4. 제2항에서,
    상기 콘텐츠의 특징은,
    일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함하는 스팸 관리 방법.
  5. 제4항에서,
    상기 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는,
    제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 바탕색과 유사한 색을 사용하여 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠, 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 및 그 구조가 일률적인 콘텐츠 중 적어도 하나를 포함하는 스팸 처리 방법.
  6. 제2항에서,
    상기 콘텐츠의 특징은,
    상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함하는 스팸 처리 방법.
  7. 제2항에서,
    상기 사용자의 특징은,
    단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
    스팸 처리 방법.
  8. 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서,
    상기 콘텐츠를 수신하는 단계,
    상기 콘텐츠를 작성한 사용자의 특징을 분석하는 단계,
    상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계,
    처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고
    상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계
    를 포함하는 스팸 관리 방법.
  9. 제8항에서,
    상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계
    를 더 포함하는 스팸 관리 방법.
  10. 제8항에서,
    상기 사용자의 특징은,
    단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
    스팸 처리 방법.
  11. 콘텐츠를 수신하는 수신부,
    상기 콘텐츠의 특징을 분석하는 콘텐츠 분석부,
    상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의사용자 유형을 분류하는 사용자 유형 도출부,
    처리 대상 사용자의 상기 사용자 유형과 상기 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고
    상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부
    를 포함하는 스팸 관리 장치.
  12. 제11항에서,
    상기 사용자의 특징을 분석하는 사용자 분석부
    를 더 포함하고,
    상기 사용자 유형 도출부는, 상기 분석된 사용자의 특징을 더 고려하는 스팸 관리 장치.
  13. 제11항에서,
    상기 처리부는,
    상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하지 않고, 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 상기 사용자 단말에 제공하는
    스팸 관리 장치.
  14. 제11항에서,
    상기 콘텐츠의 특징은,
    일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함하는 스팸 관리 장치.
  15. 제11항에서,
    상기 콘텐츠의 특징은,
    상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함하는 스팸 처리 장치.
  16. 제12항에서,
    상기 사용자의 특징은,
    단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
    스팸 처리 장치.
  17. 제11항에서,
    상기 불량 사용자 유형을 저장하는 저장부를 더 포함하는 스팸 처리 장치.
  18. 콘텐츠를 수신하는 수신부,
    상기 콘텐츠를 작성한 사용자의 특징을 분석하는 사용자 분석부,
    상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부,
    처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고
    상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부
    를 포함하는 스팸 관리 장치.
  19. 제18항에서,
    상기 사용자의 특징은,
    단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
    스팸 처리 장치.
KR1020100091597A 2010-09-17 2010-09-17 스팸 관리 장치 및 스팸 관리 방법 KR101221096B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020100091597A KR101221096B1 (ko) 2010-09-17 2010-09-17 스팸 관리 장치 및 스팸 관리 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100091597A KR101221096B1 (ko) 2010-09-17 2010-09-17 스팸 관리 장치 및 스팸 관리 방법

Publications (2)

Publication Number Publication Date
KR20120029662A true KR20120029662A (ko) 2012-03-27
KR101221096B1 KR101221096B1 (ko) 2013-01-11

Family

ID=46134012

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100091597A KR101221096B1 (ko) 2010-09-17 2010-09-17 스팸 관리 장치 및 스팸 관리 방법

Country Status (1)

Country Link
KR (1) KR101221096B1 (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101440090B1 (ko) * 2012-10-29 2014-11-04 한국과학기술원 온라인 게시판 서버, 온라인 게시판 시스템 및 온라인 게시판의 스팸 게시물 표시 방법
CN105489191A (zh) * 2014-09-18 2016-04-13 北京三星通信技术研究有限公司 一种显示设备及其显示方法
WO2016043472A3 (ko) * 2014-09-18 2016-05-06 삼성전자 주식회사 콘텐트를 디스플레이하기 위한 장치 및 방법
KR20210023916A (ko) * 2019-08-23 2021-03-04 박현준 컨텐츠 기여도 측정 방법 및 장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20050102753A (ko) * 2004-04-21 2005-10-27 장수진 스팸메일 차단 시스템 및 그 방법
KR100996311B1 (ko) * 2007-09-27 2010-11-23 야후! 인크. 스팸 ucc를 감지하기 위한 방법 및 시스템

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101440090B1 (ko) * 2012-10-29 2014-11-04 한국과학기술원 온라인 게시판 서버, 온라인 게시판 시스템 및 온라인 게시판의 스팸 게시물 표시 방법
CN105489191A (zh) * 2014-09-18 2016-04-13 北京三星通信技术研究有限公司 一种显示设备及其显示方法
WO2016043472A3 (ko) * 2014-09-18 2016-05-06 삼성전자 주식회사 콘텐트를 디스플레이하기 위한 장치 및 방법
KR20210023916A (ko) * 2019-08-23 2021-03-04 박현준 컨텐츠 기여도 측정 방법 및 장치

Also Published As

Publication number Publication date
KR101221096B1 (ko) 2013-01-11

Similar Documents

Publication Publication Date Title
US20210271682A1 (en) Gathering and contributing content across diverse sources
US20180232362A1 (en) Method and system relating to sentiment analysis of electronic content
US8630972B2 (en) Providing context for web articles
US8095547B2 (en) Method and apparatus for detecting spam user created content
CN102768676B (zh) 一种格式未知文件的处理方法和装置
US20170169010A1 (en) Interactive addition of semantic concepts to a document
US9361317B2 (en) Method for entity enrichment of digital content to enable advanced search functionality in content management systems
CN110290199B (zh) 内容推送方法、装置及设备
US20150120708A1 (en) Information aggregation, classification and display method and system
US20110093489A1 (en) Dynamic tagging
US20160217297A1 (en) Dynamically linked content creation in a secure processing environment
KR101221096B1 (ko) 스팸 관리 장치 및 스팸 관리 방법
CN112307318B (zh) 一种内容发布方法、系统及装置
AU2018429394B2 (en) Media source measurement for incorporation into a censored media corpus
US9323721B1 (en) Quotation identification
CN106570003B (zh) 数据推送方法及装置
US9563711B2 (en) Automated surfacing of tagged content in vertical applications
Spagnuelo et al. Transparency enhancing tools and the GDPR: Do they match?
JP2009151746A (ja) 情報資源の協同タギングシステム及び方法
CN114706948A (zh) 新闻处理方法、装置、存储介质以及电子设备
CN113660277B (zh) 一种基于复用埋点信息的反爬虫方法及处理终端
JP2009211404A (ja) 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。
CN116502001A (zh) 一种网页显示方法、装置、电子设备及存储介质
CN117435692A (zh) 一种基于变体对抗敏感文本识别方法和系统
KR101157202B1 (ko) 스팸 관리 장치 및 스팸 관리 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20151230

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170104

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20190329

Year of fee payment: 9