KR101221096B1 - 스팸 관리 장치 및 스팸 관리 방법 - Google Patents
스팸 관리 장치 및 스팸 관리 방법 Download PDFInfo
- Publication number
- KR101221096B1 KR101221096B1 KR1020100091597A KR20100091597A KR101221096B1 KR 101221096 B1 KR101221096 B1 KR 101221096B1 KR 1020100091597 A KR1020100091597 A KR 1020100091597A KR 20100091597 A KR20100091597 A KR 20100091597A KR 101221096 B1 KR101221096 B1 KR 101221096B1
- Authority
- KR
- South Korea
- Prior art keywords
- content
- user
- spam
- created
- processing
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 20
- 238000007726 management method Methods 0.000 claims abstract description 41
- 208000001613 Gambling Diseases 0.000 claims description 6
- 238000009795 derivation Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 claims description 3
- 239000003086 colorant Substances 0.000 claims 1
- 238000003672 processing method Methods 0.000 claims 1
- 230000006870 function Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Human Resources & Organizations (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
본 발명에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠의 특징을 분석하는 단계, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.
Description
본 발명은 스팸 관리 장치 및 스팸 관리 방법에 관한 것이다.
스팸(spam)이란 사용자의 의도 또는 목적과 상관없이 인터넷 상에서 제공되는 문서, 사진 및 동영상 등의 콘텐츠(contents)로서, 주로 광고성 사이트를 사용자에게 홍보하고 유입시키려는 목적을 갖고 있다. 인터넷 사용자는 포털 사이트(portal site) 등에서 관심 있는 업체 등을 검색하고, 검색된 업체에 대한 정보를 제공받을 수 있는데, 이때 검색 결과 목록에 스팸이 포함되거나, 인터넷 사용자의 이메일에 스팸이 포함될 수 있다. 따라서 포털 사이트 사업자는 사용자에게 제공하는 서비스에 스팸이 포함되지 않도록 걸러내어 관리할 필요가 있다.
종래에는 스팸 판단의 근거가 되는 불용 검색어, 일정한 검색어의 조합으로 이루어진 불용 패턴, 불용 문장 및 아웃 링크의 도메인 주소 등을 설정하고 이들을 포함하고 있는 콘텐츠를 스팸으로 분류함으로써 스팸을 관리하였다.
이와 같이 콘텐츠를 기준으로 스팸을 관리하는 경우에 설정한 불용 검색어, 불용 패턴, 불용 문장 및 아웃 링크 등을 의도적으로 회피하고 있는 콘텐츠에 대해서는 스팸 관리가 제대로 이루어지기 힘들다. 특히 의도적으로 스팸을 생성하는 특정 사용자는 이러한 불용 검색어, 불용 패턴 및 불용 문장 등에 대한 정보를 지속적으로 모니터링하여 그 결과에 따라 스팸을 생성하므로 스팸 관리에 더욱 큰 어려움이 있다.
본 발명이 이루고자 하는 기술적 과제는 사용자 자체에 대한 특징 및 사용자가 작성한 콘텐츠의 특징을 기초로 사용자 유형을 설정하고 이를 미리 저장한 불량 사용자 유형과 비교하여 그 결과에에 따라 스팸을 관리함으로써, 효율적으로 스팸을 처리하는 것이다.
본 발명의 실시예에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠의 특징을 분석하는 단계, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.
상기 사용자의 특징을 분석하는 단계를 더 포함하고, 상기 사용자 유형을 분류하는 단계는, 상기 분석된 사용자의 특징을 더 고려할 수 있다.
상기 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계를 더 포함할 수 있다.
상기 콘텐츠의 특징은, 일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함할 수 있다.
상기 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는, 제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 바탕색과 유사한 색을 사용하여 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠, 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 및 그 구조가 일률적인 콘텐츠 중 적어도 하나를 포함할 수 있다.
상기 콘텐츠의 특징은, 상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 방법은 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서, 상기 콘텐츠를 수신하는 단계, 상기 콘텐츠를 작성한 사용자의 특징을 분석하는 단계, 상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계, 처리 대상 사용자의 상기 사용자 유형과미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계를 포함한다.
상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계를 더 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 장치는 콘텐츠를 수신하는 수신부, 상기 콘텐츠의 특징을 분석하는 콘텐츠 분석부, 상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부, 처리 대상 사용자의 상기 사용자 유형과 상기 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고 상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부를 포함한다.
상기 사용자의 특징을 분석하는 사용자 분석부를 더 포함하고, 상기 사용자 유형 도출부는, 상기 분석된 사용자의 특징을 더 고려할 수 있다.
상기 처리부는, 상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하지 않고, 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 상기 사용자 단말에 제공할 수 있다.
상기 콘텐츠의 특징은, 일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함할 수 있다.
상기 콘텐츠의 특징은, 상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함할 수 있다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
상기 불량 사용자 유형을 저장하는 저장부를 더 포함할 수 있다.
본 발명의 다른 실시예에 따른 스팸 관리 장치는 콘텐츠를 수신하는 수신부, 상기 콘텐츠를 작성한 사용자의 특징을 분석하는 사용자 분석부, 상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부, 처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고 상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부를 포함한다.
상기 사용자의 특징은, 단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함할 수 있다.
본 발명에 따르면 사용자의 특징 및 사용자가 작성한 콘텐츠의 특징을 기초로 사용자 유형을 설정하고 이를 미리 저장한 불량 사용자 유형과 비교하여 사용자 단위로 스팸을 관리함으로써, 효율적으로 스팸을 처리할 수 있다.
도 1은 본 발명의 한 실시예에 따른 스팸 관리 장치를 도시하는 블록도이다.
도 2는 본 발명의 다른 실시예에 따른 스팸 관리 방법을 도시하는 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 스팸 관리 장치의 개략적인 도면이다.
도 2는 본 발명의 다른 실시예에 따른 스팸 관리 방법을 도시하는 흐름도이다.
도 3은 본 발명의 다른 실시예에 따른 스팸 관리 장치의 개략적인 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 전체에서, 어떤 부분이 어떤 구성요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성요소를 더 포함할 수 있는 것을 의미한다. 또한, 명세서에 기재된 "…부", "…기", "모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어 또는 하드웨어 및 소프트웨어의 결합으로 구현될 수 있다.
도면을 참고하여 본 발명의 한 실시예에 따른 스팸 관리 장치 및 스팸 관리방법에 대하여 상세하게 설명한다.
도 1은 본 발명의 한 실시예에 따른 스팸 관리 장치를 도시하는 블록도이다.
본 발명의 한 실시예에 따른 스팸 관리 장치(100)는 유입된 콘텐츠 자체의 특징 및 콘텐츠를 제작한 사용자 자체의 특징을 기초로 사용자의 유형을 도출하고, 미리 저장된 불량 사용자 유형과 상기 도출된 사용자 유형을 비교하고, 그에 따라 스팸을 관리하는 서버이다. 여기서 콘텐츠(contents)란 인터넷 상에 업로드된 문서, 사진 및 동영상 등을 의미한다.
스팸 관리 장치(100)는 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)를 포함한다.
수신부(110)는 사용자 단말(도시하지 않음)로부터 사용자가 인터넷 상에 등록한 콘텐츠, 콘텐츠가 등록되는 위치 정보 및 사용자 정보 등을 수신한다.
콘텐츠 분석부(120)는 수신부(110)가 수신한 콘텐츠를 전달받아 일정 기간 동안 특정 사용자가 입력한 콘텐츠의 특징을 분석한다.
콘텐츠의 특징은 해당 사용자가 작성한 전체 콘텐츠 수효 및 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율일 수 있다. 여기서 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는 예를 들어, 제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 배경화면과 유사한 색을 사용해서 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠, 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 및 그 구조가 일률적인 콘텐츠중 적어도 하나일 수 있다.
또한 콘텐츠 분석부(120)는 콘텐츠 길이의 평균 또는 편차를 분석할 수 있으며, HTML(hyper text markup language) 태그가 제거된 콘텐츠 길이의 평균 또는 편차를 분석할 수 있다. 스팸은 기계적으로 작성되는 경우가 많기 때문에 일률적인 길이를 가질 수 있으므로, 이러한 경우를 고려하는 것이다.
사용자 분석부(130)는 수신부(110)가 수신한 콘텐츠의 작성자인 사용자의 특징을 분석한다.
사용자 분석부(130)가 분석하는 사용자 특징은 단위 시간당 작성 콘텐츠의 수, 사용자의 가입 시기, 인터넷 상에서 콘텐츠를 등록하는 위치, 별도로 부여된 사용자의 평가 관련 순위 등일 수 있다. 예를 들어, 사용자 분석부(130)는 해당 사용자가 단위 시간당 100건 이상의 콘텐츠를 작성하였는지 여부, 사용자가 최근에 가입한 사람인지 여부 및 다음, 네이버 등의 포탈 사이트 또는 티스토리 등의 블로그에 콘텐츠를 등록하였는지 여부 등에 대하여 분석한다.
사용자 유형 도출부(140)는 콘텐츠 분석부(120) 및 사용자 분석부(130)가 분석한 내용 중 적어도 하나를 기초로 사용자 유형을 도출한다.
저장부(150)는 미리 선정한 불량 사용자 유형을 저장한다. 이때 불량 사용자 유형은 관리 목적에 따라 다양한 형태로 구분될 수 있으며, 예를 들어 성인 관련 불량 사용자 및 도박 관련 불량 사용자 등일 수 있다. 예를 들어, 단위 시간당 30건 이상의 콘텐츠 작성, 제목에 성인 검색어를 포함하는 콘텐츠 비율이 60%이상, 본문에 이미지 태그를 포함하는 문서의 비율이 90%이상 및 HTML 태그를 제거한 문서 길이의 평균이 30이상 100이하인 경우를 만족하는 해당 사용자를 성인 관련 불량 사용자로 분류할 수 있다. 또한 단위 시간당 10건 이상의 콘텐츠 작성, 제목 및 본문에 도박 검색어를 포함하는 콘텐츠의 비율이 50% 이상, 본문에 이미지 태그를 포함하는 문서의 비율이 50% 이상 및 제목과 본문에 2바이트 특수 문자를 포함하는 콘텐츠의 비율이 50% 이상인 경우를 만족하는 해당 사용자를 도박 관련 불량 사용자로 분류할 수 있다.
비교부(160)는 사용자 유형 도출부(140)로부터 도출된 판단 대상 사용자의 사용자 유형과 저장부(150)에 저장된 불량 사용자 유형의 유사 여부를 판단한다.
처리부(170)는 비교부(160)의 판단 결과 판단 대상 사용자의 사용자 유형이 저장부(150)에 저장된 불량 사용자 유형과 유사하다고 판단되면, 판단 대상 사용자가 작성한 콘텐츠를 스팸으로 처리한다. 즉 처리부(170)는 검색 서비스에서 제공되는 검색 결과 목록에서 판단 대상 사용자가 작성한 콘텐츠를 제거하거나, 메일 서비스에서 제공되는 메일 목록에서 판단 대상 사용자가 작성한 콘텐츠를 제거한다.
처리부(170)는 비교부(160)의 판단 결과 판단 대상 사용자의 사용자 유형이 저장부(150)에 저장된 불량 사용자 유형과 유사하지 않다고 판단되면, 검색 서비스 또는 메일 서비스등에서 판단 대상 사용자가 작성한 콘텐츠를 사용자 단말에게 제공한다.
종래 기술과 같이 사용자가 작성한 콘텐츠에 포함된 불용 키워드, 불용 패턴 및 불용 문장 등을 기준으로 스팸을 처리하는 경우에는 이러한 스팸 처리의 기준을 의도적으로 피하여 작성된 콘텐츠에 대하여 스팸 처리하는 것이 어려울 수 있다. 그러나 본 발명과 같이 불량 사용자를 미리 선정하고, 판단 대상이 되는 사용자 유형을 도출하여 그 유사 여부에 따라 판단 대상 사용자가 작성한 콘텐츠를 스팸으로 처리하면, 스팸 생성 사용자에 대하여 능동적으로 대응할 수 있으며, 콘텐츠에 대한 별도의 분석 없이 빠르고 정확한 스팸 처리를 수행할 수 있다.
이제 도 2를 참고하여 본 발명의 다른 실시예에 따른 스팸 관리 방법에 대하여 상세하게 설명한다.
도 2는 본 발명의 다른 실시예에 따른 스팸 관리 방법을 도시하는 흐름도이다.
도 2를 참고하면, 스팸 관리 장치(100)는 콘텐츠를 수신하고(S210), 수신한 콘텐츠를 작성한 사용자의 특징을 추출한다(S220). 여기서 사용자의 특징은 앞서 설명한 사용자 분석부(130)가 분석하는 내용에 대응된다.
그리고 스팸 관리 장치(100)는 수신한 콘텐츠의 특징을 추출한다(S230). 여기서 콘텐츠의 특징은 앞서 설명한 콘텐츠 분석부(120)가 분석하는 내용에 대응된다. 단계(S220) 및 단계(S230)의 순서를 서로 바뀔 수 있다.
그런 후 스팸 관리 장치(100)는 추출한 사용자 특징 및 콘텐츠 특징에 따라 사용자 유형을 도출한다(S240).
이어서 스팸 관리 장치(100)는 스팸 관리 대상의 콘텐츠를 작성한 처리 대상 사용자의 사용자 유형과 기 저장된 불량 사용자 유형을 비교하여 유사 여부를 판단한다(S250).
스팸 관리 장치(100)는 비교 결과에 따라 스팸 관리 대상의 콘텐츠를 처리한다(S260). 즉, 처리 대상 사용자의 사용자 유형과 불량 사용자 유형이 유사하다고 판단되면, 처리 대상 사용자가 작성한 스팸 관리 대상의 콘텐츠를 스팸으로 분류하여 처리한다. 처리 대상 사용자의 사용자 유형과 불량 사용자 유형이 유사하지 않다고 판단되면, 처리 대상 사용자자가 작성한 스팸 관리 대상의 콘텐츠를 스팸이 아닌 것으로 분류하여 검색 서비스 및 메일 서비스에 제공할 수 있다.
이상에서 설명한 본 발명의 실시예에 따른 스팸 관리 장치 및 스팸 관리 방법 중 적어도 일부 기능은 하드웨어로 구현되거나 하드웨어에 결합된 소프트웨어로 구현될 수 있다. 아래에서는 검색 서비스 제공 장치가 컴퓨터 시스템에 결합된 실시예에 대해서 도 3을 참고로 하여 상세하게 설명한다.
도 3은 본 발명의 다른 실시예에 따른 스팸 관리 장치(1000)의 개략적인 도면으로, 앞서 설명한 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능 중 적어도 일부를 수행하는 데 사용할 수 있는 시스템을 나타낸다
도 3을 참고하면, 스팸 관리 장치(1000)는 프로세서(1110), 메모리(1120), 적어도 하나의 저장 장치(1130), 입출력(input/output, I/O) 인터페이스(1140) 및 네트워크 인터페이스(1150)를 포함한다.
프로세서(1110)는 중앙 처리 유닛(central processing unit, CPU)이나 기타 칩셋, 마이크로프로세서 등으로 구현될 수 있다. 메모리(1120)는 동적 랜덤 액세스 메모리(dynamic random access memory, DRAM), 램버스 DRAM(rambus DRAM, RDRAM), 동기식 DRAM(synchronous DRAM, SDRAM), 정적 RAM(static RAM, SRAM) 등의 RAM과 같은 매체로 구현될 수 있다. 저장 장치(1130)는 하드 디스크 (hard disk), CD-ROM(compact disk read only memory), CD-RW(CD rewritable), DVD-ROM(digital video disk ROM), DVD-RAM, DVD-RW 디스크, 블루레이(blu-ray) 디스크 등의 광학 디스크, 플래시 메모리, 다양한 형태의 RAM과 같은 영구 또는 휘발성 저장 장치로 구현될 수 있다. 또한 I/O 인터페이스(1140)는 프로세서(1110) 및/또는 메모리(1120)가 저장 장치(1130)에 접근할 수 있도록 한다. 네트워크 인터페이스(1150)는 프로세서(1110) 및/또는 메모리(1120)가 네트워크에 접근할 수 있도록 한다.
이 경우, 프로세서(1110)는 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능의 적어도 일부 기능을 구현하기 위한 프로그램 명령을 메모리(1120)에 로드하고, 수신부(110), 콘텐츠 분석부(120), 사용자 분석부(130), 사용자 유형 도출부(140), 저장부(150), 비교부(160) 및 처리부(170)의 기능을 저장 장치(1130)에 위치시켜서, 도 1 및 도 2를 참고로 하여 설명한 동작이 수행되도록 제어할 수 있다.
도 3에 도시한 프로세서(1110), 메모리(1120), 저장 장치(1130), I/O 인터페이스(1140) 및 네트워크 인터페이스(1150)는 하나의 컴퓨터에 구현될 수도 있으며 또는 복수의 컴퓨터에 분산되어 구현될 수도 있다.
이상에서 본 발명의 실시예에 대하여 상세하게 설명하였지만 본 발명의 권리범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리범위에 속하는 것이다.
Claims (19)
- 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서,
사용자 단말로부터 상기 콘텐츠를 수신하는 단계,
상기 콘텐츠의 특징을 분석하는 단계,
상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계,
처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고
상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계
를 포함하고,
상기 콘텐츠의 특징을 분석하는 단계는
일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효에 대한, 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 기초로 상기 콘텐츠의 특징을 분석하는 단계를 포함하는
스팸 관리 방법. - 제1항에서,
상기 분류하는 단계 이전에
상기 사용자의 특징을 분석하는 단계
를 더 포함하고,
상기 사용자의 특징은,
단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하고,
상기 사용자 유형을 분류하는 단계는, 상기 분석된 사용자의 특징을 더 고려하는 스팸 관리 방법. - 제2항에서,
상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계
를 더 포함하는 스팸 관리 방법. - 삭제
- 제1항에서,
상기 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠는,
제목 또는 본문에 성인 검색어를 포함하는 콘텐츠, 제목 또는 본문에 도박 키워드를 포함하는 콘텐츠, 제목 또는 본문에 저작권 관련한 검색어를 포함하는 콘텐츠, 본문에 이미지 태그(tag)를 포함하는 콘텐츠, 본문에 바탕색과 유사한 색을 사용하여 작성한 글자를 포함하는 콘텐츠, 본문에 아웃 링크(outlink)를 포함하는 콘텐츠, 본문에 인코딩된 아웃 링크를 포함하는 콘텐츠, 본문에 일정 글자 크기 이하의 태그를 포함하는 콘텐츠, 제목에 2바이트 특수 문자(2byte typograghy)를 포함하는 콘텐츠, 제목에 공백이 포함되지 않은 콘텐츠 및 제목의 일정 비율 이상이 본문 앞부분에 포함된 콘텐츠 중 적어도 하나를 포함하는 스팸 처리 방법. - 제2항에서,
상기 콘텐츠의 특징은,
상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함하는 스팸 처리 방법. - 삭제
- 스팸 관리 장치가 콘텐츠의 스팸 처리를 관리하는 방법으로서,
사용자 단말로부터 상기 콘텐츠를 수신하는 단계,
상기 콘텐츠를 작성한 사용자의 특징을 분석하는 단계,
상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 단계,
처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 단계, 그리고
상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 스팸으로 처리하는 단계
를 포함하고,
상기 사용자의 특징은,
단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는 스팸 관리 방법. - 제8항에서,
상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하는 단계
를 더 포함하는 스팸 관리 방법. - 삭제
- 콘텐츠를 수신하는 수신부,
상기 콘텐츠의 특징을 분석하는 콘텐츠 분석부,
상기 분석된 콘텐츠의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부,
처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고
상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부
를 포함하고,
상기 콘텐츠의 특징은,
일정 기간 동안 상기 콘텐츠를 작성한 사용자가 작성한 전체 콘텐츠 수효에 대한, 스팸 판단의 기준이 되는 내용을 포함하는 콘텐츠 수효의 비율을 포함하는 스팸 관리 장치. - 제11항에서,
사용자의 특징을 분석하는 사용자 분석부
를 더 포함하고,
상기 사용자 유형 도출부는, 상기 분석된 사용자의 특징을 더 고려하는 스팸 관리 장치. - 제11항에서,
상기 처리부는,
상기 판단 결과 유사하다고 판단되는 경우 상기 처리 대상 콘텐츠를 사용자 단말에 제공하지 않고, 상기 판단 결과 유사하지 않다고 판단되는 경우 상기 처리 대상 콘텐츠를 상기 사용자 단말에 제공하는
스팸 관리 장치. - 삭제
- 제11항에서,
상기 콘텐츠의 특징은,
상기 콘텐츠의 길이 평균, 편차, 상기 콘텐츠에서 HTML(hyper text markup language) 태그가 제거된 길이의 평균 및 편차를 포함하는 스팸 처리 장치. - 제12항에서,
상기 사용자의 특징은,
단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
스팸 처리 장치. - 제11항에서,
상기 불량 사용자 유형을 저장하는 저장부를 더 포함하는 스팸 처리 장치. - 콘텐츠를 수신하는 수신부,
상기 콘텐츠를 작성한 사용자의 특징을 분석하는 사용자 분석부,
상기 분석된 사용자의 특징에 따라 상기 콘텐츠를 작성한 사용자의 사용자 유형을 분류하는 사용자 유형 도출부,
처리 대상 사용자의 상기 사용자 유형과 미리 저장되어 있는 불량 사용자 유형을 비교하여 유사 여부를 판단하는 비교부, 그리고
상기 비교부의 결과에 따라 상기 처리 대상 사용자가 작성한 처리 대상 콘텐츠를 처리하는 처리부
를 포함하고,
상기 사용자의 특징은,
단위 시간당 작성된 상기 콘텐츠의 수, 가입 시기, 인터넷 상에서 상기 콘텐츠를 등록하는 위치 및 별도로 부여된 사용자의 평가 관련 순위 중 적어도 하나를 포함하는
스팸 처리 장치. - 삭제
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100091597A KR101221096B1 (ko) | 2010-09-17 | 2010-09-17 | 스팸 관리 장치 및 스팸 관리 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020100091597A KR101221096B1 (ko) | 2010-09-17 | 2010-09-17 | 스팸 관리 장치 및 스팸 관리 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20120029662A KR20120029662A (ko) | 2012-03-27 |
KR101221096B1 true KR101221096B1 (ko) | 2013-01-11 |
Family
ID=46134012
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020100091597A KR101221096B1 (ko) | 2010-09-17 | 2010-09-17 | 스팸 관리 장치 및 스팸 관리 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101221096B1 (ko) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101440090B1 (ko) * | 2012-10-29 | 2014-11-04 | 한국과학기술원 | 온라인 게시판 서버, 온라인 게시판 시스템 및 온라인 게시판의 스팸 게시물 표시 방법 |
WO2016043472A2 (ko) * | 2014-09-18 | 2016-03-24 | 삼성전자 주식회사 | 콘텐트를 디스플레이하기 위한 장치 및 방법 |
CN105489191A (zh) * | 2014-09-18 | 2016-04-13 | 北京三星通信技术研究有限公司 | 一种显示设备及其显示方法 |
KR20210023690A (ko) * | 2019-08-23 | 2021-03-04 | 박현준 | 컨텐츠 기여도 측정 방법 및 장치 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050102753A (ko) * | 2004-04-21 | 2005-10-27 | 장수진 | 스팸메일 차단 시스템 및 그 방법 |
KR20090032305A (ko) * | 2007-09-27 | 2009-04-01 | 야후! 인크. | 스팸 ucc를 감지하기 위한 방법 및 시스템 |
-
2010
- 2010-09-17 KR KR1020100091597A patent/KR101221096B1/ko active IP Right Grant
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20050102753A (ko) * | 2004-04-21 | 2005-10-27 | 장수진 | 스팸메일 차단 시스템 및 그 방법 |
KR20090032305A (ko) * | 2007-09-27 | 2009-04-01 | 야후! 인크. | 스팸 ucc를 감지하기 위한 방법 및 시스템 |
Also Published As
Publication number | Publication date |
---|---|
KR20120029662A (ko) | 2012-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8630972B2 (en) | Providing context for web articles | |
US10642937B2 (en) | Interactive addition of semantic concepts to a document | |
CN102768676B (zh) | 一种格式未知文件的处理方法和装置 | |
US20180232362A1 (en) | Method and system relating to sentiment analysis of electronic content | |
US7788262B1 (en) | Method and system for creating context based summary | |
US8095547B2 (en) | Method and apparatus for detecting spam user created content | |
US20150254350A1 (en) | Method for entity enrichment of digital content to enable advanced search functionality in content management systems | |
US20110112824A1 (en) | Determining at least one category path for identifying input text | |
US11681818B2 (en) | Dynamically linked content creation in a secure processing environment | |
KR101221096B1 (ko) | 스팸 관리 장치 및 스팸 관리 방법 | |
CN103235821A (zh) | 原创内容的搜索方法和搜索服务器 | |
AU2018429394B2 (en) | Media source measurement for incorporation into a censored media corpus | |
WO2019187842A1 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
CN108494728B (zh) | 防止流量劫持的黑名单库创建方法、装置、设备及介质 | |
KR20200013298A (ko) | 형태소 분석을 활용하여 문서를 관리하는 장치 및 이의 동작 방법 | |
US9323721B1 (en) | Quotation identification | |
CN106570003B (zh) | 数据推送方法及装置 | |
Gali et al. | Extracting representative image from web page | |
JP2009151746A (ja) | 情報資源の協同タギングシステム及び方法 | |
JP2019174925A (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
CN114706948A (zh) | 新闻处理方法、装置、存储介质以及电子设备 | |
JP6762678B2 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
WO2019187843A1 (ja) | 違法コンテンツ探索装置、違法コンテンツ探索方法およびプログラム | |
JP5217513B2 (ja) | 情報解析処理方法、情報解析処理プログラム、情報解析処理装置、情報登録処理方法、情報登録処理プログラム、情報登録処理装置、情報登録解析処理方法、および情報登録解析処理プログラム。 | |
CN109948097B (zh) | 推荐内容的方法、装置及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20151230 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170104 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20190329 Year of fee payment: 9 |