KR100473052B1 - 스팸메일 자동분류용 사전 구성 방법 - Google Patents

스팸메일 자동분류용 사전 구성 방법 Download PDF

Info

Publication number
KR100473052B1
KR100473052B1 KR10-2002-0044531A KR20020044531A KR100473052B1 KR 100473052 B1 KR100473052 B1 KR 100473052B1 KR 20020044531 A KR20020044531 A KR 20020044531A KR 100473052 B1 KR100473052 B1 KR 100473052B1
Authority
KR
South Korea
Prior art keywords
mail
spam
dictionary
user
directory
Prior art date
Application number
KR10-2002-0044531A
Other languages
English (en)
Other versions
KR20040011122A (ko
Inventor
이현수
Original Assignee
삼성에스디에스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성에스디에스 주식회사 filed Critical 삼성에스디에스 주식회사
Priority to KR10-2002-0044531A priority Critical patent/KR100473052B1/ko
Publication of KR20040011122A publication Critical patent/KR20040011122A/ko
Application granted granted Critical
Publication of KR100473052B1 publication Critical patent/KR100473052B1/ko

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

본 발명은 사용자의 메일 클라이언트에 들어오는 메일을 파싱하여 들어오는 정보를 통하여 상기 메일이 스팸메일인지 아닌지를 판별할 수 있도록 하는 스팸메일 자동분류용 사전(辭典)을 구성하기 위한 방법에 관한 것으로서, 상기 사전 구성 시스템이 스팸메일 자동분류용 사전을 구성하기 위하여 접속/전송부를 통하여 사용자 메일 시스템에 접속하고, 수신 메일 존재 여부를 체크부를 통하여 체크하는 제 1 단계; 수신 메일이 존재하는 경우 상기 접속/전송부가 사용자 단말기로부터 상기 수신 메일에 대한 분류 정보 전송받는 제 2 단계; 상기 분석부가 분석 모듈을 이용하여 상기 수신 메일의 단어를 형태소 분석하여 단어를 등록부에 등록하여 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전을 구성하는 제 3 단계;를 포함한다.

Description

스팸메일 자동분류용 사전 구성 방법{Dictionary Composing Method for Automatic Spam-mail Dividing}
본 발명은 원하지 않는 광고성 이-메일인 스팸메일을 차단하기 위한 스팸메일 자동분류 방법에 관한 것으로서, 보다 구체적으로는 수신된 메일 중 스팸메일을 자동적으로 분류하도록 하여 주는 스팸메일 분류용 사전의 구성 방법에 관한 것이다.
현재 이-메일은 기업 내 사용자 뿐만 아니라 개인 사용자에게 있어서도 중요한 커뮤니케이션(Communication) 미디어로써 자리를 잡아가고 있다. 특히 기업내 업무가 메일을 통한 협업과 커뮤니케이션 도구로 자리를 잡아감에 따라 전체적인 업무의 메일 의존도는 커지고 있다고 할 수 있다. 그러나 메일에 대한 업무 의존도가 커져감에 따라 원하지 않는 메일을 수신할 가능성도 그만큼 커져 가고 있으며 이에 따라 업무시작이나 혹은 메일 클라이언트를 확인할 때 가장 먼저하는 일이 스팸메일을 삭제하는 일부터 수행을 해야하는 상황에 직면하게 되었다.
스팸메일이란 PC통신이나 인터넷 ID를 가진 사람에게 일방적·대량으로 전달되는 전자우편을 말한다. 즉, 발신자가 자신과 아무런 관계가 없는 수신자에게 발송하는 전자 메시지를 스팸(spam)이라고 하며 쓰레기나 다름없다고 하여 정크메일(junk mail)이라고도 한다. 스패머(스팸메일을 보내는 사람)는 유즈넷 토론그룹과 같은 곳으로부터 가입자 주소를 하나하나 모으거나, 또는 이메일 배포 목록을 만드는 회사로부터 목록을 구입한 다음, 그곳에 대량의 메일을 보내기도 하고 불특정 전자우편 주소를 자동으로 모아 일괄적으로 전송하는 스팸 전용 프로그램을 이용하기도 한다. 이와 같은 스팸메일은 컴퓨터 통신망에서 무차별로 살포되어 이를 원치 않는 사람이 읽거나 처리하는 데 많은 시간과 비용을 낭비하게 된다.
현재 스팸메일을 처리하는 방법으로는 IP 필터링(Fitering)에 의한 방법과 스팸메일을 처리하는 ISP(Internet Service Provider)에게 메일을 전송하여 스팸메일 발신자로 하여금 수신자에게 다시는 스팸메일을 전송하지 못하도록 하는 방법을 쓰고 있다.
먼저 IP 필터링은 메일 서버를 관리하는 관리자가 특정 IP를 가지고 들어오는 메일에 대해서 필터링을 수행함으로써 메일 사용자가 불필요한 메일을 수신하지 않도록 하는 방식을 의미한다. 그리고 ISP에 의한 방법은 메일 사용자가 스팸메일이라고 선택한 메일을 메일 클라이언트에 임베딩된 기능에 의해서 자동적으로 ISP에 등록을 하게되면 다음에 메일을 수신할 때 ISP 서버에 탑재된 디렉토리를 조회하여 메일 사용자가 다시는 스팸메일 사용자가 보낸 메일을 수신하지 않도록 하는 방식을 사용하고 있다.
이러한 종래 기술, 즉, IP 필터링에 의한 방법과 스팸메일을 처리하는 ISP에 의한 방법에 대하여, 스팸메일 발신자 역시 더욱 더 지능적인 방식으로 메일 헤더에 제목을 기입하지 않거나 자기 자신에게 메일을 보낸 후에 이를 임의의 사용자에게 다시 전송함으로써 기존 메일 클라이언트의 스팸메일 삭제 기능을 무력하게 되었다. 즉, 스패머가 자신이 이용하는 메일 서버 대신 임의의 다른 ISP나 기업의 메일 서버를 중계 서버로 이용해 마치 중계 서버의 사용자가 불특정 다수에게 광고성 메일을 보내는 것처럼 위장하는 중계 스팸 방식을 이용하여 통신업체의 필터링 차단 방식을 피하는 것이다. 더욱이, 인터넷 프로토콜(IP)추적 방지 프로그램이나 이-메일의 헤더(header)정보를 자동으로 바꾸는 프로그램의 등장은 발신자 추적을 더욱 어렵게 하고 있다. 인터넷 접속을 위해 컴퓨터가 부여받은 번호인 IP나 메일 발송 서버와 수신 서버의 IP주소 등을 담고 있는 헤더 정보를 분석하면 원칙적으로는 발신자를 추적할 수 있지만, 여러 컴퓨터를 거쳐 메일을 발송하면 추적이 어렵다. 또한 상기 IP 필터링의 경우 수신자의 의도와는 관계없이 관리자가 임의로 해당 IP로부터의 메일 수신을 금지하므로, 수신자가 수신을 원하거나 수신자에게 필요한 이-메일마저 수신되지 않을 가능성이 있다는 문제점이 지적되고 있다.
본 발명은 이러한 종래 기술의 문제점을 해결하기 위해 안출된 것으로서, 관리자 또는 메일 수신자가 직접 스팸메일을 식별하여 이를 수신하지 않도록 하는 종래의 방법을 개선하여 사용자의 메일 클라이언트에 들어오는 메일을 파싱하여 들어오는 정보를 통하여 상기 메일이 스팸메일인지 아닌지를 판별할 수 있도록 하는, 스팸메일 자동분류용 사전(辭典)을 구성하기 위한 방법을 제공하는 것을 목적으로 한다.
상기와 같은 목적을 달성하기 위하여 본 발명은 체크부, 분석부, 접속/전송부, 제작부, 등록부를 포함하는 사전 구성 시스템 및 사용자 메일 시스템을 이용하여 사용자에 적합한 스팸메일 분류용 사전을 구성하는 방법에 있어서, 상기 사전 구성 시스템은 스팸메일 자동분류용 사전을 구성하기 위하여 접속/전송부를 통하여 사용자 메일 시스템에 접속하고, 수신 메일 존재 여부를 체크부를 통하여 체크하는 제 1 단계; 수신 메일이 존재하는 경우 상기 접속/전송부가 사용자 단말기로부터 상기 수신 메일에 대한 분류 정보 전송받는 제 2 단계; 상기 분석부가 분석 모듈을 이용하여 상기 수신 메일의 단어를 형태소 분석하여 단어를 등록부에 등록하여 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전을 구성하는 제 3 단계;를 포함하는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법을 제공한다.
이하 첨부한 도면을 참고로 하여 본 발명의 양호한 실시예를 상술하기로 한다.
우선, 본 발명의 스팸메일 자동분류용 사전(辭典)은 사용자가 사용한 메일을 분석하여 여기에서 나온 말뭉치를 분석하여 사전(事前)에 미리 구성하여 사용하는 방식으로 구성되는데, 본 발명의 사전은 사용자가 일반적인 Non-스팸메일에서 사용하는 단어의 셋(Set)과 스팸메일의 단어의 셋(Set)은 관련성이 적다는 가정하에서 만들어진다.
도 1은 본 발명의 스팸메일 자동분류용 사전 작성 시스템의 개략적인 구성도이다. 도면을 참고하면, 본 발명의 사전 작성 시스템(100)은 체크부(102), 분석부(104), 접속/전송부(106), 제작부(108), 등록부(110)를 포함하며, LAN 또는 인터넷 등의 네트워크를 통하여 사용자 단말기(200)와 접속된다. 또한 도시하지는 않았으나 상기 사전 작성 시스템(100)은 사용자 단말기(200) 내에 포함되도록 구성할 수도 있다.
또한, 상기 시스템(100)은 사용자 단말기(200)에 메일 서비스를 제공하는 메일 시스템(300)과 추가로 연결될 수 있으며, 각 디렉토리 별로 스팸메일 사전 또는 Non-스팸메일 사전을 미리 분류 작성하여 DB화하고 이를 이용하여 사용자에게 적합한 사전을 제공하는 사전 서비스 시스템(400)과 추가로 연결될 수도 있다.
도 2는 본 발명의 스팸메일 자동분류용 사전 구성 방법의 각 단계를 도시하는 순서도이다.
먼저 본 발명의 사전 작성 시스템(100)은 스팸메일 자동분류용 사전을 구성하기 위하여 접속/전송부(106)를 통하여 사용자의 메일 시스템(300)에 접속하고, 사용자의 기존의 개인 계정에 기존에 수신된 메일이 존재하는지 여부를 체크부(102)를 통하여 체크한다(S 102).
다음, 기존의 수신 메일이 존재하는 경우 상기 접속/전송부(106)는 사용자 단말기(200)로부터 상기 메일 서버로부터 가져온 상기 메일에 대한 분류 정보 즉, 각 메일에 대하여 Non-스팸메일인지 또는 스팸메일인지 여부에 대한 분류 정보를 전송받는다(S 104). 상기 분류 정보에 의거하여 상기 등록부(110)는 각 Non-스팸메일 및 스팸메일을 각 Non-스팸메일 디렉토리 및 스팸메일 디렉토리에 등록하여 둘 수 있다.
다음, 상기 분석부(104)는 그 내부에 포함하고 있는 사전 분석 모듈(도시하지 않음)을 이용하여 개인 계정에 있는 메일의 단어를 형태소 분석하여 단어를 등록부(110)에 등록하여 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전을 구성한다(S 106). 즉, Non-스팸메일 및 스팸메일 각각에 대하여 각 메일이 포함하고 있는 본문의 각 단어를 소정 기준(예를 들어 띄워쓰기, 동사, 명사, 복합명서, 어간어미, 조사, 접두사 별로 각 문장을 쪼개는 방식)에 의하여 각 형태소로 분리하고, 분리된 각 형태소를 소정 기준에 따라 등록한다. 양호하게는 소정 빈도 이상인 경우 각 사전에 리스트업되도록 할 수 있는데, 예를 들어 500회 이상 노출된 경우 스팸메일 사전에 리스트업되는 기준인 경우, '광*고'란 형태소가 510회 노출되었다면 리스트업되는 방식을 취할 수도 있고, 빈도 기준으로 전체 형태소 중 노출 횟도가 상위 20 % 안에 들어가는 형태소들은 스팸메일 사전에 리스트업하는 방식을 취할 수도 있다.
다음, 상기 단계 S 104에서 기존에 수신된 메일이 없거나 상기 단계 S 106에서 단어 등록이 끝난 경우에는 상기 접속/전송부(106)가 상기 사전 서비스 시스템(400)에 접속하는 단계를 추가로 포함할 수 있다(S 108).
다음, 상기 접속/전송부(106)가 상기 사전 서비스 시스템(400)으로 사용자가 기업일 경우에는 기업의 업종, 부서, 직급 등의 기업사용자정보를, 일반 사용자일 경우에는 나이, 연령, 취미, 직업 등의 개인사용자정보를 전송한다(S 110). 예를 들어 해당 기업이 광고업종인 경우에는 '△△광고'라는 문구를 포함하는 이-메일도 스팸메일이 아닐 가능성이 많으며 해당 부서가 홍보부서인 경우에는 '△△홍보'라는 문구를 포함하는 이-메일도 스팸메일이 아닐 가능성이 많으므로, 상기 사전 서비스 시스템(400)은 이를 고려하여 각 디렉토리 별로 Non-스팸메일 사전 및 스팸메일 사전을 미리 데이터베이스화하여 두고 있다.
다음, 상기 접속/전송부(106)는 상기 사전 서비스 시스템(400)으로부터 상기 사용자정보에 해당하는 제 2 Non-스팸메일 사전과 제 2 스팸메일 사전을 전송받으며, 또한 스팸메일 헤더에서 자주 사용되어지는 단어와 스팸메일 전송자의 정보를 담고 있는 스팸메일에 대한 힌트정보를 전송받을 수 있다(S 112). 또한 기업의 경우 조직도에 대한 정보사전을 추가로 전송받을 수 있다.
다음, 상기 제작부(108)는 제 1 스팸메일 사전과 제 1 Non-스팸메일 사전 및 상기 제 2 스팸메일 사전과 제 2 Non-스팸메일 사전을 합성하여 제 3 스팸메일 사전과 제 3 Non-스팸메일 사전을 제작한다(S 114).
다음, 상기 등록부(110)는 상기 사전 서비스 시스템(400)으로부터 전송된 힌트정보를 별도의 사전으로 등록한다(S 116).
다음, 상기 등록부(110)는 스팸메일 발신자를 스팸메일 발신자 리스트에 등록한다(S 118).
도 3은 본 발명의 스팸메일 자동분류용 사전의 갱신 방법의 각 단계를 개략적으로 도시하는 순서도이다.
먼저, 상기 갱신부(112)는 사용자 단말기(200)가 메일 시스템(300)에 로긴하는 경우 Non-스팸메일 또는 스팸메일 디렉토리를 제공한다(S 202).
다음, 상기 갱신부(112)는 상기 각 디렉토리에 오류판단 체크박스를 두어 사용자 단말기(200)로부터 잘못 분류된 메일에 대하여 오류체크 정보를 전송받는다(S 204).
다음, 상기 갱신부(112)는 상기 오류체크된 메일은 각각의 교정된 메일 디렉토리로 이동시킨다(S 206).
다음, 상기 분석부(104)는 교정된 디렉토리로 이동된 메일 각각에 대하여 메일 발신자와 메일 본문을 형태소 분석하여 사전을 구성할 단어를 추출한다(S 208).
다음, 상기 제작부(108)는 상기 추출된 단어를 기존의 Non-스팸메일 단어사전 또는 스팸메일 단어사전에 추가 등록하여 사전을 갱신한다(S 210). 단어가 사전에 이미 등록되어 있는 경우 횟수를 증가시키고 없으면 신규등록 시킴으로써 분류의 정확도를 높인다.
다음, 상기 등록부(110)는 오류체크에 의해 추가된 스팸메일 발신자 및 Non-스팸메일 발신자를 등록하여 스팸메일 발신자 리스트 및 Non-스팸메일 발신자 리스트를 갱신한다(S 212).
이상 본 발명을 양호한 실시예를 들어 설명하였으나 이는 발명의 이해를 위한 것이지 제한을 위한 것은 아님을 이해할 것이다. 또한 본 발명은 발명의 사상 및 범위를 벗어나지 않는 한도 내에서 본 발명이 속하는 기술 분야의 당업자에 의한 다양한 변형 및 수정이 가능함을 이해할 것이다.
상기한 바와 같은 본 발명의 구성에 의하면, 메일 발신자의 메일 본문을 근거로 수신된 메일이 스팸메일인지 여부를 판단할 수 있도록 하는 효과가 있다.
또한 본 발명은 수신자의 의도와는 관계없이 수신자가 필요로 하는 메일이 스팸메일로 판단되어 메일 수신이 금지될 가능성을 배제할 수 있다는 효과가 있다.
또한 본 발명은 스팸메일 발신자의 발신자 메일 어드레스 변경을 이용한 스팸메일 발송에 대해서도 스팸메일을 효과적으로 구분하여 낼 수 있다는 효과가 있다.
도 1은 본 발명의 스팸메일 자동분류용 사전 작성 시스템의 개략적인 구성도이다.
도 2는 본 발명의 스팸메일 자동분류용 사전 구성 방법의 각 단계를 도시하는 순서도이다.
도 3은 본 발명의 스팸메일 자동분류용 사전의 갱신 방법의 각 단계를 개략적으로 도시하는 순서도이다.

Claims (13)

  1. 체크부, 분석부, 접속/전송부, 제작부, 등록부를 포함하는 사전 구성 시스템 및 사용자 메일 시스템을 이용하여 사용자에 적합한 스팸메일 분류용 사전을 구성하는 방법에 있어서,
    상기 사전 구성 시스템은 스팸메일 자동분류용 사전을 구성하기 위하여 접속/전송부를 통하여 사용자 메일 시스템에 접속하고, 수신 메일 존재 여부를 체크부를 통하여 체크하는 제 1 단계;
    수신 메일이 존재하는 경우 상기 접속/전송부가 사용자 단말기로부터 상기 수신 메일에 대한 분류 정보 전송받는 제 2 단계;
    상기 분석부가 분석 모듈을 이용하여 상기 수신 메일의 단어를 형태소 분석하여 단어를 등록부에 등록하여 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전을 구성하는 제 3 단계;를 포함하는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법.
  2. 제 1 항에 있어서,
    상기 형태소 분석은 상기 각 수신 메일이 포함하고 있는 본문을 띄워쓰기 내지 각 품사 별로 각 문장을 쪼개는 방식에 의하여 각 형태소로 분리하는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법.
  3. 제 1 항에 있어서, 상기 제 3 단계의 등록은,
    분리된 각 형태소 중 소정 빈도 이상 형태소들이 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전에 리스트업되는 방식으로 등록되는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법.
  4. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,
    상기 제 2 단계는 상기 분류 정보에 의거하여 상기 등록부가 각 Non-스팸메일 및 스팸메일을 각 Non-스팸메일 디렉토리 및 스팸메일 디렉토리에 등록하여 두는 제 2-1 단계를 추가로 포함하고,
    상기 갱신부가 상기 사용자 단말기가 메일 시스템에 로긴하는 경우 Non-스팸메일 디렉토리 또는 스팸메일 디렉토리를 제공하는 제 4 단계;
    상기 갱신부가 상기 각 디렉토리에 오류판단 체크박스를 두어 사용자 단말기로부터 잘못 분류된 메일에 대하여 오류체크 정보를 전송받는 제 5 단계;
    상기 갱신부가 상기 오류체크된 메일은 각각의 교정된 메일 디렉토리로 이동시키는 제 6 단계;
    상기 분석부가 교정된 디렉토리로 이동된 메일들의 메일 발신자와 메일 본문을 형태소 분석하여 사전을 구성할 단어를 추출하는 제 7 단계;
    상기 제작부가 상기 추출된 단어를 상기 제 1 Non-스팸메일 단어사전 또는 제 1 스팸메일 단어사전에 추가 등록하여 사전을 갱신하는 제 8 단계;
    상기 등록부가 오류체크에 의해 추가된 스팸메일 발신자 및 Non-스팸메일 발신자를 등록하는 제 9 단계;를 추가로 포함하는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법.
  5. 체크부, 분석부, 접속/전송부, 제작부, 등록부를 포함하는 사전 구성 시스템, 사용자 메일 시스템 및 사전 서비스 시스템을 이용하여 스팸메일 분류용 사전을 구성하는 방법에 있어서,
    상기 사전 구성 시스템은 스팸메일 자동분류용 사전을 구성하기 위하여 접속/전송부를 통하여 사용자 메일 시스템에 접속하고, 수신 메일 존재 여부를 체크부를 통하여 체크하는 제 1 단계;
    수신 메일이 존재하는 경우 상기 접속/전송부가 사용자 단말기로부터 상기 수신 메일에 대한 분류 정보 전송받는 제 2 단계;
    상기 분석부가 분석 모듈을 이용하여 상기 수신 메일의 단어를 형태소 분석하여 단어를 등록부에 등록하여 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전을 구성하는 제 3 단계;
    상기 제 2 단계에서 기존 수신된 메일이 없거나 상기 제 3 단계에서 단어 등록이 끝난 경우에는 상기 접속/전송부가 미리 데이터베이스화된 사전을 제공하는 상기 사전 서비스 시스템에 접속하는 제 4 단계;
    상기 접속/전송부가 상기 사전 서비스 시스템으로 사용자정보를 전송하는 제 5 단계;
    상기 접속/전송부가 상기 사전 서비스 시스템으로부터 상기 사용자정보에 해당하는 제 2 Non-스팸메일 사전과 제 2 스팸메일 사전을 전송받는 제 6 단계;
    상기 제작부가 상기 제 1 스팸메일 사전과 제 1 Non-스팸메일 사전 및 상기 제 2 스팸메일 사전과 제 2 Non-스팸메일 사전을 합성하여 제 3 스팸메일 사전과 제 3 Non-스팸메일 사전을 제작하는 제 7 단계;를 포함하는 것을 특징으로 하는 사전 구성 방법.
  6. 제 5 항에 있어서, 제 6 단계는,
    상기 접속/전송부가 상기 사전 서비스 시스템으로부터 스팸메일 힌트정보를 전송받는 제 6-1 단계를 추가로 포함하는 것을 특징으로 하는 사전 구성 방법.
  7. 제 5 항에 있어서, 제 6 단계는,
    사용자가 기업인 경우 상기 접속/전송부가 상기 사전 서비스 시스템으로부터 기업의 조직도에 대한 정보사전을 추가로 전송받는 제 6-2 단계를 추가로 포함하는 것을 특징으로 하는 사전 구성 방법.
  8. 제 5 항에 있어서,
    상기 사용자는 기업 및 일반 사용자를 포함하며, 사용자가 기업일 경우에는 상기 사용자정보는 기업의 조직도 정보를 포함하며, 사용자가 일반 사용자일 경우에는 상기 사용자정보는 사용자의 나이, 연령, 취미를 포함하는 것을 특징으로 하는 사전 구성 방법.
  9. 제 5 항에 있어서,
    상기 형태소 분석은 각 메일이 포함하고 있는 본문을 띄워쓰기 내지 각 품사 별로 각 문장을 쪼개는 방식에 의하여 각 형태소로 분리하는 것을 특징으로 하는 사전 구성 방법.
  10. 제 5 항에 있어서, 상기 제 3 단계의 등록은,
    분리된 각 형태소 중 소정 빈도 이상 형태소들이 제 1 스팸메일 사전 또는 제 1 Non-스팸메일 사전에 리스트업되는 방식으로 등록되는 것을 특징으로 하는 스팸메일 분류용 사전 구성 방법.
  11. 제 5 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 등록부가 상기 사전 서비스 시스템으로부터 전송된 힌트정보를 별도의 사전으로 등록하는 제 8 단계를 추가로 포함하는 것을 특징으로 하는 사전 구성 방법.
  12. 제 5 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 등록부가 스팸메일 발신자를 스팸메일 발신자 리스트에 등록하는 제 9 단계를 추가로 포함하는 것을 특징으로 하는 사전 구성 방법.
  13. 제 5 항 내지 제 10 항 중 어느 한 항에 있어서,
    상기 제 2 단계는 상기 분류 정보에 의거하여 상기 등록부가 각 Non-스팸메일 및 스팸메일을 각 Non-스팸메일 디렉토리 및 스팸메일 디렉토리에 등록하여 두는 제 2-1 단계를 추가로 포함하고,
    상기 갱신부가 상기 사용자 단말기가 메일 시스템에 로긴하는 경우 Non-스팸메일 디렉토리 또는 스팸메일 디렉토리를 제공하는 제 10 단계;
    상기 갱신부가 상기 각 디렉토리에 오류판단 체크박스를 두어 사용자 단말기로부터 잘못 분류된 메일에 대하여 오류체크 정보를 전송받는 제 11 단계;
    상기 갱신부가 상기 오류체크된 메일은 각각의 교정된 메일 디렉토리로 이동시키는 제 12 단계;
    상기 분석부가 교정된 디렉토리로 이동된 메일들의 메일 발신자와 메일 본문을 형태소 분석하여 사전을 구성할 단어를 추출하는 제 13 단계;
    상기 제작부가 상기 추출된 단어를 상기 제 3 Non-스팸메일 단어사전 또는 제 3 스팸메일 단어사전에 추가 등록하여 사전을 갱신하는 제 14 단계;
    상기 등록부가 오류체크에 의해 추가된 스팸메일 발신자 및 Non-스팸메일 발신자를 등록하는 제 15 단계;를 추가로 포함하는 것을 특징으로 하는 사전 구성 방법.
KR10-2002-0044531A 2002-07-29 2002-07-29 스팸메일 자동분류용 사전 구성 방법 KR100473052B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2002-0044531A KR100473052B1 (ko) 2002-07-29 2002-07-29 스팸메일 자동분류용 사전 구성 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2002-0044531A KR100473052B1 (ko) 2002-07-29 2002-07-29 스팸메일 자동분류용 사전 구성 방법

Publications (2)

Publication Number Publication Date
KR20040011122A KR20040011122A (ko) 2004-02-05
KR100473052B1 true KR100473052B1 (ko) 2005-03-10

Family

ID=37319443

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2002-0044531A KR100473052B1 (ko) 2002-07-29 2002-07-29 스팸메일 자동분류용 사전 구성 방법

Country Status (1)

Country Link
KR (1) KR100473052B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100473051B1 (ko) * 2002-07-29 2005-03-10 삼성에스디에스 주식회사 스팸메일 자동분류 방법
KR100746049B1 (ko) * 2006-05-10 2007-08-06 에스케이 텔레콤주식회사 스팸 메시지 관리 시스템 및 방법과 이를 위한 이동통신단말

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040011121A (ko) * 2002-07-29 2004-02-05 삼성에스디에스 주식회사 스팸메일 자동분류 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040011121A (ko) * 2002-07-29 2004-02-05 삼성에스디에스 주식회사 스팸메일 자동분류 방법

Also Published As

Publication number Publication date
KR20040011122A (ko) 2004-02-05

Similar Documents

Publication Publication Date Title
US10911383B2 (en) Spam filtering and person profiles
US7359941B2 (en) Method and apparatus for filtering spam email
US7454470B1 (en) System and method for analyzing communications
US6421709B1 (en) E-mail filter and method thereof
US7421498B2 (en) Method and system for URL based filtering of electronic communications and web pages
US6023723A (en) Method and system for filtering unwanted junk e-mail utilizing a plurality of filtering mechanisms
US6732157B1 (en) Comprehensive anti-spam system, method, and computer program product for filtering unwanted e-mail messages
CN100527117C (zh) 在含多个反垃圾邮件模块的系统中确定消息的方法和系统
US8600965B2 (en) System and method for observing communication behavior
WO2008031871A1 (en) Method for automatically classifying communication between a sender and a recipient
CN101194277A (zh) 在基于对话的电子邮件系统中显示对话
CN101087259A (zh) 一种过滤国际互联网络中垃圾电子邮件的系统及其实现方法
WO2007071588A1 (en) Publication to shared content sources using natural language electronic mail destination addresses and interest profiles registered by the shared content sources
US9246860B2 (en) System, method and computer program product for gathering information relating to electronic content utilizing a DNS server
CN114143282A (zh) 邮件处理方法、装置、设备及存储介质
KR100473051B1 (ko) 스팸메일 자동분류 방법
KR100443695B1 (ko) 메일 분산관리 방법 및 이를 위한 시스템
KR100473052B1 (ko) 스팸메일 자동분류용 사전 구성 방법
EP3143731B1 (en) Digital messaging system
US8375089B2 (en) Methods and systems for protecting E-mail addresses in publicly available network content
KR100460420B1 (ko) 자체 정규 방식의 스팸메일 여과 방법
KR20030077789A (ko) 인터넷상의 이-메일 관리 시스템
Chim To build a blocklist based on the cost of spam
Takashita et al. A spam filtering method learning from Web browsing behavior
Schryen The empirical analysis of the abuse of e-mail addresses placed on the Internet

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130108

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20140103

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20141231

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20151228

Year of fee payment: 12

LAPS Lapse due to unpaid annual fee