KR100496767B1

KR100496767B1 - 유알엘 패턴 매칭 방법을 이용한 전자 메일 차단 방법

Info

Publication number: KR100496767B1
Application number: KR10-2002-0045993A
Authority: KR
Inventors: 황건순
Original assignee: (주)이월리서치
Priority date: 2002-08-03
Filing date: 2002-08-03
Publication date: 2005-06-23
Also published as: KR20040013180A

Abstract

본 발명은 인터넷 및 무선망 등과 같은 통신망을 통하여 전달되는 전자 메일 중, 수신자의 의도와 무관하게 무분별하게 전송되는 광고성 메일이나 스팸메일 등을 차단하기 위한 방법에 관한 것으로서, 메일의 헤더와 본문을 분석하여 URL을 추출해, 이를 이미 저장된 데이터베이스 또는 외부 경로 등을 참조하여 해당되는 내용이 들어 있는 경우에 수신자가 받고 싶지 않은 메일로 분류하여 수신을 차단한다.

Description

유알엘 패턴 매칭 방법을 이용한 전자 메일 차단 방법{EMAIL BLOCKING ALGORITHM BASED ON URL PATTERN MATCHING METHOD}

본 발명은 전자 메일 차단 방법에 관한 것으로, 특히 인터넷 통신망을 통해 사용자의 동의없이 발송되는 메일인 스팸메일을 구별하고 사용자의 목적에 따라 걸러내거나 차단하기 위한 방법에 관한 것이다.

도1은 인터넷 상에서 송신자와 수신자간의 이메일 전달 방식을 보여준다. 송신자는 자신이 사용하는 메일 클라이언트인 MUA(Mail User Agent)에 이메일 전송을 의뢰하면 송신측 메일서버인 MTA(Mail Transfer Agent)를 이용하여 수신자에게 메일을 발송하고, 송신측 메일서버는 이를 SMTP 프로토콜을 이용하여 수신측 메일서버에 전달하게 되어, 수신자의 메일클라이언트는 이를 POP3/IMAP/CGI 프로토콜 등을 통하여 수신자의 메일 사서함으로부터 수신된 메일을 가져오게 된다.

도2는 기존에 사용되고 있는 스팸메일 필터링 방식의 프로세스 개념도이다. 먼저 수신된 메일(201)에서 Header와 Body를 분리해 내고(202), 분리된 Header정보 중의 송신자 주소, 송신경로 등을 분석하여 패턴DB(M220)와 비교하는 Header 패턴검사(203)를 실시한다. 다음으로 Body에 포함되어 있는 Content를 분리(204)하게 되고 각 content부분에서 다시 패턴DB(M220)에서 일치하는 구문이 있는 지를 파악하는 Body 패턴검사(205)를 실시한다. 이후, Body의 Content부분에서 text부분을 추출하고(206), 이 부분을 해석 가능한 문자로 재 변환하기 위하여 Decode 실시(207)와 Character Set변환(208) 단계를 거친 후, Text의 패턴을 패턴DB(M220)와 비교 검사하는 Text 패턴검사(209)를 실시한다. 각 조건 단계인 패턴 검사 단계(203, 205, 209)에서 패턴DB(M220) 내에서 일치하는 구문이 발견되면 해당 메일을 수신을 원치 않는 메일로 분류하여 수신을 차단(211)하고, 일치되는 구문이 없으면 메일을 정상적으로 수신(210)하게 되어 수신자의 MUA로 가져오게 된다.

이러한 기존 방법으로는 스팸메일 발송자로부터 스팸메일을 효율적으로 차단 또는 구분하는 것이 원천적으로 불가능한데 그 이유는 다음과 같다. 먼저 RFC822: Standard for ARPA Internet Text Messages에 기술되어 있는 형식으로 기록되는 헤더는 신뢰성이 없으며 송신자가 목적하는 의도대로 내용을 만들 수 있기 때문에 단순한 패턴 검사 방식으로는 스팸메일을 정확히 걸러내는 것이 어렵다. 예를 들어, 헤더 상의 송신자(From: )를 가지고 분류하는 경우 보내는 사람이 계속 임의의 내용으로 바꾸어 보낸다면 분류할 방법이 없는 것이다. 이와 비슷하게 Header정보에 기록되어 있는 발신 경로로 메일을 분류하거나 차단하는 방법 역시, 송신자의 의도 대로 송신자의 주소, 송신자가 사용한 메일 서버의 주소 또는 배달 경로 상의 서버 주소를 배달에 관계하는 표준 규약인 RFC 821에 의거하여 얼마든지 바꿀 수 있으므로 적용되기 어렵다. 제목 또는 본문 등의 Body정보에 특정 구문을(예: 광고) 포함하는 경우를 차단하는 경우에도, 이러한 구문을 쉽게 감지 못하도록 중간에 문자를 삽입하는 경우 (예: 광***고) 및 한자로 쓰는 경우 등 그 표현이 다양하여 이러한 경우를 모두 감지하는 것은 무리가 있다. 본문의 Text를 검사하는 경우도 비슷한 의미나 연상되는 의미를 가지는 단어로 대체해서 쓰기 때문에 차단의 어려움이 많으며, 요즘은 본문에 그림을 포함할 수 있기 때문에 아예 그림으로 문장을 표현하는 경우도 허다하기 때문에 스팸메일의 차단에 어려움이 많다.

본 발명은 스팸메일이 가지는 본질적인 측면, 즉 스팸메일이 다수에게 발송자의 의도를 알려 발송자의 웹사이트에 수신자를 접속하도록 유도하고자 하는 의도를 가지고 있다는 측면을 고찰하여 고안된 효율적인 전자메일 차단 방법이다. 즉, 송신자의 의도에 따라 조작 가능한 정보를 단순한 구문의 패턴 검사 방법에 따라 걸러내는 기존 방식이 아닌, 스팸메일을 발송하는 송신자가 반드시 메일 내에 포함시켜야 하는 정보인 URL을 추출하여 차단 목록과 비교하는 방법을 사용한다는 것이 본 발명의 핵심 원리이며, 이를 이용한 스팸메일 차단기술을 수신측의 MTA 또는 MUA에 적용하여 수신자가 수신하게 되는 스팸메일의 숫자를 비약적으로 감소시키는 것이 본 발명의 목적이다.

이하 본 발명의 실시예를 첨부된 도면을 참조하여 설명한다.

도3은 본 발명의 원리를 이해하기 위하여 제시하는 일반적인 이메일의 구성을 보여준다. 수신된 이메일(300)을 부분으로 분석하면 크게 Header(310)와 Body (320)로 분리될 수 있으며, Body(320)는 다시 Message부분(321)과 여러 개의 content를 보유한 Contents 부분(322)으로 나뉠 수 있다. Contents 부분(322)은 주로 첨부 파일 등을 의미하며 여러 개의 content를 가질 수 있으며, Message 부분(321)은 text/plain(331) 형식 또는 text/html(332) 형식으로 구성된다. 메일에 따라서는 Contents 부분(322)이 존재하지 않을 경우도 있으며, text/plain(331)과 text/html(332)을 동시에 포함하고 있거나 text/plain(331) 또는 text/html(332) 형식 중 어느 하나의 단독으로만 구성되어 있을 경우가 있다. 본 발명은 수신된 메일에서 도1에서 제시된 text/plain(331)과 text/html(332) 및 Contents(322) 부분을 분리 추출하여 분석하는 것으로부터 기능하기 시작한다.

도4는 본 발명의 바람직한 실시 예에 따른 기능 모듈의 구성도를 보여준다. 먼저 메일 서버에 메일이 도착하게 되어 메일이 수신되면(400), 최초로 해당 수신메일(400)의 Header와 Body를 분리(410)함으로써 메일에 대한 분석을 시작한다. 이렇게 분리되어 얻어진 Body 부분을 다시 Message와 Contents 부분으로 분리(402)하고, 분리된 메일의 Message부분이 모두 text/plain 형식으로만 이루어져 있는 것인지를 검사(403)하게 된다. 만일 모두 text/plain 형식으로만 구성된 경우에는 Decode를 실시(411)하고 이를 다시 Character Set 변환(421) 작업을 거쳐 문장해석기(440)를 통과하여 문장을 검색하고 및 URL을 추출(450)해 내는 순서를 따르게 된다. 만일 text/plain으로만 이루어져 있는 지를 검사하는 단계(403)에서 text/plain형식 이외의 text/html형식 부분도 포함되어 있을 경우에는 해당 내용을 Decode하는 단계(410)를 거쳐 Character Set을 변환(420)하고 html의 구문을 해석하여 Anchor를 추출(430)하고 이로부터 URL을 추출(450)하게 된다. 이렇게 추출된 URL구문을 차단 목록이 담겨져 있는 Custom DB (M473)와 이미 알려져 있는 차단 목록인 Pre-made DB(M472) 및 외부와의 직접연결(M471)작업을 통하여 비교하게 되고(470), 비교 대상 구문이 목록에 있을 경우에는 메일을 차단 대상 메일로 간주하여 차단(480) 하며 그렇지 않을 경우에는 정상 수신(490)을 허용하게 된다.

도4의 각 모듈의 정의와 해당 모듈에서 수행되는 기능을 상세히 알아보면 다음과 같다.

본 발명의 바람직한 실시 예에서 Header/Body분리기(401)는 수신메일(400)을 분석하여 메일을 Header와 Body 부분으로 분리하는 기능을 한다. 일반적으로 많이 사용되는 메일의 원문 형태는 다음과 같다.헤더 From : FromName <from@address.com> To : ToName <to@address.com> Subject: Mail Subject바디 Plain text mail.한편, 최근 MIME에서의 단문 메일의 형태는 다음과 같으며, 역시 헤더 부분과 바디 부분으로 구분할 수 있다.헤더 From : FromName <from@address.com> To : ToName<to@address.com> Subject : Mail Subject MIME-Version : 1.0 Content-Type : text/plain바디 Plain text mail. Single content

본 발명의 바람직한 실시 예에서 Message/Contents 분리기(402)는 Header/Body 분리기(401)에 의하여 분리된 메일의 Body 부분을 분석하여 Message 부분과 Contents 부분을 분리해 내는 기능을 하는 모듈로서, Message 부분은 text/plain 형식 또는 text/html 형식 등이 있는지를 검사 및 분리하고, Contents 부분은 여러 개의 content로 구분해 내는 기능을 한다.즉, plain text와 html 텍스트를 모두 구비하고 첨부 파일이 있는 경우 아래와 같은 메일 형식을 지니게 된다. From: FromName <from@address.com> To : ToName <to@address.com> Subject : Mail Subject MIME-Version : 1.0 Content-Type : multipart/alternative; boundary= "boundary" -- boundary Content-Type : text/plain; Plain text --boundary Content-Type : text/html; name= "test.html" Content-Disposition : attachment; filename = "test.html" <HEAD> <BODY> Attached Html Text </BODY> </HEAD> --boundary--

본 발명의 바람직한 실시예에서 Decode 수행기(410, 411)는 encode된 이메일을 판독 가능한 형태로 변환하기 위하여 decode하는 기능을 한다. 일반적으로 이메일은 발송자가 발송할 때, MTA에서 8bit, quoted-printable, base64 등의 기준에 따라 변환하여 발송되게 되는 데 이를 encode라 하며, 수신자 측에서 이를 재해석하기 위해 다시 원문상태로 풀어내는 것을 decode라 한다.

본 발명의 바람직한 실시예에서 Character Set 변환기(420, 421)는 decode된 이메일의 character set을 변환시켜 주는 기능을 한다. 이메일에 영어가 아닌 문자가 사용되었을 경우 등에는 decode 과정을 거친 후에도 이메일 내용이 판독 불가능한 형태를 지니고 있게 된다. 예를 들어, 한글의 경우 euc-kr, iso-2022kr 등의 character set을 이용하여 메일이 전송되는데, 이렇게 전송되어 판독 불가능한 이메일의 character set을 다시 변환하여 주어야 판독 가능한 문자로 식별될 수가 있다.

본 발명의 바람직한 실시예에서 Anchor추출기(430)는 html 문서 내에 URL이 포함될 수 있는 부분을 분리해 내어 Anchor코드 부분 등을 제외한 URL 부분만을 찾아내는 기능을 한다. html형식 문서 내에서 URL이나 이메일 주소가 포함될 수 있는 부분으로는 특정 anchor 및 java script 등이 해당된다. 일반적으로 anchor 중에 URL이 포함될 수 있는 것으로는 A HREF, Form Action, Object 태그 등이 있으며 이메일 주소가 포함될 수 있는 것으로는 mailto: 태그가 있다. anchor이외에도 java script의 windowsopen: 등과 같은 부분에도 URL이 포함된다.

본 발명의 바람직한 실시 예에서 문장해석기(440)는 text/plain 형식의 이메일에서 URL을 추출해 내는 기능을 한다. 문장해석기(440)는 URL이나 이메일 주소를 추출해 내기 위하여, 문장 중 특정단어가 포함되거나 특정단어로 시작하는 구문을 추출해 낸다. 예를 들어, http:// 또는 www.로 시작하거나 포함된 구문, 그리고 @가 들어가는 구문이 이에 해당된다.예를 들어서, http 또는 https를 동반하는 형태로 http://www.address.com 의 형식이 있고, 주소만 사용하는 경우 www.address.com이 있다. 또한, html 태그를 강제로 사용하는 경우가 있는데, <A HREF = "http://www.address.com"으로 나타나게 된다.

본 발명의 바람직한 실시 예에서 URL패턴추출기(450)는 URL로 추정되는 구문에서 패턴 비교를 원하는 부분을 추출하고 패턴비교가 용이하도록 다양한 형태로 가공하고 저장하는 기능을 수행하는 기능을 한다. URL패턴추출기(450)는 Anchor추출기(430)나 문장해석기(440)를 통하여 추출된 URL 구문 전체 또는 구문 상에 포함되어 있는 특정 인수(argument), 또는 특정한 디렉토리 구조를 포함한 구문 형태로 URL 구문을 재 가공하며 이를 데이터베이스로 저장하게 된다. 이메일 구문 역시 추출하여 데이터베이스로 저장한다.Html에서 URL이 나타나는 형식으로는, 태그에서 인수값을 지정하는 경우가 있는데, 예를 들어서 <A HREF = "http://www.address.com" 또는 <IMG SRC = "http:// www.address.com" 이 있다. 또한, 스크립트에 문자열로 지정될 수 있는데, var a = "http://www.address.com" 가 있을 수 있다.또한, 태그 이외에 플레인 텍스트와 비슷한 형태로 <BR>http://www.address .com 으로 지정할 수 있다.

본 발명의 바람직한 실시예에서 URL패턴매칭분석기(470)는 비교하기 위하여 추출된 URL 이나 이메일 주소를 이미 저장되어 있거나 알려져 있는 데이터와 비교하여 매칭되는 지를 분석하는 기능을 수행한다.이 때에, URL 패턴 매칭 분석기(470)는 기본 주소 형태 이외에도 아래에 열거한 변형된 형태의 URL을 추출하게 된다.(1) 기본 주소만 있는 형태 http://www.address.com(2) 주소를 임의적으로 변경하는 형태 http://any.address.com http://random.address.com(3) 상세 주소를 사용하는 형태 http://www.address.com/test.thm(4) 인수를 동반하는 형태 1 http://www.address.com/test.htm?a=1(5) 인수를 동반하는 형태 2 http://www.address.com?a=1(6) 하위 디렉토리를 변경하는 형태 http://www.address.com/any/test.htm http://www.address.com/random/test.htm(7) 하위 상세부분을 변경하는 형태 http://www.address.com/any/test.htm http://www.address.com/any/test1.htm(8) 3자 전달형태 http://www.common.com.redir?http://www.address.com(9) 게시판 자료실 등을 이용하는 형태 http://www.address.com/board/data/1.jpg

본 발명의 바람직한 실시예에서 외부 직접 연결(M471) 방식은, URL 패턴 매칭 분석기(470)가 URL을 비교하기 위한 참조값을 얻는 기능을 수행한다. 예를 들면, robot이나 spider 등의 프로그램을 이용하여 인터넷 상의 웹사이트들에 접속하여 'PICS값'을 추출한 후, 특정 PICS 값을 포함한 웹사이트를 유해 사이트로 판단하고 해당 웹사이트의 URL값을 URL 패턴 매칭 분석기(470)에게 전달해주는 실시간(real time)방식의 참조값 질의 방식을 이용할 수 있다. 이 때, 일정 기간 주기적으로 검사한 URL값을 데이터베이스로 저장해 놓는 배치(batch) 방식을 적용할 수도 있다. (PICS값이란 미국의 사이트 등급에 따른 표준권고안에 따른 값을 의미한다)

본 발명의 바람직한 실시예에서 Pre-made DB(M472)란, 유해 사이트로 등록되거나 또는 스팸메일을 대량으로 발송한 경험이 있는 사이트 등의 URL을 저장한 데이터베이스 등으로 이미 스팸메일을 발송하는 URL로 인지되어 타 기관, 법인 또는 개인 등이 제공하는 목록을 의미한다. 국내의 경우를 예를 들면, 정보통신부에서 공개하는 청소년유해사이트 목록이 담긴 데이터베이스가 이에 해당된다.

본 발명의 바람직한 실시 예에서 Custom DB(M473)란, 전자메일차단기를 설치한 서버의 관리자 또는 전자메일차단기의 적용을 받는 사용자가 직접 구축한 스팸메일 발송사이트의 URL 패턴이 담긴 데이터베이스를 의미한다.

도5는 본 발명의 바람직한 실시예에 따라 전자 메일 차단기를 MTA 또는 MUA에 설치한 설치 구성도이다. 메일이 수신측의 MTA에 수신(500)되면, 수신측MTA (510)는 새로운 메일이 도착하였음을 전자 메일 차단기(520)에 알림과 동시에 분석을 의뢰(511)하게 된다. 전자 메일 차단기(520)는 해당 메일의 내용을 분석하여 URL패턴을 추출하게 되며 이 패턴을 기존 DB와 패턴 매칭을 실시하게 된다. 매칭되는 URL패턴이 존재하게 될 경우에는 스팸 메일로 간주하여 해당 이메일을 스팸메일로 분류처리(530)하게 되고, 매칭되는 URL패턴이 존재하지 않을 경우에는 해당 메일을 다시 정상적으로 MTA(510)가 처리할 수 있도록 되돌려 준다. 이후 수신자가 사용하는 MUA가 해당 메일을 불러오도록 MTA(510)에 요청하게 될 때 POP3/IMAP/CGI 등의 프로토콜에 따라 MUA의 메일 보관함으로 메일이 전송되게 된다. 또한, 이러한 전자 메일 차단기를 MUA(540)에도 설치할 수 있는데, 이렇게 설치된 전자 메일 차단기(U511)는 MTA에 설치된 전자 메일 차단기(511)와 마찬가지의 기능을 MUA(540)에 수행하게 된다. 이렇게 MTA에 설치된 전자 메일 차단기(511) 또는 MUA에 설치된 전자 메일 차단기(U511)에 의하여 스팸메일이 제거된 메일리스트를 최종적으로 수신자가 확인(550)하게 된다.전술한 내용은 후술할 발명의 특허 청구 범위를 보다 잘 이해할 수 있도록 본 발명의 특징과 기술적 장점을 다소 폭넓게 개설하였다. 본 발명의 특허 청구 범위를 구성하는 부가적인 특징과 장점들은 이하에서 상술될 것이다. 개시된 본 발명의 개념과 특정 실시예는 본 발명과 유사 목적을 수행하기 위한 다른 구조의 설계나 수정의 기본으로 즉시 사용될 수 있음이 당해 기술 분야의 숙련된 사람들에 의해 인식되어야 한다.또한, 본 발명에서 개시된 발명 개념과 실시예가 본 발명의 동일 목적을 수행하기 위하여 다른 구조로 수정하거나 설계하기 위한 기초로서 당해 기술 분야의 숙련된 사람들에 의해 사용되어질 수 있을 것이다. 또한, 당해 기술 분야의 숙련된 사람에 의한 그와 같은 수정 또는 변경된 등가 구조는 특허 청구 범위에서 기술한 발명의 사상이나 범위를 벗어나지 않는 한도 내에서 다양한 변화, 치환 및 변경이 가능하다.

본 발명은 수신된 메일을 분석하여 스팸메일을 효과적으로 분류해 낼 수 있는 URL추출방식 및 URL패턴매칭필터링 방식에 관한 것이다. 스팸메일 내에는 수신자의 웹사이트 접속을 이끌어 내기 위한 URL이 포함된다. 따라서 메일 내에 있는 특정 문구를 찾아내어 필터링 하는 종래 방법 대신, 메일을 부분별로 분석하여 text/plain형식 부분과 html/plain형식 부분만을 따로 추출하여 각 부분의 내용에서 URL만을 추출하여 URL에 따른 패턴매칭을 실시하는 방법을 취할 경우 스팸 메일 차단율을 획기적으로 개선할 수 있다. URL추출 및 URL패턴매칭필터링 방식이 적용될 경우에는, 스팸메일 송신자가 메일의 header정보를 조작하여 발송경로나 발송자 등의 명의를 조작하는 경우나, 제목이나 본문에 필터링에 걸릴 수 있는 문구를 의도적으로 배제 또는 조작하는 경우, 또는 본문 전체를 그림파일로 대체하는 경우 등 기존 필터링 방식을 피해나가고자 하는 스팸메일 발송자의 의도를 원천적으로 차단할 수 있다. 또한, 스팸메일을 발송한 것으로 파악된 사이트의 URL 패턴을 DB화 하여 관리자 또는 사용자 개인의 패턴 업데이트와 삭제가 가능하도록 해 줌으로써, 스팸메일 발송 사이트로 한번만 등록해 놓으면 해당 사이트로부터의 스팸으로부터 원천적으로 차단할 수 있으며, 사용자 개인에 따른 필터링 적용 조건의 세부설정을 가능하게 할 수 있는 유연성도 있다. URL추출방법은 URL별, URL을 포함한 디렉토리 구조별, 그리고 URL에 포함된 특정 인수(argument)별로 추출하는 방법을 사용하므로 메일 내의 URL에 나타난 전체 디렉토리 경로를 저장하여 특정 문구로 인식하는 기존 문구 매칭 검사 방법보다 훨씬 효율적이다. 또한, 본 발명에서 제시하는 장치를 수신자 측의 MTA나 MUA에 설치함으로써 서버단위 또는 메일클라이언트 프로그램 단위에서, 기존에 사용하는 서버 프로그램의 변경 없이 간단한 설치와 설정으로만 관리할 수 있는 편이성이 있다.

도1은 종래 기술에 따른 이메일 소통 개념도.

도2는 종래 기술에 따른 문구 필터링 방식의 전자메일 차단 프로세스 개념도.

도3은 일반적인 이메일의 구성 요소 개념도.

도4는 본 발명에 따라 URL추출과 URL패턴 매칭 분석을 적용한 전자 메일 차단기의 기능 모듈 구성도.

도5는 전자 메일 차단기의 서버 설치 구성도.

Claims

네트워크를 통해 전송되는 이메일에 대해 스팸 여과를 하는 방법에 있어서,

(a) 수신된 이메일에 대해서 상기 이메일을 파싱(parsing) 과정을 통해 헤더(310)와 바디(320)로 분리하여 식별하고, 상기 바디(320)는 다시 메시지(321)와 컨텐츠(322)로 분리하여 추출하는 단계;

(b) 상기 메시지(321) 부분은 text/plain 형식(331) 또는/및 text/html 형식(332)이 있는지를 검사 및 분리하고, 컨텐츠(322) 부분은 여러 개의 컨텐츠로 구분하는 단계;

(c) 상기 메시지(321) 중 text/plain 형식(331)에 대해서는, 송신측 메일서버가 인코딩한 규약에 따라 원문 상태로 디코딩하고, 판독 가능하도록 디코딩된 텍스트를 캐릭터 변환한 후, 변환된 텍스트에 대해 파싱 과정을 통해 http:// 또는 https, www.로 시작하거나 포함된 구문, html 태그를 강제적으로 사용하는 구문의 인수, 이메일이 포함될 수 있는 @ 문자가 들어가는 구문 등을 파싱함으로써 URL을 추출하는 단계;

(d) 상기 메시지(321) 중 text/html 형식(332)에 대해서는, 송신측 메일 서버가 인코딩한 규약에 따라 원문 상태로 디코딩하고, 판독 가능하도록 디코딩된 텍스트를 캐릭터 변환한 후, 변환된 html 문서에서 A HREF, FORM ACTION, OBJECT 태그가 포함된 구문의 인수와 같은 특정 앵커(anchor)로부터 URL을 추출하거나, 자바 스크립트의 windows.open 코드를 포함하는 구문을 파싱하여 URL을 추출하는 단계; 및

(e) 상기 단계 (c) 및 (d)에서 추출한 URL을, 유해 사이트 또는 스팸 메일 발송 사이트로 분류하여 저장하고 있는 URL 목록이 담긴 데이터베이스와 비교해서 검사하는 단계;

(f) 상기 단계 (c) 및 (d)에서 추출한 URL을, 사용자가 직접 관리하는 URL 패턴이 담긴 데이터베이스와 비교해서 검사하는 단계;

(g) 상기 단계 (c) 및 (d)에서 추출한 URL의 해당 웹사이트를 직접 접속하여 PICS 값 등 사이트 등급과 관련된 정보를 실시간으로 추출하여 검사하는 단계

를 포함하는 스팸 메일 필터링 방법.
삭제
삭제
삭제
삭제
삭제
삭제