KR100614751B1 - 스팸 차단 규칙 생성 방법 - Google Patents
스팸 차단 규칙 생성 방법 Download PDFInfo
- Publication number
- KR100614751B1 KR100614751B1 KR1020040065711A KR20040065711A KR100614751B1 KR 100614751 B1 KR100614751 B1 KR 100614751B1 KR 1020040065711 A KR1020040065711 A KR 1020040065711A KR 20040065711 A KR20040065711 A KR 20040065711A KR 100614751 B1 KR100614751 B1 KR 100614751B1
- Authority
- KR
- South Korea
- Prior art keywords
- rule
- spam
- message
- messages
- rules
- Prior art date
Links
- 230000000903 blocking effect Effects 0.000 title claims abstract description 167
- 238000000034 method Methods 0.000 title claims abstract description 69
- 238000012545 processing Methods 0.000 claims description 22
- 238000012937 correction Methods 0.000 claims description 9
- 239000000284 extract Substances 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 5
- 238000001914 filtration Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/21—Monitoring or handling of messages
- H04L51/212—Monitoring or handling of messages using filtering or selective blocking
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
스팸 메시지로 분류된 메시지가 저장되어 있는 스팸풀(spam pool)과, 일반 메시지로 분류된 메시지가 저장되어 있는 일반 풀(pool)을 사용하여 스팸 차단 규칙을 생성하는 방법이 제공된다. 스팸풀에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성한다. 이후에 현재 차수의 규칙 중에서 스팸풀에 있는 메시지를 하나도 차단하지 못하는 규칙을 제거하고, 남아있는 현재 차수의 규칙 중에서 일반풀에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록하고, 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸풀에서 제거한 다음에, 스팸풀에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하는 단계를 스팸풀에 남아있는 메시지의 수가 소정의 수 이하가 될 때까지 반복한다. 한편, 스팸 차단 규칙에 의해 일반 메시지로 분류된 수신메시지를 사용자가 스팸 메시지로 등록하거나 그 반대의 경우에는 해당 수신메시지를 사용하여 스팸 차단 규칙을 정정한다.
스팸, 메일, 메시지, 문자메시지, 차단, 생성, 갱신, 메일함, 메시지함, 규칙
Description
도 1은 본 발명의 스팸 차단 규칙 생성 방법을 수행하기 위한 스팸 차단 규칙 생성 시스템을 개략적으로 보여주는 블록도이다.
도 2는 본 발명의 스팸 차단 규칙 생성 절차를 보여주는 흐름도이다.
도 3은 본 발명의 스팸 차단 규칙 생성 방법에 따라 각 차수의 규칙이 생성되고 스팸 차단 규칙으로서 등록되거나 제거되는 예를 보여주는 도면이다.
도 4는 스팸 차단의 예외 규칙을 생성하는 절차를 보여주는 흐름도이다.
도 5는 본 발명의 스팸 차단 규칙 생성 방법을 수행하기 위한 스팸 차단 규칙 생성 시스템 및 생성된 스팸 차단 규칙에 따라서 문자메시지를 처리하는 문자메시지 처리 시스템을 개략적으로 보여주는 블록도이다.
도 6은 도 5의 시스템에서의 문자메시지 처리 및 스팸 차단 규칙 갱신 절차를 보여주는 흐름도이다.
도 7은 스팸 차단 규칙에 의해 일반 메시지로 분류된 메시지를 사용자가 스팸 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차를 보여주는 흐름도이다.
도 8은 스팸 차단 규칙에 의해 스팸 메시지로 분류된 메시지를 사용자가 일반 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차의 일예를 보여주는 흐름도이다.
도 9는 스팸 차단 규칙에 의해 스팸 메시지로 분류된 메시지를 사용자가 일반 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차의 다른 예를 보여주는 흐름도이다.
< 도면의 주요 부분에 대한 부호의 설명 >
100 스팸메시지 차단규칙생성엔진, 110 스팸풀
120 일반풀 130 스팸차단규칙 데이터베이스,
200 단문메시지 처리엔진, 210 스팸메시지 보관함,
220 일반메시지 보관함.
본 발명은 스팸 차단 규칙 생성 방법에 관한 것으로서, 특히 광고성 문자메시지나 전자우편 등을 차단할 수 있는 스팸 차단 규칙을 자동적으로 생성하고 갱신하는 방법에 관한 것이다.
문자메시지나 전자우편의 사용이 늘어나면서 무차별적으로 대량으로 발송되는 스팸 메일(spam mail) 또는 스팸 메시지가 사회적인 문제로 대두하고 있다. 이 를 차단하기 위하여 특정 발송인으로부터의 메일 또는 메시지를 차단하도록 하거나, 또는 특정 단어를 포함하는 메일 또는 메시지를 차단하도록 하거나 하는 등의 다양한 방법이 도입되고 있다.
그러나, 스팸 메일을 마치 일반 메일인 것처럼 보이도록 하기 위한 다양한 수법이 수시로 바뀌기 때문에 사용자들의 스팸 차단 노력이 허사로 되는 경우가 비일비재하다. 또한, 수시로 바뀌는 스팸 메일의 형태에 대처하기 위하여 사용자들 또는 메일 시스템 관리자들이 일일이 스팸 차단 규칙을 갱신해야 하는 불편함이 있다.
본 발명은 이러한 점을 감안하여 이루어진 것으로서, 스팸 메시지로 분류된 메시지들과 일반 메시지로 분류된 메시지들로부터 자동적으로 스팸 메시지 차단 규칙을 생성하는 방법을 제공하는 것을 목적으로 한다.
본 발명의 다른 목적은, 스팸 메시지 차단 규칙을 통과하여 일반 메시지함으로 배달된 메시지를 사용자가 스팸 메시지함으로 이동시키거나, 또는 스팸 메시지 차단 규칙에 의해 스팸 메시지로 분류된 메시지를 사용자가 일반 메시지함으로 이동시키는 등과 같이 스팸 메시지 차단 규칙에 오류가 발생한 경우에는 자동으로 규칙을 정정할 수 있는 방법을 제공하는 것이다.
본 발명에서는 스팸 메시지로 분류된 메시지가 저장되어 있는 스팸풀(spam pool)과, 일반 메시지로 분류된 메시지가 저장되어 있는 일반 풀(pool)을 사용하여 스팸 차단 규칙을 생성한다. 본 발명의 스팸차단규칙 생성방법은, 스팸풀에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제1단계와, 현재 차수의 규칙 중에서 스팸풀에 있는 메시지를 하나도 차단하지 못하는 규칙을 제거하는 제2단계와, 남아있는 현재 차수의 규칙 중에서 일반풀에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록하고, 해당 규칙을 제거하는 제3단계와, 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸풀에서 제거하는 제4단계와, 스팸풀에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하고, 스팸풀에 남아있는 메시지의 수가 소정의 수 이하이면 스팸 차단 규칙 생성을 종료하는 제5단계와, 생성된 다음 차수의 규칙을 사용하여 제2단계부터 반복하는 제6단계를 구비한다.
1차 규칙의 생성은, 스팸풀에 있는 메시지에 포함된 내용 중에서 한글 문장에 대해서는 조사를 제거한 단어를 추출하고, 영어 문장에 대해서는 전치사와 관사를 제외한 단어를 추출함으로써 이루어질 수 있다.
소정의 수는 임의의 수로 정할 수도 있고, 0으로 정할 수도 있다. 소정의 수가 0인 경우에는 스팸풀에 메시자가 남지 않을 때까지 위 절차가 반복된다.
다음 차수의 규칙의 생성은, 스팸풀에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙에 포함된 단어들을 낱개로 분리한 다음에, 남아 있는 현재 차수의 규칙과 분리된 단어를 곱(AND) 논리로 조합함으로써 이루어질 수 있다.
제3단계는, 남아있는 현재 차수의 규칙의 각각에 대해서, 일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 없는 경우에는 해당 규칙을 스팸 차단 규칙으로 등록하고 해당 규칙을 제거하는 제3-1단계와, 일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 있는 경우에는, 해당 규칙으로 차단되는 메시지 전체에 대해서 적용 가능한, 해당 규칙을 제외한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 상기 해당 규칙을 스팸 차단 규칙으로 등록하고 상기 공통규칙을 상기 해당 규칙에 대한 예외조건으로서 등록하며 상기 해당 규칙을 제거하는 제3-2단계를 적용함으로써 이루어질 수 있다.
이때, 제3-2단계는 해당 규칙으로 차단되는 메시지의 수가 2 이상인 경우에 수행하는 것이 바람직하다. 또한, 제3-2단계는, 일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 있는 경우에는 해당 규칙으로 차단되는 메시지들로부터 추출된 단어를 사용하여 소정 차수 이하의 규칙을 생성하는 단계와, 생성된 상기 소정 차수 이하의 규칙 중에서 상기 메시지들을 모두 차단할 수 있는 공통규칙이 있는지를 확인하는 단계와, 상기 메시지들을 모두 차단할 수 있는 공통규칙이 있는 경우에는, 상기 해당 규칙을 스팸 차단 규칙으로 등록하고 상기 공통규칙을 상기 해당 규칙에 대한 예외조건으로서 등록하며 상기 해당 규칙을 제거하는 단계를 포함할 수 있다.
한편, 제5단계에서 스팸풀에 남아있는 메시지의 수가 소정의 수 이하이거나 현재의 차수가 소정 차수 이상인 경우에 스팸 차단 규칙 생성을 종료하도록 하는 것도 가능하다.
본 발명에 의하면 스팸 차단 규칙을 갱신하는 방법이 제공된다. 스팸차단규칙의 갱신절차는, 스팸 차단 규칙을 로딩하는 제1단계와, 상기 스팸 차단 규칙에 의해 일반 메시지로 분류된 수신메시지를 사용자가 스팸 메시지로 등록하는 경우에는 해당 수신메시지를 사용하여 스팸 차단 규칙을 정정하는 제2단계를 포함한다.
제2단계의 스팸 차단 규칙의 정정은, 수신메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제2-1단계와, 현재 차수의 규칙 중에서 일반 메시지함에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록하고 종료하는 제2-2단계와, 스팸 차단 규칙으로 등록된 규칙이 없는 경우에는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하는 제2-3단계와, 생성된 다음 차수의 규칙을 사용하여 제2-2단계부터 반복하는 제2-4단계에 의하여 수행될 수 있다.
다음 차수의 규칙의 생성은, 스팸 차단 규칙으로 등록된 규칙이 없는 경우에는 현재 차수의 규칙에 포함된 단어들을 낱개로 분리하는 단계와, 현재 차수의 규칙과 분리된 단어를 곱(AND) 논리로 조합하여 다음 차수의 규칙을 생성하는 단계에 의해 수행될 수 있다.
또한, 본 발명에서는, 스팸 차단 규칙에 의해 스팸 메시지로 분류된 수신메시지를 사용자가 일반 메시지로 등록하는 경우에는 해당 수신메시지를 사용하여 스팸 차단 규칙을 정정하도록 할 수 있다.
이때의 스팸 차단 규칙의 정정은, 해당 수신메시지를 스팸 메시지라고 판단한 제1규칙들에 의해 차단되는 일반 메시지함 내의 제1메시지 집합으로부터 제1규 칙들을 제외한 소정 차수 이하의 규칙을 생성하는 제3-1단계와, 생성된 규칙 중에서 제1메시지 집합에 대해서 공통적으로 적용 가능한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 그 공통규칙을 제1규칙들에 대한 예외조건으로서 등록하며, 공통규칙이 없는 경우에는 제1규칙들을 스팸 차단 규칙에서 삭제하는 제3-2단계에 의해 수행될 수 있다.
또는, 해당 수신메시지를 스팸 메시지라고 판단한 제1규칙들에 의해 차단되는 일반 메시지함 내의 제1메시지 집합으로부터 제1규칙들을 제외한 소정 차수 이하의 규칙을 생성하는 제3-1단계와, 생성된 규칙 중에서 제1메시지 집합에 대해서 공통적으로 적용 가능한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 그 공통규칙을 제1규칙들에 대한 예외조건으로서 등록하며, 공통규칙이 없는 경우에는 스팸 차단 규칙을 모두 삭제하고 스팸 메시지함과 일반 메시지함에 저장되어 있는 메시지를 사용하여 스팸 차단 규칙을 정정하는 제3-2단계에 의해 수행될 수도 있다.
한편, 본 발명에서는, 일정 기간마다 스팸 메시지함과 일반 메시지함에 저장되어 있는 메시지를 사용하여 스팸 차단 규칙을 정정하도록 할 수도 있다. 이때의스팸 차단 규칙의 정정은, 스팸 메시지함에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제4-1단계와, 현재 차수의 규칙 중에서 스팸 메시지함에 있는 메시지를 하나도 차단하지 못하는 현재 차수의 규칙을 제거하는 제4-2단계와, 남아있는 현재 차수의 규칙 중에서 일반 메시지함에 있는 메시지는 하나도 차단하지 않는 현재 차수의 규칙을 스팸 차단 규칙으로 등록하고, 해당 규칙을 제거하는 제4-3 단계와, 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸 메시지함에서 제거하는 제4-4단계와, 스팸 메시지함에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하고, 스팸 메시지함에 남아있는 메시지의 수가 소정의 수 이하이면 스팸 차단 규칙 생성을 종료하는 제4-5단계와, 생성된 다음 차수의 규칙을 사용하여 제4-2단계부터 반복하는 제4-6단계에 의하여 수행될 수 있다.
이하, 도면을 참조하여 본 발명의 바람직한 실시예를 상세히 설명한다. 한편, 이하의 설명에서는 휴대폰의 문자메시지를 예로 들어 설명하지만, 본 발명은 전자우편, 메신저 등에 대해서도 적용이 가능하다.
도 1은 본 발명의 스팸 차단 규칙 생성 방법을 수행하기 위한 스팸 차단 규칙 생성 시스템을 개략적으로 보여주는 블록도이다. 스팸 차단 규칙을 생성하기 위한 스팸메시지 차단규칙 생성엔진(100)은 스팸메시지를 저장하고 있는 스팸풀(110)과 일반메시지를 저장하고 있는 일반풀(120)에 저장되어 있는 메시지를 분석하여 스팸 차단 규칙을 생성하고, 이를 스팸차단규칙 데이터베이스(130)에 저장한다. 스팸 차단 생성 시스템은 사용자의 이동통신단말기나 컴퓨터 등의 정보단말기에 구비될 수도 있고, 메일 서버나 문자메시지 서버에 구비될 수도 있다.
도 2는 본 발명의 스팸 차단 규칙 생성 절차를 보여주는 흐름도이다.
본 발명에서 스팸메시지 차단규칙은 하나의 단어 혹은 다수의 단어의 AND 결합에 의해 이루어진다. 본 발명에서는 하나의 차단규칙에 포함된 단어의 수를 차수 라고 부르며, 하나의 단어로 이루어진 규칙은 '1차 규칙'으로, 두개의 단어로 이루어진 규칙은 '2차 규칙' 등과 같이 명명한다.
스팸메시지 차단규칙 생성엔진(100)은 스팸풀(110)에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성한다(S201). 1차 규칙은 하나의 단어로 이루어진 규칙으로서, 스팸풀(110)에 있는 메시지에 포함된 내용 중에서 한글 문장에 대해서는 조사를 제거한 단어를 추출하고, 영어 문장에 대해서는 전치사와 관사를 제외한 단어를 추출함으로써 생성될 수 있다.
이렇게 생성된 규칙을 이용하여 스팸풀에 있는 메시지를 필터링하여 보고, 이들 규칙의 유효성을 알아본다(S203). 필터링의 결과, 스팸풀에 있는 메시지를 하나도 차단하지 못하는 규칙을 제거한다(S205).
그러면, 스팸풀(110)에 있는 메시지를 차단할 수 있는 규칙만이 남게 된다. 그런데, 스팸을 차단하는 규칙이 일반 메시지도 차단하면 안되므로, 남아있는 현재 차수의 규칙 중에서 일반풀(120)에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록한다(S207). 이때, 스팸 차단 규칙으로 등록된 규칙은 더 이상의 차수의 규칙에 사용될 필요가 없으므로, 해당 규칙을 제거하게 된다.
또한, 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지는 등록된 스팸 차단 규칙에 의해 차단이 가능하므로, 차단 규칙을 생성하기 위한 시료로 더이상 사용될 필요가 없다. 따라서, 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸풀(110)에서 제거한다(S209).
스팸 차단 규칙으로 등록된 규칙에 의하여 스팸풀(110)에 있던 메시지가 모 두 제거되었다면 더이상 스팸 차단 규칙을 생성할 필요가 없으므로 스팸차단규칙 생성을 종료한다(S211의 '예'). 그러나, 스팸풀(110)에 메시지가 남아 있다면(S211의 '아니오'), 단계 S213으로 가서, 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성한다(S213). 다음 차수의 규칙을 생성하는 방법으로는, 남아 있는 현재 차수의 규칙에 포함된 단어들을 낱개로 분리한 다음에 분리된 단어를 남아 있는 현재 차수의 규칙과 곱(AND) 논리로 조합하는 방법이 바람직하다.
그리고는 생성된 규칙을 이용하여 단계 S203 이하의 단계를 스팸풀(110)에 있는 메시지가 모두 제거될 때까지 반복하게 된다.
한편, 스팸풀(110)에 있는 메시지를 모두 제거할 때까지 이상의 절차를 반복하게 되면 스팸차단규칙을 생성하는데 너무 많은 시간이 소요될 우려가 있다. 이와 같은 경우를 고려하여 스팸풀(110)에 일정 수 이하의 메시지가 남아있으면 스팸차단규칙 생성을 종료하도록 하는 것도 가능하다.
또한, 생성된 규칙의 차수가 너무 높은 경우에는 메시지를 차단할 수 있는 확률이 낮아지게 되므로, 일정한 차수 이내의 규칙만을 생성하도록 제한할 수도 있다. 즉, 단계 S211에서 스팸풀(110)이 비지 않은 경우 또는 스팸풀(110)에 있는 메시지의 수가 일정 수 이하인 경우에도 현재의 차수가 일정 차수 이상이라면 스팸차단규칙의 생성을 종료하도록 할 수 있다.
이상의 과정을 도 3을 예로 들어 설명한다. 도 3에서 1차 규칙은 스팸풀(110)에 있는 메시지들로부터 추출한 단어들이다. 먼저, 이들 단어들 중에서 스팸 풀(110)에 있는 메시지는 차단하지만 일반풀(120)에 있는 메시지는 차단하지 않는 단어들을 스팸차단규칙으로서 등록한다. 도 3에서는 광고(31)가 스팸차단규칙으로 등록되었다고 가정한다. 스팸차단규칙으로 등록된 규칙은 더 이상의 차수의 규칙에 사용될 필요가 없으므로, 해당 규칙을 제거하게 된다.
이와 같이 1차 규칙 중에서 스팸차단규칙으로 등록된 규칙을 제외한 나머지 규칙을 곱 조합하여 2차 규칙을 생성하게 된다. 2차 규칙 중에서 스팸풀(110)에 있는 메시지를 차단할 수 없는 규칙이 있다면, 이는 필요없는 규칙이므로 제거한다. 도 3에서는 성인&기대(35)가 이러한 규칙이라고 가정한다. 남아있는 2차 규칙 중에서 일반풀(120)에 있는 메시지는 차단하지 않는 규칙들을 스팸차단규칙으로서 등록한다. 도 3에서는 남성&성인(32), 성인&만남(33)이 스팸차단규칙으로 등록되었다고 가정한다. 스팸차단규칙으로 등록된 규칙은 더 이상의 차수의 규칙에 사용될 필요가 없으므로, 해당 규칙을 제거하게 된다.
이와 같이 2차 규칙 중에서 스팸차단규칙으로 등록된 규칙을 제외한 나머지 규칙을 곱 조합하여 3차 규칙을 생성하게 된다. 이를 위하여, 남아 있는 2차 규칙을 낱개 단어로 분리한 다음에 이들 낱개 단어들과 남아 있는 2차 규칙을 곱 조합한다. 즉, 남성&멋진, 남성&만남, 성인&멋진 등의 남아 있는 2차 규칙에서 '남성', '멋진', '만남', '성인' 등의 단어를 분리하고, 이들과 남성&멋진, 남성&만남 등의 남아 있는 2차 규칙을 곱 조합함으로써, 남성&멋진&만남 등의 3차 규칙을 생성한다. 한편, 남성&멋진&멋진 등과 같이 동일한 단어가 2개 이상 포함되는 규칙은 의미가 없으므로 규칙으로 생성하지 않는다.
이와 같은 과정을 계속 반복함으로써 다수의 차수의 규칙을 생성하여 검사하여 스팸차단규칙으로 등록하게 된다.
한편, 생성된 규칙 중에는 스팸 차단의 목적을 달성할 수 있으면서도 일부 일반 메시지도 차단하게 되는 경우가 발생할 수 있다. 이러한 규칙을 그냥 무시하고 차단 규칙으로서 등록하지 않는 것도 방법이 될 수 있지만, 이러한 규칙이 적용되는 메시지에 대해서 해당 메시지를 차단하지 않는 예외조건을 추가함으로써 이러한 문제를 해결하는 방법도 택할 수 있다.
즉, 도 2의 단계 S207에서 일반풀에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸차단규칙으로 등록하는 이외에도, 일반풀에 있는 메시지를 차단하는 규칙에 대해서도 도 4와 같은 절차를 수행하여 예외조건을 갖는 스팸차단규칙으로서 등록될 수 있는 여지를 줄 수 있다.
도 4의 절차는 도 2의 단계 S207에서 남아 있는 규칙의 각각에 대해서 적용된다. 즉, 도 4의 절차는 남아 있는 규칙 중의 하나(이하, '현재의 규칙'이라 함)에 대해서 적용되는 것으로서, 이러한 절차를 남아 있는 모든 규칙에 대해서 적용하게 된다.
먼저, 일반풀(120)에 있는 메시지 중에서 현재의 규칙으로 차단되는 메시지가 있는지를 확인하여(S401), 없는 경우에는 도 2의 경우와 마찬가지로 해당 규칙을 스팸 차단 규칙으로 등록하고 해당 규칙을 제거한다(S409).
반면, 일반풀(120)에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 있는 경우에는, 해당 규칙으로 차단되는 메시지 전체로부터 현재의 규칙을 제외한 소정 차수 이하의 규칙을 생성한다(S403). 예를 들어, 현재의 규칙이 '광고'라고 가정하면, 일반풀(120)에 있는 메시지 중에서 '광고'라는 단어가 포함된 모든 메시지에 포함된 단어들을 사용하여 1차 규칙, 2차 규칙 등과 같이 소정의 차수 이하의 규칙을 생성한다. 소정의 차수는 임의로 정할 수 있지만, 예외조건으로서의 효용성을 고려하면 2차 또는 3차까지의 차수로 제한하는 것이 바람직하다.
다음에, 생성된 소정 차수 이하의 규칙 중에서 현재의 규칙으로 차단되는 메시지들을 모두 차단할 수 있는 공통규칙이 있는지를 확인한다(S405). 예를 들어, 현재의 규칙이 '광고'라고 가정하면, 일반풀(120)에 있는 메시지 중에서 '광고'라는 단어가 포함된 모든 메시지에 공통적으로 포함되어 있는 단어 또는 소정 차수 이하의 단어들의 조합이 있는지를 확인하는 것이다.
이러한 공통규칙이 있는 경우에는, 현재의 규칙에 의해 차단될 수 있는 메시지라 하더라도 공통규칙이 적용될 수 있는 메시지는 일반 메시지일 확률이 높다는 것을 의미하므로, 현재의 규칙을 스팸 차단 규칙으로 등록하되 공통규칙을 현재의 규칙에 대한 예외조건으로서 등록하고, 현재의 규칙을 제거한다(단계 S407).
한편, 도 4의 절차는 일반풀(120)에 있는 메시지 중에서 현재의 규칙으로 차단되는 메시지의 수가 2 이상인 경우에 수행하는 것이 통계적인 측면에서 의미 있는 결과를 추출할 수 있다.
이상의 설명과 같은 절차를 거쳐서 생성된 스팸차단규칙은 스팸차단규칙을 생성한 단말기에서 사용할 수도 있고, 다른 단말기에서 다운로드 받아서 사용할 수도 있다. 그런데, 단말기에서 스팸차단규칙을 로딩하여 스팸 메시지를 차단하는데 사용할 때, 스팸 메시지로 분류된 메시지가 일반 메시지인 경우도 발생할 수 있고, 일반 메시지로 분류된 메시지가 스팸 메시지인 경우도 발생할 수 있다. 이러한 경우는 스팸 메시지가 그 형태를 다양하게 변화시켜서 발생될 수도 있고, 스팸차단규칙을 생성할 때 사용된 메시지 표본들이 불충분하거나 또는 사용되는 단말기에 적합하지 않은 표본들이 사용되어서 발생할 수도 있을 것이다. 이하에서는 이와 같은 경우에 스팸차단규칙을 정정하는 방법에 대해서 설명한다.
도 5는 본 발명의 스팸 차단 규칙 생성 방법을 수행하기 위한 스팸 차단 규칙 생성 시스템 및 생성된 스팸 차단 규칙에 따라서 문자메시지를 처리하는 문자메시지 처리 시스템을 개략적으로 보여주는 블록도이다.
스팸메시지 차단규칙 생성엔진(100)에서 생성되어 스팸차단규칙 데이터베이스(130)에 저장된 스팸차단규칙은 단문메시지 처리엔진(200)에서 수신되는 단문메시지를 분류하는데 사용된다. 단문메시지 처리엔진(200)은 스팸차단규칙 데이터베이스(130)에 저장되어 있는 스팸차단규칙에 부합되는 메시지는 스팸메시지라고 판단하여 스팸메시지 보관함(210)에 저장하고, 스팸차단규칙에 부합되지 않는 메시지는 일반메시지라고 판단하여 일반메시지 보관함(220)에 저장한다. 그런데, 사용자가 일반메시지 보관함(220)에 저장된 메시지를 스팸메시지 보관함(210)으로 이동시키거나 스팸메시지라고 등록하는 경우, 또는 사용자가 스팸메시지 보관함(210)에 저장된 메시지를 일반메시지 보관함(220)으로 이동시키거나 일반메시지라고 등록하 는 경우에는 해당 메시지를 사용하여 스팸차단규칙을 정정하게 된다.
이러한 절차를 도 6을 참조하여 설명한다. 도 6은 도 5의 시스템에서의 문자메시지 처리 및 스팸 차단 규칙 갱신 절차를 보여주는 흐름도이다.
먼저, 단문메시지 처리엔진(200)은 생성된 스팸차단규칙을 로딩한다(S601). 그리고, 단문메시지가 수신되면(S603의 '예') 로딩된 스팸차단규칙을 사용하여 수신된 단문메시지를 필터링한다(S605).
필터링의 결과, 일반메시지로 분류되어 일반메시지 보관함(220)에 저장된 메시지를 사용자가 스팸메시지로 등록하면(S607의 '예') 단문메시지 처리엔진(200)은 스팸차단규칙을 수정할 것을 스팸메시지 차단규칙 생성엔진(100)에 요청하여 스팸메시지 차단규칙을 수정하게 된다(S609). 또는 단문메시지 처리엔진(200)에서 직접 스팸메시지 차단규칙을 수정하도록 하는 것도 가능하다. 스팸 메시지 차단규칙의 정정 절차에 대해서는 후술한다.
한편, 필터링의 결과, 스팸메시지로 분류되어 스팸메시지 보관함(210)에 저장된 메시지를 사용자가 일반메시지로 등록하면(S611의 '예') 단문메시지 처리엔진(200)은 스팸차단규칙을 수정할 것을 스팸메시지 차단규칙 생성엔진(100)에 요청하여 스팸메시지 차단규칙을 수정하게 된다(S613). 또는 단문메시지 처리엔진(200)에서 직접 스팸메시지 차단규칙을 수정하도록 하는 것도 가능하다. 스팸 메시지 차단규칙의 정정 절차에 대해서는 후술한다.
한편, 사용자가 수신된 메시지의 분류를 변경할 때뿐만 아니라 일정 기간마다 스팸차단규칙을 다시 생성하도록 하는 것이 바람직하다. 즉, 스팸차단규칙에 의 해 분류되어, 또는 사용자의 등록에 의해 스팸메시지 보관함(210) 또는 일반메시지 보관함(220)에 보관된 메시지들은 각각 스팸풀(110) 또는 일반풀(120)에 복사되어 저장되고, 일정 기간마다 스팸풀(110)과 일반풀(120)에 저장된 메시지를 사용하여 도 2와 같은 절차를 거쳐서 스팸차단규칙을 생성하는데 사용된다. 이를 위하여, 단문메시지 처리엔진(200) 또는 스팸메시지 차단규칙 생성엔진(100)은 일정 기간이 경과하였는지를 확인하여(S615), 일정 기간이 경과되었으면 도 2와 같은 절차를 거쳐서 스팸차단규칙을 다시 생성한다(S617).
다음으로, 도 7을 참조하여 단계 S609의 스팸차단규칙 수정 절차를 상세히 설명한다. 도 7은 스팸 차단 규칙에 의해 일반 메시지로 분류된 수신메시지를 사용자가 스팸 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차를 보여주는 흐름도이다.
스팸 차단 규칙에 의해 일반 메시지로 분류된 수신메시지를 사용자가 스팸 메시지 보관함으로 이동시킨 경우에는, 해당 수신메시지 내에 포함된 단어들을 이용하여 스팸차단규칙 하나를 새로 생성하여 기존의 규칙에 추가하여야 한다.
이를 위하여, 수신메시지에 포함된 단어를 추출하여 도 2의 S201 단계와 유사한 절차를 거쳐서 1차 규칙을 생성한다(S701). 생성된 현재 차수의 규칙들을 일반 메시지 보관함에 있는 메시지에 적용하여 보고, 일반 메시지 보관함에 있는 메시지는 하나도 차단하지 않는 규칙이 있는지를 확인한다(S703). 만약, 현재 차수의 규칙 중에서는 일반 메시지 보관함에 있는 메시지는 하나도 차단하지 않는 규칙이 없는 경우에는 도 2의 S213과 유사한 절차를 거쳐서 다음 차수의 규칙을 생성한 다음에(S705), 단계 S703을 반복한다. 만약, 현재 차수의 규칙 중에서 일반 메시지 보관함에 있는 메시지는 하나도 차단하지 않는 규칙이 발견되면 해당 규칙을 스팸차단규칙으로 새로 추가 등록한다(S707).
다음으로, 도 8을 참조하여 단계 S613의 스팸차단규칙 수정 절차의 일실시예를 상세히 설명한다. 도 8은 스팸 차단 규칙에 의해 스팸 메시지로 분류된 메시지를 사용자가 일반 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차의 일예를 보여주는 흐름도이다.
스팸 차단 규칙에 의해 스팸 메시지로 분류된 수신메시지를 사용자가 일반 메시지 보관함으로 이동시킨 경우에, 도 8의 실시예에서는 해당 수신메시지를 스팸 메시지로 분류하게 된 근거가 되는 스팸차단규칙에 대해서 수신메시지와 같은 메시지는 차단하지 않도록 하는 예외조건을 등록하거나, 그러한 예외조건을 찾을 수 없는 경우에는 해당 스팸차단규칙을 제거하도록 하고 있다.
이를 위하여 일반 메시지 보관함 내의 메시지들 중에서, 수신메시지를 스팸메시지라고 판단한 스팸차단규칙(이하, '제1규칙'이라 함)에 의해서 차단되는 메시지의 집합을 추출한다(S801). 그리고, 추출된 메시지 집합으로부터 제1규칙을 제외한 소정 차수 이하의 규칙, 예를 들면 1차 및 2차 규칙을 생성한다(S803). 이렇게 생성된 규칙 중에서 추출된 메시지 집합에 대해서 공통으로 적용 가능한 공통 규칙이 있는지를 확인한다(S805). 공통규칙이 있다면 해당 공통규칙을 제1규칙에 대한 예외조건으로 등록함으로써(S807), 앞으로는 공통규칙을 포함하는 메시지가 제1규칙에 의해 스팸 메시지로 분류되는 것을 방지한다. 공통규칙이 없다면, 제1규칙을 스팸차단규칙에서 삭제함으로써(S809), 제1규칙이 포함된 메시지가 스팸 메시지로 분류되는 것을 방지한다.
다음으로, 도 9를 참조하여 단계 S613의 스팸차단규칙 수정 절차의 다른 실시예를 상세히 설명한다. 도 9는 스팸 차단 규칙에 의해 스팸 메시지로 분류된 메시지를 사용자가 일반 메시지 보관함으로 이동시켰을 때의 스팸 차단 규칙 정정 절차의 다른 예를 보여주는 흐름도이다.
도 9의 실시예에서는, 스팸 차단 규칙에 의해 스팸 메시지로 분류된 수신메시지를 사용자가 일반 메시지 보관함으로 이동시킨 경우에, 해당 수신메시지를 스팸 메시지로 분류하게 된 근거가 되는 스팸차단규칙에 대해서 수신메시지와 같은 메시지는 차단하지 않도록 하는 예외조건을 등록하거나, 그러한 예외조건을 찾을 수 없는 경우에는 스팸 메시지 보관함과 일반 메시지 보관함에 저장되어 있는 메시지들을 사용하여 스팸차단규칙을 새로 생성하도록 하고 있다.
이를 위하여 일반 메시지 보관함 내의 메시지들 중에서, 수신메시지를 스팸메시지라고 판단한 스팸차단규칙(이하, '제1규칙'이라 함)에 의해서 차단되는 메시지의 집합을 추출한다(S901). 그리고, 추출된 메시지 집합으로부터 제1규칙을 제외한 소정 차수 이하의 규칙, 예를 들면 1차 및 2차 규칙을 생성한다(S903). 이렇게 생성된 규칙 중에서 추출된 메시지 집합에 대해서 공통으로 적용 가능한 공통 규칙 이 있는지를 확인한다(S905). 공통규칙이 있다면 해당 공통규칙을 제1규칙에 대한 예외조건으로 등록함으로써(S907), 앞으로는 공통규칙을 포함하는 메시지가 제1규칙에 의해 스팸 메시지로 분류되는 것을 방지한다. 공통규칙이 없다면, 스팸 메시지 보관함과 일반 메시지 보관함에 저장되어 있는 메시지들을 사용하여 스팸차단규칙을 새로 생성한다(S909).
본 발명에 따르면, 일반메시지 보관함과 스팸메시지 보관함에 저장되어 있는 메시지들로부터 스팸 메시지를 차단할 수 있는 규칙을 자동으로 생성하게 되므로, 각 사용자들이 일일이 스팸 메시지 차단 규칙을 입력할 필요가 없으며, 또한 각 사용자들의 환경에 적합한 스팸 차단 규칙을 생성할 수 있다고 하는 효과가 있다.
또한, 스팸 메시지 차단 규칙에 의해 스팸 메시지 또는 일반 메시지로 분류된 메시지를 사용자가 그 반대의 경우로 분류하는 경우에 자동으로 스팸 차단 규칙을 갱신하므로, 스팸 메시지의 다양한 변신에 대해서도 신속하게 대처할 수 있다고 하는 효과가 있다.
Claims (17)
- 스팸 메시지로 분류된 메시지가 저장되어 있는 스팸풀(spam pool)과, 일반 메시지로 분류된 메시지가 저장되어 있는 일반 풀(pool)을 구비하는 스팸메시지 차단규칙 생성엔진에서 스팸 차단 규칙을 생성하는 방법에 있어서,스팸메시지 차단규칙 생성엔진이 스팸풀에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제1단계와,스팸메시지 차단규칙 생성엔진이 현재 차수의 규칙 중에서 스팸풀에 있는 메시지를 하나도 차단하지 못하는 규칙을 제거하는 제2단계와,스팸메시지 차단규칙 생성엔진이 남아있는 현재 차수의 규칙 중에서 일반풀에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록하고, 해당 규칙을 제거하는 제3단계와,스팸메시지 차단규칙 생성엔진이 스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸풀에서 제거하는 제4단계와,스팸메시지 차단규칙 생성엔진이 스팸풀에 남아있는 메시지의 수가 소정의 수보다 큰지 확인하여, 스팸풀에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하고, 스팸풀에 남아있는 메시지의 수가 소정의 수 이하이면 스팸 차단 규칙 생성을 종료하는 제5단계와,스팸메시지 차단규칙 생성엔진이 생성된 다음 차수의 규칙을 사용하여 제2단계부터 반복하는 제6단계를 구비하는 스팸 차단 규칙 생성 방법.
- 제1항에 있어서,제1단계는 스팸풀에 있는 메시지에 포함된 내용 중에서 한글 문장에 대해서는 조사를 제거한 단어를 추출하고, 영어 문장에 대해서는 전치사와 관사를 제외한 단어를 추출하는 것임을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제1항에 있어서,제5단계의 상기 소정의 수는 0인 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제1항에 있어서, 제5단계는스팸메시지 차단규칙 생성엔진이 스팸풀에 남아있는 메시지의 수가 소정의 수보다 큰지 확인하여, 스팸풀에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙에 포함된 단어들을 낱개로 분리하는 단계와,스팸메시지 차단규칙 생성엔진이 남아 있는 현재 차수의 규칙과 분리된 단어를 곱(AND) 논리로 조합하여 다음 차수의 규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제1항에 있어서, 제3단계는남아있는 현재 차수의 규칙의 각각에 대해서일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 없는 경우에는 해당 규칙을 스팸 차단 규칙으로 등록하고 해당 규칙을 제거하는 제3-1단계와,일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 있는 경우에 는, 해당 규칙으로 차단되는 메시지 전체에 대해서 적용 가능한, 해당 규칙을 제외한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 상기 해당 규칙을 스팸 차단 규칙으로 등록하고 상기 공통규칙을 상기 해당 규칙에 대한 예외조건으로서 등록하며 상기 해당 규칙을 제거하는 제3-2단계를 수행하는 것임을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제5항에 있어서,제3-2단계는 해당 규칙으로 차단되는 메시지의 수가 2 이상인 경우에 수행하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제5항에 있어서, 제3-2단계는일반풀에 있는 메시지 중에서 해당 규칙으로 차단되는 메시지가 있는 경우에는 해당 규칙으로 차단되는 메시지들로부터 추출된 단어를 사용하여 소정 차수 이하의 규칙을 생성하는 단계와,생성된 상기 소정 차수 이하의 규칙 중에서 상기 메시지들을 모두 차단할 수 있는 공통규칙이 있는지를 확인하는 단계와,상기 메시지들을 모두 차단할 수 있는 공통규칙이 있는 경우에는, 상기 해당 규칙을 스팸 차단 규칙으로 등록하고 상기 공통규칙을 상기 해당 규칙에 대한 예외조건으로서 등록하며 상기 해당 규칙을 제거하는 단계를 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제7항에 있어서, 상기 소정 차수는 2인 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제1항에 있어서,제5단계에서 스팸풀에 남아있는 메시지의 수가 소정의 수 이하이거나 현재의 차수가 소정 차수 이상인 경우에는 스팸 차단 규칙 생성을 종료하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 삭제
- 수신메시지 처리엔진이 스팸 차단 규칙을 로딩하는 제1단계와,수신메시지 처리엔진이 수신메시지를 상기 스팸 차단 규칙에 따라 일반 메시지 또는 스팸 메시지로 분류하는 제2단계와,사용자에 의해 스팸 메시지로 등록된 수신메시지가 제2단계에서 수신메시지 처리엔진에 의해 일반 메시지로 분류된 메시지였는지를 확인하여 일반 메시지로 분류된 메시지인 경우에는 수신메시지 처리엔진이 스팸 차단 규칙을 정정하는 제3단계를 구비하며,상기 제3단계의 스팸 차단 규칙 정정은,수신메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제3-1단계와,현재 차수의 규칙 중에서 일반 메시지함에 있는 메시지는 하나도 차단하지 않는 규칙을 스팸 차단 규칙으로 등록하고 종료하는 제3-2단계와,스팸 차단 규칙으로 등록된 규칙이 없는 경우에는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하는 제3-3단계와,생성된 다음 차수의 규칙을 사용하여 제3-2단계부터 반복하는 제3-4단계에 의하여 수행되는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제11항에 있어서, 제3-3단계는스팸 차단 규칙으로 등록된 규칙이 없는 경우에는 현재 차수의 규칙에 포함된 단어들을 낱개로 분리하는 단계와,현재 차수의 규칙과 분리된 단어를 곱(AND) 논리로 조합하여 다음 차수의 규칙을 생성하는 단계를 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 삭제
- 제11항에 있어서,사용자에 의해 일반 메시지로 등록된 수신메시지가 제2단계에서 수신메시지 처리엔진에 의해 스팸 메시지로 분류된 메시지였는지를 확인하여 스팸 메시지로 분류된 메시지인 경우에는 수신메시지 처리엔진이 스팸 차단 규칙을 정정하는 제4단계를 더 구비하며,제4단계의 스팸 차단 규칙의 정정은해당 수신메시지를 스팸 메시지라고 판단한 제1규칙들에 의해 차단되는 일반 메시지함 내의 제1메시지 집합으로부터 제1규칙들을 제외한 소정 차수 이하의 규칙을 생성하는 제4-1단계와,생성된 규칙 중에서 제1메시지 집합에 대해서 공통적으로 적용 가능한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 그 공통규칙을 제1규칙들에 대한 예외조건으로서 등록하며, 공통규칙이 없는 경우에는 제1규칙들을 스팸 차단 규칙에서 삭제하는 제4-2단계를 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제11항에 있어서,사용자에 의해 일반 메시지로 등록된 수신메시지가 제2단계에서 수신메시지 처리엔진에 의해 스팸 메시지로 분류된 메시지였는지를 확인하여 스팸 메시지로 분류된 메시지인 경우에는 수신메시지 처리엔진이 스팸 차단 규칙을 정정하는 제4단계를 더 구비하며,제4단계의 스팸 차단 규칙의 정정은해당 수신메시지를 스팸 메시지라고 판단한 제1규칙들에 의해 차단되는 일반 메시지함 내의 제1메시지 집합으로부터 제1규칙들을 제외한 소정 차수 이하의 규칙을 생성하는 제4-1단계와,생성된 규칙 중에서 제1메시지 집합에 대해서 공통적으로 적용 가능한 공통규칙이 있는지 확인하여, 공통규칙이 있는 경우에는 그 공통규칙을 제1규칙들에 대한 예외조건으로서 등록하며, 공통규칙이 없는 경우에는 스팸 차단 규칙을 모두 삭제하고 스팸 메시지함과 일반 메시지함에 저장되어 있는 메시지를 사용하여 스팸 차단 규칙을 정정하는 제4-2단계를 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제11항에 있어서,수신메시지 처리엔진이 일정 기간마다 스팸 메시지함과 일반 메시지함에 저장되어 있는 메시지를 사용하여 스팸 차단 규칙을 정정하는 제5단계를 더 포함하는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
- 제16항에 있어서, 제5단계의 스팸 차단 규칙의 정정은스팸 메시지함에 있는 메시지에 포함된 단어를 추출하여 1차 규칙을 생성하는 제5-1단계와,현재 차수의 규칙 중에서 스팸 메시지함에 있는 메시지를 하나도 차단하지 못하는 현재 차수의 규칙을 제거하는 제5-2단계와,남아있는 현재 차수의 규칙 중에서 일반 메시지함에 있는 메시지는 하나도 차단하지 않는 현재 차수의 규칙을 스팸 차단 규칙으로 등록하고, 해당 규칙을 제거하는 제5-3단계와,스팸 차단 규칙으로 등록된 규칙에 의해 차단 가능한 메시지를 스팸 메시지함에서 제거하는 제5-4단계와,스팸 메시지함에 남아있는 메시지의 수가 소정의 수보다 크면 남아 있는 현재 차수의 규칙을 조합하여 다음 차수의 규칙을 생성하고, 스팸 메시지함에 남아있는 메시지의 수가 소정의 수 이하이면 스팸 차단 규칙 생성을 종료하는 제5-5단계와,생성된 다음 차수의 규칙을 사용하여 제5-2단계부터 반복하는 제5-6단계에 의하여 수행되는 것을 특징으로 하는 스팸 차단 규칙 생성 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040065711A KR100614751B1 (ko) | 2004-08-20 | 2004-08-20 | 스팸 차단 규칙 생성 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020040065711A KR100614751B1 (ko) | 2004-08-20 | 2004-08-20 | 스팸 차단 규칙 생성 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20060017152A KR20060017152A (ko) | 2006-02-23 |
KR100614751B1 true KR100614751B1 (ko) | 2006-08-21 |
Family
ID=37125274
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020040065711A KR100614751B1 (ko) | 2004-08-20 | 2004-08-20 | 스팸 차단 규칙 생성 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR100614751B1 (ko) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016088954A1 (ko) * | 2014-12-04 | 2016-06-09 | 숭실대학교산학협력단 | 스팸 분류 방법, 이를 수행하기 위한 기록 매체 및 스팸 분류 장치 |
-
2004
- 2004-08-20 KR KR1020040065711A patent/KR100614751B1/ko not_active IP Right Cessation
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016088954A1 (ko) * | 2014-12-04 | 2016-06-09 | 숭실대학교산학협력단 | 스팸 분류 방법, 이를 수행하기 위한 기록 매체 및 스팸 분류 장치 |
KR20160067473A (ko) | 2014-12-04 | 2016-06-14 | 숭실대학교산학협력단 | 스팸 분류 방법, 이를 수행하기 위한 기록 매체 및 스팸 분류 장치 |
Also Published As
Publication number | Publication date |
---|---|
KR20060017152A (ko) | 2006-02-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6476195B2 (ja) | メッセージ中のタスクの識別 | |
US8095547B2 (en) | Method and apparatus for detecting spam user created content | |
Mohammed et al. | Implementing an agent-based multi-natural language anti-spam model | |
US8756288B2 (en) | Publish/subscribe message routing | |
CN110874531A (zh) | 一种话题分析方法、装置和存储介质 | |
CN113692597B (zh) | 电子邮件内容修改系统 | |
US20130041962A1 (en) | Information Filtering | |
Daraghmi et al. | We are so close, less than 4 degrees separating you and me! | |
Jatana et al. | Bayesian spam classification: Time efficient radix encoded fragmented database approach | |
Zhang et al. | Filtering junk mail with a maximum entropy model | |
JP5531583B2 (ja) | ログ出力装置、ログ出力方法、ログ出力用プログラム | |
CN105760522A (zh) | 基于应用程序的信息搜索方法及装置 | |
CN109791570B (zh) | 高效且精确的命名实体识别方法和装置 | |
CN109446299B (zh) | 基于事件识别的搜索电子邮件内容的方法及系统 | |
CN116415206A (zh) | 运营商多数据融合方法、系统、电子设备及计算机存储介质 | |
CN112307318B (zh) | 一种内容发布方法、系统及装置 | |
CN104123393B (zh) | 一种短信文本的分类方法和系统 | |
KR100614751B1 (ko) | 스팸 차단 규칙 생성 방법 | |
AU2008277487A1 (en) | Telecommunications services apparatus and method | |
CN104376304A (zh) | 一种文本广告图像的识别方法及装置 | |
RU2583713C2 (ru) | Система и способ исключения шинглов от незначимых частей из сообщения при фильтрации спама | |
WO2018115688A1 (fr) | Procédé d'édition d'un message électronique avec élimination d'éléments redondants | |
US6772397B1 (en) | Method, article of manufacture and apparatus for deleting electronic mail documents | |
CN110138723B (zh) | 一种邮件网络中恶意社区的确定方法及系统 | |
CN111639099A (zh) | 全文索引方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
N231 | Notification of change of applicant | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20120727 Year of fee payment: 7 |
|
FPAY | Annual fee payment |
Payment date: 20130730 Year of fee payment: 8 |
|
LAPS | Lapse due to unpaid annual fee |