KR20110047488A - System and method for detecting spam using user log - Google Patents

System and method for detecting spam using user log Download PDF

Info

Publication number
KR20110047488A
KR20110047488A KR1020090104134A KR20090104134A KR20110047488A KR 20110047488 A KR20110047488 A KR 20110047488A KR 1020090104134 A KR1020090104134 A KR 1020090104134A KR 20090104134 A KR20090104134 A KR 20090104134A KR 20110047488 A KR20110047488 A KR 20110047488A
Authority
KR
South Korea
Prior art keywords
spam
mail
log information
detection system
log
Prior art date
Application number
KR1020090104134A
Other languages
Korean (ko)
Other versions
KR101081721B1 (en
Inventor
은종진
Original Assignee
엔에이치엔(주)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 엔에이치엔(주) filed Critical 엔에이치엔(주)
Priority to KR1020090104134A priority Critical patent/KR101081721B1/en
Publication of KR20110047488A publication Critical patent/KR20110047488A/en
Application granted granted Critical
Publication of KR101081721B1 publication Critical patent/KR101081721B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/21Monitoring or handling of messages
    • H04L51/212Monitoring or handling of messages using filtering or selective blocking

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

PURPOSE: A system and method for detecting spam using a user log are provided to accurately filter an increased number of spam mail by judging the spam mail through the analysis of the common characteristics of the mail that plural users manage. CONSTITUTION: An analyzer(120) analyzes log information related to the execution and deletion of an e-mail, and a detector(130) detects the spam within the e-mail by using the log information. A verifier(140) analyzes the mail data of the spam and whether or not the spam exists. The log information includes the click log or duration time of the e-mail. The detection unit judges as the spam mail the e-mail which is detected while not executing the click log.

Description

사용자 로그를 이용한 스팸 검출 시스템 및 방법{SYSTEM AND METHOD FOR DETECTING SPAM USING USER LOG}Spam detection system and method using user log {SYSTEM AND METHOD FOR DETECTING SPAM USING USER LOG}

본 발명에 따른 실시예들은 전자 메일을 관리하는 사용자의 로그 정보를 활용하여 스팸 메일을 검출하는 시스템 및 방법에 관한 것이다.Embodiments according to the present invention relate to a system and method for detecting spam mail using log information of a user who manages e-mail.

초고속 인터넷 망의 발달로 인하여 사용자들은 언제 어디서든지 인터넷을 이용할 수 있게 되었다. 특히, 전자 메일 서비스는 사용자들이 가장 많이 이용하는 인터넷 서비스 중 하나로서, 전달하고자 하는 텍스트 및 파일을 신속하게 다른 사용자에게 전달할 수 있는 서비스 중 하나이다.With the development of high speed internet network, users can use the internet anytime and anywhere. In particular, the e-mail service is one of the Internet services that users use most, and is one of the services that can quickly transfer text and files to other users.

최근에는 전자 웹 메일 서비스의 용량이 점차 대용량화되며, 서비스의 형태도 점차 다양화되고 있는 추세이다. 초기에는 전자 메일 서비스가 주로 개인 용도로 활용되었으나, 전자 메일의 편의성 및 장점이 알려짐에 따라 근래에 들어 전자 메일은 업무에 있어서도 필수적인 통신 수단이 되었다.In recent years, the capacity of electronic web mail services has gradually increased, and the types of services have been gradually diversified. In the early days, e-mail services were mainly used for personal use. However, as convenience and advantages of e-mail are known, in recent years, e-mail has become an essential means of communication in business.

누구와도 자유롭게 텍스트 및 파일을 교환할 수 있는 개방성은 전자 메일의 장점이기도 하나, 이러한 장점을 악용하여 다수의 사람들에게 무작위로 이메일을 전송하거나 광고성 정보를 게시하는 등의 스팸(spam) 메일은 전자 메일 사용자에게 큰 불편을 주고 있다.Openness to free text and file exchange with anyone is an advantage of e-mail, but it can also be used to e-mail spam, such as sending random e-mails or posting advertising information to a large number of people. It is a big inconvenience for mail users.

전자 메일 사용자들은 이러한 스팸 메일들을 일일이 지정하여 삭제하여야 하는 바 스팸 메일 삭제에 많은 시간이 소요되고 있으며, 스팸 메일 및 사용자에게 필요하지 않은 메일을 보다 빠른 시간에 효율적으로 검출할 수 있는 방법이 요구되고 있다.E-mail users have to designate and delete such spam mails, and it takes a lot of time to delete spam mails, and there is a need for a method that can efficiently detect spam mails and e-mails that are not needed by users. have.

사용자가 일일이 스팸 메일을 지정하지 않더라도 스팸 메일을 보다 용이하게 관리할 수 있는 스팸 검출 시스템 및 방법이 제공된다.There is provided a spam detection system and method that makes it easier to manage spam without the user specifying spam.

전자 메일을 관리하는 사용자 로그를 활용하여 스팸 메일을 효율적으로 검출할 수 있는 스팸 검출 시스템 및 방법이 제공된다.Provided are a spam detection system and method that can efficiently detect spam mail by utilizing a user log that manages e-mail.

본 발명의 일실시예에 따른 스팸 검출 시스템은 전자 메일의 실행 또는 삭제와 관련된 로그 정보를 분석하는 분석부; 및, 로그 정보를 이용하여 전자 메일 내 스팸을 검출하는 검출부를 포함한다.Spam detection system according to an embodiment of the present invention includes an analysis unit for analyzing log information associated with the execution or deletion of the e-mail; And a detection unit for detecting spam in the e-mail using log information.

본 발명의 일측면에 따르면, 로그 정보는 전자 메일의 클릭 로그(click log) 또는 실행 시간(duration time)을 포함할 수 있다.According to an aspect of the present invention, the log information may include a click log or duration time of the electronic mail.

본 발명의 일측면에 따르면, 검출부는 클릭 로그를 통해 실행되지 않은 상태에서 삭제된 메일을 스팸으로 판단하거나, 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일을 스팸으로 판단할 수 있다.According to an aspect of the invention, the detection unit may determine that the deleted mail in the non-execution state through the click log as spam, or determine that the deleted or read interrupted mail as spam when the execution time is less than a predetermined time.

본 발명의 일측면에 따르면, 복수의 사용자에 대해 검출된 스팸 간의 메일 데이터를 분석하여 스팸 여부를 검증하는 검증부를 더 포함할 수 있으며, 메일 데이터는 발신 측의 메일 주소, 메일 서버, 제목, 보낸 사람 이름 중 적어도 하나를 포함할 수 있다.According to an aspect of the present invention, it may further include a verification unit for verifying the spam by analyzing the mail data between the detected spam for a plurality of users, the mail data is the sender's mail address, mail server, subject, sender It may include at least one of a person's name.

본 발명의 일측면에 따르면, 검증부는 스팸으로 판단된 메일의 사이즈 정보 에 따라 스팸 여부를 검증할 수 있으며, 스팸에 해당하는 발신 측의 메일 주소가 사용자에 의해 저장된 주소 목록, 혹은 발신 또는 회신된 주소 목록에 포함되는지 여부에 따라 스팸 여부를 검증할 수 있다.According to one aspect of the invention, the verification unit may verify whether the spam according to the size information of the mail determined as spam, the sender's e-mail address corresponding to the spam is a list of addresses stored by the user, or sent or returned Spam can be verified based on whether it is included in the address list.

본 발명의 일실시예에 따른 스팸 검출 방법은 스팸 검출 시스템에서 스팸을 검출하는 방법에 있어서, 스팸 검출 시스템의 분석부에서 전자 메일의 실행 또는 삭제와 관련된 로그 정보를 분석하는 단계; 및, 스팸 검출 시스템의 검출부에서 로그 정보를 이용하여 전자 메일 내 스팸을 검출하는 단계를 포함한다.A spam detection method according to an embodiment of the present invention includes a method for detecting spam in a spam detection system, the method comprising: analyzing log information related to execution or deletion of an e-mail in an analysis unit of a spam detection system; And detecting spam in the e-mail by using the log information in the detection unit of the spam detection system.

본 발명의 일실시예에 따르면, 전자 메일을 관리하는 사용자 로그를 활용하여 스팸을 분석함으로써 자동으로 스팸을 검출 및 관리할 수 있다.According to an embodiment of the present invention, spam can be detected and managed automatically by analyzing spam using a user log that manages electronic mail.

본 발명의 일실시예에 따르면, 복수의 사용자가 동일한 패턴으로 관리한 메일의 공통적인 특성을 분석하여 스팸으로 판단함으로써 보다 정확하게 많은 스팸을 필터링 할 수 있다.According to one embodiment of the present invention, by analyzing a common characteristic of the mail managed by a plurality of users in the same pattern to determine the spam can be filtered more spam more accurately.

이하 첨부된 도면을 참조하여 본 발명에 따른 다양한 실시예를 상세히 설명하기로 한다.Hereinafter, various embodiments of the present disclosure will be described in detail with reference to the accompanying drawings.

본 발명의 일실시예에 따른 스팸 검출 시스템 및 방법은 웹 상에서 전자 메일 서비스를 제공하는 시스템에 적용될 수 있는 것으로, 전자 메일 중 스팸을 필터링 할 수 있도록 스팸을 검출하는 기능을 제공한다.The spam detection system and method according to an embodiment of the present invention can be applied to a system for providing an e-mail service on the web, and provides a function of detecting spam to filter spam in an e-mail.

도 1은 본 발명의 일실시예에 있어서, 스팸 검출 시스템의 내부 구성을 설명 하기 위한 블록도이다.1 is a block diagram illustrating an internal configuration of a spam detection system according to an embodiment of the present invention.

본 발명의 일실시예에 따른 스팸 검출 시스템은 분석부(120), 검출부(130), 검증부(140)를 포함할 수 있다. 이때, 스팸 검출 시스템은 메일 박스(110)와 연동할 수 있도록 구성될 수 있다.The spam detection system according to an embodiment of the present invention may include an analysis unit 120, a detection unit 130, and a verification unit 140. In this case, the spam detection system may be configured to interoperate with the mailbox 110.

메일 박스(110)는 전자 메일을 저장하는 데이터베이스를 의미하는 것으로, 사용자 별로 연관하여 저장 및 관리한다. 메일 박스(110)는 일반적으로 MIME(Multipurpose Internet Mail Extension) 타입의 메일 데이터를 저장한다. 통상적으로, 메일 박스(110)는 메일 데이터를 하나의 파일로 관리할 수도 있으며, 각각의 메일 데이터의 저장 위치를 파일 포인터를 통해 관리할 수도 있다.The mail box 110 refers to a database that stores electronic mail, and stores and manages it in association with each user. The mailbox 110 generally stores mail data of a Multipurpose Internet Mail Extension (MIME) type. Typically, the mail box 110 may manage the mail data as one file, and may manage the storage location of each mail data through a file pointer.

분석부(120)는 전자 메일을 관리하는 사용자의 로그 정보 즉, 전자 메일의 실행 또는 삭제와 관련된 로그 정보를 분석하는 역할을 수행한다. 사용자의 로그 정보는 메일 박스(110)에 메일 데이터와 함께 기록되거나 별도의 저장 수단에 기록되어 유지될 수 있다. 분석부(120)는 메일 박스(110) 또는 저장 수단으로부터 전자 메일의 사용자 별 로그 정보를 수집하여 분석할 수 있다. 이때, 로그 정보로는 전자 메일의 클릭 로그(click log), 실행 시간(duration time) 등을 활용할 수 있다. 분석부(120)는 로그 정보를 통해 전자 메일의 실행 여부, 삭제 여부, 실행 시간 등을 분석할 수 있다.The analyzer 120 analyzes log information of the user who manages the e-mail, that is, log information related to the execution or deletion of the e-mail. The log information of the user may be recorded together with the mail data in the mailbox 110 or may be recorded and maintained in a separate storage means. The analyzer 120 may collect and analyze log information for each user of the electronic mail from the mailbox 110 or the storage means. In this case, as log information, a click log of an e-mail, a duration time, or the like may be utilized. The analysis unit 120 may analyze whether the e-mail is executed, whether or not it is deleted, and the execution time through the log information.

검출부(130)는 분석부(120)에서 분석된 로그 정보를 토대로 전자 메일 내 스팸을 검출하는 역할을 수행한다. 검출부(130)는 전자 메일 중 실행되지 않은 상태에서 삭제된 메일, 또는 실행 시간이 일정 시간(예를 들어, 5초) 이하인 상태에서 삭제 또는 읽기 중단된 메일을 검출하여 검출된 메일을 스팸으로 판단한다. 사용자는 전자 메일 서비스를 제공하는 웹 페이지에서 받은 편지함을 열게 되면 메일 제목 또는 보낸 사람 이름만으로도 쉽게 스팸 여부를 확인할 수 있다. 도 2는 본 발명의 일실시예에 따른 스팸 검출 시스템에서 사용자가 전자 메일을 관리하는 패턴의 일례를 설명하기 위한 도면이다. 사용자는 스팸 메일에 대하여 일일이 실행시키지 않고 메일 제목 또는 보낸 사람 이름을 확인한 후 삭제하거나 실행하더라도 스팸임이 확인되면 즉시 삭제하거나 읽기를 중단하는 행동 패턴을 보이게 된다. 즉, 사용자가 열어보지도 않고 바로 지우거나 열어보더라도 열자마자 삭제하거나 읽기를 중단하는 행동 패턴을 보이는 메일들은 사용자 입장에서 스팸일 가능성이 매우 높다는 것을 의미할 수 있다. 도 2에 도시된 바와 같이, 검출부(130)는 로그 정보를 이용하여 휴지통(201)의 삭제된 메일 중 실행되지 않은 상태의 메일 또는 실행 시간이 일정 시간 이하인 메일을 검출하여 해당 메일을 스팸으로 판단할 수 있다.The detector 130 detects spam in the e-mail based on the log information analyzed by the analyzer 120. The detection unit 130 determines the detected mail as spam by detecting a mail deleted while not being executed, or a mail that has been deleted or read while the execution time is less than a predetermined time (for example, 5 seconds). do. When a user opens an inbox from a web page that provides e-mail services, the user can easily check for spam by simply typing the subject or sender's name. 2 is a view for explaining an example of a pattern in which a user manages an e-mail in a spam detection system according to an embodiment of the present invention. Even if the user deletes or executes the mail subject or the sender name without checking the spam mail, it shows a behavior pattern that immediately deletes or stops reading when the spam is confirmed. That is, even if a user deletes or opens a file immediately without opening it, the mails showing a behavior pattern of deleting or stopping reading as soon as they open may be very likely to be spam from the user's point of view. As shown in FIG. 2, the detection unit 130 detects the mail that is not executed or the mail whose execution time is less than a predetermined time among the deleted mails of the recycle bin 201 using the log information to determine the corresponding mail as spam. can do.

이와 같은 구성의 스팸 검출 시스템은 전자 메일을 관리(실행 또는 삭제)하는 사용자의 로그 정보를 이용하여 스팸 메일을 용이하게 검출할 수 있다.The spam detection system having such a configuration can easily detect spam mail by using log information of a user who manages (executes or deletes) an electronic mail.

더 나아가, 검증부(140)는 검출부(130)에서 스팸으로 판단된 전자 메일에 대하여 스팸 여부를 검증하는 역할을 수행한다. 본 발명의 일실시예는 전자 메일에 대한 여러 사용자들의 행동 패턴을 고려하여 스팸 여부를 검증할 수 있다. 먼저, 검출부(130)는 사용자 별로 실행하지 않고 삭제되거나 일정 시간 이하의 실행 시간 후 삭제 또는 읽기 중단된 즉, 일정 패턴을 가진 메일을 스팸으로 판단하여 사용자 별 스팸을 검출할 수 있다. 이어, 검증부(140)는 스팸으로 판단된 전자 메일에 해당하는 메일 데이터의 공통적인 특성을 분석하여 스팸 여부를 검증한다. 이때, 메일 데이터는 발신 측의 메일 주소, 메일 서버, 제목, 보낸 사람 이름, 메일 내용의 사이즈 정보 등을 포함할 수 있다. 예를 들어, 검증부(140)는 스팸으로 판단된 전자 메일의 메일 주소(IP)가 같다거나 메일 서버가 같다거나 하는 등 각각의 메일 데이터가 공통되는 빈도수를 산출한 후 산출된 빈도수로 전자 메일을 분류(sorting)함으로써 스팸 여부를 확신할 수 있다. 또는, 검증부(140)는 스팸으로 판단된 전자 메일의 메일 제목이 특정 패턴으로 유사하거나, 보낸 사람 이름이 일정 범위 이상으로 길거나 혹은 자동 생성된 패턴을 포함하고 있을 경우 스팸인 것으로 확신할 수 있다. 또는, 메일 내용의 텍스트가 많은 메일임에도 불구하고 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일일 경우 스팸일 가능성이 더욱 높으므로 검증부(140)는 메일 내용의 사이즈 정보를 고려하여 스팸 검증을 수행할 수 있다. 즉, 검증부(140)는 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일 중 메일 내용의 사이즈 정보가 일정 크기 이상일 경우 스팸인 것으로 확신할 수 있다. 또는, 검증부(140)는 스팸으로 판단된 전자 메일의 메일 주소가 사용자에 의해 저장 및 관리되는 주소 목록(예컨대, 사용자 주소록)에 포함되거나, 사용자에 의해 발신 또는 회신된 메일의 주소 목록에 포함될 경우 스팸이 아닌 것으로 검증을 수행할 수 있다.Further, the verification unit 140 performs a role of verifying whether or not the spam for the electronic mail determined as spam in the detection unit 130. One embodiment of the present invention can verify whether or not spam in consideration of the behavior patterns of the various users for the e-mail. First, the detection unit 130 may detect spam for each user by determining that a mail having a predetermined pattern as spam is deleted without being executed for each user or deleted or read stopped after an execution time of a predetermined time or less. Subsequently, the verification unit 140 verifies spam by analyzing common characteristics of mail data corresponding to the electronic mail determined as spam. At this time, the mail data may include a mail address of the sender, a mail server, a subject, a sender name, size information of mail contents, and the like. For example, the verification unit 140 calculates a frequency in which each mail data is common, such as the same e-mail address (IP) of the e-mail determined to be spam or the same mail server, and then uses the calculated e-mail as the calculated frequency. You can be sure that you are spam by sorting. Alternatively, the verification unit 140 may be sure that the mail subject of the e-mail determined to be spam is similar in a specific pattern, the sender name is longer than a certain range, or contains an automatically generated pattern. . Alternatively, even if the message has a large amount of text, the mail is deleted or read while the execution time is less than a predetermined time, and thus the spam is more likely to be spam. Verification can be performed. That is, the verification unit 140 may be assured that the message is spam when the size information of the mail content is deleted or read while the execution time is less than or equal to a predetermined time. Alternatively, the verification unit 140 may include an e-mail address of the e-mail determined to be spam in an address list (for example, a user address book) stored and managed by the user, or included in an address list of mail sent or returned by the user. In this case, the verification can be performed as non-spam.

이와 같은 구성의 스팸 검출 시스템은 여러 사용자들이 동일한 패턴으로 삭제한 메일들의 메일 데이터를 분석하여 스팸 여부를 다시 한번 검증함으로써 보다 정확하게 스팸 메일을 검출할 수 있다.The spam detection system having such a configuration can detect the spam mail more accurately by analyzing the mail data of the mails deleted by the various users in the same pattern and verifying the spam once again.

도 3은 본 발명의 일실시예에 있어서, 스팸 검출 방법의 전 과정을 도시한 흐름도이다. 본 발명의 일실시예에 따른 스팸 검출 방법은 도 1을 통해 설명한 스팸 검출 시스템을 통해 수행될 수 있다. 도 3에서는 스팸 검출 시스템을 통해 각각의 단계가 수행되는 과정을 설명함으로써 스팸 검출 방법을 설명한다.3 is a flowchart illustrating a whole process of a spam detection method according to an embodiment of the present invention. The spam detection method according to an embodiment of the present invention may be performed through the spam detection system described with reference to FIG. 1. In FIG. 3, a spam detection method will be described by describing a process in which each step is performed through a spam detection system.

단계(S310)에서 스팸 검출 시스템은 전자 메일을 관리하는 사용자 별 로그 정보 즉, 전자 메일의 실행 또는 삭제와 관련된 로그 정보를 수집하여 분석할 수 있다. 이때, 로그 정보로는 전자 메일의 클릭 로그, 실행 시간 등을 활용할 수 있으며 스팸 검출 시스템은 로그 정보를 통해 전자 메일의 실행 여부, 삭제 여부, 실행 시간 등을 분석할 수 있다.In operation S310, the spam detection system may collect and analyze log information for each user who manages e-mail, that is, log information related to execution or deletion of the e-mail. In this case, the log information may be used as a click log of the e-mail, execution time, etc. The spam detection system may analyze whether the e-mail is executed, deleted or not, and the execution time through the log information.

단계(S320)에서 스팸 검출 시스템은 전자 메일의 로그 정보를 이용하여 전자 메일 내 스팸을 검출할 수 있다. 스팸 검출 시스템은 전자 메일 중 실행되지 않은 상태에서 삭제된 메일, 또는 실행 시간이 일정 시간(예를 들어, 5초) 이하인 상태에서 삭제 또는 읽기 중단된 메일을 검출하여 해당 메일을 스팸으로 판단할 수 있다.In operation S320, the spam detection system may detect spam in the e-mail using the log information of the e-mail. The spam detection system can detect a message deleted while not being executed, or a message deleted or interrupted while the execution time is less than a predetermined time (for example, 5 seconds) and determine that the message is spam. have.

단계(S330)에서 스팸 검출 시스템은 스팸으로 판단된 전자 메일에 대하여 스팸 여부를 검증한다. 스팸 검출 시스템은 스팸으로 판단된 전자 메일의 메일 주소, 메일 서버, 제목, 보낸 사람 이름 등 메일 데이터의 공통적인 특성을 분석하여 스팸 여부를 검증할 수 있다. 예를 들어, 스팸 검출 시스템은 스팸으로 판단된 전자 메일의 메일 주소가 같다거나 메일 서버가 같다거나 하는 등 메일 데이터가 공통되는 빈도수를 산출한 후 산출된 빈도수로 전자 메일을 분류함으로써 스팸 여부를 확신할 수 있다. 또한, 스팸 검출 시스템은 스팸으로 판단된 전자 메일의 메일 제목이 특정 패턴으로 유사하거나, 보낸 사람 이름이 일정 범위 이상으로 길거나 혹은 자동 생성된 패턴을 포함하고 있을 경우 스팸인 것으로 확신할 수 있다. 또한, 스팸 검출 시스템은 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일 중 메일 내용의 사이즈 정보가 일정 크기 이상일 경우 스팸인 것으로 확신할 수 있다. 또한, 스팸 검출 시스템은 스팸으로 판단된 전자 메일의 메일 주소가 사용자에 의해 저장 및 관리되는 주소 목록에 포함되거나, 사용자에 의해 발신 또는 회신된 메일의 주소 목록에 포함될 경우 스팸이 아닌 것으로 검증을 수행할 수 있다.In step S330, the spam detection system verifies whether or not the spam for the e-mail determined to be spam. The spam detection system may verify spam by analyzing common characteristics of mail data such as an e-mail address, a mail server, a subject, and a sender name of the e-mail determined to be spam. For example, a spam detection system can determine whether or not spam is determined by calculating the frequency of common mail data, such as the same email address or the same mail server, and classifying the email by the calculated frequency. can do. In addition, the spam detection system can be assured that the e-mail determined to be spam is similar if the mail subject is similar in a certain pattern, the sender name is longer than a certain range, or contains an automatically generated pattern. In addition, the spam detection system may be assured that the spam is spam when the size information of the contents of the mail is more than a certain size among the mails deleted or read while the execution time is less than the predetermined time. In addition, the spam detection system verifies that the e-mail address of the e-mail determined to be spam is included in the address list stored and managed by the user, or is included in the address list of the e-mail sent or returned by the user. can do.

이와 같이, 본 발명의 일실시예에 따른 스팸 검출 시스템 또는 스팸 검출 방법을 이용하면, 전자 메일을 관리하는 사용자 로그를 활용하여 스팸을 분석함으로써 자동으로 스팸을 검출 및 관리할 수 있다. 더 나아가, 여러 사용자가 동일한 패턴으로 관리한 메일의 공통적인 특성을 분석하여 스팸 여부를 다시 한번 검증함으로써 보다 정확하게 많은 스팸을 필터링 할 수 있다.As such, when the spam detection system or the spam detection method according to an embodiment of the present invention is used, spam can be detected and managed automatically by analyzing spam by using a user log that manages an e-mail. Furthermore, by analyzing the common characteristics of the mails managed by the same pattern by multiple users, the spam can be filtered more accurately by verifying the spam once again.

본 발명에 따른 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 상기 컴퓨터 판독 가능 매체는 프로그램 명령, 파일 데이터, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 상기 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되 어 사용 가능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 상기된 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention can be implemented in the form of program instructions that can be executed by various computer means can be recorded on a computer readable medium. The computer readable medium may include program instructions, file data, data structures, etc. alone or in combination. Program instructions recorded on the media may be those specially designed and constructed for the purposes of the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of computer-readable recording media include magnetic media such as hard disks, floppy disks, and magnetic tape, optical media such as CD-ROMs, DVDs, and magnetic disks, such as floppy disks. Magneto-optical media, and hardware devices specifically configured to store and execute program instructions, such as ROM, RAM, flash memory, and the like. Examples of program instructions include not only machine code generated by a compiler, but also high-level language code that can be executed by a computer using an interpreter or the like. The hardware device described above may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은 상기의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.As described above, the present invention has been described by specific embodiments such as specific components and the like. For those skilled in the art to which the present invention pertains, various modifications and variations are possible.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Therefore, the spirit of the present invention should not be limited to the described embodiments, and all of the equivalents or equivalents of the claims as well as the claims to be described later will belong to the scope of the present invention. .

도 1은 본 발명의 일실시예에 있어서, 스팸 검출 시스템의 내부 구성을 설명하기 위한 블록도이다.1 is a block diagram illustrating an internal configuration of a spam detection system according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 따른 스팸 검출 시스템에서 사용자가 전자 메일을 관리하는 패턴의 일례를 설명하기 위한 도면이다. 2 is a view for explaining an example of a pattern in which a user manages an e-mail in a spam detection system according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 있어서, 스팸 검출 방법의 전 과정을 도시한 흐름도이다.3 is a flowchart illustrating a whole process of a spam detection method according to an embodiment of the present invention.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

110: 메일박스110: Mailbox

120: 분석부120: analysis unit

130: 검출부130: detector

140: 검증부140: verification unit

Claims (19)

전자 메일의 실행 또는 삭제와 관련된 로그 정보를 분석하는 분석부; 및,An analysis unit analyzing log information related to execution or deletion of an e-mail; And, 상기 로그 정보를 이용하여 상기 전자 메일 내 스팸을 검출하는 검출부A detection unit for detecting spam in the e-mail using the log information 를 포함하는 스팸 검출 시스템.Spam detection system comprising a. 제1항에 있어서,The method of claim 1, 상기 로그 정보는 상기 전자 메일의 클릭 로그(click log) 또는 실행 시간(duration time)을 포함하는, 스팸 검출 시스템.And the log information includes a click log or duration time of the e-mail. 제1항에 있어서,The method of claim 1, 상기 로그 정보는 상기 전자 메일의 클릭 로그를 포함하며,The log information includes a click log of the e-mail, 상기 검출부는 상기 클릭 로그를 통해 실행되지 않은 상태에서 삭제된 메일을 스팸으로 판단하는, 스팸 검출 시스템.And the detection unit determines the deleted mail as spam without executing through the click log. 제1항에 있어서,The method of claim 1, 상기 로그 정보는 상기 전자 메일의 실행 시간을 포함하며,The log information includes the execution time of the e-mail, 상기 검출부는 상기 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일을 스팸으로 판단하는, 스팸 검출 시스템.The detection unit, the spam detection system determines that the e-mail deleted or read interrupted while the execution time is less than a predetermined time, spam detection system. 제1항에 있어서,The method of claim 1, 상기 스팸의 메일 데이터를 분석하여 스팸 여부를 검증하는 검증부Verification unit for verifying the spam by analyzing the mail data of the spam 를 더 포함하는, 스팸 검출 시스템.The spam detection system further comprises. 제5항에 있어서,The method of claim 5, 상기 메일 데이터는 발신 측의 메일 주소, 메일 서버, 제목, 보낸 사람 이름 중 적어도 하나를 포함하는, 스팸 검출 시스템.And the mail data includes at least one of a sender's mail address, mail server, subject, and sender's name. 제5항에 있어서,The method of claim 5, 상기 검증부는 상기 스팸에 해당하는 메일 내용의 사이즈 정보에 따라 스팸 여부를 검증하는, 스팸 검출 시스템.And the verification unit verifies whether the spam is spam based on the size information of the contents of the mail corresponding to the spam. 제5항에 있어서,The method of claim 5, 상기 검증부는 상기 스팸에 해당하는 발신 측의 메일 주소가 사용자에 의해 저장된 주소 목록, 혹은 발신 또는 회신된 주소 목록에 포함되는지 여부에 따라 스팸 여부를 검증하는, 스팸 검출 시스템.And the verification unit verifies whether or not the spam is in accordance with whether the mail address of the sender corresponding to the spam is included in a list of addresses stored by a user or a list of sent or returned addresses. 제5항에 있어서,The method of claim 5, 상기 검증부는 복수의 사용자에 대해 검출된 스팸 간의 메일 데이터가 공통되는 빈도수를 산출하여 스팸 여부를 검증하는, 스팸 검출 시스템.And the verification unit verifies spam by calculating a common frequency of mail data among spam detected for a plurality of users. 스팸 검출 시스템에서 스팸을 검출하는 방법에 있어서,In a method for detecting spam in a spam detection system, 상기 스팸 검출 시스템의 분석부에서 전자 메일의 실행 또는 삭제와 관련된 로그 정보를 분석하는 단계; 및,Analyzing log information related to execution or deletion of an e-mail in an analysis unit of the spam detection system; And, 상기 스팸 검출 시스템의 검출부에서 상기 로그 정보를 이용하여 상기 전자 메일 내 스팸을 검출하는 단계Detecting spam in the e-mail using the log information in a detection unit of the spam detection system; 를 포함하는 스팸 검출 방법.Spam detection method comprising a. 제10항에 있어서,The method of claim 10, 상기 로그 정보는 상기 전자 메일의 클릭 로그 또는 실행 시간을 포함하는, 스팸 검출 방법.And the log information includes a click log or execution time of the e-mail. 제10항에 있어서,The method of claim 10, 상기 로그 정보는 상기 전자 메일의 클릭 로그를 포함하며,The log information includes a click log of the e-mail, 상기 스팸을 검출하는 단계는 상기 클릭 로그를 통해 실행되지 않은 상태에서 삭제된 메일을 스팸으로 판단하는, 스팸 검출 방법.The detecting of the spam may include determining that the deleted mail is spam as not being executed through the click log. 제10항에 있어서,The method of claim 10, 상기 로그 정보는 상기 전자 메일의 실행 시간을 포함하며,The log information includes the execution time of the e-mail, 상기 스팸을 검출하는 단계는 상기 실행 시간이 일정 시간 이하인 상태에서 삭제 또는 읽기 중단된 메일을 스팸으로 판단하는, 스팸 검출 방법.The detecting of the spam may include determining that spam is deleted or read while the execution time is less than a predetermined time, as spam. 제10항에 있어서,The method of claim 10, 상기 스팸 검출 시스템의 검증부에서 상기 스팸의 메일 데이터를 분석하여 스팸 여부를 검증하는 단계Verifying the spam by analyzing the mail data of the spam in the verification unit of the spam detection system; 를 더 포함하는, 스팸 검출 방법.Further comprising, spam detection method. 제14항에 있어서,The method of claim 14, 상기 메일 데이터는 발신 측의 메일 주소, 메일 서버, 제목, 보낸 사람 이름 중 적어도 하나를 포함하는, 스팸 검출 방법.And the mail data includes at least one of a sender's mail address, mail server, subject, and sender's name. 제14항에 있어서,The method of claim 14, 상기 스팸 여부를 검증하는 단계는 상기 스팸에 해당하는 메일 내용의 사이즈 정보에 따라 스팸 여부를 검증하는, 스팸 검출 방법.The step of verifying whether or not the spam is a spam detection method for verifying whether or not spam according to the size information of the content of the mail corresponding to the spam. 제14항에 있어서,The method of claim 14, 상기 스팸 여부를 검증하는 단계는 상기 스팸에 해당하는 발신 측의 메일 주소가 사용자에 의해 저장된 주소 목록, 혹은 발신 또는 회신된 주소 목록에 포함되는지 여부에 따라 스팸 여부를 검증하는, 스팸 검출 방법.The step of verifying whether or not the spam is a spam detection method for verifying whether or not the spam according to whether the mail address of the sender corresponding to the spam is included in the list of addresses stored by the user or the list of sent or returned addresses. 제14항에 있어서,The method of claim 14, 상기 스팸 여부를 검증하는 단계는 복수의 사용자에 대해 검출된 스팸 간의 메일 데이터가 공통되는 빈도수를 산출하여 스팸 여부를 검증하는, 스팸 검출 방법.The step of verifying whether the spam is spam detection method for verifying the spam by calculating a common frequency of the mail data between the detected spam for a plurality of users. 제10항 내지 제19항 중 어느 한 항의 방법을 수행하는 프로그램을 기록한 컴퓨터 판독 가능 기록 매체.A computer readable recording medium having recorded thereon a program for performing the method of claim 10.
KR1020090104134A 2009-10-30 2009-10-30 System and method for detecting spam using user log KR101081721B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090104134A KR101081721B1 (en) 2009-10-30 2009-10-30 System and method for detecting spam using user log

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090104134A KR101081721B1 (en) 2009-10-30 2009-10-30 System and method for detecting spam using user log

Publications (2)

Publication Number Publication Date
KR20110047488A true KR20110047488A (en) 2011-05-09
KR101081721B1 KR101081721B1 (en) 2011-11-08

Family

ID=44238787

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090104134A KR101081721B1 (en) 2009-10-30 2009-10-30 System and method for detecting spam using user log

Country Status (1)

Country Link
KR (1) KR101081721B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206269A (en) * 2013-04-15 2014-10-30 ウ ジ−ヒュンWOO, Ji−Hyun Pipe connection device
WO2019054526A1 (en) * 2017-09-12 2019-03-21 (주)지란지교시큐리티 Method for managing spam mail

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014206269A (en) * 2013-04-15 2014-10-30 ウ ジ−ヒュンWOO, Ji−Hyun Pipe connection device
WO2019054526A1 (en) * 2017-09-12 2019-03-21 (주)지란지교시큐리티 Method for managing spam mail

Also Published As

Publication number Publication date
KR101081721B1 (en) 2011-11-08

Similar Documents

Publication Publication Date Title
US10616272B2 (en) Dynamically detecting abnormalities in otherwise legitimate emails containing uniform resource locators (URLs)
US9501744B1 (en) System and method for classifying data
US9349016B1 (en) System and method for user-context-based data loss prevention
CA2512194C (en) Framework to enable integration of anti-spam technologies
US9390240B1 (en) System and method for querying data
US8843566B2 (en) Securing outbound mail
CN110519150B (en) Mail detection method, device, equipment, system and computer readable storage medium
US20110246584A1 (en) Personalized Email Interactions Applied To Global Filtering
US10862845B2 (en) Mail bot and mailing list detection
US20060190533A1 (en) System and Method for Registered and Authenticated Electronic Messages
CN109039874B (en) Mail auditing method and device based on behavior analysis
Karagiannis et al. Behavioral profiles for advanced email features
US20070124389A1 (en) Anti-spam application storage system
JP6039378B2 (en) Unauthorized mail determination device, unauthorized mail determination method, and program
KR100977180B1 (en) Method, apparatus and computer-readable recording medium for filtering spam mail
KR101081721B1 (en) System and method for detecting spam using user log
CN108696422B (en) Electronic mail processing apparatus and electronic mail processing method
Johansen et al. Email Communities of Interest.
CN102760130A (en) Information processing method and device
JP6316380B2 (en) Unauthorized mail determination device, unauthorized mail determination method, and program
KR101086547B1 (en) System and method for processing spam by analysis of accompanying url in mail
JP2007018201A (en) Institution communication analyzing device and method
TWI784327B (en) Mail sending and analysis method
CN109391535B (en) Domain-level contact person determining method, and junk mail judging method and device
CN118368119A (en) Fishing mail detection method based on attachment

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20140925

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20151102

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20171011

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20181101

Year of fee payment: 8