KR101324459B1 - System and method for e-mail categorization - Google Patents

System and method for e-mail categorization Download PDF

Info

Publication number
KR101324459B1
KR101324459B1 KR1020090095506A KR20090095506A KR101324459B1 KR 101324459 B1 KR101324459 B1 KR 101324459B1 KR 1020090095506 A KR1020090095506 A KR 1020090095506A KR 20090095506 A KR20090095506 A KR 20090095506A KR 101324459 B1 KR101324459 B1 KR 101324459B1
Authority
KR
South Korea
Prior art keywords
category
ranking
weight
mail
email
Prior art date
Application number
KR1020090095506A
Other languages
Korean (ko)
Other versions
KR20110038279A (en
Inventor
김상욱
장민희
채수민
Original Assignee
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한양대학교 산학협력단 filed Critical 한양대학교 산학협력단
Priority to KR1020090095506A priority Critical patent/KR101324459B1/en
Publication of KR20110038279A publication Critical patent/KR20110038279A/en
Application granted granted Critical
Publication of KR101324459B1 publication Critical patent/KR101324459B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/60Business processes related to postal services

Landscapes

  • Business, Economics & Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

이메일 카테고리 분류 시스템 및 방법을 개시한다. 카테고리 분류 시스템은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 형태소 분석부, 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 의사결정트리 생성부, 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 카테고리 선택부, 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 카테고리별 가중치 계산부 및 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 카테고리 랭킹 결정부를 포함한다.Disclosed are an email category classification system and method. The category classification system generates a decision tree based on the morphological analysis unit for generating morphological analysis results by analyzing the morphemes of the contents included in the input e-mail, and based on the morphological analysis results for the e-mails corresponding to the categories previously classified in the e-mail system. Decision tree generation unit, a category selection unit for selecting one of the pre-categorized category based on the stemming analysis result and the decision tree for the newly received e-mail, the newly received e-mail in the e-mail contained in each of the pre-categorized categories And a category ranking calculator configured to calculate a weight for each category according to the number of mail addresses associated with the category and a category ranking determiner for determining a category ranking of the classified category based on the selected category and the weight for each category.

레이저, 통행량, 이동량, 평균 이동(mean shift) Laser, traffic, travel, mean shift

Description

이메일 카테고리 분류 시스템 및 방법{SYSTEM AND METHOD FOR E-MAIL CATEGORIZATION}Email category classification system and method {SYSTEM AND METHOD FOR E-MAIL CATEGORIZATION}

본 발명의 실시예들은 이메일 카테고리 분류 시스템 및 방법에 관한 것이다.Embodiments of the present invention relate to an email categorization system and method.

현재 대부분의 기업이나 기타 연구기관에서는 업무의 효율성을 높이기 위해 사원 간 의사소통 및 업무보고 등을 이메일로 하는 경우가 많다. 이 때, 각 사용자마다 하루에 수십, 수백 통의 이메일을 주고받게 되는데 이러한 이메일들은 업무 상 추후에도 필요하다. 따라서 많은 양의 이메일들을 삭제하지 않고 추후에 쉽게 열람할 수 있도록 미리 정의되어 있는 카테고리에 분류할 필요가 있다. 그러나 하루에도 수십, 수백 통의 이메일을 주고받는 상황에서 직접 이메일들을 하나하나 카테고리에 넣어 관리하기는 쉽지 않다.Currently, most companies and other research institutes often e-mail communication between employees and report on their work in order to improve work efficiency. At this point, each user sends and receives dozens and hundreds of emails a day, which are needed later in business. Therefore, it is necessary to classify into a predefined category so that a large amount of emails can be easily viewed later without deleting a large amount of emails. However, with dozens and hundreds of emails sent and received each day, it's not easy to manage them by putting them in categories.

일례로, 마이크로소프트 아웃룩(Microsoft Outlook)과 같은 기존의 이메일 시스템에서 이메일 관리를 위해 이메일 주소나 제목을 이용하여 규칙을 설정하고 이 규칙에 따라 이메일을 카테고리대로 분류하는 기술을 제공하고 있다. 그러나 이 규칙을 한번 설정하면 그 규칙대로만 이메일이 분류되기 때문에 자신이 의도하지 않은 방향으로 이메일이 분류될 수 있다. 예를 들어, 이메일 주소로 분류 했을 때, 그 주소로 오는 이메일은 무조건 사용자가 지정한 카테고리로만 분류된다. 또한, 제목의 특정 단어로 분류하면 그 단어가 들어가는 이메일 또한 사용자가 지정한 특정 카테고리로만 분류된다. 보낸 사람의 이메일 주소 또는 특정 단어가 들어간다고 해서 항상 특정 카테고리로 분류한다고 하면 다른 카테고리로 분류되어야 할 이메일들이 엉뚱한 카테고리로 잘못 분류될 수 있어 오히려 사용자의 편의성을 저해하게 된다.For example, existing email systems, such as Microsoft Outlook, provide a technique for managing email using email addresses or subjects, and categorizing emails into categories based on these rules. However, once you set this rule, your email will be classified only according to that rule, so that your email can be classified in a way you didn't intend. For example, when categorized by e-mail address, e-mail addressed to that address is unconditionally categorized into a category that you specify. In addition, if you categorize a specific word in the subject, the email containing the word is also categorized only into a specific category specified by the user. If the email address of a sender or a specific word is always classified into a specific category, emails that should be classified into other categories may be misclassified into a wrong category, thereby impairing user convenience.

본 명세서에서는, 효율적인 이메일 카테고리 분류 시스템 및 방법이 제안된다.In this specification, an efficient email category classification system and method are proposed.

형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천할 수 있는 카테고리 분류 시스템 및 방법이 제안된다.A category classification system and method are proposed that can select categories for newly received emails using stemming and decision trees, and recommend categories to users based on mail addresses and selected categories of newly received emails.

형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 새로 수신된 이메일의 카테고리를 결정할 수 있는 카테고리 분류 시스템 및 방법이 제안된다.A category classification system and method for selecting categories for newly received emails using stemming and decision trees and determining categories of newly received emails based on the newly received email addresses and selected categories are proposed. do.

본 발명의 일실시예에 따른 카테고리 분류 시스템은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 형태소 분석부, 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 의사결정트리 생성부, 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 카테고리 선택부, 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 카테고리별 가중치 계산부 및 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 카테고리 랭킹 결정부를 포함한다.A category classification system according to an embodiment of the present invention includes a morpheme analysis unit configured to generate a morpheme analysis result by analyzing a morpheme of contents included in an input email, and a morpheme analysis result for an e-mail corresponding to a category previously classified in an e-mail system. Decision tree generation unit for generating a decision tree based on the morphological analysis results for the newly received e-mail, a category selection unit for selecting one of the pre-categorized category based on the decision tree, Category ranking that calculates the category ranking of the classified categories based on the selected category and the category and weight based on the category weight calculation unit for calculating the weight for each category according to the number of included email addresses associated with the newly received email It includes a decision unit.

본 발명의 일측면에 따르면, 카테고리 분류 시스템은 카테고리 랭킹에 기초 하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천하는 카테고리 추천부를 더 포함할 수 있다.According to an aspect of the present invention, the category classification system may further include a category recommending unit for recommending at least one category for newly received e-mail based on the category ranking.

본 발명의 일측면에 따르면, 카테고리 분류 시스템은 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정하는 카테고리 결정부를 더 포함할 수 있다.According to an aspect of the present invention, the category classification system may further include a category determination unit that determines a category of a newly received e-mail as a category corresponding to the highest ranking of the category ranking.

본 발명의 일측면에 따르면, 형태소 분석부는 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다.According to an aspect of the present invention, the morpheme analysis unit analyzes the morphemes of the contents included in the email, checks the words of the pre-set parts of the extracted words, and selects the main words according to the number of occurrences of each of the confirmed words. Can be generated.

본 발명의 일측면에 따르면, 의사결정트리 생성부는 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다.According to an aspect of the present invention, the decision tree generation unit sets a word corresponding to a stemming analysis result of an email corresponding to a pre-categorized category as an attribute that is a non-terminal node capable of making a decision, and sets a pre-categorized category as a pseudo As a result of the determination, the decision tree can be generated by setting the class as a terminal node.

본 발명의 일측면에 따르면, 카테고리 선택부는 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다.According to an aspect of the present invention, the category selector determines a class that is a terminal node by comparing a word corresponding to a stemming analysis result of a newly received email with an attribute that is a non-terminal node of a decision tree, and a category corresponding to the class. Can be selected.

본 발명의 일측면에 따르면, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리별 가중치 계산부는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다.According to an aspect of the present invention, the mail address may include a sender address and a reference mail address, and the weight calculator for each category may calculate weights for each category based on the number of sender addresses and reference mail addresses included in the category. Can be.

본 발명의 일측면에 따르면, 메일 주소는 보낸 사람 주소 및 참조 메일 주소 를 포함할 수 있고, 카테고리별 가중치 계산부는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수 있다.According to an aspect of the present invention, the mail address may include a sender address and a reference mail address, and the weight calculation unit for each category gives different weights to the number of each of the sender address and the reference mail address included in the category. In addition, the sum of the values given different weights may be calculated as the weight for each category.

본 발명의 일측면에 따르면, 카테고리 랭킹 결정부는 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다.According to an aspect of the present invention, the category ranking determiner determines the category ranking in the order of the weight for each category, the category ranking by adjusting the rank of the selected category.

본 발명의 일측면에 따르면, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정될 수 있다.According to an aspect of the present invention, the selected category may be adjusted to have the highest rank when the weight for each category is equal to or greater than a predetermined value.

본 발명의 일측면에 따르면, 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.According to an aspect of the present invention, the selected category may be additionally assigned a weight that is pre-selected to the weight for each category to adjust the ranking.

본 발명의 일실시예에 따른 카테고리 분류 방법은 형태소 분석부가 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 단계, 의사결정트리 생성부가 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 단계, 카테고리 선택부가 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 단계, 카테고리별 가중치 계산부가 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 단계 및 카테고리 랭킹 결정부가 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 단계를 포함한다.In the category classification method according to an embodiment of the present invention, a morpheme analysis result is generated by analyzing a morpheme of contents included in an e-mail inputted by a morpheme analysis unit, and a decision tree generation unit corresponds to a category previously classified in an e-mail system. Generating a decision tree based on the stemming result of the e-mail, the category selection unit selecting one of pre-categorized categories based on the stemming analysis result and the decision tree of the newly received e-mail, and the weight for each category The calculating unit calculates the weight for each category according to the number of emails associated with the newly received email in the email included in each of the pre-categorized categories, and the category ranking determiner is classified based on the selected category and the weight for each category. Determine the category ranking of It includes the steps:

형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천할 수 있다.The stemming and decision tree may be used to select a category for the newly received email and to recommend the category to the user based on the mail address and the selected category of the newly received email.

형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 새로 수신된 이메일의 카테고리를 자동으로 결정할 수 있다.The stemming and decision tree may be used to select a category for the newly received email and to automatically determine the category of the newly received email based on the mail address and the selected category of the newly received email.

이메일의 내용에 기초하는 의사결정트리 뿐만 아니라 메일 주소에 기초한 가중치를 더 이용함으로써, 새로 입력되는 이메일에 대한 카테고리를 사용자에게 유동적으로 추천할 수 있다.By further using weights based on mail addresses as well as decision trees based on the contents of emails, categories for newly entered emails can be flexibly recommended to the user.

카테고리의 랭킹을 결정하고, 그 중 기선정된 수의 카테고리를 사용자에게 추천함으로써, 새로 입력되는 이메일에 대한 카테고리를 유연하게 결정할 수 있다.By determining the ranking of the categories and recommending a predetermined number of categories to the user, it is possible to flexibly determine the category for the newly input email.

이하 첨부된 도면을 참조하여 본 발명에 따른 다양한 실시예를 상세히 설명하기로 한다.Hereinafter, various embodiments of the present disclosure will be described in detail with reference to the accompanying drawings.

도 1은 본 발명의 일실시예에 있어서, 카테고리 분류 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 카테고리 분류 시스템(100)은 도 1에 도시된 바와 같이 형태소 분석부(110), 의사결정트리 결정부(120), 카테고리 선택부(130), 카테고리별 가중치 계산부(140), 카테고리 랭킹 결정부(150) 및 카테고리 추천부(160)를 포함할 수 있다.1 is a block diagram illustrating an internal configuration of a category classification system according to an embodiment of the present invention. As shown in FIG. 1, the category classification system 100 according to the present embodiment includes a morpheme analysis unit 110, a decision tree determination unit 120, a category selection unit 130, and a weight calculation unit 140 for each category. , The category ranking determiner 150 and the category recommender 160 may be included.

형태소 분석부(110)는 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성한다. 이때, 이메일의 내용에 대해 형태소를 분석하기 위해 기존에 공지된 형태소 분석 방법들 또는 형태소 분석기들 중 하나가 선택적으로 이용될 수 있고, 형태소 분석부(110)는 분석된 형태소를 이용하여 형태소 분석결과를 생성할 수 있다. 여기서, 일례로, 형태소 분석부(110)는 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다.The morpheme analysis unit 110 analyzes the morphemes of the contents included in the input email to generate a morpheme analysis result. In this case, one of the conventionally known morphological analysis methods or morphological analyzers may be selectively used to analyze the morpheme with respect to the contents of the email, and the morphological analysis unit 110 uses the analyzed morpheme to determine the morpheme analysis result. Can be generated. Here, as an example, the morpheme analysis unit 110 checks a word of a pre-set part of the words extracted by analyzing the morpheme of the contents included in the email, and selects a main word according to the number of occurrences of each identified word to analyze the morpheme. Can produce a result.

의사결정트리 결정부(120)는 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성한다. 여기서, 의사결정트리 생성부(120)는 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다. 이때, 생성되는 의사결정트리는 파일의 형태로 저장될 수 있다. 즉, 카테고리 분류 시스템(100)이 구동될 때마다 의사결정트리를 생성하는 것이 아니라, 한번 생성된 의사결정트리를 파일의 형태로 저장하고, 카테고리 분류 시스템(100)이 구동될 때 해당 파일에서 의사결정트리를 불러와 이용할 수 있다.The decision tree determiner 120 generates a decision tree based on the result of the morpheme analysis of the e-mail corresponding to the category previously classified in the e-mail system. Here, the decision tree generation unit 120 sets a word corresponding to a stemming analysis result of an email corresponding to a pre-categorized category as an attribute that is a non-terminal node capable of making a decision, and sets the pre-categorized category as a decision. As a result, the decision tree can be generated by setting the class as a terminal node. In this case, the generated decision tree may be stored in the form of a file. That is, instead of generating a decision tree every time the category classification system 100 is driven, the decision tree is stored in the form of a file, and when the category classification system 100 is driven, the pseudo tree is stored in the file. Can invoke and use decision tree.

카테고리 선택부(130)는 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택한다. 이때, 카테고 리 선택부(130)는 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다. 예를 들어, 의사결정트리의 가지 중에 애트리뷰트 '보고', 애트리뷰트 '초안' 및 클래스 '초안검토'로 연결되는 가지가 존재하고, 새로 수신된 이메일에서 추출된 주요단어 중 '보고'와 '초안'이 존재한다면, 새로 수신된 이메일의 카테고리를 '초안검토'로 선택할 수 있다.The category selector 130 selects one of the pre-categorized categories based on the stemming analysis result and the decision tree for the newly received e-mail. At this time, the category selector 130 determines a class that is a terminal node by comparing a word corresponding to a result of stemming analysis of a newly received email with an attribute that is a non-terminal node of a decision tree, and a category corresponding to the class. Can be selected. For example, there are branches in the decision tree that link to attribute 'report', attribute 'draft' and class 'draft review', and 'report' and 'draft' among the key words extracted from newly received email. If present, you can select the category of the newly received email as 'Draft Review'.

카테고리별 가중치 계산부(140)는 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산한다. 즉, 본 실시예에서는 의사결정트리에 기초하여 결정된 카테고리뿐만 아니라 메일 주소를 이용하여 계산되는 카테고리별 가중치가 새로 수신된 이메일의 카테고리를 결정하는데 더 이용될 수 있다.The category weight calculation unit 140 calculates the weight for each category according to the number of email addresses associated with the newly received email in the email included in each of the previously classified categories. That is, in the present embodiment, the weights for each category calculated using the mail address as well as the category determined based on the decision tree may be further used to determine the category of the newly received e-mail.

이때, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리별 가중치 계산부(140)는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다. 예를 들어, 새로 수신된 이메일 A의 보낸 사람 주소와 참조 메일 주소가 카테고리 B에 각각 5번 및 6번 등장하고, 카테고리 C에 각각 3번 및 2번 등장한다면, 카테고리 B의 카테고리별 가중치는 11(5+6)의 값을, 카테고리 C의 카테고리별 가중치는 5(3+2)의 값을 각각 가질 수 있다.In this case, the mail address may include a sender address and a reference mail address, and the weight calculator 140 for each category may calculate a weight for each category based on the number of sender addresses and reference mail addresses included in the category. . For example, if the sender address and reference email address of a newly received email A appear five times and six times in category B and three and two times in category C, respectively, the weighting of category B in category B is 11 A value of (5 + 6) and a category-specific weight of category C may each have a value of 5 (3 + 2).

또한, 이와는 다르게, 카테고리별 가중치 계산부(140)는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서 로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수도 있다. 예를 들어, 보낸 사람 주소의 등장횟수에는 1의 가중치를 참조 메일 주소의 등장횟수에는 0.5의 가중치가 부여될 수 있다. 이 경우, 상술한 일례에서 카테고리 B의 카테고리별 가중치는 8(5 X 1 + 6 X 0.5)의 값을, 카테고리 C의 카테고리별 가중치는 4(3 X 1 + 2 X 0.5)의 값을 각각 가질 수 있다.Also, differently, the weight calculator 140 for each category assigns different weights to the number of sender addresses and reference email addresses included in the category, and weights the sum of the weighted values to different categories. It can also be calculated as For example, a weight of 1 may be assigned to the number of appearances of the sender address and a weight of 0.5 may be assigned to the number of appearances of the reference mail address. In this case, in the above-described example, the category-weighted category B has a value of 8 (5 X 1 + 6 X 0.5), and the category-weighted category C has a value of 4 (3 X 1 + 2 X 0.5). Can be.

카테고리 랭킹 결정부(150)는 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정한다. 예를 들어, 카테고리 랭킹 결정부(150)는 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다. 이때, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정되거나 또는 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.The category ranking determiner 150 determines the category ranking of the classified category based on the selected category and the weight for each category. For example, the category ranking determination unit 150 may determine the rank of the category in the order of the high weight for each category, and determine the category ranking by adjusting the rank of the selected category. In this case, when the weight of each category is greater than or equal to a predetermined value, the selected category may be adjusted to have the highest rank, or the selected category may be additionally assigned to the weight of the corresponding category and the ranking may be adjusted.

예를 들어, 카테고리 A, B, C, D 및 E에 대해서 각각의 카테고리별 가중치가 10, 6, 3, 2, 1이고, 카테고리 C가 카테고리 선택부(130)에 의해 선택되었고, 기선정된 값이 '1'이라고 가정하자. 이때, 카테고리 랭킹은 카테고리별 가중치에 기초하여 [A(10), B(6), C(3), D(2), E(1)]의 순서로 결정된 후, 선택된 카테고리 C가 최상위의 순위를 갖도록 조정될 수 있다. 이때, 최종적으로 결정되는 카테고리 랭킹의 순서는 [C(3), A(10), B(6), D(2), E(1)]와 같이 나타날 수 있다.For example, the weight for each category is 10, 6, 3, 2, 1 for category A, B, C, D, and E, and category C is selected by category selector 130, and is pre-selected. Suppose the value is '1'. At this time, the category ranking is determined in the order of [A (10), B (6), C (3), D (2), E (1)] based on the weight of each category, and then the selected category C is ranked highest. It can be adjusted to have. In this case, the order of category ranking finally determined may appear as [C (3), A (10), B (6), D (2), E (1)].

또는, 선택된 카테고리 C에 대해 추가로 기선정된 가중치 '5'를 부여할 수도 있다. 이 경우, 최종적으로 결정되는 카테고리 랭킹의 순서는 [A(10), C(3+5), B(6), D(2), E(1)]와 같이 나타날 수 있다.Alternatively, the preselected weight '5' may be added to the selected category C. In this case, the order of category ranking finally determined may appear as [A (10), C (3 + 5), B (6), D (2), E (1)].

카테고리 추천부(160)는 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천한다. 즉, 카테고리 추천부(160)는 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대한 카테고리를 사용자에게 추천할 수 있다. 예를 들어, 카테고리 랭킹에 포함된 카테고리 중 상위 '3'개의 카테고리를 새로운 이메일에 대한 카테고리로서 추천할 수 있다.The category recommender 160 recommends at least one category for newly received emails based on the category ranking. That is, the category recommendation unit 160 may recommend a category for a newly received email to the user based on the category ranking. For example, the top '3' categories of the categories included in the category ranking may be recommended as categories for the new email.

이때, 본 발명의 다른 실시예에 따르면, 카테고리 분류 시스템(100)은 카테고리 추천부(160) 대신, 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정하는 카테고리 결정부(미도시)를 포함할 수도 있다. 이 경우, 카테고리 결정부는 카테고리 랭킹에 포함된 카테고리 중 가장 상위의 랭킹에 해당하는 카테고리를 새로 수신된 이메일의 카테고리로서 결정함으로써, 새로 수신된 이메일이 자동으로 분류되도록 할 수 있다.At this time, according to another embodiment of the present invention, the category classification system 100, instead of the category recommending unit 160, a category determination unit (not shown) to determine the category of the newly received e-mail as a category corresponding to the highest ranking of the category ranking (not shown) May be included). In this case, the category determining unit may automatically classify the newly received email by determining a category corresponding to the highest ranking among the categories included in the category ranking as the category of the newly received email.

또한, 카테고리 분류 시스템(100)은 카테고리 추천부(160)와 카테고리 결정부를 모두 포함하고, 사용자에게 카테고리 추천부(160)와 카테고리 결정부 중 원하는 모드를 결정하도록 하고, 결정된 모드에 따라, 새로 수신된 이메일의 카테고리를 자동으로 결정하거나 또는 적어도 하나의 카테고리를 사용자에게 추천할 수 있다.In addition, the category classification system 100 includes both the category recommendation unit 160 and the category determination unit, and allows the user to determine a desired mode among the category recommendation unit 160 and the category determination unit, and newly receives according to the determined mode. May automatically determine the category of a given email or recommend at least one category to the user.

도 2는 본 발명의 일실시예에 있어서, 카테고리 분류 방법을 도시한 흐름도이다. 본 실시예에 따른 카테고리 분류 방법은 도 1을 통해 설명한 카테고리 분류 시스템(100)에 의해 수행될 수 있다. 도 2에서는 카테고리 분류 시스템(100)에 의 해 각각의 단계가 수행되는 과정을 설명함으로써 카테고리 분류 방법을 설명한다.2 is a flowchart illustrating a category classification method according to an embodiment of the present invention. The category classification method according to the present embodiment may be performed by the category classification system 100 described with reference to FIG. 1. In FIG. 2, a category classification method will be described by describing a process in which each step is performed by the category classification system 100.

단계(210)에서 카테고리 분류 시스템(100)은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성한다. 이때, 이메일의 내용에 대해 형태소를 분석하기 위해 기존에 공지된 형태소 분석 방법들 또는 형태소 분석기들 중 하나가 선택적으로 이용될 수 있고, 카테고리 분류 시스템(100)은 분석된 형태소를 이용하여 형태소 분석결과를 생성할 수 있다. 여기서, 일례로, 카테고리 분류 시스템(100)은 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다. 여기서, 입력되는 이메일은 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일과 새로 수신된 이메일을 포함할 수 있다.In step 210, the category classification system 100 analyzes the morphemes of the contents included in the input e-mail to generate a morpheme analysis result. In this case, one of the conventionally known morphological analysis methods or morphological analyzers may be selectively used to analyze the morpheme with respect to the content of the email, and the category classification system 100 may use the analyzed morpheme to determine the morpheme analysis result. Can be generated. Here, as an example, the category classification system 100 analyzes the morphemes of the contents included in the email, checks the words of the pre-set parts of the extracted words, and selects the main words according to the number of occurrences of the identified words to analyze the morphemes. Can produce a result. Here, the input e-mail may include an e-mail corresponding to a category previously classified in the e-mail system and a newly received e-mail.

단계(220)에서 카테고리 분류 시스템(100)은 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성한다. 여기서, 카테고리 분류 시스템(100)은 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다. 이때, 생성되는 의사결정트리는 파일의 형태로 저장될 수 있다. 즉, 카테고리 분류 시스템(100)이 구동될 때마다 의사결정트리를 생성하는 것이 아니라, 한번 생성된 의사결정트리를 파일의 형태로 저장하고, 카테고리 분류 시스템(100)이 구동될 때 해당 파일에서 의사결정트리를 불러와 이용할 수 있다. 즉, 이러한 단계(220)은 새로 수신된 이메일의 카테고리를 분류하기 위한 전처리 단계일 수 있다.In step 220, the category classification system 100 generates a decision tree based on the morphological analysis result of the email corresponding to the category previously classified in the email system. Here, the category classification system 100 sets a word corresponding to a stemming result of an email corresponding to a pre-categorized category as an attribute that is a non-terminal node capable of making a decision, and sets the pre-categorized category as a result of the decision. In addition, the decision tree may be generated by setting the class as a terminal node. In this case, the generated decision tree may be stored in the form of a file. That is, instead of generating a decision tree every time the category classification system 100 is driven, the decision tree is stored in the form of a file, and when the category classification system 100 is driven, the pseudo tree is stored in the file. Can invoke and use decision tree. That is, this step 220 may be a preprocessing step for classifying a category of newly received email.

단계(230)에서 카테고리 분류 시스템(100)은 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택한다. 이때, 카테고리 분류 시스템(100)은 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다. 예를 들어, 의사결정트리의 가지 중에 애트리뷰트 '보고', 애트리뷰트 '초안' 및 클래스 '초안검토'로 연결되는 가지가 존재하고, 새로 수신된 이메일에서 추출된 주요단어 중 '보고'와 '초안'이 존재한다면, 새로 수신된 이메일의 카테고리를 '초안검토'로 선택할 수 있다.In operation 230, the category classification system 100 selects one of pre-classified categories based on the stemming analysis result and the decision tree for the newly received e-mail. At this time, the category classification system 100 compares the word corresponding to the stemming result of the newly received e-mail with an attribute that is a non-terminal node of the decision tree to determine a class that is a terminal node and select a category corresponding to the class. Can be. For example, there are branches in the decision tree that link to attribute 'report', attribute 'draft' and class 'draft review', and 'report' and 'draft' among the key words extracted from newly received email. If present, you can select the category of the newly received email as 'Draft Review'.

단계(240)에서 카테고리 분류 시스템(100)은 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산한다. 즉, 본 실시예에서는 의사결정트리에 기초하여 결정된 카테고리뿐만 아니라 메일 주소를 이용하여 계산되는 카테고리별 가중치가 새로 수신된 이메일의 카테고리를 결정하는데 더 이용될 수 있다.In operation 240, the category classification system 100 calculates a weight for each category according to the number of e-mail addresses associated with newly received e-mails included in e-mails included in each of the pre-categorized categories. That is, in the present embodiment, the weights for each category calculated using the mail address as well as the category determined based on the decision tree may be further used to determine the category of the newly received e-mail.

이때, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리 분류 시스템(100)은 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다. 예를 들어, 새로 수신된 이메일 A의 보낸 사람 주소와 참조 메일 주소가 카테고리 B에 각각 5번 및 6번 등장 하고, 카테고리 C에 각각 3번 및 2번 등장한다면, 카테고리 B의 카테고리별 가중치는 11(5+6)의 값을, 카테고리 C의 카테고리별 가중치는 5(3+2)의 값을 각각 가질 수 있다.In this case, the mail address may include a sender address and a reference mail address, and the category classification system 100 may calculate a weight for each category based on the number of sender addresses and reference mail addresses included in the category. For example, if the sender address and the reference email address of a newly received email A appear five times and six times in category B, and three and two times in category C, respectively, the weighting of category B in category B is 11 A value of (5 + 6) and a category-specific weight of category C may each have a value of 5 (3 + 2).

또한, 이와는 다르게, 카테고리 분류 시스템(100)은 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수도 있다. 예를 들어, 보낸 사람 주소의 등장횟수에는 1의 가중치를 참조 메일 주소의 등장횟수에는 0.5의 가중치가 부여될 수 있다. 이 경우, 상술한 일례에서 카테고리 B의 카테고리별 가중치는 8(5 X 1 + 6 X 0.5)의 값을, 카테고리 C의 카테고리별 가중치는 4(3 X 1 + 2 X 0.5)의 값을 각각 가질 수 있다.Alternatively, the category classification system 100 may assign different weights to the number of sender addresses and reference email addresses included in the category, and calculate the sum of the weighted values as the weight for each category. have. For example, a weight of 1 may be assigned to the number of appearances of the sender address and a weight of 0.5 may be assigned to the number of appearances of the reference mail address. In this case, in the above-described example, the category-weighted category B has a value of 8 (5 X 1 + 6 X 0.5), and the category-weighted category C has a value of 4 (3 X 1 + 2 X 0.5). Can be.

단계(250)에서 카테고리 분류 시스템(100)은 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정한다. 예를 들어, 카테고리 분류 시스템(100)은 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다. 이때, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정되거나 또는 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.In operation 250, the category classification system 100 determines a category ranking of the classified category based on the selected category and the weight for each category. For example, the category classification system 100 may determine the rank of the category in the order of the high weight for each category, and determine the category ranking by adjusting the rank of the selected category. In this case, when the weight of each category is greater than or equal to a predetermined value, the selected category may be adjusted to have the highest rank, or the selected category may be additionally assigned to the weight of the corresponding category and the ranking may be adjusted.

예를 들어, 카테고리 A, B, C, D 및 E에 대해서 각각의 카테고리별 가중치가 10, 6, 3, 2, 1이고, 카테고리 C가 단계(230)에서 선택되었고, 기선정된 값이 '1'이라고 가정하자. 이때, 카테고리 랭킹은 카테고리별 가중치에 기초하여 [A(10), B(6), C(3), D(2), E(1)]의 순서로 결정된 후, 선택된 카테고리 C가 최상위의 순위를 갖도록 조정될 수 있다. 이때, 최종적으로 결정되는 카테고리 랭킹의 순서는 [C(3), A(10), B(6), D(2), E(1)]와 같이 나타날 수 있다.For example, for each of categories A, B, C, D, and E, the weight for each category is 10, 6, 3, 2, 1, category C is selected in step 230, and the predetermined value is' Assume 1 '. At this time, the category ranking is determined in the order of [A (10), B (6), C (3), D (2), E (1)] based on the weight of each category, and then the selected category C is ranked highest. It can be adjusted to have. In this case, the order of category ranking finally determined may appear as [C (3), A (10), B (6), D (2), E (1)].

또는, 선택된 카테고리 C에 대해 추가로 기선정된 가중치 '5'를 부여할 수도 있다. 이 경우, 최종적으로 결정되는 카테고리 랭킹의 순서는 [A(10), C(3+5), B(6), D(2), E(1)]와 같이 나타날 수 있다.Alternatively, the preselected weight '5' may be added to the selected category C. In this case, the order of category ranking finally determined may appear as [A (10), C (3 + 5), B (6), D (2), E (1)].

단계(260)에서 카테고리 분류 시스템(100)은 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천한다. 즉, 카테고리 분류 시스템(100)은 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대한 카테고리를 사용자에게 추천할 수 있다. 예를 들어, 카테고리 랭킹에 포함된 카테고리 중 상위 '3'개의 카테고리를 새로운 이메일에 대한 카테고리로서 추천할 수 있다.In step 260, the category classification system 100 recommends at least one category for newly received email based on the category ranking. That is, the category classification system 100 may recommend a category for the newly received email to the user based on the category ranking. For example, the top '3' categories of the categories included in the category ranking may be recommended as categories for the new email.

이때, 본 발명의 다른 실시예에 따르면, 카테고리 분류 시스템(100)은 단계(260)에서 카테고리를 추천하는 대신, 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정할 수도 있다. 이 경우, 카테고리 분류 시스템(100)은 카테고리 랭킹에 포함된 카테고리 중 가장 상위의 랭킹에 해당하는 카테고리를 새로 수신된 이메일의 카테고리로서 결정함으로써, 새로 수신된 이메일이 자동으로 분류되도록 할 수 있다.At this time, according to another embodiment of the present invention, instead of recommending a category in step 260, the category classification system 100 may determine the category of the newly received e-mail as a category corresponding to the highest ranking of the category ranking. In this case, the category classification system 100 may automatically classify the newly received email by determining a category corresponding to the highest ranking among the categories included in the category ranking as a category of newly received email.

또한, 카테고리 분류 시스템(100)은 카테고리를 추천하기 위한 모드와 카테고리를 결정하기 위한 모드를 사용자가 결정하도록 하고, 사용자에 의해 결정된 모드에 따라 새로 수신된 이메일의 카테고리를 자동으로 결정하거나 또는 적어도 하 나의 카테고리를 사용자에게 추천할 수 있다.In addition, the category classification system 100 allows a user to determine a mode for recommending a category and a mode for determining a category, and automatically determines or at least automatically determines a category of a newly received e-mail according to the mode determined by the user. I can recommend my category to users.

도 3은 본 발명의 일실시예에 있어서, 의사결정트리 생성 및 형태소 분석을 설명하기 위한 일례이다. 의사결정트리 생성화면(310)은 이메일 시스템에 포함된 카테고리들의 이메일들을 형태소 분석하고, 주요단어에 기초하여 의사결정트리를 생성하는 모습의 일례를 나타낸다. 여기서, 주요단어는 형태소들 중 품사가 명사인 단어들의 반복횟수에 기초하여 결정될 수 있고, 명사인 단어를 주요 단어로 결정하기 위한 반복횟수의 스레스홀드는 본 실시예에 따른 카테고리 분류 시스템, 카테고리 분류 시스템의 사용자, 이메일 시스템 또는 이메일 시스템의 사용자에 의해 결정될 수 있다. 도 3에서는 카테고리 분류 시스템의 사용자가 반복횟수의 스레스홀드를 결정하는 일례를 나타낸다. 즉, 사용자가 'Threshold' 필드(320)를 통해 반복횟수의 스레스홀드를 입력하면, 카테고리 분류 시스템은 입력된 반복횟수의 스레스홀드에 따라 명사인 단어들 중 주요단어를 결정할 수 있다. 여기서, 주요단어 필드(330)는 반복횟수가 5회 이상인 단어들이 표시되는 필드이다. 즉, 이메일 시스템에 포함된 카테고리들의 이메일들에서 추출된 명사인 단어들 중 반복횟수가 5회 이상인 단어들이 주요단어 필드(330)에 표시될 수 있다. 이와 같이, 주요단어가 추출되면, 카테고리 분류 시스템은 주요단어를 애트리뷰트로, 이메일 시스템에서 미리 분류된 카테고리들을 클래스로 하는 의사결정트리를 생성할 수 있게 된다.3 is an example for explaining the decision tree generation and the morpheme analysis according to an embodiment of the present invention. Decision tree generation screen 310 is an example of the appearance of generating a decision tree based on the main word stemming the email of the categories included in the email system. Here, the main word may be determined based on the number of repetitions of words whose parts of speech are nouns in morphemes, and the threshold number of repetitions for determining a noun word as a main word is a category classification system and a category according to the present embodiment. It may be determined by the user of the classification system, the email system or the user of the email system. 3 shows an example in which the user of the category classification system determines the threshold of the repetition number. That is, when a user inputs a threshold of repetition counts through the 'Threshold' field 320, the category classification system may determine a main word among words that are nouns according to the threshold of the input repetition count. Here, the main word field 330 is a field in which words having a repetition frequency of five or more times are displayed. That is, among the words that are nouns extracted from the emails of the categories included in the email system, words having a repetition number of five or more times may be displayed in the main word field 330. As such, when the main word is extracted, the category classification system may generate a decision tree that sets the main word as an attribute and the categories classified in advance in the e-mail system as classes.

도 4는 본 발명의 일실시예에 있어서, 카테고리 추천 화면을 나타내는 일례이다. 사용자 화면(410)은 사용자에게 디스플레이되는 이메일 관리 화면의 일례를 나타낸다. 이때, 제2 이메일이 표시되는 영역에 대한 사용자 이벤트를 통해 제1 리스트(420)가 표시될 수 있고, 카테고리 분류 시스템을 통해 추천되는 카테고리들이 카테고리 추천 리스트(430)를 통해 표시될 수 있다. 이때, 사용자가 추천된 카테고리들 중 하나를 선택하면, 제2 이메일은 선택된 카테고리로 이동될 수 있다. 즉, 사용자는 추천 카테고리를 확인하여 보다 편리하게 각각의 이메일들에 해당하는 카테고리를 분류할 수 있게 된다. 이때, 카테고리 추천 리스트(430)는 카테고리 랭킹의 상위에 포함된 카테고리 중 기선정된 개수의 카테고리를 포함할 수 있다.4 illustrates an example of a category recommendation screen according to an embodiment of the present invention. The user screen 410 shows an example of an email management screen displayed to the user. In this case, the first list 420 may be displayed through the user event for the area where the second email is displayed, and the categories recommended through the category classification system may be displayed through the category recommendation list 430. In this case, when the user selects one of the recommended categories, the second email may be moved to the selected category. That is, the user can classify the category corresponding to each email more conveniently by checking the recommendation category. In this case, the category recommendation list 430 may include a predetermined number of categories among categories included in the category ranking.

또한, 다른 실시예로, 사용자가 새로 수신된 이메일이 자동으로 분류되도록 선택한 경우 사용자 화면(410)에서 제2 이메일이 사용자에 의해 확인된 후 자동으로 카테고리가 분류될 수 있다. 이때, 제2 이메일은 해당 카테고리 랭킹의 최상위에 랭크된 카테고리로 자동으로 분류될 수 있다.Also, in another embodiment, when the user selects to automatically sort the newly received email, the category may be automatically classified after the second email is confirmed by the user on the user screen 410. In this case, the second e-mail may be automatically classified into a category ranked at the top of the category ranking.

도 5는 본 발명의 일실시예에 있어서, 보낸 사람 주소 및 참조 메일 주소의 등장횟수와 그에 따른 카테고리별 가중치를 나타낸 표이다. 제1 표(510)는 새로 수신된 하나의 이메일에 포함된 보낸 사람 주소 및 참조 메일 주소의 등장횟수에 기초하여 카테고리별로 카테고리별 가중치를 계산하는 일례를 나타낸다. 즉, 상술한 바와 같이, 새로 수신된 이메일에 해당하는 보낸 사람 주소 및 참조 메일 주소가 카테고리별로 각각 등장하는 횟수에 따라 카테고리별 가중치가 결정될 수 있다. 이 경우, 카테고리별 가중치는 단순히 보낸 사람 주소와 참조 메일 주소가 포함된 수에 따라 결정될 수도 있고, 보낸 사람 주소와 참조 메일 주소에 각각 서로 다른 가중치를 부여하여 결정될 수도 있다. 즉, 도 5를 참조하면, 'a' 및 'b'가 각각 1 인 경우는 카테고리별 가중치가 단순히 메일 주소가 포함된 수에 따라 결정됨을 의미할 수 있고, 'a' 및 'b' 중 하나라도 1이 아닌 경우에는 서로 다른 가중치가 부여되었음을 의미할 수 있다.FIG. 5 is a table illustrating a frequency of appearance of a sender address and a reference mail address and corresponding weights according to an embodiment of the present invention. The first table 510 shows an example of calculating a weight for each category based on the number of appearances of a sender address and a reference mail address included in one newly received email. That is, as described above, the weight for each category may be determined according to the number of times that the sender address and the reference mail address corresponding to the newly received email appear for each category. In this case, the weight for each category may be determined simply by the number including the sender address and the reference mail address, or may be determined by giving different weights to the sender address and the reference mail address, respectively. That is, referring to FIG. 5, when 'a' and 'b' are each 1, it may mean that the weight for each category is simply determined based on the number of mail addresses, and one of 'a' and 'b'. If not 1, it may mean that different weights are assigned.

도 6은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 일례이다. 여기서, 제2 표(610)은 제1 카테고리 내지 제7 카테고리의 7개의 카테고리와 각각의 카테고리에 대한 카테고리별 가중치 및 의사결정트리를 통한 카테고리 선택 여부를 각각 나타낸다. 즉, 제2 표(610)에서는 제5 카테고리가 의사결정트리를 통해 선택되었음을 알 수 있다. 제3 표(620)는 이러한 카테고리별 가중치와 카테고리 선택 여부를 통해 7개의 카테고리에 대한 랭킹을 결정하는 일례를 나타낸다. 이때, 7개의 카테고리들은 카테고리별 가중치에 의해 정렬된 후, 카테고리 선택 여부에 따라 랭킹이 조정될 수 있다. 제3 표(620)에서는 의사결정트리를 통해 선택된 카테고리인 제5 카테고리가 최상위 순위를 갖도록 조정된 모습을 나타낸다. 이때, 의사결정트리를 통해 선택된 카테고리라도, 해당 카테고리별 가중치가 기선정된 값보다 작은 경우에는 랭킹이 조정되지 않도록 할 수도 있다. 즉, 기선정된 값이 제5 카테고리의 카테고리별 가중치인 '4'보다 큰 경우, 제5 카테고리의 랭킹은 조정되지 않고 그대로 랭킹 7에 머물게 된다.FIG. 6 illustrates an example of determining a category ranking based on a weight for each category and whether a category is selected. Here, the second table 610 shows seven categories of the first to seventh categories, weights for each category for each category, and whether a category is selected through the decision tree. That is, in the second table 610, it can be seen that the fifth category is selected through the decision tree. The third table 620 shows an example of determining the ranking of the seven categories through the weight of each category and whether a category is selected. In this case, after the seven categories are sorted by the weight for each category, the ranking may be adjusted according to whether the category is selected. In the third table 620, the fifth category, which is the category selected through the decision tree, is adjusted to have the highest rank. At this time, even if the category selected through the decision tree, if the weight for each category is smaller than the predetermined value, the ranking may not be adjusted. That is, when the predetermined value is larger than '4', which is the weight for each category of the fifth category, the ranking of the fifth category is not adjusted and remains in the ranking 7 as it is.

도 7은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 다른 예이다. 제4 표(710)는 제1 카테고리 내지 제7카테고리의 7개의 카테고리와 각각의 카테고리에 대한 카테고리별 가중치 및 의사결정트리를 통해 선택된 카테고리에 대한 카테고리 선택에 따른 추가 가중치를 각각 나타낸다. 이러한 추가 가중치는 제5 표(720)에 나타난 바와 같이 해당 카테고리의 카테고리별 가중치에 추가될 수 있고, 최종 카테고리별 가중치에 의해 각각의 카테고리들이 정렬될 수 있다. 이 경우, 제5 표(720)에 나타난 바와 같이 제5 카테고리의 카테고리별 가중치는 19(4 + 15)가 될 수 있고, 카테고리별 가중치가 20인 제4 카테고리 다음에 랭킹될 수 있다.FIG. 7 is another example of determining a category ranking based on a weight for each category and whether a category is selected. The fourth table 710 shows seven categories of the first to seventh categories, weights for each category for each category, and additional weights according to category selection for the category selected through the decision tree. This additional weight may be added to the category-specific weights of the corresponding categories as shown in the fifth table 720, and the respective categories may be sorted by the weight of the final category. In this case, as shown in the fifth table 720, the weight for each category of the fifth category may be 19 (4 + 15), and may be ranked after the fourth category having a weight for each category of 20.

이와 같이, 본 실시예들에 따른 카테고리 분류 시스템 또는 카테고리 분류 방법을 이용하면, 형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천하거나 또는 새로 수신된 이메일의 카테고리를 자동으로 결정할 수 있다. 또한, 이메일의 내용에 기초하는 의사결정트리 뿐만 아니라 메일 주소에 기초한 가중치를 더 이용함으로써, 새로 입력되는 이메일에 대한 카테고리를 사용자에게 유동적으로 추천할 수 있고, 카테고리의 랭킹을 결정하고 그 중 기선정된 수의 카테고리를 사용자에게 추천함으로써, 새로 입력되는 이메일에 대한 카테고리를 유연하게 결정할 수 있다.As such, when using a category classification system or a category classification method according to the present embodiments, a category for a newly received email is selected by using morphological analysis and a decision tree, and the mail address and the selected category of the newly received email. May recommend a category to the user or automatically determine the category of the newly received email. In addition, by using weights based on e-mail addresses as well as decision trees based on e-mail contents, categories for newly input e-mails can be flexibly recommended to users, and rankings of categories are selected and selected among them. By recommending a number of categories to the user, it is possible to flexibly determine the categories for newly entered emails.

본 발명에 따른 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 파일 데이터, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가 능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. Computer-readable media may include, alone or in combination with the program instructions, file data, data structures, and the like. Program instructions recorded on the media may be those specially designed and constructed for the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of the computer-readable recording medium include magnetic media such as a hard disk, a floppy disk, and a magnetic tape; optical media such as CD-ROM and DVD; magnetic recording media such as a floppy disk; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. Hardware devices may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.

이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.In the present invention as described above has been described by the specific embodiments, such as specific components and limited embodiments and drawings, but this is provided to help a more general understanding of the present invention, the present invention is not limited to the, Various modifications and variations can be made by those skilled in the art to which the present invention pertains.

따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .

도 1은 본 발명의 일실시예에 있어서, 카테고리 분류 시스템의 내부 구성을 설명하기 위한 블록도이다.1 is a block diagram illustrating an internal configuration of a category classification system according to an embodiment of the present invention.

도 2는 본 발명의 일실시예에 있어서, 카테고리 분류 방법을 도시한 흐름도이다.2 is a flowchart illustrating a category classification method according to an embodiment of the present invention.

도 3은 본 발명의 일실시예에 있어서, 의사결정트리 생성 및 형태소 분석을 설명하기 위한 일례이다.3 is an example for explaining the decision tree generation and the morpheme analysis according to an embodiment of the present invention.

도 4는 본 발명의 일실시예에 있어서, 카테고리 추천 화면을 나타내는 일례이다.4 illustrates an example of a category recommendation screen according to an embodiment of the present invention.

도 5는 본 발명의 일실시예에 있어서, 보낸 사람 주소 및 참조 메일 주소의 등장횟수와 그에 따른 카테고리별 가중치를 나타낸 표이다.FIG. 5 is a table illustrating a frequency of appearance of a sender address and a reference mail address and corresponding weights according to an embodiment of the present invention.

도 6은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 일례이다.FIG. 6 illustrates an example of determining a category ranking based on a weight for each category and whether a category is selected.

도 7은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 다른 예이다.FIG. 7 is another example of determining a category ranking based on a weight for each category and whether a category is selected.

<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>

100: 카테고리 분류 시스템100: categorization system

110: 형태소 분석부110: morphological analysis

120: 의사결정트리 생성부120: decision tree generation unit

130: 카테고리 선택부130: category selection unit

140: 카테고리별 가중치 계산부140: weight calculation unit for each category

150: 카테고리 랭킹 결정부150: category ranking determination unit

Claims (12)

입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 형태소 분석부;A morpheme analysis unit configured to generate a morpheme analysis result by analyzing a morpheme of contents included in an input email; 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 의사결정트리 생성부;A decision tree generation unit generating a decision tree based on a result of stemming analysis of an email corresponding to a category classified in advance in the email system; 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 카테고리 선택부;A category selector which selects one of pre-categorized categories based on the stemming analysis result and the decision tree of the newly received e-mail; 상기 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 카테고리별 가중치 계산부; 및A category weight calculator configured to calculate weights for each category according to the number of email addresses associated with newly received emails included in the emails included in each of the pre-categorized categories; And 상기 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 카테고리 랭킹 결정부A category ranking determination unit that determines a category ranking of categories classified based on the selected category and the weight for each category. 를 포함하고,Including, 상기 카테고리 랭킹 결정부는,The category ranking determination unit, 상기 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정하는The category ranking is determined in order of the weight of each category being high, and the category ranking is determined by adjusting the ranking of the selected category. 카테고리 분류 시스템.Category Classification System. 제1항에 있어서,The method of claim 1, 상기 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천하는 카테고리 추천부Category recommending unit for recommending at least one category for the newly received email based on the category ranking 를 더 포함하는 카테고리 분류 시스템.Category classification system further comprising. 제1항에 있어서,The method of claim 1, 상기 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정하는 카테고리 결정부A category determination unit that determines a category of a newly received email as a category corresponding to the highest ranking of the category ranking 를 더 포함하는 카테고리 분류 시스템.Category classification system further comprising. 제1항에 있어서,The method of claim 1, 상기 형태소 분석부는,The morpheme analysis unit, 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성하는, 카테고리 분류 시스템.A category classification system for generating a morphological analysis result by checking a word of a part of speech that is set in advance among words extracted by analyzing the morpheme of contents included in an email, and selecting a main word according to the number of occurrences of each identified word. 제1항에 있어서,The method of claim 1, 상기 의사결정트리 생성부는,The decision tree generation unit, 상기 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성하는, 카테고리 분류 시스템.The word corresponding to the stemming result of the e-mail corresponding to the pre-categorized category is set to an attribute which is a non-terminal node capable of making a decision, and the pre-categorized category is set to a class which is a terminal node as a result of the decision. Category classification system for generating decision trees. 제1항에 있어서,The method of claim 1, 상기 카테고리 선택부는,The category selection unit, 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택하는, 카테고리 분류 시스템.And classifying the word corresponding to the stemming result of the newly received e-mail with an attribute that is a non-terminal node of the decision tree to determine a class that is a terminal node and selecting a category corresponding to the class. 제1항에 있어서,The method of claim 1, 상기 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함하고,The mail address includes a sender address and a reference mail address. 상기 카테고리별 가중치 계산부는,The weight calculation unit for each category, 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산하는, 카테고리 분류 시스템.A category classification system that calculates a weight for each category based on the number of sender addresses and reference email addresses included in the category. 제1항에 있어서,The method of claim 1, 상기 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함하고,The mail address includes a sender address and a reference mail address. 상기 카테고리별 가중치 계산부는,The weight calculation unit for each category, 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산하는, 카테고리 분류 시스템.A different weight is assigned to each of the number of the sender address and the reference mail address included in the category, and the sum of the different weighted values is calculated as the weight for each category. 삭제delete 제1항에 있어서,The method of claim 1, 상기 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정되는, 카테고리 분류 시스템.And the selected category is adjusted to have the highest rank when the weight for each category is equal to or greater than a predetermined value. 제1항에 있어서,The method of claim 1, 상기 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정되는, 카테고리 분류 시스템.And the selected category is further assigned with a predetermined weight to a corresponding weight for each category to adjust the ranking. 형태소 분석부, 의사결정트리 생성부, 카테고리 선택부, 카테고리별 가중치 계산부, 카테고리 랭킹 결정부 및 카테고리 추천부를 포함하는 카테고리 분류 시스템에서 카테고리를 추천하는 방법에 있어서,In the method for recommending a category in a category classification system comprising a morpheme analysis unit, decision tree generation unit, category selection unit, weight category calculation unit for each category, category ranking determination unit and category recommendation unit, 상기 형태소 분석부가 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 단계;Generating a morpheme analysis result by analyzing a morpheme of contents included in the e-mail inputted by the morpheme analyzer; 상기 의사결정트리 생성부가 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 단계;Generating, by the decision tree generation unit, a decision tree based on a stemming analysis result of an e-mail corresponding to a category classified in advance in the e-mail system; 상기 카테고리 선택부가 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 단계;Selecting one of the categories classified based on the stemming analysis result and the decision tree of the newly received e-mail; 상기 카테고리별 가중치 계산부가 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 단계; 및Calculating, by the category weighting unit, weights for each category according to the number of e-mail addresses associated with newly received e-mails included in e-mails included in each of the pre-categorized categories; And 상기 카테고리 랭킹 결정부가 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 단계Determining the category ranking of the classified category based on the selected category and the weight for each category by the category ranking determination unit 를 포함하고,Including, 상기 카테고리 랭킹 결정부가 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 단계는,The category ranking determination unit may determine the category ranking of the category classified based on the selected category and the weight for each category, 상기 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정하는 단계Determining a ranking of categories in order of increasing weight for each category, and adjusting a ranking of the selected category to determine category ranking 를 포함하는 카테고리 분류 방법.Category classification method comprising a.
KR1020090095506A 2009-10-08 2009-10-08 System and method for e-mail categorization KR101324459B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020090095506A KR101324459B1 (en) 2009-10-08 2009-10-08 System and method for e-mail categorization

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020090095506A KR101324459B1 (en) 2009-10-08 2009-10-08 System and method for e-mail categorization

Publications (2)

Publication Number Publication Date
KR20110038279A KR20110038279A (en) 2011-04-14
KR101324459B1 true KR101324459B1 (en) 2013-10-31

Family

ID=44045366

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020090095506A KR101324459B1 (en) 2009-10-08 2009-10-08 System and method for e-mail categorization

Country Status (1)

Country Link
KR (1) KR101324459B1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180083148A (en) * 2017-01-12 2018-07-20 주식회사 디아이섹 Apparatus for email security trainning, and control method thereof
KR102348239B1 (en) * 2021-03-16 2022-01-07 주식회사 샌즈랩 Method for Analyzing Keywords in Email

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060045308A (en) * 2004-11-10 2006-05-17 한국전자통신연구원 Apparatus and method for classifying e-mail using decision tree

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20060045308A (en) * 2004-11-10 2006-05-17 한국전자통신연구원 Apparatus and method for classifying e-mail using decision tree

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
백준걸 외 3명, ‘실시간 기계 상태 데이터베이스에서 데이터 마이닝을 위한 적응형 의사결정 트리 알고리듬’, 대한산업공학회지26(2), pp.171-182, 2000.06*
백준걸 외 3명, '실시간 기계 상태 데이터베이스에서 데이터 마이닝을 위한 적응형 의사결정 트리 알고리듬', 대한산업공학회지26(2), pp.171-182, 2000.06 *
이경찬 외 1명, ‘범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템’, 한국정보과학회 학술발표논문집 29, pp.475-477, 2002.04*
이경찬 외 1명, '범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템', 한국정보과학회 학술발표논문집 29, pp.475-477, 2002.04 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180083148A (en) * 2017-01-12 2018-07-20 주식회사 디아이섹 Apparatus for email security trainning, and control method thereof
KR102348239B1 (en) * 2021-03-16 2022-01-07 주식회사 샌즈랩 Method for Analyzing Keywords in Email

Also Published As

Publication number Publication date
KR20110038279A (en) 2011-04-14

Similar Documents

Publication Publication Date Title
US11615079B1 (en) Graphical user interface for recurring searches
US8909713B2 (en) Method and system for filtering text messages
US7685141B2 (en) Connection sub-graphs in entity relationship graphs
US8370374B1 (en) On-the-fly pattern recognition with configurable bounds
US8918431B2 (en) Adaptive ontology
JP2018538587A (en) Risk assessment method and system
US10713423B2 (en) Content adjustment and display augmentation for communication
US20170222966A1 (en) Searching and displaying related content to a post in an activity stream
CN109299245B (en) Method and device for recalling knowledge points
Morales-Ramirez et al. Exploiting user feedback in tool-supported multi-criteria requirements prioritization
US10467252B1 (en) Document classification and characterization using human judgment, tiered similarity analysis and language/concept analysis
CN109977300A (en) Enterprise&#39;s public sentiment acquisition methods, device, terminal and computer storage medium
CN112968917B (en) Penetration test method and system for network equipment
US9582586B2 (en) Massive rule-based classification engine
JP5905651B1 (en) Performance evaluation apparatus, performance evaluation apparatus control method, and performance evaluation apparatus control program
Al-Alwani Improving email response in an email management system using natural language processing based probabilistic methods
KR101324459B1 (en) System and method for e-mail categorization
CN115329078B (en) Text data processing method, device, equipment and storage medium
CN103778210B (en) Method and device for judging specific file type of file to be analyzed
CN110377741A (en) File classification method, intelligent terminal and computer readable storage medium
CN112783775B (en) Special character input testing method and device
CN106462614B (en) Information analysis system, information analysis method, and information analysis program
KR20220131725A (en) Efficient keyword extraction method from social big data based on cohesion scoring
CN113297289A (en) Method and device for extracting business data from database and electronic equipment
CN111125319A (en) Enterprise basic law intelligent consultation terminal, system and method

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161004

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170926

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20181008

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20190905

Year of fee payment: 7