KR101324459B1 - System and method for e-mail categorization - Google Patents
System and method for e-mail categorization Download PDFInfo
- Publication number
- KR101324459B1 KR101324459B1 KR1020090095506A KR20090095506A KR101324459B1 KR 101324459 B1 KR101324459 B1 KR 101324459B1 KR 1020090095506 A KR1020090095506 A KR 1020090095506A KR 20090095506 A KR20090095506 A KR 20090095506A KR 101324459 B1 KR101324459 B1 KR 101324459B1
- Authority
- KR
- South Korea
- Prior art keywords
- category
- ranking
- weight
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000003066 decision tree Methods 0.000 claims abstract description 63
- 238000004458 analytical method Methods 0.000 claims abstract description 44
- 230000000877 morphologic effect Effects 0.000 claims abstract description 13
- 238000004364 calculation method Methods 0.000 claims description 8
- 238000012552 review Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/60—Business processes related to postal services
Landscapes
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Information Transfer Between Computers (AREA)
Abstract
이메일 카테고리 분류 시스템 및 방법을 개시한다. 카테고리 분류 시스템은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 형태소 분석부, 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 의사결정트리 생성부, 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 카테고리 선택부, 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 카테고리별 가중치 계산부 및 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 카테고리 랭킹 결정부를 포함한다.Disclosed are an email category classification system and method. The category classification system generates a decision tree based on the morphological analysis unit for generating morphological analysis results by analyzing the morphemes of the contents included in the input e-mail, and based on the morphological analysis results for the e-mails corresponding to the categories previously classified in the e-mail system. Decision tree generation unit, a category selection unit for selecting one of the pre-categorized category based on the stemming analysis result and the decision tree for the newly received e-mail, the newly received e-mail in the e-mail contained in each of the pre-categorized categories And a category ranking calculator configured to calculate a weight for each category according to the number of mail addresses associated with the category and a category ranking determiner for determining a category ranking of the classified category based on the selected category and the weight for each category.
레이저, 통행량, 이동량, 평균 이동(mean shift) Laser, traffic, travel, mean shift
Description
본 발명의 실시예들은 이메일 카테고리 분류 시스템 및 방법에 관한 것이다.Embodiments of the present invention relate to an email categorization system and method.
현재 대부분의 기업이나 기타 연구기관에서는 업무의 효율성을 높이기 위해 사원 간 의사소통 및 업무보고 등을 이메일로 하는 경우가 많다. 이 때, 각 사용자마다 하루에 수십, 수백 통의 이메일을 주고받게 되는데 이러한 이메일들은 업무 상 추후에도 필요하다. 따라서 많은 양의 이메일들을 삭제하지 않고 추후에 쉽게 열람할 수 있도록 미리 정의되어 있는 카테고리에 분류할 필요가 있다. 그러나 하루에도 수십, 수백 통의 이메일을 주고받는 상황에서 직접 이메일들을 하나하나 카테고리에 넣어 관리하기는 쉽지 않다.Currently, most companies and other research institutes often e-mail communication between employees and report on their work in order to improve work efficiency. At this point, each user sends and receives dozens and hundreds of emails a day, which are needed later in business. Therefore, it is necessary to classify into a predefined category so that a large amount of emails can be easily viewed later without deleting a large amount of emails. However, with dozens and hundreds of emails sent and received each day, it's not easy to manage them by putting them in categories.
일례로, 마이크로소프트 아웃룩(Microsoft Outlook)과 같은 기존의 이메일 시스템에서 이메일 관리를 위해 이메일 주소나 제목을 이용하여 규칙을 설정하고 이 규칙에 따라 이메일을 카테고리대로 분류하는 기술을 제공하고 있다. 그러나 이 규칙을 한번 설정하면 그 규칙대로만 이메일이 분류되기 때문에 자신이 의도하지 않은 방향으로 이메일이 분류될 수 있다. 예를 들어, 이메일 주소로 분류 했을 때, 그 주소로 오는 이메일은 무조건 사용자가 지정한 카테고리로만 분류된다. 또한, 제목의 특정 단어로 분류하면 그 단어가 들어가는 이메일 또한 사용자가 지정한 특정 카테고리로만 분류된다. 보낸 사람의 이메일 주소 또는 특정 단어가 들어간다고 해서 항상 특정 카테고리로 분류한다고 하면 다른 카테고리로 분류되어야 할 이메일들이 엉뚱한 카테고리로 잘못 분류될 수 있어 오히려 사용자의 편의성을 저해하게 된다.For example, existing email systems, such as Microsoft Outlook, provide a technique for managing email using email addresses or subjects, and categorizing emails into categories based on these rules. However, once you set this rule, your email will be classified only according to that rule, so that your email can be classified in a way you didn't intend. For example, when categorized by e-mail address, e-mail addressed to that address is unconditionally categorized into a category that you specify. In addition, if you categorize a specific word in the subject, the email containing the word is also categorized only into a specific category specified by the user. If the email address of a sender or a specific word is always classified into a specific category, emails that should be classified into other categories may be misclassified into a wrong category, thereby impairing user convenience.
본 명세서에서는, 효율적인 이메일 카테고리 분류 시스템 및 방법이 제안된다.In this specification, an efficient email category classification system and method are proposed.
형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천할 수 있는 카테고리 분류 시스템 및 방법이 제안된다.A category classification system and method are proposed that can select categories for newly received emails using stemming and decision trees, and recommend categories to users based on mail addresses and selected categories of newly received emails.
형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 새로 수신된 이메일의 카테고리를 결정할 수 있는 카테고리 분류 시스템 및 방법이 제안된다.A category classification system and method for selecting categories for newly received emails using stemming and decision trees and determining categories of newly received emails based on the newly received email addresses and selected categories are proposed. do.
본 발명의 일실시예에 따른 카테고리 분류 시스템은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 형태소 분석부, 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 의사결정트리 생성부, 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 카테고리 선택부, 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 카테고리별 가중치 계산부 및 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 카테고리 랭킹 결정부를 포함한다.A category classification system according to an embodiment of the present invention includes a morpheme analysis unit configured to generate a morpheme analysis result by analyzing a morpheme of contents included in an input email, and a morpheme analysis result for an e-mail corresponding to a category previously classified in an e-mail system. Decision tree generation unit for generating a decision tree based on the morphological analysis results for the newly received e-mail, a category selection unit for selecting one of the pre-categorized category based on the decision tree, Category ranking that calculates the category ranking of the classified categories based on the selected category and the category and weight based on the category weight calculation unit for calculating the weight for each category according to the number of included email addresses associated with the newly received email It includes a decision unit.
본 발명의 일측면에 따르면, 카테고리 분류 시스템은 카테고리 랭킹에 기초 하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천하는 카테고리 추천부를 더 포함할 수 있다.According to an aspect of the present invention, the category classification system may further include a category recommending unit for recommending at least one category for newly received e-mail based on the category ranking.
본 발명의 일측면에 따르면, 카테고리 분류 시스템은 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정하는 카테고리 결정부를 더 포함할 수 있다.According to an aspect of the present invention, the category classification system may further include a category determination unit that determines a category of a newly received e-mail as a category corresponding to the highest ranking of the category ranking.
본 발명의 일측면에 따르면, 형태소 분석부는 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다.According to an aspect of the present invention, the morpheme analysis unit analyzes the morphemes of the contents included in the email, checks the words of the pre-set parts of the extracted words, and selects the main words according to the number of occurrences of each of the confirmed words. Can be generated.
본 발명의 일측면에 따르면, 의사결정트리 생성부는 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다.According to an aspect of the present invention, the decision tree generation unit sets a word corresponding to a stemming analysis result of an email corresponding to a pre-categorized category as an attribute that is a non-terminal node capable of making a decision, and sets a pre-categorized category as a pseudo As a result of the determination, the decision tree can be generated by setting the class as a terminal node.
본 발명의 일측면에 따르면, 카테고리 선택부는 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다.According to an aspect of the present invention, the category selector determines a class that is a terminal node by comparing a word corresponding to a stemming analysis result of a newly received email with an attribute that is a non-terminal node of a decision tree, and a category corresponding to the class. Can be selected.
본 발명의 일측면에 따르면, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리별 가중치 계산부는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다.According to an aspect of the present invention, the mail address may include a sender address and a reference mail address, and the weight calculator for each category may calculate weights for each category based on the number of sender addresses and reference mail addresses included in the category. Can be.
본 발명의 일측면에 따르면, 메일 주소는 보낸 사람 주소 및 참조 메일 주소 를 포함할 수 있고, 카테고리별 가중치 계산부는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수 있다.According to an aspect of the present invention, the mail address may include a sender address and a reference mail address, and the weight calculation unit for each category gives different weights to the number of each of the sender address and the reference mail address included in the category. In addition, the sum of the values given different weights may be calculated as the weight for each category.
본 발명의 일측면에 따르면, 카테고리 랭킹 결정부는 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다.According to an aspect of the present invention, the category ranking determiner determines the category ranking in the order of the weight for each category, the category ranking by adjusting the rank of the selected category.
본 발명의 일측면에 따르면, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정될 수 있다.According to an aspect of the present invention, the selected category may be adjusted to have the highest rank when the weight for each category is equal to or greater than a predetermined value.
본 발명의 일측면에 따르면, 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.According to an aspect of the present invention, the selected category may be additionally assigned a weight that is pre-selected to the weight for each category to adjust the ranking.
본 발명의 일실시예에 따른 카테고리 분류 방법은 형태소 분석부가 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성하는 단계, 의사결정트리 생성부가 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성하는 단계, 카테고리 선택부가 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택하는 단계, 카테고리별 가중치 계산부가 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산하는 단계 및 카테고리 랭킹 결정부가 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정하는 단계를 포함한다.In the category classification method according to an embodiment of the present invention, a morpheme analysis result is generated by analyzing a morpheme of contents included in an e-mail inputted by a morpheme analysis unit, and a decision tree generation unit corresponds to a category previously classified in an e-mail system. Generating a decision tree based on the stemming result of the e-mail, the category selection unit selecting one of pre-categorized categories based on the stemming analysis result and the decision tree of the newly received e-mail, and the weight for each category The calculating unit calculates the weight for each category according to the number of emails associated with the newly received email in the email included in each of the pre-categorized categories, and the category ranking determiner is classified based on the selected category and the weight for each category. Determine the category ranking of It includes the steps:
형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천할 수 있다.The stemming and decision tree may be used to select a category for the newly received email and to recommend the category to the user based on the mail address and the selected category of the newly received email.
형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 새로 수신된 이메일의 카테고리를 자동으로 결정할 수 있다.The stemming and decision tree may be used to select a category for the newly received email and to automatically determine the category of the newly received email based on the mail address and the selected category of the newly received email.
이메일의 내용에 기초하는 의사결정트리 뿐만 아니라 메일 주소에 기초한 가중치를 더 이용함으로써, 새로 입력되는 이메일에 대한 카테고리를 사용자에게 유동적으로 추천할 수 있다.By further using weights based on mail addresses as well as decision trees based on the contents of emails, categories for newly entered emails can be flexibly recommended to the user.
카테고리의 랭킹을 결정하고, 그 중 기선정된 수의 카테고리를 사용자에게 추천함으로써, 새로 입력되는 이메일에 대한 카테고리를 유연하게 결정할 수 있다.By determining the ranking of the categories and recommending a predetermined number of categories to the user, it is possible to flexibly determine the category for the newly input email.
이하 첨부된 도면을 참조하여 본 발명에 따른 다양한 실시예를 상세히 설명하기로 한다.Hereinafter, various embodiments of the present disclosure will be described in detail with reference to the accompanying drawings.
도 1은 본 발명의 일실시예에 있어서, 카테고리 분류 시스템의 내부 구성을 설명하기 위한 블록도이다. 본 실시예에 따른 카테고리 분류 시스템(100)은 도 1에 도시된 바와 같이 형태소 분석부(110), 의사결정트리 결정부(120), 카테고리 선택부(130), 카테고리별 가중치 계산부(140), 카테고리 랭킹 결정부(150) 및 카테고리 추천부(160)를 포함할 수 있다.1 is a block diagram illustrating an internal configuration of a category classification system according to an embodiment of the present invention. As shown in FIG. 1, the
형태소 분석부(110)는 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성한다. 이때, 이메일의 내용에 대해 형태소를 분석하기 위해 기존에 공지된 형태소 분석 방법들 또는 형태소 분석기들 중 하나가 선택적으로 이용될 수 있고, 형태소 분석부(110)는 분석된 형태소를 이용하여 형태소 분석결과를 생성할 수 있다. 여기서, 일례로, 형태소 분석부(110)는 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다.The
의사결정트리 결정부(120)는 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성한다. 여기서, 의사결정트리 생성부(120)는 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다. 이때, 생성되는 의사결정트리는 파일의 형태로 저장될 수 있다. 즉, 카테고리 분류 시스템(100)이 구동될 때마다 의사결정트리를 생성하는 것이 아니라, 한번 생성된 의사결정트리를 파일의 형태로 저장하고, 카테고리 분류 시스템(100)이 구동될 때 해당 파일에서 의사결정트리를 불러와 이용할 수 있다.The decision tree determiner 120 generates a decision tree based on the result of the morpheme analysis of the e-mail corresponding to the category previously classified in the e-mail system. Here, the decision
카테고리 선택부(130)는 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택한다. 이때, 카테고 리 선택부(130)는 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다. 예를 들어, 의사결정트리의 가지 중에 애트리뷰트 '보고', 애트리뷰트 '초안' 및 클래스 '초안검토'로 연결되는 가지가 존재하고, 새로 수신된 이메일에서 추출된 주요단어 중 '보고'와 '초안'이 존재한다면, 새로 수신된 이메일의 카테고리를 '초안검토'로 선택할 수 있다.The
카테고리별 가중치 계산부(140)는 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산한다. 즉, 본 실시예에서는 의사결정트리에 기초하여 결정된 카테고리뿐만 아니라 메일 주소를 이용하여 계산되는 카테고리별 가중치가 새로 수신된 이메일의 카테고리를 결정하는데 더 이용될 수 있다.The category
이때, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리별 가중치 계산부(140)는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다. 예를 들어, 새로 수신된 이메일 A의 보낸 사람 주소와 참조 메일 주소가 카테고리 B에 각각 5번 및 6번 등장하고, 카테고리 C에 각각 3번 및 2번 등장한다면, 카테고리 B의 카테고리별 가중치는 11(5+6)의 값을, 카테고리 C의 카테고리별 가중치는 5(3+2)의 값을 각각 가질 수 있다.In this case, the mail address may include a sender address and a reference mail address, and the
또한, 이와는 다르게, 카테고리별 가중치 계산부(140)는 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서 로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수도 있다. 예를 들어, 보낸 사람 주소의 등장횟수에는 1의 가중치를 참조 메일 주소의 등장횟수에는 0.5의 가중치가 부여될 수 있다. 이 경우, 상술한 일례에서 카테고리 B의 카테고리별 가중치는 8(5 X 1 + 6 X 0.5)의 값을, 카테고리 C의 카테고리별 가중치는 4(3 X 1 + 2 X 0.5)의 값을 각각 가질 수 있다.Also, differently, the
카테고리 랭킹 결정부(150)는 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정한다. 예를 들어, 카테고리 랭킹 결정부(150)는 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다. 이때, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정되거나 또는 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.The
예를 들어, 카테고리 A, B, C, D 및 E에 대해서 각각의 카테고리별 가중치가 10, 6, 3, 2, 1이고, 카테고리 C가 카테고리 선택부(130)에 의해 선택되었고, 기선정된 값이 '1'이라고 가정하자. 이때, 카테고리 랭킹은 카테고리별 가중치에 기초하여 [A(10), B(6), C(3), D(2), E(1)]의 순서로 결정된 후, 선택된 카테고리 C가 최상위의 순위를 갖도록 조정될 수 있다. 이때, 최종적으로 결정되는 카테고리 랭킹의 순서는 [C(3), A(10), B(6), D(2), E(1)]와 같이 나타날 수 있다.For example, the weight for each category is 10, 6, 3, 2, 1 for category A, B, C, D, and E, and category C is selected by
또는, 선택된 카테고리 C에 대해 추가로 기선정된 가중치 '5'를 부여할 수도 있다. 이 경우, 최종적으로 결정되는 카테고리 랭킹의 순서는 [A(10), C(3+5), B(6), D(2), E(1)]와 같이 나타날 수 있다.Alternatively, the preselected weight '5' may be added to the selected category C. In this case, the order of category ranking finally determined may appear as [A (10), C (3 + 5), B (6), D (2), E (1)].
카테고리 추천부(160)는 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천한다. 즉, 카테고리 추천부(160)는 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대한 카테고리를 사용자에게 추천할 수 있다. 예를 들어, 카테고리 랭킹에 포함된 카테고리 중 상위 '3'개의 카테고리를 새로운 이메일에 대한 카테고리로서 추천할 수 있다.The
이때, 본 발명의 다른 실시예에 따르면, 카테고리 분류 시스템(100)은 카테고리 추천부(160) 대신, 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정하는 카테고리 결정부(미도시)를 포함할 수도 있다. 이 경우, 카테고리 결정부는 카테고리 랭킹에 포함된 카테고리 중 가장 상위의 랭킹에 해당하는 카테고리를 새로 수신된 이메일의 카테고리로서 결정함으로써, 새로 수신된 이메일이 자동으로 분류되도록 할 수 있다.At this time, according to another embodiment of the present invention, the
또한, 카테고리 분류 시스템(100)은 카테고리 추천부(160)와 카테고리 결정부를 모두 포함하고, 사용자에게 카테고리 추천부(160)와 카테고리 결정부 중 원하는 모드를 결정하도록 하고, 결정된 모드에 따라, 새로 수신된 이메일의 카테고리를 자동으로 결정하거나 또는 적어도 하나의 카테고리를 사용자에게 추천할 수 있다.In addition, the
도 2는 본 발명의 일실시예에 있어서, 카테고리 분류 방법을 도시한 흐름도이다. 본 실시예에 따른 카테고리 분류 방법은 도 1을 통해 설명한 카테고리 분류 시스템(100)에 의해 수행될 수 있다. 도 2에서는 카테고리 분류 시스템(100)에 의 해 각각의 단계가 수행되는 과정을 설명함으로써 카테고리 분류 방법을 설명한다.2 is a flowchart illustrating a category classification method according to an embodiment of the present invention. The category classification method according to the present embodiment may be performed by the
단계(210)에서 카테고리 분류 시스템(100)은 입력되는 이메일에 포함된 내용의 형태소를 분석하여 형태소 분석결과를 생성한다. 이때, 이메일의 내용에 대해 형태소를 분석하기 위해 기존에 공지된 형태소 분석 방법들 또는 형태소 분석기들 중 하나가 선택적으로 이용될 수 있고, 카테고리 분류 시스템(100)은 분석된 형태소를 이용하여 형태소 분석결과를 생성할 수 있다. 여기서, 일례로, 카테고리 분류 시스템(100)은 이메일에 포함된 내용의 형태소를 분석하여 추출한 단어 중 미리 설정된 품사의 단어를 확인하고, 확인된 단어 각각의 등장횟수에 따라 주요단어를 선택하여 형태소 분석결과를 생성할 수 있다. 여기서, 입력되는 이메일은 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일과 새로 수신된 이메일을 포함할 수 있다.In
단계(220)에서 카테고리 분류 시스템(100)은 이메일 시스템에서 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 기초하여 의사결정트리를 생성한다. 여기서, 카테고리 분류 시스템(100)은 미리 분류된 카테고리에 해당하는 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정이 가능한 비단말 노드인 애트리뷰트로 설정하고, 미리 분류된 카테고리를 의사결정의 결과로서, 단말 노드인 클래스로 설정하여 의사결정트리를 생성할 수 있다. 이때, 생성되는 의사결정트리는 파일의 형태로 저장될 수 있다. 즉, 카테고리 분류 시스템(100)이 구동될 때마다 의사결정트리를 생성하는 것이 아니라, 한번 생성된 의사결정트리를 파일의 형태로 저장하고, 카테고리 분류 시스템(100)이 구동될 때 해당 파일에서 의사결정트리를 불러와 이용할 수 있다. 즉, 이러한 단계(220)은 새로 수신된 이메일의 카테고리를 분류하기 위한 전처리 단계일 수 있다.In
단계(230)에서 카테고리 분류 시스템(100)은 새로 수신된 이메일에 대한 형태소 분석결과 및 의사결정트리에 기초하여 미리 분류된 카테고리 중 하나를 선택한다. 이때, 카테고리 분류 시스템(100)은 새로 수신된 이메일에 대한 형태소 분석결과에 해당하는 단어를 의사결정트리의 비단말 노드인 애트리뷰트와 비교하여 단말 노드인 클래스를 결정하고, 클래스에 대응하는 카테고리를 선택할 수 있다. 예를 들어, 의사결정트리의 가지 중에 애트리뷰트 '보고', 애트리뷰트 '초안' 및 클래스 '초안검토'로 연결되는 가지가 존재하고, 새로 수신된 이메일에서 추출된 주요단어 중 '보고'와 '초안'이 존재한다면, 새로 수신된 이메일의 카테고리를 '초안검토'로 선택할 수 있다.In
단계(240)에서 카테고리 분류 시스템(100)은 미리 분류된 카테고리 각각에 포함된 이메일에 새로 수신된 이메일과 연관된 메일 주소가 포함된 수에 따라 카테고리별 가중치를 계산한다. 즉, 본 실시예에서는 의사결정트리에 기초하여 결정된 카테고리뿐만 아니라 메일 주소를 이용하여 계산되는 카테고리별 가중치가 새로 수신된 이메일의 카테고리를 결정하는데 더 이용될 수 있다.In
이때, 메일 주소는 보낸 사람 주소 및 참조 메일 주소를 포함할 수 있고, 카테고리 분류 시스템(100)은 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소의 수에 기초하여 카테고리별 가중치를 계산할 수 있다. 예를 들어, 새로 수신된 이메일 A의 보낸 사람 주소와 참조 메일 주소가 카테고리 B에 각각 5번 및 6번 등장 하고, 카테고리 C에 각각 3번 및 2번 등장한다면, 카테고리 B의 카테고리별 가중치는 11(5+6)의 값을, 카테고리 C의 카테고리별 가중치는 5(3+2)의 값을 각각 가질 수 있다.In this case, the mail address may include a sender address and a reference mail address, and the
또한, 이와는 다르게, 카테고리 분류 시스템(100)은 카테고리에 포함된 보낸 사람 주소 및 참조 메일 주소 각각의 수에 서로 다른 가중치를 부여하고, 서로 다른 가중치가 부여된 값들의 합을 카테고리별 가중치로서 계산할 수도 있다. 예를 들어, 보낸 사람 주소의 등장횟수에는 1의 가중치를 참조 메일 주소의 등장횟수에는 0.5의 가중치가 부여될 수 있다. 이 경우, 상술한 일례에서 카테고리 B의 카테고리별 가중치는 8(5 X 1 + 6 X 0.5)의 값을, 카테고리 C의 카테고리별 가중치는 4(3 X 1 + 2 X 0.5)의 값을 각각 가질 수 있다.Alternatively, the
단계(250)에서 카테고리 분류 시스템(100)은 선택된 카테고리 및 카테고리별 가중치에 기초하여 분류된 카테고리의 카테고리 랭킹을 결정한다. 예를 들어, 카테고리 분류 시스템(100)은 카테고리별 가중치가 높은 순서로 카테고리의 순위를 결정하되, 선택된 카테고리의 순위를 조정하여 카테고리 랭킹을 결정할 수 있다. 이때, 선택된 카테고리는 카테고리별 가중치가 기선정된 값 이상인 경우, 최상위의 순위를 갖도록 조정되거나 또는 선택된 카테고리는 해당하는 카테고리별 가중치에 기선정된 가중치가 추가로 부여되어 순위가 조정될 수 있다.In
예를 들어, 카테고리 A, B, C, D 및 E에 대해서 각각의 카테고리별 가중치가 10, 6, 3, 2, 1이고, 카테고리 C가 단계(230)에서 선택되었고, 기선정된 값이 '1'이라고 가정하자. 이때, 카테고리 랭킹은 카테고리별 가중치에 기초하여 [A(10), B(6), C(3), D(2), E(1)]의 순서로 결정된 후, 선택된 카테고리 C가 최상위의 순위를 갖도록 조정될 수 있다. 이때, 최종적으로 결정되는 카테고리 랭킹의 순서는 [C(3), A(10), B(6), D(2), E(1)]와 같이 나타날 수 있다.For example, for each of categories A, B, C, D, and E, the weight for each category is 10, 6, 3, 2, 1, category C is selected in
또는, 선택된 카테고리 C에 대해 추가로 기선정된 가중치 '5'를 부여할 수도 있다. 이 경우, 최종적으로 결정되는 카테고리 랭킹의 순서는 [A(10), C(3+5), B(6), D(2), E(1)]와 같이 나타날 수 있다.Alternatively, the preselected weight '5' may be added to the selected category C. In this case, the order of category ranking finally determined may appear as [A (10), C (3 + 5), B (6), D (2), E (1)].
단계(260)에서 카테고리 분류 시스템(100)은 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대해 적어도 하나의 카테고리를 추천한다. 즉, 카테고리 분류 시스템(100)은 카테고리 랭킹에 기초하여 새로 수신된 이메일에 대한 카테고리를 사용자에게 추천할 수 있다. 예를 들어, 카테고리 랭킹에 포함된 카테고리 중 상위 '3'개의 카테고리를 새로운 이메일에 대한 카테고리로서 추천할 수 있다.In
이때, 본 발명의 다른 실시예에 따르면, 카테고리 분류 시스템(100)은 단계(260)에서 카테고리를 추천하는 대신, 카테고리 랭킹의 최상위 랭킹에 해당하는 카테고리로 새로 수신된 이메일의 카테고리를 결정할 수도 있다. 이 경우, 카테고리 분류 시스템(100)은 카테고리 랭킹에 포함된 카테고리 중 가장 상위의 랭킹에 해당하는 카테고리를 새로 수신된 이메일의 카테고리로서 결정함으로써, 새로 수신된 이메일이 자동으로 분류되도록 할 수 있다.At this time, according to another embodiment of the present invention, instead of recommending a category in
또한, 카테고리 분류 시스템(100)은 카테고리를 추천하기 위한 모드와 카테고리를 결정하기 위한 모드를 사용자가 결정하도록 하고, 사용자에 의해 결정된 모드에 따라 새로 수신된 이메일의 카테고리를 자동으로 결정하거나 또는 적어도 하 나의 카테고리를 사용자에게 추천할 수 있다.In addition, the
도 3은 본 발명의 일실시예에 있어서, 의사결정트리 생성 및 형태소 분석을 설명하기 위한 일례이다. 의사결정트리 생성화면(310)은 이메일 시스템에 포함된 카테고리들의 이메일들을 형태소 분석하고, 주요단어에 기초하여 의사결정트리를 생성하는 모습의 일례를 나타낸다. 여기서, 주요단어는 형태소들 중 품사가 명사인 단어들의 반복횟수에 기초하여 결정될 수 있고, 명사인 단어를 주요 단어로 결정하기 위한 반복횟수의 스레스홀드는 본 실시예에 따른 카테고리 분류 시스템, 카테고리 분류 시스템의 사용자, 이메일 시스템 또는 이메일 시스템의 사용자에 의해 결정될 수 있다. 도 3에서는 카테고리 분류 시스템의 사용자가 반복횟수의 스레스홀드를 결정하는 일례를 나타낸다. 즉, 사용자가 'Threshold' 필드(320)를 통해 반복횟수의 스레스홀드를 입력하면, 카테고리 분류 시스템은 입력된 반복횟수의 스레스홀드에 따라 명사인 단어들 중 주요단어를 결정할 수 있다. 여기서, 주요단어 필드(330)는 반복횟수가 5회 이상인 단어들이 표시되는 필드이다. 즉, 이메일 시스템에 포함된 카테고리들의 이메일들에서 추출된 명사인 단어들 중 반복횟수가 5회 이상인 단어들이 주요단어 필드(330)에 표시될 수 있다. 이와 같이, 주요단어가 추출되면, 카테고리 분류 시스템은 주요단어를 애트리뷰트로, 이메일 시스템에서 미리 분류된 카테고리들을 클래스로 하는 의사결정트리를 생성할 수 있게 된다.3 is an example for explaining the decision tree generation and the morpheme analysis according to an embodiment of the present invention. Decision
도 4는 본 발명의 일실시예에 있어서, 카테고리 추천 화면을 나타내는 일례이다. 사용자 화면(410)은 사용자에게 디스플레이되는 이메일 관리 화면의 일례를 나타낸다. 이때, 제2 이메일이 표시되는 영역에 대한 사용자 이벤트를 통해 제1 리스트(420)가 표시될 수 있고, 카테고리 분류 시스템을 통해 추천되는 카테고리들이 카테고리 추천 리스트(430)를 통해 표시될 수 있다. 이때, 사용자가 추천된 카테고리들 중 하나를 선택하면, 제2 이메일은 선택된 카테고리로 이동될 수 있다. 즉, 사용자는 추천 카테고리를 확인하여 보다 편리하게 각각의 이메일들에 해당하는 카테고리를 분류할 수 있게 된다. 이때, 카테고리 추천 리스트(430)는 카테고리 랭킹의 상위에 포함된 카테고리 중 기선정된 개수의 카테고리를 포함할 수 있다.4 illustrates an example of a category recommendation screen according to an embodiment of the present invention. The
또한, 다른 실시예로, 사용자가 새로 수신된 이메일이 자동으로 분류되도록 선택한 경우 사용자 화면(410)에서 제2 이메일이 사용자에 의해 확인된 후 자동으로 카테고리가 분류될 수 있다. 이때, 제2 이메일은 해당 카테고리 랭킹의 최상위에 랭크된 카테고리로 자동으로 분류될 수 있다.Also, in another embodiment, when the user selects to automatically sort the newly received email, the category may be automatically classified after the second email is confirmed by the user on the
도 5는 본 발명의 일실시예에 있어서, 보낸 사람 주소 및 참조 메일 주소의 등장횟수와 그에 따른 카테고리별 가중치를 나타낸 표이다. 제1 표(510)는 새로 수신된 하나의 이메일에 포함된 보낸 사람 주소 및 참조 메일 주소의 등장횟수에 기초하여 카테고리별로 카테고리별 가중치를 계산하는 일례를 나타낸다. 즉, 상술한 바와 같이, 새로 수신된 이메일에 해당하는 보낸 사람 주소 및 참조 메일 주소가 카테고리별로 각각 등장하는 횟수에 따라 카테고리별 가중치가 결정될 수 있다. 이 경우, 카테고리별 가중치는 단순히 보낸 사람 주소와 참조 메일 주소가 포함된 수에 따라 결정될 수도 있고, 보낸 사람 주소와 참조 메일 주소에 각각 서로 다른 가중치를 부여하여 결정될 수도 있다. 즉, 도 5를 참조하면, 'a' 및 'b'가 각각 1 인 경우는 카테고리별 가중치가 단순히 메일 주소가 포함된 수에 따라 결정됨을 의미할 수 있고, 'a' 및 'b' 중 하나라도 1이 아닌 경우에는 서로 다른 가중치가 부여되었음을 의미할 수 있다.FIG. 5 is a table illustrating a frequency of appearance of a sender address and a reference mail address and corresponding weights according to an embodiment of the present invention. The first table 510 shows an example of calculating a weight for each category based on the number of appearances of a sender address and a reference mail address included in one newly received email. That is, as described above, the weight for each category may be determined according to the number of times that the sender address and the reference mail address corresponding to the newly received email appear for each category. In this case, the weight for each category may be determined simply by the number including the sender address and the reference mail address, or may be determined by giving different weights to the sender address and the reference mail address, respectively. That is, referring to FIG. 5, when 'a' and 'b' are each 1, it may mean that the weight for each category is simply determined based on the number of mail addresses, and one of 'a' and 'b'. If not 1, it may mean that different weights are assigned.
도 6은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 일례이다. 여기서, 제2 표(610)은 제1 카테고리 내지 제7 카테고리의 7개의 카테고리와 각각의 카테고리에 대한 카테고리별 가중치 및 의사결정트리를 통한 카테고리 선택 여부를 각각 나타낸다. 즉, 제2 표(610)에서는 제5 카테고리가 의사결정트리를 통해 선택되었음을 알 수 있다. 제3 표(620)는 이러한 카테고리별 가중치와 카테고리 선택 여부를 통해 7개의 카테고리에 대한 랭킹을 결정하는 일례를 나타낸다. 이때, 7개의 카테고리들은 카테고리별 가중치에 의해 정렬된 후, 카테고리 선택 여부에 따라 랭킹이 조정될 수 있다. 제3 표(620)에서는 의사결정트리를 통해 선택된 카테고리인 제5 카테고리가 최상위 순위를 갖도록 조정된 모습을 나타낸다. 이때, 의사결정트리를 통해 선택된 카테고리라도, 해당 카테고리별 가중치가 기선정된 값보다 작은 경우에는 랭킹이 조정되지 않도록 할 수도 있다. 즉, 기선정된 값이 제5 카테고리의 카테고리별 가중치인 '4'보다 큰 경우, 제5 카테고리의 랭킹은 조정되지 않고 그대로 랭킹 7에 머물게 된다.FIG. 6 illustrates an example of determining a category ranking based on a weight for each category and whether a category is selected. Here, the second table 610 shows seven categories of the first to seventh categories, weights for each category for each category, and whether a category is selected through the decision tree. That is, in the second table 610, it can be seen that the fifth category is selected through the decision tree. The third table 620 shows an example of determining the ranking of the seven categories through the weight of each category and whether a category is selected. In this case, after the seven categories are sorted by the weight for each category, the ranking may be adjusted according to whether the category is selected. In the third table 620, the fifth category, which is the category selected through the decision tree, is adjusted to have the highest rank. At this time, even if the category selected through the decision tree, if the weight for each category is smaller than the predetermined value, the ranking may not be adjusted. That is, when the predetermined value is larger than '4', which is the weight for each category of the fifth category, the ranking of the fifth category is not adjusted and remains in the
도 7은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 다른 예이다. 제4 표(710)는 제1 카테고리 내지 제7카테고리의 7개의 카테고리와 각각의 카테고리에 대한 카테고리별 가중치 및 의사결정트리를 통해 선택된 카테고리에 대한 카테고리 선택에 따른 추가 가중치를 각각 나타낸다. 이러한 추가 가중치는 제5 표(720)에 나타난 바와 같이 해당 카테고리의 카테고리별 가중치에 추가될 수 있고, 최종 카테고리별 가중치에 의해 각각의 카테고리들이 정렬될 수 있다. 이 경우, 제5 표(720)에 나타난 바와 같이 제5 카테고리의 카테고리별 가중치는 19(4 + 15)가 될 수 있고, 카테고리별 가중치가 20인 제4 카테고리 다음에 랭킹될 수 있다.FIG. 7 is another example of determining a category ranking based on a weight for each category and whether a category is selected. The fourth table 710 shows seven categories of the first to seventh categories, weights for each category for each category, and additional weights according to category selection for the category selected through the decision tree. This additional weight may be added to the category-specific weights of the corresponding categories as shown in the fifth table 720, and the respective categories may be sorted by the weight of the final category. In this case, as shown in the fifth table 720, the weight for each category of the fifth category may be 19 (4 + 15), and may be ranked after the fourth category having a weight for each category of 20.
이와 같이, 본 실시예들에 따른 카테고리 분류 시스템 또는 카테고리 분류 방법을 이용하면, 형태소 분석 및 의사결정트리를 이용하여 새로 수신된 이메일에 대한 카테고리를 선택하고, 새로 수신된 이메일의 메일 주소 및 선택된 카테고리에 기초하여 사용자에게 카테고리를 추천하거나 또는 새로 수신된 이메일의 카테고리를 자동으로 결정할 수 있다. 또한, 이메일의 내용에 기초하는 의사결정트리 뿐만 아니라 메일 주소에 기초한 가중치를 더 이용함으로써, 새로 입력되는 이메일에 대한 카테고리를 사용자에게 유동적으로 추천할 수 있고, 카테고리의 랭킹을 결정하고 그 중 기선정된 수의 카테고리를 사용자에게 추천함으로써, 새로 입력되는 이메일에 대한 카테고리를 유연하게 결정할 수 있다.As such, when using a category classification system or a category classification method according to the present embodiments, a category for a newly received email is selected by using morphological analysis and a decision tree, and the mail address and the selected category of the newly received email. May recommend a category to the user or automatically determine the category of the newly received email. In addition, by using weights based on e-mail addresses as well as decision trees based on e-mail contents, categories for newly input e-mails can be flexibly recommended to users, and rankings of categories are selected and selected among them. By recommending a number of categories to the user, it is possible to flexibly determine the categories for newly entered emails.
본 발명에 따른 실시예들은 다양한 컴퓨터 수단을 통하여 수행될 수 있는 프로그램 명령 형태로 구현되어 컴퓨터 판독 가능 매체에 기록될 수 있다. 컴퓨터 판독 가능 매체는 프로그램 명령, 파일 데이터, 데이터 구조 등을 단독으로 또는 조합하여 포함할 수 있다. 매체에 기록되는 프로그램 명령은 본 발명을 위하여 특별히 설계되고 구성된 것들이거나 컴퓨터 소프트웨어 당업자에게 공지되어 사용 가 능한 것일 수도 있다. 컴퓨터 판독 가능 기록 매체의 예에는 하드 디스크, 플로피 디스크 및 자기 테이프와 같은 자기 매체(magnetic media), CD-ROM, DVD와 같은 광기록 매체(optical media), 플롭티컬 디스크(Floptical disk)와 같은 자기-광 매체(magneto-optical media), 및 롬(ROM), 램(RAM), 플래시 메모리 등과 같은 프로그램 명령을 저장하고 수행하도록 특별히 구성된 하드웨어 장치가 포함된다. 프로그램 명령의 예에는 컴파일러에 의해 만들어지는 것과 같은 기계어 코드뿐만 아니라 인터프리터 등을 사용해서 컴퓨터에 의해서 실행될 수 있는 고급 언어 코드를 포함한다. 하드웨어 장치는 본 발명의 동작을 수행하기 위해 하나 이상의 소프트웨어 모듈로서 작동하도록 구성될 수 있으며, 그 역도 마찬가지이다.Embodiments according to the present invention may be implemented in the form of program instructions that can be executed through various computer means and recorded in a computer-readable medium. Computer-readable media may include, alone or in combination with the program instructions, file data, data structures, and the like. Program instructions recorded on the media may be those specially designed and constructed for the present invention, or they may be of the kind well-known and available to those having skill in the computer software arts. Examples of the computer-readable recording medium include magnetic media such as a hard disk, a floppy disk, and a magnetic tape; optical media such as CD-ROM and DVD; magnetic recording media such as a floppy disk; Magneto-optical media, and hardware devices specifically configured to store and execute program instructions such as ROM, RAM, flash memory, and the like. Examples of program instructions include machine language code such as those produced by a compiler, as well as high-level language code that can be executed by a computer using an interpreter or the like. Hardware devices may be configured to operate as one or more software modules to perform the operations of the present invention, and vice versa.
이상과 같이 본 발명에서는 구체적인 구성 요소 등과 같은 특정 사항들과 한정된 실시예 및 도면에 의해 설명되었으나 이는 본 발명의 보다 전반적인 이해를 돕기 위해서 제공된 것일 뿐, 본 발명은의 실시예에 한정되는 것은 아니며, 본 발명이 속하는 분야에서 통상적인 지식을 가진 자라면 이러한 기재로부터 다양한 수정 및 변형이 가능하다.In the present invention as described above has been described by the specific embodiments, such as specific components and limited embodiments and drawings, but this is provided to help a more general understanding of the present invention, the present invention is not limited to the, Various modifications and variations can be made by those skilled in the art to which the present invention pertains.
따라서, 본 발명의 사상은 설명된 실시예에 국한되어 정해져서는 아니되며, 후술하는 특허청구범위뿐 아니라 이 특허청구범위와 균등하거나 등가적 변형이 있는 모든 것들은 본 발명 사상의 범주에 속한다고 할 것이다.Accordingly, the spirit of the present invention should not be construed as being limited to the embodiments described, and all of the equivalents or equivalents of the claims, as well as the following claims, belong to the scope of the present invention .
도 1은 본 발명의 일실시예에 있어서, 카테고리 분류 시스템의 내부 구성을 설명하기 위한 블록도이다.1 is a block diagram illustrating an internal configuration of a category classification system according to an embodiment of the present invention.
도 2는 본 발명의 일실시예에 있어서, 카테고리 분류 방법을 도시한 흐름도이다.2 is a flowchart illustrating a category classification method according to an embodiment of the present invention.
도 3은 본 발명의 일실시예에 있어서, 의사결정트리 생성 및 형태소 분석을 설명하기 위한 일례이다.3 is an example for explaining the decision tree generation and the morpheme analysis according to an embodiment of the present invention.
도 4는 본 발명의 일실시예에 있어서, 카테고리 추천 화면을 나타내는 일례이다.4 illustrates an example of a category recommendation screen according to an embodiment of the present invention.
도 5는 본 발명의 일실시예에 있어서, 보낸 사람 주소 및 참조 메일 주소의 등장횟수와 그에 따른 카테고리별 가중치를 나타낸 표이다.FIG. 5 is a table illustrating a frequency of appearance of a sender address and a reference mail address and corresponding weights according to an embodiment of the present invention.
도 6은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 일례이다.FIG. 6 illustrates an example of determining a category ranking based on a weight for each category and whether a category is selected.
도 7은 본 발명의 일실시예에 있어서, 카테고리별 가중치 및 카테고리 선택 여부에 따라 카테고리 랭킹을 결정하는 다른 예이다.FIG. 7 is another example of determining a category ranking based on a weight for each category and whether a category is selected.
<도면의 주요 부분에 대한 부호의 설명><Explanation of symbols for the main parts of the drawings>
100: 카테고리 분류 시스템100: categorization system
110: 형태소 분석부110: morphological analysis
120: 의사결정트리 생성부120: decision tree generation unit
130: 카테고리 선택부130: category selection unit
140: 카테고리별 가중치 계산부140: weight calculation unit for each category
150: 카테고리 랭킹 결정부150: category ranking determination unit
Claims (12)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090095506A KR101324459B1 (en) | 2009-10-08 | 2009-10-08 | System and method for e-mail categorization |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090095506A KR101324459B1 (en) | 2009-10-08 | 2009-10-08 | System and method for e-mail categorization |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110038279A KR20110038279A (en) | 2011-04-14 |
KR101324459B1 true KR101324459B1 (en) | 2013-10-31 |
Family
ID=44045366
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090095506A KR101324459B1 (en) | 2009-10-08 | 2009-10-08 | System and method for e-mail categorization |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101324459B1 (en) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180083148A (en) * | 2017-01-12 | 2018-07-20 | 주식회사 디아이섹 | Apparatus for email security trainning, and control method thereof |
KR102348239B1 (en) * | 2021-03-16 | 2022-01-07 | 주식회사 샌즈랩 | Method for Analyzing Keywords in Email |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060045308A (en) * | 2004-11-10 | 2006-05-17 | 한국전자통신연구원 | Apparatus and method for classifying e-mail using decision tree |
-
2009
- 2009-10-08 KR KR1020090095506A patent/KR101324459B1/en active IP Right Grant
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20060045308A (en) * | 2004-11-10 | 2006-05-17 | 한국전자통신연구원 | Apparatus and method for classifying e-mail using decision tree |
Non-Patent Citations (4)
Title |
---|
백준걸 외 3명, ‘실시간 기계 상태 데이터베이스에서 데이터 마이닝을 위한 적응형 의사결정 트리 알고리듬’, 대한산업공학회지26(2), pp.171-182, 2000.06* |
백준걸 외 3명, '실시간 기계 상태 데이터베이스에서 데이터 마이닝을 위한 적응형 의사결정 트리 알고리듬', 대한산업공학회지26(2), pp.171-182, 2000.06 * |
이경찬 외 1명, ‘범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템’, 한국정보과학회 학술발표논문집 29, pp.475-477, 2002.04* |
이경찬 외 1명, '범주 대표어의 가중치 계산 방식에 의한 자동 문서 분류 시스템', 한국정보과학회 학술발표논문집 29, pp.475-477, 2002.04 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20180083148A (en) * | 2017-01-12 | 2018-07-20 | 주식회사 디아이섹 | Apparatus for email security trainning, and control method thereof |
KR102348239B1 (en) * | 2021-03-16 | 2022-01-07 | 주식회사 샌즈랩 | Method for Analyzing Keywords in Email |
Also Published As
Publication number | Publication date |
---|---|
KR20110038279A (en) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11615079B1 (en) | Graphical user interface for recurring searches | |
US8909713B2 (en) | Method and system for filtering text messages | |
US7685141B2 (en) | Connection sub-graphs in entity relationship graphs | |
US8370374B1 (en) | On-the-fly pattern recognition with configurable bounds | |
US8918431B2 (en) | Adaptive ontology | |
JP2018538587A (en) | Risk assessment method and system | |
US10713423B2 (en) | Content adjustment and display augmentation for communication | |
US20170222966A1 (en) | Searching and displaying related content to a post in an activity stream | |
CN109299245B (en) | Method and device for recalling knowledge points | |
Morales-Ramirez et al. | Exploiting user feedback in tool-supported multi-criteria requirements prioritization | |
US10467252B1 (en) | Document classification and characterization using human judgment, tiered similarity analysis and language/concept analysis | |
CN109977300A (en) | Enterprise's public sentiment acquisition methods, device, terminal and computer storage medium | |
CN112968917B (en) | Penetration test method and system for network equipment | |
US9582586B2 (en) | Massive rule-based classification engine | |
JP5905651B1 (en) | Performance evaluation apparatus, performance evaluation apparatus control method, and performance evaluation apparatus control program | |
Al-Alwani | Improving email response in an email management system using natural language processing based probabilistic methods | |
KR101324459B1 (en) | System and method for e-mail categorization | |
CN115329078B (en) | Text data processing method, device, equipment and storage medium | |
CN103778210B (en) | Method and device for judging specific file type of file to be analyzed | |
CN110377741A (en) | File classification method, intelligent terminal and computer readable storage medium | |
CN112783775B (en) | Special character input testing method and device | |
CN106462614B (en) | Information analysis system, information analysis method, and information analysis program | |
KR20220131725A (en) | Efficient keyword extraction method from social big data based on cohesion scoring | |
CN113297289A (en) | Method and device for extracting business data from database and electronic equipment | |
CN111125319A (en) | Enterprise basic law intelligent consultation terminal, system and method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20161004 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20170926 Year of fee payment: 5 |
|
FPAY | Annual fee payment |
Payment date: 20181008 Year of fee payment: 6 |
|
FPAY | Annual fee payment |
Payment date: 20190905 Year of fee payment: 7 |