CN103457829B - 基于helpdesk自动化邮件系统的邮件处理方法和系统 - Google Patents

基于helpdesk自动化邮件系统的邮件处理方法和系统 Download PDF

Info

Publication number
CN103457829B
CN103457829B CN201210184315.7A CN201210184315A CN103457829B CN 103457829 B CN103457829 B CN 103457829B CN 201210184315 A CN201210184315 A CN 201210184315A CN 103457829 B CN103457829 B CN 103457829B
Authority
CN
China
Prior art keywords
mail
key word
dictionary
weights
keyword
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210184315.7A
Other languages
English (en)
Other versions
CN103457829A (zh
Inventor
李博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201210184315.7A priority Critical patent/CN103457829B/zh
Publication of CN103457829A publication Critical patent/CN103457829A/zh
Application granted granted Critical
Publication of CN103457829B publication Critical patent/CN103457829B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

本发明提出一种基于helpdesk自动化邮件系统的邮件处理方法和系统,其中所述方法包括以下步骤:抓取邮件桶中的邮件;解析抓取的每个邮件以获得每个邮件的关键词;根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理;在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息;以及将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。根据本发明的方法,一方面通过专有关键词词典,可从多个方面对邮件进行分词处理,提高邮件分类的准确性,另一方面结合历史邮件关键词处理数据库和知识库关键词处理数据库对邮件进行处理,可充分利用现有资源,提高日常helpdesk自动化邮件系统的运维效率。

Description

基于helpdesk自动化邮件系统的邮件处理方法和系统
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基于helpdesk自动化邮件系统的邮件处理方法和系统。
背景技术
现有的helpdesk自动化邮件系统中,主要通过以下两种方式实现邮件的筛选及分析处理:(1)针对邮件内容和标题进行Tag标识,手工进行分类处理,当新邮件投递到helpdesk自动化邮件系统中后,根据该新邮件的Tag标识在历史邮件处理数据库和知识库中查找相关标识的邮件;(2)通过词典对邮件进行分词分析,查询邮件中命中的关键词情况,根据权重在知识库中查找可能匹配的邮件。
现有技术存在以下问题,一方面,使用简单的Tag标识或者词典进行关键词分析,只能简单的从单一的方面对邮件进行分析,helpdesk自动化邮件系统运行在某些特定行业,无法在特定行业中发挥作用,另一方面对现有的邮件处理资源没有充分利用。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明的第一个目的在于提出一种可以提高邮件分类的准确性以及充分利用现有资源以提高日常运维效率的基于helpdesk自动化邮件系统的邮件处理方法。
本发明的第二个目的在于提出一种基于helpdesk自动化邮件系统的邮件处理系统。
为了实现上述目的,本发明的第一方面实施例的基于helpdesk自动化邮件系统的邮件处理方法包括以下步骤:a、抓取邮件桶中的邮件;b、解析抓取的每个所述邮件以获得每个所述邮件的关键词;c、根据每个所述邮件的关键词、专有关键词词典和普通关键词词典对每个所述邮件进行分类处理;d、在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个所述邮件对应的信息;以及e、将分类处理之后的每个所述邮件及对应信息分发到对应的邮件队列处理事务包中。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,一方面通过增加的专有关键词词典,可以从多个方面对邮件进行分词处理,提高邮件分类的准确性,另一方面通过结合历史邮件关键词处理数据库和知识库关键词处理数据库对邮件进行处理,可以充分利用现有资源,提高日常helpdesk自动化邮件系统的运维效率。
为了实现上述目的,本发明的第二方面实施例的用于helpdesk自动化邮件系统的邮件处理系统,包括抓取模块、解析模块、分类模块、获取模块和分发模块,其中,所述抓取模块,用于抓取邮件桶中的邮件;所述解析模块,用于解析所述抓取模块抓取的每个所述邮件以获得每个所述邮件的关键词;所述分类模块,用于根据每个所述邮件的关键词、专有关键词词典和普通关键词词典对每个所述邮件进行分类处理;所述获取模块,用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个所述邮件对应的信息;所述分发模块,用于将分类处理之后的每个所述邮件及对应信息分发到对应的邮件队列处理事务包中。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,一方面分类模块通过增加的专有关键词词典,可以从多个方面对邮件进行分词处理,提高邮件分类的准确性,另一方面获取模块通过结合历史邮件关键词处理数据库和知识库关键词处理数据库对邮件进行处理,可以充分利用现有资源,提高日常helpdesk自动化邮件系统的运维效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图;
图2是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图;
图3是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图;
图4是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图;
图5是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图;以及
图6是根据本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
在本发明的描述中,术语“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明而不是要求本发明必须以特定的方位构造和操作,因此不能理解为对本发明的限制。
下面参考说明书附图描述根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法。
一种基于helpdesk自动化邮件系统的邮件处理方法,包括以下步骤:a、抓取邮件桶中的邮件;b、解析抓取的每个邮件以获得每个邮件的关键词;c、根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理;d、在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息;以及e、将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
图1为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图。
如图1所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,包括下述步骤。
步骤S101,抓取邮件桶中的邮件。
具体地,helpdesk自动化邮件系统在邮件桶中存储未经处理的邮件,邮件抓取代理通过配置参数可以抓取邮件桶中指定的一组邮件,例如抓取具有相同后缀(如,@sina.com、@baidu.com等)的邮件。
步骤S102,解析抓取的每个邮件以获得每个邮件的关键词。
具体地,邮件抓取代理对所抓取的每个邮件的邮件内容和邮件标题等进行关键词解析以获取对应的关键词。
在本发明的一个实施例中,将解析之后的每个邮件及关键词存储到邮件存储数据库中。
步骤S103,根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理。
具体地,可以根据每个邮件的关键词在专有关键词词典和普通关键词词典中进行查找,专有关键词词典和普通关键词词典中携带有类型信息,再根据每个邮件的关键词在专有关键词词典和普通关键词词典中的命中情况(如命中次数等)对每个邮件进行分类,例如可以将该邮件归类为专有关键词词典中命中次数最多的专有关键词对应的类型,其中,专有关键词词典为特定行业的关键词词典。
步骤S104,在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息。
具体地,邮件分类之后根据每个邮件的关键词在历史邮件关键词处理数据库和知识库关键词处理数据库中查找相关联信息以获取每个邮件对应的信息,例如历史邮件处理工单、知识库关键词处理数据库中的WIKI结果等。
步骤S105,将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
具体地,在将每个邮件及对应信息分发到对应的邮件队列处理事务包中之后,运维人员对相应邮件队列进行实际运维处理。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,一方面通过增加的专有关键词词典,可以从多个方面对邮件进行分词处理,提高邮件分类的准确性,另一方面通过结合历史邮件关键词处理数据库和知识库关键词处理数据库对邮件进行处理,可以充分利用现有资源,提高日常helpdesk自动化邮件系统的运维效率。
图2为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图。
如图2所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,包括下述步骤。
步骤S201,抓取邮件桶中的邮件。
具体地,helpdesk自动化邮件系统在邮件桶中存储未经处理的邮件,邮件抓取代理通过配置参数可以抓取邮件桶中指定的一组邮件,例如抓取具有相同后缀(如,@sina.com、@baidu.com等)的邮件。
步骤S202,解析抓取的每个邮件以获得每个邮件的关键词。
具体地,邮件抓取代理对所抓取的每个邮件的邮件内容和邮件标题等进行关键词解析以获取对应的关键词。
在本发明的一个实施例中,将解析之后的每个邮件及关键词存储到邮件存储数据库中。
步骤S203,根据专有关键词词典和普通关键词词典对每个邮件的关键词赋予权值,其中,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值。
具体地,根据每个邮件的关键词在专有关键词词典和普通关键词词典中进行查找,再根据每个邮件的关键词在专有关键词词典和普通关键词词典中的命中情况(如命中次数等)对每个邮件的关键词赋予权值,例如,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值,属于相同关键词词典的关键词中命中次数多的权值大,其中,专有关键词词典为特定行业的关键词词典。
步骤S204,根据邮件的关键词的权值、关键词在专有关键词词典和/或普通关键词词典中的命中次数和命中位置计算邮件的权值。
其中,专有关键词词典中具有特殊特点的关键词携带类型信息,例如,交换机、路由器、四层设备等会被标注为网络设备,类似的关键词在专有关键词词典中根据相关程度预先设置好位置,普通关键词词典也有类似的性质。将邮件中的每个关键词的权值、在专有关键词词典和/或普通关键词词典中的命中次数和命中位置加权可以获得新的权值,然后根据每个关键词及其权值求和获得邮件的权值。
步骤S205,根据邮件的权值对邮件进行分类处理。
具体地,首先根据邮件的权值对邮件进行排序,例如按照邮件的权值从大到小将每个邮件排序,然后对排序的结果进行权值相近度分类,例如按照邮件的排序顺序,将权值差值在预定范围之内的邮件划分为一个相似度类型,再将在专有关键词词典和/或普通关键词词典中的具有相同类型且属于同一权值相似度的邮件归为一类。
步骤S206,在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息。
具体地,邮件分类之后根据每个邮件的关键词在历史邮件关键词处理数据库和知识库关键词处理数据库中查找相关联信息以获取每个邮件对应的信息,例如历史邮件处理工单、知识库关键词处理数据库中的WIKI结果等。
步骤S207,将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
具体地,在将每个邮件及对应信息分发到对应的邮件队列处理事务包中之后,运维人员对相应邮件队列进行实际运维处理。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,在邮件分类中加入专有关键词词典,并且以专有关键词词典的命中情况为主要分类依据,由于专有关键词词典具有行业特点,进一步提升准确性。
图3为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理方法的流程图。
如图3所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,包括下述步骤。
步骤S301,抓取邮件桶中的邮件。
具体地,helpdesk自动化邮件系统在邮件桶中存储未经处理的邮件,邮件抓取代理通过配置参数可以抓取邮件桶中指定的一组邮件,例如抓取具有相同后缀(如,@sina.com、@baidu.com等)的邮件。
步骤S302,解析抓取的每个邮件以获得每个邮件的关键词。
具体地,邮件抓取代理对所抓取的每个邮件的邮件内容和邮件标题等进行关键词解析以获取对应的关键词。
在本发明的一个实施例中,将解析之后的每个邮件及关键词存储到邮件存储数据库中。
步骤S303,根据专有关键词词典和普通关键词词典对每个邮件的关键词赋予权值,其中,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值。
具体地,根据每个邮件的关键词在专有关键词词典和普通关键词词典中进行查找,再根据每个邮件的关键词在专有关键词词典和普通关键词词典中的命中情况(如命中次数等)对每个邮件的关键词赋予权值,例如,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值,属于相同关键词词典的关键词中命中次数多的权值大,其中,专有关键词词典为特定行业的关键词词典。
步骤S304,根据邮件的关键词的权值、关键词在专有关键词词典和/或普通关键词词典中的命中次数和命中位置计算邮件的权值。
其中,专有关键词词典中具有特殊特点的关键词携带类型信息,例如,交换机、路由器、四层设备等会被标注为网络设备,类似的关键词在专有关键词词典中根据相关程度预先设置好位置,普通关键词词典也有类似的性质。将邮件中的每个关键词的权值、在专有关键词词典和/或普通关键词词典中的命中次数和命中位置加权可以获得新的权值,然后根据每个关键词及其权值求和获得邮件的权值。
步骤S305,根据邮件的权值对邮件进行分类处理。
具体地,首先根据邮件的权值对邮件进行排序,例如按照邮件的权值从大到小将每个邮件排序,然后对排序的结果进行权值相近度分类,例如按照邮件的排序顺序,将权值差值在预定范围之内的邮件划分为一个相似度类型,再将在专有关键词词典和/或普通关键词词典中的具有相同类型且属于同一权值相似度的邮件归为一类。
步骤S306,计算每个邮件与历史邮件关键词处理数据库和知识库关键词处理数据库中分类结果的耦合度。
其中,在耦合度计算过程中,属于专有关键词词典的邮件关键词的匹配权值要远远大于属于普通关键词词典的邮件关键词的匹配权值。
步骤S308,将耦合度最高的历史邮件关键词数据库和/或知识库关键词处理数据库中对应的结果信息与邮件关联,并添加到邮件队列处理事务包中。
在本发明的一个实施例中,结果信息包括历史邮件关键词数据库中的历史处理工单和/或关键词知识库中的WIKI(知识)结果。
步骤S309,将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
具体地,在将每个邮件及对应信息分发到对应的邮件队列处理事务包中之后,运维人员对相应邮件队列进行实际运维处理。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理方法,通过计算每个邮件与历史邮件关键词处理数据库和知识库关键词处理数据库中分类结果的耦合度并将耦合度大的结果信息与邮件关联,对现有资源进行挖掘,有效帮助运维人员处理现有邮件。
为了实现上述实施例的基于helpdesk自动化邮件系统的邮件处理方法,本发明另一方面的实施例还提出一种基于helpdesk自动化邮件系统的邮件处理系统。下面参考说明书附图描述根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统。
一种基于helpdesk自动化邮件系统的邮件处理系统,包括:抓取模块、解析模块、分类模块、获取模块和分发模块,其中,抓取模块,用于抓取邮件桶中的邮件;解析模块,用于解析抓取模块抓取的每个邮件以获得每个邮件的关键词;分类模块,用于根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理;获取模块,用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息;分发模块,用于将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
图4为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图。
如图4所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,包括抓取模块100、解析模块200、分类模块300、获取模块400和分发模块500。
具体地,抓取模块100用于抓取邮件桶中的邮件,更具体地,helpdesk自动化邮件系统在邮件桶中存储未经处理的邮件,抓取模块100可以通过邮件抓取代理配置参数抓取邮件桶中指定的一组邮件,例如抓取具有相同后缀(如,@sina.com、@baidu.com等)的邮件。
解析模块200用于解析抓取的每个邮件以获得每个邮件的关键词。更具体地,解析模块200可以通过邮件抓取代理对所抓取的每个邮件的邮件内容和邮件标题等进行关键词解析以获取对应的关键词。其中,可以将解析之后的每个邮件及关键词存储到邮件存储数据库中。
分类模块300用于根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理。更具体地,分类模块300根据每个邮件的关键词在专有关键词词典和普通关键词词典中进行查找,专有关键词词典和普通关键词词典中携带有类型信息,再根据每个邮件的关键词在专有关键词词典和普通关键词词典中的命中情况(如命中次数等)对每个邮件进行分类,例如可以将该邮件归类为专有关键词词典中命中次数最多的专有关键词对应的类型,其中,专有关键词词典为特定行业的关键词词典。
获取模块400用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息。更具体地,邮件分类之后获取模块400根据每个邮件的关键词在历史邮件关键词处理数据库和知识库关键词处理数据库中查找相关联信息以获取每个邮件对应的信息,例如历史邮件处理工单、知识库关键词处理数据库中的WIKI结果等。
分发模块500用于将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。更具体地,在将每个邮件及对应信息分发到对应的邮件队列处理事务包中之后,运维人员对相应邮件队列进行实际运维处理。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,一方面分类模块通过增加的专有关键词词典,可以从多个方面对邮件进行分词处理,提高邮件分类的准确性,另一方面获取模块通过结合历史邮件关键词处理数据库和知识库关键词处理数据库对邮件进行处理,可以充分利用现有资源,提高日常helpdesk自动化邮件系统的运维效率。
图5为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图。
如图5所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,包括抓取模块100、解析模块200、分类模块300、获取模块400、分发模块500、权值赋予单元310、权值计算单元320和分类处理单元330,其中分类模块300包括权值赋予单元310、权值计算单元320和分类处理单元330。
具体地,抓取模块100用于抓取邮件桶中的邮件。解析模块200用于解析抓取的每个邮件以获得每个邮件的关键词。分类模块300用于根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理。获取模块400用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息。分发模块500用于将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。
权值赋予单元310用于根据专有关键词词典和普通关键词词典对每个邮件的关键词赋予权值,其中,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值。更具体地,权值赋予单元310根据每个邮件的关键词在专有关键词词典和普通关键词词典中进行查找,再根据每个邮件的关键词在专有关键词词典和普通关键词词典中的命中情况(如命中次数等)对每个邮件的关键词赋予权值,例如,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值,属于相同关键词词典的关键词中命中次数多的权值大,其中,专有关键词词典为特定行业的关键词词典。
权值计算单元320用于根据邮件的关键词的权值、关键词在专有关键词词典和/或普通关键词词典中的命中次数和命中位置计算邮件的权值。其中,专有关键词词典中具有特殊特点的关键词携带类型信息,例如,交换机、路由器、四层设备等会被标注为网络设备,类似的关键词在专有关键词词典中根据相关程度预先设置好位置,普通关键词词典也有类似的性质,权值计算单元320将邮件中的每个关键词的权值、在专有关键词词典和/或普通关键词词典中的命中次数和命中位置加权可以获得新的权值,然后根据每个关键词及其权值求和获得邮件的权值。
分类处理单元330用于根据邮件的权值对邮件进行分类处理。首先,根据邮件的权值对邮件进行排序,例如按照邮件的权值从大到小将每个邮件排序,然后对排序的结果进行权值相近度分类,例如按照邮件的排序顺序,将权值差值在预定范围之内的邮件划分为一个相似度类型,再将在专有关键词词典和/或普通关键词词典中的具有相同类型且属于同一权值相似度的邮件归为一类。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,通过分类模块在邮件分类中加入专有关键词词典,并且以专有关键词词典的命中情况为主要分类依据,由于专有关键词词典具有行业特点,进一步提升准确性。
图6为本发明一个实施例的基于helpdesk自动化邮件系统的邮件处理系统的结构框图。
如图6所示,根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,包括抓取模块100、解析模块200、分类模块300、获取模块400、分发模块500、权值赋予单元310、权值计算单元320、分类处理单元330、计算单元410、关联单元420和添加单元430,其中,分类模块300包括权值赋予单元310、权值计算单元320和分类处理单元330,获取模块400包括计算单元410、关联单元420和添加单元430。
具体地,抓取模块100用于抓取邮件桶中的邮件。解析模块200用于解析抓取的每个邮件以获得每个邮件的关键词。分类模块300用于根据每个邮件的关键词、专有关键词词典和普通关键词词典对每个邮件进行分类处理。获取模块400用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个邮件对应的信息。分发模块500用于将分类处理之后的每个邮件及对应信息分发到对应的邮件队列处理事务包中。权值赋予单元310用于根据专有关键词词典和普通关键词词典对每个邮件的关键词赋予权值,其中,属于专有关键词词典的关键词的权值大于属于普通关键词词典的关键词的权值。权值计算单元320用于根据邮件的关键词的权值计算邮件的权值。分类处理单元330用于根据邮件的权值对邮件进行分类处理。
计算单元410用于计算每个邮件与历史邮件关键词处理数据库和知识库关键词处理数据库中分类结果的耦合度。其中,在耦合度计算过程中,属于专有关键词词典的邮件关键词的匹配权值要远远大于属于普通关键词词典的邮件关键词的匹配权值。
关联单元420用于将耦合度最高的历史邮件关键词数据库和/或知识库关键词处理数据库中对应的结果信息与邮件关联。在本发明的一个实施例中,结果信息包括历史邮件关键词数据库中的历史处理工单和/或知识库关键词处理数据库中的WIKI(知识)结果。
添加单元430用于将结果信息添加到邮件队列处理事务包中。
根据本发明实施例的基于helpdesk自动化邮件系统的邮件处理系统,获取模块通过计算每个邮件与历史邮件关键词处理数据库和知识库关键词处理数据库中分类结果的耦合度并将耦合度大的结果信息与邮件关联,对现有资源进行挖掘,有效帮助运维人员处理现有邮件。
在本发明的一个实施例中,还包括保存模块(图中未示出),用于将解析之后的每个邮件及关键词存储到邮件存储数据库中。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。
计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,在本发明的实施例中,移动终端可以是手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (12)

1.一种基于helpdesk自动化邮件系统的邮件处理方法,其特征在于,包括以下步骤:
a、抓取邮件桶中的邮件;
b、解析抓取的每个所述邮件以获得每个所述邮件的关键词;
c、根据每个所述邮件的关键词、专有关键词词典和普通关键词词典对每个所述邮件进行分类处理;
d、在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个所述邮件对应的信息;以及
e、将分类处理之后的每个所述邮件及对应信息分发到对应的邮件队列处理事务包中。
2.根据权利要求1所述的方法,其特征在于,所述步骤c包括:
c1、根据所述专有关键词词典和所述普通关键词词典对每个所述邮件的所述关键词赋予权值,其中,属于所述专有关键词词典的所述关键词的权值大于属于所述普通关键词词典的所述关键词的权值;
c2、根据所述邮件的关键词的权值、所述关键词在所述专有关键词词典和/或所述普通关键词词典中的命中次数和命中位置计算所述邮件的权值;以及
c3、根据所述邮件的权值对所述邮件进行分类处理。
3.根据权利要求2所述的方法,其特征在于,所述步骤c3包括:
根据所述邮件的权值对所述邮件进行排序;
对所述排序的结果进行权值相近度分类;以及
将在所述专有关键词词典和/或所述普通关键词词典中的具有相同类型且属于同一权值相似度的所述邮件归为一类。
4.根据权利要求1所述的方法,其特征在于,所述步骤d包括:
d1、计算每个所述邮件与所述历史邮件关键词处理数据库和所述知识库关键词处理数据库中分类结果的耦合度;以及
d2、将耦合度最高的所述历史邮件关键词数据库和/或所述知识库关键词处理数据库中对应的结果信息与所述邮件关联,并添加到邮件队列处理事务包中。
5.根据权利要求4所述的方法,其特征在于,所述结果信息包括所述历史邮件关键词数据库中的历史处理工单和/或所述知识库关键词处理数据库中的WIKI结果。
6.根据权利要求1-5中任一项所述的方法,其特征在于,在步骤b之后还包括:
将解析之后的每个所述邮件及所述关键词存储到邮件存储数据库中。
7.一种用于helpdesk自动化邮件系统的邮件处理系统,其特征在于,包括抓取模块、解析模块、分类模块、获取模块和分发模块,其中,
所述抓取模块,用于抓取邮件桶中的邮件;
所述解析模块,用于解析所述抓取模块抓取的每个所述邮件以获得每个所述邮件的关键词;
所述分类模块,用于根据每个所述邮件的关键词、专有关键词词典和普通关键词词典对每个所述邮件进行分类处理;
所述获取模块,用于在历史邮件关键词处理数据库和知识库关键词处理数据库中获取每个所述邮件对应的信息;
所述分发模块,用于将分类处理之后的每个所述邮件及对应信息分发到对应的邮件队列处理事务包中。
8.根据权利要求7所述的系统,其特征在于,所述分类模块包括:
权值赋予单元,用于根据所述专有关键词词典和所述普通关键词词典对每个所述邮件的所述关键词赋予权值,其中,属于所述专有关键词词典的所述关键词的权值大于属于所述普通关键词词典的所述关键词的权值;
权值计算单元,用于根据所述邮件的关键词的权值、所述关键词在所述专有关键词词典和/或所述普通关键词词典中的命中次数和命中位置计算所述邮件的权值;以及
分类处理单元,用于根据所述邮件的权值对所述邮件进行分类处理。
9.根据权利要求8所述的系统,其特征在于,所述分类处理单元用于根据所述邮件的权值对所述邮件进行排序,并对所述排序的结果进行权值相近度分类,以及将在所述专有关键词词典和/或所述普通关键词词典中的具有相同类型且属于同一权值相似度的所述邮件归为一类。
10.根据权利要求7所述的系统,其特征在于,所述获取模块包括:
计算单元,用于计算每个所述邮件与所述历史邮件关键词处理数据库和所述知识库关键词处理数据库中分类结果的耦合度;
关联单元,用于将耦合度最高的所述历史邮件关键词数据库和/或所述知识库关键词处理数据库中对应的结果信息与所述邮件关联;以及
添加单元,用于将所述结果信息添加到邮件队列处理事务包中。
11.根据权利要求10所述的系统,其特征在于,所述结果信息包括所述历史邮件关键词数据库中的历史处理工单和/或所述知识库关键词处理数据库中的WIKI结果。
12.根据权利要求7-11中任一项所述的系统,其特征在于,还包括:
保存模块,用于将解析之后的每个所述邮件及所述关键词存储到邮件存储数据库中。
CN201210184315.7A 2012-06-05 2012-06-05 基于helpdesk自动化邮件系统的邮件处理方法和系统 Active CN103457829B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210184315.7A CN103457829B (zh) 2012-06-05 2012-06-05 基于helpdesk自动化邮件系统的邮件处理方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210184315.7A CN103457829B (zh) 2012-06-05 2012-06-05 基于helpdesk自动化邮件系统的邮件处理方法和系统

Publications (2)

Publication Number Publication Date
CN103457829A CN103457829A (zh) 2013-12-18
CN103457829B true CN103457829B (zh) 2016-12-14

Family

ID=49739808

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210184315.7A Active CN103457829B (zh) 2012-06-05 2012-06-05 基于helpdesk自动化邮件系统的邮件处理方法和系统

Country Status (1)

Country Link
CN (1) CN103457829B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106130880A (zh) * 2016-07-05 2016-11-16 马岩 网络邮件数据的搜集方法及系统
CN111582831B (zh) * 2020-05-12 2023-03-14 深圳博沃智慧科技有限公司 政务信箱管理方法、系统及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1760901A (zh) * 2005-11-03 2006-04-19 上海交通大学 电子邮件过滤系统
CN101295381A (zh) * 2008-06-25 2008-10-29 北京大学 一种垃圾邮件检测方法
US7899871B1 (en) * 2006-01-23 2011-03-01 Clearwell Systems, Inc. Methods and systems for e-mail topic classification

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7590694B2 (en) * 2004-01-16 2009-09-15 Gozoom.Com, Inc. System for determining degrees of similarity in email message information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1760901A (zh) * 2005-11-03 2006-04-19 上海交通大学 电子邮件过滤系统
US7899871B1 (en) * 2006-01-23 2011-03-01 Clearwell Systems, Inc. Methods and systems for e-mail topic classification
CN101295381A (zh) * 2008-06-25 2008-10-29 北京大学 一种垃圾邮件检测方法

Also Published As

Publication number Publication date
CN103457829A (zh) 2013-12-18

Similar Documents

Publication Publication Date Title
CN106547871B (zh) 基于神经网络的搜索结果的召回方法和装置
CN101119326B (zh) 一种即时通信会话记录的管理方法及装置
CN107341183B (zh) 一种基于暗网网站综合特征的网站分类方法
US20090006391A1 (en) Automatic categorization of document through tagging
CN111460312A (zh) 空壳企业识别方法、装置及计算机设备
CN104809108B (zh) 信息监测分析系统
CN111475603B (zh) 企业标识识别方法、装置、计算机设备及存储介质
CN112165462A (zh) 基于画像的攻击预测方法、装置、电子设备及存储介质
TW200900958A (en) Link spam detection using smooth classification function
CN111385602A (zh) 基于多层级多模型的视频审核方法、介质及计算机设备
CN110287292B (zh) 一种裁判量刑偏离度预测方法及装置
CN110737821B (zh) 相似事件查询的方法、装置、存储介质和终端设备
CN107483451B (zh) 基于串并行结构网络安全数据处理方法及系统、社交网络
CN111538931A (zh) 基于大数据的舆情监控方法、装置、计算机设备及介质
CN111078835A (zh) 简历评估方法、装置、计算机设备及存储介质
CN112528022A (zh) 主题类别对应的特征词提取和文本主题类别识别方法
CN111159481B (zh) 图数据的边预测方法、装置及终端设备
Lee et al. Analysis of document-mining techniques and tools for technology intelligence: discovering knowledge from technical documents
CN103457829B (zh) 基于helpdesk自动化邮件系统的邮件处理方法和系统
Badrinath et al. An overview of global research trends in BIM from analysis of BIM publications
CN114328808A (zh) 地址模糊匹配方法、地址处理方法、装置和电子设备
CN110609936A (zh) 一种模糊地址数据智能分类的方法
CN110019829A (zh) 数据属性确定方法、装置
CN113282686B (zh) 一种不平衡样本的关联规则确定方法及装置
CN107577667A (zh) 一种实体词处理方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant