CN111222851B - 一种邮件分类方法、装置及电子设备 - Google Patents

一种邮件分类方法、装置及电子设备 Download PDF

Info

Publication number
CN111222851B
CN111222851B CN201911426153.1A CN201911426153A CN111222851B CN 111222851 B CN111222851 B CN 111222851B CN 201911426153 A CN201911426153 A CN 201911426153A CN 111222851 B CN111222851 B CN 111222851B
Authority
CN
China
Prior art keywords
clustering
mail
user
mails
factors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911426153.1A
Other languages
English (en)
Other versions
CN111222851A (zh
Inventor
陈颖棠
彭文浩
潘文辉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lunkr Technology Guangzhou Co Ltd
Original Assignee
Lunkr Technology Guangzhou Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lunkr Technology Guangzhou Co Ltd filed Critical Lunkr Technology Guangzhou Co Ltd
Priority to CN201911426153.1A priority Critical patent/CN111222851B/zh
Publication of CN111222851A publication Critical patent/CN111222851A/zh
Application granted granted Critical
Publication of CN111222851B publication Critical patent/CN111222851B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management
    • G06Q10/107Computer-aided management of electronic mailing [e-mailing]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/113Details of archiving
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • G06Q10/06393Score-carding, benchmarking or key performance indicator [KPI] analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Strategic Management (AREA)
  • Economics (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Game Theory and Decision Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明提供一种邮件分类方法、装置及电子设备,该方法包括:获取用户的邮件服务器中存储的邮件;根据邮件,确定与用户对应的聚类因子;根据聚类因子对邮件进行分类,并将邮件对应存入分别以聚类因子命名的文件夹中。本发明不需要用户手动提取关键字并设置分类条件,向用户做出初步的规则推荐后,用户再按照个人习惯进行简单操作就会自动创建文件夹并按规则移动邮件进行分类,操作简单方便,分类准确,可以极大地提高工作效率,有效地满足用户对邮件的分类需求,以及避免错过重要邮件。

Description

一种邮件分类方法、装置及电子设备
技术领域
本发明涉及互联网技术领域,具体涉及一种邮件分类方法、装置及电子设备。
背景技术
在企业内部,邮箱是日常办公中必须用到的重要系统之一,每天都会有大量邮件被接收。使用频繁的话,每个月都会产生几百封电子邮件。通常情况下,邮箱接收邮件后会将所有邮件存入邮箱默认的收件箱中。长时间使用后,如何在几百上千条的电子邮件中,方便的找到一些特殊类别的电子邮件,成了一大问题。
现有技术中,邮箱中设置有邮件过滤器,用户需手动把某类邮件的关键字提取出来,然后邮箱以此作为分类的依据,将含有该关键字的邮件执行某个指令,如移动至某个指定的分类文件夹下,或标记颜色以重点提醒等。然而,一方面该功能并不是所有用户知晓的,不清楚如何使用邮件过滤器对邮件进行分类,另一方面该邮件过滤器需要设置的条件比较多,使用起来较为复杂,也很难设置成用户满意的分类效果,不能满足用户对邮件的分类需求。
需要注意的是,本部分旨在为权利要求书中陈述的本公开的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
发明内容
本发明实施例提供一种邮件分类方法、装置及电子设备,以解决现有技术中用户不清楚如何通过邮件过滤器对邮件进行分类以及邮件过滤器使用起来较为复杂且分类效果不佳的问题。
第一方面,本发明实施例提供一种邮件分类方法,包括:
获取用户的邮件服务器中存储的邮件;
根据所述邮件,确定与所述用户对应的聚类因子;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中。
作为本发明第一方面的优选方式,所述根据所述邮件,确定与所述用户对应的至少一个聚类因子包括:
获取所述用户对各所述邮件的关注级别;
获取所述用户的用户关键词;
根据各所述邮件的关注级别和所述用户关键词,确定与所述用户对应的聚类因子。
作为本发明第一方面的优选方式,所述获取所述用户对各所述邮件的关注级别包括:
通过邮件评分项对所述邮件进行评分,获取各所述邮件的评分值,所述邮件评分项至少包括邮件点击数、邮件回复数、邮件读取状态、收件人邮箱地址和抄送人邮箱地址;
根据各所述邮件的评分值,确定各所述邮件的关注度;
根据各所述邮件的关注度,确定各所述邮件的关注级别。
作为本发明第一方面的优选方式,所述获取所述用户的用户关键词包括:
获取所述用户所在部门在规则数据库中的常用关键词;
获取所述邮件中的邮件关键词;
根据所述常用关键词和所述邮件关键词,确定所述用户的用户关键词。
作为本发明第一方面的优选方式,所述获取用户的邮件服务器中存储的邮件之后,还包括:
判断所述用户是否需要进行邮件分类;
若是,则继续执行根据所述邮件,确定与所述用户对应的聚类因子的步骤。
作为本发明第一方面的优选方式,所述判断所述用户是否需要进行邮件分类包括:
对所述邮件的数量进行统计,获取所述邮件的邮件数量;
判断所述邮件数量是否大于等于预设阈值;
若是,则向所述用户发送邮件分类请求;
若所述用户通过所述邮件分类请求,则确定所述用户需要进行邮件分类。
作为本发明第一方面的优选方式,所述向所述用户发送邮件分类请求之后,还包括:
若所述用户未通过所述邮件分类请求,则在所述邮件数量大于所述预设阈值的N倍时,继续执行所述向所述用户发送邮件分类请求的步骤。
作为本发明第一方面的优选方式,所述根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中包括:
从所述聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入所述文件夹中。
第二方面,本发明实施例提供一种邮件分类装置,包括:
邮件获取单元,用于获取用户的邮件服务器中存储的邮件;
因子确定单元,用于根据所述邮件,确定与所述用户对应的聚类因子;
邮件分类单元,用于根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中。
第三方面,本发明实施例提供一种电子设备,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取用户的邮件服务器中存储的邮件;根据所述邮件,确定与所述用户对应的聚类因子;根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中。
本发明实施例提供的一种邮件分类方法、装置及电子设备,通过分析学习用户个人的邮件内容,来确定与用户的工作职责、邮件关键信息相对应的聚类因子,在用户邮箱接收的邮件数达到某个数量级时,则自动根据聚类因子创建对应的文件夹并将邮件按规则移动到各个文件夹中。整个过程不需要用户手动提取关键字并设置分类条件,向用户做出初步的规则推荐后,用户再按照个人习惯进行简单操作就会自动创建文件夹并按规则移动邮件进行分类,操作简单方便,分类准确,可以极大地提高工作效率,有效地满足用户对邮件的分类需求,以及避免错过重要邮件。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种邮件分类方法的流程图;
图2为本发明实施例提供的一种邮件分类方法的另一流程图;
图3为本发明实施例提供的一种邮件分类装置的结构示意图;
图4为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
参照图1所示,本发明实施例公开了一种邮件分类方法,该方法主要包括:
101、获取用户的邮件服务器中存储的邮件;
102、根据邮件,确定与用户对应的聚类因子;
103、根据聚类因子对邮件进行分类,并将邮件对应存入分别以聚类因子命名的文件夹中。
步骤101中,本实施例中的方法的执行主体可以为企业邮箱的邮箱服务器。
用户登录企业邮箱账号后,邮件服务器接收邮件,接收的邮件被存放在邮件服务器的收件箱中。在获取用户的邮件服务器中存储的邮件时,可以被动地接收来自邮件服务器转发的邮件,也可以主动采集邮件服务器存储的邮件。
邮件服务器长时间接收邮件后,邮件服务器中存储成百上千条邮件,如果不对存储的邮件进行分类的话,想要找到一些特殊类别的邮件就成了一大问题。
进一步地,在步骤101之后,还包括如下步骤:
101-1、判断用户是否需要进行邮件分类;
101-2、若用户需要进行邮件分类,则继续执行步骤102。
当用户的邮件服务器中存储的邮件数量达到一定数量级时,邮箱服务器会先判断用户是否需要进行邮件分类。若确定用户需要进行邮件分类时,则会执行对邮件分类的下一个步骤,否则邮件服务器不会自行对邮件进行分类,以避免给用户带来不好的体验。
在一种可能的实现方式中,步骤101-1可按照如下步骤具体实施:
101-11、对邮件的数量进行统计,获取邮件的邮件数量。
先对存储在邮件服务器中的邮件进行统计,获取邮件的邮件数量,以进一步判断邮件的数量是否达到了需要进行分类的数量级。邮件数量太少时,可供参考的信息量太少,得出的聚类因子会不准确,聚类意义不大。
101-12、判断邮件数量是否大于预设阈值。
统计出邮件数量后,将其与预设阈值进行比较。一般地,预设阈值设为500,该数量级下的邮件可供参考的信息量达到了一定规模,由此得出的聚类因子相对准确一些,会使邮件的分类情况更加准确。
101-13、若邮件数量大于等于预设阈值,则向用户发送邮件分类请求。
当确定邮件数量大于等于预设阈值时,满足了触发邮件分类的条件,此时可以对邮件进行分类处理。
在应用本发明实施例中所述的方法进行首次邮件分类操作时,邮件服务器中存储的邮件数量通常会较多,一般会大于预设阈值,如邮件数量为800封时,满足了邮件分类的条件。当进行过一次邮件分类后,邮件服务器中存储的未分类的邮件会大量减少,其数量需要逐步累积,当邮件数量再次累积到等于预设阈值时,如邮件数量为500封时,即满足了邮件分类的条件。
当邮件数量满足邮件分类的条件时,邮件服务器就会向用户发送邮件分类请求,例如“您的邮件数量较多,建议启用邮件自动分类器进行分类”等提示用语。提示用语下面通常会设置“是”和“忽略”两个按钮供用户进行选择。
101-14、若用户通过邮件分类请求,则确定用户需要进行邮件分类。
若此时用户需要对邮件进行分类,就会点击“是”这个按钮,此时即能确定用户同意进行邮件分类。此时,进一步执行后续的分类步骤对邮件进行分类即可。
进一步地,步骤101-13之后,还包括如下步骤:
101-15、若用户未通过邮件分类请求,则在邮件数量大于等于预设阈值的N倍时,继续执行向所述用户发送邮件分类请求的步骤。
若用户在收到邮件分类请求后,暂不同意对邮件进行分类,就会点击“忽略”这个按钮,此时即能确定用户不同意进行邮件分类。此时,不会执行后续的分类步骤对邮件进行分类,整个邮件分类过程暂时结束。
当邮件数量逐步累积到预设阈值的N倍时,N为大于等于2的整数,还会再次向用户发送邮件分类请求。例如,当进行首次邮件分类操作时,邮件数量为800封,此时用户不需要进行邮件分类,邮件分类过程暂停。当邮件数量累积到1000封,即预设阈值500的2倍时,会再次向用户发送邮件分类请求,用户此次同意进行分类后即继续执行后续的分类步骤对邮件进行分类。若用户仍然不需要进行邮件分类时,邮件分类过程暂停,直至邮件数量累计到1500封,即预设阈值500的3倍时,会再次向用户发送邮件分类请求,以此类推。
步骤102中,在上述步骤中,邮件数量达到一定的数量级且用户同意进行邮件分类时,则会基于该邮件确定与用户对应的聚类因子,该聚类因子是邮件分类的依据。
本步骤中根据用户对各邮件的关注程度以及用户在企业内部的职责分工,来最终提取出与用户相对应的聚类因子。由于每个用户的关注点不同,因此提出的聚类因子也是不相同的。例如,财务部门的用户会对企业专用发票和普通发票有独立区分的要求,而其他部门的用户则不会有此要求。
具体地,步骤102可按照如下步骤具体实施:
1021、获取用户对各邮件的关注级别。
首先,对各邮件进行评分,获取用户对各个邮件的关注级别,即可确定用户的关注点。
在一种可能的实现方式中,步骤1021可按照如下步骤具体实施:
1021-1、通过邮件评分项对邮件进行评分,获取各邮件的评分值,邮件评分项至少包括邮件点击数、邮件回复数、邮件读取状态、收件人邮箱地址和抄送人邮箱地址;
1021-2、根据各邮件的评分值,确定各邮件的关注度;
1021-3、根据各邮件的关注度,确定各邮件的关注级别。
上述步骤中,先设置邮件的评分项,并以此来确定各邮件的评分值。其中,邮件评分项包括单不限于邮件点击数、邮件回复数、邮件读取状态、收件人邮箱地址和抄送人邮箱地址,选取的这些评分项都可以直观地反应用户对各邮件的关注程度。在具体评分时,可以为各邮件的每一邮件评分项来打分,将各分值加起来即可得到各邮件的评分值。
根据邮件点击数或搜索次数、邮件回复数、邮件读取状态或时间、收件人邮箱地址和抄送人邮箱地址等作为正向的评分,同时结合主题内容,如通知、周报、申请、审批等,评分数值处于0.00至1.00的范围内,并对评分项加权后合并计分。此时得到的是正值,是用户关注的邮件。
根据高频发信域名、高度相似邮件主题、高频被抄送、外域邮件等作为反向的评分,评分数值处于-1.00至-0.01的范围内,并对评分项加权后合并计分。此时得到的是负值,是用户不关注的邮件。
最后,根据上述得到的各邮件的关注度,并结合相关的邮件数量对邮件的关注度进行分级,最终确定各类邮件的关注级别。例如,可按照如下方式设置关注级别:评分值为0.80-1.00时定义为“特别重要”,评分值为0.60-0.79时定义为“一般重要”,评分值低于-0.5时定义为“不重要”,评分值为-0.49-0.59时定义为“普通”等。本实施例对此过程不做限定。
1022、获取所述用户的用户关键词;
其次,对用户进行画像,获取用户的用户关键词,即可确定用户在该企业中的职责分工。
在一种可能的实现方式中,步骤1022可按照如下步骤具体实施:
1022-1、获取用户所在部门在规则数据库中的常用关键词;
1022-2、获取邮件中的邮件关键词;
1022-3、根据常用关键词和邮件关键词,确定用户的用户关键词。
上述步骤中,先利用用户所在部门,在现有的规则数据库中查找该部门的常用关键词。例如,财务部门的常用关键词一般为“发票”、“报销”、“结账”等,而销售部门的常用关键词一般为“外勤”、“报销”、“报价”等。
然后,提取和统计用户所在的规则数据库中,可以对邮件正文、主题、摘要、发件人信息和/或收件人信息等信息进行分词处理,提取和统计出各邮件的邮件关键字。例如,财务部门的邮件关键词一般包括“发票”、“报销”、“结账”等,而销售部门的邮件关键词一般包括“外勤”、“报销”、“报价”等。而针对同一部门,财务部门的A同事,收到包括“发票”关键词的邮件占90%,包括“报销”关键词的邮件占10%,而B同事收到包括“报销”关键词的邮件占100%,这两个同事的工作内容不一样,邮件分类规则也会不一样。
最后,通过对上述得出该用户的用户关键词,即用户画像。据此可以得出同在财务部门的几个同事间不同的关键词,关键词不同说明分工职责不一样,所以会影响下一步的聚类原则。
1023、根据各邮件的关注级别和用户关键词,确定与用户对应的聚类因子。
最后,将上述步骤得出的各邮件的关注级别和用户关键词进行分析,可以得出与该用户对应的聚类因子,聚类因子由以下的三个维度组合而成:(1)重点关注(邮件评分为正的);(2)不重要,不关注(邮件评分为负的);(3)鲜明工作职责的(用户所在部门得出的关键词)。组合方式可以是选取(1)+(3)或者单独选取(1)或者单独选取(2)等。
步骤103中,上述步骤中确定了用户对应的聚类因子后,可以基于该聚类因子对邮件进行分类,并自动创建相应的以聚类因子命名的文件夹,将邮件对应存入各个文件夹中即可。
具体地,步骤103可按照如下步骤具体实施:
1031、从聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度。
在用户确认要进行邮件分类后,会获取用户对应的聚类因子,并推荐给用户选择,用户会按照个人习惯从中选取更适合自己的多个聚类因子。例如,在财务部门工作的用户,在确认要进行邮件分类后,即点击了“是”按钮后,会进一步接收到生成的与该用户对应的多个聚类因子,如“发票”、“报销”和“结账”,此时需要用户从中选取更适合自己的聚类因子,如可以选取“发票”和“报销”,并以此作为邮件类别。
用户选定作为邮件类别的聚类因子后,还需要选择聚类程度。聚类程度一般分为高、中、低三个等级,聚类程度为高时,如果各个聚类因子之间的词义较为相近能够进行同义聚合时,可以对用户选择的聚类因子进行再次聚类;如果各个聚类因子之间的词义相差太大无法进行同义聚合时,即使聚类程度为高也不会对用户选择的聚类因子进行再次聚类了,只保留用户选择的聚类因子作为邮件类别。
1032、根据聚类因子和聚类程度,创建以聚类因子命名的文件夹。
用户选定了可以作为邮件类别的聚类因子和相应的聚类程度后,邮件服务器会据此生成最终的能够作为邮件类别的聚类因子,同时创建以各个聚类因子进行命名的文件夹。
例如,在财务部门工作的用户,从接收到的聚类因子“发票”、“报销”和“结账”中,选取了“发票”和“报销”这两个聚类因子,然后选择聚类程度为高。由于“发票”和“报销”的词义相差太大无法进行同义聚合,则会同时将“发票”和“报销”这两个聚类因子同时保留下来,并创建分别以这两个聚类因子命名的文件夹。
1033、根据聚类因子对邮件进行分类,并将邮件对应存入文件夹中。
根据用户的最终选择,创建了对应的文件夹后,由于聚类因子是通过各个邮件总结提取到的,因此将各个聚类因子关联的邮件对应移动到相应的文件夹中即可,这样用户就通过简单的操作完成了邮件的自动分类。
下面将结合具体的使用场景来详细阐述本发明实施例所述的邮件分类方法:
场景一:在首次使用时,财务部门的用户A收到1200封邮件,此时会收到邮件服务器发送的邮件分类请求“您的邮件数量较多,建议启用邮件自动分类器进行分类”,用户A点击下方的“是”按钮后,则收到与用户对应的六个聚类因子,即“发票”、“报销”、“结账”、“采购”、“申请”和“周报”。用户根据个人习惯,从中选择了“发票”、“报销”和“周报”,若用户选择聚类程度为低,则邮件服务器会相应创建名称为“发票”、“报销”、“周报”这三个文件夹;若用户选择聚类程度为高,则邮件服务器只会创建“财务”和“周报”两个文件夹。最后,将邮件分类移动到相应的文件夹中。
场景二:在首次使用时,销售部门的用户B收到1700封邮件,此时会收到邮件服务器发送的邮件分类请求“您的邮件数量较多,建议启用邮件自动分类器进行分类”,用户B点击下方的“忽略”按钮后,邮件分类过程暂停。当累积收到2000封邮件时,此时会收到邮件服务器第二次发送的邮件分类请求“您的邮件数量较多,建议启用邮件自动分类器进行分类”,用户B点击下方的“是”按钮后,则收到与用户对应的五个聚类因子,即“发票”、“报销”、“报价”、“外勤”和“周报”。用户根据个人习惯,从中选择了“发票”、“外勤”和“周报”。由于这三个聚类因子之间的词义相差太大,无法进行同义聚合,则不论用户B选择的聚类程度为高、中、低中的哪一个,邮件服务器都会创建“发票”、“外勤”和“周报”三个文件夹。最后,将邮件分类移动到相应的文件夹中。
综上,本发明实施例提供的一种邮件分类方法,通过分析学习用户个人的邮件内容,来确定与用户的工作职责、邮件关键信息相对应的聚类因子,在用户邮箱接收的邮件数达到某个数量级时,则自动根据聚类因子创建对应的文件夹并将邮件按规则移动到各个文件夹中。整个过程不需要用户手动提取关键字并设置分类条件,向用户做出初步的规则推荐后,用户再按照个人习惯进行简单操作就会自动创建文件夹并按规则移动邮件进行分类,操作简单方便,分类准确,可以极大地提高工作效率,有效地满足用户对邮件的分类需求,以及避免错过重要邮件。
参照图2所示,本发明实施例公开了一种邮件分类方法,该方法主要包括:
201、获取用户的邮件服务器中存储的邮件;
202、判断用户是否需要进行邮件分类;
203、若是,则获取用户对各邮件的关注级别;否则,执行步骤209;
204、获取用户的用户关键词;
205、根据各邮件的关注级别和用户关键词,确定与用户对应的聚类因子;
206、从聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
207、根据聚类因子和聚类程度,创建以聚类因子命名的文件夹;
208、根据聚类因子对邮件进行分类,并将邮件对应存入文件夹中;
209、分类过程结束。
上述实施例中各步骤的具体实施过程,可参照前述实施例中对各方法步骤的说明,在此不再赘述。
综上,本发明实施例提供的一种邮件分类方法,通过分析学习用户个人的邮件内容,来确定与用户的工作职责、邮件关键信息相对应的聚类因子,在用户邮箱接收的邮件数达到某个数量级时,则自动根据聚类因子创建对应的文件夹并将邮件按规则移动到各个文件夹中。整个过程不需要用户手动提取关键字并设置分类条件,向用户做出初步的规则推荐后,用户再按照个人习惯进行简单操作就会自动创建文件夹并按规则移动邮件进行分类,操作简单方便,分类准确,可以极大地提高工作效率,有效地满足用户对邮件的分类需求,以及避免错过重要邮件。
需要说明的是,对于上述方法的实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明所必须的。
参照图3所示,基于同一发明构思,本发明实施例提供一种邮件分类装置,该装置主要包括:
邮件获取单元301,用于获取用户的邮件服务器中存储的邮件;
因子确定单元302,用于根据邮件,确定与用户对应的聚类因子;
邮件分类单元303,用于根据聚类因子对邮件进行分类,并将邮件对应存入分别以聚类因子命名的文件夹中。
优选地,所述因子确定单元302具体用于:
获取用户对各邮件的关注级别;
获取用户的用户关键词;
根据各邮件的关注级别和用户关键词,确定与用户对应的聚类因子。
优选地,所述因子确定单元302还用于:
通过邮件评分项对邮件进行评分,获取各邮件的评分值,邮件评分项至少包括邮件点击数、邮件回复数、邮件读取状态、收件人邮箱地址和抄送人邮箱地址;
根据各邮件的评分值,确定各邮件的关注度;
根据各邮件的关注度,确定各邮件的关注级别。
优选地,所述因子确定单元302还用于:
获取用户所在部门在规则数据库中的常用关键词;
获取邮件中的邮件关键词;
根据常用关键词和邮件关键词,确定用户的用户关键词。
优选地,所述邮件获取单元301还用于:
判断用户是否需要进行邮件分类;
若是,则继续执行根据所述邮件,确定与用户对应的聚类因子的步骤。
优选地,所述邮件获取单元301还用于:
对邮件的数量进行统计,获取邮件的邮件数量;
判断邮件数量是否大于预设阈值;
若是,则向用户发送邮件分类请求;
若用户通过邮件分类请求,则确定用户需要进行邮件分类。
优选地,所述邮件获取单元301还用于:
若用户未通过邮件分类请求,则在邮件数量大于预设阈值的N倍时,继续执行向用户发送邮件分类请求的步骤。
优选地,所述邮件分类单元303具体用于:
从聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
根据聚类因子和聚类程度,创建以聚类因子命名的文件夹;
根据聚类因子对邮件进行分类,并将邮件对应存入文件夹中。
综上,本发明实施例提供的一种邮件分类装置,通过分析学习用户个人的邮件内容,来确定与用户的工作职责、邮件关键信息相对应的聚类因子,在用户邮箱接收的邮件数达到某个数量级时,则自动根据聚类因子创建对应的文件夹并将邮件按规则移动到各个文件夹中。整个过程不需要用户手动提取关键字并设置分类条件,向用户做出初步的规则推荐后,用户再按照个人习惯进行简单操作就会自动创建文件夹并按规则移动邮件进行分类,操作简单方便,分类准确,可以极大地提高工作效率,有效地满足用户对邮件的分类需求,以及避免错过重要邮件。
需要说明的是,本发明实施例提供的邮件分类装置与前述实施例所述的邮件分类方法属于相同的技术构思,其具体实施过程可参照前述实施例中对方法步骤的说明,在此不再赘述。
应当理解,以上一种邮件分类装置包括的单元仅为根据该装置实现的功能进行的逻辑划分,实际应用中,可以进行上述单元的叠加或拆分。并且该实施例提供的一种邮件分类装置所实现的功能与上述实施例提供的一种邮件分类方法一一对应,对于该系统所实现的更为详细的处理流程,在上述方法实施例一中已做详细描述,此处不再详细描述。
参照图4所示,基于同一发明构思,本发明实施例提供一种电子设备,该电子设备主要包括:
处理器41;
用于存储处理器41可执行指令的存储器42;
其中,所述处理器41被配置为:获取用户的邮件服务器中存储的邮件;根据邮件,确定与用户对应的聚类因子;根据聚类因子对邮件进行分类,并将邮件对应存入分别以聚类因子命名的文件夹中。
优选地,所述处理器41还被配置为执行上述方法实施例中任一项所述的邮件分类方法。
图4为本发明实施例提供的用户终端的结构示意图,如图4所示,该用户终端包括处理器41、存储器42和收发器43;其中,处理器41、存储器42和收发器43通过总线44相互连接。
存储器42用于存储程序;具体地,程序可以包括程序代码,程序代码包括计算机操作指令。存储器42可以包括易失性存储器(volatile memory),例如随机存取存储器(random-access memory,简称RAM);存储器也可以包括非易失性存储器(non-volatilememory),例如快闪存储器(flash memory),硬盘(hard disk drive,简称HDD)或固态硬盘(solid-state drive,简称SSD);存储器42还可以包括上述种类的存储器的组合。
存储器42存储了如下的元素,可执行模块或者数据结构,或者它们的子集,或者它们的扩展集:
操作指令:包括各种操作指令,用于实现各种操作。
操作系统:包括各种系统程序,用于实现各种基础业务以及处理基于硬件的任务。
总线64可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
处理器41可以是中央处理器(central processing unit,简称CPU),网络处理器(network processor,简称NP)或者CPU和NP的组合。还可以是硬件芯片。上述硬件芯片可以是专用集成电路(application-specific integrated circuit,简称ASIC),可编程逻辑器件(programmable logic device,简称PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,简称CPLD),现场可编程逻辑门阵列(fieldprogrammable gate array,简称FPGA),通用阵列逻辑(generic array logic,简称GAL)或其任意组合。
所述处理器41,用于执行所述存储器42中的所述计算机程序,以实现上述邮件分类方法的步骤。
在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (9)

1.一种邮件分类方法,其特征在于,包括:
获取用户的邮件服务器中存储的邮件;
根据所述邮件,确定与所述用户对应的聚类因子;所述聚类因子是根据各所述邮件的关注级别和用户关键词确定的,所述用户关键词是根据用户所在部门在规则数据库中的常用和用户邮件中的邮件关键词确定的;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中;
所述根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中包括:
从所述聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入所述文件夹中;
所述根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹,包括:
获取用户所选择的聚类因子和聚类程度;
确定各个所述聚类因子之间的词义相近程度;
当所述词义相近程度为高且所述聚类程度为高时,对所述聚类因子进行同义聚类,并创建以所述同义聚类的结果作为聚类因子命名的文件夹;
当所述词义相近程度为低且所述聚类程度为高时,则对所述聚类因子不进行同义聚类,并创建以所述聚类因子命名的文件夹。
2.根据权利要求1所述的方法,其特征在于,所述根据所述邮件,确定与所述用户对应的至少一个聚类因子包括:
获取所述用户对各所述邮件的关注级别;
获取所述用户的用户关键词;
根据各所述邮件的关注级别和所述用户关键词,确定与所述用户对应的聚类因子。
3.根据权利要求2所述的方法,其特征在于,所述获取所述用户对各所述邮件的关注级别包括:
通过邮件评分项对所述邮件进行评分,获取各所述邮件的评分值,所述邮件评分项至少包括邮件点击数、邮件回复数、邮件读取状态、收件人邮箱地址和抄送人邮箱地址;
根据各所述邮件的评分值,确定各所述邮件的关注度;
根据各所述邮件的关注度,确定各所述邮件的关注级别。
4.根据权利要求2所述的方法,其特征在于,所述获取所述用户的用户关键词包括:
获取所述用户所在部门在规则数据库中的常用关键词;
获取所述邮件中的邮件关键词;
根据所述常用关键词和所述邮件关键词,确定所述用户的用户关键词。
5.根据权利要求1~4中任一项所述的方法,其特征在于,所述获取用户的邮件服务器中存储的邮件之后,还包括:
判断所述用户是否需要进行邮件分类;
若是,则继续执行根据所述邮件,确定与所述用户对应的聚类因子的步骤。
6.根据权利要求5所述的方法,其特征在于,所述判断所述用户是否需要进行邮件分类包括:
对所述邮件的数量进行统计,获取所述邮件的邮件数量;
判断所述邮件数量是否大于等于预设阈值;
若是,则向所述用户发送邮件分类请求;
若所述用户通过所述邮件分类请求,则确定所述用户需要进行邮件分类。
7.根据权利要求6所述的方法,其特征在于,所述向所述用户发送邮件分类请求之后,还包括:
若所述用户未通过所述邮件分类请求,则在所述邮件数量大于等于所述预设阈值的N倍时,继续执行所述向所述用户发送邮件分类请求的步骤。
8.一种邮件分类装置,其特征在于,包括:
邮件获取单元,用于获取用户的邮件服务器中存储的邮件;
因子确定单元,用于根据所述邮件,确定与所述用户对应的聚类因子;
邮件分类单元,用于根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中;
所述邮件分类单元进一步用于:
从所述聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入所述文件夹中;
所述根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹,包括:
获取用户所选择的聚类因子和聚类程度;
确定各个所述聚类因子之间的词义相近程度;
当所述词义相近程度为高且所述聚类程度为高时,对所述聚类因子进行同义聚类,并创建以所述同义聚类的结果作为聚类因子命名的文件夹;
当所述词义相近程度为低且所述聚类程度为高时,则对所述聚类因子不进行同义聚类,并创建以所述聚类因子命名的文件夹。
9.一种电子设备,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:获取用户的邮件服务器中存储的邮件;根据所述邮件,确定与所述用户对应的聚类因子;根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中;
所述根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入分别以所述聚类因子命名的文件夹中包括:
从所述聚类因子中选取作为邮件类别的聚类因子,并选取聚类程度;
根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹;
根据所述聚类因子对所述邮件进行分类,并将所述邮件对应存入所述文件夹中;
所述根据所述聚类因子和所述聚类程度,创建以所述聚类因子命名的文件夹,包括:
获取用户所选择的聚类因子和聚类程度;
确定各个所述聚类因子之间的词义相近程度;
当所述词义相近程度为高且所述聚类程度为高时,对所述聚类因子进行同义聚类,并创建以所述同义聚类的结果作为聚类因子命名的文件夹;
当所述词义相近程度为低且所述聚类程度为高时,则对所述聚类因子不进行同义聚类,并创建以所述聚类因子命名的文件夹。
CN201911426153.1A 2019-12-31 2019-12-31 一种邮件分类方法、装置及电子设备 Active CN111222851B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911426153.1A CN111222851B (zh) 2019-12-31 2019-12-31 一种邮件分类方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911426153.1A CN111222851B (zh) 2019-12-31 2019-12-31 一种邮件分类方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111222851A CN111222851A (zh) 2020-06-02
CN111222851B true CN111222851B (zh) 2024-02-06

Family

ID=70808257

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911426153.1A Active CN111222851B (zh) 2019-12-31 2019-12-31 一种邮件分类方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111222851B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113256254A (zh) * 2021-05-26 2021-08-13 青岛海信移动通信技术股份有限公司 邮件分类方法及邮件分类设备
CN114971571A (zh) * 2021-07-20 2022-08-30 支付宝(杭州)信息技术有限公司 基于邮箱的票据处理方法及装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473218A (zh) * 2013-09-04 2013-12-25 盈世信息科技(北京)有限公司 一种电子邮件分类方法及其装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IN2014MU00919A (zh) * 2014-03-20 2015-09-25 Tata Consultancy Services Ltd

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103473218A (zh) * 2013-09-04 2013-12-25 盈世信息科技(北京)有限公司 一种电子邮件分类方法及其装置

Also Published As

Publication number Publication date
CN111222851A (zh) 2020-06-02

Similar Documents

Publication Publication Date Title
US10657158B2 (en) Template-based structured document classification and extraction
CN112511410B (zh) 用于确定回复内容的方法、系统和介质
Dredze et al. Automatically classifying emails into activities
JP5759228B2 (ja) 拡張されたエンティティ抽出を基礎とするメッセージ及び会話間の意味的類似性の計算方法
US8176004B2 (en) Systems and methods for intelligent paperless document management
US7698335B1 (en) Cluster organization of electronically-stored items
CN107657029B (zh) 被遗忘的附件的检测方法及装置
Neustaedter et al. The Social Network and Relationship Finder: Social Sorting for Email Triage.
US20160337401A1 (en) Identifying phishing communications using templates
US11010547B2 (en) Generating and applying outgoing communication templates
US20150295876A1 (en) Message Scanning System and Method
CN111222851B (zh) 一种邮件分类方法、装置及电子设备
KR20150142070A (ko) 문서 분류 시스템, 문서 분류 방법 및 문서 분류 프로그램
US10002187B2 (en) Method and system for performing topic creation for social data
WO2015032124A1 (zh) 一种电子邮件分类方法及其装置
US9996529B2 (en) Method and system for generating dynamic themes for social data
EP2227750A1 (en) Systems and methods for intelligent paperless document management
WO2014178859A1 (en) Content classification
Carmona-Cejudo et al. Using gnusmail to compare data stream mining methods for on-line email classification
Grant et al. Topic modelling on archive documents from the 1970s: global policies on refugees
US20220138259A1 (en) Automated document intake system
US20200320455A1 (en) Queue management with dynamic prioritization
US20240169157A1 (en) Data association method and apparatus, computer device and storage medium
Derrig et al. Effective Document Review Techniques in Eclipse and Relativity
JP7391345B2 (ja) 情報提供装置、システム及びプログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant