CN111917632B - 解析邮件的方法、装置、非易失性存储介质及电子装置 - Google Patents

解析邮件的方法、装置、非易失性存储介质及电子装置 Download PDF

Info

Publication number
CN111917632B
CN111917632B CN202010763511.4A CN202010763511A CN111917632B CN 111917632 B CN111917632 B CN 111917632B CN 202010763511 A CN202010763511 A CN 202010763511A CN 111917632 B CN111917632 B CN 111917632B
Authority
CN
China
Prior art keywords
mail
meeting
conference
tags
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010763511.4A
Other languages
English (en)
Other versions
CN111917632A (zh
Inventor
罗志成
喻波
王志海
韩振国
安鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Wondersoft Technology Co Ltd
Original Assignee
Beijing Wondersoft Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Wondersoft Technology Co Ltd filed Critical Beijing Wondersoft Technology Co Ltd
Priority to CN202010763511.4A priority Critical patent/CN111917632B/zh
Publication of CN111917632A publication Critical patent/CN111917632A/zh
Application granted granted Critical
Publication of CN111917632B publication Critical patent/CN111917632B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/42Mailbox-related aspects, e.g. synchronisation of mailboxes

Abstract

本申请公开了一种解析邮件的方法、装置、非易失性存储介质及电子装置。该方法包括:获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;如果识别到会议标签,则获取邮件中的会议信息。通过本申请,解决了相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题。

Description

解析邮件的方法、装置、非易失性存储介质及电子装置
技术领域
本申请涉及电子邮件分析技术领域,具体而言,涉及一种解析邮件的方法、装置、非易失性存储介质及电子装置。
背景技术
在项目开发中,经常需要对邮件内容进行解析操作。相关技术中针对EML格式邮件文件解析的工具很多,但主要是针对普通邮件进行解析。
由于工作的需要,用户会经常发送会议邮件用于邀请特定单位或人士参加会议,会议邀请邮件是一种具有礼仪和告知双重作用的邮件,相关技术中针对会议邀请邮件进行解析的工具则极少。
会议邀请邮件与普通电子邮件在结构与内容上有很多相同之处,但是它们之间亦存在明显的差异,相比普通电子邮件会议邀请邮件则具有特定的结构展示会议信息,例如会议内容、会议开始时间、会议结束时间、会议地址等信息。当前市面上能能够解析邮件内容的工具大部分均为开源软件工作,如:apache tika、javamail、ExchangeService等,只能针对邮件基础内容进行解析而无法解析邮件内容部中包含的会议信息,极少的工具能够实现会议内容的解析,但是无法适配多种邮件客户端发送的会议邮件,即:只能针对特定邮件客户端发送的会议邮件进行解析。
针对相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题,目前尚未提出有效的解决方案。
发明内容
本申请提供一种解析邮件的方法、装置、非易失性存储介质及电子装置,以解决相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题。
根据本申请的一个方面,提供了一种解析邮件的方法。该方法包括:获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;如果识别到会议标签,则获取邮件中的会议信息。
可选地,对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别,包括:扫描邮件的源文件的每一行,识别出源文件中包含的会议标签,其中,会议标签包括如下至少之一:会议邀请邮件标签、会议主题标签、会议地址标签、会议开始时间标签、会议结束时间标签、会议内容标签和参会人员标签。
可选地,如果识别到会议标签,则获取邮件中的会议信息,包括:在识别到多个会议标签的情况下,解析得到每个会议标签的会议属性以及属性值。
可选地,在得到每个会议标签的会议属性以及属性值之后,该装置还包括:将每个会议标签的会议属性以及属性值存入目标列表中。
可选地,目标列表为预先构建的结构列表,其中,目标列表的KEY值为会议属性,VALUE值为会议属性值。
可选地,在获取邮件中的会议信息之前或之后,该装置还包括:解析邮件,识别出邮件中的邮件基础信息和会议附件,其中,邮件基础信息包括如下至少之一:邮件主题、邮件正文、发件人邮箱、收件人邮箱、抄送邮箱、邮件发送时间和接收时间,会议附件包括如下至少之一:文档、压缩文件和图片;其中,会议附件的解析结果以文本格式输出。
可选地,在识别出邮件中的邮件基础信息和会议附件之后,该装置还包括:将会议信息、邮件基础信息和会议附件合并为统一格式的文件进行输出。
根据本申请的另一方面,提供了一种解析邮件的装置。该装置包括:第一获取单元,用于获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;扫描单元,用于对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;第二获取单元,用于如果识别到会议标签,则获取邮件中的会议信息。
根据本发明实施例的另一方面,还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种解析邮件的方法。
根据本发明实施例的另一方面,还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种解析邮件的方法。
通过本申请,采用以下步骤:获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;如果识别到会议标签,则获取邮件中的会议信息,解决了相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题。通过识别会议标签的方式获取会议信息,进而达到了提高邮件中的会议信息解析准确度的效果。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的解析邮件的方法的流程图;
图2是根据本申请实施例提供的解析邮件的方法中目标列表的示意图;
图3是根据本申请实施例提供的解析邮件的系统的示意图;以及
图4是根据本申请实施例提供的解析邮件的装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
为了便于描述,以下对本申请实施例涉及的部分名词或术语进行说明:
电子邮件:电子邮件是—种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。电子邮件可以是文字、图像、声音等多种形式。通过网络的电子邮件系统,用户可以以低廉的价格、快速的传输方式,与世界上任何一个角落的网络用户联系。同时,用户可以得到大量免费的新闻、专题邮件,并轻松实现轻松的信息搜索。电子邮件的存在极大地方便了人与人之间的沟通与交流,促进了社会的发展。
邮件服务器:邮件服务器是一种用来负责电子邮件收发管理的设备。邮件服务器比网络上的免费邮箱更安全和高效,因此一直是企业公司的必备设备。
会议邀请邮件:会议邀请以电子邮件的形式发送专门用于邀请特定单位或人士参加会议,具有礼仪和告知双重作用的会议文书。会议邀请函的基本内容与会议通知一致,包括会议的背景、目的和名称;主办单位和组织机构;会议内容和形式;参加对象;会议的时间和地点、联络方式以及其他需要说明的事项。
EML文件:EML格式是微软公司在Outlook中所使用的一种遵循RFC822及其后续扩展的文件格式,并成为各类电子邮件软件的通用格式,EML文件即为EML格式化的文件。
根据本申请的实施例,提供了一种解析邮件的方法。
图1是根据本申请实施例的解析邮件的方法的流程图。如图1所示,该方法包括以下步骤:
步骤S101,获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式。
具体地,待解析的邮件可以为会议邀请邮件,也即,以电子邮件的形式发送专门用于邀请特定单位或人士参加会议,具有礼仪和告知双重作用的邮件。
步骤S102,对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别。
需要说明的是,邮件的源文件可以为EML格式的文件,在待解析的邮件为会议邀请邮件的情况下,邮件的源文件中包含多个会议标签,如会议地点标签、会议主题标签、会议开始时间标签、会议结束时间标签、会议描述标签、会议邀请人信息标签等。
具体地,扫描邮件的源文件并识别是否包含上述会议标签,若包含上述会议标签,说明待解析的邮件为会议邀请邮件。
步骤S103,如果识别到会议标签,则获取邮件中的会议信息。
具体地,如果识别到会议标签,则解析和提取会议相关信息,如:会议地点、会议主题、会议开始时间、会议结束时间、会议描述、会议邀请人等信息。
在待解析的邮件为会议邀请邮件的情况下,可选地,在本申请实施例提供的解析邮件的方法中,对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别,包括:扫描邮件的源文件的每一行,识别出源文件中包含的会议标签,其中,会议标签包括如下至少之一:会议邀请邮件标签、会议主题标签、会议地址标签、会议开始时间标签、会议结束时间标签、会议内容标签和参会人员标签。
具体地,可以通过读指针逐行扫描会议邮件源文件(EML格式)内容,同时对每一行内容进行标签识别,判断是否包含标签,在包含的情况下,判断是否为会议标签,具体地,会议标签包括但不限于以下标签:会议邀请邮件标签、会议主题标签、会议地址标签、会议开始时间标签、会议结束时间标签、会议内容标签和参会人员标签。
可选地,在本申请实施例提供的解析邮件的方法中,如果识别到会议标签,则获取邮件中的会议信息,包括:在识别到多个会议标签的情况下,解析得到每个会议标签的会议属性以及属性值。
具体地,每读取一行邮件源文件的内容,不仅会进行标签识别,在识别到会议标签后,还会进行会议标签的会议属性以及属性值的解析。
需要说明的是,当对邮件源文件的内容进行标签识别时,可以参考表1列举的标签进行对比识别。
表1
Figure BDA0002613736090000051
需要说明的是,表中的“BEGIN:VCALENDAR”标签、“BEGIN:VEVENT”标签、“END:VEVENT”标签、“END:VCALENDAR”标签均为会议邀请邮件标签,“SUMMARY”标签为会议主题标签、“LOCATION”标签为会议地址标签、“CREATED”标签为会议开始时间标签、“DTSTAMP”标签为会议开始结束标签、“DESCRIPTION”标签为会议描述标签、“ATTENDEE”标签为会议邀请人标签、“Content-Transfer-Encoding”标签为邮件编码标签。
具体地,如果“BEGIN:VCALENDAR”标签、“BEGIN:VEVENT”标签、“END:VEVENT”标签、“END:VCALENDAR”标签共四个标签全部被记录,则说明此封邮件一定是会议邀请邮件,而不是普通的邮件。因而,只需进行一次扫描读取便可以获取判断邮件是否为“会议邀请邮件”。
在会议标签的会议属性以及属性值后,对会议属性以及属性值进行存储,可选地,在本申请实施例提供的解析邮件的方法中,在得到每个会议标签的会议属性以及属性值之后,该装置还包括:将每个会议标签的会议属性以及属性值存入目标列表中。
可选地,在本申请实施例提供的解析邮件的方法中,目标列表为预先构建的结构列表,其中,目标列表的KEY值为会议属性,VALUE值为会议属性值。
具体地,在开始解析邮件会议属性之前会创建一块哈希表结构的内存缓存单元,也即,目标列表,如图2所示,其中哈希表的KEY值为会议属性,VALUE值为会议属性值。
例如,邮件源文件的行内容包含“SUMMARY:”标签时,程序通过标签对比发现本行内容包含会议主题信息,通过解析“SUMMARY:”标签的属性值获取会议主题,并将主题信息写入哈希表的KEY=SUMMARY的VALUE对应的列表中。
再例如:邮件源文件的行内容包含“Content-Transfer-Encoding”标签时,就可以解析标签对应的属性值从而获取当前邮件的编码,将编码信息写入哈希表的KEY=ENCODING的VALUE对应的列表中。
同样的,邮件中包含的其他会议标签的会议属性的解析与上述类型同理。
会议邀请邮件中除了会议信息,还包括邮件基础信息以及附件信息,可选地,在本申请实施例提供的解析邮件的方法中,在获取邮件中的会议信息之前或之后,该装置还包括:解析邮件,识别出邮件中的邮件基础信息和会议附件,其中,邮件基础信息包括如下至少之一:邮件主题、邮件正文、发件人邮箱、收件人邮箱、抄送邮箱、邮件发送时间和接收时间,会议附件包括如下至少之一:文档、压缩文件和图片;其中,会议附件的解析结果以文本格式输出。
具体地的,可以采用javaMail组件构建的基础信息解析模块对邮件基础信息进行解析,解析后的内容可以包括:邮件主题、邮件正文、发送者邮箱、接受者邮箱、抄送者邮箱、邮件发送时间。
具体地的,可以采用Tika组件构建的附件解析模块对附件解析进行解析,被解析的附件可以是办公文档、压缩文件、图片文件,附件所包含内容将全部被解析并以文本格式输出。
为了便于用户查看,可选地,在本申请实施例提供的解析邮件的方法中,在识别出邮件中的邮件基础信息和会议附件之后,该装置还包括:将会议信息、邮件基础信息和会议附件合并为统一格式的文件进行输出。
具体地,将提取得到的邮件基础信息、会议信息、会议附件信息采用统一格式合并到统一的文件中,查看该文件可以获知会议邮件的所有解析提取的数据。
本申请实施例提供的解析邮件的方法,通过获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;如果识别到会议标签,则获取邮件中的会议信息,解决了相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题。通过识别会议标签的方式获取会议信息,进而达到了提高邮件中的会议信息解析准确度的效果。
本申请还可以提供一种解析邮件的系统,用于实现上述解析邮件的方法,如图3所示,为根据本申请实施例的解析邮件的系统的示意图。
该系统包含邮件发送服务器、会议邮件解析模块以及邮件接收服务器,其中,会议邮件解析模块由数据防泄漏系统进行数据保护,具体的,数据防泄漏系统可以为NDLP数据防泄漏系统。
本申请实施例的解析邮件的系统可以针对各类邮件发送客户端生成的“会议邀请邮件”进行快速准确的解析,解决了现有开源软件无法解析“会议邀请邮件”中会议相关属性的问题,邮件内容解析准确而全面,同时具有较强的兼容性,能够解析多种邮件发送客户端生成的“会议邀请邮件”,具有较高的解析效率。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例还提供了一种解析邮件的装置,需要说明的是,本申请实施例的解析邮件的装置可以用于执行本申请实施例所提供的用于解析邮件的方法。以下对本申请实施例提供的解析邮件的装置进行介绍。
图4是根据本申请实施例的解析邮件的装置的示意图。如图4所示,该装置包括:第一获取单元10、扫描单元20和第二获取单元30。
具体地,第一获取单元10,用于获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式。
扫描单元20,用于对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别。
第二获取单元30,用于如果识别到会议标签,则获取邮件中的会议信息。
本申请实施例提供的解析邮件的装置,通过第一获取单元10获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;扫描单元20对邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;第二获取单元30如果识别到会议标签,则获取邮件中的会议信息,解决了相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题,通过识别会议标签的方式获取会议信息,进而达到了提高邮件中的会议信息解析准确度的效果。
可选地,在本申请实施例提供的解析邮件的装置中,扫描单元20包括:扫描模块,用于扫描邮件的源文件的每一行,识别出源文件中包含的会议标签,其中,会议标签包括如下至少之一:会议邀请邮件标签、会议主题标签、会议地址标签、会议开始时间标签、会议结束时间标签、会议内容标签和参会人员标签。
可选地,在本申请实施例提供的解析邮件的装置中,第二获取单元30包括:解析模块,用于在识别到多个会议标签的情况下,解析得到每个会议标签的会议属性以及属性值。
可选地,在本申请实施例提供的解析邮件的装置中,该装置还包括:存储单元,用于在得到每个会议标签的会议属性以及属性值之后,将每个会议标签的会议属性以及属性值存入目标列表中。
可选地,在本申请实施例提供的解析邮件的装置中,目标列表为预先构建的结构列表,其中,目标列表的KEY值为会议属性,VALUE值为会议属性值。
可选地,在本申请实施例提供的解析邮件的装置中,该装置还包括:解析单元,用于在获取邮件中的会议信息之前或之后,解析邮件,识别出邮件中的邮件基础信息和会议附件,其中,邮件基础信息包括如下至少之一:邮件主题、邮件正文、发件人邮箱、收件人邮箱、抄送邮箱、邮件发送时间和接收时间,会议附件包括如下至少之一:文档、压缩文件和图片;其中,会议附件的解析结果以文本格式输出。
可选地,在本申请实施例提供的解析邮件的装置中,该装置还包括:合并单元,用于在识别出邮件中的邮件基础信息和会议附件之后,将会议信息、邮件基础信息和会议附件合并为统一格式的文件进行输出。
所述解析邮件的装置包括处理器和存储器,上述第一获取单元10、扫描单元20和第二获取单元30等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决相关技术中采用邮件解析工具来解析邮件内容,当邮件内容中包含了会议信息时,难以准确解析的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本申请实施例还提供了一种非易失性存储介质,非易失性存储介质包括存储的程序,其中,程序运行时控制非易失性存储介质所在的设备执行一种解析邮件的方法。
本申请实施例还提供了一种电子装置,包含处理器和存储器;存储器中存储有计算机可读指令,处理器用于运行计算机可读指令,其中,计算机可读指令运行时执行一种解析邮件的方法。本文中的电子装置可以是服务器、PC、PAD、手机等。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种解析邮件的方法,其特征在于,包括:
获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;
对所述邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;
如果识别到至少以下之一会议标签,确定所述邮件为会议邮件,则获取所述邮件中的会议信息:BEGIN:VCALENDAR、END:VCALENDAR、BEGIN:VEVENT、END:VEVENT;
其中,获取所述邮件中的会议信息包括:在识别到多个所述会议标签的情况下,解析得到每个所述会议标签的会议属性以及属性值;
在得到每个所述会议标签的会议属性以及属性值之后,所述方法还包括:将每个所述会议标签的会议属性以及属性值存入目标列表中,其中,所述目标列表为哈希表,所述目标列表的KEY值为会议属性,VALUE值为会议属性值。
2.根据权利要求1所述的方法,其特征在于,对所述邮件的源文件进行扫描,并基于扫描结果进行会议标签识别,包括:
扫描所述邮件的源文件的每一行,识别出所述源文件中包含的会议标签,其中,所述会议标签包括如下至少之一:会议邀请邮件标签、会议主题标签、会议地址标签、会议开始时间标签、会议结束时间标签、会议内容标签和参会人员标签。
3.根据权利要求1至2中任意一项所述的方法,其特征在于,在获取所述邮件中的会议信息之前或之后,所述方法还包括:
解析所述邮件,识别出所述邮件中的邮件基础信息和会议附件,其中,所述邮件基础信息包括如下至少之一:邮件主题、邮件正文、发件人邮箱、收件人邮箱、抄送邮箱、邮件发送时间和接收时间,所述会议附件包括如下至少之一:文档、压缩文件和图片;
其中,所述会议附件的解析结果以文本格式输出。
4.根据权利要求3所述的方法,其特征在于,在识别出所述邮件中的邮件基础信息和会议附件之后,所述方法还包括:将所述会议信息、所述邮件基础信息和所述会议附件合并为统一格式的文件进行输出。
5.一种解析邮件的装置,其特征在于,包括:
第一获取单元,用于获取待解析的邮件,其中,不同的邮件服务器生成不同的邮件格式;
扫描单元,用于对所述邮件的源文件进行扫描,并基于扫描结果进行会议标签识别;
第二获取单元,用于如果识别到至少以下之一会议标签,确定所述邮件为会议邮件,则获取所述邮件中的会议信息:BEGIN:VCALENDAR、END:VCALENDAR、BEGIN:VEVENT、END:VEVENT;
其中,所述第二获取单元包括:解析模块,用于在识别到多个所述会议标签的情况下,解析得到每个所述会议标签的会议属性以及属性值;
存储单元,用于将每个所述会议标签的会议属性以及属性值存入目标列表中,其中,所述目标列表为哈希表,所述目标列表的KEY值为会议属性,VALUE值为会议属性值。
6.一种非易失性存储介质,其特征在于,所非易失性存储介质包括存储的程序,其中,所述程序运行时控制所述非易失性存储介质所在的设备执行权利要求1至4中任意一项所述的解析邮件的方法。
7.一种电子装置,其特征在于,包含处理器和存储器,所述存储器中存储有计算机可读指令,所述处理器用于运行所述计算机可读指令,其中,所述计算机可读指令运行时执行权利要求1至4中任意一项所述的解析邮件的方法。
CN202010763511.4A 2020-07-31 2020-07-31 解析邮件的方法、装置、非易失性存储介质及电子装置 Active CN111917632B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010763511.4A CN111917632B (zh) 2020-07-31 2020-07-31 解析邮件的方法、装置、非易失性存储介质及电子装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010763511.4A CN111917632B (zh) 2020-07-31 2020-07-31 解析邮件的方法、装置、非易失性存储介质及电子装置

Publications (2)

Publication Number Publication Date
CN111917632A CN111917632A (zh) 2020-11-10
CN111917632B true CN111917632B (zh) 2022-09-16

Family

ID=73287548

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010763511.4A Active CN111917632B (zh) 2020-07-31 2020-07-31 解析邮件的方法、装置、非易失性存储介质及电子装置

Country Status (1)

Country Link
CN (1) CN111917632B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112612619B (zh) * 2020-11-19 2023-10-20 北京明朝万达科技股份有限公司 一种大附件邮件的多线程并发处理方法及装置
CN113193972A (zh) * 2021-04-23 2021-07-30 上海明略人工智能(集团)有限公司 用于创建会议邀请信息的方法、装置、电子设备和可读存储介质
CN116308237B (zh) * 2023-05-25 2023-08-25 湖南九立供应链有限公司 一种erp邮件处理方法及其相关设备
CN117010323A (zh) * 2023-08-17 2023-11-07 上海倍通医药科技咨询有限公司 一种用于电子邮件中的文件的数据格式化方法及系统

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6857008B1 (en) * 2000-04-19 2005-02-15 Cisco Technology, Inc. Arrangement for accessing an IP-based messaging server by telephone for management of stored messages
CA2424399A1 (en) * 2002-04-04 2003-10-04 Build-A-Bear Workshop, Inc. Electronic meeting management system and an associated method of scheduling meetings
CN101340394A (zh) * 2008-08-21 2009-01-07 北京立通无限科技有限公司 会议邮件传输的方法及设备
CN103442084B (zh) * 2013-09-10 2017-02-22 杭州万格网络科技有限公司 交换数据、获取与感知服务的数据箱系统及其使用方法
CN108335079B (zh) * 2018-01-11 2021-01-08 广州视源电子科技股份有限公司 会议预约系统、会议预约消息处理方法、系统和存储介质
CN108768835B (zh) * 2018-05-30 2022-03-18 彩讯科技股份有限公司 一种邮件解析方法、装置、服务器和存储介质
CN109151078B (zh) * 2018-10-31 2022-02-22 厦门市美亚柏科信息股份有限公司 一种分布式智能邮件分析过滤方法、系统及存储介质
CN111010336A (zh) * 2019-12-18 2020-04-14 写逸网络科技(上海)有限公司 一种海量邮件解析方法及装置

Also Published As

Publication number Publication date
CN111917632A (zh) 2020-11-10

Similar Documents

Publication Publication Date Title
CN111917632B (zh) 解析邮件的方法、装置、非易失性存储介质及电子装置
US10650348B2 (en) Rapid access to data oriented workflows
TWI747911B (zh) 二維碼資訊查詢方法、伺服器、客戶端及系統
US9521104B2 (en) Outgoing communications inventory
US8935339B2 (en) News feed techniques
US9396460B2 (en) Facilitating a sender of email communications to specify policies with which the email communication are to be managed as a record
CN108920675B (zh) 一种信息处理的方法、装置、计算机存储介质及终端
CN104508689B (zh) 一种二维码处理方法和终端
US8321517B2 (en) Method and system for processing emails
US8190567B2 (en) Method and system for providing one-to-one email collaboration
US20110219083A1 (en) Email auto-filing and management
US20160337287A1 (en) Electronic mail processing
US10157190B2 (en) Image action based on automatic feature extraction
CN105516296A (zh) 群组标识图像的配置方法及装置
WO2010129714A2 (en) System and method for multilingual transcription service with automated notification services
CN109242410A (zh) 一种待办事项的生成方法和装置
US20130182974A1 (en) System and method for obtaining and routing electronic copies of documents
US20200186668A1 (en) Method and device for recommending watermark for electronic terminal
CN111177093A (zh) 一种科技资源的共享方法及设备、介质
JP4852915B2 (ja) タイムスタンプ取得プログラム、画像形成装置及びデジタルデータ管理システム
US8364654B2 (en) Method and system for automating record storage on a record management server
CN108280182B (zh) 一种灵活应用内部名单的审批方法及系统
US20120221663A1 (en) Method of compiling an electronic message
US20240022531A1 (en) Smart email template generation based on attachments
JP7401726B1 (ja) 情報処理装置および情報処理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant