CN106209605A - 一种网络信息中附件的处理方法和设备 - Google Patents
一种网络信息中附件的处理方法和设备 Download PDFInfo
- Publication number
- CN106209605A CN106209605A CN201610747043.5A CN201610747043A CN106209605A CN 106209605 A CN106209605 A CN 106209605A CN 201610747043 A CN201610747043 A CN 201610747043A CN 106209605 A CN106209605 A CN 106209605A
- Authority
- CN
- China
- Prior art keywords
- adnexa
- information
- key word
- distance
- vector space
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title description 2
- 238000007726 management method Methods 0.000 claims abstract description 38
- 239000000284 extract Substances 0.000 claims abstract description 17
- 238000004458 analytical method Methods 0.000 claims abstract description 16
- 238000000034 method Methods 0.000 claims description 19
- 238000000605 extraction Methods 0.000 claims description 13
- 230000006837 decompression Effects 0.000 claims description 7
- 238000010586 diagram Methods 0.000 claims description 6
- 239000000203 mixture Substances 0.000 claims description 5
- 238000004891 communication Methods 0.000 claims description 4
- 238000009432 framing Methods 0.000 claims description 4
- 230000001960 triggered effect Effects 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 claims 2
- 238000004364 calculation method Methods 0.000 description 4
- 238000002372 labelling Methods 0.000 description 3
- 238000011068 loading method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 208000001491 myopia Diseases 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/08—Annexed information, e.g. attachments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/107—Computer-aided management of electronic mailing [e-mailing]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/07—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail characterised by the inclusion of specific contents
- H04L51/10—Multimedia information
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L51/00—User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
- H04L51/42—Mailbox-related aspects, e.g. synchronisation of mailboxes
Abstract
本发明提供了一种电子附件的管理方法和设备,解析多个含有附件的电子通讯讯息或者互联网信息,提取所述附件的附件特征,构建多维向量空间,根据向量空间的运算结果,绘制多个附件之间的关系结构,根据关系结构,分类展示多个电子附件。本发明能够深入分析电子附件的实体内容,对电子附件进行精准的分类,提高了用户查看附件及和/或附件所属的电子通讯讯息的效率,节省了用户查看时间。
Description
技术领域
本发明涉及互联网技术领域,特别涉及一种互联网信息或者电子信息中附件的管理方法及其设备。
背景技术
电子通讯讯息,例如,电子邮件、社交平台等,已经广泛在人们生活中使用,极大的方便了人们之间的交流和沟通。附件是电子通讯讯息的一个重要的功能,附件携带的信息量大,可以满足用户交流数据的需要。目前,对附件的管理单一,例如,仅仅是简单的上传和发送,用户只有打开附件才能得知附件的内容。尤其是,在遇到垃圾附件的时候,会浪费用户查看附件的时间。
因此,如何对附件进行管理,提高用户查看和使用效率是亟待解决的技术问题。
目前,也出现了一些针对附件的分类处理技术,但只是简单根据附件的名称,大小,时间,或者正文中的关键词等对附件进行分类和关联,但并不能处理较为复杂的附件,例如各类压缩文件,图片,短视频等信息,而且分类较为粗糙,分类结果常常不够准确,客户体验度较差。
有鉴于此,特提出本发明。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的电子通讯讯息中附件的管理方法及其设备。
依据本发明的一个方面,提供了一种电子通讯讯息中附件的管理方法,其包括:解析多个含有附件的电子通讯讯息或者互联网信息,提取所述附件的附件特征;若附件为压缩文件,执行部分解压过程,得到压缩文件正文的部分信息,若附件为图像,则截取拼接图像的部分区域,形成图像摘要形式,若附件为视频,则抽取部分帧,形成视频摘要,根据上述摘要,构建多维向量空间,根据向量空间的运算结果,绘制多个附件之间的关系结构,根据关系结构,分类展示该多个附件。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理的设备,其包括:提取模块,被配置为解析多个含有附件的电子通讯讯息,提取所述附件的附件特征,若附件为压缩文件,执行部分解压过程,得到压缩文件正文的部分信息,若附件为图像,则截取拼接图像的部分区域,形成图像摘要形式,若附件为视频,则抽取部分帧,形成视频摘要;向量空间计算模块,根据上述摘要,构建多维向量空间,根据向量空间的运算结果,绘制多个附件之间的关系结构;分类模块,被配置为根据所述关系结构对所述多个附件进行分类;展现模块,被配置为根据所述分类模块提供的分类结果,展现同一分类下的附件信息。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理方法,其包括解析多个含有附件的电子通讯讯息,提取每个电子通讯讯息所包含的附件;根据所述的附件生成附件信息向量空间,所述附件信息向量空间与所述附件所属的电子通讯讯息相关联;将所述多个附件摘要信息集中展现,并根据对某个附件信息的选择触发启动同一类的所述附件和/或所述附件所属的电子通讯讯息的展现。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理的设备,其包括第一附件提取模块,被配置为解析多个含有附件的电子通讯讯息,提取每个电子通讯讯息所包含附件;附件信息向量空间生成模块,被配置为根据所述的附件生成附件信息向量空间,所述附件信息向量空间与所述附件所属的电子通讯讯息相关联;第二展现模块,被配置为将所述附件信息向量空间生成模块所生成的多个附件信息集中展现,并根据对某个附件摘要信息的选择触发启动同一类别的所述附件和/或所述附件所属的电子通讯讯息。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理方法,其包括:解析多个含有附件的电子通讯讯息,提取每个电子通讯讯息所包含附件的附件;根据所述的附件生成附件信息向量空间,所述信息向量空间中至少包括摘要著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素,根据所述信息向量空间,计算多个附件信息向量空间之间的向量距离,根据所述向量距离对所述多个附件进行分类和聚类;接收搜索关键词,根据所述搜索关键词在多个附件信息向量空间中进行向量空间计算,根据计算结果展示相关附件信息。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理的设备,其包括:第二附件提取模块,被配置为解析多个含有附件的电子通讯讯息,提取每个电子通讯讯息所包含附件的附件;信息向量空间生成模块,被配置为所述的附件生成附件信息向量空间,所述信息向量空间中至少包括摘要著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素;向量空间计算与分类模块,根据所述信息向量空间,计算多个附件信息向量空间之间的向量距离,根据所述向量距离对所述多个附件进行分类和聚类,搜索模块,被配置为接收搜索关键词,根据根据所述搜索关键词在多个附件信息向量空间中进行向量空间计算,根据计算结果展示相关附件信息。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理方法,其包括:解析多个含有附件的电子通讯讯息,获取每个电子通讯附件的信息向量空间;判断所述多个电子通讯附件的信息向量空间之间的距离是否超过特定的阈值,将未超过特定阈值的电子通讯附件收录为一个集合;将所述集合中所有的电子通讯讯息的附件关联展现,在展现时根据与特定向量的距离远近来生成展现顺序和具体展现方式。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理设备,其包括:讯息分类信息获取模块,被配置为解析多个含有附件的电子通讯讯息,获取每个电子通讯附件的信息向量空间;收录模块,被配置为判断所述多个电子通讯附件的信息向量空间之间的距离是否超过特定的阈值,将未超过特定阈值的电子通讯附件收录为一个集合;展现模块,将所述集合中所有的电子通讯讯息的附件关联展现,在展现时根据与特定向量的距离远近来生成展现顺序和具体展现方式。
依据本发明的另一个方面,还提供了一种电子通讯讯息中附件的管理方法,其包括:解析一个或多个含有附件的电子通讯讯息,提取电子通讯讯息所包含的多个附件;识别所述多个附件之间的相邻关系;当其中一个附件被查看时,根据所述相邻关系预先读取与其相邻的附件,并在用户查看所述当前附件的相邻附件时,直接展示该预先读取的相邻附件。
根据讯息分类信息的关联关系将电子通讯讯息收录为一个集合,从而将集合中的附件关联展现;从而提高了用户查看附件及和/或附件所属的电子通讯讯息的效率,节省了用户查看时间。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,以下将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1 为根据本发明一个实施例的实施例提供的电子通讯讯息中附件的管理方法的流程示意图。
图2 为根据本发明一个实施例的实施例提供的电子通讯讯息中附件的管理设备示意图。
图3为根据本发明另一个实施例的实施例提供的电子通讯讯息中附件的管理方法的流程示意图。
图4为根据本发明另一个实施例的实施例提供的电子通讯讯息中附件的管理设备示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参见图1 本发明实施例提供的一种电子通讯讯息中附件的管理方法包括:
步骤10、解析多个含有附件的电子通讯讯息,提取附件的附件特征,形成附件信息向量空间。
例如,电子通讯讯息可以包括电子邮件、社交平台上的信息,微信能或微博等。其中,附件是电子通讯讯息发布过程中以独立文档形式存在并加载于该电子通讯讯息中的文件,包括数据压缩包、文档、图片、视频、统一资源定位符(URL)、通讯信息(如电子名片)等类型,附件特征是附件自身的一些属性信息,比如附件的类型、名称、甚至附件的内容或摘要等。这些特征信息可以通过解析电子通讯讯息和/或附件得到,现在和将来任何能够解析电子通讯讯息和/或附件获得以上特征信息的技术方案,都可以应用到本发明实施例中。
被附件是未压缩的普通文档类型,例如,word,ppt,txt等类型的文档文件,则调用文本分析程序对相关附件进行分析,具体的分析过程可以是根据文档所使用语言而进行的词义语言分析方式,根据词频统计,语义关联信息,提取附件的关键信息,例如关键词;若附件为压缩文件,执行部分解压过程,则使用解压程序或解压模块对附件进行解压,尤其是,当附件文件较为庞大的时候,不解压全部的附件文档,而仅仅解文件开始的一点部分,例如对于文档压缩文件,解压前15%的内容,根据所解压的内容,提取附件的特征信息。
提取附件的特征信息的过程同时也是形成附件信息向量空间的过程,附件信息向量空间至少包括邮件著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素,其中,邮件著录项目包括邮件的发件人,收件人,发件日期和时间,邮件及其附件的大小,邮件的标记情况(紧急邮件,临时邮件,广播邮件),附件关键词为对附件进行文本处理之后所提取得到的关键词信息,邮件正文关键词为根据邮件标题和正文的内容,经过语义分析处理后得到的关键词信息,附件分析工具参量包括对附件进行分析时所使用的分析工具描述,例如,所使用的核心分析算法,核心分析参数,更具体的,在使用词义分析时,所使用的分析参数与涉及的分析参量。
信息向量空间中也可以包括其他参数,在一个变形的实施例中,信息向量空间中可以仅包括附件关键词,或者仅仅包括邮件著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量中的一个或多个。
针对每一个附件都建立上述附件信息向量空间。
步骤11、根据附件信息向量空间对附件进行分类。
在具体实现时,可以根据某一种附件特征进行分类。例如,可以根据附件的类型分类,如将某集合中附件类型为文本类型的所有附件归为一类,将附件类型是图片类型的所有附件归为一类。需要说明的是,某集合可以是某个或某几个电子通讯讯息的收件箱,也可以是已发送电子通讯讯息的已发送文件夹,还可以是待分类的任意一个或多个文件夹组成的集合,只要该集合中包含多个携带附件的电子通讯讯息即可,因此本发明实施例对本步骤中的集合没有限制。又例如,还可以按照附件的名称对附件进行分类,如将附件名称相同的所有附件归为一类,或者将附件名称相似的所有附件归为一类。至于附件名称相似的情况,比如附件名称中的关键内容一致、仅是版本号不同,在具体实现时,可以先从各电子通讯讯息的附件中提取各附件的附件名称,然后将各附件名称进行比对,获得相似度数值(如相同字符数量在整个附件名称中的占比),并设置相似度阈值,将所有附件名称的相似度超过预置阈值的附件归为一类。当然也可以将附件的多个特征结合在一起进行分类,例如,将附件名称相同并且附件类型也相同的所有附件归为一类,或者,将附件名称相似并且附件类型相同的所有附件归为一类。
另一种聚类,分类的方式则是根据附件信息向量空间,对于每两个附件信息向量空间,计算向量空间之间的距离,例如明氏距离,根据所计算的向量空间距离,对多个附件进行分类或者聚类。
更具体地,针对某一件邮件附件,计算其他邮件附件信息向量空间和其本身的附件信息向量空间之间的距离,将所有低于预定阈值的距离所对应的其他邮件附件作为本邮件的同一类,并且使用计算所得的距离还表明相关邮件之间的关联程度,距离越近,关联程度越高,距离越远,关联程度越低。
步骤12、展现同一分类下的所有附件、以及各附件所提炼出的信息向量空间的各元素信息,或者仅仅将信息向量空间中的部分元素,例如附件关键词信息,或者邮件正文关键词信息进行展现。
该步骤首先可以根据附件所属的分类,启动该分类对应的应用程序或插件,进而加载附件;例如,文本类型的附件可以对应启动OFFICE系列的应用程序,并将附件加载呈现给用户。是否有对应的应用程序取决于用户所使用的终端是否安装了与附件的分类或附件对应的应用程序或插件,该对应的应用程序或插件可启动所述附件。然后,显示同一分类下的所有加载的附件、和/或该附件的摘要信息、和/或加载的附件所属的电子通讯讯息。另外,本发明还可以根据用户选择的多个附件分类均满足的附件或附件摘要、或电子通讯讯息进行展示,比如,用户选择附件是图片类型,附件大小在3M至5M两个分类后,将同时满足上述两个分类的所有附件或附件摘要、或电子通讯讯息进行展示。
还可以提示用户选择某一个附件信息,并根据用户选择的附件信息,展现与该附件信息属于同一类别的其他附件信息。
与图1 所示实施例提供的电子通讯讯息中附件的管理方法相对应,参见图2 ,本发明实施例还提供了电子通讯讯息中附件的管理的设备,其包括提取模块13、分类模块14及展现模块15。其中,提取模块13被配置为解析多个含有附件的电子通讯讯息,提取附件的附件特征,形成附件信息向量空间,附件信息向量空间至少包括邮件著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素,其中,邮件著录项目包括邮件的发件人,收件人,发件日期和时间,邮件及其附件的大小,邮件的标记情况(紧急邮件,临时邮件,广播邮件),附件关键词为对附件进行文本处理之后所提取得到的关键词信息,邮件正文关键词为根据邮件标题和正文的内容,经过语义分析处理后得到的关键词信息,附件分析工具参量包括对附件进行分析时所使用的分析工具描述,例如,所使用的核心分析算法,核心分析参数,更具体的,在使用词义分析时,所使用的分析参数与涉及的分析参量。分类模块14被配置为根据提取模块提供的附件信息向量空间对所述多个附件进行分类;展现模块15被配置为根据分类模块14提供的分类结果,展现同一分类下的所有附件和/或附件信息向量空间和/或附件所属的电子通讯讯息。
相对于现有技术方案只能对是否有附件对电子通讯讯息(例如,电子邮件)做出分类,而无法对各附件做进一步的分类,或者仅仅根据简单的著录信息对附件进行分类,。本发明实施例提出的电子通讯讯息中附件的管理方法及其设备提高了附件关联的准确性,有利于用户查看属于同一分类下的所有加载的附件、提高对附件信息的管理效率。
对于图片类型的附件,可通过对图片缩小或降低分辨率,截取至少一页的视图(例如,第一页、最后一页或其他页)作为附件信息向量空间中的附件关键词元素,对于属于视频类型的附件,可以截取影片至少一帧(例如,第一页、最后一页或其他页)作为附件信息向量空间中的附件关键词元素。对于属于音频类型的附件,可以取其取其专辑或演唱者照片生作为附件信息向量空间中的附件关键词元素。当附件内容涉及到新闻内容时,还可以抓取新闻内容的关键词搜索该新闻最新动态的链接,并将链接和/或链接对应的网页信息生成作为附件信息向量空间中的附件关键词元素。当附件的内容包括URL(Uniform ResourceLocator,统一资源定位符)信息时,可以获取URL对应的网页信息,根据网页信息作为附件信息向量空间中的附件关键词元素。
参见图3 ,本发明另一实施例提供的一种电子通讯讯息中附件的管理方法包括:步骤30、解析多个含有附件的电子通讯讯息,提取附件的附件特征,形成附件信息向量空间。
提取附件的特征信息的过程同时也是形成附件信息向量空间的过程,附件信息向量空间至少包括邮件著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素,针对每一个附件都建立上述附件信息向量空间。
步骤31、根据向量空间对附件进行分类。
根据附件信息向量空间,对于每两个附件信息向量空间,计算向量空间之间的距离,例如明氏距离,根据所计算的向量空间距离,对多个附件进行分类或者聚类。
更具体地,针对某一件邮件附件,计算其他邮件附件信息向量空间和其本身的附件信息向量空间之间的距离,将所有低于预定阈值的距离所对应的其他邮件附件作为本邮件的同一类,并且使用计算所得的距离还表明相关邮件之间的关联程度,距离越近,关联程度越高,距离越远,关联程度越低。
步骤32、根据向量空间之间的距离,绘制附件关系图。
更具体地,首先绘制同一类中各附件之间的关系图,选择其中一个附件作为关系图基点或者重点,根据该附件与其余附件之前的信息向量空间的距离,绘制附件关系图,选择基点附件或重点附件可以随机选择,或者根据用户对于邮件的标引,或者根据用户的选择来进行;在具体绘制关系图的过程中,可以采用层状结构,树形结构等多种结构的数据表征表示。
对于多类别的多个附件,以同时属于过个类别的附件作为纽带节点,根据附件信息向量空间之间的距离计算结果,生成多层次的,表征多类别附件之间关联关系的结构图。
步骤33、展现同一分类下的附件关系图和/或多个分类关系下的附件关系图。根据步骤32中所绘制的附件关系图,进行展示。出了展示附件关系图之外,对附件本身、以及各附件所提炼出的信息向量空间的各元素信息,或者仅仅将信息向量空间中的部分元素,例如附件关键词信息,或者邮件正文关键词信息进行展现。
与图3 所示实施例提供的电子通讯讯息中附件的管理方法相对应,参见图4,本发明实施例还提供了电子通讯讯息中附件的管理的设备,其包括提取模块40,分类模块41、关系图绘制模块42及展现模块43。其中,提取模块40被配置为解析多个含有附件的电子通讯讯息,提取附件的附件特征,形成附件信息向量空间,附件信息向量空间至少包括邮件著录信息,附件关键词,相关邮件正文关键词,附件分析工具参量等元素,其中,邮件著录项目包括邮件的发件人,收件人,发件日期和时间,邮件及其附件的大小,邮件的标记情况(紧急邮件,临时邮件,广播邮件),附件关键词为对附件进行文本处理之后所提取得到的关键词信息,邮件正文关键词为根据邮件标题和正文的内容,经过语义分析处理后得到的关键词信息,附件分析工具参量包括对附件进行分析时所使用的分析工具描述,例如,所使用的核心分析算法,核心分析参数,更具体的,在使用词义分析时,所使用的分析参数与涉及的分析参量。关系图绘制模块42,被配置为根据向量空间之间的距离,绘制附件关系图。展现模块43被配置为根据关系图绘制模块42提供的附件关系图,展现多个附件之间的关联关系。
附件的管理的设备还可以包括搜索模块,被配置为接收搜索关键词,根据搜索关键词在多个附件信息向量空间中进行匹配查询,如果有匹配的信息向量空间,则展示与信息向量空间相对应的附件、附件著录项目和/或附件所属的关键词信息。用户可以根据自己的需要设定搜索关键词。可选的,当在附件信息向量空间中无法匹配成功时,还可以进一步再在附件的全部内容中进行搜索。
本发明实施例提供的电子通讯讯息中附件的管理方法还可以在发送所述附件时,将附件、与附件具有关联关系的附件摘要信息和/或附件标记信息一并发送;对于接收到的所述附件、与所述附件具有相似信息向量空间,或者彼此间的信息向量空间距离低于预设阈值的其他附件的信息,例如:信息向量空间中的各信息袁术,根据向量空间的距离附件或者附件信息,然后在接收端的显示界面上显示上述附件、附件的信息向量空间信息或附件的其他标记信息。
本发明实施例提供的电子通讯讯息中附件的管理方法,还可以将邮件和/或附件备份到云端(例如,通过上传的方式),本地存储,或者具有备份功能的应用,例如,evernote印象笔记等。假设是evernote应用,在用户授权后,邮件系统就会创建一个文件夹来映射到evernote,每当用户将邮件移动到这个文件夹,触发备份,系统就将邮件正文加上附件转成evernote的文件格式,然后用evernote创建一个新的note,从而实现备份。
本发明实施例提供的电子通讯讯息中附件的管理方法,还可以将附件保存存到设备默认目录。例如,调用IOS(Iphone Operating System,苹果操作系统)系统的接口UISaveVideoAtPathToSavedPhotosAlbum将视频附件保存到设备默认目录,调用IOS(Iphone Operating System,苹果操作系统)系统的接口UIImageWriteToSavedPhotosAlbum将图片附件保存到设备默认目录。
本发明实施例提供的电子通讯讯息中附件的管理方设备中所涉及的模块可以配置在邮件客户端、博客客户端或微博客户端,及集成邮件客户端、博客客户端或微博客户端的第三方应用。上述的邮件客户端、博客客户端、微博客户端和第三方应用等电子通讯讯息管理程序不仅可以运行在PC等设备中,还可以运行在移动终端,例如平板电脑或手机等。
结合上述公开的实施例所描述的方法的步骤,或者相对应的模块可直接体现为硬件、由处理器执行的软件模块或者这二者的组合。软件模块可能存在于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其他形式的存储媒质中。一种典型存储媒质与处理器耦合,从而使得处理器能够从该存储媒质中读信息,且可向该存储媒质写信息。在替换实例中,存储媒质是处理器的组成部分。处理器和存储媒质可能存在于一个ASIC中。该ASIC可能存在于一个用户站中。在一个替换实例中,处理器和存储媒质可以作为用户站中的分立组件存在。
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照实例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。
Claims (10)
1.一种电子附件的管理方法,其特征在于包括如下步骤:
解析多个含有附件的电子通讯讯息或者互联网信息,提取电子通讯正文或互联网信息正文和/或附件中的信息;
根据上述提取的信息,构建附件信息多维向量空间,其中所述多维向量空间中的元素至少包括著录信息,附件关键词,相关电子通讯讯息或者互联网信息正文关键词;其中,邮件著录项目包括邮件的发件人,收件人,发件日期和时间,邮件及其附件的大小,附件关键词为对附件进行处理之后所提取得到的关键词信息,邮件正文关键词为根据邮件标题和正文的内容,经过语义分析处理后得到的关键词信息;
计算多个附件多对应的多个多维向量空间中,任意两个之间的向量距离,根据计算所得到的向量距离,对多个附件进行分类;
绘制同一类别内附件之间的关系结构图,
绘制不同类别附件之间的关系结构图,
根据上述同一类别或者不同类别附件之间的关系结构,分类展示该多个附件。
2.如权利要求1所述的电子附件的管理方法,其特征在于,上述提取附件中的信息的步骤具体包括:
若附件为压缩文件,执行部分解压过程,得到压缩文件正文的部分信息,若附件为图像,则截取拼接图像的部分区域,形成图像摘要形式,若附件为视频,则抽取部分帧,形成视频摘要;
上述多维向量空间中的元素还包括附件分析工具参量元素,所述附件分析工具参量元素包括对附件进行分析时所使用的分析工具的工作参数。
3.如权利要求1所述的电子附件的管理方法,其特征在于,上述分类展示该多个附件的步骤具体包括:根据用户对某个附件信息的选择触发启动与该附件属于同一类的其他附件的展现。
4.如权利要求1所述的电子附件的管理方法,其特征在于,上述根据计算所得到的向量距离,对多个附件进行分类具体包括:
针对某一附件,计算其他附件信息多维向量空间和其本身的附件信息多维向量空间之间的距离,将所有低于预定阈值的距离所对应的其他附件作为本附件的同一类附件,并且使用计算所得的距离还表明相关附件之间的关联程度,距离越近,关联程度越高,距离越远,则关联程度越低。
5.如权利要求1-4中任一所述的电子附件的管理方法,其特征在于,还包括如下步骤:
根据用户提供的关键词,在多维向量空间中检索相关关键词,对检索结果进行排序,展示检索结果所对应的附件信息。
6.一种电子附件的管理设备,其特征在于包括如下步骤:
提取模块,被配置为解析多个含有附件的电子通讯讯息或者互联网信息,提取电子通讯正文或互联网信息正文和/或附件中的信息;
分类模块,被配置为根据上述提取的信息,构建附件信息多维向量空间,其中所述多维向量空间中的元素至少包括著录信息,附件关键词,相关电子通讯讯息或者互联网信息正文关键词;其中,邮件著录项目包括邮件的发件人,收件人,发件日期和时间,邮件及其附件的大小,附件关键词为对附件进行处理之后所提取得到的关键词信息,邮件正文关键词为根据邮件标题和正文的内容,经过语义分析处理后得到的关键词信息;
上述分类模块还被配置为计算多个附件多对应的多个多维向量空间中,任意两个之间的向量距离,根据计算所得到的向量距离,对多个附件进行分类;
关系图绘制模块,被配置为绘制同一类别内附件之间的关系结构图,上述关系图绘制模块还被配置为绘制不同类别附件之间的关系结构图;
展现模块,被配置为根据上述同一类别或者不同类别附件之间的关系结构,分类展示该多个附件。
7.如权利要求6所述的电子附件的管理设备,其特征在于,上述提取模块还被配置为:
若附件为压缩文件,执行部分解压过程,得到压缩文件正文的部分信息,若附件为图像,则截取拼接图像的部分区域,形成图像摘要形式,若附件为视频,则抽取部分帧,形成视频摘要;
上述多维向量空间中的元素还包括附件分析工具参量元素,所述附件分析工具参量元素包括对附件进行分析时所使用的分析工具的工作参数。
8.如权利要求6所述的电子附件的管理设备,其特征在于,上述展现模块还被配置为根据用户对某个附件信息的选择触发启动与该附件属于同一类的其他附件的展现。
9.如权利要求6所述的电子附件的管理设备,其特征在于,上述分类模块还被配置为:针对某一附件,计算其他附件信息多维向量空间和其本身的附件信息多维向量空间之间的距离,将所有低于预定阈值的距离所对应的其他附件作为本附件的同一类附件,并且使用计算所得的距离还表明相关附件之间的关联程度,距离越近,关联程度越高,距离越远,则关联程度越低。
10.如权利要求6-9中任一所述的电子附件的管理设备,其特征在于,还包括搜索模块,被配置为根据用户提供的关键词,在多维向量空间中检索相关关键词,对检索结果进行排序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610747043.5A CN106209605B (zh) | 2016-08-30 | 2016-08-30 | 一种网络信息中附件的处理方法和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201610747043.5A CN106209605B (zh) | 2016-08-30 | 2016-08-30 | 一种网络信息中附件的处理方法和设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN106209605A true CN106209605A (zh) | 2016-12-07 |
CN106209605B CN106209605B (zh) | 2019-12-06 |
Family
ID=57526318
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201610747043.5A Active CN106209605B (zh) | 2016-08-30 | 2016-08-30 | 一种网络信息中附件的处理方法和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106209605B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108063720A (zh) * | 2017-08-23 | 2018-05-22 | 广州市知君信息科技有限公司 | 压缩包文件分派及任务监控方法与系统 |
CN111125381A (zh) * | 2018-11-01 | 2020-05-08 | 北大方正集团有限公司 | 参考文献关键信息的识别方法、装置、设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174273A (zh) * | 2007-12-04 | 2008-05-07 | 清华大学 | 基于元数据分析的新闻事件检测方法 |
CN101488190A (zh) * | 2009-02-27 | 2009-07-22 | 华北电力大学(保定) | 一种向量间相似度的计算方法 |
CN102075449A (zh) * | 2009-11-25 | 2011-05-25 | 联想(北京)有限公司 | 电子邮件管理方法、装置和终端设备 |
CN102129470A (zh) * | 2011-03-28 | 2011-07-20 | 中国科学技术大学 | 标签聚类方法和系统 |
CN103312596A (zh) * | 2013-06-25 | 2013-09-18 | 南京奇多信息科技有限公司 | 电子通讯讯息中附件的管理方法及其设备 |
CN103595615A (zh) * | 2012-08-15 | 2014-02-19 | 腾讯科技(深圳)有限公司 | 电子邮件的发送和接收方法、终端 |
CN104182549A (zh) * | 2014-09-15 | 2014-12-03 | 中国联合网络通信集团有限公司 | 一种电子邮件摘要生成方法及装置 |
-
2016
- 2016-08-30 CN CN201610747043.5A patent/CN106209605B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101174273A (zh) * | 2007-12-04 | 2008-05-07 | 清华大学 | 基于元数据分析的新闻事件检测方法 |
CN101488190A (zh) * | 2009-02-27 | 2009-07-22 | 华北电力大学(保定) | 一种向量间相似度的计算方法 |
CN102075449A (zh) * | 2009-11-25 | 2011-05-25 | 联想(北京)有限公司 | 电子邮件管理方法、装置和终端设备 |
CN102129470A (zh) * | 2011-03-28 | 2011-07-20 | 中国科学技术大学 | 标签聚类方法和系统 |
CN103595615A (zh) * | 2012-08-15 | 2014-02-19 | 腾讯科技(深圳)有限公司 | 电子邮件的发送和接收方法、终端 |
CN103312596A (zh) * | 2013-06-25 | 2013-09-18 | 南京奇多信息科技有限公司 | 电子通讯讯息中附件的管理方法及其设备 |
CN104182549A (zh) * | 2014-09-15 | 2014-12-03 | 中国联合网络通信集团有限公司 | 一种电子邮件摘要生成方法及装置 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108063720A (zh) * | 2017-08-23 | 2018-05-22 | 广州市知君信息科技有限公司 | 压缩包文件分派及任务监控方法与系统 |
CN111125381A (zh) * | 2018-11-01 | 2020-05-08 | 北大方正集团有限公司 | 参考文献关键信息的识别方法、装置、设备及存储介质 |
CN111125381B (zh) * | 2018-11-01 | 2023-08-11 | 新方正控股发展有限责任公司 | 参考文献关键信息的识别方法、装置、设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN106209605B (zh) | 2019-12-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7996372B2 (en) | Automated response to solicited and unsolicited communications and automated collection and management of data extracted therefrom | |
US7454470B1 (en) | System and method for analyzing communications | |
US11010547B2 (en) | Generating and applying outgoing communication templates | |
US6826417B2 (en) | Process for sending images to a low display ability terminal | |
US20150278248A1 (en) | Personal Information Management Service System | |
CN104182549A (zh) | 一种电子邮件摘要生成方法及装置 | |
CN112860642A (zh) | 一种庭审数据处理方法、服务器及终端 | |
CN112016290A (zh) | 一种文档自动排版方法、装置、设备及存储介质 | |
EP1001593A2 (en) | Methods and apparatus for operating on non-text messages | |
WO2019149065A1 (zh) | 绘文字兼容显示方法、装置、终端及计算机可读存储介质 | |
CN115757596A (zh) | 一种通用电力非结构化数据转结构化数据方法 | |
CN106209605A (zh) | 一种网络信息中附件的处理方法和设备 | |
CN102036198A (zh) | 一种在短信内容中增加附加信息的方法及装置 | |
JP2001331422A (ja) | メール評価装置 | |
JP4642903B2 (ja) | 文脈認識が強化されたメッセージ変換システムおよび方法 | |
CN112182174A (zh) | 业务问答知识查询方法、装置、计算机设备和存储介质 | |
CN110096478A (zh) | 文档索引生成方法及设备 | |
CN115935958A (zh) | 简历处理方法、装置和存储介质及电子设备 | |
JP4872433B2 (ja) | 言語処理装置、携帯端末及び言語処理方法 | |
CN113595884A (zh) | 一种消息提醒方法及应用端 | |
CN116778501A (zh) | 一种基于ocr和nlp技术提取文档内非一般要求的方法 | |
CN113569019B (zh) | 基于聊天对话进行知识提取的方法、系统、设备及存储介质 | |
CN113569019A (zh) | 基于聊天对话进行知识提取的方法、系统、设备及存储介质 | |
CN117098077A (zh) | 一种基于移动终端的信息处理方法及装置 | |
CN115794788A (zh) | 数据去重方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20191115 Address after: No. 259, West 2nd Ring Road, Xi'an City, Shaanxi Province Applicant after: Xi'an Aeronautical University Address before: 710048 Xi'an Aviation Institute, Shaanxi, Xi'an Applicant before: Cheng Chuanxu |
|
TA01 | Transfer of patent application right |