CN113055278A - 邮件归档处理方法及装置 - Google Patents

邮件归档处理方法及装置 Download PDF

Info

Publication number
CN113055278A
CN113055278A CN202110359705.2A CN202110359705A CN113055278A CN 113055278 A CN113055278 A CN 113055278A CN 202110359705 A CN202110359705 A CN 202110359705A CN 113055278 A CN113055278 A CN 113055278A
Authority
CN
China
Prior art keywords
mail
information
mails
archived
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110359705.2A
Other languages
English (en)
Inventor
陈承启
黄平
陈渝
谭均昌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110359705.2A priority Critical patent/CN113055278A/zh
Publication of CN113055278A publication Critical patent/CN113055278A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L51/00User-to-user messaging in packet-switching networks, transmitted according to store-and-forward or real-time protocols, e.g. e-mail
    • H04L51/42Mailbox-related aspects, e.g. synchronisation of mailboxes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请实施例提供一种邮件归档处理方法及装置,也可用于金融领域,方法包括:扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件;根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息;根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示;本申请能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。

Description

邮件归档处理方法及装置
技术领域
本申请涉及数据处理领域,也可用于金融领域,具体涉及一种邮件归档处理方法及装置。
背景技术
当前,计算机已成为工作的必备辅助工具,企业邮箱作为企业员工的必备软件,每天与同事、客户往来的邮件,随时间的推移日积月累,形成大量的记录.
邮件作为一种非即时通讯工具,对于同一主题的邮件,发出之后可能数小时、数日之后得到回复,在邮件数量较多的情况下,可能产生邮件遗漏;并且经过多次转发、答复,最终得出结论的同时,也会形成一连串记录,这种情况给后续查找邮件沟通过类似问题的原因,或翻看过往邮件的关键结论带来不便。
发明内容
针对现有技术中的问题,本申请提供一种邮件归档处理方法及装置,能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
为了解决上述问题中的至少一个,本申请提供以下技术方案:
第一方面,本申请提供一种邮件归档处理方法,包括:
扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件;
根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息;
根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
进一步地,所述根据获取到的邮件标题确定待归档邮件,包括:
根据设定标识字符和邮件标题确定对应的邮件主题;
若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
进一步地,所述根据获取到的邮件标题确定待归档邮件,包括:
根据当前系统时间和前次扫描时的系统时间获取新增邮件;
根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
进一步地,在所述根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息之后,还包括:
通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
第二方面,本申请提供一种邮件归档处理装置,包括:
邮件分类模块,用于扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件;
语义识别模块,用于根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息;
纪要生成模块,用于根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
进一步地,所述邮件分类模块包括:
主题确定单元,用于根据设定标识字符和邮件标题确定对应的邮件主题;
待归档邮件确定单元,用于若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
进一步地,所述邮件分类模块包括:
增量获取单元,用于根据当前系统时间和前次扫描时的系统时间获取新增邮件;
增量邮件待归档确定单元,用于根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
进一步地,还包括:
机器学习模型识别单元,用于通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
第三方面,本申请提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的邮件归档处理方法的步骤。
第四方面,本申请提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的邮件归档处理方法的步骤。
由上述技术方案可知,本申请提供一种邮件归档处理方法及装置,通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例中的邮件归档处理方法的流程示意图之一;
图2为本申请实施例中的邮件归档处理方法的流程示意图之二;
图3为本申请实施例中的邮件归档处理方法的流程示意图之三;
图4为本申请实施例中的邮件归档处理装置的结构图之一;
图5为本申请实施例中的邮件归档处理装置的结构图之二;
图6为本申请实施例中的邮件归档处理装置的结构图之三;
图7为本申请实施例中的电子设备的结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整的描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
考虑到邮件作为一种非即时通讯工具,对于同一主题的邮件,发出之后可能数小时、数日之后得到回复,在邮件数量较多的情况下,可能产生邮件遗漏;并且经过多次转发、答复,最终得出结论的同时,也会形成一连串记录,这种情况给后续查找邮件沟通过类似问题的原因,或翻看过往邮件的关键结论带来不便的问题,本申请提供一种邮件归档处理方法及装置,通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
为了能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率,本申请提供一种邮件归档处理方法的实施例,参见图1,所述邮件归档处理方法具体包含有如下内容:
步骤S101:扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件。
可选的,本申请可以利用非工作时间(如午间休息,用户可进行灵活设置),通过计算机后台自动、定时任务,扫描用户邮件列表。
可选的,本申请对邮件列表进行扫描后,可以根据邮件标题进行分类,例如对邮件标题除“转发”、“答复”等设定标识字符以外一样的,登记为同一主题,通过将各邮件依据邮件标题进行分类,能够提高邮件归档效率。
可选的,根据属于同一邮件主题的邮件数量是否大于设定阈值(例如1),可以将该邮件主题的邮件确定为待归档邮件,即认为该邮件存在往来交互或更新,需要进行归档处理,而属于同一邮件主题的邮件数量没有大于设定阈值的,则可认为该邮件仅作为收件通知或发件提醒,不整理归档。
步骤S102:根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息。
可选的,所述待归档邮件中固化信息部分是指邮件本身自带的信息,例如收件人信息、发件人信息、发送时间信息等,此即所述来往信息,可以通过设定来往文字标识进行识别和提取。
可选的,所述数字顺序关键字例如“1、2、3等”,对于格式有规律的数字排序,可以理解为总结陈词,或是提出一连串问题等,此时可以根据句末的标点符号进行判断,例如句号是进行陈述,问号是对一个问题提出疑问。
可选的,所述语序关联词例如“首先”、“接着”、“其次”、“然后”、“最终”、“最后”等,出现上述关键字,有可能是对邮件内容进行一个系统性描述或梳理,甚至得出一个关键结论,此时同样可以根据句末的标点符号进行判断,例如句号是进行陈述,问号是对一个问题提出疑问。
由此,通过上述内容本申请可以对待归档邮件进行语义识别,分别提取得到来往信息和结论信息。
步骤S103:根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
可选的,本申请可以在上述邮件分类和语义识别的基础上,按照邮件的最新发送时间倒序生成邮件纪要,对于之前已经生成过邮件主题的邮件纪要,则对之前的内容进行更新。
从上述描述可知,本申请实施例提供的邮件归档处理方法,能够通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
为了能够提高邮件归档效率,在本申请的邮件归档处理方法的一实施例中,参见图2,上述步骤S101还可以具体包含如下内容:
步骤S201:根据设定标识字符和邮件标题确定对应的邮件主题。
步骤S202:若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
在一个具体实例中,计算机首次运行时记录本次运行系统时间,对邮件全量列表进行扫描。若同一主题邮件数量(包括收件和发件)为1,认为该邮件仅作为收件通知或发件提醒,不整理归档;若同一主题邮件数量大于1,认为该邮件存在往来交互或更新,登记邮件主题,进入队列,参见表1的邮件列表:
表1邮件列表
Figure BDA0003005040230000061
Figure BDA0003005040230000071
对于上表1,计算机首次运行本系统后,张三于2013/1/16 9:41:00发送的邮件“PMS集成测试周报(20130116)”,同一主题邮件数量为1,认为该邮件仅作为收件通知或发件提醒,不整理归档;而邮件“请帮忙发份参数管理平台境外数据,谢谢!”,多次“转发”、“答复”,同一主题邮件数量大于1,认为该邮件存在往来交互或更新,登记邮件主题,进入队列。
为了能够提高邮件归档效率,在本申请的邮件归档处理方法的一实施例中,参见图3,上述步骤S101还可以具体包含如下内容:
步骤S301:根据当前系统时间和前次扫描时的系统时间获取新增邮件。
步骤S302:根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
在一个具体实例中,若计算机非首次运行本系统,则获取前一次运行时间,记录本次运行时间,对邮件进行增量扫描(即不扫描发件时间或收件时间早于前一次运行时间的邮件)。在增量邮件主题范围内,匹配全量邮件主题,如同一主题在全量邮件中不存在,邮件数量(包括收件和发件)为1,认为该邮件仅作为收件通知或发件提醒,不整理归档;如同一主题在全量邮件中不存在,但邮件数量大于1,或在全量邮件中存在,认为该邮件存在往来交互或更新,登记邮件主题,进入队列。
为了能够提高邮件归档时的准确率,在本申请的邮件归档处理方法的一实施例中,上述步骤S102中还可以具体包含如下内容:
通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
可以理解的是,考虑到并非所有邮件正文中都存在数字顺序关键字、语序关联词以及准确的句末标点符号,对于此类邮件通过上述方法难以得到准确的结论信息,因此本申请可以通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
在一个具体的实例中,所述GPT自然语言处理模块的训练和使用方法如下:
(1)样本数据:预先准备之前邮件的往来记录。
(2)数据预处理:基于样本数据,对邮件内容进行拆分、断句,提取关键信息。
(3)模型选择:自然语言处理(NLP,Natural Language Procesing)属于计算机科学领域、人工智能领域的一个重要方向。与传统方法通常依赖于人工提取特征相比,神经网络模型可以更好地缓解特征工程问题。代表性的预训练模型包括ELMo、GPT、BERT等,支持充分利用大规模的单语语料,对一词多义进行建模,学习到丰富的语义知识。虽然BERT更为强大,支持自然语言的双向训练,但目前在得到良好的效果之前,训练时间较长。未来随着硬件设备的升级和训练算法的改进,训练时间预计会缩短。本文采用GPT模型。
Figure BDA0003005040230000081
Figure BDA0003005040230000091
可以理解的是,上述邮件往来,由于缺乏数字顺序及“首先”、“然后”等语序关联词,则需要在智能识别模块进行语法学习的基础上,对邮件内容进行拆分、断句,最终抽取出有效信息。效果如下:
Figure BDA0003005040230000092
为了能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率,本申请提供一种用于实现所述邮件归档处理方法的全部或部分内容的邮件归档处理装置的实施例,参见图4,所述邮件归档处理装置具体包含有如下内容:
邮件分类模块10,用于扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件。
语义识别模块20,用于根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息。
纪要生成模块30,用于根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
从上述描述可知,本申请实施例提供的邮件归档处理装置,能够通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
为了能够提高邮件归档效率,在本申请的邮件归档处理装置的一实施例中,参见图5,所述邮件分类模块10包括:
主题确定单元11,用于根据设定标识字符和邮件标题确定对应的邮件主题。
待归档邮件确定单元12,用于若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
为了能够提高邮件归档效率,在本申请的邮件归档处理装置的一实施例中,参见图6,所述邮件分类模块10包括:
增量获取单元13,用于根据当前系统时间和前次扫描时的系统时间获取新增邮件。
增量邮件待归档确定单元14,用于根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
为了能够提高邮件归档时的准确率,在本申请的邮件归档处理装置的一实施例中,还具体包含有如下内容:
机器学习模型识别单元,用于通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
从硬件层面来说,为了能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率,本申请提供一种用于实现所述邮件归档处理方法中的全部或部分内容的电子设备的实施例,所述电子设备具体包含有如下内容:
处理器(processor)、存储器(memory)、通信接口(Communications Interface)和总线;其中,所述处理器、存储器、通信接口通过所述总线完成相互间的通信;所述通信接口用于实现邮件归档处理装置与核心业务系统、用户终端以及相关数据库等相关设备之间的信息传输;该逻辑控制器可以是台式计算机、平板电脑及移动终端等,本实施例不限于此。在本实施例中,该逻辑控制器可以参照实施例中的邮件归档处理方法的实施例,以及邮件归档处理装置的实施例进行实施,其内容被合并于此,重复之处不再赘述。
可以理解的是,所述用户终端可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在实际应用中,邮件归档处理方法的部分可以在如上述内容所述的电子设备侧执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
图7为本申请实施例的电子设备9600的系统构成的示意框图。如图7所示,该电子设备9600可以包括中央处理器9100和存储器9140;存储器9140耦合到中央处理器9100。值得注意的是,该图7是示例性的;还可以使用其他类型的结构,来补充或代替该结构,以实现电信功能或其他功能。
一实施例中,邮件归档处理方法功能可以被集成到中央处理器9100中。其中,中央处理器9100可以被配置为进行如下控制:
步骤S101:扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件。
步骤S102:根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息。
步骤S103:根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
从上述描述可知,本申请实施例提供的电子设备,通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
在另一个实施方式中,邮件归档处理装置可以与中央处理器9100分开配置,例如可以将邮件归档处理装置配置为与中央处理器9100连接的芯片,通过中央处理器的控制来实现邮件归档处理方法功能。
如图7所示,该电子设备9600还可以包括:通信模块9110、输入单元9120、音频处理器9130、显示器9160、电源9170。值得注意的是,电子设备9600也并不是必须要包括图7中所示的所有部件;此外,电子设备9600还可以包括图7中没有示出的部件,可以参考现有技术。
如图7所示,中央处理器9100有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器9100接收输入并控制电子设备9600的各个部件的操作。
其中,存储器9140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器9100可执行该存储器9140存储的该程序,以实现信息存储或处理等。
输入单元9120向中央处理器9100提供输入。该输入单元9120例如为按键或触摸输入装置。电源9170用于向电子设备9600提供电力。显示器9160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器9140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器9140还可以是某种其它类型的装置。存储器9140包括缓冲存储器9141(有时被称为缓冲器)。存储器9140可以包括应用/功能存储部9142,该应用/功能存储部9142用于存储应用程序和功能程序或用于通过中央处理器9100执行电子设备9600的操作的流程。
存储器9140还可以包括数据存储部9143,该数据存储部9143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器9140的驱动程序存储部9144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块9110即为经由天线9111发送和接收信号的发送机/接收机9110。通信模块(发送机/接收机)9110耦合到中央处理器9100,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块9110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)9110还经由音频处理器9130耦合到扬声器9131和麦克风9132,以经由扬声器9131提供音频输出,并接收来自麦克风9132的音频输入,从而实现通常的电信功能。音频处理器9130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器9130还耦合到中央处理器9100,从而使得可以通过麦克风9132能够在本机上录音,且使得可以通过扬声器9131来播放本机上存储的声音。
本申请的实施例还提供能够实现上述实施例中的执行主体为服务器或客户端的邮件归档处理方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的执行主体为服务器或客户端的邮件归档处理方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
步骤S101:扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件。
步骤S102:根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息。
步骤S103:根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
从上述描述可知,本申请实施例提供的计算机可读存储介质,通过扫描用户邮件列表确定待归档邮件,然后根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息,再根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息,最后根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示,由此能够有效对邮件进行分类和分析,提取重点内容进行纪要归档,提高用户的邮件处理效率。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (10)

1.一种邮件归档处理方法,其特征在于,所述方法包括:
扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件;
根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息;
根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
2.根据权利要求1所述的邮件归档处理方法,其特征在于,所述根据获取到的邮件标题确定待归档邮件,包括:
根据设定标识字符和邮件标题确定对应的邮件主题;
若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
3.根据权利要求1所述的邮件归档处理方法,其特征在于,所述根据获取到的邮件标题确定待归档邮件,包括:
根据当前系统时间和前次扫描时的系统时间获取新增邮件;
根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
4.根据权利要求1所述的邮件归档处理方法,其特征在于,在所述根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息之后,还包括:
通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
5.一种邮件归档处理装置,其特征在于,包括:
邮件分类模块,用于扫描用户邮件列表,并根据获取到的邮件标题确定待归档邮件;
语义识别模块,用于根据设定来往文字标识识别并提取所述待归档邮件中固化信息部分的来往信息;根据数字顺序关键字和/或语序关联词以及句末标点符号类型识别并提取所述待归档邮件中邮件正文部分的结论信息;
纪要生成模块,用于根据所述来往信息和所述结论信息生成所述邮件的邮件纪要并进行客户端展示。
6.根据权利要求5所述的邮件归档处理装置,其特征在于,所述邮件分类模块包括:
主题确定单元,用于根据设定标识字符和邮件标题确定对应的邮件主题;
待归档邮件确定单元,用于若属于同一邮件主题的邮件数量大于设定阈值,则将该邮件主题的邮件确定为待归档邮件。
7.根据权利要求5所述的邮件归档处理装置,其特征在于,所述邮件分类模块包括:
增量获取单元,用于根据当前系统时间和前次扫描时的系统时间获取新增邮件;
增量邮件待归档确定单元,用于根据特定标识字符和邮件标题确定各新增邮件对应的邮件主题;若全部邮件中属于同一邮件主题的邮件数量大于设定阈值,则将新增邮件中与该邮件主题对应的邮件确定为待归档邮件。
8.根据权利要求5所述的邮件归档处理装置,其特征在于,还包括:
机器学习模型识别单元,用于通过邮件归档机器学习模型识别并提取所述待归档邮件中邮件正文部分的结论信息,其中,所述邮件归档机器学习模型是将预设历史往来邮件进行数据预处理后作为样本数据对GPT自然语言处理模型进行训练后得到的。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至4任一项所述的邮件归档处理方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至4任一项所述的邮件归档处理方法的步骤。
CN202110359705.2A 2021-04-02 2021-04-02 邮件归档处理方法及装置 Pending CN113055278A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110359705.2A CN113055278A (zh) 2021-04-02 2021-04-02 邮件归档处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110359705.2A CN113055278A (zh) 2021-04-02 2021-04-02 邮件归档处理方法及装置

Publications (1)

Publication Number Publication Date
CN113055278A true CN113055278A (zh) 2021-06-29

Family

ID=76517655

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110359705.2A Pending CN113055278A (zh) 2021-04-02 2021-04-02 邮件归档处理方法及装置

Country Status (1)

Country Link
CN (1) CN113055278A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11710000B1 (en) 2022-06-13 2023-07-25 Capital One Services, Llc Email rewrite and reorganization
CN117240819A (zh) * 2023-11-10 2023-12-15 天津异乡好居网络科技股份有限公司 邮件配置方法、装置、设备及计算机可读存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070584A1 (en) * 2008-09-12 2010-03-18 International Business Machines Corporation Method and system for dynamic e-mail view conversion
JP2010134732A (ja) * 2008-12-05 2010-06-17 Yaskawa Information Systems Co Ltd メールアーカイブサーバ
US20110119593A1 (en) * 2009-11-16 2011-05-19 Xobni Corporation Collecting and presenting data including links from communications sent to or from a user
CN104240066A (zh) * 2013-06-18 2014-12-24 腾讯科技(深圳)有限公司 一种电子邮件的会话展示方法和装置
CN106936695A (zh) * 2017-03-14 2017-07-07 维沃移动通信有限公司 一种邮件归档方法及移动终端
CN109144632A (zh) * 2018-07-19 2019-01-04 平安科技(深圳)有限公司 一种处理邮件的方法、装置、存储介质及电子设备
CN109960790A (zh) * 2017-12-25 2019-07-02 北京国双科技有限公司 摘要生成方法及装置
US20200210463A1 (en) * 2018-12-26 2020-07-02 Citrix Systems, Inc. Enhance a mail application to format a long email conversation for easy consumption

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100070584A1 (en) * 2008-09-12 2010-03-18 International Business Machines Corporation Method and system for dynamic e-mail view conversion
JP2010134732A (ja) * 2008-12-05 2010-06-17 Yaskawa Information Systems Co Ltd メールアーカイブサーバ
US20110119593A1 (en) * 2009-11-16 2011-05-19 Xobni Corporation Collecting and presenting data including links from communications sent to or from a user
CN104240066A (zh) * 2013-06-18 2014-12-24 腾讯科技(深圳)有限公司 一种电子邮件的会话展示方法和装置
CN106936695A (zh) * 2017-03-14 2017-07-07 维沃移动通信有限公司 一种邮件归档方法及移动终端
CN109960790A (zh) * 2017-12-25 2019-07-02 北京国双科技有限公司 摘要生成方法及装置
CN109144632A (zh) * 2018-07-19 2019-01-04 平安科技(深圳)有限公司 一种处理邮件的方法、装置、存储介质及电子设备
US20200210463A1 (en) * 2018-12-26 2020-07-02 Citrix Systems, Inc. Enhance a mail application to format a long email conversation for easy consumption

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11710000B1 (en) 2022-06-13 2023-07-25 Capital One Services, Llc Email rewrite and reorganization
CN117240819A (zh) * 2023-11-10 2023-12-15 天津异乡好居网络科技股份有限公司 邮件配置方法、装置、设备及计算机可读存储介质
CN117240819B (zh) * 2023-11-10 2024-02-09 天津异乡好居网络科技股份有限公司 邮件配置方法、装置、设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108920675B (zh) 一种信息处理的方法、装置、计算机存储介质及终端
CN107153965A (zh) 一种多终端的智能客服解决方法
US20230245073A1 (en) Mobile secretary cloud application
US20120330662A1 (en) Input supporting system, method and program
CN107832291B (zh) 人机协作的客服方法、电子装置及存储介质
CN110956956A (zh) 基于策略规则的语音识别方法及装置
CN113657113B (zh) 文本处理方法、装置和电子设备
US20220038569A1 (en) Mobile secretary cloud application
CN104158945A (zh) 通话信息获取方法、装置及系统
CN103179245B (zh) 来电电话号码辨识系统和方法
CN113055278A (zh) 邮件归档处理方法及装置
CN110516057B (zh) 一种信访问题答复方法及装置
US20200184018A1 (en) Electronic communication system with drafting assistant and method of using same
US20150278248A1 (en) Personal Information Management Service System
CN111063355A (zh) 会议记录的生成方法及记录终端
CN113741860A (zh) 基于rpa机器人的数据处理方法及装置
CN117951547B (zh) 基于人工智能的招投标数据处理方法及装置
CN114631094A (zh) 智能电子邮件标题行建议和重制
CN115099239A (zh) 一种资源识别方法、装置、设备以及存储介质
CN112579773A (zh) 风险事件分级方法及装置
CN110011898A (zh) 电子邮件的回复方法、装置、存储介质及计算机设备
CN113076417A (zh) 政策文件数据处理方法及装置
WO2020095776A1 (ja) 知識情報作成支援装置
CN110597765A (zh) 一种大零售呼叫中心异构数据源数据处理方法及装置
CN116166858A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20210629

RJ01 Rejection of invention patent application after publication