CN110837553A - 搜索邮件的方法及相关产品 - Google Patents

搜索邮件的方法及相关产品 Download PDF

Info

Publication number
CN110837553A
CN110837553A CN201910967382.8A CN201910967382A CN110837553A CN 110837553 A CN110837553 A CN 110837553A CN 201910967382 A CN201910967382 A CN 201910967382A CN 110837553 A CN110837553 A CN 110837553A
Authority
CN
China
Prior art keywords
mail
target
mails
search keyword
keyword group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910967382.8A
Other languages
English (en)
Other versions
CN110837553B (zh
Inventor
任熊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Property and Casualty Insurance Company of China Ltd
Original Assignee
Ping An Property and Casualty Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Property and Casualty Insurance Company of China Ltd filed Critical Ping An Property and Casualty Insurance Company of China Ltd
Priority to CN201910967382.8A priority Critical patent/CN110837553B/zh
Publication of CN110837553A publication Critical patent/CN110837553A/zh
Application granted granted Critical
Publication of CN110837553B publication Critical patent/CN110837553B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本申请公开了一种搜索邮件的方法及相关产品,所述方法包括如下步骤:接收携带目标信息的搜索指令;根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签,所述邮件标签与邮件存在关联或映射关系;根据所述第一搜索关键词组从邮件库中筛选出目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;获取所述目标邮件的数量;当所述目标邮件的数量超过预设阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;预设的位置按照上述排列顺序显示所述目标邮件。本发明提出的搜索邮件的方法,可根据用户自定义的邮件标签搜索邮件,提高了搜索的灵活性,提升用户体验。

Description

搜索邮件的方法及相关产品
技术领域
本申请涉及数据处理技术领域,具体涉及一种搜索邮件的方法及相关产品。
背景技术
当今,电子邮件已经成为人们日常工作和生活中广泛应用的通信工具。为便于用户从邮箱中大量的邮件中查阅所需的邮件,一些邮箱服务提供商为用户提供了邮件全文搜索功能,使得用户可以通过搜索关键字进行邮件搜索。而且,邮件全文搜索功能不仅支持收/发件人的邮件地址、邮件标题的搜索,还支持邮件正文等的搜索。
目前,对于邮件的搜索为通过关键字进行搜索,有的邮件含有关键字却不是用户想要搜索的邮件,造成搜索匹配度和搜索效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高搜索匹配度的搜索邮件的方法及相关产品。
本申请实施例的第一方面提供了一种搜索邮件的方法,所述方法包括:
接收携带目标信息的搜索指令;
根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签,所述邮件标签与邮件存在关联或映射关系;
根据所述第一搜索关键词组从邮件库中筛选出目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;
获取所述目标邮件的数量;
当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
预设的位置按照上述排列顺序显示所述目标邮件。
本申请实施例的第二方面提供了一种搜索邮件的装置,所述装置包括:
接收单元,接收用户从终端输入的带有目标信息的搜索指令;
分析单元,根据目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组;
筛选单元,根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;
排序单元,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
显示单元,在预设的位置按照所述排列顺序显示所述目标邮件。
本申请实施例的第三方面提供一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如本申请实施例第一方面中的步骤指令。
本申请实施例的第四方面提供了一种计算机可读存储介质,其中,上述计算机可读存储介质存储用于电子数据交换的计算机程序,其中,上述计算机程序使得计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。
本申请实施例的第五方面提供了一种计算机程序产品,其中,上述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,上述计算机程序可操作来使计算机执行如本申请实施例第一方面中所描述的部分或全部步骤。该计算机程序产品可以为一个软件安装包。
实施本申请实施例,至少具有如下有益效果:
通过本申请实施例,接收携带目标信息的搜索指令;根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组;根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;获取所述目标邮件的数量;当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;预设的位置按照上述排列顺序显示所述目标邮件,因此相对于现有方案采用的关键词搜索,本发明将结合关键词和邮件标签对邮件进行搜索先从所有邮件中通过邮件标签筛选出目标邮件,再利用关键词对目标邮件进行排序,能够减少关键词排序的工作量从而提升搜索的的效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供了一种搜索邮件方法的运用界面示意图;
图2为本发明实施例提供的一种搜索邮件方法的流程示意图;
图3为本发明实施例提供的又一种搜索邮件方法的流程示意图;
图4为本发明实施例提供的再一种搜索邮件方法的流程示意图;
图5为本申请实施例提供了一种终端的结构示意图;
图6为本申请实施例提供了一种搜索邮件的装置的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本申请中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本申请所描述的实施例可以与其它实施例相结合。
本申请实施例所涉及到的电子装置可以包括各种具有无线通信功能的手持设备、车载设备、可穿戴设备、计算设备或连接到无线调制解调器的其他处理设备,以及各种形式的用户设备(user equipment,UE),移动台(mobile station,MS),终端设备(terminaldevice)等等。为方便描述,上面提到的设备统称为电子装置。
为了更好的理解本申请实施例,下面首先对本申请实施例提供的一种搜索邮件方法进行简要介绍。请参阅图1,图1为本申请实施例提供了一种搜索邮件方法的运用界面示意图。所述运用界面包括目标信息输入框101,其中:
用户在目标信息输入框101中输入目标信息,点击确认后,上述装置接收携带目标信息的搜索指令。
下面将结合本发明的附图,对本发明实施例中的技术方案进行详细描述。
请参阅图2,图2为本申请实施例提供了一种搜索邮件方法的流程示意图。如图2所示,上述方法包括步骤201-206,具体如下:
201、终端接收携带目标信息的搜索指令。
其中,上述目标信息由用户在搜索框中输入,例如,用户输入的为目标信息可以为“预收的50万建设工程款”。
其中,上述搜索指令的生成方式可以是在输入目标信息后点击确认按钮,还可以是输入目标信息后点击回车。
202、终端根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签,所述邮件标签与邮件存在关联或映射关系。
具体的,上述搜索关键词组包括一个或多个词汇,上述第一搜索关键词组包括一个或多个词汇,上述第二搜索关键词组包括一个或多个词汇。
可选的,一种可能的根据所述目标信息获取搜索关键词组的方法包括步骤A1-A5,具体如下:
A1、结合邮件标签词汇库和自然语言词汇库对所述目标信息进行分词处理,得到所述分词词组,所述分词词组包括一个或多个词汇;
其中,举例来说,邮件标签词汇库包括以下多项:张三、王五、建设工程款、物料款、预收款、滞纳金、确认。上述目标信息进行分词处理,其中,分词处理方法可以应用本领域公开的各种方法,且分词处理时结合邮件标签词汇库赫自然语言词汇库,对所述目标信息进行分词处理。对“预收的50万建设工程款”结合邮件标签词汇库进行分词后,结果为“建设工程款”、“预收”、“50万”、“的”,而不是“预收”、“50万”、“建设”、“工程款”、“的”。
A2、从所述邮件标签词汇库筛选出与分词词组中词汇匹配的邮件标签作为所述第一搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签;
其中,举例来说,邮件标签词汇库包括以下多项:张三、王五、建设工程款、物料款、预收款、滞纳金、确认,分词词组为“建设工程款”、“预收”、“50万”、“的”。故上述第一搜索关键词组为“建设工程款”。
A3、从基于预先构建的停用词表,从上述分词词组中筛选出停用词并去除;
其中,举例来说,上述停用词是对语句无意义的词,比如“啊”、“吧”、“哦”、“嗯”、“了”、“么”、“的”、“啦”等词。示例性的,上述分词词组去除停用词后为“建设工程款”、“预收”、“50万”。
A4、从去除停用词后的上述分词词组中去除所述第一搜索关键词组,得到所述第二搜索关键词组。
其中,举例来说,再从去除停用词后的词中去除上述第一搜索关键词以得到上述待识别词汇,故上述待识别词汇为“预收”、“50万”。
其中,邮件标签词汇库存储用户录入的邮件标签,所述邮件标签与邮件之前存在映射或关联关系。
203、终端根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签包括所述第一搜索关键词组的邮件。
其中,上述邮件标签库中存储所有的收发邮件。
其中,举例来说,上述第一搜索关键词为“建设工程款”,从邮件标签库中筛选出邮件标签为“建设工程款”的邮件。
204、终端获取所述目标邮件的数量。
其中,举例来说,上述邮件标签为“建设工程款”的邮件的数量为M,M为自然数。
205、当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序。
其中,阈值为N,N为自然数,N可以由用户自定义,也可以由装置设置。
可选的,一种可能的根据所述第二搜索关键词组调整所述目标邮件的排列顺序的方法包括步骤B1-B2,具体如下:
B1、获取所述目标邮件中所述第二搜索关键词组的数量;
其中,将所述第二搜索关键词组和所述目标邮件输入预设的神经网络模型中,以计算所述目标邮件中所述第二搜索关键词组的数量。该神经网络模型为预先训练好的模型,用于计算所述第二搜索关键词组和所述目标邮件的匹配度。该模型包括但不限于卷积神经网络模型、循环神经网络模型、深度神经网络模型、前馈神经网络模型、深度信念网络模型、生成式对抗网络模型以及其他深度学习模型等。
可理解地,为保证模型精确度,需多次、反复地进行模型训练。且,每次模型训练中需占用大量的计算资源。为节省计算设备的资源开销,将模型训练放在云端实现。下面以云端服务器训练初始模型为例阐述如何训练获得神经网络模型。
具体的,云端服务器可获取多组训练样本。每组训练样本中都包括标签和邮件。接着,云端服务器可利用多组训练样本对待训练的初始模型进行一次或多次训练,从而获得训练好的神经网络模型。具体的,计算设备可每组训练样本输入初始模型中计算该训练样本对应的计算结果(即邮件和第二搜索关键词的匹配度),然后将该训练样本对应的预期结果和计算结果进行对比,得到该训练样本对应的偏差。接着,根据该训练样本的偏差对初始模型进行反向传播(即对初始模型中的每个网络层的权值(当网络层中还包括偏置时,还可包括偏置)进行调整),以获得训练好的神经网络模型。
可选地,在云端服务器获得训练好的神经网络模型后,可将其缓存在云端服务器中。计算设备根据实际需求可从云端服务器中获取该神经网络模型,将其部署在计算设备本地。
B2、根据所述数量调整所述目标邮件的排列顺序;。
其中,将按照上述数量的大小对所述目标邮件进行排序。
举例来说,上述第二搜索关键词组为“预收”、“50万”上述目标邮件中第二搜索关键词组的数量由表1所示。
表1
Figure BDA0002230919050000061
具体的,排序根据总次数(即,邮件中出现预收的次数与出现50万的次数的和)对目标邮件排序,上述目标邮件排序由表2所示。
表2
Figure BDA0002230919050000071
206、预设的位置按照上述排列顺序显示所述目标邮件。
其中,具体的,上述预设的位置可能是目标信息输入框的下方、左方、右方、上方。
本示例中,终端接收携带目标信息的搜索指令,根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件,获取所述目标邮件的数量,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序,预设的位置按照上述排列顺序显示所述目标邮件。因此,相对于现有方案中采用关键词对邮件进行搜索的方式,本发明将结合关键词和邮件标签对邮件进行搜索先从所有邮件中通过邮件标签筛选出目标邮件,再利用关键词对目标邮件进行排序,能够减少关键词排序的工作量从而提升搜索的的效率。
请参阅图3,图3为本申请实施例提供了又一种搜索邮件方法的流程示意图。如图3所示,上述方法包括步骤301-308,具体如下:
301、终端接收携带目标信息的搜索指令。
302、终端述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签,所述邮件标签与邮件存在关联或映射关系。
303、终端根据所述第一搜索关键词组从邮件库中筛选出目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件。
304、终端获取所述目标邮件的数量。
305、当所述目标邮件的数量小于预设阈值且上述第一搜索关键词组中词汇数量大于1时,按照预设的规则从上述第一搜索关键词组中筛选出第三搜索关键词组。
具体的,上述阈值为N,N为自然数,N可以由用户自定义,也可以由系统默认设置。
可选的,一种按照预设的规则从上述第一搜索关键词组中选取第三搜索关键词组的方法包括步骤C1-C2,具体如下:
C1、终端获取上述第一搜索关键词组中邮件标签的数量;
其中,举例来说,上述第一搜索关键词组中的邮件标签包括以下多项:建设工程款、物料款、确认、张三。故上述第一搜索关键词组中邮件标签的数量为4。
C2、终端根据预设的邮件标签权重列表和邮件标签的数量从上述所述第一搜索关键词组中筛选出所述第三搜索关键词组
其中,举例来说,上述邮件标签权重列表如下表3所示。
表3
Figure BDA0002230919050000081
其中,举例来说,终端从第一搜索关键词组中去除权重最小的邮件标签(即,物料款)后得到上述第三搜索关键词(即,建设工程款、确认、张三)。
306、终端根据所述第三搜索关键词组从邮件库中筛选第二目标邮件,所述第二目标邮件为邮件标签为所述第三搜索关键词组的邮件。
307、终端获取上述第二目标邮件的数量。
308、当所述第二目标邮件的数量超过阈值时,在终端的预设的位置按照预设的排序方式显示所述目标邮件和所述第二目标邮件。
其中,上述终端根据上述第二搜索关键词对上述第二目标邮件排序,将上述第二搜索关键词和上述第二目标邮件输入预设的神经网络模型中,以计算上述第二目标邮件中上述第二搜索关键词的匹配度,按照上述匹配度的大小对上述第二目标邮件进行排序。
其中,上述神经网络模型为预先训练好的模型,用于计算目标标签和邮件的匹配度。该模型包括但不限于卷积神经网络模型、循环神经网络模型、深度神经网络模型、前馈神经网络模型、深度信念网络模型、生成式对抗网络模型以及其他深度学习模型等。
可理解地,为保证模型精确度,需多次、反复地进行模型训练。且,每次模型训练中需占用大量的计算资源。为节省计算设备的资源开销,将模型训练放在云端实现。下面以云端服务器训练初始模型为例阐述如何训练获得神经网络模型。
具体的,云端服务器可获取多组训练样本。每组训练样本中都包括标签和邮件。接着,云端服务器可利用多组训练样本对待训练的初始模型进行一次或多次训练,从而获得训练好的神经网络模型。具体的,计算设备可每组训练样本输入初始模型中计算该训练样本对应的计算结果(即邮件和搜索关键词的匹配度),然后将该训练样本对应的预期结果和计算结果进行对比,得到该训练样本对应的偏差。接着,根据该训练样本的偏差对初始模型进行反向传播(即对初始模型中的每个网络层的权值(当网络层中还包括偏置时,还可包括偏置)进行调整),以获得训练好的神经网络模型。
可选地,在云端服务器获得训练好的神经网络模型后,可将其缓存在云端服务器中。计算设备根据实际需求可从云端服务器中获取该神经网络模型,将其部署在计算设备本地。
本示例中,当目标邮件数量小于预设阈值时,根据上述第三关键词获取第二目标邮件,能够在用户输入的目标信息过多导致筛选出符合条件的目标邮件过少的时,由于目标邮件数量过少,可以通过减少一个或多个用于搜索的邮件标签来提高查找邮件的效率。
请参阅图4,图4为本申请实施例提供了再一种搜索邮件方法的流程示意图。如图4所示,上述方法包括步骤401-407具体如下:
401、终端对邮件添加邮件标签。
其中,终端对邮件添加标签的方式可以是将用户录入的邮件标签添加到对应的邮件上,也可以是终端自动的从邮件标签词汇库中筛选邮件标签向第三目标的邮件添加。
其中,上述预设条件为:邮件对应的邮件标签的数量小于阈值,举例来说,终端向没有邮件标签的邮件添加邮件标签。
其中,上述向邮件添加的邮件标签从邮件标签库中筛选得到,上述邮件标签库中存储所有用户录入的邮件标签。
其中,上述第三目标邮件是邮件对应的邮件标签数量满足预设条件的邮件,例如,上述第三目标邮件是没有邮件标签的邮件。
可选的,一种从邮件标签词汇库中筛选邮件标签的方法包括步骤D1-D5,具体如下:
D1、从邮件库中筛选第三目标邮件,所述第三目标邮件为邮件的邮件标签数量满足预设条件的邮件;
D2、通过分词器提取所述第三目标邮件的关键词;
具体的,从数据库中提取对应的邮件标签符合预设条件的邮件,通过分词器提取对应的邮件标签符合预设条件的邮件的关键词。
D3、将所述关键词输入到机器学习模型中获取重复率达到预设阈值的关键词作为样本关键词;
具体的,将上述关键词输入到机器学习模型中获取重复率达到预设阈值的词汇作为样本关键词,其中,可以理解的是,所述样本关键词可以为一个也可以为多个。
D4、从邮件标签词汇库中筛选与所述样本关键词相似度大于阈值的邮件标签;
D5、从所述相似度大于阈值的邮件标签中筛选符合条件的邮件标签向所述第三目标邮件添加。
具体的,将上述相似度大于阈值的邮件标签和所述第三目标邮件输入到预设的神经网络模型中获取邮件标签与邮件的匹配度。当上述匹配度大于阈值的邮件标签向所述第三目标邮件添加。
具体的,上述神经网络模型为预先训练好的模型,用于计算邮件标签和邮件的匹配度。该模型包括但不限于卷积神经网络模型、循环神经网络模型、深度神经网络模型、前馈神经网络模型、深度信念网络模型、生成式对抗网络模型以及其他深度学习模型等。
可理解地,为保证模型精确度,需多次、反复地进行模型训练。且,每次模型训练中需占用大量的计算资源。为节省计算设备的资源开销,将模型训练放在云端实现。下面以云端服务器训练初始模型为例阐述如何训练获得神经网络模型。
具体的,云端服务器可获取多组训练样本。每组训练样本中都包括标签和邮件。接着,云端服务器可利用多组训练样本对待训练的初始模型进行一次或多次训练,从而获得训练好的神经网络模型。具体的,计算设备可每组训练样本输入初始模型中计算该训练样本对应的计算结果(即邮件标签和样本标签的匹配度),然后将该训练样本对应的预期结果和计算结果进行对比,得到该训练样本对应的偏差。接着,根据该训练样本的偏差对初始模型进行反向传播(即对初始模型中的每个网络层的权值(当网络层中还包括偏置时,还可包括偏置)进行调整),以获得训练好的神经网络模型。
可选地,在云端服务器获得训练好的神经网络模型后,可将其缓存在云端服务器中。计算设备根据实际需求可从云端服务器中获取该神经网络模型,将其部署在计算设备本地。
402、终端接收携带目标信息的搜索指令。
403、终端根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组。
404、终端根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件。
405、终端获取所述目标邮件的数量。
406、终端当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序。
407、终端预设的位置按照上述排列顺序显示所述目标邮件。
本示例中,终端对邮件添加邮件标签,向接收携带目标信息的搜索指令,根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件,获取所述目标邮件的数量,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序,预设的位置按照上述排列顺序显示所述目标邮件。因此,相对于现有方案中采用关键词对邮件进行搜索的方式,采用邮件标签结合关键词对邮件进行搜索排序,能够一定程度上提升对邮件搜索的准确性以及效率。
与上述实施例一致的,请参阅图5,图5本申请实施例提供的一种终端的结构示意图,如图所示,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,上述程序包括用于执行以下步骤的指令;
接收携带目标信息的搜索指令;
根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组;
根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签包括所述第一搜索关键词组的邮件;
获取所述目标邮件的数量;
当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
预设的位置按照上述排列顺序显示所述目标邮件。
本示例中,接收携带目标信息的搜索指令,根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件,获取所述目标邮件的数量,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序,预设的位置按照上述排列顺序显示所述目标邮件。因此,相对于现有方案中采用关键词对邮件进行搜索的方式,采用邮件标签结合关键词对邮件进行搜索排序,能够一定程度上提升对邮件搜索的准确性以及效率。
上述主要从方法侧执行过程的角度对本申请实施例的方案进行了介绍。可以理解的是,终端为了实现上述功能,其包含了执行各个功能相应的硬件结构和/或软件模块。本领域技术人员应该很容易意识到,结合本文中所提供的实施例描述的各示例的单元及算法步骤,本申请能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例可以根据上述方法示例对终端进行功能单元的划分,例如,可以对应各个功能划分各个功能单元,也可以将两个或两个以上的功能集成在一个处理单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。需要说明的是,本申请实施例中对单元的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
与上述一致的,请参阅图6,图6为本申请实施例提供了一种搜索邮件的装置的结构示意图,所述装置包括接收单元501、分析单元502、筛选单元503、排序单元504和显示单元505,其中,
接收单元501,用于接收用户从终端输入的带有目标信息的搜索指令;
分析单元502,用于根据目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组;
筛选单元503,用于根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;
排序单元504,用于当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
显示单元505,在预设的位置按照所述排列顺序显示所述目标邮件。
本示例中,接收携带目标信息的搜索指令,根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件,获取所述目标邮件的数量,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序,预设的位置按照上述排列顺序显示所述目标邮件。因此,相对于现有方案中采用关键词对邮件进行搜索的方式,采用邮件标签结合关键词对邮件进行搜索排序,能够一定程度上提升对邮件搜索的准确性以及效率。
可选的,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,根据目标信息获取搜索关键词组方面,所述分析单元502具体用于:
结合邮件标签词汇库和自然语言词汇库对所述目标信息进行分词处理,得到所述分词词组,所述分词词组包括一个或多个词汇;
从所述邮件标签词汇库筛选出与分词词组中词汇匹配的邮件标签作为所述第一搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签;
从基于预先构建的停用词表,从分词词组中筛选出停用词并去除;
从去除停用词后的分词词组中去除所述第一搜索关键词组,得到待识别词汇;
对所述待识别词汇进行语义分析,得到所述第二搜索关键词组;
其中,邮件标签词汇库存储用户录入的邮件标签,所述邮件标签与邮件之前存在映射或关联关系。
可选的,当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序方面,所述排序单元504具体用于:
获取所述目标邮件与所述第二搜索关键词组的匹配度;
根据所述匹配度调整所述目标邮件的排列顺序。
可选的,当所述目标邮件的数量小于阈值时,根据上述第三搜索关键词组从邮件库中筛选邮件方面,所述筛选单元503具体用于:
当所述目标邮件的数量不超过阈值时,获取所述第一搜索关键词组中词汇的数量;
当所述数量大于1时,按照预设的规则从所述第一搜索关键词组中筛选出第三搜索关键词组;
根据所述第三搜索关键词组从邮件库中筛选第二目标邮件,所述第二目标邮件为邮件标签为所述第三搜索关键词组的邮件;
获取上述第二目标邮件的数量;
当所述第二目标邮件的数量超过阈值时,预设的位置按照预设的排序方式显示所述目标邮件和所述第二目标邮件。
本申请实施例还提供一种计算机存储介质,其中,该计算机存储介质存储用于电子数据交换的计算机程序,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种的搜索邮件方法的部分或全部步骤。
本申请实施例还提供一种计算机程序产品,所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质,该计算机程序使得计算机执行如上述方法实施例中记载的任何一种搜索邮件方法的部分或全部步骤。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在申请明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件程序模块的形式实现。
所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(read-only memory,ROM)、随机存取存储器(random access memory,RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器、随机存取器、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。

Claims (10)

1.一种搜索邮件的方法,其特征在于,所述方法包括如下步骤:
接收携带目标信息的搜索指令;
根据所述目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签,所述邮件标签与邮件存在关联或映射关系;
根据所述第一搜索关键词组从邮件库中筛选出目标邮件,所述目标邮件为邮件标签包括所述第一搜索关键词组的邮件;
获取所述目标邮件的数量;
当所述目标邮件的数量超过预设阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
在预设的位置按照所述排列顺序显示所述目标邮件。
2.根据权利要求1所述的搜索邮件的方法,其特征在于,所述根据所述目标信息获取搜索关键词组,包括:
结合邮件标签词汇库和自然语言词汇库对所述目标信息进行分词处理,得到分词词组,所述分词词组包括一个或多个词汇;
从所述邮件标签词汇库筛选出与所述分词词组中词汇匹配的邮件标签作为所述第一搜索关键词组,所述第一搜索关键词组包括一个或多个邮件标签;
从基于预先构建的停用词表,从所述分词词组中筛选出停用词并去除;
从去除停用词后的分词词组中去除所述第一搜索关键词组,得到所述第二搜索关键词组;
其中,邮件标签词汇库存储用户录入的邮件标签。
3.根据权利要求1所述的搜索邮件的方法,其特征在于,所述根据所述述第二搜索关键词组调整所述目标邮件的排列顺序,包括:
获取所述目标邮件中所述第二搜索关键词组的数量;
根据所述数量调整所述目标邮件的排列顺序。
4.根据权利要求1所述的搜索邮件的方法,其特征在于,所述方法还包括:
当所述目标邮件的数量不超过阈值时,获取所述第一搜索关键词组中词汇的数量;
当所述数量大于1时,按照预设的规则从所述第一搜索关键词组中筛选出第三搜索关键词组;
根据所述第三搜索关键词组从邮件库中筛选第二目标邮件,所述第二目标邮件为邮件标签为所述第三搜索关键词组的邮件;
获取上述第二目标邮件的数量;
当所述第二目标邮件的数量超过阈值时,预设的位置按照预设的排序方式显示所述目标邮件和所述第二目标邮件。
5.根据权利要求4所述的搜索邮件的方法,其特征在于,所述按照预设的规则从所述第一搜索关键词组中筛选出第三搜索关键词组,包括:
获取所述第一搜索关键词组中邮件标签的数量;
根据预设的邮件标签权重列表和邮件标签的数量从所述第一搜索关键词组中筛选出所述第三搜索关键词组;
其中,所述预设的邮件标签权重列表存储邮件标签对应的权重。
6.根据权利要求1所述的搜索邮件的方法,其特征在于,所述邮件标签由用户向所述邮件添加;
或,在邮件对应的邮件标签数量满足预设条件时,自动的向所述邮件标签数量满足预设条件的邮件添加邮件标签。
7.根据权利要求6所述的搜索邮件的方法,其特征在于,所述在邮件对应的邮件标签数量满足预设条件时,自动的向所述邮件添加邮件标签,包括:
从邮件库中筛选第三目标邮件,所述第三目标邮件为邮件的邮件标签数量满足预设条件的邮件;
通过分词器提取所述第三目标邮件的关键词;
将所述关键词输入到机器学习模型中获取重复率达到预设阈值的关键词作为样本关键词;
从邮件标签词汇库中获取与所述样本关键词相似度大于阈值的邮件标签;
从所述相似度大于阈值的邮件标签中筛选符合条件的邮件标签向所述第三目标邮件添加。
8.一种搜索邮件的装置,其特征在于,所述装置包括:
接收单元,用于接收用户从终端输入的带有目标信息的搜索指令;
分析单元,用于根据目标信息获取搜索关键词组,所述搜索关键词组包括第一搜索关键词组和第二搜索关键词组;
筛选单元,用于根据所述第一搜索关键词组从邮件库中筛选目标邮件,所述目标邮件为邮件标签为所述第一搜索关键词组的邮件;
排序单元,用于当所述目标邮件的数量超过阈值时,根据所述第二搜索关键词组调整所述目标邮件的排列顺序;
显示单元,在预设的位置按照所述排列顺序显示所述目标邮件。
9.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN201910967382.8A 2019-10-12 2019-10-12 搜索邮件的方法及相关产品 Active CN110837553B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910967382.8A CN110837553B (zh) 2019-10-12 2019-10-12 搜索邮件的方法及相关产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910967382.8A CN110837553B (zh) 2019-10-12 2019-10-12 搜索邮件的方法及相关产品

Publications (2)

Publication Number Publication Date
CN110837553A true CN110837553A (zh) 2020-02-25
CN110837553B CN110837553B (zh) 2023-08-22

Family

ID=69575234

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910967382.8A Active CN110837553B (zh) 2019-10-12 2019-10-12 搜索邮件的方法及相关产品

Country Status (1)

Country Link
CN (1) CN110837553B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343070A (zh) * 2021-04-14 2021-09-03 统信软件技术有限公司 一种邮件搜索方法及计算设备
US11710000B1 (en) 2022-06-13 2023-07-25 Capital One Services, Llc Email rewrite and reorganization

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090100052A1 (en) * 2007-10-16 2009-04-16 Stern Edith H Enabling collaborative networks
KR20130080216A (ko) * 2012-01-04 2013-07-12 주식회사 인프라웨어 키워드의 시기별 빈도를 고려한 이메일 검색 방법, 그리고 키워드의 시기별 빈도를 고려한 이메일 검색 프로그램을 기록한 컴퓨터로 판독가능한 기록매체
US20160267182A1 (en) * 2015-03-13 2016-09-15 Naver Corporation Mail service system and method for effective mail search
CN110268431A (zh) * 2017-02-10 2019-09-20 微软技术许可有限责任公司 对消息内容的搜索和过滤

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090100052A1 (en) * 2007-10-16 2009-04-16 Stern Edith H Enabling collaborative networks
KR20130080216A (ko) * 2012-01-04 2013-07-12 주식회사 인프라웨어 키워드의 시기별 빈도를 고려한 이메일 검색 방법, 그리고 키워드의 시기별 빈도를 고려한 이메일 검색 프로그램을 기록한 컴퓨터로 판독가능한 기록매체
US20160267182A1 (en) * 2015-03-13 2016-09-15 Naver Corporation Mail service system and method for effective mail search
CN110268431A (zh) * 2017-02-10 2019-09-20 微软技术许可有限责任公司 对消息内容的搜索和过滤

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113343070A (zh) * 2021-04-14 2021-09-03 统信软件技术有限公司 一种邮件搜索方法及计算设备
US11710000B1 (en) 2022-06-13 2023-07-25 Capital One Services, Llc Email rewrite and reorganization

Also Published As

Publication number Publication date
CN110837553B (zh) 2023-08-22

Similar Documents

Publication Publication Date Title
CN107609121B (zh) 基于LDA和word2vec算法的新闻文本分类方法
CN108804512B (zh) 文本分类模型的生成装置、方法及计算机可读存储介质
CN107204184B (zh) 语音识别方法及系统
CN105912716B (zh) 一种短文本分类方法及装置
CN107862022B (zh) 文化资源推荐系统
CN107784092A (zh) 一种推荐热词的方法、服务器及计算机可读介质
CN108446388A (zh) 文本数据质检方法、装置、设备及计算机可读存储介质
CN109948121A (zh) 文章相似度挖掘方法、系统、设备及存储介质
CN105630767B (zh) 一种文本相似性的比较方法以及装置
CN110134792B (zh) 文本识别方法、装置、电子设备以及存储介质
US20140280242A1 (en) Method and apparatus for acquiring hot topics
CN111104526A (zh) 一种基于关键词语义的金融标签提取方法及系统
CN109582852B (zh) 一种全文检索结果的排序方法及系统
CN110147425A (zh) 一种关键词提取方法、装置、计算机设备及存储介质
CN108334610A (zh) 一种新闻文本分类方法、装置及服务器
CN104361037B (zh) 微博分类方法及装置
CN106708940A (zh) 用于处理图片的方法和装置
CN104778283B (zh) 一种基于微博的用户职业分类方法及系统
CN109885688A (zh) 文本分类方法、装置、计算机可读存储介质和电子设备
CN106897290B (zh) 一种建立关键词模型的方法及装置
CN106570170A (zh) 基于深度循环神经网络的文本分类和命名实体识别一体化方法及系统
CN107885783A (zh) 获取搜索词高相关分类的方法和装置
CN113722438A (zh) 基于句向量模型的句向量生成方法、装置及计算机设备
CN110837553B (zh) 搜索邮件的方法及相关产品
CN108595411B (zh) 一种同主题文本集合中多文本摘要获取方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant