CN112818109A - 邮件的智能回复方法、介质、装置和计算设备 - Google Patents

邮件的智能回复方法、介质、装置和计算设备 Download PDF

Info

Publication number
CN112818109A
CN112818109A CN202110213712.1A CN202110213712A CN112818109A CN 112818109 A CN112818109 A CN 112818109A CN 202110213712 A CN202110213712 A CN 202110213712A CN 112818109 A CN112818109 A CN 112818109A
Authority
CN
China
Prior art keywords
reply
intention
mail
content
sentences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110213712.1A
Other languages
English (en)
Other versions
CN112818109B (zh
Inventor
沙雨辰
胡光龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Netease Hangzhou Network Co Ltd
Original Assignee
Netease Hangzhou Network Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Netease Hangzhou Network Co Ltd filed Critical Netease Hangzhou Network Co Ltd
Priority to CN202110213712.1A priority Critical patent/CN112818109B/zh
Publication of CN112818109A publication Critical patent/CN112818109A/zh
Application granted granted Critical
Publication of CN112818109B publication Critical patent/CN112818109B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/374Thesaurus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明的实施方式提供了一种邮件的智能回复方法、介质、装置和计算设备。该邮件的智能回复方法包括:获取当前接收到的电子邮件中的邮件内容;获取所述邮件内容中的规则关键字,并根据所述规则关键字确定所述电子邮件的规则回复语句;根据所述邮件内容确定所述电子邮件的意图类别,并根据所述意图类别确定所述电子邮件的多个意图回复语句;根据所述规则回复语句和所述意图回复语句得到多个候选回复语句;响应于针对所述候选回复语句的选择指令,按照相应被选择的候选回复语句对所述电子邮件进行回复。通过规则与意图结合的方式,本发明的方法能够提高邮件回复的效率和准确率,提高用户沟通效率。

Description

邮件的智能回复方法、介质、装置和计算设备
技术领域
本发明的实施方式涉及计算机技术领域,更具体地,本发明的实施方式涉及一种邮件的智能回复方法、介质、装置和计算设备。
背景技术
本部分旨在为权利要求书中陈述的本发明的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
电子邮件作为一种信息交换的通信方式,因为其延时互动、可回复、能存档的特点,电子邮件较多地在商业、工作、教育等正式场景中使用,是一种不可替代的通讯形式。邮件智能回复功能可以在用户收到邮件后迅速生成回复内容,减少用户的编辑时间,大大提高沟通效率。
目前,已经出现一些邮件智能回复的方法,主要是通过构建历史会话和回复之间的对应关系,或者预测会话内容的真实意图来得到回复内容。然而,这些方法中,人工构建对应关系的成本高、效率低,且用户意图的预测准确率也比较低,导致生成的回复内容质量较差,准确率较低,无法反应用户的真实意图。
发明内容
本发明的目的在于提供一种数据处理方法、介质、数据处理装置和计算设备,从而至少在一定程度上克服由于相关技术的缺陷和限制而导致的电子邮件的自动回复内容质量较差和准确率较低的技术问题。
在本发明实施方式的第一方面中,提供了一种邮件的智能回复方法,包括:
获取当前接收到的电子邮件中的邮件内容;
获取所述邮件内容中的规则关键字,并根据所述规则关键字确定所述电子邮件的规则回复语句;
根据所述邮件内容确定所述电子邮件的意图类别,并根据所述意图类别确定所述电子邮件的多个意图回复语句;
根据所述规则回复语句和所述意图回复语句得到多个候选回复语句;
响应于针对所述候选回复语句的选择指令,按照相应被选择的候选回复语句对所述电子邮件进行回复。
在本发明的一些实施例中,基于前述方案,所述根据所述邮件内容确定所述电子邮件的意图类别,包括:
将所述邮件内容输入预先训练的意图分类模型中,得到所述电子邮件所属的一个或多个意图类别,其中,所述邮件内容包括邮件主题和邮件正文。
在本发明的一些实施例中,基于前述方案,所述将所述邮件内容输入预先训练的意图分类模型中,得到所述电子邮件所属的一个或多个意图类别,包括:
将所述邮件主题输入所述意图分类模型中的第一卷积神经网络,得到所述邮件主题对应的第一意图特征向量;
将所述邮件正文输入所述意图分类模型中的第二卷积神经网络,得到所述邮件正文对应的第二意图特征向量,其中,所述第一卷积神经网络和所述第二卷积神经网络中的神经网络参数互不共享;
根据所述第一意图特征向量和所述第二意图特征向量得到融合意图特征向量,并根据所述融合意图特征向量确定所述电子邮件所属的一个或多个意图类别。
在本发明的一些实施例中,基于前述方案,所述意图分类模型的训练方法包括:
获取历史电子邮件的邮件内容和对应的回复文本内容,并对所述回复文本内容进行分词处理得到多个回复词组;
根据所述回复词组在所有所述回复文本内容中的出现频率得到候选回复话术;
根据相同语义的所述候选回复话术得到回复话术簇,根据各个所述回复话术簇分别构建对应的回复内容匹配规则,并确定各个所述回复话术簇对应的意图类别;
若所述历史电子邮件的回复文本内容与所述回复话术簇对应的回复内容匹配规则相匹配,则判定所述历史电子邮件的邮件内容属于所述回复话术簇对应的意图类别;
根据所述历史电子邮件的邮件内容以及所述邮件内容对应的一个或多个意图类别得到意图类别训练数据,并根据所述意图类别训练数据训练所述意图分类模型。
在本发明的一些实施例中,基于前述方案,所述对所述回复文本内容进行分词处理得到多个回复词组,包括:
对所述回复文本内容进行预处理,并对预处理后的所述回复文本内容进行分词处理得到多个回复词组。
在本发明的一些实施例中,基于前述方案,所述根据所述回复词组在所有所述回复文本内容中的出现频率得到候选回复话术,包括:
根据一元语法、二元语法和三元语法分别对所述回复词组进行组合,得到所述回复词组对应的一元话术、二元话术和三元话术;
分别统计所述一元话术、所述二元话术和所述三元话术在所有所述回复文本内容中的出现频率,并将出现频率大于或等于词频阈值的所述一元话术、所述二元话术和所述三元话术确定为候选回复话术。
在本发明的一些实施例中,基于前述方案,所述意图回复语句包括主意图回复语句和组合意图回复语句,所述意图类别分为寒暄类意图和目的类意图,所述根据所述意图类别确定所述电子邮件的多个意图回复语句,包括:
根据所述意图类别的置信度从各个所述意图类别中确定出目标意图类别,并从所述目标意图类别对应的回复话术簇中确定一个回复话术作为主意图回复语句;
从所述目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,并根据所述目标意图类别将所述主意图回复语句与所述辅助话术进行组合,得到多个组合意图回复语句。
在本发明的一些实施例中,基于前述方案,所述从所述目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,包括:
将所述目的类意图中的各个意图类别按照置信度由高到低进行排序;
将所述置信度排序第一的意图类别确定为第一意图类别,并从所述第一意图类别对应的回复话术簇中确定一个回复话术作为第一辅助话术;
将所述置信度排序第二的意图类别确定为第二意图类别,并从所述第二意图类别对应的回复话术簇中确定一个回复话术作为第二辅助话术;
将所述置信度排序第三的意图类别确定为第三意图类别,并从所述第三意图类别对应的回复话术簇中确定一个回复话术作为第三辅助话术。
在本发明的一些实施例中,基于前述方案,所述根据所述目标意图类别将所述主意图回复语句与所述辅助话术进行组合,得到多个组合意图回复语句,包括:
若所述目标意图类别为寒暄类意图,则将所述主意图回复语句与所述第一辅助话术进行组合得到第一组合意图回复语句,将所述第一辅助话术与所述第二辅助话术进行组合得到第二组合意图回复语句;
若所述目标意图类别为目的类意图,则将所述主意图回复语句与所述第二辅助话术进行组合得到第一组合意图回复语句,将所述主意图回复语句与所述第三辅助话术进行组合得到第二组合意图回复语句。
在本发明的一些实施例中,基于前述方案,在所述根据所述目标意图类别将所述主意图回复语句与所述辅助话术进行组合,得到多个组合意图回复语句之后,所述方法还包括:
获取语句平滑词典,并根据所述语句平滑词典对所述组合意图回复语句进行平滑处理,调整所述组合意图回复语句中各个词组之间的语序。
在本发明的一些实施例中,基于前述方案,所述根据所述规则回复语句和所述意图回复语句得到多个候选回复语句,包括:
根据所述规则回复语句以及所述意图回复语句中的主意图回复语句和各个组合意图回复语句的权重参数,确定多个候选回复语句。
在本发明的一些实施例中,基于前述方案,所述规则回复语句的权重参数大于所述意图回复语句的权重参数,所述意图回复语句中的主意图回复语句的权重参数大于所述组合意图回复语句的权重参数。
在本发明的一些实施例中,基于前述方案,在所述根据所述规则回复语句和所述意图回复语句得到多个候选回复语句之后,所述方法还包括:
获取所述电子邮件的预设回复候选数量,并判断当前所述候选回复语句的个数是否小于所述预设回复候选数量;
若当前所述候选回复语句的个数小于所述预设回复候选数量,则根据各个所述候选回复语句的权重参数,将所述候选回复语句的反向回复语句添加进所述候选回复语句中,其中,所述反向回复语句为相对于所述候选回复语句而作出的相反意思表示。
在本发明的一些实施例中,基于前述方案,在所述获取当前接收到的电子邮件中的邮件内容之后,所述方法还包括:
将所述邮件内容输入预先训练的正负样本分类模型中,得到所述电子邮件的样本类别,其中,所述样本类别包括正样本和负样本;
若所述电子邮件为正样本,则按照后续步骤对所述电子邮件进行智能回复操作;
若所述电子邮件为负样本,则不对所述电子邮件进行智能回复操作。
在本发明的一些实施例中,基于前述方案,所述将所述邮件内容输入预先训练的正负样本分类模型中,得到所述电子邮件的样本类别,包括:
将所述邮件内容中的邮件主题输入所述正负样本分类模型中的第一卷积神经网络,得到所述邮件主题对应的第一特征向量;
将所述邮件内容中的邮件正文输入所述正负样本分类模型中的第二卷积神经网络,得到所述邮件正文对应的第二特征向量,其中,所述第一卷积神经网络和所述第二卷积神经网络中的神经网络参数互不共享;
根据所述第一特征向量和所述第二特征向量得到融合特征向量,并根据所述融合特征向量确定所述电子邮件的样本类别。
在本发明的一些实施例中,基于前述方案,所述正负样本分类模型的训练方法包括:
获取历史电子邮件的邮件内容和对应的回复文本内容,并获取所述历史电子邮件对应的回复客户端类型;
若所述历史电子邮件对应的回复客户端类型为移动客户端,且所述回复文本内容的文本长度小于或等于文本长度阈值,则将所述历史电子邮件的样本类别确定为正样本;
将不符合所述正样本的判定条件的其他历史电子邮件的样本类别确定为负样本;
根据所述历史电子邮件的邮件内容以及所述历史电子邮件的样本类别得到样本分类训练数据,并根据所述样本分类训练数据训练所述正负样本分类模型。
在本发明实施方式的第二方面中,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述第一方面中所述的邮件的智能回复方法。
在本发明实施方式的第三方面中,提供了一种邮件的智能回复装置,该装置包括:
邮件内容获取模块,被配置为获取当前接收到的电子邮件中的邮件内容;
规则回复确定模块,被配置为获取所述邮件内容中的规则关键字,并根据所述规则关键字确定所述电子邮件的规则回复语句;
意图回复确定模块,被配置为根据所述邮件内容确定所述电子邮件的意图类别,并根据所述意图类别确定所述电子邮件的多个意图回复语句;
候选回复确定模块,被配置为根据所述规则回复语句和所述意图回复语句得到多个候选回复语句;
候选回复选择模块,被配置为响应于针对所述候选回复语句的选择指令,按照相应被选择的候选回复语句对所述电子邮件进行回复。
在本发明的一些实施例中,基于前述方案,所述意图回复确定模块包括:
意图分类单元,被配置为将所述邮件内容输入预先训练的意图分类模型中,得到所述电子邮件所属的一个或多个意图类别,其中,所述邮件内容包括邮件主题和邮件正文。
在本发明的一些实施例中,基于前述方案,所述意图分类单元包括:
第一特征向量确定单元,被配置为将所述邮件主题输入所述意图分类模型中的第一卷积神经网络,得到所述邮件主题对应的第一意图特征向量;
第二特征向量确定单元,被配置为将所述邮件正文输入所述意图分类模型中的第二卷积神经网络,得到所述邮件正文对应的第二意图特征向量,其中,所述第一卷积神经网络和所述第二卷积神经网络中的神经网络参数互不共享;
意图类别确定单元,被配置为根据所述第一意图特征向量和所述第二意图特征向量得到融合意图特征向量,并根据所述融合意图特征向量确定所述电子邮件所属的一个或多个意图类别。
在本发明的一些实施例中,基于前述方案,所述邮件的智能回复装置还包括意图分类模型训练模块,所述意图分类模型训练模块包括:
历史邮件获取单元,被配置为获取历史电子邮件的邮件内容和对应的回复文本内容,并对所述回复文本内容进行分词处理得到多个回复词组;
候选话术确定单元,被配置为根据所述回复词组在所有所述回复文本内容中的出现频率得到候选回复话术;
回复话术簇确定单元,被配置为根据相同语义的所述候选回复话术得到回复话术簇,根据各个所述回复话术簇分别构建对应的回复内容匹配规则,并确定各个所述回复话术簇对应的意图类别;
意图类别确定单元,被配置为若所述历史电子邮件的回复文本内容与所述回复话术簇对应的回复内容匹配规则相匹配,则判定所述历史电子邮件的邮件内容属于所述回复话术簇对应的意图类别;
训练数据确定单元,被配置为根据所述历史电子邮件的邮件内容以及所述邮件内容对应的一个或多个意图类别得到意图类别训练数据,并根据所述意图类别训练数据训练所述意图分类模型。
在本发明的一些实施例中,基于前述方案,所述历史邮件获取单元包括:
文本预处理单元,被配置为对所述回复文本内容进行预处理,并对预处理后的所述回复文本内容进行分词处理得到多个回复词组。
在本发明的一些实施例中,基于前述方案,所述候选话术确定单元包括:
多元话术确定单元,被配置为根据一元语法、二元语法和三元语法分别对所述回复词组进行组合,得到所述回复词组对应的一元话术、二元话术和三元话术;
话术频率统计单元,被配置为分别统计所述一元话术、所述二元话术和所述三元话术在所有所述回复文本内容中的出现频率,并将出现频率大于或等于词频阈值的所述一元话术、所述二元话术和所述三元话术确定为候选回复话术。
在本发明的一些实施例中,基于前述方案,所述意图回复确定模块包括:
主意图回复语句确定单元,被配置为根据所述意图类别的置信度从各个所述意图类别中确定出目标意图类别,并从所述目标意图类别对应的回复话术簇中确定一个回复话术作为主意图回复语句;
组合意图回复语句确定单元,被配置为从目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,并根据所述目标意图类别将所述主意图回复语句与所述辅助话术进行组合,得到多个组合意图回复语句。
在本发明的一些实施例中,基于前述方案,所述组合意图回复语句确定单元包括:
意图类别排序单元,被配置为将所述目的类意图的各个意图类别按照置信度由高到低进行排序;
第一辅助话术确定单元,被配置为将所述置信度排序第一的意图类别确定为第一意图类别,并从所述第一意图类别对应的回复话术簇中确定一个回复话术作为第一辅助话术;
第二辅助话术确定单元,被配置为将所述置信度排序第二的意图类别确定为第二意图类别,并从所述第二意图类别对应的回复话术簇中确定一个回复话术作为第二辅助话术;
第三辅助话术确定单元,被配置为将所述置信度排序第三的意图类别确定为第三意图类别,并从所述第三意图类别对应的回复话术簇中确定一个回复话术作为第三辅助话术。
在本发明的一些实施例中,基于前述方案,所述组合意图回复语句确定单元还包括:
寒暄类组合意图回复语句确定单元,被配置为若所述目标意图类别为寒暄类意图,则将所述主意图回复语句与所述第一辅助话术进行组合得到第一组合意图回复语句,将所述第一辅助话术与所述第二辅助话术进行组合得到第二组合意图回复语句;
目的类组合意图回复语句确定单元,被配置为若所述目标意图类别为目的类意图,则将所述主意图回复语句与所述第二辅助话术进行组合得到第一组合意图回复语句,将所述主意图回复语句与所述第三辅助话术进行组合得到第二组合意图回复语句。
在本发明的一些实施例中,基于前述方案,所述组合意图回复语句确定单元还包括:
语句平滑单元,被配置为获取语句平滑词典,并根据所述语句平滑词典对所述组合意图回复语句进行平滑处理,调整所述组合意图回复语句中各个词组之间的语序。
在本发明的一些实施例中,基于前述方案,所述候选回复确定模块包括:
候选回复语句确定单元,被配置为根据所述规则回复语句以及所述意图回复语句中的主意图回复语句和各个组合意图回复语句的权重参数,确定多个候选回复语句。
在本发明的一些实施例中,基于前述方案,所述规则回复语句的权重参数大于所述意图回复语句的权重参数,所述意图回复语句中的主意图回复语句的权重参数大于所述组合意图回复语句的权重参数。
在本发明的一些实施例中,基于前述方案,所述候选回复语句确定单元包括:
预设候选数量确定单元,被配置为获取所述电子邮件的预设回复候选数量,并判断当前所述候选回复语句的个数是否小于所述预设回复候选数量;
反向回复语句添加单元,被配置为若当前所述候选回复语句的个数小于所述预设回复候选数量,则根据各个所述候选回复语句的权重参数,将所述候选回复语句的反向回复语句添加进所述候选回复语句中,其中,所述反向回复语句为相对于所述候选回复语句而作出的相反意思表示。
在本发明的一些实施例中,基于前述方案,所述邮件的智能回复装置还包括样本类别判断模块,所述样本类别判断模块包括:
样本分类单元,被配置为将所述邮件内容输入预先训练的正负样本分类模型中,得到所述电子邮件的样本类别,其中,所述样本类别包括正样本和负样本;
正样本操作单元,被配置为若所述电子邮件为正样本,则按照后续步骤对所述电子邮件进行智能回复操作;
负样本操作单元,被配置为若所述电子邮件为负样本,则不对所述电子邮件进行智能回复操作。
在本发明的一些实施例中,基于前述方案,所述样本分类单元包括:
第一特征向量确定单元,被配置为将所述邮件内容中的邮件主题输入所述正负样本分类模型中的第一卷积神经网络,得到所述邮件主题对应的第一特征向量;
第二特征向量确定单元,被配置为将所述邮件内容中的邮件正文输入所述正负样本分类模型中的第二卷积神经网络,得到所述邮件正文对应的第二特征向量,其中,所述第一卷积神经网络和所述第二卷积神经网络中的神经网络参数互不共享;
样本类别确定单元,被配置为根据所述第一特征向量和所述第二特征向量得到融合特征向量,并根据所述融合特征向量确定所述电子邮件的样本类别。
在本发明的一些实施例中,基于前述方案,所述邮件的智能回复装置还包括正负样本分类模型训练模块,所述正负样本分类模型训练模块包括:
客户端类型获取单元,被配置为获取历史电子邮件的邮件内容和对应的回复文本内容,并获取所述历史电子邮件对应的回复客户端类型;
正样本确定单元,被配置为若所述历史电子邮件对应的回复客户端类型为移动客户端,且所述回复文本内容的文本长度小于或等于文本长度阈值,则将所述历史电子邮件的样本类别确定为正样本;
负样本确定单元,被配置为将不符合所述正样本的判定条件的其他历史电子邮件的样本类别确定为负样本;
分类训练数据确定单元,被配置为根据所述历史电子邮件的邮件内容以及所述历史电子邮件的样本类别得到样本分类训练数据,并根据所述样本分类训练数据训练所述正负样本分类模型。
在本发明实施方式的第四方面中,提供了一种电子设备,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如上述第一方面中所述的邮件的智能回复方法。
在本发明提供的技术方案中,通过规则与意图结合的方式,先根据规则关键字确定电子邮件的规则回复语句,并根据意图类别确定意图回复语句,再根据邮件对应的规则回复语句和意图回复语句得到多个候选回复语句,以供用户进行选择并根据选择结果进行自动回复。一方面,通过挖掘历史会话数据中的会话意图和回复,并设定匹配规则,自动生成当前电子邮件对应的回复语句,能够提高电子邮件回复的效率和准确率,减少用户的编辑成本,提高用户沟通效率,并且减少了该方法在实际应用中的运营配置和维护成本;另一方面,通过给用户提供多个候选回复语句,能够确保回复的覆盖率和真实性,提高了回复话术的多样性,为用户带来了更好的使用体验。
另外,在本发明提供的技术方案中,还能够预先排除掉无法进行智能回复的邮件类型,在节省了算力和系统资源的同时,还能够降低回复的误会率,进一步提高电子邮件回复的效率和准确率。
附图说明
通过参考附图阅读下文的详细描述,本发明示例性实施方式的上述以及其他目的、特征和优点将变得易于理解。在附图中,以示例性而非限制性的方式示出了本发明的若干实施方式,其中:
图1示意性地示出了应用本发明示例性实施方式的系统架构示意图;
图2示意性地示出了本发明一些示例性实施方式中的邮件的智能回复方法的步骤流程图;
图3示意性地示出了本发明一些示例性实施方式中对电子邮件的样本类别进行判断的步骤流程图;
图4示意性地示出了本发明一些示例性实施方式中的正负样本分类模型的结构示意图;
图5示意性地示出了本发明一些示例性实施方式中的正负样本分类模型的训练方法的步骤流程图;
图6示意性地示出了本发明一些示例性实施方式中的意图分类模型的结构示意图;
图7示意性地示出了本发明一些示例性实施方式中的意图分类模型的训练方法的步骤流程图;
图8示意性地示出了本发明一些示例性实施方式中的确定意图回复语句的步骤流程图;
图9示意性地示出了根据本发明的一个具体实施方式中的邮件的智能回复方法的步骤流程图;
图10示意性地示出了本发明一些示例性实施方式中的邮件的智能回复装置的结构框图;
在附图中,相同或对应的标号表示相同或对应的部分。
具体实施方式
下面将参考若干示例性实施方式来描述本发明的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本发明,而并非以任何方式限制本发明的范围。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
本领域技术人员知道,本发明的实施方式可以实现为一种系统、装置、设备、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
根据本发明的实施方式,提出了一种邮件的智能回复方法和设备。
本发明中涉及的技术术语解释如下:
深度学习:利用深层神经网络来抽象数据特征,以便更精准地表征数据的分布和特性。
卷积神经网络(CNN,Convolutional Neural Network):一种包含卷积操作的前馈神经网络,是深度学习的代表算法之一。
TextCNN:用于文本分类的卷积神经网络模型架构。
分词(中文分词):将连续的中文文字序列按照一定的规范重新组合成词序列的过程。
N元语法(一元语法、二元语法、三元语法……):n-gram,指文本中连续出现的n个词语。
此外,附图中的任何元素数量均用于示例而非限制,以及任何命名都仅用于区分,而不具有任何限制含义。
下面参考本发明的若干代表性实施方式,详细阐释本发明的原理和精神。
发明概述
邮件智能回复或即时通讯回复是智能会话任务中的一项落地应用。邮件的智能回复功能多应用于移动端的电子邮件回复的场景中,涉及到多意图和多类别的判断,生成与用户意图相匹配的回复语句,邮件的用户意图相对而言比较集中,并且一般情况下仅针对当前邮件进行一轮回复即可。与之类似的还有智能机器人多轮会话功能,然而智能机器人多轮会话的应用场景一般为实时聊天的场景,对话的意图比较发散,并且由于多轮连续对话,在生成回复语句时需要联系上下文信息进行宽领域对话意图的提取,因此,邮件的智能回复功能与智能机器人多轮会话功能不论是在具体的应用场景还是在具体的实现方法上,都存在着很多不同之处。另外,在智能回复领域应用较多的还有智能客服功能,但是智能客服主要是通过历史提问与回复的匹配来构建对应的历史库或者知识库,与邮件的智能回复功能还是存在着本质上的区别。
在邮件智能回复任务中,主流方法主要有以下两类:方法一,根据历史会话数据构建历史会话和历史回复之间的对应关系,通过计算新会话和历史会话的匹配度,选择最匹配的历史会话对应的回复内容生成答复;方法二,通过预设的意图分类模块,预测会话内容的真实意图,再根据会话的意图及会话的语义信息等生成最终回复。
针对上述方法一,在一些相关的实施例中,可以通过构建共享语料库的方法,来解决构建历史会话和回复对应关系时,构建人力成本高、质量低、回复内容单一的问题。具体地,可以先建立与通讯方对应的个人语料库,再将多个通讯方的个人语料库合并,得到最终的共享语料库。其中,构建与通讯方对应的个人语料库的方法为:采集会话内容中的会话对,根据预设的场景标签采集会话对所对应的场景标签值,会话对、场景标签及场景标签值的三元组构成了个人语料库。该方法本质上是一种从历史会话中挖掘出标准会话对的方法,在节省人力成本,提高后续回复内容多样性上有一定优势。
然而,该方法强依赖于预设的场景标签,针对每一个标签需要设计相应的打标策略,该标签体系的类别设置和打标效果直接影响构造整体语料库的质量。因此,该方法有如下几个缺点:新增场景标签的成本较大,场景扩展需要对全部数据重新全部梳理,构建相应的打标策略的人力成本依然较大;因为预设的场景比较单一,无法处理多意图组合的会话内容。
针对上述方法一,在另一些相关的实施例中,还可以从历史邮件中提取需求信息并构建需求信息与回复内容之间的对应关系,通过计算新邮件的需求信息和历史邮件的需求信息的匹配程度,来找到最匹配的历史邮件及其回复内容,结合历史邮件的回复内容和一些模板规则生成新邮件的回复内容。该方法改变了邮件系统中模板化的回复内容,增加了邮件回复场景中回复内容的个性化和智能化。
然而,该方法为了达到相对高的覆盖率,前期需要花费比较多的人力构建需求信息和回复之间的对应关系;在生成回复时,采用检索和匹配的策略导致邮件需求信息的提取质量对最终效果的影响较大,方法的整体泛化能力较差,回复内容比较单一。
针对上述方法二,在一些相关的实施例中,可以通过用户在终端预先设定回复的规则、回复的内容以及回复后处理策略,当传入消息符合回复规则时,按照回复的内容及后处理策略生成回复消息。该方法能够在移动终端通信场景中,根据用户自己设定的回复规则和策略,生成自动回复内容,给了使用者更大、更丰富的配置空间。
然而,该方法虽然通过设定规则模板的方式,实现了一定的回复多样化,但是,为了覆盖一定量的智能回复邮件占比,配置的规则数量比较巨大,对用户来说学习规则和配置规则的成本较高;当配置规则数量少、质量差时,整个系统回复覆盖比率较低。
针对上述方法二,在另一些相关的实施例中,还可以通过对会话消息进行场景分析,得到会话的所属的预设场景,根据预设场景对对应的语义分析算法分析前述会话,生成待回复的消息。其中,语义分析算法包括关键词识别、意图识别等。该方法先通过场景分析模型,确定当前会话的场景,再为每个场景设计了不同的语义分析和回复生成算法,在满足预设场景的会话中,通过强定制化的回复策略,可以增加即时通讯场景中的会话活跃度和话题度。
该方法通过意图识别的方式将会话内容映射到预设场景,再针对不同的预设场景和会话语义内容生成回复,在进行场景预设扩展时同样成本较大,且各意图场景相互独立,无法生成多意图下的会话内容回复。
综上所述,对于前述方法一,难点主要在于如何高效地抽象出历史会话和回复内容之间对应关系,以及计算新会话和历史会话匹配度两点。人工构建对应关系的方法成本高、效率低;自动化构建对应关系的方法质量较低。对于前述方法二,难点主要在于预设的意图或场景分类类别难以确定,且方法二也无法处理多意图状态下的回复生成。
基于以上问题,本发明提出了一种邮件的智能回复方法,对于日常使用电子邮件的过程中,发件人急于等待回复的类型,例如请求确认类、请求批准类邮件,或者是收件人接受完信息后就可以简短回复并完成对邮件归档的类型,如通知型、征询型邮件,可以在用户收到邮件后对上述类型邮件迅速生成回复内容,免去了用户对回复内容措辞的思索,减少用户编辑时间,大大提高沟通效率。在本发明的其中一些实施例中,所提出的邮件的智能回复方法主要包括以下三个部分:
1)本发明提出了一种获取用户常用回复意图和内容的方法。为了覆盖更多的电子邮件对其进行智能回复,需要从海量的邮件正文和回复中提取出一般常用的用户邮件意图和对应的回复内容。本发明提供了一种词法分析和统计相结合的方式,构建了一套智能回复的标签体系。同时,根据已构建完成的意图标签体系制定规则,为历史的邮件正文打上意图标签。
2)本发明提出了一种根据当前邮件正文生成智能回复的方法。为了增加回复邮件的覆盖率,减少用户或邮件业务人员本身的配置、运维成本,本发明提出了结合规则和算法,生成智能回复的方法。通过设定规则,解决简单直白的邮件回复任务;通过训练一个多标签多类别的分类器,对邮件正文进行意图分类,整合多个意图下的回复话术,生成基于意图的邮件回复内容。两种方法结合,既保证了回复的准确性,又保证了回复的覆盖率和多样性。
3)本发明提出了一种判断当前邮件正文是否需要进行简短、快捷回复的方法。在电子邮件场景中,有一类邮件是无需回复的邮件,例如广告类,推广类,电子账单类等。在需要回复的邮件中,有一部分邮件是需要收件人回填、回传消息的,有一部分邮件是需要收件人详细组织语言进行长或进行复杂回复的。上述几类邮件都不符合智能回复的应用场景,如果进入后续回复生成模块,不仅浪费了算力,而且生成的回复有很大概率不会被用户采纳,因此,这类邮件内容不属于智能回复目标解决的问题。本发明提出了一种通过训练一个分类器,对无需回复和智能回复无法进行回复的邮件进行过滤,大大减少了运算开支和系统误回的可能性。
在介绍了本发明的基本原理之后,下面具体介绍本发明的各种非限制性实施方式。
应用场景总览
需要注意的是,下述应用场景仅是为了便于理解本发明的精神和原理而示出,本发明的实施方式在此方面不受任何限制。相反,本发明的实施方式可以应用于适用的任何场景。
图1示出了可以应用本发明实施例的一种邮件的智能回复方法及装置的示例性应用环境的系统架构的示意图。
如图1所示,系统架构100可以包括移动终端101、102、103中的多个,网络104和服务器105。网络104用以在移动终端101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如无线通信链路等。
应该理解,图1中的移动终端、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的移动终端、网络和服务器。比如服务器105可以是多个服务器组成的服务器集群等。
移动终端101、102、103可以是具有处理器的各种电子设备,包括但不限于智能手机、平板电脑、便携式计算机等等。服务器105可以是提供各种服务的服务器。例如移动终端101、102、103可以通过处理器获取当前接收到的电子邮件中的邮件内容,并向服务器105上传邮件内容。服务器105可以获取邮件内容中的规则关键字,并根据规则关键字确定电子邮件的规则回复语句;根据邮件内容确定电子邮件的意图类别,并根据意图类别确定电子邮件的多个意图回复语句;根据规则回复语句和意图回复语句得到多个候选回复语句。移动终端101、102、103也可以通过处理器完成从获取当前接收到的电子邮件中的邮件内容到响应于针对候选回复语句的选择指令,按照相应被选择的候选回复语句对电子邮件进行回复的全部过程。
示例性方法
下面结合上述的应用场景,参考图2来描述根据本发明示例性实施方式的邮件的智能回复方法。
本示例实施方式首先提供了一种邮件的智能回复方法。参考图2所示,上述邮件的智能回复方法可以包括以下步骤:
步骤S210.获取当前接收到的电子邮件中的邮件内容。
步骤S220.获取邮件内容中的规则关键字,并根据规则关键字确定电子邮件的规则回复语句。
步骤S230.根据邮件内容确定电子邮件的意图类别,并根据意图类别确定电子邮件的多个意图回复语句。
步骤S240.根据规则回复语句和意图回复语句得到多个候选回复语句。
步骤S250.响应于针对候选回复语句的选择指令,按照相应被选择的候选回复语句对电子邮件进行回复。
在本发明提供的技术方案中,通过规则与意图结合的方式,先根据规则关键字确定电子邮件的规则回复语句,并根据意图类别确定意图回复语句,再根据邮件对应的规则回复语句和意图回复语句得到多个候选回复语句,以供用户进行选择并根据选择结果进行自动回复。一方面,通过挖掘历史会话数据中的会话意图和回复,并设定匹配规则,自动生成当前电子邮件对应的回复语句,能够提高电子邮件回复的效率和准确率,减少用户的编辑成本,提高用户沟通效率,并且减少了该方法在实际应用中的运营配置和维护成本;另一方面,通过给用户提供多个候选回复语句,能够确保回复的覆盖率和真实性,提高了回复话术的多样性,为用户带来了更好的使用体验。
下面,结合图3至图8对本示例实施方式的上述步骤进行更加详细的说明。
在步骤S210中,获取当前接收到的电子邮件中的邮件内容。
本示例实施方式中,邮件内容包括邮件主题和邮件正文,其中,邮件内容中可以包括文字、图片、音频、视频等内容。如果邮件中包含图片、音频或视频等,则可以通过文字识别或语音识别等技术提取出对应的文字,从而得到邮件正文。在电子邮件应用场景中,邮件的标题部分对判断邮件意图也有十分重要的作用,因此,通过结合邮件主题和邮件正文,能够更准确地对邮件的类别和意图进行判定,从而提高回复的准确度。
本示例实施方式中,在获取当前接收到的电子邮件中的邮件内容之后,可以先对电子邮件的正负样本类别进行判断,从而排除一些不适用于本示例实施方式中的邮件的智能回复方法的情况,比如,可以排除掉无需进行回复或者无法进行简短回复的邮件类型。
本示例实施方式中,如图3所示,对电子邮件的样本类别进行判断的方法,具体可以包括以下几个步骤:
步骤S310.将邮件内容输入预先训练的正负样本分类模型中,得到电子邮件的样本类别。
本示例实施方式中,样本类别包括正样本和负样本,其中,正样本表示能够进行智能回复的邮件样本类型,负样本表示不符合邮件智能回复场景的样本类型,例如无需进行回复或者无法进行简短回复的邮件类型等。为了排除不符合邮件智能回复场景的负样本,本发明通过训练一个正负样本分类模型,作为是否进入后续智能回复生成模块的判别模块。
如图4所示为本发明示例性实施方式中的正负样本分类模型的结构示意图,该模型沿用TextCNN的基本结构,除此之外,还可以通过RNN(Recurrent Neural Network,循环神经网络),或Transformer模型等其他类型的机器学习模型来实现,本示例实施方式中对模型的种类不做具体限定,仅以TextCNN模型结构为例进行详细说明。
本示例实施方式中的正负样本分类模型与基本的TextCNN结构的不同之处在于:本示例实施方式中的正负样本分类模型的输入层为邮件的主题和正文两路输入。具体地,本示例实施方式是将邮件内容中的邮件主题输入正负样本分类模型中的第一卷积神经网络,得到邮件主题对应的第一特征向量;将邮件内容中的邮件正文输入正负样本分类模型中的第二卷积神经网络,得到邮件正文对应的第二特征向量,其中,第一卷积神经网络和第二卷积神经网络中的神经网络参数互不共享。如图4所示,邮件的主题和正文分别经过两个参数互不共享的卷积神经网络,分别生成邮件主题和邮件正文的特征向量表示,然后在向量融合层拼接邮件主题和邮件正文的特征向量,根据第一特征向量和第二特征向量得到融合特征向量,再进入到最后的输出层,根据融合特征向量确定电子邮件的样本类别。如果输出标签为0,则表示该邮件为负样本;如果输出标签为1,则表示该邮件为正样本。
本示例实施方式中,模型的输出层节点数为1,输出层激活函数为sigmoid函数:
Figure BDA0002952334910000201
其中z为输出层的输入向量。当前场景下,输入向量z为一维向量,经过sigmoid函数后的输出向量也为一维向量。
模型的损失函数为二元交叉熵(binary cross entropy)损失函数:
Figure BDA0002952334910000202
其中,m为样本数,yi为当前邮件标签的真值,yi'为模型预测的邮件标签。在当前场景中,yi∈{0,1}。
正负样本分类模型训练的关键在于,如何从历史海量的邮件内容和邮件回复中,生成标签为0的无法进行智能回复的邮件数据(负样本)以及标签为1的可以进行智能回复的邮件数据(正样本)。
本示例实施方式中,如图5所示,上述正负样本分类模型的训练方法具体可以包括以下几个步骤:
步骤S510.获取历史电子邮件的邮件内容和对应的回复文本内容,并获取历史电子邮件对应的回复客户端类型。
首先,从存储邮件数据的数据库中获取所有历史电子邮件的邮件内容和对应的回复文本内容,以及各个历史电子邮件在回复时所处的客户端类型,例如电脑端或移动端。其中,历史电子邮件的邮件内容同样可以包括邮件主题和邮件正文两部分。
步骤S520.若历史电子邮件对应的回复客户端类型为移动客户端,且回复文本内容的文本长度小于或等于文本长度阈值,则将历史电子邮件的样本类别确定为正样本。
用户在移动端(ios,安卓等)阅读并回复的邮件,可以认为是亟需回复的邮件。移动端屏幕较小,编辑较慢,较少被用来进行长回复。移动端读信一般表明用户在非工作状态,在上述情景下仍然进行回复的邮件是本示例实施方式中的智能回复系统目标解决的邮件类型。智能回复系统希望在用户不方便但急需(简短)回复的情况下辅助用户完成邮件回复。
因此,通过判断历史电子邮件对应的回复客户端类型是否为移动客户端,同时,判断回复文本内容的文本长度是否小于或等于文本长度阈值,即可确定该邮件是否为移动端回复且回复内容较短的正样本类型。
步骤S530.将不符合正样本的判定条件的其他历史电子邮件的样本类别确定为负样本。
用户回复内容长(大于文本长度阈值)的邮件正文,是智能回复系统难以自动生成回复的邮件。用户花费较长时间撰写的长回复邮件,一般包含用户自己的感知、描述和思考,不属于智能回复系统的应用范畴。因此,可以将全域回复内容较长或未被回复过的邮件确定为负样本类型。
步骤S540.根据历史电子邮件的邮件内容以及历史电子邮件的样本类别得到样本分类训练数据,并根据样本分类训练数据训练正负样本分类模型。
本示例实施方式中,选取移动端回复且回复内容较短的邮件正文作为正负样本分类模型的正样本,选取全域回复内容较长或未被回复过的邮件正文作为正负样本分类模型的负样本。然后,基于上述正负样本数据得到样本分类训练数据,并通过卷积神经网络训练出一个二分类模型,作为正负样本分类模型。
步骤S320.若电子邮件为正样本,则按照后续步骤对电子邮件进行智能回复操作。
若当前电子邮件为正样本,则表示当前电子邮件为通过移动端回复且回复内容较短的邮件类型,则按照后续步骤对电子邮件进行智能回复操作,生成对应的回复选项供用户选择。
步骤S330.若电子邮件为负样本,则不对电子邮件进行智能回复操作。
若当前电子邮件为负样本,则表示当前电子邮件为无需回复或需要进行较长回复的邮件类型,由于其不属于本示例实施方式中邮件的智能回复方法的适用场景,因此不对其进行智能回复操作。
在本发明提供的技术方案中,通过正负样本分类模型预先排除掉无法进行智能回复的邮件类型,在节省了算力和系统资源的同时,还能够降低回复的误会率,进一步提高电子邮件回复的效率和准确率。
继续参考图2,在步骤S220中,获取邮件内容中的规则关键字,并根据规则关键字确定电子邮件的规则回复语句。
在邮件场景中,有一些邮件正文的话术相对直白、简单,可以通过设计一定的回复规则,如正则规则,构造智能回复的策略。例如:邮件正文提及“需要……吗”、“请问需要……吗”,直截了当的回复为“需要的,麻烦了”或“不需要,谢谢”。
本示例实施方式中,可以通过设置对应的规则关键字,直接确定电子邮件对应的规则回复语句。例如,当检测到“需要……吗”这一类的规则关键字时,直接匹配出“需要的,麻烦了”和“不需要,谢谢”的规则回复语句。通过设计此类正则规则,可以保证智能回复系统在简单问题上的命中率和准确率,并提高智能回复语句的生成效率。
继续参考图2,在步骤S230中,根据邮件内容确定电子邮件的意图类别,并根据意图类别确定电子邮件的多个意图回复语句。
本示例实施方式中,根据邮件内容确定电子邮件的意图类别的具体方法可以为,将邮件内容输入预先训练的意图分类模型中,得到电子邮件所属的一个或多个意图类别。
针对智能回复的应用场景,本发明采用多标签多类别的分类方法,对邮件内容进行意图划分。采用多标签的原因在于,邮件回复的场景是相对丰富的,邮件的意图也是多种多样的,意图的个数对应着标签的个数;采用多类别的原因在于,同一封邮件可能传达出多个意图,这些意图之间不完全是相互独立的;采用分类方法的原因在于,邮件的智能回复在工作、商务、教育等领域中的意图是相对可枚举的,分类的方式在训练集构建完成后很少产生额外的数据构造和维护成本。
如图6所示为本发明示例性实施方式中的意图分类模型的结构示意图,模型沿用TextCNN的基本结构,采用卷积神经网络构建了一个多标签多类别分类模型。同样地,上述意图分类模型的结构也仅以TextCNN模型结构为例进行说明,对模型的种类不做具体限定。模型的输入层同样为邮件的主题和正文两路输入,将邮件主题输入意图分类模型中的第一卷积神经网络,得到邮件主题对应的第一意图特征向量,将邮件正文输入意图分类模型中的第二卷积神经网络,得到邮件正文对应的第二意图特征向量,其中,第一卷积神经网络和第二卷积神经网络中的神经网络参数互不共享。然后在向量融合层进行特征向量的拼接,根据第一意图特征向量和第二意图特征向量得到融合意图特征向量,并根据融合意图特征向量确定电子邮件所属的一个或多个意图类别。
需要注意的是,由于模型为多标签多类别模型,输出层节点数为意图类别数,输出层激活函数为sigmoid函数:
Figure BDA0002952334910000231
其中z为输出层的输入向量。当前场景下,z的维度为意图类别个数n,经过激活函数后的输出向量也为n维向量。
模型的损失函数为二元交叉熵(binary cross entropy)损失函数:
Figure BDA0002952334910000241
其中,m为样本数,yi为当前邮件意图类别标签的真值,yi'为模型预测的邮件意图类别标签。在当前场景中,yi∈{0,1}n,即yi为n维0-1向量。
意图分类模型训练的关键在于,如何从海量邮件正文和回复中提取一般常用的用户意图,并将邮件正文映射到构造好的意图标签上。
本示例实施方式中,如图7所示,上述意图分类模型的训练方法具体可以包括以下几个步骤:
步骤S710.获取历史电子邮件的邮件内容和对应的回复文本内容,并对回复文本内容进行分词处理得到多个回复词组。
首先,获取历史电子邮件的邮件内容和对应的回复文本内容,对于邮件内容文本(包括邮件主题和邮件正文)Mi,其对应的回复文本为Ri,可以构成一对邮件文本和回复对(Mi,Ri)。全量邮件文本集合记为M={Mi},全量的回复文本记为R={Ri}。
本示例实施方式中,在获取历史电子邮件的邮件内容和对应的回复文本内容之后,可以先对回复文本内容进行预处理,然后对预处理后的回复文本内容进行分词处理得到多个回复词组。其中,预处理操作包括繁简转换、转小写、去停用词、去敏感词等。
步骤S720.根据回复词组在所有回复文本内容中的出现频率得到候选回复话术。
本示例实施方式中,可以根据一元语法(unigram)、二元语法(bigram)和三元语法(trigram)分别对回复词组进行组合,得到回复词组对应的一元话术、二元话术和三元话术;然后分别统计一元话术、二元话术和三元话术在所有回复文本内容中的出现频率,并将出现频率大于或等于词频阈值的一元话术、二元话术和三元话术确定为候选回复话术,即在高频区域归纳出常用的回复话术作为候选回复话术。
步骤S730.根据相同语义的候选回复话术得到回复话术簇,根据各个回复话术簇分别构建对应的回复内容匹配规则,并确定各个回复话术簇对应的意图类别。
接下来,将语义一致或相似的候选回复话术进行合并,形成某一意图下的回复话术簇(Sp),对应着某个意图类别(Ip)。
得到邮件系统中用户常用的回复话术簇之后,把回复话术簇与邮件正文对应的意图类别相关联。其中,话术簇记为
Figure BDA0002952334910000251
为话术簇Sp中的一条话术,该话术是用户真实使用过的回复话术。话术簇Sp对应的正文意图为Ip,话术簇和意图之间为一一对应关系
Figure BDA0002952334910000252
然后,根据回复话术簇Sp,构建回复内容匹配规则
Figure BDA0002952334910000253
其中,回复内容匹配规则
Figure BDA0002952334910000254
可例如包含当前回复话术等。
步骤S740.若历史电子邮件的回复文本内容与回复话术簇对应的回复内容匹配规则相匹配,则判定历史电子邮件的邮件内容属于回复话术簇对应的意图类别。
对每一对历史邮件文本和回复对(Mi,Ri),如果回复内容Ri匹配上了设定好的回复内容匹配规则
Figure BDA0002952334910000255
则认为其邮件内容Mi中包含有当前回复话术簇Sp对应的正文意图Ip,即打上了该意图Ip的标签。因此,可以得到邮件内容Mi和邮件意图Ip的对应关系如下:
Figure BDA0002952334910000256
其中
Figure BDA0002952334910000257
表示回复内容Ri匹配上了设定好的回复内容匹配规则
Figure BDA0002952334910000258
为0则表示未匹配上设定好的回复内容匹配规则
Figure BDA0002952334910000259
Label(Mi)表示邮件正文Mi的意图标签。
步骤S750.根据历史电子邮件的邮件内容以及邮件内容对应的一个或多个意图类别得到意图类别训练数据,并根据意图类别训练数据训练意图分类模型。
显然,同一邮件内容可能会对应多个正文意图,即Label(Mi)=Ip且Label(Mi)=Iq。因此,邮件内容Mi属于多个意图类别,问题转化成多标签多类别的分类问题,意图类别训练数据集(X,Y)=(Mi,{Ij})。
在智能回复生成模块,对于一条真实的邮件内容Mi,上述模型可能预测出多个不同的意图,后续需要通过一定的组装方法,根据各个意图组装得到意图回复语句。
本示例实施方式中,如图8所示,根据意图类别确定电子邮件的多个意图回复语句,具体可以包括以下几个步骤:
步骤S810.根据意图类别的置信度从各个意图类别中确定出目标意图类别,并从目标意图类别对应的回复话术簇中确定一个回复话术作为主意图回复语句。
本示例实施方式中,意图回复语句包括主意图回复语句和组合意图回复语句,意图类别可以分为寒暄类意图和目的类意图。其中,寒暄类意图的回复包括“谢谢”“辛苦了”等寒暄类型的回复话术;目的类意图的话术包括“已安排XX”“批准”等描述真实目的或意图的回复话术。为了回复内容的高效和有意义,可以寒暄类意图的回复话术和目的类意图的回复话术相结合后得到组合意图回复语句进行回复,而目的类意图的回复话术可以单独作为回复内容直接进行回复。
通过上述意图分类模型可以得到邮件内容Mi对应的意图序列{Ip}={Ip,Ip+1,...,Ip+q},将意图序列按照模型预测得分的置信度进行排序,设定置信度最高的意图为目标意图类别,然后随机采样目标意图类别对应的回复话术簇Sp中的回复话术作为主意图回复语句。
步骤S820.从目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,并根据目标意图类别将主意图回复语句与辅助话术进行组合,得到多个组合意图回复语句。
由于寒暄类意图的回复话术需要与目的类意图的回复话术相结合,才能进行有效回复,因此,可以从目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,用于意图回复语句的组合。
本示例实施方式中,从目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术的方法,具体可以为:首先,将目的类意图中的各个意图类别按照置信度由高到低进行排序。其次,将置信度排序第一的意图类别确定为第一意图类别,并从第一意图类别对应的回复话术簇中确定一个回复话术作为第一辅助话术;将置信度排序第二的意图类别确定为第二意图类别,并从第二意图类别对应的回复话术簇中确定一个回复话术作为第二辅助话术;将置信度排序第三的意图类别确定为第三意图类别,并从第三意图类别对应的回复话术簇中确定一个回复话术作为第三辅助话术。
确定出多个辅助话术之后,若目标意图类别为寒暄类意图,则根据目标意图类别将主意图回复语句与辅助话术进行组合,得到多个组合意图回复语句的具体方法为:将主意图回复语句与第一辅助话术进行组合得到第一组合意图回复语句,将第一辅助话术与第二辅助话术进行组合得到第二组合意图回复语句。
具体地,当目标意图类别为寒暄类意图时,将主意图回复语句和置信度排序第一的意图类别中的第一辅助话术进行组合,得到第一组合意图回复语句,然后,再将置信度排序第一的意图类别中的第一辅助话术与置信度排序第二的意图类别中的第二辅助话术进行组合,得到第二组合意图回复语句。加上之前确定的主意图回复语句,一共可以得到三个回复语句。
若目标意图类别为目的类意图,则根据目标意图类别将主意图回复语句与辅助话术进行组合,得到多个组合意图回复语句的具体方法为:将主意图回复语句与第二辅助话术进行组合得到第一组合意图回复语句,将主意图回复语句与第三辅助话术进行组合得到第二组合意图回复语句。
具体地,当目标意图类别为目的类意图时,此时置信度排序第一的意图类别已经用于确定除了主意图回复语句,因此,将主意图回复语句分别与置信度排序第二的意图类别中的第二辅助话术和置信度排序第三的意图类别中的第三辅助话术进行组合,分别得到第一组合意图回复语句和第二组合意图回复语句,加上之前确定的主意图回复语句,一共可以得到三个回复语句。
上述主意图回复语句和辅助话术均可以从对应的回复簇话术中随机采样得出,保证了回复话术的多样性。因此上述组合方式,兼顾了回复意图的多样性和回复内容的实用性。
本示例实施方式中,在根据目标意图类别将主意图回复语句与辅助话术进行组合,得到多个组合意图回复语句之后,由于前序组装方法可能导致语序、措辞不符合人类语言习惯等现象,因此,还可以对其进行语句平滑,具体方法可以为:获取语句平滑词典,并根据语句平滑词典对组合意图回复语句进行平滑处理,调整组合意图回复语句中各个词组之间的语序。最后,就可以得到符合人类语言习惯的回复语句,保证回复的准确性和实用性。
继续参考图2,在步骤S240中,根据规则回复语句和意图回复语句得到多个候选回复语句。
为了得到一封邮件的最终回复内容候选,需要对上述基于规则得到的规则回复语句以及基于意图算法得到的意图回复语句进行组装。
本示例实施方式中,可以根据规则回复语句以及意图回复语句中的主意图回复语句和各个组合意图回复语句的权重参数,确定多个候选回复语句。
由于基于规则的回复覆盖小,但准确率高,因此,规则回复语句的权重参数大于意图回复语句的权重参数,而意图回复语句中的主意图回复语句的权重参数大于组合意图回复语句的权重参数。也就是说,如果当前电子邮件存在对应的规则回复语句,则优先选择规则回复语句作为候选回复。其次,选择主意图回复语句作为候选回复,最后,再将组合意图回复语句添加进候选回复中。
在邮件智能回复场景,可以将回复候选对数量设置为多个,例如,可以设定回复候选数为3、4或5等等。多个回复候选既能丰富回复的意图和话术,也为“是否”类型的邮件正文提供了回复“是”“否”两个可选的空间。
本示例实施方式中,在根据规则回复语句和意图回复语句得到多个候选回复语句之后,还可以获取电子邮件的预设回复候选数量,并判断当前候选回复语句的个数是否小于预设回复候选数量,若当前候选回复语句的个数小于预设回复候选数量,则根据各个候选回复语句的权重参数,将候选回复语句的反向回复语句添加进候选回复语句中,其中,反向回复语句为相对于候选回复语句而作出的相反意思表示。
例如,当回复候选不满3个时,可以通过添加候选回复语句的反向回复,来扩充回复候选列表。例如:对于回复“已完成XX”,可添加其对应的反向回复“会尽快完成XX”,用以扩充用户的选择。
继续参考图2,在步骤S250中,响应于针对候选回复语句的选择指令,按照相应被选择的候选回复语句对电子邮件进行回复。
在确定多个候选回复语句之后,可以将候选回复语句列表显示在接收邮件的用户方的邮件回复界面上,以供用户进行选择。用户可以通过点击等操作方式选择其中一个候选回复语句,然后系统会按照用户选择的候选回复语句对当前电子邮件进行自动回复。
如图9所示是本公开的一个具体实施方式中邮件的智能回复方法的完整流程图,是对本示例实施方式中的上述步骤的举例说明,主要包括模型训练流程和线上回复流程两部分。该流程图的具体步骤如下:
步骤S910.获取历史电子邮件。
获取历史电子邮件的邮件内容和对应的回复文本内容,其中,邮件内容包括邮件主题和邮件正文。
步骤S920.构建样本分类训练数据集并训练正负样本分类模型。
步骤S930.构建意图类别训练数据集并训练意图分类模型。
步骤S940.获取当前电子邮件。
获取当前接收到的电子邮件中的邮件内容,包括邮件主题和邮件正文。
步骤S950.判断是否进行智能回复。
通过正负样本分类模型判断当前电子邮件是否需要进行智能回复。
步骤S960.基于规则回复。
根据邮件内容中的规则关键字生成规则回复语句。
步骤S970.基于意图类别回复。
通过意图分类模型确定邮件的意图类别,并生成多个意图回复语句。
步骤S980.回复组装。
根据规则回复语句和意图回复语句得到多个候选回复语句,以供用户进行选择。
其中,步骤S910至步骤S930属于模型训练流程,包括用于判断是否回复的正负样本分类模型的训练集构造方法,以及用于从海量历史邮件和回复中获取邮件正文意图和回复标签,以及意图分类模型的训练集构造方法。步骤S940至步骤S980属于线上回复流程,包括基于意图判别模型生成智能回复的方法以及回复组装的方法。上述各步骤中的具体方法已在前面详细说明,此处不再赘述。
示例性介质
在介绍了本发明示例性实施方式的方法之后,接下来,对本发明示例性实施方式的介质进行说明。
在一些可能的实施方式中,本发明的各个方面还可以实现为一种介质,其上存储有程序代码,当程序代码被设备的处理器执行时用于实现本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的邮件的智能回复方法中的步骤。
需要说明的是:上述的介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于:电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于:电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线、光缆、RF等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本发明操作的程序代码,程序设计语言包括面向对象的程序设计语言-诸如Java、C++等,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)-连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
示例性装置
在介绍了本发明示例性实施方式的介质之后,接下来,参考图10对本发明示例性实施方式的邮件的智能回复装置进行说明。
图10示意性地示出了本发明一些示例性实施方式中的邮件的智能回复装置的结构框图。如图10所示,邮件的智能回复装置1000主要可以包括:
邮件内容获取模块1010,被配置为获取当前接收到的电子邮件中的邮件内容;
规则回复确定模块1020,被配置为获取邮件内容中的规则关键字,并根据规则关键字确定电子邮件的规则回复语句;
意图回复确定模块1030,被配置为根据邮件内容确定电子邮件的意图类别,并根据意图类别确定电子邮件的多个意图回复语句;
候选回复确定模块1040,被配置为根据规则回复语句和意图回复语句得到多个候选回复语句;
候选回复选择模块1050,被配置为响应于针对候选回复语句的选择指令,按照相应被选择的候选回复语句对电子邮件进行回复。
在本发明的一些示例性实施方式中,基于以上各实施方式,意图回复确定模块1030包括:
意图分类单元,被配置为将邮件内容输入预先训练的意图分类模型中,得到电子邮件所属的一个或多个意图类别,其中,邮件内容包括邮件主题和邮件正文。
在本发明的一些示例性实施方式中,基于以上各实施方式,意图分类单元包括:
第一特征向量确定单元,被配置为将邮件主题输入意图分类模型中的第一卷积神经网络,得到邮件主题对应的第一意图特征向量;
第二特征向量确定单元,被配置为将邮件正文输入意图分类模型中的第二卷积神经网络,得到邮件正文对应的第二意图特征向量,其中,第一卷积神经网络和第二卷积神经网络中的神经网络参数互不共享;
意图类别确定单元,被配置为根据第一意图特征向量和第二意图特征向量得到融合意图特征向量,并根据融合意图特征向量确定电子邮件所属的一个或多个意图类别。
在本发明的一些示例性实施方式中,基于以上各实施方式,邮件的智能回复装置1000还包括意图分类模型训练模块,该意图分类模型训练模块包括:
历史邮件获取单元,被配置为获取历史电子邮件的邮件内容和对应的回复文本内容,并对回复文本内容进行分词处理得到多个回复词组;
候选话术确定单元,被配置为根据回复词组在所有回复文本内容中的出现频率得到候选回复话术;
回复话术簇确定单元,被配置为根据相同语义的候选回复话术得到回复话术簇,根据各个回复话术簇分别构建对应的回复内容匹配规则,并确定各个回复话术簇对应的意图类别;
意图类别确定单元,被配置为若历史电子邮件的回复文本内容与回复话术簇对应的回复内容匹配规则相匹配,则判定历史电子邮件的邮件内容属于回复话术簇对应的意图类别;
训练数据确定单元,被配置为根据历史电子邮件的邮件内容以及邮件内容对应的一个或多个意图类别得到意图类别训练数据,并根据意图类别训练数据训练意图分类模型。
在本发明的一些示例性实施方式中,基于以上各实施方式,历史邮件获取单元包括:
文本预处理单元,被配置为对回复文本内容进行预处理,并对预处理后的回复文本内容进行分词处理得到多个回复词组。
在本发明的一些示例性实施方式中,基于以上各实施方式,候选话术确定单元包括:
多元话术确定单元,被配置为根据一元语法、二元语法和三元语法分别对回复词组进行组合,得到回复词组对应的一元话术、二元话术和三元话术;
话术频率统计单元,被配置为分别统计一元话术、二元话术和三元话术在所有回复文本内容中的出现频率,并将出现频率大于或等于词频阈值的一元话术、二元话术和三元话术确定为候选回复话术。
在本发明的一些示例性实施方式中,基于以上各实施方式,意图回复确定模块1030还包括:
主意图回复语句确定单元,被配置为根据意图类别的置信度从各个意图类别中确定出目标意图类别,并从目标意图类别对应的回复话术簇中确定一个回复话术作为主意图回复语句;
组合意图回复语句确定单元,被配置为从目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,并根据目标意图类别将主意图回复语句与辅助话术进行组合,得到多个组合意图回复语句。
在本发明的一些示例性实施方式中,基于以上各实施方式,组合意图回复语句确定单元包括:
意图类别排序单元,被配置为将目的类意图的各个意图类别按照置信度由高到低进行排序;
第一辅助话术确定单元,被配置为将置信度排序第一的意图类别确定为第一意图类别,并从第一意图类别对应的回复话术簇中确定一个回复话术作为第一辅助话术;
第二辅助话术确定单元,被配置为将置信度排序第二的意图类别确定为第二意图类别,并从第二意图类别对应的回复话术簇中确定一个回复话术作为第二辅助话术;
第三辅助话术确定单元,被配置为将置信度排序第三的意图类别确定为第三意图类别,并从第三意图类别对应的回复话术簇中确定一个回复话术作为第三辅助话术。
在本发明的一些示例性实施方式中,基于以上各实施方式,组合意图回复语句确定单元还包括:
寒暄类组合意图回复语句确定单元,被配置为若目标意图类别为寒暄类意图,则将主意图回复语句与第一辅助话术进行组合得到第一组合意图回复语句,将第一辅助话术与第二辅助话术进行组合得到第二组合意图回复语句;
目的类组合意图回复语句确定单元,被配置为若目标意图类别为目的类意图,则将主意图回复语句与第二辅助话术进行组合得到第一组合意图回复语句,将主意图回复语句与第三辅助话术进行组合得到第二组合意图回复语句。
在本发明的一些示例性实施方式中,基于以上各实施方式,组合意图回复语句确定单元还包括:
语句平滑单元,被配置为获取语句平滑词典,并根据语句平滑词典对组合意图回复语句进行平滑处理,调整组合意图回复语句中各个词组之间的语序。
在本发明的一些示例性实施方式中,基于以上各实施方式,候选回复确定模块1040包括:
候选回复语句确定单元,被配置为根据规则回复语句以及意图回复语句中的主意图回复语句和各个组合意图回复语句的权重参数,确定多个候选回复语句。
在本发明的一些示例性实施方式中,基于以上各实施方式,规则回复语句的权重参数大于意图回复语句的权重参数,意图回复语句中的主意图回复语句的权重参数大于组合意图回复语句的权重参数。
在本发明的一些示例性实施方式中,基于以上各实施方式,候选回复语句确定单元包括:
预设候选数量确定单元,被配置为获取电子邮件的预设回复候选数量,并判断当前候选回复语句的个数是否小于预设回复候选数量;
反向回复语句添加单元,被配置为若当前候选回复语句的个数小于预设回复候选数量,则根据各个候选回复语句的权重参数,将候选回复语句的反向回复语句添加进候选回复语句中,其中,反向回复语句为相对于候选回复语句而作出的相反意思表示。
在本发明的一些示例性实施方式中,基于以上各实施方式,邮件的智能回复装置还包括样本类别判断模块,样本类别判断模块包括:
样本分类单元,被配置为将邮件内容输入预先训练的正负样本分类模型中,得到电子邮件的样本类别,其中,样本类别包括正样本和负样本;
正样本操作单元,被配置为若电子邮件为正样本,则按照后续步骤对电子邮件进行智能回复操作;
负样本操作单元,被配置为若电子邮件为负样本,则不对电子邮件进行智能回复操作。
在本发明的一些示例性实施方式中,基于以上各实施方式,样本分类单元包括:
第一特征向量确定单元,被配置为将邮件内容中的邮件主题输入正负样本分类模型中的第一卷积神经网络,得到邮件主题对应的第一特征向量;
第二特征向量确定单元,被配置为将邮件内容中的邮件正文输入正负样本分类模型中的第二卷积神经网络,得到邮件正文对应的第二特征向量,其中,第一卷积神经网络和第二卷积神经网络中的神经网络参数互不共享;
样本类别确定单元,被配置为根据第一特征向量和第二特征向量得到融合特征向量,并根据融合特征向量确定电子邮件的样本类别。
在本发明的一些示例性实施方式中,基于以上各实施方式,邮件的智能回复装置还包括正负样本分类模型训练模块,正负样本分类模型训练模块包括:
客户端类型获取单元,被配置为获取历史电子邮件的邮件内容和对应的回复文本内容,并获取历史电子邮件对应的回复客户端类型;
正样本确定单元,被配置为若历史电子邮件对应的回复客户端类型为移动客户端,且回复文本内容的文本长度小于或等于文本长度阈值,则将历史电子邮件的样本类别确定为正样本;
负样本确定单元,被配置为将不符合正样本的判定条件的其他历史电子邮件的样本类别确定为负样本;
分类训练数据确定单元,被配置为根据历史电子邮件的邮件内容以及历史电子邮件的样本类别得到样本分类训练数据,并根据样本分类训练数据训练正负样本分类模型。
示例性计算设备
在介绍了本发明示例性实施方式的方法、介质和装置之后,接下来,介绍根据本发明的另一示例性实施方式的计算设备。
所属技术领域的技术人员能够理解,本发明的各个方面可以实现为系统、方法或程序产品。因此,本发明的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
在一些可能的实施方式中,根据本发明实施方式的计算设备可以至少包括至少一个处理器、以及至少一个存储器。其中,所述存储器存储有程序代码,当所述程序代码被所述处理器执行时,使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本发明各种示例性实施方式的邮件的智能回复方法中的步骤。例如,所述处理器可以执行如图2中所示的步骤获取邮件内容中的规则关键字,并根据规则关键字确定电子邮件的规则回复语句,根据邮件内容确定电子邮件的意图类别,并根据意图类别确定电子邮件的多个意图回复语句,并根据规则回复语句和意图回复语句得到多个候选回复语句。又如,所述处理器也可以执行如图3中所示的步骤。
应当注意,尽管在上文详细描述中提及了邮件的智能回复装置的若干单元或子单元,但是这种划分仅仅是示例性的,并非是强制性的。实际上,根据本发明的实施方式,上文描述的两个或更多模块或单元的特征和功能可以在一个模块或单元中具体化。反之,上文描述的一个模块或单元的特征和功能可以进一步划分为由多个模块或单元来具体化。
此外,尽管在附图中以特定顺序描述了本发明方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
虽然已经参考若干具体实施方式描述了本发明的精神和原理,但是应该理解,本发明并不限于所发明的具体实施方式,对各方面的划分也不意味着这些方面中的特征不能组合以进行受益,这种划分仅是为了表述的方便。本发明旨在涵盖所附权利要求的精神和范围内所包括的各种修改和等同布置。

Claims (10)

1.一种邮件的智能回复方法,其特征在于,包括:
获取当前接收到的电子邮件中的邮件内容;
获取所述邮件内容中的规则关键字,并根据所述规则关键字确定所述电子邮件的规则回复语句;
根据所述邮件内容确定所述电子邮件的意图类别,并根据所述意图类别确定所述电子邮件的多个意图回复语句;
根据所述规则回复语句和所述意图回复语句得到多个候选回复语句;
响应于针对所述候选回复语句的选择指令,按照相应被选择的候选回复语句对所述电子邮件进行回复。
2.根据权利要求1所述的邮件的智能回复方法,其特征在于,所述根据所述邮件内容确定所述电子邮件的意图类别,包括:
将所述邮件内容输入预先训练的意图分类模型中,得到所述电子邮件所属的一个或多个意图类别,其中,所述邮件内容包括邮件主题和邮件正文。
3.根据权利要求2所述的邮件的智能回复方法,其特征在于,所述意图分类模型的训练方法包括:
获取历史电子邮件的邮件内容和对应的回复文本内容,并对所述回复文本内容进行分词处理得到多个回复词组;
根据所述回复词组在所有所述回复文本内容中的出现频率得到候选回复话术;
根据相同语义的所述候选回复话术得到回复话术簇,根据各个所述回复话术簇分别构建对应的回复内容匹配规则,并确定各个所述回复话术簇对应的意图类别;
若所述历史电子邮件的回复文本内容与所述回复话术簇对应的回复内容匹配规则相匹配,则判定所述历史电子邮件的邮件内容属于所述回复话术簇对应的意图类别;
根据所述历史电子邮件的邮件内容以及所述邮件内容对应的一个或多个意图类别得到意图类别训练数据,并根据所述意图类别训练数据训练所述意图分类模型。
4.根据权利要求1所述的邮件的智能回复方法,其特征在于,所述意图回复语句包括主意图回复语句和组合意图回复语句,所述意图类别分为寒暄类意图和目的类意图,所述根据所述意图类别确定所述电子邮件的多个意图回复语句,包括:
根据所述意图类别的置信度从各个所述意图类别中确定出目标意图类别,并从所述目标意图类别对应的回复话术簇中确定一个回复话术作为主意图回复语句;
从所述目的类意图中的各个意图类别所对应的回复话术簇中确定出多个辅助话术,并根据所述目标意图类别将所述主意图回复语句与所述辅助话术进行组合,得到多个组合意图回复语句。
5.根据权利要求1所述的邮件的智能回复方法,其特征在于,所述根据所述规则回复语句和所述意图回复语句得到多个候选回复语句,包括:
根据所述规则回复语句以及所述意图回复语句中的主意图回复语句和各个组合意图回复语句的权重参数,确定多个候选回复语句。
6.根据权利要求1所述的邮件的智能回复方法,其特征在于,在所述获取当前接收到的电子邮件中的邮件内容之后,所述方法还包括:
将所述邮件内容输入预先训练的正负样本分类模型中,得到所述电子邮件的样本类别,其中,所述样本类别包括正样本和负样本;
若所述电子邮件为正样本,则按照后续步骤对所述电子邮件进行智能回复操作;
若所述电子邮件为负样本,则不对所述电子邮件进行智能回复操作。
7.根据权利要求6所述的邮件的智能回复方法,其特征在于,所述正负样本分类模型的训练方法包括:
获取历史电子邮件的邮件内容和对应的回复文本内容,并获取所述历史电子邮件对应的回复客户端类型;
若所述历史电子邮件对应的回复客户端类型为移动客户端,且所述回复文本内容的文本长度小于或等于文本长度阈值,则将所述历史电子邮件的样本类别确定为正样本;
将不符合所述正样本的判定条件的其他历史电子邮件的样本类别确定为负样本;
根据所述历史电子邮件的邮件内容以及所述历史电子邮件的样本类别得到样本分类训练数据,并根据所述样本分类训练数据训练所述正负样本分类模型。
8.一种介质,其上存储有程序,该程序被处理器执行时实现如权利要求1至7中任一项所述的方法。
9.一种邮件的智能回复装置,其特征在于,包括:
邮件内容获取模块,被配置为获取当前接收到的电子邮件中的邮件内容;
规则回复确定模块,被配置为获取所述邮件内容中的规则关键字,并根据所述规则关键字确定所述电子邮件的规则回复语句;
意图回复确定模块,被配置为根据所述邮件内容确定所述电子邮件的意图类别,并根据所述意图类别确定所述电子邮件的多个意图回复语句;
候选回复确定模块,被配置为根据所述规则回复语句和所述意图回复语句得到多个候选回复语句;
候选回复选择模块,被配置为响应于针对所述候选回复语句的选择指令,按照相应被选择的候选回复语句对所述电子邮件进行回复。
10.一种计算设备,其特征在于,包括:处理器和存储器,所述存储器存储有可执行指令,所述处理器用于调用所述存储器存储的可执行指令执行如权利要求1至7中任一项所述的方法。
CN202110213712.1A 2021-02-25 2021-02-25 邮件的智能回复方法、介质、装置和计算设备 Active CN112818109B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110213712.1A CN112818109B (zh) 2021-02-25 2021-02-25 邮件的智能回复方法、介质、装置和计算设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110213712.1A CN112818109B (zh) 2021-02-25 2021-02-25 邮件的智能回复方法、介质、装置和计算设备

Publications (2)

Publication Number Publication Date
CN112818109A true CN112818109A (zh) 2021-05-18
CN112818109B CN112818109B (zh) 2022-09-16

Family

ID=75863876

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110213712.1A Active CN112818109B (zh) 2021-02-25 2021-02-25 邮件的智能回复方法、介质、装置和计算设备

Country Status (1)

Country Link
CN (1) CN112818109B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113315692A (zh) * 2021-05-21 2021-08-27 北京来也网络科技有限公司 结合rpa和ai的邮件处理方法、装置及电子设备
CN113343116A (zh) * 2021-07-06 2021-09-03 上海明略人工智能(集团)有限公司 基于企业数仓的智能聊天推荐方法、系统、设备及存储介质
CN114036264A (zh) * 2021-11-19 2022-02-11 四川大学 一种基于小样本学习的电子邮件作者身份归属识别方法
CN114118060A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别关键事件的方法及系统

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020073159A1 (en) * 2000-12-12 2002-06-13 Ericsson Inc. System and method for controlling inclusion of email content
US6816885B1 (en) * 2000-09-21 2004-11-09 International Business Machines Corporation Method and system to handle large volume of E-mail received from a plurality of senders intelligently
CN101047657A (zh) * 2006-03-31 2007-10-03 腾讯科技(深圳)有限公司 实现邮件快捷回复的方法及其系统
CN104516921A (zh) * 2013-09-30 2015-04-15 华为技术有限公司 自动回复方法及装置
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN108243094A (zh) * 2017-12-26 2018-07-03 广东睿江云计算股份有限公司 一种自动回复邮件的优化方法
CN108920510A (zh) * 2018-05-30 2018-11-30 出门问问信息科技有限公司 自动聊天方法、装置和电子设备
CN109670155A (zh) * 2018-11-08 2019-04-23 龙马智声(珠海)科技有限公司 一种自动回复通信信息的方法
CN110011898A (zh) * 2019-02-13 2019-07-12 平安科技(深圳)有限公司 电子邮件的回复方法、装置、存储介质及计算机设备
CN110348009A (zh) * 2019-06-19 2019-10-18 深圳壹账通智能科技有限公司 基于机器学习的邮件处理方法、装置、介质及电子设备

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6816885B1 (en) * 2000-09-21 2004-11-09 International Business Machines Corporation Method and system to handle large volume of E-mail received from a plurality of senders intelligently
US20020073159A1 (en) * 2000-12-12 2002-06-13 Ericsson Inc. System and method for controlling inclusion of email content
CN101047657A (zh) * 2006-03-31 2007-10-03 腾讯科技(深圳)有限公司 实现邮件快捷回复的方法及其系统
CN104516921A (zh) * 2013-09-30 2015-04-15 华为技术有限公司 自动回复方法及装置
CN104598445A (zh) * 2013-11-01 2015-05-06 腾讯科技(深圳)有限公司 自动问答系统和方法
CN108243094A (zh) * 2017-12-26 2018-07-03 广东睿江云计算股份有限公司 一种自动回复邮件的优化方法
CN108920510A (zh) * 2018-05-30 2018-11-30 出门问问信息科技有限公司 自动聊天方法、装置和电子设备
CN109670155A (zh) * 2018-11-08 2019-04-23 龙马智声(珠海)科技有限公司 一种自动回复通信信息的方法
CN110011898A (zh) * 2019-02-13 2019-07-12 平安科技(深圳)有限公司 电子邮件的回复方法、装置、存储介质及计算机设备
CN110348009A (zh) * 2019-06-19 2019-10-18 深圳壹账通智能科技有限公司 基于机器学习的邮件处理方法、装置、介质及电子设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
宋迪: "基于概念提取的邮件自动回复技术研究", 《微计算机信息》 *

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113315692A (zh) * 2021-05-21 2021-08-27 北京来也网络科技有限公司 结合rpa和ai的邮件处理方法、装置及电子设备
CN113343116A (zh) * 2021-07-06 2021-09-03 上海明略人工智能(集团)有限公司 基于企业数仓的智能聊天推荐方法、系统、设备及存储介质
CN114118060A (zh) * 2021-11-10 2022-03-01 北京深维智信科技有限公司 一种从销售会话中自动识别关键事件的方法及系统
CN114036264A (zh) * 2021-11-19 2022-02-11 四川大学 一种基于小样本学习的电子邮件作者身份归属识别方法

Also Published As

Publication number Publication date
CN112818109B (zh) 2022-09-16

Similar Documents

Publication Publication Date Title
CN112818109B (zh) 邮件的智能回复方法、介质、装置和计算设备
WO2018224034A1 (zh) 智能问答方法、服务器、终端及存储介质
US9740677B2 (en) Methods and systems for analyzing communication situation based on dialogue act information
US9792279B2 (en) Methods and systems for analyzing communication situation based on emotion information
US8516052B2 (en) Dynamically managing online communication groups
US10387410B2 (en) Method and system of classification in a natural language user interface
WO2016197767A2 (zh) 一种表情输入方法、装置、终端和计算机可读存储介质
CN114556354A (zh) 自动确定和呈现来自事件的个性化动作项
CN111666380A (zh) 一种智能呼叫方法、装置、设备和介质
CN110019742B (zh) 用于处理信息的方法和装置
CN109284502B (zh) 一种文本相似度计算方法、装置、电子设备及存储介质
KR102041621B1 (ko) 인공지능 음성인식 기반 기계학습의 대규모 말뭉치 구축을 위한 대화형 말뭉치 분석 서비스 제공 시스템 및 구축 방법
CN111241237A (zh) 一种基于运维业务的智能问答数据处理方法及装置
CN112948534A (zh) 一种智能人机对话的交互方法、系统和电子设备
WO2021036439A1 (zh) 一种信访问题答复方法及装置
US20230072171A1 (en) System and method for training and refining machine learning models
US20230089308A1 (en) Speaker-Turn-Based Online Speaker Diarization with Constrained Spectral Clustering
CN115309877A (zh) 对话生成方法、对话模型训练方法及装置
CN112487810A (zh) 一种智能客服服务方法、装置、设备及存储介质
Windiatmoko et al. Developing FB chatbot based on deep learning using RASA framework for university enquiries
CN114706945A (zh) 意图识别方法、装置、电子设备及存储介质
CN111858875A (zh) 智能交互方法、装置、设备及存储介质
CN111209367A (zh) 信息查找方法、信息查找装置、电子设备及存储介质
KR20190074508A (ko) 챗봇을 위한 대화 모델의 데이터 크라우드소싱 방법
CN112597292B (zh) 问题回复推荐方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant