CN111242710A - 业务的分类处理方法、装置、服务平台及存储介质 - Google Patents
业务的分类处理方法、装置、服务平台及存储介质 Download PDFInfo
- Publication number
- CN111242710A CN111242710A CN201811441761.5A CN201811441761A CN111242710A CN 111242710 A CN111242710 A CN 111242710A CN 201811441761 A CN201811441761 A CN 201811441761A CN 111242710 A CN111242710 A CN 111242710A
- Authority
- CN
- China
- Prior art keywords
- service
- data
- training
- commodity
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0641—Shopping interfaces
Landscapes
- Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供一种业务的分类处理方法、装置、服务平台及存储介质,该方法包括:获取用户请求的业务特征数据;基于所述业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;基于所述目标业务场景,为用户提供相应的业务服务。能够有效提高用户意图识别的准确性,为用户提供准确的业务服务。
Description
技术领域
本申请涉及电商平台技术领域,尤其涉及一种业务的分类处理方法、装置、服务平台及存储介质。
背景技术
随着大数据和人工智能的发展,各电商的服务平台竞相推出通过语音助手为用户提供业务服务的功能,比如语音助手导购,可以帮助用户节省时间成本,提升购物体验。
现有技术中,电商平台的语音助手服务功能,是通过根据人工配置的话术模板,对用户意图进行识别分类,由于人的认知有限,配置的话术模板包括的样本句式有限,导致对用户意图的识别分类不够灵活准确。
因此,如何有效对用户意图进行分类,以为用户提供相应的业务服务成为亟需解决的技术问题。
发明内容
本申请提供一种业务的分类处理方法、装置、服务平台及存储介质,以解决现有技术用户意图识别不准确等缺陷。
本申请第一个方面提供一种业务的分类处理方法,包括:
获取用户请求的业务特征数据;
基于所述业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;
基于所述目标业务场景,为用户提供相应的业务服务。
本申请第二个方面提供一种业务的分类处理装置,包括:
第一获取模块,用于获取用户请求的业务特征数据;
确定模块,用于基于所述业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;
处理模块,用于基于所述目标业务场景,为用户提供相应的业务服务。
本申请第三个方面提供一种服务平台,包括:至少一个处理器和存储器;
所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的计算机程序,以实现第一个方面提供的方法。
本申请第四个方面提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现第一个方面提供的方法。
本申请提供的业务的分类处理方法、装置、服务平台及存储介质,通过基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例适用的业务服务系统的结构示意图;
图2为本申请一实施例提供的业务的分类处理方法的流程示意图;
图3为本申请另一实施例提供的业务的分类处理方法的流程示意图;
图4为本申请一实施例提供的业务的分类处理装置的结构示意图;
图5为本申请另一实施例提供的业务的分类处理装置的结构示意图;
图6为本申请一实施例提供的服务平台的结构示意图。
通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
首先对本申请所涉及的名词进行解释:
卷积神经网络:CNN,Convolutional Neural Network,是一种前馈神经网络,主要包括卷积层、池化层等,用来解决分类问题,本申请中是指把用户在智能助手输入的用户请求,分到购物不同的业务场景中。
长短期记忆网络:LSTM,Long-Short Term Memory,是一种时间递归神经网络,具有多种变体,比如双向循环神经网络、深层循环神经网络等。
本申请实施例提供的业务的分类处理方法,适用于如下业务服务系统:如图1所示,为本申请实施例适用的业务服务系统的结构示意图。该业务服务系统包括服务平台,以及一个或多个用户终端。用户通过用户终端输入用户请求,可以是语音输入,也可以是文本输入,比如通过语音助手输入语音“我想买XX手机”,用户终端接收到用户请求后,发送给服务平台,服务平台则可以获取用户请求内容,生成用户请求的业务特征数据,并基于业务特征数据确定用户请求对应的目标业务场景,比如“我想买XX手机”对应的目标业务场景为商品查询场景,比如“我想要退货”对应的目标业务场景为售后服务场景等等。服务平台则可以为用户提供相应的业务服务,比如向终端返回XX手机推荐页面,或者向终端返回退货相关信息等等。
此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。在以下各实施例的描述中,“多个”的含义是两个以上,除非另有明确具体的限定。
下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。
实施例一
本实施例提供一种业务的分类处理方法,用于为用户提供相应的业务服务。本实施例的执行主体为业务的分类处理装置,该装置可以设置在服务平台中。
如图2所示,为本实施例提供的业务的分类处理方法的流程示意图,该方法包括:
步骤101,获取用户请求的业务特征数据。
具体的,当用户需要服务平台为其提供业务服务时,用户可以通过用户终端输入用户请求,可以是语音输入,也可以是文本输入,比如通过语音助手输入语音“我想买XX手机”、“我想退货”、“我想换货”等等,用户终端接收到用户请求后,发送给服务平台,服务平台则可以获取用户请求内容(具体获取用户请求内容的方式为现有技术,在此不再赘述),根据用户请求内容生成用户请求的业务特征数据。
业务特征数据是指对用户请求内容进行特征提取,获得计算机可识别的特征数据。比如将用户请求内容文本,采用文本向量模型生成业务特征数据。或者采用其他特征提取算法生成业务特征数据等等。
步骤102,基于业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景。
具体的,在获取到业务特征数据后,可以基于业务特征数据及预设的分类器网络模型,来确定用户请求对应的目标业务场景,比如“我想买XX手机”对应的目标业务场景为商品查询场景,比如“我想要退货”对应的目标业务场景为售后服务场景等等。
其中,分类器网络模型是采用大量历史业务服务数据进行训练获得的。示例性的,分类器网络模型可以采用卷积神经网络。分类器网络模型的分类器网络的结构可以包括输入层、卷积层、池化层、优化函数层、激活函数层、全连接层、输出层等等。其中,输入层业务特征数据,卷积层可以根据实际需求设置卷积核,比如卷积核可以设置为1*1、3*3、5*5等,池化层可以选用最大池化算法,优化函数层可以选用随机梯度下降算法,激活函数层可以选用softmax函数,全连接层根据激活函数输出的概率值确定出目标业务场景,输出层根据需求输出用户请求对应的目标业务场景。这里只是示例性说明,具体包括的层,以及具体各层的结构可以根据实际需求设置,本实施例不做限定。
分类器网络模型的训练过程可以为:获取大量的历史业务服务数据,对其进行业务场景标注,获得对应的业务训练标注数据,并对历史业务服务数据进行特征提取获得业务训练特征数据,采用业务训练特征数据及业务训练标注数据对预先建立的分类器网络进行训练获得分类器网络模型。
为了更好地训练分类器网络,获得更好的分类器网络模型,提高分类器网络模型的泛化能力,以及减少标注工作量,提高标注效率,可以对历史业务服务数据进行正则过滤,过滤掉垃圾信息,即没有信息含量的历史用户请求,比如“哈哈”、“好的”以及骂人的话等等。其中,进行正则过滤所采用的正则话术可以是根据实际需求设置的。
对于业务场景标注,可以是人工进行标注,也可以是结合配置的话术模板进行标注。
历史业务服务数据可以是语音助手的日志,可以从大数据Hive表获得。历史业务服务数据可以包括一个或多个字段,包括输入文本(即用户请求内容文本),还可以包括业务场景、频道编号、当前场景、设备ID、用户pin、用户位置、时间、会话ID、上下文信息等等。
可选地,业务场景可以包括商品查询场景、订单查询场景、模糊优惠查询场景、特定优惠查询场景、售后服务场景、全站直达场景及未知场景等等。具体的业务场景的划分可以根据实际需求设置,不限于这些业务场景。
其中,商品查询场景表示用户购买意图或查找商品,订单查询场景表示“订单”或“物流”相关场景,模糊优惠查询场景表示“优惠活动”或“优惠券信息”查询场景,特定优惠查询场景表示对特定商品的优惠查询场景,售后服务场景表示退货、换货、报修等售后服务场景,全站直达场景表示需要找到其他特定服务模块场景,未知场景可以表示非以上场景的场景。
步骤103,基于目标业务场景,为用户提供相应的业务服务。
具体的,在获得用户请求对应的目标业务场景后,服务平台可以基于目标业务场景,为用户提供相应的业务服务。
示例性的,若用户请求为“我想退货”,服务平台基于用户请求的业务特征数据及训练好的分类器网络模型确定用户请求对应的目标业务场景为售后服务场景,服务平台则获取售后服务场景相关信息反馈给用户终端,比如服务平台获取用户当前符合退货要求的商品的退货链接反馈给用户终端,显示给用户,或者若用户当前没有符合退货要求的商品,反馈提示信息给用户终端等等。具体的业务服务方式以及展示方式可以根据实际需求进行设置,本实施例不做限定。
可选地,分类器网络模型可以是在实际使用过程中不断学习优化,即当产生新的历史业务服务数据后,可以不断增加新的训练数据使分类器网络模型进行学习,并测试评估分类器网络模型的效果,具体训练过程与上述一致,具体不再赘述。
本实施例提供的业务的分类处理方法,基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。
实施例二
本实施例对实施例一提供的方法做进一步补充说明。
如图3所示,为本实施例提供的业务的分类处理方法的流程示意图。
作为一种可实施的方式,在上述实施例一的基础上,可选地,该方法还可以包括:
步骤2011,获取用户请求的商品特征数据。
具体的,商品特征数据是指基于用户请求内容文本生成的字级别特征、词语级别特征、产品词级别特征、品牌词级别特征等特征数据。
其中,字级别特征,表示用户请求内容文本的单个字频规律,对每个字按照在语料库中出现的频数,映射成一个字典编号,比如“我想买X手机”,每个字“我”、“想”、“买”、“X”、“手”、“机”都映射成一个字典编号;词语级别特征,表示对用户请求内容文本进行分词,比如采用结巴分词或其他分词算法进行分词,以词语的粒度提取特征,比如“手机”、“耳机”等等,可以预先设置特色词库,根据特色词库进行分词;产品词级别特征,表示用户请求内容文本如果包括了一个或多个产品词,该特征值取1,否则取0,比如“小米六”、“MATE8”等为产品词,可以设置产品词词库,根据产品词词库确定用户请求内容文本的产品词级别特征;品牌词级别特征,表示用户请求内容文本如果出现了品牌词,该特征值取1,否则取0,比如“小米”、“华为”等为品牌词,若用户请求内容文本中包括品牌词,该用户请求内容文本对应的品牌词级别特征的特征值为1,可以设置品牌词词库,根据品牌词词库确定用户请求内容文本对应的品牌词级别特征;等等。
其中,产品词表示商品名称,即商品的中心产品词,例如“小米六”、“mate8”等;品牌词表示商品品牌,比如“小米”、“华为”等等;修饰词表示商品描述,即商品的修饰词,比如黑色、红色、全面屏等等;
可选地,商品特征数据可以包括上述的一种特征,也可以包括两种或两种以上的特征,比如可以包括字级别特征或词语级别特征,也可以包括字级别特征和词语级别特征。具体可以根据实际需求进行设置。
需要说明的是,当商品特征数据中包括两种或两种以上的特征时,需要将多种特征进行特征融合。
步骤2012,基于商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品。
具体的,在获取到商品特征数据后,服务平台可以基于商品特征数据及预设的LSTM模型确定用户请求对应的目标商品。
示例性的,用户请求内容文本为“我要买小米六”,服务平台可以获取相应的商品特征数据,并基于商品特征数据及预设的LSTM模型确定用户请求对应的目标商品为:产品词“小米六”、品牌词“小米”。
其中,LSTM模型为预先训练好的,具体可以基于大量历史业务服务数据进行训练,训练的具体过程与分类器网络模型一致,在此不再赘述。
LSTM模型的具体网络结构可以根据实际需求设置,本实施例不做限定。
示例性的,LSTM模型的网络结构可以包括输入层、隐藏层、激活层、全连接层、输出层。每层的具体结构可以根据实际需求设置。
可选地,在获取商品训练特征数据时,可以对历史业务服务数据中的输入文本进行多种特征的提取,并需要将多种特征进行融合,获得融合训练特征数据,基于融合训练特征数据及LSTM模型确定用户请求对应的目标商品。
相应的,步骤103具体可以包括:
步骤1031,基于目标业务场景及目标商品,为用户提供相应的业务服务。
具体的,当确定了用户请求对应的目标业务场景及目标商品后,服务平台则可以基于目标业务场景及目标商品,为用户提供相应的业务服务,进一步提高对用户意图识别的准确性。
示例性的,若用户请求内容文本为“我要买XX手机”,服务平台确定的用户请求对应的目标业务场景为商品查询场景,目标商品为XX手机,服务平台则可以获取XX手机相关的购买链接反馈给用户终端,显示给用户,供用户选择,有效提高用户购买体验。
可选地,对于特征的种类,可以根据实际需求设置,不限于上述的字级别特征、词语级别特征、产品词级别特征、品牌词级别特征,比如还可以是CRF上下文窗口关联特征、商品修饰词特征(表示商品描述的修饰词,比如黑色、红色等)、商品性别特征(表示商品所适用的性别,比如男、男士、女、女士等)、商品价格特征(表示用户想购买的商品价格)等等。
作为另一种可实施的方式,在上述实施例的基础上,可选地,分类器网络模型通过以下步骤获得:
获取业务训练数据,业务训练数据包括业务训练特征数据及业务训练标注数据;采用业务训练特征数据及业务训练标注数据,对预先建立的分类器网络进行训练,获得分类器网络模型。
其中,获取业务训练数据,具体可以包括:
获取历史业务服务数据,历史业务服务数据至少包括多条历史请求内容;采用预设过滤规则对历史业务服务数据进行正则过滤;对过滤后的历史业务服务数据进行业务场景标注,获得业务训练标注数据;基于过滤后的历史业务服务数据及预设文本向量模型,获得业务训练特征数据。
具体的,历史请求内容即从Hive表中获取到的输入文本字段,可以包括很多条数据,可以对其进行业务场景标注,获得对应的业务训练标注数据,也可以先对其进行正则过滤,再进行业务场景标注,具体不做限定。对历史业务服务数据(或者过滤后的历史业务服务数据)进行特征提取获得业务训练特征数据,采用业务训练特征数据及业务训练标注数据对预先建立的分类器网络进行训练获得分类器网络模型。
可选地,在训练时,为了保证业务训练数据中各业务场景的均衡,需要控制各业务场景对应的业务训练数据的数量。并且,在训练过程中,反复调试模型参数及各业务场景对应的业务训练数据比例,设置离线F1值,选取F1值最高的一组模型参数保存为分类器网络模型。比如分类器网络模型训练过程中的F1值可以设置为0.92,或者可以根据实际需求设置成其他值,比如0.91、0.93等等。具体不做限定。
可选地,在训练过程中,还可以根据badcase的业务场景,重新调试业务训练数据的比例,迭代优化训练模型。
可选地,LSTM模型通过以下步骤获得:
获取商品训练数据,商品训练数据包括商品训练特征数据及商品训练槽位标签;对商品训练槽位标签进行BIOES格式转换,获得BIOES格式数据;采用商品训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型。
其中,获取商品训练数据,具体包括:
获取历史业务服务数据,历史业务服务数据至少包括多条历史请求内容;采用预设过滤规则对历史业务服务数据进行正则过滤;对过滤后的历史业务服务数据进行分词处理;基于分词结果,对过滤后的历史数据进行商品槽位标注,获得商品槽位标注数据;基于商品槽位标注数据生成商品训练槽位标签;基于过滤后的历史业务服务数据生成商品训练特征数据。
具体的,对于商品训练特征数据,其具体处理过程与上述商品特征数据一致,在此不再赘述。
对于商品训练槽位标签,示例性的,以一条数据为例,历史业务数据中的历史请求内容为“我要买黑色的小米六”,分词结果为:“我”、“要”、“买”、“黑色的”、“小米六”,对其进行商品槽位标注获得的商品槽位标注数据为:产品词“小米六”、商品修饰词“黑色的”。或者,分词结果为:“我”、“要”、“买”、“黑色的”、“小米”、“六”,商品槽位标注数据为:品牌词“小米”、商品修饰词“黑色的”。
由上可以看出,有些词可能是产品词,又可能包含在品牌词中,即一个词可能属于两个槽位,或者更多个槽位,对于这种情况,可以在网络层采用多标签网络连接,预测不同的槽位,即在训练时,需要将每个槽位都标注,比如,产品词“小米六”、品牌词“小米”,用不同的标注数据分别训练不同的LSTM网络,获得不同的LSTM模型,其中一种LSTM模型获得的结果是产品词“小米六”,另一种LSTM模型获得的结果为品牌词“小米”,这两种LSTM模型并行连接,可以对于同一个输入文本的商品特征数据,预测出不同的槽位。当然,并行连接的LSTM模型的数量可以根据实际需求设置,本实施例不做限定。
在获得了商品槽位标注数据后,服务平台可以基于商品槽位标注数据生成商品训练槽位标签。并对商品训练槽位标签进行BIOES格式转换,获得BIOES格式数据,采用商品训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型。BIOES格式转换为现有技术,在此不再赘述。
可选地,在LSTM模型训练过程中,与分类器网络模型同理,也需要进行反复调试及学习优化评估,可以设置LSTM模型的F1值为0.91或者其他值,具体可以根据实际需求设置,在此不再赘述。
可选地,商品训练特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
在获取商品训练数据之后,方法还包括:
对商品训练特征数据进行特征融合处理,获得融合训练特征数据;
相应的,采用商品训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型,包括:
采用融合训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型。
需要说明的是,由于训练LSTM模型时,将商品槽位标注数据转换成了BIOES格式数据,在采用LSTM模型预测目标商品时,LSTM模型获得的结果是BIOES格式数据,需要对其进行解码,转换成人可识别的目标商品,比如目标商品的产品词、品牌词、修饰词等等。具体的解码过程为转换成BIOES格式数据的过程的逆过程,在此不再赘述。
可选地,商品特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
相应的,在获取用户请求的商品特征数据之后,该方法还包括:
对商品特征数据进行特征融合处理,获得融合特征数据;
相应的,基于商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品,包括:
基于融合特征数据及预设的LSTM模型确定用户请求对应的目标商品。
示例性的,特征融合处理可以为Highway字词特征融合,即字级别特征和词语级别特征,将两者融合是通过神经网络的Highway层,融合之后能表达更丰富的语义。
CRF:conditional random field algorithm,是指条件随机场算法,是一种基于遵循马尔可夫性的概率图模型。
可选地,全站直达场景包括至少一个业务频道;方法还包括:
若用户请求对应的目标业务场景为全站直达场景,采用预设的语义分类子模型确定用户请求对应的目标业务频道;
相应的,基于目标业务场景,为用户提供相应的业务服务,包括:
基于目标业务场景及目标业务频道,为用户提供相应的业务服务。
其中,全站直达场景为综合场景,其可以包括多个业务频道,业务频道是指服务平台为用户提供的更细化的业务服务,比如秒杀业务频道、白条业务频道等等,比如京东服务平台全站直达场景包括数十各业务频道。语音助手支持的业务频道可以是所有业务频道也可以是部分业务频道,具体可以根据实际需求设置。
若用户请求对应的目标业务场景为全站直达场景,服务平台还可以采用预设的语义分类子模型确定用户请求对应的目标业务频道。比如每个业务频道设置相应的模板句式,在确定了用户请求对应的目标业务场景为全站直达场景后,可以进一步确定用户请求对应的目标业务频道,在确定了用户请求对应的目标业务频道后,服务平台则可以基于目标业务场景及目标业务频道为用户提供准确的业务服务,进一步提高用户意图识别的准确性。
可选地,在各模型训练好后,还可以进行线上业务联调,通过算法评估指标F1值及线上业务指标,结合服务平台、用户终端进行多方联调测试,保证良好的性能及正确的逻辑。
其中,线上业务指标是指语音助手提供业务服务带来的用户点击、订单转化、gmv(Gross Merchandise Volume,成交总额(一定时间段内)的意思)提升等。具体联调过程不是本申请重点,在此不再赘述。
本申请实施例中,F1值是指F1分数,是统计学中用来衡量二分类模型精确度的一种指标,同时兼顾了分类模型的准确率和召回率。具体为现有技术,在此不再赘述。
可选地,服务平台可以从其大数据Hive表提取产品词、品牌词。
可选地,运营人员可以根据业务经验,维护一份优质品牌词库。
可选地,还可以实时地对各种词库进行扩充,比如产品词词库、品牌词词库。示例性的,在商品槽位标注后,服务平台可以将标注的产品词与产品词词库中的产品词进行比对,判断标注的产品词是否存在于产品词词库中,若不存在,则将标注的产品词加入到产品词词库,以扩充产品词词库,同理,可以通过标注的品牌词扩充品牌词词库。可以理解地,还可以根据实际需求扩充其他词库,在此不再赘述。
可选地,服务平台还可以通过爬虫技术,从其他平台或网页爬取产品词及品牌词,来扩充产品词词库及品牌词词库。
可选地,对于各模型,可以设置其对应的参数配置窗口,以使相关人员可以在参数配置窗口调整相应的参数。
需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本申请不做限定。
本实施例提供的业务的分类处理方法,基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。并且通过LSTM模型预测用户请求对应的目标商品,进一步提高用户意图识别的准确性。还通过多特征融合,进一步提高用户意图识别的准确性。此外,通过对业务场景细化成业务频道,并进一步预测用户请求对应的目标业务频道,进一步提高用户意图识别的准确性。
实施例三
本实施例提供一种业务的分类处理装置,用于执行上述实施例一的方法。
如图4所示,为本实施例提供的业务的分类处理装置的结构示意图。该业务的分类处理装置30包括获取模块31、确定模块32和处理模块33。
其中,获取模块31用于获取用户请求的业务特征数据;确定模块32用于基于业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;处理模块33用于基于目标业务场景,为用户提供相应的业务服务。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
根据本实施例提供的业务的分类处理装置,通过基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。
实施例四
本实施例对上述实施例三提供的装置做进一步补充说明。
如图5所示,为本实施例提供的业务的分类处理装置的结构示意图。
作为一种可实施的方式,在上述实施例三的基础上,可选地,所述获取模块,还用于获取用户请求的商品特征数据;
所述确定模块,还用于基于所述商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品;
相应的,所述处理模块,具体用于基于所述目标业务场景及所述目标商品,为用户提供相应的业务服务。
作为另一种可实施的方式,在上述实施例三的基础上,可选地,该装置还包括第一训练模块34。
其中,获取模块31还用于获取业务训练数据,业务训练数据包括业务训练特征数据及业务训练标注数据;第一训练模块34用于采用业务训练特征数据及业务训练标注数据,对预先建立的分类器网络进行训练,获得分类器网络模型。
可选地,该装置还可以包括第二训练模块35。
其中,获取模块,还用于获取商品训练数据,商品训练数据包括商品训练特征数据及商品训练槽位标签;第二训练模块,用于对商品训练槽位标签进行BIOES格式转换,获得BIOES格式数据;第二训练模块,还用于采用商品训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型。
可选地,商品训练特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征。
获取模块,还用于对商品训练特征数据进行特征融合处理,获得融合训练特征数据;相应的,第二训练模块,还用于采用融合训练特征数据及BIOES格式数据,对预先建立的LSTM网络进行训练,获得LSTM模型。
可选地,商品特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征。
相应的,获取模块,还用于对商品特征数据进行特征融合处理,获得融合特征数据;处理模块,还用于基于融合特征数据及预设的LSTM模型确定用户请求对应的目标商品。
作为再一种可实施的方式,在上述实施例三的基础上,可选地,业务场景包括商品查询场景、订单查询场景、模糊优惠查询场景、特定优惠查询场景、售后服务场景、全站直达场景及未知场景。
全站直达场景包括至少一个业务频道。
确定模块,还用于若用户请求对应的目标业务场景为全站直达场景,采用预设的语义分类子模型确定用户请求对应的目标业务频道;相应的,处理模块,还用于基于目标业务场景及目标业务频道,为用户提供相应的业务服务。
可选地,获取模块,具体用于:
获取历史业务服务数据,历史业务服务数据至少包括多条历史请求内容;采用预设过滤规则对历史业务服务数据进行正则过滤;对过滤后的历史业务服务数据进行业务场景标注,获得业务训练标注数据;基于过滤后的历史业务服务数据及预设文本向量模型,获得业务训练特征数据。
可选地,获取模块,具体用于:
获取历史业务服务数据,历史业务服务数据至少包括多条历史请求内容;
采用预设过滤规则对历史业务服务数据进行正则过滤;
对过滤后的历史业务服务数据进行分词处理;
基于分词结果,对过滤后的历史数据进行商品槽位标注,获得商品槽位标注数据;
基于商品槽位标注数据生成商品训练槽位标签;
基于过滤后的历史业务服务数据生成商品训练特征数据。
关于本实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
需要说明的是,本实施例中各可实施的方式可以单独实施,也可以在不冲突的情况下以任意组合方式结合实施本申请不做限定。
根据本实施例的业务的分类处理装置,通过基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。并且通过LSTM模型预测用户请求对应的目标商品,进一步提高用户意图识别的准确性。还通过多特征融合,进一步提高用户意图识别的准确性。此外,通过对业务场景细化成业务频道,并进一步预测用户请求对应的目标业务频道,进一步提高用户意图识别的准确性。
实施例五
本实施例提供一种服务平台,用于执行上述实施例提供的方法。
如图6所示,为本实施例提供的服务平台的结构示意图。该服务平台50包括:至少一个处理器51和存储器52;
存储器存储计算机程序;至少一个处理器执行存储器存储的计算机程序,以实现上述实施例提供的方法。
根据本实施例的服务平台,通过基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。
实施例六
本实施例提供一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,计算机程序被执行时实现上述任一实施例提供的方法。
根据本实施例的计算机可读存储介质,通过基于用户请求的业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景,并基于目标业务场景,为用户提供相应的业务服务,能够更准确地识别用户请求的目标业务场景,从而为用户提供准确的业务服务。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本申请各个实施例所述方法的部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述各实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。
Claims (21)
1.一种业务的分类处理方法,其特征在于,包括:
获取用户请求的业务特征数据;
基于所述业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;
基于所述目标业务场景,为用户提供相应的业务服务。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用户请求的商品特征数据;
基于所述商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品;
相应的,所述基于所述目标业务场景,为用户提供相应的业务服务,包括:
基于所述目标业务场景及所述目标商品,为用户提供相应的业务服务。
3.根据权利要求1所述的方法,其特征在于,所述分类器网络模型通过以下步骤获得:
获取业务训练数据,所述业务训练数据包括业务训练特征数据及业务训练标注数据;
采用所述业务训练特征数据及所述业务训练标注数据,对预先建立的分类器网络进行训练,获得所述分类器网络模型。
4.根据权利要求2所述的方法,其特征在于,所述LSTM模型通过以下步骤获得:
获取商品训练数据,所述商品训练数据包括商品训练特征数据及商品训练槽位标签;
对所述商品训练槽位标签进行BIOES格式转换,获得BIOES格式数据;
采用所述商品训练特征数据及所述BIOES格式数据,对预先建立的LSTM网络进行训练,获得所述LSTM模型。
5.根据权利要求4所述的方法,其特征在于,所述商品训练特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
在获取商品训练数据之后,所述方法还包括:
对所述商品训练特征数据进行特征融合处理,获得融合训练特征数据;
相应的,采用所述商品训练特征数据及所述BIOES格式数据,对预先建立的LSTM网络进行训练,获得所述LSTM模型,包括:
采用所述融合训练特征数据及所述BIOES格式数据,对预先建立的LSTM网络进行训练,获得所述LSTM模型。
6.根据权利要求5所述的方法,其特征在于,所述商品特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
相应的,在获取用户请求的商品特征数据之后,所述方法还包括:
对所述商品特征数据进行特征融合处理,获得融合特征数据;
相应的,基于所述商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品,包括:
基于所述融合特征数据及预设的LSTM模型确定用户请求对应的目标商品。
7.根据权利要求1所述的方法,其特征在于,业务场景包括商品查询场景、订单查询场景、模糊优惠查询场景、特定优惠查询场景、售后服务场景、全站直达场景及未知场景。
8.根据权利要求3所述的方法,其特征在于,所述获取业务训练数据,包括:
获取历史业务服务数据,所述历史业务服务数据至少包括多条历史请求内容;
采用预设过滤规则对所述历史业务服务数据进行正则过滤;
对过滤后的历史业务服务数据进行业务场景标注,获得所述业务训练标注数据;
基于过滤后的历史业务服务数据及预设文本向量模型,获得所述业务训练特征数据。
9.根据权利要求4所述的方法,其特征在于,所述获取商品训练数据,包括:
获取历史业务服务数据,所述历史业务服务数据至少包括多条历史请求内容;
采用预设过滤规则对所述历史业务服务数据进行正则过滤;
对过滤后的历史业务服务数据进行分词处理;
基于分词结果,对过滤后的历史数据进行商品槽位标注,获得商品槽位标注数据;
基于所述商品槽位标注数据生成所述商品训练槽位标签;
基于过滤后的历史业务服务数据生成所述商品训练特征数据。
10.根据权利要求7所述的方法,其特征在于,所述全站直达场景包括至少一个业务频道;所述方法还包括:
若用户请求对应的目标业务场景为全站直达场景,采用预设的语义分类子模型确定用户请求对应的目标业务频道;
相应的,基于所述目标业务场景,为用户提供相应的业务服务,包括:
基于所述目标业务场景及所述目标业务频道,为用户提供相应的业务服务。
11.一种业务的分类处理装置,其特征在于,包括:
获取模块,用于获取用户请求的业务特征数据;
确定模块,用于基于所述业务特征数据及预设的分类器网络模型,确定用户请求对应的目标业务场景;
处理模块,用于基于所述目标业务场景,为用户提供相应的业务服务。
12.根据权利要求11所述的装置,其特征在于,所述获取模块,还用于获取用户请求的商品特征数据;
所述确定模块,还用于基于所述商品特征数据及预设的长短期记忆网络LSTM模型确定用户请求对应的目标商品;
相应的,所述处理模块,具体用于基于所述目标业务场景及所述目标商品,为用户提供相应的业务服务。
13.根据权利要求11所述的装置,其特征在于,所述装置还包括第一训练模块;
所述获取模块,还用于获取业务训练数据,所述业务训练数据包括业务训练特征数据及业务训练标注数据;
所述第一训练模块,用于采用所述业务训练特征数据及所述业务训练标注数据,对预先建立的分类器网络进行训练,获得所述分类器网络模型。
14.根据权利要求12所述的装置,其特征在于,所述装置还包括第二训练模块;
所述获取模块,还用于获取商品训练数据,所述商品训练数据包括商品训练特征数据及商品训练槽位标签;
所述第二训练模块,用于对所述商品训练槽位标签进行BIOES格式转换,获得BIOES格式数据;
所述第二训练模块,还用于采用所述商品训练特征数据及所述BIOES格式数据,对预先建立的LSTM网络进行训练,获得所述LSTM模型。
15.根据权利要求14所述的装置,其特征在于,所述商品训练特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
所述获取模块,还用于对所述商品训练特征数据进行特征融合处理,获得融合训练特征数据;
相应的,所述第二训练模块,还用于采用所述融合训练特征数据及所述BIOES格式数据,对预先建立的LSTM网络进行训练,获得所述LSTM模型。
16.根据权利要求15所述的装置,其特征在于,所述商品特征数据包括以下特征中的至少两种:
字级别特征、词语级别特征、产品词级别特征、品牌词级别特征、CRF上下文窗口关联特征;
相应的,所述获取模块,还用于对所述商品特征数据进行特征融合处理,获得融合特征数据;
所述处理模块,还用于基于所述融合特征数据及预设的LSTM模型确定用户请求对应的目标商品。
17.根据权利要求11所述的装置,其特征在于,业务场景包括商品查询场景、订单查询场景、模糊优惠查询场景、特定优惠查询场景、售后服务场景、全站直达场景及未知场景;
所述全站直达场景包括至少一个业务频道;
所述确定模块,还用于若用户请求对应的目标业务场景为全站直达场景,采用预设的语义分类子模型确定用户请求对应的目标业务频道;
相应的,所述处理模块,还用于基于所述目标业务场景及所述目标业务频道,为用户提供相应的业务服务。
18.根据权利要求13所述的装置,其特征在于,所述获取模块,具体用于:
获取历史业务服务数据,所述历史业务服务数据至少包括多条历史请求内容;
采用预设过滤规则对所述历史业务服务数据进行正则过滤;
对过滤后的历史业务服务数据进行业务场景标注,获得所述业务训练标注数据;
基于过滤后的历史业务服务数据及预设文本向量模型,获得所述业务训练特征数据。
19.根据权利要求14所述的装置,其特征在于,所述获取模块,具体用于:
获取历史业务服务数据,所述历史业务服务数据至少包括多条历史请求内容;
采用预设过滤规则对所述历史业务服务数据进行正则过滤;
对过滤后的历史业务服务数据进行分词处理;
基于分词结果,对过滤后的历史数据进行商品槽位标注,获得商品槽位标注数据;
基于所述商品槽位标注数据生成所述商品训练槽位标签;
基于过滤后的历史业务服务数据生成所述商品训练特征数据。
20.一种服务平台,其特征在于,包括:至少一个处理器和存储器;
所述存储器存储计算机程序;所述至少一个处理器执行所述存储器存储的计算机程序,以实现权利要求1-10中任一项所述的方法。
21.一种计算机可读存储介质,其特征在于,该计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时实现权利要求1-10中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811441761.5A CN111242710A (zh) | 2018-11-29 | 2018-11-29 | 业务的分类处理方法、装置、服务平台及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811441761.5A CN111242710A (zh) | 2018-11-29 | 2018-11-29 | 业务的分类处理方法、装置、服务平台及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111242710A true CN111242710A (zh) | 2020-06-05 |
Family
ID=70877480
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811441761.5A Pending CN111242710A (zh) | 2018-11-29 | 2018-11-29 | 业务的分类处理方法、装置、服务平台及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111242710A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159487A (zh) * | 2021-01-21 | 2021-07-23 | 全球能源互联网研究院有限公司 | 一种电力数据管理方法、装置、电子设备及存储介质 |
CN113298321A (zh) * | 2021-06-22 | 2021-08-24 | 深圳市查策网络信息技术有限公司 | 一种基于多数据融合的用户意图预测方法 |
CN113590903A (zh) * | 2021-09-27 | 2021-11-02 | 广东电网有限责任公司 | 一种情报数据的管理方法及装置 |
CN115766489A (zh) * | 2022-12-23 | 2023-03-07 | 中国联合网络通信集团有限公司 | 数据处理设备、方法及存储介质 |
-
2018
- 2018-11-29 CN CN201811441761.5A patent/CN111242710A/zh active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113159487A (zh) * | 2021-01-21 | 2021-07-23 | 全球能源互联网研究院有限公司 | 一种电力数据管理方法、装置、电子设备及存储介质 |
CN113298321A (zh) * | 2021-06-22 | 2021-08-24 | 深圳市查策网络信息技术有限公司 | 一种基于多数据融合的用户意图预测方法 |
CN113298321B (zh) * | 2021-06-22 | 2022-03-11 | 深圳市查策网络信息技术有限公司 | 一种基于多数据融合的用户意图预测方法 |
CN113590903A (zh) * | 2021-09-27 | 2021-11-02 | 广东电网有限责任公司 | 一种情报数据的管理方法及装置 |
CN113590903B (zh) * | 2021-09-27 | 2022-01-25 | 广东电网有限责任公司 | 一种情报数据的管理方法及装置 |
CN115766489A (zh) * | 2022-12-23 | 2023-03-07 | 中国联合网络通信集团有限公司 | 数据处理设备、方法及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109101537B (zh) | 基于深度学习的多轮对话数据分类方法、装置和电子设备 | |
WO2020125445A1 (zh) | 分类模型训练方法、分类方法、设备及介质 | |
CN111444709A (zh) | 文本分类方法、装置、存储介质及设备 | |
CN110020009B (zh) | 在线问答方法、装置及系统 | |
CN111242710A (zh) | 业务的分类处理方法、装置、服务平台及存储介质 | |
CN112733042B (zh) | 推荐信息的生成方法、相关装置及计算机程序产品 | |
CN112308650B (zh) | 推荐理由生成方法、装置、设备及存储介质 | |
CN111783993A (zh) | 智能标注方法、装置、智能平台及存储介质 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN113159187B (zh) | 分类模型训练方法及装置、目标文本确定方法及装置 | |
CN113435182A (zh) | 自然语言处理中分类标注的冲突检测方法、装置和设备 | |
CN117786086A (zh) | 答复文本生成方法、装置、计算机设备和可读存储介质 | |
CN116821372A (zh) | 基于知识图谱的数据处理方法、装置、电子设备及介质 | |
CN111524043A (zh) | 诉讼风险评估问卷自动生成的方法和装置 | |
CN116541517A (zh) | 文本信息处理方法、装置、设备、软件程序以及存储介质 | |
CN112735564A (zh) | 心理健康状态预测方法、设备、介质及计算机程序产品 | |
CN115982391A (zh) | 信息处理方法及装置 | |
CN110232328A (zh) | 一种征信报告解析方法、装置及计算机可读存储介质 | |
CN113378826B (zh) | 一种数据处理方法、装置、设备及存储介质 | |
CN114357964A (zh) | 主观题评分方法、模型的训练方法、计算机设备及存储介质 | |
CN116186529A (zh) | 语义理解模型的训练方法及装置 | |
CN111444338A (zh) | 文本处理、装置、存储介质及设备 | |
Zhang et al. | Business chatbots with deep learning technologies: State-of-the-art, taxonomies, and future research directions | |
CN115618968B (zh) | 新意图发现方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |