CN110008318A - 问题派发方法及装置 - Google Patents

问题派发方法及装置 Download PDF

Info

Publication number
CN110008318A
CN110008318A CN201910110659.5A CN201910110659A CN110008318A CN 110008318 A CN110008318 A CN 110008318A CN 201910110659 A CN201910110659 A CN 201910110659A CN 110008318 A CN110008318 A CN 110008318A
Authority
CN
China
Prior art keywords
user
text
layers
data
characteristic data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910110659.5A
Other languages
English (en)
Inventor
王雅芳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910110659.5A priority Critical patent/CN110008318A/zh
Publication of CN110008318A publication Critical patent/CN110008318A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/01Customer relationship services
    • G06Q30/015Providing customer assistance, e.g. assisting a customer within a business location or via helpdesk
    • G06Q30/016After-sales
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0281Customer communication at a business location, e.g. providing product or service information, consulting

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Finance (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Computational Linguistics (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Marketing (AREA)
  • Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Databases & Information Systems (AREA)
  • Human Computer Interaction (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Machine Translation (AREA)

Abstract

本公开提供一种问题派发方法及装置。该问题派发方法包括:在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及基于所述问题分类结果来将所述问题派发给对应的问题处理方。利用该方法,可以将用户问题派发到合适的问题处理方来进行处理,从而使得用户能够得到更为准确的问题答复,由此提升客服效果。

Description

问题派发方法及装置
技术领域
本公开通常涉及计算机技术领域,更具体地,涉及用于派发用户问题的方法及装置。
背景技术
在互联网企业,尤其是涉及商品交易的互联网企业,通常会提供客服系统来回答客户例如关于商品质量、商品交易流程、商品售后服务之类的咨询问题。由于客户所咨询的问题通常会涉及不同的业务或流程,不同的业务或流程需要由具有该业务或流程知识的专门客服人员或客服团队(问题处理方)来进行回复,否则会影响客服效果,从而需要提供一种将客户的咨询问题派发给合适的问题处理方的问题派发机制。
问题派发的传统做法是根据用户对需求描述进行分类。然而,很多用户并不喜欢对着机器去描述问题,或者并不清楚自己的问题重点,从而使得用户的问题描述并不准确和完善,由此导致问题派发的准确率不佳,严重地影响答复效果。
发明内容
鉴于上述,本公开提供了一种问题派发方法及装置。利用该问题派发方法及装置,通过使用序列生成模型来基于用户的问题描述文本、用户行为轨迹数据和用户特征数据对用户问题进行分类,从而使得能够基于多模态多标签数据来进行问题分类,而不是基于单一的问题描述文本,由此可以提高问题分类预测的准确率,进而能够将用户问题派发到合适的问题处理方来进行处理,使得用户能够得到更为准确的问题答复,由此提升答复效果。
根据本公开的一个方面,提供了一种问题派发方法,包括:在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及基于所述问题分类结果来将所述问题派发给对应的问题处理方。
可选地,在上述方面的一个示例中,所述序列生成模型包括编码器、解码器和分类器,以及使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类包括:将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据输入到所述编码器来进行编码处理,以得到编码向量;将所述编码向量输入到所述解码器来预测所述问题处理方和所述用户之间的对话内容;以及将所述编码向量输入到所述分类器来进行分类处理,以确定所述问题的问题分类结果,其中,所述序列生成模型中的编码器、解码器和分类器是使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练的。
可选地,在上述方面的一个示例中,将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据输入到所述编码器来进行编码处理,以得到编码向量数据包括:将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据分别输入到所述编码器中的至少一个输入层,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示;将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示分别输入到所述编码器中的第一中间隐藏层、第二中间隐藏层和第三中间隐藏层,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量;以及将所得到的所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量输入到所述神经网络模型中的拼接层进行拼接处理,以得到所述编码向量。
可选地,在上述方面的一个示例中,所述第一中间隐藏层包括LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种,所述第二中间隐藏层包括DNN层,以及所述第三中间隐藏层包括LSTM层、RNN层或GRU层。
可选地,在上述方面的一个示例中,所述分类器是Softmax分类器。
可选地,在上述方面的一个示例中,获取所述问题的问题描述文本包括:在接收到用户的问题后,至少部分地基于所述用户的用户特征数据和用户行为轨迹数据,创建至少一个问答问题;以及至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。
可选地,在上述方面的一个示例中,所述解码器使用LSTM层实现。
根据本公开的另一方面,提高一种问题派发装置,包括:获取单元,被配置为在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;问题分类单元,被配置为使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及问题派发单元,被配置为基于所述问题分类结果来将所述问题派发给对应的问题处理方。
可选地,在上述方面的一个示例中,所述序列生成模型包括:编码器,被配置为对所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行编码处理,以得到编码向量;解码器,被配置为基于所述编码向量预测所述问题处理方和所述用户之间的对话内容;以及分类器,被配置为基于所得到的编码向量进行分类处理,以确定所述问题的问题分类结果,其中,所述序列生成模型中的编码器、解码器和分类器是使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练的。
可选地,在上述方面的一个示例中,所述编码器包括:至少一个输入层,被配置为分别对所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行向量化处理,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示;第一中间隐藏层,被配置为基于所述问题描述文本的向量表示,生成所述问题描述文本的中间向量;第二中间隐藏层,被配置为基于所述用户特征数据的向量表示,生成所述用户特征数据的中间向量;第三中间隐藏层,被配置为基于所述用户行为轨迹数据的向量表示,生成所述用户行为轨迹数据的中间向量;以及拼接层,被配置为对所得到的所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量进行拼接处理,以得到所述编码向量。
可选地,在上述方面的一个示例中,所述第一中间隐藏层包括LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种,所述第二中间隐藏层包括DNN层,以及所述第三中间隐藏层包括LSTM层、RNN层或GRU层。
可选地,在上述方面的一个示例中,所述分类器是Softmax分类器。
可选地,在上述方面的一个示例中,所述问题派发装置还包括:问答问题创建单元,被配置为在接收到用户的问题后,至少部分地基于所述用户的用户特征数据和用户行为轨迹数据,创建至少一个问答问题,其中,所述获取单元被配置为:至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。
根据本公开的另一方面,提供一种计算设备,包括:至少一个处理器,以及与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如上所述的问题派发方法。
根据本公开的另一方面,提供一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如上所述的问题派发方法。
附图说明
通过参照下面的附图,可以实现对于本公开内容的本质和优点的进一步理解。在附图中,类似组件或特征可以具有相同的附图标记。
图1示出了根据本公开的实施例的问题派发方法的流程图;
图2示出了根据本公开的实施例的问题的一个示例示意图;
图3示出了根据本公开的实施例的序列生成模型的一个示例的示意图;
图4示出了根据本公开的实施例的序列生成模型中的编码器的一个示例的示意图;
图5示出了根据本公开的实施例的问题描述文本获取过程的流程图;
图6示出了根据本公开的实施例的问题描述文本获取过程的一个示例示意图;
图7示出了根据本公开的实施例的问题派发装置的结构方框图;
图8示出了根据本公开的实施例的用于问题派发的计算设备的方框图。
具体实施方式
现在将参考示例实施方式讨论本文描述的主题。应该理解,讨论这些实施方式只是为了使得本领域技术人员能够更好地理解从而实现本文描述的主题,并非是对权利要求书中所阐述的保护范围、适用性或者示例的限制。可以在不脱离本公开内容的保护范围的情况下,对所讨论的元素的功能和排列进行改变。各个示例可以根据需要,省略、替代或者添加各种过程或组件。例如,所描述的方法可以按照与所描述的顺序不同的顺序来执行,以及各个步骤可以被添加、省略或者组合。另外,相对一些示例所描述的特征在其它例子中也可以进行组合。
如本文中使用的,术语“包括”及其变型表示开放的术语,含义是“包括但不限于”。术语“基于”表示“至少部分地基于”。术语“一个实施例”和“一实施例”表示“至少一个实施例”。术语“另一个实施例”表示“至少一个其他实施例”。术语“第一”、“第二”等可以指代不同的或相同的对象。下面可以包括其他的定义,无论是明确的还是隐含的。除非上下文中明确地指明,否则一个术语的定义在整个说明书中是一致的。
在本文中,术语“问题处理方”是指服务提供方(例如公司或企业等)为了处理用户问题而设立的专门问题处理机构,比如,服务提供方的客服系统中的各个客服技能组。通常,服务提供方会设立多个问题处理方,每个问题处理方专门处理某个业务(比如,支付宝应用包、理财线等)或某个处理流程(账号相关处理流程)所涉及的用户问题,并且该问题处理方具有该业务或流程所需的各种知识能力和/或处理技能。在本公开中,所述问题处理方可以是问题处理人或者问题处理组。
下面将结合附图来详细描述根据本公开的问题派发方法及装置的实施例。
图1示出了根据本公开的实施例的问题派发方法的流程图。所述方法由问题派发装置执行,下面以公司客服系统中的问题派发装置为例来进行说明。
如图1所示,在块110,接收用户的问题。在本公开中,用户可以例如通过语音对话的方式向客服系统发出问题,例如,通过电话或者语音聊天的方式,或者可以通过按键输入或屏幕输入的方式来向客服系统发出问题。所述问题可以是一个标准问题,也可以是针对问题的一段描述文字。所述问题的格式可以是文本格式、语音格式、图片格式或者其他合适的格式。
图2示出了根据本公开的实施例的问题的一个示例示意图。
在接收到用户的问题后,在块120,获取所述问题的问题描述文本,并且从用户行为轨迹数据数据库130中获取该用户的用户行为轨迹数据以及从用户特征数据数据库140中获取该用户的用户特征数据。这里,问题描述文本是用于描述用户问题的文本描述信息。在问题的格式不是文本格式的情况下,可以采用合适的格式转换方式来将所述问题转换为文本格式的问题描述文本。此外,可选地,所述问题描述文本还可以是通过对用户所输入的文本格式的问题进行预处理后得到的文本描述信息,所述预处理例如可以是去除无效信息、提取关键分词等。
用户行为轨迹数据数据库130可以是通过经由服务提供方的内部网络和/或比如互联网、其它服务提供方的系统网络之类的外部网络收集用户的历史行为轨迹数据来创建的。例如,可以通过服务提供方的内部服务网络来收集用户的历史行为轨迹数据。所述用户的历史行为轨迹数据例如可以是用户所执行的与服务提供方所提供的服务相关联的操作序列数据,比如,针对支付宝服务,用户历史行为轨迹数据可以包括用户浏览支付宝APP次数、用户在支付宝上的操作行为序列等等。这里,所述用户行为轨迹数据是具有序列特征的数据。用户特征数据是指用于描述用户特征的各种信息的数据,比如年龄、身高、特征、消费偏好、性别、收入、职业、用户本月是否还清花呗等等。用户特征数据数据库140可以是通过经由服务提供方的内部网络和/或比如互联网、其它服务提供方的系统网络之类的外部网络收集用户特征信息来创建的。例如,可以通过服务提供方的内部服务网络来收集用户的特征数据。这里,所述用户特征数据是具有离散特征的数据。用户行为轨迹数据数据库130和用户特征数据数据库140可以存储在问题派发装置中,也可以分布在问题派发装置之外的一个或多个设备中,比如客服系统中的其他设备中,并且与问题派发装置之间经由有线或无线的方式进行通信。
接着,在块150,使用序列生成模型来基于所获取的问题描述文本、用户特征数据和用户行为轨迹数据进行问题分类。在本公开中,序列生成模型是一个编码器-解码器结构的网络,它的输入是一个序列,输出也是一个序列,其中,编码器将一个可变长度的信号序列变为固定长度的向量表示,并且解码器将这个固定长度的向量表示变成可变长度的目标信号序列。此外,本公开的序列生成模型还包括分类器。如何使用序列生成模型来进行问题分类,将在下面结合图3和图4进行描述。
在如上进行问题分类后,在块160,基于问题分类结果,将所述问题派发给对应的问题处理方。例如,将问题派发给客服系统中的与问题分类结果匹配的客服组来进行处理。
图3示出了根据本公开的实施例的序列生成模型的一个示例的示意图。如图3所示,序列生成模型包括编码器320、解码器340和分类器350。
在接收到问题描述文本、用户特征数据和用户行为轨迹数据(图3中示出为短文本310)后,编码器320来对问题描述文本、用户特征数据和用户行为轨迹数据进行编码处理,以得到编码向量330,并且将所得到的编码向量330分别输入到解码器340和分类器350。
解码器340基于编码向量330来预测出问题处理方和用户之间的对话内容(图3中示出为长文本360)。这里,问题处理方和用户之间的对话内容(长文本)是指问题处理方在接收到所派发的问题(例如,问题处理方接通了用户的电话)后,与用户之间针对问题进行的对话。分类器350基于编码向量330来进行分类处理,以确定所述问题的问题分类结果。
从上可以看出,在本公开的序列生成模型中,针对所输入的短文本310,产生两种输出结果。一种输出结果是解码器340基于编码向量330所预测出的问题处理方和用户之间的对话内容,即,问题处理方在接收到所派发的问题后,与用户之间针对问题可能进行的对话。另一种输出结果是分类器350所输出的问题分类结果,该问题分类结果将使用来执行对应的问题派发。
在本公开中,所述序列生成模型中的编码器320、解码器340和分类器350是使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练的,并且在训练过程中,使得解码器340的长文本输出以及分类器350的分类结果输出同时达到最优解。按照这种方式,使得问题处理方和用户之间的经过类目标注处理后的对话内容(即,长文本)能够成为序列生成模型的训练和优化的影响因子,对序列生成模型的训练和优化产生有利影响,从而有助于提升序列生成模型的问题分类预测的准确率。
在本公开中,编码器320和解码器340可以使用比如神经网络层来实现。例如,编码器320可以使用LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种来实现,以及解码器340可以使用LSTM层来实现。分类器350可以使用Softmax分类器来实现。
图4示出了根据本公开的实施例的编码器400的一个示例的示意图。如图4所示,编码器400包括至少一个输入层440、第一中间隐藏层450-1,350-2,350-3、第二中间隐藏层460、第三中间隐藏层470和拼接层480。
在获取到用户问题的问题描述文本410、用户的用户特征数据420和用户行为轨迹数据430后,将所获取的问题描述文本410、用户特征数据420和用户行为轨迹数据430分别输入给至少一个输入层440。至少一个输入层440可以包括一个或多个输入层,如图4所示,问题描述文本410、用户特征数据420和用户行为轨迹数据430可以分别对应一个输入层。在本公开的其它示例,也可以是问题描述文本410、用户特征数据420和用户行为轨迹数据430中的至少两个对应于至少一个输入层440中的一个输入层。输入层440分别对问题描述文本410、用户特征数据420和用户行为轨迹数据430进行向量化处理,以得到问题描述文本410、用户特征数据420和用户行为轨迹数据430的向量表示。在本公开中,输入层440可以使用嵌入层来实现。
在如上得到问题描述文本410、用户特征数据420和用户行为轨迹数据430的向量表示后,将问题描述文本410的向量表示提供给第一中间隐藏层450-1,450-2,450-3,将用户特征数据420的向量表示提供给第二中间隐藏层460,以及将用户行为轨迹数据430的向量表示提供给第三中间隐藏层470。
第一中间隐藏层450-1,450-2,450-3基于问题描述文本410的向量表示,生成问题描述文本410的中间向量。第二中间隐藏层460基于用户特征数据420的向量表示,生成用户特征数据420的中间向量。第三中间隐藏层470基于用户行为轨迹数据430的向量表示,生成用户行为轨迹数据430的中间向量。然后,第一中间隐藏层450-1,450-2,450-3、第二中间隐藏层460和第三中间隐藏层470将所生成的问题描述文本410、用户特征数据420和用户行为轨迹数据430的中间向量提供给拼接层480。
在本公开中,第一中间隐藏层450可以利用LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种来实现。例如,如图4中所示,第一中间隐藏层450可以利用LSTM层450-1、DNN层450-2和RNN层450-3来实现。第二中间隐藏层460可以利用DNN层实现。第三中间隐藏层470可以利用LSTM层、RNN层或GRU层实现。优选地,第三中间隐藏层470利用LSTM层实现。
拼接层480被配置为对所得到的问题描述文本410、用户特征数据420和用户行为轨迹数据430的中间向量进行拼接处理,以得到编码向量。拼接层480例如可以利用全连接层以及dropout函数来实现。
此外,可选地,在使用编码器来执行处理时,还可以引入注意力(Attention)机制。如何在神经网络中引入Attention机制,在本领域中是公知的,在此不再详细描述。
利用该问题派发方法及装置,通过使用序列生成模型来基于用户的问题描述文本、用户行为轨迹数据和用户特征数据对用户问题进行分类,从而使得能够基于多模态多标签数据来进行问题分类,而不是基于单一的问题描述文本,由此可以提高问题分类预测的准确率,进而能够将用户问题派发到合适的问题处理方来进行处理,使得用户能够得到更为准确的问题答复,由此提升答复效果。
此外,利用该问题派发方法及装置,所使用的序列生成模型包含编码器、解码器和分类器,并且使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练编码器、解码器和分类器,使得解码器和分类器同时得到优化,可以使得问题处理方和用户之间的对话内容能够成为序列生成模型的训练和优化的影响因子,对序列生成模型的训练和优化产生有利影响,从而有助于提升序列生成模型的问题分类预测的准确率,由此可以将用户问题派发到合适的问题处理方来进行处理,从而使得用户能够得到更为准确的问题答复,由此提升答复效果。
此外,在上述问题派发方法中,针对问题描述文本、用户行为轨迹数据和用户特征数据,基于问题描述文本、用户行为轨迹数据和用户特征数据各自的数据特征,分别采用对应的合适隐藏层来进行处理,由此使得针对问题描述文本、用户行为轨迹数据和用户特征数据的中间向量处理效率更高,从而进一步提升问题分类的准确率。
在本公开中,在一些应用场景下,用户并不喜欢对着客服系统去描述问题,或者并不清楚自己的问题重点,从而使得客服系统所接收的问题描述并不准确和完善,由此导致客服系统所获取的问题描述文本并不能准确地反映出用户的咨询意图,进而使得无法对问题进行准确地分类并将该问题派发到合适的问题处理方来进行解答。
为了获取用户问题的更多有效信息,针对问题描述文本获取过程,本公开提供了一种通过基于用户行为轨迹数据和用户特征数据来创建至少一个问答问题,并基于用户的答复来获取关于用户问题的更多有效信息的问题描述文本获取方案。
图5示出了根据本公开的实施例的问题描述文本获取过程的流程图,以及图6示出了根据本公开的实施例的问题描述文本获取过程的一个示例示意图。
如图5所示,在块510,接收用户的问题,例如,用户可以仅仅拨通一个电话,或者用户发送关于问题的问题描述,例如,用户所提供的问题描述为“我手机号丢失,然后重新补办,然后再登录支付宝,与以前的就不是同一个支付宝账号了”,如图6中所示。这里,如果所接收的问题描述是非文本格式的,则还需要执行从非文本格式到文本格式的转换操作,以得到文本格式的问题描述。
在接收到用户的问题后,在块520,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户。例如,“是想找回原先的支付宝账号吗?”,如图6中所示。此外,在所接收的问题包含问题描述时,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户可以包括:至少部分地基于所接收到的问题的问题描述、用户的用户行为轨迹数据和用户特征数据,创建一个问答问题并推送给用户。
在接收到用户的肯定答复后,流程进行到块580。如果接收到用户的否定答复,则在块540,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户。例如,“是担心原来支付宝账号找那个的资金安全吗?”,如图6中所示。在本公开的另一示例中,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户可以包括:至少部分地基于用户的用户行为轨迹数据、用户特征数据以及用户针对上一问题的答复,创建另一问答问题并推送给用户。其中,所述用户的答复可以包括用户的肯定答复或者否定答复。在一些情况下,所述用户的答复还可以包括用户的补充问题描述。
在接收到用户的肯定答复后,流程进行到块580。如果接收到用户的否定答复,则在块560,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一个问答问题并推送给用户。同样,在本公开的另一示例中,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建另一问答问题并推送给用户可以包括:至少部分地基于用户的用户行为轨迹数据、用户特征数据以及用户针对上一问题的答复,创建另一问答问题并推送给用户。其中,所述用户的答复可以包括用户的肯定答复或者否定答复。在一些情况下,所述用户的答复还可以包括用户的补充问题描述。如此循环执行上述问答过程,直到得到肯定答复,或者在创建了预定数目个问答问题并且得到用户答复后停止。优选地,所创建的问答问题的数目不超过三个。
在块580,至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本。这里,用户的答复可以包括针对问题的肯定或否定答复。或者,在本公开的其它示例中,用户的答复还可以包括其它补充描述,比如图6中的“资金安全”等。在本公开的另一示例中,在用户所发出的问题包括问题描述的情况下,至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本可以包括:至少部分地基于所述用户的问题的问题描述以及所述用户针对所创建的至少一个问答问题的答复,获取问题的问题描述文本。
此外,针对所创建的至少一个问答问题,如果用户没有答复,则可以视为“肯定”答复或者“否定”答复,并且按照“肯定”答复或者“否定”答复来执行后续操作。具体是视为“肯定”答复还是“否定”答复,可以根据具体情况来由系统设定。
利用图5中示出的问题描述文本获取过程,可以在用户不喜欢对着客服系统描述问题或者不清楚自己的问题重点的情况下,尤其是用户采用比如电话或对话聊天的方式来语音输入问题描述的情形,获取包含关于用户问题的更多有效信息的问题描述文本。
图7示出了根据本公开的实施例的问题派发装置700的结构方框图。
如图7所示,问题派发装置700包括获取单元710、问题分类单元720和问题派发单元730。
获取单元710被配置为在接收到用户的问题的问题描述后,获取所述问题的问题描述文本、用户的用户特征数据和用户行为轨迹数据。获取单元710的操作可以参考上面参照图1、图5和图6描述的块120的操作。
问题分类单元720被配置为使用序列生成模型来基于问题描述文本、用户特征数据和用户行为轨迹数据进行问题分类。问题分类单元720的操作可以参考上面参照图1、图3和图4描述的块150的操作。
问题派发单元730被配置为基于问题分类结果来将所述问题派发给对应的问题处理方。问题派发单元730的操作可以参考上面参照图1描述的块160的操作。
此外,可选地,问题派发装置700还可以包括问答问题创建单元740。问题创建单元740被配置为在接收到用户的问题后,至少部分地基于用户的用户行为轨迹数据和用户特征数据,创建至少一个问答问题。相应地,获取单元710被配置为至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。
如上参照图1到图7,对根据本公开的问题派发方法及装置的实施例进行了描述。上面的问题派发装置可以采用硬件实现,也可以采用软件或者硬件和软件的组合来实现。
图8示出了根据本公开的实施例的用于问题派发的计算设备800的方框图。如图8所示,计算设备800可以包括至少一个处理器810、存储器820、内存830和通信接口840,并且至少一个处理器810、存储器820、内存830和通信接口840经由总线860连接在一起。至少一个处理器810执行在存储器中存储或编码的至少一个计算机可读指令(即,上述以软件形式实现的元素)。
在一个实施例中,在存储器中存储计算机可执行指令,其当执行时使得至少一个处理器810:在接收到用户的问题的问题描述后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及基于所述问题分类结果来将所述问题派发给对应的问题处理方。
应该理解,在存储器中存储的计算机可执行指令当执行时使得至少一个处理器810进行本公开的各个实施例中以上结合图1-7描述的各种操作和功能。
在本公开中,计算设备800可以包括但不限于:个人计算机、服务器计算机、工作站、桌面型计算机、膝上型计算机、笔记本计算机、移动计算设备、智能电话、平板计算机、蜂窝电话、个人数字助理(PDA)、手持装置、消息收发设备、可佩戴计算设备、消费电子设备等等。
根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-7描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
根据一个实施例,提供了一种比如非暂时性机器可读介质的程序产品。非暂时性机器可读介质可以具有指令(即,上述以软件形式实现的元素),该指令当被机器执行时,使得机器执行本公开的各个实施例中以上结合图1-7描述的各种操作和功能。具体地,可以提供配有可读存储介质的系统或者装置,在该可读存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机或处理器读出并执行存储在该可读存储介质中的指令。
在这种情况下,从可读介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此机器可读代码和存储机器可读代码的可读存储介质构成了本发明的一部分。
可读存储介质的实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD-RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上或云上下载程序代码。
本领域技术人员应当理解,上面公开的各个实施例可以在不偏离发明实质的情况下做出各种变形和修改。因此,本发明的保护范围应当由所附的权利要求书来限定。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和单元都是必须的,可以根据实际的需要忽略某些步骤或单元。各步骤的执行顺序不是固定的,可以根据需要进行确定。上述各实施例中描述的装置结构可以是物理结构,也可以是逻辑结构,即,有些单元可能由同一物理实体实现,或者,有些单元可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件单元或模块可以通过机械方式或电气方式实现。例如,一个硬件单元、模块或处理器可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元或处理器还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上面结合附图阐述的具体实施方式描述了示例性实施例,但并不表示可以实现的或者落入权利要求书的保护范围的所有实施例。在整个本说明书中使用的术语“示例性”意味着“用作示例、实例或例示”,并不意味着比其它实施例“优选”或“具有优势”。出于提供对所描述技术的理解的目的,具体实施方式包括具体细节。然而,可以在没有这些具体细节的情况下实施这些技术。在一些实例中,为了避免对所描述的实施例的概念造成难以理解,公知的结构和装置以框图形式示出。
本公开内容的上述描述被提供来使得本领域任何普通技术人员能够实现或者使用本公开内容。对于本领域普通技术人员来说,对本公开内容进行的各种修改是显而易见的,并且,也可以在不脱离本公开内容的保护范围的情况下,将本文所定义的一般性原理应用于其它变型。因此,本公开内容并不限于本文所描述的示例和设计,而是与符合本文公开的原理和新颖性特征的最广范围相一致。

Claims (15)

1.一种问题派发方法,包括:
在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;
使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及
基于所述问题分类结果来将所述问题派发给对应的问题处理方。
2.如权利要求1所述的问题派发方法,其中,所述序列生成模型包括编码器、解码器和分类器,以及使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类包括:
将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据输入到所述编码器来进行编码处理,以得到编码向量;
将所述编码向量输入到所述解码器来预测所述问题处理方和所述用户之间的对话内容;以及
将所述编码向量输入到所述分类器来进行分类处理,以确定所述问题的问题分类结果,
其中,所述序列生成模型中的编码器、解码器和分类器是使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练的。
3.如权利要求2所述的问题派发方法,将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据输入到所述编码器来进行编码处理,以得到编码向量数据包括:
将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据分别输入到所述编码器中的至少一个输入层,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示;
将所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示分别输入到所述编码器中的第一中间隐藏层、第二中间隐藏层和第三中间隐藏层,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量;以及
将所得到的所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量输入到所述神经网络模型中的拼接层进行拼接处理,以得到所述编码向量。
4.如权利要求3所述的问题派发方法,其中,所述第一中间隐藏层包括LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种,所述第二中间隐藏层包括DNN层,以及所述第三中间隐藏层包括LSTM层、RNN层或GRU层。
5.如权利要求2所述的问题派发方法,其中,所述分类器是Softmax分类器。
6.如权利要求1所述的问题派发方法,其中,获取所述问题的问题描述文本包括:
在接收到用户的问题后,至少部分地基于所述用户的用户特征数据和用户行为轨迹数据,创建至少一个问答问题;以及
至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。
7.如权利要求2所述的问题派发方法,其中,所述解码器使用LSTM层实现。
8.一种问题派发装置,包括:
获取单元,被配置为在接收到用户的问题后,获取所述问题的问题描述文本、所述用户的用户特征数据和用户行为轨迹数据;
问题分类单元,被配置为使用序列生成模型来基于所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行问题分类;以及
问题派发单元,被配置为基于所述问题分类结果来将所述问题派发给对应的问题处理方。
9.如权利要求8所述的问题派发装置,其中,所述序列生成模型包括:
编码器,被配置为对所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行编码处理,以得到编码向量;
解码器,被配置为基于所述编码向量预测所述问题处理方和所述用户之间的对话内容;以及
分类器,被配置为基于所得到的编码向量进行分类处理,以确定所述问题的问题分类结果,
其中,所述序列生成模型中的编码器、解码器和分类器是使用问题处理方和用户之间的经过类目标注处理后的对话内容、用户的问题的问题描述文本、用户特征数据和用户行为轨迹数据来同时训练的。
10.如权利要求9所述的问题派发装置,其中,所述编码器包括:
至少一个输入层,被配置为分别对所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据进行向量化处理,以分别得到所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的向量表示;
第一中间隐藏层,被配置为基于所述问题描述文本的向量表示,生成所述问题描述文本的中间向量;
第二中间隐藏层,被配置为基于所述用户特征数据的向量表示,生成所述用户特征数据的中间向量;
第三中间隐藏层,被配置为基于所述用户行为轨迹数据的向量表示,生成所述用户行为轨迹数据的中间向量;以及
拼接层,被配置为对所得到的所述问题描述文本、所述用户特征数据和所述用户行为轨迹数据的中间向量进行拼接处理,以得到所述编码向量。
11.如权利要求10所述的问题派发装置,其中,所述第一中间隐藏层包括LSTM层、RNN层、GRU层、DNN层和CNN层中的至少一种,所述第二中间隐藏层包括DNN层,以及所述第三中间隐藏层包括LSTM层、RNN层或GRU层。
12.如权利要求9所述的问题派发装置,其中,所述分类器是Softmax分类器。
13.如权利要求8所述的问题派发装置,还包括:
问答问题创建单元,被配置为在接收到用户的问题后,至少部分地基于所述用户的用户特征数据和用户行为轨迹数据,创建至少一个问答问题,
其中,所述获取单元被配置为:至少部分地基于所述用户针对所创建的至少一个问答问题的答复,获取所述问题的问题描述文本。
14.一种计算设备,包括:
至少一个处理器,以及
与所述至少一个处理器耦合的存储器,所述存储器存储指令,当所述指令被所述至少一个处理器执行时,使得所述至少一个处理器执行如权利要求1到7中任一所述的方法。
15.一种非暂时性机器可读存储介质,其存储有可执行指令,所述指令当被执行时使得所述机器执行如权利要求1到7中任一所述的方法。
CN201910110659.5A 2019-02-12 2019-02-12 问题派发方法及装置 Pending CN110008318A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910110659.5A CN110008318A (zh) 2019-02-12 2019-02-12 问题派发方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910110659.5A CN110008318A (zh) 2019-02-12 2019-02-12 问题派发方法及装置

Publications (1)

Publication Number Publication Date
CN110008318A true CN110008318A (zh) 2019-07-12

Family

ID=67165727

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910110659.5A Pending CN110008318A (zh) 2019-02-12 2019-02-12 问题派发方法及装置

Country Status (1)

Country Link
CN (1) CN110008318A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362668A (zh) * 2019-07-16 2019-10-22 阿里巴巴集团控股有限公司 针对用户问句的分类方法和装置
CN110543554A (zh) * 2019-08-12 2019-12-06 阿里巴巴集团控股有限公司 针对多轮对话的分类方法和装置
CN111159378A (zh) * 2019-12-30 2020-05-15 支付宝(杭州)信息技术有限公司 对问题描述信息进行分类的方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598579A (zh) * 2015-01-14 2015-05-06 北京京东尚科信息技术有限公司 一种自动问答方法及系统
CN106503236A (zh) * 2016-10-28 2017-03-15 北京百度网讯科技有限公司 基于人工智能的问题分类方法以及装置
CN106897334A (zh) * 2016-06-24 2017-06-27 阿里巴巴集团控股有限公司 一种问题推送方法和设备
CN108874823A (zh) * 2017-05-12 2018-11-23 阿里巴巴集团控股有限公司 智能客服的实现方法和装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104598579A (zh) * 2015-01-14 2015-05-06 北京京东尚科信息技术有限公司 一种自动问答方法及系统
CN106897334A (zh) * 2016-06-24 2017-06-27 阿里巴巴集团控股有限公司 一种问题推送方法和设备
CN106503236A (zh) * 2016-10-28 2017-03-15 北京百度网讯科技有限公司 基于人工智能的问题分类方法以及装置
CN108874823A (zh) * 2017-05-12 2018-11-23 阿里巴巴集团控股有限公司 智能客服的实现方法和装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362668A (zh) * 2019-07-16 2019-10-22 阿里巴巴集团控股有限公司 针对用户问句的分类方法和装置
CN110543554A (zh) * 2019-08-12 2019-12-06 阿里巴巴集团控股有限公司 针对多轮对话的分类方法和装置
CN111159378A (zh) * 2019-12-30 2020-05-15 支付宝(杭州)信息技术有限公司 对问题描述信息进行分类的方法及装置

Similar Documents

Publication Publication Date Title
US11847106B2 (en) Multi-service business platform system having entity resolution systems and methods
US20220292525A1 (en) Multi-service business platform system having event systems and methods
US9892414B1 (en) Method, medium, and system for responding to customer requests with state tracking
US20220337538A1 (en) Customized message suggestion with user embedding vectors
US20220206993A1 (en) Multi-service business platform system having custom object systems and methods
US20200043055A1 (en) Systems and methods for intelligent peer-to-peer fundraising campaign management
US20180174037A1 (en) Suggesting resources using context hashing
JP2021121922A (ja) 特徴抽出に基くマルチモデルトレーニング方法及び装置、電子機器と媒体
CN105279672A (zh) 线索推荐
US11880666B2 (en) Generating conversation descriptions using neural networks
CN111932267A (zh) 企业金融服务风险预测方法及装置
CN110059178A (zh) 问题派发方法及装置
CN110008318A (zh) 问题派发方法及装置
KR102008169B1 (ko) 고객 질의 대응 서버, 방법 및 판독 가능 저장매체에 저장된 컴퓨터 프로그램
Kumar et al. Digitalization: A strategic approach for development of tourism industry in India
CN110033120A (zh) 用于为商户提供风险预测赋能服务的方法及装置
US10922633B2 (en) Utilizing econometric and machine learning models to maximize total returns for an entity
CN109614464A (zh) 用于业务问题识别的方法及装置
WO2022001397A1 (zh) 交互资格等级确定方法、装置、设备及存储介质
CN110046233A (zh) 问题派发方法及装置
CN113033912A (zh) 问题解决人推荐方法及装置
CN111159378B (zh) 对问题描述信息进行分类的方法及装置
CN116485527A (zh) 一种金融信用风险分析方法及装置
CN114742645B (zh) 基于多阶段时序多任务的用户安全等级识别方法及装置
US20230035505A1 (en) Systems and methods for intelligent peer-to-peer fundraising campaign management

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201016

Address after: English genus

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: English genus

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201016

Address after: English genus

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190712