CN115203394A - 一种模型训练的方法、业务执行的方法及装置 - Google Patents
一种模型训练的方法、业务执行的方法及装置 Download PDFInfo
- Publication number
- CN115203394A CN115203394A CN202210861537.1A CN202210861537A CN115203394A CN 115203394 A CN115203394 A CN 115203394A CN 202210861537 A CN202210861537 A CN 202210861537A CN 115203394 A CN115203394 A CN 115203394A
- Authority
- CN
- China
- Prior art keywords
- user
- statement
- prediction model
- training
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本说明书公开了一种模型训练的方法、业务执行的方法及装置,服务器获取到用户与客服的历史对话记录,并在获取到历史对话记录后,删除历史对话记录中的关键语句,其中,关键语句包括客服向用户询问用户所需解决的问题的语句。将删除关键语句后的历史对话记录输入待训练的预测模型中,以输出预测模型预测的客服向用户训练用户所需解决的问题的语句,作为第一预测语句。以最小化关键语句与第一预测语句之间的偏差为优化目标,对预测模型进行训练。
Description
技术领域
本说明书涉及人工智能领域,尤其涉及一种模型训练的方法、业务执行的方法及装置。
背景技术
随着计算机技术的发展,很多业务都可以通过计算机执行,如在客服应答时,可以通过计算机对用户发送的信息进行语义识别,从而获取到用户的意图,并针对用户的意图来解决用户提出的问题。
目前的语义识别的形式主要为,解析用户发送的信息,通过解析该信息,从而获取到用户的问题,之后根据获取到的问题,向用户提供解决方案。
然而,目前并不能基于语义识别准确的确定出用户希望解决的问题,从而增加了用户与客服之间的交互次数,降低了用户执行客服业务的效率较低,并且降低了用户的用户体验。
所以,如何能够准确的确定出用户在执行客服业务时所要解决的问题,提高用户执行客服业务的效率,则是一个亟待解决的问题。
发明内容
本说明书提供一种模型训练的方法、业务执行的方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种模型训练的方法,包括:
获取用户与客服的历史对话记录;
删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句;
将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句;
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
可选地,对所述预测模型进行训练之前,所述方法还包括:
根据所述预测模型所应用的业务场景,选择与所述业务场景相匹配的引导语句;
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练,具体包括:
基于所述引导语句,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
可选地,基于所述引导语句,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练,具体包括:
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,训练所述预测模型,得到待优化预测模型;
将删除所述关键语句后的所述历史对话记录以及所述引导语句输入待训练的预测模型,以输出所述预测模型在所述引导语句的基础上,预测出的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第二预测语句;
以最小化所述关键语句与所述第二预测语句之间的偏差为优化目标,对所述待优化预测模型进行训练。
可选地,针对任意引导语句,该引导语句在不同业务场景对应的预测模型中的编码相同。
本说明书提供了一种业务执行的方法,包括:
在监测到所述用户执行客服业务时,获取用户的对话记录;
将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述模型训练的方法训练得到的;
基于所述对话语句,执行针对所述用户的客服业务;
在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
可选地,所述方法还包括:
若监测到将所述对话语句发送给所述用户后,所述用户未回复所述对话语句所对应的指定应答语句,将所述对话记录发送至人工客服所使用的设备,以使得所述设备基于所述人工客服执行的操作,执行所述客服业务。
本说明书提供了一种模型训练的装置,包括:
获取模块,用于获取用户与客服的历史对话记录;
删除模块,用于删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句;
输入模块,用于将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句;
训练模块,用于以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
本说明书提供了一种业务执行的装置,包括:
获取模块,用于在监测到所述用户执行客服业务时,获取用户的对话记录;
输入模块,用于将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述模型训练的方法训练得到的;
执行模块,用于基于所述对话语句,执行针对所述用户的客服业务;
训练模块,用于在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
本说明书提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述模型训练的方法和业务执行的方法。
本说明书提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述模型训练的方法和业务执行的方法。
本说明书采用的上述至少一个技术方案能够达到以下有益效果:
在本说明书提供的模型训练的方法中,服务器获取到用户与客服的历史对话记录,并在获取到历史对话记录后,删除历史对话记录中的关键语句,其中,关键语句包括客服向用户询问用户所需解决的问题的语句。将删除关键语句后的历史对话记录输入待训练的预测模型中,以输出预测模型预测的客服向用户训练用户所需解决的问题的语句,作为第一预测语句。以最小化关键语句与第一预测语句之间的偏差为优化目标,对预测模型进行训练。
从上述方法中可以看出,服务器将历史对话记录作为训练样本,以使得预测模型可以根据整个历史对话记录预测出其中的关键语句,进而结合整个历史对话记录,可以精确的确定出用户所需解决的问题。这样一来,将上述模型训练方法训练得到的预测模型应用在实际应用中,可以准确的预测出用户所需解决的问题,从而提高了用户执行客服业务的效率。
附图说明
此处所说明的附图用来提供对本说明书的进一步理解,构成本说明书的一部分,本说明书的示意性实施例及其说明用于解释本说明书,并不构成对本说明书的不当限定。在附图中:
图1为本说明书中提供的一种模型训练的方法的流程示意图;
图2为本说明书中提供的一种业务执行的方法的流程示意图;
图3为本说明书提供的一种模型训练的装置的示意图;
图4为本说明书提供的一种业务执行的装置的示意图;
图5为本说明书提供的一种对应于图1和图2的电子设备的示意图。
具体实施方式
为使本说明书的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书中提供的一种模型训练的方法的流程示意图,包括以下步骤:
S101:获取用户与客服的历史对话记录。
为了更便捷的向用户提供服务,可以由计算机执行业务或由计算机辅助执行业务,如在客服应答时,可以利用计算机对用户发送的信息进行语义识别,从而获取到用户需要解决的问题,从而根据用户需要解决的问题,执行客服业务。
而目前在客服应答时的语义识别的主要方式为,在用户发送信息后,通过解析该信息,获取到用户的问题,并根据获取到的问题,提出需要用户提供的信息,在获取到必要信息后,提出解决方案。这样的语义识别方式虽然能获取到该信息涉及到的用户问题,但是由于是针对用户的一条信息进行语义识别,所以获取到的问题有可能并非用户希望解决的问题,同时也会存在需要用户提供重复信息的情况,导致降低了用户的用户体验。
而为了解决上述问题,本说明书提供了一种模型训练的方法。
在本说明书中,具体实施模型训练的方法的执行主体可以是设置在业务平台的服务器等设备,也可以是诸如台式电脑、笔记本电脑等终端设备,为便于描述,下面仅以服务器为例,对本说明书提供的模型训练的方法进行说明。
首先,服务器需要获取到用户与客服的历史对话记录。其中,历史对话记录可以为,任意业务场景下获取到的已明确确定出用户需要解决问题的历史对话记录。这里的业务场景可以是用户执行客服业务所基于的场景,例如,该用户是由于外卖配送超时需要执行客服业务,则该用户通过外卖订单进入到客服业务的界面时,此次客服业务的业务场景即为外卖场景。在本说明书中,对于获取到历史对话记录的业务场景不做限定,可以将在任意一种业务场景下的对话记录作为历史对话记录。
S102:删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句。
服务器在获取到历史对话记录后,删除历史对话记录中的关键语句,其中关键语句包括用于表示所述用户所需解决的问题的语句。同时,服务器可以将关键语句作为正样本,以减少标注样本所需的工作量。
在本说明书中,关键语句可以是指由用户发送的能够明确确定出用户所需解决的问题的语句,例如,用户发送:“我下单的外卖配送超时了。”服务器可以根据该语句确定用户需要解决的问题为外卖配送超时的问题,那么,该语句即为关键语句。
当然,也可以是指由客服发送的询问用户所需解决的问题的语句。例如,客服发送:“您需要解决的问题是外卖配送超时的问题吗?”服务器一旦接收到用户针对这句话所返回的确认应答(如,是,对等),则可以基于这句话,确定出用户所需解决的问题即为外卖配送超时的问题,那么,这句话也可以作为关键语句。需要指出的是,这里的关键语句可以为一句,也可以为多句。
S103:将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句。
服务器可以将删除关键语句后的历史对话记录输入待训练的预测模型中,预测模型可以根据删除关键语句后的历史对话记录的上下文信息,预测出删除的关键语句所要表示的用户所需解决的问题。预测模型将用于表示预测出的用户所需解决的问题的语句输出,作为第一预测语句。
在本说明书中,在服务器将删除关键语句后的历史对话记录输入到待训练的预测模型中时,也可以将预先设置的引导语句一起输入到待训练的预测模型中,以使得待训练模型可以根据删除关键语句后的历史对话记录和引导语句,输出用于表示预测出的用户所需解决的问题的语句。
其中,引导语句可以为情感预测语句,通过设置情感预测语句,以使得预测模型可以根据用户发送的信息,确定出用户的情绪,并根据用户的情绪,提出合适的对话方式,向用户提出解决方案。因为用户在向客服提出所需解决的问题时,有可能情绪比较激烈,这时如果直接向用户提出解决方案,往往会使得用户的情绪更为激烈。而为了提高用户的用户体验,在用户情绪比较激烈的情况下,可以先安抚用户的情绪,而后向用户提出解决方案。
当然,引导语句也可以为用于确定用户所需解决问题所属场景的场景引导语句,以及用于确定用户所需解决问题所属的事件阶段(例如,在外卖场景下,用户下单出现问题,则属于外卖业务执行之前的问题,而在配送中出现问题,则属于外卖业务执行中的问题)的事件引导语句。引导语句的可以有很多,这里就不一一列举说明了。
在模型训练的过程中,服务器可以根据预测模型所应用的业务场景选择合适的引导语句加入到预测模型中,以使得训练得到的预测模型可以适用于该业务场景。例如,服务器可以在模型训练的过程中加入情感预测语句,使得预测模型可以结合用户的情绪和用户发送的语句,提出合适的对话方式。
在实际应用中,服务器针对每一种业务场景,需要根据该场景下获取到的数据训练得到对应的预测模型,而为了减少预测模型训练的成本。在本说明书中,针对任意引导语句,该引导语句在不同业务场景对应的预测模型中的编码时相同的。具体来说,在预测模型中,可以设有用于对引导语句进行编码的编码层,所以,在对任意一个预测模型进行训练后,可以将训练得到的编码层直接复用到其他业务场景对应的预测模型中,这样一来,对于所有业务场景都共用的引导语句来说,将该引导语句输入到任意业务场景下对应的预测模型时,得到的编码都是相同的,从而从整个过程来看,极大的降低了模型训练所需的成本,提高了模型训练的效率以及部署模型的效率。
S104:以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
在将删除关键语句后的历史对话记录输入到待训练的预测模型中后,以最小化关键语句与第一预测语句之间的偏差为优化目标,对预测模型进行训练。
当然,考虑到将上述提到的引导语句加入到预测模型的训练过程中时,具体可以有两种情况实现模型训练。第一种情况,服务器可以将以最小化关键语句与第一预测语句之间的偏差为优化目标,训练得到的预测模型,并不是最终的模型,而是一个预训练的模型(为了方便描述,后面直接称之为是预训练模型)。服务器在获取到预训练模型后,可以根据预测模型所应用的业务场景,选择合适的引导语句,并将选择出的引导语句以及上述删除关键语句后的历史对话记录输入到预训练模型中,以输出预测模型在引导语句的基础上,预测出的用户所需解决的问题的语句,作为第二预测语句,进而以最小化关键语句与第二预测语句之间的偏差为优化目标,对预训练模型进行再训练。
对于第二种情况来说,服务器可以直接将该预测模型对应业务场景下的引导语句连同删除关键语句后的历史对话记录同时输入到待训练的预测模型中,并基于输入的引导语句,以最小化关键语句与第一预测语句之间的偏差为优化目标,对预测模型进行训练。这样,训练出的模型即为最终的模型。
为了提高模型的训练效率,在本说明书中,可以采用一些模型参数优化的方式,应用到模型训练的过程中,如,在本说明书中,可以利用Adapter的方式,在已经训练好的预测模型中包含的模型参数的基础上,加入一些额外的参数,这样再将预测模型在一些业务场景下作进一步地训练时,可以固定预测模型中原有的模型参数,而去调整加入的额外参数,从而提高了模型的训练效率。当然,也可以利用其它方式,如Prefix Tuning方法等,在此就不详细举例说明了。
上述为本说明书提供的一种模型训练的方法,以下结合附图,说明在实际应用中基于上述方式训练出的模型如何执行业务,如图2所示。
图2为本说明书提供的一种业务执行的方法的流程示意图,包括以下步骤:
S201:在监测到所述用户执行客服业务时,获取用户的对话记录。
当服务器检测到用户需要执行客服业务后,服务器可以在用户每发送一句语句时,将该语句和用户与客服之前的对话作为对话记录,输入到预测模型中。
服务器也可以在捕捉到用户发送的语句中包含有预设的关键词(如,退货,退款等)后,将包含有关键词的语句和该语句之前的对话记录输入到预测模型中。也可以在服务器确定用户与客服之间的对话记录中包含的语句超过设定数量后,将对话记录输入到预测模型中。
需要说明的是,在本说明书中,在用户执行客服业务的过程中,与用户对话的客服,可以是指虚拟客服。
S202:将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述模型训练的方法训练得到的。
在服务器获取到用户的对话记录后,将对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,并将输出的对话语句发送给用户。
S203:基于所述对话语句,执行针对所述用户的客服业务。
服务器在将对话语句发送给用户后,若根据用户回复的对话,确认该对话语句所表示的问题与用户所需解决的问题不同,则服务器可以将对话记录发送至人工客服所使用的设备,以使得人工客服根据对话记录执行客服业务。
若根据用户回复的对话确认该对话语句所表示的问题与用户所需解决的问题相同,服务器可以基于对话语句,提出解决该问题的解决方案,如,服务器可以根据解决方案,跳转至执行解决方案的页面。
S204:在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
服务器在确定执行完客服业务后,可以通过完整的对话记录训练预测模型。
需要说明的是,在本说明书中,预测模型也可以在确定预测出的问题与用户所需解决的问题相同后,将预测出的问题发送至人工客服所使用的设备,由该设备基于人工客服执行的操作,执行客服业务。
目前,在客服应答时的语义识别的主要方式为,用户向客服发送消息后,通过解析该单次信息,获取到用户所需解决的问题。由于该问题是根据用户发送的单句预测出来的,预测出的准确率较低,且在预测问题不准确的情况下,无法根据上下句的联系,对预测问题进行纠正,导致错误一直传递下去,影响到后续客服业务的执行。且,这种方式由于是针对用户发送的单句预测出用户所需解决的问题,因此难以处理用户需要同时解决多个问题的情况。
而通过本说明书提供的一种模型训练的方法、业务执行的方法可以看出,预测模型可以根据整个对话记录,预测出用户所需解决的问题。这样根据上述模型训练方法训练得到的预测模型在实际应用中可以准确的预测出用户所需解决的问题,提高了执行客服业务的效率。
也就是说,本说明书提供的预测模型可以基于整个对话记录,预测出用户所需解决的问题,这样对话记录中的每一句话都可以对最终预测出的用户所需解决的问题产生影响,从而获取到全局最优的结果。且,若用户需要同时解决多个问题,可以通过整个对话记录,预测出用户所需解决的多个问题,从而根据预测出的多个问题,执行客服业务。
以上为本说明书的一个或多个实施例提供的模型训练的方法,基于同样的思路,本说明书还提供了相应的模型训练的装置,如图3所示。
图3为本说明书提供的一种模型训练的装置的示意图,包括:
获取模块301,用于获取用户与客服的历史对话记录;
删除模块302,用于删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句;
输入模块303,用于将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句;
训练模块304,用于以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
可选地,对所述预测模型进行训练之前,所述训练模块304还用于根据所述预测模型所应用的业务场景,选择与所述业务场景相匹配的引导语句;
所述训练模块304具体用于,基于所述引导语句,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
可选地,所述训练模块304具体用于,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,训练所述预测模型,得到待优化预测模型;将删除所述关键语句后的所述历史对话记录以及所述引导语句输入待训练的预测模型,以输出所述预测模型在所述引导语句的基础上,预测出的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第二预测语句;以最小化所述关键语句与所述第二预测语句之间的偏差为优化目标,对所述待优化预测模型进行训练。
可选地,针对任意引导语句,该引导语句在不同业务场景对应的预测模型中的编码相同。
图4为本说明书提供的一种业务执行的装置的示意图,包括:
获取模块401,用于在监测到所述用户执行客服业务时,获取用户的对话记录;
输入模块402,用于将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述模型训练的方法训练得到的;
执行模块403,用于基于所述对话语句,执行针对所述用户的客服业务;
训练模块404,用于在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
可选地,所述执行模块403还用于,若监测到将所述对话语句发送给所述用户后,所述用户未回复所述对话语句所对应的指定应答语句,将所述对话记录发送至人工客服所使用的设备,以使得所述设备基于所述人工客服执行的操作,执行所述客服业务。
本说明书还提供了一种计算机可读存储介质,该存储介质存储有计算机程序,计算机程序可用于执行上述图1和图2提供的一种模型训练的方法和一种业务执行的方法。
本说明书还提供了图5所示的一种对应于图1和图2的电子设备的示意结构图。如图5所述,在硬件层面,该电子设备包括处理器、内部总线、网络接口、内存以及非易失性存储器,当然还可能包括其他业务所需要的硬件。处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,以实现上述图1所述的模型训练的方法和图2所述的业务执行的方法。当然,除了软件实现方式之外,本说明书并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、系统、或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书是参照根据本说明书实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。
Claims (10)
1.一种模型训练的方法,其特征在于,包括:
获取用户与客服的历史对话记录;
删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句;
将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句;
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
2.如权利要求1所述的方法,其特征在于,对所述预测模型进行训练之前,所述方法还包括:
根据所述预测模型所应用的业务场景,选择与所述业务场景相匹配的引导语句;
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练,具体包括:
基于所述引导语句,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
3.如权利要求2所述的方法,其特征在于,基于所述引导语句,以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练,具体包括:
以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,训练所述预测模型,得到待优化预测模型;
将删除所述关键语句后的所述历史对话记录以及所述引导语句输入待训练的预测模型,以输出所述预测模型在所述引导语句的基础上,预测出的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第二预测语句;
以最小化所述关键语句与所述第二预测语句之间的偏差为优化目标,对所述待优化预测模型进行训练。
4.如权利要求2所述的方法,其特征在于,针对任意引导语句,该引导语句在不同业务场景对应的预测模型中的编码相同。
5.一种业务执行的方法,其特征在于,包括:
在监测到所述用户执行客服业务时,获取用户的对话记录;
将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述权利要求1~4任一项所述的方法训练得到的;
基于所述对话语句,执行针对所述用户的客服业务;
在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
6.如权利要求5所述的方法,其特征在于,所述方法还包括:
若监测到将所述对话语句发送给所述用户后,所述用户未回复所述对话语句所对应的指定应答语句,将所述对话记录发送至人工客服所使用的设备,以使得所述设备基于所述人工客服执行的操作,执行所述客服业务。
7.一种模型训练的装置,其特征在于,包括:
获取模块,用于获取用户与客服的历史对话记录;
删除模块,用于删除所述历史对话记录中的关键语句,其中,所述关键语句包括用于表示所述用户所需解决的问题的语句;
输入模块,用于将删除所述关键语句后的所述历史对话记录输入待训练的预测模型中,以输出所述预测模型预测的所述客服向所述用户询问所述用户所需解决的问题的语句,作为第一预测语句;
训练模块,用于以最小化所述关键语句与所述第一预测语句之间的偏差为优化目标,对所述预测模型进行训练。
8.一种业务执行的装置,其特征在于,包括:
获取模块,用于在监测到所述用户执行客服业务时,获取用户的对话记录;
输入模块,用于将所述对话记录输入到预先训练的预测模型中,获取到预测模型输出的对话语句,所述预测模型是通过上述权利要求1~4任一项所述的方法训练得到的;
执行模块,用于基于所述对话语句,执行针对所述用户的客服业务;
训练模块,用于在确定执行完所述客服业务后,通过完整的对话记录,训练所述预测模型。
9.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1~4或5~6任一项所述的方法。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1~4或5~6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861537.1A CN115203394A (zh) | 2022-07-20 | 2022-07-20 | 一种模型训练的方法、业务执行的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210861537.1A CN115203394A (zh) | 2022-07-20 | 2022-07-20 | 一种模型训练的方法、业务执行的方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115203394A true CN115203394A (zh) | 2022-10-18 |
Family
ID=83583065
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210861537.1A Pending CN115203394A (zh) | 2022-07-20 | 2022-07-20 | 一种模型训练的方法、业务执行的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115203394A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115545002A (zh) * | 2022-11-29 | 2022-12-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练和业务处理的方法、装置、存储介质及设备 |
CN115545720A (zh) * | 2022-11-29 | 2022-12-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、业务风控的方法及装置 |
CN115640392A (zh) * | 2022-12-06 | 2023-01-24 | 杭州心识宇宙科技有限公司 | 一种对话系统优化的方法、装置、存储介质及电子设备 |
CN116501852A (zh) * | 2023-06-29 | 2023-07-28 | 之江实验室 | 一种可控对话模型训练方法、装置、存储介质及电子设备 |
WO2024093403A1 (zh) * | 2022-11-03 | 2024-05-10 | 支付宝(杭州)信息技术有限公司 | 一种意图识别方法、装置、设备及可读存储介质 |
-
2022
- 2022-07-20 CN CN202210861537.1A patent/CN115203394A/zh active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024093403A1 (zh) * | 2022-11-03 | 2024-05-10 | 支付宝(杭州)信息技术有限公司 | 一种意图识别方法、装置、设备及可读存储介质 |
CN115545002A (zh) * | 2022-11-29 | 2022-12-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练和业务处理的方法、装置、存储介质及设备 |
CN115545720A (zh) * | 2022-11-29 | 2022-12-30 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、业务风控的方法及装置 |
CN115545720B (zh) * | 2022-11-29 | 2023-03-10 | 支付宝(杭州)信息技术有限公司 | 一种模型训练的方法、业务风控的方法及装置 |
CN115640392A (zh) * | 2022-12-06 | 2023-01-24 | 杭州心识宇宙科技有限公司 | 一种对话系统优化的方法、装置、存储介质及电子设备 |
CN116501852A (zh) * | 2023-06-29 | 2023-07-28 | 之江实验室 | 一种可控对话模型训练方法、装置、存储介质及电子设备 |
CN116501852B (zh) * | 2023-06-29 | 2023-09-01 | 之江实验室 | 一种可控对话模型训练方法、装置、存储介质及电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107437416B (zh) | 一种基于语音识别的咨询业务处理方法及装置 | |
CN115203394A (zh) | 一种模型训练的方法、业务执行的方法及装置 | |
WO2023246393A1 (zh) | 意图识别模型训练及用户意图识别 | |
CN115545002B (zh) | 一种模型训练和业务处理的方法、装置、存储介质及设备 | |
CN115129878B (zh) | 一种对话业务执行方法、装置、存储介质及电子设备 | |
CN117076650B (zh) | 一种基于大语言模型的智能对话方法、装置、介质及设备 | |
CN111507726B (zh) | 一种报文生成方法、装置及设备 | |
CN113342945A (zh) | 一种语音会话处理方法及装置 | |
CN112735407A (zh) | 一种对话处理方法及装置 | |
CN115455166A (zh) | 一种智能对话系统异常检测的方法、装置、介质及设备 | |
CN116050410A (zh) | 基于数字在线会话服务的大数据分析方法及深度学习系统 | |
CN117369783B (zh) | 一种安全代码生成模型的训练方法及装置 | |
CN113343085B (zh) | 一种信息推荐方法、装置、存储介质及电子设备 | |
CN112559575A (zh) | 一种搜索处理方法、客服信息处理方法及装置 | |
CN117828360A (zh) | 一种模型训练、代码生成方法、装置、存储介质及设备 | |
CN115620706B (zh) | 一种模型训练方法、装置、设备及存储介质 | |
CN116822606A (zh) | 一种异常检测模型的训练方法、装置、设备及存储介质 | |
CN115545353A (zh) | 一种业务风控的方法、装置、存储介质及电子设备 | |
CN114676257A (zh) | 一种对话主题确定方法及装置 | |
CN110704742B (zh) | 一种特征提取方法及装置 | |
CN113407689A (zh) | 一种模型训练和业务执行的方法及装置 | |
CN113344590A (zh) | 一种模型训练以及投诉率预估的方法及装置 | |
CN116501852B (zh) | 一种可控对话模型训练方法、装置、存储介质及电子设备 | |
CN115658891B (zh) | 一种意图识别的方法、装置、存储介质及电子设备 | |
CN113223501B (zh) | 一种语音交互业务的执行方法及执行装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |