CN111291253B

CN111291253B - 模型训练方法、咨询推荐方法、装置及电子设备

Info

Publication number: CN111291253B
Application number: CN201811488865.1A
Authority: CN
Inventors: 王奇文
Original assignee: Beijing Didi Infinity Technology and Development Co Ltd
Current assignee: Beijing Didi Infinity Technology and Development Co Ltd
Priority date: 2018-12-06
Filing date: 2018-12-06
Publication date: 2023-09-19
Anticipated expiration: 2038-12-06
Also published as: CN111291253A

Abstract

本申请提供了一种模型训练方法、咨询推荐方法、装置及电子设备，其中，该方法包括：获取至少两个业务线对应的用户数据，所述业务线为网约服务的一服务模块；将所述用户数据进行标记处理得到使用数据；将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块。

Description

模型训练方法、咨询推荐方法、装置及电子设备

技术领域

本申请涉及数据处理技术领域，具体而言，涉及一种模型训练方法、咨询推荐方法、装置及电子设备。

背景技术

各类应用程序都可能提供多个业务线，每个业务线有相互独立的工作逻辑，用户可以根据需求选择不同的业务线下的业务服务。为了更好的服务，各个业务线下会存在一些智能推荐模型，以实现更好地为用户服务；但是现有的各个业务线下的智能推荐模型相互独立，导致不能很好匹配用户的需求。

发明内容

有鉴于此，本申请实施例的目的在于提供一种模型训练方法、咨询推荐方法、装置及电子设备，能够通过将不同业务线的数据统一输入多任务模型中，实现多个任务的训练解决现有技术中存在的忽略了不同业务线的数据存在关联的问题，实现充分利用不同业务线的公共信息，满足不同的训练目标，提高模型训练的效果。

根据本申请的一个方面，提供一种电子设备，可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时，处理器与存储介质之间通过总线通信，处理器执行所述机器可读指令，以执行一个或多个以下操作：

获取至少两个业务线对应的用户数据，所述业务线为网约服务的一服务模块；

将所述用户数据进行标记处理得到使用数据；

将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块。

本申请实施例中的模型训练方法，通过将不同业务线下的数据输入一个多任务模型中进行训练，可以在一个模型中实现针对多个业务线的任务的训练，另外，关于不同的业务线相关联的数据也可以共用，从而可以使不同业务线对应的任务模块能够更好地被训练，从而使训练出来的咨询推荐模型能够更好地匹配用户的需求。

在一些实施例中，所述使用数据包括训练数据及测试数据，所述将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型的步骤，包括：

a.将所述训练数据输入多任务模型中进行训练得到初始推荐模型；

b.将所述测试数据输入所述初始推荐模型进行验证，得到所述初始推荐模型的推荐准确率；

若所述推荐准确率小于设定值，则返回步骤a；

重复上述的步骤a和b，直到所述推荐准确率小于设定值，将所述推荐准确率达到所述设定值对应的初始推荐模型作为咨询推荐模型。

本实施例中的方法，通过训练数据与测试数据的配合，可以使模型在不断调整的过程中，在提高训练速度的同时，还能够使用训练得到的咨询推荐模型也能够更好地检测到用户的需求。

在一些实施例中，所述将所述训练数据输入多任务模型中进行训练得到初始推荐模型的步骤，包括：

将所述训练数据输入所述多任务模型；

每个任务模块分别获取所需的局部训练数据进行任务训练，得到局部初始推荐模型，所有任务模块对应的局部初始推荐模型形成初始推荐模型。

在一些实施例中，所述多任务模型包括：两层浅层神经网络层和一层分类层；所述将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型的步骤，包括：

将所述使用数据输入所述浅层神经网络层进行计算，得到输出向量；

将所述输出向量输入所述分类层进行分类处理，得到分类结果；

根据所述分类结果调整所述多任务模型中的参数；

重复上述的步骤，知道所述分类结果的准确率达到设定值。

本实施例中的方法，通过使用两层结构相对简单的浅层神经网络层实现对模型的快速训练，减少训练所花费时间，提高训练效率。

在一些实施例中，所述多任务模型包括至少两个业务线与至少一个场景组合形成的任务模块，任一任务模块表示为在一业务线下的一场景匹配的任务。

在一些实施例中，所述网约服务为网约车服务，所述至少两个业务线包括：快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾；所述至少一个场景包括：问题咨询、位置推荐、菜单推荐；所述任务模块包括任一上述的业务线下的任一场景的模型训练模块。

在网约车服务领域中包括多个不同的业务线，通过将多个业务线的数据放一起作为多任务模型的训练数据，可以使用不同业务线之前有关联的数据也可以作为其它业务线对应的任务训练所用数据，可以减少在训练任务时一定程度上的用户数据缺失，从而可以使训练得到的咨询推荐模型更加完善。

在一些实施例中，所述用户数据包括：订单数据、个人信息；所述将所述用户数据进行标记处理得到使用数据的步骤，包括：

根据所述个人信息为所述用户数据设置标签；

根据所述订单数据提取所述用户数据的特征信息；

将携带有所述标签的特征信息作为使用数据。

通过将用户数据根据个人信息设置标签，可以使训练出来的咨询推荐模型能够更好针对性，针对不同的用户可提供不同的推荐策略性，从而更好地匹配用户的需求。

在另一方面，本申请实施例还提供一种咨询推荐方法，包括：

将待推荐用户数据输入上述咨询推荐模型中进行计算，得到推荐内容。

在另一方面，本申请实施例还提供一种模型训练装置，包括：

获取模块，用于获取至少两个业务线对应的用户数据，所述业务线为网约服务的一服务模块；

标记模块，用于将所述用户数据进行标记处理得到使用数据；

训练模块，用于将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块。

在一些实施例中，所述使用数据包括训练数据及测试数据，所述训练模块，还用于：

若所述推荐准确率小于设定值，则返回a过程；

重复上述的a和b过程，直到所述推荐准确率小于设定值，将所述推荐准确率达到所述设定值对应的初始推荐模型作为咨询推荐模型。

在一些实施例中，所述训练模块，还用于：

将所述训练数据输入所述多任务模型；

在一些实施例中，所述多任务模型包括：两层浅层神经网络层和一层分类层；所述训练模块，还用于：

根据所述分类结果调整所述多任务模型中的参数；

重复上面两个过程，直到所述分类结果的准确率达到设定值。

在一些实施例中，所述用户数据包括：订单数据、个人信息；所述标记模块，还用于：

根据所述个人信息为所述用户数据设置标签；

根据所述订单数据提取所述用户数据的特征信息；

将携带有所述标签的特征信息作为使用数据。

在另一方面，本申请实施例还提供一种咨询推荐装置，包括：

推荐模块，用于将待推荐用户数据输入上述咨询推荐模型中进行计算，得到推荐内容。

在另一方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一种可能的实施方式中模型训练方法的步骤。

在另一方面，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一种可能的实施方式中咨询推荐方法的步骤。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种电子设备的结构示意图；

图2示出了本申请实施例所提供的一种模型训练方法的流程图；

图3示出了本申请实施例所提供的一种模型训练方法中使用到的多任务模型的示意图

图4示出了本申请实施例所提供的咨询推荐方法的流程图；

图5示出了本申请实施例所提供的一种模型训练装置的结构示意图；

图6示出了本申请实施例所提供的一种咨询推荐装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容，结合特定应用场景“网约车服务”，给出以下实施方式。对于本领域技术人员来说，在不脱离本申请的精神和范围的情况下，可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕网约车服务进行描述，但是应该理解，这仅是一个示例性实施例。本申请可以应用于任何其他交通运输类型。例如，本申请可以应用于不同的运输系统环境，包括陆地，海洋，或航空等，或其任意组合。运输系统的交通工具可以包括出租车、私家车、顺风车、公共汽车、火车、子弹头列车、高速铁路、地铁、船只、飞机、宇宙飞船、热气球、或无人驾驶车辆等，或其任意组合。本申请还可以包括用于存在在线咨询的任何服务系统，例如，用于发送和/或接收快递的系统、用于买卖双方交易的服务系统。本申请的系统或方法的应用可以包括网页、浏览器的插件、客户端终端、定制系统、内部分析系统、或人工智能机器人等，或其任意组合。

需要说明的是，本申请实施例中将会用到术语“包括”，用于指出其后所声明的特征的存在，但并不排除增加其它的特征。

本申请中的术语“乘客”、“请求方”、“服务人员”、“服务请求方”和“客户”可互换使用，以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“提供方”、“服务提供方”和“供应商”可互换使用，以指代可以提供服务的个人、实体或工具。本申请中的术语“用户”可以指代请求服务、订购服务、提供服务或促成服务的提供的个人、实体或工具。例如，用户可以是乘客、驾驶员、操作员等，或其任意组合。在本申请中，“乘客”和“乘客终端”可以互换使用，“驾驶员”和“驾驶员终端”可以互换使用。

在用户使用应用程序时，针对各个服务模块可能会需要向后台咨询详细情况。因此，就这类问题，现有技术中有通过提供在线客服、或者电话在线咨询的服务以解决用户的咨询需求。但是，在线客服或电话在线咨询需要人工的帮助，比较浪费人力资源。基于此，由于人工智能的发展，可以通过用户数据训练出可以用的智能推荐模型，针对每一个独立的服务模块对应匹配一个独立的智能推荐模型。例如，“猜你想问”的推荐模型在不同业务线：快车、专车、顺风车等中分别使用了不同的模型，相互之间独立。

发明人对不同的业务线进行了详细的研究，即使是不同的业务线也会存在一些相似的需求，因此，不同场景、业务线使用不同的推荐模型，这种做法带来了一些问题：

1)、完整的用户行为被割裂：理论上，数据是用户行为的一面镜子，不同渠道收集到的数据刻画的是同一个人，单独处理会将完整的信息割裂；

2)、信息丢失：实际上，不同业务线、场景之间有一定的关联关系，如，快车上投诉过费用问题的用户很可能在顺风车上也投诉费用问题，如果简单隔离，会造成一定程度上的信息丢失，不利于推荐系统的完善；

3)、重复开发、维护代价大：工程实现上，多个模型相互隔离，工作量往往会大很多。一旦各个业务线或场景中的通用信息变更，所有模型都得一起修改，如果更改不及时可能会存在安全隐患。

值得注意的是，在本申请提出申请之前，在一个系统中如果存在多个业务线的话，会针对每个业务线独立的训练一个用于根据用户需求为用户推荐相关内容的模型。然而，本申请提供的模型训练方法可以将不同的业务线中的用户数据结合起来，作为训练模型的数据，有关联的数据可以用在不用的业务线对应的任务中训练。因此，通过本申请实施例中的模型训练房，本申请的模型训练装置可以达到充分利用不同业务线的公共信息，满足不同的训练目标，提高模型训练的效果。

下面通过多个实施例来详细描述上述的研究工程及实现方式。

实施例一

首先，提供一个能够执行本申请实施例提供的模型训练方法、咨询推荐方法中的各个步骤的电子设备。

图1示出根据本申请的一些实施例的电子设备100的示例性硬件和软件组件的示意图。

电子设备100可以是通用计算机或特殊用途的计算机，两者都可以用于实现本申请的模型训练方法或咨询推荐方法。本申请尽管仅示出了一个计算机，但是为了方便起见，可以在多个类似平台上以分布式方式实现本申请描述的功能，以均衡处理负载。

例如，电子设备100可以包括连接到网络的网络端口110、用于执行程序指令的一个或多个处理器120、通信总线130、和不同形式的存储介质140，例如，磁盘、ROM、或RAM，或其任意组合。示例性地，计算机平台还可以包括存储在ROM、RAM、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备100还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(Input/Output，I/O)接口150。

为了便于说明，在电子设备100中仅描述了一个处理器。然而，应当注意，本申请中的电子设备100还可以包括多个处理器，因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如，若电子设备100的处理器执行步骤A和步骤B，则应该理解，步骤A和步骤B也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如，第一处理器执行步骤A，第二处理器执行步骤B，或者第一处理器和第二处理器共同执行步骤A和B。

实施例二

本实施例提供一种模型训练方法。图2示出了本申请一个实施例中的模型训练方法的流程图。下面对图2所示的模型训练方法的流程进行详细描述。

步骤S201，获取至少两个业务线对应的用户数据。

其中，上述的业务线可以是网约服务的一服务模块。上述的网约服务可以是网约车服务、外送服务等。

在网约车服务领域中，上述的至少两个业务线可以包括：快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾等。

在外送服务领域，上述的至少两个业务线可以包括：外卖配送业务、外卖提供业务、跑腿业务、快递接收、快递发送等。

在一些实施例中，上述的用户数据包括：订单数据、个人信息。

上述的订单数据可以包括订单中所请求的服务详情、服务账单等。

在网约车服务领域中，上述的订单中所请求的服务详情可以包括出发位置、终点位置、约车服务类型、服务车信息等。约车类型可以是快车、专车、顺风车、代驾、豪华车、代驾等。服务车信息可以包括车辆型号、车牌号等。

在外送服务领域中，上述的订单中所请求的服务详情可以包括：配送出发位置、配送终点位置、配送物等。

下面主要就网约车服务领域进行详细描述，关于不同业务线之间的用户数据之间的关系。

不同业务线、不同场景下的信息存在相同之处、也存在不同之处。

不同业务线下的用户数据存在不同，比如：同样是订单、账单信息，放在不同的业务线和场景下，特征会有所不同，例如，顺风车和快车有拼车信息，需要接多个乘客，因而等待时间会偏长；专车的车型不同于快车，服务更好，但费用会更高等。

不同业务线下的用户数据存在相关之处，比如：不同业务线之间可能都会有价格相关的数据咨询、定点位置推荐等问题。

本实施例中，可以从订单数据库中获取用户数据；也可以在一段时间内监控用户的行为，获取这段时间内用户的产生的用户数据。

步骤S202，将所述用户数据进行标记处理得到使用数据。

上述的使用数据可以包括用于训练的训练数据、用于测试训练得到的模型的准确率的测试数据。

上述的用户数据包括：订单数据、个人信息。

上述的步骤S202包括：根据所述个人信息为所述用户数据设置标签；根据所述订单数据提取所述用户数据的特征信息；将携带有所述标签的特征信息作为使用数据。

将用户进行根据其携带的信息进行标记处理，数据组合：按照用户维度组织数据，含特征+标签，划分训练集和测试集。

通过用户数据的个人信息为用户数据设定标签，其中，标签可以包括：司机、乘客的个人信息，如性别、年龄、籍贯、地域、服务分、信用分、等级、手机型号等。通过标签可以标识出用户数据的静态画像信息。

通过用户数据中的订单数据提取特征数据，其中，用户特征可以包括：提取订单生命周期内有关信息，分成行程前、行程中和行程后。具体地，特征字段可以是订单进行过程中产生的数据。

在一个实例中，在网约车服务中，个人信息可以是乘客的个人信息，也可以是司机的个人信息。上述的乘客个人信息可以包括：身份信息、服务信息、投诉信息、行为信息等。身份信息可以包括，但不限于，年龄、性别、籍贯等。服务信息可以包括：用户等级、用户分值等。投诉信息包括：是否有投诉记录。行为信息可以包括：打车时间、频次、地域分布等。上述的司机个人信息可以包括：身份信息、服务信息、投诉信息、行为信息等。身份信息可以包括，但不限于，年龄、性别、籍贯等。服务信息可以包括：用户等级、服务分值、最近一次服务分值波动等。投诉信息包括：是否有被投诉记录、投诉类型。行为信息可以包括：出车时间、频次、地域分布等。

订单信息可以包括：起始地点、业务线、订单费用、订单绕路状况、取消订单与否、行驶路线是否偏离导航路线、行驶中的定位、订单对应的双方账号与客服的通信、服务方与被服务方进入客服的顺序、行车速度等。

步骤S203，将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型。

上述的多任务模型可表示为multi-task模型。

上述的多任务模型中包括所述至少两个业务线对应的任务模块。具体地，每个业务线也可以对应多个任务模块。

在一种实施方式中，若一应用平台提供了网约车服务、外卖、团购等多种服务模块。上述的多任务模型中可以对应有网约车服务、外卖、团购等服务模块对应的任务模块。

在一些实施例中，上述的多任务模型包括至少两个业务线与至少一个场景组合形成的任务模块，任一任务模块表示为在一业务线下的一场景匹配的任务。

在一个应用场景中，至少两个业务线可以包括快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾、团购、外卖等。至少一个场景包括：问题咨询、位置推荐、菜单推荐。

问题咨询的问题可以包括：港澳台人士认证如何实名制认证、领取优惠券后如何查看、押金怎么退款等。上述的问题仅仅是示意性的，具体可以根据具体的使用环境选择更多或者更少的问题。

位置推荐的位置可以包括：兴趣位置推荐、出行终点位置推荐、出行起点位置推荐等。

菜单推荐的菜单可以包括：出行游玩栏目、热门美食栏目、民宿/公寓栏目等。上述的问题、位置、菜单仅仅是示意性的，具体可以根据具体的使用环境选择更多或者更少的问题、位置、菜单。

在此应用场景中，可以为上述的多任务模型匹配任务数量是：8条业务线×3个场景，也就是二十四个任务模块。任务模块可以是快车业务下的问题咨询任务；专车业务下的问题咨询任务；顺风车业务下的问题咨询任务；代驾业务下的问题咨询任务；豪华车业务下的问题咨询任务；代驾下的问题咨询任务；团购下的问题咨询任务；外卖下的问题咨询任务；…等，在此不再穷举。

每个任务模块可以匹配有不同的任务目标。在一个实例中，每个业务线下可能对应的咨询问题对应的问题供应数量不同，例如，快车可能有15个候选问题项、专车可能有12个候选问题项、顺风车可能有20个候选问题项等。则快车业务下的问题咨询任务中将15个候选问题项作为任务的目标；专车业务下的问题咨询任务中将12个候选问题项作为任务的目标。

上述的目标可以表示为咨询推荐模型对用户数据识别后的输出结果，也就是目标作为推荐内容。

在一些实施例中，所述使用数据包括训练数据及测试数据，步骤S203可以包括：

c.判断上述的推荐准确率是否小于设定值。

若判断得到推荐准确率小于设定值，则返回步骤a，重复上述的步骤a和b，直到所述推荐准确率小于设定值，将所述推荐准确率达到所述设定值对应的初始推荐模型作为咨询推荐模型。

在一些实施例中，上述的将所述训练数据输入多任务模型中进行训练得到初始推荐模型的步骤，包括：将所述训练数据输入所述多任务模型；每个任务模块分别获取所需的局部训练数据进行任务训练，得到局部初始推荐模型，所有任务模块对应的局部初始推荐模型形成初始推荐模型。

具体地，在训练不同的任务模块时，使用的局部训练数据可以有交叉数据。

例如，在训练快车业务下的问题咨询任务和专车业务下的问题咨询任务时，关于输出的目标是价格问题时，均可以使用用户数据中的价格相关的数据。

为了使本领域的技术人员能够更好地实现本申请实施例中的方法，下面针对多任务模型的结构或实现方式进行描述。

上述的多任务模型可以使用以下两种方式实现：隐层参数的硬共享与软共享。(1)参数的硬共享机制：可以应用到所有任务的所有隐层上，而保留任务相关的输出层。(2)参数的软共享机制：每个任务都由独立模型，独立的训练数据，对模型数据的距离进行正则化来保障参数的相似。

在一种实施方式中，上述的多任务模型包括：两层浅层神经网络层和一层分类层；所述将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型的步骤，包括：

根据所述分类结果调整所述多任务模型中的参数；

重复上述的步骤，知道所述分类结果的准确率达到设定值。

在一个实例中，上述的多任务模型中对应有三个任务模块，其中包括：第一业务线中的司机的问题咨询、第一业务线中的乘客的问题咨询和第二业务线中司机的问题咨询。

如图3所示，在多任务模型的输入数据可以包括第一业务线中的司机数据、第一业务线中的乘客数据及第二业务线中的司机数据。将第一业务线中的司机数据、第一业务线中的乘客数据及第二业务线中的司机数据景观两层浅层神经网络层的训练得到输出向量，再将该输出向量输入分类层(softmax层)进行分类得到训练过程中的目标输出。图中示出的三个任务输出分别包括：第一业务线中司机-目标；第一业务线中乘客-目标；第二业务线中司机-目标。

在一个实例中，第一业务线中司机-目标可以是在问题咨询场景下的多个问题；第一业务线中乘客-目标可以是在问题咨询场景下的多个问题；第二业务线中司机-目标可以是在问题咨询场景下的多个问题。在另一个实例中，第一业务线中司机-目标可以是在菜单推荐场景下的多个菜单；第一业务线中乘客-目标可以是在菜单推荐场景下的多个菜单；第二业务线中司机-目标可以是在菜单推荐场景下的多个菜单。

实施例三

本实施例提供一种咨询推荐方法。图4示出了本申请一个实施例中的模型训练方法的流程图。下面对图4所示的模型训练方法的流程进行详细描述。

步骤S301，将待推荐用户数据输入上述咨询推荐模型中进行计算，得到推荐内容。

步骤S302，将推荐内容发送给当前咨询终端。

上述的当前咨询终端可以是服务请求方终端，也可以是服务提供方终端。

进一步地，若步骤S301在上述的当前咨询终端中执行，则上述的步骤S302可以被省略。

通过本实施例中的咨询推荐方法，可以使根据用户当前的情况进行识别，从而为用户匹配出需要的推荐内容，更好地满足用户的需求，提高用户使用体验。

实施例四

基于同一申请构思，本申请实施例中还提供了与模型训练方法对应的模型训练装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述模型训练方法相似，因此装置的实施可以参见方法实施例中的描述，重复之处不再赘述。

图5是示出本申请的一些实施例的模型训练装置的框图，该模型训练装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器，或服务器的处理器，也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件，如图5所示，模型训练装置可以包括：获取模块401、标记模块402以及训练模块403，其中，

获取模块401，用于获取至少两个业务线对应的用户数据，所述业务线为网约服务的一服务模块；

标记模块402，用于将所述用户数据进行标记处理得到使用数据；

训练模块403，用于将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块。

在一些实施例中，所述使用数据包括训练数据及测试数据，所述训练模块403，还用于：

若所述推荐准确率小于设定值，则返回a过程；

在一些实施例中，所述训练模块403，还用于：

将所述训练数据输入所述多任务模型；

在一些实施例中，所述多任务模型包括：两层浅层神经网络层和一层分类层；所述训练模块403，还用于：

根据所述分类结果调整所述多任务模型中的参数；

在一些实施例中，所述网约服务为网约车服务，所述至少两个业务线包括：快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾；所述至少一个场景包括：问题咨询、位置推荐、菜单推荐；所述任务模块包括任一上述的业务线下的任一场景的模型训练模块403。

在一些实施例中，所述用户数据包括：订单数据、个人信息；所述标记模块402，还用于：

根据所述个人信息为所述用户数据设置标签；

根据所述订单数据提取所述用户数据的特征信息；

将携带有所述标签的特征信息作为使用数据。

上述模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等，或其任意组合。无线连接可以包括通过LAN、WAN、蓝牙、ZigBee、或NFC等形式的连接，或其任意组合。两个或更多个模块可以组合为单个模块，并且任何一个模块可以分成两个或更多个单元。

关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明，这里不再详述。

实施例五

基于同一申请构思，本申请实施例中还提供了与咨询推荐方法对应的咨询推荐装置，由于本申请实施例中的装置解决问题的原理与本申请实施例上述咨询推荐方法相似，因此装置的实施可以参见方法实施例中的描述，重复之处不再赘述。

图6是示出本申请的一些实施例的咨询推荐装置的框图，该咨询推荐装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器，或服务器的处理器，也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件，如图所示，咨询推荐装置可以包括：推荐模块501、发送模块502，其中，

推荐模块501，用于将待推荐用户数据输入上述咨询推荐模型中进行计算，得到推荐内容；

发送模块502，用于将推荐内容发送给当前咨询终端。

此外，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一种可能的实施方式中模型训练方法的步骤。

此外，本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行上述任一种可能的实施方式中咨询推荐方法的步骤。

本申请实施例所提供的模型训练方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的模型训练方法的步骤，具体可参见上述方法实施例，在此不再赘述。

本申请实施例所提供的咨询推荐方法的计算机程序产品，包括存储了程序代码的计算机可读存储介质，所述程序代码包括的指令可用于执行上述方法实施例中所述的咨询推荐方法的步骤，具体可参见上述方法实施例，在此不再赘述。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统和装置的具体工作过程，可以参考方法实施例中的对应过程，本申请中不再赘述。在本申请所提供的几个实施例中，应该理解到，所揭露的系统、装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或模块的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式，但本申请的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本申请揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本申请的保护范围之内。因此，本申请的保护范围应以权利要求的保护范围为准。

Claims

1.一种模型训练方法，其特征在于，包括：

将所述用户数据进行标记处理得到使用数据，所述使用数据包括训练数据及测试数据；

将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，包括：a.将所述训练数据输入所述多任务模型，每个任务模块分别获取所需的局部训练数据进行任务训练，得到局部初始推荐模型，所有任务模块对应的局部初始推荐模型形成初始推荐模型；b.将所述测试数据输入所述初始推荐模型进行验证，得到所述初始推荐模型的推荐准确率；若所述推荐准确率小于设定值，则返回步骤a；重复上述的步骤a和b，直到所述推荐准确率达到设定值，将所述推荐准确率达到所述设定值对应的初始推荐模型作为咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块。

2.如权利要求1所述的方法，其特征在于，所述多任务模型包括：两层浅层神经网络层和一层分类层；所述将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型的步骤，包括：

根据所述分类结果调整所述多任务模型中的参数；

重复上述的步骤，直到所述分类结果的准确率达到设定值。

3.如权利要求1所述的方法，其特征在于，所述多任务模型包括至少两个业务线与至少一个场景组合形成的任务模块，任一任务模块表示为在一业务线下的一场景匹配的任务。

4.如权利要求3所述的方法，其特征在于，所述网约服务为网约车服务，所述至少两个业务线包括：快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾；所述至少一个场景包括：问题咨询、位置推荐、菜单推荐；所述任务模块包括任一上述的业务线下的任一场景的模型训练模块。

5.如权利要求1所述的方法，其特征在于，所述用户数据包括：订单数据、个人信息；所述将所述用户数据进行标记处理得到使用数据的步骤，包括：

根据所述个人信息为所述用户数据设置标签；

根据所述订单数据提取所述用户数据的特征信息；

将携带有所述标签的特征信息作为使用数据。

6.一种咨询推荐方法，其特征在于，包括：

将待推荐用户数据输入权利要求1-5任一项所述咨询推荐模型中进行计算，得到推荐内容。

7.一种模型训练装置，其特征在于，包括：

标记模块，用于将所述用户数据进行标记处理得到使用数据，所述使用数据包括训练数据及测试数据；

训练模块，用于将所述使用数据输入多任务模型中进行训练，得到咨询推荐模型，所述多任务模型中包括所述至少两个业务线对应的任务模块；

其中，所述训练模块，还用于：

a.将所述训练数据输入所述多任务模型，每个任务模块分别获取所需的局部训练数据进行任务训练，得到局部初始推荐模型，所有任务模块对应的局部初始推荐模型形成初始推荐模型；

若所述推荐准确率小于设定值，则返回a过程；

重复上述的a和b过程，直到所述推荐准确率达到设定值，将所述推荐准确率达到所述设定值对应的初始推荐模型作为咨询推荐模型。

8.如权利要求7所述的装置，其特征在于，所述多任务模型包括：两层浅层神经网络层和一层分类层；所述训练模块，还用于：

根据所述分类结果调整所述多任务模型中的参数；

9.如权利要求7所述的装置，其特征在于，所述多任务模型包括至少两个业务线与至少一个场景组合形成的任务模块，任一任务模块表示为在一业务线下的一场景匹配的任务。

10.如权利要求9所述的装置，其特征在于，所述网约服务为网约车服务，所述至少两个业务线包括：快车业务、专车业务、顺风车业务、代驾业务、豪华车业务、代驾；所述至少一个场景包括：问题咨询、位置推荐、菜单推荐；所述任务模块包括任一上述的业务线下的任一场景的模型训练模块。

11.如权利要求7所述的装置，其特征在于，所述用户数据包括：订单数据、个人信息；所述标记模块，还用于：

根据所述个人信息为所述用户数据设置标签；

根据所述订单数据提取所述用户数据的特征信息；

将携带有所述标签的特征信息作为使用数据。

12.一种咨询推荐装置，其特征在于，包括：

推荐模块，用于将待推荐用户数据输入权利要求1-5任一项所述咨询推荐模型中进行计算，得到推荐内容。

13.一种电子设备，其特征在于，包括：处理器、存储器和总线，所述存储器存储有所述处理器可执行的机器可读指令，当电子设备运行时，所述处理器与所述存储器之间通过总线通信，所述机器可读指令被所述处理器执行时执行如权利要求1至6任一所述的方法的步骤。

14.一种计算机可读存储介质，其特征在于，该计算机可读存储介质上存储有计算机程序，该计算机程序被处理器运行时执行如权利要求1至6任一所述的方法的步骤。