CN112328742B

CN112328742B - 基于人工智能的培训方法、装置、计算机设备及存储介质

Info

Publication number: CN112328742B
Application number: CN202011209903.2A
Authority: CN
Inventors: 满园园; 侯晓龙; 陈闽; 许闻笳; 宋思宇; 高毅
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2020-11-03
Filing date: 2020-11-03
Publication date: 2023-08-18
Anticipated expiration: 2040-11-03
Also published as: WO2022095378A1; CN112328742A

Abstract

本发明公开了基于人工智能的培训方法、装置、计算机设备及存储介质，方法包括：根据统计得到的客户分类信息及业务场景流程对历史业务办理记录进行拆分以得到分类样本数据信息，从分类样本数据信息中获取与培训请求信息相匹配的目标培训信息并生成对应的虚拟提问视频，获取用户反馈的答复视频信息进行评分得到答复评分信息并发送至用户终端。本发明基于语音交互技术，属于人工智能领域，基于包含多个客户的历史业务办理记录获取包含大量问答信息的分类样本数据信息，根据评分模型及与培训请求信息相匹配的目标培训信息获取答复视频信息的答复评分信息，以提高线上培训的覆盖面并实现对答复视频信息进行准确评分，从而大幅提升线上培训效率。

Description

基于人工智能的培训方法、装置、计算机设备及存储介质

技术领域

本发明涉及人工智能技术领域，属于智慧城市中对服务人员进行智能线上培训的应用场景，尤其涉及一种基于人工智能的培训方法、装置及计算机设备。

背景技术

在进行业务办理过程中，企业通常会选择一位服务人员作为客户的对接人并为客户提供服务，在线上进行远程视频沟通作为一种为客户提供服务的新形势越来越受到客户青睐，然而企业的新服务人员在通过进行远程视频沟开展业务过程中经常会因经验不足，而无法基于当前所处的业务办理阶段向客户准确推送相关信息。为提高服务人员的业务能力以更好地为客户提供服务，可获取客户进行业务办理的历史业务办理记录作为参考案例对服务人员进行培训，然而历史业务办理记录中客户的办理流程仅是针对单一客户在办理业务过程中遇到的实际问题，因此这一培训过程无法涉及业务办理过程中可能出现的各种问题，若解决这一问题可从历史业务办理记录中获取大量客户的办理流程作为大量参考案例以供服务人员进行学习，但这一培训方式需耗费大量时间，培训效率较低；并且服务人员采用这一培训方式难以对培训效果进行评价，导致对服务人员进行培训时的培训效果不理想。因此现有技术方法在对服务人员进行培训时存在培训效率较低的问题。

发明内容

本发明实施例提供了一种基于人工智能的培训方法、装置、计算机设备及存储介质，旨在解决现有技术方法中对服务人员进行培训时所存在的培训效率较低的问题。

第一方面，本发明实施例提供了一种基于人工智能的培训方法，其包括：

若接收到管理员输入的历史业务办理记录，根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类统计以获取客户分类信息；

根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息；

若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息；

根据虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，以获取所述用户终端所反馈的答复视频信息，其中，所述答复视频信息包含至少一段答复视频；

根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端。

第二方面，本发明实施例提供了一种基于人工智能的培训装置，其包括：

客户分类信息获取单元，用于若接收到管理员输入的历史业务办理记录，根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类统计以获取客户分类信息；

分类样本数据信息获取单元，用于根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息；

目标培训信息获取单元，用于若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息；

虚拟提问视频发送单元，用于根据虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，以获取所述用户终端所反馈的答复视频信息，其中，所述答复视频信息包含至少一段答复视频；

答复评分信息发送单元，用于根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端。

第三方面，本发明实施例又提供了一种计算机设备，其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现上述第一方面所述的基于人工智能的培训方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其中所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于人工智能的培训方法。

本发明实施例提供了一种基于人工智能的培训方法、装置、计算机设备及存储介质。根据统计得到的客户分类信息及业务场景流程对历史业务办理记录进行拆分以得到分类样本数据信息，从分类样本数据信息中获取与培训请求信息相匹配的目标培训信息并生成对应的虚拟提问视频，获取用户反馈的答复视频信息进行评分得到答复评分信息并发送至用户终端。通过上述方法，基于包含多个客户的历史业务办理记录获取包含大量问答信息的分类样本数据信息，根据评分模型及与培训请求信息相匹配的目标培训信息获取答复视频信息的答复评分信息，以提高线上培训的覆盖面并实现对答复视频信息进行准确评分，从而大幅提升进行线上培训的培训效率。

附图说明

为了更清楚地说明本发明实施例技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于人工智能的培训方法的流程示意图；

图2为本发明实施例提供的基于人工智能的培训方法的应用场景示意图；

图3为本发明实施例提供的基于人工智能的培训方法的子流程示意图；

图4为本发明实施例提供的基于人工智能的培训方法的另一子流程示意图；

图5为本发明实施例提供的基于人工智能的培训方法的另一子流程示意图；

图6为本发明实施例提供的基于人工智能的培训方法的另一子流程示意图；

图7为本发明实施例提供的基于人工智能的培训方法的另一流程示意图；

图8为本发明实施例提供的基于人工智能的培训方法的另一子流程示意图；

图9为本发明实施例提供的基于人工智能的培训装置的示意性框图；

图10为本发明实施例提供的计算机设备的示意性框图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

应当理解，当在本说明书和所附权利要求书中使用时，术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本发明说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本发明。如在本发明说明书和所附权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。

还应当进一步理解，在本发明说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

请参阅图1及图2，图1是本发明实施例提供的基于人工智能的培训方法的流程示意图，图2为本发明实施例提供的基于人工智能的培训方法的应用场景示意图，该基于人工智能的培训方法应用于管理服务器10中，该方法通过安装于管理服务器10中的应用软件进行执行，管理服务器10与至少一台用户终端20进行通信，用户终端20可发送培训请求信息至管理服务器10以获取虚拟提问视频，用户根据虚拟提问视频反馈答复视频信息至管理服务器10，管理服务器10对答复视频信息进行评分得到答复评分信息并反馈至用户终端20，管理员即为管理服务器10的使用者，用户终端20的使用者可以是企业的服务人员。管理服务器10即是用于执行基于人工智能的培训方法以对服务人员进行智能线上培训的服务器端，管理服务器10可以是企业所设置的服务器端，用户终端20即是可用于与管理服务器10进行通信的终端设备，例如笔记本电脑、平板电脑或手机等。图2中仅仅示意出一台用户终端20与管理服务器10进行信息传输，在实际应用中，该管理服务器10也可与多台用户终端20同时进行信息传输。如图1所示，该方法包括步骤S110～S150。

S110、若接收到管理员输入的历史业务办理记录，根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类统计以获取客户分类信息。

若接收到输入的历史业务办理记录，根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类以获取客户分类信息。其中，管理员即为管理服务器的使用者，历史业务办理记录包含已完成业务办理的多个客户的业务办理信息，以及相应客户的个人信息。具体的，客户信息量化模型即为对客户的个人信息进行量化的模型，可将每一客户的个人信息转换为客户量化信息进行量化表示，客户分类模型即为基于客户量化信息对客户进行分类的神经网络模型，可根据客户分类模型对客户量化信息进行分类处理得到每一客户所属的客户类别，得到客户分类信息，并对每一客户类别包含的客户进行统计得到客户分类信息，则客户分类信息中包含与每一客户类别相匹配的多个客户。其中，客户的个人信息中包括客户姓名、性别、年龄、职业、兴趣爱好、月收入、婚姻状态、生育状态等信息，业务办理信息即为客户在业务办理阶段与服务人员进行沟通的文字信息。

在一实施例中，如图3所示，步骤S110包括子步骤S111、S112和S113。

S111、根据所述客户信息量化模型对所述历史业务办理记录中客户的个人信息进行量化得到与每一客户对应的客户量化信息。

根据所述客户信息量化模型对所述历史业务办理记录中客户的个人信息进行量化得到与每一客户对应的客户量化信息。具体的，客户信息量化模型中包含多个量化项目，量化项目的数量可以等于或少于客户的个人信息中所包含的信息项数，每一量化项目均可将个人信息中对应的一项信息转换为一个向量值进行表示，每一客户的个人信息所对应的多个向量值即组合为该客户的客户量化信息，客户量化信息可表示为一个多维的特征向量，对每一量化项目的一项信息进行量化所得量化值的范围均为[0，1]。

具体的，对于与量化项目对应的信息以非数值方式进行表示的情况，则直接获取量化项目中与该非数值相匹配的关键字所对应的数据，作为与该非数值对应的量化值。例如，客户信息量化模型与婚姻状态这一量化项目中包含“已婚”及“未婚”两个关键字，与“已婚”对应的数据为“1”、与“未婚”对应的数据为“0”，某客户的个人信息中婚姻状态为已婚，则对应的量化值为“1”。

对于与量化项目对应的信息以数值方式表示的情况，客户信息量化模型中对应的量化规则为一个激活函数及一个中间值，根据激活函数对中间值及量化项目的一项信息进行计算，即可得到对应的量化值。

例如，激活函数可表示为其中，x为与量化项目对应的一项信息，v为与该量化项目对应的中间值。与月收入这一量化项目对应的中间值为v＝8000，某客户对应的客户信息中月收入为x＝10000，则根据上述激活函数计算得到对应的量化值为0.4378。

S112、将所述客户量化信息依次输入所述客户分类模型以获取与每一客户量化信息对应的客户类别；S113、对每一所述客户类别包含的客户进行统计得到客户分类信息。

客户分类模型是基于神经网络所构建的，客户分类模型中由多个输入节点、多个输出节点及全连接层组成，每一输入节点均对应客户特征向量中一个维度的向量值，每一输出节点均对应一个客户类别，根据分类目的可在客户分类模型中配置与多个客户类别对应的多个输出节点。输入节点与输出节点之间包含全连接层，全连接层中包含多个特征单元，输入节点与全连接层之间设置有第一公式组，输出节点与全连接层之间设置有第二公式组。其中，第一公式组包含所有输入节点至所有特征单元的公式，第一公式组中的公式均以输入节点值作为输入值、特征单元值作为输出值，第二公式组包含所有输出节点至所有特征单元的公式，第二公式组中的公式均以特征单元值作为输入值、输出节点值作为输出值，客户分类模型中所包含的每一公式中均拥有对应的参数值。输出节点值也即是客户量化信息与该输出节点对应的客户类别之间的匹配概率，根据计算得到某一客户的客户量化信息与每一输出节点的匹配概率，选择匹配概率最高的一个输出节点所对应的客户类别作为与该客户量化信息对应的分类结果，其中，客户类别可以包括都市白领、青年学生、家庭主妇、孕期妈妈等。根据所得到的分类结果，对每一客户类别包含的客户进行统计得到客户分类信息。

在一实施例中，步骤S112之前还包括：若接收到所输入的训练数据集，根据预置的梯度下降训练模型及所述训练数据集对所述客户分类模型进行迭代训练以得到训练后的客户分类模型。

若接收到所输入的训练数据集，根据预置的梯度下降训练模型及所述训练数据集对所述客户分类模型进行迭代训练以得到训练后的客户分类模型。其中输入训练数据集的可以是管理服务器的管理员，为使客户分类模型在对客户量化信息进行分类时可以有更高的准确率，可在使用客户分类模型之前对客户分类模型进行迭代训练，也即是对客户分类模型的第一公式组及第二公式组中的参数值进行调整，训练后所得到的客户分类模型可以对客户量化信息进行更精准的分类。梯度下降训练模型即为对客户分类模型进行训练的模型，梯度下降训练模型中包括损失值计算公式及梯度计算公式，训练数据集中包含多条训练数据，每一条训练数据对应一个客户，每一训练数据中均包含一个客户的客户量化信息以及该客户的分类标签；将某一客户的客户量化信息输入客户分类模型得到多个输出节点对应的匹配概率，根据损失值计算公式及分类标签对多个输出节点对应的匹配概率进行计算即可得到对应的损失值，根据损失值及梯度计算公式即可计算得到第一公式组及第二公式组中每一参数对应的更新值，通过更新值即可对每一参数对应的参数值进行更新，这一对参数值进行更新的过程即为对客户分类模型进行训练的具体过程。

具体的，损失值计算公式可表示为其中，f_s为与分类标签对应的一个输出节点的匹配概率，f_n为第n个输出节点的匹配概率，f_s及f_n的取值范围均为[0，1]。

根据所述梯度计算公式、所述损失值及所述客户分类模型的计算值计算得到所述客户分类模型中每一参数的更新值。具体的，将客户分类模型中一个参数对客户量化信息进行计算所得到的计算值输入梯度计算公式，并结合上述损失值，即可计算得到与该参数对应的更新值，这一计算过程也即为梯度下降计算。

具体的，梯度计算公式可表示为：

其中，/>为计算得到的参数x的更新值，ω_x为参数x的原始参数值，η为梯度计算公式中预置的学习率，/>为基于损失值及参数x对应的计算值对该参数x的偏导值(这一计算过程中需使用参数对应的计算值)。

根据每一所述参数的更新值对所述客户分类模型中对应参数的参数值进行更新，以对所述客户分类模型进行训练。基于所计算得到更新值对客户分类模型中每一参数的参数值对应更新，即完成对客户分类模型的一次训练过程。基于一次训练后所得到的客户分类模型对训练数据集中另一条训练数据再次进行计算处理，并重复上述训练过程，即可实现对客户分类模型进行迭代训练；当所计算得到的损失值小于预设的损失阈值或训练数据集中条训练数据均被用于训练后，即终止训练过程得到训练后的客户分类模型。

S120、根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息。

根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息。业务场景流程中还包括每一客户的业务办理信息，每一条业务办理信息中均包含至少一个问答信息，一条问答信息即为客户在进行某一项业务办理阶段与服务人员进行一轮问答沟通的信息，每一条问答信息中均包含客户所输入的提问信息及服务人员进行解释、引导的答复信息。业务场景流程中包含多个业务场景，每一业务场景涉及对一种业务进行办理的具体场景，每一业务场景包含对应的多个流程节点，可先根据客户分类信息对历史业务办理记录中每一客户的业务办理信息进行分类，再根据多个业务场景分别对应的流程节点对每一客户类别的业务办理信息进行拆分得到分类样本数据信息，则分类样本数据信息中涉及多个业务场景，每一业务场景均对应每一客户类别的多条问答信息，每一条问答信息均与一个流程节点相对应。

在一实施例中，如图4所示，步骤S120包括子步骤S121和S122。

S121、根据所述客户分类信息对所述历史业务办理记录中的业务办理信息进行分类，以得到业务办理分类信息。

根据所述客户分类信息对所述历史业务办理记录的业务办理信息进行分类，以得到业务办理分类信息。具体的，根据客户分类信息中每一客户类别包含的客户获取历史业务办理记录中相应客户的业务办理信息，得到业务办理分类信息，则业务办理分类信息中包含每一客户类别对应的业务办理信息。

S122、根据所述业务场景流程中所包含的流程节点，获取所述业务办理分类信息中每一客户类别的业务办理信息分别与每一所述流程节点相匹配的问答信息，作为所述分类样本数据信息。

根据业务场景流程中每一业务场景包含的流程节点，获取每一客户类别的业务办理信息分别与每一流程节点相匹配的问答信息，得到分类样本数据信息，则分类样本数据信息中的问答信息被分类至多个业务场景对应的流程节点，且每一流程节点包含多个客户类别对应的问答信息。

在一实施例中，如图5所示，步骤S122之后还包括步骤S123。

S123、根据预置的去重规则对每一流程节点中同一客户类别的问答信息进行去重处理，将每一流程节点的去重处理后的问答信息作为所述分类样本数据信息。

根据预置的去重规则对每一流程节点中同一客户类别的问答信息进行去重处理，得到每一流程节点的去重处理后的问答信息。一个流程节点中同一客户类别的多个问答信息可能存在重复，则需要通过去重规则对每一流程节点中同一客户类别的问答信息进行去重处理，去重规则即为可对问答信息进行去重处理的具体规则。具体的，可根据去重规则判断同一客户类别的问答信息中的两个提问信息或两个答复信息是否重复，若重复则选择其中一个进行保留；若不重复则两个均进行保留。

例如，获取两个提问信息或两个答复信息对应的两段文字信息，可将去重规则设置为判断两段文字信息的字符重复率是否不小于90％，若两段文字信息中字符的重复率不小于90％，则判断两段文字信息重复，否则判断两段文字信息不重复。

S130、若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息。

若接收到来自所述用户终端的培训请求信息，获取所述样本数据信息中与所述培训请求信息相匹配的目标培训信息。具体的，服务人员可通过用户终端向管理服务器发送培训请求信息，培训请求信息中包含业务场景信息，则服务人员可通过发送培训请求信息对某一种业务进行办理的具体场景所对应的问题进行针对性训练，可从样本数据信息中获取与培训请求信息相匹配的目标培训信息，目标培训信息中包含与业务场景信息中多个流程节点对应的多条问答信息，目标培训信息的多条问答信息均属于同一客户类别。

在一实施例中，步骤S130包括子步骤：随机选取所述分类样本数据信息中一个客户类别的问答信息作为目标类别问答信息；根据所述培训请求信息中的业务场景信息，获取所述目标类别问答信息中与所述业务场景信息的每一流程节点相匹配的一条问答信息进行组合得到与所述培训请求信息相匹配的目标培训信息。

分类样本数据信息中包含多个业务场景对应的流程节点，每一流程节点包含多个客户类别对应的问答信息，可选取一个客户类别作为目标客户类别，并获取每一流程节点中与该目标客户类别相匹配的问答信息作为目标类别问答信息。

培训请求信息中包括业务场景信息，根据培训请求信息中的业务场景信息，获取目标类别问答信息中与业务场景信息的每一流程节点相匹配的问答信息，并从与每一流程节点相匹配的多条问答信息中随机选择一条问答信息进行组合，即可得到与培训请求信息相匹配的目标培训信息。

S140、根据虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，以获取所述用户终端所反馈的答复视频信息。

根据虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，以获取所述用户终端所反馈的答复视频信息，其中，所述答复视频信息包含至少一段答复视频。为提高对服务人员进行培训的效果，可通过虚拟视频生成模型生成相应的虚拟提问视频，虚拟提问视频中包含与每一流程节点对应的一段虚拟视频，每一段虚拟视频均包含与一个流程节点对应的一条提问信息中的内容，服务人员通过用户终端接收虚拟提问视频，并针对虚拟提问视频中的每一段虚拟视频分别进行视频答复得到相应答复视频信息并反馈至管理服务器。

在一实施例中，如图6所示，步骤S140包括子步骤S141、S142和S143。

S141、获取所述虚拟视频生成模型中与所述目标培训信息的客户类别相匹配的一个类别模板。

虚拟视频生成模型中包含多个类别模板，每一类别模板与一个客户类别相匹配，则可获取虚拟视频生成模型中与目标培训信息的客户类别相匹配的一个类别模板。

S142、根据所述类别模板中的语音词典对所述目标培训信息所包含的提问信息进行转换以得到对应的语音提问信息。

类别模板中包含语音词典，可通过语音词典将目标培训信息中以文字形式记载的提问信息转换为语音提问信息，语音提问信息中包含与每一提问信息对应的语音信息，也即是一个提问信息对应一段语音信息。具体的，语音词典中包含多个词组及多个单词，每一词组对应一个词组发音，每一单词对应一个单词发音，获取目标培训信息中与一个流程节点对应的提问信息，对该提问信息中的字符与语音词典中的词组进行匹配，并获取相应词组的词组发音，对该提问信息中所剩余的不与词组相匹配的字符，则与语音词典中的单词进行匹配，并获取相应单词的单词发音，根据该提问信息中字符的顺序对词组发音与单词发音进行组合即可得到与该提问信息对应的一段语音信息。

例如，某一提问信息为“我想要了解这个重大疾病险”，语音词典中与“想要”对应的词组发音为“xiǎng,yào”，与“了解”对应的发音为“liǎo,jiě”，与“这个”对应的发音为“zhè,gè”，与“重大疾病”对应的发音为“zhòng,dà,jí,bìng”，与“我”对应的单词发音为“wǒ”，与“险”对应的单词发音为“xiǎn”，对上述发音进行组合即可得到对应的一段语音信息。

S143、将所述语音提问信息与所述类别模板中的人像模型进行组合以生成虚拟提问视频。

获取语音提问信息中每一段语音信息的语音长度，根据人像模型生成与语音长度对应的视频信息，人像模型即为与一个客户类别相匹配的虚拟人像，将语音提问信息与视频信息进行组合即可得到与一个提问信息对应的一段虚拟视频，获取与每一段提问信息对应的虚拟视频作为虚拟提问视频。

在一实施例中，如图7所示，步骤S150之前包括步骤S1510。

S1510、根据多个业务场景的业务语料数据库及预置的训练规则分别对初始化的神经网络进行语言环境训练以得到所述神经网络集合，所述初始化的神经网络基于BERT网络构建得到。

具体的，一个业务场景的业务语料数据库可对初始化的神经网络进行训练得到一个与该业务场景相匹配的神经网络，多个业务语料数据库分别对初始化的神经网络进行训练即可得到包含多个神经网络的神经网络集合，神经网络集合中每一神经网络均与一个业务场景相匹配。训练规则包括比例值、损失函数计算公式及梯度计算公式，训练规则即为对初始化的神经网络进行训练的规则信息，基于一个业务场景的业务语料数据库对初始化的神经网络进行训练的过程包括步骤(1)至(6)：

(1)从一个所述业务语料数据库中随机选择与所述比例值对应的部分语料数据作为目标语料数据。

业务语料数据库中的每一条语料数据均是一个完整的句子，则每一语料数据均由多个字符组成，训练规则中还设置有比例值，可根据比例值从一个业务语料数据库中随机选择得到相应数量的语料数据作为目标语料数据，例如，比例值可设置为10-90％。

(2)对所述目标语料数据进行随机遮盖处理，得到语料处理数据。

每一语料均由多个字符组成，可对每一语料中的任意一个字符进行遮盖处理，得到包含遮盖字符的语料处理数据。

例如，某一目标语料数据为“想了解一下财产保险”，进行随机遮盖处理后得到的语料处理数据为“想X解一下财产保险”，其中“X”即表示被遮盖的字符。

具体的，步骤(2)之中还可以包括：对所述语料处理数据中与所述比例值对应的部分语料处理数据中被遮盖的字符进行随机替换。为增强预训练效果，还可根据上述比例值将部分语料处理数据中被遮盖的字符随机替换为其他字符。

例如，某一语料处理数据为“想X解一下财产保险”，进行随机替换后得到的语料处理数据为“想理解一下财产保险”。

(3)根据所述转换词典分别对所述目标语料数据及所述语料处理数据进行转换得到语料特征向量及语料处理特征向量。

每一字符均可在转换词典中匹配到对应的一个特征码，则可根据转换词典将目标语料数据中所包含的字符进行转换，得到大小为(1，M)的语料特征向量，其表示语料特征向量为1行M列，目标语料数据的特征码作为数值填充语料特征向量，其中未被填充的数值记为“0”。采用同样转换方式对与目标语料数据相对应的一条语料处理数据进行转换，得到语料处理特征向量。

例如，“想”在转换词典中对应的特征码为“2318”；“理”的特征码为“6522”，“解”的特征码为“7351”，“一”的特征码为“0100”，“下”的特征码为“8631”，“财”的特征码为“3621”、“产”的特征码为“1531”、“保”的特征码为“4280”、“险”的特征码为“6634”。“101”代表句子的开始特征码，“102”代表句子的结束特征码。则“想理解一下财产保险”的对应组合得到语料处理特征向量可表示为[101,2318,6522,7351,0100,8631,3621,1531,4280,6634,102,……，0]。

(4)将一个所述语料特征向量与对应的一个所述语料处理特征向量输入所述初始化的神经网络进行计算分别得到语料数组及语料处理数组。

初始化的神经网络由一个输入层、多个中间层及一个输出层组成，输入层与中间层之间、中间层与其他中间层之间、中间层与输出层之间均通过关联公式进行关联，例如某一关联公式可表示为y＝r×x+t，r和t即为该关联公式中的参数值。输入层中包含的输入节点的数量与第一特征向量的长度相对应，则第一特征向量中每一向量值与一个输入节点相对应，将第一特征向量输入初始化的神经网络进行计算，即可从其输出层获取输出结果，输出结果采用一个数组(M,N)进行表示，与语料特征向量对应的输出结果为语料数组，则语料数组的大小为M行N列。采用同样方式将语料处理特征向量输入识别模板进行计算，得到语料处理数组，其大小也为(M,N)，其中语料数组及语料处理数组中每一数值均属于[0，1]这一取值范围。

(5)根据所述训练规则中的损失函数计算公式计算所述语料数组与所述语料处理数组之间的损失值。

损失值可用于对语料数组与语料处理数组之间的差别进行量化表示，具体的，计算语料数组S₁与语料处理数组S₂之间的损失值可通过损失函数计算公式计算得到其中，Ls为计算得到的损失值，a_xy为语料数组S₁中第x行第y列的数值，b_xy为语料处理数组S₂中第x行第y列的数值，M为语料数组S₁的总行数，N为语料数组S₁的总列数。

(6)根据所述训练规则中的梯度计算公式、所述损失值及所述识别模板的计算值计算得到所述初始化的神经网络中相应参数的更新值以更新所述参数的参数值。

根据所述训练规则中的梯度计算公式、所述损失值及所述初始化的神经网络的计算值计算得到所述识别模板的初始化的神经网络中每一参数的更新值以更新所述参数的参数值。具体的，将初始化的神经网络中一个参数对语料特征向量进行计算所得到的计算值输入梯度计算公式，并结合上述损失值，即可计算得到与该参数对应的更新值，这一计算过程也即为梯度下降计算，对参数值进行更新的过程与上述过程相同，在此不作赘述。

S150、根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端。

根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端，其中，所述评分模型包括语音转换规则、节点转化关键字、特征词典、神经网络集合及评分计算公式，所述神经网络集合中的神经网络均是基于BERT(Bidirectional Encoder Representations from Transformers)网络构建得到。可根据评分模型对答复视频信息进行分析，以得到答复评分信息并发送至用户终端，服务人员可通过用户终端获取相应的答复评分以获取培训的结果。答复视频信息中包含多段答复视频，每一段答复视频均与业务场景信息中的一个流程节点相匹配，可分别获取答复视频信息中多段答复视频的评分值作为答复评分信息。

在一实施例中，如图8所示，步骤S150包括子步骤S151、S152、S153、S154、S155和S156。

S151、根据所述语音转换规则对所述答复视频信息中的一段答复视频进行转换以得到对应的文字信息。

具体的，语音转换规则中包含声学模型、拼音词典及语义解析模型。一段答复视频中所包含的语音信息由多个字符发音的音素而组成，一个字符的音素包括该字符发音的频率和音色。声学模型中包含所有字符发音的音素，通过将语音信息与声学模型中所有的音素进行匹配，即可对语音信息中单个字符的音素进行切分，通过切分最终得到答复视频中所包含的多个音素。拼音词典中包含所有字符拼音对应的音素信息，通过将所得到的音素与字符拼音对应的音素信息进行匹配，即可将单个字符的音素转换为拼音词典中与该音素相匹配的字符拼音，以实现将答复视频的语音信息中所包含的所有音素转换为拼音信息。语义解析模型中包含拼音信息与文字信息之间所对应的映射关系，通过语义解析模型中所包含的映射关系即可对所得到的拼音信息进行语义解析以将拼音信息转换为对应的文字信息，所得到的文字信息即为与答复视频对应的一段文字信息。

例如，拼音“bàn，lǐ”在语义解析模型中所对应的文字信息为“办理”。

S152、判断所述文字信息是否与节点转化关键字中相应流程节点的转化关键字相匹配以得到关键字判断结果。

节点转化关键字中包含与每一流程节点对应的转换关键字，可获取节点转换关键字中与文字信息对应的流程节点的转换关键字，并判断文字信息是否与转化关键字相匹配，可判断文字信息中是否包含该转化关键字以得到文字信息是否与转化关键字相匹配的关键字判断结果。若文字信息与转化关键字相匹配，则表明该文字信息对应的答复视频符合相应客户类别的核心诉求，可触发业务场景流程中相应的转化节点并推进业务办理过程，触发相应转化节点后业务办理可从当前流程节点顺利流转至下一流程节点；若文字信息不与转化关键字相匹配，则表明该文字信息对应的答复视频不符合相应客户类别的核心诉求。

S153、根据所述特征词典分别对所述文字信息及所述流程节点的答复信息进行转换得到第一特征向量及第二特征向量。

转换词典即为对字符进行转换的词典，每一字符均可在转换词典中匹配到对应的一个特征码，则可根据转换词典将文字信息中所包含的字符进行转换，将每一字符对应的特征码进行组合得到第一特征向量，所得到的第一特征向量即为将文字信息的特征采用向量方式进行表示，第一特征向量的大小为(1，M)，其表示第一特征向量为1行M列，第一特征向量的长度M可由用户预先设定，如可设定第一特征向量及第二特征向量中数值的数量为30(M＝30)，文字信息的特征码作为数值填充第一特征向量，第一特征向量中未被填充的数值记为“0”。采用同样转换方式对与文字信息相匹配的流程节点的答复信息进行转换，得到第二特征向量。

S154、根据所述业务场景信息确定所述神经网络集合中与所述业务场景信息相匹配的一个目标神经网络。

根据所述业务场景信息确定所述神经网络集合中与所述业务场景信息相匹配的一个目标神经网络。神经网络集合中包含多个神经网络，其中的神经网络均是基于BERT网络构建得到，每一神经网络均与一个业务场景相匹配，也即是一个神经网络适用于与之相匹配的一个业务场景的特定语言环境。采用一个业务场景的语料数据对初始化的神经网络进行预训练，以得到一个适用于该业务场景的语言环境的神经网络，多个业务场景对应的神经网络组合成为所述神经网络集合。通过获取与业务场景信息相匹配的目标神经网络，可基于目标神经网络的语言环境对第一特征向量及第二特征向量进行评分，得到更准确的评分结果。

S155、将所述第一特征向量与所述第二特征向量输入所述目标神经网络进行计算分别得到第一数组及第二数组。

具体的，对第一特征向量及第二特征向量进行计算的过程与对语料特征向量或语料处理特征向量进行计算的过程相同，输出结果采用一个数组(M,N)进行表示，与第一特征向量对应的输出结果为第一数组，则第一数组的大小也为M行N列，第二特征向量的输出结果为第二数组，第二数组的大小也为(M,N)，其中第一数组及第二数组中每一数值均属于[0，1]这一取值范围。

S156、根据所述评分计算公式对所述关键字判断结果、所述第一数组及所述第二数组进行计算得到对应的一个评分值。

可通过评分计算公式对所得到的关键字判断结果、第一数组及第二数组进行计算，以获取与该答复视频对应的一个评分值，具体的，先将关键字判断结果转换为对应的一个系数值进行表示。例如，若关键字判断结果为文字信息与转化关键字相匹配，对应的系数值为1；若关键字判断结果为文字信息不与转化关键字相匹配，对应的系数值为0.3。具体的，第一数组为S_a，第二数组为S_b，根据上述计算公式计算得到第一数组与第二数组之间的损失值，根据评分计算公式可表示为：P₀＝C₀×(1L₀)；其中，P₀为计算得到的评分值，C₀为所得到的系数值，L₀为第一数组S_a与第二数组S_b之间的损失值。

本申请中的技术方法可应用于智慧政务/智慧城管/智慧社区/智慧安防/智慧物流/智慧医疗/智慧教育/智慧环保/智慧交通等包含对服务人员进行智能线上培训的应用场景中，从而推动智慧城市的建设。

在本发明实施例所提供的基于人工智能的培训方法中，根据统计得到的客户分类信息及业务场景流程对历史业务办理记录进行拆分以得到分类样本数据信息，从分类样本数据信息中获取与培训请求信息相匹配的目标培训信息并生成对应的虚拟提问视频，获取用户反馈的答复视频信息进行评分得到答复评分信息并发送至用户终端。通过上述方法，基于包含多个客户的历史业务办理记录获取包含大量问答信息的分类样本数据信息，根据评分模型及与培训请求信息相匹配的目标培训信息获取答复视频信息的答复评分信息，以提高线上培训的覆盖面并实现对答复视频信息进行准确评分，从而大幅提升进行线上培训的培训效率。

本发明实施例还提供一种基于人工智能的培训装置，该基于人工智能的培训装置用于执行前述基于人工智能的培训方法的任一实施例。具体地，请参阅图9，图9是本发明实施例提供的基于人工智能的培训装置的示意性框图。该基于人工智能的培训装置可配置于管理服务器10中。

如图9所示，基于人工智能的培训装置100包括客户分类信息获取单元110、分类样本数据信息获取单元120、目标培训信息获取单元130虚拟提问视频发送单元140和答复评分信息发送单元150。

客户分类信息获取单元110，用于若接收到管理员输入的历史业务办理记录，根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类统计以获取客户分类信息。

在一实施例中，所述客户分类信息获取单元110包括子单元：客户量化信息获取单元、客户类别获取单元和客户统计单元。

客户量化信息获取单元，用于根据所述客户信息量化模型对所述历史业务办理记录中客户的个人信息进行量化得到与每一客户对应的客户量化信息；客户类别获取单元，用于将所述客户量化信息依次输入所述客户分类模型以获取与每一客户量化信息对应的客户类别；客户统计单元，用于对每一所述客户类别包含的客户进行统计得到客户分类信息。

在一实施例中，所述客户分类信息获取单元110还包括子单元：客户分类模型训练单元。

客户分类模型训练单元，用于若接收到所输入的训练数据集，根据预置的梯度下降训练模型及所述训练数据集对所述客户分类模型进行迭代训练以得到训练后的客户分类模型。

分类样本数据信息获取单元120，用于根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息。

在一实施例中，所述分类样本数据信息获取单元120包括子单元：业务办理分类信息获取单元和问答信息匹配单元。

业务办理分类信息获取单元，用于根据所述客户分类信息对所述历史业务办理记录中的业务办理信息进行分类，以得到业务办理分类信息；问答信息匹配单元，用于根据所述业务场景流程中所包含的流程节点，获取所述业务办理分类信息中每一客户类别的业务办理信息分别与每一所述流程节点相匹配的问答信息，作为所述分类样本数据信息。

在一实施例中，所述分类样本数据信息获取单元120还包括子单元：去重处理单元。

去重处理单元，用于根据预置的去重规则对每一流程节点中同一客户类别的问答信息进行去重处理，将每一流程节点的去重处理后的问答信息作为所述分类样本数据信息。

目标培训信息获取单元130，用于若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息。

虚拟提问视频发送单元140，用于根据虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，以获取所述用户终端所反馈的答复视频信息，其中，所述答复视频信息包含至少一段答复视频。

在一实施例中，所述虚拟提问视频发送单元140包括子单元：类别模板匹配单元和提问信息转换单元。

类别模板匹配单元，用于获取所述虚拟视频生成模型中与所述目标培训信息的客户类别相匹配的一个类别模板；提问信息转换单元，用于根据所述类别模板中的语音词典对所述目标培训信息所包含的提问信息进行转换以得到对应的语音提问信息。虚拟提问视频生成单元，用于将所述语音提问信息与所述类别模板中的人像模型进行组合以生成虚拟提问视频。

在一实施例中，所述基于人工智能的培训装置100还包括：神经网络集合获取单元。

神经网络集合获取单元，用于根据多个业务场景的业务语料数据库及预置的训练规则分别对初始化的神经网络进行语言环境训练以得到所述神经网络集合，所述初始化的神经网络基于BERT网络构建得到。

答复评分信息发送单元150，用于根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端。

在一实施例中，所述答复评分信息发送单元150包括子单元：文字信息获取单元、关键字匹配单元、特征向量获取单元、目标神经网络获取单元、数组获取单元和评分计算单元。

文字信息获取单元，用于根据所述语音转换规则对所述答复视频信息中的一段答复视频进行转换以得到对应的文字信息；关键字匹配单元，用于判断所述文字信息是否与节点转化关键字中相应流程节点的转化关键字相匹配以得到关键字判断结果；特征向量获取单元，用于根据所述特征词典分别对所述文字信息及所述流程节点的答复信息进行转换得到第一特征向量及第二特征向量；目标神经网络获取单元，用于根据所述业务场景信息确定所述神经网络集合中与所述业务场景信息相匹配的一个目标神经网络；数组获取单元，用于将所述第一特征向量与所述第二特征向量输入所述目标神经网络进行计算分别得到第一数组及第二数组；评分计算单元，用于根据所述评分计算公式对所述关键字判断结果、所述第一数组及所述第二数组进行计算得到对应的一个评分值。

在本发明实施例所提供的基于人工智能的培训装置应用上述基于人工智能的培训方法，根据统计得到的客户分类信息及业务场景流程对历史业务办理记录进行拆分以得到分类样本数据信息，从分类样本数据信息中获取与培训请求信息相匹配的目标培训信息并生成对应的虚拟提问视频，获取用户反馈的答复视频信息进行评分得到答复评分信息并发送至用户终端。通过上述方法，基于包含多个客户的历史业务办理记录获取包含大量问答信息的分类样本数据信息，根据评分模型及与培训请求信息相匹配的目标培训信息获取答复视频信息的答复评分信息，以提高线上培训的覆盖面并实现对答复视频信息进行准确评分，从而大幅提升进行线上培训的培训效率。

上述基于人工智能的培训装置可以实现为计算机程序的形式，该计算机程序可以在如图10所示的计算机设备上运行。

请参阅图10，图10是本发明实施例提供的计算机设备的示意性框图。该计算机设备可以是用于执行基于人工智能的培训方法以对服务人员进行智能线上培训的管理服务器10。

参阅图10，该计算机设备500包括通过系统总线501连接的处理器502、存储器和网络接口505，其中，存储器可以包括非易失性存储介质503和内存储器504。

该非易失性存储介质503可存储操作系统5031和计算机程序5032。该计算机程序5032被执行时，可使得处理器502执行基于人工智能的培训方法。

该处理器502用于提供计算和控制能力，支撑整个计算机设备500的运行。

该内存储器504为非易失性存储介质503中的计算机程序5032的运行提供环境，该计算机程序5032被处理器502执行时，可使得处理器502执行基于人工智能的培训方法。

该网络接口505用于进行网络通信，如提供数据信息的传输等。本领域技术人员可以理解，图10中示出的结构，仅仅是与本发明方案相关的部分结构的框图，并不构成对本发明方案所应用于其上的计算机设备500的限定，具体的计算机设备500可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

其中，所述处理器502用于运行存储在存储器中的计算机程序5032，以实现上述的基于人工智能的培训方法中对应的功能。

本领域技术人员可以理解，图10中示出的计算机设备的实施例并不构成对计算机设备具体构成的限定，在其他实施例中，计算机设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。例如，在一些实施例中，计算机设备可以仅包括存储器及处理器，在这样的实施例中，存储器及处理器的结构及功能与图10所示实施例一致，在此不再赘述。

应当理解，在本发明实施例中，处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器502还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。其中，通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

在本发明的另一实施例中提供计算机可读存储介质。该计算机可读存储介质可以为非易失性的计算机可读存储介质。该计算机可读存储介质存储有计算机程序，其中计算机程序被处理器执行时实现上述的基于人工智能的培训方法中所包含的步骤。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的设备、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

在本发明所提供的几个实施例中，应该理解到，所揭露的设备、装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的单元集合成一个单元，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个计算机可读存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

Claims

1.一种基于人工智能的培训方法，应用于管理服务器，所述管理服务器与至少一台用户终端通过网络连接实现数据信息的传输，其特征在于，所述方法包括：

若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息；所述培训请求信息中包含业务场景信息；

根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端；

所述评分模型包括语音转换规则、节点转化关键字、特征词典、神经网络集合及评分计算公式，所述答复评分信息包含每一段答复视频的评分值，所述根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端，包括：

根据所述语音转换规则对所述答复视频信息中的一段答复视频进行转换以得到对应的文字信息；

判断所述文字信息是否与节点转化关键字中相应流程节点的转化关键字相匹配以得到关键字判断结果；

根据所述特征词典分别对所述文字信息及所述流程节点的答复信息进行转换得到第一特征向量及第二特征向量；

根据所述业务场景信息确定所述神经网络集合中与所述业务场景信息相匹配的一个目标神经网络；

将所述第一特征向量与所述第二特征向量输入所述目标神经网络进行计算分别得到第一数组及第二数组；

根据所述评分计算公式对所述关键字判断结果、所述第一数组及所述第二数组进行计算得到对应的一个评分值。

2.根据权利要求1所述的基于人工智能的培训方法，其特征在于，所述根据预置的客户信息量化模型及预置的客户分类模型对所述历史业务办理记录中的客户进行分类统计以获取客户分类信息，包括：

根据所述客户信息量化模型对所述历史业务办理记录中客户的个人信息进行量化得到与每一客户对应的客户量化信息；

将所述客户量化信息依次输入所述客户分类模型以获取与每一客户量化信息对应的客户类别；

对每一所述客户类别包含的客户进行统计得到客户分类信息。

3.根据权利要求1所述的基于人工智能的培训方法，其特征在于，所述根据预置的业务场景流程及所述客户分类信息对所述历史业务办理记录进行拆分以获取与所述客户分类信息相匹配的分类样本数据信息，包括：

根据所述客户分类信息对所述历史业务办理记录中的业务办理信息进行分类，以得到业务办理分类信息；

根据所述业务场景流程中所包含的流程节点，获取所述业务办理分类信息中每一客户类别的业务办理信息分别与每一所述流程节点相匹配的问答信息，作为所述分类样本数据信息。

4.根据权利要求3所述的基于人工智能的培训方法，其特征在于，所述获取所述业务办理分类信息中每一客户类别的业务办理信息分别与每一所述流程节点相匹配的问答信息之后，还包括：

根据预置的去重规则对每一流程节点中同一客户类别的问答信息进行去重处理，将每一流程节点的去重处理后的问答信息作为所述分类样本数据信息。

5.根据权利要求1所述的基于人工智能的培训方法，其特征在于，所述根据预置的虚拟视频生成模型生成与所述目标培训信息中提问信息对应的虚拟提问视频发送至所述用户终端，包括：

获取所述虚拟视频生成模型中与所述目标培训信息的客户类别相匹配的一个类别模板；

根据所述类别模板中的语音词典对所述目标培训信息所包含的提问信息进行转换以得到对应的语音提问信息；

将所述语音提问信息与所述类别模板中的人像模型进行组合以生成虚拟提问视频。

6.根据权利要求1所述的基于人工智能的培训方法，其特征在于，所述根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端之前，还包括：

根据多个业务场景的业务语料数据库及预置的训练规则分别对初始化的神经网络进行语言环境训练以得到所述神经网络集合，所述初始化的神经网络基于BERT网络构建得到。

7.一种基于人工智能的培训装置，其特征在于，所述装置配置于管理服务器，所述管理服务器与至少一台用户终端通过网络连接实现数据信息的传输，包括：

目标培训信息获取单元，用于若接收到来自所述用户终端的培训请求信息，获取所述分类样本数据信息中与所述培训请求信息相匹配的目标培训信息；所述培训请求信息中包含业务场景信息；

答复评分信息发送单元，用于根据预置的评分模型及所述目标培训信息获取与所述答复视频信息对应的答复评分信息并发送至所述用户终端；

8.一种计算机设备，包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至6中任一项所述的基于人工智能的培训方法。

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序当被处理器执行时使所述处理器执行如权利要求1至6中任一项所述的基于人工智能的培训方法。