WO2018196684A1

WO2018196684A1 - 对话机器人生成方法及装置

Info

Publication number: WO2018196684A1
Application number: PCT/CN2018/083836
Authority: WO
Inventors: 汤鹏飞; 彭明超; 白铖; 王远斌; 赵紫星
Original assignee: 北京京东尚科信息技术有限公司; 北京京东世纪贸易有限公司
Priority date: 2017-04-24
Filing date: 2018-04-20
Publication date: 2018-11-01
Also published as: CN108733722A; CN108733722B

Abstract

本公开提供了一种对话机器人生成方法及装置，涉及机器学习领域，其中方法包括：基于用户输入的机器人建立指令确定所需创建的机器学习模型；将初始语料集合作为训练样本对机器学习模型进行训练；获取训练好的机器学习模型进行部署，并设置与机器学习模型对应的机器人对话入口；将对话交互信息输入与机器人对话入口相对应的机器学习模型，以使机器学习模型生成应答信息。本公开的对话机器人生成方法及装置，对用户开放建立和部署对话机器人的功能，机器学习模型的训练和部署由系统自动完成，用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答，提高了用户建立和部署对话机器人的效率，提升了用户体验。

Description

对话机器人生成方法及装置

相关申请的交叉引用

本申请是以CN申请号为201710270940.6，申请日为2017年4月24日的申请为基础，并主张其优先权，该CN申请的公开内容在此作为整体引入本申请中。

技术领域

本公开涉及机器学习技术领域，尤其涉及一种对话机器人生成方法及装置。

背景技术

智能对话机器人利用自然语言处理、机器学习等人工智能领域技术，接收用户咨询问题，理解问题语义、识别用户意图并给出正确的应答。智能对话机器人通常使用机器学习模型接收用户咨询并生成应答。

发明内容

本公开的发明人发现相关技术存在如下问题：客服机器人需要通过专业技术人员通过编程建立并维护，难以满足业务发展的需要,不具有编程能力的普通用户具有构建属于自己的客服机器人的愿望。有鉴于此，本公开实施例要解决的一个技术问题是：现有的普通用户需要通过编程构建对话机器人的问题，为了解决该技术问题，本公开提供一种对话机器人生成方法及装置。

根据本公开的一个或多个实施例的一个方面，提供一种对话机器人生成方法，包括：确定步骤，基于用户输入的机器人建立指令确定所需创建的机器学习模型；训练步骤，将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练；部署步骤，基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署；设置步骤，设置与所述机器学习模型对应的机器人对话入口；输入步骤，将来自用户的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型，以使所述机器学习模型生成应答信息。

可选地，所述将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练包括：基于所述初始语料集合中的初始语料进行分类训练，用以得到用于判定所述初始语料的类别的分类规则；向用户显示所述分类规则，以使用户基于所述分类规则对所述初始语料标注类别；根据用户提交的对所述初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对所述机器学习模型进行训练。

可选地，所述基于所述初始语料集合中的初始语料进行分类训练、用以得到用于判定所述初始语料的类别的分类规则包括：提取所述初始语料的特征信息；利用特征上下位和特征同义词关系中的至少一个对所述特征信息进行泛化处理；对泛化处理后的所述特征信息进行聚类处理，用以得到所述初始语料的聚类结果；融合所述聚类结果得到所述初始语料的分类结果；基于所述分类结果建立所述分类规则。

可选地，在将所述初始语料集合作为训练样本对所述机器学习模型进行训练之后还包括：使用所述机器学习模型对验证语料集合进行分类检验；将所述分类检验的成功率与阈值进行比较；在所述成功率低于所述阈值的情况下，提示用户输入新的初始语料集合，将所述新的初始语料作为新的训练样本，用以继续对所述机器学习模型进行训练。

可选地，在所述成功率高于所述阈值的情况下，停止对所述机器学习模型进行训练；接收用户设置的与所述初始语料的类别相对应的应答信息；在所述机器学习模型中设置所述类别与所述应答信息的对应关系。

可选地，所述将用户输入的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型包括：将用户输入的文字信息发送到与此文字信息相对应的机器人入口；；对所述文字信息进行纠错处理；对进行所述纠错处理后的所述文字信息进行分词处理；对进行所述分词处理后的文字信息进行特征词提取；基于所述特征词构造所述文字信息的语义向量；将所述语义向量输入所述机器人入口对应的所述机器学习模型，以使所述机器学习模型基于所述语义向量确定所述文字信息的类别，用以得到与所述类别相对应的应答信息。

可选地，所述机器人包括：客服机器人，所述类别包括退货、付款、购买中的至少一种。

根据本公开的一个或多个实施例的另一方面，提供一种对话机器人生成装置，包括：模型确定模块，用于基于用户输入的机器人建立指令确定所需创建的机器学习模型；模型训练模块，用于将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练；模型部署模块，用于基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署；入口设置模块，用于设置与所述机器学习模型对应的机器人对话入口；运行控制模块，用于将来自用户的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型，以使所述机器学习模型生成应答信息。

可选地，所述模型训练模块，包括：语料分类单元，用于基于所述初始语料集合中的初始语料进行分类训练，用以得到用于判定所述初始语料的类别的分类规则；标注提示单元，用于向用户显示所述分类规则，以使用户基于所述分类规则对所述初始语料标注类别；样本训练单元，用于根据用户提交的对所述初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对所述机器学习模型进行训练。

可选地，所述语料分类单元，还用于提取所述初始语料的特征信息；利用特征上下位和特征同义词关系中的至少一个对所述特征信息进行泛化处理；对泛化处理后的所述特征信息进行聚类处理，用以得到所述初始语料的聚类结果；融合所述聚类结果得到所述初始语料的分类结果；基于所述分类结果建立所述分类规则。

可选地，所述样本训练单元，还用于得到使用所述机器学习模型对验证语料集合进行分类检验；将所述分类检验的成功率与阈值进行比较；在所述成功率低于所述阈值的情况下，则提示用户输入新的初始语料集合；将所述新的初始语料作为新的训练样本，用以继续对所述机器学习模型进行训练。

可选地，所述样本训练单元，还用于在所述成功率高于所述阈值的情况下，停止对所述机器学习模型进行训练；接收用户设置的与所述初始语料的类别相对应的应答信息；在所述机器学习模型中设置所述类别与所述应答信息的对应关系。

可选地，所述运行控制模块，还包括：入口确定单元，用于将用户输入的文字信息发送到与此文字信息相对应的机器人入口；文本处理单元，用于对所述文字信息进行纠错处理；对进行所述纠错处理后的所述文字信息进行分词处理；对进行所述分词处理后的文字信息进行特征词提取；基于所述特征词构造所述文字信息的语义向量；应答生成单元，用于将所述语义向量输入所述机器人入口对应的所述机器学习模型，以使所述机器学习模型基于所述语义向量确定所述文字信息的类别，用以得到与所述类别相对应的应答信息。

根据本公开的一个或多个实施例的又一个方面，还提供一种对话机器人生成装置，包括：存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如上所述的对话机器人生成方法。

根据本公开的一个或多个实施例的再一个方面，还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述指令被处理器执行时实现如上所述任一项所述的对话机器人生成方法。

本公开提供的对话机器人生成方法及装置，对用户开放建立和部署对话机器人的功能，机器学习模型的训练和部署由系统自动完成，用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答，提高了用户建立和部署对话机器人的效率。

通过以下参照附图对本公开的示例性实施例的详细描述，本公开的其它特征及其优点将会变得清楚。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本申请的一部分，本公开的示意性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1为示出根据本公开一些实施例的对话机器人生成方法的流程示意图；

图2为示出根据本公开一些实施例的对话机器人生成方法中的机器学习模型建立的流程示意图；

图3为示出根据本公开一些实施例的对话机器人生成方法中的机器学习模型生成应答的流程示意图；

图4为示出根据本公开一些实施例的对话机器人生成装置的一个实施例的模块示意图；

图5为示出根据本公开一些实施例的对话机器人生成装置中的模型训练模块的模块示意图；

图6为示出根据本公开一些实施例的对话机器人生成装置中的运行控制模块的模块示意图；

图7为示出根据本公开一些实施例的对话机器人生成装置的另一模块示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分实施例，而不是全部的实施例。以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为授权说明书的一部分。

在这里示出和讨论的所有示例中，任何具体值应被解释为仅仅是示例性的，而不是作为限制。因此，示例性实施例的其它示例可以具有不同的值。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

图1为示出根据本公开一些实施例的对话机器人生成方法的流程示意图，如图1所示，方法包括步骤101－104。

步骤101，基于用户输入的机器人建立指令确定所需创建的机器学习模型。

智能对话机器人通常使用机器学习模型接收用户咨询并生成应答。机器学习模型是一种数据模型，通过训练出的模型可对用户的咨询问题进行分类，从而识别用户意图。机器学习模型可以为多种，例如逻辑回归模型、随机森林模型、贝叶斯方法模型、支持向量机模型、神经网络模型等。

步骤102，接收用户输入的初始语料集合，将初始语料集合作为训练样本对机器学习模型进行训练。

初始语料集合可以为在日常工作中所接收到的咨询问题。例如，一个电商接收到的客户通过QQ、邮件等发送的咨询问题，包括：询价、订货、退货等问题。

步骤103，基于用户输入的机器人部署指令获取训练好的机器学习模型进行部署，并设置与机器学习模型对应的机器人对话入口。

步骤104，接收到用户输入的对话交互信息，将对话交互信息输入与机器人对话入口相对应的机器学习模型，以使机器学习模型生成应答信息。

例如，在电商网站上部署基于训练好的机器学习模型的客服机器人，并在电商网站上设置客服服务标识作为机器人对话入口。客户点击客服服务标识则弹出提问窗口，客户在提问窗口中可以输入咨询问题，将咨询问题输入与提问窗口相对应的机器学习模型，机器学习模型生成应答信息，并向客户显示。

上述实施例中的对话机器人生成方法，可以对用户提供人机友好界面，例如为网页，并对所进行的每一步操作都进行使用提示，机器学习模型的建立、部署都由后台系统自动完成，使普通用户能够建立自定义的机器学习模型及基于该模型的客服机器人并进行部署，可以利用机器学习模型对客户的咨询等提供自动应答。

图2为示出根据本公开一些实施例的对话机器人生成方法中的机器学习模型建立的流程示意图，如图2所示，机器学习模型建立流程包括步骤201－208。

步骤201，创建机器学习模型。用户通过人机界面输入自定义机器人名及开头语等，自动创建机器学习模型。

步骤202，接收用户输入的初始语料集合。机器学习模型需要学习已有的语料，用户通过人机界面导入已有的初始语料，可以基于初始语料集合中的初始语料进行分类训练。

步骤203，提取初始语料的特征信息，并利用特征上下位和/或特征同义词关系对特征信息进行泛化处理，对泛化处理后的特征信息进行聚类处理，获取初始语料的聚类结果。

泛化是指将一些相似的词替换为同一种表示，例如将“170cm”泛化为“170厘米”。聚类是指应用聚类算法将相似的语料归类到一起，为创建分类规则做参考。泛化和聚类处理都由系统自动进行。

步骤204，融合聚类结果得到初始语料的分类结果，基于分类结果建立分类规则。

文本描述模型可以为布尔逻辑模型、向量空间模型VSM、概率模型等。通过文本分类算法，可根据文本特征自动划分文档所属类别。文本分类算法有朴素贝叶斯、K邻近算法、支持向量机、人工神经网络等。

例如，将文本进行分词，提取文本特征词，最后利用提取的特征词构造空间向量表示文本。采用向量空间模型(VSM)将文本向量化为向量空间的点，采用向量夹角距离，向量内积或者欧几里得几何距离判定文本相似度。

以聚类结果为参考，可以使用多种分类工具创建一些分类类别。例如，用户导入的初始语料是有关电商售后政策的，以如下三个语料为例：1、怎么退货？2、我要退货；3、退款怎么还没收到。则可建立两个分类规则“退货”及“退款”。语料1和2属于“退货”分类，语料3属于“退款”分类。

步骤205，对初始语料标注类别。通过人机界面向用户显示分类规则，用户基于分类规则对初始语料进行分类，并对初始语料标注类别。

分类规则创建完毕后，需要人工对导入的初始语料一一进行标注。标注即将语料标为属于分类规则的哪一个分类，以便机器学习模型“学习”。例如已经有“退款”分类，可将初始语料“在哪可申请退款”标注为属于“退款”分类。也可以用机器学习模型自动对需标注的初始语料进行类别标注，为人工标注提供参考。

步骤206，对机器学习模型进行训练。接收到用户提交的对初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对机器学习模型进行训练。可以根据建立的机器学习模型类型，选取相应的方法进行训练。

步骤207，验证机器学习模型。获取验证语料集合，使用机器学习模型对验证语料集合进行分类检验，获取验证语料集合中验证语料的类别。确定分类检验的成功率，判断成功率是否低于预设的阈值，如果是，则提示用户输入新的初始语料集合，将新的初始语料作为新的训练样本，继续对机器学习模型进行训练，即重复步骤202－206。

步骤208，部署机器学习模型。如果使用机器学习模型对验证语料集合进行分类检验的成功率高于阈值，则停止对机器学习模型进行训练。如果用户需要部署机器人，通过人机界面进行设置。接收用户设置的与类别相对应的应答信息，例如，对于“退货”类别设置相关的退货政策信息作为应答信息。并设置与机器学习模型对应的机器人对话入口。

机器学习模型的训练、部署由系统自动完成，通过语料及标注结果训练机器学习模型，采用的机器学习算法有逻辑回归、支持向量机等。机器学习模型训练完成后需由系统自动对其分类的准确率进行估测，准确率高于阈值时，机器学习模型才可上线，低于阈值则需增加样本或修改标注重新训练。

图3为示出根据本公开一些实施例的对话机器人生成方法中的机器学习模型生成应答的流程示意图，如图3所示，机器学习模型生成应答的流程包括步骤301－307。

步骤301，确定文字信息对应的机器人入口。接收到用户输入的文字信息，确定与文字信息相对应的机器人入口，并将文字信息发送至机器人入口。

例如，对于一个系统可能会有多个机器人，每个机器人会有多个入口。以电商网站为例，商品页、订单页、售后页等都会有客服机器人图标，点击这些图标便可咨询客服机器人。接收到用户的咨询请求后首先要定位用户咨询的机器人及对应入口。

步骤302，对文字信息进行纠错处理。纠错处理是纠正用户咨询的文字信息里的错别字或错误语法。

步骤303，对文字信息进行分词处理。分词处理是基于分词算法将用户的文字信息分成独立的词。

步骤304，对进行分词处理后的文字信息进行特征词提取，构造文字信息的语义向量。在分词之后得到的集合中，会发现一些无效词，可以被排除。也可以识别出文字信息里特定的实体，如手机号实体，长度实体等。构造文字信息的语义向量是构造在向量空间的向量，即文本向量空间模型中的向量，将文字信息转换为二进制表示，以便进行分类。

步骤306，将语义向量输入机器人入口对应的机器学习模型。

步骤307，机器学习模型基于语义向量确定文字信息的类别，获取与类别相对应的应答信息。机器学习模型采用向量空间模型进行分类，将语义向量与向量空间模型的已知类别的向量进行比对，采用向量夹角距离，向量内积或者欧几里得几何距离判定相似度，获取最相似的已知类别的向量，即确定用户输入的文字信息的类别。

机器学习模型可以进行意图识别，即用构造的机器学习模型对文字信息转换而成的向量进行分类，识别用户问话对应的类别，而后用应答引擎给出对应的回答。例如，机器学习模型生成应答的过程如下所示：

用户问：“我要退货”。对文本信息“我要退货”进行纠错：无错误，不需纠正。对文本信息“我要退货”进行分词处理的结果为：转换为“我|要|退货”。进行实体识别：无要识别的实体。构造向量空间：在分词基础上再对用户问话进行切分，如切换为“我|我要|要|要退|退|退货|货”，假设机器人词库有一万个字词，则词库可理解为一个具有一万个字词的数组，“我|我要|要|要退|退|退货|货”包含7个字词，若词库中存在“我”、“我要”等字词，则对应数组元素为1，否则为0。从而用户问话为转换为形如“00000010000…………”的二进制串，此二进制串则为用户问话转换而成的向量。将向量用机器学习模型进行分类，可分类为“退货”，根据“退货”类别预定义的应答策略和信息给出预先设置的答案。

上述实施例中提供的对话机器人生成方法，对用户开放建立和部署对话机器人的功能，机器学习模型的训练和部署由系统自动完成，用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答，提高了用户建立和部署对话机器人的效率。

在一个实施例中，本公开提供一种对话机器人生成装置40，包括：模型确定模块41、模型训练模块42、模型部署模块43和运行控制模块44。模型确定模块41基于用户输入的机器人建立指令确定所需创建的机器学习模型。模型训练模块42接收用户输入的初始语料集合，将初始语料集合作为训练样本对机器学习模型进行训练。

模型部署模块43基于用户输入的机器人部署指令获取训练好的机器学习模型进行部署，入口设置模块44设置与机器学习模型对应的机器人对话入口。运行控制模块45接收到用户输入的对话交互信息，将对话交互信息输入与机器人对话入口相对应的机器学习模型，以使机器学习模型生成应答信息。

如图5所示，模型训练模块42包括：语料分类单元421、标注提示单元422和样本训练单元423。语料分类单元421基于初始语料集合中的初始语料进行分类训练，获取用于判定初始语料的类别的分类规则。标注提示单元422向用户显示分类规则，以使用户基于分类规则对初始语料进行分类，并对初始语料标注类别。样本训练单元423接收到用户提交的对初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对机器学习模型进行训练。

语料分类单元421提取初始语料的特征信息，并利用特征上下位和/或特征同义词关系对特征信息进行泛化处理。语料分类单元421对泛化处理后的特征信息进行聚类处理，用以获取初始语料的聚类结果。语料分类单元421融合聚类结果得到初始语料的分类结果，基于分类结果建立分类规则。

样本训练单元423获取验证语料集合，使用机器学习模型对验证语料集合进行分类检验，获取验证语料集合中验证语料的类别。样本训练单元423确定分类检验的成功率，判断成功率是否低于预设的阈值。如果是，则样本训练单元423提示用户输入新的初始语料集合，将新的初始语料作为新的训练样本，用以继续对机器学习模型进行训练。

如果成功率高于阈值，则样本训练单元423停止对机器学习模型进行训练。样本训练单元423接收用户设置的与类别相对应的应答信息，并在机器学习模型中设置类别与应答信息的对应关系。

如图6所示，运行控制模块45包括：入口确定单元451、文本处理单元452和应答生成单元453。入口确定单元451接收用户输入的文字信息，确定与文字信息相对应的机器人入口，并将文字信息发送至机器人入口。文本处理单元452对文字信息进行纠错处理，并对文字信息进行分词处理，对进行分词处理后的文字信息进行特征词提取，构造文字信息的语义向量。应答生成单元453将语义向量输入机器人入口对应的机器学习模型，以使机器学习模型基于语义向量确定文字信息的类别，获取与类别相对应的应答信息。

图7为根据本公开的对话机器人生成装置的另一个实施例的模块示意图。如图7所示，该装置可包括存储器71、处理器72、通信接口73以及总线74。存储器71用于存储指令，处理器72耦合到存储器71，处理器72被配置为基于存储器71存储的指令执行实现上述的对话机器人生成方法。

存储器71可以为高速RAM存储器、非易失性存储器(non-volatile memory)等，存储器71也可以是存储器阵列。存储器71还可能被分块，并且块可按一定的规则组合成虚拟卷。处理器72可以为中央处理器CPU，或专用集成电路ASIC(Application Specific Integrated Circuit)，或者是被配置成实施本公开的对话机器人生成方法的一个或多个集成电路。

本公开还提供一种计算机可读存储介质，其中计算机可读存储介质存储有计算机指令，指令被处理器执行时实现任一实施例所涉及的方法。本领域内的技术人员应明白，本公开的实施例可提供为方法、装置、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式

上述实施例中提供的对话机器人自动生成方法及装置，对用户开放建立和部署对话机器人的功能，机器学习模型的训练和部署由系统自动完成，用户无需编程便可自动建立机器学习模型并能够利用机器学习模型进行应答，提高了用户建立和部署对话机器人的效率，并且基于机器学习模型能够快速、准确地生成应答信息，提升了用户体验。

本领域内的技术人员应明白，本公开的实施例可提供为方法、系统、或计算机程序产品。因此，本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本公开是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

最后应当说明的是：以上实施例仅用以说明本公开的技术方案而非对其限制；尽管参照较佳实施例对本公开进行了详细的说明，所属领域的普通技术人员应当理解：依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换；而不脱离本公开技术方案的精神，其均应涵盖在本公开请求保护的技术方案范围当中

Claims

一种对话机器人生成方法，包括：

确定步骤，基于用户输入的机器人建立指令确定所需创建的机器学习模型；

训练步骤，将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练；

部署步骤，基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署；

设置步骤，设置与所述机器学习模型对应的机器人对话入口；以及

输入步骤，将来自用户的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型，以使所述机器学习模型生成应答信息。
如权利要求1所述的方法，所述将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练包括：

基于所述初始语料集合中的初始语料进行分类训练，用以得到用于判定所述初始语料的类别的分类规则；

向用户显示所述分类规则，以使用户基于所述分类规则对所述初始语料标注类别；

根据用户提交的对所述初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对所述机器学习模型进行训练。
如权利要求2所述的方法，所述基于所述初始语料集合中的初始语料进行分类训练、用以得到用于判定所述初始语料的类别的分类规则包括：

提取所述初始语料的特征信息；

利用特征上下位和特征同义词关系中的至少一个对所述特征信息进行泛化处理；

对泛化处理后的所述特征信息进行聚类处理，用以得到所述初始语料的聚类结果；

融合所述聚类结果得到所述初始语料的分类结果；

基于所述分类结果建立所述分类规则。
如权利要求3所述的方法，在将所述初始语料集合作为训练样本对所述机器学习模型进行训练之后还包括：

使用所述机器学习模型对验证语料集合进行分类检验；

将所述分类检验的成功率与阈值进行比较；

在所述成功率低于所述阈值的情况下，提示用户输入新的初始语料集合，用以继续对所述机器学习模型进行训练。
如权利要求4所述的方法，还包括：

在所述成功率高于所述阈值的情况下，停止对所述机器学习模型进行训练；

接收用户设置的与所述初始语料的类别相对应的应答信息；

在所述机器学习模型中设置所述初始语料的类别与所述应答信息的对应关系。
如权利要求5所述的方法，所述将用户输入的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型包括：

将用户输入的文字信息发送到与此文字信息相对应的机器人入口；

对所述文字信息进行纠错处理；

对进行所述纠错处理后的所述文字信息进行分词处理；

对进行所述分词处理后的文字信息进行特征词提取；

基于所述特征词构造所述文字信息的语义向量；

将所述语义向量输入所述机器人入口对应的所述机器学习模型，以使所述机器学习模型基于所述语义向量确定所述文字信息的类别，用以得到与此类别相对应的应答信息。
如权利要求2所述的方法，其中，

所述机器人包括：客服机器人，所述类别包括退货、付款、购买中的至少一种。
一种对话机器人生成装置，包括：

模型确定模块，用于基于用户输入的机器人建立指令确定所需创建的机器学习模型；

模型训练模块，用于将来自用户的初始语料集合作为训练样本对所述机器学习模型进行训练；

模型部署模块，用于基于用户输入的机器人部署指令获取训练好的所述机器学习模型进行部署；

入口设置模块，用于设置与所述机器学习模型对应的机器人对话入口；

运行控制模块，用于将来自用户的对话交互信息输入与所述机器人对话入口相对应的所述机器学习模型，以使所述机器学习模型生成应答信息。
如权利要求8所述的装置，其中，

所述模型训练模块，包括：

语料分类单元，用于基于所述初始语料集合中的初始语料进行分类训练，用以得到用于判定所述初始语料的类别的分类规则；

标注提示单元，用于向用户显示所述分类规则，以使用户基于所述分类规则对所述初始语料标注类别；

样本训练单元，用于根据用户提交的对所述初始语料标注类别的结果，将标注有类别的初始语料作为训练样本对所述机器学习模型进行训练。
如权利要求9所述的装置，其中，

所述语料分类单元，还用于提取所述初始语料的特征信息；利用特征上下位和特征同义词关系中的至少一个对所述特征信息进行泛化处理；对泛化处理后的所述特征信息进行聚类处理，用以得到所述初始语料的聚类结果；融合所述聚类结果得到所述初始语料的分类结果；基于所述分类结果建立所述分类规则。
如权利要求10所述的装置，其中，

所述样本训练单元，还用于使用所述机器学习模型对验证语料集合进行分类检验；将所述分类检验的成功率与阈值进行比较；在所述成功率低于所述阈值的情况下，提示用户输入新的初始语料集合；将所述新的初始语料作为新的训练样本，用以继续对所述机器学习模型进行训练。
如权利要求11所述的装置，其中，

所述样本训练单元，还用于在所述成功率高于所述阈值的情况下，停止对所述机器学习模型进行训练；接收用户设置的与所述初始语料的类别相对应的应答信息；在所述机器学习模型中设置此类别与所述应答信息的对应关系。
如权利要求12所述的装置，其中，

所述运行控制模块，还包括：

入口确定单元，用于将用户输入的文字信息发送到与此文字信息相对应的机器人入口；

文本处理单元，用于对所述文字信息进行纠错处理；对进行所述纠错处理后的所述文字信息进行分词处理；对进行所述分词处理后的文字信息进行特征词提取；基于所述特征词构造所述文字信息的语义向量；

应答生成单元，用于将所述语义向量输入所述机器人入口对应的所述机器学习模型，以使所述机器学习模型基于所述语义向量确定所述文字信息的类别，用以得到与所述类别相对应的应答信息。
一种对话机器人生成装置，包括：

存储器；以及耦接至所述存储器的处理器，所述处理器被配置为基于存储在所述存储器中的指令，执行如权利要求1至7中任一项所述的对话机器人生成方法。
一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述指令被处理器执行如权利要求1至7中任一项所述的对话机器人生成方法。