CN114579718A

CN114579718A - 结合rpa和ai的文本特征生成方法、装置、设备及存储介质

Info

Publication number: CN114579718A
Application number: CN202210137742.3A
Authority: CN
Inventors: 王建周
Original assignee: Laiye Technology Beijing Co Ltd
Current assignee: Laiye Technology Beijing Co Ltd
Priority date: 2022-02-15
Filing date: 2022-02-15
Publication date: 2022-06-03

Abstract

本公开提出一种结合RPA和AI的文本特征生成方法、装置、设备及存储介质，应用于支持自然语言处理NLP的智能对话系统，智能对话系统可供用户注册使用，该方法包括：基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。通过本公开，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，有效提升文本特征生成的准确度，提升智能对话系统的召回性能。

Description

结合RPA和AI的文本特征生成方法、装置、设备及存储介质

技术领域

本公开涉及计算机技术领域，尤其涉及一种结合RPA(Robotic ProcessAutomation，机器人流程自动化)和AI(Artificial Intelligence，人工智能)的文本特征生成方法、装置、设备及存储介质。

背景技术

机器人流程自动化(Robotic Process Automation)简称RPA，是通过特定的“机器人软件”，模拟人在计算机上的操作，按规则自动执行流程任务。

人工智能(Artificial Intelligence，AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门技术科学。

智能对话系统，是指利用人工智能AI中涉及的处理算法对用户的问题文本进行处理，以得到问题文本对应的应答文本的对话系统，用户是指与智能对话系统进行交互的对象。

相关技术中，采用智能对话系统对用户的问题召回接近的答案和意图时，通常利用用户与智能对话系统的对话文本对人工智能AI模型进行训练和微调。

这种方式下，单个用户对话文本的数据量不足以对人工智能AI模型进行微调，影响对话文本特征分析的准确性，导致智能对话系统的召回性能受到影响。

发明内容

本公开旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本公开的目的在于提出一种结合RPA和AI的文本特征生成方法、装置、电子设备及存储介质，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，有效提升文本特征生成的准确度，提升智能对话系统的召回性能。

本公开第一方面实施例提出的结合RPA和AI的文本特征生成方法，包括：基于机器人流程自动化RPA获取对话文本；基于人工智能AI确定所述对话文本的第一词向量特征；确定所述用户的需求词向量意图；以及根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征。

在一种实施方式中，处理所述第二词向量特征，以得到所述对话文本的句向量特征，其中，所述智能对话系统，基于所述AI处理所述句向量特征，以得到所述对话文本的应答文本。

在一种实施方式中，所述基于人工智能AI确定所述对话文本的第一词向量特征，包括：基于所述AI确定所述对话文本的第一词向量；基于平滑逆词频算法，确定与所述第一词向量对应的第一词频；根据所述第一词频，确定所述第一词向量的第一词权重，其中，所述第一词向量和所述第一词权重被共同作为所述第一词向量特征。

在一种实施方式中，在所述确定所述用户的需求词向量意图之后，还包括：基于所述AI处理所述需求词向量意图，以得到多个意图词向量；对所述多个意图词向量进行主成分分解，以得到所述多个意图词向量之间的共性语义信息；根据所述共性语义信息，从所述多个意图词向量之中确定出目标意图词向量。

在一种实施方式中，所述根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征，包括：如果所述目标意图词向量和所述第一词向量匹配，则将所述第一词权重增大处理为目标词权重；将所述第一词向量和所述目标词权重作为所述第二词向量特征。

在一种实施方式中，所述处理所述第二词向量特征，以得到所述对话文本的句向量特征，包括：如果所述目标意图词向量和所述第一词向量匹配，则基于所述目标词权重对所述第一词向量进行描述处理，以得到所述对话文本的句向量特征。

在一种实施方式中，所述根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征，包括：如果所述目标意图词向量与所述第一词向量不匹配，则采用所述目标意图词向量更新所述第一词向量；对所述目标意图词向量配置意图词权重；将所述目标意图词向量和所述意图词权重作为所述第二词向量特征。

在一种实施方式中，所述处理所述第二词向量特征，以得到所述对话文本的句向量特征，包括：如果所述目标意图词向量与所述第一词向量不匹配，则基于所述意图词权重对所述目标意图词向量进行描述处理，以得到所述对话文本的句向量特征。

在一种实施方式中，在所述对所述目标意图词向量配置意图词权重前，还包括：将所述需求词向量意图输入至所述AI中的权重解析模型中，以得到与所述目标意图词向量对应的所述意图词权重。

本公开第二方面实施例提出的结合RPA和AI的文本特征生成装置，包括：获取模块，用于基于机器人流程自动化RPA获取对话文本；第一确定模块，用于基于人工智能AI确定所述对话文本的第一词向量特征；第二确定模块，用于确定所述用户的需求词向量意图；以及第一处理模块，用于根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征。

在一种实施方式中，还包括：第二处理模块，用于处理所述第二词向量特征，以得到所述对话文本的句向量特征，其中，所述智能对话系统，基于所述AI处理所述句向量特征，以得到所述对话文本的应答文本。

在一种实施方式中，所述第一确定模块，包括：第一确定子模块，用于基于所述AI确定所述对话文本的第一词向量；第二确定子模块，用于基于平滑逆词频算法，确定与所述第一词向量对应的第一词频；第三确定子模块，用于根据所述第一词频，确定所述第一词向量的第一词权重，其中，所述第一词向量和所述第一词权重被共同作为所述第一词向量特征。

在一种实施方式中，还包括：第三处理模块，用于在所述确定所述用户的需求词向量意图之后，基于所述AI处理所述需求词向量意图，以得到多个意图词向量；第四处理模块，用于对所述多个意图词向量进行主成分分解，以得到所述多个意图词向量之间的共性语义信息；第三确定模块，用于根据所述共性语义信息，从所述多个意图词向量之中确定出目标意图词向量。

在一种实施方式中，所述第一处理模块，具体用于：如果所述目标意图词向量和所述第一词向量匹配，则将所述第一词权重增大处理为目标词权重；将所述第一词向量和所述目标词权重作为所述第二词向量特征。

在一种实施方式中，所述第二处理模块，具体用于：如果所述目标意图词向量和所述第一词向量匹配，则基于所述目标词权重对所述第一词向量进行描述处理，以得到所述对话文本的句向量特征。

在一种实施方式中，所述第一处理模块，还用于：如果所述目标意图词向量与所述第一词向量不匹配，则采用所述目标意图词向量更新所述第一词向量；对所述目标意图词向量配置意图词权重；将所述目标意图词向量和所述意图词权重作为所述第二词向量特征。

在一种实施方式中，所述第二处理模块，还用于：如果所述目标意图词向量与所述第一词向量不匹配，则基于所述意图词权重对所述目标意图词向量进行描述处理，以得到所述对话文本的句向量特征。

在一种实施方式中，所述第一处理模块，还用于：在所述对所述目标意图词向量配置意图词权重前，将所述需求词向量意图输入至所述AI中的权重解析模型中，以得到与所述目标意图词向量对应的所述意图词权重。

本公开第三方面实施例提出了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现如本公开第一方面实施例提出的结合RPA和AI的文本特征生成方法。

本公开第四方面实施例提出了一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本公开第一方面实施例提出的结合RPA和AI的文本特征生成方法。

上述技术方案中的优点或有益效果至少包括：通过基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，以及根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，有效提升文本特征生成的准确度，提升智能对话系统的召回性能。

上述概述仅仅是为了说明书的目的，并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外，通过参考附图和以下的详细描述，本公开进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中，除非另外规定，否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解，这些附图仅描绘了根据本公开的一些实施方式，而不应将其视为是对本公开范围的限制。

图1是本公开一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图；

图2是本公开另一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图；

图3是本公开另一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图；

图4是本公开一实施例提出的结合RPA和AI的文本特征生成装置的结构示意图；

图5是本公开另一实施例提出的结合RPA和AI的文本特征生成装置的结构示意图；

图6示出根据本公开一实施例的电子设备的结构框图。

具体实施方式

下面详细描述本公开的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本公开，而不能理解为对本公开的限制。

在本公开的描述中，术语“多个”指两个或两个以上。

在本公开的描述中，术语“机器人流程自动化RPA”，是指通过机器人应用软件在计算机上按照规则自动执行流程任务。

在本公开的描述中，术语“人工智能AI”，是指研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术，以及机器学习、深度学习、大数据处理技术、知识图谱技术等几大方向。

在本公开的描述中，术语“对话文本”，是指用户与机器人进行交互的内容文本，该交互的内容文本例如可以为用户的询问文本，举例而言，对话文本具体可以为用户对商品进行咨询的问句文本，或者也可以为其他任意形式交互的内容文本，对此不做限制。

在本公开的描述中，术语“第一词向量特征”，是指映射至向量空间的语义向量特征，该语义特征可以用于描述对话文本的语义，该第一词向量特征可以用于捕捉文本中单词的语义相似性。

在本公开的描述中，术语“第二词向量特征”，是指根据用户的需求词向量意图对第一词向量特征进行匹配调整处理后的词向量特征，第二词向量特征可以用于进行加权处理等以生成对话文本对应的句向量特征。

在本公开的描述中，术语“第一词向量”，是指对对话文本中的词汇在向量空间进行映射表示后生成的表征向量。

在本公开的描述中，术语“词频”，是指词向量在文本中出现的频率，第一词频是指第一词向量在在文本中出现的频率。

在本公开的描述中，术语“词权重”，是指词向量的权值信息，第一词权重是第一词向量的权值信息。

在本公开的描述中，术语“句向量特征”，是指对第二词向量特征进行加权处理后得到的可以表征语句语义的向量特征。

在本公开的描述中，术语“应答文本”，是指基于句向量特征生成的对对话文本中的文本内容进行应答的文本。

在本公开的描述中，术语“意图词向量”，是指将用户的需求词向量意图映射至向量空间之后得到的词向量，可以对需求词向量意图进行向量化处理，以得到意图词向量。

在本公开的描述中，术语“主成分分解”，是指对多个意图词向量进行转换处理，以得到多个意图词向量之间的共性语义信息，使得处理后的意图词向量为不相关的意图词向量。

在本公开的描述中，术语“目标意图词向量”，是指对多个意图词向量去除包含共性语义信息的部分意图词向量之后，得到的不相关的意图词向量，该目标意图词向量之间不具有相关性关系。

参照下面的描述和附图，将清楚本公开的实施例的这些和其他方面。在这些描述和附图中，具体公开了本公开的实施例中的一些特定实施方式，来表示实施本公开的实施例的原理的一些方式，但是应当理解，本公开的实施例的范围不受此限制。相反，本公开的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。

以下结合附图描述根据本公开实施例的结合RPA和AI的文本特征生成方法。

图1是本公开一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图。

本实施例以结合RPA和AI的文本特征生成方法被配置为结合RPA和AI的文本特征生成装置中来举例说明，本实施例中结合RPA和AI的文本特征生成方法可以被配置在结合RPA和AI的文本特征生成装置中，结合RPA和AI的文本特征生成装置可以设置在服务器中，或者也可以设置在电子设备中，本公开实施例对此不作限制。

本实施例以结合RPA和AI的文本特征生成方法被配置在电子设备中为例。其中，电子设备例如智能手机、平板电脑、个人数字助理、电子书等具有各种操作系统的硬件设备。

需要说明的是，本公开实施例的执行主体，在硬件上可以例如为服务器或者电子设备中的中央处理器(Central Processing Unit，CPU)，在软件上可以例如为服务器或者电子设备中的相关的后台服务，对此不作限制。

另外，本公开实施例中的“生成”，是指结合机器人流程自动化RPA和人工智能AI的文本特征生成过程，也即是说，该文本特征生成过程是一个全流程自动化的生成过程，并且该文本特征生成过程还可以与人工智能AI相结合，实现自动化地进行自然语言处理(Natural Language Processing，NLP)之中的应答和意图召回。

本公开可以具体应用于支持自然语言处理NLP的智能对话系统，所述智能对话系统可供用户注册使用，自然语言处理(Natural Language Processing，NLP)，即计算机科学，人工智能，语言学关注计算机和人类(自然)语言之间的相互作用的领域。

举例而言，本公开实施例中基于该全流程自动化的文本特征生成过程，可以实现全流程自动化地执行基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，以及根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。

如图1所示，该结合RPA和AI的文本特征生成方法，包括：

本公开实施例中的结合RPA和AI的文本特征生成方法可以应用于支持自然语言处理NLP的智能对话系统，智能对话系统可供用户注册使用，其中，用户是指与智能对话系统进行交互的对象，智能对话系统，是指利用人工智能AI中涉及的处理算法对用户的问题文本进行处理，以得到问题文本对应的应答文本的对话系统。

S101：基于机器人流程自动化RPA获取对话文本。

其中，机器人流程自动化RPA，是指通过机器人应用软件在计算机上按照规则自动执行流程任务。

其中，对话文本是指用户与机器人进行交互的内容文本，该交互内容文本例如可以为用户的询问文本，举例而言，对话文本具体可以为用户对商品进行咨询的问句文本，或者也可以为其他任意形式的交互内容文本，对此不做限制。

也即是说，本公开实施例中的一种应用场景可以具体例如为，基于机器人流程自动化RPA获取用户对商品的咨询问句文本，举例而言，该咨询问句例如可以为“有什么经济实惠的酒”，将获取到的咨询问句文本作为对话文本，而后可以对获取到的对话文本进行结合RPA和AI的文本特征生成，本公开实施例描述的结合RPA和AI的文本特征生成方法，也可以应用于其他任意可能的文本特征生成场景中，对此不做限制。

本公开实施例中，在基于机器人流程自动化RPA获取对话文本时，可以预先配置应用程序数据接口，由RPA机器人按照预先设定好的软件操作流程，经由该应用程序数据接口接收用户与机器人进行交互的内容文本，并将获取到的用户与机器人进行交互的内容文本作为对话文本。

另一些实施例中，也可以基于机器人流程自动化RPA获取用户的与机器人交互的对话音频，而后利用语音识别模型对交互音频进行文本识别提取，以提取到对话音频对应的交互内容文本，并将获取到的交互内容文本作为对话文本，或者也可以在结合RPA和AI的文本特征生成装置上配备数据传输接口，经由该数据传输接口接收其他电子设备传输的对话文本作为获取到的对话文本，或者也可以采用其他任意可能的基于机器人流程自动化RPA的方式获取对话文本，对此不做限制。

S102：基于人工智能AI确定对话文本的第一词向量特征。

其中，第一词向量特征，是指映射至向量空间的语义向量特征，该语义特征可以用于描述对话文本的语义，该第一词向量特征可以用于捕捉文本中单词的语义相似性。

本公开实施例在上述基于机器人流程自动化RPA获取对话文本之后，可以基于人工智能AI确定对话文本的第一词向量特征。

本公开实施例中，在基于人工智能AI确定对话文本的第一词向量特征时，可以利用平滑逆词频算法(Smooth Inverse Frequency，SIF)对对话文本进行词频分析以及权重分析等处理，以得到平滑逆词频算法输出的用于描述对话文本语义的词向量特征，并将平滑逆词频算法输出的词向量特征作为对话文本的第一词向量特征。

另一些实施例中，也可以采用预训练的包含输入层、映射层以及输出层的语言分析模型对对话文本进行分析处理，在输出层建立对话文本的中词汇的霍夫曼树，获取输出层的最终输出结果作为对话文本的第一词向量特征，或者也可以采用其他任意基于人工智能AI的方法确定对话文本的第一词向量特征，对此不做限制。

S103：确定用户的需求词向量意图。

其中，用户是指与智能对话机器人通过对话文本进行交互的对象，用户的需求词向量意图，是指预先根据用户对于词汇间自定义的语义关联设置的词汇特征意图，该需求词向量意图可以用于对对话文本的词向量进行自定义拉近处理。

本公开实施例中，在确定用户的需求词向量意图时，可以预先获取用户自定义的对话文本中词汇间的语义关联，而后可以利用语义编码模型对该词汇间的语义关联进行编码处理，以对包含语义关联的词向量进行拉近处理，以确定用户的需求词向量意图。

S104：根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。

其中，第二词向量特征，是指根据用户的需求词向量意图对第一词向量特征进行匹配调整处理后的词向量特征，第二词向量特征可以用于进行加权处理等以生成对话文本对应的句向量特征。

本公开实施例在上述基于人工智能AI确定对话文本的第一词向量特征，并确定用户的需求词向量意图之后，可以根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。

本公开实施例中，在根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征时，可以根据需求词向量意图对平滑逆词频算法SIF进行调优处理，而后利用调优处理后的平滑逆词频算法SIF对第一词向量特征进行匹配调整处理，以得到调优处理后的平滑逆词频算法输出的向量特征作为对话文本的第二词向量特征。

另一些实施例中，可以预先训练一个深度学习模型，该深度学习模型可以执行对词向量特征进行匹配调整的任务，并根据需求词向量意图对深度学习模型进行针对性的适应性的调优处理，以得到调优处理后的深度学习模型，而后利用调优处理后的深度学习模型对第一词向量特征进行匹配调整处理，以得到深度学习模型的输出结果作为对话文本的第二词向量特征，或者也可以采用其他任意方式根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征，对此不做限制。

本实施例中，通过基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，以及根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，有效提升文本特征生成的准确度，提升智能对话系统的召回性能。

图2是本公开另一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图。

如图2所示，该结合RPA和AI的文本特征生成方法，包括：

S201：基于机器人流程自动化RPA获取对话文本。

S201的描述说明可以示例参见上述实施例，在此不再赘述。

S202：基于AI确定对话文本的第一词向量。

其中，第一词向量，是指对对话文本中的词汇在向量空间进行映射表示后生成的表征向量。

本公开实施例中，在基于机器人流程自动化RPA获取对话文本之后，可以基于人工智能AI，确定对话文本的第一词向量，可以利用预训练的语言表征模型对对话文本进行分词处理和向量化处理，以得到预训练的语言表征模型的输出的词向量，并将预训练的语言表征模型的输出的词向量作为对话文本的第一词向量。

S203：基于平滑逆词频算法，确定与第一词向量对应的第一词频。

其中，词频是指词向量在文本中出现的频率，第一词频是指第一词向量在在文本中出现的频率。

本公开实施例中，在对对话文本进行分词处理和向量化处理以得到确定对话文本的第一词向量之后，可以基于平滑逆词频算法对各个第一词向量的出现频率进行统计处理，以得到第一词向量对应的第一词频。

S204：根据第一词频，确定第一词向量的第一词权重，其中，第一词向量和第一词权重被共同作为第一词向量特征。

其中，词权重是指词向量的权值信息，第一词权重是第一词向量的权值信息。

本公开实施例在上述基于人工智能AI确定对话文本的第一词向量，并基于平滑逆词频算法，确定与第一词向量对应的第一词频之后，可以根据第一词频，确定第一词向量的第一词权重。

本公开实施例中，在根据第一词频，确定第一词向量的第一词权重时，可以利用权重计算公式

进行第一词向量的第一词权重的计算，其中，a为常数，可以调整常数a的参数范围使得计算结果接近较佳结果，p(w)代表第一词向量的第一词频，以得到权重计算公式的权值计算结果作为第一词向量对应的第一词权重。

本公开实施例中，在利用权重计算公式根据第一词频，确定第一词向量的第一词权重之后，可以将第一词向量和第一词权重共同作为第一词向量特征。

本实施例中，通过基于人工智能AI确定对话文本的第一词向量，基于平滑逆词频算法，确定与第一词向量对应的第一词频，根据第一词频，确定第一词向量的第一词权重，从而可以确定出第一词向量的第一词权重值，由于第一词权重可以用于对第一词向量进行加权处理以得到句向量特征，从而可以提升生成的句向量特征的准确度，辅助生成较为准确的对话文本对应的应答文本。

S205：确定用户的需求词向量意图。

S206：根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。

S205-S206的描述说明可以示例参见上述实施例，在此不再赘述。

S207：处理第二词向量特征，以得到对话文本的句向量特征，其中，智能对话系统，基于AI处理句向量特征，以得到对话文本的应答文本。

其中，句向量特征是指对第二词向量特征进行加权处理后得到的可以表征语句语义的向量特征。

其中，应答文本是指基于句向量特征生成的对对话文本中的文本内容进行应答的文本。

其中，智能对话系统，是指利用人工智能AI中涉及的处理算法对用户的问题文本进行处理，以得到问题文本对应的应答文本的对话系统，智能对话系统可以基于AI处理句向量特征，以得到对话文本的应答文本。

本公开实施例在上述确定用户的需求词向量意图，并根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征之后，可以处理第二词向量特征，以得到对话文本的句向量特征。

本公开实施例中，在处理第二词向量特征，以得到对话文本的句向量特征时，可以分别计算第二词向量特征的权值，而后对第二词向量特征进行加权处理，以得到加权处理后的特征作为对话文本的句向量特征，而后可以利用智能对话系统基于人工智能AI中涉及的相关算法处理句向量特征，可以利用智能对话系统基于AI处理算法对句向量特征进行匹配检索处理，以得到对话文本对应的应答文本。

本实施例中，通过基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，以及根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，有效提升文本特征生成的准确度，提升智能对话系统的召回性能，通过基于人工智能AI确定对话文本的第一词向量，基于平滑逆词频算法，确定与第一词向量对应的第一词频，根据第一词频，确定第一词向量的第一词权重，从而可以确定出第一词向量的第一词权重值，由于第一词权重可以用于对第一词向量进行加权处理以得到句向量特征，从而可以提升生成的句向量特征的准确度，辅助生成较为准确的对话文本对应的应答文本。

图3是本公开另一实施例提出的结合RPA和AI的文本特征生成方法的流程示意图。

如图3所示，该结合RPA和AI的文本特征生成方法，包括：

S301：基于机器人流程自动化RPA获取对话文本。

S302：基于人工智能AI确定对话文本的第一词向量特征。

S303：确定用户的需求词向量意图。

S301-S303的描述说明可以示例参见上述实施例，在此不再赘述。

S304：基于AI处理需求词向量意图，以得到多个意图词向量。

其中，意图词向量，是指将用户的需求词向量意图映射至向量空间之后得到的词向量，可以对需求词向量意图进行向量化处理，以得到意图词向量。

本公开实施例中，在确定用户的需求词向量意图之后，可以基于人工智能AI处理需求词向量意图，以得到多个意图词向量，可以利用编码模型，对需求词向量意图进行编码处理和向量化处理，将用户的需求词向量意图映射至向量空间，以得到编码模型输出的多个词向量，并将编码模型输出的多个词向量作为基于人工智能AI处理需求词向量意图得到的多个意图词向量。

S305：对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息。

其中，主成分分解是指对多个意图词向量进行转换处理，以得到多个意图词向量之间的共性语义信息，使得处理后的意图词向量为不相关的意图词向量。

本公开实施例在上述基于AI处理需求词向量意图，以得到多个意图词向量之后，可以对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息。

本公开实施例中，在对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息时，可以将意图词向量构成词向量矩阵，计算多个意图词向量计算加权平均值，计算多个意图词向量在词向量矩阵中的投影数据信息，并将计算得到的投影数据信息作为多个意图向量之间的共性语义信息。

S306：根据共性语义信息，从多个意图词向量之中确定出目标意图词向量。

其中，目标意图词向量，是指对多个意图词向量去除包含共性语义信息的部分意图词向量之后，得到的不相关的意图词向量，该目标意图词向量之间不具有相关性关系。

本公开实施例中，可以根据共性语义信息，对多个意图词向量进行变换处理，将包含相关性意图词向量的多个意图词向量去除部分共性意图词向量，以得到不相关的意图词向量作为目标意图词向量。

本实施例中，通过基于AI处理需求词向量意图，以得到多个意图词向量，对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息，根据共性语义信息，从多个意图词向量之中确定出目标意图词向量，从而可以对意图词向量中的共性部分进行去除，以得到不相关的目标意图词向量，由于联合目标意图词向量进行句向量特征的生成，从而可以保证句向量特征的生成效果，有效提升生成的句向量特征的准确性，辅助提升智能对话系统的召回性能。

S307：如果目标意图词向量和第一词向量匹配，则将第一词权重增大处理为目标词权重。

本公开实施例中，在上述根据共性语义信息，从多个意图词向量之中确定出目标意图词向量之后，可以将目标意图词向量与第一词向量进行匹配处理，如果目标意图词向量和第一词向量匹配，则可以将第一词权重增大处理为目标词权重，可以对第一词向量对应的第一词权重进行增大处理，以得到增大处理后的第一词权重，并将增大处理后的第一词权重作为目标词权重。

S308：将第一词向量和目标词权重作为第二词向量特征。

本公开实施例中，在上述在目标意图词向量和第一词向量匹配时，将第一词权重增大处理为目标词权重之后，可以将第一词向量和增大处理后的目标词权重作为第二词向量特征。

S309：如果目标意图词向量和第一词向量匹配，则基于目标词权重对第一词向量进行描述处理，以得到对话文本的句向量特征，其中，智能对话系统，基于AI处理句向量特征，以得到对话文本的应答文本。

本公开实施例中，如果目标意图词向量和第一词向量匹配，则将第一词权重增大处理为目标词权重，并将第一词向量和目标词权重作为第二词向量特征，而后可以基于目标词权重对第一词向量进行描述处理，以得到对话文本的句向量特征。

本公开实施例中，在基于目标词权重对第一词向量进行描述处理时，可以基于增大处理后得到的目标词权重，对第一词向量进行加权和描述处理，以得到描述处理后生成的句向量特征，并将生成的句向量特征作为对话文本的句向量特征，而后可以利用智能对话系统，基于人工智能AI处理句向量特征，以得到对话文本对应的应答文本。

可选地，一些实施例中，如果目标意图词向量与第一词向量不匹配，则采用目标意图词向量更新第一词向量，将需求词向量意图输入至AI中的权重解析模型中，以得到与目标意图词向量对应的意图词权重，对目标意图词向量配置意图词权重，将目标意图词向量和意图词权重作为第二词向量特征，如果目标意图词向量与第一词向量不匹配，则基于意图词权重对目标意图词向量进行描述处理，以得到对话文本的句向量特征，其中，智能对话系统，基于AI处理句向量特征，以得到对话文本的应答文本，从而可以在目标意图词向量与第一词向量不匹配时，对第一词向量进行更新处理，并基于意图词权重和目标意图词向量生成对话文本的句向量特征，保证根据第一词向量生成对话文本的句向量特征处理的全面性，有效提升文本特征生成处理效果，辅助提升智能对话系统的召回性能。

其中，预训练的权重解析模型可以完成对向量进行权重解析以及配置的任务，可以用于对词向量的词权重进行配置。

本公开实施例中，可以将目标意图词向量与第一词向量进行匹配处理，如果目标意图词向量与第一词向量不匹配，则采用目标意图词向量更新第一词向量，而后可以将需求词向量意图输入至预训练的权重解析模型中，利用权重解析模型对需求词向量意图进行权重解析处理，以得到预训练的权重解析模型的输出结果，将预训练的权重解析模型的输出结果作为意图词权重，而后可以对目标意图词向量配置意图词权重，并将目标意图词向量和意图词权重作为第二词向量特征。

本公开实施例中，如果目标意图词向量与第一词向量不匹配，则可以基于意图词权重对目标意图词向量进行加权描述处理，以得到加权描述处理后的向量特征作为对话文本的句向量特征，而后可以利用智能对话系统，基于人工智能AI处理句向量特征，以得到对话文本的应答文本。

本实施例中，通过基于机器人流程自动化RPA获取对话文本，基于人工智能AI确定对话文本的第一词向量特征，确定用户的需求词向量意图，以及根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征，能够利用RPA结合人工智能AI实现对用户的需求词向量意图进行预先识别，以对对话文本的第一词向量特征进行调整处理，保障词向量识别匹配的准确度，提升智能对话系统的召回性能，有效提升文本特征生成的准确度，通过基于AI处理需求词向量意图，以得到多个意图词向量，对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息，根据共性语义信息，从多个意图词向量之中确定出目标意图词向量，从而可以对意图词向量中的共性部分进行去除，以得到不相关的目标意图词向量，由于联合目标意图词向量进行句向量特征的生成，从而可以保证句向量特征的生成效果，有效提升生成的句向量特征的准确性，辅助提升智能对话系统的召回性能。

图4是本公开一实施例提出的结合RPA和AI的文本特征生成装置的结构示意图。

如图4所示，该结合RPA和AI的文本特征生成装置40，应用于支持自然语言处理NLP的智能对话系统，智能对话系统可供用户注册使用，包括：

获取模块401，用于基于机器人流程自动化RPA获取对话文本；

第一确定模块402，用于基于人工智能AI确定对话文本的第一词向量特征；

第二确定模块403，用于确定用户的需求词向量意图；以及

第一处理模块404，用于根据需求词向量意图处理第一词向量特征，以得到对话文本的第二词向量特征。

在本公开的一些实施例中，如图5所示，图5是本公开另一实施例提出的结合RPA和AI的文本特征生成装置的结构示意图，还包括：

第二处理模块405，用于处理第二词向量特征，以得到对话文本的句向量特征，其中，智能对话系统，基于AI处理句向量特征，以得到对话文本的应答文本。

在本公开的一些实施例中，其中，第一确定模块402，包括：

第一确定子模块4021，用于基于AI确定对话文本的第一词向量；

第二确定子模块4022，用于基于平滑逆词频算法，确定与第一词向量对应的第一词频；

第三确定子模块4023，用于根据第一词频，确定第一词向量的第一词权重，其中，第一词向量和第一词权重被共同作为第一词向量特征。

在本公开的一些实施例中，还包括：

第三处理模块406，用于在确定用户的需求词向量意图之后，基于AI处理需求词向量意图，以得到多个意图词向量；

第四处理模块407，用于对多个意图词向量进行主成分分解，以得到多个意图词向量之间的共性语义信息；

第三确定模块408，用于根据共性语义信息，从多个意图词向量之中确定出目标意图词向量。

在本公开的一些实施例中，其中，第一处理模块404，具体用于：

如果目标意图词向量和第一词向量匹配，则将第一词权重增大处理为目标词权重；

将第一词向量和目标词权重作为第二词向量特征。

在本公开的一些实施例中，其中，第二处理模块405，具体用于：

如果目标意图词向量和第一词向量匹配，则基于目标词权重对第一词向量进行描述处理，以得到对话文本的句向量特征。

在本公开的一些实施例中，其中，第一处理模块404，还用于：

如果目标意图词向量与第一词向量不匹配，则采用目标意图词向量更新第一词向量；

对目标意图词向量配置意图词权重；

将目标意图词向量和意图词权重作为第二词向量特征。

在本公开的一些实施例中，其中，第二处理模块405，还用于：

如果目标意图词向量与第一词向量不匹配，则基于意图词权重对目标意图词向量进行描述处理，以得到对话文本的句向量特征。

在对目标意图词向量配置意图词权重前，将需求词向量意图输入至AI中的权重解析模型中，以得到与目标意图词向量对应的意图词权重。

与上述图1至图3实施例提供的结合RPA和AI的文本特征生成方法相对应，本公开还提供一种结合RPA和AI的文本特征生成装置，由于本公开实施例提供的结合RPA和AI的文本特征生成装置与上述图1至图3实施例提供的结合RPA和AI的文本特征生成方法相对应，因此在结合RPA和AI的文本特征生成方法的实施方式也适用于本公开实施例提供的结合RPA和AI的文本特征生成装置，在本公开实施例中不再详细描述。

本公开实施例各装置中的各模块的功能可以参见上述方法中的对应描述，在此不再赘述。

为了实现上述实施例，本公开还提出一种电子设备，包括：存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，处理器执行程序时，实现如本公开前述实施例提出的结合RPA和AI的文本特征生成方法。

图6示出根据本公开一实施例的电子设备的结构框图。如图6所示，该电子设备60包括：存储器610和处理器620，存储器610内存储有可在处理器620上运行的计算机程序。处理器620执行该计算机程序时实现上述实施例中的结合RPA和AI的文本特征生成方法。存储器610和处理器620的数量可以为一个或多个。

该电子设备60还包括：

通信接口630，用于与外界设备进行通信，进行数据交互传输。

如果存储器610、处理器620和通信接口630独立实现，则存储器610、处理器620和通信接口630可以通过总线相互连接并完成相互间的通信。该总线可以是工业标准体系结构(Industry Standard Architecture，ISA)总线、外部设备互连(Peripheral ComponentInterconnect，PCI)总线或扩展工业标准体系结构(Extended Industry StandardArchitecture，EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。

可选的，在具体实现上，如果存储器610、处理器620及通信接口630集成在一块芯片上，则存储器610、处理器620及通信接口630可以通过内部接口完成相互间的通信。

本公开实施例提供了一种计算机可读存储介质，其存储有计算机程序，该程序被处理器执行时实现本公开实施例中提供的方法。

本公开实施例还提供了一种芯片，该芯片包括，包括处理器，用于从存储器中调用并运行存储器中存储的指令，使得安装有芯片的通信设备执行本公开实施例提供的方法。

本公开实施例还提供了一种芯片，包括：输入接口、输出接口、处理器和存储器，输入接口、输出接口、处理器以及存储器之间通过内部连接通路相连，处理器用于执行存储器中的代码，当代码被执行时，处理器用于执行申请实施例提供的方法。

应理解的是，上述处理器可以是中央处理器(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(FieldProgrammable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者是任何常规的处理器等。值得说明的是，处理器可以是支持进阶精简指令集机器(Advanced RISC Machines，ARM)架构的处理器。

进一步地，可选的，上述存储器可以包括只读存储器和随机存取存储器，还可以包括非易失性随机存取存储器。该存储器可以是易失性存储器或非易失性存储器，或可包括易失性和非易失性存储器两者。其中，非易失性存储器可以包括只读存储器(Read-OnlyMemory，ROM)、可编程只读存储器(Programmable ROM，PROM)、可擦除可编程只读存储器(Erasable PROM，EPROM)、电可擦除可编程只读存储器(Electrically EPROM，EEPROM)或闪存。易失性存储器可以包括随机存取存储器(Random Access Memory，RAM)，其用作外部高速缓存。通过示例性但不是限制性说明，许多形式的RAM可用。例如，静态随机存取存储器(Static RAM，SRAM)、动态随机存取存储器(Dynamic Random Access Memory，DRAM)、同步动态随机存取存储器(Synchronous DRAM，SDRAM)、双倍数据速率同步动态随机存取存储器(Double Data Date SDRAM，DDR SDRAM)、增强型同步动态随机存取存储器(EnhancedSDRAM，ESDRAM)、同步连接动态随机存取存储器(Synchlink DRAM，SLDRAM)和直接内存总线随机存取存储器(Direct Rambus RAM，DR RAM)。

在上述实施例中，可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时，可以全部或部分地以计算机程序产品的形式实现。计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行计算机程序指令时，全部或部分地产生按照本公开的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中，或者从一个计算机可读存储介质向另一个计算机可读存储介质传输。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包括于本公开的至少一个实施例或示例中。而且，描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外，在不相互矛盾的情况下，本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外，术语“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此，限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本公开的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为，表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分。并且本公开的优选实施方式的范围包括另外的实现，其中可以不按所示出或讨论的顺序，包括根据所涉及的功能按基本同时的方式或按相反的顺序，来执行功能。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行指令的定序列表，可以具体实现在任何计算机可读介质中，以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用，或结合这些指令执行系统、装置或设备而使用。

应理解的是，本公开的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。上述实施例方法的全部或部分步骤是可以通过程序来指令相关的硬件完成，该程序可以存储于一种计算机可读存储介质中，该程序在执行时，包括方法实施例的步骤之一或其组合。

此外，在本公开各个实施例中的各功能单元可以集成在一个处理模块中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。上述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时，也可以存储在一个计算机可读存储介质中。该存储介质可以是只读存储器，磁盘或光盘等。

以上所述，仅为本公开的具体实施方式，但本公开的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本公开揭露的技术范围内，可轻易想到其各种变化或替换，这些都应涵盖在本公开的保护范围之内。因此，本公开的保护范围应以权利要求的保护范围为准。

Claims

1.一种结合RPA和AI的文本特征生成方法，其特征在于，应用于支持自然语言处理NLP的智能对话系统，所述智能对话系统可供用户注册使用，所述方法包括：

基于机器人流程自动化RPA获取对话文本；

基于人工智能AI确定所述对话文本的第一词向量特征；

确定所述用户的需求词向量意图；以及

根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征。

2.如权利要求1所述的方法，其特征在于，还包括：

处理所述第二词向量特征，以得到所述对话文本的句向量特征，其中，所述智能对话系统，基于所述AI处理所述句向量特征，以得到所述对话文本的应答文本。

3.如权利要求2所述的方法，其特征在于，所述基于人工智能AI确定所述对话文本的第一词向量特征，包括：

基于所述AI确定所述对话文本的第一词向量；

基于平滑逆词频算法，确定与所述第一词向量对应的第一词频；

根据所述第一词频，确定所述第一词向量的第一词权重，其中，所述第一词向量和所述第一词权重被共同作为所述第一词向量特征。

4.如权利要求3所述的方法，其特征在于，在所述确定所述用户的需求词向量意图之后，还包括：

基于所述AI处理所述需求词向量意图，以得到多个意图词向量；

对所述多个意图词向量进行主成分分解，以得到所述多个意图词向量之间的共性语义信息；

根据所述共性语义信息，从所述多个意图词向量之中确定出目标意图词向量。

5.如权利要求4所述的方法，其特征在于，所述根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征，包括：

如果所述目标意图词向量和所述第一词向量匹配，则将所述第一词权重增大处理为目标词权重；

将所述第一词向量和所述目标词权重作为所述第二词向量特征。

6.如权利要求5所述的方法，其特征在于，所述处理所述第二词向量特征，以得到所述对话文本的句向量特征，包括：

如果所述目标意图词向量和所述第一词向量匹配，则基于所述目标词权重对所述第一词向量进行描述处理，以得到所述对话文本的句向量特征。

7.如权利要求4所述的方法，其特征在于，所述根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征，包括：

如果所述目标意图词向量与所述第一词向量不匹配，则采用所述目标意图词向量更新所述第一词向量；

对所述目标意图词向量配置意图词权重；

将所述目标意图词向量和所述意图词权重作为所述第二词向量特征。

8.如权利要求7所述的方法，其特征在于，所述处理所述第二词向量特征，以得到所述对话文本的句向量特征，包括：

如果所述目标意图词向量与所述第一词向量不匹配，则基于所述意图词权重对所述目标意图词向量进行描述处理，以得到所述对话文本的句向量特征。

9.如权利要求7所述的方法，其特征在于，在所述对所述目标意图词向量配置意图词权重前，还包括：

将所述需求词向量意图输入至所述AI中的权重解析模型中，以得到与所述目标意图词向量对应的所述意图词权重。

10.一种结合RPA和AI的文本特征生成装置，其特征在于，应用于支持自然语言处理NLP的智能对话系统，所述智能对话系统可供用户注册使用，所述装置包括：

获取模块，用于基于机器人流程自动化RPA获取对话文本；

第一确定模块，用于基于人工智能AI确定所述对话文本的第一词向量特征；

第二确定模块，用于确定所述用户的需求词向量意图；以及

第一处理模块，用于根据所述需求词向量意图处理所述第一词向量特征，以得到所述对话文本的第二词向量特征。

11.如权利要求10所述的装置，其特征在于，还包括：

第二处理模块，用于处理所述第二词向量特征，以得到所述对话文本的句向量特征，其中，所述智能对话系统，基于所述AI处理所述句向量特征，以得到所述对话文本的应答文本。

12.如权利要求11所述的装置，其特征在于，所述第一确定模块，包括：

第一确定子模块，用于基于所述AI确定所述对话文本的第一词向量；

第二确定子模块，用于基于平滑逆词频算法，确定与所述第一词向量对应的第一词频；

第三确定子模块，用于根据所述第一词频，确定所述第一词向量的第一词权重，其中，所述第一词向量和所述第一词权重被共同作为所述第一词向量特征。

13.如权利要求12所述的装置，其特征在于，还包括：

第三处理模块，用于在所述确定所述用户的需求词向量意图之后，基于所述AI处理所述需求词向量意图，以得到多个意图词向量；

第四处理模块，用于对所述多个意图词向量进行主成分分解，以得到所述多个意图词向量之间的共性语义信息；

第三确定模块，用于根据所述共性语义信息，从所述多个意图词向量之中确定出目标意图词向量。

14.如权利要求13所述的装置，其特征在于，所述第一处理模块，具体用于：

15.如权利要求14所述的装置，其特征在于，所述第二处理模块，具体用于：

16.如权利要求13所述的装置，其特征在于，所述第一处理模块，还用于：

对所述目标意图词向量配置意图词权重；

17.如权利要求16所述的装置，其特征在于，所述第二处理模块，还用于：

18.如权利要求16所述的装置，其特征在于，所述第一处理模块，还用于：

在所述对所述目标意图词向量配置意图词权重前，将所述需求词向量意图输入至所述AI中的权重解析模型中，以得到与所述目标意图词向量对应的所述意图词权重。

19.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-9中任一项所述的结合RPA和AI的文本特征生成方法。

20.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的结合RPA和AI的文本特征生成方法。