发明内容
本发明提供一种应用于AI聊天机器人的问答交互数据处理方法及服务器,为实现上述技术目的,本发明采用如下技术方案。
第一方面是一种应用于AI聊天机器人的问答交互数据处理方法,应用于问答交互大数据处理服务器,所述方法包括:
通过调试后的第二Transformer网络对第二对话语种的待分析咨询文本进行文本向量挖掘,得到所述待分析咨询文本的文本描述向量;其中,所述待分析咨询文本用于表征智能终端和聊天机器人之间的问答交互记录;
基于所述待分析咨询文本的文本描述向量对聊天机器人的问答策略进行升级优化。
在一种可能的示例中,第二Transformer网络的调试步骤包括:
调用第一对话语种的第一Transformer网络,对所述第一对话语种的第一咨询文本示例进行文本向量挖掘,得到所述第一咨询文本示例的第一文本描述示例向量;
调用第二对话语种的第二Transformer网络,对所述第一对话语种的第一咨询文本示例进行文本向量挖掘,得到所述第一咨询文本示例的第二文本描述示例向量;
依据所述第一文本描述示例向量对所述第二文本描述示例向量进行协同调试分析,得到所述第二Transformer网络的转用参考向量;
利用所述第二Transformer网络对所述第二对话语种的第二咨询文本示例进行文本向量挖掘,得到所述第二咨询文本示例的第三文本描述示例向量;
依据所述第三文本描述示例向量以及所述转用参考向量调试所述第二Transformer网络,其中,调试后的第二Transformer网络用于挖掘所述第二对话语种的待分析咨询文本的文本描述向量,所述待分析咨询文本的文本描述向量用于实现聊天机器人的升级优化。
在一种可能的示例中,所述调用第一对话语种的第一Transformer网络,对所述第一对话语种的第一咨询文本示例进行文本向量挖掘,得到所述第一咨询文本示例的第一文本描述示例向量,包括:调用第一对话语种的第一Transformer网络实施如下操作:对所述第一对话语种的第一咨询文本示例进行卷积操作,得到所述第一咨询文本示例的第一文本卷积示例向量;对所述第一咨询文本示例的第一文本卷积示例向量进行数值映射操作,得到所述第一咨询文本示例的第一文本描述示例向量;所述调用第二对话语种的第二Transformer网络,对所述第一对话语种的第一咨询文本示例进行文本向量挖掘,得到所述第一咨询文本示例的第二文本描述示例向量,包括:调用第二对话语种的第二Transformer网络实施如下操作:对所述第一对话语种的第一咨询文本示例进行卷积操作,得到所述第一咨询文本示例的第二文本卷积示例向量;对所述第一咨询文本示例的第二文本卷积示例向量进行数值映射操作,得到所述第一咨询文本示例的第二文本描述示例向量;
其中,所述第一Transformer网络包括第一卷积子网以及第一调整子网,所述第二Transformer网络包括第二卷积子网以及第二调整子网;所述对所述第一对话语种的第一咨询文本示例进行卷积操作,得到所述第一咨询文本示例的第一文本卷积示例向量,包括:利用所述第一卷积子网对所述第一对话语种的第一咨询文本示例进行初始卷积操作,得到所述第一咨询文本示例的第一初始词向量示例;利用所述第一调整子网对所述第一咨询文本示例的第一初始词向量示例进行特征调整处理,得到所述第一咨询文本示例的第一文本卷积示例向量;所述对所述第一对话语种的第一咨询文本示例进行卷积操作,得到所述第一咨询文本示例的第二文本卷积示例向量,包括:利用所述第二卷积子网对所述第一对话语种的第一咨询文本示例进行初始卷积操作,得到所述第一咨询文本示例的第二初始词向量示例;利用所述第二调整子网对所述第一咨询文本示例的第二初始词向量示例进行特征调整处理,得到所述第一咨询文本示例的第二文本卷积示例向量。
在一种可能的示例中,所述依据所述第一文本描述示例向量对所述第二文本描述示例向量进行协同调试分析,得到所述第二Transformer网络的转用参考向量,包括:
确定所述第一文本描述示例向量与所述第二文本描述示例向量之间的相关性数据;
确定所述第一文本描述示例向量的衡量指标;
将所述相关性数据与所述衡量指标之间的比较结果作为所述第二Transformer网络的转用参考向量。
在一种可能的示例中,所述依据所述第三文本描述示例向量以及所述转用参考向量调试所述第二Transformer网络,包括:
依据所述第三文本描述示例向量,生成所述第二Transformer网络的向量化调试代价;
依据所述转用参考向量,生成所述第二Transformer网络的转用调试代价;
对所述向量化调试代价以及所述转用调试代价进行聚合处理,得到所述第二Transformer网络的目标调试代价;
依据所述目标调试代价改进所述第二Transformer网络的网络参量,将所述第二Transformer网络的改进的网络参量作为调试后的第二Transformer网络的网络参量。
在一种可能的示例中,所述对所述向量化调试代价以及所述转用调试代价进行聚合处理,得到所述第二Transformer网络的目标调试代价之前,所述方法还包括:利用所述第二Transformer网络对所述第二对话语种的第二咨询文本示例进行卷积操作,得到所述第二咨询文本示例的第三文本卷积示例向量;确定所述第二咨询文本示例的关联咨询文本示例的第四文本卷积示例向量、以及所述第二咨询文本示例的非关联咨询文本示例的第五文本卷积示例向量;依据所述第三文本卷积示例向量、所述第四文本卷积示例向量以及所述第五文本卷积示例向量,生成所述第二Transformer网络的动态调试代价;
所述对所述向量化调试代价以及所述转用调试代价进行聚合处理,得到所述第二Transformer网络的目标调试代价,包括:对所述动态调试代价、所述向量化调试代价以及所述转用调试代价进行聚合处理,得到所述第二Transformer网络的目标调试代价。
在一种可能的示例中,所述依据所述第三文本描述示例向量,生成所述第二Transformer网络的向量化调试代价,包括:确定所述第二咨询文本示例的关联咨询文本示例的第四文本描述示例向量、以及所述第二咨询文本示例的非关联咨询文本示例的第五文本描述示例向量;依据所述第三文本描述示例向量、所述第四文本描述示例向量以及所述第五文本描述示例向量,生成所述第二Transformer网络的联动调试代价;依据所述第三文本描述示例向量以及所述第二咨询文本示例的文本描述示例向量注释,生成所述第二Transformer网络的特征映射调试代价;对所述联动调试代价以及所述特征映射调试代价进行聚合处理,得到所述第二Transformer网络的向量化调试代价;
其中,所述依据所述第三文本描述示例向量、所述第四文本描述示例向量以及所述第五文本描述示例向量,生成所述第二Transformer网络的联动调试代价,包括:将所述第三文本描述示例向量、与所述第四文本描述示例向量进行向量共性分析,得到所述第二咨询文本示例与所述关联咨询文本示例之间的第一共性评分;将所述第三文本描述示例向量、与所述第五文本描述示例向量进行向量共性分析,得到所述第二咨询文本示例与所述非关联咨询文本示例之间的第二共性评分;依据所述第一共性评分以及所述第二共性评分,生成所述第二Transformer网络的联动调试代价。
在一种可能的示例中,所述方法还包括:确定所述第一Transformer网络的热力要素分布标签,并确定所述第二Transformer网络的非热力要素分布标签;将所述非热力要素分布标签对应的网络参量改进为所述第二Transformer网络的热力要素分布标签对应的网络参量;
其中,所述第一Transformer网络包括多个第一向量要素分布标签,所述第二Transformer网络包括多个第二向量要素分布标签;
所述确定所述第一Transformer网络的热力要素分布标签,包括:对于所述多个第一向量要素分布标签的任一所述第一向量要素分布标签实施如下操作:对所述第一咨询文本示例的第一文本描述示例向量进行依据所述第一向量要素分布标签的记录处理,得到所述第一向量要素分布标签的热力程度;依据所述第一向量要素分布标签的热力程度,确定所述第一向量要素分布标签的热力置信系数;依据所述多个第一向量要素分布标签分别对应的热力置信系数,对所述多个第一向量要素分布标签进行挑选处理,得到所述第一Transformer网络的热力要素分布标签;
所述确定所述第二Transformer网络的非热力要素分布标签,包括:对于所述多个第二向量要素分布标签的任一所述第二向量要素分布标签实施如下操作:对所述第一咨询文本示例的第二文本描述示例向量进行依据所述第二向量要素分布标签的记录处理,得到所述第二向量要素分布标签的热力程度;依据所述第二向量要素分布标签的热力程度,确定所述第二向量要素分布标签的热力置信系数;依据所述多个第二向量要素分布标签分别对应的热力置信系数,对所述多个第二向量要素分布标签进行挑选处理,得到所述第二Transformer网络的非热力要素分布标签;
其中,所述对所述多个第一向量要素分布标签进行挑选处理,得到所述第一Transformer网络的热力要素分布标签,包括:对所述多个第一向量要素分布标签进行顺序整理,将顺序整理结果中正数的第二设定数目的所述第一向量要素分布标签作为所述第一Transformer网络的备选热力要素分布标签;对所述第一Transformer网络的备选热力要素分布标签进行抽样处理,得到所述第二Transformer网络的热力要素分布标签;所述对所述多个第二向量要素分布标签进行挑选处理,得到所述第二Transformer网络的非热力要素分布标签,包括:对所述多个第二向量要素分布标签进行顺序整理,将顺序整理结果中倒数的第二设定数目的所述第二向量要素分布标签作为所述第二Transformer网络的非热力要素分布标签;
其中,所述依据所述第一向量要素分布标签的热力程度,确定所述第一向量要素分布标签的热力置信系数,包括:依据所述第一向量要素分布标签的热力程度,确定所述第一向量要素分布标签的非热力程度;依据所述第一向量要素分布标签的热力程度以及所述第一向量要素分布标签的非热力程度对所述第一向量要素分布标签进行置信度识别,得到所述第一向量要素分布标签的热力置信系数。
第二方面是一种问答交互大数据处理服务器,包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述问答交互大数据处理服务器执行第一方面的方法。
第三方面是一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行第一方面的方法。
根据本发明的一个实施例,通过挖掘待分析咨询文本的文本描述向量,可以利用文本描述向量实现聊天机器人的问答策略的升级优化,比如对应答文本进行调整或者修改等,这样可以不断完善和优化聊天机器人,提高聊天机器人的智能化程度。如此,可以改善传统技术中聊天机器人的生硬的问答处理机制。
进一步地,调用第一对话语种的咨询文本示例以及第一Transformer网络进行协同调试分析,得到第二Transformer网络的转用参考向量,并依据转用参考向量以及第二对话语种的咨询文本示例调试第二Transformer网络,从而结合转用参考向量的提炼保障在咨询文本示例不充足的情况下的转用调试质量,以提升Transformer网络的调试时效性,减少不必要的时间开销和运算开销。
具体实施方式
以下,术语“第一”、“第二”和“第三”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”或“第三”等的特征可以明示或者隐含地包括一个或者更多个该特征。
图1示出了本发明实施例提供的应用于AI聊天机器人的问答交互数据处理方法的流程示意图,应用于AI聊天机器人的问答交互数据处理方法可以通过问答交互大数据处理服务器实现,问答交互大数据处理服务器可以包括存储器和处理器;所述存储器和所述处理器耦合;所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令;其中,当所述处理器执行所述计算机指令时,使得所述问答交互大数据处理服务器执行S101-S105。
在本发明实施例中,第一对话语种(语种1)的第一Transformer网络为调用第一对话语种的咨询文本示例(可以理解为咨询文本示例1)调试后的网络,可以理解为Transformer1,第二对话语种(语种2)的第二Transformer网络为拟进行调试的网络,可以理解为Transformer2,其中,第二对话语种可以是包含第一对话语种的非单一语种,第一Transformer网络的网络配置与第二Transformer网络的网络配置相同。比如,第一对话语种为中文,第二对话语种为中英文,则第一咨询文本示例为中文咨询文本示例,第二咨询文本示例为中英文咨询文本示例,则第一Transformer网络为处理中文咨询文本的网络,第二Transformer网络为处理中英文咨询文本的网络。
S101、调用第一对话语种的第一Transformer网络,对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第一文本描述示例向量。
比如,通过调试后的第一Transformer网络对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第一文本描述示例向量(可以理解为文本描述向量或数值向量)。本领域技术人员可以知晓,第一咨询文本示例并不表征一个咨询文本,而是表征一种咨询文本,即第一对话语种的多个咨询文本。
在一些可能的示例下,调用第一对话语种的第一Transformer网络,对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第一文本描述示例向量,包括:调用第一对话语种的第一Transformer网络实施如下操作:对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第一文本卷积示例向量;对第一咨询文本示例的第一文本卷积示例向量进行数值映射操作,得到第一咨询文本示例的第一文本描述示例向量。
比如,第一Transformer网络包括向量提炼子网以及数值映射子网,调用第一Transformer网络包括的向量提炼子网对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第一文本卷积示例向量(可以理解为文本卷积示例编码),调用第一Transformer网络包括的数值映射子网对第一咨询文本示例的第一文本卷积示例向量进行数值映射操作,得到第一咨询文本示例的第一文本描述示例向量(可以理解为文本描述向量)。
在一些可能的示例下,第一Transformer网络包括第一卷积子网以及第一调整子网;对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第一文本卷积示例向量,包括:调用第一卷积子网对第一对话语种的第一咨询文本示例进行初始卷积操作(基础特征提取),得到第一咨询文本示例的第一初始词向量示例;调用第一调整子网对第一咨询文本示例的第一初始词向量示例进行特征调整处理,得到第一咨询文本示例的第一文本卷积示例向量。其中,调整子网可以理解为嵌入层,因而特征调整处理可以理解为嵌入向量的转换操作。
比如,向量提炼子网包括第一卷积子网(可以理解为初始卷积子网)以及第一调整子网,调用第一卷积子网对第一对话语种的第一咨询文本示例(如咨询文本示例1)进行初始卷积操作,得到第一咨询文本示例的第一初始词向量示例(可以理解为初始/低阶向量),调用第一调整子网对第一咨询文本示例的第一初始词向量示例进行特征调整处理,得到第一咨询文本示例的第一文本卷积示例向量(可以理解为文本卷积示例编码),并通过数值映射子网对第一咨询文本示例的第一文本卷积示例向量进行数值映射操作,得到第一咨询文本示例的第一文本描述示例向量。
本领域技术人员可以知晓,本发明实施例中的第一文本描述示例向量还可以基于如下思路获得:调用第一卷积子网对第一对话语种的第一咨询文本示例进行初始卷积操作,得到第一咨询文本示例的第一初始词向量示例;调用第一Transformer网络包括的数值映射子网对第一咨询文本示例的第一初始词向量示例进行数值映射操作,得到第一咨询文本示例的第一文本描述示例向量。
S102、调用第二对话语种的第二Transformer网络,对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第二文本描述示例向量。
比如,通过拟调试的第二Transformer网络对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第二文本描述示例向量(可以理解为文本描述向量或数值向量)。本领域技术人员可以知晓,第一咨询文本示例并不表征一个咨询文本,而是表征一种咨询文本,即第一对话语种的多个咨询文本。
在一些可能的示例下,调用第二对话语种的第二Transformer网络,对第一对话语种的第一咨询文本示例进行文本向量挖掘,得到第一咨询文本示例的第二文本描述示例向量,包括:调用第二对话语种的第二Transformer网络实施如下操作:对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第二文本卷积示例向量;对第一咨询文本示例的第二文本卷积示例向量进行数值映射操作,得到第一咨询文本示例的第二文本描述示例向量。
比如,第二Transformer网络包括向量提炼子网以及数值映射子网,调用第二Transformer网络包括的向量提炼子网对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第二文本卷积示例向量(可以理解为一种文本卷积示例编码),调用第二Transformer网络包括的数值映射子网对第一咨询文本示例的第二文本卷积示例向量进行数值映射操作,得到第一咨询文本示例的第二文本描述示例向量(可以理解为一种文本描述向量)。
在一些可能的示例下,第二Transformer网络包括第二卷积子网以及第二调整子网;对第一对话语种的第一咨询文本示例进行卷积操作,得到第一咨询文本示例的第二文本卷积示例向量,包括:调用第二卷积子网对第一对话语种的第一咨询文本示例进行初始卷积操作,得到第一咨询文本示例的第二初始词向量示例;调用第二调整子网对第一咨询文本示例的第二初始词向量示例进行特征调整处理,得到第一咨询文本示例的第二文本卷积示例向量。
比如,第二Transformer网络包括的向量提炼子网包括第二卷积子网以及第二调整子网,调用第二卷积子网对第一对话语种的第一咨询文本示例(如咨询文本示例1)进行初始卷积操作,得到第一咨询文本示例的第二初始词向量示例,调用第二调整子网对第一咨询文本示例的第二初始词向量示例进行特征调整处理,得到第一咨询文本示例的第二文本卷积示例向量(可以理解为一种文本卷积示例编码),并通过数值映射子网对第一咨询文本示例的文本卷积示例编码进行数值映射操作,得到第一咨询文本示例的第二文本描述示例向量。
本领域技术人员可以知晓,本发明实施例中的第二文本描述示例向量还可以基于如下思路获得:调用第二卷积子网对第一对话语种的第一咨询文本示例进行初始卷积操作,得到第一咨询文本示例的第二初始词向量示例;调用第二Transformer网络包括的数值映射子网对第一咨询文本示例的第二初始词向量示例进行数值映射操作,得到第一咨询文本示例的第二文本描述示例向量。其中,数值映射操作可以理解为针对词向量的量化操作。
S103、依据第一文本描述示例向量对第二文本描述示例向量进行协同调试分析,得到第二Transformer网络的转用参考向量。
比如,为规避导致完成调试的第二Transformer网络的网络参量被误差示例所干扰,利用第一Transformer网络的词向量挖掘结果(可以理解为第一文本描述示例向量)优化第二Transformer网络的词向量挖掘结果(可以理解为第二文本描述示例向量),以及时生成一个相对不复杂的第二Transformer网络,利用质量更佳的第一Transformer网络的调试指导,来调试这个第二Transformer网络,从而保障第二Transformer网络的网络质量。进一步地,可以基于第一Transformer网络的词向量挖掘结果对第二Transformer网络的词向量挖掘结果进行蒸馏,得到第二Transformer网络(相对于第一Transformer网络更为轻量),基于第一Transformer网络的训练监督,可以实现对第二Transformer网络的调试。
在一些示例中,S103可以通过S1031-S1033实现。
S1031、确定第一文本描述示例向量与第二文本描述示例向量之间的相关性数据。
S1032、确定第一文本描述示例向量的衡量指标。
S1033、将相关性数据与衡量指标之间的比较结果作为第二Transformer网络的转用参考向量。
比如,鉴于第二对话语种的第二咨询文本示例不是很充足,纯调试第二咨询文本示例极易导致第二Transformer网络存在偏移,故利用第一咨询文本示例期望可以使得第二Transformer网络在吸收第二咨询文本示例的同时,对第一咨询文本示例的特征分析尽可能迎合第一Transformer网络的性能。
比如,确定第一文本描述示例向量与第二文本描述示例向量之间的相关性数据为第一文本描述示例向量与第二文本描述示例向量之间的互信息,确定第一文本描述示例向量的衡量指标为信息熵,第二Transformer网络的转用参考向量可以是相关性数据与衡量指标之间的差值。
S104、调用第二Transformer网络对第二对话语种的第二咨询文本示例进行文本向量挖掘,得到第二咨询文本示例的第三文本描述示例向量。
比如,通过拟调试的第二Transformer网络对第二对话语种的第二咨询文本示例进行文本向量挖掘,得到第二咨询文本示例的第三文本描述示例向量(可以理解为文本描述向量或数值向量)。本领域技术人员可以知晓,第二咨询文本示例并不表征一个咨询文本,而是表征一种咨询文本,即第二对话语种的多个咨询文本。
在一些可能的示例下,调用第二对话语种的第二Transformer网络,对第二对话语种的第二咨询文本示例进行文本向量挖掘,得到第二咨询文本示例的第三文本描述示例向量,包括:调用第二对话语种的第二Transformer网络实施如下操作:对第二对话语种的第二咨询文本示例进行卷积操作,得到第二咨询文本示例的第三文本卷积示例向量;对第二咨询文本示例的第三文本卷积示例向量进行数值映射操作,得到第二咨询文本示例的第三文本描述示例向量。
比如,第二Transformer网络包括向量提炼子网以及数值映射子网,调用第二Transformer网络包括的向量提炼子网对第二对话语种的第二咨询文本示例进行卷积操作,得到第二咨询文本示例的第三文本卷积示例向量(可以理解为一种文本卷积示例编码),调用第二Transformer网络包括的数值映射子网对第二咨询文本示例的第三文本卷积示例向量进行数值映射操作,得到第二咨询文本示例的第三文本描述示例向量(可以理解为一种文本描述向量)。
在一些可能的示例下,第二Transformer网络包括第二卷积子网以及第二调整子网;对第二对话语种的第二咨询文本示例进行卷积操作,得到第二咨询文本示例的第三文本卷积示例向量,包括:调用第二卷积子网对第二对话语种的第二咨询文本示例进行初始卷积操作,得到第二咨询文本示例的第三初始词向量示例;调用第二调整子网对第二咨询文本示例的第三初始词向量示例进行特征调整处理,得到第二咨询文本示例的第三文本卷积示例向量。
比如,第二Transformer网络包括的向量提炼子网包括第二卷积子网(可以理解为初始挖掘子网或初始卷积子网)以及第二调整子网(可以理解为调整子网),调用第二卷积子网对第二对话语种的第二咨询文本示例进行初始卷积操作,得到第二咨询文本示例的第三初始词向量示例,调用第二调整子网对第二咨询文本示例的第三初始词向量示例进行特征调整处理,得到第二咨询文本示例的第三文本卷积示例向量(可以理解为一种文本卷积示例编码)。
本领域技术人员可以知晓,本发明实施例中的第三文本描述示例向量还可以基于如下思路获得:调用第二卷积子网对第二对话语种的第二咨询文本示例进行初始卷积操作,得到第二咨询文本示例的第三初始词向量示例;调用第二Transformer网络包括的数值映射子网对第二咨询文本示例的第三初始词向量示例进行数值映射操作,得到第二咨询文本示例的第三文本描述示例向量。
S105、依据第三文本描述示例向量以及转用参考向量调试第二Transformer网络,其中,调试后的第二Transformer网络用于挖掘第二对话语种的待分析咨询文本的文本描述向量,待分析咨询文本的文本描述向量用于实现聊天机器人的升级优化。
比如,在网络学习时,除利用第一Transformer网络的词向量挖掘结果优化第二Transformer网络的词向量挖掘结果(转用参考向量)外,还能够提高第二Transformer网络的转用的性能。
在另一些实施例中,S105可以通过S1051-S1053实现。
S1051、依据第三文本描述示例向量,生成第二Transformer网络的向量化调试代价;依据转用参考向量,生成第二Transformer网络的转用调试代价。
S1052、对向量化调试代价以及转用调试代价进行聚合处理,得到第二Transformer网络的目标调试代价。
S1053、依据目标调试代价改进第二Transformer网络的网络参量,将第二Transformer网络的改进的网络参量作为调试后的第二Transformer网络的网络参量。
比如,将转用参考向量作为第二Transformer网络的转用调试代价(蒸馏代价),将向量化调试代价(特征代价)以及转用调试代价之和作为第二Transformer网络的目标调试代价(可以理解为全局损失函数)。依据第三文本描述示例向量以及转用参考向量,确定第二Transformer网络的目标调试代价的值后,可以判断目标调试代价的值是否超出设定值,当目标调试代价的值超出设定值时,依据目标调试代价确定第二Transformer网络的训练偏移,将训练偏移在第二Transformer网络中进行反馈,并基于此改进各个层的网络网络参量。该思路可以基于梯度处理进行反向传播和迭代调试,从而实现第二Transformer网络的收敛。
在一些可能的示例下,依据第三文本描述示例向量,生成第二Transformer网络的向量化调试代价,包括:确定第二咨询文本示例的关联咨询文本示例的第四文本描述示例向量、以及第二咨询文本示例的非关联咨询文本示例的第五文本描述示例向量;依据第三文本描述示例向量、第四文本描述示例向量以及第五文本描述示例向量,生成第二Transformer网络的联动调试代价;依据第三文本描述示例向量以及第二咨询文本示例的文本描述示例向量注释,生成第二Transformer网络的特征映射调试代价;对联动调试代价以及特征映射调试代价进行聚合处理,得到第二Transformer网络的向量化调试代价。其中,聚合处理例如可以是加权求和。
比如,生成联动调试代价的过程如下所示:将第三文本描述示例向量、与第四文本描述示例向量进行向量共性分析,得到第二咨询文本示例与关联咨询文本示例之间的第一共性评分;将第三文本描述示例向量、与第五文本描述示例向量进行向量共性分析,得到第二咨询文本示例与非关联咨询文本示例之间的第二共性评分;依据第一共性评分以及第二共性评分,生成第二Transformer网络的联动调试代价。
其中,联动调试代价可以是三元组调试代价,向量共性分析用于确定向量之间的相似度,也即共性评分。
在一些可能的示例下,对向量化调试代价以及转用调试代价进行聚合处理,得到第二Transformer网络的目标调试代价之前,调用第二Transformer网络对第二对话语种的第二咨询文本示例进行卷积操作,得到第二咨询文本示例的第三文本卷积示例向量;确定第二咨询文本示例的关联咨询文本示例的第四文本卷积示例向量、以及第二咨询文本示例的非关联咨询文本示例的第五文本卷积示例向量;依据第三文本卷积示例向量、第四文本卷积示例向量以及第五文本卷积示例向量,生成第二Transformer网络的动态调试代价;对向量化调试代价以及转用调试代价进行聚合处理,得到第二Transformer网络的目标调试代价,包括:对动态调试代价、向量化调试代价以及转用调试代价进行聚合处理,得到第二Transformer网络的目标调试代价。
这样,结合动态调试代价、向量化调试代价以及转用调试代价进行联合调试,能够提高第二Transformer网络的调试效果。
其中,生成动态调试代价的过程如下所示:将第三文本卷积示例向量、与第四文本卷积示例向量进行向量共性分析,得到第二咨询文本示例与第二咨询文本示例的关联咨询文本示例之间的第三共性评分;第三文本卷积示例向量、与第五文本卷积示例向量进行向量共性分析,得到第二咨询文本示例与第二咨询文本示例的不关联咨询文本示例之间的第四共性评分;依据第三共性评分以及第四共性评分,生成第二Transformer网络的动态调试代价。
在本发明实施例中,关联咨询文本示例可以理解为相似的咨询文本示例,非关联咨询文本示例可以理解为不相似的咨询文本示例。
在一些可能的示例下,确定第一Transformer网络的热力要素分布标签,并确定第二Transformer网络的非热力要素分布标签;将非热力要素分布标签对应的网络参量改进为第二Transformer网络的热力要素分布标签对应的网络参量。
本领域技术人员可以知晓,热力要素分布标签表示第一Transformer网络中全部向量要素分布标签中活跃度较高的向量要素分布标签,非热力要素分布标签表示第二Transformer网络中全部向量要素分布标签中活跃度较低的向量要素分布标签。
比如,第二Transformer网络鉴于自身对应的第二咨询文本示例不是很充足,不能保证全部向量要素分布标签都具有较高活跃度。因此,本发明实施例采用特征辅助思路,以保证第二Transformer网络全部向量要素分布标签都具有较高活跃度,从而提高第二Transformer网络的调试效果。其中,特征辅助思路包括但不限于权重辅助处理。
在一些可能的示例下,第一Transformer网络包括多个第一向量要素分布标签,第二Transformer网络包括多个第二向量要素分布标签;确定第一Transformer网络的热力要素分布标签,包括:针对多个第一向量要素分布标签的任一第一向量要素分布标签实施如下操作:对第一咨询文本示例的第一文本描述示例向量进行依据第一向量要素分布标签的记录处理,得到第一向量要素分布标签的热力程度;依据第一向量要素分布标签的热力程度,确定第一向量要素分布标签的热力置信系数;依据多个第一向量要素分布标签分别对应的热力置信系数,对多个第一向量要素分布标签进行挑选处理,得到第一Transformer网络的热力要素分布标签;确定第二Transformer网络的非热力要素分布标签,包括:针对多个第二向量要素分布标签的任一第二向量要素分布标签实施如下操作:对第一咨询文本示例的第二文本描述示例向量进行依据第二向量要素分布标签的记录处理,得到第二向量要素分布标签的热力程度;依据第二向量要素分布标签的热力程度,确定第二向量要素分布标签的热力置信系数;依据多个第二向量要素分布标签分别对应的热力置信系数,对多个第二向量要素分布标签进行挑选处理,得到第二Transformer网络的非热力要素分布标签。
进一步地,对多个第一向量要素分布标签进行挑选处理,得到第一Transformer网络的热力要素分布标签,包括:对多个第一向量要素分布标签进行顺序整理,将顺序整理结果中正数的第二设定数目的第一向量要素分布标签作为第一Transformer网络的备选热力要素分布标签,对第一Transformer网络的备选热力要素分布标签进行抽样处理,得到第二Transformer网络的热力要素分布标签。对多个第一向量要素分布标签进行挑选处理,得到第一Transformer网络的热力要素分布标签,包括:对多个第一向量要素分布标签进行顺序整理,将顺序整理结果中正数的第二设定数目的第一向量要素分布标签作为第二Transformer网络的热力要素分布标签。对多个第二向量要素分布标签进行挑选处理,得到第二Transformer网络的非热力要素分布标签,包括:对多个第二向量要素分布标签进行顺序整理,将顺序整理结果中倒数的第二设定数目的第二向量要素分布标签作为第二Transformer网络的非热力要素分布标签。
比如,依据第一向量要素分布标签的热力程度,确定第一向量要素分布标签的热力置信系数,包括:依据第一向量要素分布标签的热力程度,确定第一向量要素分布标签的非热力程度;依据第一向量要素分布标签的热力程度以及第一向量要素分布标签的非热力程度对第一向量要素分布标签进行置信度识别,得到第一向量要素分布标签的热力置信系数。
在本发明实施例中,热力程度可以是活跃占比,也即处于活跃状态的第一向量要素分布标签的比例。热力置信系数的取值范围可以是0~1。此外,向量要素分布标签可以理解为向量中对应向量成员/要素的位置信息,还可以理解为特征位。
在一些可能的示例下,依据第三文本描述示例向量以及转用参考向量调试第二Transformer网络后,得到调试后的第二Transformer网络,依据调试后的第二Transformer网络提取第二对话语种的待分析咨询文本的文本描述向量,并依据待分析咨询文本的文本描述向量用于实现聊天机器人的升级优化。
基于上述示例,在一些可独立的设计思路下,所述方法还包括:通过调试后的第二Transformer网络对第二对话语种的待分析咨询文本进行文本向量挖掘,得到所述待分析咨询文本的文本描述向量;其中,所述待分析咨询文本用于表征智能终端和聊天机器人之间的问答交互记录;基于所述待分析咨询文本的文本描述向量对聊天机器人的问答策略进行升级优化。
在本发明实施例中,用户可以通过智能终端与聊天机器人进行问答交互,比如通过中英文混合语言进行问答处理,示例性的,用户可以通过智能终端向聊天机器人发问:“请问如何理解XXX这句话”,其中,“XXX”为英文,基于此,聊天机器人可以输出对应的应答文本,由此可以获得对应的待分析咨询文本包括“请问如何理解XXX这句话”+应答文本。
进一步地,通过挖掘待分析咨询文本的文本描述向量,可以利用文本描述向量实现聊天机器人的问答策略的升级优化,比如对应答文本进行调整或者修改等,这样可以不断完善和优化聊天机器人,提高聊天机器人的智能化程度。如此,可以改善传统技术中聊天机器人的生硬的问答处理机制。
基于上述示例,在一些可独立的设计思路下,所述基于所述待分析咨询文本的文本描述向量对聊天机器人的问答策略进行升级优化,包括:结合所述待分析咨询文本的文本描述向量确定所述聊天机器人的应答质量反馈;利用所述应答质量反馈对所述聊天机器人的应答检索逻辑和/或应答输出排版格式进行更新。
在本发明实施例中,可以基于所述待分析咨询文本的文本描述向量获取智能终端的应答质量反馈,应答质量反馈可以通过文本或者聊天表情的形式进行表示。进一步地,可以结合应答质量反馈确定智能终端的问答需求偏好,从而基于该问答需求偏好针对性地更新聊天机器人的应答检索逻辑和/或应答输出排版格式。比如扩展针对提问信息的检索数据库,以及以金字塔形式进行应答文本的输出。
基于上述示例,在一些可独立的设计思路下,利用所述应答质量反馈对所述聊天机器人的应答检索逻辑和/或应答输出排版格式进行更新,包括:获取所述应答质量反馈对应的文本反馈信息集,其中,所述文本反馈信息集包括存在关联的X组文本反馈信息,所述X为大于或等于1的整数;根据所述文本反馈信息集获取表情反馈信息集,其中,所述表情反馈信息集包括存在关联的X组表情反馈信息;基于所述文本反馈信息集,通过问答需求偏好分析网络所包括的第一反馈知识抽取子网获取文本反馈知识集,其中,所述文本反馈知识集包括X个文本反馈知识;基于所述表情反馈信息集,通过所述问答需求偏好分析网络所包括的第二反馈知识抽取子网获取表情反馈知识集,其中,所述表情反馈知识集包括X个表情反馈知识;基于所述文本反馈知识集以及所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的偏好归纳子网获取所述文本反馈信息所对应的偏好归类指数;根据所述偏好归类指数确定所述文本反馈信息集的问答需求偏好;通过所述问答需求偏好对所述聊天机器人的应答检索逻辑和/或应答输出排版格式进行更新。
如此设计,鉴于文本形式的反馈信息占比较大,通过对文本形式的反馈信息和表情形式的反馈信息进行综合分析,可以准确得到文本反馈信息所对应的偏好归类指数,这样能够基于偏好归类指数进行标签匹配以得到问答需求偏好,以便通过问答需求偏好进行针对性的应答检索逻辑和/或应答输出排版格式更新升级。
基于上述示例,在一些可独立的设计思路下,所述基于所述文本反馈知识集以及所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的偏好归纳子网获取所述文本反馈信息集所对应的偏好归类指数,包括:基于所述文本反馈知识集,通过所述问答需求偏好分析网络所包括的第一BERT模型获取X个第一知识字段,其中,每个第一知识字段对应于一个文本反馈知识;基于所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的第二BERT模型获取X个第二知识字段,其中,每个第二知识字段对应于一个表情反馈知识;对所述X个第一知识字段以及所述X个第二知识字段进行知识连接,得到X个目标知识字段,其中,每个目标知识字段包括一个第一知识字段以及一个第二知识字段;基于所述X个目标知识字段,通过所述问答需求偏好分析网络所包括的所述偏好归纳子网获取所述文本反馈信息集所对应的偏好归类指数。
基于上述示例,在一些可独立的设计思路下,所述基于所述文本反馈知识集,通过所述问答需求偏好分析网络所包括的第一BERT模型获取X个第一知识字段,包括:针对所述文本反馈知识集中的每组文本反馈知识,通过所述第一BERT模型所包括的局部编码层获取第一局部编码反馈知识,其中,所述第一BERT模型属于所述问答需求偏好分析网络;针对所述文本反馈知识集中的每组文本反馈知识,通过所述第一BERT模型所包括的全局编码层获取第一全局编码反馈知识;针对所述文本反馈知识集中的每组文本反馈知识,基于所述第一局部编码反馈知识以及所述第一全局编码反馈知识,通过所述第一BERT模型所包括的滑动平均层获取第一聚合反馈知识;针对所述文本反馈知识集中的每组文本反馈知识,基于所述第一聚合反馈知识以及所述文本反馈知识,通过所述第一BERT模型所包括的第一全局编码层获取第一知识字段。
基于上述示例,在一些可独立的设计思路下,所述基于所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的第二BERT模型获取X个第二知识字段,包括:针对所述表情反馈知识集中的每组表情反馈知识,通过所述第二BERT模型所包括的局部编码层获取第二局部编码反馈知识,其中,所述第二BERT模型属于所述问答需求偏好分析网络;针对所述表情反馈知识集中的每组表情反馈知识,通过所述第二BERT模型所包括的全局编码层获取第二全局编码反馈知识;针对所述表情反馈知识集中的每组表情反馈知识,基于所述第二局部编码反馈知识以及所述第二全局编码反馈知识,通过所述第二BERT模型所包括的滑动平均层获取第二聚合反馈知识;针对所述表情反馈知识集中的每组表情反馈知识,基于所述第二聚合反馈知识以及所述表情反馈知识,通过所述第二BERT模型所包括的第二全局编码层获取第二知识字段。
基于上述示例,在一些可独立的设计思路下,所述X为大于1的整数;所述基于所述X个目标知识字段,通过所述问答需求偏好分析网络所包括的所述偏好归纳子网获取所述文本反馈信息集所对应的偏好归类指数,包括:基于所述X个目标知识字段,通过所述问答需求偏好分析网络所包括的长短期记忆模型获取聚合知识字段,其中,所述聚合知识字段为根据所述X个目标知识字段以及X个顺序优先级确定的,每个目标知识字段对应于一个顺序优先级;基于所述聚合知识字段,通过所述问答需求偏好分析网络所包括的所述偏好归纳子网获取所述文本反馈信息集所对应的偏好归类指数。
基于上述示例,在一些可独立的设计思路下,所述基于所述X个目标知识字段,通过所述问答需求偏好分析网络所包括的长短期记忆模型获取聚合知识字段,包括:基于所述X个目标知识字段,通过所述长短期记忆模型所包括的第一模型单元获取X个第一局部知识字段,其中,所述长短期记忆模型属于所述问答需求偏好分析网络;基于所述X个第一局部知识字段,通过所述长短期记忆模型所包括的第二模型单元获取X个第二局部知识字段;根据所述X个第二局部知识字段确定X个顺序优先级,其中,每个顺序优先级对应于一个目标知识字段;根据所述X个目标知识字段以及X个顺序优先级,确定所述聚合知识字段。
基于上述示例,在一些可独立的设计思路下,所述X为大于1的整数;所述基于所述文本反馈知识集以及所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的偏好归纳子网获取所述文本反馈信息所对应的偏好归类指数,包括:基于所述文本反馈知识集,通过所述问答需求偏好分析网络所包括的第一全局编码层获取X个第一知识字段,其中,每个第一知识字段对应于一个文本反馈知识;基于所述表情反馈知识集,通过所述问答需求偏好分析网络所包括的第二全局编码层获取X个第二知识字段,其中,每个第二知识字段对应于一个表情反馈知识;对所述X个第一知识字段以及所述X个第二知识字段进行知识连接,得到X个目标知识字段,其中,每个目标知识字段包括一个第一知识字段以及一个第二知识字段;基于所述X个目标知识字段,通过所述问答需求偏好分析网络所包括的长短期记忆模型获取聚合知识字段,其中,所述聚合知识字段为根据所述X个目标知识字段以及X个顺序优先级确定的,每个目标知识字段对应于一个顺序优先级;基于所述聚合知识字段,通过所述问答需求偏好分析网络所包括的所述偏好归纳子网获取所述文本反馈信息集所对应的偏好归类指数。
基于上述的相关设计思路,本发明实施例还提供了一种应用于AI聊天机器人的问答交互数据处理方法,包括:通过调试后的第二Transformer网络对第二对话语种的待分析咨询文本进行文本向量挖掘,得到所述待分析咨询文本的文本描述向量;其中,所述待分析咨询文本用于表征智能终端和聊天机器人之间的问答交互记录;基于所述待分析咨询文本的文本描述向量对聊天机器人的问答策略进行升级优化。
其中,第二Transformer网络的调试步骤可以参考上述S101-S105的内容。
可见,本发明实施例提供的应用于AI聊天机器人的问答交互数据处理方法的有益效果至少包括:调用第一对话语种的咨询文本示例以及第一Transformer网络进行协同调试分析,得到第二Transformer网络的转用参考向量,并依据转用参考向量以及第二对话语种的咨询文本示例调试第二Transformer网络,从而结合转用参考向量的提炼保障在咨询文本示例不充足的情况下的转用调试质量,以提升Transformer网络的调试时效性,减少不必要的时间开销和运算开销。
以上所述,仅为本发明的具体实施方式。熟悉本技术领域的技术人员根据本发明提供的具体实施方式,可想到变化或替换,都应涵盖在本发明的保护范围之内。