发明内容
为了至少克服现有技术中的上述不足,本申请实施例的目的在于提供一种基于人工智能决策的服务优化方法及数字化在线页面系统。
第一方面,本申请实施例实施例提供一种基于人工智能决策的服务优化方法,应用于数字化在线页面系统,所述方法包括:
对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容;
对各个所述对话主题内容中的对话关键词进行统计分析,基于统计分析获得的各个对话关键词的关联词信息以及出现频率信息确定各个对话关键词所对应的关键词权重信息,并基于所述各个对话关键词所对应的关键词权重信息确定目标对话关键词;
基于所述目标对话关键词,对所述目标用户所对应的数字化在线页面中的关联服务功能项进行内容优化。
在第一方面的一种可能的实施方式中,所述对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容的步骤,包括:
获取所述目标用户在数字化在线页面中产生的应用于对话主题内容分析任务的目标对话事件序列,所述目标对话事件序列包括若干个虚拟数字人对话事件;
通过第一对话事件分析网络对所述目标对话事件序列中的每个虚拟数字人对话事件进行对话标签分析,生成所述每个虚拟数字人对话事件的对话标签分析数据以及所述每个虚拟数字人对话事件的对话语义向量,所述对话标签分析数据表征虚拟数字人对话事件所对应的对话触发标签;
基于所述每个虚拟数字人对话事件的对话标签分析数据,从所述目标对话事件序列中获取多方参与对话事件以及K个独立对话事件,所述多方参与对话事件与所述独立对话事件均属于所述虚拟数字人对话事件,所述K为不小于1的整数;
基于所述多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量,确定K个第一对话代价值以及K个第二对话代价值,所述K个第一对话代价值包括所述每个独立对话事件与所述多方参与对话事件之间的第一对话代价值,所述K个第二对话代价值包括所述每个独立对话事件所对应的第二对话代价值,所述对话代价值用于表示对应的对话事件之间的候选代价值;
基于所述K个第一对话代价值以及所述K个第二对话代价值,确定所述每个独立对话事件所对应的全局对话代价值,所述全局对话代价值用于表征独立对话事件的对话注意力值;
从所述每个独立对话事件所对应的全局对话代价值中获取最大全局对话代价值,并将所述最大全局对话代价值所对应的独立对话事件作为目标独立对话事件;
通过目标对话主题挖掘网络对所述目标独立对话事件进行对话主题挖掘,生成所述目标独立对话事件的对话主题挖掘结果,所述对话主题挖掘结果用于确定所述目标独立对话事件中的对话主题内容。
在第一方面的一种可能的实施方式中,所述获取应用于对话主题内容分析任务的目标对话事件序列,包括:
获取应用于对话主题内容分析任务的初始对话事件序列,所述初始对话事件序列包括若干个虚拟数字人对话事件;
通过第二对话事件分析网络对所述初始对话事件序列中的每个虚拟数字人对话事件进行分析,生成所述每个虚拟数字人对话事件的异常对话内容分析数据,所述异常对话内容分析数据表征虚拟数字人对话事件的异常对话内容分布状态;
基于所述每个虚拟数字人对话事件的异常对话内容分析数据,将所述初始对话事件序列中异常对话内容分析数据属于无异常对话内容分布的虚拟数字人对话事件作为所述目标对话事件序列中的虚拟数字人对话事件。
在第一方面的一种可能的实施方式中,所述方法还包括:
获取第一待学习对话事件序列,所述第一待学习对话事件序列包括一个或多个第一待学习对话事件,每个第一待学习对话事件对应于异常对话内容标注数据;
针对所述第一待学习对话事件序列中的每个第一待学习对话事件,依据所述第二对话事件分析网络获取所述每个第一待学习对话事件所对应的异常对话内容预测数据;
依据所述每个第一待学习对话事件所对应的异常对话内容预测数据以及所述异常对话内容标注数据,确定第一网络学习效果值;
基于所述第一网络学习效果值对所述第二对话事件分析网络进行网络权重信息迭代优化。
在第一方面的一种可能的实施方式中,所述通过第一对话事件分析网络对所述目标对话事件序列中的每个虚拟数字人对话事件进行对话标签分析,生成所述每个虚拟数字人对话事件的对话标签分析数据以及所述每个虚拟数字人对话事件的对话语义向量,包括:
针对所述目标对话事件序列中的所述每个虚拟数字人对话事件,依据所述第一对话事件分析网络所包括的语义编码单元获取所述每个虚拟数字人对话事件的对话语义向量;
针对所述每个虚拟数字人对话事件的对话语义向量,依据所述第一对话事件分析网络所包括的降维抽象单元获取所述每个虚拟数字人对话事件的降维抽象向量;
针对所述每个虚拟数字人对话事件的降维抽象向量,依据所述第一对话事件分析网络所包括的全连接单元获取所述每个虚拟数字人对话事件的对话标签热力图;
基于所述每个虚拟数字人对话事件的对话标签热力图,确定所述每个虚拟数字人对话事件的对话标签分析数据。
在第一方面的一种可能的实施方式中,所述方法还包括:
获取第二待学习对话事件序列,所述第二待学习对话事件序列包括一个或多个第二待学习对话事件,每个第二待学习对话事件对应于对话标签标注数据;
针对所述第二待学习对话事件序列中的每个第二待学习对话事件,依据所述第一对话事件分析网络获取所述每个第二待学习对话事件所对应的对话标签热力图;
依据所述每个第二待学习对话事件所对应的对话标签热力图以及所述对话标签标注数据,确定第二网络学习效果值;
基于所述第二网络学习效果值对所述第一对话事件分析网络进行网络权重信息迭代优化。
在第一方面的一种可能的实施方式中,所述基于所述多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量,确定K个第一对话代价值以及K个第二对话代价值,包括:
对所述多方参与对话事件的对话语义向量以及所述每个独立对话事件的对话语义向量进行类间代价计算,生成所述每个独立对话事件与所述多方参与对话事件之间的第一对话代价值;
对所述每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成所述每个独立对话事件所对应的第二对话代价值,所述其它各个独立对话事件为所述K个独立对话事件中除了所述独立对话事件之外的余下独立对话事件;
所述基于所述K个第一对话代价值以及所述K个第二对话代价值,确定所述每个独立对话事件所对应的全局对话代价值,包括:
针对所述每个独立对话事件,对独立对话事件所对应的第一对话代价值以及第二对话代价值进行融合,生成所述独立对话事件所对应的全局对话代价值;
所述对所述多方参与对话事件的对话语义向量以及所述每个独立对话事件的对话语义向量进行类间代价计算,生成所述每个独立对话事件与所述多方参与对话事件之间的第一对话代价值,包括:
针对所述每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与所述多方参与对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成所述独立对话事件与所述多方参与对话事件之间的H个分句语义向量距离,所述H为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述多方参与对话事件之间的H个分句语义向量距离进行对话代价计算,生成所述独立对话事件与所述多方参与对话事件之间的第一对话代价值;
所述对所述每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成所述每个独立对话事件所对应的第二对话代价值,包括:
针对所述每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与所述其它各个独立对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成所述每个独立对话事件与所述其它各个独立对话事件之间的H个分句语义向量距离,所述H为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的H个分句语义向量距离进行对话代价计算,生成所述独立对话事件与所述其它各个独立对话事件之间的第一候选代价值;
针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的第一候选代价值进行平均代价值计算,生成所述独立对话事件所对应的第二对话代价值;
或者,所述对所述多方参与对话事件的对话语义向量以及所述每个独立对话事件的对话语义向量进行类间代价计算,生成所述每个独立对话事件与所述多方参与对话事件之间的第一对话代价值,包括:
对所述多方参与对话事件的对话语义向量以及所述每个独立对话事件的对话语义向量进行代价值计算,生成所述每个独立对话事件与所述多方参与对话事件之间的对话语义向量距离;
对所述多方参与对话事件的对话倾向分布图特征以及所述每个独立对话事件的对话倾向分布图特征进行代价值计算,生成所述每个独立对话事件与所述多方参与对话事件之间的对话倾向分布图代价值;
针对所述每个独立对话事件,对独立对话事件与所述多方参与对话事件之间的对话语义向量距离,以及所述独立对话事件与所述多方参与对话事件之间的对话倾向分布图代价值进行融合,生成所述独立对话事件与所述多方参与对话事件之间的第一对话代价值;
所述对所述每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成所述每个独立对话事件所对应的第二对话代价值,包括:
基于所述每个独立对话事件的对话语义向量,确定所述每个独立对话事件所对应的平均对话语义向量距离;
基于所述每个独立对话事件的对话倾向分布图特征,确定所述每个独立对话事件所对应的平均对话倾向分布图特征距离;
针对所述每个独立对话事件,对独立对话事件所对应的平均对话语义向量距离,以及所述独立对话事件所对应的平均对话倾向分布图特征距离进行融合,生成所述独立对话事件所对应的第二对话代价值。
譬如,在第一方面的一种可能的实施方式中,所述对所述多方参与对话事件的对话语义向量以及所述每个独立对话事件的对话语义向量进行代价值计算,生成所述每个独立对话事件与所述多方参与对话事件之间的对话语义向量距离,包括:
针对所述每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与所述多方参与对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成所述独立对话事件与所述多方参与对话事件之间的H个分句语义向量距离,所述H为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述多方参与对话事件之间的H个分句语义向量距离进行对话代价计算,生成所述独立对话事件与所述多方参与对话事件之间的对话语义向量距离;
所述对所述多方参与对话事件的对话倾向分布图特征以及所述每个独立对话事件的对话倾向分布图特征进行代价值计算,生成所述每个独立对话事件与所述多方参与对话事件之间的对话倾向分布图代价值,包括:
针对所述每个独立对话事件,将独立对话事件对应对话倾向分布图特征中的每个分句语义向量,与所述多方参与对话事件对应对话倾向分布图特征中相对应对话节点的分句语义向量进行代价值计算,生成所述独立对话事件与所述多方参与对话事件之间的F个分句语义向量距离,所述F为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述多方参与对话事件之间的F个分句语义向量距离进行代价值计算,生成所述独立对话事件与所述多方参与对话事件之间的对话倾向分布图代价值。
譬如,在第一方面的一种可能的实施方式中,所述基于所述每个独立对话事件的对话语义向量,确定所述每个独立对话事件所对应的平均对话语义向量距离,包括:
针对所述每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与其它各个独立对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成所述每个独立对话事件与所述其它各个独立对话事件之间的H个分句语义向量距离,所述H为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的H个分句语义向量距离进行对话代价计算,生成所述独立对话事件与所述其它各个独立对话事件之间的第一候选代价值; 针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的第一候选代价值进行平均代价值计算,生成所述独立对话事件所对应的平均对话语义向量距离;
所述基于所述每个独立对话事件的对话倾向分布图特征,确定所述每个独立对话事件所对应的平均对话倾向分布图特征距离,包括:
针对所述每个独立对话事件,将独立对话事件对应对话倾向分布图特征中的每个分句语义向量,与其它各个独立对话事件对应对话倾向分布图特征中相对应对话节点的分句语义向量进行代价值计算,生成所述每个独立对话事件与所述其它各个独立对话事件之间的F个分句语义向量距离,所述F为不小于1的整数;
针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的F个分句语义向量距离进行代价值计算,生成所述独立对话事件与所述其它各个独立对话事件之间的第二候选代价值;
针对所述每个独立对话事件,对所述独立对话事件与所述其它各个独立对话事件之间的第二候选代价值进行平均代价值计算,生成所述独立对话事件所对应的平均对话倾向分布图特征距离。
譬如,在第一方面的一种可能的实施方式中,所述方法还包括:
对所述多方参与对话事件进行对话倾向标注,生成第一对话倾向标注对话事件,所述第一对话倾向标注对话事件中的每个对话内容片段对应于一个对话倾向值;
依据所述多方参与对话事件所对应的第一对话倾向标注对话事件,分别统计各个预设对话倾向值所对应的对话内容片段数;
基于所述第一对话倾向标注对话事件针对所述各个预设对话倾向值的对话内容片段数,构建所述多方参与对话事件的对话倾向分布图特征;
所述方法还包括:
针对所述每个独立对话事件,对独立对话事件进行对话倾向标注,生成第二对话倾向标注对话事件,所述第二对话倾向标注对话事件中的每个对话内容片段对应于一个对话倾向值;
针对所述每个独立对话事件,依据所述第二对话倾向标注对话事件,分别统计各个预设对话倾向值所对应的对话内容片段数;
针对所述每个独立对话事件,基于所述第二对话倾向标注对话事件针对所述各个预设对话倾向值的对话内容片段数,构建所述独立对话事件的对话倾向分布图特征。
第二方面,本申请实施例实施例还提供一种基于人工智能决策的服务优化系统,所述基于人工智能决策的服务优化系统包括数字化在线页面系统以及与所述数字化在线页面系统通信连接的多个AI运算服务在线行为对象;
所述数字化在线页面系统,用于:
对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容;
对各个所述对话主题内容中的对话关键词进行统计分析,基于统计分析获得的各个对话关键词的关联词信息以及出现频率信息确定各个对话关键词所对应的关键词权重信息,并基于所述各个对话关键词所对应的关键词权重信息确定目标对话关键词;
基于所述目标对话关键词,对所述目标用户所对应的数字化在线页面中的关联服务功能项进行内容优化。
第三方面,本申请实施例还提供一种数字化在线页面系统,所述数字化在线页面系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序结合该处理器加载并执行以实现以上第一方面的基于人工智能决策的服务优化方法。
第四方面,本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于被处理器执行时,以实现以上第一方面的基于人工智能决策的服务优化方法。
第五方面,本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,以实现以上第一方面的基于人工智能决策的服务优化方法。
本申请实施例至少具有以下有益效果:
通过对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容,对各个所述对话主题内容中的对话关键词进行统计分析,基于统计分析获得的各个对话关键词的关联词信息以及出现频率信息确定各个对话关键词所对应的关键词权重信息,并基于所述各个对话关键词所对应的关键词权重信息确定目标对话关键词,基于所述目标对话关键词,对所述目标用户所对应的数字化在线页面中的关联服务功能项进行内容优化,从而可以针对对话主题内容中的对话关键词进行权重评估后进行进一步筛选后,对数字化在线页面中的关联服务功能项进行内容优化,相较于现有方案而言可以提高内容优化的精准性和可靠性。
并且,获取应用于对话主题内容分析任务的目标对话事件序列,可通过第一对话事件分析网络对每个虚拟数字人对话事件进行对话标签分析,生成每个虚拟数字人对话事件的对话标签分析数据以及每个虚拟数字人对话事件的对话语义向量。然后,从目标对话事件序列中获取多方参与对话事件以及K个独立对话事件,再确定K个第一对话代价值以及K个第二对话代价值。由此,可基于K个第一对话代价值以及K个第二对话代价值,确定每个独立对话事件所对应的全局对话代价值。再从每个独立对话事件所对应的全局对话代价值中获取最大全局对话代价值,并将最大全局对话代价值所对应的独立对话事件作为目标独立对话事件。最后,通过目标对话主题挖掘网络对目标独立对话事件进行对话主题挖掘,生成目标独立对话事件的对话主题挖掘结果。通过上述方式,引入了独立对话事件的第二对话代价值以及独立对话事件与多方参与对话事件第一对话代价值,共同衡量独立对话事件的对话注意力值,由此,可选择出对话注意力值最大的独立对话事件作为对话集中程度最大节点的独立对话事件,并将该独立对话事件作为预测对话主题内容的目标独立对话事件。基于以上方案,本申请实施例充分考虑到不同用户之间对话集中程度的区别,有利于提高对话主题内容提取的可靠性。
实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的基础上相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的关键搜索表征数据,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的基础上可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
需要说明的是,以下实施例中所获得的各类数据均是在获得用户授权许可的基础上获取的。
参见图1:
步骤S100,对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容。
本实施例中,目标用户的目标对话事件序列中可包括若干个虚拟数字人对话事件,一种可替代的实施方式中,虚拟数字人对话事件可以是目标用户在数字化在线页面(如数字化医疗在线页面、数字化电商在线页面、数字化工业服务在线业务等)中与虚拟数字人(Digital Human / Meta Human)进行在线对话的事件。目标独立对话事件可以是指对话注意力值满足预设条件的对话事件,对话注意力值用于表征对话事件的对话集中程度,例如,目标用户在一个对话事件的对话行为越集中,则对话注意力值越大。
在此基础上,可以进一步对目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容,对话主题内容可以用于表示所述目标独立对话事件中具有关键性、代表性、显著性的对话内容。
步骤S200,对各个所述对话主题内容中的对话关键词进行统计分析,基于统计分析获得的各个对话关键词的关联词信息以及出现频率信息确定各个对话关键词所对应的关键词权重信息,并基于所述各个对话关键词所对应的关键词权重信息确定目标对话关键词。
例如,可以分析各个对话关键词的关联词数量,关联词可以是与所述对话关键词存在逻辑关联的词语,然后将关联词数量乘以对应的权重系数,并将所述出现频率信息乘以对应的权重系数,可以获得各个对话关键词所对应的关键词权重信息,然后将关键词权重大于设定权重的对话关键词确定为目标对话关键词。其中,对话关键词可以是指与本次对话主题关联的词语。
步骤S300,基于所述目标对话关键词,对所述目标用户所对应的数字化在线页面中的关联服务功能项进行内容优化。
例如,可以确定所述目标对话关键词在所述目标用户所对应的数字化在线页面中的关联服务功能项,然后在所述关联服务功能项中增加所述目标对话关键词所对应的功能内容数据,如文章内容数据、视频内容数据、功能添加数据等。
基于以上步骤,本实施例通过对目标用户的目标对话事件序列中的目标独立对话事件进行对话主题内容挖掘,获得所述目标独立对话事件中的对话主题内容,对各个所述对话主题内容中的对话关键词进行统计分析,基于统计分析获得的各个对话关键词的关联词信息以及出现频率信息确定各个对话关键词所对应的关键词权重信息,并基于所述各个对话关键词所对应的关键词权重信息确定目标对话关键词,基于所述目标对话关键词,对所述目标用户所对应的数字化在线页面中的关联服务功能项进行内容优化,从而可以针对对话主题内容中的对话关键词进行权重评估后进行进一步筛选后,对数字化在线页面中的关联服务功能项进行内容优化,相较于现有方案而言可以提高内容优化的精准性和可靠性。
一种实施例中,针对步骤S100,提供一种基于人工智能的对话主题内容挖掘方法,包括以下步骤。
步骤S110、获取所述目标用户在数字化在线页面中产生的应用于对话主题内容分析任务的目标对话事件序列,目标对话事件序列包括若干个虚拟数字人对话事件;
步骤S120、通过第一对话事件分析网络对目标对话事件序列中的每个虚拟数字人对话事件进行对话标签分析,生成每个虚拟数字人对话事件的对话标签分析数据以及每个虚拟数字人对话事件的对话语义向量,对话标签分析数据表征虚拟数字人对话事件所对应的对话触发标签。
一种可替代的实施方式中,将目标对话事件序列中的每个虚拟数字人对话事件作为第一对话事件分析网络的输入,通过第一对话事件分析网络输出每个虚拟数字人对话事件的对话标签热力图,再依据对话标签热力图可确定虚拟数字人对话事件的对话标签分析数据。与此同时,依据第一对话事件分析网络的语义编码单元,可获取每个虚拟数字人对话事件的对话语义向量。其中,第一对话事件分析网络可采用卷积神经网络CNN,对话语义向量即为卷积特征,对话语义向量表示为特征向量的形式。
步骤S130、基于每个虚拟数字人对话事件的对话标签分析数据,从目标对话事件序列中获取多方参与对话事件以及K个独立对话事件,多方参与对话事件与独立对话事件均属于虚拟数字人对话事件,K为不小于1的整数;
一种可替代的实施方式中,结合每个虚拟数字人对话事件的对话标签分析数据,可以从目标对话事件序列中筛选出属于多方参与对话事件的虚拟数字人对话事件,以及属于独立对话事件的虚拟数字人对话事件。其中,如果目标对话事件序列包括多个多方参与对话事件,则可选择其中一个多方参与对话事件进行后续处理。此外,目标对话事件序列中通常会包括多个独立对话事件,因此,需要从多个独立对话事件中选择用于预测对话主题内容的目标独立对话事件。
步骤S140、基于多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量,确定K个第一对话代价值以及K个第二对话代价值,K个第一对话代价值包括每个独立对话事件与多方参与对话事件之间的第一对话代价值,K个第二对话代价值包括每个独立对话事件所对应的第二对话代价值;
一种可替代的实施方式中,在得到多方参与对话事件以及K个独立对话事件之后,利用多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量,确定K个第一对话代价值。其中,K个第一对话代价值包括每个独立对话事件分别与多方参与对话事件之间的第一对话代价值。与此同时,利用每个独立对话事件的对话语义向量,确定K个第二对话代价值。其中,K个第二对话代价值包括每个独立对话事件分别与余下(K-1)个独立对话事件之间的第二对话代价值。
步骤S150、基于K个第一对话代价值以及K个第二对话代价值,确定每个独立对话事件所对应的全局对话代价值,全局对话代价值用于表征独立对话事件的对话注意力值;
对于K个独立对话事件中的每个独立对话事件而言,分别具有一个第一对话代价值和一个第二对话代价值。因此,针对每个独立对话事件,基于其对应的第一对话代价值和第二对话代价值,确定全局对话代价值。由此,生成每个独立对话事件所对应的全局对话代价值。其中,独立对话事件的全局对话代价值越大,表示该独立对话事件的差异程度越显著。
步骤S160、从每个独立对话事件所对应的全局对话代价值中获取最大全局对话代价值,并将最大全局对话代价值所对应的独立对话事件作为目标独立对话事件;
一种可替代的实施方式中,全局对话代价值与独立对话事件的对话注意力值呈正相关,因此,先从K个全局对话代价值中确定最大全局对话代价值,然后,将最大全局对话代价值所对应的独立对话事件作为目标独立对话事件。
步骤S170、通过目标对话主题挖掘网络对目标独立对话事件进行对话主题挖掘,生成目标独立对话事件的对话主题挖掘结果,对话主题挖掘结果用于确定目标独立对话事件中的对话主题内容。
一种可替代的实施方式中,将目标独立对话事件作为目标对话主题挖掘网络的输入,通过目标对话主题挖掘网络输出目标独立对话事件的对话主题挖掘结果。
目标对话主题挖掘网络可采用特征金字塔网络,此处不做限定。
示例性地,假设以目标对话事件序列包括虚拟数字人对话事件1、虚拟数字人对话事件2和虚拟数字人对话事件3为例,经过第一对话事件分析网络之后,可确定虚拟数字人对话事件1为多方参与对话事件,虚拟数字人对话事件2和虚拟数字人对话事件3均为独立对话事件。同时,通过第一对话事件分析网络的语义编码单元还可以得到每个虚拟数字人对话事件的对话语义向量,即,对话语义向量FE0、对话语义向量FE1和对话语义向量FE2。由此,利用对话语义向量FE0、对话语义向量FE1和对话语义向量FE2进行代价值计算,以得到独立对话事件1的全局对话代价值和独立对话事件2的全局对话代价值。由此,从独立对话事件1(即,虚拟数字人对话事件2)和独立对话事件2(即,虚拟数字人对话事件3)中选择出全局对话代价值更大的独立对话事件作为目标独立对话事件,最后,通过目标对话主题挖掘网络对目标独立对话事件进行对话主题挖掘,以得到对话主题内容的挖掘结果。
采用以上技术方案,引入了独立对话事件的第二对话代价值以及独立对话事件与多方参与对话事件第一对话代价值,共同衡量独立对话事件的对话注意力值,由此,可选择出对话注意力值最大的独立对话事件作为对话集中程度最大节点的独立对话事件,并将该独立对话事件作为预测对话主题内容的目标独立对话事件。基于以上方案,本申请实施例充分考虑到不同用户之间对话集中程度的区别,有利于提高对话主题内容提取的可靠性。
一种可替代的实施例中,获取应用于对话主题内容分析任务的目标对话事件序列,可以通过下述步骤实现:
应用于对话主题内容分析任务的初始对话事件序列,初始对话事件序列包括若干个虚拟数字人对话事件;
通过第二对话事件分析网络对初始对话事件序列中的每个虚拟数字人对话事件进行分析,生成每个虚拟数字人对话事件的异常对话内容分析数据,异常对话内容分析数据表征虚拟数字人对话事件的异常对话内容分布状态;
基于每个虚拟数字人对话事件的异常对话内容分析数据,将初始对话事件序列中异常对话内容分析数据属于无异常对话内容分布的虚拟数字人对话事件作为目标对话事件序列中的虚拟数字人对话事件。
一种可替代的实施方式中,提高一种自动识别异常对话内容的对话事件的方式。在实际场景中,用户可能会产生一些异常对话内容,日语其它旁人交谈的无关内容,因此,还需要从这些对话事件中提取用于构成目标对话事件序列的虚拟数字人对话事件。
示例性地,以初始对话事件序列包括虚拟数字人对话事件1、虚拟数字人对话事件2、虚拟数字人对话事件3、虚拟数字人对话事件4、虚拟数字人对话事件5和虚拟数字人对话事件6为例,将这些虚拟数字人对话事件作为第二对话事件分析网络的输入,通过第二对话事件分析网络得到每个虚拟数字人对话事件的异常对话内容预测数据,再依据异常对话内容预测数据可确定虚拟数字人对话事件的异常对话内容分析数据。异常对话内容分析数据可以是“异常对话内容分布”,也可以是“无异常对话内容分布”。其中,虚拟数字人对话事件1、虚拟数字人对话事件3和虚拟数字人对话事件4均属于“异常对话内容分布”,因此,可剔除这3个虚拟数字人对话事件。并将属于“无异常对话内容分布”虚拟数字人对话事件5、虚拟数字人对话事件2和虚拟数字人对话事件6作为目标对话事件序列。
由此,将虚拟数字人对话事件5、虚拟数字人对话事件2和虚拟数字人对话事件6作为第一对话事件分析网络的输入,通过第一对话事件分析网络得到每个虚拟数字人对话事件的对话标签热力图,再依据对话标签热力图可确定虚拟数字人对话事件的对话标签分析数据。其中,虚拟数字人对话事件5为多方参与对话事件,虚拟数字人对话事件2和虚拟数字人对话事件6均为独立对话事件。同时,通过第一对话事件分析网络的语义编码单元还可以得到每个虚拟数字人对话事件的对话语义向量,即,对话语义向量FE0、对话语义向量FE1和对话语义向量FE2。利用对话语义向量FE0、对话语义向量FE1和对话语义向量FE2进行代价值计算,以得到独立对话事件1(即,虚拟数字人对话事件2)的全局对话代价值和独立对话事件2(即,虚拟数字人对话事件6)的全局对话代价值。由此,从独立对话事件1和独立对话事件2中选择出全局对话代价值更大的独立对话事件作为目标独立对话事件,最后,通过目标对话主题挖掘网络对目标独立对话事件进行对话主题挖掘,以得到对话主题内容的预测结果。
一种可替代的实施例中,本申请时还是离提供一种基于人工智能的对话事件分析方法,可以包括:
获取第一待学习对话事件序列,第一待学习对话事件序列包括一个或多个第一待学习对话事件,每个第一待学习对话事件对应于异常对话内容标注数据;
针对于第一待学习对话事件序列中的每个第一待学习对话事件,依据第二对话事件分析网络获取每个第一待学习对话事件所对应的异常对话内容预测数据;
依据每个第一待学习对话事件所对应的异常对话内容预测数据以及异常对话内容标注数据,确定第一网络学习效果值;
采用第一网络学习效果值对第二对话事件分析网络进行网络权重信息迭代优化,以基于迭代优化的第二对话事件分析网络进行对话事件分析。
一种可替代的实施方式中,需要构建第一待学习对话事件序列,以使用第一待学习对话事件序列对第二对话事件分析网络进行训练。其中,第一待学习对话事件序列包括一个或多个第一待学习对话事件,且,每个第一待学习对话事件标注有对应的异常对话内容标注数据。例如,第一待学习对话事件1的异常对话内容标注数据为“异常对话内容分布”,第一待学习对话事件2的异常对话内容标注数据为“无异常对话内容分布”。
一种可替代的实施例中,通过第一对话事件分析网络对目标对话事件序列中的每个虚拟数字人对话事件进行对话标签分析,生成每个虚拟数字人对话事件的对话标签分析数据以及每个虚拟数字人对话事件的对话语义向量,可以通过下述步骤实现:
针对于目标对话事件序列中的每个虚拟数字人对话事件,通过第一对话事件分析网络所包括的语义编码单元获取每个虚拟数字人对话事件的对话语义向量;
针对于每个虚拟数字人对话事件的对话语义向量,通过第一对话事件分析网络所包括的降维抽象单元获取每个虚拟数字人对话事件的降维抽象向量;
针对于每个虚拟数字人对话事件的降维抽象向量,通过第一对话事件分析网络所包括的全连接单元获取每个虚拟数字人对话事件的对话标签热力图;
基于每个虚拟数字人对话事件的对话标签热力图,确定每个虚拟数字人对话事件的对话标签分析数据。
将目标对话事件序列中的每个虚拟数字人对话事件作为语义编码单元的输入,通过语义编码单元获取每个虚拟数字人对话事件的对话语义向量。由此,可缓存每个虚拟数字人对话事件的对话语义向量。接下来,对每个虚拟数字人对话事件的对话语义向量进行池化处理,即,通过降维抽象单元获取每个虚拟数字人对话事件的降维抽象向量。然后,将每个虚拟数字人对话事件的降维抽象向量作为全连接单元的输入,通过全连接单元获取每个虚拟数字人对话事件的对话标签热力图。由此,基于对话标签热力图,实现对虚拟数字人对话事件的分类,从而得到每个虚拟数字人对话事件的对话标签分析数据。其中,全连接单元包括全连接层和softmax层。
由此,利用第一对话事件分析网络不仅能够识别出虚拟数字人对话事件的对话标签分析数据,还能够提取虚拟数字人对话事件的对话语义向量,以学习得到虚拟数字人对话事件的高维特征向量。
一种可替代的实施例中,基于每个虚拟数字人对话事件的对话标签热力图,确定每个虚拟数字人对话事件的对话标签分析数据,可以通过下述步骤实现:
对每个虚拟数字人对话事件的对话标签热力图所包括的各个置信度进行数值分析,生成每个虚拟数字人对话事件的对话标签热力图中的最大置信度;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第一对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为无主动参与类别;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第二对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为多方参与类别,属于多方参与类别的虚拟数字人对话事件为多方参与对话事件;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第三对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为独立主动对话参与类别,属于独立主动对话参与类别的虚拟数字人对话事件为独立对话事件。
一种可替代的实施方式中,利用第一对话事件分析网络可输出虚拟数字人对话事件的对话标签热力图。其中,第一对话事件分析网络可识别出“无主动参与类别”、“多方参与类别”和“独立主动对话参与类别”。
示例性地,将各个虚拟数字人对话事件作为第一对话事件分析网络中语义编码单元的输入,通过语义编码单元提取相应的对话语义向量。然后,通过降维抽象单元获取每个虚拟数字人对话事件的降维抽象向量。再通过全连接层和softmax层获取每个虚拟数字人对话事件的对话标签热力图。假设对话标签热力图中第一对话内容节点对应于“无主动参与类别”,第二对话内容节点对应于“多方参与类别”,第三对话内容节点对应于“独立主动对话参与类别”。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.8,0.1,0.1),最大置信度为“0.8”。可见,最大置信度对应于第一对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为无主动参与类别。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.1,0.7,0.2),最大置信度为“0.7”。可见,最大置信度对应于第二对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为多方参与类别,即,该虚拟数字人对话事件属于多方参与对话事件。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.2,0.1,0.7),最大置信度为“0.7”。可见,最大置信度对应于第三对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为独立主动对话参与类别,即,该虚拟数字人对话事件属于独立对话事件。
其中,虚拟数字人对话事件经过第一对话事件分析网络预测时,通过语义编码单元获取的对话语义向量会进行缓存。在确定虚拟数字人对话事件所对应的对话标签之后,提取多方参与对话事件的对话语义向量和独立对话事件的对话语义向量即可,以用于后续计算候选代价值。
一种可替代的实施例中,基于每个虚拟数字人对话事件的对话标签热力图,确定每个虚拟数字人对话事件的对话标签分析数据,可以通过下述步骤实现:
对每个虚拟数字人对话事件的对话标签热力图所包括的各个置信度进行数值分析,生成每个虚拟数字人对话事件的对话标签热力图中的最大置信度;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第一对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为无主动参与类别;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第二对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为多方参与类别,属于多方参与类别的虚拟数字人对话事件为多方参与对话事件;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第三对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为独立主动对话参与类别,属于独立主动对话参与类别的虚拟数字人对话事件为独立对话事件;
针对于每个虚拟数字人对话事件,若虚拟数字人对话事件的对话标签热力图中最大置信度对应于第四对话内容节点,则将虚拟数字人对话事件的对话标签分析数据确定为无效对话类别,属于无效对话类别的虚拟数字人对话事件为无效参与对话事件。
一种可替代的实施方式中,利用第一对话事件分析网络可输出虚拟数字人对话事件的对话标签热力图。其中,第一对话事件分析网络可识别出“无主动参与类别”、“多方参与类别”、“独立主动对话参与类别”和“无效对话类别”。
示例性地,将各个虚拟数字人对话事件作为第一对话事件分析网络中语义编码单元的输入,通过语义编码单元提取相应的对话语义向量。然后,通过降维抽象单元获取每个虚拟数字人对话事件的降维抽象向量。再通过全连接层和softmax层获取每个虚拟数字人对话事件的对话标签热力图。其中,假设对话标签热力图中第一对话内容节点对应于“无主动参与类别”,第二对话内容节点对应于“多方参与类别”,第三对话内容节点对应于“独立主动对话参与类别”。第四对话内容节点对应于“无效对话类别”。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.7,0.1,0.1,0.1),最大置信度为“0.7”。可见,最大置信度对应于第一对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为无主动参与类别。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.1,0.7,0.1,0.1),最大置信度为“0.7”。可见,最大置信度对应于第二对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为多方参与类别,即,该虚拟数字人对话事件属于多方参与对话事件。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.2,0.1,0.6,0.1),最大置信度为“0.6”。可见,最大置信度对应于第三对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为独立主动对话参与类别,即,该虚拟数字人对话事件属于独立对话事件。
一种可替代的实施方式中,假设虚拟数字人对话事件的对话标签热力图为(0.2,0.1,0.1,0.6),最大置信度为“0.6”。可见,最大置信度对应于第四对话内容节点,因此,将该虚拟数字人对话事件的对话标签分析数据确定为无效对话类别,即,该虚拟数字人对话事件属于无效参与对话事件。
其中,虚拟数字人对话事件经过第一对话事件分析网络预测时,通过语义编码单元获取的对话语义向量会进行缓存。在确定虚拟数字人对话事件所对应的对话标签之后,提取多方参与对话事件的对话语义向量和独立对话事件的对话语义向量即可,以用于后续计算候选代价值。
由此,依据第一对话事件分析网络输出的对话标签热力图,可确定虚拟数字人对话事件所对应的对话标签。进而自动区分多方参与对话事件、独立对话事件和无效参与对话事件。
一种可替代的实施例中,本申请实施例还提供一种基于人工智能的对话事件分析方法,可以包括:
获取第二待学习对话事件序列,第二待学习对话事件序列包括一个或多个第二待学习对话事件,每个第二待学习对话事件对应于对话标签标注数据;
针对于第二待学习对话事件序列中的每个第二待学习对话事件,依据第一对话事件分析网络获取每个第二待学习对话事件所对应的对话标签热力图;
依据每个第二待学习对话事件所对应的对话标签热力图以及对话标签标注数据,确定第二网络学习效果值;
采用第二网络学习效果值对第一对话事件分析网络进行网络权重信息迭代优化,以基于迭代优化的第一对话事件分析网络进行对话事件分析。
一种可替代的实施方式中,需要构建第二待学习对话事件序列,以使用第二待学习对话事件序列对第一对话事件分析网络进行训练。其中,第二待学习对话事件序列包括一个或多个第二待学习对话事件,且,每个第二待学习对话事件标注有对应的对话标签标注数据。例如,第二待学习对话事件1的对话标签标注数据为“无主动参与类别”,第二待学习对话事件2的对话标签标注数据为“多方参与类别”。
一种可替代的实施方式中,可将第二待学习对话事件序列作为一个批次的样本数据。由此,将第二待学习对话事件序列中的各个第二待学习对话事件作为第一对话事件分析网络的输入,通过第一对话事件分析网络输出每个第二待学习对话事件所对应的对话标签热力图。与此同时,基于每个第二待学习对话事件所对应的对话标签标注数据,可得到每个第二待学习对话事件所对应的实际热力图。例如,对话标签标注数据为“无主动参与类别”,则对应的实际热力图为(1,0,0,0)。又例如,异常对话内容标注数据为“多方参与类别”,则对应的实际热力图为(0,1,0,0)。又例如,异常对话内容标注数据为“独立主动对话参与类别”,则对应的实际热力图为(0,0,1,0)。又例如,异常对话内容标注数据为“无效对话类别”,则对应的实际热力图为(0,0,0,1)。
一种可替代的实施例中,基于多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量,确定K个第一对话代价值以及K个第二对话代价值,可以通过下述步骤实现:
对多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量进行类间代价计算,生成每个独立对话事件与多方参与对话事件之间的第一对话代价值;
对每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成每个独立对话事件所对应的第二对话代价值,其它各个独立对话事件为K个独立对话事件中除了独立对话事件之外的余下独立对话事件;
基于K个第一对话代价值以及K个第二对话代价值,确定每个独立对话事件所对应的全局对话代价值,可以通过下述步骤实现:
针对于每个独立对话事件,对独立对话事件所对应的第一对话代价值以及第二对话代价值进行融合,生成独立对话事件所对应的全局对话代价值。
一种可替代的实施方式中,在得到K个独立对话事件之后,一方面,需要将每个独立对话事件分别与多方参与对话事件进行第一对话代价值的计算。另一方面,需要将每个独立对话事件分别与其它独立对话事件进行第二对话代价值的计算。
一种可替代的实施方式中,假设有3个独立对话事件(即,K等于3),分别为独立对话事件1、独立对话事件2和独立对话事件3。由此,K个第一对话代价值包括独立对话事件1与多方参与对话事件之间的第一对话代价值1,独立对话事件2与多方参与对话事件之间的第一对话代价值2,独立对话事件3与多方参与对话事件之间的第一对话代价值3。K个第二对话代价值包括独立对话事件1与余下两个独立对话事件(即,独立对话事件2和独立对话事件3)的第二对话代价值1,独立对话事件2与余下两个独立对话事件(即,独立对话事件1和独立对话事件3)的第二对话代价值2,独立对话事件3与余下两个独立对话事件(即,独立对话事件1和独立对话事件2)的第二对话代价值3。
可见,对于每个独立对话事件而言,能够分别得到其对应的第一对话代价值和第二对话代价值。即,独立对话事件1对应于第一对话代价值1和第二对话代价值1。独立对话事件2对应于第一对话代价值2和第二对话代价值2。独立对话事件3对应于第一对话代价值3和第二对话代价值3。
由此,对独立对话事件的第一对话代价值和第二对话代价值进行融合,以得到其它各个独立对话事件的全局对话代价值。从而能够自动选择独立对话事件中对话集中程度最显现的对话事件作为用于对话主题内容预测的目标独立对话事件。依据类内和类间的差异性对比,以加权的方式来衡量独立对话事件的对话集中程度,可提高后续数据处理的可靠性。
一种可替代的实施例中,对多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量进行类间代价计算,生成每个独立对话事件与多方参与对话事件之间的第一对话代价值,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与多方参与对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成独立对话事件与多方参与对话事件之间的H个分句语义向量距离,H为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与多方参与对话事件之间的H个分句语义向量距离进行对话代价计算,生成独立对话事件与多方参与对话事件之间的第一对话代价值。
一种可替代的实施方式中,可依据多方参与对话事件的对话语义向量以及独立对话事件的对话语义向量,生成独立对话事件与多方参与对话事件之间的对话语义向量距离。例如,可将独立对话事件与多方参与对话事件之间的对话语义向量距离直接作为两者之间的第一对话代价值。
一种可替代的实施例中,对每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成每个独立对话事件所对应的第二对话代价值,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与其它各个独立对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成每个独立对话事件与其它各个独立对话事件之间的H个分句语义向量距离,H为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的H个分句语义向量距离进行对话代价计算,生成独立对话事件与其它各个独立对话事件之间的第一候选代价值;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的第一候选代价值进行平均代价值计算,生成独立对话事件所对应的第二对话代价值。
一种可替代的实施方式中,可依据K个独立对话事件的对话语义向量,生成独立对话事件与其它各个独立对话事件之间的对话语义向量距离。例如,可将独立对话事件与其它各个独立对话事件之间的对话语义向量距离直接作为两者之间的第二对话代价值。
一种可替代的实施例中,对多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量进行类间代价计算,生成每个独立对话事件与多方参与对话事件之间的第一对话代价值,可以通过下述步骤实现:
对多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量进行代价值计算,生成每个独立对话事件与所述多方参与对话事件之间的对话语义向量距离;
对多方参与对话事件的对话倾向分布图特征以及每个独立对话事件的对话倾向分布图特征进行代价值计算,生成每个独立对话事件与多方参与对话事件之间的对话倾向分布图代价值;
针对于每个独立对话事件,对独立对话事件与多方参与对话事件之间的对话语义向量距离,以及独立对话事件与多方参与对话事件之间的对话倾向分布图代价值进行融合,生成独立对话事件与多方参与对话事件之间的第一对话代价值。
一种可替代的实施方式中,在得到K个独立对话事件之后,需要将每个独立对话事件分别与多方参与对话事件进行对话语义向量距离的计算。还需要将每个独立对话事件分别与多方参与对话事件进行对话倾向分布图代价值的计算。由此,可通过以下公式计算独立对话事件与多方参与对话事件之间的第一对话代价值:
Cost0=i1·TRE0+j1·TRY0
其中,Cost0表示第i个独立对话事件与多方参与对话事件之间的第一对话代价值。TRE0表示第i个独立对话事件与多方参与对话事件之间的对话倾向分布图代价值。TRY0表示表示第i个独立对话事件与多方参与对话事件之间的对话语义向量距离。i1和j1均表示权重系数,如,i1=0.5,j1=0.5。
对于第i个独立对话事件而言,对第i个独立对话事件与多方参与对话事件之间的对话语义向量距离(即,TRY0),以及第i个独立对话事件与多方参与对话事件之间的对话倾向分布图代价值(即,TRE0)进行融合,以得到第i个独立对话事件与多方参与对话事件之间的第一对话代价值(即,Cost0)。
示例性地,以初始对话事件序列包括虚拟数字人对话事件1、虚拟数字人对话事件2、虚拟数字人对话事件3、虚拟数字人对话事件4、虚拟数字人对话事件5、虚拟数字人对话事件6和虚拟数字人对话事件7为例,将这些虚拟数字人对话事件作为第二对话事件分析网络的输入,通过第二对话事件分析网络得到每个虚拟数字人对话事件的异常对话内容预测数据,再依据异常对话内容预测数据可确定虚拟数字人对话事件的异常对话内容分析数据。异常对话内容分析数据可以是“异常对话内容分布”,也可以是“无异常对话内容分布”。其中,虚拟数字人对话事件1、虚拟数字人对话事件3和虚拟数字人对话事件4均属于“异常对话内容分布”,因此,可剔除这3个虚拟数字人对话事件。并将属于“无异常对话内容分布”虚拟数字人对话事件5、虚拟数字人对话事件2、虚拟数字人对话事件6和虚拟数字人对话事件7作为目标对话事件序列。
由此,将虚拟数字人对话事件5、虚拟数字人对话事件2、虚拟数字人对话事件6和虚拟数字人对话事件7作为第一对话事件分析网络的输入,通过第一对话事件分析网络得到每个虚拟数字人对话事件的对话标签热力图,再依据对话标签热力图可确定虚拟数字人对话事件的对话标签分析数据。其中,虚拟数字人对话事件5为多方参与对话事件,虚拟数字人对话事件2和虚拟数字人对话事件6均为独立对话事件,虚拟数字人对话事件7为无效参与对话事件。同时,通过第一对话事件分析网络的语义编码单元还可以得到每个虚拟数字人对话事件的对话语义向量,即,对话语义向量FE0、对话语义向量FE1、对话语义向量FE2和对话语义向量FE3。
一方面,需要利用对话语义向量FE0、对话语义向量FE1和对话语义向量FE2进行代价值计算,以得到独立对话事件1(即,虚拟数字人对话事件2)的对话语义向量距离和独立对话事件2(即,虚拟数字人对话事件6)的对话语义向量距离。
另一方面,需要分别提取多方参与对话事件和每个独立对话事件的对话倾向分布图特征,以得到多方参与对话事件的对话倾向分布图特征f0、独立对话事件1的对话倾向分布图特征f1和独立对话事件2的对话倾向分布图特征f2。利用对话倾向分布图特征f0、对话倾向分布图特征f1和对话倾向分布图特征f2进行代价值计算,以得到独立对话事件1(即,虚拟数字人对话事件2)的对话倾向分布图代价值和独立对话事件2(即,虚拟数字人对话事件6)的对话倾向分布图代价值。
由此,基于独立对话事件1的对话语义向量距离和对话倾向分布图代价值,确定独立对话事件1的全局对话代价值。基于独立对话事件2的对话语义向量距离和对话倾向分布图代价值,确定独立对话事件2的全局对话代价值。于是,从独立对话事件1和独立对话事件2中选择出全局对话代价值更大的独立对话事件作为目标独立对话事件,最后,通过目标对话主题挖掘网络对目标独立对话事件进行对话主题挖掘,以得到对话主题内容的挖掘可靠性。
一种可替代的实施例中,对多方参与对话事件的对话语义向量以及每个独立对话事件的对话语义向量进行代价值计算,生成每个独立对话事件与所述多方参与对话事件之间的对话语义向量距离,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与多方参与对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成独立对话事件与多方参与对话事件之间的H个分句语义向量距离,H为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与多方参与对话事件之间的H个分句语义向量距离进行对话代价计算,生成独立对话事件与多方参与对话事件之间的对话语义向量距离;
对多方参与对话事件的对话倾向分布图特征以及每个独立对话事件的对话倾向分布图特征进行代价值计算,生成每个独立对话事件与多方参与对话事件之间的对话倾向分布图代价值,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话倾向分布图特征中的每个分句语义向量,与多方参与对话事件对应对话倾向分布图特征中相对应对话节点的分句语义向量进行代价值计算,生成独立对话事件与多方参与对话事件之间的F个分句语义向量距离,F为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与多方参与对话事件之间的F个分句语义向量距离进行代价值计算,生成独立对话事件与多方参与对话事件之间的对话倾向分布图代价值。
一种可替代的实施方式中,可依据多方参与对话事件的对话语义向量以及独立对话事件的对话语义向量,生成独立对话事件与多方参与对话事件之间的对话语义向量距离。可依据多方参与对话事件的对话倾向分布图特征以及独立对话事件的对话倾向分布图特征,生成独立对话事件与多方参与对话事件之间的对话倾向分布图代价值。例如,可将独立对话事件与多方参与对话事件之间的对话语义向量距离和对话倾向分布图代价值融合的结果作为两者之间的第一对话代价值。
一种可替代的实施例中,对每个独立对话事件的对话语义向量以及其它各个独立对话事件对应对话语义向量进行类内代价计算,生成每个独立对话事件所对应的第二对话代价值,可以通过下述步骤实现:
基于每个独立对话事件的对话语义向量,确定每个独立对话事件所对应的平均对话语义向量距离;
基于每个独立对话事件的对话倾向分布图特征,确定每个独立对话事件所对应的平均对话倾向分布图特征距离;
针对于每个独立对话事件,对独立对话事件所对应的平均对话语义向量距离,以及独立对话事件所对应的平均对话倾向分布图特征距离进行融合,生成独立对话事件所对应的第二对话代价值。
一种可替代的实施方式中,在得到K个独立对话事件之后,一方面,可依据其它各个独立对话事件的对话语义向量,生成独立对话事件与其它各个独立对话事件之间的平均对话语义向量距离。另一方面,可依据其它各个独立对话事件的对话倾向分布图特征,生成独立对话事件与其它各个独立对话事件之间的平均对话倾向分布图特征距离。由此,可采用如下方式计算独立对话事件所对应的第二对话代价值:
Cost=i2·TRE+j2·TRY;其中,Cost表示第i个独立对话事件所对应的第二对话代价值。TRE表示第i个独立对话事件所对应的平均对话倾向分布图特征距离。TRY表示表示第i个独立对话事件所对应的平均对话语义向量距离。i2和j2均表示权重,例如,i2=0.5,j2=0.5。
对于第i个独立对话事件而言,对第i个独立对话事件与其它各个独立对话事件之间的平均对话语义向量距离(即,TRY),以及第i个独立对话事件与其它各个独立对话事件之间的平均对话倾向分布图特征距离(即,TRE)进行融合,以得到第i个独立对话事件与其它各个独立对话事件之间的第二对话代价值(即,Cost)。
一种可替代的实施例中,基于每个独立对话事件的对话语义向量,确定每个独立对话事件所对应的平均对话语义向量距离,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话语义向量中的每个分句语义向量,与其它各个独立对话事件对应对话语义向量中相对应对话节点的分句语义向量进行代价值计算,生成每个独立对话事件与其它各个独立对话事件之间的H个分句语义向量距离,H为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的H个分句语义向量距离进行对话代价计算,生成独立对话事件与其它各个独立对话事件之间的第一候选代价值;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的第一候选代价值进行平均代价值计算,生成独立对话事件所对应的平均对话语义向量距离;
基于每个独立对话事件的对话倾向分布图特征,确定每个独立对话事件所对应的平均对话倾向分布图特征距离,可以通过下述步骤实现:
针对于每个独立对话事件,将独立对话事件对应对话倾向分布图特征中的每个分句语义向量,与其它各个独立对话事件对应对话倾向分布图特征中相对应对话节点的分句语义向量进行代价值计算,生成每个独立对话事件与其它各个独立对话事件之间的F个分句语义向量距离,F为不小于1的整数;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的F个分句语义向量距离进行代价值计算,生成独立对话事件与其它各个独立对话事件之间的第二候选代价值;
针对于每个独立对话事件,对独立对话事件与其它各个独立对话事件之间的第二候选代价值进行平均代价值计算,生成独立对话事件所对应的平均对话倾向分布图特征距离。
一种可替代的实施方式中,可依据K个独立对话事件的对话语义向量,生成独立对话事件与其它各个独立对话事件之间的平均对话语义向量距离。可依据K个独立对话事件的对话倾向分布图特征,生成独立对话事件与其它各个独立对话事件之间的平均对话倾向分布图特征距离。例如,可将独立对话事件所对应的平均对话语义向量距离和平均对话倾向分布图特征距离融合的结果作为两者之间的第一对话代价值。
一种可替代的实施例中,以上实施例还可以包括:
对多方参与对话事件进行对话倾向标注,生成第一对话倾向标注对话事件,第一对话倾向标注对话事件中的每个对话内容片段对应于一个对话倾向值;
依据多方参与对话事件所对应的第一对话倾向标注对话事件,分别统计各个预设对话倾向值所对应的对话内容片段数;
基于第一对话倾向标注对话事件针对于各个预设对话倾向值的对话内容片段数,构建多方参与对话事件的对话倾向分布图特征;
还可以包括:
针对每个独立对话事件,对独立对话事件进行对话倾向标注,生成第二对话倾向标注对话事件,第二对话倾向标注对话事件中的每个对话内容片段对应于一个对话倾向值;
针对每个独立对话事件,依据第二对话倾向标注对话事件,分别统计各个预设对话倾向值所对应的对话内容片段数;
针对每个独立对话事件,基于第二对话倾向标注对话事件针对于各个预设对话倾向值的对话内容片段数,构建独立对话事件的对话倾向分布图特征。
一些设计思路中,提供了一种数字化在线页面系统,该数字化在线页面系统可以是服务器,该数字化在线页面系统包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该数字化在线页面系统的处理器用于提供计算和控制能力。该数字化在线页面系统的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该数字化在线页面系统的数据库用于存储上述方法所涉及的数据。该数字化在线页面系统的模型加载数据/输出接口用于处理器与外部设备之间交换信息。该数字化在线页面系统的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于人工智能决策的服务优化方法。
一些设计思路中,提供了一种数字化在线页面系统,该数字化在线页面系统可以是终端。该数字化在线页面系统包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该数字化在线页面系统的处理器用于提供计算和控制能力。该数字化在线页面系统的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该数字化在线页面系统的模型加载数据/输出接口用于处理器与外部设备之间交换信息。该数字化在线页面系统的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其它技术实现。该计算机程序被处理器执行时以实现一种基于人工智能决策的服务优化方法。该数字化在线页面系统的显示单元用于形成视觉可见的画面。
一些设计思路中,提供了一种数字化在线页面系统,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。