CN117556025B - 基于ai和可视化的平台化项目服务信息优化方法及系统 - Google Patents
基于ai和可视化的平台化项目服务信息优化方法及系统 Download PDFInfo
- Publication number
- CN117556025B CN117556025B CN202410034713.3A CN202410034713A CN117556025B CN 117556025 B CN117556025 B CN 117556025B CN 202410034713 A CN202410034713 A CN 202410034713A CN 117556025 B CN117556025 B CN 117556025B
- Authority
- CN
- China
- Prior art keywords
- conversation
- round
- session
- intention
- text content
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000005457 optimization Methods 0.000 title claims abstract description 43
- 238000012800 visualization Methods 0.000 title claims abstract description 32
- 238000012549 training Methods 0.000 claims abstract description 145
- 238000005065 mining Methods 0.000 claims abstract description 101
- 238000013135 deep learning Methods 0.000 claims abstract description 9
- 239000013598 vector Substances 0.000 claims description 153
- 238000009826 distribution Methods 0.000 claims description 41
- 238000012545 processing Methods 0.000 claims description 39
- 238000002372 labelling Methods 0.000 claims description 24
- 230000004927 fusion Effects 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 13
- 230000007246 mechanism Effects 0.000 claims description 12
- 238000012544 monitoring process Methods 0.000 claims description 11
- 230000002708 enhancing effect Effects 0.000 claims description 5
- 235000013550 pizza Nutrition 0.000 description 22
- 230000006870 function Effects 0.000 description 10
- 235000013351 cheese Nutrition 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000012935 Averaging Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000000386 athletic effect Effects 0.000 description 3
- 241000125205 Anethum Species 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000009223 counseling Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000007636 ensemble learning method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Databases & Information Systems (AREA)
- Human Computer Interaction (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请提供一种基于AI和可视化的平台化项目服务信息优化方法及系统,通过有效地利用有监督和无监督的会话文本内容,通过深度学习方法,即模糊预测网络,能够生成表征无监督多轮会话文本内容对应的会话意图属性的模糊预测意图。在获得有监督和无监督的会话意图信息后,再通过混合平均的方式,生成用于训练会话意图挖掘网络的集成模板多轮会话文本内容和对应的会话意图信息。此外,经过训练的会话意图挖掘网络可以被用于优化平台化项目服务中的页面内容架构,使其更加符合用户的需求和意图,从而提高用户体验,降低客服负担,提升运营效率。
Description
技术领域
本申请涉及人工智能技术领域,具体而言,涉及一种基于AI和可视化的平台化项目服务信息优化方法及系统。
背景技术
在网络平台服务中,尤其是平台化项目服务如电商、社交媒体、新闻推荐等场景下,用户会通过多轮对话的方式与平台进行交互。理解这些会话内容,并从中挖掘出用户的意图,对于提升用户体验,优化服务质量,甚至驱动产品迭代具有重要价值。
然而,传统的会话意图识别技术大多依赖于规则或模板匹配,这不仅需要大量人力物力进行维护,而且无法处理复杂和变化多端的用户会话,难以满足实际需求。而基于深度学习的会话意图挖掘方法虽然能自动学习到用户意图的高级表征,但是它们大多依赖于有监督学习,需要大量标注数据,对于没有标签或者标签稀疏的情况处理能力较弱。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于AI和可视化的平台化项目服务信息优化方法及系统。
第一方面,本申请提供一种基于AI和可视化的平台化项目服务信息优化方法,所述方法包括:
获取用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,所述第一训练会话文本序列中包括至少一个平台化项目服务的有监督多轮会话文本内容以及各个所述有监督多轮会话文本内容分别对应的标注会话意图,所述标注会话意图表征所述有监督多轮会话文本内容对应的会话意图属性,所述第二训练会话文本序列中包括不携带会话意图属性的至少一个无监督多轮会话文本内容,每个模板多轮会话文本内容包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容;
利用模糊预测网络生成所述无监督多轮会话文本内容对应的模糊预测意图,所述模糊预测网络是生成表征所述无监督多轮会话文本内容对应的会话意图属性的所述模糊预测意图的深度学习网络;
基于所述有监督多轮会话文本内容、所述有监督多轮会话文本内容对应的标注会话意图、所述无监督多轮会话文本内容以及所述无监督多轮会话文本内容对应的模糊预测意图,生成参考训练会话文本序列;
从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息;
依据所述集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,对所述会话意图挖掘网络进行训练,生成训练后的会话意图挖掘网络,并基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
在第一方面的一种可能的实施方式中,所述利用模糊预测网络生成所述无监督多轮会话文本内容对应的模糊预测意图,包括:
利用k种样本扩充策略分别对所述无监督多轮会话文本内容进行样本扩充,生成k个样本扩充后的无监督多轮会话文本内容,k为大于1的整数;
利用所述模糊预测网络,生成所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,所述会话意图置信度分布是指所述样本扩充后的无监督多轮会话文本内容属于各个会话意图属性的置信度;
基于所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,确定所述无监督多轮会话文本内容对应的模糊预测意图。
在第一方面的一种可能的实施方式中,所述基于所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,确定所述无监督多轮会话文本内容对应的模糊预测意图,包括:
计算所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布的平均置信度分布;
对所述平均置信度分布进行高频分量增强处理,将处理结果作为所述无监督多轮会话文本内容对应的模糊预测意图。
在第一方面的一种可能的实施方式中,所述参考训练会话文本序列中的模板多轮会话文本内容包括:所述有监督多轮会话文本内容,所述有监督多轮会话文本内容对应的会话意图信息为所述有监督多轮会话文本内容对应的标注会话意图;所述样本扩充后的无监督多轮会话文本内容,所述样本扩充后的无监督多轮会话文本内容对应的会话意图信息为所述无监督多轮会话文本内容对应的模糊预测意图。
在第一方面的一种可能的实施方式中,所述从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,包括:
将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容与第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容与第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容;
将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容对应的会话意图信息与所述第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容对应的会话意图信息与所述第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容对应的会话意图信息。
在第一方面的一种可能的实施方式中,所述会话意图挖掘网络包括:语义表示单元、上下文自相关处理单元和全连接输出单元; 所述依据所述集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,对所述会话意图挖掘网络进行训练,生成训练后的会话意图挖掘网络,包括:
依据所述语义表示单元获取所述集成模板多轮会话文本内容的语义表示向量数据;
依据所述上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格;
对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果;
对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量;
利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量;
基于所述第一关注矢量和所述第二关注矢量,生成集成特征关系网格;
将所述语义表示向量数据与所述集成特征关系网格进行融合,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性;
依据所述全连接输出单元基于所述上下文自相关处理后的语义表示向量数据,生成所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果;
基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和所述集成模板多轮会话文本内容对应的会话意图信息,确定所述会话意图挖掘网络的训练Loss参数;
基于所述训练Loss参数,对所述会话意图挖掘网络进行训练,生成所述训练后的会话意图挖掘网络。
在第一方面的一种可能的实施方式中,所述基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和所述集成模板多轮会话文本内容对应的会话意图信息,确定所述会话意图挖掘网络的训练Loss参数,包括:
针对符合第一匹配规则的集成模板多轮会话文本内容,利用第一Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第一训练Loss参数;其中,所述第一匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容中,存在至少一个模板多轮会话文本内容为所述有监督多轮会话文本内容;
针对符合第二匹配规则的集成模板多轮会话文本内容,利用第二Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第二训练Loss参数;其中,所述第二匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容均不是所述有监督多轮会话文本内容;
基于所述第一训练Loss参数和所述第二训练Loss参数,确定所述会话意图挖掘网络的训练Loss参数。
在第一方面的一种可能的实施方式中,所述获取用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,包括:
获取至少一个会话用户的对话监控数据,所述会话用户的对话监控数据包括由所述至少一个文本内容采集单元在多个会话节点对所述会话用户进行对话文本提取到的数据;
基于对话游走单位的单位长度和共享参数,利用所述对话游走单位从所述会话用户的对话监控数据中,提取到多个模板多轮会话文本内容;
基于第一比例参数,将所述多个模板多轮会话文本内容分为所述有监督多轮会话文本内容和所述无监督多轮会话文本内容;
获取各个所述有监督多轮会话文本内容分别对应的标注会话意图,生成所述第一训练会话文本序列;
基于各个所述无监督多轮会话文本内容,生成所述第二训练会话文本序列。
在第一方面的一种可能的实施方式中,所述基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化的步骤,包括:
获取目标会话用户的会话文本数据,所述会话文本数据包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容;
通过会话意图挖掘网络的语义表示单元,获取所述会话文本数据的语义表示向量数据;
依据所述会话意图挖掘网络的上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格;
对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果;
对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量;
利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量;
基于所述第一关注矢量和所述第二关注矢量,确定集成特征关系网格; 将所述语义表示向量数据与所述集成特征关系网格相乘,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性;
依据所述会话意图挖掘网络的全连接输出单元,基于所述上下文自相关处理后的语义表示向量数据,生成所述会话文本数据对应的会话意图属性数据,并基于所述会话意图属性数据对所述目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
第二方面,本申请实施例还提供一种基于AI和可视化的平台化项目服务信息优化系统,所述基于AI和可视化的平台化项目服务信息优化系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序结合该处理器加载并执行以实现以上第一方面的基于AI和可视化的平台化项目服务信息优化方法。
采用以上任意方面的技术方案,通过获取第一训练会话文本序列和第二训练会话文本序列,利用模糊预测网络生成无监督多轮会话文本内容对应的模糊预测意图,并基于有监督多轮会话文本内容、标注会话意图、无监督多轮会话文本内容以及模糊预测意图生成参考训练会话文本序列,进一步对两个模板多轮会话文本内容进行混合平均,生成集成模板多轮会话文本内容和对应的会话意图信息,最后依据这些信息对会话意图挖掘网络进行训练并进行页面内容架构的信息优化。由此,有效地利用了有监督和无监督的会话文本内容,通过深度学习方法,即模糊预测网络,能够生成表征无监督多轮会话文本内容对应的会话意图属性的模糊预测意图。在获得有监督和无监督的会话意图信息后,再通过混合平均的方式,生成用于训练会话意图挖掘网络的集成模板多轮会话文本内容和对应的会话意图信息。此外,经过训练的会话意图挖掘网络可以被用于优化平台化项目服务中的页面内容架构,使其更加符合用户的需求和意图,从而提高用户体验,降低客服负担,提升运营效率。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以结合这些附图获得其它相关的附图。
图1为本申请实施例提供的基于AI和可视化的平台化项目服务信息优化方法的流程示意图;
图2为本申请实施例提供的用于实现上述的基于AI和可视化的平台化项目服务信息优化方法的基于AI和可视化的平台化项目服务信息优化系统的功能结构示意框图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和结合本申请,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本申请的原则和范围时,本申请中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本申请并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
参见图1所示,本申请提供一种基于AI和可视化的平台化项目服务信息优化方法,包括以下步骤。
步骤S110,获取用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,所述第一训练会话文本序列中包括至少一个平台化项目服务的有监督多轮会话文本内容以及各个所述有监督多轮会话文本内容分别对应的标注会话意图,所述标注会话意图表征所述有监督多轮会话文本内容对应的会话意图属性,所述第二训练会话文本序列中包括不携带会话意图属性的至少一个无监督多轮会话文本内容,每个模板多轮会话文本内容包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容。
例如,可以从数据库中或者外部数据源获取第一训练会话文本序列和第二训练会话文本序列。示例性地,可可以从电商平台中获取用户与客服之间的多轮会话文本内容,以及对应的标注会话意图。这些会话文本内容可以作为有监督多轮会话文本内容,用于训练会话意图挖掘网络。同时,还可以从社交媒体平台中获取用户发表的评论和留言等无监督多轮会话文本内容。这些无监督多轮会话文本内容用于训练模糊预测网络,以预测用户的意图。
例如,可以获取以下有监督多轮会话文本内容:
会话1:
用户:你好,我想要购买一台笔记本电脑。
客服:您好,您想要什么品牌的电脑呢?
用户:我想购买戴尔牌的。
客服:好的,戴尔有很多型号的电脑,您需要哪种类型的呢?
用户:我想要一款轻薄型的,适合出差使用的。
客服:那您可以考虑戴尔的XPS系列,这款电脑非常轻薄,适合出差使用。
会话1对应的标注会话意图是:产品咨询-电脑
其中,所述会话意图挖掘网络是一种深度学习网络,用于根据输入的会话文本内容预测出会话意图信息。会话意图信息可以包括会话意图的类型、重要性等级等。
所述训练会话文本序列是一种用于训练会话意图挖掘网络的文本数据集,包括有监督多轮会话文本内容和无监督多轮会话文本内容。所述有监督多轮会话文本内容是带有训练标签的会话文本内容,包括用户在平台化项目服务中与客服或其它用户的多个轮次的对话内容。每个多轮会话文本内容都对应一个标注会话意图,用于指示该会话文本内容的会话意图属性。例如,用户在电商平台询问商品详情,客服提供了详细的回答,这个会话文本内容就是有监督多轮会话文本内容。所述标注会话意图是对有监督多轮会话文本内容的会话意图属性的标注,用于指示该会话文本内容的含义和目的。例如,在产品咨询类型的会话文本内容中,标注会话意图可能是“询问产品规格”、“寻求购买建议”等。所述无监督多轮会话文本内容是不带有训练标签的会话文本内容,包括用户在平台化项目服务中产生的对话内容,但没有明确的会话意图属性标签。这些会话文本内容的意图需要通过其它方法进行预测。例如,用户在社交媒体平台上发表一篇关于产品评论的文章,这个会话文本内容就是无监督多轮会话文本内容。
由此,所述模板多轮会话文本内容是在训练会话意图挖掘网络时使用的会话文本内容的基本单位,包括至少一个会话节点采集到的会话文本内容。每个模板多轮会话文本内容都可以被视为一个会话意图挖掘的基本单位,用于训练网络并提高其预测精度。例如,一个询问航班信息的会话文本内容,可能包括用户询问航班时间、航班价格等多个会话节点,这些会话节点就可以组成一个模板多轮会话文本内容。
所述文本内容采集单元:这是一种采集会话文本内容的方式,可以是自动采集(如基于自然语言处理技术的采集工具),也可以是人手工采集(如客服人员记录用户的询问内容)。文本内容采集单元可以根据特定的场景和需求进行定制化设计。例如,在某个客服平台中,可以使用聊天机器人作为文本内容采集单元,自动采集用户的咨询问题。
步骤S120,利用模糊预测网络生成所述无监督多轮会话文本内容对应的模糊预测意图,所述模糊预测网络是生成表征所述无监督多轮会话文本内容对应的会话意图属性的所述模糊预测意图的深度学习网络。
例如,在这个步骤中,可以使用预先训练好的模糊预测网络对第二训练会话文本序列中的每个无监督多轮会话文本内容进行意图预测,生成对应的模糊预测意图。模糊预测网络是生成表征无监督多轮会话文本内容对应的会话意图属性的深度学习网络。例如,可以将用户的评论文本输入到预先训练好的模糊预测网络中,得到该评论文本可能对应的意图,如商品评价、售后投诉等。例如,对于用户发表的评论“这个产品质量很好,下次还会购买”,模糊预测网络可以预测出该评论可能对应的意图是“商品评价”。
步骤S130,基于所述有监督多轮会话文本内容、所述有监督多轮会话文本内容对应的标注会话意图、所述无监督多轮会话文本内容以及所述无监督多轮会话文本内容对应的模糊预测意图,生成参考训练会话文本序列。
例如,在这个步骤中,可以将第一训练会话文本序列和第二训练会话文本序列进行融合,生成参考训练会话文本序列。参考训练会话文本序列包含了丰富的会话文本内容和对应的意图信息,可以用于训练会话意图挖掘网络。例如,可以将购物咨询会话文本序列和用户评论会话文本序列进行合并,生成一个包含问题和回答、用户评论及其预测意图的参考训练会话文本序列。
步骤S140,从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息。
例如,在这个步骤中,通过对参考训练会话文本序列中的会话文本内容和意图信息进行混合平均,生成更加丰富和稳定的集成模板多轮会话文本内容和对应的会话意图信息。例如,可以从参考训练会话文本序列中随机选择两个会话文本内容,将它们进行混合,并计算它们对应的意图信息的平均值,作为集成模板多轮会话文本内容对应的会话意图信息。
步骤S140:从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息。
例如,可以选择会话1和用户评论1进行混合,得到以下集成模板多轮会话文本内容:
集成模板1:
用户:你好,我想要购买一台笔记本电脑。
客服:您好,您想要什么品牌的电脑呢?
用户:我想购买戴尔牌的。
客服:好的,戴尔有很多型号的电脑,您需要哪种类型的呢?
用户:我想要一款轻薄型的,适合出差使用的。
客服:那您可以考虑戴尔的XPS系列,这款电脑非常轻薄,适合出差使用。
用户评论:这个手机质量很好,使用起来非常流畅。
对应的会话意图信息为:产品咨询-电脑 商品评价。
步骤S150,依据所述集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,对所述会话意图挖掘网络进行训练,生成训练后的会话意图挖掘网络,并基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
例如,在这个步骤中,可以使用集成模板多轮会话文本内容及其对应的会话意图信息对会话意图挖掘网络进行训练,使其能够更好地识别和理解用户的意图。然后,使用训练后的会话意图挖掘网络对目标用户在平台化项目服务中的页面内容架构进行信息优化,提高用户体验。例如,可以将训练后的会话意图挖掘网络应用于电商平台的智能客服系统,根据用户的提问和意图,为其推荐更加相关和个性化的商品和服务。
示例性的,基于会话意图属性数据对目标用户在平台化项目服务中的页面内容架构进行信息优化,可以通过以下步骤实现:
1. 确定目标用户的会话意图属性数据:这可以通过上述技术步骤得到,即通过会话意图挖掘网络对用户的会话内容进行分析,得到用户的会话意图属性数据。
2. 分析目标用户的会话内容:这包括分析用户在平台化项目服务中的操作路径、交互行为、访问频率等信息,以了解用户的兴趣和需求。
3. 设计优化策略:根据目标用户的会话意图属性数据和会话内容分析结果,设计针对性的优化策略,包括页面内容的布局、导航、推荐等。
4. 实施优化:根据设计好的优化策略,对平台化项目服务中的页面内容架构进行优化。
下面是一个详细的例子:
假设有一个电商平台,用户在这个平台上购买商品。通过会话意图挖掘网络,得到了用户的会话意图属性数据,发现用户对服装类商品比较感兴趣,并且最喜欢的品牌是品牌A。同时,通过分析用户的会话内容,发现用户经常访问品牌A的页面,但是对其他品牌的访问较少。
根据这些数据,可以设计优化策略,比如在首页推荐品牌A的最新商品,同时在商品的详情页面增加相似品牌的推荐。此外,还可以根据用户的意图属性数据,对页面内容进行个性化推荐,比如在用户浏览了某个商品后,为他推荐相关的产品。
在实施了这些优化策略后,用户在平台上的体验得到了提升,同时也提高了转化率。
再例如,如果运营的是一个电商平台,用户在与客服的交谈中经常询问iPhone 12的相关问题,比如“iPhone 12的颜色有哪些?”、“iPhone 12支持5G网络吗?”等。这些都是会话意图属性数据,表示用户对iPhone 12的颜色和网络支持情况感兴趣。
那么,可以根据这些信息优化页面内容架构。比如,可以在商品详情页的显眼位置增加iPhone 12支持的颜色选项,并明确标注其支持5G网络。这样,当用户查看iPhone 12的详细信息时,就能快速找到他们关心的信息,从而提高用户体验,也可能提高购买转化率。同时,对于一些频繁被问及但平台上还未明确给出的问题,也可以通过优化页面内容架构来解答,减少客服的负担。比如,如果很多用户都在询问“iPhone 12的保修期是多长?”但平台上并未明确标注,那么就应该在商品详情页增加关于保修期的信息。
此外,还可以根据会话意图属性数据进行个性化推荐。比如,如果一个用户经常询问关于运动鞋的问题,那么就可以推测他可能对运动鞋有购买需求,因此可以在他的首页推荐一些热销或新上市的运动鞋,提高购买转化率。
再例如,假设有一个在线教育平台,用户在这个平台上学习课程。通过会话意图挖掘网络,得到了用户的会话意图属性数据,发现用户对计算机科学领域的课程比较感兴趣,并且最喜欢的讲师是斯坦福大学的李飞飞教授。同时,通过分析用户的会话内容,发现用户经常观看李飞飞教授的视频教程,但是对其他讲师的访问较少。根据这些数据,可以设计优化策略,比如在首页推荐李飞飞教授的最新课程,同时在课程详情页面增加相似讲师的推荐。此外,还可以根据用户的意图属性数据,对页面内容进行个性化推荐,比如在用户学习了某个课程后,为他推荐相关的学习资源。在实施了这些优化策略后,用户在平台上的学习体验得到了提升,同时也提高了用户满意度和留存率。
基于以上步骤,本申请实施例通过获取第一训练会话文本序列和第二训练会话文本序列,利用模糊预测网络生成无监督多轮会话文本内容对应的模糊预测意图,并基于有监督多轮会话文本内容、标注会话意图、无监督多轮会话文本内容以及模糊预测意图生成参考训练会话文本序列,进一步对两个模板多轮会话文本内容进行混合平均,生成集成模板多轮会话文本内容和对应的会话意图信息,最后依据这些信息对会话意图挖掘网络进行训练并进行页面内容架构的信息优化。由此,有效地利用了有监督和无监督的会话文本内容,通过深度学习方法,即模糊预测网络,能够生成表征无监督多轮会话文本内容对应的会话意图属性的模糊预测意图。在获得有监督和无监督的会话意图信息后,再通过混合平均的方式,生成用于训练会话意图挖掘网络的集成模板多轮会话文本内容和对应的会话意图信息。此外,经过训练的会话意图挖掘网络可以被用于优化平台化项目服务中的页面内容架构,使其更加符合用户的需求和意图,从而提高用户体验,降低客服负担,提升运营效率。
在一种可能的实施方式中,步骤S120可以包括:
步骤S121,利用k种样本扩充策略分别对所述无监督多轮会话文本内容进行样本扩充,生成k个样本扩充后的无监督多轮会话文本内容,k为大于1的整数。
例如,可以使用以下几种样本扩充策略中的一种或多种:
1、随机插入:在无监督多轮会话文本内容中随机插入一些单词或短语。
2、随机交换:在无监督多轮会话文本内容中随机交换两个单词或短语的位置。
3、随机删除:在无监督多轮会话文本内容中随机删除一些单词或短语。
4、回译:将无监督多轮会话文本内容翻译成另一种语言,然后再翻译回原来的语言。
通过这些样本扩充策略,可以生成多个不同的样本扩充后的无监督多轮会话文本内容,从而提高网络的泛化能力。
步骤S122,利用所述模糊预测网络,生成所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,所述会话意图置信度分布是指所述样本扩充后的无监督多轮会话文本内容属于各个会话意图属性的置信度。
例如可以将样本扩充后的无监督多轮会话文本内容输入模糊预测网络,得到它属于各个会话意图属性的概率分布,该概率分布就是会话意图置信度分布。
步骤S123,基于所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,确定所述无监督多轮会话文本内容对应的模糊预测意图。
例如,可以计算k个会话意图置信度分布的平均值,作为无监督多轮会话文本内容对应的模糊预测意图。也可以使用其它集成学习方法,如投票、加权平均等,来确定最终的模糊预测意图。
基于以上步骤,可以充分利用样本扩充后的无监督多轮会话文本内容的信息,提高模糊预测意图的准确性。同时,由于采用了多个样本扩充策略,也可以有效地减少过拟合现象,提高网络的泛化能力。
在一种可能的实施方式中,步骤S123可以包括:
步骤S1231,计算所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布的平均置信度分布。
步骤S1232,对所述平均置信度分布进行高频分量增强处理,将处理结果作为所述无监督多轮会话文本内容对应的模糊预测意图。
例如,可以计算所有扩充后的无监督多轮会话文本内容的会话意图置信度分布的平均值,得到一个平均置信度分布。这个平均置信度分布可以反映整个无监督多轮会话文本内容的会话意图分布情况。
然后,对平均置信度分布进行高频分量增强处理,以提高模型的预测精度。例如,可以将平均置信度分布中最高的几个分量的值加倍,以增强这些分量的影响力。由此,可以将处理后的平均置信度分布作为无监督多轮会话文本内容对应的模糊预测意图。例如,可以将处理后的平均置信度分布作为一个概率分布,从中采样得到一个最可能的预测意图。
通过以上步骤,可以自动识别用户在客服平台上的咨询意图,并为用户提供更好的服务体验。
基于以上实施例,在一种可能的实施方式中,所述参考训练会话文本序列中的模板多轮会话文本内容包括:所述有监督多轮会话文本内容,所述有监督多轮会话文本内容对应的会话意图信息为所述有监督多轮会话文本内容对应的标注会话意图。所述样本扩充后的无监督多轮会话文本内容,所述样本扩充后的无监督多轮会话文本内容对应的会话意图信息为所述无监督多轮会话文本内容对应的模糊预测意图。
示例性的,在生成参考训练会话文本序列的过程中,将有监督多轮会话文本内容和无监督多轮会话文本内容都作为模板多轮会话文本内容纳入其中。对于有监督多轮会话文本内容,其对应的会话意图信息就是之前标注的会话意图。例如,如果在一个电商平台上,用户询问了关于某个商品的详细信息,客服提供了详细的回答,这就构成了一个有监督多轮会话文本内容,其对应的会话意图可能被标注为“询问商品详情”。
另一方面,无监督多轮会话文本内容则没有明确的会话意图标签。但是,在的方法中,通过对无监督多轮会话文本内容进行样本扩充和模糊预测网络的处理,可以得到每个无监督多轮会话文本内容对应的模糊预测意图。例如,用户在社交媒体平台上发表了一篇关于某款手机的评论,这就构成了一个无监督多轮会话文本内容。虽然这段评论没有明确的会话意图标签,但是通过的模糊预测网络,可以预测出这段评论可能对应的意图,如“对手机性能的评价”。
因此,参考训练会话文本序列中的模板多轮会话文本内容包括有监督多轮会话文本内容和无监督多轮会话文本内容,它们分别对应的会话意图信息为标注会话意图和模糊预测意图。这样的设计使得可以同时利用有监督数据和无监督数据进行训练,提高了会话意图挖掘网络的泛化能力和准确性。
在一种可能的实施方式中,步骤S140可以包括:
步骤S141,将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容与第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容与第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容。
步骤S142,将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容对应的会话意图信息与所述第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容对应的会话意图信息与所述第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容对应的会话意图信息。
在这个步骤中,从参考训练会话文本序列中选定两个模板多轮会话文本内容。假设其中一个模板多轮会话文本内容是用户在电商平台询问商品详情的对话内容,对应的会话意图标注为“询问商品详情”。另一个模板多轮会话文本内容则可能是用户在社交媒体平台上发布的关于某款手机性能评价的评论内容,其通过模糊预测网络得到的模糊预测意图为“评价手机性能”。
然后,使用两个文本主题权重来对这两个模板多轮会话文本内容进行融合。具体来说,第一个模板多轮会话文本内容与第一文本主题权重进行融合,第二个模板多轮会话文本内容与第二文本主题权重进行融合,然后将两个融合结果相加,生成集成模板多轮会话文本内容。这种方式实际上是对两个模板多轮会话文本内容进行了一种加权平均操作,生成了一个包含两者信息的新的模板多轮会话文本内容。
同样地,也对这两个模板多轮会话文本内容对应的会话意图信息进行融合。第一个模板多轮会话文本内容对应的会话意图信息与第一文本主题权重进行融合,第二个模板多轮会话文本内容对应的会话意图信息与第二文本主题权重进行融合,然后将两个融合结果相加,生成集成模板多轮会话文本内容对应的会话意图信息。这样就得到了一个包含两者会话意图信息的新的会话意图信息。
通过这种方式,可以充分利用不同模板多轮会话文本内容以及它们对应的会话意图信息,使得生成的集成模板多轮会话文本内容和对应的会话意图信息更加全面和准确。
在一种可能的实施方式中,所述会话意图挖掘网络包括:语义表示单元、上下文自相关处理单元和全连接输出单元。
步骤S150可以包括:
步骤S151,依据所述语义表示单元获取所述集成模板多轮会话文本内容的语义表示向量数据。
本实施例中,所述语义表示单元是将输入的集成模板多轮会话文本内容转换为数学表达形式(即语义表示向量数据)的模块。
然后,语义表示单元会将这个集成模板多轮会话文本中的每个词转换为数学表达形式,即语义表示向量数据。具体实现方式可以采用词嵌入(Word Embedding)或预训练语义会话意图挖掘网络(如BERT)等。例如,
假设有一个集成模板多轮会话文本内容,其中包含了两轮对话:
用户:你好,我想要点一份披萨。
客服:您好,您想要什么口味的披萨?
用户:我想要奶酪披萨。
对于这个会话文本内容,可以使用词嵌入技术(如Word2Vec或GloVe)将每个词表示为一个向量。例如,将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”分别表示为向量[x1, x2, x3]、[y1, y2, y3]、[z1, z2, z3]、[a1, a2, a3]、[b1, b2, b3]和[c1,c2, c3],这些向量就是该会话文本内容的语义表示向量数据。
在实际应用中,语义表示向量数据可以用来训练机器学习会话意图挖掘网络,如分类器或聚类器等,以提取用户意图、情感等有价值的信息。例如,在这个例子中,可以通过训练分类器来预测用户想要什么口味的披萨,或者通过聚类算法来发现用户喜欢的披萨类型。
步骤S152,依据所述上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格。
例如,上下文自相关处理单元的作用是提取出文本中的句法结构和语义结构特征,并将这些特征表示为特征关系网格。特征关系网格是一种将文本中的不同成分(如词、短语、句子等)之间的语义或句法关系表示为图的结构的表示方法。在特征关系网格中,每个节点表示一个成分,每条边表示两个成分之间的关系。
具体来说,第一特征关系网格是指句法结构的特征关系网格,它反映了文本中成分之间的句法关系,如主谓关系、动宾关系等。第二特征关系网格是指语义结构的特征关系网格,它反映了文本中成分之间的语义关系,如语义角色、语义等价等。
举个例子,还是考虑上面那个集成模板多轮会话文本内容:
用户:你好,我想要点一份披萨。
客服:您好,您想要什么口味的披萨?
用户:我想要奶酪披萨。
对于这个会话文本内容,可以使用句法分析器和语义分析器来提取出句法结构和语义结构特征,并将它们表示为特征关系网格。例如,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”表示为节点,然后将它们之间的句法关系(如主谓关系、动宾关系等)表示为边,得到第一特征关系网格。同时,也可以将句子中的语义角色(如主题、谓语、宾语等)表示为节点之间的关系,得到第二特征关系网格。
通过构建特征关系网格,可以更好地理解文本中的语义和句法结构,并将这些结构信息融入到会话意图挖掘中,从而提高会话意图挖掘网络的准确性和效率。
步骤S153,对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果。
例如,具体来说,可以使用词嵌入技术(如Word2Vec或GloVe)将每个成员表示为一个向量。例如,在上面的例子中,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”分别表示为向量[x1, x2, x3]、[y1, y2, y3]、[z1, z2, z3]、[a1, a2, a3]、[b1, b2,b3]和[c1, c2, c3],这些向量就是这些成员的分块知识表示结果。
对于第一特征关系网格,可以将每个成员表示为一个向量,然后将这些向量连接起来,得到一个更大的向量,表示整个网格的语义信息。例如,在上面的例子中,可以将[x1,x2, x3]、[y1, y2, y3]、[z1, z2, z3]、[a1, a2, a3]、[b1, b2, b3]和[c1, c2, c3]连接起来,得到一个长度为18的向量,表示整个第一特征关系网格的语义信息。
对于第二特征关系网格,也可以将每个成员表示为一个向量,然后将这些向量连接起来,得到一个更大的向量,表示整个网格的语义信息。例如,在上面的例子中,可以将[x1, x2, x3]、[y1, y2, y3]、[z1, z2, z3]、[a1, a2, a3]、[b1, b2, b3]和[c1, c2,c3]连接起来,得到一个长度为18的向量,表示整个第二特征关系网格的语义信息。
通过将每个成员表示为一个向量,可以将第一特征关系网格和第二特征关系网格的语义信息转化为数字形式,从而更好地理解文本中的语义和句法结构,并将这些结构信息融入到会话意图挖掘中,从而提高会话意图挖掘网络的准确性和效率。
步骤S154,对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量。
例如,可以使用线性转换或非线性转换等方法将每个分块知识表示结果转换为一个向量。例如,可以使用线性转换将每个分块知识表示结果转换为一个长度为3的向量,即[x, y, z],其中x、y、z是分块知识表示结果中每个元素的加权平均值。
对于第一特征关系网格,可以将其中的每个分块知识表示结果进行规则化知识表示,得到第一知识表示矢量。例如,在上面的例子中,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”的分块知识表示结果分别转换为一个长度为3的向量,得到第一知识表示矢量。
对于第二特征关系网格,也可以将其中的每个分块知识表示结果进行规则化知识表示,得到第二知识表示矢量。例如,在上面的例子中,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”的分块知识表示结果分别转换为一个长度为3的向量,得到第二知识表示矢量。
通过将分块知识表示结果转换为向量,可以将第一特征关系网格和第二特征关系网格的语义信息转化为数字形式,从而更好地理解文本中的语义和句法结构,并将这些结构信息融入到会话意图挖掘中,从而提高会话意图挖掘网络的准确性和效率。
步骤S155,利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量。
例如,注意力机制是一种在机器学习中常用的机制,它可以让在处理大量信息时,只关注其中与当前任务最相关的部分,从而提高会话意图挖掘网络的性能和效率。
具体来说,可以使用点积注意力机制或加性注意力机制等方法对第一知识表示矢量和第二知识表示矢量进行处理。例如,可以使用点积注意力机制对第一知识表示矢量和第二知识表示矢量进行处理,计算每个矢量的权重,并将权重与对应的矢量相乘,得到第一关注矢量和第二关注矢量。
对于第一知识表示矢量,可以将其中的每个分量与第二知识表示矢量中的每个分量进行点积运算,计算它们之间的相似度,并将相似度作为每个分量的权重。然后,可以将每个分量的权重与对应的分量相乘,得到第一关注矢量。例如,在上面的例子中,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”的第一知识表示矢量中的每个分量与第二知识表示矢量中的每个分量进行点积运算,计算它们之间的相似度,并将相似度作为每个分量的权重。然后,可以将每个分量的权重与对应的分量相乘,得到第一关注矢量。
对于第二知识表示矢量,也可以将其中的每个分量与第一知识表示矢量中的每个分量进行点积运算,计算它们之间的相似度,并将相似度作为每个分量的权重。然后,可以将每个分量的权重与对应的分量相乘,得到第二关注矢量。例如,在上面的例子中,可以将“你好”、“我想要”、“点”、“一份”、“披萨”和“奶酪披萨”的第二知识表示矢量中的每个分量与第一知识表示矢量中的每个分量进行点积运算,计算它们之间的相似度,并将相似度作为每个分量的权重。然后,可以将每个分量的权重与对应的分量相乘,得到第二关注矢量。
通过使用注意力机制对第一知识表示矢量和第二知识表示矢量进行处理,可以聚焦于与当前任务最相关的部分,从而提高会话意图挖掘网络的性能和效率。
步骤S156,基于所述第一关注矢量和所述第二关注矢量,生成集成特征关系网格。
步骤S157,将所述语义表示向量数据与所述集成特征关系网格进行融合,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性。
例如,使用第一关注矢量和第二关注矢量来生成集成特征关系网格,然后将语义表示向量数据与集成特征关系网格进行融合,生成上下文自相关处理后的语义表示向量数据。这样做的目的是为了增强语义表示向量数据之间的上下文语义关联性,从而提高会话意图挖掘网络的性能和效率。
具体来说,可以使用加权平均或拼接等方法将第一关注矢量和第二关注矢量融合为一个集成特征关系网格。例如,可以使用加权平均方法将第一关注矢量和第二关注矢量融合为一个集成特征关系网格,其中第一关注矢量的权重为0.5,第二关注矢量的权重为0.5。这样得到的集成特征关系网格可以综合考虑第一特征关系网格和第二特征关系网格的信息,从而更好地表示文本的语义信息。
然后,可以将语义表示向量数据与集成特征关系网格进行融合,生成上下文自相关处理后的语义表示向量数据。例如,可以将语义表示向量数据与集成特征关系网格进行点积运算或加权平均运算等操作,将集成特征关系网格的信息融入到语义表示向量数据中,从而增强语义表示向量数据之间的上下文语义关联性。这样得到的上下文自相关处理后的语义表示向量数据可以更好地反映文本的语义信息,从而提高会话意图挖掘网络的性能和效率。
步骤S158,依据所述全连接输出单元基于所述上下文自相关处理后的语义表示向量数据,生成所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果。
例如,可以将被输入的语义表示向量数据输入到一个全连接神经网络中,该全连接神经网络包括多个全连接层和一个输出层。每个全连接层都使用权重矩阵将输入数据转换为一个新的向量,并将该向量传递到下一个全连接层。在输出层,使用softmax激活函数将输出向量转换为每个类别的概率分布,该分布表示了集成模板多轮会话文本内容对应的会话意图属性在各个类别之间的概率。选择具有最高概率的类别作为训练识别结果。
该神经网络的输出层使用softmax激活函数将输出向量转换为每个类别的概率分布。最终,选择具有最高概率的类别作为训练识别结果,例如“订餐”。这样,就成功地识别了该集成模板多轮会话文本内容的会话意图属性。
步骤S159,基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和所述集成模板多轮会话文本内容对应的会话意图信息,确定所述会话意图挖掘网络的训练Loss参数。
例如,训练Loss参数是一种用于衡量会话意图挖掘网络的预测结果与真实结果之间的差距的参数。通过不断调整Loss参数,可以优化会话意图挖掘网络的预测效果。
具体来说,可以使用交叉熵损失函数(Cross-entropy loss)来计算Loss参数。交叉熵损失函数是一种常用的损失函数,用于衡量两个概率分布之间的差距。在会话意图挖掘任务中,将集成模板多轮会话文本内容对应的会话意图属性的训练识别结果视为会话意图挖掘网络预测的结果,将集成模板多轮会话文本内容对应的会话意图信息视为真实的会话意图信息。这样,就可以使用交叉熵损失函数来计算会话意图挖掘网络的预测结果与真实结果之间的差距,并将该差距作为训练Loss参数。
步骤S1510,基于所述训练Loss参数,对所述会话意图挖掘网络进行训练,生成所述训练后的会话意图挖掘网络。
在一种可能的实施方式中,步骤S159可以包括:
步骤S1591,针对符合第一匹配规则的集成模板多轮会话文本内容,利用第一Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第一训练Loss参数。其中,所述第一匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容中,存在至少一个模板多轮会话文本内容为所述有监督多轮会话文本内容。
步骤S1592,针对符合第二匹配规则的集成模板多轮会话文本内容,利用第二Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第二训练Loss参数。其中,所述第二匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容均不是所述有监督多轮会话文本内容。
步骤S1593,基于所述第一训练Loss参数和所述第二训练Loss参数,确定所述会话意图挖掘网络的训练Loss参数。
示例性的,本实施例核心在于计算训练Loss参数,也就是评估会话意图挖掘网络在训练过程中的表现。训练Loss参数用于衡量会话意图挖掘网络预测结果和真实值之间的差距,这个参数越小,表示会话意图挖掘网络的预测效果越好。
首先,对于符合第一匹配规则的集成模板多轮会话文本内容,使用第一Loss公式来计算第一训练Loss参数。第一匹配规则是指生成集成模板多轮会话文本内容的两个模板多轮会话文本内容中,存在至少一个为有监督多轮会话文本内容。有监督多轮会话文本内容是指已经有了标注信息的对话文本。例如,可以使用交叉熵损失函数作为第一Loss公式,它能够度量会话意图挖掘网络预测的会话意图属性的概率分布与真实的会话意图信息之间的差异。
然后,对于符合第二匹配规则的集成模板多轮会话文本内容,使用第二Loss公式来计算第二训练Loss参数。第二匹配规则是指生成集成模板多轮会话文本内容的两个模板多轮会话文本内容都不是有监督多轮会话文本内容。对于这类无监督的数据,可能需要使用不同的Loss公式,例如,可以使用自编码器的重构损失来度量会话意图挖掘网络预测结果与输入数据的差异。
最后,根据第一训练Loss参数和第二训练Loss参数,可以确定会话意图挖掘网络的训练Loss参数。具体的方式可能是将这两个Loss参数进行加权平均,权重可以根据数据分布或者实验效果进行调整。
总结来说,这个步骤就是通过计算会话意图挖掘网络在有监督数据和无监督数据上的表现,来确定会话意图挖掘网络的训练Loss参数,从而优化会话意图挖掘网络的性能。
示例性的,在具体的计算过程中,对于第一训练Loss参数,如果选择交叉熵损失函数作为第一Loss公式,其形式可以表示为:
第一训练Loss = -1/N Σ(y_i * log(p(y_i)) + (1-y_i) * log(1-p(y_i)))
其中,N是样本数量,y_i代表真实的会话意图属性,p(y_i)则代表会话意图挖掘网络预测出的会话意图属性的概率。这个公式用于衡量会话意图挖掘网络预测的概率分布和真实的会话意图信息之间的差异。
对于第二训练Loss参数,如果选择自编码器的重构损失作为第二Loss公式,其形式可以表示为:
第二训练Loss = 1/N Σ||x_i - f(x_i)||^2
其中,N是样本数量,x_i是输入的集成模板多轮会话文本内容,f(x_i)则是会话意图挖掘网络预测出的结果。这个公式用于度量会话意图挖掘网络预测结果与输入数据的差异。
最后,将第一训练Loss参数和第二训练Loss参数进行加权平均,就得到了会话意图挖掘网络的训练Loss参数,公式如下:
总训练Loss = w1*第一训练Loss + w2*第二训练Loss
其中,w1和w2是权重,可以根据数据分布或者实验效果进行调整。这样得到的总训练Loss就能够同时考虑有监督学习和无监督学习的性能,从而更全面地评估会话意图挖掘网络的表现。
在一种可能的实施方式中,步骤S110可以包括:
步骤S111,获取至少一个会话用户的对话监控数据,所述会话用户的对话监控数据包括由所述至少一个文本内容采集单元在多个会话节点对所述会话用户进行对话文本提取到的数据。
步骤S112,基于对话游走单位的单位长度和共享参数,利用所述对话游走单位从所述会话用户的对话监控数据中,提取到多个模板多轮会话文本内容。
步骤S113,基于第一比例参数,将所述多个模板多轮会话文本内容分为所述有监督多轮会话文本内容和所述无监督多轮会话文本内容。
步骤S114,获取各个所述有监督多轮会话文本内容分别对应的标注会话意图,生成所述第一训练会话文本序列。
步骤S115,基于各个所述无监督多轮会话文本内容,生成所述第二训练会话文本序列。
首先,需要从至少一个会话用户的对话监控数据中提取信息。会话用户的对话监控数据可能来自多种场景,比如客服系统、社交媒体平台等,由文本内容采集单元在多个会话节点对用户进行对话文本提取。
然后,根据对话游走单位的单位长度和共享参数,可以从用户的对话监控数据中提取到多个模板多轮会话文本内容。这一过程类似于对原始对话数据进行预处理,将其转换为符合特定格式的模板多轮会话文本内容。
接下来,需要将这些模板多轮会话文本内容分为有监督多轮会话文本内容和无监督多轮会话文本内容。这一步的关键是第一比例参数,它决定了有监督和无监督内容的比例。例如,如果第一比例参数为0.7,那么70%的模板多轮会话文本内容将被视为有监督内容,而剩余的30%将被视为无监督内容。
之后,需要获取每个有监督多轮会话文本内容对应的标注会话意图。这些标注信息可能来源于专业的数据标注人员或者用户自己提供的反馈。然后,将有监督多轮会话文本内容和对应的标注会话意图一起,生成第一训练会话文本序列。
最后,直接使用无监督多轮会话文本内容生成第二训练会话文本序列。因为这部分内容没有对应的标注会话意图,所以在训练过程中,模型需要依靠自我学习的方式来理解其中的意图信息。
这样,就获取到了用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,从而可以开始对会话意图挖掘网络进行训练。
在一种可能的实施方式中,所述基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化的步骤,包括:
步骤A110,获取目标会话用户的会话文本数据,所述会话文本数据包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容。
步骤A120,通过会话意图挖掘网络的语义表示单元,获取所述会话文本数据的语义表示向量数据。
步骤A130,依据所述会话意图挖掘网络的上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格。
步骤A140,对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果。
步骤A150,对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量。
步骤A160,利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量。
步骤A170,基于所述第一关注矢量和所述第二关注矢量,确定集成特征关系网格。将所述语义表示向量数据与所述集成特征关系网格相乘,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性。
步骤A180,依据所述会话意图挖掘网络的全连接输出单元,基于所述上下文自相关处理后的语义表示向量数据,生成所述会话文本数据对应的会话意图属性数据,并基于所述会话意图属性数据对所述目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
本实施例的部分为基于前述实施例的具体应用部分,涉及到相关步骤的部分可以参见前述实施例的相应描述即可。
图2示意性地示出了可被用于实现本申请中所述的各个实施例的基于AI和可视化的平台化项目服务信息优化系统100。
对于一个实施例,图2示出了基于AI和可视化的平台化项目服务信息优化系统100,该基于AI和可视化的平台化项目服务信息优化系统100具有多个处理器102、被耦合到(多个)处理器102中的一个或多个的控制模块(芯片组)104、被耦合到控制模块104的存储器106、被耦合到控制模块104的非易失性存储器(NVM)/存储设备108、被耦合到控制模块104的多个输入/输出设备110,和被耦合到控制模块104的网络接口112。
处理器102可包括多个单核或多核处理器,处理器102可包括通用处理器或专用处理器(例如图形处理器、应用处理器、基频处理器等)的任意组合。一些可替代的实施方式中,基于AI和可视化的平台化项目服务信息优化系统100能够作为本申请实施例中所述网关等服务器设备。
一些可替代的实施方式中,基于AI和可视化的平台化项目服务信息优化系统100可包括具有指令114的多个计算机可读介质(例如,存储器106或NVM/存储设备108)和与该多个计算机可读介质相合并被配置为执行指令114以实现模块从而执行本公开中所述的动作的多个处理器102。
对于一个实施例,控制模块104可包括任意适当的接口控制器,以向(多个)处理器102中的一个或多个和/或与控制模块104通信的任意适当的设备或组件提供任意适当的接口。
控制模块104可包括存储器控制器模块,以向存储器106提供接口。存储器控制器模块可以是硬件模块、软件模块和/或固件模块。
存储器106可被用于例如为基于AI和可视化的平台化项目服务信息优化系统100加载和存储数据和/或指令114。对于一个实施例,存储器106可包括任意适当的易失性存储器,例如,适当的DRAM。一些可替代的实施方式中,存储器106可包括双倍数据速率类型四同步动态随机存取存储器。
对于一个实施例,控制模块104可包括多个输入/输出控制器,以向NVM/存储设备108及(多个)输入/输出设备110提供接口。
例如,NVM/存储设备108可被用于存储数据和/或指令114。NVM/存储设备108可包括任意适当的非易失性存储器(例如,闪存)和/或可包括任意适当的(多个)非易失性存储设备。
NVM/存储设备108可包括在物理上作为基于AI和可视化的平台化项目服务信息优化系统100被安装在其上的设备的一部分的存储资源,或者其可被该设备访问可不必作为该设备的一部分。例如,NVM/存储设备108可结合网络经由(多个)输入/输出设备110进行访问。
(多个)输入/输出设备110可为基于AI和可视化的平台化项目服务信息优化系统100提供接口以与任意其它适当的设备通信。网络接口112可为基于AI和可视化的平台化项目服务信息优化系统100提供接口以依据多个网络通信,基于AI和可视化的平台化项目服务信息优化系统100可依据多个无线网络标准和/或协议中的任意标准和/或协议来与无线网络的多个组件进行无线通信,例如接入依据通信标准的无线网络,如WiFi、2G、3G、4G、5G等,或它们的组合进行无线通信。
对于一个实施例,(多个)处理器102中的一个或多个可与控制模块104的多个控制器(例如,存储器控制器模块)的逻辑封装在一起。对于一个实施例,(多个)处理器102中的一个或多个可与控制模块104的多个控制器的逻辑封装在一起以形成系统级封装。对于一个实施例,(多个)处理器102中的一个或多个可与控制模块104的多个控制器的逻辑集成在同一模具上。对于一个实施例,(多个)处理器102中的一个或多个可与控制模块104的多个控制器的逻辑集成在同一模具上以形成片上系统。
在各个实施例中,基于AI和可视化的平台化项目服务信息优化系统100可以但不限于是:台式计算设备或移动计算设备(例如,膝上型计算设备、手持计算设备、平板电脑、上网本等)等终端设备。在各个实施例中,基于AI和可视化的平台化项目服务信息优化系统100可具有更多或更少的组件和/或不同的架构。例如,一些可替代的实施方式中,基于AI和可视化的平台化项目服务信息优化系统100包括多个摄像机、键盘、液晶显示器屏幕(包括触屏显示器)、非易失性存储器端口、多个天线、图形芯片、专用集成电路和扬声器。
以上对本申请进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (10)
1.一种基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述方法包括:
获取用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,所述第一训练会话文本序列中包括至少一个平台化项目服务的有监督多轮会话文本内容以及各个所述有监督多轮会话文本内容分别对应的标注会话意图,所述标注会话意图表征所述有监督多轮会话文本内容对应的会话意图属性,所述第二训练会话文本序列中包括不携带会话意图属性的至少一个无监督多轮会话文本内容,每个模板多轮会话文本内容包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容;
利用模糊预测网络生成所述无监督多轮会话文本内容对应的模糊预测意图,所述模糊预测网络是生成表征所述无监督多轮会话文本内容对应的会话意图属性的所述模糊预测意图的深度学习网络;
基于所述有监督多轮会话文本内容、所述有监督多轮会话文本内容对应的标注会话意图、所述无监督多轮会话文本内容以及所述无监督多轮会话文本内容对应的模糊预测意图,生成参考训练会话文本序列;
从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息;
依据所述集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,对所述会话意图挖掘网络进行训练,生成训练后的会话意图挖掘网络,并基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
2.根据权利要求1所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述利用模糊预测网络生成所述无监督多轮会话文本内容对应的模糊预测意图,包括:
利用k种样本扩充策略分别对所述无监督多轮会话文本内容进行样本扩充,生成k个样本扩充后的无监督多轮会话文本内容,k为大于1的整数;
利用所述模糊预测网络,生成所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,所述会话意图置信度分布是指所述样本扩充后的无监督多轮会话文本内容属于各个会话意图属性的置信度;
基于所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,确定所述无监督多轮会话文本内容对应的模糊预测意图。
3.根据权利要求2所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述基于所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布,确定所述无监督多轮会话文本内容对应的模糊预测意图,包括:
计算所述k个样本扩充后的无监督多轮会话文本内容分别对应的会话意图置信度分布的平均置信度分布;
对所述平均置信度分布进行高频分量增强处理,将处理结果作为所述无监督多轮会话文本内容对应的模糊预测意图。
4.根据权利要求2所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述参考训练会话文本序列中的模板多轮会话文本内容包括:所述有监督多轮会话文本内容,所述有监督多轮会话文本内容对应的会话意图信息为所述有监督多轮会话文本内容对应的标注会话意图;所述样本扩充后的无监督多轮会话文本内容,所述样本扩充后的无监督多轮会话文本内容对应的会话意图信息为所述无监督多轮会话文本内容对应的模糊预测意图。
5.根据权利要求1所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述从所述参考训练会话文本序列中任意确定出两个模板多轮会话文本内容,对所述两个模板多轮会话文本内容以及所述两个模板多轮会话文本内容分别对应的会话意图信息进行混合平均,生成集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,包括:
将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容与第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容与第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容;
将所述两个模板多轮会话文本内容中的一个模板多轮会话文本内容对应的会话意图信息与所述第一文本主题权重的融合结果,加上另一个模板多轮会话文本内容对应的会话意图信息与所述第二文本主题权重的融合结果,生成所述集成模板多轮会话文本内容对应的会话意图信息。
6.根据权利要求1所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述会话意图挖掘网络包括:语义表示单元、上下文自相关处理单元和全连接输出单元; 所述依据所述集成模板多轮会话文本内容以及所述集成模板多轮会话文本内容对应的会话意图信息,对所述会话意图挖掘网络进行训练,生成训练后的会话意图挖掘网络,包括:
依据所述语义表示单元获取所述集成模板多轮会话文本内容的语义表示向量数据;
依据所述上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格;
对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果;
对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量;
利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量;
基于所述第一关注矢量和所述第二关注矢量,生成集成特征关系网格;
将所述语义表示向量数据与所述集成特征关系网格进行融合,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性;
依据所述全连接输出单元基于所述上下文自相关处理后的语义表示向量数据,生成所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果;
基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和所述集成模板多轮会话文本内容对应的会话意图信息,确定所述会话意图挖掘网络的训练Loss参数;
基于所述训练Loss参数,对所述会话意图挖掘网络进行训练,生成所述训练后的会话意图挖掘网络。
7.根据权利要求6所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和所述集成模板多轮会话文本内容对应的会话意图信息,确定所述会话意图挖掘网络的训练Loss参数,包括:
针对符合第一匹配规则的集成模板多轮会话文本内容,利用第一Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第一训练Loss参数;其中,所述第一匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容中,存在至少一个模板多轮会话文本内容为所述有监督多轮会话文本内容;
针对符合第二匹配规则的集成模板多轮会话文本内容,利用第二Loss公式基于所述集成模板多轮会话文本内容对应的会话意图属性的训练识别结果和会话意图信息,确定第二训练Loss参数;其中,所述第二匹配规则包括生成所述集成模板多轮会话文本内容的两个模板多轮会话文本内容均不是所述有监督多轮会话文本内容;
基于所述第一训练Loss参数和所述第二训练Loss参数,确定所述会话意图挖掘网络的训练Loss参数。
8.根据权利要求1所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述获取用于对会话意图挖掘网络进行参数学习的第一训练会话文本序列和第二训练会话文本序列,包括:
获取至少一个会话用户的对话监控数据,所述会话用户的对话监控数据包括由所述至少一个文本内容采集单元在多个会话节点对所述会话用户进行对话文本提取到的数据;
基于对话游走单位的单位长度和共享参数,利用所述对话游走单位从所述会话用户的对话监控数据中,提取到多个模板多轮会话文本内容;
基于第一比例参数,将所述多个模板多轮会话文本内容分为所述有监督多轮会话文本内容和所述无监督多轮会话文本内容;
获取各个所述有监督多轮会话文本内容分别对应的标注会话意图,生成所述第一训练会话文本序列;
基于各个所述无监督多轮会话文本内容,生成所述第二训练会话文本序列。
9.根据权利要求6所述的基于AI和可视化的平台化项目服务信息优化方法,其特征在于,所述基于所述训练后的会话意图挖掘网络对目标用户在所述平台化项目服务中的页面内容架构进行信息优化的步骤,包括:
获取目标会话用户的会话文本数据,所述会话文本数据包括由至少一个文本内容采集单元在至少一个会话节点采集到的会话文本内容;
通过会话意图挖掘网络的语义表示单元,获取所述会话文本数据的语义表示向量数据;
依据所述会话意图挖掘网络的上下文自相关处理单元,基于所述语义表示向量数据,确定第一特征关系网格和第二特征关系网格,所述第一特征关系网格是指句法结构的特征关系网格,所述第二特征关系网格是指语义结构的特征关系网格;
对所述第一特征关系网格和所述第二特征关系网格中的每个网格成员分块进行分块知识表示,生成所述第一特征关系网格对应的分块知识表示结果,以及所述第二特征关系网格对应的分块知识表示结果;
对所述第一特征关系网格对应的分块知识表示结果和所述第二特征关系网格对应的分块知识表示结果分别进行规则化知识表示,生成第一知识表示矢量和第二知识表示矢量;
利用注意力机制对所述第一知识表示矢量和所述第二知识表示矢量分别进行处理,生成第一关注矢量和第二关注矢量;
基于所述第一关注矢量和所述第二关注矢量,确定集成特征关系网格; 将所述语义表示向量数据与所述集成特征关系网格相乘,生成所述上下文自相关处理后的语义表示向量数据,所述上下文自相关处理用于增强所述语义表示向量数据之间的上下文语义关联性;
依据所述会话意图挖掘网络的全连接输出单元,基于所述上下文自相关处理后的语义表示向量数据,生成所述会话文本数据对应的会话意图属性数据,并基于所述会话意图属性数据对所述目标用户在所述平台化项目服务中的页面内容架构进行信息优化。
10.一种基于AI和可视化的平台化项目服务信息优化系统,其特征在于,所述基于AI和可视化的平台化项目服务信息优化系统包括处理器和机器可读存储介质,该机器可读存储介质中存储有机器可执行指令,该机器可执行指令由该处理器加载并执行以实现权利要求1-9中任意一项所述的基于AI和可视化的平台化项目服务信息优化方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410034713.3A CN117556025B (zh) | 2024-01-10 | 2024-01-10 | 基于ai和可视化的平台化项目服务信息优化方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410034713.3A CN117556025B (zh) | 2024-01-10 | 2024-01-10 | 基于ai和可视化的平台化项目服务信息优化方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117556025A CN117556025A (zh) | 2024-02-13 |
CN117556025B true CN117556025B (zh) | 2024-04-02 |
Family
ID=89820827
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410034713.3A Active CN117556025B (zh) | 2024-01-10 | 2024-01-10 | 基于ai和可视化的平台化项目服务信息优化方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117556025B (zh) |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639175A (zh) * | 2020-05-29 | 2020-09-08 | 电子科技大学 | 一种自监督的对话文本摘要方法及系统 |
CN112417864A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 基于门控拷贝和掩码的多轮对话省略恢复方法 |
CN112905772A (zh) * | 2021-02-10 | 2021-06-04 | 网易有道信息技术(北京)有限公司 | 语义相关性分析方法、装置及相关产品 |
CN113553860A (zh) * | 2021-06-10 | 2021-10-26 | 合肥工业大学 | 基于多任务学习的回复多样性多轮对话生成方法和系统 |
CN113672726A (zh) * | 2021-07-20 | 2021-11-19 | 贵州电网有限责任公司 | 一种基于重采样的多轮对话分类方法 |
CN114722837A (zh) * | 2022-03-29 | 2022-07-08 | 上海销氪信息科技有限公司 | 一种多轮对话意图识别方法、装置及计算机可读存储介质 |
CN115392264A (zh) * | 2022-10-31 | 2022-11-25 | 康佳集团股份有限公司 | 一种基于rasa的任务型智能多轮对话方法及相关设备 |
CN116029309A (zh) * | 2022-12-30 | 2023-04-28 | 中通天鸿(北京)通信科技股份有限公司 | 一种意图自动识别方法和系统 |
CN117150395A (zh) * | 2023-08-21 | 2023-12-01 | 中国电信股份有限公司 | 模型训练、意图识别方法、装置、电子设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9690776B2 (en) * | 2014-12-01 | 2017-06-27 | Microsoft Technology Licensing, Llc | Contextual language understanding for multi-turn language tasks |
US20180293221A1 (en) * | 2017-02-14 | 2018-10-11 | Microsoft Technology Licensing, Llc | Speech parsing with intelligent assistant |
US10497366B2 (en) * | 2018-03-23 | 2019-12-03 | Servicenow, Inc. | Hybrid learning system for natural language understanding |
US11948058B2 (en) * | 2018-12-11 | 2024-04-02 | Adobe Inc. | Utilizing recurrent neural networks to recognize and extract open intent from text inputs |
-
2024
- 2024-01-10 CN CN202410034713.3A patent/CN117556025B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111639175A (zh) * | 2020-05-29 | 2020-09-08 | 电子科技大学 | 一种自监督的对话文本摘要方法及系统 |
CN112417864A (zh) * | 2020-11-29 | 2021-02-26 | 中国科学院电子学研究所苏州研究院 | 基于门控拷贝和掩码的多轮对话省略恢复方法 |
CN112905772A (zh) * | 2021-02-10 | 2021-06-04 | 网易有道信息技术(北京)有限公司 | 语义相关性分析方法、装置及相关产品 |
CN113553860A (zh) * | 2021-06-10 | 2021-10-26 | 合肥工业大学 | 基于多任务学习的回复多样性多轮对话生成方法和系统 |
CN113672726A (zh) * | 2021-07-20 | 2021-11-19 | 贵州电网有限责任公司 | 一种基于重采样的多轮对话分类方法 |
CN114722837A (zh) * | 2022-03-29 | 2022-07-08 | 上海销氪信息科技有限公司 | 一种多轮对话意图识别方法、装置及计算机可读存储介质 |
CN115392264A (zh) * | 2022-10-31 | 2022-11-25 | 康佳集团股份有限公司 | 一种基于rasa的任务型智能多轮对话方法及相关设备 |
CN116029309A (zh) * | 2022-12-30 | 2023-04-28 | 中通天鸿(北京)通信科技股份有限公司 | 一种意图自动识别方法和系统 |
CN117150395A (zh) * | 2023-08-21 | 2023-12-01 | 中国电信股份有限公司 | 模型训练、意图识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
"基于对话模型的聊天机器人结构研究";刘阳阳 等;《计算机应用》;20230131;第13-16页 * |
Jiao Liu 等."Review of Intent Detection Methods in the Human-Machine Dialogue System".《2019 3rd International Conference on Artificial Intelligence, Automation and Control Technologies (AIACT 2019)》.第1-11页. * |
Also Published As
Publication number | Publication date |
---|---|
CN117556025A (zh) | 2024-02-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Li et al. | Image sentiment prediction based on textual descriptions with adjective noun pairs | |
Cai et al. | A deep recommendation model of cross-grained sentiments of user reviews and ratings | |
CN112541122A (zh) | 推荐模型的训练方法、装置、电子设备及存储介质 | |
CN108230009B (zh) | 一种用户偏好的预测方法及装置,电子设备 | |
CN111949887B (zh) | 物品推荐方法、装置及计算机可读存储介质 | |
CN113946754A (zh) | 基于用户画像的权益推荐方法、装置、设备及存储介质 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
Tayal et al. | Personalized ranking of products using aspect-based sentiment analysis and Plithogenic sets | |
CN115114974A (zh) | 一种模型蒸馏方法、装置、计算机设备和存储介质 | |
CN107545075A (zh) | 一种基于在线评论和情境感知的餐馆推荐方法 | |
Ouyang | Personalized combination recommendation of short video online learning resources | |
CN117556025B (zh) | 基于ai和可视化的平台化项目服务信息优化方法及系统 | |
CN110020195B (zh) | 文章推荐方法及装置、存储介质、电子设备 | |
Shibghatullah et al. | Deploying Support Vector Machines and Rule-Based Algorithms for Enhanced User Training in Cloud ERP: A Natural Language Processing Approach | |
Liu | Simulation of E-learning in English personalized learning recommendation system based on Markov chain algorithm and adaptive learning algorithm | |
Ramadhanti et al. | Determining customer relationship management strategy with customer personality analysis using ontology model approach | |
Martina et al. | A virtual assistant for the movie domain exploiting natural language preference elicitation strategies | |
Wu et al. | Question-aware dynamic scene graph of local semantic representation learning for visual question answering | |
CN114912009A (zh) | 用户画像的生成方法、装置、电子设备和计算机程序介质 | |
Hu et al. | GeoEntity-type constrained knowledge graph embedding for predicting natural-language spatial relations | |
Kumar | A Machine Learning-based Automated Approach for Mining Customer Opinion | |
CN111915339A (zh) | 数据的处理方法、装置及设备 | |
CN118332194B (zh) | 一种跨领域冷启动推荐方法、装置、设备及存储介质 | |
CN118350894A (zh) | 商品推荐方法、装置及电子设备 | |
US20230341998A1 (en) | Automated processing and dynamic filtering of content for display |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |