CN116362260A - 基于大数据平台的在线会话处理方法、系统及程序产品 - Google Patents
基于大数据平台的在线会话处理方法、系统及程序产品 Download PDFInfo
- Publication number
- CN116362260A CN116362260A CN202310361786.9A CN202310361786A CN116362260A CN 116362260 A CN116362260 A CN 116362260A CN 202310361786 A CN202310361786 A CN 202310361786A CN 116362260 A CN116362260 A CN 116362260A
- Authority
- CN
- China
- Prior art keywords
- text
- target
- conversation
- session
- online
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 23
- 230000008451 emotion Effects 0.000 claims abstract description 191
- 238000004458 analytical method Methods 0.000 claims abstract description 111
- 239000013598 vector Substances 0.000 claims abstract description 37
- 230000008447 perception Effects 0.000 claims abstract description 25
- 238000000034 method Methods 0.000 claims abstract description 17
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 230000004927 fusion Effects 0.000 claims description 81
- 230000005012 migration Effects 0.000 claims description 40
- 238000013508 migration Methods 0.000 claims description 40
- 238000004590 computer program Methods 0.000 claims description 18
- 238000013507 mapping Methods 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 11
- 230000014759 maintenance of location Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 7
- 238000005516 engineering process Methods 0.000 abstract description 5
- 238000013461 design Methods 0.000 description 18
- 238000004891 communication Methods 0.000 description 9
- 238000012545 processing Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种基于大数据平台的在线会话处理方法、系统及程序产品,可以依据目标会话文本情感分析网络的特征选择和注意力感知部分来提取候选会话文本特征的整体和局部文本语义信息,比较于相关技术中仅全局语义信息提取可以解析出更具备有区分性的语义信息,这样即使会话文本段在语义向量编码流程中存在细节信息遗漏,也能够尽可能保留具备情感分析意义的语义向量,由此可以提高会话文本情感分析精确度,进而提高后续页面会话过程中的智能化程度。
Description
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种基于大数据平台的在线会话处理方法、系统及程序产品。
背景技术
随着大数据平台技术和AI技术的迭代发展,会话文本情感分析技术已被广泛应用在会话文本情感分析任务中,以对大量的会话文本信息进行意见挖掘、倾向性分析等操作。
然而,在相关技术中,会话文本情感分析方案一般是通过神经网络模型进行全局语义信息提取并进行情感标签分类实现,但是发明人经过仔细研究发现,该方案可能会忽略局部会话文本段的细节特征,导致一部分具备情感分析意义的语义向量丢失,从而难以保证会话文本情感分析精确度,也进一步影响后续页面会话过程中的智能化程度。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于大数据平台的在线会话处理方法、系统及程序产品。
第一方面,本申请提供一种基于大数据平台的在线会话处理方法,应用于大数据在线平台系统,所述方法包括:
搜集用于会话文本情感分析学习的目标待学习在线会话文本序列;所述目标待学习在线会话文本序列包括基础待学习在线会话文本序列以及所述基础待学习在线会话文本序列对应的扩展待学习在线会话文本序列,所述扩展待学习在线会话文本序列是对所述基础待学习在线会话文本序列进行文本词编码向量扩展更新生成的;
基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络;所述会话文本情感分析网络包括特征选择单元、目标注意力感知单元以及文本情感标签分类单元;
分析所述更新后的会话文本情感分析网络是否满足学习终止条件,在满足学习终止条件时,将所述更新后的会话文本情感分析网络确定为目标会话文本情感分析网络;所述目标会话文本情感分析网络用于对目标用户在大数据在线平台中的在线会话文本进行会话文本情感分析,生成对应的会话文本情感分析结果;
基于所述会话文本情感分析结果向所述目标用户所对应的在线会话页面推送对应的页面会话反馈数据。
在第一方面的一种可能的实施方式中,所述基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络,包括:
基于网络权重参数初始化的会话文本情感分析网络的特征选择单元以及所述特征选择单元的第一特征选择函数信息,对所述目标待学习在线会话文本序列中的每个目标待学习在线会话文本进行特征选择,获得每个所述目标待学习在线会话文本对应的文本结构选择特征;所述特征选择单元的第一特征选择函数信息包括局部感知野参数和/或权值共享参数,其中,所述局部感知野参数被配置于感知所述目标待学习在线会话文本中的局部文本结构特征向量,所述权值共享参数被配置于感知所述目标待学习在线会话文本中的局部共享特征向量;
基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段;
基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。
在第一方面的一种可能的实施方式中,所述目标注意力感知单元包括多个整体注意力感知单元;
其中,所述基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段,包括:
针对每个所述整体注意力感知单元,基于各所述目标待学习在线会话文本对应的文本结构选择特征,确定所述整体注意力感知单元对应的各候选会话文本特征,并基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段;
确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数;
当所述当前注意力感知次数小于门限次数时,将所述当前注意力感知次数增加1次,以及将各所述候选会话文本特征对应的标的显著会话文本段确定为下一个整体注意力感知单元所对应的各候选会话文本特征,并执行所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,以及确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数的操作;所述整体注意力感知单元为所述下一个整体注意力感知单元;
当所述当前注意力感知次数不小于门限次数时,将各所述候选会话文本特征对应的标的显著会话文本段确定为各所述目标待学习在线会话文本对应的目标显著会话文本段。
在第一方面的一种可能的实施方式中,每个所述整体注意力感知单元均包括对应的整体注意力语义编码子单元以及对应的整体注意力语义融合子单元;
其中,所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,包括:
基于所述整体注意力感知单元对应的整体注意力语义编码子单元以及网络权重参数初始化的所述整体注意力语义编码子单元的第二特征选择函数信息,对每个所述候选会话文本特征进行注意力语义特征编码,获得每个所述候选会话文本特征对应的中间显著会话文本段;所述整体注意力语义编码子单元的第二特征选择函数信息包括注意力局部感知野参数和/或注意力权值共享参数;
基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段;
对每个所述候选会话文本特征对应的中间显著会话文本段以及对应的语义融合显著文本段进行汇聚,获得各所述候选会话文本特征对应的标的显著会话文本段。
在第一方面的一种可能的实施方式中,所述基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段,包括:
将各所述候选会话文本特征加载到所述整体注意力感知单元对应的整体注意力语义融合子单元,以使所述整体注意力语义融合子单元的每一语义融合层进行下述步骤:
针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征,并对每个所述迁移会话文本特征中的各文本语句关键词执行进行关键词位置置乱,获得每个所述迁移会话文本特征对应的各置乱后文本语句关键词;所述候选会话文本特征以及每个所述迁移会话文本特征均包括对应的多个文本语句关键词,且每个所述迁移会话文本特征中的各所述文本语句关键词均与所述候选会话文本特征中的各所述文本语句关键词相匹配;
针对每个所述候选会话文本特征的各所述迁移会话文本特征,提取所述迁移会话文本特征对应的每个所述置乱后文本语句关键词的前后文语义向量信息,并基于每个所述置乱后文本语句关键词的前后文语义向量信息,对各所述置乱后文本语句关键词进行关键词置乱还原,获得所述迁移会话文本特征对应的各还原文本语句关键词;每个所述置乱后文本语句关键词的前后文语义向量信息包括该置乱后文本语句关键词与在所述迁移会话文本特征中的任一其它置乱后文本语句关键词之间的前后文语义关系信息;
针对每个所述候选会话文本特征,基于预置的所述候选会话文本特征中的每个所述文本语句关键词的第一词向量信息、其对应的每个所述迁移会话文本特征中的每个所述还原文本语句关键词的第二词向量信息、所述候选会话文本特征的第一词语义影响系数以及其对应的每个所述迁移会话文本特征的第二词语义影响系数,对所述候选会话文本特征中的每个所述文本语句关键词进行融合,获得所述候选会话文本特征的各语义融合文本语句关键词;
针对每个所述候选会话文本特征,基于所述候选会话文本特征中的每个所述语义融合文本语句关键词对应的前后文语义向量信息,对每个所述语义融合文本语句关键词进行注意力语义融合,获得所述候选会话文本特征的各目标融合文本语句关键词,并基于所述候选会话文本特征的各所述目标融合文本语句关键词,确定所述候选会话文本特征对应的候选语义融合显著文本段;
在得到各所述候选会话文本特征对应的候选语义融合显著文本段之后,判断是否存在下一个语义融合层;
当存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为所述下一个语义融合层对应的各候选会话文本特征以及将对应的各候选会话文本特征加载到所述下一个语义融合层,并执行所述针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征的操作;
当不存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为各所述候选会话文本特征对应的语义融合显著文本段。
在第一方面的一种可能的实施方式中,所述基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度,包括:
针对每个所述目标待学习在线会话文本对应的目标显著会话文本段,基于所述会话文本情感分析网络的文本情感标签分类单元,对所述目标显著会话文本段中的每个会话文本语句单元进行文本情感标签置信度映射,获得所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,并基于所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,确定所述目标显著会话文本段的目标情感标签映射置信度;
对得到的每个所述目标待学习在线会话文本对应的目标显著会话文本段的目标情感标签映射置信度执行规则化输出,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。
在第一方面的一种可能的实施方式中,所述目标待学习在线会话文本中的各所述目标待学习在线会话文本包括所述基础待学习在线会话文本序列中的各基础待学习在线会话文本以及所述扩展待学习在线会话文本序列中的各扩展待学习在线会话文本;
其中,所述分析所述更新后的会话文本情感分析网络是否满足学习终止条件,包括:
基于每个所述基础待学习在线会话文本的目标文本情感分类置信度、每个所述扩展待学习在线会话文本的目标文本情感分类置信度、每个所述基础待学习在线会话文本的第一先验文本情感标注信息以及每个所述扩展待学习在线会话文本的第二先验文本情感标注信息,计算所述更新后的会话文本情感分析网络的目标Loss值,并分析所述目标Loss值是否不大于设定Loss值;
当所述目标Loss值不大于设定Loss值时,确定所述更新后的会话文本情感分析网络满足学习终止条件。
第二方面,本申请实施例还提供一种大数据在线平台系统,所述大数据在线平台系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序结合该处理器加载并执行以实现以上第一方面的基于大数据平台的在线会话处理方法。
第三方面,本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于被处理器执行时,以实现以上第一方面的基于大数据平台的在线会话处理方法。
第四方面,本申请实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,以实现以上第一方面的基于大数据平台的在线会话处理方法。
本申请实施例至少具有以下有益效果:
本申请实施例能够基于目标待学习在线会话文本序列对会话文本情感分析网络进行网络权重参数更新,在更新后的会话文本情感分析网络满足学习终止条件时,将更新后的会话文本情感分析网络确定为目标会话文本情感分析网络,由此可以依据目标会话文本情感分析网络的特征选择和注意力感知部分来提取候选会话文本特征的整体和局部文本语义信息,比较于相关技术中仅全局语义信息提取可以解析出更具备有区分性的语义信息,这样即使会话文本段在语义向量编码流程中存在细节信息遗漏,也能够尽可能保留具备情感分析意义的语义向量,由此可以提高会话文本情感分析精确度,进而提高后续页面会话过程中的智能化程度。
附图说明
图1为本申请实施例提供的基于大数据平台的在线会话处理方法的流程示意图。
具体实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
步骤S101、搜集用于会话文本情感分析学习的目标待学习在线会话文本序列。
一种示例性的设计思路中,目标待学习在线会话文本序列可以包括基础待学习在线会话文本序列以及基础待学习在线会话文本序列对应的扩展待学习在线会话文本序列,其中,扩展待学习在线会话文本序列是对基础待学习在线会话文本序列进行文本词编码向量扩展更新生成的。示例性地,基础待学习在线会话文本序列可以理解为基础收集的在线会话文本样本序列,而扩展待学习在线会话文本序列可以理解为对基础收集的在线会话文本样本序列进行扩展处理后(如口语化术语转换等)所得到的在线会话文本样本序列。
其中,在线会话文本可以是指用户在各类在线服务(如在线电商服务、在线医疗服务、在线工业服务、在线金融服务等)的大数据在线平台中发起各种会话(如咨询会话、协同会话等)的文本互动数据。
步骤S102、基于目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络。
一种示例性的设计思路中,会话文本情感分析网络可以包括特征选择单元、目标注意力感知单元以及文本情感标签分类单元。该特征选择单元用于对每个目标待学习在线会话文本进行特征选择,从而可以通过特定特征选择获得每个所述目标待学习在线会话文本对应的文本结构选择特征,文本结构选择特征可以理解为对每个目标待学习在线会话文本进行文本结构拆分后选择的文本语句特征,从而能够关注每个目标待学习在线会话文本中的局部文本结构单元信息,该目标注意力感知单元用于提取及融合每个目标待学习在线会话文本对应的显著会话文本段,从而能够关注每个目标待学习在线会话文本中的局部重要性文本语义信息,而该文本情感标签分类单元用于确定每个目标待学习在线会话文本所属的文本情感标签置信度。
其中,文本情感标签分类可以是指对目标待学习在线会话文本中句子的情感进行识别与分类,比如“生气”、“悲伤”、“快乐” 等等文本情感标签,在实际实施过程中,可以基于每种文本情感标签及其强度值来实现文本情感标签分类。
步骤S103、判断更新后的会话文本情感分析网络是否满足学习终止条件,在满足学习终止条件时,则将更新后的会话文本情感分析网络确定为目标会话文本情感分析网络;所述目标会话文本情感分析网络用于对目标用户在大数据在线平台中的在线会话文本进行会话文本情感分析,生成对应的会话文本情感分析结果。
一种示例性的设计思路中,该目标会话文本情感分析网络可应用于会话文本情感分析任务中。其中,该方法还可以包括:当判断出更新后的会话文本情感分析网络不满足网络收敛条件时,对更新后的会话文本情感分析网络进行网络权重参数更新,获得迭代的会话文本情感分析网络,并重复执行上述步骤S102中的基于目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络,以及上述步骤S103中的判断更新后的会话文本情感分析网络是否满足学习终止条件的操作。其中,针对更新后的会话文本情感分析网络的网络权重参数的更新可以调整其学习率、迭代次数等等。
步骤S104,基于所述会话文本情感分析结果向所述目标用户所对应的在线会话页面推送对应的页面会话反馈数据。
例如,可以获取所述会话文本情感分析结果中文本情感标签及其强度值满足预设要求的目标会话语句,并对所述目标会话语句进行主题摘要生成,从而基于生成的主题摘要确定对应的会话应答语句,并基于所述目标会话语句的文本情感标签所对应的预置应答风格,对所述会话应答语句进行应答风格转换,获得转换应答风格后的目标会话应答语句,由此将所述目标会话应答语句作为所述页面会话反馈数据向所述目标用户所对应的在线会话页面进行推送。
基于以上步骤,本实施例能够基于目标待学习在线会话文本序列对会话文本情感分析网络进行网络权重参数更新,在更新后的会话文本情感分析网络满足学习终止条件时,将更新后的会话文本情感分析网络确定为目标会话文本情感分析网络,由此可以依据目标会话文本情感分析网络的特征选择和注意力感知部分来提取候选会话文本特征的整体和局部文本语义信息,比较于相关技术中仅全局语义信息提取可以解析出更具备有区分性的语义信息,这样即使会话文本段在语义向量编码流程中存在细节信息遗漏,也能够尽可能保留具备情感分析意义的语义向量,由此可以提高会话文本情感分析精确度,进而提高后续页面会话过程中的智能化程度。
下面介绍本申请实施例提供的另一种基于大数据平台的在线会话处理方法,可以包括以下步骤:
步骤S201、搜集用于会话文本情感分析学习的目标待学习在线会话文本序列。
步骤S202、基于网络权重参数初始化的会话文本情感分析网络的特征选择单元以及特征选择单元的第一特征选择函数信息,对目标待学习在线会话文本序列中的每个目标待学习在线会话文本进行特征选择,获得每个目标待学习在线会话文本对应的文本结构选择特征。
一种示例性的设计思路中,该特征选择单元的第一特征选择函数信息包括局部感知野参数和/或权值共享参数,其中,所述局部感知野参数被配置于感知所述目标待学习在线会话文本中的局部文本结构特征向量,所述权值共享参数被配置于感知所述目标待学习在线会话文本中的局部共享特征向量。
步骤S203、通过会话文本情感分析网络的目标注意力感知单元,对每个目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各目标待学习在线会话文本对应的目标显著会话文本段。
一种示例性的设计思路中,该目标注意力感知单元可由M个整体注意力感知单元构成,其中,每个整体注意力感知单元可由对应的整体注意力语义编码子单元以及对应的整体注意力语义融合子单元构成。
步骤S204、通过会话文本情感分析网络的文本情感标签分类单元,对每个目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各目标待学习在线会话文本的目标文本情感分类置信度。
一种示例性的设计思路中,每个目标待学习在线会话文本的目标文本情感分类置信度可以理解为该目标待学习在线会话文本所对应的某一情感分类标签的预测置信度。
步骤S205、判断更新后的会话文本情感分析网络是否满足学习终止条件,在满足学习终止条件时,则将更新后的会话文本情感分析网络确定为目标会话文本情感分析网络。
一种示例性的设计思路中,针对步骤步骤S201、步骤步骤S205的其它描述,可以参照前述实施例针对步骤S101、步骤S103的详细描述。
基于以上步骤,通过特征选择单元、目标注意力感知单元以及文本情感标签分类单元对目标待学习在线会话文本的网络处理,来完成对会话文本情感分析网络的网络权重参数更新,可以提高对会话文本情感分析网络的网络权重参数更新过程中的可靠性和有效性;同时,通过对目标注意力感知单元的构建,也实现了依据目标会话文本情感分析网络的特征选择和注意力感知部分来提取候选会话文本特征的整体和局部文本语义信息,比较于相关技术中仅全局语义信息提取可以解析出更具备有区分性的语义信息,这样即使会话文本段在语义向量编码流程中存在细节信息遗漏,也能够尽可能保留具备情感分析意义的语义向量,由此可以提高会话文本情感分析精确度。
在一种示例性的设计思路中,上述步骤步骤S203中的通过会话文本情感分析网络的目标注意力感知单元,对每个目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各目标待学习在线会话文本对应的目标显著会话文本段,包括:
针对每个整体注意力感知单元,基于各目标待学习在线会话文本对应的文本结构选择特征,确定整体注意力感知单元对应的各候选会话文本特征,并通过整体注意力感知单元,对各候选会话文本特征进行显著特征提取,获得各候选会话文本特征对应的标的显著会话文本段;确定各目标待学习在线会话文本对应的当前注意力感知次数,并判断当前注意力感知次数是否不小于门限次数;当小于门限次数时,将当前注意力感知次数增加1次,以及将各候选会话文本特征对应的标的显著会话文本段确定为下一个整体注意力感知单元所对应的各候选会话文本特征,并触发执行的通过整体注意力感知单元,对各候选会话文本特征进行显著特征提取,获得各候选会话文本特征对应的标的显著会话文本段,以及确定各目标待学习在线会话文本对应的当前注意力感知次数,并判断当前注意力感知次数是否不小于门限次数的操作;当不小于门限次数时,将各候选会话文本特征对应的标的显著会话文本段确定为各目标待学习在线会话文本对应的目标显著会话文本段。在该示例性的设计思路中,所触发执行流程中该整体注意力感知单元为下一个整体注意力感知单元。其中,目标注意力感知单元包括多个整体注意力感知单元,且各个整体注意力感知单元之间的构建顺序是以显著文本段提取的顺序作为依据的。
其中,每个整体注意力感知单元均包括对应的注意力局部感知野参数和/或注意力权值共享参数。
在另一种示例性的设计思路中,上述步骤中的通过整体注意力感知单元,对各候选会话文本特征进行显著特征提取,获得各候选会话文本特征对应的标的显著会话文本段,包括:通过整体注意力感知单元对应的整体注意力语义编码子单元以及网络权重参数初始化的整体注意力语义编码子单元的第二特征选择函数信息,对每个候选会话文本特征进行注意力语义特征编码,获得每个候选会话文本特征对应的中间显著会话文本段;通过整体注意力感知单元对应的整体注意力语义融合子单元,对每个候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个候选会话文本特征对应的语义融合显著文本段;对每个候选会话文本特征对应的中间显著会话文本段以及对应的语义融合显著文本段进行汇聚,获得各候选会话文本特征对应的标的显著会话文本段。
在另一种示例性的设计思路中,上述步骤中的通过整体注意力感知单元对应的整体注意力语义融合子单元,对每个候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个候选会话文本特征对应的语义融合显著文本段,包括:将各候选会话文本特征加载到整体注意力感知单元对应的整体注意力语义融合子单元,以使整体注意力语义融合子单元的每一语义融合层进行下述步骤:针对每个候选会话文本特征,对候选会话文本特征进行文本保留迁移,获得候选会话文本特征对应的多个迁移会话文本特征,并对每个迁移会话文本特征中的各文本语句关键词执行进行关键词位置置乱,获得每个迁移会话文本特征对应的各置乱后文本语句关键词;针对每个候选会话文本特征的每一迁移会话文本特征,提取迁移会话文本特征对应的每个置乱后文本语句关键词的前后文语义向量信息,并基于每个置乱后文本语句关键词的前后文语义向量信息,对各置乱后文本语句关键词进行关键词置乱还原,获得迁移会话文本特征对应的各还原文本语句关键词;针对每个候选会话文本特征,基于预置的候选会话文本特征中的每个文本语句关键词的第一词向量信息、其对应的每个迁移会话文本特征中的每个还原文本语句关键词的第二词向量信息、候选会话文本特征的第一词语义影响系数以及其对应的每个迁移会话文本特征的第二词语义影响系数,对候选会话文本特征中的每个文本语句关键词进行融合,获得候选会话文本特征的各语义融合文本语句关键词;针对每个候选会话文本特征,基于候选会话文本特征中的每个语义融合文本语句关键词对应的前后文语义向量信息,对每个语义融合文本语句关键词进行注意力语义融合,获得候选会话文本特征的各目标融合文本语句关键词,并基于候选会话文本特征的各目标融合文本语句关键词,确定候选会话文本特征对应的候选语义融合显著文本段;在得到各候选会话文本特征对应的候选语义融合显著文本段之后,判断是否存在下一个语义融合层;当存在下一个语义融合层时,将各候选会话文本特征对应的候选语义融合显著文本段确定为下一个语义融合层对应的各候选会话文本特征以及将对应的各候选会话文本特征加载到下一个语义融合层,并触发执行的针对每个候选会话文本特征,对候选会话文本特征进行文本保留迁移,获得候选会话文本特征对应的多个迁移会话文本特征的操作;当不存在下一个语义融合层时,将各候选会话文本特征对应的候选语义融合显著文本段确定为各候选会话文本特征对应的语义融合显著文本段。
其中,候选会话文本特征以及每个迁移会话文本特征均包括对应的多个文本语句关键词,且每个迁移会话文本特征中的各文本语句关键词均与候选会话文本特征中的各文本语句关键词相匹配。再其中,每个置乱后文本语句关键词的前后文语义向量信息包括该置乱后文本语句关键词与在迁移会话文本特征中的任一其它置乱后文本语句关键词之间的前后文语义关系信息。示例性地,每个语义融合层中均可包括k个分支。
在另一种示例性的设计思路中,上述步骤步骤S204中的通过会话文本情感分析网络的文本情感标签分类单元,对每个目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各目标待学习在线会话文本的目标文本情感分类置信度,包括:针对每个目标待学习在线会话文本对应的目标显著会话文本段,通过会话文本情感分析网络的文本情感标签分类单元,对目标显著会话文本段中的每个会话文本语句单元进行文本情感标签置信度映射,获得目标显著会话文本段的各会话文本语句单元的情感标签映射置信度,并基于目标显著会话文本段的各会话文本语句单元的情感标签映射置信度,确定目标显著会话文本段的目标情感标签映射置信度;对得到的每个目标待学习在线会话文本对应的目标显著会话文本段的目标情感标签映射置信度执行规则化输出,获得每个目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各目标待学习在线会话文本的目标文本情感分类置信度。
在另一种示例性的设计思路中,上述步骤步骤S205中的判断更新后的会话文本情感分析网络是否满足学习终止条件,包括:基于每个基础待学习在线会话文本的目标文本情感分类置信度、每个扩展待学习在线会话文本的目标文本情感分类置信度、每个基础待学习在线会话文本的第一先验文本情感标注信息以及每个扩展待学习在线会话文本的第二先验文本情感标注信息,计算更新后的会话文本情感分析网络的目标Loss值,并判断目标Loss值是否不大于设定Loss值;当不大于设定Loss值时,确定更新后的会话文本情感分析网络满足学习终止条件。
一些设计思路中,提供了一种大数据在线平台系统,该大数据在线平台系统可以是服务器,该大数据在线平台系统包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该大数据在线平台系统的处理器用于提供计算和控制能力。该大数据在线平台系统的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该大数据在线平台系统的数据库用于存储上述方法所涉及的数据。该大数据在线平台系统的输入/输出接口用于处理器与外部设备之间交换信息。该大数据在线平台系统的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于大数据平台的在线会话处理方法。
一些设计思路中,提供了一种大数据在线平台系统,该大数据在线平台系统可以是终端。该大数据在线平台系统包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该大数据在线平台系统的处理器用于提供计算和控制能力。该大数据在线平台系统的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该大数据在线平台系统的输入/输出接口用于处理器与外部设备之间交换信息。该大数据在线平台系统的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其它技术实现。该计算机程序被处理器执行时以实现一种基于大数据平台的在线会话处理方法。该大数据在线平台系统的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该大数据在线平台系统的输入装置可以是显示屏上覆盖的触摸层,也可以是大数据在线平台系统外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
一些设计思路中,提供了一种大数据在线平台系统,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,HyperText Markup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于大数据平台的在线会话处理方法,其特征在于,应用于所述大数据在线平台系统,所述方法包括:
搜集用于会话文本情感分析学习的目标待学习在线会话文本序列;所述目标待学习在线会话文本序列包括基础待学习在线会话文本序列以及所述基础待学习在线会话文本序列对应的扩展待学习在线会话文本序列,所述扩展待学习在线会话文本序列是对所述基础待学习在线会话文本序列进行文本词编码向量扩展更新生成的;
基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络;所述会话文本情感分析网络包括特征选择单元、目标注意力感知单元以及文本情感标签分类单元;
分析所述更新后的会话文本情感分析网络是否满足学习终止条件,在满足学习终止条件时,将所述更新后的会话文本情感分析网络确定为目标会话文本情感分析网络;所述目标会话文本情感分析网络用于对目标用户在大数据在线平台中的在线会话文本进行会话文本情感分析,生成对应的会话文本情感分析结果;
基于所述会话文本情感分析结果向所述目标用户所对应的在线会话页面推送对应的页面会话反馈数据。
2.根据权利要求1所述的基于大数据平台的在线会话处理方法,其特征在于,所述基于所述目标待学习在线会话文本序列,对网络权重参数初始化的会话文本情感分析网络进行网络权重参数更新,获得更新后的会话文本情感分析网络,包括:
基于网络权重参数初始化的会话文本情感分析网络的特征选择单元以及所述特征选择单元的第一特征选择函数信息,对所述目标待学习在线会话文本序列中的每个目标待学习在线会话文本进行特征选择,获得每个所述目标待学习在线会话文本对应的文本结构选择特征;所述特征选择单元的第一特征选择函数信息包括局部感知野参数和/或权值共享参数,其中,所述局部感知野参数被配置于感知所述目标待学习在线会话文本中的局部文本结构特征向量,所述权值共享参数被配置于感知所述目标待学习在线会话文本中的局部共享特征向量;
基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段;
基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。
3.根据权利要求2所述的基于大数据平台的在线会话处理方法,其特征在于,所述目标注意力感知单元包括多个整体注意力感知单元;
其中,所述基于所述会话文本情感分析网络的目标注意力感知单元,对每个所述目标待学习在线会话文本对应的文本结构选择特征进行显著特征提取,获得各所述目标待学习在线会话文本对应的目标显著会话文本段,包括:
针对每个所述整体注意力感知单元,基于各所述目标待学习在线会话文本对应的文本结构选择特征,确定所述整体注意力感知单元对应的各候选会话文本特征,并基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段;
确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数;
当所述当前注意力感知次数小于门限次数时,将所述当前注意力感知次数增加1次,以及将各所述候选会话文本特征对应的标的显著会话文本段确定为下一个整体注意力感知单元所对应的各候选会话文本特征,并执行所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,以及确定各所述目标待学习在线会话文本对应的当前注意力感知次数,并分析所述当前注意力感知次数是否不小于门限次数的操作;所述整体注意力感知单元为所述下一个整体注意力感知单元;
当所述当前注意力感知次数不小于门限次数时,将各所述候选会话文本特征对应的标的显著会话文本段确定为各所述目标待学习在线会话文本对应的目标显著会话文本段。
4.根据权利要求3所述的基于大数据平台的在线会话处理方法,其特征在于,每个所述整体注意力感知单元均包括对应的整体注意力语义编码子单元以及对应的整体注意力语义融合子单元;
其中,所述基于所述整体注意力感知单元,对各所述候选会话文本特征进行显著特征提取,获得各所述候选会话文本特征对应的标的显著会话文本段,包括:
基于所述整体注意力感知单元对应的整体注意力语义编码子单元以及网络权重参数初始化的所述整体注意力语义编码子单元的第二特征选择函数信息,对每个所述候选会话文本特征进行注意力语义特征编码,获得每个所述候选会话文本特征对应的中间显著会话文本段;所述整体注意力语义编码子单元的第二特征选择函数信息包括注意力局部感知野参数和/或注意力权值共享参数;
基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段;
对每个所述候选会话文本特征对应的中间显著会话文本段以及对应的语义融合显著文本段进行汇聚,获得各所述候选会话文本特征对应的标的显著会话文本段。
5.根据权利要求4所述的基于大数据平台的在线会话处理方法,其特征在于,所述基于所述整体注意力感知单元对应的整体注意力语义融合子单元,对每个所述候选会话文本特征对应的中间显著会话文本段进行注意力语义融合,获得每个所述候选会话文本特征对应的语义融合显著文本段,包括:
将各所述候选会话文本特征加载到所述整体注意力感知单元对应的整体注意力语义融合子单元,以使所述整体注意力语义融合子单元的每一语义融合层进行下述步骤:
针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征,并对每个所述迁移会话文本特征中的各文本语句关键词执行进行关键词位置置乱,获得每个所述迁移会话文本特征对应的各置乱后文本语句关键词;所述候选会话文本特征以及每个所述迁移会话文本特征均包括对应的多个文本语句关键词,且每个所述迁移会话文本特征中的各所述文本语句关键词均与所述候选会话文本特征中的各所述文本语句关键词相匹配;
针对每个所述候选会话文本特征的各所述迁移会话文本特征,提取所述迁移会话文本特征对应的每个所述置乱后文本语句关键词的前后文语义向量信息,并基于每个所述置乱后文本语句关键词的前后文语义向量信息,对各所述置乱后文本语句关键词进行关键词置乱还原,获得所述迁移会话文本特征对应的各还原文本语句关键词;每个所述置乱后文本语句关键词的前后文语义向量信息包括该置乱后文本语句关键词与在所述迁移会话文本特征中的任一其它置乱后文本语句关键词之间的前后文语义关系信息;
针对每个所述候选会话文本特征,基于预置的所述候选会话文本特征中的每个所述文本语句关键词的第一词向量信息、其对应的每个所述迁移会话文本特征中的每个所述还原文本语句关键词的第二词向量信息、所述候选会话文本特征的第一词语义影响系数以及其对应的每个所述迁移会话文本特征的第二词语义影响系数,对所述候选会话文本特征中的每个所述文本语句关键词进行融合,获得所述候选会话文本特征的各语义融合文本语句关键词;
针对每个所述候选会话文本特征,基于所述候选会话文本特征中的每个所述语义融合文本语句关键词对应的前后文语义向量信息,对每个所述语义融合文本语句关键词进行注意力语义融合,获得所述候选会话文本特征的各目标融合文本语句关键词,并基于所述候选会话文本特征的各所述目标融合文本语句关键词,确定所述候选会话文本特征对应的候选语义融合显著文本段;
在得到各所述候选会话文本特征对应的候选语义融合显著文本段之后,判断是否存在下一个语义融合层;
当存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为所述下一个语义融合层对应的各候选会话文本特征以及将对应的各候选会话文本特征加载到所述下一个语义融合层,并执行所述针对每个所述候选会话文本特征,对所述候选会话文本特征进行文本保留迁移,获得所述候选会话文本特征对应的多个迁移会话文本特征的操作;
当不存在下一个语义融合层时,将各所述候选会话文本特征对应的候选语义融合显著文本段确定为各所述候选会话文本特征对应的语义融合显著文本段。
6.根据权利要求2-5中任意一项所述的基于大数据平台的在线会话处理方法,其特征在于,所述基于所述会话文本情感分析网络的文本情感标签分类单元,对每个所述目标待学习在线会话文本对应的目标显著会话文本段进行文本情感标签分类,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度,包括:
针对每个所述目标待学习在线会话文本对应的目标显著会话文本段,基于所述会话文本情感分析网络的文本情感标签分类单元,对所述目标显著会话文本段中的每个会话文本语句单元进行文本情感标签置信度映射,获得所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,并基于所述目标显著会话文本段的各所述会话文本语句单元的情感标签映射置信度,确定所述目标显著会话文本段的目标情感标签映射置信度;
对得到的每个所述目标待学习在线会话文本对应的目标显著会话文本段的目标情感标签映射置信度执行规则化输出,获得每个所述目标待学习在线会话文本对应的目标显著会话文本段的文本情感分类置信度,确定为各所述目标待学习在线会话文本的目标文本情感分类置信度。
7.根据权利要求6所述的基于大数据平台的在线会话处理方法,其特征在于,所述目标待学习在线会话文本中的各所述目标待学习在线会话文本包括所述基础待学习在线会话文本序列中的各基础待学习在线会话文本以及所述扩展待学习在线会话文本序列中的各扩展待学习在线会话文本;
其中,所述分析所述更新后的会话文本情感分析网络是否满足学习终止条件,包括:
基于每个所述基础待学习在线会话文本的目标文本情感分类置信度、每个所述扩展待学习在线会话文本的目标文本情感分类置信度、每个所述基础待学习在线会话文本的第一先验文本情感标注信息以及每个所述扩展待学习在线会话文本的第二先验文本情感标注信息,计算所述更新后的会话文本情感分析网络的目标Loss值,并分析所述目标Loss值是否不大于设定Loss值;
当所述目标Loss值不大于设定Loss值时,确定所述更新后的会话文本情感分析网络满足学习终止条件。
8.一种计算机可读存储介质,存储有计算机可执行指令,其特征在于,所述计算机可执行指令被处理器执行时,实现权利要求1-7中任意一项的基于大数据平台的在线会话处理方法。
9.一种计算机程序产品,包括计算机程序或计算机可执行指令,其特征在于,所述计算机程序或计算机可执行指令被处理器执行时,实现权利要求1-7中任意一项的基于大数据平台的在线会话处理方法。
10.一种大数据在线平台系统,其特征在于,所述大数据在线平台系统包括处理器和机器可读存储介质,该机器可读存储介质中存储有机器可执行指令,该机器可执行指令由该处理器加载并执行以实现权利要求1-7中任意一项的基于大数据平台的在线会话处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310361786.9A CN116362260A (zh) | 2023-04-07 | 2023-04-07 | 基于大数据平台的在线会话处理方法、系统及程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310361786.9A CN116362260A (zh) | 2023-04-07 | 2023-04-07 | 基于大数据平台的在线会话处理方法、系统及程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116362260A true CN116362260A (zh) | 2023-06-30 |
Family
ID=86907204
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310361786.9A Withdrawn CN116362260A (zh) | 2023-04-07 | 2023-04-07 | 基于大数据平台的在线会话处理方法、系统及程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116362260A (zh) |
-
2023
- 2023-04-07 CN CN202310361786.9A patent/CN116362260A/zh not_active Withdrawn
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108345692B (zh) | 一种自动问答方法和系统 | |
US20200184307A1 (en) | Utilizing recurrent neural networks to recognize and extract open intent from text inputs | |
US11636341B2 (en) | Processing sequential interaction data | |
JP2023539532A (ja) | テキスト分類モデルのトレーニング方法、テキスト分類方法、装置、機器、記憶媒体及びコンピュータプログラム | |
CN113011186B (zh) | 命名实体识别方法、装置、设备及计算机可读存储介质 | |
CN107391505A (zh) | 一种图像处理方法及系统 | |
CN111460290B (zh) | 信息的推荐方法、装置、设备和存储介质 | |
JP7194233B2 (ja) | オブジェクト推薦方法、ニューラルネットワークおよびそのトレーニング方法、装置ならびに媒体 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN114330966A (zh) | 一种风险预测方法、装置、设备以及可读存储介质 | |
CN111753082A (zh) | 基于评论数据的文本分类方法及装置、设备和介质 | |
CN114330704A (zh) | 语句生成模型更新方法、装置、计算机设备和存储介质 | |
Lu et al. | Chinese sentence semantic matching based on multi-level relevance extraction and aggregation for intelligent human–robot interaction | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN112749557A (zh) | 文本处理模型的构建方法和文本处理方法 | |
CN115795038B (zh) | 基于国产化深度学习框架的意图识别方法和装置 | |
CN116308551A (zh) | 基于数字金融ai平台的内容推荐方法及系统 | |
CN111382232A (zh) | 问答信息处理方法、装置及计算机设备 | |
CN116362260A (zh) | 基于大数据平台的在线会话处理方法、系统及程序产品 | |
CN115952266A (zh) | 问题生成方法、装置、计算机设备和存储介质 | |
CN114548242A (zh) | 用户标签识别方法、装置、电子设备和计算机可读存储介质 | |
CN115186085A (zh) | 回复内容处理方法以及媒体内容互动内容的交互方法 | |
CN114911940A (zh) | 文本情感识别方法及装置、电子设备、存储介质 | |
CN113901337A (zh) | 应用推荐方法、装置、设备和计算机可读存储介质 | |
CN114328894A (zh) | 文档处理方法、装置、电子设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230630 |