CN116308551A - 基于数字金融ai平台的内容推荐方法及系统 - Google Patents
基于数字金融ai平台的内容推荐方法及系统 Download PDFInfo
- Publication number
- CN116308551A CN116308551A CN202310253289.7A CN202310253289A CN116308551A CN 116308551 A CN116308551 A CN 116308551A CN 202310253289 A CN202310253289 A CN 202310253289A CN 116308551 A CN116308551 A CN 116308551A
- Authority
- CN
- China
- Prior art keywords
- text
- text data
- behavior
- learning value
- emotion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 58
- 230000008451 emotion Effects 0.000 claims abstract description 346
- 238000004458 analytical method Methods 0.000 claims abstract description 172
- 238000012549 training Methods 0.000 claims abstract description 65
- 230000002452 interceptive effect Effects 0.000 claims abstract description 14
- 239000013598 vector Substances 0.000 claims description 284
- 230000006399 behavior Effects 0.000 claims description 196
- 230000009471 action Effects 0.000 claims description 104
- 238000013210 evaluation model Methods 0.000 claims description 96
- 230000002776 aggregation Effects 0.000 claims description 77
- 238000004220 aggregation Methods 0.000 claims description 77
- 238000011156 evaluation Methods 0.000 claims description 57
- 238000013507 mapping Methods 0.000 claims description 31
- 230000004927 fusion Effects 0.000 claims description 6
- 230000003542 behavioural effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 abstract description 16
- 230000003993 interaction Effects 0.000 abstract description 4
- 238000013461 design Methods 0.000 description 27
- 238000004590 computer program Methods 0.000 description 13
- 238000012216 screening Methods 0.000 description 12
- 239000000284 extract Substances 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000009467 reduction Effects 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 6
- 238000002372 labelling Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000013515 script Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
- G06Q30/0255—Targeted advertisements based on user history
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/338—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Development Economics (AREA)
- Strategic Management (AREA)
- Databases & Information Systems (AREA)
- Finance (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Game Theory and Decision Science (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Machine Translation (AREA)
Abstract
本申请实施例提供一种基于数字金融AI平台的内容推荐方法及系统,获取待学习行为文本数据序列,并基于待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络,基于训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果,基于用户文本情感分析结果,根据用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与目标实体对象对应的推荐内容信息,将推荐内容信息发送至目标用户所对应的数字金融互动页面中,从而通过用户文本情感分析为目标用户推荐匹配其积极情感倾向的内容信息,提高文本内容互动过程中的内容匹配度。
Description
技术领域
本申请涉及AI技术领域,具体而言,涉及一种基于数字金融AI平台的内容推荐方法及系统。
背景技术
随着互联网技术和社交网络的发展,互联网在线内容服务已成为人们获取信息的主要来源,用户在互联网在线内容服务中会产生诸多的用户行为,这些用户行为中有相对大的比重是以类文本的形式进行表达的,例如文本咨询行为。
在相关技术中,在线内容推荐算法的目的是指根据用户的历史行为以及个人信息等猜测用户的喜好,向用户推荐其可能会感兴趣的内容,然而相关技术的技术方案时,缺少通过用户文本情感分析为目标用户推荐匹配其积极情感倾向的内容信息的方案,导致文本内容互动过程中的内容匹配度不高。
发明内容
为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于数字金融AI平台的内容推荐方法及系统。
第一方面,本申请提供一种基于数字金融AI平台的内容推荐方法,应用于数字金融AI平台,所述方法包括:
从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于所述待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络,所述待学习行为文本数据序列包括至少一个携带文本情感标注信息的待学习行为文本数据,所述待学习行为文本数据为所述用户文本情感分析网络在先分析的对话行为文本数据;
基于所述训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果;
基于所述用户文本情感分析结果,根据所述用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与所述目标实体对象对应的推荐内容信息,将所述推荐内容信息发送至所述目标用户所对应的数字金融互动页面中。
第二方面,本申请实施例还提供一种数字金融AI平台,所述数字金融AI平台包括处理器和机器可读存储介质,所述机器可读存储介质中存储有计算机程序,所述计算机程序结合该处理器加载并执行以实现以上第一方面的基于数字金融AI平台的内容推荐方法。
采用以上任意方面的技术方案,从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络,基于训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果,基于用户文本情感分析结果,根据用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与目标实体对象对应的推荐内容信息,将推荐内容信息发送至目标用户所对应的数字金融互动页面中,从而通过用户文本情感分析为目标用户推荐匹配其积极情感倾向的内容信息,提高文本内容互动过程中的内容匹配度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以结合这些附图获得其它相关的附图。
图1为本申请实施例提供的基于数字金融AI平台的内容推荐方法的流程示意图。
实施方式
为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。
在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。
在以下的描述中,所涉及的术语“第一\第二”仅仅是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。
除非另有定义,本申请实施例所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本申请实施例中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
请参阅图1所示,本申请实施例提供一种基于数字金融AI平台的内容推荐方法,包括下述步骤。
步骤S100,从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于所述待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络。
所述待学习行为文本数据序列包括至少一个携带文本情感标注信息(例如标注待学习行为文本数据中各个文本分段或者文本实体词序列所对应的情感倾向标签)的待学习行为文本数据,所述待学习行为文本数据可以为所述用户文本情感分析网络在先分析的对话行为文本数据。
步骤S200,基于所述训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果。
本实施例中,该用户文本情感分析结果可以包括针对所述数字金融AI平台的目标用户的用户行为文本数据中各个文本分段或者文本实体词序列所对应的情感倾向标签,例如,积极情感类型,如愉快、信任、感激、庆幸类型等;负向情感如痛苦、鄙视、仇恨、嫉妒等类型等,具体不作限定。
步骤S300,基于所述用户文本情感分析结果,根据所述用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与所述目标实体对象对应的推荐内容信息,将所述推荐内容信息发送至所述目标用户所对应的数字金融互动页面中。
例如,如果所述用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象为某个数字金融产品对象A,那么可以从当前云端互动推荐内容库中确定与所述数字金融产品对象A对应的推荐内容信息,例如所述数字金融产品对象A对应的产品属性介绍信息,从而可以将所述产品属性介绍信息发送至所述目标用户所对应的数字金融互动页面中。
基于以上步骤,本实施例从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络,基于训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果,基于用户文本情感分析结果,根据用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与目标实体对象对应的推荐内容信息,将推荐内容信息发送至目标用户所对应的数字金融互动页面中,从而通过用户文本情感分析为目标用户推荐匹配其积极情感倾向的内容信息,提高文本内容互动过程中的内容匹配度。
一种示例性的设计思路中,针对步骤S100,本申请实施例提供一种基于人工智能的用户文本情感分析方法,包括下述步骤。
步骤S101、从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,待学习行为文本数据序列包括至少一个携带文本情感标注信息的待学习行为文本数据,待学习行为文本数据为用户文本情感分析网络在先分析的对话行为文本数据。
对话行为文本数据可以是指数字金融产品注册用户进行对话行为过程(如金融产品申购咨询对话行为、金融产品合同咨询对话行为等)中产生的对话文本数据。
其中,数字金融AI平台可以直接将用户文本情感分析网络先验识别过的先验对话行为文本数据均作为用户文本情感分析网络在先分析的对话行为文本数据。或者,数字金融AI平台也可以从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的(目标数量的小于先验对话行为文本数据的总数量)的先验对话行为文本数据作为用户文本情感分析网络在先分析的对话行为文本数据。
由于当先验对话行为文本数据的文本学习价值较低时,无法判断先验对话行为文本数据的情感信息,造成先验对话行为文本数据的分析结果出现错误。因此,当数字金融AI平台从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的先验对话行为文本数据作为对话行为文本数据时,可以是从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的文本学习价值较高的先验对话行为文本数据作为对话行为文本数据。
一些示例性的设计思路中,可以是人工从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的文本学习价值较好的先验对话行为文本数据,然后将文本学习价值较好的先验对话行为文本数据作为对话行为文本数据,或者,数字金融AI平台也可以自动从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的文本学习价值较高的先验对话行为文本数据作为对话行为文本数据。
如果数字金融AI平台自动从用户文本情感分析网络先验识别过的先验对话行为文本数据中提取目标数量的文本学习价值较高的先验对话行为文本数据作为对话行为文本数据,则从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,可以包括:
获取用户文本情感分析网络在先分析的先验对话行为文本数据;
提取先验对话行为文本数据的对话主题文本段,并基于对话主题文本段确定先验对话行为文本数据对应的文本学习价值;
将符合设定条件的文本学习价值对应的先验对话行为文本数据,作为用户文本情感分析网络在先分析的对话行为文本数据。
在本实施例中,基于先验对话行为文本数据的对话主题文本段,确定先验对话行为文本数据对应的文本学习价值,然后将符合设定条件的文本学习价值对应的先验对话行为文本数据,作为用户文本情感分析网络在先分析的对话行为文本数据,实现自动筛选掉文本学习价值较低的先验对话行为文本数据,使得不但可以提高基于待学习行为文本数据序列用于训练用户文本情感分析网络的学习速度,而且可以提高筛选效率。
基于对话主题文本段确定先验对话行为文本数据对应的文本学习价值的方法,可以基于实际情况进行选择,比如,可以通过对话主题文本段确定先验对话行为文本数据的非口语文本关键词数量,然后基于非口语文本关键词数量,确定先验对话行为文本数据对应的文本学习价值。又或者,可以通过对话主题文本段,确定先验对话行为文本数据中对话主题符合度,然后基于对话主题符合度,确定先验对话行为文本数据对应的文本学习价值。又或者,也可以通过文本学习价值评估模型,基于对话主题文本段确定先验对话行为文本数据的文本学习价值。
当通过文本学习价值评估模型,基于对话主题文本段确定先验对话行为文本数据的文本学习价值时,如果只通过一个文本学习价值评估模型,基于对话主题文本段确定先验对话行为文本数据的文本学习价值,获得的文本学习价值的可靠性较低。
为了提高文本学习价值的可靠性,一些示例性的设计思路中,基于对话主题文本段确定先验对话行为文本数据对应的文本学习价值,包括:获取先验对话行为文本数据的多个文本学习价值评估模型;通过文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据的多个参考文本学习价值;基于参考文本学习价值,确定先验对话行为文本数据对应的文本学习价值。
其中,可以将多个参考文本学习价值进行权重融合,从而得到先验对话行为文本数据对应的文本学习价值。或者,也可以是,从多个参考文本学习价值中提取一个参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值。
在本实施例中,通过多个文本学习价值评估模型,获得先验对话行为文本数据的多个参考文本学习价值,然后再基于多个参考文本学习价值,确定先验对话行为文本数据的文本学习价值,从而提高先验对话行为文本数据的文本学习价值。
另一些示例性的设计思路中,先验对话行为文本数据存在多个价值评估标签,每个价值评估标签对应一个标签学习价值评估模型,即文本学习价值评估模型可以为标签学习价值评估模型,通过文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据的多个参考文本学习价值,基于参考文本学习价值,确定先验对话行为文本数据对应的文本学习价值,包括:通过标签学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据针对每个价值评估标签的参考文本学习价值;对各个参考文本学习价值进行权重融合,获得先验对话行为文本数据对应的文本学习价值。
价值评估标签可以是指影响先验对话行为文本数据的文本学习价值的因素所在的维度。价值评估标签可以基于实际情况进行选择,比如,价值评估标签可以为先验对话行为文本数据的非口语文本关键词数量、先验对话行为文本数据中对话主题的对话主题符合度、先验对话行为文本数据的对话主题的主题热度、先验对话行为文本数据的持续参与时间或先验对话行为文本数据的对话协同次数等,也即是,标签学习价值评估模型(各个标签学习价值评估模型也可以称为多专家模型)可以为非口语文本关键词数量的文本学习价值评估模型、对话主题符合度的文本学习价值评估模型、主题热度的文本学习价值评估模型、持续参与时间的文本学习价值评估模型或对话协同次数的文本学习价值评估模型等,参考文本学习价值可以为非口语文本关键词数量的文本学习价值、对话主题符合度的文本学习价值、主题热度的文本学习价值、持续参与时间的文本学习价值以及对话协同次数的文本学习价值等,本实施例在此不做限定。
权重融合可以指直接将各个参考文本学习价值进行相加,或者,权重融合也可以指将参考文本学习价值与参考文本学习价值对应的权重进行相乘,获得更新后参考文本学习价值,然后再将更新后参考文本学习价值进行相加。
在本实施例中,每个价值评估标签对应一个标签学习价值评估模型,然后通过标签学习价值评估模型,获得先验对话行为文本数据针对每个价值评估标签的参考文本学习价值,最后对各个参考文本学习价值进行权重融合,获得先验对话行为文本数据对应的文本学习价值,实现从不同价值评估标签得到文本学习价值,提高文本学习价值的可靠性。
当价值评估标签对应的标签学习价值评估模型通过训练的方式得到时,比如,当价值评估标签为先验对话行为文本数据的非口语文本关键词数量或主题热度时,价值评估标签对应的标签学习价值评估模型可以为非口语文本关键词数量文本学习价值评估模型或主题热度的文本学习价值评估模型,非口语文本关键词数量文本学习价值评估模型或主题热度的文本学习价值评估模型可以通过模型训练生成。
例如,如果通过有监督模型训练方案得到标签学习价值评估模型,则在通过标签学习价值评估模型,基于对话主题文本段确定先验对话行为文本数据对应的文本学习价值之前,还包括:
获取待更新标签学习价值评估模型的第一待学习行为文本数据序列,第一待学习行为文本数据序列包括多个第一待学习行为文本数据;提取第一待学习行为文本数据的训练对话主题文本段,并基于训练对话主题文本段,确定待更新标签学习价值评估模型的组合评估误差信息和/或独立评估误差信息;基于组合评估误差信息和/或独立评估误差信息,对待更新标签学习价值评估模型进行网络权重参数更新,获得标签学习价值评估模型。
其中,可以通过度量学习的方法基于训练对话主题文本段,确定待更新标签学习价值评估模型的组合评估误差信息。
譬如,基于训练对话主题文本段,确定待更新标签学习价值评估模型的组合评估误差信息时,基于训练对话主题文本段,确定待更新标签学习价值评估模型的组合评估误差信息的过程可以为:
从第一待学习行为文本数据对应的第一训练聚团中提取第一待学习行为文本数据对应的正待学习行为文本数据,从第二训练聚团中提取第一待学习行为文本数据对应的多个负待学习行为文本数据,第二训练聚团为第一待学习行为文本数据序列对应的训练聚团中除了第一训练聚团之外的训练聚团;基于第一待学习行为文本数据的训练对话主题文本段和正待学习行为文本数据的训练对话主题文本段,确定第一待学习行为文本数据和正待学习行为文本数据之间的第一特征代价,以及基于第一待学习行为文本数据的训练对话主题文本段和负待学习行为文本数据的训练对话主题文本段,确定第一待学习行为文本数据和负待学习行为文本数据之间的第二特征代价;基于第一特征代价和第二特征代价,确定待更新标签学习价值评估模型的组合评估误差信息。
一些示例性的设计思路中,基于训练对话主题文本段,确定待更新标签学习价值评估模型的独立评估误差信息(Anchor Loss)的过程可以为:获取第一待学习行为文本数据对应的独立文本情感标注信息,以及获取独立文本情感标注信息对应的置信度范围;基于训练对话主题文本段,确定第一待学习行为文本数据的决策置信度;基于独立文本情感标注信息、决策置信度和独立文本情感标注信息对应的置信度范围,确定待更新标签学习价值评估模型的独立评估误差信息。
为了进一步提高标签学习价值评估模型的可靠性,另一些示例性的设计思路中,基于对话主题文本段,确定待更新标签学习价值评估模型的独立评估误差信息,包括:
获取第一待学习行为文本数据对应的独立文本情感标注信息,独立文本情感标注信息表示价值评估标签的级别;基于对话主题文本段,确定第一待学习行为文本数据的决策置信度;基于独立文本情感标注信息、主题热度决策置信度以及独立文本情感标注信息对应的置信度范围,确定待更新标签学习价值评估模型的独立评估误差信息。
其中,基于独立文本情感标注信息、决策置信度以及独立文本情感标注信息对应的置信度范围,确定待更新标签学习价值评估模型的独立评估误差信息的过程可以为:基于独立文本情感标注信息和决策置信度,确定待更新独立评估误差信息;基于独立文本情感标注信息对应的置信度范围,确定独立文本情感标注信息对应的正确置信度;基于决策置信度和独立文本情感标注信息对应的正确置信度之间的差值,对待更新独立评估误差信息进行更新,获得待更新标签学习价值评估模型的独立评估误差信息。
本实施例可以基于组合评估误差信息对待更新标签学习价值评估模型进行网络权重参数更新。或者,本实施例也可以基于独立评估误差信息(Anchor Loss)对待更新标签学习价值评估模型进行网络权重参数更新。又或者,本实施例也可以同时基于组合评估误差信息和独立评估误差信息对待更新标签学习价值评估模型进行网络权重参数更新。
当基于组合评估误差信息对待更新标签学习价值评估模型进行网络权重参数更新时,由于组合评估误差信息中包含正训练数据对之间的特征代价和正训练数据与负训练数据之间的特征代价,因此,相对于基于二情感分析误差信息,对待更新标签学习价值评估模型进行网络权重参数更新,基于组合评估误差信息对待更新标签学习价值评估模型进行网络权重参数更新之后,获得的标签学习价值评估模型在进行文本学习价值评价时的效果更好。
当同时基于组合评估误差信息和独立评估误差信息对待更新标签学习价值评估模型进行网络权重参数更新时,不但可以对正训练数据对之间的特征代价和正训练数据与负训练数据之间的特征代价进行约束,而且可以对置信度范围进行约束,使得可以进一步提升标签学习价值评估模型在进行文本学习价值评价时的效果。
为了更加准确地得到文本学习价值,另一些示例性的设计思路中,先验对话行为文本数据的多个文本学习价值评估模型包括第一全局文本学习价值评估模型和第二全局文本学习价值评估模型,基于对话主题文本段确定先验对话行为文本数据对应的文本学习价值,包括:通过第一全局文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据对应的第一参考文本学习价值;通过第二全局文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据对应的第二参考文本学习价值;从第一参考文本学习价值和第二参考文本学习价值中,提取先验对话行为文本数据对应的文本学习价值。
在本实施例中,第一全局文本学习价值评估模型和第二全局文本学习价值评估模型可以同时基于先验对话行为文本数据的各个价值评估标签确定先验对话行为文本数据的第一参考文本学习价值和第二参考文本学习价值,使得第一参考文本学习价值和第二参考文本学习价值更加准确。
并且,上述价值评估标签的标签学习价值评估模型的训练方式为有监督训练,有监督训练使得待更新标签学习价值评估模型的训练受第一待学习行为文本数据的标注精度和效率影响。因此为了更加准确地得到文本学习价值,另一些示例性的设计思路中,第一全局文本学习价值评估模型和第二全局文本学习价值评估模型,可以为第一全局文本学习价值评估模型和第二全局文本学习价值评估模型。
其中,从第一参考文本学习价值和第二参考文本学习价值中,提取先验对话行为文本数据对应的文本学习价值,包括:获取设定学习价值;若第一参考文本学习价值和第二参考文本学习价值均不大于设定学习价值,则将第一参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值;若第一参考文本学习价值和第二参考文本学习价值均大于设定学习价值,则将第二参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值。
第一参考文本学习价值和第二参考文本学习价值均不大于设定学习价值,可以理解为第一参考文本学习价值和第二参考文本学习价值均小于设定学习价值,或者,也可以理解为第一参考文本学习价值和第二参考文本学习价值均等于设定学习价值,又或者,也可以理解为第一参考文本学习价值小于设定学习价值,第二参考文本学习价值等于设定学习价值,又或者,也可以理解为第一参考文本学习价值等于设定学习价值,第二参考文本学习价值小于设定学习价值。
由此,在本实施方式中,可以得到低文本学习价值的对话行为文本数据更加准确的文本学习价值的全局文本学习价值评估模型作为第一全局文本学习价值评估模型,将可以得到高文本学习价值的对话行为文本数据更加准确的文本学习价值的全局文本学习价值评估模型作为第二全局文本学习价值评估模型,然后通过第一全局文本学习价值评估模型和第二全局文本学习价值评估模型,获得不同文本学习价值的先验对话行为文本数据的参考文本学习价值,从而提高先验对话行为文本数据对应的文本学习价值的可靠性。但由于在通过第一全局文本学习价值评估模型确定先验对话行为文本数据对应的第一参考文本学习价值以及通过第二全局文本学习价值评估模型对确定先验对话行为文本数据对应的第二参考文本学习价值时,数字金融AI平台并不能确定先验对话行为文本数据的文本学习价值的高低。
基于此,本实施方式中,获取设定学习价值,如果第一参考文本学习价值和第二参考文本学习价值均不大于设定学习价值,说明该先验对话行为文本数据为低文本学习价值的对话行为文本数据,则将第一参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值,如果第一参考文本学习价值和第二参考文本学习价值均大于设定学习价值,说明该先验对话行为文本数据为高文本学习价值的对话行为文本数据,则将第二参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值,从而实现采用不同的全局文本学习价值评估模型,获得不同文本学习价值的先验对话行为文本数据的参考文本学习价值,进而提高先验对话行为文本数据对应的文本学习价值的可靠性。
应理解,本实施例中在训练第一全局文本学习价值评估模型和第二全局文本学习价值评估模型时,可以基于用户文本情感分析网络对先验对话行为文本数据进行文本情感分析,获得识别结果,然后基于识别结果和待更新第一全局文本学习价值评估模型的第一样本文本学习价值确定第一目标评估误差信息,再基于第一目标评估误差信息对待更新第一全局文本学习价值评估模型进行网络权重参数更新,获得第一全局文本学习价值评估模型。
第二全局文本学习价值评估模型的模型更新流程可以参照第一全局文本学习价值评估模型的模型更新流程,本实例在此不做限定。
另一些示例性的设计思路中,从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,包括:获取用户文本情感分析网络在先分析的对话行为文本数据;从对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,并基于待学习文本数据聚团序列对对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据;基于携带文本情感标注信息的对话行为文本数据,确定用于训练用户文本情感分析网络的待学习行为文本数据序列。
数字金融AI平台在获取到用户文本情感分析网络在先分析的对话行为文本数据之后,再对对话行为文本数据进行分团,从而得到对话行为文本数据对应的文本数据聚团,接着再从对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,以便基于待学习文本数据聚团序列对对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据,最后基于携带文本情感标注信息的对话行为文本数据,确定用于训练用户文本情感分析网络的待学习行为文本数据序列。
另一些示例性的设计思路中,从对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列的过程可以为:
从各个候选文本数据聚团中提取第一待学习文本数据聚团,然后从候选文本数据聚团中,提取第一数量个第二待学习文本数据聚团分别与第一待学习文本数据聚团序列成待学习文本数据聚团序列。
然而,通过该方法得到的待学习文本数据聚团序列数量较多,并且,标注误差会累加。为减少待学习文本数据聚团序列的数量,减少标注误差,另一些示例性的设计思路中,从对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,包括:基于对话行为文本数据对应的文本数据聚团中文本语义向量,确定对话行为文本数据对应的文本数据聚团之间的相关性参数值;基于相关性参数值,从对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列。
数字金融AI平台可以基于两个对话行为文本数据对应的文本数据聚团的中心文本语义向量计算两个对话行为文本数据对应的文本数据聚团之间的聚团关联参数值(或者,从对话行为文本数据对应的文本数据聚团中随机选取一个文本语义向量计算两个对话行为文本数据对应的文本数据聚团之间的聚团关联参数值),并基于对话行为文本数据对应的文本数据聚团中对话行为文本数据的个数(即对话行为文本数据对应的文本数据聚团对应的文本情感标注信息出现的次数)和总的对话行为文本数据的个数计算对话行为文本数据对应的文本数据聚团的聚集度,然后基于对话行为文本数据对应的文本数据聚团的聚集度和聚团关联参数值,确定对话行为文本数据对应的文本数据聚团之间的相关性参数值。
在本实施例中,在得到对话行为文本数据对应的文本数据聚团之后,基于对话行为文本数据对应的文本数据聚团中对话行为文本数据对应的文本语义向量,确定对话行为文本数据对应的文本数据聚团之间的相关性参数值,然后基于相关性参数值,从对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列,相关性参数值越大,表示两个对话行为文本数据对应的文本数据聚团相匹配的可能性越大,然后将该两个对话行为文本数据对应的文本数据聚团作为待学习文本数据聚团序列,从而减少待学习文本数据聚团序列的数量。
一些示例性的设计思路中,基于相关性参数值,从对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列,可以是提取的待学习文本数据聚团序列的相关性参数值之间的和最小,或者,也可以是提取的待学习文本数据聚团序列的相关性参数值之间的和第二小,本实施例在此不做限定。
另一些示例性的设计思路中,基于相关性参数值,从对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列,包括:
基于对话行为文本数据对应的文本数据聚团和相关性参数值构建图网络架构,图网络架构包括多个图成员和多条成员链路,每个图成员表示对话行为文本数据对应的文本数据聚团,成员链路的权重表示对话行为文本数据对应的文本数据聚团之间的相关性参数值;基于图网络架构中成员链路的权重,对图网络架构进行循环结构更新,获得不包含循环结构连接的图网络架构;从不包含循环结构连接的图网络架构中提取图成员序列,图成员序列对应待学习文本数据聚团序列。
在本实施例中,基于对话行为文本数据对应的文本数据聚团和相关性参数值构建图网络架构,图网络架构包括多个图成员和多条成员链路,每个图成员表示对话行为文本数据对应的文本数据聚团,成员链路的权重表示对话行为文本数据对应的文本数据聚团之间的相关性参数值,然后基于图网络架构中成员链路的权重,对图网络架构进行循环结构更新,获得不包含循环结构连接的图网络架构,最后从不包含循环结构连接的图网络架构中提取图成员序列,图成员序列对应待学习文本数据聚团序列,通过图网络架构的方式,基于相关性参数值,获得待学习文本数据聚团序列,从而使得不但可以减少待学习文本数据聚团序列的数量,而且可以更加准确地得到待学习文本数据聚团序列。
譬如,从基于对话行为文本数据对应的文本数据聚团中文本语义向量,确定对话行为文本数据对应的文本数据聚团之间的相关性参数值,基于相关性参数值,从对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列,包括:
基于对话行为文本数据的文本语义向量,确定对话行为文本数据对应的文本数据聚团的聚集影响值,聚集影响值用于表示对话行为文本数据的区分难度;从对话行为文本数据对应的文本数据聚团中,提取满足预设权重的聚集影响值对应的文本数据聚团,获得候选文本数据聚团;基于候选文本数据聚团中文本语义向量,确定候选文本数据聚团之间的相关性参数值;基于相关性参数值,从候选文本数据聚团中提取待学习文本数据聚团序列。
此时,基于对话行为文本数据对应的文本数据聚团和相关性参数值构建图网络架构,图网络架构包括多个图成员和多条成员链路,每个图成员表示对话行为文本数据对应的文本数据聚团,成员链路的权重表示对话行为文本数据对应的文本数据聚团之间的相关性参数值,可以包括:基于候选文本数据聚团和相关性参数值构建图网络架构,图网络架构包括多个图成员和多条成员链路,每个图成员表示候选文本数据聚团,成员链路的权重表示候选文本数据聚团之间的相关性参数值。
在本实施例中,采用基于对话行为文本数据的文本语义向量,获得对话行为文本数据对应的文本数据聚团的聚集影响值表示区分难度,然后基于聚集影响值从对话行为文本数据对应的文本数据聚团中,提取满足预设权重的聚集影响值对应的文本数据聚团,获得候选文本数据聚团,使得在基于候选文本数据聚团对用户文本情感分析网络进行网络权重参数更新时,获得的目标用户文本情感分析网络的召回率更高。
其中,基于对话行为文本数据的文本语义向量,确定对话行为文本数据对应的文本数据聚团的聚集影响值地过程可以为:
计算各个对话行为文本数据对应的文本数据聚团的第一聚焦语义向量和对话行为文本数据的文本语义向量之间的关联参数值;
基于对话行为文本数据的文本语义向量,确定对话行为文本数据对应的第一决策置信度和第二决策置信度;
基于第一决策置信度和第二决策置信度以及关联参数值,确定对话行为文本数据的聚集影响值。
第一决策置信度和第二决策置信度可以为用户文本情感分析网络对对话行为文本数据的决策置信度中的两个。比如,第一决策置信度可以为用户文本情感分析网络预测对话行为文本数据的最大置信度,第二决策置信度可以为用户文本情感分析网络预测对话行为文本数据的第二大置信度。又比如,第一决策置信度可以为用户文本情感分析网络预测对话行为文本数据的第二大置信度,第二决策置信度可以为用户文本情感分析网络预测对话行为文本数据的第三大置信度。本实施例在此不做限定。
对话行为文本数据包含了较大的噪声,如果直接基于主动学习的方法从对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,并基于待学习文本数据聚团序列对对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据,会影响基于携带文本情感标注信息的对话行为文本数据进行网络权重参数更新得到的用户文本情感分析网络的召回率。
所以,为了降低对用户文本情感分析网络的召回率的影响,譬如在另一些示例性的设计思路中,基于对话行为文本数据的文本语义向量,确定对话行为文本数据对应的文本数据聚团的聚集影响值,从对话行为文本数据对应的文本数据聚团中,提取满足预设权重的聚集影响值对应的文本数据聚团,获得候选文本数据聚团包括:获取对话行为文本数据的文本数据聚团的聚集度;从对话行为文本数据的文本数据聚团提取满足预设聚集度的聚集度的文本数据聚团,获得初筛文本数据聚团;基于初筛文本数据聚团中对话行为文本数据的文本语义向量,确定初筛文本数据聚团的聚集影响值;从初筛文本数据聚团中,提取满足预设权重的聚集影响值对应的文本数据聚团,获得候选文本数据聚团。
基于聚集度,从对话主题的文本数据聚团提取满足预设聚集度的聚集度的文本数据聚团,获得初筛文本数据聚团,然后再基于初筛文本数据聚团中对话行为文本数据的文本语义向量,确定初筛文本数据聚团的聚集影响值,并基于聚集影响值得到候选文本数据聚团。
数字金融AI平台在得到待学习文本数据聚团序列之后,可以基于待学习文本数据聚团序列对对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据。一些示例性的设计思路中,基于待学习文本数据聚团序列对对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据,包括:提取待学习文本数据聚团序列中对话行为文本数据对应的多个情感字段向量信息;将待学习文本数据聚团序列以及情感字段向量信息进行显示;接收用户基于情感字段向量信息,对待学习文本数据聚团序列中对话行为文本数据进行文本情感标注的监督指示信息,获得用于有监督训练学习的对话行为文本数据。
步骤S102、对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的文本语义向量,并对文本语义向量和文本情感标注信息对应的目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第一情感嵌入语义向量。
其中,可以通过用户文本情感分析网络中语义向量编码单元,对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的文本语义向量。又或者,也可以通过用户文本情感分析网络中语义向量编码单元,对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的参考文本语义向量,然后再通过用户文本情感分析网络中语义映射单元对参考文本语义向量进行语义映射,获得待学习行为文本数据对应的文本语义向量。
一些示例性的设计思路中,用户文本情感分析网络中语义映射单元包括第一预测子单元(全连接网络)和第一函数变换子单元(激活网络),通过用户文本情感分析网络中语义映射单元对参考文本语义向量进行语义映射,获得待学习行为文本数据对应的文本语义向量,包括:通过用户文本情感分析网络中第一预测子单元,对参考文本语义向量进行特征降维映射,获得待学习行为文本数据对应的降维后文本语义向量;通过用户文本情感分析网络中第一函数变换子单元,对降维后文本语义向量进行非线性语义映射,获得待学习行为文本数据对应的文本语义向量。
譬如另一些示例性的设计思路中,用户文本情感分析网络中语义映射单元可以为残差结构,具体而言,用户文本情感分析网络中语义映射单元还包括第二预测子单元,通过用户文本情感分析网络中第一函数变换子单元,对降维后文本语义向量进行非线性语义映射,获得待学习行为文本数据对应的文本语义向量,包括:通过用户文本情感分析网络中第一函数变换子单元,对降维后文本语义向量进行非线性语义映射,获得待学习行为文本数据对应的非线性文本语义向量;通过用户文本情感分析网络中第二预测子单元,对非线性文本语义向量进行特征升维映射,待学习行为文本数据对应的升维后文本语义向量;基于升维后文本语义向量和参考文本语义向量,确定待学习行为文本数据对应的文本语义向量。
另一些示例性的设计思路中,用户文本情感分析网络中还包括聚焦映射单元,以上方法实施例还可以包括:获取文本情感标注信息对应的目标聚团的初始聚焦语义向量;通过用户文本情感分析网络的聚焦映射单元,对初始聚焦语义向量进行映射,获得文本情感标注信息对应的目标聚团的第一聚焦语义向量。
一些示例性的设计思路中,聚焦映射单元的网络权重参数可以与语义映射单元的网络权重参数相同,即训练得到用户文本情感分析网络时,可以得到语义映射单元的网络权重参数,然后再将语义映射单元的网络权重参数分享给聚焦映射单元,此时,用户文本情感分析网络可以为自适应用户文本情感分析网络。
步骤S103、基于第一情感嵌入语义向量和文本语义向量,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
其中,可以是基于第一情感嵌入语义向量,确定待学习行为文本数据的文本情感推定信息,然后基于文本语义向量以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。或者,也可以是基于第一情感嵌入语义向量,确定待学习行为文本数据的文本情感推定信息,然后文本语义向量、文本情感推定信息以及目标聚团的初始聚焦语义向量,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
当基于第一情感嵌入语义向量,确定待学习行为文本数据的文本情感推定信息,然后基于文本语义向量以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量时,基于文本语义向量以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量,包括:获取文本语义向量对应的第一语境维度信息,以及获取参考文本语义向量的第二语境维度信息;基于第一语境维度信息、第二语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
在本实施例中,基于第一语境维度信息、第二语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量,以便从语境维度信息,即从成员链路界信息上对目标聚团的第一聚焦语义向量进行更新,实现对目标聚团的第一聚焦语义向量进行约束,从而得到目标聚团的第二聚焦语义向量。
或者,基于文本语义向量以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量,包括:获取文本语义向量对应的第一语境维度信息,以及获取目标聚团的第一聚焦语义向量的第三语境维度信息;基于第一语境维度信息、第三语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
在本实施例中,基于第一语境维度信息、第三语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量,以便从语境维度信息,即从成员链路界信息上对目标聚团的第一聚焦语义向量进行更新,实现对目标聚团的第一聚焦语义向量进行约束,从而得到目标聚团的第二聚焦语义向量。
譬如另一些示例性的设计思路中,基于第一语境维度信息、第二语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量的过程可以为:获取第一语境维度信息对应的维度影响值和第二语境维度信息对应的维度影响值;基于第一语境维度信息对应的维度影响值,对第一语境维度信息进行更新,获得更新后第一语境维度信息,以及基于第二语境维度信息对应的维度影响值,对第二语境维度信息进行更新,获得更新后第二语境维度信息;基于更新后第一语境维度信息和更新后第二语境维度信息,确定参考文本语义向量和文本语义向量之间的第一语义联系信息;基于第一语义联系信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
或者,基于第一语境维度信息、第二语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量的过程也可以为:获取目标聚团的第一聚焦语义向量的第三语境维度信息;基于第一语境维度信息、第二语境维度信息、第三语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
其中,基于第一语境维度信息、第二语境维度信息、第三语境维度信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量的过程可以为:基于第一语境维度信息和第二语境维度信息,确定参考文本语义向量和文本语义向量之间的第一语义联系信息;基于第二语境维度信息和第三语境维度信息,确定参考文本语义向量和目标聚团的第一聚焦语义向量之间的第二语义联系信息;基于第一语义联系信息、第二语义联系信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
另一些示例性的设计思路中,基于第一语义联系信息、第二语义联系信息以及文本情感推定信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量的过程可以为:确定第一语义联系信息和第二语义联系信息之间的关联语义向量信息;基于文本情感推定信息、关联语义向量信息以及文本情感标注信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
应理解,目标聚团的第一聚焦语义向量可以为目标聚团的初始聚焦语义向量,或者也可以是对目标聚团的初始聚焦语义向量映射得到的语义向量。
在本实施例中,通过第一语义联系信息以及第二语义联系信息之间的差异,对目标聚团的第一聚焦语义向量进行约束,使得在基于目标聚团的更新后中心得到的语义兼容误差信息训练用户文本情感分析网络时,用户文本情感分析网络可以达到更好的收敛状态。
步骤S104、对文本语义向量和目标聚团的第二聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第二情感嵌入语义向量。
对文本语义向量和目标聚团的第二聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第二情感嵌入语义向量的过程,可以参照对文本语义向量和文本情感标注信息对应的目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第一情感嵌入语义向量的过程,实施例在此不做限定。
应理解,在将目标聚团的第一聚焦语义向量变为目标聚团的第二聚焦语义向量之后,用户文本情感分析网络可以称为新用户文本情感分析网络,此时,对文本语义向量和目标聚团的第二聚焦语义向量进行情感嵌入汇聚中的文本语义向量,可以指通过新用户文本情感分析网络对待学习行为文本数据进行语义向量编码得到的文本语义向量。
步骤S105、基于第二情感嵌入语义向量,确定第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息,以及确定用户文本情感分析网络的情感分析误差信息。
第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息,也可以理解为文本语义向量和第二情感嵌入语义向量之间的语义兼容误差信息。其中,可以对第二情感嵌入语义向量和文本语义向量进行第一情感嵌入汇聚,获得待学习行为文本数据的目标第一情感嵌入语义向量,然后基于目标第一情感嵌入语义向量,第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息。
或者,也可以是对第二情感嵌入语义向量和参考文本语义向量进行第一情感嵌入汇聚,获得待学习行为文本数据的目标第一情感嵌入语义向量,然后基于目标第一情感嵌入语义向量,第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息。
步骤S106、基于情感分析误差信息和语义兼容误差信息,对用户文本情感分析网络进行网络权重参数更新,获得训练完成的目标用户文本情感分析网络。
数字金融AI平台可以直接将情感分析误差信息和语义兼容误差信息相加,从而得到用户文本情感分析网络的目标评估误差信息,或者,数字金融AI平台也可以获取情感分析误差信息对应的第一影响系数和语义兼容误差信息对应的第二影响系数,然后将第一影响系数与情感分析误差信息相乘,获得更新后情感分析误差信息,将第二影响系数与语义兼容误差信息相乘,获得更新后语义兼容误差信息,最后再将更新后情感分析误差信息和更新后语义兼容误差信息相加,获得目标评估误差信息。
在得到目标评估误差信息之后,如果目标评估误差信息等于或大于预设评估误差信息,则基于目标评估误差信息,用于训练用户文本情感分析网络的网络权重参数,并返回执行对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的文本语义向量的步骤,此时,可以无需执行对文本语义向量和文本情感标注信息对应的目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第一情感嵌入语义向量,基于第一情感嵌入语义向量和文本语义向量,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量的步骤,也可以执行,本实施例在此不做赘述。
一些示例性的设计思路中,第一影响系数和第二影响系数在模型更新流程中,可以是固定的,也可以是动态变化的,也即是,在训练用户文本情感分析网络的过程时,同时学习第一影响系数和第二影响系数,此时,在基于目标评估误差信息,用于训练用户文本情感分析网络的参数的同时,更新第一影响系数和第二影响系数。
采用目标用户文本情感分析网络对输入对话行为文本数据进行识别的过程可以为:获取输入对话行为文本数据,并通过目标用户文本情感分析网络中语义向量编码单元对输入对话行为文本数据进行语义向量编码,获得输入对话行为文本数据对应的目标文本语义向量;通过目标用户文本情感分析网络中情感分类单元,对目标文本语义向量进行分类,获得输入对话行为文本数据的情感分析结果。
由以上可知,从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,待学习行为文本数据序列包括至少一个携带文本情感标注信息的待学习行为文本数据,待学习行为文本数据为用户文本情感分析网络在先分析的对话行为文本数据,对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的文本语义向量,并对文本语义向量和文本情感标注信息对应的目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第一情感嵌入语义向量,以便可以基于第一情感嵌入语义向量和文本语义向量,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量,使得在对文本语义向量和目标聚团的第二聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第二情感嵌入语义向量之后,可以基于第二情感嵌入语义向量,确定第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息,以及确定用户文本情感分析网络的情感分析误差信息,并基于情感分析误差信息和语义兼容误差信息,对用户文本情感分析网络进行网络权重参数更新,获得训练完成的目标用户文本情感分析网络,从而使得通过目标用户文本情感分析网络得到的文本语义向量和通过用户文本情感分析网络得到的文本语义向量具备兼容性,进而使得无需采用目标用户文本情感分析网络对对话行为文本数据重新进行语义向量编码,减少重新进行语义向量编码的时间,进而提高网络收敛效率。
基于上述实施例所描述的方法,以下将举例作进一步详细说明。
本申请实施例提供一种基于文本情感分析的数据构建方法,可以包括:
步骤S201、数字金融AI平台获取文本情感分析网络在先分析的先验对话行为文本数据,并提取先验对话行为文本数据的对话主题文本段。
步骤S202、数字金融AI平台通过第一全局文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据对应的第一参考文本学习价值,通过第二全局文本学习价值评估模型,基于对话主题文本段,确定先验对话行为文本数据对应的第二参考文本学习价值,并获取设定学习价值。
步骤S203、若第一参考文本学习价值和第二参考文本学习价值均不大于设定学习价值,数字金融AI平台则将第一参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值。
步骤S204、若第一参考文本学习价值和第二参考文本学习价值均大于设定学习价值,数字金融AI平台则将第二参考文本学习价值,作为先验对话行为文本数据对应的文本学习价值。
步骤S205、数字金融AI平台将符合设定条件的文本学习价值对应的先验对话行为文本数据,作为文本情感分析网络在先分析的对话行为文本数据。
步骤S206、数字金融AI平台通过文本情感分析网络对对话行为文本数据进行分团,获得对话行为文本数据所在的文本数据聚团。
步骤S207、数字金融AI平台获取对话行为文本数据的文本数据聚团的聚集度,并从对话行为文本数据的文本数据聚团提取满足预设聚集度的聚集度的文本数据聚团,获得初筛文本数据聚团。
步骤S208、数字金融AI平台基于初筛文本数据聚团中对话行为文本数据的语义向量,确定初筛文本数据聚团的聚集影响值,并从初筛文本数据聚团中,提取满足预设权重的聚集影响值对应的文本数据聚团,获得候选文本数据聚团。
步骤S209、数字金融AI平台基于候选文本数据聚团中对话行为文本数据对应的语义向量,确定候选文本数据聚团之间的相关性参数值,并基于候选文本数据聚团和相关性参数值构建图网络架构,图网络架构包括多个图成员和多条成员链路,每个图成员表示候选文本数据聚团,成员链路的权重表示候选文本数据聚团之间的相关性参数值。
步骤S2010、数字金融AI平台基于图网络架构中成员链路的权重,对图网络架构进行更新,获得最小生成树,并从最小生成树中提取图成员序列,图成员序列对应待学习文本数据聚团序列。
步骤S2011、数字金融AI平台提取待学习文本数据聚团序列中对话行为文本数据对应的多个情感字段向量信息,并将待学习文本数据聚团序列以及情感字段向量信息进行显示。
步骤S2012、数字金融AI平台接收用户基于情感字段向量信息,对待学习文本数据聚团序列中对话行为文本数据进行文本情感标注的监督指示信息,获得用于有监督训练学习的对话行为文本数据。
步骤S2013、数字金融AI平台基于用于有监督训练学习的对话行为文本数据,构建更新文本情感分析网络的待学习行为文本数据序列,待学习行为文本数据序列包括至少一个携带文本情感标注信息的待学习行为文本数据。
下面提供本申请另一种实施例的基于人工智能的文本情感分析网络更新方法,可以包括:
步骤S301、数字金融AI平台通过文本情感分析网络中语义向量编码单元,对待学习行为文本数据进行语义向量编码,获得待学习行为文本数据对应的初始语义向量。
步骤S302、数字金融AI平台通过文本情感分析网络中第一预测子单元,对初始语义向量进行特征降维映射,获得待学习行为文本数据对应的降维后语义向量,并通过文本情感分析网络中第一函数变换子单元,对降维后语义向量进行非线性语义映射,获得待学习行为文本数据对应的非线性语义向量。
步骤S303、数字金融AI平台通过文本情感分析网络中第二预测子单元,对非线性语义向量进行特征升维映射,待学习行为文本数据对应的升维后语义向量,并基于升维后语义向量和初始语义向量,确定待学习行为文本数据对应的语义向量。
步骤S304、数字金融AI平台获取文本情感标注信息对应的目标聚团的初始聚焦语义向量,并通过文本情感分析网络中第三预测子单元对目标聚团的初始聚焦语义向量进行降维映射,获得降维后初始聚焦语义向量。
步骤S305、数字金融AI平台通过文本情感分析网络中第二函数变换子单元,对降维后初始聚焦语义向量进行非线性语义映射,获得非线性初始聚焦语义向量,并通过文本情感分析网络中第四预测子单元,对非线性初始聚焦语义向量进行特征升维映射,获得升维后初始聚焦语义向量。
步骤S306、数字金融AI平台基于升维后初始聚焦语义向量和目标聚团的初始聚焦语义向量,确定目标聚团的第一聚焦语义向量。
步骤S307、数字金融AI平台通过文本情感分析网络中情感嵌入汇聚单元,对语义向量和目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第一情感嵌入语义向量,并通过文本情感分析网络中情感分类单元,基于第一情感嵌入语义向量,确定待学习行为文本数据的文本情感推定信息。
步骤S308、数字金融AI平台获取语义向量对应的第一语境维度信息、获取初始语义向量的第二语境维度信息、以及获取目标聚团的初始聚焦语义向量的第三语境维度信息。
步骤S309、数字金融AI平台基于第一语境维度信息和第二语境维度信息,确定初始语义向量和语义向量之间的第一语义联系信息,以及基于第二语境维度信息和第三语境维度信息,确定初始语义向量和目标聚团的第一聚焦语义向量之间的第二语义联系信息。
步骤S3010、数字金融AI平台确定第一语义联系信息和第二语义联系信息之间的关联语义向量信息,并基于文本情感推定信息、文本情感标注信息、关联语义向量信息,对目标聚团的第一聚焦语义向量进行更新,获得目标聚团的第二聚焦语义向量。
步骤S3011、数字金融AI平台对语义向量和目标聚团的第二聚焦语义向量进行情感嵌入汇聚,获得待学习行为文本数据的第二情感嵌入语义向量。
步骤S3012、数字金融AI平台对第二情感嵌入语义向量和初始语义向量进行第一情感嵌入汇聚,获得待学习行为文本数据的目标第一情感嵌入语义向量。
步骤S3013、数字金融AI平台基于目标第一情感嵌入语义向量,确定第一情感嵌入语义向量和第二情感嵌入语义向量之间的语义兼容误差信息,以及确定文本情感分析网络的情感分析误差信息。
步骤S3014、数字金融AI平台基于情感分析误差信息和语义兼容误差信息,对文本情感分析网络进行网络权重参数更新,获得文本情感分析网络更新后的目标文本情感分析网络。
一些设计思路中,提供了一种数字金融AI平台,该数字金融AI平台可以是服务器,该数字金融AI平台包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该数字金融AI平台的处理器用于提供计算和控制能力。该数字金融AI平台的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该数字金融AI平台的数据库用于存储上述方法所涉及的数据。该数字金融AI平台的输入/输出接口用于处理器与外部设备之间交换信息。该数字金融AI平台的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于数字金融AI平台的内容推荐方法。
一些设计思路中,提供了一种数字金融AI平台,该数字金融AI平台可以是终端。该数字金融AI平台包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该数字金融AI平台的处理器用于提供计算和控制能力。该数字金融AI平台的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该数字金融AI平台的输入/输出接口用于处理器与外部设备之间交换信息。该数字金融AI平台的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于数字金融AI平台的内容推荐方法。该数字金融AI平台的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该数字金融AI平台的输入装置可以是显示屏上覆盖的触摸层,也可以是数字金融AI平台外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
一些设计思路中,提供了一种数字金融AI平台,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
一些设计思路中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(DynamicRandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
在一些实施例中,计算机可执行指令可以采用程序、软件、软件模块、脚本或代码的形式,按任意形式的编程语言(包括编译或解释语言,或者声明性或过程性语言)来编写,并且其可按任意形式部署,包括被部署为独立的程序或者被部署为模块、组件、子例程或者适合在计算环境中使用的其它单元。
作为示例,计算机可执行指令可以但不一定对应于文件系统中的文件,可以可被存储在保存其它程序或数据的文件的一部分,例如,存储在超文本标记语言(HTML,HyperText Markup Language)文档中的一个或多个脚本中,存储在专用于所讨论的程序的单个文件中,或者,存储在多个协同文件(例如,存储一个或多个模块、子程序或代码部分的文件)中。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种基于数字金融AI平台的内容推荐方法,其特征在于,应用于所述数字金融AI平台,所述方法包括:
从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于所述待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络,所述待学习行为文本数据序列包括至少一个携带文本情感标注信息的待学习行为文本数据,所述待学习行为文本数据为所述用户文本情感分析网络在先分析的对话行为文本数据;
基于所述训练完成的目标用户文本情感分析网络对所述数字金融AI平台的目标用户的用户行为文本数据进行用户文本情感分析,获得用户文本情感分析结果;
基于所述用户文本情感分析结果,根据所述用户文本情感分析结果中情感倾向为积极情感倾向的目标实体对象,从当前云端互动推荐内容库中确定与所述目标实体对象对应的推荐内容信息,将所述推荐内容信息发送至所述目标用户所对应的数字金融互动页面中。
2.根据权利要求1所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,并基于所述待学习行为文本数据序列训练生成对应的目标用户文本情感分析网络的步骤,包括:
对所述待学习行为文本数据进行语义向量编码,获得所述待学习行为文本数据对应的文本语义向量,并对所述文本语义向量和所述文本情感标注信息对应的目标聚团的第一聚焦语义向量进行情感嵌入汇聚,获得所述待学习行为文本数据的第一情感嵌入语义向量;
基于所述第一情感嵌入语义向量和所述文本语义向量,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量;
对所述文本语义向量和所述目标聚团的第二聚焦语义向量进行情感嵌入汇聚,获得所述待学习行为文本数据的第二情感嵌入语义向量;
基于所述第二情感嵌入语义向量,确定所述第一情感嵌入语义向量和所述第二情感嵌入语义向量之间的语义兼容误差信息,以及确定所述用户文本情感分析网络的情感分析误差信息;
基于所述情感分析误差信息和所述语义兼容误差信息,对所述用户文本情感分析网络进行网络权重参数更新,获得训练完成的目标用户文本情感分析网络;
所述基于所述第一情感嵌入语义向量和所述文本语义向量,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量,包括:
基于所述第一情感嵌入语义向量,确定所述待学习行为文本数据的文本情感推定信息;
基于所述文本语义向量以及所述文本情感推定信息,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量。
3.根据权利要求2所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述对所述待学习行为文本数据进行语义向量编码,获得所述待学习行为文本数据对应的文本语义向量,包括:
基于所述用户文本情感分析网络中语义向量编码单元对所述待学习行为文本数据进行语义向量编码,获得所述待学习行为文本数据对应的参考文本语义向量;
基于所述用户文本情感分析网络中语义映射单元对所述参考文本语义向量进行语义映射,获得所述待学习行为文本数据对应的文本语义向量;
所述基于所述文本语义向量以及所述文本情感推定信息,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量,包括:
获取所述文本语义向量对应的第一语境维度信息,以及获取所述参考文本语义向量的第二语境维度信息;
基于所述第一语境维度信息、所述第二语境维度信息以及所述文本情感推定信息,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量;
所述基于所述第一语境维度信息、所述第二语境维度信息以及所述文本情感推定信息,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量,包括:
获取所述目标聚团的第一聚焦语义向量的第三语境维度信息;
基于所述第一语境维度信息、所述第二语境维度信息、所述第三语境维度信息以及所述文本情感推定信息,对所述目标聚团的第一聚焦语义向量进行更新,获得所述目标聚团的第二聚焦语义向量。
4.根据权利要求3所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述用户文本情感分析网络中还包括聚焦映射单元,所述方法还包括:
获取所述文本情感标注信息对应的目标聚团的初始聚焦语义向量;
基于所述用户文本情感分析网络的聚焦映射单元,对所述初始聚焦语义向量进行映射,获得所述文本情感标注信息对应的目标聚团的第一聚焦语义向量。
5.根据权利要求2-4中任意一项所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述从所述数字金融AI平台中获取用于训练用户文本情感分析网络的待学习行为文本数据序列,包括:
获取所述用户文本情感分析网络在先分析的对话行为文本数据;
从所述对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,并基于所述待学习文本数据聚团序列对所述对话行为文本数据进行文本情感标注,获得携带文本情感标注信息的对话行为文本数据;
基于所述携带文本情感标注信息的对话行为文本数据,确定用于训练用户文本情感分析网络的待学习行为文本数据序列。
6.根据权利要求5所述的基于数字金融AI平台的内容推荐方法,其特征在于,获取所述用户文本情感分析网络在先分析的对话行为文本数据,包括:
获取所述用户文本情感分析网络在先分析的先验对话行为文本数据;
提取所述先验对话行为文本数据的对话主题文本段,并基于所述对话主题文本段确定所述先验对话行为文本数据对应的文本学习价值;
将符合设定条件的文本学习价值对应的先验对话行为文本数据,作为所述用户文本情感分析网络在先分析的对话行为文本数据。
7.根据权利要求6所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述基于所述对话主题文本段确定所述先验对话行为文本数据对应的文本学习价值,包括:
获取所述先验对话行为文本数据的多个文本学习价值评估模型;
基于所述文本学习价值评估模型,基于所述对话主题文本段,确定所述先验对话行为文本数据的多个参考文本学习价值;
基于所述参考文本学习价值,确定所述先验对话行为文本数据对应的文本学习价值;
所述先验对话行为文本数据存在多个价值评估标签,每个所述价值评估标签对应一个标签学习价值评估模型;
所述基于所述文本学习价值评估模型,基于所述对话主题文本段,确定所述先验对话行为文本数据的多个参考文本学习价值,基于所述参考文本学习价值,确定所述先验对话行为文本数据对应的文本学习价值,包括:
基于所述标签学习价值评估模型,基于所述对话主题文本段,确定所述先验对话行为文本数据针对每个价值评估标签的参考文本学习价值;
对各个所述参考文本学习价值进行权重融合,获得所述先验对话行为文本数据对应的文本学习价值;
在所述基于所述标签学习价值评估模型,基于所述对话主题文本段确定所述先验对话行为文本数据对应的文本学习价值之前,还包括:
获取待更新标签学习价值评估模型的第一待学习行为文本数据序列,所述第一待学习行为文本数据序列包括多个第一待学习行为文本数据;
提取所述第一待学习行为文本数据的训练对话主题文本段,并基于所述训练对话主题文本段,确定所述待更新标签学习价值评估模型的组合评估误差信息和/或独立评估误差信息;
基于所述组合评估误差信息和/或独立评估误差信息,对所述待更新标签学习价值评估模型进行网络权重参数更新,获得标签学习价值评估模型;
所述先验对话行为文本数据的多个文本学习价值评估模型包括第一全局文本学习价值评估模型和第二全局文本学习价值评估模型,所述基于所述对话主题文本段确定所述先验对话行为文本数据对应的文本学习价值,包括:
基于所述第一全局文本学习价值评估模型,基于所述对话主题文本段,确定所述先验对话行为文本数据对应的第一参考文本学习价值;
基于所述第二全局文本学习价值评估模型,基于所述对话主题文本段,确定所述先验对话行为文本数据对应的第二参考文本学习价值;
从所述第一参考文本学习价值和所述第二参考文本学习价值中,提取所述先验对话行为文本数据对应的文本学习价值;
所述从所述第一参考文本学习价值和所述第二参考文本学习价值中,提取所述先验对话行为文本数据对应的文本学习价值,包括:
获取设定学习价值;
如果所述第一参考文本学习价值和所述第二参考文本学习价值均不大于所述设定学习价值,则将所述第一参考文本学习价值,作为所述先验对话行为文本数据对应的文本学习价值;
如果所述第一参考文本学习价值和所述第二参考文本学习价值均大于所述设定学习价值,则将所述第二参考文本学习价值,作为所述先验对话行为文本数据对应的文本学习价值。
8.根据权利要求5所述的基于数字金融AI平台的内容推荐方法,其特征在于,所述从所述对话行为文本数据对应的文本数据聚团中提取待学习文本数据聚团序列,包括:
基于所述对话行为文本数据对应的文本数据聚团中文本语义向量,确定所述对话行为文本数据对应的文本数据聚团之间的相关性参数值;
基于所述相关性参数值,从所述对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列;
所述基于所述相关性参数值,从所对话行为文本数据对应的文本数据聚团中,提取待学习文本数据聚团序列,包括:
基于所述对话行为文本数据对应的文本数据聚团和所述相关性参数值构建图网络架构,所述图网络架构包括多个图成员和多条成员链路,每个所述图成员表示所述对话行为文本数据对应的文本数据聚团,所述成员链路的权重表示所述对话行为文本数据对应的文本数据聚团之间的相关性参数值;
基于所述图网络架构中成员链路的权重,对所述图网络架构进行循环结构更新,获得不包含循环结构连接的图网络架构;
从所述不包含循环结构连接的图网络架构中提取图成员序列,所述图成员序列对应所述待学习文本数据聚团序列。
9.根据权利要求8所述的基于数字金融AI平台的内容推荐方法,其特征在于,基于所述待学习文本数据聚团序列对所述对话行为文本数据进行文本情感标注,获得用于有监督训练学习的对话行为文本数据,包括:
提取所述待学习文本数据聚团序列中对话行为文本数据对应的多个情感字段向量信息;
将所述待学习文本数据聚团序列以及所述情感字段向量信息进行显示;
接收用户基于所述情感字段向量信息,对所述待学习文本数据聚团序列中对话行为文本数据进行文本情感标注的监督指示信息,获得用于有监督训练学习的对话行为文本数据。
10.一种数字金融AI平台,其特征在于,所述数字金融AI平台包括处理器和机器可读存储介质,该机器可读存储介质中存储有机器可执行指令,该机器可执行指令由该处理器加载并执行以实现权利要求1-9中任意一项的基于数字金融AI平台的内容推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310253289.7A CN116308551A (zh) | 2023-03-16 | 2023-03-16 | 基于数字金融ai平台的内容推荐方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310253289.7A CN116308551A (zh) | 2023-03-16 | 2023-03-16 | 基于数字金融ai平台的内容推荐方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116308551A true CN116308551A (zh) | 2023-06-23 |
Family
ID=86797418
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310253289.7A Withdrawn CN116308551A (zh) | 2023-03-16 | 2023-03-16 | 基于数字金融ai平台的内容推荐方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116308551A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473457A (zh) * | 2023-12-25 | 2024-01-30 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
-
2023
- 2023-03-16 CN CN202310253289.7A patent/CN116308551A/zh not_active Withdrawn
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117473457A (zh) * | 2023-12-25 | 2024-01-30 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
CN117473457B (zh) * | 2023-12-25 | 2024-02-27 | 四川省大数据技术服务中心 | 基于数字化业务的大数据挖掘方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Asri et al. | A sequence-to-sequence model for user simulation in spoken dialogue systems | |
US20210027770A1 (en) | Multi-turn dialogue response generation with persona modeling | |
CN109376222B (zh) | 问答匹配度计算方法、问答自动匹配方法及装置 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN114281957A (zh) | 自然语言数据查询方法、装置、电子设备及存储介质 | |
CN114648032B (zh) | 语义理解模型的训练方法、装置和计算机设备 | |
CN116308551A (zh) | 基于数字金融ai平台的内容推荐方法及系统 | |
CN110929532A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN114282528A (zh) | 一种关键词提取方法、装置、设备及存储介质 | |
US11416892B2 (en) | Non-transitory computer-readable recording medium, determination method, and information processing apparatus | |
CN113032676A (zh) | 基于微反馈的推荐方法和系统 | |
CN114912623A (zh) | 用于模型解释的方法及装置 | |
CN111552827A (zh) | 标注方法和装置、行为意愿预测模型训练方法和装置 | |
CN116628236B (zh) | 多媒体信息的投放方法、装置、电子设备及存储介质 | |
CN113254635B (zh) | 数据处理方法、装置及存储介质 | |
CN115455306B (zh) | 推送模型训练、信息推送方法、装置和存储介质 | |
CN117786234B (zh) | 一种基于两阶段对比学习的多模态资源推荐方法 | |
US11755570B2 (en) | Memory-based neural network for question answering | |
CN116882450B (zh) | 问答模型的编辑方法、装置、电子设备和存储介质 | |
CN111737440B (zh) | 一种问题生成方法及装置 | |
CN114417944B (zh) | 识别模型训练方法及装置、用户异常行为识别方法及装置 | |
CN116881556A (zh) | 资源推荐方法、装置、计算机设备和存储介质 | |
CN116362260A (zh) | 基于大数据平台的在线会话处理方法、系统及程序产品 | |
CN117472431A (zh) | 代码注释生成方法、装置、计算机设备、存储介质和产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20230623 |