CN114692650A - 针对大数据推荐的社交平台互动信息处理方法及系统 - Google Patents

针对大数据推荐的社交平台互动信息处理方法及系统 Download PDF

Info

Publication number
CN114692650A
CN114692650A CN202210343589.XA CN202210343589A CN114692650A CN 114692650 A CN114692650 A CN 114692650A CN 202210343589 A CN202210343589 A CN 202210343589A CN 114692650 A CN114692650 A CN 114692650A
Authority
CN
China
Prior art keywords
appeal
text
session
distribution
global
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN202210343589.XA
Other languages
English (en)
Inventor
徐宗磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202210343589.XA priority Critical patent/CN114692650A/zh
Publication of CN114692650A publication Critical patent/CN114692650A/zh
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/022Knowledge engineering; Knowledge acquisition
    • G06N5/025Extracting rules from data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了针对大数据推荐的社交平台互动信息处理方法及系统,通过重点关注目标用户群体会话日志的社交话题信息,可以在一定程度上提高用户群体会话日志处理的效率,另外,利用社交话题整合思路,可以实现用户会话场景与社交话题的联动分析处理,基于上述内容的综合进行后续的信息推送偏好识别操作,能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。

Description

针对大数据推荐的社交平台互动信息处理方法及系统
技术领域
本申请涉及大数据推荐技术领域,尤其涉及一种针对大数据推荐的社交平台互动信息处理方法及系统。
背景技术
大数据推荐是自动联系用户和物品的一种技术,它通过研究用户的兴趣爱好来进行个性化推荐。随着大数据和云计算的不断发展,大数据推荐的涉及领域越来越广,例如现有技术CN112270570B涉及电商大数据推荐,现有技术CN113971204A涉及论文实时推荐,现有技术CN109213852B涉及旅游地图推荐等等。
在上述基础上,当下的大数据推荐技术的关注重点仍然是如何实现精准高效推送,发明人经研究和分析发现,保障精准高效的大数据推荐的关键在于对待推送用户的推送需求挖掘,然而相关技术在对待推送用户进行推送需求挖掘时,难以确保推送需求与相关业务会话的高相关性,也就难以确保推送需求的精度和可信度。
发明内容
本申请的一个目的是提供一种针对大数据推荐的社交平台互动信息处理方法及系统。
本申请的技术方案是通过如下至少部分实施例实现的。
一种针对大数据推荐的社交平台互动信息处理方法,所述方法应用于大数据推荐系统,所述大数据推荐系统与社交平台系统通信,该方法至少包括:通过指定AI策略确定目标用户群体会话日志的第一全局诉求文本分布,并通过指定话题整合策略确定第一全局诉求文本分布对应的话题整合引导特征;基于话题整合引导特征以及第一全局诉求文本分布确定第二全局诉求文本分布,并结合所述指定AI策略确定与所述目标用户群体会话日志对应的推送偏好知识集。
应用于本申请实施例,通过话题整合引导特征以及第一全局诉求文本分布,能够确定出尽可能完整丰富的第二全局诉求文本分布,这样能够通过指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,以确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,通过指定AI策略确定目标用户群体会话日志的第一全局诉求文本分布,并通过指定话题整合策略确定第一全局诉求文本分布对应的话题整合引导特征;基于话题整合引导特征以及第一全局诉求文本分布确定第二全局诉求文本分布,并结合所述指定AI策略确定与所述目标用户群体会话日志对应的推送偏好知识集,包括:响应于所述社交平台系统的信息推送辅助请求,调取目标用户群体会话日志;借助指定AI策略对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布,其中,第一全局诉求文本分布包括与目标用户群体会话日志对应的相异社交话题下的诉求会话文本内容;调用指定话题整合策略对第一全局诉求文本分布进行处理,获得话题整合引导特征;调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二全局诉求文本分布;借助指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。
应用于本申请实施例,通过重点关注目标用户群体会话日志的社交话题(比如购物、办公、交通、影视、教育等)信息,可以在一定程度上提高用户群体会话日志处理的效率,另外,利用社交话题整合思路,可以实现用户会话场景(比如不同的群聊场景或者聊天语境场景)与社交话题的联动分析处理,基于上述内容的综合进行后续的信息推送偏好识别操作,能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,在调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二全局诉求文本分布之前,还包括:基于诉求量化处理策略对第一全局诉求文本分布进行处理,获得用户诉求短语;调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二全局诉求文本分布,包括:调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合;基于用户诉求短语对经过整合的诉求会话文本内容进行诉求偏置操作;基于诉求偏置操作后的诉求会话文本内容,获得第二全局诉求文本分布。
应用于本申请实施例,通过整合、诉求偏置等处理可以快速得到用户会话场景、社交话题的联动分析处理的诉求会话文本内容,可以在一定程度上提高用户群体会话日志处理的效率和精度。
在一些可独立实施的实施例中,第一全局诉求文本分布的侧重指标包括社交话题侧重指标和待定侧重指标;调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,包括:通过待定侧重指标从第一全局诉求文本分布中抽样不低于一组诉求会话文本内容,其中,每组诉求会话文本内容包括相同的待定侧重指标下匹配相异社交话题的诉求会话文本内容;调用话题整合引导特征对不低于一组诉求会话文本内容在社交话题侧重指标下进行整合。
应用于本申请实施例,通过待定侧重指标从第一全局诉求文本分布中抽样不低于一组诉求会话文本内容,且每组诉求会话文本内容包括相同的待定侧重指标下匹配相异社交话题的诉求会话文本内容,并调用话题整合引导特征对不低于一组诉求会话文本内容在社交话题侧重指标下进行整合,这样能够减少整合处理的资源消耗,同时可以在一定程度上提高用户群体会话日志处理的效率。
在一些可独立实施的实施例中,待定侧重指标为话题氛围侧重指标;和/或,话题整合引导特征包括Q个整合变量,不低于一组诉求会话文本内容包括Q组第一诉求会话文本内容;调用话题整合引导特征对不低于一组诉求会话文本内容在社交话题侧重指标下进行整合包括:调用话题整合引导特征中第p个整合变量对第p组第一诉求会话文本内容在社交话题侧重指标下进行整合,获得第p组第二诉求会话文本内容,其中,p为不大于Q的正整数。
应用于本申请实施例,通过将与话题整合引导特征中包含的合并变量数目一致数量的第一诉求会话文本内容对应进行整合处理,可以高效确定用户会话场景、社交话题的联动分析处理的诉求会话文本内容,可以在一定程度上提高用户群体会话日志处理的效率和精度。
在一些可独立实施的实施例中,调用话题整合引导特征中第p个整合变量对第p组第一诉求会话文本内容在社交话题侧重指标下进行整合,获得第p组第二诉求会话文本内容包括:确定第p个整合变量落入的线性变量限定集,且该线性变量限定集的第一端点数据与第二端点数据的比较数据为一指定变量值,结合社交话题侧重指标,以及与第一端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第三诉求会话文本内容,并结合社交话题侧重指标,以及与第二端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第四诉求会话文本内容;以第p个整合变量与第二端点数据的数值计算结果作为诉求因子对第p组第一诉求会话文本内容进行诉求偏置操作,获得第p组第一诉求偏置会话文本,并以第一端点数据与第p个整合变量的数值计算结果作为诉求因子对第p组第四诉求会话文本内容进行诉求偏置操作,获得第p组第二诉求偏置会话文本;基于第p组第一诉求偏置会话文本和第p组第二诉求偏置会话文本之间的联合分析结果,确定第p组第二诉求会话文本内容。
应用于本申请实施例,可以及时、有序地对第一诉求会话文本内容进行整合处理,可以在一定程度上提高用户群体会话日志处理的效率。
在一些可独立实施的实施例中,目标用户群体会话日志包括E组目标用户群体会话消息,用户诉求短语包括E个诉求因子变量;基于用户诉求短语对经过整合的诉求会话文本内容进行诉求偏置操作包括:对经过整合的每组诉求会话文本内容,分别基于用户诉求短语中第g个诉求因子变量对当前组诉求会话文本内容中的第g个社交话题对应的会话文本情绪变量进行诉求偏置操作,获得诉求偏置操作后的适配组诉求会话文本内容;其中,g为不大于E的正整数。
应用于本申请实施例,通过对经过整合的每组诉求会话文本内容,分别基于用户诉求短语中第g个诉求因子变量对当前组诉求会话文本内容的第g个社交话题对应的会话文本情绪变量进行诉求偏置操作,获得诉求偏置操作后的适配组诉求会话文本内容,可以在部分需求会话文本内容出现整合遗漏时,对诉求会话文本内容进行二次诉求偏置操作,能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,基于诉求偏置操作后的诉求会话文本内容,获得第二全局诉求文本分布,包括:利用诉求偏置操作后的诉求会话文本内容以及第一全局诉求文本分布中没有经过整合的诉求会话文本内容,确定第二全局诉求文本分布。
应用于本申请实施例,通过诉求偏置操作后的诉求会话文本内容以及第一全局诉求文本分布中没有经过整合的诉求会话文本内容合并成为第二全局诉求会话文本内容,能够降低资源占用率,可以在一定程度上提高用户群体会话日志处理的效率。
在一些可独立实施的实施例中,基于诉求量化处理策略对第一全局诉求文本分布进行处理,获得用户诉求短语,包括:基于诉求量化处理策略的第一会话分布抽取模块对第一全局诉求文本分布进行会话分布抽取,获得第一会话分布抽取信息;基于诉求量化处理策略的第一窗口化挖掘模块对第一会话分布抽取信息进行窗口化挖掘操作,获得第一诉求会话文本挖掘清单;基于诉求量化处理策略的第一用户诉求解析模块对第一诉求会话文本挖掘清单进行用户诉求解析操作,获得用户诉求短语。
应用于本申请实施例,通过第一会话分布抽取模块、第一窗口化挖掘模块和第一用户诉求解析模块对第一全局诉求文本分布进行依次处理,能够得到用户诉求短语,进而能够对诉求量化处理策略的策略进行轻量化升级,进而降低策略变量,可以在一定程度上提高用户群体会话日志处理的策略优化时的策略优化效率,从而能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,调用指定话题整合策略对第一全局诉求文本分布进行处理,获得话题整合引导特征,包括:调用指定话题整合策略的第二会话分布抽取模块对第一全局诉求文本分布进行会话分布抽取,获得第二会话分布抽取信息;调用指定话题整合策略的第二窗口化挖掘模块对第二会话分布抽取信息进行窗口化挖掘操作,获得第二诉求会话文本挖掘清单;调用指定话题整合策略的第一文本整合模块对第二诉求会话文本挖掘清单进行诉求会话文本整合,获得第一诉求会话文本整合数据;调用指定话题整合策略的第二用户诉求解析模块对第一诉求会话文本整合数据进行用户诉求解析操作,获得用户诉求解析操作结果;调用指定话题整合策略的第二文本整合模块对用户诉求解析操作结果进行诉求会话文本整合,获得第二诉求会话文本整合数据;调用指定话题整合策略的第三用户诉求解析模块对第二诉求会话文本整合数据进行用户诉求解析操作,获得话题整合引导特征。
应用于本申请实施例,能够实现指定话题整合策略的轻量化升级,降低策略变量,可以在一定程度上提高用户群体会话日志处理的策略优化时的策略优化效率,从而能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,指定AI策略包括至少一个窗口化挖掘模块;借助指定AI策略对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布,包括:借助指定AI策略的一窗口化挖掘模块对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布;若指定AI策略的窗口化挖掘模块的数目为两个以上,则在得到第二全局诉求文本分布之后,并在借助指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集之前,方法还包括:借助指定AI策略中没有完成诉求会话文本挖掘的窗口化挖掘模块对第二全局诉求文本分布进行诉求会话文本挖掘,获得补充的第一全局诉求文本分布;执行调用指定话题整合策略对补充的第一全局诉求文本分布进行处理,获得话题整合引导特征的步骤以及之后步骤,获得补充的第二全局诉求文本分布;持续实施以上操作,直到指定AI策略的所有窗口化挖掘模块都实现对补充的第二全局诉求文本分布的诉求会话文本挖掘;借助指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集,包括:借助指定AI策略的文本整合模块对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。
应用于本申请实施例,在指定AI策略包括的窗口化挖掘模块数目为两个以上时,借助指定AI策略中没有完成诉求会话文本挖掘的窗口化挖掘模块对第二全局诉求文本分布进行诉求会话文本挖掘,获得补充的第一全局诉求文本分布,并再次实施整合处理等操作,直到指定AI策略中所有窗口化挖掘模块都完成对最新的第二全局诉求文本分布进行诉求会话文本挖掘的步骤,从而借助指定AI策略的文本整合模块对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集,进而能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一些可独立实施的实施例中,目标用户群体会话日志包括多组目标用户群体会话消息,借助指定AI策略对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布包括:借助指定AI策略分别对多组目标用户群体会话消息进行诉求会话文本挖掘,获得与每组目标用户群体会话消息对应的诉求会话文本记录;将若干个诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在目标用户群体会话日志中的社交话题进行组合,获得第一全局诉求文本分布。
应用于本申请实施例,通过指定AI策略分别对目标用户群体会话日志的多组目标用户群体会话消息进行诉求会话文本挖掘,获得与每组目标用户群体会话消息对应的诉求会话文本记录,可以立刻将多个诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在目标用户群体会话日志中的社交话题进行组合,获得第一全局诉求文本分布,能够减少对目标用户群体会话日志进行诉求会话文本挖掘的资源占用率,可以在一定程度上提高用户群体会话日志处理的效率。
在一些可独立实施的实施例中,所述指定AI策略通过如下方式进行配置:采集已认证用户群体会话日志,其中,已认证用户群体会话日志包括先验配置依据;借助指定AI策略对已认证用户群体会话日志进行诉求会话文本挖掘,获得第一已认证全局诉求文本分布,其中,第一已认证全局诉求文本分布包括与已认证用户群体会话日志对应的相异社交话题下的诉求会话文本内容;调用指定话题整合策略对第一已认证全局诉求文本分布进行处理,获得话题整合引导特征;调用话题整合引导特征对第一已认证全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二已认证全局诉求文本分布;借助指定AI策略对第二已认证全局诉求文本分布进行信息推送偏好识别,获得已认证用户群体会话日志的推送偏好知识集;借助先验配置依据和推送偏好知识集确定策略代价;基于策略代价,调整指定AI策略和指定话题整合策略的策略变量。
如此设计,可以直接关注已认证用户群体会话日志的社交话题信息,有助于提高策略配置时的效率,另外,利用社交话题整合思路,可以实现用户会话场景与社交话题的联动分析处理,基于上述内容的综合进行后续的信息推送偏好识别操作,进而有助于之后能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
一种大数据推荐系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
图1是示出可以实现本申请的实施例的大数据推荐系统的一种通信配置的示意图。
图2是示出可以实现本申请的实施例的针对大数据推荐的社交平台互动信息处理方法的流程示意图。
图3是示出可以实现本申请的实施例的针对大数据推荐的社交平台互动信息处理方法的应用环境的架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
本申请实施例的技术方案可以总结如下:通过指定AI策略确定目标用户群体会话日志的第一全局诉求文本分布,并通过指定话题整合策略确定第一全局诉求文本分布对应的话题整合引导特征;基于话题整合引导特征以及第一全局诉求文本分布确定第二全局诉求文本分布,并结合所述指定AI策略确定与所述目标用户群体会话日志对应的推送偏好知识集。应用于本申请实施例,通过话题整合引导特征以及第一全局诉求文本分布,能够确定出尽可能完整丰富的第二全局诉求文本分布,这样能够通过指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,以确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
图1是示出可以实现本申请的实施例的大数据推荐系统100的一种通信配置的框图,大数据推荐系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本申请实施例中针对大数据推荐的社交平台互动信息处理方法的处理器102。
图2是示出可以实现本申请的实施例的针对大数据推荐的社交平台互动信息处理方法的流程示意图,针对大数据推荐的社交平台互动信息处理方法可以通过图1所示的大数据推荐系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
STEP11、响应于所述社交平台系统的信息推送辅助请求,调取目标用户群体会话日志。
就本申请实施例而言,目标用户群体会话日志可以包括多组目标用户群体会话消息,比如,目标用户群体会话日志包括4组/8组/12组目标用户群体会话消息。
在一种可能的实施例中,目标用户群体会话日志可以是会话线程捕捉到的业务交互日志,以对业务交互日志中交互会话事件进行会话解析,比如,跨境支付会话、数字办公会话等等。在另一种可能的实施例中,目标用户群体会话日志可以是会话信息集合中的会话日志,以对会话信息集合中的会话日志进行聚类,比如,智慧医疗会话日志、AR会话日志、VR会话日志等等。此外,信息推送辅助请求社交平台系统向大数据推荐系统发送的,用于请求进行推送偏好/兴趣挖掘分析的申请或者求助。
STEP12、借助指定AI策略对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布。
就本申请实施例而言,为了进一步降低策略变量,减少资源占用率,提高处理效率,提高配置时的策略优化效率,指定AI策略可以是机器学习模型,比如,卷积神经网络、循环神经网络、图卷积神经网络等等。
就本申请实施例而言,第一全局诉求文本分布包括与目标用户群体会话日志对应的相异社交话题(不同的社交话题)下的诉求会话文本内容(诉求/需求特征信息)。
在一种可能的实施例中,为了减少对目标用户群体会话日志进行诉求会话文本挖掘的资源占用率,确保会话日志分析的时效性,可以通过指定AI策略分别对目标用户群体会话日志的多组目标用户群体会话消息进行诉求会话文本挖掘,获得每组目标用户群体会话消息对应的诉求会话文本记录,可以立刻将多个诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在目标用户群体会话日志中的社交话题进行组合,获得第一全局诉求文本分布。比如,目标用户群体会话日志包括4组目标用户群体会话消息,则可以借助指定AI策略分别对这4组目标用户群体会话消息进行诉求会话文本挖掘,获得每组目标用户群体会话消息的诉求会话文本记录(比如可以理解为诉求特征分布/诉求特征图/需求特征分布/需求特征图),继而直接将4组诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在目标用户群体会话日志中的社交话题进行组合(比如可以是融合或者拼接),获得第一全局诉求文本分布。
STEP13、调用指定话题整合策略对第一全局诉求文本分布进行处理,获得话题整合引导特征。
就本申请实施例而言,相异于传统的单一目标用户群体会话消息,会话日志一般而言更加注重于交互会话事件动态的状态变化,因此为了更好地获取会话日志的隐藏社交话题标签,可以联合社交话题信息和用户会话场景信息进行分析。因此,就本申请实施例而言,借助指定话题整合策略处理得到话题整合引导特征,以在之后基于该话题整合引导特征进行社交话题整合,从而完成社交话题信息和用户会话场景的合并。指定话题整合策略示例性可以为是一指定AI策略,从而可以通过该指定AI策略对第一全局诉求文本分布进行处理,高效地获得话题整合引导特征。
在一种可能的实施例中,指定话题整合策略可以包括存在先后传递关系的会话分布抽取模块(可以理解为降采样层)、窗口化挖掘模块(可以理解为卷积层)、文本整合模块(可以理解为全连接层)、用户诉求解析模块(可以理解为激活层)、文本整合模块和用户诉求解析模块。因此,指定话题整合策略包括5个模块,且其中只有窗口化挖掘模块和文本整合模块包含策略变量,能够实现策略的轻量化升级,并降低策略变量,进而能够降低策略占用量,能够显著提高策略策略优化效率,以使得配置所得到的测绿能够尽可能的精确,进而能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在实际实施时,可以调用指定话题整合策略的会话分布抽取模块对第一全局诉求文本分布进行会话分布抽取(比如,降采样处理),获得会话分布抽取信息。在一种可能的实施例中,会话分布抽取模块示例性可以为是整体性抽样模块,第一全局诉求文本分布的侧重指标包括社交话题侧重指标和待定侧重指标(比如话题氛围侧重指标)。
在上述内容的基础上,可以调用指定话题整合策略的窗口化挖掘模块对会话分布抽取信息进行窗口化挖掘操作,获得诉求会话文本挖掘清单,指定话题整合策略的窗口化挖掘模块示例性可以为包含数目与目标用户群体会话日志的组数一致的窗口化节点(比如卷积核),窗口化节点的大小可以为6*6。并调用指定话题整合策略的第一个文本整合模块对诉求会话文本挖掘清单进行诉求会话文本整合,获得诉求会话文本整合数据,指定话题整合策略的第一个文本整合模块可以包含数目与目标用户群体会话日志的组数一致的处理单元。并调用指定话题整合策略的第一个用户诉求解析模块对诉求会话文本整合数据进行用户诉求解析操作,获得用户诉求解析操作结果,指定话题整合策略的第一个用户诉求解析模块可以是RELU单元中的用户诉求解析模块。并调用指定话题整合策略的第二个文本整合模块对用户诉求解析操作结果进行诉求会话文本整合,获得诉求会话文本整合数据;再调用指定话题整合策略的第二个用户诉求解析模块对诉求会话文本整合数据进行用户诉求解析操作,获得话题整合引导特征,指定话题整合策略的第二个用户诉求解析模块可以是基于逻辑回归函数的用户诉求解析模块,从而能够将话题整合引导特征中的各个特征成员进行标准化处理,从而保障各特征成员的描述值处于[0,1]这个区间。
在实际实施时,可以将调用指定话题整合策略的第二个用户诉求解析模块对诉求会话文本整合数据进行用户诉求解析操作得到的话题整合引导特征中的各个特征成员分别进行调整,并将进行调整后所得到的结果与目标用户群体会话日志的组数进行加权,从而得到最终的话题整合引导特征。此外,话题整合引导特征可以用于指示不同社交话题的整合,从而保障诉求特征的完整性。
STEP14、调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二全局诉求文本分布。
就本申请实施例而言,为了使部分诉求会话文本内容中对应于相异社交话题下的信息能够得到整合,从而合并社交话题信息和用户会话场景信息,会话需求挖掘和推送预处理的质量,部分诉求会话文本内容示例性可以为是基于待定侧重指标(比如,话题氛围侧重指标)进行拆解而得到的。另外,还可以调用话题整合引导特征对第一全局诉求文本分布的所有诉求会话文本内容进行社交话题整合。
在一种可能的实施例中,为了减少整合处理资源占用率,确保会话日志分析的时效性,还可以通过待定侧重指标(比如话题氛围侧重指标)从第一全局诉求文本分布中抽样不低于一组诉求会话文本内容,其中,每组诉求会话文本内容包括相同待定侧重指标(比如话题氛围侧重指标)上匹配相异社交话题的诉求会话文本内容,可以理解,指定话题整合策略第二个文本整合模块可以包含数目与所抽样的诉求会话文本内容的组数一致的处理单元,从而话题整合引导特征中的特征成员的数量与所抽样的诉求会话文本内容的组数相同,进而可以调用话题整合引导特征中的各个特征成员分别对不低于一组诉求会话文本内容在社交话题侧重指标下进行整合,比如,在社交话题侧重指标下整合一个社交话题环节,或者,在社交话题侧重指标下整合两个社交话题环节等。
在调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合之后,可以将社交话题经过整合的部分诉求会话文本内容与第一全局诉求文本分布中没有进行社交话题整合的部分诉求会话文本内容进行组合,从而得到第二全局诉求文本分布。
STEP15、借助指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。
就本申请实施例而言,可以借助指定AI策略的文本整合模块对第二全局诉求文本分布进行诉求会话文本整合,借助指定AI策略的归一化单元进行处理(比如可以是预测处理),从而得到目标用户群体会话日志所对应的属性标签(比如,智慧医疗会话日志、VR会话日志等),或者,还可以得到目标用户群体会话日志中交互会话事件的业务交互属性标签。
此外,推送偏好知识集能够反映目标用户群体会话日志对应的用户群体的推送偏好/推送兴趣/推送需求,这样,大数据推荐系统可以将推送偏好知识集返回给社交平台系统,从而使得社交平台系统能够根据推送偏好知识集进行信息推送的处理和规划,以提高后续社交平台系统的推送精度。进一步地,由于推送偏好知识集的确定是通过大数据推荐系统实现的,对于一些数据量较大的目标用户群体会话日志而言,具有较强算力的大数据推荐系统能够保障推送偏好知识集确定的时效性,从而避免在社交平台系统侧进行推送偏好知识集识别导致的系统过载现象。
在一种可能的实施例中,为了提高处理的灵活性,指定话题整合策略可以设置在指定AI策略的窗口化挖掘模块之前,比如,指定AI策略为RNN,指定话题整合策略可以设置在每个循环单元中的窗口化挖掘模块之前。在一种可能的实施例中,指定策略层可以包括至少一个窗口化挖掘模块,从而在诉求会话文本挖掘过程中,可以借助指定AI策略的一窗口化挖掘模块对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布。
在一种可能的实施例中,为了会话需求挖掘和推送预处理的质量,指定AI策略的窗口化挖掘模块可以为两个以上,比如,4个、6个、8个等等,因此在对第二全局诉求文本分布进行信息推送偏好识别之前,还可以借助指定AI策略中没有完成诉求会话文本挖掘的窗口化挖掘模块对第二全局诉求文本分布进行诉求会话文本挖掘,获得补充的第一全局诉求文本分布,在实际实施时,补充的第一全局诉求文本分布在社交话题侧重指标下可以维持指标保持不变,并实施调用指定话题整合策略对补充的第一全局诉求文本分布进行处理,获得话题整合引导特征的步骤以及之后步骤,从而得到新的第二全局诉求文本分布,并持续实施以上操作,直到指定AI策略的所有窗口化挖掘模块都实现对补充的第二全局诉求文本分布的诉求会话文本挖掘,再借助指定AI策略的文本整合模块对最后确定出的第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。举例而言,以指定AI策略包括6个窗口化挖掘模块为例,目标用户群体会话日志通过指定AI策略的第一个窗口化挖掘模块进行诉求会话文本挖掘得到第一全局诉求文本分布之后,借助以上相关操作进行社交话题整合,获得第二全局诉求文本分布,在借助指定AI策略的文本整合模块进行信息推送偏好识别处理之前,还可以进一步将该第二全局诉求文本分布导入第二个窗口化挖掘模块进行诉求会话文本挖掘,获得补充的第一全局诉求文本分布,并通过以上相关操作对补充的第一全局诉求文本分布进行社交话题整合,获得新的第二全局诉求文本分布,相应的,借助第三个窗口化挖掘模块对该新的第二全局诉求文本分布进行诉求会话文本挖掘,又得到一个补充的第一全局诉求文本分布,并通过以上相关操作对补充的第一全局诉求文本分布进行社交话题整合,获得新的第二全局诉求文本分布,可以理解,指定AI策略的三个窗口化挖掘模块已所有实施完成诉求会话文本挖掘步骤,可以借助预设策略的文本整合模块对最新得到的第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。可以理解,在另外的实施例中,为了减少资源占用率,也可以只在部分窗口化挖掘模块之后实施社交话题整合步骤。
应用上述技术方案,通过对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布,且第一全局诉求文本分布包括与目标用户群体会话日志对应的相异社交话题下的诉求会话文本内容,并调用指定话题整合策略对第一全局诉求文本分布进行处理,获得话题整合引导特征,从而调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二全局诉求文本分布,进而通过重点关注目标用户群体会话日志的社交话题信息,可以在一定程度上提高用户群体会话日志处理的效率,另外,利用社交话题整合思路,可以实现用户会话场景与社交话题的联动分析处理,基于上述内容的综合进行后续的信息推送偏好识别操作,能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
可以理解的是,就本申请实施例而言,话题整合引导特征包括Q个整合变量,还可以将第一全局诉求文本分布的至少部分沿待定侧重指标(比如,话题氛围侧重指标)拆解为Q组第一诉求会话文本内容,则可以调用话题整合引导特征中第p个整合变量对第p组第一诉求会话文本内容在社交话题侧重指标下进行整合,获得第p组第二诉求会话文本内容,其中,p为不大于Q的正整数。举例而言,第一全局诉求文本分布的至少部分包括两组第一诉求会话文本内容,则可以调用话题整合引导特征中的第一个整合变量对第一组第一诉求会话文本内容在社交话题侧重指标下进行整合,获得第一组第二诉求会话文本内容,并调用话题整合引导特征中的第二个整合变量对第二组第一诉求会话文本内容在社交话题侧重指标下进行整合,获得第二组第二诉求会话文本内容。
对于一种可独立实施的技术方案而言,该技术方案还可以包括如下内容。
STEP141、确定第p个整合变量落入的线性变量限定集,且线性变量限定集的第一端点数据与第二端点数据的比较数据为一指定变量值。
就本申请实施例而言,指定变量值可以为1,线性变量限定集(可以理解为数值范围)的第二端点数据为对第p个整合变量进行第一变量转换之后的结果,线性变量限定集的第一端点数据为对第p个整合变量进行第二变量转换之后的结果,可以理解的是,对于第p个整合变量par_p,其线性变量限定集可记录成(p0,p0+1)。比如,当整合变量为0.9时,其线性变量限定集为[0,1];或者,当整合变量为1.5时,其线性变量限定集为[1,2],当整合变量为其他数值时,可以逐一推算,本申请实施例在此不在一一列举示例。如此设计,在整合变量为非整数的情况下,可以精简之后社交话题整合的处理过程。其中,第一端点数据可以理解为上限值,第二端点数据可以理解为下限值。
STEP142、结合社交话题侧重指标,以及与第一端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第三诉求会话文本内容,并结合社交话题侧重指标,以及与第二端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第四诉求会话文本内容。
在一种可能的实施例中,每个整合变量可能为非整数,比如,每个整合变量的线性变量限定集为[0,1],以上第一端点数据为1,第二端点数据为0,指定变量值为1,因此对于第p组第一诉求会话文本内容text_p而言,对应的第三诉求会话文本内容可记录成text_p+1,对应的第四诉求会话文本内容可记录成text_p。
STEP143、以第p个整合变量与第二端点数据的数值计算结果作为诉求因子对第p组第三诉求会话文本内容进行诉求偏置操作,获得第p组第一诉求偏置会话文本,并以第一端点数据与第p个整合变量的数值计算结果作为诉求因子对第p组第四诉求会话文本内容进行诉求偏置操作,获得第p组第二诉求偏置会话文本。
就本申请实施例而言,以第p个整合变量表示为par_p为例,故当第p个整合变量的线性变量限定集表示为(p0,p0+1)时,以第p个整合变量par_p与第二端点数据(即p0)的数值计算结果(即par_p-p0)作为诉求因子(权重)对第p组第三诉求会话文本内容进行诉求偏置操作,获得对应的第一诉求偏置会话文本,并以第一端点数据(即p0+1)与第p个整合变量par_p的数值计算结果(即p0+1-par_p)作为诉求因子对第p组第四诉求会话文本内容进行诉求偏置操作(比如基于诉求维度的加权处理),获得对应的第二诉求偏置会话文本。
STEP144、基于第p组第一诉求偏置会话文本和第p组第二诉求偏置会话文本之间的联合分析结果,确定第p组第二诉求会话文本内容。
在一种可能的实施例中,每个整合变量可能为非整数,比如,每个整合变量的线性变量限定集为[0,1],即上述第一端点数据为1,第二端点数据为0,指定变量值为1,就第一诉求会话文本内容text_p而言,第一诉求偏置会话文本可记录成par_ptext_p+1,第二诉求偏置会话文本可记录成(1-par_p)text_p,故第p组第二诉求会话文本内容可记录成(1-par_p)text_p+par_ptext_p+1。
结合上述内容,通过确定第p个整合变量落入的线性变量限定集,且该线性变量限定集的第一端点数据与第二端点数据的比较数据为一指定变量值,结合社交话题侧重指标,以及与第一端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第三诉求会话文本内容,并结合社交话题侧重指标,以及与第二端点数据对应的社交话题等级,对第p组第一诉求会话文本内容进行处理,获得第p组第四诉求会话文本内容;以第p个整合变量与第二端点数据的数值计算结果作为诉求因子对第p组第一诉求会话文本内容进行诉求偏置操作,获得第p组第一诉求偏置会话文本,并以第一端点数据与第p个整合变量的数值计算结果作为诉求因子对第p组第四诉求会话文本内容进行诉求偏置操作,获得第p组第二诉求偏置会话文本;基于第p组第一诉求偏置会话文本和第p组第二诉求偏置会话文本之间的联合分析结果,确定第p组第二诉求会话文本内容,进而能够及时有效地对第一诉求会话文本内容进行整合处理,可以在一定程度上提高用户群体会话日志处理的效率。
对于一种可独立实施的技术方案而言,本申请针对大数据推荐的社交平台互动信息处理方法另一实施例可以包括如下内容。
STEP51、响应于所述社交平台系统的信息推送辅助请求,调取目标用户群体会话日志。
STEP52、借助指定AI策略对目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布。
STEP53、调用指定话题整合策略对第一全局诉求文本分布进行处理,获得话题整合引导特征。
STEP54、基于诉求量化处理策略对第一全局诉求文本分布进行处理,获得用户诉求短语。
就本申请实施例而言,在社交话题整合时,第一诉求会话文本内容首尾的诉求会话文本具有一定概率被忽略,为准确分析社交话题经过整合的第一诉求会话文本内容中各诉求会话文本的重要性,可以采用局部聚焦思路对经社交话题经过整合的第一诉求会话文本内容中各诉求会话文本进行二次诉求偏置操作,基于此,用户诉求短语是不可缺少的。进一步地,可以基于诉求量化处理策略对第一全局诉求文本分布进行处理,获得用户诉求短语。
在一种可能的实施例中,诉求量化处理策略可以包括存在先后传递关系的会话分布抽取模块、窗口化挖掘模块和用户诉求解析模块。因此,诉求量化处理策略仅包括3个模块,且其中仅窗口化挖掘模块包含策略变量,能够实现策略的轻量化升级,并降低策略变量,进而能够降低策略占用量,能够显著提高策略策略优化效率,以使得配置所得到的测绿能够尽可能的精确,进而能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在实际实施时,可以基于诉求量化处理策略的会话分布抽取模块对第一全局诉求文本分布进行会话分布抽取,获得会话分布抽取信息。在一种可能的实施例中,会话分布抽取模块可以是整体性抽样模块。进一步地,可以调用指定话题整合策略的窗口化挖掘模块对会话分布抽取信息进行窗口化挖掘操作的,获得诉求会话文本挖掘清单,指定话题整合策略的窗口化挖掘模块中可以包含1个窗口化节点,并基于诉求量化处理策略的用户诉求解析模块对诉求会话文本挖掘清单进行用户诉求解析操作,获得用户诉求短语,该用户诉求解析模块可以是基于逻辑回归函数的用户诉求解析模块,从而能够将用户诉求短语中的各个特征成员进行标准化处理,从而保障各特征成员的描述值处于[0,1]这个区间。
另外,本申请实施例中的指定话题整合策略和诉求量化处理策略可以设置在指定AI策略的窗口化挖掘模块之前,比如,指定AI策略为RNN,指定话题整合策略和诉求量化处理策略可以设置在每个循环单元的窗口化挖掘模块之前,从而分别利用第一全局诉求文本分布,处理得到话题整合引导特征和用户诉求短语,以便后续整合与诉求偏置操作,从而能够在RNN已有的策略变量的前提下,配置较少的策略变量实现社交话题信息的分析,有利于降低会话日志分析的资源占用率,提高会话日志分析的效率,从而保障策略配置的质量,提高会话日志分析的精度和可信度。
STEP55、调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合。
STEP56、基于用户诉求短语对经过整合的诉求会话文本内容进行诉求偏置操作。
在一种可能的实施例中,目标用户群体会话日志示例性可以为包括E组目标用户群体会话消息,用户诉求短语可以包括E个诉求因子变量,E示例性可以为是不同数值。因此在诉求偏置操作时,可以对经过整合的每组诉求会话文本内容,分别基于用户诉求短语中的第g个诉求因子变量对当前组诉求会话文本内容中的第g个社交话题对应的会话文本情绪变量进行诉求偏置操作,获得诉求偏置操作后的适配组诉求会话文本内容,其中,g为不大于E的正整数。
以上述实施例中整合处理后的诉求会话文本内容[r0,e0,z0,z0,z0,z0,z0,r0]为例,用户诉求短语可以为[r1,e1,z1,z1,z1,z1,z1,r1],则分别基于用户诉求短语中的第g个诉求因子变量对上述诉求会话文本内容中的第g个社交话题对应的会话文本情绪变量进行诉求偏置操作后,获得对应组的诉求会话文本内容为[r2,e2,z2,z2,z2,z2,z2,r2]。
STEP57、基于诉求偏置操作后的诉求会话文本内容,获得第二全局诉求文本分布。
可以理解的是,经过社交话题整合和诉求偏置操作之后,即可得到与第一全局诉求文本分布对应的第二全局诉求文本分布。在一种可能的实施例中,可以利用诉求偏置操作后的诉求会话文本内容以及第一全局诉求文本分布中没有经过整合的诉求会话文本内容,确定第二全局诉求文本分布。在实际实施时,可以将诉求偏置操作后的诉求会话文本内容与第一全局诉求文本分布中没有经过整合的诉求会话文本内容进行组合处理,获得第二全局诉求文本分布。得到的第二全局诉求文本分布与第一全局诉求文本分布具有相同的规模。另外,若第一全局诉求文本分布中的诉求会话文本内容均进行了社交话题整合处理,则可以直接将诉求偏置操作后的诉求会话文本内容进行组合,作为第二全局诉求文本分布。
STEP58、借助指定AI策略对第二全局诉求文本分布进行信息推送偏好识别,获得目标用户群体会话日志的推送偏好知识集。
应用于上述相关实施例,基于诉求量化处理策略(比如预测模型)对第一全局诉求文本分布进行处理,获得用户诉求短语,并调用话题整合引导特征对第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,且基于用户诉求短语对经过整合的诉求会话文本内容进行诉求偏置操作,并基于诉求偏置操作后的诉求会话文本内容,获得第二全局诉求文本分布,因此通过整合、诉求偏置等处理可以快速得到用户会话场景、社交话题的联动分析处理的诉求会话文本内容,可以在一定程度上提高用户群体会话日志处理的效率和精度。
对于一种可独立实施的技术方案而言,本申请中的指定AI策略的配置可以包括如下内容。
STEP71、采集已认证用户群体会话日志。
就本申请实施例而言,已认证用户群体会话日志包括先验配置依据。以对会话日志进行会话解析为例,已认证用户群体会话日志的先验配置依据可以包括多类注释。或者,以对会话日志进行聚类为例,已认证用户群体会话日志的先验配置依据可以包括但不限于:智慧医疗会话日志、AR会话日志、VR会话日志,其他应用场景可以逐一推算,本申请实施例在此不在一一列举示例。
本申请实施例中,已认证用户群体会话日志可以包括多组目标用户群体会话消息,比如,可以包括4组目标用户群体会话消息,或者,也可以包括8组目标用户群体会话消息,或者,还可以包括12组目标用户群体会话消息。
STEP72、借助指定AI策略对已认证用户群体会话日志进行诉求会话文本挖掘,获得第一已认证全局诉求文本分布。
在一种可能的实施例中,为了进一步降低策略变量,减少资源占用率,提高处理效率,提高配置时的策略优化效率,指定AI策略可以是机器学习模型。
本申请实施例中,第一已认证全局诉求文本分布包括与已认证用户群体会话日志对应的相异社交话题下的诉求会话文本内容。在一种可能的实施例中,为了减少对已认证用户群体会话日志进行诉求会话文本挖掘的资源占用率,提高会话日志分析的效率,可以通过指定AI策略分别对已认证用户群体会话日志的多组目标用户群体会话消息进行诉求会话文本挖掘,获得每组目标用户群体会话消息对应的诉求会话文本记录,可以立刻将多个诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在已认证用户群体会话日志中的社交话题进行组合,获得第一已认证全局诉求文本分布。比如,已认证用户群体会话日志包括4组目标用户群体会话消息,则可以借助指定AI策略分别对这4组目标用户群体会话消息进行诉求会话文本挖掘,获得每组目标用户群体会话消息的诉求会话文本记录,继而直接将4组诉求会话文本记录按照与该诉求会话文本记录对应的目标用户群体会话消息在已认证用户群体会话日志中的社交话题进行组合,获得第一已认证全局诉求文本分布。
STEP73、调用指定话题整合策略对第一已认证全局诉求文本分布进行处理,获得话题整合引导特征。
STEP74、调用话题整合引导特征对第一已认证全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二已认证全局诉求文本分布。
在一种可能的实施例中,指定AI策略可以包括至少一个窗口化挖掘模块,则可以借助指定AI策略的一窗口化挖掘模块对已认证用户群体会话日志进行诉求会话文本挖掘,获得第一已认证全局诉求文本分布。在一种可能的实施例中,指定AI策略的窗口化挖掘模块的数目可以为两个以上个,则可以借助指定AI策略中没有完成诉求会话文本挖掘的窗口化挖掘模块对第二已认证全局诉求文本分布进行诉求会话文本挖掘,获得新的第一已认证全局诉求文本分布,并实施调用指定话题整合策略对新的第一已认证全局诉求文本分布进行处理,获得话题整合引导特征的相关步骤,从而得到新的第二已认证全局诉求文本分布,进而持续实施以上操作,直到指定AI策略的所有窗口化挖掘模块均完成对最新的第二已认证全局诉求文本分布的诉求会话文本挖掘步骤。
STEP75、借助指定AI策略对第二已认证全局诉求文本分布进行信息推送偏好识别,获得已认证用户群体会话日志的推送偏好知识集。
在实际实施时,可以借助指定AI策略的文本整合模块对第二已认证全局诉求文本分布进行信息推送偏好识别,获得已认证用户群体会话日志的推送偏好知识集。在一种可能的实施例中,可以借助指定AI策略的文本整合模块对第二已认证全局诉求文本分布进行诉求会话文本整合,借助指定AI策略的归一化单元进行处理,从而得到已认证用户群体会话日志属于各个属性标签(如,智慧医疗会话日志、VR会话日志等)的可能性值。
STEP76、借助先验配置依据和推送偏好知识集确定策略代价。
在实际实施时,可以通过各类损失函数对先验配置依据和推送偏好知识集进行策略代价确定。
STEP77、基于策略代价,调整指定AI策略和指定话题整合策略的策略变量。
在一种可能的实施例中,基于以上内容,还可以基于诉求量化处理策略对第一已认证全局诉求文本分布进行处理,获得用户诉求短语,从而基于用户诉求短语对经过整合的诉求会话文本内容进行诉求偏置操作,并基于诉求偏置操作后的诉求会话文本内容,获得第二样本全局诉求会话文本内容,因此,基于策略代价,还可以调整指定AI策略和指定话题整合策略、诉求量化处理策略的策略变量。在实际实施时,可以调整指定AI策略中的窗口化挖掘模块、文本整合模块的策略变量,并调整指定话题整合策略中的窗口化挖掘模块、文本整合模块的策略变量,并调整诉求量化处理策略中的窗口化挖掘模块的策略变量。在实际实施时,可以通过最优处理策略来调整策略变量,比如梯度下降法。
在一种可能的实施例中,在调整策略变量之后,还可以再次实施以上STEP72以及之后步骤,直到确定得到的策略代价符合设定配置终止要求为至。在实际实施时,设定配置终止要求可以包括:策略代价小于一设定差异值,且策略代价趋于稳定。
可以理解的是,通过对已认证用户群体会话日志进行诉求会话文本挖掘,获得第一已认证全局诉求文本分布,且第一已认证全局诉求文本分布包括与已认证用户群体会话日志对应的相异社交话题下的诉求会话文本内容,并调用指定话题整合策略对第一已认证全局诉求文本分布进行处理,获得话题整合引导特征,从而调用话题整合引导特征对第一已认证全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的诉求会话文本内容得到第二已认证全局诉求文本分布,进而可以直接关注已认证用户群体会话日志的社交话题信息,有助于提高策略配置时的效率,另外,利用社交话题整合思路,可以实现用户会话场景与社交话题的联动分析处理,基于上述内容的综合进行后续的信息推送偏好识别操作,进而有助于之后能够确保推送偏好知识集的会话场景与社交话题的高度相关,进而提升推送偏好知识集的精度和可信度。
在一种可独立的实施例中,在获得所述目标用户群体会话日志的推送偏好知识集之后,该方法还可以包括如下内容:将所述推送偏好知识集返回给所述社交平台系统;响应于所述社交平台系统基于所述推送偏好知识集进行信息推送时反馈的用户评价数据,对所述用户评价数据进行语言情绪分析,得到所述用户评价数据的语言情绪分析结果;通过所述语言情绪分析结果,确定所述社交平台系统基于所述推送偏好知识集进行信息推送的推送满意度。
可以理解的是,社交平台系统在接收到推送偏好知识集之后,可以根据推送偏好知识集定制信息推送方案,并根据信息推送方案对相关用户群体进行信息推送,并将推送过程中接收到的用户评价数据反馈给大数据推荐系统,以供大数据推荐系统进行推送满意度确定。进一步地,对所述用户评价数据进行语言情绪分析,得到所述用户评价数据的语言情绪分析结果同样可以基于AI模型实现,继而可以通过语言情绪分析结果对应的情感词汇向量,从预设SQL数据库中确定对应的推送满意度数据,以精准确定所述社交平台系统的信息推送质量。
在一种可独立的实施例中,对所述用户评价数据进行语言情绪分析,得到所述用户评价数据的语言情绪分析结果,可以包括如下内容:获取用户评价数据中的评论观点词特征分布和评论观点句特征分布;依据所述用户评价数据中的评论观点词特征分布和评论观点句特征分布之间的特征分布相关性系数,对所述用户评价数据中的评论观点词特征分布和评论观点句特征分布进行联动处理,得到特征分布联动特征分布;将联动处理未成功的评论观点句特征分布确定为待配对评论观点句特征分布,根据所述特征分布联动特征分布中的评论观点句特征分布与所述待配对评论观点句特征分布之间的特征分布量化差异,确定与所述待配对评论观点句特征分布相配对的情感要素;对与所述待配对评论观点句特征分布相配对的情感要素和所述待配对评论观点句特征分布进行联动处理,得到情感要素联动特征分布;根据所述情感要素联动特征分布和所述特征分布联动特征分布,确定所述用户评价数据中的情绪极性变化信息。
在本申请实施例中,联动处理可以理解为绑定处理,通过从词层面和句子层面进行特征联动分析,能够完整准确地得到用户评价数据的情绪极性变化信息,从而为后续的推送满意度确定提供精准可信的决策依据。
在一种可独立的实施例中,所述获取用户评价数据中的评论观点词特征分布和评论观点句特征分布,包括:获取所述用户评价数据中的不少于两个评论观点词向量和不少于两个评论观点句向量;获取所述不少于两个评论观点词向量之间的评论观点词向量量化差异和评论观点词向量相似度,获取所述不少于两个评论观点句向量之间的评论观点句向量量化差异和评论观点句向量相似度;根据所述评论观点词向量量化差异和所述评论观点词向量相似度,对所述不少于两个评论观点词向量进行拼接,得到所述用户评价数据中的评论观点词特征分布;一个评论观点词特征分布包括不少于一个评论观点词向量;根据所述评论观点句向量量化差异和所述评论观点句向量相似度,对所述不少于两个评论观点句向量进行拼接,得到所述用户评价数据中的评论观点句特征分布;一个评论观点句特征分布包括不少于一个评论观点句向量。如此设计,可以确保评论观点词特征分布和评论观点句特征分布的完整性,避免评论观点词特征分布和评论观点句特征分布出现缺失。
图3是示出可以实现本申请的实施例的针对大数据推荐的社交平台互动信息处理方法的应用环境的架构示意图,针对大数据推荐的社交平台互动信息处理方法的应用环境中可以包括互相通信的大数据推荐系统100和社交平台系统200。基于此,大数据推荐系统100和社交平台系统200在运行时实现或者部分实现本申请实施例的针对大数据推荐的社交平台互动信息处理方法。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。

Claims (10)

1.一种针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述方法应用于大数据推荐系统,所述大数据推荐系统与社交平台系统通信,该方法至少包括:
通过指定AI策略确定目标用户群体会话日志的第一全局诉求文本分布,并通过指定话题整合策略确定第一全局诉求文本分布对应的话题整合引导特征;
基于话题整合引导特征以及第一全局诉求文本分布确定第二全局诉求文本分布,并结合所述指定AI策略确定与所述目标用户群体会话日志对应的推送偏好知识集。
2.根据权利要求1所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述通过指定AI策略确定目标用户群体会话日志的第一全局诉求文本分布,并通过指定话题整合策略确定第一全局诉求文本分布对应的话题整合引导特征,包括:响应于所述社交平台系统的信息推送辅助请求,调取目标用户群体会话日志;借助指定AI策略对所述目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布;其中,所述第一全局诉求文本分布包括与所述目标用户群体会话日志对应的相异社交话题下的诉求会话文本内容;调用指定话题整合策略对所述第一全局诉求文本分布进行处理,获得话题整合引导特征;
所述基于话题整合引导特征以及第一全局诉求文本分布确定第二全局诉求文本分布,并结合所述指定AI策略确定与所述目标用户群体会话日志对应的推送偏好知识集,包括:结合所述话题整合引导特征对所述第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的所述诉求会话文本内容得到第二全局诉求文本分布;结合所述指定AI策略对所述第二全局诉求文本分布进行信息推送偏好识别,获得所述目标用户群体会话日志的推送偏好知识集。
3.根据权利要求2所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,在所述结合所述话题整合引导特征对所述第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的所述诉求会话文本内容得到第二全局诉求文本分布之前,还包括:
基于诉求量化处理策略对所述第一全局诉求文本分布进行处理,获得用户诉求短语;
所述结合所述话题整合引导特征对所述第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,以及,通过整合成功的所述诉求会话文本内容得到第二全局诉求文本分布,包括:
结合所述话题整合引导特征对所述第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合;
结合所述用户诉求短语对经过整合的所述诉求会话文本内容进行诉求偏置操作;
基于经过诉求偏置操作的所述诉求会话文本内容,获得第二全局诉求文本分布。
4.根据权利要求3所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述第一全局诉求文本分布的侧重指标包括社交话题侧重指标和待定侧重指标;
所述结合所述话题整合引导特征对所述第一全局诉求文本分布的部分诉求会话文本内容进行社交话题整合,包括:
通过待定侧重指标从第一全局诉求文本分布中抽样不低于一组诉求会话文本内容,其中,每组诉求会话文本内容包括相同的待定侧重指标下匹配相异社交话题的诉求会话文本内容;
结合所述话题整合引导特征对所述不低于一组诉求会话文本内容在社交话题侧重指标下进行整合。
5.根据权利要求4所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述待定侧重指标为话题氛围侧重指标,以及,所述话题整合引导特征包括Q个整合变量,所述不低于一组诉求会话文本内容包括Q组第一诉求会话文本内容;
所述结合所述话题整合引导特征对所述不低于一组诉求会话文本内容在社交话题侧重指标下进行整合包括:
结合所述话题整合引导特征中第p个所述整合变量对第p组所述第一诉求会话文本内容在所述社交话题侧重指标下进行整合,获得第p组第二诉求会话文本内容,其中,所述p为不大于所述Q的正整数;
其中,所述结合所述话题整合引导特征中第p个所述整合变量对第p组所述第一诉求会话文本内容在所述社交话题侧重指标下进行整合,获得第p组第二诉求会话文本内容包括:
确定第p个所述整合变量落入的线性变量限定集,且所述线性变量限定集的第一端点数据与第二端点数据的比较数据为一指定变量值;
结合所述社交话题侧重指标,以及与所述第一端点数据对应的社交话题等级,对第p组所述第一诉求会话文本内容进行处理,获得第p组第三诉求会话文本内容,并结合所述社交话题侧重指标,以及与所述第二端点数据对应的社交话题等级,对第p组所述第一诉求会话文本内容进行处理,获得第p组第四诉求会话文本内容;
以第p个所述整合变量与所述第二端点数据的数值计算结果作为诉求因子对第p组所述第三诉求会话文本内容进行诉求偏置操作,获得第p组第一诉求偏置会话文本,并以所述第一端点数据与所述第p个整合变量的数值计算结果作为诉求因子对第p组所述第四诉求会话文本内容进行诉求偏置操作,获得第p组第二诉求偏置会话文本;
基于所述第p组第一诉求偏置会话文本和第p组第二诉求偏置会话文本之间的联合分析结果,确定第p组所述第二诉求会话文本内容。
6.根据权利要求4所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述目标用户群体会话日志包括E组目标用户群体会话消息,所述用户诉求短语包括所述E个诉求因子变量;
所述结合所述用户诉求短语对经过整合的所述诉求会话文本内容进行诉求偏置操作包括:
对经过整合的每组诉求会话文本内容,分别结合所述用户诉求短语中第g个诉求因子变量对当前组诉求会话文本内容中的第g个社交话题对应的会话文本情绪变量进行诉求偏置操作,获得诉求偏置操作后的适配组诉求会话文本内容;其中,所述g为不大于所述E的正整数。
7.根据权利要求3所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述基于诉求量化处理策略对所述第一全局诉求文本分布进行处理,获得用户诉求短语,包括:
结合所述诉求量化处理策略的第一会话分布抽取模块对所述第一全局诉求文本分布进行会话分布抽取,获得第一会话分布抽取信息;
结合所述诉求量化处理策略的第一窗口化挖掘模块对所述第一会话分布抽取信息进行窗口化挖掘操作,获得第一诉求会话文本挖掘清单;
结合所述诉求量化处理策略的第一用户诉求解析模块对所述第一诉求会话文本挖掘清单进行用户诉求解析操作,获得所述用户诉求短语;
其中,所述基于经过诉求偏置操作的所述诉求会话文本内容,获得第二全局诉求文本分布,包括:结合经过诉求偏置操作的所述诉求会话文本内容以及所述第一全局诉求文本分布中没有经过整合的诉求会话文本内容,确定所述第二全局诉求文本分布。
8.根据权利要求2所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述调用指定话题整合策略对所述第一全局诉求文本分布进行处理,获得话题整合引导特征,包括:
调用所述指定话题整合策略的第二会话分布抽取模块对所述第一全局诉求文本分布进行会话分布抽取,获得第二会话分布抽取信息;
基于所述指定话题整合策略的第二窗口化挖掘模块对所述第二会话分布抽取信息进行窗口化挖掘操作,获得第二诉求会话文本挖掘清单;
通过所述指定话题整合策略的第一文本整合模块对所述第二诉求会话文本挖掘清单进行诉求会话文本整合,获得第一诉求会话文本整合数据;
依据所述指定话题整合策略的第二用户诉求解析模块对所述第一诉求会话文本整合数据进行用户诉求解析操作,获得用户诉求解析操作结果;
采用所述指定话题整合策略的第二文本整合模块对所述用户诉求解析操作结果进行诉求会话文本整合,获得第二诉求会话文本整合数据;
利用所述指定话题整合策略的第三用户诉求解析模块对所述第二诉求会话文本整合数据进行用户诉求解析操作,获得所述话题整合引导特征。
9.根据权利要求3所述的针对大数据推荐的社交平台互动信息处理方法,其特征在于,所述指定AI策略包括至少一个窗口化挖掘模块;所述借助指定AI策略对所述目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布,包括:借助指定AI策略的一窗口化挖掘模块对所述目标用户群体会话日志进行诉求会话文本挖掘,获得第一全局诉求文本分布;
倘若所述指定AI策略的窗口化挖掘模块的数目为两个以上,则在所述获得第二全局诉求文本分布之后,并在所述结合所述指定AI策略对所述第二全局诉求文本分布进行信息推送偏好识别,获得所述目标用户群体会话日志的推送偏好知识集之前,所述方法还包括:
结合所述指定AI策略中没有完成诉求会话文本挖掘的窗口化挖掘模块对所述第二全局诉求文本分布进行诉求会话文本挖掘,获得补充的第一全局诉求文本分布;跳转至所述调用指定话题整合策略对所述补充的第一全局诉求文本分布进行处理,获得话题整合引导特征的步骤,获得补充的第二全局诉求文本分布,直到所述指定AI策略的所有窗口化挖掘模块都实现对补充的第二全局诉求文本分布的诉求会话文本挖掘;
所述结合所述指定AI策略对所述第二全局诉求文本分布进行信息推送偏好识别,获得所述目标用户群体会话日志的推送偏好知识集,包括:结合所述指定AI策略的文本整合模块对所述第二全局诉求文本分布进行信息推送偏好识别,获得所述目标用户群体会话日志的推送偏好知识集。
10.一种大数据推荐系统,其特征在于,包括:
用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9任一项所述的方法的处理器。
CN202210343589.XA 2022-03-31 2022-03-31 针对大数据推荐的社交平台互动信息处理方法及系统 Withdrawn CN114692650A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210343589.XA CN114692650A (zh) 2022-03-31 2022-03-31 针对大数据推荐的社交平台互动信息处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210343589.XA CN114692650A (zh) 2022-03-31 2022-03-31 针对大数据推荐的社交平台互动信息处理方法及系统

Publications (1)

Publication Number Publication Date
CN114692650A true CN114692650A (zh) 2022-07-01

Family

ID=82141150

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210343589.XA Withdrawn CN114692650A (zh) 2022-03-31 2022-03-31 针对大数据推荐的社交平台互动信息处理方法及系统

Country Status (1)

Country Link
CN (1) CN114692650A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115422463A (zh) * 2022-09-27 2022-12-02 高冬 基于大数据的用户分析推送处理方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115422463A (zh) * 2022-09-27 2022-12-02 高冬 基于大数据的用户分析推送处理方法及系统
CN115422463B (zh) * 2022-09-27 2024-04-19 耳纹元智能科技(广东)有限公司 基于大数据的用户分析推送处理方法及系统

Similar Documents

Publication Publication Date Title
CN107846350B (zh) 一种语境感知网络聊天的方法、计算机可读介质和系统
EP3441891A1 (en) Data source-based service customisation apparatus, method, system, and storage medium
US8977617B1 (en) Computing social influence scores for users
CN111858854B (zh) 一种基于历史对话信息的问答匹配方法及相关装置
CN110909145A (zh) 针对多任务模型的训练方法及装置
CN109977216A (zh) 基于场景的对话推荐方法及系统
CN112818109B (zh) 邮件的智能回复方法、介质、装置和计算设备
CN111639162A (zh) 信息交互方法和装置、电子设备和存储介质
CN114692650A (zh) 针对大数据推荐的社交平台互动信息处理方法及系统
CN115203282A (zh) 结合深度学习的智慧企服用户数据处理方法及系统
CN112801721B (zh) 信息处理方法、装置、电子设备及存储介质
CN112948550B (zh) 日程创建方法、装置和电子设备
CN113987151A (zh) 智能客服回复方法及装置
CN116541517A (zh) 文本信息处理方法、装置、设备、软件程序以及存储介质
CN112214667B (zh) 基于三维模型的信息推送方法、装置、设备及存储介质
CN113132214B (zh) 一种对话方法、装置、服务器及存储介质
CN113111157B (zh) 问答处理方法、装置、计算机设备和存储介质
CN113869068A (zh) 场景服务推荐方法、装置、设备及存储介质
CN113868396A (zh) 基于知识图谱的任务类智能对话构建方法及系统
CN116153318B (zh) 一种订单监管方法、装置、电子设备及计算机存储介质
CN117708304B (zh) 数据库问答方法、设备及存储介质
CN116702795B (zh) 结合AI和Chatterbot的智慧政务对话处理方法及软件产品
CN116911313B (zh) 一种语义漂移文本的识别方法及装置
CN114840653B (zh) 对话处理方法、装置、设备以及存储介质
US20230030822A1 (en) Automated predictive response computing platform implementing adaptive data flow sets to exchange data via an omnichannel electronic communication channel independent of data source

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WW01 Invention patent application withdrawn after publication

Application publication date: 20220701

WW01 Invention patent application withdrawn after publication