CN114662470A - 结合大数据的产品点评信息处理方法及系统 - Google Patents
结合大数据的产品点评信息处理方法及系统 Download PDFInfo
- Publication number
- CN114662470A CN114662470A CN202210342490.8A CN202210342490A CN114662470A CN 114662470 A CN114662470 A CN 114662470A CN 202210342490 A CN202210342490 A CN 202210342490A CN 114662470 A CN114662470 A CN 114662470A
- Authority
- CN
- China
- Prior art keywords
- comment
- suggestion
- product
- viewpoint
- mining
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Accounting & Taxation (AREA)
- Software Systems (AREA)
- Finance (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请实施例公开了结合大数据的产品点评信息处理方法及系统,在进行优化建议的识别挖掘时,可以精准定位得到活跃性用户点评文本集在若干类产品反馈建议主题下的优化建议挖掘信息,可以在一定程度上减少活跃性用户点评文本集的个别产品反馈建议主题的优化建议识别遗漏,这样能够尽量地提升活跃性用户点评文本集的优化建议识别的精度和完整性,此外,鉴于优化建议识别的核心流程在大数据处理系统侧进行,因而可以减轻数字化产品平台系统特别是算力较弱的数字化产品平台系统的点评分析资源开销。
Description
技术领域
本申请涉及大数据技术领域,尤其涉及一种结合大数据的产品点评信息处理方法及系统。
背景技术
大数据时代下的用户分析涉及用户兴趣挖掘、用户偏好识别等。而实现用户分析的传统技术思路通常是针对用户交互行为的分析。当下,互联网社交的普及使得用户之间能够基于不同产品平台进行产品的点评分析,因此,针对产品点评的用户分析也是值的关注的。发明人经研究和分析发现,基于点评分析的用户分析技术一般用于产品优化和产品升级,但是相关技术在对用户点评进行分析挖掘时,难以准确完整地挖掘出针对相关产品的优化升级信息。
发明内容
本申请的一个目的是提供一种结合大数据的产品点评信息处理方法及系统。
本申请的技术方案是通过如下至少部分实施例实现的。
本申请实施例的第一方面提供一种结合大数据的产品点评信息处理方法,该方法应用于大数据处理系统,所述大数据处理系统与数字化产品平台系统通信,该方法至少包括:当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息;响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集;对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告。
应用于相关实施例,当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息;响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集;对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告。如此一来,在进行优化建议的识别挖掘时,可以精准定位得到活跃性用户点评文本集(例如产品使用体验点评)在若干类产品反馈建议主题下的优化建议挖掘信息,可以在一定程度上减少活跃性用户点评文本集的个别产品反馈建议主题的优化建议识别遗漏,这样能够尽量地提升活跃性用户点评文本集的优化建议识别的精度和完整性,此外,鉴于优化建议识别的核心流程在大数据处理系统侧进行,因而可以减轻数字化产品平台系统特别是算力较弱的数字化产品平台系统的点评分析资源开销。
在一种可独立实施的实施例中,对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告,包括:对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列;采用若干类产品反馈建议主题中每类产品反馈建议主题对应的机器学习模型分别对第一展示型点评句子序列进行优化建议挖掘,得到活跃性用户点评文本集对于每类产品反馈建议主题的优化建议挖掘报告。
应用于相关实施例,每类产品反馈建议主题对应的机器学习模型共享第一展示型点评句子序列进行优化建议挖掘,使得每个机器学习模型在进行优化建议挖掘之前无需额外进行自然语言处理(比如特征提取或者特征挖掘),有助于减少自然语言处理的周期以及减少自然语言处理资源消耗量。
在一种可独立实施的实施例中,每类产品反馈建议主题的优化建议挖掘报告包含如下的其中一项:具有该产品反馈建议主题的优化建议;不具有该产品反馈建议主题的优化建议;未鉴别出是否具有该产品反馈建议主题的优化建议;具有未知产品反馈建议主题的优化建议。
应用于相关实施例,传统的优化建议挖掘报告较为粗略,在本申请实施例中,能够针对优化建议进行细化处理,从而保障优化建议挖掘报告具有更高质量的细节内容表达。
在一种可独立实施的实施例中,对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列,包括:对活跃性用户点评文本集所关联的上下游评论观点文本集进行窗口化挖掘,得到第一观点句子序列;对第一观点句子序列进行u轮周期的关键短语提取处理,得到u个体量的观点句子序列,u个体量的观点句子序列与u轮周期的关键短语提取处理存在一对一匹配关系,u为不小于2的整数;对第一观点句子序列和u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,得到w个第二观点句子序列,v为不小于2且不超过u的整数;结合w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,得到第一展示型点评句子序列,u轮周期的衍生短语扩展处理与u轮周期的关键短语提取处理存在一对一匹配关系。
应用于相关实施例,基于自然语言处理思路的特征提取/挖掘,能够保障第一展示型点评句子序列的完整性,还可以确保第一展示型点评句子序列的精度和可信度。
在一种可独立实施的实施例中,结合w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,得到第一展示型点评句子序列,包括:对目标体量的观点句子序列进行第一轮周期的衍生短语扩展处理;对于u轮周期的衍生短语扩展处理中第x轮周期的衍生短语扩展处理,若w个第二观点句子序列中具有待整理的第二观点句子序列,则将待整理的第二观点句子序列与第x轮周期的衍生短语扩展处理所得的观点句子序列进行整理,得到第一已整理观点句子序列,待整理的第二观点句子序列为与第x轮周期的衍生短语扩展处理所得的观点句子序列的观点描述维度一致的第二观点句子序列,x为不小于1且小于等于u-1的整数;对第一已整理观点句子序列或第x轮周期的衍生短语扩展处理所得的观点句子序列,进行第y轮周期的衍生短语扩展处理,直到完成第u轮周期的衍生短语扩展处理;将第u轮周期的衍生短语扩展处理所得的观点句子序列与w个第二观点句子序列中观点描述维度一致的观点句子序列进行整理,得到第二已整理观点句子序列;对第二已整理观点句子序列进行基于展示策略的调整,得到第一展示型点评句子序列。
应用于相关实施例,鉴于自然语言处理时对第一观点句子序列进行了u轮周期的关键短语提取处理,关键短语提取处理在一定程度上可能会造成部分数据的匮乏,进而通过对第一观点句子序列和u个体量的观点句子序列进行语义挖掘,结合完成语义挖掘的的w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,例如,可将w个第二观点句子序列中观点描述维度与衍生短语扩展处理得到的同一观点描述维度的观点句子序列整理,以改善关键短语提取处理所造成的数据匮乏,进而保障第一展示型点评句子序列中的细节丰富程度。
在一种可独立实施的实施例中,对第一观点句子序列和u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,包括:对于第一观点句子序列和v个目标观点句子序列中的每个观点句子序列,对每个观点句子序列进行第1轮双向语义挖掘操作,得到第1轮完成语义挖掘的的观点句子序列;对第z轮完成语义挖掘的的观点句子序列进行第q轮双向语义挖掘操作,得到第q轮完成语义挖掘的的观点句子序列,z为大于或等1的整数;通过不低于两轮的双向语义挖掘操作,确定与每个观点句子序列满足语义挖掘匹配条件的第二观点句子序列,w个第二观点句子序列包括第二观点句子序列。
应用于相关实施例,依据LSTM对第一观点句子序列和u个体量的观点句子序列中的每个观点句子序列进行不低于两轮的双向语义挖掘操作,鉴于不低于两轮的双向语义挖掘操作可以通过不同滑动窗口联合的策略,有助于记录第一观点句子序列和u个体量的观点句子序列中的相对分布信息,该相对分布信息有助于活跃性用户点评文本集的优化建议的确定。
在一种可独立实施的实施例中,对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告是基于智能化决策线程实现的,智能化决策线程是通过对人工智能模型进行调试所得的,人工智能模型包括自然语言处理算法和用作逐个对指定的若干类产品反馈建议主题进行区分处理的多个机器学习模型,智能化决策线程基于如下内容调试所得:收集活跃性用户点评文本集的第一认证型产品使用点评信息和第一认证型产品使用点评信息对于若干类产品反馈建议主题的先验知识;将第一认证型产品使用点评信息输入自然语言处理算法进行自然语言处理,得到第二展示型点评句子序列;将第二展示型点评句子序列分别加载到多个机器学习模型进行优化建议挖掘,得到第一认证型产品使用点评信息对于若干类产品反馈建议主题的优化建议挖掘报告;根据第一认证型产品使用点评信息对于若干类产品反馈建议主题的优化建议挖掘报告和第一认证型产品使用点评信息对于若干类产品反馈建议主题的先验知识,确定第一策略代价信息;根据第一策略代价信息调整自然语言处理算法和多个机器学习模型的偏置数据,动态更新第一认证型产品使用点评信息,以使第一策略代价信息满足逼近条件,得到智能化决策线程。
应用于相关实施例,针对多个机器学习模型的非独占自然语言处理算法输出的思路,自然语言处理算法的性能不会受到机器学习模型的数量变化的干扰。此外,利用多样化注释对若干类产品反馈建议主题进行差异化处理,能够保障产品反馈建议主题之间的互相独立,有助于减少调试过程中产品反馈建议主题之间的干扰和认证型产品使用点评信息的先验误导。
在一种可独立实施的实施例中,该方法还包括:如果存在需要额外配设的目标产品反馈建议主题,则在智能化决策线程中增加目标产品反馈建议主题的目标机器学习模型;收集活跃性用户点评文本集的第二认证型产品使用点评信息和第二认证型产品使用点评信息对于目标产品反馈建议主题的先验知识;将第二认证型产品使用点评信息输入自然语言处理算法进行自然语言处理,得到第三展示型点评句子序列;将第三展示型点评句子序列输入目标机器学习模型进行优化建议挖掘,得到第二认证型产品使用点评信息对于目标产品反馈建议主题的优化建议挖掘报告;根据第二认证型产品使用点评信息对于目标产品反馈建议主题的优化建议挖掘报告和第二认证型产品使用点评信息对于目标产品反馈建议主题的先验知识,确定目标机器学习模型的第二策略代价信息;根据第二策略代价信息调整目标机器学习模型的偏置数据,动态更新第二认证型产品使用点评信息,以使第二策略代价信息满足逼近条件。
应用于相关实施例,针对多个机器学习模型的非独占自然语言处理算法输出思路,如果存在额外配置的目标产品反馈建议主题,则可以为该目标产品反馈建议主题概括一个新的注释信息,并通过经由注释的第二认证型产品使用点评信息为该目标产品反馈建议主题调试一个机器学习模型,从而能够有效地进行产品反馈建议主题的优化和机器学习模型的额外配置。此外,鉴于自然语言处理算法和之前的多个机器学习模型的偏置数据不存在变化,调试目标机器学习模型时,不需要对自然语言处理算法和多个机器学习模型的偏置数据进行调整,这样有助于提高目标机器学习模型的调试速度。
在一些可能的实施例中,活跃性用户点评文本集为产品使用体验点评,优化建议挖掘报告包括产品使用体验点评对于指定的若干类产品反馈建议主题中每类产品反馈建议主题的优化建议挖掘报告,若干类产品反馈建议主题包含如下两项或两项以上:可视化交互界面优化、强制广告弹窗拦截和个体隐私信息防护。
一种大数据处理系统,包括:用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现上述方法的处理器。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在运行时执行上述方法。
附图说明
图1是示出可以实现本申请的实施例的大数据处理系统的示意图。
图2是示出可以实现本申请的实施例的结合大数据的产品点评信息处理方法的流程示意图。
图3是示出可以实现本申请的实施例的结合大数据的产品点评信息处理方法的应用环境的架构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。为了使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请作进一步地详细描述,所描述的实施例不应视为对本申请的限制,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本申请保护的范围。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。
图1是示出可以实现本申请的实施例的大数据处理系统100的一种通信配置的框图,大数据处理系统100包括用于存储可执行计算机程序的存储器101,用于执行所述存储器101中存储的可执行计算机程序时实现本申请实施例中结合大数据的产品点评信息处理方法的处理器102。
图2是示出可以实现本申请的实施例的结合大数据的产品点评信息处理方法的流程示意图,结合大数据的产品点评信息处理方法可以通过图1所示的大数据处理系统100实现,进一步可以包括以下相关步骤所描述的技术方案。
STEP201、当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息。
对于本申请实施例而言,目标线上服务产品的产品使用点评信息可以经由数字化产品平台系统中的信息获取模块向大数据处理系统提供,例如,在交互过程中,信息获取模块可以向大数据处理系统上传获取到的目标线上服务产品的产品使用点评信息。可以理解,产品使用点评信息可以经由任何能够获取到目标线上服务产品的产品使用点评信息的信息获取模块向大数据处理系统提供,本申请实施例对目标线上服务产品的产品使用点评信息的收集方法不进行限制。
进一步地,数字化产品平台系统通过上传产品点评分析请求,能够借助大数据处理系统进行产品点评分析和优化建议识别,且优化建议识别的核心流程可以在大数据处理系统侧实现,因而可以减轻数字化产品平台系统特别是算力较弱的数字化产品平台系统的点评分析资源开销。此外,目标线上服务产品可以是云服务产品或者数字服务产品,比如跨境电商服务产品、数字化办公软件、远程教育程序等,在此不作限定。
STEP202、响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集。
对于本申请实施例而言,活跃性用户点评文本集可以理解为产品使用点评信息中关注度较高的点评文本信息,或者具有优化建议挖掘需求的用户点评文本集。相应的,活跃性用户点评文本集还可以理解为待处理的用户点评文本集。
对于本申请实施例而言,对于采集到的产品使用点评信息,大数据处理系统可以结合相关产品点评分析策略对其进行产品使用点评处理,例如:相关产品点评分析策略(产品点评分析算法)可以是卷积神经网络、图卷积神经网络等,基于活跃性用户点评文本集的点评要求在产品使用点评信息中的位置信息,可以从产品使用点评信息中确定活跃性用户点评文本集所关联的上下游文本集,并拆分出活跃性用户点评文本集所关联的上下游评论观点文本集。上下游评论观点文本集可以理解为与活跃性用户点评文本集对应的关联文本集。
举例而言,拆分出活跃性用户点评文本集所关联的上下游评论观点文本集,包括:对产品使用点评信息进行热点信息区分,得到产品使用点评信息中的不低于一项产品服务事项的不低于一个热点信息标签;从不低于一个热点信息标签中确定出活跃性用户点评文本集的热点信息标签;收集活跃性用户点评文本集的热点信息标签的指定文本段落,以及将该指定文本段落与活跃性用户点评文本集的点评要求的重叠部分确定为待拆分文本集;从产品使用点评信息中拆分出该待拆分文本集,得到活跃性用户点评文本集所关联的上下游评论观点文本集。
可以理解的是,不低于一项产品服务事项与不低于一个热点信息标签存在一对一匹配关系,可以理解,每项产品服务事项均存在一个热点信息标签,可以理解,目标线上服务产品中的用户点评文本集均存在一定的显著描述,通过这些显著描述可以确定出不低于一个热点信息标签中产品使用体验点评的热点信息标签。
STEP203、对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告。
对于本申请实施例而言,对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别可以理解为对活跃性用户点评文本集所关联的上下游评论观点文本集进行预设的若干类产品反馈类别/属性的优化识别,以得到优化建议挖掘报告。而优化建议挖掘报告例如产品使用功能优化建议、产品服务态度优化建议等。
对于一种可独立实施的技术方案而言,对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告,可以包括如下内容:对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列;采用若干类产品反馈建议主题中每类产品反馈建议主题对应的机器学习模型分别对第一展示型点评句子序列进行优化建议挖掘,得到活跃性用户点评文本集对于每类产品反馈建议主题的优化建议挖掘报告。
对于本申请实施例而言,对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理可以理解为对活跃性用户点评文本集所关联的上下游评论观点文本集进行关键信息提取或者特征信息提取,以得到第一展示型点评句子序列。而展示型点评句子序列可以理解为用于向其他客户或者用户公开的点评句子序列。
对于本申请实施例而言,以活跃性用户点评文本集为产品使用体验点评例,将产品使用体验点评文本集(可以理解为产品使用体验点评所关联的上下游评论观点文本集)导入偏置数据保持不变的智能化决策线程,通过多个机器学习模型的非独占自然语言处理算法进行自然语言处理,得到第一展示型点评句子序列,第一展示型点评句子序列逐个加载至多个机器学习模型进行优化建议挖掘,举例而言,多个机器学习模型分别可以是可视化交互界面优化的机器学习模型、强制广告弹窗拦截的机器学习模型,进一步的,可视化交互界面优化的机器学习模型,基于第一展示型点评句子序列得到对于可视化交互界面优化这一产品反馈建议主题下若干优化建议标识的优化建议挖掘信息;强制广告弹窗拦截的机器学习模型,基于第一展示型点评句子序列得到对于强制广告弹窗拦截这一产品反馈建议主题下若干优化建议标识的优化建议挖掘信息。在一些可示性实施例中,在活跃性用户点评文本集为产品使用体验点评的前提下,若干类产品反馈建议主题包含如下两项或两项以上:可视化交互界面优化、强制广告弹窗拦截和个体隐私信息防护。如此设计,每类产品反馈建议主题对应的机器学习模型共享第一展示型点评句子序列进行优化建议挖掘,使得每个机器学习模型在进行优化建议挖掘之前无需额外进行自然语言处理,有助于减少自然语言处理的周期、削弱自然语言处理资源消耗量。
对于一种可独立实施的技术方案而言,每类产品反馈建议主题的优化建议挖掘信息包含如下的其中一项:具有该产品反馈建议主题的优化建议;不具有该产品反馈建议主题的优化建议;未鉴别出是否具有该产品反馈建议主题的优化建议;具有未知产品反馈建议主题的优化建议。
例如,产品使用体验点评对于强制广告弹窗拦截这一产品反馈建议主题的优化建议挖掘信息可以是拦截时段精准度有待提高、拦截内容的类别有待扩增的优化建议、拦截方式有待调整等。如此设计,在传统优化建议挖掘信息的前提下,还额外配设了活跃性用户点评文本集所关联的上下游评论观点文本集用于进行较为隐晦的建议主题的定位分析,从而实现更加精准可信的优化建议挖掘,并尽量减少相关数据信息的先验误导。
对于一种可独立实施的技术方案而言,对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列,可以包括如下内容:对活跃性用户点评文本集所关联的上下游评论观点文本集进行窗口化挖掘,得到第一观点句子序列;对第一观点句子序列进行u轮周期的关键短语提取处理,得到u个体量的观点句子序列,u个体量的观点句子序列与u轮周期的关键短语提取处理存在一对一匹配关系,u为不小于2的整数;对第一观点句子序列和u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,得到w个第二观点句子序列,v为不小于2且不超过u的整数;结合w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,得到第一展示型点评句子序列。
对于本申请实施例而言,对活跃性用户点评文本集所关联的上下游评论观点文本集进行窗口化挖掘可以理解为对活跃性用户点评文本集所关联的上下游评论观点文本集进行卷积处理,以得到第一观点句子序列。而观点句子序列可以通过图像或者文本的形式进行记录。
对于本申请实施例而言,以AI人工智能模型为基准、融合LSTM的自然语言处理算法,与AI人工智能模型一致的,包括u轮周期的关键短语提取处理(比如,下采样操作)和u轮周期的衍生短语扩展处理(比如,上采样操作),可以理解,关键短语提取处理部分与衍生短语扩展处理部分存在对应关系。多个周期分别包括第一轮周期、第二周期、第三周期和第四周期,u个体量(规模/尺度/维度/尺寸)的观点句子序列包括第一轮周期的关键短语提取处理所得的观点句子序列、第二周期的关键短语提取处理所得的观点句子序列、第三周期的关键短语提取处理所得的观点句子序列和第四周期的关键短语提取处理所得的观点句子序列,将第一轮周期的关键短语提取处理所得的观点句子序列和第二周期的关键短语提取处理所得的观点句子序列作为目标观点句子序列,基于调试成功的LSTM对第一观点句子序列、第一轮周期的关键短语提取处理所得的观点句子序列和第二周期的关键短语提取处理所得的观点句子序列进行语义挖掘(比如,映射处理),得到对应的每个观点句子序列中重点观点句子信息的可能性分布预测,可以理解,w个第二观点句子序列中的重点观点句子信息表示可能性分布预测。
应用于上述实施例,鉴于自然语言处理的过程对第一观点句子序列进行了u轮周期的关键短语提取处理,关键短语提取处理在一定程度上可能会造成部分数据的匮乏,继而通过对第一观点句子序列和u个体量的观点句子序列进行语义挖掘,结合完成语义挖掘的的w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,例如,可将w个第二观点句子序列中观点描述维度与衍生短语扩展处理得到的同一观点描述维度的观点句子序列整理,以改善关键短语提取处理所造成的数据匮乏,进而保障第一展示型点评句子序列中的细节丰富程度。
对于一种可独立实施的技术方案而言,结合w个第二观点句子序列对u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,得到第一展示型点评句子序列,可以包括如下内容:对目标体量的观点句子序列进行第一轮周期的衍生短语扩展处理;对于u轮周期的衍生短语扩展处理中第x轮周期的衍生短语扩展处理,若w个第二观点句子序列中具有待整理的第二观点句子序列,则将待整理的第二观点句子序列与第x轮周期的衍生短语扩展处理所得的观点句子序列进行整理,得到第一已整理观点句子序列,待整理的第二观点句子序列为与第x轮周期的衍生短语扩展处理所得的观点句子序列的观点描述维度一致的第二观点句子序列,x为不小于1且小于等于u-1的整数;对第一已整理观点句子序列或第x轮周期的衍生短语扩展处理所得的观点句子序列,进行第y轮周期的衍生短语扩展处理,直到完成第u轮周期的衍生短语扩展处理;将第u轮周期的衍生短语扩展处理所得的观点句子序列与w个第二观点句子序列中观点描述维度一致的观点句子序列进行整理,得到第二已整理观点句子序列;对第二已整理观点句子序列进行基于展示策略的调整,得到第一展示型点评句子序列。
对于本申请实施例而言,目标体量的观点句子序列可以是第四周期的关键短语提取处理所得的观点句子序列,对目标体量的观点句子序列进行第一轮周期的衍生短语扩展处理,鉴于w个第二观点句子序列中不存在与第一轮周期的衍生短语扩展处理所得的观点句子序列观点描述维度一致的待整理的第二观点句子序列,由此,直接对第一轮周期的衍生短语扩展处理所得的观点句子序列进行第二周期的衍生短语扩展处理。w个第二观点句子序列中具有与第二周期的衍生短语扩展处理所得的观点句子序列观点描述维度一致的待整理的第二观点句子序列,则将第二周期的衍生短语扩展处理所得的观点句子序列与w个第二观点句子序列中观点描述维度一致的待整理的第二观点句子序列(例如,第二周期的关键短语提取处理所得的观点句子序列通过LSTM的语义挖掘,得到的第二观点句子序列)进行整理,得到第一个第一已整理观点句子序列。对第一个第一已整理观点句子序列进行第三周期的衍生短语扩展处理,w个第二观点句子序列中具有与第三周期的衍生短语扩展处理所得的观点句子序列观点描述维度一致的待整理的第二观点句子序列,则将第三周期的衍生短语扩展处理所得的观点句子序列与w个第二观点句子序列中观点描述维度一致的待整理的第二观点句子序列(可以理解为第一轮周期的关键短语提取处理所得的观点句子序列通过LSTM的语义挖掘,得到的第二观点句子序列)进行整理,得到第二个第一已整理观点句子序列。
进一步的,对于u轮周期的衍生短语扩展处理中第x轮周期的衍生短语扩展处理,如果w个第二观点句子序列中具有观点描述维度一致的待整理的第二观点句子序列,则将第x轮周期的衍生短语扩展处理所得的观点句子序列与该待整理的第二观点句子序列进行整理,对整理所得的观点句子序列进行下一周期的衍生短语扩展处理;如果w个第二观点句子序列中不存在观点描述维度一致的待整理的第二观点句子序列,则直接对第x轮周期的衍生短语扩展处理所得的观点句子序列进行下一周期的衍生短语扩展处理,一直实施直到完成第u轮周期的衍生短语扩展处理,可以理解为第四周期的衍生短语扩展处理。
在一些可能的实施例中,对于第u轮周期的衍生短语扩展处理所得的观点句子序列,w个第二观点句子序列中通常存在观点描述维度一致的待整理的第二观点句子序列(可以理解为第一观点句子序列通过LSTM的语义挖掘,得到的第二观点句子序列),则将它们进行整理,所得的观点句子序列可以理解为第二已整理观点句子序列,再对第二已整理观点句子序列进行基于展示策略的调整,得到第一展示型点评句子序列。
进一步的,以上所提到的“整理”示例性可以是对两个观点句子序列进行运算处理,如此可以将第二观点句子序列中的可能性分布预测与衍生短语扩展处理所得的观点句子序列进行运算处理(比如二院运算),从而进行优化建议的显著化增强,进而有助于之后的分离,基于展示策略的调整可以是进行基于展示维度的精简操作,可以理解,本申请实施例每轮在进行观点句子序列整理后都会进行相应的基于展示策略的调整,本申请实施例包括但不限于基于展示维度的精简操作,以提高展示效率。
对于一种可独立实施的技术方案而言,对第一观点句子序列和u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,可以包括如下内容:对于第一观点句子序列和v个目标观点句子序列中的每个观点句子序列,对每个观点句子序列进行第1轮双向语义挖掘操作,得到第1轮完成语义挖掘的的观点句子序列;对第z轮完成语义挖掘的的观点句子序列进行第q轮双向语义挖掘操作,得到第q轮完成语义挖掘的的观点句子序列,z为大于或等1的整数;通过不低于两轮的双向语义挖掘操作,确定与每个观点句子序列满足语义挖掘匹配条件的第二观点句子序列,w个第二观点句子序列包括第二观点句子序列。
对于本申请实施例而言,LSTM中一般而言会使用双向调整单元将导入的观点句子序列中的重点观点句子信息语义挖掘为满足相关分布条件的原料信息,该原料信息可以作为产品使用体验点评文本集中对应文本段落的点评观点描述的可能性分布预测,简单的理解,第一观点句子序列和v个目标观点句子序列中的每个观点句子序列对应的第二观点句子序列中的重点观点句子信息都为可能性分布预测。可以理解,对于一般的活跃性用户点评文本集而言,其点评观点描述匹配于高斯分布,比如,其可能性分布预测接近高斯分布的参考分布成员YHR,而对于具有较高挖掘价值的活跃性用户点评文本集而言,其对应的优化建议特征的可能性分布预测是不同于高斯分布的参考分布成员YHR的,将第二观点句子序列中的可能性分布预测作为依据与衍生短语扩展处理得到的观点描述维度一致的观点句子序列整理,能够实现建议需求特征的显著性增强,更加有助于优化建议挖掘。比如,每个机器学习模型同理可以以高斯分布的参考分布成员YHR为判定值,拆解出第一展示型点评句子序列中具有建议需求特征的文本集,从而得到活跃性用户点评文本集在对应产品反馈建议主题下的优化建议挖掘信息。
可以理解的是,本申请实施例借助不少于两个双向调整单元进行语义挖掘,以第一观点句子序列为例,第一观点句子序列通过第一个双向调整单元的语义挖掘,得到第1轮完成语义挖掘的的观点句子序列,第1轮完成语义挖掘的的观点句子序列通过第二个双向调整单元的语义挖掘,得到第二轮完成语义挖掘的的观点句子序列,以此类推,第z轮完成语义挖掘的的观点句子序列通过第q轮双向调整单元的语义挖掘得到第q轮完成语义挖掘的的观点句子序列,经过不低于两轮的双向语义挖掘操作,得到对应的第二观点句子序列。
可以理解的是,LSTM中每个双向调整单元通过迁移变换模块对导入进行迁移变换处理(映射处理),可以理解,迁移变换处理将输入拆解为两个局部观点句子序列,然后将两个局部观点句子序列进行合并,得到第1轮迁移变换处理的导出内容。进一步的,将第1轮迁移变换处理的导出内容与2维的窗口化单元的输入拼接,得到双向调整单元的导出内容,或者还可对第1轮迁移变换处理的导出内容继续进行迁移变换处理,通过若干轮迁移变换处理,将末尾一轮迁移变换处理的导出内容与其前一轮迁移变换处理的导出内容拼接,,得到双向调整单元的导出内容。可以理解,迁移变换模块的处理思路可以参阅相关技术,本申请实施例在此不作过多阐述。
在一些可能的实施例中,LSTM中的双向调整单元通过6*6滑动平均和2*2滑动平均混合的思路,有助于维持活跃性用户点评文本集所关联的上下游评论观点文本集中重点观点句子信息的分布特征不变。
应用上述相关实施例,借助LSTM对第一观点句子序列和u个体量的观点句子序列中的每个观点句子序列进行不低于两轮的双向语义挖掘操作,由于不低于两轮的双向语义挖掘操作可以借助不同滑动窗口联合的思路,有助于维持第一观点句子序列和u个体量的观点句子序列中的相对分布信息,该相对分布信息有助于活跃性用户点评文本集的优化建议的挖掘。
可以理解的是,本申请实施例通过当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息;响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集;对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告。如此一来,在进行优化建议的识别挖掘时,可以精准定位得到活跃性用户点评文本集在若干类产品反馈建议主题下的优化建议挖掘信息,可以在一定程度上减少活跃性用户点评文本集的个别产品反馈建议主题的优化建议识别遗漏,这样能够尽量地提升活跃性用户点评文本集的优化建议识别的精度和完整性。
对于一种可独立实施的技术方案而言,本申请的技术方案所示出的又一种结合大数据的产品点评信息处理方法可以包括如下STEP701-STEP704所记录的技术方案。
STEP701、当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息。
STEP702、响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集。
STEP703、对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列。
STEP704、采用指定的若干类产品反馈建议主题中每类产品反馈建议主题对应的机器学习模型分别对第一展示型点评句子序列进行优化建议挖掘,得到活跃性用户点评文本集对于每类产品反馈建议主题的优化建议挖掘报告。
可以理解的是,STEP703和STEP704是基于智能化决策线程实现的,智能化决策线程是通过对人工智能模型进行调试所得的,人工智能模型包括自然语言处理算法和用作逐个对若干类产品反馈建议主题进行区分处理的多个机器学习模型。
进一步的,该智能化决策线程基于如下内容调试所得:收集活跃性用户点评文本集的第一认证型产品使用点评信息和第一认证型产品使用点评信息对于若干类产品反馈建议主题的先验知识;将第一认证型产品使用点评信息输入自然语言处理算法进行自然语言处理,得到第二展示型点评句子序列;将第二展示型点评句子序列分别加载到多个机器学习模型进行优化建议挖掘,得到第一认证型产品使用点评信息对于若干类产品反馈建议主题的优化建议挖掘报告;根据第一认证型产品使用点评信息对于若干类产品反馈建议主题的优化建议挖掘报告和第一认证型产品使用点评信息对于若干类产品反馈建议主题的先验知识,确定第一策略代价信息;根据第一策略代价信息调整自然语言处理算法和多个机器学习模型的偏置数据,动态更新第一认证型产品使用点评信息,以使第一策略代价信息满足逼近条件,得到智能化决策线程。
对于本申请实施例而言,第二展示型点评句子序列可以是调试过程中结合自然语言处理算法对第一认证型产品使用点评信息进行自然语言处理所得的观点句子序列,可以理解,人工智能模型的调试一般而言需要一定数目的样本信息集,第一认证型产品使用点评信息可以是样本信息集中的其中一组认证型产品使用点评信息,自然语言处理算法对第一认证型产品使用点评信息的挖掘思路可以参阅对活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理的对应内容。在通过机器学习模型得到第一认证型产品使用点评信息对于若干类产品反馈建议主题下若干优化建议标识的优化建议挖掘信息后,可根据每类产品反馈建议主题下若干优化建议标识的优化建议挖掘信息和该产品反馈建议主题的先验知识运算对应的偏差信息,根据第一认证型产品使用点评信息在若干类产品反馈建议主题下的多个偏差信息得到第一策略代价信息,例如:在活跃性用户点评文本集为产品使用体验点评的前提下,可以将第一认证型产品使用点评信息在强制广告弹窗拦截这一产品反馈建议主题的偏差信息作为第一策略代价信息,或者将部分或者所有产品反馈建议主题的多个偏差信息的全局代价作为第一策略代价信息,本申请实施例在此不作限定。
可以理解的是,在第一策略代价信息未满足逼近条件的前提下,调整自然语言处理算法和多个机器学习模型的偏置数据,不断动态更新认证型产品使用点评信息集(可以是第一认证型产品使用点评信息),直到第一策略代价信息满足逼近条件,得到偏置数据保持不变的智能化决策线程。
如此设计,针对多个机器学习模型的非独占自然语言处理算法输出的思路,自然语言处理算法的性能不会受到机器学习模型的数量变化的干扰。此外,利用多样化注释对若干类产品反馈建议主题进行差异化处理,实现了产品反馈建议主题间的分离,有助于减少调试过程中产品反馈建议主题间的干扰和认证型产品使用点评信息的先验误导。
对于一种可独立实施的技术方案而言,该方法还可以包括如下内容。
STEP801、如果存在需要额外配设的目标产品反馈建议主题,则在智能化决策线程中额外配设目标产品反馈建议主题的目标机器学习模型。
STEP802、收集产品使用体验点评的第二认证型产品使用点评信息和第二认证型产品使用点评信息对于目标产品反馈建议主题的先验知识。
STEP803、将第二认证型产品使用点评信息加载到自然语言处理算法进行自然语言处理,得到第三展示型点评句子序列。
STEP804、将第三展示型点评句子序列加载到目标机器学习模型进行优化建议挖掘,得到第二认证型产品使用点评信息对于目标产品反馈建议主题的优化建议挖掘信息。
STEP805、根据第二认证型产品使用点评信息对于目标产品反馈建议主题的优化建议挖掘信息和第二认证型产品使用点评信息对于目标产品反馈建议主题的先验知识,确定目标机器学习模型的第二策略代价信息。
STEP806、根据第二策略代价信息改进目标机器学习模型的偏置数据,动态更新第二认证型产品使用点评信息,以使第二策略代价信息满足逼近条件。
对于本申请实施例而言,以活跃性用户点评文本集为产品使用体验点评例,如果目前需要概况一个新的产品使用体验点评的产品反馈建议主题,例如,个体隐私信息防护,则在现有智能化决策线程的前提下,额外配设个体隐私信息防护的机器学习模型,个体隐私信息防护的机器学习模型可以是目标机器学习模型,并在调试人工智能模型的样本信息集中加入个体隐私信息防护的认证型产品使用点评信息,并对该认证型产品使用点评信息进行标记,以对样本信息集进行优化,第二认证型产品使用点评信息可以是优化后的样本信息集中的其中一组产品使用点评信息,包括个体隐私信息防护的认证型产品使用点评信息。第三展示型点评句子序列可以是调试目标机器学习模型时通过自然语言处理算法对第二认证型产品使用点评信息进行自然语言处理所得的观点句子序列,自然语言处理算法对第二认证型产品使用点评信息的处理思路同理可以参阅对活跃性用户点评文本集进行自然语言处理的相关描述。目标机器学习模型在得到第二认证型产品使用点评信息对于目标产品反馈建议主题的优化建议挖掘信息后,确定该结果与第二认证型产品使用点评信息对于目标产品反馈建议主题的先验知识的偏差信息,可以理解为第二策略代价信息,在该策略代价信息不满足逼近条件的前提下,调整目标机器学习模型的偏置数据,确保自然语言处理算法和之前的多个机器学习模型的偏置数据保持不变,动态更新第二认证型产品使用点评信息,跟踪第二策略代价信息,直到第二策略代价信息满足逼近条件。可以理解的是,第三展示型点评句子序列同理会分配到之前的多个机器学习模型进行区分处理。
应用于上述实施例,针对多个机器学习模型的非独占自然语言处理算法输出思路,如果存在额外配置的目标产品反馈建议主题,则可为该目标产品反馈建议主题概括一个新的注释信息,并通过经由注释的第二认证型产品使用点评信息为该目标产品反馈建议主题调试一个机器学习模型,从而能够有效地进行产品反馈建议主题的优化和机器学习模型的额外配置。此外,由于自然语言处理算法和之前的多个机器学习模型的偏置数据不存在变化,调试目标机器学习模型时,无需对自然语言处理算法和多个机器学习模型的偏置数据进行改进,有助于提高目标机器学习模型的调试速度。
对于一种可独立实施的技术方案而言,在获得所述活跃性用户点评文本集的优化建议挖掘报告之后,该方法还可以包括如下内容:向所述数字化产品平台系统下发所述优化建议挖掘报告;判断在设定时段内是否接收到所述数字化产品平台系统针对所述优化建议挖掘报告发送的产品优化定制请求;若是,则基于所述产品优化定制请求对所述优化建议挖掘报告进行产品优化方案定制,得到目标产品优化方案并将其下发给所述数字化产品平台系统;若否,则将所述优化建议挖掘报告进行缓存。
举例而言,设定时段可以是1小时或者1天,在此不作限定。如果在设定时段内接收到所述数字化产品平台系统针对所述优化建议挖掘报告发送的产品优化定制请求,则大数据处理系统可以进行产品优化方案定制,从而快速得到目标产品优化方案,提高数字化产品平台系统获得目标产品优化方案的时效性。其中,目标产品优化方案可以指示数字化产品平台系统的产品优化的一些列细节性流程,从而可以快速准确地指导数字化产品平台系统进行服务产品优化,避免数字化产品平台系统在定制目标产品优化方案的过程中耗费大量处理资源。此外,在一些情况下,大数据处理系统可以并行下处理不同数字化产品平台系统的产品优化定制请求,从而进一步提高服务产品优化的效率。
对于一种可独立实施的技术方案而言,基于所述产品优化定制请求对所述优化建议挖掘报告进行产品优化方案定制,得到目标产品优化方案,可以包括如下内容:对优化建议挖掘报告进行产品更新细节内容抽取,得到第一细节内容抽取结果;将所述优化建议挖掘报告的模板优化建议挖掘报告与所述优化建议挖掘报告进行细节内容混淆,对完成细节内容混淆的所述优化建议挖掘报告进行产品更新细节内容抽取,得到第二细节内容抽取结果;通过所述第一细节内容抽取结果和所述第二细节内容抽取结果确定所述优化建议挖掘报告中产品更新事项的目标产品优化方案。如此设计,通过细节内容混淆处理,能够考虑模板优化建议挖掘报告的历史产品优化方案,从而保障目标产品优化方案的精度和可信度。
对于一种可独立实施的技术方案而言,所述第一细节内容抽取结果在所述优化建议挖掘报告中对应第一报告内容集,所述第二细节内容抽取结果在所述优化建议挖掘报告中对应第二报告内容集;所述通过所述第一细节内容抽取结果和所述第二细节内容抽取结果确定所述优化建议挖掘报告中产品更新事项的目标产品优化方案,包括:确定所述第一报告内容集和所述第二报告内容集的比对系数;响应于所述比对系数大于指定限值,基于所述第一细节内容抽取结果和所述第二细节内容抽取结果的联合分析结果,确定所述优化建议挖掘报告中产品更新事项的目标产品优化方案。
对于一种可独立实施的技术方案而言,所述第一细节内容抽取结果包括所述产品更新事项的第一事项优化流程数据,所述第二细节内容抽取结果包括所述产品更新事项的第二事项优化流程数据;所述基于所述第一细节内容抽取结果和所述第二细节内容抽取结果的联合分析结果,确定所述优化建议挖掘报告中产品更新事项的目标产品优化方案,包括:将所述产品更新事项的第一事项优化流程数据与所述产品更新事项的第二事项优化流程数据进行合并,确定所述产品更新事项的事项优化流程数据。
对于一种可独立实施的技术方案而言,所述第一细节内容抽取结果包括所述产品更新事项的第一事项标识和所述产品更新事项属于所述第一事项标识的第一命中指数,所述第二细节内容抽取结果包括所述产品更新事项的第二事项标识和所述产品更新事项属于所述第二事项标识的第二命中指数;所述基于所述第一细节内容抽取结果和所述第二细节内容抽取结果的联合分析结果,确定所述优化建议挖掘报告中产品更新事项的目标产品优化方案,包括:响应于所述第一事项标识和所述第二事项标识为同一事项标识,对所述第一命中指数和所述第二命中指数进行合并得到所述产品更新事项属于该事项标识的命中指数。
对于一种可独立实施的技术方案而言,所述对优化建议挖掘报告进行产品更新细节内容抽取,得到第一细节内容抽取结果,包括:通过第一细节抽取模型对所述优化建议挖掘报告进行细节内容抽取,得到所述优化建议挖掘报告的第一细节内容分布;通过第二细节抽取模型对所述优化建议挖掘报告的第一细节内容分布进行细节内容抽取,得到所述优化建议挖掘报告的多组第二细节内容分布;对所述优化建议挖掘报告的多组第二细节内容分布进行挖掘,得到所述第一细节内容抽取结果。
对于一种可独立实施的技术方案而言,所述将所述优化建议挖掘报告的模板优化建议挖掘报告与所述优化建议挖掘报告进行细节内容混淆,对完成细节内容混淆的所述优化建议挖掘报告进行产品更新细节内容抽取,得到第二细节内容抽取结果,包括:通过细节内容混淆模型将所述优化建议挖掘报告的第一细节内容分布与所述模板优化建议挖掘报告的第一细节内容分布进行拼接,得到所述优化建议挖掘报告的第三细节内容分布;通过第三细节抽取模型对所述优化建议挖掘报告的第三细节内容分布进行细节内容抽取,得到优化建议挖掘报告的多组第四细节内容分布;对所述优化建议挖掘报告的多组第四细节内容分布进行挖掘,得到所述第二细节内容抽取结果。
对于一种可独立实施的技术方案而言,所述模板优化建议挖掘报告包括处于所述优化建议挖掘报告之前的历史优化建议挖掘报告;所述通过细节内容混淆模型将所述优化建议挖掘报告的第一细节内容分布与所述模板优化建议挖掘报告的第一细节内容分布进行拼接,得到所述优化建议挖掘报告的第三细节内容分布,包括:将所述优化建议挖掘报告的第一细节内容分布与所述优化建议挖掘报告的上一组优化建议挖掘报告的第三细节内容分布进行拼接,得到所述优化建议挖掘报告的第三细节内容分布。
图3是示出可以实现本申请的实施例的结合大数据的产品点评信息处理方法的应用环境的架构示意图,结合大数据的产品点评信息处理方法的应用环境中可以包括互相通信的大数据处理系统100和数字化产品平台系统200。基于此,大数据处理系统100和数字化产品平台系统200在运行时实现或者部分实现本申请实施例的结合大数据的产品点评信息处理方法。
以上已经结合附图描述了本申请的实施例,至少具有如下有益效果:当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息;响应于产品使用点评信息中包含活跃性用户点评文本集,确定活跃性用户点评文本集所关联的上下游评论观点文本集;对活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,得到活跃性用户点评文本集的优化建议挖掘报告。如此一来,在进行优化建议的识别挖掘时,可以精准定位得到活跃性用户点评文本集(例如产品使用体验点评)在若干类产品反馈建议主题下的优化建议挖掘信息,可以在一定程度上减少活跃性用户点评文本集的个别产品反馈建议主题的优化建议识别遗漏,这样能够尽量地提升活跃性用户点评文本集的优化建议识别的精度和完整性,此外,鉴于优化建议识别的核心流程在大数据处理系统侧进行,因而可以减轻数字化产品平台系统特别是算力较弱的数字化产品平台系统的点评分析资源开销。
以上所述,仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。
Claims (10)
1.一种结合大数据的产品点评信息处理方法,其特征在于,该方法应用于大数据处理系统,所述大数据处理系统与数字化产品平台系统通信,该方法至少包括:
当接收到所述数字化产品平台系统上传的产品点评分析请求时,采集目标线上服务产品的产品使用点评信息;
响应于所述产品使用点评信息中包含活跃性用户点评文本集,确定所述活跃性用户点评文本集所关联的上下游评论观点文本集;
对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,获得所述活跃性用户点评文本集的优化建议挖掘报告。
2.根据权利要求1所述的方法,其特征在于,所述对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,获得所述活跃性用户点评文本集的优化建议挖掘报告是基于智能化决策线程实现的,所述智能化决策线程是通过对人工智能模型进行调试所得的,所述人工智能模型包括自然语言处理算法和用作逐个对指定的若干类产品反馈建议主题进行区分处理的多个机器学习模型,所述智能化决策线程基于如下内容调试所得:
收集所述活跃性用户点评文本集的第一认证型产品使用点评信息和所述第一认证型产品使用点评信息关于所述若干类产品反馈建议主题的先验知识;
将所述第一认证型产品使用点评信息加载到所述自然语言处理算法进行自然语言处理,得到第二展示型点评句子序列;
将所述第二展示型点评句子序列分别加载到所述多个机器学习模型进行优化建议挖掘,获得所述第一认证型产品使用点评信息关于所述若干类产品反馈建议主题的优化建议挖掘报告;
利用所述第一认证型产品使用点评信息关于所述若干类产品反馈建议主题的优化建议挖掘报告和所述第一认证型产品使用点评信息关于所述若干类产品反馈建议主题的先验知识,确定第一策略代价信息;
利用所述第一策略代价信息改进所述自然语言处理算法和所述多个机器学习模型的偏置数据,动态更新所述第一认证型产品使用点评信息,以实现所述第一策略代价信息满足逼近条件,获得所述智能化决策线程。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
如果存在需要额外配设的目标产品反馈建议主题,则在所述智能化决策线程中额外配设所述目标产品反馈建议主题的目标机器学习模型;
收集所述活跃性用户点评文本集的第二认证型产品使用点评信息和所述第二认证型产品使用点评信息关于所述目标产品反馈建议主题的先验知识;
将所述第二认证型产品使用点评信息加载到所述自然语言处理算法进行自然语言处理,得到第三展示型点评句子序列;
将所述第三展示型点评句子序列加载到所述目标机器学习模型进行优化建议挖掘,获得所述第二认证型产品使用点评信息关于所述目标产品反馈建议主题的优化建议挖掘报告;
利用所述第二认证型产品使用点评信息关于所述目标产品反馈建议主题的优化建议挖掘报告和所述第二认证型产品使用点评信息关于所述目标产品反馈建议主题的先验知识,确定所述目标机器学习模型的第二策略代价信息;
利用所述第二策略代价信息改进所述目标机器学习模型的偏置数据,动态更新所述第二认证型产品使用点评信息,以实现所述第二策略代价信息满足逼近条件。
4.根据权利要求1所述的方法,其特征在于,所述对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行指定的若干类产品反馈建议主题的优化建议识别,获得所述活跃性用户点评文本集的优化建议挖掘报告,包括:
对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列;
基于所述若干类产品反馈建议主题中每类产品反馈建议主题对应的机器学习模型分别对所述第一展示型点评句子序列进行优化建议挖掘,获得所述活跃性用户点评文本集关于所述每类产品反馈建议主题的优化建议挖掘报告。
5.根据权利要求4所述的方法,其特征在于,所述每类产品反馈建议主题的优化建议挖掘报告包含如下的其中一项:具有该产品反馈建议主题的优化建议;不具有该产品反馈建议主题的优化建议;未鉴别出是否具有该产品反馈建议主题的优化建议;具有未知产品反馈建议主题的优化建议。
6.根据权利要求4所述的方法,其特征在于,所述活跃性用户点评文本集为产品使用体验点评,所述若干类产品反馈建议主题包含如下两项或两项以上:可视化交互界面优化、强制广告弹窗拦截和个体隐私信息防护。
7.根据权利要求4所述的方法,其特征在于,所述对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行自然语言处理,得到第一展示型点评句子序列,包括:
对所述活跃性用户点评文本集所关联的上下游评论观点文本集进行窗口化挖掘,得到第一观点句子序列;
对所述第一观点句子序列进行u轮周期的关键短语提取处理,得到u个体量的观点句子序列,所述u个体量的观点句子序列与所述u轮周期的关键短语提取处理存在一对一匹配关系,u为不小于2的整数;
对所述第一观点句子序列和所述u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,得到w个第二观点句子序列,v为不小于2且不超过u的整数,w=v+1;
依据所述w个第二观点句子序列对所述u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,获得所述第一展示型点评句子序列。
8.根据权利要求7所述的方法,其特征在于,所述依据所述w个第二观点句子序列对所述u个体量的观点句子序列中目标体量的观点句子序列进行u轮周期的衍生短语扩展处理,获得所述第一展示型点评句子序列,包括:
对所述目标体量的观点句子序列进行第一轮周期的衍生短语扩展处理;
关于所述u轮周期的衍生短语扩展处理中第x轮周期的衍生短语扩展处理,如果所述w个第二观点句子序列中具有待整理的第二观点句子序列,则将所述待整理的第二观点句子序列与所述第x轮周期的衍生短语扩展处理所得的观点句子序列进行整理,得到第一已整理观点句子序列,所述待整理的第二观点句子序列为与所述第x轮周期的衍生短语扩展处理所得的观点句子序列的观点描述维度一致的第二观点句子序列,x为不小于1且小于等于u-1的整数;
对所述第一已整理观点句子序列或所述第x轮周期的衍生短语扩展处理所得的观点句子序列,进行第y轮周期的衍生短语扩展处理,直到完成第u轮周期的衍生短语扩展处理,y=x+1;
将所述第u轮周期的衍生短语扩展处理所得的观点句子序列与所述w个第二观点句子序列中观点描述维度一致的观点句子序列进行整理,得到第二已整理观点句子序列;
对所述第二已整理观点句子序列进行基于展示策略的调整,获得所述第一展示型点评句子序列。
9.根据权利要求7所述的方法,其特征在于,所述对所述第一观点句子序列和所述u个体量的观点句子序列中的v个目标观点句子序列进行语义挖掘,包括:
关于所述第一观点句子序列和所述v个目标观点句子序列中的每个观点句子序列,对所述每个观点句子序列进行第1轮双向语义挖掘操作,得到第1轮完成语义挖掘的的观点句子序列;
对第z轮完成语义挖掘的的观点句子序列进行第q轮双向语义挖掘操作,得到第q轮完成语义挖掘的的观点句子序列,z为大于或等1的整数且q=z+1;
通过不低于两轮的双向语义挖掘操作,确定与所述每个观点句子序列满足语义挖掘匹配条件的第二观点句子序列,所述w个第二观点句子序列包括所述第二观点句子序列。
10.一种大数据处理系统,其特征在于,包括:
用于存储可执行计算机程序的存储器,用于执行所述存储器中存储的可执行计算机程序时实现权利要求1-9任一所述的方法的处理器。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210342490.8A CN114662470A (zh) | 2022-03-31 | 2022-03-31 | 结合大数据的产品点评信息处理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210342490.8A CN114662470A (zh) | 2022-03-31 | 2022-03-31 | 结合大数据的产品点评信息处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114662470A true CN114662470A (zh) | 2022-06-24 |
Family
ID=82033541
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210342490.8A Withdrawn CN114662470A (zh) | 2022-03-31 | 2022-03-31 | 结合大数据的产品点评信息处理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114662470A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115168895A (zh) * | 2022-07-08 | 2022-10-11 | 哈尔滨汇谷科技有限公司 | 结合人工智能的用户信息威胁分析方法及服务器 |
CN116843916A (zh) * | 2023-07-25 | 2023-10-03 | 湖北仕上电子科技有限公司 | 基于人工智能的板材干燥设备控制系统的优化方法及系统 |
-
2022
- 2022-03-31 CN CN202210342490.8A patent/CN114662470A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115168895A (zh) * | 2022-07-08 | 2022-10-11 | 哈尔滨汇谷科技有限公司 | 结合人工智能的用户信息威胁分析方法及服务器 |
CN115168895B (zh) * | 2022-07-08 | 2023-12-12 | 深圳市芒果松科技有限公司 | 结合人工智能的用户信息威胁分析方法及服务器 |
CN116843916A (zh) * | 2023-07-25 | 2023-10-03 | 湖北仕上电子科技有限公司 | 基于人工智能的板材干燥设备控制系统的优化方法及系统 |
CN116843916B (zh) * | 2023-07-25 | 2024-02-23 | 湖北仕上电子科技有限公司 | 基于人工智能的板材干燥设备控制系统的优化方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107291828B (zh) | 基于人工智能的口语查询解析方法、装置及存储介质 | |
CN112307215A (zh) | 数据处理方法、装置及计算机可读存储介质 | |
CN113010702B (zh) | 多媒体信息的互动处理方法、装置、电子设备及存储介质 | |
CN114662470A (zh) | 结合大数据的产品点评信息处理方法及系统 | |
CN110909145B (zh) | 针对多任务模型的训练方法及装置 | |
CN107330613A (zh) | 一种舆情监控方法、设备及计算机可读存储介质 | |
CN109299245B (zh) | 知识点召回的方法和装置 | |
CN111368075A (zh) | 文章质量预测方法、装置、电子设备及存储介质 | |
CN111144120A (zh) | 一种训练语句的获取方法、装置、存储介质及电子设备 | |
CN112035675A (zh) | 医疗文本标注方法、装置、设备及存储介质 | |
CN110580308A (zh) | 信息审核方法及装置、电子设备、存储介质 | |
CN111309887B (zh) | 一种训练文本关键内容提取模型的方法和系统 | |
CN109582788A (zh) | 垃圾评论训练、识别方法、装置、设备及可读存储介质 | |
CN109376219A (zh) | 文本属性字段的匹配方法、装置、电子设备及存储介质 | |
CN108959550B (zh) | 用户关注点挖掘方法、装置、设备及计算机可读介质 | |
CN113919336A (zh) | 基于深度学习的文章生成方法、装置及相关设备 | |
CN114357125A (zh) | 任务型对话系统中的自然语言识别方法、装置及设备 | |
CN111340605A (zh) | 训练用户行为预测模型、用户行为预测的方法和装置 | |
CN111524043A (zh) | 诉讼风险评估问卷自动生成的方法和装置 | |
CN114862520A (zh) | 产品推荐方法、装置、计算机设备及存储介质 | |
CN111523315A (zh) | 数据处理方法、文本识别方法、装置及计算机设备 | |
CN117057722A (zh) | 项目分工方法 | |
CN116701752A (zh) | 基于人工智能的新闻推荐方法、装置、电子设备及介质 | |
CN116186089A (zh) | 一种产业资源智能匹配方法、系统、介质及设备 | |
CN113722577B (zh) | 反馈信息的处理方法、装置、设备以及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220624 |