CN114661994A - 基于人工智能的用户兴趣数据处理方法、系统及云平台 - Google Patents
基于人工智能的用户兴趣数据处理方法、系统及云平台 Download PDFInfo
- Publication number
- CN114661994A CN114661994A CN202210309048.5A CN202210309048A CN114661994A CN 114661994 A CN114661994 A CN 114661994A CN 202210309048 A CN202210309048 A CN 202210309048A CN 114661994 A CN114661994 A CN 114661994A
- Authority
- CN
- China
- Prior art keywords
- entity
- activity
- basic
- derived
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Probability & Statistics with Applications (AREA)
- Fuzzy Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供的基于人工智能的用户兴趣数据处理方法、系统及云平台,依据用户兴趣挖掘计划对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;挖掘衍生用户行为日志中与基础活动实体相关的衍生活动实体;确定实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,确定用户兴趣挖掘计划是否准确;针对触发前后的用户行为日志中的活动实体进行了衍生,比对基础活动实体与衍生活动实体之间的实体区别特征,以及实体区别特征与模拟衍生维度特征之间的关联度,进而可以提高兴趣预测结果的可信度。
Description
技术领域
本申请涉及数据处理技术领域,具体而言,涉及基于人工智能的用户兴趣数据处理方法、系统及云平台。
背景技术
随着人工智能的不断发展,人工智能能够快速的对用户感兴趣的相关数据进行识别并处理,这样一来,能有效地提高用户的体验感。在实际操作过程中,发明人发现,在进行用户的兴趣预测时,可能会出现预测不准确的问题,进而导致用户兴趣数据处理时,存在处理缺陷,从而难以确保预测结果的可信度,所以亟需一个方案以解决上述技术问题。
发明内容
鉴于此,本申请提供了基于人工智能的用户兴趣数据处理方法、系统及云平台。
第一方面,提供一种基于人工智能的用户兴趣数据处理方法,包括:
依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体;
依据所述用户兴趣挖掘请求对所述用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;所述用户兴趣挖掘请求具有所述模糊衍生的模拟衍生维度特征;
挖掘所述衍生用户行为日志中与所述基础活动实体相关的衍生活动实体;
确定所述基础活动实体与所述衍生活动实体之间的实体区别特征;基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,并基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果。
在一种独立实施的实施例中,所述解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体,包括:依据用户行为活动解析网络对所述用户兴趣挖掘请求涵盖的用户行为日志进行解析,生成所述用户行为日志中的用户行为活动;
获取所述用户行为活动在所述用户行为日志中的活动定位轨迹,从所述活动定位轨迹关联的活动实体中确定所述用户行为活动关联的基础活动实体。
在一种独立实施的实施例中,所述解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体,包括:
获取所述用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的预设知识图谱,获取所述预设知识图谱相关的预设知识图谱数据;
在所述用户兴趣挖掘请求涵盖的用户行为日志中,将实体类别属性匹配于所述预设知识图谱数据的用户行为内容块,生成为所述用户行为日志中的用户行为活动关联的基础活动实体;具有匹配预设知识图谱的基础活动实体为基础活动实体组合。
在一种独立实施的实施例中,所述方法还包括:
获取所述用户行为日志中的若干用户行为内容块的内容特征变量,依据所述若干用户行为内容块的内容特征变量,将所述若干用户行为内容块投射到预设知识空间;
依据所述若干用户行为内容块在所述预设知识空间中的内容节点,对所述若干用户行为内容块进行分簇,获得用户行为内容块簇;
基于所述预设知识空间中与所述用户行为内容块簇的联系知识实体覆盖预设知识实体范围的知识实体,生成知识实体分布网络,所述知识实体分布网络包括所述预设知识图谱数据。
在一种独立实施的实施例中,所述基础活动实体的量化值为若干,所述衍生活动实体的量化值为若干;
所述确定所述基础活动实体与所述衍生活动实体之间的实体区别特征,包括:
获取若干基础活动实体的各个基础活动实体分别相关的基础实体属性,获取每个基础活动实体分别相关的基础实体属性的属性标签分量,依据所述基础实体属性的属性标签分量对所述若干基础活动实体进行分团,获得w个基础活动实体组合;所述w个基础活动实体组合包括基础活动实体组合r,所述基础活动实体组合r包括第一基础活动实体及第二基础活动实体;
获取若干衍生活动实体的各个衍生活动实体分别相关的衍生过程信息,获取所述每个衍生活动实体分别相关的衍生过程信息的属性标签分量,依据所述衍生过程信息的属性标签分量对所述若干衍生活动实体进行分团,获得w个衍生活动实体组合;所述w个衍生活动实体组合包括衍生活动实体组合r,所述衍生活动实体组合r包括第一衍生活动实体及第二衍生活动实体;
获取每个基础活动实体组合中第一基础活动实体在所述用户行为日志中的第一基础业务节点,及所述第二基础活动实体在所述用户行为日志中的第二基础业务节点,基于所述第一基础业务节点及所述第二基础业务节点,生成所述基础活动实体组合r的基础区别特征;
获取每个衍生活动实体组合中第一衍生活动实体在所述衍生用户行为日志中的第一衍生业务节点,及所述第二衍生活动实体在所述衍生用户行为日志中的第二衍生业务节点,基于所述第一衍生业务节点及所述第二衍生业务节点,生成所述衍生活动实体组合r的衍生区别特征;
将所述基础活动实体组合r的基础区别特征及所述衍生活动实体组合r的衍生区别特征之间的联系区别特征,生成为第r个实体区别特征。
在一种独立实施的实施例中,所述基础活动实体的量化值为若干,所述衍生活动实体的量化值为若干;
所述确定所述基础活动实体与所述衍生活动实体之间的实体区别特征,包括:
获取所述用户兴趣挖掘计划相关的参考属性标签分量,获取若干基础活动实体的各个基础活动实体的属性标签分量,将所述若干基础活动实体中与所述参考属性标签分量关联的基础活动实体作为参考基础活动实体;所述参考基础活动实体包括参考基础活动实体t及参考基础活动实体y,所述参考基础活动实体t与所述参考基础活动实体y的属性标签分量一致;
获取所述参考基础活动实体t在所述用户行为日志中的第三基础业务节点及所述参考基础活动实体y在所述用户行为日志中的第四基础业务节点,基于所述第三基础业务节点及所述第四基础业务节点,生成所述参考基础活动实体t与所述参考基础活动实体y之间的参考基础区别特征;
获取若干衍生活动实体的各个衍生活动实体的属性标签分量,将所述若干衍生活动实体中与所述参考属性标签分量关联的衍生活动实体作为目标衍生活动实体;所述目标衍生活动实体包括目标衍生活动实体t及目标衍生活动实体y,所述目标衍生活动实体t与所述目标衍生活动实体y的属性标签分量一致;
获取所述目标衍生活动实体t在所述衍生用户行为日志中的第三衍生业务节点及所述目标衍生活动实体y在所述衍生用户行为日志中的第四衍生业务节点,基于所述第三衍生业务节点及所述第四衍生业务节点,生成所述目标衍生活动实体t与所述目标衍生活动实体y之间的目标衍生区别特征;将所述参考基础区别特征及所述目标衍生区别特征之间的联系区别特征,生成为所述实体区别特征。
在一种独立实施的实施例中,所述基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,包括:
基于所述模拟衍生维度特征确定与所述实体区别特征匹配的目标挖掘基础特征;
获取所述目标挖掘基础特征所对应的数据索引信息以及每个数据索引信息所对应的引用信息;
基于所述数据索引信息从所述用户兴趣挖掘请求涵盖的用户行为日志中获取基础索引基础数据,并基于所述引用信息,在所述基础索引基础数据中引用其它与所述用户兴趣挖掘请求对应的当前用户的目标用户在当前指定的业务推广计划的扩展行为数据,并将所述扩展行为数据和所述基础索引基础数据进行汇总以生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据。
在一种独立实施的实施例中,所述基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果的步骤,包括:
基于预先训练的兴趣预测模型提取所述用户兴趣挖掘基础数据中与当前指定的业务推广计划相关的偏好提取特征,并基于所述兴趣预测模型中的分类网络层对所述偏好提取特征进行分类,获得每个候选用户兴趣的预测概率值;
基于所述每个候选用户兴趣的预测概率值生成对应的目标用户兴趣热力图,并结合历史兴趣热力图与所述目标用户兴趣热力图进行融合,获得所述用户行为日志的用户兴趣数据结果。
第二方面,提供一种基于人工智能的用户兴趣数据处理系统,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,提供一种云平台,所述云平台包括存储有计算机程序的可读存储介质,所述可读存储介质运行计算机程序以执行所述的方法。
本申请实施例所提供的基于人工智能的用户兴趣数据处理方法、系统及云平台,依据用户兴趣挖掘计划对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;挖掘衍生用户行为日志中与基础活动实体相关的衍生活动实体;确定实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,确定用户兴趣挖掘计划是否准确;针对触发前后的用户行为日志中的活动实体进行了衍生,比对基础活动实体与衍生活动实体之间的实体区别特征,以及实体区别特征与模拟衍生维度特征之间的关联度,进而可以提高兴趣预测结果的可信度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例所提供的一种基于人工智能的用户兴趣数据处理方法的流程图。
图2为本申请实施例所提供的一种基于人工智能的用户兴趣数据处理装置的框图。
图3为本申请实施例所提供的一种基于人工智能的用户兴趣数据处理系统的架构图。
具体实施方式
为了更好的理解上述技术方案,下面通过附图以及具体实施例对本申请技术方案做详细的说明,应当理解本申请实施例以及实施例中的具体特征是对本申请技术方案的详细的说明,而不是对本申请技术方案的限定,在不冲突的情况下,本申请实施例以及实施例中的技术特征可以相互组合。
请参阅图1,示出了一种基于人工智能的用户兴趣数据处理方法,该方法可以包括以下STEP101-STEP104所描述的技术方案。
STEP101,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体。
本公开实施例中,可以通过触发的用户兴趣挖掘计划的用户兴趣挖掘请求时,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体。其中,用户行为日志可以理解为在线采集数据,也可以是用户输入数据等,在此不进行一一赘述。如果用户行为日志为在线采集数据,则针对在线采集数据中的每一个用户输入数据,都会执行以下STEP101-STEP104进行处理。用户行为活动可以理解为用户行为日志中的关键特征。基础活动实体用于记录用户行为日志中用户行为活动的关键属性所相关的用户行为内容块。
优选地,依据用户行为活动解析网络解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体。详细地,依据用户行为活动解析网络对用户兴趣挖掘请求涵盖的用户行为日志进行解析,生成用户行为日志中的用户行为活动;获取用户行为活动在用户行为日志中的活动定位轨迹,从活动定位轨迹关联的活动实体中确定用户行为活动关联的基础活动实体。
在实际操作过程中,依据用户行为活动解析网络对用户兴趣挖掘请求涵盖的用户行为日志进行解析,生成用户行为日志中的用户行为活动;获取该用户行为活动所相关的用户行为内容块的特征,依据该用户行为活动的事件及该用户行为活动的关键属性之间的相对关系,生成该用户行为活动的关键属性相关的活动定位轨迹;分析该用户行为活动的关键属性的约束条件,将该用户行为活动的关键属性的约束条件作为该用户行为活动关联的基础活动实体。
优选地,依据用户行为日志中的批注变量确定用户行为日志中的用户行为活动关联的基础活动实体。进一步地,获取用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的预设知识图谱,获取预设知识图谱相关的预设知识图谱数据;在用户兴趣挖掘请求涵盖的用户行为日志中,将实体类别属性匹配于预设知识图谱数据的用户行为内容块,生成为用户行为日志中的用户行为活动关联的基础活动实体;具有匹配预设知识图谱的基础活动实体为基础活动实体组合。属于预设知识图谱数据的实体类别属性可以理解为预设知识图谱。
在实际操作过程中,可以先获取用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的预设知识图谱,比如,用户兴趣挖掘计划关联的预设知识图谱是指某一关键属性相关的批注变量(比如用户兴趣挖掘计划是针对用户行为活动的热点行为进行的模糊衍生,针对用户行为活动的其他关键属性不进行模糊衍生),则获取用户行为活动的相关的预设知识图谱数据,通过对用户行为日志中的用户行为内容块进行分析,如果分析到实体类别属性匹配于预设知识图谱数据的用户行为内容块,则将该实体类别属性匹配于预设知识图谱数据的用户行为内容块作为用户行为日志中的用户行为活动关联的基础活动实体。
在获取用户行为日志中的用户行为活动关联的基础活动实体时,通过分析用户行为日志中的若干用户行为内容块;如果若干用户行为内容块中的第q个用户行为内容块相关的实体类别属性匹配于预设知识图谱数据,则将第q个用户行为内容块作为用户行为日志中的用户行为活动关联的基础活动实体;如果若干用户行为内容块中的第q个用户行为内容块相关的实体类别属性不属于预设知识图谱数据,则分析第(q+2)个用户行为内容块相关的实体类别属性,分析该第(q+2)个用户行为内容块相关的实体类别属性是否属于预设知识图谱数据,以分析该第(q+2)个用户行为内容块是否为用户行为日志中的用户行为活动关联的基础活动实体;直至对该用户行为日志中的所有用户行为内容块分析结束,获得用户行为日志中的用户行为活动关联的基础活动实体,将具有匹配预设知识图谱的基础活动实体作为基础活动实体组合。
在实际操作过程中,通过分析用户行为日志中的若干用户行为内容块,比如可以从用户行为日志中从按照预先设置的顺序进行识别,当分析到其中一个中存在用户行为内容块(比如第q个用户行为内容块)相关的实体类别属性匹配于预设知识图谱数据时,将该用户行为内容块(比如第q个用户行为内容块)作为用户行为日志中的用户行为活动关联的基础活动实体。进一步地,可以连续不间断地从用户行为日志中反序进行识别,当分析到其中一个中存在用户行为内容块相关的实体类别属性匹配于预设知识图谱数据时,将该用户行为内容块作为用户行为日志中的用户行为活动关联的基础活动实体。优选地,也可以直接对用户行为日志进行逐一识别;或者,也可直接对用户行为日志进行逐一识别。
优选地,可以获取预设知识图谱数据,以及获取需要分析的目标关键属性相关的分析活动实体数目,然后对用户行为日志进行识别,分析到用户行为日志中实体类别属性匹配于预设知识图谱数据的用户行为内容块后,将该实体类别属性匹配于预设知识图谱数据的用户行为内容块作为基础活动实体,再对用户行为日志进行识别,如果分析到实体类别属性匹配于预设知识图谱数据的用户行为内容块,则将此次识别中,实体类别属性匹配于预设知识图谱数据的用户行为内容块作为基础活动实体。当获取到的基础活动实体的量化值等于分析活动实体数目时,可以结束对用户行为日志的分析,从而提高数据分析准确率。比如,目标关键属性相关的分析活动实体数目为4时,对用户行为日志进行识别,如果分析到用户行为日志中实体类别属性匹配于预设知识图谱数据的一个基础活动实体时,再对用户行为日志进行识别,如果分析到用户行为日志中实体类别属性匹配于预设知识图谱数据的另一个基础活动实体时,可知此时基础活动实体的量化值为4,且等于分析活动实体数目,则可以结束对用户行为日志的分析,从而提高数据分析准确率。
优选地,批注变量也可以表征用于记录用户行为日志中用户行为活动的关键属性相关的用户行为内容块的量化结果。
进一步地,将若干批注变量中属于预设知识图谱数据的批注变量作为预设知识图谱,该预设知识图谱数据用于表示目标关键属性相关的预设知识图谱,比如该预设知识图谱数据用于从若干批注变量中抽取需要分析的目标关键属性相关的预设知识图谱。由于在上述过程中从若干批注变量中确定了预设知识图谱,因此可以直接将预设知识图谱在用户行为日志中相关的用户行为内容块,生成为用户行为活动关联的基础活动实体。
进一步地,可以将用户行为日志中的用户行为内容块的内容特征变量投射到预设知识空间,依据预设知识空间确定知识实体分布网络。进一步地,获取用户行为日志中的若干用户行为内容块的内容特征变量,依据若干用户行为内容块的内容特征变量,将若干用户行为内容块投射到预设知识空间;依据若干用户行为内容块在预设知识空间中的内容节点对若干用户行为内容块进行分簇,获得用户行为内容块簇;基于预设知识空间中与用户行为内容块簇的联系知识实体覆盖预设知识实体范围的知识实体,生成所述知识实体分布网络,其中,知识实体分布网络包括预设知识图谱数据。优选地,如果用户行为内容块簇的量化值为a个,则基于预设知识空间中与a个用户行为内容块簇的联系知识实体的各个用户行为内容块簇的联系知识实体都满足预设知识实体范围的知识实体,生成知识实体分布网络。
本公开实施例提供的一种确定知识实体分布网络的运用场景,用户行为日志21中包括40个用户行为内容块,每个用户行为内容块对应一个内容特征变量,获取每个用户行为内容块的内容特征变量,依据每个用户行为内容块的内容特征变量将40个用户行为内容块投射到预设知识空间22中。可以依据40个用户行为内容块在预设知识空间中的内容节点对40个用户行为内容块进行分簇,获得用户行为内容块簇,比如得到6个用户行为内容块簇,基于预设知识空间中与6个用户行为内容块簇的联系知识实体覆盖预设知识实体范围的知识实体,生成所述知识实体分布网络。比如,用户行为内容块g1位于用户行为内容块簇内,则用户行为内容块g1的知识实体与用户行为内容块簇的联系知识实体未覆盖预设知识实体范围;而用户行为内容块g2位于用户行为内容块簇外的待选内容集,则用户行为内容块g2的知识实体与用户行为内容块簇的联系知识实体覆盖预设知识实体范围,可以将用户行为内容块g2相关的知识实体所属范围作为知识实体分布网络,知识实体分布网络包括预设知识图谱数据。
STEP102,依据所述用户兴趣挖掘请求对所述用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;所述用户兴趣挖掘请求具有所述模糊衍生的模拟衍生维度特征。
本公开实施例中,依据用户兴趣挖掘请求对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志,比如衍生用户行为日志中用户行为活动为模糊衍生后的用户行为活动,用户兴趣挖掘请求具有模拟衍生维度特征,模拟衍生维度特征可以表征触发的请求数目或者触发的比例,等等。
优选地,用户兴趣挖掘计划可以针对用户行为活动关联的若干关键属性中的所有关键属性进行触发;或者,用户兴趣挖掘计划可以针对用户行为活动关联的若干关键属性中的至少一个关键属性进行触发。在用户兴趣挖掘计划为针对用户行为活动关联的若干关键属性中的所有关键属性进行触发时,则响应触发的用户兴趣挖掘计划的用户兴趣挖掘请求,依据用户兴趣挖掘请求对用户行为日志中的用户行为活动的所有关键属性进行模糊衍生。在用户兴趣挖掘计划为针对用户行为活动关联的若干关键属性中的至少一个关键属性进行触发时,可以基于数据处理终端针对具体某至少一个关键属性的用户兴趣挖掘请求,实现对用户行为活动的该某至少一个关键属性进行模糊衍生。
本公开实施例提供的一种对用户行为活动进行触发说明,其中,用户兴趣挖掘计划的用户兴趣挖掘请求为针对用户操作的触发,用户兴趣挖掘请求的模拟衍生维度特征为10%,响应该用户兴趣挖掘请求,获取用户兴趣挖掘计划的用户兴趣挖掘请求相关的参考属性标签分量。获取用户行为活动的相关的基础活动实体的属性标签分量,将属性标签分量与参考属性标签分量关联的基础活动实体作为参考基础活动实体。比如参考属性标签分量为用户行为活动的冷门行为相关的属性标签分量,假设用户行为活动的冷门行为相关的属性标签分量为挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体。
本公开实施例中,可以依据用户行为活动解析网络对衍生用户行为日志进行解析,生成衍生用户行为日志中的用户行为活动;获取用户行为活动在衍生用户行为日志中的活动定位轨迹,从用户行为活动在衍生用户行为日志中的活动定位轨迹关联的活动实体中确定与基础活动实体相关的衍生活动实体。具体依据用户行为活动解析网络挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体的方法可参阅STEP101中依据用户行为活动解析网络分析用户行为日志中用户行为活动关联的基础活动实体的方法,此处不再进行一一赘述。
优选地,也可以依据衍生用户行为日志中的融合批注变量,挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体。进一步地,获取用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的目标融合批注变量,获取目标融合批注变量相关的目标融合知识实体分布网络,在衍生用户行为日志中,将融合实体类别属性匹配于目标融合知识实体分布网络的用户行为内容块,生成为衍生用户行为日志中与基础活动实体相关的衍生活动实体,具有相同目标融合批注变量的衍生活动实体为衍生活动实体组合。其中,融合批注变量可以表征衍生用户行为日志中的用户行为内容块的内容特征变量,
STEP103,挖掘所述衍生用户行为日志中与所述基础活动实体相关的衍生活动实体。
本公开实施例中,基础活动实体的量化值为若干,衍生活动实体的量化值为若干,可以获取若干基础活动实体中具有相同属性标签分量的基础活动实体之间的基础区别特征,以及若干衍生活动实体中具有相同属性标签分量的衍生活动实体之间的量化结果,从而基于基础区别特征及衍生区别特征之间的关联度确定基础活动实体与衍生活动实体之间的实体区别特征。
进一步地,获取若干基础活动实体的各个基础活动实体分别相关的基础实体属性,获取每个基础活动实体分别相关的基础实体属性的属性标签分量,依据基础实体属性的属性标签分量对若干基础活动实体进行分团,获得w个基础活动实体组合。其中,w个基础活动实体组合包括基础活动实体组合r,基础活动实体组合r包括第一基础活动实体及第二基础活动实体。
可以理解的是,可以通过获取用户行为日志中用户行为活动关联的各个基础活动实体的内容特征变量确定各个基础活动实体是否为相同属性标签分量,对同一类别的两个基础活动实体进行分类,获得基础活动实体组合,从而得到w个基础活动实体组合。对于用户行为活动的每个关键属性,存在一个相关的基础活动实体组合。比如,用户行为活动的热点行为对应一个基础活动实体组合。
进一步地,在确定w个基础活动实体组合中的基础活动实体组合r之后,获取若干衍生活动实体的各个衍生活动实体分别相关的衍生过程信息,获取每个衍生活动实体分别相关的衍生过程信息的属性标签分量,依据衍生过程信息的属性标签分量对若干衍生活动实体进行分团,获得w个衍生活动实体组合。其中,w个衍生活动实体组合包括衍生活动实体组合r,衍生活动实体组合r包括第一衍生活动实体及第二衍生活动实体。衍生过程信息是指在衍生用户行为日志中的衍生活动实体相关的批注变量。其中,由于用户兴趣挖掘计划是用于对用户行为活动的关键属性进行触发,实现将用户行为活动的关键属性的触发。
可以理解的是,可以通过获取衍生用户行为日志中用户行为活动关联的各个衍生活动实体的内容特征变量从而确定各个衍生活动实体是否为同一类别,对同一类别的两个衍生活动实体进行分类,获得衍生活动实体组合,从而得到w个衍生活动实体组合。对于用户行为活动的每个关键属性,存在一个相关的衍生活动实体组合。优选地,衍生活动实体组合r可以表征用户行为活动的正常行为相关的衍生活动实体组合,或者,衍生活动实体组合r可以表征用户行为活动的冷门行为相关的衍生活动实体组合等。本公开实施例是针对用户行为活动的其中一个关键属性相关的衍生活动实体进行处理,针对用户行为活动的其余关键属性相关的衍生活动实体进行处理的方式可以参阅该其中一个关键属性相关的衍生活动实体的处理方式。
进一步地,获取每个基础活动实体组合中第一基础活动实体在用户行为日志中的第一基础业务节点,及第二基础活动实体在用户行为日志中的第二基础业务节点,基于第一基础业务节点及第二基础业务节点,生成基础活动实体组合r的基础区别特征。
进一步地,获取每个衍生活动实体组合中第一衍生活动实体在衍生用户行为日志中的第一衍生业务节点,及第二衍生活动实体在衍生用户行为日志中的第二衍生业务节点,基于第一衍生业务节点及第二衍生业务节点,生成衍生活动实体组合r的衍生区别特征。其中,确定衍生活动实体组合r的衍生区别特征可以表征确定衍生用户行为日志中的用户行为活动的热点行为相关的两个衍生活动实体之间的量化结果,具体确定衍生活动实体组合r的衍生区别特征的方式可以参阅上述确定基础活动实体组合r的基础区别特征的方法。
优选地,将基础活动实体组合r的基础区别特征及衍生活动实体组合r的衍生区别特征之间的联系区别特征,生成为第r个实体区别特征的方法可以包括:获取依据用户兴趣挖掘请求相关的模拟衍生维度特征最大时对用户行为日志进行模糊衍生,获得目标用户行为日志中用户行为活动的触发活动实体组合r的触发量化结果;基于基础区别特征、衍生区别特征以及触发量化结果,生成为第r个实体区别特征。
STEP104,确定所述基础活动实体与所述衍生活动实体之间的实体区别特征;基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,并基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果。
本公开实施例中,由于通过上述描述内容获取到用户行为日志中的用户行为活动关联的基础活动实体,以及衍生用户行为日志中与基础活动实体相关的衍生活动实体,则可以确定基础活动实体与衍生活动实体之间的实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据,从而确定用户兴趣挖掘计划为有效用户兴趣挖掘计划或者无效用户兴趣挖掘计划,以依据该用户兴趣挖掘基础数据分析该用户兴趣挖掘计划是否发挥作用,进一步地,当该用户兴趣挖掘计划为有效用户兴趣挖掘计划时,生成该用户兴趣挖掘计划可以发挥作用;当该用户兴趣挖掘计划为无效用户兴趣挖掘计划时,生成该用户兴趣挖掘计划不能发挥作用。
优选地,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据的方法可以为:获取实体区别特征与模拟衍生维度特征之间的关联度数据;如果关联度数据属于存在误差许可,则确定用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划有效结果,比如,生成该用户兴趣挖掘计划为有效用户兴趣挖掘计划,可以发挥作用;如果关联度数据不属于存在误差许可,则确定用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划无效结果,比如,生成该用户兴趣挖掘计划为无效用户兴趣挖掘计划,该用户兴趣挖掘计划无法发挥作用。
进一步地,可以获取实体区别特征与模拟衍生维度特征之间的比较结果,将该比较结果作为实体区别特征与模拟衍生维度特征之间的关联度数据,如果实体区别特征与模拟衍生维度特征之间的比较结果属于存在误差许可,则确定用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划有效结果;如果实体区别特征与模拟衍生维度特征之间的比较结果不属于存在误差许可,则确定用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划无效结果。
可以理解的,在执行上述STEP101-STEP104所描述的内容时,依据用户兴趣挖掘计划对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;挖掘衍生用户行为日志中与基础活动实体相关的衍生活动实体;确定实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,确定用户兴趣挖掘计划是否准确;针对触发前后的用户行为日志中的活动实体进行了衍生,比对基础活动实体与衍生活动实体之间的实体区别特征,以及实体区别特征与模拟衍生维度特征之间的关联度,进而可以提高兴趣预测结果的可信度。
本公开实施例中,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体;依据用户兴趣挖掘请求对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;其中,用户兴趣挖掘请求具有模拟衍生维度特征;挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体;确定基础活动实体与衍生活动实体之间的实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。由于用户兴趣挖掘请求相关的模拟衍生维度特征可以表示触发的用户兴趣挖掘计划的用户兴趣挖掘请求可以使用户行为日志触发的标准触发请求数目,而实体区别特征可以表示经过模糊衍生后用户行为日志的实时挖掘请求数目,通过比对用户行为日志的标准触发请求数目与实时挖掘请求数目,可以确定该用户兴趣挖掘计划的用户兴趣挖掘基础数据,比如确定用户兴趣挖掘计划是否准确;由于针对触发前后的用户行为日志中的活动实体进行了分析,且比对了基础活动实体与衍生活动实体之间的实体区别特征,以及实体区别特征与模拟衍生维度特征之间的关联度,可以提高基于人工智能的用户兴趣数据处理的可信度。
优选地,可以分析用户行为日志及衍生用户行为日志中的所有活动实体,再依据用户兴趣挖掘计划对所有活动实体进行筛选,获得目标活动实体,以依据目标活动实体确定实体区别特征。进一步地,可以解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体,该基础活动实体相关的批注变量属于知识实体分布网络,比如,用户行为日志中一旦被注释了的用户行为内容块都可以分析到;挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体,该衍生活动实体相关的批注变量属于知识实体分布网络,比如,在衍生用户行为日志中一旦被注释了的用户行为内容块都可以分析到。进一步地,本公开实施例提供的一种基于人工智能的用户兴趣数据处理方法,所述方法具体可以包括以下步骤。
STEP201,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体。
本公开实施例中,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,分析该用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的所有活动实体,将分析到的所有活动实体记作基础活动实体。进一步地,将用户行为日志中实体类别属性匹配于知识实体分布网络的用户行为内容块作为基础活动实体,此处的基础活动实体用于表示该用户行为日志中所存在的所有活动实体,比如包括了关键属性在用户行为日志中相关的活动实体。
STEP202,依据用户兴趣挖掘请求对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志。
STEP203,挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体。
本公开实施例中,挖掘所述衍生用户行为日志中的用户行为活动关联的所有活动实体,将分析到的所有活动实体记作衍生活动实体。进一步地,将衍生用户行为日志中实体类别属性匹配于融合知识实体分布网络的融合用户行为内容块作为衍生活动实体,此处的衍生活动实体是指该衍生用户行为日志中所存在的所有活动实体,比如包括了关键属性在衍生用户行为日志中相关的活动实体。其中,STEP201-STEP203的具体实施内容可参阅相关的实施例中STEP101-STEP103的描述,此处不再进行一一赘述。
STEP204,生成基础活动实体与衍生活动实体之间的实体区别特征。
本公开实施例中,如果基础活动实体的量化值为若干,衍生活动实体的量化值为若干;则可以通过以下方式确定基础活动实体与衍生活动实体之间的实体区别特征。
(1)获取用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的参考属性标签分量,获取若干基础活动实体的各个基础活动实体的属性标签分量,将若干基础活动实体中与参考属性标签分量关联的基础活动实体作为参考基础活动实体。其中,参考基础活动实体包括参考基础活动实体t及参考基础活动实体y,参考基础活动实体t与参考基础活动实体y的属性标签分量一致。用户兴趣挖掘计划相关的参考属性标签分量用于指示用户行为活动的具体某一关键属性,基础活动实体的属性标签分量用于表示该基础活动实体组合应用户行为活动的某个关键属性。
进一步地,获取用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的参考属性标签分量。
(2)获取参考基础活动实体t在用户行为日志中的第三基础业务节点及参考基础活动实体y在用户行为日志中的第四基础业务节点,基于第三基础业务节点及第四基础业务节点,生成参考基础活动实体t与参考基础活动实体y之间的参考基础区别特征。
(3)获取若干衍生活动实体的各个衍生活动实体的属性标签分量,将若干衍生活动实体中与参考属性标签分量关联的衍生活动实体作为目标衍生活动实体。其中,目标衍生活动实体包括目标衍生活动实体t及目标衍生活动实体y,目标衍生活动实体t与目标衍生活动实体y的属性标签分量一致。衍生活动实体的属性标签分量用于表示该衍生活动实体组合应衍生用户行为日志中用户行为活动的某个关键属性。
(4)获取目标衍生活动实体t在衍生用户行为日志中的第三衍生业务节点及目标衍生活动实体y在衍生用户行为日志中的第四衍生业务节点,基于第三衍生业务节点及该第四衍生业务节点,生成目标衍生活动实体t与该目标衍生活动实体y之间的目标衍生区别特征。
(5)将参考基础区别特征及目标衍生区别特征之间的联系区别特征,生成为实体区别特征。
优选地,可以获取依据用户兴趣挖掘请求相关的模拟衍生维度特征最大时对用户行为日志进行模糊衍生,获得目标用户行为日志中用户行为活动的热点行为相关的触发活动实体t和触发活动实体y之间的触发量化结果;基于参考基础区别特征、目标衍生区别特征以及触发量化结果,生成基础活动实体与衍生活动实体之间的实体区别特征。
STEP205,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。
本公开实施例中,通过确定基础活动实体与衍生活动实体之间的实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据,从而确定用户兴趣挖掘计划为有效用户兴趣挖掘计划或者无效用户兴趣挖掘计划。具体基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据的方法可以参阅相关的实施例中STEP104的描述,此处不再进行一一赘述。
STEP206,如果用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划无效结果,则生成触发的用户兴趣挖掘计划的补全指示。
本公开实施例中,通过判断实体区别特征与模拟衍生维度特征之间的比较结果是否属于存在误差许可,如果确定实体区别特征与模拟衍生维度特征之间的比较结果不属于存在误差许可,则确定用户兴趣挖掘计划的用户兴趣挖掘基础数据为用户兴趣挖掘计划无效结果。其中,补全指示包括关联度数据。
STEP207,将补全指示下发数据处理终端,以使数据处理终端依据补全指示对用户兴趣挖掘计划进行补全。
本公开实施例中,在生成补全指示之后,将补全指示下发数据处理终端,以使数据处理终端依据补全指示对用户兴趣挖掘计划进行补全。由于补全指示中包括关联度数据,则用户可以通过数据处理终端查询到该关联度数据,从而基于该关联度数据确定该关联度数据与存在误差许可之间的目标值,进而实现对用户兴趣挖掘计划的补全,以使补全后的用户兴趣挖掘计划可以实现对用户行为日志进行触发。
在本实施例中,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据,包括:基于模拟衍生维度特征确定与实体区别特征匹配的目标挖掘基础特征;获取目标挖掘基础特征所对应的数据索引信息以及每个数据索引信息所对应的引用信息;基于数据索引信息从用户兴趣挖掘请求涵盖的用户行为日志中获取基础索引基础数据,并基于引用信息,在基础索引基础数据中引用其它与用户兴趣挖掘请求对应的当前用户的目标用户在当前指定的业务推广计划的扩展行为数据,并将扩展行为数据和基础索引基础数据进行汇总以生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。
可以理解,通过与目标挖掘基础特征进行比对,从而提高了用户兴趣挖掘基础数据的精确性。
在本实施例中,基于预先训练的兴趣预测模型对用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,兴趣预测结果用于作为用户行为日志的用户兴趣数据结果的步骤,包括:基于预先训练的兴趣预测模型提取用户兴趣挖掘基础数据中与当前指定的业务推广计划相关的偏好提取特征,并基于兴趣预测模型中的分类网络层对偏好提取特征进行分类,获得每个候选用户兴趣的预测概率值;基于每个候选用户兴趣的预测概率值生成对应的目标用户兴趣热力图,并结合历史兴趣热力图与目标用户兴趣热力图进行融合,获得用户行为日志的用户兴趣数据结果。
可以理解,在执行上述内容时,基于预先训练的兴趣预测模型对用户兴趣挖掘基础数据进行精确地兴趣预测,从而能够更加准确地获得相关的兴趣预测结果。
在上述基础上,请结合参阅图2,提供了一种基于人工智能的用户兴趣数据处理装置200,应用于基于人工智能的用户兴趣数据处理系统,所述装置包括:
实体解析模块210,用于依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体;
日志获取模块220,用于依据所述用户兴趣挖掘请求对所述用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;所述用户兴趣挖掘请求具有所述模糊衍生的模拟衍生维度特征;
实体挖掘模块230,用于挖掘所述衍生用户行为日志中与所述基础活动实体相关的衍生活动实体;
结果获取模块240,用于确定所述基础活动实体与所述衍生活动实体之间的实体区别特征;基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,并基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果。
在上述基础上,请结合参阅图3,示出了一种基于人工智能的用户兴趣数据处理系统300,包括互相之间通信的处理器310和存储器320,所述处理器310用于从所述存储器320中读取计算机程序并执行,以实现上述的方法。
在上述基础上,还提供了一种计算机可读存储介质,其上存储的计算机程序在运行时实现上述的方法。
在上述基础上,还提供一种云平台,所述云平台包括存储有计算机程序的可读存储介质,所述可读存储介质运行计算机程序以执行所述的方法。
综上,基于上述方案,依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体;依据用户兴趣挖掘计划对用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;其中,用户兴趣挖掘请求具有模糊衍生的模拟衍生维度特征;挖掘所述衍生用户行为日志中与基础活动实体相关的衍生活动实体;确定基础活动实体与衍生活动实体之间的实体区别特征,基于实体区别特征及模拟衍生维度特征,生成用户兴趣挖掘计划的用户兴趣挖掘基础数据。由于用户兴趣挖掘请求具有的模拟衍生维度特征可以表示用户兴趣挖掘计划可以使用户行为日志触发的标准触发请求数目,而实体区别特征可以表征经过模糊衍生后用户行为日志的实时挖掘请求数目,通过比对用户行为日志的标准触发请求数目与实时挖掘请求数目,可以确定该用户兴趣挖掘计划的用户兴趣挖掘基础数据,并确定用户兴趣挖掘计划是否准确;针对触发前后的用户行为日志中的活动实体进行了衍生,且比对了基础活动实体与衍生活动实体之间的实体区别特征,以及实体区别特征与模拟衍生维度特征之间的关联度,进而可以提高兴趣预测结果的可信度。
应当理解,上述所示的系统及其模块可以利用各种方式来实现。例如,在一些实施例中,系统及其模块可以通过硬件、软件或者软件和硬件的结合来实现。其中,硬件部分可以利用专用逻辑来实现;软件部分则可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域技术人员可以理解上述的方法和系统可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本申请的系统及其模块不仅可以有诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用例如由各种类型的处理器所执行的软件实现,还可以由上述硬件电路和软件的结合(例如,固件)来实现。
需要说明的是,不同实施例可能产生的有益效果不同,在不同的实施例里,可能产生的有益效果可以是以上任意一种或几种的组合,也可以是其他任何可能获得的有益效果。
上文已对基本概念做了描述,显然,对于本领域技术人员来说,上述详细披露仅仅作为示例,而并不构成对本申请的限定。虽然此处并没有明确说明,本领域技术人员可能会对本申请进行各种修改、改进和修正。该类修改、改进和修正在本申请中被建议,所以该类修改、改进、修正仍属于本申请示范实施例的精神和范围。
同时,本申请使用了特定词语来描述本申请的实施例。如“一个实施例”、“一实施例”、和/或“一些实施例”意指与本申请至少一个实施例相关的某一特征、结构或特点。因此,应强调并注意的是,本说明书中在不同位置两次或多次提及的“一实施例”或“一个实施例”或“一个替代性实施例”并不一定是指同一实施例。此外,本申请的一个或多个实施例中的某些特征、结构或特点可以进行适当的组合。
此外,本领域技术人员可以理解,本申请的各方面可以通过若干具有可专利性的种类或情况进行说明和描述,包括任何新的和有用的工序、机器、产品或物质的组合,或对他们的任何新的和有用的改进。相应地,本申请的各个方面可以完全由硬件执行、可以完全由软件(包括固件、常驻软件、微码等)执行、也可以由硬件和软件组合执行。以上硬件或软件均可被称为“数据块”、“模块”、“引擎”、“单元”、“组件”或“系统”。此外,本申请的各方面可能表现为位于一个或多个计算机可读介质中的计算机产品,该产品包括计算机可读程序编码。
计算机存储介质可能包含一个内含有计算机程序编码的传播数据信号,例如在基带上或作为载波的一部分。该传播信号可能有多种表现形式,包括电磁形式、光形式等,或合适的组合形式。计算机存储介质可以是除计算机可读存储介质之外的任何计算机可读介质,该介质可以通过连接至一个指令执行系统、装置或设备以实现通讯、传播或传输供使用的程序。位于计算机存储介质上的程序编码可以通过任何合适的介质进行传播,包括无线电、电缆、光纤电缆、RF、或类似介质,或任何上述介质的组合。
本申请各部分操作所需的计算机程序编码可以用任意一种或多种程序语言编写,包括面向对象编程语言如Java、Scala、Smalltalk、Eiffel、JADE、Emerald、C++、C#、VB.NET、Python等,常规程序化编程语言如C语言、Visual Basic、Fortran 2003、Perl、COBOL 2002、PHP、ABAP,动态编程语言如Python、Ruby和Groovy,或其他编程语言等。该程序编码可以完全在用户计算机上运行、或作为独立的软件包在用户计算机上运行、或部分在用户计算机上运行部分在远程计算机运行、或完全在远程计算机或服务器上运行。在后种情况下,远程计算机可以通过任何网络形式与用户计算机连接,比如局域网(LAN)或广域网(WAN),或连接至外部计算机(例如通过因特网),或在云计算环境中,或作为服务使用如软件即服务(SaaS)。
此外,除非权利要求中明确说明,本申请所述处理元素和序列的顺序、数字字母的使用、或其他名称的使用,并非用于限定本申请流程和方法的顺序。尽管上述披露中通过各种示例讨论了一些目前认为有用的发明实施例,但应当理解的是,该类细节仅起到说明的目的,附加的权利要求并不仅限于披露的实施例,相反,权利要求旨在覆盖所有符合本申请实施例实质和范围的修正和等价组合。例如,虽然以上所描述的系统组件可以通过硬件设备实现,但是也可以只通过软件的解决方案得以实现,如在现有的服务器或移动设备上安装所描述的系统。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或多个发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。但是,这种披露方法并不意味着本申请对象所需要的特征比权利要求中提及的特征多。实际上,实施例的特征要少于上述披露的单个实施例的全部特征。
一些实施例中使用了描述成分、属性数量的数字,应当理解的是,此类用于实施例描述的数字,在一些示例中使用了修饰词“大约”、“近似”或“大体上”来修饰。除非另外说明,“大约”、“近似”或“大体上”表明所述数字允许有适应性的变化。相应地,在一些实施例中,说明书和权利要求中使用的数值参数均为近似值,该近似值根据个别实施例所需特点可以发生改变。在一些实施例中,数值参数应考虑规定的有效数位并采用一般位数保留的方法。尽管本申请一些实施例中用于确认其范围广度的数值域和参数为近似值,在具体实施例中,此类数值的设定在可行范围内尽可能精确。
针对本申请引用的每个专利、专利申请、专利申请公开物和其他材料,如文章、书籍、说明书、出版物、文档等,特此将其全部内容并入本申请作为参考。与本申请内容不一致或产生冲突的申请历史文件除外,对本申请权利要求最广范围有限制的文件(当前或之后附加于本申请中的)也除外。需要说明的是,如果本申请附属材料中的描述、定义、和/或术语的使用与本申请所述内容有不一致或冲突的地方,以本申请的描述、定义和/或术语的使用为准。
最后,应当理解的是,本申请中所述实施例仅用以说明本申请实施例的原则。其他的变形也可能属于本申请的范围。因此,作为示例而非限制,本申请实施例的替代配置可视为与本申请的教导一致。相应地,本申请的实施例不仅限于本申请明确介绍和描述的实施例。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种基于人工智能的用户兴趣数据处理方法,其特征在于,包括:
依据触发的用户兴趣挖掘计划的用户兴趣挖掘请求,解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体;
依据所述用户兴趣挖掘请求对所述用户行为日志中的用户行为活动进行模糊衍生,获得衍生用户行为日志;所述用户兴趣挖掘请求具有所述模糊衍生的模拟衍生维度特征;
挖掘所述衍生用户行为日志中与所述基础活动实体相关的衍生活动实体;
确定所述基础活动实体与所述衍生活动实体之间的实体区别特征;基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,并基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果。
2.根据权利要求2所述的方法,其特征在于,所述所述解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体,包括:依据用户行为活动解析网络对所述用户兴趣挖掘请求涵盖的用户行为日志进行解析,生成所述用户行为日志中的用户行为活动;
获取所述用户行为活动在所述用户行为日志中的活动定位轨迹,从所述活动定位轨迹关联的活动实体中确定所述用户行为活动关联的基础活动实体。
3.根据权利要求1所述的方法,其特征在于,所述解析所述用户兴趣挖掘请求涵盖的用户行为日志中的用户行为活动关联的基础活动实体,包括:
获取所述用户兴趣挖掘请求相关的用户兴趣挖掘计划表达的预设知识图谱,获取所述预设知识图谱相关的预设知识图谱数据;
在所述用户兴趣挖掘请求涵盖的用户行为日志中,将实体类别属性匹配于所述预设知识图谱数据的用户行为内容块,生成为所述用户行为日志中的用户行为活动关联的基础活动实体;具有匹配预设知识图谱的基础活动实体为基础活动实体组合。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
获取所述用户行为日志中的若干用户行为内容块的内容特征变量,依据所述若干用户行为内容块的内容特征变量,将所述若干用户行为内容块投射到预设知识空间;
依据所述若干用户行为内容块在所述预设知识空间中的内容节点,对所述若干用户行为内容块进行分簇,获得用户行为内容块簇;
基于所述预设知识空间中与所述用户行为内容块簇的联系知识实体覆盖预设知识实体范围的知识实体,生成知识实体分布网络,所述知识实体分布网络包括所述预设知识图谱数据。
5.根据权利要求1-3任意一项所述的方法,其特征在于,所述基础活动实体的量化值为若干,所述衍生活动实体的量化值为若干;
所述确定所述基础活动实体与所述衍生活动实体之间的实体区别特征,包括:
获取若干基础活动实体的各个基础活动实体分别相关的基础实体属性,获取每个基础活动实体分别相关的基础实体属性的属性标签分量,依据所述基础实体属性的属性标签分量对所述若干基础活动实体进行分团,获得w个基础活动实体组合;所述w个基础活动实体组合包括基础活动实体组合r,所述基础活动实体组合r包括第一基础活动实体及第二基础活动实体;
获取若干衍生活动实体的各个衍生活动实体分别相关的衍生过程信息,获取所述每个衍生活动实体分别相关的衍生过程信息的属性标签分量,依据所述衍生过程信息的属性标签分量对所述若干衍生活动实体进行分团,获得w个衍生活动实体组合;所述w个衍生活动实体组合包括衍生活动实体组合r,所述衍生活动实体组合r包括第一衍生活动实体及第二衍生活动实体;
获取每个基础活动实体组合中第一基础活动实体在所述用户行为日志中的第一基础业务节点,及所述第二基础活动实体在所述用户行为日志中的第二基础业务节点,基于所述第一基础业务节点及所述第二基础业务节点,生成所述基础活动实体组合r的基础区别特征;
获取每个衍生活动实体组合中第一衍生活动实体在所述衍生用户行为日志中的第一衍生业务节点,及所述第二衍生活动实体在所述衍生用户行为日志中的第二衍生业务节点,基于所述第一衍生业务节点及所述第二衍生业务节点,生成所述衍生活动实体组合r的衍生区别特征;
将所述基础活动实体组合r的基础区别特征及所述衍生活动实体组合r的衍生区别特征之间的联系区别特征,生成为第r个实体区别特征。
6.根据权利要求1-3任意一项所述的方法,其特征在于,所述基础活动实体的量化值为若干,所述衍生活动实体的量化值为若干;
所述确定所述基础活动实体与所述衍生活动实体之间的实体区别特征,包括:
获取所述用户兴趣挖掘计划相关的参考属性标签分量,获取若干基础活动实体的各个基础活动实体的属性标签分量,将所述若干基础活动实体中与所述参考属性标签分量关联的基础活动实体作为参考基础活动实体;所述参考基础活动实体包括参考基础活动实体t及参考基础活动实体y,所述参考基础活动实体t与所述参考基础活动实体y的属性标签分量一致;
获取所述参考基础活动实体t在所述用户行为日志中的第三基础业务节点及所述参考基础活动实体y在所述用户行为日志中的第四基础业务节点,基于所述第三基础业务节点及所述第四基础业务节点,生成所述参考基础活动实体t与所述参考基础活动实体y之间的参考基础区别特征;
获取若干衍生活动实体的各个衍生活动实体的属性标签分量,将所述若干衍生活动实体中与所述参考属性标签分量关联的衍生活动实体作为目标衍生活动实体;所述目标衍生活动实体包括目标衍生活动实体t及目标衍生活动实体y,所述目标衍生活动实体t与所述目标衍生活动实体y的属性标签分量一致;
获取所述目标衍生活动实体t在所述衍生用户行为日志中的第三衍生业务节点及所述目标衍生活动实体y在所述衍生用户行为日志中的第四衍生业务节点,基于所述第三衍生业务节点及所述第四衍生业务节点,生成所述目标衍生活动实体t与所述目标衍生活动实体y之间的目标衍生区别特征;将所述参考基础区别特征及所述目标衍生区别特征之间的联系区别特征,生成为所述实体区别特征。
7.根据权利要求1所述的方法,其特征在于,所述基于所述实体区别特征及所述模拟衍生维度特征,生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据,包括:
基于所述模拟衍生维度特征确定与所述实体区别特征匹配的目标挖掘基础特征;
获取所述目标挖掘基础特征所对应的数据索引信息以及每个数据索引信息所对应的引用信息;
基于所述数据索引信息从所述用户兴趣挖掘请求涵盖的用户行为日志中获取基础索引基础数据,并基于所述引用信息,在所述基础索引基础数据中引用其它与所述用户兴趣挖掘请求对应的当前用户的目标用户在当前指定的业务推广计划的扩展行为数据,并将所述扩展行为数据和所述基础索引基础数据进行汇总以生成所述用户兴趣挖掘计划的用户兴趣挖掘基础数据。
8.根据权利要求1所述的方法,其特征在于,所述基于预先训练的兴趣预测模型对所述用户兴趣挖掘基础数据进行兴趣预测,获得相关的兴趣预测结果,所述兴趣预测结果用于作为所述用户行为日志的用户兴趣数据结果的步骤,包括:
基于预先训练的兴趣预测模型提取所述用户兴趣挖掘基础数据中与当前指定的业务推广计划相关的偏好提取特征,并基于所述兴趣预测模型中的分类网络层对所述偏好提取特征进行分类,获得每个候选用户兴趣的预测概率值;
基于所述每个候选用户兴趣的预测概率值生成对应的目标用户兴趣热力图,并结合历史兴趣热力图与所述目标用户兴趣热力图进行融合,获得所述用户行为日志的用户兴趣数据结果。
9.一种基于人工智能的用户兴趣数据处理系统,其特征在于,包括互相之间通信的处理器和存储器,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
10.一种云平台,其特征在于,所述云平台包括存储有计算机程序的可读存储介质,所述可读存储介质运行计算机程序以执行权利要求1中所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210309048.5A CN114661994B (zh) | 2022-03-28 | 2022-03-28 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210309048.5A CN114661994B (zh) | 2022-03-28 | 2022-03-28 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114661994A true CN114661994A (zh) | 2022-06-24 |
CN114661994B CN114661994B (zh) | 2022-10-14 |
Family
ID=82034008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210309048.5A Active CN114661994B (zh) | 2022-03-28 | 2022-03-28 | 基于人工智能的用户兴趣数据处理方法、系统及云平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114661994B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455300A (zh) * | 2022-09-29 | 2022-12-09 | 吴敬晗 | 基于人工智能的数据推送方法、系统及云平台 |
CN115510984A (zh) * | 2022-09-29 | 2022-12-23 | 刘家杰 | 支付平台的防侵入方法、系统及云平台 |
CN118280590A (zh) * | 2024-05-13 | 2024-07-02 | 深圳市复米健康科技有限公司 | 应用人工智能的智能康复日志文本处理方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140257795A1 (en) * | 2013-03-06 | 2014-09-11 | Northwestern University | Linguistic Expression of Preferences in Social Media for Prediction and Recommendation |
US20170109412A1 (en) * | 2015-10-14 | 2017-04-20 | Linkedin Corporation | System for facet expansion |
CN112232889A (zh) * | 2020-11-06 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 一种用户兴趣画像扩展方法、装置、设备及存储介质 |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN113392330A (zh) * | 2021-08-17 | 2021-09-14 | 湖南轻悦健康管理有限公司 | 一种基于互联网行为的大数据处理方法及系统 |
CN113487389A (zh) * | 2021-07-27 | 2021-10-08 | 中国银行股份有限公司 | 一种信息推荐方法及装置 |
CN113626719A (zh) * | 2021-10-12 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及计算机程序产品 |
WO2022041982A1 (zh) * | 2020-08-28 | 2022-03-03 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN114238365A (zh) * | 2021-11-12 | 2022-03-25 | 广西南宁瀚铭教育投资有限公司 | 一种基于智慧教育的服务数据管理方法及系统 |
-
2022
- 2022-03-28 CN CN202210309048.5A patent/CN114661994B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140257795A1 (en) * | 2013-03-06 | 2014-09-11 | Northwestern University | Linguistic Expression of Preferences in Social Media for Prediction and Recommendation |
US20170109412A1 (en) * | 2015-10-14 | 2017-04-20 | Linkedin Corporation | System for facet expansion |
WO2022041982A1 (zh) * | 2020-08-28 | 2022-03-03 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN112232889A (zh) * | 2020-11-06 | 2021-01-15 | 腾讯科技(深圳)有限公司 | 一种用户兴趣画像扩展方法、装置、设备及存储介质 |
CN112991017A (zh) * | 2021-03-26 | 2021-06-18 | 刘秀萍 | 基于用户评论解析的标签体系精准推荐方法 |
CN113487389A (zh) * | 2021-07-27 | 2021-10-08 | 中国银行股份有限公司 | 一种信息推荐方法及装置 |
CN113392330A (zh) * | 2021-08-17 | 2021-09-14 | 湖南轻悦健康管理有限公司 | 一种基于互联网行为的大数据处理方法及系统 |
CN113626719A (zh) * | 2021-10-12 | 2021-11-09 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及计算机程序产品 |
CN114238365A (zh) * | 2021-11-12 | 2022-03-25 | 广西南宁瀚铭教育投资有限公司 | 一种基于智慧教育的服务数据管理方法及系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115455300A (zh) * | 2022-09-29 | 2022-12-09 | 吴敬晗 | 基于人工智能的数据推送方法、系统及云平台 |
CN115510984A (zh) * | 2022-09-29 | 2022-12-23 | 刘家杰 | 支付平台的防侵入方法、系统及云平台 |
CN115455300B (zh) * | 2022-09-29 | 2023-04-14 | 临沂沂川网络科技有限公司 | 基于人工智能的数据推送方法、系统及云平台 |
CN115510984B (zh) * | 2022-09-29 | 2024-01-02 | 广州合利宝支付科技有限公司 | 支付平台的防侵入方法、系统及云平台 |
CN118280590A (zh) * | 2024-05-13 | 2024-07-02 | 深圳市复米健康科技有限公司 | 应用人工智能的智能康复日志文本处理方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN114661994B (zh) | 2022-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114661994B (zh) | 基于人工智能的用户兴趣数据处理方法、系统及云平台 | |
US10860312B1 (en) | Defect ownership assignment system and predictive analysis for codebases | |
US8166000B2 (en) | Using a data mining algorithm to generate format rules used to validate data sets | |
CN111143226B (zh) | 自动化测试方法及装置、计算机可读存储介质、电子设备 | |
US11481707B2 (en) | Risk prediction system and operation method thereof | |
CN114168747A (zh) | 基于云服务的知识库构建方法及系统 | |
CN117632905B (zh) | 基于云端使用记录的数据库管理方法及系统 | |
CN113313464A (zh) | 结合人工智能的云办公大数据处理方法及云办公服务器 | |
CN113378554A (zh) | 一种医疗信息智能交互的方法及系统 | |
CN113239229A (zh) | 一种智能筛选数据处理方法、系统及云平台 | |
CN112308627A (zh) | 基于区块链和人工智能的广告数据接入方法及大数据中心 | |
CN111949514A (zh) | 一种模型预测方法、装置及存储介质 | |
CN114218034A (zh) | 在大数据场景下的在线办公安防处理方法及大数据服务器 | |
WO2022165152A1 (en) | Constructing a statistical model and evaluating model performance | |
US11651281B2 (en) | Feature catalog enhancement through automated feature correlation | |
CN113468017A (zh) | 应用于区块链的在线业务状态检测方法及业务服务器 | |
CN116883181B (zh) | 基于用户画像的金融服务推送方法、存储介质及服务器 | |
CN113313463A (zh) | 应用于大数据云办公的数据分析方法及数据分析服务器 | |
CN113472860A (zh) | 大数据和数字化环境下的业务资源分配方法及服务器 | |
US10514908B2 (en) | Program analysis device for classifying programs into program groups based on call relationship between programs, program analysis method for classifying programs into program groups based on call relationship between programs, and recording medium storing analysis program for classifying programs into program groups based on a call relationship between programs | |
CN114329116B (zh) | 基于人工智能的智慧园区资源匹配度分析方法及系统 | |
CN114238365B (zh) | 一种基于智慧教育的服务数据管理方法及系统 | |
CN115187191A (zh) | 一种基于教学集控管理的科研项目进度监控方法及系统 | |
US11520831B2 (en) | Accuracy metric for regular expression | |
CN114462417A (zh) | 一种应用于大数据的评论文本处理方法及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20220914 Address after: Room 501, No. 1, Floor 1-5, Building 3-13, Phase III, Optics Valley Core Center, No. 303, Optics Valley Avenue, Fozuling Street, Donghu New Technology Development Zone, Wuhan City, Hubei Province 430000 Applicant after: ChinaSoft digital intelligence information technology (Wuhan) Co.,Ltd. Address before: No. 7, shuyingpan Town, Luquan Yi and Miao Autonomous County, Kunming, Yunnan 650000 Applicant before: Xu Yong |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |