CN117807128A - 基于设备端多维数据融合的用户行为分析方法及系统 - Google Patents
基于设备端多维数据融合的用户行为分析方法及系统 Download PDFInfo
- Publication number
- CN117807128A CN117807128A CN202311675451.0A CN202311675451A CN117807128A CN 117807128 A CN117807128 A CN 117807128A CN 202311675451 A CN202311675451 A CN 202311675451A CN 117807128 A CN117807128 A CN 117807128A
- Authority
- CN
- China
- Prior art keywords
- behavior
- samples
- behavior samples
- key
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 62
- 230000004927 fusion Effects 0.000 title claims abstract description 51
- 238000013508 migration Methods 0.000 claims abstract description 32
- 230000005012 migration Effects 0.000 claims abstract description 32
- 238000004140 cleaning Methods 0.000 claims abstract description 10
- 238000005065 mining Methods 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 32
- 230000001174 ascending effect Effects 0.000 claims description 19
- 238000012545 processing Methods 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 10
- 238000009412 basement excavation Methods 0.000 claims description 8
- 230000001419 dependent effect Effects 0.000 claims description 7
- 230000008859 change Effects 0.000 abstract description 18
- 238000007405 data analysis Methods 0.000 abstract description 4
- 230000007246 mechanism Effects 0.000 abstract description 4
- 230000006399 behavior Effects 0.000 description 629
- 239000000523 sample Substances 0.000 description 123
- 230000003542 behavioural effect Effects 0.000 description 33
- 238000004422 calculation algorithm Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 14
- 230000001965 increasing effect Effects 0.000 description 13
- 230000000694 effects Effects 0.000 description 10
- 230000002596 correlated effect Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 230000002708 enhancing effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 230000002159 abnormal effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 238000010921 in-depth analysis Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001737 promoting effect Effects 0.000 description 2
- 239000013074 reference sample Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000012731 temporal analysis Methods 0.000 description 2
- 238000000700 time series analysis Methods 0.000 description 2
- 230000002730 additional effect Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000010420 art technique Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000013178 mathematical model Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000013179 statistical model Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
- 230000003442 weekly effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2465—Query processing support for facilitating data mining operations in structured databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2216/00—Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
- G06F2216/03—Data mining
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请实施例提供一种基于设备端多维数据融合的用户行为分析方法及系统,结合上下文特征数据和有向知识网络,对用户行为模式的关键属性进行了深入分析,从而为关键行为样本提供了更加丰富和精确的特征描述。通过设置门限值并清洗那些与基准行为样本差异显著的样本,减少了噪声和不一致数据对于特征参数估计的负面影响,从而提高了数据分析的质量。利用迁移状态趋势值,能够灵活地追踪和预测用户行为随时间和其它预设因素的变化,从而可以及时更新以反映最新的用户行为动态,在此基础上设计了特征参数的更新机制,能够在保持稳定性的同时快速适应行为模式的变化,使得构建的用户行为知识模型进行个性化推荐时显示出更好的泛化能力和更低的误差率。
Description
技术领域
本发明涉及数字化数据挖掘技术领域,具体而言,涉及一种基于设备端多维数据融合的用户行为分析方法及系统。
背景技术
在现代的信息技术时代,用户通过各种电子设备产生的数据量呈爆炸性增长。特别是对于在线平台和服务提供商来说,能够准确理解和预测用户行为对于提高用户满意度、增加用户黏性以及推动个性化服务的发展至关重要。传统的用户行为分析方法通常仅依赖简单的统计分析或浅层次的数据挖掘技术,这些方法往往不能全面捕捉到用户行为的复杂性和动态变化,从而影响了推荐系统的精准度和个性化程度。
目前存在的技术挑战包括如何有效处理和分析大规模的多维融合数据,如何从中提取有价值的行为特征,以及如何建立起能够反映实际用户行为趋势的知识模型。更具体地说,现有技术在进行用户行为分析时,可能没有有效地清洗和过滤掉噪声数据和异常值,导致最终分析结果的不准确。并且,用户行为是随时间和外界因素动态变化的,但传统模型往往忽视了这种动态性,无法适应用户行为的快速变化。由于上述问题的存在,现有的用户行为知识模型难以为用户提供真正个性化的内容推荐,无法满足不同用户的独特需求。
发明内容
为了至少克服现有技术中的上述不足,本申请实施例的目的在于提供一种基于设备端多维数据融合的用户行为分析方法及系统,通过先进的数据处理和分析方法,利用多维数据构建有向知识网络,通过精准的特征提取和参数更新机制,以及动态迁移状态分析,生成一个能够持续学习和适应用户行为变化的目标用户行为知识模型,可以提高个性化推荐的效果。
依据本申请实施例的一个方面,提供了一种基于设备端多维数据融合的用户行为分析方法,包括:
对用户行为知识模型的设备端多维融合数据进行特征提取,生成所述用户行为知识模型中的关键行为样本的上下文特征数据的有向知识网络数据;
从所述用户行为知识模型中的X个先验挖掘行为样本中提取Y个先验挖掘行为样本作为所述关键行为样本的Y个参考行为样本,并依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,X≥Y≥1,Y≥m≥1;
清洗所述m个相关行为样本中的与基准行为样本的特征挖掘参数的偏离度不低于设定门限值的相关行为样本,并基于所述m个相关行为样本中余下相关行为样本的特征挖掘参数,确定所述关键行为样本的特征参数的估计信息;所述基准行为样本为所述m个相关行为样本中的行为样本;
对所述设备端多维融合数据进行迁移状态分析,生成反映用户行为随预设因素发生变化趋势的迁移状态趋势值,并基于所述关键行为样本的特征参数的估计信息和所述迁移状态趋势值,生成所述关键行为样本的特征参数的更新参数值;
基于所述关键行为样本的特征参数的目标更新参数值,生成目标用户行为知识模型,并基于所述目标用户行为知识模型进行个性化推荐。
在第一方面的一种可能的实施方式中,X>Y,所述从所述用户行为知识模型中的X个先验挖掘行为样本中提取Y个先验挖掘行为样本作为所述关键行为样本的Y个参考行为样本,包括:
依据所述X个先验挖掘行为样本的第一排列节点,从所述X个先验挖掘行为样本中提取所述Y个先验挖掘行为样本,所述第一排列节点为依据升序或者降序对所述X个先验挖掘行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点,或所述第一排列节点为所述X个先验挖掘行为样本和所述关键行为样本的挖掘排列节点;
将所述Y个先验挖掘行为样本,输出为所述Y个参考行为样本。
在第一方面的一种可能的实施方式中,所述依据所述X个先验挖掘行为样本的第一排列节点,从所述X个先验挖掘行为样本中提取所述Y个先验挖掘行为样本,包括:
基于所述第一排列节点,将所述关键行为样本前向排列的且与所述关键行为样本存在关联的Y个行为样本,输出为所述Y个先验挖掘行为样本;
或者,基于所述第一排列节点,将所述关键行为样本前向排列的且满足非中断状态的Y个行为样本,输出为所述Y个先验挖掘行为样本,其中,所述满足非中断状态的Y个行为样本与所述关键行为样本最少分隔一个先验挖掘行为样本。
在第一方面的一种可能的实施方式中,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本和所述关键行为样本之间的有向关系链路信息;
依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本。
在第一方面的一种可能的实施方式中,所述有向关系链路信息通过知识图谱表示;所述依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本,包括:
依据所述知识图谱,确定所述关键行为样本的m个直接依赖行为样本,将所述m个直接依赖行为样本,输出为所述m个相关行为样本;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i不低于m,则将所述i个参考行为样本输出为所述m个相关行为样本,以及如果i不低于m,则在所述i个参考行为样本中提取m个参考行为样本作为所述m个相关行为样本;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点,依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本,所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点;或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
在第一方面的一种可能的实施方式中,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值;
依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
在第一方面的一种可能的实施方式中,所述依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,包括:
将所述Y个参考行为样本中的与所述关键行为样本的代价值低于第一设定代价值的行为样本,输出为所述m个相关行为样本;
或者,将所述Y个参考行为样本中的与所述关键行为样本的代价值为第二设定代价值的行为样本,输出为m个相关行为样本。
在第一方面的一种可能的实施方式中,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点;
依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本;
所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点;或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
在第一方面的一种可能的实施方式中,所述基于所述m个相关行为样本中余下相关行为样本的特征挖掘参数,确定所述关键行为样本的特征参数的估计信息,包括:
以所述余下相关行为样本中的一个相关行为样本与所述关键行为样本的代价值的反比数作为所述一个相关行为样本的影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息;
或者,针对所述余下相关行为样本中的不同相关行为样本设定相同或不同的初始影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和初始影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息,其中所述m个相关行为样本中的一个相关行为样本的初始影响因子与所述一个相关行为样本与所述关键行为样本的代价值成反比例关系,所述设备端多维融合数据包括所述余下相关行为样本中的每一个相关行为样本的初始影响因子;或者,将所述余下相关行为样本中与所述关键行为样本的代价值最近的相关行为样本的特征挖掘参数,输出为所述关键行为样本的特征参数的估计信息。
依据本申请实施例的一个方面,提供了一种用户行为分析系统,所述用户行为分析系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现前述任意一种可能的实施方式中的基于设备端多维数据融合的用户行为分析方法。
依据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述三方面的各种可选实现方式中提供的方法。
在本申请的一些实施例所提供的技术方案中,通过对设备端多维融合数据进行精细化特征提取和有向知识网络数据的生成,显著提升了关键行为样本特征参数估计的准确性。特别地,通过清洗偏离度较大的相关行为样本,有效降低了噪声和异常数据的影响。此外,采用迁移状态分析方法能够动态捕捉用户行为随预设因素变化的趋势,并将这些趋势整合到特征参数更新过程中,增强了用户行为知识模型的适应性和时效性,也即,本申请结合上下文特征数据和有向知识网络,对用户行为模式的关键属性进行了深入分析,从而为关键行为样本提供了更加丰富和精确的特征描述。通过设置门限值并清洗那些与基准行为样本差异显著的样本,减少了噪声和不一致数据对于特征参数估计的负面影响,从而提高了数据分析的质量。利用迁移状态趋势值,能够灵活地追踪和预测用户行为随时间和其它预设因素的变化,从而可以及时更新以反映最新的用户行为动态。依据估计信息和迁移状态趋势值,设计了特征参数的更新机制,能够在保持稳定性的同时快速适应行为模式的变化,以使得构建的用户行为知识模型进行个性化推荐时显示出更好的泛化能力和更低的误差率。由此,改善了用户行为分析的深度和广度,为后续的个性化推荐和决策支持提供了可靠的科学基础。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要启用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的基础上,还可以结合这些附图提取其它相关的附图。
图1为本申请实施例提供的基于设备端多维数据融合的用户行为分析方法的流程示意图;
图2为本申请实施例提供的用于实现上述的基于设备端多维数据融合的用户行为分析方法的用户行为分析系统的结构示意框图。
具体实施方式
以下描述是为了使本领域的普通技术人员能够实施和结合本申请,并且该描述是在特定的应用场景及其要求的环境下提供的。对于本领域的普通技术人员来讲,显然可以对所公开的实施例作出各种改变,并且在不偏离本申请的原则和范围时,本申请中所定义的普遍原则可以适用于其它实施例和应用场景。因此,本申请并不限于所描述的实施例,而应该被给予与权利要求一致的最广泛的范围。
图1是本申请一种实施例提供的基于设备端多维数据融合的用户行为分析方法的流程示意图,下面对该基于设备端多维数据融合的用户行为分析方法进行详细介绍。
步骤S110,对用户行为知识模型的设备端多维融合数据进行特征提取,生成所述用户行为知识模型中的关键行为样本的上下文特征数据的有向知识网络数据。
本实施例中,设备端多维融合数据可以是用户在多个设备端的多维用户会话数据,可以考虑一个在线视频流平台的场景,在线视频流平台希望通过分析用户的观看行为来优化推荐算法和提升用户体验。在这个在线视频流平台上,用户的各种互动(比如播放、暂停、搜索、评分等)都被记录,并与时间戳、设备类型、地理位置等信息一起构成多维会话数据。
本步骤中,当用户在这个在线视频流平台上浏览并观看视频时,可以收集到包括视频ID、观看时长、用户的点击路径、观看顺序、暂停次数等在内的数据作为设备端多维融合数据。在此基础上,对这些多维会话数据进行特征提取,比如计算用户观看某类型视频的平均时长或跳过开头的频率,并以此建立一个描述用户观看行为模式的有向知识网络。这个有向知识网络能够显示不同视频内容之间的关联性,例如发现喜剧片观众倾向于连续观看相似题材的视频。
更详细地,可以想象用户在该在线视频流平台上的一系列行为:观看视频、搜索内容、添加到播放列表、评分和评论等。这些行为会在不同时间点发生,并且伴随着用户的设备信息、位置数据、观看时长等多维数据。下面将通过一个具体例子来解释如何对用户行为知识模型进行特征提取,并生成有向知识网络数据。
假设用户A经常在周末的晚上使用视频流平台观看连续剧。记录了以下几个阶段性行为事件:
1.登录:用户A打开应用并登录账户。
2.搜索:用户A搜索“科幻连续剧”。
3.浏览:用户A浏览搜索结果,花费时间比较各个选项。
4.观看:用户A选择一部科幻连续剧并开始观看。
5.暂停/恢复:在观看过程中,用户A多次暂停再恢复观看。
6.评分/评论:观看结束后,用户A给连续剧打分并留下评论。
那么,可以从这些阶段性行为事件中提取特征。例如,可能会关注:户A的观看习惯(例如,观看时间、频率)、哪些类型的视频被观看和搜索得最多、观看会话的平均时长、互动行为的模式,如评分和评论的频率、暂停和恢复行为的频率和时机等。
接着,可以利用这些特征来构建一个有向知识网络。这个有向知识网络将展示不同特征之间的联系,例如:搜索“科幻连续剧”通常导致观看某些特定的连续剧、在特定的时间点(如周末晚上)登录可能意味着用户更倾向于长时间观看、暂停视频之后通常会在短时间内恢复观看、观看结束后进行评分或评论的概率等。
例如,基于上述分析,可能发现用户A每当搜索“科幻连续剧”后,80%的情况下会选择观看“太空探险者”系列。同时,如果用户在观看过程中暂停超过三次,那么在观看完毕后给出的评分通常低于平均水平。
因此,在有向知识网络中,“搜索->观看特定连续剧”和“暂停次数->评分水平”成为两个关键的有向边。这样的有向知识网络帮助平台理解用户行为的模式,并预测未来的行为,比如可以根据用户A的历史搜索和观看习惯,优先推荐新上线的科幻连续剧。
总结来说,特征提取和有向知识网络的生成让视频流平台能够更好地理解用户行为的上下文,从而为用户提供更加个性化的内容推荐,增强用户满意度和平台的用户粘性。
步骤S120,从所述用户行为知识模型中的X个先验挖掘行为样本中提取Y个先验挖掘行为样本作为所述关键行为样本的Y个参考行为样本,并依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,X≥Y≥1,Y≥m≥1。
例如,从所有用户的观看行为事件中,可能已经挖掘出X个代表用户典型观看路径的行为样本,也即先验挖掘行为样本。接着,可以从中选择Y个最能反映用户关键行为(比如导致高用户留存的行为)的行为样本作为参考点。基于关键行为样本的有向知识网络数据,从这Y个行为样本中筛选出m个与关键行为最相关的行为样本,例如那些在推荐系统变动前后用户行为改变不大的样本。
示例性的,假设先验挖掘行为样本都包含了用户与视频内容交互的一系列事件,例如搜索、点击、观看、暂停、评价等。因此,可以运用机器学习算法对先验挖掘行为样本进行分析,以识别出导致用户增加订阅时长或提升观看频率的行为模式。例如,可以筛选出1000个这样的行为样本(X=1000),这些样本可能反映了不同的用户行为特征,比如哪些特定类型的视频更容易吸引用户连续观看整个系列。
那么,在这1000个先验挖掘的行为样本中,可以进一步分析找到200个最具代表性的样本(Y=200),这些样本展示了一种普遍且对平台战略有重要影响的行为趋势。例如,可能发现这200个样本中的用户在周末期间开始观看某部新剧集,并在48小时内完成了至少80%的剧集。这些行为样本被认为是关键行为样本的参考行为样本。
接下来,基于这200个关键行为样本的上下文特征数据,使用有向知识网络来进一步提炼信息。有向知识网络可能揭示了用户从开始观看新剧集到成为忠实观众的转化路径。利用这个有向知识网络,可以从200个参考样本中筛选出50个行为样本(m=50),这些样本在特征上与关键行为样本高度一致,例如用户在晚上观看时间较长、经常在观看后进行评价或推荐给朋友。
具体实例:
X个先验挖掘行为样本:在所有用户的数据中,筛选出1000个在周末登录并至少观看两部电影的用户行为样本。
Y个参考行为样本:进一步识别其中200个在一个月内每周末都有类似观看模式,且至少推荐一次内容给其它用户的样本。
m个相关行为样本:根据有向知识网络的分析,从这200个样本中提取50个样本,这些样本展示了用户在观看完推荐内容后给出评分,并在接下来的周末观看了该内容推荐者的其它推荐视频。
通过以上步骤,可以深入理解用户的观看行为和偏好,进而调整推荐算法,以增强用户的参与度和满意度。
步骤S130,清洗所述m个相关行为样本中的与基准行为样本的特征挖掘参数的偏离度不低于设定门限值的相关行为样本,并基于所述m个相关行为样本中余下相关行为样本的特征挖掘参数,确定所述关键行为样本的特征参数的估计信息。所述基准行为样本为所述m个相关行为样本中的行为样本。
例如,对于这m个相关行为样本,可以检查它们与某个基准行为样本(例如观看完整视频而没有快进的用户行为)之间的特征挖掘参数的偏离度。如果某个相关行为样本的偏离度超过了设定的门限值(如观看时长远低于平均水平),则认为这个相关行为样本不具代表性,将其排除。余下的相关行为样本用于估计关键行为样本的特征参数,如观看特定类型视频的偏好强度。
以在线视频流平台为背景,进行数据清洗和特征参数估计的步骤可以这样理解:
在之前的分析中,从用户会话数据中提取了m个相关行为样本,这些样本与关键行为模式高度一致。然而,并不是所有这些样本都是完美无瑕的;一些可能由于数据收集错误、用户非典型行为或其它噪音因素而偏离正常范围。在建立精准模型之前,需要清洗这些异常样本。
例如,假设有50个被认为与关键行为模式一致的用户样本。关键行为模式是指用户在晚上时间段开始观看新上线连续剧,并且在接下来48小时内至少完成了半数集数的观看。现在,需要确定哪些样本真实反映了这一模式,哪些则可能由于某些异常情况而不应纳入后续分析。
由此,可能会设置一些门限值来定义正常行为范围,比如:用户每个会话至少观看15分钟、每个会话间隔不超过24小时、用户没有在短时间内跳过大量内容。
如果一个样本显示用户在10分钟内频繁地切换连续剧,这可能表明用户在寻找感兴趣的内容,而不是真正在观看。这种样本的行为特征与基准样本(比如那些符合关键行为模式并持续观看的用户)相差甚远,因此可能会被排除。
清洗后的样本将用于估计关键行为样本的特征参数。特征参数可能包括观看时间、用户活跃时间段、观看频率等。
一种示例中,设想经过清洗后,剩下40个符合标准的样本。这些样本的共同特点可能是:平均每次观看时长为40分钟、主要活跃时间是晚上8点到午夜12点、在48小时内平均完成了75%的连续剧集数。
这些特征参数的估计信息就构成了对关键行为模式的描述。通过对这些特征参数的深入分析,可以更好地理解用户的观看习惯,并据此调整推荐系统,例如,在用户最活跃的时间段推送最新连续剧的通知,或者优化播放器功能,使得用户在晚上的观看体验更加顺畅。
总结来说,通过对m个相关行为样本进行清洗,移除偏离度过高的样本,再基于余下样本的特征参数,可以有效地估计出代表关键用户行为的特征,进而提供更加个性化的服务。
步骤S140,对所述设备端多维融合数据进行迁移状态分析,生成反映用户行为随预设因素发生变化趋势的迁移状态趋势值,并基于所述关键行为样本的特征参数的估计信息和所述迁移状态趋势值,生成所述关键行为样本的特征参数的更新参数值。
例如,回到在线视频流平台的场景,设备端多维融合数据可能包括用户的观看历史、搜索记录、设备类型、操作系统、网络质量、观看时段等信息。
接下来,可以对所述设备端多维融合数据进行迁移状态分析,寻找用户行为随时间或其它外部条件变化的模式。例如,可能注意到新剧集发布后的头几天内用户的观看时长有显著增加。迁移状态就是用户行为从一种模式转变为另一种模式的过程,比如从偶尔观看转为频繁观看。通过统计分析方法,可以将这些变化定量化为趋势值,反映出在某预设因素下(如节假日、推广活动等)用户行为的变化趋势。
迁移状态趋势值可能表示用户行为随特定事件发生的增减,如在周末观看视频的平均时长比工作日增加20%。这个迁移状态趋势值反映了用户行为在某个或某组预设因素影响下的变化方向和幅度。
示例性的,要对设备端收集的多维融合数据进行迁移状态分析。这意味着需要从不同时间点收集的用户行为数据中分析和识别出行为随预设因素(如时间、推荐内容、用户反馈等)发生的变化趋势。生成迁移状态趋势值的过程可以通过统计模型、机器学习方法或其它数据分析技术来完成。以下是一个具体的例子和可能的计算方法。
假设关注以下几个因素:
1.时间:用户观看行为在一天中不同时间段的变化。
2.推荐内容:用户接受了哪些推荐内容,并据此选择了何种类型的电影进行观看。
3.用户反馈:用户对观看内容的评分和评论。
那么,首先需要收集一段时间内用户的观看记录、接收到的推荐内容以及给出的评分和评论,这些数据应包含多个维度,如用户ID、电影ID、观看时间、推荐类型、评分和评论等。
首先,定义什么构成一个迁移状态。在这个例子中,迁移状态可能指用户从观看一种类型的电影转向观看另一种类型的电影。
接下来,需要量化用户行为的趋势变化。假设使用“推荐接受率”作为衡量标准,其中“推荐接受率”是用户实际观看了推荐内容与总推荐次数的比值。
推荐接受率\(R_{accept}\)的计算公式可以是:
\[R_{accept}=\frac{N_{watched}}{N_{recommended}}\]
其中\(N_{watched}\)是用户实际观看的推荐电影数量,\(N_{recommended}\)是用户接收到的推荐电影总数。
然后,分析推荐接受率随时间的变化趋势。例如,可以计算每周的推荐接受率并分析其变化。
假设有以下序列代表连续几周的推荐接受率:\(R_{accept_1},R_{accept_2},...,R_{accept_n}\)
变化趋势值\(T\)可以使用简单的线性回归模型来估计,即拟合这个序列随时间的线性变化。线性回归方程可以表示为:
\[R_{accept}=\beta_0+\beta_1\cdot t+\epsilon\]
其中\(t\)代表时间(如周数),\(\beta_0\)是截距项,\(\beta_1\)是斜率(即趋势),\(\epsilon\)是误差项。
最后,迁移状态趋势值\(T\)就是线性回归中的斜率\(\beta_1\),它表示了推荐接受率随时间的变化速率。
如果\(\beta_1\)显著大于0,则表示推荐接受率呈上升趋势;如果\(\beta_1\)显著小于0,则表示推荐接受率呈下降趋势。
由此,在前面的步骤中,已经基于用户的行为事件提取了关键行为样本,并识别出其特征参数,如观看习惯、喜好的视频类型等。特征参数的估计信息就是对这些关键行为样本特征的一个量化描述。结合迁移状态趋势值和特征参数的估计信息,可以重新评估和调整关键行为样本的特征参数。例如,如果趋势值显示用户晚上观看视频的时间在增长,那么相关特征参数可能需要增大以反映这一变化,更新后的参数值不再是简单的历史均值,而是考虑了最新趋势的结果。
例如,在前述例子中,已经根据相关行为样本得到了关键行为样本的特征参数的估计信息。下一步是利用这些估计信息以及迁移状态趋势值来更新关键行为样本的特征参数。由于迁移状态趋势值代表用户行为随时间的变化趋势。例如,随着新剧集发布,用户可能更频繁地访问平台,或者在周末观看视频的时长增加。那么,可以将使用已有的特征参数估计信息,并结合迁移状态趋势值,来生成特征参数的更新参数值。这意味着,如果趋势显示用户在周末的观看时长增加,那么“观看时长”这一特征参数的更新值应当反映出这一增长。这一过程通常会涉及数学模型和算法,如机器学习模型或时间序列分析。可以根据趋势数据调整参数值,确保推荐系统能够适应用户行为的演变。更新后的特征参数值可用于优化推荐算法,为用户提供更加个性化的内容推荐。例如,如果发现用户开始对某类型的内容显示出更多兴趣,可以相应地提升这类内容在推荐列表中的权重。
通过这种方式,不仅考虑了用户的当前行为模式,而且还预测并适应了行为的未来变化。因此,当用户的兴趣或习惯出现变化时,推荐系统能够迅速响应并提供相应的内容,从而提高用户满意度并促进用户参与度。
在上述步骤中,重点是通过分析设备端的多维数据来理解用户行为的变化趋势,并据此更新关于用户行为的关键指标,以便更精确地把握用户的当前行为和潜在需求。这一过程关注于如何通过分析数据趋势来优化现有的特征参数。这些参数之后可以用于各种业务决策,比如内容推荐、广告投放等,以提升用户体验和业务成效。
步骤S150,基于所述关键行为样本的特征参数的目标更新参数值,生成目标用户行为知识模型,并基于所述目标用户行为知识模型进行个性化推荐。
例如,通过以上步骤调整和优化后,特征参数将被用来生成新的用户行为知识模型,这个用户行为知识模型可以预测用户可能感兴趣的视频内容。这些信息随后用于优化推荐算法,比如向特定用户群体推荐它们可能喜欢的新电视剧,或者在它们最活跃的时间段内推送相关视频,从而增强用户粘性和提升平台的观看时长。
示例性的,假设在线视频流平台的目标是增加用户观看时长。在线视频流平台收集了包括用户观看历史、搜索习惯、设备信息等多维融合数据。在分析这些数据时,在线视频流平台注意到一些关键行为样本,即代表性的用户观看模式,例如:用户在工作日午夜时段倾向于观看短视频、在周末,用户喜欢看连续剧,尤其是推出新剧集的时候、一部分用户会在早晨锻炼时观看健身相关视频内容。
根据这些关键行为样本,可以提取特征参数,如“观看时段”、“视频类型”和“活跃天数”。然后,通过对这些特征参数进行迁移状态分析,发现了一些变化趋势,例如用户在节假日更倾向于观看电影而不是短视频。
接着,设定目标更新参数值,意图使用户行为知识模型更好地预测和推动用户观看时长的增加。基于之前分析得出的迁移状态趋势值,用户行为知识模型可能会被调整为:
工作日午夜时段提升短视频内容的推荐权重。
周末和新剧集推出时增强连续剧的推荐频率。
早晨时段针对健身爱好者用户群体优先推送健身视频内容。
最后,将这些更新的参数值应用到现有的用户行为知识模型中,生成目标用户行为知识模型。这个新用户行为知识模型将能更精准地预测用户的行为,并提供个性化推荐,从而有可能实现增加用户观看时长的目标。
总结来说,这个过程涉及从多维数据中洞察用户行为,定义更新模型的目标参数值,并据此更新用户行为知识模型,以便更好地服务于业务目标,如增加用户观看时长、提高用户满意度或促进内容消费。
总结来说,在这个在线视频流平台的场景中,通过多维用户会话数据的分析和处理,可以更深入地理解用户行为,从而提供更加个性化和精准的内容推荐。
基于以上步骤,通过对设备端多维融合数据进行精细化特征提取和有向知识网络数据的生成,显著提升了关键行为样本特征参数估计的准确性。特别地,通过清洗偏离度较大的相关行为样本,有效降低了噪声和异常数据的影响。此外,采用迁移状态分析方法能够动态捕捉用户行为随预设因素变化的趋势,并将这些趋势整合到特征参数更新过程中,增强了用户行为知识模型的适应性和时效性,也即,本申请结合上下文特征数据和有向知识网络,对用户行为模式的关键属性进行了深入分析,从而为关键行为样本提供了更加丰富和精确的特征描述。通过设置门限值并清洗那些与基准行为样本差异显著的样本,减少了噪声和不一致数据对于特征参数估计的负面影响,从而提高了数据分析的质量。利用迁移状态趋势值,能够灵活地追踪和预测用户行为随时间和其它预设因素的变化,从而可以及时更新以反映最新的用户行为动态。依据估计信息和迁移状态趋势值,设计了特征参数的更新机制,能够在保持稳定性的同时快速适应行为模式的变化,以使得构建的用户行为知识模型进行个性化推荐时显示出更好的泛化能力和更低的误差率。由此,改善了用户行为分析的深度和广度,为后续的个性化推荐和决策支持提供了可靠的科学基础。
在一种可能的实施方式中,X>Y,步骤S120可以包括:
步骤S121,依据所述X个先验挖掘行为样本的第一排列节点,从所述X个先验挖掘行为样本中提取所述Y个先验挖掘行为样本,所述第一排列节点为依据升序或者降序对所述X个先验挖掘行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点,或所述第一排列节点为所述X个先验挖掘行为样本和所述关键行为样本的挖掘排列节点。
步骤S122,将所述Y个先验挖掘行为样本,输出为所述Y个参考行为样本。
例如,重新回到之前的上下文例子,并具体化这一技术内容。在线视频流平台中有一个庞大的用户行为知识模型,包含了大量的用户观看历史、互动数据等(集合X)。现在要从这个在线视频流平台中提取出一部分样本(集合Y),用以分析和优化推荐系统。
集合X可以想象为平台上所有用户的观看行为记录,比如哪些视频被观看、观看时长、搜索记录、用户评分等,数量非常庞大。集合Y是一个更小的、精选的行为样本集合,旨在反映或捕捉到用户行为的关键特征,以便进行深入的分析。
为了从集合X中挑选出集合Y,需要一个规则来决定哪些样本最具代表性。这里的第一排列节点可能指的是根据某种排序规则确定的样本排序序列。这种排序可能是基于用户活跌情况、观看频率、观看时间长度等因素,使用升序或降序排列。也就是说,可能会选择那些观看次数最多或最少的用户作为参考样本。另外,使用空间填充曲线(例如希尔伯特曲线或Z-order曲线)对样本进行排序,这样可以在处理高维度数据时保持数据的空间邻近性,有助于挖掘局部模式。
根据第一排列节点的规则,从集合X中选出了集合Y。例如,如果关注的是用户在周末晚上的观看习惯,可能会选择那些在周末晚上观看视频最多的用户作为参考行为样本。提取出的这些样本会包括用户的观看时间、频率、偏好类型等信息,它们将被用来进一步分析用户行为,优化推荐算法。
在在线视频流平台的案例中,这个过程可以帮助平台理解在不同时间段、不同设备上的用户观看行为模式,从而使得推荐算法能够更准确地预测用户喜欢什么内容,何时观看,以及通过什么设备观看,进而提供更加个性化的内容推荐。
在一种可能的实施方式中,步骤S121可以包括:
基于所述第一排列节点,将所述关键行为样本前向排列的且与所述关键行为样本存在关联的Y个行为样本,输出为所述Y个先验挖掘行为样本。
或者,基于所述第一排列节点,将所述关键行为样本前向排列的且满足非中断状态的Y个行为样本,输出为所述Y个先验挖掘行为样本,其中,所述满足非中断状态的Y个行为样本与所述关键行为样本最少分隔一个先验挖掘行为样本。
例如,将继续使用在线视频流平台的场景,并结合前文所述的步骤来构建一个具体例子。
假设在线视频流平台想要改进其推荐算法。为此,它首先对大量用户行为数据进行了分析,以创建或更新用户行为知识模型。现在,该在线视频流平台希望从已经存在的用户行为数据集(X)中提取出一组特别有价值的行为样本(Y),这些样本将用于进一步分析或作为参考点来调整推荐逻辑。
首先,通过某种方法(如时间序列分析、聚类算法等)识别出了用户行为数据集中的特定排列节点。这些特定排列节点可能基于用户观看视频的时间顺序,也可能基于用户行为的关联度。第一排列节点可以是一个标志性事件,比如一个用户开始观看一个新系列剧集的第一集。
依据第一排列节点,选择与关键行为样本存在关联且按照时间或其它条件前向排列的Y个行为样本。例如,如果关键行为样本是一个用户在周五晚上开始观看的新剧集,则可能会选择那些在随后的周六和周日观看同一剧集的其它用户作为先验挖掘行为样本。
或者,可能选择满足非中断状态的Y个行为样本,这意味着选取的样本在时间序列上与关键样本之间至少有一个其它行为样本的间隔。比如,如果关键样本是周五晚上的观看行为,非中断样本可能是周日而不是周六的观看行为。
然后,这些被识别的Y个行为样本被输出,以供进一步分析。这些样本因其与关键行为样本的直接关联或非中断关联,可能揭示了用户行为的特定模式或趋势。例如,如果发现周末观看新剧集的用户更倾向于在接下来的几天内继续观看该剧集,可能会利用这一信息来调整推荐系统,在用户开始一个新剧集时推荐整个系列,尤其是在周末。
通过这种方式,可以从大量的用户行为数据中提取最有价值的样本,并使用这些样本来优化后续的推荐策略。这有助于提高用户的参与度和满意度,同时可能还能增加用户对平台的粘性。
这个过程是一种数据驱动的决策方法,能够基于实际的用户行为模式进行精确的推荐和服务优化。通过持续监测和分析这些先验挖掘行为样本,可以便于后续不断迭代和改善其算法,以达到更好的用户体验和商业效果。
在一种可能的实施方式中,步骤S120可以包括:
步骤S123,依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本和所述关键行为样本之间的有向关系链路信息。
步骤S124,依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本。
例如,继续使用在线视频流平台的例子来解释这些技术步骤。在这个场景中,希望从已经选出的参考行为样本(集合Y)中提取出一组更加关联的样本(称为m个相关行为样本),以便对特定用户群体或行为模式进行深入分析。
假设已经通过前面的步骤选出了Y个参考行为样本,这些参考行为样本反映了一些普遍的观看习惯和内容偏好。现在,希望进一步挖掘特定类型的用户行为,比如那些在周末晚上倾向于长时间观看某类剧集的用户。
上下文特征数据的有向知识网络数据是指一个结构化的数据模型,其中节点代表用户行为的不同特征(例如观看特定类型的视频、在特定时间段内的活跃度等),而边则表示这些特征之间的关系(例如,用户在观看某个类型的视频后可能会搜索相关的信息)。这个有向知识网络包含了关键行为样本的上下文特征数据,如用户可能在观看完一部悬疑片后搜索推理相关的书籍或其它影视作品。
接下来,分析Y个参考行为样本和关键行为样本的上下文特征数据,在有向知识网络中确定它们之间的关系链路信息。例如,如果一个用户通常在观看某科幻系列电影后查看相应的续集信息,这就形成了一个有向关系链路,表明这种观看行为与特定的后续行为(搜索续集信息)有关联。
根据已确定的有向关系链路信息,可以从Y个参考行为样本中提取出m个相关行为样本,这些样本最能代表或反映用户的这些关联行为。举个具体的例子:如果在周末晚上,一部分用户在看完一集某热门剧集后会立即搜索该剧集的相关评论或讨论,那么这些用户的行为样本将被识别为具有强关联性,并被选为m个相关行为样本。
这些相关行为样本可以用于多种目的:
通过理解用户在观看特定内容后的行为模式,可以调整推荐算法,以在用户观看完一集之后及时推荐相关的评论、讨论或续集,从而增加用户的参与度和平台的粘性。
了解用户的关联行为也可以帮助平台设计针对性的营销活动,比如针对经常在周末晚上追新剧的用户群体推出特定促销。
总结来说,通过建立有向知识网络并识别有向关系链路信息,视频流平台能够更精准地捕获用户行为的上下文和关联性,从而提升服务质量,实现个性化推荐,并最终增强用户满意度和忠诚度。
在一种可能的实施方式中,所述有向关系链路信息通过知识图谱表示。所述依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本,包括:
1、依据所述知识图谱,确定所述关键行为样本的m个直接依赖行为样本,将所述m个直接依赖行为样本,输出为所述m个相关行为样本。
或者,2、依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i不低于m,则将所述i个参考行为样本输出为所述m个相关行为样本,以及如果i不低于m,则在所述i个参考行为样本中提取m个参考行为样本作为所述m个相关行为样本。
或者,3、依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
或者,4、依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点,依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本,所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点。或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
例如,继续以在线视频流平台的案例来具体化每个步骤。
假设在线视频流平台希望通过分析用户的观看习惯来优化推荐算法。它已经识别出了一组关键行为样本,并希望通过这些样本来找到与它们直接或间接强关联的其它样本,以便更精准地理解用户行为模式。
首先,构建了一个知识图谱,这个知识图谱包含了有关视频内容、用户观看行为、时间标签、设备类型等的有向关系链路信息。在知识图谱中,每个视频内容节点可能会连接到用户行为节点,表示特定用户对该视频内容的观看历史。
首先,根据知识图谱确定关键行为样本的m个直接依赖行为样本。这意味着查找与关键样本直接相关联的参考行为样本,例如,那些在同一时间段内观看相同视频序列的用户行为。
如果直接关联的参考行为样本数量i不低于m,则这些直接关联的参考行为样本就是所需的相关行为样本。
如果i低于m或等于0,说明没有足够的直接关联样本,此时需要利用知识图谱进一步探索。这可能涉及到计算参考行为样本与关键样本之间的代价值,也就是行为偏离度。行为偏离度可以基于多种因素,如观看时间差异、内容类别偏好等。
然后,根据代价值(行为偏离度)选择m个最相关的参考行为样本。如果代价值较低,说明行为样本与关键样本的关联性较高。
如果直接或间接强关联的参考行为样本仍然不足m个,平台则需要定义第二排列节点,以便更精细地从Y个参考行为样本中挑选出m个相关样本。第二排列节点可能基于空间填充曲线对样本进行排序,或者根据行为偏离度升序或降序排列。
其中,在上述在线视频流平台的场景中,计算从参考行为样本到关键行为样本之间的代价值可以是基于不同因素的函数。这个代价值通常用来量化参考行为样本与关键行为样本之间的相似度或关联性:代价值越小,表示两个样本之间的相似度或关联性越高。
假设,有一个关键行为样本K,它代表了用户在周末晚上观看某一特定剧集,并且该用户在观看后进行了相关内容的搜索。现在想要评估Y个参考行为样本中每一个样本i与关键行为样本K之间的代价值D(i,K)。
代价值计算公式示例
一个简单的代价值计算公式可能会包括以下几个方面:
1.时间差异(T):用户行为发生的时间与关键行为样本时间的差异。
2.内容偏好差异(C):用户在参考行为样本中观看的内容与关键行为样本中观看内容的差异。
3.活动类型差异(A):用户在参考行为样本中的活动类型(如观看、搜索、评论)与关键行为样本中的活动类型的差异。
假设分配给这些方面不同的权重:w_t,w_c,和w_a,对应时间差异、内容偏好差异和活动类型差异。那么代价值的计算公式可以是:
D(i,K)=w_t*T(i,K)+w_c*C(i,K)+w_a*A(i,K)
其中:
-T(i,K)=|time_i-time_K|
-C(i,K)=similarity(content_i,content_K)
-A(i,K)=similarity(activity_i,activity_K)
在这里,similarity()函数可以根据具体的数据类型和需求来定义。例如,如果内容是由类别标签表示的,similarity()可能会计算两组标签之间的Jaccard相似度。对于活动类型,如果它们是同一类型,则相似度为0;如果不同,则为1。
在实际应用中,这个公式可能需要更复杂的模型来准确地反映不同样本之间的相似度或关联性。例如,可以通过机器学习方法来学习最佳的权重w_t、w_c、w_a,或者使用深度学习的方法来直接从数据中学习到样本间的复杂关系。
基于以上实施例,在线视频流平台将这些步骤应用于实际场景:
使用知识图谱来追踪哪些用户在推出新剧集后开始binge-watching(连续观看)。从这些用户行为中提取m个相关行为样本,这些样本可以是那些在随后的日子里继续观看该剧集的用户,或者那些虽然没有立即观看,但其观看行为与关键样本具有较小偏离度的用户。如果发现直接关联的参考行为样本不够,将通过计算参考样本与关键样本之间的代价值来找到最相关的m个相关行为样本。例如,那些观看了相同剧集,且观看模式与关键样本类似的用户。最终,这些相关行为样本将用于进一步分析和优化推荐算法,使得平台能够向用户提供更加个性化和准确的视频推荐。通过这个复杂的提取和分析过程,可以更深入地理解用户的观看行为和偏好,从而提供更加精准的内容推荐,增强用户体验,并提高用户黏性。
在一种可能的实施方式中,步骤S120还可以包括:
步骤S125,依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值。
步骤S126,依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
例如,在这一技术内容中,需要使用关键行为样本的上下文特征数据来识别与之最相关的行为样本。具体步骤涉及建立有向知识网络数据、确定参考行为样本与关键行为样本之间的代价值,并根据这个代价值(即行为偏离度)提取相关行为样本。继续使用在线视频流平台的例子,可以对每个步骤进行详细的场景举例说明。
在线视频流平台想要分析用户在周末观看电影的行为模式。关键行为样本可能是在过去的几个周末中,用户观看某热门新上映电影的行为数据。Y个参考行为样本则是识别出来的可能具有相似观看习惯的用户行为数据集合。
首先构建一个有向知识网络,其中包含了用户行为的上下文特征数据,如观看时间、类型偏好、观看设备、用户反馈等。关键行为样本在这个有向知识网络中会以节点形式存在,其它参考行为样本也以节点形式表示,并通过边与关键行为样本连接,边上的权重或属性可以表示它们之间的相似性或关联度。
接着,计算每个参考行为样本到关键行为样本之间的代价值。这个代价值是基于上下文特征数据和知识网络中的路径强度来确定的。例如,如果一个用户在同一周末观看了同一部电影,但在不同的时间段,那么这个参考样本到关键样本的代价值(行为偏离度)可能会比在相同时间段观看的用户低。
根据前面确定的代价值,可以将从Y个参考行为样本中挑选出代价值最小的m个相关行为样本,因为这些相关行为样本在行为上与关键样本的偏离度最低,从而被认为与关键行为样本最相关。比如,如果发现某些用户在周六晚上观看了该电影并给出了高评分,而这正是关键行为样本所呈现的模式,那么这些用户的行为样本就会被选为相关样本。
通过这种方法,可以精确识别那些与关键行为样本有类似观看模式的用户,从而更好地理解目标用户群体。同时,可以便于后续利用这些信息来优化推荐系统,比如在用户开始观看某部电影时,推荐它们可能感兴趣的类似电影或相关内容。这种分析还可以在特定时间段针对特定用户群体开展促销活动,增加用户黏性和提高转化率。由此,使得后续能够利用用户的历史行为数据来预测和引导未来的观看行为,提升用户体验并增加业务价值。
步骤S126可以包括:
将所述Y个参考行为样本中的与所述关键行为样本的代价值低于第一设定代价值的行为样本,输出为所述m个相关行为样本。
或者,将所述Y个参考行为样本中的与所述关键行为样本的代价值为第二设定代价值的行为样本,输出为m个相关行为样本。
例如,在这个技术内容中,需要从Y个参考行为样本中提取m个与关键行为样本最相关的样本。这一过程基于计算出的代价值来确定每个参考样本与关键样本之间的相关性。代价值越低,代表两者之间的相似度越高,相关性越强。以下是具体场景的举例说明:
当前正在进行用户观看行为的分析,已经定义了一个关键行为样本,例如某用户在周末晚上连续观看整个剧季,并在观看后进行评论。现在,需要找到与此类似的其它用户行为样本。
设置一个第一设定代价值(第一阈值)。所有代价值低于这个阈值的参考行为样本将被视为与关键行为样本高度相关。例如,如果设定代价值阈值为0.3,那么所有计算出代价值小于0.3的参考行为样本都会被选作相关行为样本。
对Y个参考行为样本进行遍历,将那些代价值低于第一设定代价值的样本输出为m个相关行为样本。举例来说,如果发现一批用户在相同的周末晚上观看了相同的剧集,并在观看后搜索了有关该剧集的额外信息,这些用户的行为样本代价值可能就会低于设定的阈值,因此它们将被选择为相关样本。
或者,如果没有足够的参考行为样本的代价值低于第一设定代价值,可以选择使用第二设定代价值(第二阈值),这通常是一个更宽松的条件,允许包括更多参考行为样本作为相关行为样本。这意味着即使参考行为样本与关键行为样本之间的代价值略高,但仍在第二阈值范围内的参考行为样本也会被认为是相关的。
接下来,按照第二设定代价值筛选出m个相关行为样本,这些相关行为样本可能包含了在周末晚上观看了相同剧集但没有进行任何额外活动的用户,或者在不同时间段但仍在周末进行了类似观看行为的用户。
通过以上步骤,可以精确地识别出那些与关键用户行为模式相匹配的用户群体。然后可以便于针对这些用户实施特定的推荐策略,比如推送该剧集的相关内容、幕后花絮、相似剧集推荐等,以增加用户的黏性和满意度。同时,还可以利用这些数据来优化其内容库,确保满足目标用户群体的偏好。
在一种可能的实施方式中,步骤S120可以包括:
基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点。
依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本。
所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点。或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
这段技术内容描述了如何基于有向知识网络数据和行为偏离度来排列参考行为样本,并从中提取与关键行为样本最相关的m个样本。下面通过在线视频流平台的案例来详细说明每一步。
首先会构建一个有向知识网络,它包含了关键行为样本及所有Y个参考行为样本的上下文特征数据。这个有向知识网络能够展示不同用户行为之间的联系,例如,用户对特定类型的电影的偏好、观看时间、观看频率等。
基于上述有向知识网络数据,将定义一系列的第二排列节点。这些排列节点可以根据空间填充曲线的方式(如Z-order曲线)或者根据参考行为样本与关键行为样本之间的代价值进行排序来生成。例如,如果使用空间填充曲线,可能会将观看时间和类型偏好转换成一个多维空间中的坐标点,然后使用Z-order曲线来确定样本间的相对位置。另一方面,如果基于代价值进行排序,则会计算每个参考行为样本与关键样本之间的偏离度,并按照这个标准进行升序或降序排列。
接着,根据上一步得到的第二排列节点的顺序,平台将选择m个与关键行为样本最相关的参考行为样本。如果是根据空间填充曲线排序,那么距离关键行为样本最近的m个样本将被选取。如果是基于代价值排序,那么代价值最低(或者最接近特定值)的m个样本将被选取。
利用这种方法,能够识别出在类似的时间点观看了类似类型电影的用户群体,分析这些用户的其它观看习惯,以发现潜在的观看模式,根据这些模式调整推荐算法,向目标用户推荐它们可能感兴趣的其它电影或节目。
通过以上步骤,不仅能够更精确地理解用户的行为模式,还能通过提供更加个性化的推荐来增强用户满意度和提高用户黏性。
在一种可能的实施方式中,步骤S130可以包括:
以所述余下相关行为样本中的一个相关行为样本与所述关键行为样本的代价值的反比数作为所述一个相关行为样本的影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息。
或者,针对所述余下相关行为样本中的不同相关行为样本设定相同或不同的初始影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和初始影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息,其中所述m个相关行为样本中的一个相关行为样本的初始影响因子与所述一个相关行为样本与所述关键行为样本的代价值成反比例关系,所述设备端多维融合数据包括所述余下相关行为样本中的每一个相关行为样本的初始影响因子。或者,将所述余下相关行为样本中与所述关键行为样本的代价值最近的相关行为样本的特征挖掘参数,输出为所述关键行为样本的特征参数的估计信息。
例如,在这个技术内容中,基于m个相关行为样本来估计关键行为样本的特征参数。这里的关键行为样本代表了一种用户行为的核心模式,而相关行为样本则提供了对这一核心模式的补充和详细信息。以下是具体场景的举例说明:
继续使用在线视频流平台的例子,假设关键行为样本是一个用户在周五晚上观看了某一热门剧集的新一季,并在每次观看后发布了评论。已经从大量的用户行为数据中提取出了m个与之高度相关的行为样本。
对于余下的相关行为样本中的每一个相关行为样本,以其与关键行为样本的代价值的反比数作为影响因子。如果代价值小,则意味着该相关行为样本与关键行为样本非常相似,其影响因子大;反之,代价值大,影响因子小。例如,一个用户在周六晚上观看了同一剧集并发布了评论,其代价值较低,因此该用户的行为样本将有较大的影响因子。
接下来,可以结合每个相关行为样本的特征挖掘参数和影响因子来计算融合挖掘参数,并输出这些融合挖掘参数作为关键行为样本的特征参数的估计信息。举例来说,如果某个相关行为样本的用户在观看后通常搜索相关讨论话题,这个行为就会通过影响因子反映到关键行为样本的特征参数估计中。
或者,可以为不同的相关行为样本设定相同或不同的初始影响因子,这些影响因子可以与每个样本与关键样本之间的代价值成反比例关系。这样,即使在开始时没有精确的代价值数据,也可以给予每个样本一个合理的初始权重。然后,依据每个相关行为样本的特征挖掘参数和初始影响因子,平台将这些数据融合起来得到一个全面的特征参数集,作为关键行为样本的特征参数估计。比如,如果某个样本的初始影响因子较高,那么这个样本的行为特征将在融合挖掘参数中占有较大的比重。
或者,如果选择简化流程,它可能会直接选取与关键行为样本代价值最近的相关行为样本,并使用其特征挖掘参数作为关键行为样本的特征参数估计。例如,如果有一个用户的行为样本与关键样本的代价值最小,那么这个用户的观看时间、评论内容和频率等特征就可以直接作为对关键样本特征参数的一个有效估计。
图2示出了本申请实施例提供的用于实现上述的基于设备端多维数据融合的用户行为分析方法的用户行为分析系统100的硬件结构意图,如图2所示,用户行为分析系统100可包括处理器110、机器可读存储介质120、总线130以及通信单元140。
一种可替代的实施例中,用户行为分析系统100可以是单个服务器,也可以是服务器组。所述服务器组可以是集中式的,也可以是分布式的(例如,用户行为分析系统100可以是分布式的系统)。一种可替代的实施例中,用户行为分析系统100可以是本地的,也可以是远程的。例如,用户行为分析系统100可以经由网络访问存储于机器可读存储介质120中的信息和/或数据。又例如,用户行为分析系统100可以直接连接到机器可读存储介质120以访问存储的信息和/或数据。一种可替代的实施例中,用户行为分析系统100可以在云平台上实施。仅作为示例,该云平台可以包括私有云、公共云、混合云、社区云、分布云、内部云、多层云等或其任意组合。
机器可读存储介质120可以储存数据和/或指令。一种可替代的实施例中,机器可读存储介质120可以存储从外部终端获取的数据。一种可替代的实施例中,机器可读存储介质120可以储存用户行为分析系统100用来执行或使用来完成本申请中描述的示例性方法的数据及/或指令。一种可替代的实施例中,机器可读存储介质120可包括大容量存储器、可移动存储器、易失性读写存储器、只读存储器等或其任意组合。示例性的大容量存储器可以包括磁盘、光盘、固态磁盘等。示例性可移动存储器可以包括闪存驱动器、软盘、光盘、存储卡、压缩盘、磁带等。
在具体实现过程中,多个处理器110执行机器可读存储介质120存储的计算机可执行指令,使得处理器110可以执行如上方法实施例的基于设备端多维数据融合的用户行为分析方法,处理器110、机器可读存储介质120以及通信单元140通过总线130连接,处理器110可以用于控制通信单元140的收发动作。
处理器110的具体实现过程可参见上述用户行为分析系统100执行的各个方法实施例,其实现原理和技术效果类似,本实施例此处不再赘述。
此外,本申请实施例还提供一种可读存储介质,所述可读存储介质中预设有计算机可执行指令,当处理器执行所述计算机可执行指令时,实现如上基于设备端多维数据融合的用户行为分析方法。
同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。同理,应当注意的是,为了简化本申请披露的表述,从而帮助对一个或以上发明实施例的理解,前文对本申请实施例的描述中,有时会将多种特征归并至一个实施例、附图或对其的描述中。
Claims (10)
1.一种基于设备端多维数据融合的用户行为分析方法,其特征在于,所述方法包括:
对用户行为知识模型的设备端多维融合数据进行特征提取,生成所述用户行为知识模型中的关键行为样本的上下文特征数据的有向知识网络数据;
从所述用户行为知识模型中的X个先验挖掘行为样本中提取Y个先验挖掘行为样本作为所述关键行为样本的Y个参考行为样本,并依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,X≥Y≥1,Y≥m≥1;
清洗所述m个相关行为样本中的与基准行为样本的特征挖掘参数的偏离度不低于设定门限值的相关行为样本,并基于所述m个相关行为样本中余下相关行为样本的特征挖掘参数,确定所述关键行为样本的特征参数的估计信息;所述基准行为样本为所述m个相关行为样本中的行为样本;
对所述设备端多维融合数据进行迁移状态分析,生成反映用户行为随预设因素发生变化趋势的迁移状态趋势值,并基于所述关键行为样本的特征参数的估计信息和所述迁移状态趋势值,生成所述关键行为样本的特征参数的更新参数值;
基于所述关键行为样本的特征参数的目标更新参数值,生成目标用户行为知识模型,并基于所述目标用户行为知识模型进行个性化推荐。
2.根据权利要求1所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,X>Y,所述从所述用户行为知识模型中的X个先验挖掘行为样本中提取Y个先验挖掘行为样本作为所述关键行为样本的Y个参考行为样本,包括:
依据所述X个先验挖掘行为样本的第一排列节点,从所述X个先验挖掘行为样本中提取所述Y个先验挖掘行为样本,所述第一排列节点为依据升序或者降序对所述X个先验挖掘行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点,或所述第一排列节点为所述X个先验挖掘行为样本和所述关键行为样本的挖掘排列节点;
将所述Y个先验挖掘行为样本,输出为所述Y个参考行为样本。
3.根据权利要求2所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述依据所述X个先验挖掘行为样本的第一排列节点,从所述X个先验挖掘行为样本中提取所述Y个先验挖掘行为样本,包括:
基于所述第一排列节点,将所述关键行为样本前向排列的且与所述关键行为样本存在关联的Y个行为样本,输出为所述Y个先验挖掘行为样本;
或者,基于所述第一排列节点,将所述关键行为样本前向排列的且满足非中断状态的Y个行为样本,输出为所述Y个先验挖掘行为样本,其中,所述满足非中断状态的Y个行为样本与所述关键行为样本最少分隔一个先验挖掘行为样本。
4.根据权利要求1所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本和所述关键行为样本之间的有向关系链路信息;
依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本。
5.根据权利要求4所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述有向关系链路信息通过知识图谱表示;所述依据所述有向关系链路信息,从所述Y个参考行为样本中提取所述m个相关行为样本,包括:
依据所述知识图谱,确定所述关键行为样本的m个直接依赖行为样本,将所述m个直接依赖行为样本,输出为所述m个相关行为样本;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i不低于m,则将所述i个参考行为样本输出为所述m个相关行为样本,以及如果i不低于m,则在所述i个参考行为样本中提取m个参考行为样本作为所述m个相关行为样本;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度;
或者,依据所述有向关系链路信息,从所述Y个参考行为样本中提取与所述关键行为样本直接关联或者间接强关联的i个参考行为样本,如果i低于m或i等于0,则基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点,依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本,所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点;或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
6.根据权利要求1所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
依据所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据,确定所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值;
依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,其中,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
7.根据权利要求6所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述依据所述Y个参考行为样本中的参考行为样本到所述关键行为样本之间的代价值,从所述Y个参考行为样本中提取所述m个相关行为样本,包括:
将所述Y个参考行为样本中的与所述关键行为样本的代价值低于第一设定代价值的行为样本,输出为所述m个相关行为样本;
或者,将所述Y个参考行为样本中的与所述关键行为样本的代价值为第二设定代价值的行为样本,输出为m个相关行为样本。
8.根据权利要求1所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述依据所述关键行为样本的上下文特征数据的有向知识网络数据,从所述Y个参考行为样本中提取m个相关行为样本,包括:
基于所述关键行为样本的上下文特征数据的有向知识网络数据和所述Y个参考行为样本的上下文特征数据的有向知识网络数据确定第二排列节点;
依据所述第二排列节点,从所述Y个参考行为样本中提取所述m个相关行为样本;
所述第二排列节点为依据升序或者降序对所述Y个参考行为样本和所述关键行为样本进行空间填充曲线的排列处理生成的排列节点;或者,所述第二排列节点为依据所述Y个参考行为样本中的参考行为样本与所述关键行为样本的代价值进行降序或者升序后生成的排列节点,所述Y个参考行为样本中的参考行为样本到所述关键行为样本的代价值为行为偏离度。
9.根据权利要求1-8中任意一项所述的基于设备端多维数据融合的用户行为分析方法,其特征在于,所述基于所述m个相关行为样本中余下相关行为样本的特征挖掘参数,确定所述关键行为样本的特征参数的估计信息,包括:
以所述余下相关行为样本中的一个相关行为样本与所述关键行为样本的代价值的反比数作为所述一个相关行为样本的影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息;
或者,针对所述余下相关行为样本中的不同相关行为样本设定相同或不同的初始影响因子,依据所述余下相关行为样本中每一个相关行为样本的特征挖掘参数和初始影响因子,将计算的所述余下相关行为样本的特征挖掘参数的融合挖掘参数,输出为所述关键行为样本的特征参数的估计信息,其中所述m个相关行为样本中的一个相关行为样本的初始影响因子与所述一个相关行为样本与所述关键行为样本的代价值成反比例关系,所述设备端多维融合数据包括所述余下相关行为样本中的每一个相关行为样本的初始影响因子;或者,将所述余下相关行为样本中与所述关键行为样本的代价值最近的相关行为样本的特征挖掘参数,输出为所述关键行为样本的特征参数的估计信息。
10.一种用户行为分析系统,其特征在于,所述用户行为分析系统包括处理器和机器可读存储介质,所述机器可读存储介质中存储有机器可执行指令,所述机器可执行指令由所述处理器加载并执行以实现权利要求1-9中任意一项的基于设备端多维数据融合的用户行为分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311675451.0A CN117807128A (zh) | 2023-12-07 | 2023-12-07 | 基于设备端多维数据融合的用户行为分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311675451.0A CN117807128A (zh) | 2023-12-07 | 2023-12-07 | 基于设备端多维数据融合的用户行为分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117807128A true CN117807128A (zh) | 2024-04-02 |
Family
ID=90429006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311675451.0A Pending CN117807128A (zh) | 2023-12-07 | 2023-12-07 | 基于设备端多维数据融合的用户行为分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117807128A (zh) |
-
2023
- 2023-12-07 CN CN202311675451.0A patent/CN117807128A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5283110B2 (ja) | 対象を定めたテレビ番組配信のためのシステム、プリファレンスエンジン、機械可読媒体およびテレビ視聴習慣を判断する方法 | |
US7644427B1 (en) | Time-centric training, interference and user interface for personalized media program guides | |
US8869205B2 (en) | Method and system for video collection management, invalid video replacement and continuous video replay | |
US10616299B2 (en) | Video analytics device | |
US20150058903A1 (en) | Geographic content recommendation | |
US20170161773A1 (en) | Methods and Systems for Targeted Advertising Using Machine Learning Techniques | |
US20170161772A1 (en) | Methods and Systems for Targeted Advertising Using Machine Learning Techniques | |
US20140259038A1 (en) | Demographic prediction channel | |
WO2014143024A1 (en) | Almost online large scale collaborative filtering based recommendation system | |
CN104782138A (zh) | 识别缩略图图像以呈现视频 | |
US20210304285A1 (en) | Systems and methods for utilizing machine learning models to generate content package recommendations for current and prospective customers | |
US20200183975A1 (en) | Video content optimization system | |
WO2017095942A1 (en) | Methods and systems for targeted advertising using machine learning techniques | |
JP6823170B2 (ja) | コンテンツストリームにおける中断期間の予測 | |
Pattanayak et al. | Review of recommender system for OTT platform through artificial intelligence | |
CN117807128A (zh) | 基于设备端多维数据融合的用户行为分析方法及系统 | |
US10503794B2 (en) | Video content optimization system and method for content and advertisement placement improvement on a third party media content platform | |
WO2023287444A1 (en) | Method for identifying new audiences for content of a content provider | |
EP3226158B1 (en) | Video analytics device | |
Zibriczky et al. | EPG content recommendation in large scale: a case study on interactive TV platform | |
Clement et al. | Impact of recommendation engine on video-sharing platform-YouTube | |
Li | Towards predictive networking based on user interest mining | |
US11490172B2 (en) | Method and system for the classification and categorization of video pathways in interactive videos | |
Cañamares et al. | On the Optimal Non-Personalized Recommendation: From the PRP to the Discovery False Negative Principle | |
Pagano | Context-driven recommender systems |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |