CN114817225A - 基于大数据电商优化的用户行为数据处理方法及系统 - Google Patents

基于大数据电商优化的用户行为数据处理方法及系统 Download PDF

Info

Publication number
CN114817225A
CN114817225A CN202210571964.6A CN202210571964A CN114817225A CN 114817225 A CN114817225 A CN 114817225A CN 202210571964 A CN202210571964 A CN 202210571964A CN 114817225 A CN114817225 A CN 114817225A
Authority
CN
China
Prior art keywords
user behavior
behavior tracking
tracking data
attention
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210571964.6A
Other languages
English (en)
Other versions
CN114817225B (zh
Inventor
赵建武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shengsheng Technology Co ltd
Original Assignee
Guangxi Runjia Internet Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi Runjia Internet Technology Co ltd filed Critical Guangxi Runjia Internet Technology Co ltd
Priority to CN202210571964.6A priority Critical patent/CN114817225B/zh
Publication of CN114817225A publication Critical patent/CN114817225A/zh
Application granted granted Critical
Publication of CN114817225B publication Critical patent/CN114817225B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • G06F16/2379Updates performed during online database operations; commit processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2474Sequence data queries, e.g. querying versioned data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Finance (AREA)
  • Probability & Statistics with Applications (AREA)
  • Development Economics (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Quality & Reliability (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供的基于大数据电商优化的用户行为数据处理方法及系统,能够每隔预设关联时长间隔统计一次候选关联用户行为跟踪数据序列,并确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。

Description

基于大数据电商优化的用户行为数据处理方法及系统
技术领域
本申请涉及大数据及电商优化及数据处理技术领域,特别涉及基于大数据电商优化的用户行为数据处理方法及系统。
背景技术
随着科学技术的不断发展,大数据的应用领域越来越广泛。以智慧电商为例,在大数据时代下,电商优化技术得到了快速的发展,能够实现用户与电商人员、电商平台间的互联互通和信息共享,促进电商业务协同,实现电商资源的高效配置。
现目前,电商优化技术是用于识别到用户行为的一种技术方案。但是,在实际操作过程中,由于每个用户的喜好和兴趣是不同的,从而可能导致电商优化技术不能准确且可靠的识别到用户意图。因此,亟需一种技术方案以改善上述技术问题。
发明内容
为改善相关技术中存在的上述背景技术存在的技术问题,本申请提供了基于大数据电商优化的用户行为数据处理方法及系统。
本申请提供了一种基于大数据电商优化的用户行为数据处理系统,包括用户行为跟踪服务器和云计算服务器,所述用户行为跟踪服务器和所述云计算服务器通信连接;所述用户行为跟踪服务器用于:向所述云计算服务器上传用户行为跟踪数据;所述云计算服务器具体用于:获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
进一步地,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
进一步地,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:获取目标用户行为跟踪数据的目标用户行为跟踪标签;根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;所述云计算服务器具体还用于:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态;所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
进一步地,所述云计算服务器获取目标用户行为跟踪数据的目标用户行为跟踪标签的步骤,包括:从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签;若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签;若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤,其中,所述云计算服务器具体还用于:提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征;从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值;若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系;若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
进一步地,所述云计算服务器具体还用于:若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列;确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
进一步地,所述云计算服务器根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列的步骤,包括:若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
进一步地,所述云计算服务器具体还用于:采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新。
本申请提供了一种基于大数据电商优化的用户行为数据处理方法,应用于云计算服务器,所述方法包括:获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
本申请提供了一种云计算服务器,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与云计算服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述的方法。
本申请提供了一种应用于计算机的可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在云计算服务器的内存中运行时实现上述的方法。
本申请实施例提供的技术方案中,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1为本申请实施例所提供的基于大数据电商优化的用户行为数据处理系统的架构示意图;
图2为本申请实施例所提供的基于大数据电商优化的用户行为数据处理方法的流程图;
图3为本申请实施例所提供的基于大数据电商优化的用户行为数据处理装置的功能模块框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
为了便于对上述的基于大数据电商优化的用户行为数据处理方法及系统进行阐述,请结合参考图1,提供了本申请实施例所公开的基于大数据电商优化的用户行为数据处理系统100的通信架构示意图。其中,所述基于大数据电商优化的用户行为数据处理系统100可以包括用户行为跟踪服务器200以及云计算服务器300,所述用户行为跟踪服务器200与云计算服务器300连接。
在具体的实施方式中,用户行为跟踪服务器200可以用于执行相关的检测项目,然后将采集到的用户行为跟踪数据传输给云计算服务器300,相应的,云计算服务器300可以是平板电脑、台式电脑或笔记本电脑等具有数据处理功能的设备。
在上述基础上,请结合参阅图2,为本申请实施例所提供的基于大数据电商优化的用户行为数据处理方法的流程示意图,所述基于大数据电商优化的用户行为数据处理方法可以应用于图1中的云计算服务器300,进一步地,所述基于大数据电商优化的用户行为数据处理方法具体可以包括以下步骤S21-步骤S24所描述的内容。
步骤S21,云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔。
示例性的,目标用户行为跟踪数据用于表征用户行为跟踪服务器对应的用户行为检测结果,用户行为跟踪服务器可以将目标用户行为跟踪数据上传给云计算服务器。用户行为可以理解的是:用户浏览电商商品等行为。
在实际应用时,目标用户行为跟踪数据可以表示为对用户行为进行挖掘或者跟踪。
步骤S22,云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
进一步地,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔。可以理解的是,关联时长间隔可以根据实际情况进行调整。
示例性的,所述候选关联用户行为跟踪数据序列表示针对每个目标用户关注波动时长所匹配的用户行为跟踪数据的集合。此外,候选关联用户行为跟踪数据序列可以为多个。
步骤S23,云计算服务器确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列。
在本实施例中,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列。
相应的,用户关注波动频率可以用于表征用户行为跟踪数据在单位时长内出现突变的累积次数。预设关联阈值可以理解为用户关注波动频率的判断值。
步骤S24,云计算服务器根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
示例性的,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。在准确确定出关联用户行为跟踪数据序列的前提下,能够实现对目标用户行为跟踪数据的有效误差校验,从而降低目标用户行为跟踪数据的错误率,提高目标用户行为跟踪数据的检测精度。
可以理解,在执行上述步骤S21-步骤S24所描述的内容时,本申请实施例提供的技术方案中,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
在一种可替换的实施例中,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,存在多个目标用户关注波动时长导致的目标用户关注波动时长紊乱的问题,这样就难以对每个目标用户关注波动时长进行有效地区分,就不能精确地得到至少两个目标用户关注波动时长,为了改善上述技术问题,步骤S21所描述的获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,具体可以包括以下步骤S211和步骤S212所描述的内容。
步骤S211,获取目标用户行为跟踪数据的目标用户行为跟踪标签。
示例性的,目标用户行为跟踪标签用于表示目标用户行为跟踪数据中的关键内容。进一步地,关键内容可以体现出对应的目标用户行为跟踪数据的特征。比如:在相关数据中进行排序并标号,这样可以通过对应的序号查询到对应的相关数据的位置,以便于得到对应的数据内容,这样的序号可以代指标签。
步骤S212,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长。
可以理解,在执行上述步骤S211和步骤S212所描述的内容时,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,根据用户行为跟踪数据的用户关注波动时长的映射关系,能准确地对每个目标用户关注波动时长精确的进行区分,确保目标用户关注波动时长的完整性,从而有效地避免每个目标用户关注波动时长之间的相互干扰。譬如,可以通过波形变换技术,将目标用户行为跟踪数据换成每一个时长点对应的突变波形数据。然后,确定突变波形数据中的波动幅度超过预设突变标准对应的时长点,作为用户关注波动开始时长和用户关注波动结束时长,该两个时长点所形成的时长段,则为目标用户行为跟踪数据中的用户关注波动时长段。当然,本领域技术人员可以在上述内容的基础上根据实际需要采用各种方式识别出目标用户行为跟踪数据中的用户关注波动时长段,本申请实施例对此不作限制。
在一种可替换的实施例中,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,存在用户关注波动时长不准确的问题,从而难以精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,为了改善上述技术问题,步骤S22所描述的分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤q1所描述的内容。
步骤q1,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
举例而言,映射关系包括一对一、多对一或者一对多。
可以理解,在执行上述步骤q1所描述的内容时,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,有效地避免用户关注波动时长不准确的问题,从而能精确地确保用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,因此能精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
在一种可替换的实施例中,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,存在获取不到准确地目标用户行为跟踪数据的问题,从而难以准确地的得到对应的至少两个目标用户关注波动时长,为了改善上述技术问题,步骤S21所描述的获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,具体可以包括以下步骤w1和步骤w2所描述的内容。
步骤w1,获取目标用户行为跟踪数据的目标用户行为跟踪标签。
步骤w2,根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长。
举例而言,用户行为跟踪数据的用户关注波动时长的映射关系中的映射关系表示预先储存的用户行为跟踪标签和用户关注波动时长的一一对应关系。
可以理解,在执行上述步骤w1和步骤w2所描述的内容时,在获取目标用户行为跟踪数据的至少两个目标用户关注波动时长时,避免获取不到准确地目标用户行为跟踪数据的问题,从而能够准确地的得到对应的至少两个目标用户关注波动时长。
基于上述基础,还可以包括以下步骤e1所描述的内容。
步骤e1,根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态。
可以理解,在执行上述步骤e1所描述的内容时,通过用户关注波动时长的映射关系,这样能精确地确定出目标用户行为跟踪数据中的每个所述目标用户关注波动时长对应的目标用户关注波动状态,进一步地,提高目标用户行为跟踪数据的准确度,从而确保目标用户行为跟踪数据进行相关处理的精度。
在一种可替换的实施例中,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,存在每个目标用户关注波动时长对应的候选用户关注波动时长不能进行区分的问题,从而难以精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,为了改善上述技术问题,步骤q1所描述的分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤t1所描述的内容。
步骤t1,根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
示例性的,用户关注波动状态表示可以用于表征用户行为跟踪数据在单位时长内出现突变的状态。
可以理解,在执行上述步骤t1所描述的内容时,在分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列时,避免每个目标用户关注波动时长对应的候选用户关注波动时长不能进行区分的问题,从而能够精确地确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列。
在一种可以换的实施例中,在获取目标用户行为跟踪数据的目标用户行为跟踪标签时,存在待定用户行为跟踪标签不能精确地确定的问题,从而难以精确地获取目标用户行为跟踪数据的目标用户行为跟踪标签,为了改善上述技术问题,步骤w1所描述的获取目标用户行为跟踪数据的目标用户行为跟踪标签的步骤,具体可以包括以下步骤y1-步骤y3所描述的内容。
步骤y1,从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签。
步骤y2,若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签。
步骤y3,若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤。
可以理解,在执行上述步骤y1-步骤y3所描述的内容时,在获取目标用户行为跟踪数据的目标用户行为跟踪标签时,避免待定用户行为跟踪标签不能精确地确定的问题,从而能够精确地获取目标用户行为跟踪数据的目标用户行为跟踪标签。
基于上述基础,还可以包括以下步骤u1-步骤u4所描述的内容。
步骤u1,提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征。
可以理解的是,第一用户行为跟踪数据特征表示描述用户行为跟踪数据的重要属性,比如,用户行为的波长、用户行为的频率以及用户行为的折损率等。
步骤u2,从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值。
步骤u3,若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系。
步骤u4,若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
可以理解,在执行上述步骤u1-步骤u4所描述的内容时,实时用户行为数据中包括多种跟踪数据对应的数据特征,将每一种数据特征映射到用户行为跟踪数据的用户关注波动时长中,这样能够提高判断第二用户行为跟踪数据特征与第一用户行为跟踪数据特征的相似度与预设相似度阈值大小关系的精确性。
基于上述基础,还包括以下步骤p1-步骤p3所描述的内容。
步骤p1,若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列。
步骤p2,确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的。
步骤p3,根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
可以理解,在执行上述步骤p1-步骤p3所描述的内容时,通过候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率与预设关联阈值的大小关系,能精确地确定目标跟踪数据子序列,因此,提高目标用户行为跟踪数据的关联用户行为跟踪数据序列的准确性。
在一种可替换的实施例中,步骤p3所描述的根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列的步骤,具体可以包括以下步骤K1和步骤k2所描述的内容。
步骤k1,若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
步骤k2,若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
可以理解,在执行上述步骤K1和步骤k2所描述的内容时,根据关联用户行为跟踪数据序列的数量逐一地进行相关计算,能够提高计算的准确性,从而能精确地确定目标跟踪数据子序列的并将其作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
在一些选择性的实施例中,上述步骤所描述的采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新,还可以包括以下步骤S251-步骤S256。
步骤S251,根据所述关联用户行为跟踪数据序列获取检测项目描述集,其中,所述检测项目描述集包括不间断的x组检测项目描述,所述x为大于或等于1的整数。
譬如,检测项目描述用于表征不同的检测项目情况。
步骤S252,根据所述检测项目描述集获取干扰描述集,其中,所述干扰描述集包括不间断的x组干扰描述。
譬如,干扰描述用于表征检测项目对应的偏差情况。
步骤S253,基于所述检测项目描述集,通过检测项目分析线程所包括的第一内容解析单元获取检测项目表达信息集,其中,所述检测项目表达信息集包括x个检测项目表达信息。
譬如,检测项目分析线程可以是基于人工智能的卷积神经网络。
步骤S254,基于所述干扰描述集,通过所述检测项目分析线程所包括的第二内容解析单元获取干扰表达信息集,其中,所述干扰表达信息集包括x个干扰表达信息。
譬如,内容解析单元可以是特征提取层。
步骤S255,基于所述检测项目表达信息集以及所述干扰表达信息集,通过所述检测项目分析线程所包括的用户关注波动分类单元获取所述检测项目描述所对应的检测需求标签。
譬如,用户关注波动分类单元可以是全连接层。
在一些可选的实施例中,所述基于所述检测项目表达信息集以及所述干扰表达信息集,通过所述检测项目分析线程所包括的用户关注波动分类单元获取所述检测项目描述集所对应的检测需求标签,包括:基于所述检测项目表达信息集,通过所述检测项目分析线程所包括的第一位置关注单元获取x个第一项目特征,其中,每个第一项目特征对应于一个检测项目表达信息;基于所述干扰表达信息集,通过所述检测项目分析线程所包括的第二位置关注单元获取x个第二项目特征,其中,每个第二项目特征对应于一个干扰表达信息;对所述x个第一项目特征以及所述x个第二项目特征进行整合处理,得到x个目标项目特征,其中,每个目标项目特征包括一个第一项目特征以及一个第二项目特征;基于所述x个目标项目特征,通过所述检测项目分析线程所包括的所述用户关注波动分类单元获取所述检测项目描述集所对应的检测需求标签。
在一些可选的实施例中,所述基于所述检测项目表达信息集,通过所述检测项目分析线程所包括的第一位置关注单元获取x个第一项目特征,包括:针对所述检测项目表达信息集中的每组检测项目表达信息,通过所述第一位置关注单元所包括的全局分类层获取第一全局聚类表达信息,其中,所述第一位置关注单元属于所述检测项目分析线程;针对所述检测项目表达信息集中的每组检测项目表达信息,通过所述第一位置关注单元所包括的局部分类层获取第一局部聚类表达信息;针对所述检测项目表达信息集中的每组检测项目表达信息,基于所述第一全局聚类表达信息以及所述第一局部聚类表达信息,通过所述第一位置关注单元所包括的特征压缩层获取第一合成表达信息;针对所述检测项目表达信息集中的每组检测项目表达信息,基于所述第一合成表达信息以及所述检测项目表达信息,通过所述第一位置关注单元所包括的第一局部分类层获取第一项目特征。
步骤S256,根据所述检测需求标签确定所述检测项目描述集的更新引导策略,采用所述更新引导策略对所述目标用户行为跟踪数据进行更新。
譬如,可以确定目标用户行为跟踪数据和关联用户行为跟踪数据序列的比对结果,然后结合比对结果,采用更新引导策略对所述目标用户行为跟踪数据进行更新,从而便于后续用户行为跟踪数据的正常使用。
可以理解的是,通过上述步骤S251-步骤S256,能够借助检测项目分析线程确定更新引导策略,从而采用更新引导策略对所述目标用户行为跟踪数据进行更新,以考虑不同的检测项目的具体情况,这样可以确保更新与实际检测情况的适配性。
基于同样的发明构思,还提供了基于大数据电商优化的用户行为数据处理系统,所述系统包括用户行为跟踪服务器和云计算服务器,所述用户行为跟踪服务器与所述云计算服务器通信连接,云计算服务器具体用于:
获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;
分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;
确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;
根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
进一步的,云计算服务器具体用于:
获取目标用户行为跟踪数据的目标用户行为跟踪标签;
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;
所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
进一步的,云计算服务器具体用于:
获取目标用户行为跟踪数据的目标用户行为跟踪标签;
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;
所述方法还包括:
根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态;
所述分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:
根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
进一步的,云计算服务器具体用于:
从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签;
若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签;
若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤。
进一步的,云计算服务器具体用于:
提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征;
从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值;
若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系;
若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
进一步的,云计算服务器具体用于:
若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列;
确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的;
根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
进一步的,云计算服务器具体用于:
若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;
若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
进一步的,云计算服务器具体用于:
采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新。
基于上述同样的发明构思,请结合参阅图3,还提供了基于大数据电商优化的用户行为数据处理装置400的功能模块框图,关于所述基于大数据电商优化的用户行为数据处理装置400的详细描述如下。
基于大数据电商优化的用户行为数据处理装置400,应用于云计算服务器,所述装置400包括:
数据获取模块410,用于获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;
序列确定模块420,用于分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;
子序列确定模块430,用于确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;
数据更新模块440,用于根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
本申请提供了一种云计算服务器,包括:处理器,以及与处理器连接的内存和网络接口;所述网络接口与云计算服务器中的非易失性存储器连接;所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述的方法。
本申请提供了一种应用于计算机的可读存储介质,所述可读存储介质烧录有计算机程序,所述计算机程序在云计算服务器的内存中运行时实现上述的方法。
综上,基于上述方案,每隔预设关联时长间隔,统计一次目标用户行为跟踪数据的候选关联用户行为跟踪数据序列,基于所有候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的所有候选关联跟踪数据子序列中的目标跟踪数据子序列,确定目标用户行为跟踪数据的关联用户行为跟踪数据序列。这可以规避掉在同一用户行为检测项目中频繁采集到同一用户行为跟踪数据的问题,降低了由于多次采集到非关联用户行为跟踪数据,从而将非关联用户行为跟踪数据确定为关联用户行为跟踪数据的概率,提高了确定用户行为跟踪数据的关联用户行为跟踪数据的准确性,进一步地,可以通过关联用户行为跟踪数据对用户行为跟踪数据进行更新,从而确保用户行为跟踪数据在后续挖掘过程中的噪声最小化,提高后续用户行为跟踪数据传递的可靠性。
当然,实施本申请的任一产品或方法并不一定需要同时达到以上所述的所有优点。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围执行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种基于大数据电商优化的用户行为数据处理系统,其特征在于,包括用户行为跟踪服务器和云计算服务器,所述用户行为跟踪服务器和所述云计算服务器通信连接;
所述用户行为跟踪服务器用于:
向所述云计算服务器上传用户行为跟踪数据;
所述云计算服务器具体用于:
获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;
分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;
确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;
根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
2.根据权利要求1所述的系统,其特征在于,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:
获取目标用户行为跟踪数据的目标用户行为跟踪标签;
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;
所述分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长。
3.根据权利要求1所述的系统,其特征在于,所述云计算服务器获取目标用户行为跟踪数据的至少两个目标用户关注波动时长的步骤,包括:
获取目标用户行为跟踪数据的目标用户行为跟踪标签;
根据预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的至少两个目标用户关注波动时长;
所述云计算服务器具体还用于:
根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,确定所述目标用户行为跟踪数据的每个所述目标用户关注波动时长对应的目标用户关注波动状态;
所述云计算服务器分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列的步骤,包括:
根据预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动状态和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系,以及所述目标用户行为跟踪标签,分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,所述候选关联用户行为跟踪数据序列包括用户行为跟踪标签,每个目标用户关注波动时长对应的候选用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔,且每个目标用户关注波动时长对应的候选用户关注波动状态与该目标用户关注波动时长对应的目标用户关注波动状态匹配,所述候选用户关注波动时长为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动时长,所述候选用户关注波动状态为该目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪标签对应的用户关注波动状态。
4.根据权利要求2或3所述的系统,其特征在于,所述云计算服务器获取目标用户行为跟踪数据的目标用户行为跟踪标签的步骤,包括:
从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签;
若未确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则确定所述待定用户行为跟踪标签为目标用户行为跟踪标签;
若已确定所述待定用户行为跟踪标签所表征用户行为跟踪数据的关联用户行为跟踪数据,则重新执行所述从预先储存的用户行为跟踪标签和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,获取统计时长段内的用户关注波动时长对应的用户行为跟踪标签,作为待定用户行为跟踪标签的步骤,
其中,所述云计算服务器具体还用于:
提取实时用户行为数据包含的第一用户行为跟踪数据的第一用户行为跟踪数据特征;
从预先储存的用户行为跟踪标签、用户行为跟踪标签所表征用户行为跟踪数据的用户行为跟踪数据特征和用户行为跟踪标签所表征用户行为跟踪数据的用户关注波动时长的映射关系中,检索包括第二用户行为跟踪数据特征的第一映射关系,所述第二用户行为跟踪数据特征与所述第一用户行为跟踪数据特征的相似度大于预设相似度阈值;
若检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,将所述第一映射关系包括的用户行为跟踪标签作为所述第一用户行为跟踪数据的第一用户行为跟踪标签,储存所述第一用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第二映射关系;
若未检索到,则将所述实时用户行为数据的实时时长作为所述第一用户行为跟踪数据的第一用户关注波动时长,为所述第一用户行为跟踪数据分配第二用户行为跟踪标签,并储存所述第二用户行为跟踪标签、所述第一用户行为跟踪数据特征和第一用户关注波动时长的第三映射关系。
5.根据权利要求1所述的系统,其特征在于,所述云计算服务器具体还用于:
若所有所述候选关联用户行为跟踪数据序列中每个子序列的用户关注波动频率均小于所述预设关联阈值,则获取预先储存的所述目标用户行为跟踪数据的历史候选关联用户行为跟踪数据序列;
确定所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有历史候选关联跟踪数据子序列中的目标跟踪数据子序列,所述历史候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列和所述历史候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的;
根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
6.根据权利要求1所述的系统,其特征在于,所述云计算服务器根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列的步骤,包括:
若所确定的目标跟踪数据子序列的数量为一个,则将所确定的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;
若所确定的目标跟踪数据子序列的数量为多个,则将所确定的目标跟踪数据子序列的并序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列分别作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列,或将所确定的目标跟踪数据子序列中包括元素数量最多的目标跟踪数据子序列作为所述目标用户行为跟踪数据的关联用户行为跟踪数据序列。
7.根据权利要求1所述的系统,其特征在于,所述云计算服务器具体还用于:
采用所述关联用户行为跟踪数据序列对所述目标用户行为跟踪数据进行更新。
8.一种基于大数据电商优化的用户行为数据处理方法,其特征在于,应用于云计算服务器,所述方法包括:
获取目标用户行为跟踪数据的至少两个目标用户关注波动时长,相邻两个所述目标用户关注波动时长的间隔大于或等于预设统计时长间隔;
分别确定每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列,其中,每个目标用户关注波动时长对应的候选关联用户行为跟踪数据序列包括的用户行为跟踪数据的用户关注波动时长与该目标用户关注波动时长的间隔小于或等于预设关联时长间隔;
确定所有所述候选关联用户行为跟踪数据序列的候选关联跟踪数据子序列中的目标跟踪数据子序列,所述候选关联跟踪数据子序列为所有所述候选关联用户行为跟踪数据序列的所有子序列中,用户关注波动频率大于或等于预设关联阈值的子序列,所述目标跟踪数据子序列不是任一所述候选关联跟踪数据子序列的子序列;
根据所确定的目标跟踪数据子序列,确定所述目标用户行为跟踪数据的关联用户行为跟踪数据序列;其中,所述关联用户行为跟踪数据序列用于对目标用户行为跟踪数据进行更新。
9.一种云计算服务器,其特征在于,包括:
处理器,以及
与处理器连接的内存和网络接口;
所述网络接口与云计算服务器中的非易失性存储器连接;
所述处理器在运行时通过所述网络接口从所述非易失性存储器中调取计算机程序,并通过所述内存运行所述计算机程序,以执行上述权利要求8所述的方法。
10.一种应用于计算机的可读存储介质,其特征在于,所述可读存储介质烧录有计算机程序,所述计算机程序在云计算服务器的内存中运行时实现上述权利要求8所述的方法。
CN202210571964.6A 2022-05-25 2022-05-25 基于大数据电商优化的用户行为数据处理方法及系统 Active CN114817225B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210571964.6A CN114817225B (zh) 2022-05-25 2022-05-25 基于大数据电商优化的用户行为数据处理方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210571964.6A CN114817225B (zh) 2022-05-25 2022-05-25 基于大数据电商优化的用户行为数据处理方法及系统

Publications (2)

Publication Number Publication Date
CN114817225A true CN114817225A (zh) 2022-07-29
CN114817225B CN114817225B (zh) 2023-03-28

Family

ID=82517446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210571964.6A Active CN114817225B (zh) 2022-05-25 2022-05-25 基于大数据电商优化的用户行为数据处理方法及系统

Country Status (1)

Country Link
CN (1) CN114817225B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102291251A (zh) * 2011-04-28 2011-12-21 大连亿创天地科技发展有限公司 一种用于互联网网站的用户状态跟踪方法及系统
US20160352760A1 (en) * 2015-05-28 2016-12-01 Cisco Technology, Inc. Tracking Users over Network Hosts Based on User Behavior
CN106202482A (zh) * 2016-07-18 2016-12-07 浪潮(北京)电子信息产业有限公司 一种基于用户行为分析的网站优化方法及系统
CN106339948A (zh) * 2016-08-26 2017-01-18 微梦创科网络科技(中国)有限公司 一种基于社交网络的关联用户的挖掘方法及装置
CN106960014A (zh) * 2017-03-02 2017-07-18 合网络技术(北京)有限公司 关联用户推荐方法及装置
CN107330459A (zh) * 2017-06-28 2017-11-07 联想(北京)有限公司 一种数据处理方法、装置和电子设备
CN108062415A (zh) * 2018-01-02 2018-05-22 武汉斗鱼网络科技有限公司 用户行为的统计方法、装置及终端设备
CN110008248A (zh) * 2014-02-21 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法和装置
CN112163008A (zh) * 2020-09-28 2021-01-01 邓燕平 基于大数据分析的用户行为数据处理方法及云计算平台
CN112561565A (zh) * 2020-11-27 2021-03-26 四川新网银行股份有限公司 一种基于行为日志的用户需求识别方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102291251A (zh) * 2011-04-28 2011-12-21 大连亿创天地科技发展有限公司 一种用于互联网网站的用户状态跟踪方法及系统
CN110008248A (zh) * 2014-02-21 2019-07-12 阿里巴巴集团控股有限公司 一种数据处理方法和装置
US20160352760A1 (en) * 2015-05-28 2016-12-01 Cisco Technology, Inc. Tracking Users over Network Hosts Based on User Behavior
CN106202482A (zh) * 2016-07-18 2016-12-07 浪潮(北京)电子信息产业有限公司 一种基于用户行为分析的网站优化方法及系统
CN106339948A (zh) * 2016-08-26 2017-01-18 微梦创科网络科技(中国)有限公司 一种基于社交网络的关联用户的挖掘方法及装置
CN106960014A (zh) * 2017-03-02 2017-07-18 合网络技术(北京)有限公司 关联用户推荐方法及装置
CN107330459A (zh) * 2017-06-28 2017-11-07 联想(北京)有限公司 一种数据处理方法、装置和电子设备
CN108062415A (zh) * 2018-01-02 2018-05-22 武汉斗鱼网络科技有限公司 用户行为的统计方法、装置及终端设备
CN112163008A (zh) * 2020-09-28 2021-01-01 邓燕平 基于大数据分析的用户行为数据处理方法及云计算平台
CN112561565A (zh) * 2020-11-27 2021-03-26 四川新网银行股份有限公司 一种基于行为日志的用户需求识别方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
赵钧等: "电信运营商大数据业务创新模式", 《电信科学》 *

Also Published As

Publication number Publication date
CN114817225B (zh) 2023-03-28

Similar Documents

Publication Publication Date Title
US11182223B2 (en) Dataset connector and crawler to identify data lineage and segment data
US8370359B2 (en) Method to perform mappings across multiple models or ontologies
WO2018144897A1 (en) Method, apparatus, and system for data analytics model selection for real-time data visualization
EP3619649A1 (en) Analyzing sequence data using neural networks
US20130238619A1 (en) Data processing system, and data processing device
US20110029517A1 (en) Global and topical ranking of search results using user clicks
CN111709765A (zh) 一种用户画像评分方法、装置和存储介质
CN104115145A (zh) 生成表示满足搜索准则的对象中的内容实例的标签的显示组的可视化
CN107111625A (zh) 实现数据的高效分类和探索的方法和系统
US20170109639A1 (en) General Model for Linking Between Nonconsecutively Performed Steps in Business Processes
US11537498B2 (en) Techniques for detecting atypical events in event logs
CN111427974A (zh) 数据质量评估管理方法和装置
CN103995828B (zh) 一种云存储日志数据分析方法
US7797264B2 (en) Detecting and displaying exceptions in tabular data
KR20110067647A (ko) 이상 속성을 포함하는 데이터의 검출 방법 및 장치
CN110532492A (zh) 一种论坛数据管理分类系统及方法
CN114862520A (zh) 产品推荐方法、装置、计算机设备及存储介质
CN116383193A (zh) 一种数据管理方法、装置、电子设备和存储介质
CN111950623B (zh) 数据稳定性监控方法、装置、计算机设备及介质
CN114817225B (zh) 基于大数据电商优化的用户行为数据处理方法及系统
CN111078870A (zh) 评价数据处理方法、装置、介质和计算机设备
US20220050884A1 (en) Utilizing machine learning models to automatically generate a summary or visualization of data
Abdelaal et al. SAGED: Few-Shot Meta Learning for Tabular Data Error Detection.
CN113674065A (zh) 基于服务触点的业务推荐方法、装置、电子设备及介质
CN113781068A (zh) 线上问题解决方法、装置、电子设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230109

Address after: 530200 Dashatan Development Zone, Liangqing District, Nanning City, Guangxi Zhuang Autonomous Region

Applicant after: Zhao Jianwu

Address before: 530200 no.181 Jinsha Avenue, dashatan Development Zone, Liangqing District, Nanning City, Guangxi Zhuang Autonomous Region

Applicant before: Guangxi Runjia Internet Technology Co.,Ltd.

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230308

Address after: 518000 2701-2702, Block A, Building 10, Shenzhen Bay Science and Technology Ecological Park, No. 10, Gaoxin South 9th Road, High tech Zone Community, Yuehai Street, Nanshan District, Shenzhen, Guangdong

Applicant after: Shenzhen Shengsheng Technology Co.,Ltd.

Address before: 530200 Dashatan Development Zone, Liangqing District, Nanning City, Guangxi Zhuang Autonomous Region

Applicant before: Zhao Jianwu

GR01 Patent grant
GR01 Patent grant