CN115496525B - 一种基于大数据的信息处理系统及方法 - Google Patents

一种基于大数据的信息处理系统及方法 Download PDF

Info

Publication number
CN115496525B
CN115496525B CN202211086023.XA CN202211086023A CN115496525B CN 115496525 B CN115496525 B CN 115496525B CN 202211086023 A CN202211086023 A CN 202211086023A CN 115496525 B CN115496525 B CN 115496525B
Authority
CN
China
Prior art keywords
user
account
users
commodity
acquiring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211086023.XA
Other languages
English (en)
Other versions
CN115496525A (zh
Inventor
吕海军
孙雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Guolian Video Information Technology Co ltd
Original Assignee
Beijing Guolian Video Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Guolian Video Information Technology Co ltd filed Critical Beijing Guolian Video Information Technology Co ltd
Priority to CN202211086023.XA priority Critical patent/CN115496525B/zh
Publication of CN115496525A publication Critical patent/CN115496525A/zh
Application granted granted Critical
Publication of CN115496525B publication Critical patent/CN115496525B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Data Mining & Analysis (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于大数据的信息处理系统及方法,属于互联网技术领域。通过获取历史数据中注册用户的交互信息,根据交互信息构建基础用户数据库和关联用户数据库;根据基础用户数据库,获取基础用户的稳定性指数;根据关联用户数据库,获取关联用户的受影响指数;根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度;根据用户消费信度,建立商品产量预测模型,进而实时预测商品的产量,使互联网企业精准的控制商品生产量,避免产能严重不足或者过剩。

Description

一种基于大数据的信息处理系统及方法
技术领域
本发明涉及互联网技术领域,具体为一种基于大数据的信息处理系统及方法。
背景技术
我国互联网企业发展非常迅速,已经成为国民经济重要增长点。在竞争激烈的微利时代,互联网企业盈利的重要手段是降低生产、运营和管理的成本。目前互联网企业在生产、运营和管理方面存在较多的问题,例如缺乏系统性,缺少商品结合市场的方向性,以及在商品生命周期的各个阶段中的效应上缺少长期性和持续性。现实中,而互联网企业的发展最终面向的是市场和用户,通过对用户在消费过程中产生的多个维度的数据进行挖掘和分析,能够有效的避免上述问题,提高互联网企业的运营和管理效率,精准的控制商品生产量,避免产能严重不足或者过剩。
发明内容
本发明的目的在于提供一种基于大数据的信息处理系统及方法,以解决上述背景技术中提出的问题。
为了解决上述技术问题,本发明提供如下技术方案:
一种基于大数据的信息处理方法,本方法包括以下步骤:
步骤S100:获取历史数据中注册用户的交互信息,根据所述交互信息构建基础用户数据库和关联用户数据库;
步骤S200:根据所述基础用户数据库,获取基础用户的稳定性指数;根据所述关联用户数据库,获取关联用户的受影响指数;
步骤S300:根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度;
步骤S400:根据所述用户消费信度,建立商品产量预测模型,进而实时预测商品的产量。
进一步的,根据所述交互信息构建基础用户数据库和关联用户数据库的具体实施过程包括:
步骤S101:获取历史数据中的注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;
步骤S102:提取注册用户中关注IP账号的用户的交互信息;获取历史数据中商品发布的时间段,记为i;获取所述商品发布的时间段的时长,记为Ti;获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;建立用户忠诚度评价模型,具体计算公式如下:
Figure BDA0003835106410000021
其中,n表示商品发布的总次数,G表示用户忠诚度;
步骤S103:设置忠诚度阈值,将大于忠诚度阈值的的关注IP账号的用户筛选出来,同时将筛选出来的用户和该用户的交互信息存储在所述基础用户数据库;
根据上述方法,互联网企业商品生命周期在导入、成长、成熟、衰退等阶段中表现特征各不相同,通过用户留言次数、用户互动次数、用户购买商品次数、用户关注IP账号时长、关注IP账号的用户和没有关注IP账号的用户等多个维度进行数据挖掘和分析,有利于互联网企业全方位精准的把控商品的生产量;公式
Figure BDA0003835106410000022
表示用户在商品发布时间段期间对该商品的关注持续度,公式
Figure BDA0003835106410000023
表示用户在商品发布时间段期间每次互动的持续时间,持续时间越长表示该用户对商品的兴趣程度越大;通过公式
Figure BDA0003835106410000024
来综合评价在商品发布时间段期间用户的活跃度;公式
Figure BDA0003835106410000025
表示用户对商品的认可程度,在用户关注IP账号期间,购买商品的次数越多,对商品的留言次数越多,表示该用户对商品的认可程度越大;公式
Figure BDA0003835106410000026
表示用户的忠诚度;
步骤S104:提取基础用户数据库中的关注IP账号的用户和用户的交互信息;获取某个没有关注IP账号的用户在某个商品发布的时间段的停留时长,记为Ai;获取没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,具体计算公式如下:
Figure BDA0003835106410000027
其中,P表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,Mij表示第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时长,Bij表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时间段的重合停留时长,mi表示基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数;
设置关联指数阈值P0,将P≥P0的没有关注IP账号的用户存储在所述关联用户数据库;
根据上述方法,公式
Figure BDA0003835106410000031
表示没有关注IP账号的用户在商品发布时间段期间对该商品的关注持续度;公式
Figure BDA0003835106410000032
表示当基础用户在关注商品时,没有关注IP账号的用户与基础用户的重合时长关系;公式
Figure BDA0003835106410000033
来综合评价在商品发布时间段期间没有关注IP账号的用户与基础用户的关联程度,通过与基础用户关联比较,能够在非常多的用户中快速筛选出具有消费潜力的用户;
步骤S105:根据步骤S102中用户忠诚度评价模型计算公式对基础用户数据库进行实时更新;根据步骤S104中关联指数计算公式对关联用户数据库进行实时更新。
进一步的,根据所述基础用户数据库,获取基础用户的稳定性指数,以及根据所述关联用户数据库,获取关联用户的受影响指数的具体实施过程包括:
步骤S201:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000034
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000035
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
Figure BDA0003835106410000036
获取基础用户的稳定性指数,具体计算公式如下:
Figure BDA0003835106410000037
其中,Q1表示基础用户的稳定性指数;
根据上述方法,在互联网企业运营管理中,难免会有关注IP账号的用户的流失和增加;通过对每一次商品发布期间基础用户的变化来获取基础用户的稳定性指数,能够综合判断商品结合市场的方向性有没有出现偏差,使互联网企业能够及时调整应对策略;
步骤S202:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000041
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000042
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
Figure BDA0003835106410000043
获取关联用户的受影响指数,具体计算公式如下:
Figure BDA0003835106410000044
其中,Q2表示关联用户的受影响指数,vi表示关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数;
根据上述方法,通过基础用户关联得到那些关注IP账号的用户,进一步分析这些用户参与购买的贡献值;在每一次商品发布前后,关联数据库中的用户是在变化的,再进一步分析这些用户的购买情况,能够反应这些用户的潜力值,有利于分析观察在商品生命周期的各个阶段中的效应上的长期性和持续性。
进一步的,根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度的具体计算公式如下:
Figure BDA0003835106410000045
其中,X表示用户消费信度。
进一步的,根据所述用户消费信度,建立商品产量预测模型的具体计算公式如下:
Figure BDA0003835106410000046
其中,Y表示商品的产量,
Figure BDA0003835106410000047
为调节系数且
Figure BDA0003835106410000048
Yi为第i个商品发布的时间段的商品产量,m表示当前时间节点基础用户数据库中关注IP账号的用户的总人数,v表示当前时间节点关联用户数据库中未关注IP账号的用户的总人数;
根据上述方法,基础用户的稳定性指数和关联用户的受影响指数随着基础用户数据库和关联用户数据库的更新而变化,进而用户消费信度在不同的商品发布期间也呈现出不同;以当前时间为节点,以历史数据为基础,能够综合且系统的分析出用户的消费意愿的变化,进而实时预测商品的产量,使互联网企业精准的控制商品生产量,避免产能严重不足或者过剩。
一种基于大数据的信息处理系统,本系统包括:数据采集模块、数据库模块、数据处理模块和产量预测模型模块;
所述数据采集模块,用于采集注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;用于获取商品发布的时间段,记为i,用于获取商品发布的总次数,记为n;用于筛选关注IP账号的用户;
所述数据库模块,用于存储经过筛选后的关注IP账号的用户交互信息和没有关注IP账号的用户交互信息;用于对基础用户数据库和关联用户数据库进行实时更新;
所述数据处理模块,用于获取基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数,记为mi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000051
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000052
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
Figure BDA0003835106410000053
用于获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为vi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000054
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000055
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
Figure BDA0003835106410000056
所述产量预测模型模块,用于实时预测商品的产量。
进一步的,所述数据采集模块还包括数据采集单元和用户忠诚度评价模型单元;
所述数据采集单元,用于采集注册用户的交互信息;用于获取商品发布的时间段,记为i;用于获取所述商品发布的时间段的时长,记为Ti;用于获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;用于将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;
所述用户忠诚度评价模型单元,用于筛选关注IP账号的用户;用于构建用户忠诚度评价模型
Figure BDA0003835106410000057
进一步的,所述数据库模块还包括基础用户数据库单元、关联用户数据库单元和数据更新单元;
所述基础用户数据库单元,用于存储经过筛选后的关注IP账号的用户交互信息;
所述关联用户数据库单元,用于根据基础用户数据库中关注IP账号的用户交互信息,获取与基础用户数据库中关注IP账号的用户相关联的没有关注IP账号的用户;
所述数据更新单元,用于对基础用户数据库和关联用户数据库进行实时更新。
进一步的,所述数据处理模块还包括稳定性指数计算单元、受影响指数计算单元和用户消费信度计算单元;
所述稳定性指数计算单元,用于获取基础用户的稳定性指数
Figure BDA0003835106410000061
所述受影响指数计算单元,用于获取关联用户的受影响指数
Figure BDA0003835106410000062
所述用户消费信度计算单元,用于根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度
Figure BDA0003835106410000063
与现有技术相比,本发明所达到的有益效果是:本发明提供的一种基于大数据的信息处理系统及方法中,通过获取历史数据中注册用户的交互信息,根据交互信息构建基础用户数据库和关联用户数据库;考虑到互联网企业商品生命周期在导入、成长、成熟、衰退等阶段中表现特征各不相同,通过用户留言次数、用户互动次数、用户购买商品次数、用户关注IP账号时长、关注IP账号的用户和没有关注IP账号的用户等多个维度进行数据挖掘和分析,有利于互联网企业全方位精准的把控商品的生产量;
进而,根据基础用户数据库,获取基础用户的稳定性指数,能够有效的筛查出长期没有活跃度的虚假用户,使互联网企业对用户的分析更加精确;根据关联用户数据库,获取关联用户的受影响指数,能够使互联网企业挖掘出更多具有消费潜力的用户;根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度,能够使互联网企业分析出不同时间端用户消费的可能性程度,进一步提高互联网企业运营和管理的效率;根据用户消费信度,建立商品产量预测模型,进而实时预测商品的产量,使互联网企业精准的控制商品生产量,避免产能严重不足或者过剩。
附图说明
附图用来提供对本发明的进一步理解,并且且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并且不构成对本发明的限制。在附图中:
图1是本发明一种基于大数据的信息处理系统的结构示意图;
图2是本发明一种基于大数据的信息处理方法的流程示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-图2,本发明提供技术方案:
请参阅图1,在本实施例一中:提供一种基于大数据的信息处理系统,本系统包括:数据采集模块、数据库模块、数据处理模块和产量预测模型模块;
数据采集模块,用于采集注册用户的交互信息,其中,注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;用于获取商品发布的时间段,记为i,用于获取商品发布的总次数,记为n;用于筛选关注IP账号的用户;
数据库模块,用于存储经过筛选后的关注IP账号的用户交互信息和没有关注IP账号的用户交互信息;用于对基础用户数据库和关联用户数据库进行实时更新;
数据处理模块,用于获取基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数,记为mi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000071
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000072
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
Figure BDA0003835106410000073
用于获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为vi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000074
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000075
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
Figure BDA0003835106410000076
产量预测模型模块,用于实时预测商品的产量。
在上述系统中,数据采集模块还包括数据采集单元和用户忠诚度评价模型单元;
数据采集单元,用于采集注册用户的交互信息;用于获取商品发布的时间段,记为i;用于获取商品发布的时间段的时长,记为Ti;用于获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;用于将用户购买商品次数记为k;将用户关注IP账号时长记为w;将用户留言次数记为l;
用户忠诚度评价模型单元,用于筛选关注IP账号的用户;用于构建用户忠诚度评价模型
Figure BDA0003835106410000081
在上述系统中,数据库模块还包括基础用户数据库单元、关联用户数据库单元和数据更新单元;
基础用户数据库单元,用于存储经过筛选后的关注IP账号的用户交互信息;
关联用户数据库单元,用于根据基础用户数据库中关注IP账号的用户交互信息,获取与基础用户数据库中关注IP账号的用户相关联的没有关注IP账号的用户;
数据更新单元,用于对基础用户数据库和关联用户数据库进行实时更新。
在上述系统中,数据处理模块还包括稳定性指数计算单元、受影响指数计算单元和用户消费信度计算单元;
稳定性指数计算单元,用于获取基础用户的稳定性指数
Figure BDA0003835106410000082
受影响指数计算单元,用于获取关联用户的受影响指数
Figure BDA0003835106410000083
用户消费信度计算单元,用于根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度
Figure BDA0003835106410000084
请参阅图2,在本实施例二中:
获取历史数据中的注册用户的交互信息,其中,注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;
提取注册用户中关注IP账号的用户的交互信息;获取历史数据中商品发布的时间段,记为i;获取商品发布的时间段的时长,记为Ti;获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;将用户购买商品次数记为k;将用户关注IP账号时长记为w;将用户留言次数记为l;获取商品发布的总次数,记为n;根据用户忠诚度评价模型,计算用户的忠诚度
Figure BDA0003835106410000091
Figure BDA0003835106410000092
例如,获取用户购买商品次数为10,用户留言次数为2,用户关注IP账号时长为100,获取商品发布的时间段有3次,分别获取每一次的商品发布的时间段的时长为120、180和180,分别获取每一次商品发布的时间段的用户的停留时长为20、30和20,分别获取每一次商品发布的时间段的用户的互动次数为5、10和10,则用户的忠诚度
Figure BDA0003835106410000093
Figure BDA0003835106410000094
设置忠诚度阈值,将大于忠诚度阈值的的关注IP账号的用户筛选出来,同时将筛选出来的用户和该用户的交互信息存储在基础用户数据库;对基础用户数据库进行实时更新;
提取基础用户数据库中的关注IP账号的用户和用户的交互信息;获取某个没有关注IP账号的用户在某个商品发布的时间段的停留时长,记为Ai;获取没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数
Figure BDA0003835106410000095
其中,P表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,Mij表示第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时长,Bij表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时间段的重合停留时长,mi表示基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数;
设置关联指数阈值P0,将P≥P0的没有关注IP账号的用户存储在关联用户数据库;对关联用户数据库进行实时更新;
获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为
Figure BDA0003835106410000096
获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为
Figure BDA0003835106410000097
获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为
Figure BDA0003835106410000098
获取基础用户的稳定性指数
Figure BDA0003835106410000099
Figure BDA00038351064100000910
获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为
Figure BDA00038351064100000911
获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为
Figure BDA00038351064100000912
获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
Figure BDA00038351064100000913
获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为vi;获取关联用户的受影响指数
Figure BDA0003835106410000101
Figure BDA0003835106410000102
获取用户消费信度
Figure BDA0003835106410000103
预测商品产量
Figure BDA0003835106410000104
其中,
Figure BDA0003835106410000105
为调节系数且
Figure BDA0003835106410000106
Yi为第i个商品发布的时间段的商品产量,m表示当前时间节点基础用户数据库中关注IP账号的用户的总人数,v表示当前时间节点关联用户数据库中未关注IP账号的用户的总人数;例如,获取当前时间节点基础用户数据库中关注IP账号的用户的总人数为50,当前时间节点关联用户数据库中未关注IP账号的用户的总人数为100,用户消费信度为0.6,调节系数为5,预测商品产量Y=5×(50+100)×0.6=450,则在下一次商品发布之前,商品生产量为450。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并且不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (5)

1.一种基于大数据的信息处理方法,其特征在于,该方法包括以下步骤:
步骤S100:获取历史数据中注册用户的交互信息,根据所述交互信息构建基础用户数据库和关联用户数据库;
步骤S200:根据所述基础用户数据库,获取基础用户的稳定性指数;根据所述关联用户数据库,获取关联用户的受影响指数;
步骤S300:根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度;
步骤S400:根据所述用户消费信度,建立商品产量预测模型,进而实时预测商品的产量;
根据所述交互信息构建基础用户数据库和关联用户数据库的具体实施过程包括:
步骤S101:获取历史数据中的注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;
步骤S102:提取注册用户中关注IP账号的用户的交互信息;获取历史数据中商品发布的时间段,记为i;获取所述商品发布的时间段的时长,记为Ti;获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;建立用户忠诚度评价模型,具体计算公式如下:
其中,n表示商品发布的总次数,G表示用户忠诚度;
步骤S103:设置忠诚度阈值,将大于忠诚度阈值的的关注IP账号的用户筛选出来,同时将筛选出来的用户和该用户的交互信息存储在所述基础用户数据库;
步骤S104:提取基础用户数据库中的关注IP账号的用户和用户的交互信息;获取某个没有关注IP账号的用户在某个商品发布的时间段的停留时长,记为Ai;获取没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,具体计算公式如下:
其中,P表示没有关注IP账号的用户与基础用户数据库中的关注IP账号的用户的关联指数,Mij表示第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时长,Bij表示没有关注IP账号的用户与第j个基础用户数据库中的关注IP账号的用户在第i个商品发布的时间段的停留时间段的重合停留时长,mi表示基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数;
设置关联指数阈值P0,将P≥P0的没有关注IP账号的用户存储在所述关联用户数据库;
步骤S105:根据步骤S102中用户忠诚度评价模型计算公式对基础用户数据库进行实时更新;根据步骤S104中关联指数计算公式对关联用户数据库进行实时更新;
根据所述基础用户数据库,获取基础用户的稳定性指数,以及根据所述关联用户数据库,获取关联用户的受影响指数的具体实施过程包括:
步骤S201:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为获取基础用户的稳定性指数,具体计算公式如下:
其中,Q1表示基础用户的稳定性指数;
步骤S202:获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为获取关联用户的受影响指数,具体计算公式如下:
其中,Q2表示关联用户的受影响指数,vi表示关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数;
根据所述基础用户的稳定性指数和所述关联用户的受影响指数,获取用户消费信度的具体计算公式如下:
其中,X表示用户消费信度;
根据所述用户消费信度,建立商品产量预测模型的具体计算公式如下:
其中,Y表示商品的产量,为调节系数且Yi为第i个商品发布的时间段的商品产量,m表示当前时间节点基础用户数据库中关注IP账号的用户的总人数,v表示当前时间节点关联用户数据库中未关注IP账号的用户的总人数。
2.执行如权利要求1中一种基于大数据的信息处理方法的一种基于大数据的信息处理系统,其特征在于,所述系统包括:数据采集模块、数据库模块、数据处理模块和产量预测模型模块;
所述数据采集模块,用于采集注册用户的交互信息,所述注册用户的交互信息包括用户留言次数、用户互动次数、用户购买商品次数和用户关注IP账号时长;其中,注册用户包括关注IP账号的用户和没有关注IP账号的用户;用于获取商品发布的时间段,记为i,用于获取商品发布的总次数,记为n;用于筛选关注IP账号的用户;
所述数据库模块,用于存储经过筛选后的关注IP账号的用户交互信息和没有关注IP账号的用户交互信息;用于对基础用户数据库和关联用户数据库进行实时更新;
所述数据处理模块,用于获取基础用户数据库中的第i个商品发布的时间段的关注IP账号的用户的总人数,记为mi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的减少人数,记为获取该次商品发布时间段前基础用户数据库中关注IP账号的用户的增加人数,记为获取该次商品发布时间段后,基础用户数据库中参与购买的关注IP账号的用户的人数,记为用于获取关联用户数据库中第i个商品发布的时间段的未关注IP账号的用户的总人数,记为vi;用于获取历史数据中某一次商品发布的时间段,获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的减少人数,记为获取该次商品发布时间段前关联用户数据库中未关注IP账号的用户的增加人数,记为获取该次商品发布时间段后,关联用户数据库中参与购买的未关注IP账号的用户的人数,记为
所述产量预测模型模块,用于实时预测商品的产量。
3.根据权利要求2所述的一种基于大数据的信息处理系统,其特征在于:所述数据采集模块还包括数据采集单元和用户忠诚度评价模型单元;
所述数据采集单元,用于采集注册用户的交互信息;用于获取商品发布的时间段,记为i;用于获取所述商品发布的时间段的时长,记为Ti;用于获取商品发布的时间段中关注IP账号的用户的停留时长和用户互动次数,并且分别将所述关注IP账号的用户的停留时长记为ti和用户互动次数记为ci;用于将所述用户购买商品次数记为k;将所述用户关注IP账号时长记为w;将所述用户留言次数记为l;
所述用户忠诚度评价模型单元,用于筛选关注IP账号的用户;用于构建用户忠诚度评价模型
4.根据权利要求3所述的一种基于大数据的信息处理系统,其特征在于:所述数据库模块还包括基础用户数据库单元、关联用户数据库单元和数据更新单元;
所述基础用户数据库单元,用于存储经过筛选后的关注IP账号的用户交互信息;
所述关联用户数据库单元,用于根据基础用户数据库中关注IP账号的用户交互信息,获取与基础用户数据库中关注IP账号的用户相关联的没有关注IP账号的用户;
所述数据更新单元,用于对基础用户数据库和关联用户数据库进行实时更新。
5.根据权利要求4所述的一种基于大数据的信息处理系统,其特征在于:所述数据处理模块还包括稳定性指数计算单元、受影响指数计算单元和用户消费信度计算单元;
所述稳定性指数计算单元,用于获取基础用户的稳定性指数
所述受影响指数计算单元,用于获取关联用户的受影响指数
所述用户消费信度计算单元,用于根据基础用户的稳定性指数和关联用户的受影响指数,获取用户消费信度
CN202211086023.XA 2022-09-06 2022-09-06 一种基于大数据的信息处理系统及方法 Active CN115496525B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211086023.XA CN115496525B (zh) 2022-09-06 2022-09-06 一种基于大数据的信息处理系统及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211086023.XA CN115496525B (zh) 2022-09-06 2022-09-06 一种基于大数据的信息处理系统及方法

Publications (2)

Publication Number Publication Date
CN115496525A CN115496525A (zh) 2022-12-20
CN115496525B true CN115496525B (zh) 2023-04-28

Family

ID=84468862

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211086023.XA Active CN115496525B (zh) 2022-09-06 2022-09-06 一种基于大数据的信息处理系统及方法

Country Status (1)

Country Link
CN (1) CN115496525B (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20150332414A1 (en) * 2014-05-13 2015-11-19 Mastercard International Incorporated System and method for predicting items purchased based on transaction data
CN108205768B (zh) * 2016-12-20 2022-07-05 百度在线网络技术(北京)有限公司 数据库建立方法和数据推荐方法及装置、设备和存储介质
CN113468194B (zh) * 2021-07-02 2022-03-22 广东蕾特恩科技发展有限公司 一种基于大数据的客户关系管理数据更新系统及方法

Also Published As

Publication number Publication date
CN115496525A (zh) 2022-12-20

Similar Documents

Publication Publication Date Title
CN106960359B (zh) 一种基于流式计算的全自动竞价优化方法及系统
CN114118691A (zh) 基于业务量的排班方案处理方法、装置、设备和介质
Radhakrishnan et al. Inventory optimization in supply chain management using genetic algorithm
CN114971356A (zh) 一种电力工程项目进度预测系统及方法
CN112232949B (zh) 基于区块链的借贷风险的预测方法和装置
CN112884590A (zh) 基于机器学习算法的电网企业融资决策方法
Jiang et al. Multiple precast component orders acceptance and scheduling
CN116468536A (zh) 一种自动化风险控制规则生成的方法
Shi Application of the model combining demand forecasting and inventory decision in feature based newsvendor problem
El-Kholy A multi-objective fuzzy linear programming model for cash flow management
CN115496525B (zh) 一种基于大数据的信息处理系统及方法
CN112884534A (zh) 一种收益法估值模型
Noorul Haq et al. Effect of forecasting on the multi-echelon distribution inventory supply chain cost using neural network, genetic algorithm and particle swarm optimisation
CN115587865B (zh) 基于风险映射的土地价格评估方法、计算设备及存储介质
KR102457018B1 (ko) 기업 인큐베이팅 시스템
TWI792101B (zh) 基於確定值及預測值的數據定量化方法
CN114971688A (zh) 一种基于组合模型的供应链生产预测方法
CN113657945A (zh) 用户价值预测方法、装置、电子设备和计算机存储介质
CN113743994A (zh) 一种供应商的旺季预测方法、系统、设备及存储介质
Yang et al. Dynamically optimizing display advertising profits under diverse budget settings
Zubrii et al. Forecasting real option price model by means of evolutionary and genetic algorithms
CN117557346B (zh) 一种基于动态消费数据的全链路智能商业决策分析方法
CN114387075A (zh) 一种企业信贷策略查询方法及系统
Iurasov et al. Study of different data science methods for demand prediction and replenishment forecasting at retail network
CN117611364A (zh) 投入成本预估偏差测算方法及其系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20230410

Address after: 100085 703, Building 1, No. 1, Shangdi Xinxi Road, Haidian District, Beijing

Applicant after: Beijing Guolian video information technology Co.,Ltd.

Address before: No. 6-21-1, Floor 1-8, No. 177, Dongzhi Road, Daowai District, Harbin, Heilongjiang 150050

Applicant before: Harbin jianweizhishu Technology Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP02 Change in the address of a patent holder
CP02 Change in the address of a patent holder

Address after: 9th Floor, Building 3, Zone 6, No. 188 South Fourth Ring West Road, Fengtai District, Beijing, 100070

Patentee after: Beijing Guolian video information technology Co.,Ltd.

Address before: 100085 703, Building 1, No. 1, Shangdi Xinxi Road, Haidian District, Beijing

Patentee before: Beijing Guolian video information technology Co.,Ltd.