CN115309737A - 访客意向分析方法、系统、终端设备及可读存储介质 - Google Patents
访客意向分析方法、系统、终端设备及可读存储介质 Download PDFInfo
- Publication number
- CN115309737A CN115309737A CN202211237457.5A CN202211237457A CN115309737A CN 115309737 A CN115309737 A CN 115309737A CN 202211237457 A CN202211237457 A CN 202211237457A CN 115309737 A CN115309737 A CN 115309737A
- Authority
- CN
- China
- Prior art keywords
- user behavior
- data
- visitor
- intention
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 27
- 238000004364 calculation method Methods 0.000 claims abstract description 22
- 230000006399 behavior Effects 0.000 claims description 324
- 238000004422 calculation algorithm Methods 0.000 claims description 12
- 238000012545 processing Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000003066 decision tree Methods 0.000 claims description 9
- 238000012549 training Methods 0.000 claims description 9
- 238000012360 testing method Methods 0.000 claims description 6
- 238000009825 accumulation Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 abstract description 7
- 238000011161 development Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000001186 cumulative effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000013145 classification model Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013138 pruning Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000005303 weighing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/22—Indexing; Data structures therefor; Storage structures
- G06F16/2282—Tablespace storage structures; Management thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/54—Interprogram communication
- G06F9/546—Message passing systems or structures, e.g. queues
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2209/00—Indexing scheme relating to G06F9/00
- G06F2209/54—Indexing scheme relating to G06F9/54
- G06F2209/547—Messaging middleware
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Quality & Reliability (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种访客意向分析方法、系统、终端设备及可读存储介质,属于线上访客意向分析领域,该访客意向分析方法包括:获取私域流量的用户行为数据;基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。本申请通过及时获取线上行为数据并进行特征工程处理,再输入到事先训练好的预测模型中,达到了精准、及时地通过线上用户行为数据对访客意向进行预测,充分挖掘数据,从而显著提升线上数据的使用效率,弥补了线下效率低下、效果不明显的短板,助力行业从粗放式管理逐步向精细化管理转变。
Description
技术领域
本发明涉及线上访客意向分析领域,尤其涉及访客意向分析方法、系统、终端设备及可读存储介质。
背景技术
随着互联网技术的不断发展,线上数据在访客运营业务中起到了重要的作用,当前房地产行业增速放缓,房地产市场从增量时代步入存量时代,然而目前房地产行业主要依靠行销、中介等线下渠道拓客,拓客效率低下,拓客效果不显著。为提高线下营销、运营能力吸引客户、成交转化的效率,房地产进行数字化转型,但是现有产品处于发展初期,数字化水平低,集成能力和可拓展能力差,数据挖掘不充分,使用效率低。因此如何通过线上精准拓客成为了房地产线上运营业务亟待解决的问题。
因此,如何精准、及时地通过线上访客行为数据对访客意向进行预测是当前亟待解决的问题。
发明内容
本申请的主要目的在于提供访客意向分析方法、系统、终端设备及可读存储介质,旨在解决如何精准、及时地通过线上访客行为数据对访客意向进行预测的问题。
为实现上述目的,本申请提供访客意向分析方法,应用于线上访客意向分析技术领域,所述访客意向分析方法包括以下步骤:
获取私域流量的用户行为数据;
基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
可选的,所述获取私域流量的用户行为数据的步骤包括:
从预先部署的RocketMQ消息中间件中获取私域流量的用户行为;
从预先得到的用户行为意向度汇总表中获取所述用户的第二历史行为数据;
根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。
可选的,所述基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据的步骤包括:
将所述用户行为数据与通过特征工程确认的行为特征库做匹配,得到匹配成功的用户行为数据作为用户行为特征数据。
可选的,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之前,得到所述预测模型的步骤包括:
从预设的数据库中获取第一历史行为数据;
对所述第一历史行为数据进行标签化处理,得到用户行为标签数据;
基于所述用户行为标签数据和决策树、XGBoost和Lightgbm算法进行模型训练,得到初始预测模型;
通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,得到预测模型。
可选的,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之后还包括:
将所述用户的用户行为进行累加计数,更新到所述用户行为意向度汇总表中;
将所述用户的访客意向度更新到所述用户行为意向度汇总表中;
将所述用户的访客意向度上报到所述消息中间件中。
可选的,所述获取私域流量的用户行为数据的步骤之前还包括:
通过所述消息中间件接收所述私域流量的用户行为数据;
将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表;
对所述用户行为汇总表进行初始化,生成所述用户行为意向度汇总表。
可选的,所述将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表的步骤包括:
从所述消息中间件中获取所有用户行为数据进行数据清洗,将清洗后的数据存储到所述用户行为汇总表中。
本申请实施案例还提出一种访客意向分析系统,所述访客意向分析系统包括:
获取模块,用于获取私域流量的用户行为数据;
处理模块,用于基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
计算模块,用于将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
本申请实施案例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的访客意向分析程序,所述访客意向分析程序被所述处理器执行时实现所述访客意向分析方法的步骤。
本申请实施案例还提出一种可读存储介质,所述可读存储介质上存储有访客意向分析程序,所述访客意向分析程序被处理器执行时实现所述访客意向分析方法的步骤。
本申请提出的访客意向分析方法、系统、终端设备及可读存储介质,通过获取私域流量的用户行为数据;基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。基于本申请方案,实现了通过及时获取线上行为数据并进行特征工程处理,再输入到事先训练好的预测模型中,达到了精准、及时地通过线上用户行为数据对访客意向进行预测的效果。
附图说明
图1为本申请访客意向分析方法所属终端的功能模块示意图;
图2为本申请访客意向分析方法第一示例性实施例的流程示意图;
图3为本申请访客意向分析方法第二示例性实施例的流程示意图;
图4为本申请访客意向分析方法第三示例性实施例的流程示意图;
图5为本申请访客意向分析方法第四示例性实施例的流程示意图;
图6为本申请访客意向分析方法第五示例性实施例的流程示意图;
图7为本申请访客意向分析方法第六示例性实施例的流程示意图;
图8为本申请访客意向分析方法第七示例性实施例的流程示意图;
图9为本申请访客意向分析方法的功能流程图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施案例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例的主要解决方案是:获取私域流量的用户行为数据;基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。基于本方案,实现了通过及时获取线上行为数据并进行特征工程处理,再输入到事先训练好的预测模型中,达到了精准、及时地通过线上访客行为数据对访客意向进行预测的效果。
具体地,参照图1,图1为本申请访客意向分析装置所属终端设备的功能模块示意图。该访客意向分析装置为基于终端设备的、能够通过及时获取线上行为数据进行特征工程处理,再输入到事先训练好的预测模型中,从而达到精准、及时对访客意向进行预测的装置,其可以通过硬件或软件的形式承载于终端设备上。
在本实施例中,该访客意向分析装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。
存储器130中存储有操作系统以及访客意向分析程序,所述访客意向分析装置可以将获取私域流量的用户行为数据;基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度等信息存储于该存储器130中;输出模块110可为显示屏等。通信模块140可以包括WIFI模块、移动通信模块以及蓝牙模块等,通过通信模块140与外部设备或服务器进行通信。
其中,存储器130中的访客意向分析程序,所述访客意向分析程序被处理器执行时实现以下步骤:
获取私域流量的用户行为数据;
基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
从预先部署的RocketMQ消息中间件中获取私域流量的用户行为;
从预先得到的用户行为意向度汇总表中获取所述用户的第二历史行为数据;
根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
将所述用户行为数据与通过特征工程确认的行为特征库做匹配,得到匹配成功的用户行为数据作为用户行为特征数据。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
从预设的数据库中获取第一历史行为数据;
对所述第一历史行为数据进行标签化处理,得到用户行为标签数据;
基于所述用户行为标签数据和决策树、XGBoost和Lightgbm算法进行模型训练,得到初始预测模型;
通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,得到预测模型。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
将所述用户的用户行为进行累加计数,更新到所述用户行为意向度汇总表中;
将所述用户的访客意向度更新到所述用户行为意向度汇总表中;
将所述用户的访客意向度上报到所述消息中间件中。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
通过所述消息中间件接收所述私域流量的用户行为数据;
将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表;
对所述用户行为汇总表进行初始化,生成所述用户行为意向度汇总表。
进一步地,存储器130中的访客意向分析程序被处理器执行时还实现以下步骤:
从所述消息中间件中获取所有用户行为数据进行数据清洗,将清洗后的数据存储到所述用户行为汇总表中。
基于上述终端设备架构但不限于上述架构,提出本申请方法实施例。
参照图2,图2为访客意向预测方法第一示例性实施例的流程示意图。所述访客意向预测方法包括:
步骤S110,获取私域流量的用户行为数据;
具体地,所述私域流量指从公域网络平台、它域以及私域本身产生的流量用户行为数据,其中它域指如其他业务方的平台引流到私域官网、用户名单。通过对SDK软件、小程序等线上访问操作进行埋点方式获取到的第三业务方、公开数据获取平台、本业务的流量的用户行为数据。
步骤S130,基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
具体地,基于历史行为数据进行数据清洗和缺失值填充、数据转换、特征提取和特征构造、特征选择等特征工程的步骤,选择出有效的用户的行为特征,将步骤S110获取的用户行为数据与通过特征工程确认的行为特征做匹配,得到匹配成功的用户行为数据作为用户行为特征数据,所述行为特征库,生成在此步骤之前即可,即可以在程序运行前生成并以文本文件或数据表等方式存储。
步骤S150,将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
具体地,所述预测模型是基于历史用户行为数据通过多种机器学习算法模型训练得到的,根据用户线上行为进行到访预测,属于有监督的分类模型,将上述预测模型文件部署在实时计算的服务器上,通过接收获取到的用户行为特征数据,输出计算后预测到的访客意向度。
本实施例通过上述方案,具体通过获取私域流量的用户行为数据;基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。基于本方案,通过及时获取用户线上数据并输入到历史用户行为大数据进行机器学习训练得到的预测模型,输出预测的用户意向度与到访的可能性,从而达到了精准、及时的预测用户意向度,充分挖掘数据,显著提升线上数据的使用效率,弥补了现下拓展客户效率低下、效果不明显的短板,助力行业从粗放式管理逐步向精细化管理转变。
进一步地,参照图3,图3为访客意向预测方法第二示例性实施例的流程示意图,所述获取私域流量的用户行为数据的步骤包括:
步骤S1101,从预先部署的RocketMQ消息中间件中获取私域流量的用户行为;
具体地,预先部署的RocketMQ消息中间件支持分布式且写入消息低延迟,满足对用户行为数据及时处理的需求。预先部署的RocketMQ消息中间件从线上业务方接收私域流量的用户的行为进行存储和转发,消费者实例实时拉取用户的用户行为。
步骤S1102,从预先得到的用户行为意向度汇总表中获取所述用户的第二历史行为数据;
具体地,用户行为意向度汇总表汇总了不同用户的不同行为计数和用户意向度,从用户行为意向度汇总表获取到当前用户的第二历史行为数据。
步骤S1103,根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。
具体地,所述第二历史行为数据包括了当前用户不同行为的计数,根据所述用户行为对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。
本实施例通过上述方案,具体通过从预先部署的RocketMQ消息中间件中获取私域流量的用户行为;从预先得到的用户行为意向度汇总表中获取所述用户的第二历史行为数据;根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。基于本方案,通过获取私域流量的用户行为数据,达到了支持海量数据及时获取和消费的目的,为后续访客意向预测提供了数据支持。
进一步地,参照图4,图4为访客意向预测方法第三示例性实施例的流程示意图,所述基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据的步骤包括:
步骤S1301,将所述用户行为数据与通过特征工程确认的行为特征库做匹配,得到匹配成功的用户行为数据作为用户行为特征数据。
具体地,所述通过特征工程确认的用户行为特征是对历史行为数据执行数据清洗和缺失值填充、数据转换、特征提取和特征构造、特征选择等一种或多种特征工程的步骤,选择出有效的用户的行为特征。其中,通过特征工程确认的行为特征在步骤S1301之前执行,具体步骤时序根据实际需要限定。将所述用户行为数据与上述方式得到的行为特征做匹配,将匹配成功的行为数据作为用户行为特征数据。
本实施例通过上述方案,具体通过将所述用户行为数据与通过特征工程确认的行为特征库做匹配,得到匹配成功的用户行为数据作为用户行为特征数据。基于本方案,基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据,避免了数据冗余问题,保证了后续输入预测模型的初始数据的有效性,提高了预测结果的可靠性。
进一步地,参照图5,图5为访客意向预测方法第四示例性实施例的流程示意图,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之前,得到所述预测模型的步骤包括:
步骤S1501,从预设的数据库中获取第一历史行为数据;
具体地,历史行为数据包括了用户历史行为及计数,实际的用户意向。
步骤S1502,对所述第一历史行为数据进行标签化处理,得到用户行为标签数据;
具体地,历史行为数据的标签化处理指通过大数据工具设定规则和/或在埋点时就将用户行为根据预设规则做标签化处理或其他方式,得到用户行为标签数据。
步骤S1503,基于所述用户行为标签数据和决策树、XGBoost和Lightgbm算法进行模型训练,得到初始预测模型;
具体地,所述决策树、XGBoost和Lightgbm都是基于决策树算法原理,根据用户行为标签数据进行划分,确定用户意向度,XGBoost是基于决策树的随机森林算法,对用户行为标签数据进行划分,上述方式通过层级优先分裂策略,导致会产生局部最优解的问题,Lightgbm采用深度优先分裂策略,即每次对叶节点进行分裂时,均考虑了全局的样本,不会造成局部最优解的问题,也减少了后剪枝操作次数的可能,同时根据这三种算法训练模型,得到三种初始预测模型。
步骤S1504,通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,得到预测模型。
具体地,通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,根据业务需要,如用户访问意向预测的精准率和召回率等衡量标准,得到预测模型。
本实施例通过上述方案,具体通过从预设的数据库中获取第一历史行为数据;对所述第一历史行为数据进行标签化处理,得到用户行为标签数据;基于所述用户行为标签数据和决策树、XGBoost和Lightgbm算法进行模型训练,得到初始预测模型;通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,得到预测模型。基于本方案,通过获取历史行为数据,再基于多种算法模型结合业务,得到预测模型,保证了预测的精确度和稳定性,充分挖掘线上数据,显著提升线上数据的使用效果。
进一步地,参照图6,图6为访客意向预测方法第五示例性实施例的流程示意图,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之后还包括:
步骤S151,将所述用户的用户行为进行累加计数,更新到所述用户行为意向度汇总表中;
具体地,从预先部署的RocketMQ消息中间件中获取私域流量的用户行为;
从所述用户行为意向度汇总表中获取所述用户的第二历史行为数据,根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,将所述用户行为及累加计数,更新到所述用户行为意向度汇总表中。
步骤S152,将所述用户的访客意向度更新到所述用户行为意向度汇总表中。
具体地,通过将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度,将将所述用户的访客意向度更新到所述用户行为意向度汇总表中,业务方根据用户意向度确定用户意向,用户意向度汇总表对外提供查询接口,供所需要的业务使用方进行调用。
步骤S153,将所述用户的访客意向度上报到所述消息中间件中。
具体地,将所述用户意向度上报到预先部署的RocketMQ消息中间件,方便需要的业务方及时订阅用户意向度消息。
本实施例通过上述方案,具体通过将所述用户的用户行为进行累加计数,更新到所述用户行为意向度汇总表中;将所述用户的访客意向度更新到所述用户行为意向度汇总表中;将所述用户的访客意向度上报到所述消息中间件中。基于本方案,通过更新用户行为意向度汇总表,从而充分挖掘线上数据,显著提升线上数据的使用效率,弥补了线下拓展客户效率低下、效果不明显的短板,助力行业从粗放式管理逐步向精细化管理转变。
进一步地,参照图7,图7为访客意向预测方法第六示例性实施例的流程示意图,所述获取私域流量的用户行为数据的步骤之前还包括:
步骤S101,通过所述消息中间件接收所述私域流量的用户行为数据;
具体地,从业务方接收私域流量的用户行为数据到预先部署的RocketMQ消息中间件,方便消费者实例获取数据,所述消费者实例实时拉取用户行为数据存储到用户行为汇总表。
步骤S102,将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表;
具体地,所述消息中间件中的用户行为数据实时更新到预设的用户行为汇总表中,所述用户行为汇总表记录了不同用户的多次操作行为。
步骤S103,对所述用户行为汇总表进行初始化,生成所述用户行为意向度汇总表。
具体地,将用户行为汇总表根据用户唯一属性进行划分,并针对每一个用户进行不同行为的次数统计,最终基于用户唯一属性、行为数据、用户意向度字段,生成了用户行为意向度汇总表。
本实施例通过上述方案,具体通过所述消息中间件接收所述私域流量的用户行为数据;将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表;对所述用户行为汇总表进行初始化,生成所述用户行为意向度汇总表。基于本方案,方便后续获取用户历史行为数据,为预测用户意向度提供了数据支持。
进一步地,参照图8,图8为访客意向预测方法第七示例性实施例的流程示意图,所述将所述消息中间件中的用户行为数据存储到所述用户行为汇总表的步骤包括:
步骤S1021,从所述消息中间件中获取所有用户行为数据进行数据清洗,将清洗后的数据存储到所述用户行为汇总表中。
具体地,所述数据清洗包括但不限于去除无效的用户行为数据,保证数据的准确性和有效性,将用户行为数据存储到所述用户行为汇总表中,方便后续获取。
本实施例通过上述方案,具体通过从所述消息中间件中获取所有用户行为数据进行数据清洗,将清洗后的数据存储到所述用户行为汇总表中。基于本方案,通过对用户行为数据进行清洗,并进行存储,方便后续历史用户行为数据的获取,保证了数据的准确性和有效性。
进一步地,参照图9,图9为访客意向预测方法第八示例性实施例的功能流程图,所述访客意向预测方法的功能流程如下所述:
首先,从业务方接收上报的用户行为数据到消息中间件RocketMQ中;
然后,从消息中间件RocketMQ中实时拉取用户行为数据入库存储到用户行为汇总表中;
同时,实时拉去所述消息中间件RocketMQ中的用户行为数据,并根据当前用户从用户行为意向度汇总表中获取当前用户的历史行为数据,并根据本次用户行为进行累加,将最终当前用户行为的汇总结果根据行为特征进行过滤,然后将过滤后的用户行为特征数据输入到预测模型中得到用户意向度预测结果,将预测结果上传到上述消息中间件;将预测结果和本次行为数据更新到用户行为意向度汇总表中;
其中,行为特征、用户行为意向度汇总表、预测模型文件是在执行时提前准备好的,所述行为特征是通过特征工程对从数据库中历史行为数据进行数据清洗和缺失值填充、数据转换、特征提取和特征构造、特征选择等步骤,选择出有效的用户的行为特征;
所述用户行为意向度汇总表是通过对用户行为汇总表中用户的唯一属性进行用户划分,并针对每一个用户进行不同行为的次数统计,最终基于用户唯一属性、行为数据、用户意向度字段,生成了用户行为意向度汇总表。
所述预测模型文件是通过决策树、XGBoost、Lightgbm根据这三种算法对用户历史行为数据进行训练、测试、验证,得到三种预测模型文件,后续可根据业务需求的不同,选取预测结果使用。部署用户意向预测模型文件到服务器,接收用户行为特征,输出用户意向度的预测结果。
此外,本申请实施例还提出一种访客意向预测系统,所述访客意向预测系统包括:
获取模块,用于获取私域流量的用户行为数据;
处理模块,用于基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
计算模块,用于将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
此外,本申请实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的访客意向预测程序,所述访客意向预测程序被所述处理器执行时实现所述访客意向预测方法的步骤。
由于本程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
此外,本申请实施例还提出一种可读存储介质,所述可读存储介质上存储有访客意向分析程序,所述访客意向分析程序被处理器执行时实现如上所述的访客意向分析方法的步骤。
由于本程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个可读存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本申请每个实施例的方法。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
Claims (10)
1.一种访客意向分析方法,其特征在于,所述访客意向分析方法包括以下步骤:
获取私域流量的用户行为数据;
基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
2.根据权利要求1所述的访客意向分析方法,其特征在于,所述基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据的步骤包括:
将所述用户行为数据与通过特征工程确认的行为特征库做匹配,得到匹配成功的用户行为数据作为用户行为特征数据。
3.根据权利要求1所述的访客意向分析方法,其特征在于,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之前,得到所述预测模型的步骤包括:
从预设的数据库中获取第一历史行为数据;
对所述第一历史行为数据进行标签化处理,得到用户行为标签数据;
基于所述用户行为标签数据和决策树、XGBoost和Lightgbm算法进行模型训练,得到初始预测模型;
通过所述第一历史用户行为数据对所述初始预测模型进行测试、验证,得到预测模型。
4.根据权利要求1所述的访客意向分析方法,其特征在于,所述将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度的步骤之后还包括:
将所述用户的用户行为进行累加计数,更新到预先得到的用户行为意向度汇总表中;
将所述用户的访客意向度更新到所述用户行为意向度汇总表中;
将所述用户的访客意向度上报到预先部署的RocketMQ消息中间件中。
5.根据权利要求4所述的访客意向分析方法,其特征在于,所述获取私域流量的用户行为数据的步骤包括:
从所述消息中间件中获取私域流量的用户行为;
从所述用户行为意向度汇总表中获取所述用户的第二历史行为数据;
根据所述用户行为,对所述第二历史行为数据中对应的行为进行累加计数,得到用户行为数据。
6.根据权利要求5所述的访客意向分析方法,其特征在于,所述获取私域流量的用户行为数据的步骤之前还包括:
通过所述消息中间件接收所述私域流量的用户行为数据;
将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表;
对所述用户行为汇总表进行初始化,生成所述用户行为意向度汇总表。
7.根据权利要求6所述的访客意向分析方法,其特征在于,所述将所述消息中间件中的用户行为数据存储到预设的用户行为汇总表的步骤包括:
从所述消息中间件中获取所有用户行为数据进行数据清洗,将清洗后的数据存储到所述用户行为汇总表中。
8.一种访客意向分析系统,其特征在于,所述访客意向分析系统包括:
获取模块,用于获取私域流量的用户行为数据;
处理模块,用于基于预先确认的行为特征库,从所述用户行为数据中提取得到用户行为特征数据;
计算模块,用于将所述用户行为特征数据输入到预先得到的预测模型中进行计算,得到访客意向度。
9.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的访客意向分析程序,所述访客意向分析程序被所述处理器执行时实现如权利要求1-7中任一项所述访客意向分析方法的步骤。
10.一种可读存储介质,其特征在于,所述可读存储介质上存储有访客意向分析程序,所述访客意向分析程序被处理器执行时实现如权利要求1-7中任一项所述访客意向分析方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211237457.5A CN115309737A (zh) | 2022-10-11 | 2022-10-11 | 访客意向分析方法、系统、终端设备及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211237457.5A CN115309737A (zh) | 2022-10-11 | 2022-10-11 | 访客意向分析方法、系统、终端设备及可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115309737A true CN115309737A (zh) | 2022-11-08 |
Family
ID=83868247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211237457.5A Pending CN115309737A (zh) | 2022-10-11 | 2022-10-11 | 访客意向分析方法、系统、终端设备及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115309737A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615128A (zh) * | 2018-12-05 | 2019-04-12 | 重庆锐云科技有限公司 | 房地产客户成交概率预测方法、装置及服务器 |
CN110389970A (zh) * | 2019-06-11 | 2019-10-29 | 中国平安财产保险股份有限公司 | 用户意向预测方法、装置、计算机设备及存储介质 |
CN111681051A (zh) * | 2020-06-08 | 2020-09-18 | 上海汽车集团股份有限公司 | 购买意向度预测方法、装置、存储介质及终端 |
WO2021164232A1 (zh) * | 2020-02-17 | 2021-08-26 | 平安科技(深圳)有限公司 | 用户识别方法、装置、设备及存储介质 |
CN113988195A (zh) * | 2021-10-28 | 2022-01-28 | 广州小鹏汽车科技有限公司 | 一种私域流量线索挖掘方法、装置、车辆、可读介质 |
CN113988190A (zh) * | 2021-10-29 | 2022-01-28 | 平安科技(深圳)有限公司 | 客户意向分析方法、装置、设备及存储介质 |
CN115099326A (zh) * | 2022-06-20 | 2022-09-23 | 中国平安财产保险股份有限公司 | 基于人工智能的行为预测方法、装置、设备及存储介质 |
-
2022
- 2022-10-11 CN CN202211237457.5A patent/CN115309737A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615128A (zh) * | 2018-12-05 | 2019-04-12 | 重庆锐云科技有限公司 | 房地产客户成交概率预测方法、装置及服务器 |
CN110389970A (zh) * | 2019-06-11 | 2019-10-29 | 中国平安财产保险股份有限公司 | 用户意向预测方法、装置、计算机设备及存储介质 |
WO2021164232A1 (zh) * | 2020-02-17 | 2021-08-26 | 平安科技(深圳)有限公司 | 用户识别方法、装置、设备及存储介质 |
CN111681051A (zh) * | 2020-06-08 | 2020-09-18 | 上海汽车集团股份有限公司 | 购买意向度预测方法、装置、存储介质及终端 |
CN113988195A (zh) * | 2021-10-28 | 2022-01-28 | 广州小鹏汽车科技有限公司 | 一种私域流量线索挖掘方法、装置、车辆、可读介质 |
CN113988190A (zh) * | 2021-10-29 | 2022-01-28 | 平安科技(深圳)有限公司 | 客户意向分析方法、装置、设备及存储介质 |
CN115099326A (zh) * | 2022-06-20 | 2022-09-23 | 中国平安财产保险股份有限公司 | 基于人工智能的行为预测方法、装置、设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108345692B (zh) | 一种自动问答方法和系统 | |
CN109492772B (zh) | 生成信息的方法和装置 | |
CN108334568B (zh) | 房源推送方法、装置、设备及计算机可读存储介质 | |
CN109858683B (zh) | 确定店铺的营业状态的方法、装置、电子设备及存储介质 | |
CN111405030B (zh) | 一种消息推送方法、装置、电子设备和存储介质 | |
CN106407381B (zh) | 一种基于人工智能的推送信息的方法和装置 | |
US11568344B2 (en) | Systems and methods for automated pattern detection in service tickets | |
CN112131382B (zh) | 民生问题高发地的识别方法、装置及电子设备 | |
CN110866040A (zh) | 用户画像生成方法、装置和系统 | |
CN111681049A (zh) | 用户行为的处理方法、存储介质及相关设备 | |
CN110784377A (zh) | 一种多云环境下的云监控数据统一管理的方法 | |
CN112347147A (zh) | 基于用户关联关系的信息推送方法、装置及电子设备 | |
CN112749323B (zh) | 一种构建用户画像的方法和装置 | |
CN103475532A (zh) | 硬件检测方法和系统 | |
CN110717788A (zh) | 一种目标用户的筛选方法及装置 | |
CN107395377B (zh) | 一种广播列表推送方法 | |
CN113205130A (zh) | 一种数据审核方法、装置、电子设备及存储介质 | |
CN117009357A (zh) | 智慧城市的物联网数据治理方法、装置、系统及介质 | |
CN115309737A (zh) | 访客意向分析方法、系统、终端设备及可读存储介质 | |
CN108549722B (zh) | 多平台数据发布方法、系统及介质 | |
CN114897571A (zh) | 一种基于私域电商平台中商城货品数据处理方法、系统和存储介质 | |
CN115080824A (zh) | 目标词的挖掘方法、装置、电子设备及存储介质 | |
CN110807466A (zh) | 一种处理订单数据的方法和装置 | |
CN114036391A (zh) | 数据推送方法、装置、电子设备和存储介质 | |
CN114066603A (zh) | 贷后风险预警方法、装置、电子设备和计算机可读介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20221108 |