CN116934506A - 一种用户行为预测方法、装置、计算机设备及存储介质 - Google Patents
一种用户行为预测方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN116934506A CN116934506A CN202311002325.9A CN202311002325A CN116934506A CN 116934506 A CN116934506 A CN 116934506A CN 202311002325 A CN202311002325 A CN 202311002325A CN 116934506 A CN116934506 A CN 116934506A
- Authority
- CN
- China
- Prior art keywords
- behavior
- user behavior
- model
- target
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 70
- 238000003860 storage Methods 0.000 title claims abstract description 23
- 230000006399 behavior Effects 0.000 claims abstract description 456
- 238000012549 training Methods 0.000 claims abstract description 94
- 239000002245 particle Substances 0.000 claims description 70
- 238000012216 screening Methods 0.000 claims description 57
- 230000008569 process Effects 0.000 claims description 18
- 230000006870 function Effects 0.000 claims description 17
- 238000012795 verification Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 11
- 238000013473 artificial intelligence Methods 0.000 abstract description 14
- 238000004519 manufacturing process Methods 0.000 abstract description 3
- 238000005516 engineering process Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 10
- 238000007726 management method Methods 0.000 description 8
- 238000005457 optimization Methods 0.000 description 8
- 238000004891 communication Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 238000007405 data analysis Methods 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000002159 abnormal effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000003542 behavioural effect Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 238000007418 data mining Methods 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000019800 disodium phosphate Nutrition 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/01—Customer relationship services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Computational Linguistics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Technology Law (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Health & Medical Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开一种用户行为预测方法、装置、计算机设备及存储介质,涉及人工智能技术领域和产险金融领域。本申请通过获取目标用户行为的目标行为特征,基于目标行为特征对历史行为数据进行筛选,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,然后将历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请还涉及区块链技术领域,用户行为数据可以存储在区块链网络的节点上。本申请通过使用梯度提升树模型结合群体智能算法可以提高用户行为预测模型训练的速度和预测精度。
Description
技术领域
本申请涉及人工智能技术领域和产险金融领域,具体涉及一种用户行为预测方法、装置、计算机设备及存储介质。
背景技术
随着互联网金融的发展,保险销售的渠道和需求也在不断变革,消费者对保险服务的要求也越来越高。为了提高服务水平,提升自身行业内的竞争力,保险企业的客户服务起到了关键作用,不管是在承保咨询阶段,还是在理赔咨诉过程中,客服都是解决消费者服务需求的保障,并且随着客户需求的不断提升,也对险企服务提出了更高的要求,这也导致客服人员收到的投诉量激增。目前针对投诉事件,保险企业只能在用户投诉发生后再进行跟进处理,缺少对用户投诉倾向的感知。
目前针对投诉事件的处理方案主要是通过数据挖掘的方法来实现用户投诉倾向感知,管理人员对历史投诉情况进行数据分析,挖掘出消费者投诉的主要原因,再对后续服务加以改善,这种方法只能在用户投诉发生后再进行分析和弥补,且需要花费大量人员对过往投诉案例进行分析,而且面对复杂多变的服务种类来说,其挖掘难度很大。
发明内容
本申请实施例的目的在于提出一种用户行为预测方法、装置、计算机设备及存储介质,以解决现有针对投诉事件的处理方案存在的只能在用户投诉发生后再进行分析和弥补,且需要花费大量人员对过往投诉案例进行分析,而且面对复杂多变的服务种类来说,其挖掘难度很大的技术问题。
为了解决上述技术问题,本申请实施例提供一种用户行为预测方法,采用了如下所述的技术方案:
一种用户行为预测方法,包括:
确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征;
基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据;
基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,其中,所述用户行为预测模型基于梯度提升树模型构建,所述用户行为预测模型训练时基于群体智能算法进行迭代;
获取与所述目标用户行为匹配的历史行为数据,将与所述目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
进一步地,所述基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,具体包括:
对所述筛选行为数据进行数据集划分,并构建特征数据集,其中,特征数据集包括训练数据集和验证数据集;
通过所述训练数据集训练用户行为预测模型;
以及通过所述验证数据集验证训练完成的用户行为预测模型,并输出通过验证的所述用户行为预测模型。
进一步地,所述梯度提升树模型为XGBoost模型,所述群体智能算法为PSO算法,所述PSO算法的基本运算单元为粒子,所述通过所述训练数据集训练用户行为预测模型,具体包括:
对所述粒子进行初始化,并为每个所粒子随机分配初始位置和速度;
对所述粒子和所述XGBoost模型的模型参数进行关联;
利用所述训练数据集对所述XGBoost模型进行持续训练,以更新所述模型参数,直至所述XGBoost模型拟合,得到所述用户行为预测模型。
进一步地,所述模型参数包括随机采样率和最小叶子节点,所述利用所述训练数据集对所述XGBoost模型进行持续训练,以更新所述模型参数,直至所述XGBoost模型拟合,得到所述用户行为预测模型,具体包括:
定义所述XGBoost模型的适应度函数;
在所述XGBoost模型训练过程中,以所述随机采样率和所述最小叶子节点作为待优化变量,以所述适应度函数来评估所述XGBoost模型的性能,持续更新所述粒子的位置和速度,并计算粒子适应度值;
当达到预定的停止条件时,停止模型训练,获取停止时刻的粒子适应度值;
基于所述粒子适应度值生成模型参数组合,并基于所述模型参数组合初始化所述XGBoost模型,得到所述用户行为预测模型。
进一步地,所述XGBoost模型的适应度函数如下:
式中,R2为粒子适应度值,sst为总的平方和,sse为残差平方和,其中,sst=ssr+sse,ssr为回归平方和。
进一步地,确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征,具体包括:
确定用户行为预测目标,并获取用户行为序列;
从所述用户行为序列中获取行为关键词,并计算所述行为关键词与所述用户行为预测目标之间的相似度;
根据所述相似度筛选用户行为,得到所述目标用户行为;
对所述目标用户行为进行特征提取,得到所述目标行为特征。
进一步地,基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,具体包括:
获取所述历史行为数据的特征标签;
将所述目标行为特征与所述特征标签进行匹配;
将与所述目标行为特征匹配的所述特征标签对应的历史行为数据作为所述筛选行为数据。
为了解决上述技术问题,本申请实施例还提供一种用户行为预测装置,采用了如下所述的技术方案:
一种用户行为预测装置,包括:
行为特征模块,用于确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征;
数据筛选模块,用于基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据;
模型训练模块,用于基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,其中,所述用户行为预测模型基于梯度提升树模型构建,所述用户行为预测模型训练时基于群体智能算法进行迭代;
行为预测模块,用于获取与所述目标用户行为匹配的历史行为数据,将与所述目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
为了解决上述技术问题,本申请实施例还提供一种计算机设备,采用了如下所述的技术方案:
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如上述任一项所述的用户行为预测方法的步骤。
为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,采用了如下所述的技术方案:
一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如上述中任一项所述的用户行为预测方法的步骤。
与现有技术相比,本申请实施例主要有以下有益效果:
本申请公开一种用户行为预测方法、装置、计算机设备及存储介质,涉及人工智能技术领域和产险金融领域。本申请通过确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
附图说明
为了更清楚地说明本申请中的方案,下面将对本申请实施例描述中所需要使用的附图作一个简单介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本申请可以应用于其中的示例性系统架构图;
图2示出了根据本申请的用户行为预测方法的一个实施例的流程图;
图3示出了根据本申请的面向保险消费者的客服投诉预测的实施例流程图;
图4示出了根据本申请的用户行为预测装置的一个实施例的结构示意图;
图5示出了根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请;本申请的说明书和权利要求书及上述附图说明中的术语“包括”和“具有”以及它们的任何变形,意图在于覆盖不排他的包含。本申请的说明书和权利要求书或上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
为了使本技术领域的人员更好地理解本申请方案,下面将结合附图,对本申请实施例中的技术方案进行清楚、完整地描述。
如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture ExpertsGroup Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving PictureExperts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台服务器,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。
需要说明的是,本申请实施例所提供的用户行为预测方法一般由服务器执行,相应地,用户行为预测装置一般设置于服务器中。
应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
继续参考图2,示出了根据本申请的用户行为预测方法的一个实施例的流程图。本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
目前针对投诉事件的处理方案主要是通过数据挖掘的方法来实现用户投诉倾向感知,管理人员对历史投诉情况进行数据分析,挖掘出消费者投诉的主要原因,再对后续服务加以改善,这种方法只能在用户投诉发生后再进行分析和弥补,且需要花费大量人员对过往投诉案例进行分析,而且面对复杂多变的服务种类来说,其挖掘难度很大。
为了解决上述技术问题,本申请公开一种用户行为预测方法、装置、计算机设备及存储介质,涉及人工智能技术领域和产险金融领域,本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
所述的用户行为预测方法,包括以下步骤:
S201,确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征。
在本实施例中,从用户行为序列中筛选出与用户行为预测目标关联的目标用户行为,即待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,有效地捕捉用户行为的相关性,提高行为预测的准确性。
进一步地,确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,具体包括:
确定用户行为预测目标,并获取用户行为序列;
从用户行为序列中获取行为关键词,并计算行为关键词与用户行为预测目标之间的相似度;
根据相似度筛选用户行为,得到目标用户行为;
对目标用户行为进行特征提取,得到目标行为特征。
在本实施例中,确定用户行为预测目标,并获取用户行为序列,其中,用户行为预测目标可以是某个特定的行为,例如购买、点击、点赞、投诉、评论等,用户行为序列是指用户在一段时间内的行为记录,可以包括浏览历史、购买记录、搜索记录等。从用户行为序列中获取行为关键词,并计算行为关键词与用户行为预测目标之间的相似度,其中,行为关键词是指能够描述用户行为的关键词或短语,相似度计算可以使用文本相似度算法,如余弦相似度或编辑距离等。根据相似度筛选用户行为,得到目标用户行为,通过计算行为关键词与目标行为之间的相似度,可以筛选出与目标行为相关的用户行为。对目标用户行为进行特征提取,得到目标行为特征,特征提取是将行为数据转化为可供机器学习算法处理的特征向量的过程,可以使用各种特征提取方法,如词袋模型、TF-IDF、Word2Vec等。
在本申请一种具体的实施例中,以保险销售的客服投诉分析为例,通过对某险企历史客服投诉工单数据的分析,得到与消费者投诉行为关联性较高的数据特征包括人工服务时长、人工服务次数、客服电话频率、业务办理失败次数、业务咨询次数及消费渠道6个关键特征。此外,从近一年内险企客服投诉工单数据中筛选出上述六个特征数据项构成正样本数据,为保证样本的均衡,还需要加入非投诉类型的负样本数据。
在上述实施例中,本申请利用行为关键词和相似度计算方法,从用户行为序列中筛选出与目标行为相似的行为,并提取相应的行为特征,有效地捕捉用户行为的相关性,提高行为预测的准确性。
S202,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据。
在本实施例中,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,获取与目标行为特征相似的历史行为数据,提高预测模型的准确性和性能。
进一步地,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,具体包括:
获取历史行为数据的特征标签;
将目标行为特征与特征标签进行匹配;
将与目标行为特征匹配的特征标签对应的历史行为数据作为筛选行为数据。
在本实施例中,每一个历史行为数据包括若干个特征标签,通过获取历史行为数据的特征标签,并将目标行为特征与特征标签进行匹配,当目标行为特征与特征标签匹配时,将特征标签对应的历史行为数据作为筛选行为数据。
在上述实施例中,本申请利用特征标签对历史行为数据进行分类和标记,并通过与目标行为特征的匹配来筛选出相关的行为数据,有效地选择与目标行为特征相似的历史行为数据,提高预测模型的准确性和性能。
S203,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代。
在本实施例中,对筛选行为数据进行数据集划分,并构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代。
群体智能算法是一类启发式优化算法,通过模拟生物群体中的个体之间的相互作用和信息交流来求解问题。群体智能算法包括多种不同的方法,其中最常见的包括粒子群优化算法(Particle Swarm Optimization,PSO)、蚁群算法(Ant Colony Optimization,ACO)、遗传算法(Genetic Algorithm,GA)等。
梯度提升树(Gradient Boosting Tree)是一种集成学习方法,通过构建多个决策树并将它们组合起来来进行预测或分类任务,梯度提升树还是一种迭代的方法,每一轮迭代都会根据当前模型的预测结果来调整下一棵树的拟合目标,从而逐步提升整体模型的性能。
在上述实施例中,本申请使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度。
进一步地,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,具体包括:
对筛选行为数据进行数据集划分,并构建特征数据集,其中,特征数据集包括训练数据集和验证数据集;
通过训练数据集训练用户行为预测模型;
以及通过验证数据集验证训练完成的用户行为预测模型,并输出通过验证的用户行为预测模型。
在本实施例中,对筛选行为数据进行数据集划分,并构建特征数据集,其中,特征数据集包括训练数据集和验证数据集,特征数据集中,70%的数据作为训练数据集,30%作为验证数据集。然后通过训练数据集训练用户行为预测模型,通过验证数据集验证训练完成的用户行为预测模型,并输出通过验证的用户行为预测模型。
建特征数据集通常会存在数据值异常、缺失等情况,因此在数据集划分前,需要对筛选行为数据进行预处理,预处理包括数据去重、缺失值填充、归一化处理等等。为进一步降低数据集对预测结果的影响,可以直接舍弃数值异常和值缺失的特征项,然后对特征值进行one-hot编码,再将编码后的训练数据集导入预测模型中进行训练,以及将编码后的验证数据集验证训练完成的用户行为预测模型。
在本申请一种具体的实施例中,将影响消费者投诉的特征值范围处标记为1,其余置为0,这样即可得到仅包含0和1的特征矩阵数据集,按照数据分析结果,上述6个关键特征在如下取值范围内时,消费者投诉可能性更高:
表1关键特征与特征值范围标记表
特征项 | 值范围 | 标记 |
人工服务时长(min) | ≧60 | 1 |
人工服务次数(次) | (8,10) | 1 |
客服电话频率(次) | (5,8) | 1 |
业务失败次数(次) | (3,5) | 1 |
业务咨询次数(次) | (2,4) | 1 |
消费渠道 | 电话、APP渠道 | 1 |
进一步地,梯度提升树模型为XGBoost模型,群体智能算法为PSO算法,PSO算法的基本运算单元为粒子,通过训练数据集训练用户行为预测模型,具体包括:
对粒子进行初始化,并为每个所粒子随机分配初始位置和速度;
对粒子和XGBoost模型的模型参数进行关联;
利用训练数据集对XGBoost模型进行持续训练,以更新模型参数,直至XGBoost模型拟合,得到用户行为预测模型。
XGBoost(eXtreme Gradient Boosting)是一种基于梯度提升树(GradientBoosting Tree)的机器学习算法,用于解决回归和分类问题。XGBoost通过集成多个弱学习器(通常是决策树)来构建一个强大的预测模型,在每个迭代周期中,模型通过拟合当前残差来学习新的决策树模型,并以梯度下降的方式逐步改进模型的预测能力,XGBoost采用了一些创新的技术,如正则化、缺失值处理和并行化等,以提高模型的准确性和效率。
PSO(Particle Swarm Optimization)优化算法是一种群体智能算法,模拟了鸟群或鱼群等群体行为中的信息共享和协作机制,用于求解优化问题。PSO算法的基本思想是通过模拟粒子在搜索空间中的移动过程,寻找最优解,每个粒子代表一个潜在解,粒子通过跟踪个体最优解和全局最优解的信息来调整自身的移动方向和速度。粒子根据当前的速度和位置,以及个体和全局最优解的引导,更新自己的位置和速度,直到达到预定的停止条件。
在PSO算法中,粒子是PSO算法的基本单位,代表了待优化问题的一个解或候选解,每个粒子在搜索空间中表示一个潜在解,并通过不断地调整自身的位置和速度来寻找最优解。每个粒子都有自己的位置和速度,它们的位置表示当前的解或候选解,速度表示粒子在搜索空间中的移动方向和速度,粒子通过不断地更新位置和速度来搜索最优解的方向。
在PSO算法中,粒子通过与周围粒子的交互和信息共享来改变自身的移动方向和速度,每个粒子都有个体最优解和全局最优解,个体最优解是粒子自身曾经找到的最好解,而全局最优解是整个粒子群中适应度最好的解,通过比较个体最优解和全局最优解,粒子可以调整自身的移动方向和速度。
进一步地,模型参数包括随机采样率和最小叶子节点,利用训练数据集对XGBoost模型进行持续训练,以更新模型参数,直至XGBoost模型拟合,得到用户行为预测模型,具体包括:
定义XGBoost模型的适应度函数;
在XGBoost模型训练过程中,以随机采样率和最小叶子节点作为待优化变量,以适应度函数来评估XGBoost模型的性能,持续更新粒子的位置和速度,并计算粒子适应度值;
当达到预定的停止条件时,停止模型训练,获取停止时刻的粒子适应度值;
基于粒子适应度值生成模型参数组合,并基于模型参数组合初始化XGBoost模型,得到用户行为预测模型。
进一步地,XGBoost模型的适应度函数如下:
式中,R2为粒子适应度值,sst为总的平方和,sse为残差平方和,其中,sst=ssr+sse,ssr为回归平方和。
在本实施例中,确定用户行为预测目标后,设计适应度函数来评估XGBoost模型的性能,将每个粒子表示为一组XGBoost模型的参数,这些参数可以包括树的数量、树的深度、学习率等,每个粒子代表了一组参数配置,然后随机初始化一定数量的粒子,并为每个粒子随机分配初始位置和速度,根据PSO算法的原理,通过计算当前位置和速度,以及个体和全局最优解的引导,更新每个粒子的位置和速度,使用XGBoost模型来训练数据,并使用定义的适应度函数评估模型的性能,即适应度值,将适应度值分配给每个粒子,根据每个粒子的适应度值,更新个体最优解和全局最优解。如果某个粒子找到了更好的解决方案,则更新个体最优解,如果全局最优解需要更新,则更新全局最优解。最后根据预定的停止条件(例如达到最大迭代次数或满足一定的适应度阈值),判断是否终止模型训练过程,提取全局最优解对应的参数配置作为最终的XGBoost模型的最优参数组合,根据最优参数组合重新初始化的XGBoost模型,再次训练得到用户行为预测模型。
在上述实施例中,本申请根据PSO算法的原理进行XGBoost模型的迭代训练,以获得XGBoost模型的最优参数组合,通过重新初始化的XGBoost模型,可以快训练用户行为预测模型,提高用户行为预测模型训练的速度和预测精度。
在本申请一种具体的实施例中,以面向保险消费者的客服投诉预测,请参考图3,客服投诉预测具体实现如下:
(1)通过对险企历史客服投诉工单数据的分析,获取消费者投诉行为关联性较高的行为数据,并构建特征数据集。
(2)初始化XGBoost模型参数,进行模型预训练;
(3)初始化PSO优化算法(如粒子位置、速度等),将XGBoost的随机采样率和最小叶子节点作为待优化变量,模型拟合判定系数作为PSO适应度函数;
(4)利用特征数据集训练XGBoost模型,同时更新粒子的速度与位置,计算其适应度值,获取当前个体最优值与全局最优值;
(5)判断是否满足终止条件,若不满足则继续迭代,获得新的个体最优与全局最优值;若满足,则输出最优粒子位置,即可得到最优的随机采样率和最小叶子节点数;
(6)利用上述步骤得到的最优参数组合,重新初始化最优的XGBoost模型,再次训练得到最优的客服投诉预测模型;
(7)将上述构建的PSO-XGBoost投诉预测模型应用到险企客服系统中,即可实现对客服投诉预测。
在上述实施例中,本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
S204,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
在本实施例中,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,用户行为预测模型可以直接针对匹配的历史行为数据输出对应的目标用户行为的预测结果。
在上述实施例中,本申请公开一种用户行为预测方法,涉及人工智能技术领域和产险金融领域。本申请通过确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
在本实施例中,用户行为预测方法运行于其上的电子设备(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式接收指令或者获取数据。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
需要强调的是,为进一步保证上述行为数据的私密和安全性,上述行为数据还可以存储于一区块链的节点中。
本申请所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机可读指令来指令相关的硬件来完成,该计算机可读指令可存储于一计算机可读取存储介质中,该计算机可读指令在执行时,可包括如上述各方法的实施例的流程。其中,前述的存储介质可为磁碟、光盘、只读存储记忆体(Read-On ly Memory,ROM)等非易失性存储介质,或随机存储记忆体(Random Access Memory,RAM)等。
应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
进一步参考图4,作为对上述图2所示方法的实现,本申请提供了一种用户行为预测装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图4所示,本实施例所述的用户行为预测装置400,包括:
行为特征模块401,用于确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征;
数据筛选模块402,用于基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据;
模型训练模块403,用于基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代;
行为预测模块404,用于获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
进一步地,模型训练模块403具体包括:
数据集划分子模块,用于对筛选行为数据进行数据集划分,并构建特征数据集,其中,特征数据集包括训练数据集和验证数据集;
模型训练子模块,用于通过训练数据集训练用户行为预测模型;
模型验证子模块,用于以及通过验证数据集验证训练完成的用户行为预测模型,并输出通过验证的用户行为预测模型。
进一步地,梯度提升树模型为XGBoost模型,群体智能算法为PSO算法,PSO算法的基本运算单元为粒子,模型训练子模块具体包括:
粒子初始化单元,用于对粒子进行初始化,并为每个所粒子随机分配初始位置和速度;
参数关联单元,用于对粒子和XGBoost模型的模型参数进行关联;
迭代训练单元,用于利用训练数据集对XGBoost模型进行持续训练,以更新模型参数,直至XGBoost模型拟合,得到用户行为预测模型。
进一步地,模型参数包括随机采样率和最小叶子节点,迭代训练单元具体包括:
适应度函数定义子单元,用于定义XGBoost模型的适应度函数;
粒子适应度值计算子单元,用于在XGBoost模型训练过程中,以随机采样率和最小叶子节点作为待优化变量,以适应度函数来评估XGBoost模型的性能,持续更新粒子的位置和速度,并计算粒子适应度值;
模型迭代停止子单元,用于当达到预定的停止条件时,停止模型训练,获取停止时刻的粒子适应度值;
模型参数初始化子单元,用于基于粒子适应度值生成模型参数组合,并基于模型参数组合初始化XGBoost模型,得到用户行为预测模型。
进一步地,XGBoost模型的适应度函数如下:
式中,R2为粒子适应度值,sst为总的平方和,sse为残差平方和,其中,sst=ssr+sse,ssr为回归平方和。
进一步地,行为特征模块401具体包括:
预测目标子模块,用于确定用户行为预测目标,并获取用户行为序列;
行为关键词子模块,用于从用户行为序列中获取行为关键词,并计算行为关键词与用户行为预测目标之间的相似度;
相似度筛选子模块,用于根据相似度筛选用户行为,得到目标用户行为;
行为特征提取子模块,用于对目标用户行为进行特征提取,得到目标行为特征。
进一步地,数据筛选模块402具体包括:
标签获取子模块,用于获取历史行为数据的特征标签;
特征匹配子模块,用于将目标行为特征与特征标签进行匹配;
数据筛选子模块,用于将与目标行为特征匹配的特征标签对应的历史行为数据作为筛选行为数据。
在上述实施例中,本申请公开一种用户行为预测装置,涉及人工智能技术领域和产险金融领域。本申请通过确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
为解决上述技术问题,本申请实施例还提供计算机设备。具体请参阅图5,图5为本实施例计算机设备基本结构框图。
所述计算机设备5包括通过系统总线相互通信连接存储器51、处理器52、网络接口53。需要指出的是,图中仅示出了具有组件51-53的计算机设备5,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,本技术领域技术人员可以理解,这里的计算机设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(ApplicationSpecific Integrated Circuit,ASIC)、可编程门阵列(Field-Programmable GateArray,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。
所述计算机设备可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机设备可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。
所述存储器51至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,所述存储器51可以是所述计算机设备5的内部存储单元,例如该计算机设备5的硬盘或内存。在另一些实施例中,所述存储器51也可以是所述计算机设备5的外部存储设备,例如该计算机设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(FlashCard)等。当然,所述存储器51还可以既包括所述计算机设备5的内部存储单元也包括其外部存储设备。本实施例中,所述存储器51通常用于存储安装于所述计算机设备5的操作系统和各类应用软件,例如用户行为预测方法的计算机可读指令等。此外,所述存储器51还可以用于暂时地存储已经输出或者将要输出的各类数据。
所述处理器52在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器52通常用于控制所述计算机设备5的总体操作。本实施例中,所述处理器52用于运行所述存储器51中存储的计算机可读指令或者处理数据,例如运行所述用户行为预测方法的计算机可读指令。
所述网络接口53可包括无线网络接口或有线网络接口,该网络接口53通常用于在所述计算机设备5与其他电子设备之间建立通信连接。
在上述实施例中,本申请公开一种计算机设备,涉及人工智能技术领域和产险金融领域。本申请通过确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
本申请还提供了另一种实施方式,即提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令可被至少一个处理器执行,以使所述至少一个处理器执行如上述的用户行为预测方法的步骤。
在上述实施例中,本申请公开一种计算机可读存储介质,涉及人工智能技术领域和产险金融领域。本申请通过确定待预测的目标用户行为,并获取目标用户行为的行为特征,得到目标行为特征,基于目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,基于筛选行为数据构建特征数据集,并基于特征数据集训练用户行为预测模型,其中,用户行为预测模型基于梯度提升树模型构建,用户行为预测模型训练时基于群体智能算法进行迭代,获取与目标用户行为匹配的历史行为数据,将与目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。本申请通过构建特征数据集和训练用户行为预测模型来预测目标用户的行为,使用梯度提升树模型结合群体智能算法可以提高预测模型训练的速度和预测精度,实现对险企客服系统中用户投诉倾向的预测,有效解决企业在客户服务管理过程被动投诉的问题,进一步提升服务水平。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
本申请可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
显然,以上所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例,附图中给出了本申请的较佳实施例,但并不限制本申请的专利范围。本申请可以以许多不同的形式来实现,相反地,提供这些实施例的目的是使对本申请的公开内容的理解更加透彻全面。尽管参照前述实施例对本申请进行了详细的说明,对于本领域的技术人员来而言,其依然可以对前述各具体实施方式所记载的技术方案进行修改,或者对其中部分技术特征进行等效替换。凡是利用本申请说明书及附图内容所做的等效结构,直接或间接运用在其他相关的技术领域,均同理在本申请专利保护范围之内。
Claims (10)
1.一种用户行为预测方法,其特征在于,包括:
确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征;
基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据;
基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,其中,所述用户行为预测模型基于梯度提升树模型构建,所述用户行为预测模型训练时基于群体智能算法进行迭代;
获取与所述目标用户行为匹配的历史行为数据,将与所述目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
2.如权利要求1所述的用户行为预测方法,其特征在于,所述基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,具体包括:
对所述筛选行为数据进行数据集划分,并构建特征数据集,其中,特征数据集包括训练数据集和验证数据集;
通过所述训练数据集训练用户行为预测模型;
以及通过所述验证数据集验证训练完成的用户行为预测模型,并输出通过验证的所述用户行为预测模型。
3.如权利要求2所述的用户行为预测方法,其特征在于,所述梯度提升树模型为XGBoost模型,所述群体智能算法为PSO算法,所述PSO算法的基本运算单元为粒子,所述通过所述训练数据集训练用户行为预测模型,具体包括:
对所述粒子进行初始化,并为每个所粒子随机分配初始位置和速度;
对所述粒子和所述XGBoost模型的模型参数进行关联;
利用所述训练数据集对所述XGBoost模型进行持续训练,以更新所述模型参数,直至所述XGBoost模型拟合,得到所述用户行为预测模型。
4.如权利要求3所述的用户行为预测方法,其特征在于,所述模型参数包括随机采样率和最小叶子节点,所述利用所述训练数据集对所述XGBoost模型进行持续训练,以更新所述模型参数,直至所述XGBoost模型拟合,得到所述用户行为预测模型,具体包括:
定义所述XGBoost模型的适应度函数;
在所述XGBoost模型训练过程中,以所述随机采样率和所述最小叶子节点作为待优化变量,以所述适应度函数来评估所述XGBoost模型的性能,持续更新所述粒子的位置和速度,并计算粒子适应度值;
当达到预定的停止条件时,停止模型训练,获取停止时刻的粒子适应度值;
基于所述粒子适应度值生成模型参数组合,并基于所述模型参数组合初始化所述XGBoost模型,得到所述用户行为预测模型。
5.如权利要求4所述的用户行为预测方法,其特征在于,所述XGBoost模型的适应度函数如下:
式中,R2为粒子适应度值,sst为总的平方和,sse为残差平方和,其中,sst=ssr+sse,ssr为回归平方和。
6.如权利要求1至5任意一项所述的用户行为预测方法,其特征在于,确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征,具体包括:
确定用户行为预测目标,并获取用户行为序列;
从所述用户行为序列中获取行为关键词,并计算所述行为关键词与所述用户行为预测目标之间的相似度;
根据所述相似度筛选用户行为,得到所述目标用户行为;
对所述目标用户行为进行特征提取,得到所述目标行为特征。
7.如权利要求6所述的用户行为预测方法,其特征在于,基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据,具体包括:
获取所述历史行为数据的特征标签;
将所述目标行为特征与所述特征标签进行匹配;
将与所述目标行为特征匹配的所述特征标签对应的历史行为数据作为所述筛选行为数据。
8.一种用户行为预测装置,其特征在于,包括:
行为特征模块,用于确定待预测的目标用户行为,并获取所述目标用户行为的行为特征,得到目标行为特征;
数据筛选模块,用于基于所述目标行为特征对预设数据库中的历史行为数据进行筛选,得到筛选行为数据;
模型训练模块,用于基于所述筛选行为数据构建特征数据集,并基于所述特征数据集训练用户行为预测模型,其中,所述用户行为预测模型基于梯度提升树模型构建,所述用户行为预测模型训练时基于群体智能算法进行迭代;
行为预测模块,用于获取与所述目标用户行为匹配的历史行为数据,将与所述目标用户行为匹配的历史行为数据导入训练完成的用户行为预测模型,得到目标用户行为预测结果。
9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述的用户行为预测方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机可读指令,所述计算机可读指令被处理器执行时实现如权利要求1至7中任一项所述的用户行为预测方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311002325.9A CN116934506A (zh) | 2023-08-09 | 2023-08-09 | 一种用户行为预测方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311002325.9A CN116934506A (zh) | 2023-08-09 | 2023-08-09 | 一种用户行为预测方法、装置、计算机设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116934506A true CN116934506A (zh) | 2023-10-24 |
Family
ID=88384411
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311002325.9A Pending CN116934506A (zh) | 2023-08-09 | 2023-08-09 | 一种用户行为预测方法、装置、计算机设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116934506A (zh) |
-
2023
- 2023-08-09 CN CN202311002325.9A patent/CN116934506A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111898550B (zh) | 建立表情识别模型方法、装置、计算机设备及存储介质 | |
CN114357117A (zh) | 事务信息查询方法、装置、计算机设备及存储介质 | |
CN113627797A (zh) | 入职员工画像生成方法、装置、计算机设备及存储介质 | |
CN114398466A (zh) | 基于语义识别的投诉分析方法、装置、计算机设备及介质 | |
CN116843483A (zh) | 一种车险理赔方法、装置、计算机设备及存储介质 | |
CN116843395A (zh) | 一种业务系统的告警分级方法、装置、设备及存储介质 | |
CN116777646A (zh) | 基于人工智能的风险识别方法、装置、设备及存储介质 | |
CN115730603A (zh) | 基于人工智能的信息提取方法、装置、设备及存储介质 | |
CN115238077A (zh) | 基于人工智能的文本分析方法、装置、设备及存储介质 | |
CN114637831A (zh) | 基于语义分析的数据查询方法及其相关设备 | |
CN116934506A (zh) | 一种用户行为预测方法、装置、计算机设备及存储介质 | |
CN113792549B (zh) | 一种用户意图识别的方法、装置、计算机设备及存储介质 | |
CN117172632B (zh) | 一种企业异常行为检测方法、装置、设备及存储介质 | |
CN113792342B (zh) | 一种脱敏数据还原的方法、装置、计算机设备及存储介质 | |
CN117236707A (zh) | 一种资产优化配置方法、装置、计算机设备及存储介质 | |
CN117057362A (zh) | 基于人工智能的意图识别方法、装置、设备及存储介质 | |
CN117076775A (zh) | 资讯数据的处理方法、装置、计算机设备及存储介质 | |
CN117407750A (zh) | 基于元数据的数据质量监控方法、装置、设备及存储介质 | |
CN116824600A (zh) | 一种公司印章识别方法及其相关设备 | |
CN116756147A (zh) | 一种数据归类方法、装置、计算机设备及存储介质 | |
CN116502624A (zh) | 训练语料的扩充方法、装置、计算机设备及存储介质 | |
CN117235257A (zh) | 基于人工智能的情感预测方法、装置、设备及存储介质 | |
CN116757771A (zh) | 基于人工智能的方案推荐方法、装置、设备及存储介质 | |
CN117078406A (zh) | 一种客户流失预警方法、装置、计算机设备及存储介质 | |
CN117217812A (zh) | 一种用户行为预测方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |