CN113435927B - 用户意愿预测方法、装置、设备和存储介质 - Google Patents
用户意愿预测方法、装置、设备和存储介质 Download PDFInfo
- Publication number
- CN113435927B CN113435927B CN202110700856.XA CN202110700856A CN113435927B CN 113435927 B CN113435927 B CN 113435927B CN 202110700856 A CN202110700856 A CN 202110700856A CN 113435927 B CN113435927 B CN 113435927B
- Authority
- CN
- China
- Prior art keywords
- prediction
- data
- time point
- observation
- target user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000003860 storage Methods 0.000 title claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 23
- 230000008859 change Effects 0.000 claims abstract description 10
- 238000005315 distribution function Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 27
- 238000009826 distribution Methods 0.000 claims description 22
- 230000015654 memory Effects 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012935 Averaging Methods 0.000 claims description 3
- 238000004458 analytical method Methods 0.000 abstract description 7
- 230000008569 process Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 7
- 230000001788 irregular Effects 0.000 description 7
- 230000006399 behavior Effects 0.000 description 6
- 238000013135 deep learning Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000306 recurrent effect Effects 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007723 transport mechanism Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0202—Market predictions or forecasting for commercial activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/08—Insurance
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Strategic Management (AREA)
- Mathematical Physics (AREA)
- Development Economics (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computational Linguistics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Business, Economics & Management (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Marketing (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Economics (AREA)
- Pure & Applied Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Mathematical Optimization (AREA)
- Mathematical Analysis (AREA)
- Computational Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Operations Research (AREA)
- Probability & Statistics with Applications (AREA)
- Game Theory and Decision Science (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Technology Law (AREA)
Abstract
本发明提供了一种用户意愿预测方法、装置、设备和存储介质,包括:获取目标用户群体在多个离散的观测时间点的观测数据,每个观测时间点的观测数据表征目标用户群体在对应的观测时间点对于产品的平均接受程度;将所有观测数据和预测时间点输入至预测模型,得到在预测时间点的预测数据,预测数据表征目标用户群体在预测时间点对于产品的平均接受程度,预测模型由ODE模型根据观测数据训练得到。由于ODE模型能够接受更广泛且不定期的输入,模型使用不受限;其次还能够提供更广泛的输出,不仅可以对未来较长时间进行预测,也可以回顾历史轨迹进行分析;另外通过ODE模型弥补时间的间隔,能准确反映出用户对于产品接受程度的心理变化,以实现精准营销。
Description
技术领域
本发明实施例涉及但不限于人工智能技术领域,尤其涉及一种用户意愿预测方法、用户意愿预测装置、计算机设备和计算机可读存储介质。
背景技术
由于销售模式、生产关系和社会存款等因素影响,长期以来,保险行业呈现出一定周期性规律,这为趋势分析提供了一定基础。因此,在客户长期购买保险的行为中,提前做好预测工作,有利于实现精准营销。
然而,由于单一群体客户保险购买行为的发生时间是离散和不定期的,因此对于传统的深度学习时间序列预测模型如基于RNN(Recurrent Neural Network,深度学习递归神经网络)算法的LSTM(Long Short Term Memory,长短时记忆网络)模型,难以适用于非固定时间间隔数据和非稳定时间序列,从而导致模型使用受限。即使使用传统的深度学习时间序列预测模型进行计算,由于数据稀疏、购买时间跨度较长,导致其预测结果的准确度也较低。
发明内容
以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
本发明实施例提供了一种用户意愿预测方法、用户意愿预测装置、计算机设备和计算机可读存储介质,能够对离散和不定期的保险购买行为进行预测,以实现精准营销。
第一方面,本发明实施例提供了一种用户意愿预测方法,包括:
获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个所述观测时间点的所述观测数据表征所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
将所有所述观测数据和预测时间点输入至预测模型,以得到在所述预测时间点的预测数据,所述预测数据表征所述目标用户群体在所述预测时间点对于产品的平均接受程度,其中,所述预测模型由ODE模型根据所述观测数据训练得到。
在一些实施例中,所述获取目标用户群体在多个离散的观测时间点的观测数据,包括:
对于每一个所述观测时间点,获取所述目标用户群体中各个用户对于产品的个体接受程度,并对所有所述个体接受程度取平均,以得到所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
获取所有所述观测时间点对应的平均接受程度,作为所述目标用户群体在多个离散的所述观测时间点的观测数据。
在一些实施例中,所述目标用户群体中各个用户在多个离散的所述观测时间点对于产品的个体接受程度为:
其中,所述m为所述目标用户群体中的用户数量,所述tn为所述观测时间点,所述表示第m个用户在tn观测时间点对于产品的个体接受度;
对应地,所述目标用户群体在各个离散的所述观测时间点对于产品的平均接受程度为:
其中,所述为所述目标用户群体中所有用户在tn观测时间点对于产品的平均接受程度。
在一些实施例中,所述预测模型由ODE模型根据所述观测数据训练得到,包括:
采用RNN编码器对所述观测数据进行编码转化,以得到潜在轨迹的初始状态和所述观测数据的分布函数;
将所述初始状态和所述分布函数输入至ODE模型,以得到所述潜在轨迹中与多个所述观测时间点对应的潜在状态;
采用ODE解码器对所述潜在状态进行解码,以得到与所述观测时间点对应的推算数据,其中,所述推算数据表征通过所述ODE模型所推算得到的所述目标用户群体在多个离散的观测时间点对于产品的平均接受程度;
采用所述推算数据和所述观测数据对所述ODE模型进行迭代训练,以得到所述预测模型。在一些实施例中,所述预测模型通过如下公式生成得到:
zt0~p(zt0)
zt1,zt2,...ztN=ODESolve(zt0,f,θf,t0,t1...,tN)
对于每个Xti~p(x|zti,θx)
其中,所述zt0为所述初始状态,所述p为所述分布函数,所述ODESolve(zt0,f,θf,t0,t1...,tN)为所述RNN编码器的模型,所述f用于输出所述潜在轨迹在时间上的变化梯度,所述θf为所述f的参数,所述t0为与所述初始状态对应的初始观测时间点,所述tN为所述观测时间点,所述ztN为所述潜在状态在多个所述观测时间点的数值,所述Xti为所述目标用户群体中所有用户在ti观测时间点对于产品的个体接受度,所述Xti符合所述p的分布,所述θx为所述Xti对应的函数参数。
在一些实施例中,当所述潜在轨迹服从正态分布,所述分布函数的参数包括平均值和方差;所述分布函数由如下得到:
将所述观测数据输入至RNN编码器,以得到所述平均值和所述方差;
根据所述平均值和所述方差确定所述分布函数。
在一些实施例中,在所述得到潜在轨迹的初始状态和所述观测数据的分布函数之后,所述用户意愿预测方法还包括:根据所述初始状态和所述分布函数生成得到概率函数,所述概率函数表征所述目标用户群体在时间上对于产品接受程度的实际分布情况;
对应地,所述采用ODE解码器对所述潜在状态进行解码,包括:采用ODE解码器通过所述概率函数对所述潜在状态进行解码。
在一些实施例中,所述采用所述推算数据和所述观测数据对所述ODE模型进行迭代训练,通过如下公式实现:
p(zt0)=N(0,1)
其中,所述q为所述概率函数,所述N为所述正态分布,所述{xti,ti}i为所述目标用户群体中用户在ti观测时间点对于产品的接受程度,所述μt0和所述σt0来自于所述RNN编码器得到的初始状态所述/>为{xti,ti}i对应的分布参数μti,σti。
第二方面,本发明实施例还提供了一种用户意愿预测装置,包括:
数据获取单元,用于获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个所述观测时间点的所述观测数据表征所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
数据预测单元,用于将所有所述观测数据和预测时间点输入至预测模型,以得到在所述预测时间点的预测数据,所述预测数据表征所述目标用户群体在所述预测时间点对于产品的平均接受程度,其中,所述预测模型由ODE模型根据所述观测数据训练得到。
第三方面,本发明实施例还提供了一种计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的用户意愿预测方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,存储有计算机可执行指令,所述计算机可执行指令用于执行如上述第一方面所述的用户意愿预测方法。
本发明实施例包括:获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个所述观测时间点的所述观测数据表征所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;将所有所述观测数据和预测时间点输入至预测模型,以得到在所述预测时间点的预测数据,所述预测数据表征所述目标用户群体在所述预测时间点对于产品的平均接受程度,其中,所述预测模型由ODE模型根据所述观测数据训练得到。根据本发明实施例的技术方案,由于本发明实施例的预测模型是由ODE模型根据观测数据训练得到的,而ODE模型能够接受更广泛的输入,数据集时间间隔允许是不定期的,各属性的标签允许为空值,因此可以解决模型使用受限的问题;其次,本发明实施例还能够提供更广泛的输出,不仅可以对未来较长时间跨度进行预测,也可以回顾历史轨迹进行分析;另外,本发明实施例相对于传统的RNN时间序列建模所存在的时间间隔不固定、数据稀疏以及难以形成优质的特征标签的问题,本发明实施例通过ODE模型能够弥补时间的间隔,能够准确反映出目标用户群体对于产品的接受程度的心理变化曲线,以便在接受程度的最高点实现精准营销。
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
图1是本发明一个实施例提供的用于执行用户意愿预测方法的系统架构平台的示意图;
图2是本发明一个实施例提供的用户意愿预测方法的流程图;
图3是本发明一个实施例提供的获取目标用户群体在多个离散的观测时间点的观测数据的流程图;
图4是本发明一个实施例提供的根据观测数据对ODE模型进行训练以得到预测模型的流程图;
图5是本发明一个实施例提供的ODE模型的生成示意图;
图6是本发明一个实施例提供的分布函数的获取过程的流程图;
图7是本发明一个实施例提供的概率函数的获取过程的流程图;
图8是本发明一个实施例提供的解码过程的流程图;
图9是本发明一个实施例提供的用户意愿预测装置的示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
在相关技术中,由于销售模式、生产关系和社会存款等因素影响,长期以来,保险行业呈现出一定周期性规律,这为趋势分析提供了一定基础。因此,在客户长期购买保险的行为中,提前做好预测工作,有利于实现精准营销。
然而,由于单一群体客户保险购买行为的发生时间是离散和不定期的,因此对于传统的深度学习时间序列预测模型如基于RNN(Recurrent Neural Network,深度学习递归神经网络)算法的LSTM(Long Short Term Memory,长短时记忆网络)模型,难以适用于非固定时间间隔数据和非稳定时间序列,从而导致模型使用受限。即使使用传统的深度学习时间序列预测模型进行计算,由于数据稀疏、购买时间跨度较长,导致其预测结果的准确度也较低。
基于上述情况,本发明提供了一种用户意愿预测方法、用户意愿预测装置、计算机设备和计算机可读存储介质,该用户意愿预测方法包括但不限于如下步骤:获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个观测时间点的观测数据表征目标用户群体在对应的观测时间点对于产品的平均接受程度;将所有观测数据和预测时间点输入至预测模型,以得到在预测时间点的预测数据,预测数据表征目标用户群体在预测时间点对于产品的平均接受程度,其中,预测模型由ODE模型根据观测数据训练得到。根据本发明实施例的技术方案,由于本发明实施例的预测模型是由ODE模型根据观测数据训练得到的,而ODE模型能够接受更广泛的输入,数据集时间间隔允许是不定期的,各属性的标签允许为空值,因此可以解决模型使用受限的问题;其次,本发明实施例还能够提供更广泛的输出,不仅可以对未来较长时间跨度进行预测,也可以回顾历史轨迹进行分析;另外,本发明实施例相对于传统的RNN时间序列建模所存在的时间间隔不固定、数据稀疏以及难以形成优质的特征标签的问题,本发明实施例通过ODE模型能够弥补时间的间隔,能够准确反映出目标用户群体对于产品的接受程度的心理变化曲线,以便在接受程度的最高点实现精准营销。
下面结合附图,对本发明实施例作进一步阐述。
如图1所示,图1是本发明一个实施例提供的用于执行用户意愿预测方法的系统架构平台的示意图。
在图1的示例中,该系统架构平台100包括有处理器110和存储器120,其中,处理器110和存储器120可以通过总线或者其他方式连接,图1中以通过总线连接为例。
存储器120作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外,存储器120可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器120可选包括相对于处理器110远程设置的存储器,这些远程存储器可以通过网络连接至该系统架构平台。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
本领域技术人员可以理解的是,该系统架构平台可以应用于3G通信网络系统、LTE通信网络系统、5G通信网络系统以及后续演进的移动通信网络系统等,本实施例对此并不作具体限定。
本领域技术人员可以理解的是,图1中示出的系统架构平台并不构成对本发明实施例的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
在图1所示的系统架构平台中,处理器110可以调用储存在存储器120中的用户意愿预测程序,从而执行用户意愿预测方法。
基于上述系统架构平台,下面提出本发明的用户意愿预测方法的各个实施例。
如图2所示,图2是本发明一个实施例提供的用户意愿预测方法的流程图,该方法包括但不限于有步骤S100和步骤S200。
步骤S100、获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个观测时间点的观测数据表征目标用户群体在对应的观测时间点对于产品的平均接受程度;
步骤S200、将所有观测数据和预测时间点输入至预测模型,以得到在预测时间点的预测数据,预测数据表征目标用户群体在预测时间点对于产品的平均接受程度,其中,预测模型由ODE模型根据观测数据训练得到。
根据本发明实施例的技术方案,由于本发明实施例的预测模型是由ODE(OrdinaryDifferential Equation,常微分方程)模型根据观测数据训练得到的,而ODE模型能够接受更广泛的输入,数据集时间间隔允许是不定期的,各属性的标签允许为空值,因此可以解决模型使用受限的问题;其次,本发明实施例还能够提供更广泛的输出,不仅可以对未来较长时间跨度进行预测,也可以回顾历史轨迹进行分析;另外,本发明实施例相对于传统的RNN时间序列建模所存在的时间间隔不固定、数据稀疏以及难以形成优质的特征标签的问题,本发明实施例通过ODE模型能够弥补时间的间隔,能够准确反映出目标用户群体对于产品的接受程度的心理变化曲线,以便在接受程度的最高点实现精准营销。
另外,如图3所示,图3是本发明一个实施例提供的获取目标用户群体在多个离散的观测时间点的观测数据的流程图,关于上述步骤S100中的获取目标用户群体在多个离散的观测时间点的观测数据,包括但不限于有步骤S310和步骤S320。
步骤S310、对于每一个观测时间点,获取目标用户群体中各个用户对于产品的个体接受程度,并对所有个体接受程度取平均,以得到目标用户群体在对应的观测时间点对于产品的平均接受程度;
步骤S320、获取所有观测时间点对应的平均接受程度,作为目标用户群体在多个离散的观测时间点的观测数据。
需要说明的是,关于目标用户群体中各个用户在多个离散的观测时间点对于产品的个体接受程度,可以参照如下公式:
其中,m为目标用户群体中的用户数量,tn为观测时间点,表示第m个用户在tn观测时间点对于产品的个体接受度。
另外,需要说明的是,关于目标用户群体在各个离散的观测时间点对于产品的平均接受程度,可以参照如下公式:
其中,为目标用户群体中所有用户在tn观测时间点对于产品的平均接受程度。
基于上述图3中的方法步骤,本发明实施例提出了一个关于观测数据的获取过程的实施例,具体如下:
首先,在实际情况下,会根据用户画像提前聚类拉取目标用户群体的名单,即客户的电话号码。由于同一批画像的名单用户具有相似行为模式,那么可以进行整体行为轨迹预测。在实际电话销售环节中,销售团队不会根据名单系顺序逐一完成,而是对多个名单进行异步处理。示例性地,销售团队对着一批名单连续拨打两到三天,但并没有拨打完所有电话号码,过了两个星期,接着拨打完成。等过了数月,又会重复使用这批名单。因此,销售团队对于同一批名单拨打时间为T={t1,t2,,……tn},其中,ti到ti+1为非固定时间间隔。单个用户可表示为/>其中,/>表示用户在tn观测时间点对于产品的接受程度。若用户xi在tn时刻没有被拨打电话,那么/>可以被记录为空值。在每次营销中会记录该客户的反馈,具体分为如下情况:第一种情况:客户直接挂断了电话;第二种情况:客户有听客服介绍,但表示目前没有兴趣;第三种情况:顾客有听客服介绍,并表示以后可能会感兴趣;第四种情况:客户听取了客服介绍,并表示想咨询更多具体信息;第五种情况:客户在和销售达成了成交的共识。对于上述这五种情况,可以转换表示为用户对于产品的接受程度,从低到高以离散值的形式表示,即/>每个值对应客户的反馈情况,即客户对于产品的接受程度。
接着,经过上述关于名单中各个客户对于产品的接受程度的收集之后,可以得到如下初始数据模型,即目标用户群体中各个用户在多个离散的观测时间点对于产品的个体接受程度,具体可以参照如下公式:
其中,m为目标用户群体中的用户数量,即名单中的用户数量;tn为观测时间点,表示第m个用户在tn观测时间点对于产品的个体接受度;/>为名单。
然后,为了能够对整体进行行为模式分析,本发明实施例选取xi在各个观测时间点上的平均数入模,即目标用户群体在时间轴T上对于产品的平均接受程度为
另外,如图4所示,图4是本发明一个实施例提供的根据观测数据对ODE模型进行训练以得到预测模型的流程图,关于预测模型的生成过程包括但不限于有步骤S410、步骤S420、步骤S430和步骤S440。
步骤S410、采用RNN编码器对观测数据进行编码转化,以得到潜在轨迹的初始状态和观测数据的分布函数;
步骤S420、将初始状态和分布函数输入至ODE模型,以得到潜在轨迹中与多个观测时间点对应的潜在状态;
步骤S430、采用ODE解码器对潜在状态进行解码,以得到与观测时间点对应的推算数据,其中,推算数据表征通过ODE模型所推算得到的目标用户群体在多个离散的观测时间点对于产品的平均接受程度;
步骤S440、采用推算数据和观测数据对ODE模型进行迭代训练,以得到预测模型。
具体地,当获取到观测数据之后,本发明实施例可以将观测数据输入至RNN编码器,接着RNN编码器会进行编码转化,得到所需要的潜在轨迹的初始状态和观测数据的分布函数,接着再将初始状态和分布函数输入至ODE模型,通过ODE模型会得到潜在轨迹的潜在状态,其中,潜在状态对应于多个观测时间点;接着本发明实施例会采用ODE解码器对潜在状态进行解码,得到与观测时间点对应的推算数据,该推算数据是ODE模型所推算出来的目标用户群体在多个离散的观测时间点对于产品的平均接受程度,具体地,由于推算数据和观测数据会存在一定的差异,因此,本发明实施例最后还会采用推算数据和观测数据对ODE模型进行迭代训练,直至推算数据和观测数据之间的差异满足预设条件,则表明ODE模型已经训练得足够准确,并将迭代训练后的ODE模型作为本发明实施例中的预测模型。
需要说明的是,关于上述的预测模型,可以通过如下公式生成得到:
zt0~p(zt0)
zt1,zt2,...ztN=ODESolve(zt0,f,θf,t0,t1...,tN)
对于每个Xti~p(x|zti,θx)
其中,zt0为初始状态,p为分布函数,ODESolve(zt0,f,θf,t0,t1...,tN)为RNN编码器的模型,f用于输出潜在轨迹在时间上的变化梯度,θf为f的参数,t0为与初始状态对应的初始观测时间点,tN为观测时间点,ztN为潜在状态在多个观测时间点的数值,Xti为目标用户群体中所有用户在ti观测时间点对于产品的个体接受度,Xti符合p的分布,θx为Xti对应的函数参数。
基于上述图4中的方法步骤,本发明实施例提出了基于ODE算法的优化和实现原理的实施例,如图5所示,图5是本发明一个实施例提供的ODE模型的生成示意图,具体原理过程如下:
模型输入的数据为上述的观测数据该观测数据为一组离散值,表征了整体的目标用户群体在各个离散的观测时间点对于产品的平均接受程度。为了能够预测用户在未来任意时间的购买意愿,本发明实施例引入了常微分方程的解法。首先,将/>定义成一个连续的时间序列的生成模型,对应的时间序列可以由一条潜在轨迹Z来表示,对应的每个时间节点可以称之为潜在状态。潜在轨迹由其初始状态zt0和全局潜在状态的时间序列来定义。具体方式为:给出观测时间t0,t1...,tN和初始状态zt0,其中,初始状态zt0由RNN编码器定义,ODE解码器可以给出zt1...ztN的数值,即潜在状态在每个观测时间点的值,该生成模型过程可以通过如下公式表示:
zt0~p(zt0)
zt1,zt2,...ztN=ODESolve(zt0,f,θf,t0,t1...,tN)
对于每个Xti~p(x|zti,θx,)
其中,zt0表示潜在轨迹的初始状态,关于Z分布函数p表示潜在轨迹上客户接受度随时间分布情况。另外,zt1,zt2,...ztN由ODE模型计算得到,θf为函数f的参数,f可以输出潜在轨迹Z在时间上的变化梯度。另外,Xti符合p的分布,并获得对应函数图像的参数θx。
另外,如图6所示,图6是本发明一个实施例提供的分布函数的获取过程的流程图,当潜在轨迹服从正态分布,那么分布函数的参数会包括平均值和方差,因此,分布函数由如下步骤得到,包括但不限于有步骤S510和步骤S520。
步骤S510、将观测数据输入至RNN编码器,以得到平均值和方差;
步骤S520、根据平均值和方差确定分布函数。
具体地,参照图5所示,当潜在轨迹服从正态分布时,分布函数的参数会包括平均值μ和方差σ,因此,本发明实施例中的RNN编码器会首先根据观测数据计算得到所需要的平均值μ和方差σ,当确定了平均值μ和方差σ之后本发明实施例就能够确定最终的分布函数。
另外,如图7所示,图7是本发明一个实施例提供的概率函数的获取过程的流程图,在步骤S410之后,本发明实施例的用户意愿预测方法还包括但不限于有步骤S600。
步骤S600、根据初始状态和分布函数生成得到概率函数,概率函数表征目标用户群体在时间上对于产品接受程度的实际分布情况。
基于上述图7中的方法步骤,如图8所示,图8是本发明一个实施例提供的解码过程的流程图,关于步骤S430中的采用ODE解码器对潜在状态进行解码,包括但不限于有步骤S700。
步骤S700、采用ODE解码器通过概率函数对潜在状态进行解码。
具体地,当得到潜在轨迹中与多个观测时间点对应的潜在状态之后,为了可以得到潜在状态所对应的推算数据,本发明实施例会通过概率函数对潜在状态进行解码,以得到推算数据。
需要说明的是,关于上述步骤S440中的采用推算数据和观测数据对ODE模型进行迭代训练,通过如下公式实现:
p(zt0)=N(0,1)
其中,q为概率函数,N为正态分布,{xti,ti}i为目标用户群体中用户在ti观测时间点对于产品的接受程度,μt0和σt0来自于RNN编码器得到的初始状态为{xti,ti}i对应的分布参数μti,σti。
基于上述图2至图8中的方法步骤,本发明实施例提出了训练潜在轨迹的ODE模型的详细实施例,具体如下:
为了得到潜在轨迹的初始状态,本发明实施例采用RNN编码器将观测数据进行转化,从而得到他的初始状态zt0和分布函数p,并生成关于{xti,ti}概率函数/>q表示目标用户群体在时间轴T上的对于产品的接受程度的实际分布情况,/>为参数。当Z服从标准正态分布N时,则分布函数p的参数即为平均值μ和方差σ。观测数据/>表示用户实际心理变化的离散过程,/>经过RNN编码得到zt0和p,再经过ODE模型得到得到潜在轨迹Z={zt1,zt2,...ztN},Z经过ODE解码器后能返回用户心理变化曲线即推算数据,并将推算数据和观测数据/>进行比较,通过两者拟合的效果能够验证ODE模型的准确性。对于预测用户未来不定期购买保险的时间,只需要将分布在未来轨迹上的zti解码之后便能得到,模型的详细算法如下:
首先,通过观测数据运行RNN编码器,并且推断zt0上的后验参数:
其中,μt0,σt0来自于RNN编码器得到的初始状态表示{xti,ti}i对应的分布参数μti,σti。
然后,从zt0~q(zt0|{xti,ti}i)中采样,输入ODE模型。
接着,利用ODE模型ODESolve(zt0,f,θf,t0,t1...,tN)输出其中f可以输出z在t上的梯度dz(t)/dt。基于函数f具有时间不变性,它接收当下时间的Z值并且输出它的结果f(z(t),θf),因此本发明实施例可以用一个神经元来参数化函数f,即参数θf,得到这个ODE解码器。
最后,利用泊松似然方法,则损失函数使用ELBO函数。此函数能表示经过ODE解码之后,返回的预测值xti即推算数据和实际xti即观测数据的拟合度,并将其最大化进行迭代,优化模型参数,其中:
p(zt0)=N(0,1)
经过多次迭代以后,直至经过ODE解码后的推算数据基本能拟合用户实际心理变化曲线程度,才完成ODE模型的训练,即得到上述的预测模型。
当得到训练好的预测模型之后,因为f是非线性时不变的,对于任意的潜在状态z(t),整个潜在轨迹都有其对应的定义。外推这个潜在轨迹,可以及时向前预测或者反向推演。如图5所示,延伸部分即在tN+1之后的部分,这样就可以推算出目标用户群体在不同时间点对于产品的接受程度,即目标用户群体对于购买产品意愿的心理变化路程,有利于保险公司针对性地采取合适的营销策略,实现收益最大化。
基于上述用户意愿预测方法,下面分别提出本发明的用户意愿预测装置、计算机设备和计算机可读存储介质的各个实施例。
如图9所示,图9是本发明一个实施例提供的用户意愿预测装置的示意图。本发明实施例的用户意愿预测装置200包括但不限于数据获取单元210和数据预测单元220。
具体地,数据获取单元210用于获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个观测时间点的观测数据表征目标用户群体在对应的观测时间点对于产品的平均接受程度;数据预测单元220用于将所有观测数据和预测时间点输入至预测模型,以得到在预测时间点的预测数据,预测数据表征目标用户群体在预测时间点对于产品的平均接受程度,其中,预测模型由ODE模型根据观测数据训练得到。
值得注意的是,本发明实施例的用户意愿预测装置的具体实施方式及对应的技术效果,可对应参照上述用户意愿预测方法的具体实施方式及对应的技术效果。
另外,本发明的一个实施例还提供了一种计算机设备,该计算机设备包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序。
处理器和存储器可以通过总线或者其他方式连接。
需要说明的是,本实施例中的计算机设备,可以应用于如图1所示实施例中的系统架构平台,本实施例中的计算机设备,能够构成图1所示实施例中的系统架构平台的一部分,两者属于相同的发明构思,因此两者具有相同的实现原理以及有益效果,此处不再详述。
实现上述实施例的用户意愿预测方法所需的非暂态软件程序以及指令存储在存储器中,当被处理器执行时,执行上述实施例的用户意愿预测方法,例如,执行以上描述的图2至图4以及图6至图8中的方法步骤。
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机可执行指令,计算机可执行指令用于执行上述的用户意愿预测方法。例如,被上述用户意愿预测装置的一个处理器执行,可使得上述处理器执行上述实施例中的用户意愿预测方法,例如,执行以上描述的图2至图4以及图6至图8中的方法步骤。
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包括计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的共享条件下还可作出种种等同的变形或替换,这些等同的变形或替换均包括在本发明权利要求所限定的范围内。
Claims (8)
1.一种用户意愿预测方法,其特征在于,包括:
获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个所述观测时间点的所述观测数据表征所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
将所有所述观测数据和预测时间点输入至预测模型,以得到在所述预测时间点的预测数据,所述预测数据表征所述目标用户群体在所述预测时间点对于产品的平均接受程度,其中,所述预测模型由ODE模型根据所述观测数据训练得到;
其中,所述预测模型通过如下公式生成得到:
zt0~p(zt0)
zt1,zt2,...ztN=ODESolve(zt0,f,θf,t0,t1...,tn)
对于每个Xti~p(x|zti,θx)
其中,所述zt0为初始状态,所述p为分布函数,所述ODESolve(zt0,f,θf,t0,t1...,tn)为RNN编码器的模型,所述f用于输出潜在轨迹在时间上的变化梯度,所述θf为所述f的参数,所述t0为与所述初始状态对应的初始观测时间点,所述tn为所述观测时间点,所述ztN为潜在状态在第N个所述观测时间点的数值,所述Xti为所述目标用户群体中所有用户在ti观测时间点对于产品的个体接受度,所述Xti符合所述p的分布,所述θx为所述Xti对应的函数参数,所述zti为所述潜在状态在第i个所述观测时间点的数值;
其中,所述ODE模型的迭代训练,通过如下公式实现:
其中,所述q为概率函数,所述N为正态分布,所述{xti,ti}i为所述目标用户群体中用户在ti观测时间点对于产品的接受程度,所述μt0和所述σt0来自于所述RNN编码器得到的初始状态所述/>为{xti,ti}i对应的分布参数μti,σti。
2.根据权利要求1所述的用户意愿预测方法,其特征在于,所述获取目标用户群体在多个离散的观测时间点的观测数据,包括:
对于每一个所述观测时间点,获取所述目标用户群体中各个用户对于产品的个体接受程度,并对所有所述个体接受程度取平均,以得到所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
获取所有所述观测时间点对应的平均接受程度,作为所述目标用户群体在多个离散的所述观测时间点的观测数据。
3.根据权利要求2所述的用户意愿预测方法,其特征在于,所述目标用户群体中各个用户在多个离散的所述观测时间点对于产品的个体接受程度为:
其中,所述m为所述目标用户群体中的用户数量,所述tn所述观测时间点,所述表示第m个用户在tn观测时间点对于产品的个体接受度;
对应地,所述目标用户群体在各个离散的所述观测时间点对于产品的平均接受程度为:
其中,所述为所述目标用户群体中所有用户在tn观测时间点对于产品的平均接受程度。
4.根据权利要求3所述的用户意愿预测方法,其特征在于,所述预测模型由ODE模型根据所述观测数据训练得到,包括:
采用RNN编码器对所述观测数据进行编码转化,以得到潜在轨迹的初始状态和所述观测数据的分布函数;
将所述初始状态和所述分布函数输入至ODE模型,以得到所述潜在轨迹中与多个所述观测时间点对应的潜在状态;
采用ODE解码器对所述潜在状态进行解码,以得到与所述观测时间点对应的推算数据,其中,所述推算数据表征通过所述ODE模型所推算得到的所述目标用户群体在多个离散的观测时间点对于产品的平均接受程度;
采用所述推算数据和所述观测数据对所述ODE模型进行迭代训练,以得到所述预测模型。
5.根据权利要求4所述的用户意愿预测方法,其特征在于,在所述得到潜在轨迹的初始状态和所述观测数据的分布函数之后,所述用户意愿预测方法还包括:根据所述初始状态和所述分布函数生成得到概率函数,所述概率函数表征所述目标用户群体在时间上对于产品接受程度的实际分布情况;
对应地,所述采用ODE解码器对所述潜在状态进行解码,包括:采用ODE解码器通过所述概率函数对所述潜在状态进行解码。
6.一种用户意愿预测装置,其特征在于,包括:
数据获取单元,用于获取目标用户群体在多个离散的观测时间点的观测数据,其中,每个所述观测时间点的所述观测数据表征所述目标用户群体在对应的所述观测时间点对于产品的平均接受程度;
数据预测单元,用于将所有所述观测数据和预测时间点输入至预测模型,以得到在所述预测时间点的预测数据,所述预测数据表征所述目标用户群体在所述预测时间点对于产品的平均接受程度,其中,所述预测模型由ODE模型根据所述观测数据训练得到;
其中,所述预测模型通过如下公式生成得到:
zt0~p(zt0)
zt1,zt2,...ztN=ODESolve(zt0,f,θf,t0,t1...,tn)
对于每个Xti~p(x|zti,θx)
其中,所述zt0为初始状态,所述p为分布函数,所述ODESolve(zt0,f,θf,t0,t1...,tn)为RNN编码器的模型,所述f用于输出潜在轨迹在时间上的变化梯度,所述θf为所述f的参数,所述t0为与所述初始状态对应的初始观测时间点,所述tn为所述观测时间点,所述ztN为潜在状态在第N个所述观测时间点的数值,所述Xti为所述目标用户群体中所有用户在ti观测时间点对于产品的个体接受度,所述Xti符合所述p的分布,所述θx为所述Xti对应的函数参数,所述zti为所述潜在状态在第i个所述观测时间点的数值;
其中,所述ODE模型的迭代训练,通过如下公式实现:
其中,所述q为概率函数,所述N为正态分布,所述{xti,ti}i为所述目标用户群体中用户在ti观测时间点对于产品的接受程度,所述μt0和所述σt0来自于所述RNN编码器得到的初始状态所述/>为{xti,ti}i对应的分布参数μti,σti。
7.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至5中任意一项所述的用户意愿预测方法。
8.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,所述计算机可执行指令用于执行如权利要求1至5中任意一项所述的用户意愿预测方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700856.XA CN113435927B (zh) | 2021-06-23 | 2021-06-23 | 用户意愿预测方法、装置、设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110700856.XA CN113435927B (zh) | 2021-06-23 | 2021-06-23 | 用户意愿预测方法、装置、设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113435927A CN113435927A (zh) | 2021-09-24 |
CN113435927B true CN113435927B (zh) | 2024-04-09 |
Family
ID=77753706
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110700856.XA Active CN113435927B (zh) | 2021-06-23 | 2021-06-23 | 用户意愿预测方法、装置、设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113435927B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116562357B (zh) * | 2023-07-10 | 2023-11-10 | 深圳须弥云图空间科技有限公司 | 点击预测模型训练方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363650A (zh) * | 2019-06-27 | 2019-10-22 | 上海淇毓信息科技有限公司 | 一种存量用户动支意愿预测方法、装置和系统 |
CN110490717A (zh) * | 2019-09-05 | 2019-11-22 | 齐鲁工业大学 | 基于用户会话及图卷积神经网络的商品推荐方法及系统 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AU2002951543A0 (en) * | 2002-09-20 | 2002-10-03 | Neurotech Research Pty Limited | Condition analysis |
-
2021
- 2021-06-23 CN CN202110700856.XA patent/CN113435927B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110363650A (zh) * | 2019-06-27 | 2019-10-22 | 上海淇毓信息科技有限公司 | 一种存量用户动支意愿预测方法、装置和系统 |
CN110490717A (zh) * | 2019-09-05 | 2019-11-22 | 齐鲁工业大学 | 基于用户会话及图卷积神经网络的商品推荐方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN113435927A (zh) | 2021-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11521221B2 (en) | Predictive modeling with entity representations computed from neural network models simultaneously trained on multiple tasks | |
US20150254554A1 (en) | Information processing device and learning method | |
CN111124840A (zh) | 业务运维中告警的预测方法、装置与电子设备 | |
Singh et al. | Software effort estimation by genetic algorithm tuned parameters of modified constructive cost model for nasa software projects | |
CN107153874A (zh) | 水质预测方法及系统 | |
Araújo et al. | Hybrid morphological methodology for software development cost estimation | |
US20210201176A1 (en) | System and method of machine learning based deviation prediction and interconnected-metrics derivation for action recommendations | |
CN110334208B (zh) | 基于贝叶斯信念网络的lkj故障预测诊断方法和系统 | |
CN110110372B (zh) | 一种用户时序行为自动切分预测方法 | |
CN113360848A (zh) | 一种时序数据预测方法及装置 | |
CN116402352A (zh) | 一种企业风险预测方法、装置、电子设备及介质 | |
CN113435927B (zh) | 用户意愿预测方法、装置、设备和存储介质 | |
CN113988264A (zh) | 获得用于执行流量预测业务的图神经网络的方法及装置 | |
Tellez et al. | An Assure AI Bot (AAAI bot) | |
Jiang et al. | Deep learning with regularized robust long‐and short‐term memory network for probabilistic short‐term load forecasting | |
Zhang et al. | Collaborated online change-point detection in sparse time series for online advertising | |
CN115564059A (zh) | 训练模型的方法及装置 | |
US12105770B2 (en) | Estimation device, estimation method, and computer program product | |
Luo et al. | Fused gromov-wasserstein alignment for hawkes processes | |
He et al. | Singular-Value Decomposition Feature-Extraction Method for Cost-Performance Prediction | |
Karpukhin et al. | HoTPP Benchmark: Are We Good at the Long Horizon Events Forecasting? | |
Theis et al. | Masking neural networks using reachability graphs to predict process events | |
Prabhu et al. | Generative Adversarial Network with Soft-Dynamic Time Warping and Parallel Reconstruction for Energy Time Series Anomaly Detection | |
Branchi et al. | Recommending the optimal policy by learning to act from temporal data | |
Kemp | Gamma test analysis tools for non-linear time series |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |