CN113298321B

CN113298321B - 一种基于多数据融合的用户意图预测方法

Info

Publication number: CN113298321B
Application number: CN202110692537.9A
Authority: CN
Inventors: 林正春; 兰林; 陈功文
Original assignee: Shenzhen Chace Network Information Technology Co ltd
Current assignee: Shenzhen Chace Network Information Technology Co ltd
Priority date: 2021-06-22
Filing date: 2021-06-22
Publication date: 2022-03-11
Anticipated expiration: 2041-06-22
Also published as: CN113298321A

Abstract

本发明涉及一种基于多数据融合的用户意图预测方法，该方法包括以下步骤：采集用户在平台的访问地址、抵达时间、访问频率和访问时长等访问记录数据，并对访问记录数据进行数据融合；融合后的访问记录数据输入多层神经网络进行离散化，得到用户目标结果数据和多层神经网络的输出向量；计算多层神经网络输出向量中各分量的维度值，选出大于阈值的维度值，阈值为多层神经网络的输出向量的松紧控制因子；根据选出的维度值映射回目标结果数据对应的访问记录数据，即为用户意图的预测结果。通过本发明可以有效的降低预测用户意图的时间复杂度、提高算法的计算效率、使数据变得更加完整，提高数据分析结果的准确性，满足快速引导用户使用网络平台的需求。

Description

一种基于多数据融合的用户意图预测方法

技术领域

本发明涉及网络信息技术领域，特别涉及一种基于多数据融合的用户意图预测方法。

背景技术

随着科技的发展，网络营销已经成为一种成熟的商业模式，企业通过网站建设获得用户，为用户提供的信息、商业服务，用户对于网页看似随意的访问轨迹隐藏着许多信息与该用户实际需要的商业服务之间存在很强的关联关系。如果能通过用户访问地址、抵达频率、访问频率量、访问时长及跳出率等访问记录数据预测用户的访问意图，就帮助用户更好地使用企业网站，找到自己需要的商业服务，更好地引导用户使用企业网站平台。

在预测用户对于网页的访问特点与实际购买商业信息、服务之间关系的方法中，应用最广泛的方法是通过访客行为数据进行判断，通过用户访问行为数据，预测用户意图，这种方法预算量大、预测得到的结果往往与用户实际意图产生偏差较大。针对这种方法的缺陷，现有的方法是通过对访客行为指标的效果影响因子权重进行判定，从而得出网站运行的准确判断结果，但是这种方法时间复杂度较高、计算效率低，无法满足快速引导用户使用网络平台的需求。

发明内容

本发明的目的是克服现有技术的不足，提供一种基于多数据融合的用户意图预测方法，降低用户意图预测的时间复杂度，提高预算效率，以更好地引导用户使用平台。

本发明的目的是通过以下技术方案来实现的：

一种基于多数据融合的用户意图预测方法，包括以下步骤：

(1)采集用户在平台的访问记录数据，并对访问记录数据进行数据融合；

(2)融合后的访问记录数据输入多层神经网络进行离散化，得到用户目标结果数据和多层神经网络的输出向量；

(3)计算多层神经网络输出向量中各分量的维度值，选出大于阈值的维度值，所述阈值为多层神经网络的输出向量的松紧控制因子；

(4)根据选出的维度值映射回目标结果数据对应的访问记录数据，即为用户意图的预测结果。

进一步的，步骤(1)中访问记录数据包括访问地址、抵达时间、访问频率和访问时长；对访问记录数据进行数据融合的具体步骤为：

1.a、用四字节的正整数对访问地址进行编号为N₁；

1.b、采用四字节的时间截记录抵达时间精度到毫秒为N₂；

1.c、用四字节的正整数记录访问频率，并记录访客每分钟的访问次数为N3；

1.d、采用四字节的正整数记录访问时长精度到秒为N₄；

1.e、将步骤1.a～1.d中得到的数字N_i顺序排列成一个n×1的向量x，i＝1,2,3,4,n＝4；所述向量x的每一维为信号的一个通道；

1.f、设用户的访问记录数据有m组，将m组访问记录数据融合为n个通道的m组信号

进一步的，所述步骤(2)具体为：

2.a、信号X的每个通道作为多层神经网络的输入，得到M项用户目标结果数据y_j,j＝1,2,...,M；

2.b、多层神经网络采用激励函数对用户目标结果数据y_j进行训练得到网络参数，即多层神经网络的输出向量。

进一步的，所述激励函数为ReLu函数。

进一步的，所述步骤2.b具体为：

多层神经网络将M项用户目标结果数据y_j，顺序排列成一个M×1的向量y＝(y₁,y₂,…,y_M)^T，y_j∈{0,1}，j＝1,2,...,M；信号X未输入多层神经网络时，初始值为y＝(0，0，...，0)^T；

信号X输入多层神经网络时，通过激励函数计算各项用户目标结果数据，若用户目标结果数据第j项存在，则y_j＝1；若用户目标结果数据第j项不存在，则y_j＝0；计算

并由多层神经网络输出。

进一步的，所述步骤(3)具体为：

计算多层神经网络的输出向量

中分量的维度值

j＝1，2，...M，选出大于阈值ε的维度值，其中0≤ε≤1。

本发明的有益效果是：采集用户在平台的访问记录数据，并对访问记录数据进行数据融合及离散化，将访问记录数据向量化，可以有效的降低预测用户用途的时间复杂度、提高算法计算效率、使数据变得更加完整，提高数据分析结果的准确性。访问记录数据进行数据融合及离散化后，得到的用户目标结果数据和多层神经网络的输出向量，通过多层神经网络的输出向量的松紧控制因子预测用户意图，克服预测得到的结果与用户实际意图容易产生偏差的缺陷。

附图说明

图1为本发明一种基于多数据融合的用户意图预测方法的结构示意图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

本发明提供了一种基于多数据融合的用户意图预测方法，包括以下步骤：

(1)采集用户在平台的访问地址、抵达时间、访问频率和访问时长等访问记录数据，并对访问记录数据进行数据融合，具体步骤为：

1.a、用四字节的正整数对访问地址进行编号为N₁；

1.b、采用四字节的时间截记录抵达时间精度到毫秒为N₂；

1.d、采用四字节的正整数记录访问时长精度到秒为N₄；

对访问记录数据进行融合，使访问记录数据量化，使数据变得更加完整，减小运算的时间复杂度和使用空间，提高计算效率及数据分析结果的准确性。

(2)融合后的访问记录数据输入多层神经网络进行离散化，得到用户目标结果数据和多层神经网络的输出向量；具体步骤为：

2.b、多层神经网络采用激励函数对用户目标结果数据y_j进行训练得到网络参数，即多层神经网络的输出向量。通过多层神经网络对融合后的访问记录数据进行离散化，将融合后的访问记录数据层次化，减少数据处理量，提高数据处理速率，克服预测得到的结果与用户实际意图容易产生偏差的缺陷。

优选的技术方案，步骤2.b具体为：

并由多层神经网络输出。

本发明优选ReLu函数作为激励函数。ReLU函数只有线性关系，在输入为正数的时候，不存在梯度消失问题，计算速度快。

(3)计算多层神经网络输出向量中各分量的维度值，选出大于阈值ε的维度值，阈值ε为多层神经网络的输出向量的松紧控制因子，具体为：

计算多层神经网络的输出向量

中分量的维度值

j＝1，2，...M，选出大于阈值ε的维度值，其中0≤ε≤1。

本发明通过采集用户的各项访问记录数据数据，利用对各项访问记录数据数据进行数据融合和离散化，分析用户潜在的意图，以帮助用户更好地使用平台，找到适合自己的政策，引导科技企业向政策需要的方向发展。

需要声明的是，上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理，在本发明所公开的技术范围内，任何熟悉本技术领域的技术人员在未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都应涵盖在本发明的保护范围内。

Claims

1.一种基于多数据融合的用户意图预测方法，其特征在于，包括以下步骤：

(2)融合后的访问记录数据输入多层神经网络进行离散化，得到用户目标结果数据和多层神经网络的输出向量，所述多层神经网络设有激励函数，所述激励函数为ReLu函数；

(4)根据选出的维度值映射回目标结果数据对应的访问记录数据，即为用户意图的预测结果；

步骤(1)中访问记录数据包括访问地址、抵达时间、访问频率和访问时长；对访问记录数据进行数据融合的具体步骤为：

1.a、用四字节的正整数对访问地址进行编号为N₁；

1.b、采用四字节的时间截记录抵达时间精度到毫秒为N₂；

1.c、用四字节的正整数记录访问频率，并记录访客每分钟的访问次数为N₃；

1.d、采用四字节的正整数记录访问时长精度到秒为N₄；

1.e、将步骤1.a～1.d中得到的数字N_i顺序排列成一个n×1的向量x，所述数字N_i中的i＝1,2,3,4；其中n＝4；所述向量x的每一维为信号的一个通道；

1.f、设用户的访问记录数据有m组，将m组访问记录数据融合为n个通道的m组信号X＝[x₁，x₂，…，x_m]；

所述步骤(2)具体为：

2.a、信号X的每个通道作为多层神经网络的输入，得到M项用户目标结果数据y_j，j＝1，2，…，M；

2.b、多层神经网络采用激励函数对用户目标结果数据y_j进行训练得到网络参数，即多层神经网络的输出向量；

所述步骤2.b具体为：

多层神经网络将M项用户目标结果数据y_j，顺序排列成一个M×1的向量y＝(y₁，y₂，…，y_j，…，y_M)^T，y_j∈{0，1}，j＝1，2，…，M；信号X未输入多层神经网络时，初始值为y＝(0，0，…，0)^T；

并由多层神经网络输出；

所述步骤(3)具体为：

计算多层神经网络的输出向量

中分量的维度值

j＝1，2，…，M，选出大于阈值ε的维度值，其中0≤ε≤1。