CN113298321B - 一种基于多数据融合的用户意图预测方法 - Google Patents

一种基于多数据融合的用户意图预测方法 Download PDF

Info

Publication number
CN113298321B
CN113298321B CN202110692537.9A CN202110692537A CN113298321B CN 113298321 B CN113298321 B CN 113298321B CN 202110692537 A CN202110692537 A CN 202110692537A CN 113298321 B CN113298321 B CN 113298321B
Authority
CN
China
Prior art keywords
neural network
data
access
user
multilayer neural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110692537.9A
Other languages
English (en)
Other versions
CN113298321A (zh
Inventor
林正春
兰林
陈功文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Chace Network Information Technology Co ltd
Original Assignee
Shenzhen Chace Network Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Chace Network Information Technology Co ltd filed Critical Shenzhen Chace Network Information Technology Co ltd
Priority to CN202110692537.9A priority Critical patent/CN113298321B/zh
Publication of CN113298321A publication Critical patent/CN113298321A/zh
Application granted granted Critical
Publication of CN113298321B publication Critical patent/CN113298321B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Molecular Biology (AREA)
  • Development Economics (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种基于多数据融合的用户意图预测方法,该方法包括以下步骤:采集用户在平台的访问地址、抵达时间、访问频率和访问时长等访问记录数据,并对访问记录数据进行数据融合;融合后的访问记录数据输入多层神经网络进行离散化,得到用户目标结果数据和多层神经网络的输出向量;计算多层神经网络输出向量中各分量的维度值,选出大于阈值的维度值,阈值为多层神经网络的输出向量的松紧控制因子;根据选出的维度值映射回目标结果数据对应的访问记录数据,即为用户意图的预测结果。通过本发明可以有效的降低预测用户意图的时间复杂度、提高算法的计算效率、使数据变得更加完整,提高数据分析结果的准确性,满足快速引导用户使用网络平台的需求。

Description

一种基于多数据融合的用户意图预测方法
技术领域
本发明涉及网络信息技术领域,特别涉及一种基于多数据融合的用户意图预测方法。
背景技术
随着科技的发展,网络营销已经成为一种成熟的商业模式,企业通过网站建设获得用户,为用户提供的信息、商业服务,用户对于网页看似随意的访问轨迹隐藏着许多信息与该用户实际需要的商业服务之间存在很强的关联关系。如果能通过用户访问地址、抵达频率、访问频率量、访问时长及跳出率等访问记录数据预测用户的访问意图,就帮助用户更好地使用企业网站,找到自己需要的商业服务,更好地引导用户使用企业网站平台。
在预测用户对于网页的访问特点与实际购买商业信息、服务之间关系的方法中,应用最广泛的方法是通过访客行为数据进行判断,通过用户访问行为数据,预测用户意图,这种方法预算量大、预测得到的结果往往与用户实际意图产生偏差较大。针对这种方法的缺陷,现有的方法是通过对访客行为指标的效果影响因子权重进行判定,从而得出网站运行的准确判断结果,但是这种方法时间复杂度较高、计算效率低,无法满足快速引导用户使用网络平台的需求。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于多数据融合的用户意图预测方法,降低用户意图预测的时间复杂度,提高预算效率,以更好地引导用户使用平台。
本发明的目的是通过以下技术方案来实现的:
一种基于多数据融合的用户意图预测方法,包括以下步骤:
(1)采集用户在平台的访问记录数据,并对访问记录数据进行数据融合;
(2)融合后的访问记录数据输入多层神经网络进行离散化,得到用户目标结果数据和多层神经网络的输出向量;
(3)计算多层神经网络输出向量中各分量的维度值,选出大于阈值的维度值,所述阈值为多层神经网络的输出向量的松紧控制因子;
(4)根据选出的维度值映射回目标结果数据对应的访问记录数据,即为用户意图的预测结果。
进一步的,步骤(1)中访问记录数据包括访问地址、抵达时间、访问频率和访问时长;对访问记录数据进行数据融合的具体步骤为:
1.a、用四字节的正整数对访问地址进行编号为N1
1.b、采用四字节的时间截记录抵达时间精度到毫秒为N2
1.c、用四字节的正整数记录访问频率,并记录访客每分钟的访问次数为N3;
1.d、采用四字节的正整数记录访问时长精度到秒为N4
1.e、将步骤1.a~1.d中得到的数字Ni顺序排列成一个n×1的向量x,i=1,2,3,4,n=4;所述向量x的每一维为信号的一个通道;
1.f、设用户的访问记录数据有m组,将m组访问记录数据融合为n个通道的m组信号
Figure BDA0003127296890000022
进一步的,所述步骤(2)具体为:
2.a、信号X的每个通道作为多层神经网络的输入,得到M项用户目标结果数据yj,j=1,2,...,M;
2.b、多层神经网络采用激励函数对用户目标结果数据yj进行训练得到网络参数,即多层神经网络的输出向量。
进一步的,所述激励函数为ReLu函数。
进一步的,所述步骤2.b具体为:
多层神经网络将M项用户目标结果数据yj,顺序排列成一个M×1的向量y=(y1,y2,…,yM)T,yj∈{0,1},j=1,2,...,M;信号X未输入多层神经网络时,初始值为y=(0,0,...,0)T
信号X输入多层神经网络时,通过激励函数计算各项用户目标结果数据,若用户目标结果数据第j项存在,则yj=1;若用户目标结果数据第j项不存在,则yj=0;计算
Figure BDA0003127296890000021
并由多层神经网络输出。
进一步的,所述步骤(3)具体为:
计算多层神经网络的输出向量
Figure BDA0003127296890000031
中分量的维度值
Figure BDA0003127296890000032
j=1,2,...M,选出大于阈值ε的维度值,其中0≤ε≤1。
本发明的有益效果是:采集用户在平台的访问记录数据,并对访问记录数据进行数据融合及离散化,将访问记录数据向量化,可以有效的降低预测用户用途的时间复杂度、提高算法计算效率、使数据变得更加完整,提高数据分析结果的准确性。访问记录数据进行数据融合及离散化后,得到的用户目标结果数据和多层神经网络的输出向量,通过多层神经网络的输出向量的松紧控制因子预测用户意图,克服预测得到的结果与用户实际意图容易产生偏差的缺陷。
附图说明
图1为本发明一种基于多数据融合的用户意图预测方法的结构示意图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
本发明提供了一种基于多数据融合的用户意图预测方法,包括以下步骤:
(1)采集用户在平台的访问地址、抵达时间、访问频率和访问时长等访问记录数据,并对访问记录数据进行数据融合,具体步骤为:
1.a、用四字节的正整数对访问地址进行编号为N1
1.b、采用四字节的时间截记录抵达时间精度到毫秒为N2
1.c、用四字节的正整数记录访问频率,并记录访客每分钟的访问次数为N3;
1.d、采用四字节的正整数记录访问时长精度到秒为N4
1.e、将步骤1.a~1.d中得到的数字Ni顺序排列成一个n×1的向量x,i=1,2,3,4,n=4;所述向量x的每一维为信号的一个通道;
1.f、设用户的访问记录数据有m组,将m组访问记录数据融合为n个通道的m组信号
Figure BDA0003127296890000033
对访问记录数据进行融合,使访问记录数据量化,使数据变得更加完整,减小运算的时间复杂度和使用空间,提高计算效率及数据分析结果的准确性。
(2)融合后的访问记录数据输入多层神经网络进行离散化,得到用户目标结果数据和多层神经网络的输出向量;具体步骤为:
2.a、信号X的每个通道作为多层神经网络的输入,得到M项用户目标结果数据yj,j=1,2,...,M;
2.b、多层神经网络采用激励函数对用户目标结果数据yj进行训练得到网络参数,即多层神经网络的输出向量。通过多层神经网络对融合后的访问记录数据进行离散化,将融合后的访问记录数据层次化,减少数据处理量,提高数据处理速率,克服预测得到的结果与用户实际意图容易产生偏差的缺陷。
优选的技术方案,步骤2.b具体为:
多层神经网络将M项用户目标结果数据yj,顺序排列成一个M×1的向量y=(y1,y2,…,yM)T,yj∈{0,1},j=1,2,...,M;信号X未输入多层神经网络时,初始值为y=(0,0,...,0)T
信号X输入多层神经网络时,通过激励函数计算各项用户目标结果数据,若用户目标结果数据第j项存在,则yj=1;若用户目标结果数据第j项不存在,则yj=0;计算
Figure BDA0003127296890000041
并由多层神经网络输出。
本发明优选ReLu函数作为激励函数。ReLU函数只有线性关系,在输入为正数的时候,不存在梯度消失问题,计算速度快。
(3)计算多层神经网络输出向量中各分量的维度值,选出大于阈值ε的维度值,阈值ε为多层神经网络的输出向量的松紧控制因子,具体为:
计算多层神经网络的输出向量
Figure BDA0003127296890000042
中分量的维度值
Figure BDA0003127296890000043
j=1,2,...M,选出大于阈值ε的维度值,其中0≤ε≤1。
(4)根据选出的维度值映射回目标结果数据对应的访问记录数据,即为用户意图的预测结果。
本发明通过采集用户的各项访问记录数据数据,利用对各项访问记录数据数据进行数据融合和离散化,分析用户潜在的意图,以帮助用户更好地使用平台,找到适合自己的政策,引导科技企业向政策需要的方向发展。
需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理,在本发明所公开的技术范围内,任何熟悉本技术领域的技术人员在未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都应涵盖在本发明的保护范围内。

Claims (1)

1.一种基于多数据融合的用户意图预测方法,其特征在于,包括以下步骤:
(1)采集用户在平台的访问记录数据,并对访问记录数据进行数据融合;
(2)融合后的访问记录数据输入多层神经网络进行离散化,得到用户目标结果数据和多层神经网络的输出向量,所述多层神经网络设有激励函数,所述激励函数为ReLu函数;
(3)计算多层神经网络输出向量中各分量的维度值,选出大于阈值的维度值,所述阈值为多层神经网络的输出向量的松紧控制因子;
(4)根据选出的维度值映射回目标结果数据对应的访问记录数据,即为用户意图的预测结果;
步骤(1)中访问记录数据包括访问地址、抵达时间、访问频率和访问时长;对访问记录数据进行数据融合的具体步骤为:
1.a、用四字节的正整数对访问地址进行编号为N1
1.b、采用四字节的时间截记录抵达时间精度到毫秒为N2
1.c、用四字节的正整数记录访问频率,并记录访客每分钟的访问次数为N3
1.d、采用四字节的正整数记录访问时长精度到秒为N4
1.e、将步骤1.a~1.d中得到的数字Ni顺序排列成一个n×1的向量x,所述数字Ni中的i=1,2,3,4;其中n=4;所述向量x的每一维为信号的一个通道;
1.f、设用户的访问记录数据有m组,将m组访问记录数据融合为n个通道的m组信号X=[x1,x2,…,xm];
所述步骤(2)具体为:
2.a、信号X的每个通道作为多层神经网络的输入,得到M项用户目标结果数据yj,j=1,2,…,M;
2.b、多层神经网络采用激励函数对用户目标结果数据yj进行训练得到网络参数,即多层神经网络的输出向量;
所述步骤2.b具体为:
多层神经网络将M项用户目标结果数据yj,顺序排列成一个M×1的向量y=(y1,y2,…,yj,…,yM)T,yj∈{0,1},j=1,2,…,M;信号X未输入多层神经网络时,初始值为y=(0,0,…,0)T
信号X输入多层神经网络时,通过激励函数计算各项用户目标结果数据,若用户目标结果数据第j项存在,则yj=1;若用户目标结果数据第j项不存在,则yj=0;计算
Figure FDA0003483110750000021
并由多层神经网络输出;
所述步骤(3)具体为:
计算多层神经网络的输出向量
Figure FDA0003483110750000022
中分量的维度值
Figure FDA0003483110750000023
j=1,2,…,M,选出大于阈值ε的维度值,其中0≤ε≤1。
CN202110692537.9A 2021-06-22 2021-06-22 一种基于多数据融合的用户意图预测方法 Active CN113298321B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110692537.9A CN113298321B (zh) 2021-06-22 2021-06-22 一种基于多数据融合的用户意图预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110692537.9A CN113298321B (zh) 2021-06-22 2021-06-22 一种基于多数据融合的用户意图预测方法

Publications (2)

Publication Number Publication Date
CN113298321A CN113298321A (zh) 2021-08-24
CN113298321B true CN113298321B (zh) 2022-03-11

Family

ID=77329041

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110692537.9A Active CN113298321B (zh) 2021-06-22 2021-06-22 一种基于多数据融合的用户意图预测方法

Country Status (1)

Country Link
CN (1) CN113298321B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114386688B (zh) * 2022-01-07 2022-12-06 逑美科技(上海)有限公司 一种基于多数据融合的用户意图预测方法及系统

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0676356A2 (en) * 1994-04-07 1995-10-11 Otis Elevator Company Elevator dispatching system
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法
CN111242710A (zh) * 2018-11-29 2020-06-05 北京京东尚科信息技术有限公司 业务的分类处理方法、装置、服务平台及存储介质
CN111796926A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN111798019A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 意图预测方法、装置、存储介质及电子设备
CN112132628A (zh) * 2020-09-28 2020-12-25 科大讯飞股份有限公司 一种用户意图预测方法、信息推荐方法及相关设备
CN112364664A (zh) * 2020-11-19 2021-02-12 北京京东尚科信息技术有限公司 意图识别模型的训练及意图识别方法、装置、存储介质
CN112818227A (zh) * 2021-01-29 2021-05-18 北京百度网讯科技有限公司 内容推荐方法、装置、电子设备及存储介质

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3791236A4 (en) * 2018-05-07 2022-06-08 Strong Force Iot Portfolio 2016, LLC METHODS AND SYSTEMS FOR DATA COLLECTION, LEARNING AND STREAMING MACHINE SIGNALS FOR ANALYSIS AND MAINTENANCE USING THE INDUSTRIAL INTERNET OF THINGS
CN111010565B (zh) * 2018-10-04 2023-05-16 华为技术有限公司 帧间预测方法、装置及其应用的编/解方法及装置
CN111128328A (zh) * 2019-10-25 2020-05-08 中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所) 鼻咽癌结构化影像报告及数据处理系统和方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0676356A2 (en) * 1994-04-07 1995-10-11 Otis Elevator Company Elevator dispatching system
CN108446374A (zh) * 2018-03-16 2018-08-24 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN108446374B (zh) * 2018-03-16 2019-09-20 北京三快在线科技有限公司 用户意图预测方法、装置、电子设备、存储介质
CN109635989A (zh) * 2018-08-30 2019-04-16 电子科技大学 一种基于多源异构数据融合的社交网络链路预测方法
CN111242710A (zh) * 2018-11-29 2020-06-05 北京京东尚科信息技术有限公司 业务的分类处理方法、装置、服务平台及存储介质
CN111796926A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 指令执行方法、装置、存储介质及电子设备
CN111798019A (zh) * 2019-04-09 2020-10-20 Oppo广东移动通信有限公司 意图预测方法、装置、存储介质及电子设备
CN112132628A (zh) * 2020-09-28 2020-12-25 科大讯飞股份有限公司 一种用户意图预测方法、信息推荐方法及相关设备
CN112364664A (zh) * 2020-11-19 2021-02-12 北京京东尚科信息技术有限公司 意图识别模型的训练及意图识别方法、装置、存储介质
CN112818227A (zh) * 2021-01-29 2021-05-18 北京百度网讯科技有限公司 内容推荐方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN113298321A (zh) 2021-08-24

Similar Documents

Publication Publication Date Title
Yin et al. Accurate and efficient time-domain classification with adaptive spiking recurrent neural networks
Gao et al. STAN: spatio-temporal attention network for pandemic prediction using real-world evidence
Su et al. Identifying and predicting novelty in microbiome studies
CN112258262B (zh) 一种基于卷积自注意力网络的会话推荐方法
CN110110372B (zh) 一种用户时序行为自动切分预测方法
CN113298321B (zh) 一种基于多数据融合的用户意图预测方法
CN112464281B (zh) 基于隐私分组和情感识别的网络信息分析方法
CN110968564A (zh) 一种数据处理方法及数据状态预测模型的训练方法
CN113807452B (zh) 一种基于注意力机制的业务过程异常检测方法
CN104572504A (zh) 一种实现数据预读的方法及装置
CN112052273B (zh) 一种多角度业务流程下一候选活动提取方法
Méndez-Jiménez et al. Modelling and forecasting of the radiation level time series at the Canfranc Underground Laboratory
CN112949628A (zh) 一种基于嵌入-混合的轨迹数据增强及轨迹识别方法
Usmanova Impact of E-government on Poverty Rate: A Cross-Country Empirical Assessment
CN116578400A (zh) 多任务数据处理方法和装置
Zimmermann et al. Small area estimation with a lognormal mixed model under informative sampling
Li et al. Utilizing Data Science and AI for Customer Churn Prediction in Marketing
CN112328899B (zh) 信息处理方法、信息处理装置、存储介质与电子设备
Bornmann et al. Measuring individual performance with comprehensive bibliometric reports as an alternative to h-index values
CN107908620A (zh) 一种基于工作文档预判用户职业的方法和装置
CN113792772A (zh) 一种用于数据分级混合存储的冷热数据识别方法
US20230267277A1 (en) Systems and methods for using document activity logs to train machine-learned models for determining document relevance
Liu et al. A unified sampling framework for solver searching of diffusion probabilistic models
Hamid et al. Text Classification on Social Media using Bidirectional Encoder Representations from Transformers (BERT) for Zakat Sentiment Analysis
Liu et al. Long-and short-term preference model based on graph embedding for sequential recommendation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant