CN114139064A - 一种信息的智能推荐方法、系统及存储介质 - Google Patents

一种信息的智能推荐方法、系统及存储介质 Download PDF

Info

Publication number
CN114139064A
CN114139064A CN202210115327.8A CN202210115327A CN114139064A CN 114139064 A CN114139064 A CN 114139064A CN 202210115327 A CN202210115327 A CN 202210115327A CN 114139064 A CN114139064 A CN 114139064A
Authority
CN
China
Prior art keywords
data
gas station
user
data set
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202210115327.8A
Other languages
English (en)
Other versions
CN114139064B (zh
Inventor
张绪生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Tianzhuo Network Co ltd
Original Assignee
Hangzhou Tianzhuo Network Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Tianzhuo Network Co ltd filed Critical Hangzhou Tianzhuo Network Co ltd
Priority to CN202210115327.8A priority Critical patent/CN114139064B/zh
Publication of CN114139064A publication Critical patent/CN114139064A/zh
Application granted granted Critical
Publication of CN114139064B publication Critical patent/CN114139064B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种信息的智能推荐方法,数据集构建:构建用户的训练数据集UD1和测试数据集UD2,构建加油站的训练数据集UG1和测试数据集UG2;分别对训练数据集和测试数据集进行预处理,对待训练的神经网络模型进行训练,得到训练后的模型M21、M22和M23;获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,得到最终的加油站推荐信息。本发明通过改进神经网络模型的激活函数,提高了模型的训练速度和准确性,通过综合考虑实际因素、用户消费、用户历史行为统计、用户信息等多维信息,为用户实现了加油站的精准推荐,为加油站提供了精准的用户维护,有效提高了用户体验和加油站的付费率。

Description

一种信息的智能推荐方法、系统及存储介质
技术领域
本发明涉及信息推荐,尤其涉及加油站相关信息的智能推荐。
背景技术
随着汽车的普及,越来越多的用户选择自驾出行,因此需要加油的情况随时可能出现,如何为用户找到合适的加油站是当前迫切需要解决的问题。现有技术在进行加油站的推荐时,通常只考虑距离等单一维度的因素,存在加油站的推荐规则模糊、推荐结果不精准等问题,即当前的加油站推荐方式没有综合考虑用户历史使用情况和加油站可能存在的福利优惠等维度。现有技术还存在推荐次序混乱,不能很好达到推荐的目的等问题。
同时,现有技术没有可以提供给加油站的完善的规则体系,帮助加油站维护优质用户,提升加油站的付费率。
发明内容
为了解决现有技术存在的上述问题,本发明设计一套基于多维度的信息智能推荐方法,从实际因素、用户消费、用户历史行为统计、用户信息进行有效归纳评分,通过评分更精准的推荐适合的加油站,提升用户体验。
本发明提供一种信息的智能推荐方法,包括以下步骤:
S1 数据集构建:分别获取用户的多维度数据和加油站的多维度数据构建用户数据集合U1和加油站的数据集合U2,利用用户数据集合U1构建用户的训练数据集UD1和测试数据集UD2,利用加油站的数据集合U2构建加油站的训练数据集UG1和测试数据集UG2
S2 数据预处理:分别对用户的训练数据集UD1和测试数据集UD2、加油站的训练数据集UG1和测试数据集UG2进行预处理,得到预处理后的PD1、PD2、PG1和PG2
S3 模型训练:选取待训练的神经网络模型M11,M12,M13,基于预处理后的PD1和PG1监督训练M11和M12,得到训练后的模型M21和M22;基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,基于综合数据集U4监督训练M13,得到训练后的模型M23
S4 加油站推荐:基于用户信息D1和模型M21获取用户特征F1;基于加油站信息D2和模型M22获取加油站特征F2;基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,得到最终的加油站推荐信息。
优选的,其中,神经网络模型M11,M12,M13采用Resnet网络,并采用下列函数对各个神经网络模型的ReLU激活函数进行改进:
Figure 100002_DEST_PATH_IMAGE001
其中,f(x)为ReLU激活函数,x为上一层神经元的输出。
优选的,所述用户的多维度数据包括用户的统计类数据、消费类数据、信息类数据,所述加油站的多维度数据包括加油站的实际因素类数据。
优选的,数据预处理具体包括:
剔除其中偏离正态分布±3σ的数据;
根据数据类型,分别对数值数据、布尔数据和条件数据进行归一化处理;
对UD1、UD2、UG1和UG2数据增加数据标签。
优选的,根据数据类型,分别对数值数据、布尔数据和条件数据进行归一化处理,具体包括:
将数值数据做归一化处理为0-1之间的小数;
将布尔数据归一化为0或1;
将条件数据按照条件数量N进行归一化处理,若条件数据满足第一个条件则条件数据值为1/N;若条件数据满足第N个条件则条件数据值为1。
优选的,对UD1、UD2、UG1和UG2数据增加数据标签,具体包括:
在UD1、UD2数据内增加用户特征标签列,增加用户类型标签,用户类型标签包括核心用户、潜在用户、老用户和新用户;
在UG1和UG2数据内增加加油站特征标签列,增加加油站特征标签,加油站特征标签包括价格便宜、有促销、客流量大和距离近。
优选的,基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,具体包括:
将用户数据集合U1和加油站的数据集合U2的并集U3分成K份,随机从K份数据集中抽取k-1份作为数据集U4。
优选的,基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,具体包括:
将用户信息D1膨胀到宽度与加油站信息D2一致的数据,得到膨胀后用户信息D3;
由加油站信息D2和膨胀后用户信息D3组成结构化数据D4,输入M23中,得到各个加油站的推荐数据D5;将各个加油站的推荐数据D5中的列数据求和作为分数,并由高到底排序,得到最终的加油站推荐信息。
优选的,智能推荐方法的服务目标至少包括用户或加油站;
若服务目标是用户时,加油站推荐信息按照每个加油站的权重分数从高到低排序,并展示加油站特征F2;若服务目标是加油站时,加油站推荐信息可直接从将用户特征F1中读取。
一种信息的智能推荐系统,所述系统包括以下模块:
数据集构建模块,分别获取用户的多维度数据和加油站的多维度数据构建用户数据集合U1和加油站的数据集合U2,利用用户数据集合U1构建用户的训练数据集UD1和测试数据集UD2,利用加油站的数据集合U2构建加油站的训练数据集UG1和测试数据集UG2
数据预处理模块,分别对用户的训练数据集UD1和测试数据集UD2、加油站的训练数据集UG1和测试数据集UG2进行预处理,得到预处理后的PD1、PD2、PG1和PG2
神经网络训练模块,选取待训练的神经网络模型M11,M12,M13,基于预处理后的PD1和PG1监督训练M11和M12,得到训练后的模型M21和M22;基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,基于综合数据集U4监督训练M13,得到训练后的模型M23
推荐信息确定模块,基于用户信息D1和模型M21获取用户特征F1;基于加油站信息D2和模型M22获取加油站特征F2;基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,得到最终的加油站推荐信息;
其中,神经网络模型采用Resnet网络,并采用下列函数对所述神经网络模型的ReLU激活函数进行改进:
Figure 211468DEST_PATH_IMAGE001
其中,f(x)为ReLU激活函数,x为上一层神经元的输出。
一种存储介质,其存储有计算机程序;当所述计算机程序被计算机设备中的处理器执行时,计算机设备执行上述任一项所述的方法。
本发明通过综合考虑实际因素、用户消费、用户历史行为统计、用户信息等多维信息,为用户实现了加油站的精准推荐,为加油站提供了精准的用户维护,有效提高了用户体验和加油站的付费率。激活函数在网络的前半段,即浅层网络,采用避免饱和的激活函数,避免了ReLU函激活函数的边界,其更平滑的曲线特征泛化性更好;在网络的后半段,即更深层次的网络,采用在深层网络不激活状态下对噪声鲁棒优势更明显的激活函数。上述改进的激活函数,在进行消费类维度、统计类维度的数据训练时,显著提高了训练速度和准确性。
附图说明
为了更清楚地说明发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明的方法流程图;
图2是Resnet18中的残差结构图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
实施例一
本发明提供一种信息的智能推荐方法,其流程图如图1所示,包括以下步骤:
S1 根据不同分类,构建训练数据集和测试数据集。
具体的,由用户的实际因素类数据、统计类数据、消费类数据、信息类数据按列顺序拼接构成用户数据集合U1,利用U1构建用户的训练数据集UD1和测试数据集UD2。例如,实际因素类数据包括距离、是否有活动等,统计类数据包括一个月内加油种类数量、一个月内购买油种类比例等,消费类数据包括一周内消耗金额、一月内消耗金额等,信息类数据包括一周内登录天数、是否是会员等,将每个维度的数据进行分类,并将所有分类情况依次作为数据构建样本集,最后写入用户总得分。其中,训练数据集为全部分类情况集合,测试数据集由手工从训练数据集中随机抽出百分之二十作为测试数据集。全部数据均写入.txt文件中。构建方法为随机从数据集中抽取80%作为UD1,将剩余的20%作为UD2;将加油站的实际因素类数据作为加油站的数据集合U2,利用U2构建加油站的训练数据集UG1和测试数据集UG2,构建方法为UD1对应的加油站数据条目作为UG1,将UD2对应的加油站数据条目集合作为UG2
作为一个实施例,训练数据集的单个数据样例(需要进行排列组合,将每一种组合情况都列入数据集)如表1所示:
表1训练数据集的单个数据样例
Figure 100002_DEST_PATH_IMAGE002
Figure DEST_PATH_IMAGE003
S2 对构建的训练数据集进行数据预处理,生成可用于训练神经网络的数据格式。
具体的,需要对数据集进行预处理,处理生成可以用来训练神经网络的格式。
先剔除其中偏离正态分布±3σ的数据,对剩余的数据进行后续处理:将数值数据做归一化处理为0-1之间的小数,将布尔数据归一化为0或1,将条件数据按照条件数量N进行归一化处理,即第一个条件满足时,该值为1/N,第N个条件满足时,该值为1;对于数值数据和布尔数据,缺省值处理为0,对于条件数据,缺省值为1/N;完成数据处理后,对UD1、UD2、UG1和UG2进行打标签操作。在UD1、UD2数据内增加用户特征标签列,并根据实际情况给用户打上:核心用户、潜在用户、老用户、新用户等标签;在UG1和UG2数据内增加加油站特征标签列,并根据实际情况给加油站打上:价格便宜、有促销、客流量大、距离近等标签;根据该预处理原则,由UD1、UD2生成PD1和PD2,由UG1、UG2生成PG1和PG2,其中PD1和PG1用于训练神经网络,PD2和PG2用于测试神经网络。
具体还可以为:
S2.1 将构建的数据集的.txt数据文件转换为.csv文件,并对其中的距离、一周内油站出售单数、一月内油站出售单数、一月内加油种类数量、一周内消费油站数、一月内消费油站数、一周内消耗金额、一个月内消耗金额、总共消费金额、一周内消耗单数、一月内消耗单数、总共消耗单数、一周内登陆天数、一个月内登陆天数等按照条件数量N进行归一化处理;对其中的是否有活动、是否送券、是否是会员等按照布尔数据进行处理;对其中的0/92/95/98号价格比国标价、一周内消费最高油站占比、一月内消费最高油站占比等按照数值行数据进行归一化处理;
作为一个实施例,可使用python实现。
S2.2 使用python中的h5py模块,将.csv文件转换为.h5文件。至此,完成数据集数据的预处理。
S3选取用于训练的神经网络模型。
具体的,用于训练的神经网络模型M11,M12,M13,其中,M11的输入层长度为15,包含30个隐藏层,输出层长度为4;M12的输入层长度为6,包含15个隐藏层,输出层长度为5;M13的输入层长度为21,包含50个隐藏层,输出层长度为4。神经网络可以采用分类效果出色的VGG或是Resnet网络,Resnet网络由于残差模块性能的优势,结果可能会更优于VGG。
S4将S2预处理后的可用于训练神经网络的数据,输入到S3选定的神经网络模型进行训练,得到最终的权值结果并用于分类。
具体的,将S2预处理后的PD1和PG1,分别输入到M11和M12中进行监督训练,得到训练后的模型M21和M22;利用PD2和PG2测试M21和M22,如果准确率大于96%则认为训练过程完成,否则重新生成UD1、UD2、UG1和UG2并重复上述过程;当M11和M12的训练过程结束后,将数据集U1和U2的并集U3分成K份,随机从K份数据集中抽取k-1份作为数据集U4,U4对U3的补集记为U5;利用U4对M13进行监督训练,得到训练后的模型M23,再利用U5作为测试数据,对M23进行测试,如果准确率大于96%则认为训练过程完成,否则重新生成U4和U5并重复上述过程。
作为一个实施例,可以用卷积神经网络模型提取特征然后进行分类与回归,例如,神经网络模型具体采用Resnet网络。其中,Resnet网络是在VGG19网络的基础上进行修改,通过短路机制加入残差单元,Resnet直接使用stride=2的卷积做下采样,并且用globalaverage pool层替换了全连接层。Resnet的一个重要设计原则是:当feature map大小降低一半时,feature map的数量增加一倍,这保持了网络层的复杂度。
Resnet相比普通网络每两层间增加了短路机制,这就形成了残差学习。总的来说,Resnet相比较传统神经网络来说,主要具有两个优势,一是残差网络可以更好的拟合分类函数以获得更高的分类精度,二是残差网络解决了网络在层数加深时优化训练上的难题。
作为一个实施例,Resnet18中的残差结构可参考图2所示。
在一优选实施例中,对ReLu激活函数进行改进,改进后的激活函数为:
Figure DEST_PATH_IMAGE004
其中,f(x)为ReLU激活函数,x为上一层神经元的输出。
上述激活函数在网络的前半段,即浅层网络,采用避免饱和的激活函数,避免了ReLU函激活函数的边界,其更平滑的曲线特征泛化性更好;在网络的后半段,即更深层次的网络,采用在深层网络不激活状态下对噪声鲁棒优势更明显的激活函数。上述改进的激活函数,在进行消费类维度、统计类维度的数据训练时,显著提高了训练速度和准确性。
S5 基于神经网络的训练结果,通过编写判别脚本实现特征提取及分类,并给出最终的推荐信息。
其中,神经网络模型M11,M12,M13采用Resnet网络,并采用下列函数对所述神经网络模型的ReLU激活函数进行改进。
具体的,根据神经网络的小类输出结果编写判别脚本,用于判断各小类得分分别属于哪个优先等级,从而达到按优先级分类的目的。
作为一个实施例,通过设计的信息点提取表格,获得统计信息后,针对不同服务目标提取不同的信息进行分析处理,并给出最终的推荐信息。
具体的,服务目标可以包括用户或加油站。
当服务目标为用户时,根据提取的特征信息进行分析处理,推荐用户更容易付费的加油站信息,提高用户体验。具体可根据以下情况进行分类:
对于新用户(注册未超过1个月)通过实际因素类总分值进行排序,分数越高优先级越高,相同分数则根据实际距离进行排序,距离越近优先级越高。
对于老用户,以用户一周内消费最高油站和一月内消费最高油站,为最高优先级显示,其次根据实际因素、统计、消费的不同分值进行不同的推荐算法。
具体的,第一种推荐算法具体包括:统计类分值≤20、消费类分值≥60,判定此类用户注重实际因素,对价格不会太敏感:直接按照距离的属性直接进行优先级排序,距离越近优先级越高,按实际情况给用户推荐最快加油的油站。
第二种推荐算法包括:统计类分值≥20、消费类分值≥60,判定此类用户注重消费体验,对于价格不会太敏感:按照周售单数和月售单数总分进行统计,总分越高油站优先级越高,总分相同按照周售单数进行排序,周售单数越高优先级越高,给用户推荐比较受欢迎的油站。
第三种推荐算法包括:统计类分值≤20、消费类分值≤60,判定此类用户注重福利和价格:按照实际因素类总分进行排序,总分越高优先级越高,给用户推荐受欢迎且性价比相对较高的油站。
第四种推荐算法包括:统计类分值≥20、消费类分值≤60,判定此类用户为平衡型用户,对于福利和价格都会考虑,且较容易提高用户粘性:按照油站是否有活动、是否有券进行排序,优先有活动、有券的油站,再按照实际距离排序,距离越近优先级越高,给用户推荐存在福利的油站。
当服务目标为加油站时,根据提取的特征信息进行分析处理,推荐加油站的优质用户/潜在用户信息,提高加油站的维护效率,提高加油站付费率。
具体的,通过统计、消费、信息等三个方面进行用户优先级排序,将在目标加油站消费过的用户分为核心用户、潜在用户、老用户、新用户的等几个方面,提高加油站的维护效率。作为一个实施例,具体分析过程如下:
核心用户:消费类分值≥60,最先记录一周内消费最高油站和一月内消费最高油站中存在目标油站的用户。这些用户粘性高,且消费能力强,适合重点关注。
潜在用户:消费类分值≥60、信息类分值≥20、统计类分值≤20,且在油站消费过的用户。这些用户没有固定的目标油站,但是消费能力强,可以深度发展成核心用户。
老用户:消费类分值≤60、信息类分值≥20、统计类分值≥20,且最先记录一周内消费最高油站和一月内消费最高油站中存在目标油站的用户。这些用户粘性高,但是消费能力较弱,可以在有活动时进行推送,提升付费。
新用户:非上述三者,且在油站消费过的用户。
本发明通过综合考虑实际因素、用户消费、用户历史行为统计、用户信息等多维信息,为用户实现了的加油站的精准推荐,为加油站提供了精准的用户维护信息,有效提高了用户体验和加油站的付费率。
为了说明的目的,前述描述使用具体命名以提供对所述实施方案的透彻理解。然而,对于本领域的技术人员而言将显而易见的是,不需要具体细节即可实践所述实施方案。因此,出于例示和描述的目的,呈现了对本文所述的具体实施方案的前述描述。这些描述并非旨在是穷举性的或将实施方案限制到所公开的精确形式。对于本领域的普通技术人员而言将显而易见的是,鉴于上面的教导内容,许多修改和变型是可行的。另外,当在本文中用于指部件的位置时,上文和下文的术语或它们的同义词不一定指相对于外部参照的绝对位置,而是指部件的参考附图的相对位置。
此外,前述附图和描述包括许多概念和特征,其可以多种方式组合以实现多种有益效果和优点。因此,可组合来自各种不同附图的特征,部件,元件和/或概念,以产生未必在本说明书中示出或描述的实施方案或实施方式。此外,在任何特定实施方案和/或实施方式中,不一定需要具体附图或说明中所示的所有特征,部件,元件和/或概念。应当理解,此类实施方案和/或实施方式落入本说明书的范围。

Claims (11)

1.一种信息的智能推荐方法,其特征在于,包括以下步骤:
S1 数据集构建:分别获取用户的多维度数据和加油站的多维度数据构建用户数据集合U1和加油站的数据集合U2,利用用户数据集合U1构建用户的训练数据集UD1和测试数据集UD2,利用加油站的数据集合U2构建加油站的训练数据集UG1和测试数据集UG2
S2 数据预处理:分别对用户的训练数据集UD1和测试数据集UD2、加油站的训练数据集UG1和测试数据集UG2进行预处理,得到预处理后的PD1、PD2、PG1和PG2
S3 模型训练:选取待训练的神经网络模型M11,M12,M13,基于预处理后的PD1和PG1监督训练M11和M12,得到训练后的模型M21和M22;基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,基于综合数据集U4监督训练M13,得到训练后的模型M23
S4 加油站推荐:基于用户信息D1和模型M21获取用户特征F1;基于加油站信息D2和模型M22获取加油站特征F2;基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,得到最终的加油站推荐信息。
2.如权利要求1所述的信息的智能推荐方法,其特征在于,其中,神经网络模型M11,M12,M13采用Resnet网络,并采用下列函数对各个神经网络模型的ReLU激活函数进行改进:
Figure DEST_PATH_IMAGE001
其中,f(x)为ReLU激活函数,x为上一层神经元的输出。
3.如权利要求1所述的信息的智能推荐方法,其特征在于,所述用户的多维度数据包括用户的统计类数据、消费类数据、信息类数据,所述加油站的多维度数据包括加油站的实际因素类数据。
4.如权利要求1所述的信息的智能推荐方法,其特征在于,数据预处理具体包括:
剔除其中偏离正态分布±3σ的数据;
根据数据类型,分别对数值数据、布尔数据和条件数据进行归一化处理;
对UD1、UD2、UG1和UG2数据增加数据标签。
5.如权利要求4所述的信息的智能推荐方法,其特征在于,根据数据类型,分别对数值数据、布尔数据和条件数据进行归一化处理,具体包括:
将数值数据做归一化处理为0-1之间的小数;
将布尔数据归一化为0或1;
将条件数据按照条件数量N进行归一化处理,若条件数据满足第一个条件则条件数据值为1/N;若条件数据满足第N个条件则条件数据值为1。
6.如权利要求4所述的信息的智能推荐方法,其特征在于,对UD1、UD2、UG1和UG2数据增加数据标签,具体包括:
在UD1、UD2数据内增加用户特征标签列,增加用户类型标签,用户类型标签包括核心用户、潜在用户、老用户和新用户;
在UG1和UG2数据内增加加油站特征标签列,增加加油站特征标签,加油站特征标签包括价格便宜、有促销、客流量大和距离近。
7.如权利要求1所述的信息的智能推荐方法,其特征在于,基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,具体包括:
将用户数据集合U1和加油站的数据集合U2的并集U3分成K份,随机从K份数据集中抽取k-1份作为数据集U4。
8.如权利要求1所述的信息的智能推荐方法,其特征在于,基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,具体包括:
将用户信息D1膨胀到宽度与加油站信息D2一致的数据,得到膨胀后用户信息D3;
由加油站信息D2和膨胀后用户信息D3组成结构化数据D4,输入M23中,得到各个加油站的推荐数据D5;将各个加油站的推荐数据D5中的列数据求和作为分数,并由高到底排序,得到最终的加油站推荐信息。
9.如权利要求8所述的信息的智能推荐方法,其特征在于,智能推荐方法的服务目标至少包括用户或加油站;
若服务目标是用户时,加油站推荐信息按照每个加油站的权重分数从高到低排序,并展示加油站特征F2;若服务目标是加油站时,加油站推荐信息可直接从将用户特征F1中读取。
10.一种信息的智能推荐系统,其特征在于,所述系统包括以下模块:
数据集构建模块,分别获取用户的多维度数据和加油站的多维度数据构建用户数据集合U1和加油站的数据集合U2,利用用户数据集合U1构建用户的训练数据集UD1和测试数据集UD2,利用加油站的数据集合U2构建加油站的训练数据集UG1和测试数据集UG2
数据预处理模块,分别对用户的训练数据集UD1和测试数据集UD2、加油站的训练数据集UG1和测试数据集UG2进行预处理,得到预处理后的PD1、PD2、PG1和PG2
神经网络训练模块,选取待训练的神经网络模型M11,M12,M13,基于预处理后的PD1和PG1监督训练M11和M12,得到训练后的模型M21和M22;基于用户数据集合U1和加油站的数据集合U2构建综合数据集U4,基于综合数据集U4监督训练M13,得到训练后的模型M23
推荐信息确定模块,基于用户信息D1和模型M21获取用户特征F1;基于加油站信息D2和模型M22获取加油站特征F2;基于用户信息D1和加油站信息D2和模型M23获取各个加油站的推荐数据,基于各个加油站的推荐数据对加油站进行排序,得到最终的加油站推荐信息;
其中,神经网络模型采用Resnet网络,并采用下列函数对所述神经网络模型的ReLU激活函数进行改进:
Figure DEST_PATH_IMAGE002
其中,f(x)为ReLU激活函数,x为上一层神经元的输出。
11.一种存储介质,其特征在于,其存储有计算机程序;当所述计算机程序被计算机设备中的处理器执行时,计算机设备执行如权利要求1-9任一项所述的方法。
CN202210115327.8A 2022-02-07 2022-02-07 一种信息的智能推荐方法、系统及存储介质 Active CN114139064B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210115327.8A CN114139064B (zh) 2022-02-07 2022-02-07 一种信息的智能推荐方法、系统及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210115327.8A CN114139064B (zh) 2022-02-07 2022-02-07 一种信息的智能推荐方法、系统及存储介质

Publications (2)

Publication Number Publication Date
CN114139064A true CN114139064A (zh) 2022-03-04
CN114139064B CN114139064B (zh) 2022-05-06

Family

ID=80381920

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210115327.8A Active CN114139064B (zh) 2022-02-07 2022-02-07 一种信息的智能推荐方法、系统及存储介质

Country Status (1)

Country Link
CN (1) CN114139064B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738277B1 (en) * 2013-03-14 2014-05-27 Honda Motor Co., Ltd. Gas station recommendation systems and methods
CN112084407A (zh) * 2020-09-08 2020-12-15 辽宁工程技术大学 一种融合图神经网络和注意力机制的协同过滤推荐方法
CN112488799A (zh) * 2020-12-14 2021-03-12 北京易兴元石化科技有限公司 一种基于加油站端的石油数据处理方法、装置及存储介质
WO2021069412A1 (de) * 2019-10-07 2021-04-15 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur betankung eines kraftfahrzeugs, kraftfahrzeug, tankstelle und computerlesbares speichermedium

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8738277B1 (en) * 2013-03-14 2014-05-27 Honda Motor Co., Ltd. Gas station recommendation systems and methods
WO2021069412A1 (de) * 2019-10-07 2021-04-15 Bayerische Motoren Werke Aktiengesellschaft Verfahren zur betankung eines kraftfahrzeugs, kraftfahrzeug, tankstelle und computerlesbares speichermedium
CN112084407A (zh) * 2020-09-08 2020-12-15 辽宁工程技术大学 一种融合图神经网络和注意力机制的协同过滤推荐方法
CN112488799A (zh) * 2020-12-14 2021-03-12 北京易兴元石化科技有限公司 一种基于加油站端的石油数据处理方法、装置及存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YASSMEEN SALMAN等: ""A model and prototype of a proactive multi-type context-aware recommender system"", 《2017 INTELLIGENT SYSTEMS CONFERENCE (INTELLISYS)》 *
韩更: ""基于数据挖掘技术的S公司加油站精准营销方法与策略研究"", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅰ辑》 *

Also Published As

Publication number Publication date
CN114139064B (zh) 2022-05-06

Similar Documents

Publication Publication Date Title
CN111444394B (zh) 获取实体间关系表达的方法、系统和设备、广告召回系统
CN110532379B (zh) 一种基于lstm的用户评论情感分析的电子资讯推荐方法
US20120095943A1 (en) System for training classifiers in multiple categories through active learning
CN106447066A (zh) 一种大数据的特征提取方法和装置
CN106445988A (zh) 一种大数据的智能处理方法和系统
Verdhan Supervised learning with python
CN105225135B (zh) 潜力客户识别方法以及装置
WO2006102381A2 (en) Constrained tree structure method and system
CN107704512A (zh) 基于社交数据的金融产品推荐方法、电子装置及介质
CN112418956A (zh) 一种金融产品的推荐方法及装置
CN111666496B (zh) 一种基于评论文本的组推荐方法
Ghahramani et al. Leveraging artificial intelligence to analyze citizens’ opinions on urban green space
CN109740642A (zh) 发票类别识别方法、装置、电子设备及可读存储介质
Ma et al. Travel mode choice prediction using deep neural networks with entity embeddings
CN112000801A (zh) 基于机器学习的政务文本分类、热点问题挖掘方法及系统
CN113424207B (zh) 高效地训练可理解模型的系统和方法
Chan et al. Melody: Generating and visualizing machine learning model summary to understand data and classifiers together
CN115147155A (zh) 一种基于集成学习的铁路货运客户流失预测方法
CN115018588A (zh) 产品推荐方法、装置、电子设备及可读存储介质
CN114077836A (zh) 一种基于异构神经网络的文本分类方法及装置
CN113706291A (zh) 欺诈风险预测方法、装置、设备及存储介质
CN115618101A (zh) 基于负反馈的流媒体内容推荐方法、装置及电子设备
CN116629258B (zh) 基于复杂信息项数据的司法文书的结构化分析方法及系统
CN111553442B (zh) 一种分类器链标签序列的优化方法及系统
Zhang et al. Leveraging online reviews for hotel demand forecasting: A deep learning approach

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant