CN113254788B - 一种基于大数据的推荐方法、系统及可读存储介质 - Google Patents
一种基于大数据的推荐方法、系统及可读存储介质 Download PDFInfo
- Publication number
- CN113254788B CN113254788B CN202110695334.5A CN202110695334A CN113254788B CN 113254788 B CN113254788 B CN 113254788B CN 202110695334 A CN202110695334 A CN 202110695334A CN 113254788 B CN113254788 B CN 113254788B
- Authority
- CN
- China
- Prior art keywords
- information
- target user
- project
- heterogeneous
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/047—Probabilistic or stochastic networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
Abstract
本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
Description
技术领域
本发明涉及一种推荐方法,更具体的,涉及一种基于大数据的推荐方法、系统及可读存储介质。
背景技术
随着信息技术及智能技术的迅猛发展,人类已经从IT时代走向DT时代。以互联网为载体,全球大数据如今进入加速发展时期,数据总量每年增长50%,互联网中不同类型数据实体相互作用、相互影响,交织构成了复杂庞大的异质信息网络。现实生活中的异质信息网络随处可见,如电子商务网络、社交媒体网络、移动通信网络、交通运输网络、科学引文网络、医疗卫生网络等。同时网络技术的发展推动了各行业信息化平台的产生,大数据和云计算技术的普遍应用使得互联网平台用户及项目数据量急剧增长。推荐系统作为缓解“信息过载”问题的重要工具,帮助用户从海量信息中获取感兴趣的内容,成为互联网应用不可或缺的重要角色。
为了能够通过目标用户的喜好更好的进行推荐,需要开发一款基于大数据的推荐系统进行匹配,该系统通过获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。在系统的实现过程中如何基于上下文感知建立节点嵌入模型以及如何通过对目标用户和项目的低维嵌入表示并计算得分生成排序结果都是亟不可待需要解决的问题。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于大数据的推荐方法、系统及可读存储介质。
本发明第一方面提供了一种基于大数据的推荐方法,包括:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
本方案中,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
本发明第二方面还提供了一种基于大数据的推荐系统,该系统包括:存储器、处理器,所述存储器中包括一种基于大数据的推荐方法程序,所述一种一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
本方案中,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的推荐方法的步骤。
本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。本发明将目标用户和项目分为不同类型的数据节点,并通过目标用户和项目所附带的属性信息构建所述数据节点信息的关联信息,根据所述关联信息构建异构信息网络,能够有效融合多种不同类型的上下文信息,实现更好的表示目标用户及项目的属性信息并提高推荐的效果,确保了推荐的稳定性,有利于提高推荐性能。
附图说明
图1示出了本发明一种基于大数据的推荐方法的流程图;
图2示出了本发明根据低维嵌入表示计算得分生成排序结果方法流程图;
图3示出了本发明建立神经网络模型对预测信息进行误差补偿及修正方法流程图;
图4示出了本发明一种基于大数据的推荐系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于大数据的推荐方法的流程图。
如图1所示,本发明第一方面提供了一种基于大数据的推荐方法,包括:
S102,获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
S104,同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
S106,基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
S108,通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
需要说明的是,获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,当所述属性信息中的信息类型为文本信息时可以使用潜在语义分析模型进行提取,具体为:当属性信息中含有个文本信息,在每个文本信息中含有个词,预设主题数为,提取第个文本中对应的第个词的特征值,通过奇异值分解方法计算得到文本、词与预设主题和语义之间的的相关度,根据LSI算法得到文本主题矩阵,使用余弦相似度计算完成文本的相似度的计算,实现文本信息的提取。
图2示出了本发明根据低维嵌入表示计算得分生成排序结果方法流程图。
根据本发明实施例,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
S202,将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
S204,提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
S206,根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
S208,按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
图3示出了本发明建立神经网络模型对预测信息进行误差补偿及修正方法流程图;
根据本发明实施例,本方案中还包括建立神经网络模型对预测信息进行误差补偿及修正,具体为:
S302,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
S304,设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
S306,若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
S308,将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
S310,将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
需要说明的是,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练,具体为:获取相关信息,或直接连接相关数据库,将获取的训练信息进行整理分类、数据分析等预处理,将初始训练信息进行分组,得到若干个训练信息数据集,将若干个数据集导入初始神经网络模型生成第一次学习后的输出结果,根据得到的第一次输出结果进行分析计算出每组训练集的初始学习率,初始学习率与离散系数成正比,将第一次学习后的输出结果再次导入神经网络模型,继续进行N次学习,在每次学习的过程中使得若干组训练信息数据集的损失函数保持线性相关,输出初始神经网络模型进行N次学习后的输出结果,设定神经网络模型误差阈值,比较计算若干组训练信息数据集的输出结果得到误差值,判断误差值是否小于预设误差阈值,若所述误差值小于预设误差阈值,则证明神经网络训练完毕,得到训练后神经网络模型。
根据本发明实施例,本发明还包括,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐。
根据本发明实施例,本发明,还包括:根据目标用户反馈信息重新推荐项目内容,具体为:
完成对目标用户的项目推荐后,获取目标用户和项目的交互信息;
将所述交互信息转换为异质信息网络中节点数据关联的交互特征值;
当所述交互特征值小于预设阈值时,生成目标用户反馈信息
图4示出了本发明一种基于大数据的推荐系统的框图。
本发明第二方面还提供了一种基于大数据的推荐系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
需要说明的是,获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,当所述属性信息中的信息类型为文本信息时可以使用潜在语义分析模型进行提取,具体为:当属性信息中含有个文本信息,在每个文本信息中含有个词,预设主题数为,提取第个文本中对应的第个词的特征值,通过奇异值分解方法计算得到文本、词与预设主题和语义之间的的相关度,根据LSI算法得到文本主题矩阵,使用余弦相似度计算完成文本的相似度的计算,实现文本信息的提取。
根据本发明实施例,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
根据本发明实施例,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
需要说明的是,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练,具体为:获取相关信息,或直接连接相关数据库,将获取的训练信息进行整理分类、数据分析等预处理,将初始训练信息进行分组,得到若干个训练信息数据集,将若干个数据集导入初始神经网络模型生成第一次学习后的输出结果,根据得到的第一次输出结果进行分析计算出每组训练集的初始学习率,初始学习率与离散系数成正比,将第一次学习后的输出结果再次导入神经网络模型,继续进行N次学习,在每次学习的过程中使得若干组训练信息数据集的损失函数保持线性相关,输出初始神经网络模型进行N次学习后的输出结果,设定神经网络模型误差阈值,比较计算若干组训练信息数据集的输出结果得到误差值,判断误差值是否小于预设误差阈值,若所述误差值小于预设误差阈值,则证明神经网络训练完毕,得到训练后神经网络模型。
根据本发明实施例,本发明还包括,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的推荐方法的步骤。
本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。本发明将目标用户和项目分为不同类型的数据节点,并通过目标用户和项目所附带的属性信息构建所述数据节点信息的关联信息,根据所述关联信息构建异构信息网络,能够有效融合多种不同类型的上下文信息,实现更好的表示目标用户及项目的属性信息并提高推荐的效果,确保了推荐的稳定性,有利于提高推荐性能。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (6)
1.一种基于大数据的推荐方法,其特征在于,包括:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐;
同时,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐;
所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐;
所述的根据所述特征值及上下文出现概率预测结果数据生成权重信息 ,则所述权重信息的计算公式具体为:
还包括,建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
4.一种基于大数据的推荐系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐;
同时,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐;
所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐;
所述的根据所述特征值及上下文出现概率预测结果数据生成权重信息 ,则所述权重信息的计算公式具体为:
还包括,建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如权利要求1至3中任一项所述的一种基于大数据的推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695334.5A CN113254788B (zh) | 2021-06-23 | 2021-06-23 | 一种基于大数据的推荐方法、系统及可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110695334.5A CN113254788B (zh) | 2021-06-23 | 2021-06-23 | 一种基于大数据的推荐方法、系统及可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113254788A CN113254788A (zh) | 2021-08-13 |
CN113254788B true CN113254788B (zh) | 2021-09-24 |
Family
ID=77189280
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110695334.5A Active CN113254788B (zh) | 2021-06-23 | 2021-06-23 | 一种基于大数据的推荐方法、系统及可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113254788B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115146180B (zh) * | 2022-09-02 | 2022-11-29 | 南方科技大学 | 一种好友和兴趣点推荐方法及终端 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245874A (zh) * | 2019-03-27 | 2019-09-17 | 中国海洋大学 | 一种基于机器学习和知识推理的决策融合方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100241663A1 (en) * | 2008-02-07 | 2010-09-23 | Microsoft Corporation | Providing content items selected based on context |
CN110807154B (zh) * | 2019-11-08 | 2021-06-01 | 内蒙古工业大学 | 一种基于混合深度学习模型的推荐方法与系统 |
CN112836120B (zh) * | 2021-01-27 | 2024-03-22 | 深圳大学 | 一种基于多模态知识图谱的电影推荐方法、系统及终端 |
-
2021
- 2021-06-23 CN CN202110695334.5A patent/CN113254788B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110245874A (zh) * | 2019-03-27 | 2019-09-17 | 中国海洋大学 | 一种基于机器学习和知识推理的决策融合方法 |
Non-Patent Citations (1)
Title |
---|
异质数据的表示、对齐方法及其应用;吴彪;《中国优秀博硕士学位论文全文数据库(博士)(信息科技辑)》;20210215;第I138-9页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113254788A (zh) | 2021-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110046304B (zh) | 一种用户推荐方法和装置 | |
CN108829822B (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
CN111222053A (zh) | 一种对象推荐方法、装置以及相关设备 | |
CN111898384A (zh) | 一种文本情感识别方法、装置、存储介质及电子设备 | |
CN114676704A (zh) | 句子情感分析方法、装置、设备以及存储介质 | |
CN106803092B (zh) | 一种标准问题数据的确定方法及装置 | |
CN114266443A (zh) | 数据评估方法和装置、电子设备、存储介质 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN113254788B (zh) | 一种基于大数据的推荐方法、系统及可读存储介质 | |
CN110347916B (zh) | 跨场景的项目推荐方法、装置、电子设备及存储介质 | |
CN111382232A (zh) | 问答信息处理方法、装置及计算机设备 | |
CN108595395B (zh) | 一种昵称的生成方法、装置及设备 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
CN114282119B (zh) | 一种基于异构信息网络的科技信息资源检索方法及系统 | |
WO2022267755A1 (zh) | 表单处理方法、装置、设备以及存储介质 | |
CN113741759B (zh) | 评论信息的展示方法、装置、计算机设备和存储介质 | |
CN115470328A (zh) | 基于知识图谱的开放领域问答方法及相关设备 | |
CN114429384A (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN112464087A (zh) | 推荐概率的输出方法及装置、存储介质、电子设备 | |
CN111444338A (zh) | 文本处理、装置、存储介质及设备 | |
CN117556149B (zh) | 资源推送方法、装置、电子设备和存储介质 | |
CN114093447A (zh) | 数据资产推荐方法、装置、计算机设备及存储介质 | |
Ali et al. | Identifying and Profiling User Interest over time using Social Data | |
CN114942980B (zh) | 一种确定文本匹配方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230327 Address after: Room 170, the first floor, No. 74, Huijing North Road, Tianhe District, Guangzhou City, Guangdong Province, 510000 Patentee after: Miyuan (Guangzhou) New Media Technology Co.,Ltd. Address before: 528200 floor 11, building 1, Guangdong Hong Kong Financial Technology Park, No. 6, Jinke Road, Guicheng Street, Nanhai District, Foshan City, Guangdong Province Patentee before: Foshan Menassen Intelligent Technology Co.,Ltd. |
|
TR01 | Transfer of patent right |