CN113254788B - 一种基于大数据的推荐方法、系统及可读存储介质 - Google Patents

一种基于大数据的推荐方法、系统及可读存储介质 Download PDF

Info

Publication number
CN113254788B
CN113254788B CN202110695334.5A CN202110695334A CN113254788B CN 113254788 B CN113254788 B CN 113254788B CN 202110695334 A CN202110695334 A CN 202110695334A CN 113254788 B CN113254788 B CN 113254788B
Authority
CN
China
Prior art keywords
information
target user
project
heterogeneous
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110695334.5A
Other languages
English (en)
Other versions
CN113254788A (zh
Inventor
洪丽凤
刘立斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Miyuan (Guangzhou) New Media Technology Co.,Ltd.
Original Assignee
Foshan Menassen Intelligent Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Foshan Menassen Intelligent Technology Co ltd filed Critical Foshan Menassen Intelligent Technology Co ltd
Priority to CN202110695334.5A priority Critical patent/CN113254788B/zh
Publication of CN113254788A publication Critical patent/CN113254788A/zh
Application granted granted Critical
Publication of CN113254788B publication Critical patent/CN113254788B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/906Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/047Probabilistic or stochastic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate

Abstract

本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。

Description

一种基于大数据的推荐方法、系统及可读存储介质
技术领域
本发明涉及一种推荐方法,更具体的,涉及一种基于大数据的推荐方法、系统及可读存储介质。
背景技术
随着信息技术及智能技术的迅猛发展,人类已经从IT时代走向DT时代。以互联网为载体,全球大数据如今进入加速发展时期,数据总量每年增长50%,互联网中不同类型数据实体相互作用、相互影响,交织构成了复杂庞大的异质信息网络。现实生活中的异质信息网络随处可见,如电子商务网络、社交媒体网络、移动通信网络、交通运输网络、科学引文网络、医疗卫生网络等。同时网络技术的发展推动了各行业信息化平台的产生,大数据和云计算技术的普遍应用使得互联网平台用户及项目数据量急剧增长。推荐系统作为缓解“信息过载”问题的重要工具,帮助用户从海量信息中获取感兴趣的内容,成为互联网应用不可或缺的重要角色。
为了能够通过目标用户的喜好更好的进行推荐,需要开发一款基于大数据的推荐系统进行匹配,该系统通过获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。在系统的实现过程中如何基于上下文感知建立节点嵌入模型以及如何通过对目标用户和项目的低维嵌入表示并计算得分生成排序结果都是亟不可待需要解决的问题。
发明内容
为了解决上述至少一个技术问题,本发明提出了一种基于大数据的推荐方法、系统及可读存储介质。
本发明第一方面提供了一种基于大数据的推荐方法,包括:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
本方案中,所述的多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据所述中心词进行相应上下文出现概率的预测计算公式具体为:
Figure 758218DEST_PATH_IMAGE001
其中,
Figure 890122DEST_PATH_IMAGE002
表示节点的特征,
Figure 635355DEST_PATH_IMAGE003
为项目的低维度向量表示形式,
Figure 776487DEST_PATH_IMAGE004
为用户集合,
Figure 336781DEST_PATH_IMAGE005
表示当节点
Figure 145247DEST_PATH_IMAGE006
是节点
Figure 627044DEST_PATH_IMAGE007
的上下文时的低维低维度向量表示形式,
Figure 40708DEST_PATH_IMAGE008
表示噪声函数。
本方案中,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的根据上下文出现概率预测结果数据生成权重信息,则所述权重信息的计算公式具体为:
Figure 658771DEST_PATH_IMAGE009
其中,
Figure 866899DEST_PATH_IMAGE010
表示所求权重信息,
Figure 321145DEST_PATH_IMAGE011
表示项目系数,
Figure 538500DEST_PATH_IMAGE012
表示上下文出现概率预测结果数据,
Figure 276648DEST_PATH_IMAGE013
表示特征值项数,
Figure 186836DEST_PATH_IMAGE014
表述数据关联项数。
本方案中,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
本发明第二方面还提供了一种基于大数据的推荐系统,该系统包括:存储器、处理器,所述存储器中包括一种基于大数据的推荐方法程序,所述一种一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
本方案中,所述的多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据所述中心词进行相应上下文出现概率的预测计算公式具体为:
Figure 393957DEST_PATH_IMAGE001
其中,
Figure 149424DEST_PATH_IMAGE002
表示节点的特征,
Figure 7658DEST_PATH_IMAGE003
为项目的低维度向量表示形式,
Figure 823167DEST_PATH_IMAGE004
为用户集合,
Figure 252006DEST_PATH_IMAGE005
表示当节点
Figure 545584DEST_PATH_IMAGE006
是节点
Figure 523904DEST_PATH_IMAGE007
的上下文时的低维低维度向量表示形式,
Figure 244736DEST_PATH_IMAGE008
表示噪声函数。
本方案中,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
本方案中,所述的根据上下文出现概率预测结果数据生成权重信息,则所述权重信息的计算公式具体为:
Figure 410138DEST_PATH_IMAGE009
其中,
Figure 255209DEST_PATH_IMAGE010
表示所求权重信息,
Figure 822457DEST_PATH_IMAGE011
表示项目系数,
Figure 714190DEST_PATH_IMAGE012
表示上下文出现概率预测结果数据,
Figure 366888DEST_PATH_IMAGE013
表示特征值项数,
Figure 2269DEST_PATH_IMAGE014
表述数据关联项数。
本方案中,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的推荐方法的步骤。
本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。本发明将目标用户和项目分为不同类型的数据节点,并通过目标用户和项目所附带的属性信息构建所述数据节点信息的关联信息,根据所述关联信息构建异构信息网络,能够有效融合多种不同类型的上下文信息,实现更好的表示目标用户及项目的属性信息并提高推荐的效果,确保了推荐的稳定性,有利于提高推荐性能。
附图说明
图1示出了本发明一种基于大数据的推荐方法的流程图;
图2示出了本发明根据低维嵌入表示计算得分生成排序结果方法流程图;
图3示出了本发明建立神经网络模型对预测信息进行误差补偿及修正方法流程图;
图4示出了本发明一种基于大数据的推荐系统的框图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
图1示出了本发明一种基于大数据的推荐方法的流程图。
如图1所示,本发明第一方面提供了一种基于大数据的推荐方法,包括:
S102,获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
S104,同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
S106,基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
S108,通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
需要说明的是,获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,当所述属性信息中的信息类型为文本信息时可以使用潜在语义分析模型进行提取,具体为:当属性信息中含有
Figure 440334DEST_PATH_IMAGE006
个文本信息,在每个文本信息中含有
Figure 502968DEST_PATH_IMAGE015
个词,预设主题数为
Figure 642963DEST_PATH_IMAGE016
,提取第
Figure 347613DEST_PATH_IMAGE007
个文本中对应的第
Figure 640186DEST_PATH_IMAGE014
个词的特征值,通过奇异值分解方法计算得到文本
Figure 139300DEST_PATH_IMAGE006
、词
Figure 766590DEST_PATH_IMAGE015
与预设主题
Figure 9353DEST_PATH_IMAGE016
和语义之间的的相关度,根据LSI算法得到文本主题矩阵,使用余弦相似度计算完成文本的相似度的计算,实现文本信息的提取。
需要说明的是,所述的多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据所述中心词进行相应上下文出现概率的预测计算公式具体为:
Figure 422011DEST_PATH_IMAGE001
其中,
Figure 826447DEST_PATH_IMAGE002
表示节点的特征,
Figure 675455DEST_PATH_IMAGE003
为项目的低维度向量表示形式,
Figure 456329DEST_PATH_IMAGE004
为用户集合,
Figure 972761DEST_PATH_IMAGE005
表示当节点
Figure 561481DEST_PATH_IMAGE006
是节点
Figure 897784DEST_PATH_IMAGE007
的上下文时的低维低维度向量表示形式,
Figure 482349DEST_PATH_IMAGE008
表示噪声函数。
图2示出了本发明根据低维嵌入表示计算得分生成排序结果方法流程图。
根据本发明实施例,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
S202,将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
S204,提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
S206,根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
S208,按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的根据上下文出现概率预测结果数据生成权重信息,则所述权重信息的计算公式具体为:
Figure 853288DEST_PATH_IMAGE009
其中,
Figure 350259DEST_PATH_IMAGE010
表示所求权重信息,
Figure 439438DEST_PATH_IMAGE011
表示项目系数,
Figure 562115DEST_PATH_IMAGE012
表示上下文出现概率预测结果数据,
Figure 787560DEST_PATH_IMAGE013
表示特征值项数,
Figure 970279DEST_PATH_IMAGE014
表述数据关联项数。
图3示出了本发明建立神经网络模型对预测信息进行误差补偿及修正方法流程图;
根据本发明实施例,本方案中还包括建立神经网络模型对预测信息进行误差补偿及修正,具体为:
S302,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
S304,设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
S306,若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
S308,将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
S310,将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
需要说明的是,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练,具体为:获取相关信息,或直接连接相关数据库,将获取的训练信息进行整理分类、数据分析等预处理,将初始训练信息进行分组,得到若干个训练信息数据集,将若干个数据集导入初始神经网络模型生成第一次学习后的输出结果,根据得到的第一次输出结果进行分析计算出每组训练集的初始学习率,初始学习率与离散系数成正比,将第一次学习后的输出结果再次导入神经网络模型,继续进行N次学习,在每次学习的过程中使得若干组训练信息数据集的损失函数保持线性相关,输出初始神经网络模型进行N次学习后的输出结果,设定神经网络模型误差阈值,比较计算若干组训练信息数据集的输出结果得到误差值,判断误差值是否小于预设误差阈值,若所述误差值小于预设误差阈值,则证明神经网络训练完毕,得到训练后神经网络模型。
根据本发明实施例,本发明还包括,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐。
根据本发明实施例,本发明,还包括:根据目标用户反馈信息重新推荐项目内容,具体为:
完成对目标用户的项目推荐后,获取目标用户和项目的交互信息;
将所述交互信息转换为异质信息网络中节点数据关联的交互特征值;
当所述交互特征值小于预设阈值时,生成目标用户反馈信息
图4示出了本发明一种基于大数据的推荐系统的框图。
本发明第二方面还提供了一种基于大数据的推荐系统4,该系统包括:存储器41、处理器42,所述存储器中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第i节点,将第i节点作为中心词,第i节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
需要说明的是,获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,当所述属性信息中的信息类型为文本信息时可以使用潜在语义分析模型进行提取,具体为:当属性信息中含有
Figure 31907DEST_PATH_IMAGE006
个文本信息,在每个文本信息中含有
Figure 958275DEST_PATH_IMAGE015
个词,预设主题数为
Figure 38227DEST_PATH_IMAGE016
,提取第
Figure 657427DEST_PATH_IMAGE007
个文本中对应的第
Figure 940772DEST_PATH_IMAGE014
个词的特征值,通过奇异值分解方法计算得到文本
Figure 670830DEST_PATH_IMAGE006
、词
Figure 870867DEST_PATH_IMAGE015
与预设主题
Figure 395390DEST_PATH_IMAGE016
和语义之间的的相关度,根据LSI算法得到文本主题矩阵,使用余弦相似度计算完成文本的相似度的计算,实现文本信息的提取。
需要说明的是,所述的多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据所述中心词进行相应上下文出现概率的预测计算公式具体为:
Figure 415298DEST_PATH_IMAGE001
其中,
Figure 962430DEST_PATH_IMAGE002
表示节点的特征,
Figure 16973DEST_PATH_IMAGE003
为项目的低维度向量表示形式,
Figure 712397DEST_PATH_IMAGE004
为用户集合,
Figure 219602DEST_PATH_IMAGE005
表示当节点
Figure 42195DEST_PATH_IMAGE006
是节点
Figure 951245DEST_PATH_IMAGE007
的上下文时的低维低维度向量表示形式,
Figure 83150DEST_PATH_IMAGE008
表示噪声函数。
根据本发明实施例,所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐。
需要说明的是,所述的根据上下文出现概率预测结果数据生成权重信息,则所述权重信息的计算公式具体为:
Figure 812071DEST_PATH_IMAGE009
其中,
Figure 438356DEST_PATH_IMAGE010
表示所求权重信息,
Figure 201912DEST_PATH_IMAGE011
表示项目系数,
Figure 239138DEST_PATH_IMAGE012
表示上下文出现概率预测结果数据,
Figure 720935DEST_PATH_IMAGE013
表示特征值项数,
Figure 134599DEST_PATH_IMAGE014
表述数据关联项数。
根据本发明实施例,还包括:建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
需要说明的是,建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练,具体为:获取相关信息,或直接连接相关数据库,将获取的训练信息进行整理分类、数据分析等预处理,将初始训练信息进行分组,得到若干个训练信息数据集,将若干个数据集导入初始神经网络模型生成第一次学习后的输出结果,根据得到的第一次输出结果进行分析计算出每组训练集的初始学习率,初始学习率与离散系数成正比,将第一次学习后的输出结果再次导入神经网络模型,继续进行N次学习,在每次学习的过程中使得若干组训练信息数据集的损失函数保持线性相关,输出初始神经网络模型进行N次学习后的输出结果,设定神经网络模型误差阈值,比较计算若干组训练信息数据集的输出结果得到误差值,判断误差值是否小于预设误差阈值,若所述误差值小于预设误差阈值,则证明神经网络训练完毕,得到训练后神经网络模型。
根据本发明实施例,本发明还包括,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐。
本发明第三方面还提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如上述任一项所述的一种基于大数据的推荐方法的步骤。
本发明公开了一种基于大数据的推荐方法、系统及可读存储介质,包括:获取目标用户的属性信息,基于目标用户的属性信息建立用户异质信息网络;同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐。本发明将目标用户和项目分为不同类型的数据节点,并通过目标用户和项目所附带的属性信息构建所述数据节点信息的关联信息,根据所述关联信息构建异构信息网络,能够有效融合多种不同类型的上下文信息,实现更好的表示目标用户及项目的属性信息并提高推荐的效果,确保了推荐的稳定性,有利于提高推荐性能。
在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。
上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。
另外,在本发明各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
或者,本发明上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

Claims (6)

1.一种基于大数据的推荐方法,其特征在于,包括:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐;
同时,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐;
所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐;
所述的根据所述特征值及上下文出现概率预测结果数据生成权重信息 ,则所述权重信息的计算公式具体为:
Figure 510445DEST_PATH_IMAGE002
其中,
Figure DEST_PATH_IMAGE003
表示所求权重信息,
Figure 301684DEST_PATH_IMAGE004
表示项目系数,
Figure DEST_PATH_IMAGE005
表示上下文出现概率预测结果数据,
Figure 958928DEST_PATH_IMAGE006
表示特征值项数,
Figure DEST_PATH_IMAGE007
表述数据关联项数;
还包括,建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
2.根据权利要求1所述的一种基于大数据的推荐方法,其特征在于,所述的基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间,具体为:
获取目标用户及项目的属性信息,从所述属性信息中进行特征提取,构建异质信息网络;
选取异质信息网络中第
Figure 519223DEST_PATH_IMAGE008
节点,将第
Figure 759711DEST_PATH_IMAGE008
节点作为中心词,第
Figure 303825DEST_PATH_IMAGE008
节点的邻居节点作为相应上下文;
进行多种类型上下文的抽样,根据所述中心词进行相应上下文出现概率的预测;
计算用户异质信息网络及项目异质信息网络的损失函数;
通过协同过滤的方法对所述损失函数进行对齐,完成模型的参数优化;
通过所述节点嵌入模型实现目标用户及项目的低维嵌入表达,将不同的信息实现在同一空间的对齐。
3.根据权利要求2所述的一种基于大数据的推荐方法,其特征在于,所述的多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据所述中心词进行相应上下文出现概率的预测计算公式具体为:
Figure 655172DEST_PATH_IMAGE010
其中,
Figure DEST_PATH_IMAGE011
表示节点的特征,
Figure 69973DEST_PATH_IMAGE012
为项目的低维度向量表示形式,
Figure DEST_PATH_IMAGE013
为用户集合,
Figure 576303DEST_PATH_IMAGE014
表示当节点
Figure DEST_PATH_IMAGE015
是节点
Figure 76554DEST_PATH_IMAGE008
的上下文时的低维度向量表示形式,
Figure 90647DEST_PATH_IMAGE016
表示噪声函数。
4.一种基于大数据的推荐系统,其特征在于,该系统包括:存储器、处理器,所述存储器中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被所述处理器执行时实现如下步骤:
获取目标用户的属性信息,基于所述目标用户的属性信息建立用户异质信息网络;
同时建立项目异质信息网络,运用交互算法关联所述用户异质信息网络和项目异质信息网络;
基于上下文感知建立节点嵌入模型,使不同信息对齐到同一空间;
通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,根据所述排序结果对目标用户的喜好进行预测推荐;
同时,通过目标用户及项目的属性信息提取特征构建异质信息网络,根据节点之间的相对关系对目标用户的多种行为进行反馈,通过反馈数据对目标用户实现推荐,具体为:
获取目标用户及项目的属性信息,获取目标用户的多种行为记录;
构建目标用户异质信息网络、项目异质信息网络以及目标用户与项目多种行为记录异质信息网络;
根据异质信息网络中节点的跳转获取目标用户与项目的联系以及不同类型的反馈信息,并将所述反馈信息分为正反馈信息与负反馈信息;
预设所述正反馈信息与负反馈信息的权重,进行多种类型反馈信息的抽样;
通过自注意力方法实现权重的自适应变化;
根据对反馈信息进行表示学习及对齐,完成对目标用户的喜爱推荐;
所述的通过对目标用户和项目的低维嵌入表示计算得分生成排序结果,具体为:
将目标用户和项目进行嵌入对齐连接,获取目标用户和项目之间的数据关联;
提取所述数据关联的特征值、上下文出现概率预测结果数据,将提取到的数据进行预处理;
根据所述特征值及上下文出现概率预测结果数据生成权重信息,通过权重比例计算出目标用户与项目之间的相关性得分;
按所述相关性得分将目标用户与项目的相关性进行倒序排序,根据所述排序结果对目标用户的喜好进行预测推荐;
所述的根据所述特征值及上下文出现概率预测结果数据生成权重信息 ,则所述权重信息的计算公式具体为:
Figure 32058DEST_PATH_IMAGE002
其中,
Figure 738983DEST_PATH_IMAGE003
表示所求权重信息,
Figure 133055DEST_PATH_IMAGE004
表示项目系数,
Figure 449373DEST_PATH_IMAGE005
表示上下文出现概率预测结果数据,
Figure 979712DEST_PATH_IMAGE006
表示特征值项数,
Figure 857538DEST_PATH_IMAGE007
表述数据关联项数;
还包括,建立神经网络模型对预测信息进行误差补偿及修正,具体为:
建立初始神经网络模型,选取相关数据作为训练集对所述初始神经网络模型进行训练;
设定神经网络模型误差阈值,测试模型误差值,将测量所得误差值与阈值进行比较;
若小于,则证明所述神经网络模型训练完毕,得到训练后神经网络模型;
将预测信息导入训练后神经网络模型,生成所述预测信息的误差补偿信息;
将所述预测信息的误差补偿信息反馈到节点嵌入模型,对预测信息进行误差补偿及修正。
5.根据权利要求4所述的一种基于大数据的推荐系统,其特征在于,在所述节点嵌入模型中,多种类型上下文的抽样基于用户异质信息网络和项目异质信息网络的交互网络实现,根据中心词进行相应上下文出现概率的预测计算公式具体为:
Figure DEST_PATH_IMAGE017
其中,
Figure 332382DEST_PATH_IMAGE011
表示节点的特征,
Figure 829222DEST_PATH_IMAGE012
为项目的低维度向量表示形式,
Figure 604280DEST_PATH_IMAGE013
为用户集合,
Figure 262794DEST_PATH_IMAGE014
表示当节点
Figure 257557DEST_PATH_IMAGE015
是节点
Figure 292510DEST_PATH_IMAGE008
的上下文时的低维度向量表示形式,
Figure 187653DEST_PATH_IMAGE016
表示噪声函数。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中包括一种基于大数据的推荐方法程序,所述一种基于大数据的推荐方法程序被处理器执行时,实现如权利要求1至3中任一项所述的一种基于大数据的推荐方法的步骤。
CN202110695334.5A 2021-06-23 2021-06-23 一种基于大数据的推荐方法、系统及可读存储介质 Active CN113254788B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110695334.5A CN113254788B (zh) 2021-06-23 2021-06-23 一种基于大数据的推荐方法、系统及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110695334.5A CN113254788B (zh) 2021-06-23 2021-06-23 一种基于大数据的推荐方法、系统及可读存储介质

Publications (2)

Publication Number Publication Date
CN113254788A CN113254788A (zh) 2021-08-13
CN113254788B true CN113254788B (zh) 2021-09-24

Family

ID=77189280

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110695334.5A Active CN113254788B (zh) 2021-06-23 2021-06-23 一种基于大数据的推荐方法、系统及可读存储介质

Country Status (1)

Country Link
CN (1) CN113254788B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115146180B (zh) * 2022-09-02 2022-11-29 南方科技大学 一种好友和兴趣点推荐方法及终端

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245874A (zh) * 2019-03-27 2019-09-17 中国海洋大学 一种基于机器学习和知识推理的决策融合方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100241663A1 (en) * 2008-02-07 2010-09-23 Microsoft Corporation Providing content items selected based on context
CN110807154B (zh) * 2019-11-08 2021-06-01 内蒙古工业大学 一种基于混合深度学习模型的推荐方法与系统
CN112836120B (zh) * 2021-01-27 2024-03-22 深圳大学 一种基于多模态知识图谱的电影推荐方法、系统及终端

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110245874A (zh) * 2019-03-27 2019-09-17 中国海洋大学 一种基于机器学习和知识推理的决策融合方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
异质数据的表示、对齐方法及其应用;吴彪;《中国优秀博硕士学位论文全文数据库(博士)(信息科技辑)》;20210215;第I138-9页 *

Also Published As

Publication number Publication date
CN113254788A (zh) 2021-08-13

Similar Documents

Publication Publication Date Title
CN110046304B (zh) 一种用户推荐方法和装置
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN110909182B (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN111222053A (zh) 一种对象推荐方法、装置以及相关设备
CN111898384A (zh) 一种文本情感识别方法、装置、存储介质及电子设备
CN114676704A (zh) 句子情感分析方法、装置、设备以及存储介质
CN106803092B (zh) 一种标准问题数据的确定方法及装置
CN114266443A (zh) 数据评估方法和装置、电子设备、存储介质
CN110399473B (zh) 为用户问题确定答案的方法和装置
CN113254788B (zh) 一种基于大数据的推荐方法、系统及可读存储介质
CN110347916B (zh) 跨场景的项目推荐方法、装置、电子设备及存储介质
CN111382232A (zh) 问答信息处理方法、装置及计算机设备
CN108595395B (zh) 一种昵称的生成方法、装置及设备
CN116956183A (zh) 多媒体资源推荐方法、模型训练方法、装置及存储介质
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
WO2022267755A1 (zh) 表单处理方法、装置、设备以及存储介质
CN113741759B (zh) 评论信息的展示方法、装置、计算机设备和存储介质
CN115470328A (zh) 基于知识图谱的开放领域问答方法及相关设备
CN114429384A (zh) 基于电商平台的产品智能推荐方法及系统
CN112464087A (zh) 推荐概率的输出方法及装置、存储介质、电子设备
CN111444338A (zh) 文本处理、装置、存储介质及设备
CN117556149B (zh) 资源推送方法、装置、电子设备和存储介质
CN114093447A (zh) 数据资产推荐方法、装置、计算机设备及存储介质
Ali et al. Identifying and Profiling User Interest over time using Social Data
CN114942980B (zh) 一种确定文本匹配方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20230327

Address after: Room 170, the first floor, No. 74, Huijing North Road, Tianhe District, Guangzhou City, Guangdong Province, 510000

Patentee after: Miyuan (Guangzhou) New Media Technology Co.,Ltd.

Address before: 528200 floor 11, building 1, Guangdong Hong Kong Financial Technology Park, No. 6, Jinke Road, Guicheng Street, Nanhai District, Foshan City, Guangdong Province

Patentee before: Foshan Menassen Intelligent Technology Co.,Ltd.

TR01 Transfer of patent right