CN117633363A - 新闻个性化推荐方法、设备以及计算机可读存储介质 - Google Patents
新闻个性化推荐方法、设备以及计算机可读存储介质 Download PDFInfo
- Publication number
- CN117633363A CN117633363A CN202410086359.9A CN202410086359A CN117633363A CN 117633363 A CN117633363 A CN 117633363A CN 202410086359 A CN202410086359 A CN 202410086359A CN 117633363 A CN117633363 A CN 117633363A
- Authority
- CN
- China
- Prior art keywords
- news
- information
- representation
- personalized recommendation
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 claims abstract description 113
- 238000005516 engineering process Methods 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims description 8
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 230000003993 interaction Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000004927 fusion Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000004075 alteration Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001932 seasonal effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及电子数字数据处理技术领域,尤其涉及一种新闻个性化推荐方法、设备以及计算机可读存储介质。所述新闻个性化推荐方法通过当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息;对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。达到提高新闻个性化推荐系统对内容推送的准确性的目的。
Description
技术领域
本发明涉及电子数字数据处理技术领域,尤其涉及一种新闻个性化推荐方法、设备以及计算机可读存储介质。
背景技术
个性化推荐是一种基于用户个人兴趣和行为模式,通过分析用户的历史数据和行为信息,为用户提供定制化的内容推荐的方法。个性化推荐旨在根据用户的喜好和偏好,提供更有针对性和个性化的推荐结果,从而提升用户的体验和满意度。
现有的新闻个性化推荐系统一般分为三个模块,即新闻建模模块、用户建模模块和推荐模块。对于新闻建模模块,通常采用单一模态建模,也即只考虑新闻内容、或者标题、或者主题信息中的一项进行建模;对于用户建模模块,在建模的时候,只考虑用户的浏览记录进行建模。
由于新闻建模模块采用的是单一模态建模,并且未考虑到新闻封面图片信息,故存在信息的不全面性,无法充分理解用户的兴趣和需求的缺陷,从而影响个性化推荐系统对内容推送的准确性。因此,现有的新闻个性化推荐系统存在内容推送的准确性较低的缺陷。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种新闻个性化推荐方法,旨在解决现有的新闻个性化推荐系统存在内容推送的准确性较低的问题。
为实现上述目的,本发明提供的一种新闻个性化推荐方法,所述新闻个性化推荐方法包括以下步骤:
当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息;
对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;
基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;
根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。
可选地,所述当检测到用户阅读新闻的操作时,获取所述新闻的各个特征信息的步骤包括:
读取用户行为日志中记录的用户点击事件;
判断所述用户点击事件是否为所述新闻阅读操作;
若是,获取所述新闻的特征信息。
可选地,所述当检测到用户阅读新闻的操作时,获取所述新闻的各个特征信息的步骤包括:
在捕获到所述新闻阅读操作之后,基于新闻平台的元数据,获取所述新闻的主题信息和标题信息,并基于图像处理技术,提取所述新闻的封面信息。
可选地,所述对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量的步骤包括:
基于词嵌入模型,对所述主题信息和所述标题信息进行文本嵌入向量编码,生成主题模态向量和标题模态向量;
基于卷积神经网络模型,提取所述封面信息的封面模态向量。
可选地,所述基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示的步骤包括:
基于所述注意力网络,确定所述主题模态向量、标题模态向量和封面模态向量对应的模态的注意力权重;
对所述主题模态向量、标题模态向量和封面模态向量,与所述主题模态向量、标题模态向量和封面模态向量对应的注意力权重进行加权求和运算,生成所述新闻对应的新闻表示。
可选地,所述基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示的步骤之后,还包括:
获取所述新闻的隐式反馈信息;
基于所述注意力网络,对新闻表示和所述隐式反馈信息进行加权求和,生成所述新闻对应的用户表示;
基于所述用户表示和所述新闻表示,推送所述未阅新闻。
可选地,所述获取所述新闻的隐式反馈信息的步骤包括:
根据所述新闻打开的时长,确定新闻阅读时间;和/或,
根据所述新闻的交互记录,获取用户对所述新闻的评论信息、收藏信息和/或分享信息。
可选地,所述基于所述用户表示和所述新闻表示,推送所述未阅新闻的步骤包括:
根据所述新闻表示和所述用户表示的相似度,对所述未阅新闻进行评估,获得所述未阅新闻的推荐值;
基于各个未阅新闻的推荐值,推送所述未阅新闻。
此外,为实现上述目的,本发明还提供一种新闻个性化推荐设备,所述新闻个性化推荐设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的新闻个性化推荐程序,所述新闻个性化推荐程序被所述处理器执行时实现如上所述的新闻个性化推荐方法的步骤。
此外,为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有新闻个性化推荐程序,所述新闻个性化推荐程序被处理器执行时实现如上所述的新闻个性化推荐方法的步骤。
本发明实施例提供一种新闻个性化推荐方法,通过对新闻的主题信息、标题信息和封面信息等特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;并基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;然后再根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。由于考虑到新闻封面图片信息、主题信息和标题信息,故依据的新闻特征信息具有全面性,可以更好地理解用户的兴趣和需求,从而达到提高新闻个性化推荐系统对内容推送的准确性的目的。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例涉及的新闻个性化推荐设备的硬件运行环境的架构示意图;
图2为本发明新闻个性化推荐方法的第一实施例的流程示意图;
图3为本发明新闻个性化推荐方法的第一实施例的流程框架示意图;
图4为本发明新闻个性化推荐方法的第二实施例的流程示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图作进一步说明。
具体实施方式
本申请一种新闻个性化推荐方法,通过当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息;对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。达到提高新闻个性化推荐系统对内容推送的准确性的目的。
为了更好地理解上述技术方案,下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整地传达给本领域的技术人员。
作为一种实现方案,图1为本发明实施例方案涉及的新闻个性化推荐设备的硬件运行环境的架构示意图。
如图1所示,该新闻个性化推荐设备可以包括:处理器101,例如中央处理器(Central Processing Unit,CPU),存储器102,通信总线103。其中,存储器102可以是高速的随机存取存储器(Random Access Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器102可选的还可以是独立于前述处理器101的存储装置。通信总线103用于实现这些组件之间的连接通信。
本领域技术人员可以理解,图1中示出的结构并不构成对新闻个性化推荐设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种计算机可读存储介质的存储器102中可以包括操作系统、数据存储模块、网络通信模块、用户接口模块以及新闻个性化推荐程序。
在图1所示的新闻个性化推荐设备中,处理器101、存储器102可以设置在新闻个性化推荐设备中,所述新闻个性化推荐设备通过处理器101调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息;
对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;
基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;
根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
读取用户行为日志中记录的用户点击事件;
判断所述用户点击事件是否为所述新闻阅读操作;
若是,获取所述新闻的特征信息。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
在捕获到所述新闻阅读操作之后,基于新闻平台的元数据,获取所述新闻的主题信息和标题信息,并基于图像处理技术,提取所述新闻的封面信息。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
基于词嵌入模型,对所述主题信息和所述标题信息进行文本嵌入向量编码,生成主题模态向量和标题模态向量;
基于卷积神经网络模型,提取所述封面信息的封面模态向量。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
基于所述注意力网络,确定所述主题模态向量、标题模态向量和封面模态向量对应的模态的注意力权重;
对所述主题模态向量、标题模态向量和封面模态向量,与所述主题模态向量、标题模态向量和封面模态向量对应的注意力权重进行加权求和运算,生成所述新闻对应的新闻表示。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
获取所述新闻的隐式反馈信息;
基于所述注意力网络,对新闻表示和所述隐式反馈信息进行加权求和,生成所述新闻对应的用户表示;
基于所述用户表示和所述新闻表示,推送所述未阅新闻。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
根据所述新闻打开的时长,确定新闻阅读时间;和/或,
根据所述新闻的交互记录,获取用户对所述新闻的评论信息、收藏信息和/或分享信息。
在一实施例中,处理器101可以用于调用存储器102中存储的新闻个性化推荐程序,并执行以下操作:
根据所述新闻表示和所述用户表示的相似度,对所述未阅新闻进行评估,获得所述未阅新闻的推荐值;
基于各个未阅新闻的推荐值,推送所述未阅新闻。
基于上述新闻个性化推荐设备的硬件架构,提出本发明新闻个性化推荐方法的实施例。
参照图2,在第一实施例中,所述新闻个性化推荐方法包括以下步骤:
步骤S100:当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息。
在本实施例中,可以通过读取用户行为日志中记录的用户点击事件来捕获用户的新闻阅读操作。然后,判断读取到的用户点击事件是否为新闻阅读操作。若是,则获取所述新闻的特征信息。
作为一种可选实施方案,根据用户点击事件的类型,判断读取到的用户点击事件是否为新闻阅读操作。如果用户点击事件的类型与新闻阅读相关,如"阅读"、"查看"、"点击新闻"等,则可以判断该用户点击事件为新闻阅读操作。
作为另一种可选实施方案,可以通过检查用户行为日志中记录的点击事件所对应的页面URL或标识,来判断用户点击事件是否为新闻阅读操作。需要说明的是,在Web或移动应用中,新闻阅读页面会有独特的URL或标识,远程可以根据这些标识来判断用户点击事件是否为新闻阅读操作。
可选地,在捕获到所述新闻阅读操作之后,可以进一步基于新闻平台的元数据,获取所述新闻的主题信息和标题信息,并基于图像处理技术,提取所述新闻的封面信息。需要说明的是,由于新闻平台的数据库中通常会有一些字段用于存储新闻的相关信息,包括主题和标题。因此可以通过查询和抽取这些字段,获取到新闻的主题信息和标题信息。其中,主题信息指代涉及新闻主题的信息,包括但不限于主题名称、副主题名称等内容。
其中,基于图像处理技术,提取新闻封面信息,需要先通过新闻平台的API获取到该新闻的封面图像,并对获取到的图像进行大小调整、灰度化处理、去噪等预处理。然后,利用图像处理技术和计算机视觉算法,提取封面图像的色彩特征、纹理特征、形状特征等封面信息。
在本实施例中,通过捕获用户的新闻阅读行为,进而可以针对阅读的新闻,获取用户的偏好和兴趣。以达到为用户提供更相关和感兴趣的新闻内容,提升用户体验和留存率的目的。
步骤S200:对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量。
在本实施例中,在获得新闻的主题信息、标题信息和封面信息等新闻的特征信息之后,对这些特征信息进行多模态特征编码,以生成各个特征信息对应的模态向量。其中,多模态编码指的是指利用多种不同的数据模态来表达一个信息的过程。在多模态编码中,每种模态的数据能够提供独特的信息,通过结合这些模态的数据,可以更全面地描述和理解信息。需要说明的是,本实施例中的主题信息、标题信息和封面信息即不同的数据模态。
在本实施例中,主题信息对应的模态向量为主题模态向量;标题信息对应的模态向量为标题模态向量;封面信息对应的模态向量为封面模态向量。可选地,可以基于词嵌入模型,对所述主题信息和所述标题信息进行文本嵌入向量编码,生成主题模态向量和标题模态向量。以及基于卷积神经网络模型,提取所述封面信息的封面模态向量。
生成主题模态向量和标题模态向量,需要先将主题信息和标题信息分别存储为两个列表,并对主题信息和标题信息进行文本预处理,例如分词、去停用词、词干化等。其中,每个列表中的元素是一个字符串,表示一个主题信息或标题信息。然后,对每个词进行词嵌入向量编码,将每个词转换为对应的词嵌入向量。最后,对主题信息的词嵌入向量进行求和、平均等方式进行整合,得到主题模态向量;对标题信息的词嵌入向量进行求和、平均等方式进行整合,得到标题模态向量。提取所述封面信息的封面模态向量,需要将封面图片信息输入至卷积神经网络模型,然后,获取模型的中间层,如全连接层的输出作为封面模态向量。
通过词嵌入模型将主题信息和标题信息编码为主题模态向量和标题模态向量,可以在后续的任务中更好地表示主题信息和标题信息,并且可以在同一向量空间中进行比较和处理,实现将不同模态的信息进行对齐和融合。通过卷积神经网络模型提取封面图像的特征,可以获得关于封面图像的更丰富的信息,进而后续生成新闻对应的新闻表示的准确性。
步骤S300:基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示。
注意力网络指的是一种允许模型在处理序列数据时,能够自动关注到与当前任务相关的重要部分的机制。
在本实施例中,在获得各个特征信息对应的模态向量之后,通过基于所述注意力网络,确定所述主题模态向量、标题模态向量和封面模态向量对应的模态的注意力权重。在确定各个模态向量对应的注意力权重之后,对所述主题模态向量、标题模态向量和封面模态向量,与所述主题模态向量、标题模态向量和封面模态向量对应的注意力权重进行加权求和运算,生成所述新闻对应的新闻表示。
通过注意力网络,在加权求和操作中可以充分利用不同模态之间的互补关系。主题模态向量、标题模态向量和封面模态向量可能携带不同的、互补的语义和视觉信息。通过加权求和,可以在表示中包含更全面、更丰富的信息。对于某些新闻样本,可能某个模态的信息质量较差,或者某个模态在该任务中并不重要。通过注意力网络,可以根据输入样本的特点自动调整不同模态的权重,降低对于噪声或无关信息的敏感性,提高对干扰的鲁棒性。因此,通过注意力网络可以动态调整不同模态的权重,将不同模态的信息进行加权融合,从而生成更有效、更准确的新闻表示,提高对干扰的鲁棒性。
步骤S400:根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。
在本实施例中,在获得新闻对应的新闻表示之后,通过获取未阅新闻的新闻表示来参与新闻的相似度计算。然后,根据已阅新闻的新闻表示与未阅新闻的新闻表示的相似度,确定未阅新闻的推荐值,并根据未阅新闻的推荐值推荐未阅新闻。
作为一种可选实施方式,如图3所示。假设新闻的特征信息包括封面图片信息、新闻主题信息、新闻标题信息和新闻副标题信息。通过视觉和语言的多模态模型,将封面图片信息、新闻主题信息、新闻标题信息和新闻副标题信息转化为封面模态向量、主题模态向量、标题模态向量和副标题模态向量。然后将这四个向量送入跨模态注意力层,通过跨模态注意力层来调节各个部分信息对于新闻表征的权重。
其中,和V为自注意头的参数,/>、/>是第i、j个通道的键向量,L是包含所有键向量的矩阵,/>是/>对/>的第k个头的权值。t i 是l i 通过跨模态注意力机制分配权重后的结果,即各个模态向量对应的注意力权重。T′=[t1,t2,t3,t4]总的向量具有相同的特征维度,可以投影到同一特征向量空间中。但是其中是有图像与文本两种信息组成。如果要使其融合,则需要通过一个加法注意力层来使其归一化:
其中,是查询向量,/>和/>是参数。最后计算得到:
x作为新闻表征维度可能不符合,因此还需要用MLP(Multilayer Perceptron,多层感知器)来压缩到合适的维度:
其中W i 、b i 是权重参数,x i 是各层的输入,g是激活函数,h x 是最终得到的融合向量,即新闻表示。
在本实施例提供的技术方案中,通过对新闻的主题信息、标题信息和封面信息等特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;并基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;然后再根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。由于考虑到新闻封面图片信息、主题信息和标题信息,故依据的新闻特征信息具有全面性,可以更好地理解用户的兴趣和需求,从而达到提高新闻个性化推荐系统对内容推送的准确性的目的。
参照图4,基于上述实施例,在第二实施例中,所述基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示的步骤之后,还包括:
步骤S500:获取所述新闻的隐式反馈信息;
步骤S600:基于所述注意力网络,对新闻表示和所述隐式反馈信息进行加权求和,生成所述新闻对应的用户表示;
步骤S700:基于所述用户表示和所述新闻表示,推送所述未阅新闻。
在本实施例中,在生成新闻对应的新闻表示之后,进一步基于注意力网络,对新闻表示和获取的用户的隐式反馈信息,进行加权求和,以获得新闻对应的用户表示。然后再基于新闻表示和用户表示来推送未阅新闻。
可选地,隐式反馈信息包括用户对新闻的阅读时间、收藏信息、评论信息和/或分享信息等。具体地,根据用户在该新闻页面上所停留的时间,即打开新闻的时长确定用户对该新闻的阅读的时间。通过读取被用户点击的新闻的交互记录,并查询交互记录中是否记录有评论操作、收藏操作和/或分享操作等交互操作,进而获取用户对该新闻的收藏信息、评论信息和/或分享信息等隐式反馈信息。
作为一种可选的实施方式,通过持续时间编码器,对不同且连续的活动时间t序列分成离散变量:
其中,将持续时间t映射到不同的类中,与持续时间反映的隐式反馈不同,某一事件发生的日期时间具有物理意义,同时也传达了时间信息背后的规律。对文章的发布时间和会话的开始时间进行编码。提取周期时间变化,也就是季节性,根据月、月、日、周、时、分钟,构建整个时间向量,以表示日期时间。由于在不同周期的相似时间里,用户可能会更倾向于开始相似的会话,即点击相同类型的新闻。本方案将开始时间ts j 嵌入到偏好查询向量中:
其中,是参数,/>是偏差。
然后,根据偏好查询向量与文章表示的重要性,赋予其不同的权重:
其中,和/>是权重参数。
然后,结合新闻的持续阅读时间:
最终,生成新闻的用户表示为:
进一步地,在获得新闻对应的新闻表示之后,根据所述新闻表示和所述用户表示的相似度,对所述未阅新闻进行评估,获得所述未阅新闻的推荐值。然后,基于各个未阅新闻的推荐值,推送所述未阅新闻。
在本实施例提供的技术方案中,利用了隐式反馈信息进行用户建模,并且,结合使用新闻封面、新闻标题和新闻主题等信息进行新闻建模。确保了建模信息的全面性,进而更好地理解用户的兴趣和需求,以达到提高新闻个性化推荐系统新闻推送的准确性。
此外,本领域普通技术人员可以理解的是实现上述实施例的方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成。该计算机程序包括程序指令,计算机程序可以存储于一存储介质中,该存储介质为计算机可读存储介质。该程序指令被新闻个性化推荐设备中的至少一个处理器执行,以实现上述方法的实施例的流程步骤。
因此,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有新闻个性化推荐程序,所述新闻个性化推荐程序被处理器执行时实现如上实施例所述的新闻个性化推荐方法的各个步骤。
其中,所述计算机可读存储介质可以是U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、磁碟或者光盘等各种可以存储程序代码的计算机可读存储介质。
需要说明的是,由于本申请实施例提供的存储介质,为实施本申请实施例的方法所采用的存储介质,故而基于本申请实施例所介绍的方法,本领域所属人员能够了解该存储介质的具体结构及变形,故而在此不再赘述。凡是本申请实施例的方法所采用的存储介质都属于本申请所欲保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
应当注意的是,在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
Claims (10)
1.一种新闻个性化推荐方法,其特征在于,所述新闻个性化推荐方法包括以下步骤:
当捕获到新闻阅读操作时,获取所述新闻的各个特征信息,所述特征信息包括主题信息、标题信息和封面信息;
对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量;
基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示;
根据所述新闻表示与未阅新闻的新闻表示的相似度,推送所述未阅新闻。
2.如权利要求1所述的新闻个性化推荐方法,其特征在于,所述当检测到用户阅读新闻的操作时,获取所述新闻的各个特征信息的步骤包括:
读取用户行为日志中记录的用户点击事件;判断所述用户点击事件是否为所述新闻阅读操作;
若是,获取所述新闻的特征信息。
3.如权利要求1所述的新闻个性化推荐方法,其特征在于,所述当检测到用户阅读新闻的操作时,获取所述新闻的各个特征信息的步骤包括:
在捕获到所述新闻阅读操作之后,基于新闻平台的元数据,获取所述新闻的主题信息和标题信息,并基于图像处理技术,提取所述新闻的封面信息。
4.如权利要求1所述的新闻个性化推荐方法,其特征在于,所述对所述特征信息进行多模态编码,生成所述特征信息对应的各个模态向量的步骤包括:
基于词嵌入模型,对所述主题信息和所述标题信息进行文本嵌入向量编码,生成主题模态向量和标题模态向量;
基于卷积神经网络模型,提取所述封面信息的封面模态向量。
5.如权利要求1所述的新闻个性化推荐方法,其特征在于,所述基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示的步骤包括:
基于所述注意力网络,确定所述主题模态向量、标题模态向量和封面模态向量对应的模态的注意力权重;
对所述主题模态向量、标题模态向量和封面模态向量,与所述主题模态向量、标题模态向量和封面模态向量对应的注意力权重进行加权求和运算,生成所述新闻对应的新闻表示。
6.如权利要求1所述的新闻个性化推荐方法,其特征在于,所述基于注意力网络,对所述模态向量进行加权求和,生成所述新闻对应的新闻表示的步骤之后,还包括:
获取所述新闻的隐式反馈信息;
基于所述注意力网络,对新闻表示和所述隐式反馈信息进行加权求和,生成所述新闻对应的用户表示;
基于所述用户表示和所述新闻表示,推送所述未阅新闻。
7.如权利要求6所述的新闻个性化推荐方法,其特征在于,所述获取所述新闻的隐式反馈信息的步骤包括:
根据所述新闻打开的时长,确定新闻阅读时间;和/或,
根据所述新闻的交互记录,获取用户对所述新闻的评论信息、收藏信息和/或分享信息。
8.如权利要求6所述的新闻个性化推荐方法,其特征在于,所述基于所述用户表示和所述新闻表示,推送所述未阅新闻的步骤包括:
根据所述新闻表示和所述用户表示的相似度,对所述未阅新闻进行评估,获得所述未阅新闻的推荐值;
基于各个未阅新闻的推荐值,推送所述未阅新闻。
9.一种新闻个性化推荐设备,其特征在于,所述新闻个性化推荐设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的新闻个性化推荐程序,所述新闻个性化推荐程序配置为实现如权利要求1至8中任一项所述的新闻个性化推荐方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有新闻个性化推荐程序,所述新闻个性化推荐程序被处理器执行时实现如权利要求1至8任一项所述的新闻个性化推荐方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410086359.9A CN117633363A (zh) | 2024-01-22 | 2024-01-22 | 新闻个性化推荐方法、设备以及计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410086359.9A CN117633363A (zh) | 2024-01-22 | 2024-01-22 | 新闻个性化推荐方法、设备以及计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117633363A true CN117633363A (zh) | 2024-03-01 |
Family
ID=90025449
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410086359.9A Pending CN117633363A (zh) | 2024-01-22 | 2024-01-22 | 新闻个性化推荐方法、设备以及计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117633363A (zh) |
-
2024
- 2024-01-22 CN CN202410086359.9A patent/CN117633363A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107346336B (zh) | 基于人工智能的信息处理方法和装置 | |
CN110557659B (zh) | 视频推荐方法、装置、服务器及存储介质 | |
CN112015928B (zh) | 多媒体资源的信息提取方法、装置、电子设备及存储介质 | |
CN112989209A (zh) | 内容推荐方法、装置和存储介质 | |
CN110399473B (zh) | 为用户问题确定答案的方法和装置 | |
CN113590970A (zh) | 一种基于读者偏好的个性化数字图书推荐系统、方法、计算机及存储介质 | |
CN111695357A (zh) | 文本标注方法及相关产品 | |
CN113836390B (zh) | 资源推荐方法、装置、计算机设备及存储介质 | |
CN117763510A (zh) | 网页识别方法、装置、设备、介质及程序产品 | |
CN113407772A (zh) | 视频推荐模型的生成方法、视频推荐方法、装置 | |
CN111310453A (zh) | 一种基于深度学习的用户主题向量化表示方法和系统 | |
CN117633363A (zh) | 新闻个性化推荐方法、设备以及计算机可读存储介质 | |
CN117216361A (zh) | 推荐方法、装置、电子设备及计算机可读存储介质 | |
CN114647787A (zh) | 一种基于多模态数据的用户个性化推荐方法 | |
CN114385915A (zh) | 一种内容推荐方法、装置、存储介质及电子设备 | |
TWM617933U (zh) | 新聞及公眾意見分析系統 | |
CN111400437A (zh) | 互联网信息响应方法、装置、电子设备和计算机可读介质 | |
CN118694818B (zh) | 基于人工智能的旅游服务信息推送方法及系统 | |
CN112287184B (zh) | 基于神经网络的迁移标注方法、装置、设备及存储介质 | |
Rakesh | Movie Recommendation System Using Content Based Filtering | |
CN112711703A (zh) | 用户标签获取方法、装置、服务器及存储介质 | |
CN112464027A (zh) | 一种视频检测方法、装置及存储介质 | |
CN114548083B (zh) | 标题生成方法、装置、设备及介质 | |
CN116485352B (zh) | 会员管理和数据分析的方法、装置、设备及存储介质 | |
CN117573844B (zh) | 一种基于上下文感知的数据推荐方法、装置及相关介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |