CN114756671A - 文章推荐方法、装置、计算机设备及存储介质 - Google Patents

文章推荐方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN114756671A
CN114756671A CN202210441145.XA CN202210441145A CN114756671A CN 114756671 A CN114756671 A CN 114756671A CN 202210441145 A CN202210441145 A CN 202210441145A CN 114756671 A CN114756671 A CN 114756671A
Authority
CN
China
Prior art keywords
reading
user
article
behavior data
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210441145.XA
Other languages
English (en)
Inventor
姚宏志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202210441145.XA priority Critical patent/CN114756671A/zh
Publication of CN114756671A publication Critical patent/CN114756671A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及数据推送领域,特别是涉及到一种文章推荐方法、装置、计算机设备及存储介质,所述方法包括:获取用户浏览文章的阅读行为信息;提取所述阅读行为信息中所述用户的阅读行为数据;根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;基于所述阅读标签向用户推荐对应的目标文章。本申请通过扩展识别用户的阅读行为信息,准确地获得用户的阅读兴趣,提高向用户推送目标信息的准确性。

Description

文章推荐方法、装置、计算机设备及存储介质
技术领域
本申请涉及数据推送领域,特别是涉及到一种文章推荐方法、装置、计算机设备及存储介质。
背景技术
目前针对文章的阅读推荐,主要通过用户对某篇文章的浏览时间、评论转发次数等来识别用户对文章的兴趣,但该识别的过程,常常因为单一的数据维度,并且数据的准确性较低且不全面,导致对用户的兴趣识别不够精准,文章推送的准确性较低。
发明内容
本申请的主要目的为提供一种文章推荐方法、装置、计算机设备及存储介质,旨在解决文章推送的准确性较低的问题。
为了实现上述发明目的,本申请提出一种文章推荐方法,所述方法包括:
获取用户浏览文章的阅读行为信息;
提取所述阅读行为信息中所述用户的阅读行为数据;
根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;
若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;
根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;
基于所述阅读标签向用户推荐对应的目标文章。
进一步地,所述根据所述阅读行为数据确定所述用户对所述文章的阅读方式,包括:
根据所述阅读行为数据计算所述用户对所述文章的喜爱度;
根据所述喜爱度确定所述用户对所述文章的阅读方式。
进一步地,所述根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括:
根据所述阅读行为数据生成用户阅读画像;
根据所述用户阅读画像匹配相似阅读画像;
获取各个所述相似阅读画像的待选阅读真实度;
根据所述各个所述相似阅读画像及对应的待选阅读真实度计算所述用户对所述文章的阅读真实度。
进一步地,所述提取所述阅读行为信息中所述用户的阅读行为数据,包括:
识别所述阅读行为信息,获取所述阅读行为信息包含的行为项目;
识别所述行为项目,提取所述行为项目中用户的行为数据及行为数据值;
根据所述行为数据及行为数据值生成所述用户的阅读行为数据。
进一步地,所述根据所述行为数据及行为数据值生成所述用户的阅读行为数据,包括:
对所述行为数据及行为数据值进行连续归一处理,生成所述用户归一化的阅读行为数据。
进一步地,所述基于所述阅读标签向用户推荐对应的目标文章,包括:
从算法库中获取不同策略的若干种待选算法;
根据所述待选算法与所述阅读标签确定待选文章;
从所述待选文章中选取满足预设要求的预设数量的目标文章,以向用户推荐对应的目标文章。
进一步地,所述从所述待选文章中选取满足预设要求的预设数量的目标文章,包括:
获取所述待选算法的历史推荐准确率;
根据所述历史推荐准确率配置各个所述待选算法的比例值;
根据所述各个所述待选算法的比例值确定所述待选算法对应的待选文章的数量,得到预设数量的目标文章。
本申请还提供一种文章推荐装置,所述装置包括:
信息获取模块,用于获取用户浏览文章的阅读行为信息;
信息提取模块,用于提取所述阅读行为信息中所述用户的阅读行为数据;
数据计算模块,用于根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;
数据匹配模块,用于若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;
标签匹配模块,用于根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;
目标推送模块,用于基于所述阅读标签向用户推荐对应的目标文章。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述任一项所述文章推荐方法。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一项所述文章推荐方法。
本申请实施例提供了一种基于识别用户的阅读兴趣向用户推送文章的方法,首先获取用户浏览文章的阅读行为信息,然后提取所述阅读行为信息中的有效信息,先将阅读行为信息中的冗余信息剔除,再识别剔除冗余信息后的阅读行为信息,提取所述阅读行为信息中所述用户的阅读行为数据,从而提高识别所述阅读行为数据的准确率与效率,再根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括用户对每一篇文章的阅读真实度,以及用户对所有文章统一后的阅读真实度,再根据所述阅读真实度对用户的阅读文章进行筛选,若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式,确定用户对文章为精读、粗略阅读或者热衷评论等阅读方式,根据用户对文章的阅读方式匹配用户对文章的兴趣指数,再根据所述兴趣指数提取所述文章具有的标签,从而所述兴趣数据生成用户的阅读标签,基于所述阅读标签向用户推荐对应的目标文章,通过扩展识别用户的阅读行为信息,基于用户的阅读行为信息准确地获得用户的阅读兴趣,再根据用户对不同文章的阅读兴趣提取文章包含的标签,基于所述标签向用户匹配目标文章,从而提高向用户推送目标信息的准确性。
附图说明
图1为本申请文章推荐方法的一实施例流程示意图;
图2为本申请确定用户对文章的阅读方式的一实施例流程示意图;
图3为本申请计算阅读真实度的一实施例流程示意图;
图4为本申请提取阅读行为数据的一实施例流程示意图;
图5为本申请根据所述行为数据及行为数据值生成所述用户的阅读行为数据的一实施例流程示意图;
图6为本申请基于所述阅读标签向用户推荐对应的目标文章的一实施例流程示意图;
图7为本申请从所述待选文章中选取满足预设要求的预设数量的目标文章的一实施例流程示意图;
图8为本申请文章推荐装置的一实施例结构示意图;
图9为本申请计算机设备的一实施例结构示意框图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
参照图1,本申请实施例提供一种文章推荐方法,所述文章推荐方法包括步骤S101-S106,对于所述文章推荐方法的各个步骤的详细阐述如下。
S101、获取用户浏览文章的阅读行为信息。
本实施例应用于文章阅读推荐场景中,在文章阅读推荐场景中,为了提供更精准的文章给用户,首先,获取用户浏览文章的阅读行为信息,在文章阅读的应用程序中,向用户推送不同的文章,用户在应用程序中针对不同的文章进行浏览、阅读,将用户对不同文章的浏览、阅读灯操作行为定义为用户浏览文章的阅读行为信息,在一种实施方式中,通过在应用程序中进行埋点,收集用户在应用程序中浏览文章的各种操作数据,从而获取用户浏览文章的阅读行为信息。
S102、提取所述阅读行为信息中所述用户的阅读行为数据。
本实施例中,在获取用户浏览文章的阅读行为信息之后,为了对所述阅读行为信息进行准确的分析,提取所述阅读行为信息中所述用户的阅读行为数据,在一种实施方式中,所述阅读行为信息以日志的形式记录,日志中包含了时间、地址、IP等其他冗余信息,并且,日志中包含了用户对不同文章的不同阅读行为,例如用户对文章A的阅读行为,用户对文章B的阅读行为等,在提取所述阅读行为信息中的有效信息时,先将所述冗余信息剔除,再识别剔除冗余信息后的阅读行为信息,从而提高识别所述阅读行为数据的准确率与效率。
S103、根据所述阅读行为数据计算所述用户对所述文章的阅读真实度。
本实施例中,在提取所述阅读行为信息中所述用户的阅读行为数据之后,根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,即根据所述阅读行为数据计算用户是否对文章进行真实的阅读,在一种实施方式中,根据所述阅读行为信息中的浏览时间、停留时间、滑动时间计算用户对所述文章的阅读真实度,计算得到包括用户对每一篇文章的阅读真实度,以及用户对所有文章统一后的阅读真实度。
S104、若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式。
本实施例中,在根据所述阅读行为数据计算所述用户对所述文章的阅读真实度之后,根据所述阅读真实度对用户的阅读文章进行筛选,同时对用户进行筛选,在一种实施方式中,若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式,即用户对某一篇文章的阅读真实度满足预设阈值,则将篇文章筛选出来,同时获取用户对该篇文章的阅读行为数据,再根据所述阅读行为数据确定所述用户对所述文章的阅读方式,即确定用户对文章为精读、粗略阅读或者热衷评论等阅读方式。
S105、根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签。
本实施例中,在判定所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式之后,根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签,即根据用户对文章的阅读方式匹配用户对文章的兴趣指数,再根据所述兴趣指数提取所述文章具有的标签,从而所述兴趣数据生成用户的阅读标签。
S106、基于所述阅读标签向用户推荐对应的目标文章。
本实施例中,在根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签之后,基于所述阅读标签向用户推荐对应的目标文章,根据所述阅读标签可以准确地了解用户对不同类型的文章的感兴趣程度,然后根据用户对不同类型的文章的感兴趣程度匹配相应的文章,定义为目标文章,从而基于所述阅读标签向用户推荐对应的目标文章,通过扩展识别用户的阅读行为信息,基于用户的阅读行为信息准确地获得用户的阅读兴趣,再根据用户对不同文章的阅读兴趣提取文章包含的标签,基于所述标签向用户匹配目标文章,从而提高向用户推送目标信息的准确性。
本实施例提供了一种基于识别用户的阅读兴趣向用户推送文章的方法,首先获取用户浏览文章的阅读行为信息,然后提取所述阅读行为信息中的有效信息,先将阅读行为信息中的冗余信息剔除,再识别剔除冗余信息后的阅读行为信息,提取所述阅读行为信息中所述用户的阅读行为数据,从而提高识别所述阅读行为数据的准确率与效率,再根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括用户对每一篇文章的阅读真实度,以及用户对所有文章统一后的阅读真实度,再根据所述阅读真实度对用户的阅读文章进行筛选,若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式,确定用户对文章为精读、粗略阅读或者热衷评论等阅读方式,根据用户对文章的阅读方式匹配用户对文章的兴趣指数,再根据所述兴趣指数提取所述文章具有的标签,从而所述兴趣数据生成用户的阅读标签,基于所述阅读标签向用户推荐对应的目标文章,通过扩展识别用户的阅读行为信息,基于用户的阅读行为信息准确地获得用户的阅读兴趣,再根据用户对不同文章的阅读兴趣提取文章包含的标签,基于所述标签向用户匹配目标文章,从而提高向用户推送目标信息的准确性。
在一个实施例中,如图2所示,所述根据所述阅读行为数据确定所述用户对所述文章的阅读方式,包括步骤S201-202:
S201,根据所述阅读行为数据计算所述用户对所述文章的喜爱度;
S202,根据所述喜爱度确定所述用户对所述文章的阅读方式。
本实施例中,在根据所述阅读行为数据确定所述用户对所述文章的阅读方式的过程中,首先根据所述阅读行为数据计算所述用户对所述文章的喜爱度,针对用户对每一篇文章的阅读行为计算用户对每一篇文章的喜爱度,将各种不同的阅读行为以喜爱度的评分进行量化,从而准确地对每一种阅读行为进行定义,再根据所述喜爱度确定所述用户对所述文章的阅读方式,基于不同评分的喜爱度匹配阅读方式,以评分量化的形式对阅读方式进行确定,能够提高确定阅读方式的效率。
在一个实施例中,如图3所示,所述根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括步骤S301-S304:
S301,根据所述阅读行为数据生成用户阅读画像;
S302,根据所述用户阅读画像匹配相似阅读画像;
S303,获取各个所述相似阅读画像的待选阅读真实度;
S304,根据所述各个所述相似阅读画像及对应的待选阅读真实度计算所述用户对所述文章的阅读真实度。
本实施例中,在根据所述阅读行为数据计算所述用户对所述文章的阅读真实度的过程中,根据所述阅读行为数据生成用户阅读画像,从而为每一个用户生成其对应的用户阅读画像,包括用户对每一篇文章的用户阅读画像,再根据所述用户阅读画像匹配相似阅读画像,获取各个所述相似阅读画像的待选阅读真实度,历史已收集的用户相似阅读画像均配置有对应的待选阅读真实度数据,然后根据所述各个所述相似阅读画像及对应的待选阅读真实度计算所述用户对所述文章的阅读真实度,基于相似画像的待选阅读真实度加权计算用户的阅读真实度,从而提高基于阅读行为数据而计算用户对所述文章的阅读真实度的准确性。
在一个实施例中,如图4所示,所述提取所述阅读行为信息中所述用户的阅读行为数据,包括步骤S401-S402:
S401,识别所述阅读行为信息,获取所述阅读行为信息包含的行为项目;
S402,识别所述行为项目,提取所述行为项目中用户的行为数据及行为数据值;
S403,根据所述行为数据及行为数据值生成所述用户的阅读行为数据。
本实施例中,在提取所述阅读行为信息中所述用户的阅读行为数据的过程中,识别所述阅读行为信息,获取所述阅读行为信息包含的行为项目,即先识别所述阅读信息中包含了哪些行为数据的类目,同一个类目的行为数据写在预设的范围内,再识别该范围内的信息,即识别所述行为项目,提取所述行为项目中用户的行为数据及行为数据值,每一项行为数据均包含有对应的数据值,例如浏览时间5秒,阅读市场2分钟,评论次数2次等,再根据所述行为数据及行为数据值生成所述用户的阅读行为数据,提高识别用户的阅读行为数据的准确性。
在一个实施例中,如图5所示,所述根据所述行为数据及行为数据值生成所述用户的阅读行为数据,包括步骤S501:
S501,对所述行为数据及行为数据值进行连续归一处理,生成所述用户归一化的阅读行为数据。
本实施例中,在根据所述行为数据及行为数据值生成所述用户的阅读行为数据的过程中,对所述行为数据及行为数据值进行连续归一处理,将具有相同或相关联的行为数据及其数据值进行归一处理,并且基于时间顺序进行连续归一处理,从而生成所述用户归一化的阅读行为数据,归一化的阅读行为数据能够减少阅读行为数据的数据量,有效地提高分析阅读行为数据的效率。
在一个实施例中,如图6所示,所述基于所述阅读标签向用户推荐对应的目标文章,包括步骤S601-S603:
S601,从算法库中获取不同策略的若干种待选算法;
S602,根据所述待选算法与所述阅读标签确定待选文章;
S603,从所述待选文章中选取满足预设要求的预设数量的目标文章,以向用户推荐对应的目标文章。
本实施例中,在基于所述阅读标签向用户推荐对应的目标文章的过程中,可以通过不同的算法对所述阅读标签进行计算,具体的,算法库中配置有若干种不同的算法,相同的标签基于不同的算法能够计算得到不同的文章,在一种实施方式中,从算法库中获取不同策略的若干种待选算法,所述策略包括基于协同过滤策略、基于热度值策略、基于相似度策略等,然后根据所述待选算法与所述阅读标签确定待选文章,再从所述待选文章中选取满足预设要求的预设数量的目标文章,以向用户推荐对应的目标文章,从而选取多种不同策略下确定的目标文章,提高文章推荐的多样性。
在一个实施例中,如图7所示,所述从所述待选文章中选取满足预设要求的预设数量的目标文章之后,还包括步骤S701-S702:
S701,获取所述待选算法的历史推荐准确率;
S702,根据所述历史推荐准确率配置各个所述待选算法的比例值;
S703,根据所述各个所述待选算法的比例值确定所述待选算法对应的待选文章的数量,得到预设数量的目标文章。
本实施例中,在从所述待选文章中选取满足预设要求的预设数量的目标文章之后,获取所述待选算法的历史推荐准确率,所述准确率通过用户对基于不同待选算法推荐的文章的喜爱程度而确定,即根据用户对基于不同待选算法推荐的文章的行为数据计算准确率,然后根据所述历史推荐准确率配置各个所述待选算法的比例值,根据所述各个所述待选算法的比例值确定所述待选算法对应的待选文章的数量,得到预设数量的目标文章,在一种实施方式中,每一次共推荐10篇目标文章,3个待选算法A、B、C的比例值为4:3:3,则根据所述比例值推送的待选算法A匹配的文章数量为4,待选算法B匹配的文章数量为3,待选算法C匹配的文章数量为3,从而动态地调整不同文章的比例,提高文章推荐的多样性。
参照图8,本申请还提供一种文章推荐装置,包括:
信息获取模块101,用于获取用户浏览文章的阅读行为信息;
信息提取模块102,用于提取所述阅读行为信息中所述用户的阅读行为数据;
数据计算模块103,用于根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;
数据匹配模块104,用于若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;
标签匹配模块105,用于根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;
目标推送模块106,用于基于所述阅读标签向用户推荐对应的目标文章。
如上所述,可以理解地,本申请中提出的所述文章推荐装置的各组成部分可以实现如上所述文章推荐方法任一项的功能。
在一个实施例中,所述根据所述阅读行为数据确定所述用户对所述文章的阅读方式,包括:
根据所述阅读行为数据计算所述用户对所述文章的喜爱度;
根据所述喜爱度确定所述用户对所述文章的阅读方式。
在一个实施例中,所述根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括:
根据所述阅读行为数据生成用户阅读画像;
根据所述用户阅读画像匹配相似阅读画像;
获取各个所述相似阅读画像的待选阅读真实度;
根据所述各个所述相似阅读画像及对应的待选阅读真实度计算所述用户对所述文章的阅读真实度。
在一个实施例中,所述提取所述阅读行为信息中所述用户的阅读行为数据,包括:
识别所述阅读行为信息,获取所述阅读行为信息包含的行为项目;
识别所述行为项目,提取所述行为项目中用户的行为数据及行为数据值;
根据所述行为数据及行为数据值生成所述用户的阅读行为数据。
在一个实施例中,所述根据所述行为数据及行为数据值生成所述用户的阅读行为数据,包括:
对所述行为数据及行为数据值进行连续归一处理,生成所述用户归一化的阅读行为数据。
在一个实施例中,所述基于所述阅读标签向用户推荐对应的目标文章,包括:
从算法库中获取不同策略的若干种待选算法;
根据所述待选算法与所述阅读标签确定待选文章;
从所述待选文章中选取满足预设要求的预设数量的目标文章,以向用户推荐对应的目标文章。
在一个实施例中,所述从所述待选文章中选取满足预设要求的预设数量的目标文章,包括:
获取所述待选算法的历史推荐准确率;
根据所述历史推荐准确率配置各个所述待选算法的比例值;
根据所述各个所述待选算法的比例值确定所述待选算法对应的待选文章的数量,得到预设数量的目标文章。
参照图9,本申请实施例中还提供一种计算机设备,该计算机设备可以是移动终端,其内部结构可以如图9所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和显示装置及输入装置。其中,该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示装置用于显示离线应用。该计算机设备的输入装置用于接收用户在离线应用的输入。该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质。该非易失性存储介质存储有操作系统、计算机程序和数据库。该计算机设备的数据库用于存放原始数据。该计算机程序被处理器执行时以实现一种文章推荐方法。
上述处理器执行上述的文章推荐方法,所述方法包括:获取用户浏览文章的阅读行为信息;提取所述阅读行为信息中所述用户的阅读行为数据;根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;基于所述阅读标签向用户推荐对应的目标文章。
所述计算机设备提供了一种基于识别用户的阅读兴趣向用户推送文章的方法,首先获取用户浏览文章的阅读行为信息,然后提取所述阅读行为信息中的有效信息,先将阅读行为信息中的冗余信息剔除,再识别剔除冗余信息后的阅读行为信息,提取所述阅读行为信息中所述用户的阅读行为数据,从而提高识别所述阅读行为数据的准确率与效率,再根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括用户对每一篇文章的阅读真实度,以及用户对所有文章统一后的阅读真实度,再根据所述阅读真实度对用户的阅读文章进行筛选,若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式,确定用户对文章为精读、粗略阅读或者热衷评论等阅读方式,根据用户对文章的阅读方式匹配用户对文章的兴趣指数,再根据所述兴趣指数提取所述文章具有的标签,从而所述兴趣数据生成用户的阅读标签,基于所述阅读标签向用户推荐对应的目标文章,通过扩展识别用户的阅读行为信息,基于用户的阅读行为信息准确地获得用户的阅读兴趣,再根据用户对不同文章的阅读兴趣提取文章包含的标签,基于所述标签向用户匹配目标文章,从而提高向用户推送目标信息的准确性。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被所述处理器执行时实现一种文章推荐方法,包括步骤:获取用户浏览文章的阅读行为信息;提取所述阅读行为信息中所述用户的阅读行为数据;根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;基于所述阅读标签向用户推荐对应的目标文章。
所述计算机可读存储介质提供了一种基于识别用户的阅读兴趣向用户推送文章的方法,首先获取用户浏览文章的阅读行为信息,然后提取所述阅读行为信息中的有效信息,先将阅读行为信息中的冗余信息剔除,再识别剔除冗余信息后的阅读行为信息,提取所述阅读行为信息中所述用户的阅读行为数据,从而提高识别所述阅读行为数据的准确率与效率,再根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括用户对每一篇文章的阅读真实度,以及用户对所有文章统一后的阅读真实度,再根据所述阅读真实度对用户的阅读文章进行筛选,若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式,确定用户对文章为精读、粗略阅读或者热衷评论等阅读方式,根据用户对文章的阅读方式匹配用户对文章的兴趣指数,再根据所述兴趣指数提取所述文章具有的标签,从而所述兴趣数据生成用户的阅读标签,基于所述阅读标签向用户推荐对应的目标文章,通过扩展识别用户的阅读行为信息,基于用户的阅读行为信息准确地获得用户的阅读兴趣,再根据用户对不同文章的阅读兴趣提取文章包含的标签,基于所述标签向用户匹配目标文章,从而提高向用户推送目标信息的准确性。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种文章推荐方法,其特征在于,所述方法包括:
获取用户浏览文章的阅读行为信息;
提取所述阅读行为信息中所述用户的阅读行为数据;
根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;
若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;
根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;
基于所述阅读标签向用户推荐对应的目标文章。
2.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述阅读行为数据确定所述用户对所述文章的阅读方式,包括:
根据所述阅读行为数据计算所述用户对所述文章的喜爱度;
根据所述喜爱度确定所述用户对所述文章的阅读方式。
3.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述阅读行为数据计算所述用户对所述文章的阅读真实度,包括:
根据所述阅读行为数据生成用户阅读画像;
根据所述用户阅读画像匹配相似阅读画像;
获取各个所述相似阅读画像的待选阅读真实度;
根据所述各个所述相似阅读画像及对应的待选阅读真实度计算所述用户对所述文章的阅读真实度。
4.根据权利要求1所述的文章推荐方法,其特征在于,所述提取所述阅读行为信息中所述用户的阅读行为数据,包括:
识别所述阅读行为信息,获取所述阅读行为信息包含的行为项目;
识别所述行为项目,提取所述行为项目中用户的行为数据及行为数据值;
根据所述行为数据及行为数据值生成所述用户的阅读行为数据。
5.根据权利要求4所述的文章推荐方法,其特征在于,所述根据所述行为数据及行为数据值生成所述用户的阅读行为数据,包括:
对所述行为数据及行为数据值进行连续归一处理,生成所述用户归一化的阅读行为数据。
6.根据权利要求1所述的文章推荐方法,其特征在于,所述基于所述阅读标签向用户推荐对应的目标文章,包括:
从算法库中获取不同策略的若干种待选算法;
根据所述待选算法与所述阅读标签确定待选文章;
从所述待选文章中选取满足预设要求的预设数量的目标文章,以向用户推荐对应的目标文章。
7.根据权利要求6所述的文章推荐方法,其特征在于,所述从所述待选文章中选取满足预设要求的预设数量的目标文章,包括:
获取所述待选算法的历史推荐准确率;
根据所述历史推荐准确率配置各个所述待选算法的比例值;
根据所述各个所述待选算法的比例值确定所述待选算法对应的待选文章的数量,得到预设数量的目标文章。
8.一种文章推荐装置,其特征在于,所述装置包括:
信息获取模块,用于获取用户浏览文章的阅读行为信息;
信息提取模块,用于提取所述阅读行为信息中所述用户的阅读行为数据;
数据计算模块,用于根据所述阅读行为数据计算所述用户对所述文章的阅读真实度;
数据匹配模块,用于若所述阅读真实度满足预设阈值,根据所述阅读行为数据确定所述用户对所述文章的阅读方式;
标签匹配模块,用于根据所述阅读方式匹配所述用户对所述文章的兴趣数据,根据所述兴趣数据生成用户的阅读标签;
目标推送模块,用于基于所述阅读标签向用户推荐对应的目标文章。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7任一项所述文章推荐方法。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一项所述文章推荐方法。
CN202210441145.XA 2022-04-25 2022-04-25 文章推荐方法、装置、计算机设备及存储介质 Pending CN114756671A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210441145.XA CN114756671A (zh) 2022-04-25 2022-04-25 文章推荐方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210441145.XA CN114756671A (zh) 2022-04-25 2022-04-25 文章推荐方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN114756671A true CN114756671A (zh) 2022-07-15

Family

ID=82332445

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210441145.XA Pending CN114756671A (zh) 2022-04-25 2022-04-25 文章推荐方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN114756671A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226539A (zh) * 2023-05-04 2023-06-06 浙江保融科技股份有限公司 一种自动化内容推荐方法及系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116226539A (zh) * 2023-05-04 2023-06-06 浙江保融科技股份有限公司 一种自动化内容推荐方法及系统
CN116226539B (zh) * 2023-05-04 2023-07-18 浙江保融科技股份有限公司 一种自动化内容推荐方法及系统

Similar Documents

Publication Publication Date Title
CN111325037B (zh) 文本意图识别方法、装置、计算机设备和存储介质
CN106446816B (zh) 人脸识别方法及装置
CN110765275A (zh) 搜索方法、装置、计算机设备和存储介质
CN110569500A (zh) 文本语义识别方法、装置、计算机设备和存储介质
CN110751533B (zh) 产品画像生成方法、装置、计算机设备和存储介质
CN110135943B (zh) 产品推荐方法、装置、计算机设备和存储介质
CN111191568A (zh) 翻拍图像识别方法、装置、设备及介质
CN110111136B (zh) 视频数据处理方法、装置、计算机设备和存储介质
CN110555164B (zh) 群体兴趣标签的生成方法、装置、计算机设备和存储介质
CN112395500A (zh) 内容数据推荐方法、装置、计算机设备及存储介质
CN111192153B (zh) 人群关系网络构建方法、装置、计算机设备和存储介质
CN112818162B (zh) 图像检索方法、装置、存储介质和电子设备
CN112699923A (zh) 文档分类预测方法、装置、计算机设备及存储介质
CN111858977B (zh) 票据信息采集方法、装置、计算机设备和存储介质
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN110413994B (zh) 热点话题生成方法、装置、计算机设备和存储介质
CN111368061B (zh) 短文本过滤方法、装置、介质及计算机设备
CN114756671A (zh) 文章推荐方法、装置、计算机设备及存储介质
CN112035775B (zh) 基于随机森林模型的用户识别方法、装置和计算机设备
CN113762392A (zh) 基于人工智能的理财产品推荐方法、装置、设备及介质
CN112464660A (zh) 文本分类模型构建方法以及文本数据处理方法
CN111783786A (zh) 图片的识别方法、系统、电子设备及存储介质
CN114692785B (zh) 行为分类方法、装置、设备及存储介质
CN115994232A (zh) 在线多版本文献同一性鉴别方法、系统及计算机设备
CN112015762A (zh) 案件检索方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination