CN112328881A - 文章推荐方法、装置、终端设备及存储介质 - Google Patents

文章推荐方法、装置、终端设备及存储介质 Download PDF

Info

Publication number
CN112328881A
CN112328881A CN202011225618.XA CN202011225618A CN112328881A CN 112328881 A CN112328881 A CN 112328881A CN 202011225618 A CN202011225618 A CN 202011225618A CN 112328881 A CN112328881 A CN 112328881A
Authority
CN
China
Prior art keywords
article
recommended
articles
user
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011225618.XA
Other languages
English (en)
Other versions
CN112328881B (zh
Inventor
老焯楠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202011225618.XA priority Critical patent/CN112328881B/zh
Publication of CN112328881A publication Critical patent/CN112328881A/zh
Application granted granted Critical
Publication of CN112328881B publication Critical patent/CN112328881B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种文章推荐方法、装置、终端设备及存储介质,该方法包括:确定用户在预设时间内点击的文章,并根据文章的文章标签计算用户的标签分数;根据标签分数构建用户的文章点击标签;获取不同待推荐文章的文章标签,并根据文章标签和文章点击标签分别计算用户对不同待推荐文章的文章兴趣度;根据文章兴趣度对待推荐文章进行排序,并根据排序后的待推荐文章对用户进行文章推荐。本申请基于文章兴趣度以表征用户对对应待推荐文章的感兴趣程度,使得能对用户感兴趣程度不相同的待推荐文章进行区分,并根据文章兴趣度对待推荐文章进行排序,提高了文章推荐的准确性。此外,本申请还涉及区块链技术。

Description

文章推荐方法、装置、终端设备及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种文章推荐方法、装置、终端设备及存储介质。
背景技术
文章推荐是人工智能中比较贴近业务的一个领域,在开拓新场景或者新企业初创的过程中,往往会遇到数据侧与推荐策略迭代节奏不一致的情况,常用的CTR(click-through rate)预估模型会因为缺乏曝光点击数据而不能完成文章的推荐,因此,基于杰卡德相似度(jaccard)的文章推荐方法应运而生,基于杰卡德相似度的文章推荐方法通过直接计算用户与待推荐数据中待推荐文章之间的标签相似度,并基于标签相似度对用户进行文章推荐,使得无需基于曝光点击数据进行文章的推荐。
现有的基于杰卡德相似度的文章推荐方法使用过程中,仅考虑了用户与待推荐文章的标签之间所共有的标签交集以及两者标签的并集,基于随机的方式进行感兴趣程度较高的文章与感兴趣程度较低的文章之间的排序和推荐,使得对用户感兴趣程度较高的文章推荐不准确性,进而降低了文章推荐准确性。
发明内容
有鉴于此,本申请实施例提供了一种文章推荐方法、装置、终端设备及存储介质,以解决现有技术的文章推荐过程中,由于采用随机的方式进行感兴趣程度较高的文章与感兴趣程度较低的文章之间的排序和推荐,所导致的文章推荐准确性低下的问题。
本申请实施例的第一方面提供了一种文章推荐方法,包括:
确定用户在预设时间内点击的文章,并根据所述文章的文章标签计算所述用户的标签分数,所述标签分数用于表征所述用户对不同文章标签的偏好程度;
根据所述标签分数构建所述用户的文章点击标签,所述文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征;
获取不同待推荐文章的文章标签,并根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度;
根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
进一步地,所述根据所述文章的文章标签计算所述用户的标签分数,包括:
获取不同所述文章在预设时间内的点击次数,并获取所述用户在所述预设时间内点击不同所述文章的总点击次数;
分别计算不同所述文章在预设时间内的点击次数与所述文章的总点击次数之间的商值,得到所述用户对不同文章标签的偏好程度。
进一步地,所述根据所述标签分数构建所述用户的文章点击标签,包括:
分别获取不同所述文章的文章标签对应的标签向量,并根据所述偏好程度对对应所述标签向量进行加权计算;
将加权计算后的所述标签向量与对应所述文章标签进行关联存储,得到所述文章点击标签。
进一步地,所述根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度,包括:
对加权计算后的所述标签向量进行向量合并,得到所述文章点击标签的标签向量;
分别获取不同所述待推荐文章的文章标签对应的标签向量,并根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算,得到所述文章兴趣度,所述兴趣度计算用于计算所述用户对待推荐文章的感兴趣程度。
进一步地,所述根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算所采用的计算公式为:
Simjaccard=A*B/(|A|2+|B|2-A*B)
A是所述文章点击标签的标签向量,B是所述待推荐文章的文章标签对应的标签向量,Simjaccard是所述文章兴趣度。
进一步地,所述获取不同待推荐文章的文章标签,包括:
获取训练样本,并将所述训练样本输入推荐模型;
根据所述推荐模型分别提取所述训练样本中不同样本文章的一级类目、二级类目和关键词;
根据所述一级类目、所述二级类目和所述关键词进行损失计算,得到模型损失值,并根据所述模型损失值对所述推荐模型进行权值更新,直至所述推荐模型收敛;
将所述待推荐数据输入收敛后的所述推荐模型,并根据收敛后的所述推荐模型分别对不同所述待推荐文章进行标签提取,得到不同所述待推荐文章的文章标签。
进一步地,所述根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度之后,还包括:
若任一所述文章兴趣度小于兴趣度阈值,则删除所述文章兴趣度对应的待推荐文章。
本申请实施例的第二方面提供了一种文章推荐装置,包括:
点击数据获取单元,用于获取用户的文章点击数据,所述文章点击数据包括所述用户在预设时间内点击的点击文章;
标签分数计算单元,用于根据所述点击文章的文章标签计算所述用户的标签分数,并根据所述标签分数构建所述用户的文章点击标签,所述标签分数包括所述用户对不同所述点击文章对应文章标签的偏好程度;
文章标签获取单元,用于获取待推荐数据,并分别获取所述待推荐数据中不同待推荐文章的文章标签;
文章兴趣度计算单元,用于根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度;
文章推荐单元,用于根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
本申请实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在终端设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方案提供的文章推荐方法的各步骤。
本申请实施例的第四方面提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提供的文章推荐方法的各步骤。
实施本申请实施例提供的一种文章推荐方法、装置、终端设备及存储介质具有以下有益效果:
本申请实施例提供的一种文章推荐方法,首先根据用户在预设时间内点击的文章的文章标签计算用户的标签分数,再根据标签分数构建用户的文章点击标签。由于标签分数用于表征用户对不同文章标签的偏好程度,且文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征,因此,根据标签分数构建的用户的文章点击标签能有效的提高文章点击标签构建的准确性,由于标签分数能表征用户对不同文章标签的偏好程度,因此,通过根据标签分数构建得到的用户的文章点击标签能有效的表征用户在预设时间内点击的文章的标签特征,通过根据用户针对不同文章标签的兴趣偏好和待推荐文章的文章标签,分别计算用户对不同待推荐文章的文章兴趣度,基于文章兴趣度以表征用户对对应待推荐文章的感兴趣程度,使得能有效的对用户感兴趣程度不相同的待推荐文章进行区分,并根据对用户感兴趣程度不相同的待推荐文章的区分结果,按照文章兴趣度从高到低进行排序,使得基于计算到的文章兴趣度对待推荐文章进行文章排序和文章推荐,能有效的将用户兴趣度程度高的待推荐文章排序在用户兴趣度程度低的待推荐文章的前面,使得将用户兴趣度程度高的待推荐文章先进行文章推荐,提高了文章推荐的准确性和用户对待推荐文章的点击概率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种文章推荐方法的实现流程图;
图2是本申请另一实施例提供的一种文章推荐方法的实现流程图;
图3是本申请实施例提供的一种文章推荐装置的结构框图;
图4是本申请实施例提供的一种终端设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例所涉及的文章推荐方法,可以由控制设备或终端(以下称“移动终端”)执行。
请参阅图1,图1示出了本申请实施例提供的一种文章推荐方法的实现流程图,包括:
步骤S10,确定用户在预设时间内点击的文章,并根据所述文章的文章标签计算所述用户的标签分数。
其中,该标签分数用于表征用户对不同文章标签的偏好程度,当该标签分数越高时,则判定用户对该标签分数对应文章标签的文章越感兴趣,例如,计算到该文章标签“体育”的标签分数为0.1,文章标签“金融”的标签分数为0.3时,则判定用户对金融类文章的感兴趣程度大于体育类文章。
该步骤中,通过获取该用户的用户信息,并根据该用户信息进行用户在预设时间内点击的文章查询,该用户信息包括用户姓名、用户标识、用户年龄、用户性别和居住地等信息,具体的,该步骤中,通过将该用户信息与文章点击查询表进行匹配,以确定用户在预设时间内点击的文章,该文章点击查询表中存储有不同用户信息在预设时间内与对应点击的文章之间的对应关系。
可选的,该步骤中,所述根据所述文章的文章标签计算所述用户的标签分数,包括:
获取不同所述文章在预设时间内的点击次数,并获取所述用户在所述预设时间内点击不同所述文章的总点击次数;
分别计算不同所述文章在预设时间内的点击次数与所述文章的总点击次数之间的商值,得到所述用户对不同文章标签的偏好程度;
其中,该预设时间可以设置为指定时间或指定间隔时间等,该指定时间和指定间隔时间均可以根据用户需求进行设置,例如,该指定时间可以设置为每周的周一或每周的周三早上8点等,该指定间隔时间可以设置为1小时、1天或1周等,当该指定间隔时间可以设置为1小时,则获取当前时间点至1小时前所形成的时间范围内用户点击的文章。
具体的,该步骤中,通过分别计算不同文章在预设时间内的点击次数与文章的总点击次数之间的商值,以得到用户对不同文章标签的偏好程度,例如,用户在预设时间内点击的文章包括文章A、文章B和文章C,文章A的文章标签为标签体育,文章B的文章标签为标签金融,文章C的文章标签为标签电影,文章A在预设时间内的点击次数为1次,文章B在预设时间内的点击次数为2次,文章C在预设时间内的点击次数为7次时,则标签体育的偏好程度为0.1,标签金融的偏好程度为0.2,标签电影的偏好程度为0.7。
步骤S20,根据所述标签分数构建所述用户的文章点击标签。
其中,文章点击标签用于表征用户在预设时间内点击的文章的标签特征,具体的,该步骤中,通过根据该文章标签在标签分数中对应的偏好程度进行加权,并基于加权后的文章标签以构建该文章点击标签;
例如,用户在预设时间内点击的文章包括文章A、文章B和文章C,文章A的文章标签为标签体育,文章B的文章标签为标签金融,文章C的文章标签为标签电影,标签体育的偏好程度为0.1,标签金融的偏好程度为0.2,标签电影的偏好程度为0.7时,则文章点击标签中的文章标签包括标签体育、标签金融和标签电影,且标签体育、标签金融和标签电影在文章点击标签中的占比为1:2:7,即用户对电影类文章的感兴趣程度大于金融类文章的感兴趣程度,金融类文章的感兴趣程度大于体育类文章的感兴趣程度。
步骤S30,获取不同待推荐文章的文章标签,并根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度。
其中,可以基于推荐模型或文章标签提取器的方式进行该不同待推荐文章的文章标签的提取操作,使得能针对不同待推荐文章直接提取到对应的文章标签。
可选的,该步骤中,所述获取不同待推荐文章的文章标签,包括:
获取训练样本,将所述训练样本输入推荐模型,并根据所述推荐模型分别提取所述训练样本中不同样本文章的一级类目、二级类目和关键词;
根据所述一级类目、所述二级类目和所述关键词进行损失计算,得到模型损失值,并根据所述模型损失值对所述推荐模型进行权值更新,直至所述推荐模型收敛;
将所述待推荐数据输入收敛后的所述推荐模型,并根据收敛后的所述推荐模型分别对不同所述待推荐文章进行标签提取,得到不同所述待推荐文章的文章标签;
其中,该训练样本可以根据需求进行设置,该训练样本用于为推荐模型的模型训练提供训练数据,该推荐模型基于模型内的卷积层分别对不同样本文章的一级类目、二级类目和关键词进行提取,将提取到的一级类目、二级类目和关键词输出模型内的全连接层进行分类预测,得到一级类目、二级类目和关键词对应的标签,根据全连接层输出的标签和样本文章对应的正确标签进行损失计算,以计算该推荐模型的模型损失值,并根据模型损失值对推荐模型中的卷积层和全连接层进行权值更新,直至推荐模型收敛,使得收敛后的推荐模型能对样本文章中一级类目、二级类目和关键词进行准确的分类,进而保障了收敛后的推荐模型对待推荐文章中一级类目、二级类目和关键词的分类,提高了对不同待推荐文章标签提取的准确性。
步骤S40,根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
其中,根据文章兴趣度对待推荐文章进行排序,得到推荐排序结果,并根据推荐排序结果对用户进行文章推荐,该推荐排序结果中存储有不同待推荐文章与对应推荐顺序之间的对应关系,该步骤中,当文章兴趣度越大时,则判定用户对该文章兴趣度对应的待推荐文章越感兴趣,因此,基于该文章兴趣度进行该待推荐文章的排序,并根据排序后的待推荐文章对用户进行文章推荐,能有效的将用户兴趣度程度高的待推荐文章排序在用户兴趣度程度低的待推荐文章的前面,使得将用户兴趣度程度高的待推荐文章先进行文章推荐,提高了用户对待推荐文章的点击概率。
例如,待推荐文章包括文章D、文章E和文章F,文章D、文章E和文章F对应的文章兴趣度为0.1、0.4和0.8时,则针对该文章D、文章E和文章F的推荐排序为文章D-文章E-文章F,并根据推荐排序文章D-文章E-文章F对用户进行文章推荐。
本实施例中,首先根据用户在预设时间内点击的文章的文章标签计算用户的标签分数,再根据标签分数构建用户的文章点击标签。由于标签分数用于表征用户对不同文章标签的偏好程度,且文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征,因此,根据标签分数构建的用户的文章点击标签能有效的提高文章点击标签构建的准确性,由于标签分数能表征用户对不同文章标签的偏好程度,因此,通过根据标签分数构建得到的用户的文章点击标签能有效的表征用户在预设时间内点击的文章的标签特征,通过根据用户针对不同文章标签的兴趣偏好和待推荐文章的文章标签,分别计算用户对不同待推荐文章的文章兴趣度,基于文章兴趣度以表征用户对对应待推荐文章的感兴趣程度,使得能有效的对用户感兴趣程度不相同的待推荐文章进行区分,并根据对用户感兴趣程度不相同的待推荐文章的区分结果,按照文章兴趣度从高到低进行排序,使得基于计算到的文章兴趣度对待推荐文章进行文章排序和文章推荐,能有效的将用户兴趣度程度高的待推荐文章排序在用户兴趣度程度低的待推荐文章的前面,使得将用户兴趣度程度高的待推荐文章先进行文章推荐,提高了文章推荐的准确性和用户对待推荐文章的点击概率。
请参阅图2,图2是本申请另一实施例提供的一种文章推荐方法的实现流程图。相对于图1对应的实施例,本实施例提供的文章推荐方法是对图1对应的实施例中步骤S20的进一步细化,包括:
步骤S21,分别获取不同所述文章的文章标签对应的标签向量,并根据所述偏好程度对对应所述标签向量进行加权计算。
其中,本实施例中预存储有向量查询库,该向量查询库中存储有不同文章标签与对应标签向量之间的对应关系,该标签向量用于表征对应文章标签的文章特征,因此,该步骤中,通过将不同文章的文章标签分别与向量查询库进行匹配,以得到不同文章的文章标签对应的标签向量。
该步骤中,通过根据偏好程度对对应文章标签对应的标签向量进行加权计算,以根据用户对不同文章标签的偏好程度对对应标签向量进行加权,例如,用户在预设时间内点击的文章包括文章A、文章B和文章C,文章A的文章标签为标签体育,文章B的文章标签为标签金融,文章C的文章标签为标签电影,标签体育、标签金融和标签电影对应的标签向量为标签向量a、标签向量b和标签向量c,标签体育的偏好程度为0.1,标签金融的偏好程度为0.2,标签电影的偏好程度为0.7时,则计算标签向量a与0.1之间的乘积,计算标签向量b与0.2之间的乘积,计算标签向量c与0.7之间的乘积,以达到对标签向量a、标签向量b和标签向量c的加权效果。
步骤S22,将加权计算后的所述标签向量与对应所述文章标签进行关联存储,得到所述文章点击标签。
其中,将加权计算后的文章标签对应的标签向量与对应文章标签进行关联存储,以采用标签向量的方式表征用户对不同文章标签对应类型文章的偏好程度。
可选的,本实施例中,针对图1对应实施例中的步骤S30,所述根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度,包括:
对加权计算后的所述标签向量进行向量合并,得到所述文章点击标签的标签向量;
分别获取不同所述待推荐文章的文章标签对应的标签向量,并根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算,得到所述文章兴趣度;
其中,通过对加权计算后的文章标签对应的标签向量进行向量合并,以采用一个标签向量的方式表征对应的文章点击标签,进而有效的方便了后续待推荐文章的文章标签对应的标签向量与文章点击标签的标签向量之间的兴趣度计算。
例如,对加权计算后的文章标签对应的标签向量包括标签向量a、标签向量b和标签向量c时,则对标签向量a、标签向量b和标签向量c进行向量合并,得到标签向量d,则该标签向量d为文章点击标签的标签向量。
具体的,该兴趣度计算用于计算用户对待推荐文章的感兴趣程度,进一步地,本实施例中,所述根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算所采用的计算公式为:
Simjaccard=A*B/(|A|2+|B|2-A*B)
A是所述文章点击标签的标签向量,B是所述待推荐文章的文章标签对应的标签向量,Simjaccard是所述文章兴趣度。
可选的,该步骤中,若任一文章兴趣度小于兴趣度阈值,则删除文章兴趣度对应的待推荐文章,其中,若任一文章兴趣度小于兴趣度阈值,判定用户对该文章兴趣度对应的待推荐文章不感兴趣,通过删除该文章兴趣度对应的待推荐文章,有效的方便了该待推荐文章对用户的无效推荐。
本实施例中,通过根据偏好程度对对应文章标签对应的标签向量进行加权计算,以根据用户对不同文章标签的偏好程度对对应标签向量进行加权,通过将加权计算后的文章标签对应的标签向量与对应文章标签进行关联存储,以采用标签向量的方式表征用户对不同文章标签对应类型文章的偏好程度,通过根据不同待推荐文章的文章标签对应的标签向量和文章点击标签的标签向量进行兴趣度计算,以得到用户对不同待推荐文章的感兴趣程度,并基于该感兴趣程度能有效的对不同待推荐文章进行排序和推荐。
在本申请的所有实施例中,根据文章兴趣度对待推荐文章进行排序得到推荐排序结果,具体来说,推荐排序结果由文章兴趣度对待推荐文章进行排序得到。将推荐排序结果上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得到该推荐排序结果,以便查证推荐排序结果是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
请参阅图3,图3是本申请实施例提供的一种文章推荐装置100的结构框图。本实施例中该文章推荐装置100包括的各单元用于执行图1、图2对应的实施例中的各步骤。具体请参阅图1、图2以及图1、图2所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,文章推荐装置100包括:标签分数计算单元10、点击标签构建单元11、兴趣度计算单元12和文章推荐单元13,其中:
标签分数计算单元10,用于确定用户在预设时间内点击的文章,并根据所述文章的文章标签计算所述用户的标签分数,所述标签分数用于表征所述用户对不同文章标签的偏好程度。
其中,标签分数计算单元10还用于:获取不同所述文章在预设时间内的点击次数,并获取所述用户在所述预设时间内点击不同所述文章的总点击次数;
分别计算不同所述文章在预设时间内的点击次数与所述文章的总点击次数之间的商值,得到所述用户对不同文章标签的偏好程度。
点击标签构建单元11,用于根据所述标签分数构建所述用户的文章点击标签,所述文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征。
其中,点击标签构建单元11还用于:分别获取不同所述文章的文章标签对应的标签向量,并根据所述偏好程度对对应所述标签向量进行加权计算;
将加权计算后的所述标签向量与对应所述文章标签进行关联存储,得到所述文章点击标签。
兴趣度计算单元12,用于获取不同待推荐文章的文章标签,并根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度。
其中,兴趣度计算单元12还用于:对加权计算后的所述标签向量进行向量合并,得到所述文章点击标签的标签向量;
分别获取不同所述待推荐文章的文章标签对应的标签向量,并根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算,得到所述文章兴趣度,所述兴趣度计算用于计算所述用户对待推荐文章的感兴趣程度。
可选的,所述根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算所采用的计算公式为:
Simjaccard=A*B/(|A|2+|B|2-A*B)
A是所述文章点击标签的标签向量,B是所述待推荐文章的文章标签对应的标签向量,Simjaccard是所述文章兴趣度。
可选的,兴趣度计算单元12还用于:获取训练样本,并将所述训练样本输入推荐模型;
根据所述推荐模型分别提取所述训练样本中不同样本文章的一级类目、二级类目和关键词;
根据所述一级类目、所述二级类目和所述关键词进行损失计算,得到模型损失值,并根据所述模型损失值对所述推荐模型进行权值更新,直至所述推荐模型收敛;
将所述待推荐数据输入收敛后的所述推荐模型,并根据收敛后的所述推荐模型分别对不同所述待推荐文章进行标签提取,得到不同所述待推荐文章的文章标签。
可选的,兴趣度计算单元12还用于:若任一所述文章兴趣度小于兴趣度阈值,则删除所述文章兴趣度对应的待推荐文章。
文章推荐单元13,用于根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
以上可以看出,首先根据用户在预设时间内点击的文章的文章标签计算用户的标签分数,再根据标签分数构建用户的文章点击标签。由于标签分数用于表征用户对不同文章标签的偏好程度,且文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征,因此,根据标签分数构建的用户的文章点击标签能有效的提高文章点击标签构建的准确性,由于标签分数能表征用户对不同文章标签的偏好程度,因此,通过根据标签分数构建得到的用户的文章点击标签能有效的表征用户在预设时间内点击的文章的标签特征,通过根据用户针对不同文章标签的兴趣偏好和待推荐文章的文章标签,分别计算用户对不同待推荐文章的文章兴趣度,基于文章兴趣度以表征用户对对应待推荐文章的感兴趣程度,使得能有效的对用户感兴趣程度不相同的待推荐文章进行区分,并根据对用户感兴趣程度不相同的待推荐文章的区分结果,按照文章兴趣度从高到低进行排序,使得基于计算到的文章兴趣度对待推荐文章进行文章排序和文章推荐,能有效的将用户兴趣度程度高的待推荐文章排序在用户兴趣度程度低的待推荐文章的前面,使得将用户兴趣度程度高的待推荐文章先进行文章推荐,提高了文章推荐的准确性和用户对待推荐文章的点击概率。
图4是本申请另一实施例提供的一种终端设备2的结构框图。如图4所示,该实施例的终端设备2包括:处理器20、存储器21以及存储在所述存储器21中并可在所述处理器20上运行的计算机程序22,例如文章推荐方法的程序。处理器20执行所述计算机程序23时实现上述各个文章推荐方法各实施例中的步骤,例如图1所示的S10至S40,或者图2所示的S21至S22。或者,所述处理器20执行所述计算机程序22时实现上述图3对应的实施例中各单元的功能,例如,图3所示的单元10至13的功能,具体请参阅图4对应的实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序22可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器21中,并由所述处理器20执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序22在所述终端设备2中的执行过程。例如,所述计算机程序22可以被分割成标签分数计算单元10、点击标签构建单元11、兴趣度计算单元12和文章推荐单元13,各单元具体功能如上所述。
所述终端设备可包括,但不仅限于,处理器20、存储器21。本领域技术人员可以理解,图4仅仅是终端设备2的示例,并不构成对终端设备2的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器20可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器21可以是所述终端设备2的内部存储单元,例如终端设备2的硬盘或内存。所述存储器21也可以是所述终端设备2的外部存储设备,例如所述终端设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器21还可以既包括所述终端设备2的内部存储单元也包括外部存储设备。所述存储器21用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器21还可以用于暂时地存储已经输出或者将要输出的数据。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种文章推荐方法,其特征在于,包括:
确定用户在预设时间内点击的文章,并根据所述文章的文章标签计算所述用户的标签分数,所述标签分数用于表征所述用户对不同文章标签的偏好程度;
根据所述标签分数构建所述用户的文章点击标签,所述文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征;
获取不同待推荐文章的文章标签,并根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度;
根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
2.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述文章的文章标签计算所述用户的标签分数,包括:
获取不同所述文章在预设时间内的点击次数,并获取所述用户在所述预设时间内点击不同所述文章的总点击次数;
分别计算不同所述文章在预设时间内的点击次数与所述文章的总点击次数之间的商值,得到所述用户对不同文章标签的偏好程度。
3.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述标签分数构建所述用户的文章点击标签,包括:
分别获取不同所述文章的文章标签对应的标签向量,并根据所述偏好程度对对应所述标签向量进行加权计算;
将加权计算后的所述标签向量与对应所述文章标签进行关联存储,得到所述文章点击标签。
4.根据权利要求3所述的文章推荐方法,其特征在于,所述根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度,包括:
对加权计算后的所述标签向量进行向量合并,得到所述文章点击标签的标签向量;
分别获取不同所述待推荐文章的文章标签对应的标签向量,并根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算,得到所述文章兴趣度,所述兴趣度计算用于计算所述用户对待推荐文章的感兴趣程度。
5.根据权利要求4所述的文章推荐方法,其特征在于,所述根据不同所述待推荐文章的标签向量和所述文章点击标签的标签向量进行兴趣度计算所采用的计算公式为:
Simjaccard=A*B/(|A|2+|B|2-A*B)
A是所述文章点击标签的标签向量,B是所述待推荐文章的文章标签对应的标签向量,Simjaccard是所述文章兴趣度。
6.根据权利要求1所述的文章推荐方法,其特征在于,所述获取不同待推荐文章的文章标签,还包括:
获取训练样本,并将所述训练样本输入推荐模型;
根据所述推荐模型分别提取所述训练样本中不同样本文章的一级类目、二级类目和关键词;
根据所述一级类目、所述二级类目和所述关键词进行损失计算,得到模型损失值,并根据所述模型损失值对所述推荐模型进行权值更新,直至所述推荐模型收敛;
将所述待推荐数据输入收敛后的所述推荐模型,并根据收敛后的所述推荐模型分别对不同所述待推荐文章进行标签提取,得到不同所述待推荐文章的文章标签。
7.根据权利要求1所述的文章推荐方法,其特征在于,所述根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度之后,还包括:
若任一所述文章兴趣度小于兴趣度阈值,则删除所述文章兴趣度对应的待推荐文章。
8.一种文章推荐装置,其特征在于,包括:
标签分数计算单元,用于确定用户在预设时间内点击的文章,并根据所述文章的文章标签计算所述用户的标签分数,所述标签分数用于表征所述用户对不同文章标签的偏好程度;
点击标签构建单元,用于根据所述标签分数构建所述用户的文章点击标签,所述文章点击标签用于表征所述用户在预设时间内点击的文章的标签特征;
兴趣度计算单元,用于获取不同待推荐文章的文章标签,并根据所述文章标签和所述文章点击标签分别计算所述用户对不同所述待推荐文章的文章兴趣度;
文章推荐单元,用于根据所述文章兴趣度对所述待推荐文章进行排序,并根据排序后的所述待推荐文章对所述用户进行文章推荐。
9.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202011225618.XA 2020-11-05 2020-11-05 文章推荐方法、装置、终端设备及存储介质 Active CN112328881B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011225618.XA CN112328881B (zh) 2020-11-05 2020-11-05 文章推荐方法、装置、终端设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011225618.XA CN112328881B (zh) 2020-11-05 2020-11-05 文章推荐方法、装置、终端设备及存储介质

Publications (2)

Publication Number Publication Date
CN112328881A true CN112328881A (zh) 2021-02-05
CN112328881B CN112328881B (zh) 2024-04-02

Family

ID=74316106

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011225618.XA Active CN112328881B (zh) 2020-11-05 2020-11-05 文章推荐方法、装置、终端设备及存储介质

Country Status (1)

Country Link
CN (1) CN112328881B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592589A (zh) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器
CN113705792A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 基于深度学习模型的个性化推荐方法、装置、设备及介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置
US20160212494A1 (en) * 2013-09-06 2016-07-21 Beijing Qihoo Technology Company Limited Video recommendation method and device
CN106777139A (zh) * 2016-12-19 2017-05-31 浙江工业大学 基于阅读时间的用户阅读偏好统计的个性化推送方法
CN108510307A (zh) * 2018-02-25 2018-09-07 心触动(武汉)科技有限公司 一种课程推荐方法及系统
CN109190024A (zh) * 2018-08-20 2019-01-11 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110633408A (zh) * 2018-06-20 2019-12-31 北京正和岛信息科技有限公司 智能商业资讯的推荐方法和系统
CN110727784A (zh) * 2019-09-05 2020-01-24 上海异势信息科技有限公司 基于内容的文章推荐方法及系统

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160212494A1 (en) * 2013-09-06 2016-07-21 Beijing Qihoo Technology Company Limited Video recommendation method and device
CN105224699A (zh) * 2015-11-17 2016-01-06 Tcl集团股份有限公司 一种新闻推荐方法及装置
CN106777139A (zh) * 2016-12-19 2017-05-31 浙江工业大学 基于阅读时间的用户阅读偏好统计的个性化推送方法
CN108510307A (zh) * 2018-02-25 2018-09-07 心触动(武汉)科技有限公司 一种课程推荐方法及系统
CN110633408A (zh) * 2018-06-20 2019-12-31 北京正和岛信息科技有限公司 智能商业资讯的推荐方法和系统
CN109190024A (zh) * 2018-08-20 2019-01-11 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN110727784A (zh) * 2019-09-05 2020-01-24 上海异势信息科技有限公司 基于内容的文章推荐方法及系统

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592589A (zh) * 2021-07-27 2021-11-02 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器
CN113592589B (zh) * 2021-07-27 2024-03-29 上海致景信息科技有限公司 纺织原料推荐方法、装置及处理器
CN113705792A (zh) * 2021-08-31 2021-11-26 平安银行股份有限公司 基于深度学习模型的个性化推荐方法、装置、设备及介质
CN113705792B (zh) * 2021-08-31 2024-05-24 平安银行股份有限公司 基于深度学习模型的个性化推荐方法、装置、设备及介质

Also Published As

Publication number Publication date
CN112328881B (zh) 2024-04-02

Similar Documents

Publication Publication Date Title
CN110147551B (zh) 多类别实体识别模型训练、实体识别方法、服务器及终端
CN111898031B (zh) 一种获得用户画像的方法及装置
CN112529663B (zh) 商品推荐方法、装置、终端设备及存储介质
US9846841B1 (en) Predicting object identity using an ensemble of predictors
WO2015120798A1 (en) Method for processing network media information and related system
CN112434151A (zh) 一种专利推荐方法、装置、计算机设备及存储介质
US10489800B2 (en) Discovery of new business openings using web content analysis
CN108846097B (zh) 用户的兴趣标签表示方法、文章推荐方法、及装置、设备
CN110322254B (zh) 在线欺诈识别方法、装置、介质及电子设备
US11562262B2 (en) Model variable candidate generation device and method
CN109685537B (zh) 用户行为的分析方法、装置、介质和电子设备
WO2023000491A1 (zh) 一种应用推荐方法、装置、设备及计算机可读存储介质
CN112328881B (zh) 文章推荐方法、装置、终端设备及存储介质
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
CN111582932A (zh) 场景间信息推送方法、装置、计算机设备及存储介质
CN112818218A (zh) 信息推荐方法、装置、终端设备及计算机可读存储介质
CN115982463A (zh) 资源推荐方法、装置、设备及存储介质
CN113656699B (zh) 用户特征向量确定方法、相关设备及介质
CN115222443A (zh) 客户群体划分方法、装置、设备及存储介质
CN112989118A (zh) 视频召回方法及装置
CN111062449A (zh) 预测模型的训练方法、兴趣度预测方法、装置和存储介质
CN107943943B (zh) 用户相似度的确定方法、装置、电子设备及存储介质
CN113591881B (zh) 基于模型融合的意图识别方法、装置、电子设备及介质
CN112328779B (zh) 训练样本构建方法、装置、终端设备及存储介质
CN112328879B (zh) 新闻推荐方法、装置、终端设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant