CN113868408A - 文本数据推荐方法、装置、计算机设备和存储介质 - Google Patents

文本数据推荐方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN113868408A
CN113868408A CN202111009236.8A CN202111009236A CN113868408A CN 113868408 A CN113868408 A CN 113868408A CN 202111009236 A CN202111009236 A CN 202111009236A CN 113868408 A CN113868408 A CN 113868408A
Authority
CN
China
Prior art keywords
label
text data
text
user
dimension
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111009236.8A
Other languages
English (en)
Inventor
石奕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Original Assignee
Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuo Erzhi Lian Wuhan Research Institute Co Ltd filed Critical Zhuo Erzhi Lian Wuhan Research Institute Co Ltd
Priority to CN202111009236.8A priority Critical patent/CN113868408A/zh
Publication of CN113868408A publication Critical patent/CN113868408A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及一种文本数据推荐方法、装置、计算机设备和存储介质。本申请的方法在进行文本数据推荐时,先分别确定预设文本标签对应的用户维度重要度以及文本数据维度重要度,从而结合用户添加目标文本标签对应的时间维度特征来确定用户对文本数据的偏好度,即根据预设文本标签以及标签时间特征来进行用户偏好分析,从而人们更加快速找到携带自己喜欢标签的文本数据,可以有效提高文本数据的推荐准确率。

Description

文本数据推荐方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机领域,特别是涉及一种文本数据推荐方法、装置、计算机设备和存储介质。
背景技术
随着人工智能与机器学习等技术的发展,推荐算法充斥在互联网系统中的各个角落,通常是根据用户的需求,系统为其推荐相关的内容。
目前,在小说、书籍等文本推荐方法中,通常使用关键词推荐算法,即根据小说的关键词为其推荐其他关键词相同的小说。但基于关键词的推荐算法所推荐的内容有时并不符合人们的需求,人们更乐意找到与已看小说风格相同、类型较为接近的其他小说,也就是说目前文本数据推荐的准确率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够有效提高推荐准确率的文本数据推荐方法、装置、计算机设备和存储介质。
一种文本数据推荐方法,所述方法包括:
获取用户发送的文本推荐请求;
响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;
根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;
根据所述偏好度,推荐文本数据至所述用户。
在其中一个实施例中,获取预设文本标签对应的用户维度重要度包括:
获取标签用户数以及用户总数,所述标签用户数为使用过所述预设文本标签的用户人数;
根据所述标签用户数以及所述用户总数,获取所述预设文本标签对应的用户维度重要度。
在其中一个实施例中,所述根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度包括:
根据所述用户维度重要度以及所述时间维度特征,构建所述用户对应的第一标签特征向量;
根据所述文本数据维度重要度以及所述时间维度特征,构建所述文本数据对应的第二标签特征向量;
根据所述第一标签特征向量以及所述第二标签特征向量,确定所述用户对文本数据的偏好度。
在其中一个实施例中,所述根据所述用户维度重要度以及所述时间维度特征,构建所述用户对应的第一标签特征向量包括:
获取所述用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数;
根据所述各目标文本标签对应的使用次数以及所述标签总数量,确定各目标文本标签对应的使用频率;
根据所述时间维度特征,获取所述用户对各目标文本标签的第一标注时间;
根据各目标文本标签对应的所述用户维度重要度、所述使用频率以及所述第一标注时间,确定所述各目标文本标签在所述第一标注时间对所述用户的时间维度重要度;
根据所述各目标文本标签在所述标注时间对所述用户的时间维度重要度,构建所述用户对应的第一标签特征向量。
在其中一个实施例中,所述根据所述文本数据维度重要度以及所述时间维度特征,构建所述文本数据对应的第二标签特征向量包括:
获取文本数据对应的标签总数,以及所述文本数据被各目标文本标签标记的标记次数;
根据所述文本数据对应的标签总数以及所述标记次数,获取各目标文本标签的出现频率;
根据所述时间维度特征,获取所述各目标文本标签被标注于所述文本数据的标注时间;
根据所述出现频率、所述第二标注时间以及所述文本数据维度重要度构建所述文本数据对应的第二标签特征向量。
在其中一个实施例中,所述根据所述偏好度,推荐文本数据至所述用户之后,还包括:
获取新增文本数据;
通过余弦相似度公式确定所述新增文本数据与已推荐文本数据之间的相似度;
新增文本数据与已推荐文本数据之间的相似度,获取所述新增文本数据中的可推荐文本数据;
推荐所述新增文本数据中的可推荐文本数据至所述用户。
一种文本数据推荐装置,所述装置包括:
数据接收单元,用于获取用户发送的文本推荐请求;
数据处理单元,用于响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;根据所述偏好度,推荐文本数据至所述用户。
在其中一个实施例中,所述数据处理单元具体用于:获取标签用户数以及用户总数,所述标签用户数为使用过所述预设文本标签的用户人数;根据所述标签用户数以及所述用户总数,获取所述预设文本标签对应的用户维度重要度。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
获取用户发送的文本推荐请求;
响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;
根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;
根据所述偏好度,推荐文本数据至所述用户。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取用户发送的文本推荐请求;
响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;
根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;
根据所述偏好度,推荐文本数据至所述用户。
上述文本数据推荐方法、装置、计算机设备和存储介质,方法通过获取用户发送的文本推荐请求;响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;根据偏好度,推荐文本数据至用户。本申请在进行文本数据推荐时,先分别确定预设文本标签对应的用户维度重要度以及文本数据维度重要度,从而结合用户添加目标文本标签对应的时间维度特征来确定用户对文本数据的偏好度,即根据预设文本标签以及标签时间特征来进行用户偏好分析,从而人们更加快速找到携带自己喜欢标签的文本数据,可以有效提高文本数据的推荐准确率。
附图说明
图1为一个实施例中文本数据推荐方法的应用环境图;
图2为一个实施例中文本数据推荐方法的流程示意图;
图3为一个实施例中图2中步骤203的子流程示意图;
图4为一个实施例中图2中步骤207的子流程示意图;
图5为一个实施例中图4中步骤401的子流程示意图;
图6为一个实施例中图4中步骤403的子流程示意图;
图7为一个实施例中文本数据推荐装置的结构框图;
图8为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的文本数据推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。终端102可以通过网络向服务器104发送文本推荐请求。而后服务器104获取用户发送的文本推荐请求;响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;根据偏好度,推荐文本数据至用户。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种文本数据推荐方法,以该方法应用于图1中的服务器104端为例进行说明,包括以下步骤:
步骤201,获取用户发送的文本推荐请求。
步骤203,响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度。
其中,文本推荐请求是指当用户需要进行文本数据的推荐时,通过终端102发送至服务器104的请求,服务器104可以根据用户的操作记录,确定预设文本标签对应的用户维度重要度以及文本数据维度重要度,从而进行文本数据的推荐分析。在其中一个实施例中,本申请的文本数据推荐方法具体用于推荐小说类型的文本数据,此时服务器104与小说阅读应用相对应,服务器104对应于小说阅读应用的后台,而终端102则对应于小说阅读应用的前台。用户可以在终端102上小说阅读应用的界面点击推荐按钮,从而生成文本推荐请求。在另一个实施例中,在用户阅读小说将要阅读完成时,终端102可以自动生成文本推荐请求,并将其发送至服务器104。预设文本标签是指服务器104为文本数据设置的一些标签,标签的具体内容可以根据文本的类别而定,如对于小说类型的文本数据,其预设文本标签具体可以包括小说类型或小说风格等用户可以自由在小说阅读软件上对进行标注的数据。用户在通过小说阅读软件阅读小说过程中,或者阅读完成后,通过预设文本标签对小说进行标注。预设文本标签对应的用户维度重要度具体是指,各个不同的预设文本标签相对于所有的用户而言其对应的重要程度。具体可以根据使用过各预设文本标签的人数以及统计的总用户人数来进行用户维度重要度的计算。在其中一个实施例中,如果用
Figure BDA0003238035740000071
表示使用过预设文本标签bj的所有用户的数量,n表示用户总人数,则预设文本标签bj对所有用户的用户维度重要度为
Figure BDA0003238035740000072
同理,文本数据维度重要度用于表征各预设文本标签对所有文本数据的重要程度。具体可以根据使用过各预设文本标签的人数以及统计的总用户人数来进行用户维度重要度的计算。具体可以根据被各预设文本标签的文本数据数以及统计的总文本数据数来进行文本数据维度重要度的计算。在其中一个实施例中,m表示数据集中资源的总数,
Figure BDA0003238035740000073
表示资源i被标记为预设文本标签bj的数量,
Figure BDA0003238035740000074
表示预设文本标签bj的文本数据维度重要度。
具体地,本申请主要用于根据用户对应的文本推荐请求,实现针对用户的个性化文本数据推荐。因此,需要根据用户对应的文本推荐请求来开启推荐进程。而后根据文本推荐请求来查找用户的历史阅读记录,并确定各个预设文本标签对所有用户的重要程度;同时确定文本数据维度重要度,文本数据维度重要度则是用于预设文本标签对所有文本数据的重要程度。
步骤205,查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征。
步骤207,根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度。
步骤209,根据偏好度,推荐文本数据至用户。
其中,目标文本数据是所有的预设文本标签中,被用户使用过的文本标签。用户对文本数据的偏好度代表了用户是否对文本数据感兴趣的倾向度。时间维度特征具体包括了用户使用预设文本标签对文本数据标注的时间,以及文本数据被标注预设文本标签的时间。本申请通过偏好度分析,可以有效从众多的文本数据中识别出用户可能感兴趣的文本数据,从而进行有效的文本数据推荐。
具体地,在得到用户维度重要度以及文本数据维度重要度后,可以结合两者,确定用户对各个文本数据的偏好度。在其中一个实施例中,预设文本标签还包括被所有用户添加的时间维度特征,因此本方案可以从用户、时间和预设文本标签3个角度分析用户对文本数据的偏好倾向度。通过时间维度特征的加权的目标文本标签来进行用户对文本数据的偏好度计算,可以有效提高推荐的时效性,从而保证文本数据推荐的准确率。而在确定户对文本数据的偏好度后,即可从所有的文本数据中挑选出可推荐的文本数据来进行推荐。在其中一个实施例中,该过程具体是可以构建偏好度排名,而后将偏好度排名中偏前的前N个文本数据作为向用户推荐的文本数据。在另一个实施例中,则是通过预先设置偏好度阈值,而后将偏好度高于预设偏好度阈值的文本数据作为向用户推荐的文本数据。
上述文本数据推荐方法,方法通过获取用户发送的文本推荐请求;响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;根据偏好度,推荐文本数据至用户。本申请在进行文本数据推荐时,先分别确定预设文本标签对应的用户维度重要度以及文本数据维度重要度,从而结合用户添加目标文本标签对应的时间维度特征来确定用户对文本数据的偏好度,即根据预设文本标签以及标签时间特征来进行用户偏好分析,从而人们更加快速找到携带自己喜欢标签的文本数据,可以有效提高文本数据的推荐准确率。
在一个实施例中,如图3所示,步骤203包括:
步骤302,获取标签用户数以及用户总数,标签用户数为使用过预设文本标签的用户人数。
步骤304,根据标签用户数以及用户总数,获取预设文本标签对应的用户维度重要度。
具体地,在计算预设小文本数据标签对应的用户维度重要度时,可以基于使用过预设文本标签的用户人数来进行重要度的计算。在其中一个实施例中,如果用
Figure BDA0003238035740000091
表示使用过预设文本标签bj的所有用户的数量,n表示用户总人数,则预设文本标签bj对所有用户的用户维度重要度为
Figure BDA0003238035740000092
本实施例中,通过标签用户数以及用户总数,可以有效地计算出获取预设文本标签对应的用户维度重要度。
在一个实施例中,如图4所示,步骤207包括:
步骤401,根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量。
步骤403,根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量。
步骤405,根据第一标签特征向量以及第二标签特征向量,确定用户对文本数据的偏好度。
其中,第一标签特征向量具体包括是指利用用户最近或者经常使用的标签,再结合标签相对应的时间维度的特征来表示用户以及预设文本标签的用户维度重要度的兴趣特征。而第二标签特征向量则具体是由文本数据被标注的所有预设文本标签,结合相应的时间维度特征以及这些预设文本标签对应的文本数据维度重要度所组成。
具体地,在进行具体地偏好度计算时,可以先根根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量;根据文本数据维度重要度以及时间维度特征,构建文本数据对应的第二标签特征向量。从而确定用户的兴趣特征与文本数据被标注的所有预设文本标签的重叠程度。在其中一个实施例中,用
Figure BDA0003238035740000093
表示第一标签特征向量,用
Figure BDA0003238035740000094
表示第二标签特征向量,用户uj对文本数据ik的偏好程度的公式如下:
Figure BDA0003238035740000101
其中,uj∈U,j=1,2,...,n;ik∈I,k=1,2,...,m。
本实施中,通过分别构建用户与文本数据对应的特征标签向量,可以有效实现用户对文本数据的偏好度的计算,同时提高偏好度计算的准确率。
在其中一个实施例中,如图5所示,步骤401包括:
步骤502,获取用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数。
步骤504,根据各目标文本标签对应的使用次数以及标签总数量,确定各目标文本标签对应的使用频率;
步骤506,根据时间维度特征,获取用户对各目标文本标签的第一标注时间。
步骤508,根据各目标文本标签对应的用户维度重要度、使用频率以及第一标注时间,确定各目标文本标签在第一标注时间对用户的时间维度重要度。
步骤510,根据各目标文本标签在标注时间对用户的时间维度重要度,构建用户对应的第一标签特征向量。
具体地,在进行第一标签特征向量的构建时,需要先构建向量内的各个特征,即继续确定各个时刻下标签对应用户维度重要度,从而识别出包含时间维度的用户兴趣特征。因此可以先根据各目标文本标签对应的使用次数以及标签总数量,确定各目标文本标签对应的使用频率。根据各目标文本标签对应的用户维度重要度、使用频率以及第一标注时间,确定各目标文本标签在第一标注时间对用户的时间维度重要度;根据所有的目标文本标签在标注时间对用户的时间维度重要度,来构建用户对应的第一标签特征向量,从而有效地表示出用户的兴趣特征。如在一个具体的实施例中,
Figure BDA0003238035740000102
表示使用过目标文本标签bj的所有用户的数量,n表示数据集中用户的总数,
Figure BDA0003238035740000103
表示用户u使用目标文本标签bj的次数,nub表示用户u所使用的目标文本标签的总数量,则
Figure BDA0003238035740000111
表示u使用标签的频率,若用
Figure BDA0003238035740000112
表示在用户所有标注的目标文本标签中各个目标文本标签的重要度,用
Figure BDA0003238035740000113
表示在t时刻用户u对标签bj进行了标注,则
Figure BDA0003238035740000114
可以项表示在t时刻标签bj对该用户u的时间维度重要度。那么,可以通过各目标文本标签在标注时间对用户的时间维度重要度,即可以构建第一标签特征向量
Figure BDA0003238035740000115
Figure BDA0003238035740000116
在本实施例中,通过用户维度重要度、使用频率以及第一标注时间,可以有效确定各目标文本标签在第一标注时间对用户的时间维度重要度。从而有效确定构建用户对应的第一标签特征向量。
在其中一个实施例中,如图6所示,步骤403包括:
步骤601,获取文本数据对应的标签总数,以及文本数据被各目标文本标签标记的标记次数。
步骤603,根据文本数据对应的标签总数以及标记次数,获取各目标文本标签的出现频率。
步骤605,根据时间维度特征,获取各目标文本标签被标注于文本数据的标注时间。
步骤607,根据出现频率、第二标注时间以及文本数据维度重要度构建文本数据对应的第二标签特征向量。
具体地,进行第二标签特征向量的构建时,同样需要结合文本数据已被标注的各个目标文本标签来进行分析。因此,可以先获取文本数据对应的标签总数,以及文本数据被标记为各目标文本标签的次数。从而获取对文本数据标记过程中各目标文本标签对应的出现频率。从而进行第二特征标签特征向量的构建,确定在固定时刻对文本数据标注的目标文本标签来作为资源的标签特征向量。m表示数据集中待推荐资源的总数,
Figure BDA0003238035740000121
表示文本数据i被标记为目标文本标签bj的数量,
Figure BDA0003238035740000122
表示目标文本标签bj在所有标签中出现的频率,
Figure BDA0003238035740000123
表示标签bj的重要度,
Figure BDA0003238035740000124
表示目标文本标签bj对文本数据i的重要度。构建完成后,所得的第二标签特征向量具体可以为
Figure BDA0003238035740000125
的表达式具体为:
Figure BDA0003238035740000126
在本实施例中,通过文本数据维度重要度、出现频率以及第二标注时间,可以有效确定各目标文本标签在第二标注时间对文本数据的时间维度重要度。从而有效确定构建文本数据对应的第二标签特征向量。
在其中一个实施例中,步骤209之后还包括:获取新增文本数据;通过余弦相似度公式确定新增文本数据与已推荐文本数据之间的相似度;新增文本数据与已推荐文本数据之间的相似度,获取新增文本数据中的可推荐文本数据;推荐新增文本数据中的可推荐文本数据至用户。
余弦相似度,又称为余弦相似性,是通过计算两个向量的夹角余弦值来评估他们的相似度。
具体地,用户可以在阅读过程中,使用文本标签对感兴趣的文本数据进行标注。本实施例中,可以结合时间维度的特征,来对不同的文本数据一句相应的标签来进行分类,在不同时刻对于相同的资源可能会分成不一样的类。而在得到新的文本数据时,还可以计算其与已拥有的不同文本数据的相似度,即计算文本数据所属标签类型的相似度。因此,可以基于时间加权标签计算出的文本数据相似度值,一般以最近时间段的历史行为作为基础数据。而文本数据相似度的计算具体可以使用余弦相似度公式。本实施例中,在确定向用户进行推荐的文本数据后,可以进一步地计算取新增文本数据与已推荐文本数据之间的相似度,从而进行后续高效资源推荐,可以有效提高推荐质量的准确性与效率。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种文本数据推荐装置,包括:
数据接收单元702,用于获取用户发送的文本推荐请求。
数据处理单元704,用于响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;根据偏好度,推荐文本数据至用户。
在其中一个实施例中,数据处理单元704具体用于:根获取标签用户数以及用户总数,标签用户数为使用过预设文本标签的用户人数;根据标签用户数以及用户总数,获取预设文本标签对应的用户维度重要度。
在其中一个实施例中,数据处理单元704具体用于:根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量;根据文本数据维度重要度以及时间维度特征,构建文本数据对应的第二标签特征向量;根据第一标签特征向量以及第二标签特征向量,确定用户对文本数据的偏好度。
在其中一个实施例中,数据处理单元704具体用于:获取用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数;根据各目标文本标签对应的使用次数以及标签总数量,确定各目标文本标签对应的使用频率;根据时间维度特征,获取用户对各目标文本标签的第一标注时间;根据各目标文本标签对应的用户维度重要度、使用频率以及第一标注时间,确定各目标文本标签在第一标注时间对用户的时间维度重要度;根据各目标文本标签在标注时间对用户的时间维度重要度,构建用户对应的第一标签特征向量。
在其中一个实施例中,数据处理单元704具体用于:获取文本数据对应的标签总数,以及文本数据被各目标文本标签标记的标记次数;根据文本数据对应的标签总数以及标记次数,获取各目标文本标签的出现频率;根据时间维度特征,获取各目标文本标签被标注于文本数据的标注时间;根据出现频率、第二标注时间以及文本数据维度重要度构建文本数据对应的第二标签特征向量。
在其中一个实施例中,数据处理单元704具体用于:获取新增文本数据;通过余弦相似度公式确定新增文本数据与已推荐文本数据之间的相似度;新增文本数据与已推荐文本数据之间的相似度,获取新增文本数据中的可推荐文本数据;推荐新增文本数据中的可推荐文本数据至用户。
关于文本数据推荐装置的具体限定可以参见上文中对于文本数据推荐方法的限定,在此不再赘述。上述文本数据推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图8所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储文本数据推荐数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文本数据推荐方法。
本领域技术人员可以理解,图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取用户发送的文本推荐请求。
响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;
根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;
根据偏好度,推荐文本数据至用户。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根获取标签用户数以及用户总数,标签用户数为使用过预设文本标签的用户人数;根据标签用户数以及用户总数,获取预设文本标签对应的用户维度重要度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量;根据文本数据维度重要度以及时间维度特征,构建文本数据对应的第二标签特征向量;根据第一标签特征向量以及第二标签特征向量,确定用户对文本数据的偏好度。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数;根据各目标文本标签对应的使用次数以及标签总数量,确定各目标文本标签对应的使用频率;根据时间维度特征,获取用户对各目标文本标签的第一标注时间;根据各目标文本标签对应的用户维度重要度、使用频率以及第一标注时间,确定各目标文本标签在第一标注时间对用户的时间维度重要度;根据各目标文本标签在标注时间对用户的时间维度重要度,构建用户对应的第一标签特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取文本数据对应的标签总数,以及文本数据被各目标文本标签标记的标记次数;根据文本数据对应的标签总数以及标记次数,获取各目标文本标签的出现频率;根据时间维度特征,获取各目标文本标签被标注于文本数据的标注时间;根据出现频率、第二标注时间以及文本数据维度重要度构建文本数据对应的第二标签特征向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取新增文本数据;通过余弦相似度公式确定新增文本数据与已推荐文本数据之间的相似度;新增文本数据与已推荐文本数据之间的相似度,获取新增文本数据中的可推荐文本数据;推荐新增文本数据中的可推荐文本数据至用户。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取用户发送的文本推荐请求。
响应文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,用户维度重要度用于表征预设文本标签对所有用户的重要程度;文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询用户历史添加的预设文本标签,得到目标文本标签,并获取目标文本标签被所有用户添加的时间维度特征;
根据用户维度重要度、文本数据维度重要度以及时间维度特征,确定用户对文本数据的偏好度;
根据偏好度,推荐文本数据至用户。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根获取标签用户数以及用户总数,标签用户数为使用过预设文本标签的用户人数;根据标签用户数以及用户总数,获取预设文本标签对应的用户维度重要度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据用户维度重要度以及时间维度特征,构建用户对应的第一标签特征向量;根据文本数据维度重要度以及时间维度特征,构建文本数据对应的第二标签特征向量;根据第一标签特征向量以及第二标签特征向量,确定用户对文本数据的偏好度。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数;根据各目标文本标签对应的使用次数以及标签总数量,确定各目标文本标签对应的使用频率;根据时间维度特征,获取用户对各目标文本标签的第一标注时间;根据各目标文本标签对应的用户维度重要度、使用频率以及第一标注时间,确定各目标文本标签在第一标注时间对用户的时间维度重要度;根据各目标文本标签在标注时间对用户的时间维度重要度,构建用户对应的第一标签特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取文本数据对应的标签总数,以及文本数据被各目标文本标签标记的标记次数;根据文本数据对应的标签总数以及标记次数,获取各目标文本标签的出现频率;根据时间维度特征,获取各目标文本标签被标注于文本数据的标注时间;根据出现频率、第二标注时间以及文本数据维度重要度构建文本数据对应的第二标签特征向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取新增文本数据;通过余弦相似度公式确定新增文本数据与已推荐文本数据之间的相似度;新增文本数据与已推荐文本数据之间的相似度,获取新增文本数据中的可推荐文本数据;推荐新增文本数据中的可推荐文本数据至用户。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(RandomAccessMemory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(StaticRandomAccessMemory,SRAM)或动态随机存取存储器(DynamicRandomAccessMemory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种文本数据推荐方法,其特征在于,所述方法包括:
获取用户发送的文本推荐请求;
响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;
查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;
根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;
根据所述偏好度,推荐文本数据至所述用户。
2.根据权利要求1所述的方法,其特征在于,获取预设文本标签对应的用户维度重要度包括:
获取标签用户数以及用户总数,所述标签用户数为使用过所述预设文本标签的用户人数;
根据所述标签用户数以及所述用户总数,获取所述预设文本标签对应的用户维度重要度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度包括:
根据所述用户维度重要度以及所述时间维度特征,构建所述用户对应的第一标签特征向量;
根据所述文本数据维度重要度以及所述时间维度特征,构建所述文本数据对应的第二标签特征向量;
根据所述第一标签特征向量以及所述第二标签特征向量,确定所述用户对文本数据的偏好度。
4.根据权利要求3所述的方法,其特征在于,所述根据所述用户维度重要度以及所述时间维度特征,构建所述用户对应的第一标签特征向量包括:
获取所述用户使用目标文本标签的标签总数量,以及各目标文本标签对应的使用次数;
根据所述各目标文本标签对应的使用次数以及所述标签总数量,确定各目标文本标签对应的使用频率;
根据所述时间维度特征,获取所述用户对各目标文本标签的第一标注时间;
根据各目标文本标签对应的所述用户维度重要度、所述使用频率以及所述第一标注时间,确定所述各目标文本标签在所述第一标注时间对所述用户的时间维度重要度;
根据所述各目标文本标签在所述标注时间对所述用户的时间维度重要度,构建所述用户对应的第一标签特征向量。
5.根据权利要求3所述的方法,其特征在于,所述根据所述文本数据维度重要度以及所述时间维度特征,构建所述文本数据对应的第二标签特征向量包括:
获取文本数据对应的标签总数,以及所述文本数据被各目标文本标签标记的标记次数;
根据所述文本数据对应的标签总数以及所述标记次数,获取各目标文本标签的出现频率;
根据所述时间维度特征,获取所述各目标文本标签被标注于所述文本数据的标注时间;
根据所述出现频率、所述第二标注时间以及所述文本数据维度重要度构建所述文本数据对应的第二标签特征向量。
6.根据权利要求1所述的方法,其特征在于,所述根据所述偏好度,推荐文本数据至所述用户之后,还包括:
获取新增文本数据;
通过余弦相似度公式确定所述新增文本数据与已推荐文本数据之间的相似度;
新增文本数据与已推荐文本数据之间的相似度,获取所述新增文本数据中的可推荐文本数据;
推荐所述新增文本数据中的可推荐文本数据至所述用户。
7.一种文本数据推荐装置,其特征在于,所述装置包括:
数据接收单元,用于获取用户发送的文本推荐请求;
数据处理单元,用于响应所述文本推荐请求,获取预设文本标签对应的用户维度重要度以及文本数据维度重要度,所述用户维度重要度用于表征预设文本标签对所有用户的重要程度;所述文本数据维度重要度用于表征预设文本标签对所有文本数据的重要程度;查询所述用户历史添加的预设文本标签,得到目标文本标签,并获取所述目标文本标签被所有用户添加的时间维度特征;根据所述用户维度重要度、所述文本数据维度重要度以及所述时间维度特征,确定所述用户对文本数据的偏好度;根据所述偏好度,推荐文本数据至所述用户。
8.根据权利要求7所述的装置,其特征在于,所述数据处理单元具体用于:获取标签用户数以及用户总数,所述标签用户数为使用过所述预设文本标签的用户人数;根据所述标签用户数以及所述用户总数,获取所述预设文本标签对应的用户维度重要度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202111009236.8A 2021-08-31 2021-08-31 文本数据推荐方法、装置、计算机设备和存储介质 Pending CN113868408A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111009236.8A CN113868408A (zh) 2021-08-31 2021-08-31 文本数据推荐方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111009236.8A CN113868408A (zh) 2021-08-31 2021-08-31 文本数据推荐方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN113868408A true CN113868408A (zh) 2021-12-31

Family

ID=78988827

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111009236.8A Pending CN113868408A (zh) 2021-08-31 2021-08-31 文本数据推荐方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN113868408A (zh)

Similar Documents

Publication Publication Date Title
CN110941740B (zh) 视频推荐方法及计算机可读存储介质
CN109190044B (zh) 个性化推荐方法、装置、服务器和介质
CN110866181B (zh) 资源推荐的方法、装置及存储介质
CN108319723B (zh) 一种图片分享方法和装置、终端、存储介质
CN106326391B (zh) 多媒体资源推荐方法及装置
WO2018192496A1 (zh) 热度信息的生成方法和装置、存储介质以及电子装置
US20210056458A1 (en) Predicting a persona class based on overlap-agnostic machine learning models for distributing persona-based digital content
CN110223186B (zh) 用户相似度确定方法以及信息推荐方法
CN108664582B (zh) 企业关系的查询方法、装置、计算机设备及存储介质
CN109168047B (zh) 视频推荐方法、装置、服务器及存储介质
WO2015081915A1 (zh) 文件推荐方法和装置
CN110880006B (zh) 用户分类方法、装置、计算机设备和存储介质
CN112883257B (zh) 行为序列数据处理方法、装置、电子设备及存储介质
CN111209490A (zh) 基于用户信息的交友推荐方法、电子装置及存储介质
CN111858969B (zh) 多媒体数据推荐方法、装置、计算机设备和存储介质
CN113873330B (zh) 视频推荐方法、装置、计算机设备和存储介质
CN110765286A (zh) 跨媒体检索方法、装置、计算机设备和存储介质
CN113032668A (zh) 基于用户画像的产品推荐方法、装置、设备及存储介质
CN110162689B (zh) 信息推送方法、装置、计算机设备和存储介质
CN108563648B (zh) 数据显示方法和装置、存储介质及电子装置
CN115935049A (zh) 基于人工智能的推荐处理方法、装置及电子设备
CN113821574A (zh) 用户行为分类方法和装置及存储介质
CN112115354A (zh) 信息处理方法、装置、服务器及存储介质
US9530024B2 (en) Recommendation system for protecting user privacy
CN113902526B (zh) 基于人工智能的产品推荐方法、装置和计算机设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination