CN113268672A - 一种资源评分方法及系统 - Google Patents

一种资源评分方法及系统 Download PDF

Info

Publication number
CN113268672A
CN113268672A CN202110822319.2A CN202110822319A CN113268672A CN 113268672 A CN113268672 A CN 113268672A CN 202110822319 A CN202110822319 A CN 202110822319A CN 113268672 A CN113268672 A CN 113268672A
Authority
CN
China
Prior art keywords
calculation
resource
parameter
calculation parameter
term
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110822319.2A
Other languages
English (en)
Other versions
CN113268672B (zh
Inventor
廖忠儒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sohu New Media Information Technology Co Ltd
Original Assignee
Beijing Sohu New Media Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sohu New Media Information Technology Co Ltd filed Critical Beijing Sohu New Media Information Technology Co Ltd
Priority to CN202110822319.2A priority Critical patent/CN113268672B/zh
Publication of CN113268672A publication Critical patent/CN113268672A/zh
Application granted granted Critical
Publication of CN113268672B publication Critical patent/CN113268672B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提供了一种资源评分方法及系统,该方法为:获取待推荐用户的用户特征和待处理资源;获取预先缓存的待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数;根据用户特征和待处理资源的资源特征,确定M个匹配特征并组合得到目标组合模式;获取预先缓存的与目标组合模式对应的第四计算参数、第五计算参数和第六计算参数;基于用户特征确定第七计算参数、第八计算参数和第九计算参数;基于第一计算参数至第九计算参数,结合FM公式,并行计算每个待处理资源的评分。不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,节约计算资源和时间,提高资源推荐的效率。

Description

一种资源评分方法及系统
技术领域
本发明涉及资源推荐技术领域,具体涉及一种资源评分方法及系统。
背景技术
随着互联网技术的发展,资源(例如视频、文章和物品等)推荐的应用越来越广泛。在资源推荐过程中通常涉及资源召回、资源排序和资源重排序三个环节,其中的资源排序环节就是对所召回的资源进行打分并选择top n的高分资源,资源排序环节是影响资源推荐效果的重要因素。
目前对资源进行打分的方式为:因子分解机(Factorization Machine,FM)模型使用FM公式逐一对每条所召回的资源进行打分。但是随着数据量的暴增,每次进行资源推荐时,都需要使用FM公式对每条所召回的资源进行打分,此种方式会耗费大量的计算资源和时间,进而会导致资源推荐的效率较低。
发明内容
有鉴于此,本发明实施例提供一种资源评分方法及系统,以解决现有对资源进行评分的方式存在的耗费大量的计算资源和时间等问题。
为实现上述目的,本发明实施例提供如下技术方案:
本发明实施例第一方面公开一种资源评分方法,所述方法包括:
获取待推荐用户的用户特征和待处理资源;
从预设的全量资源特征文件中,获取所述待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数,所述全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数;
根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,M为正整数;
获取预先计算并缓存的与所述目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,所述第四计算参数、所述第五计算参数和所述第六计算参数由预先基于所述M个匹配特征计算得到;
基于所述用户特征确定第七计算参数、第八计算参数和第九计算参数;
基于所述第一计算参数、所述第二计算参数、所述第三计算参数、所述第四计算参数、所述第五计算参数、所述第六计算参数、所述第七计算参数、所述第八计算参数和所述第九计算参数,结合分解因子机FM公式,并行计算每个所述待处理资源的评分。
优选的,所述根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,包括:
确定所述用户特征与所述待处理资源的资源特征的匹配值;
对所述匹配值进行哈希hash计算,生成M个匹配特征;
将所述M个匹配特征拼接成字符串,得到对应的目标组合模式。
优选的,计算每个所述待处理资源的评分的过程,包括:
基于所述第一计算参数、所述第四计算参数和所述第七计算参数,确定所述FM公式的第一计算项的数值,所述FM公式由偏置项、第一计算项、第二计算项和第三计算项构成;
基于所述第二计算参数、所述第五计算参数和所述第八计算参数,确定所述FM公式的第二计算项的数值;
基于所述第三计算参数,所述第六计算参数和所述第九计算参数,确定所述FM公式的第三计算项的数值;
利用所述FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算所述待处理资源的评分。
优选的,所述第一计算参数为
Figure 56840DEST_PATH_IMAGE001
,所述第二计算参数为
Figure 70932DEST_PATH_IMAGE002
,所述第三计算参数为
Figure 622130DEST_PATH_IMAGE003
其中,k2为资源特征的数量,itemi为第i个资源特征,ωitemi为第i个资源特征的权重,xitemi为用于指示第i个资源特征是否存在的参数,vitemi,f为第i个资源特征的隐向量里第f维的权重。
优选的,所述第四计算参数为
Figure 735580DEST_PATH_IMAGE004
,所述第五计算参数为
Figure 660811DEST_PATH_IMAGE005
,所述第六计算参数为
Figure 88381DEST_PATH_IMAGE006
其中,k3为匹配特征的数量,matchi为第i个匹配特征,ωmatchi为第i个匹配特征的权重,xmatchi为用于指示第i个匹配特征是否存在的参数,vmatchi,f为第i个匹配特征的隐向量里第f维的权重。
优选的,所述第七计算参数为
Figure 149878DEST_PATH_IMAGE007
,所述第八计算参数为
Figure 27704DEST_PATH_IMAGE008
,所述第九计算参数为
Figure 909072DEST_PATH_IMAGE009
其中,k1为用户特征的数量,useri为第i个用户特征,ωuseri为第i个用户特征的权重,xuseri为用于指示第i个用户特征是否存在的参数,vuseri,f为第i个用户特征的隐向量里第f维的权重。
本发明实施例第二方面公开一种资源评分系统,所述系统包括:
第一获取单元,用于获取待推荐用户的用户特征和待处理资源;
第二获取单元,用于从预设的全量资源特征文件中,获取所述待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数,所述全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数;
处理单元,用于根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,M为正整数;
第三获取单元,用于获取预先计算并缓存的与所述目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,所述第四计算参数、所述第五计算参数和所述第六计算参数由预先基于所述M个匹配特征计算得到;
确定单元,用于基于所述用户特征确定第七计算参数、第八计算参数和第九计算参数;
计算单元,用于基于所述第一计算参数、所述第二计算参数、所述第三计算参数、所述第四计算参数、所述第五计算参数、所述第六计算参数、所述第七计算参数、所述第八计算参数和所述第九计算参数,结合分解因子机FM公式,并行计算每个所述待处理资源的评分。
优选的,所述处理单元具体用于:确定所述用户特征与所述待处理资源的资源特征的匹配值;对所述匹配值进行哈希hash计算,生成M个匹配特征;将所述M个匹配特征拼接成字符串,得到对应的目标组合模式。
优选的,用于计算每个所述待处理资源的评分的所述计算单元,具体用于:基于所述第一计算参数、所述第四计算参数和所述第七计算参数,确定所述FM公式的第一计算项的数值,所述FM公式由偏置项、第一计算项、第二计算项和第三计算项构成;基于所述第二计算参数、所述第五计算参数和所述第八计算参数,确定所述FM公式的第二计算项的数值;基于所述第三计算参数,所述第六计算参数和所述第九计算参数,确定所述FM公式的第三计算项的数值;利用所述FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算所述待处理资源的评分。
优选的,所述第一计算参数为
Figure 937071DEST_PATH_IMAGE010
,所述第二计算参数为
Figure 118654DEST_PATH_IMAGE011
,所述第三计算参数为
Figure 384025DEST_PATH_IMAGE012
其中,k2为资源特征的数量,itemi为第i个资源特征,ωitemi为第i个资源特征的权重,xitemi为用于指示第i个资源特征是否存在的参数,vitemi,f为第i个资源特征的隐向量里第f维的权重。
基于上述本发明实施例提供的一种资源评分方法及系统,该方法为:获取待推荐用户的用户特征和待处理资源;从预设的全量资源特征文件中,获取待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数;根据用户特征和待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式;获取预先计算并缓存的与目标组合模式对应的第四计算参数、第五计算参数和第六计算参数;基于用户特征确定第七计算参数、第八计算参数和第九计算参数;基于第一计算参数至第九计算参数,结合FM公式,并行计算每个待处理资源的评分。通过预先计算并缓存各个资源的资源特征及对应的计算参数,以及预先缓存由不同匹配特征组合得到的各个组合模式对应的计算参数,在对资源进行评分时,利用由用户特征计算得到的计算参数、所缓存的计算参数和FM公式进行计算,不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,节约计算资源和时间,提高资源推荐的效率。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种资源评分方法的流程图;
图2为本发明实施例提供的计算每个待处理资源的评分的流程图;
图3为本发明实施例提供的一种资源评分系统的结构框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本申请中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
由背景技术可知,在进行资源推荐时,需要对各个资源进行打分,目前对资源进行打分的方式为:因子分解机(Factorization Machine,FM)模型使用FM公式逐一对每条所召回的资源进行打分。此种方式会耗费大量的计算资源和时间,进而会导致资源推荐的效率较低。
因此,本发明实施例提供一种资源评分方法及系统,通过预先计算并缓存各个资源的资源特征及对应的计算参数,以及预先缓存由不同匹配特征组合得到的各个组合模式对应的计算参数,在对资源进行评分时,利用由用户特征计算得到的计算参数、所缓存的计算参数和FM公式进行计算,不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,以节约计算资源和时间,进而提高资源推荐的效率。
为更好理解本发明实施例所提供的一种资源评分方法及系统的具体放方案,以下内容先对现有的资源评分方式进行简单介绍。
现有技术中的资源评分方式为:获取用户特征信息和资源特征信息,将用户特征信息转化为用户特征,及将资源特征信息转化为资源特征;根据用户特征和资源特征生成匹配特征(也称为match特征);将用户特征、资源特征和匹配特征发送至排序模型服务,排序模型服务中的FM模型通过FM公式进行计算得到资源的评分,FM公式的具体内容如公式(1)。
Figure 877324DEST_PATH_IMAGE013
(1)
在公式(1)中,w0为FM公式的偏置项,n为特征数量,wi为第i个特征的权重,xi为用于指示第i个特征是否存在的参数(xi为1表示第i个特征存在),vi为第i个特征的隐向量,vi,f为第i个特征的隐向量里第f维的权重,k为隐向量长度。
可以理解的是,在公式(1)中,
Figure 443434DEST_PATH_IMAGE014
为下述本发明实施例中所提及的FM公式 的第一计算项,
Figure 745103DEST_PATH_IMAGE015
为下述本发明实施例中所提及的FM公式的第二计算项,
Figure 308939DEST_PATH_IMAGE016
为下述本发明实施例中所提及的FM公式的第三计算项。
针对上述内容所提及的现有技术中的资源评分方式,发明人经研究发现,现有技术在每次计算资源的评分时,都需要重复提取各资源的资源特征,此种方式会浪费计算资源。同时,发明人经反复研究和验证发现,利用FM公式计算资源的评分时,会涉及到某些中间结果(即下述本发明实施例中所涉及的计算参数)的重复计算,因此发明人根据研究结果将FM公式进行细化并预先缓存某些中间结果,在计算资源时利用所缓存的中间结果进行计算,能大幅度节约计算资源和时间,进而提高资源推荐的效率。关于本发明实施例所提供的一种资源评分方法及系统的具体内容,详见以下说明。
需要说明的是,本发明实施例提供的一种资源评分方法及系统,应用于排序模型服务中。
参见图1,示出了本发明实施例提供的一种资源评分方法的流程图,该资源评分方法包括以下步骤:
步骤S101:获取待推荐用户的用户特征和待处理资源。
在具体实现步骤S101的过程中,从推荐服务中获取待推荐用户的用户特征(可以是多个用户特征)和待处理资源(可以是多个待处理资源)。具体而言,推荐服务先获取待处理资源(也就是用于推荐的召回资源)和待推荐用户的用户特征信息,由推荐服务将该用户特征信息转换为用户特征(例如对用户特征信息进行hash处理得到相应的用户特征)。此时,可从推荐服务中获取该待推荐用户的用户特征和待处理资源。
步骤S102:从预设的全量资源特征文件中,获取待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数。
需要说明的是,全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数,每个资源都计算得到与其对应的第一计算参数、第二计算参数和第三计算参数。
具体而言,预先按预设方式所提取的增量资源(如以离线方式提取小时级的增量资源)和存量资源,将所提取的增量资源和存量资源构建全量资源特征文件,并将该全量资源特征文件中的过期资源移除,此时利用公式(2)计算全量资源特征文件中每个资源对应的第一计算参数并将其存储在全量资源特征文件,利用公式(3)计算全量资源特征文件中每个资源对应的第二计算参数并将其存储在全量资源特征文件,利用公式(4)计算全量资源特征文件中每个资源对应的第三计算参数并将其存储在全量资源特征文件。
Figure 696058DEST_PATH_IMAGE017
(2)
Figure 144488DEST_PATH_IMAGE018
(3)
Figure 35084DEST_PATH_IMAGE019
(4)
在公式(2)至公式(4)中,k2为资源特征的数量,itemi为第i个资源特征,ωitemi为第i个资源特征的权重,xitemi为用于指示第i个资源特征是否存在的参数(例如xitemi为表示第i个资源特征存在),vitemi,f为第i个资源特征的隐向量里第f维的权重。
也就是说,对于全量资源特征文件中的各个资源,预先计算各个资源的资源特征并进行缓存,以及预先计算各个资源的第一计算参数、第二计算参数和第三计算参数并进行缓存。
在具体实现步骤S102的过程中,对于每个待处理资源,从全量资源特征文件中获取与该待处理资源对应的资源特征、第一计算参数、第二计算参数和第三计算参数,不需要重新计算待处理资源的资源特征、第一计算参数、第二计算参数和第三计算参数,以节约计算资源和时间。
步骤S103:根据用户特征和待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式。
需要说明的是,M为正整数。
在具体实现步骤S103的过程中,针对每个待处理资源,根据用户特征与该待处理资源的资源特征,确定M个匹配特征,并将该M个匹配特征拼接成字符串得到相应的目标组合模式。也就是说,对于每个待处理资源,都基于用户特征和资源特征确定对应的目标组合模式,每个待处理资源对应一目标组合模式。
在具体实现中,针对每个待处理资源,确定用户特征与该待处理资源的资源特征的匹配值,对该匹配值进行哈希hash计算,生成M个匹配特征。
针对每个待处理资源,生成用户特征与该待处理资源的资源特征的M个匹配特征后,将该M个匹配特征拼接成字符串,得到对应的目标组合模式。
步骤S104:获取预先计算并缓存的与目标组合模式对应的第四计算参数、第五计算参数和第六计算参数。
需要说明的是,第四计算参数、第五计算参数和第六计算参数由预先基于M个匹配特征计算得到。
可以理解的是,发明人经反复研究和验证发现,由于用户特征与资源特征的匹配特征的模式是有限且固定的,因此多个匹配特征的组合模式也是有限且固定的。故,利用公式(5)预先计算多种组合模式(每种组合模式由一个或以上个匹配特征组成)的第四计算参数并进行缓存,利用公式(6)预先计算多种组合模式的第五计算参数并进行缓存,利用公式(7)预先计算多种组合模式的第六计算参数并进行缓存,也就是每种组合模式都预先计算对应的第四计算参数、第五计算参数和第六计算参数并缓存。
Figure 832138DEST_PATH_IMAGE020
(5)
Figure 768870DEST_PATH_IMAGE021
(6)
Figure 676784DEST_PATH_IMAGE022
(7)
在公式(5)至公式(7)中,其中,k3为匹配特征的数量,matchi为第i个匹配特征,ωmatchi为第i个匹配特征的权重,xmatchi为用于指示第i个匹配特征是否存在的参数(例如xmatchi为表示第i个匹配特征存在),vmatchi,f为第i个匹配特征的隐向量里第f维的权重。
如上述内容可知,基于每个待处理资源的资源特征与用户特征可生成对应的目标组合模式,即一待处理资源对应一目标组合模式,在具体实现步骤S104的过程中,针对每个待处理资源,将与该待处理资源对应的目标组合模式作为key,从预先确定的多个组合模式中查询与该目标组合模式所匹配的组合模式,获取与该目标组合模式所匹配的组合模式对应的预先缓存的第四计算参数、第五计算参数和第六计算参数。以前述方式,从预先缓存的内容中直接获取各个目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,不需要重新计算目标组合模式的第四计算参数、第五计算参数和第六计算参数,以节约计算资源和时间。
可以理解的是,在获取各个目标组合模式对应的第四计算参数、第五计算参数和第六计算参数的过程中,可能存在某个目标组合模式不存在预先缓存的第四计算参数、第五计算参数和第六计算参数,此时可利用上述公式(5)至公式(7)计算该某个目标组合模式的第四计算参数、第五计算参数和第六计算参数并将其缓存,以待后续使用。
步骤S105:基于用户特征确定第七计算参数、第八计算参数和第九计算参数。
在具体实现步骤S105的过程中,基于用户特征,通过公式(8)计算第七计算参数,通过公式(9)计算第八计算参数,通过公式(10)计算第九计算参数。
Figure 687465DEST_PATH_IMAGE023
(8)
Figure 655421DEST_PATH_IMAGE024
(9)
Figure 830181DEST_PATH_IMAGE025
(10)
在公式(8)至公式(10)中,k1为用户特征的数量,useri为第i个用户特征,ωuseri为第i个用户特征的权重,xuseri为用于指示第i个用户特征是否存在的参数(例如xuseri为表示第i个用户特征存在),vuseri,f为第i个用户特征的隐向量里第f维的权重。
步骤S106:基于第一计算参数、第二计算参数、第三计算参数、第四计算参数、第五计算参数、第六计算参数、第七计算参数、第八计算参数和第九计算参数,结合FM公式,并行计算每个待处理资源的评分。
由上述内容可知,每个待处理资源都存在与之对应的第一计算参数、第二计算参数、第三计算参数、第四计算参数、第五计算参数和第六计算参数,可利用FM公式计算每个待处理资源对应的评分。结合上述公式(1)中关于FM公式的第一计算项、第二计算项和第三计算项的内容,在具体实现步骤S106的过程中,针对每个待处理资源,利用与之对应的第一计算参数、第二计算参数、第三计算参数、第四计算参数、第五计算参数和第六计算参数,结合与用户特征对应的第七计算参数、第八计算参数和第九计算参数,以FM公式计算该待处理资源的评分。
可以理解的是,以并行方式(例如OpenMP方式)并行计算各个待处理资源的评分。
具体而言,针对每个待处理资源,利用与之对应的第一计算参数、第二计算参数、第三计算参数、第四计算参数、第五计算参数和第六计算参数,结合与用户特征对应的第七计算参数、第八计算参数和第九计算参数,分别计算FM公式的第一计算项的数值、第二计算项的数值和第三计算项的数值,并据此和FM公式计算得到该待处理资源的评分。
优选的,在计算得到各个待处理资源的评分后,将各个待处理资源的评分反馈给推荐服务以进行后续的资源推荐过程。
在本发明实施例中,通过预先计算并缓存各个资源的资源特征及对应的计算参数,以及预先缓存由不同匹配特征组合得到的各个组合模式对应的计算参数,在对资源进行评分时,利用由用户特征计算得到的计算参数、所缓存的计算参数和FM公式进行计算,不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,能节约计算资源和时间,进而提高资源推荐的效率。
上述本发明实施例图1步骤S106中涉及的计算待处理资源的评分的过程,参见图2,示出了本发明实施例提供的计算每个待处理资源的评分的流程图,可以理解的是,图2中以计算一个待处理资源的评分为例进行解释说明如何计算待处理资源的评分,图2包括以下步骤:
步骤S201:基于第一计算参数、第四计算参数和第七计算参数,确定FM公式的第一计算项的数值。
需要说明的是,FM公式由偏置项、第一计算项、第二计算项和第三计算项构成,关于FM公式的偏置项、第一计算项、第二计算项和第三计算项的具体内容,可参见上述内容,在此不再赘述。
在具体实现步骤S201的过程中,基于第一计算参数(也就是公式(2)计算得到的结果)、第四计算参数(也就是公式(5)计算得到的结果)和第七计算参数(也就是公式(8)计算得到的结果),通过公式(11)确定FM公式的第一计算项的数值。
Figure 541785DEST_PATH_IMAGE026
(11)
步骤S202:基于第二计算参数、第五计算参数和第八计算参数,确定FM公式的第二计算项的数值。
在具体实现步骤S201的过程中,基于第二计算参数(也就是公式(3)计算得到的结果)、第五计算参数(也就是公式(6)计算得到的结果)和第八计算参数(也就是公式(9)计算得到的结果),通过公式(12)确定FM公式的第二计算项的数值。
Figure 734869DEST_PATH_IMAGE027
(12)
步骤S203:基于第三计算参数,第六计算参数和第九计算参数,确定FM公式的第三计算项的数值。
在具体实现步骤S203的过程中,基于第三计算参数(也就是公式(4)计算得到的结果),第六计算参数(也就是公式(7)计算得到的结果)和第九计算参数(也就是公式(10)计算得到的结果),通过公式(13)确定FM公式的第三计算项的数值。
Figure 873727DEST_PATH_IMAGE028
(13)
步骤S204:利用FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算待处理资源的评分。
在具体实现步骤S204的过程中,针对每个待处理资源,在利用上述公式(11)至公式(13)分别计算得到定FM公式的第一计算项、第二计算项和第三计算项的数值以后,结合上述公式(1)可计算得到该待处理资源的评分。
在本发明实施例中,将FM公式进行细化,在对资源进行评分时,利用所缓存的计算参数结合基于用户特征计算得到的计算参数,分别确定FM公式的细化部分的数值,并据此利用FM公式计算得到资源的评分,能大幅度节约计算资源和时间,进而提高资源推荐的效率。
与上述本发明实施例提供的一种资源评分方法相对应,参见图3,本发明实施例还提供了一种资源评分系统的结构框图,该资源评分系统包括:第一获取单元301、第二获取单元302、处理单元303、第三获取单元304、确定单元305和计算单元306;
第一获取单元301,用于获取待推荐用户的用户特征和待处理资源。
第二获取单元302,用于从预设的全量资源特征文件中,获取待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数,全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数。
在具体实现中,第一计算参数、第二计算参数和第三计算参数的具体内容,参见上述公式(2)至公式(4)。
处理单元303,用于根据用户特征和待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,M为正整数。
在具体实现中,处理单元303具体用于:确定用户特征与待处理资源的资源特征的匹配值;对匹配值进行hash计算,生成M个匹配特征;将M个匹配特征拼接成字符串,得到对应的目标组合模式。
第三获取单元304,用于获取预先计算并缓存的与目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,第四计算参数、第五计算参数和第六计算参数由预先基于M个匹配特征计算得到。
在具体实现中,第四计算参数、第五计算参数和第六计算参数的具体内容,参见上述公式(5)至公式(7)。
确定单元305,用于基于用户特征确定第七计算参数、第八计算参数和第九计算参数。
在具体实现中,第七计算参数、第八计算参数和第九计算参数的具体内容,参见上述公式(8)至公式(10)。
计算单元306,用于基于第一计算参数、第二计算参数、第三计算参数、第四计算参数、第五计算参数、第六计算参数、第七计算参数、第八计算参数和第九计算参数,结合FM公式,并行计算每个待处理资源的评分。
在具体实现中,计算单元306具体用于:基于第一计算参数、第四计算参数和第七计算参数,确定FM公式的第一计算项的数值,FM公式由偏置项、第一计算项、第二计算项和第三计算项构成;基于第二计算参数、第五计算参数和第八计算参数,确定FM公式的第二计算项的数值;基于第三计算参数,第六计算参数和第九计算参数,确定FM公式的第三计算项的数值;利用FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算待处理资源的评分。
在本发明实施例中,通过预先计算并缓存各个资源的资源特征及对应的计算参数,以及预先缓存由不同匹配特征组合得到的各个组合模式对应的计算参数,在对资源进行评分时,利用由用户特征计算得到的计算参数、所缓存的计算参数和FM公式进行计算,不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,能节约计算资源和时间,进而提高资源推荐的效率。
综上所述,本发明实施例提供一种资源评分方法及系统,将FM公式进行细化,预先计算并缓存各个资源的资源特征及对应的计算参数,以及预先缓存由不同匹配特征组合得到的各个组合模式对应的计算参数。在并行对资源进行评分时,利用预先缓存的计算参数和基于用户特征计算得到的计算参数,分别确定FM公式各细化部分的数值,并据此利用FM公式计算资源的评分,不需要每次都重新计算各个计算参数,同时以并行计算的方式并行计算各个资源的评分,节约计算资源和时间,进而提高资源推荐的效率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (10)

1.一种资源评分方法,其特征在于,所述方法包括:
获取待推荐用户的用户特征和待处理资源;
从预设的全量资源特征文件中,获取所述待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数,所述全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数;
根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,M为正整数;
获取预先计算并缓存的与所述目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,所述第四计算参数、所述第五计算参数和所述第六计算参数由预先基于所述M个匹配特征计算得到;
基于所述用户特征确定第七计算参数、第八计算参数和第九计算参数;
基于所述第一计算参数、所述第二计算参数、所述第三计算参数、所述第四计算参数、所述第五计算参数、所述第六计算参数、所述第七计算参数、所述第八计算参数和所述第九计算参数,结合分解因子机FM公式,并行计算每个所述待处理资源的评分。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,包括:
确定所述用户特征与所述待处理资源的资源特征的匹配值;
对所述匹配值进行哈希hash计算,生成M个匹配特征;
将所述M个匹配特征拼接成字符串,得到对应的目标组合模式。
3.根据权利要求1所述的方法,其特征在于,计算每个所述待处理资源的评分的过程,包括:
基于所述第一计算参数、所述第四计算参数和所述第七计算参数,确定所述FM公式的第一计算项的数值,所述FM公式由偏置项、第一计算项、第二计算项和第三计算项构成;
基于所述第二计算参数、所述第五计算参数和所述第八计算参数,确定所述FM公式的第二计算项的数值;
基于所述第三计算参数,所述第六计算参数和所述第九计算参数,确定所述FM公式的第三计算项的数值;
利用所述FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算所述待处理资源的评分。
4.根据权利要求1所述的方法,其特征在于,所述第一计算参数为
Figure 223437DEST_PATH_IMAGE001
, 所述第二计算参数为
Figure 215795DEST_PATH_IMAGE002
,所述第三计算参数为
Figure 756497DEST_PATH_IMAGE003
其中,k2为资源特征的数量,itemi为第i个资源特征,ωitemi为第i个资源特征的权重,xitemi为用于指示第i个资源特征是否存在的参数,vitemi,f为第i个资源特征的隐向量里第f维的权重。
5.根据权利要求1所述的方法,其特征在于,所述第四计算参数为
Figure 931127DEST_PATH_IMAGE004
,所述第五计算参数为
Figure 266293DEST_PATH_IMAGE005
,所述第六计算参数 为
Figure 323111DEST_PATH_IMAGE006
其中,k3为匹配特征的数量,matchi为第i个匹配特征,ωmatchi为第i个匹配特征的权重,xmatchi为用于指示第i个匹配特征是否存在的参数,vmatchi,f为第i个匹配特征的隐向量里第f维的权重。
6.根据权利要求1所述的方法,其特征在于,所述第七计算参数为
Figure 401925DEST_PATH_IMAGE008
,所述第八计算参数为
Figure 916214DEST_PATH_IMAGE009
,所述第九计算参数为
Figure 422282DEST_PATH_IMAGE010
其中,k1为用户特征的数量,useri为第i个用户特征,ωuseri为第i个用户特征的权重,xuseri为用于指示第i个用户特征是否存在的参数,vuseri,f为第i个用户特征的隐向量里第f维的权重。
7.一种资源评分系统,其特征在于,所述系统包括:
第一获取单元,用于获取待推荐用户的用户特征和待处理资源;
第二获取单元,用于从预设的全量资源特征文件中,获取所述待处理资源的资源特征及其对应的第一计算参数、第二计算参数和第三计算参数,所述全量资源特征文件中包含:预先确定的各个资源的资源特征及基于资源特征预先计算得到的第一计算参数、第二计算参数和第三计算参数;
处理单元,用于根据所述用户特征和所述待处理资源的资源特征,确定M个匹配特征并将其进行组合得到目标组合模式,M为正整数;
第三获取单元,用于获取预先计算并缓存的与所述目标组合模式对应的第四计算参数、第五计算参数和第六计算参数,所述第四计算参数、所述第五计算参数和所述第六计算参数由预先基于所述M个匹配特征计算得到;
确定单元,用于基于所述用户特征确定第七计算参数、第八计算参数和第九计算参数;
计算单元,用于基于所述第一计算参数、所述第二计算参数、所述第三计算参数、所述第四计算参数、所述第五计算参数、所述第六计算参数、所述第七计算参数、所述第八计算参数和所述第九计算参数,结合分解因子机FM公式,并行计算每个所述待处理资源的评分。
8.根据权利要求7所述的系统,其特征在于,所述处理单元具体用于:确定所述用户特征与所述待处理资源的资源特征的匹配值;对所述匹配值进行哈希hash计算,生成M个匹配特征;将所述M个匹配特征拼接成字符串,得到对应的目标组合模式。
9.根据权利要求7所述的系统,其特征在于,用于计算每个所述待处理资源的评分的所述计算单元,具体用于:基于所述第一计算参数、所述第四计算参数和所述第七计算参数,确定所述FM公式的第一计算项的数值,所述FM公式由偏置项、第一计算项、第二计算项和第三计算项构成;基于所述第二计算参数、所述第五计算参数和所述第八计算参数,确定所述FM公式的第二计算项的数值;基于所述第三计算参数,所述第六计算参数和所述第九计算参数,确定所述FM公式的第三计算项的数值;利用所述FM公式的偏置项、第一计算项的数值、第二计算项的数值和第三计算项的数值,计算所述待处理资源的评分。
10.根据权利要求7所述的系统,其特征在于,所述第一计算参数为
Figure DEST_PATH_IMAGE011
,所 述第二计算参数为
Figure 497554DEST_PATH_IMAGE012
,所述第三计算参数为
Figure 380060DEST_PATH_IMAGE013
其中,k2为资源特征的数量,itemi为第i个资源特征,ωitemi为第i个资源特征的权重,xitemi为用于指示第i个资源特征是否存在的参数,vitemi,f为第i个资源特征的隐向量里第f维的权重。
CN202110822319.2A 2021-07-21 2021-07-21 一种资源评分方法及系统 Active CN113268672B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110822319.2A CN113268672B (zh) 2021-07-21 2021-07-21 一种资源评分方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110822319.2A CN113268672B (zh) 2021-07-21 2021-07-21 一种资源评分方法及系统

Publications (2)

Publication Number Publication Date
CN113268672A true CN113268672A (zh) 2021-08-17
CN113268672B CN113268672B (zh) 2021-10-15

Family

ID=77237001

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110822319.2A Active CN113268672B (zh) 2021-07-21 2021-07-21 一种资源评分方法及系统

Country Status (1)

Country Link
CN (1) CN113268672B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190355025A1 (en) * 2018-05-17 2019-11-21 Alibaba Group Holding Limited Blockchain-based resource value evaluation methods and apparatus
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统
CN111339433A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN112699309A (zh) * 2021-03-23 2021-04-23 北京搜狐新媒体信息技术有限公司 资源推荐方法、装置、可读介质以及设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190355025A1 (en) * 2018-05-17 2019-11-21 Alibaba Group Holding Limited Blockchain-based resource value evaluation methods and apparatus
CN111275479A (zh) * 2020-01-07 2020-06-12 北京爱笔科技有限公司 一种人流量预测方法、装置及系统
CN111339433A (zh) * 2020-05-21 2020-06-26 腾讯科技(深圳)有限公司 基于人工智能的信息推荐方法、装置、电子设备
CN112699309A (zh) * 2021-03-23 2021-04-23 北京搜狐新媒体信息技术有限公司 资源推荐方法、装置、可读介质以及设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
YUEDING等: "SCFM: Social and crowdsourcing factorization machines for recommendation", 《APPLIED SOFT COMPUTING》 *
燕彩蓉等: "因子分解机模型的宽度和深度扩展研究", 《软件学报》 *

Also Published As

Publication number Publication date
CN113268672B (zh) 2021-10-15

Similar Documents

Publication Publication Date Title
US9569499B2 (en) Method and apparatus for recommending content on the internet by evaluating users having similar preference tendencies
CN111309824B (zh) 实体关系图谱显示方法及系统
Goloboff Calculating SPR distances between trees
CN106446179B (zh) 热点话题的生成方法及装置
CN105739971B (zh) 校验文件的生成、使用方法及装置
CN108632311A (zh) 信息推送方法和装置
CN110245140A (zh) 数据分箱处理方法及装置、电子设备和计算机可读介质
CN102073728A (zh) 一种用于确定网页访问请求的方法、装置及设备
CN108319646A (zh) 基于用户历史行为的车源搜索方法及装置
CN106326388A (zh) 一种信息处理方法和装置
CN112351088A (zh) 一种cdn缓存方法、装置、计算机设备及存储介质
CN113268672B (zh) 一种资源评分方法及系统
Haslegrave et al. Preferential attachment with choice
Dahlberg et al. Verifiable light-weight monitoring for certificate transparency logs
CN116342228B (zh) 一种基于有向图神经网络的相关推荐的方法
CN109299463A (zh) 一种情感得分的计算方法以及相关设备
CN110690987B (zh) 账号信息管理方法、装置及设备
CN105893515B (zh) 一种信息处理方法及服务器
CN115048430B (zh) 数据核验方法、系统、装置及存储介质
JP4286828B2 (ja) Webページ巡回装置及びWebページ巡回プログラム
CN104796478B (zh) 一种资源推荐方法及装置
CN114339689A (zh) 一种物联网机卡绑定池管控方法、装置及相关介质
US20200104325A1 (en) System and method for determining temporal citation count
JP2011227720A (ja) 推薦システム、推薦方法、及び推薦プログラム
CN112381620A (zh) 产品推荐方法、装置、电子设备及计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant