CN116975359A - 资源处理方法、资源推荐方法、装置和计算机设备 - Google Patents
资源处理方法、资源推荐方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN116975359A CN116975359A CN202211524162.6A CN202211524162A CN116975359A CN 116975359 A CN116975359 A CN 116975359A CN 202211524162 A CN202211524162 A CN 202211524162A CN 116975359 A CN116975359 A CN 116975359A
- Authority
- CN
- China
- Prior art keywords
- resource
- node
- interacted
- occurrence
- resources
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 71
- 238000003672 processing method Methods 0.000 title abstract description 21
- 238000012546 transfer Methods 0.000 claims abstract description 173
- 238000004590 computer program Methods 0.000 claims abstract description 29
- 238000003860 storage Methods 0.000 claims abstract description 15
- 238000000605 extraction Methods 0.000 claims description 67
- 238000010586 diagram Methods 0.000 claims description 55
- 238000012545 processing Methods 0.000 claims description 18
- 238000012549 training Methods 0.000 claims description 17
- 238000013138 pruning Methods 0.000 claims description 14
- 238000005295 random walk Methods 0.000 claims description 11
- 238000000638 solvent extraction Methods 0.000 claims 1
- 230000007704 transition Effects 0.000 description 36
- 230000006399 behavior Effects 0.000 description 16
- 239000013598 vector Substances 0.000 description 15
- 238000013528 artificial neural network Methods 0.000 description 13
- 238000004891 communication Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000005070 sampling Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 5
- 230000000153 supplemental effect Effects 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 102100035353 Cyclin-dependent kinase 2-associated protein 1 Human genes 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000013508 migration Methods 0.000 description 2
- 230000005012 migration Effects 0.000 description 2
- 238000012216 screening Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000000265 homogenisation Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000013021 overheating Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种资源处理方法、资源推荐方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息;基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;基于互转移度对初始资源共现图进行调整,得到目标资源共现图;基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;资源特征用于进行资源推荐。采用本方法能够提高推荐准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种资源处理方法、资源推荐方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,各种各样的应用程序中都出现了推荐功能,向用户推荐各种各样的资源。例如,在视频应用中,向用户推荐感兴趣的视频。
传统技术中,通常是基于当前用户的历史交互资源来对当前用户进行资源推荐,例如,若用户点击过的文章1为电影A的精彩语录,则为用户推荐与电影A相关的文章。然而,用户的历史交互资源有些时候无法直接反映真实用户意图,直接基于用户的历史交互资源来进行资源推荐,容易导致推荐不准确的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高资源推荐准确性的资源处理方法、资源推荐方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种资源处理方法。所述方法包括:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;所述资源特征用于进行资源推荐。
本申请还提供了一种资源处理装置。所述装置包括:
资源共现图获取模块,用于获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
单向转移度确定模块,用于基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
互转移度确定模块,用于融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
资源共现图调整模块,用于基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
资源特征提取模块,用于基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;所述资源特征用于进行资源推荐。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述资源处理方法所述的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述资源处理方法所述的步骤。
一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述资源处理方法所述的步骤。
上述资源处理方法、装置、计算机设备、存储介质和计算机程序产品,获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;基于互转移度对初始资源共现图进行调整,得到目标资源共现图;基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;资源特征用于进行资源推荐。可以理解,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点之间的关系,避免因初始资源共现图中的热点节点影响节点之间的关系而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。
本申请提供了一种资源推荐方法。所述方法包括:
获取当前搜索语句对应的当前召回资源的召回资源特征;
基于所述召回资源特征,从候选资源库中获取对应的匹配资源作为所述当前召回资源对应的目标推荐资源;
其中,所述当前召回资源为已交互资源,所述已交互资源对应的资源特征的提取过程包括以下步骤:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
本申请还提供了一种资源推荐装置。所述装置包括:
召回资源特征获取模块,用于获取当前搜索语句对应的当前召回资源的召回资源特征;
目标推荐资源确定模块,用于基于所述召回资源特征,从候选资源库中获取对应的匹配资源作为所述当前召回资源对应的目标推荐资源;
其中,所述当前召回资源为已交互资源,所述已交互资源对应的资源特征的提取过程包括以下步骤:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
上述资源推荐方法、装置、计算机设备、存储介质和计算机程序产品,获取当前搜索语句对应的当前召回资源的召回资源特征,基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源。当前召回资源为已交互资源,已交互资源对应的资源特征是基于目标资源共现图得到的,目标资源共现图是基于资源节点对所对应的互转移度对初始资源共现图进行调整得到的,初始资源共现图中各个资源节点对分别对应的互转移度是融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度得到的。可以理解,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点之间的关系,避免因初始资源共现图中的热点节点影响节点之间的关系而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。在进行资源推荐时,基于当前搜索语句对应的当前召回资源的召回资源特征,从候选资源库中可以准确获取与当前召回资源匹配的候选资源作为当前召回资源对应的目标推荐资源,将目标推荐资源推荐给当前搜索语句对应的待推荐对象可以有效提高资源推荐的准确性、可靠性、有效性。
附图说明
图1为一个实施例中资源处理方法和资源推荐方法的应用环境图;
图2为一个实施例中资源处理方法的流程示意图;
图3为一个实施例中建立初始资源共现图的示意图;
图4A为一个实施例中计算单向转移度和互转移度的示意图;
图4B为一个实施例中对目标资源共现图进行剪枝的示意图;
图5为一个实施例中提取资源特征的流程示意图;
图6为一个实施例中筛选热点节点的示意图;
图7为一个实施例中资源推荐方法的流程示意图;
图8为一个实施例中展示资源的流程示意图;
图9A为一个实施例中推荐相似视频的界面示意图;
图9B为一个实施例中展示补充推荐视频的界面示意图;
图10为一个实施例中基于用户点击序列确定视频对应的向量表示的流程示意图;
图11为一个实施例中资源处理装置的结构框图;
图12为一个实施例中资源推荐装置的结构框图;
图13为一个实施例中计算机设备的内部结构图;
图14为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的方案涉及人工智能的计算机视觉技术、机器学习等技术,具体通过如下实施例进行说明:
本申请实施例提供的资源处理方法和资源推荐方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群或者云服务器来实现。
终端和服务器均可单独用于执行本申请实施例中提供的资源处理方法和资源推荐方法。
例如,服务器获取初始资源共现图,其中,初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息。服务器基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度,融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度,基于互转移度对初始资源共现图进行调整,得到目标资源共现图。服务器基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;资源特征用于进行资源推荐。
终端获取当前搜索语句对应的当前召回资源的召回资源特征,基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源。终端可以将目标推荐资源向当前搜索语句对应的搜索对象进行展示。
终端和服务器也可协同用于执行本申请实施例中提供的资源处理方法和资源推荐方法。
例如,服务器从终端获取用于生成初始资源共现图的已交互资源序列,基于多个待推荐对象对应的已交互资源序列生成初始资源共现图。初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息。服务器基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度,融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度,基于互转移度对初始资源共现图进行调整,得到目标资源共现图。服务器基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
服务器从终端获取当前搜索语句,服务器获取当前搜索语句对应的当前召回资源的召回资源特征。服务器基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源。服务器可以将目标推荐资源发送至终端,终端可以将目标推荐资源向当前搜索语句对应的搜索对象进行展示。
在一个实施例中,如图2所示,提供了一种资源处理方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器,该方法可以由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图2,资源处理方法包括以下步骤:
步骤S202,获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息。
其中,初始资源共现图是指初始的资源共现图。资源共现图是一种共现图,用于反映资源与资源之间的共现关系。资源具体是指网络资源,网络资源是指借助于网络环境可以获取到的信息资源,例如,视频、音频、文本、图像等。
初始资源共现图是基于多个待推荐对象分别对应的已交互资源序列生成的共现图。已交互资源序列包括同一待推荐对象对应的多个已交互资源。待推荐对象是指待推荐用户,待推荐用户可以是任意的用户,例如,待推荐用户可以是应用程序中的注册用户;可以是需要搜索资源的搜索用户;等等。已交互资源是指与待推荐对象产生过交互的资源,例如,已交互资源可以是用户点击过的资源;已交互资源可以是用户点击过、且浏览时长大于预设时长的资源;已交互资源可以是用户点击过、且评论过资源;等等。可以理解,已交互资源序列中的各个已交互资源可以是有序排列的,也可以是无序排列的。此外,已交互资源序列还可以进一步包括已交互资源对应的资源介绍信息。资源介绍信息是用于介绍资源的文本信息,例如,资源的标题、资源的作者、资源的标签等。
初始资源共现图具体包括多个资源节点对和各个资源节点对分别对应的节点对关联信息。一个资源节点对包括一对资源节点。一个资源节点代表一个已交互资源,相应的,一个资源节点对代表一对已交互资源。资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,例如,可以将已交互资源序列中的已交互资源进行两两组合得到多对已交互资源,一对已交互资源对应一个资源节点对;可以对已交互资源序列中的已交互资源进行筛选,将筛选出来的已交互资源进行两两组合得到多对已交互资源,一对已交互资源对应一个资源节点对;等等。
资源节点对所对应的节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息,节点对关联信息可以反映资源节点对中的资源节点之间的关联程度。资源节点对在不同已交互资源序列中的共现信息,是通过统计同一资源节点对同时出现在不同的已交互资源序列中的频次得到的,用于反映同一资源节点对在各个已交互资源序列中的重复情况。资源节点对所对应的节点关联信息和资源节点对所对应的共现信息在数值上呈正比关系,也就是,同一资源节点对在更多的已交互资源序列中出现,则该资源节点对所对应的节点对关联信息的数值越大。
可以理解,待推荐对象的已交互资源序列可以反映待推荐对象的行为序列,基于已交互资源序列生成的初始资源共现图相当于待推荐对象的行为共现图,基于行为共现图可以挖掘待推荐对象的兴趣偏好、真实用户意图。
具体地,各式各样的应用程序通常都会提供推荐服务、推荐功能,推荐功能可以用于向用户进行资源推荐。在进行资源推荐时,可以借助资源对应的资源特征,通过特征匹配向用户进行相似资源推荐。针对资源特征,计算机设备可以获取初始资源共现图,对初始资源共现图进行数据处理来挖掘真实用户意图,从而得到准确的资源特征。
在一个实施例中,已交互资源序列包括在预设时间段内与待推荐对象产生过交互的资源。其中,预设时间段可以根据实际需要进行设置,例如,若预设时间段为90天,则已交互资源序列可以包括90天内待推荐对象点击过的资源;若预设时间段为120天,则已交互资源序列可以包括120天内待推荐对象点击过的资源。
步骤S204,基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度。
其中,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性。单向转移是指从一个资源节点转移到另一个资源节点,相当于在与一个资源交互后跳转到与另一个资源进行交互,例如,用户在点击视频A后再点击视频B。单向转移度具体可以是指从一个资源节点转移到另一个资源节点的概率,相当于表示用户在与一个资源交互后跳转到与另一个资源进行交互的概率,例如,用户在点击视频A后再点击视频B的概率。
可以理解,一个资源节点可以对应至少一个单向转移度。同一资源节点对应的不同的单向转移度,是资源节点在不同的资源节点对中所对应的单向转移度。例如,资源节点对1包括资源节点A和资源节点B,资源节点对2包括资源节点A和资源节点C,资源节点A一共对应两个单向转移度,资源节点A在资源节点对1中对应的单向转移度表示从资源节点A转移到资源节点B的概率,资源节点A在资源节点对2中对应的单向转移度表示从资源节点A转移到资源节点C的概率。
具体地,计算机设备可以基于初始资源共现图中的节点对关联信息计算资源节点在资源节点对中对应的单向转移度,得到各个资源节点在各自资源节点对中所对应的单向转移度。具体可以基于目标资源节点对所对应的节点对关联信息、以及目标资源节点对中一个目标资源节点所对应的各个资源节点对的节点对关联信息,计算该目标资源节点在目标资源节点对中对应的单向转移度,例如,资源节点对1包括资源节点A和资源节点B,可以基于资源节点对1对应的节点对关联信息、以及包含资源节点A的各个资源节点对分别对应的节点对关联信息,计算资源节点A在资源节点对1中对应的单向转移度,即计算从资源节点A转移到资源节点B的概率。
步骤S206,融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度。
其中,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性。可以理解,单向转移存在偏向性,若某个资源节点对应的资源比较热门,则从其他资源节点转移到该资源节点的概率都比较大,例如,某个视频为热门视频,用户很容易从先点击播放某个普通视频再点击播放热门视频,但是从先点击播放热门视频再点击播放该普通视频的可能性通常较低,因此单向转移度无法很好地反映资源节点之间真实的关联关系。互转移度是通过融合一对资源节点在资源节点对中对应的单向转移度得到的。互转移度可以有效平衡热门资源节点对其他资源节点的影响,可以很好的解决由于部分资源节点过热而导致对资源共现图的同质性的影响。同质性是指图中相近资源节点拥有类似属性的性质,用户比较容易在相近资源之间进行跳转交互。
例如,资源节点对1包括资源节点A和资源节点B,资源节点对2包括资源节点A和资源节点C。资源节点对1对应的互转移度是通过融合资源节点A和资源节点B在资源节点对1中对应的单向转移度得到的,即通过将从资源节点A转移到资源节点B的概率和从资源节点B转移到资源节点A的概率进行融合得到的。同理,资源节点对2对应的互转移度是通过融合资源节点A和资源节点C在资源节点对2中对应的单向转移度得到的,即通过将从资源节点A转移到资源节点C的概率和从资源节点C转移到资源节点A的概率进行融合得到的。
具体地,在初始资源共现图中,可能存在一些超级节点,大部分节点均和超级节点存在节点对关联信息,但是,大部分节点中不是各个节点都和超级节点拥有类似属性的性质。为了修正初始资源贡献图中资源节点之间的关系,计算机设备可以将同一资源节点对中各个资源节点在资源节点对中对应的单向转移度进行融合,也就是,将一对资源节点在所组成的资源节点对中对应的单向转移度进行融合,从而得到各个资源节点对分别对应的互转移度。互转移度用于修正初始资源共现图中资源节点之间的关系。
步骤S208,基于互转移度对初始资源共现图进行调整,得到目标资源共现图。
其中,目标资源共现图是指最终的资源共现图。目标资源共现图是指调整后的初始资源共现图。
具体地,在计算得到互转移度后,计算机设备基于互转移度对初始资源共现图进行调整,具体可以基于互转移度对初始资源共现图进行剪枝,将剪枝后的初始资源共现图作为目标资源共现图。例如,在初始资源共现图中,可以将互转移度小于转移度阈值的资源节点对进行剪枝;可以对初始资源共现图对应的各个互转移度从小到大进行排序,将排序靠前的若干个互转移度所对应的资源节点对进行剪枝;等等。
步骤S210,基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;资源特征用于进行资源推荐。
具体地,计算机设备可以基于目标资源共现图,对目标资源共现图中的资源节点所对应的已交互资源进行资源特征提取,得到目标资源共现图对应的各个已交互资源分别对应的资源特征。可以理解,可以基于各种特征提取算法进行资源特征提取,也可以基于自定义算法或公式进行资源特征提取。
后续,提取得到的资源特征可以应用于资源推荐,资源推荐具体是用于推荐某个资源或某些资源对应的相似资源。例如,基于资源特征计算当前资源分别和各个候选资源之间的特征相似度,基于特征相似度从各个候选资源中确定当前资源对应的相似资源,将当前资源对应的相似资源推荐给当前资源对应的终端。当前资源对应的终端可以是与当前资源进行过交互的用户对应的终端,也可以是当前资源的展示终端。可以理解,资源推荐可以是用户主动获取信息的推荐方式,也就是,资源推荐可以是用户主动触发的。例如,用户在搜索栏中输入当前资源,触发相关控件(如搜索控件、相似推荐控件)后,基于资源特征从候选资源中获取当前资源对应的相似资源,向用户展示当前资源对应的相似资源。资源推荐也可以是用户被动获取信息的推荐方式,也就是,资源推荐可以是用户被动接收的。例如,当前资源为用户的历史搜索结果,基于资源特征从候选资源中获取当前资源对应的相似资源,自动向用户展示当前资源对应的相似资源。
在一个实施例中,基于目标资源共现图,通过用于处理文本的文本神经网络对已交互资源进行资源特征提取。可以从目标资源共现图中采样得到多个节点序列,基于各个节点序列训练文本神经网络来提取资源特征。输入文本神经网络的序列可以是文本序列,文本序列包括节点序列中的资源节点所对应的已交互资源的资源信息,资源信息以文本数据类型来表示。最终,基于训练得到的文本神经网络确定目标资源共现图中各个已交互资源的资源特征。在一个实施例中,文本神经网络的输入数据为序列,输出数据为序列预测结果,用于生成输出数据的中间数据为序列中的已交互资源对应的资源特征。
在一个实施例中,基于目标资源共现图,通过用于处理图像的图神经网络对已交互资源进行资源特征提取。可以从目标资源共现图中采样得到多个资源子图,基于各个资源子图训练图神经网络来提取资源特征。图神经网络的输入数据为图像,输出数据为图像中的已交互资源对应的资源特征。最终,基于训练得到的图神经网络提取目标资源共现图对应的各个已交互资源的资源特征。在一个实施例中,图神经网络的训练目标可以是让资源子图中主节点和其领域节点分别对应的已交互资源之间的资源特征相似,资源子图中主节点和其非领域节点分别对应的已交互资源之间的资源特征不相似,例如,可以让主节点和其领域节点分别对应的已交互资源之间的资源特征相似度大于主节点和其非领域节点分别对应的已交互资源之间的资源特征相似度;可以让主节点和其领域节点分别对应的已交互资源之间的资源特征相似度比主节点和其非领域节点分别对应的已交互资源之间的资源特征相似度大预设数值;等等。主节点可以是资源子图中任意的节点,也可以是从资源子图中选取的至少一个节点。主节点的领域节点用于表示位于主节点附近的节点,主节点的非领域节点用于表示远离主节点的节点。例如,主节点对应的领域节点是指与主节点之间的节点距离小于或等于第一预设距离的节点,主节点对应的非领域节点是指与主节点之间的节点距离大于第二预设距离的节点,其中,第一预设距离小于或等于第二预设距离,两个节点之间的节点距离是基于两个节点之间的最短节点路径确定的,节点路径越短,节点距离越小。
在一个实施例中,可以从目标资源共现图中选取一部分资源节点来训练神经网络,在训练结束后,再提取目标资源共现图中各个已交互资源的资源特征。
在一个实施例中,为了进一步降低热点节点(即热门节点)的影响力,在生成神经网络的训练样本时,可以降低针对热点节点的采样频率。
在一个实施例中,由于网络中会不断涌现新的资源,为了保障资源推荐与时俱进,可以定时更新初始资源共现图,基于新的初始资源共现图生成新的目标资源共现图,基于新的目标资源共现图对图中的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。这样,在资源推荐时,新出现的资源也有机会推荐给用户,保障了资源推荐的灵活性。
上述资源处理方法中,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点之间的关系,避免因初始资源共现图中的热点节点影响节点之间的关系而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。
可以理解,基于提取得到的资源特征进行资源推荐,有效提高了资源推荐的准确性、可靠性、有效性,进而用户就可以快速获取到感兴趣的资源,无需用户重复刷新界面或重复搜索资源,从而进一步有效节约计算机设备的推送资源消耗,有效提高了推送效率。
在一个实施例中,获取初始资源共现图,包括:
获取至少两个待推荐对象分别对应的已交互资源序列;将同一已交互资源序列中的已交互资源进行组合,得到多个已交互资源对;将已交互资源对中的已交互资源作为资源节点,得到资源节点对;统计各个已交互资源对在不同已交互资源序列中的共现次数,得到各个已交互资源对分别对应的节点对关联信息;基于节点对关联信息连接已交互资源对所对应的资源节点,得到初始资源共现图。
其中,共现次数是指一个已交互资源对同时出现在不同已交互资源序列中的出现次数。例如,已交互资源序列包括10个序列,针对由已交互资源A和已交互资源B组成的已交互资源对,10个序列中有3个序列都可以通过组合序列中的已交互资源得到该已交互资源对,则该已交互资源对所对应的共现次数为3。
具体地,计算机设备可以获取至少两个待推荐对象分别对应的已交互资源序列,基于各个已交互资源序列生成初始资源共现图。首先,将同一已交互资源序列中的已交互资源进行组合,得到同一已交互资源序列对应的至少一个已交互资源对,各个已交互资源序列都可以得到对应的至少一个已交互资源对。在生成初始资源共现图时,已交互资源对中的已交互资源用于作为资源节点,已交互资源对用于作为资源节点对。进一步的,统计各个已交互资源对在不同已交互资源序列中的共现次数,基于已交互资源对所对应的共现次数得到已交互资源对所对应的节点对关联信息,例如,将共现次数作为节点对关联信息;对共现次数进行归一化得到节点对关联信息;等等。在生成初始资源共现图时,基于节点对关联信息连接已交互资源对所对应的资源节点,也就是,将已交互资源对所对应的资源节点进行连接,将节点对关联信息作为资源节点对之间的连线权重。
上述实施例中,将同一已交互资源序列中的已交互资源进行组合得到已交互资源对,从一个用户对应的行为序列中确定已交互资源对,可以保障已交互资源对中的资源具备一定的关联关系。统计已交互资源对在不同已交互资源序列中的共现次数,得到已交互资源对所对应的节点对关联信息,节点对关联信息可以反映已交互资源对在不同已交互资源序列中的共现频次,进而反映已交互资源对中的资源之间的关联程度。将已交互资源对中的已交互资源作为资源节点,基于节点对关联信息连接已交互资源对所对应的资源节点,可以快速建立初始资源共现图。
在一个实施例中,参考图3,以5个用户的已交互资源序列为例说明建立初始资源共现图的过程。用户的已交互资源序列包括用户近90天内交互过的资源,例如,若资源为视频,则已交互资源序列包括用户近90天内点击过的视频。已交互资源序列中的已交互资源可以是按照交互顺序排列的。用户1的已交互资源序列为doc1-doc2-doc4-doc1-doc2,相当于,用户1的已交互资源序列包括有序排列的资源1、资源2、资源4、资源1、资源2。doc用于表示资源的资源介绍信息。用户2的已交互资源序列为doc2-doc4-doc3,用户3的已交互资源序列为doc5-doc3-doc2,用户4的已交互资源序列为doc2-doc6-doc5-doc7,用户5的已交互资源序列为doc2-doc6。将同一已交互资源序列中不同的资源进行组合,基于5个已交互资源序列最终可以得到12个已交互资源对,统计各个已交互资源对在不同已交互资源序列中的共现次数。将已交互资源对中的已交互资源作为资源节点,连接已交互资源对所对应的资源节点,并将已交互资源对所对应的共现次数作为资源节点对之间的连线权重,最终得到初始资源共现图。参考图3,以doc1和doc2组成的资源对为例,doc1和doc2组成的资源对只有在用户1的已交互资源序列中出现,因此对应的出现次数为1,基于doc1生成资源节点1,基于doc2生成资源节点2,连接资源节点1和资源节点2组成资源节点对,资源节点1和资源节点2之间的连线权重为1。
在一个实施例中,基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度,包括:
从当前资源节点对中确定目标资源节点;对目标资源节点所属各个资源节点对分别对应的节点对关联信息进行累积,得到累积关联信息;基于当前资源节点对所对应的节点对关联信息和累积关联信息的比值,得到目标资源节点在当前资源节点对中对应的单向转移度。
其中,当前资源节点对是指当前处理的资源节点对。可以理解,当前资源节点对可以是各个资源节点对中的任意资源节点对。目标资源节点是指当前资源节点对中的某个资源节点,可以理解,目标资源节点可以是当前资源节点对中的任意资源节点。目标资源节点所属资源节点对是指包含目标资源节点的资源节点对。
具体地,计算机设备从各个资源节点对中选取任意的资源节点对作为当前资源节点对,从当前资源节点对中选取任意的资源节点作为目标资源节点,基于包含目标资源节点的各个资源节点对所对应的节点对关联信息确定目标资源节点在当前资源节点对中所对应的单向转移度。参考同样的方法,确定当前资源节点对中的其他资源节点在当前资源节点对中对应的单向转移度,确定各个资源节点在相应的资源节点对中所对应的单向转移度。
针对当前资源节点对中的目标资源节点,首先对目标资源节点所属各个资源节点对分别对应的节点对关联信息进行累积,得到目标资源节点对应的累积关联信息,例如,将目标资源节点所属的各个资源节点对分别对应的节点对关联信息进行累加得到累积关联信息;将目标资源节点所属的各个资源节点对分别对应的节点对关联信息进行加权求和得到累积关联信息,节点对关联信息的数值越大,对应的权重越大;等等。进一步的,计算当前资源节点对所对应的节点对关联信息和目标资源节点对应的累积关联信息的比值,基于该比值得到目标资源节点在当前资源节点对中对应的单向转移度,例如,将该比值作为单向转移度。
举例说明,资源节点A分别和资源节点B、C、D相连,资源节点A和资源节点B之间的连线权重(即节点对关联信息)为2,资源节点A和资源节点C之间的连线权重为4,资源节点A和资源节点C之间的连线权重为1,资源节点A和资源节点B组成资源节点对1,资源节点A和资源节点C组成资源节点对2,资源节点A和资源节点D组成资源节点对3。以资源节点对1为例,从资源节点A转移到资源节点B的单向转移度(即资源节点A在资源节点对1中对应的单向转移度)为2/(2+4+1)=2/7。
上述实施例中,针对当前资源节点对中的目标资源节点,对目标资源节点所属各个资源节点对分别对应的节点对关联信息进行累积,基于当前资源节点对所对应的节点对关联信息和通过累积得到的累积关联信息的比值,可以快速得到目标资源节点在当前资源节点对中对应的单向转移度,这样计算得到的单向转移度可以直观反映在当前资源节点对中从目标资源节点转移到其他资源节点的转移概率。
在一个实施例中,基于互转移度对初始资源共现图进行调整,得到目标资源共现图,包括:
从初始资源共现图中,将互转移度小于转移度阈值的资源节点对进行剪枝,得到目标资源共现图。
其中,转移度阈值是用于筛选出需要剪枝的资源节点对的转移度临界值。转移度阈值可以根据实际需要进行设置,例如,由专业人员设置转移度阈值;通过实验测试确定转移度阈值;等等。可以理解,不同的初始资源共现图对应的转移度阈值可以相同可以不同。
剪枝是指将资源节点对之间的关联关系剪断,也就是,将资源节点对之间的连线删除。
具体地,在基于互转移度对初始资源共现图进行调整时,资源节点对所对应的互转移度越小,表明资源节点对中资源节点之间的关联关系越弱,因此可以将初始资源共现图中互转移度小于转移度阈值的资源节点对进行剪枝,将剪枝后的初始资源共现图作为目标资源共现图。
上述实施例中,从初始资源共现图中将互转移度小于转移度阈值的资源节点对进行剪枝,可以有效删除联系不那么紧密的资源节点之间的关联关系,剪枝得到的目标资源共现图有利于提高后续数据处理的准确性。
在一个实施例中,参考图4A说明单向转移度和互转移度的计算过程。转移概率是指从一个节点转移到另一个节点的概率,转移概率即为单向转移度。从A节点转移到B节点的概率,具体可以先计算A所有边的权重和,然后用AB边的权重和A所有边的权重和的比值作为从A节点到B节点的转移概率。以资源节点1和资源节点2为例,从资源节点1转移到资源节点2的转移概率为1/(1+1)=0.5,从资源节点2转移到资源节点1的转移概率为1/(1+2+2+2+2+1)=0.1。在共现图上,有些超级节点因为热度过高会导致其他节点到这类节点的转移概率都会比较大,单看转移概率并不能很好的表示节点间的关系,因此引入互转移概率。互转移概率是将从A节点转移到B节点的转移概率乘上从B节点转移到A节点的转移概率得到的,互转移概率即为互转移度。互转移概率可以很好的解决头部过热数据对图的同质性的影响,互转移概率可以理解为对图的同质性进行了置信矫正。
参考图4B,将互转移概率低于0.05的共现边进行剪枝,也就是,0.05为互转移度阈值,将互转移度小于转移度阈值的连边删除。7节点虽然到2节点的转移概率很高,但是2节点是热点节点,2节点和许多节点都相关,7节点到2节点的转移概率并不能准确的表示节点间的关系。然而7节点和2节点之间的互转移概率较低,说明2-7连边的置信度较低,7节点和2节点对应的资源不太相似,因此可以做剪枝操作来修正。
在一个实施例中,如图5所示,基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征,包括:
步骤S502,将目标资源共现图中的资源节点划分为非热点类节点和热点类节点。
其中,目标资源共现图中的资源节点可以分为两大类,一类为热点类节点,一类为非热点类节点,热点类节点用于表示经常被用户交互的热门资源对应的节点,非热点类节点用于表示不经常被用户交互的普通资源对应的节点。
在一个实施例中,将目标资源共现图中的资源节点划分为非热点类节点和热点类节点,包括:统计目标资源共现图中的资源节点在各个已交互资源序列中的出现次数,将出现次数大于出现阈值的资源节点作为热点类节点,将出现次数小于或等于出现阈值的资源节点作为非热点类节点。
具体地,可以基于资源节点对应的出现次数快速进行资源节点的分类。若某个已交互资源被多个用户都交互过,则表示该已交互资源为热门资源、热点资源,因此,计算机设备统计目标资源共现图中的资源节点在各个已交互资源序列中的出现次数,将出现次数大于出现阈值的资源节点作为热点类节点,将出现次数小于或等于出现阈值的资源节点作为非热点类节点。其中,出现阈值是用于节点分类的出现次数临界值,出现阈值具体可以根据实际需要进行设置。
在一个实施例中,可以按照出现次数从大到小将各个资源节点进行排序,获取排序靠前的若干个资源节点作为热点类节点,将剩余的资源节点作为非热点类节点。
步骤S504,获取至少一个节点路径模式;节点路径模式是对非热点类节点标签和热点类节点标签进行排列得到的路径模式。
其中,节点路径模式是一种资源节点采样模式,用于从目标资源共现图中采样资源节点来组成相应的节点路径。节点路径模式具体可以是对非热点类节点标签和热点类节点标签进行排列得到的路径模式。非热点类节点标签是用于指代非热点类节点的标签。热点类节点标签是用于指代热点类节点的标签。在节点路径模式中,热点类节点标签的标签数量用于确定最终生成的节点路径中热点类节点的数量,非热点类节点标签的标签数量用于确定最终生成的节点路径中非热点类节点的数量。在节点路径模式中,节点标签之间的排列顺序用于确定最终生成的节点路径中节点之间的排列顺序。
例如,热点类节点标签用H表示,非热点类节点标签用P表示,若节点路径模式用P-P-P-H-P-P-P表示,该节点路径模式表征最终生成的节点路径需要是由非热点类节点-非热点类节点-非热点类节点-热点类节点-非热点类节点-非热点类节点-非热点类节点这样排列组成的。
节点路径模式可以是预先设置好的,节点路径模式可以根据实际需要进行设置。
步骤S506,基于节点路径模式,在目标资源共现图中进行随机游走,得到各个节点路径模式分别对应的至少一个节点游走路径。
步骤S508,基于节点游走路径进行特征提取,得到节点游走路径途经的资源节点所对应的已交互资源的资源特征。
其中,随机游走是指从目标资源共现图中随机采样资源节点。节点游走路径是由采样得到的资源节点组成的节点路径。
具体地,目标资源共现图中包含大量的资源节点,为了减少数据处理复杂度,可以从目标资源共现图中采样得到多个节点游走路径,将目标资源共现图分解为多个节点游走路径,对节点游走路径途经的资源节点所对应的已交互资源进行特征提取,得到节点游走路径途经的资源节点所对应的已交互资源的资源特征,分别基于各个节点游走路径进行特征提取,最终得到目标资源共现图对应的各个已交互资源的资源特征。
在生成节点游走路径时,可以获取多个节点路径模式,基于节点路径模式在目标资源共现图中进行随机游走,随机采样符合节点路径模式要求的资源节点来组成符合节点路径模式的节点游走路径。可以理解,目标资源共现图中通常包括大量的由非热点类节点组成的非热点类节点对、由热点类节点和非热点类节点组成的混合类节点对,甚至还包括由热点类节点组成的热点类节点对,节点路径模式的长度又是有限的,因此,基于一个节点路径模式在目标资源共现图中进行随机游走可以得到至少一个节点游走路径。
在进行特征提取时,可以基于节点游走路径对应的各个已交互资源的资源介绍信息来提取资源特征。例如,将资源介绍信息输入文本神经网络,得到资源特征。
在一个实施例中,节点路径模式中的热点类节点标签的标签数量小于预设数量,这样可以进一步降低针对热点类节点的采样频率,避免最终生成的各个节点游走路径一直经过同样的热点类节点。预设数量可以根据实际需要进行设置,例如,设置为1;设置为节点路径模式对应的节点路径长度的1/5或1/10或1/20;等等。
上述实施例中,将目标资源共现图中的资源节点划分为非热点类节点和热点类节点,基于对非热点类节点标签和热点类节点标签进行排列得到的节点路径模式在目标资源共现图中进行随机游走,可以快速得到各个节点路径模式分别对应的至少一个节点游走路径,基于节点游走路径进行特征提取,得到节点游走路径途经的资源节点所对应的已交互资源的资源特征,这样的特征提取方式可以有效提高资源特征提取的效率。
在一个实施例中,基于节点路径模式,在目标资源共现图中进行随机游走,得到各个节点路径模式分别对应的至少一个节点游走路径,包括:
基于资源节点对应的节点类型,从目标资源共现图中,获取与当前节点路径模式中的节点标签对匹配的资源节点对,得到各个节点标签对分别对应的资源节点对;节点标签对包括当前节点路径模式中相邻的节点标签;按照节点标签对在当前节点路径模式中的排序,将对应的各个资源节点对进行排列,得到当前节点路径模式对应的节点游走路径。
其中,目标资源共现图中的资源节点被分为热点类节点和非热点类节点,相应的,节点类型就包括热点类节点和非热点类节点。
一个节点标签对包括一对节点标签。节点路径模式是将热点类节点标签和非热点类节点标签进行排列得到的,节点标签在节点路径模式中是有序排列的,因此可以将节点路径模式中相邻的节点标签组成节点标签对。
当前节点路径模式是指当前处理的节点路径模式。可以理解,当前节点路径模式可以是任意的节点路径模式。
具体地,计算机设备可以基于各个节点路径模式,分别在目标资源共现图中进行随机游走,从而得到各个节点路径模式分别对应的至少一个节点游走路径。
针对当前节点路径模式,首先从目标资源共现图中,基于资源节点对应的节点类型获取与当前节点路径模式中的节点标签对匹配的资源节点对,得到当前节点路径模式中的各个节点标签对分别对应的资源节点对。例如,某个节点标签对包括非热点类节点标签和热点类节点标签,则从目标资源共现图中获取存在连线的非热点类节点和热点类节点作为该节点标签对所对应的资源节点对;某个节点标签对包括非热点类节点标签和非热点类节点标签,则从目标资源共现图中获取存在连线的一对非热点类节点作为该节点标签对所对应的资源节点对。当前节点路径模式可以认为是由多个有序排列的节点标签对组成的,因此按照节点标签对在当前节点路径模式中的排序,将对应的各个资源节点对进行有序排列,最终得到当前节点路径模式对应的节点游走路径。
上述实施例中,基于资源节点对应的节点类型,从目标资源共现图中,获取与当前节点路径模式中的节点标签对匹配的资源节点对,按照节点标签对在当前节点路径模式中的排序,将对应的各个资源节点对进行排列,得到当前节点路径模式对应的节点游走路径。这样,基于节点标签对和资源节点对的匹配,可以快速从目标资源共现图中确定节点路径模式对应的节点游走路径。
在一个实施例中,基于节点游走路径进行特征提取,得到节点游走路径途经的资源节点所对应的已交互资源的资源特征,包括:
获取节点游走路径对应的各个已交互资源的资源介绍信息,组成节点游走路径对应的资源介绍信息序列;基于资源介绍信息序列训练初始文本特征提取模型,得到目标文本特征提取模型;基于目标文本特征提取模型确定资源介绍信息对应的文本特征,将资源介绍信息对应的文本特征作为资源介绍信息所属已交互资源对应的资源特征。
其中,资源介绍信息是用于介绍资源的信息。资源介绍信息具体可以包括资源标题、资源简介、资源作者、资源参与者、资源标签等信息中的至少一者。以资源为视频为例,视频介绍信息可以包括视频标题、视频描述、视频标签、视频对应的演员、导演、编剧等信息。资源介绍信息序列包括节点游走路径对应的各个已交互资源的资源介绍信息。
文本特征提取模型是用于将文本转换为特征向量的神经网络模型。初始文本特征提取模型是指待训练的文本特征提取模型。目标文本特征提取模型是指训练完成的文本特征提取模型。
具体地,可以基于文本特征提取模型来进行特征提取。计算机设备可以获取节点游走路径对应的各个已交互资源的资源介绍信息,将各个资源介绍信息组成节点游走路径对应的资源介绍信息序列。各个节点游走路径最终都可以得到对应的资源介绍信息序列。将各个资源介绍信息序列作为文本特征提取模型的训练集,基于各个资源介绍信息序列对初始文本特征提取模型进行模型训练,得到目标文本特征提取模型。最终,基于目标文本特征提取模型确定各个资源介绍信息分别对应的文本特征,将资源介绍信息对应的文本特征作为资源介绍信息所属已交互资源对应的资源特征,从而得到各个已交互资源分别对应的资源特征。
在一个实施例中,文本特征提取模型包括输入层、隐藏层和输出层。在模型训练时,文本特征提取模型的学习任务可以是通过资源介绍信息序列中的中心资源介绍信息去预测中心资源介绍信息周围的资源介绍信息,也可以是通过周围的资源介绍信息去预测中心资源介绍信息,两个学习任务的最终目的都是学习到隐藏层的参数。隐藏层参数包括各个资源介绍信息分别对应的初始特征,在模型迭代训练时不断反向传播来更新隐藏层参数。在训练完成后,获取最终的隐藏层参数得到各个资源介绍信息分别对应的文本特征。
其中,资源介绍信息序列中的中心资源介绍信息可以是资源介绍信息序列中的任意资源介绍信息。中心资源介绍信息周围的资源介绍信息可以包括中心资源介绍信息周围预设数目个资源介绍信息。
以通过周围的资源介绍信息去预测中心资源介绍信息的学习任务为例说明模型训练过程。将遮挡了中心资源介绍信息的资源介绍信息序列输入待训练的文本特征提取模型,文本特征提取模型输出预测资源介绍信息,基于中心资源介绍信息和预测介绍信息之间的差异生成模型损失,基于模型损失调整文本特征提取模型的模型参数,直至满足收敛条件,得到训练完成的文本特征提取模型。其中,收敛条件可以是模型迭代次数大于迭代次数阈值、模型损失小于损失阈值等中的至少一者。
上述实施例中,基于节点游走路径对应的资源介绍信息序列训练初始文本特征提取模型,得到目标文本特征提取模型,基于目标文本特征提取模型确定资源介绍信息对应的文本特征,将资源介绍信息对应的文本特征作为资源介绍信息所属已交互资源对应的资源特征。通过资源介绍信息序列可以快速训练文本特征提取模型,借助训练完成的文本特征提取模型可以快速得到准确的资源特征。
在一个实施例中,参考图6说明资源特征的提取过程。通过统计资源在已交互资源序列中的出现频次来筛选出热点节点,可以把目标资源共现图中节点分为两类,即非热点节点(即非热点类节点)和热点节点(即热点类节点)。在图6中,选择阈值大于3的节点作为热点节点,最终选出节点2作为热点节点。根据节点分类,目标资源共现图就变成了二部图(即二分图)。基于目标资源共现图生成多个节点游走路径,通过word2vec(word tovector,将文本转为向量)方法得到每个节点(即doc、资源)的向量表示。
在生成节点游走路径时,可以通过设置元路径(即节点路径模式)的方法控制对热点节点的选择频率。可以理解,若没有设置元路径,则可以从图中随机采样节点来生成节点游走路径,那么会有较大概率一直采样得到经过节点2的路径。通过设置元路径可以有效避免一直经过热点节点2的路径,进而排除热点节点的影响。
举例说明,H表示热点节点,P表示普通节点。Path表示元路径。若Path为P-P-P-H-P-P-P,基于该path采样得到的一个节点游走路径可以是4-3-5-2-6-7-5;若Path为P-H-P-P-P-P-P,基于该path采样得到的一个节点游走路径可以是1-2-5-6-7-5-3。
word2vec包含两种算法,分别是skip-gram(跳字模型)和CBOW(continuous bagof words,连续词袋模型)。在模型训练时,skip-gram的学习任务是通过中心词去预测中心词周围的词,而CBOW的学习任务是通过周围的词去预测中心词。两者最终目的都是学习到隐层的参数,基于隐层的参数得到各个词分别对应的词向量。在本申请中,可以将一个资源对应的资源介绍信息作为一个词,将资源介绍信息序列作为一句话或一段话。在模型训练完成后,word2vec模型可用来将每个词映射到一个向量。在本申请中,word2vec模型可以将各个资源介绍信息映射为向量,从而得到各个已交互资源分别对应的资源特征。
在一个实施例中,如图7所示,提供了一种资源推荐方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器,该方法可以由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图7,资源推荐方法包括以下步骤:
步骤S702,获取当前搜索语句对应的当前召回资源的召回资源特征。
步骤S704,基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源。
其中,当前搜索语句是指当前处理的搜索语句。搜索语句是在进行资源搜索时的关键语句,即搜索是针对搜索语句展开,以搜索与搜索语句相关的资源。例如,在搜索引擎中,用户可以通过输入“电影A”作为搜索语句,则搜索引擎可以围绕该搜索语句进行资源搜索,并反馈与电影A相关的视频。搜索语句可以是搜索关键词,也可以是包含搜索关键词的句子。可以理解,搜索语句可以是用户在搜索输入框中直接输入的搜索文本,也可以是对用户输入的语音进行语音识别得到的搜索文本。
当前召回资源是指根据当前搜索语句进行搜索召回的资源。可以理解,当前召回资源可以是当前搜索语句对应的搜索结果中的任意召回资源,例如,可以是搜索结果中排序第一的召回资源;可以是搜索结果中热度最高的召回资源;可以是搜索结果中评分最高的召回资源;等等。召回资源特征用于表示召回资源对应的资源特征,具体是指当前召回资源对应的资源特征。
候选资源库包括多个候选资源。候选资源是指候选的资源,待判断是否推荐给用户的资源。匹配资源是指与召回资源特征匹配的候选资源。
其中,当前召回资源和候选资源为已交互资源,也就是,当前召回资源和候选资源是与用户发生过交互的资源。可以理解,当前召回资源和候选资源可以是同一用户交互过的资源,也可以是不同的用户交互过的资源。
已交互资源对应的资源特征的提取过程包括以下步骤:获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;基于互转移度对初始资源共现图进行调整,得到目标资源共现图;基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
可以理解,已交互资源对应的资源特征的提取过程可以参考前述资源处理方法各个实施例的内容,此次不再赘述。
具体地,在用户触发资源搜索后,除了向用户返回搜索结果还可以向用户进行资源推荐。在进行资源推荐时,计算机设备先确定当前搜索语句对应的当前召回资源,获取当前召回资源对应的召回资源特征,进而基于召回资源特征从候选资源库中查询相匹配的候选资源,将与召回资源特征匹配的候选资源作为当前召回资源对应的匹配资源,将匹配资源作为目标推荐资源。
可以理解,候选资源对应的资源特征为候选资源特征,基于召回资源特征和候选资源特征之间的特征相似度,可以从候选资源库中快速确定匹配资源。
若计算机设备为当前搜索语句对应的搜索对象的终端,终端可以将当前召回资源和目标推荐资源进行展示。若计算机设备为其他设备,计算机设备可以将当前召回资源和目标推荐资源发送至当前搜索语句对应的搜索对象的终端,在终端展示当前召回资源和目标推荐资源。可以理解,搜索对象是指搜索用户。计算机设备可以将当前召回资源和目标推荐资源一起发送至当前搜索语句对应的搜索对象的终端,也可以将当前召回资源和目标推荐资源先后发送至当前搜索语句对应的搜索对象的终端。
当前召回资源和目标推荐资源可以同时展示,例如,响应于针对当前搜索语句的搜索操作,同步展示当前召回资源和当前召回资源对应的目标推荐资源。当前召回资源和目标推荐资源也可以先后展示,例如,响应于针对当前搜索语句的搜索操作,展示当前召回资源,响应于针对当前召回资源的相似资源推荐操作,展示当前召回资源对应的目标推荐资源。相似资源推荐操作用于触发展开针对当前召回资源的资源推荐。相似资源推荐操作可以是针对相似推荐控件的触发操作。
此外,当前召回资源可以有至少一个,相应的,可以确定各个当前召回资源分别对应的目标推荐资源。同一当前召回资源对应的目标推荐资源也可以有至少一个。
上述资源推荐方法,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点之间的关系,避免因初始资源共现图中的热点节点影响节点之间的关系而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。在进行资源推荐时,基于当前搜索语句对应的当前召回资源的召回资源特征,从候选资源库中可以准确获取与当前召回资源匹配的候选资源作为当前召回资源对应的目标推荐资源,将目标推荐资源推荐给当前搜索语句对应的搜索对象可以有效提高资源推荐的准确性、可靠性、有效性。
在一个实施例中,如图8所示,资源推荐方法还包括:
步骤S802,响应于针对当前搜索语句的搜索操作,展示当前召回资源和当前召回资源对应的目标推荐资源,展示目标推荐资源对应的推荐理由;推荐理由是基于当前召回资源和目标推荐资源之间的共同资源信息确定的。
步骤S804,响应于针对推荐理由的触发操作,展示与推荐理由相关的至少一个补充推荐资源。
其中,搜索操作用于触发展开针对当前搜索语句的资源搜索。搜索操作可以是针对搜索控件的触发操作。触发操作具体可以是触摸操作、光标操作、按键操作或者语音操作,触摸操作可以是触摸点击操作、触摸按压操作或者触摸滑动操作,触摸操作可以是单点触摸操作或者多点触摸操作,光标操作可以是控制光标进行点击的操作或者控制光标进行按压的操作,按键操作可以是虚拟按键操作或者实体按键操作等。
推荐理由是基于当前召回资源和目标推荐资源之间的共同资源信息确定的。不同资源之间的共同资源信息是指在不同资源的资源介绍信息中相同的、重复的信息。例如,若不同资源之间的资源作者相同,则共同资源信息可以包括资源作者;若不同资源之间的资源标签相同,则共同资源信息可以包括资源标签。
补充推荐资源是指基于推荐理由额外补充推荐的资源。基于推荐理由可以进行补充推荐,得到补充推荐资源,补充推荐资源对应的资源介绍信息包括推荐理由。例如,以资源为视频为例,若推荐理由为喜剧,表示当前召回资源和目标推荐资源都是喜剧,若推荐理由为喜剧,补充推荐资源可以是属于喜剧类型的视频。可以理解,补充推荐资源可以有至少一个。
具体地,在资源搜索时可以自动触发资源推荐。在进行资源搜索时,用户可以在终端上输入当前搜索语句,并触发搜索控件。终端响应于针对当前搜索语句的搜索操作,获取当前召回资源和当前召回资源对应的目标推荐资源,展示当前召回资源和当前召回资源对应的目标推荐资源。在展示当前召回资源和当前召回资源对应的目标推荐资源时,还可以同步展示目标推荐资源对应的推荐理由。用户可以通过触发当前召回资源来查看当前召回资源的具体内容,通过触发目标推荐资源来查看目标推荐资源的具体内容。
进一步的,用户还可以通过触发推荐理由来查看基于推荐理由额外补充的推荐资源。终端响应于针对推荐理由的触发操作,展示与推荐理由相关的至少一个补充推荐资源。
上述实施例中,响应于针对当前搜索语句的搜索操作,展示当前召回资源和当前召回资源对应的目标推荐资源,展示目标推荐资源对应的推荐理由,展示的推荐理由有利于提高用户获取信息的效率,帮助用户快速了解目标推荐资源和当前召回资源之间的联系。响应于针对推荐理由的触发操作,展示与推荐理由相关的至少一个补充推荐资源,可以进一步提高用户获取信息的效率,用户无需启动新的搜索,通过简单的触发操作即可快速获取新的推荐资源。
在一个实施例中,在视频播放应用中,用户可以在搜索框中输入搜索语句来搜索相关视频。参考图9A,用户在搜索框中输入“动画A”来搜索动画A的相关视频,终端可以展示动画A的搜索结果。在动画A的搜索结果中,动画A第二季的视频为第一搜索结果902,动画A的其他视频为第二搜索结果906。用户可以点击第一搜索结果902中的“立即播放”控件来播放动画A第二季的视频,用户也可以点击第一搜索结果902中的任意集数来播放指定集数对应的视频,用户可以点击第一搜索结果902中的“缓存”控件来缓存动画A第二季的视频。
针对第一搜索结果902,终端还可以展示其对应的推荐结果904,推荐结果904包括目标推荐视频9041和相应的推荐理由9042。用户可以点击目标推荐视频9041中任意的视频来进行视频播放。用户可以点击推荐理由9042中任意的推荐理由来进一步展示补充推荐视频。例如,若用户点击推荐理由“同导演”,则如图9B所示,展示动画A第二季的导演甲的相关作品。进一步的,用户点击图9B中的“返回”控件908可以从图9B返回展示图9A。
在一个实施例中,基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源,包括:
计算召回资源特征分别和候选资源库中各个候选资源对应的候选资源特征之间的特征相似度;基于特征相似度,从各个候选资源中确定匹配资源,将匹配资源作为目标推荐资源。
其中,候选资源特征是指候选资源对应的资源特征。特征相似度用于表征不同资源特征之间的相似程度。特征相似度越大,表明不同资源特征之间越相似。可以采用各种相似度计算算法来计算资源特征之间的特征相似度,例如,可以计算余弦距离或欧式距离等表示资源特征之间距离的数据作为特征相似度;计算资源特征之间的交集元素和并集元素的比值作为特征相似度;等等。
具体地,计算召回资源特征分别和候选资源库中各个候选资源对应的候选资源特征之间的特征相似度;基于特征相似度,从各个候选资源中确定匹配资源,将匹配资源作为目标推荐资源。
在基于召回资源特征确定匹配资源时,计算机设备可以获取候选资源库中各个候选资源分别对应的候选资源特征,计算召回资源特征分别和各个候选资源特征之间的特征相似度。特征相似度可以反映特征之间的匹配程度,反映候选资源和当前召回资源的匹配程度,因此,可以基于各个特征相似度从各个候选资源中确定匹配资源。例如,将各个候选资源按照特征相似度从大到小排列,获取排序靠前的若干个候选资源分别作为匹配资源;获取特征相似度大于相似度阈值的候选资源作为匹配资源;等等。最终,将确定的匹配资源作为当前召回资源对应的目标推荐资源。
上述实施例中,基于候选资源对应的候选资源特征和当前召回资源对应的召回资源特征之间的特征相似度,从候选资源库中,可以快速确定准确的匹配资源,快速得到准确的目标推荐资源。
在一个具体的实施例中,本申请的资源处理方法和资源推荐方法可以应用于视频应用中的相似视频推荐模块。相似视频推荐模块用于推荐某个视频的相似视频。例如,相似视频推荐模块可以是精品视频推荐模块。精品视频推荐是指根据搜索语句(query)的首个精品视频搜索结果(即当前召回资源),推荐与之相关的精品视频(即目标推荐资源),并给出推荐理由,甚至给出推荐理由聚合结果(即补充推荐视频)。具体地,在视频应用中用户搜索某个电影,根据首条精品视频搜索结果推荐与该搜索结果相似的精品视频,同时给出相似视频的推荐理由,用户点击推荐理由又可以触发展示推荐理由的聚合结果。
本申请方法通过对用户的行为建模组成行为共现图,并对行为共现图进行图的同质性矫正,从而消除头部视频的马太效应,进而得到真实用户意图,进而进行相似推荐。
本申请方法可以由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图10,本申请方法包括以下步骤:
1、用户点击序列获取
获取近90天用户在视频应用中的消费视频记录,基于消费视频记录确定用户点击序列。其中,消费视频记录包括用户近90天内消费的视频,消费的视频具体是指被用户点击播放的视频。需要获取多个用户分别对应的用户点击序列来构建行为共现图。
2、行为共现图构建
同一个用户在90天内消费的两个视频记为一次共现。统计各个用户点击序列中每一对视频的共现频次,将一对视频作为行为共现图中相连的两个节点,将共现频次作为连边的权重,进而得到行为共现图。
3、基于互转移概率剪枝
计算行为共现图中每对节点分别对应的互转移概率,将互转移概率小于转移概率阈值的连边进行剪枝。
4、元路径游走
在剪枝后的行为共现图中,通过统计视频在用户点击序列中的出现频次来筛选出热点节点。通过设置元路径的方法控制对热点节点的选择频率,基于元路径在剪枝后的行为共现图中进行随机游走,得到多个节点游走路径。
5、向量表示确定
基于节点游走路径对应的视频介绍信息序列,通过word2vec方法训练word2vec模型,基于word2vec模型得到每个视频的视频介绍信息对应的向量表示,将视频介绍信息对应的向量表示作为视频对应的向量表示,进而得到每个视频对应的向量表示。
在推荐与首个精品视频搜索结果相关的精品视频时,基于首个精品视频搜索结果对应的向量表示和候选视频对应的向量表示之间的向量相似度,从候选视频中确定与首个精品视频搜索结果相关的精品视频。
进一步的,将本申请方法在线上进行测试,在同样用户流量的情况下,本申请方法相较于传统方法,相似视频推荐模块的有效点击率提升了4%
上述实施例中,本申请方法提出了互转移概率,互转移概率可以修正行为共现图中节点之间的同质性,避免行为共现图中的热点节点破坏图的同质性导致结果不置信,可以有效消除推荐任务中常见的马太效应。并且,通过设置元路径的方法可以有效改善热点节点在节点游走路径中的频率,去除热点分布的影响,降低热点节点间的同质化影响,使相似度结果更加平稳。
可以理解,除了应用于视频推荐,本申请方法还可以应用于其他类型资源的推荐,例如,文本推荐、音乐推荐等。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的资源处理方法的资源处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源处理装置实施例中的具体限定可以参见上文中对于资源处理方法的限定,在此不再赘述。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的资源推荐方法的资源推荐装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个资源推荐装置实施例中的具体限定可以参见上文中对于资源推荐方法的限定,在此不再赘述。
在一个实施例中,如图11所示,提供了一种资源处理装置,包括:资源共现图获取模块1102、单向转移度确定模块1104、互转移度确定模块1106、资源共现图调整模块1108和资源特征提取模块1110,其中:
资源共现图获取模块1102,用于获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息。
单向转移度确定模块1104,用于基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度。
互转移度确定模块1106,用于融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度。
资源共现图调整模块1108,用于基于互转移度对初始资源共现图进行调整,得到目标资源共现图。
资源特征提取模块1110,用于基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;资源特征用于进行资源推荐。
上述资源处理装置,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点的同质性,避免因初始资源共现图中的热点节点破坏节点之间的同质性而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。
在一个实施例中,资源共现图获取模块1102还用于:
获取至少两个待推荐对象分别对应的已交互资源序列;将同一已交互资源序列中的已交互资源进行组合,得到多个已交互资源对;将已交互资源对中的已交互资源作为资源节点,得到资源节点对;统计各个已交互资源对在不同已交互资源序列中的共现次数,得到各个已交互资源对分别对应的节点对关联信息;基于节点对关联信息连接已交互资源对所对应的资源节点,得到初始资源共现图。
在一个实施例中,单向转移度确定模块1104还用于:
从当前资源节点对中确定目标资源节点;对目标资源节点所属各个资源节点对分别对应的节点对关联信息进行累积,得到累积关联信息;基于当前资源节点对所对应的节点对关联信息和累积关联信息的比值,得到目标资源节点在当前资源节点对中对应的单向转移度。
在一个实施例中,资源共现图调整模块1108还用于:
从初始资源共现图中,将互转移度小于转移度阈值的资源节点对进行剪枝,得到目标资源共现图。
在一个实施例中,资源特征提取模块1110还用于:
将目标资源共现图中的资源节点划分为非热点类节点和热点类节点;获取至少一个节点路径模式;节点路径模式是对非热点类节点标签和热点类节点标签进行排列得到的路径模式;基于节点路径模式,在目标资源共现图中进行随机游走,得到各个节点路径模式分别对应的至少一个节点游走路径;基于节点游走路径进行特征提取,得到节点游走路径途经的资源节点所对应的已交互资源的资源特征。
在一个实施例中,资源特征提取模块1110还用于:
统计目标资源共现图中的资源节点在各个已交互资源序列中的出现次数,将出现次数大于出现阈值的资源节点作为热点类节点,将出现次数小于或等于出现阈值的资源节点作为非热点类节点。
在一个实施例中,资源特征提取模块1110还用于:
基于资源节点对应的节点类型,从目标资源共现图中,获取与当前节点路径模式中的节点标签对匹配的资源节点对,得到各个节点标签对分别对应的资源节点对;节点标签对包括当前节点路径模式中相邻的节点标签;按照节点标签对在当前节点路径模式中的排序,将对应的各个资源节点对进行排列,得到当前节点路径模式对应的节点游走路径。
在一个实施例中,资源特征提取模块1110还用于:
获取节点游走路径对应的各个已交互资源的资源介绍信息,组成节点游走路径对应的资源介绍信息序列;基于资源介绍信息序列训练初始文本特征提取模型,得到目标文本特征提取模型;基于目标文本特征提取模型确定资源介绍信息对应的文本特征,将资源介绍信息对应的文本特征作为资源介绍信息所属已交互资源对应的资源特征。
在一个实施例中,如图12所示,提供了一种资源推荐装置,包括:召回资源特征获取模块1202和目标推荐资源确定模块1204,其中:
召回资源特征获取模块1202,用于获取当前搜索语句对应的当前召回资源的召回资源特征。
目标推荐资源确定模块1204,用于基于召回资源特征,从候选资源库中获取对应的匹配资源作为当前召回资源对应的目标推荐资源。
其中,当前召回资源为已交互资源,已交互资源对应的资源特征的提取过程包括以下步骤:
获取初始资源共现图;初始资源共现图包括资源节点对和对应的节点对关联信息,资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;基于互转移度对初始资源共现图进行调整,得到目标资源共现图;基于目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
上述资源推荐装置,单向转移度用于表征资源节点对中的资源节点之间单向转移的可能性,互转移度用于表征资源节点对中的资源节点之间互相转移的可能性,基于互转移度对初始资源共现图进行调整,可以修正初始资源共现图中节点的同质性,避免因初始资源共现图中的热点节点破坏节点之间的同质性而导致初始资源共现图反映的信息不准确,调整得到的目标资源共现图可以反映大量待推荐对象的真实意图,基于目标资源共现图进行资源特征提取,可以提取到更准确的资源特征,基于提取得到的资源特征进行资源推荐,可以有效提高资源推荐的准确性、可靠性、有效性。在进行资源推荐时,基于当前搜索语句对应的当前召回资源的召回资源特征,从候选资源库中可以准确获取与当前召回资源匹配的候选资源作为当前召回资源对应的目标推荐资源,将目标推荐资源推荐给当前搜索语句对应的待推荐对象可以有效提高资源推荐的准确性、可靠性、有效性。
在一个实施例中,资源推荐装置还包括:
资源展示模块,用于响应于针对当前搜索语句的搜索操作,展示当前召回资源和当前召回资源对应的目标推荐资源,展示目标推荐资源对应的推荐理由;推荐理由是基于当前召回资源和目标推荐资源之间的共同资源信息确定的;响应于针对推荐理由的触发操作,展示与推荐理由相关的至少一个补充推荐资源。
在一个实施例中,目标推荐资源确定模块1204还用于:
计算召回资源特征分别和候选资源库中各个候选资源对应的候选资源特征之间的特征相似度;基于特征相似度,从各个候选资源中确定匹配资源,将匹配资源作为目标推荐资源。
上述资源处理装置和资源推荐装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储候选资源库、资源特征等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种资源处理方法和资源推荐方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种资源处理方法和资源推荐方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置,显示屏可以是液晶显示屏或电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13、14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (16)
1.一种资源处理方法,其特征在于,所述方法包括:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;所述资源特征用于进行资源推荐。
2.根据权利要求1所述的方法,其特征在于,所述获取初始资源共现图,包括:
获取至少两个待推荐对象分别对应的已交互资源序列;
将同一已交互资源序列中的已交互资源进行组合,得到多个已交互资源对;
将所述已交互资源对中的已交互资源作为资源节点,得到资源节点对;
统计各个已交互资源对在不同已交互资源序列中的共现次数,得到所述各个已交互资源对分别对应的节点对关联信息;
基于节点对关联信息连接已交互资源对所对应的资源节点,得到所述初始资源共现图。
3.根据权利要求1所述的方法,其特征在于,所述基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度,包括:
从当前资源节点对中确定目标资源节点;
对所述目标资源节点所属各个资源节点对分别对应的节点对关联信息进行累积,得到累积关联信息;
基于当前资源节点对所对应的节点对关联信息和所述累积关联信息的比值,得到所述目标资源节点在所述当前资源节点对中对应的单向转移度。
4.根据权利要求1所述的方法,其特征在于,所述基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图,包括:
从所述初始资源共现图中,将互转移度小于转移度阈值的资源节点对进行剪枝,得到所述目标资源共现图。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征,包括:
将所述目标资源共现图中的资源节点划分为非热点类节点和热点类节点;
获取至少一个节点路径模式;所述节点路径模式是对非热点类节点标签和热点类节点标签进行排列得到的路径模式;
基于所述节点路径模式,在所述目标资源共现图中进行随机游走,得到各个节点路径模式分别对应的至少一个节点游走路径;
基于所述节点游走路径进行特征提取,得到所述节点游走路径途经的资源节点所对应的已交互资源的资源特征。
6.根据权利要求5所述的方法,其特征在于,所述将所述目标资源共现图中的资源节点划分为非热点类节点和热点类节点,包括:
统计所述目标资源共现图中的资源节点在各个已交互资源序列中的出现次数,将出现次数大于出现阈值的资源节点作为热点类节点,将出现次数小于或等于出现阈值的资源节点作为非热点类节点。
7.根据权利要求5所述的方法,其特征在于,所述基于所述节点路径模式,在所述目标资源共现图中进行随机游走,得到各个节点路径模式分别对应的至少一个节点游走路径,包括:
基于资源节点对应的节点类型,从所述目标资源共现图中,获取与当前节点路径模式中的节点标签对匹配的资源节点对,得到各个节点标签对分别对应的资源节点对;所述节点标签对包括所述当前节点路径模式中相邻的节点标签;
按照节点标签对在所述当前节点路径模式中的排序,将对应的各个资源节点对进行排列,得到所述当前节点路径模式对应的节点游走路径。
8.根据权利要求5所述的方法,其特征在于,所述基于所述节点游走路径进行特征提取,得到所述节点游走路径途经的资源节点所对应的已交互资源的资源特征,包括:
获取所述节点游走路径对应的各个已交互资源的资源介绍信息,组成所述节点游走路径对应的资源介绍信息序列;
基于所述资源介绍信息序列训练初始文本特征提取模型,得到目标文本特征提取模型;
基于所述目标文本特征提取模型确定资源介绍信息对应的文本特征,将资源介绍信息对应的文本特征作为资源介绍信息所属已交互资源对应的资源特征。
9.一种资源推荐方法,其特征在于,所述方法包括:
获取当前搜索语句对应的当前召回资源的召回资源特征;
基于所述召回资源特征,从候选资源库中获取对应的匹配资源作为所述当前召回资源对应的目标推荐资源;
其中,所述当前召回资源为已交互资源,所述已交互资源对应的资源特征的提取过程包括以下步骤:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
10.根据权利要求9所述的方法,其特征在于,所述方法还包括:
响应于针对所述当前搜索语句的搜索操作,展示所述当前召回资源和所述当前召回资源对应的目标推荐资源,展示所述目标推荐资源对应的推荐理由;所述推荐理由是基于所述当前召回资源和所述目标推荐资源之间的共同资源信息确定的;
响应于针对所述推荐理由的触发操作,展示与所述推荐理由相关的至少一个补充推荐资源。
11.根据权利要求9所述的方法,其特征在于,所述基于所述召回资源特征,从候选资源库中获取对应的匹配资源作为所述当前召回资源对应的目标推荐资源,包括:
计算所述召回资源特征分别和所述候选资源库中各个候选资源对应的候选资源特征之间的特征相似度;
基于所述特征相似度,从各个候选资源中确定匹配资源,将所述匹配资源作为所述目标推荐资源。
12.一种资源处理装置,其特征在于,所述装置包括:
资源共现图获取模块,用于获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
单向转移度确定模块,用于基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
互转移度确定模块,用于融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
资源共现图调整模块,用于基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
资源特征提取模块,用于基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征;所述资源特征用于进行资源推荐。
13.一种资源推荐装置,其特征在于,所述装置包括:
召回资源特征获取模块,用于获取当前搜索语句对应的当前召回资源的召回资源特征;
目标推荐资源确定模块,用于基于所述召回资源特征,从候选资源库中获取对应的匹配资源作为所述当前召回资源对应的目标推荐资源;
其中,所述当前召回资源为已交互资源,所述已交互资源对应的资源特征的提取过程包括以下步骤:
获取初始资源共现图;所述初始资源共现图包括资源节点对和对应的节点对关联信息,所述资源节点对是从同一个待推荐对象对应的已交互资源序列中组合已交互资源得到的,所述节点对关联信息用于表征资源节点对在不同已交互资源序列中的共现信息;
基于节点对关联信息得到资源节点在资源节点对中对应的单向转移度;
融合同一资源节点对中各个资源节点在资源节点对中对应的单向转移度,得到各个资源节点对分别对应的互转移度;
基于互转移度对所述初始资源共现图进行调整,得到目标资源共现图;
基于所述目标资源共现图,对相应的已交互资源进行资源特征提取,得到各个已交互资源分别对应的资源特征。
14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
16.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211524162.6A CN116975359A (zh) | 2022-12-01 | 2022-12-01 | 资源处理方法、资源推荐方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211524162.6A CN116975359A (zh) | 2022-12-01 | 2022-12-01 | 资源处理方法、资源推荐方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116975359A true CN116975359A (zh) | 2023-10-31 |
Family
ID=88471935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211524162.6A Pending CN116975359A (zh) | 2022-12-01 | 2022-12-01 | 资源处理方法、资源推荐方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116975359A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117148705A (zh) * | 2023-11-01 | 2023-12-01 | 博纯材料股份有限公司 | 基于数据监控分析的设备运行状态检测方法及系统 |
-
2022
- 2022-12-01 CN CN202211524162.6A patent/CN116975359A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117148705A (zh) * | 2023-11-01 | 2023-12-01 | 博纯材料股份有限公司 | 基于数据监控分析的设备运行状态检测方法及系统 |
CN117148705B (zh) * | 2023-11-01 | 2024-01-16 | 博纯材料股份有限公司 | 基于数据监控分析的设备运行状态检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2020207196A1 (zh) | 用户标签生成方法、装置、存储介质和计算机设备 | |
US10102277B2 (en) | Bayesian visual interactive search | |
CN111680219B (zh) | 内容推荐方法、装置、设备及可读存储介质 | |
CN107609152B (zh) | 用于扩展查询式的方法和装置 | |
CN110909182B (zh) | 多媒体资源搜索方法、装置、计算机设备及存储介质 | |
US10606883B2 (en) | Selection of initial document collection for visual interactive search | |
Qian et al. | Social media based event summarization by user–text–image co-clustering | |
CN112364204B (zh) | 视频搜索方法、装置、计算机设备及存储介质 | |
TW201606537A (zh) | 視覺交互搜尋 | |
CN111782947A (zh) | 一种搜索内容展示方法、装置、电子设备及存储介质 | |
CN112749330B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN110264277B (zh) | 由计算设备执行的数据处理方法及装置、介质和计算设备 | |
TWI525460B (zh) | 電子計算裝置、其個人化資訊推薦方法及其電腦程式產品 | |
CN116975359A (zh) | 资源处理方法、资源推荐方法、装置和计算机设备 | |
Lu et al. | Multi-trends enhanced dynamic micro-video recommendation | |
US20240028997A1 (en) | Method and System for Automatically Managing and Displaying a Visual Representation of Workflow Information | |
CN114330704A (zh) | 语句生成模型更新方法、装置、计算机设备和存储介质 | |
CN114168804B (zh) | 一种基于异质子图神经网络的相似信息检索方法和系统 | |
CN114996490A (zh) | 电影推荐方法、系统、存储介质及设备 | |
CN113010769A (zh) | 基于知识图谱的物品推荐方法、装置、电子设备及介质 | |
CN115118616B (zh) | 展示结果测试方法、装置、计算机设备和存储介质 | |
CN116703531B (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
CN112000888B (zh) | 信息推送方法、装置、服务器及存储介质 | |
CN113676505B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN116578767A (zh) | 语义数据处理、内容推荐方法、装置和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |