CN110413896A - 网络信息推送方法、装置、计算机设备及存储介质 - Google Patents
网络信息推送方法、装置、计算机设备及存储介质 Download PDFInfo
- Publication number
- CN110413896A CN110413896A CN201910492044.3A CN201910492044A CN110413896A CN 110413896 A CN110413896 A CN 110413896A CN 201910492044 A CN201910492044 A CN 201910492044A CN 110413896 A CN110413896 A CN 110413896A
- Authority
- CN
- China
- Prior art keywords
- user
- network information
- network
- information
- ranking
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003860 storage Methods 0.000 title claims abstract description 27
- 238000005070 sampling Methods 0.000 claims description 42
- 230000009471 action Effects 0.000 claims description 18
- 230000008569 process Effects 0.000 claims description 13
- 230000015654 memory Effects 0.000 claims description 12
- 230000006399 behavior Effects 0.000 claims description 5
- 230000000694 effects Effects 0.000 abstract description 11
- 230000000875 corresponding effect Effects 0.000 description 43
- 238000012545 processing Methods 0.000 description 29
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 238000004891 communication Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 238000001914 filtration Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 4
- 238000010396 two-hybrid screening Methods 0.000 description 4
- 230000000630 rising effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000003813 thumb Anatomy 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 210000003811 finger Anatomy 0.000 description 1
- 210000003127 knee Anatomy 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 239000004984 smart glass Substances 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000011800 void material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9536—Search customisation based on social or collaborative filtering
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请是关于一种网络信息推送方法、装置、计算机设备及存储介质。该方法包括:获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;根据所述加权网络图获取所述各个用户的网络信息排名;根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。由于根据各个用户对各个网络信息执行的操作构建的加权网络图能够体现用户与网络信息之间的相对距离,通过该加权网络图获取的网络排名信息能够准确的体现出用户与网络信息之间的匹配程度,后续根据该网络信息排名进行信息推送时,能够达到提高网络信息推送的准确性的效果。
Description
技术领域
本申请实施例涉及网络信息服务技术领域,特别涉及一种网络信息推送方法、装置、计算机设备及存储介质。
背景技术
随着网络和计算机技术的不断发展,越来越多的用户通过网络浏览新闻等网络信息。相应的,为了提高用户浏览网络信息的体验,网络信息服务商可以有针对性的向用户推送网络信息。
在相关技术中,常用的网络信息推荐方法是协同过滤,包括基于网络信息的协同过滤和基于用户的协同过滤。其中,基于网络信息的协同过滤是指当用户点击某个网络信息后,服务器可以向该用户推荐类似的其它网络信息;而基于用户的协同过滤是指对于兴趣相似的两个用户,当一个用户点击某个网络信息后,服务器可以将该网络信息推荐给另一个用户。
然而,相关技术所示的方案只考虑了网络信息之间的相似性或者用户之间的相似性,影响新闻推荐的因素较为单一,导致网络信息的推荐准确性不高。
发明内容
本申请实施例提供了一种网络信息推送方法、装置、计算机设备及存储介质,可以提高网络信息推荐的准确性,该技术方案如下:
一方面,提供了一种网络信息推送方法,所述方法包括:
获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;
根据所述加权网络图获取所述各个用户的网络信息排名,所述网络信息排名指示所述各个网络信息中的部分或者全部信息与对应用户之间的匹配关系;
根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。
另一方面,提供了一种网络信息推送装置,所述装置包括:
网络图获取模块,用于获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;
排名获取模块,用于根据所述加权网络图获取所述各个用户的网络信息排名,所述网络信息排名指示所述各个网络信息中的部分或者全部信息与对应用户之间的匹配关系;
推送模块,用于根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。
在一种可能的实现方案中,所述加权网络图是包含所述各个用户各自的用户节点,以及所述各个网络信息各自的网络信息节点的二部混合加权网络图;
所述加权网络图中的第一用户节点和第一网络信息节点之间的边的权重用于指示第一用户对第一网络信息执行的操作;所述第一用户是所述第一用户节点对应的用户,所述第一网络信息是所述第一网络信息节点对应的网络信息。
在一种可能的实现方案中,所述网络图获取模块,用于,
获取指定时间段内的各条用户操作记录,所述用户操作记录包括单个用户对单个网络信息的单次浏览过程中产生的操作信息,所述操作信息包括浏览时长和操作类型中的至少一项;
根据所述各条用户操作记录生成所述加权网络图。
在一种可能的实现方案中,所述装置还包括:
采样模块,用于在所述网络图获取模块根据所述各条用户操作记录生成所述加权网络图之前,对所述各条用户操作记录进行采样,获得采样操作记录;
所述网络图获取模块,用于,
根据所述采样操作记录生成所述加权网络图。
在一种可能的实现方案中,所述采样模块,用于,
当第二用户在所述指定时间段内浏览的网络信息的数量大于N时,从所述各条用户操作记录中采样出所述第二用户浏览N条网络信息的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二用户是所述各个用户中的任一用户,N为大于或者等于1的整数。
在一种可能的实现方案中,所述采样模块,用于,
当第二网络信息在所述指定时间段内被浏览的次数大于M时,从所述各条用户操作记录中采样出所述第二网络信息被浏览M次的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二网络信息是所述各个网络信息中的任一网络信息,M为大于或者等于1的整数。
在一种可能的实现方案中,所述装置还包括:
平滑处理模块,用于当所述操作信息包括浏览时长时,在所述网络图获取模块根据所述各条用户操作记录生成所述加权网络图之前,对所述各条用户操作记录中的浏览时长进行平滑处理。
在一种可能的实现方案中,所述排名获取模块,用于,
获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,所述第三用户是所述各个用户中的任一用户;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块,还用于,获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离之前,
对所述二部混合加权网络图中的各个节点进行聚类,获得至少一个聚类社区;
所述排名获取模块,用于在获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离时,
获取第三用户在所述二部混合加权网络图中与各个同社区信息之间的距离;所述同社区信息是与所述第三用户处于同一社区内的网络信息;
所述排名获取模块,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
根据所述第三用户在所述二部混合加权网络图中与所述各个同社区信息之间的距离,对所述各个同社区信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
获取辅助排名信息,所述辅助排名信息包括所述各个网络信息的重要性得分、所述各个网络信息的热度信息以及所述第三用户的用户画像中的至少一项;所述重要性得分用于指示对应的网络信息在所述二部混合加权网络图中的重要性,所述热度信息用于指示对应的网络信息在网络中的热门程度;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
对所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息进行加权求和,获得所述各个网络信息相对于所述第三用户的排名分值;
按照排名分值从大到小的顺序对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述装置还包括:
候选信息获取模块,用于在推送模块根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息之前,
根据所述目标用户的网络信息排名,从所述目标用户的终端上未曝光过的网络信息中获取n个候选网络信息,n为大于或者等于1的整数;
所述推送模块,用于向所述目标用户的终端推送所述n个候选网络信息中的至少一个网络信息。
另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的网络信息推送方法。
另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的网络信息推送方法。
本申请提供的技术方案可以包括以下有益效果:
通过指示各个用户对各个网络信息执行的操作的加权网络图获取各个用户的网络信息排名,并根据网络信息排名进行网络信息的推送。由于根据各个用户对各个网络信息执行的操作构建的加权网络图能够体现用户与网络信息之间的相对距离,通过该加权网络图获取的网络排名信息能够准确的体现出用户与网络信息之间的匹配程度,后续根据该网络信息排名进行信息推送时,能够达到提高网络信息推送的准确性的效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
图1是本申请各个实施例涉及的一种网络信息推送系统的系统构成图;
图2是根据一示例性实施例示出的一种网络信息推送方法的流程图;
图3是根据一示例性实施例示出的一种网络信息推送方法的流程图;
图4是图3所示实施例涉及的一种用户-新闻网络图的构建流程示意图;
图5是根据一示例性实施例示出的一种新闻推荐流程示意图;
图6是根据一示例性实施例示出的网络信息推送装置的结构方框图;
图7是根据一示例性实施例示出的一种计算机设备的结构示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
本申请实施例提出了一种高效并且高准确率的自编码器学习方案,该方案能够通过对用于训练的初始数据进行处理,使得后续训练出的编码器从数据中学习到的表征效果更好。为了便于理解,下面对本申请涉及的几个名词进行解释。
1)网络信息
在本申请中,网络信息是指通过网络传播的各类信息,比如,网络信息可以是通过网络传播的新闻、广告、音频、视频以及购物链接等。
2)网络图和二部混合网络图
在本申请中,网络图是指由节点实体和边关系构成的网状图。其中,网络图按照节点之间的边是否有方向可以分为有向网络图和无向网络图;此外,网络图按照节点之间的边是否有权重可以分为加权网络图和无权网络图。
其中,由两种不同类型的节点实体,以及节点实体之间的变关系构成的网络图可以称为二部混合网络图。
3)网络社区
在本申请中,网络社区是指根据网络中各个用户的行为、属性以及兴趣等信息而聚类形成的真实团体。
4)Louvain
Louvain是一种现有的基于层次聚类和模块度的图社区发现算法。
5)PageRank
PageRank是一种根据网络信息(比如网页)之间的相互超链接关系计算网络信息排名的算法。
6)节点距离
在本申请中,网络图中两个节点之间的最短路径长度可以称为这两个节点之间的节点距离。对于无权网络图而言,两个节点之间的路径长度可以是两个节点之间的跳数;对于加权网络图而言,两个节点之间的路径长度可以是两个节点之间的边的加权求和的值。
7)Spark GraphX
Spark GraphX是一个分布式图处理框架,GraphX基于Spark分布式计算平台提供丰富的图挖掘和图计算功能。
8)用户画像
在本申请中,用户画像是指根据用户的属性以及历史行为等信息刻画出来的,多维度表示用户行为习惯属性的描述数据。
9)网络信息热度
在本申请中,网络信息热度是根据新闻在过去一段时间内的曝光增量、点击增量和评论增量计算出的网络信息上升热度值。
10)Redis
Redis是一种基于内存的键值对存储数据库。
请参考图1,其示出了本申请各个实施例涉及的一种网络信息推送系统的系统构成图。如图1所示,该系统包括服务器120、数据库140以及若干个终端160。
服务器120是一台服务器,或者由若干台服务器,或者是一个虚拟化平台,或者是一个云计算服务中心。
服务器120可以由一个或多个功能单元组成。可选的,如图1所示,服务器120可以包括操作数据采集单元120a、网络图处理单元120b以及推送单元120c。
操作数据采集单元120a用于采集用户在终端中对各个网络信息的操作数据,包含操作类型以及浏览时长等。
网络图处理单元120b用于根据各个用户的操作数据构建网络图,并根据构建的网络图进行后续处理,比如对网络信息进行排名等。
推送单元120c用于根据网络图处理单元120b的处理结果向各个用户进行有针对性的推送。
上述数据库140可以是Redis数据库,或者,也可以是其它类型数据库。其中,数据库140用于存储各类数据,比如,各个网络信息、操作数据采集单元120a采集到的操作数据以及网络图处理单元120b的处理结果等等。
比如,操作数据采集单元120a采集到各个终端上传的操作数据后,将操作数据存储至数据库140,网络图处理单元120b定期从数据库140中提取操作数据,根据提取的操作数据更新网络图及其处理结果,并将更新的处理结果存储至数据库140,推送单元120c向用户推送网络信息时,从数据库140提取最新更新的处理结果,并根据提取的处理结果进行网络信息推送。
终端160可以是具有网络连接功能以及界面展示功能的终端设备,比如,终端160可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、MP3播放器(Moving PictureExperts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(MovingPicture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。
终端160与服务器120之间通过通信网络相连。可选的,该通信网络是有线网络或无线网络。
可选的,该系统还可以包括管理设备(图1未示出),该管理设备与服务器120之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。
可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(Local Area Network,LAN)、城域网(Metropolitan Area Network,MAN)、广域网(Wide Area Network,WAN)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(Hyper Text Mark-up Language,HTML)、可扩展标记语言(Extensible MarkupLanguage,XML)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(Secure Socket Layer,SSL)、传输层安全(Transport Layer Security,TLS)、虚拟专用网络(Virtual Private Network,VPN)、网际协议安全(Internet ProtocolSecurity,IPsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。
图2是根据一示例性实施例示出的一种网络信息推送方法的流程图,该网络信息推送方法可以用于计算机设备,比如上述图1所示系统的服务器中。如图2所示,该网络信息推送方法可以包括如下步骤:
步骤21,获取加权网络图,该加权网络图用于指示各个用户对各个网络信息执行的操作。
步骤22,根据该加权网络图获取各个用户的网络信息排名,该网络信息排名指示各个网络信息中的部分或者全部信息与对应用户之间的匹配关系。
步骤23,根据目标用户的网络信息排名,向该目标用户的终端推送网络信息;该目标用户是上述各个用户中的任一用户。
综上所述,本申请实施例所示的方案,通过指示各个用户对各个网络信息执行的操作的加权网络图获取各个用户的网络信息排名,并根据网络信息排名进行网络信息的推送。由于根据各个用户对各个网络信息执行的操作构建的加权网络图能够体现用户与网络信息之间的相对距离,通过该加权网络图获取的网络排名信息能够准确的体现出用户与网络信息之间的匹配程度,后续根据该网络信息排名进行信息推送时,能够达到提高网络信息推送的准确性的效果。
在上述图2所示的方案中,上述加权网络图可以是包含用户节点和网络信息节点这两种类型节点的二部混合加权网络图。计算机设备(比如服务器)在执行上述图2所示的方案时,可以周期性的获取新的加权网络图并更新网络信息排名。
图3是根据一示例性实施例示出的一种网络信息推送方法的流程图,该网络信息推送方法可以用于计算机设备中。如图3所示,以该计算机设备是上述图1所示系统的服务器为例,该网络信息推送方法可以包括如下步骤:
步骤301,获取指定时间段内的各条用户操作记录,该用户操作记录包括单个用户对单个网络信息的单次浏览过程中产生的操作信息。
其中,该操作信息包括浏览时长和操作类型中的至少一项。
上述指定时间段可以是当前时间之前的一段指定长度时间段。比如,指定时间段可以是当前时间之前的一个星期(7天)。
在一种可能的实现方式中,终端向用户展示一个网络信息的入口(比如网络信息的链接)后,若用户通过该网络信息的入口浏览该网络信息,则终端会根据用户本次对该网络信息的浏览操作,生成一条或者多条用户操作数据,并将该一条或者多条用户操作数据上传给服务器,服务器可以根据该一条或者多条用户操作数据生成一条用户操作记录,以指示该用户对该网络信息的单次浏览过程。
其中,上述操作信息可以包括浏览时长(比如60s),也可以包括用户对该网络信息执行的各个操作的操作类型,比如,点赞、评论、转发等等。
服务器接收终端上传的用户操作数据并生成用户操作记录后,可以将生成的用户操作记录存储在数据库中。后续每隔一段时间(比如每隔2小时),服务器可以从数据库中提取当前时间之前的指定长度时间段内的各条用户操作记录。
其中,当前时间之前的指定长度时间段内的各条用户操作记录,可以是指用户的操作开始时间或者操作结束时间处于当前时间之前的指定长度时间段内的用户操作记录。或者,上述当前时间之前的指定长度时间段内的各条用户操作记录,也可以是生成时间处于当前时间之前的指定长度时间段内的用户操作记录。
步骤302,根据上述各条用户操作记录生成加权网络图;该加权网络图是包含该各个用户各自的用户节点,以及该各个网络信息各自的网络信息节点的二部混合加权网络图。
其中,该加权网络图中的第一用户节点和第一网络信息节点之间的边的权重用于指示第一用户对第一网络信息执行的操作;该第一用户是该第一用户节点对应的用户,该第一网络信息是该第一网络信息节点对应的网络信息。
在本申请实施例中,在生成加权网络图时,对于上述各条用户操作记录涉及的各个用户以及各个网络信息,服务器可以为每个用户设置一个用户节点,并为每个网络信息生成一个网络信息节点,当某个用户对某个网络信息存在操作记录时,该用户节点和该网络信息之间将存在一条无向的边,这条边的权重也由该用户对该网络信息的操作信息来确定。
比如,假设用户A对网络信息a存在用户操作记录,则在生成的加权网络图中,用户A对应的用户节点与网络信息a对应的网络信息节点之间通过一条边相连。当操作信息包括浏览时长时,这条边的权重可以与浏览时长成正相关,即浏览时长越长,这条边的权重也越高。当操作信息包括操作类型时,这条边的权重可以由该操作类型确定,且不同的操作类型可以对应不同的权重,比如,当操作类型为点赞时,对应的权重为1,当操作类型为评论时,对应的权重为2,当操作类型为转发时,对应的权重为3;当该操作信息中存在多种操作类型时,这条边的权重可以是多种操作类型对应权重中的最高值,也可以是多种操作类型对应权重之和。或者,当操作信息同时包括浏览时长和操作类型时,这条边的权重可以由浏览时长和操作类型综合确定,比如,可以是浏览时长对应权重以及。操作类型对应权重之和。
在一种可能的实现方式中,在根据各条用户操作记录生成该加权网络图之前,服务器还可以对该各条用户操作记录进行采样,获得采样操作记录;在根据该各条用户操作记录生成该加权网络图时,可以根据该采样操作记录生成该加权网络图。
由于网络中的用户的活跃程度可能有较大的差距,比如,某些用户在过去一周内浏览了大量的网络信息(比如浏览器了几千条),而其它用户可能不够活跃,比如,在过去一周内只浏览过几条网络信息。此外,网络中的网络信息的热门程度也不相同,某些网络信息在最近一段时间较为热门时,可能会接收到大量的浏览,比如,热门新闻可能在短时间内被各个用户点击浏览几百万甚至上千万次,而某些不太热门的网络信息可能只会被浏览几百或者几千次。
由于单个用户过多的点击浏览或者单个网络信息过多的被点击浏览,都可能影响后续排名和推送准确性,因此,在本申请实施例中,服务器在生成加权网络图之前,可以首先对各条用户操作记录进行采样,从而对各个用户的浏览次数差异,和/或,各个网络信息的被浏览次数的差异进行抑制,并根据采样得到的用户操作记录生成加权网络图,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
在一种可能的实现方式中,在对该各条用户操作记录进行采样,获得采样操作记录时,当第二用户在该指定时间段内浏览的网络信息的数量大于N时,服务器可以从各条用户操作记录中采样出第二用户浏览N条网络信息的用户操作记录,并将采样得到的用户操作记录添加至该采样操作记录;其中,该第二用户是该各个用户中的任一用户,N为大于或者等于1的整数。
在上述实现方案中,对于在指定时间段内浏览次数过多的用户,服务器可以从该用户的用户操作记录中采样出一定数量的用户操作记录,并将其它用户操作记录剔除。比如,在指定时间段内,假设上述N的数值为100,某用户B对应的用户操作记录有300条,则服务器可以从该用户的300条用户操作记录中采样100条,而该用户的其它200条用户操作记录则剔除。
在一种可能的实现方式中,在对该各条用户操作记录进行采样,获得采样操作记录时,当第二网络信息在该指定时间段内被浏览的次数大于M时,服务器从该各条用户操作记录中采样出该第二网络信息被浏览M次的用户操作记录,并将采样得到的用户操作记录添加至该采样操作记录;其中,该第二网络信息是该各个网络信息中的任一网络信息,M为大于或者等于1的整数。
在上述实现方案中,对于在指定时间段内被浏览次数过多的网络信息,服务器可以从该网络信息对应的用户操作记录中采样出一定数量的用户操作记录,并将其它用户操作记录剔除。比如,在指定时间段内,假设上述M的数值为10万,某网络信息对应的用户操作记录有30万条,则服务器可以从该网络信息对应的30万条用户操作记录中采样10万条,而该网络信息对应的其它20万条用户操作记录则剔除。
其中,上述两种对该各条用户操作记录进行采样的方案可以单独使用,即服务器只通过一种方案进行采样。
此外,上述两种对该各条用户操作记录进行采样的方案也可以一同使用,比如,服务器可以先对单个用户对应的用户操作记录进行采样,再对网络信息对应的用户操作记录进行采样;或者,服务器也可以先对网络信息对应的用户操作记录进行采样,再对单个用户对应的用户操作记录进行采样。
在一种可能的实现方式中,当上述操作信息包括浏览时长时,服务器根据该各条用户操作记录生成该加权网络图之前,还可以对该各条用户操作记录中的浏览时长进行平滑处理。
由于网络中的每条用户操作记录对应的浏览时长的差距可能会很大,比如,对于一条长新闻而言,对该新闻感兴趣的用户浏览该新闻的时长可能会很长,比如,可能会长达十几分钟。而对于一条短新闻而言,对该新闻不太感兴趣的用户浏览该新闻的时长可能会很短,比如可能只有3至5秒钟,如果直接按照浏览时长设置用户节点与网络信息节点之间的边的权重,则可能会导致加权网络图中各条边的权重差距过大,影响后续排名和推送的准确性。
因此,在本申请实施例中,当操作信息包括浏览时长时,服务器可以对各条用户操作记录中的浏览时长进行平滑处理,以对各条用户操作记录中的浏览时长之间的差值进行抑制,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
其中,服务器可以通过log()函数对各条用户操作记录中的浏览时长进行平滑处理,比如,某条用户操作记录中的浏览时长为60s,则平滑处理后的浏览时长为log(60)。
在本申请实施例中,当服务器对该各条用户操作记录进行采样时,服务器可以对采样获得的用户操作记录中的浏览时长进行平滑处理,并根据采样获得的且经过浏览时长的平滑处理的各条用户操作记录,生成上述加权网络图。
例如,在一种实现方案中,以上述网络信息是网络中的新闻为例,在新闻类App中用户点击某条新闻后,系统会将该用户对该新闻的点击和阅读时长数据实时的上报到分布式日志存储平台(对应图1的数据库)中,然后再使用Spark GraphX分布式图计算平台,构建出用户-新闻的网络结构图。
例如,请参考图4,其示出了本申请实施例涉及的一种用户-新闻网络图的构建流程示意图。如图4所示,用户通过终端中的新闻类App浏览新闻时,终端中的新闻类App可以向服务器上报用户点击浏览新闻过程中产生的操作数据(S41)。服务器采集新闻类App上报的操作数据,生成用户操作记录,并存储在分布式日志存储平台(S42)中。服务器定期提取用户操作记录,并通过Spark GraphX分布式图计算平台对用户操作记录进行处理(S43),并获得Spark GraphX分布式图计算平台处理获得的用户-新闻二部混合加权网络图(S44)。
步骤303,根据该加权网络图获取该各个用户的网络信息排名,该网络信息排名指示该各个网络信息中的部分或者全部信息与对应用户之间的匹配关系。
在本申请实施例中,服务器在根据该二部混合加权网络图获取该各个用户各自的网络信息排名时,可以获取第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,该第三用户是该各个用户中的任一用户;并根据该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,对该各个网络信息进行排名,获得该第三用户的网络信息排名。
在本申请实施例中,服务器在根据该加权网络图获取该各个用户的网络信息排名时,可以针对每一个用户,分别获取各个网络信息在加权网络图中与该用户之间的距离,并根据各个网络信息在加权网络图中与该用户之间的距离对各个网络信息进行排名,获得该用户的网络排名信息。由于各个网络信息在加权网络图中与该用户之间的距离能够体现出用户与网络信息之间的加权特征的紧密程度,因此,通过本申请所示的方案,可以准确的提取用户与网络信息之间的匹配程度,能够达到提高网络信息推送的准确性的效果。
在一种可能的实现方案中,在获取第三用户在该二部混合加权网络图中与该各个网络信息之间的距离之前,服务器还可以对该二部混合加权网络图中的各个节点进行聚类,获得至少一个聚类社区。在获取第三用户在该二部混合加权网络图中与该各个网络信息之间的距离时,服务器可以获取第三用户在该二部混合加权网络图中与各个同社区信息之间的距离;该同社区信息是与该第三用户处于同一社区内的网络信息;并且,在根据该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,对该各个网络信息进行排名,获得该第三用户的网络信息排名时,服务器可以根据该第三用户在该二部混合加权网络图中与该各个同社区信息之间的距离,对该各个同社区信息进行排名,获得该第三用户的网络信息排名。
由于加权网络图中的用户与网络信息之间的距离仅表示用户与网络信息之间的特征相关度,为了进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度,在本申请实施例中,服务器还可以对加权网络图中的各个节点进行聚类(比如,通过Louvain算法对加权网络图中的各个节点进行聚类),以将同类的用户和网络信息聚类到同一个社区中,后续在获取某一用户的网络信息排名时,可以根据该用户到同社区内的各个网络信息之间的距离,对与该用户同社区内的各个网络信息进行排名,获得该用户的网络信息排名。通过社区聚类算法,服务器可以将关联关系紧密的用户和网络信息聚类到同一个社区中,后续进行网络信息排名时,在同社区内进行网络信息的排名,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
在一种可能的实现方案中,在根据该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,对该各个网络信息进行排名,获得该第三用户的网络信息排名时,服务器可以获取辅助排名信息,该辅助排名信息包括该各个网络信息的重要性得分、该各个网络信息的热度信息以及该第三用户的用户画像中的至少一项;该重要性得分用于指示对应的网络信息在该二部混合加权网络图中的重要性,该热度信息用于指示对应的网络信息在网络中的热门程度;根据该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,以及该辅助排名信息对该各个网络信息进行排名,获得该第三用户的网络信息排名。
在本申请实施例中,在对网络信息进行排名时,服务器不仅考虑用户与网络信息在加权网络图中的距离,还考虑了网络信息的重要性、热门程度以及网络信息与用户画像的匹配程度等因素,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
在一种可能的实现方式中,在根据该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,以及该辅助排名信息对该各个网络信息进行排名,获得该第三用户的网络信息排名时,服务器可以对该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,以及该辅助排名信息进行加权求和,获得该各个网络信息相对于该第三用户的排名分值;按照排名分值从大到小的顺序对该各个网络信息进行排名,获得该第三用户的网络信息排名。
其中,上述对该第三用户在该二部混合加权网络图中与该各个网络信息之间的距离,以及该辅助排名信息进行加权求和时使用的权重,可以由开发人员或者管理人员预先设置或者调整。
比如,开发人员或者管理人员预先设置用户在二部混合加权网络图中与各个网络信息之间的距离的阈值a,以及辅助排名信息对应的阈值b(其中,当辅助排名信息包括两种或者两种以上信息时,该阈值b可以包括该两种或者两种以上信息各自对应的阈值),在推送应用过程中,管理人员可以根据实际的推送效果(比如用户点击率等)人工调整阈值a和阈值b的数值。
步骤304,根据目标用户的网络信息排名,从目标用户的终端上未曝光过的网络信息中获取n个候选网络信息,n为大于或者等于1的整数;该目标用户是该各个用户中的任一用户。
在本申请实施例中,服务器获取到各个用户分别对应的网络信息排名之后,可以根据各个用户各自对应的网络信息排名,为每个用户挑选未浏览过且匹配程度最高的n个网络信息,作为待推送给各个用户的候选网络信息并存储在数据库中。
步骤305,向该目标用户的终端推送该n个候选网络信息中的至少一个网络信息。
在本申请实施例中,当服务器接收到目标用户的终端发送的信息推送请求,或者,服务器需要主动向目标用户的终端推送网络信息时,可以直接从数据库中存储的,该目标用户的n个候选网络信息提取本次推送的一个或者多个网络信息,并将提取的网络信息推送至目标用户的终端。
其中,在对同一个用户进行多次网络信息推送时,服务器可以按照网络信息的排名分值从高到低的顺序,依次向该用户的终端推送该用户的n个候选网络信息中的一个或者多个网络信息。
综上所述,本申请实施例所示的方案,通过指示各个用户对各个网络信息执行的操作的加权网络图获取各个用户的网络信息排名,并根据网络信息排名进行网络信息的推送。由于根据各个用户对各个网络信息执行的操作构建的加权网络图能够体现用户与网络信息之间的相对距离,通过该加权网络图获取的网络排名信息能够准确的体现出用户与网络信息之间的匹配程度,后续根据该网络信息排名进行信息推送时,能够达到提高网络信息推送的准确性的效果。
此外,本申请实施例所示的方案,服务器在生成加权网络图之前,可以首先对各条用户操作记录进行采样,从而对各个用户的浏览次数差异,和/或,各个网络信息的被浏览次数的差异进行抑制,并根据采样得到的用户操作记录生成加权网络图,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
另外,本申请实施例所示的方案,服务器可以对各条用户操作记录中的浏览时长进行平滑处理,以对各条用户操作记录中的浏览时长之间的差值进行抑制,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
另外,本申请实施例所示的方案,通过社区聚类算法,服务器可以将关联关系紧密的用户和网络信息聚类到同一个社区中,后续进行网络信息排名时,在同社区内进行网络信息的排名,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
此外,在对网络信息进行排名时,服务器不仅考虑用户与网络信息在加权网络图中的距离,还考虑了网络信息的重要性、热门程度以及网络信息与用户画像的匹配程度等因素,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
上述图2或图3所示的方案,可以应用于新闻类第三方应用程序(Application,App)、音频/视频类App以及购物类App的推荐场景中。以应用于新闻类App的推荐系统为例,该系统在线上实时运行时,可以结合用户-新闻形成二部混合加权网络图和新闻本身的质量特征,自动从新闻池中召回用户可能感兴趣的高质量新闻,对整体的点击率(ClickThrough Rate,CTR)和人均页面访问量(Page View,PV)都带来很大提升,提高了个性化新闻推荐系统的整体效果。
图5是根据一示例性实施例示出的一种新闻推荐流程示意图。以上述图2或图3所示的方案应用于某新闻类App的推荐系统为例,请参考图5,本方案在技术侧总体可分为离线阶段和在线阶段这两个阶段。
其中,对于离线阶段,该阶段的实现流程如下:
第一,从分布式日志存储平台(对应图1所示系统中的数据库)收集用户操作记录(S51),并使用Spark GraphX分布式图计算平台,处理该新闻类App最近7天内所有用户的点击新闻和阅读新闻时长数据,构建出用户-新闻二部混合加权网络图(S53)。构建过程如下:
如果用户点击了一篇新闻,那么该用户节点和该新闻节点之间就存在一条边,用户浏览这篇新闻的阅读时长数据作为这条边的权重。这样所形成的网络是一个无向加权图,节点包括用户和新闻两种类型,边是用户对新闻的阅读时长数据。
其中,在构建该用户-新闻无向加权网络图的过程之前或者过程中,还对用户操作记录进行平滑处理和采样处理(S52),该平滑处理和采样处理包括以下两点处理方式:
1)在使用浏览时长数据表示边的权重时,由用户对各个网络信息的浏览时长波动范围较大,因此需要对浏览时长做平滑处理,本方案采用log函数进行平滑计算,例如,如果用户浏览某篇新闻的时间是60s,则平滑后权重为log(60)=1.8s。
2)在构建上述用户-新闻二部混合加权网络图的过程之前或者过程中,为了避免有过多点击的用户和过热的新闻干扰网络图的相关计算,可以对用户和新闻之间的边关系进行采样,采样方法可以如下:
如果某用户过去7天内点击的新闻数大于100篇,则随机采样其中的100篇;如果某新闻过去7天内被点击的次数大于10万,则随机取其中的10万次点击。
经过以上对边的时长权重数据的平滑处理和过多点击用户、过热新闻采样处理之后,即可以得到最终的用户-新闻无向加权网络图。
第二,根据用户-新闻二部混合加权网络结构图、用户画像数据和新闻的索引数据,综合计算用户对应相关新闻的得分。该步骤可以包括如下子步骤:
1)利用Louvain图聚类算法可以计算出网络中的社区,由此可以得到所有用户和所有新闻的社区编号。例如,首先计算出每个用户与其所在社区中所有新闻之间的距离,计作符号D。然后根据PageRank算法计算出网络图中所有节点的PageRank值,计作符号P,这个数值反映的是新闻在整个网络图中的重要性,也反映了新闻本身的内容质量。
2)根据新闻的索引数据,计算出新闻在过去一段时间的曝光增量、点击增量和评论数增量数据,根据贝叶斯和皮尔逊公式可以计算出新闻对应的上升热度评分,其中,H=曝光增量/(曝光增量+平均曝光)*点击增量+平均曝光/(曝光增量+平均曝光)*平均点击。
3)拉取用户的画像信息,计算新闻本身的一级分类、二级分类和tag标签和用户本身画像的相关匹配程度,计作符号M。
其中,上述子步骤1)、2)和3)对应图5中的步骤S54。
4)综合考虑以上四个因素,计算用户与同社区内的新闻之间的得分为score=(a*D+b*P+c*H+d*M),其中参数a、b、c、d可以根据线上结果进行调优。
其中,上述子步骤4)对应图5中的步骤S55。
由于Redis资源有限,在该系统中,以用户的终端id为key,按照该用户和其所在社区的文章score得分降序排列,对用户看过的文章做曝光过滤之后取top100篇新闻作为value,存储到Redis中,供后续线上召回所用。
其中,上述离线流程可以每2小时运行更新一次结果,至此,可以得到了所有用户在网络图中同社区内的top100篇新闻。
在线阶段主要流程如下所示:
用户通过终端进入该新闻类App后,服务器根据用户的终端id从上述Redis中拉取和用户相关的100篇新闻,并依次推荐给用户即可(S56)。相应的,用户点击并浏览该新闻类App中的新闻时,终端向服务器上传用户的操作数据,服务器实时采集用户操作数据,生成相应的用户操作记录并存储至分布式日志存储平台(S57)。
本方案在最终计算时不仅考虑了二部混合网络图中用户-新闻之间的加权距离特征,还综合考虑了新闻本身的重要属性特征,包括新闻在二部混合加权网络中的PageRank值、新闻在过去一段时间内的上升热度、新闻与用户画像的相关性匹配程度。使得在新闻推荐场景中准确率高、具有很好的推荐效果。
本方案以应用于新闻类的推荐系统为例,对用户-新闻建立二部混合加权网络图,通过挖掘网络图中的社区结构并结合新闻本身的重要属性特征,对用户和其同社区内的新闻进行综合得分计算排名。本方案在最终计算时不仅考虑了二部混合网络图中用户-新闻之间的加权距离特征,还综合考虑了新闻本身的重要属性特征,包括新闻在二部混合加权网络中的PageRank值、新闻在过去一段时间内的上升热度、新闻与用户画像的相关性匹配程度。使得在新闻推荐场景中准确率高,对整体的CTR和人均PV都带来很大提升。该系统在线上实时运行,自动从新闻池中召回用户可能感兴趣的新闻,使得整个推荐具有很好的效果。
可选的,上述方案在网络图构建时,除了使用了Spark GraphX分布式图计算平台,也可以使用其他的图计算平台,比如Gephi平台来实现相同的功能。
本方案采用了Louvain社区聚类发现算法来进行社区聚类,此外,还可以使用其他的图聚类算法,比如Kernighan-Lin算法来实现相同的功能。
另外,本方案所采用的综合计算得分公式为score=(a*D+b*P+c*H+d*M),除此之外,也可以采用其他的综合考虑以上四个因素D、P、H、M的类似公式。
此外,本方案以新闻推荐场景为例进行说明,除此之外,本申请上述图2或图3所示的方案也可以应用到其它类型的网络信息的推荐场景,比如音频、视频或者购物链接等推荐场景。
图6是根据一示例性实施例示出的一种网络信息推送装置的结构方框图。该网络信息推送装置可以用于计算机设备,比如服务器中,以执行图2或图3所示实施例中的全部或者部分步骤。该网络信息推送装置可以包括:
网络图获取模块601,用于获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;
排名获取模块602,用于根据所述加权网络图获取所述各个用户的网络信息排名,所述网络信息排名指示所述各个网络信息中的部分或者全部信息与对应用户之间的匹配关系;
推送模块603,用于根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。
在一种可能的实现方案中,所述加权网络图是包含所述各个用户各自的用户节点,以及所述各个网络信息各自的网络信息节点的二部混合加权网络图;
所述加权网络图中的第一用户节点和第一网络信息节点之间的边的权重用于指示第一用户对第一网络信息执行的操作;所述第一用户是所述第一用户节点对应的用户,所述第一网络信息是所述第一网络信息节点对应的网络信息。
在一种可能的实现方案中,所述网络图获取模块601,用于,
获取指定时间段内的各条用户操作记录,所述用户操作记录包括单个用户对单个网络信息的单次浏览过程中产生的操作信息,所述操作信息包括浏览时长和操作类型中的至少一项;
根据所述各条用户操作记录生成所述加权网络图。
在一种可能的实现方案中,所述装置还包括:
采样模块,用于在所述网络图获取模块601根据所述各条用户操作记录生成所述加权网络图之前,对所述各条用户操作记录进行采样,获得采样操作记录;
所述网络图获取模块601,用于,
根据所述采样操作记录生成所述加权网络图。
在一种可能的实现方案中,所述采样模块,用于,
当第二用户在所述指定时间段内浏览的网络信息的数量大于N时,从所述各条用户操作记录中采样出所述第二用户浏览N条网络信息的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二用户是所述各个用户中的任一用户,N为大于或者等于1的整数。
在一种可能的实现方案中,所述采样模块,用于,
当第二网络信息在所述指定时间段内被浏览的次数大于M时,从所述各条用户操作记录中采样出所述第二网络信息被浏览M次的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二网络信息是所述各个网络信息中的任一网络信息,M为大于或者等于1的整数。
在一种可能的实现方案中,所述装置还包括:
平滑处理模块,用于当所述操作信息包括浏览时长时,在所述网络图获取模块601根据所述各条用户操作记录生成所述加权网络图之前,对所述各条用户操作记录中的浏览时长进行平滑处理。
在一种可能的实现方案中,所述排名获取模块602,用于,
获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,所述第三用户是所述各个用户中的任一用户;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块602,还用于,获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离之前,
对所述二部混合加权网络图中的各个节点进行聚类,获得至少一个聚类社区;
所述排名获取模块602,用于在获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离时,
获取第三用户在所述二部混合加权网络图中与各个同社区信息之间的距离;所述同社区信息是与所述第三用户处于同一社区内的网络信息;
所述排名获取模块602,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
根据所述第三用户在所述二部混合加权网络图中与所述各个同社区信息之间的距离,对所述各个同社区信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块602,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
获取辅助排名信息,所述辅助排名信息包括所述各个网络信息的重要性得分、所述各个网络信息的热度信息以及所述第三用户的用户画像中的至少一项;所述重要性得分用于指示对应的网络信息在所述二部混合加权网络图中的重要性,所述热度信息用于指示对应的网络信息在网络中的热门程度;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述排名获取模块602,用于在根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名时,
对所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息进行加权求和,获得所述各个网络信息相对于所述第三用户的排名分值;
按照排名分值从大到小的顺序对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
在一种可能的实现方案中,所述装置还包括:
候选信息获取模块,用于在推送模块603根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息之前,
根据所述目标用户的网络信息排名,从所述目标用户的终端上未曝光过的网络信息中获取n个候选网络信息,n为大于或者等于1的整数;
所述推送模块603,用于向所述目标用户的终端推送所述n个候选网络信息中的至少一个网络信息。
综上所述,在本申请实施例所示的方案中,通过指示各个用户对各个网络信息执行的操作的加权网络图获取各个用户的网络信息排名,并根据网络信息排名进行网络信息的推送。由于根据各个用户对各个网络信息执行的操作构建的加权网络图能够体现用户与网络信息之间的相对距离,通过该加权网络图获取的网络排名信息能够准确的体现出用户与网络信息之间的匹配程度,后续根据该网络信息排名进行信息推送时,能够达到提高网络信息推送的准确性的效果。
此外,本申请实施例所示的方案,服务器在生成加权网络图之前,可以首先对各条用户操作记录进行采样,从而对各个用户的浏览次数差异,和/或,各个网络信息的被浏览次数的差异进行抑制,并根据采样得到的用户操作记录生成加权网络图,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
另外,本申请实施例所示的方案,服务器可以对各条用户操作记录中的浏览时长进行平滑处理,以对各条用户操作记录中的浏览时长之间的差值进行抑制,从而提高后续根据生成的加权网络图进行网络信息的排名和推送的准确性。
另外,本申请实施例所示的方案,通过社区聚类算法,服务器可以将关联关系紧密的用户和网络信息聚类到同一个社区中,后续进行网络信息排名时,在同社区内进行网络信息的排名,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
此外,在对网络信息进行排名时,服务器不仅考虑用户与网络信息在加权网络图中的距离,还考虑了网络信息的重要性、热门程度以及网络信息与用户画像的匹配程度等因素,从而进一步提高网络信息排名所指示的用户与网络信息之间的匹配程度。
图7是根据一示例性实施例示出的一种计算机设备的结构示意图。所述计算机设备700包括中央处理单元(CPU)701、包括随机存取存储器(RAM)702和只读存储器(ROM)703的系统存储器704,以及连接系统存储器704和中央处理单元701的系统总线705。所述计算机设备700还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)706,和用于存储操作系统713、应用程序714和其他程序模块715的大容量存储设备707。
所述基本输入/输出系统706包括有用于显示信息的显示器708和用于用户输入信息的诸如鼠标、键盘之类的输入设备709。其中所述显示器708和输入设备709都通过连接到系统总线705的输入输出控制器710连接到中央处理单元701。所述基本输入/输出系统706还可以包括输入输出控制器710以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器710还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备707通过连接到系统总线705的大容量存储控制器(未示出)连接到中央处理单元701。所述大容量存储设备707及其相关联的计算机可读介质为计算机设备700提供非易失性存储。也就是说,所述大容量存储设备707可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器704和大容量存储设备707可以统称为存储器。
计算机设备700可以通过连接在所述系统总线705上的网络接口单元711连接到互联网或者其它网络设备。
所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,中央处理器701通过执行该一个或一个以上程序来实现图2或图3所示的方法的全部或者部分步骤。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括计算机程序(指令)的存储器,上述程序(指令)可由计算机设备的处理器执行以完成本申请各个实施例所示的方法的全部或者部分步骤。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。
Claims (15)
1.一种网络信息推送方法,其特征在于,所述方法包括:
获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;
根据所述加权网络图获取所述各个用户的网络信息排名,所述网络信息排名指示所述各个网络信息中的部分或者全部信息与对应用户之间的匹配关系;
根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。
2.根据权利要求1所述的方法,其特征在于,所述加权网络图是包含所述各个用户各自的用户节点,以及所述各个网络信息各自的网络信息节点的二部混合加权网络图;
所述加权网络图中的第一用户节点和第一网络信息节点之间的边的权重用于指示第一用户对第一网络信息执行的操作;所述第一用户是所述第一用户节点对应的用户,所述第一网络信息是所述第一网络信息节点对应的网络信息。
3.根据权利要求1或2所述的方法,其特征在于,所述获取加权网络图,包括:
获取指定时间段内的各条用户操作记录,所述用户操作记录包括单个用户对单个网络信息的单次浏览过程中产生的操作信息,所述操作信息包括浏览时长和操作类型中的至少一项;
根据所述各条用户操作记录生成所述加权网络图。
4.根据权利要求3所述的方法,其特征在于,所述根据所述各条用户操作记录生成所述加权网络图之前,还包括:
对所述各条用户操作记录进行采样,获得采样操作记录;
所述根据所述各条用户操作记录生成所述加权网络图,包括:
根据所述采样操作记录生成所述加权网络图。
5.根据权利要求4所述的方法,其特征在于,所述对所述各条用户操作记录进行采样,获得采样操作记录,包括:
当第二用户在所述指定时间段内浏览的网络信息的数量大于N时,从所述各条用户操作记录中采样出所述第二用户浏览N条网络信息的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二用户是所述各个用户中的任一用户,N为大于或者等于1的整数。
6.根据权利要求4所述的方法,其特征在于,所述对所述各条用户操作记录进行采样,获得采样操作记录,包括:
当第二网络信息在所述指定时间段内被浏览的次数大于M时,从所述各条用户操作记录中采样出所述第二网络信息被浏览M次的用户操作记录,并将采样得到的用户操作记录添加至所述采样操作记录;
其中,所述第二网络信息是所述各个网络信息中的任一网络信息,M为大于或者等于1的整数。
7.根据权利要求3所述的方法,其特征在于,当所述操作信息包括浏览时长时,所述根据所述各条用户操作记录生成所述加权网络图之前,还包括:
对所述各条用户操作记录中的浏览时长进行平滑处理。
8.根据权利要求1或2所述的方法,其特征在于,所述根据所述加权网络图获取所述各个用户各自的网络信息排名,包括:
获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,所述第三用户是所述各个用户中的任一用户;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
9.根据权利要求8所述的方法,其特征在于,所述获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离之前,还包括:
对所述二部混合加权网络图中的各个节点进行聚类,获得至少一个聚类社区;
所述获取第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,包括:
获取第三用户在所述二部混合加权网络图中与各个同社区信息之间的距离;所述同社区信息是与所述第三用户处于同一社区内的网络信息;
所述根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名,包括:
根据所述第三用户在所述二部混合加权网络图中与所述各个同社区信息之间的距离,对所述各个同社区信息进行排名,获得所述第三用户的网络信息排名。
10.根据权利要求8所述的方法,其特征在于,所述根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,对所述各个网络信息进行排名,获得所述第三用户的网络信息排名,包括:
获取辅助排名信息,所述辅助排名信息包括所述各个网络信息的重要性得分、所述各个网络信息的热度信息以及所述第三用户的用户画像中的至少一项;所述重要性得分用于指示对应的网络信息在所述二部混合加权网络图中的重要性,所述热度信息用于指示对应的网络信息在网络中的热门程度;
根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
11.根据权利要求10所述的方法,其特征在于,所述根据所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息对所述各个网络信息进行排名,获得所述第三用户的网络信息排名,包括:
对所述第三用户在所述二部混合加权网络图中与所述各个网络信息之间的距离,以及所述辅助排名信息进行加权求和,获得所述各个网络信息相对于所述第三用户的排名分值;
按照排名分值从大到小的顺序对所述各个网络信息进行排名,获得所述第三用户的网络信息排名。
12.根据权利要求1所述的方法,其特征在于,所述根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息之前,还包括:
根据所述目标用户的网络信息排名,从所述目标用户的终端上未曝光过的网络信息中获取n个候选网络信息,n为大于或者等于1的整数;
所述根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息,包括:
向所述目标用户的终端推送所述n个候选网络信息中的至少一个网络信息。
13.一种网络信息推送装置,其特征在于,所述装置包括:
网络图获取模块,用于获取加权网络图,所述加权网络图用于指示各个用户对各个网络信息执行的操作;
排名获取模块,用于根据所述加权网络图获取所述各个用户的网络信息排名,所述网络信息排名指示所述各个网络信息中的部分或者全部信息与对应用户之间的匹配关系;
推送模块,用于根据目标用户的网络信息排名,向所述目标用户的终端推送网络信息;所述目标用户是所述各个用户中的任一用户。
14.一种计算机设备,其特征在于,所述计算机设备包含处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如权利要求1至12任一所述的网络信息推送方法。
15.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如权利要求1至12任一所述的网络信息推送方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910492044.3A CN110413896B (zh) | 2019-06-06 | 网络信息推送方法、装置、计算机设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910492044.3A CN110413896B (zh) | 2019-06-06 | 网络信息推送方法、装置、计算机设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110413896A true CN110413896A (zh) | 2019-11-05 |
CN110413896B CN110413896B (zh) | 2024-06-28 |
Family
ID=
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110929049A (zh) * | 2019-12-02 | 2020-03-27 | 北京明略软件系统有限公司 | 一种用户账号识别方法及装置 |
CN112784152A (zh) * | 2019-11-11 | 2021-05-11 | 北京沃东天骏信息技术有限公司 | 一种标记用户的方法和装置 |
CN113426139A (zh) * | 2021-07-06 | 2021-09-24 | 网易(杭州)网络有限公司 | 一种信息推荐方法、装置、计算机设备及存储介质 |
WO2024114517A1 (zh) * | 2022-11-29 | 2024-06-06 | 中电信数智科技有限公司 | 一种基于Louvain算法的内容推荐方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309972A (zh) * | 2013-06-08 | 2013-09-18 | 清华大学 | 基于链路预测的推荐方法和系统 |
CN108632311A (zh) * | 2017-03-20 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN109166016A (zh) * | 2018-10-12 | 2019-01-08 | 平安科技(深圳)有限公司 | 基于聚类的信息推送方法、装置、计算机设备及存储介质 |
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103309972A (zh) * | 2013-06-08 | 2013-09-18 | 清华大学 | 基于链路预测的推荐方法和系统 |
CN108632311A (zh) * | 2017-03-20 | 2018-10-09 | 北京京东尚科信息技术有限公司 | 信息推送方法和装置 |
CN109166016A (zh) * | 2018-10-12 | 2019-01-08 | 平安科技(深圳)有限公司 | 基于聚类的信息推送方法、装置、计算机设备及存储介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112784152A (zh) * | 2019-11-11 | 2021-05-11 | 北京沃东天骏信息技术有限公司 | 一种标记用户的方法和装置 |
WO2021093423A1 (zh) * | 2019-11-11 | 2021-05-20 | 北京沃东天骏信息技术有限公司 | 一种标记用户的方法和装置 |
CN110929049A (zh) * | 2019-12-02 | 2020-03-27 | 北京明略软件系统有限公司 | 一种用户账号识别方法及装置 |
CN110929049B (zh) * | 2019-12-02 | 2023-05-26 | 北京明略软件系统有限公司 | 一种用户账号识别方法及装置 |
CN113426139A (zh) * | 2021-07-06 | 2021-09-24 | 网易(杭州)网络有限公司 | 一种信息推荐方法、装置、计算机设备及存储介质 |
WO2024114517A1 (zh) * | 2022-11-29 | 2024-06-06 | 中电信数智科技有限公司 | 一种基于Louvain算法的内容推荐方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11538064B2 (en) | System and method of providing a platform for managing data content campaign on social networks | |
US11710054B2 (en) | Information recommendation method, apparatus, and server based on user data in an online forum | |
CN105320766B (zh) | 信息推送方法和装置 | |
CN105989074B (zh) | 一种通过移动设备信息进行推荐冷启动的方法和装置 | |
CN108776844B (zh) | 基于上下文感知张量分解的社交网络用户行为预测方法 | |
CN109857935A (zh) | 一种信息推荐方法及装置 | |
CN111259263B (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
CN108241667A (zh) | 用于推送信息的方法和装置 | |
CN109155136A (zh) | 从视频自动检测和渲染精彩场面的计算机化系统和方法 | |
US20120041769A1 (en) | Requests for proposals management systems and methods | |
US9015158B2 (en) | Contents creating device and contents creating method | |
CN108632311A (zh) | 信息推送方法和装置 | |
WO2013009710A1 (en) | Automated presentation of information using infographics | |
CN109960761A (zh) | 信息推荐方法、装置、设备及计算机可读存储介质 | |
CN108460082A (zh) | 一种推荐方法及装置,电子设备 | |
CN103744849A (zh) | 一种应用自动推荐的方法及装置 | |
CN108287857A (zh) | 表情图片推荐方法及装置 | |
CN107870984A (zh) | 识别搜索词的意图的方法和装置 | |
CN111723292A (zh) | 基于图神经网络的推荐方法、系统、电子设备及存储介质 | |
CN107644100A (zh) | 信息处理方法、装置以及系统和计算机可读存储介质 | |
CN107436914A (zh) | 推荐方法及装置 | |
CN106599194A (zh) | 标签确定方法及装置 | |
CN109727047A (zh) | 一种确定数据关联度的方法和装置、数据推荐方法和装置 | |
CN107368499B (zh) | 一种客户标签建模及推荐方法及装置 | |
CN112116426A (zh) | 一种推送物品信息的方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant |