CN112541121A - 页面数据推送方法、装置、计算机设备及存储介质 - Google Patents

页面数据推送方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN112541121A
CN112541121A CN202011521654.0A CN202011521654A CN112541121A CN 112541121 A CN112541121 A CN 112541121A CN 202011521654 A CN202011521654 A CN 202011521654A CN 112541121 A CN112541121 A CN 112541121A
Authority
CN
China
Prior art keywords
page
data
task
analysis task
preset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011521654.0A
Other languages
English (en)
Inventor
王国彬
牟锟伦
杨帅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Bincent Technology Co Ltd
Original Assignee
Shenzhen Bincent Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Bincent Technology Co Ltd filed Critical Shenzhen Bincent Technology Co Ltd
Priority to CN202011521654.0A priority Critical patent/CN112541121A/zh
Publication of CN112541121A publication Critical patent/CN112541121A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/957Browsing optimisation, e.g. caching or content distillation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system
    • G06F9/4881Scheduling strategies for dispatcher, e.g. round robin, multi-level priority queues

Abstract

本发明涉及数据推送技术领域,揭露了一种页面数据推送方法、装置、计算机设备及存储介质。该方法通过获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与当前分析任务关联的至少一个任务分类标签;通过预设调度算法将当前分析任务插入至预设分析任务队列中;自页面推荐数据队列中抽取与各任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;根据热度值排序方式,将待推送数据推送至目标用户。本发明提高了页面数据推送的准确性,缩短了页面数据推送时间,提高了页面数据推送效率。

Description

页面数据推送方法、装置、计算机设备及存储介质
技术领域
本发明涉及数据推送技术领域,尤其涉及一种页面数据推送方法、装置、计算机设备及存储介质。
背景技术
随着互联网的广泛普及,用户在日常生活中使用互联网的过程中产生的数据,包括应用程序页面数据,网站页面数据等,产生的数据包括购物浏览数据、搜索浏览数据等,并且各个应用程序页面数据或者网站页面数据,会对用户进行信息推送。
现有技术中,信息推送方法往往兼顾所有用户,但是这种推送方法没有考虑用户对推送信息的真实情感取向,没有针对用户行为数据进行信息推送调整,例如,用户很快的关闭推送信息,或者用户浏览推送信息的时长,并且不能为信息推送功能进行合适地调度,进而导致信息推送准确率低、效率低等问题。
发明内容
本发明实施例提供一种页面数据推送方法、装置、计算机设备及存储介质,以解决信息推送准确率低、效率低等问题。
一种页面数据推送方法,包括:
获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;
根据热度值排序方式,将所述待推送数据推送至所述目标用户。
一种页面数据推送装置,包括:
页面推荐数据队列获取模块,用于获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
分析任务生成模块,用于获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
分析任务调度模块,用于通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
数据匹配模块,用于按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;
页面数据推送模块,用于根据热度值排序方式,将所述待推送数据推送至所述目标用户。
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述页面数据推送方法。
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述页面数据推送方法。
上述页面数据推送方法、装置、计算机设备及存储介质,该方法通过获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;根据热度值排序方式,将所述待推送数据推送至所述目标用户。
本发明通过对页面浏览数据进行链路分析,进而确定与各页面浏览数据关联的任务分类标签,并且抽取与任务分类标签匹配的页面推荐数据,提高了页面数据推送的准确性。此外还根据预设调度算法将当前分析任务插入预设分析任务队列,提高了用户体验,缩短了页面数据推送时间,提高了页面数据推送效率。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一实施例中页面数据推送方法的一应用环境示意图;
图2是本发明一实施例中页面数据推送方法的一流程图;
图3是本发明一实施例中页面数据推送方法中步骤S30的一流程图;
图4是本发明一实施例中页面数据推送方法中步骤S40的一流程图;
图5是本发明一实施例中页面数据推送方法中步骤S50的一流程图;
图6是本发明一实施例中页面数据推送装置的一原理框图;
图7是本发明一实施例中页面数据推送装置中分析任务调度模块的一原理框图;
图8是本发明一实施例中页面数据推送装置中数据匹配模块的一原理框图;
图9是本发明一实施例中页面数据推送装置中页面数据推送模块的一原理框图;
图10是本发明一实施例中计算机设备的一示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供的页面数据推送方法,该页面数据推送方法可应用如图1所示的应用环境中。具体地,该页面数据推送方法应用在页面数据推送系统中,该页面数据推送系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决信息推送准确率低、效率低等问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一实施例中,如图2所示,提供一种页面数据推送方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
S10:获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
可以理解地,页面推荐数据可以存储于数据库中,或者存储模块中,该数据库或者存储模块可以包括持久化存储单元以及本地缓存单元。其中,持久化存储单元可以采用mysql-innodb存储引擎将页面推荐数据进行存储和整理;本地缓存单元用于存储临时页面推荐数据或者其它计算数据,可以减少服务器在进行多线程任务同步计算时,拉取页面推荐数据带来的性能损耗,从而减少服务器计算压力且提高服务器数据处理效率。示例性地,该页面推荐数据可以为广告数据。
S20:获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
可以理解地,目标用户可以为当前正在浏览如购物网页、查询网页等各类网页的用户。页面浏览数据指的是目标用户当前正在浏览的页面,或者是目标用户打开但暂未浏览的页面。当前分析任务用于根据目标用户打开或者正在浏览的所有页面浏览数据,确定目标用户关注的页面数据的类型,如购物类型页面数据,某行业知识页面数据等。
其中,链路分析用于确定与目标用户的所有页面浏览数据关联的任务分类标签,示例性地,假设目标用户的页面浏览数据有购物页面浏览数据,查询区块链知识的页面浏览数据,以及观看视频的页面浏览数据;则通过对上述页面浏览数据进行链路分析,进而提取与上述页面浏览数据中具有表征意义的信息,如在购物页面浏览数据中的具体购物信息(如鞋子),查询区块链知识的页面浏览数据中,具体对应的区块链知识内容,观看视频页面浏览数据中视频的文字信息或者画面信息等(如具体电影名称或者电影类型),进而对其进行分类后得到的任务分类标签可以包括:鞋子分类标签、区块链分类标签,以及电影类型分类标签。
可以理解地,对于一个页面浏览数据,并不是所有与该页面浏览数据的信息均具有表征意义,因此需要对各页面浏览数据进行特征提取,进而确定与目标用户对应的任务分类标签;进一步地,上述举例仅为解释说明,但并不表征一个页面浏览数据关联一个任务分类标签,如在页面浏览数据提取的特征信息存在相同,或者该特征信息无法确定对应的任务分类标签时(如特征信息提取错误时)。
S30:通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
其中,预设调度算法可以为EDF(Earliest Deadline First,最近截止日期优先)算法,该预设调度算法可以根据各当前分析任务的分析时间进行任务调度,如将分析时间最短的当前分析任务提取到预设分析任务队列中的最前面。可以理解地,预设分析任务队列中包含已经进行链路分析完成的队列分析任务。
在一实施例中,如图3所示,步骤S30中包括如下步骤:
S301:获取所述预设分析任务队列中的所有队列分析任务的第二分析时间。
可以理解地,一个队列分析任务关联一个第二分析时间,该第二分析时间指的是对队列分析任务进行链路分析所需时间。当前分析任务关联第一分析时间,该第一分析时间指的是对当前分析任务进行链路分析所需时间。进一步地,预设分析任务队列中各队列分析任务按照与其关联的第二分析时间从小到大排序,也即在预设分析任务队列中,排在最前的队列分析任务对应的第二分析时间是最短的,排在最后的队列分析任务对应的第二分析时间是最长的,进而可以减少目标用户等待推送的时间,提高推送效率。
S302:将所述第一分析时间与各所述第二分析时间进行比较。
S303:将小于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第一分析任务;将大于或等于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第二分析任务。
可以理解地,虽然各队列分析任务均已链路分析完成,但是可能是由于队列分析任务启动链路分析的时间早,进而该队列分析任务已经插入至预设分析任务队列中,因此需要将第一分析时间与各第二分析时间进行比较,进而将小于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第一分析任务;将大于或等于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第二分析任务。
S304:通过EDF调度算法将所述当前分析任务插入至所述第一分析任务以及所述第二分析任务之间。
可以理解地,通过EDF调度算法将当前分析任务插入第一分析任务以及第二分析任务之间,可以减少目标用户等待推送的时间,提高推送效率。
S40:按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据。
具体地,在通过预设调度算法将所述当前分析任务插入至预设分析任务队列中之后,按照预设分析任务队列中各任务的顺序,也即,在当前分析任务处于预设分析任务队列的顶部时,自页面推荐数据队列中抽取与各任务分类标签匹配的所有页面推荐数据,并记录为待推送数据。可以理解地,页面推荐数据是与各任务分类标签匹配的,如在步骤S20中举例的鞋子分类标签,则页面推荐数据可以为各类款式的鞋子页面数据;如区块链分类标签,则页面推荐数据可以为包含区块链知识的页面数据,如论文页面、博客页面等。
在一实施例中,如图4所示,步骤S40中,包括:
S401:获取与各所述页面推荐数据关联的页面推荐数据标签;
可以理解地,一个页面推荐数据关联一个页面推荐数据标签;示例性地,各类品牌的鞋子的页面推荐数据,则对应的页面推荐数据标签可以为XXX品牌的鞋子标签,亦或者根据各类鞋子的款式进行分类,如帆布鞋页面推荐数据标签、球鞋页面推荐数据标签。
S402:确定各所述任务分类标签与各所述页面推荐数据标签之间的标签相似度,并将标签相似度与预设相似度阈值比较;
可以理解地,标签相似度可以通过余弦相似度进行确定(余弦相似度越大,标签相似度越高),也可以通过欧几里得距离确定(欧几里得距离越小,标签相似度越高)。进而在获取与各所述页面推荐数据关联的页面推荐数据标签之后,确定确定各所述任务分类标签与各所述页面推荐数据标签之间的标签相似度,并将标签相似度与预设相似度阈值比较。其中,预设相似度阈值可以根据具体应用场景进行确定,示例性地,该预设相似度阈值可以为90%,95%等。
S403:将大于或等于所述预设相似度阈值的标签相似度对应的页面推荐数据标签关联的页面推荐数据,记录为所述待推送数据。
具体地,在确定各所述任务分类标签与各所述页面推荐数据标签之间的标签相似度,并将标签相似度与预设相似度阈值比较之后,将大于或等于所述预设相似度阈值的标签相似度对应的页面推荐数据标签关联的页面推荐数据,记录为所述待推送数据。剔除小于预设相似度阈值的标签相似度对应的页面推荐数据标签关联的页面推荐数据,以提高页面数据推送的准确性。
S50:根据热度值排序方式,将所述待推送数据推送至所述目标用户。
可以理解地,热度值排序方式是指根据用户对待推送数据的行为数据,对待推送数据的推送进行调整的方式。
在一实施例中,如图5所示,步骤S50中,包括:
S501:将各所述待推送数据,按照所述标签相似度从大到小的顺序插入推送数据序列中;
可以理解地,标签相似度最高的待推送数据排在推送数据序列的第一位,标签相似度最低的待推送数据排在推送数据序列的最后一位。
S502:自所述推送数据序列中,将所述标签相似度最大的待推送数据推送至所述目标用户;
具体地,在将各所述待推送数据,按照所述标签相似度从大到小的顺序插入推送数据序列中之后,将推送数据序列中,将所述标签相似度最大的待推送数据推送至所述目标用户。
S503:实时监测所述目标用户的用户行为数据;
可以理解地,用户行为数据可以包括,目标用户打开待推送数据,或者目标用户忽略该推送数据,亦或者目标用户关闭该待推送数据。
S504:在预设监测时间范围内,所述用户行为数据为关闭行为数据时,剔除所述推送数据序列中,与所述标签相似度最大的待推送数据具有相同页面推荐数据标签的待推送数据。
其中,预设监测时间范围可以根据具体应用场景进行设定,示例性地,该预设监测时间范围可以为1s至5s,亦或者1s至10s等。可以理解地,在预设监测时间范围内,用户行为数据为关闭行为数据时,表征目标用户并不喜欢该类型的待推送数据,如目标用户可能是意外打开了其中一个页面浏览数据,而该最大标签相似度对应的待推送数据恰好与该页面浏览数据匹配,则目标用户可能对该待推送数据不感兴趣,进而在预设监测时间范围内,关闭该待推送数据。因此,在预设监测时间范围内,所述用户行为数据为关闭行为数据时,剔除所述推送数据序列中,与所述标签相似度最大的待推送数据具有相同页面推荐数据标签的待推送数据,进而避免对目标用户造成重复推送,提高用户体验度以及推送准确率。
进一步地,在预设监测时间范围之外,用户行为数据为打开行为数据时,可以获取目标用户的浏览时间,进而可以根据目标用户的浏览时间,对该待推送数据以及与该待推送数据具有相同页面推荐数据标签的其它待推送数据进行评分,并记录该评分。在目标用户关闭所有页面浏览数据之后,可以对各页面推荐数据标签进行优先级排序,以在下一次目标用户打开页面浏览数据时,可以根据各页面推荐数据标签的优先级给目标用户推送相应的页面数据。可以理解地,上述根据各页面推荐数据标签优先级进行页面数据推送,在目标用户浏览页面数据过程中,可以根据目标用户的页面浏览数据进行如步骤S20至S50进行调整。
进一步地,在预设监测时间范围之外,用户行为数据为打开行为数据之后,可以在预设推送时间之后,自推送数据序列中,选取标签相似度第二大的待推送数据推送至目标用户,使得目标用户可以了解更多的推送信息,提高推送准确率以及效率。
在本实施例中,通过对页面浏览数据进行链路分析,进而确定与各页面浏览数据关联的任务分类标签,并且抽取与任务分类标签匹配的页面推荐数据,提高了页面数据推送的准确性。此外还根据预设调度算法将当前分析任务插入预设分析任务队列,提高了用户体验,缩短了页面数据推送时间,提高了页面数据推送效率。
在一实施例中,步骤S20之后,也即生成与目标用户对应的当前分析任务之后,包括:
S60:获取各所述页面浏览数据对应的页面信息;所述页面信息中包含图片信息;
S70:对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题;
可以理解地,图片信息可以为页面信息中包含的图片,也可以为对页面信息进行截图后生成的图片信息。页面主题指的是与页面浏览数据对应的表征,示例性地,假设页面浏览数据为购物浏览页面,该购物浏览页面中包含商品图片(也即图片信息),即可对该商品图片进行主题特征提取,进而获取与该商品图片对应的页面主题,如鞋子、衣服、耳机等主题。
在一实施例中,步骤S70中,包括:
S701:获取预设识别模型,并通过所述预设识别模型对所述图片信息进行图像文本识别,得到与所述图片信息对应的图像句子。
其中,预设识别模型用于对图片信息进行图像文本识别,该预设识别模型可以为LDA(Latent Dirichlet Allocation,文档主题模型)模型。图像句子为图片信息对应的描述句子。
S702:将所述图像句子输入至文本特征提取模型,对所述图像句子进行文本特征提取,得到与所述图像句子对应的时序句子。
其中,文本特征提取模型的实质是自编码解码模型,该文本特征提取模型包括编码和解码两部分,用于提取图像句子的文本特征。
具体地,在通过所述预设识别模型对所述图片信息进行图像文本识别,得到与所述图片信息对应的图像句子之后,将图像句子输入至文本特征提取模型中,通过文本特征提取模型中的编码模块以及解码模块,对图像句子进行文本特征提取,使得图像句子带有时序特征,从而得到时序句子。
S703:通过文本主题模型对所述时序句子进行主题提取,得到所述页面主题。
其中,文本主题模型用于进行文本主题提取,
具体地,在本实施例中,选择高斯混合模型(Gaussian Mixture Model,GMM)作为文本主题模型对时序句子进行主题提取。将时序句子输入至文本主题模型之后,文本主题模型对时序句子对应的句子向量进行主题提取,以得到与时序句子对应的文本主题。
进一步地,GMM文本主题模型可以在连续特征控件中发现主题,本实施例中,将GMM的一个高斯组件定义为一个文本主题,对于时序句子在任意一个文本主题下的概率可以表示为k个高斯组件的线性组合,对于时序句子对应的句子向量,可以通过贝叶斯计算句子向量在每个高斯组件下的概率分布,进而选取概率分布最高的主题确定为与各页面浏览数据对应的页面主题。
S80:获取预设页面分类标签集;所述预设页面分类标签集中包含至少一个页面分类标签;
可以理解地,页面分类标签可以通过预先对各类图片信息进行主题特征提取之后,通过人工分类标签得到。
S90:将各所述页面主题与各所述页面分类标签进行匹配,将与各所述页面主题对应的页面分类标签记录为所述任务分类标签。
具体地,在对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题,且获取预设页面分类标签集之后,将各所述页面主题与各所述页面分类标签进行匹配,示例性地,可以通过余弦相似度,亦或者欧几里得距离进行匹配,如在余弦相似度大于预设余弦相似阈值(如90%)时,或者欧几里得距离小于预设距离阈值(如0.1)时,确定页面主题与对应的页面分类标签匹配,进而将各页面主题对应的页面分类标签记录为任务分类标签。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
在一实施例中,提供一种页面数据推送装置,该页面数据推送装置与上述实施例中页面数据推送方法一一对应。如图6所示,该页面数据推送装置包括页面推荐数据队列获取模块10、分析任务生成模块20、分析任务调度模块30、数据匹配模块40和页面数据推送模块50。各功能模块详细说明如下:
页面推荐数据队列获取模块10,用于获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
分析任务生成模块20,用于获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
分析任务调度模块30,用于通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
数据匹配模块40,用于按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;
页面数据推送模块50,用于根据热度值排序方式,将所述待推送数据推送至所述目标用户。
优选地,所述页面数据推送装置还包括:
页面信息获取模块,用于获取各所述页面浏览数据对应的页面信息;所述页面信息中包含图片信息;
主题特征提取模块,用于对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题;
页面分类标签获取模块,用于获取预设页面分类标签集;所述预设页面分类标签集中包含至少一个页面分类标签;
标签匹配模块,用于将各所述页面主题与各所述页面分类标签进行匹配,将与各所述页面主题对应的页面分类标签记录为所述任务分类标签。
优选地,主题特征提取模块包括:
获取预设识别模型,并通过所述预设识别模型对所述图片信息进行图像文本识别,得到与所述图片信息对应的图像句子;
将所述图像句子输入至文本特征提取模型,对所述图像句子进行文本特征提取,得到与所述图像句子对应的时序句子;
通过文本主题模型对所述时序句子进行主题提取,得到所述页面主题。
优选地,如图7所示,分析任务调度模块30包括:
分析时间获取单元301,用于获取所述预设分析任务队列中的所有队列分析任务的第二分析时间;
分析时间比较单元302,用于将所述第一分析时间与各所述第二分析时间进行比较;
分析任务记录单元303,用于将小于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第一分析任务;将大于或等于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第二分析任务;
分析任务调度单元304,用于通过EDF调度算法将所述当前分析任务插入至所述第一分析任务以及所述第二分析任务之间。
优选地,如图8所示,数据匹配模块40包括:
数据标签获取单元401,用于获取与各所述页面推荐数据关联的页面推荐数据标签;
标签相似度确定单元402,用于确定各所述任务分类标签与各所述页面推荐数据标签之间的标签相似度,并将标签相似度与预设相似度阈值比较;
待推送数据记录单元403,用于将大于或等于所述预设相似度阈值的标签相似度对应的页面推荐数据标签关联的页面推荐数据,记录为所述待推送数据。
优选地,如图9所示,页面数据推送模块50包括:
数据插入单元501,用于将各所述待推送数据,按照所述标签相似度从大到小的顺序插入推送数据序列中;
数据推送单元502,用于自所述推送数据序列中,将所述标签相似度最大的待推送数据推送至所述目标用户;
用户行为数据监测单元503,用于实时监测所述目标用户的用户行为数据;
数据剔除单元504,用于在预设监测时间范围内,所述用户行为数据为关闭行为数据时,剔除所述推送数据序列中,与所述标签相似度最大的待推送数据具有相同页面推荐数据标签的待推送数据。
关于页面数据推送装置的具体限定可以参见上文中对于页面数据推送方法的限定,在此不再赘述。上述页面数据推送装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中页面数据推送方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种页面数据推送方法。
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中页面数据推送方法。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中页面数据推送方法。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种页面数据推送方法,其特征在于,包括:
获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;
根据热度值排序方式,将所述待推送数据推送至所述目标用户。
2.如权利要求1所述的页面数据推送方法,其特征在于,所述生成与目标用户对应的当前分析任务之后,包括:
获取各所述页面浏览数据对应的页面信息;所述页面信息中包含图片信息;
对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题;
获取预设页面分类标签集;所述预设页面分类标签集中包含至少一个页面分类标签;
将各所述页面主题与各所述页面分类标签进行匹配,将与各所述页面主题对应的页面分类标签记录为所述任务分类标签。
3.如权利要求2所述的页面数据推送方法,其特征在于,所述对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题,包括:
获取预设识别模型,并通过所述预设识别模型对所述图片信息进行图像文本识别,得到与所述图片信息对应的图像句子;
将所述图像句子输入至文本特征提取模型,对所述图像句子进行文本特征提取,得到与所述图像句子对应的时序句子;
通过文本主题模型对所述时序句子进行主题提取,得到所述页面主题。
4.如权利要求1所述的页面数据推送方法,其特征在于,所述当前分析任务关联一个第一分析时间;所述通过预设调度算法将所述当前分析任务插入至预设分析任务队列中,包括:
获取所述预设分析任务队列中的所有队列分析任务的第二分析时间;
将所述第一分析时间与各所述第二分析时间进行比较;
将小于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第一分析任务;将大于或等于所述第一分析时间的第二分析时间对应的队列分析任务,记录为第二分析任务;
通过EDF调度算法将所述当前分析任务插入至所述第一分析任务以及所述第二分析任务之间。
5.如权利要求1所述的页面数据推送方法,其特征在于,所述自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据包括:
获取与各所述页面推荐数据关联的页面推荐数据标签;
确定各所述任务分类标签与各所述页面推荐数据标签之间的标签相似度,并将标签相似度与预设相似度阈值比较;
将大于或等于所述预设相似度阈值的标签相似度对应的页面推荐数据标签关联的页面推荐数据,记录为所述待推送数据。
6.如权利要求5所述的页面数据推送方法,其特征在于,所述根据热度值排序方式,将所述待推送数据推送至所述目标用户,包括:
将各所述待推送数据,按照所述标签相似度从大到小的顺序插入推送数据序列中;
自所述推送数据序列中,将所述标签相似度最大的待推送数据推送至所述目标用户;
实时监测所述目标用户的用户行为数据;
在预设监测时间范围内,所述用户行为数据为关闭行为数据时,剔除所述推送数据序列中,与所述标签相似度最大的待推送数据具有相同页面推荐数据标签的待推送数据。
7.一种页面数据推送装置,其特征在于,包括:
页面推荐数据队列获取模块,用于获取页面推荐数据队列;所述页面推荐数据队列包含至少一个页面推荐数据;
分析任务生成模块,用于获取目标用户的所有页面浏览数据,并生成与目标用户对应的当前分析任务;所述当前分析任务用于对各所述页面浏览数据进行链路分析,以确定与所述当前分析任务关联的至少一个任务分类标签;
分析任务调度模块,用于通过预设调度算法将所述当前分析任务插入至预设分析任务队列中;
数据匹配模块,用于按照所述预设分析任务队列,自所述页面推荐数据队列中抽取与各所述任务分类标签匹配的所有页面推荐数据,并记录为待推送数据;
页面数据推送模块,用于根据热度值排序方式,将所述待推送数据推送至所述目标用户。
8.如权利要求7所述的页面数据推送装置,其特征在于,所述页面数据推送装置还包括:
页面信息获取模块,用于获取各所述页面浏览数据对应的页面信息;所述页面信息中包含图片信息;
主题特征提取模块,用于对所述图片信息进行主题特征进行提取,确定与各所述页面浏览数据对应的页面主题;
页面分类标签获取模块,用于获取预设页面分类标签集;所述预设页面分类标签集中包含至少一个页面分类标签;
标签匹配模块,用于将各所述页面主题与各所述页面分类标签进行匹配,将与各所述页面主题对应的页面分类标签记录为所述任务分类标签。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述页面数据推送方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述页面数据推送方法。
CN202011521654.0A 2020-12-21 2020-12-21 页面数据推送方法、装置、计算机设备及存储介质 Pending CN112541121A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011521654.0A CN112541121A (zh) 2020-12-21 2020-12-21 页面数据推送方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011521654.0A CN112541121A (zh) 2020-12-21 2020-12-21 页面数据推送方法、装置、计算机设备及存储介质

Publications (1)

Publication Number Publication Date
CN112541121A true CN112541121A (zh) 2021-03-23

Family

ID=75019446

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011521654.0A Pending CN112541121A (zh) 2020-12-21 2020-12-21 页面数据推送方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN112541121A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113590959A (zh) * 2021-08-02 2021-11-02 北京奇艺世纪科技有限公司 一种用户行为数据获取方法、装置、设备及存储介质
CN113626686A (zh) * 2021-07-19 2021-11-09 上海泛宥信息科技有限公司 基于用户数据分析的自动推送方法、装置和计算机设备
CN116166716A (zh) * 2023-02-16 2023-05-26 北京瑞风协同科技股份有限公司 一种数据推送方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810043A (zh) * 2012-11-09 2014-05-21 中国科学院沈阳计算技术研究所有限公司 一种适用于数控系统周期任务的节能调度方法
CN105868250A (zh) * 2015-12-16 2016-08-17 乐视移动智能信息技术(北京)有限公司 一种浏览器的页面标签管理方法及装置
CN106204165A (zh) * 2016-08-11 2016-12-07 广州出益信息科技有限公司 一种广告投放方法及装置
CN107908789A (zh) * 2017-12-12 2018-04-13 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109241427A (zh) * 2018-09-04 2019-01-18 中国平安人寿保险股份有限公司 信息推送方法、装置、计算机设备和存储介质
CN111582913A (zh) * 2020-04-21 2020-08-25 北京龙云科技有限公司 一种广告推荐方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103810043A (zh) * 2012-11-09 2014-05-21 中国科学院沈阳计算技术研究所有限公司 一种适用于数控系统周期任务的节能调度方法
CN105868250A (zh) * 2015-12-16 2016-08-17 乐视移动智能信息技术(北京)有限公司 一种浏览器的页面标签管理方法及装置
CN106204165A (zh) * 2016-08-11 2016-12-07 广州出益信息科技有限公司 一种广告投放方法及装置
CN107908789A (zh) * 2017-12-12 2018-04-13 北京百度网讯科技有限公司 用于生成信息的方法和装置
CN109241427A (zh) * 2018-09-04 2019-01-18 中国平安人寿保险股份有限公司 信息推送方法、装置、计算机设备和存储介质
CN111582913A (zh) * 2020-04-21 2020-08-25 北京龙云科技有限公司 一种广告推荐方法及装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113626686A (zh) * 2021-07-19 2021-11-09 上海泛宥信息科技有限公司 基于用户数据分析的自动推送方法、装置和计算机设备
CN113590959A (zh) * 2021-08-02 2021-11-02 北京奇艺世纪科技有限公司 一种用户行为数据获取方法、装置、设备及存储介质
CN113590959B (zh) * 2021-08-02 2023-07-28 北京奇艺世纪科技有限公司 一种用户行为数据获取方法、装置、设备及存储介质
CN116166716A (zh) * 2023-02-16 2023-05-26 北京瑞风协同科技股份有限公司 一种数据推送方法及装置
CN116166716B (zh) * 2023-02-16 2023-10-24 北京瑞风协同科技股份有限公司 一种数据推送方法及装置

Similar Documents

Publication Publication Date Title
CN108563722B (zh) 文本信息的行业分类方法、系统、计算机设备和存储介质
CN109583325B (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
CN110765275B (zh) 搜索方法、装置、计算机设备和存储介质
CN109635838B (zh) 人脸样本图片标注方法、装置、计算机设备及存储介质
CN112541121A (zh) 页面数据推送方法、装置、计算机设备及存储介质
CN108874992B (zh) 舆情分析方法、系统、计算机设备和存储介质
CN108595695B (zh) 数据处理方法、装置、计算机设备和存储介质
CN108897734B (zh) 用户画像生成方法、装置、计算机设备和存储介质
CN109743624B (zh) 视频切割方法、装置、计算机设备和存储介质
CN109635296B (zh) 新词挖掘方法、装置计算机设备和存储介质
CN111325037B (zh) 文本意图识别方法、装置、计算机设备和存储介质
CN111666401B (zh) 基于图结构的公文推荐方法、装置、计算机设备及介质
CN110750523A (zh) 数据标注方法、系统、计算机设备和存储介质
CN112446218A (zh) 长短句文本语义匹配方法、装置、计算机设备及存储介质
CN113343108B (zh) 推荐信息处理方法、装置、设备及存储介质
CN110633475A (zh) 基于计算机场景的自然语言理解方法、装置、系统和存储介质
CN110555165B (zh) 信息识别方法、装置、计算机设备和存储介质
CN112766319A (zh) 对话意图识别模型训练方法、装置、计算机设备及介质
CN112685475A (zh) 报表查询方法、装置、计算机设备及存储介质
CN112434158A (zh) 一种企业标签的获取方法、获取装置、存储介质和计算机设备
CN112580329B (zh) 文本噪声数据识别方法、装置、计算机设备和存储介质
CN114090792A (zh) 基于对比学习的文档关系抽取方法及其相关设备
CN115994232B (zh) 在线多版本文献同一性鉴别方法、系统及计算机设备
CN112527985A (zh) 未知问题处理方法、装置、设备及介质
CN115576789A (zh) 流失用户识别方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination