CN112699295A - 一种网页内容推荐方法、装置和计算机可读存储介质 - Google Patents

一种网页内容推荐方法、装置和计算机可读存储介质 Download PDF

Info

Publication number
CN112699295A
CN112699295A CN201911008928.3A CN201911008928A CN112699295A CN 112699295 A CN112699295 A CN 112699295A CN 201911008928 A CN201911008928 A CN 201911008928A CN 112699295 A CN112699295 A CN 112699295A
Authority
CN
China
Prior art keywords
content
information
current page
type
content information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911008928.3A
Other languages
English (en)
Other versions
CN112699295B (zh
Inventor
杨木文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911008928.3A priority Critical patent/CN112699295B/zh
Publication of CN112699295A publication Critical patent/CN112699295A/zh
Application granted granted Critical
Publication of CN112699295B publication Critical patent/CN112699295B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

本发明实施例公开了一种网页内容推荐方法、装置和计算机可读存储介质;本发明实施例在获取用户浏览的当前页面后,该当前页面中包括内容信息,采集用户在当前页面的浏览时间和操作指令信息,根据操作指令信息,生成用户对当前页面的关注度,当关注度和浏览时间满足预设条件时,识别出内容信息的类型,将类型发送至推荐服务器,并接收推荐服务器根据类型推荐的网页内容,以显示在当前页面中;该方案可以提高网页内容推荐的精确性。

Description

一种网页内容推荐方法、装置和计算机可读存储介质
技术领域
本发明涉及通信技术领域,具体涉及一种网页内容推荐方法、装置和计算 机可读存储介质。
背景技术
近年来,随着互联网技术的发展,网页信息量呈现了爆发式的增长。然而, 随着网页数量的增加,已经进入了网页信息过载的时代。为了解决过载的问题, 可以通过推荐系统辅助用户更方便的找到需要的网页内容,现有的内容推荐方 法一般多为预先收集用户浏览历史记录或收藏记录,然后通过算法分析该用户 感兴趣内容并对其打标签,最后在某些场景下基于便签向用户推荐内容。
在对现有技术的研究和实践过程中,本发明的发明人发现当前的网页内容 推荐方法中,普通用户访问网页的站点可能是五花八门,通过收集用户的历史 记录或者收藏记录会导致用于分析用户感兴趣内容的数据较为单一,因此,导 致网页内容推荐的精确性较差。
发明内容
本发明实施例提供一种网页内容推荐方法、装置和计算机可读存储介质。 可以提高网页内容推荐的精确性。
一种网页内容推荐方法,包括:
获取用户浏览的当前页面,所述当前页面中包括内容信息;
采集用户在所述当前页面的浏览时间和操作指令信息;
根据所述操作指令信息,生成所述用户对当前页面的关注度;
当所述关注度和所述浏览时间满足预设条件时,识别出所述内容信息的类 型;
将所述类型发送至推荐服务器,并接收所述推荐服务器根据所述类型推荐 的网页内容,以显示在所述当前页面中。
相应的,本发明实施例还可以提供另一种网页内容推荐方法,包括:
接收终端发送的网页内容推荐请求,所述网页内容推荐请求包括内容信息 的类型;
根据所述内容信息的类型生成多个查询条件;
对每个查询条件分配预设权重值;
根据所述查询条件的权重值,将所述多个查询条件进行融合;
在所述内容数据库中查询融合后查询条件对应的至少一条网页内容;
将所述网页内容发送至所述终端,以使得在所述终端的当前页面中显示与 所述内容信息相关联的所述网页内容。
相应的,本发明实施例提供一种网页内容推荐装置,包括:
获取单元,用于获取用户浏览的当前页面,所述当前页面中包括内容信息;
第一采集单元,用于采集用户在所述当前页面的浏览时间和操作指令信息;
第一生成单元,用于根据所述操作指令信息,生成所述用户对当前页面的 关注度;
识别单元,用于当所述关注度和所述浏览时间满足预设条件时,识别出所 述内容信息的类型;
显示单元,用于将所述类型发送至推荐服务器,并接收所述推荐服务器根 据所述类型推荐的网页内容,以显示在所述当前页面中。
相应的,本发明实施例还可以提供另一种网页内容推荐装置,包括:
接收单元,用于接收终端发送的网页内容推荐请求,所述网页内容推荐请 求包括内容信息的类型;
第二生成单元,用于根据所述内容信息的类型生成多个查询条件;
分配单元,用于对每个查询条件分配预设权重值;
融合单元,用于根据所述查询条件的权重值,将所述多个查询条件进行融 合;
查询单元,用于在所述内容数据库中查询融合后查询条件对应的至少一条 网页内容;
发送单元,用于将所述网页内容发送至所述终端,以使得在所述终端的当 前页面中显示与所述内容信息相关联的所述网页内容。
可选的,在一些实施例中,所述获取单元,具体可以用于获取所述用户浏 览的初始页面,所述初始页面包括属性信息和初始内容信息,根据所述属性信 息,对初始页面的排版权限进行检测,当检测结果指示所述初始页面支持重新 排版时,在所述初始内容信息中将与正文无关的内容过滤,得到所述内容信息, 按照预设策略对所述内容信息进行排版,根据排版后的所述内容信息生成所述 当前页面。
可选的,在一些实施例中,所述获取单元,具体可以用于在所述初始页面 添加浏览控件,当检测到所述用户针对所述浏览控件的触发操作时,对所述初 始内容信息进行分类,根据分类结果,将所述初始内容信息中与正文无关的内 容过滤,得到所述内容信息。
可选的,在一些实施例中,所述生成单元,具体可以用于在所述内容信息 中提取文本内容,对所述文本内容的文本长度进行检测,当所述文本长度超过 预设长度阈值时,计算所述用户浏览完所述内容信息所需的时间,得到浏览总 时间。
可选的,在一些实施例中,所述生成单元,具体可以用于在所述操作指令 信息中提取出所述当前页面的滚动操作指令信息,在所述滚动操作指令信息中 筛选出所述当前页面的滚动频率,当所述滚动频率超过预设频率阈值或者为零 时,基于所述浏览总时间,生成所述用户对所述当前页面的第一关注度,当所 述滚动频率未超过预设频率阈值且不为零时,基于所述浏览总时间,生成所述 用户对所述当前页面的第二关注度。
可选的,在一些实施例中,所述识别单元,具体可以用于当所述关注度为 所述第一关注度时,获取所述第一关注度对应的第一预设比例阈值,根据所述 第一预设比例阈值和所述浏览总时间,计算出第一浏览时间阈值,当所述浏览 时间超过所述第一浏览时间阈值时,识别出所述内容信息的类型。
可选的,在一些实施例中,所述识别单元,具体可以用于当所述关注度为 所述第二关注度时,获取所述第一关注度对应的第二预设比例阈值,根据所述 第二预设比例阈值和所述浏览总时间,计算出第二浏览时间阈值,当所述浏览 时间超过所述第二浏览时间阈值时,识别出所述内容信息的类型。
可选的,在一些实施例中,所述识别单元,具体可以用于提取所述内容信 息中的文本信息,在所述文本信息中筛选出至少一个出现频率超过预设阈值的 关键词,根据所述关键词,采用训练后识别模型识别出所述内容信息的类型。
可选的,在一些实施例中,所述识别单元,具体可以用于采集多个内容信 息样本,所述内容信息样本包括已标注类型的内容信息,采用预设识别模型对 所述内容信息样本的类型进行预测,得到所述内容信息样本的预测类型,根据 所述预测类型与所述标注类型对所述识别模型进行收敛,得到所述训练后识别 模型。
可选的,在一些实施例中,所述显示单元,具体可以用于获取所述当前页 面的参数信息,生成网页内容推荐请求,所述网页内容推荐请求携带所述参数 信息、内容信息的类型和关键词,将所述网页内容推荐请求发送至所述推荐服 务器。
可选的,在一些实施例中,所述显示单元,具体可以用于接收所述推荐服 务器根据所述网页内容推荐请求推荐的网页内容,对所述推荐的网页内容的格 式进行调整,将调整后网页内容添加至所述当前页面的预设区域,并进行显示。
此外,本发明实施例还提供一种电子设备,包括处理器和存储器,所述存 储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序实现本发 明实施例提供的网页内容推荐方法。
此外,本发明实施例还提供一种计算机可读存储介质,所述计算机可读存 储介质存储有多条指令,所述指令适于处理器进行加载,以执行本发明实施例 所提供的任一种网页内容推荐方法中的步骤。
本发明实施例在获取用户浏览的当前页面后,该当前页面中包括内容信息, 采集用户在当前页面的浏览时间和操作指令信息,根据操作指令信息,生成用 户对当前页面的关注度,当关注度和浏览时间满足预设条件时,识别出内容信 息的类型,将类型发送至推荐服务器,并接收推荐服务器根据类型推荐的网页 内容,以显示在当前页面中;由于该方案通过用户在当前页面的浏览时间和操 作指令信息生成用户对该页面的关注度,基于该关注度对该页面的内容类型进 行识别,可以在实时场景下准确分析出用户的兴趣爱好,从而大大提高网页内 容推荐的精确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明 的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还 可以根据这些附图获得其他的附图。
图1是本发明实施例提供的网页内容推荐方法的场景示意图;
图2是本发明实施例提供的网页内容推荐方法的流程示意图;
图3是本发明实施例提供的初始页面的示意图;
图4是本发明实施例提供的当前页面的示意图;
图5是本发明实施例提供的当前页面显示推荐的网页内容的示意图;
图6是本发明实施例提供的当前页面的结构区域的示意图;
图7是本发明实施例提供的网页内容推荐方法的另一流程示意图;
图8是本发明实施例提供的网页内容推荐方法的交互示意图;
图9是本发明实施例提供的网页内容推荐装置的结构示意图;
图10是本发明实施例提供的网页内容推荐装置的获取单元的结构示意图;
图11是本发明实施例提供的网页内容推荐装置的第一生成单元的结构示 意图;
图12是本发明实施例提供的网页内容推荐装置的显示单元的结构示意图;
图13是本发明实施例提供的网页内容推荐装置的另一结构示意图;
图14是本发明实施例提供的网页内容推荐装置的另一结构示意图;
图15是本发明实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清 楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是 全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳 动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例提供一种网页内容推荐方法、装置和计算机可读存储介质。 具体的,本发明实施例提供适用于第一电子设备的网页内容推荐装置(为了区 分可以称为第一网页内容推荐装置)中,以及适用于第二电子设备的网页内容 推荐装置(为了区分可以称为第二网页内容推荐装置),其中,第一电子设备 可以为终端等设备,该终端可以为手机、平板电脑、笔记本电脑等设备。其中, 第二电子设备可以为服务器等网络侧设备。
比如,第一网页内容推荐装置可以在终端中,第二网页内容推荐装置可以 集成在服务器,该服务器可以是单台服务器,也可以是由多个服务器组成的服 务器集群。
本发明实施例将以第一电子设备为终端,第二电子设备为服务器为例,来 介绍网页内容推荐方法。
参考图1,本发明实施例提供了网页内容推荐系统包括终端10和推荐服务 器20等;终端10与推荐服务器20之间通过网络连接,比如,通过有线或无线网 络连接等,其中,第一网页内容推荐装置集成在终端中,比如,以客户端的形 式集成在终端中。
其中,终端10,可以用于获取用户浏览的当前页面,该当前页面中包括内 容信息,采集用户在当前页面的浏览时间和操作指令信息,根据操作指令信息, 生成用户对当前页面的关注度,当关注度和浏览时间满足预设条件时,识别出 所述内容信息的类型,将内容信息的类型发送至推荐服务器20,接收推荐服务 器20根据内容信息的类型推荐的网页内容,以显示在当前页面中。
其中,终端显示推荐的网页内容的方式有多种,比如,终端10可以接收推 荐服务器20根据识别结在内容数据库中查询到的网页内容。具体地,终端10 可以向推荐服务器20发送网页内容推荐请求,推荐服务器20可以具体用于:
接收终端发送的网页内容推荐请求,根据网页内容推荐请求生成多个查询 条件,对每个查询条件分配预设权重值,根述查询条件的权重值,将多个查询 条件进行融合,在内容数据库中查询融合后查询条件对应的至少一条网页内容, 将网页内容发送至终端。
以下分别进行详细说明。需要说明的是,以下实施例的描述顺序不作为对 实施例优选顺序的限定。
本实施例将从第一网页内容推荐装置的角度进行描述,该第一网页内容推 荐装置具体可以集成在电子设备中,该电子设备可以为终端等设备;其中,该 终端可以包括平板电脑、笔记本电脑、以及个人计算(PC,Personal Computer) 等设备。
一种网页内容推荐方法,包括:获取用户浏览的当前页面,该当前页面中 包括内容信息,采集用户在当前页面的浏览时间和操作指令信息,根据操作指 令信息,生成用户对当前页面的关注度,当关注度和浏览时间满足预设条件时, 识别出内容信息的类型,将类型发送至推荐服务器,并接收推荐服务器根据类 型推荐的网页内容,以显示在当前页面中。
本发明实施例提供的一种网页内容推荐方法,该方法可以由终端的处理器 执行,如图2所示,该网页内容推荐方法的具体流程如下:
101、获取用户浏览的当前页面,该当前页面中包括内容信息。
其中,当前页面可以为在用户最开始浏览的网页中过滤出与正文无关的内 容之后得到的页面,比如,可以为去除广告、无关图片和无关链接之后的网页。
其中,内容信息可以为当前页面的正文内容信息,比如,可以包括与正文 内容相关的文本、图片和/或音视频等信息。
(1)获取用户浏览的初始页面,该初始页面包括属性信息和初始内容信 息。
其中,初始页面可以为用户通过浏览器打开网址对应的初始网页页面,该 网页页面可以包括属性信息和初始内容信息,比如,用户通过浏览器输入 www.xxx.com的网址,在浏览器上显示的对应的网页页面,该网页页面上可以 显示各种控件,还可以显示包括多个区域的初始内容信息,该初始内容信息中 可以包括正文信息,还可以包括与正文无关的信息,譬如广告信息等,在网页 内部还可以包含该网页的属性信息,所谓属性信息为可以展现该初始网页页面 的属性的相关信息,比如,可以包括网页地址、网页的排版权限信息和/或支 撑初始网页页面内容的前端代码和预设的网页排版格式等信息。
例如,可以通过浏览器获取用户浏览的初始页面,如图3所示,比如,用 户通过浏览器输入特定网址,在浏览器上显示该网址对应的网页页面,通过抽 取浏览器中该网页页面的信息,获取用户浏览的初始页面。用户还可以通过触 发某个网页的链接控件,在浏览器上显示该链接控件对应的网页页面,通过抽 取该网页页面的信息,获取用户浏览的初始页面。
(2)根据属性信息,对初始页面的排版权限进行检测。
其中,排版权限可以为初始页面的排版格式是否支持重新排版的权限,比 如,初始页面的排版格式为A,A中存在多个区域,在某一个或者多个区域显 示正文内容,在其他区域显示广告等于正文无关的内容,此时,排版权限可以 为初始页面是否支持对原排版格式A进行修改或者删除之后,对初始页面的内 容进行过滤之后重新排版的权限。
例如,根据属性信息,通过向终端内的网页信息控件(WebView)中注入检 测代码,通过检测代码对初始页面的排版权限进行检测,比如,通过向终端内 的WebView中注入检测代码,然后可以通过WebView对初始页面属性信息中的 排版权限进行检测。
其中,该检测代码基于直译式脚本语言(JavaScript)编制而成。
(3)当检测结果指示所述初始页面支持重新排版时,在所述初始内容信 息中将与正文无关的内容过滤,得到所述内容信息。
例如,当检测结果指示初始页面支持重新排版时,在初始页面添加浏览控 件,当检测到用户针对浏览控件的触发操作时,对初始内容信息进行分类,根 据分类结果,将初始内容信息中与正文无关的内容过滤,得到内容信息,比如, 在初始页面添加浏览控件,当用户触发初始页面的浏览控件时,对初始页面的 初始内容信息按照类型进行分类,譬如,可以将初始页面的正文内容分为一类, 将与正文内容无关的广告内容信息和其他内容信息分为一类,将无正文内容无 关的那一类在初始内容信息中过滤掉,留下正文内容,将正文内容作为内容信 息,该内容信息可以包括与正文相关的文本、图像、视频和/或音频等信息。 当检测结果指示初始页面不支持重新排版时,停止下一步的步骤。
(4)按照预设策略对内容信息进行排版,根据排版后的内容信息生成当 前页面。
例如,将得到内容信息按预设策略进行排版,比如,可以按照预设的排版 模板对内容信息进行排版,预设的排版模板可以包括至少一个内容显示区域, 将内容信息填充至该区域,按照填充完内容区域的预设的排版模板,生成当前 页面,当前页面可以包括预留的推荐的网页内容显示区域,如图4所示。
102、采集用户在当前页面的浏览时间和操作指令信息。
其中,浏览时间可以为用户浏览当前页面花费的时间,操作指令信息可以 为用户通过外部接口或触发控件输入的操作指令信息,比如,对当前页面的滚 动、滑动、放大、缩小和/或关闭该页面等操作指令信息。
(1)采集用户在当前页面的浏览时间;
例如,采集用户在当前页面浏览时间的方式有多种,比如,可以采用计时 器对用户在当前页面的浏览时间进行采集,通过设定用户在打开初始页面时开 始计时,还可以设定在生成当前页面时开始计时,当用户通过触发关闭控件关 闭当前页面时,停止计时,如果用户不触发关闭控件,计时一直持续。也可以 采用在当前页面中设定时间标记点来采集用户在当前页面的浏览时间,在当前 页面的内容信息中设定多个时间标记点,譬如,A、B和C三个时间标记点,当 用户对当前页面进行浏览时拖动滑动进度条至A点,此时记为用户在当前页面 的浏览时间为5秒,当用户拖动滑动进度条至B点,此时记为用户在当前页面 的浏览时间为10秒,当用户拖动滑动进度条至C点,此时记为用户在当前页面 的浏览时间为15秒,若存在超多三个时间标记点的,依次类推。
其中需要说明的是,时间标记点的数量可以为任意正整数值,时间标记点 的数量需要根据实际应用来进行设定。
(2)采集用户在当前页面的操作指令信息。
例如,对用户通过外部接口或者控件输入的操作指令信息进行采集,比如, 采集用户通过鼠标滚轮、滚动控件或滚动触摸动作通过触摸屏输入至当前页面 滚动的操作指令信息,还可以采集用户通过滑动进度条控件输入至当前页面上 下滑动的操作指令信息,还可以采集用户通过键盘和鼠标输入对当前页面进行 放大或缩小的操作指令信息等。
103、根据操作指令信息,生成用户对当前页面的关注度。
其中,关注度可以为用户对浏览的当前页面的关注程度或者感兴趣的程度, 比如,根据用户对当前页面的浏览行为确定用户对当前浏览的关注程度或者感 兴趣程度,譬如,关注度的可以划分为多个程度的关注度,可以分为一般关注 的第一关注度和非常关注的第二关注度,具体划分关注度可以根据实际应用来 划分。
例如,在操作指令信息中提取出当前页面的滚动操作指令信息,在滚动操 作指令信息中筛选出当前页面的滚动频率,比如,在众多的操作指令信息中提 取出控制当前页面滚动的滚动操作指令信息,该滚动操作指令信息可以由用户 通过鼠标滚轮输入,在输入到浏览器中的当前页面的滚动操作指令信息中筛选 出该滚动操作指令信息中控制当前页面滚动速度的滚动频率。
对于滚动频率来说,当用户通过鼠标滚轮输入的滚动频率越快,则当前页 面的滚动速度就越快,滚动速度越快则说明用户在当前页面浏览内容信息的速 度越快,可以得出用户对当前页面的内容信息的关注度较低,若出现滚动频率 为零,则说明当前页面一直未动,也可以得出用户可能不在关注当前页面的内 容信息,也可以说明用户对当前页面的内容信息的关注度较低。基于浏览总时 间,生成用户对当前页面的第一关注度,比如,该浏览总时间为当前内容预估 或者计算需要全部浏览完需要的时间,当预估或者计算的浏览总时间超过预设 的一个时间值,且滚动频率超过预设频率阈值或者为零时,生成用户对当前页 面的第一关注度。
对于滚动频率来说,当用户的滚动频率未超过预设频率阈值且不为零时, 表明用户对当前页面的内容信息的浏览速度较慢,浏览速度较慢时,在同样多 的内容信息的前提下,花费的浏览时间必然会增加,可以得出用户对当前页面 的关注度较高。基于浏览总时间,生成用户对当前页面的第二关注度,比如, 当预估或者计算的浏览总时间未超过预设的一个时间值,且滚动频率超过预设 频率阈值或者不为零时,生成用户对当前页面的第二关注度。
可选的,在步骤“根据操作指令信息,生成用户对当前页面的关注度”之 前还可以根据当前页面的内容信息中文本内容的文本长度来判断是否有足够 的时间来在当前页面上推荐用户感兴趣的网页内容,当内容信息太少,用户在 当前页面浏览的时间太短,还未生成推荐内容,用户就已经触发关闭控件关闭 了当前页面,而且,如果内容信息太少,推荐的内容也不够精确,从而导致推 荐失败。因此,可以通过检测当前页面的内容信息的文本长度来判断内容信息 的容量是否满足生成推荐网页内容的时间和精准度。具体步骤如下:
在内容信息中提取文本内容;
对文本内容的文本长度进行检测;
当文本长度超过预设长度阈值时,计算用户浏览完内容信息所需的时间, 得到浏览总时间。
例如,在内容信息中提取文本内容,对文本内容的文本长度进行统计,比 如,可以统计该文本内容的字符数等文本长度数据。对文本内容的文本长度进 行检测,当文本内容的长度超多预设长度阈值时,计算用户浏览完内容信息所 需的时间,得到浏览总时间,比如,根据用户正常的浏览速度,譬如1秒可以 浏览20个字符,浏览5个图像等内容信息,通过文本内容中的字符数与浏览速 度,可以计算出浏览完全部的文本需要的浏览时间,通过图像的个数与浏览速 度,可以计算出浏览完全部的图像需要的浏览时间,音频和视频就按照文件本 身的时间长度作为浏览时间即可,因此,当内容信息中存在多个类型的文件时, 将该文件对应的浏览时间相加,即可得到用户浏览完全部内容信息所需的浏览 总时间,比如,当内容信息中存在文本和视频时,将计算出的浏览文本需要的 文本浏览时间和视频本身的时间长度相加,作为浏览总时间。
104、当关注度和浏览时间满足预设条件时,识别出内容信息的类型。
(1)当关注度为第一关注度时,根据浏览时间,识别出内容信息的类型
例如,当关注度为第一关注度时,获取第一关注度对应的第一预设比例阈 值,根据第一预设比例阈值和浏览总时间,计算出第一浏览时间阈值,当浏览 时间超过第一浏览时间阈值时,对内容信息进行识别,比如,以第一关注度对 应的第一预设比例阈值为1/2,浏览总时间为10秒为例,将浏览总时间与第一 预设比例阈值相乘,得到第一浏览时间阈值为5秒,当采集到用户在当前页面 的实时浏览时间超过5秒时,识别出内容信息的类型。
(2)当关注度为第二关注度时,根据浏览时间,识别出内容信息的类型。
例如,当关注度为第二关注度时,获取第二关注度对应的第二预设比例阈 值,根据第二预设比例阈值和浏览总时间,计算出第二浏览时间阈值,当浏览 时间超过第二浏览时间阈值时,对内容信息进行识别,比如,以第二关注度对 应的第二预设比例阈值为1/3,浏览总时间为12秒为例,将浏览总时间与第二 预设比例阈值相乘,得到第二浏览时间阈值为5秒,当采集到用户在当前页面 的实时浏览时间超过4秒时,识别出内容信息的类型。
可选的,识别出内容信息的类型,内容信息中可以包括文本、图像、音频 和/或视频等多种类型的信息,可以对各种类型的信息按类型分别进行识别, 还可以直接全部进行识别。主要是识别内容信息的类型,比如,该内容的类型 可以包括小说、娱乐、体育、军事、科技、财经和/或汽车等类型,还可以在 此基础上进行进一步的细化,譬如,以小说为例,可以为张三的小说,还可以 为李四的小说等。识别的方法,具体可以如下:
提取内容信息中的文本信息;
在文本信息中筛选出至少一个出现频率超过预设阈值的关键词;
根据关键词,采用训练后识别模型对内容信息的类型的进行识别。
例如,在内容信息中提取文本信息,该文本信息可以包括单独的文本内容, 还可以包括图像、音频和/或视频中的文本,在该文本信息中筛选出至少一个 出现频率超过预设阈值的关键词,根据关键词,采用训练后识别模型对内容信 息的类型进行识别。由于训练后识别模型需要集成在终端中,因此,可以采用 占用内存较小的识别模型,该识别模型可以为一个或者多个,具体如下:
对内容信息中的文本信息可以采用FastText简化版本的训练模型(一种文 本类型识别模型)进行识别,识别结果为文本信息的类型信息,具体可以为对 文本信息中的文本字符进行特征提取,得到文本信息中的词或词组的特征向量, 对特征向量进行线性变换后(即编码)映射到中间层,中间层进行解码,将解 码后的特征向量映射至预设类型标签库中进行识别,得到文本信息的类型。
对内容信息中的图像可以采用密集连接卷积神经网(DenseNet)进行类型 的识别,比如,可以通过卷积层对图像进行卷积处理,并经由池化层对卷积处 理结果进行最大池化处理后,依次采用不同的密集块对该最大池化层结果进行 处理,最后由分类层对密集块的输出结果进行分类识别,即可得到识别结果。 其中,不同的密集块之间可以通过过渡层连接,该过渡层用于将当前密集块的 输出数据调整为符合下一个密集块输入需求的数据。
同理,对内容信息中的视频和音频可以采用视频和音频中对应的识别模型, 对于视频而言,先提取视频中的画面帧,对每一帧采用图像识别的方法,对该 视频的类型进行识别,对音频而言,可以先对音频中内容进行识别,将音频的 内容转换为文本,再采用文本识别的方法,对音频的类型进行识别。
根据内容信息中存在的文件类型,采用对应的识别模型和识别方法,分别 识别出内容信息的类型,然后,将各自识别出的内容信息的类型和关键词进行 融合,得到内容信息的识别结果。比如,当内容信息中存在文本内容和图像内 容时,对文本内容进行识别得到的内容信息的类型为财经信息,对图像内容进 行识别得到的内容信息的类型为美国信息,内容信息中文本内容中的关键词为 特朗普,将三者融合,可以得到内容信息的类型为当前美国财经信息。
其中,该训练后识别模型可以根据实际应用的需求进行设置。
另外,需要说的是,该训练后识别模型可以由维护人员预先进行设置,也 可以由该网页内容推荐装置自行进行训练,即步骤“采用训练后识别模型对内 容信息的类型进行识别”之前,该网页内容推荐方法还可以包括:
(1)采集多个内容信息样本,该内容信息样本包括已标注类型的内容信 息;
例如,具体可以采集多个内容信息作为原始数据集,比如,从数据库或者 网络等获取该原始数据集,然后,对该原始数据集进行类型的标注,即可得到 标注类型的内容信息样本
(2)采用预设识别模型对内容信息样本的类型进行预测,得到内容信息 样本的预测类型;
例如,具体可以获取用户浏览的当前页面,该当前页面中包括内容信息样 本,采集用户在当前页面的浏览时间和操作指令信息,然后,根据操作指令信 息,生成用户对当前页面的关注度,根据关注度和浏览时间,对内容信息进行 预测,得到内容信息样本的预测类型。
其中,采集浏览时间和操作指令信息,并生成用户对当前页面的关注度, 具体可以参见前面实施例,在此不作赘述。
(3)根据预测类型与标注类型对识别模型进行收敛,得到训练后识别模 型;
例如,在本发明实施例中,可以通过插值损失函数,根据预测类型与标注 类型对识别模型进行收敛,得到训练后识别模型。譬如,具体可以如下:
采用Dice函数(一种损失函数),根据该数据集样本中预测类型与标注类 型对识别模型中用于识别内容信息类型的参数进行调整,以及通过插值损失函 数,根据该数据集样本中预测类型与标注类型对识别模型中用于识别内容信息 类型的参数进行调整,得到训练后识别模型。
可选的,为了提高上下文特征的精确性,除了采用Dice函数之外,还可以 采用其他的损失函数如交叉熵损失函数来进行收敛,具体可以如下:
采用交叉熵损失函数,根据该数据集样本中预测类型与标注类型对识别模 型中用于识别内容信息类型的参数进行调整,以及通过插值损失函数,根据该 数据集样本中预测类型与标注类型对识别模型中用于识别内容信息类型的参 数进行调整,得到训练后识别模型。
105、将类型发送至推荐服务器,并接收推荐服务器根据类型推荐的网页 内容,以显示在当前页面中。
其中,推荐服务器可以为生成推荐内容的服务器,该服务器可以根据终端 发送的识别结果,在内容数据库中查询该识别结果对应的网页内容,将该网页 内容推荐给终端。
(1)将类型发送至推荐服务器
例如,获取当前页面的参数信息,比如,获取当前页面的网页地址和网页 标题,如果用户通过个人登录当前页面的话,还可以获取当前页面用户登录的 用户名或者账号信息等作为参数信息。生成网页推荐请求,该网页推荐请求携 带参数信息、识别结果和关键词。比如,生成网页推荐请求,在该网页推荐请 求中添加参数信息、识别结果(即内容信息的类型)和关键词。将添加参数信 息、识别结果(即内容信息的类型)和关键词的网页内容推荐请求发送至推荐 服务器,发送的方式有多种,可以采用无线网络和有限网络,还可以采用数据 线直接发送。
(2)接收推荐服务器根据类型推荐的网页内容,以显示在当前页面中。
例如,接收推荐服务器根据网页内容推荐请求推荐的网页内容,对推荐的 网页内容的格式进行调整,比如,推荐服务器根据网页内容推荐请求推荐的网 页内容可以包括内容标题、地址或者页面的内容概况等信息,将该网页内容以 预装的样式组装成HTML(一种超文本标记语言)数据。将调整后的网页内容 添加至当前页面的预设区域,并进行显示,比如,将该HTML数据注入WebView 控件中,通过WebView控件将HTML数据动态拼接在当前页面的尾部,并进行 显示,如图5所述。在此需要强调的是,首先动态拼接在当前页面的尾部可以 为将当前页面划分为三个区域,一个为头部区域,一个为中间区域,剩下的一 个为尾部区域,如图6所示,头部区域用户显示当前页面的网络地址,中间区 域用于显示内容信息,中间区域存在一个使页面上下滑动的滑动控件,尾部区 域用于显示推荐的网页内容,也可以包括一个滑动控件,当用户通过滑动控件 滑动上头部和中间区域,浏览当前页面的内容信息,而尾部区域的推荐内容则 持续动态在当前页面的尾部,这种显示方式可以友好的显示推荐的网页内容, 对用户浏览内容信息不会产生干扰,其次,推荐服务器推荐的网页内容是基于 用户在当前页面正在浏览的内容构建的实时性场景下,根据用户对当前页面浏览的内容信息关注度或者感兴趣程序推荐的内容,与用户在当前页面正在浏览 的内容信息存在关联性,比如,用户在当前页面正在浏览的内容信息为美国经 济发展,则接收推荐的网页内容可以为与美国经济发展相关联的网页内容,将 该网页内容动态拼接在当前页面的尾部区域,用户浏览完当前页面的内容信息 后,可以直接在尾部区域点击或者触发该网页内容,可以在当前页面直接显示。 可以大大增加网页内容推荐的精准性和便捷性。
其中,HTML数据一种标识性的语言,可以包括一系列标签.通过这些标 签可以将网络上的文档格式统一,使分散的网络资源连接为一个逻辑整体。 HTML文本是由HTML命令组成的描述性文本,HTML命令可以说明文字,图 形、动画、声音、表格、链接等。
由以上可知,本发明实施例在获取用户浏览的当前页面后,该当前页面中 包括内容信息,采集用户在当前页面的浏览时间和操作指令信息,根据操作指 令信息,生成用户对当前页面的关注度,当关注度和浏览时间满足预设条件时, 识别出内容信息的类型,将类型发送至推荐服务器,并接收推荐服务器根据类 型推荐的网页内容,以显示在当前页面中;由于该方案通过用户在当前页面的 浏览时间和操作指令信息生成用户对该页面的关注度,基于该关注度对该页面 的内容类型进行识别,可以在实时场景下准确分析出用户的兴趣爱好,从而大 大提高网页内容推荐的精确性。
本实施例将从第二网页内容推荐装置的角度进行描述,该第二网页内容推 荐装置具体可以集成在电子设备中,该电子设备可以为服务器等设备,该服务 器设备可以为单台服务器,也可以为多台服务器组成的服务器群。
一种网页内容推荐方法,包括:接收终端发送的网页内容推荐请求,根据 网页内容推荐请求生成多个查询条件,对每个查询条件分配预设权重值,根据 查询条件的权重值,将多个查询条件进行融合,在内容数据库中查询融合后查 询条件对应的至少一条网页内容,将网页内容发送至所述终端。
本发明实施例提供的一种网页内容推荐方法,该方法可以由服务器的处理 器执行,如图7所示,该网页内容推荐方法的具体流程如下:
201、接收终端发送的网页内容推荐请求,并根据网页内容推荐请求中内 容信息的类型生成多个查询条件。
例如,接收终端通过有线网络和/或无线网络发送的网页内容推荐请求, 根据该内容推荐请求中携带的参数信息、识别结果和关键词生成多个查询条件, 比如,可以将参数信息中的用户在当前页面的用户名、内容信息的类型和内容 信息中的关键词分别作为查询条件。
202、对每个查询条件分配预设权重值,根据查询条件的权重值,将多个 查询条件进行融合。
例如,对每个查询条件分配预设权重值,根据查询条件的权重值,将多个 查询条件进行融合,得到融合后查询条件,比如,以查询条件为参数信息中的 当前页面的网页标题、用户名、内容信息的类型和关键词为例,对各个查询条 件分配预设的权重值,譬如,对网页标题分配的预设权重值为0.2,用户名的 预设权重值为0.1,内容信息的类型的预设权重值为0.4,关键词的预设权重值 为0.3,根据分配好的权重值,将各个查询条件进行融合,得到融合后查询条 件,融合后查询条件可以看成一个复合查询条件,该复合查询条件可以包括多 个查询条件,融合的过程可以为根据单个查询条件的权重值大小进行排序,将 权重大的查询条件排在复合查询条件中第一位,依次类推,可以得到复合查询 条件为内容信息的类型+关键词+网页标题+用户名,且该查询条件中还可以包 括以下查询逻辑,即在内容数据库中优先以查询内容信息的类型和关键词为初 始查询条件查询符合推荐条件的初始网页内容查询结果,在初始网页内容查询 结果中继续以网页标题+用户名为查询条件进行查询。
203、在内容数据库中查询融合后查询条件对应的至少一条网页内容,将 该网页内容发送至终端,以使得在终端的当前页面中显示与内容信息相关联的 网页内容。
例如,在内容数据库中查询融合后查询条件对应的至少一条网页内容,比 如,以融合后查询条件为内容信息的类型+关键词+网页标题+用户名为例,根 据该融合后查询条件中的查询逻辑在内容数据库中查询该融合后查询条件对 应的网页内容,譬如,在内容数据库中查询内容信息的类型为财经类信息+关 键词为美国经济对应的网页内容为10条,则再以网页标题为“美国当前经济发 展”+用户名为“看财经的段子手”为查询条件,在查询到的10条信息中查询 与之相关的网页内容3条,则将3条网页内容作为查询出的需要推荐给终端的网 页内容,可以3条全部发送给终端,也可以根据3条内容与查询条件的关联程度,挑选关联程度较高的网页内容发送给终端,发送给终端的方式也有多种,可以 通过无线网络或有限网络直接发送至终端,还可以通过第三方服务器作为中转 站发送给终端。还可以先向终端发送推送请求,当接收到终端的同意接收指令 之后,再将选择的网页内容发送至终端。通过将与用户在当前页面浏览的内容 信息相关联的推荐的网页内容发送至终端,以使得在终端的当前页面中显示与 内容信息相关联的网页内容。
由以上可知,本发明实施例在接收终端发送的网页内容推荐请求后,根据 网页内容推荐请求生成多个查询条件,对每个查询条件分配预设权重值,根据 查询条件的权重值,将多个查询条件进行融合,在内容数据库中查询融合后查 询条件对应的至少一条网页内容,将网页内容发送至终端;由于该方案可以根 据内容推荐请求生成多个查询条件,针对多个查询条件分配预设权重值,根据 预设权重值在内容数据库中查询推荐的网页内容,会大大提高网页内容推荐的 精确性。
根据上面实施例所描述的方法,以下将举例作进一步详细说明。
在本实施例中,将以该网页内容推荐装置具体集成在电子设备为例进行说 明。其中,该电子设备可以包括终端和服务器等设备。
如图8所示,一种网页内容推荐方法,其中,涉及到终端和服务器的交互, 具体流程如下:
301、终端获取用户浏览的初始页面,该初始页面包括属性信息和初始内 容信息。
例如,用户通过终端的浏览器输入特定网址,在浏览器上显示该网址对应 的网页页面,通过抽取浏览器中该网页页面的信息,获取用户浏览的初始页面。 用户还可以通过触发某个网页的链接控件,在浏览器上显示该链接控件对应的 网页页面,通过抽取该网页页面的信息,获取用户浏览的初始页面。
302、终端根据属性信息,对初始页面的排版权限进行检测。
例如,根据属性信息,终端通过向WebView中注入检测代码,然后可以通 过WebView对初始页面属性信息中的排版权限进行检测。
303、当检测结果指示所述初始页面支持重新排版时,终端在初始内容信 息中将与正文无关的内容过滤,得到内容信息。
例如,终端在初始页面添加浏览控件,当用户触发初始页面的浏览控件时, 对初始页面的初始内容信息按照类型进行分类,譬如,可以将初始页面的正文 内容分为一类,将与正文内容无关的广告内容信息和其他内容信息分为一类, 将无正文内容无关的那一类在初始内容信息中过滤掉,留下正文内容,将正文 内容作为内容信息,该内容信息可以包括与正文相关的文本、图像、视频和/ 或音频等信息。当检测结果指示初始页面不支持重新排版时,停止下一步的步 骤。
304、终端按照预设策略对内容信息进行排版,根据排版后的内容信息生 成当前页面。
例如,终端可以按照预设的排版模板对内容信息进行排版,预设的排版模 板可以包括至少一个内容显示区域,将内容信息填充至该区域,按照填充完内 容区域的预设的排版模板,生成当前页面。
305、终端采集用户在当前页面的浏览时间和操作指令信息。
(1)采集用户在当前页面的浏览时间;
例如,终端可以采用计时器对用户在当前页面的浏览时间进行采集,通过 设定用户在打开初始页面时开始计时,还可以设定在生成当前页面时开始计时, 当用户通过触发关闭控件关闭当前页面时,停止计时,如果用户不触发关闭控 件,计时一直持续。也可以采用在当前页面中设定时间标记点来采集用户在当 前页面的浏览时间,在当前页面的内容信息中设定多个时间标记点。
(2)终端采集用户在当前页面的操作指令信息。
例如,终端采集用户通过鼠标滚轮、滚动控件或滚动触摸动作通过触摸屏 输入至当前页面滚动的操作指令信息,还可以采集用户通过滑动进度条控件输 入至当前页面上下滑动的操作指令信息,还可以采集用户通过键盘和鼠标输入 对当前页面进行放大或缩小的操作指令信息等。
306、终端根据操作指令信息,生成用户对当前页面的关注度。
例如,终端在众多的操作指令信息中提取出控制当前页面滚动的滚动操作 指令信息,该滚动操作指令信息可以由用户通过鼠标滚轮输入,在输入到浏览 器中的当前页面的滚动操作指令信息中筛选出该滚动操作指令信息中控制当 前页面滚动速度的滚动频率。
可选的,对于滚动频率来说,当用户通过鼠标滚轮输入的滚动频率越快, 则当前页面的滚动速度就越快,滚动速度越快则说明用户在当前页面浏览内容 信息的速度越快,可以得出用户对当前页面的内容信息的关注度较低,若出现 滚动频率为零,则说明当前页面一直未动,也可以得出用户可能不在关注当前 页面的内容信息,也可以说明用户对当前页面的内容信息的关注度较低。基于 浏览总时间,生成用户对当前页面的第一关注度,比如,该浏览总时间为当前 内容预估或者计算需要全部浏览完需要的时间,当预估或者计算的浏览总时间 超过预设的一个时间值,且滚动频率超过预设频率阈值或者为零时,生成用户 对当前页面的第一关注度。
可选的,对于滚动频率来说,当用户的滚动频率未超过预设频率阈值且不 为零时,表明用户对当前页面的内容信息的浏览速度较慢,浏览速度较慢时, 在同样多的内容信息的前提下,花费的浏览时间必然会增加,可以得出用户对 当前页面的关注度较高。基于浏览总时间,生成用户对当前页面的第二关注度, 比如,当预估或者计算的浏览总时间未超过预设的一个时间值,且滚动频率超 过预设频率阈值或者不为零时,生成用户对当前页面的第二关注度。
可选的,终端可以通过检测当前页面的内容信息的文本长度来判断内容信 息的容量是否满足生成推荐网页内容的时间和精准度。具体步骤如下:
在内容信息中提取文本内容;
对文本内容的文本长度进行检测;
当文本长度超过预设长度阈值时,计算用户浏览完内容信息所需的时间, 得到浏览总时间。
例如,终端可以统计该文本内容的字符数等文本长度数据。然后,根据用 户正常的浏览速度,譬如1秒可以浏览20个字符,浏览5个图像等内容信息,通 过文本内容中的字符数与浏览速度,可以计算出浏览完全部的文本需要的浏览 时间,通过图像的个数与浏览速度,可以计算出浏览完全部的图像需要的浏览 时间,音频和视频就按照文件本身的时间长度作为浏览时间即可,因此,当内 容信息中存在多个类型的文件时,将该文件对应的浏览时间相加,即可得到用 户浏览完全部内容信息所需的浏览总时间,比如,当内容信息中存在文本和视 频时,将计算出的浏览文本需要的文本浏览时间和视频本身的时间长度相加, 作为浏览总时间。
307、终端当关注度和浏览时间满足预设条件时,识别出内容信息的类型。
(1)当关注度为第一关注度时,终端根据浏览时间,对内容信息进行识 别
例如,当关注度为第一关注度时,终端获取第一关注度对应的第一预设比 例阈值,以第一关注度对应的第一预设比例阈值为1/2,浏览总时间为10秒为 例,将浏览总时间与第一预设比例阈值相乘,得到第一浏览时间阈值为5秒, 当采集到用户在当前页面的实时浏览时间超过5秒时,识别出内容信息的类型。
(2)当关注度为第二关注度时,终端根据浏览时间,对内容信息进行识 别。
例如,当关注度为第二关注度时,终端获取第二关注度对应的第二预设比 例阈值,以第二关注度对应的第二预设比例阈值为1/3,浏览总时间为12秒为 例,将浏览总时间与第二预设比例阈值相乘,得到第二浏览时间阈值为5秒, 当采集到用户在当前页面的实时浏览时间超过4秒时,识别出内容信息的类型。
可选的,终端可以对内容信息的类型进行识别,内容信息中可以包括文本、 图像、音频和/或视频等多种类型的信息,可以对各种类型的信息按类型分别 进行识别,还可以直接全部进行识别。主要是识别内容信息的类型,比如,该 内容的类型可以包括小说、娱乐、体育、军事、科技、财经和/或汽车等类型, 还可以在此基础上进行进一步的细化,譬如,以小说为例,可以为张三的小说, 还可以为李四的小说等。识别的方法,具体可以如下:
提取内容信息中的文本信息;
在文本信息中筛选出至少一个出现频率超过预设阈值的关键词;
根据关键词,采用训练后识别模型对内容信息的类型的进行识别。
例如,终端在内容信息中提取文本信息,该文本信息可以包括单独的文本 内容,还可以包括图像、音频和/或视频中的文本,在该文本信息中筛选出至 少一个出现频率超过预设阈值的关键词,根据关键词,采用训练后识别模型对 内容信息的类型进行识别。由于训练后识别模型需要集成在终端中,因此,可 以采用占用内存较小的识别模型,该识别模型可以为一个或者多个,具体如下:
终端对内容信息中的文本信息可以采用FastText简化版本的训练模型(一 种文本类型识别模型)进行识别,识别结果为文本信息的类型信息,具体可以 为对文本信息中的文本字符进行特征提取,得到文本信息中的词或词组的特征 向量,对特征向量进行线性变换后(即编码)映射到中间层,中间层进行解码, 将解码后的特征向量映射至预设类型标签库中进行识别,得到文本信息的类型。
终端对内容信息中的图像可以采用密集连接卷积神经网(DenseNet)进行 类型的识别,比如,可以通过卷积层对图像进行卷积处理,并经由池化层对卷 积处理结果进行最大池化处理后,依次采用不同的密集块对该最大池化层结果 进行处理,最后由分类层对密集块的输出结果进行分类识别,即可得到识别结 果。其中,不同的密集块之间可以通过过渡层连接,该过渡层用于将当前密集 块的输出数据调整为符合下一个密集块输入需求的数据。
同理,终端对内容信息中的视频和音频可以采用视频和音频中对应的识别 模型,对于视频而言,先提取视频中的画面帧,对每一帧采用图像识别的方法, 对该视频的类型进行识别,对音频而言,可以先对音频中内容进行识别,将音 频的内容转换为文本,再采用文本识别的方法,对音频的类型进行识别。
根据内容信息中存在的文件类型,采用对应的识别模型和识别方法,分别 识别出内容信息的类型,然后,将各自识别出的内容信息的类型和关键词进行 融合,得到内容信息的识别结果。比如,当内容信息中存在文本内容和图像内 容时,对文本内容进行识别得到的内容信息的类型为财经信息,对图像内容进 行识别得到的内容信息的类型为美国信息,内容信息中文本内容中的关键词为 特朗普,将三者融合,可以得到内容信息的类型为当前美国财经信息。
其中,该训练后识别模型可以根据实际应用的需求进行设置。
另外,需要说的是,该训练后识别模型可以由维护人员预先进行设置,也 可以由该网页内容推荐装置自行进行训练,即步骤“采用训练后识别模型对内 容信息的类型进行识别”之前,该网页内容推荐方法还可以包括:
(1)终端采集多个内容信息样本,该内容信息样本包括已标注类型的内 容信息;
例如,终端从数据库或者网络等获取该原始数据集,然后,对该原始数据 集进行类型的标注,即可得到标注类型的内容信息样本
(2)终端采用预设识别模型对内容信息样本的类型进行预测,得到内容 信息样本的预测类型;
例如,具体可以获取用户浏览的当前页面,该当前页面中包括内容信息样 本,采集用户在当前页面的浏览时间和操作指令信息,然后,根据操作指令信 息,生成用户对当前页面的关注度,根据关注度和浏览时间,对内容信息进行 预测,得到内容信息样本的预测类型。
其中,采集浏览时间和操作指令信息,并生成用户对当前页面的关注度, 具体可以参见前面实施例,在此不作赘述。
(3)终端根据预测类型与标注类型对识别模型进行收敛,得到训练后识 别模型;
例如,在本发明实施例中,可以通过插值损失函数,根据预测类型与标注 类型对识别模型进行收敛,得到训练后识别模型。譬如,具体可以如下:
采用Dice函数(一种损失函数),根据该数据集样本中预测类型与标注类 型对识别模型中用于识别内容信息类型的参数进行调整,以及通过插值损失函 数,根据该数据集样本中预测类型与标注类型对识别模型中用于识别内容信息 类型的参数进行调整,得到训练后识别模型。
可选的,为了提高上下文特征的精确性,除了采用Dice函数之外,还可以 采用其他的损失函数如交叉熵损失函数来进行收敛,具体可以如下:
采用交叉熵损失函数,根据该数据集样本中预测类型与标注类型对识别模 型中用于识别内容信息类型的参数进行调整,以及通过插值损失函数,根据该 数据集样本中预测类型与标注类型对识别模型中用于识别内容信息类型的参 数进行调整,得到训练后识别模型。
308、终端将内容信息的类型发送至推荐服务器。
例如,终端获取当前页面的网页地址和网页标题,如果用户通过个人登录 当前页面的话,还可以获取当前页面用户登录的用户名或者账号信息等作为参 数信息。生成网页推荐请求,在该网页推荐请求中添加参数信息、内容信息的 类型和关键词。将添加参数信息、内容信息的类型和关键词的网页内容推荐请 求发送至推荐服务器,发送的方式有多种,可以采用无线网络和有限网络,还 可以采用数据线直接发送。
309、推荐服务器接收终端发送的网页内容推荐请求,并根据网页内容推 荐请求中内容信息的类型生成多个查询条件。
例如,接收终端通过有线网络和/或无线网络发送的网页内容推荐请求, 根据该内容推荐请求中携带的参数信息、网页内容的类型和关键词生成多个查 询条件,比如,可以将参数信息中的用户在当前页面的用户名、内容信息的类 型和内容信息中的关键词分别作为查询条件。
310、推荐服务器对每个查询条件分配预设权重值,根据查询条件的权重 值,将多个查询条件进行融合。
例如,推荐服务器对每个查询条件分配预设权重值,以查询条件为参数信 息中的当前页面的网页标题、用户名、内容信息的类型和关键词为例,对各个 查询条件分配预设的权重值,比如,对网页标题分配的预设权重值为0.2,用 户名的预设权重值为0.1,内容信息的类型的预设权重值为0.4,关键词的预设 权重值为0.3,根据分配好的权重值,将各个查询条件进行融合,得到融合后 查询条件,融合后查询条件可以看成一个复合查询条件,该复合查询条件可以 包括多个查询条件,融合的过程可以为根据单个查询条件的权重值大小进行排 序,将权重大的查询条件排在复合查询条件中第一位,依次类推,可以得到复合查询条件为内容信息的类型+关键词+网页标题+用户名,且该查询条件中还 可以包括以下查询逻辑,即在内容数据库中优先以查询内容信息的类型和关键 词为初始查询条件查询符合推荐条件的初始网页内容查询结果,在初始网页内 容查询结果中继续以网页标题+用户名为查询条件进行查询。
311、推荐服务器在内容数据库中查询融合后查询条件对应的至少一条网 页内容,将该网页内容发送至终端,以使得在终端的当前页面中显示与内容信 息相关联的网页内容。
例如,以融合后查询条件为内容信息的类型+关键词+网页标题+用户名为 例,终端根据该融合后查询条件中的查询逻辑在内容数据库中查询该融合后查 询条件对应的网页内容,比如,在内容数据库中查询内容信息的类型为财经类 信息+关键词为美国经济对应的网页内容为10条,则再以网页标题为“美国当 前经济发展”+用户名为“看财经的段子手”为查询条件,在查询到的10条信 息中查询与之相关的网页内容3条,则将3条网页内容作为查询出的需要推荐给 终端的网页内容,可以3条全部发送给终端,也可以根据3条内容与查询条件的 关联程度,挑选关联程度较高的网页内容发送给终端,发送给终端的方式也有 多种,可以通过无线网络或有限网络直接发送至终端,还可以通过第三方服务 器作为中转站发送给终端。还可以先向终端发送推送请求,当接收到终端的同 意接收指令之后,再将选择的网页内容发送至终端。通过将与用户在当前页面 浏览的内容信息相关联的推荐的网页内容发送至终端,以使得在终端的当前页 面中显示与内容信息相关联的网页内容。
312、终端接收推荐服务器根据识别结果推荐的网页内容,以显示在当前 页面中。
例如,终端接收推荐服务器根据网页内容推荐请求推荐的网页内容,推荐 服务器根据网页内容推荐请求推荐的网页内容可以包括内容标题、地址或者页 面的内容概况等信息,终端将该网页内容以预装的样式组装成HTML(一种超 文本标记语言)数据。将调整后的网页内容添加至当前页面的预设区域,并进 行显示,比如,将该HTML数据注入WebView控件中,通过WebView控件将 HTML数据动态拼接在当前页面的尾部,并进行显示。
由以上可知,本发明实施例的终端在获取用户浏览的当前页面后,该当前 页面中包括内容信息,采集用户在当前页面的浏览时间和操作指令信息,根据 操作指令信息,生成用户对当前页面的关注度,当关注度和浏览时间满足预设 条件时,识别出内容信息的类型,将类型发送至推荐服务器,推荐服务器在接 收终端发送的网页内容推荐请求后,根据网页内容推荐请求生成多个查询条件, 对每个查询条件分配预设权重值,根据查询条件的权重值,将多个查询条件进 行融合,在内容数据库中查询融合后查询条件对应的至少一条网页内容,将网 页内容发送至终端,终端接收推荐服务器根据类型推荐的网页内容,以显示在 当前页面中,由于该方案通过用户在当前页面的浏览时间和操作指令信息生成 用户对该页面的关注度,基于该关注度对该页面的内容类型进行识别,可以在 实时场景下准确分析出用户的兴趣爱好,从而大大提高网页内容推荐的精确性。
为了更好地实施以上方法,本发明实施例还提供一种网页内容推荐装置 (第一网页内容推荐装置),该第一网页内容推荐装置可以集成在电子设备, 比如终端等设备中,该终端可以包括平板电脑、笔记本电脑和/或个人计算机 等。
例如,如图9所示,该第一网页内容推荐装置可以包括获取单元401、第一 采集单元402、第一生成单元403、识别单元404、显示单元405如下:
(1)获取单元401;
获取单元401,用于获取用户浏览的当前页面,当前页面中包括内容信息;
其中,获取单元401还可以包括第一获取子单元4011、检测子单元4012、 过滤子单元4013、排版子单元4014和第一生成子单元4015,如图10所述,具体 如下:
第一获取子单元4011,用于获取所述用户浏览的初始页面,所述初始页面 包括属性信息和初始内容信息;
检测子单元4012,用于根据属性信息,对初始页面的排版权限进行检测;
过滤子单元4013,用于当检测结果指示初始页面支持重新排版时,在初始 内容信息中将与正文无关的内容过滤,得到内容信息;
排版子单元4014,用于按照预设策略对内容信息进行排版;
第一生成子单元4015,用于根据排版后的内容信息生成当前页面。
例如,第一获取子单元4011获取所述用户浏览的初始页面,所述初始页面 包括属性信息和初始内容信息,检测子单元4012根据所述属性信息,对初始页 面的排版权限进行检测,过滤子单元4013,当检测结果指示所述初始页面支持 重新排版时,在所述初始内容信息中将与正文无关的内容过滤,得到所述内容 信息,排版子单元4014,按照预设策略对所述内容信息进行排版,第一生成子 单元4015根据排版后的所述内容信息生成所述当前页面。
(2)第一采集单元402;
第一采集单元402,用于采集用户在当前页面的浏览时间和操作指令信息。
例如,第一采集单元402,具体可以用于可以采用计时器对用户在当前页 面的浏览时间进行采集,还可以采用在当前页面中设定时间标记点来采集用户 在当前页面的浏览时间,采集用户通过鼠标滚轮输入至当前页面滚动的操作指 令信息,还可以采集用户通过滑动进度条控件输入至当前页面上下滑动的操作 指令信息,还可以采集用户通过键盘和鼠标输入对当前页面进行放大或缩小的 操作指令信息等。
(3)第一生成单元403;
第一生成单元403,用于根据操作指令信息,生成用户对当前页面的关注 度。
其中,第一生成单元403可以包括第一提取子单元4031、筛选子单元4032 和第二生成子单元4033,如图11所述,具体如下:
第一提取子单元4031,用于在操作指令信息中提取出当前页面的滚动操作 指令信息;
筛选子单元4032,用于在滚动操作指令信息中筛选出当前页面的滚动频率;
第二生成子单元4033,用于当滚动频率超过预设频率阈值或者为零时,基 于浏览总时间,生成用户对当前页面的第一关注度,当滚动频率未超过预设频 率阈值且不为零时,基于浏览总时间,生成用户对所述当前页面的第二关注度。
例如,提取子单元4031在操作指令信息中提取出当前页面的滚动操作指令 信息,筛选子单元4032在滚动操作指令信息中筛选出当前页面的滚动频率,第 二生成子单元4033当滚动频率超过预设频率阈值或者为零时,基于浏览总时间, 生成用户对当前页面的第一关注度,当滚动频率未超过预设频率阈值且不为零 时,基于浏览总时间,生成用户对所述当前页面的第二关注度。
(4)识别单元404
识别单元404,用于根据所述关注度和所述浏览时间,对所述内容信息进 行识别。
例如,当关注度为所述第一关注度时,获取第一关注度对应的第一预设比 例阈值,根据第一预设比例阈值和所述浏览总时间,计算出第一浏览时间阈值, 当浏览时间超过所述第一浏览时间阈值时,对所述内容信息进行识别;当关注 度为第二关注度时,获取第一关注度对应的第二预设比例阈值,根据第二预设 比例阈值和浏览总时间,计算出第二浏览时间阈值,当浏览时间超过第二浏览 时间阈值时,对所述内容信息进行识别。其中具体识别过程可以包括提取所述 内容信息中的文本信息,在所述文本信息中筛选出至少一个出现频率超过预设 阈值的关键词,根据所述关键词,采用训练后识别模型对所述内容信息的类型 的进行识别。
(5)显示单元405;
显示单元405,用于将类型发送至推荐服务器,并接收推荐服务器根据类 型推荐的网页内容,以显示在当前页面中。
其中,显示单元405可以包括第一发送子单元4051、第一接收子单元4052、 调整子单元4053和显示子单元4054,如图12所示,具体如下:
第一发送子单元4051,用于获取当前页面的参数信息,生成网页内容推荐 请求,该网页内容推荐请求携带参数信息、内容信息的类型和关键词,将网页 内容推荐请求发送至推荐服务器;
第一接收子单元4052,用于接收推荐服务器根据网页内容推荐请求推荐的 网页内容;
调整子单元4053,用于对推荐的网页内容的格式进行调整;
显示子单元4054,用于将调整后网页内容添加至当前页面的预设区域,并 进行显示。
例如,第一发送子单元4051获取当前页面的参数信息,生成网页内容推荐 请求,该网页内容推荐请求携带参数信息、内容信息的类型和关键词,将网页 内容推荐请求发送至推荐服务器,第一接收子单元4052接收推荐服务器根据网 页内容推荐请求推荐的网页内容,调整子单元4053对推荐的网页内容的格式进 行调整,显示子单元4054将调整后网页内容添加至当前页面的预设区域,并进 行显示。
可选的,识别单元404中训练后识别模型可以除了由运维人员预先进行设 置之外,也可以由该识别模型自行训练来得到。即如图13所示,该网页内容推 荐装置还可以包括采集单元406和训练单元407,如下:
第二采集单元406,用于采集多个内容信息样本,该内容信息样本包括已 标注类型的内容信息。
例如,第二采集单元406,具体可以用于从数据库或者网络等获取该原始 数据集,然后,对该原始数据集进行类型的标注,即可得到标注类型的内容信 息样本。
训练单元407,用于采用预设识别模型对内容信息样本的类型进行预测, 得到内容信息样本的预测类型,根据预测类型与标注类型对识别模型进行收敛, 得到训练后识别模型。
例如,训练单元407,具体可以用于获取用户浏览的当前页面,该当前页 面中包括内容信息样本,采集用户在当前页面的浏览时间和操作指令信息,然 后,根据操作指令信息,生成用户对当前页面的关注度,当关注度和浏览时间 满足预设条件时,对内容信息的类型进行预测,得到内容信息样本的预测类型, 根据预测类型与标注类型对识别模型进行收敛,得到训练后识别模型。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意 组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的 方法实施例,在此不再赘述。
由以上可知,本发明实施例在获取单元401获取用户浏览的当前页面后, 该当前页面中包括内容信息,第一采集单元402采集用户在当前页面的浏览时 间和操作指令信息,然后,生成单元403根据操作指令信息,生成用户对当前 页面的关注度,识别单元404当关注度和浏览时间满足预设条件时,识别出内 容信息的类型,显示单元将类型发送至推荐服务器,并接收推荐服务器根据类 型推荐的网页内容,以显示在所述当前页面中;由于该方案通过用户在当前页 面的浏览时间和操作指令信息生成用户对该页面的关注度,基于该关注度对该 页面的内容类型进行识别,可以在实时场景下准确分析出用户的兴趣爱好,从 而大大提高网页内容推荐的精确性。
为了更好地实施以上方法,本发明实施例还提供一种网页内容推荐装置 (第二网页内容推荐装置),该网页内容推荐装置可以集成在电子设备,比如 服务器等设备。
例如,如图14所示,该第二网页内容推荐装置可以包括接收单元501、第 二生成单元502、分配单元503、融合单元504、查询单元505和发送单元506, 如下:
接收单元501,用于接收终端发送的网页内容推荐请求,该网页内容推荐 请求包括内容信息的类型;
第二生成单元502,用于根据内容信息的类型生成多个查询条件;
分配单元503,用于对每个查询条件分配预设权重值;
融合单元504,用于根据查询条件的权重值,将多个查询条件进行融合;
查询单元505,用于在内容数据库中查询融合后查询条件对应的至少一条 网页内容;
发送单元506,用于将网页内容发送至终端,以使得在所述终端的当前页 面中显示与所述内容信息相关联的所述网页内容。
例如,接收单元501接收终端发送的网页内容推荐请求,该网页内容推荐 请求包括内容信息的类型,第二生成单元502根据内容信息的类型网页内容推 荐请求生成多个查询条件,分配单元503对每个查询条件分配预设权重值,融 合单元504根据查询条件的权重值,将多个查询条件进行融合,查询单元505 在内容数据库中查询融合后查询条件对应的至少一条网页内容,发送单元506 将网页内容发送至终端,以使得在所述终端的当前页面中显示与所述内容信息 相关联的所述网页内容。
具体实施时,以上各个单元可以作为独立的实体来实现,也可以进行任意 组合,作为同一或若干个实体来实现,以上各个单元的具体实施可参见前面的 方法实施例,在此不再赘述。
由以上可知,本实施例在接收单元501接收终端发送的网页内容推荐请求, 该网页内容推荐请求包括内容信息的类型,第二生成单元502根据内容信息的 类型网页内容推荐请求生成多个查询条件,分配单元503对每个查询条件分配 预设权重值,融合单元504根据查询条件的权重值,将多个查询条件进行融合, 查询单元505在内容数据库中查询融合后查询条件对应的至少一条网页内容, 发送单元506将网页内容发送至终端,以使得在所述终端的当前页面中显示与 所述内容信息相关联的所述网页内容;由于该方案可以根据内容推荐请求生成 多个查询条件,针对多个查询条件分配预设权重值,根据预设权重值在内容数 据库中查询推荐的网页内容,会大大提高网页内容推荐的精确性。
本发明实施例还提供一种电子设备,如图15所示,其示出了本发明实施例 所涉及的电子设备的结构示意图,具体来讲:
该电子设备可以包括一个或者一个以上处理核心的处理器601、一个或一 个以上计算机可读存储介质的存储器602、电源603和输入单元604等部件。 本领域技术人员可以理解,图15中示出的电子设备结构并不构成对电子设备 的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的 部件布置。其中:
处理器601是该电子设备的控制中心,利用各种接口和线路连接整个电子 设备的各个部分,通过运行或执行存储在存储器602内的软件程序和/或模块, 以及调用存储在存储器602内的数据,执行电子设备的各种功能和处理数据, 从而对电子设备进行整体监控。可选的,处理器601可包括一个或多个处理核 心;优选的,处理器601可集成应用处理器和调制解调处理器,其中,应用处 理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无 线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器601中。
存储器602可用于存储软件程序以及模块,处理器601通过运行存储在存 储器602的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器 602可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、 至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存 储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器602可以 包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存 储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器602还可以 包括存储器控制器,以提供处理器601对存储器602的访问。
电子设备还包括给各个部件供电的电源603,优选的,电源603可以通过 电源管理系统与处理器601逻辑相连,从而通过电源管理系统实现管理充电、 放电、以及功耗管理等功能。电源603还可以包括一个或一个以上的直流或交 流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态 指示器等任意组件。
该电子设备还可包括输入单元604,该输入单元604可用于接收输入的数 字或字符信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、 光学或者轨迹球信号输入。
尽管未示出,电子设备还可以包括显示单元等,在此不再赘述。具体在本 实施例中,电子设备中的处理器601会按照如下的指令,将一个或一个以上的 应用程序的进程对应的可执行文件加载到存储器602中,并由处理器601来运行 存储在存储器602中的应用程序,从而实现各种功能,如下:
获取用户浏览的当前页面,该当前页面中包括内容信息,采集用户在当前 页面的浏览时间和操作指令信息,根据操作指令信息,生成用户对当前页面的 关注度,当关注度和浏览时间满足预设条件时,识别出内容信息的类型,将类 型发送至推荐服务器,并接收推荐服务器根据类型推荐的网页内容,以显示在 当前页面中。
或者
接收终端发送的网页内容推荐请求,该网页内容推荐请求包括内容信息的 类型,根据内容信息的类型网页内容推荐请求生成多个查询条件,对每个查询 条件分配预设权重值,根据查询条件的权重值,将多个查询条件进行融合,在 内容数据库中查询融合后查询条件对应的至少一条网页内容,将网页内容发送 至终端,以使得在所述终端的当前页面中显示与所述内容信息相关联的所述网 页内容。
以上各个操作的具体实施可参见前面的实施例,在此不作赘述。
由以上可知,本发明实施例的电子设备可以根据用户的当前页面的内容信 息推荐网页内容,并进行显示,可以在实时场景下准确分析出用户的兴趣爱好, 从而大大提高网页内容推荐的精确性。
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步 骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储 于一计算机可读存储介质中,并由处理器进行加载和执行。
为此,本发明实施例提供一种计算机可读存储介质,其中存储有多条指令, 该指令能够被处理器进行加载,以执行本发明实施例所提供的任一种网页内容 推荐方法中的步骤。例如,该指令可以执行如下步骤:
获取用户浏览的当前页面,该当前页面中包括内容信息,采集用户在当前 页面的浏览时间和操作指令信息,根据操作指令信息,生成用户对当前页面的 关注度,当关注度和浏览时间满足预设条件时,识别出内容信息的类型,将类 型发送至推荐服务器,并接收推荐服务器根据类型推荐的网页内容,以显示在 当前页面中。
或者
接收终端发送的网页内容推荐请求,该网页内容推荐请求包括内容信息的 类型,根据内容信息的类型网页内容推荐请求生成多个查询条件,对每个查询 条件分配预设权重值,根据查询条件的权重值,将多个查询条件进行融合,在 内容数据库中查询融合后查询条件对应的至少一条网页内容,将网页内容发送 至终端,以使得在所述终端的当前页面中显示与所述内容信息相关联的所述网 页内容。
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
其中,该计算机可读存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取记忆体(RAM,Random Access Memory)、磁盘或光盘等。
由于该计算机可读存储介质中所存储的指令,可以执行本发明实施例所提 供的任一种网页内容推荐方法中的步骤,因此,可以实现本发明实施例所提供 的任一种网页内容推荐方法所能实现的有益效果,详见前面的实施例,在此不 再赘述。
以上对本发明实施例所提供的一种网页内容推荐方法、装置和计算机可读 存储介质进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式 进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想; 同时,对于本领域的技术人员,依据本发明的思想,在具体实施方式及应用范 围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

Claims (15)

1.一种网页内容推荐方法,其特征在于,包括:
获取用户浏览的当前页面,所述当前页面中包括内容信息;
采集用户在所述当前页面的浏览时间和操作指令信息;
根据所述操作指令信息,生成所述用户对当前页面的关注度;
当所述关注度和所述浏览时间满足预设条件时,识别出所述内容信息的类型;
将所述类型发送至推荐服务器,并接收所述推荐服务器根据所述类型推荐的网页内容,以显示在所述当前页面中。
2.根据权利要求1所述的网页内容推荐方法,其特征在于,所述获取用户浏览的当前页面,包括:
获取所述用户浏览的初始页面,所述初始页面包括属性信息和初始内容信息;
根据所述属性信息,对初始页面的排版权限进行检测;
当检测结果指示所述初始页面支持重新排版时,在所述初始内容信息中将与正文无关的内容过滤,得到所述内容信息;
按照预设策略对所述内容信息进行排版;
根据排版后的所述内容信息生成所述当前页面。
3.根据权利要求2所述的网页内容推荐方法,其特征在于,所述在所述初始内容信息中将与正文无关的内容过滤,得到所述内容信息,包括:
在所述初始页面添加浏览控件;
当检测到所述用户针对所述浏览控件的触发操作时,对所述初始内容信息进行分类;
根据分类结果,将所述初始内容信息中与正文无关的内容过滤,得到所述内容信息。
4.根据权利要求1所述的网页内容推荐方法,其特征在于,所述根据所述操作指令信息,生成所述用户对当前页面的关注度之前,包括:
在所述内容信息中提取文本内容;
对所述文本内容的文本长度进行检测;
当所述文本长度超过预设长度阈值时,计算所述用户浏览完所述内容信息所需的时间,得到浏览总时间。
5.根据权利要求4所述的网页内容推荐方法,其特征在于,所述根据所述操作指令信息,生成所述用户对当前页面的关注度,包括:
在所述操作指令信息中提取出所述当前页面的滚动操作指令信息;
在所述滚动操作指令信息中筛选出所述当前页面的滚动频率;
当所述滚动频率超过预设频率阈值或者为零时,基于所述浏览总时间,生成所述用户对所述当前页面的第一关注度;
当所述滚动频率未超过预设频率阈值且不为零时,基于所述浏览总时间,生成所述用户对所述当前页面的第二关注度。
6.根据权利要求5所述的网页内容推荐方法,其特征在于,所述当所述关注度和所述浏览时间满足预设条件时,识别出所述内容信息的类型,包括:
当所述关注度为所述第一关注度时,获取所述第一关注度对应的第一预设比例阈值;
根据所述第一预设比例阈值和所述浏览总时间,计算出第一浏览时间阈值;
当所述浏览时间超过所述第一浏览时间阈值时,识别出所述内容信息的类型。
7.根据权利要求5所述的网页内容推荐方法,其特征在于,所述当所述关注度和所述浏览时间满足预设条件时,识别出所述内容信息的类型,还包括:
当所述关注度为所述第二关注度时,获取所述第一关注度对应的第二预设比例阈值;
根据所述第二预设比例阈值和所述浏览总时间,计算出第二浏览时间阈值;
当所述浏览时间超过所述第二浏览时间阈值时,识别出所述内容信息的类型。
8.根据权利要求6或7任一项所述的网页内容推荐方法,其特征在于,所述识别出所述内容信息的类型,包括:
提取所述内容信息中的文本信息;
在所述文本信息中筛选出至少一个出现频率超过预设阈值的关键词;
根据所述关键词,采用训练后识别模型识别出所述内容信息的类型。
9.根据权利要求8所述的网页内容推荐方法,其特征在于,所述采用训练后识别模型识别出所述内容信息的类型之前,还包括:
采集多个内容信息样本,所述内容信息样本包括已标注类型的内容信息;
采用预设识别模型对所述内容信息样本的类型进行预测,得到所述内容信息样本的预测类型;
根据所述预测类型与所述标注类型对所述识别模型进行收敛,得到所述训练后识别模型。
10.根据权利要求8所述的网页内容推荐方法,其特征在于,所述将所述类型发送至推荐服务器,包括:
获取所述当前页面的参数信息;
生成网页内容推荐请求,所述网页内容推荐请求携带所述参数信息、内容信息的类型和关键词;
将所述网页内容推荐请求发送至所述推荐服务器。
11.根据权利要求10所述的网页内容推荐方法,其特征在于,所述接收所述推荐服务器根据所述类型推荐的网页内容,以显示在所述当前页面中,包括:
接收所述推荐服务器根据所述网页内容推荐请求推荐的网页内容;
对所述推荐的网页内容的格式进行调整;
将调整后网页内容添加至所述当前页面的预设区域,并进行显示。
12.一种网页内容推荐方法,其特征在于,包括:
接收终端发送的网页内容推荐请求,所述网页内容推荐请求包括内容信息的类型;
根据所述内容信息的类型生成多个查询条件;
对每个查询条件分配预设权重值;
根据所述查询条件的权重值,将所述多个查询条件进行融合;
在所述内容数据库中查询融合后查询条件对应的至少一条网页内容;
将所述网页内容发送至所述终端,以使得在所述终端的当前页面中显示与所述内容信息相关联的所述网页内容。
13.一种网页内容推荐装置,其特征在于,包括:
获取单元,用于获取用户浏览的当前页面,所述当前页面中包括内容信息;
第一采集单元,用于采集用户在所述当前页面的浏览时间和操作指令信息;
第一生成单元,用于根据所述操作指令信息,生成所述用户对当前页面的关注度;
识别单元,用于当所述关注度和所述浏览时间满足预设条件时,识别出所述内容信息的类型;
显示单元,用于将所述类型发送至推荐服务器,并接收所述推荐服务器根据所述类型推荐的网页内容,以显示在所述当前页面中。
14.一种网页内容推荐装置,其特征在于,包括:
接收单元,用于接收终端发送的网页内容推荐请求,所述网页内容推荐请求包括内容信息的类型;
第二生成单元,用于根据所述内容信息的类型生成多个查询条件;
分配单元,用于对每个查询条件分配预设权重值;
融合单元,用于根据所述查询条件的权重值,将所述多个查询条件进行融合;
查询单元,用于在所述内容数据库中查询融合后查询条件对应的至少一条网页内容;
发送单元,用于将所述网页内容发送至所述终端,以使得在所述终端的当前页面中显示与所述内容信息相关联的所述网页内容。
15.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至12任一项所述的网页内容推荐方法中的步骤。
CN201911008928.3A 2019-10-23 2019-10-23 一种网页内容推荐方法、装置和计算机可读存储介质 Active CN112699295B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911008928.3A CN112699295B (zh) 2019-10-23 2019-10-23 一种网页内容推荐方法、装置和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911008928.3A CN112699295B (zh) 2019-10-23 2019-10-23 一种网页内容推荐方法、装置和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112699295A true CN112699295A (zh) 2021-04-23
CN112699295B CN112699295B (zh) 2023-12-12

Family

ID=75504859

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911008928.3A Active CN112699295B (zh) 2019-10-23 2019-10-23 一种网页内容推荐方法、装置和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112699295B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515335A (zh) * 2021-05-20 2021-10-19 口碑(上海)信息技术有限公司 一种服务信息展示形式的确定方法、装置以及电子设备
CN113536108A (zh) * 2021-05-31 2021-10-22 珠海大横琴科技发展有限公司 一种信息推荐的方法和装置
CN114339441A (zh) * 2022-03-16 2022-04-12 海看网络科技(山东)股份有限公司 一种iptv中实现直点互通功能的方法
CN114491244A (zh) * 2022-01-12 2022-05-13 北京元年科技股份有限公司 基于大数据优化资源配置的方法、装置、设备及存储介质
CN116738072A (zh) * 2023-08-15 2023-09-12 深圳大学 一种结合人因信息的多维推荐方法
CN116957680A (zh) * 2023-08-03 2023-10-27 深圳花旦传媒有限公司 一种广告投放效果监控系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968417A (zh) * 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 一种应用于计算机网络中的搜索方法和系统
US20150294011A1 (en) * 2014-04-14 2015-10-15 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for providing recommended information
CN107436893A (zh) * 2016-05-26 2017-12-05 北京搜狗科技发展有限公司 一种网页推荐方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102968417A (zh) * 2011-09-01 2013-03-13 阿里巴巴集团控股有限公司 一种应用于计算机网络中的搜索方法和系统
US20150294011A1 (en) * 2014-04-14 2015-10-15 Baidu Online Network Technology (Beijing) Co., Ltd Method and apparatus for providing recommended information
CN107436893A (zh) * 2016-05-26 2017-12-05 北京搜狗科技发展有限公司 一种网页推荐方法和装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113515335A (zh) * 2021-05-20 2021-10-19 口碑(上海)信息技术有限公司 一种服务信息展示形式的确定方法、装置以及电子设备
CN113536108A (zh) * 2021-05-31 2021-10-22 珠海大横琴科技发展有限公司 一种信息推荐的方法和装置
CN114491244A (zh) * 2022-01-12 2022-05-13 北京元年科技股份有限公司 基于大数据优化资源配置的方法、装置、设备及存储介质
CN114339441A (zh) * 2022-03-16 2022-04-12 海看网络科技(山东)股份有限公司 一种iptv中实现直点互通功能的方法
CN114339441B (zh) * 2022-03-16 2022-06-07 海看网络科技(山东)股份有限公司 一种iptv中实现直点互通功能的方法
CN116957680A (zh) * 2023-08-03 2023-10-27 深圳花旦传媒有限公司 一种广告投放效果监控系统
CN116738072A (zh) * 2023-08-15 2023-09-12 深圳大学 一种结合人因信息的多维推荐方法
CN116738072B (zh) * 2023-08-15 2023-11-14 深圳大学 一种结合人因信息的多维推荐方法

Also Published As

Publication number Publication date
CN112699295B (zh) 2023-12-12

Similar Documents

Publication Publication Date Title
CN112699295B (zh) 一种网页内容推荐方法、装置和计算机可读存储介质
CN112104899B (zh) 直播中的信息推荐方法、装置、电子设备及存储介质
US9934515B1 (en) Content recommendation system using a neural network language model
CN103294815B (zh) 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
US9208441B2 (en) Information processing apparatus, information processing method, and program
CN102156737B (zh) 一种中文网页主题内容的提取方法
CN106682144A (zh) 页面展示方法和装置
CN109684538A (zh) 一种基于用户个人特征的推荐方法及推荐系统
KR20180011254A (ko) 웹페이지 트레이닝 방법 및 기기, 그리고 검색 의도 식별 방법 및 기기
CN103443786A (zh) 识别网络浏览器中的并行布局的独立任务的机器学习方法
CN110888990A (zh) 文本推荐方法、装置、设备及介质
CN112052387B (zh) 一种内容推荐方法、装置和计算机可读存储介质
CN104899306B (zh) 信息处理方法、信息显示方法及装置
CN102063456A (zh) 自动定位至网页的视觉中心的方法及设备
CN105786969A (zh) 信息展示方法和装置
CN107562939A (zh) 垂直领域新闻推荐方法、装置及可读储存介质
CN111783712A (zh) 一种视频处理方法、装置、设备及介质
CN103713894A (zh) 一种用于确定用户的访问需求信息的方法与设备
CN111400575B (zh) 用户标识生成方法、用户识别方法及其装置
CN115659008A (zh) 大数据信息反馈的信息推送系统、方法、电子设备及介质
KR101667199B1 (ko) 키워드 검색을 통한 웹 페이지의 상대적 품질 지수 평가 장치
CN115580758A (zh) 视频内容生成方法及装置、电子设备、存储介质
CN107368923B (zh) 景点热度预测方法及装置
Gali et al. Extracting representative image from web page
JP6499763B2 (ja) ビデオ情報に対して検証を行うための方法及び装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40041933

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant