CN103067470B - 一种向浏览器推送信息的方法、服务器和系统 - Google Patents
一种向浏览器推送信息的方法、服务器和系统 Download PDFInfo
- Publication number
- CN103067470B CN103067470B CN201210563513.4A CN201210563513A CN103067470B CN 103067470 B CN103067470 B CN 103067470B CN 201210563513 A CN201210563513 A CN 201210563513A CN 103067470 B CN103067470 B CN 103067470B
- Authority
- CN
- China
- Prior art keywords
- pushed information
- webpage
- requesting party
- target access
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000007418 data mining Methods 0.000 claims abstract description 65
- 238000000605 extraction Methods 0.000 claims description 30
- 230000005611 electricity Effects 0.000 claims description 20
- 239000000284 extract Substances 0.000 claims description 10
- 230000000875 corresponding effect Effects 0.000 description 64
- 238000012937 correction Methods 0.000 description 10
- 235000014510 cooky Nutrition 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000003203 everyday effect Effects 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000002596 correlated effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000010985 leather Substances 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001035 drying Methods 0.000 description 1
Abstract
本发明公开了一种向浏览器推送信息的方法、服务器和系统,该方法包括:接收终端发送的访问请求方在浏览器中所访问的网页的网页信息,对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录;对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库;根据该网页信息和目标访问请求方的网页访问特征库,从存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息,将推送信息返回给终端,以在终端的浏览器中呈现该推送信息。本发明能够解决无法利用多领域的访问的网页信息,来实现在多领域中向终端的浏览器推送信息的问题。
Description
技术领域
本发明涉及计算机网络领域,具体涉及一种向浏览器推送信息的方法、服务器和系统。
背景技术
现有技术中,由各个网站向终端的浏览器推送信息。网站根据网站中各个网页的访问次数,确定网页的点击率。当访问请求方访问该网站时,向访问请求方所在的浏览器中推送点击率最高的网页。但是,由于每个网站都只是与一个领域向对应,该网站获得的访问的网页信息仅限于其所对应的领域,所以现有技术无法利用多领域的访问的网页信息,来实现在多领域中向终端的浏览器推送信息。
发明内容
鉴于上述问题,提出了本发明以便提供一种向浏览器推送信息的方法、服务器和系统。
依据本发明的一个方面,提供了一种向浏览器推送信息的方法,该方法包括:
接收终端发送的访问请求方在浏览器中所访问的网页的网页信息,所述网页信息中包含网页内容和网页地址;
对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录,所述目标访问请求方为在终端的浏览器中登录后接收推送信息的访问请求方;
对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库,所述网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征;
在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,从存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息,将推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
其中,所述根据该网页信息和目标访问请求方的网页访问特征库,从配置的推送信息库中查找出目标访问请求方的推送信息具体包括:
根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型;
从目标访问请求方的网页访问特征库中提取浏览特征;
根据提取的浏览特征和当前浏览的网页的网页类型从配置的推送信息库中查找出目标访问请求方的推送信息。
其中,该方法还包括:
在接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息,将根据关键字查找到的推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
其中,该方法还包括:
在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页,将该选择的网页返回给终端,以在终端的浏览器中呈现该网页。
其中,在生成目标访问请求方的网页访问特征库后还包括:
记录预设时间段内目标访问请求方所访问的网页的网页信息;
对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
其中,所述根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录具体包括:
从接收的网页信息中提取目标访问请求方所访问的网页的网页信息;
根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器中记录网页类型与该推送信息类型对应的网页的网页信息。
其中,所述对目标访问请求方的网页信息记录中的网页内容进行数据挖掘具体包括:
对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征。
其中,所述从目标访问请求方的网页访问特征库中提取浏览特征具体包括:
确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型;
在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。
其中,所述根据提取的浏览特征和当前访问的网页的网页类型从配置的推送信息库中查找出目标访问请求方的推送信息具体包括:
从推送信息库中查找到当前访问的网页的网页类型所对应的推送信息类型的推送信息;
将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。
其中,所述根据数据挖掘结果生成该目标访问请求方的网页访问特征库具体包括:
通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;
根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;
在网页访问特征库中记录各个浏览特征和权重值。
其中,所述从目标访问请求方的网页访问特征库中提取浏览特征具体包括:
从目标访问请求方的网页访问特征库中提取权重值最大的浏览特征。
其中,所述推送信息类型包括:电商信息类型、媒体信息类型、和/或社交信息类型。
其中,所述将推送信息返回给终端,以在终端的浏览器中呈现该推送信息具体包括:
将推送信息返回给终端,以在终端的浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
根据本发明的另一方面,提供了一种向浏览器推送信息的服务器,该服务器包括:
接收模块,适于接收终端发送的访问请求方在浏览器中所访问的网页的网页信息,所述网页信息中包含网页内容和网页地址;
网页信息记录模块,适于对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录,所述目标访问请求方为在终端的浏览器中登录后接收推送信息的访问请求方;
网页访问特征库生成模块,适于对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库,所述网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征;
推送信息获取模块,适于在接收模块接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,在存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息;
发送模块,适于将推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
其中,所述推送信息获取模块包括:
网页类型确定子模块,适于根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型;
浏览特征提取子模块,适于从目标访问请求方的网页访问特征库中提取浏览特征;
推送信息取得子模块,适于根据提取的浏览特征和当前访问的网页的网页类型从推送信息库中查找出目标访问请求方的推送信息。
其中,所述推送信息获取模块,还适于当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息;
所述发送模块,还适于将根据关键字查找到的推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
其中,所述推送信息获取模块,还适于当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页作为该目标访问请求方的推送信息;
所述发送模块,还适于将该选择的网页返回给终端,以在终端的浏览器中呈现该网页。
其中,所述服务器还包括:
网页访问特征库更新模块,适于在网页访问特征库生成模块生成目标访问请求方的网页访问特征库后,记录预设时间段内目标访问请求方所访问的网页的网页信息,对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
其中,所述网页信息记录模块,具体适于从接收的网页信息中提取目标访问请求方所访问的网页的网页信息;根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器中记录网页类型与该推送信息类型对应的网页的网页信息。
其中,所述网页访问特征库生成模块,具体适于对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征。
其中,所述浏览特征提取子模块,具体适于确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型,在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。
其中,所述推送信息取得子模块,具体适于从推送信息库中查找到当前访问的网页的网页类型所对应推送信息类型的推送信息,将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。
其中,所述网页访问特征库生成模块,具体适于通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
其中,所述浏览特征提取子模块,具体适于从目标访问请求方的网页访问特征库中提取权重值最大的浏览特征。
其中,所述推送信息类型包括:电商信息类型、媒体信息类型、和/或社交信息类型。
根据本发明的另一方面还提供了一种向浏览器推送信息的系统,
该系统包括:上述服务器,以及
存储服务器,适于存储目标访问请求方所访问的网页的网页信息和配置的推送信息库;
终端,适于向服务器发送访问请求方在浏览器中所访问的网页的网页信息,并接收服务器返回的推送信息,在本地浏览器中呈现该推送信息。
其中,终端,具体适于接收推送信息,在浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
根据本发明的技术方案,依据访问请求方在浏览器中所访问的网页的网页信息,生成目标访问请求方的网页信息记录,对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,生成该目标访问请求方的网页访问特征库;在向浏览器推送信息时,根据目标访问请求方当前访问的网页的网页信息和目标访问请求方的网页访问特征库,从存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息,实现向浏览器推送信息。
在本发明中,依据浏览器提供的访问请求方访问的网页的网页信息来推送信息,浏览器提供的访问网页的网页信息与网站中的访问网页的网页信息不同,浏览器所提供的网页信息不受领域限制,能够包含在各个领域中进行访问时的网页信息,所以本发明解决了无法利用多领域的访问的网页信息,来实现在多领域中向终端的浏览器推送信息的问题。
另一方面,本发明中,对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,生成该目标访问请求方的网页访问特征库,因为网页访问特征库中包含的浏览特征能够表示出访问请求方的浏览行为,而且该网页访问特征库与访问请求方对应,所以本发明中的推送信息对应于单个访问请求方的针对性更强,取得了能够使推送信息与访问请求方的访问目标更佳匹配的有益效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的向浏览器推送信息的服务器的结构图;
图2示出了根据本发明一个实施例的向浏览器推送信息的服务器的结构图;
图3示出了根据本发明一个实施例的向浏览器推送信息的服务器的结构图;
图4示出了根据本发明一个实施例的向浏览器推送信息的系统的结构图;
图5示出了根据本发明一个实施例的浏览器中推送信息的方法的流程图;
图6示出了根据本发明一个实施例的浏览器中推送信息的方法中基于网页访问特征库获得推送信息的流程图;以及
图7示出了根据本发明一个实施例的浏览器中推送信息的方法的流程图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参见图1,示出了根据本发明一个实施例的浏览器中推送信息的服务器的结构图。该服务器1000包括:接收模块100、网页信息记录模块200、网页访问特征库生成模块300、推送信息获取模块400和发送模块500。
接收模块100,适于接收终端3000发送的访问请求方在浏览器中所访问的网页的网页信息。网页信息中包含网页内容和网页地址。
其中,接收模块100接收到终端3000发送的cookie或者是脚本文件,该cookie或脚本文件中包含访问请求方在浏览器中所访问的网页的网页内容和网页地址。
预先建立网站的域名名单,该域名名单中包含配置的域名。例如,对团购类的网站,则预先统计出团购网站的域名名单,该团购网站的域名名单中可以包含已知的全部的团购网站,还可以是一部分优选的团购网站。上述团购网站仅为举例说明,还可以是其他类型的网址,例如博客,在线视频等。
终端3000在发送访问请求方所访问的网页的网页信息时,将所访问的网页的域名与域名名单中域名匹配,如果匹配成功,则将该网页的网页信息发送给服务器1000;否则,不将该网页的网页信息发送给服务器1000。
上述域名名单可以是以匹配列表的方式存在。当访问的网页的域名满足一个匹配项时才发送。比如:满足“http://www.dianping.com/*”,*表示任一匹配,即当所访问的网页为“点评网”下面的某一网页时,才会触发向服务器1000发送网页信息。该匹配列表,可以使用配置文件的方式下发给终端3000。终端3000可以是按预设周期从服务器1000或存储服务器2000下载配置文件,以获取其中的匹配列表,例如,终端3000每天从服务器1000或存储服务器2000下载一次配置文件。
由此,服务器可以对终端上传的网页信息进行定制,终端仅将其域名与域名名单匹配的网页的网页信息上传,避免了将垃圾网站中网页信息传送给服务器,节省了网络通信资源,也降低了服务器的任务处理负担。
此外,为了防止访问的网页中信息被非法上传,终端3000在接收到访问请求方的允许上传网页信息的指令后,才将网页信息上传给服务器1000。如果没有接收到访问请求方的允许上传网页信息的指令,则不进行上传网页信息的操作。
网页信息记录模块200,适于对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器2000中进行记录,生成目标访问请求方的网页信息记录。目标访问请求方为在终端3000的浏览器中登录后接收推送信息的访问请求方。
网页访问特征库生成模块300,适于对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库。网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征。
推送信息获取模块400,适于在接收模块100接收到终端3000发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,在存储服务器2000中存储的推送信息库中查找出目标访问请求方的推送信息。
发送模块500,适于将推送信息返回给终端3000,以在终端3000的浏览器中呈现该推送信息。
进一步地,图2示出了根据本发明一个实施例的向浏览器推送信息的服务器的结构图。其中,推送信息获取模块400包括:网页类型确定子模块410、浏览特征提取子模块420和推送信息取得子模块430。
网页类型确定子模块410,适于根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型。
浏览特征提取子模块420,适于从目标访问请求方的网页访问特征库中提取浏览特征。
推送信息取得子模块430,适于根据提取的浏览特征和当前访问的网页的网页类型从推送信息库中查找出目标访问请求方的推送信息。
举例而言,接收模块100接收终端3000发送的访问请求方在浏览器中所访问的网页的网页信息。网页信息记录模块200对应于每个目标访问请求方,生成该目标访问请求方的网页信息记录。网页访问特征库生成模块300对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,通过数据挖掘得出某个目标访问请求方的一个浏览特征为“伦敦奥运会”,则表示该目标访问请求方的访问行为与“伦敦奥运会”相关。推送信息获取模块400在接收模块100接收到终端3000发送的该目标访问请求方当前访问的网页的网页信息后,从推送信息库中查找出与“伦敦奥运会”匹配的推送信息。具体地,网页类型确定子模块410根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型,例如:新闻网页类型、电商网页类型等等。浏览特征提取子模块420从目标访问请求方的网页访问特征库中提取浏览特征“伦敦奥运会”。推送信息取得子模块430根据提取的浏览特征和当前访问的网页的网页类型从推送信息库中查找出目标访问请求方的推送信息。发送模块500将推送信息返回给终端3000,在终端3000的浏览器中呈现该推送信息。例如,当目标访问请求方当前正在访问新闻网页,则终端3000获得推送信息为“伦敦奥运会”相关的新闻的网页,并进行呈现。当目标访问请求方当前正在访问电商网页,则终端3000获得推送信息为“伦敦奥运会”相关的商品的网页,并进行呈现。
在本实施例中,能够利用多领域的访问的网页信息,来实现在多领域中向终端3000的浏览器推送信息;并且推送信息对应于单个访问请求方的针对性更强,取得了能够使推送信息与访问请求方的访问目标更佳匹配的有益效果。
在一实施例中,除按上述方式推送信息外,还可以按如下方式进行信息推送。
方式一
推送信息获取模块400,还适于当接收到终端3000发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息。
发送模块500,还适于将根据关键字查找到的推送信息返回给终端3000,以在终端3000的浏览器中呈现该推送信息。
方式二
推送信息获取模块400,还适于当接收到终端3000发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页作为该目标访问请求方的推送信息。
发送模块500,还适于将该选择的网页返回给终端3000,以在终端3000的浏览器中呈现该网页。
在本实施例中,终端3000除了能够接收到依据浏览特征取得的推送信息外,还能够接收到按方式一和/或方式二取得的推送信息,因此能够接收多种方式取得的推送信息,扩大了推送信息的内容。
在一实施例中,服务器1000还包括:网页访问特征库更新模块600。图3示出了根据本发明一个实施例的向浏览器推送信息的服务器的结构图。
网页访问特征库更新模块600,适于在网页访问特征库生成模块300生成目标访问请求方的网页访问特征库后,记录预设时间段内目标访问请求方所访问的网页的网页信息,对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
举例而言,网页访问特征库更新模块600对记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,数据挖掘结果为浏览特征,如果新得的浏览特征中包含网页访问特征库中没有的浏览特征,则将该浏览特征添加到网页访问特征库中。
进一步地,网页访问特征库生成模块300,具体适于通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
网页访问特征库更新模块600,对记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,数据挖掘结果包括浏览特征和浏览特征对应的访问次数,根据数据挖掘结果包括的浏览特征和浏览特征对应的访问次数更新网页访问特征库中记录的各个浏览特征和权重值。
举例而言,网页访问特征库中记录的浏览特征和权重值包括:浏览特征“连衣裙”,权重值为0.8;浏览特征“雪地靴”,权重值为0.2。
网页访问特征库更新模块600所得数据挖掘结果包括:浏览特征“雪地靴”,访问次数6次;浏览特征“连衣裙”,浏览次数4次;浏览特征“羽绒服”,浏览次数10次。
按预设计算模型对网页访问特征库更新模块600所得数据挖掘结果进行计算,得出各个浏览特征的权重修正值。例如,“雪地靴”的权重修正值为6/20=0.3,“连衣裙”的权重修正值为4/20=0.2,“羽绒服”的权重修正值为10/20=0.5。
根据该权重修正值更新网页访问特征库,“雪地靴”更新后权重值为(0.3+0.2)/(0.8+0.2+0.3+0.2+0.5)=0.25,“连衣裙”更新后权重值为(0.2+0.8)/(0.8+0.2+0.3+0.2+0.5)=0.5,新添加的浏览特征“羽绒服”权重值为(0.5+0)/(0.8+0.2+0.3+0.2+0.5)=0.25。
以上仅为示例性说明,本实施例中网页访问特征库的更新方式不限于此,也可以在更新时考虑到获得浏览次数的时间因素,越近时间段内的浏览次数,在计算权重值时所占比例越大。
以下对于图2中向浏览器推送信息的服务器进行示例性地详细说明。
其中,推送信息库中存储多种类型的推送信息。例如,推送信息类型包括:电商信息类型、媒体信息类型、和社交信息类型。根据网页内容确定的网页类型也包括多种,例如,与电商信息类型对应的购物网页类型;与媒体信息类型对应的影视网页类型、教学视频网页、新闻网页类型;与社交信息类型对应的即时通讯网页类型、微博网页类型。
接收模块100,适于接收终端3000发送的访问请求方在浏览器中所访问的网页的网页信息。网页信息中包含网页内容和网页地址。
网页信息记录模块200,适于从接收的网页信息中提取目标访问请求方所访问的网页的网页信息;根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器2000中记录网页类型与该推送信息类型对应的网页的网页信息。例如,接收的网页信息所属的网页类型为购物网页类型,则将该网页信息记录到推送信息类型“电商信息类型”对应的网页信息中;接收的网页信息所属的网页类型为微博网页类型,则将该网页信息记录到推送信息类型“社交信息类型”对应的网页信息中。
网页访问特征库生成模块300,适于对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征。网页访问特征库生成模块300对应于每种推送信息类型,通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
例如,对电商信息类型对应的网页信息进行数据挖掘,得出浏览特征和权重值包括:“连衣裙”,权重值0.6;“羽绒服”,权重值0.2;“皮鞋”,权重值0.2。对媒体信息类型对应的网页信息进行数据挖掘,得出浏览特征和权重值包括:“篮球”,权重值0.4;“足球”,权重值0.6。
推送信息获取模块400包括:网页类型确定子模块410、浏览特征提取子模块420和推送信息取得子模块430。
网页类型确定子模块410,适于根据接收到目标访问请求方当前访问的网页的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型。
浏览特征提取子模块420,适于确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型,在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。浏览特征提取子模块420从与该推送信息类型对应的浏览特征中提取权重值最大的浏览特征。例如,目标访问请求方当前访问的网页的网页类型为购物网页类型,则从网页访问特征库中,电商信息类型的浏览特征中提取浏览特征“连衣裙”。
推送信息取得子模块430,适于从推送信息库中查找到当前访问的网页的网页类型所对应推送信息类型的推送信息,将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。例如,推送信息取得子模块430对于电商信息类型的推送信息,将推送信息的关键字与“连衣裙”匹配,获得与“连衣裙”相关的推送信息。
发送模块500,适于将推送信息返回给终端3000,以在终端3000的浏览器中呈现该推送信息。
在本实施例中,对网页信息的处理按网页类型分类进行,网页类型与推送信息类型对应,进而依据当前访问网页的网页类型而取得对应的推送信息,能够为终端提供多种类的推送信息,并进一步提高了推送信息与访问请求方的访问目标间匹配度。
参见图4,示出了根据本发明一个实施例的向浏览器推送信息的系统的结构图。
该系统包括:上述任一实施例中服务器1000,以及存储服务器2000和多个终端3000。
存储服务器2000,适于存储目标访问请求方所访问的网页的网页信息和配置的推送信息库。
终端3000,适于向服务器1000发送访问请求方在浏览器中所访问的网页的网页信息,并接收服务器1000返回的推送信息,在本地浏览器中呈现该推送信息。
进一步地,终端3000,具体适于接收推送信息,在浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
预先建立网站的域名名单,该域名名单中包含配置的域名。例如,对团购类的网站,则预先统计出团购网站的域名名单,该团购网站的域名名单中可以包含已知的全部的团购网站,还可以是一部分优选的团购网站。上述团购网站仅为举例说明,还可以是其他类型的网址,例如博客,在线视频等。
终端3000在发送访问请求方所访问的网页的网页信息时,将所访问的网页的域名与域名名单中域名匹配,如果匹配成功,则将该网页的网页信息发送给服务器1000;否则,不将该网页的网页信息发送给服务器1000。
上述域名名单可以是以匹配列表的方式存在。当访问的网页的域名满足一个匹配项时才发送。比如:满足“http://www.dianping.com/*”,*表示任一匹配,即当所访问的网页为“点评网”下面的某一网页时,才会触发向服务器1000发送网页信息。该匹配列表,可以使用配置文件的方式下发给终端3000。终端3000可以是按预设周期从服务器1000或存储服务器2000下载配置文件,以获取其中的匹配列表,例如,终端3000每天从服务器1000或存储服务器2000下载一次配置文件。
由此,服务器可以对终端上传的网页信息进行定制,终端仅将其域名与域名名单匹配的网页的网页信息上传,避免了将垃圾网站中网页信息传送给服务器,节省了网络通信资源,也降低了服务器的任务处理负担。
此外,为了防止访问的网页中信息被非法上传,终端3000在接收到访问请求方的允许上传网页信息的指令后,才将网页信息上传给服务器1000。如果没有接收到访问请求方的允许上传网页信息的指令,则不进行上传网页信息的操作。
其中,服务器1000,存储服务器2000和多个终端3000可以直接连接,也可以通过网络进行连接,在此没有特别限制。
参见图5,示出了根据本发明一个实施例的浏览器中推送信息的方法的流程图。本实施例中方法包括如下步骤。
步骤S510,接收终端发送的访问请求方在浏览器中所访问的网页的网页信息。网页信息中包含网页内容和网页地址。
其中,步骤S510中接收到终端发送的cookie或者是脚本文件,该cookie或脚本文件中包含访问请求方在浏览器中所访问的网页的网页内容和网页地址。
预先建立网站的域名名单,该域名名单中包含配置的域名。例如,对团购类的网站,则预先统计出团购网站的域名名单,该团购网站的域名名单中可以包含已知的全部的团购网站,还可以是一部分优选的团购网站。上述团购网站仅为举例说明,还可以是其他类型的网址,例如博客,在线视频等。
终端在发送访问请求方所访问的网页的网页信息时,将所访问的网页的域名与域名名单中域名匹配,如果匹配成功,则发送该网页的网页信息;否则,不发送该网页的网页信息。
上述域名名单可以是以匹配列表的方式存在。当访问的网页的域名满足一个匹配项时才发送。比如:满足“http://www.dianping.com/*”,*表示任一匹配,即当所访问的网页为“点评网”下面的某一网页时,才会触发发送网页信息。该匹配列表,可以使用配置文件的方式下发给终端。终端可以是按预设周期下载配置文件,以获取其中的匹配列表,例如,终端每天下载一次配置文件。
由此,可以对终端上传的网页信息进行定制,终端仅将其域名与域名名单匹配的网页的网页信息上传,避免终端传送垃圾网站中网页信息,节省了网络通信资源,也降低了任务处理负担。
此外,为了防止访问的网页中信息被非法上传,终端在接收到访问请求方的允许上传网页信息的指令后,才发送网页信息。如果没有接收到访问请求方的允许上传网页信息的指令,则不进行上传网页信息的操作。
步骤S520,对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录。目标访问请求方为在终端的浏览器中登录后接收推送信息的访问请求方。
步骤S530,对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库。网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征。
步骤S540,在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,从存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息,将推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
其中,所述将推送信息返回给终端,以在终端的浏览器中呈现该推送信息具体包括:将推送信息返回给终端,以在终端的浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
进一步地,参见图6,示出了根据本发明一个实施例的浏览器中推送信息的方法中基于网页访问特征库获得推送信息的流程图。步骤S540中根据该网页信息和目标访问请求方的网页访问特征库,从配置的推送信息库中查找出目标访问请求方的推送信息具体包括如下步骤。
步骤S542,根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型。
步骤S544,从目标访问请求方的网页访问特征库中提取浏览特征。
步骤S546,根据提取的浏览特征和当前浏览的网页的网页类型从配置的推送信息库中查找出目标访问请求方的推送信息。
举例而言,接收终端发送的访问请求方在浏览器中所访问的网页的网页信息。对应于每个目标访问请求方,生成该目标访问请求方的网页信息记录。对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,通过数据挖掘得出某个目标访问请求方的一个浏览特征为“伦敦奥运会”,则表示该目标访问请求方的访问行为与“伦敦奥运会”相关。在接收到终端发送的该目标访问请求方当前访问的网页的网页信息后,从推送信息库中查找出与“伦敦奥运会”匹配的推送信息。具体地,根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型,例如:新闻网页类型、电商网页类型等等。从目标访问请求方的网页访问特征库中提取浏览特征“伦敦奥运会”。根据提取的浏览特征和当前访问的网页的网页类型从推送信息库中查找出目标访问请求方的推送信息。将推送信息返回给终端,在终端的浏览器中呈现该推送信息。例如,当目标访问请求方当前正在访问新闻网页,则终端获得推送信息为“伦敦奥运会”相关的新闻的网页,并进行呈现。当目标访问请求方当前正在访问电商网页,则终端获得推送信息为“伦敦奥运会”相关的商品的网页,并进行呈现。
在本实施例中,能够利用多领域的访问的网页信息,来实现在多领域中向终端的浏览器推送信息;并且推送信息对应于单个访问请求方的针对性更强,取得了能够使推送信息与访问请求方的访问目标更佳匹配的有益效果。
在一实施例中,除按上述方式推送信息外,还可以按如下方式进行信息推送。
方式一
当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息;将根据关键字查找到的推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
方式二
当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页作为该目标访问请求方的推送信息;将该选择的网页返回给终端,以在终端的浏览器中呈现该网页。
在本实施例中,终端除了能够接收到依据浏览特征取得的推送信息外,还能够接收到按方式一和/或方式二取得的推送信息,因此能够接收多种方式取得的推送信息,扩大了推送信息的内容。
在一实施例中,方法还包括对网络访问特征库进行更新的操作。
在生成目标访问请求方的网页访问特征库后,记录预设时间段内目标访问请求方所访问的网页的网页信息,对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
举例而言,对记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,数据挖掘结果为浏览特征,如果新得的浏览特征中包含网页访问特征库中没有的浏览特征,则将该浏览特征添加到网页访问特征库中。
进一步地,步骤S530具体包括:通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
在更新网页访问特征库时,对记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,数据挖掘结果包括浏览特征和浏览特征对应的访问次数,根据数据挖掘结果包括的浏览特征和浏览特征对应的访问次数更新网页访问特征库中记录的各个浏览特征和权重值。
举例而言,网页访问特征库中记录的浏览特征和权重值包括:浏览特征“连衣裙”,权重值为0.8;浏览特征“雪地靴”,权重值为0.2。
更新时做数据挖掘所得数据挖掘结果包括:浏览特征“雪地靴”,访问次数6次;浏览特征“连衣裙”,浏览次数4次;浏览特征“羽绒服”,浏览次数10次。
按预设计算模型对更新时所得数据挖掘结果进行计算,得出各个浏览特征的权重修正值。例如,“雪地靴”的权重修正值为6/20=0.3,“连衣裙”的权重修正值为4/20=0.2,“羽绒服”的权重修正值为10/20=0.5。
根据该权重修正值更新网页访问特征库,“雪地靴”更新后权重值为(0.3+0.2)/(0.8+0.2+0.3+0.2+0.5)=0.25,“连衣裙”更新后权重值为(0.2+0.8)/(0.8+0.2+0.3+0.2+0.5)=0.5,新添加的浏览特征“羽绒服”权重值为(0.5+0)/(0.8+0.2+0.3+0.2+0.5)=0.25。
以上仅为示例性说明,本实施例中网页访问特征库的更新方式不限于此,也可以在更新时考虑到获得浏览次数的时间因素,越近时间段内的浏览次数,在计算权重值时所占比例越大。
参见图7,示出了根据本发明一个实施例的浏览器中推送信息的方法的流程图。以下对于图7中方法进行示例性地详细说明。
其中,推送信息库中存储多种类型的推送信息。例如,推送信息类型包括:电商信息类型、媒体信息类型、和社交信息类型。根据网页内容确定的网页类型也包括多种,例如,与电商信息类型对应的购物网页类型;与媒体信息类型对应的影视网页类型、教学视频网页、新闻网页类型;与社交信息类型对应的即时通讯网页类型、微博网页类型。
步骤S710,接收终端发送的访问请求方在浏览器中所访问的网页的网页信息。网页信息中包含网页内容和网页地址。
步骤S720,从接收的网页信息中提取目标访问请求方所访问的网页的网页信息,根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器中记录网页类型与该推送信息类型对应的网页的网页信息。
例如,接收的网页信息所属的网页类型为购物网页类型,则将该网页信息记录到推送信息类型“电商信息类型”对应的网页信息中;接收的网页信息所属的网页类型为微博网页类型,则将该网页信息记录到推送信息类型“社交信息类型”对应的网页信息中。
步骤S730,对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征,生成目标访问请求方的网页访问特征库。
具体而言,对应于每种推送信息类型,通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
例如,对电商信息类型对应的网页信息进行数据挖掘,得出浏览特征和权重值包括:“连衣裙”,权重值0.6;“羽绒服”,权重值0.2;“皮鞋”,权重值0.2。对媒体信息类型对应的网页信息进行数据挖掘,得出浏览特征和权重值包括:“篮球”,权重值0.4,“足球”,权重值0.6。
步骤S740,在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据接收到目标访问请求方当前访问的网页的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型。
步骤S750,确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型,在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。
具体而言,在步骤S750中,从与该推送信息类型对应的浏览特征中提取权重值最大的浏览特征。例如,目标访问请求方当前访问的网页的网页类型为购物网页类型,则从网页访问特征库中,电商信息类型的浏览特征中提取浏览特征“连衣裙”。
步骤S760,从推送信息库中查找到当前访问的网页的网页类型所对应推送信息类型的推送信息,将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。例如,对于电商信息类型的推送信息,将推送信息的关键字与“连衣裙”匹配,获得与“连衣裙”相关的推送信息。
步骤S770,将推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
在本实施例中,对网页信息的处理按网页类型分类进行,网页类型与推送信息类型对应,进而依据当前访问网页的网页类型而取得对应的推送信息,能够为终端提供多种类的推送信息,并进一步提高了推送信息与访问请求方的访问目标间匹配度。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (25)
1.一种向浏览器推送信息的方法,该方法包括:
接收终端发送的访问请求方在浏览器中所访问的网页的网页信息,所述网页信息中包含网页内容和网页地址;
对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录,所述目标访问请求方为在终端的浏览器中登录后接收推送信息的访问请求方;
对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库,所述网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征;
在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,从存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息,将推送信息返回给终端,以在终端的浏览器中呈现该推送信息;
其中,所述根据该网页信息和目标访问请求方的网页访问特征库,从配置的推送信息库中查找出目标访问请求方的推送信息具体包括:
根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型;
从目标访问请求方的网页访问特征库中提取浏览特征;
根据提取的浏览特征和当前浏览的网页的网页类型从配置的推送信息库中查找出目标访问请求方的推送信息。
2.根据权利要求1所述的方法,其中,
该方法还包括:
在接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息,将根据关键字查找到的推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
3.根据权利要求1所述的方法,其中,
该方法还包括:
在接收到终端发送的目标访问请求方当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页,将该选择的网页返回给终端,以在终端的浏览器中呈现该网页。
4.根据权利要求1所述的方法,其中,
在生成目标访问请求方的网页访问特征库后还包括:
记录预设时间段内目标访问请求方所访问的网页的网页信息;
对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
5.根据权利要求1所述的方法,其中,
所述根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录具体包括:
从接收的网页信息中提取目标访问请求方所访问的网页的网页信息;
根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器中记录网页类型与该推送信息类型对应的网页的网页信息。
6.根据权利要求5所述的方法,其中,
所述对目标访问请求方的网页信息记录中的网页内容进行数据挖掘具体包括:
对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征。
7.根据权利要求6所述的方法,其中,
所述从目标访问请求方的网页访问特征库中提取浏览特征具体包括:
确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型;
在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。
8.根据权利要求7所述的方法,其中,
所述根据提取的浏览特征和当前访问的网页的网页类型从配置的推送信息库中查找出目标访问请求方的推送信息具体包括:
从推送信息库中查找到当前访问的网页的网页类型所对应的推送信息类型的推送信息;
将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。
9.根据权利要求1所述的方法,其中,
所述根据数据挖掘结果生成该目标访问请求方的网页访问特征库具体包括:
通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;
根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;
在网页访问特征库中记录各个浏览特征和权重值。
10.根据权利要求9所述的方法,其中,
所述从目标访问请求方的网页访问特征库中提取浏览特征具体包括:
从目标访问请求方的网页访问特征库中提取权重值最大的浏览特征。
11.根据权利要求1至10任一项所述的方法,其中,
所述推送信息类型包括:电商信息类型、媒体信息类型、和/或社交信息类型。
12.根据权利要求1至10任一项所述的方法,其中,
所述将推送信息返回给终端,以在终端的浏览器中呈现该推送信息具体包括:
将推送信息返回给终端,以在终端的浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
13.一种向浏览器推送信息的服务器,该服务器包括:
接收模块,适于接收终端发送的访问请求方在浏览器中所访问的网页的网页信息,所述网页信息中包含网页内容和网页地址;
网页信息记录模块,适于对应于每个目标访问请求方,根据接收的网页信息对该目标访问请求方所访问的网页的网页信息在存储服务器中进行记录,生成目标访问请求方的网页信息记录,所述目标访问请求方为在终端的浏览器中登录后接收推送信息的访问请求方;
网页访问特征库生成模块,适于对目标访问请求方的网页信息记录中的网页内容进行数据挖掘,根据数据挖掘结果生成该目标访问请求方的网页访问特征库,所述网页访问特征库中包含用于表示访问请求方浏览行为的浏览特征;
推送信息获取模块,适于在接收模块接收到终端发送的目标访问请求方当前访问的网页的网页信息后,根据该网页信息和目标访问请求方的网页访问特征库,在存储服务器中存储的推送信息库中查找出目标访问请求方的推送信息;
发送模块,适于将推送信息返回给终端,以在终端的浏览器中呈现该推送信息;
其中,所述推送信息获取模块包括:
网页类型确定子模块,适于根据该接收到的网页信息中包含的网页地址确定目标访问请求方当前访问的网页的网页类型;
浏览特征提取子模块,适于从目标访问请求方的网页访问特征库中提取浏览特征;
推送信息取得子模块,适于根据提取的浏览特征和当前访问的网页的网页类型从推送信息库中查找出目标访问请求方的推送信息。
14.根据权利要求13所述的服务器,其中,
所述推送信息获取模块,还适于当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,从该网页信息包含的网页内容中提取关键字,根据该关键字从推送信息库中查找出目标访问请求方的推送信息;
所述发送模块,还适于将根据关键字查找到的推送信息返回给终端,以在终端的浏览器中呈现该推送信息。
15.根据权利要求13所述的服务器,其中,
所述推送信息获取模块,还适于当接收到终端发送的目标访问请求方在浏览器中当前访问的网页的网页信息后,确定访问该网页的除目标访问请求方之外的访问请求方,查找到确定的访问请求方所访问的除目标访问请求方当前访问的网页之外的网页,从查找到的网页中选择点击率最高的网页作为该目标访问请求方的推送信息;
所述发送模块,还适于将该选择的网页返回给终端,以在终端的浏览器中呈现该网页。
16.根据权利要求13所述的服务器,其中,
所述服务器还包括:
网页访问特征库更新模块,适于在网页访问特征库生成模块生成目标访问请求方的网页访问特征库后,记录预设时间段内目标访问请求方所访问的网页的网页信息,对该记录的预设时间段内的网页信息中包含的网页内容进行数据挖掘,根据数据挖掘结果更新目标访问请求方的网页访问特征库。
17.根据权利要求13所述的服务器,其中,
所述网页信息记录模块,具体适于从接收的网页信息中提取目标访问请求方所访问的网页的网页信息;根据网页信息中包含的网页地址确定目标访问请求方所访问的网页的网页类型,对于每个预设的推送信息类型,在存储服务器中记录网页类型与该推送信息类型对应的网页的网页信息。
18.根据权利要求17所述的服务器,其中,
所述网页访问特征库生成模块,具体适于对于每个推送信息类型,对目标访问请求方的网页信息记录中与该推送信息类型对应的网页信息中包含的网页内容进行数据挖掘,获得该推送信息类型对应的浏览特征。
19.根据权利要求18所述的服务器,其中,
所述浏览特征提取子模块,具体适于确定目标访问请求方当前访问的网页的网页类型所对应的推送信息类型,在目标访问请求方的网页访问特征库中,从与该推送信息类型对应的浏览特征中进行浏览特征的提取。
20.根据权利要求19所述的服务器,其中,
所述推送信息取得子模块,具体适于从推送信息库中查找到当前访问的网页的网页类型所对应推送信息类型的推送信息,将查找到的推送信息的关键字与提取的浏览特征进行匹配,以匹配到的推送信息作为目标访问请求方的推送信息。
21.根据权利要求13所述的服务器,其中,
所述网页访问特征库生成模块,具体适于通过数据挖掘获得多个浏览特征和各个浏览特征对应的访问次数;根据访问次数得出浏览特征的权重值,访问次数越多得出的浏览特征的权重值越大;在网页访问特征库中记录各个浏览特征和权重值。
22.根据权利要求21所述的服务器,其中,
所述浏览特征提取子模块,具体适于从目标访问请求方的网页访问特征库中提取权重值最大的浏览特征。
23.根据权利要求13至22任一项所述的服务器,其中,
所述推送信息类型包括:电商信息类型、媒体信息类型、和/或社交信息类型。
24.一种向浏览器推送信息的系统,
该系统包括:
如权利要求13至23任一项所述的服务器,以及
存储服务器,适于存储目标访问请求方所访问的网页的网页信息和配置的推送信息库;
终端,适于向服务器发送访问请求方在浏览器中所访问的网页的网页信息,并接收服务器返回的推送信息,在本地浏览器中呈现该推送信息。
25.根据权利要求24所述的系统,其中,
终端,具体适于接收推送信息,在浏览器的收藏夹中保存该推送信息或将推送信息提供给浏览器插件。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210563513.4A CN103067470B (zh) | 2012-12-21 | 2012-12-21 | 一种向浏览器推送信息的方法、服务器和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201210563513.4A CN103067470B (zh) | 2012-12-21 | 2012-12-21 | 一种向浏览器推送信息的方法、服务器和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN103067470A CN103067470A (zh) | 2013-04-24 |
CN103067470B true CN103067470B (zh) | 2016-08-03 |
Family
ID=48109924
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201210563513.4A Expired - Fee Related CN103067470B (zh) | 2012-12-21 | 2012-12-21 | 一种向浏览器推送信息的方法、服务器和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN103067470B (zh) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104331403B (zh) * | 2013-07-22 | 2020-09-11 | 腾讯科技(深圳)有限公司 | 一种基于浏览器的动态消息查看方法、装置及系统 |
CN104809120B (zh) * | 2014-01-24 | 2020-10-30 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及装置 |
CN105721528B (zh) * | 2014-12-04 | 2019-10-22 | 中国移动通信集团江苏有限公司 | 一种局域网内容推送方法、设备及系统 |
CN104951961A (zh) * | 2015-06-02 | 2015-09-30 | 百度在线网络技术(北京)有限公司 | 用于推送内容的方法、终端、服务器以及系统 |
CN108632050B (zh) * | 2017-03-15 | 2021-03-02 | 阿里巴巴集团控股有限公司 | 一种记录网站访问日志的方法和装置 |
CN109831472B (zh) * | 2017-11-23 | 2021-04-06 | 苏州跃盟信息科技有限公司 | 一种信息推送、信息显示方法和系统 |
CN108038331B (zh) * | 2017-12-27 | 2022-11-11 | 重庆工商职业学院 | 一种基于云计算的高精度温度数据校正方法 |
CN108259481B (zh) * | 2018-01-02 | 2021-08-20 | 中电万维信息技术有限责任公司 | 一种电子政务个性化信息服务方法 |
CN111460285B (zh) * | 2020-03-17 | 2023-11-03 | 阿波罗智联(北京)科技有限公司 | 信息处理方法、装置、电子设备和存储介质 |
CN112417269A (zh) * | 2020-10-30 | 2021-02-26 | 南京湛杰信息科技有限公司 | 一种智能在线培训服务信息推送算法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079063A (zh) * | 2007-06-25 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种基于场景信息推送广告的方法、系统及设备 |
CN101833570A (zh) * | 2010-03-23 | 2010-09-15 | 深圳市五巨科技有限公司 | 一种移动终端页面推送优化的方法和装置 |
CN102622445A (zh) * | 2012-03-15 | 2012-08-01 | 华南理工大学 | 一种基于用户兴趣感知的网页推送系统及方法 |
-
2012
- 2012-12-21 CN CN201210563513.4A patent/CN103067470B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101079063A (zh) * | 2007-06-25 | 2007-11-28 | 腾讯科技(深圳)有限公司 | 一种基于场景信息推送广告的方法、系统及设备 |
CN101833570A (zh) * | 2010-03-23 | 2010-09-15 | 深圳市五巨科技有限公司 | 一种移动终端页面推送优化的方法和装置 |
CN102622445A (zh) * | 2012-03-15 | 2012-08-01 | 华南理工大学 | 一种基于用户兴趣感知的网页推送系统及方法 |
Also Published As
Publication number | Publication date |
---|---|
CN103067470A (zh) | 2013-04-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103067470B (zh) | 一种向浏览器推送信息的方法、服务器和系统 | |
CN102130933B (zh) | 一种基于移动互联网的推荐方法、系统和设备 | |
CN102713909B (zh) | 用于移动搜索的基于社区的动态高速缓存 | |
US8606636B1 (en) | Recommendations based on environmental variables | |
CN102651021B (zh) | 一种图标内容更新方法及更新装置 | |
CN103714119B (zh) | 一种浏览器数据的处理方法和装置 | |
CN103678555B (zh) | 进行网页收藏的方法和进行网页收藏的装置 | |
CN101432713A (zh) | 基于交互频率向用户提供内容的方法和系统 | |
CN103064949A (zh) | 基于用户意图提供应用结果 | |
CN102340514A (zh) | 网络信息推送方法及系统 | |
CN103297469A (zh) | 一种网站数据的采集方法及装置 | |
US20130254014A1 (en) | Automatic Information Placement | |
US9558175B2 (en) | Generating an individualized web page template with entities of a web page publisher organization associated with areas of the template | |
CN104468790A (zh) | cookie数据的处理方法与客户端 | |
CN102970348A (zh) | 网络应用推送方法、系统和网络应用服务器 | |
US20140280350A1 (en) | Method and system for user profiling via mapping third party interests to a universal interest space | |
CN102955859B (zh) | 网页内容展现方法和装置 | |
CN110766489A (zh) | 请求内容及提供内容的方法和相应设备 | |
CN106796695A (zh) | 应用安装的转化和识别 | |
CN105450718A (zh) | 界面更新方法及客户端 | |
CN105630953A (zh) | 移动搜索客户端展示新闻的方法和装置 | |
EP3111344A1 (en) | Information interface generation and/or population | |
CN103530791A (zh) | 一种标记重定向用户的方法、装置和系统 | |
CN104765811A (zh) | 实现搜索提示的装置、系统及方法 | |
US20150052189A1 (en) | Method for providing a third party service associated with a network-accessible site using a single scripting approach |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20160803 Termination date: 20211221 |
|
CF01 | Termination of patent right due to non-payment of annual fee |