CN104199874A - 一种基于用户浏览行为的网页推荐方法 - Google Patents

一种基于用户浏览行为的网页推荐方法 Download PDF

Info

Publication number
CN104199874A
CN104199874A CN201410412077.XA CN201410412077A CN104199874A CN 104199874 A CN104199874 A CN 104199874A CN 201410412077 A CN201410412077 A CN 201410412077A CN 104199874 A CN104199874 A CN 104199874A
Authority
CN
China
Prior art keywords
user
page
webpage
interest
method based
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410412077.XA
Other languages
English (en)
Other versions
CN104199874B (zh
Inventor
姚念民
张薇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harbin Engineering University
Original Assignee
Harbin Engineering University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Harbin Engineering University filed Critical Harbin Engineering University
Priority to CN201410412077.XA priority Critical patent/CN104199874B/zh
Publication of CN104199874A publication Critical patent/CN104199874A/zh
Application granted granted Critical
Publication of CN104199874B publication Critical patent/CN104199874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Abstract

本发明涉及一种基于用户浏览行为的网页推荐方法,其特征在于:步骤1:利用浏览器收集每个页面的停留时间以及页面内容信息;步骤2:对页面内容进行文本分析,获得页面的特征项;步骤3:根据页面停留时间和特征项,分析出用户对每个特征项的兴趣程度,得到用户兴趣类权值;步骤4:将权值较高的兴趣类作为关键词,利用爬虫程序,将Web上与用户兴趣有关的网页按照类别全部抓取下来;步骤5:利用余弦夹角函数计算抓取的网页与用户已浏览的网页的相似度,将相似度较高的网页推送给用户。

Description

一种基于用户浏览行为的网页推荐方法
技术领域
本发明涉及一种基于用户浏览行为的网页推荐方法。
背景技术
在网络技术飞速发展的今天,信息和资源也随之迅猛增长。在网络方面这种趋势显得尤为突出。面对Web上如此庞大的信息资源,Web上的“信息迷航”和“信息过载”等问题也在加剧。为了防止此类问题的愈演愈烈,有必要提供一种基于用户浏览行为的网页推荐方法,在Web上寻找更相关的信息以满足不同用户的个性化需求。
发明内容
本发明目的在于提供一种基于用户浏览行为的网页推荐方法,通过获取并分析用户的浏览行为数据,向用户推荐他可能感兴趣的网页,满足用户的个性化需求。
实现本发明目的技术方案:
一种基于用户浏览行为的网页推荐方法,其特征在于:
步骤1:利用浏览器收集每个页面的停留时间以及页面内容信息;
步骤2:对页面内容进行文本分析,获得页面的特征项;
步骤3:根据页面停留时间和特征项,分析出用户对每个特征项的兴趣程度,得到用户兴趣类权值;
步骤4:将权值较高的兴趣类作为关键词,利用爬虫程序,将Web上与用户兴趣有关的网页按照类别全部抓取下来;
步骤5:利用余弦夹角函数计算抓取的网页与用户已浏览的网页的相似度,将相似度较高的网页推送给用户。
步骤1中,利用浏览器监听页面的创建和消亡、鼠标滚轮的滑动,统计页面的停留时间;利用在浏览器中得到所有页面url,对页面源代码即页面内容进行获取。
步骤2中,首先对网页中的干扰信息进行清理,所说的干扰信息为HTML页面的框架结构信息、超链接信息或者脚本信息。
步骤2中,文本分析时,首先,对处理过的页面文档集进行分词处理,然后,对文本中所有特征项进行权值计算,并抽取权值最高的N个词语作为页面的主题内容,N值由用户设定。
步骤3中,兴趣类权值计算公式如下所示:
InterestDegree(Ij)=KeywordDegree(Ij)×ViewtimeDegree(Ij)
兴趣等级InterestDegree(Ij),表示用户兴趣类权值;
页面停留时间等级ViewtimeDegree(Ij),表示用户在每一关键词中花费的时间时间占总浏览时间的比值,Ij∈T,T表示特征集合;
关键词兴趣等级KeywordDegree(Ij),表示每一关键词在主题词集合T中出现的次数占关键词的总数的比值,Ij∈T,T表示特征集合。
本发明具有的有益效果:
本发明在用户进行浏览网页时,利用浏览器将每个页面的停留时间以及页面内容收集起来;在数据预处理阶段,对页面内容进行文本分析,获得页面的特征项;根据页面停留时间和特征项出现频率分析出用户对每个特征项的兴趣程度,得到用户的当前兴趣模型;最后根据页面停留时间和特征项对用户兴趣的影响分析出用户对每个特征项的兴趣程度,得到用户的当前兴趣,将相关网页推送给用户。本发明不仅能够自动记录用户行为,实时分析,挖掘用户当前的兴趣偏好,还可以掌握用户对所有兴趣的喜爱程度,可以利用此信息进行实时的个性化推荐服务。
本发明在数据预处理阶段即步骤2中,首先对网页中的干扰信息进行清理,在文本分析时,首先,对处理过的页面文档集进行分词处理,然后,对文本中所有特征项进行权值计算,并抽取权值最高的N个词语作为页面的主题内容,能够有效提高获得页面特征项的速度和准确率。本发明在步骤3中通过兴趣类权值计算公式,能够充分体现出用户对浏览网页的兴趣。
具体实施方式
步骤1:利用浏览器收集每个页面的停留时间以及页面内容信息;
利用浏览器监听页面的创建和消亡、鼠标滚轮的滑动,统计页面的停留时间;每当一个页面(pageA)加载完成时,浏览器会将此时的系统时间记录下来,作为页面停留时间的开始时刻T(startA)。当这个页面进入非活跃状态时,也就是用户进行了关闭页面的操作或进行了新的网页浏览,浏览器就会再次记录系统时间,作为页面停留时间的结束时刻T(endA)。那么用户在此页面的页面停留时间StayTime(pageA)就等于结束时刻与开始时刻的时间差。页面停留时间计算公式如下:
StayTime(pageA)=T(endA)-T(startA)
利用在浏览器中得到所有页面url,对页面源代码,即页面内容,进行获取。
步骤2:对页面内容进行文本分析,获得页面的特征项;
首先对网页中的干扰信息进行清理,所说的干扰信息为HTML页面的框架结构信息、超链接信息或者脚本信息。
文本分析时,首先,对处理过的页面文档集进行分词处理,然后,对文本中所有特征项进行权值计算,并抽取权值最高的N个词语作为页面的主题内容,N值由用户设定,本实施例中,N取7。
步骤3:根据页面停留时间和特征项,分析出用户对每个特征项的兴趣程度,得到用户兴趣类权值;
在用户兴趣挖掘阶段,考虑到页面停留时间和特征项对用户兴趣的影响,对用户每一兴趣类进行兴趣强度计算,即计算用户兴趣类权值。
兴趣等级InterestDegree(Ij):表示用户兴趣类权值。
页面停留时间等级ViewtimeDegree(Ij)(Ij∈T)(T表示特征集合)::表示用户在每一关键词中花费的时间时间占总浏览时间的比值。
关键词兴趣等级KeywordDegree(Ij)(Ij∈T):表示每一关键词在主题词集合T中出现的次数占关键词的总数的比值。
兴趣权值计算公式如下所示:
InterestDegree(Ij)=KeywordDegree(Ij)×ViewtimeDegree(Ij)
通过计算页面停留时间等级和关键词兴趣等级,就可计算出用户对每个兴趣类的兴趣强度,从而得到用户兴趣表示。
用户兴趣表示为:((I1,InterestDegree(I1)),(I2,InterestDegree(I2)),...,(In,InterestDegree(In))。
其中,In表示用户的兴趣类,InterestDegree(In)表示In对应的用户兴趣类权值。
经过文本分析后,就可以利用特征项表示页面内容,构建向量空间模型。对于页面集合P={p1,p2,...,pn}中的任意页面pi(1<=i<=n),表示成pi={(ti1,wi1),(ti2,wi2),...,(tin,win)}(n>=1)。其中tik(1<=k<=n)表示页面的特征项,wik(1<=k<=n)表示特征项对应的权值。在向量空间模型下,使用特征项的权重集合表示页面向量,页面pi和pj的页面向量分别为pi(wi1,wi2,...,win),pj(wj1,wj2,...,wjn)。两个页面之间的相似度Sim(pi,pj)的公式为:
Sim ( p i , p j ) = cos &theta; &Sigma; k w ik &times; w jk ( &Sigma; k w ik 2 ) ( &Sigma; k w jk 2 )
将用户兴趣表示中权值较高的兴趣类作为关键词,利用爬虫程序,将Web上与用户兴趣有关的网页按照类别全部抓取下来。再通过上面的余弦夹角公式就能求得抓取页面与进行文本分析页面之间的相似度。将相似度较高的网页推送给用户,从而达到个性化推荐的目的。
步骤4:将权值较高的兴趣类作为关键词,利用爬虫程序,将Web上与用户兴趣有关的网页按照类别全部抓取下来;
步骤5:利用余弦夹角函数计算抓取的网页与用户已浏览的网页的相似度,将相似度较高的网页推送给用户。

Claims (5)

1.一种基于用户浏览行为的网页推荐方法,其特征在于:
步骤1:利用浏览器收集每个页面的停留时间以及页面内容信息;
步骤2:对页面内容进行文本分析,获得页面的特征项;
步骤3:根据页面停留时间和特征项,分析出用户对每个特征项的兴趣程度,得到用户兴趣类权值;
步骤4:将权值较高的兴趣类作为关键词,利用爬虫程序,将Web上与用户兴趣有关的网页按照类别全部抓取下来;
步骤5:利用余弦夹角函数计算抓取的网页与用户已浏览的网页的相似度,将相似度较高的网页推送给用户。
2.根据权利要求1所述的基于用户浏览行为的网页推荐方法,其特征在于:步骤1中,利用浏览器监听页面的创建和消亡、鼠标滚轮的滑动,统计页面的停留时间;利用在浏览器中得到所有页面url,对页面源代码即页面内容进行获取。
3.根据权利要求2所述的基于用户浏览行为的网页推荐方法,其特征在于:步骤2中,首先对网页中的干扰信息进行清理,所说的干扰信息为HTML页面的框架结构信息、超链接信息或者脚本信息。
4.根据权利要求3所述的基于用户浏览行为的网页推荐方法,其特征在于:步骤2中,文本分析时,首先,对处理过的页面文档集进行分词处理,然后,对文本中所有特征项进行权值计算,并抽取权值最高的N个词语作为页面的主题内容,N值由用户设定。
5.根据权利要求4所述的基于用户浏览行为的网页推荐方法,其特征在于:步骤3中,
兴趣类权值计算公式如下所示:
InterestDegree(Ij)=KeywordDegree(Ij)×ViewtimeDegree(Ij)
兴趣等级InterestDegree(Ij),表示用户兴趣类权值;
页面停留时间等级ViewtimeDegree(Ij),表示用户在每一关键词中花费的时间时间占总浏览时间的比值,Ij∈T,T表示特征集合;
关键词兴趣等级KeywordDegree(Ij),表示每一关键词在主题词集合T中出现的次数占关键词的总数的比值,Ij∈T,T表示特征集合。
CN201410412077.XA 2014-08-20 2014-08-20 一种基于用户浏览行为的网页推荐方法 Active CN104199874B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410412077.XA CN104199874B (zh) 2014-08-20 2014-08-20 一种基于用户浏览行为的网页推荐方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410412077.XA CN104199874B (zh) 2014-08-20 2014-08-20 一种基于用户浏览行为的网页推荐方法

Publications (2)

Publication Number Publication Date
CN104199874A true CN104199874A (zh) 2014-12-10
CN104199874B CN104199874B (zh) 2018-07-31

Family

ID=52085167

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410412077.XA Active CN104199874B (zh) 2014-08-20 2014-08-20 一种基于用户浏览行为的网页推荐方法

Country Status (1)

Country Link
CN (1) CN104199874B (zh)

Cited By (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104951961A (zh) * 2015-06-02 2015-09-30 百度在线网络技术(北京)有限公司 用于推送内容的方法、终端、服务器以及系统
CN105279224A (zh) * 2015-09-09 2016-01-27 百度在线网络技术(北京)有限公司 信息推送方法及装置
CN105683962A (zh) * 2016-01-08 2016-06-15 马岩 网络信息的抓取方法及系统
CN105760516A (zh) * 2016-02-25 2016-07-13 广州视源电子科技股份有限公司 区分用户的方法及区分用户的装置
CN106156259A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种用户行为信息展示方法及系统
CN106168953A (zh) * 2016-06-02 2016-11-30 中国人民解放军国防科学技术大学 面向弱关系社交网络的博文推荐方法
CN106294601A (zh) * 2016-07-28 2017-01-04 腾讯科技(深圳)有限公司 数据处理方法和装置
CN106326244A (zh) * 2015-06-19 2017-01-11 联想企业解决方案(新加坡)有限公司 用于确定用户对基于Web内容的兴趣的方法和装置
CN106326320A (zh) * 2015-07-09 2017-01-11 阿里巴巴集团控股有限公司 一种个性化引导的实现方法及装置
WO2017028099A1 (zh) * 2015-08-16 2017-02-23 常平 网站推荐方法和网站推荐系统
WO2017028097A1 (zh) * 2015-08-16 2017-02-23 常平 推荐附近用户时的信息提醒方法和用户推荐系统
WO2017028098A1 (zh) * 2015-08-16 2017-02-23 常平 推荐网站时显示技术信息的方法和网站推荐系统
WO2017028092A1 (zh) * 2015-08-16 2017-02-23 常平 投放网页广告时的信息提示方法和广告投放系统
WO2017028095A1 (zh) * 2015-08-16 2017-02-23 常平 根据网站浏览时间识别用户兴趣的方法和数据处理系统
WO2017028094A1 (zh) * 2015-08-16 2017-02-23 常平 识别用户兴趣时的信息提醒方法和数据处理系统
WO2017036341A1 (en) * 2015-09-03 2017-03-09 Huawei Technologies Co., Ltd. Random index pattern matching based email relations finder system
CN106599147A (zh) * 2016-12-06 2017-04-26 庄爱芹 一种浏览器浏览记录的管理方法及装置
CN106960063A (zh) * 2017-04-20 2017-07-18 广州优亚信息技术有限公司 一种针对招商引资领域的互联网情报抓取和推荐系统
CN107122367A (zh) * 2016-02-25 2017-09-01 阿里巴巴集团控股有限公司 基于用户浏览行为的用户属性值计算方法和计算装置
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法
CN107341233A (zh) * 2017-07-03 2017-11-10 北京拉勾科技有限公司 一种职位推荐方法及计算设备
CN107463573A (zh) * 2016-06-02 2017-12-12 广州市动景计算机科技有限公司 内容信息提供方法、设备、浏览器、电子设备和服务器
CN107644028A (zh) * 2016-07-20 2018-01-30 平安科技(深圳)有限公司 网页数据的收集方法及系统
WO2018036272A1 (zh) * 2016-08-22 2018-03-01 上海壹账通金融科技有限公司 新闻内容的推送方法、电子装置及计算机可读存储介质
CN107766449A (zh) * 2017-09-26 2018-03-06 杭州云赢网络科技有限公司 热点挖掘方法、装置、电子设备及存储介质
CN107770274A (zh) * 2017-10-23 2018-03-06 林楚莲 一种网页推送方法及系统
CN108182255A (zh) * 2017-12-29 2018-06-19 重庆金融资产交易所有限责任公司 产权项目信息推荐方法、装置、存储介质和计算机设备
CN108337281A (zh) * 2017-01-19 2018-07-27 北京京东尚科信息技术有限公司 计算页面浏览时长的方法及系统
CN108364353A (zh) * 2017-12-27 2018-08-03 广东鸿威国际会展集团有限公司 引导观看者观看场景的三维直播流的系统和方法
CN108415563A (zh) * 2017-12-27 2018-08-17 广东鸿威国际会展集团有限公司 沉浸式三维虚拟显示系统和方法
CN108830634A (zh) * 2018-04-26 2018-11-16 湖北今古传奇数字新媒体有限公司 一种自媒体平台用户行为分析及管理方法
CN109190024A (zh) * 2018-08-20 2019-01-11 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN109189660A (zh) * 2018-09-30 2019-01-11 北京诸葛找房信息技术有限公司 一种基于用户鼠标交互行为的爬虫识别方法
CN109740061A (zh) * 2019-01-03 2019-05-10 北京奇艺世纪科技有限公司 一种基于用户浏览行为的信息流数据动态加载方法及装置
CN110363564A (zh) * 2019-05-28 2019-10-22 成都美美臣科技有限公司 一个电子商务网站自动化广告推送方法
CN110929017A (zh) * 2019-11-25 2020-03-27 三角兽(北京)科技有限公司 文本的推荐方法及装置
CN111125591A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 曝光信息的统计方法、装置、终端及存储介质
CN112487316A (zh) * 2019-09-11 2021-03-12 海信电子科技(武汉)有限公司 一种关闭浏览器中标签页的方法及终端
CN112507230A (zh) * 2020-12-16 2021-03-16 平安银行股份有限公司 基于浏览器的网页推荐方法、装置、电子设备及存储介质
CN113176878A (zh) * 2021-06-30 2021-07-27 深圳市维度数据科技股份有限公司 自动查询方法、装置和设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法
CN103577478A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 网页推送方法及系统
CN103678710A (zh) * 2013-12-31 2014-03-26 同济大学 一种基于用户行为的信息推荐方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102622445A (zh) * 2012-03-15 2012-08-01 华南理工大学 一种基于用户兴趣感知的网页推送系统及方法
CN103577478A (zh) * 2012-08-06 2014-02-12 腾讯科技(深圳)有限公司 网页推送方法及系统
CN103678710A (zh) * 2013-12-31 2014-03-26 同济大学 一种基于用户行为的信息推荐方法

Cited By (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106156259A (zh) * 2015-04-28 2016-11-23 天脉聚源(北京)科技有限公司 一种用户行为信息展示方法及系统
CN104951961A (zh) * 2015-06-02 2015-09-30 百度在线网络技术(北京)有限公司 用于推送内容的方法、终端、服务器以及系统
CN106326244A (zh) * 2015-06-19 2017-01-11 联想企业解决方案(新加坡)有限公司 用于确定用户对基于Web内容的兴趣的方法和装置
CN106326320A (zh) * 2015-07-09 2017-01-11 阿里巴巴集团控股有限公司 一种个性化引导的实现方法及装置
WO2017005119A1 (zh) * 2015-07-09 2017-01-12 阿里巴巴集团控股有限公司 一种个性化引导的实现方法及装置
WO2017028099A1 (zh) * 2015-08-16 2017-02-23 常平 网站推荐方法和网站推荐系统
WO2017028097A1 (zh) * 2015-08-16 2017-02-23 常平 推荐附近用户时的信息提醒方法和用户推荐系统
WO2017028098A1 (zh) * 2015-08-16 2017-02-23 常平 推荐网站时显示技术信息的方法和网站推荐系统
WO2017028092A1 (zh) * 2015-08-16 2017-02-23 常平 投放网页广告时的信息提示方法和广告投放系统
WO2017028095A1 (zh) * 2015-08-16 2017-02-23 常平 根据网站浏览时间识别用户兴趣的方法和数据处理系统
WO2017028094A1 (zh) * 2015-08-16 2017-02-23 常平 识别用户兴趣时的信息提醒方法和数据处理系统
US10936638B2 (en) 2015-09-03 2021-03-02 Huawei Technologies Co., Ltd. Random index pattern matching based email relations finder system
WO2017036341A1 (en) * 2015-09-03 2017-03-09 Huawei Technologies Co., Ltd. Random index pattern matching based email relations finder system
CN105279224A (zh) * 2015-09-09 2016-01-27 百度在线网络技术(北京)有限公司 信息推送方法及装置
CN105279224B (zh) * 2015-09-09 2019-01-15 百度在线网络技术(北京)有限公司 信息推送方法及装置
WO2017117805A1 (zh) * 2016-01-08 2017-07-13 马岩 网络信息的抓取方法及系统
CN105683962A (zh) * 2016-01-08 2016-06-15 马岩 网络信息的抓取方法及系统
CN105760516A (zh) * 2016-02-25 2016-07-13 广州视源电子科技股份有限公司 区分用户的方法及区分用户的装置
CN107122367B (zh) * 2016-02-25 2020-07-03 阿里巴巴集团控股有限公司 基于用户浏览行为的用户属性值计算方法和计算装置
CN107122367A (zh) * 2016-02-25 2017-09-01 阿里巴巴集团控股有限公司 基于用户浏览行为的用户属性值计算方法和计算装置
CN107203530A (zh) * 2016-03-16 2017-09-26 北大方正集团有限公司 信息推荐方法
CN106168953A (zh) * 2016-06-02 2016-11-30 中国人民解放军国防科学技术大学 面向弱关系社交网络的博文推荐方法
CN106168953B (zh) * 2016-06-02 2019-12-20 中国人民解放军国防科学技术大学 面向弱关系社交网络的博文推荐方法
CN107463573B (zh) * 2016-06-02 2020-10-13 阿里巴巴(中国)有限公司 内容信息提供方法、设备、浏览器、电子设备和服务器
CN107463573A (zh) * 2016-06-02 2017-12-12 广州市动景计算机科技有限公司 内容信息提供方法、设备、浏览器、电子设备和服务器
CN107644028A (zh) * 2016-07-20 2018-01-30 平安科技(深圳)有限公司 网页数据的收集方法及系统
CN107644028B (zh) * 2016-07-20 2020-09-04 平安科技(深圳)有限公司 网页数据的收集方法及系统
CN106294601A (zh) * 2016-07-28 2017-01-04 腾讯科技(深圳)有限公司 数据处理方法和装置
WO2018036272A1 (zh) * 2016-08-22 2018-03-01 上海壹账通金融科技有限公司 新闻内容的推送方法、电子装置及计算机可读存储介质
CN106599147A (zh) * 2016-12-06 2017-04-26 庄爱芹 一种浏览器浏览记录的管理方法及装置
CN108337281A (zh) * 2017-01-19 2018-07-27 北京京东尚科信息技术有限公司 计算页面浏览时长的方法及系统
CN106960063A (zh) * 2017-04-20 2017-07-18 广州优亚信息技术有限公司 一种针对招商引资领域的互联网情报抓取和推荐系统
CN107341233A (zh) * 2017-07-03 2017-11-10 北京拉勾科技有限公司 一种职位推荐方法及计算设备
CN107341233B (zh) * 2017-07-03 2020-11-06 北京拉勾科技有限公司 一种职位推荐方法及计算设备
CN107766449A (zh) * 2017-09-26 2018-03-06 杭州云赢网络科技有限公司 热点挖掘方法、装置、电子设备及存储介质
CN107770274A (zh) * 2017-10-23 2018-03-06 林楚莲 一种网页推送方法及系统
CN108415563A (zh) * 2017-12-27 2018-08-17 广东鸿威国际会展集团有限公司 沉浸式三维虚拟显示系统和方法
CN108364353A (zh) * 2017-12-27 2018-08-03 广东鸿威国际会展集团有限公司 引导观看者观看场景的三维直播流的系统和方法
CN108182255B (zh) * 2017-12-29 2020-07-28 重庆金融资产交易所有限责任公司 产权项目信息推荐方法、装置、存储介质和计算机设备
CN108182255A (zh) * 2017-12-29 2018-06-19 重庆金融资产交易所有限责任公司 产权项目信息推荐方法、装置、存储介质和计算机设备
CN108830634A (zh) * 2018-04-26 2018-11-16 湖北今古传奇数字新媒体有限公司 一种自媒体平台用户行为分析及管理方法
CN109190024B (zh) * 2018-08-20 2023-04-07 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN109190024A (zh) * 2018-08-20 2019-01-11 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
WO2020037930A1 (zh) * 2018-08-20 2020-02-27 平安科技(深圳)有限公司 信息推荐方法、装置、计算机设备及存储介质
CN109189660A (zh) * 2018-09-30 2019-01-11 北京诸葛找房信息技术有限公司 一种基于用户鼠标交互行为的爬虫识别方法
CN111125591B (zh) * 2018-11-01 2023-07-25 百度在线网络技术(北京)有限公司 曝光信息的统计方法、装置、终端及存储介质
CN111125591A (zh) * 2018-11-01 2020-05-08 百度在线网络技术(北京)有限公司 曝光信息的统计方法、装置、终端及存储介质
CN109740061A (zh) * 2019-01-03 2019-05-10 北京奇艺世纪科技有限公司 一种基于用户浏览行为的信息流数据动态加载方法及装置
CN110363564A (zh) * 2019-05-28 2019-10-22 成都美美臣科技有限公司 一个电子商务网站自动化广告推送方法
CN112487316A (zh) * 2019-09-11 2021-03-12 海信电子科技(武汉)有限公司 一种关闭浏览器中标签页的方法及终端
CN110929017A (zh) * 2019-11-25 2020-03-27 三角兽(北京)科技有限公司 文本的推荐方法及装置
CN112507230A (zh) * 2020-12-16 2021-03-16 平安银行股份有限公司 基于浏览器的网页推荐方法、装置、电子设备及存储介质
CN113176878A (zh) * 2021-06-30 2021-07-27 深圳市维度数据科技股份有限公司 自动查询方法、装置和设备

Also Published As

Publication number Publication date
CN104199874B (zh) 2018-07-31

Similar Documents

Publication Publication Date Title
CN104199874A (zh) 一种基于用户浏览行为的网页推荐方法
Khder Web scraping or web crawling: State of art, techniques, approaches and application.
CN103605794B (zh) 一种网站分类方法
CN103226578B (zh) 面向医学领域的网站识别和网页细分类的方法
CN103177090B (zh) 一种基于大数据的话题检测方法及装置
CN104572977B (zh) 一种农产品质量安全事件在线检测方法
CN102915335B (zh) 基于用户操作记录和资源内容的信息关联方法
CN105574047A (zh) 一种基于网站主页特征分析的中文网站分类方法和系统
CN104462213A (zh) 一种基于大数据的用户行为分析方法及系统
CN101515272B (zh) 提取网页内容的方法和装置
CN103077190A (zh) 基于排序学习技术的热门事件排名方法
CN105337987B (zh) 一种网络用户身份认证方法及系统
CN104391978B (zh) 用于浏览器的网页收藏处理方法及装置
CN102473190A (zh) 为网页分配关键词
CN102270331A (zh) 基于可视化搜索的网络购物导航方法
CN108416034B (zh) 基于金融异构大数据的信息采集系统及其控制方法
CN103177036A (zh) 一种标签自动提取方法和系统
CN102402566A (zh) 基于中文网页自动分类技术的Web用户行为分析方法
CN110287409B (zh) 一种网页类型识别方法及装置
CN104899324A (zh) 一种基于idc有害信息监测系统的样本训练系统
CN103744954A (zh) 一种词关联网模型的构建方法及其构建器
CN102663060A (zh) 一种识别被篡改网页的方法及装置
Jayamalini et al. Research on web data mining concepts, techniques and applications
CN103914538B (zh) 基于锚文本上下文和链接分析的主题抓取方法
CN106844588A (zh) 一种基于网络爬虫的用户行为数据的分析方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant