CN112507230B - 基于浏览器的网页推荐方法、装置、电子设备及存储介质 - Google Patents
基于浏览器的网页推荐方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN112507230B CN112507230B CN202011486854.7A CN202011486854A CN112507230B CN 112507230 B CN112507230 B CN 112507230B CN 202011486854 A CN202011486854 A CN 202011486854A CN 112507230 B CN112507230 B CN 112507230B
- Authority
- CN
- China
- Prior art keywords
- matrix
- login
- personal
- webpage
- browser
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000004927 fusion Effects 0.000 claims abstract description 27
- 239000011159 matrix material Substances 0.000 claims description 236
- 239000013598 vector Substances 0.000 claims description 40
- 238000004140 cleaning Methods 0.000 claims description 27
- 230000006870 function Effects 0.000 claims description 27
- 238000012216 screening Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 7
- 230000011218 segmentation Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005406 washing Methods 0.000 claims description 4
- 238000005516 engineering process Methods 0.000 abstract description 7
- 238000007726 management method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- QLKDMIUEWFNEPV-UHFFFAOYSA-N 4,5,6,7-Tetrachloro-2-trifluoromethylbenzimidazole Chemical compound ClC1=C(Cl)C(Cl)=C2NC(C(F)(F)F)=NC2=C1Cl QLKDMIUEWFNEPV-UHFFFAOYSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 238000000802 evaporation-induced self-assembly Methods 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/958—Organisation or management of web site content, e.g. publishing, maintaining pages or automatic linking
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明涉及大数据技术,揭露一种基于浏览器的网页推荐方法,包括:获取浏览器的个人登录数据、个人操作数据、历史登录数据及历史网页操作数据,根据个人登录数据及历史登录数据计算用户属性相似度,根据个人操作数据及历史网页操作数据计算用户操作相似度,计算所述用户属性相似度及所述用户操作相似度的融合相似度,利用所述融合相似度得到初始网页集,根据所述初始网页集通过所述浏览器搜索得到推荐网页集,并将所述推荐网页通过浏览器输出。本发明还涉及区块链技术,个人及历史的登录数据、操作数据等可存储于区块链节点中。本发明还提出基于浏览器的网页推荐装置、电子设备以及存储介质。本发明实可解决浏览器的网页推荐准确率低的问题。
Description
技术领域
本发明涉及大数据技术领域,尤其涉及一种基于浏览器的网页推荐方法、装置、电子设备及计算机可读存储介质。
背景技术
随着互联网技术的飞速发展,越来越多的用户利用浏览器访问网页,如何利用用户的有效信息,优化基于浏览器的网页推荐,是当前重要的技术研究方向。
目前,浏览器的网页推荐方法,主要通过用户自身操作浏览器的个人操作数据进行智能化推荐,这种以用户自身操作浏览器的个人操作数据进行智能化推荐称为显示反馈,但由于显示反馈极易受到数据影响,如当个人操作数据时,基于浏览器的网页推荐效果较差。
发明内容
本发明提供一种基于浏览器的网页推荐方法、装置、电子设备及计算机可读存储介质,其主要目的在于解决当个人操作数据缺失时,基于浏览器的网页推荐准确率低的问题。
为实现上述目的,本发明提供的一种基于浏览器的网页推荐方法,包括:
接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的网页集及个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型
利用所述的矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵;
计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度;
计算所述用户属性相似度及所述用户操作相似度的融合相似度;
利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
可选地,所述从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据,包括:
接收用户在所述浏览器中输入的搜索关键字,根据所述搜索关键字构建搜索请求,对所述搜索请求进行解析,得到网页内容关键字;
基于所述网页内容关键字,确定与所述搜索请求匹配的至少一个网页;
从所述个人登录数据中提取用户登录名及密码,根据所述网页在前端页面的历史记录及所述用户登录名及密码,获取所述个人网页操作数据。
可选地,所述对所述搜索请求进行解析,得到网页内容关键字,包括:
根据所述搜索请求通过所述浏览器获取网页内容,对所述网页内容的标题执行第一切分,获得所述标题的第一词语集;
获取所述第一词语集中的每个词语在所述网页内容中所属的语句;
对所述语句执行第二切分,获得所述语句的第二词语集;
计算所述第二词语集的网络使用频率,根据所述网络使用频率,从所述第二词语集中筛选得到所述网页内容关键字。
可选地,所述计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,包括:
获取每个用户属性向量的权重值;
利用预构建的相似度判断函数与每个用户属性向量的权重值,计算得到所述个人登录矩阵及所述标准登录矩阵的用户属性相似度。
可选地,所述计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度,包括:
计算所述个人操作矩阵中每个用户操作向量与所述标准操作矩阵中每个用户操作向量的指数值;
根据所述指数值,计算得到所述用户操作相似度。
可选地,所述根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型,包括:
利用所述历史操作矩阵或所述历史登录矩阵,构建出预测下一个用户的操作矩阵或登录矩阵的预测函数;
根据所述预测函数构建输入层及隐藏层;
组合所述输入层及所述隐藏层,得到所述矩阵清洗模型。
可选地,所述计算所述用户属性相似度及所述用户操作相似度的融合相似度,包括:
根据个人登录矩阵中的用户操作向量在所述标准登录矩阵中的用户操作向量下的梯度值,计算所述用户属性相似度的权重因子;
根据所述权重因子,计算所述用户属性相似度及所述用户操作相似度的融合相似度。
为了解决上述问题,本发明还提供一种基于浏览器的网页推荐装置,所述装置包括:
个人矩阵生成模块,用于接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的网页集及个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
历史矩阵生成模块,用于获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
相似度计算模块,用于根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型,利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵,计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度,计算所述用户属性相似度及所述用户操作相似度的融合相似度;
网页推荐模块,用于利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
存储器,存储至少一个指令;及
处理器,执行所述存储器中存储的指令以实现上述中任意一项所述的基于浏览器的网页推荐方法。
为了解决上述问题,本发明还提供一种计算机可读存储介质,包括存储数据区和存储程序区,存储数据区存储创建的数据,存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行时实现上述中任意一项所述的基于浏览器的网页推荐方法。
相比于背景技术,本发明实施例不仅仅依赖于个人操作数据进行网页推荐,还利用了个人登录数据、历史网页操作数据及历史登录数据,并计算所述个人登录数据及所述历史登录数据的用户属性相似度,及计算所述个人操作数据及所述历史网页操作数据的用户操作相似度,通过计算所述用户属性相似度及所述用户操作相似度的融合相似度,并基于所述融合相似度匹配出对应网页,完成网页推荐,因此当个人操作数据缺失时,本发明实施例依然可利用个人登录数据、历史网页操作数据及历史登录数据计算出融合相似度,进而完成网页推荐功能。因此本发明提出的基于浏览器的网页推荐方法、装置及计算机可读存储介质,可以解决当个人操作数据缺失时,基于浏览器的网页推荐准确率低的问题。
附图说明
图1为本发明一实施例提供的基于浏览器的网页推荐方法的流程示意图;
图2为本发明一实施例提供的基于浏览器的网页推荐方法中S1的详细流程示意图;
图3为本发明一实施例提供的基于浏览器的网页推荐装置的模块示意图;
图4为本发明一实施例提供的实现基于浏览器的网页推荐方法的电子设备的内部结构示意图;
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本申请实施例提供一种基于浏览器的网页推荐方法,所述基于浏览器的网页推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本申请实施例提供的该方法的电子设备中的至少一种。换言之,所述基于浏览器的网页推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端包括但不限于:单台服务器、服务器集群、云端服务器或云端服务器集群等。
参照图1所示,为本发明一实施例提供的基于浏览器的网页推荐方法的流程示意图。在本实施例中,基于浏览器的网页推荐方法包括:
S1、接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵。
所述浏览器是统一管理网页的平台。本发明较佳实施例中,所述个人登录数据包括用户登录名及密码,还包括用户用户年龄、性别、居住地、专业等的用户属性数据,及所述个人网页操作数据包括用户在预设时间段内浏览的网页集,以及对所述网页集中的每个网页的点击操作数据、在浏览器首页中收藏所述网页集内某网页、删除某网页等的用户行为数据。
详细地,参阅图2所示,所述从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据,包括:
S11、接收用户在所述浏览器中输入的搜索关键字,根据所述搜索关键字构建搜索请求,对所述搜索请求进行解析,得到网页内容关键字;
S12、基于所述网页内容关键字,确定与所述搜索请求匹配的至少一个网页;
S13、从所述个人登录数据中提取用户登录名及密码,根据所述网页在前端页面的历史记录及所述用户登录名及密码,获取所述个人网页操作数据。
本发明实施例中,所述搜索请求携包括所述搜索关键词和搜索参数。其中,所述搜索参数至少包括用于指示所述用户的信息参数和/或指示所述浏览器的信息参数,所述信息参数是以浏览器为基础的功能函数,包括loadTime()及TTFB()等功能函数,其中loadTime()表示浏览器的加载时间、TTFB()表示浏览器的页面搜索时间等。所述搜索关键词可为英语单词或中文词语。
其中,所述对所述搜索请求进行解析,得到网页内容关键字,包括:根据所述搜索请求通过所述浏览器获取网页内容,对所述网页内容的标题执行第一切分,获得所述标题的第一词语集;获取所述第一词语集中的每个词语在所述网页内容中所属的语句;对所述语句执行第二切分,获得所述语句的第二词语集;计算所述第二词语集的网络使用频率,根据所述网络使用频率,从所述第二词语集中筛选得到所述网页内容关键字。
其中,所述网络使用频率可由服务器根据所有用户的网页访问记录进行大数据分析,并且经过热点和趋势统计确定得到。进一步地,本发明实施例可使用结巴分词工具执行所述第一切分及所述第二切分。
本发明较佳实施例中,可使用WORD2VEC、Bert等模型,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵,其中,所述个人登录矩阵为Attrp=(a1,a2,A3,…,ai),其中ai表示第i个用户属性向量,所述个人操作矩阵为Actp=(b1,b2,b3,…,bj),其中,bj表示第j个用户操作向量。
S2、获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵。
应该了解,所述浏览器也供其他用户操作,因此存储有其他用户的网页历史登录信息及对应的历史网页操作数据。同样地,本发明实施例利用WORD2VEC、Bert等模型将所述历史网页操作数据及历史登录数据分别转变为历史操作矩阵及历史登录矩阵。
S3、根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型。
由于通过上述WORD2VEC、Bert等模型得到的历史操作矩阵及历史登录矩阵,是基于所有用户的历史登录及历史操作记录,为了进一步提高对当前用户的网页推荐的准确性,本发明实施例中,需构建出所述矩阵清洗模型,进一步清理所述历史操作矩阵及所述历史登录矩阵。
详细地,所述S3包括:利用所述历史操作矩阵或所述历史登录矩阵,构建出预测下一个用户的操作矩阵或登录矩阵的预测函数;根据所述预测函数构建出输入层及隐藏层;组合所述输入层及所述隐藏层,得到所述矩阵清洗模型。
如所述历史操作矩阵Actn=(x1,…,xt),所述下一个用户为t+1对应的操作矩阵vt+1为:
P(vt+1=vj|xt,…,x1)
其中,vj为在所述历史操作矩阵Actn=(x1,…,xt)为条件下,所述操作矩阵vt+1的预测值,xt为第t个用户的历史操作矩阵,P(vt+1=vj|xt,…,x1)表示在历史操作矩阵为前提下vt+1=vj的概率值。
进一步地,所述预测函数为:
P(vt+1=vj|xt,…,x1)=softmax(h(t)U+b2)
通过所述预测函数得到所述输入层及隐藏层分别为:
h(t)=sigmoid(h(t)H+e(t)I+b1)
e(t)=x(t)L
x(t)=(x1,…,xt)
其中,h(t)是所述矩阵清洗模型的隐藏层,e(t)是所述矩阵清洗模型的输入层,L为预构建的第一转换矩阵,H是预构建的第二转换矩阵,I是预构建的第三转换矩阵,U是预构建的第四转换矩阵,b1、b2是所述矩阵清洗模型的偏置,softmax表示逻辑回归函数,sigmoid表示激活函数。
S4、利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵。
如利用所述矩阵清洗模型对所述历史操作矩阵进行清理,当vt+1与xt+1的差值大于预设阈值时,调整所述历史操作矩阵Actn=(x1,…,xt,xt+1)中,x1至xt的矩阵值,直至vt+1与xt+1的差值小于或等于预设阈值,得到满足要求的标准操作矩阵同理,清理所述历史登录矩阵,得到标准登录矩阵。
S5、计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度。
进一步地,所述计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,包括:获取每个用户属性向量的权重值,利用预构建的相似度判断函数与每个用户属性向量的权重值,计算得到所述个人登录矩阵及所述标准登录矩阵的用户属性相似度。
详细地,所述用户属性相似度的计算方法为:
其中,u表示所述个人登录矩阵,v表示所述标准登录矩阵,fi(u,v)是所述个人登录矩阵及所述标准登录矩阵中,第i个用户属性向量的相似度判断函数,ωi表示第i个用户属性向量的权重值,表示所述用户属性相似度。
进一步地,所述计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度,包括:计算所述个人操作矩阵中每个用户操作向量与所述标准操作矩阵中每个用户操作向量的指数值,根据所述指数值,计算得到所述用户操作相似度。
详细地,所述用户操作相似度的计算方法为:
其中,w表示所述个人操作矩阵,z表示所述标准登录矩阵,表示所述用户操作相似度,rwi表示所述个人操作矩阵w中,第i个用户操作向量,rzi表示所述标准登录矩阵z中,第i个用户操作向量,m为所述个人操作矩阵的矩阵维度。
S6、计算所述用户属性相似度及所述用户操作相似度的融合相似度。
详细地,所述S6包括:
根据个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值,计算所述用户属性相似度的权重因子λ:
根据所述权重因子,计算所述用户属性相似度及所述用户操作相似度的融合相似度sim:
其中,λ为权重因子,σ为所述个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值。本发明实施例中,所述融合相似度能够反应历史网页操作数据对应的网页集中每个网页与当前用户的匹配程度。
S7、利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
本发明实施例根据所述融合相似度对所述历史网页操作数据对应的网页集进行排序,得到排序网页集;从所述排序网页集中提取与预设网页提取数量相同的网页,得到所述初始网页集。例如,所述网页集共100个网页,所述预设网页提取数量为10个,则本发明实施例从100个网页中提取融合相似度最大的前10个网页作为初始网页集。
进一步的,当得到所述初始网页集后,本发明实施例利用浏览器搜索与所述初始网页集相关的网页,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
相比于背景技术,本发明实施例不仅仅依赖于个人操作数据进行网页推荐,还利用了个人登录数据、历史网页操作数据及历史登录数据,并计算所述个人登录数据及所述历史登录数据的用户属性相似度,及计算所述个人操作数据及所述历史网页操作数据的用户操作相似度,通过计算所述用户属性相似度及所述用户操作相似度的融合相似度,并基于所述融合相似度匹配出对应网页,完成网页推荐,因此当个人操作数据缺失时,本发明实施例依然可利用个人登录数据、历史网页操作数据及历史登录数据计算出融合相似度,进而完成网页推荐功能。因此本发明提出的基于浏览器的网页推荐方法、装置及计算机可读存储介质,可以解决当个人操作数据缺失时,基于浏览器的网页推荐准确率低的问题。
如图3所示,是本发明基于浏览器的网页推荐装置的模块示意图。
本发明所述基于浏览器的网页推荐装置100可以安装于电子设备中。根据实现的功能,所述基于浏览器的网页推荐装置可以包括个人矩阵生成模块101、历史矩阵生成模块102、相似度计算模块103及网页推荐模块104。本发所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
在本实施例中,关于各模块/单元的功能如下:
所述个人矩阵生成模块101,用于接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的网页集及个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
所述历史矩阵生成模块102,用于获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
所述相似度计算模块103,用于根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型,利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵;
所述网页推荐模块104,用于利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
本发明实施例所提供的基于浏览器的网页推荐装置100中的各个模块能够在使用时基于与上述的基于浏览器的网页推荐方法采用相同的手段,并产生相同的技术效果,即解决当个人操作数据缺失时,基于浏览器的网页推荐准确率低的问题。
如图4所示,是本发明实现基于浏览器的网页推荐方法的电子设备的结构示意图。
所述电子设备1可以包括处理器10、存储器11和总线,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如基于浏览器的网页推荐程序12。
其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:SD或DX存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(Smart Media Card,SMC)、安全数字(SecureDigital,SD)卡、闪存卡(Flash Card)等。进一步地,所述存储器11还可以既包括电子设备1的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于浏览器的网页推荐程序12的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processing unit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(Control Unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如执行基于浏览器的网页推荐程序等),以及调用存储在所述存储器11内的数据,以执行电子设备1的各种功能和处理数据。
所述总线可以是外设部件互连标准(peripheral component interconnect,简称PCI)总线或扩展工业标准结构(extended industry standard architecture,简称EISA)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。
图4仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图4示出的结构并不构成对所述电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
例如,尽管未示出,所述电子设备1还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备1还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
进一步地,所述电子设备1还可以包括网络接口,可选地,所述网络接口可以包括有线接口和/或无线接口(如WI-FI接口、蓝牙接口等),通常用于在该电子设备1与其他电子设备之间建立通信连接。
可选地,该电子设备1还可以包括用户接口,用户接口可以是显示器(Display)、输入单元(比如键盘(Keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是LED显示器、液晶显示器、触控式液晶显示器以及OLED(Organic Light-Emitting Diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备1中处理的信息以及用于显示可视化的用户界面。
应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
所述电子设备1中的所述存储器11存储的基于浏览器的网页推荐程序12是多个指令的组合,在所述处理器10中运行时,可以实现:
接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据及网页集,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型;
利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵;
计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度;
计算所述用户属性相似度及所述用户操作相似度的融合相似度;
利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
进一步地,所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)。
进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
在本发明所提供的几个实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图表记视为限制所涉及的权利要求。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。
Claims (9)
1.一种基于浏览器的网页推荐方法,其特征在于,所述方法包括:
接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型;
利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵;
计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度;
所述用户属性相似度的计算方法为:
其中,表示所述个人登录矩阵,/>表示所述标准登录矩阵,/>是所述个人登录矩阵及所述标准登录矩阵中的第/>个用户属性向量的相似度判断函数,/>表示第/>个用户属性向量的权重值,/>表示所述用户属性相似度;
所述用户操作相似度的计算方法为:
其中,表示所述个人操作矩阵,/>表示所述标准登录矩阵,/>表示所述用户操作相似度,/>表示所述个人操作矩阵/>中的第/>个用户操作向量,/>表示所述标准登录矩阵/>中的第/>个用户操作向量,/>为所述个人操作矩阵的矩阵维度;
根据所述个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值,计算所述用户属性相似度的权重因子:
根据所述权重因子,计算所述用户属性相似度及所述用户操作相似度的融合相似度:
其中,为权重因子,/>为所述个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值;
利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
2.如权利要求1所述的基于浏览器的网页推荐方法,其特征在于,所述从所述浏览器中获取与所述个人登录数据对应的个人网页操作数据,包括:
接收用户在所述浏览器中输入的搜索关键字,根据所述搜索关键字构建搜索请求,对所述搜索请求进行解析,得到网页内容关键字;
基于所述网页内容关键字,确定与所述搜索请求匹配的至少一个网页;
从所述个人登录数据中提取用户登录名及密码,根据所述网页在前端页面的历史记录及所述用户登录名及密码,获取所述个人网页操作数据。
3.如权利要求2所述的基于浏览器的网页推荐方法,其特征在于,所述对所述搜索请求进行解析,得到网页内容关键字,包括:
根据所述搜索请求通过所述浏览器获取网页内容,对所述网页内容的标题执行第一切分,获得所述标题的第一词语集;
获取所述第一词语集中的每个词语在所述网页内容中所属的语句;
对所述语句执行第二切分,获得所述语句的第二词语集;
计算所述第二词语集的网络使用频率,根据所述网络使用频率,从所述第二词语集中筛选得到所述网页内容关键字。
4.如权利要求1所述的基于浏览器的网页推荐方法,其特征在于,所述计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,包括:
获取每个用户属性向量的权重值;
利用预构建的相似度判断函数与每个用户属性向量的权重值,计算得到所述个人登录矩阵及所述标准登录矩阵的用户属性相似度。
5.如权利要求1所述的基于浏览器的网页推荐方法,其特征在于,所述计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度,包括:
计算所述个人操作矩阵中每个用户操作向量与所述标准操作矩阵中每个用户操作向量的指数值;
根据所述指数值,计算得到所述用户操作相似度。
6.如权利要求1至5中任意一项所述的基于浏览器的网页推荐方法,其特征在于,所述根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型,包括:
利用所述历史操作矩阵或所述历史登录矩阵,构建出预测下一个用户的操作矩阵或登录矩阵的预测函数;
根据所述预测函数构建输入层及隐藏层;
组合所述输入层及所述隐藏层,得到所述矩阵清洗模型。
7.一种基于浏览器的网页推荐装置,其特征在于,所述装置包括:
个人矩阵生成模块,用于接收用户登录浏览器的个人登录数据,从所述浏览器中获取与所述个人登录数据对应的网页集及个人网页操作数据,将所述个人登录数据及所述个人网页操作数据分别转变为个人登录矩阵及个人操作矩阵;
历史矩阵生成模块,用于获取所述浏览器的历史网页操作数据及历史登录数据,将所述历史网页操作数据及所述历史登录数据,分别转变为历史操作矩阵及历史登录矩阵;
相似度计算模块,用于根据所述历史操作矩阵及所述历史登录矩阵,构建矩阵清洗模型,利用所述矩阵清洗模型,清理所述历史操作矩阵及所述历史登录矩阵,分别得到标准操作矩阵及标准登录矩阵,计算所述个人登录矩阵及所述标准登录矩阵的用户属性相似度,及计算所述个人操作矩阵及所述标准操作矩阵的用户操作相似度,根据所述个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值,计算所述用户属性相似度的权重因子:
根据所述权重因子,计算所述用户属性相似度及所述用户操作相似度的融合相似度:
其中,为权重因子,/>为所述个人操作矩阵的用户操作向量在所述标准登录矩阵的用户操作向量下的梯度值;
所述用户属性相似度的计算方法为:
其中,表示所述个人登录矩阵,/>表示所述标准登录矩阵,/>是所述个人登录矩阵及所述标准登录矩阵中的第/>个用户属性向量的相似度判断函数, />表示第/>个用户属性向量的权重值,/>表示所述用户属性相似度;
所述用户操作相似度的计算方法为:
其中,表示所述个人操作矩阵,/>表示所述标准登录矩阵,/>表示所述用户操作相似度,/>表示所述个人操作矩阵/>中的第/>个用户操作向量,/>表示所述标准登录矩阵/>中的第/>个用户操作向量,/>为所述个人操作矩阵的矩阵维度;
网页推荐模块,用于利用所述融合相似度从所述历史网页操作数据对应的网页集中筛选得到初始网页集,根据所述初始网页集在所述浏览器中执行搜索,得到推荐网页集,并将所述推荐网页集通过所述浏览器输出。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至6中任一项所述的基于浏览器的网页推荐方法。
9.一种计算机可读存储介质,包括存储数据区和存储程序区,其特征在于,所述存储数据区存储创建的数据,所述存储程序区存储有计算机程序;其中,所述计算机程序被处理器执行实现如权利要求1至6中任一项所述的基于浏览器的推荐方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011486854.7A CN112507230B (zh) | 2020-12-16 | 2020-12-16 | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011486854.7A CN112507230B (zh) | 2020-12-16 | 2020-12-16 | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112507230A CN112507230A (zh) | 2021-03-16 |
CN112507230B true CN112507230B (zh) | 2024-05-17 |
Family
ID=74972697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011486854.7A Active CN112507230B (zh) | 2020-12-16 | 2020-12-16 | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112507230B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114979674B (zh) * | 2021-05-06 | 2023-09-05 | 中移互联网有限公司 | 一种基于区块链的内容推送方法、装置及电子设备 |
CN113535311A (zh) * | 2021-07-29 | 2021-10-22 | 展讯半导体(成都)有限公司 | 一种页面显示方法、装置及电子设备 |
CN115114557B (zh) * | 2022-08-30 | 2023-03-31 | 平安银行股份有限公司 | 基于区块链的页面数据获取方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324645A (zh) * | 2012-03-23 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 一种网页推荐方法和装置 |
CN104199874A (zh) * | 2014-08-20 | 2014-12-10 | 哈尔滨工程大学 | 一种基于用户浏览行为的网页推荐方法 |
CN104408105A (zh) * | 2014-11-20 | 2015-03-11 | 四川长虹电器股份有限公司 | 一种适用于智能tv用户的好友推荐方法 |
US9633081B1 (en) * | 2013-09-30 | 2017-04-25 | Google Inc. | Systems and methods for determining application installation likelihood based on user network characteristics |
CN110399563A (zh) * | 2019-08-05 | 2019-11-01 | 中国人民解放军军事科学院评估论证研究中心 | 一种基于用户行为分析的偏好模型及个性化信息主动推荐方法 |
WO2019226933A1 (en) * | 2018-05-25 | 2019-11-28 | Target Brands, Inc. | Personalized recommendations for unidentified users based on web browsing context |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20110106796A1 (en) * | 2009-10-29 | 2011-05-05 | Marko Svaic | System and method for recommendation of interesting web pages based on user browsing actions |
-
2020
- 2020-12-16 CN CN202011486854.7A patent/CN112507230B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103324645A (zh) * | 2012-03-23 | 2013-09-25 | 腾讯科技(深圳)有限公司 | 一种网页推荐方法和装置 |
US9633081B1 (en) * | 2013-09-30 | 2017-04-25 | Google Inc. | Systems and methods for determining application installation likelihood based on user network characteristics |
CN104199874A (zh) * | 2014-08-20 | 2014-12-10 | 哈尔滨工程大学 | 一种基于用户浏览行为的网页推荐方法 |
CN104408105A (zh) * | 2014-11-20 | 2015-03-11 | 四川长虹电器股份有限公司 | 一种适用于智能tv用户的好友推荐方法 |
WO2019226933A1 (en) * | 2018-05-25 | 2019-11-28 | Target Brands, Inc. | Personalized recommendations for unidentified users based on web browsing context |
CN110399563A (zh) * | 2019-08-05 | 2019-11-01 | 中国人民解放军军事科学院评估论证研究中心 | 一种基于用户行为分析的偏好模型及个性化信息主动推荐方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112507230A (zh) | 2021-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2022141861A1 (zh) | 情感分类方法、装置、电子设备及存储介质 | |
CN112507230B (zh) | 基于浏览器的网页推荐方法、装置、电子设备及存储介质 | |
CN113449187B (zh) | 基于双画像的产品推荐方法、装置、设备及存储介质 | |
CN112541338A (zh) | 相似文本匹配方法、装置、电子设备及计算机存储介质 | |
CN115002200B (zh) | 基于用户画像的消息推送方法、装置、设备及存储介质 | |
CN110162522B (zh) | 一种分布式数据搜索系统及方法 | |
CN112380859A (zh) | 舆情信息的推荐方法、装置、电子设备及计算机存储介质 | |
WO2022160454A1 (zh) | 医疗文献的检索方法、装置、电子设备及存储介质 | |
CN113887941B (zh) | 业务流程生成方法、装置、电子设备及介质 | |
CN113592605B (zh) | 基于相似产品的产品推荐方法、装置、设备及存储介质 | |
CN115659008B (zh) | 大数据信息反馈的信息推送系统、方法、电子设备及介质 | |
CN113051480A (zh) | 资源推送方法、装置、电子设备及存储介质 | |
CN113886708A (zh) | 基于用户信息的产品推荐方法、装置、设备及存储介质 | |
CN113468421A (zh) | 基于向量匹配技术的产品推荐方法、装置、设备及介质 | |
WO2023178978A1 (zh) | 基于人工智能的处方审核方法、装置、设备及介质 | |
CN116362684A (zh) | 一种基于图书馆集群的图书管理方法、装置、设备及存储介质 | |
CN114741608A (zh) | 基于用户画像的新闻推荐方法、装置、设备及存储介质 | |
WO2022227171A1 (zh) | 关键信息提取方法、装置、电子设备及介质 | |
CN111403011B (zh) | 挂号科室推送方法、装置、系统、电子设备及存储介质 | |
CN116720525A (zh) | 基于问诊数据的疾病辅助分析方法、装置、设备及介质 | |
CN112528183B (zh) | 基于大数据的网页组件布局方法、装置、电子设备及介质 | |
CN116628162A (zh) | 语义问答方法、装置、设备及存储介质 | |
CN116578696A (zh) | 文本摘要生成方法、装置、设备及存储介质 | |
CN113656586B (zh) | 情感分类方法、装置、电子设备及可读存储介质 | |
CN113707302A (zh) | 基于关联信息的服务推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |