CN101320375A - 基于用户点击行为的数字图书搜索方法 - Google Patents

基于用户点击行为的数字图书搜索方法 Download PDF

Info

Publication number
CN101320375A
CN101320375A CNA2008100630104A CN200810063010A CN101320375A CN 101320375 A CN101320375 A CN 101320375A CN A2008100630104 A CNA2008100630104 A CN A2008100630104A CN 200810063010 A CN200810063010 A CN 200810063010A CN 101320375 A CN101320375 A CN 101320375A
Authority
CN
China
Prior art keywords
books
score
query word
retrieval
book
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100630104A
Other languages
English (en)
Other versions
CN101320375B (zh
Inventor
吴江琴
庄越挺
袁川
张寅�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University ZJU
Original Assignee
Zhejiang University ZJU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University ZJU filed Critical Zhejiang University ZJU
Priority to CN2008100630104A priority Critical patent/CN101320375B/zh
Publication of CN101320375A publication Critical patent/CN101320375A/zh
Application granted granted Critical
Publication of CN101320375B publication Critical patent/CN101320375B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

本发明公开了一种基于用户点击行为的数字图书搜索的方法。首先,提取Web日志中的图书阅读记录构建图书之间的关联图,使用该关联图来计算图书的相关性排序;其次,提取日志中的检索阅读记录,利用其中读者对检索结果的隐式反馈对查询词进行聚类;最后,在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种信息源,形成最终的图书搜索结果排序。本发明可以获得客观的图书相关性排序和很好的查询词聚类效果;将互联网上丰富的图书评分数据融入到相对封闭和静态的数字图书馆中,有效提高图书搜索质量。

Description

基于用户点击行为的数字图书搜索方法
技术领域
本发明涉及数字图书馆、信息检索和Web使用挖掘领域,尤其涉及一种基于用户点击行为的数字图书搜索方法。
背景技术
21世纪是数字化的时代,随着计算机技术、海量存储技术和网络技术的飞速发展,信息载体的数字化和信息传播的网络化得到了空前的深化,图书馆的数字化成为一个必然趋势。数字图书馆在世界很多国家受到了高度关注,并取得了迅猛发展,已经成为人们获取信息与知识的重要途径。
数字图书馆中通常拥有海量的数字图书资源,如何有效的利用这些丰富而宝贵的资源,让数字图书馆读者能够更充分的利用他们就显得非常重要。数字图书搜索是数字图书馆必须提供的支撑性服务本,它是数字图书馆中最为重要的一个功能模块,它使得读者能够很好地找到需要的图书资源,是数字图书馆服务平台的“第一线”。
传统的图书资源搜索系统是基于关系数据库的简单匹配查找,只能过滤出与读者所输入的关键字相匹配的相关图书条目,并没有使用有效的图书排序机制以提高读者检索的满意度,而且性能和用户体验不佳。
发明内容
本发明为克服数字图书馆中传统图书搜索系统质量差的缺点,提供了一种高质量的图书搜索结果排序方法。
基于用户点击行为的数字图书搜索方法包括以下步骤:
(1)提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分;
(2)提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类;
(3)抓取互联网上的图书评分数据,整合形成图书评分排序得分;
(4)在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序。
所述的提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的读者图书阅读记录,构建共同阅读过图书i和图书j的读者的数量矩阵
Figure A20081006301000061
用U={ui:0≤i<m}表示读者的集合,B={bj:0≤j<n}表示图书的集合,然后对
Figure A20081006301000062
进行归一化处理:
C i , j = C ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | B | C ~ i , j
得到图书关联矩阵Ci,j,使用向量BR=[br0,br1,br2,...,br|B|-1]T表示图书的相关性排序得分,向量d=[d0,d1,d2,...,d|B|-1]T表示图书的已知质量信息,最后使用下面的迭代方法来计算最终的图书相关性排序得分:
BR ( 0 ) = 1 | B | 1 | B | BR ( n + 1 ) = &alpha;CBR ( n ) + ( 1 - &alpha; ) d .
所述的提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的图书检索阅读记录,得到与每个查询词相关的数字图书,使用Q={qi:0≤i<m}表示查询词的集合,集合 B i &SubsetEqual; B 表示与查询词qi相关的图书,集合Gi,j定义为:
Figure A20081006301000067
构建表示与查询词qi和qj都相关的图书的数量的矩阵,定义为:
S ~ i , j = | G i , j |
归一化后即得到查询词相似性矩阵:
S i , j = S ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | Q | S ~ i , j
然后使用类似上述的图书相关性排序的迭代计算方式来对查询词进行聚类。
所述的抓取互联网上的图书评分数据,整合形成图书评分排序得分步骤:设计爬虫程序抓取互联网上著名图书网站上的图书评分页面,分析提取图书的元数据和图书评分,如果提取出来的图书在数字图书馆中存在,则整合不同网站上的相同图书的评分数据,设整合的站点为Si其中:0≤i<N,图书bk在站点Si上的归一化后的评分数据为vki,评分人数为pki,若该图书该站点上不存在或存在但是没有评分记录,那么vki或pki为零,使用如下公式来整合图书评分:
Figure A20081006301000071
所述的在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序步骤:将基于数字图书访问关联图的图书排序值表示为R=[r0,r1,r2,...,r|B|-1]T,将从互联网上整合得到的图书排序值表示为S=[s0,s1,s2,...,s|B|-1]T,将基于元数据文本相似度的检索得分表示为T=[t0,t1,t2,...,tn-1]T,其中B为图书的集合,三个排序值都是介于0到1之间的浮点值,得分最高的图书的分值为1,对于一次图书搜索,使用基于文本相似度的元数据检索获得匹配的图书列表B=[b0,b1,b2,...,bn-1]T,bk,0≤k<n为图书的编号,图书列表文本相似度得分为T=[t0,t1,t2,...,tn-1]T,n为匹配当前搜索关键词的图书数目,然后使用如下公式来计算最终的图书得分:
f k = &alpha;t k + &beta;r b k + &gamma;s b k 其中:0≤k<n
其中α,β,γ按照如下方式确定:从读者的图书检索阅读的序列数据中提取出一系列的有序对<key,book>,进而将有序对转化为<key,score>,score表示读者对图书的评分,得到的一系列有序对<key,score>,按照查询词的聚类结果来将前面得到的有序对分为m个组,第i组中的所有有序对满足key∈Qi,对于第i组中的每一个有序对j,计算出以它的key值作为查询词的检索结果中它对应的图书的三个排序分值,以有序对j的score分子作为最终的图书得分f,这样第i组中的所有有序对构成一个多元线性回归分析模型:
f ij = &alpha; i t ij + &beta; i r ib j + &gamma; i s ib j
使用每一组中的所有有序对来进行最小二乘估计可以得到针对每一个查询词类的αi,βi,γi
本发明所述的基于用户点击行为的数字图书搜索方法具有如下特点:
(1)充分挖掘和使用了数字图书馆Web使用日志中的用户点击行为数据,可以获得客观的图书相关性排序和很好的查询词聚类效果;
(2)将互联网上丰富的图书评分数据融入到相对封闭和静态的数字图书馆中,有效提高图书搜索质量;
(3)综合考虑了三种排序信息源,并使用读者的隐式反馈来进行集成,可以得到高质量的排序结果。
附图说明
图1是整合图书评分数据基本框架图;
具体实施方式
基于用户点击行为的数字图书搜索方法包括如下步骤:
1.提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分
设读者的集合为:U={ui:0≤i<m},其中m为读者的数量;图书的集合为:B={bj:0≤j<n},其中n为图书的数量。读者与图书的阅读关系表示为:T={ti,j:ui∈U∧bj∈B,0≤i<m,0≤j<n},其中ti,j为一个bool值,如果读者ui阅读了图书bj的20%以上的页数,则视为一次有效的阅读行为,ti,j等于True,否则视为没有发生过该阅读行为,ti,j等于False:
Figure A20081006301000081
图书与图书之间存在着关联关系,本发明通过同时阅读过两本图书的读者把这两本书关联起来。定义 U i , j &SubsetEqual; U , 为U的一个子集,表示同时阅读过图书bi和图书bj的读者的集合:
Figure A20081006301000083
这样就可以构建一个|B|*|B|的矩阵
Figure A20081006301000084
表示每一对图书之间共同阅读过它们的读者的数量:
C ~ i , j = | U i , j |
这里|·|表示一个集合的势。很明显 &ForAll; i , C ~ i , i = 0 而且
Figure A20081006301000087
是一个对称矩阵。
对矩阵做规格化处理:
C i , j = C ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | B | C ~ i , j
称C为图书关联矩阵,矩阵中的每一项代表了图书对的关联系数,图书关联矩阵也可以被看作是一个图书关联图GC的加权关联矩阵。GC中的节点表示集合B中图书,图书bi和图书bj之间有边链接当且仅当Ci,j>0,Ci,j为边的权重。有一点需要注意,虽然是一个对称矩阵,但是C并不是一个对称矩阵,所以边(bi,bj)和边(bj,bi)的权重并不是一致的,GC是一个有向加权图。
图书相关性排序算法最基本的思想就是通过从用户使用日志中提取出来的图书关联图来传播图书的质量信息,进而估算出图书的相关性排序。使用向量BR=[br0,br1,br2,...,br|B|-1]T表示图书的相关性排序得分,向量d=[d0,d1,d2,...,d|B|-1]T表示图书的已知质量信息,最后使用下面的迭代方法来计算最终的图书相关性排序得分:
BR ( 0 ) = 1 | B | 1 | B | BR ( n + 1 ) = &alpha;CBR ( n ) + ( 1 - &alpha; ) d
收敛后得到的BR即为图书rank值,在最终排序检索结果中它是一个重要的组成部分。最后对得到的结果进行处理使得其中rank值最高的项值为1:
br i = br i max ( BR ) max(BR)为BR中值最高的项。
2.提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类
分析数字图书馆的Web使用日志数据,提取其中的图书检索阅读记录,得到与每个查询词相关的数字图书,使用Q={qi:0≤i<m}表示查询词的集合,集合 B i &SubsetEqual; B 表示与查询词qi相关的图书,集合 B i &SubsetEqual; B 表示与查询词qi相关的图书,集合Gi,j定义为:
Figure A20081006301000095
构建表示与查询词qi和qj都相关的图书的数量的矩阵,定义为:
S ~ i , j = | G i , j |
归一化后即得到查询词相似性矩阵:
S i , j = S ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | Q | S ~ i , j
然后使用类似上述的图书相关性排序的迭代计算方式来对查询词进行聚类。
3.抓取互联网上的图书评分数据,整合形成图书评分排序得分
设计爬虫程序抓取互联网上著名图书网站上的图书评分页面,分析提取图书的元数据和图书评分,如果提取出来的图书在数字图书馆中存在,则整合不同网站上的相同图书的评分数据,设整合的站点为Si其中:0≤i<N,图书bk在站点Si上的归一化后的评分数据为vki,评分人数为pki,若该图书该站点上不存在或存在但是没有评分记录,那么vki或pki为零,使用如下公式来整合图书评分:
4.在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序
将基于数字图书访问关联图的图书排序值表示为R=[r0,r1,r2,...,r|B|-1]T,将从互联网上整合得到的图书排序值表示为S=[s0,s1,s2,...,s|B|-1]T,将基于元数据文本相似度的检索得分表示为T=[t0,t1,t2,...,tn-1]T,其中B为图书的集合,三个排序值都是介于0到1之间的浮点值,得分最高的图书的分值为1,对于一次图书搜索,使用基于文本相似度的元数据检索获得匹配的图书列表B=[b0,b1,b2,...,bn-1]T,bk,0≤k<n为图书的编号,图书列表文本相似度得分为T=[t0,t1,t2,...,tn-1]T,n为匹配当前搜索关键词的图书数目,然后使用如下公式来计算最终的图书得分:
f k = &alpha;t k + &beta;r b k + &gamma;s b k 其中:0≤k<n
其中α,β,γ按照如下方式确定:从读者的图书检索阅读的序列数据中提取出一系列的有序对<key,book>,进而将有序对转化为<key,score>,score表示读者对图书的评分,得到的一系列有序对<key,score>,按照查询词的聚类结果来将前面得到的有序对分为m个组,第i组中的所有有序对满足key∈Qi,对于第i组中的每一个有序对j,计算出以它的key值作为查询词的检索结果中它对应的图书的三个排序分值,以有序对j的score分子作为最终的图书得分f,这样第i组中的所有有序对构成一个多元线性回归分析模型:
f ij = &alpha; i t ij + &beta; i r i b j + &gamma; i s ib j
使用每一组中的所有有序对来进行最小二乘估计可以得到针对每一个查询词类的αi,βi,γi

Claims (5)

1、一种基于用户点击行为的数字图书搜索方法,其特征在于包括以下步骤:
(1)提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分;
(2)提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类;
(3)抓取互联网上的图书评分数据,整合形成图书评分排序得分;
(4)在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序。
2、根据权利要求1所述的一种基于用户点击行为的数字图书搜索方法,其特征在于所述的提取日志中的图书阅读记录构建图书之间的关联图,使用关联图计算图书的相关性排序得分步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的读者图书阅读记录,构建共同阅读过图书i和图书j的读者的数量矩阵
Figure A2008100630100002C1
用U={ui:0≤i<m}表示读者的集合,B={bj:0≤j<n}表示图书的集合,然后对
Figure A2008100630100002C2
进行归一化处理:
C i , j = C ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | B | C ~ i , j
得到图书关联矩阵Ci,j,使用向量BR=[br0,br1,br2,...,br|B|-1]T表示图书的相关性排序得分,向量d=[d0,d1,d2,...,d|B|-1]T表示图书的已知质量信息,最后使用下面的迭代方法来计算最终的图书相关性排序得分:
BR ( 0 ) = 1 | B | 1 | B | BR ( n + 1 ) = &alpha;CBR ( n ) + ( 1 - &alpha; ) d .
3、根据权利要求1所述的一种基于用户点击行为的数字图书搜索方法,其特征在于所述的提取日志中的检索阅读记录,利用读者对检索结果的隐式反馈对查询词进行聚类步骤:分析数字图书馆的Web使用日志数据,提取Web使用日志数据中的图书检索阅读记录,得到与每个查询词相关的数字图书,使用Q={qi:0≤i<m}表示查询词的集合,集合 B i &SubsetEqual; B 表示与查询词qi相关的图书,集合Gi,j定义为:
Figure A2008100630100003C1
构建表示与查询词qi和qj都相关的图书的数量的矩阵,定义为:
S ~ i , j = | G i , j |
归一化后即得到查询词相似性矩阵:
S i , j = S ~ i , j w j 其中: w j = &Sigma; 0 &le; i < | Q | S ~ i , j
然后使用类似上述的图书相关性排序的迭代计算方式来对查询词进行聚类。
4、根据权利要求1所述的一种基于用户点击行为的数字图书搜索方法,其特征在于所述的抓取互联网上的图书评分数据,整合形成图书评分排序得分步骤:设计爬虫程序抓取互联网上著名图书网站上的图书评分页面,分析提取图书的元数据和图书评分,如果提取出来的图书在数字图书馆中存在,则整合不同网站上的相同图书的评分数据,设整合的站点为Si其中:0≤i<N,图书bk在站点Si上的归一化后的评分数据为vki,评分人数为pki,若该图书该站点上不存在或存在但是没有评分记录,那么vki或pki为零,使用如下公式来整合图书评分:
Figure A2008100630100003C5
5、根据权利要求1所述的一种基于用户点击行为的数字图书搜索方法,其特征在于所述的在查询词聚类的基础之上,针对每类查询词,利用读者对检索结果的隐式反馈,综合从关联图得出的图书相关性排序、互联网上的图书评分以及文本相似度这三种排序信息源,形成最终的图书搜索结果排序步骤:将基于数字图书访问关联图的图书排序值表示为R=[r0,r1,r2,...,r|B|-1]T,将从互联网上整合得到的图书排序值表示为S=[s0,s1,s2,...,s|B|-1]T,将基于元数据文本相似度的检索得分表示为T=[t0,t1,t2,...,tn-1]T,其中B为图书的集合,三个排序值都是介于0到1之间的浮点值,得分最高的图书的分值为1,对于一次图书搜索,使用基于文本相似度的元数据检索获得匹配的图书列表B=[b0,b1,b2,...,bn-1]T,bk,0≤k<n为图书的编号,图书列表文本相似度得分为T=[t0,t1,t2,...,tn-1]T,n为匹配当前搜索关键词的图书数目,然后使用如下公式来计算最终的图书得分:
f k = &alpha;t k + &beta;r b k + &gamma;s b k 其中:0≤k<n
其中α,β,γ按照如下方式确定:从读者的图书检索阅读的序列数据中提取出一系列的有序对<key,book>,进而将有序对转化为<key,score>,score表示读者对图书的评分,得到的一系列有序对<key,score>,按照查询词的聚类结果来将前面得到的有序对分为m个组,第i组中的所有有序对满足key∈Qi,对于第i组中的每一个有序对j,计算出以它的key值作为查询词的检索结果中它对应的图书的三个排序分值,以有序对j的score分子作为最终的图书得分f,这样第i组中的所有有序对构成一个多元线性回归分析模型:
f ij = &alpha; i t ij + &beta; i r ib j + &gamma; i s i b j
使用每一组中的所有有序对来进行最小二乘估计可以得到针对每一个查询词类的αi,βi,γi
CN2008100630104A 2008-07-04 2008-07-04 基于用户点击行为的数字图书搜索方法 Expired - Fee Related CN101320375B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2008100630104A CN101320375B (zh) 2008-07-04 2008-07-04 基于用户点击行为的数字图书搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2008100630104A CN101320375B (zh) 2008-07-04 2008-07-04 基于用户点击行为的数字图书搜索方法

Publications (2)

Publication Number Publication Date
CN101320375A true CN101320375A (zh) 2008-12-10
CN101320375B CN101320375B (zh) 2010-09-22

Family

ID=40180428

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100630104A Expired - Fee Related CN101320375B (zh) 2008-07-04 2008-07-04 基于用户点击行为的数字图书搜索方法

Country Status (1)

Country Link
CN (1) CN101320375B (zh)

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101826114A (zh) * 2010-05-26 2010-09-08 南京大学 一种基于多马尔可夫链的内容推荐方法
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN102236677A (zh) * 2010-04-28 2011-11-09 北京大学深圳研究生院 一种基于问答系统的信息匹配方法及系统
CN102253943A (zh) * 2010-05-21 2011-11-23 卓望数码技术(深圳)有限公司 一种网页评级方法和网页评级系统
CN102542003A (zh) * 2010-12-01 2012-07-04 微软公司 用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型
CN102880712A (zh) * 2012-10-08 2013-01-16 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统
CN102902744A (zh) * 2012-09-17 2013-01-30 杭州东信北邮信息技术有限公司 一种图书推荐方法
CN103080935A (zh) * 2010-07-01 2013-05-01 Sk普兰尼特有限公司 内容搜索服务系统和内容搜索服务方法
CN103246740A (zh) * 2013-05-17 2013-08-14 重庆大学 迭代的基于用户点击的优化搜索和满意度提升方法和系统
CN104933047A (zh) * 2014-03-17 2015-09-23 北京奇虎科技有限公司 一种确定搜索词的价值的方法和装置
CN105335491A (zh) * 2015-10-20 2016-02-17 杭州东信北邮信息技术有限公司 基于用户点击行为来向用户推荐图书的方法和系统
CN105824946A (zh) * 2016-03-21 2016-08-03 乐视网信息技术(北京)股份有限公司 基于数据评分进行多媒体推荐的方法及系统
CN106126626A (zh) * 2016-06-23 2016-11-16 昆明理工大学 一种基于特征提取的图书检索方法
CN107025277A (zh) * 2017-03-27 2017-08-08 华南理工大学 一种用户隐式反馈的量化评分方法
CN107133644A (zh) * 2017-05-03 2017-09-05 牡丹江医学院 数字化图书馆内容分析系统及方法
CN107491456A (zh) * 2016-06-13 2017-12-19 阿里巴巴集团控股有限公司 图像排序方法和装置
CN107798072A (zh) * 2017-09-27 2018-03-13 广州大学 基于用户使用情况的精品资源图谱构建方法及装置
CN107908698A (zh) * 2017-11-03 2018-04-13 广州索答信息科技有限公司 一种主题网络爬虫方法、电子设备、存储介质、系统
CN108268652A (zh) * 2018-01-29 2018-07-10 四川乐路科技有限公司 一种科普知识推荐系统及方法
CN109299383A (zh) * 2018-11-02 2019-02-01 北京字节跳动网络技术有限公司 生成推荐词的方法、装置、电子设备及存储介质
CN109313638A (zh) * 2017-03-09 2019-02-05 微软技术许可有限责任公司 应用推荐
CN110472125A (zh) * 2019-08-23 2019-11-19 厦门商集网络科技有限责任公司 一种基于网络爬虫的多级页面的级联爬取方法和设备
CN112612875A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
TWI731666B (zh) * 2020-04-30 2021-06-21 股感生活金融科技股份有限公司 利用多維度評級資料之文章推薦系統及方法
CN113139106A (zh) * 2021-05-07 2021-07-20 杭州世平信息科技有限公司 一种保密检查的事件审核方法和装置

Cited By (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102236677A (zh) * 2010-04-28 2011-11-09 北京大学深圳研究生院 一种基于问答系统的信息匹配方法及系统
CN102253943A (zh) * 2010-05-21 2011-11-23 卓望数码技术(深圳)有限公司 一种网页评级方法和网页评级系统
CN101826114B (zh) * 2010-05-26 2012-05-09 南京大学 一种基于多马尔可夫链的内容推荐方法
CN101826114A (zh) * 2010-05-26 2010-09-08 南京大学 一种基于多马尔可夫链的内容推荐方法
CN103080935B (zh) * 2010-07-01 2015-07-08 Sk普兰尼特有限公司 内容搜索服务系统和内容搜索服务方法
CN103080935A (zh) * 2010-07-01 2013-05-01 Sk普兰尼特有限公司 内容搜索服务系统和内容搜索服务方法
CN102542003A (zh) * 2010-12-01 2012-07-04 微软公司 用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型
CN102542003B (zh) * 2010-12-01 2016-01-20 微软技术许可有限责任公司 用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型
CN102222098A (zh) * 2011-06-20 2011-10-19 北京邮电大学 一种网页预取方法和系统
CN102902744A (zh) * 2012-09-17 2013-01-30 杭州东信北邮信息技术有限公司 一种图书推荐方法
CN102902744B (zh) * 2012-09-17 2015-02-11 杭州东信北邮信息技术有限公司 一种图书推荐方法
CN102880712B (zh) * 2012-10-08 2015-07-22 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统
CN102880712A (zh) * 2012-10-08 2013-01-16 合一网络技术(北京)有限公司 一种用于对搜索的网络视频进行排序的方法和系统
CN103246740B (zh) * 2013-05-17 2016-12-28 重庆大学 迭代的基于用户点击的优化搜索和满意度提升方法和系统
CN103246740A (zh) * 2013-05-17 2013-08-14 重庆大学 迭代的基于用户点击的优化搜索和满意度提升方法和系统
CN104933047A (zh) * 2014-03-17 2015-09-23 北京奇虎科技有限公司 一种确定搜索词的价值的方法和装置
CN104933047B (zh) * 2014-03-17 2020-02-04 北京奇虎科技有限公司 一种确定搜索词的价值的方法和装置
CN105335491A (zh) * 2015-10-20 2016-02-17 杭州东信北邮信息技术有限公司 基于用户点击行为来向用户推荐图书的方法和系统
CN105335491B (zh) * 2015-10-20 2018-11-09 杭州东信北邮信息技术有限公司 基于用户点击行为来向用户推荐图书的方法和系统
CN105824946A (zh) * 2016-03-21 2016-08-03 乐视网信息技术(北京)股份有限公司 基于数据评分进行多媒体推荐的方法及系统
CN107491456A (zh) * 2016-06-13 2017-12-19 阿里巴巴集团控股有限公司 图像排序方法和装置
CN106126626A (zh) * 2016-06-23 2016-11-16 昆明理工大学 一种基于特征提取的图书检索方法
CN106126626B (zh) * 2016-06-23 2019-06-11 昆明理工大学 一种基于特征提取的图书检索方法
CN109313638B (zh) * 2017-03-09 2023-09-01 微软技术许可有限责任公司 应用推荐
CN109313638A (zh) * 2017-03-09 2019-02-05 微软技术许可有限责任公司 应用推荐
CN107025277B (zh) * 2017-03-27 2019-08-20 华南理工大学 一种用户隐式反馈的量化评分方法
CN107025277A (zh) * 2017-03-27 2017-08-08 华南理工大学 一种用户隐式反馈的量化评分方法
CN107133644A (zh) * 2017-05-03 2017-09-05 牡丹江医学院 数字化图书馆内容分析系统及方法
CN107133644B (zh) * 2017-05-03 2019-04-23 牡丹江医学院 数字化图书馆内容分析系统及方法
CN107798072B (zh) * 2017-09-27 2021-05-14 广州大学 基于用户使用情况的精品资源图谱构建方法及装置
CN107798072A (zh) * 2017-09-27 2018-03-13 广州大学 基于用户使用情况的精品资源图谱构建方法及装置
CN107908698A (zh) * 2017-11-03 2018-04-13 广州索答信息科技有限公司 一种主题网络爬虫方法、电子设备、存储介质、系统
CN107908698B (zh) * 2017-11-03 2021-04-13 广州索答信息科技有限公司 一种主题网络爬虫方法、电子设备、存储介质、系统
CN108268652B (zh) * 2018-01-29 2021-05-11 四川乐路科技有限公司 一种科普知识推荐系统及方法
CN108268652A (zh) * 2018-01-29 2018-07-10 四川乐路科技有限公司 一种科普知识推荐系统及方法
CN109299383A (zh) * 2018-11-02 2019-02-01 北京字节跳动网络技术有限公司 生成推荐词的方法、装置、电子设备及存储介质
CN110472125A (zh) * 2019-08-23 2019-11-19 厦门商集网络科技有限责任公司 一种基于网络爬虫的多级页面的级联爬取方法和设备
TWI731666B (zh) * 2020-04-30 2021-06-21 股感生活金融科技股份有限公司 利用多維度評級資料之文章推薦系統及方法
CN112612875A (zh) * 2020-12-29 2021-04-06 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
CN112612875B (zh) * 2020-12-29 2023-05-23 重庆农村商业银行股份有限公司 一种查询词自动扩展方法、装置、设备及存储介质
CN113139106A (zh) * 2021-05-07 2021-07-20 杭州世平信息科技有限公司 一种保密检查的事件审核方法和装置

Also Published As

Publication number Publication date
CN101320375B (zh) 2010-09-22

Similar Documents

Publication Publication Date Title
CN101320375B (zh) 基于用户点击行为的数字图书搜索方法
CN101174273B (zh) 基于元数据分析的新闻事件检测方法
US10146862B2 (en) Context-based metadata generation and automatic annotation of electronic media in a computer network
CN106649260B (zh) 基于评论文本挖掘的产品特征结构树构建方法
US9262532B2 (en) Ranking entity facets using user-click feedback
CN108280114B (zh) 一种基于深度学习的用户文献阅读兴趣分析方法
KR102080362B1 (ko) 쿼리 확장
CN100440224C (zh) 一种搜索引擎性能评价的自动化处理方法
CN108763321B (zh) 一种基于大规模相关实体网络的相关实体推荐方法
CN103559191B (zh) 基于隐空间学习和双向排序学习的跨媒体排序方法
CN111708740A (zh) 基于云平台的海量搜索查询日志计算分析系统
CN101609450A (zh) 基于训练集的网页分类方法
Yin et al. Facto: a fact lookup engine based on web tables
CN103544255A (zh) 基于文本语义相关的网络舆情信息分析方法
CN102236646A (zh) 对象级垂直搜索引擎个性化排序算法iRank
CN104317834A (zh) 一种基于深度神经网络的跨媒体排序方法
CN103914478A (zh) 网页训练方法及系统、网页预测方法及系统
CN105005590B (zh) 一种信息媒介的专题阶段性摘要的生成方法
CN104484431A (zh) 一种基于领域本体的多源个性化新闻网页推荐方法
CN111401040B (zh) 一种适用于word文本的关键词提取方法
CN101694670A (zh) 一种基于公共子串的中文Web文档在线聚类方法
CN105378730A (zh) 社交媒体分析与输出
CN105512333A (zh) 基于情感倾向的产品评论主题搜索方法
CN110555154B (zh) 一种面向主题的信息检索方法
TW201118619A (en) An opinion term mining method and apparatus thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20100922

Termination date: 20130704