CN103389974A - 进行信息搜索的方法及服务器 - Google Patents

进行信息搜索的方法及服务器 Download PDF

Info

Publication number
CN103389974A
CN103389974A CN2012101375655A CN201210137565A CN103389974A CN 103389974 A CN103389974 A CN 103389974A CN 2012101375655 A CN2012101375655 A CN 2012101375655A CN 201210137565 A CN201210137565 A CN 201210137565A CN 103389974 A CN103389974 A CN 103389974A
Authority
CN
China
Prior art keywords
sorting position
clicking rate
search
entry
search results
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2012101375655A
Other languages
English (en)
Other versions
CN103389974B (zh
Inventor
李祯孝
陈戈
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201210137565.5A priority Critical patent/CN103389974B/zh
Priority to KR1020147020722A priority patent/KR20140111305A/ko
Priority to JP2014555070A priority patent/JP2015505629A/ja
Priority to PCT/CN2013/074718 priority patent/WO2013166916A1/zh
Publication of CN103389974A publication Critical patent/CN103389974A/zh
Priority to US14/456,114 priority patent/US9454613B2/en
Application granted granted Critical
Publication of CN103389974B publication Critical patent/CN103389974B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/93Document management systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Business, Economics & Management (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了进行信息搜索的方法及服务器,其中,该方法包括:接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值;用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。本发明方案能够更加准确地对搜索结果进行排序,使排序结果更遵循用户的查询需求。

Description

进行信息搜索的方法及服务器
技术领域
本发明涉及信息处理技术,尤其涉及进行信息搜索的方法及服务器。
背景技术
随着信息技术的发展和网络时代的来临,运用网络进行信息搜索,以获取需要的数据也日益普遍。
进行信息搜索包括:用户终端向进行信息搜索的服务器发送包含查询词的搜索请求,服务器接收搜索请求后,搜索出搜索结果条目,对各搜索结果条目进行初始排序,将排序后的数据结果反馈给用户终端。
一般地,常利用用户点击日志对各搜索结果条目进行初始排序。用户点击日志记录了用户搜索各查询词的信息,包括某查询词下各搜索结果条目的条目点击率。关于某查询词下某搜索结果条目的条目点击率,为用户在该查询词下点击该搜索结果条目的总次数除以用户搜索该查询词的次数,所得到的值。
现有技术中采用条目点击率对搜索结果条目进行排序,具体地,按照条目点击率,降序对搜索结果条目进行排序。条目点击率是对搜索结果满意程度的一种直接体现,一般说来,条目点击率越高的搜索结果条目,说明用户对该搜索结果条目的满意度越高,此搜索结果条目应该排在前面。然而,条目点击率本身也收到搜索结果排序的影响,排在越靠前的搜索结果条目被用户点击的概率越大,因此,并非按照条目点击率排在前面的搜索结果条目就是用户需求度高的结果,此问题称为位置偏置问题。位置偏置问题说明仅按照条目点击率对搜索结果条目进行排序,是不准确的,对排序靠后的搜索结果条目不公平。
为了解决位置偏置问题,目前多采用人工调试排序的方法对搜索结果条目进行排序,该方法中,人工为各排序位置设置位置补偿因子,所述排序位置指排在最靠前的第一位置、其后的第二位置、以及后面依次排列的第三位置、第四位置、第五位置……每个排序位置对应一个补偿因子,各个排序位置的补偿因子是由人工调试得到的经验值,且调试后的一套补偿因子适用于所有搜索结果排序中。
现有人工调试排序的方法包括:
服务器接收来自用户终端的包含查询词的搜索请求后,搜索出搜索结果条目;服务器从用户点击日志中获取各搜索结果条目的条目点击率,将所有的搜索结果条目按照条目点击率进行降序排序,每个排序位置对应一个补偿因子,将各排序位置上的搜索结果条目的条目点击率与该排序对应的补偿因子相乘,将相乘结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序;将排序后的数据反馈给用户终端。
现有人工调试排序的方案中,各个排序位置的补偿因子是由人工调试得到的经验值,且调试后的一套补偿因子适用于所有搜索结果排序中;这种采用由经验值确定补偿因子的方法过于粗糙,且将一套补偿因子适用于所有搜索结果排序中,会造成补偿不准确,导致排序结果不能满足用户的查询需求。
发明内容
本发明提供了一种进行信息搜索的方法,该方法能够更加准确地对搜索结果进行排序,使排序结果更遵循用户的查询需求。
本发明提供了一种进行信息搜索的服务器,该服务器能够更加准确地对搜索结果进行排序,使排序结果更遵循用户的查询需求。
一种进行信息搜索的方法,该方法包括:
接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值;
用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;
将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
一种进行信息搜索的服务器,该服务器包括估计单元、排序分数获取单元和排序反馈单元;
所述估计单元,用于接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值,传送给所述排序分数获取单元;
所述排序分数获取单元,用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数,将排序分数发送给所述排序反馈单元;
所述排序反馈单元,用于按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
从上述方案可以看出,本发明对某查询词下各个排序位置的补偿因子分别进行运算得到,而非采用人工调试的经验值确定补偿因子,使获得的补偿因子更加准确;并且,针对不同的查询词,由确定的相应补偿因子计算得到不同的排序分数,避免了现有技术中将一套补偿因子适用于所有搜索结果排序中,从而,使搜索结果排序更加准确,也使排序结果更遵循用户的查询需求。
附图说明
图1为本发明进行信息搜索的方法示意性流程图;
图2为由查询词“发明”搜索出的搜索结果条目;
图3为本发明进行信息搜索的服务器结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明进一步详细说明。
本发明对某查询词下各个排序位置的补偿因子分别进行运算得到,再由确定的相应补偿因子计算得到该查询词下给搜索结果条目的排序分数,而后,由排序分数进行搜索结果排序。参见图1,为本发明进行信息搜索的方法示意性流程图,其包括以下步骤:
步骤101,接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索搜索得到初始排序后的搜索结果。
服务器接收搜索请求,由查询词搜索出搜索结果条目;对搜索结果条目进行初始排序,得到初始排序的搜索结果。所述初始排序包括多种实现方式,举例说明:按照随机方式进行排序;或者,按照特征值进行排序,如按照各搜索结果条目的条目点击率进行降序排列。以查询词“发明”为例,图2示出了与“发明”相关的前5个排序位置的搜索结果条目,排在最靠前第一位置的是关于“中国发明网”的搜索结果条目,排在第二位置的是关于“发明百度百科”的搜索结果条目,排在第三位置的是关于“发明吧百度贴吧”的搜索结果条目,排在第四位置的是关于“《我爱发明》官网”的搜索结果条目,排在第五位置的是关于“发明的最新相关信息”的搜索结果条目;图中的省略号为各搜索结果条目的概述。
步骤102,对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值。
关于某查询词下某排序位置的位置点击率,为在该查询词下用户点击该排序位置的总次数除以用户搜索该查询词的次数,所得到的值。
估计某查询词的各个排序位置的位置点击率,可采用机器学习方法实现,下面进行举例说明。本步骤所述对所述查询词的各个排序位置的位置点击率进行估计包括:
选取特征,获取所述查询词下所述特征对应的数值;
由获取的数值以及各排序位置的历史点击行为信息,利用机器学习方法对所述查询词的各排序位置的位置点击率进行估计。
选取特征后,可从用户点击日志中获取所述查询词下所述特征对应的数值,为便于说明,将所述查询词表示为q;选取的特征为至少一个。用户点击日志记录了用户搜索各查询词的信息,包括某查询词下各特征对应的数值,用户点击日志记录中的特征包括各搜索结果条目的条目点击率,以及某查询词下的翻页率、页面点击率等。
某查询词下某搜索结果条目的条目点击率,为在该查询词下用户点击该搜索结果条目的总次数除以用户搜索该查询词的次数,所得到的值。
所述翻页率是针对不同页面的翻页率,例如关于第二页的翻页率、关于第三页的翻页率等,针对指定页面的翻页率,为在相应查询词下用户翻动该指定页面的总次数除以用户搜索该查询词的次数,所得到的值;以查询词“发明”为例,关于第二页的翻页率,为用户搜索“发明”后从第一页翻倒第二页的总次数除以用户搜索“发明”的次数,所得到的值;关于第三页的翻页率,为用户搜索“发明”后从第二页翻倒第三页的总次数除以用户搜索“发明”的次数,所得到的值。选取用于进行估计的特征时,可以选一个翻页率,也可以选多个翻页率。
所述页面点击率是针对不同页面的点击率,例如关于第二页的点击率、关于第三页的点击率等;针对指定页面的点击率,为在相应查询词下用户点击该指定页面的总次数除以用户搜索该查询词的次数,所得到的值;以查询“发明”为例,关于第二页的点击率,为用户搜索“发明”后点击第二页的总次数除以用户搜索“发明”的总次数,所得到的值;关于第三页的点击率,为用户搜索“发明”后点击第三页的总次数除以用户搜索“发明”的总次数,所得到的值。选取用于进行估计的特征时,可以选一个页面点击率,也可以选多个页面点击率。
用户点击日志中包含各排序位置的历史点击行为信息,历史点击行为一般针对的是一段时间内用户对所有查询词的搜索行为。以前一周在第一位置的历史点击行为进行说明,其包括在前一周内用户对各查询词进行信息搜索后,第一位置被点击或未被点击的行为;用户进行一次搜索后对第一位置的点击行为作为一个样本。
获取查询词q下所选取特征对应的数值后,由获取的数值以及各排序位置的历史点击行为信息,利用机器学习方法对所述查询词的各排序位置的位置点击率进行估计。所述机器学习方法包括逻辑斯蒂回归方法或者其它概率分类模型方法,下面以逻辑斯蒂回归方法进行具体说明。
设查询词为q,排序位置为p,选取的特征为m个,m取自然数;在排序位置p上,查询词q下的特征数值记为fq,1,fq,2…fq,m
查询词q在排序位置p上的点击行为记为cp,q,其为1表示被点击,为0表示未被点击,p(cp,q=1)为查询词q下排序位置p被点击的概率;p(cp,q=0)为查询词q下排序位置p未被点击的概率。则位置点击概率和特征之间关系建模如下:
p ( c p , q = 1 ) = 1 1 + exp ( - β p , 0 - β p , 1 f q , 1 · · · - β p , m f q , m ) - - - ( 1 )
p ( c p , q = 0 ) = 1 - 1 1 + exp ( - β p , 0 - β p , 1 f q , 1 · · · - β p , m f q , m ) - - - ( 2 )
其中,βp,0,βp,1…βp,m为需要估计的参数。βp,0,βp,1…βp,m可以用最大似然方法估计,具体估计方法如下:对于给定的排序位置p,从用户点击日志的历史点击结果中筛选出在排序位置p的点击行为作为样本,基于公式(1)和(2)可以得到似然函数:
L ( β p , 0 , β p , 1 · · · β p , m ) = Π i = 1 n ( 1 1 + exp ( - β p , 0 - β p , 1 f q i , 1 · · · - β p , m f qi , m ) ) Cp , qi
· Π i = 1 n ( 1 - 1 1 + exp ( - β p , 0 - β p , 1 f q i , 1 · · · - β p , m f qi , m ) ) 1 - Cp , qi
其中i(i=1~n)表示样本,n取自然数,qi为此样本对应的查询词。对似然函数L(βp,0,βp,1…βp,m)或者logL(βp,0,βp,1…βp,m)进行最大化,得到βp,0,βp,1…βp,m的估计值。对似然函数进行最大化,估计出其中的参数,是已有技术,这里不赘述。
得到βp,0,βp,1…βp,m的值后,对于特定的查询词q,代入公式(1)计算出p(cp,q=1),即查询词q下排序位置p平滑后的点击率,也就是查询词q下排序位置p的位置点击率估计值。
步骤103,用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子。
关于某查询词下某排序位置的位置点击率,为在该查询词下用户点击该排序位置的总次数处于用户搜索该查询词的次数,所得到的值;首位的位置点击率,为在该查询词下用户点击第一位置的总次数处于用户搜索该查询词的次数,所得到的值。而位置点击率估计值,为本发明对位置点击率进行估计得到的值。
步骤104,将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数。
步骤105,按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
上述流程中,为了使搜索结果排序更加准确,还可以对步骤103得到的补偿因子进行修正,包括:对补偿因子与设定指数γ作指数运算:(补偿因子)^γ,将运算结果作为修正后的补偿因子,所述设定指数取值为[0,1]中的一个实数。相应地,步骤104所述将各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除包括:将各排序位置上的历史搜索结果条目的条目点击率与相应排序位置对应的修正后的补偿因子相除。
本发明对某查询词下各个排序位置的补偿因子分别进行运算得到,而非采用人工调试的经验值确定补偿因子,使获得的补偿因子更加准确;并且,针对不同的查询词,由确定的相应补偿因子计算得到不同的排序分数,避免了现有技术中将一套补偿因子适用于所有搜索结果排序中,从而,使搜索结果排序更加准确,也使排序结果更遵循用户的查询需求。
并且,本发明方案中,将人工确定的参数降低到1个,即只需人工确定设定指数γ,控制了人工调试的负担。
参见图3,为本发明进行信息搜索的服务器结构示意图,该服务器包括估计单元、排序分数获取单元和排序反馈单元;
所述估计单元,用于接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值,传送给所述排序分数获取单元;
所述排序分数获取单元,用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数,将排序分数发送给所述排序反馈单元;
所述排序反馈单元,用于按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
可选地,所述估计单元包括学习估计子单元,用于选取特征,获取所述查询词下所述特征对应的数值;由获取的数值以及各排序位置的历史点击行为信息,利用机器学习方法对所述查询词的各排序位置的位置点击率进行估计,得到所述查询词在各个排序位置的位置点击率估计值。
可选地,所述排序分数获取单元还包括修正子单元,用于对所述补偿因子与设定指数作指数运算,将运算结果作为修正后的补偿因子,所述设定指数取值为[0,1]中的一个实数;所述将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除包括:将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的修正后的补偿因子相除。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

Claims (10)

1.一种进行信息搜索的方法,其特征在于,该方法包括:
接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值;
用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;
将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数;按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
2.如权利要求1所述的方法,其特征在于,对所述查询词的各个排序位置的位置点击率进行估计包括:
选取特征,获取所述查询词下所述特征对应的数值;
由获取的数值以及各排序位置的历史点击行为信息,利用机器学习方法对所述查询词的各排序位置的位置点击率进行估计。
3.如权利要求2所述的方法,其特征在于,所述特征包括翻页率或页面点击率。
4.如权利要求2所述的方法,其特征在于,所述机器学习方法包括逻辑斯蒂回归方法。
5.如权利要求1至4中任一项所述的方法,所述将相除结果作为相应排序位置的补偿因子之后,该方法还包括:
对补偿因子与设定指数作指数运算,将运算结果作为修正后的补偿因子,所述设定指数取值为[0,1]中的一个实数;
所述将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除包括:将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的修正后的补偿因子相除。
6.一种进行信息搜索的服务器,其特征在于,该服务器包括估计单元、排序分数获取单元和排序反馈单元;
所述估计单元,用于接收来自用户终端的包含查询词的搜索请求,根据所述搜索请求搜索得到初始排序后的搜索结果;对所述查询词的各个排序位置的位置点击率进行估计,得到在各个排序位置的位置点击率估计值,传送给所述排序分数获取单元;
所述排序分数获取单元,用各个排序位置的位置点击率估计值除以排序位置中首位位置的位置点击率估计值,将相除结果作为相应排序位置的补偿因子;将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除,将相除结果作为该搜索结果条目的排序分数,将排序分数发送给所述排序反馈单元;
所述排序反馈单元,用于按照排序分数降序对搜索结果条目进行排序,将排序后的数据反馈给用户终端。
7.如权利要求6所述的服务器,其特征在于,所述估计单元包括学习估计子单元,用于选取特征,获取所述查询词下所述特征对应的数值;由获取的数值以及各排序位置的历史点击行为信息,利用机器学习方法对所述查询词的各排序位置的位置点击率进行估计,得到所述查询词在各个排序位置的位置点击率估计值。
8.如权利要求7所述的服务器,其特征在于,所述特征包括翻页率或页面点击率。
9.如权利要求7所述的服务器,其特征在于,所述机器学习方法包括逻辑斯蒂回归方法。
10.如权利要求6至9中任一项所述的服务器,其特征在于,所述排序分数获取单元还包括修正子单元,用于对所述补偿因子与设定指数作指数运算,将运算结果作为修正后的补偿因子,所述设定指数取值为[0,1]中的一个实数;所述将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的补偿因子相除包括:将搜索得到的各排序位置上的搜索结果条目的条目点击率与相应排序位置对应的修正后的补偿因子相除。
CN201210137565.5A 2012-05-07 2012-05-07 进行信息搜索的方法及服务器 Active CN103389974B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201210137565.5A CN103389974B (zh) 2012-05-07 2012-05-07 进行信息搜索的方法及服务器
KR1020147020722A KR20140111305A (ko) 2012-05-07 2013-04-25 정보 검색을 위한 방법 및 서버
JP2014555070A JP2015505629A (ja) 2012-05-07 2013-04-25 情報検索を行う方法及びサーバ
PCT/CN2013/074718 WO2013166916A1 (zh) 2012-05-07 2013-04-25 进行信息搜索的方法及服务器
US14/456,114 US9454613B2 (en) 2012-05-07 2014-08-11 Method and server for searching information

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210137565.5A CN103389974B (zh) 2012-05-07 2012-05-07 进行信息搜索的方法及服务器

Publications (2)

Publication Number Publication Date
CN103389974A true CN103389974A (zh) 2013-11-13
CN103389974B CN103389974B (zh) 2017-12-08

Family

ID=49534250

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210137565.5A Active CN103389974B (zh) 2012-05-07 2012-05-07 进行信息搜索的方法及服务器

Country Status (5)

Country Link
US (1) US9454613B2 (zh)
JP (1) JP2015505629A (zh)
KR (1) KR20140111305A (zh)
CN (1) CN103389974B (zh)
WO (1) WO2013166916A1 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528377A (zh) * 2014-10-22 2016-04-27 阿里巴巴集团控股有限公司 搜索结果的处理方法、装置及系统
CN107958081A (zh) * 2017-12-14 2018-04-24 泰康保险集团股份有限公司 信息处理方法与装置
CN109962983A (zh) * 2019-03-29 2019-07-02 北京搜狗科技发展有限公司 一种点击率统计方法及装置
CN110598102A (zh) * 2019-09-05 2019-12-20 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110619095A (zh) * 2019-09-23 2019-12-27 北京字节跳动网络技术有限公司 排序方法及装置
CN110674400A (zh) * 2019-09-18 2020-01-10 北京字节跳动网络技术有限公司 排序方法、装置、电子设备及计算机可读存储介质
CN110674399A (zh) * 2019-09-10 2020-01-10 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法和装置
CN111563158A (zh) * 2020-04-26 2020-08-21 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10592568B2 (en) 2016-10-27 2020-03-17 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
US10558687B2 (en) 2016-10-27 2020-02-11 International Business Machines Corporation Returning search results utilizing topical user click data when search queries are dissimilar
CN108319610A (zh) * 2017-01-18 2018-07-24 百度在线网络技术(北京)有限公司 推荐词的排序方法和装置
CN110390052B (zh) * 2019-07-25 2022-10-28 腾讯科技(深圳)有限公司 搜索推荐方法、ctr预估模型的训练方法、装置及设备
CN113094581A (zh) * 2021-03-30 2021-07-09 联想(北京)有限公司 数据处理方法及设备
CN113934872A (zh) * 2021-10-29 2022-01-14 北京达佳互联信息技术有限公司 一种搜索结果的排序方法、装置、设备以及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060265399A1 (en) * 2005-05-23 2006-11-23 Giotto De Filippi Keywords auto-segmentation and auto-allocation system to increase search engines income
CN101055587A (zh) * 2007-05-25 2007-10-17 清华大学 一种基于用户行为信息的搜索引擎检索结果重排序方法
CN101079039A (zh) * 2006-06-30 2007-11-28 腾讯科技(深圳)有限公司 一种搜索广告排序系统和方法
US20100153370A1 (en) * 2008-12-15 2010-06-17 Microsoft Corporation System of ranking search results based on query specific position bias
CN102004772A (zh) * 2010-11-15 2011-04-06 百度在线网络技术(北京)有限公司 一种用于根据检索词进行搜索结果排序的方法及设备
CN102063488A (zh) * 2010-12-29 2011-05-18 南京航空航天大学 一种基于语义的代码搜索方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8938463B1 (en) * 2007-03-12 2015-01-20 Google Inc. Modifying search result ranking based on implicit user feedback and a model of presentation bias

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060265399A1 (en) * 2005-05-23 2006-11-23 Giotto De Filippi Keywords auto-segmentation and auto-allocation system to increase search engines income
CN101079039A (zh) * 2006-06-30 2007-11-28 腾讯科技(深圳)有限公司 一种搜索广告排序系统和方法
CN101055587A (zh) * 2007-05-25 2007-10-17 清华大学 一种基于用户行为信息的搜索引擎检索结果重排序方法
US20100153370A1 (en) * 2008-12-15 2010-06-17 Microsoft Corporation System of ranking search results based on query specific position bias
CN102004772A (zh) * 2010-11-15 2011-04-06 百度在线网络技术(北京)有限公司 一种用于根据检索词进行搜索结果排序的方法及设备
CN102063488A (zh) * 2010-12-29 2011-05-18 南京航空航天大学 一种基于语义的代码搜索方法

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105528377B (zh) * 2014-10-22 2019-02-15 阿里巴巴集团控股有限公司 搜索结果的处理方法、装置及系统
CN105528377A (zh) * 2014-10-22 2016-04-27 阿里巴巴集团控股有限公司 搜索结果的处理方法、装置及系统
CN107958081B (zh) * 2017-12-14 2021-11-30 泰康保险集团股份有限公司 信息处理方法与装置
CN107958081A (zh) * 2017-12-14 2018-04-24 泰康保险集团股份有限公司 信息处理方法与装置
CN109962983A (zh) * 2019-03-29 2019-07-02 北京搜狗科技发展有限公司 一种点击率统计方法及装置
CN110598102A (zh) * 2019-09-05 2019-12-20 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110674399A (zh) * 2019-09-10 2020-01-10 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法和装置
CN110674399B (zh) * 2019-09-10 2023-04-07 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法和装置
CN110674400A (zh) * 2019-09-18 2020-01-10 北京字节跳动网络技术有限公司 排序方法、装置、电子设备及计算机可读存储介质
CN110674400B (zh) * 2019-09-18 2022-05-10 北京字节跳动网络技术有限公司 排序方法、装置、电子设备及计算机可读存储介质
CN110619095A (zh) * 2019-09-23 2019-12-27 北京字节跳动网络技术有限公司 排序方法及装置
CN111563158A (zh) * 2020-04-26 2020-08-21 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质
CN111563158B (zh) * 2020-04-26 2023-08-29 腾讯科技(深圳)有限公司 文本排序方法、排序装置、服务器和计算机可读存储介质

Also Published As

Publication number Publication date
WO2013166916A1 (zh) 2013-11-14
KR20140111305A (ko) 2014-09-18
CN103389974B (zh) 2017-12-08
JP2015505629A (ja) 2015-02-23
US20140351247A1 (en) 2014-11-27
US9454613B2 (en) 2016-09-27

Similar Documents

Publication Publication Date Title
CN103389974A (zh) 进行信息搜索的方法及服务器
CN103092856B (zh) 搜索结果排序方法及设备、搜索方法及设备
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN105701216B (zh) 一种信息推送方法及装置
CN102799591B (zh) 一种提供推荐词的方法及装置
CN107704467B (zh) 搜索质量评估方法及装置
CN103714084B (zh) 推荐信息的方法和装置
CN108460082B (zh) 一种推荐方法及装置,电子设备
EP2145264B1 (en) Calculating importance of documents factoring historical importance
CN102236677A (zh) 一种基于问答系统的信息匹配方法及系统
US20090276729A1 (en) Adaptive user feedback window
CN111262953B (zh) 一种实时推送信息的方法和装置
CN102314443B (zh) 搜索引擎的修正方法和系统
CN103593353A (zh) 信息搜索方法、展示信息排序权重值确定方法及其装置
CN103365839A (zh) 一种搜索引擎的推荐搜索方法和装置
CN103309894B (zh) 基于用户属性的搜索实现方法及系统
JP2013531847A (ja) インテリジェントナビゲーションの方法、装置、およびシステム
CN105159930A (zh) 搜索关键词的推送方法和装置
CN104281718A (zh) 一种基于用户群体行为数据挖掘智能推荐的方法
CN103064903A (zh) 图片检索方法和装置
CN102364467A (zh) 一种网络搜索方法和系统
CN102609539B (zh) 一种搜索方法和系统
CN103020289A (zh) 一种基于日志挖掘的搜索引擎用户个性化需求提供方法
CN104636403A (zh) 处理查询请求的方法及装置
CN103106234A (zh) 一种网页内容搜索方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHENZHEN SHIJI LIGHT SPEED INFORMATION TECHNOLOGY

Free format text: FORMER OWNER: TENGXUN SCI-TECH (SHENZHEN) CO., LTD.

Effective date: 20131028

C41 Transfer of patent application or patent right or utility model
COR Change of bibliographic data

Free format text: CORRECT: ADDRESS; FROM: 518044 SHENZHEN, GUANGDONG PROVINCE TO: 518057 SHENZHEN, GUANGDONG PROVINCE

TA01 Transfer of patent application right

Effective date of registration: 20131028

Address after: 518057 Tencent Building, 16, Nanshan District hi tech park, Guangdong, Shenzhen

Applicant after: Shenzhen Shiji Guangsu Information Technology Co., Ltd.

Address before: Shenzhen Futian District City, Guangdong province 518044 Zhenxing Road, SEG Science Park 2 East Room 403

Applicant before: Tencent Technology (Shenzhen) Co., Ltd.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant