CN102254039A - 一种基于搜索引擎的网络搜索方法 - Google Patents

一种基于搜索引擎的网络搜索方法 Download PDF

Info

Publication number
CN102254039A
CN102254039A CN2011102296425A CN201110229642A CN102254039A CN 102254039 A CN102254039 A CN 102254039A CN 2011102296425 A CN2011102296425 A CN 2011102296425A CN 201110229642 A CN201110229642 A CN 201110229642A CN 102254039 A CN102254039 A CN 102254039A
Authority
CN
China
Prior art keywords
user
search
query
searching
result
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011102296425A
Other languages
English (en)
Inventor
王君泽
黄本雄
魏超
胡广
温杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUHAN ANWEN TECHNOLOGY DEVELOPMENT CO LTD
Original Assignee
WUHAN ANWEN TECHNOLOGY DEVELOPMENT CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUHAN ANWEN TECHNOLOGY DEVELOPMENT CO LTD filed Critical WUHAN ANWEN TECHNOLOGY DEVELOPMENT CO LTD
Priority to CN2011102296425A priority Critical patent/CN102254039A/zh
Publication of CN102254039A publication Critical patent/CN102254039A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及基于搜索引擎的网络搜索方法,用于为搜索客户端提供精确搜索,该精确搜索可以根据搜索客户端用户对搜索结果的点击日志筛选出可以反映用户搜索意图的关键词,并将这些搜索词在各种专业的问答社区进行问题匹配,以此来明确用户的真正搜索意图,恢复用户的精确搜索语句,并以此语句重新提交搜索,将用户真正感兴趣的、对用户有用的结果以高优先级返回给用户,从而大大减少用户的搜索时间,提高用户的搜索效率。

Description

一种基于搜索引擎的网络搜索方法
技术领域
本发明涉及计算机科学/互联网技术领域,尤其涉及到互联网的网络搜索方法。
背景技术
随着互联网技术的发展,人们对网络的依赖程度越来越大了,据统计,每个月有超过100亿的搜索关键词提交给网络搜索引擎。这些搜索大多数是由一些关键词组成的,简短、模糊并且不太准确。实际上,当用户提交一个很短并且不准确的查询时,搜索引擎面临的一个很大的困难是要分析出用户的实际需求。
现有的众多的搜索方法论文以及各种搜索方法专利,这些方法主要是将用户的搜索关键字提交到兴趣模型,利用兴趣模型的处理结果进行再次搜索,返回最终的搜索结果。或者是根据搜索结果的相似性评价及搜索结果内容,对搜索结果进行优化排序。
这些方法只是考虑了用户的最初的搜索关键字,建立了各种分析模型,而忽略了用户本身的行为,因而搜索结果可能没有太大的说服力。
发明内容
本发明所要解决的技术问题是提供一种基于搜索引擎的网络搜索方法,快速的帮助用户精确定位到感兴趣的内容。
为解决上述技术问题,本发明的技术构思如下:
一、针对用户提交的初始查询词,集中关注搜索引擎返回的结果。当用户初步浏览了各个结果的标题和摘要后,点击了某一个或几个链接后,那这几个被用户点击的页面中必定会有一些词是可以描述用户的信息需求的。如果可以找出用户感兴趣的这些词来扩展用户的搜索词,必然会大大提高搜索的效率。
当用户点击搜索结果中的某个链接时,预示着该结果中的某一个或几个词语与该用户的信息需求是相关的。找出这些词,就可以更加清晰的了解用户的信息需求。
假如搜索结果是sa,sa是由词语w1w2...wn组成的。这时就可以用空间向量模型来表示出sa。这里的关键问题是如何衡量各个词语的权重。一种简单的方法是使用词语在该结果和整个搜索的结果集中出现的频率来计算词语的权重。同时也应该考虑各个词语和原始查询词的相关性。
此方法的基本思想是考察原始查询词和搜索结果前列的候选词的共现频率,以此来衡量该候选词的权重。
假设(1)原始查询词是Q,(2)Q中的关键词为q1q2q3...qm,(3)查询结果排在前列的文档集是C,C={s1,s2,...,sn}。用co_deg ree(t,qi)来表示词t和qi在文档C中的共同出现的次数。本文使用下面的公式来计算t和qi的共现次数:
co _ deg ree ( t , q i ) = Σ s ∈ C log ( tf ( t , s ) + 1 ) × log ( tf ( qi , s ) + 1 ) n 公式一
tf(t,s)和tf(q,s)分别代表词t和词qi在搜索结果s中出现的频率。将这种量度作为词w和关键词qi在集合C中的共现概率。这个算法将词语在文档中出现的次数和两词的共现次数联系起来了。得到词t和关键词qi的共现概率co_deg ree(t,qi)后,还要计算词t和所有的qi在靠前的结果集中的共现率。设想t和不同的查询词的共现率是独立的,很自然的一种假设是把这些单个的共现率相乘。
g ( t , Q ) = Π q ∈ Q ( co _ deg ree ( t , q ) + 1 ) idf ( t ) 公式二
idf ( t ) = 1 df ( t ) + 1 公式三
当用户点击某个搜索结果的链接时,可以根据此模型算出该结果中的各个词语与用户的查询词的共现率,进而算出该结果中的每个词语对查询结果影响的权重,取权重值大的几个词语来扩展用户的查询,可以达到更好的查询效果。
如果用户搜索的结果和问答社区中的答案很相似时,那么这个答案对应的问题和用户的信息需求也应该在意义上相似。
二、在网络搜索结果和问答社区(例如百度知道)之间作一个信息对比。当用户提交某个查询时,这个查询就相当于用户向搜索引擎提出的一个问题,用户得到自己想要的信息就相当于找出此问题的答案。如果一个问题能够反映用户的信息需求,那么这个问题的最佳答案也是在语义上与用户需要的搜索结果相似。如果可以将用户的搜索词对应到主流问答服务社区,找到最佳答案的可能性更大。
本文使用Kullback-Leibler距离(相对熵)来衡量搜索结果和问答社区中的答案的相似性。KL距离应用在信息检索领域和基于统计语言建模的自然语言处理领域。KL距离用于测量两种概率分布的差异性(在同一事件空间)。概率分布P和Q在有限集X上的KL距离定义为:
D ( P | | Q ) = Σ x ∈ V P ( x ) log P ( x ) Q ( x ) 公式四
Q(x)和P(x)表示两种概率分布。
与上面公式相关的对称的公式如下:
Sim ( Q , D ) ≈ KL ( Q | | D ) = Σ w ∈ V ( ( P ( w | Q ) - P ( w | D ) ) log P ( w | Q ) P ( w | D ) ) 公式五
为了避免出现分母上概率为零,这里引入了线性插值来解决这个问题:
P(w|Q)=λPML(w|Q)+(1-λ)P(w|C)  公式六
当用户提交某个查询时,可以将搜索结果与问答社区中的答案进行语义相似性对比,取出相似性最高的答案,那此答案所对应的问题就有理由被认为是与用户实际的查询需求相关的。
三、用MAP(Method Average Precision)来评估搜索系统的有效性。MAP计算了一个查询结果集里面结果的平均精确度。它的定义如下:
Average Precision ( q ) = Σ i = 1 r q R ( i ) × pos ( i ) R ( r q ) × i 公式七
rq为搜索结果的总数,R(i)为前i个结果中与词关键词q相关的结果的个数,pos(i)是一个二元函数,它指示第i个结果与查询词是否相关。这样,针对原始的搜索关键词q0,采用本发明所述的方法进行查询词扩展后或者利用问答社区进行问题提取后得到新的关键词q1,利用上述公式计算得到查询结果的平均精确度ap0和ap1,通过比较ap0和ap1值的大小即可验证方法的有效性。
基于上述技术构思,本发明提出的基于搜索引擎的网络搜索方法,包括以下步骤:
步骤1、所述搜索引擎根据用户键入的初始查询词进行搜索,展示所述搜索结果;
步骤2、记录所述初始查询词以及用户对所述搜索结果的点击日志;
步骤3、利用公式二计算出所述点击日志的网页中每个词语与所述查询词之间的相关度,并按相关度进行排序,挑选相关度高的前n个词语扩展所述初始查询词为扩展查询词;所述n为自然数;
g ( t , Q ) = Π q ∈ Q ( co _ deg ree ( t , q ) + 1 ) idf ( t ) 公式二
其中,Q表示查询词,q表示查询词Q中的关键词,t表示任意词,co_deg ree(t,qi)表示词t和qi在查询结果排在前列的文档集C中的共同出现的次数; idf ( t ) = 1 df ( t ) + 1 ;
步骤4、将所述扩展查询词提交到所述搜索引擎进行二次搜索,并展示新的搜索结果。
进一步的,在所述步骤4之后,包括以下步骤:
步骤5、将所述初始查询词和扩展查询词分别提交到问答社区进行搜索,
步骤6、利用公式五计算所述问答社区中的答案和搜索引擎的搜索结果的KL距离,
Sim ( Q , D ) ≈ KL ( Q | | D ) = Σ w ∈ V ( ( P ( w | Q ) - P ( w | D ) ) log P ( w | Q ) P ( w | D ) ) 公式五
KL距离小的问答对被认为是反映用户搜索意图的问答对;
步骤7、取搜索结果中KL距离值小的前m个搜索结果展示给用户,供用户选择。
在所述公式五中,P(w|Q)=λPML(w|Q)+(1-λ)P(w|C)。
更加优化的,在所述步骤7之后,还包括以下步骤:
步骤8、采用如下公式七,
Average Precision ( q ) = Σ i = 1 r q R ( i ) × pos ( i ) R ( r q ) × i 公式七
其中,rq为搜索结果的总数,R(i)为前i个结果中与查询词q相关的结果的个数,pos(i)是一个二元函数,它指示第i个结果与查询词是否相关;分别计算针对原始关键词q0的问答社区查询结果的平均精确度ap0以及针对扩展关键词q1的问答社区查询结果的平均精确度ap0,比较ap0和ap1值大小,如果ap0和ap1的相似比例在设定范围内,则认为查询结果准确。
本发明以浏览器插件的形式或者单独运行的形式存在于用户浏览器中,当用户开启这个插件的功能时,用户的搜索需求会被本系统捕获,经过相应的运算后,本系统会将反映用户搜索意图的更为精确的搜索关键词以搜索建议的形式提示给用户,帮助用户快速找到感兴趣的信息。
本发明采用了用户对搜索结果的点击日志来得到用户感兴趣的查询词,从而扩展用户的查询。将用户的初始查询和扩展后的查询对应到问答服务社区进行问题匹配,更快更精确的帮助用户快速找到感兴趣的搜索结果。
本发明采用了数据挖掘技术,在用户点击某个结果链接时,可以挖掘出用户感兴趣的潜在信息,从而给予用户更好的搜索体验。
附图说明
下面结合附图和具体实施方式对本发明的技术方案作进一步具体说明。
图1为搜索引擎对原始查询词搜索的结果网页截图。
图2为用户点击察看过的图1的搜索结果网页截图。
图3为用户查看的图1搜索结果的详细网页截图。
图4为搜索引擎对扩展查询词的二次搜索的搜索结果网页截图。
图5为专业问答社区搜索中KL距离小的前n条搜索结果网页截图。
图6为最终提供给用户的搜索结果网页截图。
具体实施方式
本发明充分考虑了用户行为,通过用户对搜索结果的点击查看日志来分析用户对结果的感兴趣程度,从用户点击过的结果中提取出关键字,扩展用户的查询,并在专业问答社区中匹配已有问题,产生新的搜索关键字或搜索问题,并将新的搜索结果以搜索建议的形式返回给用户,有供用户选择。
例如,当用户的查询词为“java”时,搜索引擎搜索出来的结果很多,可以分成很多类,有“java小游戏”,“java语言介绍”,“java软件下载”,“java入门教程”等。搜索结果包括了标题、摘要等信息。用户根据搜索出来的海量结果,很难快速定位到感兴趣的结果。如果用户点击某个“java入门教程”类别的结果,这时就可以粗略的判断用户对该结果中至少一个关键词感兴趣或该结果中包括了部分用户需求的信息。本发明可以采用一定的算法对此结果进行分析,提取出用户感兴趣的关键词,扩充用户的原始搜索关键词,并以页面搜索建议的形式展现给用户。当用户点击了某个搜索建议,搜索引擎会会对搜索关键词再进行一次查询,将符合用户搜索意图的结果返回给用户。在上面的例子中,就是将“java入门教程”类别的结果以高优先级返回给用户。
实施例
用户安装运行本发明的浏览器插件。
用户打开搜索引擎(如谷歌、百度),并键入查询词。如附图1所示。
针对搜索引擎搜索出来的众多结果,用户通知浏览前几页的结果的标题和摘要,粗略判断哪些结果里含有自己需要的信息。
用户点击了某几个网页,查看了里面的内容。该插件会记录用户的每一次的查询词和用户在此查询词下的点击日志,利用公式二计算出已经点击过的网页中每个词语与用户的查询词之间的相关度,并按相关度进行排序,自动挑选前n个词语来扩展用户的查询词。用户点击察看过的搜索结果如附图2所示。用户查看的搜索结果的详细网页如附图3所示。
通过用户的点击日志,可以计算出用户察看过的网页中的各个词语与用户的查询词的关联度。例如上例中可以计算出“早期”这个词权重很高。这样就可以得到扩展查询词“怀孕早期旅行”。将扩展查询词提交到搜索引擎进行二次搜索,二次搜索的搜索结果如附图4所示。
将用户的初始查询和扩展后的查询提交到专业问答社区进行搜索,搜索出了很多问答对,利用公式五计算问答社区中的答案和搜索引擎的搜索结果的KL距离,KL距离最小的问答对被认为是反映用户搜索意图的问答对。在问答社区中匹配相关的问题,取搜索结果的前n位展示给用户,供用户选择。如附图5所示。
最后的结果以弹出框的形式展示给用户,供用户选择。如附图6所示。这样用户可以找到很多自己需要的结果的集合。
结果验证。志愿者验证:
志愿者先说出他们的搜索意愿,然后志愿者输入搜索词在搜索引擎中进行搜索。在经过本发明提出的搜索系统后,给出用户n个搜索问题建议。用户根据这个建议问题,给出三种判断,Adequate表示与志愿者的搜索意愿完全相符,Material表示与志愿者的搜索意愿一般相关,Unsatisfactory表示与志愿者的搜索意图完全无关。
针对12个志愿者的不同搜索,系统分别对不同的搜索进行了扩展,并从问答社区中匹配答案,给出了很多二次搜索结果。在5645个评估选项中,有131个是adequate,173个是material。这个比例已经是相当高了。本发明基于用户对搜索结果的点击日志和专业问答社区的问答对。用户查询日志来源于搜狗商业引擎中10M的查询数据集以及实验中12个人的搜索日志。选取30个英文搜索的点击日志,50个中文搜索的点击日志。采用百度知道和Yahoo!Answer作为社区问答对库。
最后所应说明的是,以上具体实施方式仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发明的权利要求范围当中。

Claims (4)

1.一种基于搜索引擎的网络搜索方法,其特征在于,包括以下步骤:
步骤1、所述搜索引擎根据用户键入的初始查询词进行搜索,展示所述搜索结果;
步骤2、记录所述初始查询词以及用户对所述搜索结果的点击日志;
步骤3、利用公式二计算出所述点击日志的网页中每个词语与所述查询词之间的相关度,并按相关度进行排序,挑选相关度高的前n个词语扩展所述初始查询词为扩展查询词;所述n为人为设定的自然数;
g ( t , Q ) = Π q ∈ Q ( co _ degree ( t , q ) + 1 ) idf ( t ) 公式二
其中,Q表示查询词,q表示查询词Q中的关键词,t表示任意词,co_deg ree(t,qi)表示词t和qi在查询结果排在前列的文档集C中的共同出现的次数; idf ( t ) = 1 df ( t ) + 1 ;
步骤4、将所述扩展查询词提交到所述搜索引擎进行二次搜索,并展示新的搜索结果。
2.根据权利要求1所述的基于搜索引擎的网络搜索方法,其特征在于,在所述步骤4之后,包括以下步骤:
步骤5、将所述初始查询词和扩展查询词分别提交到问答社区进行搜索,
步骤6、利用公式五计算所述问答社区中的答案和搜索引擎的搜索结果的KL距离,
Sim ( Q , D ) ≈ KL ( Q | | D ) = Σ w ∈ V ( ( P ( w | Q ) - P ( w | D ) ) log P ( w | Q ) P ( w | D ) ) 公式五
KL距离小的问答对被认为是反映用户搜索意图的问答对;
步骤7、取搜索结果中KL距离值小的前m个搜索结果展示给用户,供用户选择,所述m为人为设定的自然数。
3.根据权利要求2所述的基于搜索引擎的网络搜索方法,其特征在于,在所述公式五中,P(w|Q)=λPML(w|Q)+(1-λ)P(w|C)。
4.根据权利要求2或3之一所述的基于搜索引擎的网络搜索方法,其特征在于,在所述步骤7之后,还包括以下步骤:
步骤8、采用如下公式七,
Average Precision ( q ) = Σ i = 1 r q R ( i ) × pos ( i ) R ( r q ) × i 公式七
其中,rq为搜索结果的总数,R(i)为前i个结果中与查询词q相关的结果的个数,pos(i)是一个二元函数,它指示第i个结果与查询词是否相关;
分别计算针对原始关键词q0的问答社区查询结果的平均精确度ap0以及针对扩展关键词q1的问答社区查询结果的平均精确度ap0,比较ap0和ap1值大小,如果ap0和ap1的相似比例在设定范围内,则认为查询结果准确。
CN2011102296425A 2011-08-11 2011-08-11 一种基于搜索引擎的网络搜索方法 Pending CN102254039A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011102296425A CN102254039A (zh) 2011-08-11 2011-08-11 一种基于搜索引擎的网络搜索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011102296425A CN102254039A (zh) 2011-08-11 2011-08-11 一种基于搜索引擎的网络搜索方法

Publications (1)

Publication Number Publication Date
CN102254039A true CN102254039A (zh) 2011-11-23

Family

ID=44981303

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011102296425A Pending CN102254039A (zh) 2011-08-11 2011-08-11 一种基于搜索引擎的网络搜索方法

Country Status (1)

Country Link
CN (1) CN102254039A (zh)

Cited By (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103164537A (zh) * 2013-04-09 2013-06-19 浙江鸿程计算机系统有限公司 一种面向用户信息需求的搜索引擎日志数据挖掘的方法
CN103226601A (zh) * 2013-04-25 2013-07-31 百度在线网络技术(北京)有限公司 一种图片搜索的方法和装置
CN103235812A (zh) * 2013-04-24 2013-08-07 中国科学院计算技术研究所 查询多意图识别方法和系统
CN103942232A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
CN103970748A (zh) * 2013-01-25 2014-08-06 腾讯科技(深圳)有限公司 一种相关关键词推荐方法和装置
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
CN104376072A (zh) * 2014-11-12 2015-02-25 天脉聚源(北京)传媒科技有限公司 一种搜索方法及装置
CN104424300A (zh) * 2013-08-30 2015-03-18 北京千橡网景科技发展有限公司 个性化搜索提示方法及装置
CN104503991A (zh) * 2014-12-03 2015-04-08 百度在线网络技术(北京)有限公司 一种信息搜索方法和装置
CN104615724A (zh) * 2015-02-06 2015-05-13 百度在线网络技术(北京)有限公司 知识库的建立以及基于知识库的信息搜索方法和装置
CN105786874A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于百科词条构建问答知识库数据项的方法和装置
CN105809473A (zh) * 2016-02-29 2016-07-27 北京百度网讯科技有限公司 匹配模型参数的训练方法、服务推荐方法及对应装置
CN106156114A (zh) * 2015-04-03 2016-11-23 北京中献电子技术开发中心 专利检索方法和装置
CN103744956B (zh) * 2014-01-06 2017-01-04 同济大学 一种关键词的多样化拓展方法
CN106294688A (zh) * 2016-08-05 2017-01-04 浪潮软件集团有限公司 一种基于用户特征分析的查询扩展方法、装置和系统
CN106372132A (zh) * 2016-08-25 2017-02-01 北京百度网讯科技有限公司 基于人工智能的查询意图预测方法和装置
CN106649737A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN106682192A (zh) * 2016-12-29 2017-05-17 北京奇虎科技有限公司 一种基于搜索关键词训练回答意图分类模型的方法和装置
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN108491407A (zh) * 2018-01-24 2018-09-04 大连理工大学 一种面向代码检索的查询扩展方法
CN108776901A (zh) * 2018-04-27 2018-11-09 微梦创科网络科技(中国)有限公司 基于搜索词的广告推荐方法及系统
CN109062973A (zh) * 2018-06-29 2018-12-21 北京百度网讯科技有限公司 一种问答资源的挖掘方法、装置、服务器及存储介质
CN110347920A (zh) * 2019-07-02 2019-10-18 北京纵横无双科技有限公司 一种健康信息的检索匹配方法及装置
WO2019233463A1 (en) * 2018-06-07 2019-12-12 Huawei Technologies Co., Ltd. Quality-aware keyword query suggestion and evaluation
CN110688558A (zh) * 2019-09-10 2020-01-14 中国平安财产保险股份有限公司 网页搜索的方法、装置、电子设备和存储介质
CN110889050A (zh) * 2018-09-07 2020-03-17 北京搜狗科技发展有限公司 一种泛品牌词的挖掘方法及装置
CN110895587A (zh) * 2018-08-23 2020-03-20 百度在线网络技术(北京)有限公司 用于确定目标用户的方法和装置
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统
WO2021226840A1 (zh) * 2020-05-12 2021-11-18 深圳市欢太科技有限公司 热点新闻意图识别方法、装置、设备及可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1434952A (zh) * 2000-04-18 2003-08-06 韩国电气通信公社 根据有含义中心词检索信息的方法和系统
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
US20080208841A1 (en) * 2007-02-22 2008-08-28 Microsoft Corporation Click-through log mining
CN101329669A (zh) * 2007-06-19 2008-12-24 中山名人数码科技有限公司 一种搜索引擎装置及搜索引擎方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1434952A (zh) * 2000-04-18 2003-08-06 韩国电气通信公社 根据有含义中心词检索信息的方法和系统
CN101105795A (zh) * 2006-10-27 2008-01-16 北京搜神网络技术有限责任公司 基于网络行为的个性化推荐方法和系统
US20080208841A1 (en) * 2007-02-22 2008-08-28 Microsoft Corporation Click-through log mining
CN101329669A (zh) * 2007-06-19 2008-12-24 中山名人数码科技有限公司 一种搜索引擎装置及搜索引擎方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
丁国栋等: "《一种基于局部共现的查询扩展方法》", 《中文信息学报》, vol. 20, no. 3, 30 June 2006 (2006-06-30) *
李东园等: "《基于用户日志分析的查询扩展研究》", 《第四届全国学生计算语言研讨会会议文集》, 31 July 2008 (2008-07-31) *
王君泽等: "《问答服务中的问题检索任务研究》", 《武汉理工大学学报》, vol. 32, no. 21, 30 November 2010 (2010-11-30) *

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942232A (zh) * 2013-01-18 2014-07-23 佳能株式会社 用于挖掘意图的方法和设备
CN103942232B (zh) * 2013-01-18 2018-09-18 佳能株式会社 用于挖掘意图的方法和设备
CN103970748A (zh) * 2013-01-25 2014-08-06 腾讯科技(深圳)有限公司 一种相关关键词推荐方法和装置
CN103970748B (zh) * 2013-01-25 2019-01-29 腾讯科技(深圳)有限公司 一种相关关键词推荐方法和装置
CN103164537A (zh) * 2013-04-09 2013-06-19 浙江鸿程计算机系统有限公司 一种面向用户信息需求的搜索引擎日志数据挖掘的方法
CN103164537B (zh) * 2013-04-09 2016-01-13 浙江鸿程计算机系统有限公司 一种面向用户信息需求的搜索引擎日志数据挖掘的方法
CN103235812B (zh) * 2013-04-24 2015-04-01 中国科学院计算技术研究所 查询多意图识别方法和系统
CN103235812A (zh) * 2013-04-24 2013-08-07 中国科学院计算技术研究所 查询多意图识别方法和系统
CN103226601B (zh) * 2013-04-25 2019-03-29 百度在线网络技术(北京)有限公司 一种图片搜索的方法和装置
CN103226601A (zh) * 2013-04-25 2013-07-31 百度在线网络技术(北京)有限公司 一种图片搜索的方法和装置
CN104424300A (zh) * 2013-08-30 2015-03-18 北京千橡网景科技发展有限公司 个性化搜索提示方法及装置
CN103744956B (zh) * 2014-01-06 2017-01-04 同济大学 一种关键词的多样化拓展方法
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
CN104376072A (zh) * 2014-11-12 2015-02-25 天脉聚源(北京)传媒科技有限公司 一种搜索方法及装置
CN104503991B (zh) * 2014-12-03 2018-04-27 百度在线网络技术(北京)有限公司 一种信息搜索方法和装置
CN104503991A (zh) * 2014-12-03 2015-04-08 百度在线网络技术(北京)有限公司 一种信息搜索方法和装置
CN105786874A (zh) * 2014-12-23 2016-07-20 北京奇虎科技有限公司 基于百科词条构建问答知识库数据项的方法和装置
CN104615724B (zh) * 2015-02-06 2018-01-23 百度在线网络技术(北京)有限公司 知识库的建立以及基于知识库的信息搜索方法和装置
CN104615724A (zh) * 2015-02-06 2015-05-13 百度在线网络技术(北京)有限公司 知识库的建立以及基于知识库的信息搜索方法和装置
CN106156114A (zh) * 2015-04-03 2016-11-23 北京中献电子技术开发中心 专利检索方法和装置
CN105809473A (zh) * 2016-02-29 2016-07-27 北京百度网讯科技有限公司 匹配模型参数的训练方法、服务推荐方法及对应装置
CN106896932B (zh) * 2016-06-07 2019-10-15 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN106896932A (zh) * 2016-06-07 2017-06-27 阿里巴巴集团控股有限公司 一种候选词推荐方法及装置
CN106294688A (zh) * 2016-08-05 2017-01-04 浪潮软件集团有限公司 一种基于用户特征分析的查询扩展方法、装置和系统
CN106372132A (zh) * 2016-08-25 2017-02-01 北京百度网讯科技有限公司 基于人工智能的查询意图预测方法和装置
CN106649737B (zh) * 2016-12-23 2020-06-12 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN106649737A (zh) * 2016-12-23 2017-05-10 北京奇虎科技有限公司 针对综艺类query的搜索结果的推送方法及装置
CN106682192A (zh) * 2016-12-29 2017-05-17 北京奇虎科技有限公司 一种基于搜索关键词训练回答意图分类模型的方法和装置
CN106682192B (zh) * 2016-12-29 2020-07-03 北京奇虎科技有限公司 一种基于搜索关键词训练回答意图分类模型的方法和装置
CN108491407B (zh) * 2018-01-24 2021-01-08 大连理工大学 一种面向代码检索的查询扩展方法
CN108491407A (zh) * 2018-01-24 2018-09-04 大连理工大学 一种面向代码检索的查询扩展方法
CN108776901B (zh) * 2018-04-27 2021-01-15 微梦创科网络科技(中国)有限公司 基于搜索词的广告推荐方法及系统
CN108776901A (zh) * 2018-04-27 2018-11-09 微梦创科网络科技(中国)有限公司 基于搜索词的广告推荐方法及系统
WO2019233463A1 (en) * 2018-06-07 2019-12-12 Huawei Technologies Co., Ltd. Quality-aware keyword query suggestion and evaluation
US11514049B2 (en) 2018-06-07 2022-11-29 Huawei Technologies Co., Ltd. Quality-aware keyword query suggestion and evaluation
CN109062973A (zh) * 2018-06-29 2018-12-21 北京百度网讯科技有限公司 一种问答资源的挖掘方法、装置、服务器及存储介质
CN110895587B (zh) * 2018-08-23 2022-08-26 百度在线网络技术(北京)有限公司 用于确定目标用户的方法和装置
CN110895587A (zh) * 2018-08-23 2020-03-20 百度在线网络技术(北京)有限公司 用于确定目标用户的方法和装置
CN110889050A (zh) * 2018-09-07 2020-03-17 北京搜狗科技发展有限公司 一种泛品牌词的挖掘方法及装置
CN110347920A (zh) * 2019-07-02 2019-10-18 北京纵横无双科技有限公司 一种健康信息的检索匹配方法及装置
CN110688558A (zh) * 2019-09-10 2020-01-14 中国平安财产保险股份有限公司 网页搜索的方法、装置、电子设备和存储介质
CN110688558B (zh) * 2019-09-10 2024-06-25 中国平安财产保险股份有限公司 网页搜索的方法、装置、电子设备和存储介质
WO2021226840A1 (zh) * 2020-05-12 2021-11-18 深圳市欢太科技有限公司 热点新闻意图识别方法、装置、设备及可读存储介质
CN112711716A (zh) * 2021-01-25 2021-04-27 广东工业大学 一种基于知识图谱的海洋产业新闻推送方法及系统

Similar Documents

Publication Publication Date Title
CN102254039A (zh) 一种基于搜索引擎的网络搜索方法
CN100465954C (zh) 用于搜索术语建议的多种类型数据的加强群集
US7809715B2 (en) Abbreviation handling in web search
US7289985B2 (en) Enhanced document retrieval
US9171078B2 (en) Automatic recommendation of vertical search engines
CN101520785B (zh) 信息检索方法和系统
US8266077B2 (en) Method of analyzing documents
US7392238B1 (en) Method and apparatus for concept-based searching across a network
CA2504181C (en) Verifying relevance between keywords and web site contents
US8645289B2 (en) Structured cross-lingual relevance feedback for enhancing search results
CN102542003B (zh) 用于顾及当用户在搜索引擎中提出查询时的用户意图的点击模型
CN102253982B (zh) 一种基于查询语义和点击流数据的查询建议方法
CN102722498B (zh) 搜索引擎及其实现方法
US20050234952A1 (en) Content propagation for enhanced document retrieval
US20120323968A1 (en) Learning Discriminative Projections for Text Similarity Measures
CN102902806A (zh) 一种利用搜索引擎进行查询扩展的方法及系统
CN102682001A (zh) 一种确定推荐词的方法及设备
CN105045875A (zh) 个性化信息检索方法及装置
CN104252456A (zh) 一种权重估计方法、装置及系统
CN102722501A (zh) 搜索引擎及其实现方法
CN101751439A (zh) 基于层次聚类的图像检索方法
CN102737021A (zh) 搜索引擎及其实现方法
CN105808739A (zh) 基于Borda算法的搜索结果排序方法
CN105677828A (zh) 基于大数据的用户信息处理方法
CN115905489A (zh) 一种提供招投标信息搜索服务的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111123