CN102750280A - 用于搜索的计算机处理方法及系统 - Google Patents
用于搜索的计算机处理方法及系统 Download PDFInfo
- Publication number
- CN102750280A CN102750280A CN2011100978383A CN201110097838A CN102750280A CN 102750280 A CN102750280 A CN 102750280A CN 2011100978383 A CN2011100978383 A CN 2011100978383A CN 201110097838 A CN201110097838 A CN 201110097838A CN 102750280 A CN102750280 A CN 102750280A
- Authority
- CN
- China
- Prior art keywords
- key word
- user
- associating
- search
- associating key
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 9
- 230000004044 response Effects 0.000 claims abstract description 19
- 238000011156 evaluation Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 40
- 230000003993 interaction Effects 0.000 claims description 17
- 238000011160 research Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 18
- 230000008569 process Effects 0.000 description 12
- 230000006870 function Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 8
- 230000008676 import Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 3
- 230000000875 corresponding effect Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012946 outsourcing Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000007474 system interaction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种用于搜索的计算机处理方法及其系统。该计算机处理方法包括:接收第一关键字;利用第一关键字进行搜索,以获得第一搜索结果;接收用户对第一搜索结果的评价;响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字;按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字;以及响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。本发明相关具体实施方式可以帮助用户在搜索时,更加有效地找到输入关键字,使其得到更满意的搜索结果。
Description
技术领域
本发明总体上涉及信息处理技术领域,特别地,涉及一种用于搜索的计算机处理方法及系统。
背景技术
搜索引擎作为人们获取信息的工具变得越来越重要。但是用户往往难以确定准确的搜索关键字,从而无法得到满意的搜索结果,并浪费很多时间在确定正确的搜索关键字上。比如,用户期望搜索到community based work taskdevelopment的相关信息,并且期望得到在这一领域最新的研究状态。匹配用户搜索需求的关键字是:crowdsourcing。但是用户由于本身缺少相关经验或知识等因素,不能提供准确的关键字输入。用户给出关键字是outsourcing,现在的搜索引擎(例如Google,Google是Google公司的注册商标),给出的搜索结果如图中显示,包括列出的outsourcing的相关搜索(推荐的其他关键字)都没有crowdsourcing。
目前的搜索引擎会提供用户输入的关键字的一些扩展,但是这些扩展的关键字都包括了用户输入的关键字,这样用户一旦输入错误或者不恰当的关键字,用户基本是没有辅助工具来帮助其得到正确的关键字。另外有一些技术是通过分析搜索引擎的日志等来向用户提供辅助的关键字,这些技术涉及到需要从根本上修改搜索引擎,且效果也不明显。结果只能是用户依靠自身的知识来确定准确的关键字。但是用户的知识往往是有限的,现在随着互联网的发展,各种新的信息和知识不断累积和更新,用户往往无法确定准确的关键字而找到其所真正关心的信息。
因此需要一种用于搜索的计算机处理方法和系统。
发明内容
本发明一方面提供一种用于搜索的计算机处理方法,包括:接收第一关键字;利用第一关键字进行搜索,以获得第一搜索结果;接收用户对第一搜索结果的评价;响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字;按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字;以及响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。
本发明另一方面提供一种用于搜索的计算机系统,其中该系统包括:关键字收集器,被配置为接收第一关键字;搜索引擎,被配置为利用第一关键字进行搜索,以获得第一搜索结果;用户交互组件,被配置为接收用户对第一搜索结果的评价;关键字搜索器,被配置为响应于所述评价为不满意,基于第一关键字从关联关键字数据源搜索关联关键字,其中,所述用户交互组件还被配置为按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字,以及所述搜索引擎还被配置响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。
本发明一些具体实施方式可以帮助用户在搜索时,更加有效地找到输入关键字,使其得到更满意的搜索结果;在找到输入关键字的过程中,提供可视化的用户与系统交互界面,使用户能够不断地根据动态结果自己调整,从而搜获路径不断地偏向用户的最优结果,本发明一些具体实施方式会记录用户调整的过程以及用户满意的最终选择,不断优化工具的参数配置,使其推荐的关键字能够提高用户的满意度。
附图说明
为了对本发明实施例的特征和优点进行详细说明,将参照以下附图。如果可能的话,在附图和描述中使用相同或者类似的参考标号以指代相同或者类似的部分。其中:
图1示出了现有搜索引擎提供扩展关键字的状况;
图2示出了本发明用于搜索的计算机实现方法的第一具体实施方式;
图3示出了本发明用于搜索的计算机实现方法的第二具体实施方式;
图4、5示出了本发明用于搜索的计算机实现方法的第三具体实施方式;
图6示出了形成用户反馈数据源的具体实施方式;
图7示出了本发明用于搜索的计算机系统示意图;
图8示意性示出了可以实现根据本发明的实施例的计算设备的结构方框图。
具体实施方式
现在将参考本发明的示例性实施例进行详细的描述,在附图中图解说明了所述实施例的示例,其中相同的参考数字始终指示相同的元件。应当理解,本发明并不限于所公开的示例实施例。还应当理解,并非所述方法和设备的每个特征对于实施任一权利要求所要求保护的本发明都是必要的。此外,在整个公开中,当显示或描述处理或方法时,方法的步骤可以以任何顺序或者同时执行,除非从上下文中能清楚一个步骤依赖于先执行的另一步骤。此外,步骤之间可以有显著的时间间隔。
图2示出了本发明用于搜索的计算机处理方法的第一具体实施方式。其中在步骤201中接收第一关键字。该第一关键字由用户根据其所需要搜索的信息,基于其自身的知识进行决定。在步骤203中,利用第一关键字进行搜索,以获得第一搜索结果。利用通用的搜索引擎,比如Google、Baidu(Baidu是百度公司的注册商标)等,基于用户输入的第一关键字,就可以得到相关的搜索信息。则在步骤205中,接收用户对第一搜索结果的评价。用户通过浏览这些搜索信息,可能会对这些搜索结果满意,也可能不满意。优选地,如果用户不满意,可以给出不满意的评价。
在步骤207中,响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字。如果用户对搜索结果不满意,则会启动为用户提供关联关键字的帮助,通过实时地搜索关键字数据源,来提供相关关联关键字。其中所述关键字数据源可为百科全书类网站、专业学科词库、文献库等。优选地,可以从关键字数据源确定与第一关键字相关的内容,使用第一关键字作为输入词条,从数据源中找到其相关内容,在确定了相关的内容后,则从所述相关的内容中抽取所述关联关键字。优选地,可以按照关键字数据源的结构(分类)来直接抽取,例如每一种结构或分类中都会列举相关词条,这些词条就是我们要抽取的关联关键字。根据所述关键字数据源的结构和不同的分类,确定所述关联关键字与第一关键字的匹配系数。匹配系数的计算需要根据系统所采用的关联关键字的来源来配置,不同的关键字数据源对词条内容会有不同的组织结构,相应的匹配系数的计算也不同。以维基百科Wiki(www.wikipedia.org)举例:Wiki除了最开始对词目有一段解释定义外,还会分一些类别来介绍词目,例如“See also”,“History”等,不同的类别代表了里面的词目与当前的词目的关系,因此可以利用这些分类来定义匹配系数,匹配系数配置可如下所示:
L1:“Frequently used terms”(频繁使用的术语)、“Explanation”(解释)、“see also”(另见)、“tags”(标签)
L2.“overview”(总结)、“history”(历史)
L3.“types”(类型)、“criteria”(标准)
其中L1、L2、L 3分别表示不同级别的匹配系数,当匹配系数是1的时候,表示匹配程度最高,当系数为2,3...的时候,匹配程度依次递减。再例如,针对Baidu百科这种数据源,匹配系数可如下设定:
L1:“相关词条”,“同义词”,“标签”
L2.“简介”,“概述”,“分类”
L3.“英文解释”,“扩展阅读”
而针对专业词库,我们按照它的组织结构定义匹配系数,给出的例子如下:
L1:“基本释义”,“网络释义”,“行业释义”
L2.“相关词”
L3.“相关搜索”
如果用户本身对数据源的结构以及内容有更深刻以及准确理解,也可自己定义匹配系数。匹配系数的计算方法可以根据不同类型数据源而配置不同的匹配系数技术方法。另外匹配系数的计算还可以根据用户的互动来进行调整。
在步骤209中,按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字。优选地,可以将具有高级别匹配系数的关联关键字优先推荐给用户,或者优选地将距离最短的具有高级别的匹配系数的关联关键字优先推荐给用户。最短距离可由用户自己定义,例如两个词条没有包含关系可以定义两词条距离最短等。在步骤211中,响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。本发明的第一具体实施方式可以通过在通用浏览器中增加一个插件即可实现。
图3示出了本发明的第二具体实施方式。其中在步骤301中,接收用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价。在步骤303中,响应于所述用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价为不满意,将所选择的关联关键字作为第一关键字。以及在步骤305中,重复执行所述搜索关联关键字、所述向用户推荐关联关键字、所述基于用户所选择的关联关键字进行搜索、所述接收用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价以及所述将所选择的关联关键字作为第一关键字的步骤,直至获得满意的搜索结果。通过这样循环进行关联关键字的搜索,就可以更好地接近用户真正需要的关键字。
图4、5示出了本发明用于搜索的第三具体实施方式,其中:
阶段1:首先,由用户输入第一关键字K,搜索引擎执行第一次搜索,如果用户满意搜索结果,则搜索结束,否则执行第二次搜索;
阶段2:首先将用户输入的第一关键字K作为词条在在相应数据源中查询,例如维基百科,百度百科等,然后按照前面所定义的匹配系数,找到系数为1的关联关键字(如图4中所示T1.1、T1.2、T1.3),并返回所有系数为1的关联关键字,由用户挑选作为第二次输入的关键字,也可由预先在系统中配置好的距离定义算法,返回距离最短的关联关键字作为第二次输入的关键字(如图4中所示T1.2);
阶段3:用户以T1,2作为输入关键字进行第二次搜索,如果返回结果满意,则搜索结束,否则用户可选择继续使用其他匹配系数为1的关键字作为输入关键字,再次返回搜索结果。或者再进行一次关联关键字寻找。本实施例可提供2种寻找结构,一种如图4所示,仍以第一关键字K为中心词,寻找匹配系数为2的相关关键字(T2.1,T2.2,T2.3),然后按照阶段2所述方法选择一个相关关键字作为再次输入的关键字。另一种关联关键词寻找的方法如图5所示,该方法以上次所选中的输入关键字作为词条(T1.2),以它为中心寻找与它匹配系数为1的关联关键字(T1.2.1,T1.2.2,T1.2.3),然后再按照阶段2所述方法选择一个关联关键字作为再次输入的关键字。
阶段4:重复上述过程,直至输入的关联关键字得到的搜索结果满足用户的需要,则结束搜索。
如图6所示,在上述阶段4中,可记录此次搜索路径以及关键字匹配结果(用户第一次输入的第一关键字K,最后一次选择的搜索结果满意的关联关键字T),并存储于用户反馈数据源中,可用于系统对匹配系数的调整。同时如果用户愿意公开分享其搜索路径,可以将用户的搜索路径以及关键字匹配结果存入共享性的用户反馈数据源中。通过搜索路径会得到进一步优化,建议词提供的越趋向准确。图6表示两个用户一开始输入的第一关键字为K,经过本发明的方法采用不同的关键字,最终都达到了令其满意的搜索结果,找到了相应的关键字T,T具体可能是不同的词。其中一个经过K->T1.2->T1.2.3->T,另外一个用户经过K->T3.3->T存储上述两个路径都要存储,并且存储每条路径被用户使用频率(次数)。则当再有用户输入路径的开始词或者中间词作为第一输入关键词时,可直接推荐用户选择次数多的路径的终点词给用户作为关联关键词。通过这种方法,用户可以把最后满意的关键字匹配共享给其他用户使用,用户反馈数据源的匹配系数会被相应调整。这样一来,下次T会被优先出现在K对应的关键字列表中。
如图7所示,本发明还提供一种用于搜索的计算机系统。该系统包括有:搜索引擎701、关键字收集器703、关键字搜索器707、用户交互组件709、关键字数据源717。其中所述关键字收集器703被配置为接收第一关键字;所述搜索引擎701被配置为利用第一关键字进行搜索,以获得第一搜索结果;用户交互组件709被配置为接收用户对第一搜索结果的评价;关键字搜索器707,被配置为响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字。其中所述用户交互组件709还被配置为按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字,以及所述搜索引擎701还被配置为响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。
优选地,用户交互组件709还包括有反馈收集器711、关键字组装器713和展示器715。用户交互组件709用于帮助用户呈现系统建议的关键字和搜索路径,在可视化图形上,用户可以选择建议的关键字直接进行检索,关键字组装器713会根据不同搜索引擎组装需要的关键字格式最后调用搜索引擎代理705反馈到搜索引擎进行重新搜索(当然搜索引擎代理705并非必须,关键字可以直接送到所述关键字收集器703进行搜索)。用户的选择和反馈的关键字路径和关键字匹配通过反馈搜集器711发送到用户反馈数据源中的用户共享反馈数据源719中与其他搜索的用户共享,也可以发送到用户反馈数据源中的用户独享反馈数据源721中只为自己使用。
优选地,其中所述关键字数据源717为百科全书类网站。
优选地,关键字搜索器707还包括:内容确定器,被配置为从关键字数据源确定与第一关键字相关的内容;抽取器,被配置为从所述相关的内容中抽取所述关联关键字;匹配系数确定器,被配置为根据所述关键字数据源的结构,确定所述关联关键字与第一关键字的匹配系数。
优选地,所述用户交互组件709还被配置为将具有高级别匹配系数的关联关键字优先推荐给用户。
优选地,所述用户交互组件709还包括评价接收器,该评价接收器被配置为接收用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价,所述搜索引擎701还被配置响应于用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价为不满意,为接收用户选择的同等级别的其它关联关键字以进行重新搜索。
优选地,反馈收集器711被配置为存储用户选择关联关键字的路径以及使用频率以形成用户反馈数据库。
优选地,所述用户交互组件709还被配置为将具有高使用频率的关联关键字路径中的关联关键字推荐给用户。
图8则示意性示出了可以实现根据本发明的实施例的计算设备的结构方框图。图8中所示的计算机系统包括CPU(中央处理单元)801、RAM(随机存取存储器)802、ROM(只读存储器)803、系统总线804,硬盘控制器805、键盘控制器806、串行接口控制器807、并行接口控制器808、显示器控制器809、硬盘810、键盘811、串行外部设备812、并行外部设备813和显示器814。在这些部件中,与系统总线804相连的有CPU 801、RAM 802、ROM 803、硬盘控制器805、键盘控制器806,串行接口控制器807,并行接口控制器808和显示器控制器809。硬盘810与硬盘控制器805相连,键盘811与键盘控制器806相连,串行外部设备812与串行接口控制器807相连,并行外部设备813与并行接口控制器808相连,以及显示器814与显示器控制器809相连。
图8中每个部件的功能在本技术领域内都是众所周知的,并且图8所示的结构也是常规的。这种结构不仅用于个人计算机,而且用于手持设备,如Palm PC、PDA(个人数据助理)、移动电话等等。在不同的应用中,例如用于实现包含有根据本发明的客户端模块的用户终端或者包含有根据本发明的网络应用服务器的服务器主机时,可以向图8中所示的结构添加某些部件,或者图8中的某些部件可以被省略。图8中所示的整个系统由通常作为软件存储在硬盘810中、或者存储在EPROM或者其它非易失性存储器中的计算机可读指令控制。软件也可从网络(图中未示出)下载。或者存储在硬盘810中,或者从网络下载的软件可被加载到RAM 802中,并由CPU 801执行,以便完成由软件确定的功能。
尽管图8中描述的计算机系统能够支持根据本发明的提供的技术方案,但是该计算机系统只是计算机系统的一个例子。本领域的熟练技术人员可以理解,许多其它计算机系统设计也能实现本发明的实施例。
虽然这里参照附图描述了本发明的示例性实施例,但是应该理解本发明不限于这些精确的实施例,并且在不背离本发明的范围和宗旨的情况下,本领域普通技术人员能对实施例进行各种变化的修改。所有这些变化和修改意欲包含在所附权利要求中限定的本发明的范围中。
并且根据上述描述,所属技术领域的技术人员知道,本发明可以体现为装置、方法或计算机程序产品。因此,本发明可以具体实现为以下形式,即,可以是完全的硬件、完全的软件(包括固件、驻留软件、微代码等)、或者本文一般称为“电路”、“模块”或“系统”的软件部分与硬件部分的组合。此外,本发明还可以采取体现在任何有形的表达介质(medium of expression)中的计算机程序产品的形式,该介质中包含计算机可读的程序码。
可以使用一个或多个计算机可读的或计算机可读的介质的任何组合。计算机可读的或计算机可读的介质例如可以是——但不限于——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置、器件或传播介质。计算机可读介质的更具体的例子(非穷举的列表)包括以下:有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、诸如支持因特网或内部网的传输介质、或者磁存储器件。注意计算机可读的或计算机可读的介质甚至可以是上面印有程序的纸张或者其它合适的介质,这是因为,例如可以通过电扫描这种纸张或其它介质,以电子方式获得程序,然后以适当的方式加以编译、解释或处理,并且必要的话在计算机存储器中存储。在本文件的语境中,计算机可读的或计算机可读的介质可以是任何含有、存储、传达、传播、或传输供指令执行系统、装置或器件使用的或与指令执行系统、装置或器件相联系的程序的介质。计算机可读的介质可包括在基带中或者作为载波一部分传播的、由其体现计算机可读的程序码的数据信号。计算机可读的程序码可以用任何适当的介质传输,包括——但不限于——无线、电线、光缆、RF等等。
用于执行本发明的操作的计算机程序码,可以以一种或多种程序设计语言的任何组合来编写,所述程序设计语言包括面向对象的程序设计语言——诸如Java、Smalltalk、C++之类,还包括常规的过程式程序设计语言——诸如”C”程序设计语言或类似的程序设计语言。程序码可以完全地在用户的计算上执行、部分地在用户的计算机上执行、作为一个独立的软件包执行、部分在用户的计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在后一种情形中,远程计算机可以通过任何种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户的计算机,或者,可以(例如利用因特网服务提供商来通过因特网)连接到外部计算机。
此外,本发明的流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机程序指令实现。这些计算机程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得通过计算机或其它可编程数据处理装置执行的这些指令,产生实现流程图和/或框图中的方框中规定的功能/操作的装置(means)。
也可以把这些计算机程序指令存储在能指令计算机或其它可编程数据处理装置以特定方式工作的计算机可读介质中,这样,存储在计算机可读介质中的指令产生一个包括实现流程图和/或框图中的方框中规定的功能/操作的指令装置(instruction means)的制造品,
也可以把计算机程序指令加载到计算机或其它可编程数据处理装置上,使得在计算机或其它可编程数据处理装置上执行一系列操作步骤,以产生计算机实现的过程,从而在计算机或其它可编程装置上执行的指令就提供实现流程图和/或框图中的方框中规定的功能/操作的过程。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
Claims (15)
1.一种用于搜索的计算机处理方法,包括:
接收第一关键字;
利用第一关键字进行搜索,以获得第一搜索结果;
接收用户对第一搜索结果的评价;
响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字;
按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字;以及
响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。
2.一种如权利要求1所述的方法,其中所述关键字数据源为百科全书类网站。
3.一种如权利要求1所述的方法,其中所述基于第一关键字从关键字数据源搜索关联关键字包括:
从关键字数据源确定与第一关键字相关的内容;
从所述相关的内容中抽取所述关联关键字;
根据所述关键字数据源的结构,确定所述关联关键字与第一关键字的匹配系数。
4.一种如权利要求3所述的方法,其中所述按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字包括:
将具有高级别匹配系数的关联关键字优先推荐给用户。
5.一种如权利要求4所述的方法,还包括:
将距离最短的具有高级别的匹配系数的关联关键字优先推荐给用户。
6.一种如权利要求3所述方法,还包括:
接收用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价;
响应于用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价为不满意,接收用户选择的同等级别的其它关联关键字以进行重新搜索。
7.一种如权利要求1所述的方法,还包括:
接收用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价;
响应于所述用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价为不满意,将所选择的关联关键字作为第一关键字;
重复执行所述搜索关联关键字、所述向用户推荐关联关键字、所述基于用户所选择的关联关键字进行搜索、所述接收用户对基于用户所选择的关联关键字进行搜索的搜索结果的评价以及所述将所选择的关联关键字作为第一关键字的步骤,直至获得满意的搜索结果。
8.一种如权利要求4所述的方法,还包括:
存储用户选择关联关键字的路径以及使用频率以形成用户反馈数据源。
9.一种如权利要求8所述的方法,其中所述按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字包括:
将具有高使用频率的关联关键字路径中的关联关键字推荐给用户。
10.一种用于搜索的计算机系统,其中该系统包括:
关键字收集器,被配置为接收第一关键字;
搜索引擎,被配置为利用第一关键字进行搜索,以获得第一搜索结果;
用户交互组件,被配置为接收用户对第一搜索结果的评价;
关键字搜索器,被配置为响应于所述评价为不满意,基于第一关键字从关键字数据源搜索关联关键字,
其中,所述用户交互组件还被配置为按照所述关联关键字与第一关键字的匹配程度,向用户推荐关联关键字,以及
所述搜索引擎还被配置为响应于用户从所推荐的关联关键字中选择了关联关键字,基于用户所选择的关联关键字进行搜索。
11.一种如权利要求10所述的系统,其中所述关键字数据源为百科全书类网站。
12.一种如权利要求10所述的系统,其中关键字搜索器还包括:
内容确定器,被配置为从关键字数据源确定与第一关键字相关的内容;
抽取器,被配置为从所述相关的内容中抽取所述关联关键字;
匹配系数确定器,被配置为根据所述关键字数据源的结构,确定所述关联关键字与第一关键字的匹配系数。
13.一种如权利要求12所述的系统,其中所述用户交互组件被配置为将具有高级别匹配系数的关联关键字优先推荐给用户。
14.一种如权利要求12所述的系统,其中:
所述用户交互组件还被配置为接收用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价,
所述搜索引擎还被配置响应于用户对于基于用户所选择的关联关键字进行搜索的搜索结果的评价为不满意,为接收用户选择的同等级别的其它关联关键字以进行重新搜索。
15.一种如权利要求10所述的系统,其中,
所述用户交互组件还包括反馈收集器,该反馈收集器被配置为存储用户选择关联关键字的路径以及使用频率以形成用户反馈数据源,
所述用户交互组件还被配置为将具有高使用频率的关联关键字路径中的关联关键字推荐给用户。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100978383A CN102750280A (zh) | 2011-04-19 | 2011-04-19 | 用于搜索的计算机处理方法及系统 |
US13/449,429 US20120271843A1 (en) | 2011-04-19 | 2012-04-18 | Computer Processing Method and System for Searching |
US13/602,872 US20130006956A1 (en) | 2011-04-19 | 2012-09-04 | Computer Processing Method and System for Searching |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN2011100978383A CN102750280A (zh) | 2011-04-19 | 2011-04-19 | 用于搜索的计算机处理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102750280A true CN102750280A (zh) | 2012-10-24 |
Family
ID=47022104
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2011100978383A Pending CN102750280A (zh) | 2011-04-19 | 2011-04-19 | 用于搜索的计算机处理方法及系统 |
Country Status (2)
Country | Link |
---|---|
US (2) | US20120271843A1 (zh) |
CN (1) | CN102750280A (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103366003A (zh) * | 2013-07-19 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 基于用户反馈优化搜索结果的方法和设备 |
CN103870482A (zh) * | 2012-12-13 | 2014-06-18 | 腾讯科技(深圳)有限公司 | 搜索系统及方法 |
CN103870520A (zh) * | 2012-12-12 | 2014-06-18 | 伊姆西公司 | 用于搜索信息的设备和方法 |
CN105447048A (zh) * | 2014-09-02 | 2016-03-30 | 步步高教育电子有限公司 | 一种应用搜索方法及系统 |
CN105930488A (zh) * | 2016-05-03 | 2016-09-07 | 乐视控股(北京)有限公司 | 信息搜索处理方法及装置 |
CN106354551A (zh) * | 2015-07-14 | 2017-01-25 | 深圳富泰宏精密工业有限公司 | 基于任务的阅读方法及利用该方法的服务器 |
CN107133280A (zh) * | 2017-04-14 | 2017-09-05 | 合信息技术(北京)有限公司 | 反馈的响应方法及装置 |
CN107274267A (zh) * | 2012-10-30 | 2017-10-20 | Sk 普兰尼特有限公司 | 提供内容推荐服务的系统和方法 |
CN108170744A (zh) * | 2017-12-19 | 2018-06-15 | 山东浪潮云服务信息科技有限公司 | 一种数据采集方法及装置 |
CN110209932A (zh) * | 2019-05-17 | 2019-09-06 | 上海新储集成电路有限公司 | 一种提高搜索效率的方法 |
CN110489649A (zh) * | 2019-08-19 | 2019-11-22 | 北京创鑫旅程网络技术有限公司 | 标签关联内容的方法及装置 |
CN112966172A (zh) * | 2019-12-12 | 2021-06-15 | 北京沃东天骏信息技术有限公司 | 搜索方法和搜索装置 |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8977642B2 (en) * | 2010-03-19 | 2015-03-10 | Intuit Inc. | Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform |
CN102750280A (zh) * | 2011-04-19 | 2012-10-24 | 国际商业机器公司 | 用于搜索的计算机处理方法及系统 |
WO2014143076A1 (en) * | 2013-03-13 | 2014-09-18 | Intuit Inc. | Recommending relevant and personalized content accessing keywords for users of a text messaging service based global textsite platform |
CN103150400B (zh) * | 2013-03-27 | 2017-06-06 | 领航动力信息系统有限公司 | 一种基于MapReduce框架的数据筛选方法 |
CN104216918B (zh) * | 2013-06-04 | 2019-02-01 | 腾讯科技(深圳)有限公司 | 关键词搜索方法和系统 |
CN104216995B (zh) * | 2014-09-10 | 2018-03-06 | 北京金山安全软件有限公司 | 信息处理方法及装置 |
CN107870679B (zh) * | 2017-10-11 | 2021-11-09 | 北京京东尚科信息技术有限公司 | 多音字处理方法及系统 |
CN110737756B (zh) * | 2018-07-03 | 2023-06-23 | 百度在线网络技术(北京)有限公司 | 确定针对用户输入数据的应答的方法、装置、设备和介质 |
CN109359188B (zh) * | 2018-09-30 | 2020-01-14 | 北京数聚鑫云信息技术有限公司 | 一种组件编排方法和系统 |
CN111368161B (zh) * | 2018-12-26 | 2024-01-09 | 北京搜狗科技发展有限公司 | 一种搜索意图的识别方法、意图识别模型训练方法和装置 |
CN112214695A (zh) * | 2019-07-12 | 2021-01-12 | 北京字节跳动网络技术有限公司 | 信息处理方法、装置和电子设备 |
CN111339424B (zh) * | 2020-03-04 | 2021-05-14 | 北京字节跳动网络技术有限公司 | 基于关键词进行搜索的方法、装置、设备及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017489A (zh) * | 2006-02-08 | 2007-08-15 | 腾讯科技(深圳)有限公司 | 一种基于即时通信的知识搜索方法及系统 |
CN101496011A (zh) * | 2006-11-09 | 2009-07-29 | 松下电器产业株式会社 | 内容检索装置 |
CN101606155A (zh) * | 2007-08-09 | 2009-12-16 | 松下电器产业株式会社 | 内容检索装置 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7870147B2 (en) * | 2005-03-29 | 2011-01-11 | Google Inc. | Query revision using known highly-ranked queries |
US8316037B1 (en) * | 2009-01-30 | 2012-11-20 | Google Inc. | Providing remedial search operation based on analysis of user interaction with search results |
US20100280989A1 (en) * | 2009-04-29 | 2010-11-04 | Pankaj Mehra | Ontology creation by reference to a knowledge corpus |
CN102750280A (zh) * | 2011-04-19 | 2012-10-24 | 国际商业机器公司 | 用于搜索的计算机处理方法及系统 |
-
2011
- 2011-04-19 CN CN2011100978383A patent/CN102750280A/zh active Pending
-
2012
- 2012-04-18 US US13/449,429 patent/US20120271843A1/en not_active Abandoned
- 2012-09-04 US US13/602,872 patent/US20130006956A1/en not_active Abandoned
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017489A (zh) * | 2006-02-08 | 2007-08-15 | 腾讯科技(深圳)有限公司 | 一种基于即时通信的知识搜索方法及系统 |
CN101496011A (zh) * | 2006-11-09 | 2009-07-29 | 松下电器产业株式会社 | 内容检索装置 |
CN101606155A (zh) * | 2007-08-09 | 2009-12-16 | 松下电器产业株式会社 | 内容检索装置 |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107274267B (zh) * | 2012-10-30 | 2021-01-15 | Sk 普兰尼特有限公司 | 提供内容推荐服务的系统和方法 |
CN107274267A (zh) * | 2012-10-30 | 2017-10-20 | Sk 普兰尼特有限公司 | 提供内容推荐服务的系统和方法 |
CN103870520A (zh) * | 2012-12-12 | 2014-06-18 | 伊姆西公司 | 用于搜索信息的设备和方法 |
US10409871B2 (en) | 2012-12-12 | 2019-09-10 | EMC IP Holding Company LLC | Apparatus and method for searching information |
CN103870520B (zh) * | 2012-12-12 | 2019-09-06 | 伊姆西公司 | 用于搜索信息的设备和方法 |
CN103870482B (zh) * | 2012-12-13 | 2018-12-11 | 腾讯科技(深圳)有限公司 | 搜索系统及方法 |
CN103870482A (zh) * | 2012-12-13 | 2014-06-18 | 腾讯科技(深圳)有限公司 | 搜索系统及方法 |
CN103366003A (zh) * | 2013-07-19 | 2013-10-23 | 百度在线网络技术(北京)有限公司 | 基于用户反馈优化搜索结果的方法和设备 |
CN103366003B (zh) * | 2013-07-19 | 2017-03-08 | 百度在线网络技术(北京)有限公司 | 基于用户反馈优化搜索结果的方法和设备 |
CN105447048A (zh) * | 2014-09-02 | 2016-03-30 | 步步高教育电子有限公司 | 一种应用搜索方法及系统 |
CN106354551A (zh) * | 2015-07-14 | 2017-01-25 | 深圳富泰宏精密工业有限公司 | 基于任务的阅读方法及利用该方法的服务器 |
CN105930488A (zh) * | 2016-05-03 | 2016-09-07 | 乐视控股(北京)有限公司 | 信息搜索处理方法及装置 |
WO2018188410A1 (zh) * | 2017-04-14 | 2018-10-18 | 优酷信息技术(北京)有限公司 | 反馈的响应方法及装置 |
CN107133280A (zh) * | 2017-04-14 | 2017-09-05 | 合信息技术(北京)有限公司 | 反馈的响应方法及装置 |
CN108170744A (zh) * | 2017-12-19 | 2018-06-15 | 山东浪潮云服务信息科技有限公司 | 一种数据采集方法及装置 |
CN110209932A (zh) * | 2019-05-17 | 2019-09-06 | 上海新储集成电路有限公司 | 一种提高搜索效率的方法 |
CN110489649A (zh) * | 2019-08-19 | 2019-11-22 | 北京创鑫旅程网络技术有限公司 | 标签关联内容的方法及装置 |
CN110489649B (zh) * | 2019-08-19 | 2023-06-27 | 北京创鑫旅程网络技术有限公司 | 标签关联内容的方法及装置 |
CN112966172A (zh) * | 2019-12-12 | 2021-06-15 | 北京沃东天骏信息技术有限公司 | 搜索方法和搜索装置 |
Also Published As
Publication number | Publication date |
---|---|
US20130006956A1 (en) | 2013-01-03 |
US20120271843A1 (en) | 2012-10-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102750280A (zh) | 用于搜索的计算机处理方法及系统 | |
CN106202382B (zh) | 链接实体方法和系统 | |
JP4856238B2 (ja) | ユーザ別適応推薦語を提供するシステム、方法およびこの方法を実行するためのプログラムが記録されたコンピュータで読み取り可能な記録媒体 | |
JP2022539138A (ja) | 自然言語理解(nlu)フレームワークを使用して意味探索を実行するシステムおよび方法 | |
CN108153901A (zh) | 基于知识图谱的信息推送方法和装置 | |
US10929603B2 (en) | Context-based text auto completion | |
US8949227B2 (en) | System and method for matching entities and synonym group organizer used therein | |
CN105069103B (zh) | App搜索引擎利用用户评论的方法及系统 | |
CN101697109A (zh) | 一种获取输入法候选项的方法及系统 | |
CN104699737A (zh) | 用于管理搜索的方法和系统 | |
US10949452B2 (en) | Constructing content based on multi-sentence compression of source content | |
WO2020026366A1 (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
CN110096599B (zh) | 知识图谱的生成方法及装置 | |
CN105117380A (zh) | 粘贴处理方法及装置 | |
US9009031B2 (en) | Analyzing a category of a candidate phrase to update from a server if a phrase category is not in a phrase database | |
CN107885888A (zh) | 信息处理方法及装置、终端设备以及计算机可读存储介质 | |
CN111078858A (zh) | 文章搜索方法、装置及电子设备 | |
CN106055567A (zh) | 提供app商店搜索结果 | |
JP2020021455A (ja) | 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム | |
WO2020245887A1 (ja) | 文章生成装置、文章生成方法、および文章生成プログラム | |
US20190163810A1 (en) | Search User Interface | |
CN111275263B (zh) | 一种基于图论和数据驱动的产品优化设计方法 | |
CN113407815B (zh) | 生成场景主题的方法和装置 | |
JP2008134952A (ja) | 情報公開システムおよび情報公開方法 | |
WO2022204845A1 (zh) | 实体热度生成方法、装置、存储介质及电子设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C05 | Deemed withdrawal (patent law before 1993) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20121024 |