CN102479219B - 一种交互式搜索的处理方法 - Google Patents

一种交互式搜索的处理方法 Download PDF

Info

Publication number
CN102479219B
CN102479219B CN201010566463.6A CN201010566463A CN102479219B CN 102479219 B CN102479219 B CN 102479219B CN 201010566463 A CN201010566463 A CN 201010566463A CN 102479219 B CN102479219 B CN 102479219B
Authority
CN
China
Prior art keywords
entry
user
information
document
top document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201010566463.6A
Other languages
English (en)
Other versions
CN102479219A (zh
Inventor
陆永邦
陈诗雅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hong Kong Polytechnic University HKPU
Original Assignee
Hong Kong Polytechnic University HKPU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hong Kong Polytechnic University HKPU filed Critical Hong Kong Polytechnic University HKPU
Priority to CN201010566463.6A priority Critical patent/CN102479219B/zh
Publication of CN102479219A publication Critical patent/CN102479219A/zh
Application granted granted Critical
Publication of CN102479219B publication Critical patent/CN102479219B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种交互式搜索的方法,包括:搜索引擎检索输入的查询,并将查询结果的链接信息生成顶层文档,在与该查询相关的顶层文档中选择出现频率最高的主信息作为子信息,并将该子信息作为界面的输入数据,界面根据用户用不同的方式输入的词条,显示与该词条相对应的搜索结果,搜索引擎接收到用户的确认指示后整理好与用户所输入的词条相对应的文档,之后向客户端发送反馈信息。通过本发明的方案,搜索过程更加灵活,准确性高,效率高,用户可更直观、快速地看到搜索结果,操作过程方便,效率高,另外检索更准确,更贴近用户需求,用户的体验效果佳。

Description

一种交互式搜索的处理方法
技术领域
本发明涉及一种搜索的处理方法,尤其涉及一种交互式搜索的处理方法。
背景技术
随着在一些网络上用户可使用众多网页和媒体信息的出现,需要研究者已经将目光转向如何为用户提供更快捷、方便的方法来获得来自网络的信息,如现有的检索系统中,一般都是:用户输入查询,搜索引擎返回一个或多个与该查询相关的链接,而该链接不一定是用户所需要的,或者与用户的查询不相关的,用户需要重新输入查询,因此用户体验效果不佳,查询效率低。
此外,目前的检索技术中,每个搜索引擎都具有独特的功能,而每个搜索引擎都对应一定的搜索条件,很多引擎只能对少量的词进行查询,这样会造成搜索范围较大,搜索的结果不够准确,不能使用户得到真正需要的信息,并且由于查询结果往往存在很多的冗余,造成界面屏幕不够空间显示,从而影响搜索进程。
再者,目前的搜索技术中,搜索结果的分类标准是预先设置好的,但是如果搜索的结果与预先设置好的标准不匹配的情况下,就可能导致搜索不能顺利进行,使得搜索不具备灵活性,用户使用起来不方便。
发明内容
本发明要解决的技术问题在于,现有技术中,查询效率低,用户体验效果差,检索不具备灵活性,用户使用起来不方便,针对现有技术的上述缺陷,提供一种交互式搜索的处理方法。
本发明解决其技术问题所采用的技术方案是:
一种交互式搜索的处理方法,包括如下步骤:
S1、搜索引擎对用户输入的查询进行检索后,根据检索到的信息,将查询结果的链接信息生成顶层文档,将用户输入的查询及其相关项生成检索目录;
S2、搜索引擎计算在所述顶层文档中出现的或与该顶层文档相关联的主信息的统计量,所述统计量包括所述主信息在所述顶层文档出现的频率;所述主信息包括元数据和/或至少一个词,所述主信息与所述查询相关;
S3、根据所计算的统计量,搜索引擎在所述顶层文档中选择出现频率最高的主信息作为子信息,并将所选择的子信息传送到界面,作为界面的输入数据;
S4、搜索引擎存储用户与自身的对话信息,所述对话信息包括所述查询、所述顶层文件的识别码、所选择的子信息;
S5、界面根据用户的指示,输出相对应的搜索结果,并接收用户的确认信息,所述指示包括用户所输入的词条及输入所述词条的方式,所述确认信息为用户所选择的词条及检索路径;
S6、客户端向搜索引擎发送用户与界面之间对话的相关数据,所述相关数据包括所述对话的识别码;
S7、根据所述相关数据,搜索引擎进行搜索并构造与该搜索结果相对应的文档,将该文档按照预置方式进行排列;
S8、搜索引擎向客户端发送反馈信息,所述反馈信息包括客户端与搜索引擎的对话信息;
S9、客户端存储所接收的对话信息,所述对话信息包括客户端与搜索引擎的对话识别码、所述排列后的文档和用户所选择的词条。
优选地,包括:
所述元数据包括所述查询的类型和/或所述查询所在的领域;
所述统计量还包括所述顶层文档的个数。
优选地,包括:
所述步骤S4之后还包括:搜索引擎等待用户的反馈;
所述步骤S9之后还包括:客户端等待用户的反馈。
优选地,所述步骤S5具体包括:
接收到用户直接从组合框的列表中选择的词条的信息;
界面输出与该词条相对应的搜索结果;
接收用户的确认指示,所述确认指示为所述用户所选择的词条和检索路径。
优选地,所述步骤S5具体包括:
A1、接收到用户用键盘输入的词条的信息;
A2、界面输出与所输入的词条相对应的搜索结果;
A3、接收用户的确认指示,所述确认指示为用户所输入的词条和检索路径。
优选地,所述步骤A2之后还包括:
接收并执行用户删除或修改词条的指令,所述指令包括需要删除或修改的词条;
接收用户用鼠标或键盘输入的词条的信息;
界面输出与目前其组合框存在的词条相对应的搜索结果。
优选地,所述步骤S5具体包括:
B1、接收到用户用鼠标方式输入的词条的信息;
B2、界面输出与所输入的词条相对应的搜索结果;
B3、接收用户的确认指令,所述确认指令为所述用户所输入的词条和检索路径。
优选地,所述步骤B2之后还包括:
接收并执行用户删除或修改词条的指令,所述指令包括需要删除或修改的词条;
接收到用户用鼠标或键盘输入的词条的信息;
界面输出与目前其组合框存在的词条相对应的搜索结果。
优选地,所述步骤S7具体包括:
检测所述顶层文档是否缓存;
根据检测结果,执行如下步骤中的一个:
当所述顶层文档缓存时,搜索引擎根据所述对话的识别码,查找到顶层文档,计算在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档的数量,并将在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档构造成下一级顶层文档,按照预置方式对所述下一级顶层文件进行排列;或
当所述顶层文档不缓存时,搜索引擎根据所述查询与用户所输入的词条的组合重新进行搜索,将搜索结果的链接信息构造成新的顶层文档,将所述新的顶层文档按照预置方式进行排列。
优选地,所述预置方式具体包括根据所述词条进入搜索引擎系统中的优先级,按照所述优先级由高到低排列,或者按照所述优先级由低到高排列。
使用本发明的技术方案,具有以下有益效果:由于搜索引擎在与所输入的查询相关的顶层文档中选择出现的频率最高的主信息作为子信息,并将该子信息作为界面的输入数据,搜索过程更加灵活,准确性高,效率高;此外,用户可根据需要输入自己所需要的词条,界面会根据用户需要而显示相对应的搜索结果,用户可更直观、快速地看到搜索结果,使用灵活。
附图说明
下面将结合附图及实施例对本发明作进一步说明,附图中:
图1是本发明一实施例的一种交互式搜索的处理方法的流程图;
图2是本发明实施例的一种交互式搜索的处理方法的交互式搜索结果界面图;
图3是本发明实施例的一种交互式搜索的处理方法的点击附图2中的按钮3后显示的交互式搜索结果界面图;
图4是本发明实施例的一种交互式搜索的处理方法的显示通过鼠标来选择词条过程的界面图;
图5是本发明实施例的一种交互式搜索的处理方法的通过点击分类依据按钮输入词条后的界面图;
图6是本发明实施例的一种交互式搜索的处理方法的通过按回车键输入附加词条后的界面图;
图7是本发明实施例的一种交互式搜索的处理方法的创建下一级信息后的界面图;
图8是本发明实施例的一种交互式搜索的处理方法的通过点中词条来创建下一级信息后并从文档搜索区域选择所需要的下一级信息的界面图;
图9是本发明一实施例的一种交互式搜索的处理方法的流程图;
图10是本发明一实施例的一种交互式搜索的处理方法的流程图;
图11是本发明一实施例的一种交互式搜索的处理方法的流程图;
图12是本发明一实施例的一种交互式搜索的处理方法的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
如图1所示,是本发明一实施例的一种交互式搜索的处理方法的流程图;本实施例中,首先,用户通过搜索引擎进入操作界面,如图2中所示界面,此时仅出现标号1和2中所示的界面图,该界面是标准界面,用户在文本框1中输入查询,接着点击搜索按钮2,进入步骤101,搜索引擎根据用户输入的查询进行检索,如检索词为“提高有机土壤”,如图2所示的界面;并根据检索信息,将所述查询的结果的链接信息生成顶层文档,将用户输入的查询及其相关项生成检索目录。具体地,搜索引擎检索所采用的方式有多种,本实施例中采用反向索引的方式。在步骤102中,搜索引擎计算在所述顶层文档中出现的或与该文档相关联的主信息的统计量,所述统计量除了包括所述主信息在所述顶层文档出现的频率,还包括所述顶层文档的个数以及其他的数值数据,例如将所述查询颠倒次序之后在所述顶层文档中出现的频率。所述主信息包括元数据和/或至少一个词,所述主信息与所述查询相关;具体地,所述元数据包括所述查询的类型和/或所述查询所属领域,所述至少一个词是与所述查询相关联的词,如下一级词,同义词,或者反义词等,本实施例不作限制,而所述顶层文档的个数可达到一千至一万;转到步骤103中,根据所计算的统计量,搜索引擎在所述顶层文档中选择出现频率最高的主信息作为子信息,并将所选择的子信息传送到界面,作为界面的输入数据。这时界面会出现如图2的标注3和4所示。步骤104中,搜索引擎存储用户与自身的对话信息,存储的对话信息可供用户在此之后需要使用该界面时使用。具体地,该对话信息包括所述顶层文件的标识码,所述查询,所选择的子信息;接着,界面显示如图2所示的状态,等待用户的反馈。其中,标注3和4所示的是本发明的一个优选实施例,但还可以是其他形式的特征,本发明对此不作限制。如图3所示,通过用户点击界面的组合框的按键,如标注3所示,界面上会出现一个列表,该列表包括有与所述顶层文档相关联或在所述顶层文件中出现的元信息和/或至少一个词,如图3中的标注5所示,其中,每个词的右边圆圈内的数字表示该词在所述顶层文档中出现过的文档的个数,由于与所述查询相关联的词可能会很多,为了避免由于太多的词而不能全部显示在界面上,因此设置了标注6所示的内容,可用于浏览其他词的相关信息,可通过点击箭头所指的方块来上下滚动浏览所述相关联的词,进一步地,可通过组合框的特征,如图3的标注6和图4的标注7所示的内容来为用户提供更多的选择。优选地,本实施例中,如图4的标注7所示,查询区域的各个文档之间的分类关系是根据该类型或该词在顶层文件中出现的概率来决定的。接着进行进一步的检索,转到步骤105。
在步骤105中,接收到用户直接从组合框的列表中选择的词条的信息,如标注6所示,具体地,用户可点击箭头所指的方块,上下拉动该方块来选择自己所需要的词,用户输入所需要的词条的方式有多种,如可用鼠标点击来选择所需要的词,或者在所述列表中找到自己所要选择的词条之后,在标注4所示的文本框中输入该词,作为优选,本实施例选择后者。当用户输入词条之后,界面接收到用户输入的信息,在步骤106中,界面输出与所输入词条相对应的搜索结果,该搜索结果为显示出与该词条相对应的文档,接着在步骤107中,接收到用户确认指示。具体地,该确认指示可由用户通过鼠标点击或按回车键来发送确认指示,其中所述检索目标为所述所需要的词条和检索路径。接着转到步骤108,客户端向搜索引擎发送用户与界面之间对话的相关数据,其中所述相关数据包括所述对话的识别码、所述对话信息、用户所选择的词条和所输入的词条的链接信息。优选地,识别码是搜索引擎用于根据用户所输入词条在顶层文档中查找与该词条相关的文档的根据。
在步骤109中,检测所述顶层文档是否缓存,在本实施例中不是每一次生成的顶层文档都缓存,因此搜索引擎还需要先检索所述顶层文档是否缓存。当所述顶层文档缓存时,搜索引擎可以根据所述识别码来寻找顶层文档,转到步骤110;当所述顶层文档没有缓存时,搜索引擎不能根据所述识别码来寻找顶层文档,因此需要重新搜索,转到步骤111。
在步骤110中,搜索引擎根据所述对话的识别码,查找到顶层文档,计算在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量,接着将与所输入的词条相关联的或包含所输入的词条的文档按照预置方式进行排列,具体地,将在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档标为下一级顶层文档,并计算该词条在所述下一级顶层文档中出现的频率,接着搜索引擎将与所述下一级顶层文档按照预置方式进行排列。
在步骤111中,搜索引擎根据所述查询与用户所输入的词条的组合重新进行搜索,将搜索结果的链接信息构造成新的顶层文档,将所述新的顶层文档按照预置方式进行排列。
具体地,排列的方式有多种,如按词条出现的频率,还可按照词条的优先级进行排列,以及根据所输入词条的首个字母按字母顺序排列,此处不作限制。
作为优选,该预置方式可以是:根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,从高频率到低频率,将所述下一级顶层文档或所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来;或根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,由低频率达到高频率,将所述下一级顶层文档或在所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来。
更优选地,本实施例中,还可按照所输入的词条进入搜索引擎系统中的优先级,由高到低排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。还可以按照优先级由低到高排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。
本实施例中,在顶层文档中查找相关的文档或重新检索可通过以下几种方式进行,通过匹配整个词条或匹配该词条的下一级词来实现,又或者通过匹配该词条的一部分或该词条的下一级词的索引词来进行。例如,如果下一级词是“土壤富集”,如果此时使用双词索引,搜索引擎可根据索引词,如“土壤”、“壤富”和“富集”或者使用“土壤”和“富集”来匹配整个句子或重新检索。
当搜索引擎根据用户需要整理好文档之后,转到步骤112。
在步骤112中,搜索引擎向客户端发送反馈信息,其中,该反馈信息包括客户端与搜索引擎的对话信息,具体地,该对话信息包括客户端与搜索引擎的对话的识别码、所述排列后的文档及用户所选择的词条,所述排列的文档及其相关的信息,还包括用户所选择的词条的统计量,其中,该统计量包括在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量。步骤113中,客户端存储对话信息,该对话信息为接收到用户的确认指示之后客户端与搜索引擎之间的对话信息,所述对话信息包括识别码以及相关的信息,具体地,该识别码用于识别经过搜索引擎重新排列的文档,所述相关的信息包括与用户所选中的词相关联的元数据和/或多个词,此时,界面上显示的是重新检索后的文档。接着步骤114中,客户端等待用户的反馈。
本发明的另外一个实施例中,详细介绍了检索的另外一种方法,如图9所示,是本发明一实施例的一种交互式搜索的处理方法的流程图,本实施例中,首先,用户通过搜索引擎进入操作界面,如图2中所示界面,此时仅出现标号1和2中所示的界面图,该界面是标准界面,用户在文本框1中输入查询,接着点击搜索按钮2,进入步骤901,搜索引擎根据用户输入的查询进行检索,如检索词为“提高有机土壤”,如图2所示的界面,并根据检索信息,将查询结果的链接信息生成顶层文档,将用户输入的查询及其相关项生成检索目录。具体地,搜索引擎检索所采用的方式有多种,本实施例中采用反向索引的方式。在步骤902中,搜索引擎计算在所述顶层文档中出现的或与该文档相关联的主信息的统计量,所述统计量除了包括所述主信息在所述顶层文档出现的频率,还包括所述顶层文档的个数以及其他的数值数据,例如将所述查询颠倒次序之后在所述顶层文档中出现的频率。所述主信息包括元数据和/或至少一个词,所述主信息与所述查询相关。具体地,所述元数据包括所述查询的类型和/或所属领域,所述至少一个词是与所述查询相关联的词,如下一级词,同义词,或者反义词等,本实施例不作限制,而所述顶层文档的个数可达到一千至一万;转到步骤903中,根据所计算的统计量,搜索引擎在所述顶层文档中选择出现频率最高的主信息作为子信息,并将所选择的子信息传送到界面,作为界面的输入数据。这时界面会出现如图2标注3和4所示。步骤904中,搜索引擎存储用户与自身的对话信息,存储的对话信息可供后来的用户需要使用该界面时使用。具体地,该对话信息包括所述顶层文件的标识码,所述查询,所选择的子信息;接着,界面显示如图2所示的状态,等待用户的反馈。其中,标注3和4所示的画面是本发明的一个优选实施例,但还可以是其他形式的特征,本发明对此不作限制。用户可点击界面的组合框的按键,如标注3所示,会出现一个列表,该列表包括有与所述顶层文档相关联或在所述顶层文件中出现的元信息和至少一个词,如图3中的标注5所示,其中,每个词的右边圆圈内的数字表示该词在所述顶层文档中出现过的文档的个数,由于与所述查询相关联的词可能会很多,为了避免由于太多的词而不能全部显示在界面上,因此设置了标注6所示的画面,可用于浏览其他词的相关信息,可通过点击箭头所指的方块来上下滚动浏览所述相关联的词,进一步地,可通过组合框的特征,如图3的标注6和图4的标注7所示的内容来为用户提供更多的选择。优选地,本实施例中,如图4的标注7所示,查询区域的各个文档之间的分类关系是根据该类型或该词在顶层文件中出现的概率来决定的。基于当前输入的查询,用户开始选择自己所需要的词或元信息进一步检索,转到步骤905。
步骤905中,接收到用户用键盘输入的词条的信息,本实施例中,该所需的词条可以是用户同时从界面的文本框中输入的多个词条,因此所述多个词条需要用分隔符隔开,接着在步骤906中,界面输出与所输入的词条相对应的搜索结果,如图2中的标注4所示。
现实生活中,用户往往需要通过多次输入词条或需要通过输入检索目录中的词条的下一级词来更准确地检索到自己所需要的信息。因此,本实施例中对如何输入多个词条进行详细描述,例如,在图2中的标注4所在的文本框输入“肥料”用户选择该词之后,界面会创建一个选项卡,所述选项卡包括输入的词条和用括弧框住的数字,如图5的标注10所示,括弧内的数字表示在顶层文档中包含该词“肥料”的文档的数量,具体地,如图5所示,有171个文档中包含有该词“肥料”。如果此时的界面的搜索结果不是用户所需的,用户可以通过点击图5中的标注12所指的“ALL”按钮来恢复到最初的搜索结果所在的界面,这时的界面上没有关于任何词条或元信息的相关信息,如果用户还需要增加更多的词,如图6所示,例如,增加“有机的”一词,因此,搜索结果界面会创建更多的选项卡,如图6的标注13所示,相应地,界面会出现组建和排列好关于“有机的”一词的文档,如图6所示的标注14所示。
如果用户需要选择目前界面的元信息的子信息或词的下一级词时,可在如图2所示的标注4所在的文本框中输入下一级词或子信息,该子信息通过括弧与元信息分隔开,下一级词通过括弧与所述词分隔开,该如该分隔符为方括号,如图7的标注15所示,当确认输入的词之后,用户按回车键来重新检索,如图7的标注17所示,新的文档出现在所述词“肥料”所在文档的下面,其中新的文档包含有下一级词“有机的”。因此,如图7的标注16所示,该词“肥料”的选项卡下面有一个命名为“有机的”的选项卡,该选项卡中的数字表示所述顶层文件中包含该下一级词“有机的”的文档的个数。下面举例进行详细来说明如何添加多个下一级词。
例如,用户需要添加3个下一级词,如上一级词为土壤,下一级词为肥沃、轮作和侵蚀,如“土壤[肥沃;轮作;侵蚀)]用户可通过不同的布尔运算符来区分该下一级词的表示意义,如,“土壤[肥沃;农作物|(轮流&!侵蚀)]”的意思与前面的“土壤[肥沃;轮作;侵蚀)]”意思不一样,因为布尔运算符中“|”表示或的意思,“&”表示与的意思,而“!”不是布尔运算符,因此用户使用不同的布尔运算符可使下一级词具有不同的概念。
如果此时用户不满意所搜索的结果,想要修改或删除当前存在的词条时,具体地,例如,用户想删除某个词条时,用户可将鼠标放在所述词条所对应的选项卡,点击鼠标右键,在所弹出的菜单中选择“删除选项卡”。或者用户想修改某个词条时,可通过修改与该词条相对应的选项卡。具体地,用户可通过鼠标选中所需要更改的词条或元信息,或者选中需要更改的下一级元信息或下一级词,点击鼠标的右键,在所弹出的对话框中,选择“修改分类依据”选项。在步骤907中,接收到并执行用户删除或修改词条的指令,界面显示与目前存在的词条所对应的搜索结果。具体地,根据当前用户所输入的词条或者当前界面的组合框中存在的词条,搜索引擎会执行另外一个检索命令,搜索引擎计算并统计在顶层文档中,出现该词条或与该词条相关联的文档的个数,并将这些文档进行分类,重新排列分类后的文档,该文档的个数会通过界面显示出来,接着该界面会创建另一个选项卡,该选项卡下面的检索区域出现新的检索结果。该检索结果与目前界面存在的词条或元信息相对应,如果删除之前界面没有别的选项卡,界面会显示最初的检索列表,该检索列表没有任何元信息或用户指定的词条。接着在步骤908中,接收到用户用鼠标输入的词条的信息,具体地,用户在顶层文档的搜索区域用鼠标选定所需要的词条,点击鼠标右键;界面会在所选定的词条的一侧弹出菜单,所述菜单用于供用户选择处理所述词条的方式,然后选择“分类依据”这个选项,如图4标注7所示。在步骤909中,界面显示与目前存在的词条所对应的搜索结果。
在步骤910中,接收用户的确认指示,具体地,该界面会出现一个关于用户当前所输入词条的选项卡。该确认指示包括用户因需要而选择的词条,还包括搜索路径。具体地,该搜索路径可以是词条的相关链接,接着转到步骤911,
在步骤911中,客户端向搜索引擎发送用户与界面之间对话的相关数据,其中所述相关数据包括所述对话的识别码、所述对话信息、用户所选择的词条和所输入的词条的链接信息。优选地,识别码是搜索引擎用于根据用户所选择的词条在顶层文档中查找与该词相关的文档的根据。
在步骤912中,检测所述顶层文档是否缓存,在本实施例中,不是每一次生成的顶层文档都缓存,因此搜索引擎还需要先检索所述顶层文档是否缓存。当所述顶层文档缓存时,搜索引擎可以根据所述识别码来寻找顶层文档,转到步骤913;当所述顶层文档没有缓存时,搜索引擎不能根据所述识别码来寻找顶层文档,因此需要重新搜索,转到步骤913。
在步骤913中,搜索引擎根据所述对话的识别码,查找到顶层文档,计算在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量,接着将与所输入的词条相关联的或包含所输入的词条的文档按照预置方式进行排列,具体地,将在顶层文档中与用户所输入的词条相关联的或包含所输入的词的文档标为下一级顶层文档,并计算该词条在所述下一级顶层文档中出现的频率,接着搜索引擎将与所述下一级顶层文档按照预置方式进行排列。
在步骤914中,搜索引擎根据所述查询与用户所输入的词条的组合重新进行搜索,将搜索结果的链接信息构造成新的顶层文档,将所述新的顶层文档按照预置方式进行排列。
具体地,排列的方式有多种,如按词条出现的频率,还可按照词条的优先级进行排列,以及根据所输入的词条的首个字母按字母顺序排列,此处不作限制。
作为优选,该预置方式可以是:根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,从高频率到低频率,将所述下一级顶层文档或所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来;或根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,由低频率达到高频率,将所述下一级顶层文档或在所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来。
更优选地,本实施例中,还可按照所输入的词条进入搜索引擎系统中的优先级,由高到低排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。还可以按照优先级由低到高排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。
本实施例中,在顶层文档中查找相关的文档或重新检索可通过以下几种方式进行,通过匹配整个词条或匹配该词条的下一级词来实现,又或者通过匹配该词条的一部分或该词条的下一级词的索引词来进行。例如,如果下一级词是“土壤富集”,如果此时使用双词索引,搜索引擎可根据索引词,如“土壤”、“壤富”和“富集”或者使用“土壤”和“富集”来匹配整个句子或重新检索。
当搜索引擎根据用户需要整理好文档之后,转到步骤915。
在步骤915中,搜索引擎向客户端发送反馈信息,其中,该反馈信息包括客户端与搜索引擎的对话信息,具体地,该对话信息包括客户端与搜索引擎的对话的识别码、所述排列后的文档及用户所选择的词条,所述排列的文档及其相关的信息,还包括用户所选择的词条的统计量,其中,该统计量包括在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量。步骤916中,客户端存储对话信息,该对话信息为用户确认检索目标之后与搜索引擎之间的对话信息,所述对话信息包括识别码以及相关的信息,具体地,该识别码用于识别经过搜索引擎重新排列的文档,所述相关的信息包括与用户所选中的词相关联的元数据和多个词,此时,界面上显示的是重新检索后的文档。接着步骤917中,客户端等待用户的反馈。
如图10所示,本发明的另外一个实施例,本实施例中,除了步骤1008与上述实施例的步骤908不一致,其余的步骤均一致,此处不再赘述,在步骤1008中,接收到用户用键盘输入的词条的信息,具体地,所输入的词条可以是用户同时从界面的文本框中输入的多个词条,因此所述多个词条需要用分隔符隔开。
本发明的另外一个实施例中,详细介绍了检索的另外一种方法,如图11所示,本实施例中,首先,用户通过搜索引擎进入操作界面,如图2中所示界面,此时仅出现标号1和2中所示的界面图,该界面是标准界面,用户在文本框1中输入查询,接着点击搜索按钮2,进入步骤1101,搜索引擎根据用户输入的查询进行检索,如检索词为“提高有机土壤”,如图2所示的界面;并根据检索信息,将所述查询的结果的链接信息生成顶层文档,将用户输入的查询及其相关项生成检索目录。具体地,搜索引擎检索所采用的方式有多种,本实施例中采用反向索引的方式。在步骤1102中,搜索引擎计算在所述顶层文档中出现的或与该文档相关联的主信息的统计量,所述统计量除了包括所述主信息在所述顶层文档出现的频率,还包括所述顶层文档的个数以及其他的数值数据,例如将所述查询颠倒次序之后在所述顶层文档中出现的频率。所述主信息包括元数据和/或至少一个词,所述主信息与所述查询相关;具体地,所述元数据包括所述查询的类型和/或所属领域,所述至少一个词是与所述查询相关联的词,如下一级词,同义词,或者反义词等,本实施例不作限制,而所述顶层文档的个数可达到一千至一万;转到步骤1103中,根据所计算的统计量,搜索引擎在所述顶层文档中选择出现频率最高的主信息作为子信息,并将所选择的子信息传送到界面,作为界面的输入数据,这时界面会出现如图2的标注3和4所示。步骤1104中,搜索引擎存储用户与自身的对话信息,存储的对话信息可供后来的用户需要使用该界面时使用。具体地,该对话信息包括所述顶层文件的标识码,所述查询,所选择的子信息;接着,界面显示如图2所示的状态,等待用户的反馈。其中,标注3和4所示的画面是本发明的一个优选实施例,但还可以是其他形式的特征,本发明对此不作限制。用户可点击界面的组合框的按键,如标注3所示,会出现一个列表,该列表包括有与所述顶层文档相关联或在所述顶层文件中出现的元信息和/或至少一个词,如图3中的标注5所示,其中,每个词的右边圆圈内的数字表示该词在所述顶层文档中出现过的文档的个数,由于与所述查询相关联的词可能会很多,为了避免由于太多的词而不能全部显示在界面上,因此设置了标注6所示的画面,可用于浏览其他词的相关信息,可通过点击箭头所指的方块来上下滚动浏览所述相关联的词,进一步地,可通过组合框的特征,如图3的标注6和图4的标注7所示的内容来为用户提供更多的选择。优选地,本实施例中,如图4的标注7所示,查询区域的各个文档之间的分类关系是根据该类型或该词条在顶层文件中出现的概率来决定的。基于当前输入的查询,用户开始选择自己所需要的词或元信息进一步检索,在顶层文档的搜索区域用鼠标选定输入所需要的词条,点击鼠标右键;界面会在所选定的词条的一侧弹出菜单,所述菜单用于供用户选择处理所述词条的方式,然后选择“分类依据”这个选项,如图4标注7所示;转到步骤1105。
步骤1105中,接收到用户用鼠标输入的词条的信息,其中,该词条可以是多个关键词或当前存在的词条中某个词条的下一级词条等。
在步骤1106中,界面输出与所输入的词条相对应的搜索结果,需要说明的是,现实生活中,为了检索的准确性,往往需要进行多级检索,因此,需要选择目前界面所显示的词条的下一级词,本实施例中,添加下一级词的方式如图4中输入用户所需要的词条的方式一样,例如图8的标注18所示,用户在上一级词“肥料”的文档的搜索区域用鼠标选定所需要的下一级词“有机的”,点击鼠标的右键,界面会弹出对话菜单,选择该菜单上的“选择分类依据”选项,接着,如图8的标注20所示,会在上一级词“肥料”的选项卡下面出现下一级词“有机的”的选项卡,该文档搜索区域会显示包括该下一级词“有机的”的文档,该文档可以是所输入的词条的相关链接,但是没有在图8中显示,如果用户不满意目前的检索结果,需要删除或修改当前存在的某个词条时,例如,用户想删除某个词条时,用户可将鼠标放在所述词条所对应的选项卡,点击鼠标右键,在所弹出的菜单中选择“删除选项卡”。或者用户想修改某个词条时,可通过修改与该词条相对应的选项卡。具体地,用户可通过鼠标选中所需要更改的词条或元信息,或者选中需要更改的下一级元信息或下一级词,点击鼠标的右键,在所弹出的对话框中,选择“修改分类依据”选项。
在步骤1107中,接收并执行用户删除或修改词条的指令。具体地,根据用户的删除或修改指令,界面显示与当前存在的词条相对应的搜索结果。具体地,需要更改的元信息或下一级元信息、词条或下一级词汇被删除,根据目前界面上存在的元信息或下一级元信息、词或下一级词,界面会出现经过重新检索、重新排列的文档的搜索结果,并将所搜结果显示在界面上,如图8的标注19所示;接着在步骤1108中,接收到用户用键盘输入的词条的信息。具体地,该所需的词条可以是用户同时从界面的文本框中输入的多个词条,因此所述多个词条需要用分隔符隔开,接着在步骤1109中,界面输出与所输入的多个词条相对应的搜索结果,如图2中的标注4所示。接着用户点击该菜单中的“选择分类依据”这个选项,转到步骤1110。
在步骤1110中,接收用户的确认指示,具体地,该界面会出现一个关于用户当前所输入的词条的选项卡。该确认指示包括用户需要而选择输入的词条及搜索路径。具体地,该搜索路径可以是词条的相关链接,如图4的标注7和图8的标注19中所示,在界面中,所输入的词条被添加到顶层文档搜索区域的元信息或词的路径中,具体如图4和图8所示,接着转到步骤1111。
在步骤1111中,客户端向搜索引擎发送用户与界面之间对话的相关数据,其中所述相关数据包括所述对话的识别码、所述对话信息、用户所选择的词条和所输入的词条的链接信息。优选地,识别码是搜索引擎用于根据用户所选择的词条在顶层文档中查找与该词相关的文档的根据。
在步骤1112中,检测所述顶层文档是否缓存,在本实施例中,不是每一次生成的顶层文档都缓存,因此搜索引擎还需要先检索所述顶层文档是否缓存。当所述顶层文档缓存时,搜索引擎可以根据所述识别码来寻找顶层文档,转到步骤1113;当所述顶层文档没有缓存时,搜索引擎不能根据所述识别码来寻找顶层文档,因此需要重新搜索,转到步骤1114。
在步骤1113中,搜索引擎根据所述对话的识别码,查找到顶层文档,计算在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量,接着将与所输入的词条相关联的或包含所输入的词条的文档按照预置方式进行排列。具体地,将在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档标为下一级顶层文档,并计算该词条在所述下一级顶层文档中出现的频率,接着搜索引擎将与所述下一级顶层文档按照预置方式进行排列。
在步骤1114中,搜索引擎根据所述查询与用户所输入的词条的组合重新进行搜索,将搜索结果的链接信息构造成新的顶层文档,将所述新的顶层文档按照预置方式进行排列。
具体地,排列的方式有多种,如按词条出现的频率,还可按照词条的优先级进行排列,以及根据所输入词条的首个字母按字母顺序排列,此处不作限制。
作为优选,该预置方式可以是:根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,从高频率到低频率,将所述下一级顶层文档或所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来;或根据所输入的词条在所述下一级顶层文档中或在所述新的顶层文档中出现的频率,由低频率达到高频率,将所述下一级顶层文档或在所述新的顶层文档进行排列,并将所排列的文档通过界面显示出来。
更优选地,本实施例中,还可按照所输入的词条进入搜索引擎系统中的优先级,由高到低排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。还可以按照优先级由低到高排列所述下一级顶层文档或所述新的顶层文档,并将所排列的文档通过界面显示出来。
本实施例中,在顶层文档中查找相关的文档或重新检索可通过以下几种方式进行,通过匹配整个词条或匹配该词条的下一级词来实现,又或者通过匹配该词条的一部分或该词条的下一级词的索引词来进行。例如,如果下一级词是“土壤富集”,如果此时使用双词索引,搜索引擎可根据索引词,如“土壤”、“壤富”和“富集”或者使用“土壤”和“富集”来匹配整个句子或重新检索。
当搜索引擎根据用户需要整理好文档之后,转到步骤1115。
在步骤1115中,搜索引擎向客户端发送反馈信息,其中,该反馈信息包括客户端与搜索引擎的对话信息,具体地,该对话信息包括客户端与搜索引擎的对话的识别码、所述排列后的文档及用户所选择的词条,所述排列的文档及其相关的信息,还包括用户所选择的词条的统计量,其中,该统计量包括在顶层文档中与所输入的词条相关联的或包含所输入的词条的文档的数量。步骤1116中,客户端存储对话信息,该对话信息为用户确认检索目标之后与搜索引擎之间的对话信息,所述对话信息包括识别码以及相关的信息,具体地,该识别码用于识别经过搜索引擎重新排列的文档,所述相关的信息包括与用户所选中的词相关联的元数据和多个词,此时,界面上显示的是重新检索后的文档。接着步骤1117中,客户端等待用户的反馈。
如图12所示,是本发明的另外一实施例,其中,除了步骤1208与图11所示的具体实施例中的步骤不一致,其余的都一致,此处不再赘述。在步骤1208中,接收到用户用鼠标输入的词条的信息,其中,该词条可以是多个关键词或当前存在的词条中某个词条的下一级词条等。由于可以进行多级检索,当用户不满意目前的检索结果时,可以根据需要删除某个词条,或者修改某些词条,此外还可使用多种方式输入词条,操作过程简单,检索方便、快捷。更能贴近用户需求。
值得一提的是,上述本实施例中,步骤108至112、步骤911至913、步骤1011至1013、步骤1111至1113、步骤1211至1213还可以由客户端单方执行,但是需要搜索引擎传送顶层文档的相关数据来协助客户端执行检索、编辑等步骤,为了避免用户直接获得文档的相关数据,该顶层文档的数据是经过加密的。
通过本发明的方案,可减轻搜索引擎的负担,减小搜索引擎的存储空间,此外,搜索引擎根据输入的词条与顶层文档的关联程度来对文档进行分类排列,搜索过程更加灵活,加快搜索进程,用户可更快地检索到所需要的信息,效率高。
此外,用户可选择多种方式输入词条,可根据需要进行删除或修改所输入的词条,还可多次输入多级词条,操作过程方便,实用性强,效率高,增强用户的体验效果,另外也使检索更准确,更贴近用户需求。

Claims (9)

1.一种交互式搜索的处理方法,其特征在于,包括如下步骤:
S1、搜索引擎对用户输入的查询进行检索后,根据检索到的信息,将查询结果的链接信息生成顶层文档,将用户输入的查询及其相关项生成检索目录;
S2、搜索引擎计算在所述顶层文档中出现的或与该顶层文档相关联的主信息的统计量,所述统计量包括所述主信息在所述顶层文档出现的频率;所述主信息包括元数据和/或至少一个词,所述主信息与所述查询相关;
S3、根据所计算的统计量,搜索引擎在所述顶层文档中选择出现频率最高的主信息作为子信息,并将所选择的子信息传送到界面,作为界面的输入数据;
S4、搜索引擎存储用户与所述搜索引擎的对话信息,所述对话信息包括所述查询、所述顶层文档的识别码、所选择的子信息;
S5、界面根据用户的指示,输出相对应的搜索结果,并接收用户的确认信息,所述指示包括用户所输入的词条及输入所述词条的方式,所述确认信息为用户所选择的词条及检索路径;
S6、客户端向搜索引擎发送用户与界面之间对话的相关数据,所述相关数据包括所述对话的识别码;
S7、根据所述相关数据,搜索引擎进行搜索并构造与该搜索结果相对应的文档,将该文档按照预置方式进行排列;
具体包括:
检测所述顶层文档是否缓存;
根据检测结果,执行如下步骤中的一个:
当所述顶层文档缓存时,搜索引擎根据所述对话的识别码,查找到顶层文档,计算在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档的数量,并将在顶层文档中与用户所输入的词条相关联的或包含所输入的词条的文档构造成下一级顶层文档,按照预置方式对所述下一级顶层文档进行排列;或
当所述顶层文档不缓存时,搜索引擎根据所述查询与用户所输入的词条的组合重新进行搜索,将搜索结果的链接信息构造成新的顶层文档,将所述新的顶层文档按照预置方式进行排列;
S8、搜索引擎向客户端发送反馈信息,所述反馈信息包括客户端与搜索引擎的对话信息;
S9、客户端存储所接收的对话信息,所述对话信息包括客户端与搜索引擎的对话识别码、所述排列后的文档和用户所选择的词条。
2.根据权利要求1所述的方法,其特征在于,包括:
所述元数据包括所述查询的类型和/或所述查询所在的领域;
所述统计量还包括所述顶层文档的个数。
3.根据权利要求1所述的方法,其特征在于,包括:
所述步骤S4之后还包括:搜索引擎等待用户的反馈;
所述步骤S9之后还包括:客户端等待用户的反馈。
4.根据权利要求1所述的方法,其特征在于,所述步骤S5具体包括:
接收到用户直接从组合框的列表中选择的词条的信息;
界面输出与该词条相对应的搜索结果;
接收用户的确认指示,所述确认指示为所述用户所选择的词条和检索路径。
5.根据权利要求1所述的方法,其特征在于,所述步骤S5具体包括:
A1、接收到用户用键盘输入的词条的信息;
A2、界面输出与所输入的词条相对应的搜索结果;
A3、接收用户的确认指示,所述确认指示为用户所输入的词条和检索路径。
6.根据权利要求5所述的方法,其特征在于,所述步骤A2之后还包括:
接收并执行用户删除或修改词条的指令,所述指令包括需要删除或修改的词条;
接收用户用鼠标或键盘输入的词条的信息;
界面输出与目前其组合框存在的词条相对应的搜索结果。
7.根据权利要求1所述的方法,其特征在于,所述步骤S5具体包括:
B1、接收到用户用鼠标方式输入的词条的信息;
B2、界面输出与所输入的词条相对应的搜索结果;
B3、接收用户的确认指令,所述确认指令为所述用户所输入的词条和检索路径。
8.根据权利要求7所述的方法,其特征在于,所述步骤B2之后还包括:
接收并执行用户删除或修改词条的指令,所述指令包括需要删除或修改的词条;
接收到用户用鼠标或键盘输入的词条的信息;
界面输出与目前其组合框存在的词条相对应的搜索结果。
9.根据权利要求8所述的方法,其特征在于,所述预置方式具体包括根据所述词条进入搜索引擎系统中的优先级,按照所述优先级由高到低排列,或者按照所述优先级由低到高排列。
CN201010566463.6A 2010-11-30 2010-11-30 一种交互式搜索的处理方法 Expired - Fee Related CN102479219B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201010566463.6A CN102479219B (zh) 2010-11-30 2010-11-30 一种交互式搜索的处理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201010566463.6A CN102479219B (zh) 2010-11-30 2010-11-30 一种交互式搜索的处理方法

Publications (2)

Publication Number Publication Date
CN102479219A CN102479219A (zh) 2012-05-30
CN102479219B true CN102479219B (zh) 2015-02-25

Family

ID=46091867

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201010566463.6A Expired - Fee Related CN102479219B (zh) 2010-11-30 2010-11-30 一种交互式搜索的处理方法

Country Status (1)

Country Link
CN (1) CN102479219B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106407247B (zh) * 2016-07-24 2020-08-04 平安科技(深圳)有限公司 数据查询的方法及装置
US10387528B2 (en) * 2016-12-20 2019-08-20 Microsoft Technology Licensing, Llc Search results integrated with interactive conversation service interface
CN114881774B (zh) * 2022-07-12 2022-10-21 华中科技大学同济医学院附属协和医院 基于凭证信息处理的电子档案管理系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6339775B1 (en) * 1997-11-07 2002-01-15 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
CN1918568A (zh) * 2003-12-31 2007-02-21 Google公司 通用搜索引擎接口

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6339775B1 (en) * 1997-11-07 2002-01-15 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
CN1918568A (zh) * 2003-12-31 2007-02-21 Google公司 通用搜索引擎接口

Also Published As

Publication number Publication date
CN102479219A (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
KR102254979B1 (ko) 식별된 개체에 기반한 속성 값의 인출 기법
US8793266B2 (en) Graphical user interface for a search query
US10929603B2 (en) Context-based text auto completion
US9146999B2 (en) Search keyword improvement apparatus, server and method
US8478792B2 (en) Systems and methods for presenting information based on publisher-selected labels
KR101732342B1 (ko) 신뢰 질의 시스템 및 방법
US8347237B2 (en) Method, apparatus, and program product for efficiently detecting relationships in a comprehension state of a collection of information
CN103279513B (zh) 产生内容标签的方法、提供多媒体内容信息的方法及装置
CN102385621B (zh) 一种基于输入法界面实现文档索引的方法及系统
US7743054B2 (en) Information retrieval system
CN107085583B (zh) 一种基于内容的电子文档管理方法及装置
CN100461159C (zh) 用于信息检索的分层数据驱动导航系统及方法
US20040133566A1 (en) Data searching apparatus capable of searching with improved accuracy
US20070067268A1 (en) Navigation of structured data
US20120078979A1 (en) Method for advanced patent search and analysis
US20100332967A1 (en) System and method for automatically generating web page augmentation
CN104794242A (zh) 一种搜索方法
CN110188165A (zh) 合同模板获取方法、装置、存储介质和计算机设备
CN102479219B (zh) 一种交互式搜索的处理方法
JP2007272465A (ja) スケジュール管理装置、スケジュール管理装置における文書提示方法、およびスケジュール管理プログラム
US10579718B2 (en) System and method for interacting in layers in channels over the display of a resource by another application
JP4481978B2 (ja) 情報共有システム及び情報共有プログラム
KR100718745B1 (ko) 텍스트 마이닝을 이용한 특허 검색 시스템 및 그 방법
CN105630837A (zh) 一种媒体记录搜索方法和装置
US20160170606A1 (en) Customized search icon output control system and method therefor

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20150225

Termination date: 20161130

CF01 Termination of patent right due to non-payment of annual fee