CN103914476A - 搜索引导方法和搜索引擎 - Google Patents

搜索引导方法和搜索引擎 Download PDF

Info

Publication number
CN103914476A
CN103914476A CN201310002564.4A CN201310002564A CN103914476A CN 103914476 A CN103914476 A CN 103914476A CN 201310002564 A CN201310002564 A CN 201310002564A CN 103914476 A CN103914476 A CN 103914476A
Authority
CN
China
Prior art keywords
search
word
disambiguation
search word
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310002564.4A
Other languages
English (en)
Other versions
CN103914476B (zh
Inventor
梁晔平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201310002564.4A priority Critical patent/CN103914476B/zh
Publication of CN103914476A publication Critical patent/CN103914476A/zh
Application granted granted Critical
Publication of CN103914476B publication Critical patent/CN103914476B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出一种搜索引导方法和搜索引擎,其中该方法包括以下步骤:搜索引擎建立搜索词匹配词典;搜索引擎接收用户输入的输入信息;搜索引擎查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词;以及如果判断为具有歧义的搜索词,则搜索引擎根据输入信息获取对应的多个消歧类型,并将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。根据本发明实施例的搜索引导方法,可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。

Description

搜索引导方法和搜索引擎
技术领域
本发明涉及搜索技术领域,尤其涉及一种搜索引导方法和搜索引擎。
背景技术
用户在使用搜索引擎进行搜索时,用户输入的搜索词或者是搜索引擎显示的搜索提示结果中的搜索词可能本身带有歧义,而且在有些情况下用户有可能并不知道该搜索词具有歧义。目前,搜索引擎还没有对具有歧义的搜索词进行相应的处理,由此用户得到的搜索结果中会有些与自己搜索目的毫无关联的内容,用户需要重新修改搜索词再次进行搜索,浪费了资源,并且用户体验差。
发明内容
本发明旨在至少解决上述技术问题之一。
为此,本发明的第一个目的在于提出一种搜索引导方法,该方法可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。
本发明的第二个目的在于提出一种搜索引擎。
为了实现上述目的,本发明第一方面实施例的搜索引导方法包括以下步骤:搜索引擎建立搜索词匹配词典,其中,所述搜索词匹配词典包括搜索词、所述搜索词对应的多个消歧类型以及每个所述消歧类型对应的锚文字和链接;所述搜索引擎接收用户输入的输入信息;所述搜索引擎查询所述搜索词匹配词典判断所述输入信息是否为具有歧义的搜索词;以及如果判断为具有歧义的搜索词,则所述搜索引擎根据所述输入信息获取对应的多个所述消歧类型,并将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
根据本发明实施例的搜索引导方法,搜索引擎根据搜索词匹配词典判断用户的输入信息是否具有歧义,并将具有歧义的输入信息对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。
为了实现上述目的,本发明第二方面实施例的搜索引擎,包括:建立模块,用于建立搜索词匹配词典,其中,所述搜索词匹配词典包括搜索词、所述搜索词对应的多个消歧类型以及每个所述消歧类型对应的锚文字和链接;接收模块,用于接收用户输入的输入信息;判断模块,用于查询所述搜索词匹配词典判断所述输入信息是否为具有歧义的搜索词;获取模块,用于在判断为具有歧义的搜索词时,根据所述输入信息获取对应的多个所述消歧类型;以及显示模块,用于将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
根据本发明实施例的搜索引擎,根据搜索词匹配词典判断用户的输入信息是否具有歧义,并将具有歧义的输入信息对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,
图1是根据本发明一个实施例的搜索引导方法的流程图;
图2是根据本发明一个具体实施例的搜索引导方法的流程图;
图3是根据本发明另一个具体实施例的搜索引导方法的流程图;
图4(a)、图4(b)是根据本发明一个实施例的搜索引导方法的操作示意图;
图5是根据本发明一个实施例的搜索引擎的结构示意图;
图6是根据本发明一个具体实施例的搜索引擎的结构示意图;
图7是根据本发明一个实施例的建立模块的结构示意图;
图8是根据本发明另一个实施例的建立模块的结构示意图;以及
图9是根据本发明另一个具体实施例的搜索引擎的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。
下面参考附图描述根据本发明实施例的搜索引导方法和搜索引擎。
一种搜索引导方法,包括以下步骤:搜索引擎建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接;搜索引擎接收用户输入的输入信息;搜索引擎查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词;以及如果判断为具有歧义的搜索词,则搜索引擎根据输入信息获取对应的多个消歧类型,并将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。
图1是根据本发明一个实施例的搜索引导方法的流程图。
如图1所示,搜索引导方法,包括以下步骤:
步骤S101,搜索引擎建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接。
步骤S102,搜索引擎接收用户输入的输入信息。
步骤S103,搜索引擎查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词。
其中,搜索引擎根据用户的输入信息查询搜索词匹配词典,如果用户的输入信息和搜索词匹配词典中的搜索词匹配,则搜索引擎判断用户的输入信息为具有歧义的搜索词,如果不匹配,则搜索引擎判断用户的输入信息为不具有歧义的搜索词。
步骤S104,如果判断为具有歧义的搜索词,则搜索引擎根据输入信息获取对应的多个消歧类型,并将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。
具体地,如果搜索引擎判断用户的输入信息为具有歧义的搜索词,则搜索引擎通过搜索词匹配词典获取用户的输入信息对应的多个消歧类型的锚文字和链接显示给用户,其中,搜索引擎可以将用户的输入信息对应的多个消歧类型的锚文字和链接插入到搜索栏中。例如,用户输入“天龙八部”,对应的消歧类型可能为视频、金庸创作小说或者游戏等。
根据本发明实施例的搜索引导方法,搜索引擎根据搜索词匹配词典判断用户的输入信息是否具有歧义,并将具有歧义的输入信息对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。
在本发明的一个实施例中,搜索引擎获取具有搜索词多义项分类的百科类站点;并对百科类站点进行页面结构分析以获取搜索词对应的多个多义项分类类型;并且对多个多义项分类类型进行排序;以及根据排序结果获取搜索词对应的多个消歧类型,并为多个消歧类型增加锚文字和链接以建立搜索词匹配词典。例如,搜索引擎首先可以通过百度百科获取具有多义项分类的百科类站点,并且分析具有多义词的百科类站点的页面结构获取搜索词对应的多个多义项分类类型,然后搜索引擎可以将具有多义项分类的百科类站点划分到不同的多义项分类类型中,在后搜索引擎可以根据每个多义项分类类型中百科类站点的数量将多义项分类类型进行排序,并且将百科类站点数量最多的两个或者三个多义项分类类型处理生成搜索词对应的消歧类型的锚文字和链接,搜索引擎将搜索词和对应的消歧类型的锚文字和链接保存到搜索词匹配词典中。
在本发明的一个实施例中,搜索引擎根据搜索词获取多个网页;并且搜索引擎对多个网页库进行分类;以及搜索引擎根据分类结果获取搜索词对应的消歧类型,并为多个消歧类型增加锚文字和链接以建立搜索词匹配词典。例如,搜索引擎可以根据网页的标题和正文与类别库中的文本的相似度将多个网页库进行分类。
图2是根据本发明一个具体实施例的搜索引导方法的流程图。
如图2所示,搜索引导方法,包括以下步骤:
步骤S201,搜索引擎建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接。
步骤S202,搜索引擎接收用户输入的输入信息。
步骤S203,搜索引擎根据所述输入信息生成搜索提示结果。
步骤S204,搜索引擎查询搜索词匹配词典判断输入信息和/或搜索提示结果是否为具有歧义的搜索词。
搜索引擎根据用户的输入信息查询搜索词匹配词典,如果用户的输入信息和/或搜索提示结果和搜索词匹配词典中的搜索词匹配,则搜索引擎判断用户的输入信息和/或搜索提示结果为具有歧义的搜索词,如果不匹配,则搜索引擎判断用户的输入信息和/或搜索提示结果为不具有歧义的搜索词。
步骤S205,如果判断为具有歧义的搜索词,则搜索引擎根据输入信息和/或搜索提示结果获取对应的多个消歧类型,并将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。
具体地,如果搜索引擎判断用户的输入信息和/或搜索提示结果为具有歧义的搜索词,则搜索引擎通过搜索词匹配词典获取用户的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接显示给用户,例如,搜索引擎可以将用户的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接插入到搜索栏中。其中,如果用户的输入信息为具有歧义的搜索词,则搜索引擎可以将用户的输入信息对应的多个消歧类型的锚文字和链接插入到输入栏中用户的输入信息的后面。如果搜索提示结果为具有歧义的搜索词,则搜索引擎可以将搜索提示结果对应的多个消歧类型的锚文字和链接插入搜索提示栏中搜索提示结果的后面。
根据本发明实施例的搜索引导方法,搜索引擎根据搜索词匹配词典判断用户的输入信息和/或搜索提示结果是否具有歧义,并将具有歧义的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以给用户在搜索提示结果中也提供消歧的跳转链接,使用户搜索更加便利,进一步提升了用户体验。
图3是根据本发明另一个具体实施例的搜索引导方法的流程图。
如图3所示,搜索引导方法,包括以下步骤:
步骤S301,搜索引擎建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接。
步骤S302,搜索引擎接收用户输入的输入信息。
步骤S303,搜索引擎查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词。
其中,搜索引擎根据用户的输入信息查询搜索词匹配词典,如果用户的输入信息和搜索词匹配词典中的搜索词匹配,则搜索引擎判断用户的输入信息为具有歧义的搜索词,如果不匹配,则搜索引擎判断用户的输入信息为不具有歧义的搜索词。
步骤S304,如果判断为具有歧义的搜索词,则搜索引擎对搜索词的每个消歧类型对应的锚文字和链接进行解析以生成跳转链接,并将跳转链接插入到搜索结果。
具体地,首先搜索引擎可以把搜索词的每个消歧类型对应的锚文字和链接发送到搜索引擎的模板上,然后搜索引擎的模板根据搜索引擎预定的格式,将接收到的锚文字和链接的字段进行解析,在后搜索引擎将通过模板解析后得到的可以点解的链接形式插入到搜索结果中。
下面举一个具体的例子说明本发明实施例的方法。通过具体示例的描述,本发明的方面和优点将变得更加明显。
图4(a)、图4(b)是根据本发明一个实施例的搜索引导方法的操作示意图。
如图4(a)所示,首先用户在搜索栏输入“天龙八”,搜索引擎接收到用户发送的输入信息后,搜索引擎根据用户发送的输入信息生成搜索提示结果“天龙八部”、“天龙八部黄日华版”等,然后搜索引擎根据查询搜索词匹配词典判断搜索提示结果中“天龙八部”为具有歧义的搜索词,在后搜索引擎获取搜索提示结果中“天龙八部”对应的消歧类型“视频”和“金庸创作小说”,并将歧类型“视频”和“金庸创作小说”的锚文字和链接显示在搜索提示结果“天龙八部”的旁边。或者如图4(b)所示,用户在搜索栏输入“天龙八部”,搜索引擎接收到用户发送的输入信息后,搜索引擎则判断用户输入的信息“天龙八部”本身具有歧义,此时搜索引擎将将用户输入信息“天龙八部”对应的消歧类型“视频”和“金庸创作小说”的锚文字和链接显示在搜索栏中“天龙八部”的旁边。
一种搜索引擎,包括:建立模块,用于建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接;接收模块,用于接收用户输入的输入信息;判断模块,用于查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词;获取模块,用于在判断为具有歧义的搜索词时,根据输入信息获取对应的多个消歧类型;以及显示模块,用于将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。
图5是根据本发明一个实施例的搜索引擎的结构示意图。
如图5所示,搜索引擎包括:建立模块100、接收模块200、判断模块300、获取模块400和显示模块500。
具体地,建立模块100用于建立搜索词匹配词典,其中,搜索词匹配词典包括搜索词、搜索词对应的多个消歧类型以及每个消歧类型对应的锚文字和链接。
接收模块200用于接收用户输入的输入信息。
判断模块300用于查询搜索词匹配词典判断输入信息是否为具有歧义的搜索词。其中,判断模块300根据用户的输入信息查询搜索词匹配词典,如果用户的输入信息和搜索词匹配词典中的搜索词匹配,则判断模块300判断用户的输入信息为具有歧义的搜索词,如果不匹配,则判断模块300判断用户的输入信息为不具有歧义的搜索词。
获取模块400用于在判断为具有歧义的搜索词时,根据输入信息获取对应的多个消歧类型。
显示模块500用于将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。具体地,如果判断模块300判断用户的输入信息为具有歧义的搜索词,则获取模块400通过搜索词匹配词典获取用户的输入信息对应的多个消歧类型的锚文字和链接显示给用户,其中,显示模块500可以将用户的输入信息对应的多个消歧类型的锚文字和链接插入到搜索栏中。例如,用户输入“天龙八部”,对应的消歧类型可能为视频、金庸创作小说或者游戏等。
根据本发明实施例的搜索引擎,根据搜索词匹配词典判断用户的输入信息是否具有歧义,并将具有歧义的输入信息对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以避免了用户需要修改搜索词再次进行搜索,节约了流量,并且给用户提供了便利的搜索方式,提升了用户体验。
图6是根据本发明一个具体实施例的搜索引擎的结构示意图。
如图6所示,在图5所示的基础上,搜索引擎还包括:生成模块600。
具体地,生成模块600用于根据输入信息生成搜索提示结果。
在本发明的一个实施例中,判断模块300还用于查询搜索词匹配词典判断输入信息和/或搜索提示结果是否为具有歧义的搜索词,获取模块400还用于在判断为具有歧义的搜索词时,根据输入信息和/或搜索提示结果获取对应的多个消歧类型,并将多个消歧类型的锚文字和链接显示给用户以引导用户根据消歧类型进行搜索。具体地,判断模块300根据用户的输入信息查询搜索词匹配词典,如果用户的输入信息和/或搜索提示结果和搜索词匹配词典中的搜索词匹配,则判断模块300判断用户的输入信息和/或搜索提示结果为具有歧义的搜索词,如果不匹配,则判断模块300判断用户的输入信息和/或搜索提示结果为不具有歧义的搜索词。如果判断模块300判断用户的输入信息和/或搜索提示结果为具有歧义的搜索词,则获取模块400通过搜索词匹配词典获取用户的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接通过显示模块500显示给用户,例如,显示模块500可以将用户的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接插入到搜索栏中。其中,如果用户的输入信息为具有歧义的搜索词,则显示模块500可以将用户的输入信息对应的多个消歧类型的锚文字和链接插入到输入栏中用户的输入信息的后面。如果搜索提示结果为具有歧义的搜索词,则显示模块500可以将搜索提示结果对应的多个消歧类型的锚文字和链接插入搜索提示栏中搜索提示结果的后面。
根据本发明实施例的搜索引擎,根据搜索词匹配词典判断用户的输入信息和/或搜索提示结果是否具有歧义,并将具有歧义的输入信息和/或搜索提示结果对应的多个消歧类型的锚文字和链接显示给用户以引导用户进行搜索,可以给用户在搜索提示结果中也提供消歧的跳转链接,使用户搜索更加便利,进一步提升了用户体验。
图7是根据本发明一个实施例的建立模块的结构示意图。
如图7所示,建立模块100包括:第一获取单元110、第一分析单元120、排序单元130和第一建立单元140。
具体地,第一获取单元110用于获取具有搜索词多义项分类的百科类站点。
第一分析单元120用于对百科类站点进行页面结构分析以获取搜索词对应的多个多义项分类类型。
排序单元130用于对多个多义项分类类型进行排序。
第一建立单元140用于根据排序结果获取搜索词对应的多个消歧类型,并为多个消歧类型增加锚文字和链接以建立搜索词匹配词典。
例如,第一获取单元110首先可以通过百度百科获取具有多义项分类的百科类站点,并且第一分析单元120分析具有多义词的百科类站点的页面结构获取搜索词对应的多个多义项分类类型,然后第一分析单元120可以将具有多义项分类的百科类站点划分到不同的多义项分类类型中,在后排序单元130可以根据每个多义项分类类型中百科类站点的数量将多义项分类类型进行排序,并且将百科类站点数量最多的两个或者三个多义项分类类型处理生成搜索词对应的消歧类型的锚文字和链接,第一建立单元140将搜索词和对应的消歧类型的锚文字和链接保存到搜索词匹配词典中。
图8是根据本发明另一个实施例的建立模块的结构示意图。
如图8所示,建立模块100还包括:第二获取单元150、第二分析单元160和第二建立单元170。
第二获取单元150用于根据搜索词获取多个网页。
第二分析单元160用于对多个网页库进行分类。例如,第二分析单元160可以根据网页的标题和正文与类别库中的文本的相似度将多个网页库进行分类。
第二建立单元170用于根据分类结果获取搜索词对应的消歧类型,并为多个消歧类型增加锚文字和链接以建立搜索词匹配词典。
图9是根据本发明另一个具体实施例的搜索引擎的结构示意图。
如图9所示,在图6所示的基础上,搜索引擎还包括:解析模块700。
解析模块700用于对搜索词的每个消歧类型对应的锚文字和链接进行解析以生成跳转链接,并将跳转链接插入到搜索结果。具体地,首先解析模块700可以把搜索词的每个消歧类型对应的锚文字和链接发送到搜索引擎的模板上,然后解析模块700根据搜索引擎的模板预定的格式,将接收到的锚文字和链接的字段进行解析,在后解析模块700将通过模板解析后得到的可以点解的链接形式插入到搜索结果中。
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

Claims (10)

1.一种搜索引导方法,其特征在于,包括以下步骤:
搜索引擎建立搜索词匹配词典,其中,所述搜索词匹配词典包括搜索词、所述搜索词对应的多个消歧类型以及每个所述消歧类型对应的锚文字和链接;
所述搜索引擎接收用户输入的输入信息;
所述搜索引擎查询所述搜索词匹配词典判断所述输入信息是否为具有歧义的搜索词;以及
如果判断为具有歧义的搜索词,则所述搜索引擎根据所述输入信息获取对应的多个所述消歧类型,并将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
2.如权利要求1所述的搜索引导方法,其特征在于,还包括:
所述搜索引擎根据所述输入信息生成搜索提示结果;
所述搜索引擎查询所述搜索词匹配词典判断所述输入信息和/或所述搜索提示结果是否为具有歧义的搜索词;以及
如果判断为具有歧义的搜索词,则所述搜索引擎根据所述输入信息和/或搜索提示结果获取对应的多个所述消歧类型,并将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
3.如权利要求1或2所述的搜索引导方法,其特征在于,所述搜索引擎建立搜索词匹配词典,进一步包括:
所述搜索引擎获取具有搜索词多义项分类的百科类站点;
所述搜索引擎对所述百科类站点进行页面结构分析以获取所述搜索词对应的多个多义项分类类型;
所述搜索引擎对多个所述多义项分类类型进行排序;以及
所述搜索引擎根据所述排序结果获取所述搜索词对应的多个所述消歧类型,并为多个所述消歧类型增加所述锚文字和链接以建立所述搜索词匹配词典。
4.如权利要求1或2所述的搜索引导方法,其特征在于,所述搜索引擎建立搜索词匹配词典,还包括:
所述搜索引擎根据所述搜索词获取多个网页;
所述搜索引擎对多个所述网页库进行分类;以及
所述搜索引擎根据分类结果获取所述搜索词对应的所述消歧类型,并为多个所述消歧类型增加所述锚文字和链接以建立所述搜索词匹配词典。
5.如权利要求1-4任一项所述的搜索引导方法,其特征在于,所述搜索引擎根据所述输入信息生成搜索提示结果,进一步包括:
所述搜索引擎对所述搜索词的每个所述消歧类型对应的所述锚文字和所述链接进行解析以生成跳转链接,并将所述跳转链接插入到搜索结果。
6.一种搜索引擎,其特征在于,包括:
建立模块,用于建立搜索词匹配词典,其中,所述搜索词匹配词典包括搜索词、所述搜索词对应的多个消歧类型以及每个所述消歧类型对应的锚文字和链接;
接收模块,用于接收用户输入的输入信息;
判断模块,用于查询所述搜索词匹配词典判断所述输入信息是否为具有歧义的搜索词;
获取模块,用于在判断为具有歧义的搜索词时,根据所述输入信息获取对应的多个所述消歧类型;以及
显示模块,用于将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
7.如权利要求6所述的搜索引擎,其特征在于,还包括:
生成模块,用于根据所述输入信息生成搜索提示结果,其中,
所述判断模块还用于查询所述搜索词匹配词典判断所述输入信息和/或所述搜索提示结果是否为具有歧义的搜索词,所述获取模块还用于在判断为具有歧义的搜索词时,根据所述输入信息和/或搜索提示结果获取对应的多个所述消歧类型,并将多个所述消歧类型的所述锚文字和所述链接显示给用户以引导所述用户根据所述消歧类型进行搜索。
8.如权利要求6或7所述的搜索引擎,其特征在于,所述建立模块包括:
第一获取单元,用于获取具有搜索词多义项分类的百科类站点;
第一分析单元,用于对所述百科类站点进行页面结构分析以获取所述搜索词对应的多个多义项分类类型;
排序单元,用于对多个所述多义项分类类型进行排序;以及
第一建立单元,用于根据所述排序结果获取所述搜索词对应的多个所述消歧类型,并为多个所述消歧类型增加所述锚文字和链接以建立所述搜索词匹配词典。
9.如权利要求6或7所述的搜索引擎,其特征在于,所述建立模块还包括:
第二获取单元,用于根据所述搜索词获取多个网页;
第二分析单元,用于对多个所述网页库进行分类;以及
第二建立单元,用于根据分类结果获取所述搜索词对应的所述消歧类型,并为多个所述消歧类型增加所述锚文字和链接以建立所述搜索词匹配词典。
10.如权利要求6-9任一项所述的搜索引擎,其特征在于,还包括:
解析模块,用于对所述搜索词的每个所述消歧类型对应的所述锚文字和所述链接进行解析以生成跳转链接,并将所述跳转链接插入到搜索结果。
CN201310002564.4A 2013-01-05 2013-01-05 搜索引导方法和搜索引擎 Active CN103914476B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310002564.4A CN103914476B (zh) 2013-01-05 2013-01-05 搜索引导方法和搜索引擎

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310002564.4A CN103914476B (zh) 2013-01-05 2013-01-05 搜索引导方法和搜索引擎

Publications (2)

Publication Number Publication Date
CN103914476A true CN103914476A (zh) 2014-07-09
CN103914476B CN103914476B (zh) 2017-02-01

Family

ID=51040168

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310002564.4A Active CN103914476B (zh) 2013-01-05 2013-01-05 搜索引导方法和搜索引擎

Country Status (1)

Country Link
CN (1) CN103914476B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN105574174A (zh) * 2015-12-18 2016-05-11 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN105574143A (zh) * 2015-12-15 2016-05-11 北京奇虎科技有限公司 一种向用户推荐内容的方法及系统
CN107016011A (zh) * 2015-09-11 2017-08-04 谷歌公司 用于自然语言查询的联接路径的消岐
CN107180087A (zh) * 2017-05-09 2017-09-19 北京奇艺世纪科技有限公司 一种搜索方法及装置
CN108197284A (zh) * 2018-01-12 2018-06-22 北京百度网讯科技有限公司 搜索处理方法及装置
CN109213848A (zh) * 2018-11-23 2019-01-15 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备
CN109643306A (zh) * 2017-07-14 2019-04-16 网鸟株式会社 使用去除最后一个字母的算法的一种半导体元件搜索方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040021691A1 (en) * 2000-10-18 2004-02-05 Mark Dostie Method, system and media for entering data in a personal computing device
CN1839386A (zh) * 2003-08-21 2006-09-27 伊迪利亚公司 使用语义歧义消除与扩展的因特网搜索
CN101118555A (zh) * 2007-09-10 2008-02-06 腾讯科技(深圳)有限公司 关键词的联想信息生成系统和生成方法
CN101268463A (zh) * 2005-08-24 2008-09-17 雅虎公司 在完成搜索查询之前提出可选查询

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040021691A1 (en) * 2000-10-18 2004-02-05 Mark Dostie Method, system and media for entering data in a personal computing device
CN1839386A (zh) * 2003-08-21 2006-09-27 伊迪利亚公司 使用语义歧义消除与扩展的因特网搜索
CN101268463A (zh) * 2005-08-24 2008-09-17 雅虎公司 在完成搜索查询之前提出可选查询
CN101118555A (zh) * 2007-09-10 2008-02-06 腾讯科技(深圳)有限公司 关键词的联想信息生成系统和生成方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107016011A (zh) * 2015-09-11 2017-08-04 谷歌公司 用于自然语言查询的联接路径的消岐
US10997167B2 (en) 2015-09-11 2021-05-04 Google Llc Disambiguating join paths for natural language queries
CN105574143A (zh) * 2015-12-15 2016-05-11 北京奇虎科技有限公司 一种向用户推荐内容的方法及系统
CN105574174B (zh) * 2015-12-18 2019-11-26 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN105426535A (zh) * 2015-12-18 2016-03-23 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN105574174A (zh) * 2015-12-18 2016-05-11 北京奇虎科技有限公司 基于搜索提示的搜索方法及装置
CN107180087A (zh) * 2017-05-09 2017-09-19 北京奇艺世纪科技有限公司 一种搜索方法及装置
CN107180087B (zh) * 2017-05-09 2019-11-15 北京奇艺世纪科技有限公司 一种搜索方法及装置
CN109643306A (zh) * 2017-07-14 2019-04-16 网鸟株式会社 使用去除最后一个字母的算法的一种半导体元件搜索方法
CN109643306B (zh) * 2017-07-14 2022-12-06 网鸟株式会社 使用去除最后一个字母的算法的一种半导体元件搜索方法
CN108197284A (zh) * 2018-01-12 2018-06-22 北京百度网讯科技有限公司 搜索处理方法及装置
CN108197284B (zh) * 2018-01-12 2022-01-25 北京百度网讯科技有限公司 搜索处理方法及装置
CN109213848A (zh) * 2018-11-23 2019-01-15 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备
CN109213848B (zh) * 2018-11-23 2022-03-11 北京字节跳动网络技术有限公司 相关搜索词的确定方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
CN103914476B (zh) 2017-02-01

Similar Documents

Publication Publication Date Title
CN103914476A (zh) 搜索引导方法和搜索引擎
CN111221984B (zh) 多模态内容处理方法、装置、设备及存储介质
US11481455B2 (en) Using content identification as context for search
CN110597999A (zh) 一种依存句法分析关系抽取模型的司法案件知识图谱构建方法
CN103092943B (zh) 一种广告调度的方法和广告调度服务器
CN1755696A (zh) 用于创建文档摘要的系统和方法
CN103914553A (zh) 搜索方法和搜索引擎
CN111460289B (zh) 新闻资讯的推送方法和装置
CN111177462B (zh) 视频分发时效的确定方法和装置
CN101256448B (zh) 输入法实现方法及装置、客户端
CN104679783A (zh) 一种网络搜索方法和装置
CN105912662A (zh) 基于Coreseek的垂直搜索引擎研究与优化的方法
WO2020026366A1 (ja) 特許評価判定方法、特許評価判定装置、および特許評価判定プログラム
CN103914533A (zh) 推广搜索结果的展现方法和装置
CN110990057A (zh) 小程序子链信息的提取方法、装置、设备及介质
CN104063208A (zh) 代码文件的优化方法、系统和服务器
CN102567365B (zh) 一种针对于关键词进行标注的输入方法及系统
CN105653547A (zh) 一种提取文本关键词的方法和装置
CN104102733A (zh) 搜索内容提供方法和搜索引擎
CN104933171A (zh) 兴趣点数据关联方法和装置
CN111382256B (zh) 信息推荐方法及装置
JP2012027788A (ja) 文書検索システム、文書検索方法およびプログラム
CN103092919A (zh) 搜索引导方法和搜索引擎
CN105488113A (zh) 论文的搜索方法、装置及搜索引擎
CN104035955A (zh) 搜索方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant