CN105117383A - 一种提供搜索结果的方法与装置 - Google Patents

一种提供搜索结果的方法与装置 Download PDF

Info

Publication number
CN105117383A
CN105117383A CN201510502935.4A CN201510502935A CN105117383A CN 105117383 A CN105117383 A CN 105117383A CN 201510502935 A CN201510502935 A CN 201510502935A CN 105117383 A CN105117383 A CN 105117383A
Authority
CN
China
Prior art keywords
selection result
search
history selection
search sequence
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510502935.4A
Other languages
English (en)
Inventor
田彪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201510502935.4A priority Critical patent/CN105117383A/zh
Priority to PCT/CN2015/095920 priority patent/WO2017028395A1/zh
Publication of CN105117383A publication Critical patent/CN105117383A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明的目的是提供一种提供搜索结果的方法与装置。其中,本发明记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果,进而根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,并将相应的历史选择结果提供给当前用户。本发明考虑了用户所提交的大量搜索序列之间所具有的较高的冗余性,也即,用户所提交的部分搜索序列具有较高的相似性(重复性),从而可以将这些相似搜索序列的历史选择结果直接提供给用户。本发明可以解决现有技术中搜索引擎通常需要每次对搜索序列进行一次全新搜索的技术问题,从而提高了搜索的速度和效率。

Description

一种提供搜索结果的方法与装置
技术领域
本发明涉及互联网技术领域,尤其涉及一种提供搜索结果的技术。
背景技术
现有技术中,搜索引擎可以根据用户所提交的搜索序列(如关键词、语句等),为用户提供相应的搜索结果。搜索引擎通常需要对搜索序列进行多种预处理,如切词分词、字符过滤、需求识别、重要性排序等。这些预处理的步骤使搜索的过程较为复杂,并且降低了搜索的速度和效率。
发明内容
本发明的目的是提供一种提供搜索结果的方法与装置。
根据本发明的一个方面,提供了一种提供搜索结果的方法,其中,该方法包括:
-记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括所述历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;
其中,该方法还包括:
-根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果;
-将所获得的历史选择结果提供给所述当前用户。
根据本发明的另一个方面,还提供了一种提供搜索结果的装置,其中,该装置包括:
-用于记录历史搜索序列及其对应的历史选择结果的装置,所述历史选择结果包括所述历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;
-用于根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果的装置;
-用于将所获得的历史选择结果提供给所述当前用户的装置。
与现有技术相比,本发明记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果,进而根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,并将相应的历史选择结果提供给当前用户。本发明考虑了用户所提交的大量搜索序列之间所具有的较高的冗余性,也即,用户所提交的部分搜索序列具有较高的相似性(重复性),从而可以将这些相似搜索序列的历史选择结果直接提供给用户。本发明可以解决现有技术中搜索引擎通常需要每次对搜索序列进行一次全新搜索的技术问题,包括需对搜索序列进行多种预处理所导致的复杂的搜索过程,从而提高了搜索的速度和效率。
根据本发明的一个优选实施例,除了获得历史选择结果,本发明还可以根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果,进而将历史选择结果与搜索结果一并提供给当前用户。在此,本发明通过查询索引信息库,可以增加为用户所提供的搜索结果的数量,提高搜索结果的查全率。
进一步地,本发明还可以根据搜索序列以及当前用户对所提供的历史选择结果和/或搜索结果的选择更新历史搜索序列及其对应的历史选择结果的记录。在此,本发明可以使用户的选择反馈给网络设备,从而使得网络设备具有自学习能力。一方面,历史选择结果的相关统计信息可以与大多数用户的需求相一致。对于用户输入的搜索序列,网络设备可以根据相匹配的历史搜索序列所对应的各历史选择结果的相关统计信息,对各历史选择结果进行排序,并将排序后的历史选择结果提供给用户,从而使最可能符合用户需求的历史选择结果最优先地呈现给用户。另一方面,网络设备所记录的历史搜索序列会越来越丰富,网络设备所记录的历史选择结果也会越来越丰富、越来越准确。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
图1示出根据本发明一个实施例的一种提供搜索结果的方法流程图;
图2示出根据本发明一个优选实施例的一种提供搜索结果的方法流程图;
图3示出根据本发明一个实施例的一种提供搜索结果的装置示意图;
图4示出根据本发明一个优选实施例的一种提供搜索结果的装置示意图。
附图中相同或相似的附图标记代表相同或相似的部件。
具体实施方式
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的程序指令来执行预定处理过程,或是由ASIC、FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。
所述计算机设备例如网络设备。所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(CloudComputing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
需要说明的是,所述网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
本文后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。
应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元,但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、组件和/或其组合。
还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
下面结合附图对本发明作进一步详细描述。
图1示出根据本发明一个实施例的方法流程图,其具体示出一种提供搜索结果的过程。如图1所示,在步骤S100中,网络设备记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;在步骤S101中,网络设备根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果;在步骤S102中,网络设备将所获得的历史选择结果提供给当前用户。
具体地,在步骤S100中,网络设备记录历史搜索序列及其对应的历史选择结果。
在此,搜索序列包括但不限于各种用户提交的用于搜索的字符串,例如关键词、语句以及其他字符等。
现有的搜索过程中,每时每刻均有大量用户向搜索引擎提交搜索序列进行搜索,并且,每个用户均可以在搜索引擎所提供的一个或多个搜索结果中选择其需要浏览的搜索结果。其中,搜索引擎可以根据搜索序列,查询索引信息库,以获得相应的搜索结果。
本发明所提出的网络设备可以记录用户向上述搜索引擎所提交的搜索序列,这些搜索序列即为历史搜索序列。进而,网络设备可以记录用户在历史搜索序列所对应的搜索结果中所选择过的搜索结果,这些搜索结果即为历史选择结果。优选地,本发明所提出的网络设备可以作为搜索引擎的一部分。
可替代地,网络设备可以从搜索引擎的搜索日志中获得用户的历史搜索序列及其对应的历史选择结果。
所述历史搜索序列包括但不限于各种用户向搜索引擎所提交过的搜索序列。
所述历史选择结果意指历史搜索序列所对应的搜索结果中被用户选择过的搜索结果。也即,在获得搜索引擎所提供的一个或多个搜索结果后,用户在该(等)搜索结果中所选择的搜索结果。
其中,搜索结果例如可以包括标题、描述、图片以及搜索结果所对应的链接信息等信息。搜索结果可以指向新闻、评论、百科等文字内容类信息,也可以指向音乐、视频等多媒体内容类信息。
本领域技术人员应能理解,网络设备记录历史搜索序列及其对应的历史选择结果的步骤可以被理解为实施本发明的基础步骤。该步骤可以定期执行,如每小时或每天记录用户的新增历史搜索序列以及各历史搜索序列所对应的当前最新历史选择结果。或者,由于每时每刻均有大量用户在进行搜索,为提高本发明所提供的历史选择结果的准确度,该步骤也可以始终被执行,从而总是获得实时更新的历史搜索序列和历史选择结果。
所述“历史搜索序列”和“历史选择结果”中的“历史”应被理解为“相对性质的”——相对于步骤S101而言。在每次执行步骤S101时,网络设备均会按照其在步骤S100中已确定的历史搜索序列以及历史选择结果为用户获得历史选择结果。
本领域技术人员应能理解,步骤S101和步骤S102通常为连续进行的。步骤S100与步骤S101、S102之间并无严格的顺序关系,其相互之间可以为连续进行的,也可以为并非连续进行的,甚至可以是并行的。
在此,网络设备对于每个历史搜索序列,可以仅记录一个相应的历史选择结果,如从搜索日志中获取用户选择次数最多的搜索结果作为历史选择结果。当然,由于搜索日志不断更新,所以每个历史搜索序列所对应的历史选择结果也可能会不断更新。
此外,对于每个历史搜索序列,网络设备也可以记录有多个相应的历史选择结果,如所有用户选择过的搜索结果或用户选择次数排名前N位的搜索结果。
在步骤S101中,网络设备根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果。
在此,用户可以通过其用户设备(例如手机)向网络设备提交搜索序列,相应地,网络设备获得当前用户所提交的搜索序列。接着,网络设备可以根据当前用户提交的搜索序列,查询所记录的历史搜索序列及其对应的历史选择结果,来确定与当前用户提交的搜索序列相匹配的历史搜索序列,进而获得该历史搜索序列所对应的历史选择结果。
例如,示例A,网络设备所记录的历史搜索序列包括“刘德华”,该历史搜索序列所对应的历史选择结果包括“刘德华_百度百科”、“刘德华吧_百度贴吧”、“刘德华_百度图片”等。如果当前用户提交的搜索序列为“刘德华”,则网络设备可以确定相匹配的历史搜索序列为“刘德华”,进而获得该历史搜索序列“刘德华”所对应的历史选择结果。
其中,与当前用户提交的搜索序列相匹配的历史搜索序列的获取方式包括但不限于以下2种:
1)通过与当前用户提交的搜索序列的完全匹配来获得相应的历史搜索序列。
网络设备可以将当前用户提交的搜索序列,与之前所记录的一个或多个历史搜索序列,按照字符匹配的方式进行比较,以确定与当前用户提交的搜索序列完全匹配的历史搜索序列。
例如,继前示例A,当前用户提交的搜索序列为“刘德华”。网络设备根据该搜索序列,查询所记录的历史搜索序列及其对应的历史选择结果,确定与当前用户提交的搜索序列完全一致的历史搜索序列“刘德华”。
2)通过与当前用户提交的搜索序列的相似匹配来获得相应的历史搜索序列。
例如,相似匹配可以通过当前搜索序列与历史搜索序列的字符重合度来确定。具体如,与当前用户提交的搜索序列字符重合度高于预定重合度阈值的历史搜索序列可以被确定为与当前用户提交的搜索序列相匹配的历史搜索序列。进一步地,例如,历史搜索序列“刘德华”可以被确定为与当前用户提交的搜索序列“刘得华”相匹配的历史搜索序列。
又如,网络设备可以将与当前用户提交的搜索序列相似度高的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
具体如,网络设备可以实时计算当前用户提交的搜索序列与历史搜索序列的相似度,并将与当前用户提交的搜索序列相似度高于预定相似度阈值的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
例如,网络设备可以基于以下公式1来确定当前用户提交的搜索序列与之前所记录的历史搜索序列的相似度:
f ( C q u e r y , H q u e r y ) = c o m m _ l e n ( C q u e r y , H q u e r y ) l e n ( C q u e r y ) × l e n ( H q u e r y ) 公式1
其中,Cquery表示当前用户提交的搜索序列,Hquery表示历史搜索序列,len(Cquery)表示当前用户提交的搜索序列的长度,len(Hquery)表示历史搜索序列的长度,comm_len(Cquery,Hquery)表示当前用户提交的搜索序列与历史搜索序列中相同字符串的长度,f(Cquery,Hquery)表示当前用户提交的搜索序列与之前所记录的历史搜索序列的相似度。
或者,网络设备可以根据当前用户提交的搜索序列,查询预先保存历史搜索序列与相似的搜索序列的对应关系,以确定与当前用户提交的搜索序列相匹配的历史搜索序列。
在此,如果当前用户提交的搜索序列与一历史搜索序列满足前述对应关系(也即,该搜索序列与该历史搜索序列相似),网络设备即可将与当前用户提交的搜索序列对应的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
本领域技术人员应能理解,前述获取与当前用户提交的搜索序列相匹配的历史搜索序列的方式仅为举例,而不应被视为对本发明的任何限制,任何现有其它或今后可能出现的获取与当前用户提交的搜索序列相匹配的历史搜索序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
在步骤S102中,网络设备将所获得的历史选择结果提供给当前用户。
在此,网络设备可以将所获得的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得历史选择结果。接着,该用户设备可以将历史选择结果呈现给当前用户。
例如,当历史搜索序列与历史选择结果一一对应时,网络设备可以直接将与用户的搜索序列相匹配的历史搜索序列所对应的历史选择结果提供给用户设备。
又如,继前示例A,网络设备可以将历史搜索序列“刘德华”所对应的“刘德华_百度百科”、“刘德华吧_百度贴吧”、“刘德华_百度图片”等历史选择结果提供给当前用户。
优选地,网络设备可以按照以下2个子步骤将历史选择结果提供给当前用户:
1)网络设备根据相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序/筛选。
在此,每个历史搜索序列对应有一个或多个历史选择结果,其中每个历史选择结果具有相关统计信息。
所述历史选择结果所具有的相关统计信息包括但不限于基于各种统计方式对历史选择结果的相关信息进行统计所确定的信息。
所述历史选择结果所具有的相关统计信息例如历史选择结果被用户选择过的次数。所述历史选择结果所具有的相关统计信息又如历史选择结果的当前热度。
在此,历史选择结果所具有的相关统计信息至少具有以下2种统计方式:
i)由于一个历史选择结果可能对应于一个或多个历史搜索序列,为提升历史选择结果所具有的相关统计信息的准确度,历史选择结果应具有分别对应于不同历史搜索序列的相关统计信息。例如,继前示例A,历史选择结果“刘德华_百度百科”可能对应于多个历史搜索序列,如“刘德华”、“刘德华&百科”和“刘德华&资料”,并且,对于每个历史搜索序列,该历史选择结果分别具有一个相关统计信息,如被用户选择过的次数。
ii)每个历史选择结果仅具有一个相关统计信息。在此,历史选择结果所具有的相关统计信息并不对应于特定的历史搜索序列。例如,对于同一个历史选择结果来说,只要其被用户选择过一次,该历史选择结果被用户选择过的次数则增加一次,而无论用户之前所提交的搜索序列是否相同。
本领域技术人员应能理解,前述2种统计方式仅为举例,而不应被视为对本发明的任何限制,任何现有其它或今后可能出现的统计方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
网络设备可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,如按照从高到低的方式,对各历史选择结果进行排序,以获得经排序的历史选择结果。
网络设备也可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,并结合预定的统计信息阈值,对各历史选择结果进行筛选,以获得其相关统计信息高于预定的统计信息阈值的历史选择结果。
本领域技术人员应能理解,网络设备还可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,对历史选择结果进行排序和筛选,以获得其相关统计信息高于预定的统计信息阈值、并且经排序的历史选择结果。
2)网络设备将经排序/筛选的历史选择结果提供给当前用户。
在此,网络设备可以将经排序的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经排序的历史选择结果。接着,经排序的历史选择结果可以按照顺序被呈现给当前用户,例如,排序相对靠前的历史选择结果可以被呈现在搜索结果页面的上方区域,排序相对靠后的历史选择结果可以被呈现在搜索结果页面的下方区域。
网络设备也可以将经筛选的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经筛选的历史选择结果。接着,经筛选的历史选择结果可以被呈现给当前用户。其相关统计信息低于预订的统计信息阈值的历史选择结果将不被发送给当前用户的用户设备。
网络设备还可以将经筛选、并且经排序的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经筛选、并且经排序的历史选择结果。接着,经筛选、并且经排序的历史选择结果可以按照顺序被呈现给当前用户。
优选地,网络设备还可以根据当前用户对所提供的历史选择结果的选择,更新历史搜索序列及其对应的历史选择结果的记录。
例如,如果用户的当前搜索序列与一历史搜索序列相匹配,用户选择了该历史搜索序列所对应的一历史选择结果,网络设备可以更新该历史选择结果的相关统计信息,如可以将该历史搜索序列所对应的该历史选择结果被用户选择过的次数增加1次。在此,由于用户所提交的搜索序列具有相匹配的历史搜索序列,故无论用户所提交的搜索序列是否与该匹配的历史搜索序列完全一致,网络设备通常均可以将用户所提交的搜索序列视为相匹配的历史搜索序列。即使用户所提交的搜索序列与相匹配的历史搜索序列不完全一致,网络设备通常也无需再将用户所提交的搜索序列记录为新的历史搜索序列。这种处理方式正是由于用户选择了一历史选择结果,其证明了本发明的有效性——也即,即使用户所提交的搜索序列与历史搜索序列不完全一致,但用户仍然可以获得他所希望获得的信息。这进一步说明了本发明所记录的历史搜索序列以及相应的历史选择结果可以满足用户大部分的搜索需求。
在此,网络设备根据当前用户对所提供的历史选择结果的选择更新历史搜索序列及其对应的历史选择结果的记录的步骤,可以使用户的选择反馈给网络设备,从而使得网络设备具有自学习能力。并且,历史选择结果的相关统计信息可以与大多数用户的需求相一致。网络设备可以根据相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序,并将排序后的历史选择结果提供给用户,从而使最可能符合用户需求的历史选择结果最优先地呈现给用户。
优选地,本发明的方法(也即,步骤S100、S101和S102)可以被应用于一垂直领域。
在此,所述垂直领域包括但不限于各种仅针对特定类型的信息的领域。所述垂直领域例如音乐领域、视频领域等。
垂直领域下,用户所提交的大量搜索序列具有较高的冗余性,也即,用户所提交的部分搜索序列具有较高的相似性(重复性)。例如,在音乐领域下,不同用户可能提交相同的搜索序列,例如“小苹果”、“刘德华”等。并且,这些搜索序列所对应的搜索结果相对固定。例如,搜索序列“小苹果”对应于“小苹果——筷子兄弟(歌曲)”、“最炫小苹果——凤凰传奇(歌曲)”、“最炫小苹果——凤凰传奇(专辑)”等搜索结果。
本发明方法考虑了垂直领域的前述特性。本发明方法可以根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而将相应的历史选择结果提供给当前用户。现有技术中,搜索引擎需对搜索序列进行切词分词、字符过滤、需求识别、重要性排序等预处理步骤,本发明避免了前述复杂步骤,降低了计算处理的难度,并提高了向当前用户提供搜索结果的速度和效率以及准确率。
进一步地,优选地,网络设备所记录的历史搜索序列及其对应的历史选择结果分别包括垂直领域的专有名词及其在垂直领域所对应的特定类型的搜索结果。
在此,网络设备所记录的历史搜索序列包括垂直领域的专有名词。例如,在音乐领域下,网络设备所记录的历史搜索序列包括音乐领域下的歌曲名称。
网络设备所记录的历史搜索序列所对应的历史选择结果包括垂直领域的专有名词在垂直领域所对应的特定类型的搜索结果。例如,在音乐领域下,网络设备所记录的历史选择结果包括歌曲名称所对应的歌曲类型的搜索结果。
图2示出根据本发明一个优选实施例的方法流程图,其具体示出一种为用户提供目标搜索结果的过程。具体地,在步骤S200中,网络设备记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;在步骤S201中,网络设备根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果;在步骤S202中,网络设备根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果;在步骤S203中,网络设备将所获得的历史选择结果和所述搜索结果提供给当前用户。
其中,图2的步骤S200、步骤S201与图1中的步骤S100、步骤S101相同或相似,故在此不再赘述,并通过引用的方式包含于此。以下将主要具体描述步骤S202和S203。
在步骤S202中,网络设备根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
在此,网络设备查询索引信息库的过程与通常的搜索引擎的搜索过程无异。所述索引信息库例如保存有关键词与索引信息的对应关系。网络设备可以对搜索序列进行多种预处理,如切词分词等,以获得搜索序列所对应的一个或多个关键词。接着,网络设备根据所获得的关键词,查询索引信息库,以将关键词所对应的索引信息确定为搜索结果。
本领域技术人员应能理解,网络设备进行步骤S201与步骤S202的先后顺序存在多种方式。例如,网络设备可以同时地进行这两个步骤。又如,网络设备也可以先进行其中一个步骤,随后再进行另一个步骤。
优选地,当满足以下任一项条件时,网络设备启动前述查询步骤S202:
1)网络设备不能确定与搜索序列相匹配的历史搜索序列。
在此,网络设备所记录的历史搜索序列是有限的,通常不能穷尽所有可能存在的搜索序列。因此,对于部分搜索序列而言,网络设备可能不能确定与这些搜索序列相匹配的历史搜索序列。当网络设备不能确定与搜索序列相匹配的历史搜索序列,网络设备启动前述查询步骤,也即,网络设备根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
例如,网络设备按照字符匹配的方式,对当前用户提交的搜索序列与所有历史搜索序列进行比较,比较的结果为——该搜索序列与所有历史搜索序列的重合度均低于预定重合度阈值。
又如,网络设备实时计算当前用户提交的搜索序列与所有历史搜索序列的相似度,计算结果为——该搜索序列与所有历史搜索序列的相似度均低于预定的相似度阈值。
2)索引信息库有新增项。
所述新增项意指新增的索引信息。
在此,由于索引信息库中由新增项,而这些新增项可能由于尚未被用户搜索从而未被记录为历史选择结果。为提高查全率,当索引信息库有新增项时,网络设备启动前述查询步骤,也即,网络设备根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
3)网络设备所获得的历史选择结果的相关统计信息低于对应阈值。
在此,所述历史选择结果的相关统计信息例如历史选择结果被用户选择过的次数,又如历史选择结果的当前热度。为增加为用户所提供的搜索结果的数量、提高查全率,当所获得的历史选择结果的相关统计信息低于对应阈值时,网络设备启动前述查询步骤,也即,网络设备根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
在步骤S203中,网络设备将所获得的历史选择结果和查询索引信息库所获得的搜索结果提供给当前用户。
在此,网络设备将与当前用户提交的搜索序列相匹配的历史搜索序列所对应的历史选择结果以及根据当前用户提交的搜索序列查询索引信息库所获得的相应的搜索结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得历史选择结果和搜索结果。接着,该用户设备可以将历史选择结果和搜索结果呈现给当前用户。
优选地,网络设备将所获得的历史选择结果与搜索结果去重后提供给当前用户。
在此,网络设备所记录的历史选择结果为历史搜索序列所对应的搜索结果中被用户选择过的搜索结果。历史选择结果来自于索引信息库。因此,与当前用户提交的搜索序列相匹配的历史搜索序列所对应的历史选择结果通常与根据当前用户提交的搜索序列查询索引信息库所获得的相应的搜索结果有重合。在此,网络设备对所获得的历史选择结果与搜索结果进行去重处理,并将去重处理后剩余的搜索结果提供给当前用户。这可以避免用户获得多个完全相同的搜索结果。
优选地,网络设备还可以根据搜索序列以及当前用户对所提供的历史选择结果和/或搜索结果的选择,更新历史搜索序列及其对应的历史选择结果的记录。
例如,当用户提交的搜索序列获得相匹配的历史搜索序列时,网络设备同时为用户提供历史选择结果和搜索结果,如用户选择历史选择结果,则网络设备更新该历史选择结果的用户选择次数,如用户选择搜索结果,则网络设备将该搜索结果也记录为历史选择结果,或者,网络设备更新该搜索结果的用户选择次数,直至该搜索结果的用户选择次数满足成为历史选择结果的条件,如用户选择次数最高或超过阈值等。
当用户提交的搜索序列未能获得相匹配的历史搜索序列时,网络设备仅能为用户提供搜索结果,并记录用户选择的搜索结果,从而该搜索序列以及用户选择的搜索结果可以被记录为历史搜索序列及其对应的历史选择结果。
在此,网络设备根据搜索序列以及当前用户对所提供的历史选择结果和/或搜索结果的选择更新历史搜索序列及其对应的历史选择结果的记录的步骤,可以使用户的选择反馈给网络设备,从而使得网络设备具有自学习能力,并始终向用户提供历史选择结果,优化用户的搜索体验。一方面,历史选择结果的相关统计信息可以与大多数用户的需求相一致。网络设备可以将单个历史选择结果直接提供给用户或将多个历史选择结果排序后提供给用户,从而使最可能符合用户需求的历史选择结果最优先地呈现给用户。另一方面,网络设备所记录的历史搜索序列会越来越丰富,网络设备所记录的历史选择结果也会越来越丰富、越来越准确。
图3示出根据本发明一个实施例的装置示意图,其具体示出一种提供搜索结果的装置,也即提供装置310。如图3所示,提供装置310被装置于网络设备1中,并具体包括装置311-313。
装置311记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果(为便于区分,以下将装置311称为历史信息记录装置311);装置312根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果(为便于区分,以下将装置312称为历史结果获得装置312);装置313将所获得的历史选择结果提供给当前用户(为便于区分,以下将装置313称为搜索结果提供装置313)。
具体地,历史信息记录装置311记录历史搜索序列及其对应的历史选择结果。
在此,搜索序列包括但不限于各种用户提交的用于搜索的字符串,例如关键词、语句以及其他字符等。
现有的搜索过程中,每时每刻均有大量用户向搜索引擎提交搜索序列进行搜索,并且,每个用户均可以在搜索引擎所提供的一个或多个搜索结果中选择其需要浏览的搜索结果。其中,搜索引擎可以根据搜索序列,查询索引信息库,以获得相应的搜索结果。
本发明所提出的提供装置310中的历史信息记录装置311可以记录用户向上述搜索引擎所提交的搜索序列,这些搜索序列即为历史搜索序列。进而,历史信息记录装置311可以记录用户在历史搜索序列所对应的搜索结果中所选择过的搜索结果,这些搜索结果即为历史选择结果。优选地,本发明所提出的提供装置310可以作为搜索引擎的一部分。
可替代地,历史信息记录装置311可以从搜索引擎的搜索日志中获得用户的历史搜索序列及其对应的历史选择结果。
所述历史搜索序列包括但不限于各种用户向搜索引擎所提交过的搜索序列。
所述历史选择结果意指历史搜索序列所对应的搜索结果中被用户选择过的搜索结果。也即,在获得搜索引擎所提供的一个或多个搜索结果后,用户在该(等)搜索结果中所选择的搜索结果。
其中,搜索结果例如可以包括标题、描述、图片以及搜索结果所对应的链接信息等信息。搜索结果可以指向新闻、评论、百科等文字内容类信息,也可以指向音乐、视频等多媒体内容类信息。
本领域技术人员应能理解,历史信息记录装置311记录历史搜索序列及其对应的历史选择结果的操作可以被理解为实施本发明的基础操作。该操作可以定期执行,如每小时或每天记录用户的新增历史搜索序列以及各历史搜索序列所对应的当前最新历史选择结果。或者,由于每时每刻均有大量用户在进行搜索,为提高本发明所提供的历史选择结果的准确度,该操作也可以始终被执行,从而总是获得实时更新的历史搜索序列和历史选择结果。
所述“历史搜索序列”和“历史选择结果”中的“历史”应被理解为“相对性质的”——相对于历史结果获得装置312所执行的操作而言。在每次历史结果获得装置312执行操作时,历史结果获得装置312均会按照历史信息记录装置311已确定的历史搜索序列以及历史选择结果为用户获得历史选择结果。
本领域技术人员应能理解,历史结果获得装置312和搜索结果提供装置313通常为连续执行操作的。历史信息记录装置311所执行的操作与历史结果获得装置312、搜索结果提供装置313所分别执行的操作之间并无严格的顺序关系,其相互之间可以为连续执行的,也可以为并非连续执行的,甚至可以是并行的。
在此,历史信息记录装置311对于每个历史搜索序列,可以仅记录一个相应的历史选择结果,如从搜索日志中获取用户选择次数最多的搜索结果作为历史选择结果。当然,由于搜索日志不断更新,所以每个历史搜索序列所对应的历史选择结果也可能会不断更新。
此外,对于每个历史搜索序列,历史信息记录装置311也可以记录有多个相应的历史选择结果,如所有用户选择过的搜索结果或用户选择次数排名前N位的搜索结果。
随后,历史结果获得装置312根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果。
在此,用户可以通过其用户设备(例如手机)向网络设备1提交搜索序列,相应地,网络设备1的历史结果获得装置312获得当前用户所提交的搜索序列。接着,历史结果获得装置312可以根据当前用户提交的搜索序列,查询所记录的历史搜索序列及其对应的历史选择结果,来确定与当前用户提交的搜索序列相匹配的历史搜索序列,进而获得该历史搜索序列所对应的历史选择结果。
例如,示例A,历史信息记录装置311所记录的历史搜索序列包括“刘德华”,该历史搜索序列所对应的历史选择结果包括“刘德华_百度百科”、“刘德华吧_百度贴吧”、“刘德华_百度图片”等。如果当前用户提交的搜索序列为“刘德华”,则历史结果获得装置312可以确定相匹配的历史搜索序列为“刘德华”,进而获得该历史搜索序列“刘德华”所对应的历史选择结果。
其中,与当前用户提交的搜索序列相匹配的历史搜索序列的获取方式包括但不限于以下2种:
1)通过与当前用户提交的搜索序列的完全匹配来获得相应的历史搜索序列。
历史结果获得装置312可以将当前用户提交的搜索序列,与之前所记录的一个或多个历史搜索序列,按照字符匹配的方式进行比较,以确定与当前用户提交的搜索序列完全匹配的历史搜索序列。
例如,继前示例A,当前用户提交的搜索序列为“刘德华”。历史结果获得装置312根据该搜索序列,查询所记录的历史搜索序列及其对应的历史选择结果,确定与当前用户提交的搜索序列完全一致的历史搜索序列“刘德华”。
2)通过与当前用户提交的搜索序列的相似匹配来获得相应的历史搜索序列。
例如,相似匹配可以通过当前搜索序列与历史搜索序列的字符重合度来确定。具体如,与当前用户提交的搜索序列字符重合度高于预定重合度阈值的历史搜索序列可以被确定为与当前用户提交的搜索序列相匹配的历史搜索序列。进一步地,例如,历史搜索序列“刘德华”可以被确定为与当前用户提交的搜索序列“刘得华”相匹配的历史搜索序列。
又如,历史结果获得装置312可以将与当前用户提交的搜索序列相似度高的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
具体如,历史结果获得装置312可以实时计算当前用户提交的搜索序列与历史搜索序列的相似度,并将与当前用户提交的搜索序列相似度高于预定相似度阈值的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
例如,历史结果获得装置312可以基于以上公式1来确定当前用户提交的搜索序列与之前所记录的历史搜索序列的相似度。
或者,历史结果获得装置312可以根据当前用户提交的搜索序列,查询预先保存历史搜索序列与相似的搜索序列的对应关系,以确定与当前用户提交的搜索序列相匹配的历史搜索序列。
在此,如果当前用户提交的搜索序列与一历史搜索序列满足前述对应关系(也即,该搜索序列与该历史搜索序列相似),历史结果获得装置312即可将与当前用户提交的搜索序列对应的历史搜索序列确定为与当前用户提交的搜索序列相匹配的历史搜索序列。
本领域技术人员应能理解,前述获取与当前用户提交的搜索序列相匹配的历史搜索序列的方式仅为举例,而不应被视为对本发明的任何限制,任何现有其它或今后可能出现的获取与当前用户提交的搜索序列相匹配的历史搜索序列的方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
随后,搜索结果提供装置313将所获得的历史选择结果提供给当前用户。
在此,搜索结果提供装置313可以将所获得的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得历史选择结果。接着,该用户设备可以将历史选择结果呈现给当前用户。
例如,当历史搜索序列与历史选择结果一一对应时,搜索结果提供装置313可以直接将与用户的搜索序列相匹配的历史搜索序列所对应的历史选择结果提供给用户设备。
又如,继前示例A,搜索结果提供装置313可以将历史搜索序列“刘德华”所对应的“刘德华_百度百科”、“刘德华吧_百度贴吧”、“刘德华_百度图片”等历史选择结果提供给当前用户。
优选地,搜索结果提供装置313可以按照以下2个子操作将历史选择结果提供给当前用户:
1)搜索结果提供装置313根据相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序/筛选。
在此,每个历史搜索序列对应有一个或多个历史选择结果,其中每个历史选择结果具有相关统计信息。
所述历史选择结果所具有的相关统计信息包括但不限于基于各种统计方式对历史选择结果的相关信息进行统计所确定的信息。
所述历史选择结果所具有的相关统计信息例如历史选择结果被用户选择过的次数。所述历史选择结果所具有的相关统计信息又如历史选择结果的当前热度。
在此,历史选择结果所具有的相关统计信息至少具有以下2种统计方式:
i)由于一个历史选择结果可能对应于一个或多个历史搜索序列,为提升历史选择结果所具有的相关统计信息的准确度,历史选择结果应具有分别对应于不同历史搜索序列的相关统计信息。例如,继前示例A,历史选择结果“刘德华_百度百科”可能对应于多个历史搜索序列,如“刘德华”、“刘德华&百科”和“刘德华&资料”,并且,对于每个历史搜索序列,该历史选择结果分别具有一个相关统计信息,如被用户选择过的次数。
ii)每个历史选择结果仅具有一个相关统计信息。在此,历史选择结果所具有的相关统计信息并不对应于特定的历史搜索序列。例如,对于同一个历史选择结果来说,只要其被用户选择过一次,该历史选择结果被用户选择过的次数则增加一次,而无论用户之前所提交的搜索序列是否相同。
本领域技术人员应能理解,前述2种统计方式仅为举例,而不应被视为对本发明的任何限制,任何现有其它或今后可能出现的统计方式如可适用于本发明,也应包含在本发明保护范围以内,并在此以引用方式包含于此。
搜索结果提供装置313可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,如按照从高到低的方式,对各历史选择结果进行排序,以获得经排序的历史选择结果。
搜索结果提供装置313也可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,并结合预定的统计信息阈值,对各历史选择结果进行筛选,以获得其相关统计信息高于预定的统计信息阈值的历史选择结果。
本领域技术人员应能理解,搜索结果提供装置313还可以根据相匹配的历史搜索序列所对应的一个或多个历史选择结果各自的相关统计信息,对历史选择结果进行排序和筛选,以获得其相关统计信息高于预定的统计信息阈值、并且经排序的历史选择结果。
2)搜索结果提供装置313将经排序/筛选的历史选择结果提供给当前用户。
在此,搜索结果提供装置313可以将经排序的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经排序的历史选择结果。接着,经排序的历史选择结果可以按照顺序被呈现给当前用户,例如,排序相对靠前的历史选择结果可以被呈现在搜索结果页面的上方区域,排序相对靠后的历史选择结果可以被呈现在搜索结果页面的下方区域。
搜索结果提供装置313也可以将经筛选的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经筛选的历史选择结果。接着,经筛选的历史选择结果可以被呈现给当前用户。其相关统计信息低于预订的统计信息阈值的历史选择结果将不被发送给当前用户的用户设备。
搜索结果提供装置313还可以将经筛选、并且经排序的历史选择结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得经筛选、并且经排序的历史选择结果。接着,经筛选、并且经排序的历史选择结果可以按照顺序被呈现给当前用户。
优选地,提供装置310或提供装置310中的特定装置还可以根据当前用户对所提供的历史选择结果的选择,更新历史搜索序列及其对应的历史选择结果的记录。
例如,如果用户的当前搜索序列与一历史搜索序列相匹配,用户选择了该历史搜索序列所对应的一历史选择结果,提供装置310或提供装置310中的特定装置可以更新该历史选择结果的相关统计信息,如可以将该历史搜索序列所对应的该历史选择结果被用户选择过的次数增加1次。在此,由于用户所提交的搜索序列具有相匹配的历史搜索序列,故无论用户所提交的搜索序列是否与该匹配的历史搜索序列完全一致,提供装置310或提供装置310中的特定装置通常均可以将用户所提交的搜索序列视为相匹配的历史搜索序列。即使用户所提交的搜索序列与相匹配的历史搜索序列不完全一致,提供装置310或提供装置310中的特定装置通常也无需再将用户所提交的搜索序列记录为新的历史搜索序列。这种处理方式正是由于用户选择了一历史选择结果,其证明了本发明的有效性——也即,即使用户所提交的搜索序列与历史搜索序列不完全一致,但用户仍然可以获得他所希望获得的信息。这进一步说明了本发明所记录的历史搜索序列以及相应的历史选择结果可以满足用户大部分的搜索需求。
在此,提供装置310或提供装置310中的特定装置根据当前用户对所提供的历史选择结果的选择更新历史搜索序列及其对应的历史选择结果的记录的操作,可以使用户的选择反馈给提供装置310,从而使得提供装置310具有自学习能力。并且,历史选择结果的相关统计信息可以与大多数用户的需求相一致。提供装置310中的搜索结果提供装置313可以根据相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序,并将排序后的历史选择结果提供给用户,从而使最可能符合用户需求的历史选择结果最优先地呈现给用户。
优选地,本发明的装置(也即,提供装置310,其包括历史信息记录装置311、历史结果获得装置312和搜索结果提供装置313)可以被应用于一垂直领域。
在此,所述垂直领域包括但不限于各种仅针对特定类型的信息的领域。所述垂直领域例如音乐领域、视频领域等。
垂直领域下,用户所提交的大量搜索序列具有较高的冗余性,也即,用户所提交的部分搜索序列具有较高的相似性(重复性)。例如,在音乐领域下,不同用户可能提交相同的搜索序列,例如“小苹果”、“刘德华”等。并且,这些搜索序列所对应的搜索结果相对固定。例如,搜索序列“小苹果”对应于“小苹果——筷子兄弟(歌曲)”、“最炫小苹果——凤凰传奇(歌曲)”、“最炫小苹果——凤凰传奇(专辑)”等搜索结果。
本发明装置考虑了垂直领域的前述特性。本发明装置可以根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而将相应的历史选择结果提供给当前用户。现有技术中,搜索引擎需对搜索序列进行切词分词、字符过滤、需求识别、重要性排序等预处理操作,本发明避免了前述复杂操作,降低了计算处理的难度,并提高了向当前用户提供搜索结果的速度和效率以及准确率。
进一步地,优选地,历史信息记录装置311所记录的历史搜索序列及其对应的历史选择结果分别包括垂直领域的专有名词及其在垂直领域所对应的特定类型的搜索结果。
在此,历史信息记录装置311所记录的历史搜索序列包括垂直领域的专有名词。例如,在音乐领域下,历史信息记录装置311所记录的历史搜索序列包括音乐领域下的歌曲名称。
历史信息记录装置311所记录的历史搜索序列所对应的历史选择结果包括垂直领域的专有名词在垂直领域所对应的特定类型的搜索结果。例如,在音乐领域下,历史信息记录装置311所记录的历史选择结果包括歌曲名称所对应的歌曲类型的搜索结果。
图4示出根据本发明一个优选实施例的装置示意图,其具体示出一种为用户提供目标搜索结果的装置,也即提供装置410。如图4所示,提供装置410被装置于网络设备1中,并具体包括装置411-414。
装置411记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括历史搜索序列所对应的搜索结果中被用户选择过的搜索结果(为便于区分,以下将装置411称为历史信息记录装置411);装置412根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果(为便于区分,以下将装置412称为历史结果获得装置412);装置414根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果(为便于区分,以下将装置414称为普通结果获得装置414);装置413将所获得的历史选择结果和所述搜索结果提供给当前用户(为便于区分,以下将装置413称为搜索结果提供装置413)。
其中,图4的历史信息记录装置411、历史结果获得装置412所分别执行的操作与图3中的历史信息记录装置311、历史结果获得装置312所分别执行的操作相同或相似,故在此不再赘述,并通过引用的方式包含于此。以下将主要具体描述普通结果获得装置414和搜索结果提供装置413所分别执行的操作。
普通结果获得装置414根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
在此,普通结果获得装置414查询索引信息库的过程与通常的搜索引擎的搜索过程无异。所述索引信息库例如保存有关键词与索引信息的对应关系。普通结果获得装置414可以对搜索序列进行多种预处理,如切词分词等,以获得搜索序列所对应的一个或多个关键词。接着,普通结果获得装置414根据所获得的关键词,查询索引信息库,以将关键词所对应的索引信息确定为搜索结果。
本领域技术人员应能理解,历史结果获得装置412与普通结果获得装置414执行操作的先后顺序存在多种方式。例如,历史结果获得装置412和普通结果获得装置414可以同时地执行操作。又如,其中一个装置也可以先执行操作,随后再由另一个装置执行操作。
优选地,当满足以下任一项条件时,普通结果获得装置414启动前述查询操作:
1)历史结果获得装置412不能确定与搜索序列相匹配的历史搜索序列。
在此,历史信息记录装置411所记录的历史搜索序列是有限的,通常不能穷尽所有可能存在的搜索序列。因此,对于部分搜索序列而言,历史结果获得装置412可能不能确定与这些搜索序列相匹配的历史搜索序列。当历史结果获得装置412不能确定与搜索序列相匹配的历史搜索序列,普通结果获得装置414启动前述查询操作,也即,普通结果获得装置414根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
例如,历史结果获得装置412按照字符匹配的方式,对当前用户提交的搜索序列与所有历史搜索序列进行比较,比较的结果为——该搜索序列与所有历史搜索序列的重合度均低于预定重合度阈值。
又如,历史结果获得装置412实时计算当前用户提交的搜索序列与所有历史搜索序列的相似度,计算结果为——该搜索序列与所有历史搜索序列的相似度均低于预定的相似度阈值。
2)索引信息库有新增项。
所述新增项意指新增的索引信息。
在此,由于索引信息库中由新增项,而这些新增项可能由于尚未被用户搜索从而未被记录为历史选择结果。为提高查全率,当索引信息库有新增项时,普通结果获得装置414启动前述查询操作,也即,普通结果获得装置414根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
3)历史结果获得装置412所获得的历史选择结果的相关统计信息低于对应阈值。
在此,所述历史选择结果的相关统计信息例如历史选择结果被用户选择过的次数,又如历史选择结果的当前热度。为增加为用户所提供的搜索结果的数量、提高查全率,当历史结果获得装置412所获得的历史选择结果的相关统计信息低于对应阈值时,普通结果获得装置414启动前述查询操作,也即,普通结果获得装置414根据当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果。
随后,搜索结果提供装置413将所获得的历史选择结果和查询索引信息库所获得的搜索结果提供给当前用户。
在此,搜索结果提供装置413将与当前用户提交的搜索序列相匹配的历史搜索序列所对应的历史选择结果以及根据当前用户提交的搜索序列查询索引信息库所获得的相应的搜索结果发送给当前用户的用户设备(例如手机),相应地,当前用户的用户设备获得历史选择结果和搜索结果。接着,该用户设备可以将历史选择结果和搜索结果呈现给当前用户。
优选地,搜索结果提供装置413将所获得的历史选择结果与搜索结果去重后提供给当前用户。
在此,历史信息记录装置411所记录的历史选择结果为历史搜索序列所对应的搜索结果中被用户选择过的搜索结果。历史选择结果来自于索引信息库。因此,与当前用户提交的搜索序列相匹配的历史搜索序列所对应的历史选择结果通常与根据当前用户提交的搜索序列查询索引信息库所获得的相应的搜索结果有重合。在此,搜索结果提供装置413对所获得的历史选择结果与搜索结果进行去重处理,并将去重处理后剩余的搜索结果提供给当前用户。这可以避免用户获得多个完全相同的搜索结果。
优选地,提供装置410还可以包括一搜索结果更新装置(图4中未示出)。搜索结果更新装置可以根据搜索序列以及当前用户对所提供的历史选择结果和/或搜索结果的选择,更新历史搜索序列及其对应的历史选择结果的记录。
例如,当用户提交的搜索序列获得相匹配的历史搜索序列时,搜索结果提供装置413同时为用户提供历史选择结果和搜索结果,如用户选择历史选择结果,则搜索结果更新装置更新该历史选择结果的用户选择次数,如用户选择搜索结果,则搜索结果更新装置将该搜索结果也记录为历史选择结果,或者,搜索结果更新装置更新该搜索结果的用户选择次数,直至该搜索结果的用户选择次数满足成为历史选择结果的条件,如用户选择次数最高或超过阈值等。
当用户提交的搜索序列未能获得相匹配的历史搜索序列时,搜索结果提供装置413仅能为用户提供搜索结果,并由搜索结果更新装置记录用户选择的搜索结果,从而该搜索序列以及用户选择的搜索结果可以被记录为历史搜索序列及其对应的历史选择结果。
在此,搜索结果更新装置根据搜索序列以及当前用户对所提供的历史选择结果和/或搜索结果的选择更新历史搜索序列及其对应的历史选择结果的记录的操作,可以使用户的选择反馈给提供装置410,从而使得提供装置410具有自学习能力,并由提供装置410中的搜索结果提供装置413始终向用户提供历史选择结果,优化用户的搜索体验。一方面,历史选择结果的相关统计信息可以与大多数用户的需求相一致。搜索结果提供装置413可以将单个历史选择结果直接提供给用户或将多个历史选择结果排序后提供给用户,从而使最可能符合用户需求的历史选择结果最优先地呈现给用户。另一方面,提供装置410中的历史信息记录装置411所记录的历史搜索序列会越来越丰富,历史信息记录装置411所记录的历史选择结果也会越来越丰富、越来越准确。
需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,本发明的各个装置可采用专用集成电路(ASIC)或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

Claims (16)

1.一种提供搜索结果的方法,其中,该方法包括:
-记录历史搜索序列及其对应的历史选择结果,所述历史选择结果包括所述历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;
其中,该方法还包括:
-根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果;
-将所获得的历史选择结果提供给所述当前用户。
2.根据权利要求1所述的方法,其中,该方法还包括:
-根据所述当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果;
其中,所述提供步骤还包括:
-将所述搜索结果提供给所述当前用户。
3.根据权利要求2所述的方法,其中,所述提供步骤还包括:
-将所获得的历史选择结果与所述搜索结果去重后提供给所述当前用户。
4.根据权利要求2或3所述的方法,其中,当满足以下任一项条件时,启动所述查询步骤:
-不能确定与所述搜索序列相匹配的历史搜索序列;
-所述索引信息库有新增项;
-所获得的历史选择结果的相关统计信息低于对应阈值。
5.根据权利要求2至4中任一项所述的方法,其中,该方法还包括:
-根据所述搜索序列以及所述当前用户对所提供的历史选择结果和/或搜索结果的选择,更新所述历史搜索序列及其对应的历史选择结果的记录。
6.根据权利要求1至5中任一项所述的方法,其中,每个历史搜索序列对应有一个或多个历史选择结果,其中每个历史选择结果具有相关统计信息;
其中,所述提供步骤具体包括:
-根据所述相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序/筛选;
-将经排序/筛选的历史选择结果提供给所述当前用户。
7.根据权利要求1至6中任一项所述的方法,其中,该方法被应用于一垂直领域。
8.根据权利要求7所述的方法,其中,所记录的历史搜索序列及其对应的历史选择结果分别包括所述垂直领域的专有名词及其在所述垂直领域所对应的特定类型的搜索结果。
9.一种提供搜索结果的装置,其中,该装置包括:
-用于记录历史搜索序列及其对应的历史选择结果的装置,所述历史选择结果包括所述历史搜索序列所对应的搜索结果中被用户选择过的搜索结果;
-用于根据当前用户提交的搜索序列,确定相匹配的历史搜索序列,进而获得相应的历史选择结果的装置;
-用于将所获得的历史选择结果提供给所述当前用户的装置。
10.根据权利要求9所述的装置,其中,该装置还包括:
-用于根据所述当前用户提交的搜索序列,查询索引信息库,以获得相应的搜索结果的装置;
其中,所述提供装置还用于:
-将所述搜索结果提供给所述当前用户。
11.根据权利要求10所述的装置,其中,所述提供装置还用于:
-将所获得的历史选择结果与所述搜索结果去重后提供给所述当前用户。
12.根据权利要求10或11所述的装置,其中,当满足以下任一项条件时,启动所述查询装置:
-不能确定与所述搜索序列相匹配的历史搜索序列;
-所述索引信息库有新增项;
-所获得的历史选择结果的相关统计信息低于对应阈值。
13.根据权利要求10至12中任一项所述的装置,其中,该装置还包括:
-用于根据所述搜索序列以及所述当前用户对所提供的历史选择结果和/或搜索结果的选择,更新所述历史搜索序列及其对应的历史选择结果的记录的装置。
14.根据权利要求9至13中任一项所述的装置,其中,每个历史搜索序列对应有一个或多个历史选择结果,其中每个历史选择结果具有相关统计信息;
其中,所述提供装置具体用于:
-根据所述相匹配的历史搜索序列所对应的历史选择结果各自的相关统计信息,对其中各历史选择结果进行排序/筛选;
-将经排序/筛选的历史选择结果提供给所述当前用户。
15.根据权利要求9至14中任一项所述的装置,其中,该装置被应用于一垂直领域。
16.根据权利要求15所述的装置,其中,所记录的历史搜索序列及其对应的历史选择结果分别包括所述垂直领域的专有名词及其在所述垂直领域所对应的特定类型的搜索结果。
CN201510502935.4A 2015-08-14 2015-08-14 一种提供搜索结果的方法与装置 Pending CN105117383A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201510502935.4A CN105117383A (zh) 2015-08-14 2015-08-14 一种提供搜索结果的方法与装置
PCT/CN2015/095920 WO2017028395A1 (zh) 2015-08-14 2015-11-30 一种提供搜索结果的方法与装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510502935.4A CN105117383A (zh) 2015-08-14 2015-08-14 一种提供搜索结果的方法与装置

Publications (1)

Publication Number Publication Date
CN105117383A true CN105117383A (zh) 2015-12-02

Family

ID=54665377

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510502935.4A Pending CN105117383A (zh) 2015-08-14 2015-08-14 一种提供搜索结果的方法与装置

Country Status (2)

Country Link
CN (1) CN105117383A (zh)
WO (1) WO2017028395A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107679091A (zh) * 2017-09-07 2018-02-09 北京海融兴通信息安全技术有限公司 一种基于大数据的搜索系统及方法
CN107784027A (zh) * 2016-08-31 2018-03-09 北京国双科技有限公司 一种裁判文书检索关键词的提示方法及装置
CN108108235A (zh) * 2017-12-07 2018-06-01 北京荣之联科技股份有限公司 任务处理方法及装置
CN109857926A (zh) * 2019-03-05 2019-06-07 百度在线网络技术(北京)有限公司 用于呈现信息的方法和装置
CN110083688A (zh) * 2019-05-10 2019-08-02 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019028174A2 (en) 2017-08-02 2019-02-07 Lilac Solutions, Inc. ION EXCHANGE SYSTEM FOR LITHIUM EXTRACTION
CN111191042A (zh) * 2019-12-10 2020-05-22 同济大学 一种基于知识图谱路径语义关系的搜索准确性评价方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080016046A1 (en) * 2006-07-14 2008-01-17 Yahoo Inc. Query categorizer
US20090265325A1 (en) * 2008-04-16 2009-10-22 Iac Search & Media, Inc. Adaptive multi-channel content selection with behavior-aware query analysis
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及系统
CN104123332A (zh) * 2014-01-24 2014-10-29 腾讯科技(深圳)有限公司 搜索结果的显示方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246499B (zh) * 2008-03-27 2010-10-13 腾讯科技(深圳)有限公司 网络信息搜索方法及系统
US8909621B2 (en) * 2012-11-16 2014-12-09 International Business Machines Corporation Contextual search history in collaborative archives
CN104142999B (zh) * 2014-08-01 2019-03-29 百度在线网络技术(北京)有限公司 搜索结果展示方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080016046A1 (en) * 2006-07-14 2008-01-17 Yahoo Inc. Query categorizer
US20090265325A1 (en) * 2008-04-16 2009-10-22 Iac Search & Media, Inc. Adaptive multi-channel content selection with behavior-aware query analysis
CN103064853A (zh) * 2011-10-20 2013-04-24 北京百度网讯科技有限公司 一种搜索建议生成方法、装置及系统
CN104123332A (zh) * 2014-01-24 2014-10-29 腾讯科技(深圳)有限公司 搜索结果的显示方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107784027A (zh) * 2016-08-31 2018-03-09 北京国双科技有限公司 一种裁判文书检索关键词的提示方法及装置
CN107679091A (zh) * 2017-09-07 2018-02-09 北京海融兴通信息安全技术有限公司 一种基于大数据的搜索系统及方法
CN108108235A (zh) * 2017-12-07 2018-06-01 北京荣之联科技股份有限公司 任务处理方法及装置
CN108108235B (zh) * 2017-12-07 2021-10-29 哈勃智远(北京)科技有限公司 任务处理方法及装置
CN109857926A (zh) * 2019-03-05 2019-06-07 百度在线网络技术(北京)有限公司 用于呈现信息的方法和装置
CN110083688A (zh) * 2019-05-10 2019-08-02 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质
CN110083688B (zh) * 2019-05-10 2022-03-25 北京百度网讯科技有限公司 搜索结果召回方法、装置、服务器及存储介质

Also Published As

Publication number Publication date
WO2017028395A1 (zh) 2017-02-23

Similar Documents

Publication Publication Date Title
CN105117383A (zh) 一种提供搜索结果的方法与装置
US11720633B2 (en) Aggregating personalized suggestions from multiple sources
CN102402605B (zh) 用于搜索引擎索引的混合分布模型
CN105808685B (zh) 推广信息的推送方法及装置
US8572074B2 (en) Identifying task groups for organizing search results
US8458165B2 (en) System and method for applying ranking SVM in query relaxation
US8332393B2 (en) Search session with refinement
US9104764B1 (en) Session-based query suggestions
US10585927B1 (en) Determining a set of steps responsive to a how-to query
US8898129B1 (en) Prompt for query clarification
US20100191758A1 (en) System and method for improved search relevance using proximity boosting
US9773064B1 (en) Contextual search term evaluation
CN103778548A (zh) 商品信息与关键词匹配方法、商品信息投放方法及装置
KR20150031234A (ko) 어플리케이션 검색들을 가능하게 하기 위해 사용되는 검색 인덱스의 업데이트
CN102411591A (zh) 一种信息处理的方法及设备
JP2013504118A (ja) クエリのセマンティックパターンに基づく情報検索
US20110208715A1 (en) Automatically mining intents of a group of queries
CN103092943A (zh) 一种广告调度的方法和广告调度服务器
CN107729578B (zh) 一种音乐推荐方法及装置
US9721000B2 (en) Generating and using a customized index
US20120254148A1 (en) Serving multiple search indexes
CN103970748A (zh) 一种相关关键词推荐方法和装置
CN103942198B (zh) 用于挖掘意图的方法和设备
CN103049495A (zh) 用于提供与查询序列相对应的搜索建议的方法、装置与设备
CN102982125B (zh) 一种用于确定同义文本的方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20160329

Address after: 100027 Haidian District, Qinghe Qinghe East Road, No. 23, building two, floor 2108, No., No. 18

Applicant after: BEIJING YINZHIBANG CULTURE TECHNOLOGY Co.,Ltd.

Address before: 100085 Beijing, Haidian District, No. ten on the street Baidu building, No. 10

Applicant before: BEIJING BAIDU NETCOM SCIENCE AND TECHNOLOGY Co.,Ltd.

WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20151202

WD01 Invention patent application deemed withdrawn after publication