CN103970796A - 查询偏好排序方法和装置 - Google Patents

查询偏好排序方法和装置 Download PDF

Info

Publication number
CN103970796A
CN103970796A CN201310043389.3A CN201310043389A CN103970796A CN 103970796 A CN103970796 A CN 103970796A CN 201310043389 A CN201310043389 A CN 201310043389A CN 103970796 A CN103970796 A CN 103970796A
Authority
CN
China
Prior art keywords
web page
page interlinkage
classification
preference information
historical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310043389.3A
Other languages
English (en)
Inventor
罗景
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shiji Guangsu Information Technology Co Ltd
Original Assignee
Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shiji Guangsu Information Technology Co Ltd filed Critical Shenzhen Shiji Guangsu Information Technology Co Ltd
Priority to CN201310043389.3A priority Critical patent/CN103970796A/zh
Publication of CN103970796A publication Critical patent/CN103970796A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • G06F16/337Profile generation, learning or modification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种查询偏好排序方法和装置,属于计算机技术领域。所述方法包括:接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。本发明通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。

Description

查询偏好排序方法和装置
技术领域
本发明涉及网络技术领域,特别涉及一种查询偏好排序方法和装置。
背景技术
随着网络技术的发展,搜索引擎所提供的服务越来越强大,通过搜索引擎获取相关信息已经成为工作、生活、学习的重要部分。因此,如何提高搜索引擎的准确性成为网络发展的关键技术。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
在现有技术中,搜索引擎根据用户输入的搜索关键字进行匹配以获取搜索结果,并按照与关键字之间的相关度输出搜索结果,由于用户输入的搜索关键字有可能很短,包含的信息量有限,造成了搜索结果的不准确和片面性,输出的搜索结果没有规律性,不具有导向性,导致搜索效率低。
发明内容
为了解决搜索效率低的问题,本发明实施例提供了一种查询偏好排序方法和装置。所述技术方案如下:
一方面,提供了一种查询偏好排序方法,所述方法包括:
接收用户输入的指定搜索关键字;
根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
另一方面,提供了一种查询偏好排序装置,所述装置包括:
接收模块,用于接收用户输入的指定搜索关键字;
网页链接获取模块,用于根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
网页链接信息获取模块,用于获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
排序分数计算模块,用于根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
输出模块,用于根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
本发明实施例提供的技术方案带来的有益效果是:
本发明提供了一种查询偏好排序方法和装置,通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例中提供的一种查询偏好排序方法流程图;
图2是本发明实施例中提供的一种查询偏好排序方法流程图;
图3是本发明实施例中提供的一种查询偏好排序装置结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
图1是本发明实施例中提供的一种查询偏好排序方法流程图,该实施例的执行主题可以为搜索服务器,参见图1,该方法包括:
101:接收用户输入的指定搜索关键字;
在本发明实施例中,指定搜索关键字是指本次搜索所使用的搜索关键字。搜索关键字泛指用户在进行搜索时输入的信息,可以是符号、字、词、句子等。在进行搜索之前,用户进入搜索页面,在搜索页面中输入搜索关键字。
需要说明的是,该搜索的过程可以通过搜索引擎完成,搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
102:根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
对于指定搜索关键字来说,可以根据指定搜索关键字的具体情况进行如分词处理、去除停止词等处理,
进一步地,在搜索到和指定关键字匹配的至少一个网页链接后,根据排名算法计算出至少一个网页链接的排序。排名算法是指根据网页中关键词的匹配程度、出现的位置、频次、链接质量等计算出各网页的相关度及排名等级。
在本发明实施例执行过程中,为了提高搜索引擎的排序结果准确度和搜索结果的分类效率,还需在后续步骤中对搜索得到的至少一个页面链接进一步进行处理。
103:获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
其中,历史偏好信息由两部分组成:主题偏好以及意图偏好。
其中,主题偏好由一组主题类别的向量组成,向量中的每一个元素由一个主题类别以及其支持度组成;主题类别通常是根据用户的内容需求进行的分类,用于解决查询的歧义性,比如针对苹果这样的一个查询,它既可以表示手机,也可以表示一种水果,在主题类别中苹果包括至少两个类别,手机和水果。
意图偏好由一组意图类别的向量组成,向量中的每一个元素由一个意图类别以及其支持度组成;意图类别通常根据用户的行为需求进行分类,意图类别包括:导航、信息、事务。当大多数用户只对相同的搜索结果中的某个网页链接进行点击时,认为该查询类别是导航类,当用户对搜索结果中的不同网页链接进行点击时,认为该查询类别是信息类,当用户对网页链接中的资源下载、进行游戏、娱乐等,认为该查询类别是事务类。
网页链接的类别相当于给每个网页链接打上了不同的标签,每个网页链接具备意图类标签和/或主题类标签。搜索引擎可以获取一个时间段内的网页链接的历史点击数据,根据网页链接的历史点击数据计算该网页链接的类别的支持度。网页链接的类别可以通过网页中的元信息获取,也可以根据用户的点击操作获取,对于用户的网页链接点击操作,搜索引擎根据对该网页链接的类别对应记录点击次数,同一个网页链接某个类别的点击次数越高,该网页链接的某个类别的支持度越高。搜索引擎通过分析网页链接在历史搜索过程中的用户点击数据,获取网页链接的各个类别及其对应的支持度,即网页链接的历史偏好信息。
在本发明实施例中,通过根据网页链接与历史偏好信息的映射关系获取网页链接的历史偏好信息,当根据历史搜索过程中的用户点击数据分析得到网页链接的历史偏好信息后,建立历史偏好信息与网页链接之间的映射关系,以便在后续的搜索过程中,为用户提供网页链接时可以进行倾向性的排序。
104:根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
历史偏好信息包括:主题偏好和/或意图偏好。在计算网页链接的排序分数时需要考虑网页链接的历史偏好信息中的各个类别的支持度。
对于只有一个类别的网页,可以将其类别对应的支持度直接作为排序的分数,或者综合考虑支持度、相关度等信息进行计算,以获取该网页链接的排序分数。对于有两个或两个以上类别的网页,可以将各个类别的支持度进行加权求和或叠加,也可以在计算时加入相关度、网页属性等信息,以获取该网页链接的排序分数。
105:根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
搜索引擎返回至少一个网页链接后,对各个网页链接进行了如步骤104的排序分数的计算,该排序分数由该网页链接的类别、不同时间段的用户的点击情况确定,是对用户的历史搜索情况的统计。
搜索引擎按照排序分数将各个网页链接进行排序,输出排序后的网页链接,排序后的网页链接将用户可能使用的重要网页链接放置在靠前的位置,便于用户对信息的获取。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。
可选地,图1所示实施例的技术方案的基础上,步骤101“接收用户输入的指定搜索关键字”之后,102“根据获取到的历史偏好信息,计算至少一个网页链接的排序分数”之前,包括:获取所述指定搜索关键字的历史偏好信息,所述指定搜索关键字的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到。
在本发明实施例中,通过根据搜索关键字与历史偏好信息的映射关系获取搜索关键字的历史偏好信息,当根据历史搜索过程中的用户点击数据分析得到指定搜索关键字的历史偏好信息后,建立历史偏好信息与搜索关键字之间的映射关系,以便在后续的搜索过程中,为用户提供网页链接时可以进行倾向性的排序。
获取了搜索关键字的历史偏好信息,也就获取了关键字的意图类别和/或主题类别,以及意图类别的支持度和/或主题类别的支持度。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。
可选地,图1所示实施例的技术方案的基础上,步骤101“接收用户输入的搜索关键字”之前,所述方法还包括:步骤1011和1012:
1011:按照搜索关键字的类别,统计所述搜索关键字的历史搜索过程的用户点击数据中所述搜索关键字各个类别对应的网页链接的被点击次数;
在搜索引擎中,针对每个搜索关键字的搜索均保留有历史记录,通过对该历史记录的分析可以获知该搜索关键字匹配的多个网页链接,并通过历史记录中的用户点击数据获知每个网页链接的被点击次数,进而获取到搜索关键字的各个类别对应的网页链接的被点击次数。通过统计用户对各个网页链接的被点击次数,以获取搜索关键字的历史偏好信息。网页链接的被点击次数能够有助于对搜索关键字类别倾向的判断,某类别的网页链接的被点击次数越多,说明该搜索关键字的类别越倾向于被点击次数多的网页链接的类别,某类别的网页链接被点击次数越少,说明该搜索关键字的类别越偏离被点击次数少的网页链接的类别。
按照搜索关键字的所包括的意图类别和/或主题类别,统计意图类别的支持度和/或主题类别对应的被点击次数。
1012:根据各个类别对应的网页链接的被点击次数,获取所述搜索关键字各个类别的支持度,将所述搜索关键字各个类别的支持度作为所述搜索关键字的历史偏好信息。
搜索引擎在对搜索关键字的各个类别的网页链接的被点击次数进行统计后,可以获取一个预设时间段内,该搜索关键字的各个类别的支持度。各个类别的支持度可以通过对每个类别的多个网页链接的被点击次数的叠加或者加权求和等方法获取。
在搜索关键字的各个类别的支持度的计算过程中,需要考虑同一类别的网页链接多次点击的边际递减效应。随着对同一个类别的网页链接的点击数据的增大,支持度也在不断上升,为了使支持度在一定的范围之内,支持度的计算需要符合边际递减效应,如可以采用反正切函数,该函数为递增函数,但是随着自变量的值的增加,因变量增加的幅度越来越小,将点击数据作为自变量,支持度作为因变量,支持度的值域在[0,π/2]。还可以采用底数大于1的对数函数,将点击数据映射到该函数的部分定义域内,如[1,100],则支持度对应值域范围为[0,loga100],其中a是底数。
上述是根据同一时间段内的用户点击数据计算支持度的方法,对于不同时间段内的用户点击数据,需要考虑用户点击数据对支持度的贡献,与当前时间间隔越小的时间段的用户点击数据,贡献要大一些,而与当前时间间隔越大的时间段的用户点击数据,贡献相对要小一些,例如,当前时间为1月5号,则1月3号的用户点击数据和1月4号的用户点击数据相比较来说,如果该两个点击数据中所表示的被点击次数相同,则1月4号的用户点击数据对支持度的贡献较大。
同一个类别的网页链接会不断地被点击,从而产生点击数据,点击数据可以每隔一定时间段,叠加到对应类别的支持度中,以实现搜索关键字的历史偏好信息的更新。由于距统计时刻越近的点击数据越有价值,因此最近时间段的点击数据对支持度的贡献是边际递增的。在预设时间段内对搜索关键字的历史偏好信息进行更新时,降低已有的支持度,将当前的点击数据运算产生的支持度叠加到降低后的支持度中,产生新的支持度。如可以对已有的支持度进行线性衰减,或者指数衰减等来降低已有的支持度。而对当前时间段的点击数据进行支持度计算后,将该支持度叠加到衰减后的支持度中,或者赋予根据当前时间段的点击数据获得的支持度一个较大的权值,将当前时间段的点击数据获得的支持度经过权值运算后叠加到衰减后的支持度中,更新关键字的历史偏好信息。
按照搜索关键字的所包括的意图类别和/或主题类别,及意图类别的支持度和/或主题类别对应的被点击次数,分别计算意图类别和/或主题类别的支持度,更新关键字的历史偏好信息。
对关键字的历史偏好信息的更新的预设时间段由开发人员在设计过程中或维护过程中进行设置,可以是1秒、1小时、1天、1周等,本发明实施例对此不作具体限定。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。
可选地,图1所示实施例的技术方案的基础上,步骤101“接收用户输入的搜索关键字”之前,包括101a和101b:
101a:根据网页链接的各个类别,分别统计所述网页链接作为与所述各个类别匹配的搜索结果时被点击的次数;
在搜索引擎中,针对每个网页链接的各个类别的被点击次数均保留有历史记录,通过对该历史记录的分析可以获知该网页链接的历史偏好信息。网页链接的被点击次数能够有助于对网页链接类别倾向的判断,网页链接的某个类别对应的被点击次数越多,说明该网页链接的类别越倾向于被点击次数多的网页链接的类别,网页链接的某类别对应的被点击次数越少,说明该网页链接的类别越偏离被点击次数少的网页链接的类别。按照网页链接所包括的意图类别和/或主题类别,统计意图类别的支持度和/或主题类别对应的被点击次数。
101b:根据各个类别对应的被点击次数,获取所述网页链接各个类别的支持度,将所述网页链接各个类别的支持度作为所述网页链接的历史偏好信息。
搜索引擎在对网页链接各个类别的被点击次数进行统计后,可以获取一个预设时间段内,该网页链接各个类别的支持度。
在网页链接各个类别的支持度的计算过程中,需要考虑网页链接各个类别的多次点击的边际递减效应。随着对网页链接各个类别的点击数据的增大,支持度也在不断上升,为了使支持度在一定的范围之内,支持度的计算需要符合边际递减效应,如可以采用反正切函数,该函数为递增函数,但是随着自变量的值的增加,因变量增加的幅度越来越小,将点击数据作为自变量,支持度作为因变量,支持度的值域在[0,π/2]。还可以采用底数大于1的对数函数,将点击数据映射到该函数的部分定义域内,如[1,100],则支持度对应值域范围为[0,loga100],其中a是底数。
上述是根据同一时间段内的用户点击数据计算支持度的方法,对于不同时间段内的用户点击数据,需要考虑用户点击数据对支持度的贡献,与当前时间间隔越小的时间段的用户点击数据,贡献要大一些,而与当前时间间隔越大的时间段的用户点击数据,贡献相对要小一些,例如,当前时间为1月5号,则1月3号的用户点击数据和1月4号的用户点击数据相比较来说,如果该两个点击数据中所表示的被点击次数相同,则1月4号的用户点击数据对支持度的贡献较大。
网页链接各个类别对应的被点击数据不断增大,用户的点击数据可以每隔一定时间段,叠加到对应类别的支持度中,以实现搜索关键字的历史偏好信息的更新。由于距统计时刻越近的点击数据越有价值,因此最近时间段的点击数据对支持度的贡献是边际递增的。在预设时间段内对搜索关键字的历史偏好信息进行更新时,降低已有的支持度,将当前的点击数据运算产生的支持度叠加到降低后的支持度中,产生新的支持度。如可以对已有的支持度进行线性衰减,或者指数衰减等来降低已有的支持度。而对当前时间段的点击数据进行支持度计算后,将该支持度叠加到衰减后的支持度中,或者赋予根据当前时间段的点击数据获得的支持度一个较大的权值,将根据当前时间段的点击数据获得的支持度经过权值运算后叠加到衰减后的支持度中,更新关键字的历史偏好信息。
按照网页链接所包括的意图类别和/或主题类别,及意图类别的支持度和/或主题类别对应的被点击次数,分别计算意图类别和/或主题类别的支持度,更新网页链接的历史偏好信息。
对网页链接的历史偏好信息更新的预设时间段由开发人员在设计过程中或维护过程中进行设置,可以是1秒、1小时、1天、1周等,本发明实施例对此不作具体限定。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。
可选地,图1所示实施例的技术方案的基础上,步骤1011、1012、101a、101b中所述类别至少包括主题类别和意图类别中任一项。
不同的网页链接的类别各不相同,有的是主题类别,有的是意图类别,有的网页既有主题类别也有意图类别。主题类别又分为导航、信息、事务类别,而意图类别又根据内容分为不同的类别。
一个网页链接最多具有两个大类别,而两个大类别中又包含了各个小类别,所以对于一个网页链接来说,它的总类别数量是不确定的。在计算各个类别的支持度时,需要根据类别的数量进行对应的支持度的计算,在计算排序分数时,也要充分考虑各个类别及其支持度,根据预设算法、意图类别和/或主题类别、意图类别的支持度和/或主题类别的支持度等信息,计算排序分数。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。进一步地,通过对网页进行详细地分类,以及分类计算支持度,有利于提高排序的效率。
可选地,图1所示实施例的技术方案的基础上,步骤104“根据获取到的历史偏好信息,计算至少一个网页链接的排序分数”,包括:根据获取到的历史偏好信息中类别的支持度,应用预设算法计算至少一个网页链接的排序分数。
其中,预设算法是指根据关键字的历史偏好信息和/或网页链接的历史偏好信息中的支持度,计算至少一个网页链接的排序分数。
该预设算法可以先计算关键字的历史偏好信息的支持度,将关键字的历史偏好信息的各个类别对应的支持度进行叠加,获取网页链接的排序分数;
该预设算法还可以是先计算网页链接的历史偏好信息的支持度,将网页链接的历史偏好信息的各个类别对应的支持度进行叠加,获取网页链接的排序分数;
该预设算法还可以是将关键字的历史偏好信息的支持度和网页链接的历史偏好信息的支持度进行叠加,获取网页链接的排序分数;
除此之外,该预设算法还可以是将关键字的历史偏好信息的支持度、网页链接的历史偏好信息的支持度以及相关度等其他信息进行叠加或者加权求和,获取网页链接的排序分数。在计算过程中,还可以为各个类别的支持度设置不同的系数,本发明实施例对此不作具体限定,如对意图类别的支持度系数设置为0.7,而主题类别的支持度系数设置为0.3。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。进一步地,通过对预设算法的灵活应用,充分考虑了网页链接各种信息,增加了返回网页链接的全面性。
图2是本发明实施例中提供的一种查询偏好排序方法流程图,参见图2,该方法包括:
201:根据网页链接的各个类别,分别统计所述网页链接作为与所述各个类别匹配的搜索结果时被点击的次数;
其中,所述类别包括:主题类别和/或意图类别。
搜索引擎根据预设时间段和的网页链接的各个类别,分别统计网页链接作为与所述各个类别匹配的搜索结果时被点击的次数。在搜索引擎中存储有几十到几百个亿的网页链接,每个网页链接中包括多个类别,所以,如果将预设时间段选的过于短,增加了搜索引擎的工作量,影响正常的用户业务,优选地,预设时间段可以为一天。
如在一天内,一个网页链接被点击了100次,该网页链接包括导航、信息、事务、主题四个类别,需要统计该网页链接作为与所述各个类别匹配的搜索结果时的被点击次数,统计结果可以为如导航—10次,信息—20次,事务—30次,主题—40次的形式。
202:根据各个类别对应的被点击次数,获取所述网页链接各个类别的支持度,将所述网页链接各个类别的支持度作为所述网页链接的历史偏好信息;
对于同一个时间段的支持度计算,需要根据网页链接的各个类别对应的被点击次数和边际递减效应计算各个类别的支持度,使得不论网页链接的各个类别对应的被点击次数增加到任意值时,支持度的值始终在一定的范围之内,以便于计算、存储和比较。
对于不同时间计算的支持度,需要累加到已有的支持度上。由于当前时间段的支持度代表了最近的一段时间内用户的基本点击需求,所以具有较高的导向性。对于不同的时间段,根据边际递增效应进行计算。可以增加当前时间段的支持度的权重,即对当前时间段的支持度乘以一个较大的系数,或者降低已有的支持度的权重,即对已有的支持度进行线性衰减或非线性衰减,从而使当前时间段的支持度计算具有边际递增效应。
在计算完各个网页链接的主题类别和/或意图类别的支持度后,将该主题类别和/或意图类别及主题类别和/或意图类别的支持度作为网页链接的历史偏好信息。
基于步骤202中的例子,在获取到网页链接的主题类别和/或意图类别的点击次数后,根据主题类别和/或意图类别的点击次数获取主题类别和/或意图类别的支持度。例如采用反正切函数进行计算y=arc tan x,该函数符合边际递减效果,当导航类别的点击次数为10,带入公式计算可以获取到对应的支持度为1.47,若已有的支持度为3,则可以将已有的支持度乘以一个系数如0.9,通过计算获取的支持度乘以一个系数如0.6,再将二者相加,即3*0.9+1.47*0.6=3.582,将3.582作为导航类别的支持度,使用同样的方法计算信息、事务、主题类别的支持度,将各个类别的支持度作为该网页链接的历史偏好信息的支持度。
203:按照搜索关键字的类别,统计所述搜索关键字的历史搜索过程的用户点击数据中所述搜索关键字各个类别对应的网页链接的被点击次数;
搜索引擎在历史记录中根据搜索关键字的历史搜索过程的用户点击数据中,统计搜索关键字各个类别对应的网页链接的被点击次数。
如一个关键字对应导航、信息、事务、主题四个类别,在一天内,该关键字的历史搜索过程中,该关键字的导航类的网页链接包括N1个,信息类的网页链接包括N2个,事务类的网页链接包括N3个,主题类的网页链接包括N4个,统计该关键字的各个类别对应的网页链接的被点击次数,统计结果可以为如导航—10次,信息—20次,事务—30次,主题—40次的形式。
该统计过程的时间段由技术人员在开发过程中或维护过程中进行设置,本发明实施例对此不作具体限定。
204:根据各个类别对应的网页链接的被点击次数,获取所述搜索关键字各个类别的支持度,将所述搜索关键字各个类别的支持度作为所述搜索关键字的历史偏好信息;
对于同一个时间段内计算的支持度,搜索引擎根据各个类别对应的网页链接的被点击次数和边界递减效应对各个类别的支持度进行计算,使得各个类别的网页链接对应的被点击次数增加到任意值时,支持度的值始终在一定的范围之内,以便于计算、存储和比较。
对于不同时间计算的支持度,需要累加到已有的支持度上。由于当前计算的支持度代表了最近的一段时间内用户的基本点击需求,所以具有较高的导向性,根据边际递增效应进行计算当前时间段的支持度。可以增加当前时间段的支持度的权重,即对当前时间段的支持度乘以一个较大的系数,或者降低已有的支持度的权重,即对已有的支持度进行线性衰减或非线性衰减,在对当前时间段的支持度和已有的支持度进行加权后在求和作为历史偏好信息的支持度,从而使当前时间段的支持度计算具有边际递增效应。
在步骤203的例子的基础上,获取到一天之内的一个关键字的各个类别的点击次数的统计结果为导航—10次,信息—20次,事务—30次,主题—40次,采用反正切函数y=arc tan x计算该关键字的各个类别的支持度,该函数符合边际递减效果,当导航类的点击次数为10,带入公式计算可以获取到对应的支持度为arc tan10=1.47,信息类的支持度arc tan20=1.52,事务类的支持度arctan30=1.537,主题类的支持度arc tan40=1.545。将各个类别的支持度进行加权,叠加到已有的支持度中,如已有的导航类的支持度为5.5,将已有的导航类的支持度乘以0.8,同时将当前计算获得的导航类支持度1.47乘以0.5,在将两者进行相加,即5.5*0.8+1.47*0.5=5.135,该关键字的其他类别的计算入导航类的计算过程相似,这里不再赘述,将计算后的该关键字的各个类别的支持度作为该关键字的历史偏好信息的支持度。
需要说明的是,步骤201-202、203-204的计算时间没有先后的顺序,该计算时间是由技术人员在开发过程中或维护过程中进行设置的,步骤的序号并不代表该过程在实际应用中的执行顺序。
205:接收用户输入的指定搜索关键字;
用户在搜索页面输入指定的关键字后,搜索引擎获取该指定关键字,如用户输入指定关键为“苹果”,搜索引擎通过获取“苹果”,以进行对相关网页的获取。
206:根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
搜索引擎根据指定搜索关键字如“苹果”,进行分析处理,由于该关键字比较简单,不需要进行分词等处理,搜索引擎在已有的网页链接中查找和“苹果”匹配的至少一个网页链接,并获取至少一个匹配的网页链接。
207:获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
根据匹配到的至少一个网页链接,搜索引擎获取至少一个网页链接的历史偏好信息,该偏好信息包括类别以及其对应的支持度。如“苹果”对应N个网页链接,N可以为1,2,3,4等,当N为3时,网页链接1的历史偏好信息为:导航—5.55,信息—3.12;网页链接2的历史偏好信息为:水果—8.56;网页链接3的历史偏好信息为:手机—9.25。
网页链接的历史偏好信息通过步骤101-102对历史搜索过程中的用户点击数据进行分析,获取网页链接的各个类别及其支持度,将各个类别及其支持度作为网页链接的历史偏好信息,在此不再赘述。
208:获取所述指定搜索关键字的历史偏好信息,所述指定搜索关键字的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
获取搜索的关键字的历史偏好信息,即该关键字的各个类别及其对应的支持度。如关键字“苹果”的关键字的历史偏好信息为:导航—5.55,信息—3.12;网页链接2的历史偏好信息为:水果—8.56;网页链接3的历史偏好信息为:手机—9.25。
关键字的历史偏好信息通过步骤203-204对历史搜索过程中的用户点击数据进行分析,获取关键字的各个类别及其支持度,将各个类别及其支持度作为关键字的历史偏好信息,在此不再赘述。
209:根据获取到的历史偏好信息中类别的支持度,应用预设算法计算至少一个网页链接的排序分数;
获取到的历史偏好信息包括关键字的历史偏好信息和/或网页链接的历史偏好信息。搜索引擎根据预设算法对关键字的历史偏好信息和/或网页链接的历史偏好信息中的支持度、相关度等信息中的任一种或多种信息进行叠加或者加权求和,以获取网页链接的排序分数。
优选地,采用关键字的历史偏好信息、网页链接的偏好信息和相关度进行网页链接的排序分数的计算,以便使用户获取到的网页链接最大限度的满足用户的需求。如输入关键字为“苹果”时,关键字的历史偏好信息包括:导航—5.55,信息—3.12,水果—8.56,手机(意图类别)—9.25。当已获取的网页链接数量为N时,以其中3个网页链接为例进行说明,网页链接1的页链接的历史偏好信息为:导航—1.55,信息—1.12;网页链接2的网页链接的历史偏好信息为:水果—2.56;网页链接3的网页链接的历史偏好信息为:手机—2.25。网页链接1的相关度为0.4,网页链接2的相关度为0.7,网页链接3的相关度为0.9。在计算排序分数时,可以采用加权求和的方式,网页链接的排序分数=关键字的历史偏好信息的支持度*网页链接的历史偏好信息的支持度+相关度;则网页链接1的排序分数为:5.55*1.55+3.21*1.12+0.4=12.5977,网页链接2的排序分数为:8.56*2.56+0.7=22.6136,网页链接3的排序分数为:9.25*2.25+0.9=21.7125。
210:根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
搜索引擎将各个网页链接按照排序分数进行输出,用户在浏览器提供的页面中看到排序后的各个网页链接。基于步骤208中的例子,当N为3时,网页链接的排序为:网页链接2,网页链接3,网页链接1。
用户按照网页链接的顺序查看各个网页链接获取需要的网页链接,进而可以通过点击操作进入相关的页面。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的技术方案,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。进一步地,通过对预设算法的灵活应用,充分考虑了网页链接各种信息,增加了返回网页链接的全面性。
图3是本发明实施例中提供的一种查询偏好排序装置结构示意图,参见图3,该方法包括:
接收模块301,用于接收用户输入的指定搜索关键字;
网页链接获取模块302,用于根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
网页链接信息获取模块303,用于获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
排序分数计算模块304,用于根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
输出模块305,用于根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
所述装置还包括:
关键字信息获取模块,用于获取所述指定搜索关键字的历史偏好信息,所述指定搜索关键字的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到。
所述装置还包括:
第一统计模块,用于按照搜索关键字的类别,统计所述搜索关键字的历史搜索过程的用户点击数据中所述搜索关键字各个类别对应的网页链接的被点击次数;
关键字信息计算模块,用于根据各个类别对应的网页链接的被点击次数,获取所述搜索关键字各个类别的支持度,将所述搜索关键字各个类别的支持度作为所述搜索关键字的历史偏好信息。
所述装置还包括:
第二统计模块,用于根据网页链接的各个类别,分别统计所述网页链接作为与所述各个类别匹配的搜索结果时被点击的次数;
网页链接信息计算模块,用于根据各个类别对应的被点击次数,获取所述网页链接各个类别的支持度,将所述网页链接各个类别的支持度作为所述网页链接的历史偏好信息。
所述类别至少包括主题类别和意图类别中任一项。
所述排序分数计算模块304用于根据获取到的历史偏好信息中类别的支持度,应用预设算法计算至少一个网页链接的排序分数。
本发明通过接收用户输入的指定搜索关键字;根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;根据所述至少一个网页链接的排序分数,输出排序后的网页链接。采用本发明提供的装置,通过获取对历史搜索过程中的用户点击数据的分析得到的历史偏好信息以及对至少一个网页链接的排序分数的计算,使得搜索引擎输出的排序后的网页链接能够综合历史搜索过程中用户的偏好,根据其排序分数进行排序,使得搜索更加准确,为用户的搜索提供了导向作用,提高了搜索的效率。进一步地,通过对关键字的历史偏好信息的获取,增强了网页链接的排序的导向作用。进一步地,通过对预设算法的灵活应用,充分考虑了网页链接各种信息,增加了返回网页链接的全面性。
需要说明的是:上述实施例提供的查询偏好排序装置在对查询偏好排序时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的查询偏好排序装置与查询偏好排序方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种查询偏好排序方法,其特征在于,所述方法包括:
接收用户输入的指定搜索关键字;
根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
2.根据权利要求1所述的方法,其特征在于,接收用户输入的指定搜索关键字之后,根据获取到的历史偏好信息,计算至少一个网页链接的排序分数之前,所述方法还包括:
获取所述指定搜索关键字的历史偏好信息,所述指定搜索关键字的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到。
3.根据权利要求2所述的方法,其特征在于,接收用户输入的搜索关键字之前,所述方法还包括:
按照搜索关键字的类别,统计所述搜索关键字的历史搜索过程的用户点击数据中所述搜索关键字各个类别对应的网页链接的被点击次数;
根据各个类别对应的网页链接的被点击次数,获取所述搜索关键字各个类别的支持度,将所述搜索关键字各个类别的支持度作为所述搜索关键字的历史偏好信息。
4.根据权利要求1所述的方法,其特征在于,接收用户输入的搜索关键字之前,所述方法还包括:
根据网页链接的各个类别,分别统计所述网页链接作为与所述各个类别匹配的搜索结果时被点击的次数;
根据各个类别对应的被点击次数,获取所述网页链接各个类别的支持度,将所述网页链接各个类别的支持度作为所述网页链接的历史偏好信息。
5.根据权利要求3或4所述的方法,其特征在于,所述类别至少包括主题类别和意图类别中任一项。
6.根据权利要求3或4所述的方法,其特征在于,根据获取到的历史偏好信息,计算至少一个网页链接的排序分数,包括:
根据获取到的历史偏好信息中类别的支持度,应用预设算法计算至少一个网页链接的排序分数。
7.一种查询偏好排序装置,其特征在于,所述装置包括:
接收模块,用于接收用户输入的指定搜索关键字;
网页链接获取模块,用于根据所述指定搜索关键字,获取与所述指定搜索关键字匹配的至少一个网页链接;
网页链接信息获取模块,用于获取所述至少一个网页链接的历史偏好信息,所述网页链接的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到;
排序分数计算模块,用于根据获取到的历史偏好信息,计算至少一个网页链接的排序分数;
输出模块,用于根据所述至少一个网页链接的排序分数,输出排序后的网页链接。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
关键字信息获取模块,用于获取所述指定搜索关键字的历史偏好信息,所述指定搜索关键字的历史偏好信息通过对历史搜索过程中的用户点击数据的分析得到。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
第一统计模块,用于按照搜索关键字的类别,统计所述搜索关键字的历史搜索过程的用户点击数据中所述搜索关键字各个类别对应的网页链接的被点击次数;
关键字信息计算模块,用于根据各个类别对应的网页链接的被点击次数,获取所述搜索关键字各个类别的支持度,将所述搜索关键字各个类别的支持度作为所述搜索关键字的历史偏好信息。
10.根据权利要求7所述的装置,其特征在于,所述装置还包括:
第二统计模块,用于根据网页链接的各个类别,分别统计所述网页链接作为与所述各个类别匹配的搜索结果时被点击的次数;
网页链接信息计算模块,用于根据各个类别对应的被点击次数,获取所述网页链接各个类别的支持度,将所述网页链接各个类别的支持度作为所述网页链接的历史偏好信息。
11.根据权利要求9或10所述的装置,其特征在于,所述类别至少包括主题类别和意图类别中任一项。
12.根据权利要求9或10所述的装置,其特征在于,所述排序分数计算模块用于根据获取到的历史偏好信息中类别的支持度,应用预设算法计算至少一个网页链接的排序分数。
CN201310043389.3A 2013-02-04 2013-02-04 查询偏好排序方法和装置 Pending CN103970796A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310043389.3A CN103970796A (zh) 2013-02-04 2013-02-04 查询偏好排序方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310043389.3A CN103970796A (zh) 2013-02-04 2013-02-04 查询偏好排序方法和装置

Publications (1)

Publication Number Publication Date
CN103970796A true CN103970796A (zh) 2014-08-06

Family

ID=51240308

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310043389.3A Pending CN103970796A (zh) 2013-02-04 2013-02-04 查询偏好排序方法和装置

Country Status (1)

Country Link
CN (1) CN103970796A (zh)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462556A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法和装置
CN104715011A (zh) * 2014-12-31 2015-06-17 上海孩子国科教设备有限公司 进行数据检索的方法及系统
CN104994424A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种构建音视频标准数据集的方法和装置
CN105045835A (zh) * 2015-06-30 2015-11-11 百度在线网络技术(北京)有限公司 信息搜索方法和装置
CN105302898A (zh) * 2015-10-23 2016-02-03 天津车之家科技有限公司 一种基于点击模型的搜索排序方法及装置
CN105975506A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 一种服务搜索方法和装置
CN107430615A (zh) * 2015-09-30 2017-12-01 谷歌公司 深度链接到多个本原应用
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置
CN107885783A (zh) * 2017-10-17 2018-04-06 北京京东尚科信息技术有限公司 获取搜索词高相关分类的方法和装置
CN108305091A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 电子设备、用户感兴趣感知度提取方法及装置
CN108681568A (zh) * 2018-05-03 2018-10-19 北京五八信息技术有限公司 一种搜索排序方法、装置、设备及计算机可读存储介质
CN109783740A (zh) * 2019-01-24 2019-05-21 北京字节跳动网络技术有限公司 关注页面的排序方法及装置
CN110134716A (zh) * 2019-04-12 2019-08-16 平安城市建设科技(深圳)有限公司 信息查询方法、信息查询平台、设备及可读存储介质
CN112559886A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 历史记录文档的排序方法、装置、设备、存储介质及产品
CN114969545A (zh) * 2022-06-16 2022-08-30 江苏智慧智能软件科技有限公司 一种心理健康课程个性化智能推荐系统及方法
CN115048581A (zh) * 2022-06-17 2022-09-13 武汉叶子互娱文化传媒有限公司 一种网络数据分析处理方法、系统及计算机存储介质

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462556B (zh) * 2014-12-25 2018-02-23 北京奇虎科技有限公司 问答页面相关问题推荐方法和装置
CN104462556A (zh) * 2014-12-25 2015-03-25 北京奇虎科技有限公司 问答页面相关问题推荐方法和装置
CN104715011A (zh) * 2014-12-31 2015-06-17 上海孩子国科教设备有限公司 进行数据检索的方法及系统
CN104994424B (zh) * 2015-06-30 2018-03-20 北京奇艺世纪科技有限公司 一种构建音视频标准数据集的方法和装置
CN105045835A (zh) * 2015-06-30 2015-11-11 百度在线网络技术(北京)有限公司 信息搜索方法和装置
CN104994424A (zh) * 2015-06-30 2015-10-21 北京奇艺世纪科技有限公司 一种构建音视频标准数据集的方法和装置
CN105045835B (zh) * 2015-06-30 2019-06-04 百度在线网络技术(北京)有限公司 信息搜索方法和装置
CN107430615A (zh) * 2015-09-30 2017-12-01 谷歌公司 深度链接到多个本原应用
CN105302898A (zh) * 2015-10-23 2016-02-03 天津车之家科技有限公司 一种基于点击模型的搜索排序方法及装置
CN105302898B (zh) * 2015-10-23 2019-02-19 车智互联(北京)科技有限公司 一种基于点击模型的搜索排序方法及装置
CN105975506A (zh) * 2016-04-28 2016-09-28 百度在线网络技术(北京)有限公司 一种服务搜索方法和装置
CN108305091A (zh) * 2017-01-13 2018-07-20 北京京东尚科信息技术有限公司 电子设备、用户感兴趣感知度提取方法及装置
CN108305091B (zh) * 2017-01-13 2022-04-26 北京京东尚科信息技术有限公司 电子设备、用户感兴趣感知度提取方法及装置
CN107870984A (zh) * 2017-10-11 2018-04-03 北京京东尚科信息技术有限公司 识别搜索词的意图的方法和装置
CN107885783B (zh) * 2017-10-17 2020-11-03 北京京东尚科信息技术有限公司 获取搜索词高相关分类的方法和装置
CN107885783A (zh) * 2017-10-17 2018-04-06 北京京东尚科信息技术有限公司 获取搜索词高相关分类的方法和装置
CN108681568A (zh) * 2018-05-03 2018-10-19 北京五八信息技术有限公司 一种搜索排序方法、装置、设备及计算机可读存储介质
CN109783740A (zh) * 2019-01-24 2019-05-21 北京字节跳动网络技术有限公司 关注页面的排序方法及装置
CN110134716A (zh) * 2019-04-12 2019-08-16 平安城市建设科技(深圳)有限公司 信息查询方法、信息查询平台、设备及可读存储介质
CN112559886A (zh) * 2020-12-25 2021-03-26 北京百度网讯科技有限公司 历史记录文档的排序方法、装置、设备、存储介质及产品
CN114969545A (zh) * 2022-06-16 2022-08-30 江苏智慧智能软件科技有限公司 一种心理健康课程个性化智能推荐系统及方法
CN114969545B (zh) * 2022-06-16 2023-10-13 江苏智慧智能软件科技有限公司 一种心理健康课程个性化智能推荐系统及方法
CN115048581A (zh) * 2022-06-17 2022-09-13 武汉叶子互娱文化传媒有限公司 一种网络数据分析处理方法、系统及计算机存储介质
CN115048581B (zh) * 2022-06-17 2023-12-08 广东朝阳全网通科技有限公司 一种网络数据分析处理方法、系统及计算机存储介质

Similar Documents

Publication Publication Date Title
CN103970796A (zh) 查询偏好排序方法和装置
US8073741B2 (en) Method, device, and system for analyzing and ranking web-accessible data targets
US7685091B2 (en) System and method for online information analysis
CN103177090B (zh) 一种基于大数据的话题检测方法及装置
US8612435B2 (en) Activity based users' interests modeling for determining content relevance
US20160098778A1 (en) Method, device, and system for analyzing and ranking products
CN102760138B (zh) 用户网络行为的分类方法和装置及对应的搜索方法和装置
CN101876981B (zh) 一种构建知识库的方法及装置
CN107862022B (zh) 文化资源推荐系统
US9798820B1 (en) Classification of keywords
US20110313844A1 (en) Real-time-ready behavioral targeting in a large-scale advertisement system
CN106682192A (zh) 一种基于搜索关键词训练回答意图分类模型的方法和装置
US20070038646A1 (en) Ranking blog content
CN103679462A (zh) 一种评论数据处理方法和装置、一种搜索方法和系统
CN101930438A (zh) 一种搜索结果生成方法及信息搜索系统
US8423554B2 (en) Content category scoring for nodes in a linked database
JP2023533475A (ja) キーワード推薦のための人工知能
CN110134845A (zh) 项目舆情监控方法、装置、计算机设备及存储介质
US8126790B2 (en) System for cost-sensitive autonomous information retrieval and extraction
CN103198098A (zh) 一种网络信息投放方法和装置
Kim et al. Nowcasting commodity prices using social media
CN108932625A (zh) 用户行为数据的分析方法、装置、介质和电子设备
Hossain et al. Software process metrics in agile software development: A systematic mapping study
CN104462556A (zh) 问答页面相关问题推荐方法和装置
Antoniou et al. A semantic web personalizing technique: the case of bursts in web visits

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140806