CN110096655B - 搜索结果的排序方法、装置、设备及存储介质 - Google Patents

搜索结果的排序方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN110096655B
CN110096655B CN201910357684.3A CN201910357684A CN110096655B CN 110096655 B CN110096655 B CN 110096655B CN 201910357684 A CN201910357684 A CN 201910357684A CN 110096655 B CN110096655 B CN 110096655B
Authority
CN
China
Prior art keywords
recall
result
query statement
user
click data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910357684.3A
Other languages
English (en)
Other versions
CN110096655A (zh
Inventor
彭钊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910357684.3A priority Critical patent/CN110096655B/zh
Publication of CN110096655A publication Critical patent/CN110096655A/zh
Application granted granted Critical
Publication of CN110096655B publication Critical patent/CN110096655B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9538Presentation of query results

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开实施例公开了一种搜索结果的排序方法、装置、设备及存储介质。该方法包括:获取用户输入的查询语句,并对所述查询语句进行归一化处理;根据归一化后的查询语句进行搜索,获得召回结果;获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;根据所述特征信息和所述历史点击数据对所述召回结果进行排序。本公开实施例提供的搜索结果的排序方法,根据召回结果的特征信息以及用户针对查询语句的历史点击数据对召回结果进行排序,可以避免其他用户的历史点击数据对当前用户的搜索结果造成干扰,从而提高用户在沟通工具中搜索的准确性。

Description

搜索结果的排序方法、装置、设备及存储介质
技术领域
本公开实施例涉及搜索技术领域,尤其涉及一种搜索结果的排序方法、装置、设备及存储介质。
背景技术
在沟通应用程序(Application,APP)尤其是企业沟通应用程序中,通常会使用查询语句查询相关信息。如为了建立聊天会话,需要搜索联系人、搜群会话;为了查看聊天记录,需要搜索消息。搜索在沟通工具中的使用越来越频繁,已经成为高效使用沟通工具中不可或缺的一部分。
在网页搜索场景中,通过参考大量用户的搜索点击数据,对当前用户的搜索结果顺序进行优化。和网页搜索场景不同,在沟通应用程序中的搜索,对于不同的用户,搜索的结果集是不同的,例如:对于不在群会话中的用户,是没有权限搜到该群名及群内消息的。另一方面,由于用户的搜索习惯不同,不同用户输入同一查询语句,希望得到的结果也可能不同。因此,若在沟通应用程序中采用现有的网页搜索技术进行搜索,搜索结果中会出现大量的干扰项,降低搜索的准确性。
发明内容
本公开实施例提供一种搜索结果的排序方法、装置、设备及存储介质,可以提高用户在沟通工具中搜索的准确性。
第一方面,本公开实施例提供了一种搜索结果的排序方法,该方法包括:
获取用户输入的查询语句,并对所述查询语句进行归一化处理;
根据归一化后的查询语句进行搜索,获得召回结果;
获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;
根据所述特征信息和所述历史点击数据对所述召回结果进行排序。
进一步地,对所述查询语句进行归一化处理,包括如下至少一项:
对所述查询语句进行大小写转换、空格及特殊符号的去除以及语义的归一化。
进一步地,在获取用户输入的查询语句之前,还包括:
采集用户针对查询语句的点击数据,并将所述点击数据存储至服务器的数据库中,所述点击数据包括:用户身份识别码、归一化后的查询语句、点击结果的身份识别码和点击时间。
进一步地,获取所述用户针对所述查询语句的历史点击数据,包括:
根据所述查询语句获取用户的历史点击数据;
提取点击时间距离当前时刻的时长在设定时间段内的历史点击数据。
进一步地,获取所述召回结果的特征信息,包括:
对所述召回结果进行特征计算,获得召回结果的特征信息,所述特征信息包括召回结果的更新时间以及与所述查询语句的文本匹配度。
进一步地,根据所述特征信息和所述历史点击数据对所述召回结果进行排序,包括:
对所述更新时间和所述文本匹配进行加权求和,获得召回结果的权重值;
根据所述权重值对所述召回结果进行初始排序;
根据所述历史点击数据对初始排序后的召回结果的顺序进行调整。
进一步地,根据所述历史点击数据对初始排序后的召回结果的顺序进行调整,包括:
获取与所述历史点击数据中的点击结果的身份识别码相匹配的召回结果,确定为优选召回结果;
将所述优选召回结果调整至其他召回结果之前。
进一步地,将所述优选召回结果调整至其他召回结果之前,包括:
若所述优选召回结果的数量为多个,则按照点击时间对所述多个优选召回结果进行排序,
将排序后的所述多个优选召回结果调整至其他召回结果之前。
第二方面,本公开实施例还提供了一种搜索结果的排序装置,该装置包括:
归一化处理模块,用于获取用户输入的查询语句,并对所述查询语句进行归一化处理;
召回结果获取模块,用于根据归一化后的查询语句进行搜索,获得召回结果;
历史点击数据获取模块,用于获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;
召回结果排序模块,用于根据所述特征信息和所述历史点击数据对所述召回结果进行排序。
第三方面,本公开实施例还提供了一种电子设备,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如本公开实施例所述的搜索结果的排序方法。
第四方面,本公开实施例还提供了一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现如本公开实施例所述的搜索结果的排序方法。
本公开实施例,首先获取用户输入的查询语句,并对查询语句进行归一化处理,然后根据归一化后的查询语句进行搜索,获得召回结果,再然后获取召回结果的特征信息以及用户针对查询语句的历史点击数据,最后根据特征信息和历史点击数据对召回结果进行排序。本公开实施例提供的搜索结果的排序方法,根据召回结果的特征信息以及用户针对查询语句的历史点击数据对召回结果进行排序,可以避免其他用户的历史点击数据对当前用户的搜索结果造成干扰,从而提高用户在沟通工具中搜索的准确性。
附图说明
图1是本公开实施例一中的一种搜索结果的排序方法的流程图;
图2是本公开实施例二中的一种搜索结果的排序装置的结构示意图;
图3是本公开实施例三中的一种电子设备的结果示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本公开,而非对本公开的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本公开相关的部分而非全部结构。
实施例一
图1为本公开实施例一提供的一种搜索结果的排序方法的流程图,本公开实施例可适用于在企业沟通应用程序中对搜索结果进行排序的情况,该方法可以由搜索结果的排序装置来执行,该装置可由硬件和/或软件组成,并一般可集成在具有搜索结果的排序功能的设备中,该设备可以是服务器、移动终端或服务器集群等电子设备。如图1所示,该方法具体包括如下步骤:
步骤110,获取用户输入的查询语句,并对查询语句进行归一化处理。
其中,查询语句可以用户在企业沟通应用程序中搜索联系人、群会话或者聊天记录时在搜索框中输入的语句。若用户搜索的是联系人或群会话,则查询语句可以是待搜索的联系人会群会话的中文姓名、英文姓名、中文姓名对应的拼音或者中文姓名对应的拼音首字母等;若用户搜索的是聊天记录,则查询语句可以是与聊天记录语义相近或相同的词语等。
对查询语句进行归一化处理的方式可以包括如下至少一种:对所述查询语句进行大小写转换、空格及特殊符号的去除以及语义的归一化。其中,进行大小转换可以是按照预设规则进行转换,例如:预设规则是将所有字母转化为小写,则将查询语句中大写的字母转换为小写,如:将“A”转换为“a”。特殊符号可以包括除文字及字母以外的其他符号。语义的归一化的方式可以是对查询语句进行语义识别,在预设语义映射表中查找与该语义对应的语句,确定为语义归一化后的查询语句。
具体的,用户在在企业沟通应用程序中进行搜索时,在搜索框输入查询语句,搜索引擎对查询语句进行字符及语义等的识别,根据识别结果对查询语句进行大小写转换、空格及特殊符号的去除或者语义的归一化处理。
步骤120,根据归一化后的查询语句进行搜索,获得召回结果。
其中,召回结果的数量可以是1个或多个,用户在企业沟通应用程序的搜索框中输入查询语句,搜索引擎在企业沟通应用程序对应的数据库中进行搜索,获得与查询语句匹配的召回结果。
步骤130,获取召回结果的特征信息以及用户针对查询语句的历史点击数据。
其中,特征信息包括召回结果的更新时间以及与所述查询语句的文本匹配度。更新时间可以是召回结果最近一次出现的时间,文本匹配度可以是召回结果的信息中与查询语句文本相同的文字所占的比例。例如,输入的查询语句为“张三”,A召回结果为张三,则文本匹配度为100%,B召回结果为张三丰,则文本匹配度为2/3。点击数据可以包括用户身份识别码、归一化后的查询语句、点击结果的身份识别码和点击时间。其中,点击结果为被用户点击的召回结果,例如,某查询语句对应的召回结果包括A、B、C和D,用户点击了D,则D为点击结果。
具体的,获取召回结果的特征信息的方式可以是对召回结果进行特征计算,获得召回结果的特征信息。计算召回结果的文本中与归一化后的查询语句的文本相同的文字所占的比例,获得召回结果与查询语句的文本匹配度。获取用户针对查询语句的历史点击数据的方式可以是,根据归一化的查询语句查找用户的历史点击数据中包含该归一化的查询语句的历史点击数据,然后提取点击时间距离当前时刻的时长在设定时间段内的历史点击数据。其中设定时间段可以是2周-1个月之间的任意时间段。点击时间距离当前时刻的时长在设定时间段内的历史点击数据,可以真实反映用户最近的行为习惯,提高搜索的准确性。
步骤140,根据特征信息和历史点击数据对召回结果进行排序。
具体的,可以先根据特征信息对召回结果进行初始排序,然后根据历史点击数据对初始排序后的召回结果的顺序进行调整。
可选的,根据特征信息和历史点击数据对召回结果进行排序,可通过下述方式实施:对更新时间和文本匹配进行加权求和,获得召回结果的权重值;根据权重值对召回结果进行初始排序;根据历史点击数据对初始排序后的召回结果的顺序进行调整。
可选的,对文本匹配度和更新时间进行加权求和的方式可以是,首先计算更新时间距离当前时间的时长(可以以秒或分钟为单位),对获得的时长进行归一化处理,然后获取文本匹配度和更新时间分别对应的置信度,最后将文本匹配度和归一化后的时长分别与对应的置信度相乘后求和,从而获得召回结果的权重值。其中,对时长归一化可以将时长转化为0-1之间的值,例如:可以采用公式T=t/t+a进行计算,其中,T为归一化后的时长,t为更新时间距离当前时间的时长,a为常数,如:可以取100。获得召回结果的权重值后,按照权重值从大到小的顺序对召回结果进行初始排序。
可选的,根据历史点击数据对初始排序后的召回结果的顺序进行调整,的过程可以是:获取与历史点击数据中的点击结果的身份识别码相匹配的召回结果,确定为优选召回结果;将优选召回结果调整至其他召回结果之前。
具体的,在获得用户的历史点击数据之后,将历史点击数据中的点击结果的身份识别码与召回结果的身份识别码进行比对,提取出与点击结果的身份识别码相同的召回结果,确定为优选召回结果,并将优选召回结果调整至其他召回结果之前。示例性的,假设某查询语句的召回结果包括A1、A2、A3、A4和A5,对召回结果初始排序后得到的顺序为A4、A2、A5、A1、A3,其中A3与历史点击数据中的点击结果的身份识别码匹配,则将A3调整至其他召回结果之前,获得的最终的排序为A3、A4、A2、A5、A1。
可选的,将优选召回结果调整至其他召回结果之前,还可通过下述方式实施:若优选召回结果的数量为多个,则按照点击时间对多个优选召回结果进行排序,将排序后的多个优选召回结果调整至其他召回结果之前。
当优选召回结果的数量为多个时,按照点击时间距离当前时间由近到远的顺序对多个优选召回结果进行排序,并将排序后的多个优选召回结果调整值其他召回结果之前。示例性的,假设某查询语句的召回结果包括A1、A2、A3、A4和A5,对召回结果初始排序后得到的顺序为A4、A2、A5、A1、A3,其中A3和A5均为优选召回结果,A5的点击时间与A3的点击时间相比,距离当前时间较近,则将A5排在A3前面,最终的排序为A5、A3、A4、A2、A1。
可选的,在获取用户输入的查询语句之前,还包括如下步骤:采集用户针对查询语句的点击数据,并将点击数据存储至服务器的数据库中。
其中,点击数据包括:用户身份识别码、归一化后的查询语句、点击结果的身份识别码和点击时间。当检测到用户执行搜索的操作时,采集用户针对查询语句的搜索结果的点击数据,并将点击数据存储至服务器的数据库中。示例性的,假设用户在一次搜索中输入的查询语句为“a”,输出的搜索结果包括:A1、A2、A3、A4和A5,用户点击了“A1”,则采集该次点击行为产生的数据,包括:用户的身份识别码、归一化后的a、A1的身份识别码及点击A1时的时间。
本公开实施例的技术方案,首先获取用户输入的查询语句,并对查询语句进行归一化处理,然后根据归一化后的查询语句进行搜索,获得召回结果,再然后获取召回结果的特征信息以及用户针对查询语句的历史点击数据,最后根据特征信息和历史点击数据对召回结果进行排序。本公开实施例提供的搜索结果的排序方法,根据召回结果的特征信息以及用户针对查询语句的历史点击数据对召回结果进行排序,可以避免其他用户的历史点击数据对当前用户的搜索结果造成干扰,从而提高用户在沟通工具中搜索的准确性。
实施例二
图2为本公开实施例二提供的一种搜索结果的排序装置的结构示意图。如图2所示,该装置包括:归一化处理模块210,召回结果获取模块220,历史点击数据获取模块230和召回结果排序模块240。
归一化处理模块210,用于获取用户输入的查询语句,并对查询语句进行归一化处理;
召回结果获取模块220,用于根据归一化后的查询语句进行搜索,获得召回结果;
历史点击数据获取模块230,用于获取召回结果的特征信息以及用户针对查询语句的历史点击数据;
召回结果排序模块240,用于根据特征信息和历史点击数据对召回结果进行排序。
可选的,归一化处理模块210,还用于:
对查询语句进行大小写转换、空格及特殊符号的去除以及语义的归一化。
可选的,还包括:
点击数据存储模块,用于采集用户针对查询语句的点击数据,并将点击数据存储至服务器的数据库中,点击数据包括:用户身份识别码、归一化后的查询语句、点击结果的身份识别码和点击时间。
可选的,历史点击数据获取模块230,还用于:
根据查询语句获取用户的历史点击数据;
提取点击时间距离当前时刻的时长在设定时间段内的历史点击数据。
可选的,历史点击数据获取模块230,还用于:
对召回结果进行特征计算,获得召回结果的特征信息,特征信息包括召回结果的更新时间以及与查询语句的文本匹配度。
可选的,召回结果排序模块240,还用于:
对更新时间和文本匹配进行加权求和,获得召回结果的权重值;
根据权重值对召回结果进行初始排序;
根据历史点击数据对初始排序后的召回结果的顺序进行调整。
可选的,召回结果排序模块240,还用于:
获取与历史点击数据中的点击结果的身份识别码相匹配的召回结果,确定为优选召回结果;
将优选召回结果调整至其他召回结果之前。
可选的,召回结果排序模块240,还用于:
若优选召回结果的数量为多个,则按照点击时间对多个优选召回结果进行排序,
将排序后的多个优选召回结果调整至其他召回结果之前。
上述装置可执行本公开前述所有实施例所提供的方法,具备执行上述方法相应的功能模块和有益效果。未在本公开实施例中详尽描述的技术细节,可参见本公开前述所有实施例所提供的方法。
实施例三
下面参考图3,其示出了适于用来实现本公开实施例的电子设备300的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端,或者各种形式的服务器,如独立服务器或者服务器集群。图3示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图3所示,电子设备300可以包括处理装置(例如中央处理器、图形处理器等)301,其可以根据存储在只读存储装置(ROM)302中的程序或者从存储装置305加载到随机访问存储装置(RAM)303中的程序而执行各种适当的动作和处理。在RAM 303中,还存储有电子设备300操作所需的各种程序和数据。处理装置301、ROM 302以及RAM 303通过总线304彼此相连。输入/输出(I/O)接口305也连接至总线304。
通常,以下装置可以连接至I/O接口305:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置306;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置307;包括例如磁带、硬盘等的存储装置308;以及通信装置309。通信装置309可以允许电子设备300与其他设备进行无线或有线通信以交换数据。虽然图3示出了具有各种装置的电子设备300,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行错别字的纠正方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置309从网络上被下载和安装,或者从存储装置305被安装,或者从ROM 302被安装。在该计算机程序被处理装置301执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储装置(RAM)、只读存储装置(ROM)、可擦式可编程只读存储装置(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储装置(CD-ROM)、光存储装置件、磁存储装置件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该处理装置执行时,使得该电子设备:获取用户输入的查询语句,并对所述查询语句进行归一化处理;根据归一化后的查询语句进行搜索,获得召回结果;获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;根据所述特征信息和所述历史点击数据对所述召回结果进行排序。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,模块的名称在某种情况下并不构成对该模块本身的限定。
注意,上述仅为本公开的较佳实施例及所运用技术原理。本领域技术人员会理解,本公开不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本公开的保护范围。因此,虽然通过以上实施例对本公开进行了较为详细的说明,但是本公开不仅仅限于以上实施例,在不脱离本公开构思的情况下,还可以包括更多其他等效实施例,而本公开的范围由所附的权利要求范围决定。

Claims (9)

1.一种搜索结果的排序方法,其特征在于,包括:
获取用户输入的查询语句,并对所述查询语句进行归一化处理;
根据归一化后的查询语句进行搜索,获得召回结果;
获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;其中,所述特征信息包括召回结果的更新时间以及与所述查询语句的文本匹配度;
对所述更新时间和所述文本匹配进行加权求和,获得召回结果的权重值;
根据所述权重值对所述召回结果进行初始排序;
获取与所述历史点击数据中的点击结果的身份识别码相匹配的召回结果,确定为优选召回结果;
将所述优选召回结果调整至其他召回结果之前。
2.根据权利要求1所述的方法,其特征在于,对所述查询语句进行归一化处理,包括如下至少一项:
对所述查询语句进行大小写转换、空格及特殊符号的去除以及语义的归一化。
3.根据权利要求1所述的方法,其特征在于,在获取用户输入的查询语句之前,还包括:
采集用户针对查询语句的点击数据,并将所述点击数据存储至服务器的数据库中,所述点击数据包括:用户身份识别码、归一化后的查询语句、点击结果的身份识别码和点击时间。
4.根据权利要求3所述的方法,其特征在于,获取所述用户针对所述查询语句的历史点击数据,包括:
根据所述查询语句获取用户的历史点击数据;
提取点击时间距离当前时刻的时长在设定时间段内的历史点击数据。
5.根据权利要求1-4任一所述的方法,其特征在于,获取所述召回结果的特征信息,包括:
对所述召回结果进行特征计算,获得召回结果的特征信息。
6.根据权利要求1所述的方法,其特征在于,将所述优选召回结果调整至其他召回结果之前,包括:
若所述优选召回结果的数量为多个,则按照点击时间对多个优选召回结果进行排序,
将排序后的所述多个优选召回结果调整至其他召回结果之前。
7.一种搜索结果的排序装置,其特征在于,包括:
归一化处理模块,用于获取用户输入的查询语句,并对所述查询语句进行归一化处理;
召回结果获取模块,用于根据归一化后的查询语句进行搜索,获得召回结果;
历史点击数据获取模块,用于获取所述召回结果的特征信息以及所述用户针对所述查询语句的历史点击数据;其中,所述特征信息包括召回结果的更新时间以及与所述查询语句的文本匹配度;
召回结果排序模块,用于根据所述特征信息和所述历史点击数据对所述召回结果进行排序;
其中,所述召回结果排序模块,还用于:
对更新时间和文本匹配进行加权求和,获得召回结果的权重值;
根据权重值对召回结果进行初始排序;
获取与历史点击数据中的点击结果的身份识别码相匹配的召回结果,确定为优选召回结果;
将优选召回结果调整至其他召回结果之前。
8.一种电子设备,其特征在于,所述电子设备包括:
一个或多个处理装置;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理装置执行,使得所述一个或多个处理装置实现如权利要求1-6中任一所述的搜索结果的排序方法。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现如权利要求1-6中任一所述的搜索结果的排序方法。
CN201910357684.3A 2019-04-29 2019-04-29 搜索结果的排序方法、装置、设备及存储介质 Active CN110096655B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910357684.3A CN110096655B (zh) 2019-04-29 2019-04-29 搜索结果的排序方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910357684.3A CN110096655B (zh) 2019-04-29 2019-04-29 搜索结果的排序方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN110096655A CN110096655A (zh) 2019-08-06
CN110096655B true CN110096655B (zh) 2021-04-09

Family

ID=67446569

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910357684.3A Active CN110096655B (zh) 2019-04-29 2019-04-29 搜索结果的排序方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN110096655B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619093B (zh) * 2019-09-02 2022-10-18 北京字节跳动网络技术有限公司 确定搜索项目的顺序的方法、装置、电子设备和计算机可读存储介质
CN110717008B (zh) * 2019-09-17 2023-10-10 平安科技(深圳)有限公司 基于语意识别的搜索结果排序方法及相关装置
CN111581545B (zh) * 2020-05-12 2023-09-19 腾讯科技(深圳)有限公司 一种召回文档的排序方法及相关设备
CN111694929B (zh) * 2020-05-29 2023-04-07 平安科技(深圳)有限公司 基于数据图谱的搜索方法、智能终端和可读存储介质
CN111966899B (zh) * 2020-08-12 2024-02-13 新华智云科技有限公司 搜索排序方法、系统及计算机可读存储介质
CN112749238A (zh) * 2020-12-30 2021-05-04 北京金堤征信服务有限公司 搜索排序方法、装置、电子设备以及计算机可读存储介质
CN113094604B (zh) * 2021-04-15 2022-05-03 支付宝(杭州)信息技术有限公司 搜索结果排序方法、搜索方法及装置
CN113468347A (zh) * 2021-07-26 2021-10-01 北京明略软件系统有限公司 用于数据召回的方法及装置、电子设备、可读存储介质
CN113641721B (zh) * 2021-10-13 2022-03-04 中航信移动科技有限公司 一种机票展示方法、装置、电子设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033386A (zh) * 2018-07-27 2018-12-18 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN109063108A (zh) * 2018-07-27 2018-12-21 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN109086394A (zh) * 2018-07-27 2018-12-25 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120109981A1 (en) * 2010-10-28 2012-05-03 Goetz Graefe Generating progressive query results
US8996495B2 (en) * 2011-02-15 2015-03-31 Ebay Inc. Method and system for ranking search results based on category demand normalized using impressions
CN102890683B (zh) * 2011-07-21 2016-01-20 阿里巴巴集团控股有限公司 信息提供方法及装置
US20180260481A1 (en) * 2018-04-01 2018-09-13 Yogesh Rathod Displaying search result associated identified or extracted unique identity associated structured contents or structured website

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033386A (zh) * 2018-07-27 2018-12-18 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN109063108A (zh) * 2018-07-27 2018-12-21 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质
CN109086394A (zh) * 2018-07-27 2018-12-25 天津字节跳动科技有限公司 搜索排序方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN110096655A (zh) 2019-08-06

Similar Documents

Publication Publication Date Title
CN110096655B (zh) 搜索结果的排序方法、装置、设备及存储介质
US10210243B2 (en) Method and system for enhanced query term suggestion
CN106202394B (zh) 文本资讯的推荐方法及系统
US9081812B2 (en) System and method for information identification using tracked preferences of a user
CN110619076B (zh) 一种搜索词推荐方法、装置、计算机及存储介质
CN108171576B (zh) 订单处理方法、装置、电子设备及计算机可读存储介质
CN112988753B (zh) 一种数据搜索方法和装置
CN114861889B (zh) 深度学习模型的训练方法、目标对象检测方法和装置
CN109558600B (zh) 翻译处理方法及装置
CN114840671A (zh) 对话生成方法、模型的训练方法、装置、设备及介质
CN113657113A (zh) 文本处理方法、装置和电子设备
CN110083677B (zh) 联系人的搜索方法、装置、设备及存储介质
CN111435406A (zh) 一种纠正数据库语句拼写错误的方法和装置
CN111078849B (zh) 用于输出信息的方法和装置
CN111428011B (zh) 词语的推荐方法、装置、设备及存储介质
CN111708911B (zh) 搜索方法、装置、电子设备及计算机可读存储介质
CN110750994A (zh) 一种实体关系抽取方法、装置、电子设备及存储介质
CN111737571B (zh) 搜索方法、装置和电子设备
CN111382365B (zh) 用于输出信息的方法和装置
CN111339790B (zh) 文本翻译方法、装置、设备及计算机可读存储介质
CN111737572B (zh) 搜索语句生成方法、装置和电子设备
CN112148751A (zh) 用于查询数据的方法和装置
CN113515687A (zh) 物流信息的获取方法和装置
CN111460971A (zh) 视频概念检测方法、装置以及电子设备
CN115204124A (zh) 词语例句生成方法、装置和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant