CN111143695A - 一种搜索方法、装置、服务器及存储介质 - Google Patents

一种搜索方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN111143695A
CN111143695A CN201911425165.2A CN201911425165A CN111143695A CN 111143695 A CN111143695 A CN 111143695A CN 201911425165 A CN201911425165 A CN 201911425165A CN 111143695 A CN111143695 A CN 111143695A
Authority
CN
China
Prior art keywords
search
behavior data
historical
feature vector
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911425165.2A
Other languages
English (en)
Inventor
缪畅宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201911425165.2A priority Critical patent/CN111143695A/zh
Publication of CN111143695A publication Critical patent/CN111143695A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/635Filtering based on additional data, e.g. user or group profiles

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种搜索方法、装置、服务器及可读存储介质,该方法包括:获取用户当前提交的第一搜索关键字和第一搜索关键字对应的第一目标特征向量;获取用户在预设第一时长内的至少一个历史搜索行为数据和至少一个历史搜索行为数据对应的第二目标特征向量,至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;根据第一目标特征向量和第二目标特征向量,确定第一搜索关键字对应的搜索结果列表,搜索结果列表中目标搜索结果对应的排序优先级最高,目标搜索结果与历史搜索关键字和/或用户对搜索结果做出的行为数据相关。通过这种方式可以优化搜索结果,提高搜索效率和准确性。

Description

一种搜索方法、装置、服务器及存储介质
技术领域
本申请涉及计算机技术领域,尤其涉及一种搜索方法、装置、服务器及存储介质。
背景技术
现有的搜索方法主要是基于用户输入的关键字进行搜索,以得到与关键字对应的搜索结果列表。然而这种方式得到的搜索结果列表中各个搜索结果的排序仅根据关键字确定,存在一定的局限性,从而影响了搜索效率。因此,如何提高搜索效率成为研究的热点。
发明内容
本发明实施例提供了一种搜索方法、装置、服务器及存储介质,可以将搜索关键字和历史搜索行为数据相结合来确定搜索结果列表,优化了搜索结果,提高了搜索效率和准确性。
第一方面,本发明实施例提供了一种搜索方法,包括:
获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
第二方面,本发明实施例提供了一种搜索装置,包括:
第一获取模块,用于获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
第二获取模块,用于获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
确定模块,用于根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
第三方面,本发明实施例提供了一种服务器,所述服务器包括:处理器和存储器,所述处理器用于执行:
获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
第四方面,本发明实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有程序指令,该程序指令被执行时,用于实现上述第一方面所述的方法。
本发明实施例可以获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;并获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;从而根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。通过这种实施方式,可以将搜索关键字和历史搜索行为数据相结合来确定搜索结果列表,优化了搜索结果,提高了搜索效率和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种搜索系统的结构示意图;
图2是本发明实施例提供的一种搜索方法的流程示意图;
图3是本发明实施例提供的一种获取搜索结果列表的示意图;
图4是本发明实施例提供的一种搜索装置的结构示意图;
图5是本发明实施例提供的一种服务器的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
用户的搜索行为往往具有一定的连贯性,比如在音乐搜索的场景下,用户先搜索“周杰伦”,在搜索结果中点击了某一首歌曲,在听歌的时候,想起了周杰伦的另一首歌曲“稻香”,也想听一听,于是搜索“稻香”并点击播放,用户的这些搜索行为均相关联,具有一定的连贯性;或者用户搜索『睡前听的歌』,找到一系列歌曲,点了其中一首,感觉很不错,想看看这个歌手的其他歌曲是不是也是很适合睡前听,于是搜索了这个歌手。用户的每一次搜索行为与历史搜索行为关联且具有一定的连贯性,用户的每一次搜索行为都可能影响下一次的搜索。
因此本发明实施例提供了一种搜索方法,通过将用户当前提交的搜索关键字和一段时间内的历史搜索行为数据相结合来确定搜索结果列表,其中,所述搜索结果列表中包括一个或多个搜索结果,所述搜索结果列表中搜索结果的排序是根据当前提交的搜索关键字和一段时间内的历史搜索行为数据相结合来确定的。通过本发明实施例的搜索方法,优化了搜索结果,提高了搜索效率和准确性。
例如,在音乐搜索的场景下,假设用户当前提交的搜索关键字为“稻香”,如果在当前提交搜索关键字之前的一段时间内用户提交了搜索关键字“张三”和/或点击了“张三”的一首歌曲,则可以根据用户当前提交的搜索关键字“稻香”以及在当前提交搜索关键字之前的一段时间内用户提交的搜索关键字“张三”以及点击了“张三”的一首歌曲的这一历史搜索行为数据,确定出“张三”的歌曲中歌词包括“稻香”的歌曲为“稻花香”,并确定出其他歌手的歌词包括“稻香”的歌曲“稻田”,从而可以确定从“张三”的歌曲中确定出的歌词包括“稻香”的歌曲在搜索结果列表中的排序优先级最高,并确定其他歌手包括“稻香”的歌曲在搜索结果列表中的排序优先级在从“张三”的歌曲中确定出的歌词包括“稻香”的歌曲的优先级之后,即确定出搜索结果列表中搜索结果的排列顺序依次为:“稻花香”、“稻田”。
本发明实施例中提供的搜索方法可以应用于一种搜索装置,在某些实施例中,搜索装置可以设置在服务器上;在某些实施例中,所述搜索装置还可以在空间上独立于服务器,如所述搜索装置可以设置在智能手机、平板电脑、笔记本电脑、台式电脑、车载智能终端、智能手表等智能终端设备上。在某些实施例中,所述搜索装置可以和服务器建立通信连接。
下面结合附图对本发明实施例提供的搜索系统进行示意性说明。
请参见图1,图1是本发明实施例提供的一种搜索系统的结构示意图。所述搜索系统包括:搜索装置11和服务器12。在某些实施例中,搜索装置11和服务器12可以通过无线通信连接方式建立通信连接;其中,在某些场景下,搜索装置11和服务器12之间也可以通过有线通信连接方式建立通信连接。在某些实施例中,所述搜索装置11可以设置于服务器12上。
在一个实施例中,搜索装置11可以获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;并获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;以及根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。通过这种实施方式,可以优化搜索结果,提高搜索效率和准确性。
下面结合附图对本发明实施例提供的搜索方法进行示意性说明。
具体请参见图2,图2是本发明实施例提供的一种搜索方法的流程示意图,本发明实施例的搜索方法可以由搜索装置执行,其中,所述搜索装置的具体解释如前所述。具体地,本发明实施例的所述方法包括如下步骤。
S201:获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量。
本发明实施例中,服务器可以获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量。在某些实施例中,所述第一关键字携带了所述用户的属性、当前时间、设备等与用户相关的特征信息。
在一个实施例中,所述服务器在获取用户当前提交的第一搜索关键字对应的第一目标特征向量时,可以获取用户当前提交的第一搜索关键字对应的特征向量,并对所述第一搜索关键字对应的特征向量进行编码,得到所述第一搜索关键字对应的第一目标特征向量。在某些实施例中,所述第一搜索关键字包括但不限于文字、字母、数字等字符。
例如,服务器可以获取用户当前提交的第一搜索关键字x对应的特征向量y,并对所述第一搜索关键字对应的特征向量y进行编码,得到所述第一搜索关键字对应的第一目标特征向量h’。
通过获取第一搜索关键字的第一目标特征向量有助于后续根据第一目标特征向量对第一训练模型进行训练得到候选结果列表。
在一个实施例中,服务器在获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量之前,可以对第二排序模型进行训练。
在一个实施例中,在对第二排序模型进行训练时,可以获取所述用户在第一时刻提交的第二搜索关键字和所述第二搜索关键字对应的第三目标特征向量,并将所述第三目标特征向量输入第一排序模型,得到所述第二搜索关键字对应的搜索结果列表,以及获取所述用户对所述搜索结果列表包括的搜索结果做出的行为数据,从而根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本,并利用所述训练样本对第二排序模型进行训练。在某些实施例中,所述第一时刻是当前时刻之前的某一个时刻。例如,假设当前时刻为10点,服务器可以获取用户在当前时刻10点之前的9点40分提交的第二搜索关键字和所述第二搜索关键字对应的第三目标特征向量。
在某些实施例中,所述第一排序模型可以包括但不限于pairwise的模型、listwise的模型等,在某些实施例中,所述pairwise的模型是通过比较两两之间的先后顺序进行排序,在某些实施例中,所述listwise的模型是通过优化整个搜索列表进行排序。
在一个实施例中,服务器在根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本时,可以获取所述用户在预设第二时长内提交的第三搜索关键字和所述第三搜索关键字对应的第四目标特征向量,并将所述第三目标特征向量和所述第四目标特征向量添加到特征向量集合中,以及利用所述用户对所述搜索结果列表包括的搜索结果做出的行为数据,对所述第二搜索关键字对应的搜索结果列表包括的搜索结果进行重新排序,从而根据所述特征向量集合和重新排序后的所述第二搜索关键字对应的搜索结果列表生成训练样本。
在某些实施例中,所述预设第二时长是在所述第一时刻之前的某个时间段。例如,假设当前时刻为10点,第一时刻为9点40分,服务器可以获取所述用户在9点40分之前的10分钟内(即预设第二时长内)提交的第三搜索关键字和所述第三搜索关键字对应的第四目标特征向量。
在一个示例中,假设服务器获取到用户在ti时刻提交的第二搜索关键字对应的第三目标特征向量为X={t1,t2,…},将所述第三目标特征向量输入第一排序模型,得到所述第二搜索关键字对应的搜索结果列表为Y={y1,y2,y3},假设获取到的所述用户对所述搜索结果列表包括的搜索结果做出的行为数据为点击y2,则可以对所述第二搜索关键字对应的搜索结果列表包括的搜索结果进行重新排序得到Y={y2,y1,y3},从而根据所述特征向量集合X={t1,t2,…}和重新排序后的所述第二搜索关键字对应的搜索结果列表Y={y2,y1,y3}生成训练样本{X={t1,t2,…},Y={y2,y1,y3}}。当用户点击了y2后,用户在ti时刻就有了搜索结果和行为数据,如果用户在下一阶段又发生了点击行为,则可以将ti加入到X里,然后类似的,根据第一排序模型训练得到的搜索结果和用户的行为数据(如用户实际点击的物品)构建新的Y,从而产生一个新的训练样本{X,Y}。
在一个实施例中,如果用户在某一时刻的行为数据距离上一时刻的行为数据超过了预设第二时长,则需要重新构建特征向量集合X,而不是将该时刻的行为数据加到之前的X里。
通过对第二排序模型进行训练,有助于在获取到用户当前提交的第一搜索关键字之后,将获取到的预设第一时长的历史搜索行为数据的第二目标特征向量和第一搜索关键字对应的第一目标特征向量输入训练好的第二排序模型进行训练,从而得到搜索结果列表,实现了对候选结构列表的优化。
S202:获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量。
本发明实施例中,服务器可以获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量。在某些实施例中,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;在一个示例中,所述行为数据可以为用户对搜索结果做出的选取操作,在某些实施例中,所述选取操作包括但不限于点击操作。
在一个实施例中,服务器在获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量时,可以获取所述用户在预设第一时长内的至少一个历史搜索行为数据,并获取所述至少一个历史搜索行为数据中的每一个历史搜索行为数据对应的历史特征向量,以及对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量。
在一个实施例中,若在所述预设第一时长内不存在所述用户的历史搜索行为数据,则可以将所述指定长度的第二目标特征向量设置为全零向量。
在一个实施例中,服务器在对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量时,可以根据神经网络编码模型对所述每一个历史搜索行为数据对应的历史特征向量进行编码,以将所述每一个历史搜索行为数据对应的历史特征向量编码到一个指定长度的第二目标特征向量上。在某些实施例中,所述神经网络编码模型包括但不限于循环神经网络(Recurrent Neural Network,RNN)编码模型。
例如,假设用户在当前时刻t输入了一个第一搜索关键字,则可以获取用户在t之前的预设第一时长内比如1小时之内,有没有发生搜索点击行为,如果有发生搜索点击行为,则可以获取在t之前的1个小时内的至少一个历史搜索行为数据,并获取所述至少一个历史搜索行为数据对应的历史特征向量,以及将至少一个历史搜索行为数据对应的历史特征向量输入到神经网络编码模型中进行编码,得到指定长度的第二目标特征向量,如果没有发生搜索点击行为,则将第二目标特征向量用全0向量表示。
S203:根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表。
本发明实施例中,服务器可以根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
例如,在音乐搜索的场景下,假设用户当前提交的搜索关键字为“草原”,如果在当前提交搜索关键字之前的一段时间内用户提交了搜索关键字“睡前听的歌”和/或点击了“睡前听的歌”的搜索结果中的一首歌曲,则可以根据用户当前提交的搜索关键字“草原”对应的第一目标特征向量,以及在当前提交搜索关键字之前的一段时间内用户提交的搜索关键字“睡前听的歌”以及点击了“睡前听的歌”的搜索结果中的一首歌曲的这一历史搜索行为数据对应的第二目标特征向量,从“睡前听的歌”的歌曲中确定出歌词包括“草原”的歌曲“草原的静谧”,并确定出其他歌词包括“草原”的歌曲“草原的歌”,从而可以确定从“睡前听的歌”的歌曲中确定出的歌词包括“草原”的歌曲在搜索结果列表中的排序优先级最高,以及确定出的其他歌词包括“草原”的歌曲在搜索结果列表中的排序优先级在从“睡前听的歌”的歌曲中确定出的歌词包括“草原”的歌曲之后,即搜索列表中搜索结果的排列顺序为:草原的静谧”、“草原的歌”。
在一个实施例中,服务器在根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表时,可以将所述第一目标特征向量输入第一排序模型,得到与所述第一搜索关键字对应的候选结果列表,并将所述第一目标特征向量、所述第二目标特征向量和所述候选结果列表输入第二排序模型,得到与所述第一搜索关键字对应的搜索结果列表。例如,在音乐搜索引擎里,搜索结果列表展现出来的是歌曲,在网页搜索引擎里,搜索结果列表展现出来的是网页。
具体可以图3为例进行说明,图3是本发明实施例提供的一种获取搜索结果列表的示意图,如图3所示,假设用户在当前时刻t输入了一个第一搜索关键字,则可以获取对所述第一搜索关键字进行编码得到第一目标特征向量h’31,并获取用户在t之前的预设第一时长内比如1小时之内的至少一个历史搜索行为数据,以及获取所述至少一个历史搜索行为数据对应的历史特征向量32,接着将至少一个历史搜索行为数据对应的历史特征向量32输入到神经网络编码模型33中进行编码,得到指定长度的第二目标特征向量h34。然后将第一目标特征向量h’31,输入到第一排序模型35里,得到候选结果列表36,然后,根据候选结果列表36,将h’和h一起输入到已经训练好的第二排序模型37里进行训练,得到搜索结果列表38。
可见,通过将用户当前输入的第一搜索关键字和用户在当前时刻之前的预设第一时长内的历史搜索行为数据相结合,考虑了用户的历史行为数据对搜索结果的影响,可以对单纯通过第一排序模型得到的候选结果列表进行进一步地优化,提高了搜索排序的有效性。
在一个实施例中,服务器在根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表之后,可以获取用户对搜索结果列表中搜索结果包括的用户对搜索结果做出的行为数据,并根据用户对搜索结果列表中搜索结果包括的搜索结果做出的行为数据对第二训练模型进行训练。以此类推,每当获取到新的搜索结果列表时,都可以根据用户对新的搜索结果列表中搜索结果包括的搜索结果做出的行为数据对第二训练模型进行训练,具体训练过程的实施方式如前所述,此处不再赘述。
在一个实施例中,服务器在根据用户对新的搜索结果列表中搜索结果包括的搜索结果做出的行为数据对第二训练模型进行训练时,可以在训练成熟后的一段时间内不再训练。在某些实施例中,服务器可以根据训练次数是否满足预设次数阈值来确定第二训练模型是否训练成熟,如训练次数大于预设次数阈值时确定训练成熟。在其他实施例中,服务器可以根据其他方式确定第二训练模型是否训练成熟,此处不做具体限定。
在一个实施例中,服务器也可以根据用户对新的搜索结果列表中搜索结果包括的搜索结果做出的行为数据对第二训练模型进行不停的训练。
在一个实施例中,服务器可以获取用户反馈的对搜索结果列表中搜索结果的满意度,并根据用户反馈的对搜索结果列表中搜索结果的满意度确定是否继续训练,如当获取到用户反馈的对搜索结果列表中搜索结果的满意度大于预设满意度阈值时,可以确定停止对第二训练模型进行训练。
本发明实施例可以获取用户当前提交的第一搜索关键字和第一搜索关键字对应的第一目标特征向量,并获取用户在预设第一时长内的至少一个历史搜索行为数据和至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据,从而根据第一目标特征向量和第二目标特征向量,确定第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。通过这种实施方式,可以优化搜索结果,提高搜索效率和有效性。
请参见图4,图4是本发明实施例提供的一种搜索装置的结构示意图。具体的,所述装置设置于服务器中,所述装置包括:第一获取模块401、第二获取模块402、确定模块403;
第一获取模块401,用于获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
第二获取模块402,用于获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
确定模块403,用于根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
进一步地,所述第二获取模块402获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量时,具体用于:
获取所述用户在预设第一时长内的至少一个历史搜索行为数据;
获取所述至少一个历史搜索行为数据中的每一个历史搜索行为数据对应的历史特征向量;
对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量。
进一步地,所述确定模块403根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表时,具体用于:
将所述第一目标特征向量输入第一排序模型,得到与所述第一搜索关键字对应的候选结果列表;
将所述第一目标特征向量、所述第二目标特征向量和所述候选结果列表输入第二排序模型,得到与所述第一搜索关键字对应的搜索结果列表。
进一步地,所述第二获取模块402对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量时,具体用于:
根据神经网络编码模型对所述每一个历史搜索行为数据对应的历史特征向量进行编码,以将所述每一个历史搜索行为数据对应的历史特征向量编码到一个指定长度的第二目标特征向量上。
进一步地,所述第二获取模块402还用于:
若在所述预设第一时长内不存在所述用户的历史搜索行为数据,则将所述指定长度的第二目标特征向量设置为全零向量。
进一步地,所述第一获取模块401获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量之前,还用于:
获取所述用户在第一时刻提交的第二搜索关键字和所述第二搜索关键字对应的第三目标特征向量;
将所述第三目标特征向量输入第一排序模型,得到所述第二搜索关键字对应的搜索结果列表;
获取所述用户对所述搜索结果列表包括的搜索结果做出的行为数据;
根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本,并利用所述训练样本对第二排序模型进行训练。
进一步地,所述第一获取模块401根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本时,具体用于:
获取所述用户在预设第二时长内提交的第三搜索关键字和所述第三搜索关键字对应的第四目标特征向量;
将所述第三目标特征向量和所述第四目标特征向量添加到特征向量集合中;
利用所述用户对所述搜索结果列表包括的搜索结果做出的行为数据,对所述第二搜索关键字对应的搜索结果列表包括的搜索结果进行重新排序;
根据所述特征向量集合和重新排序后的所述第二搜索关键字对应的搜索结果列表生成训练样本。
本发明实施例可以获取用户当前提交的第一搜索关键字和第一搜索关键字对应的第一目标特征向量,并获取用户在预设第一时长内的至少一个历史搜索行为数据和至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据,从而根据第一目标特征向量和第二目标特征向量,确定第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。通过这种实施方式,可以优化搜索结果,提高搜索效率和有效性。
请参见图5,图5是本发明实施例提供的一种服务器的结构示意图。具体的,所述服务器包括:存储器501、处理器502。
在一种实施例中,所述服务器还包括数据接口503,所述数据接口503,用于传递服务器和其他设备之间的数据信息。
所述存储器501可以包括易失性存储器(volatile memory);存储器501也可以包括非易失性存储器(non-volatile memory);存储器501还可以包括上述种类的存储器的组合。所述处理器502可以是中央处理器(central processing unit,CPU)。所述处理器502还可以进一步包括硬件芯片。上述硬件芯片可以是专用集成电路(application-specificintegrated circuit,ASIC),可编程逻辑器件(programmable logic device,PLD)或其组合。上述PLD可以是复杂可编程逻辑器件(complex programmable logic device,CPLD),现场可编程逻辑门阵列(field-programmable gate array,FPGA)或其任意组合。
所述存储器501用于存储程序,所述处理器502可以调用存储501中存储的程序,用于执行如下步骤:
获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
进一步地,所述处理器502获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量时,具体用于:
获取所述用户在预设第一时长内的至少一个历史搜索行为数据;
获取所述至少一个历史搜索行为数据中的每一个历史搜索行为数据对应的历史特征向量;
对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量。
进一步地,所述处理器502根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表时,具体用于:
将所述第一目标特征向量输入第一排序模型,得到与所述第一搜索关键字对应的候选结果列表;
将所述第一目标特征向量、所述第二目标特征向量和所述候选结果列表输入第二排序模型,得到与所述第一搜索关键字对应的搜索结果列表。
进一步地,所述处理器502对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量时,具体用于:
根据神经网络编码模型对所述每一个历史搜索行为数据对应的历史特征向量进行编码,以将所述每一个历史搜索行为数据对应的历史特征向量编码到一个指定长度的第二目标特征向量上。
进一步地,所述处理器502还用于:
若在所述预设第一时长内不存在所述用户的历史搜索行为数据,则将所述指定长度的第二目标特征向量设置为全零向量。
进一步地,所述处理器502获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量之前,还用于:
获取所述用户在第一时刻提交的第二搜索关键字和所述第二搜索关键字对应的第三目标特征向量;
将所述第三目标特征向量输入第一排序模型,得到所述第二搜索关键字对应的搜索结果列表;
获取所述用户对所述搜索结果列表包括的搜索结果做出的行为数据;
根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本,并利用所述训练样本对第二排序模型进行训练。
进一步地,所述处理器502根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本时,具体用于:
获取所述用户在预设第二时长内提交的第三搜索关键字和所述第三搜索关键字对应的第四目标特征向量;
将所述第三目标特征向量和所述第四目标特征向量添加到特征向量集合中;
利用所述用户对所述搜索结果列表包括的搜索结果做出的行为数据,对所述第二搜索关键字对应的搜索结果列表包括的搜索结果进行重新排序;
根据所述特征向量集合和重新排序后的所述第二搜索关键字对应的搜索结果列表生成训练样本。
本发明实施例可以获取用户当前提交的第一搜索关键字和第一搜索关键字对应的第一目标特征向量,并获取用户在预设第一时长内的至少一个历史搜索行为数据和至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据,从而根据第一目标特征向量和第二目标特征向量,确定第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。通过这种实施方式,可以优化搜索结果,提高搜索效率和有效性。
本发明的实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现本发明图2所对应实施例中描述的方法,也可实现图4所述本发明所对应实施例的装置,在此不再赘述。
所述计算机可读存储介质可以是前述任一实施例所述的设备的内部存储单元,例如设备的硬盘或内存。所述计算机可读存储介质也可以是所述设备的外部存储设备,例如所述设备上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(SecureDigital,SD)卡,闪存卡(Flash Card)等。进一步地,所述计算机可读存储介质还可以既包括所述设备的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述服务器所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所揭露的仅为本发明的部分实施例而已,当然不能以此来限定本发明之权利范围,本领域普通技术人员可以理解实现上述实施例的全部或部分流程,并依本发明权利要求所作的等同变化,仍属于发明所涵盖的范围。

Claims (10)

1.一种搜索方法,其特征在于,包括:
获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
2.根据权利要求1所述的方法,其特征在于,所述获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,包括:
获取所述用户在预设第一时长内的至少一个历史搜索行为数据;
获取所述至少一个历史搜索行为数据中的每一个历史搜索行为数据对应的历史特征向量;
对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,包括:
将所述第一目标特征向量输入第一排序模型,得到与所述第一搜索关键字对应的候选结果列表;
将所述第一目标特征向量、所述第二目标特征向量和所述候选结果列表输入第二排序模型,得到与所述第一搜索关键字对应的搜索结果列表。
4.根据权利要求2所述的方法,其特征在于,所述对所述每一个历史搜索行为数据对应的历史特征向量进行编码,得到一个指定长度的第二目标特征向量,包括:
根据神经网络编码模型对所述每一个历史搜索行为数据对应的历史特征向量进行编码,以将所述每一个历史搜索行为数据对应的历史特征向量编码到一个指定长度的第二目标特征向量上。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
若在所述预设第一时长内不存在所述用户的历史搜索行为数据,则将所述指定长度的第二目标特征向量设置为全零向量。
6.根据权利要求1所述的方法,其特征在于,所述获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量之前,还包括:
获取所述用户在第一时刻提交的第二搜索关键字和所述第二搜索关键字对应的第三目标特征向量;
将所述第三目标特征向量输入第一排序模型,得到所述第二搜索关键字对应的搜索结果列表;
获取所述用户对所述搜索结果列表包括的搜索结果做出的行为数据;
根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本,并利用所述训练样本对第二排序模型进行训练。
7.根据权利要求6所述的方法,其特征在于,所述根据所述第三目标特征向量、所述搜索结果列表和所述用户对所述搜索结果列表包括的搜索结果做出的行为数据生成训练样本,包括:
获取所述用户在预设第二时长内提交的第三搜索关键字和所述第三搜索关键字对应的第四目标特征向量;
将所述第三目标特征向量和所述第四目标特征向量添加到特征向量集合中;
利用所述用户对所述搜索结果列表包括的搜索结果做出的行为数据,对所述第二搜索关键字对应的搜索结果列表包括的搜索结果进行重新排序;
根据所述特征向量集合和重新排序后的所述第二搜索关键字对应的搜索结果列表生成训练样本。
8.一种搜索装置,其特征在于,包括:
第一获取模块,用于获取用户当前提交的第一搜索关键字和所述第一搜索关键字对应的第一目标特征向量;
第二获取模块,用于获取所述用户在预设第一时长内的至少一个历史搜索行为数据和所述至少一个历史搜索行为数据对应的第二目标特征向量,所述至少一个历史搜索行为数据中的每一个历史搜索行为数据包括历史搜索关键字和/或所述用户对搜索结果做出的行为数据;
确定模块,用于根据所述第一目标特征向量和所述第二目标特征向量,确定所述第一搜索关键字对应的搜索结果列表,所述搜索结果列表中目标搜索结果对应的排序优先级最高,所述目标搜索结果与所述历史搜索关键字和/或所述用户对搜索结果做出的行为数据相关。
9.一种服务器,其特征在于,包括:处理器和存储器,所述处理器和存储装置相互连接,其中,所述存储装置用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,该计算机可读存储介质中存储有程序指令,该程序指令被执行时,用于实现如权利要求1-7任一项所述的方法。
CN201911425165.2A 2019-12-31 2019-12-31 一种搜索方法、装置、服务器及存储介质 Pending CN111143695A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911425165.2A CN111143695A (zh) 2019-12-31 2019-12-31 一种搜索方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911425165.2A CN111143695A (zh) 2019-12-31 2019-12-31 一种搜索方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN111143695A true CN111143695A (zh) 2020-05-12

Family

ID=70523172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911425165.2A Pending CN111143695A (zh) 2019-12-31 2019-12-31 一种搜索方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN111143695A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312523A (zh) * 2021-07-30 2021-08-27 北京达佳互联信息技术有限公司 字典生成、搜索关键字推荐方法、装置和服务器
WO2023138428A1 (zh) * 2022-01-19 2023-07-27 中兴通讯股份有限公司 搜索结果排序方法、搜索系统、计算机可读存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207962A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种动态搜索引擎及方法
US20130117285A1 (en) * 2011-11-09 2013-05-09 Nec Corporation Search support apparatus, search support method, and search support program
CN106484766A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN110222260A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种搜索方法、装置及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102207962A (zh) * 2011-05-25 2011-10-05 盛乐信息技术(上海)有限公司 一种动态搜索引擎及方法
US20130117285A1 (en) * 2011-11-09 2013-05-09 Nec Corporation Search support apparatus, search support method, and search support program
CN106484766A (zh) * 2016-09-07 2017-03-08 北京百度网讯科技有限公司 基于人工智能的搜索方法和装置
CN110222260A (zh) * 2019-05-21 2019-09-10 深圳壹账通智能科技有限公司 一种搜索方法、装置及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113312523A (zh) * 2021-07-30 2021-08-27 北京达佳互联信息技术有限公司 字典生成、搜索关键字推荐方法、装置和服务器
WO2023138428A1 (zh) * 2022-01-19 2023-07-27 中兴通讯股份有限公司 搜索结果排序方法、搜索系统、计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN107797984B (zh) 智能交互方法、设备及存储介质
US11294891B2 (en) Interactive search experience using machine learning
JP5736469B2 (ja) ユーザ意図の有無に基づく検索キーワードの推薦
US20210049458A1 (en) Processing sequential interaction data
CN108763502A (zh) 信息推荐方法和系统
US9864951B1 (en) Randomized latent feature learning
US20190102397A1 (en) Methods and systems for client side search ranking improvements
CN111143178B (zh) 用户行为分析方法、装置及设备
WO2014148948A1 (ru) Способ отбора эффективных вариантов в поисковых и рекомендательных системах (варианты)
CN109726664B (zh) 一种智能表盘推荐方法、系统、设备及存储介质
CN107122469A (zh) 基于语义相似度与时效性频率的查询推荐排序方法与装置
CN108319628B (zh) 一种用户兴趣确定方法及装置
CN111143695A (zh) 一种搜索方法、装置、服务器及存储介质
JP7200069B2 (ja) 情報処理装置、ベクトル生成方法及びプログラム
CN113704620A (zh) 基于人工智能的用户标签更新方法、装置、设备及介质
US20230229896A1 (en) Method and computing device for determining optimal parameter
CN110827078B (zh) 一种信息推荐方法、装置、设备及存储介质
JP7144558B2 (ja) 検索システム、および検索方法
CN113407702B (zh) 员工合作关系强度量化方法、系统、计算机和存储介质
CN115471271A (zh) 广告的归因方法、装置、计算机设备及可读存储介质
CN115511512A (zh) 信息获取方法、装置、设备及存储介质
CN114154051A (zh) 信息推荐方法、装置、设备及存储介质
CN113676505B (zh) 信息推送方法、装置、计算机设备和存储介质
CN116561735B (zh) 一种基于多认证源的互信认证方法、系统及电子设备
Sun et al. Allies: Prompting Large Language Model with Beam Search

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination