CN117875314A - 搜索联想词展示方法、计算机设备和计算机可读存储介质 - Google Patents
搜索联想词展示方法、计算机设备和计算机可读存储介质 Download PDFInfo
- Publication number
- CN117875314A CN117875314A CN202311563322.2A CN202311563322A CN117875314A CN 117875314 A CN117875314 A CN 117875314A CN 202311563322 A CN202311563322 A CN 202311563322A CN 117875314 A CN117875314 A CN 117875314A
- Authority
- CN
- China
- Prior art keywords
- association
- search
- word
- words
- similarity
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 230000003993 interaction Effects 0.000 claims abstract description 57
- 239000013598 vector Substances 0.000 claims description 62
- 230000006399 behavior Effects 0.000 claims description 45
- 238000000605 extraction Methods 0.000 claims description 36
- 238000012545 processing Methods 0.000 claims description 33
- 238000004590 computer program Methods 0.000 claims description 22
- 230000004927 fusion Effects 0.000 claims description 17
- 239000007787 solid Substances 0.000 claims description 2
- 230000008569 process Effects 0.000 description 8
- 230000002452 interceptive effect Effects 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
Abstract
本申请涉及一种搜索联想词展示方法、计算机设备。所述方法包括:响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;根据各候选搜索联想词的音乐搜索意图信息,确定不同候选搜索联想词之间的音乐搜索意图相似程度;根据各候选搜索联想词的搜索后交互信息,确定不同候选搜索联想词之间的音乐搜索结果相似程度;采用不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为音乐搜索词对应的搜索联想结果进行展示。采用本方法能够有效对音乐领域搜索联想词多样性去重。
Description
技术领域
本申请涉及互联网技术领域,特别是涉及一种搜索联想词展示方法、计算机设备和计算机可读存储介质。
背景技术
随着互联网下数字音乐和移动音乐的快速发展,越来越多新兴音乐人可以通过音乐平台、音乐应用等获得知名度,因此,会存在较多歌曲名或歌手名相同的音乐。
在音乐领域的搜索场景下,当用户输入部分字段时,希望通过搜索联想词为用户提供其想要的音乐搜索结果,以降低用户的输入难度。相关技术中,所提供给用户的输入提示词过于单一,相同类似的词条容易导致用户的点击意愿低,无法很好满足用户的音乐搜索需求。
发明内容
基于此,有必要针对上述技术问题,提供一种能够实现联想词多样性去重的搜索联想词展示方法、计算机设备和计算机可读存储介质。
第一方面,本申请提供了一种搜索联想词展示方法。所述方法包括:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
在其中一个实施例中,所述音乐搜索意图信息包括意图信息和实体信息,所述根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度,包括:
获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词;
根据所述第一联想词的意图信息和所述第二联想词的意图信息,确定意图相似程度,以及根据所述第一联想词的实体信息和所述第二联想词的实体信息,确定实体相似程度;
基于所述意图相似程度和所述实体相似程度,得到所述第一联想词和所述第二联想词之间的音乐搜索意图相似程度。
在其中一个实施例中,在所述获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词的步骤之后,所述方法还包括:
确定所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果;所述槽位提取结果用于表征对应的联想词中各实体词及其实体类型;
采用意图模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的意图信息和所述第二联想词的意图信息;
采用实体模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的实体信息和所述第二联想词的实体信息。
在其中一个实施例中,所述确定意图相似程度,包括:获取所述意图模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的意图相似程度;
所述确定实体相似程度,包括:获取所述实体模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的实体相似程度。
在其中一个实施例中,所述搜索后交互信息包括历史交互行为和搜索结果,所述根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度,包括:
采用所述第一联想词的历史交互行为和搜索结果,构造出所述第一联想词的第一词条特征向量,以及采用所述第二联想词的历史交互行为和搜索结果,构造出所述第二联想词的第二词条特征向量;
根据所述第一词条特征向量和所述第二词条特征向量,确定所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
在其中一个实施例中,所述方法还包括:
采用交互行为模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的历史交互行为、所述第二联想词的历史交互行为;
采用搜索结果模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的搜索结果、所述第二联想词的搜索结果;
所述根据所述第一词条特征向量和所述第二词条特征向量,确定所述第一联想词和所述第二联想词之间的搜索结果相似程度,包括:
获取向量处理模型针对所述第一词条特征向量和所述第二词条特征向量输出的相似度结果,得到所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
在其中一个实施例中,所述音乐搜索意图相似程度包括意图相似程度和实体相似程度;所述采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,包括:
获取融合权重信息;所述融合权重信息包括针对所述候选搜索联想词之间的意图相似程度的第一权重、针对所述候选搜索联想词之间的实体相似程度的第二权重、针对所述候选搜索联想词之间的音乐搜索结果相似程度的第三权重;
结合所述第一权重、所述第二权重、所述第三权重,融合任意两个所述候选搜索联想词之间的所述意图相似程度、所述实体相似程度、所述音乐搜索结果相似程度,得到任意两个所述候选搜索联想词之间的联想词相似程度;所述联想词相似程度用于判断任意两个所述候选搜索联想词是否存在相似音乐搜索意图和相似音乐搜索结果;
在所述多个候选搜索联想词中,根据任意两个所述候选搜索联想词之间的联想词相似程度进行去重处理,得到所述至少一个目标搜索联想词。
在其中一个实施例中,在所述结合所述第一权重、所述第二权重、所述第三权重,融合任意两个所述候选搜索联想词之间的所述意图相似程度、所述实体相似程度、所述音乐搜索结果相似程度,得到任意两个所述候选搜索联想词之间的联想词相似程度的步骤之前,所述方法还包括:
在任意两个所述候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个所述候选搜索联想词之间的音乐搜索结果相似程度。
第二方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
第三方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
第四方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
上述一种搜索联想词展示方法、计算机设备和计算机可读存储介质,通过响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词,然后根据各候选搜索联想词的音乐搜索意图信息,确定不同候选搜索联想词之间的音乐搜索意图相似程度,根据各候选搜索联想词的搜索后交互信息,确定不同候选搜索联想词之间的音乐搜索结果相似程度,进而采用不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为音乐搜索词对应的搜索联想结果进行展示,实现了在音乐领域的搜索场景下对所提供搜索联想词的优化,可以基于不同搜索联想词之间的音乐搜索意图相似程度和音乐搜索结果相似程度,去除存在相似音乐搜索意图和相似音乐搜索结果的搜索联想词,能够在保证精确性的基础上进行联想词多样性去重,有助于为用户提供多样化的搜索结果。
附图说明
图1为一个实施例中一种搜索联想词展示方法的流程示意图;
图2为一个实施例中一种音乐领域搜索联想词去重处理的示意图;
图3为一个实施例中一种目标搜索联想词得到的步骤的流程示意图;
图4为另一个实施例中搜索联想词展示方法的流程示意图;
图5为一个实施例中搜索联想词展示装置的结构框图;
图6为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种搜索联想词展示方法,本实施例以该方法应用于服务器进行举例说明,可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。
其中,服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现;终端可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等。
在本实施例中,该方法可以包括以下步骤:
在步骤S101中,响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词。
在实际应用中,可以响应于用户在搜索框中的搜索输入操作,获取所输入的音乐搜索词对应的多个候选搜索联想词;示例性地,在音乐领域的搜索场景下,可以根据用户输入搜索框的部分短语(即音乐搜索词)生成对应的搜索联想词,以通过输入提示为用户提供符合其搜索需求的完整词条。
在步骤S102中,根据各候选搜索联想词的音乐搜索意图信息,确定不同候选搜索联想词之间的音乐搜索意图相似程度。
其中,音乐搜索意图信息可以包括意图信息和实体信息,例如,可以分别计算出每个候选搜索联想词的意图和ner(命名实体识别,如在音乐领域中可以为歌曲、歌手、影视等)信息。
作为一示例,音乐搜索意图相似程度可以采用分数方式表示,如可以计算出对应的相似分数。
在得到多个候选搜索联想词后,针对每个候选搜索联想词,可以通过候选搜索联想词对应的意图和ner信息获得词条的搜索意图(即音乐搜索意图信息),进而可以在不同候选搜索联想词之间,基于获得的搜索意图计算相似分数,如可以针对两个候选搜索联想词计算出搜索意图相似分数,即音乐搜索意图相似程度。从而可以有助于通过词语意图对词条分类,挖掘词条中有用信息。
在步骤S103中,根据各候选搜索联想词的搜索后交互信息,确定不同候选搜索联想词之间的音乐搜索结果相似程度。
其中,搜索后交互信息可以包括历史交互行为和搜索结果,如可以获取每个候选搜索联想词的用户搜索后交互行为,其可以基于群体的历史操作行为等学习得到群体的兴趣偏好,还可以获取每个候选搜索联想词对应配置的搜索结果。
作为一示例,音乐搜索结果相似程度可以采用分数方式表示,如可以计算出对应的相似分数。
在得到多个候选搜索联想词后,针对每个候选搜索联想词,可以通过候选搜索联想词对应的词条搜索后信息(即搜索后交互信息)计算出向量表示embedding,如可以构造词条embedding,进而可以在不同候选搜索联想词之间,基于词条embedding计算相似分数,如可以针对两个候选搜索联想词计算出向量相似分数,即音乐搜索结果相似程度。
在步骤S104中,采用不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为音乐搜索词对应的搜索联想结果进行展示。
在具体实现中,可以结合不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,对音乐领域的搜索联想词进行去重,通过去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,可以得到去重处理后的目标搜索联想词,进而可以作为音乐搜索词对应的搜索联想结果进行展示。从而能够在保证精确性的基础上达到联想词多样性去重的目的。
在一示例中,通过结合候选搜索联想词对应的意图和ner信息,以及候选搜索联想词对应的词条搜索后信息计算出的向量表示embedding,可以在多个候选搜索联想词去重相似词,进而可以针对搜索联想词列表,将相同意思、相同意图、相同搜索结果的词语进行去除,从而能够有助于为用户提供多样化的搜索结果。
上述搜索联想词展示方法中,通过响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词,然后根据各候选搜索联想词的音乐搜索意图信息,确定不同候选搜索联想词之间的音乐搜索意图相似程度,根据各候选搜索联想词的搜索后交互信息,确定不同候选搜索联想词之间的音乐搜索结果相似程度,进而采用不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为音乐搜索词对应的搜索联想结果进行展示,实现了在音乐领域的搜索场景下对所提供搜索联想词的优化,可以基于不同搜索联想词之间的音乐搜索意图相似程度和音乐搜索结果相似程度,去除存在相似音乐搜索意图和相似音乐搜索结果的搜索联想词,能够在保证精确性的基础上进行联想词多样性去重,有助于为用户提供多样化的搜索结果。
在一个实施例中,音乐搜索意图信息可以包括意图信息和实体信息,在步骤S102中,根据各候选搜索联想词的音乐搜索意图信息,确定不同候选搜索联想词之间的音乐搜索意图相似程度,可以包括如下步骤:
获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词;根据第一联想词的意图信息和第二联想词的意图信息,确定意图相似程度,以及根据第一联想词的实体信息和第二联想词的实体信息,确定实体相似程度;基于意图相似程度和实体相似程度,得到第一联想词和第二联想词之间的音乐搜索意图相似程度。
在一示例中,如图2所示,可以将任意两个候选搜索联想词作为候选词A和候选词B(即第一联想词和第二联想词),通过对该候选词A和候选词B分别计算其意图和ner信息,可以获取到候选query中的组合信息(即音乐搜索意图信息),进而可以计算出相似分数,如图2中实体相似分和意图相似分,即实体相似程度和意图相似程度。
在一个可选实施例中,可以通过获得不同候选搜索联想词之间的音乐搜索意图相似程度,对多个候选搜索联想词进行词条分类,以将搜索意图相似的候选搜索联想词集中于同一分组之下,进而可以针对任一候选搜索联想词分组,进一步结合该分组下候选搜索联想词之间的音乐搜索结果相似程度进行去重处理。
在本实施例中,通过获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词,然后根据第一联想词的意图信息和第二联想词的意图信息,确定意图相似程度,以及根据第一联想词的实体信息和第二联想词的实体信息,确定实体相似程度,进而基于意图相似程度和实体相似程度,得到第一联想词和第二联想词之间的音乐搜索意图相似程度,能够有助于通过词语意图对词条分类,挖掘词条中有用信息。
在一个实施例中,在获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词的步骤之后,还可以包括如下步骤:
确定第一联想词的槽位提取结果和第二联想词的槽位提取结果;槽位提取结果用于表征对应的联想词中各实体词及其实体类型;采用意图模型对第一联想词和第二联想词进行处理,基于第一联想词的槽位提取结果和第二联想词的槽位提取结果,获得第一联想词的意图信息和第二联想词的意图信息;采用实体模型对第一联想词和第二联想词进行处理,基于第一联想词的槽位提取结果和第二联想词的槽位提取结果,获得第一联想词的实体信息和第二联想词的实体信息。
在实际应用中,针对第一联想词和第二联想词,可以通过意图模型获得联想词的有用槽位(即槽位提取结果),其可以用于进一步ner模型分数计算和意图模型分数。
示例性地,所获得联想词的有用槽位可以采用如下方式表示:
周xx的七里香(即搜索联想词)=>周xx:singer,七里香:track,的:else。
其中,在音乐领域下“周xx”、“七里香”属于命名实体(即实体词),其分别对应“歌手”、“歌曲”(即实体类型)。
在一示例中,可以采用如下方式获得联想词的有用槽位:
IntentionFeaquery=IntentionModel(Query)
其中,Query表示候选搜索联想词,即第一联想词或第二联想词。
在又一示例中,如图2所示,可以利用意图模型,分别计算候选词A和候选词B的意图,即第一联想词的意图信息和第二联想词的意图信息,可以利用实体模型,分别计算候选词A和候选词B的ner信息,即第一联想词的实体信息和第二联想词的实体信息。
在本实施例中,通过确定第一联想词的槽位提取结果和第二联想词的槽位提取结果,进而采用意图模型对第一联想词和第二联想词进行处理,基于第一联想词的槽位提取结果和第二联想词的槽位提取结果,获得第一联想词的意图信息和第二联想词的意图信息,采用实体模型对第一联想词和第二联想词进行处理,基于第一联想词的槽位提取结果和第二联想词的槽位提取结果,获得第一联想词的实体信息和第二联想词的实体信息,为进一步得到第一联想词和第二联想词之间的音乐搜索意图相似程度提供了数据支持。
在一个实施例中,确定意图相似程度,可以包括如下步骤:
获取意图模型针对第一联想词和第二联想词输出的相似度结果,得到第一联想词和第二联想词之间的意图相似程度。
在一示例中,如图2所示,针对候选词A和候选词B(即第一联想词和第二联想词),可以利用意图模型得到输出的意图相似分,即意图相似程度,可以采用如下方式计算得到意图模型分数:为
IntentSimScore=IntentionModel(QueryA,QueryB)
其中,QueryA表示候选词A,QueryB表示候选词B,IntentSimScore为意图相似程度。
确定实体相似程度,包括:获取实体模型针对第一联想词和第二联想词输出的相似度结果,得到第一联想词和第二联想词之间的实体相似程度。
在又一示例中,如图2所示,针对候选词A和候选词B(即第一联想词和第二联想词),可以利用实体模型得到输出的实体相似分,即实体相似程度,可以采用如下方式计算得到ner模型分数:
NerSimScore=NerModel(QueryA,QueryB)
其中,QueryA表示候选词A,QueryB表示候选词B,NerSimScore为实体相似程度。
在本实施例中,通过获取意图模型针对第一联想词和第二联想词输出的相似度结果,得到第一联想词和第二联想词之间的意图相似程度,以及获取实体模型针对第一联想词和第二联想词输出的相似度结果,得到第一联想词和第二联想词之间的实体相似程度,可以基于意图模型和ner模型准确获取意图相似程度和实体相似程度,能够保证搜索意图相似性判定的精确性。
在一个实施例中,搜索后交互信息可以包括历史交互行为和搜索结果,在步骤S103中,根据各候选搜索联想词的搜索后交互信息,确定不同候选搜索联想词之间的音乐搜索结果相似程度,可以包括如下步骤:
采用第一联想词的历史交互行为和搜索结果,构造出第一联想词的第一词条特征向量,以及采用第二联想词的历史交互行为和搜索结果,构造出第二联想词的第二词条特征向量;根据第一词条特征向量和第二词条特征向量,确定第一联想词和第二联想词之间的音乐搜索结果相似程度。
作为一示例,搜索联想词的历史交互行为可以基于群体兴趣确定得到,如可以计算该搜索联想词的历史点击率、历史热度等,还可以采用其它的搜索后用户历史操作行为,在本实施例中不作具体限制。
在具体实现中,以候选词A和候选词B为例(即第一联想词和第二联想词),可以分别根据该候选词A和候选词B的搜索结果和历史交互行为,得到词条embedding,即构造出第一词条特征向量和第二词条特征向量,进而可以计算向量相似度得到对应的相似分数,即音乐搜索结果相似程度。
例如,利用词向量模型(即向量处理模型)对候选搜索联想词进行处理,得到词条的embedding,可以采用如下方式表示:
EmbeddingA=EmbeddingModel(QueryA,ResultA,BehaviorA)
其中,QueryA表示候选词A,ResultA表示候选词A的搜索结果,BehaviorA表示候选词A的历史交互行为,EmbeddingA为候选词A对应的词条特征向量。
在一个可选实施例中,针对词语向量的生成方式,还可以采用其它不同的词语特征生成得到,在本实施例中不作具体限制。
在本实施例中,通过采用第一联想词的历史交互行为和搜索结果,构造出第一联想词的第一词条特征向量,以及采用第二联想词的历史交互行为和搜索结果,构造出第二联想词的第二词条特征向量,进而根据第一词条特征向量和第二词条特征向量,确定第一联想词和第二联想词之间的音乐搜索结果相似程度,能够结合搜索结果相似度判断,在保证精确性的基础上进行联想词多样性去重,有助于为用户提供多样化的搜索结果。
在一个实施例中,还可以包括如下步骤:
采用交互行为模型对第一联想词和第二联想词进行处理,获得第一联想词的历史交互行为、第二联想词的历史交互行为;采用搜索结果模型对第一联想词和第二联想词进行处理,获得第一联想词的搜索结果、第二联想词的搜索结果。
在实际应用中,如图2所示,可以利用交互行为模型对候选词A和候选词B处理得到对应的历史搜索后用户交互行为,即第一联想词的历史交互行为、第二联想词的历史交互行为;可以利用搜索结果模型对候选词A和候选词B处理得到对应的搜索结果,即第一联想词的搜索结果、第二联想词的搜索结果。
根据第一词条特征向量和第二词条特征向量,确定第一联想词和第二联想词之间的搜索结果相似程度,包括:
获取向量处理模型针对第一词条特征向量和第二词条特征向量输出的相似度结果,得到第一联想词和第二联想词之间的音乐搜索结果相似程度。
在一示例中,如图2所示,以候选词A和候选词B为例(即第一联想词和第二联想词),可以利用词向量模型(即向量处理模型),采用如下方式计算词条embedding的向量相似度(如图2中向量相似分):
EmbSimScore=EmbScore(QueryA,QueryB)
其中,QueryA表示候选词A,QueryB表示候选词B,EmbSimScore为候选词A和候选词B的词条embedding向量相似度,即音乐搜索结果相似程度。
在一个可选实施例中,针对相似度的计算可以采用余弦相似度方式,还可以采用其它相似度计算方式,在本实施例中不作具体限制。
在本实施例中,通过采用交互行为模型对第一联想词和第二联想词进行处理,获得第一联想词的历史交互行为、第二联想词的历史交互行为,进而采用搜索结果模型对第一联想词和第二联想词进行处理,获得第一联想词的搜索结果、第二联想词的搜索结果,为进一步得到第一联想词和第二联想词之间的音乐搜索结果相似程度提供了数据支持。
在一个实施例中,如图3所示,音乐搜索意图相似程度可以包括意图相似程度和实体相似程度,在步骤S104中,采用不同候选搜索联想词之间的音乐搜索意图相似程度,以及不同候选搜索联想词之间的音乐搜索结果相似程度,去除多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,可以包括如下步骤:
在步骤S301中,获取融合权重信息;融合权重信息包括针对候选搜索联想词之间的意图相似程度的第一权重、针对候选搜索联想词之间的实体相似程度的第二权重、针对候选搜索联想词之间的音乐搜索结果相似程度的第三权重;
在步骤S302中,结合第一权重、第二权重、第三权重,融合任意两个候选搜索联想词之间的意图相似程度、实体相似程度、音乐搜索结果相似程度,得到任意两个候选搜索联想词之间的联想词相似程度;联想词相似程度用于判断任意两个候选搜索联想词是否存在相似音乐搜索意图和相似音乐搜索结果;
在步骤S303中,在多个候选搜索联想词中,根据任意两个候选搜索联想词之间的联想词相似程度进行去重处理,得到至少一个目标搜索联想词。
在实际应用中,如图2所示,以候选词A和候选词B为例(即任意两个候选搜索联想词),在得到实体相似分、意图相似分、向量相似分后,即意图相似程度、实体相似程度、音乐搜索结果相似程度,可以通过将获得的相似分数合并得到最终分数(如图2中候选词相似分),即联想词相似程度,以作出是否需要去重的判断。
在一示例中,基于学习融合系数(即包括第一权重、第二权重、第三权重的融合权重信息),可以将意图相似分、实体相似分、向量相似分融合得到最终分数,以判定两个候选搜索联想词是否重复,可以采用如下方式进行分数融合:
FinalScore=ω1*IntentSimScore(a,b)+ω2*EmbSimScore(a,b)+ω3*NerSimScore(a,b)
其中,IntentSimScore(a,b)表示候选词A和候选词B的意图相似分,w1为第一权重,NerSimScore(a,b)表示候选词A和候选词B的实体相似分,w3为第二权重,EmbSimScore(a,b)表示候选词A和候选词B的向量相似分,w2为第三权重,FinalScore为融合得到最终分数,即联想词相似程度。
在一个可选实施例中,针对意图相似分、实体相似分、向量相似分的融合还可以采用其它计算方式,在本实施例中不作具体限制。
在又一示例中,在去重处理时可以留下分数更高的候选搜索联想词,或排序靠前的候选搜索联想词,还可以采用其它方式选取留下的候选搜索联想词,在本实施例中不作具体限制。
例如,基于本实施例的技术方案,通过对音乐领域搜索联想词多样性去重可以得到如下结果:
处理前 | 处理后 |
歌手名A | 歌手名A |
歌手名A的歌 | 歌手名A免费 |
歌手名A的歌曲大全 | 歌手名A歌单 |
歌手名A免费 | 歌手名A歌曲名B |
歌手名A免费歌曲大全 | 歌手名A歌曲名C |
歌手名A歌单 | 歌手名A专辑 |
其中,query为歌手名A(即音乐搜索词),如在用户输入歌手名A时,传统方法得到的搜索联想词列表为处理前一列所示,通过本实施例的技术方案得到的搜索联想词列表为处理后一列所示,其对处理前一列中相同的三个搜索联想词“歌手名A”、“歌手名A的歌”、“歌手名A的歌曲大全”进行去除,从而能够有助于为用户提供多样化的搜索结果。
在本实施例中,通过获取融合权重信息,然后结合第一权重、第二权重、第三权重,融合任意两个候选搜索联想词之间的意图相似程度、实体相似程度、音乐搜索结果相似程度,得到任意两个候选搜索联想词之间的联想词相似程度,进而在多个候选搜索联想词中,根据任意两个候选搜索联想词之间的联想词相似程度进行去重处理,得到至少一个目标搜索联想词,能够在保证精确性的基础上进行联想词多样性去重,优化了搜索联想词列表展示结果。
在一个实施例中,在结合第一权重、第二权重、第三权重,融合任意两个候选搜索联想词之间的意图相似程度、实体相似程度、音乐搜索结果相似程度,得到任意两个候选搜索联想词之间的联想词相似程度的步骤之前,还可以包括如下步骤:
在任意两个候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个候选搜索联想词之间的音乐搜索结果相似程度。
在一示例中,如图2所示,可以通过对实体相似分和意图相似分、向量相似分这两部分的分数进行融合计算,针对已出现过的搜索联想词综合给出相似分数;针对新词、历史未见过的词汇(即历史未出现的新搜索联想词),可以通过降低embedding分数,即调低音乐搜索结果相似程度,使得更确信意图模型给出的意图相似分。从而在兼顾用户历史搜索词的同时也兼顾了新词汇,能够将相似的搜索联想词去重,为用户提供多样性的搜索结果,可以更好满足用户搜索需求。
在本实施例中,通过任意两个候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个候选搜索联想词之间的音乐搜索结果相似程度,使得兼顾了新词汇,能够为用户提供多样性的搜索联想词。
在一个实施例中,如图4所示,提供了另一种搜索联想词展示方法的流程示意图。本实施例中,该方法包括以下步骤:
在步骤S401中,响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词,获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词。在步骤S402中,根据第一联想词的意图信息和第二联想词的意图信息,确定意图相似程度,以及根据第一联想词的实体信息和第二联想词的实体信息,确定实体相似程度。在步骤S403中,基于意图相似程度和实体相似程度,得到第一联想词和第二联想词之间的音乐搜索意图相似程度。在步骤S404中,采用第一联想词的历史交互行为和搜索结果,构造出第一联想词的第一词条特征向量,以及采用第二联想词的历史交互行为和搜索结果,构造出第二联想词的第二词条特征向量。在步骤S405中,根据第一词条特征向量和第二词条特征向量,确定第一联想词和第二联想词之间的音乐搜索结果相似程度。在步骤S406中,获取融合权重信息,在任意两个候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个候选搜索联想词之间的音乐搜索结果相似程度。在步骤S407中,结合第一权重、第二权重、第三权重,融合任意两个候选搜索联想词之间的意图相似程度、实体相似程度、音乐搜索结果相似程度,得到任意两个候选搜索联想词之间的联想词相似程度。在步骤S408在多个候选搜索联想词中,根据任意两个候选搜索联想词之间的联想词相似程度进行去重处理,得到至少一个目标搜索联想词,作为音乐搜索词对应的搜索联想结果进行展示。需要说明的是,上述步骤的具体限定可以参见上文对一种搜索联想词展示方法的具体限定,在此不再赘述。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的搜索联想词展示方法的搜索联想词展示装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个搜索联想词展示装置实施例中的具体限定可以参见上文中对于搜索联想词展示方法的限定,在此不再赘述。
在一个实施例中,如图5所示,提供了一种搜索联想词展示装置,包括:
候选搜索联想词获取模块501,用于响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
音乐搜索意图相似程度确定模块502,用于根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
音乐搜索结果相似程度确定模块503,用于根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
目标搜索联想词得到模块504,用于采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
在一个实施例中,所述音乐搜索意图信息包括意图信息和实体信息,所述音乐搜索意图相似程度确定模块502包括:
待处理词获取子模块,用于获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词;
意图相似程度和实体相似程度确定子模块,用于根据所述第一联想词的意图信息和所述第二联想词的意图信息,确定意图相似程度,以及根据所述第一联想词的实体信息和所述第二联想词的实体信息,确定实体相似程度;
音乐搜索意图相似程度得到子模块,用于基于所述意图相似程度和所述实体相似程度,得到所述第一联想词和所述第二联想词之间的音乐搜索意图相似程度。
在一个实施例中,所述装置还包括:
槽位提取结果确定模块,用于确定所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果;所述槽位提取结果用于表征对应的联想词中各实体词及其实体类型;
意图信息获得模块,用于采用意图模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的意图信息和所述第二联想词的意图信息;
实体信息获得模块,用于采用实体模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的实体信息和所述第二联想词的实体信息。
在一个实施例中,所述意图相似程度和实体相似程度确定子模块包括:
意图模型输出单元,用于获取所述意图模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的意图相似程度;
所述意图相似程度和实体相似程度确定子模块包括:
实体模型输出单元,用于获取所述实体模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的实体相似程度。
在一个实施例中,所述搜索后交互信息包括历史交互行为和搜索结果,所述音乐搜索结果相似程度确定模块503包括:
词条特征向量构造子模块,用于采用所述第一联想词的历史交互行为和搜索结果,构造出所述第一联想词的第一词条特征向量,以及采用所述第二联想词的历史交互行为和搜索结果,构造出所述第二联想词的第二词条特征向量;
音乐搜索结果相似程度得到子模块,用于根据所述第一词条特征向量和所述第二词条特征向量,确定所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
在一个实施例中,所述装置还包括:
交互行为模型输出模块,用于采用交互行为模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的历史交互行为、所述第二联想词的历史交互行为;
搜索结果模型输出模块,用于采用搜索结果模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的搜索结果、所述第二联想词的搜索结果;
所述音乐搜索结果相似程度得到子模块包括:
向量处理模型输出单元,用于获取向量处理模型针对所述第一词条特征向量和所述第二词条特征向量输出的相似度结果,得到所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
在一个实施例中,所述音乐搜索意图相似程度包括意图相似程度和实体相似程度;所述目标搜索联想词得到模块504包括:
融合权重信息获取子模块,用于获取融合权重信息;所述融合权重信息包括针对所述候选搜索联想词之间的意图相似程度的第一权重、针对所述候选搜索联想词之间的实体相似程度的第二权重、针对所述候选搜索联想词之间的音乐搜索结果相似程度的第三权重;
联想词相似程度得到子模块,用于结合所述第一权重、所述第二权重、所述第三权重,融合任意两个所述候选搜索联想词之间的所述意图相似程度、所述实体相似程度、所述音乐搜索结果相似程度,得到任意两个所述候选搜索联想词之间的联想词相似程度;所述联想词相似程度用于判断任意两个所述候选搜索联想词是否存在相似音乐搜索意图和相似音乐搜索结果;
去重处理子模块,用于在所述多个候选搜索联想词中,根据任意两个所述候选搜索联想词之间的联想词相似程度进行去重处理,得到所述至少一个目标搜索联想词。
在一个实施例中,所述装置还包括:
新搜索联想词调整模块,用于在任意两个所述候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个所述候选搜索联想词之间的音乐搜索结果相似程度。
上述搜索联想词展示装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储搜索联想词展示数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一搜索联想词展示方法。
本领域技术人员可以理解,图6中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
在一个实施例中,处理器执行计算机程序时还实现上述其他实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
在一个实施例中,计算机程序被处理器执行时还实现上述其他实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种搜索联想词展示方法,其特征在于,所述方法包括:
响应于搜索输入操作,获取音乐搜索词对应的多个候选搜索联想词;
根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度;
根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度;
采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,作为所述音乐搜索词对应的搜索联想结果进行展示。
2.根据权利要求1所述的方法,其特征在于,所述音乐搜索意图信息包括意图信息和实体信息,所述根据各所述候选搜索联想词的音乐搜索意图信息,确定不同所述候选搜索联想词之间的音乐搜索意图相似程度,包括:
获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词;
根据所述第一联想词的意图信息和所述第二联想词的意图信息,确定意图相似程度,以及根据所述第一联想词的实体信息和所述第二联想词的实体信息,确定实体相似程度;
基于所述意图相似程度和所述实体相似程度,得到所述第一联想词和所述第二联想词之间的音乐搜索意图相似程度。
3.根据权利要求2所述的方法,其特征在于,在所述获取任意两个候选搜索联想词作为待处理的第一联想词和第二联想词的步骤之后,所述方法还包括:
确定所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果;所述槽位提取结果用于表征对应的联想词中各实体词及其实体类型;
采用意图模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的意图信息和所述第二联想词的意图信息;
采用实体模型对所述第一联想词和所述第二联想词进行处理,基于所述第一联想词的槽位提取结果和所述第二联想词的槽位提取结果,获得所述第一联想词的实体信息和所述第二联想词的实体信息。
4.根据权利要求3所述的方法,其特征在于,
所述确定意图相似程度,包括:获取所述意图模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的意图相似程度;
所述确定实体相似程度,包括:获取所述实体模型针对所述第一联想词和所述第二联想词输出的相似度结果,得到所述第一联想词和所述第二联想词之间的实体相似程度。
5.根据权利要求2所述的方法,其特征在于,所述搜索后交互信息包括历史交互行为和搜索结果,所述根据各所述候选搜索联想词的搜索后交互信息,确定不同所述候选搜索联想词之间的音乐搜索结果相似程度,包括:
采用所述第一联想词的历史交互行为和搜索结果,构造出所述第一联想词的第一词条特征向量,以及采用所述第二联想词的历史交互行为和搜索结果,构造出所述第二联想词的第二词条特征向量;
根据所述第一词条特征向量和所述第二词条特征向量,确定所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
采用交互行为模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的历史交互行为、所述第二联想词的历史交互行为;
采用搜索结果模型对所述第一联想词和所述第二联想词进行处理,获得所述第一联想词的搜索结果、所述第二联想词的搜索结果;
所述根据所述第一词条特征向量和所述第二词条特征向量,确定所述第一联想词和所述第二联想词之间的搜索结果相似程度,包括:
获取向量处理模型针对所述第一词条特征向量和所述第二词条特征向量输出的相似度结果,得到所述第一联想词和所述第二联想词之间的音乐搜索结果相似程度。
7.根据权利要求1所述的方法,其特征在于,所述音乐搜索意图相似程度包括意图相似程度和实体相似程度;所述采用不同所述候选搜索联想词之间的音乐搜索意图相似程度,以及不同所述候选搜索联想词之间的音乐搜索结果相似程度,去除所述多个候选搜索联想词中存在相似音乐搜索意图和相似音乐搜索结果的候选搜索联想词,得到至少一个目标搜索联想词,包括:
获取融合权重信息;所述融合权重信息包括针对所述候选搜索联想词之间的意图相似程度的第一权重、针对所述候选搜索联想词之间的实体相似程度的第二权重、针对所述候选搜索联想词之间的音乐搜索结果相似程度的第三权重;
结合所述第一权重、所述第二权重、所述第三权重,融合任意两个所述候选搜索联想词之间的所述意图相似程度、所述实体相似程度、所述音乐搜索结果相似程度,得到任意两个所述候选搜索联想词之间的联想词相似程度;所述联想词相似程度用于判断任意两个所述候选搜索联想词是否存在相似音乐搜索意图和相似音乐搜索结果;
在所述多个候选搜索联想词中,根据任意两个所述候选搜索联想词之间的联想词相似程度进行去重处理,得到所述至少一个目标搜索联想词。
8.根据权利要求7所述的方法,其特征在于,在所述结合所述第一权重、所述第二权重、所述第三权重,融合任意两个所述候选搜索联想词之间的所述意图相似程度、所述实体相似程度、所述音乐搜索结果相似程度,得到任意两个所述候选搜索联想词之间的联想词相似程度的步骤之前,所述方法还包括:
在任意两个所述候选搜索联想词中存在历史未出现的新搜索联想词的情况下,调低任意两个所述候选搜索联想词之间的音乐搜索结果相似程度。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至8中任一项所述的方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至8中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311563322.2A CN117875314A (zh) | 2023-11-21 | 2023-11-21 | 搜索联想词展示方法、计算机设备和计算机可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311563322.2A CN117875314A (zh) | 2023-11-21 | 2023-11-21 | 搜索联想词展示方法、计算机设备和计算机可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117875314A true CN117875314A (zh) | 2024-04-12 |
Family
ID=90583626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311563322.2A Pending CN117875314A (zh) | 2023-11-21 | 2023-11-21 | 搜索联想词展示方法、计算机设备和计算机可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117875314A (zh) |
-
2023
- 2023-11-21 CN CN202311563322.2A patent/CN117875314A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8468146B2 (en) | System and method for creating search index on cloud database | |
CN111291177A (zh) | 一种信息处理方法、装置和计算机存储介质 | |
CN104641371A (zh) | 社交网络系统中基于上下文的对象检索 | |
CN111797319B (zh) | 推荐方法、装置、设备及存储介质 | |
CN110598123B (zh) | 基于画像相似性的信息检索推荐方法、装置及存储介质 | |
CN109086386B (zh) | 数据处理方法、装置、计算机设备和存储介质 | |
CN112559895B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN115660686A (zh) | 交易风险评估方法、装置、设备、存储介质和程序产品 | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
CN110020181B (zh) | 一种推荐信息的处理方法、装置及计算机可读存储介质 | |
CN106021346B (zh) | 检索处理方法及装置 | |
CN117875314A (zh) | 搜索联想词展示方法、计算机设备和计算机可读存储介质 | |
CN112232360A (zh) | 图像检索模型优化方法、图像检索方法、装置及存储介质 | |
CN116882408B (zh) | 变压器图模型的构建方法、装置、计算机设备和存储介质 | |
CN115269785A (zh) | 搜索方法、装置、计算机设备和存储介质 | |
CN115168409B (zh) | 数据库分表的数据查询方法、装置和计算机设备 | |
CN116881543A (zh) | 金融资源对象推荐方法、装置、设备、存储介质和产品 | |
CN115409070A (zh) | 离散数据序列临界点的确定方法、装置以及设备 | |
CN117171457A (zh) | 人机交互方法、装置、计算机设备和存储介质 | |
CN117033451A (zh) | 搜索方法、装置、计算机设备和存储介质 | |
CN117112724A (zh) | 搜索推送方法、装置、设备、存储介质和计算机程序产品 | |
CN117609593A (zh) | 在电子书籍阅读器中搜索数据的方法、装置、设备和介质 | |
CN115146104A (zh) | 音频分布信息获取方法、计算机设备和计算机程序产品 | |
CN117435185A (zh) | 代码生成方法、装置、计算机设备和存储介质 | |
CN116719994A (zh) | 媒体对象推荐方法、装置、计算机设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination |