CN115563394B - 搜索召回方法、召回模型训练方法、装置和计算机设备 - Google Patents
搜索召回方法、召回模型训练方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN115563394B CN115563394B CN202211480284.XA CN202211480284A CN115563394B CN 115563394 B CN115563394 B CN 115563394B CN 202211480284 A CN202211480284 A CN 202211480284A CN 115563394 B CN115563394 B CN 115563394B
- Authority
- CN
- China
- Prior art keywords
- search
- sequence
- recall
- feature
- historical
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请涉及一种搜索召回方法、召回模型训练方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:分别对当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列;对当前搜索对象的当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征;基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。采用本方法能够召回准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种搜索召回方法、召回模型训练方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着计算机技术的发展,搜索引擎的功能日趋强大。召回是搜索中的重要环节,根据用户输入的搜索语句可以从海量信息资源中召回与搜索语句相关的信息资源。
传统技术中,通常是提取搜索语句对应的搜索语句特征,提取待召回资源对应的资源特征,基于搜索语句特征和资源特征从待召回资源中确定目标召回资源。然而,从搜索语句中提取到的搜索语句特征包含的信息量有限,容易导致召回准确性较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高召回准确性的搜索召回方法、召回模型训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种搜索召回方法。所述方法包括:
获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;
分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;
对所述当前搜索语句进行特征提取,得到当前搜索语句特征,融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;
基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
本申请还提供了一种搜索召回装置。所述装置包括:
数据获取模块,用于获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;
特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;
特征融合模块,用于对所述当前搜索语句进行特征提取,得到当前搜索语句特征,融合所述当前搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;
资源召回模块,用于基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述搜索召回方法所述的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述搜索召回方法所述的步骤。
一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述搜索召回方法所述的步骤。
上述搜索召回方法、装置、计算机设备、存储介质和计算机程序产品,通过获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;当前搜索对象为当前搜索语句对应的搜索对象,历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列;对当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征;基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。这样,历史正向召回信息序列隐含了当前搜索对象的对象属性,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征当前搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合当前搜索语句对应的当前搜索语句特征和当前搜索对象对应的搜索对象特征得到的搜索融合特征,既包含当前搜索语句对应的语义信息,又包含当前搜索对象对应的属性信息,基于这样的搜索融合特征从候选召回资源库中获取到的匹配召回资源不仅与当前搜索语句匹配,而且还与当前搜索对象匹配,具有更高的准确性,可以有效提高搜索召回的准确性,实现针对当前搜索对象的个性化召回。
本申请提供了一种召回模型训练方法。所述方法包括:
获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;
分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;
分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;
融合所述训练搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;
基于所述搜索融合特征分别和所述目标正向召回信息特征、所述目标反向召回信息特征之间的特征相似度,调整所述初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
本申请还提供了一种召回模型训练装置。所述装置包括:
训练数据获取模块,用于获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;
特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;
特征提取模块,用于分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;
特征融合模块,用于融合所述训练搜索语句特征和所述搜索对象特征初始序列,得到搜索融合特征;
模型调整模块,用于基于所述搜索融合特征分别和所述目标正向召回信息特征、所述目标反向召回信息特征之间的特征相似度,调整所述初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述召回模型训练方法所述的步骤。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述召回模型训练方法所述的步骤。
一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述召回模型训练方法所述的步骤。
上述召回模型训练方法、装置、计算机设备、存储介质和计算机程序产品,通过获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列输入初始召回模型;训练搜索对象为训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到训练搜索对象对应的搜索对象特征初始序列;分别对训练搜索语句、正向召回信息、反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;融合训练搜索语句特征和搜索对象特征初始序列,得到搜索融合特征;基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。这样,历史正向召回信息序列隐含了训练搜索对象的对象属性,在模型中,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征训练搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合训练搜索语句对应的训练搜索语句特征和训练搜索对象对应的搜索对象特征得到的搜索融合特征,既包含训练搜索语句对应的语义信息,又包含训练搜索对象对应的属性信息。基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,能够使得模型输出更准确的搜索融合特征、召回信息特征。经过训练得到的目标召回模型可以输出搜索语句对应的准确的搜索融合特征、待召回资源对应的准确的召回信息特征,从而有助于提高搜索召回的准确性,最终实现针对搜索对象的个性化召回。
附图说明
图1为一个实施例中搜索召回方法和召回模型训练方法的应用环境图;
图2为一个实施例中搜索召回方法的流程示意图;
图3为一个实施例中进行搜索语句和召回信息的对齐的示意图;
图4为一个实施例中解调处理的示意图;
图5为一个实施例中对信号进行傅里叶变换的示意图;
图6为一个实施例中小波变换的示意图;
图7为一个实施例中滤波处理的示意图;
图8为另一个实施例中搜索召回方法的流程示意图;
图9为一个实施例中目标召回模型的结构示意图;
图10为一个实施例中不同搜索场景的界面示意图;
图11为一个实施例中展示当前召回结果的流程示意图;
图12为一个实施例中切换不同视频搜索场景的界面示意图;
图13为又一个实施例中搜索召回方法的流程示意图;
图14为一个实施例中召回模型训练方法的流程示意图;
图15为一个实施例中训练召回模型的示意图;
图16为一个实施例中搜索召回装置的结构框图;
图17为一个实施例中召回模型训练装置的结构框图;
图18为一个实施例中计算机设备的内部结构图;
图19为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的方案涉及人工智能的计算机视觉技术、机器学习等技术,具体通过如下实施例进行说明:
本申请实施例提供的搜索召回方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他服务器上。其中,终端102可以但不限于是各种台式计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群或者云服务器来实现。
终端和服务器均可单独用于执行本申请实施例中提供的搜索召回方法和召回模型训练方法。
例如,服务器获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列,其中,当前搜索对象为当前搜索语句对应的搜索对象,历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息。服务器分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。服务器基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。服务器对当前搜索语句进行特征提取得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列得到搜索融合特征。服务器基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。
服务器获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列输入初始召回模型。服务器分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。服务器通过模型基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,得到训练搜索对象对应的搜索对象特征初始序列,分别对训练搜索语句、正向召回信息、反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征,融合训练搜索语句特征和搜索对象特征初始序列,得到搜索融合特征。服务器基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
终端和服务器也可协同用于执行本申请实施例中提供的搜索召回方法和召回模型训练方法。
例如,服务器从终端获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列。服务器分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列,基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。服务器对当前搜索语句进行特征提取得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列得到搜索融合特征。服务器基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。服务器可以将当前召回结果向终端返回,终端可以展示当前召回结果。
服务器从终端获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列。服务器基于训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列,对初始召回模型进行模型训练,得到目标召回模型。服务器可以将目标召回模型存储在本地,也可以将目标召回模型发送至终端,以供终端基于目标召回模型进行数据处理。
在一个实施例中,如图2所示,提供了一种搜索召回方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图2,搜索召回方法包括以下步骤:
步骤S202,获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;当前搜索对象为当前搜索语句对应的搜索对象,历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息。
其中,搜索语句是在进行信息资源搜索时的关键语句,即搜索是针对搜索语句展开,以搜索与搜索语句相关的信息资源。例如,在搜索引擎中,用户可以通过输入“电影A”作为搜索语句,则搜索引擎可以围绕该搜索语句进行资源搜索,并反馈与电影A相关的信息资源。搜索语句可以是搜索关键词,也可以是包含搜索关键词的句子。可以理解,搜索语句可以是用户在搜索输入框中直接输入的搜索文本,也可以是对用户输入的语音进行语音识别得到的搜索文本。当前搜索语句是指当前待处理的搜索语句。
搜索对象是指搜索语句所属用户,例如,搜索对象是在搜索输入框中输入搜索语句的用户。当前搜索对象为当前搜索语句对应的搜索对象。
当前搜索对象对应的历史搜索语句序列包括当前搜索对象在进行搜索时使用的多个历史搜索语句。历史搜索语句序列是由多个历史搜索语句组成的序列。历史搜索语句是指在以前进行信息资源搜索时使用的搜索语句。可以理解,历史搜索语句对应的搜索时间早于当前搜索语句对应的搜索时间,也就是,当前搜索语句是指当前进行信息资源搜索时使用的搜索语句,历史搜索语句是在之前进行信息资源搜索时使用的搜索语句。在一个实施例中,历史搜索语句序列包括搜索时间与当前搜索语句对应的搜索时间最接近的第一预设数目个历史搜索语句。例如,历史搜索语句序列包括最近20条历史搜索语句。
召回资源是指根据搜索语句召回的信息资源,也就是,根据搜索语句进行信息资源搜索得到的搜索结果。正向召回资源是指所有召回资源中被搜索对象选中的召回资源,也就是,搜索结果中被搜索对象选中的召回资源。正向召回资源是搜索对象感兴趣、期望获得的召回资源。
召回信息是指召回资源对应的资源信息。召回信息可以包括召回资源对应的资源介绍信息、资源统计信息等资源信息中的至少一者。资源介绍信息用于介绍召回资源,例如,资源介绍信息可以是资源标题或资源简介。资源统计信息是指对搜索对象针对召回资源的操作行为进行统计得到的信息,例如,资源统计信息可以是资源浏览时长。在一个实施例中,正向召回资源是资源统计信息满足预设条件、且被搜索对象选中的召回资源。其中,预设条件可以根据实际需要进行设置。例如,正向召回资源可以是被搜索对象选中进行浏览、且资源浏览时长大于预设时长的召回资源。
历史正向召回资源是指在以前进行信息资源搜索时的正向召回资源。历史正向召回信息是指历史正向召回资源对应的召回信息。历史正向召回信息序列包括多个历史正向召回资源分别对应的历史正向召回信息。在一个实施例中,历史正向召回信息序列包括选中时间与当前搜索语句对应的搜索时间最接近的第二预设数目个历史正向召回资源的召回信息。例如,历史正向召回信息序列包括最近20个历史正向召回资源分别对应的召回信息。
具体地,在进行信息资源搜索时,计算机设备可以获取当前搜索对象对应的当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列,借助历史搜索语句序列和历史正向召回信息序列来确定当前搜索语句对应的搜索结果。
步骤S204,分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。
其中,特征转换是指将数据转换为通过特征向量的形式来表示,以便后续的数据处理。历史搜索语句特征序列包括历史搜索语句序列中各个历史搜索语句分别对应的历史搜索语句特征。正向召回信息特征序列也可以称为历史正向召回信息特征序列,正向召回信息特征序列包括历史正向召回信息序列中各个历史正向召回信息分别对应的历史正向召回信息特征。
搜索语句特征是搜索语句对应的特征表示,历史搜索语句特征是指历史搜索语句对应的特征表示。召回信息特征是召回信息的特征表示,正向召回信息特征是指正向召回信息的特征表示,历史正向召回信息特征是指历史正向召回信息的特征表示。
具体地,计算机设备对历史搜索语句序列进行特征转换,将历史搜索语句序列转换为通过特征向量的形式来表示,得到历史搜索语句序列对应的历史搜索语句特征序列。计算机设备对历史正向召回信息序列进行特征转换,将历史搜索语句序列转换为通过特征向量的形式来表示,得到历史正向召回信息序列对应的正向召回信息特征序列。
以历史搜索语句序列为例,可以通过查询字向量表将历史搜索语句中的每个字转换为一维向量,从而得到历史搜索语句对应的历史搜索语句特征,将历史搜索语句序列中各个历史搜索语句分别对应的历史搜索语句特征组合,从而得到历史搜索语句特征序列。可以理解,也可以采用其他方式进行特征转换,本申请不做限制。
步骤S206,基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。
其中,解调处理用于从正向召回信息特征序列中挖掘出搜索对象对应的搜索对象特征。可以理解,正向召回资源是搜索结果中被搜索对象选中的召回资源,是搜索对象感兴趣、期望获得的召回资源,因此,正向召回资源隐含了搜索对象的兴趣属性,相应的,正向召回资源对应的正向召回信息特征中也隐含了搜索对象的兴趣属性。但是,正向召回资源是基于搜索语句召回的,正向召回资源还会受到搜索语句的影响,也就是,正向召回资源也隐含了搜索语句的相关信息,相应的,正向召回资源对应的正向召回信息特征中也隐含了搜索语句的相关信息。因此,为了提取到不受搜索语句影响的搜索对象特征,通过历史搜索语句特征序列对正向召回信息特征序列进行解调处理。
搜索对象特征是搜索对象对应的特征表示。搜索对象特征初始序列是指初始的搜索对象特征序列。搜索对象特征初始序列包括从正向召回信息特征序列包含的各个历史正向召回信息特征中分别解调出的、初始的搜索对象特征。
具体地,可以将搜索对象特征类比为信号系统中的原始信号、基带信号,将历史搜索语句特征序列类比为信号系统中的载波信号,将正向召回信息特征序列类比为信号系统中的调制信号,调制信号是将原始信号和载波信号进行混合得到的信号,类比信号系统中解调调制信号的方法,计算机设备基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从调制信号中解调出原始信号,从而得到当前搜索对象对应的搜索对象特征初始序列。
类比信号系统中解调调制信号的方法在进行解调处理时,可以将历史搜索语句特征序列和正向召回信息特征序列进行时域乘积或频域卷积,从而得到当前搜索对象对应的搜索对象特征初始序列。
步骤S208,对当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征。
其中,特征提取用于从数据中提取出可表征数据语义的特征信息。当前搜索语句特征是指当前搜索语句对应的搜索语句特征。
具体地,计算机设备可以对当前搜索语句进行特征提取,得到当前搜索语句特征。进一步的,为了搜索到与当前搜索语句和当前搜索对象均匹配的搜索结果,将当前搜索语句对应的当前搜索语句特征和当前搜索对象对应的搜索对象特征初始序列进行融合,从而得到搜索融合特征。搜索融合特征既包含当前搜索语句对应的语义信息,又包含当前搜索对象对应的属性信息,基于搜索融合特征可以获取到更准确的搜索结果。
在一个实施例中,特征提取具体可以是先对当前搜索语句进行特征转换得到初始搜索语句特征,再对初始搜索语句特征进行特征增强得到当前搜索语句特征。通过特征增强使得当前搜索语句特征的语义表征能力得到增强。
步骤S210,基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。
其中,候选召回资源库包括多个候选召回资源。候选召回资源是指候选的信息资源,待确定是否召回的信息资源。匹配召回资源是指与搜索融合特征匹配的候选召回资源。当前召回结果是指当前搜索对象基于当前搜索语句通过本申请方案进行搜索得到的召回结果、搜索结果。
具体地,计算机设备可以基于搜索融合特征从候选召回资源库中查询相匹配的候选召回资源,将与搜索融合特征匹配的候选召回资源作为搜索融合特征对应的匹配召回资源,将匹配召回资源作为当前搜索对象对应的当前召回结果。可以理解,候选召回资源存在对应的召回信息特征,基于搜索融合特征和召回信息特征之间的特征相似度,可以从候选召回资源库中快速确定匹配召回资源。
当前召回结果可以包括至少一个匹配召回资源,当前召回结果可以在终端进行排序展示,便于当前搜索对象通过终端阅览各个搜索结果。
上述搜索召回方法中,历史正向召回信息序列隐含了当前搜索对象的对象属性,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征当前搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合当前搜索语句对应的当前搜索语句特征和当前搜索对象对应的搜索对象特征得到的搜索融合特征,既包含当前搜索语句对应的语义信息,又包含当前搜索对象对应的属性信息,基于这样的搜索融合特征从候选召回资源库中获取到的匹配召回资源不仅与当前搜索语句匹配,而且还与当前搜索对象匹配,具有更高的准确性,可以有效提高搜索召回的准确性,实现针对当前搜索对象的个性化召回。
在一个实施例中,基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列,包括:
基于历史搜索语句特征序列和正向召回信息特征序列进行搜索语句和召回信息的对齐,得到历史正向召回信息序列对应的搜索语句特征对齐序列;基于搜索语句特征对齐序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。
其中,历史搜索语句序列中的历史搜索语句和历史正向召回信息序列中的历史正向召回信息所对应的历史正向召回资源可能不是一一对应的,例如,历史搜索语句序列包括最近20条搜索语句,历史正向召回信息序列包括最近20条被用户点击的召回视频所对应的视频信息,这20条召回视频和20条搜索语句并不是一一对应的,这20条被用户点击的召回视频可能只是其中3条搜索语句的搜索结果中包含的召回视频。搜索语句和召回信息的对齐用于从历史搜索语句特征序列中,筛选出与正向召回信息特征序列中的历史正向召回信息特征相关的历史搜索语句特征,并将筛选出的历史搜索语句特征和对应的历史正向召回信息特征进行特征对齐。特征对齐用于将筛选出的历史搜索语句特征转换为与对应的历史正向召回信息特征具有相同特征长度的特征。可以理解,从历史搜索语句特征序列中筛选出与正向召回信息特征序列中的历史正向召回信息特征相关的历史搜索语句特征,相当于从历史搜索语句序列中筛选出与历史正向召回资源相关的历史搜索语句。
搜索语句特征对齐序列包括历史正向召回信息序列中各个历史正向召回信息分别对应的、经过特征对齐的搜索语句特征。
具体地,一般情况下,历史正向召回信息序列中的信息和历史搜索语句序列中的信息不是一一对应的,为了提高解调准确性,计算机设备可以先对两个序列进行对齐,再进行解调。
计算机设备基于历史搜索语句特征序列和正向召回信息特征序列进行搜索语句和召回信息的对齐,具体可以基于历史搜索语句特征和历史正向召回信息特征,从历史搜索语句特征序列中获取与历史正向召回信息相关的历史搜索语句特征,并进行特征对齐来生成历史正向召回信息对应的、经过特征对齐的搜索语句特征,基于各个历史正向召回信息对应的、经过特征对齐的搜索语句特征组成历史正向召回信息序列所对应的搜索语句特征对齐序列。进而,计算机设备基于搜索语句特征对齐序列对正向召回信息特征序列进行解调处理,从而得到当前搜索对象对应的搜索对象特征初始序列。
可以理解,若历史正向召回信息序列中的信息和历史搜索语句序列中的信息是一一对应的,那么可以直接进行解调处理。
在一个实施例中,可以对历史搜索语句特征序列和正向召回信息特征序列进行注意力处理来实现搜索语句和召回信息的对齐,从而得到历史正向召回信息序列对应的搜索语句特征对齐序列。注意力处理是基于注意力机制(attention机制)实现的数据处理。
上述实施例中,在进行解调处理时,先进行搜索语句和召回信息的对齐得到搜索语句特征对齐序列,再基于搜索语句特征对齐序列,对正向召回信息特征序列进行解调处理,最终可以解调得到更准确的搜索对象特征初始序列。
在一个实施例中,基于历史搜索语句特征序列和正向召回信息特征序列进行搜索语句和召回信息的对齐,得到历史正向召回信息序列对应的搜索语句特征对齐序列,包括:
基于历史搜索语句特征序列中的历史搜索语句特征和正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重;基于同一历史正向召回信息对应的各个关联权重,对历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征;基于各个搜索语句对齐特征得到搜索语句特征对齐序列。
其中,特征相似度用于表征不同特征之间的相似程度。特征相似度越大,表明不同特征之间越相似。关联权重用于表征不同特征之间的关联程度。特征相似度越大,关联权重越大。
搜索语句特征对齐序列包括各个历史正向召回信息分别对应的搜索语句对齐特征,即包括各个历史正向召回信息特征分别对应的搜索语句对齐特征。搜索语句对齐特征是将更新搜索语句特征序列经过特征对齐得到的搜索语句特征。可以理解,搜索语句对齐特征与历史正向召回信息特征具有相同的特征长度,便于进行后续进行解调处理。
具体地,在进行搜索语句和召回信息的对齐时,计算机设备可以计算历史搜索语句序列中的历史搜索语句和历史正向召回信息序列中的历史正向召回信息之间的关联程度,基于关联程度对历史搜索语句序列进行处理来得到各个历史正向召回信息分别对应的搜索语句对齐特征,进而将各个搜索语句对齐特征进行组合得到搜索语句特征对齐序列。
具体可以计算历史搜索语句特征序列中的历史搜索语句特征和正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到任意的历史搜索语句特征和任意的历史正向召回信息特征之间的特征相似度,基于历史搜索语句特征和历史正向召回信息特征之间的特征相似度来生成对应的历史正向召回信息和历史搜索语句之间的关联权重。例如,可以将特征相似度作为关联权重。历史搜索语句特征序列包括各个历史搜索语句分别对应的历史搜索语句特征,因此可以计算得到同一历史正向召回信息分别和各个历史搜索语句之间的关联权重,从而同一历史正向召回信息对应多个关联权重。进而,基于同一历史正向召回信息对应的各个关联权重,对历史搜索语句特征序列中对应的各个历史搜索语句特征进行加权融合,得到同一历史正向召回信息对应的搜索语句对齐特征。由于存在多个历史正向召回信息,可以得到各个历史正向召回信息分别对应的搜索语句对齐特征。最后,将各个搜索语句对齐特征组合得到搜索语句特征对齐序列。
举例说明,假设历史搜索语句特征序列包括历史搜索语句A1对应的历史搜索语句特征a1、历史搜索语句A2对应的历史搜索语句特征a2、历史搜索语句A3对应的历史搜索语句特征a3。正向召回信息特征序列包括历史正向召回信息B1对应的历史正向召回信息特征b1、历史正向召回信息B2对应的历史正向召回信息特征b2、历史正向召回信息B3对应的历史正向召回信息特征b3。
以历史正向召回信息B1为例,计算历史正向召回信息特征b1分别和历史搜索语句特征a1、历史搜索语句特征a2、历史搜索语句特征a3之间的特征相似度,将特征相似度作为关联权重,得到历史正向召回信息B1和历史搜索语句A1之间的关联权重c1、历史正向召回信息B1和历史搜索语句A2之间的关联权重c2、历史正向召回信息B1和历史搜索语句A3之间的关联权重c3。基于关联权重c1对历史搜索语句特征a1进行调整,得到更新搜索语句特征a1’,基于关联权重c2对历史搜索语句特征a2进行调整,得到更新搜索语句特征a2’,基于关联权重c3对历史搜索语句特征a3进行调整,得到更新搜索语句特征a3’。融合更新搜索语句特征a1’、 更新搜索语句特征a2’和更新搜索语句特征a3’得到历史正向召回信息B1对应的搜索语句对齐特征d1。基于相同的方法计算得到历史正向召回信息B2对应的搜索语句对齐特征d2、历史正向召回信息B3对应的搜索语句对齐特征d3。将搜索语句对齐特征d1、搜索语句对齐特征d2和搜索语句对齐特征d3组成搜索语句特征对齐序列。
后续在进行解调时,可以基于搜索语句对齐特征d1对历史正向召回信息特征b1进行解调,基于搜索语句对齐特征d2对历史正向召回信息特征b2进行解调,搜索语句对齐特征d3对历史正向召回信息特征b3进行解调,基于各个解调结果得到搜索对象特征序列。
上述实施例中,基于历史搜索语句特征和历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重,关联权重可以反映历史正向召回信息和历史搜索语句之间的相关程度。基于同一历史正向召回信息对应的各个关联权重,对历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征,搜索语句对齐特征为对齐后的搜索语句特征,搜索语句对齐特征中加强了与历史正向召回信息相关的历史搜索语句的语义信息。基于各个搜索语句对齐特征得到搜索语句特征对齐序列,搜索语句特征对齐序列有助于提高后续解调处理的准确性。
在一个具体的实施例中,参考图3说明进行搜索语句和召回信息的对齐的数据处理过程。对历史搜索语句特征序列和历史正向召回信息特征序列(即正向召回信息特征序列)进行注意力处理来实现搜索语句和召回信息的对齐,最终得到搜索语句特征对齐序列。具体可以将历史正向召回信息特征序列作为attention机制中的Query向量(简称Q),将历史搜索语句特征序列作为attention机制中的Key向量(简称K),将历史搜索语句特征序列作为attention机制中的Value向量(简称V)。基于Q和K计算得到中间结果,基于中间结果和V计算得到最终的注意力处理结果。例如,计算Q和K之间的相似度作为权重,基于权重对V进行处理得到注意力处理结果。
在一个实施例中,基于搜索语句特征对齐序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列,包括:
在搜索语句特征对齐序列和正向召回信息特征序列中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征序列;基于解调权重,对语句融合特征序列进行调整,得到搜索对象特征初始序列。
其中,语句融合特征序列包括各个历史正向召回信息分别对应的语句融合特征,语句融合特征是将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合得到的。解调权重用于对语句融合特征进行调整得到搜索对象特征。不同历史正向召回信息对应的解调权重可以相同可以不同。解调权重可以是预先设置的,可以是通过模型训练得到的。
具体地,搜索语句特征对齐序列包括各个历史正向召回信息分别对应的搜索语句对齐特征,正向召回信息特征序列包括各个历史正向召回信息分别对应的历史正向召回信息特征。在进行解调处理时,计算机设备可以先将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征。由于存在多个历史正向召回信息,可以得到多个语句融合特征,各个语句融合特征组成语句融合特征序列。进而,计算机设备获取解调权重,基于解调权重对语句融合特征进行调整得到初始的搜索对象特征,将各个初始的搜索对象特征组合得到搜索对象特征初始序列。
上述实施例中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合相当于时域乘积,基于解调权重,对融合得到的语句融合特征序列进行调整,可以得到更准确的搜索对象特征初始序列。
在一个具体的实施例中,参考图4说明解调处理的数据处理过程。将搜索语句特征对齐序列和历史正向召回信息特征序列按位相乘,得到搜索对象特征初始序列。在按位相乘时,每一位数据存在对应的解调权重,在按位相乘时基于解调权重进行加权相乘。解调权重可以是可学习权重,可学习权重是指在模型训练时可以被调整的权重,可学习权重作为模型的一种模型参数,随着模型训练而被调整。模型训练结束,模型学习结束,可学习权重就固定了。
在一个实施例中,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征,包括:
对搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列;融合当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征。
其中,小波变换是将信号分解为一系列的小波函数的叠加,将信号分解为一系列不同尺度、时间的小波函数的叠加,而这些小波函数都是一个母小波经过平移和尺度伸缩得来的。小波变换是空间(时间)和频率的局部变换,能有效地从信号、数据中提取信息,可对信号、数据进行多尺度的细化分析。
傅里叶变换是将信号分解成一系列不同频率的正余弦函数的叠加,但是傅里叶变换无法区分非稳定信号的区别。参考图5,图5中展示了三个信号和三个信号分别对应的傅里叶变换结果。图5中的第一个信号是频率始终不变的稳定信号,第二个信号和第三个信号是频率随着时间改变的非稳定信号,三个信号同样包含相同频率的四个成分。做傅里叶变换(FFT)后,可以发现这三个时域上有巨大差异的信号,频谱却非常一致,尤其是两个非稳定信号,从频谱上无法区分它们。
与傅里叶变换不同的是,小波变换可以用于处理非稳定信号,可以看到不同时间分辨率下的频谱变化,没有丢失时间维度信息,可以完整的表示非稳定信号的特性。历史搜索语句序列和历史正向召回信息序列通常是非稳定信号,引入小波变换,可以提取到更准确的搜索对象特征。
搜索对象特征目标序列是指目标的搜索对象特征序列。搜索对象特征目标序列包括多个目标的搜索对象特征。可以理解,相比于初始的搜索对象特征,目标的搜索对象特征是更细化、更准确的搜索对象特征。
具体地,在基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列后,计算机设备可以进一步对搜索对象特征初始序列进行小波变换,从搜索对象特征初始序列中分解出至少两个搜索对象特征目标序列,将当前搜索语句特征和各个搜索对象特征目标序列进行融合,最终得到搜索融合特征。
上述实施例中,对搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,融合当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征。通过小波变换可以提取到更准确的搜索对象特征,再将搜索对象特征和当前搜索语句特征进行融合,可以得到更准确的搜索融合特征。
在一个实施例中,对搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:
将搜索对象特征初始序列作为当前处理序列;获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列;对第一特征滤波序列进行下采样处理,得到第一特征下采样序列,对第二特征滤波序列进行下采样处理,得到第二特征下采样序列;将第二特征下采样序列作为当前处理序列,返回获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,直至满足结束条件,得到各个第一特征下采样序列和各个第二特征下采样序列;基于各个第一特征下采样序列和各个第二特征下采样序列,得到至少两个搜索对象特征目标序列。
其中,滤波频率可以根据实际需要进行设置。例如,滤波频率可以设置为当前处理序列对应的频率区间中的中位值。
结束条件可以根据实际需要进行设置,结束条件包括但不限于滤波次数大于或等于预设次数、或经过下采样处理后的序列的长度小于预设长度等中的至少一者。
具体地,小波变换具体可以是对信号进行多级分解,每级分解时的数据处理包括高通滤波、低通滤波和下采样处理。下一级待分解的信号是基于上一级的分解结果得到的。
在第一轮分解中,计算机设备将搜索对象特征初始序列作为当前处理序列,获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除得到第一特征滤波序列,即对当前处理序列进行高通滤波得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除得到第二特征滤波序列,即对当前处理序列进行低通滤波得到第二特征滤波序列。参考奈奎斯特抽样定理,信号经过滤波后,频率降低,所以采样频率也可以降低,所以序列可以进行下采样处理。因此,可以对第一特征滤波序列进行下采样处理得到第一特征下采样序列,对第二特征滤波序列进行下采样处理得到第二特征下采样序列。滤波操作后的下采样操作不影响分辨率,由于滤波操作使得有一部分的样本点是冗余的,而下采样操作只不过是去除了这些冗余的样本点,而且去除这些冗余的样本点也不会丢失任何信息。总之,滤波可以使得分辨率减小,但是尺度因子不变,经过下采样处理后,尺度因子才可以翻倍。
在第二轮分解中,计算机设备将经过第一轮分解得到的第二特征下采样序列作为新的当前处理序列,返回获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,也就是,对新的当前处理序列进行新一轮的高通滤波、低通滤波、下采样处理,得到新的第一特征下采样序列和第二特征下采样序列。以此类推,经过若干轮分解后,若满足结束条件,则停止进行分解,最终可以得到多个第一特征下采样序列和多个第二特征下采样序列。
最后,基于分解得到的各个第一特征下采样序列和第二特征下采样序列,得到至少两个搜索对象特征目标序列。例如,可以从各个第一特征下采样序列和各个第二特征下采样序列中筛选若干个序列作为搜索对象特征目标序列。
上述实施例中,在进行小波变换时,对搜索对象特征初始序列进行多级分解,能够从搜索对象特征初始序列中分解出更精细、更准确的搜索对象特征。
在一个实施例中,对搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:
对搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列;对搜索对象特征中间序列进行小波变换,得到至少两个搜索对象特征目标序列。
其中,滤波处理用于滤除信号、数据中的噪声信息。
具体地,在进行小波变换时,为了提高数据处理准确性,计算机设备可以先对搜索对象特征初始序列进行滤波处理,滤除噪声信息,得到搜索对象特征中间序列,再对搜索对象特征中间序列进行小波变换,得到至少两个搜索对象特征目标序列。
计算机设备可以通过滤波器对搜索对象特征初始序列进行滤波处理。
上述实施例中,在进行小波变换时,先进行滤波处理,再进行小波变换,能够提高小波变换的数据处理准确性。
在一个具体的实施例中,参考图6说明小波变换的数据处理过程。在对搜索对象特征中间序列进行小波变换时,具体可以对搜索对象特征中间序列进行三级分解。在第一级分解(即J=1)中,对搜索对象特征中间序列进行高通滤波得到第一高通滤波序列,对第一高通滤波序列进行下采样处理得到第一高通下采样序列d1,对搜索对象特征中间序列进行低通滤波得到第一低通滤波序列,对第一低通滤波序列进行下采样处理得到第一低通下采样序列a1。在第二级分解(即J=2)中,对第一低通下采样序列a1进行高通滤波得到第二高通滤波序列,对第二高通滤波序列进行下采样处理得到第二高通下采样序列d2,对第一低通下采样序列a1进行低通滤波得到第二低通滤波序列,对第二低通滤波序列进行下采样处理得到第二低通下采样序列a2。在第三级分解(即J=3)中,对第二低通下采样序列a2进行高通滤波得到第三高通滤波序列,对第三高通滤波序列进行下采样处理得到第三高通下采样序列d3,对第二低通下采样序列a2进行低通滤波得到第三低通滤波序列,对第三低通滤波序列进行下采样处理得到第三低通下采样序列a3。可以将第一高通下采样序列d1、第二高通下采样序列d2和第三低通下采样序列a3分别作为搜索对象特征目标序列。
在一个实施例中,对搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列,包括:
对搜索对象特征初始序列进行频域变换,得到初始频域信息;基于滤波权重,对初始频域信息进行调整,得到目标频域信息;对目标频域信息进行时域变换,得到搜索对象特征中间序列。
其中,频域变换是将信号从时域变换到频域。时域变换是将信号从频域变换到时域。滤波权重用于滤除噪声信息。滤波权重可以是预先设置的,可以是通过模型训练得到的。
具体地,在进行滤波处理时,计算机设备先对搜索对象特征初始序列进行频域变换,将其变换到频域,得到初始频域信息,从初始频域信息中滤除噪声信息得到目标频域信息,再将目标频域信息进行时域变换,将其还原到时域,最终得到搜索对象特征中间序列。
在滤除噪声信息时,获取滤波权重,基于滤波权重对初始频域信息进行调整得到目标频域信息。例如,将滤波权重和初始频域信息相乘得到目标频域信息。
上述实施例中,对搜索对象特征初始序列进行频域变换,基于滤波权重,可以快速对转换得到的初始频域信息进行调整,快速滤除噪声信息,对滤波得到的目标频域信息进行时域变换,最终得到搜索对象特征中间序列。
在一个具体的实施例中,参考图7说明滤波处理的数据处理过程。对搜索对象特征初始序列Xuser进行傅里叶变换(FFT),将其变换为频域,得到频域信息Fuser。将Fuser按位乘滤波权重来实现滤波器的滤波处理,得到滤波后的频域信息。将滤波后的频域信息进行傅里叶反变换(IFFT),将其变换回时域,得到搜索对象特征中间序列。
在一个实施例中,融合当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征,包括:
分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征;获取当前搜索语句特征和各个搜索对象目标特征分别对应的特征权重;基于特征权重,融合各个搜索对象目标特征和当前搜索语句特征,得到搜索融合特征。
其中,池化处理是一种数据压缩方式,对不同特征进行聚合统计处理以降低特征的维度。搜索对象目标特征是对搜索对象特征目标序列进行池化处理得到的。在一个实施例中,池化处理可以是均值池化(mean pooling)。
特征权重用于表征特征的重要性。特征越重要,特征权重越大。可以通过计算特征重要性的算法来获取特征权重,也可以通过模型来获取特征权重。
具体地,在融合当前搜索语句特征和各个搜索对象特征目标序列时,计算机设备先分别对各个搜索对象特征目标序列进行池化处理,得到各个搜索对象特征目标序列分别对应的搜索对象目标特征,融合各个搜索对象目标特征和当前搜索语句特征得到搜索融合特征。
在融合时,除了直接融合,为了提高数据处理准确性,还可以进一步获取当前搜索语句特征和各个搜索对象目标特征分别对应的特征权重,基于特征权重,对各个搜索对象目标特征和当前搜索语句特征进行加权融合,最终得到搜索融合特征。
上述实施例中,分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征,池化处理可以精简数据,保留特征中的重要信息。基于当前搜索语句特征和各个搜索对象目标特征分别对应的特征权重,融合各个搜索对象目标特征和当前搜索语句特征,可以得到更准确的搜索融合特征。
在一个实施例中,候选召回资源库包括多个候选召回资源。
基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果,包括:
计算各个候选召回资源对应的候选召回信息的候选召回信息特征分别和搜索融合特征之间的特征相似度;基于特征相似度,从各个候选召回信息中确定匹配召回信息;从候选召回数据库中,将匹配召回信息对应的候选召回资源作为匹配召回资源,得到当前召回结果。
其中,候选召回信息特征是指候选召回信息的特征表示。候选召回信息是指候选召回资源对应的召回信息。
匹配召回信息是基于特征相似度从各个候选召回信息中筛选出的候选召回信息。例如,将最大特征相似度对应的候选召回信息作为匹配召回信息;将各个候选召回信息按照特征相似度从大到小排列,获取排序靠前的若干个候选召回信息分别作为匹配召回信息;将数值大于预设相似度的特征相似度所对应的候选召回信息作为匹配召回信息;等等。
匹配召回资源是指匹配召回信息对应的候选召回资源。
具体地,在基于搜索融合特征确定匹配召回资源时,计算机设备可以获取候选召回资源库中各个候选召回资源分别对应的候选召回信息特征,计算搜索融合特征分别和各个候选召回信息特征之间的特征相似度。特征相似度可以反映特征之间的匹配程度,反映候选召回资源和当前搜索语句、当前搜索对象的匹配程度,因此,可以基于各个特征相似度从各个候选召回信息中确定匹配召回信息。例如,将各个候选召回信息按照特征相似度从大到小排列,获取排序靠前的若干个候选召回信息分别作为匹配召回信息。最终,从候选召回数据库中,获取匹配召回信息对应的候选召回资源作为匹配召回资源,将匹配召回资源作为当前召回结果。
上述实施例中,基于候选召回资源对应的候选召回信息特征和搜索融合特征之间的特征相似度,从候选召回数据库中,可以快速确定准确的匹配召回资源,快速得到准确的当前召回结果。
在一个实施例中,如图8所示,搜索召回方法还包括:
步骤S802,对候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,得到候选召回资源对应的候选召回信息特征。
步骤S804,对当前搜索语句进行特征转换,得到对应的初始搜索语句特征,将初始搜索语句特征、历史搜索语句特征序列、正向召回信息特征序列输入目标召回模型中的搜索语句处理网络,得到搜索融合特征。
步骤S806,基于搜索融合特征分别和各个候选召回信息特征之间的特征相似度,从候选召回资源库中获取匹配召回资源作为当前召回结果。
其中,目标召回模型是指已训练的目标召回模型。目标召回模型的输入数据包括候选召回信息对应的初始召回信息特征、当前搜索语句对应的初始搜索语句特征、当前搜索对象的历史搜索语句序列对应的历史搜索语句特征序列、当前搜索对象的历史正向召回信息序列对应的正向召回信息特征序列。目标召回模型的输出数据包括搜索融合特征和候选召回信息对应的候选召回信息特征。
初始召回信息特征是指候选召回信息对应的初始的召回信息特征,候选召回信息特征是指候选召回信息对应的目标的召回信息特征。相比于初始召回信息特征,候选召回信息特征是经过模型数据处理得到的,候选召回信息特征具有更高的准确性、更强的语义表征能力。同理,相比于初始搜索语句特征,当前搜索语句特征具有更高的准确性、更强的语义表征能力。
目标召回模型为双塔模型,包括召回信息处理网络和搜索语句处理网络。召回信息处理网络用于对候选召回信息的相关数据进行处理。搜索语句处理网络用于对当前搜索语句的相关数据进行处理。召回信息处理网络的输入数据为候选召回资源的候选召回信息所对应的初始召回信息特征,输出数据为候选召回信息特征。搜索语句处理网络的输入数据为当前搜索对象的当前搜索语句对应的初始搜索语句特征、当前搜索对象的历史搜索语句序列对应的历史搜索语句特征序列、当前搜索对象的历史正向召回信息序列对应的正向召回信息特征序列,输出数据为搜索融合特征。
具体地,计算机设备可以借助机器学习模型来快速确定当前搜索对象对应的当前召回结果。
计算机设备对候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到各个候选召回资源分别对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,经过召回信息处理网络的数据处理,得到各个候选召回资源分别对应的候选召回信息特征。
计算机设备对当前搜索语句、历史搜索语句序列和历史正向召回信息序列进行特征转换,得到当前搜索语句对应的初始搜索语句特征、历史搜索语句序列对应的历史搜索语句特征序列、历史正向召回信息序列对应的正向召回信息特征序列,将初始搜索语句特征、历史搜索语句特征序列、正向召回信息特征序列输入目标召回模型中的搜索语句处理网络,经过搜索语句处理网络的数据处理,得到搜索融合特征。
在获取到搜索融合特征和各个候选召回资源对应的候选召回信息特征后,计算机设备计算搜索融合特征分别和各个候选召回信息特征之间的特征相似度,基于特征相似度从候选召回资源库中获取匹配召回资源作为当前召回结果。例如,获取大于预设相似度的特征相似度所对应的候选召回资源作为匹配召回资源。
在一个实施例中,在获取当前搜索语句之前,可以预先基于目标召回模型中的召回信息处理网络得到各个候选召回资源分别对应的候选召回信息特征,存储各个候选召回资源分别对应的候选召回信息特征。在获取当前搜索语句后,只需要基于目标召回模型中的搜索语句处理网络得到搜索融合特征,然后直接获取各个候选召回资源分别对应的候选召回信息特征,基于搜索融合特征和候选召回信息特征之间的特征相似度,快速从候选召回资源库中获取对应的匹配召回资源作为当前召回结果。
上述实施例中,通过目标召回模型可以快速提取得到候选召回资源对应的候选召回信息特征,快速提取得到搜索融合特征,进而基于候选召回信息特征和搜索融合特征可以快速确定当前召回结果。并且,目标召回模型也可以保障提取到的特征的准确性,进而保障当前召回结果的准确性。
在一个具体的实施例中,参考图9,目标召回模型为双塔模型,包括召回信息处理网络和搜索语句处理网络。
将当前搜索语句对应的初始搜索语句特征输入搜索语句处理网络,将初始搜索语句特征输入至搜索语句处理网络中的处理层,处理层输出当前搜索语句对应的当前搜索语句特征。将当前搜索对象对应的历史搜索语句特征序列和历史正向召回信息特征序列输入搜索语句处理网络,历史搜索语句特征序列和历史正向召回信息特征序列输入至搜索语句处理网络中的软对齐层,软对齐层输出搜索语句特征对齐序列。将搜索语句特征对齐序列和历史正向召回信息特征序列输入至搜索语句处理网络中的解调层(也可以称为解调器),解调层输出搜索对象特征初始序列。将搜索对象特征初始序列输入至搜索语句处理网络中的滤波层(也可以称为滤波器),滤波层输出搜索对象特征中间序列。将搜索对象特征中间序列输入至搜索语句处理网络中的小波变换层,小波变换层输出搜索对象特征目标序列。将搜索对象特征目标序列输入至搜索语句处理网络中的池化层,池化层输出搜索对象目标特征。将搜索对象目标特征和当前搜索语句特征输入至搜索语句处理网络中的特征融合层,特征融合层输出搜索融合特征。
将候选召回资源对应的初始召回信息特征输入召回信息处理网络中的处理层,处理层输出候选召回资源对应的候选召回信息特征。
在一个实施例中,历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句。
具体地,在当前的大搜索时代,搜索呈现搜索场景多元化的特性,历史正向召回信息序列对应的历史正向召回资源序列可以包括至少两个搜索场景分别对应的历史正向召回资源,历史搜索语句序列也可以包括至少两个搜索场景分别对应的历史搜索语句,相当于历史正向召回资源序列和历史搜索语句序列为多场景序列。从多场景序列中挖掘搜索对象的搜索对象特征,由于多场景序列包含更丰富的信息,从中可以挖掘到更丰富、更准确的搜索对象特征。并且,多场景序列为不稳定信号,本申请中引入小波变换也可以保障最终得到的搜索融合特征的准确性。
在一个实施例中,搜索场景可以根据搜索结果的展示交互方式来划分。例如,搜索场景可以包括双列流场景、单列流场景、沉浸流场景等。双列流场景是指单屏以双列形式展示搜索结果。在双列流场景中,可以同步展示多个信息资源,多个信息资源排列成两个队列进行展示。单列流场景是指单屏以单列形式展示搜索结果。在单列流场景中,也可以同步展示多个信息资源,但是多个信息资源排列成一个队列进行展示。沉浸流场景是指单屏展示一个搜索结果,通过切换操作切换搜索结果,展示另一个信息资源。在沉浸流场景中,无法同步展示多个信息资源。
参考图10,以视频搜索为例,示出了双列流场景、单列流场景和沉浸流场景的界面示意图。
在一个实施例中,历史正向召回信息包括历史正向召回资源对应的资源介绍信息或资源统计信息中的至少一种。资源介绍信息用于介绍资源,可以反映资源的固有信息。针对不同的用户,同一资源的资源介绍信息是相同的。资源统计信息是统计用户针对资源的操作行为得到的,可以反映资源和用户之间的互动情况,是个性化信息。针对不同的用户,同一资源的资源统计信息是不同的。
举例说明,若资源为视频,历史正向召回信息包括历史正向召回视频的视频标题、视频时长等视频介绍信息,还包括历史正向召回视频的视频播放次数、视频完整播放比例等视频统计信息。视频完整播放比例是指在所有播放次数中,视频完整播放的次数占比。
在一个实施例中,参考图11,搜索召回方法还包括:
步骤S1102,响应于针对在第一视频搜索场景下录入的当前搜索语句的搜索操作,展示当前搜索语句对应的视频播放入口集合;第一视频搜索场景用于同步展示同一搜索语句对应的至少两个初始召回视频的视频播放入口。
步骤S1104,响应于针对视频播放入口集合中目标播放入口的选择操作,进入第二视频搜索场景,播放目标播放入口对应的目标召回视频。
步骤S1106,响应于针对目标召回视频的切换操作,播放当前召回结果中的匹配召回视频。
其中,初始召回视频是指基于搜索语句搜索得到的初始视频。初始召回视频可以是基于传统方式召回的视频,例如,针对当前搜索语句,可以基于当前搜索语句对应的搜索语句特征和候选召回视频对应的召回视频特征之间的特征相似度,获取特征相似度大于预设阈值的候选召回视频作为当前搜索语句对应的初始召回视频;也可以是获取视频介绍信息包含当前搜索语句的候选召回视频作为当前搜索语句对应的初始召回视频;等等。
目标召回视频是指通过选择视频播放入口从初始召回视频中确定的目标视频。
第一视频搜索场景用于同步展示同一搜索语句对应的至少两个初始召回视频的视频播放入口,例如,第一视频搜索场景为双列流场景或单列流场景,以双列或单列的形式展示视频播放入口。第二视频搜索场景用于切换播放当前召回结果中的匹配召回视频,例如,第二搜索场景为沉浸流场景,先播放目标召回视频,然后通过切换操作从播放目标召回视频切换到播放匹配召回视频。
视频播放入口集合包括至少两个视频播放入口。视频播放入口用于触发播放视频。目标播放入口是从视频播放入口集合中选中的视频播放入口。
搜索操作用于触发展开针对当前搜索语句的视频搜索。搜索操作可以是针对搜索控件的触发操作。触发操作具体可以是触摸操作、光标操作、按键操作或者语音操作,触摸操作可以是触摸点击操作、触摸按压操作或者触摸滑动操作,触摸操作可以是单点触摸操作或者多点触摸操作,光标操作可以是控制光标进行点击的操作或者控制光标进行按压的操作,按键操作可以是虚拟按键操作或者实体按键操作等。
选择操作用于从视频播放入口集合中选择一个视频播放入口。与触发操作类似,选择操作也可以是触摸操作、光标操作、按键操作或者语音操作。
切换操作用于切换当前播放的视频。与触发操作类似,切换操作也可以是触摸操作、光标操作、按键操作或者语音操作。例如,切换操作可以是下滑操作,通过下滑操作从播放目标召回视频切换到播放匹配召回视频。当然,切换操作也可以是在目标召回视频播放结束后自动触发的。例如,在目标召回视频播放结束后,自动播放匹配召回视频。
具体地,在进行视频搜索时,先进入第一搜索场景,用户可以在终端上输入当前搜索语句,并触发搜索控件。终端响应于针对在第一视频搜索场景下录入的当前搜索语句的搜索操作,展示当前搜索语句对应的视频播放入口集合,当前搜索语句对应的视频播放入口集合包括基于当前搜索语句召回的至少两个初始召回视频分别对应的视频播放入口。用户可以从展示的各个视频播放入口中选择一个视频播放入口来触发相应视频的播放。终端响应于针对视频播放入口集合中目标播放入口的选择操作,进入第二视频搜索场景,播放目标播放入口对应的目标召回视频。在播放目标召回视频的过程中,用户可以通过快速切换来直接观看其他视频。终端响应于针对目标召回视频的切换操作,从播放目标召回视频切换到播放当前召回结果中的匹配召回视频。
可以理解,若当前召回结果包括多个匹配召回视频,当前召回结果中的各个匹配召回视频可以是按照视频信息特征(即候选召回信息特征)分别和搜索融合特征之间的特征相似度从大到小进行排序的。那么,在第二视频搜索场景中,可以按照当前召回结果中各个匹配召回视频的排序来进行切换播放。例如,在播放目标召回视频的过程中,若检测到用户的第一次下滑操作,则从目标召回视频切换到播放当前召回结果中的第一个匹配召回视频,若检测到用户的第二次下滑操作,则从第一个匹配召回视频切换到播放当前召回结果中的第二个匹配召回视频,以此类推。
在一个具体的实施例中,在视频播放应用中,用户可以在搜索框中输入搜索语句来搜索相关视频,搜索结果先以双列流形式呈现。参考图12,用户在搜索框中输入“动画A”来搜索动画A的相关视频,先以双列流形式向用户呈现动画A的相关视频的视频信息。视频信息可以包括视频标题、视频时长、视频作者、视频播放量、单个视频画面等信息。视频信息可以作为视频播放入口。用户点击任意视频的视频信息就可以触发开始进行视频播放。参考图12,用户点击视频1202的任意视频信息,则进入以沉浸流形式播放用户点击的视频。用户可以通过下滑操作来切换当前播放的视频。若检测到用户的下滑操作,则播放用户对应的当前召回结果中的匹配召回视频。
上述实施例中,通过第一视频搜索场景中的视频播放入口可以快速切换至第二视频搜索场景。通过本申请方案得到的当前召回结果可以应用于第二视频搜索场景,对当前搜索对象实现个性化视频内容分发。
在一个具体的实施例中,如图13所示,提供了一种搜索召回方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图13,搜索召回方法包括以下步骤:
步骤S1302,对候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,得到候选召回信息对应的候选召回信息特征。
步骤S1304,获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列,当前搜索对象为当前搜索语句对应的搜索对象。
步骤S1306,分别对当前搜索语句、历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的初始搜索语句特征、历史搜索语句特征序列、正向召回信息特征序列,将初始搜索语句特征、历史搜索语句特征序列、正向召回信息特征序列输入目标召回模型中的搜索语句处理网络。
步骤S1308,基于搜索语句特征序列和正向召回信息特征序列进行搜索语句和召回信息的对齐,得到历史正向召回信息序列对应的搜索语句特征对齐序列。
步骤S1310,基于搜索语句特征对齐序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。
步骤S1312,对搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列。
步骤S1314,对搜索对象特征中间序列进行小波变换,得到至少两个搜索对象特征目标序列。
步骤S1316,融合当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征。
步骤S1318,基于搜索融合特征分别和各个候选召回信息特征之间的特征相似度,从候选召回资源库中获取匹配召回资源作为当前召回结果。
在一个实施例中,如图14所示,提供了一种召回模型训练方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器,由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。参考图14,召回模型训练方法包括以下步骤:
步骤S1402,获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列输入初始召回模型;训练搜索对象为训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息。
其中,训练搜索语句是指用于模型训练的搜索语句。训练搜索语句对应的正向召回信息是指训练搜索语句对应的正向召回资源所对应的召回信息。训练搜索语句对应的反向召回信息是指训练搜索语句对应的反向召回资源所对应的召回信息。正向召回信息用于在模型训练时作为正样本,反向召回信息用于在模型训练时作为负样本。
训练搜索对象是指训练搜索语句对应的搜索对象。初始召回模型是指待训练的召回模型。
在一个实施例中,正向召回资源是训练搜索语句的所有召回资源中目标操作状态对应的召回资源。反向召回资源是训练搜索语句的所有召回资源中非目标操作状态对应的召回资源。
在一个实施例中,正向召回资源是目标操作状态对应的、且操作时长大于或等于第一预设时长的召回资源,反向召回资源包括目标操作状态对应的、且操作时长小于第二预设时长的召回资源和非目标操作状态对应的召回资源,第一预设时长大于或等于第二预设时长。
其中,操作状态是根据搜索对象针对搜索语句的召回资源的操作行为来确定的。目标操作状态用于表征搜索对象触发了召回资源,非目标操作状态用于表征搜索对象没有触发召回资源。例如,若召回资源被搜索对象浏览,则召回资源对应的操作状态为目标操作状态,若召回资源没有被搜索对象浏览,则召回资源对应的操作状态为非目标操作状态。操作时长用于表征搜索对象针对召回资源的操作行为的持续时长。例如,操作时长是指资源浏览时长。正向召回资源是目标操作状态对应的、且操作时长大于或等于第一预设时长的召回资源。以视频为例,正向召回视频可以是播放时长大于或等于30s的用户点击视频。反向召回资源包括非目标操作状态对应的召回资源,非目标操作状态对应的召回资源用于作为普通负样本。反向召回资源还包括目标操作状态对应的、且操作时长小于第二预设时长的召回资源,以视频为例,反向召回视频可以是播放时长小于3s的用户点击视频。目标操作状态对应的、且操作时长小于第二预设时长的召回资源用于作为难负样本,难负样本在模型训练时有助于提高模型训练质量。
具体地,计算机设备获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列作为训练数据,将训练数据输入初始召回模型进行数据处理。
步骤S1404,分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。
具体地,计算机设备分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到历史搜索语句序列对应的历史搜索语句特征序列、历史正向召回信息序列对应的正向召回信息特征序列。
步骤S1406,基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到训练搜索对象对应的搜索对象特征初始序列。
步骤S1408,分别对训练搜索语句、正向召回信息、反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征。
步骤S1410,融合训练搜索语句特征和搜索对象特征初始序列,得到搜索融合特征。
具体地,可以将搜索对象特征类比为信号系统中的原始信号、基带信号,将历史搜索语句特征序列类比为信号系统中的载波信号,将正向召回信息特征序列类比为信号系统中的调制信号,类比信号系统中解调调制信号的方法,在模型中,计算机设备基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,得到训练搜索对象对应的搜索对象特征初始序列。
计算机设备可以分别对训练搜索语句、正向召回信息、反向召回信息进行特征提取,得到训练搜索语句对应的训练搜索语句特征、正向召回信息对应的目标正向召回信息特征、反向召回信息对应的目标反向召回信息特征。
计算机设备将训练搜索语句特征和搜索对象特征初始序列进行融合,得到搜索融合特征。
可以理解,特征转换、解调处理、融合处理的具体处理过程可以参照前述搜索召回方法中各个相关实施例的内容,此处不再赘述。
在一个实施例中,特征提取可以是先进行特征转换再进行特征增强。
在一个实施例中,特征转换可以在模型中进行,也可以在模型外进行。
若在模型外进行,初始召回模型的输入数据包括历史搜索语句序列对应的历史搜索语句特征序列、历史正向召回信息序列对应的正向召回信息特征序列、训练搜索语句对应的初始搜索语句特征、正向召回信息对应的初始正向召回信息特征、反向召回信息对应的初始反向召回信息特征。模型的输入数据是对相应的数据进行特征转换得到的。
若在模型内进行,初始召回模型的输入数据包括训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列。在模型训练时,可以不调整用于特征转换的相关参数。
步骤S1412,基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
具体地,计算机设备计算搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,基于特征相似度计算模型损失,将模型损失进行反向传播来调整初始召回模型的模型参数,通过模型迭代训练,直至满足收敛条件,得到目标召回模型。
其中,收敛条件是指判断模型是否达到收敛的条件,收敛条件包括但不限于模型损失小于预设损失值、模型迭代次数大于预设迭代次数、或损失的变化率小于预设变化率等中的至少一者。
例如,计算机设备获取训练集,将训练集输入初始召回模型来计算得到模型损失,基于模型损失调整初始召回模型得到中间召回模型,将中间召回模型作为初始召回模型,获取新的训练集,将新的训练集输入新的初始召回模型来计算得到新的模型损失,基于新的模型损失调整新的初始召回模型得到新的中间召回模型,将中间召回模型作为初始召回模型,返回获取训练集的步骤执行,继续进行模型迭代训练。若预设迭代次数为100,则获取第101次调整得到的中间召回模型作为目标召回模型。
上述召回模型训练方法,历史正向召回信息序列隐含了训练搜索对象的对象属性,在模型中,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征训练搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合训练搜索语句对应的训练搜索语句特征和训练搜索对象对应的搜索对象特征得到的搜索融合特征,既包含训练搜索语句对应的语义信息,又包含训练搜索对象对应的属性信息。基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,能够使得模型输出更准确的搜索融合特征、召回信息特征。经过训练得到的目标召回模型可以输出搜索语句对应的准确的搜索融合特征、待召回资源对应的准确的召回信息特征,从而有助于提高搜索召回的准确性,最终实现针对搜索对象的个性化召回。
在一个具体的实施例中,本申请的召回模型训练方法、搜索召回方法可以应用于视频搜索的沉浸流个性化召回任务中。在用户进入沉浸流视频搜索场景,通过本申请方法会对用户进行个性化内容分发。
参考图15,模型包括召回信息处理网络(可以称为doc塔)和搜索语句处理网络(可以称为user塔),doc塔的输入数据是候选视频对应的初始视频信息特征(可以称为doc信息)。user塔的输入数据包括用户当前搜索语句对应的初始搜索语句特征(即当前query信息),用户历史搜索语句序列对应的历史搜索语句特征序列(可以称为历史query信息序列,简称query序列),用户历史正向召回视频信息序列对应的历史视频信息特征序列(可以称为历史正向消费的doc信息序列,简称doc序列)。初始视频信息特征、初始搜索语句特征、历史搜索语句特征序列和历史视频信息特征序列为向量形式。
一、模型训练
在模型训练时,训练集包括多组训练样本。一组训练样本包括训练query(user)信息和对应的正样本、负样本,负样本包括普通负样本、随机负样本和难负样本。训练query(user)信息包括同一用户对应的训练搜索语句、用户历史搜索语句序列和用户历史正向召回视频信息序列所分别对应的初始搜索语句特征、历史搜索语句特征序列和历史视频信息特征序列。正样本是指在训练搜索语句的召回视频中,播放时长超过30s的用户点击视频对应的初始视频信息特征。难负样本是指在训练搜索语句的召回视频中,播放时长少于3s的用户点击视频对应的初始视频信息特征。随机负样本是从训练集内其他组训练样本中随机采样得到的初始视频信息特征。
doc塔包括BERT(Bidirectional Encoder Representation from Transformers)网络,将初始视频信息特征输入doc塔,经过BERT网络的数据处理,doc塔输出目标视频信息特征。
user塔也包括BERT网络,将初始搜索语句特征输入user塔中的BERT网络。user塔还包括软对齐层(soft align layer)、解调层(Demodulator layer)、滤波层(Fliterlayer)、小波变换层(MRA layer)、池化层(pool layer)、全连接层(FC)和特征融合层(Fusion layer)。将历史搜索语句特征序列和历史视频信息特征序列输入软对齐层,将历史视频信息特征序列和软对齐层的输出数据输入解调层,将解调层的输出数据输入滤波层,将滤波层的输出数据输入小波变换层,将小波变换层的每级分解结果分别输入对应的池化层,将各个池化层的输出数据分别输入对应的全连接层,将user塔中的BERT网络的输出数据输入对应的全连接层,将各个全连接层的输出数据输入特征融合层,将特征融合层的输出数据输入最后的全连接层,全连接层输出搜索融合特征。
软对齐层主要是对齐query序列和doc序列,为下一步进入解调器做准备。解调层是类比建模信号系统中的信号解调器,通过对齐的query序列对doc序列进行解调,来获取不带query偏置的用户兴趣表示,即用户操作表现处理的用户真实兴趣。用户的真实兴趣特征的表达会因为query不同而有很大不同,所以需要去掉query的影响。滤波层是对解调后得到的序列进行处理,去除噪声信息。小波变换层是针对多场景混合序列的处理,因为query序列和doc序列是双列流和沉浸流的混合序列,是非稳定信号,所以适合使用小波变换处理。特征融合层对多个全连接层输出特征的融合,通过使用SE-NET(Squeeze-and-Excitation Networks)对特征进行重要性选择,来筛选不同特征。因为不同用户的行为不同,有的用户兴趣可能表现在不同场景更多些,所以不同特征的重要程度不同。
模型的训练损失函数使用 sampled softmax loss负采样函数来做对比学习。基于同一组训练样本中搜索融合特征分别和正样本、负样本对应的目标视频信息特征之间的特征相似度来生成模型损失。模型的训练损失函数也可以使用triple loss函数。
二、模型应用
针对训练完成的模型,将视频库中候选视频对应的初始视频信息特征输入doc塔,doc塔输出候选视频对应的目标视频信息特征(也可以称为候选视频信息特征),可以得到多个候选视频分别对应的目标视频信息特征。
针对训练完成的模型,将当前用户的当前搜索语句对应的初始搜索语句特征、当前用户对应的历史搜索语句特征序列和历史视频信息特征序列输入user塔,user塔输出当前用户对应的搜索融合特征。
基于目标视频信息特征和搜索融合特征之间的特征相似度,将各个候选视频按照特征相似度从大到小排序,获取排序靠前的若干个候选视频作为当前用户对应的召回视频。
在当前用户进入沉浸流视频搜索场景时,根据当前用户的切换操作,按照召回视频对应的特征相似度从大到小来有序播放各个召回视频。
将本申请训练得到的模型进行离线测评,离线测评结果如表1所示。
表1
模型 | recall@1 | recall@5 | recall@10 | recall@50 | recall@100 | recall@1000 |
基础模型(即传统模型) | 0.1246 | 0.2505 | 0.3239 | 0.5264 | 0.6156 | 0.8208 |
+解调层 | 0.1258 | 0.2545 | 0.3298 | 0.5371 | 0.6282 | 0.837 |
+小波变换层(J=3) | 0.1261 | 0.2562 | 0.3301 | 0.5402 | 0.6308 | 0.8395 |
+小波变换层(J=2) | 0.1306 | 0.2627 | 0.338 | 0.5485 | 0.6396 | 0.8433 |
可以理解,传统模型不包括本申请中的软对齐层、解调层、滤波层、小波变换层、特征融合层。
上述实施例中,本申请模型中的软对齐层使query序列和doc序列对齐,方便后面从doc序列中解除query的影响。模型针对搜索场景从频域角度出发设计了解调层,可以解除query对用户消费序列的干扰。并且,用户序列是多场景混合序列,是不稳定信号,用户序列主要来自搜索业务中的双列流场景和沉浸流场景,通过引入小波变换层建模多场景混合序列,能够自动分析跨场景序列信息特征。
可以理解,除了应用于视频搜索,本申请方法还可以应用于图片搜索、文本搜索等搜索领域。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的搜索召回方法的搜索召回装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个搜索召回装置实施例中的具体限定可以参见上文中对于搜索召回方法的限定,在此不再赘述。本申请实施例还提供了一种用于实现上述所涉及的召回模型训练方法的召回模型训练装置,该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个召回模型训练装置实施例中的具体限定可以参见上文中对于召回模型训练方法的限定,在此不再赘述。
在一个实施例中,如图16所示,提供了一种搜索召回装置,包括:数据获取模块1602、特征转换模块1604、特征解调模块1606、特征融合模块1608和资源召回模块1610,其中:
数据获取模块1602,用于获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;当前搜索对象为当前搜索语句对应的搜索对象,历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息。
特征转换模块1604,用于分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。
特征解调模块1606,用于基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。
特征融合模块1608,用于对当前搜索语句进行特征提取,得到当前搜索语句特征,融合当前搜索语句特征和搜索对象特征初始序列,得到搜索融合特征。
资源召回模块1610,用于基于搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为当前搜索对象对应的当前召回结果。
上述搜索召回装置,历史正向召回信息序列隐含了当前搜索对象的对象属性,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征当前搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合当前搜索语句对应的当前搜索语句特征和当前搜索对象对应的搜索对象特征得到的搜索融合特征,既包含当前搜索语句对应的语义信息,又包含当前搜索对象对应的属性信息,基于这样的搜索融合特征从候选召回资源库中获取到的匹配召回资源不仅与当前搜索语句匹配,而且还与当前搜索对象匹配,具有更高的准确性,可以有效提高搜索召回的准确性,实现针对当前搜索对象的个性化召回。
在一个实施例中,特征解调模块1606还用于:
基于历史搜索语句特征序列和正向召回信息特征序列进行搜索语句和召回信息的对齐,得到历史正向召回信息序列对应的搜索语句特征对齐序列;基于搜索语句特征对齐序列,对正向召回信息特征序列进行解调处理,得到当前搜索对象对应的搜索对象特征初始序列。
在一个实施例中,特征解调模块1606还用于:
基于历史搜索语句特征序列中的历史搜索语句特征和正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重;基于同一历史正向召回信息对应的各个关联权重,对历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征;基于各个搜索语句对齐特征得到搜索语句特征对齐序列。
在一个实施例中,特征解调模块1606还用于:
在搜索语句特征对齐序列和正向召回信息特征序列中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征序列;基于解调权重,对语句融合特征序列进行调整,得到搜索对象特征初始序列。
在一个实施例中,特征融合模块1608还用于:
对搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列;融合当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征。
在一个实施例中,特征融合模块1608还用于:
将搜索对象特征初始序列作为当前处理序列;获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列;对第一特征滤波序列进行下采样处理,得到第一特征下采样序列,对第二特征滤波序列进行下采样处理,得到第二特征下采样序列;将第二特征下采样序列作为当前处理序列,返回获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,直至满足结束条件,得到各个第一特征下采样序列和各个第二特征下采样序列;基于各个第一特征下采样序列和各个第二特征下采样序列,得到至少两个搜索对象特征目标序列。
在一个实施例中,特征融合模块1608还用于:
对搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列;对搜索对象特征中间序列进行小波变换,得到至少两个搜索对象特征目标序列。
在一个实施例中,特征融合模块1608还用于:
对搜索对象特征初始序列进行频域变换,得到初始频域信息;基于滤波权重,对初始频域信息进行调整,得到目标频域信息;对目标频域信息进行时域变换,得到搜索对象特征中间序列。
在一个实施例中,特征融合模块1608还用于:
分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征;获取当前搜索语句特征和各个搜索对象目标特征分别对应的特征权重;基于特征权重,融合各个搜索对象目标特征和当前搜索语句特征,得到搜索融合特征。
在一个实施例中,候选召回资源库包括多个候选召回资源。资源召回模块1610还用于:
计算各个候选召回资源对应的候选召回信息的候选召回信息特征分别和搜索融合特征之间的特征相似度;基于特征相似度,从各个候选召回信息中确定匹配召回信息;从候选召回数据库中,将匹配召回信息对应的候选召回资源作为匹配召回资源,得到当前召回结果。
在一个实施例中,搜索召回装置还用于:
对候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,得到候选召回资源对应的候选召回信息特征;对当前搜索语句进行特征转换,得到对应的初始搜索语句特征,将初始搜索语句特征、历史搜索语句特征序列、正向召回信息特征序列输入目标召回模型中的搜索语句处理网络,得到搜索融合特征;基于搜索融合特征分别和各个候选召回信息特征之间的特征相似度,从候选召回资源库中获取匹配召回资源作为当前召回结果。
在一个实施例中,历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句,历史正向召回信息包括历史正向召回资源对应的资源介绍信息或资源统计信息中的至少一种。
在一个实施例中,搜索召回装置还用于:
响应于针对在第一视频搜索场景下录入的当前搜索语句的搜索操作,展示当前搜索语句对应的视频播放入口集合;第一视频搜索场景用于同步展示同一搜索语句对应的至少两个初始召回视频的视频播放入口;响应于针对视频播放入口集合中目标播放入口的选择操作,进入第二视频搜索场景,播放目标播放入口对应的目标召回视频;响应于针对目标召回视频的切换操作,播放当前召回结果中的匹配召回视频。
在一个实施例中,如图17所示,提供了一种召回模型训练装置,包括:训练数据获取模块1702、特征转换模块1704、特征解调模块1706、特征提取模块1708、特征融合模块1710和模型调整模块1712,其中:
训练数据获取模块1702,用于获取训练搜索语句和训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将训练搜索语句、正向召回信息、反向召回信息、历史搜索语句序列和历史正向召回信息序列输入初始召回模型;训练搜索对象为训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息。
特征转换模块1704,用于分别对历史搜索语句序列和历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列。
特征解调模块1706,用于基于历史搜索语句特征序列,对正向召回信息特征序列进行解调处理,得到训练搜索对象对应的搜索对象特征初始序列。
特征提取模块1708,用于分别对训练搜索语句、正向召回信息、反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征。
特征融合模块1710,用于融合训练搜索语句特征和搜索对象特征初始序列,得到搜索融合特征。
模型调整模块1712,用于基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
上述召回模型训练装置,历史正向召回信息序列隐含了训练搜索对象的对象属性,在模型中,基于历史搜索语句特征序列对正向召回信息特征序列进行解调处理,可以从正向召回信息特征序列中解调出用于表征训练搜索对象的对象属性的搜索对象特征,搜索对象特征初始序列为搜索对象特征对应的序列。融合训练搜索语句对应的训练搜索语句特征和训练搜索对象对应的搜索对象特征得到的搜索融合特征,既包含训练搜索语句对应的语义信息,又包含训练搜索对象对应的属性信息。基于搜索融合特征分别和目标正向召回信息特征、目标反向召回信息特征之间的特征相似度,调整初始召回模型的模型参数,能够使得模型输出更准确的搜索融合特征、召回信息特征。经过训练得到的目标召回模型可以输出搜索语句对应的准确的搜索融合特征、待召回资源对应的准确的召回信息特征,从而有助于提高搜索召回的准确性,最终实现针对搜索对象的个性化召回。
在一个实施例中,正向召回信息对应的正向召回资源是目标操作状态对应的、且操作时长大于或等于第一预设时长的召回资源,反向召回信息对应的反向召回资源包括目标操作状态对应的、且操作时长小于第二预设时长的召回资源和非目标操作状态对应的召回资源,第一预设时长大于或等于第二预设时长。
上述搜索召回装置和召回模型训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图18所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储模型、模型的训练样本等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种搜索召回方法或召回模型训练方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图19所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种搜索召回方法或召回模型训练方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图18、19中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (32)
1.一种搜索召回方法,其特征在于,所述方法包括:
获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;所述历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,所述历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句;所述搜索场景是根据搜索结果的展示交互方式划分的;
分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;所述解调处理用于从所述正向召回信息特征序列中挖掘出所述当前搜索对象对应的搜索对象特征;
对所述当前搜索语句进行特征提取,得到当前搜索语句特征;
对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列;
融合所述当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征;
基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
2.根据权利要求1所述的方法,其特征在于,所述基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列,包括:
基于所述历史搜索语句特征序列和所述正向召回信息特征序列进行搜索语句和召回信息的对齐,得到所述历史正向召回信息序列对应的搜索语句特征对齐序列;
基于所述搜索语句特征对齐序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列。
3.根据权利要求2所述的方法,其特征在于,所述基于所述历史搜索语句特征序列和所述正向召回信息特征序列进行搜索语句和召回信息的对齐,得到所述历史正向召回信息序列对应的搜索语句特征对齐序列,包括:
基于所述历史搜索语句特征序列中的历史搜索语句特征和所述正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重;
基于同一历史正向召回信息对应的各个关联权重,对所述历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征;
基于各个搜索语句对齐特征得到所述搜索语句特征对齐序列。
4.根据权利要求2所述的方法,其特征在于,所述基于所述搜索语句特征对齐序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列,包括:
在所述搜索语句特征对齐序列和所述正向召回信息特征序列中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征序列;
基于解调权重,对所述语句融合特征序列进行调整,得到所述搜索对象特征初始序列。
5.根据权利要求1所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:
将所述搜索对象特征初始序列作为当前处理序列;
获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列;
对第一特征滤波序列进行下采样处理,得到第一特征下采样序列,对第二特征滤波序列进行下采样处理,得到第二特征下采样序列;
将第二特征下采样序列作为当前处理序列,返回所述获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,直至满足结束条件,得到各个第一特征下采样序列和各个第二特征下采样序列;
基于所述各个第一特征下采样序列和所述各个第二特征下采样序列,得到所述至少两个搜索对象特征目标序列。
6.根据权利要求5所述的方法,其特征在于,所述结束条件包括滤波次数大于或等于预设次数、经过下采样处理后得到的序列的长度小于预设长度中的至少一者。
7.根据权利要求1所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,包括:
对所述搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列;
对所述搜索对象特征中间序列进行小波变换,得到所述至少两个搜索对象特征目标序列。
8.根据权利要求7所述的方法,其特征在于,所述对所述搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列,包括:
对所述搜索对象特征初始序列进行频域变换,得到初始频域信息;
基于滤波权重,对所述初始频域信息进行调整,得到目标频域信息;
对所述目标频域信息进行时域变换,得到所述搜索对象特征中间序列。
9.根据权利要求1所述的方法,其特征在于,所述融合所述当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征,包括:
分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征;
获取所述当前搜索语句特征和所述各个搜索对象目标特征分别对应的特征权重;
基于特征权重,融合所述各个搜索对象目标特征和所述当前搜索语句特征,得到所述搜索融合特征。
10.根据权利要求1所述的方法,其特征在于,所述候选召回资源库包括多个候选召回资源;
所述基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果,包括:
计算各个候选召回资源对应的候选召回信息的候选召回信息特征分别和所述搜索融合特征之间的特征相似度;
基于所述特征相似度,从各个候选召回信息中确定匹配召回信息;
从候选召回数据库中,将所述匹配召回信息对应的候选召回资源作为所述匹配召回资源,得到所述当前召回结果。
11.根据权利要求1至10中任一项所述的方法,其特征在于,所述方法还包括:
对所述候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,得到候选召回资源对应的候选召回信息特征;
对所述当前搜索语句进行特征转换,得到对应的初始搜索语句特征,将所述初始搜索语句特征、所述历史搜索语句特征序列、所述正向召回信息特征序列输入所述目标召回模型中的搜索语句处理网络,得到所述搜索融合特征;
基于所述搜索融合特征分别和各个候选召回信息特征之间的特征相似度,从所述候选召回资源库中获取匹配召回资源作为所述当前召回结果。
12.根据权利要求1至10中任一项所述的方法,其特征在于,所述历史正向召回信息包括所述历史正向召回资源对应的资源介绍信息或资源统计信息中的至少一种。
13.根据权利要求1至10中任一项所述的方法,其特征在于,所述方法还包括:
响应于针对在第一视频搜索场景下录入的当前搜索语句的搜索操作,展示所述当前搜索语句对应的视频播放入口集合;所述第一视频搜索场景用于同步展示同一搜索语句对应的至少两个初始召回视频的视频播放入口;
响应于针对所述视频播放入口集合中目标播放入口的选择操作,进入第二视频搜索场景,播放所述目标播放入口对应的目标召回视频;
响应于针对所述目标召回视频的切换操作,播放所述当前召回结果中的匹配召回视频。
14.一种召回模型训练方法,其特征在于,所述方法包括:
获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;所述历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,所述历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句;所述搜索场景是根据搜索结果的展示交互方式划分的;
分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;所述解调处理用于从所述正向召回信息特征序列中挖掘出所述训练搜索对象对应的搜索对象特征;
分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;
对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列;
融合所述训练搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征;
基于所述搜索融合特征分别和所述目标正向召回信息特征、所述目标反向召回信息特征之间的特征相似度,调整所述初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
15.根据权利要求14所述的方法,其特征在于,所述正向召回信息对应的正向召回资源是目标操作状态对应的、且操作时长大于或等于第一预设时长的召回资源,所述反向召回信息对应的反向召回资源包括目标操作状态对应的、且操作时长小于第二预设时长的召回资源和非目标操作状态对应的召回资源,所述第一预设时长大于或等于所述第二预设时长。
16.一种搜索召回装置,其特征在于,所述装置包括:
数据获取模块,用于获取当前搜索语句,获取当前搜索对象对应的历史搜索语句序列和历史正向召回信息序列;所述当前搜索对象为所述当前搜索语句对应的搜索对象,所述历史正向召回信息序列中的历史正向召回信息是历史正向召回资源对应的资源信息;所述历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,所述历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句;所述搜索场景是根据搜索结果的展示交互方式划分的;
特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列;所述解调处理用于从所述正向召回信息特征序列中挖掘出所述当前搜索对象对应的搜索对象特征;
特征融合模块,用于对所述当前搜索语句进行特征提取,得到当前搜索语句特征,对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,融合所述当前搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征;
资源召回模块,用于基于所述搜索融合特征,从候选召回资源库中获取对应的匹配召回资源作为所述当前搜索对象对应的当前召回结果。
17.根据权利要求16所述的装置,其特征在于,所述特征解调模块还用于:
基于所述历史搜索语句特征序列和所述正向召回信息特征序列进行搜索语句和召回信息的对齐,得到所述历史正向召回信息序列对应的搜索语句特征对齐序列;基于所述搜索语句特征对齐序列,对所述正向召回信息特征序列进行解调处理,得到所述当前搜索对象对应的搜索对象特征初始序列。
18.根据权利要求17所述的装置,其特征在于,所述特征解调模块还用于:
基于所述历史搜索语句特征序列中的历史搜索语句特征和所述正向召回信息特征序列中的历史正向召回信息特征之间的特征相似度,得到历史正向召回信息和历史搜索语句之间的关联权重;基于同一历史正向召回信息对应的各个关联权重,对所述历史搜索语句特征序列中对应的各个历史搜索语句特征进行融合,得到各个历史正向召回信息分别对应的搜索语句对齐特征;基于各个搜索语句对齐特征得到所述搜索语句特征对齐序列。
19.根据权利要求17所述的装置,其特征在于,所述特征解调模块还用于:
在所述搜索语句特征对齐序列和所述正向召回信息特征序列中,将同一历史正向召回信息对应的搜索语句对齐特征和历史正向召回信息特征进行融合,得到语句融合特征序列;基于解调权重,对所述语句融合特征序列进行调整,得到所述搜索对象特征初始序列。
20.根据权利要求16所述的装置,其特征在于,所述特征融合模块还用于:
将所述搜索对象特征初始序列作为当前处理序列;获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列;对第一特征滤波序列进行下采样处理,得到第一特征下采样序列,对第二特征滤波序列进行下采样处理,得到第二特征下采样序列;将第二特征下采样序列作为当前处理序列,返回所述获取当前处理序列对应的滤波频率,将当前处理序列中低于滤波频率的数据滤除,得到第一特征滤波序列,将当前处理序列中高于或等于滤波频率的数据滤除,得到第二特征滤波序列的步骤执行,直至满足结束条件,得到各个第一特征下采样序列和各个第二特征下采样序列;基于所述各个第一特征下采样序列和所述各个第二特征下采样序列,得到所述至少两个搜索对象特征目标序列。
21.根据权利要求20所述的装置,其特征在于,所述结束条件包括滤波次数大于或等于预设次数、经过下采样处理后得到的序列的长度小于预设长度中的至少一者。
22.根据权利要求16所述的装置,其特征在于,所述特征融合模块还用于:
对所述搜索对象特征初始序列进行滤波处理,得到搜索对象特征中间序列;对所述搜索对象特征中间序列进行小波变换,得到所述至少两个搜索对象特征目标序列。
23.根据权利要求22所述的装置,其特征在于,所述特征融合模块还用于:
对所述搜索对象特征初始序列进行频域变换,得到初始频域信息;基于滤波权重,对所述初始频域信息进行调整,得到目标频域信息;对所述目标频域信息进行时域变换,得到所述搜索对象特征中间序列。
24.根据权利要求16所述的装置,其特征在于,所述特征融合模块还用于:
分别对各个搜索对象特征目标序列进行池化处理,得到对应的各个搜索对象目标特征;获取所述当前搜索语句特征和所述各个搜索对象目标特征分别对应的特征权重;基于特征权重,融合所述各个搜索对象目标特征和所述当前搜索语句特征,得到所述搜索融合特征。
25.根据权利要求16所述的装置,其特征在于,所述候选召回资源库包括多个候选召回资源,所述资源召回模块还用于:
计算各个候选召回资源对应的候选召回信息的候选召回信息特征分别和所述搜索融合特征之间的特征相似度;基于所述特征相似度,从各个候选召回信息中确定匹配召回信息;从候选召回数据库中,将所述匹配召回信息对应的候选召回资源作为所述匹配召回资源,得到所述当前召回结果。
26.根据权利要求16至25中任一项所述的装置,其特征在于,所述装置还用于:
对所述候选召回资源库中的候选召回资源所对应的候选召回信息进行特征转换,得到对应的初始召回信息特征,将各个候选召回资源对应的初始召回信息特征输入目标召回模型中的召回信息处理网络,得到候选召回资源对应的候选召回信息特征;对所述当前搜索语句进行特征转换,得到对应的初始搜索语句特征,将所述初始搜索语句特征、所述历史搜索语句特征序列、所述正向召回信息特征序列输入所述目标召回模型中的搜索语句处理网络,得到所述搜索融合特征;基于所述搜索融合特征分别和各个候选召回信息特征之间的特征相似度,从所述候选召回资源库中获取匹配召回资源作为所述当前召回结果。
27.根据权利要求16至25中任一项所述的装置,其特征在于,所述历史正向召回信息包括所述历史正向召回资源对应的资源介绍信息或资源统计信息中的至少一种。
28.根据权利要求16至25中任一项所述的装置,其特征在于,所述装置还用于:
响应于针对在第一视频搜索场景下录入的当前搜索语句的搜索操作,展示所述当前搜索语句对应的视频播放入口集合;所述第一视频搜索场景用于同步展示同一搜索语句对应的至少两个初始召回视频的视频播放入口;响应于针对所述视频播放入口集合中目标播放入口的选择操作,进入第二视频搜索场景,播放所述目标播放入口对应的目标召回视频;响应于针对所述目标召回视频的切换操作,播放所述当前召回结果中的匹配召回视频。
29.一种召回模型训练装置,其特征在于,所述装置包括:
训练数据获取模块,用于获取训练搜索语句和所述训练搜索语句对应的正向召回信息、反向召回信息,获取训练搜索对象对应的历史搜索语句序列和历史正向召回信息序列,将所述训练搜索语句、所述正向召回信息、所述反向召回信息、所述历史搜索语句序列和所述历史正向召回信息序列输入初始召回模型;所述训练搜索对象为所述训练搜索语句对应的搜索对象,召回信息是召回资源对应的资源信息;所述历史正向召回信息序列对应的历史正向召回资源序列包括至少两个搜索场景分别对应的历史正向召回资源,所述历史搜索语句序列包括至少两个搜索场景分别对应的历史搜索语句;所述搜索场景是根据搜索结果的展示交互方式划分的;
特征转换模块,用于分别对所述历史搜索语句序列和所述历史正向召回信息序列进行特征转换,得到对应的历史搜索语句特征序列、正向召回信息特征序列;
特征解调模块,用于基于所述历史搜索语句特征序列,对所述正向召回信息特征序列进行解调处理,得到所述训练搜索对象对应的搜索对象特征初始序列;所述解调处理用于从所述正向召回信息特征序列中挖掘出所述训练搜索对象对应的搜索对象特征;
特征提取模块,用于分别对所述训练搜索语句、所述正向召回信息、所述反向召回信息进行特征提取,得到训练搜索语句特征、目标正向召回信息特征、目标反向召回信息特征;
特征融合模块,用于对所述搜索对象特征初始序列进行小波变换,得到至少两个搜索对象特征目标序列,融合所述训练搜索语句特征和各个搜索对象特征目标序列,得到搜索融合特征;
模型调整模块,用于基于所述搜索融合特征分别和所述目标正向召回信息特征、所述目标反向召回信息特征之间的特征相似度,调整所述初始召回模型的模型参数,直至满足收敛条件,得到目标召回模型。
30.根据权利要求29所述的装置,其特征在于,所述正向召回信息对应的正向召回资源是目标操作状态对应的、且操作时长大于或等于第一预设时长的召回资源,所述反向召回信息对应的反向召回资源包括目标操作状态对应的、且操作时长小于第二预设时长的召回资源和非目标操作状态对应的召回资源,所述第一预设时长大于或等于所述第二预设时长。
31.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至15中任一项所述的方法的步骤。
32.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至15中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211480284.XA CN115563394B (zh) | 2022-11-24 | 2022-11-24 | 搜索召回方法、召回模型训练方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211480284.XA CN115563394B (zh) | 2022-11-24 | 2022-11-24 | 搜索召回方法、召回模型训练方法、装置和计算机设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115563394A CN115563394A (zh) | 2023-01-03 |
CN115563394B true CN115563394B (zh) | 2023-03-28 |
Family
ID=84770405
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211480284.XA Active CN115563394B (zh) | 2022-11-24 | 2022-11-24 | 搜索召回方法、召回模型训练方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115563394B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116226297B (zh) * | 2023-05-05 | 2023-07-25 | 深圳市唯特视科技有限公司 | 数据模型的可视化搜索方法、系统、设备及存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9384226B1 (en) * | 2015-01-30 | 2016-07-05 | Dropbox, Inc. | Personal content item searching system and method |
CN110750501A (zh) * | 2019-10-17 | 2020-02-04 | 广州视源电子科技股份有限公司 | 文件检索方法和装置、存储介质及相关设备 |
CN111538908A (zh) * | 2020-06-22 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
CN113505204A (zh) * | 2021-09-09 | 2021-10-15 | 腾讯科技(深圳)有限公司 | 召回模型训练方法、搜索召回方法、装置和计算机设备 |
WO2022007520A1 (zh) * | 2020-07-09 | 2022-01-13 | 百果园技术(新加坡)有限公司 | 推荐项目确定方法、装置、设备及存储介质 |
CN115205085A (zh) * | 2022-08-26 | 2022-10-18 | 广州华多网络科技有限公司 | 通信地址联想方法及其装置、设备、介质、产品 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10956514B2 (en) * | 2017-05-31 | 2021-03-23 | Microsoft Technology Licensing, Llc | System and method for directed analysis of content using artifical intelligence for storage and recall |
CN110083688B (zh) * | 2019-05-10 | 2022-03-25 | 北京百度网讯科技有限公司 | 搜索结果召回方法、装置、服务器及存储介质 |
CN110349568B (zh) * | 2019-06-06 | 2024-05-31 | 平安科技(深圳)有限公司 | 语音检索方法、装置、计算机设备及存储介质 |
CN113704507B (zh) * | 2021-10-26 | 2022-02-11 | 腾讯科技(深圳)有限公司 | 数据处理方法、计算机设备以及可读存储介质 |
CN114998093B (zh) * | 2022-05-18 | 2024-08-02 | 大连理工大学 | 一种基于权重解调的图像风格迁移方法及装置 |
-
2022
- 2022-11-24 CN CN202211480284.XA patent/CN115563394B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9384226B1 (en) * | 2015-01-30 | 2016-07-05 | Dropbox, Inc. | Personal content item searching system and method |
CN110750501A (zh) * | 2019-10-17 | 2020-02-04 | 广州视源电子科技股份有限公司 | 文件检索方法和装置、存储介质及相关设备 |
CN111538908A (zh) * | 2020-06-22 | 2020-08-14 | 腾讯科技(深圳)有限公司 | 搜索排序方法、装置、计算机设备和存储介质 |
WO2022007520A1 (zh) * | 2020-07-09 | 2022-01-13 | 百果园技术(新加坡)有限公司 | 推荐项目确定方法、装置、设备及存储介质 |
CN113505204A (zh) * | 2021-09-09 | 2021-10-15 | 腾讯科技(深圳)有限公司 | 召回模型训练方法、搜索召回方法、装置和计算机设备 |
CN115205085A (zh) * | 2022-08-26 | 2022-10-18 | 广州华多网络科技有限公司 | 通信地址联想方法及其装置、设备、介质、产品 |
Also Published As
Publication number | Publication date |
---|---|
CN115563394A (zh) | 2023-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108062375B (zh) | 一种用户画像的处理方法、装置、终端和存储介质 | |
CN105653700B (zh) | 视频检索方法及系统 | |
CN107480158B (zh) | 基于相似性得分评估内容项目与图像的匹配的方法和系统 | |
CN109241412B (zh) | 一种基于网络表示学习的推荐方法、系统及电子设备 | |
CN112052387B (zh) | 一种内容推荐方法、装置和计算机可读存储介质 | |
CN107526846B (zh) | 频道排序模型的生成、排序方法、装置、服务器和介质 | |
JP5469046B2 (ja) | 情報検索装置、情報検索方法及び情報検索プログラム | |
US20230386238A1 (en) | Data processing method and apparatus, computer device, and storage medium | |
US9633110B2 (en) | Enrichment of data using a semantic auto-discovery of reference and visual data | |
CN106776849A (zh) | 一种以图快速检索景点的方法及导游系统 | |
CN111125344B (zh) | 相关词推荐方法和装置 | |
CN113204691B (zh) | 一种信息展示方法、装置、设备及介质 | |
CN115563394B (zh) | 搜索召回方法、召回模型训练方法、装置和计算机设备 | |
WO2023241332A1 (zh) | 摘要信息生成与搜索结果展示方法、装置、设备和介质 | |
CN105912586B (zh) | 一种信息搜索方法及电子设备 | |
CN116034401A (zh) | 用于使用自然语言描述检索视频的系统和方法 | |
CN115795030A (zh) | 文本分类方法、装置、计算机设备和存储介质 | |
Choi et al. | Multimodal location estimation of consumer media: Dealing with sparse training data | |
Gao et al. | Dancinglines: an analytical scheme to depict cross-platform event popularity | |
US11269898B1 (en) | Machine learning based database query retrieval | |
CN103559269A (zh) | 一种面向移动新闻订阅的知识推荐方法 | |
CN111831938A (zh) | 信息显示方法、装置、电子设备及介质 | |
CN110598049A (zh) | 用于检索视频的方法、装置、电子设备和计算机可读介质 | |
CN113221572B (zh) | 一种信息处理方法、装置、设备及介质 | |
CN113076395A (zh) | 语义模型训练、搜索显示方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40079092 Country of ref document: HK |