CN113297511B - 商户排序模型的构建方法、装置、服务器及存储介质 - Google Patents
商户排序模型的构建方法、装置、服务器及存储介质 Download PDFInfo
- Publication number
- CN113297511B CN113297511B CN202110565288.7A CN202110565288A CN113297511B CN 113297511 B CN113297511 B CN 113297511B CN 202110565288 A CN202110565288 A CN 202110565288A CN 113297511 B CN113297511 B CN 113297511B
- Authority
- CN
- China
- Prior art keywords
- vector
- dimension
- merchant
- feature
- correlation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开提供了一种商户排序模型的构建方法、装置、服务器及存储介质,属于互联网技术领域。所述方法包括:根据搜索词向量和多个第一商户特征向量,生成的第一相关性向量;根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量;根据多个第二相关性向量进行模型训练。本公开基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
Description
技术领域
本公开涉及互联网技术领域,特别涉及一种商户排序模型的构建方法、装置、服务器及存储介质。
背景技术
随着大数据时代的到来,从海量的数据中提取有用信息,一直是学术界和工业界研究的热点问题。点评类应用作为用户本地生活服务的重要工具,如何构建商户排序模型,实现个性化搜索成为点评类应用的重要任务。
相关技术中,基于注意力机制,根据用户的历史行为,构建商户排序模型。然而,由于所构建的商户排序模型主要基于用户的历史行为进行搜索,无法挖掘出在不同搜索词下用户意图的差异性,导致在不同搜索词下搜索的商户都是相同的。因此,亟需构建一种新的商户排序模型,以满足不同搜索场景下用户的搜索需求。
发明内容
本公开实施例提供了一种商户排序模型的构建方法、装置、服务器及存储介质,能够满足不同搜索场景下的搜索需求。所述技术方案如下:
第一方面,提供了一种商户排序模型的构建方法,所述方法包括:
获取用户输入的搜索词、所述用户实施过操作的多个第一商户的属性信息及基于所述搜索词搜索到的多个第二商户的属性信息,所述第二商户标注有排序结果;
根据所述搜索词、所述多个第一商户的属性信息及所述多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量,所述搜索词向量、所述第一商户特征向量及所述第二商户特征向量的维度相同;
根据所述搜索词向量和所述多个第一商户特征向量,生成第一相关性向量;
根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量;
根据所述多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
在本公开的另一个实施例中,所述根据所述搜索词向量和所述第一商户特征向量,生成第一相关性向量,包括:
根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量;
将所述搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;
采用前馈网络对所述第一拼接向量进行处理,得到所述第一相关性向量。
在本公开的另一个实施例中,所述根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量,包括:
将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与所述搜索词向量维度相同的第一特征维度向量;
根据所述搜索词向量和所述多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示所述搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
在本公开的另一个实施例中,所述根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量,包括:
对于任一第二商户特征向量,根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;
将所述第一相关性向量与所述第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;
采用前馈网络对所述第二拼接向量进行处理,得到所述第二相关性向量。
在本公开的另一个实施例中,所述根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量,包括:
将所述第二商户特征向量中每一维度上的第二元素映射到所述第二商户特征向量的向量空间,得到与所述第二商户特征向量维度相同的第二特征维度向量;
根据所述第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
其中,D-Attenk表示表示所述第一相关性向量与所述第二商户特征向量中维度k上的第二元素的第二元素相关性向量,表示所述第二商户特征向量中维度k上的第二元素的第二特征维度向量,表示表示维度k上的第一相关性向量,dk表示k的维度。
第二方面,提供了一种商户排序模型的构建装置,所述装置包括:
获取模块,用于获取用户输入的搜索词、所述用户实施过操作的多个第一商户的属性信息及基于所述搜索词搜索到的多个第二商户的属性信息,所述第二商户标注有排序结果;
生成模块,用于根据所述搜索词、所述多个第一商户的属性信息及所述多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量,所述搜索词向量、所述第一商户特征向量及所述第二商户特征向量的维度相同;
所述生成模块,还用于根据所述搜索词向量和所述多个第一商户特征向量,生成第一相关性向量;
所述生成模块,还用于根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量;
训练模块,用于根据所述多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
在本公开的另一个实施例中,所述生成模块,用于根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量;将所述搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;采用前馈网络对所述第一拼接向量进行处理,得到所述第一相关性向量。
在本公开的另一个实施例中,所述生成模块,用于将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与所述搜索词向量维度相同的第一特征维度向量;根据所述搜索词向量和所述多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示所述搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
在本公开的另一个实施例中,所述生成模块,用于对于任一第二商户特征向量,根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;将所述第一相关性向量与所述第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;采用前馈网络对所述第二拼接向量进行处理,得到所述第二相关性向量。
在本公开的另一个实施例中,所述生成模块,用于将所述第二商户特征向量中每一维度上的第二元素映射到所述第二商户特征向量的向量空间,得到与所述第二商户特征向量维度相同的第二特征维度向量;根据所述第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
其中,D-Attenk表示表示所述第一相关性向量与所述第二商户特征向量中维度k上的第二元素的第二元素相关性向量,表示所述第二商户特征向量中维度k上的第二元素的第二特征维度向量,表示表示维度k上的第一相关性向量,dk表示k的维度。
第三方面,提供了一种服务器,所述服务器包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如第一方面所述的商户排序模型的构建方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如第一方面所述的商户排序模型的构建方法。
本公开实施例提供的技术方案带来的有益效果是:
基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的一种商户排序模型的网络架构图;
图2是本公开实施例提供的一种商户排序模型的构建方法的流程图;
图3是本公开实施例提供的另一种商户排序模型的构建方法的流程图;
图4是本公开实施例提供的一种商户排序模型的构建装置结构示意图;
图5是根据一示例性实施例示出的一种用于商户排序模型的构建的服务器。
具体实施方式
为使本公开的目的、技术方案和优点更加清楚,下面将结合附图对本公开实施方式作进一步地详细描述。
可以理解,本公开实施例所使用的术语“每个”、“多个”及“任一”等,多个包括两个或两个以上,每个是指对应的多个中的每一个,任一是指对应的多个中的任意一个。举例来说,多个词语包括10个词语,而每个词语是指这10个词语中的每一个词语,任一词语是指10个词语中的任意一个词语。
近些年来,基于用户实施过操作行为(包括点击、收藏及购买等操作行为)的商户,构建商户排序模型逐渐成为信息推荐领域研究的热点。特别是,随着基于注意力机制的提出,商户排序模型和深度点击率预估模型实现很好的融合。商户排序模型的优化工作主要包括采用RNN(Recurrent Neural Network,循环神经网络)网络挖掘用户行为序列的顺序性、使用Transformer网络挖掘用户行为序列内部之间的相关性等。上述商户排序模型主要用于广告推荐场景。与广告推荐场景相比,搜索场景具有用户输入的搜索词,用户意图比较明显。比如用户输入搜索词“火锅”,那么在进行商户推荐时商户类目应该发挥较大的作用;再比如,用户搜索“环境好的餐厅”,那么进行商户推荐时商户坏境应该发挥更大的作用。也即是,针对不同的搜索词,推荐的商户应该集中在不同的方面。然而,目前构建的商户排序模型在搜索词方面的信息缺失,无法挖掘出不同搜索词下用户意图和商户表征的差异性和多样性,不同搜索词下推荐的商户是相同的,无法满足不同搜索场景下用户的搜索需求。
为了满足不同搜索场景下用户的搜索需求,本公开实施例提供了一种商户排序模型的构建方法,该方法采用Transformer网络,该Transformer是一个非常典型的seq2seq结构,主要包括Encoder和Decoder部分。Encoder部分主要包含Self-Attention(自注意网络)和Forward Network(前馈网络)两部分。Decoder部分主要包含Self-Attention、Context-Attention(上下文注意力)及Forward Network等。Transformer中的Attention机制可以被看成一个Query(Q)和一组K-V对映射到一个输出的操作,Q、K、V均是向量,输出为V向量的加权集合,权重是由Q和V向量对应的K向量计算得到。基于Transformer网络,本公开实施例在Transformer网络的Encoder(编码)部分,计算搜索词向量与用户实施过操作的多个第一商户的第一商户特征向量的相关性,得到第一相关性向量;在Transformer网络的Decoder(解码)部分,计算第一相关性向量和待排序的第二商户的第二商户特征向量的相关性,得到第二相关性向量,然后基于第二相关性向量训练商户排序模型。
图1示出了本公开实施例采用Transformer网络的结构图,参见图1,在编码部分,将用户实施过操作的第一商户的商户属性信息、搜索词输入到Encoder部分,输出维度相同第一商户特征向量和搜索词向量,即将搜索词向量作为Attention机制中的Q,将第一商户特征向量作为Attention机制中的K/V,通过处理得到第一相关性向量;在解码部分,将第一相关性向量作为Attention机制中的K/V,将第二商户特征向量作为Attention机制中Q,通过处理得到第二相关性向量,进而基于第二相关性向量进行建模。其中,在编码部分和解码部分,处理过程为:进行矩阵相乘,再进行scale,再进行Mask(opt.),再进行Softmax处理,然后进行矩阵相乘。
本公开实施例提供了一种商户排序模型的构建方法,参见图2,本公开实施例提供的方法流程包括:
201.获取用户输入的搜索词、用户实施过操作的多个第一商户的属性信息及基于搜索词搜索到的多个第二商户的属性信息。
其中,第二商户标注有排序结果。
202.根据搜索词、多个第一商户的属性信息及多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量。
其中,搜索词向量、第一商户特征向量及第二商户特征向量的维度相同。
203.根据搜索词向量和多个第一商户特征向量,生成第一相关性向量。
204.根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量。
205.根据多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
本公开实施例提供的方法,基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
在本公开的另一个实施例中,根据搜索词向量和第一商户特征向量,生成第一相关性向量,包括:
根据搜索词向量和多个第一商户特征向量中每一维度上的第一元素,生成搜索词与每一维度上的第一元素的第一元素相关性向量;
将搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;
采用前馈网络对第一拼接向量进行处理,得到第一相关性向量。
在本公开的另一个实施例中,根据搜索词向量和多个第一商户特征向量中每一维度上的第一元素,生成搜索词与每一维度上的第一元素的第一元素相关性向量,包括:
将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与搜索词向量维度相同的第一特征维度向量;
根据搜索词向量和多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
在本公开的另一个实施例中,根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量,包括:
对于任一第二商户特征向量,根据第一相关性向量和第二商户特征向量中每一维度上的第二元素,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;
将第一相关性向量与第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;
采用前馈网络对第二拼接向量进行处理,得到第二相关性向量。
在本公开的另一个实施例中,根据第一相关性向量和第二商户特征向量中每一维度上的第二元素,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量,包括:
将第二商户特征向量中每一维度上的第二元素映射到第二商户特征向量的向量空间,得到与第二商户特征向量维度相同的第二特征维度向量;
根据第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
其中,D-Attenk表示表示第一相关性向量与第二商户特征向量中维度k上的第二元素的第二元素相关性向量,表示第二商户特征向量中维度k上的第二元素的第二特征维度向量,表示维度k上的第一相关性向量,dk表示k的维度。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
本公开实施例提供了一种商户排序模型的构建方法,以服务器执行本公开实施例为例,该服务器为具有信息搜索功能的指定应用的后台服务器,该指定应用可以为点评类应用、外卖类应用、购物类应用等等。参见图3,本公开实施例提供的方法流程包括:
301.服务器获取用户输入的搜索词、用户实施过操作的多个第一商户的属性信息及基于搜索词搜索到的多个第二商户的属性信息。
其中,第一商户为用户实施过点击操作、收藏操作等操作行为的商户,该第一商户的属性信息包括商户标识、所在区域标识、环境、品类等等。第二商户为基于用户输入的搜索词搜索到的商户,该第二商户标注有排序结果,该第二商户的属性信息包括商户标识、所在区域标识、环境、品类等等。
服务器从指定应用中选取用于建模的用户,并获取该用户在历史时刻实施过操作的多个商户作为多个第一商户,进而获取每个第一商户的属性信息。然后,服务器获取该用户输入的搜索词,以及基于该搜索词搜索到的第二商户,进而获取每个第二商户的属性信息。
302.服务器根据搜索词,生成搜索词向量。
基于用户输入的搜索词,服务器从搜索词中提取搜索词特征,该搜索词特征包括关键词、请求时间等,进而根据搜索词特征,生成搜索词向量,该搜索词向量为具有指定维度的向量,该指定维度及每一维度上元素的特征可由服务器进行设置。在生成搜索词向量时,如果某一维度上未提取出相应的特征,则将该维度上的特征设置为0。
303.服务器根据多个第一商户的属性信息,生成多个第一商户特征向量。
对于每个第一商户,服务器从第一商户的属性信息中,提取第一商户特征,并根据提取的第一商户特征,生成第一商户特征向量,该第一商户特征向量为具有指定维度的向量。在生成第一商户特征向量时,如果某一维度上未提取出相应的特征,则将该维度上的特征设置为0。
304.服务器根据多个第二商户的属性信息,生成多个第二商户特征向量。
对于每个第二商户,服务器从第二商户的属性信息中,提取第二商户特征,并根据提取的第二商户特征,生成第二商户特征向量,该第二商户特征向量为具有指定维度的向量。在生成第二商户特征向量时,如果某一维度上未提取出相应的特征,则将该维度上的特征设置为0。
通过上述步骤302~304,服务器获取具有相同维度的搜索词向量、第一商户特征向量及第二商户特征向量。
305.服务器根据搜索词向量和多个第一商户特征向量,生成第一相关性向量。
服务器根据搜索词向量和第一商户特征向量,生成第一相关性向量时,可采用如下方法:
3051.服务器根据搜索词向量和多个第一商户特征向量中每一维度上的第一元素,生成搜索词与每一维度上的第一元素的第一元素相关性向量。
服务器根据搜索词向量和多个第一商户特征向量中每一维度上的第一元素,生成搜索词与每一维度上的第一元素的第一元素相关性向量时,可采用如下方法:
30511.服务器将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与搜索词向量维度相同的第一特征维度向量。
服务器将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,使得生成的第一特征维度向量与第一商户特征向量的维度相同,由于第一商户特征向量和搜索词向量的维度相同,因而第一特征维度向量也与搜索词向量的维度相同。
30512.服务器根据搜索词向量和多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
本步骤将搜索词向量作为Q,将多个第一商户特征向量在同一维度上的第一元素的第一特征维度向量作为K和V,采用搜索词对第一商户的第一商户特征向量进行信息提取,从而提取出更贴近搜索场景的信息。编码部分捕捉了用户实施过操作的第一商户和搜索词的相关性,且加入了第一商户各个维度上的特征,从而捕捉了搜索词与第一商户在不同维度上的相关性。例如,搜索“适合约会的餐厅”,则在计算第一商户和搜索词的相关性时,第一商户的环境因素则成为重要的因素。
3052.服务器将搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量。
当获取到搜索词与各个维度上的第一元素的第一元素相关性向量,服务器将各个维度上的第一元素的第一元素相关性向量进行连接,得到与搜索词向量、第一商户特征向量及第二商户特征向量维度相同的第一拼接向量。
3053.服务器采用前馈网络对第一拼接向量进行处理,得到第一相关性向量。
其中,前馈网络用于挖掘出第一拼接向量中各个维度上特征之间的关联。当将第一拼接向量输入到前馈网络,经过前馈网络的处理,输出第一相关性向量。该过程可以表示为:
C=F(concat(Q-Atten1,Q-Atten2,...,Q-Attenk))
其中,C表示第一相关性向量,F表示前馈网络,Q-Atten1表示搜索词与第一维度上的第一元素的第一元素相关性,Q-Atten2表示示搜索词与第二维度上的第一元素的第一元素相关性,Q-Attenk表示搜索词与第K维度上的第一元素的第一元素相关性。
306.服务器根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量。
服务器根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量时,可采用如下方法:
3061.对于任一第二商户特征向量,服务器根据第一相关性向量和第二商户特征向量中每一维度上的第二元素,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量。
服务器根据第一相关性向量和第二商户特征向量中每一维度上的第二元素,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量时,可采用如下方法:
30611.服务器将第二商户特征向量中每一维度上的第二元素映射到第二商户特征向量的向量空间,得到与第二商户特征向量维度相同的第二特征维度向量。
服务器将第二商户特征向量中每一维度上的第二元素映射到第二商户特征向量的向量空间,使得生成的第二特征维度向量与第二商户特征向量的维度相同。第二商户特征向量、搜索词向量及第一相关性向量的维度相同,因而第二特征维度向量也与第一相关性向量的维度相同。
30612.服务器根据第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
其中,D-Attenk表示第一相关性向量与第二商户特征向量中维度k上的第二元素的第二元素相关性向量,表示第二商户特征向量中维度k上的第二元素的第二特征维度向量,表示表示维度k上的第一相关性向量,dk表示k的维度。
本步骤将第二商户特征向量中维度k上的第二元素的第二元素相关性向量作为Q,将第一相关性向量作为K和V,从而学习到与搜索词和用户操作过的商户的相关性,从而能够搜索出满足用户个性化需求及适合搜索场景的商户,搜索结果更准确。
3062.服务器将第一相关性向量与第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量。
当获取到第一相关性向量与各个维度上的第二元素的第二元素相关性向量,服务器将各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量。
3063.服务器采用前馈网络对第二拼接向量进行处理,得到第二相关性向量。
其中,前馈网络用于挖掘出第二拼接向量中各个维度上特征之间的关联。当将第二拼接向量输入到前馈网络,经过前馈网络的处理,输出第二相关性向量。该过程可以表示为:
Eu=F(concat(D-Atten1,D-Atten2,...,D-Attenk))
其中,Eu表示第二相关性向量,F表示前馈网络,D-Atten1表示第一相关性向量与第一维度上的第二元素的第二元素相关性,D-Atten2表示第一相关性向量与第二维度上的第二元素的第二元素相关性,D-Attenk表示第一相关性向量与第K维度上的第二元素的第二元素相关性。
307.服务器根据多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
当获取多个第二相关性向量,服务器将多个第二相关性向量输入到初始商户排序模型中,输出对多个第二商户的排序结果,进而将多个第二商户的排序结果和标注结果输入到预先构建的损失函数中,输出损失函数的函数值。如果损失函数的函数值大于预设数值,则调整初始商户排序模型的模型参数,直至输出的损失函数的函数值小于预设数值,将使得损失函数的函数值小于预设数值的模型参数对应的商户排序模型,确定为训练好的商户排序模型。其中,预设数值可由服务器进行设置。
本公开实施例提供的方法,基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
参见图4,本公开实施例提供了一种商户排序模型的构建装置,该装置包括:
获取模块401,用于获取用户输入的搜索词、用户实施过操作的多个第一商户的属性信息及基于搜索词搜索到的多个第二商户的属性信息,第二商户标注有排序结果;
生成模块402,用于根据搜索词、多个第一商户的属性信息及多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量,搜索词向量、第一商户特征向量及第二商户特征向量的维度相同;
生成模块402,还用于根据搜索词向量和多个第一商户特征向量,生成第一相关性向量;
生成模块402,还用于根据第一相关性向量和多个第二商户特征向量,生成多个第二相关性向量;
训练模块403,用于根据多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
在本公开的另一个实施例中,生成模块402,用于根据搜索词向量和多个第一商户特征向量中每一维度上的第一元素,生成搜索词与每一维度上的第一元素的第一元素相关性向量;将搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;采用前馈网络对第一拼接向量进行处理,得到第一相关性向量。
在本公开的另一个实施例中,生成模块402,用于将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与搜索词向量维度相同的第一特征维度向量;根据搜索词向量和多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
在本公开的另一个实施例中,生成模块402,用于对于任一第二商户特征向量,根据第一相关性向量和第二商户特征向量中每一维度上的第二元素,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;将第一相关性向量与第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;采用前馈网络对第二拼接向量进行处理,得到第二相关性向量。
在本公开的另一个实施例中,生成模块402,用于将第二商户特征向量中每一维度上的第二元素映射到第二商户特征向量的向量空间,得到与第二商户特征向量维度相同的第二特征维度向量;根据第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成第一相关性向量与第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
其中,D-Attenk表示表示第一相关性向量与第二商户特征向量中维度k上的第二元素的第二元素相关性向量,表示第二商户特征向量中维度k上的第二元素的第二特征维度向量,表示维度k上的第一相关性向量,dk表示k的维度。
综上,本公开实施例提供的装置,基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
图5是根据一示例性实施例示出的一种用于商户排序模型的构建的服务器。参照图5,服务器500包括处理组件522,其进一步包括一个或多个处理器,以及由存储器532所代表的存储器资源,用于存储可由处理组件522的执行的指令,例如应用程序。存储器532中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件522被配置为执行指令,以执行上述商户排序模型的构建方法中服务器所执行的功能。
服务器500还可以包括一个电源组件526被配置为执行服务器500的电源管理,一个有线或无线网络接口550被配置为将服务器500连接到网络,和一个输入输出(I/O)接口558。服务器500可以操作基于存储在存储器532的操作系统,例如Windows ServerTM,Mac OSXTM,UnixTM,LinuxTM,FreeBSDTM或类似。
本公开实施例提供的服务器,基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
本公开实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现商户排序模型的构建方法。该计算机可读存储介质可以是非暂态的。例如,该计算机可读存储介质可以是只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
本公开实施例提供的计算机可读存储介质,基于搜索词向量与第一商户特征向量,生成第一相关性向量,该第一相关性向量捕捉了搜索词和第一商户的特性,进而基于第一相关性向量与第二商户特征向量,生成第二相关性向量,然后基于该第二相关性向量对初始商户排序模型进行训练,该方法训练的模型考虑了搜索词和用户的操作行为,因而排序结果与搜索词具有更强的相关性,能够满足用户的个性化搜索需求。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本公开的可选实施例,并不用以限制本公开,凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
Claims (8)
1.一种商户排序模型的构建方法,其特征在于,所述方法包括:
获取用户输入的搜索词、用户实施过操作的多个第一商户的属性信息及基于所述搜索词搜索到的多个第二商户的属性信息,所述第二商户标注有排序结果;
根据所述搜索词、所述多个第一商户的属性信息及所述多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量,所述搜索词向量、所述第一商户特征向量及所述第二商户特征向量的维度相同;
根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量;
将所述搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;
采用前馈网络对所述第一拼接向量进行处理,得到第一相关性向量;
根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量;
根据所述多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量,包括:
将每个第一商户特征向量中每一维度上的第一元素映射到每个第一商户特征向量的向量空间,得到与所述搜索词向量维度相同的第一特征维度向量;
根据所述搜索词向量和所述多个第一商户特征向量中每一维度对应的第一特征维度向量,应用以下公式,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量:
其中,Q-Attenk表示所述搜索词与维度k上的第一元素的第一元素相关性向量,Qk表示维度k上的搜索词向量,Xk表示任一第一商户特征向量中维度k上的第一元素的第一特征维度向量,dk表示k的维度。
3.根据权利要求1所述的方法,其特征在于,所述根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量,包括:
对于任一第二商户特征向量,根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;
将所述第一相关性向量与所述第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;
采用前馈网络对所述第二拼接向量进行处理,得到所述第二相关性向量。
4.根据权利要求3所述的方法,其特征在于,所述根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量,包括:
将所述第二商户特征向量中每一维度上的第二元素映射到所述第二商户特征向量的向量空间,得到与所述第二商户特征向量维度相同的第二特征维度向量;
根据所述第一相关性向量和每一维度对应的第二特征维度向量,应用以下公式,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量:
5.一种商户排序模型的构建装置,其特征在于,所述装置包括:
获取模块,用于获取用户输入的搜索词、用户实施过操作的多个第一商户的属性信息及基于所述搜索词搜索到的多个第二商户的属性信息,所述第二商户标注有排序结果;
生成模块,用于根据所述搜索词、所述多个第一商户的属性信息及所述多个第二商户的属性信息,生成搜索词向量、多个第一商户特征向量及多个第二商户特征向量,所述搜索词向量、所述第一商户特征向量及所述第二商户特征向量的维度相同;
所述生成模块,还用于根据所述搜索词向量和所述多个第一商户特征向量中每一维度上的第一元素,生成所述搜索词与每一维度上的第一元素的第一元素相关性向量;将所述搜索词与各个维度上的第一元素的第一元素相关性向量进行连接,得到第一拼接向量;采用前馈网络对所述第一拼接向量进行处理,得到第一相关性向量;
所述生成模块,还用于根据所述第一相关性向量和所述多个第二商户特征向量,生成多个第二相关性向量;
训练模块,用于根据所述多个第二相关性向量,对初始商户排序模型进行训练,得到商户排序模型。
6.根据权利要求5所述的装置,其特征在于,所述生成模块,用于对于任一第二商户特征向量,根据所述第一相关性向量和所述第二商户特征向量中每一维度上的第二元素,生成所述第一相关性向量与所述第二商户特征向量中每一维度上的第二元素的第二元素相关性向量;将所述第一相关性向量与所述第二商户特征向量各个维度上的第二元素的第二元素相关性向量进行连接,得到第二拼接向量;采用前馈网络对所述第二拼接向量进行处理,得到所述第二相关性向量。
7.一种服务器,其特征在于,所述服务器包括处理器和存储器,所述存储器中存储有至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行,以实现如权利要求1至4中任一项所述的商户排序模型的构建方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一条程序代码,所述至少一条程序代码由处理器加载并执行,以实现如权利要求1至4中任一项所述的商户排序模型的构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565288.7A CN113297511B (zh) | 2021-05-24 | 2021-05-24 | 商户排序模型的构建方法、装置、服务器及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110565288.7A CN113297511B (zh) | 2021-05-24 | 2021-05-24 | 商户排序模型的构建方法、装置、服务器及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113297511A CN113297511A (zh) | 2021-08-24 |
CN113297511B true CN113297511B (zh) | 2022-09-16 |
Family
ID=77324215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110565288.7A Active CN113297511B (zh) | 2021-05-24 | 2021-05-24 | 商户排序模型的构建方法、装置、服务器及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113297511B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017177630A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 个性化信息推荐方法及装置 |
CN107679119A (zh) * | 2017-09-19 | 2018-02-09 | 北京京东尚科信息技术有限公司 | 生成品牌衍生词的方法和装置 |
CN108255954A (zh) * | 2017-12-20 | 2018-07-06 | 广州优视网络科技有限公司 | 应用检索方法、装置、存储介质以及终端 |
CN109657145A (zh) * | 2018-12-20 | 2019-04-19 | 拉扎斯网络科技(上海)有限公司 | 商户搜索方法及装置、电子设备及计算机可读存储介质 |
CN112559895A (zh) * | 2021-02-19 | 2021-03-26 | 深圳平安智汇企业信息管理有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105912630B (zh) * | 2016-04-07 | 2020-01-31 | 北京搜狗信息服务有限公司 | 一种信息扩展方法及装置 |
CN108614832B (zh) * | 2016-12-12 | 2022-01-28 | 苏宁易购集团股份有限公司 | 一种用户个性化商品搜索实现方法及装置 |
CN107330023B (zh) * | 2017-06-21 | 2021-02-12 | 北京百度网讯科技有限公司 | 基于关注点的文本内容推荐方法和装置 |
CN107832432A (zh) * | 2017-11-15 | 2018-03-23 | 北京百度网讯科技有限公司 | 一种搜索结果排序方法、装置、服务器和存储介质 |
CN111078858B (zh) * | 2018-10-19 | 2023-06-09 | 阿里巴巴集团控股有限公司 | 文章搜索方法、装置及电子设备 |
CN112446727B (zh) * | 2019-09-04 | 2023-09-12 | 百度在线网络技术(北京)有限公司 | 广告触发的方法、装置、设备及计算机可读存储介质 |
CN111079985B (zh) * | 2019-11-26 | 2021-07-06 | 昆明理工大学 | 一种基于bert并融合可区分属性特征的刑事案件刑期预测方法 |
CN111899074A (zh) * | 2020-08-07 | 2020-11-06 | 赵禁 | 一种商城集中显示方法及系统 |
CN112148923B (zh) * | 2020-08-18 | 2023-12-26 | 北京达佳互联信息技术有限公司 | 搜索结果的排序方法、排序模型的生成方法、装置及设备 |
CN111814058A (zh) * | 2020-08-20 | 2020-10-23 | 深圳市欢太科技有限公司 | 基于用户意图的推送方法、装置、电子设备及存储介质 |
CN112100529B (zh) * | 2020-11-17 | 2021-03-19 | 北京三快在线科技有限公司 | 搜索内容排序方法、装置、存储介质和电子设备 |
CN112434183B (zh) * | 2020-11-30 | 2024-05-17 | 北京达佳互联信息技术有限公司 | 一种搜索结果的排序方法、装置、设备和存储介质 |
CN112749238A (zh) * | 2020-12-30 | 2021-05-04 | 北京金堤征信服务有限公司 | 搜索排序方法、装置、电子设备以及计算机可读存储介质 |
-
2021
- 2021-05-24 CN CN202110565288.7A patent/CN113297511B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2017177630A1 (zh) * | 2016-04-15 | 2017-10-19 | 乐视控股(北京)有限公司 | 个性化信息推荐方法及装置 |
CN107679119A (zh) * | 2017-09-19 | 2018-02-09 | 北京京东尚科信息技术有限公司 | 生成品牌衍生词的方法和装置 |
CN108255954A (zh) * | 2017-12-20 | 2018-07-06 | 广州优视网络科技有限公司 | 应用检索方法、装置、存储介质以及终端 |
CN109657145A (zh) * | 2018-12-20 | 2019-04-19 | 拉扎斯网络科技(上海)有限公司 | 商户搜索方法及装置、电子设备及计算机可读存储介质 |
CN112559895A (zh) * | 2021-02-19 | 2021-03-26 | 深圳平安智汇企业信息管理有限公司 | 一种数据处理方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113297511A (zh) | 2021-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2021159776A1 (zh) | 基于人工智能的推荐方法、装置、电子设备及存储介质 | |
CN111753060B (zh) | 信息检索方法、装置、设备及计算机可读存储介质 | |
CN111061946B (zh) | 场景化内容推荐方法、装置、电子设备及存储介质 | |
CN111581510A (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
CN112119388A (zh) | 训练图像嵌入模型和文本嵌入模型 | |
CN111353106A (zh) | 推荐方法和装置、电子设备和存储介质 | |
CN112989212B (zh) | 媒体内容推荐方法、装置和设备及计算机存储介质 | |
CN111143539B (zh) | 基于知识图谱的教学领域问答方法 | |
JP2022169743A (ja) | 情報抽出方法、装置、電子機器及び記憶媒体 | |
CN115964560B (zh) | 基于多模态预训练模型的资讯推荐方法及设备 | |
CN111324773A (zh) | 一种背景音乐构建方法、装置、电子设备和存储介质 | |
CN116303558A (zh) | 查询语句生成方法、数据查询方法及生成模型训练方法 | |
CN113051468A (zh) | 一种基于知识图谱和强化学习的电影推荐方法及系统 | |
CN113297511B (zh) | 商户排序模型的构建方法、装置、服务器及存储介质 | |
CN115631008B (zh) | 商品推荐方法、装置、设备及介质 | |
CN115203516A (zh) | 基于人工智能的信息推荐方法、装置、设备及存储介质 | |
CN111860870A (zh) | 交互行为确定模型的训练方法、装置、设备及介质 | |
CN117635275B (zh) | 基于大数据的智能电商运营商品管理平台及方法 | |
CN116089712B (zh) | 基于数据挖掘与分析的热门会议推荐方法及系统 | |
CN112000817B (zh) | 多媒体资源的处理方法、装置、电子设备及存储介质 | |
CN113312523B (zh) | 字典生成、搜索关键字推荐方法、装置和服务器 | |
CN116628179B (zh) | 一种用户操作数据的可视化与人机交互推荐方法 | |
CN113807749B (zh) | 一种对象评分方法和装置 | |
CN115114545A (zh) | 内容处理方法以及相关设备 | |
CN117574915A (zh) | 基于多方数据源的公共数据平台及其数据分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |