CN116911913A - 一种交互结果的预测方法及装置 - Google Patents
一种交互结果的预测方法及装置 Download PDFInfo
- Publication number
- CN116911913A CN116911913A CN202311169025.XA CN202311169025A CN116911913A CN 116911913 A CN116911913 A CN 116911913A CN 202311169025 A CN202311169025 A CN 202311169025A CN 116911913 A CN116911913 A CN 116911913A
- Authority
- CN
- China
- Prior art keywords
- task
- feature
- feature vector
- extraction module
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000003993 interaction Effects 0.000 title claims abstract description 88
- 238000000034 method Methods 0.000 title claims abstract description 45
- 239000013598 vector Substances 0.000 claims abstract description 435
- 238000000605 extraction Methods 0.000 claims description 218
- 238000004590 computer program Methods 0.000 claims description 20
- 238000010606 normalization Methods 0.000 claims description 18
- 230000004927 fusion Effects 0.000 claims description 16
- 238000006243 chemical reaction Methods 0.000 abstract description 9
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000012360 testing method Methods 0.000 description 112
- 239000010410 layer Substances 0.000 description 37
- 230000006870 function Effects 0.000 description 15
- 238000012545 processing Methods 0.000 description 11
- 230000004913 activation Effects 0.000 description 8
- 230000006399 behavior Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000002452 interceptive effect Effects 0.000 description 5
- 239000002356 single layer Substances 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000012163 sequencing technique Methods 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开涉及人工智能技术领域,提供了一种交互结果的预测方法、装置、计算机设备及计算机可读存储介质。该方法可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
Description
技术领域
本公开涉及人工智能技术领域,尤其涉及一种交互结果的预测方法及装置。
背景技术
在互联网电子商务业务中,如何根据用户的个性化特征,向用户推荐合适的商品或服务一直是一个重要课题。在电商场景中,搜索系统是连接人和货的桥梁。高效的搜索系统可以快速将用户需要的商品在千万个商品中检索出来,并将用户最有可能点击与购买的商品通过排序算法展现到页面最上方。
然而,目前的神经网络模型,对于用户输入的query(搜索词)和商品文本的建模粒度不够,并且只针对性的对单目标进行优化,没有同时考虑到用户在点击后的一系列行为,从而对随搜索的排序结果预测会发生偏差,即对于商品的交互结果预测不准确,这样,会使得向用户推荐商品或服务的场景下,给用户所推荐的商品或服务并不是用户真正想要的商品或服务,从而导致用户体验较差,且在提高商品或服务的转化率上有一定的局限性。
发明内容
有鉴于此,本公开实施例提供了一种交互结果的预测方法、装置、计算机设备及计算机可读存储介质,以解决现有技术中对于商品的交互结果预测不准确,这使得向用户推荐商品或服务的场景下,给用户所推荐的商品或服务并不是用户真正想要的商品或服务,从而导致用户体验较差,且在提高商品或服务的转化率上有一定的局限性的问题。
本公开实施例的第一方面,提供了一种交互结果的预测方法,该方法应用于交互结果预测模型,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;该方法包括:
获取搜索文本和目标对象的标识、属性信息;
将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;
将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;
将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;
将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量;
将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。
本公开实施例的第二方面,提供了一种交互结果的预测装置,该装置应用于交互结果预测模型,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;该装置包括:
信息获取单元,用于获取搜索文本和目标对象的标识、属性信息;
第一确定单元,用于将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;
第二确定单元,用于将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;
第三确定单元,用于将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;
第四确定单元,用于将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量;
结果确定单元,用于将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。
本公开实施例的第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并且可以在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
本公开实施例与现有技术相比存在的有益效果是:本公开实施例所提供的方法可以应用于交互结果预测模型,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块。在本实施例中,可以先获取搜索文本和目标对象的标识、属性信息;然后,可以将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;接着,可以将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量,其中,每个第一任务特征向量所对应的任务均不相同;紧接着,可以将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量,其中,每个第二任务特征向量所对应的任务均不相同;最后,可以将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量,以及,将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。在本实施例中,可以利用特征生成模块,得到该搜索文本和该目标对象的标识、属性信息的原始特征向量,建模了搜索文本和目标对象的特征,降低了搜索文本和该目标对象不匹配的概率;以及,可以从多个任务维度提取搜索文本和该目标对象的标识、属性信息的对应的特征向量,以及,可以基于多个任务维度的特征向量确定目标对象的交互结果;这样,便可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
附图说明
为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本公开实施例的应用场景的场景示意图;
图2是本公开实施例提供的交互结果的预测方法的流程图;
图3是本公开实施例提供的交互结果预测模型的网络架构示意图;
图4是本公开实施例提供的交互结果的预测装置的框图;
图5是本公开实施例提供的计算机设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
下面将结合附图详细说明根据本公开实施例的一种交互结果的预测方法和装置。
在现有技术中,由于目前的神经网络模型,对于用户输入的query(搜索词)和商品文本的建模粒度不够,并且只针对性的对单目标进行优化,没有同时考虑到用户在点击后的一系列行为,从而对随搜索的排序结果预测会发生偏差,即对于商品的交互结果预测不准确,这样,会使得向用户推荐商品或服务的场景下,给用户所推荐的商品或服务并不是用户真正想要的商品或服务,从而导致用户体验较差,且在提高商品或服务的转化率上有一定的局限性。
为了解决上述问题。本发明提供了一种交互结果的预测方法,在本方法中,由于在本实施例中,可以利用特征生成模块,得到该搜索文本和该目标对象的标识、属性信息的原始特征向量,建模了搜索文本和目标对象的特征,降低了搜索文本和该目标对象不匹配的概率;以及,可以从多个任务维度提取搜索文本和该目标对象的标识、属性信息的对应的特征向量,以及,可以基于多个任务维度的特征向量确定目标对象的交互结果;这样,便可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
举例说明,本发明实施例可以应用到如图1所示的应用场景。在该场景中,可以包括终端设备1和服务器2。
终端设备1可以是硬件,也可以是软件。当终端设备1为硬件时,其可以是具有显示屏且支持与服务器2通信的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等;当终端设备1为软件时,其可以安装在如上该的电子设备中。终端设备1可以实现为多个软件或软件模块,也可以实现为单个软件或软件模块,本公开实施例对此不作限制。进一步地,终端设备1上可以安装有各种应用,例如数据处理应用、即时通信工具、社交平台软件、搜索类应用、购物类应用等。
服务器2可以是提供各种服务的服务器,例如,对与其建立通信连接的终端设备发送的请求进行接收的后台服务器,该后台服务器可以对终端设备发送的请求进行接收和分析等处理,并生成处理结果。服务器2可以是一台服务器,也可以是由若干台服务器组成的服务器集群,或者还可以是一个云计算服务中心,本公开实施例对此不作限制。
需要说明的是,服务器2可以是硬件,也可以是软件。当服务器2为硬件时,其可以是为终端设备1提供各种服务的各种电子设备。当服务器2为软件时,其可以是为终端设备1提供各种服务的多个软件或软件模块,也可以是为终端设备1提供各种服务的单个软件或软件模块,本公开实施例对此不作限制。
终端设备1与服务器2可以通过网络进行通信连接。网络可以是采用同轴电缆、双绞线和光纤连接的有线网络,也可以是无需布线就能实现各种通信设备互联的无线网络,例如,蓝牙(Bluetooth)、近场通信(Near Field Communication,NFC)、红外(Infrared)等,本公开实施例对此不作限制。
具体地,用户可以通过终端设备1输入搜索文本和目标对象的标识、属性信息;终端设备1将搜索文本和目标对象的标识、属性信息向服务器2发送。服务器2存储有已训练的交互结果预测模型,其中,交互结果预测模型可以包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;服务器2可以先将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;然后,服务器2可以将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量,其中,每个第一任务特征向量所对应的任务均不相同;接着,服务器2可以将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量,其中,每个第二任务特征向量所对应的任务均不相同;最后,服务器2可以将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量,以及,将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。这样,由于本申请可以利用特征生成模块,得到该搜索文本和该目标对象的标识、属性信息的原始特征向量,建模了搜索文本和目标对象的特征,降低了搜索文本和该目标对象不匹配的概率;以及,可以从多个任务维度提取搜索文本和该目标对象的标识、属性信息的对应的特征向量,以及,可以基于多个任务维度的特征向量确定目标对象的交互结果;这样,便可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
需要说明的是,终端设备1和服务器2以及网络的具体类型、数量和组合可以根据应用场景的实际需求进行调整,本公开实施例对此不作限制。
需要注意的是,上述应用场景仅是为了便于理解本公开而示出,本公开的实施方式在此方面不受任何限制。相反,本公开的实施方式可以应用于适用的任何场景。
图2是本公开实施例提供的一种交互结果的预测方法的流程图。图2的一种交互结果的预测方法可以由图1的终端设备或服务器执行。其中,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;其中,特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块依次连接。如图2所示,该交互结果的预测方法包括:
S201:获取搜索文本和目标对象的标识、属性信息。
在本实施例中,搜索文本可以理解为用户输入的且需要进行搜索的字符串,例如,搜索文本可以为手机、衣服等。目标对象可以理解为需要预测是否会被用户执行交互行为的对象。其中,交互行为可以理解为能够反映用户对目标对象所执行的操作,例如,假设目标对象为商品,交互行为可以包括用户对商品点击、用户将商品加入购物车、用户点击商品后并购买商品。目标对象的标识可以理解用于辨别目标对象的标识,可以理解的是,对象的标识是唯一,即不同的对象的标识是不相同的。例如,假设目标对象为商品,则目标对象的标识可以为商品ID。目标对象的属性信息可以理解为能够反映交互对象本身属性的特征信息。例如,目标对象为商品或服务时,交互对象属性特征可以为能够反映商品或服务的价格、单日销售量、产品类型、颜色等属性的信息。
S202:将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量。
在本实施例中,获取到搜索文本和目标对象的标识、属性信息后,可以利用特征生成模块生成搜索文本和目标对象的标识、属性信息对应的原始特征向量。可以理解的是,原始特征向量可以反映搜索文本的文本内容、目标对象的标识以及目标对象的属性信息。
S203:将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量。
在获取到原始特征向量后,可以利用第一特征提取模块提取原始特征向量中与各个预测任务的特性所相关的特征向量,以及,与所有预测任务的共性所相关的特征向量。在本实施例中,为了便于描述,可以将与各个预测任务的特性所相关的特征向量称之为第一任务特征向量,可以将与所有预测任务的共性所相关的特征向量称之为共享特征向量。
需要说明的是,每个第一任务特征向量所对应的任务(即预测任务)均不相同,因此,不同预测任务对应的第一任务特征向量也是不同的。可以理解的是,预测任务的特性可以理解为该预测任务所特定关注的特征,而其它预测任务可能并不关注的特征;预测任务的共性可以理解为每个预测任务都关注的特征。需要说明的是,第一任务特征向量的数量与预测任务的数量是相同的。
S204:将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量。
在获取到多个任务特征向量和共享特征向量后,可以利用第二特征提取模块提取与各个预测任务所相关的第二任务特征向量。可以理解的是,第二任务特征向量为各个预测任务执行时所需要的特征向量。需要说明的是,每个第二任务特征向量所对应的任务(即预测任务)均不相同,因此,不同预测任务对应的第二任务特征向量也是不同的。需要说明的是,第二任务特征向量的数量与第一任务特征向量的数量是相同的。
S205:将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量。
在获取到多个预测任务各自分别对应的第二任务特征向量后,可以利用信息提取模块分别根据各个第二任务特征向量,确定各个第二任务特征向量各自分别对应的任务结果特征向量。可以理解的是,任务结果特征向量可以理解为能够反映预测任务的结果的特征向量。需要说明的是,任务结果特征向量的数量与第一任务特征向量的数量是相同的。
S206:将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。
在获取到多个任务结果特征向量,可以利用结果输出模块,确定该搜索文本和该目标对象之间的预测交互结果。例如,有些预测任务之间是存在相关关系的,因此,在确定一个预测任务的预测交互结果时,可能需要根据多个预测任务对应的任务结果特征向量来确定。需要说明的是,预测交互结果的数量可以与预测任务的数量是相同的,即每个预测任务均有与其对应的预测交互结果。例如,在一些实施例中,该搜索文本和该目标对象之间的预测交互结果可以包括CTR测试任务对应的预测结果CTR、ATC测试任务对应的预测结果ATC、CVR测试任务对应的预测结果CVR。
本公开实施例与现有技术相比存在的有益效果是:本公开实施例所提供的方法可以应用于交互结果预测模型,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块。在本实施例中,可以先获取搜索文本和目标对象的标识、属性信息;然后,可以将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;接着,可以将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量,其中,每个第一任务特征向量所对应的任务均不相同;紧接着,可以将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量,其中,每个第二任务特征向量所对应的任务均不相同;最后,可以将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量,以及,将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。在本实施例中,可以利用特征生成模块,得到该搜索文本和该目标对象的标识、属性信息的原始特征向量,建模了搜索文本和目标对象的特征,降低了搜索文本和该目标对象不匹配的概率;以及,可以从多个任务维度提取搜索文本和该目标对象的标识、属性信息的对应的特征向量,以及,可以基于多个任务维度的特征向量确定目标对象的交互结果;这样,便可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
在一些实施例中,该特征生成模块可以包括编码器、特征交叉层、归一化层和特征拼接层。例如,如图3所示,编码器可以为BERT模型,特征交叉层可以为Text Interaction层,归一化层可以为Feature Normalization层,特征拼接层可以为Concatenate层。具体地,S202“将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量”的步骤具体可以包括以下步骤:
S202a:将该搜索文本和该目标对象的标识、属性信息分别输入该编码器,得到该搜索文本的特征向量、该标识的特征向量和该属性信息的特征向量。
在本实施例中,可以将将该搜索文本和该目标对象的标识、属性信息分别输入该编码器进行特征提取,得到该搜索文本的特征向量、该标识的特征向量和该属性信息的特征向量。以图3为例,首先将该搜索文本和该目标对象的标识分别输入已训练的BERT(即编码器),使用BERT对搜索文本query和目标对象的标识item进行编码,获得搜索文本query和目标对象的标识item的低维向量表征(即搜索文本的特征向量、标识的特征向量);以及,将该目标对象的属性信息输入已训练的BERT(即编码器),使用BERT对属性信息进行编码,获得属性信息的低维向量表征(即属性信息的特征向量)。
S202b:将该搜索文本的特征向量和该标识的特征向量输入该特征交叉层,得到交叉特征向量。
在该搜索文本的特征向量和该标识的特征向量后,可以将该搜索文本的特征向量和该标识的特征向量输入该特征交叉层,以便特征交叉层对该搜索文本的特征向量和该标识的特征向量进行特征交叉处理,得到交叉特征向量。
以图3为例,可以利用Text Interaction层(即特征交叉层)对搜索文本query和目标对象的标识item的低维向量表征(即搜索文本的特征向量Query Embedding、标识的特征向量item Embedding)进行特征交叉处理,获得交叉特征向量。
S202c:将该属性信息的特征向量输入该归一化层,得到该属性信息的归一化特征向量。
在获取到属性信息的特征向量后,可以将该属性信息的特征向量输入该归一化层,归一化层可以对属性信息的特征向量进行特征归一化处理,比如:对于输入的离散特征(属性信息的特征向量),归一化层可以对属性信息的特征向量进行onehot编码再进行向量化,便可以得到属性信息的归一化特征向量。
以图3为例,属性信息(例如item的属性特征如:颜色、价格、分数匹配度等)的特征向量wide Features,作为归一化层(即Feature Normalization层)的输入,得到该属性信息的归一化特征向量.
S202d:将该交叉特征向量和该属性信息的归一化特征向量输入该特征拼接层,得到原始特征向量。
在本实施例中,可以将该交叉特征向量和该属性信息的归一化特征向量输入特征拼接层(例如Concatenate层),特征拼接层可以对交叉特征向量和该属性信息的归一化特征向量进行拼接处理,得到原始特征向量。
在一些实施例中,该第一特征提取模块包括第一任务特征提取模块、第二任务特征提取模块、第三任务特征提取模块和共享特征提取模块,其中,该第一任务特征提取模块、该第二任务特征提取模块、该第三任务特征提取模块和该共享特征提取模块均包括门控网络和专家网络。例如,如图3所示,三个测试任务可以为CTR(Click-Through-Rate,用户点击这个商品的概率)测试任务、ATC(用户将这个商品加入购物车的概率)测试任务和CVR(Conversion Rate,用户点击之后并购买这个商品的概率),第一特征提取模块可以包括CTR测试任务对应的第一任务特征提取模块、ATC测试任务对应的第二任务特征提取模块、CVR测试任务对应的第三任务特征提取模块和共享特征提取模块。其中,CTR测试任务对应的第一任务特征提取模块包括门控网络Gating和专家网络Expert A;ATC测试任务对应的第二任务特征提取模块包括门控网络Gating和专家网络Expert B;CVR测试任务对应的第三任务特征提取模块包括门控网络Gating和专家网络Expert C;共享特征提取模块可以包括门控网络Gating和专家网络Shared Expert。具体地,S203“该将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量”的步骤可以包括以下步骤:
S203a:将该原始特征向量输入该第一任务特征提取模块,得到第一预测任务对应的第一任务特征向量。
可以将原始特征向量输入该第一任务特征提取模块,第一任务特征提取模块可以针对第一测试任务(例如CTR测试任务)提取属于第一测试任务的特性的特征向量,从而可以得到第一预测任务对应的第一任务特征向量。需要说明的是,在一种实现方式中,第一任务特征向量可以为隐向量。
作为一种示例,第一任务特征提取模块中的专家网络Expert A可以先从原始特征向量中提取第一预测任务对应的特征向量;接着,可以利用第一任务特征提取模块中的门控网络Gating通过第一测试任务对应的输出权重,在第一预测任务对应的特征向量中提取第一预测任务对应第一任务特征向量。需要说明的是,门控网络的各种方案可以学习组合专家网络的不同模式,因此第一任务特征提取模块可以在提取第一预测任务对应的第一任务特征向量时,将考虑第一预测任务与每个测试任务的相关性和差异性。
在一种实现方式中,专家网络Expert A可以为简单的多层前馈网络,可以具有批量归一化和ReLu激活功能。门控网络Gating可以为具有Softmax 激活函数的单层前馈网络。
S203b:将该原始特征向量输入该第二任务特征提取模块,得到第二预测任务对应的第一任务特征向量。
可以将原始特征向量输入该第二任务特征提取模块,第二任务特征提取模块可以针对第二测试任务(例如ATC测试任务)提取属于第二测试任务的特性的特征向量,从而可以得到第二预测任务对应的第一任务特征向量。需要说明的是,在一种实现方式中,第一任务特征向量可以为隐向量。
作为一种示例,第二任务特征提取模块中的专家网络Expert B可以先从原始特征向量中提取第二预测任务对应的特征向量;接着,可以利用第二任务特征提取模块中的门控网络Gating通过第二测试任务对应的输出权重,在第二预测任务对应的特征向量中提取第二预测任务对应第一任务特征向量。需要说明的是,门控网络的各种方案可以学习组合专家网络的不同模式,因此第二任务特征提取模块可以在提取第二预测任务对应的第一任务特征向量时,将考虑第二预测任务与每个测试任务的相关性和差异性。
在一种实现方式中,专家网络Expert B可以为简单的多层前馈网络,可以具有批量归一化和ReLu激活功能。门控网络Gating可以为具有Softmax 激活函数的单层前馈网络。
S203c:将该原始特征向量输入该第三任务特征提取模块,得到第三预测任务对应的第一任务特征向量。
可以将原始特征向量输入该第三任务特征提取模块,第三任务特征提取模块可以针对第三测试任务(例如CVR测试任务)提取属于第三测试任务的特性的特征向量,从而可以得到第三预测任务对应的第一任务特征向量。需要说明的是,在一种实现方式中,第一任务特征向量可以为隐向量。
作为一种示例,第三任务特征提取模块中的专家网络Expert C可以先从原始特征向量中提取第三预测任务对应的特征向量;接着,可以利用第三任务特征提取模块中的门控网络Gating通过第三测试任务对应的输出权重,在第三预测任务对应的特征向量中提取第三预测任务对应第一任务特征向量。需要说明的是,门控网络的各种方案可以学习组合专家网络的不同模式,因此第三任务特征提取模块可以在提取第三预测任务对应的第一任务特征向量时,将考虑第三预测任务与每个测试任务的相关性和差异性。
在一种实现方式中,专家网络Expert C可以为简单的多层前馈网络,可以具有批量归一化和ReLu激活功能。门控网络Gating可以为具有Softmax 激活函数的单层前馈网络。
S203d:将该原始特征向量输入该共享特征提取模块,得到该共享特征向量。
可以将原始特征向量输入该共享特征提取模块,共享特征提取模块可以提取第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)所共有的特征向量,从而可以得到共享特征向量。需要说明的是,在一种实现方式中,共享特征向量可以为隐向量。
作为一种示例,共享特征提取模块中的专家网络Shared Expert可以先从原始特征向量中提取第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)所共有的特征向量;接着,可以利用共享特征提取模块中的门控网络Gating通过第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)对应的输出权重,在第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)所共有的特征向量中提取第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)对应的共享特征向量。需要说明的是,门控网络的各种方案可以学习组合专家网络的不同模式,因此共享特征提取模块可以在提取第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)对应的共享特征向量时,将考虑第一测试任务(例如CTR测试任务)、第二测试任务(例如ATC测试任务)、第三测试任务(例如CVR测试任务)之间的相关性和共同性。
在一种实现方式中,专家网络Shared Expert可以为简单的多层前馈网络,可以具有批量归一化和ReLu激活功能。门控网络Gating可以为具有Softmax 激活函数的单层前馈网络。
在一些实施例中,该第二特征提取模块可以包括:该第一任务特征提取模块、该第二任务特征提取模块和该第三任务特征提取模块,其中,该第一任务特征提取模块、该第二任务特征提取模块、该第三任务特征提取模块均包括门控网络和专家网络。例如,如图3所示,三个测试任务可以为CTR(Click-Through-Rate,用户点击这个商品的概率)测试任务、ATC(用户将这个商品加入购物车的概率)测试任务和CVR(Conversion Rate,用户点击之后并购买这个商品的概率),第二特征提取模块可以包括CTR测试任务对应的第一任务特征提取模块、ATC测试任务对应的第二任务特征提取模块、CVR测试任务对应的第三任务特征提取模块。其中,CTR测试任务对应的第一任务特征提取模块包括门控网络Gating和专家网络Expert A;ATC测试任务对应的第二任务特征提取模块包括门控网络Gating和专家网络Expert B;CVR测试任务对应的第三任务特征提取模块包括门控网络Gating和专家网络Expert C。具体地,S204“该将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量”的步骤可以包括以下步骤:
S204a:将该第一预测任务对应的第一任务特征向量和该共享特征向量输入该第一任务特征提取模块,得到该第一预测任务对应的第二任务特征向量。
在本实施例中,第一任务特征提取模块中的专家网络Expert A可以先对第一预测任务对应的第一任务特征向量和共享特征向量进行加权求和,然后,可以利用第一任务特征提取模块中的门控网络Gating提取第一预测任务对应的第一任务特征向量和共享特征向量的加权和之间的特定于第一预测任务的隐藏信息对应的特征向量,以及,将该特定于第一预测任务的隐藏信息对应的特征向量作为第一预测任务对应的第二任务特征向量。
S204b:将该第二预测任务对应的第一任务特征向量和该共享特征向量输入该第二任务特征提取模块,得到该第二预测任务对应的第二任务特征向量。
在本实施例中,第二任务特征提取模块中的专家网络Expert B可以先对第二预测任务对应的第二任务特征向量和共享特征向量进行加权求和,然后,可以利用第二任务特征提取模块中的门控网络Gating提取第二预测任务对应的第二任务特征向量和共享特征向量的加权和之间的特定于第二预测任务的隐藏信息对应的特征向量,以及,将该特定于第二预测任务的隐藏信息对应的特征向量作为第二预测任务对应的第二任务特征向量。
S204c:将该第三预测任务对应的第一任务特征向量和该共享特征向量输入该第三任务特征提取模块,得到该第三预测任务对应的第二任务特征向量。
在本实施例中,第三任务特征提取模块中的专家网络Expert C可以先对第三预测任务对应的第三任务特征向量和共享特征向量进行加权求和,然后,可以利用三任务特征提取模块中的门控网络Gating提取第三预测任务对应的第三任务特征向量和共享特征向量的加权和之间的特定于第三预测任务的隐藏信息对应的特征向量,以及,将该特定于第三预测任务的隐藏信息对应的特征向量作为第三预测任务对应的第二任务特征向量。
在一些实施例中,该信息提取模块可以包括第一任务信息提取模块、第二任务信息提取模块和第三任务信息提取模块,其中,该第一任务信息提取模块、该第二任务信息提取模块和该第三任务信息提取模块均包括塔网络和注意力单元。例如,如图3所示,三个测试任务可以为CTR(Click-Through-Rate,用户点击这个商品的概率)测试任务、ATC(用户将这个商品加入购物车的概率)测试任务和CVR(Conversion Rate,用户点击之后并购买这个商品的概率),信息提取模块可以包括CTR测试任务对应的第一任务信息提取模块、ATC测试任务对应的第二任务信息提取模块、CVR测试任务对应的第三任务信息提取模块。其中,CTR测试任务对应的第一任务信息提取模块包括塔网络Tower A和注意力单元Attention;ATC测试任务对应的第二任务信息提取模块包括塔网络Tower B和注意力单元Attention;CVR测试任务对应的第三任务信息提取模块包括塔网络Tower C和注意力单元Attention。具体地,S205“该将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量”的步骤可以包括以下步骤:
S205a:将该第一预测任务对应的第二任务特征向量输入该第一任务信息提取模块,得到该第一预测任务对应的任务结果特征向量。
在本实施例中,第一任务信息提取模块中的塔网络Tower A和注意单元attention可以基于第一预测任务,从第一预测任务对应的第二任务特征向量中提取第一预测任务对应的隐藏信息,以及,将该第一预测任务对应的隐藏信息作为第一预测任务对应的任务结果特征向量。其中,第一任务信息提取模块中的塔网络Tower A可以为一个多层前馈网络,可以扩展到任何高级结构。需要说明的是,第一任务信息提取模块中的塔网络Tower A和注意单元attention可以自适应地从第一预测任务对应的第二任务特征向量中传输有用的信息给第一预测任务使用,这种结构可以同时优化用户在线的多种行为如点击、加购和购买。
S205b:将该第二预测任务对应的第二任务特征向量输入该第二任务信息提取模块,得到该第二预测任务对应的任务结果特征向量。
在本实施例中,第二任务信息提取模块中的塔网络Tower B和注意单元attention可以基于第二预测任务,从第二预测任务对应的第二任务特征向量中提取第二预测任务对应的隐藏信息,以及,将该第二预测任务对应的隐藏信息作为第二预测任务对应的任务结果特征向量。其中,第二任务信息提取模块中的塔网络Tower B可以为一个多层前馈网络,可以扩展到任何高级结构。需要说明的是,第二任务信息提取模块中的塔网络Tower B和注意单元attention可以自适应地从第二预测任务对应的第二任务特征向量中传输有用的信息给第二预测任务使用,这种结构可以同时优化用户在线的多种行为如点击、加购和购买。
S205c:将该第三预测任务对应的第二任务特征向量输入该第三任务信息提取模块,得到该第三预测任务对应的任务结果特征向量。
在本实施例中,第三任务信息提取模块中的塔网络Tower C和注意单元attention可以基于第三预测任务,从第三预测任务对应的第二任务特征向量中提取第三预测任务对应的隐藏信息,以及,将该第三预测任务对应的隐藏信息作为第三预测任务对应的任务结果特征向量。其中,第三任务信息提取模块中的塔网络Tower C可以为一个多层前馈网络,可以扩展到任何高级结构。需要说明的是,第三任务信息提取模块中的塔网络Tower C和注意单元attention可以自适应地从第三预测任务对应的第二任务特征向量中传输有用的信息给第三预测任务使用,这种结构可以同时优化用户在线的多种行为如点击、加购和购买。
在一些实施例中,该结果输出模块可以包括第一融合模块和第二融合模块。具体地,S206“该将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果”可以包括以下步骤:
S206a:根据该第一预测任务对应的任务结果特征向量,确定第一预测任务对应的预测结果。
例如,假设第一预测任务为CTR测试任务,则可以直接将第一预测任务对应的任务结果特征向量,作为CTR测试任务对应的预测结果CTR。
S206b:将该第一预测任务对应的任务结果特征向量和该第二预测任务对应的任务结果特征向量输入该第一融合模块,得到第二预测任务对应的预测结果特征向量;以及,根据该第二预测任务对应的预测结果特征向量,确定该第二预测任务对应的预测结果。
例如,假设第一预测任务为CTR测试任务,第二预测任务为ATC测试任务,可以将第一预测任务对应的任务结果特征向量和第二预测任务对应的任务结果特征向量输入该第一融合模块;该第一融合模块可以将第一预测任务对应的任务结果特征向量和第二预测任务对应的任务结果特征向量进行融合,得到第二预测任务对应的预测结果特征向量;以及,将该第二预测任务对应的预测结果特征向量作为该第二预测任务ATC测试任务对应的预测结果ATC。
S206c:将该第三预测任务对应的任务结果特征向量和该第二预测任务对应的预测结果特征向量输入第二融合模块,得到第三预测任务对应的预测结果特征向量;以及,根据该第三预测任务对应的预测结果特征向量,确定该第二预测任务对应的预测结果。
例如,假设第二预测任务为ATC测试任务,第三预测任务为CVR测试任务,可以将第三预测任务对应的任务结果特征向量和该第二预测任务对应的预测结果特征向量输入第二融合模块;该第二融合模块可以将第三预测任务对应的任务结果特征向量和第二预测任务对应的任务结果特征向量进行融合,得到第三预测任务对应的预测结果特征向量;以及,将该第三预测任务对应的预测结果特征向量作为该第三预测任务CVR测试任务对应的预测结果CVR。
S206d:将该第一预测任务对应的预测结果、该第二预测任务对应的预测结果和该第三预测任务对应的预测结果作为该搜索文本和该目标对象之间的预测交互结果。
例如,可以将CTR测试任务对应的预测结果CTR、ATC测试任务对应的预测结果ATC、CVR测试任务对应的预测结果CVR作为搜索文本和该目标对象之间的预测交互结果。
需要说明的是,交互结果预测模型最终的损失值是多个任务(第一测试任务、第二测试任务和第三测试任务,例如CTR、ATC、CVR)的损失值的线性加权之和;其中,第一测试任务、第二测试任务和第三测试任务各自所使用的损失函数可以均为二分类交叉熵损失函数。不同损失值的权重调节是一个动态的过程,因此使用了不确定性权重(UncertaintyWeight)的方式进行处理。在一种实现方式中,交互结果预测模型最终的损失值可以通过下述公式确定:
;
其中,为交互结果预测模型最终的损失值;/>为第一测试任务对应的损失值;/>为第二测试任务对应的损失值;/>为第三测试任务对应的损失值;/>分别为第一测试任务、第二测试任务、第三测试任务的噪声值,用来控制权重。
上述所有可选技术方案,可以采用任意结合形成本公开的可选实施例,在此不再一一赘述。
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
图4是本公开实施例提供的交互结果的预测装置的示意图,该装置应用于交互结果预测模型,该交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块。如图4所示,该交互结果的预测装置包括:
信息获取单元401,用于获取搜索文本和目标对象的标识、属性信息;
第一确定单元402,用于将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;
第二确定单元403,用于将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;
第三确定单元404,用于将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;
第四确定单元405,用于将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量;
结果确定单元406,用于将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。
可选的,该特征生成模块包括编码器、特征交叉层、归一化层和特征拼接层;该第一确定单元402,用于:
将该搜索文本和该目标对象的标识、属性信息分别输入该编码器,得到该搜索文本的特征向量、该标识的特征向量和该属性信息的特征向量;
将该搜索文本的特征向量和该标识的特征向量输入该特征交叉层,得到交叉特征向量;
将该属性信息的特征向量输入该归一化层,得到该属性信息的归一化特征向量;
将该交叉特征向量和该属性信息的归一化特征向量输入该特征拼接层,得到原始特征向量。
可选的,该第一特征提取模块包括第一任务特征提取模块、第二任务特征提取模块、第三任务特征提取模块和共享特征提取模块;该第二确定单元403,用于:
将该原始特征向量输入该第一任务特征提取模块,得到第一预测任务对应的第一任务特征向量;
将该原始特征向量输入该第二任务特征提取模块,得到第二预测任务对应的第一任务特征向量;
将该原始特征向量输入该第三任务特征提取模块,得到第三预测任务对应的第一任务特征向量;
将该原始特征向量输入该共享特征提取模块,得到该共享特征向量。
可选的,该第二特征提取模块包括:该第一任务特征提取模块、该第二任务特征提取模块和该第三任务特征提取模块;该第三确定单元404,用于:
将该第一预测任务对应的第一任务特征向量和该共享特征向量输入该第一任务特征提取模块,得到该第一预测任务对应的第二任务特征向量;
将该第二预测任务对应的第一任务特征向量和该共享特征向量输入该第二任务特征提取模块,得到该第二预测任务对应的第二任务特征向量;
将该第三预测任务对应的第一任务特征向量和该共享特征向量输入该第三任务特征提取模块,得到该第三预测任务对应的第二任务特征向量。
可选的,该第一任务特征提取模块、该第二任务特征提取模块、该第三任务特征提取模块和该共享特征提取模块均包括门控网络和专家网络。
可选的,该信息提取模块包括第一任务信息提取模块、第二任务信息提取模块和第三任务信息提取模块,其中,该第一任务信息提取模块、该第二任务信息提取模块和该第三任务信息提取模块均包括塔网络和注意力单元;该第四确定单元405,用于:
将该第一预测任务对应的第二任务特征向量输入该第一任务信息提取模块,得到该第一预测任务对应的任务结果特征向量;
将该第二预测任务对应的第二任务特征向量输入该第二任务信息提取模块,得到该第二预测任务对应的任务结果特征向量;
将该第三预测任务对应的第二任务特征向量输入该第三任务信息提取模块,得到该第三预测任务对应的任务结果特征向量。
可选的,该结果输出模块包括第一融合模块和第二融合模块;该结果确定单元406,用于:
根据该第一预测任务对应的任务结果特征向量,确定第一预测任务对应的预测结果;
将该第一预测任务对应的任务结果特征向量和该第二预测任务对应的任务结果特征向量输入该第一融合模块,得到第二预测任务对应的预测结果特征向量;以及,根据该第二预测任务对应的预测结果特征向量,确定该第二预测任务对应的预测结果;
将该第三预测任务对应的任务结果特征向量和该第二预测任务对应的预测结果特征向量输入第二融合模块,得到第三预测任务对应的预测结果特征向量;以及,根据该第三预测任务对应的预测结果特征向量,确定该第二预测任务对应的预测结果;
将该第一预测任务对应的预测结果、该第二预测任务对应的预测结果和该第三预测任务对应的预测结果作为该搜索文本和该目标对象之间的预测交互结果。
本公开实施例与现有技术相比存在的有益效果是:本公开实施例提供了一种交互结果的预测装置,该装置包括:信息获取单元,用于获取搜索文本和目标对象的标识、属性信息;第一确定单元,用于将该搜索文本和该目标对象的标识、属性信息输入该特征生成模块,得到原始特征向量;第二确定单元,用于将该原始特征向量输入该第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;第三确定单元,用于将该多个任务特征向量和该共享特征向量输入该第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;第四确定单元,用于将该多个第二任务特征向量输入该信息提取模块,得到多个任务结果特征向量;结果确定单元,用于将该多个任务结果特征向量输入该结果输出模块,得到该搜索文本和该目标对象之间的预测交互结果。在本实施例中,可以利用特征生成模块,得到该搜索文本和该目标对象的标识、属性信息的原始特征向量,建模了搜索文本和目标对象的特征,降低了搜索文本和该目标对象不匹配的概率;以及,可以从多个任务维度提取搜索文本和该目标对象的标识、属性信息的对应的特征向量,以及,可以基于多个任务维度的特征向量确定目标对象的交互结果;这样,便可以利用多个任务维度的特征向量来预估目标对象的交互结果,可以提高交互结果预测模型对于交互结果的评估的精准度,提升了对象推荐的准确度,保证了给用户所推荐的对象是用户真正想要的,进而可以提高推荐对象的转化率以及用户体验。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
图5是本公开实施例提供的计算机设备5的示意图。如图5所示,该实施例的计算机设备5包括:处理器501、存储器502以及存储在该存储器502中并且可以在处理器501上运行的计算机程序503。处理器501执行计算机程序503时实现上述各个方法实施例中的步骤。或者,处理器501执行计算机程序503时实现上述各装置实施例中各模块/模块的功能。
示例性地,计算机程序503可以被分割成一个或多个模块/模块,一个或多个模块/模块被存储在存储器502中,并由处理器501执行,以完成本公开。一个或多个模块/模块可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序503在计算机设备5中的执行过程。
计算机设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算机设备。计算机设备5可以包括但不仅限于处理器501和存储器502。本领域技术人员可以理解,图5仅仅是计算机设备5的示例,并不构成对计算机设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如,计算机设备还可以包括输入输出设备、网络接入设备、总线等。
处理器501可以是中央处理模块(Central Processing Unit,CPU),也可以是其它通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器502可以是计算机设备5的内部存储模块,例如,计算机设备5的硬盘或内存。存储器502也可以是计算机设备5的外部存储设备,例如,计算机设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,存储器502还可以既包括计算机设备5的内部存储模块也包括外部存储设备。存储器502用于存储计算机程序以及计算机设备所需的其它程序和数据。存储器502还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块、模块完成,即将装置的内部结构划分成不同的功能模块或模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块、模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中,上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。另外,各功能模块、模块的具体名称也只是为了便于相互区分,并不用于限制本公开的保护范围。上述系统中模块、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
在本公开所提供的实施例中,应该理解到,所揭露的装置/计算机设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/计算机设备实施例仅仅是示意性的,例如,模块或模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或模块的间接耦合或通讯连接,可以是电性,机械或其它的形式。
作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
集成的模块/模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。
Claims (10)
1.一种交互结果的预测方法,其特征在于,所述方法应用于交互结果预测模型,所述交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;所述方法包括:
获取搜索文本和目标对象的标识、属性信息;
将所述搜索文本和所述目标对象的标识、属性信息输入所述特征生成模块,得到原始特征向量;
将所述原始特征向量输入所述第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;
将所述多个任务特征向量和所述共享特征向量输入所述第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;
将所述多个第二任务特征向量输入所述信息提取模块,得到多个任务结果特征向量;
将所述多个任务结果特征向量输入所述结果输出模块,得到所述搜索文本和所述目标对象之间的预测交互结果。
2.根据权利要求1所述的方法,其特征在于,所述特征生成模块包括编码器、特征交叉层、归一化层和特征拼接层;所述将所述搜索文本和所述目标对象的标识、属性信息输入所述特征生成模块,得到原始特征向量,包括:
将所述搜索文本和所述目标对象的标识、属性信息分别输入所述编码器,得到所述搜索文本的特征向量、所述标识的特征向量和所述属性信息的特征向量;
将所述搜索文本的特征向量和所述标识的特征向量输入所述特征交叉层,得到交叉特征向量;
将所述属性信息的特征向量输入所述归一化层,得到所述属性信息的归一化特征向量;
将所述交叉特征向量和所述属性信息的归一化特征向量输入所述特征拼接层,得到原始特征向量。
3.根据权利要求1所述的方法,其特征在于,所述第一特征提取模块包括第一任务特征提取模块、第二任务特征提取模块、第三任务特征提取模块和共享特征提取模块;所述将所述原始特征向量输入所述第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量,包括:
将所述原始特征向量输入所述第一任务特征提取模块,得到第一预测任务对应的第一任务特征向量;
将所述原始特征向量输入所述第二任务特征提取模块,得到第二预测任务对应的第一任务特征向量;
将所述原始特征向量输入所述第三任务特征提取模块,得到第三预测任务对应的第一任务特征向量;
将所述原始特征向量输入所述共享特征提取模块,得到所述共享特征向量。
4.根据权利要求3所述的方法,其特征在于,所述第二特征提取模块包括:所述第一任务特征提取模块、所述第二任务特征提取模块和所述第三任务特征提取模块;所述将所述多个任务特征向量和所述共享特征向量输入所述第二特征提取模块,得到多个第二任务特征向量,包括:
将所述第一预测任务对应的第一任务特征向量和所述共享特征向量输入所述第一任务特征提取模块,得到所述第一预测任务对应的第二任务特征向量;
将所述第二预测任务对应的第一任务特征向量和所述共享特征向量输入所述第二任务特征提取模块,得到所述第二预测任务对应的第二任务特征向量;
将所述第三预测任务对应的第一任务特征向量和所述共享特征向量输入所述第三任务特征提取模块,得到所述第三预测任务对应的第二任务特征向量。
5.根据权利要求3或4所述的方法,其特征在于,所述第一任务特征提取模块、所述第二任务特征提取模块、所述第三任务特征提取模块和所述共享特征提取模块均包括门控网络和专家网络。
6.根据权利要求4所述的方法,其特征在于,所述信息提取模块包括第一任务信息提取模块、第二任务信息提取模块和第三任务信息提取模块,其中,所述第一任务信息提取模块、所述第二任务信息提取模块和所述第三任务信息提取模块均包括塔网络和注意力单元;所述将所述多个第二任务特征向量输入所述信息提取模块,得到多个任务结果特征向量,包括:
将所述第一预测任务对应的第二任务特征向量输入所述第一任务信息提取模块,得到所述第一预测任务对应的任务结果特征向量;
将所述第二预测任务对应的第二任务特征向量输入所述第二任务信息提取模块,得到所述第二预测任务对应的任务结果特征向量;
将所述第三预测任务对应的第二任务特征向量输入所述第三任务信息提取模块,得到所述第三预测任务对应的任务结果特征向量。
7.根据权利要求5所述的方法,其特征在于,所述结果输出模块包括第一融合模块和第二融合模块;所述将所述多个任务结果特征向量输入所述结果输出模块,得到所述搜索文本和所述目标对象之间的预测交互结果,包括:
根据所述第一预测任务对应的任务结果特征向量,确定第一预测任务对应的预测结果;
将所述第一预测任务对应的任务结果特征向量和所述第二预测任务对应的任务结果特征向量输入所述第一融合模块,得到第二预测任务对应的预测结果特征向量;以及,根据所述第二预测任务对应的预测结果特征向量,确定所述第二预测任务对应的预测结果;
将所述第三预测任务对应的任务结果特征向量和所述第二预测任务对应的预测结果特征向量输入第二融合模块,得到第三预测任务对应的预测结果特征向量;以及,根据所述第三预测任务对应的预测结果特征向量,确定所述第二预测任务对应的预测结果;
将所述第一预测任务对应的预测结果、所述第二预测任务对应的预测结果和所述第三预测任务对应的预测结果作为所述搜索文本和所述目标对象之间的预测交互结果。
8.一种交互结果的预测装置,其特征在于,所述装置应用于交互结果预测模型,所述交互结果预测模型包括特征生成模块、第一特征提取模块、第二特征提取模块、信息提取模块和结果输出模块;所述装置包括:
信息获取单元,用于获取搜索文本和目标对象的标识、属性信息;
第一确定单元,用于将所述搜索文本和所述目标对象的标识、属性信息输入所述特征生成模块,得到原始特征向量;
第二确定单元,用于将所述原始特征向量输入所述第一特征提取模块,得到多个第一任务特征向量和一个共享特征向量;其中,每个第一任务特征向量所对应的任务均不相同;
第三确定单元,用于将所述多个任务特征向量和所述共享特征向量输入所述第二特征提取模块,得到多个第二任务特征向量;其中,每个第二任务特征向量所对应的任务均不相同;
第四确定单元,用于将所述多个第二任务特征向量输入所述信息提取模块,得到多个任务结果特征向量;
结果确定单元,用于将所述多个任务结果特征向量输入所述结果输出模块,得到所述搜索文本和所述目标对象之间的预测交互结果。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并且可以在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311169025.XA CN116911913B (zh) | 2023-09-12 | 2023-09-12 | 一种交互结果的预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311169025.XA CN116911913B (zh) | 2023-09-12 | 2023-09-12 | 一种交互结果的预测方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116911913A true CN116911913A (zh) | 2023-10-20 |
CN116911913B CN116911913B (zh) | 2024-02-20 |
Family
ID=88367165
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311169025.XA Active CN116911913B (zh) | 2023-09-12 | 2023-09-12 | 一种交互结果的预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116911913B (zh) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090756A (zh) * | 2020-03-24 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的多目标推荐模型的训练方法及装置 |
CN114187894A (zh) * | 2021-12-10 | 2022-03-15 | 京东科技信息技术有限公司 | 一种意图识别方法、装置及其相关设备 |
CN115168720A (zh) * | 2022-07-14 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 内容交互预测方法以及相关设备 |
CN115935185A (zh) * | 2022-12-01 | 2023-04-07 | 北京龙智数科科技服务有限公司 | 一种推荐模型的训练方法及装置 |
CN116049411A (zh) * | 2023-03-31 | 2023-05-02 | 北京中关村科金技术有限公司 | 一种信息匹配方法、装置、设备和可读存储介质 |
CN116541610A (zh) * | 2023-07-06 | 2023-08-04 | 深圳须弥云图空间科技有限公司 | 一种推荐模型的训练方法及装置 |
CN116628349A (zh) * | 2023-07-25 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及程序产品 |
CN116680481A (zh) * | 2023-08-03 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 搜索排序方法、装置、设备、存储介质及计算机程序产品 |
-
2023
- 2023-09-12 CN CN202311169025.XA patent/CN116911913B/zh active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111090756A (zh) * | 2020-03-24 | 2020-05-01 | 腾讯科技(深圳)有限公司 | 基于人工智能的多目标推荐模型的训练方法及装置 |
CN114187894A (zh) * | 2021-12-10 | 2022-03-15 | 京东科技信息技术有限公司 | 一种意图识别方法、装置及其相关设备 |
CN115168720A (zh) * | 2022-07-14 | 2022-10-11 | 腾讯科技(深圳)有限公司 | 内容交互预测方法以及相关设备 |
CN115935185A (zh) * | 2022-12-01 | 2023-04-07 | 北京龙智数科科技服务有限公司 | 一种推荐模型的训练方法及装置 |
CN116049411A (zh) * | 2023-03-31 | 2023-05-02 | 北京中关村科金技术有限公司 | 一种信息匹配方法、装置、设备和可读存储介质 |
CN116541610A (zh) * | 2023-07-06 | 2023-08-04 | 深圳须弥云图空间科技有限公司 | 一种推荐模型的训练方法及装置 |
CN116628349A (zh) * | 2023-07-25 | 2023-08-22 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备、存储介质及程序产品 |
CN116680481A (zh) * | 2023-08-03 | 2023-09-01 | 腾讯科技(深圳)有限公司 | 搜索排序方法、装置、设备、存储介质及计算机程序产品 |
Also Published As
Publication number | Publication date |
---|---|
CN116911913B (zh) | 2024-02-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109492772B (zh) | 生成信息的方法和装置 | |
CN110008973B (zh) | 一种模型训练方法、基于模型确定目标用户的方法及装置 | |
EP4242955A1 (en) | User profile-based object recommendation method and device | |
CN116541610B (zh) | 一种推荐模型的训练方法及装置 | |
CN109087138A (zh) | 数据处理方法及系统、计算机系统和可读存储介质 | |
CN113643103A (zh) | 基于用户相似度的产品推荐方法、装置、设备及存储介质 | |
CN110399479A (zh) | 搜索数据处理方法、装置、电子设备及计算机可读介质 | |
CN113393306A (zh) | 产品推荐方法、装置、电子设备及计算机可读介质 | |
CN115935185A (zh) | 一种推荐模型的训练方法及装置 | |
CN110866625A (zh) | 促销指标信息生成方法和装置 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN116911953B (zh) | 物品推荐方法、装置、电子设备及计算机可读存储介质 | |
US20220198487A1 (en) | Method and device for processing user interaction information | |
CN116911913B (zh) | 一种交互结果的预测方法及装置 | |
CN114429384B (zh) | 基于电商平台的产品智能推荐方法及系统 | |
CN115983907A (zh) | 一种数据推荐方法、装置、电子设备及计算机可读介质 | |
CN115619142A (zh) | 匹配数据的方法、装置、设备和计算机可读介质 | |
CN111325614B (zh) | 电子对象的推荐方法、装置和电子设备 | |
CN116911912B (zh) | 一种交互对象和交互结果的预测方法及装置 | |
CN116911304B (zh) | 一种文本推荐方法及装置 | |
CN111105274A (zh) | 数据处理方法、装置、介质及电子设备 | |
CN116340638A (zh) | 一种交互结果的确定方法及装置 | |
CN111626805B (zh) | 信息展示方法和装置 | |
CN108846743B (zh) | 用于生成信息的方法和装置 | |
CN116383638A (zh) | 一种推荐模型的训练方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |