CN114139041B - 类目相关性预测网络训练及类目相关性预测方法及装置 - Google Patents

类目相关性预测网络训练及类目相关性预测方法及装置 Download PDF

Info

Publication number
CN114139041B
CN114139041B CN202210107592.1A CN202210107592A CN114139041B CN 114139041 B CN114139041 B CN 114139041B CN 202210107592 A CN202210107592 A CN 202210107592A CN 114139041 B CN114139041 B CN 114139041B
Authority
CN
China
Prior art keywords
category
search
text
search text
training
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210107592.1A
Other languages
English (en)
Other versions
CN114139041A (zh
Inventor
董正心
苑爱泉
桑梓森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Rajax Network Technology Co Ltd
Zhejiang Koubei Network Technology Co Ltd
Original Assignee
Rajax Network Technology Co Ltd
Zhejiang Koubei Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rajax Network Technology Co Ltd, Zhejiang Koubei Network Technology Co Ltd filed Critical Rajax Network Technology Co Ltd
Priority to CN202210107592.1A priority Critical patent/CN114139041B/zh
Publication of CN114139041A publication Critical patent/CN114139041A/zh
Application granted granted Critical
Publication of CN114139041B publication Critical patent/CN114139041B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9532Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种类目相关性预测网络训练及类目相关性预测方法、装置及设备。所述类目相关性预测网络训练方法包括:基于搜索文本及其对应的对象类目文本生成训练样本,在每轮训练中:将训练样本的搜索文本特征与用户行为不确定性特征融合,得到训练样本的搜索侧融合特征;将训练样本的对象类目特征与用户行为倾向性特征融合,得到训练样本的对象侧融合特征;根据搜索侧融合特征与对象侧融合特征之间的距离,确定搜索文本与当前计算对象所属的类目之间的相关程度数据。所述类目相关性预测方法使用所述类目相关性预测网络预测对象所属类目与搜索文本的相关性。采用所述方法,解决了难以准确预测搜索文本与对象所属类目之间的相关程度数据的问题。

Description

类目相关性预测网络训练及类目相关性预测方法及装置
技术领域
本申请涉及搜索技术领域,具体涉及一种类目相关性预测网络训练方法、装置及设备。本申请同时涉及一种类目相关性预测方法、装置及设备。
背景技术
目前,通过网络搜索信息是人们获取信息的重要途径。搜索结果与用户输入的搜索文本之间的相关性,是影响用户搜索体验重要环节,其决定了对象的召回及排序,影响用户获取信息的准确度。在搜索结果与搜索文本的相关性体系中,搜索文本与对象所属类目之间的类目相关性尤其重要。例如,在实际应用中,若针对搜索美食类的搜索词得到其他生活服务类的结果,或针对搜索生活服务类的搜索词得到美食类的结果,都会非常影响用户的体验。
实际上,一些行业类目体系呈多层级树状结构,同一对象也可以挂载多种类目,使得很难准确确定用户输入的搜索文本与对象所属类目的相关程度。对于这些行业,现有技术主要通过以下方式确定类目相关程度:一是根据实体匹配计算实体与类目的匹配评分,得到搜索侧的搜索文本和召回侧的类目相关性。但是需要依赖实体识别覆盖程度以及序列标注的准确率。二是根据用户历史的点击及购买行为构建搜索文本与类目映射关系,但是只能覆盖中高频搜索词。
因此,如何较为准确的预测搜索文本与对象所属类目之间的相关程度数据,是需要解决的问题。
发明内容
本申请实施例提供的类目相关性预测网络训练方法、类目相关性预测方法,解决了难以准确预测搜索文本与对象所属类目之间的相关程度数据的问题。
本申请实施例提供一种类目相关性预测网络训练方法,包括:基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;使用所述训练样本训练所述类目相关性预测网络,在每轮训练中执行下述步骤:
将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征;将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征;根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
可选的,所述类目相关性预测网络包括深度语义模型;所述方法,还包括:基于所述搜索文本获得所述训练样本的第一搜索特征;将所述第一搜索特征输入所述深度语义模型,得到包含搜索文本语义信息的第二搜索特征,将所述第二搜索特征作为所述训练样本的搜索文本特征;基于所述对象类目文本获得所述训练样本的第一对象类目特征;将所述第一对象类目特征输入所述深度语义模型,得到包含对象类目语义信息的第二对象类目特征,将所述第二对象类目特征作为所述训练样本的对象类目特征。
可选的,还包括:获得所述搜索文本对应的针对当前计算对象所属的类目的下述至少一种第一行为统计特征度量数据:曝光分布熵、点击分布熵、收藏信息熵、购买分布熵;所述第一行为统计特征度量数据用于表征针对所述搜索文本的所述用户行为不确定性特征;所述将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征,包括:将所述搜索文本特征与所述至少一种第一行为统计特征度量数据进行向量拼接,得到所述训练样本的搜索侧融合特征。
可选的,还包括:根据所述搜索文本对应的类目集合中每一类目的点击概率,确定所述搜索文本对应的当前计算对象所属的类目的点击分布熵。
可选的,还包括:获得所述当前计算对象所属的类目的下述至少一种第二行为统计特征度量数据:点击率和/或转化率;所述第二行为统计特征度量数据用于表征所述类目的用户行为倾向性特征;所述将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征,包括:将所述对象类目特征与所述至少一种第二行为统计特征度量数据进行向量拼接,得到所述训练样本的对象侧融合特征。
可选的,还包括:针对所述当前计算对象所属的每一类目级别的每一类目,根据该类目下的用户点击量以及用户展现量确定所述当前计算对象在该类目下的点击率;和/或,根据该类目下的用户购买量以及用户点击量确定所述当前计算对象在该类目下的转化率。
可选的,所述根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据,包括:将所述搜索侧融合特征与所述对象侧融合特征,分别输入预设层数的全连接层;根据所述搜索侧融合特征与所述对象侧融合特征各自经过所述全连接层处理后得到的映射特征计算余弦相似度,得到所述搜索文本与所述当前计算对象所属的类目的相关性评分,作为所述相关程度数据。
可选的,所述基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本,包括:获取搜索日志;从所述搜索日志中提取搜索文本、针对所述搜索文本的搜索结果项包含的对象类目文本、以及用户针对所述搜索结果项的用户行为信息,生成可作为所述训练样本的正样本;其中,所述正样本形成用于训练所述类目相关性预测网络的第一训练样本集。
可选的,还包括:从所述第一训练样本集中选择搜索文本,使用选择的搜索文本替换正样本包含的搜索文本,生成可作为所述训练样本的第一负样本;和/或,从所述第一训练样本集中选择类目文本,使用选择的类目文本替换正样本包含的对象所属类目的类目文本,生成可作为所述训练样本的第二负样本;和/或,从所述第一训练样本集中选择对象标识,使用选择的对象标识替换正样本包含的对象标识,生成可作为所述训练样本的第三负样本;其中,所述第一负样本、所述第二负样本、所述第三负样本中至少之一形成用于训练所述类目相关性预测网络的第二训练样本集。
可选的,还包括:将搜索范围内的对象全集划分为预设数量桶;根据随机生成的编号匹配所述预设数量桶中的其一桶;从匹配到的桶内随机抽取对象;获取随机抽取到的对象对应的搜索文本,使用所述搜索文本替换所述第一训练集的正样本的搜索文本,得到第一负样本;和/或,获取随机抽取到的对象所属类目的类目文本,使用所述类目文本对应替换所述第一训练集的正样本的类目文本,生成所述第二负样本;和/或,获取随机抽取到的对象的对象标识,使用所述随机抽取到的对象的对象标识对应替换所述第一训练集的正样本的对象标识,生成所述第三负样本。
本申请实施例还提供一种类目相关性预测方法,包括:获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;其中,所述类目相关性预测网络为本申请实施例提供的所述的类目相关性预测网络。
可选的,所述将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据,包括:获得所述搜索文本对应的针对所述当前计算对象所属类目的用户行为不确定性特征,将所述搜索文本的搜索文本特征与所述用户行为不确定性特征融合,得到所述搜索文本的搜索侧融合特征;获得所述当前计算对象所属的类目对应的用户行为倾向性特征,将所述对象的对象类目特征与所述用户行为倾向性特征融合,得到所述当前计算对象的对象侧融合特征;根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述搜索文本与所述当前计算对象所属的类目之间的相关程度数据。
可选的,还包括:确定所述相关程度数据大于预设相关性阈值的目标对象类目文本,将所述目标对象类目文本作为针对所述搜索文本推荐的搜索结果;和/或,根据所述相关程度数据,调整所述当前计算对象在所述搜索文本对应的搜索结果中的排序。
本申请实施例还提供一种类目相关性预测网络训练装置,包括:样本单元,用于基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;训练单元,用于使用所述训练样本训练所述类目相关性预测网络;所述训练单元包括:搜索特征融合子单元,用于将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征;对象类目特征融合子单元,用于将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征;相关程度计算子单元,用于根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
本申请实施例还提供一种类目相关性预测装置,包括:数据获取单元,用于获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;相关程度预测单元,将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;其中,所述类目相关性预测网络为本申请实施例提供的所述的类目相关性预测网络。
本申请实施例还提供一种电子设备,包括:存储器,以及处理器;所述存储器用于存储计算机程序,所述计算机程序被所述处理器运行后,执行本申请实施例提供的所述方法。
本申请实施例还提供一种存储设备,存储有计算机程序,所述计算机程序被处理器运行后,执行本申请实施例提供的所述方法。
与现有技术相比,本申请具有以下优点:
本申请实施例提供的一种类目相关性预测网络训练方法、装置及设备,通过基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;使用训练样本训练类目相关性预测网络,在每轮训练中执行下述步骤:将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征;将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征;根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。由于类目相关性预测网络将搜索文本特征与用户行为不确定性特征融合,将对象类目特征与用户行为倾向性特征融合,针对搜索文本和对象所属类目计算类目相关性,从而不依赖序列标注,不需要对各层级进行相关性匹配,建立起了搜索文本与对象之间直接计算类目相关性的端到端模型,提高了类目相关性计算的准确度,解决了难以准确预测搜索文本与对象所属类目之间的相关程度数据的问题。
本申请实施例提供的一种类目相关性预测方法、装置及设备,通过获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;其中,所述类目相关性预测网络为本申请实施例提供的所述类目相关性预测网络。由于类目相关性预测网络为搜索文本与对象之间直接计算类目相关性的端到端模型,并且融合了历史的用户行为不确定性特征以及用户行为倾向性特征,能够更准确的计算搜索文本与对象所属类目之间的相关程度数据。
附图说明
图1是本申请第一实施例提供的类目相关性预测网络训练方法的处理流程图。
图2是本申请第一实施例提供的类目相关性预测网络的网络结构示意图。
图3本申请第一实施例提供的类目相关性预测网络的数据处理流程示意图。
图4是本申请第二实施例提供的类目相关性预测方法的处理流程图。
图5是本申请第三实施例提供的类目相关性预测网络训练装置示意图。
图6是本申请第四实施例提供的类目相关性预测装置示意图。
图7是本申请提供的电子设备示意图。
具体实施方式
在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
本申请实施例提供一种类目相关性预测网络训练方法、装置、电子设备及存储设备。本申请实施例还提供一种类目相关性预测方法、装置、电子设备及存储设备。在下面的实施例中逐一进行说明。
为便于理解,首先给出本申请实施例提供的类目相关性预测网络训练方法中的概念。所谓相关性,是指搜索文本与系统返回的搜索结果之间的匹配程度。相关性越高,则搜索结果与搜索文本的预期符合程度越高,相关性越低,则搜索结果与搜索文本的预期符合程度越低。而类目相关性是所述相关性的一种重要数据。所谓类目相关性,是指搜索文本的类目意图与系统返回的搜索结果中的对象所属类目的匹配程度。所谓搜索文本,可以为用户输入的搜索词。所谓对象,是指系统根据接收到的搜索文本搜索到的相关实体,例如,对象可以是店铺,而对象所属类目是指对象挂载的类目。对象所属类目可以包含多层级的类目,并且同一对象也可以属于多种类目。例如,如店铺A蛋糕店可同时挂载在美食/用餐时段/下午茶、美食/面包甜点/面包蛋糕、美食/热卖品类/蛋糕等多种类目。实际应用中,在针对用户输入的搜索词返回展现给用户的搜索结果项的处理中,可以先根据搜索词确定一定范围的对象,再计算搜索词与每个对象所属类目之间的相关性评分,进一步可将其用于确定搜索词与每个对象之间的相关性评分,从而可以将满足预设相关性评分阈值的对象的信息作为搜索结果项展现给用户。
本申请实施例提供的类目相关性预测网络是用于针对搜索文本和对象直接计算搜索文本与对象所属类目之间的相关程度数据的端到端的类目相关性预测模型。所述类目相关性预测网络的训练中,除了训练样本的搜索文本特征及对象类目特征之外,还引入了用户历史行为特征:用户行为不确定性特征及用户行为倾向性特征,增加了类目相关性预测网络的学习维度,学习搜索文本在各类目下的倾向程度以及区分程度,其中,用户行为不确定性特征体现了区分程度。从而提高了类目相关性计算的准确度。
以下结合图1至图3对本申请第一实施例提供的类目相关性预测网络训练方法进行说明。图1所示的类目相关性预测网络训练方法,包括:步骤S101至步骤S104。
步骤S101,基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本。
本申请实施例提供的所述类目相关性预测网络,其网络结构中引入了深度语义模型,通过深度语义模型处理搜索文本,可以充分利用上下文信息得到搜索文本的深度语义特征,通过深度语义模型处理对象类目文本,获得对象类目文本的包含深度语义信息的特征。
请参考图2,图中示出了类目相关性预测网络的网络结构,包括:深度语义模型201、融合用户行为不确定性特征202、融合用户行为倾向性特征203、全连接层204、计算余弦相似度205。所述深度语义模型,具体可以为BERT语义模型,其可以是训练过的BERT语义模型。将用户输入的搜索词,即搜索侧(query侧)的搜索文本,输入深度语义模型,得到包含深度语义信息的搜索文本特征。具体处理可以包括对搜索文本,如图中,对“火锅”进行简单编码得到稀疏向量E[火锅],输入BERT语义模型,得到降维的稠密向量T[火锅]。将对象类目文本,即对象侧(系统获得的搜索内容侧)的对象信息及对象所属类目信息,例如店铺名称、一级/二级/三级类目、商品标题,如图中:“潮汕…”、“美食…火锅”、“牛肉…”进行简单编码对应得到稀疏向量E[潮汕]、…、E[美食]、…E[火锅]、E[牛肉]…,等;将这些稀疏向量输入bert模型,得到降维的稠密向量T[潮汕]、…、TE[美食]、…T [火锅]、T [牛肉]…等。实施时,图中所示分别处理搜索文本及对象类目文本的BERT语义模型为同一网络模型,BERT语义模型的网络参数是一套共享参数,而搜索文本及对象类目文本输入的顺序不同,也就是搜索文本与对象类目文本在同一BERT网络的不同时刻进行语义特征提取。也就是说,搜索侧和对象侧各自的文本经过同一深度语义模型处理后得到各自包含语义信息的编码特征,编码特征具体为编码后稠密向量。通过深度语义特征模型可以充分利用上下文信息,得到较强的语义表达能力,从而不依赖于对对象实体的识别能力,也不需要进行序列标注,可以提高对象召回的准确率。融合用户行为不确定性特征202将经过BERT语义模型处理得到的搜索文本特征与用户行为不确定性特征进行融合,用户行为不确定性特征具体为搜索文本(query)在各级类目下的曝光信息熵、点击信息熵、收藏信息熵、购买信息熵中的至少一种信息熵。融合用户行为倾向性特征203将经过BERT语义模型处理得到的对象类目特征与用户行为倾向性特征融合。用户行为倾向性特征为各级类目在搜索文本(query)下的点击率(ctr)和/或转化率(cvr)。融合后的搜索文本特征以及融合后的对象类目特征分别经过全连接层处理,各自得到的向量,由计算余弦相似度205计算余弦距离,得到相关性得分(相关性评分),即为搜索文本与对象类目文本之间的相关程度数据。用户行为不确定性以及用户行为倾向性特征为历史行为统计特征,是针对搜索日志进行数据分析得到的用户曝光/点击/购买/收藏行为的量化特征。
本步骤是为所述类目相关性预测网络生成训练样本。一条训练样本数据至少包括搜索文本及对象类目文本。所谓对象类目文本,包括对象的信息以及对象所属类目的信息,对象的信息可以为对象标识,如对象名称;对象所属类目包括对象所属的多层级类目。例如:训练样本中的搜索文本:蛋糕,对应的对象类目文本为:A蛋糕店(美食/面包甜点/面包蛋糕)。可以理解的是,本实施例和本申请其他实施例中,对象类目文本中的对象的信息及其所属的多层级类目的信息之间可以有预设连接符,也可以为直接拼在一起得到的文本,示例中的括号及“/”仅为清楚描述各部分,而并非对其文本结构进行限定。其中,A蛋糕店为店铺名称,即对象名称;美食/面包甜点/面包蛋糕为该店铺挂载的多层级类目。美食为一级类目,面包甜点为二级类目,面包蛋糕为三级类目。实施时,可以根据真实搜索数据提取出训练样本。具体的,从搜索日志中提取真实搜索数据,生成正样本。
进一步,基于正样本构造一些与真实搜索数据不符合的负样本。正样本和负样本均作为类目相关预测网络的训练样本集中的训练样本。通过负样本可以增强类目相关性预测网络的学习及判断能力。其中,所述基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本,包括:获取搜索日志;从所述搜索日志中提取搜索文本、针对所述搜索文本的搜索结果项包含的对象类目文本、以及用户针对所述搜索结果项的用户行为信息,生成可作为所述训练样本的正样本;其中,所述正样本形成用于训练所述类目相关性预测网络的第一训练样本集。进一步,可以通过负采样方法生成负样本,如对正样本的词进行替换。具体包括:从所述第一训练样本集中选择搜索文本,使用选择的搜索文本替换正样本包含的搜索文本,生成可作为所述训练样本的第一负样本;和/或,从所述第一训练样本集中选择类目文本,使用选择的类目文本替换正样本包含的对象所属类目的类目文本,生成可作为所述训练样本的第二负样本;和/或,从所述第一训练样本集中选择对象标识,使用选择的对象标识替换正样本包含的对象标识,生成可作为所述训练样本的第三负样本;其中,所述第一负样本、所述第二负样本、所述第三负样本中至少之一形成用于训练所述类目相关性预测网络的第二训练样本集。可以从第一训练样本集及第二训练样本集中抽取训练样本训练类目相关性预测网络。并且,第一训练样本集和/或第二训练样本集可以根据周期性采集搜索日志进行周期性更新。通过多种构建负样本的方式可以增强模型的学习能力,提高模型的泛化能力,防止过拟合。
例如,生成的正样本1搜索文本为:蛋糕,对应的对象类目文本为:A蛋糕店(美食/面包甜点/面包蛋糕)。随机在搜索日志中负采样搜索文本,如得到“火锅”,使用该词替换“蛋糕”,得到一个第一负样本。则该负样本的搜索文本为:火锅,对应的对象类目文本为:A蛋糕店(美食/面包甜点/面包蛋糕)。
其中,生成第二负样本的处理中,可以对正样本进行类目负采样,具体的:从指定正样本的对象所属各级类目下的其他叶子类目中随机选择类目,将指定正样本中的类目文本替换为随机选择的类目文本。沿用上述生成的正样本1的例子,使用随机选择的类目替换其类目文本“美食/面包甜点/面包蛋糕”,得到的一个第二负样本,该第二负样本的搜索文本为:蛋糕,对象类目文本为:A蛋糕店(丽人/健身中心/足浴足疗)。
其中,生成第三负样本的处理中,可以是对对象名称负采样,即在所有正样本的对象名称全集中随机选择对象名称,替换每个正样本的对象名称。沿用正样本1,使用随机选择的店铺名称替换A蛋糕店,得到一个第三负样本,该第三负样本的搜索文本为:蛋糕,对象类目文本为:B美发店(美食/面包甜点/面包蛋糕)。
实施时,由于搜索日志中的搜索数量和对象(店铺)数量庞大,可以采用分桶策略以便实现随机抽取及替换。具体包括下述处理:将搜索范围内的对象全集划分为预设数量桶;根据随机生成的编号匹配所述预设数量桶中的其一桶;从匹配到的桶内随机抽取对象;获取随机抽取到的对象对应的搜索文本,使用所述搜索文本替换所述第一训练集的正样本的搜索文本,得到第一负样本;和/或,获取随机抽取到的对象所属类目的类目文本,使用所述类目文本对应替换所述第一训练集的正样本的类目文本,生成所述第二负样本;和/或,获取随机抽取到的对象的对象标识,使用所述随机抽取到的对象的对象标识对应替换所述第一训练集的正样本的对象标识,生成所述第三负样本。例如,将全部店铺分为1000个桶并编号,随机生成一个编号进行匹配确定一个桶,然后再在桶内随机抽取一个店铺名称用来替换生成第三负样本。
本实施例中,所述搜索文本包括用户输入的搜索文本自身的文本信息,如正样本1,搜索文本特征包含搜索词“蛋糕”。所述对象类目文本包含下述至少一种信息:对象标识如对象名称、对象所属类目及各类目的层级关系、对象关联的商品或服务信息。例如某训练样本中,对象类目特征包含的对象标识为:A蛋糕店;对象所属类目及各类目的层级关系中的一级类目文本、二级类目文本、三级类目文本分别为:美食、面包甜点、面包蛋糕;对象关联的商品为:浓醇提拉米苏蛋糕。从而使得类目相关性预测网络的输入信息在语序中保留类目的层级信息,将全部类目信息考虑在内,从而避免各层级匹配之间的依赖性,能提高对象召回的覆盖率。
根据第一训练集和/或第二训练集对所述类目相关性预测网络进行训练,在每轮训练中执行步骤S102至步骤S104。以下对步骤S102至步骤S104进行说明。
步骤S102,将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征。
本实施例中,所述训练样本的搜索文本特征可以指搜索文本本身的编码特征,也可以是基于训练样本的搜索文本通过深度语义模型获得的包含语义信息的文本特征。具体可以包括下述处理:基于所述搜索文本获得所述训练样本的第一搜索特征;将所述第一搜索特征输入所述深度语义模型,得到包含搜索文本语义信息的第二搜索特征,将所述第二搜索特征作为所述训练样本的搜索文本特征。
本实施例中,可以根据历史行为统计特征从多个方面刻画所述用户行为不确定性特征。例如,基于针对搜索文本的曝光分布熵、点击分布熵、收藏信息熵、购买分布熵中至少一种信息熵,得到所述用户行为不确定性特征。所谓熵,是对消息的信息含量的一种量度,能表征可能出现的程度,即对不确定性的度量。信息熵可以理解为接收的每条消息中包含的信息的平均量。其中,所谓消息,可以指来自分布或数据流中的事件、样本或特征。以生活服务类平台的搜索场景为例。生活服务类平台主要连接消费者用户和生活服务行业,向用户提供生活服务行业各具体服务提供方的信息及服务提供方提供的生活服务信息。服务提供方可以理解为店铺,生活服务可以理解为店铺提供的商品或服务,店铺可挂载于平台的多种类目下,每种类目有可以包含多层级类目。当用户通过生活服务类平台的搜索功能输入搜索文本,生活服务类平台根据搜索文本的类目意图搜索相关店铺,搜索到的店铺所属类目(即所挂载类目)与搜索文本的意图的相关程度即类目相关程度越高,则用户体验越好。某一搜索文本对应的点击分布熵可以理解为该搜索文本下用户倾向于点击的店铺所属类目的不确定程度,其不确定程度越高,熵值越大。曝光分布熵、收藏信息熵、购买分布熵与点击分布熵同理。其中,可以根据所述搜索文本对应的类目集合中每一类目的点击概率,确定所述搜索文本对应的当前计算对象所属的类目的点击分布熵。具体可以由如下公式定量计算点击分布熵:
Figure 775904DEST_PATH_IMAGE001
Figure 505963DEST_PATH_IMAGE002
其中,X为当前计算的训练样本的搜索文本对应的多个类目集合;N为点击总次数;Nx为当前计算的该搜索文本下类目x被点击的次数;p(x)为类目x对应的被点击概率,即当前计算的该搜索文本下类目x被点击的次数Nx与点击总次数N的比值;
Figure 456732DEST_PATH_IMAGE003
为点击分布熵值。
本实施例中,具体包括:获得所述搜索文本对应的针对当前计算对象所属的类目的下述至少一种第一行为统计特征度量数据:曝光分布熵、点击分布熵、收藏信息熵、购买分布熵;所述第一行为统计特征度量数据用于表征针对所述搜索文本的所述用户行为不确定性特征;相应的,所述将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征,包括:将所述搜索文本特征与所述至少一种第一行为统计特征度量数据进行向量拼接,得到所述训练样本的搜索侧融合特征。例如,搜索文本输入深度语义模型后得到的编码向量,与曝光分布熵、点击分布熵、购买分布熵、收藏信息熵至少之一形成的向量进行拼接,组成的特征向量作为所述搜索侧融合特征。
步骤S103,将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征。
本实施例中,所述训练样本的对象类目特征可以指对象类目文本本身的编码特征,也可以是基于训练样本的对象类目文本通过深度语义模型获得的包含语义信息的对象类目特征。实施时具体还可以包括下述处理:基于所述对象类目文本获得所述训练样本的第一对象类目特征;将所述第一对象类目特征输入所述深度语义模型,得到包含对象类目语义信息的第二对象类目特征,将所述第二对象类目特征作为所述训练样本的对象类目特征。
本实施例中,可以根据历史行为统计特征从多个方面刻画所述用户行为倾向性特征。例如,基于针对与搜索文本对应的对象类目中的各个类目的点击率和/或转化率得到所述用户行为倾向性特征的数据化表达。具体包括下述处理:获得所述当前计算对象所属的类目的下述至少一种第二行为统计特征度量数据:点击率和/或转化率;所述第二行为统计特征度量数据用于表征所述类目的用户行为倾向性特征;相应的,所述将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征,包括:将所述对象类目特征与所述至少一种第二行为统计特征度量数据进行向量拼接,得到所述训练样本的对象侧融合特征。其中,可根据用户点击量以及用户展现量计算点击率及转化率。具体包括:针对所述当前计算对象所属的每一类目级别的每一类目,根据该类目下的用户点击量以及用户展现量确定所述当前计算对象在该类目下的点击率;和/或,根据该类目下的用户购买量以及用户点击量确定所述当前计算对象在该类目下的转化率。针对每一层级的每个类目的统计样本数量计算得到的点击率、转化率,可以理解为各类目被点击、转化的倾向程度,从而可以使得类目除了在文本上有区分之外,在行为特征上也有所区分。沿用生活服务类平台的搜索场景的例子。各层级类目下的点击率、转化率以用户展现量(UserView, UV)为单位进行统计计算。假设包括一级类目、二级类目、三级类目在内的全部类目集合为X,则其中任取一个类目x,其点击率及转化率可以采用如下公式计算:
类目下点击率 = 类目x下的UV点击量/类目x下的UV展现量,
类目下转化率 = 类目x下的UV购买量/类目x下的UV点击量。
其中,将所述对象类目特征与所述至少一种第二行为统计特征度量数据进行向量拼接,得到所述训练样本的对象侧融合特征,具体包括:对象类目文本输入深度语义模型后得到的编码向量,与当前计算对象的所属类目的各层级类目下的点击率及转化率至少之一形成的向量进行拼接,组成的特征向量作为所述对象侧融合特征。
通过步骤S102及步骤S103,将历史行为统计特征融入文本特征,即:在基于搜索文本得到的包含语义信息的向量后拼接与搜索文本对应的用户不确定性特征如曝光分布熵、点击分布熵、收藏信息熵、购买分布熵,组成搜索侧融合特征;在基于对象类目文本得到的包含语义信息的向量后拼接当前对象所属各层级类目下的用户倾向性特征如点击率、转化率,组成对象侧融合特征,从而实现了历史行为统计特征与文本特征的拼接融合。因而,对于行为不足的低频搜索文本可以实现更关注其文本语义而避免仅覆盖高频搜索文本的类目相关性问题。并且,历史行为统计特征的引入反映了用户行为的丰富程度,将同一搜索文本下在类目倾向上的不确定性以及各类目被点击/转化的倾向程度,分别与各自对应的文本特征相融合,实现了在计算类目相关性过程中引入用户行为的同时又不仅仅局限于用户行为,更贴合真实搜索场景的特征,使得由训练得到的类目相关性预测网络计算出的类目相关程度数据更加准确。
实际实施时,用户行为不确定性特征以及用户行为倾向性特征可以为预先计算好的离线数据表,训练过程中根据搜索样本查询离线数据表得到用户行为不确定性特征数据,根据搜索样本、当前计算的对象和/或该对象挂载的各层级类目(即该对象所属的各层级类目)查询离线数据表得到该搜索文本下各层级类目对应的用户行为倾向性特征数据。
步骤S104,根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
本实施例中,可以将所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的余弦距离值,作为所述相关程度数据。其中,所述根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据,包括:将所述搜索侧融合特征与所述对象侧融合特征,分别输入预设层数的全连接层;根据所述搜索侧融合特征与所述对象侧融合特征各自经过所述全连接层处理后得到的映射特征计算余弦相似度,得到所述搜索文本与所述当前计算对象所属的类目的相关性评分,作为所述相关程度数据。优选的,所述全连接层的预设层数为1。即,将步骤S102及步骤S103各自拼接后组成的向量分别经过一层全连接层处理后计算余弦相似度,从而得到搜索文本与对象所属类目的端到端的类目相关性评分。例如,以A和B两个向量分别表示搜索侧融合特征以及对象类目融合特征,则A和B的余弦相似度的计算公式如下:
Figure 981255DEST_PATH_IMAGE004
请参考图3,图3示出了一种类目相关性预测网络的数据处理流程示意图,包括:S301-S303为对于搜索侧搜索文本的特征提取及与用户行为不确定性特征的向量拼接处理;S304-S306为针对对应搜索文本的对象侧的对象类目文本的特征提取及与用户行为倾向性特征的向量拼接处理。向量拼接后各自得到的拼接向量输入全连接层,在S307中,对上述步骤经全连接处理后各自得到的特征计算余弦相似度,得到搜索文本与对象挂载类目(即对象所属类目)的相关性得分,作为搜索文本与对象所属类目之间的相关程度数据。其中,S301,将搜索文本或搜索文本的简单编码输入bert语义模型。S302,由bert语义模型得到query编码,即搜索侧包含语义信息的搜索文本特征。S303,输入曝光分布熵、点击分布熵、购买分布熵至少一种表征用户行为不确定性特征的数据,与S302得到的搜索文本特征进行拼接,拼接后向量输入全连接层。S304,将对象类目文本或其简单编码输入bert语义模型;图中示例的对象类目文本由以下各文本构成:店铺名称、商品标题、一级类目、二级类目、三级类目等各层级类目。S305,由bert语义模型得到doc编码,即对象侧包含语义信息的对象类目特征。S306,输入类目下点击率及类目下转化率中至少一种表征用户行为倾向性特征的数据,与S305得到的对象类目特征进行拼接,拼接后向量输入全连接层。
本实施例中,类目相关性预测网络训练后可用于针对用户输入的搜索文本预测该搜索文本与对象所属类目相关程度,预测得到的相关程度数据可作为一致性校验的依据,用于确定搜索结果中的对象是否可以达到展现给用户的标准。具体包括:根据所述相关程度数据确定平台召回的对象的排序优先级,平台召回的对象,是指平台根据用户输入的搜索文本初始查询得到的对象。一个方式中,从初始查询得到的对象中删除相关程度数据低于预设相关性阈值的对象,也就是删除类目不相关或相关程度较低的误召回对象。一个方式中,可以根据预测得到的相关程度数据调整对象或对象所属类目的相关性权重,从而通过对所述相关性权重的提升或者降低调整对象或对象所属类目的排序优先级。当用于预测所述相关程度数据的类目相关性预测网络的输出越准确,针对用户输入的搜索文本推荐展示给用户的对象及其所属类目越符合用户的搜索意图,从而提升用户体验以及用户获取信息的准确度。
本实施例中,利用上述训练的类目相关性预测网络预测类目相关性的处理中,具体包括:获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据。优选的,所述将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据,包括:获得所述搜索文本对应的针对所述当前计算对象所属类目的用户行为不确定性特征,将所述搜索文本的搜索文本特征与所述用户行为不确定性特征融合,得到所述搜索文本的搜索侧融合特征;获得所述当前计算对象所属的类目对应的用户行为倾向性特征,将所述对象的对象类目特征与所述用户行为倾向性特征融合,得到所述当前计算对象的对象侧融合特征;根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述搜索文本与所述当前计算对象所属的类目之间的相关程度数据。当然,由于训练的类目相关性预测网络中已经学习了用户历史行为特征,包括用户行为不确定性特征以及用户行为倾向性特征,因此,使用训练的类目相关性预测网络对用户真实输入的搜索文本进行类目相关性预测时即使不输入用户历史行为特征,也能得到较为准确的相关程度数据预测值。进一步,确定所述相关程度数据大于预设相关性阈值的目标对象类目文本,将所述目标对象类目文本作为针对所述搜索文本推荐的搜索结果;和/或,根据所述相关程度数据,调整所述当前计算对象在所述搜索文本对应的搜索结果中的排序,从而较为准确的确定平台初始查询召回的对象是否达到可以展现的标准。
本实施例提供的类目相关性预测网络为,针对用户输入的搜索文本以及基于所述搜索文本获得的对象类目文本,直接计算搜索文本与对象所属类目的相关程度数据的端到端的预测模型。进一步,在该预测模型中引入了深度语义模型BERT模型,利用上下文的语义信息。进一步,在对象类目文本中包含对象所属各层级类目,并在语序上保留了类目的层级顺序。再者,引入了用户行为统计特征。从而,提升了根据搜索文本召回对象的覆盖率以及准确度。
需要说明的是,在不冲突的情况下,在本实施例和本申请的其他实施例中给出的特征可以相互组合,并且步骤S101和S102或类似用语不限定步骤必须先后执行。
至此,对本实施例提供的方法进行了说明,所述方法通过在类目相关性预测网络训练中,将训练样本的搜索文本特征与用户行为不确定性特征融合,得到训练样本的搜索侧融合特征;将训练样本的对象类目特征与用户行为倾向性特征融合,得到训练样本的对象侧融合特征;根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。由于类目相关性预测网络将搜索文本特征与用户行为不确定性特征融合,将对象类目特征与用户行为倾向性特征融合,针对搜索文本和对象所属类目计算类目相关性,从而不依赖序列标注,不需要对各层级进行相关性匹配,建立起了搜索文本与对象之间直接计算类目相关性的端到端模型,解决了难以准确预测搜索文本与对象所属类目之间的相关程度数据的问题。
以上述实施例为基础,本申请第二实施例提供一种类目相关性预测方法。以下结合图4对所述方法进行说明,相同部分请参见上述实施例对应部分的描述,不再赘述。图4所示的类目相关性预测方法,包括:步骤S401至步骤S402。
步骤S401,获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本。
本实施例的针对搜索文本的类目相关性预测方法,可以应用于生活服务类平台,也可以应用于其他互联网平台。用户通过平台的搜索功能输入搜索文本,向平台发送搜索请求。平台接收到搜索请求后解析出搜索文本,根据搜索文本对文档库中的对象进行匹配,所述文档库可以理解为搜索中提供搜索返回内容的内容库。所述预设范围可以为所述文档库内的对象,也可以为平台针对初始匹配得到的相关文档,针对文档库内的对象或者针对这些相关文档内的对象再进一步确定其所属类目与所述搜索文本的相关程度数据,从而得到类目相关程度数据满足预设相关度阈值的对象及其类目,作为本次搜索的搜索结果项,展示给用户。用户可以针对搜索结果项中的各对象进行点击、购买、收藏、分享等操作。
步骤S402,将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;其中,所述类目相关性预测网络为上述实施例提供的所述类目相关性预测网络。
本步骤为计算用户输入的搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据。具体包括:获得所述搜索文本对应的针对所述当前计算对象所属类目的用户行为不确定性特征,将所述搜索文本的搜索文本特征与所述用户行为不确定性特征融合,得到所述搜索文本的搜索侧融合特征;获得所述当前计算对象所属的类目对应的用户行为倾向性特征,将所述对象的对象类目特征与所述用户行为倾向性特征融合,得到所述当前计算对象的对象侧融合特征;根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述搜索文本与所述当前计算对象所属的类目之间的相关程度数据。当然,由于训练的类目相关性预测网络中已经学习了用户历史行为特征,包括用户行为不确定性特征以及用户行为倾向性特征,因此,使用训练的类目相关性预测网络对用户真实输入的搜索文本进行类目相关性预测时即使不输入用户历史行为特征,也能得到较为准确的相关程度数据预测值。进一步,确定所述相关程度数据大于预设相关性阈值的目标对象类目文本,将所述目标对象类目文本作为针对所述搜索文本推荐的搜索结果;和/或,根据所述相关程度数据,调整所述当前计算对象在所述搜索文本对应的搜索结果中的排序,从而较为准确的确定平台初始查询召回的对象是否达到可以展现的标准。
本实施例中,采用所述类目相关性预测网络预测得到的相关程度数据,可作为一致性校验的依据,用于确定搜索结果中的对象是否可以达到展现给用户的标准。具体包括:根据所述相关程度数据确定平台召回的对象的排序优先级,平台召回的对象,是指平台根据用户输入的搜索文本初始查询得到的对象。一个方式中,从初始查询得到的对象中删除相关程度数据低于预设相关性阈值的对象,也就是删除类目不相关或相关程度较低的误召回对象。一个方式中,可以根据预测得到的相关程度数据调整对象或对象所属类目的相关性权重,从而通过对所述相关性权重的提升或者降低调整对象或对象所属类目的排序优先级。当用于预测所述相关程度数据的类目相关性预测网络的输出越准确,针对用户输入的搜索文本推荐展示给用户的对象及其所属类目越符合用户的搜索意图,从而提升用户体验以及用户获取信息的准确度。
至此,对第二实施例提供的方法进行了说明,所述方法通过针对用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本,使用上述实施例提供的类目相关性预测网络,得到所述搜索文本与所述预设范围内的对象所属的类目之间的相关程度数据。由于所述类目相关性预测网络为搜索文本与对象之间直接计算类目相关性的端到端模型,并且融合了历史的用户行为不确定性特征以及用户行为倾向性特征,能够更准确的计算搜索文本与对象所属类目之间的相关程度数据。
与第一实施例对应,本申请第三实施例提供一种类目相关性预测网络训练装置。以下结合图5对所述装置进行说明。图5所示的类目相关性预测网络训练装置,包括:
样本单元501,用于基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;
训练单元502,用于使用所述训练样本训练所述类目相关性预测网络;所述训练单元包括:
搜索特征融合子单元503,用于将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征;
对象类目特征融合子单元504,用于将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征;
相关程度计算子单元505,用于根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
可选的,所述类目相关性预测网络包括深度语义模型;所述训练单元502具体用于:基于所述搜索文本获得所述训练样本的第一搜索特征;将所述第一搜索特征输入所述深度语义模型,得到包含搜索文本语义信息的第二搜索特征,将所述第二搜索特征作为所述训练样本的搜索文本特征;基于所述对象类目文本获得所述训练样本的第一对象类目特征;将所述第一对象类目特征输入所述深度语义模型,得到包含对象类目语义信息的第二对象类目特征,将所述第二对象类目特征作为所述训练样本的对象类目特征。
可选的,所述搜索特征融合子单元503具体用于:获得所述搜索文本对应的针对当前计算对象所属的类目的下述至少一种第一行为统计特征度量数据:曝光分布熵、点击分布熵、收藏信息熵、购买分布熵;所述第一行为统计特征度量数据用于表征针对所述搜索文本的所述用户行为不确定性特征;将所述搜索文本特征与所述至少一种第一行为统计特征度量数据进行向量拼接,得到所述训练样本的搜索侧融合特征。
可选的,所述搜索特征融合子单元503具体用于:根据所述搜索文本对应的类目集合中每一类目的点击概率,确定所述搜索文本对应的当前计算对象所属的类目的点击分布熵。
可选的,所述对象类目特征融合子单元504具体用于:获得所述当前计算对象所属的类目的下述至少一种第二行为统计特征度量数据:点击率和/或转化率;所述第二行为统计特征度量数据用于表征所述类目的用户行为倾向性特征;将所述对象类目特征与所述至少一种第二行为统计特征度量数据进行向量拼接,得到所述训练样本的对象侧融合特征。
可选的,所述对象类目特征融合子单元504具体用于:针对所述当前计算对象所属的每一类目级别的每一类目,根据该类目下的用户点击量以及用户展现量确定所述当前计算对象在该类目下的点击率;和/或,根据该类目下的用户购买量以及用户点击量确定所述当前计算对象在该类目下的转化率。
可选的,所述相关程度计算子单元505具体用于:将所述搜索侧融合特征与所述对象侧融合特征,分别输入预设层数的全连接层;根据所述搜索侧融合特征与所述对象侧融合特征各自经过所述全连接层处理后得到的映射特征计算余弦相似度,得到所述搜索文本与所述当前计算对象所属的类目的相关性评分,作为所述相关程度数据。
可选的,所述样本单元501具体用于:获取搜索日志;从所述搜索日志中提取搜索文本、针对所述搜索文本的搜索结果项包含的对象类目文本、以及用户针对所述搜索结果项的用户行为信息,生成可作为所述训练样本的正样本;其中,所述正样本形成用于训练所述类目相关性预测网络的第一训练样本集。
可选的,所述样本单元501具体用于:从所述第一训练样本集中选择搜索文本,使用选择的搜索文本替换正样本包含的搜索文本,生成可作为所述训练样本的第一负样本;和/或,从所述第一训练样本集中选择类目文本,使用选择的类目文本替换正样本包含的对象所属类目的类目文本,生成可作为所述训练样本的第二负样本;和/或,从所述第一训练样本集中选择对象标识,使用选择的对象标识替换正样本包含的对象标识,生成可作为所述训练样本的第三负样本;其中,所述第一负样本、所述第二负样本、所述第三负样本中至少之一形成用于训练所述类目相关性预测网络的第二训练样本集。
可选的,所述样本单元501具体用于:将搜索范围内的对象全集划分为预设数量桶;根据随机生成的编号匹配所述预设数量桶中的其一桶;从匹配到的桶内随机抽取对象;获取随机抽取到的对象对应的搜索文本,使用所述搜索文本替换所述第一训练集的正样本的搜索文本,得到第一负样本;和/或,获取随机抽取到的对象所属类目的类目文本,使用所述类目文本对应替换所述第一训练集的正样本的类目文本,生成所述第二负样本;和/或,获取随机抽取到的对象的对象标识,使用所述随机抽取到的对象的对象标识对应替换所述第一训练集的正样本的对象标识,生成所述第三负样本。
与第二实施例对应,本申请第四实施例提供一种类目相关性预测装置。以下结合图6对所述装置进行说明。图6所示的类目相关性预测装置,包括:
数据获取单元601,用于获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;
相关程度预测单元602,将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;
其中,所述类目相关性预测网络为上述实施例提供的所述的类目相关性预测网络。
可选的,所述相关程度预测单元602具体用于:获得所述搜索文本对应的针对所述当前计算对象所属类目的用户行为不确定性特征,将所述搜索文本的搜索文本特征与所述用户行为不确定性特征融合,得到所述搜索文本的搜索侧融合特征;获得所述当前计算对象所属的类目对应的用户行为倾向性特征,将所述对象的对象类目特征与所述用户行为倾向性特征融合,得到所述当前计算对象的对象侧融合特征;根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述搜索文本与所述当前计算对象所属的类目之间的相关程度数据。
可选的,所述相关程度预测单元602具体用于:确定所述相关程度数据大于预设相关性阈值的目标对象类目文本,将所述目标对象类目文本作为针对所述搜索文本推荐的搜索结果;和/或,根据所述相关程度数据,调整所述当前计算对象在所述搜索文本对应的搜索结果中的排序。
以上述实施例为基础,本申请第五实施例提供一种电子设备,相关的部分请参见上述实施例的对应说明即可。请参考图7,图中所示的电子设备包括:存储器701,以及处理器702;所述存储器用于存储计算机程序,所述计算机程序被处理器运行后,执行本申请实施例提供的所述方法。
以上述实施例为基础,本申请第七实施例提供一种存储设备,相关的部分请参见上述实施例的对应说明即可。所述存储设备的示意图类似图7。所述存储设备存储有计算机程序,所述计算机程序被处理器运行后,执行本申请实施例提供的所述方法。
在一个典型的配置中,计算设备包括一个或多个处理器 (CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器 (RAM) 和/或非易失性内存等形式,如只读存储器 (ROM) 或闪存(flash RAM)。内存是计算机可读介质的示例。
1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存 (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器 (DRAM)、其他类型的随机存取存储器 (RAM)、只读存储器(ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘 (DVD) 或其他光学存储、磁盒式磁带,磁带磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体 (transitory media),如调制的数据信号和载波。
2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改,因此本申请的保护范围应当以本申请权利要求所界定的范围为准。

Claims (17)

1.一种类目相关性预测网络训练方法,其特征在于,包括:
基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;
使用所述训练样本训练所述类目相关性预测网络,在每轮训练中执行下述步骤:
将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征,其中,所述用户行为不确定性特征,为基于所述搜索文本的曝光分布熵、点击分布熵、收藏信息熵、购买分布熵中的至少一种信息熵得到的体现所述搜索文本在其所属类目下的用户行为不确定程度的特征;
将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征,其中,所述用户行为倾向性特征,为基于针对与所述搜索文本对应的对象类目中各个类目的点击率和/或转化率得到的用于体现所述搜索文本在其所属类目下的用户行为倾向程度的特征;其中,所述转化率为所述类目下的点击量转化为所述类目下的购买量的比率;
根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
2.根据权利要求1所述的方法,其特征在于,所述类目相关性预测网络包括深度语义模型;
所述方法,还包括:
基于所述搜索文本获得所述训练样本的第一搜索特征;
将所述第一搜索特征输入所述深度语义模型,得到包含搜索文本语义信息的第二搜索特征,将所述第二搜索特征作为所述训练样本的搜索文本特征;
基于所述对象类目文本获得所述训练样本的第一对象类目特征;
将所述第一对象类目特征输入所述深度语义模型,得到包含对象类目语义信息的第二对象类目特征,将所述第二对象类目特征作为所述训练样本的对象类目特征。
3.根据权利要求1所述的方法,其特征在于,还包括:
获得所述搜索文本对应的针对当前计算对象所属的类目的下述至少一种第一行为统计特征度量数据:曝光分布熵、点击分布熵、收藏信息熵、购买分布熵;所述第一行为统计特征度量数据用于表征针对所述搜索文本的所述用户行为不确定性特征;
所述将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征,包括:
将所述搜索文本特征与所述至少一种第一行为统计特征度量数据进行向量拼接,得到所述训练样本的搜索侧融合特征。
4.根据权利要求3所述的方法,其特征在于,还包括:
根据所述搜索文本对应的类目集合中每一类目的点击概率,确定所述搜索文本对应的当前计算对象所属的类目的点击分布熵。
5.根据权利要求1所述的方法,其特征在于,还包括:
获得所述当前计算对象所属的类目的下述至少一种第二行为统计特征度量数据:点击率和/或转化率;所述第二行为统计特征度量数据用于表征所述类目的用户行为倾向性特征;
所述将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征,包括:
将所述对象类目特征与所述至少一种第二行为统计特征度量数据进行向量拼接,得到所述训练样本的对象侧融合特征。
6.根据权利要求5所述的方法,其特征在于,还包括:
针对所述当前计算对象所属的每一类目级别的每一类目,根据该类目下的用户点击量以及用户展现量确定所述当前计算对象在该类目下的点击率;和/或,根据该类目下的用户购买量以及用户点击量确定所述当前计算对象在该类目下的转化率。
7.根据权利要求1所述的方法,其特征在于,所述根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据,包括:
将所述搜索侧融合特征与所述对象侧融合特征,分别输入预设层数的全连接层;
根据所述搜索侧融合特征与所述对象侧融合特征各自经过所述全连接层处理后得到的映射特征计算余弦相似度,得到所述搜索文本与所述当前计算对象所属的类目的相关性评分,作为所述相关程度数据。
8.根据权利要求1所述的方法,其特征在于,所述基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本,包括:
获取搜索日志;
从所述搜索日志中提取搜索文本、针对所述搜索文本的搜索结果项包含的对象类目文本、以及用户针对所述搜索结果项的用户行为信息,生成可作为所述训练样本的正样本;
其中,所述正样本形成用于训练所述类目相关性预测网络的第一训练样本集。
9.根据权利要求8所述的方法,其特征在于,还包括:
从所述第一训练样本集中选择搜索文本,使用选择的搜索文本替换正样本包含的搜索文本,生成可作为所述训练样本的第一负样本;和/或,
从所述第一训练样本集中选择类目文本,使用选择的类目文本替换正样本包含的对象所属类目的类目文本,生成可作为所述训练样本的第二负样本;和/或,
从所述第一训练样本集中选择对象标识,使用选择的对象标识替换正样本包含的对象标识,生成可作为所述训练样本的第三负样本;
其中,所述第一负样本、所述第二负样本、所述第三负样本中至少之一形成用于训练所述类目相关性预测网络的第二训练样本集。
10.根据权利要求9所述的方法,其特征在于,还包括:
将搜索范围内的对象全集划分为预设数量桶;
根据随机生成的编号匹配所述预设数量桶中的其一桶;
从匹配到的桶内随机抽取对象;
获取随机抽取到的对象对应的搜索文本,使用所述搜索文本替换所述第一训练集的正样本的搜索文本,得到第一负样本;和/或,
获取随机抽取到的对象所属类目的类目文本,使用所述类目文本对应替换所述第一训练集的正样本的类目文本,生成所述第二负样本;和/或,
获取随机抽取到的对象的对象标识,使用所述随机抽取到的对象的对象标识对应替换所述第一训练集的正样本的对象标识,生成所述第三负样本。
11.一种类目相关性预测方法,其特征在于,包括:
获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;
将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;
其中,所述类目相关性预测网络为权利要求1至10任一项所述的类目相关性预测网络。
12.根据权利要求11所述的方法,其特征在于,所述将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据,包括:
获得所述搜索文本对应的针对所述当前计算对象所属类目的用户行为不确定性特征,将所述搜索文本的搜索文本特征与所述用户行为不确定性特征融合,得到所述搜索文本的搜索侧融合特征;
获得所述当前计算对象所属的类目对应的用户行为倾向性特征,将所述对象的对象类目特征与所述用户行为倾向性特征融合,得到所述当前计算对象的对象侧融合特征;
根据所述搜索侧融合特征与所述对象侧融合特征之间的距离,确定所述搜索文本与所述当前计算对象所属的类目之间的相关程度数据。
13.根据权利要求11所述的方法,其特征在于,还包括:
确定所述相关程度数据大于预设相关性阈值的目标对象类目文本,将所述目标对象类目文本作为针对所述搜索文本推荐的搜索结果;和/或,
根据所述相关程度数据,调整所述当前计算对象在所述搜索文本对应的搜索结果中的排序。
14.一种类目相关性预测网络训练装置,其特征在于,包括:
样本单元,用于基于搜索文本以及与所述搜索文本对应的对象类目文本,生成训练样本;
训练单元,用于使用所述训练样本训练所述类目相关性预测网络;所述训练单元包括:
搜索特征融合子单元,用于将所述训练样本的搜索文本特征与用户行为不确定性特征融合,得到所述训练样本的搜索侧融合特征,其中,所述用户行为不确定性特征,为基于所述搜索文本的曝光分布熵、点击分布熵、收藏信息熵、购买分布熵中的至少一种信息熵得到的体现所述搜索文本在其所属类目下的用户行为不确定程度的特征;
对象类目特征融合子单元,用于将所述训练样本的对象类目特征与用户行为倾向性特征融合,得到所述训练样本的对象侧融合特征,其中,所述用户行为倾向性特征,为基于针对与所述搜索文本对应的对象类目中各个类目的点击率和/或转化率得到的用于体现所述搜索文本在其所属类目下的用户行为倾向程度的特征;其中,所述转化率为所述类目下的点击量转化为所述类目下的购买量的比率;
相关程度计算子单元,用于根据所述训练样本的搜索侧融合特征与所述训练样本的对象侧融合特征之间的距离,确定所述训练样本的搜索文本与所述训练样本中当前计算对象所属的类目之间的相关程度数据。
15.一种类目相关性预测装置,其特征在于,包括:
数据获取单元,用于获取用户输入的搜索文本,以及与所述搜索文本相关的预设范围内的对象类目文本;
相关程度预测单元,将所述搜索文本与所述对象类目文本输入类目相关性预测网络,得到所述搜索文本与所述预设范围内的当前计算对象所属的类目之间的相关程度数据;
其中,所述类目相关性预测网络为权利要求1至10任一项所述的类目相关性预测网络。
16.一种电子设备,其特征在于,包括:
存储器,以及处理器;所述存储器用于存储计算机程序,所述计算机程序被所述处理器运行后,执行权利要求1-13任意一项所述的方法。
17.一种存储设备,其特征在于,存储有计算机程序,所述计算机程序被处理器运行后,执行权利要求1-13任意一项所述的方法。
CN202210107592.1A 2022-01-28 2022-01-28 类目相关性预测网络训练及类目相关性预测方法及装置 Active CN114139041B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210107592.1A CN114139041B (zh) 2022-01-28 2022-01-28 类目相关性预测网络训练及类目相关性预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210107592.1A CN114139041B (zh) 2022-01-28 2022-01-28 类目相关性预测网络训练及类目相关性预测方法及装置

Publications (2)

Publication Number Publication Date
CN114139041A CN114139041A (zh) 2022-03-04
CN114139041B true CN114139041B (zh) 2022-05-13

Family

ID=80382238

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210107592.1A Active CN114139041B (zh) 2022-01-28 2022-01-28 类目相关性预测网络训练及类目相关性预测方法及装置

Country Status (1)

Country Link
CN (1) CN114139041B (zh)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106021364A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN106815252A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种搜索方法和设备
CN110163703A (zh) * 2018-02-12 2019-08-23 阿里巴巴集团控股有限公司 一种分类模型建立方法、文案推送方法和服务器
CN111460264A (zh) * 2020-03-30 2020-07-28 口口相传(北京)网络技术有限公司 语义相似度匹配模型的训练方法及装置
CN112182323A (zh) * 2020-09-18 2021-01-05 北京三快在线科技有限公司 一种类目预测方法、装置、电子设备及存储介质
CN112434173A (zh) * 2021-01-26 2021-03-02 浙江口碑网络技术有限公司 搜索内容输出方法、装置、计算机设备及可读存储介质

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7676521B2 (en) * 2006-03-31 2010-03-09 Microsoft Corporation Keyword search volume seasonality forecasting engine
US20210182884A1 (en) * 2015-12-30 2021-06-17 Wells Fargo Bank, N.A. Analysis of Social Media Data to Predict Customer Purchases
CN112784083A (zh) * 2019-11-04 2021-05-11 阿里巴巴集团控股有限公司 类目预测模型、特征提取模型的获取方法及装置
CN111737418B (zh) * 2020-07-20 2021-05-14 北京每日优鲜电子商务有限公司 搜索词和商品的相关性预测方法、设备和存储介质

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106815252A (zh) * 2015-12-01 2017-06-09 阿里巴巴集团控股有限公司 一种搜索方法和设备
CN106021364A (zh) * 2016-05-10 2016-10-12 百度在线网络技术(北京)有限公司 图片搜索相关性预测模型的建立、图片搜索方法和装置
CN110163703A (zh) * 2018-02-12 2019-08-23 阿里巴巴集团控股有限公司 一种分类模型建立方法、文案推送方法和服务器
CN111460264A (zh) * 2020-03-30 2020-07-28 口口相传(北京)网络技术有限公司 语义相似度匹配模型的训练方法及装置
CN112182323A (zh) * 2020-09-18 2021-01-05 北京三快在线科技有限公司 一种类目预测方法、装置、电子设备及存储介质
CN112434173A (zh) * 2021-01-26 2021-03-02 浙江口碑网络技术有限公司 搜索内容输出方法、装置、计算机设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于网络日志的用户行为刻画与预测研究;康海燕等;《郑州大学学报》;20190930;第51卷(第3期);第48-54页 *

Also Published As

Publication number Publication date
CN114139041A (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN111061946B (zh) 场景化内容推荐方法、装置、电子设备及存储介质
CN108829822B (zh) 媒体内容的推荐方法和装置、存储介质、电子装置
CN107784010B (zh) 一种用于确定新闻主题的热度信息的方法与设备
CN107832338B (zh) 一种识别核心产品词的方法和系统
EP2825981A1 (en) Publishing product information
CN110909182A (zh) 多媒体资源搜索方法、装置、计算机设备及存储介质
CN110955831B (zh) 物品推荐方法、装置、计算机设备及存储介质
CN113254777B (zh) 信息推荐方法、装置、电子设备及存储介质
KR20150032147A (ko) 사용자 의도 추론에 기반한 휴대용 단말 장치 및 이를 이용한 컨텐츠 추천 방법
CN113570413A (zh) 广告关键词的生成方法、装置、存储介质及电子设备
CN115712780A (zh) 一种基于云计算和大数据的信息推送方法及装置
CN110008396B (zh) 对象信息推送方法、装置、设备及计算机可读存储介质
CN110992127A (zh) 一种物品推荐方法及装置
CN113821588A (zh) 文本处理方法、装置、电子设备及存储介质
CN112182126A (zh) 用于确定匹配度的模型训练方法、装置、电子设备及可读存储介质
CN114139041B (zh) 类目相关性预测网络训练及类目相关性预测方法及装置
CN116843376A (zh) 一种营销效果预判方法、装置、存储介质及设备
CN114282119B (zh) 一种基于异构信息网络的科技信息资源检索方法及系统
CN113327154B (zh) 基于大数据的电商用户讯息推送方法及系统
CN115827990A (zh) 搜索方法及装置
CN115618126A (zh) 搜索处理方法、系统、计算机可读存储介质及计算机设备
CN111581245B (zh) 一种数据搜索方法以及装置
CN110796505A (zh) 一种业务对象推荐方法以及装置
CN115203206A (zh) 数据内容搜索方法、装置、计算机设备及可读存储介质
CN113704617A (zh) 物品推荐方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant