CN118172146B - 物品数据处理方法、装置、计算机设备和存储介质 - Google Patents
物品数据处理方法、装置、计算机设备和存储介质 Download PDFInfo
- Publication number
- CN118172146B CN118172146B CN202410591829.7A CN202410591829A CN118172146B CN 118172146 B CN118172146 B CN 118172146B CN 202410591829 A CN202410591829 A CN 202410591829A CN 118172146 B CN118172146 B CN 118172146B
- Authority
- CN
- China
- Prior art keywords
- article
- sequence
- item
- target
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title abstract description 21
- 230000002452 interceptive effect Effects 0.000 claims abstract description 168
- 238000012549 training Methods 0.000 claims abstract description 152
- 230000003993 interaction Effects 0.000 claims abstract description 106
- 238000000034 method Methods 0.000 claims abstract description 63
- 238000004590 computer program Methods 0.000 claims abstract description 28
- 230000009467 reduction Effects 0.000 claims description 147
- 238000012545 processing Methods 0.000 claims description 48
- 238000012937 correction Methods 0.000 claims description 32
- 238000000605 extraction Methods 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 8
- 230000009466 transformation Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 abstract description 34
- 230000000875 corresponding effect Effects 0.000 description 208
- 230000006399 behavior Effects 0.000 description 20
- 238000005516 engineering process Methods 0.000 description 15
- 230000008569 process Effects 0.000 description 15
- 238000010586 diagram Methods 0.000 description 14
- 239000013598 vector Substances 0.000 description 12
- 238000010801 machine learning Methods 0.000 description 11
- 238000013473 artificial intelligence Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 9
- 230000007246 mechanism Effects 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 7
- 238000003058 natural language processing Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000002829 reductive effect Effects 0.000 description 6
- 238000012163 sequencing technique Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 230000006835 compression Effects 0.000 description 3
- 238000007906 compression Methods 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000010606 normalization Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013500 data storage Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000070023 Phoenicopterus roseus Species 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 230000000644 propagated effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000013526 transfer learning Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
- G06Q30/0601—Electronic shopping [e-shopping]
- G06Q30/0631—Item recommendations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/10—Pre-processing; Data cleansing
- G06F18/15—Statistical pre-processing, e.g. techniques for normalisation or restoring missing data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/27—Regression, e.g. linear or logistic regression
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
- G06N3/0455—Auto-encoder networks; Encoder-decoder networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0464—Convolutional networks [CNN, ConvNet]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/0499—Feedforward networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/0895—Weakly supervised learning, e.g. semi-supervised or self-supervised learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Business, Economics & Management (AREA)
- Databases & Information Systems (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Probability & Statistics with Applications (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Image Analysis (AREA)
Abstract
本申请涉及一种物品数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取目标物品和目标对象的交互物品序列;从目标对象的交互物品序列中确定目标物品的关联物品序列;基于关联物品序列和目标物品,得到联合物品序列,将联合物品序列输入目标序列模型;目标序列模型包括预设物品特征集,目标序列模型是基于训练对象的交互物品序列训练得到的;通过目标序列模型,在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征;物品序列特征,用于确定目标物品和目标对象之间的匹配度。采用本方法能够提高嵌入表征准确性。
Description
技术领域
本申请涉及计算机技术领域,特别是涉及一种物品数据处理方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
互联网的出现和普及给用户带来了海量信息,满足了用户在信息时代的信息需求。然而,随着信息量的大幅增长,用户在面对海量信息时,难以从海量的信息中快速获取想要的或者感兴趣的内容,此时推荐功能应运而生。
针对物品的推荐,通常是分别提取目标物品和目标对象的交互物品序列的嵌入表征,将二者的嵌入表征进行比较确定是否将目标物品推荐给目标对象。然而,目前的嵌入表征方式难以获取目标物品和交互物品序列之间的相关性,准确性较低,后续也会影响物品推荐效果。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高嵌入表征准确性的物品数据处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
本申请提供了一种物品数据处理方法,包括:
获取目标物品和目标对象的交互物品序列;
从所述目标对象的交互物品序列中确定所述目标物品的关联物品序列;
基于所述关联物品序列和所述目标物品,得到联合物品序列,将所述联合物品序列输入目标序列模型;所述目标序列模型包括预设物品特征集,所述目标序列模型是基于训练对象的交互物品序列训练得到的;
通过所述目标序列模型,在所述预设物品特征集中,查询所述联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出所述联合物品序列的物品序列特征;所述物品序列特征,用于确定所述目标物品和所述目标对象之间的匹配度。
本申请还提供了一种物品数据处理装置,包括:
数据获取模块,用于获取目标物品和目标对象的交互物品序列;
关联物品确定模块,用于从所述目标对象的交互物品序列中确定所述目标物品的关联物品序列;
物品联合模块,用于基于所述关联物品序列和所述目标物品,得到联合物品序列,将所述联合物品序列输入目标序列模型;所述目标序列模型包括预设物品特征集,所述目标序列模型是基于训练对象的交互物品序列训练得到的;
序列特征提取模块,用于通过所述目标序列模型,在所述预设物品特征集中,查询所述联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出所述联合物品序列的物品序列特征;所述物品序列特征,用于确定所述目标物品和所述目标对象之间的匹配度。
本申请还提供了一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述物品数据处理方法所述的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述物品数据处理方法所述的步骤。
本申请还提供了一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述物品数据处理方法所述的步骤。
上述物品数据处理方法、装置、计算机设备、存储介质和计算机程序产品,获取目标物品和目标对象的交互物品序列;从目标对象的交互物品序列中确定目标物品的关联物品序列;基于关联物品序列和目标物品,得到联合物品序列,将联合物品序列输入目标序列模型;目标序列模型包括预设物品特征集,目标序列模型是基于训练对象的交互物品序列训练得到的;通过目标序列模型,在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征;物品序列特征,用于确定目标物品和目标对象之间的匹配度。这样,对目标对象的交互物品序列进行物品筛选,得到目标物品的关联物品序列,能够避免直接对较长序列进行嵌入表征建模,有效降低计算复杂度,提高数据处理效率。目标序列模型是基于训练对象的交互物品序列训练得到的,能够准确提取物品序列的嵌入表征,因此,将基于关联物品序列和目标物品得到的联合物品序列输入目标序列模型进行嵌入表征建模,能够提取到准确的嵌入表征。目标序列模型通过针对目标物品和关联物品序列查询到的初始物品特征,对目标物品和关联物品序列进行联合的嵌入表征建模,通过嵌入表征建模得到的物品序列特征,能够准确反映目标对象在目标物品上的行为嵌入表征。后续,基于物品序列特征可以确定目标物品和目标对象之间的匹配度,根据匹配度向目标对象进行物品推荐,能够有效提高推荐准确性、推荐有效性。
附图说明
为了更清楚地说明本申请实施例或相关技术中的技术方案,下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一个实施例中物品数据处理方法的应用环境图;
图2为一个实施例中物品数据处理方法的流程示意图;
图3为一个实施例中训练降维模型的流程示意图;
图4为一个实施例中降维模型的结构示意图;
图5为另一个实施例中降维模型的结构示意图;
图6为一个实施例中大语言模型的结构示意图;
图7为一个实施例中训练序列模型的流程示意图;
图8为一个实施例中序列模型的结构示意图;
图9为另一个实施例中序列模型的结构示意图;
图10为另一个实施例中序列模型的结构示意图;
图11为一个实施例中物品推荐方法的流程示意图;
图12为一个实施例中物品数据处理装置的结构框图;
图13为一个实施例中计算机设备的内部结构图;
图14为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、预训练模型技术、操作/交互系统、机电一体化等技术。其中,预训练模型又称大模型、基础模型,经过微调后可以广泛应用于人工智能各大方向下游任务。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
自然语言处理(Nature Language processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理涉及自然语言,即人们日常使用的语言,与语言学研究密切;同时涉及计算机科学和数学。人工智能领域模型训练的重要技术,预训练模型,即是从NLP领域的大语言模型(Large Language Model)发展而来。经过微调,大语言模型可以广泛应用于下游任务。自然语言处理技术通常包括文本处理、语义理解、机器翻译、机器人问答、知识图谱等技术。
机器学习(Machine Learning, ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。预训练模型是深度学习的最新发展成果,融合了以上技术。
本申请实施例提供的方案涉及人工智能的机器学习、自然语言处理等技术,具体通过如下实施例进行说明:
本申请实施例提供的物品数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以单独设置,可以集成在服务器 104上,也可以放在云上或其他设备上。用户可以在终端102上浏览信息,服务器104可以为终端102提供待展示的信息。终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群或者云服务器来实现。
终端和服务器均可单独用于执行本申请实施例中提供的物品数据处理方法。终端和服务器也可协同用于执行本申请实施例中提供的物品数据处理方法。
例如,服务器获取目标物品和目标对象的交互物品序列,从目标对象的交互物品序列中确定目标物品的关联物品序列,基于关联物品序列和目标物品,得到联合物品序列。服务器将联合物品序列输入目标序列模型,通过目标序列模型,在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征。其中,目标序列模型包括预设物品特征集,目标序列模型是基于训练对象的交互物品序列训练得到的。物品序列特征,用于确定目标物品和目标对象之间的匹配度。
在一些实施例中,如图2所示,提供了一种物品数据处理方法,以该方法应用于计算机设备来举例说明,计算机设备可以是终端或服务器。可以理解,该方法可以由终端或服务器自身单独执行,也可以通过终端和服务器之间的交互来实现。其中:
步骤S202,获取目标物品和目标对象的交互物品序列。
其中,物品可以被拥有、使用或交易。物品可以是视频、图像、文本、音频等各种类型的媒体资源,物品也可以是商品、产品或服务。目标物品是指待处理、待分析的物品。
对象是指用户。对象对应的交互物品是指与对象存在交互信息的物品,是指与对象互动、交互过的物品。例如,若物品代表视频,则对象对应的交互物品可以是被用户播放过的视频,可以是被用户收藏过的视频;若物品代表商品,则对象对应的交互物品可以是被用户消费过的商品。目标对象是指待处理、待分析的对象。目标对象的交互物品序列包括目标对象对应的多个交互物品。
在一个实施例中,物品对应的交互时间是指对象对物品进行交互操作的操作时间。例如,若对象对应的交互物品是被用户播放过的视频,则交互物品对应的交互时间为视频的播放时间。目标对象的交互物品序列是将目标对象对应的多个交互物品按照交互时间进行排序得到的。例如,交互物品为对象浏览过的文章,则目标对象的交互物品序列可以是将目标对象最近浏览过的k个文章的文章标识按照文章的浏览时间从早到晚进行排序得到的。
具体地,计算机设备可以获取目标物品和目标对象的交互物品序列,对目标物品和交互物品序列进行联合的嵌入表征建模,从而更好地理解目标对象的兴趣、习惯和行为趋势。
在一个实施例中,从候选物品集中确定目标物品。候选物品集相当于物品池。在需要向目标对象推荐物品的时候,从物品池中确定推荐给目标对象的物品。目标物品可以是从候选物品集中随机选取的,也可以是先从候选物品集中进行物品召回,得到中间物品集,将中间物品集中的物品作为目标物品。
步骤S204,从目标对象的交互物品序列中确定目标物品的关联物品序列。
其中,目标对象的交互物品序列包括目标对象的多个交互物品。目标物品的关联物品序列包括交互物品序列中与目标物品关联的多个交互物品。交互物品与目标物品之间存在关联可以是物品之间在内容上存在关联。例如,存在相同的物品属性;存在相似的物品特征;等等。
具体地,目标对象的交互物品序列通常是较长序列,为了减轻后续建模压力,计算机设备可以从目标对象的交互物品序列中选取多个与目标物品关联的交互物品,组成目标物品的关联物品序列。例如,提取交互物品序列中各个交互物品的物品特征,提取目标物品的物品特征,计算目标物品的物品特征分别和各个交互物品的物品特征之间的特征距离,选取特征距离较小的多个交互物品组成目标物品的关联物品序列。
步骤S206,基于关联物品序列和目标物品,得到联合物品序列,将联合物品序列输入目标序列模型;目标序列模型包括预设物品特征集,目标序列模型是基于训练对象的交互物品序列训练得到的。
其中,联合物品序列包括目标物品和目标物品的关联物品序列。联合物品序列是与目标对象和目标物品相关的物品序列。
序列模型是机器学习模型,可以用于提取物品序列的嵌入表征(即序列特征)。序列模型包括预设物品特征集。预设物品特征集包括候选物品集中各个物品各自的预设物品特征。物品的预设物品特征是预先针对物品提取的嵌入表征,用于反映物品的语义信息。物品的预设物品特征可以是物品的内容特征,内容特征是对物品的自身内容进行特征提取得到的。例如,可以对物品的物品属性集进行特征提取,得到物品的预设物品特征。将物品序列输入序列模型,序列模型从预设物品特征集中查询物品序列中各个物品分别对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到物品序列的嵌入表征。
训练对象的交互物品序列是序列模型的训练数据,基于训练数据对初始序列模型进行自监督训练,得到目标序列模型。在训练过程中,模型根据序列中在目标位置之前的物品来预测序列中在目标位置上的物品,这种训练方式鼓励模型学习物品序列的生成过程,并捕获序列中的依赖关系。在模型训练时,将训练对象的交互物品序列输入初始序列模型,查询交互物品序列中在目标位置之前的物品的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到由目标位置之前的物品组成的子序列的嵌入表征,基于子序列的嵌入表征进行物品预测,得到交互物品序列中在目标位置上的物品的预测概率。训练目标是通过调整模型参数来提高交互物品序列中在目标位置上的物品的预测概率。
可以理解,初始序列模型是待训练的序列模型。目标序列模型是完成训练的序列模型。训练对象的交互物品序列包括训练对象对应的多个交互物品。例如,训练对象的交互物品序列是将训练对象对应的多个交互物品按照交互时间进行排序得到的。训练对象的相关数据用于模型训练,目标对象的相关数据用于模型应用。训练对象和目标对象均可以是任意的用户。
具体地,计算机设备可以将关联物品序列和目标物品组合,得到联合物品序列,将联合物品序列输入目标序列模型,通过目标序列模型对联合物品序列进行嵌入表征建模,得到联合物品序列的物品序列特征。
可以理解,本申请中的各个物品序列可以是由物品标识组成的物品标识序列。物品标识是一种标识,用于标识物品。例如,物品标识可以是物品名称,物品标识可以是物品序列号。
步骤S208,通过目标序列模型,在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征;物品序列特征,用于确定目标物品和目标对象之间的匹配度。
其中,对多个物品特征进行特征交互是指将多个物品特征进行特征融合。对联合物品序列中各个物品对应的预设物品特征进行特征交互,能够捕捉联合物品序列中目标物品和目标对象的交互物品之间的关联、相互作用,使得通过特征交互得到的物品序列特征可以反映目标物品和目标对象之间的联系。例如,可以通过神经网络进行特征交互;可以通过Transformer层(变换层)进行特征交互;等等。
将联合物品序列输入目标序列模型,目标序列模型输出联合物品序列的物品序列特征。物品序列特征是联合物品序列的嵌入表征。目标对象的交互物品序列可以反映目标对象的行为模式,联合物品序列包括目标物品和目标对象的交互物品序列中与目标物品相关的交互物品,物品序列特征可以反映目标对象在目标物品上的行为嵌入表征,因此,联合物品序列的物品序列特征可以用于确定目标物品和目标对象之间的匹配度。
具体地,目标序列模型包括预设物品特征集。计算机设备将联合物品序列输入目标序列模型。目标序列模型在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到联合物品序列的物品序列特征,输出联合物品序列的物品序列特征。
可以理解,相比于对目标物品和目标对象的交互物品序列分别进行嵌入表征建模,先基于目标物品和目标对象的交互物品序列得到联合物品序列,通过对联合物品序列进行嵌入表征建模相当于对目标物品和目标对象的交互物品序列进行联合的嵌入表征建模,通过联合的嵌入表征建模得到的序列特征,能够更准确地反映目标对象的兴趣、习惯和行为趋势。
后续,计算机设备可以基于联合物品序列的物品序列特征,确定目标物品和目标对象之间的匹配度。进一步的,基于目标物品和目标对象之间的匹配度,可以确定是否向目标对象推荐目标物品。例如,向目标对象推荐匹配度超过匹配度阈值的目标物品。
上述物品数据处理方法中,对目标对象的交互物品序列进行物品筛选,得到目标物品的关联物品序列,能够避免直接对较长序列进行嵌入表征建模,有效降低计算复杂度,提高数据处理效率。目标序列模型是基于训练对象的交互物品序列训练得到的,能够准确提取物品序列的嵌入表征,因此,将基于关联物品序列和目标物品得到的联合物品序列输入目标序列模型进行嵌入表征建模,能够提取到准确的嵌入表征。目标序列模型通过针对目标物品和关联物品序列查询到的初始物品特征,对目标物品和关联物品序列进行联合的嵌入表征建模,通过嵌入表征建模得到的物品序列特征,能够准确反映目标对象在目标物品上的行为嵌入表征。后续,基于物品序列特征可以确定目标物品和目标对象之间的匹配度,根据匹配度向目标对象进行物品推荐,能够有效提高推荐准确性、推荐有效性。
在一些实施例中,从目标对象的交互物品序列中确定目标物品的关联物品序列,包括:
针对目标物品和目标对象的交互物品序列中的交互物品,提取物品的目标物品特征;目标物品特征是对物品的初始物品特征进行降维处理得到的;
基于目标物品和交互物品各自的目标物品特征之间的特征距离,从目标对象的交互物品序列中确定目标物品的关联物品序列。
其中,物品的初始物品特征是物品的高维嵌入表征。物品的目标物品特征是物品的低维嵌入表征。对物品的初始物品特征进行降维处理,得到物品的目标物品特征。物品的初始物品特征和目标物品特征都可以表达物品的语义信息,但是目标物品特征的数据量小于初始物品特征的数据量。对特征进行降维处理用于在减少特征的数据量的同时,尽可能保留特征中的重要信息。
具体地,为了提高从目标对象的交互物品序列中确定目标物品的关联物品序列的速度,可以获取物品的低维嵌入表征,通过物品的低维嵌入表征从交互物品序列中选取与目标物品关联的交互物品,组成目标物品的关联物品序列。
计算机设备获取目标物品的目标物品特征,获取目标对象的交互物品序列中各个交互物品的目标物品特征,计算目标物品的目标物品特征分别和各个交互物品的目标物品特征之间的特征距离,基于特征距离从各个交互物品中确定与目标物品关联的交互物品。例如,将特征距离小于距离阈值的交互物品作为与目标物品关联的交互物品;按照特征距离从小到大将各个交互物品进行排序,获取排序靠前的n个交互物品作为与目标物品关联的交互物品;等等。最终,计算机设备可以将从目标对象的交互物品序列中选取的交互物品作为目标物品的关联物品,组成目标物品的关联物品序列。
在一个实施例中,可以通过预训练模型提取物品的初始物品特征。预训练模型是经过大规模数据训练得到的大模型。按照处理的数据模态可以分为语言模型(ELMO,BERT,GPT)、视觉模型(swin-transformer,ViT,V-MOE)、语音模型(VALL-E)、多模态模型(ViBERT,CLIP,Flamingo,Gato)等。例如,可以将物品对应的文本类型的物品属性输入语言模型,语言模型输出物品的初始物品特征;可以将物品对应的图像类型的物品属性输入视觉模型,视觉模型输出物品的初始物品特征;等等。其中多模态模型是指建立两种或以上数据模态特征表示的模型。
上述实施例中,基于物品的低维嵌入表征,从目标对象的交互物品序列中确定目标物品的关联物品序列,能够降低计算复杂度,提高从交互物品序列中确定关联物品序列的速度。
在一些实施例中,针对目标物品和目标对象的交互物品序列中的交互物品,提取物品的目标物品特征,包括:
基于当前物品的物品标识生成当前物品标识序列,将当前物品标识序列输入目标降维模型;当前物品为目标物品或目标对象的交互物品序列中的交互物品,目标降维模型包括初始物品特征集;
通过目标降维模型,在初始物品特征集中,查询当前物品的物品标识对应的初始物品特征,对查询到的初始物品特征进行特征增强和特征降维,输出当前物品的目标物品特征。
其中,当前物品是指当前进行降维处理的物品。当前物品为目标物品或目标对象的交互物品序列中的交互物品。当前物品标识序列包括当前物品的物品标识,不包括其他物品的物品标识。将当前物品标识序列输入目标降维模型,得到当前物品的目标物品特征。
降维模型是机器学习模型,用于对物品特征进行降维处理。降维模型包括初始物品特征集,初始物品特征集包括候选物品集中各个物品各自的初始物品特征。初始物品特征是物品的高维嵌入表征。目标降维模型是完成训练的降维模型。在模型应用时,目标降维模型的输入数据是一个物品的物品标识序列,输出数据是该物品的目标物品特征。
对特征进行特征增强是指增强特征的语义信息。例如,通过Transformer层进行特征增强;通过卷积层进行特征增强。对特征进行特征降维是指减少特征的数据量。例如,通过特征映射来进行特征降维;通过特征选择来进行特征降维。
具体地,采用机器学习模型对物品的初始物品特征进行降维处理,得到物品的目标物品特征。
计算机设备可以基于当前物品的物品标识生成当前物品标识序列,将当前物品标识序列输入目标降维模型。目标降维模型在初始物品特征集中查询当前物品的物品标识对应的初始物品特征,对查询到的初始物品特征进行特征增强和特征降维,得到当前物品的目标物品特征,输出当前物品的目标物品特征。
可以理解,可以是对查询到的初始物品特征进行特征增强,得到第一中间物品特征,再对第一中间物品特征进行特征降维,得到目标物品特征。也可以是对查询到的初始物品特征进行特征降维,得到第二中间物品特征,再对第二中间物品特征进行特征增强,得到目标物品特征。
在一些实施例中,训练对象的交互物品序列是降维模型的训练数据,基于训练数据对初始降维模型进行自监督训练,得到目标降维模型。在训练过程中,模型根据序列中在目标位置之前的物品来预测序列中在目标位置上的物品,这种训练方式鼓励模型学习物品序列的生成过程,并捕获序列中的依赖关系。
训练对象的交互物品序列可以是物品标识序列,包括训练对象对应的多个交互物品的物品标识。当前物品标识序列包括当前物品的物品标识和预设标识。预设标识是预先设置的标识,预设标识不代表任何的物品,用于调节序列长度。预设标识可以根据实际需要进行设置,例如,预设标识可以是0。当前物品对应的当前物品标识序列与训练对象的交互物品序列具有相同数量的标识,也就是,具有相同的序列长度。
举例说明,训练对象的交互物品序列用A-B-C-D-E表示。A、B、C、D、E分别表示训练对象按照时间顺序依次浏览过的物品。目标物品用X表示,目标物品对应的物品标识序列可以用X-0-0-0-0表示。
上述实施例中,目标降维模型包括初始物品特征集,将当前物品的物品标识输入目标降维模型,目标降维模型基于当前物品的物品标识从初始物品特征集中快速查询当前物品的初始物品特征,目标降维模型无需专门单独提取当前物品的初始物品特征,对查询到的初始物品特征进行特征增强和特征降维,即可得到当前物品的目标物品特征,能够降低计算量,提高降维处理的效率。通过机器学习模型进行降维处理,也能够保障降维处理的准确性。
在一些实施例中,如图3所示,物品数据处理方法还包括:
步骤S302,获取第一物品标识序列,将第一物品标识序列输入初始降维模型;第一物品标识序列是基于第一训练对象的交互物品序列得到的,初始降维模型包括初始物品特征集。
其中,第一物品标识序列是用于训练降维模型的训练物品标识序列。训练物品标识序列包括训练对象对应的多个交互物品的物品标识。例如,交互物品为对象浏览过的文章,则训练物品标识序列可以是将训练对象最近浏览过的k个文章的文章标识按照文章的浏览时间从早到晚进行排序得到的。
第一物品标识序列是基于第一训练对象的交互物品序列得到的。第一训练对象的相关数据用于训练降维模型。初始降维模型是指待训练的降维模型。对初始降维模型进行训练,得到目标降维模型。目标降维模型是指完成训练的降维模型。在模型训练时,初始降维模型的输入数据是第一物品标识序列,输出数据是物品标识对应的第一预测概率。初始降维模型包括初始物品特征集,初始物品特征集包括候选物品集中各个物品分别对应的初始物品特征。
具体地,计算机设备可以获取第一物品标识序列,基于第一物品标识序列对初始降维模型进行自监督训练,得到目标降维模型。降维模型的训练任务是基于第一物品标识序列中第一位置之前的物品标识,预测第一位置上的物品标识,模型在训练任务上的表现越好,说明模型的数据处理能力越好。
步骤S304,通过初始降维模型,在初始物品特征集中,查询第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征,对查询到的各个初始物品特征进行特征增强和特征降维,得到第一位置对应的预测物品特征,基于第一位置对应的预测物品特征,得到第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率;第一位置是从第一物品标识序列的各个物品标识位置中确定的,第一预测概率表征第一位置对应的物品和第一位置对应的前向物品序列之间的预测关联度。
其中,物品标识位置用于表征物品标识在物品标识序列中的位置。可以理解,物品标识序列包括有序排列的多个物品标识,因此物品标识序列中存在多个物品标识位置。第一位置是从第一物品标识序列的各个物品标识位置中确定的。第一位置可以根据需要进行选取。例如,可以将第一物品标识序列的各个物品标识位置分别作为第一位置;可以从第一物品标识序列的各个物品标识位置中,随机获取若干个物品标识位置分别作为第一位置。
在训练过程中,基于历史物品的初始物品特征对下一物品进行特征表示。第一位置对应的预测物品特征是对第一物品标识序列中处于第一位置之前的各个物品标识的初始物品特征进行特征增强和特征降维得到的。例如,在模型训练时,若第一位置为第二个物品标识位置,则对第一物品标识序列中第一个物品标识的初始物品特征进行特征增强和特征降维,也就是,基于第一物品标识序列中第一个物品标识的初始物品特征对第二个物品标识所属物品进行特征表示,得到第二个物品标识位置对应的预测物品特征;若第一位置为第三个物品标识位置,则对第一物品标识序列中第一个物品标识、第二个物品标识的初始物品特征进行特征增强和特征降维,也就是,基于第一物品标识序列中第一个物品标识、第二个物品标识的初始物品特征对第三个物品标识所属物品进行特征表示,得到第三个物品标识位置对应的预测物品特征。预测物品特征用于表征针对下一个物品预测得到的特征表示。
第一位置对应的第一预测概率是基于第一位置对应的预测物品特征得到的。第一位置对应的第一预测概率表征,第一物品标识序列中在第一位置上的物品标识所属的物品和第一位置对应的前向物品序列的预测关联度。第一位置对应的前向物品序列包括第一物品标识序列中处于第一位置之前的各个物品标识对应的物品。也就是,第一位置对应的第一预测概率可以表征,第一物品标识序列中在第一位置上的物品标识所属的物品和处于第一位置之前的各个物品标识对应的物品的预测关联度。可以理解,预测关联度表示物品和前向物品序列的关联程度,预测概率越高表示预测关联度越高、关联程度越高。例如,若第一位置为第二个物品标识位置,基于第二个物品标识位置对应的预测物品特征得到第二个物品标识位置所属物品对应的预测概率,该预测概率表征第二个物品标识位置所属物品和第一个物品标识位置所属物品之间的预测关联度,表征基于第一个物品标识位置所属物品的初始物品特征预测下一个物品为第二个物品标识位置所属物品的概率。
具体地,计算机设备将第一物品标识序列输入初始降维模型,初始降维模型输出第一物品标识序列中在各个第一位置上的物品标识分别对应的预测概率。在初始降维模型中,从初始物品特征集中查询第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征,对第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征进行特征增强和特征降维,得到第一位置对应的预测物品特征,基于第一位置对应的预测物品特征,得到第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率。可以理解,若第一位置有多个,则分别得到第一物品标识序列中在各个第一位置上的物品标识所对应的第一预测概率。
在一个实施例中,基于第一位置对应的预测物品特征得到第一位置对应的物品分布特征,第一位置对应的物品分布特征包括候选物品集中各个物品分别对应的第一预测概率,候选物品集中包括第一物品标识序列中各个物品标识所属的物品,从第一位置对应的物品分布特征中获取第一物品标识序列中在第一位置上的物品标识所对应的预测概率。
例如,候选物品集包括m个物品,第一物品标识序列包括有序排列的n个物品标识。若第一位置为第一物品标识序列中第t个位置,则对序列中第1至第t-1个物品标识对应的初始物品特征进行特征增强和特征降维,得到第t个位置对应的预测物品特征,基于第t个位置对应的预测物品特征,得到第t个位置对应的物品分布特征。第t个位置对应的物品分布特征包括候选物品集中m个物品分别对应的第一预测概率。若序列中第t个位置上的物品标识为物品A,从第t个位置对应的物品分布特征中获取物品A对应的第一预测概率,得到第一物品标识序列中在第t个位置上的物品标识所对应的第一预测概率。
步骤S306,基于第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,得到第一损失。
具体地,在得到第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率后,计算机设备基于第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,得到第一损失。例如,可以基于各个第一预测概率的平均值得到第一损失;可以基于各个第一预测概率的加权平均值得到第一损失;可以基于各个第一预测概率中的中位值得到第一损失;等等。可以理解,模型的训练目标是使得第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率越大越好,在第一位置上的物品标识所对应的第一预测概率越大,说明模型对第一物品标识序列中处于第一位置之前的各个物品标识的初始物品特征经过降维处理后,能够准确预测出第一位置上的物品标识,说明模型能够准确将特征降维,具备降维处理能力。
在一个实施例中,第一物品标识序列包括n个物品标识,用表示,第一损失的计算公式如下:
其中,L1表示第一损失。表示第一物品标识序列中第n个位置上的物品标识,表示由第一物品标识序列中第1到t-1个位置上的物品标识组成的序列。表示在的基础上预测下一物品,下一物品为的预测概率。也就是,t表示第一位置,表示第一物品标识序列中处于第一位置之前的各个物品标识,表示基于第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征,得到的第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率。可以理解,第一损失L1与第一预测概率呈负相关,越大,L1越小。
步骤S308,基于第一损失调整初始降维模型的模型参数,直至满足第一收敛条件,得到目标降维模型。
具体地,计算机设备可以将第一损失进行反向传播来调整初始降维模型的模型参数,通过多次模型迭代训练,直至满足第一收敛条件,得到目标降维模型。
可以理解,在基于第一损失调整模型参数时,无需对初始降维模型中存储的初始物品特征集进行调整,可以对其他模型参数进行调整。可以通过梯度下降算法基于第一损失调整初始降维模型的模型参数。
其中,第一收敛条件是判断降维模型是否达到收敛的条件,第一收敛条件包括但不限于第一损失小于预设损失值、模型迭代次数大于预设迭代次数、或第一损失的变化率小于预设变化率等中的至少一者。
上述实施例中,无需对第一物品标识序列标注训练标签,基于第一物品标识序列对初始降维模型进行自监督训练,即可得到准确的目标降维模型,能够有效提高模型训练效率。在训练过程中,模型对第一物品标识序列中目标位置之前的各个物品标识的相关特征进行降维处理,进而生成第一物品标识序列中目标位置上的物品标识对应的第一预测概率,基于第一物品标识序列中各个物品标识分别对应的第一预测概率生成第一模型损失,基于第一模型损失调整模型参数,使得降维模型能够提高第一物品标识序列中目标位置上的物品标识对应的预测概率,能够基于依次关联的交互物品准确预测下一物品,从而提高模型的降维处理能力,因为模型在预测过程中使用了降维处理。
在一些实施例中,基于第一位置对应的预测物品特征,得到第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率,包括:
将第一位置对应的预测物品特征进行线性变换,得到第一位置对应的初始物品分布特征;初始物品分布特征包括候选物品集中各个候选物品分别对应的特征值;
对初始物品分布特征进行特征值压缩,得到第一位置对应的目标物品分布特征;目标物品分布特征包括候选物品集中各个候选物品分别对应的第一预测概率,候选物品集包括第一物品标识序列中各个物品标识分别对应的物品;
从目标物品分布特征中,确定第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率。
其中,线性变换用于将预测物品特征映射到预设维度的向量空间。将预测物品特征进行线性变换得到初始物品分布特征,初始物品分布特征的维度为预设维度,初始物品分布特征的维度等于候选物品集的大小,候选物品集的大小反映候选物品集中物品的数量。
特征值压缩用于将特征值的数值压缩到预设范围内。例如,可以是将特征值的数值压缩到[0,1]中,从而得到预测概率,可以通过Softmax函数(归一化指数函数)进行特征值压缩。对第一位置对应的初始物品分布特征进行特征值压缩,得到第一位置对应的目标物品分布特征。
具体地,在基于第一位置对应的预测物品特征得到第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率时,先基于第一位置对应的预测物品特征得到候选物品集中各个物品分别对应的第一预测概率,候选物品集包括第一物品标识序列中各个物品标识分别对应的物品,再从候选物品集中各个物品分别对应的第一预测概率中,获取第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率。
计算机设备先将第一位置对应的预测物品特征进行线性变换,得到第一位置对应的初始物品分布特征,初始物品分布特征为向量维度等于候选物品集大小的向量,初始物品分布特征包括候选物品集中各个物品分别对应的特征值。然后,对初始物品分布特征进行特征值压缩,得到第一位置对应的目标物品分布特征,目标物品分布特征为向量维度等于候选物品集大小的向量,目标物品分布特征包括候选物品集中各个物品分别对应的第一预测概率。最终,从目标物品分布特征中获取第一物品标识序列在第一位置上的物品标识所属物品对应的第一预测概率,作为第一物品标识序列在第一位置上的物品标识所对应的第一预测概率。
上述实施例中,通过线性变换和特征值压缩可以将预测物品特征转换为候选物品集中各个物品分别对应的预测概率,通过预测概率可以直观得到候选物品集中各个物品分别和前向物品序列的预测关联度,通过预测概率可以直观得到候选物品集中各个物品属于下一物品的概率。
在一些实施例中,基于第一损失调整初始降维模型的模型参数,直至满足第一收敛条件,得到目标降维模型,包括:
基于第一损失调整初始降维模型中投影层、修正层和输出层的模型参数,直至满足第一收敛条件,得到目标降维模型。
其中,初始降维模型包括嵌入层、投影层、修正层和输出层,嵌入层用于查询初始物品特征。嵌入层中存储有初始物品特征集。将第一物品标识序列输入初始降维模型,在初始降维模型中,第一物品标识序列先输入嵌入层,嵌入层输出查询到的初始物品特征。投影层用于特征降维,修正层用于特征增强。若先进行特征降维再进行特征增强,则将嵌入层输出的初始物品特征输入投影层,将投影层输出的中间物品特征输入修正层,修正层输出预测物品特征。若先进行特征增强再进行特征降维,则将嵌入层输出的初始物品特征输入修正层,将修正层输出的中间物品特征输入投影层,投影层输出预测物品特征。输出层用于输出第一预测概率。将预测物品特征输入输出层,输出层输出第一预测概率。
具体地,初始降维模型包括嵌入层、投影层、修正层和输出层。嵌入层用于查询初始物品特征,无需调整参数,投影层用于特征降维,修正层用于特征增强,输出层用于输出第一预测概率,投影层、修正层和输出层需要调整参数。因此,计算机设备基于第一损失调整初始降维模型的模型参数时,主要是将第一损失进行反向传播来调整初始降维模型中投影层、修正层和输出层的模型参数。
可以理解,目标降维模型包括嵌入层、投影层、修正层和输出层。将当前物品的当前物品标识序列输入目标降维模型,若先进行特征降维再进行特征增强,则目标降维模型的修正层输出当前物品的目标物品特征,若先进行特征增强再进行特征降维,则目标降维模型的投影层输出当前物品的目标物品特征。
上述实施例中,在调整初始降维模型的模型参数时,无需调整初始降维模型中的嵌入层,只需调整初始降维模型中的投影层、修正层和输出层,嵌入层包括初始物品特征集,初始物品特征集具有较大的数据量,通过有针对性地调整能够在保障模型训练质量的基础上有效提高模型训练速度。
在一个实施例中,参考图4,初始降维模型包括依次连接的输入层、嵌入层、投影层、修正层和输出层。输入层用于接收输入的第一物品标识序列,将第一物品标识序列输入至嵌入层。可以理解,第一物品标识序列一般需要包括k个物品标识(即物品ID),若第一物品标识序列中物品标识的个数不足k个,则将后续不满的位置用掩码进行填充。嵌入层预先嵌入了初始物品特征集,嵌入层用于从初始物品特征集中查询相应的初始物品特征。
将第一物品标识序列输入初始降维模型,输入层将第一物品标识序列输入嵌入层,嵌入层查询第一物品标识序列中各个物品标识分别对应的初始物品特征,输出各个初始物品特征,将各个初始物品特征输入投影层。投影层用于特征降维。投影层可以是通过全连接层实现线性投影,将高维嵌入表征映射到低维嵌入表征上。例如,将原有4096维的高维表征通过一个全连接层映射到32维的低维度表征上。
将投影层的输出输入修正层,修正层用于特征增强。修正层可以是Transformer层,Transformer层主要是由带掩码机制的N个Transformer的解码块(decoding block)堆叠构建的更深层次的解码器,以提高模型的性能和泛化能力。每个解码块(decodingblock)包含三个部分,第一部分为带掩码机制的多头自注意力机制(Masked Multi-HeadSelf-Attention),第二部分为前馈神经网络(Feedforward Neural Network),第三部分为残差连接(Residual Connection)和层归一化(Layer Normalization)。第一部分通过对输入序列进行多头自注意力计算,来捕捉输入序列中不同位置之间的依赖关系。掩码机制是用于在自注意力机制中避免使用未来信息。例如,若第一位置为第三个物品标识位置,则通过掩码机制对输入序列中第三个物品标识及其之后的物品特征进行屏蔽,使得修正层对输入序列中前两个物品特征进行特征增强。第二部分通过对每个位置的表示进行全连接层的计算,来增强每个位置的特征表达能力。第三部分通过将前面两个部分的输出与输入序列进行残差连接,并对残差连接后的结果进行层归一化,来加速模型的训练和提高模型的性能。修正层可以输出各个第一位置分别对应的预测物品特征。
修正层将预测物品特征输入输出层,输出层将修正层的输出映射到一个维度等于候选物品集大小的向量空间,再通过Softmax函数将这个向量空间中的每个元素转换为一个概率值(表示属于下一物品的第一预测概率),得到目标物品分布特征。输出层可以输出各个第一位置分别对应的目标物品分布特征。
将第一物品标识序列输入初始降维模型,得到第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,基于第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,得到第一损失,基于第一损失调整初始降维模型中投影层、修正层和输出层的模型参数,直至满足第一收敛条件,得到目标降维模型。
在一个实施例中,参考图5,初始降维模型包括依次连接的输入层、嵌入层、修正层、投影层和输出层。输入层用于接收输入的第一物品标识序列,将第一物品标识序列输入至嵌入层。将第一物品标识序列输入初始降维模型,输入层将第一物品标识序列输入嵌入层,嵌入层查询第一物品标识序列中各个物品标识分别对应的初始物品特征,输出各个初始物品特征,将各个初始物品特征输入修正层。修正层用于特征增强。修正层可以是Transformer层,Transformer层主要是由带掩码机制的N个Transformer的解码块(decoding block)堆叠构建的更深层次的解码器,以提高模型的性能和泛化能力。将修正层的输出输入投影层,投影层用于特征降维。投影层可以是通过全连接层实现线性投影,将高维嵌入表征映射到低维嵌入表征上。投影层将预测物品特征输入输出层,输出层将投影层的输出映射到一个维度等于候选物品集大小的向量空间,再通过Softmax函数将这个向量空间中的每个元素转换为一个概率值(表示属于下一物品的第一预测概率),得到目标物品分布特征。输出层可以输出各个第一位置分别对应的目标物品分布特征。
在一些实施例中,物品数据处理方法还包括:
获取候选物品集中各个候选物品分别对应的物品描述文本;
通过大语言模型,对物品描述文本进行特征提取,得到各个候选物品分别对应的初始物品特征;
基于各个候选物品分别对应的初始物品特征,得到初始物品特征集。
其中,物品的物品描述文本是指描述物品信息的文本。例如,物品描述文本可以是物品介绍文本。大语言模型用于处理文本数据的预训练模型。
具体地,计算机设备可以获取候选物品集中各个候选物品分别对应的物品描述文本,将各个候选物品分别对应的物品描述文本分别输入大语言模型进行特征提取,得到各个候选物品分别对应的初始物品特征,将各个候选物品分别对应的初始物品特征组成初始物品特征集。
上述实施例中,大语言模型具有较强的文本处理能力,通过大语言模型对物品的物品描述文本进行特征提取,得到物品的初始物品特征,能够保障初始物品特征的准确性。
在一个实施例中,参考图6,大语言模型包括依次连接的输入层、嵌入层、Transformer层和输出层。输入层用于接收输入的文本序列。嵌入层用于获取文本序列中各个词分别对应的词特征。Transformer层用于进一步的特征处理。Transformer层主要是由带掩码机制的N个Transformer的解码块(decoding block)堆叠构建的更深层次的解码器,以提高模型的性能和泛化能力。输出层用于基于Transformer层输出的特征得到大语言模型的输出结果。
在具体应用时,获取物品的各种文本描述,例如标题、标签、简介等,将这些文本描述拼接在一起,输入大语言模型,从大语言模型中Transformer层的最后一个Transform解码块的输出中,得到物品的初始物品特征,初始物品特征为高维的语义嵌入表征。
在一些实施例中,基于目标物品和交互物品各自的目标物品特征之间的特征距离,从目标对象的交互物品序列中确定目标物品的关联物品序列,包括:
基于目标物品和交互物品各自的目标物品特征之间的特征距离,按照特征距离从小到大,从目标对象的交互物品序列中确定目标物品的多个关联物品;将各个关联物品按照与目标对象的交互时间进行排序,得到目标物品的关联物品序列。
具体地,计算机设备可以计算目标物品的目标物品特征分别和目标对象的各个交互物品的目标物品特征之间的特征距离,按照特征距离从小到大,从目标对象的交互物品序列中确定目标物品的多个关联物品。例如,获取特征距离较小的n个交互物品作为目标物品的关联物品。进而,将各个关联物品按照与目标对象的交互时间进行排序,得到目标物品的关联物品序列。
上述实施例中,基于目标物品和交互物品各自的目标物品特征之间的特征距离,从目标对象的交互物品序列中选取特征距离较小的交互物品作为目标物品的关联物品,目标物品和关联物品为比较相关的物品。将各个关联物品按照与目标对象的交互时间进行排序,得到目标物品的关联物品序列。目标物品的关联物品序列可以在一定程度上反映目标对象针对目标物品的相关行为,有助于后续的嵌入表征。
在一些实施例中,如图7所示,物品数据处理方法还包括:
步骤S702,获取第二物品标识序列,将第二物品标识序列输入初始序列模型;第二物品标识序列是基于第二训练对象的交互物品序列得到的,初始序列模型包括预设物品特征集。
其中,第二物品标识序列是用于训练序列模型的训练物品标识序列。训练物品标识序列是将训练对象对应的多个交互物品的物品标识按照交互时间进行排序得到的。
第二物品标识序列是基于第二训练对象的交互物品序列得到的。第二训练对象的相关数据用于训练序列模型。初始序列模型是指待训练的序列模型。对初始序列模型进行训练,得到目标序列模型。目标序列模型是完成训练的序列模型。在模型训练时,初始序列模型的输入数据是第二物品标识序列,输出数据是物品标识对应的第二预测概率。初始序列模型包括预设物品特征集,预设物品特征集包括候选物品集中各个物品分别对应的预设物品特征。可以理解,预设物品特征集可以是初始物品特征集,初始物品特征集包括候选物品集中各个物品分别对应的初始物品特征。预设物品特征集可以是目标物品特征集,目标物品特征集包括候选物品集中各个物品分别对应的目标物品特征。
具体地,计算机设备可以获取第二物品标识序列,基于第二物品标识序列对初始序列模型进行自监督训练,得到目标序列模型。序列模型的训练任务是基于第二物品标识序列中第二位置之前的物品标识,预测第二位置上的物品标识,模型在训练任务上的表现越好,说明模型的数据处理能力越好。
步骤S704,通过初始序列模型,在预设物品特征集中,查询第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到第二位置对应的预测物品特征,基于第二位置对应的预测物品特征,得到第二物品标识序列中在第二位置上的物品标识所对应的第二预测概率;第二位置是从第二物品标识序列的各个物品标识位置中确定的,第二预测概率表征第二位置对应的物品和第二位置对应的前向物品序列之间的预测关联度。
其中,第二位置是从第二物品标识序列的各个物品标识位置中确定的。第二位置可以根据需要进行选取。例如,可以将第二物品标识序列的各个物品标识位置分别作为第二位置;可以从第二物品标识序列的各个物品标识位置中,随机获取若干个物品标识位置分别作为第二位置。
在训练过程中,基于历史物品的预设物品特征对下一物品进行特征表示。第二位置对应的预测物品特征是对第二物品标识序列中处于第二位置之前的各个物品标识的预设物品特征进行特征交互得到的。例如,在模型训练时,若第二位置为第二个物品标识位置,则对第二物品标识序列中第二个物品标识的预设物品特征进行特征交互,也就是,基于第二物品标识序列中第二个物品标识的预设物品特征对第二个物品标识所属物品进行特征表示,得到第二个物品标识位置对应的预测物品特征;若第二位置为第三个物品标识位置,则对第二物品标识序列中第二个物品标识、第二个物品标识的预设物品特征进行特征交互,也就是,基于第二物品标识序列中第二个物品标识、第二个物品标识的预设物品特征对第三个物品标识所属物品进行特征表示,得到第三个物品标识位置对应的预测物品特征。预测物品特征用于表征针对下一个物品预测得到的特征表示。
第二位置对应的第二预测概率是基于第二位置对应的预测物品特征得到的。第二位置对应的第二预测概率表征第二物品标识序列中在第二位置上的物品标识所属的物品和第二位置对应的前向物品序列的预测关联度。第二位置对应的前向物品序列包括第二物品标识序列中处于第二位置之前的各个物品标识对应的物品。也就是,第二位置对应的第二预测概率可以表征,第二物品标识序列中在第二位置上的物品标识所属的物品和处于第二位置之前的各个物品标识对应的物品的预测关联度。可以理解,预测关联度表示物品和前向物品序列的关联程度,预测概率越高表示预测关联度越高、关联程度越高。例如,若第二位置为第二个物品标识位置,基于第二个物品标识位置对应的预测物品特征得到第二个物品标识位置所属物品对应的预测概率,该预测概率表征第二个物品标识位置所属物品和第二个物品标识位置所属物品之间的预测关联度,表征基于第二个物品标识位置所属物品的预设物品特征预测下一个物品为第二个物品标识位置所属物品的概率。
具体地,计算机设备将第二物品标识序列输入初始序列模型,初始序列模型输出第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率。在初始序列模型中,从预设物品特征集中查询第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征,对第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征进行特征交互,得到第二位置对应的预测物品特征,基于第二位置对应的预测物品特征,得到第二物品标识序列中在第二位置上的物品标识所对应的第二预测概率。可以理解,若第二位置有多个,则分别得到第二物品标识序列中在各个第二位置上的物品标识所对应的第二预测概率。
在一个实施例中,基于第二位置对应的预测物品特征得到第二位置对应的物品分布特征,第二位置对应的物品分布特征包括候选物品集中各个物品分别对应的第二预测概率,候选物品集中包括第二物品标识序列中各个物品标识所属的物品,从第二位置对应的物品分布特征中获取第二物品标识序列中在第二位置上的物品标识所对应的预测概率。
步骤S706,基于第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,得到第二损失。
具体地,在得到第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率后,计算机设备基于第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,得到第二损失。例如,可以基于各个第二预测概率的平均值得到第二损失;可以基于各个第二预测概率的加权平均值得到第二损失;可以基于各个第二预测概率中的中位值得到第二损失;等等。可以理解,模型的训练目标是使得第二物品标识序列中在第二位置上的物品标识所对应的第二预测概率越大越好,在第二位置上的物品标识所对应的第二预测概率越大,说明模型对第二物品标识序列中处于第二位置之前的各个物品标识的初始物品特征经过特征处理后,能够准确预测出第二位置上的物品标识,说明模型能够准确建模嵌入表征,从而准确预测下一物品。
在一个实施例中,第二物品标识序列包括T个物品标识,用表示,第二损失的计算公式如下:
其中,L2表示第二损失。表示第二物品标识序列中第t个位置上的物品标识,表示由第二物品标识序列中第1到t-1个位置上的物品标识组成的序列。表示在的基础上预测下一物品,下一物品为的预测概率。也就是,t表示第二位置,表示第二物品标识序列中处于第二位置之前的各个物品标识,表示基于第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征,得到的第二物品标识序列中在第二位置上的物品标识所对应的第二预测概率。可以理解,第二损失L2与第二预测概率呈负相关,越大,L2越小。
步骤S708,基于第二损失调整初始序列模型的模型参数,直至满足第二收敛条件,得到目标序列模型。
具体地,计算机设备可以将第二损失进行反向传播来调整初始序列模型的模型参数,通过多次模型迭代训练,直至满足第二收敛条件,得到目标序列模型。
可以理解,在基于第二损失调整模型参数时,无需对初始序列模型中存储的预设物品特征集进行调整,可以对其他模型参数进行调整。可以通过梯度下降算法基于第二损失调整初始序列模型的模型参数。
其中,第二收敛条件是判断序列模型是否达到收敛的条件,第二收敛条件包括但不限于第二损失小于预设损失值、模型迭代次数大于预设迭代次数、或第二损失的变化率小于预设变化率等中的至少一者。
上述实施例中,无需对第二物品标识序列标注训练标签,基于第二物品标识序列对初始序列模型进行自监督训练,即可得到准确的目标序列模型,能够有效提高模型训练效率。在训练过程中,模型对第二物品标识序列中目标位置之前的各个物品标识的相关特征进行特征交互,进而生成第二物品标识序列中目标位置上的物品标识对应的第二预测概率,基于第二物品标识序列中各个物品标识分别对应的第二预测概率生成第二模型损失,基于第二模型损失调整模型参数,使得序列模型能够提高第二物品标识序列中目标位置上的物品标识对应的预测概率,能够基于依次关联的交互物品准确预测下一物品,从而提高模型的嵌入表征建模能力、特征交互能力,因为模型在预测过程中使用了特征交互。
在一些实施例中,基于第二损失调整初始序列模型的模型参数,直至满足第二收敛条件,得到目标序列模型,包括:
基于第二损失调整初始序列模型中的交互层和输出层的模型参数,直至满足第二收敛条件,得到目标序列模型。
其中,初始序列模型包括嵌入层、交互层和输出层。嵌入层用于查询预设物品特征。嵌入层用于查询预设物品特征。嵌入层中存储有预设物品特征集。交互层用于特征交互。输出层用于输出第二预测概率。将第二物品标识序列输入初始序列模型,在初始序列模型中,第二物品标识序列先输入嵌入层,嵌入层输出查询到的预设物品特征,将嵌入层输出的预设物品特征输入交互层,将交互层的输出的预设物品特征输入输出层,输出层输出第二预测概率。
具体地,初始序列模型包括嵌入层、交互层和输出层。嵌入层用于查询预设物品特征,无需调整参数,交互层用于特征交互,输出层用于输出第二预测概率,交互层和输出层需要调整参数。因此,计算机设备基于第二损失调整初始序列模型的模型参数时,主要是将第二损失进行反向传播来调整初始序列模型中交互层和输出层的模型参数。
可以理解,目标序列模型包括嵌入层、交互层和输出层。将联合物品特征输入目标序列模型,目标序列模型的交互层输出联合物品特征的物品序列特征。
上述实施例中,在调整初始序列模型的模型参数时,无需调整初始序列模型中的嵌入层,只需调整初始序列模型中的交互层和输出层,嵌入层包括预设物品特征集,预设物品特征集具有较大的数据量,通过有针对性地调整能够在保障模型训练质量的基础上有效提高模型训练速度。
在一个实施例中,参考图8,初始序列模型包括依次连接的输入层、嵌入层、交互层和输出层。输入层用于接收输入的第二物品标识序列,将第二物品标识序列输入至嵌入层。嵌入层用于从预设物品特征集中查询相应的预设物品特征。将第二物品标识序列输入初始序列模型,输入层将第二物品标识序列输入嵌入层,嵌入层查询第二物品标识序列中各个物品标识分别对应的预设物品特征,输出各个预设物品特征,将各个预设物品特征输入交互层。交互层用于特征交互。交互层可以是Transformer层,Transformer层主要是由带掩码机制的N个Transformer的解码块(decoding block)堆叠构建的更深层次的解码器,以提高模型的性能和 泛化能力。交互层可以输出各个第二位置分别对应的预测物品特征。交互层将预测物品特征输入输出层,输出层将交互层的输出映射到一个维度等于候选物品集大小的向量空间,再通过Softmax函数将这个向量空间中的每个元素转换为一个概率值(表示属于下一物品的第二预测概率),得到目标物品分布特征。输出层可以输出各个第二位置分别对应的目标物品分布特征。
将第二物品标识序列输入初始序列模型,得到第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,基于第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,得到第二损失,基于第二损失调整初始序列模型中交互层和输出层的模型参数,直至满足第二收敛条件,得到目标序列模型。
在一些实施例中,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征,包括:
按照联合物品序列的物品顺序,将查询到的各个预设物品特征进行组合,得到预设物品特征序列;
对预设物品特征序列进行特征交互,得到物品交互特征序列;物品交互特征序列包括与联合物品序列的物品数量匹配的物品交互特征;
从物品交互特征序列中,获取在目标物品的物品位置上的物品交互特征,作为联合物品序列的物品序列特征。
具体地,计算机设备将目标物品拼接在关联物品序列之后,得到联合物品序列,将联合物品序列输入目标序列模型。在目标序列模型中,先查询联合物品序列中各个物品分别对应的预设物品特征,按照联合物品序列中各个物品的排列顺序,将查询到的各个预设物品特征进行组合,得到预设物品特征序列。进而,对预设物品特征序列进行特征交互,得到物品交互特征序列,物品交互特征序列包括与联合物品序列的物品数量匹配的物品交互特征。例如,联合物品序列包括5个物品,预设物品特征序列包括这5个物品分别对应的预设物品特征,物品交互特征序列包括5个物品交互特征。在物品交互特征序列中,某个位置的物品交互特征可以表征该位置对应的物品和该位置之前的物品之间的特征交互结果。最终,从物品交互特征序列中,获取在目标物品的物品位置上的物品交互特征,作为联合物品序列的物品序列特征,也就是,获取最后一个物品交互特征作为联合物品序列的物品序列特征。
例如,将目标物品的关联物品序列与目标物品拼接在一起,得到联合物品序列。将输入目标序列模型,目标序列模型的Transformer层输出一个的向量列表(即物品交互特征序列),其中第k+1个位置向量的,即为的嵌入表征(即物品序列特征)。
上述实施例中,联合物品序列是目标物品针对目标对象的相关序列,目标序列模型在对联合物品序列进行数据处理时,按照联合物品序列的物品顺序,将查询到的各个预设物品特征进行组合,得到预设物品特征序列,对预设物品特征序列进行特征交互,得到物品交互特征序列,从物品交互特征序列中,获取在目标物品的物品位置上的物品交互特征,作为联合物品序列的物品序列特征,能够将目标物品的预设物品特征和其他物品的预设物品特征之间的特征交互结果,作为联合物品序列的物品序列特征,保障物品序列特征的准确性。
在一些实施例中,预设物品特征集中的预设物品特征为物品的目标物品特征,物品的目标物品特征是对物品的初始物品特征进行降维处理得到的。
具体地,物品的初始物品特征为物品的高维嵌入表征,物品的目标物品特征为物品的低维嵌入表征。目标序列模型包括预设物品特征集,预设物品特征集中的预设物品特征为物品的目标物品特征,预设物品特征为低维嵌入表征,能够在保障模型数据处理准确性的基础上有效提高模型的数据处理效率。
在一个实施例中,序列模型包括依次连接的输入层、嵌入层、交互层和输出层。参考图9,嵌入层可以包括初始物品特征集,初始物品特征集包括候选物品集中各个候选物品对应的初始物品特征。参考图10,嵌入层也可以包括目标物品特征集,目标物品特征集包括候选物品集中各个候选物品对应的目标物品特征。可以理解,初始物品特征为高维嵌入表征,目标物品特征为低维嵌入表征,若序列模型使用高维嵌入表征,那么通过序列模型得到的物品序列特征的信息表达能力会更强,若序列模型使用低维嵌入表征,那么通过序列模型得到的物品序列特征的复杂度会较低,有助于提高后续计算的效率。
在一些实施例中,物品数据处理方法还包括:
获取目标物品的物品特征和目标对象的对象特征;
将物品序列特征、目标物品的物品特征、目标对象的对象特征输入目标匹配模型,得到目标物品和目标对象之间的匹配度。
其中,匹配模型是机器学习模型,用于确定物品和对象之间的匹配度。匹配模型的输入数据包括待匹配物品的物品特征、待匹配对象的对象特征、待匹配物品和待匹配对象之间的融合特征。匹配模型的输出数据包括待匹配物品和待匹配对象之间的匹配度。待匹配物品的物品特征可以是预设物品特征、初始物品特征、目标物品特征等基于物品自身信息得到的特征。待匹配对象的对象特征可以是基于对象自身信息得到的特征,例如,对对象的对象属性进行特征提取,得到对象特征,待匹配对象的对象特征也可以是基于对象的交互物品得到的特征,例如,对对象的交互物品进行特征提取,得到对象特征。待匹配物品和待匹配对象之间的融合特征是基于待匹配物品和待匹配对象的交互物品序列得到的。例如,获取待匹配物品的物品特征,获取待匹配对象的交互物品序列中各个交互物品的物品特征,将待匹配物品的物品特征和各个交互物品的物品特征进行融合,得到待匹配物品和待匹配对象之间的融合特征。又例如,待匹配物品和待匹配对象之间的融合特征可以是,基于待匹配物品和待匹配对象的交互物品序列确定的联合物品序列所对应的序列特征。可以理解,基于待匹配物品和待匹配对象的交互物品序列确定的联合物品序列所对应的序列特征的获取过程,可以参考基于目标物品和目标对象的交互物品序列确定的联合物品序列所对应的序列特征的获取过程。
目标匹配模型是完成训练的匹配模型。目标匹配模型是基于存在训练标签的训练样本对,对初始匹配模型进行有监督训练得到的。初始匹配模型是待训练的匹配模型。训练样本对包括训练物品的物品特征、训练对象的对象特征、训练物品和训练对象之间的融合特征。训练样本对所对应的训练标签用于表示训练物品和训练对象之间是否匹配。例如,若获取训练对象交互过的物品作为训练物品,则认为训练物品和训练对象是相互匹配的,训练标签为正标签;若获取训练对象未交互过的物品作为训练物品,则认为训练物品和训练对象是不匹配的,训练标签为负标签。
具体地,计算机设备可以获取目标物品的物品特征,获取目标对象的对象特征,将联合物品序列的物品序列特征、目标物品的物品特征、目标对象的对象特征输入目标匹配模型,经过目标匹配模型的数据处理,目标匹配模型输出目标物品和目标对象之间的匹配度。基于目标物品和目标对象之间的匹配度可以确定是否向目标对象推荐目标物品。例如,若目标物品和目标对象之间的匹配度大于匹配度阈值,则将向目标对象推荐目标物品。
可以理解,匹配模型也可以称为排序模型。若目标物品有多个,通过目标匹配模型可以确定各个目标物品分别和目标对象之间的匹配度,再按照匹配度从大到小,将各个目标物品进行排序,得到目标对象对应的推荐物品序列。可以按照推荐物品序列,向目标对象推荐物品。
上述实施例中,通过本申请方法得到的物品序列特征是目标物品和目标对象之间更准确的融合特征,将物品序列特征、目标物品的物品特征、目标对象的对象特征输入目标匹配模型,目标匹配模型能够输出更准确的匹配度。基于更准确的匹配度能够进行更准确、更有效的物品推荐。
在一个具体的实施例中,本申请方法可以应用于物品推荐场景。在推荐场景中,超长序列建模具有重要意义,它可以捕捉用户浏览物品间的长期依赖关系,更好地理解用户复杂的行为,更好地理解用户的行为模式和兴趣偏好,从而提高推荐的准确性、提供更个性化的推荐。本申请提出了一种对用户超长的行为序列与目标物品进行联合嵌入表征建模的方法。利用用户浏览的物品序列数据,基于大语言模型的自回归预训练方式,通过大语言模型抽取出由用户的超长序列与目标物品构建的序列的嵌入表征。
参考图11,针对用户浏览的物品序列中的物品和目标物品,提取物品的低维嵌入表征。具体地,将物品的各类文本信息拼接起来,形成物品的一段文本描述。将物品的文本描述输入大语言模型,通过大语言模型抽取出这段文字描述的高维嵌入表征。将物品的高维嵌入表征输入降维模型,通过降维模型进行降维处理,得到物品的低维嵌入表征。这样,充分利用现有的大语言模型得到物品的高质量嵌入表征,从而服务于后续的相关序列检索与行为建模。
从用户超长序列(即用户浏览的物品序列)中提取目标物品的相关子序列。具体地,根据目标物品与用户超长序列中物品在模态嵌入表征空间的相关性,进行最近邻检索,从而找到与目标物品模态特征最为相关的子序列。计算目标物品与用户超长序列中每个物品在嵌入空间中的距离,并找到目标物品距离最近的物品子集,并按照用户的浏览时间排序得到目标物品的相关子序列。这样,通过相关子序列的检索可以避免对整个用户超长序列直接进行建模,从而极大地降低了对行为建模的算法时间与空间复杂度。
基于用户浏览的物品序列训练序列模型。具体地,将物品的低维嵌入表征放入大语言模型结构中,得到序列模型,基于用户浏览的物品序列,通过自回归预训练方式,对序列模型进行训练。自回归预训练方式是指基于物品序列中的目标位置之前的物品预测目标位置上的物品,训练目标是最大化目标位置上的物品的预测概率。在模型训练时,模型基于序列中第1至第t-1个物品标识的低维嵌入表征预测序列中第t个物品标识属于序列中第t个位置的概率,模型的训练目标是在最大化序列中第t个物品标识属于序列中第t个位置的概率。序列模型是通过用户的行为序列训练得到的,无需专门构建复杂的训练数据。
在训练序列模型和提取目标物品的相关子序列后,将目标物品拼接在相关子序列之后,得到用户与目标物品的相关行为序列。将用户与目标物品的相关行为序列输入到完成训练的序列模型中,即可得到用户与目标物品相关的行为序列的序列嵌入表征。这样,使用大语言模型的自回归结构更加自然地建模用户超长序列与目标物品组成的序列的嵌入表征。通过完成训练的序列模型,可以高效建模用户的与目标物品相关的行为序列的嵌入表征,从而更好地理解用户的兴趣、习惯和行为趋势。
基于序列嵌入表征可以计算用户和目标物品之间的匹配分数,根据匹配分数进行物品推荐。具体地,将目标物品的嵌入表征、用户的嵌入表征、序列嵌入表征输入匹配模型,匹配模型输出用户和目标物品之间的匹配分数,获取匹配分数较高的目标物品作为推荐物品,按照匹配分数从高到低,将各个推荐物品有序推荐给用户。
可以理解,物品推荐可以是主动向用户进行推荐,例如,用户在终端上打开或登录应用后,应用主动向用户推荐物品。物品推荐也可以是被动向用户进行推荐,例如,用户在终端上打开或登录应用后,用户在搜索栏中输入搜索信息,应用基于搜索信息向用户推荐物品,也就是,基于搜索信息向用户返回搜索结果。
应用可以是指安装在终端中的客户端,客户端(又可称为应用客户端、APP客户端)是指安装并运行在终端中的程序;应用也可以是指免安装的应用程序,即无需下载安装即可使用的应用程序,这类应用程序又可以称为小程序,它通常作为子程序运行于客户端中;应用还可以是指通过浏览器打开的web应用程序;等等。
可以理解,本申请方法可以应用于各种应用中的物品推荐。例如,应用于视频应用中的视频推荐;应用于社交应用中的广告推荐;应用于搜索应用中的内容搜索;等等。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的物品数据处理方法的物品数据处理装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个物品数据处理装置实施例中的具体限定可以参见上文中对于物品数据处理方法的限定,在此不再赘述。
在一个实施例中,如图12所示,提供了一种物品数据处理装置,包括:数据获取模块1202、关联物品确定模块1204、物品联合模块1206和序列特征提取模块1208,其中:
数据获取模块1202,用于获取目标物品和目标对象的交互物品序列。
关联物品确定模块1204,用于从目标对象的交互物品序列中确定目标物品的关联物品序列。
物品联合模块1206,用于基于关联物品序列和目标物品,得到联合物品序列,将联合物品序列输入目标序列模型;目标序列模型包括预设物品特征集,目标序列模型是基于训练对象的交互物品序列训练得到的。
序列特征提取模块1208,用于通过目标序列模型,在预设物品特征集中,查询联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出联合物品序列的物品序列特征;物品序列特征,用于确定目标物品和目标对象之间的匹配度。
在一个实施例中,关联物品确定模块1204还用于:
针对目标物品和目标对象的交互物品序列中的交互物品,提取物品的目标物品特征;目标物品特征是对物品的初始物品特征进行降维处理得到的;
基于目标物品和交互物品各自的目标物品特征之间的特征距离,从目标对象的交互物品序列中确定目标物品的关联物品序列。
在一个实施例中,关联物品确定模块1204还用于:
基于当前物品的物品标识生成当前物品标识序列,将当前物品标识序列输入目标降维模型;当前物品为目标物品或目标对象的交互物品序列中的交互物品,目标降维模型包括初始物品特征集;
通过目标降维模型,在初始物品特征集中,查询当前物品的物品标识对应的初始物品特征,对查询到的初始物品特征进行特征增强和特征降维,输出当前物品的目标物品特征。
在一个实施例中,物品数据处理装置还用于:
获取第一物品标识序列,将第一物品标识序列输入初始降维模型;第一物品标识序列是基于第一训练对象的交互物品序列得到的,初始降维模型包括初始物品特征集;
通过初始降维模型,在初始物品特征集中,查询第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征,对查询到的各个初始物品特征进行特征增强和特征降维,得到第一位置对应的预测物品特征,基于第一位置对应的预测物品特征,得到第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率;第一位置是从第一物品标识序列的各个物品标识位置中确定的,第一预测概率表征第一位置对应的物品和第一位置对应的前向物品序列之间的预测关联度;
基于第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,得到第一损失;
基于第一损失调整初始降维模型的模型参数,直至满足第一收敛条件,得到目标降维模型。
在一个实施例中,物品数据处理装置还用于:
将第一位置对应的预测物品特征进行线性变换,得到第一位置对应的初始物品分布特征;初始物品分布特征包括候选物品集中各个候选物品分别对应的特征值;
对初始物品分布特征进行特征值压缩,得到第一位置对应的目标物品分布特征;目标物品分布特征包括候选物品集中各个候选物品分别对应的第一预测概率,候选物品集包括第一物品标识序列中各个物品标识分别对应的物品;
从目标物品分布特征中,确定第一物品标识序列中在第一位置上的物品标识所对应的第一预测概率。
在一个实施例中,初始降维模型包括嵌入层、投影层、修正层和输出层,嵌入层用于查询初始物品特征,投影层用于特征降维,修正层用于特征增强,输出层用于输出第一预测概率。
在一个实施例中,物品数据处理装置还用于:
基于第一损失调整初始降维模型中投影层、修正层和输出层的模型参数,直至满足第一收敛条件,得到目标降维模型。
在一个实施例中,物品数据处理装置还用于:
获取候选物品集中各个候选物品分别对应的物品描述文本;
通过大语言模型,对物品描述文本进行特征提取,得到各个候选物品分别对应的初始物品特征;
基于各个候选物品分别对应的初始物品特征,得到初始物品特征集。
在一个实施例中,关联物品确定模块1204还用于:
基于目标物品和交互物品各自的目标物品特征之间的特征距离,按照特征距离从小到大,从目标对象的交互物品序列中确定目标物品的多个关联物品;
将各个关联物品按照与目标对象的交互时间进行排序,得到目标物品的关联物品序列。
在一个实施例中,物品数据处理装置还用于:
获取第二物品标识序列,将第二物品标识序列输入初始序列模型;第二物品标识序列是基于第二训练对象的交互物品序列得到的,初始序列模型包括预设物品特征集;
通过初始序列模型,在预设物品特征集中,查询第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到第二位置对应的预测物品特征,基于第二位置对应的预测物品特征,得到第二物品标识序列中在第二位置上的物品标识所对应的第二预测概率;第二位置是从第二物品标识序列的各个物品标识位置中确定的,第二预测概率表征第二位置对应的物品和第二位置对应的前向物品序列之间的预测关联度;
基于第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,得到第二损失;
基于第二损失调整初始序列模型的模型参数,直至满足第二收敛条件,得到目标序列模型。
在一个实施例中,初始序列模型包括嵌入层、交互层和输出层,嵌入层用于查询预设物品特征,交互层用于特征交互,输出层用于输出第二预测概率。物品数据处理装置还用于:
基于第二损失调整初始序列模型中的交互层和输出层的模型参数,直至满足第二收敛条件,得到目标序列模型。
在一个实施例中,序列特征提取模块1208还用于:
按照联合物品序列的物品顺序,将查询到的各个预设物品特征进行组合,得到预设物品特征序列;
对预设物品特征序列进行特征交互,得到物品交互特征序列;物品交互特征序列包括与联合物品序列的物品数量匹配的物品交互特征;
从物品交互特征序列中,获取在目标物品的物品位置上的物品交互特征,作为联合物品序列的物品序列特征。
在一个实施例中,预设物品特征集中的预设物品特征为物品的目标物品特征,物品的目标物品特征是对物品的初始物品特征进行降维处理得到的。
在一个实施例中,物品数据处理装置还用于:
获取目标物品的物品特征和目标对象的对象特征;
将物品序列特征、目标物品的物品特征、目标对象的对象特征输入目标匹配模型,得到目标物品和目标对象之间的匹配度。
上述物品数据处理装置,对目标对象的交互物品序列进行物品筛选,得到目标物品的关联物品序列,能够避免直接对较长序列进行嵌入表征建模,有效降低计算复杂度,提高数据处理效率。目标序列模型是基于训练对象的交互物品序列训练得到的,能够准确提取物品序列的嵌入表征,因此,将基于关联物品序列和目标物品得到的联合物品序列输入目标序列模型进行嵌入表征建模,能够提取到准确的嵌入表征。目标序列模型通过针对目标物品和关联物品序列查询到的初始物品特征,对目标物品和关联物品序列进行联合的嵌入表征建模,通过嵌入表征建模得到的物品序列特征,能够准确反映目标对象在目标物品上的行为嵌入表征。后续,基于物品序列特征可以确定目标物品和目标对象之间的匹配度,根据匹配度向目标对象进行物品推荐,能够有效提高推荐准确性、推荐有效性。
上述物品数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图13所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储序列模型、降维模型等数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种物品数据处理方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图14所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种物品数据处理方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图13、图14中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
在一个实施例中,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要符合相关规定。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (17)
1.一种物品数据处理方法,其特征在于,所述方法包括:
获取目标物品和目标对象的交互物品序列;
针对所述目标物品和所述目标对象的交互物品序列中的交互物品,提取物品的目标物品特征;所述目标物品特征是对物品的初始物品特征进行降维处理得到的;
基于所述目标物品和所述交互物品各自的目标物品特征之间的特征距离,从所述目标对象的交互物品序列中确定所述目标物品的关联物品序列;
基于所述关联物品序列和所述目标物品,得到联合物品序列,将所述联合物品序列输入目标序列模型;所述目标序列模型包括预设物品特征集,所述目标序列模型是基于训练对象的交互物品序列训练得到的;
通过所述目标序列模型,在所述预设物品特征集中,查询所述联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出所述联合物品序列的物品序列特征;所述物品序列特征,用于确定所述目标物品和所述目标对象之间的匹配度。
2.根据权利要求1所述的方法,其特征在于,所述针对所述目标物品和所述目标对象的交互物品序列中的交互物品,提取物品的目标物品特征,包括:
基于当前物品的物品标识生成当前物品标识序列,将所述当前物品标识序列输入目标降维模型;所述当前物品为所述目标物品或所述目标对象的交互物品序列中的交互物品,所述目标降维模型包括初始物品特征集;
通过所述目标降维模型,在所述初始物品特征集中,查询所述当前物品的物品标识对应的初始物品特征,对查询到的初始物品特征进行特征增强和特征降维,输出所述当前物品的目标物品特征。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取第一物品标识序列,将所述第一物品标识序列输入初始降维模型;所述第一物品标识序列是基于第一训练对象的交互物品序列得到的,所述初始降维模型包括所述初始物品特征集;
通过所述初始降维模型,在所述初始物品特征集中,查询所述第一物品标识序列中处于第一位置之前的各个物品标识对应的初始物品特征,对查询到的各个初始物品特征进行特征增强和特征降维,得到所述第一位置对应的预测物品特征,基于所述第一位置对应的预测物品特征,得到所述第一物品标识序列中在所述第一位置上的物品标识所对应的第一预测概率;所述第一位置是从所述第一物品标识序列的各个物品标识位置中确定的,所述第一预测概率表征所述第一位置对应的物品和所述第一位置对应的前向物品序列之间的预测关联度;
基于所述第一物品标识序列中在各个第一位置上的物品标识分别对应的第一预测概率,得到第一损失;
基于所述第一损失调整所述初始降维模型的模型参数,直至满足第一收敛条件,得到所述目标降维模型。
4.根据权利要求3所述的方法,其特征在于,所述基于所述第一位置对应的预测物品特征,得到所述第一物品标识序列中在所述第一位置上的物品标识所对应的第一预测概率,包括:
将所述第一位置对应的预测物品特征进行线性变换,得到所述第一位置对应的初始物品分布特征;所述初始物品分布特征包括候选物品集中各个候选物品分别对应的特征值;
对所述初始物品分布特征进行特征值压缩,得到所述第一位置对应的目标物品分布特征;所述目标物品分布特征包括所述候选物品集中各个候选物品分别对应的第一预测概率,所述候选物品集包括所述第一物品标识序列中各个物品标识分别对应的物品;
从所述目标物品分布特征中,确定所述第一物品标识序列中在所述第一位置上的物品标识所对应的第一预测概率。
5.根据权利要求3所述的方法,其特征在于,所述初始降维模型包括嵌入层、投影层、修正层和输出层,所述嵌入层用于查询初始物品特征,所述投影层用于特征降维,所述修正层用于特征增强,所述输出层用于输出第一预测概率;
所述基于所述第一损失调整所述初始降维模型的模型参数,直至满足第一收敛条件,得到所述目标降维模型,包括:
基于所述第一损失调整所述初始降维模型中投影层、修正层和输出层的模型参数,直至满足第一收敛条件,得到所述目标降维模型。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取候选物品集中各个候选物品分别对应的物品描述文本;
通过大语言模型,对所述物品描述文本进行特征提取,得到所述各个候选物品分别对应的初始物品特征;
基于所述各个候选物品分别对应的初始物品特征,得到所述初始物品特征集。
7.根据权利要求1所述的方法,其特征在于,所述基于所述目标物品和所述交互物品各自的目标物品特征之间的特征距离,从所述目标对象的交互物品序列中确定所述目标物品的关联物品序列,包括:
基于所述目标物品和所述交互物品各自的目标物品特征之间的特征距离,按照特征距离从小到大,从所述目标对象的交互物品序列中确定所述目标物品的多个关联物品;
将各个关联物品按照与所述目标对象的交互时间进行排序,得到所述目标物品的关联物品序列。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二物品标识序列,将所述第二物品标识序列输入初始序列模型;所述第二物品标识序列是基于第二训练对象的交互物品序列得到的,所述初始序列模型包括所述预设物品特征集;
通过所述初始序列模型,在所述预设物品特征集中,查询所述第二物品标识序列中处于第二位置之前的各个物品标识对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,得到所述第二位置对应的预测物品特征,基于所述第二位置对应的预测物品特征,得到所述第二物品标识序列中在所述第二位置上的物品标识所对应的第二预测概率;所述第二位置是从所述第二物品标识序列的各个物品标识位置中确定的,所述第二预测概率表征所述第二位置对应的物品和所述第二位置对应的前向物品序列之间的预测关联度;
基于所述第二物品标识序列中在各个第二位置上的物品标识分别对应的第二预测概率,得到第二损失;
基于所述第二损失调整所述初始序列模型的模型参数,直至满足第二收敛条件,得到所述目标序列模型。
9.根据权利要求8所述的方法,其特征在于,所述初始序列模型包括嵌入层、交互层和输出层,所述嵌入层用于查询预设物品特征,所述交互层用于特征交互,所述输出层用于输出第二预测概率;
所述基于所述第二损失调整所述初始序列模型的模型参数,直至满足第二收敛条件,得到所述目标序列模型,包括:
基于所述第二损失调整所述初始序列模型中的交互层和输出层的模型参数,直至满足第二收敛条件,得到所述目标序列模型。
10.根据权利要求1所述的方法,其特征在于,所述对查询到的各个预设物品特征进行特征交互,输出所述联合物品序列的物品序列特征,包括:
按照所述联合物品序列的物品顺序,将查询到的各个预设物品特征进行组合,得到预设物品特征序列;
对所述预设物品特征序列进行特征交互,得到物品交互特征序列;所述物品交互特征序列包括与所述联合物品序列的物品数量匹配的物品交互特征;
从所述物品交互特征序列中,获取在所述目标物品的物品位置上的物品交互特征,作为所述联合物品序列的物品序列特征。
11.根据权利要求1所述的方法,其特征在于,所述预设物品特征集中的预设物品特征为物品的目标物品特征,物品的目标物品特征是对物品的初始物品特征进行降维处理得到的。
12.根据权利要求1至11中任一项所述的方法,其特征在于,所述方法还包括:
获取所述目标物品的物品特征和所述目标对象的对象特征;
将所述物品序列特征、所述目标物品的物品特征、所述目标对象的对象特征输入目标匹配模型,得到所述目标物品和所述目标对象之间的匹配度。
13.根据权利要求12所述的方法,其特征在于,所述方法还包括:
获取存在训练标签的训练样本;所述训练样本包括训练物品的物品特征、训练对象的对象特征、基于所述训练物品和训练对象的交互物品序列得到的融合特征;
基于所述训练样本和所述训练标签,对初始匹配模型进行有监督训练,得到所述目标匹配模型。
14.一种物品数据处理装置,其特征在于,所述装置包括:
数据获取模块,用于获取目标物品和目标对象的交互物品序列;
关联物品确定模块,用于针对所述目标物品和所述目标对象的交互物品序列中的交互物品,提取物品的目标物品特征;所述目标物品特征是对物品的初始物品特征进行降维处理得到的;基于所述目标物品和所述交互物品各自的目标物品特征之间的特征距离,从所述目标对象的交互物品序列中确定所述目标物品的关联物品序列;
物品联合模块,用于基于所述关联物品序列和所述目标物品,得到联合物品序列,将所述联合物品序列输入目标序列模型;所述目标序列模型包括预设物品特征集,所述目标序列模型是基于训练对象的交互物品序列训练得到的;
序列特征提取模块,用于通过所述目标序列模型,在所述预设物品特征集中,查询所述联合物品序列中各个物品对应的预设物品特征,对查询到的各个预设物品特征进行特征交互,输出所述联合物品序列的物品序列特征;所述物品序列特征,用于确定所述目标物品和所述目标对象之间的匹配度。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至13中任一项所述的方法的步骤。
16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
17.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至13中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410591829.7A CN118172146B (zh) | 2024-05-14 | 2024-05-14 | 物品数据处理方法、装置、计算机设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410591829.7A CN118172146B (zh) | 2024-05-14 | 2024-05-14 | 物品数据处理方法、装置、计算机设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN118172146A CN118172146A (zh) | 2024-06-11 |
CN118172146B true CN118172146B (zh) | 2024-09-06 |
Family
ID=91347285
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410591829.7A Active CN118172146B (zh) | 2024-05-14 | 2024-05-14 | 物品数据处理方法、装置、计算机设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118172146B (zh) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631012A (zh) * | 2022-10-27 | 2023-01-20 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
CN116703531A (zh) * | 2023-08-03 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 物品数据处理方法、装置、计算机设备和存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117764633A (zh) * | 2022-09-19 | 2024-03-26 | 北京沃东天骏信息技术有限公司 | 自监督学习模型的生成方法和转化率预估模型的生成方法 |
CN115687777A (zh) * | 2022-11-11 | 2023-02-03 | 中国电信股份有限公司 | 序列推荐方法及装置 |
CN116720919A (zh) * | 2023-06-19 | 2023-09-08 | 建信金融科技有限责任公司 | 物品推荐方法、装置、设备及存储介质 |
CN117390074A (zh) * | 2023-08-18 | 2024-01-12 | 东北大学 | 一种基于长用户行为的序列化推荐方法、装置及存储介质 |
-
2024
- 2024-05-14 CN CN202410591829.7A patent/CN118172146B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115631012A (zh) * | 2022-10-27 | 2023-01-20 | 深圳须弥云图空间科技有限公司 | 目标推荐方法及装置 |
CN116703531A (zh) * | 2023-08-03 | 2023-09-05 | 腾讯科技(深圳)有限公司 | 物品数据处理方法、装置、计算机设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN118172146A (zh) | 2024-06-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111931062B (zh) | 一种信息推荐模型的训练方法和相关装置 | |
WO2020034849A1 (zh) | 音乐推荐的方法、装置、计算设备和介质 | |
CN111581510A (zh) | 分享内容处理方法、装置、计算机设备和存储介质 | |
WO2021139415A1 (zh) | 数据处理方法、装置、计算机可读存储介质及电子设备 | |
CN114332680A (zh) | 图像处理、视频搜索方法、装置、计算机设备和存储介质 | |
CN111949886B (zh) | 一种用于信息推荐的样本数据生成方法和相关装置 | |
CN116310318B (zh) | 交互式的图像分割方法、装置、计算机设备和存储介质 | |
CN116703531B (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
WO2024041483A1 (zh) | 一种推荐方法及相关装置 | |
CN116108267A (zh) | 一种推荐方法及相关设备 | |
WO2023185925A1 (zh) | 一种数据处理方法及相关装置 | |
CN118035945B (zh) | 一种标签识别模型的处理方法和相关装置 | |
CN115879508A (zh) | 一种数据处理方法及相关装置 | |
CN117217284A (zh) | 一种数据处理方法及其装置 | |
WO2024067779A1 (zh) | 一种数据处理方法及相关装置 | |
CN117312630A (zh) | 推荐信息的获取方法、模型训练方法、装置、电子设备及存储介质 | |
CN116910357A (zh) | 一种数据处理方法及相关装置 | |
CN116796729A (zh) | 基于特征强化的文本推荐方法、装置、设备及存储介质 | |
CN118172146B (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
CN113641900A (zh) | 信息推荐方法及装置 | |
CN114926210A (zh) | 评论生成方法、装置、设备及计算机可读存储介质 | |
CN113822291A (zh) | 一种图像处理方法、装置、设备及存储介质 | |
CN114817697A (zh) | 标签信息的确定方法、装置、电子设备以及存储介质 | |
CN117938951B (zh) | 信息推送方法、装置、计算机设备和存储介质 | |
CN118035565B (zh) | 基于多模态情绪感知的主动服务推荐方法、系统和设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |