CN110213325A - 数据处理方法以及数据推送方法 - Google Patents

数据处理方法以及数据推送方法 Download PDF

Info

Publication number
CN110213325A
CN110213325A CN201910262185.6A CN201910262185A CN110213325A CN 110213325 A CN110213325 A CN 110213325A CN 201910262185 A CN201910262185 A CN 201910262185A CN 110213325 A CN110213325 A CN 110213325A
Authority
CN
China
Prior art keywords
matrix
user
user group
historical operation
initial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910262185.6A
Other languages
English (en)
Other versions
CN110213325B (zh
Inventor
袁伟康
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN201910262185.6A priority Critical patent/CN110213325B/zh
Publication of CN110213325A publication Critical patent/CN110213325A/zh
Application granted granted Critical
Publication of CN110213325B publication Critical patent/CN110213325B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/55Push-based network services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Evolutionary Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • User Interface Of Digital Computer (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请涉及一种数据推送方法、装置、计算机可读存储介质和计算机设备,该方法包括:获取用户标识和待推送对象数据;将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度;根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。此外,还提供了一种数据处理方法、装置、计算机可读存储介质和计算机设备。

Description

数据处理方法以及数据推送方法
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、装置、计算机可读存储介质和计算机设备,以及一种数据推送方法、装置、计算机可读存储介质和计算机设备。
背景技术
随着计算机技术的发展,出现了特征工程构建技术,在对象推送应用场景中发挥重要的作用。然而,目前的特征工程构建技术,是没有对训练数据进行相关的特征处理,而是将全部训练数据直接转化为特征对推送模型进行训练,不仅无法将对象的低维特征体现出来,而且容易导致训练出来的推送模型最后推送目标对象的准确性低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高目标对象推送的准确性的数据处理方法、装置、计算机可读存储介质和计算机设备以及一种数据推送方法、装置、计算机可读存储介质和计算机设备。
一种数据处理方法,包括:
获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵;
根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵;
将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度;
根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
一种数据处理装置,该装置包括:
历史操作行为矩阵获取模块,用于获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
历史操作行为矩阵分解模块,用于利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
历史操作行为更新矩阵生成模块,用于根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵;
历史操作行为矩阵矫正模块,用于根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵;
初始神经网络预测模型计算模块,用于将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度;
初始神经网络预测模型计算模块还用于根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
初始神经网络预测模型训练模块,用于根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行程序时实现以下步骤:
获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵;
根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵;
将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度;
根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵;
根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵;
将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度;
根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
一种数据推送方法,该方法包括:
获取用户标识和待推送对象数据;
将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;
目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度;
根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行程序时实现以下步骤:
获取用户标识和待推送对象数据;
将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;
目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度;
根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时,使得处理器执行以下步骤:
获取用户标识和待推送对象数据;
将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;
目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度;
根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
上述数据处理方法、装置、计算机可读存储介质和计算机设备以及数据推送方法、装置、计算机可读存储介质和计算机设备,利用矩阵分解将各个用户群的历史操作行为矩阵分解成两个低维的第一目标影响因子矩阵和第二目标影响因子矩阵,再根据第一目标影响因子矩阵和第二目标影响因子矩阵生成新的历史操作行为矩阵,进而根据新的历史操作行为矩阵和历史操作行为矩阵对应的置信度矩阵更新历史操作行为矩阵,得到目标历史操作行为矩阵。最后,将目标历史操作行为矩阵作为初始神经网络预测模型的训练数据,对其进行训练,得到目标神经网络预测模型。通过对历史操作行为矩阵进行分解得到两个低维的影响因子矩阵,而历史操作行为矩阵的对象的各个低维特征都能够在计算中体现出来,从而提高目标神经网络预测模型推送目标对象至对应的用户的准确性。
附图说明
图1为一个实施例中数据处理方法的应用环境图;
图2为一个实施例中数据处理方法的流程示意图;
图3为一个实施例中历史操作行为矩阵和对应的置信度矩阵获取步骤的流程示意图;
图4为一个实施例中用户属性数据对象生成步骤的流程示意图;
图5为一个实施例中用户属性数据对象聚类步骤的流程示意图;
图6为另一个实施例中数据处理方法的流程示意图;
图7为一个实施例中历史操作行为矩阵分解步骤的流程示意图;
图8为一个实施例中第二初始影响因子矩阵计算步骤的流程示意图;
图9为一个实施例中第一更新影响因子矩阵计算步骤的流程示意图;
图10为一个实施例中目标影响因子矩阵计算步骤的流程示意图;
图11为一个实施例中历史操作行为更新矩阵生成步骤的流程示意图;
图12为一个实施例中历史操作行为矩阵矫正步骤的流程示意图;
图13为一个实施例中数据推送方法的流程示意图;
图14为一个实施例中数据处理方法的原理示意图;
图15为一个实施例中数据处理装置的结构框图;
图16为一个实施例中历史操作行为矩阵获取模块的结构框图;
图17为一个实施例中历史操作行为矩阵分解模块的结构框图;
图18为一个实施例中数据推送装置的结构框图;
图19为一个实施例中计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
图1为一个实施例中数据处理方法的应用环境图。参照图1,该数据处理方法应用于数据处理系统。该数据处理系统包括终端110和服务器120。终端110和服务器120通过网络连接。终端110具体可以是台式终端或移动终端,移动终端具体可以手机、平板电脑、笔记本电脑等中的至少一种。服务器120可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,终端110可采集各个用户群对应的历史操作行为矩阵,再将采集到的各个用户群对应的历史操作行为矩阵发送至服务器120。服务器120获取到各个用户群对应的历史操作行为矩阵,且各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于用户与对象之间的实际匹配度,利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
进一步地,服务器120根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵,根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵,将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度,根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值,根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。进一步地,服务器120可将目标神经网络预测模型发送至终端110。
其中,图1还可以为另一个实施例中数据推送方法的应用环境图,该数据推送方法应用于数据推送系统。具体地,终端110将用户标识和待推送对象数据发送至服务器120,服务器120将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的,目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度,根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
如图2所示,在一个实施例中,提供了一种数据处理方法。本实施例主要以该方法应用于上述图1中的终端110或服务器120来举例说明。参照图2,该数据处理方法具体包括如下步骤:
步骤202,获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度。
其中,用户群是对采集到的所有用户进行聚类得到的用户集合,同一用户群中的用户具有一定的相似性。历史操作行为矩阵是将用户历史操作行为数据按照长方阵列排列的复数或实数集合,历史操作行为矩阵的行和列可自定义,自定义可以是历史操作行为矩阵的行代表用户数量,列代表物品数量等。例如,历史操作行为矩阵的第i行第j列的值代表第i个用户对第j个物品的喜好程度。其中,历史操作行为矩阵可以是通过用户历史操作行为数据计算得到的中间历史操作行为矩阵,再通过中间历史操作行为矩阵得到历史操作行为矩阵,或者是直接将用户历史行为操作数据组成历史操作行为矩阵等等。其中,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度,所谓实际匹配度是指用户与对象之间的真实匹配度。其中,由于用户群的历史操作行为矩阵可通过历史操作行为数据计算得到,为了验证历史操作行为矩阵的可靠性,则各个用户群的历史操作行为矩阵都存在对应的置信度矩阵是用于验证各个用户群的历史操作行为矩阵的可靠程度,可从置信度矩阵中得知曝光对象与用户进行交互的可靠程度,曝光对象与用户未进行交互的可靠程度,以及未曝光对象与用户的可靠程度,置信度越高说明曝光对象与用户进行交互,置信度为0说明对应的对象并未曝光。置信度矩阵与对应的历史操作行为矩阵具有相同的维度信息。各个用户群的置信度矩阵可根据用户群中的用户与对象的交互数据计算得到,具体可以是直接获取用户群中各个用户与对象的交互数据,将各个用户与对象的交互数据按照长方阵列排列组成置信度矩阵。其中对象是指与用户发生交互的特定事物,例如对象可以是物品、视频、音频、文本内容等等。用户与对象的交互数据可以是用户对对象的点击次数、用户对对象的播放次数、用户对对象的唤醒次数等等。其中,若用户群中某个用户对某个对象不存在交互数据,则可根据该用户群中所有对象的总数目计算得到对应的置信度,或者还可以是提前设置预设置信度,将预设置信度作为该用户对该对象的置信度。
具体地,获取采集到的各个用户画像,根据用户画像构建画像特征,根据画像特征将画像特征转换为对应的特征向量,根据特征向量和各个用户群对应的初始聚类中心不断进行重复聚类,将各个用户画像分类到各个用户群中。在同群用户下,根据同群的各个用户的用户与对象之间的用户对象交互数据生成对应的历史操作行为数据矩阵,或者根据同群的各个用户的历史操作行为数据组成对应的历史操作行为数据矩阵。另外,在生成历史操作行为数据的同时,还需可根据用户对象交互数据计算得到对应的置信度矩阵,置信度矩阵是用于描述对应的历史操作行为数据的可靠度。
步骤204,利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
其中,由于各个用户群对应的历史操作行为矩阵可为高维的矩阵,高维的矩阵在计算过程中容易出现误差,而且计算花费时间较长,导致计算效率低,因此需要利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解。所谓的矩阵分解是指通过矩阵分解法将历史操作行为矩阵拆解成预设数量个子矩阵,这里的矩阵分解是将各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。其中,利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解可以是先初始化其中一个影响因子矩阵,通过不断迭代求得全局极小值,将使得全局极小值的矩阵作为第一目标影响因子矩阵和第二目标影响因子矩阵,还可以是先初始化其中一个影响因子矩阵,通过不断迭代直至到达最大迭代数,将最大迭代数对应的矩阵作为第一目标影响因子矩阵和第二目标影响因子矩阵等等。
在一个实施例中,矩阵分解具体可以是先获取初始化的第一影响因子矩阵,根据初始化的第一影响因子矩阵和对应的历史操作行为矩阵生成初始化的第二影响因子矩阵,然后再根据初始化的第二影响因子矩阵和对应的历史操作行为矩阵更新初始化的第一影响因子矩阵,得到中间第一影响因子矩阵,再根据中间第一影响因子矩阵和对应的历史操作行为矩阵更新初始化的第二影响因子矩阵,不断进行迭代,直至满足迭代条件,得到第一目标影响因子矩阵和第二目标影响因子矩阵。其中,迭代条件可自定义,自定义可以是迭代次数的限定,或者使用交替最小二乘法进行限定等等。
步骤206,根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵。
其中,历史操作行为更新矩阵是用来对历史操作行为矩阵进行更新的数据,历史操作行为更新矩阵中是由用户对对象的预测打分组成的,用户对对象的预测打分具体可根据第一目标影响因子矩阵和第二目标影响因子矩阵计算得到。其中,由于历史操作行为矩阵中存在未知的矩阵值,则需要根据历史操作行为更新矩阵对对应的历史操作行为矩阵进行更新。其中,历史操作行为矩阵中的未知的矩阵值代表未曝光的对象,用户无法对其进行操作行为,因此可根据预设条件在历史操作行为矩阵中赋予对应的矩阵值。为了能够准确得到历史操作行为矩阵中未知的矩阵值,因此可根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到对应的历史操作行为更新矩阵。
其中,根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到对应的历史操作行为更新矩阵的计算方式可自定义,自定义可以是将第一目标影响因子矩阵和第二目标影响因子矩阵的乘积作为历史操作行为更新矩阵,还可以是先对第二目标影响因子矩阵进行转置,将转置后的第二目标影响因子矩阵和第一目标影响因子矩阵进行矩阵乘积,将乘积结果作为历史操作行为更新矩阵等等。
步骤208,根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵。
其中,由于各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,而置信度矩阵是用于验证各个用户群的历史操作行为矩阵的可靠程度。在置信度矩阵中可根据置信度得知不可靠的矩阵值,针对不可靠的矩阵值可根据历史操作行为更新矩阵进行矫正。具体可以是,根据各个用户群对应的置信度矩阵确定不可靠的矩阵值所在的第一位置,由于置信度矩阵和对应的历史操作行为更新矩阵具有相同的维度,因此可确定不可靠的矩阵值所在的第一位置在历史操作行为更新矩阵中的第二位置和在历史操作行为矩阵中的第三位置,将第三位置中的矩阵值替换成第二位置中的矩阵值。最后,得到各个用户群矫正后的目标历史操作行为矩阵,其中目标历史操作行为矩阵中的矩阵值都为预测值,可以矫正历史操作行为矩阵中存在未知的矩阵值的策略。
例如,历史操作行为矩阵有2个用户对2个物品的喜好组成的:第一行的第一列的1代表第1个用户喜欢第1个物品,第一行的第二列的0代表第1个用户讨厌第2个物品,第二行的第一列的0代表第1个物品属于未曝光物品,不知第2个用户对其的喜好,因此假设第2个用户讨厌该物品,则赋予0,第二行的第二列1代表第2个用户喜欢第2个物品。该历史操作行为矩阵对应的置信度矩阵为:置信度矩阵可将用户与物品的点击次数作为置信度矩阵中的矩阵值,第一行的第一列的3代表第1个用户对第1个物品进行3次点击,第一行的第二列的0代表第2个用户对第2个物品进行0次点击,第二行的第一列的0是未曝光的物品,该值根据预设规则进行计算得到的,第二行的第二列的5代表第2个用户对第2个物品进行5次点击。而历史操作行为更新矩阵为:因此,根据置信度矩阵确定该用户群中未曝光的物品为第2个用户对第1个物品的喜好程度,因此,将历史操作行为更新矩阵中的该位置的值替换到历史操作行为矩阵中对应的矩阵值中,得到目标历史操作行为矩阵,目标历史操作行为矩阵为:可以看到第2个用户虽然没有接触过第1个物品,但是根据第2个用户的属性,可以预测当第1个物品得到曝光时,则该用户会有一定概率的点击。
步骤210,将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度。
其中,初始神经网络预测模型是用来预测用户与对象之间的匹配度的数字模型,初始神经网络预测模型可以词向量编码神经网络word2vec,还可以是CNN卷积神经网络或者是DNN深度学习神经网络模型等等。具体地,将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型中,通过神经网络预测模型计算得到各个用户群对应的用户与对象之间的预测匹配度。其中,在将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型之前,可对各个用户群对应的目标历史操作行为矩阵进行过滤清理,具体可以是设置过滤掉大量目标历史操作行为矩阵中用户对对象的关注度低的物品,保留用户对对象关注度高的物品作为初始神经网络预测模型的训练数据,因此可以提高初始神经网络预测模型的计算效率。
步骤212,根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值。
其中,训练损失值是用来对初始神经网络预测模型训练的参考值,具体可根据各个用户群的预测匹配度和对应的实际匹配度计算得到。其中,计算方式可自定义,自定义可以是将各个用户群的实际匹配度和预测匹配度之间的差异性的总和作为训练损失值,或者还可以是将各个用户群的实际匹配度和预测匹配度加权的总和作为训练损失值等等。
步骤214,根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
其中,在计算得到训练损失值后,根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。其中,收敛条件可自定义,自定义可以是当训练损失值达到最小值,则可认为初始神经网络预测模型满足收敛条件,从而得到目标神经网络预测模型。或者还可以是训练损失值达到稳定水平时,则可认为初始神经网络预测模型满足收敛条件,进而得到目标神经网络预测模型。
上述数据处理方法,利用矩阵分解将各个用户群的历史操作行为矩阵分解成两个低维的第一目标影响因子矩阵和第二目标影响因子矩阵,再根据第一目标影响因子矩阵和第二目标影响因子矩阵生成新的历史操作行为矩阵,进而根据新的历史操作行为矩阵和历史操作行为矩阵对应的置信度矩阵更新历史操作行为矩阵,得到目标历史操作行为矩阵。最后,将目标历史操作行为矩阵作为初始神经网络预测模型的训练数据,对其进行训练,得到目标神经网络预测模型。通过对历史操作行为矩阵进行分解得到两个低维的影响因子矩阵,而历史操作行为矩阵的对象的各个低维特征都能够在计算中体现出来,从而提高目标神经网络预测模型推送目标对象至对应的用户的准确性。
在一个实施例中,如图3所示,获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,包括:
步骤302,获取用户属性数据集合,用户属性数据集合包括多个用户属性数据。
具体地,用户属性数据是指用户相关的属性信息。比如,用户属性数据可以是但不限于用户年龄、性别、学历等。而用户属性数据集合是由多个用户属性数据组成的集合。服务器可通过终端相关的应用程序将用户属性数据推送至对应的终端,这里的应用程序可以是但不限于具有各种推送用户属性数据服务的新闻应用程序、视频应用、社交网络应用、论坛应用等。服务器可通过自身具有采集能力的推送相关服务从而采集各个用户属性数据,将采集到的各个用户属性数据组成用户属性数据集合。
具体地,服务器可通过自身的采集能力采集用户属性数据,服务器将获取到的各种用户属性数据组成用户属性数据集合。
步骤304,生成与各个用户属性数据对应的用户属性数据对象。
其中,用户属性数据是用来对用户属性数据的抽象表示。由于用户属性数据中有很多与用户属性数据相关的指标,因此可将与用户属性数据相关的指标抽象成对应的特征。这里的与用户属性数据相关的指标包括但不限于连续型指标和离散型指标,其中,连续型指标可以是但不限于用户年龄等等,而离散型指标包括但不限于用户性别、学历等等。
具体地,在得到多个用户属性数据后,获取各个用户属性数据中的的各个指标,将采集到的各个指标抽象成各个特征,根据各个特征抽象成对应的用户属性数据对象。具体可以是,获取各个用户属性数据中对应的各个指标,根据指标的类型判定为连续型指标还是离散型指标。对于连续型指标可按不同区间分箱处理,增加连续型特征的鲁棒性。而对于离散型指标则可将其转换为哑变量进行处理。其实,就是将各个用户属性数据中的指标用具体数值来表示,而用户属性数据对象就是由一连串具体数值组成的。
例如,某一用户的用户属性数据的指标为年龄15岁、性别女、学历本科,根据指标的类型分为连续型指标为:年龄15岁,和离散型指标为:性别女和学历本科。对于连续型指标按照不同区间的分箱处理,一共有20个箱子,每个箱子对应的长度为:1/20=0.05,箱子如下:0-5岁、5-10岁、10-15岁……,而该用户的年龄为15岁,位于第3个箱子,因此可将年龄为15岁转换为具体数值0.05*3=0.15。而对于离散型指标则将其转换成哑变量进行处理,如性别为女,则转换成哑变量为是否为男性、是否为女性,因此性别为女转换后的具体数值为0、1,0表示性别不是男性,1代表性别是女性,而学历本科则转换成哑变量为是否为大专、是否为本科、是否为研究生、是否为博士,因此学历本科转换后的具体数值为0、1、0、0,第1个0代表学历不是大专、第1个1代表学历是本科、第2个0代表学历不是研究生以及第3个0代表学历不是博士。因此,该用户对应的用户属性数据对象为:{0.15、0、1、0、1、0、0}。
步骤306,对各个用户属性数据对象进行聚类,得到多个用户群。
其中,聚类是将抽象的用户属性数据对象分成由类型的用户属性数据对象组成的多个用户群的过程。聚类过程所生成的用户群是一组用户属性数据对象的集合,这些用户属性数据对象与同一个用户群的用户属性数据对象彼此相似,与其他用户群中的用户属性数据对象相异。具体地,可通过各个用户属性数据对象的相似度或者距离来确定各个用户属性数据对象对应的用户隶属哪个用户群,具体可通过不断重复聚类得到多个用户群,各个用户群的用户都彼此相似。
步骤308,获取在各个用户群下用户与对象之间的用户对象交互数据。
其中,用户对象交互数据是指用户与对象之间的交互数据,用户对象交互数据可以是用户对对象的点击次数、用户对对象的播放次数、用户对对象的唤醒次数等等。具体地,获取在各个用户群下用户与对象之间的用户对象交互数据可以是通过相关的应用程序采集得到,或者通过相关的服务采集得到。
步骤310,根据各个用户群的用户对象交互数据生成各个用户群对应的历史操作行为矩阵。
具体地,可根据各个用户群的用户对象交互数据中用户与对象的交互情况确定对应的历史操作行为数据,再根据历史操作行为数据生成历史操作行为矩阵。例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0。则根据用户对象交互数据生成对应的历史操作行为矩阵为:第1行第1列的1代表用户a喜欢物品1,第1行第2列的1代表用户a喜欢物品2,第1行第3列的0代表用户a讨厌物品3,第2行第1列的1代表用户b喜欢物品1,第2行第2列的0代表用户b对物品1的喜欢程度未知,但是可假设为讨厌该物品,则可赋予为0,第2行第3列的0代表用户b讨厌物品3。即,用户对物品进行了点击则代表喜欢,未进行点击则代表讨厌,而对于未曝光的物品,则可假设用户讨厌该物品,直接赋予0。
步骤312,根据各个用户群的用户对象交互数据计算得到各个用户群的历史操作行为矩阵对应的置信度矩阵。
具体地,在生成历史操作行为数据的同时,还需可根据用户对象交互数据计算得到对应的置信度矩阵,置信度矩阵是用于描述对应的历史操作行为数据的可靠度,置信度越高说明可靠度越高。具体可以是,直接将用户对象交互数据组成对应的置信度矩阵,而对于未曝光的物品,用户与该对象之间没有交互数据,则可根据预设条件赋予对应的较低的置信度给它,如将未曝光对象的置信度赋值0,将曝光对象并且用户进行交互的对象的置信度赋值为用户点击次数*100%,而曝光对象但并不与用户进行交互的对象的置信度赋值为100%。例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0,则该用户群对应的置信度矩阵为
在一个实施例中,如图4所示,生成与各个用户属性数据对应的用户属性数据对象,包括:
步骤402,获取各个用户属性数据对应的各个特征,将特征归入对应类型的特征集,类型包括连续型类型、离散型类型中的至少一种。
其中,由于不同类型的特征的处理方式不同,因此需要获取各个用户属性数据对应的各个特征,将特征归入对应的同类型对应的特征集。其中特征类型包括连续型类型、离散型类型中的至少一种。所谓连续型特征是指连续性的,如年龄等,而离散型特征是指特征是离散的,如性别和学历等。
步骤404,根据各个特征对应的类型,确定各个特征对应的特征编码方式。
步骤406,根据各个特征对应的特征编码方式对对应的特征进行编码,得到各个用户属性数据对应的用户属性数据对象。
其中,特征编码方式是指将各个特征从一种形式转换成另一种形式。具体地,在确定各个特征对应的类型后,根据各个特征对应的类型确定对应的特征编码方式,例如若特征为连续型特征,则编码方式为按不同区间分箱处理,若特征为离散型特征,则编码方式为转换对应的哑变量进行处理。进一步地,在确定各个特征对应的特征编码方式后,则对对应的特征进行编码,最后得到各个用户属性数据对应的用户属性数据对象。
例如,某一用户的用户属性数据的特征为年龄15岁、性别女、学历本科,根据特征的类型分为连续型特征为:年龄15岁,和离散型特征为:性别女和学历本科。对于连续型特征按照不同区间的分箱处理,一共有20个箱子,每个箱子对应的长度为:1/20=0.05,箱子如下:0-5岁、5-10岁、10-15岁……,而该用户的年龄为15岁,位于第3个箱子,因此可将年龄为15岁转换为具体数值0.05*3=0.15。而对于离散型特征则将其转换成哑变量进行处理,如性别为女,则转换成哑变量为是否为男性、是否为女性,因此性别为女转换后的具体数值为0、1,0表示性别不是男性,1代表性别是女性,而学历本科则转换成哑变量为是否为大专、是否为本科、是否为研究生、是否为博士,因此学历本科转换后的具体数值为0、1、0、0,第1个0代表学历不是大专、第1个1代表学历是本科、第2个0代表学历不是研究生以及第3个0代表学历不是博士。因此,该用户对应的用户属性数据对象为:{0.15、0、1、0、1、0、0}。
在一个实施例中,如图5所示,对各个用户属性数据对象进行聚类,得到多个用户群,包括:
步骤502,获取各个初始用户群的初始聚类中心,将初始聚类中心作为当前聚类中心。
其中,初始聚类中心是指各个用户群对应的初始的聚类中心,各个初始用户群的初始聚类中心可以是预先设置的,也可以是从各个用户属性数据对象中随机获取一个作为该初始用户群的初始聚类中心。将初始聚类中心作为当前聚类中心,所谓当前聚类中心是指所在的用户群正在使用的聚类中心。
步骤504,将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度。
步骤506,当初始相似度大于预设相似度时,将初始相似度对应的用户属性数据对象分配到当前聚类中心对应的初始用户群中,得到多个当前用户群。
具体地,在确定各个初始用户群对应的初始聚类中心后,并将初始聚类中心作为当前聚类中心后,将各个用户属性数据对象与当前聚类中心进行相似度计算得到对应的初始相似度。进一步地,当初始相似度大于预设相似度时,说明初始相似度对应的用户属性数据对象与当前聚类中心所在的用户群更相似,则将初始相似度对应你的用户属性数据对象分配到当前聚类中心所在的用户群中,得到多个当前用户群。即,将每个用户属性数据对象分配给离其所在距离最近的当前聚类中心的用户群中。
步骤508,根据各个当前用户群中的当前用户属性数据对象计算得到对应的各个更新聚类中心,将各个更新聚类中心作为当前聚类中心,返回将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度的步骤进行重复聚类,直到满足聚类收敛条件,得到多个用户群。
具体地,在将各个用户属性数据对象分配给离其所在距离最近的当前聚类中心的用户群后,计算新的聚类中心,直至满足中心收敛时输出聚类结果,聚类结果为各个用户群。具体地,在得到多个当前用户群后,需要根据各个当前用户群的当前用户属性数据对象重新计算得到对应的更新聚类中心,将重新计算得到的更新聚类中心作为当前聚类中心,重新返回将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度的步骤进行重复聚类,直到满足聚类收敛条件,输出多个用户群。所谓中心收敛是当重新计算的更新聚类中心与上一个聚类中心的误差满足一定范围内时,可判定为满足收敛条件。
在一个实施例中,如图6所示,获取在各个用户群下用户与对象之间的用户对象交互数据,根据各个用户群的用户对象交互数据生成各个用户群对应的历史操作行为矩阵,根据各个用户群下的用户对象交互数据计算得到各个用户群的历史操作行为矩阵对应的置信度矩阵,包括:
步骤602,获取在各个用户群下用户对对象的点击次数,将点击次数作为在各个用户群下用户与对象之间的用户对象交互数据。
步骤604,将各个用户群的用户对对象的点击次数组成各个用户群对应的用户对象感兴趣数据矩阵。
具体地,通过相关应用程序或者相关服务记录在各个用户群中的用户对对象的点击次数,所谓点击次数是指用户对对象的点击频率,点击次数越高,点击频率越高。可通过用户对对象的点击次数得知用户对对象的感兴趣度,若用户对对象进行了点击,则说明该用户对该对象感兴趣,反之,则说明用户对该对象不感兴趣。
进一步地,在获取各个用户群下用户与对象之间的点击次数后,将点击次数作为各个用户群下用户与对象之间的用户对象交互数据,然后再将各个用户群的用户对对象的点击次数组成各个用户群对应的用户对象感兴趣数据矩阵。其中,对于未曝光的对象,可假设用户并未对其进行点击,因此点击次数为无。
例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0。则根据户对对象的点击次数组成对应的用户对象感兴趣数据矩阵为:
步骤606,根据预设规则将各个用户群对应的用户对象感兴趣数据矩阵转换为对应的历史操作行为矩阵。
其中,预设规则是用于将用户对象感兴趣数据矩阵转换成对应的历史操作行为矩阵的转换规则,可预先设置,预设规则可自定义,自定义可以是根据用户对象感兴趣数据矩阵中的用户对象点击次数转换对应的历史操作行为矩阵,如,用户与对象之间存在点击次数,说明用户喜欢该对象,则可用1来表示,反之则可用0来表示。因此,可通过用0或者1来表示历史操作行为矩阵。例如,用户对象感兴趣数据矩阵为:则根据预设规则对用户对象感兴趣数据矩阵转换为对应的历史操作行为矩阵为:
步骤608,根据各个用户群的用户对对象的点击次数确定用户关注度高的对象、用户关注度低的对象和用户待推荐对象。
其中,用户关注度高的对象是指用户与对象之间发生点击操作的对象,用户关注度低的对象是指用户与对象之间未发生点击操作的对象,而用户待推荐对象是指对象未曝光,用户与对象之间未发生点击操作。具体地,可根据各个用户群的用户对对象的点击次数确定用户关注度高的对象、用户关注度低的对象和用户待推荐对象,也就是说,将用户与对象之间发生点击次数的作为用户关注度高的对象,而将用户与对象之间未发生点击次数的作为用户关注度低的对象,对于未曝光的物品,则作为用户待推荐对象。
例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0。则用户关注度高的对象为:用户a对物品1、用户a对物品2、用户b对物品1,用户关注度低的对象为:用户a对物品3、用户b对物品3,而用户待推荐对象为:用户b对物品2。
步骤610,将各个用户群的用户关注度高的对象和用户关注度低的对象对应的点击次数作为对应的置信度。
步骤612,获取各个用户群下的对象总数目,根据各个用户群的对象总数目计算得到各个用户群的用户待推荐对象的置信度。
其中,在计算用户关注度高的对象、用户关注度低的对象以及用户待推荐对象的置信度时,可根据各个用户对对象的点击次数得到。具体地,对于用户关注度高的对象、用户关注度低的对象,可直接将用户对对象的点击次数作为对应的置信度。而对于用户待推荐对象的置信度时,可获取该用户群下的所有对象的总数目,根据对象的总数目计算得到对应的置信度。
例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0。则用户关注度高的对象为:用户a对物品1、用户a对物品2、用户b对物品1,用户关注度低的对象为:用户a对物品3、用户b对物品3,而用户待推荐对象为:用户b对物品2。因此,用户关注度高的对象的置信度分别为3*100%、2*100%、3*100%,用户关注度低的对象的置信度分别为100%、100%,而用户待推荐对象的置信度为0。
步骤614,根据各个用户群的用户关注度高的对象和用户关注低的对象对应的点击次数作为对应的置信度,和用户待推荐对象的置信度组成各个用户群的历史操作行为矩阵对应的置信度矩阵。
具体地,在获得各个用户群的用户关注度高的对象和用户关注低的对象对应的点击次数作为对应的置信度,和用户待推荐对象的置信度后,可根据根据各个用户群的用户关注度高的对象和用户关注低的对象对应的点击次数作为对应的置信度,和用户待推荐对象的置信度组成各个用户群的历史操作行为矩阵对应的置信度矩阵。
例如,用户a对物品1的点击次数为3、对物品2的点击次数为2、对物品3的点击次数为0,用户b对物品1的点击次数为3、对物品2的点击次数为NULL(未知情况)、对物品3的点击次数为0。则用户关注度高的对象为:用户a对物品1、用户a对物品2、用户b对物品1,用户关注度低的对象为:用户a对物品3、用户b对物品3,而用户待推荐对象为:用户b对物品2。因此,用户关注度高的对象的置信度分别为3*100%、2*100%、3*100%,用户关注度低的对象的置信度分别为100%、100%,而用户待推荐对象的置信度为0,则最后组成的置信度矩阵为:
在一个实施例中,如图7所示,利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵,包括:
步骤702,获取各个用户群对应的第一初始影响因子矩阵。
步骤704,根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵生成各个用户群对应的第二初始影响因子矩阵。
其中,由于各个用户群对应的历史操作行为矩阵是用于描述用户与对象之间的实际匹配度,即历史操作行为矩阵中只描述用户与对象之间的关系,而对象包括多个低维特征。而历史操作行为矩阵中无法描述用户与对象的各个低维特征之间的关系,也无法描述对象与对象的各个低维特征之间的关系。因此,将各个用户群对应的历史操作行为矩阵进行降维处理,可以将对象的各个低维特征在历史操作行为矩阵的高维计算中体现出来,从而加快计算效率。其中,可将各个用户群对应的高维历史操作行为矩阵降维求得两个低维的第一目标影响因子矩阵和第二目标影响因子矩阵,通过第一目标影响因子矩阵和第二目标影响因子矩阵来矫正对应的历史操作行为矩阵中的不可靠的矩阵值。
具体地,先获取各个用户群对应的第一初始影响因子矩阵,第一初始影响因子矩阵是预先设置的,控制第一初始影响因子矩阵和对应的历史操作行为矩阵不变,生成第二初始影响因子矩阵。
在一个实施例中,例如,历史操作行为矩阵为用户-物品矩阵X,第一目标影响因子矩阵为用户-用户偏好权重矩阵,第二目标影响因子矩阵为物品-物品属性优劣矩阵,具体地,使用矩阵分解把用户-物品矩阵X(m*n,m为用户数量,n为物品数量)分解为两个低维矩阵,目标用户-用户偏好权重矩阵U(m*d,m为用户数量,物品属性可抽象为d维),目标物品-物品属性优劣矩阵P(n*d,n为物品数量,物品属性可抽象为d维)。具体可以是先获取随机初始化的用户-用户偏好权重矩阵,根据随机初始化的用户-用户偏好权重矩阵和用户-物品矩阵计算对应的物品-物品属性优劣矩阵。进一步再根据计算的物品-物品属性优劣矩阵和用户-物品矩阵去更新初始化的用户-用户偏好权重矩阵,得到更新后的用户-用户偏好权重矩阵,再根据更新后的矩阵和用户-物品矩阵去更新该更新后的用户-用户偏好权重矩阵,不断重复计算,满足预设条件,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
步骤706,根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
具体地,在生成得到各个用户群对应的第二初始影响因子矩阵后,说明获取随机初始化的第一初始影响因子矩阵和第二初始影响因子矩阵较为接近,但是由于初始化的第一初始影响因子矩阵只是随机化且预先设置的,并不是第一目标影响因子矩阵和第二目标影响因子矩阵,因此还需要根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。具体可以是,控制各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵不变,根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵计算得到各个用户群的第一更新影响因子矩阵,如根据第二初始影响因子矩阵和对应的历史操作行为矩阵构建损失函数,通过交替最小乘法得到对应的第一更新影响因子矩阵。
步骤708,根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
具体地,在得到各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵后,需要根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵不断迭代计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。具体可以是,根据各个用户群的第一更新影响因子矩阵、第二初始影响子矩阵和历史操作行为矩阵构建对应的损失函数,通过损失函数的值满足收敛条件从而确定最后的第一目标影响因子矩阵和第二目标影响因子矩阵。其中,收敛条件可以是当损失函数的值达到最小化时,则可将最小化时的第一影响因子矩阵和第二影响因子矩阵作为第一目标影响因子矩阵和第二目标影响因子矩阵。收敛条件还可以是当迭代次数达到预设次数时,则将达到预设次数的第一影响因子矩阵和第二影响因子矩阵作为第一目标影响因子矩阵和第二目标影响因子矩阵等等。
在一个实施例中,如图8所示,根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵生成各个用户群对应的第二初始影响因子矩阵,包括:
步骤802,根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第一损失函数。
步骤804,当第一损失函数达到第一收敛条件时,则确定各个用户群对应的第二初始影响因子矩阵。
其中,这里的第一损失函数是用于计算第二初始影响因子矩阵的函数,是将第一初始影响因子矩阵中的随机变量以及其随机变量在历史操作行为矩阵中的取值映射为非负实数以表示该随机事件的“风险”或“损失”的函数。具体可以以以下公式构建,其中,这里的第一损失函数中的第一初始影响因子矩阵和对应的历史操作行为矩阵为已知的矩阵,根据已知的矩阵求解未知的第二影响因子矩阵:
其中,Xij表示历史操作行为矩阵中第i个用户对第j个对象的实际匹配度,Ui表示第一影响因子矩阵中第i个用户对对象的各个低维特征的匹配度,Pj表示第二影响因子矩阵中第j个对象的各个低维特征的匹配度,表示历史操作行为更新矩阵中第i个用户对第j个对象的预测匹配度。
其中,在第一损失函数中第一影响因子矩阵和第二影响因子矩阵都属于未知矩阵,在求解第一影响因子矩阵和第二影响因子矩阵时,可先随机初始化其中一个矩阵,通过初始化的矩阵和对应的历史操作行为矩阵计算求解第二初始影响因子矩阵。具体可根据构建的损失函数进行求解得到。
在一个实施例中,如图9所示,根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵,包括:
步骤902,根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第二损失函数。
步骤904,当第二损失函数达到第二收敛条件时,则确定各个用户群的第一中间影响因子矩阵。
其中,这里的第二损失函数中第一初始影响因子矩阵和对应的历史操作行为矩阵为已知的矩阵,根据已知的矩阵更新第一初始影响因子矩阵,具体地,根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第二损失函数,第二损失函数可以是图8中描述的第一损失函数。通过构建第二损失函数更新随机初始化的第一初始影响因子矩阵,当构建的第二损失函数达到第二收敛条件时,可以将满足第二收敛条件时的第一影响因子矩阵确定为第一中间影响因子矩阵。其中,第二收敛条件可自定义,自定义可以是根据实际业务需求和实际应用场景确定得到的。
步骤906,根据各个用户群的第一中间影响因子矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
具体地,在得到各个用户群的第一中间影响因子矩阵后,根据各个用户群的第一中间影响因子矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。其中,更新可以但不限于将第一中间影响因子矩阵替换第一初始影响因子矩阵。
在一个实施例中,如图10所示,根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵,包括:
步骤1002,根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算对应的矩阵损失值。
步骤1004,当矩阵损失值达到第三收敛条件时,则将矩阵损失值对应的第一影响因子矩阵和第二影响因子矩阵确定为各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
其中,由于计算得到的第一更新影响因子矩阵和第二初始影响因子矩阵还不是最后的目标影响因子矩阵,因此还需要根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算对应的矩阵损失值。损失值具体可以以以下公式计算:
其中,xij表示历史操作行为矩阵中第i个用户对第j个对象的实际匹配度,aij表示第i个用户对第j个对象的置信度,ui(d维向量)表示第一影响因子矩阵中第i个用户对对象的各个低维特征的匹配度,pj第二影响因子矩阵中第j个对象的各个低维特征的匹配度,历史操作行为更新矩阵中第i个用户对第j个对象的预测匹配度,其中使用置信度,针对实际匹配度和预测匹配度的距离的平方,进行加权求和,构造损失函数。例如,置信度使用用户点击次数赋值,例如,用户点击了3次该对象,则xij=1,aij=3;该物品已曝光,用户没有点击,则xij=0,aij=1;该物品没有曝光,则xij=0,aij=0。
进一步地,当矩阵损失值达到第三收敛条件时,则将矩阵损失值对应的第一影响因子矩阵和第二影响因子矩阵确定为各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。其中第三收敛条件可自定义,自定义可以是矩阵损失值达到最小时,认为矩阵损失值达到第三收敛条件,或者矩阵损失值不再发生变化时,则认为矩阵损失值达到第三收敛条件,或者还可以是迭代次数达到预设次数时,则可认为矩阵损失值达到第三收敛条件等等。
最后,当矩阵损失值未达到第三收敛条件时,则各个用户群的更新的第一影响因子矩阵、更新的第二影响因子矩阵和历史操作行为矩阵不断重复迭代,直至训练损失值达到第三收敛条件,则可停止迭代。
在一个实施例中,如图11所示,根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵,包括:
步骤1102,对各个用户群的第二目标影响因子矩阵进行转置,得到第二中间目标影响因子矩阵。
步骤1104,根据各个用户群第一目标影响因子矩阵和对应的第二中间目标影响因子矩阵计算得到历史操作行为更新矩阵。
具体地,在通过计算求得训练损失值满足第三收敛条件的第一目标影响因子矩阵和第二目标影响因子矩阵后,可根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵,具体可以是先对各个用户群的第二目标影响因子矩阵进行转置,得到第二中间目标影响因子矩阵,然后再根据各个用户群第一目标影响因子矩阵和对应的第二中间目标影响因子矩阵计算得到历史操作行为更新矩阵。例如,通过以下公式计算历史操作行为更新矩阵:
其中,Ua表示第一目标影响因子矩阵,Pb表示第二目标影响因子矩阵,表示对第二目标影响因子矩阵进行矩阵,得到第二中间目标影响因子矩阵。
在一个实施例中,如图12所示,根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵,包括:
步骤1202,根据各个用户群的置信度矩阵确定历史操作行为矩阵中待更新历史操作行为矩阵值。
步骤1204,获取各个用户群的历史操作行为更新矩阵中与待更新历史操作行为矩阵值对应的中间历史操作行为矩阵值。
步骤1206,将各个用户群的中间历史操作行为矩阵值替换待更新历史操作行为矩阵值,得到各个用户群对应的目标历史操作行为矩阵。
其中,由于各个用户群的置信度矩阵时用于验证各个用户群的历史操作行为矩阵的可靠程度,因此可从各个用户群对应的置信度矩阵中确定得到不可靠的用户对对象的实际匹配度,而不可靠的用户对对象的实际匹配度是因为未曝光的对象,用户不知道与其进行交互,因此将赋予较低的置信度。
具体地,根据各个用户群的置信度矩阵确定历史操作行为矩阵中的待更新历史操作行为矩阵值,也就是将较低的置信度对应的矩阵值位置确定历史操作行为矩阵中的待更新历史操作行为矩阵值。由于各个用户群的历史操作行为更新矩阵与历史操作行为更新矩阵具有相同的维度,因此可根据待更新历史操作行为矩阵值的位置确定在历史操作行为更新矩阵相同位置的中间历史操作行为矩阵值,将各个用户群的中间历史操作行为矩阵值替换待更新历史操作行为矩阵值,得到各个用户群对应的目标历史操作行为矩阵。
例如,历史操作行为矩阵为:对应的置信度矩阵为:历史操作行为更新矩阵为:首先根据置信度确定历史操作行为矩阵中不可靠的历史操作行为矩阵值为:第2个用户对第2个对象的实际匹配度,以及第3个用户对第3个对象的实际匹配度。其次,获取历史操作行为更新矩阵中与待更新历史操作行为矩阵值对应的中间历史操作行为矩阵值为:第2个用户对第2个对象的预测匹配度为0.125,第3个用户对第3个对象的预测匹配度为0.152。最后,将中间历史操作行为矩阵值替换待更新历史操作行为矩阵值,得到对应的目标历史操作行为矩阵,则将第2个用户对第2个对象的预测匹配度0.125替换历史操作行为矩阵中第2个用户对第2个对象的实际匹配度0,将第3个用户对第3个对象的预测匹配度0.152替换历史操作行为矩阵中的第3个用户对第3个对象的实际匹配度0,得到最后的目标历史操作行为矩阵为:
在一个实施例中,如图13所示,提供了一种数据推送方法,本实施例主要以该方法应用于上述图1中的终端110或服务器120来举例说明。该数据推送方法具体包括以下步骤:
步骤1302,获取用户标识和待推送对象数据。
步骤1304,将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的。
步骤1306,目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度。
步骤1308,根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
其中,用户标识是用来唯一标识用户终端的,而待推送对象数据是指等待推送的对象的相关数据,将用户标识和待推送对象数据输入至目标神经网络预测模型中,其中目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的,具体可以参考图2所示的方法进行训练得到,在此不再作赘述。
进一步地,目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度,可根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。具体可以是,当关注匹配度满足预设关注条件时,则可将目标待推送对象数据发送至匹配的用户标识对应的终端用户中。
在一个具体的实施例中,提供一种数据处理方法以及数据推送方法,具体包括以下步骤:
1、获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度。
1-1、获取用户属性数据集合,用户属性数据集合包括多个用户属性数据。
1-2、生成与各个用户属性数据对应的用户属性数据对象。
1-2-1、获取各个用户属性数据对应的各个特征,将特征归入对应类型的特征集,类型包括连续型类型、离散型类型中的至少一种。
1-2-2、根据各个特征对应的类型,确定各个特征对应的特征编码方式。
1-2-3、根据各个特征对应的特征编码方式对对应的特征进行编码,得到各个用户属性数据对应的用户属性数据对象。
1-3、对各个用户属性数据对象进行聚类,得到多个用户群。
1-3-1、获取各个初始用户群的初始聚类中心,将初始聚类中心作为当前聚类中心。
1-3-2、将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度。
1-3-3、当初始相似度大于预设相似度时,将初始相似度对应的用户属性数据对象分配到当前聚类中心对应的初始用户群中,得到多个当前用户群。
1-3-4、根据各个当前用户群中的当前用户属性数据对象计算得到对应的各个更新聚类中心,将各个更新聚类中心作为当前聚类中心,返回将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度的步骤进行重复聚类,直到满足聚类收敛条件,得到多个用户群。
1-4、获取在各个用户群下用户与对象之间的用户对象交互数据。
1-4-1、获取在各个用户群下用户对对象的点击次数,将点击次数作为在各个用户群下用户与对象之间的用户对象交互数据。
1-5、根据各个用户群的用户对象交互数据生成各个用户群对应的历史操作行为矩阵。
1-5-1、将各个用户群的用户对对象的点击次数组成各个用户群对应的用户对象感兴趣数据矩阵。
1-5-2、根据预设规则将各个用户群对应的用户对象感兴趣数据矩阵转换为对应的历史操作行为矩阵。
1-6、根据各个用户群的用户对象交互数据计算得到各个用户群的历史操作行为矩阵对应的置信度矩阵。
1-6-1、根据各个用户群的用户对对象的点击次数确定用户关注度高的对象、用户关注度低的对象和用户待推荐对象。
1-6-2、将各个用户群的用户关注度高的对象和用户关注度低的对象对应的点击次数作为对应的置信度。
1-6-3、获取各个用户群下的对象总数目,根据各个用户群的对象总数目计算得到各个用户群的用户待推荐对象的置信度。
1-6-4、根据各个用户群的用户关注度高的对象和用户关注低的对象对应的点击次数作为对应的置信度,和用户待推荐对象的置信度组成各个用户群的历史操作行为矩阵对应的置信度矩阵。
2、利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
2-1、获取各个用户群对应的第一初始影响因子矩阵。
2-2、根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵生成各个用户群对应的第二初始影响因子矩阵。
2-2-1、根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第一损失函数。
2-2-2、当第一损失函数达到第一收敛条件时,则确定各个用户群对应的第二初始影响因子矩阵。
2-3、根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
2-3-1、根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第二损失函数。
2-3-2、当第二损失函数达到第二收敛条件时,则确定各个用户群的第一中间影响因子矩阵。
2-3-3、根据各个用户群的第一中间影响因子矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
2-4、根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
2-4-1、根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算对应的矩阵损失值。
2-4-2、当矩阵损失值达到第三收敛条件时,则将矩阵损失值对应的第一影响因子矩阵和第二影响因子矩阵确定为各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
3、根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵。
3-1、对各个用户群的第二目标影响因子矩阵进行转置,得到第二中间目标影响因子矩阵。
3-2、根据各个用户群第一目标影响因子矩阵和对应的第二中间目标影响因子矩阵计算得到历史操作行为更新矩阵。
4、根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵。
4-1、根据各个用户群的置信度矩阵确定历史操作行为矩阵中待更新历史操作行为矩阵值。
4-2、获取各个用户群的历史操作行为更新矩阵中与待更新历史操作行为矩阵值对应的中间历史操作行为矩阵值。
4-3、将各个用户群的中间历史操作行为矩阵值替换待更新历史操作行为矩阵值,得到各个用户群对应的目标历史操作行为矩阵。
5、将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度。
6、根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值。
7、根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
8、获取用户标识和待推送对象数据。
9、将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的。
10、目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度。
11、根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
在一个实际应用场景中,如图14所示,图14为一个实施例中数据处理方法的原理示意图,如图14所示的应用场景为用户对物品的喜好程度,即历史操作行为矩阵为用户-物品矩阵,第一影响因子矩阵为用户-用户偏好权重矩阵,第二影响因子矩阵为物品-物品属性优劣矩阵,神经网络预测模型为word2vec词向量编码模型。具体为以下步骤:
1、用户画像特征工程的构建:主要根据用户的性别、年龄、学历等构建画像特征并对特征进行进一步处理:连续特征如年龄等按不同区间分箱处理,增加年龄特征的鲁棒性,而离散画像如性别、学历等则转换为哑变量。
2、基于用户画像,使用聚类技术(K-MEANS、K-MEDOIDS)(k类)对用户进行分群:用户群1、用户群2、用户群3...用户群k。
3、同群用户下,对于曝光的物品,记录用户对物品的点击次数,点击次数属于隐式反馈信息,在这里,我们假设点击代表用户喜欢该物品,不点击代表用户讨厌该物品,以点击次数这个动作频率作为我们假设的置信度,对于没有曝光的物品,原假设为用户讨厌该物品,置信度很低。以这个完整的用户-物品矩阵作为训练数据。
4、基于函数拟合的思路,使用矩阵分解把用户-物品矩阵X(m*n,m为用户数量,n为物品数量)分解为两个低维矩阵,用户-用户偏好权重矩阵U(m*d,m为用户数量,物品属性可抽象为d维),物品-物品属性优劣矩阵P(n*d,n为物品数量,物品属性可抽象为d维)。
物品属性举例说明,如一个直播类物品,它的属性可以有画质、音效、主播、内容题材等等,抽象的物品属性无法对物品有清晰的描述,但可以作为在低维空间描述物品的一种有效手段。构建损失函数其中xij表示第i个用户对第j个物品的真实打分,aij表示第i个用户对第j个物品的真实打分的置信度,ui(d维向量)表示第i个用户对物品各项抽象属性的喜欢程度,pj表示第j个物品各项抽象属性的得分,表示第i个用户对第j个物品的预测打分(使用置信度,针对真实打分和预测打分的距离的平方,进行加权求和,构造损失函数;之前提及,置信度使用用户点击次数赋值,例如,用户点击了3次该物品,则xij=1,aij=3;该物品已曝光,用户没有点击,则xij=0,aij=1;该物品没有曝光,则xij=0,aij=0;)。关于求解最小化的损失函数,由于用户量m*物品量n很大,不宜使用梯度下降法,矩阵U和矩阵P均为未知矩阵,最终选用交替最小二乘法(Alternating LeastSquares),求解时先初始化其中一个矩阵,通过不断迭代求得全局极小值。另外,为了防止过拟合,损失函数需要进行正则化处理。
5、通过训练数据,求得使损失函数最小化的矩阵U和矩阵P,针对缺失数据,用函数拟合值矫正我们的原假设xab(用户a的客户端没有曝光物品b,原假设用户讨厌该物品,置信度很低)。
6、经过矫正的用户-物品矩阵X,每一个用户对应一个物品打分向量(n维),使用softmax回归函数把打分数值映射到0-1,得到新的用户-物品矩阵Y,设置阈值过滤用户大量讨厌物品,保留用户少量喜欢物品作为word2vec的训练数据进行特征处理(词向量编码),训练得到物品的低维稠密的向量(200维)。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图15所示,提供了一种数据处理装置1500,包括:
历史操作行为矩阵获取模块1502,用于获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度。
历史操作行为矩阵分解模块1504,用于利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
历史操作行为更新矩阵生成模块1506,用于根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵。
历史操作行为矩阵矫正模块1508,用于根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵。
初始神经网络预测模型计算模块1510,用于将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度。
初始神经网络预测模型计算模块1510还用于根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值。
初始神经网络预测模型训练模块1512,用于根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
在一个实施例中,如图16所示,历史操作行为矩阵获取模块1502包括:
用户属性数据获取单元1502a,用于获取用户属性数据集合,用户属性数据集合包括多个用户属性数据。
用户属性数据对象生成单元1502b,用于生成与各个用户属性数据对应的用户属性数据对象。
用户属性数据对象聚类单元1502c,用于对各个用户属性数据对象进行聚类,得到多个用户群。
用户对象交互数据获取单元1502d,用于获取在各个用户群下用户与对象之间的用户对象交互数据。
历史操作行为矩阵生成单元1502e,用于根据各个用户群的用户对象交互数据生成各个用户群对应的历史操作行为矩阵。
置信度矩阵计算单元1502f,用于根据各个用户群的用户对象交互数据计算得到各个用户群的历史操作行为矩阵对应的置信度矩阵。
在一个实施例中,用户属性数据对象生成单元1502b还用于获取各个用户属性数据对应的各个特征,将特征归入对应类型的特征集,类型包括连续型类型、离散型类型中的至少一种;根据各个特征对应的类型,确定各个特征对应的特征编码方式;根据各个特征对应的特征编码方式对对应的特征进行编码,得到各个用户属性数据对应的用户属性数据对象。
在一个实施例中,用户属性数据对象聚类单元1502c还用于获取各个初始用户群的初始聚类中心,将初始聚类中心作为当前聚类中心;将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度;当初始相似度大于预设相似度时,将初始相似度对应的用户属性数据对象分配到当前聚类中心对应的初始用户群中,得到多个当前用户群;根据各个当前用户群中的当前用户属性数据对象计算得到对应的各个更新聚类中心,将各个更新聚类中心作为当前聚类中心,返回将各个用户属性数据对象与各个当前聚类中心进行相似度计算得到对应的初始相似度的步骤进行重复聚类,直到满足聚类收敛条件,得到多个用户群。
在一个实施例中,历史操作行为矩阵获取模块1502还用于获取在各个用户群下用户对对象的点击次数,将点击次数作为在各个用户群下用户与对象之间的用户对象交互数据;将各个用户群的用户对对象的点击次数组成各个用户群对应的用户对象感兴趣数据矩阵;根据预设规则将各个用户群对应的用户对象感兴趣数据矩阵转换为对应的历史操作行为矩阵;根据各个用户群的用户对对象的点击次数确定用户关注度高的对象、用户关注度低的对象和用户待推荐对象;将各个用户群的用户关注度高的对象和用户关注度低的对象对应的点击次数作为对应的置信度;获取各个用户群下的对象总数目,根据各个用户群的对象总数目计算得到各个用户群的用户待推荐对象的置信度;根据各个用户群的用户关注度高的对象和用户关注低的对象对应的点击次数作为对应的置信度,和用户待推荐对象的置信度组成各个用户群的历史操作行为矩阵对应的置信度矩阵。
在一个实施例中,如图17所示,历史操作行为矩阵分解模块1504包括:
第一初始影响因子矩阵获取单元1504a,用于获取各个用户群对应的第一初始影响因子矩阵。
第二初始影响因子矩阵生成单元1504b,用于根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵生成各个用户群对应的第二初始影响因子矩阵。
第一初始影响因子矩阵更新单元1504c,用于根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
目标影响因子矩阵计算单元1504d,用于根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
在一个实施例中,第二初始影响因子矩阵生成单元1504b还用于根据各个用户群的第一初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第一损失函数;当第一损失函数达到第一收敛条件时,则确定各个用户群对应的第二初始影响因子矩阵。
在一个实施例中,第一初始影响因子矩阵更新单元1504c还用于根据各个用户群的第二初始影响因子矩阵和对应的历史操作行为矩阵构建对应的第二损失函数;当第二损失函数达到第二收敛条件时,则确定各个用户群的第一中间影响因子矩阵;根据各个用户群的第一中间影响因子矩阵更新对应的第一初始影响因子矩阵,得到各个用户群的第一更新影响因子矩阵。
在一个实施例中,目标影响因子矩阵计算单元1504d还用于根据各个用户群的第一更新影响因子矩阵、第二初始影响因子矩阵和历史操作行为矩阵计算对应的矩阵损失值;当矩阵损失值达到第三收敛条件时,则将矩阵损失值对应的第一影响因子矩阵和第二影响因子矩阵确定为各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
在一个实施例中,历史操作行为更新矩阵生成模块1506还用于对各个用户群的第二目标影响因子矩阵进行转置,得到第二中间目标影响因子矩阵;根据各个用户群第一目标影响因子矩阵和对应的第二中间目标影响因子矩阵计算得到历史操作行为更新矩阵。
在一个实施例中,历史操作行为矩阵矫正模块1508还用于根据各个用户群的置信度矩阵确定历史操作行为矩阵中待更新历史操作行为矩阵值;获取各个用户群的历史操作行为更新矩阵中与待更新历史操作行为矩阵值对应的中间历史操作行为矩阵值;将各个用户群的中间历史操作行为矩阵值替换待更新历史操作行为矩阵值,得到各个用户群对应的目标历史操作行为矩阵。
在一个实施例中,如图18所示,提供了一种数据推送装置1800,该装置包括:
用户标识获取模块1802,用于获取用户标识和待推送对象数据;
目标神经网络预测模型计算模块1804,用于将用户标识和待推送对象数据输入至目标神经网络预测模型中,目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;
目标神经网络预测模型计算模块1804还用于目标神经网络预测模型计算用户标识和待推送对象数据之间的关注匹配度;
待推送对象数据推送模块1806,用于根据关注匹配度向用户标识对应的终端用户推送目标待推送对象数据。
图19示出了一个实施例中计算机设备的内部结构图。该计算机设备具体可以是图1中的终端110或服务器120。如图19所示,该计算机设备包括该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、输入装置和显示屏。其中,存储器包括非易失性存储介质和内存储器。该计算机设备的非易失性存储介质存储有操作系统,还可存储有计算机程序,该计算机程序被处理器执行时,可使得处理器实现数据处理方法或者数据推送方法。该内存储器中也可储存有计算机程序,该计算机程序被处理器执行时,可使得处理器执行数据处理方法或者数据推送方法。计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。应当说明的是,若计算机设备为图1中的服务器120时,该计算机设备不包括显示屏。
本领域技术人员可以理解,图19中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,本申请提供的数据处理装置可以实现为一种计算机程序的形式,计算机程序可在如图19所示的计算机设备上运行。计算机设备的存储器中可存储组成该数据处理装置的各个程序模块,比如,图15所示的A模块、B模块和C模块。各个程序模块构成的计算机程序使得处理器执行本说明书中描述的本申请各个实施例的数据处理方法中的步骤。
例如,图19所示的计算机设备可以通过如图15所示的数据处理装置中的历史操作行为矩阵获取模块执行获取各个用户群对应的历史操作行为矩阵,各个用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;历史操作行为矩阵分解模块执行利用矩阵分解对各个用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;历史操作行为更新矩阵生成模块执行根据各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个用户群对应的历史操作行为更新矩阵;历史操作行为矩阵矫正模块执行根据各个用户群对应的历史操作行为更新矩阵和对应的置信度矩阵矫正对应的历史操作行为矩阵,得到各个用户群对应的目标历史操作行为矩阵;初始神经网络预测模型计算模块执行将各个用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个用户群对应的用户与对象之间的预测匹配度;初始神经网络预测模型计算模块还执行根据各个用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;初始神经网络预测模型训练模块执行根据训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述数据处理方法的步骤。此处数据处理方法的步骤可以是上述各个实施例的数据处理方法中的步骤。
在一个实施例中,提供了一种计算机可读存储介质,存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述数据处理方法的步骤。此处数据处理方法的步骤可以是上述各个实施例的数据处理方法中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (15)

1.一种数据处理方法,包括:
获取各个用户群对应的历史操作行为矩阵,各个所述用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个所述用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
利用矩阵分解对各个所述用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
根据各个所述用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个所述用户群对应的历史操作行为更新矩阵;
根据各个所述用户群对应的历史操作行为更新矩阵和对应的所述置信度矩阵矫正对应的历史操作行为矩阵,得到各个所述用户群对应的目标历史操作行为矩阵;
将各个所述用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个所述用户群对应的用户与对象之间的预测匹配度;
根据各个所述用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
根据所述训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
2.根据权利要求1所述的方法,其特征在于,所述获取各个用户群对应的历史操作行为矩阵,各个所述用户群的历史操作行为矩阵都存在对应的置信度矩阵,包括:
获取用户属性数据集合,所述用户属性数据集合包括多个用户属性数据;
生成与各个所述用户属性数据对应的用户属性数据对象;
对各个所述用户属性数据对象进行聚类,得到多个用户群;
获取在各个所述用户群下用户与对象之间的用户对象交互数据;
根据各个所述用户群的用户对象交互数据生成各个所述用户群对应的历史操作行为矩阵;
根据所述各个所述用户群的用户对象交互数据计算得到各个所述用户群的历史操作行为矩阵对应的置信度矩阵。
3.根据权利要求2所述的方法,其特征在于,所述生成与各个所述用户属性数据对应的用户属性数据对象,包括:
获取各个所述用户属性数据对应的各个特征,将所述特征归入对应类型的特征集,所述类型包括连续型类型、离散型类型中的至少一种;
根据各个所述特征对应的类型,确定各个所述特征对应的特征编码方式;
根据各个所述特征对应的特征编码方式对对应的特征进行编码,得到各个所述用户属性数据对应的用户属性数据对象。
4.根据权利要求2所述的方法,其特征在于,所述对各个所述用户属性数据对象进行聚类,得到多个用户群,包括:
获取各个初始用户群的初始聚类中心,将所述初始聚类中心作为当前聚类中心;
将各个所述用户属性数据对象与各个所述当前聚类中心进行相似度计算得到对应的初始相似度;
当所述初始相似度大于预设相似度时,将所述初始相似度对应的所述用户属性数据对象分配到所述当前聚类中心对应的所述初始用户群中,得到多个当前用户群;
根据各个所述当前用户群中的当前用户属性数据对象计算得到对应的各个更新聚类中心,将所述各个更新聚类中心作为当前聚类中心,返回所述将各个所述用户属性数据对象与各个所述当前聚类中心进行相似度计算得到对应的初始相似度的步骤进行重复聚类,直到满足聚类收敛条件,得到所述多个用户群。
5.根据权利要求2所述的方法,其特征在于,所述获取在各个所述用户群下用户与对象之间的用户对象交互数据,包括:
获取在各个所述用户群下用户对对象的点击次数,将所述点击次数作为在各个所述用户群下用户与对象之间的用户对象交互数据;
所述根据各个所述用户群的用户对象交互数据生成各个所述用户群对应的历史操作行为矩阵,包括:
将各个所述用户群的所述用户对对象的点击次数组成各个所述用户群对应的用户对象感兴趣数据矩阵;
根据预设规则将各个所述用户群对应的用户对象感兴趣数据矩阵转换为对应的历史操作行为矩阵;
所述根据所述各个所述用户群下的用户对象交互数据计算得到各个所述用户群的历史操作行为矩阵对应的置信度矩阵,包括:
根据各个所述用户群的用户对对象的点击次数确定用户关注度高的对象、用户关注度低的对象和用户待推荐对象;
将各个所述用户群的所述用户关注度高的对象和所述用户关注度低的对象对应的点击次数作为对应的置信度;
获取各个所述用户群下的对象总数目,根据各个所述用户群的所述对象总数目计算得到各个所述用户群的所述用户待推荐对象的置信度;
根据各个所述用户群的所述用户关注度高的对象和所述用户关注低的对象对应的点击次数作为对应的置信度,和所述用户待推荐对象的置信度组成各个所述用户群的历史操作行为矩阵对应的置信度矩阵。
6.根据权利要求1所述的方法,其特征在于,所述利用矩阵分解对各个所述用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵,包括:
获取各个所述用户群对应的第一初始影响因子矩阵;
根据各个所述用户群的第一初始影响因子矩阵和对应的所述历史操作行为矩阵生成各个所述用户群对应的第二初始影响因子矩阵;
根据各个所述用户群的第二初始影响因子矩阵和对应的所述历史操作行为矩阵更新对应的所述第一初始影响因子矩阵,得到各个所述用户群的第一更新影响因子矩阵;
根据各个所述用户群的第一更新影响因子矩阵、所述第二初始影响因子矩阵和所述历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
7.根据权利要求6所述的方法,其特征在于,所述根据各个所述用户群的第一初始影响因子矩阵和对应的所述历史操作行为矩阵生成各个所述用户群对应的第二初始影响因子矩阵,包括:
根据各个所述用户群的第一初始影响因子矩阵和对应的所述历史操作行为矩阵构建对应的第一损失函数;
当所述第一损失函数达到第一收敛条件时,则确定各个所述用户群对应的第二初始影响因子矩阵。
8.根据权利要求6所述的方法,其特征在于,所述根据各个所述用户群的第二初始影响因子矩阵和对应的所述历史操作行为矩阵更新对应的所述第一初始影响因子矩阵,得到各个所述用户群的第一更新影响因子矩阵,包括:
根据各个所述用户群的第二初始影响因子矩阵和对应的所述历史操作行为矩阵构建对应的第二损失函数;
当所述第二损失函数达到第二收敛条件时,则确定各个所述用户群的第一中间影响因子矩阵;
根据各个所述用户群的所述第一中间影响因子矩阵更新对应的所述第一初始影响因子矩阵,得到各个所述用户群的第一更新影响因子矩阵。
9.根据权利要求1所述的方法,其特征在于,所述根据各个所述用户群的第一更新影响因子矩阵、所述第二初始影响因子矩阵和所述历史操作行为矩阵计算得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵,包括:
根据各个所述用户群的第一更新影响因子矩阵、所述第二初始影响因子矩阵和所述历史操作行为矩阵计算对应的矩阵损失值;
当所述矩阵损失值达到第三收敛条件时,则将所述矩阵损失值对应的第一影响因子矩阵和第二影响因子矩阵确定为各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵。
10.根据权利要求1所述的方法,其特征在于,所述根据各个所述用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个所述用户群对应的历史操作行为更新矩阵,包括:
对各个所述用户群的第二目标影响因子矩阵进行转置,得到第二中间目标影响因子矩阵;
根据各个所述用户群第一目标影响因子矩阵和对应的所述第二中间目标影响因子矩阵计算得到历史操作行为更新矩阵。
11.根据权利要求1所述的方法,其特征在于,所述根据各个所述用户群对应的历史操作行为更新矩阵和对应的所述置信度矩阵矫正对应的历史操作行为矩阵,得到各个所述用户群对应的目标历史操作行为矩阵,包括:
根据各个所述用户群的所述置信度矩阵确定所述历史操作行为矩阵中待更新历史操作行为矩阵值;
获取各个所述用户群的所述历史操作行为更新矩阵中与所述待更新历史操作行为矩阵值对应的中间历史操作行为矩阵值;
将各个所述用户群的所述中间历史操作行为矩阵值替换所述待更新历史操作行为矩阵值,得到各个所述用户群对应的目标历史操作行为矩阵。
12.一种数据推送方法,其特征在于,包括:
获取用户标识和待推送对象数据;
将所述用户标识和待推送对象数据输入至目标神经网络预测模型中,所述目标神经网络预测模型是通过各个用户群的目标历史操作行为矩阵训练得到的,所述目标历史操作行为矩阵是根据用户历史行为数据矩阵生成得到的;
所述目标神经网络预测模型计算所述用户标识和所述待推送对象数据之间的关注匹配度;
根据所述关注匹配度向所述用户标识对应的终端用户推送目标待推送对象数据。
13.一种数据处理装置,其特征在于,所述装置包括:
历史操作行为矩阵获取模块,用于获取各个用户群对应的历史操作行为矩阵,各个所述用户群的历史操作行为矩阵都存在对应的置信度矩阵,各个所述用户群的历史操作行为矩阵用于描述用户与对象之间的实际匹配度;
历史操作行为矩阵分解模块,用于利用矩阵分解对各个所述用户群对应的历史操作行为矩阵进行分解,得到各个用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵;
历史操作行为更新矩阵生成模块,用于根据各个所述用户群对应的第一目标影响因子矩阵和第二目标影响因子矩阵生成得到各个所述用户群对应的历史操作行为更新矩阵;
历史操作行为矩阵矫正模块,用于根据各个所述用户群对应的历史操作行为更新矩阵和对应的所述置信度矩阵矫正对应的历史操作行为矩阵,得到各个所述用户群对应的目标历史操作行为矩阵;
初始神经网络预测模型计算模块,用于将各个所述用户群对应的目标历史操作行为矩阵输入至初始神经网络预测模型,计算得到各个所述用户群对应的用户与对象之间的预测匹配度;
所述初始神经网络预测模型计算模块还用于根据各个所述用户群的预测匹配度和对应的实际匹配度计算得到训练损失值;
初始神经网络预测模型训练模块,用于根据所述训练损失值不断调整初始神经网络预测模型的模型参数,直至满足收敛条件,得到目标神经网络预测模型。
14.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
15.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如权利要求1至12中任一项所述方法的步骤。
CN201910262185.6A 2019-04-02 2019-04-02 数据处理方法以及数据推送方法 Active CN110213325B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910262185.6A CN110213325B (zh) 2019-04-02 2019-04-02 数据处理方法以及数据推送方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910262185.6A CN110213325B (zh) 2019-04-02 2019-04-02 数据处理方法以及数据推送方法

Publications (2)

Publication Number Publication Date
CN110213325A true CN110213325A (zh) 2019-09-06
CN110213325B CN110213325B (zh) 2021-09-24

Family

ID=67785072

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910262185.6A Active CN110213325B (zh) 2019-04-02 2019-04-02 数据处理方法以及数据推送方法

Country Status (1)

Country Link
CN (1) CN110213325B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111291264A (zh) * 2020-01-23 2020-06-16 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN112269937A (zh) * 2020-11-16 2021-01-26 加和(北京)信息科技有限公司 一种计算用户相似度的方法、系统及装置
CN112307341A (zh) * 2020-11-02 2021-02-02 沈阳民航东北凯亚有限公司 航班推送方法及装置
CN112685641A (zh) * 2020-12-31 2021-04-20 五八有限公司 一种信息处理方法及装置
CN112733006A (zh) * 2019-10-14 2021-04-30 中国移动通信集团上海有限公司 用户画像的生成方法、装置、设备及存储介质
CN112765468A (zh) * 2021-01-23 2021-05-07 珠海金智维信息科技有限公司 一种个性化用户服务定制方法和装置
CN113098916A (zh) * 2019-12-23 2021-07-09 中国移动通信集团辽宁有限公司 基于网络行为数据的信息推送方法及装置

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095219A (zh) * 2014-04-23 2015-11-25 华为技术有限公司 微博推荐方法和终端
US20160019387A1 (en) * 2014-07-16 2016-01-21 Microsoft Corporation Behavior Change Detection System for Services
CN105550211A (zh) * 2015-12-03 2016-05-04 云南大学 一种融合社交网络和项目内容的协同推荐系统
CN105631535A (zh) * 2015-12-17 2016-06-01 东软集团股份有限公司 一种评分数据预测方法及装置
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
US20170228659A1 (en) * 2016-02-04 2017-08-10 Adobe Systems Incorporated Regularized Iterative Collaborative Feature Learning From Web and User Behavior Data
EP3229207A2 (en) * 2016-04-08 2017-10-11 Goodrich Corporation Warp models for registering multi-spectral imagery
CN107885796A (zh) * 2017-10-27 2018-04-06 阿里巴巴集团控股有限公司 信息推荐方法及装置、设备
WO2018085946A1 (en) * 2016-11-14 2018-05-17 Nuralogix Corporation System and method for detecting subliminal facial responses in response to subliminal stimuli
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095219A (zh) * 2014-04-23 2015-11-25 华为技术有限公司 微博推荐方法和终端
US20160019387A1 (en) * 2014-07-16 2016-01-21 Microsoft Corporation Behavior Change Detection System for Services
CN105550211A (zh) * 2015-12-03 2016-05-04 云南大学 一种融合社交网络和项目内容的协同推荐系统
CN105631535A (zh) * 2015-12-17 2016-06-01 东软集团股份有限公司 一种评分数据预测方法及装置
US20170228659A1 (en) * 2016-02-04 2017-08-10 Adobe Systems Incorporated Regularized Iterative Collaborative Feature Learning From Web and User Behavior Data
EP3229207A2 (en) * 2016-04-08 2017-10-11 Goodrich Corporation Warp models for registering multi-spectral imagery
CN106484777A (zh) * 2016-09-12 2017-03-08 腾讯科技(深圳)有限公司 一种多媒体数据处理方法以及装置
WO2018085946A1 (en) * 2016-11-14 2018-05-17 Nuralogix Corporation System and method for detecting subliminal facial responses in response to subliminal stimuli
CN107885796A (zh) * 2017-10-27 2018-04-06 阿里巴巴集团控股有限公司 信息推荐方法及装置、设备
CN109284417A (zh) * 2018-08-27 2019-01-29 广州飞磨科技有限公司 视频推送方法、装置、计算机设备和存储介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CHINTAN SHAH: "A Hybrid Approach of Text Summarization Using Latent Semantic Analysis and Deep Learning", 《2018 INTERNATIONAL CONFERENCE ON ADVANCES IN COMPUTING, COMMUNICATIONS AND INFORMATICS (ICACCI)》 *
杨苏雁: "基于矩阵分解及深度神经网络的推荐排序学习方法研究", 《信息科技辑》 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112733006A (zh) * 2019-10-14 2021-04-30 中国移动通信集团上海有限公司 用户画像的生成方法、装置、设备及存储介质
CN113098916A (zh) * 2019-12-23 2021-07-09 中国移动通信集团辽宁有限公司 基于网络行为数据的信息推送方法及装置
CN113098916B (zh) * 2019-12-23 2023-11-14 中国移动通信集团辽宁有限公司 基于网络行为数据的信息推送方法及装置
CN111291264A (zh) * 2020-01-23 2020-06-16 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN111291264B (zh) * 2020-01-23 2023-06-23 腾讯科技(深圳)有限公司 基于机器学习的访问对象预测方法、装置和计算机设备
CN112307341A (zh) * 2020-11-02 2021-02-02 沈阳民航东北凯亚有限公司 航班推送方法及装置
CN112269937A (zh) * 2020-11-16 2021-01-26 加和(北京)信息科技有限公司 一种计算用户相似度的方法、系统及装置
CN112269937B (zh) * 2020-11-16 2024-02-02 加和(北京)信息科技有限公司 一种计算用户相似度的方法、系统及装置
CN112685641A (zh) * 2020-12-31 2021-04-20 五八有限公司 一种信息处理方法及装置
CN112685641B (zh) * 2020-12-31 2023-04-07 五八有限公司 一种信息处理方法及装置
CN112765468A (zh) * 2021-01-23 2021-05-07 珠海金智维信息科技有限公司 一种个性化用户服务定制方法和装置

Also Published As

Publication number Publication date
CN110213325B (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
CN110213325A (zh) 数据处理方法以及数据推送方法
CN112529168B (zh) 一种基于gcn的属性多层网络表示学习方法
Sun et al. Representative task self-selection for flexible clustered lifelong learning
Zhang et al. A cross-domain recommender system with kernel-induced knowledge transfer for overlapping entities
CN113299354B (zh) 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
CN109345302A (zh) 机器学习模型训练方法、装置、存储介质和计算机设备
Wan et al. Deep matrix factorization for trust-aware recommendation in social networks
CN110162701A (zh) 内容推送方法、装置、计算机设备和存储介质
Cheng et al. Learning transferable user representations with sequential behaviors via contrastive pre-training
Mandala et al. Clustering social networks using ant colony optimization
CN110175286A (zh) 结合成对优化和矩阵分解的产品推荐方法及系统
Chen et al. Federated-WDCGAN: A federated smart meter data sharing framework for privacy preservation
CN112417289A (zh) 一种基于深度聚类的资讯信息智能推荐方法
Zhang et al. Learning user representations with hypercuboids for recommender systems
Zhou et al. The dual-fuzzy convolutional neural network to deal with handwritten image recognition
CN115168721A (zh) 融合协同变换与时态感知的用户兴趣推荐方法及系统
Liu et al. Gflowout: Dropout with generative flow networks
Qin et al. Federated deep contrastive learning for mid-term natural gas demand forecasting
Ding et al. User identification across multiple social networks based on naive Bayes model
Niknam et al. DyVGRNN: DYnamic mixture variational graph recurrent neural networks
Zhou et al. Online recommendation based on incremental-input self-organizing map
Wei et al. Short-term load forecasting using spatial-temporal embedding graph neural network
Liang et al. A normalizing flow-based co-embedding model for attributed networks
Zhang et al. Cross-domain recommendation with multi-auxiliary domains via consistent and selective cluster-level knowledge transfer
Atif et al. Structured nonnegative matrix factorization for traffic flow estimation of large cloud networks

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant