CN110598845A - 数据处理方法、装置、计算机设备和存储介质 - Google Patents

数据处理方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110598845A
CN110598845A CN201910746149.7A CN201910746149A CN110598845A CN 110598845 A CN110598845 A CN 110598845A CN 201910746149 A CN201910746149 A CN 201910746149A CN 110598845 A CN110598845 A CN 110598845A
Authority
CN
China
Prior art keywords
neural network
network model
training sample
feature
cross
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910746149.7A
Other languages
English (en)
Other versions
CN110598845B (zh
Inventor
黄严汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN201910746149.7A priority Critical patent/CN110598845B/zh
Publication of CN110598845A publication Critical patent/CN110598845A/zh
Application granted granted Critical
Publication of CN110598845B publication Critical patent/CN110598845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Strategic Management (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请涉及机器学习领域,提供了一种数据处理方法、装置、计算机设备和存储介质。该方法包括:获取训练样本集合,各个训练样本都存在对应的训练样本标签;对各个训练样本进行向量化处理,得到对应的特征向量;将各个训练样本的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本的交叉特征;将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成对应的图像特征图;将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;根据预测概率值和训练样本标签计算得到训练损失值;根据训练损失值对第三神经网络模型进行训练,最终得到已训练的第三神经网络模型。

Description

数据处理方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种数据处理方法、装置、计算机设备和存储介质。
背景技术
传统技术中,根据实际应用场景利用神经网络模型来对输入数据的行为进行预测,然而,传统的神经网络模型在进行数据处理时,直接将输入数据输入至神经网络模型,得到神经网络模型的输出结果,而不对输入数据进行任何处理,容易导致出现神经网络在进行数据处理时出现准确性低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高数据处理准确率的数据处理方法、装置、计算机设备和存储介质。
一种数据处理方法,该方法包括:
获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据预测概率值和对应的训练样本标签计算得到训练损失值;
根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
在其中一个实施例中,对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,包括:对各个训练样本进行分词,得到分词后的词语;根据分词后的词语对应的词语属性,将分词后的词语分成对应的序列特征和非序列特征;对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对非序列特征和处理后的序列特征进行向量化处理,得到各个训练样本对应的特征向量。
在其中一个实施例中,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到对应的交叉特征,包括:获取各个特征向量在预设维度上对应的目标子特征向量;获取各个特征向量在预设维度上对应的预设子特征向量;获取各个特征向量在预设维度上对应的预设卷积和权重;根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。
在其中一个实施例中,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图,包括:第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征;第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征;第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵;第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
在其中一个实施例中,训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,训练样本标签为用户点击目标商品的真实点击概率。
一种数据处理装置,该装置包括:
训练样本获取模块,用于获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
向量化处理模块,用于对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
第一神经网络处理模块,用于将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
第二神经网络处理模块,用于将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
第三神经网络处理模块,用于将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
损失值计算模块,用于根据预测概率值和对应的训练样本标签计算得到训练损失值;
第三神经网络训练模块,用于根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行所述计算机程序时实现以下步骤:
获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据预测概率值和对应的训练样本标签计算得到训练损失值;
根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据预测概率值和对应的训练样本标签计算得到训练损失值;
根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
上述数据处理方法、装置、计算机设备和存储介质,通过第一神经网络模型输出得到各个训练样本对应的交叉特征,输入至第二神经网络模型,通过第二神经网络模型对交叉特征进行内积计算得到对应的图像特征图,根据训练样本和图像特征图对第三神经网络模型进行训练。其中交叉特征是各个训练样本之间的共同特征或者相同特征组成的,因此将训练样本结合交叉特征一起对第三神经网络模型进行训练,提高第三神经网络模型进行网络行为预测的准确性。
附图说明
图1为一个实施例中数据处理方法的应用场景图;
图2为一个实施例中数据处理方法的流程示意图;
图3为一个实施例中训练样本向量化处理步骤的流程示意图;
图4为一个实施例中第一神经网络模型处理步骤的流程示意图;
图5为一个实施例中第二神经网络模型处理步骤的流程示意图;
图6为一个实施例中数据处理装置的结构框图;
图7为一个实施例中向量化处理模块的结构框图;
图8为一个实施例中第一神经网络处理模块的结构框图;
图9为一个实施例中第二神经网络处理模块的结构框图;
图10为一个实施例中计算机设备的内部结构图;
图11为另一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104通过网络进行通信。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
具体地,终端102将训练样本集合发送至服务器104,服务器104获取到训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;根据预测概率值和对应的训练样本标签计算得到训练损失值;根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型。进一步地,服务器104可将已训练的第三神经网络模型发送至终端102,供终端102对第三神经网络模型进行应用。
在一个实施例中,如图2所示,提供了一种数据处理方法,以该方法应用于图1中的终端或者服务器为例进行说明,包括以下步骤:
步骤202,获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签。
其中,训练样本集合是用来训练第一神经网络模型的训练数据,可以根据业务需求或者应用场景采集相应的样本数据,训练样本集合中的各个训练样本都存在对应的训练样本标签,所谓训练样本标签是指训练样本对应的真实标签,可以通过人为对训练样本打上对应的训练样本标签,如,训练样本是用来进行分类的,则对应的真实标签可以是正样本或者负样本。
在一个实施例中,训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,训练样本标签为用户点击目标商品的真实点击概率。
其中,用户行为信息是指与用户行为有关的信息,例如用户是否购买了某商品的购买行为,或者用户隔了多长时间购买了某商品的购买时间等等。所谓用户商品交互信息是指用户与商品进行交互产生的有关信息,例如用户购买了某商品几次、相隔多长时间进行购买等等。用户属性信息是指与用户基本信息有关的信息,例如用户收入、用户喜好程度等等,而商品属性信息是指与商品基本信息有关的信息,例如商品标价、商品成本价、商品利润等等。
而这里的训练样本标签是指用户对训练样本的真实点击概率,可通过统计各个训练样本对应的点击概率,将统计后的点击概率作为训练样本标签。
步骤204,对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量。
其中,由于训练样本很多是非结构化的数据,对于神经网络模型来说,非结构化的数据在进行数据处理时容易无法识别对应的特征,因此需要进行向量化处理,将非结构化的训练样本转换成结构化的特征向量,以便于神经网络模型进行数据处理。向量化处理是指将训练样本转换成对应的特征向量的处理过程。具体地,在获取到训练样本集合后,需要对训练样本集合进行加工处理,具体可以是对训练样本集合中的各个训练样本进行向量化处理,得到各个训练样本对应的特征向量。向量化处理具体可以是借助向量化处理应用对各个训练样本进行向量化处理,得到对应的特征向量。步骤206,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征。
其中,这里的第一神经网络模型是指已训练好的神经网络模型,用于计算得到训练样本之间的交叉特征的。所谓交叉特征是指各个训练样本之间存在的共同或者相同的特征,将共同或者相同的特征作为交叉特征。具体地,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征,输出交叉特征。
步骤208,将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图。
其中,这里的第二神经网络模型是已训练好的神经网络模型,用来生成图像特征图,图像特征图是对交叉特征进行内积计算得到的结果。为了能够反映交叉特征之间的向量交叉结果,因此需要将第一神经网络模型输出的交叉特征输入至第二神经网络模型,通过第二神经网络模型对交叉特征进行内积计算,得到与交叉特征对应的图像特征图。
步骤210,将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值。
其中,第三神经网络模型是用来预测训练样本网络行为对应的概率值的网络模型,网络行为可以是购买行为、喜爱程度等等。第三神经网络模型是未进行训练的,为了提高第三神经网络模型的预测概率值,将各个训练样本和图像特征图输入至第三神经网络模型中,通过第三神经网络模型根据训练样本和图像特征图进行特征提取、计算得到各个训练样本对应的预测概率值。
步骤212,根据预测概率值和对应的训练样本标签计算得到训练损失值。
具体地,在得到各个训练样本对应的预测概率值后,根据预测概率值和对应的训练样本标签计算得到训练损失值,其中训练损失值的计算方式可自定义,自定义可以是根据预测概率值和训练样本标签进行均值计算,将均值计算得到的结果作为训练损失值,或者是根据预测概率值和训练样本标签进行加权求和计算,将加权求和计算得到的结果作为训练损失值等等。
步骤214,根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
具体地,在计算得到训练损失值后,根据训练损失值对第三神经网络模型进行训练,不断调整第三神经网络模型的模型参数,直至满足收敛条件,得到已训练好的第三神经网络模型。其中,收敛条件可自定义,自定义可以是当训练损失值不再发生变化时,可认为第三神经网络模型达到收敛,或者还可以是训练损失值达到最小时,则可认为第三神经网络模型达到收敛。
上述数据处理方法中,通过第一神经网络模型输出得到各个训练样本对应的交叉特征,输入至第二神经网络模型,通过第二神经网络模型对交叉特征进行内积计算得到对应的图像特征图,根据训练样本和图像特征图对第三神经网络模型进行训练。其中交叉特征是各个训练样本之间的共同特征或者相同特征组成的,因此将训练样本结合交叉特征一起对第三神经网络模型进行训练,提高第三神经网络模型进行网络行为预测的准确性。
在一个实施例中,如图3所示,对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,包括:
步骤302,对各个训练样本进行分词,得到分词后的词语。
其中,由于训练样本一般是以句子形式的评论或者文章,因此需要对训练样本进行分词,得到分词后的多个词语。具体的,在获取训练样本后,会对训练样本按照一定的规则进行分割,得到分词后的词语。其中,分割规则可根据词语在句子中的成分、词语的词性以及词语的搭配习惯进行分割。
步骤304,根据分词后的词语对应的词语属性,将分词后的词语分成对应的序列特征和非序列特征。
步骤306,对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对非序列特征和处理后的序列特征进行向量化处理,得到各个训练样本对应的特征向量。
其中,词语属性是指与词语相关的属性信息,可根据分词后的词语对应的词语属性将分词后的词语分成对应的序列特征和非序列特征,序列特征是与用户商品交互相关的特征,将用户商品交互相关的特征归为序列特征,如序列特征可以是用户对商品的点击、用户对商品的购买。而非序列特征是指与用户基本信息相关的特征,将与用户基本信息相关的特征归为非序列特征,如非序列特征可以是用户的年龄、用户的收入等等。
进一步地,当将分词后的词语分成对应的序列特征和非序列特征后,由于序列特征和非序列特征的处理方式不同,具体可以是,序列特征的处理方式是,对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,而非序列特征的处理方式则无需进行其他处理,直接将非序列特征和处理后的序列特征都进行向量化处理,得到各个训练样本对应的特征向量。
在一个实施例中,如图4所示,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到对应的交叉特征,包括:
步骤402,获取各个特征向量在预设维度上对应的目标子特征向量。
步骤404,获取各个特征向量在预设维度上对应的预设子特征向量。
步骤406,获取各个特征向量在预设维度上对应的预设卷积和权重。
步骤408,根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。
其中,由于特征向量是多维的特征向量,而为了减少数据量的计算,因此无需对各维的子特征向量都进行计算,可直接只计算预设维度上的交叉特征。具体可以是,获取各个特征向量在预设维度上的目标子特征向量、预设子特征向量和预设卷积和权重,所谓目标子特征向量是指特征向量在预设维度上对应的子特征向量,其中预设维度可以是根据业务需求或者应用场景从特征向量的多个维度确定得到的。而预设子特征向量是指该预设维度预先设置的子特征向量,可作为目标子特征向量的参考子特征向量,可预先设置。而预设卷积和权重都是为该预设维度预先设置的卷积和权重,特征向量各个维度对应的预设卷积和权重都是不同的。
具体地,在获取到各个特征向量在预设维度上对应的目标子特征向量、预设子特征向量和预设卷积和权重,根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。其中,交叉特征的计算方式可自定义,自定义可以是根据目标子特征向量、预设子特征向量和预设卷积和权重进行加权求和计算,将加权求和计算得到的结果作为交叉特征,或者还可以是根据目标子特征向量、预设子特征向量和预设卷积和权重进行均值计算,将均值计算得到的结果作为交叉特征等等。
在一个实施例中,如图5所示,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图,包括:
步骤502,第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征。
其中,预设维度信息是指与预设维度相关的信息,第一神经网络模型将输出的交叉特征输入至第二神经网络模型后,第二神经网络模型获取预设维度信息,根据预设维度信息对交叉特征进行切分,得到预设维度上的各个子交叉特征。
步骤504,第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征。
具体地,在得到预设维度上的各个子交叉特征后,第二神经网络模型对各个子交叉特征进行特征组合,得到目标交叉特征。其中,特征组合方式可自定义,自定义可以是对各个子交叉特征进行外积计算,将外积计算得到的结果作为目标交叉特征,或者自定义还可以是各个子交叉特征与预设交叉阶数进行计算,得到目标交叉特征。
步骤506,第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵。
步骤508,第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
具体地,在得到各个训练样本对应的目标交叉特征后,根据各个目标交叉特征生成交叉特征矩阵,具体可以是将各个目标交叉特征按照预设阶数组成交叉特征矩阵。进一步地,在生成得到交叉特征矩阵后,第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
应该理解的是,虽然上述流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图6所示,提供了一种数据处理装置600,包括训练样本获取模块602、向量化处理模块604、第一神经网络处理模块606、第二神经网络处理模块608、第三神经网络处理模块610、损失值计算模块612和第三神经网络训练模块614,其中:
训练样本获取模块602,用于获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签。
向量化处理模块604,用于对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量。
第一神经网络处理模块606,用于将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征。
第二神经网络处理模块608,用于将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图。
第三神经网络处理模块610,用于将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值。
损失值计算模块612,用于根据预测概率值和对应的训练样本标签计算得到训练损失值。
第三神经网络训练模块614,用于根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
在一个实施例中,如图7所示,向量化处理模块604包括:
训练样本分词单元604a,用于对各个训练样本进行分词,得到分词后的词语。
词语处理单元604b,用于根据分词后的词语对应的词语属性,将分词后的词语分成对应的序列特征和非序列特征。
特征向量生成单元604c,用于对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对非序列特征和处理后的序列特征进行向量化处理,得到各个训练样本对应的特征向量。
在一个实施例中,如图8所示,第一神经网络处理模块606包括:
目标子特征向量获取单元606a,用于获取各个特征向量在预设维度上对应的目标子特征向量。
预设子特征向量获取单元606b,用于获取各个特征向量在预设维度上对应的预设子特征向量。
权重获取单元606c,用于获取各个特征向量在预设维度上对应的预设卷积和权重。
交叉特征计算单元606d,用于根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。
在一个实施例中,如图9所示,第二神经网络处理模块608包括:
交叉特征切分单元608a,用于第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征。
子交叉特征组合单元608b,用于第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征。
交叉特征矩阵生成单元608c,用于第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵。
交叉特征矩阵计算单元608d,用于第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
在一个实施例中,训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,训练样本标签为用户点击目标商品的真实点击概率。
关于数据处理装置的具体限定可以参见上文中对于数据处理方法的限定,在此不再赘述。上述数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储第一神经网络模型、第二神经网络模型和第三神经网络模型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图11所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图10或图11中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据预测概率值和对应的训练样本标签计算得到训练损失值;
根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
在一个实施例中,对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,包括:对各个训练样本进行分词,得到分词后的词语;根据分词后的词语对应的词语属性,将分词后的词语分成对应的序列特征和非序列特征;对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对非序列特征和处理后的序列特征进行向量化处理,得到各个训练样本对应的特征向量。
在一个实施例中,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到对应的交叉特征,包括:获取各个特征向量在预设维度上对应的目标子特征向量;获取各个特征向量在预设维度上对应的预设子特征向量;获取各个特征向量在预设维度上对应的预设卷积和权重;根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。
在一个实施例中,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图,包括:第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征;第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征;第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵;第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
在一个实施例中,训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,训练样本标签为用户点击目标商品的真实点击概率。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取训练样本集合,训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,向量化处理用于将非结构化的训练样本转换为结构化的特征向量;
将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到各个训练样本对应的交叉特征;
将交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图;
将各个训练样本和图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据预测概率值和对应的训练样本标签计算得到训练损失值;
根据训练损失值对第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,第三神经网络用于训练样本的网络行为预测。
在一个实施例中,对各个训练样本进行向量化处理,得到各个训练样本对应的特征向量,包括:对各个训练样本进行分词,得到分词后的词语;根据分词后的词语对应的词语属性,将分词后的词语分成对应的序列特征和非序列特征;对序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对非序列特征和处理后的序列特征进行向量化处理,得到各个训练样本对应的特征向量。
在一个实施例中,将各个训练样本对应的特征向量输入至第一神经网络模型,第一神经网络模型计算得到对应的交叉特征,包括:获取各个特征向量在预设维度上对应的目标子特征向量;获取各个特征向量在预设维度上对应的预设子特征向量;获取各个特征向量在预设维度上对应的预设卷积和权重;根据目标子特征向量、预设子特征向量和预设卷积和权重计算得到对应的交叉特征。
在一个实施例中,通过第二神经网络模型对交叉特征进行内积计算,生成交叉特征对应的图像特征图,包括:第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征;第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征;第二神经网络模型根据各个目标交叉特征生成交叉特征矩阵;第二神经网络模型对交叉特征矩阵进行矩阵内积计算,生成交叉特征对应的图像特征图。
在一个实施例中,训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,训练样本标签为用户点击目标商品的真实点击概率。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (10)

1.一种数据处理方法,所述方法包括:
获取训练样本集合,所述训练样本集合中各个训练样本都存在对应的训练样本标签;
对各个所述训练样本进行向量化处理,得到各个所述训练样本对应的特征向量,所述向量化处理用于将非结构化的所述训练样本转换为结构化的特征向量;
将所述各个所述训练样本对应的特征向量输入至第一神经网络模型,所述第一神经网络模型计算得到各个所述训练样本对应的交叉特征;
将所述交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对所述交叉特征进行内积计算,生成所述交叉特征对应的图像特征图;
将所述各个训练样本和所述图像特征图输入至第三神经网络模型,得到对应的预测概率值;
根据所述预测概率值和对应的训练样本标签计算得到训练损失值;
根据所述训练损失值对所述第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,所述第三神经网络用于训练样本的网络行为预测。
2.根据权利要求1所述的方法,其特征在于,所述对各个所述训练样本进行向量化处理,得到各个所述训练样本对应的特征向量,包括:
对各个所述训练样本进行分词,得到分词后的词语;
根据所述分词后的词语对应的词语属性,将所述分词后的词语分成对应的序列特征和非序列特征;
对所述序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对所述非序列特征和所述处理后的序列特征进行向量化处理,得到各个所述训练样本对应的特征向量。
3.根据权利要求1所述的方法,其特征在于,所述将所述各个所述训练样本对应的特征向量输入至第一神经网络模型,所述第一神经网络模型计算得到对应的交叉特征,包括:
获取各个所述特征向量在预设维度上对应的目标子特征向量;
获取各个所述特征向量在所述预设维度上对应的预设子特征向量;
获取各个所述特征向量在所述预设维度上对应的预设卷积和权重;
根据所述目标子特征向量、所述预设子特征向量和所述预设卷积和权重计算得到对应的交叉特征。
4.根据权利要求1所述的方法,其特征在于,所述通过第二神经网络模型对所述交叉特征进行内积计算,生成所述交叉特征对应的图像特征图,包括:
所述第二神经网络模型根据预设维度信息对交叉特征进行切分,得到多个子交叉特征;
所述第二神经网络模型对各个子交叉特征进行特征组合,得到对应的目标交叉特征;
所述第二神经网络模型根据各个所述目标交叉特征生成交叉特征矩阵;
所述第二神经网络模型对所述交叉特征矩阵进行矩阵内积计算,生成所述交叉特征对应的图像特征图。
5.根据权利要求1所述的方法,其特征在于,所述训练样本为用户行为信息、用户商品交互信息、用户属性信息、商品属性信息中的至少一种,所述训练样本标签为用户点击目标商品的真实点击概率。
6.一种数据处理装置,其特征在于,所述装置包括:
训练样本获取模块,用于获取训练样本集合,所述训练样本集合中各个训练样本都存在对应的训练样本标签;
向量化处理模块,用于对各个所述训练样本进行向量化处理,得到各个所述训练样本对应的特征向量,所述向量化处理用于将非结构化的所述训练样本转换为结构化的特征向量;
第一神经网络处理模块,用于将所述各个所述训练样本对应的特征向量输入至第一神经网络模型,所述第一神经网络模型计算得到各个所述训练样本对应的交叉特征;
第二神经网络处理模块,用于将所述交叉特征作为第二神经网络模型的输入,通过第二神经网络模型对所述交叉特征进行内积计算,生成所述交叉特征对应的图像特征图;
第三神经网络处理模块,用于将所述各个训练样本和所述图像特征图输入至第三神经网络模型,得到对应的预测概率值;
损失值计算模块,用于根据所述预测概率值和对应的训练样本标签计算得到训练损失值;
第三神经网络训练模块,用于根据所述训练损失值对所述第三神经网络模型的模型参数进行调整,直至满足收敛条件,得到已训练的第三神经网络模型,所述第三神经网络用于训练样本的网络行为预测。
7.根据权利要求6所述的装置,其特征在于,所述向量化处理模块包括:
训练样本分词单元,用于对各个所述训练样本进行分词,得到分词后的词语;
词语处理单元,用于根据所述分词后的词语对应的词语属性,将所述分词后的词语分成对应的序列特征和非序列特征;
特征向量生成单元,用于对所述序列特征进行加权求和或者加权平均方式来处理得到处理后的序列特征,对所述非序列特征和所述处理后的序列特征进行向量化处理,得到各个所述训练样本对应的特征向量。
8.根据权利要求6所述的装置,其特征在于,所述第一神经网络处理模块包括:
目标子特征向量获取单元,用于获取各个所述特征向量在预设维度上对应的目标子特征向量;
预设子特征向量获取单元,用于获取各个所述特征向量在所述预设维度上对应的预设子特征向量;
权重获取单元,用于获取各个所述特征向量在所述预设维度上对应的预设卷积和权重;
交叉特征计算单元,用于根据所述目标子特征向量、所述预设子特征向量和所述预设卷积和权重计算得到对应的交叉特征。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN201910746149.7A 2019-08-13 2019-08-13 数据处理方法、装置、计算机设备和存储介质 Active CN110598845B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910746149.7A CN110598845B (zh) 2019-08-13 2019-08-13 数据处理方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910746149.7A CN110598845B (zh) 2019-08-13 2019-08-13 数据处理方法、装置、计算机设备和存储介质

Publications (2)

Publication Number Publication Date
CN110598845A true CN110598845A (zh) 2019-12-20
CN110598845B CN110598845B (zh) 2023-04-07

Family

ID=68854079

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910746149.7A Active CN110598845B (zh) 2019-08-13 2019-08-13 数据处理方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110598845B (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160454A (zh) * 2019-12-27 2020-05-15 北京旋极信息技术股份有限公司 一种速变信号检测方法和装置
CN111191092A (zh) * 2019-12-31 2020-05-22 腾讯科技(深圳)有限公司 画像数据处理方法和画像模型训练方法
CN111383221A (zh) * 2020-03-12 2020-07-07 南方科技大学 一种脊柱侧弯检测模型的生成方法和计算机设备
CN111428783A (zh) * 2020-03-23 2020-07-17 支付宝(杭州)信息技术有限公司 对推荐模型的训练样本进行样本域转换的方法及装置
CN111524557A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 基于人工智能的逆合成预测方法、装置、设备及存储介质
CN111949530A (zh) * 2020-08-07 2020-11-17 北京灵汐科技有限公司 测试结果的预测方法、装置、计算机设备及存储介质
CN112101550A (zh) * 2020-09-25 2020-12-18 平安科技(深圳)有限公司 分诊融合模型训练方法、分诊方法、装置、设备及介质
CN112232407A (zh) * 2020-10-15 2021-01-15 杭州迪英加科技有限公司 病理图像样本的神经网络模型训练方法、装置
CN112860800A (zh) * 2021-02-22 2021-05-28 深圳市星网储区块链有限公司 基于区块链和联邦学习的可信网络应用方法和装置
CN113592059A (zh) * 2020-04-30 2021-11-02 伊姆西Ip控股有限责任公司 用于处理数据的方法、设备和计算机程序产品
CN113706663A (zh) * 2021-08-27 2021-11-26 脸萌有限公司 图像生成方法、装置、设备及存储介质
CN115047894A (zh) * 2022-04-14 2022-09-13 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质
CN116029357A (zh) * 2023-03-29 2023-04-28 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN116562357A (zh) * 2023-07-10 2023-08-08 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105701191A (zh) * 2016-01-08 2016-06-22 腾讯科技(深圳)有限公司 一种推送信息点击率估计方法和装置
CN107437111A (zh) * 2017-07-31 2017-12-05 杭州朗和科技有限公司 基于神经网络的数据处理方法、介质、装置和计算设备
CN108416625A (zh) * 2018-02-28 2018-08-17 阿里巴巴集团控股有限公司 营销产品的推荐方法和装置
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
US20190073590A1 (en) * 2017-09-01 2019-03-07 Facebook, Inc. Sparse Neural Network Training Optimization
CN109544241A (zh) * 2018-11-27 2019-03-29 腾讯科技(深圳)有限公司 一种点击率预估模型的构建方法、点击率预估方法和装置
CN109903100A (zh) * 2018-12-25 2019-06-18 深圳市梦域科技有限公司 一种用户流失预测方法、装置及可读存储介质
CN109902177A (zh) * 2019-02-28 2019-06-18 上海理工大学 基于双通道卷积记忆神经网络的文本情感分析方法
CN109977151A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种数据分析方法及系统
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105160548A (zh) * 2015-08-20 2015-12-16 北京奇虎科技有限公司 对广告点击率进行预测的方法及装置
CN105701191A (zh) * 2016-01-08 2016-06-22 腾讯科技(深圳)有限公司 一种推送信息点击率估计方法和装置
CN107437111A (zh) * 2017-07-31 2017-12-05 杭州朗和科技有限公司 基于神经网络的数据处理方法、介质、装置和计算设备
US20190073590A1 (en) * 2017-09-01 2019-03-07 Facebook, Inc. Sparse Neural Network Training Optimization
CN108416625A (zh) * 2018-02-28 2018-08-17 阿里巴巴集团控股有限公司 营销产品的推荐方法和装置
CN108764273A (zh) * 2018-04-09 2018-11-06 中国平安人寿保险股份有限公司 一种数据处理的方法、装置、终端设备及存储介质
CN109544241A (zh) * 2018-11-27 2019-03-29 腾讯科技(深圳)有限公司 一种点击率预估模型的构建方法、点击率预估方法和装置
CN109903100A (zh) * 2018-12-25 2019-06-18 深圳市梦域科技有限公司 一种用户流失预测方法、装置及可读存储介质
CN109992710A (zh) * 2019-02-13 2019-07-09 网易传媒科技(北京)有限公司 点击率预估方法、系统、介质和计算设备
CN109902177A (zh) * 2019-02-28 2019-06-18 上海理工大学 基于双通道卷积记忆神经网络的文本情感分析方法
CN109977151A (zh) * 2019-03-28 2019-07-05 北京九章云极科技有限公司 一种数据分析方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
万满: "基于卷积神经网络的广告点击率预测模型研究", 《中国优秀硕士学位论文全文数据库经济与管理科学辑》 *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111160454A (zh) * 2019-12-27 2020-05-15 北京旋极信息技术股份有限公司 一种速变信号检测方法和装置
CN111160454B (zh) * 2019-12-27 2023-12-22 北京旋极信息技术股份有限公司 一种速变信号检测方法和装置
CN111191092A (zh) * 2019-12-31 2020-05-22 腾讯科技(深圳)有限公司 画像数据处理方法和画像模型训练方法
CN111191092B (zh) * 2019-12-31 2023-07-14 腾讯科技(深圳)有限公司 标签确定方法和标签确定模型训练方法
CN111383221A (zh) * 2020-03-12 2020-07-07 南方科技大学 一种脊柱侧弯检测模型的生成方法和计算机设备
CN111383221B (zh) * 2020-03-12 2023-04-28 南方科技大学 一种脊柱侧弯检测模型的生成方法和计算机设备
CN111428783B (zh) * 2020-03-23 2022-06-21 支付宝(杭州)信息技术有限公司 对推荐模型的训练样本进行样本域转换的方法及装置
CN111428783A (zh) * 2020-03-23 2020-07-17 支付宝(杭州)信息技术有限公司 对推荐模型的训练样本进行样本域转换的方法及装置
CN111524557A (zh) * 2020-04-24 2020-08-11 腾讯科技(深圳)有限公司 基于人工智能的逆合成预测方法、装置、设备及存储介质
CN111524557B (zh) * 2020-04-24 2024-04-05 腾讯科技(深圳)有限公司 基于人工智能的逆合成预测方法、装置、设备及存储介质
CN113592059A (zh) * 2020-04-30 2021-11-02 伊姆西Ip控股有限责任公司 用于处理数据的方法、设备和计算机程序产品
CN111949530B (zh) * 2020-08-07 2024-02-20 北京灵汐科技有限公司 测试结果的预测方法、装置、计算机设备及存储介质
CN111949530A (zh) * 2020-08-07 2020-11-17 北京灵汐科技有限公司 测试结果的预测方法、装置、计算机设备及存储介质
CN112101550B (zh) * 2020-09-25 2024-05-03 平安科技(深圳)有限公司 分诊融合模型训练方法、分诊方法、装置、设备及介质
CN112101550A (zh) * 2020-09-25 2020-12-18 平安科技(深圳)有限公司 分诊融合模型训练方法、分诊方法、装置、设备及介质
CN112232407B (zh) * 2020-10-15 2023-08-18 杭州迪英加科技有限公司 病理图像样本的神经网络模型训练方法、装置
CN112232407A (zh) * 2020-10-15 2021-01-15 杭州迪英加科技有限公司 病理图像样本的神经网络模型训练方法、装置
CN112860800A (zh) * 2021-02-22 2021-05-28 深圳市星网储区块链有限公司 基于区块链和联邦学习的可信网络应用方法和装置
CN113706663B (zh) * 2021-08-27 2024-02-02 脸萌有限公司 图像生成方法、装置、设备及存储介质
CN113706663A (zh) * 2021-08-27 2021-11-26 脸萌有限公司 图像生成方法、装置、设备及存储介质
CN115047894B (zh) * 2022-04-14 2023-09-15 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质
CN115047894A (zh) * 2022-04-14 2022-09-13 中国民用航空总局第二研究所 一种无人机轨迹测算方法、电子设备及存储介质
CN116029357B (zh) * 2023-03-29 2023-08-15 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN116029357A (zh) * 2023-03-29 2023-04-28 荣耀终端有限公司 训练样本生成、模型训练、点击率评估方法及电子设备
CN116562357A (zh) * 2023-07-10 2023-08-08 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置
CN116562357B (zh) * 2023-07-10 2023-11-10 深圳须弥云图空间科技有限公司 点击预测模型训练方法及装置

Also Published As

Publication number Publication date
CN110598845B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110598845B (zh) 数据处理方法、装置、计算机设备和存储介质
CN109783730A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN109493199A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN108520041B (zh) 文本的行业分类方法、系统、计算机设备和存储介质
US11640617B2 (en) Metric forecasting employing a similarity determination in a digital medium environment
US20200167690A1 (en) Multi-task Equidistant Embedding
CN111178949B (zh) 服务资源匹配参考数据确定方法、装置、设备和存储介质
CN112085565A (zh) 基于深度学习的信息推荐方法、装置、设备及存储介质
CN108182633B (zh) 贷款数据处理方法、装置、计算机设备和存储介质
CN109801101A (zh) 标签确定方法、装置、计算机设备和存储介质
CN111275205A (zh) 虚拟样本的生成方法、终端设备及存储介质
US20230342797A1 (en) Object processing method based on time and value factors
CN111209929A (zh) 访问数据处理方法、装置、计算机设备及存储介质
CN115795000A (zh) 基于联合相似度算法对比的围标识别方法和装置
CN115311042A (zh) 商品推荐方法、装置、计算机设备和存储介质
CN111161009B (zh) 信息推送方法、装置、计算机设备和存储介质
CN110598090B (zh) 兴趣标签的生成方法、装置、计算机设备和存储介质
CN111316259A (zh) 用于反馈和裁定的语义属性的动态合成和瞬时聚簇的系统和方法
CN115456039A (zh) 点击率预估模型训练方法、点击率预估方法及电子设备
CN115424001A (zh) 场景相似度估计方法、装置、计算机设备和存储介质
CN115222112A (zh) 一种行为预测方法、行为预测模型的生成方法及电子设备
CN114219184A (zh) 产品交易数据预测方法、装置、设备、介质和程序产品
Chong et al. Customer Churn Prediction of Telecom Company Using Machine Learning Algorithms
CN114048392B (zh) 多媒体资源推送方法、装置、电子设备及存储介质
CN111598638A (zh) 点击率确定方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant