CN113886713A - 数据处理方法、装置、服务器及存储介质 - Google Patents

数据处理方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN113886713A
CN113886713A CN202111495001.4A CN202111495001A CN113886713A CN 113886713 A CN113886713 A CN 113886713A CN 202111495001 A CN202111495001 A CN 202111495001A CN 113886713 A CN113886713 A CN 113886713A
Authority
CN
China
Prior art keywords
sample
account set
content
target
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111495001.4A
Other languages
English (en)
Inventor
何攀
高小平
郑秋野
徐禄军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202111495001.4A priority Critical patent/CN113886713A/zh
Publication of CN113886713A publication Critical patent/CN113886713A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开关于一种数据处理方法、装置、服务器及存储介质,该方法包括:获取帐户集合数据;从所述帐户集合数据中提取出帐户集合特征和内容类型;所述内容类型为向所述帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息。采用本方法,有利于提高内容发布信息的确定效率。

Description

数据处理方法、装置、服务器及存储介质
技术领域
本公开涉及互联网技术领域,尤其涉及一种数据处理方法、装置、服务器及存储介质。
背景技术
随着互联网技术的发展,推荐系统会根据用户需求推荐内容给帐户。
相关技术中,在进行内容推荐之前,需要确定相应的内容发布信息,该内容发布信息一般是通过人工分析来确定;但是,通过人工分析确定内容发布信息,耗费时间较多,导致内容发布信息的确定效率较低。
发明内容
本公开提供一种数据处理方法、装置、服务器及存储介质,以至少解决相关技术中内容发布信息的确定效率较低的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种数据处理方法,包括:
获取帐户集合数据;
从所述帐户集合数据中提取出帐户集合特征和内容类型;所述内容类型为向所述帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;
将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息。
在一示例性实施例中,在获取帐户集合数据之前,还包括:
获取样本帐户集合特征、样本内容类型和目标发布信息;所述目标发布信息为针对所述样本帐户集合特征对应的样本帐户集合,以及所述样本内容类型对应的样本内容的实际发布信息;
将所述样本帐户集合特征和所述样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息;
根据所述预测发布信息和所述目标发布信息之间的差值,得到损失值;
根据所述损失值调整所述待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到所述训练结束条件的训练后的神经网络模型,作为所述预先训练的信息预测模型。
在一示例性实施例中,所述方法还包括:
获取针对所述预先训练的信息预测模型的反馈数据;
根据所述反馈数据,对所述预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
在一示例性实施例中,在将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息之前,还包括:
从所述帐户集合数据中提取出发布时间;所述发布时间为向所述目标帐户集合中的帐户发布所述目标内容的时间;
所述将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息,包括:
将所述帐户集合特征、所述内容类型和所述发布时间输入所述预先训练的信息预测模型,得到针对所述目标帐户集合、所述目标内容和所述发布时间的发布信息。
在一示例性实施例中,所述将所述样本帐户集合特征和样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息,包括:
获取样本时间;所述样本时间为向所述样本帐户集合中的样本帐户发布所述样本内容的实际时间;所述目标发布信息为针对所述样本帐户集合、所述样本内容和所述样本时间的实际发布信息;
将所述样本帐户集合特征、所述样本内容类型和所述样本时间输入所述待训练的神经网络模型,得到针对所述样本帐户集合、所述样本内容和所述样本时间的预测发布信息。
在一示例性实施例中,在将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合,所述目标内容的发布信息之后,还包括:
按照所述发布信息,向所述目标帐户集合中的每个帐户发布所述目标内容。
根据本公开实施例的第二方面,提供一种数据处理装置,包括:
数据获取单元,被配置为执行获取帐户集合数据;
特征提取单元,被配置为从所述帐户集合数据中提取出帐户集合特征和内容类型;所述内容类型为向所述帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;
信息确定单元,被配置为执行将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息。
在一示例性实施例中,所述装置还包括模型训练单元,被配置为执行获取样本帐户集合特征、样本内容类型和目标发布信息;所述目标发布信息为针对所述样本帐户集合特征对应的样本帐户集合,以及所述样本内容类型对应的样本内容的实际发布信息;将所述样本帐户集合特征和所述样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息;根据所述预测发布信息和所述目标发布信息之间的差值,得到损失值;根据所述损失值调整所述待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到所述训练结束条件的训练后的神经网络模型,作为所述预先训练的信息预测模型。
在一示例性实施例中,所述装置还包括模型更新单元,被配置为执行获取针对所述预先训练的信息预测模型的反馈数据;根据所述反馈数据,对所述预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
在一示例性实施例中,所述装置还包括时间提取单元,被配置为执行从所述帐户集合数据中提取出发布时间;所述发布时间为向所述目标帐户集合中的帐户发布所述目标内容的时间;
所述信息确定单元,还被配置为执行将所述帐户集合特征、所述内容类型和所述发布时间输入所述预先训练的信息预测模型,得到针对所述目标帐户集合、所述目标内容和所述发布时间的发布信息。
在一示例性实施例中,所述模型训练单元,还被配置为执行获取样本时间;所述样本时间为向所述样本帐户集合中的样本帐户发布所述样本内容的实际时间;所述目标发布信息为针对所述样本帐户集合、所述样本内容和所述样本时间的实际发布信息;将所述样本帐户集合特征、所述样本内容类型和所述样本时间输入所述待训练的神经网络模型,得到针对所述样本帐户集合、所述样本内容和所述样本时间的预测发布信息。
在一示例性实施例中,所述装置还包括内容发布单元,被配置为执行按照所述发布信息,向所述目标帐户集合中的每个帐户发布所述目标内容。
根据本公开实施例的第三方面,提供一种服务器,包括:处理器;用于存储所述处理器可执行指令的存储器;其中,所述处理器被配置为执行所述指令,以实现如第一方面的任一项实施例中所述的数据处理方法。
根据本公开实施例的第四方面,提供一种计算机可读存储介质,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行第一方面的任一项实施例中所述的数据处理方法。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述计算机程序产品包括指令,所述指令被服务器的处理器执行时,使得所述服务器能够执行第一方面的任一项实施例中所述的数据处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:
通过获取帐户集合数据;然后从帐户集合数据中提取出帐户集合特征和内容类型;内容类型为向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;最后将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息。这样,实现了根据预先训练的信息预测模型,自动得到目标内容的发布信息的目的,无需通过人工分析,从而简化了内容发布信息的确定过程,进而提高了内容发布信息的确定效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种数据处理方法的流程图。
图2是根据一示例性实施例示出的信息预测模型的训练步骤的流程图。
图3是根据一示例性实施例示出的另一种数据处理方法的流程图。
图4是根据一示例性实施例示出的又一种数据处理方法的流程图。
图5是根据一示例性实施例示出的一种数据处理装置的框图。
图6是根据一示例性实施例示出的一种服务器的框图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
还需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息、帐户集合数据、样本帐户集合数据等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
图1是根据一示例性实施例示出的一种数据处理方法的流程图,如图1所示,该数据处理方法用于服务器中;可以理解的是,该方法也可以应用于终端,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。本示例性实施例中,该方法包括以下步骤:
在步骤S110中,获取帐户集合数据。
其中,帐户是指终端中的应用程序的注册帐户,比如短视频应用程序的注册帐户、视频浏览程序的注册帐户等。需要说明的是,本公开涉及的帐户是指经过授权且需要进行处理分析的帐户,具体是指内容的推荐对象,比如广告的推荐对象。
其中,帐户集合是指由多个帐户组合而成的集合,具体是指由帐户特征相同的帐户所构成的集合。帐户特征用于表征帐户的帐户属性,包括年龄、地域等。
其中,帐户集合数据是指由选择的帐户集合特征和内容类型所构成的数据,比如用户群数据。帐户集合特征,用于表征帐户集合所包含的帐户的共同帐户属性,包括年龄、地域等。内容类型,是指需要向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型,比如广告类型。
需要说明的是,针对同一个帐户集合,不同内容类型对应的内容发布信息不一样。
具体地,终端响应于针对帐户集合数据的选择操作,获取选择的帐户集合数据,根据选择的帐户集合数据生成内容发布信息查询请求,并将内容发布信息查询请求发送至对应的服务器;服务器对内容发布信息查询请求进行解析,得到终端获取的帐户集合数据。
举例说明,用户在终端提供的内容发布信息查询界面上,选择帐户集合特征,比如年龄、地域等,并选择内容类型,比如电子产品;在选择完帐户集合特征和内容类型之后,用户点击查询按钮,触发终端生成内容发布信息查询请求,并将内容发布信息查询请求发送至服务器,然后在界面上显示服务器根据内容发布信息查询请求返回的内容发布信息。
在步骤S120中,从帐户集合数据中提取出帐户集合特征和内容类型;内容类型为向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型。
其中,内容类型是指需要向目标帐户集合中的帐户发布的目标内容的类型,具体是指需要向目标帐户集合中的帐户发布的广告的类型。目标内容包括图片、视频、广告、文章等。
具体地,服务器将帐户集合数据输入特征提取模型,通过特征提取模型从帐户集合数据中提取出帐户集合特征和内容类型。
进一步地,服务器还可以根据特征提取指令,从帐户集合数据中提取出帐户集合特征和内容类型。
在步骤S130中,将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息。
其中,预先训练的信息预测模型是一种能够自动预测出内容发布信息的模型,比如时间序列预测模型。
其中,发布信息是指目标内容的发布成本。针对目标帐户集合和目标内容的发布信息,是指向目标帐户集合中的帐户发布目标内容的成本。
具体地,服务器将帐户集合特征和内容类型输入预先训练的信息预测模型,通过预先训练的信息预测模型对帐户集合特征和内容类型进行处理,得到针对目标帐户集合的目标内容的发布信息,比如针对某个用户集合的内容发布信息。
上述数据处理方法中,通过获取帐户集合数据;然后从帐户集合数据中提取出帐户集合特征和内容类型;内容类型为向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;最后将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息。这样,实现了根据预先训练的信息预测模型,自动得到目标内容的发布信息的目的,无需通过人工分析,从而简化了内容发布信息的确定过程,进而提高了内容发布信息的确定效率。
在一示例性实施例中,如图2所示,上述步骤S110,在获取帐户集合数据之前,还包括信息预测模型的训练步骤,具体可以通过以下步骤实现:
在步骤S210中,获取样本帐户集合特征、样本内容类型和目标发布信息;目标发布信息为针对样本帐户集合特征对应的样本帐户集合,以及样本内容类型对应的样本内容的实际发布信息。
具体地,服务器从数据库中获取历史内容发布数据,并对历史内容发布数据进行分析处理,得到接收到样本内容的帐户的共同帐户特征,并将其作为样本帐户集合特征;从历史内容发布数据中,提取出所发布的样本内容的内容类型,并将其作为样本内容类型;根据历史内容发布数据,确定历史上针对样本帐户集合特征对应的样本帐户集合的内容发布信息的平均值,并将其作为目标发布信息。
在步骤S220中,将样本帐户集合特征和样本内容类型输入待训练的神经网络模型,得到针对样本帐户集合和样本内容的预测发布信息。
在步骤S230中,根据预测发布信息和目标发布信息之间的差值,得到损失值。
在步骤S240中,根据损失值调整待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到训练结束条件的训练后的神经网络模型,作为预先训练的信息预测模型。
其中,样本帐户集合特征是指样本帐户集合对应的帐户集合特征。样本内容类型是指样本内容对应的内容类型,比如样本广告类型。目标发布信息,是指针对样本帐户集合的样本内容的实际发布信息。需要说明的是,样本帐户集合特征、样本内容类型和目标发布信息是指训练信息预测模型的样本数据。
其中,神经网络模型是指待训练的时间序列预测模型。针对样本帐户集合和样本内容的预测发布信息,是指向样本帐户集合中的帐户发布样本内容的预测成本。训练结束条件可以但不限于达到预设训练次数、损失函数达到收敛等。
具体地,服务器根据历史内容发布数据,确定样本帐户集合特征、样本内容类型和目标发布信息;将样本帐户集合特征和样本内容类型输入待训练的神经网络模型,通过待训练的神经网络模型对样本帐户集合特征和样本内容类型进行预测处理,得到针对样本帐户集合和样本内容的预测发布信息;根据预测发布信息和目标发布信息之间的差值,结合损失函数,计算得到损失值;当未达到训练结束条件时,则根据损失值调整待训练的神经网络模型的网络参数,得到网络参数调整后的神经网络模型,并重复执行步骤S220至步骤S240,直到达到训练结束条件;当达到训练结束条件时,将达到训练结束条件的训练后的神经网络模型,确定为预先训练的信息预测模型。
举例说明,当损失值大于或者等于预设阈值时,或者未达到预设训练次数时,则根据损失值调整待训练的神经网络模型的网络参数,得到网络参数调整后的神经网络模型,以缩小通过神经网络模型得到的预测发布信息与实际发布信息之间的误差。重复执行上述过程,以对模型参数调整后的神经网络模型进行反复训练,直到根据训练后的神经网络模型得到的损失值小于预设阈值,或者达到预设训练次数,则将该训练后的神经网络模型或者经过预设训练次数训练后的神经网络模型,作为预先训练的信息预测模型。
本公开实施例提供的技术方案,根据样本帐户集合特征、样本内容类型和目标发布信息,训练得到信息预测模型,有利于后续根据信息预测模型自动预测出针对帐户集合的内容发布信息,无需通过人工分析,从而提高了内容发布信息的确定效率。
在一示例性实施例中,本公开提供的数据处理方法还包括信息预测模型的更新步骤,具体包括如下内容:获取针对预先训练的信息预测模型的反馈数据;根据反馈数据,对预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
其中,反馈数据是指针对帐户集合的实际内容发布信息,所挖掘出的其他帐户集合特征或者预测内容发布信息的其他因素等。更新后的信息预测模型,是指网络参数更新后的信息预测模型。
举例说明,服务器从数据库中,获取针对预先训练的信息预测模型的反馈数据;然后根据这些反馈数据,重复执行上述步骤S220至步骤S240,以对预先训练的信息预测模型的网络参数进行更新,得到网络参数更新后的信息预测模型,并将其作为更新后的信息预测模型。
进一步地,上述步骤S130,将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息,具体包括:服务器将帐户集合特征和内容类型输入更新后的信息预测模型,通过更新后的信息预测模型对帐户集合特征和内容类型进行处理,得到针对目标帐户集合的目标内容的发布信息。
本公开实施例提供的技术方案,根据针对预先训练的信息预测模型的反馈数据,对预先训练的信息预测模型进行更新,实现了对信息预测模型进行优化的目的,有利于进一步提高通过信息预测模型预测出的内容发布信息的准确率。
在一示例性实施例中,上述步骤S130,在将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息之前,还包括:从帐户集合数据中提取出发布时间;发布时间为向目标帐户集合中的帐户发布目标内容的时间。
其中,发布时间是指内容发布时间。需要说明的是,针对同一个帐户集合,不同发布时间的内容发布信息是不一样的。
具体地,在从帐户集合数据中提取出帐户集合特征和内容类型的过程中,服务器还可以从帐户集合数据中提取出发布时间。例如,服务器将帐户集合数据输入特征提取模型,通过特征提取模型从帐户集合数据中提取出帐户集合特征、内容类型和发布时间。
进一步地,上述步骤S130,将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息,具体包括:将帐户集合特征、内容类型和发布时间输入预先训练的信息预测模型,得到针对目标帐户集合、目标内容和发布时间的发布信息。
其中,针对目标帐户集合、目标内容和发布时间的发布信息,是指在发布时间,向目标帐户集合中的帐户发布目标内容的成本。
其中,预先训练的信息预测模型的表现形式为y(t) =g(t)+s(t)+h(t)+&(t),综合考虑了增长趋势、季节趋势和节假日对预测的发布信息的影响。g(t)表示增长函数,用来拟合时间序列中预测的发布信息的非周期性变化;s(t)表示周期性变化,比如每周、每月、每个季节等;h(t)表示时间序列中那些潜在的具有非固定周期的节假日对预测的发布信息造成的影响。&(t)表示噪声项,表示模型未预测到的波动信息,这里假设&(t)是高斯分布的。
具体地,服务器将帐户集合特征、内容类型和发布时间输入预先训练的信息预测模型,通过预先训练的信息预测模型对帐户集合特征、内容类型和发布时间进行预测处理,得到针对目标帐户集合、目标内容和发布时间的发布信息。
举例说明,用户在终端提供的内容发布信息查询界面上,选择帐户集合特征,比如年龄、地域等,并选择内容类型和发布时间;在选择完帐户集合特征、内容类型和发布时间之后,用户点击查询按钮,触发终端生成内容发布信息查询请求,并将内容发布信息查询请求发送至服务器;服务器根据内容发布信息查询请求,将帐户集合特征、内容类型和发布时间输入预先训练的信息预测模型,得到针对目标帐户集合、目标内容和发布时间的发布信息,并将发布信息直接返回至终端,通过终端的内容发布信息查询界面展示该发布信息。
需要说明的是,在用户点击查询按钮之后,内容发布信息查询界面除了展示发布信息,还可以展示触发人数、点击率、转化率等。
本公开实施例提供的技术方案,综合考虑帐户集合特征、内容类型和发布时间,并通过预先训练的信息预测模型输出内容发布信息,有利于提高内容发布信息的预测准确性,避免了通过人工确定内容发布信息,容易出现错误,导致内容发布信息的确定准确性较低的缺陷。
在一示例性实施例中,上述步骤S220,将样本帐户集合特征和样本内容类型输入待训练的神经网络模型,得到针对样本帐户集合和样本内容的预测发布信息,具体包括:获取样本时间;样本时间为向样本帐户集合中的样本帐户发布样本内容的实际时间;目标发布信息为针对样本帐户集合、样本内容和样本时间的实际发布信息;将样本帐户集合特征、样本内容类型和样本时间输入待训练的神经网络模型,得到针对样本帐户集合、样本内容和样本时间的预测发布信息。
其中,样本帐户集合特征、样本内容类型、样本时间和目标发布信息,共同构成信息预测模型的训练样本数据。
其中,针对样本帐户集合、样本内容和样本时间的实际发布信息,是指在样本时间,向样本帐户集合中的样本帐户发布样本内容的实际成本。针对样本帐户集合、样本内容和样本时间的预测发布信息,是指在样本时间,向样本帐户集合中的样本帐户发布样本内容的预测成本。
具体地,服务器根据历史内容发布数据,确定样本帐户集合特征、样本内容类型、样本时间和目标发布信息;将样本帐户集合特征、样本内容类型和样本时间输入待训练的神经网络模型,通过待训练的神经网络模型对样本帐户集合特征、样本内容类型和样本时间进行预测处理,得到针对样本帐户集合、样本内容和样本时间的预测发布信息;根据预测发布信息和目标发布信息之间的差值,结合损失函数,计算得到损失值;当未达到训练结束条件时,比如当损失值大于或者等于预设阈值时,或者未达到预设训练次数时,则根据损失值调整待训练的神经网络模型的网络参数,得到网络参数调整后的神经网络模型,并重复执行上述过程,直到达到训练结束条件;当达到训练结束条件时,比如根据训练后的神经网络模型得到的损失值小于预设阈值,或者达到预设训练次数,则将达到训练结束条件的训练后的神经网络模型,确定为预先训练的信息预测模型。
本公开实施例提供的技术方案,根据样本帐户集合特征、样本内容类型、样本时间和目标发布信息,训练得到信息预测模型,有利于后续根据信息预测模型自动预测出针对帐户集合、目标内容和发布时间的发布信息,无需通过人工分析,从而提高了内容发布信息的确定效率和确定准确性。
在一示例性实施例中,上述步骤S130,在将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息之后,还包括:按照发布信息,向目标帐户集合中的每个帐户发布目标内容。
举例说明,在得到针对目标帐户集合和目标内容的发布信息之后,服务器按照确定的内容发布成本,确定目标内容在终端页面的特定展示位置;向目标帐户集合中的每个帐户所对应的终端推送目标内容,并通过每个终端的终端页面的特定展示位置展示该目标内容。
本公开实施例提供的技术方案,在得到针对目标帐户集合和目标内容的发布信息之后,按照发布信息,向目标帐户集合中的每个帐户发布目标内容,有利于实现目标内容的精准推送,从而提高了目标内容的推荐准确率。
图3是根据一示例性实施例示出的另一种数据处理方法的流程图,如图3所示,数据处理方法用于服务器中,包括以下步骤:
在步骤S310中,获取样本帐户集合特征、样本内容类型、样本时间和目标发布信息;目标发布信息为针对样本帐户集合特征对应的样本帐户集合、样本内容类型对应的样本内容和样本时间的实际发布信息;样本时间为向样本帐户集合中的样本帐户发布样本内容的实际时间。
在步骤S320中,将样本帐户集合特征、样本内容类型和样本时间输入待训练的神经网络模型,得到针对样本帐户集合、样本内容和样本时间的预测发布信息。
在步骤S330中,根据预测发布信息和目标发布信息之间的差值,得到损失值。
在步骤S340中,根据损失值调整待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到训练结束条件的训练后的神经网络模型,作为预先训练的信息预测模型。
在步骤S350中,获取帐户集合数据。
在步骤S360中,从帐户集合数据中提取出帐户集合特征、内容类型和发布时间;内容类型为向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;发布时间为向目标帐户集合中的帐户发布目标内容的时间。
在步骤S370中,将帐户集合特征、内容类型和发布时间输入预先训练的信息预测模型,得到针对目标帐户集合、目标内容和发布时间的发布信息。
上述数据处理方法中,通过训练得到信息预测模型,并通过信息预测模型输出针对目标帐户集合、目标内容和发布时间的发布信息;实现了根据预先训练的信息预测模型,自动得到目标内容的发布信息的目的,无需通过人工分析,从而简化了内容发布信息的确定过程,进而提高了内容发布信息的确定效率。
为了更清晰阐明本公开实施例提供的数据处理方法,以下以一个具体的实施例对该数据处理方法进行具体说明。在一个实施例中,如图4所示,本公开还提供了一种数据处理方法,通过历史的内容发布数据,对时间序列预测模型进行训练,得到训练后的时间序列预测模型,作为训练完成的信息预测模型,并通过训练完成的信息预测模型,实现内容发布信息的精准确定。该方法具体包括以下内容:
(1)清洗历史内容发布数据,并提取出帐户集合特征。
(2)查询出历史上针对这些帐户集合特征对应的帐户集合的内容发布信息。
(3)将帐户集合特征和内容发布信息拼接成一个样本。
(4)构建时间序列预测模型y(t)=g(t)+s(t)+h(t)+&(t),并利用深度学习算法对该模型进行训练,得到训练后的时间序列预测模型,作为训练完成的信息预测模型。
(5)在用户选择特定帐户集合的情况下,利用信息预测模型输出针对该特定帐户集合的内容发布信息,并将该内容发布信息展示给用户。
(6)收集信息预测模型的反馈数据,根据反馈数据不断优化信息预测模型的输入数据和模型参数。
上述数据处理方法,可以达到以下技术效果:(1)基于时间序列预测模型训练得到信息预测模型,可以自动确定针对帐户集合的内容发布信息;(2)结合节假日因素,可以更准确的预测出针对帐户集合的内容发布信息,从而提高了内容发布信息的预测准确率;(3)实现了内容的精准推送。
应该理解的是,虽然图1-图3的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1-图3中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
可以理解的是,本说明书中上述方法的各个实施例之间相同/相似的部分可互相参见,每个实施例重点说明的是与其他实施例的不同之处,相关之处参见其他方法实施例的说明即可。
图5是根据一示例性实施例示出的一种数据处理装置的框图。参照图5,该装置包括数据获取单元510,特征提取单元520和信息确定单元530。
数据获取单元510,被配置为执行获取帐户集合数据。
特征提取单元520,被配置为从帐户集合数据中提取出帐户集合特征和内容类型;内容类型为向帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型。
信息确定单元530,被配置为执行将帐户集合特征和内容类型输入预先训练的信息预测模型,得到针对目标帐户集合和目标内容的发布信息。
在一示例性实施例中,数据处理装置还包括模型训练单元,被配置为执行获取样本帐户集合特征、样本内容类型和目标发布信息;目标发布信息为针对样本帐户集合特征对应的样本帐户集合,以及样本内容类型对应的样本内容的实际发布信息;将样本帐户集合特征和样本内容类型输入待训练的神经网络模型,得到针对样本帐户集合和样本内容的预测发布信息;根据预测发布信息和目标发布信息之间的差值,得到损失值;根据损失值调整待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到训练结束条件的训练后的神经网络模型,作为预先训练的信息预测模型。
在一示例性实施例中,数据处理装置还包括模型更新单元,被配置为执行获取针对预先训练的信息预测模型的反馈数据;根据反馈数据,对预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
在一示例性实施例中,数据处理装置还包括时间提取单元,被配置为执行从帐户集合数据中提取出发布时间;发布时间为向目标帐户集合中的帐户发布目标内容的时间;
信息确定单元530,还被配置为执行将帐户集合特征、内容类型和发布时间输入预先训练的信息预测模型,得到针对目标帐户集合、目标内容和发布时间的发布信息。
在一示例性实施例中,模型训练单元,还被配置为执行获取样本时间;样本时间为向样本帐户集合中的样本帐户发布样本内容的实际时间;目标发布信息为针对样本帐户集合、样本内容和样本时间的实际发布信息;将样本帐户集合特征、样本内容类型和样本时间输入待训练的神经网络模型,得到针对样本帐户集合、样本内容和样本时间的预测发布信息。
在一示例性实施例中,数据处理装置还包括内容发布单元,被配置为执行按照发布信息,向目标帐户集合中的每个帐户发布目标内容。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
图6是根据一示例性实施例示出的一种用于执行数据处理方法的设备600的框图。例如,设备600可以为服务器。参照图6,设备600包括处理组件620,其进一步包括一个或多个处理器,以及由存储器622所代表的存储器资源,用于存储可由处理组件620的执行的指令,例如应用程序。存储器622中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件620被配置为执行指令,以执行上述方法。
设备600还可以包括:电源组件624被配置为执行设备600的电源管理,有线或无线网络接口626被配置为将设备600连接到网络,和输入输出(I/O)接口628。设备600可以操作基于存储在存储器622的操作系统,例如Windows Server,Mac OS X,Unix,Linux,FreeBSD或类似。
在示例性实施例中,还提供了一种包括指令的计算机可读存储介质,例如包括指令的存储器622,上述指令可由设备600的处理器执行以完成上述方法。存储介质可以是计算机可读存储介质,例如,所述计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。
在示例性实施例中,还提供一种计算机程序产品,所述计算机程序产品中包括指令,上述指令可由设备600的处理器执行以完成上述方法。
需要说明的,上述的装置、服务器、计算机可读存储介质、计算机程序产品等根据方法实施例的描述还可以包括其他的实施方式,具体的实现方式可以参照相关方法实施例的描述,在此不作一一赘述。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由权利要求指出。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (14)

1.一种数据处理方法,其特征在于,包括:
获取帐户集合数据;
从所述帐户集合数据中提取出帐户集合特征和内容类型;所述内容类型为向所述帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;
将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息。
2.根据权利要求1所述的方法,其特征在于,在获取帐户集合数据之前,还包括:
获取样本帐户集合特征、样本内容类型和目标发布信息;所述目标发布信息为针对所述样本帐户集合特征对应的样本帐户集合,以及所述样本内容类型对应的样本内容的实际发布信息;
将所述样本帐户集合特征和所述样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息;
根据所述预测发布信息和所述目标发布信息之间的差值,得到损失值;
根据所述损失值调整所述待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到所述训练结束条件的训练后的神经网络模型,作为所述预先训练的信息预测模型。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取针对所述预先训练的信息预测模型的反馈数据;
根据所述反馈数据,对所述预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
4.根据权利要求2所述的方法,其特征在于,在将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息之前,还包括:
从所述帐户集合数据中提取出发布时间;所述发布时间为向所述目标帐户集合中的帐户发布所述目标内容的时间;
所述将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息,包括:
将所述帐户集合特征、所述内容类型和所述发布时间输入所述预先训练的信息预测模型,得到针对所述目标帐户集合、所述目标内容和所述发布时间的发布信息。
5.根据权利要求4所述的方法,其特征在于,所述将所述样本帐户集合特征和样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息,包括:
获取样本时间;所述样本时间为向所述样本帐户集合中的样本帐户发布所述样本内容的实际时间;所述目标发布信息为针对所述样本帐户集合、所述样本内容和所述样本时间的实际发布信息;
将所述样本帐户集合特征、所述样本内容类型和所述样本时间输入所述待训练的神经网络模型,得到针对所述样本帐户集合、所述样本内容和所述样本时间的预测发布信息。
6.根据权利要求1所述的方法,其特征在于,在将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合,所述目标内容的发布信息之后,还包括:
按照所述发布信息,向所述目标帐户集合中的每个帐户发布所述目标内容。
7.一种数据处理装置,其特征在于,所述装置包括:
数据获取单元,被配置为执行获取帐户集合数据;
特征提取单元,被配置为从所述帐户集合数据中提取出帐户集合特征和内容类型;所述内容类型为向所述帐户集合特征对应的目标帐户集合中的帐户发布的目标内容的类型;
信息确定单元,被配置为执行将所述帐户集合特征和所述内容类型输入预先训练的信息预测模型,得到针对所述目标帐户集合和所述目标内容的发布信息。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括模型训练单元,被配置为执行获取样本帐户集合特征、样本内容类型和目标发布信息;所述目标发布信息为针对所述样本帐户集合特征对应的样本帐户集合,以及所述样本内容类型对应的样本内容的实际发布信息;将所述样本帐户集合特征和所述样本内容类型输入待训练的神经网络模型,得到针对所述样本帐户集合和所述样本内容的预测发布信息;根据所述预测发布信息和所述目标发布信息之间的差值,得到损失值;根据所述损失值调整所述待训练的神经网络模型的网络参数;对网络参数调整后的神经网络模型进行反复训练,直到达到训练结束条件,则将达到所述训练结束条件的训练后的神经网络模型,作为所述预先训练的信息预测模型。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括模型更新单元,被配置为执行获取针对所述预先训练的信息预测模型的反馈数据;根据所述反馈数据,对所述预先训练的信息预测模型进行更新,得到更新后的信息预测模型。
10.根据权利要求8所述的装置,其特征在于,所述装置还包括时间提取单元,被配置为执行从所述帐户集合数据中提取出发布时间;所述发布时间为向所述目标帐户集合中的帐户发布所述目标内容的时间;
所述信息确定单元,还被配置为执行将所述帐户集合特征、所述内容类型和所述发布时间输入所述预先训练的信息预测模型,得到针对所述目标帐户集合、所述目标内容和所述发布时间的发布信息。
11.根据权利要求10所述的装置,其特征在于,所述模型训练单元,还被配置为执行获取样本时间;所述样本时间为向所述样本帐户集合中的样本帐户发布所述样本内容的实际时间;所述目标发布信息为针对所述样本帐户集合、所述样本内容和所述样本时间的实际发布信息;将所述样本帐户集合特征、所述样本内容类型和所述样本时间输入所述待训练的神经网络模型,得到针对所述样本帐户集合、所述样本内容和所述样本时间的预测发布信息。
12.根据权利要求7所述的装置,其特征在于,所述装置还包括内容发布单元,被配置为执行按照所述发布信息,向所述目标帐户集合中的每个帐户发布所述目标内容。
13.一种服务器,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至6中任一项所述的数据处理方法。
14.一种计算机可读存储介质,其特征在于,当所述计算机可读存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至6中任一项所述的数据处理方法。
CN202111495001.4A 2021-12-09 2021-12-09 数据处理方法、装置、服务器及存储介质 Pending CN113886713A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111495001.4A CN113886713A (zh) 2021-12-09 2021-12-09 数据处理方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111495001.4A CN113886713A (zh) 2021-12-09 2021-12-09 数据处理方法、装置、服务器及存储介质

Publications (1)

Publication Number Publication Date
CN113886713A true CN113886713A (zh) 2022-01-04

Family

ID=79016662

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111495001.4A Pending CN113886713A (zh) 2021-12-09 2021-12-09 数据处理方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN113886713A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840793A (zh) * 2017-11-28 2019-06-04 广州腾讯科技有限公司 推广信息的推送方法和装置、存储介质、电子装置
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
US20210174164A1 (en) * 2019-12-09 2021-06-10 Miso Technologies Inc. System and method for a personalized search and discovery engine
US20210312288A1 (en) * 2020-12-28 2021-10-07 Beijing Baidu Netcom Science Technology Co., Ltd. Method for training classification model, classification method, apparatus and device

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109840793A (zh) * 2017-11-28 2019-06-04 广州腾讯科技有限公司 推广信息的推送方法和装置、存储介质、电子装置
US20210174164A1 (en) * 2019-12-09 2021-06-10 Miso Technologies Inc. System and method for a personalized search and discovery engine
CN111538912A (zh) * 2020-07-07 2020-08-14 腾讯科技(深圳)有限公司 内容推荐方法、装置、设备及可读存储介质
CN112612826A (zh) * 2020-12-21 2021-04-06 北京达佳互联信息技术有限公司 数据处理方法和装置
US20210312288A1 (en) * 2020-12-28 2021-10-07 Beijing Baidu Netcom Science Technology Co., Ltd. Method for training classification model, classification method, apparatus and device

Similar Documents

Publication Publication Date Title
CN109922379B (zh) 广告视频优化方法、装置、设备及计算机可读存储介质
CN109711871B (zh) 一种潜在客户确定方法、装置、服务器及可读存储介质
CN109471981B (zh) 评论信息排序方法、装置、服务器及存储介质
CN111340233B (zh) 机器学习模型的训练方法及装置、样本处理方法及装置
CN114461871B (zh) 推荐模型训练方法、对象推荐方法、装置及存储介质
CN112445690B (zh) 信息获取方法、装置及电子设备
CN114357305A (zh) 实时直播间的直播对象讲解顺序确定方法及装置
CN112966486A (zh) 一种工程量清单智能生成方法、装置、终端及存储介质
CN111475628A (zh) 会话数据处理方法、装置、计算机设备和存储介质
CN114245185A (zh) 视频推荐方法、模型训练方法、装置、电子设备及介质
CN113836388B (zh) 信息推荐方法、装置、服务器及存储介质
CN110689177B (zh) 订单准备时间的预测方法和装置,电子设备及存储介质
CN113886713A (zh) 数据处理方法、装置、服务器及存储介质
CN112308648A (zh) 信息处理方法及装置
WO2016166598A1 (en) Requirements determination
CN112565904B (zh) 视频片段推送方法、装置、服务器以及存储介质
CN114328995A (zh) 内容推荐方法、装置、设备及存储介质
CN115408606A (zh) 保险信息推送方法、装置、存储介质及计算机设备
CN110502715B (zh) 点击概率的预测方法及装置
CN108536811B (zh) 基于机器学习的语音交互路径确定方法及装置、存储介质、终端
CN112905892A (zh) 应用于用户画像挖掘的大数据处理方法及大数据服务器
CN112559868A (zh) 信息召回方法、装置、存储介质及电子设备
CN111401969A (zh) 用于提高用户留存率的方法、装置、服务器及存储介质
CN106202390B (zh) 一种数据库完善系统及方法
CN116862561B (zh) 基于卷积神经网络的产品热度分析方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20220104

RJ01 Rejection of invention patent application after publication