CN113469438B - 数据处理方法、装置、设备以及存储介质 - Google Patents
数据处理方法、装置、设备以及存储介质 Download PDFInfo
- Publication number
- CN113469438B CN113469438B CN202110738344.2A CN202110738344A CN113469438B CN 113469438 B CN113469438 B CN 113469438B CN 202110738344 A CN202110738344 A CN 202110738344A CN 113469438 B CN113469438 B CN 113469438B
- Authority
- CN
- China
- Prior art keywords
- media resource
- target
- tag
- data
- threshold interval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 32
- 238000000034 method Methods 0.000 claims abstract description 31
- 238000012545 processing Methods 0.000 claims description 68
- 238000012549 training Methods 0.000 claims description 68
- 230000006399 behavior Effects 0.000 claims description 40
- 230000002452 interceptive effect Effects 0.000 claims description 19
- 238000011156 evaluation Methods 0.000 claims description 9
- 230000010365 information processing Effects 0.000 abstract description 2
- 238000004891 communication Methods 0.000 description 15
- 230000006870 function Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 230000002093 peripheral effect Effects 0.000 description 10
- 238000004590 computer program Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 230000001133 acceleration Effects 0.000 description 4
- 238000013528 artificial neural network Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000013135 deep learning Methods 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- 238000013461 design Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0277—Online advertisement
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/80—Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
- H04N21/83—Generation or processing of protective or descriptive data associated with content; Content structuring
- H04N21/835—Generation of protective data, e.g. certificates
- H04N21/8352—Generation of protective data, e.g. certificates involving content or source identification data, e.g. Unique Material Identifier [UMID]
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Strategic Management (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Game Theory and Decision Science (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Computer Security & Cryptography (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本公开提供一种数据处理方法、装置、设备以及存储介质,涉及网络信息处理技术领域,以至少解决现有技术中无法均衡媒体资源标签完整性和标签回传的实时性的问题。该方法包括:获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间;标签用于表征媒体资源的样本属性;根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间;基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。
Description
技术领域
本公开涉及网络信息处理技术领域,尤其涉及一种数据处理方法、装置、设备以及存储介质。
背景技术
目前,通常利用有标签的媒体资源来训练转化率(Click Value Rate,CVR)/和点击率(Click Through Rate,CTR)模型,以得到CVR和CTR等评测指标的预估结果。
在深度学习技术中,有标签的媒体资源可以通过流式训练确定。当需要确定标签的媒体资源是在线广告时,具体的确定方法为:获取已曝光的在线广告,在得到已曝光的在线广告数据后,等待固定时间,获取用户行为数据,再根据用户行为数据确定出每个在线广告的标签。
由上述可知,不同的等待固定时间,将会得到不同的用户行为数据,从而影响标签的完整性和回传标签的及时性。针对该问题,现有技术通过设置一个可变的阈值来解决。由于该阈值是根据历史数据得到的,因而可以保证大部分的标签都符合要求。但是对于长尾现象(即:在一个数据区间中,大多数的数据集中在区间头部,还有部分差异化的、少量的数据集中在区间尾部。区间尾部的数据累加起来会形成比区间头部的数据累加起来还大的影响)而言,若等待时间过长,将影响回传标签的实时性,若等待时间过短,将影响标签的完整性。
发明内容
本公开提供一种数据处理方法、装置、设备以及存储介质,以至少解决现有技术中无法均衡媒体资源标签完整性和标签回传的实时性的问题。本公开的技术方案如下:
根据本公开的第一方面,提供一种数据处理方法,该数据处理方法包括:电子设备获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间;标签用于表征媒体资源的样本属性;并根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间;基于目标阈值区间的回传规则,电子设备回传目标媒体资源和目标媒体资源的标签。
可选的,该数据处理方法,还包括:电子设备获取历史媒体资源标签的回传时间;电子设备对历史媒体资源标签的回传时间进行分类处理,得到多个预设阈值区间。
可选的,该数据处理方法,还包括:电子设备根据目标媒体资源对应的目标阈值区间,从多个训练模型中确定目标媒体资源对应的目标训练模型;目标训练模型为多个训练模型中任一训练模型;并将目标媒体资源和目标媒体资源的标签输入目标训练模型进行训练,得到目标模型;对所有的目标模型进行组合处理,生成预测模型。
可选的,该数据处理方法,还包括:电子设备将媒体资源曝光数据和用户行为数据输入到预测模型中,得到评测指标的预测结果。
可选的,基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签,包括:当处于目标阈值区间的结束时间时,回传目标媒体资源和目标媒体资源的标签。
可选的,样本属性包括正样本和负样本,媒体资源曝光数据为消费媒体资源曝光数据,获取媒体资源曝光数据中每个媒体资源的标签包括:在用户对目标消费媒体资源执行交互操作的情况下,获取目标消费媒体资源的标签为正样本;目标消费媒体资源为消费媒体资源曝光数据中的每一消费媒体资源;在用户对目标消费媒体资源未执行交互操作情况下,获取目标消费媒体资源的标签为负样本。
根据本公开的第二方面,提供一种数据处理装置,该数据处理装置包括获取模块、处理模块和发送模块。获取模块,被配置为获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间;标签用于表征媒体资源的样本属性;处理模块,被配置为根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间;发送模块,被配置为基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。
可选的,获取模块,还被配置为获取历史媒体资源标签的回传时间;
处理模块,还被配置为对历史媒体资源标签的回传时间进行分类处理,得到多个预设阈值区间。
可选的,处理模块,还被配置为根据目标媒体资源对应的目标阈值区间,从多个训练模型中确定目标媒体资源对应的目标训练模型;目标训练模型为多个训练模型中任一训练模型;
处理模块,还被配置为将目标媒体资源和目标媒体资源的标签输入目标训练模型进行训练,得到目标模型;
处理模块,还被配置为对所有的目标模型进行组合处理,生成预测模型。
可选的,处理模块,还被配置为将媒体资源曝光数据和用户行为数据输入到预测模型中,得到评测指标的预测结果。
可选的,发送模块,还被配置为当处于目标阈值区间的结束时间时,回传目标媒体资源和目标媒体资源的标签。
可选的,样本属性包括正样本和负样本,媒体资源曝光数据为消费媒体资源曝光数据,获取模块,还被配置为在用户对目标消费媒体资源执行交互操作的情况下,获取目标消费媒体资源的标签为正样本;目标消费媒体资源为消费媒体资源曝光数据中的每一消费媒体资源;
获取模块,还被配置为在用户对目标消费媒体资源未执行交互操作情况下,获取目标消费媒体资源的标签为负样本。
根据本公开的第三方面,提供一种电子设备,包括:处理器和用于存储处理器可执行的指令的存储器;其中,处理器被配置为执行指令,以实现如上述第一方面中任一种可选的数据处理方法。
根据本公开的第四方面,提供一种计算机可读存储介质,计算机可读存储介质上存储有指令,当计算机可读存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如上述第一方面中任一种可选的数据处理方法。
根据本公开的第五方面,提供一种计算机程序产品,包含指令,当该计算机程序产品中的指令由电子设备的处理器执行时,实现如上述第一方面中任一种可选的数据处理方法。
本公开实施例提供的技术方案至少带来以下有益效果:
上述方案中,电子设备创建多个预设阈值区间,然后获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间,根据媒体资源的回传时间确定出该媒体资源对应的预设阈值区间,按照预设阈值区间的回传规则,回传媒体资源和媒体资源的标签。相较于现有技术中,只设置一个阈值,本公开设置多个预设阈值区间,从而将获取到的媒体资源标签按照预设阈值区间进行分类回传,进一步提升数据处理的实时性,同时,避免了由于媒体资源回传时间较晚,而导致的标签不完整的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种电子设备的结构示意图;
图2是根据一示例性实施例示出的一种数据处理方法的流程图之一;
图3是根据一示例性实施例示出的一种数据处理方法的流程图之二;
图4是根据一示例性实施例示出的一种数据处理方法的流程图之三;
图5是根据一示例性实施例示出的一种预测模型的结构示意图;
图6是根据一示例性实施例示出的一种数据处理方法的流程图之四;
图7A是根据一示例性实施例示出的另一种预测模型的结构示意图;
图7B是根据一示例性实施例示出的另一种预测模型的应用示意图;
图8是根据一示例性实施例示出的一种数据处理装置的结构框图;
图9是根据一示例性实施例提供的数据处理方法的计算机程序产品的结构示意图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。本公开所涉及的数据可以为经用户授权或者经过各方充分授权的数据。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
还应当理解的是,术语“包括”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素和/或组件的存在或添加。
首先,对本公开实施例的应用场景进行介绍。
目前,互联网在线广告在投放之前,需要对在线广告的推荐效果进行预测。现有的投放效果都是通过转化率(Click Value Rate,CVR)和点击率(Click Through Rate,CTR)等评测指标来判断的,因此,需要对CVR和CTR等评测指标的进行预测。相关技术中,CVR和CTR的预测是通过CVR/CTR模型实现的,CVR/CTR模型是基于ID类特征+嵌入(embedding)的方式创建。对于在线广告而言,由于在线广告的有效期较短,若要保证推荐效果,就需要非常多实时的在线广告标签。
在深度学习技术中,可以通过流式训练来实现实时标签的统计。当需要统计标签的原始数据是在线广告数据时,实时在线广告标签的统计方法为:首先获取已曝光的在线广告,在得到已曝光的在线广告数据后,等待固定时间,获取用户行为数据,之后再根据用户行为数据中用户对在线广告是否执行交互操作,来确定出每个在线广告的标签,并将包含标签的在线广告回传至CVR/CTR模型。
由于,不同的等待固定时间,将会得到不同的用户行为数据。而用户行为数据又直接与在线广告的标签判断相关联。具体的,若等待固定时间过短,可能会出现用户行为漏抓取,则根据用户行为得到的标签,将会不完整;若等待固定时间过长,虽然可以保证在线广告标签的完整性,但是在得到标签之后,又无法及时的回传在线广告标签。
针对上述问题,现有技术根据历史标签回传时间的分布,设置一个用于表征等待固定时长的阈值,通过调整阈值来解决上述问题。设置的阈值是根据历史数据得到的,因而可以保证获取到大部分的标签。但是对于长尾现象(即:在一个数据区间中,大多数的数据集中在区间头部,还有部分差异化的、少量的数据集中在区间尾部。区间尾部的数据累加起来会形成比区间头部的数据累加起来还大的影响)而言,若等待时间过长,将影响回传标签的实时性,若等待时间过短,将影响标签的完整性。
为了解决上述问题,本公开实施例提供一种数据处理方法,应用于电子设备,首先电子设备创建多个预设阈值区间,然后获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间,根据媒体资源的回传时间确定出该媒体资源对应的预设阈值区间,按照预设阈值区间的回传规则,回传媒体资源和媒体资源的标签。相较于现有技术中,只设置一个阈值,本公开设置多个预设阈值区间,从而将获取到的媒体资源标签按照预设阈值区间进行分类回传,进一步提升数据处理的实时性,同时,避免了由于媒体资源回传时间较晚,而导致的标签不完整的问题。
需要说明的是,本申请实施例提供的数据处理方法应用于上述电子设备,即本申请实施例提供的数据处理方法的执行主体可以为数据处理装置,数据处理装置可以为上述电子设备。
图1是根据一示例性实施例示出的一种电子设备的结构示意图。上述数据处理方法可以应用于该电子设备100中。参见图1所示,该电子设备100包括有处理器101和存储器102。
其中,处理器101可以包括一个或多个处理核心,比如4核心处理器、8核心处理器等。处理器101可以包括应用处理器(application processor,AP),调制解调处理器,图形处理器(graphics processing unit,GPU),图像信号处理器(image signal processor,ISP),控制器,存储器,视频编解码器,数字信号处理器(digital signal processor,DSP),基带处理器,和/或神经网络处理器(neural-network processing unit,NPU)等。其中,不同的处理单元可以是独立的器件,也可以集成在一个或多个处理器中。
存储器102可以包括一个或多个计算机可读存储介质,该计算机可读存储介质可以是非暂态的。存储器102还可包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。在一些实施例中,存储器102中的非暂态的计算机可读存储介质用于存储至少一个指令,该至少一个指令用于被处理器101所执行以实现本公开方法实施例提供的数据处理方法。
在一些实施例中,电子设备100还可选包括有:外围设备接口103和至少一个外围设备。处理器101、存储器102和外围设备接口103之间可以通过总线或信号线相连。各个外围设备可以通过总线、信号线或电路板与外围设备接口103相连。具体地,外围设备包括:射频电路104、显示屏105、摄像头组件106、音频电路107、定位组件108和电源109中的至少一种。
外围设备接口103可被用于将输入/输出(input/output,I/O)相关的至少一个外围设备连接到处理器101和存储器102。在一些实施例中,处理器101、存储器102和外围设备接口103被集成在同一芯片或电路板上;在一些其他实施例中,处理器101、存储器102和外围设备接口103中的任意一个或两个可以在单独的芯片或电路板上实现,本实施例对此不予限定。
射频电路104用于接收和发射射频(radio frequency,RF)信号,也称电磁信号。射频电路104通过电磁信号与通信网络以及其他通信设备进行通信。射频电路104将电信号转换为电磁信号进行发送,或者,将接收到的电磁信号转换为电信号。可选地,射频电路104包括:天线系统、RF收发器、一个或多个放大器、调谐器、振荡器、数字信号处理器、编解码芯片组、用户身份模块卡等等。射频电路104可以通过至少一种无线通信协议来与其它电子设备进行通信。该无线通信协议包括但不限于:城域网、各代移动通信网络(2G、3G、4G及5G)、无线局域网和/或无线保真(wireless fidelity,WiFi)网络。在一些实施例中,射频电路104还可以包括近距离无线通信(near field communication,NFC)有关的电路,本公开对此不加以限定。
显示屏105用于显示用户界面(user interface,UI)。该UI可以包括图形、文本、图标、视频及其它们的任意组合。当显示屏105是触摸显示屏时,显示屏105还具有采集在显示屏105的表面或表面上方的触摸信号的能力。该触摸信号可以作为控制信号输入至处理器101进行处理。此时,显示屏105还可以用于提供虚拟按钮和/或虚拟键盘,也称软按钮和/或软键盘。在一些实施例中,显示屏105可以为一个,设置电子设备100的前面板;显示屏105可以采用液晶显示屏(liquid crystal display,LCD)、有机发光二极管(organic light-emitting diode,OLED)等材质制备。
摄像头组件106用于采集图像或视频。可选地,摄像头组件106包括前置摄像头和后置摄像头。通常,前置摄像头设置在电子设备的前面板,后置摄像头设置在电子设备的背面。音频电路107可以包括麦克风和扬声器。麦克风用于采集用户及环境的声波,并将声波转换为电信号输入至处理器101进行处理,或者输入至射频电路104以实现语音通信。出于立体声采集或降噪的目的,麦克风可以为多个,分别设置在电子设备100的不同部位。麦克风还可以是阵列麦克风或全向采集型麦克风。扬声器则用于将来自处理器101或射频电路104的电信号转换为声波。扬声器可以是传统的薄膜扬声器,也可以是压电陶瓷扬声器。当扬声器是压电陶瓷扬声器时,不仅可以将电信号转换为人类可听见的声波,也可以将电信号转换为人类听不见的声波以进行测距等用途。在一些实施例中,音频电路107还可以包括耳机插孔。
定位组件108用于定位电子设备100的当前地理位置,以实现导航或基于位置的服务(location based service,LBS)。定位组件108可以是基于美国的全球定位系统(globalpositioning system,GPS)、中国的北斗系统、俄罗斯的格雷纳斯系统或欧盟的伽利略系统的定位组件。
电源109用于为电子设备100中的各个组件进行供电。电源109可以是交流电、直流电、一次性电池或可充电电池。当电源109包括可充电电池时,该可充电电池可以支持有线充电或无线充电。该可充电电池还可以用于支持快充技术。
在一些实施例中,电子设备100还包括有一个或多个传感器110。该一个或多个传感器110包括但不限于:加速度传感器、陀螺仪传感器、压力传感器、指纹传感器、光学传感器以及接近传感器。
加速度传感器可以检测以电子设备100建立的坐标系的三个坐标轴上的加速度大小。陀螺仪传感器可以检测电子设备100的机体方向及转动角度,陀螺仪传感器可以与加速度传感器协同采集用户对电子设备100的3D动作。压力传感器可以设置在电子设备100的侧边框和/或触摸显示屏105的下层。当压力传感器设置在电子设备100的侧边框时,可以检测用户对电子设备100的握持信号。指纹传感器用于采集用户的指纹。光学传感器用于采集环境光强度。接近传感器,也称距离传感器,通常设置在电子设备100的前面板。接近传感器用于采集用户与电子设备100的正面之间的距离。
本领域技术人员可以理解,图1中示出的结构并不构成对电子设备100的限定,可以包括比图示更多或更少的组件,或者组合某些组件,或者采用不同的组件布置。
示例性的,电子设备100中的处理器101可以调用存储器102中的程序,以实现以下数据处理方法:获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间;标签用于表征媒体资源的样本属性;根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间;基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。
需要说明的是,电子设备100可以为手机、平板电脑、桌面型、膝上型、手持计算机、笔记本电脑、超级移动个人计算机(ultra-mobile personal computer,UMPC)、上网本等,本申请实施例对该电子设备100的具体形态不作特殊限制。
下面结合图1所示的电子设备,通过图2对本申请实施例提供的数据处理方法进行描述。
图2是根据一示例性实施例示出的一种数据处理方法的流程图。如图2所示,该方法可以包括以下步骤。
步骤21:电子设备获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间。
其中,标签用于表征媒体资源的样本属性。
本公开实施例中,电子设备获取到媒体资源曝光数据后,等待一段时间,再获取到用户行为数据,根据用户行为数据中的每个用户行为确定出该用户行为对应的当前媒体资源的标签,并将获取到用户行为数据中每个用户行为的时间确定为该用户行为对应的媒体资源的媒体资源标签的回传时间。示例性的,电子设备获取到的用户行为数据包括N个用户行为,将每个用户行为标记为aj,j用于表示用户行为数据中的第j个用户行为;并将媒体资源的标签标记为lj,媒体资源标签的回传时间标记为tj。
可选的,样本属性包括正样本和负样本,媒体资源曝光数据为消费媒体资源曝光数据。
步骤21,获取媒体资源曝光数据中每个媒体资源的标签包括:
在用户对目标消费媒体资源执行交互操作的情况下,获取目标消费媒体资源的标签为正样本。
在用户对目标消费媒体资源未执行交互操作情况下,获取目标消费媒体资源的标签为负样本。
其中,目标消费媒体资源为消费媒体资源曝光数据中的每一消费媒体资源。
具体的,基于用户行为数据确定样本属性是正样本,还是负样本。若用户行为数据中显示用户对当前媒体资源执行过交互操作,则样本属性为正样本,即标签为正样本;若用户行为数据中显示用户对当前媒体资源没有执行过交互操作,则样本属性为负样本,即标签为负样本。
其中,交互操作为用户对当前媒体资源执行过的触发行为。对于点击场景而言,交互操作为用户点击当前媒体资源。对于购买场景而言,交互操作为用户点击过曝光媒体资源后,并下单购买。当然,实际实现时,交互操作还可以应用于其它任意可能的场景中,具体可以根据实际使用需求确定,本公开实施例不作限定。
示例性的,当消费媒体资源曝光数据为消费广告曝光数据时,在规定的时间内,对于消费广告数据中的每个消费广告而言,若用户点击该消费广告,则将该消费广告的标签为正样本,若用户一直未点击该消费广告,则该消费广告的标签为负样本。
本公开实施例中,采用上述方式来表征当媒体资源曝光数据用于消费媒体资源曝光数据场景时,给出一种判断消费媒体资源曝光数据的标签的方法。
步骤22:电子设备根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间。
其中,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间。
具体的,电子设备预设多个预设阈值区间,每个预设阈值区间都为一个时间区间,时间区间内的时间跨度可以是固定的,还可以是不定的,具体可以根据实际使用需求确定,本公开对此不做限制。
基于背景技术,为了同时兼顾长时间回传的标签和短时间回传的标签,电子设备利用分桶技术,创建出多个预设阈值区间。每个预设阈值区间可以表示为Bi=[Li,Ri]。其中,Bi用于表示第i个预设阈值区间,Li用于表示第i个预设阈值区间的起始时间,Ri用于表示第i个预设阈值区间的终止时间。
示例性的,电子装置预设了4个预设阈值区间B,分别是预设阈值区间B1、预设阈值区间B2、预设阈值区间B3和预设阈值区间B4。预设阈值区间B1的时间区间为B1=[0,10分钟],用于表征收集是0-10分钟产生的正例标签,预设阈值区间B2的时间区间为B2=[10,30分钟],用于表征收集的是10-30分钟产生的标签,预设阈值区间B3的时间区间为B3=[30,60分钟],用于表征收集的是30-60分钟产生的标签,预设阈值区间B4的时间区间为B4=[60,120分钟],用于表征收集的是60-120分钟产生的标签。
本公开实施例中,电子设备根据目标媒体资源的回传时间,在目标媒体资源的回传时间处于第一预设阈值区间的起始时间和结束时间的时间范围内时,确定第一预设阈值区间为目标阈值区间。
示例性的,结合上述描述,若获取到某个媒体资源标签的回传时间为45分钟时,则确定出该目标媒体资源对应的是预设阈值区间3。
步骤23:电子设备基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。
本公开实施例中,电子设备根据目标媒体资源的回传时间,确定出目标媒体资源对应的目标阈值区间后,根据目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。其中,回传规则为电子设备设定的回传目标媒体资源和目标媒体资源的标签的时间。
本公开实施例提供的技术方案至少带来以下有益效果:
上述方案中,首先电子设备创建多个预设阈值区间,然后获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间,根据媒体资源的回传时间确定出该媒体资源对应的预设阈值区间,按照预设阈值区间的回传规则,回传媒体资源和媒体资源的标签。相较于现有技术中,只设置一个阈值,本公开设置多个预设阈值区间,从而将获取到的媒体资源标签按照预设阈值区间进行分类回传,进一步提升数据处理的实时性,同时,避免了由于媒体资源回传时间较晚,而导致的标签不完整的问题。
可选的,步骤23基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签包括:
当处于目标阈值区间的结束时间时,电子设备回传目标媒体资源和目标媒体资源的标签。
示例性的,结合步骤23,回传规则可以是目标阈值区间的结束时间,还可以是目标阈值区间的结束时间后的一段时间。
本公开实施例中,采用上述技术特征,给出了一种回传规则的具体实现方法。
可选的,如图3所示,数据处理方法,还包括如下步骤:
步骤24:电子设备获取历史媒体资源标签的回传时间。
本公开实施例中,电子设备获取大量的历史媒体资源标签的回传时间,历史媒体资源标签的回传时间是用于确定预设阈值区间的基础。
示例性的,电子设备获取大量的历史媒体资源标签的回传时间的过程为,获取历史媒体资源曝光数据和历史媒体资源曝光数据对应的用户历史行为数据。根据用户历史行为数据确定出每个用户历史行为对应的历史媒体资源的标签和历史媒体资源标签的回传时间。
步骤25:电子设备对历史媒体资源标签的回传时间进行分类处理,得到多个预设阈值区间。
具体的,结合步骤22,在电子设备获取到大量的历史媒体资源标签的回传时间后,电子设备对这些回传时间进行统计,根据统计结果,分类成多个预设阈值区间。分类的原则为:既要保证在获取到媒体资源标签后能及时的进行回传,还要保证能够包含所有的正例标签。其中,多个预设阈值区间为确定回传媒体资源和媒体资源标签时间的依据。
本公开实施例中,采用上述方式,给出了一种预设阈值区间的具体生成方法,生成的预设阈值区间用于后续及时回传媒体资源和媒体资源的标签。
需要说明的是,本公开实施例步骤24和步骤25在步骤21、步骤22和步骤23之前执行。
可选的,如图4和图5所示,数据处理方法,还包括如下步骤:
步骤26:电子设备根据目标媒体资源对应的目标阈值区间,从多个训练模型中确定目标媒体资源对应的目标训练模型。
其中,目标训练模型为多个训练模型中任一训练模型。
本公开实施例中,由于阈值区间和训练模型是对应的,当电子设备确定出目标媒体资源对应的目标阈值区间后,即可确定出目标媒体资源对应的目标训练模型。
步骤27:电子设备将目标媒体资源和目标媒体资源的标签输入目标训练模型进行训练,得到目标模型。
本公开实施例中,由于现有的训练模型为原始模型,预估准确度不高。电子设备通过将训练数据输入到训练模型中,对训练模型进行训练,从而得到目标模型(图中未示出)。该目标模型预估的标签结果可以无限接近训练数据的真实结果。其中,训练数据可以是目标媒体资源和目标媒体资源的标签,目标媒体资源为媒体资源曝光数据中的每一媒体资源。由于每个媒体资源都有各自对应的目标训练模型,这样,可以实现所有训练模型的训练。
步骤28:电子设备对所有的目标模型进行组合处理,生成预测模型。
本公开实施例中,在得到所有的目标模型后,电子设备将目标模型进行组合,从而得到预测模型。
本公开实施例中,采用上述方式来提供一种预测模型的训练方法。
示例性的,图5为本公开实施例示出的一种预测模型的结构示意图。如图5所示,该预测模型包括输入层51、训练层52以及输出层53。其中,训练层52功能基于深度学习模型(Deep Neural Networks,DNN)实现。预测模型的训练层52包括并行的多个训练模型,用于根据训练数据对训练模型进行训练,生成目标模型,并根据目标模型得到预测模型。
具体的,在输入层51输入训练数据(如:媒体资源、媒体资源的标签和媒体资源标签的回传时间),控制层52根据媒体资源的回传时间,确定出该媒体资源用于训练的目标训练模型,在确定出该媒体资源对应的目标训练模型后,通过媒体资源的标签对目标训练模型进行训练,最终得到符合要求的目标模型,再将目标模型进行组合,通过输出层53输出预测模型。
可选的,如图6所示,数据处理方法,还包括如下步骤:
步骤29:电子设备将媒体资源曝光数据和用户行为数据输入到预测模型中,得到评测指标的预测结果。
本公开实施例中,在生成预测模型后,可直接将原始数据输入到预测模型中,预测模型直接生成预测结果。具体的,当原始数据为媒体资源曝光数据和用户行为数据时,可直接得到预测结果。
本公开实施例中,采用上述方式来提供一种预测模型的使用方法。
示例性的,图7A为本公开实施例示出的另一种预测模型的结构示意图。如图7A所示,该预测模型包括输入层71、控制层72、连接层73以及输出层77。其中,控制层72功能基于深度学习模型(Deep Neural Networks,DNN)实现。预测模型的控制层72包括并行的多个目标模型,用于预测不同预测阈值区间内的数据;连接层73用于将控制层72所有预测数据进行拼接处理,从而生成最终的预测结果。具体的,该预测模型可以用于进行分类型数据预测,如:CTR或者CVR;还可以用于回归型数据预测,如:预测用户下单金额等等,具体可以根据实际使用需求确定,本公开实施例不作限定。
具体的,在输入层71输入媒体资源曝光数据和用户行为数据时,控制层72按照用户行为数据的时间,确定出媒体资源曝光数据所出的目标模型,按照不同的目标模型分别对每个目标模型内的媒体资源曝光数据进行处理,并将处理后的结果输入到连接层,进行求和,最终将求和的结果输入到输出层73,输出层73输出最终结果。
示例性的,图7B为本公开实施例示出的另一种预测模型的应用示意图。结合图7A,如图7B所示,输入层71接收到媒体资源曝光数据和用户行为数据后,将媒体资源曝光数据和用户行为数据输入控制层。控制层72根据用户行为数据中的具体内容,得出回传时间是45分钟,则回传时间落在目标模型3中(即:预测30-60分钟产生的标签)。
然后,采用one-hot技术将目标模型1、目标模型2和目标模型4的数据置为0,目标模型3的数据置为1。接着,对目标模型1、目标模型2、目标模型3和目标模型4采用mask和add技术进行筛选,输出目标模型3;对输出的目标模型3采用loss函数进行训练,以提高目标模型3的准确率。最后,将目标模型1、目标模型2、目标模型3和目标模型4的处理结果进行求和,得到最终结果,并将最终结果输入到输出层73,输出层73输出最终结果。
以上结合图2-图7B详细说明了本公开实施例提供的方法。为了实现上述功能,数据处理装置包含了执行各个功能相应的硬件结构和/或软件模块,这些执行各个功能相应的硬件结构和/或软件模块可以构成一个电子设备。本领域技术人员应该很容易意识到,结合本文中所公开的实施例描述的各示例的算法步骤,本公开能够以硬件或硬件和计算机软件的结合形式来实现。某个功能究竟以硬件还是计算机软件驱动硬件的方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
本公开实施例可以根据上述方法示例对电子设备进行功能模块的划分,例如,电子设备可以包括数据处理装置,数据处理装置可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本公开实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
以下,结合图8详细说明本公开实施例提供的数据处理装置。应理解,装置实施例的描述与方法实施例的描述相互对应,因此,未详细描述的内容可以参见上文方法实施例,为了简洁,这里不再赘述。
图8是根据一示例性实施例示出的一种数据处理装置的结构示意图,应用于电子设备,参见图8所示,该数据处理装置包括:获取模块81、处理模块82和发送模块83。
其中,获取模块81,被配置为获取媒体资源曝光数据中每个媒体资源的标签和每个媒体资源的回传时间;标签用于表征媒体资源的样本属性。例如,参照图2所示,获取模块81,被配置为执行步骤21。
处理模块82,被配置为根据目标媒体资源的回传时间,从多个预设阈值区间中确定目标媒体资源对应的目标阈值区间,目标媒体资源为媒体资源曝光数据中每一媒体资源,目标阈值区间为多个预设阈值区间中任一预设阈值区间。例如,参照图2所示,处理模块82,被配置为执行步骤22。
发送模块83,被配置为基于目标阈值区间的回传规则,回传目标媒体资源和目标媒体资源的标签。例如,参照图2所示,发送模块83,被配置为执行步骤23。
可选的,获取模块81,还被配置为获取历史媒体资源标签的回传时间。例如,参照图3所示,获取模块81,被配置为执行步骤24。
处理模块82,还被配置为对历史媒体资源标签的回传时间进行分类处理,得到多个预设阈值区间。例如,参照图3所示,处理模块82,被配置为执行步骤25。
可选的,处理模块82,还被配置为根据目标媒体资源对应的目标阈值区间,从多个训练模型中确定目标媒体资源对应的目标训练模型;目标训练模型为多个训练模型中任一训练模型。例如,参照图4所示,处理模块82,被配置为执行步骤26。
处理模块82,还被配置为将目标媒体资源和目标媒体资源的标签输入目标训练模型进行训练,得到目标模型。例如,参照图4所示,处理模块82,被配置为执行步骤27。
处理模块82,还被配置为对所有的目标模型进行组合处理,生成预测模型。例如,参照图4所示,处理模块82,被配置为执行步骤28。
可选的,处理模块82,还被配置为将媒体资源曝光数据和用户行为数据输入到预测模型中,得到评测指标的预测结果。例如,参照图6所示,处理模块82,被配置为执行步骤29。
可选的,发送模块83,还被配置为当处于目标阈值区间的结束时间时,回传目标媒体资源和目标媒体资源的标签。
可选的,获取模块81,还被配置为在用户对目标消费媒体资源执行交互操作的情况下,获取目标消费媒体资源的标签为正样本;目标消费媒体资源为消费媒体资源曝光数据中的每一消费媒体资源。
获取模块81,还被配置为在用户对目标消费媒体资源未执行交互操作情况下,获取目标消费媒体资源的标签为负样本。
当然,本公开实施例提供的数据处理装置包括但不限于上述模块,例如数据处理装置还可以包括存储模块84。存储模块84可以用于存储该写数据处理装置的程序代码,还可以用于存储写数据处理装置在运行过程中生成的数据,如写请求中的数据等。
在实际实现时,获取模块81和处理模块82可以由图1所示的处理器101调用存储器102中的程序代码来实现。其具体的执行过程可参考图2-图7B中所示的任一种数据处理方法部分的描述,这里不再赘述。
本公开另一实施例还提供一种计算机可读存储介质,该计算机可读存储介质中存储有指令,当指令在电子设备上运行时,该电子设备执行如上述图2-图7B中所示的任一种数据处理方法。
图9示意性地示出本公开实施例提供的计算机程序产品的概念性局部视图,计算机程序产品包括用于在计算设备上执行计算机进程的计算机程序。
在一个实施例中,计算机程序产品是使用信号承载介质910来提供的。信号承载介质910可以包括一个或多个程序指令,其当被一个或多个处理器运行时可以提供以上针对图2描述的功能或者部分功能。因此,例如,参考图2中所示的实施例,步骤21~步骤23的一个或多个特征可以由与信号承载介质910相关联的一个或多个指令来承担。此外,图9中的程序指令也描述示例指令。
在一些示例中,信号承载介质910可以包含计算机可读介质911,诸如但不限于,硬盘驱动器、紧密盘(CD)、数字视频光盘(DVD)、数字磁带、存储器、只读存储记忆体(read-only memory,ROM)或随机存储记忆体(random access memory,RAM)等等。
在一些实施方式中,信号承载介质910可以包含计算机可记录介质912,诸如但不限于,存储器、读/写(R/W)CD、R/W DVD、等等。
在一些实施方式中,信号承载介质910可以包含通信介质913,诸如但不限于,数字和/或模拟通信介质(例如,光纤电缆、波导、有线通信链路、无线通信链路、等等)。
信号承载介质910可以由无线形式的通信介质913来传达。一个或多个程序指令可以是,例如,计算机可执行指令或者逻辑实施指令。
在一些示例中,诸如针对图3描述的数据处理装置可以被配置为,响应于通过计算机可读介质911、计算机可记录介质912、和/或通信介质913中的一个或多个程序指令,提供各种操作、功能、或者动作。
通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全分类部或者部分功能。
在本公开所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个装置,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是一个物理单元或多个物理单元,即可以位于一个地方,或者也可以分布到多个不同地方。可以根据实际的需要选择其中的部分或者全分类部单元来实现本实施例方案的目的。
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个可读取存储介质中。基于这样的理解,本公开实施例的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全分类部或部分可以以软件产品的形式体现出来,该软件产品存储在一个存储介质中,包括若干指令用以使得一个设备(可以是单片机,芯片等)或处理器(processor)执行本公开各个实施例方法的全分类部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上,仅为本公开的具体实施方式,但本公开的保护范围并不局限于此,任何在本公开揭露的技术范围内的变化或替换,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应以权利要求的保护范围为准。
Claims (12)
1.一种数据处理方法,其特征在于,包括:
获取媒体资源曝光数据中每个媒体资源的标签和所述每个媒体资源的回传时间;所述标签用于表征用户是否对所述媒体资源执行交互操作;
根据目标媒体资源的回传时间,从多个预设阈值区间中确定所述目标媒体资源对应的目标阈值区间,所述目标媒体资源为所述媒体资源曝光数据中每一媒体资源,所述目标媒体资源的回传时间位于所述目标阈值区间指示的时间范围内;
当处于所述目标阈值区间的回传规则包括的时间的情况下,回传所述目标媒体资源和所述目标媒体资源的标签,所述回传规则包括所述目标阈值区间的结束时间,或者所述目标阈值区间的结束时间之后的预设时间,所述目标阈值区间的结束时间与所述预设时间之间的时长小于预设时长。
2.根据权利要求1所述的数据处理方法,其特征在于,还包括:
获取历史媒体资源标签的回传时间;
对所述历史媒体资源标签的回传时间进行分类处理,得到所述多个预设阈值区间。
3.根据权利要求1所述的数据处理方法,其特征在于,还包括:
根据所述目标媒体资源对应的目标阈值区间,从多个训练模型中确定所述目标媒体资源对应的目标训练模型;所述目标训练模型为所述多个训练模型中任一训练模型;
将所述目标媒体资源和所述目标媒体资源的标签输入所述目标训练模型进行训练,得到目标模型;
对所有的所述目标模型进行组合处理,生成预测模型。
4.根据权利要求3所述的数据处理方法,其特征在于,还包括:
将所述媒体资源曝光数据和用户行为数据输入到所述预测模型中,得到评测指标的预测结果。
5.根据权利要求1-4中任一项所述的数据处理方法,其特征在于,样本属性包括正样本和负样本,所述媒体资源曝光数据为消费媒体资源曝光数据,获取媒体资源曝光数据中每个媒体资源的标签包括:
在用户对目标消费媒体资源执行交互操作的情况下,获取所述目标消费媒体资源的标签为所述正样本;所述目标消费媒体资源为所述消费媒体资源曝光数据中的每一消费媒体资源;
在用户对目标消费媒体资源未执行交互操作情况下,获取所述目标消费媒体资源的标签为所述负样本。
6.一种数据处理装置,其特征在于,包括:
获取模块,被配置为获取媒体资源曝光数据中每个媒体资源的标签和所述每个媒体资源的回传时间;所述标签用于表征用户是否对所述媒体资源执行交互操作;
处理模块,被配置为根据目标媒体资源的回传时间,从多个预设阈值区间中确定所述目标媒体资源对应的目标阈值区间,所述目标媒体资源为所述媒体资源曝光数据中每一媒体资源,所述目标媒体资源的回传时间位于所述目标阈值区间指示的时间范围内;
发送模块,被配置为当处于所述目标阈值区间的回传规则包括的时间的情况下,回传所述目标媒体资源和所述目标媒体资源的标签,所述回传规则包括所述目标阈值区间的结束时间,或者所述目标阈值区间的结束时间之后的预设时间,所述目标阈值区间的结束时间与所述预设时间之间的时长小于预设时长。
7.根据权利要求6所述的数据处理装置,其特征在于,还包括:
所述获取模块,还被配置为获取历史媒体资源标签的回传时间;
所述处理模块,还被配置为对所述历史媒体资源标签的回传时间进行分类处理,得到所述多个预设阈值区间。
8.根据权利要求6所述的数据处理装置,其特征在于,还包括:
所述处理模块,还被配置为根据所述目标媒体资源对应的目标阈值区间,从多个训练模型中确定所述目标媒体资源对应的目标训练模型;所述目标训练模型为所述多个训练模型中任一训练模型;
所述处理模块,还被配置为将所述目标媒体资源和所述目标媒体资源的标签输入所述目标训练模型进行训练,得到目标模型;
所述处理模块,还被配置为对所有的所述目标模型进行组合处理,生成预测模型。
9.根据权利要求8所述的数据处理装置,其特征在于,还包括:
所述处理模块,还被配置为将所述媒体资源曝光数据和用户行为数据输入到所述预测模型中,得到评测指标的预测结果。
10.根据权利要求6-9中任一项所述的数据处理装置,其特征在于,样本属性包括正样本和负样本,所述媒体资源曝光数据为消费媒体资源曝光数据,
所述获取模块,还被配置为在用户对目标消费媒体资源执行交互操作的情况下,获取所述目标消费媒体资源的标签为所述正样本;所述目标消费媒体资源为所述消费媒体资源曝光数据中的每一消费媒体资源;
所述获取模块,还被配置为在用户对目标消费媒体资源未执行交互操作情况下,获取所述目标消费媒体资源的标签为所述负样本。
11.一种电子设备,其特征在于,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1-5中任一项所述的数据处理方法。
12.一种计算机可读存储介质,所述计算机可读存储介质上存储有指令,其特征在于,当所述计算机可读存储介质中的指令由电子设备的处理器执行时,使得所述电子设备能够执行如权利要求1-5中任一项所述的数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110738344.2A CN113469438B (zh) | 2021-06-30 | 2021-06-30 | 数据处理方法、装置、设备以及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110738344.2A CN113469438B (zh) | 2021-06-30 | 2021-06-30 | 数据处理方法、装置、设备以及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113469438A CN113469438A (zh) | 2021-10-01 |
CN113469438B true CN113469438B (zh) | 2024-01-05 |
Family
ID=77876752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110738344.2A Active CN113469438B (zh) | 2021-06-30 | 2021-06-30 | 数据处理方法、装置、设备以及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113469438B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557555A (zh) * | 2016-10-31 | 2017-04-05 | 努比亚技术有限公司 | 媒体播放方法及装置 |
CN109345302A (zh) * | 2018-09-27 | 2019-02-15 | 腾讯科技(深圳)有限公司 | 机器学习模型训练方法、装置、存储介质和计算机设备 |
CN111597449A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 用于搜索的候选词构建方法、装置、电子设备及可读介质 |
CN111738766A (zh) * | 2020-06-23 | 2020-10-02 | 北京达佳互联信息技术有限公司 | 用于多媒体信息的数据处理方法、装置以及服务器 |
CN112150219A (zh) * | 2020-10-22 | 2020-12-29 | 广州万唯邑众信息科技有限公司 | 一种在线广告投放系统及其使用方法 |
CN112862544A (zh) * | 2021-03-15 | 2021-05-28 | 重庆度小满优扬科技有限公司 | 对象信息的获取方法、装置以及存储介质 |
-
2021
- 2021-06-30 CN CN202110738344.2A patent/CN113469438B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106557555A (zh) * | 2016-10-31 | 2017-04-05 | 努比亚技术有限公司 | 媒体播放方法及装置 |
CN109345302A (zh) * | 2018-09-27 | 2019-02-15 | 腾讯科技(深圳)有限公司 | 机器学习模型训练方法、装置、存储介质和计算机设备 |
CN111597449A (zh) * | 2020-05-20 | 2020-08-28 | 北京字节跳动网络技术有限公司 | 用于搜索的候选词构建方法、装置、电子设备及可读介质 |
CN111738766A (zh) * | 2020-06-23 | 2020-10-02 | 北京达佳互联信息技术有限公司 | 用于多媒体信息的数据处理方法、装置以及服务器 |
CN112150219A (zh) * | 2020-10-22 | 2020-12-29 | 广州万唯邑众信息科技有限公司 | 一种在线广告投放系统及其使用方法 |
CN112862544A (zh) * | 2021-03-15 | 2021-05-28 | 重庆度小满优扬科技有限公司 | 对象信息的获取方法、装置以及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
CN113469438A (zh) | 2021-10-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110363346B (zh) | 点击率预测方法、预测模型的训练方法、装置及设备 | |
CN111897996B (zh) | 话题标签推荐方法、装置、设备及存储介质 | |
CN112069414A (zh) | 推荐模型训练方法、装置、计算机设备及存储介质 | |
CN111104980B (zh) | 确定分类结果的方法、装置、设备及存储介质 | |
CN109784351B (zh) | 行为数据分类方法、分类模型训练方法及装置 | |
WO2021057537A1 (zh) | 一种卡顿预测的方法、数据处理的方法以及相关装置 | |
CN110059623B (zh) | 用于生成信息的方法和装置 | |
CN112040333B (zh) | 视频发布方法、装置、终端及存储介质 | |
CN111708944A (zh) | 多媒体资源识别方法、装置、设备及存储介质 | |
CN112131473B (zh) | 信息推荐方法、装置、设备及存储介质 | |
CN112116391A (zh) | 多媒体资源投放方法、装置、计算机设备及存储介质 | |
CN111416996B (zh) | 多媒体文件检测方法、播放方法、装置、设备及存储介质 | |
CN111930249B (zh) | 智能笔图像处理方法、装置及电子设备 | |
CN112530205A (zh) | 机场停机坪飞机状态检测方法及装置 | |
CN114154068A (zh) | 媒体内容推荐方法、装置、电子设备及存储介质 | |
CN114282587A (zh) | 数据处理方法、装置、计算机设备及存储介质 | |
CN113469438B (zh) | 数据处理方法、装置、设备以及存储介质 | |
CN113838479B (zh) | 单词发音评测方法、服务器及系统 | |
CN111414496B (zh) | 基于人工智能的多媒体文件的检测方法和装置 | |
CN113762585A (zh) | 数据的处理方法、账号类型的识别方法及装置 | |
CN111897709B (zh) | 监控用户的方法、装置、电子设备及介质 | |
CN111062709B (zh) | 资源转移方式推荐方法、装置、电子设备及存储介质 | |
CN113486260A (zh) | 互动信息的生成方法、装置、计算机设备及存储介质 | |
CN113947418A (zh) | 反馈信息的获取方法、装置、电子设备及存储介质 | |
CN113673427B (zh) | 视频识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |