CN111709764B - 多媒体内容的相关参数的确定方法、装置及存储介质 - Google Patents
多媒体内容的相关参数的确定方法、装置及存储介质 Download PDFInfo
- Publication number
- CN111709764B CN111709764B CN201910204453.9A CN201910204453A CN111709764B CN 111709764 B CN111709764 B CN 111709764B CN 201910204453 A CN201910204453 A CN 201910204453A CN 111709764 B CN111709764 B CN 111709764B
- Authority
- CN
- China
- Prior art keywords
- multimedia content
- characteristic information
- machine learning
- learning model
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 61
- 238000010801 machine learning Methods 0.000 claims description 74
- 238000001914 filtration Methods 0.000 claims description 48
- 238000012549 training Methods 0.000 claims description 41
- 238000000605 extraction Methods 0.000 claims description 26
- 230000006870 function Effects 0.000 claims description 15
- 238000012545 processing Methods 0.000 claims description 15
- 238000004364 calculation method Methods 0.000 claims description 12
- 238000012216 screening Methods 0.000 claims description 3
- 238000013215 result calculation Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 9
- 230000008685 targeting Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 235000019580 granularity Nutrition 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000007619 statistical method Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 239000002699 waste material Substances 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000011362 coarse particle Substances 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003203 everyday effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000010419 fine particle Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0251—Targeted advertisements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0241—Advertisements
- G06Q30/0273—Determination of fees for advertising
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Marketing (AREA)
- Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Transfer Between Computers (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请提供了一种多媒体内容的相关参数的确定方法、装置及存储介质。所述方法包括:获取目标多媒体内容的特征信息;提取特征信息的抽象特征;根据抽象特征,计算目标多媒体内容的未考虑新鲜度系数。相比于相关技术中,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证,本申请实施例提供的技术方案,利用特征信息的抽象特征,考虑了各个特征信息之间的相互关系,且全部由计算机设备完成,不仅可以节约时间和人力,而且可以更加准确地确定出未考虑新鲜度系数。
Description
技术领域
本申请实施例涉及信息技术领域,特别涉及一种多媒体内容的相关参数的确定方法、装置及存储介质。
背景技术
在广告领域,询量是指广告主或者广告商通过询量系统中特定的查询界面,去检索其所需要的定向在库存中的剩余量。在通过询量系统对广告进行询量时,需要考虑新鲜度指标的影响。上述新鲜度指标是指影响广告的曝光量过滤结果的因素,如广告位频控、用户行为频控、广告投放时间等。目前,仍然有部分新鲜度指标的影响并没有计入询量系统,如连续多条请求过滤同一商品广告以及其它一些难以量化模拟的新鲜度指标,从而导致询量结果偏大。因此,引入未考虑新鲜度系数。
未考虑新鲜度系数是用于计算广告的曝光量过滤结果的重要参数。询量系统中引入未考虑新鲜度系数,通过该未考虑新鲜度系数来扣除未考虑到的新鲜度指标过滤的曝光量,从而避免了询量结果偏大的问题,使询量结果更加符合实际情况。
相关技术中,采用人工计算的方式得到广告的未考虑新鲜度系数。配置人员先根据广告的版位将流量进行划分,并根据固定的统计策略利用广告的版位、广告所属一级类目、广告的站点集合等特征信息,来计算得到该广告的未考虑新鲜度系数。之后,配置人员将该广告的未考虑新鲜度系数配置到线上的询量系统中,询量系统在读取到该广告的未考虑新鲜度系数之后,得到该广告的询量结果并锁量下单。
上述相关技术中,由于广告的未考虑新鲜度系数需要进行人工计算得到,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证。
发明内容
本申请实施例提供了一种多媒体内容的相关参数的确定方法、装置及存储介质,可用于解决相关技术提供的计算广告的未考虑新鲜度系数的方式,所存在的费时费力,且准确性不高的问题。所述技术方案如下:
一方面,本申请实施例提供了一种多媒体内容的相关参数的确定方法,应用于计算机设备中,所述方法包括:
获取目标多媒体内容的特征信息,所述特征信息用于指示所述目标多媒体内容的相关属性;
提取所述特征信息的抽象特征,所述抽象特征用于反映所述特征信息之间的相互关系;
根据所述抽象特征,计算所述目标多媒体内容的未考虑新鲜度系数,所述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对所述目标多媒体内容的曝光量过滤结果的影响。
另一方面,本申请实施例提供了一种多媒体内容的相关参数的确定装置,应用于计算机设备中,所述装置包括:
信息获取模块,用于获取目标多媒体内容的特征信息,所述特征信息用于指示所述目标多媒体内容的相关属性;
特征提取模块,用于提取所述特征信息的抽象特征,所述抽象特征用于反映所述特征信息之间的相互关系;
系数计算模块,用于根据所述抽象特征,计算所述目标多媒体内容的未考虑新鲜度系数,所述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对所述目标多媒体内容的曝光量过滤结果的影响。
又一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上述方面所述的多媒体内容的相关参数的确定方法。
再一方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上述方面所述的多媒体内容的相关参数的确定方法。
还一方面,提供了一种计算机程序产品,当该计算机程序产品被执行时,其用于执行上述方面所述的多媒体内容的相关参数的确定方法。
本申请实施例提供的技术方案可以包括如下有益效果:
通过获取目标多媒体内容的特征信息,并在提取到该特征信息的抽象特征之后,根据该抽象特征计算得到目标多媒体内容的未考虑新鲜度系数。相比于相关技术中,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证,本申请实施例提供的技术方案,利用特征信息的抽象特征,考虑了各个特征信息之间的相互关系,且全部由计算机设备完成,不仅可以节约时间和人力,而且可以更加准确地确定出未考虑新鲜度系数。
附图说明
图1是本申请一个实施例提供的多媒体内容的相关参数的确定方法的流程图;
图2是本申请另一个实施例提供的多媒体内容的相关参数的确定方法的流程图;
图3示例性示出了一种询量结果展示界面的示意图;
图4示例性示出了一种模型架构的示意图;
图5是本申请一个实施例提供的模型训练方法的流程图;
图6示例性示出了一种广告系统的示意图;
图7示例性示出了另一种广告系统的示意图;
图8示例性示出了又一种广告系统的示意图;
图9是本申请一个实施例提供的多媒体内容的相关参数的确定装置的框图;
图10是本申请另一个实施例提供的多媒体内容的相关参数的确定装置的框图;
图11是本申请一个实施例提供的计算机设备的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
在对本申请实施例进行介绍说明之前,首先对本申请中涉及的一些名词进行解释说明。
1、合约广告(Agreement-based Advertising):又称为保量CPM(Cost Per Mille,千人成本)广告,是指广告主和广告商先下达成协议,约定在某一段时间某一个广告位针对定向受众投放广告,广告主按照广告的曝光量付费。
2、新鲜度:在广告行业中,新鲜度可以是指一种广告过滤策略,即对一些广告进行过滤,对同一用户看到同一广告或者同一类型广告的次数进行判断,以避免同一广告或者同一类型广告重复在某一位置,重复针对某一定向受众曝光。通过该策略,一方面,同一个用户不至于反复看到同一个广告或者同一类型的广告,提升用户体验;另一方面也使得广告能覆盖更多的用户群体,充分起到打广告的目的。
3、新鲜度指标:新鲜度指标是指影响广告的曝光量过滤结果的因素,如广告位频控、用户行为频控、广告投放时间、广告版位等等。当广告主进行下单时,会明确一些定向条件来使得广告的投放更加精准,效果更好,而每种新鲜度指标都针对某种特殊的定向条件,把一些不符合该定向条件的曝光过滤掉。例如,通过广告位频控,可以保证同一广告在一定时间内不会重复在某一位置曝光。
4、未考虑新鲜度系数:询量系统中考虑了一部分新鲜度指标的影响,但仍然有另一部分新鲜度指标的影响并未考虑到,如连续多条请求过滤同一商品广告以及其它一些难以量化模拟的新鲜度指标,从而导致最终询量结果偏大。因此,引入未考虑新鲜度系数。
未考虑新鲜度系数的定义如下述公式所示:
其中,上述novelty_coef是指未考虑新鲜度系数;unprocess_novelty_filter_cnt是指被未考虑到的新鲜度指标过滤掉的广告量;out_reranking_cnt是指广告经过精排(reranking)的返回量。
该未考虑新鲜度系数表征未考虑到的新鲜度指标对广告的曝光量过滤结果的影响。未考虑新鲜度系数越小,表示未考虑到的新鲜度指标对广告的曝光量过滤结果的影响越大,被未考虑到的新鲜度指标过滤掉的曝光量就越大。
未考虑新鲜度系数不是固定的,不同的流量,不同的广告类型,不同的广告版位等都有可能会导致未考虑新鲜度系数的大小不同。
通过下述公式可以计算出添加未考虑新鲜度系数后的询量值:
pv_after=pv_before*novelty_coef
其中,pv_before是指没有使用未考虑新鲜度系数的询量值;pv_after是指使用了未考虑新鲜度系数后的询量值。
5、询量:询量是广告主或者广告商通过询量系统中特定的查询界面,去检索其所需要的定向在库存中的剩余量,该剩余量就是能卖给此广告的最大曝光量。
6、锁量:询量操作结束后,广告主了解到了其想购买的定向对应的可售卖库存,如果这个库存满足其购买需求,广告主就可以购买其想要的曝光量,而其购买的这些曝光量即被分配给此广告,即被锁定。这整个的操作为锁量,即下单。
请参考图1,其示出了本申请一个实施例提供的多媒体内容的相关参数的确定方法的流程图。在本申请实施例中,各步骤的执行主体可以是计算机设备,计算机设备是指具备数据计算和存储能力的电子设备,如PC(Personal Computer,个人计算机)或服务器。该方法可以包括如下几个步骤:
步骤101,获取目标多媒体内容的特征信息。
在本申请实施例中,多媒体内容是指在多媒体平台上展示,以供多媒体平台的用户查看的内容,例如该多媒体内容可以是广告。
目标多媒体内容的特征信息用于指示目标多媒体内容的相关属性。通过该相关属性可以唯一确定该目标多媒体内容。
可选地,特征信息包括基本特征信息、投放特征信息、定向特征信息组成的群组中选择的至少一个;其中,基本特征信息用于指示目标多媒体内容的基本属性,投放特征信息用于指示目标多媒体内容的投放属性,定向特征信息用于指示目标多媒体内容的定向属性。
示例性地,以多媒体内容为广告为例,基本特征信息用于指示广告的基本属性,如广告的商品标识、品牌标识、广告类目标识、广告主标识等等;投放特征信息用于指示该广告的投放属性,如广告投放的版位标识、广告占用流量、广告长标识、广告精排次数等等;定向特征信息用于指示该广告的定向属性,该定向特征信息主要包括人群信息,该人群信息用于指示该广告的受众人群信息,例如年龄、性别、职业、居住地等等。
计算机设备可以从系统日志数据中获取到目标多媒体内容的特征信息。上述系统日志数据是指多媒体内容在投放过程中的相关数据,如曝光量。
步骤102,提取特征信息的抽象特征。
上述抽象特征用于反映特征信息之间的相互关系。该相互关系可以是单纯的线性关系,也可以单纯的非线性关系,还可以是线性关系与非线性关系的组合关系。
步骤103,根据抽象特征,计算目标多媒体内容的未考虑新鲜度系数。
计算机设备在提取到目标多媒体内容的特征信息的抽象特征之后,可以采用预设的计算模型或算法,根据该抽象特征计算出目标多媒体内容的未考虑新鲜度系数。
上述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对目标多媒体内容的曝光量过滤结果的影响。有关未考虑新鲜度系数已在名词解释部分进行了详细的介绍,此处不再赘述。
综上所述,本申请实施例提供的技术方案中,通过获取目标多媒体内容的特征信息,并在提取到该特征信息的抽象特征之后,根据该抽象特征计算得到目标多媒体内容的未考虑新鲜度系数。相比于相关技术中,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证,本申请实施例提供的技术方案,利用特征信息的抽象特征,考虑了各个特征信息之间的相互关系,且全部由计算机设备完成,不仅可以节约时间和人力,而且可以更加准确地确定出未考虑新鲜度系数。
请参考图2,其示出了本申请另一个实施例提供的多媒体内容的相关参数的确定方法的流程图。在本申请实施例中,各步骤的执行主体为计算机设备。该方法可以包括如下几个步骤:
步骤201,获取目标多媒体内容的特征信息。
关于本步骤的详细介绍与图1实施例中步骤101相同或类似,此处不再赘述。
步骤202,调用完成训练的机器学习模型,将上述特征信息输入至机器学习模型,通过机器学习模型提取特征信息的抽象特征。
完成训练的机器学习模型是指通过多组训练样本数据对机器学习模型进行训练得到的。该机器学习模型可以是DeepFM模型,也可以是Wide&Deep模型,还可以是DNN(DeepNeural Networks,深度神经网络)模型等等,本申请实施例对此不作限定。
可选地,上述机器学习模型包括第一特征提取模块和第二特征提取模块,第一特征提取模块用于提取特征信息的高阶抽象特征,第二特征提取模块用于提取特征信息的低阶抽象特征。上述高阶抽象特征是指经过多次线性和非线性组合操作之后形成的特征;上述低阶抽象特征是指经过少量线性和非线性组合操作之后形成的特征。
在本实施例中,以该机器学习模型为DeepFM模型为例来说明。DeepFM模型可以包括FM(Factorization Machines,因子分解机)模块和DNN模块,其中,FM模块可以用来提取低阶抽象特征,DNN模块可以用来提取高阶抽象特征。
在本申请实施例中,机器学习模型包括第一特征提取模块和第二特征提取模块,分别提取高阶抽象特征和低阶抽象特征,不仅考虑到了特征之间复杂的非线性关系,而且考虑到了特征之间交叉的复杂广义线性关系,从而可以使得最终计算得到的未考虑新鲜度系数更加准确。
可选地,计算机设备对特征信息进行相关预处理后输入至机器学习模型。
众多特征信息按照数据类型可以分为连续特征信息、单值离散特征信息和多值离散特征信息。上述连续特征信息是指特征的取值是连续的值,如年龄、历史过滤比例等。以该多媒体内容是广告为例,上述单值离散特征信息是指每个广告对于该特征只有唯一的值,如每个广告有一个广告主标识、一级类目标识、二级类目标识等。上述多值离散特征信息是指如广告对于该特征可能有多个取值,例如每个广告可以投放到男性用户和女性用户,那么这个广告投放的性别特征就会有多个取值,性别特征就是一个多值离散特征;又例如每个广告可以投放到不同的地域,该地域特征就是一个多值离散特征。
计算机设备针对上述不同类别的特征信息,可以进行不同的预处理。则上述将特征信息输入至机器学习模型,包括:
1、当特征信息中包含连续特征信息时,直接将连续特征信息输入至机器学习模型。
以机器学习模型为DeepFM模型为例,该连续特征信息可以直接应用于模型中的DNN模块。
2、当特征信息中包含单值离散特征信息时,对单值离散特征信息执行嵌入处理,得到单值离散特征信息的嵌入值;将单值离散特征信息的嵌入值输入至机器学习模型。
以机器学习模型为DeepFM模型为例,该单值离散特征信息可以经预处理后应用于模型中的FM模块和DNN模块。
上述嵌入处理(Embedding)是用于将输入的离散特征信息,通过权重矩阵计算,压缩到低维度的稠密向量,以此输入至机器学习模型,从而可以节约计算资源。
3、当特征信息中包含多值离散特征信息时,对多值离散特征信息进行独热编码,得到多值离散特征信息的独热码;对多值离散特征信息的独热码执行嵌入处理,得到独热码的嵌入值;对独热码的嵌入值进行平均处理,得到多值离散特征信息的嵌入值;将多值离散特征信息的嵌入值输入至机器学习模型。
以机器学习模型为DeepFM模型为例,该多值离散特征信息可以经预处理后应用于模型中的FM模块和DNN模块。
多值离散特征信息进行独热(one-hot)编码,示例性地,假设对于多值离散特征信息中的性别特征信息,有男性和女性2个取值,那么经过独热编码后,就变成了2个二元特征的独热码10和01。并且,这两个特征取值互斥,每次只有一个激活。从而多值离散特征信息就会变成稀疏的数据信息。进一步解决了属性信息较难处理的问题,同时在一定程度上也起到了扩充特征的作用。
然后,计算机设备可以对得到的稀疏的独热码执行嵌入处理,得到稠密的独热码的嵌入值,进一步对稠密的独热码的嵌入值进行平均处理后,得到多值离散特征信息的嵌入值,以此输入至机器学习模型。
步骤203,根据上述抽象特征,计算目标多媒体内容的未考虑新鲜度系数。
可选地,机器学习模型在提取到特征信息的抽象特征后,可以根据上述抽象特征计算目标多媒体内容的未考虑新鲜度系数。
步骤204,根据目标多媒体内容的曝光量和未考虑新鲜度系数,计算目标多媒体内容的曝光量过滤结果。
在计算得到目标多媒体内容的未考虑新鲜度系数后,可以结合目标多媒体内容的曝光量,计算目标多媒体内容的曝光量过滤结果。
示例性地,结合参考图3,在询量系统中,结合多媒体内容的曝光量和未考虑新鲜度系数,在询量结果展示界面30中显示计算得到多媒体内容的曝光量过滤结果。询量结果展示界面30中,每一行表示一个过滤步骤,第一列31是询量阶段中每个过滤步骤的名称,第二列32是过滤掉的曝光量,第三列33是过滤前后的曝光量。其中,使用未考虑新鲜度系数过滤前的曝光量34是A3;使用未考虑新鲜度系数过滤掉的曝光量35是k3;使用未考虑新鲜度系数过滤后的曝光量36是A4,其中,A4=A3-k3。
本申请实施例提供的技术方案,借助于AI(Artificial Intelligence,人工智能)领域中的机器学习算法,实现了多媒体内容的未考虑新鲜度系数的计算,使得多媒体内容的曝光量过滤结果更加准确。
综上所述,在本申请实施例提供的技术方案中,在获取到目标多媒体内容的特征信息后,调用完成训练的机器学习模型,将特征信息输入至机器学习模型,通过机器学习模型提取抽象特征,并根据抽象特征,计算目标多媒体内容的未考虑新鲜度系数。相比于相关技术中,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证,本申请实施例提供的技术方案,利用特征信息的抽象特征,考虑了各个特征信息之间的相互关系,且全部由计算机设备完成,不仅可以节约时间和人力,而且可以更加准确地确定出未考虑新鲜度系数。
另外,在本申请实施例中,机器学习模型包括第一特征提取模块和第二特征提取模块,分别提取高阶抽象特征和低阶抽象特征,不仅考虑到了特征之间复杂的非线性关系,而且考虑到了特征之间交叉的复杂广义线性关系,从而可以使得最终计算得到的未考虑新鲜度系数更加准确。
此外,根据多媒体内容的曝光量和未考虑新鲜度系数,计算得到多媒体内容的曝光量过滤结果,进一步使得询量结果更加准确,给广告主下单提供了更可靠的依据。
在一个具体的例子中,结合参考图4,示例性示出了一种模型架构的示意图。以机器学习模型为DeepFM模型为例。
计算机设备获取的多媒体内容的特征信息包括连续特征信息和离散特征信息,其中离散特征信息包括单值离散特征信息和多值离散特征信息。首先,需要在嵌入堆叠层41对离散特征信息进行嵌入处理,得到对应的嵌入值。然后将得到的嵌入值联合连续特征信息,作为输入特征X0,输入至机器学习模型的FM模块42和DNN模块43。
接下来,在FM模块42提取低阶抽象特征,包括以下几个步骤:
1、对输入特征X0进行交叉相乘,如下述公式:Xc=X0,i*X0,j,其中X0,i和X0,j分别表示第i个和第j个输入特征,得到交叉结果Xc;
2、采用下述公式提取得到低阶抽象特征:
其中,yFM表示FM模块的输出,即提取的低阶抽象特征;<Vi,Vj>表示输入特征X0,i和X0,j之间的交叉相乘的系数;Vi表示X0,i的K维辅助向量;Vj表示X0,j的K维辅助向量;d表示输入特征的数量。
接下来,在DNN模块43提取高阶抽象特征,包括以下几个步骤:
1、以ReLU作为激励函数,采用下述公式,计算得到第一隐含层h1:
2、采用下述公式,计算得到第二隐含层h2:
3、结合第一隐含层h1和第二隐含层h2,得到DNN模块的输出yDNN,即高阶抽象特征。
在提取到上述低阶抽象特征yFM和高阶抽象特征yDNN之后,在输出层44,采用下述公式计算得到未考虑新鲜度系数P:
P=sigmoid(yFM+yDNN)。
其中,sigmoid()表示sigmoid函数。
在基于图1所示实施例提供的一个可选实施例中,在步骤102之前,计算机设备需要先获取完成训练的机器学习模型。上述机器学习模型可以由该计算机设备训练得到,也可以由其它设备训练得到,本申请实施例对此不作限定。结合参考图5,示出了本申请一个实施例提供的模型训练方法的流程图。在本实施例中,以多媒体内容为广告来举例说明。该方法可以包括如步骤:
步骤501,构建机器学习模型。
构建机器学习模型主要确定机器学习模型的如下内容:机器学习模型所包括的层,比如卷积层、归一化层、一维化层、全连接层等等。机器学习模型所包括的各个层的数量、参数以及连接关系等等。
步骤502,获取至少一个训练样本,每个训练样本包括一个多媒体内容样本的特征信息以及多媒体内容样本的未考虑新鲜度系数。
计算机设备可以从系统日志数据中解析得到上述至少一个训练样本。可选地,上述获取训练样本的步骤,包括以下几个子步骤:
1、获取至少一个候选多媒体内容的特征数据表。
示例性地,广告的特征数据表可以包括如下表-1至表-8。
其中,表-1是广告从触发到返回的详细过滤情况总表,记录着广告从触发到返回至CGI(Common Gateway Interface,通用网关接口)的详细的过滤过程,如广告触发的时间、广告长标识、推广系列标识等等,这整体的过滤过程就是广告投放的一种很重要的上下文信息。
表-1
表-2是合约广告基本信息表,存储的是合约广告的基本属性信息,这些基本属性信息标识着合约广告的基本面,每一种属性信息都是对合约广告的一个分类,也是对合约广告的几个基本描述,这些属性信息都起到了较强的标志作用。例如,当广告推广计划类型为4时,即代表该广告类型为合约广告。
特征名 | 特征含义 |
ftime | 广告触发的时间(例如20181014) |
aid | 广告长标识 |
product_id | 商品标识 |
ad_category_id | 广告类目标识 |
ad_campaign_type | 广告推广计划类型(合约广告为4) |
aindex | 广告短标识 |
site_set | 站点集合标识 |
segment_id | 版位标识 |
表-2
表-3是广告类目映射表,存储的是广告类目标识与广告一级类目和二级类目的映射关系;由基本的原始广告类目标识获取到一级类目以及分类更加细致的二级类目。
特征名 | 特征含义 |
ad_category_id | 广告类目标识 |
first_category | 广告一级类目 |
second_category | 广告二级类目 |
表-3
表-4是检索阶段广告详细过滤信息表,存储的是广告在检索阶段的过滤指标类型以及过滤掉的曝光量。
特征名 | 特征含义 |
ftime | 广告触发的时间 |
aindex | 广告短标识 |
filter_code | 过滤码 |
filter_code_cnt | 过滤次数 |
表-4
表-5是粗排阶段洗脸过滤信息表,存储的是广告粗排阶段过滤指标类型以及过滤掉的曝光量。
特征名 | 特征含义 |
ftime | 广告触发的时间 |
aindex | 广告短标识 |
wash_code | 洗脸策略过滤码 |
wash_code_cnt | 过滤次数 |
表-5
表-6是doc wash阶段过滤信息表,存储的是广告在doc wash阶段过滤指标类型以及过滤掉的曝光量。
特征名 | 特征含义 |
ftime | 广告触发的时间 |
aindex | 广告短标识 |
doc_wash_filter_code | doc wash过滤码 |
doc_wash_code_cnt | doc wash过滤次数 |
表-6
表-7是精排阶段广告多样性过滤信息表,存储的是广告在精排阶段过滤指标类型以及过滤掉的曝光量。
特征名 | 特征含义 |
ftime | 广告触发的时间 |
aindex | 广告短标识 |
diversity_filter | 多样性过滤码 |
diversity_filter_cnt | 多样性过滤次数 |
表-7
表-8是合约广告投放定向表,存储的是广告投放定向信息,记录的是每个合约广告的受众特点,这个信息将直接体现合约广告的定向受众用户。
表-8
2、从至少一个候选多媒体内容中筛选出符合预设条件的多媒体内容,作为多媒体内容样本,其中,预设条件包括:属于目标类型和/或历史投放时长大于预设时长。
根据上述广告的特征数据表,可以选出符合预设条件的广告,作为训练的广告样本。
在一种可能的实施方式中,预设条件只包括属于目标类型。
上述多媒体内容的类型,可以包括合约广告、竞价广告等,上述目标类型可以是任意一种。多媒体内容的类型可以根据特征数据表中标识类型的字段来确定。例如根据上述合约广告基本信息表中,广告推广计划类型,当广告推广计划类型为4时,即代表该广告类型为合约广告。
预设条件包含属于目标类型,是为了保留下所有多媒体内容中目标类型多媒体内容的信息,除去其它类型的多媒体内容。
在另一种可能的实施方式中,预设条件只包括历史投放时长大于预设时长。
上述历史投放时长是多媒体内容投放的时间长度,可以根据特征数据表中标识投放时长的字段来确定。示例性地,历史投放时长可以根据上述广告从触发到返回的详细过滤情况总表中,广告在当天投放的有效小时数来确定。
假设预设时长为20,当预设条件包括历史投放时长大于预设时长,则只保留历史投放时长大于20的多媒体内容作为接下来的多媒体内容样本,从而去除一些有效时间不足20个小时的多媒体内容,从而除去因投放时间太短造成的不准确的多媒体内容样本。
在又一种可能的实施方式中,预设条件还可以同时包括属于目标类型和历史投放时长大于预设时长,则多媒体内容样本是同时符合上述两种预设条件的多媒体内容。
3、从多媒体内容样本的特征数据表中提取多媒体内容样本的特征信息,得到训练样本。
在确定多媒体内容样本后,可以从该样本的特征数据表中提取多媒体内容样本的特征信息,以及多媒体内容样本的未考虑新鲜度系数,作为训练机器学习模型的样本。
步骤503,采用训练样本对机器学习模型进行训练,得到完成训练的机器学习模型。
在获取到训练样本后,可以对机器学习模型进行训练。可选地,当机器学习模型的训练满足停止训练条件时,停止对该机器学习模型的训练,得到完成训练的机器学习模型。
上述停止训练条件包括损失函数值小于预设阈值,或者,训练次数小于预设次数。其中,损失函数值可以根据多媒体内容样本的未考虑新鲜度系数和未训练得到的考虑新鲜度系数样得到。当损失函数值大于或等于预设阈值时,则对神经网络模型的各项参数进行调整,并重新开始执行步骤403,直到损失函数值小于预设阈值为止。
上述预设阈值和预设次数可以根据实际经验设定,本申请实施例对此不作限定。
可选地,结合参考图6,其示例性示出了一种广告系统的示意图。在得到完成训练的机器学习模型61后,可以将该机器学习模型61与广告投放系统62、询量系统63和数据系统64结合起来,形成完整的广告系统。询量系统63在询量过程中读取机器学习模型61计算得到的未考虑新鲜度系数,为询量提供依据。询量完成之后,进行锁量下单,广告投放系统62投放广告。广告投放的相关数据都会记录在系统日志数据65中,以使得计算机设备从系统日志数据65中解析得到上述训练样本。
可选地,上述数据系统中的数据文件可以每天进行更新,也可以每半天进行更新,还可以每2小时进行更新等等,更新时长可以根据实际经验设定,本申请实施例对此不作限定。
下面,通过多组使用本申请提供的技术方案得到的未考虑新鲜度系数,与采用相关技术,如配置法和粗细粒度统计法,得到的未考虑新鲜度系数,进行对比,以说明本申请提供的技术方案取得的有益效果。
上述配置法,结合参考图7,即根据广告的版位,采用人工计算的方式得到广告的未考虑新鲜度系数,并写入配置文71。配置人员将该广告的未考虑新鲜度系数配置到线上的询量系统63中,询量系统63在读取到该广告的未考虑新鲜度系数之后,得到该广告的询量结果并锁量下单。之后,相关人员需要根据系统日志数据65记录的广告投放过程中的相关数据来不定期维护上述配置文件。
上述粗细粒度统计法,即先根据广告的版位和广告所属类目、广告的版位、广告的站点集合和和广告所属类目、广告的站点集合4种划分方式,将流量划分为4种不同的粗细粒度,如下述表-9所示。然后,结合参考图8,按照上述4种划分方式,从系统日志数据65中,按照一定的统计策略81统计得到每个划分粒度级别的未考虑新鲜度系数,并记入模型文件82,配置人员将该模型文件配置到线上的询量系统63中,询量系统63在读取到该广告的未考虑新鲜度系数之后,得到该广告的询量结果并锁量下单。
表-9
下面结合表-10,通过多组使用本申请提供的技术方案得到的未考虑新鲜度系数,与采用配置法和粗细粒度统计法,得到的未考虑新鲜度系数,进行详细地对比:
表-10
上述RMSE(Root Mean Squared Error,均方根误差)的定义为:
其中,y_actual是测试样本的真实值;y_predict是测试样本的预估值。RMSE值越小,表示预估结果越准确。
MAE(Mean Absolute Error,平均绝对误差)的定义为:
MAE值越小,表示预估结果越准确。
R2(coefficient of determination,决定系数)的定义为:
其中,y_mean表示测试样本真实值的平均值。R2值越接近1,表示预估结果越准确。
从上述表-10中可以看出,本申请实施例提供的技术方案确定的未考虑新鲜度系数更准确。
在示意性的例子中,本申请提供的技术方案应用于广告投放场景中,用来确定广告的未考虑新鲜度系数,主要包括以下几个步骤:首先,计算机设备获取目标广告的特征信息,该特征信息用于指示该广告的相关属性;然后,计算机设备提取该特征信息的抽象特征,该抽象特征用于反映上述特征信息之间的相互关系;接下来,根据上述抽象特征,计算目标广告的未考虑新鲜度系数,该未考虑新鲜度系数用于表征未考虑到的新鲜度指标对目标广告的曝光量过滤结果的影响;其中,计算设备可以调用完成训练的机器学习模型,将特征信息输入至该机器学习模型,通过该机器学习模型提取上述抽象特征,并基于抽象特征得到未考虑新鲜度系数并输出;最后,根据目标广告的曝光量和未考虑新鲜度系数,计算目标广告的曝光量过滤结果,并根据该未考虑新鲜度系数进行广告投放。
另外,本申请实施例提供的技术方案还可以应用于视频推荐、歌曲推送、应用程序推荐等场景中,相关实现原理和步骤与上文介绍的广告投放场景中的原理和步骤相同或类似,本申请实施例仅以应用于广告投放场景中来举例说明。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
请参考图9,其示出了本申请一个实施例提供的多媒体内容的相关参数的确定装置的框图。该装置具有实现上述多媒体内容的相关参数的确定方法示例的功能,所述功能可以由硬件实现,也可以由硬件执行相应的软件实现。该装置可以是上文介绍的计算机设备,也可以设置在计算机设备上。该装置900可以包括:信息获取模块910、特征提取模块920和系数计算模块930。
信息获取模块910,用于获取目标多媒体内容的特征信息,所述特征信息用于指示所述目标多媒体内容的相关属性。
特征提取模块920,用于提取所述特征信息的抽象特征,所述抽象特征用于反映所述特征信息之间的相互关系。
系数计算模块930,用于根据所述抽象特征,计算所述目标多媒体内容的未考虑新鲜度系数,所述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对所述目标多媒体内容的曝光量过滤结果的影响。
综上所述,本申请实施例提供的技术方案中,通过获取目标多媒体内容的特征信息,并在提取到该特征信息的抽象特征之后,根据该抽象特征计算得到目标多媒体内容的未考虑新鲜度系数。相比于相关技术中,每个广告的未考虑新鲜度系数都需要人工进行计算,费时费力,且准确性难以得到保证,本申请实施例提供的技术方案,利用特征信息的抽象特征,考虑了各个特征信息之间的相互关系,且全部由计算机设备完成,不仅可以节约时间和人力,而且可以更加准确地确定出未考虑新鲜度系数。
在基于图9实施例提供的一个可选实施例中,所述特征提取模块920,用于:
调用完成训练的机器学习模型,将所述特征信息输入至所述机器学习模型,通过所述机器学习模型提取所述抽象特征。
其中,所述机器学习模型包括第一特征提取模块和第二特征提取模块,所述第一特征提取模块用于提取所述特征信息的高阶抽象特征,所述第二特征提取模块用于提取所述特征信息的低阶抽象特征。
可选地,特征提取模块920,还用于:
当所述特征信息中包含连续特征信息时,直接将所述连续特征信息输入至所述机器学习模型。
当所述特征信息中包含单值离散特征信息时,对所述单值离散特征信息执行嵌入处理,得到所述单值离散特征信息的嵌入值;将所述单值离散特征信息的嵌入值输入至所述机器学习模型。
当所述特征信息中包含多值离散特征信息时,对所述多值离散特征信息进行独热编码,得到所述多值离散特征信息的独热码;对所述多值离散特征信息的独热码执行嵌入处理,得到所述独热码的嵌入值;对所述独热码的嵌入值进行平均处理,得到所述多值离散特征信息的嵌入值;将所述多值离散特征信息的嵌入值输入至所述机器学习模型。
可选地,所述机器学习模型的训练过程如下:
构建所述机器学习模型;
获取至少一个训练样本,每个所述训练样本包括一个多媒体内容样本的特征信息以及所述多媒体内容样本的未考虑新鲜度系数;
采用所述训练样本对所述机器学习模型进行训练,得到完成训练的所述机器学习模型。
可选地,所述获取至少一个训练样本,包括:
获取至少一个候选多媒体内容的特征数据表;
从所述至少一个候选多媒体内容中筛选出符合预设条件的多媒体内容,作为所述多媒体内容样本,其中,所述预设条件包括:属于目标类型和/或历史投放时长大于预设时长;
从所述多媒体内容样本的特征数据表中提取所述多媒体内容样本的特征信息,得到所述训练样本。
在基于图9实施例或者上述任一可选实施例提供的另一个可选实施例中,所述特征信息包括基本特征信息、投放特征信息、定向特征信息组成的群组中选择的至少一个;
其中,所述基本特征信息用于指示所述目标多媒体内容的基本属性,所述投放特征信息用于指示所述目标多媒体内容的投放属性,所述定向特征信息用于指示所述目标多媒体内容的定向属性。
在基于图9实施例或者上述任一可选实施例提供的另一个可选实施例中,如图10所示,所述装置900还包括:结果计算模块940。
结果计算模块940,用于根据所述目标多媒体内容的曝光量和所述未考虑新鲜度系数,计算所述目标多媒体内容的曝光量过滤结果。
需要说明的是,上述实施例提供的装置,在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置与方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
请参考图11,其示出了本申请一个实施例提供的计算机设备的结构示意图。该计算机设备用于实施上述实施例中提供的多媒体内容的相关参数的确定方法。具体来讲:
所述计算机设备1100包括中央处理单元(CPU)1101、包括随机存取存储器(RAM)1102和只读存储器(ROM)1103的系统存储器1104,以及连接系统存储器1104和中央处理单元1101的系统总线1105。所述计算机设备1100还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(I/O系统)1106,和用于存储操作系统1113、应用程序1114和其他程序模块1112的大容量存储设备1107。
所述基本输入/输出系统1106包括有用于显示信息的显示器1108和用于用户输入信息的诸如鼠标、键盘之类的输入设备1109。其中所述显示器1108和输入设备1109都通过连接到系统总线1105的输入输出控制器1110连接到中央处理单元1101。所述基本输入/输出系统1106还可以包括输入输出控制器1110以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1110还提供输出到显示屏、打印机或其他类型的输出设备。
所述大容量存储设备1107通过连接到系统总线1105的大容量存储控制器(未示出)连接到中央处理单元1101。所述大容量存储设备1107及其相关联的计算机可读介质为计算机设备1100提供非易失性存储。也就是说,所述大容量存储设备1107可以包括诸如硬盘或者CD-ROM驱动器之类的计算机可读介质(未示出)。
不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括RAM、ROM、EPROM、EEPROM、闪存或其他固态存储其技术,CD-ROM、DVD或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1104和大容量存储设备1107可以统称为存储器。
根据本申请的各种实施例,所述计算机设备1100还可以通过诸如因特网等网络连接到网络上的远程计算机运行。也即计算机设备1100可以通过连接在所述系统总线1105上的网络接口单元1111连接到网络1112,或者说,也可以使用网络接口单元1111来连接到其他类型的网络或远程计算机系统(未示出)。
所述存储器还包括至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、至少一段程序、代码集或指令集存储于存储器中,且经配置以由一个或者一个以上处理器执行,以实现上述多媒体内容的相关参数的确定方法。
在示例性实施例中,还提供了一种计算机设备。所述计算机设备包括处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现上述多媒体内容的相关参数的确定方法。
在示例性实施例中,还提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或所述指令集在被处理器执行时实现上述多媒体内容的相关参数的确定方法。
在示例性实施例中,还提供了一种计算机程序产品,当该计算机程序产品被处理器执行时,其用于实现上述多媒体内容的相关参数的确定方法。
应当理解的是,在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
以上所述仅为本申请的示例性实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (8)
1.一种多媒体内容的相关参数的确定方法,其特征在于,应用于计算机设备中,所述方法包括:
获取目标多媒体内容的特征信息,所述特征信息用于指示所述目标多媒体内容的相关属性;
调用完成训练的机器学习模型,将所述特征信息输入至所述机器学习模型,通过所述机器学习模型提取所述特征信息的抽象特征,所述抽象特征用于反映所述特征信息之间的相互关系;其中,所述机器学习模型包括第一特征提取模块和第二特征提取模块,所述第一特征提取模块用于提取所述特征信息的高阶抽象特征,所述第二特征提取模块用于提取所述特征信息的低阶抽象特征;
根据所述特征信息的高阶抽象特征和所述特征信息的低阶抽象特征,采用sigmoid函数计算所述目标多媒体内容的未考虑新鲜度系数,所述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对所述目标多媒体内容的曝光量过滤结果的影响;
根据所述目标多媒体内容的曝光量和所述未考虑新鲜度系数,计算所述目标多媒体内容的曝光量过滤结果。
2.根据权利要求1所述的方法,其特征在于,所述将所述特征信息输入至所述机器学习模型,包括:
当所述特征信息中包含连续特征信息时,直接将所述连续特征信息输入至所述机器学习模型;
当所述特征信息中包含单值离散特征信息时,对所述单值离散特征信息执行嵌入处理,得到所述单值离散特征信息的嵌入值;将所述单值离散特征信息的嵌入值输入至所述机器学习模型;
当所述特征信息中包含多值离散特征信息时,对所述多值离散特征信息进行独热编码,得到所述多值离散特征信息的独热码;对所述多值离散特征信息的独热码执行嵌入处理,得到所述独热码的嵌入值;对所述独热码的嵌入值进行平均处理,得到所述多值离散特征信息的嵌入值;将所述多值离散特征信息的嵌入值输入至所述机器学习模型。
3.根据权利要求1所述的方法,其特征在于,所述机器学习模型的训练过程如下:
构建所述机器学习模型;
获取至少一个训练样本,每个所述训练样本包括一个多媒体内容样本的特征信息以及所述多媒体内容样本的未考虑新鲜度系数;
采用所述训练样本对所述机器学习模型进行训练,得到完成训练的所述机器学习模型。
4.根据权利要求3所述的方法,其特征在于,所述获取至少一个训练样本,包括:
获取至少一个候选多媒体内容的特征数据表;
从所述至少一个候选多媒体内容中筛选出符合预设条件的多媒体内容,作为所述多媒体内容样本,其中,所述预设条件包括:属于目标类型和/或历史投放时长大于预设时长;
从所述多媒体内容样本的特征数据表中提取所述多媒体内容样本的特征信息,得到所述训练样本。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述特征信息包括基本特征信息、投放特征信息、定向特征信息组成的群组中选择的至少一个;
其中,所述基本特征信息用于指示所述目标多媒体内容的基本属性,所述投放特征信息用于指示所述目标多媒体内容的投放属性,所述定向特征信息用于指示所述目标多媒体内容的定向属性。
6.一种多媒体内容的相关参数的确定装置,其特征在于,应用于计算机设备中,所述装置包括:
信息获取模块,用于获取目标多媒体内容的特征信息,所述特征信息用于指示所述目标多媒体内容的相关属性;
特征提取模块,用于调用完成训练的机器学习模型,将所述特征信息输入至所述机器学习模型,通过所述机器学习模型提取所述特征信息的抽象特征,所述抽象特征用于反映所述特征信息之间的相互关系;其中,所述机器学习模型包括第一特征提取模块和第二特征提取模块,所述第一特征提取模块用于提取所述特征信息的高阶抽象特征,所述第二特征提取模块用于提取所述特征信息的低阶抽象特征;
系数计算模块,用于根据所述特征信息的高阶抽象特征和所述特征信息的低阶抽象特征,采用sigmoid函数计算所述目标多媒体内容的未考虑新鲜度系数,所述未考虑新鲜度系数用于表征未考虑到的新鲜度指标对所述目标多媒体内容的曝光量过滤结果的影响;
结果计算模块,用于根据所述目标多媒体内容的曝光量和所述未考虑新鲜度系数,计算所述目标多媒体内容的曝光量过滤结果。
7.一种计算机设备,其特征在于,所述计算机设备包括处理器和存储器,所述存储器中存储有至少一段程序,所述至少一段程序由所述处理器加载并执行以实现如权利要求1至5任一项所述的方法。
8.一种计算机可读存储介质,其特征在于,所述存储介质中存储有至少一段程序,所述至少一段程序由处理器加载并执行以实现如权利要求1至5任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204453.9A CN111709764B (zh) | 2019-03-18 | 2019-03-18 | 多媒体内容的相关参数的确定方法、装置及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910204453.9A CN111709764B (zh) | 2019-03-18 | 2019-03-18 | 多媒体内容的相关参数的确定方法、装置及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111709764A CN111709764A (zh) | 2020-09-25 |
CN111709764B true CN111709764B (zh) | 2023-04-18 |
Family
ID=72536095
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910204453.9A Active CN111709764B (zh) | 2019-03-18 | 2019-03-18 | 多媒体内容的相关参数的确定方法、装置及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111709764B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112163165B (zh) * | 2020-10-21 | 2024-05-17 | 腾讯科技(深圳)有限公司 | 信息推荐方法、装置、设备及计算机可读存储介质 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103430527A (zh) * | 2011-03-15 | 2013-12-04 | 杜比实验室特许公司 | 用于图像数据变换的方法和装置 |
CN105117448A (zh) * | 2015-08-14 | 2015-12-02 | 新一站保险代理有限公司 | 一种网络购物中基于图片的产品曝光率算法及系统 |
CN108965938A (zh) * | 2018-08-03 | 2018-12-07 | 山东大学 | 智能电视中潜在付费用户预测方法及系统 |
CN108985851A (zh) * | 2018-07-24 | 2018-12-11 | 广州市丰申网络科技有限公司 | 基于大数据强化学习的广告分析与监控方法及装置 |
CN109003140A (zh) * | 2018-07-26 | 2018-12-14 | 腾讯科技(深圳)有限公司 | 多媒体内容的投放出资的确定方法、设备及存储介质 |
CN109101964A (zh) * | 2018-08-15 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 确定多媒体文件中首尾区域的方法、设备及存储介质 |
-
2019
- 2019-03-18 CN CN201910204453.9A patent/CN111709764B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103430527A (zh) * | 2011-03-15 | 2013-12-04 | 杜比实验室特许公司 | 用于图像数据变换的方法和装置 |
CN105117448A (zh) * | 2015-08-14 | 2015-12-02 | 新一站保险代理有限公司 | 一种网络购物中基于图片的产品曝光率算法及系统 |
CN108985851A (zh) * | 2018-07-24 | 2018-12-11 | 广州市丰申网络科技有限公司 | 基于大数据强化学习的广告分析与监控方法及装置 |
CN109003140A (zh) * | 2018-07-26 | 2018-12-14 | 腾讯科技(深圳)有限公司 | 多媒体内容的投放出资的确定方法、设备及存储介质 |
CN108965938A (zh) * | 2018-08-03 | 2018-12-07 | 山东大学 | 智能电视中潜在付费用户预测方法及系统 |
CN109101964A (zh) * | 2018-08-15 | 2018-12-28 | 腾讯科技(深圳)有限公司 | 确定多媒体文件中首尾区域的方法、设备及存储介质 |
Non-Patent Citations (1)
Title |
---|
李楚桐.基于域感知因子分解机的广告推荐模型研究.《中国优秀硕士学位论文全文数据库》.2018,(第12期),J157-108. * |
Also Published As
Publication number | Publication date |
---|---|
CN111709764A (zh) | 2020-09-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113626719B (zh) | 信息推荐方法、装置、设备、存储介质及计算机程序产品 | |
CA3045736A1 (en) | Digital banking platform and architecture | |
CN103927615B (zh) | 将实体与类别相关联 | |
CN107423859B (zh) | 一种组合模型建模方法及系统 | |
CN110704730A (zh) | 基于大数据的产品数据推送方法、系统及计算机设备 | |
CN102385727A (zh) | Id价值评价设备,id价值评价系统和id价值评价方法 | |
CN110766428A (zh) | 一种数据价值评估系统以及方法 | |
CN112990386B (zh) | 用户价值聚类方法、装置、计算机设备和存储介质 | |
CN108572988A (zh) | 一种房产评估数据生成方法和装置 | |
CN111291936B (zh) | 产品生命周期预估模型生成方法、装置及电子设备 | |
CN115358809A (zh) | 一种基于图对比学习的多意图推荐方法及装置 | |
CN110688433B (zh) | 一种基于路径的特征生成方法及装置 | |
CN113204655A (zh) | 多媒体信息的推荐方法、相关装置及计算机存储介质 | |
CN116127184A (zh) | 产品的推荐方法及装置、非易失性存储介质、电子设备 | |
CN111709764B (zh) | 多媒体内容的相关参数的确定方法、装置及存储介质 | |
CN106919609B (zh) | 产品信息推送方法和装置 | |
CN114595323A (zh) | 画像构建、推荐、模型训练方法、装置、设备及存储介质 | |
CN114330837A (zh) | 对象处理方法、装置、计算机设备和存储介质 | |
Angelini et al. | The complex dynamics of products and its asymptotic properties | |
CN115730125A (zh) | 对象识别方法、装置、计算机设备和存储介质 | |
CN113327132A (zh) | 多媒体推荐方法、装置、设备及存储介质 | |
CN112364919A (zh) | 数据处理方法、装置、设备及存储介质 | |
CN115471260A (zh) | 基于神经网络的销售预测方法、装置、设备及介质 | |
Birkeland et al. | Developing and evaluating an automated valuation model for residential real estate in Oslo | |
CN113706258A (zh) | 基于组合模型的产品推荐方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40028484 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |