CN112446738A - 广告数据处理方法、装置、介质以及电子设备 - Google Patents

广告数据处理方法、装置、介质以及电子设备 Download PDF

Info

Publication number
CN112446738A
CN112446738A CN202011412900.9A CN202011412900A CN112446738A CN 112446738 A CN112446738 A CN 112446738A CN 202011412900 A CN202011412900 A CN 202011412900A CN 112446738 A CN112446738 A CN 112446738A
Authority
CN
China
Prior art keywords
advertisement
optimized
prediction model
data
matrix
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011412900.9A
Other languages
English (en)
Inventor
顾立瑞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202011412900.9A priority Critical patent/CN112446738A/zh
Publication of CN112446738A publication Critical patent/CN112446738A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0241Advertisements
    • G06Q30/0251Targeted advertisements
    • G06Q30/0269Targeted advertisements based on user profile or attribute
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities

Landscapes

  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Engineering & Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Finance (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本公开提供了一种广告数据处理方法、装置、介质以及电子设备。该方法包括:确定待优化预测模型,并获取与待优化预测模型对应的广告数据;确定与待优化预测模型对应的标注规则,并按照标注规则标注广告数据得到数据矩阵;对数据矩阵进行矩阵分解处理得到广告隐式特征,以利用广告隐式特征优化待优化预测模型。本公开对广告数据生成的数据矩阵进行矩阵分解处理得到广告隐式特征,挖掘过程无需过多用户特征和物品特征,减少了挖掘广告隐式特征的人力成本和时间成本,提高了特征挖掘效率;另一方面,利用广告隐式特征优化的待优化预测模型有至少两种,丰富了挖掘到的用户隐式特征的应用场景,并且优化了各个应用场景中的待优化预测模型的预测效果。

Description

广告数据处理方法、装置、介质以及电子设备
技术领域
本公开涉及人工智能技术领域,具体而言,涉及一种广告数据处理方法、广告数据处理装置、计算机可读介质以及电子设备。
背景技术
随着互联网技术的快速发展,网络空间中的信息量呈指数级增长,从而导致在海量数据中挖掘到有用的数据变得愈发困难。
尤其是在广告数据处理领域,挖掘到广告隐式特征对预测用户的数据具有极为重要的影响。但是,目前通过双塔模型挖掘广告隐式特征是十分困难的。
鉴于此,本领域亟需开发一种新的广告数据处理方法及装置。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的技术背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种广告数据处理方法、广告数据处理装置、计算机可读介质以及电子设备,进而至少在一定程度上克服广告隐式特征挖掘困难的技术问题。
本公开的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本公开的实践而习得。
根据本公开实施例的一个方面,提供一种广告数据处理方法,该方法包括:确定待优化预测模型,并获取与所述待优化预测模型对应的广告数据;
确定与所述待优化预测模型对应的标注规则,并按照所述标注规则标注所述广告数据得到数据矩阵;
对所述数据矩阵进行矩阵分解处理得到广告隐式特征,以利用所述广告隐式特征优化所述待优化预测模型。
根据本公开实施例的一个方面,提供一种广告数据处理装置,该装置包括:模型确定模块,被配置为确定待优化预测模型,并获取与所述待优化预测模型对应的广告数据;
数据标注模块,被配置为确定与所述待优化预测模型对应的标注规则,并按照所述标注规则标注所述广告数据得到数据矩阵;
模型优化模块,被配置为对所述数据矩阵进行矩阵分解处理得到广告隐式特征,以利用所述广告隐式特征优化所述待优化预测模型。
在本公开的一些实施例中,基于以上技术方案,所述数据标注模块包括:点击率样本单元,被配置为确定与所述广告点击率预测模型对应的点击率正样本标注规则和点击率负样本标注规则;
点击率规则单元,被配置为将所述点击率正样本标注规则和所述点击率负样本标注规则确定为标注规则。
在本公开的一些实施例中,基于以上技术方案,所述数据标注模块包括:转化率样本单元,被配置为确定与所述广告转换率预测模型对应的转化率正样本标注规则和转化率负样本标注规则;
转化率规则单元,被配置为将所述转化率正样本标注规则和所述转化率负样本标注规则确定为标注规则。
在本公开的一些实施例中,基于以上技术方案,所述模型优化模块包括:矩阵分解单元,被配置为利用矩阵分解模型对所述数据矩阵进行矩阵分解处理得到用户隐式特征;
特征确定单元,被配置为确定所述用户隐式特征为广告隐式特征。
在本公开的一些实施例中,基于以上技术方案,所述模型优化模块,包括:原始特征单元,被配置为获取所述待优化预测模型的原始特征;
特征输入单元,被配置为将所述原始特征和所述广告隐式特征输入至所述待优化预测模型,以优化所述待优化预测模型。
在本公开的一些实施例中,基于以上技术方案,所述模型确定模块,包括:时长确定单元,被配置为确定与所述待优化预测模型对应的累积时长,并获取在所述累积时长内的原始数据;
数据处理单元,被配置为对所述原始数据进行预处理得到广告数据。
在本公开的一些实施例中,基于以上技术方案,所述广告数据处理装置,还包括:参数获取模块,被配置为确定优化后的所述待优化预测模型的优化参数,并获取与所述优化参数对应的有效参数;
优化结果模块,被配置为若所述优化参数大于所述有效参数,确定所述待优化预测模型优化成功。
根据本公开实施例的一个方面,提供一种计算机可读介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如以上技术方案中的广告数据处理方法。
根据本公开实施例的一个方面,提供一种电子设备,该电子设备包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器被配置为经由执行所述可执行指令来执行如以上技术方案中的广告数据处理方法。
根据本公开实施例的一个方面,提供一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实施例中提供的广告数据处理方法。
在本公开实施例提供的技术方案中,一方面,对广告数据生成的数据矩阵进行矩阵分解处理得到广告隐式特征,挖掘过程无需过多用户特征和物品特征,减少了挖掘广告隐式特征的人力成本和时间成本,提高了特征挖掘效率;另一方面,利用广告隐式特征优化的待优化预测模型有至少两种,丰富了挖掘到的用户隐式特征的应用场景,并且优化了各个应用场景中的待优化预测模型的预测效果。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性地示出了应用本公开技术方案的示例性系统的架构示意图;
图2示意性地示出了本公开的一些实施例中一种广告数据处理方法的步骤流程图;
图3示意性地示出了在本公开的一些实施例中获取广告数据的方法的步骤流程图;
图4示意性地示出了在本公开的一些实施例中确定广告点击率预测模型的标注规则的方法的步骤流程图;
图5示意性地示出了在本公开的一些实施例中确定广告转化率预测模型的方法的步骤流程图;
图6示意性地示出了在本公开的一些实施例中矩阵分解处理的方法的步骤流程图;
图7示意性地示出了在本公开的一些实施例中优化待优化预测模型的方法的步骤流程图;
图8示意性地示出了在本公开的一些实施例中确定待优化预测模型优化成功的方法的步骤流程图;
图9示意性地示出了在本公开些实施例在应用场景下的广告数据处理方法的步骤流程图;
图10示意性地示出了在本公开的一些实施例中在应用场景下矩阵分解处理模型进行矩阵分解处理的方式示意图;
图11示意性地示出了在本公开一些实施例中的一种广告数据处理装置的结构框图;
图12示意性地示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本公开的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本公开的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
在本领域的相关技术中,挖掘用户的隐式特征是通过一个双塔模型实现的。隐式特征是一种特征表征形式。相对于显示特征,隐式特征的每一维度都有不可解释性,是一个embedding表征向量。
在双塔模型中,用户塔和物品塔分别对用户和物品做embedding向量表征,把用户塔的中间层拿出来作为用户的表征向量,亦即用户隐式特征。
首先,在数据输入阶段,主要使用用户兴趣数据、扣费数据和广告数据这三种。其中,兴趣数据包括商业兴趣数据、营销兴趣数据、手机应用程序兴趣数据、媒体兴趣数据和商圈类目兴趣数据等等,维度超过1万维;扣费数据为用户在每个站点*每个行业上的扣费信息,共有1千多维;广告数据包括广告基础属性数据、广告长度数据、平均浏览时长、点击数和曝光数等,维度超过1万维。
然后,在特征抽取阶段,使用双塔模型进行训练和预测。其中,用户塔的输入包含用户近期每天的广告扣费数据等序列型特征、用户商业兴趣和营销兴趣等离散型特征、用户媒体兴趣和商圈类目兴趣等连续性特征。物品塔的输入包含广告的一级分类和二级分类等离散型特征,广告长度、平均浏览时长、点击数、曝光数等连续性特征。进一步的,投影层将序列型特征和离散型特征被嵌入成向量后,序列向量会输送给序列特征提取模块进行序列信息抽取,离散型特征会输送给特征交叉模块进行特征交叉。将序列表征向量(物品塔侧没有序列)、交叉表征和连续型特征拼接起来并输送给多层全连接层进行矩阵变换,进而将用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间。最后,在输出层,用户侧的用户表征向量和物品侧的物品表征向量映射至统一语义空间后,并经过L2正则化使得两者向量通过点积运算进行交互匹配,最终通过激活函数,例如Sigmoid函数进行缩放,最终把用户塔部分中间隐层拿出来作为用户隐式特征。
但是这种方式需要大量的用户特征和物品特征来进行双塔模型的训练和预测,特征获取起来十分困难。
基于以上方案存在的问题,本公开提供了一种基于人工智能的广告数据处理方法、广告数据处理装置、计算机可读介质以及电子设备。
人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。
人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,机器学习(Machine Learning,ML)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
利用人工智能中机器学习方法的广告数据处理方法,减少了挖掘广告隐式特征的人力成本和时间成本,提高了特征挖掘效率。
图1示出了应用本公开技术方案的示例性系统架构示意图。
如图1所示,系统架构100可以包括终端110、网络120、服务器端130。其中,终端110和服务器端130通过网络120连接。
终端110可以是智能手机、平板电脑、笔记本电脑、台式计算机、智能音箱、智能手表等,但并不局限于此。网络120可以是能够在终端110和服务器端130之间提供通信链路的各种连接类型的通信介质,例如可以是有线通信链路、无线通信链路或者光纤电缆等等,本申请在此不做限制。服务器130可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、CDN、以及大数据和人工智能平台等基础云计算服务的云服务器。
具体地,服务器端130可以确定待优化预测模型,并获取与待优化预测模型对应的广告数据。然后,确定与待优化预测模型对应的标注规则,并按照标注规则标注广告数据得到数据矩阵。进一步的,对数据矩阵进行矩阵分解处理得到广告隐式特征,以利用广告隐式特征优化待预测模型。
另外,本公开实施例中的广告数据处理方法可以应用于终端,也可以应用于服务器端,本公开对此不做特殊限定。本公开实施例主要以广告数据处理方法应用于服务器端130来举例说明。
下面结合具体实施方式对本公开提供的广告数据处理方法、广告数据处理装置、计算机可读介质以及电子设备做出详细说明。
图2示意性地示出了本公开的一些实施例中广告数据处理方法的步骤流程图,如图2所示,广告数据处理方法主要可以包括以下步骤:
步骤S210.确定待优化预测模型,并获取与待优化预测模型对应的广告数据。
步骤S220.确定与待优化预测模型对应的标注规则,并按照标注规则标注广告数据得到数据矩阵。
步骤S230.对数据矩阵进行矩阵分解处理得到广告隐式特征,以利用广告隐式特征优化待优化预测模型。
在本公开的示例性实施例中,一方面,对广告数据生成的数据矩阵进行矩阵分解处理得到广告隐式特征,挖掘过程无需过多用户特征和物品特征,减少了挖掘广告隐式特征的人力成本和时间成本,提高了特征挖掘效率;另一方面,利用广告隐式特征优化的待优化预测模型有至少两种,丰富了挖掘到的用户隐式特征的应用场景,并且优化了各个应用场景中的待优化预测模型的预测效果。
下面对广告数据处理方法的各个步骤进行详细说明。
在步骤S210中,确定待优化预测模型,并获取与待优化预测模型对应的广告数据。
在本公开的示例性实施例中,该待优化预测模型可以是从至少两个广告预测模型中确定的。
其中,广告预测模型可以包括广告点击率预测模型和广告转化率预测模型,也可以包括广告数据处理方面的任意一种预测模型,本示例性实施例对此不做特殊限定。
在确定待优化预测模型之后,可以进一步获取与该待优化预测模型对应的广告数据。
在可选的实施例中,图3示出了获取广告数据的方法的步骤流程图,如图3所示,该方法至少包括以下步骤:在步骤S310中,确定与待优化预测模型对应的累计时长,并获取在累计时长内的原始数据。
该累计时长可以是在广告数据处理领域,能够反映用户点击率或者转化率效果的时长。一般的,该累计时长可以为30天,也可以根据实际情况设置其他时长,本示例性实施例对此不做特殊限定。
而该原始数据可以是在累计时长内获取到的与待优化预测模型对应的数据。
举例而言,当待优化预测模型为广告点击率预测模型时,获取到的原始数据可以是用户看到某条曝光的广告之后,是否点击该广告的数据;当待优化预测模型为广告转化率模型时,获取到的原始数据可以是用户在点击某条广告之后,是否进行后续表征转化操作的数据。其中,转化操作可以是填写该条广告的相关信息进行注册,或者是根据广告中的联系方式进行咨询等。
其中,该原始数据可以是从分布式数据仓库(Tencent distribution DataWarehouse,简称TDW)中获取到的。
TDW是一个基于share-nothing架构的数据仓库,具有高可用性和高可伸缩性,用于海量数据存储和分析。它可以向用户提供接口,也可以提供PB级别的存储和TB级别的计算能力来满足日益增长的海量数据分析需求,帮助发现更多用户价值。
在步骤S320中,对原始数据进行预处理得到广告数据。
在得到与待优化预测模型对应的原始数据之后,可以对原始数据进行预处理。其中,预处理的方式包括缺失值处理、离群点处理和噪声处理等方式。
具体的,可以将缺失值、离群点和有噪声的原始数据剔除,也可以有其他预处理方式,本示例性实施例对此不做特殊限定。
在本示例性实施例中,对获取到的与待优化预测模型对应的原始数据进行预处理可以得到广告数据,剔除无效数据,为后续优化待优化预测模型提供了准确的数据基础,保证了待优化预测模型的优化效果。
在步骤S220中,确定与待优化预测模型对应的标注规则,并按照标注规则标注广告数据得到数据矩阵。
在本公开的示例性实施例中,在获取到广告数据之后,可以进一步确定待优化模型对应的标注规则。由于待优化预测模型可以包括广告点击率预测模型和广告转化率预测模型,因此,针对广告点击率预测模型和广告转化率预测模型可以有不同的标注规则。
图4和图5分别示出了确定广告点击率预测模型和广告转化率预测模型的标注规则的方法的步骤流程图。
其中,图4示出了确定广告点击率预测模型的标注规则的方法的步骤流程图,图5示出了确定广告转化率预测模型的标注规则的方法的步骤流程图。
在可选的实施例中,待优化预测模型包括广告点击率预测模型。图4示出了确定广告点击率预测模型的标注规则的方法的步骤流程图,如图4所示,该方法至少包括以下步骤:在步骤S410中,确定与广告点击率预测模型对应的点击率正样本标注规则和点击率负样本标注规则。
举例而言,点击率正样本标注规则可以是将曝光且点击的数据标注为点击率正样本,点击率负样本标注规则可以是将曝光未点击的数据标注为点击率负样本。
除此之外,也可以将点击率正样本标注规则和点击率负样本标注规则调整为相反的标注规则,也可以按照实际情况设置其他点击率正样本标注规则和点击率负样本标注规则,本示例性实施例对此不做特殊限定。
在步骤S420中,将点击率正样本标注规则和点击率负样本标注规则确定为标注规则。
在确定点击率正样本标注规则和点击率负样本标注规则之后,可以确定点击率正样本标注规则和点击率负样本标注规则为与广告点击率预测模型对应的标注规则。
在本示例性实施例中,确定广告点击率预测模型的标注规则,确定方式简单准确,且与广告点击率预测的数据处理场景紧密贴合,保证了后续广告点击率预测模型的优化效果。
在可选的实施例中,待优化预测模型包括广告转化率模型。图5示出了确定广告转化率预测模型的标注规则的方法的步骤流程图,如图5所示,该方法至少包括以下步骤:在步骤S510中,确定与广告转化率预测模型对应的转化率正样本标注规则和转化率负样本标注规则。
举例而言,转化率正样本标注规则可以是将点击且转化的数据标注为转化率正样本,转化率负样本标注规则可以是将点击未转化的数据标注为转化率负样本。
除此之外,也可以将转化率正样本标注规则和转化率负样本标注规则调整为相反的标注规则,也可以按照实际情况设置其他转化率正样本和转化率负样本标注规则,本示例性实施例对此不做特殊限定。
在步骤S520中,将转化率正样本标注规则和转化率负样本标注规则确定为标注规则。
在确定转化率正样本标注规则和转化率负样本标注规则之后,可以确定转化率正样本标注规则和转化率负样本标注规则为与广告转化率预测模型对应的标注规则。
在本示例性实施例中,确定广告转化率预测模型的标注规则,确定方式简单准确,且与广告转化率预测的数据处理场景紧密贴合,保证了后续广告转化率预测模型的优化效果。
在确定标注规则之后,可以进一步按照标注规则标注广告数据得到数据矩阵。
具体的,按照标注规则标注广告数据得到的数据矩阵可以参照表1:
表1
广告1 广告2 广告3 广告4 广告5 广告6 广告7 广告8
用户1 1 1
用户2 1 1
用户3 1 1
用户4 1 1
用户5 1 1
用户6 1 1
用户7 1
用户8 1
用户9 1
用户10 1 1
用户11 1 1
用户12 1 1
当表1为广告点击率预测模型的标注结果时,标注1的广告数据表征用户曝光且点击的正样本,空白(标注0)的广告数据表征曝光但用户未点击的负样本,那么,数据矩阵即为标注有1或空白的广告数据,是一个8×12大小的矩阵;当表1为广告转化率预测模型的标注结果时,标注1的广告数据表征用户点击且曝光的正样本,空白(标注0)的广告数据表征用户点击但未转化的负样本,那么,数据矩阵即为标注有1或空白的广告数据,是一个8×12大小的矩阵。
在步骤S230中,对数据矩阵进行矩阵分解处理得到广告隐式特征,以利用广告隐式特征优化待优化预测模型。
在本公开的示例性实施例中,由于该数据矩阵是一个十分稀疏的矩阵,因此可以进一步对该数据矩阵进行矩阵分解处理挖掘广告隐式特征。
矩阵分解是一种将矩阵分解为其组成部分的方法。这种方法可以简化复杂的矩阵运算,以使该矩阵运算在分解后的矩阵上执行,而无需在原始的矩阵上执行。
在可选的实施例中,图6示出了矩阵分解处理的方法的步骤流程图,如图6所示,该方法至少包括以下步骤:在步骤S610中,利用矩阵分解模型对数据矩阵进行矩阵分解处理得到用户隐式特征。
该矩阵分解模型可以为K-因子模型,也可以为其他矩阵分解模型,本示例性实施例对此不做特殊限定。
若该数据分解矩阵为K-因子模型,K为设置的要挖掘的广告隐式特征的维度。举例而言,当K为3,且数据矩阵为8×12大小的矩阵时,可以将数据矩阵分解为3×12大小的用户隐式特征的矩阵和8×3大小的物品隐式特征的矩阵。除此之外,当设置K为其他数值时,也可以分解得到其他大小的用户隐式特征和物品隐式特征。
在步骤S620中,确定用户隐式特征为广告隐式特征。
在矩阵分解处理得到用户隐式特征之后,可以进一步确定用户隐式特征为广告隐式特征,以挖掘到的用户隐式特征作为优化待优化预测模型的隐式特征。
在本示例性实施例中,通过矩阵分解模型对数据矩阵进行矩阵分解处理得到广告隐式特征,为后续优化待优化预测模型增加了数据维度和数据基础,保证了对待优化预测模型的优化效果。
在得到广告隐式特征之后,可以利用该广告隐式特征对待优化预测模型进行优化。
图7示出了优化待优化预测模型的方法的步骤流程图,如图7所示,该方法至少包括以下步骤:在步骤S710中,获取待优化预测模型的原始特征。
原始特征可以是待优化预测模型原本预测用户的点击率或者转化率时使用的特征。该原始特征可以是根据用户的兴趣数据、扣费数据或者是广告数据等数据提取得到的。
在步骤S720中,将原始特征和广告隐式特征输入至待优化预测模型,以优化待优化预测模型。
在挖掘到广告隐式特征之后,对待优化预测模型的优化方式就是在原本的每一个用户的原始特征中加入挖掘到该用户的广告隐式特征,共同作为待优化预测模型的数据输入,以通过优化输入数据的方式达到优化待优化预测模型的预测结果的效果。
在本示例性实施例中,利用广告隐式特征对待优化预测模型的输入数据进行优化,将挖掘到的广告隐式特征落地到广告点击率和转化率预测的应用场景中,丰富了广告隐式特征的应用场景。
而在利用广告隐式特征对待优化预测模型优化之后,为确定广告隐式特征的优化效果,还可以利用广告数据处理领域的优化标准确定待优化预测模型是否优化成功。
在可选的实施例中,图8示出了确定待优化预测模型优化成功的方法的步骤流程图,如图8所示,该方法至少包括以下步骤:在步骤S810中,确定优化后的待优化预测模型的优化参数,并获取与优化参数对应的有效参数。
该优化参数可以是在离线过程中或在线过程中,反映应用优化后的待优化预测模型预测的点击率和转化率和优化前的待优化预测模型预测的点击率和转化率的差别的参数。
举例而言,在离线过程中,该优化参数可以是优化前后的待优化预测模型的ROC(接受者操作特征曲线,receiver operating characteristic curve)曲线下方的面积大小(Area Under Curve,AUC)的提升指标,也可以是其他指标,本示例性实施例对此不做特殊限定。
对应的,对离线过程中的待优化预测模型的优化结果判定优化成功的有效参数可以是AUC提升的指标是否达到
Figure BDA0002815280140000131
在在线过程中,该优化参数可以是优化前后的待优化预测模型的广告消耗,也可以是点击率和转化率等参数,本示例性实施例对此不做特殊限定。
对应的,在线过程的待优化预测模型的优化结果判定优化成功的有效参数可以是广告消耗是否达到正增长,亦即大于0%,或者的点击率和转化率的提升是否达到1%。
在步骤S820中,若优化参数大于有效参数,确定待优化预测模型优化成功。
在确定优化前后的待优化预测模型的优化参数和有效参数之后,可以将优化参数与有效参数进行比较。当比较结果为优化参数大于有效参数时,确定待优化预测模型优化成功。
值得说明的是,首先在离线过程中对待优化预测模型进行优化,且确定离线过程中优化成功时,才会在在线过程中投入使用,以判断是否在在线过程中优化成功,进入实际使用。
在本示例性实施例中,利用离线过程与在线过程中的有效参数对优化后的待优化预测模型的优化参数进行效果评估,优化了待优化预测模型的预测效果,并且对是否进入实际应用提供了准确严密的判断逻辑,提供了更为精准的投放广告的方法,且提升了用户体验。
下面结合一具体应用场景对本公开实施例中提供的广告数据处理方法做出详细说明。
图9示出了应用场景下的广告数据处理方法的步骤流程图,如图9所示,在步骤S910中,基础数据累计。
确定与待优化预测模型对应的累计时长,并获取在累计时长内的原始数据。该累计时长可以是在广告数据处理领域,能够反映用户点击率或者转化率效果的时长。一般的,该累计时长可以为30天。
而该原始数据可以是在累计时长内获取到的与待优化预测模型对应的数据。亦即当待优化预测模型为广告点击率预测模型时,获取到的原始数据可以是用户看到某条曝光的广告之后,是否点击该广告的数据;当待优化预测模型为广告转化率模型时,获取到的原始数据可以是用户在点击某条广告之后,是否进行后续表征转化操作的数据。其中,转化操作可以是填写该条广告的相关信息进行注册,或者是根据广告中的联系方式进行咨询等。
在步骤S920中,数据预处理。
在得到与待优化预测模型对应的原始数据之后,可以对原始数据进行预处理。其中,预处理的方式包括缺失值处理、离群点处理和噪声处理等方式。
在步骤S930中,正负样本生成。
若待优化预测模型为广告点击率预测模型,点击率正样本标注规则可以是将曝光且点击的数据标注为点击率正样本,点击率负样本标注规则可以是将曝光未点击的数据标注为点击率负样本。
若待优化预测模型为广告转化率预测模型,转化率正样本标注规则可以是将点击且转化的数据标注为转化率正样本,转化率负样本标注规则可以是将点击未转化的数据标注为转化率负样本。
在步骤S940中,矩阵分解模型。
在确定点击率正样本标注规则和点击率负样本标注规则之后,可以确定点击率正样本标注规则和点击率负样本标注规则为与广告点击率预测模型对应的标注规则。
在确定转化率正样本标注规则和转化率负样本标注规则之后,可以确定转化率正样本标注规则和转化率负样本标注规则为与广告转化率预测模型对应的标注规则。
对应的,按照标注规则将广告数据进行标注之后,可以得到数据矩阵,以进一步利用矩阵分解模型对数据矩阵进行矩阵分解处理。
值得说明的是,点击率正样本和转化率正样本标注为1,点击率负样本和转化率负样本标注为0,以进一步得到数据矩阵。
图10示出了应用场景下矩阵分解模型进行矩阵分解处理的方式示意图,如图10所示,矩阵1010为数据矩阵,该数据矩阵1010为9×13大小的矩阵。利用K-因子分解模型等矩阵分解模型进行矩阵分解处理之后,可以得到矩阵1020和矩阵1030。其中,该K-因子分解模型的K值为3。
其中,矩阵1020为用户隐式矩阵,该用户隐式矩阵为3×13大小的矩阵;矩阵1030为物品隐式矩阵,该物品隐式矩阵为9×3大小的矩阵。
进一步的,确定该用户隐式矩阵为广告隐式矩阵,以利用广告隐式矩阵优化待优化预测模型。
在步骤S950中,效果评估。
由于广告隐式特征可以对离线的待优化预测模型和在线的待优化预测模型进行优化,因此,可以分别针对离线过程和在线过程设置有效参数确定待优化预测模型的优化效果。
具体的,离线过程的效果评估可以参照表2:
表2
Figure BDA0002815280140000151
Figure BDA0002815280140000161
表2中的Embedding向量为广告隐式特征。隐式特征是一种特征的表征形式。相对于显示特征,隐式特征的每一维度特征都具有不可解释性,利用Embedding向量表征。
在Embedding向量后面的维数,例如2维、4维、8维、……,是K-因子分解模型进行矩阵分解处理的K值。
在将数据矩阵进行分解之后得到的广告隐式特征可以投入朋友圈、公众号文底、激励视频和和信息流广告(XQ)中使用,以确定优化后的待优化预测模型的AUC提升指标。
当AUC提升指标大于
Figure BDA0002815280140000162
时,确定离线过程中的待优化预测模型优化成功。
具体的,在线过程的效果评估可以参照表3:
表3
应用场景 消耗 MT-CTR MH-CVR MH-CPM
朋友圈_pCTR 1.1% 0.2% - 1.103%
MI_人群优选 2.4% 26.25% 13.95% -
MI_人群修正 3.3% 18.4% 20.7% -
MI_标签推荐 2.1% 23% 19.3% -
在上线使用时,可以将优化后的待优化预测模型应用在朋友圈的点击率预测、人群优选、人群修正和标签推荐等应用场景中。
其中,在各个应用场景中的消耗表征通过投放广告赚到的收入,且在各个应用场景下的消耗均为正值,表征投入在这四个应用场景中能够在一定程度上提高收入。
除此之外,CTR和CVR表征投入在各个应用场景中的点击率和转化率预测,且在各个应用场景下的CTR和CVR均大于1%,说明从点击率和转化率方面来说,优化后的待优化预测模型是有效的。
基于以上应用场景可知,本公开实施例提供的广告数据处理方法,一方面,对广告数据生成的数据矩阵进行矩阵分解处理得到广告隐式特征,挖掘过程无需过多用户特征和物品特征,减少了挖掘广告隐式特征的人力成本和时间成本,提高了特征挖掘效率;另一方面,利用广告隐式特征优化的待优化预测模型有至少两种,丰富了挖掘到的用户隐式特征的应用场景,并且优化了各个应用场景中的待优化预测模型的预测效果。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
以下介绍本公开的装置实施例,可以用于执行本公开上述实施例中的广告数据处理方法。对于本公开装置实施例中未披露的细节,请参照本公开上述的广告数据处理方法的实施例。
图11示意性地示出了在本公开一些实施例中的一种广告数据处理装置的结构框图,如图11所示,广告数据处理装置1100主要可以包括:模型确定模块1110、数据标注模块1120和模型优化模块1130。
模型确定模块1110,被配置为确定待优化预测模型,并获取与待优化预测模型对应的广告数据;数据标注模块1120,被配置为确定与待优化预测模型对应的标注规则,并按照标注规则标注广告数据得到数据矩阵;模型优化模块1130,被配置为对数据矩阵进行矩阵分解处理得到广告隐式特征,以利用广告隐式特征优化待优化预测模型。
在本公开的一些实施例中,节点确定模块包括:执行状态子模块,被配置为获取执行当前任务节点的任务结果参数,并根据任务结果参数确定任务流的当前执行状态;
状态确定子模块,被配置为根据当前执行状态在任务流中确定目标任务节点。
在本公开的一些实施例中,状态确定子模块包括:分类算法单元,被配置为根据任务结果参数以及与任务结果参数对应的分类算法确定任务流的当前执行状态为重新执行状态。
在本公开的一些实施例中,分类算法单元包括:异常样本子单元,被配置为确定与任务结果参数对应的异常样本数据库,以在异常样本数据库中确定与任务结果参数对应的异常样本;
样本状态子单元,被配置为利用分类算法确定异常样本对应的参考执行状态为重新执行状态,以确定任务流的当前执行状态为重新执行状态。
在本公开的一些实施例中,基于以上技术方案,状态确定子模块,包括:映射关系单元,被配置为若当前执行状态为重新执行状态,确定任务结果参数与目标任务节点之间的映射关系;
结果参数单元,被配置为基于映射关系,根据任务结果参数确定任务流中的目标任务节点。
在本公开的一些实施例中,状态确定子模块,包括:下一节点单元,被配置为若当前执行状态为终止当前任务节点状态,确定当前任务节点的下一任务节点为目标任务节点。
在本公开的一些实施例中,节点确定模块,包括:来源信息子模块,被配置为获取原始多媒体的多媒体来源信息,并根据多媒体来源信息在任务流中确定目标任务节点。
本公开各实施例中提供的广告数据处理装置的具体细节已经在对应的方法实施例中进行了详细的描述,因此此处不再赘述。
图12示出了适于用来实现本公开实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图12示出的电子设备的计算机系统1200仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图12所示,计算机系统1200包括中央处理单元(Central Processing Unit,CPU)1201,其可以根据存储在只读存储器(Read-Only Memory,ROM)1202中的程序或者从存储部分1208加载到随机访问存储器(Random Access Memory,RAM)1203中的程序而执行各种适当的动作和处理。在RAM 1203中,还存储有系统操作所需的各种程序和数据。CPU1201、ROM 1202以及RAM 1203通过总线1204彼此相连。输入/输出(Input/Output,I/O)接口1205也连接至总线1204。
以下部件连接至I/O接口1205:包括键盘、鼠标等的输入部分1206;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分1207;包括硬盘等的存储部分1208;以及包括诸如LAN(Local AreaNetwork,局域网)卡、调制解调器等的网络接口卡的通信部分1209。通信部分1209经由诸如因特网的网络执行通信处理。驱动器1210也根据需要连接至I/O接口1205。可拆卸介质1211,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1210上,以便于从其上读出的计算机程序根据需要被安装入存储部分1208。
特别地,根据本公开的实施例,各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1209从网络上被下载和安装,和/或从可拆卸介质1211被安装。在该计算机程序被中央处理单元(CPU)1201执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本公开实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本公开实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本公开实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (10)

1.一种广告数据处理方法,其特征在于,所述方法包括:
确定待优化预测模型,并获取与所述待优化预测模型对应的广告数据;
确定与所述待优化预测模型对应的标注规则,并按照所述标注规则标注所述广告数据得到数据矩阵;
对所述数据矩阵进行矩阵分解处理得到广告隐式特征,以利用所述广告隐式特征优化所述待优化预测模型。
2.根据权利要求1所述的广告数据处理方法,其特征在于,所述待优化预测模型包括广告点击率预测模型;
所述确定与所述待优化预测模型对应的标注规则,包括:
确定与所述广告点击率预测模型对应的点击率正样本标注规则和点击率负样本标注规则;
将所述点击率正样本标注规则和所述点击率负样本标注规则确定为标注规则。
3.根据权利要求1所述的广告数据处理方法,其特征在于,所述待优化预测模型包括广告转化率模型;
所述确定与所述待优化预测模型对应的标注规则,包括:
确定与所述广告转换率预测模型对应的转化率正样本标注规则和转化率负样本标注规则;
将所述转化率正样本标注规则和所述转化率负样本标注规则确定为标注规则。
4.根据权利要求1所述的广告数据处理方法,其特征在于,所述对所述数据矩阵进行矩阵分解处理得到广告隐式特征,包括:
利用矩阵分解模型对所述数据矩阵进行矩阵分解处理得到用户隐式特征;
确定所述用户隐式特征为广告隐式特征。
5.根据权利要求1所述的广告数据处理方法,其特征在于,所述利用所述广告隐式特征优化所述待优化预测模型,包括:
获取所述待优化预测模型的原始特征;
将所述原始特征和所述广告隐式特征输入至所述待优化预测模型,以优化所述待优化预测模型。
6.根据权利要求1所述的广告数据处理方法,其特征在于,所述获取与所述待优化预测模型对应的广告数据,包括:
确定与所述待优化预测模型对应的累积时长,并获取在所述累积时长内的原始数据;
对所述原始数据进行预处理得到广告数据。
7.根据权利要求1至6中任一项所述的广告数据处理方法,其特征在于,所述方法还包括:
确定优化后的所述待优化预测模型的优化参数,并获取与所述优化参数对应的有效参数;
若所述优化参数大于所述有效参数,确定所述待优化预测模型优化成功。
8.一种广告数据处理装置,其特征在于,所述装置包括:
模型确定模块,被配置为确定待优化预测模型,并获取与所述待优化预测模型对应的广告数据;
数据标注模块,被配置为确定与所述待优化预测模型对应的标注规则,并按照所述标注规则标注所述广告数据得到数据矩阵;
模型优化模块,被配置为对所述数据矩阵进行矩阵分解处理得到广告隐式特征,以利用所述广告隐式特征优化所述待优化预测模型。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的广告数据处理方法。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储所述处理器的可执行指令;
其中,所述处理器配置为经由执行所述可执行指令来执行权利要求1至7中任一项所述的广告数据处理方法。
CN202011412900.9A 2020-12-03 2020-12-03 广告数据处理方法、装置、介质以及电子设备 Pending CN112446738A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011412900.9A CN112446738A (zh) 2020-12-03 2020-12-03 广告数据处理方法、装置、介质以及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011412900.9A CN112446738A (zh) 2020-12-03 2020-12-03 广告数据处理方法、装置、介质以及电子设备

Publications (1)

Publication Number Publication Date
CN112446738A true CN112446738A (zh) 2021-03-05

Family

ID=74740286

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011412900.9A Pending CN112446738A (zh) 2020-12-03 2020-12-03 广告数据处理方法、装置、介质以及电子设备

Country Status (1)

Country Link
CN (1) CN112446738A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012066A (zh) * 2023-03-28 2023-04-25 江西时刻互动科技股份有限公司 广告转化率的预测方法、装置、可读存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116012066A (zh) * 2023-03-28 2023-04-25 江西时刻互动科技股份有限公司 广告转化率的预测方法、装置、可读存储介质

Similar Documents

Publication Publication Date Title
CN111966914B (zh) 基于人工智能的内容推荐方法、装置和计算机设备
CN110489582B (zh) 个性化展示图像的生成方法及装置、电子设备
CN112164391A (zh) 语句处理方法、装置、电子设备及存储介质
CN112988979B (zh) 实体识别方法、装置、计算机可读介质及电子设备
CN113254785B (zh) 推荐模型训练方法、推荐方法和相关设备
CN110990600B (zh) 多媒体文件推荐、参数调整方法、装置、介质及电子设备
CN111625715B (zh) 信息提取方法、装置、电子设备及存储介质
CN111666500A (zh) 文本分类模型的训练方法及相关设备
US20210350202A1 (en) Methods and systems of automatic creation of user personas
CN113379449B (zh) 多媒体资源召回方法、装置、电子设备以及存储介质
CN113761190A (zh) 文本识别方法、装置、计算机可读介质及电子设备
CN114299194A (zh) 图像生成模型的训练方法、图像生成方法及装置
CN112165639A (zh) 内容分发方法、装置、电子设备以及存储介质
CN111444335B (zh) 中心词的提取方法及装置
CN112926341A (zh) 文本数据处理方法、装置
CN112446738A (zh) 广告数据处理方法、装置、介质以及电子设备
CN116756281A (zh) 知识问答方法、装置、设备和介质
CN108734498B (zh) 一种广告推送方法和装置
CN112101015B (zh) 一种识别多标签对象的方法及装置
CN117150053A (zh) 多媒体信息推荐模型训练方法、推荐方法及装置
CN114021565A (zh) 命名实体识别模型的训练方法及装置
CN115186096A (zh) 针对特定类型分词的识别方法、装置、介质及电子设备
CN113239215A (zh) 多媒体资源的分类方法、装置、电子设备及存储介质
CN115203516A (zh) 基于人工智能的信息推荐方法、装置、设备及存储介质
CN114862431A (zh) 广告转化特征的预测方法、装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40043387

Country of ref document: HK

SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination